-
[1월 4주차-1/23] Python 기초 문법과 데이터 분석 기초(데이터 추출, 가공, 시각화)Why Not SW CAMP 5기/수업 기록 2025. 1. 23. 16:34
Python은 데이터 분석에서 가장 많이 사용되는 프로그래밍 언어 중 하나로, 이번 강의는 Python의 기초 개념과 주요 기능들을 다뤘습니다. 들으면서 느꼈던 Python의 유용함과 이해한 내용을 간단히 정리해 보았습니다.
1. 변수와 문자열
- Python에서 변수를 선언할 때는 따로 자료형을 명시하지 않아도 됩니다.
- 문자열은 ' ' 또는 " "로 감싸 표현하며, 문자열을 다룰 때 유용한 함수들이 많습니다.
text = "hi hello 안녕 내가 누군지 아니" print(text[:2]) # 결과: hi
2. 조건문: if
- 조건에 따라 코드를 실행시키는 데 사용됩니다. 들여쓰기가 중요하며, 조건문은 매우 직관적으로 작성됩니다.
if 5 > 3: print("5는 3보다 크다")
3. 반복문: for
- 반복문을 통해 리스트나 범위 내의 요소들을 순회하며 작업할 수 있습니다.
for i in range(5): print(i) # 0부터 4까지 출력
4. 리스트(list)
- 여러 데이터를 순서대로 저장할 수 있는 자료형으로, 정렬(.sort())이나 슬라이싱 등 다양한 기능을 제공합니다.
my_list = [3, 'word', 10] print(my_list[0:2]) # [3, 'word'] 출력
5. 딕셔너리(dict)
- 키(key)와 값(value)으로 데이터를 저장하는 구조로, 데이터를 효율적으로 다룰 수 있습니다.
my_dict = {'name': 'John', 'age': 25} print(my_dict.keys()) # dict_keys(['name', 'age']) print(my_dict.values()) # dict_values(['John', 25])
6. 함수(def)
- 특정 작업을 반복적으로 수행할 때 유용하며, 데이터를 정리하거나 분석할 때 자주 사용됩니다.
def greet(name): return f"Hello, {name}!" print(greet("Alice")) # Hello, Alice!
7. 클래스(class)
- 함수와 데이터를 모아 놓는 저장소로, 객체 지향 프로그래밍(OOP)의 핵심 개념입니다.
기타 유용한 기능
- 문자열 변경: .replace()
text = "I like books" new_text = text.replace("books", "coding") print(new_text) # I like coding - 문자열 나누기: .split()
sentence = "Python is fun" words = sentence.split() print(words) # ['Python', 'is', 'fun']
Python을 활용한 데이터 추출과 시각화
Python을 활용하여 데이터를 조건에 따라 추출하고, 이를 바탕으로 시각화하는 방법을 배웠습니다. 특히, 월별 지출액을 계산하고 이를 그래프로 표현하는 과정을 실습하며 실질적인 데이터 분석의 흐름을 이해할 수 있었습니다.
목표
10월, 11월, 12월의 월별 지출액을 계산하고, 이를 시각적으로 표현하는 막대그래프를 만드는 것.
1. 월별 지출액 계산
먼저, 10월부터 12월까지의 월별 지출액을 저장할 리스트를 생성하고 초깃값을 설정합니다.
s_mon = [0, 0, 0] # 각 월의 초기 지출액은 0으로 설정2. 데이터 조건별 처리
전체 이용 내역(data)을 반복하면서 조건에 맞는 데이터를 추출하고, 월별로 지출액을 계산합니다.
for row in data: if row[-1] == '전표매입': # 매입 상태가 '전표매입'인 경우 mon = int(row[0].split('-')[1]) # 이용월 추출 idx = mon - 10 # 10월부터 시작하므로 10을 뺀 값을 인덱스로 사용 payment = int(row[6]) # 이용금액 추출 s_mon[idx] += payment # 해당 월의 지출액에 추가3. 결과 출력
계산된 월별 지출액 리스트를 출력하여 확인합니다.
print(s_mon) # 예: [2093015, 4127744, 1953269]
4. 시각화: 막대그래프 그리기
Python의 matplotlib 라이브러리를 활용하여 월별 지출액을 시각적으로 표현합니다.
import matplotlib.pyplot as plt # 월별 지출액 그래프 그리기 plt.figure(dpi=100) plt.rc('font',family ='NanumGothic') plt.title('10-12월 지출현황') plt.bar(['10월','11월','12월'], s_mon, color = 'royalblue') plt.show()
이번 실습을 통해 데이터를 조건에 따라 가공하고, 이를 시각화하여 인사이트를 도출하는 과정을 경험할 수 있었습니다. 단순히 데이터를 출력하는 것에서 그치지 않고, 막대그래프로 표현하니 데이터의 흐름과 차이를 한눈에 파악할 수 있어 매우 유익했습니다.
Python의 강력한 데이터 처리 및 시각화 기능은 데이터 분석을 효과적으로 수행하는 데 큰 힘이 된다는 점을 깨달았습니다. 앞으로 더 복잡한 데이터를 다루는 데에도 자신감이 생겼고, 이를 활용한 다양한 분석 작업에 도전해 보고 싶다는 동기가 생겼습니다! 😊
'Why Not SW CAMP 5기 > 수업 기록' 카테고리의 다른 글
[1월 4주차-1/24(2)]Python GUI 프로그래밍: Tkinter로 시작하기 (0) 2025.01.24 [1월 4주차-1/24(1)]파이썬 지도 시각화: Folium으로 간단히 배우는 지도 활용 (1) 2025.01.24 [1월 4주차-1/22]EBS(Elastic Block Store), ELB(Elastic Load Balancing) 개념 정리 및 실습 (1) 2025.01.22 [1월 4주차-1/21(2)]AWS 계정 생성부터 EC2 인스턴스 생성과 설정, 그리고 탄력적 IP(Elastic IP) 사용까지 (0) 2025.01.21 [1월 4주차-1/21(1)]클라우드 개념 및 AWS 주요 서비스 정리와 개념 이해 (2) 2025.01.21