ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [1월 4주차-1/23] Python 기초 문법과 데이터 분석 기초(데이터 추출, 가공, 시각화)
    Why Not SW CAMP 5기/수업 기록 2025. 1. 23. 16:34

     

     

    Python은 데이터 분석에서 가장 많이 사용되는 프로그래밍 언어 중 하나로, 이번 강의는 Python의 기초 개념과 주요 기능들을 다뤘습니다. 들으면서 느꼈던 Python의 유용함과 이해한 내용을 간단히 정리해 보았습니다.


    1. 변수와 문자열

    • Python에서 변수를 선언할 때는 따로 자료형을 명시하지 않아도 됩니다.
    • 문자열은 ' ' 또는 " "로 감싸 표현하며, 문자열을 다룰 때 유용한 함수들이 많습니다.
      text = "hi hello 안녕 내가 누군지 아니"
      print(text[:2])  # 결과: hi
      

    2. 조건문: if

    • 조건에 따라 코드를 실행시키는 데 사용됩니다. 들여쓰기가 중요하며, 조건문은 매우 직관적으로 작성됩니다.
      if 5 > 3:
          print("5는 3보다 크다")
      

    3. 반복문: for

    • 반복문을 통해 리스트나 범위 내의 요소들을 순회하며 작업할 수 있습니다.
      for i in range(5):
          print(i)  # 0부터 4까지 출력
      

    4. 리스트(list)

    • 여러 데이터를 순서대로 저장할 수 있는 자료형으로, 정렬(.sort())이나 슬라이싱 등 다양한 기능을 제공합니다.
      my_list = [3, 'word', 10]
      print(my_list[0:2])  # [3, 'word'] 출력
      

    5. 딕셔너리(dict)

    • 키(key)와 값(value)으로 데이터를 저장하는 구조로, 데이터를 효율적으로 다룰 수 있습니다.
      my_dict = {'name': 'John', 'age': 25}
      print(my_dict.keys())    # dict_keys(['name', 'age'])
      print(my_dict.values())  # dict_values(['John', 25])
      

    6. 함수(def)

    • 특정 작업을 반복적으로 수행할 때 유용하며, 데이터를 정리하거나 분석할 때 자주 사용됩니다.
      def greet(name):
          return f"Hello, {name}!"
      print(greet("Alice"))  # Hello, Alice!
      

    7. 클래스(class)

    • 함수와 데이터를 모아 놓는 저장소로, 객체 지향 프로그래밍(OOP)의 핵심 개념입니다.

    기타 유용한 기능

    • 문자열 변경: .replace()
      text = "I like books"
      new_text = text.replace("books", "coding")
      print(new_text)  # I like coding
      
    • 문자열 나누기: .split()
      sentence = "Python is fun"
      words = sentence.split()
      print(words)  # ['Python', 'is', 'fun']
      

     

    Python을 활용한 데이터 추출과 시각화

    Python을 활용하여 데이터를 조건에 따라 추출하고, 이를 바탕으로 시각화하는 방법을 배웠습니다. 특히, 월별 지출액을 계산하고 이를 그래프로 표현하는 과정을 실습하며 실질적인 데이터 분석의 흐름을 이해할 수 있었습니다.


    목표

    10월, 11월, 12월의 월별 지출액을 계산하고, 이를 시각적으로 표현하는 막대그래프를 만드는 것.


    1. 월별 지출액 계산

    먼저, 10월부터 12월까지의 월별 지출액을 저장할 리스트를 생성하고 초깃값을 설정합니다.

    s_mon = [0, 0, 0]  # 각 월의 초기 지출액은 0으로 설정
    

    2. 데이터 조건별 처리

    전체 이용 내역(data)을 반복하면서 조건에 맞는 데이터를 추출하고, 월별로 지출액을 계산합니다.

    for row in data:
        if row[-1] == '전표매입':  # 매입 상태가 '전표매입'인 경우
            mon = int(row[0].split('-')[1])  # 이용월 추출
            idx = mon - 10  # 10월부터 시작하므로 10을 뺀 값을 인덱스로 사용
            payment = int(row[6])  # 이용금액 추출
            s_mon[idx] += payment  # 해당 월의 지출액에 추가
    

    3. 결과 출력

    계산된 월별 지출액 리스트를 출력하여 확인합니다.

    print(s_mon)  # 예: [2093015, 4127744, 1953269]

    4. 시각화: 막대그래프 그리기

    Python의 matplotlib 라이브러리를 활용하여 월별 지출액을 시각적으로 표현합니다.

    import matplotlib.pyplot as plt
    
    # 월별 지출액 그래프 그리기
    plt.figure(dpi=100)
    plt.rc('font',family ='NanumGothic')
    plt.title('10-12월 지출현황')
    plt.bar(['10월','11월','12월'], s_mon, color = 'royalblue')
    plt.show()

     

    이번 실습을 통해 데이터를 조건에 따라 가공하고, 이를 시각화하여 인사이트를 도출하는 과정을 경험할 수 있었습니다. 단순히 데이터를 출력하는 것에서 그치지 않고, 막대그래프로 표현하니 데이터의 흐름과 차이를 한눈에 파악할 수 있어 매우 유익했습니다.

    Python의 강력한 데이터 처리 및 시각화 기능은 데이터 분석을 효과적으로 수행하는 데 큰 힘이 된다는 점을 깨달았습니다. 앞으로 더 복잡한 데이터를 다루는 데에도 자신감이 생겼고, 이를 활용한 다양한 분석 작업에 도전해 보고 싶다는 동기가 생겼습니다! 😊

     

     

Designed by Tistory.