파이썬 라이브러리 시리즈 ⑧ — pandas로 데이터 다루기

pandas는 엑셀, CSV, 데이터 분석 업무에서 사실상 표준 도구로 사용되는 강력한 라이브러리입니다.
데이터를 표(데이터프레임) 형태로 다룰 수 있어 초보자도 직관적으로 데이터를 관리할 수 있습니다.

✔ pandas가 왜 중요한가?

엑셀로 할 수 있는 작업 대부분을 파이썬으로 자동화할 수 있습니다.
필터링, 정렬, 합계, 평균, 조건 추출 등이 단 몇 줄이면 끝납니다.

✔ 언제 사용하나?

  • CSV를 읽어서 가공할 때
  • 통계 분석을 자동화하고 싶을 때
  • 크롤링한 데이터를 테이블로 정리할 때
  • 엑셀 파일을 병합 또는 분할할 때

✔ 예제 — CSV 파일 읽기


import pandas as pd

df = pd.read_csv("data.csv")
print(df.head())

✔ 예제 — 특정 열 필터링


import pandas as pd

df = pd.read_csv("data.csv")

selected = df[df["score"] > 80]
print(selected)

✔ 예제 — 새로운 엑셀로 저장


df.to_excel("output.xlsx", index=False)

✔ 총평

pandas를 배우면 “데이터 자동화 파이프라인”을 만들 수 있습니다.
꾸준히 쓰면 엑셀보다 10배 빠른 데이터 처리가 가능합니다.

 

댓글 남기기