[데이터분석] Pandas

2024. 8. 13. 15:49데이터 사이언스

Pandas

  • Python Data Analysis Library
  • 대표적인 Python 기반 정형 데이터 분석 라이브러리
  • import pandas as pd
  • 특징
    • 테이블 형태의 데이터를 분석/처리할 수 있는 다양한 함수 제공
    • Excel로 할 수 있는 모든 연산/기능 수행 가능
    • 데이터 통계, 크롤링, 시각화 등 가능
    • Python 자료구조(list, Tuple, Dictionary, numpy array)와 호환
    • 외부 데이터(CSV, txt, Excel, SQL database, XML, pdf 등)불러올 수 있음

Pandas 자료구조

1. Series - 1차원데이터

 

2. Data Frame - 2차원 데이터

  • 행의 이름 : index명
  • 열의 이름 : column명
  • series를 모아놓은 것이 Data Frame