Python(18)
-
[데이터분석] Pandas - DataFrame
DataFrame 생성pd.DataFrame(data)List 사용date = [['초코파이', '몽쉘', '오예스'], ['오리온', '롯데', '해태'], [171, 170, 150], 5830, 5290, 4790]]df = pd.DataFrame(data)+) index명, column명 설정date = [['초코파이', '몽쉘', '오예스'], ['오리온', '롯데', '해태'], [171, 170, 150], 5830, 5290, 4790]]df = pd.DataFrame(data, index='상품명', '제조사', '열량', '가격'], columns=['상품1', '상품2', '상품3'])Dictionary사용data = {'상품1' : ['초코파이', '오리온', 171, 5830], ..
2024.08.13 -
[데이터분석] Pandas - Series
Series 생성pd.Series(data, index = ) → List, Dictionary, Tuple, ndarray 등numpy와 다르게 다른 유형(자료형)의 데이터를 다 묶을 수 있음pandas는 계산용이 아닌, 분석용이기 때문에 다양한 형태의 데이터 호환이 가능함상품명초코파이제조사오리온열량171가격5830 List 사용# pd.Series(data)series = pd.Series(['초코파이', '오리온', 171, 5830])print(series)+) index 설정series = pd.Series(['초코파이', '오리온', 171, 5830], index = ['상품명', '제조사', '열량', '가격'])print(series) Tuple 사용Tuple 자료형: (data1, d..
2024.08.13 -
[데이터분석] Pandas
PandasPython Data Analysis Library대표적인 Python 기반 정형 데이터 분석 라이브러리import pandas as pd특징테이블 형태의 데이터를 분석/처리할 수 있는 다양한 함수 제공Excel로 할 수 있는 모든 연산/기능 수행 가능데이터 통계, 크롤링, 시각화 등 가능Python 자료구조(list, Tuple, Dictionary, numpy array)와 호환외부 데이터(CSV, txt, Excel, SQL database, XML, pdf 등)불러올 수 있음Pandas 자료구조1. Series - 1차원데이터 2. Data Frame - 2차원 데이터행의 이름 : index명열의 이름 : column명series를 모아놓은 것이 Data Frame
2024.08.13 -
[데이터분석] Numpy배열 - indexing, slicing
Indexing여러 원소를 가지고 있는 개체(리스트, 튜플, 배열 등)에 부여되는 번호파이썬의 List와 동일하게 ndarray도 인덱싱 가능 # 1부터 10까지 수 중 랜덤하게 6개의 수가 추출된 'arr1'이라는 배열# shape: 3X2인 2차원 배열arr1 = np.random.randint(1, 11, size = (3, 2))print(arr1[0,:]) # 1행 출력print(arr1[1, 0]) # 2행 1열의 원소 출력 Slicing여러 원소를 가지고 있는 객체의 일부를 추출하는 것파이썬의 List와 동일하게 ndarray도 슬라이싱 가능1. 1차원 배열의 슬라이싱 # 10부터 19까지 연속적인 수로 이루어진 'arr2'라는 배열# shape: 1차원 배열arr2 = np.arange(1..
2024.08.13 -
[데이터분석] Numpy배열 - broadcasting
Broadcasting다른 형태의 배열도 연산할 수 있도록 배열의 형태를 변환하는 것가능한 경우 only 3가지하나의 배열이 원소 1개로 이루어진 배열인 경우하나의 배열이 1차원인 경우둘다 1차원인데, 행과 열의 개수가 반대인 경우1. 하나의 배열이 원소 1개로 이루어진 배열의 경우arr1 = np.array([[0, 0, 0],[1, 1, 1],[2, 2, 2]])arr2 = np.array([1]) # 하나의 배열이 원소 1개로 이루어진 배열print(arr1 + arr2)print(arr1 + 1)2. 하나의 배열이 1차원인 경우arr1 = np.array([0, 0, 0], [1, 1, 1],[2, 2, 2]])arr2 = np.array([1, 2, 3]) # 하나의 배열이 1차원인 경우prin..
2024.08.13 -
[데이터분석] Numpy 배열
Numpy 배열같은 배열 속 값들은 모두 동일한 자료형 이어야함3차원 배열: 2D 배열의 개수를 파악하고, 2D 배열의 형태 파악2D배열의 개수가 4개2D배열의 형태 : shape(2, 3)1차원 배열: shape(3, )2차원 배열: shape(2, 3) : 2행 3열3차원 배열: shape(4, 3, 2) : 4행 3열이 2개배열 속성 확인ndarray.dtype # 데이터의 자료형 확인 (ex) float64ndarray.ndim # 데이터 차원 확인 (ex) 3ndarray.shape # 데이터의 축(axis)별 크기 확인 (ex) (2, 4, 3)ndarray.size # 데이터의 전체 요소 개수 확인 (ex) 24배열 생성유형1```pythonnp.array(list or tuple) # Py..
2024.08.13