pandas 8

데이터 복사하기

원본 데이터df = pd.DataFrame({'A': [0, 1, 2, 3, 4], 'B': [4, 5, 6, 7, 8], 'C': ['a', 'b', 'c', 'd', 'e']})df 얕은 복사원본도 변경 된다(원본을 바꾸면 복사본도 변경 됨)# 카피하지 않으면 원본 데이터도 변경됨non_cp = dfnon_cp.A = 0non_cp  깊은 복사.copy() 했을 때원본 데이터에는 영향을 미치지 않는다# 원본 데이터 카피하면 바꿔도 원본 데이터에 영향 Xcp = df.copy()cp.A = 0

빅데이터 공부 2025.02.27

[Pandas] 데이터 변형하기 - stack, unstack

2024.10.22 - [빅데이터 공부] - [Pandas] 데이터 변형하기 - groupby [Pandas] 데이터 변형하기 - groupby1. groupby()2. pd.pivot(), pd.pivot_table()3. stack(), unstack() 실습을 위한 라이브러리 임포트import numpy as npimport pandas as pdimport seaborn as sns 팁 데이터 사용tips = sns.load_dataset('tips') 데이터 살펴보기tips.head()tidogfoot1.tistory.com 2024.12.07 - [빅데이터 공부] - [Pandas] 데이터 변형하기 - pivot, pivot_table [Pandas] 데이터 변형하기 - pivot, pivot..

빅데이터 공부 2024.12.08

[Pandas] 데이터 변형하기 - pivot, pivot_table

2024.10.22 - [빅데이터 공부] - [Pandas] 데이터 변형하기 - groupby [Pandas] 데이터 변형하기 - groupby1. groupby()2. pd.pivot(), pd.pivot_table()3. stack(), unstack() 실습을 위한 라이브러리 임포트import numpy as npimport pandas as pdimport seaborn as sns 팁 데이터 사용tips = sns.load_dataset('tips') 데이터 살펴보기tips.head()tidogfoot1.tistory.com 1. groupby()2. pd.pivot(), pd.pivot_table()3. stack(), unstack() 실습을 위한 라이브러리 임포트import numpy as..

빅데이터 공부 2024.12.07

[Pandas] 데이터 변형하기 - groupby

1. groupby()2. pd.pivot(), pd.pivot_table()3. stack(), unstack() 실습을 위한 라이브러리 임포트import numpy as npimport pandas as pdimport seaborn as sns 팁 데이터 사용tips = sns.load_dataset('tips') 데이터 살펴보기tips.head()tips.info()groupby()컬럼 값이 같은 것끼리 그룹화한다 # 성별로 묶기group_sex = tips.groupby('sex')# 객체를 리턴group_sex  그룹의 속성이 보고 싶다면groups()group_sex.groups  groupby의 함수 활용- count: 데이터 수 - size: 집단 별 크기 - sum: 합 - mean: ..

빅데이터 공부 2024.10.22

[Pandas] DataFrame

필요 라이브러리 임포트import numpy as npimport pandas as pd  1. 데이터프레임 만들기: pd.DataFrame()pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None) 자주 사용하는 파라미터index: 인덱스명 지정columns: 컬럼명 지정 - 딕셔너리 사용key 값이 컬럼, value에 리스트 형태로 각 인덱스 값 넣기 pd.DataFrame({'a':[10,20], 'b':[20,40], 'c':[59,39]}) 인덱스명을 지정하고 싶을 때: index=[]pd.DataFrame({'a':[10,20], 'b':[20,40], 'c':[59,39]}, index=['s1', 's2']) ..

빅데이터 공부 2024.07.14

판다스(Pandas)

print(sr2[[2,3]])#숫자 인덱스에 sr2[2], sr2[3] 출력 print(sr2[['2','3']])#문자열 인덱스에 sr2['2'], sr2['3'] 출력 판다스는 행과 열로 구성된 테이블 형식의 데이터를 다루는 데이터 분석에 많이 사용되는 패키지이다. 변수가 1개일 경우에는 시리즈(Series), 변수가 2개 이상이면 데이터프레임(Data Frame) 객체를 사용한다. 판다스 패키지 추가 import pandas as pd Series: 1차원 배열 형태의 구조로, 인덱스와 데이터가 있어 파이썬 딕셔너리와 유사하다. 배열의 각 원소에는 서로 다른 자료형을 넣을 수 있고, 다차원 배열도 원소로 넣을 수 있다. DataFrame: 2차원 테이블 형태의 구조로, 여러 열과 행을 가지며 열은..

빅데이터 공부 2023.06.17