판다스 4

[Pandas] 데이터 변형하기 - groupby

1. groupby()2. pd.pivot(), pd.pivot_table()3. stack(), unstack() 실습을 위한 라이브러리 임포트import numpy as npimport pandas as pdimport seaborn as sns 팁 데이터 사용tips = sns.load_dataset('tips') 데이터 살펴보기tips.head()tips.info()groupby()컬럼 값이 같은 것끼리 그룹화한다 # 성별로 묶기group_sex = tips.groupby('sex')# 객체를 리턴group_sex  그룹의 속성이 보고 싶다면groups()group_sex.groups  groupby의 함수 활용- count: 데이터 수 - size: 집단 별 크기 - sum: 합 - mean: ..

빅데이터 공부 2024.10.22

[Pandas] DataFrame

필요 라이브러리 임포트import numpy as npimport pandas as pd  1. 데이터프레임 만들기: pd.DataFrame()pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None) 자주 사용하는 파라미터index: 인덱스명 지정columns: 컬럼명 지정 - 딕셔너리 사용key 값이 컬럼, value에 리스트 형태로 각 인덱스 값 넣기 pd.DataFrame({'a':[10,20], 'b':[20,40], 'c':[59,39]}) 인덱스명을 지정하고 싶을 때: index=[]pd.DataFrame({'a':[10,20], 'b':[20,40], 'c':[59,39]}, index=['s1', 's2']) ..

빅데이터 공부 2024.07.14

DataFrame 다루기

Pandas 사용하기데이터프레임의 이름은 df로 하겠습니다!!. 1. 데이터 값 추출하기 -인덱싱#인덱싱#특정 값 하나를 보고 싶을 때df.loc['특정 인덱스 값', '특정 컬럼 값']#특정 인덱스의 모든 값을 보고 싶을 때df.loc['특정 인덱스 값', :]df.loc['특정 인덱스 값']#특정 컬럼의 모든 값을 보고 싶을 때df.loc[: , '특정 컬럼 값']df['특정 컬럼 값']컬럼만 인덱싱할 때는 .loc이 필요 없다  만약 원하는 인덱스나 컬럼이 2개 이상이라면리스트로 묶어주면 됩니다#인덱싱#여러 값을 보고 싶을 때df.loc[[인덱스1, 인덱스2], [컬럼1, 컬럼2]]#특정 인덱스들의 모든 컬럼df.loc[[인덱스1, 인덱스2], :]df.loc[[인덱스1, 인덱스2]]#특정 컬럼들의..

빅데이터 공부 2023.10.26

판다스(Pandas)

print(sr2[[2,3]])#숫자 인덱스에 sr2[2], sr2[3] 출력 print(sr2[['2','3']])#문자열 인덱스에 sr2['2'], sr2['3'] 출력 판다스는 행과 열로 구성된 테이블 형식의 데이터를 다루는 데이터 분석에 많이 사용되는 패키지이다. 변수가 1개일 경우에는 시리즈(Series), 변수가 2개 이상이면 데이터프레임(Data Frame) 객체를 사용한다. 판다스 패키지 추가 import pandas as pd Series: 1차원 배열 형태의 구조로, 인덱스와 데이터가 있어 파이썬 딕셔너리와 유사하다. 배열의 각 원소에는 서로 다른 자료형을 넣을 수 있고, 다차원 배열도 원소로 넣을 수 있다. DataFrame: 2차원 테이블 형태의 구조로, 여러 열과 행을 가지며 열은..

빅데이터 공부 2023.06.17