본문 바로가기
Python

[파이썬] 판다스: concat, merge, pivot_table

by eyoo 2022. 5. 2.

concat 함수를 통해 두개 이상의 데이터프레임을 합칠수있다.

 

df_Engineering_dept = 

 

df_Finance_dept =

 

위의 데이터프레임들을 하나로 합쳐보자

 

in:

df_all = pd.concat([df_Engineering_dept,df_Finance_dept])
df_all

out:

# 하나의 새로운 데이터프레임으로 다시 만들고 싶다면 인덱스명에 주의하자

# reset_index함수로 인덱스를 재설정하여 0부터 오름차순으로 바꿔줄수있다.

 

 

merge 함수를 사용해 연봉 데이터가 들어있는 데이터프레임을 이전의 합쳐진 부서데이터에 넣어보자

 

 

in:

pd.merge(df_all,df_salary,on = 'Employee ID')

out:

# on 파라미터로 연결되는 컬럼의 이름을 입력해 데이터를 연결시킬수 있다.
# 첫번째 데이터프레임을 left 두번째를 right 라고 한다.
# 기본형은 두개의 교집합만 합치고 없는것은 제외한다.

 

 

how 파라미터로 모두 표시할 열을 지정할수 있다.

 

in:

pd.merge(df_all,df_salary,on = 'Employee ID', how='left')

out:

# 샐러리 정보가 없는 행도 Nan으로 처리되어 표시된다.

 

 

판다스를 사용하여 피봇테이블을 만들수 있다.피봇팅 한다는것은 컬럼의 값을 열로 만드는것이다.

 

df=

 

pivot_table 함수로 중복데이터가 있으면 하나로 합쳐서 인덱스로 뽑되, 수치데이터만을 뽑아 하나로 합칠수있다.

 

in:

pd.pivot_table(df, index=['Name'])

out:

# 데이터와 인덱스를 설정하면 만들어 진다.

# 기본값은 평균값으로 나오게 되며 다른 값으로 설정하고싶으면 aggfunc파라미터를 사용하면 된다.

# 합계를 나타내고 싶으면 aggfunc = np.sum 을 파라미터로 사용하면된다.

 

 

 

 

 

댓글