concat 함수를 통해 두개 이상의 데이터프레임을 합칠수있다.
df_Engineering_dept =

df_Finance_dept =

위의 데이터프레임들을 하나로 합쳐보자
in:
df_all = pd.concat([df_Engineering_dept,df_Finance_dept])
df_all
out:

# 하나의 새로운 데이터프레임으로 다시 만들고 싶다면 인덱스명에 주의하자
# reset_index함수로 인덱스를 재설정하여 0부터 오름차순으로 바꿔줄수있다.
merge 함수를 사용해 연봉 데이터가 들어있는 데이터프레임을 이전의 합쳐진 부서데이터에 넣어보자

in:
pd.merge(df_all,df_salary,on = 'Employee ID')
out:

# on 파라미터로 연결되는 컬럼의 이름을 입력해 데이터를 연결시킬수 있다.
# 첫번째 데이터프레임을 left 두번째를 right 라고 한다.
# 기본형은 두개의 교집합만 합치고 없는것은 제외한다.
how 파라미터로 모두 표시할 열을 지정할수 있다.
in:
pd.merge(df_all,df_salary,on = 'Employee ID', how='left')
out:

# 샐러리 정보가 없는 행도 Nan으로 처리되어 표시된다.
판다스를 사용하여 피봇테이블을 만들수 있다.피봇팅 한다는것은 컬럼의 값을 열로 만드는것이다.
df=

pivot_table 함수로 중복데이터가 있으면 하나로 합쳐서 인덱스로 뽑되, 수치데이터만을 뽑아 하나로 합칠수있다.
in:
pd.pivot_table(df, index=['Name'])
out:

# 데이터와 인덱스를 설정하면 만들어 진다.
# 기본값은 평균값으로 나오게 되며 다른 값으로 설정하고싶으면 aggfunc파라미터를 사용하면 된다.
# 합계를 나타내고 싶으면 aggfunc = np.sum 을 파라미터로 사용하면된다.
'Python' 카테고리의 다른 글
| [파이썬] 데이터 분석 실습: 기온데이터분석 (0) | 2022.05.03 |
|---|---|
| [파이썬] 맷플롯립 (Matplotlib) (0) | 2022.05.02 |
| [파이썬] 판다스: 조건과 정렬 (0) | 2022.05.02 |
| [파이썬] 판다스: 카테고리컬 데이터 (categorical data) (0) | 2022.05.01 |
| [파이썬] 판다스: NaN (0) | 2022.04.29 |
댓글