본문 바로가기
Python

[파이썬] 데이터 분석 실습: CCTV설치

by eyoo 2022. 5. 4.

실습 1. CCTV_in_Seoul.csv 파일을 pandas 로 읽어오세요.

 

 

실습 2. 컬럼 중 "기관명" 컬럼명을 "구별" 로 이름을 바꾸세요.

 

 

실습 3. population_in_Seoul.xls 파일을 읽으세요.

 

# header 파라미터로 컬럼명을 엑셀에서 몇번째 열에 위치한 컬럼들로 할지 설정할수있다.

# usecols으로 사용할 컬럼들만 엑셀에서 가져올수있다.

 

 

실습 4. pop_Seoul 의 컬럼명을 모두 출력하세요.

 

 

 

실습 5. 컬럼명을 다음처럼 바꿉니다.
(0번째는 '구별' , 1번째는 '인구수', 2번쨰는 '한국인', 3번째는 '외국인', 4번째는 '고령자' 로 rename)

 

pop_Seoul.rename(columns={'자치구':'구별','계':'인구수','계.1':'한국인','계.2':'외국인','65세이상고령자':'고령자'}, inplace=True)

 

 

실습 6. CCTV 갯수가 가장 많은 순부터 적은 순으로 정렬한 후, 상위 20개만 화면에 보여주세요.

 

 

 

실습 7. 최근 3년간 CCTV 증가율을 계산하여, dataframe 에 '최근증가율' 컬럼을 추가하세요.

(증가율 계산 : (2016 + 2015 + 2014) / 2013이전 * 100)

 

df_CCTV['최근증가율'] = (df_CCTV['2016년']+df_CCTV['2015년']+df_CCTV['2014년'])/df_CCTV['2013년도 이전']*100

 

 

실습 8. 최근 3년간 CCTV 증가율이 가장 높은 순으로 5개의 구를 찾으세요.

 

 

 

실습 9. 서울시의 인구 데이터 중, 가장 첫번째 로우(row) 는 필요 없으니, 삭제하세요.

 

 

 

실습 9. 서울시의 인구 데이터 중, NaN이 있는지 확인하고, NaN이 있으면 해당 row를 삭제하세요.

 

 

 

실습 10. '외국인비율' 과 '고령자비율' 두개의 컬럼을 추가하세요.
(외국인비율 = 외국인 수 / 인구수 * 100
고령자비율 = 고령자 수 / 인구수 * 100)

 

 

 

실습 11. 외국인 대상으로 장사를 하려 합니다. 외국인이 가장 많은 구와, 외국인비율이 가장 높은 구를 각각 5개씩 찾으세요.

 

 

 

실습 12. 고령자 대상 마케팅을 구상 중입니다. 고령자가 가장 많은 구와, 고령자비율이 가장 높은 구를 각각 5개씩 찾으세요.

 

 

 

실습 13. CCTV 데이터와 인구 데이터 합치고 분석하기

 

 

 

실습 14. data_result 에서, 다음 4개의 컬럼을 모두 버려 버립니다.

('2013년도 이전', 2014년', '2015년', '2016년')

 

 

 

실습 15. dara_result 의 인덱스를, '구별' 로 바꿔줍니다.

 

 

 

실습 16. 이 데이터프레임을 csv 파일로 저장합니다.

 

df.to_csv('CCTV_result.csv')

 

 

실습 17. CCTV의 갯수와 고령자 비율의 상관관계를 분석하세요.

 

# 상관계수는 -1부터 1까지의 값을 갖는다.1일 때 완벽한 양의 상관관계가 되고

# -1일 때 완벽한 음의 상관관계가 된다.

# 0이라면 별다른 상관관계가 없음을 의미한다.
# 상관계수가 0.1 이하면 관계가 없고, 0.3 이하면 약한관계다.

# 따라서 CCTV의 갯수와 고령자 비율의 관계는 약한 반비례 관계다.

 

 

실습 18. CCTV의 갯수와 외국인 비율의 상관관계를 분석하세요.

 

 

 

실습 19. CCTV의 갯수와 인구수의 상관관계를 분석하세요.

 

 

 

실습 20. 각 구의 CCTV의 갯수를 bar로 나타내세요.

 

# 판다스에서 직접 제공하는 plot함수를 이용하여 바 차트를 만들수 있다.

# kind 파라미터를 bar로 설정하면 바 차트가 된다. (barh 면 가로방향 바차트 생성)

 

 

실습 21. 각 구의 CCTV의 갯수를, 먼저 소팅(큰순)한 후, bar로 나타내세요.

 

 

 

실습 22. 인구 한명당 CCTV의 비율을 계산하고, 이를 각 구별로 CCTV비율이 얼마인지 bar로 나타내세요.

 

 

 

실습 23. 인구수와 CCTV갯수가 어떤 분포인지, scatter로 나타내세요.

 

 

댓글