본문 바로가기

파이썬28

[바이브코딩]한영타변환 모방.py 현재 아주 고맙게 잘 쓰고있는 한영타 변환기가 있다https://www.theyt.net/wiki/%ED%95%9C%EC%98%81%ED%83%80%EB%B3%80%ED%99%98%EA%B8%B0 한영타변환기 – theYT.net한/영타 변환기 생각하고 쓴 날짜 : 2004/01/21 제목이 나타내듯 바로 '한/영타 변환기' 입니다. 가끔씩 볼 수 있는 'dodls rngka;' 같은 한글을 영어로 친 것이나, '소둇.ㅜㄷㅅ' 같은 영어를 한글로 친www.theyt.net 이 로직을 간단히 GPT에게 알려줘서 파이썬 소스로 달라고 하자(대화 시간 : 30분) 나의 말  :한영타 변환해주는 파이썬 코드를 작성해줄수있나?가끔씩 볼 수 있는 'dodls rngka;' 같은 한글을 영어로 친 것이나, '소둇.ㅜ.. 2025. 4. 9.
[파이썬] 영화 추천 시스템 실습: Item-based Collaborative Filtering, pivot_table, corrwith 추천시스템은 영화나 노래등을 추천하는데 사용되며, 주로 관심사나 이용 내역을 기반으로 추천한다. movie_titles_df= movies_rating_df= 실습 1. 두개의 데이터프레임을 합치시오. in: movie = pd.merge(movies_rating_df,movie_titles_df, on = 'item_id') out: 실습 2. timestamp 컬럼은 필요없으니, movies_rating_df 에서 아예 제거하시오. in: movie.drop('timestamp',axis=1,inplace=True) movie out: 실습 3. 각 영화별 별점의 평균을 구하고, 이를 ratings_df_mean 에 저장하시오. 또, 각 영화별로 몇개의 데이터가 있는지 구하고, 이를 ratings_d.. 2022. 5. 12.
[파이썬] Alexa 리뷰 실습: Word Cloud, STOPWORDS 리뷰로부터 인사이트를 얻고, 감성분석을 한다. 데이터셋은 아마존의 알렉사 제품에 대한, 3000개의 리뷰로 되어있다. 컬럼은 rating, date, variation(제품모델), verified_reviews, feedback Dataset: www.kaggle.com/sid321axn/amazon-alexa-reviews 실습 1. 패키지 설치 프로젝트를 위해, 아나콘다 프롬프트를 실행하고, 다음을 인스톨 하세요. conda install -c conda-forge wordcloud 실습 2. pandas로 파일 읽기 - 탭으로 되어 있는 tsv 파일 읽기 df = pd.read_csv('data/amazon_alexa.tsv',sep="\t") # 혹은 read_table활용 실습 3. verifi.. 2022. 5. 10.
[파이썬] 데이터 분석 실습: 범죄현황 + 구글 맵 API (Geocoding), gmaps.geocode 서울시 구별 범죄 발생과 검거율 데이터 분석 '서울시 관서별 5대 범죄 발생 검거 현황' 파일을 가지고 분석한다. 실습 1. crime_in_Seoul.csv 파일을 pandas 로 읽어오세요. 실습 2. 경찰서들은 하나의 구에 여러개가 있을 수 있습니다. 따라서 구 단위로 데이터를 통합하세요. 구글 맵 API 를 이용해서, 경찰서가 무슨 구에 있는지 확인하기 위해 아나콘다 프롬프트웨어 다음을 실행. (pip install googlemaps) import googlemaps # 아나콘다 기준으로 아나콘다 프롬프트를 실행하여 pip install googlemaps 입력 구글 클라우드의 MAPS API 페이지로 이동하여, API 키를 생성합니다. https://cloud.google.com/maps-pl.. 2022. 5. 4.
[파이썬] 데이터 분석 실습: CCTV설치 실습 1. CCTV_in_Seoul.csv 파일을 pandas 로 읽어오세요. 실습 2. 컬럼 중 "기관명" 컬럼명을 "구별" 로 이름을 바꾸세요. 실습 3. population_in_Seoul.xls 파일을 읽으세요. # header 파라미터로 컬럼명을 엑셀에서 몇번째 열에 위치한 컬럼들로 할지 설정할수있다. # usecols으로 사용할 컬럼들만 엑셀에서 가져올수있다. 실습 4. pop_Seoul 의 컬럼명을 모두 출력하세요. 실습 5. 컬럼명을 다음처럼 바꿉니다. (0번째는 '구별' , 1번째는 '인구수', 2번쨰는 '한국인', 3번째는 '외국인', 4번째는 '고령자' 로 rename) pop_Seoul.rename(columns={'자치구':'구별','계':'인구수','계.1':'한국인','계.2'.. 2022. 5. 4.
[파이썬] 데이터 분석 실습: 인구조사 https://mois.go.kr에서, 연령별 인구현황 통계표를 csv로 다운로드 한다. (남녀구문을 uncheck, 연령1세단위, 0~100, 전체읍면동현황) pd.read_csv로 해당 파일을 가져오면 숫자로 된 str데이터가 포함되는데 이는 1000 단위마다 쉼표를 넣어 구분하는 표시때문에 문자열로 인식하게 된다. 그러므로 thousand 파라미터를 사용해서 문자열을 숫자형식으로 불러와야 한다. df = pd.read_csv('data/age.csv',encoding='cp949', thousands=',') 실습 1. '삼청동' 의 인구 구조를, 0세부터 100세 까지 나이대 별로 몇명이 있는지 시각화 하세요. (가로축은 나이, 세로축은 인구수) 실습 2. '종로구' 의 인구 구조를, 0세부터 1.. 2022. 5. 4.
[파이썬] 데이터 분석 실습: 대중교통 subwayfee.csv 파일을 통한 지하철 유무임별 이용현황 데이터 분석 (자료출처 : t-money.co.kr) 실습 0. 유임승차, 유임하차, 무임승차, 무임하차 4가지 별로, 각각 가장 많은 역을 찾아보세요. 실습 1. 무임승차 대비 유임승차 비율이 가장 높은 역은 어디입니까? # 무임승차 컬럼에 0값을 가진 데이터가 있어 그대로 나누어주면 inf나온다 # 그러므로 0을 제외하고 나누어 주도록하자 실습 2. 전체승차인원(유임+무임)이 만명이상인 역 중, 유임승차 비율이 가장 높은 역은 어디입니까? 실습 3. 모든 역의 유임승차, 유임하차, 무임승차, 무임하차, 총 4개를, 파이차트로 나타내세요. 먼저 첫번째와 두번쨰 행에 있는 서울역과 시청의 승하차현황을 나타내보면서 어떻게 코드를 짜야할지 생각하.. 2022. 5. 4.
[파이썬] 데이터 분석 실습: 기온데이터분석 기온데이터는 아래와 같다. 실습 1. 가장 더운날은 언제입니까? 실습 2. 최고기온을 히스토그램으로 나타내되, bin의 범위를 4도로 만들어서, 히스토그램으로 보여주세요. 실습 3. 위에서는 모든 날짜에 대한 데이터 입니다. 그러면! 2014년도 부터의 데이터를 기준으로, bin의 범위를 4도로 만들어서, 히스토그램으로 보여주세요. 내가 한 방법: 실습 4. 2017-08-01 ~ 2017-08-15 사이의 날짜별 x축, 최고기온을 y축으로 스케터로 나타내세요. 2022. 5. 3.