본문 바로가기

wordcloud2

[머신러닝] 스팸 분류 실습: CountVectorizer, Data Cleaning, Pipelining, NaiveBayes, Wordcloud 제시되는 데이터에는 약 5,728개의 이메일 메시지가 있으며, 스팸인지 아닌지의 정보를 가지고 있다. spam 컬럼의 값이 1이면 스팸이고, 0이면 스팸이 아니다. 스팸인지 아닌지 분류하는 인공지능을 만들자 (Supervised learning의 분류 문제) # colab으로 실습을 진행하였다. 실습 1. 구글드라이브에 있는 emails.csv 읽기 from google.colab import drive drive.mount('/content/drive') # colab의 구글드라이브 마운트 버튼을 누르면 해당 코드가 나온다. chdir로 디렉토리를 바꾸고 read_csv로 데이터를 불러오자. in: import os os.chdir('/content/drive/MyDrive/Colab Notebooks.. 2022. 5. 10.
[파이썬] Alexa 리뷰 실습: Word Cloud, STOPWORDS 리뷰로부터 인사이트를 얻고, 감성분석을 한다. 데이터셋은 아마존의 알렉사 제품에 대한, 3000개의 리뷰로 되어있다. 컬럼은 rating, date, variation(제품모델), verified_reviews, feedback Dataset: www.kaggle.com/sid321axn/amazon-alexa-reviews 실습 1. 패키지 설치 프로젝트를 위해, 아나콘다 프롬프트를 실행하고, 다음을 인스톨 하세요. conda install -c conda-forge wordcloud 실습 2. pandas로 파일 읽기 - 탭으로 되어 있는 tsv 파일 읽기 df = pd.read_csv('data/amazon_alexa.tsv',sep="\t") # 혹은 read_table활용 실습 3. verifi.. 2022. 5. 10.