◆ 이번에는 TF값을 이용하여 Word Cloud를 그려보려고 한다.
WordCloud 패키지에서 지원을 해주기 때문에 쉽게 가능하다.
import pandas as pd
from wordcloud import WordCloud
def main():
df = pd.read_excel('./count_tf.xlsx', header=None)
count = {} # dictionary 만들기
for index, row in df.iterrows():
w, c = row[0], row[1]
count[w] = c
#한글로 그리기 위해서는 별도로 폰트가 필요할 것이다.
fontpath = './NanumBarunGothic.ttf'
wordcloud = WordCloud(
font_path = fontpath,
max_font_size = 350,
width = 1280, #이미지 너비 지정
height = 960, #이미지 높이 지정
prefer_horizontal = 1,
background_color = 'white', #이미지 배경색 지정
max_words = 80) #몇개의 단어를 표시할 것인지
word_cloud_file_name = "./word_cloud.png"
wordcloud.to_file(word_cloud_file_name)
print("> word cloud image exported to ", word_cloud_file_name)
대략 아래와 같은 형태로 이미지를 얻을 수 있다.

'SW Project > 빅데이터 키워드 네트워크 분석' 카테고리의 다른 글
빅데이터 키워드 분석 : Keyword Network Graph 그리기 (0) | 2023.11.19 |
---|---|
빅데이터 키워드 분석 : 연결 중심성, 위세 중심성 계산 (Centrality) (0) | 2023.11.19 |
빅데이터 키워드 분석 : 동시 출현 빈도 계산 (0) | 2023.11.19 |
빅데이터 키워드 분석 : Term Frequency, TF-IDF 계산 및 막대그래프(plot-bar) 그리기 (0) | 2023.11.19 |
빅데이터 키워드 분석 : 개발환경, 데이터 정제 (0) | 2023.11.19 |