◆ 이번에는 키워드 동시 출현 빈도값을 기반으로 Keyword network 및 네트워크 군집화를 하여 그래프 그리기를 해보려고 한다.

그 전에, python의 networkx 패키지를 이용하여 어찌저찌 그래프를 그려보았지만, 몇가지의 문제가 있어 이걸 다른 분석 결과에 가져다 쓰기는 조금 부족해보였다.

아래는 networkx등의 패키지를 이용해서 python으로 그려본 그래프이다.

그룹화하는 알고리즘을 어디선가 찾아서 군집화도 시도를 해보았다.

일단, 노드들이 겹쳐지는 문제가 있고, 노드 위치등을 옮기고 하는게 쉽지 않았다.

그래서 UCINET 툴을 이용해서 그리는게 매우 효율적이었다.

※아래 블로그를 참고하면 사용법을 쉽게 따라할 수 있다.

[Network Graph 그리기]

빅데이터 분석 솔루션 텍스톰(Textom)

 

텍스톰(TEXTOM)

웹 기반의 빅데이터 분석 솔루션! WEB, SNS, 보유데이터 분석이 가능합니다.

www.textom.co.kr

 

[CONCOR 분석 - 군집화]

빅데이터 분석 솔루션 텍스톰(Textom)

 

텍스톰(TEXTOM)

웹 기반의 빅데이터 분석 솔루션! WEB, SNS, 보유데이터 분석이 가능합니다.

www.textom.co.kr

 

위 툴을 사용하면, 마우스로 쉽게 노드들을 옮길 수 있고, 노드크기 조절(Weight에 비례하게도 가능)

특정 노드 없애기, 군집화, 각 군집별 색상, 필터링 등등 손쉽게 사용가능한 기능들이 많다.

툴에 데이터를 로드할 때, concurrency_sheet.xlsx 와 concurrency_list.csv 에 생성해서 저장한 값들을 복사해서 UCINET 툴에 복사해서 붙여넣기를 하면 된다. (위 링크 참조)

UCINET 설치파일 다운

Analytic Technologies - Download (google.com)

 

Analytic Technologies - Download

TO DOWNLOAD, PRESS THE RED DOWNLOAD BUTTON BELOW. BUT YOU MIGHT WANT TO READ THE WHOLE PAGE FIRST

sites.google.com

 

 

아마 32비트 64비트용 프로그램이 동시에 설치될 것인데, 32비트용 프로그램을 실행해야 문제가 없을듯하다.

첨엔, 64비트로 했다가 알 수 없는 오류로 진행이 안되는 경우가 많았다. 이유를 모르고 계속 오류가 발생해서 한참을 삽질했는데, 우연히 32비트로 실행해야 된다는 말을 검색중에 찾았다.

+ Recent posts