Skip to content

밴드 자우림의 가사를 수집하고 KoNLPy를 이용하여 사용된 명사를 통계 내는 프로젝트

Notifications You must be signed in to change notification settings

JinooJung/Jaurim-nouns-on-lyrics-counting

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Jaurim-nouns-on-lyrics-counting

밴드 자우림의 가사를 수집하고 KoNLPy를 이용하여 사용된 명사를 통계 내는 프로젝트

(Legacy created at 2019)

설명

Python의 requests와 BeautifulSoup를 이용하여 자우림의 가사를 수집하고, KoNLPy를 이용하여 사용된 명사를 통계 내는 프로젝트입니다.

2019년 당시 출시 되었던 모든 자우림 멤버(김윤아, 이선규, 김진만, 구태훈 이하 4명) 작사곡(타 작사가 작사곡은 제외)이 포함되었으며 정규앨범 기준 10집까지 해당되며 여러 EP가 포함되었습니다. 네이버 뮤직에서 해당 되는 모든 곡의 가사를 웹크롤링 한 후, KoNLPy를 이용하여 각 곡마다 명사들의 집합을 만든 후(즉 곡당 한 단어 1회 카운트), 각 단어가 몇 곡에서 등장하였는지 세어줬습니다. 세어준 결과치에서 큰 의미를 가지지 않는 단어들은 제외했습니다.

※ 2024년 현재 크롤링 코드는 네이버 뮤직의 사이트 개편에 따라 더이상 작동하지 않습니다. (2019년에 작성된 코드)

통계치

plot

About

밴드 자우림의 가사를 수집하고 KoNLPy를 이용하여 사용된 명사를 통계 내는 프로젝트

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages