K-Means-Clustering-on-Documents

Document clustering algorithm based on TF-IDF

Data set used is : Pick up the Reuters R52 dataset from https://www.cs.umb.edu/~smimarog/textmining/datasets/.

First run createDocument_in_folders.java to creats documents in AllDocumnets folder.

Then run kMeans.java to perform clustering on AllDocumnets.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
K-Means Clustering		K-Means Clustering
README.md		README.md

Provide feedback