Skip to content
Change the repository type filter

All

    Repositories list

    • 0000Updated Jul 23, 2018Jul 23, 2018
    • HanLP

      Public
      自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取 新词发现 短语提取 自动摘要 文本分类 拼音简繁
      Java
      Apache License 2.0
      10k000Updated Apr 10, 2018Apr 10, 2018
    • ⚡ 分布式微博爬虫,部署简单,接口丰富,文档详细,演示视频支持,可灵活定制满足自己的需求。已实现内容包括微博用户资料、微博信息、评论信息和转发信息抓取。目前专注于程序本身的健壮性和易用性,正在快速迭代,欢迎watch跟进,star支持
      Python
      MIT License
      1.2k100Updated May 30, 2017May 30, 2017
    • THULAC

      Public
      An Efficient Lexical Analyzer for Chinese
      C++
      172000Updated Mar 10, 2017Mar 10, 2017
    • jieba

      Public
      结巴中文分词
      Python
      MIT License
      6.7k000Updated Jan 10, 2017Jan 10, 2017
    • 结巴分词(java版)
      Java
      Apache License 2.0
      842000Updated Nov 9, 2016Nov 9, 2016
    • cncorpus

      Public
      中文语料爬取爬虫
      Python
      2000Updated Oct 19, 2015Oct 19, 2015
    • 基于深度学习的中文分词尝试
      Jupyter Notebook
      35000Updated Aug 27, 2015Aug 27, 2015
    • corpusZh

      Public
      一个中文的已标注词性的语料库
      JavaScript
      69000Updated Aug 5, 2014Aug 5, 2014
    • webdict

      Public
      一个中文词库
      The Unlicense
      71000Updated May 11, 2014May 11, 2014