v1.6.4常规维护
- 优化CorpusLoader、优化MutableFeatureMap的设计
- 优化新词发现,使结果不含分隔符:#826
- TextRank提取关键词提升算法速度 @hlstudio
- 用户词典热更新时支持.csv @patrick_lin
- 增强词向量读取时的健壮性:#821
- 根据百度汉语和在线辞海修正拼音词典 @AnyListen
- 修订停用词词典 @duohappy
- 修复词法分析器禁用用户词典时发生的问题、修复词法分析器seg接口与命名实体识别的配合问题:https://github.com/hankcs/pyhanlp/issues/15#issuecomment-382583304 、修正结构化感知机多线程平均的问题
- 微调人名识别模型、新增月份词汇
- 数据包 data-for-1.6.4.zip
md5=8b5b944f89c4052d0552bf8ad7479010
获取最新版的数据包,请fork
并git clone
一份仓库中的最新data。 - Portable版同步升级到v1.6.4
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.6.4</version>
</dependency>
🎉感谢所有在issue中提出宝贵建议的用户!