FastHMM

README written in English

FastHMM

实现快速训练和解码预测的 HMM（隐马尔可夫模型）的 python 包

版本依赖

Python3

安装

pip

pip install FastHMM

source

pip install git+https://github.com/312shan/FastHMM.git

用法示例

from FastHMM.hmm import HMMModel

# test model training and predict
hmm_model = HMMModel()
hmm_model.train_one_line([("我", "r"), ("爱", "v"), ("北京", "ns"), ("天安门", "ns")])
hmm_model.train_one_line([("你", "r"), ("去", "v"), ("深圳", "ns")])
result = hmm_model.predict(["俺", "爱", "广州"])
print(result)

# test save and load model
hmm_model.save_model()
hmm_model = HMMModel().load_model()
result = hmm_model.predict(["我们", "爱", "深圳"])
print(result)

Output:

[('俺', 'r'), ('爱', 'v'), ('广州', 'ns')]
[('我们', 'r'), ('爱', 'v'), ('深圳', 'ns')]

性能:

在人民日报数据集上进行测试

python .test/test_postagging.py

Output:

train size 18484 ,test_size 1000
finish training
eval result: 
predict 57929 tags, 54228 correct,  accuracy 0.9361114467710473
runtime : 370.1029086 seconds

上面的 case 大部分时间消耗都在解码阶段，尝试了多种方法来实现维特比算法，当前使用的实现是其中最快的。如果您有改建议，欢迎留言，非常感谢。

TODO

增加一个 BMES 标注的字粒度的 FastHMM 序列标注用例脚本。（上面的 93% 是词粒度）
增加基于 BMES 标注数据的 FastHMM 分词用例脚本。
增加一个序列标注评估脚本，实现更多指标的自动评测。

参考

MicroHMM
Hidden Markov model
Viterbi algorithm

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.test		.test
FastHMM		FastHMM
data		data
model		model
.gitignore		.gitignore
LICENSE.txt		LICENSE.txt
README.en.md		README.en.md
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

README written in English

FastHMM

版本依赖

安装

pip

source

用法示例

性能:

TODO

参考

About

Releases

Packages

Languages

License

312shan/FastHMM

Folders and files

Latest commit

History

Repository files navigation

README written in English

FastHMM

版本依赖

安装

pip

source

用法示例

性能:

TODO

参考

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages