GitHub

最近参加了一个命名实体识别比赛，学到了很多调参技巧，比赛进了复赛就没有打了

开源一下自己的代码，以后自己可以参考参考。

主要的方法是使用bert+lstm, bert+idcnn,bert+lstm+attention.

其中效果最优的是bert+lstm+attention

trick的话，主要就是在计算损失的时候，增加'B', 'I', 'E'标签损失比重，减少’O'标签损失比重

#bilstm可改为其他模型 idcnn、bilstm_attn
python3 ensemble.py -m bilstm
#结果在/data/5-fold/bilstm/

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
.vscode		.vscode
__pycache__		__pycache__
backup		backup
crf		crf
data		data
.gitignore		.gitignore
bilstm.py		bilstm.py
bilstm_attn.py		bilstm_attn.py
config.yml		config.yml
data_loader.py		data_loader.py
data_util.py		data_util.py
ensemble.py		ensemble.py
idcnn.py		idcnn.py
model_process.py		model_process.py
out.txt		out.txt
readme.md		readme.md
selfattention.py		selfattention.py
temp.txt		temp.txt
util.py		util.py

Provide feedback