Skip to content

Latest commit

 

History

History
11 lines (6 loc) · 477 Bytes

README.md

File metadata and controls

11 lines (6 loc) · 477 Bytes

Spam-SMS-recognition

一个简单垃圾短信识别模型,使用BERT提取词向量来训练一个LSTM模型,本科毕业设计,答辩已过,代码完整性没问题,但是可能有很多细节性上的问题。

依赖jieba, Pytorch, transformers, 以及Nvidia的CUDA和cuDNN

训练模型直接运行train.py

main.py是一个小的模型测试脚本。

数据集默认1万条,存放在data文件夹内,同文件夹下也存放有原始的80万条短信。