Skip to content

Latest commit

 

History

History
8 lines (8 loc) · 451 Bytes

File metadata and controls

8 lines (8 loc) · 451 Bytes

从零训练

步骤说明

  1. 从线上获取 doc pair 格式为 : doc_id + \t + doc_id
  2. 根据需求送评标注
  3. 基于 MongoUtils 构造 File_Fields, 格式为 : doc_id + \t + doc_id + \t + jstr + \t + jstr
  4. 基于 ARFFUtils + File_Fields 构造 File.arff 注: 如需新增特征或查看特征计算详情, 见 FeatureUtils, 且新增特征需保证特征数量与 arff header 保持一致.
  5. 基于 ModelUtils + File.arff 训练模型