Skip to content

基于触发词的燃气事件抽取,包括:时间、地点、原因、后果、组织等实体信息

Notifications You must be signed in to change notification settings

DangYG/GasEventExtraction

Repository files navigation

EventExtraction

事件抽取-目前限定燃气事故,数据来源为“燃气爆炸微信公众平台”


基于模板

燃气事件

  1. 触发词:爆炸,起火,闪爆,爆燃,泄漏, 火灾, 中毒
  2. 事件类型:燃气火灾事故、燃气爆炸事故、燃气泄漏事故、CO中毒事故、燃气闪爆事故
  3. 发生时间:xxxx年xx月xx日xx时xx分,当晚,凌晨, 早上...
  4. 事故地点:
  5. 救援组织:
  6. 事故损伤:死亡,受伤,伤亡, 烧毁,受损,损失...
  7. 事故原因:原因,调查...

匹配模板

  1. .*?(未造成(?:伤亡|人员伤亡|经济损失
  2. .*?造成.*?(\d+人死亡)
  3. .*?造成.*?(\d+人受伤)

操作步骤

  1. 使用 stanfordcorenlp 工具包,识别触发词,抽取时间、地点、组织(修改stanfordnlp_ner.py文件中的stanfordnlp工具包路径,stanfordnlp工具可自行百度下载)
  2. 将待抽取燃气事故放入“燃气事故.docx文件”,每个事件一个段落
  3. 执行:python event_extraction.py,结果保存为xls文件
  4. 处理xls文件数据,并保存为csv文件,执行python csv_to_neo4j.py,导入抽取结果至neo4j数据库

抽取效果

示例一:

西安一燃气管道遭施工方挖断...5天挖断3次。2019年10月17日凌晨,居多民网友反映,西安科技八路快速路施工单位,于凌晨2:56再次挖断天然气管道造成天然气泄漏(罗马西西里外),喷射足有十几米高!就此,18日早7点,当地燃气公司工作人员表示17日晚罗马西西里外发生的爆管事件属实。但管子是个旧管,可能是因为内有余气,所以才发生喷射,目前工作人员已沿线排查,燃气管道完好,周边居民可放心用气。

{'trigger': '泄漏', 'events': '燃气泄漏事故', 'time': '2019年10月17日凌晨', 'location': '罗马,西安', 'rescue_org': '未知', 'cause': '正在进一步调查', 'loss': '未知'}

示例二:

上海一面馆疑似液化气泄漏发生爆燃,居民深夜被震醒。2019年10月18日凌晨0点左右,浦东归昌路凌河路交叉口的浦兴菜市场一面馆发生爆燃事故,据初步了解:不排除事发面馆内的液化气发生泄漏后发生爆燃事故,未造成人员伤亡。事故原因可能使用液化气操作不当。

{'trigger': '泄漏', 'events': '燃气泄漏事故', 'time': '深夜', 'location': '浦东归昌路凌河', 'rescue_org': '未知', 'cause': '可能使用液化气操作不当', 'loss': '未造成人员伤亡'}

About

基于触发词的燃气事件抽取,包括:时间、地点、原因、后果、组织等实体信息

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages