摘要
- 地质报告中出现了大量的非结构化文本数据;因此,在不进行信息提取和处理的情况下,很难从它们那里获取有价值的信息。
- 本研究提出了一种通过三次提取从地质报告中自动提取信息的方法,然后从提取的实体和关系中自动构建地质知识图谱。
- 结构化信息有助于更好地表示源报告的内容,并与地质领域知识相匹配。
- 结构化信息有助于更好地表示源报告的内容,并与地质领域知识相匹配。该方法可以快速、稳健地将文本数据转换为便于推理和查询地质实体和关系的结构化形式。
HighLights
- 提出了一种地质文本三元组联合提取模型。
- 提高了地质文本三元组的提取完整性,解决了重叠问题。
- 构建地质报告知识图谱,发现新的地质知识。
研究目标
研究内容
研究方法
结论
讨论
解决的问题
正文
使用