分类: 信息资源管理 >> 情报学 提交时间: 2024-09-11
摘要:为解决可降解农用地膜领域知识结构复杂、专利文本专有名词众多、数据利用效率低等问题,本文利用知识图谱强大的语义处理和知识关联能力,提出了一种基于深度学习的可降解农用地膜领域专利知识图谱构建方法。首先,该方法根据可降解农用地膜专利数据特征并结合专家先验知识,预定义实体类型、属性和关系集合,采用自顶向下的模式构建知识图谱本体模型。随后,按照本体模型选定数据范围,从结构化、半结构化和非结构化专利数据中进行数据选取或信息抽取。对于半结构化数据和非结构化数据部分,对少量训练样本进行文本标注后,利用通用信息抽取(Universal information extraction,UIE)框架进行数据挖掘,识别并抽取可降解农用地膜技术要素字段。抽取结果表明,在少量训练样本前提下,该抽取方法具有较高的准确率97.78%,召回率93.62%和F1值95.65%,显著优于BERT-BiLSTM+CRF模型。最后,将抽取到的知识存储到Neo4j图数据库,实现知识图谱可视化及知识关联推理。本研究构建的可降解农用地膜知识图谱可以有效解析可降解农用地膜领域技术结构,实现对农膜专利数据的有效分析挖掘,并可较好的为地膜专利信息检索、知识问答等应用领域提供知识库基础。