CN112765363A - 一种面向科技服务需求的需求图谱构建方法 - Google Patents
一种面向科技服务需求的需求图谱构建方法 Download PDFInfo
- Publication number
- CN112765363A CN112765363A CN202110067662.0A CN202110067662A CN112765363A CN 112765363 A CN112765363 A CN 112765363A CN 202110067662 A CN202110067662 A CN 202110067662A CN 112765363 A CN112765363 A CN 112765363A
- Authority
- CN
- China
- Prior art keywords
- triples
- demand
- requirement
- graph
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims abstract description 25
- 238000002372 labelling Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 230000000007 visual effect Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 6
- 210000001072 colon Anatomy 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000000547 structure data Methods 0.000 abstract 3
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000003058 natural language processing Methods 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明为一种面向科技服务需求的需求图谱构建方法,公开了一种基于需求文档的需求图谱构建的方法,该方法首先对非结构化需求文档利用依存语法和语义角色标注初步提取出文档里的需求三元组,然后通过人工标注的方式对于部分的需求三元组标注其意图标签,接着把人工标注好的数据进行数据预处理,转换成图结构数据,用one‑hot编码对图结构数据里面的部分信息进行特征编码,得到每个三元组的特征表示,将图结构数据和处理好的特征编码转为邻接矩阵和特征矩阵输入到准备好的两层图神经网络里面,得到一个训练好可以用来预测需求三元组标签的模型,最后将所有处理好的需求三元组构建成需求图谱进行可视化展示。
Description
技术领域
本发明涉及一种面向科技服务需求的需求图谱构建方法,属于自然语言处理技术领域。
背景技术
知识图谱是谷歌在2012年提出一种语义网络,可以用图的展示形式来描述知识和客观世界万物之间的关联关系的一种技术。知识图谱是由边和节点组成。节点是一个概念实体,如苹果、人名、自然与语言处理,知识图谱。边则是概念实体的相关属性或者实体之间的关系,如英文名、引用等。具体领域的知识图谱构建是一项重要的功能,知识图谱的构建需要根据该领域的特点,设定一个符合该领域规范的知识图谱结构,紧接着如果数据是结构化数据,需要结合第三方数据进行知识融合,如果是半结构化或者结构化的数据,则是需要对数据进行属性抽取,关系抽取,实体抽取,从而得到该数据的三元组表示。之后对于这俩类数据都要进行指代消解和实体消歧,最后进行知识加工构建出该领域的知识图谱。知识图谱构建完成之后我们用其进行下游子任务,例如该领域的智能问答机器人,智能推荐等。
发明内容
本专利提出一种面向科技服务需求的需求图谱构建方法,该发明首先用自然语言处理的方法从需求文档中提取出需求三元组,然后对提取出的需求三元组进行人工标注,标注出需求三元组代表的意图,之后用one-hot码对需求三元组的本体进行编码,得到256维的特征,将特征保存为特征矩阵,以及根据需求三元组的关系构建邻接矩阵,将特征矩阵和邻接矩阵输入到设置好的图神经网络,得到一个可以识别需求三元组意图的模型,从而对所有需求三元组进行标注,标注后用d3.js的技术,实时构建输入的需求文档的需求图谱。
本发明的技术方案是:一种面向科技服务需求的需求图谱构建方法,其特征在于:具体的算法流程如下所示:
Step1、利用python-doc的包,读取存储在doc文件里面需求文档数据,并保存为字典格式;
Step2、加载哈工大语言技术平台工具Pyltp,读取Pyltp内cws.model等语言模型;
Step3、将Step1中处理好的数据先进行分句处理,将分句处理好的数据切分长句,冒号,分号等做切分标识,利用语义角色标注,获取主谓宾三元组,先根据语义角色标注的结果,抽取三元组。如果语义角色标注为空,则采取依存语法进行抽取;
Step4、将Step3中抽取成功的需求三元组利用python第三方包xlrd进行保存,存储到excel表格里面备用;
Step5、将excel里面的部分需求三元组进行人工标注,从excel里面信息提取需求三元组的特征,构建出需求三元组的特征矩阵与邻接矩阵;
Step6、将Step5中构建的矩阵放入到设计好的图神经网络进行训练,得到一个可以对三元组进行标注的模型;
Step7、利用训练好的模型将需求三元组全部进行标注后,构建成图谱形式并进行可视化展示;
进一步的,所述步骤Step2的具体步骤为:
Step2.1、加载哈工大语言技术平台工具Pyltp里面ltp.data,读取cws.model、pos.model、parser.model、ner.model、pisrl.model语言模型,以备用来对非结构化需求文本提取需求三元组。
进一步的,所述步骤Step3的具体步骤为:
Step3.1定义一个parser参数,用来存储Step2的语言模型。
Step3.2定义一个split_sents方法,导入python中的re包,通过re包内置方法,利用正则表达式来匹配字符串,对输入的需求文本进行分句处理,切分冒号,感叹号等并做切分标识。
Step3.3定义一个语义角色标注方法,可以直接获取主语,谓语,宾语三元组
Step3.4定义一个需求三元组抽取的主函数,根据Step3.3的语义角色标注的结果,进行需求三元组的抽取,如果语义角色的标记为空,则使用依存语法进行需求三元组的抽取。
进一步的,所述步骤Step5的具体步骤为:
Step5.1对抽取的N个需求三元组(h,r,t)进行人工标注,标注出这N个三元组的意图标签,例如(预期,花费,金额300万人民币),对其标注一个”约束“这个标签,标注完成后将已经标注好的需求三元组用结构化的方式存储在excel表里面,分为三列,第一列表示需求三组的id,第二列表示需求三元组的内容,第三列表示需求三元组的标签。
Step5.2紧接着需要对需求三元组进行特征提取,使用python自带包xlwt读取Step5.1存储在excel里面的内容,存储形式为字典,创建一个常见词为256维的分词器,构建索引单词,将字典中需求三元组的内容字符串转为整数索引列表,根据索引得到每个需求三元组的256维的one-hot特征表示,将这256维的需求三元组特征存储为特征矩阵,以备用于之后的计算,然后根据需求三元组之间的关联,创建一个邻接矩阵。
进一步的,所述步骤Step6的具体步骤为:
Step6.1根据Step5中构建的需求三元组的特征矩阵和邻接矩阵,将其输入到一个图卷积神经网络,定义一个两层的图卷积神经网络,其中输入的维度为256维,隐藏层维度设置为16维,最后一层图卷积神经网络将输出的维度变为类别数4,激活函数选择使用的是ReLU函数
Step6.2设置图神经网络的一些超参数,learn_rate学习率为0.04,weight_dacay=5e-4,epochs迭代次数为200次,损失函数使用设置的是交叉熵损失函数,优化器设置的是Adam。
本发明的有益效果是:
本发明在需求图谱的构建方面有很好的表现,该发明首先用自然语言处理的方法从需求文档中提取出需求三元组,然后对提取出的需求三元组进行人工标注,标注出需求三元组代表的意图,之后用one-hot码对需求三元组的本体进行编码,得到256维的特征,将特征保存为特征矩阵,以及根据需求三元组的关系构建邻接矩阵,将特征矩阵和邻接矩阵输入到设置好的图神经网络,得到一个可以识别需求三元组意图的模型,从而对所有需求三元组进行标注,标注后用d3.js的技术,实时构建可视化需求图谱。
附图说明
图1为本发明中的整体流程图;
图2为单个需求文档的需求图谱的可视化;
具体实施方式
实施例1:如图1所示,一种面向科技服务需求的需求图谱构建方法,所述方法的具体步骤为:
Step1、在本专利中,使用是100个非结构化的长本文需求文档。首先我们对这100个非结构化需求文档进行需求三元组的提取,得到这100个需求文档的需求三元组表示,如表1所示。
Step2、对于需求三元组进行人工标注,标注出其意图属性,将数据按照需求三元组id,需求三元组本体,需求三元组意图的格式存储到excel里面,如表2所示。
Step3、利用one-hot编码的方法,将需求三元组本体编码成256维的one-hot特征码,并读取得到一个关于需求三元组的特征矩阵,将其与邻接矩阵一起输入到设置好的图神经网络当中,具体参数如表3所示。
表1单个需求文本提取出的需求三元组
需求文档编号 | 需求三元组 |
01 | ['与xxx公司分部','达成','战略合作'] |
01 | ['预算金额','为','230万人民币'] |
01 | ['时间','为','3个月内'] |
... | ... |
表2进行人工标注后的数据列表
需求id | 需求三元组 | 标注 |
10001 | ['预算金额','为','230万人民币'] | 约束 |
10002 | ['时间','为','3个月内'] | 约束 |
10003 | ['与xxx公司分部','达成','战略合作'] | 目标 |
... | ... | ... |
表3图神经网络超参数设置
学习率learn_rate | 0.004 |
weight_dacay | 5e-4 |
激活函数 | ReLU |
迭代次数 | 200 |
损失函数 | 交叉熵损失函数 |
优化器 | Adam |
Claims (5)
1.一种面向科技服务需求的需求图谱构建方法,其特征在于:具体的操作流程如下所示:
Step1、利用python-doc的包,读取存储在doc文件里面需求文档数据,并保存为字典格式;
Step2、加载哈工大语言技术平台工具Pyltp,读取Pyltp内cws.model等语言模型;
Step3、将Step1中处理好的数据先进行分句处理,将分句处理好的数据切分长句,冒号,分号等做切分标识,利用语义角色标注,获取主谓宾三元组,先根据语义角色标注的结果,抽取三元组。如果语义角色标注为空,则采取依存语法进行抽取;
Step4、将Step3中抽取成功的需求三元组利用python第三方包xlrd进行保存,存储到excel表格里面备用;
Step5、将excel里面的部分需求三元组进行人工标注,从excel里面信息提取需求三元组的特征,构建出需求三元组的特征矩阵与邻接矩阵;
Step6、将Step5中构建的矩阵放入到设计好的图神经网络进行训练,得到一个可以对三元组进行标注的模型;
Step7、利用训练好的模型将需求三元组全部进行标注后,构建成图谱形式并进行可视化展示。
2.根据权利要求1所述的一种面向科技服务需求的需求图谱构建方法,其特征在于:所述步骤Step2的具体步骤为:
Step2.1、加载哈工大语言技术平台工具Pyltp里面ltp.data,读取cws.model、pos.model、parser.model、ner.model、pisrl.model语言模型,以备用来对非结构化需求文本提取需求三元组。
3.根据权利要求1所述的一种面向科技服务需求的需求图谱构建方法,其特征在于:所述步骤Step3的具体步骤为:
Step3.1定义一个parser参数,用来存储Step2的语言模型;
Step3.2定义一个split_sents方法,导入python中的re包,通过re包内置方法,利用正则表达式来匹配字符串,对输入的需求文本进行分句处理,切分冒号,感叹号等并做切分标识;
Step3.3定义一个语义角色标注方法,可以直接获取主语,谓语,宾语三元组;
Step3.4定义一个需求三元组抽取的主函数,根据Step3.3的语义角色标注的结果,进行需求三元组的抽取,如果语义角色的标记为空,则使用依存语法进行需求三元组的抽取。
4.根据权利要求1所述的一种面向科技服务需求的需求图谱构建方法,其特征在于:所述步骤Step5的具体步骤为:
Step5.1对抽取的N个需求三元组(h,r,t)进行人工标注,标注出这N个三元组的意图标签,例如(预期,花费,金额300万人民币),对其标注一个”约束“这个标签,标注完成后将已经标注好的需求三元组用结构化的方式存储在excel表里面,分为三列,第一列表示需求三组的id,第二列表示需求三元组的内容,第三列表示需求三元组的标签;
Step5.2紧接着需要对需求三元组进行特征提取,使用python自带包xlwt读取Step5.1存储在excel里面的内容,存储形式为字典,创建一个常见词为256维的分词器,构建索引单词,将字典中需求三元组的内容字符串转为整数索引列表,根据索引得到每个需求三元组的256维的one-hot特征表示,将这256维的需求三元组特征存储为特征矩阵,以备用于之后的计算,然后根据需求三元组之间的关联,创建一个邻接矩阵。
5.根据权利要求1所述的一种面向科技服务需求的需求图谱构建方法,其特征在于:所述步骤Step6的具体步骤为:
Step6.1根据Step5中构建的需求三元组的特征矩阵和邻接矩阵,将其输入到一个图卷积神经网络,定义一个两层的图卷积神经网络,其中输入的维度为256维,隐藏层维度设置为16维,最后一层图卷积神经网络将输出的维度变为类别数4,激活函数选择使用的是ReLU函数;
Step6.2设置图神经网络的一些超参数,learn_rate学习率为0.04,weight_dacay=5e-4,epochs迭代次数为200次,损失函数使用设置的是交叉熵损失函数,优化器设置的是Adam。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110067662.0A CN112765363B (zh) | 2021-01-19 | 2021-01-19 | 一种面向科技服务需求的需求图谱构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110067662.0A CN112765363B (zh) | 2021-01-19 | 2021-01-19 | 一种面向科技服务需求的需求图谱构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112765363A true CN112765363A (zh) | 2021-05-07 |
CN112765363B CN112765363B (zh) | 2022-11-22 |
Family
ID=75703056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110067662.0A Active CN112765363B (zh) | 2021-01-19 | 2021-01-19 | 一种面向科技服务需求的需求图谱构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112765363B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407645A (zh) * | 2021-05-19 | 2021-09-17 | 福建福清核电有限公司 | 一种基于知识图谱的声像档案智能编研方法 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101414310A (zh) * | 2008-10-17 | 2009-04-22 | 山西大学 | 一种自然语言搜索的方法和装置 |
US20110161070A1 (en) * | 2009-12-31 | 2011-06-30 | International Business Machines Corporation | Pre-highlighting text in a semantic highlighting system |
CN102955848A (zh) * | 2012-10-29 | 2013-03-06 | 北京工商大学 | 一种基于语义的三维模型检索系统和方法 |
CN106156365A (zh) * | 2016-08-03 | 2016-11-23 | 北京智能管家科技有限公司 | 一种知识图谱的生成方法及装置 |
CN106897273A (zh) * | 2017-04-12 | 2017-06-27 | 福州大学 | 一种基于知识图谱的网络安全动态预警方法 |
CN107491555A (zh) * | 2017-09-01 | 2017-12-19 | 北京纽伦智能科技有限公司 | 知识图谱构建方法和系统 |
CN109117479A (zh) * | 2018-08-13 | 2019-01-01 | 数据地平线(广州)科技有限公司 | 一种金融文档智能核查方法、装置及存储介质 |
CN109446341A (zh) * | 2018-10-23 | 2019-03-08 | 国家电网公司 | 知识图谱的构建方法及装置 |
CN109508459A (zh) * | 2018-11-06 | 2019-03-22 | 杭州费尔斯通科技有限公司 | 一种从新闻中提取主题和关键信息的方法 |
CN110019839A (zh) * | 2018-01-03 | 2019-07-16 | 中国科学院计算技术研究所 | 基于神经网络和远程监督的医学知识图谱构建方法和系统 |
CN110263324A (zh) * | 2019-05-16 | 2019-09-20 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
CN110457491A (zh) * | 2019-08-19 | 2019-11-15 | 中国农业大学 | 一种基于游离状态节点的知识图谱重构方法及装置 |
CN110597760A (zh) * | 2019-09-18 | 2019-12-20 | 苏州派维斯信息科技有限公司 | 用于电子文档合规性判别的智能方法 |
CN111198950A (zh) * | 2019-12-24 | 2020-05-26 | 浙江工业大学 | 一种基于语义向量的知识图谱表示学习方法 |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
CN111897914A (zh) * | 2020-07-20 | 2020-11-06 | 杭州叙简科技股份有限公司 | 用于综合管廊领域的实体信息抽取及知识图谱构建方法 |
-
2021
- 2021-01-19 CN CN202110067662.0A patent/CN112765363B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101414310A (zh) * | 2008-10-17 | 2009-04-22 | 山西大学 | 一种自然语言搜索的方法和装置 |
US20110161070A1 (en) * | 2009-12-31 | 2011-06-30 | International Business Machines Corporation | Pre-highlighting text in a semantic highlighting system |
CN102955848A (zh) * | 2012-10-29 | 2013-03-06 | 北京工商大学 | 一种基于语义的三维模型检索系统和方法 |
CN106156365A (zh) * | 2016-08-03 | 2016-11-23 | 北京智能管家科技有限公司 | 一种知识图谱的生成方法及装置 |
CN106897273A (zh) * | 2017-04-12 | 2017-06-27 | 福州大学 | 一种基于知识图谱的网络安全动态预警方法 |
CN107491555A (zh) * | 2017-09-01 | 2017-12-19 | 北京纽伦智能科技有限公司 | 知识图谱构建方法和系统 |
CN110019839A (zh) * | 2018-01-03 | 2019-07-16 | 中国科学院计算技术研究所 | 基于神经网络和远程监督的医学知识图谱构建方法和系统 |
CN109117479A (zh) * | 2018-08-13 | 2019-01-01 | 数据地平线(广州)科技有限公司 | 一种金融文档智能核查方法、装置及存储介质 |
CN109446341A (zh) * | 2018-10-23 | 2019-03-08 | 国家电网公司 | 知识图谱的构建方法及装置 |
CN109508459A (zh) * | 2018-11-06 | 2019-03-22 | 杭州费尔斯通科技有限公司 | 一种从新闻中提取主题和关键信息的方法 |
CN110263324A (zh) * | 2019-05-16 | 2019-09-20 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
CN110457491A (zh) * | 2019-08-19 | 2019-11-15 | 中国农业大学 | 一种基于游离状态节点的知识图谱重构方法及装置 |
CN110597760A (zh) * | 2019-09-18 | 2019-12-20 | 苏州派维斯信息科技有限公司 | 用于电子文档合规性判别的智能方法 |
CN111198950A (zh) * | 2019-12-24 | 2020-05-26 | 浙江工业大学 | 一种基于语义向量的知识图谱表示学习方法 |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
CN111897914A (zh) * | 2020-07-20 | 2020-11-06 | 杭州叙简科技股份有限公司 | 用于综合管廊领域的实体信息抽取及知识图谱构建方法 |
Non-Patent Citations (2)
Title |
---|
J YAN: "Research and Exploration on the Construction Method of Knowledge Graph of Water Field Based on Text", 《2019 2ND INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS AND COMPUTER AIDED EDUCATION》 * |
李兴钦: "一种基于语义标注的个性化搜索技术的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407645A (zh) * | 2021-05-19 | 2021-09-17 | 福建福清核电有限公司 | 一种基于知识图谱的声像档案智能编研方法 |
CN113407645B (zh) * | 2021-05-19 | 2024-06-11 | 福建福清核电有限公司 | 一种基于知识图谱的声像档案智能编研方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112765363B (zh) | 2022-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111858944B (zh) | 一种基于注意力机制的实体方面级情感分析方法 | |
CN109753660B (zh) | 一种基于lstm的中标网页命名实体抽取方法 | |
CN108182295A (zh) | 一种企业知识图谱属性抽取方法及系统 | |
CN112149421A (zh) | 一种基于bert嵌入的软件编程领域实体识别方法 | |
CN113609859A (zh) | 一种基于预训练模型的特种设备中文命名实体识别方法 | |
CN113822026B (zh) | 一种多标签实体标注方法 | |
CN114020768A (zh) | 中文自然语言的sql语句生成模型的构建方法及应用 | |
CN111581376A (zh) | 一种知识图谱自动构建系统及方法 | |
CN110134959B (zh) | 命名实体识别模型训练方法及设备、信息抽取方法及设备 | |
CN112883175B (zh) | 结合预训练模型及模板生成的气象服务交互方法及系统 | |
CN113946677B (zh) | 基于双向循环神经网络和注意力机制的事件识别分类方法 | |
CN112926345A (zh) | 基于数据增强训练的多特征融合神经机器翻译检错方法 | |
CN113468887A (zh) | 基于边界与片段分类的学者信息关系抽取方法和系统 | |
CN116070602A (zh) | 一种pdf文档智能标注与抽取方法 | |
CN115063119A (zh) | 基于招聘行为数据的自适应性的招聘决策系统及方法 | |
CN112765363B (zh) | 一种面向科技服务需求的需求图谱构建方法 | |
CN117194682B (zh) | 构建基于电网相关文件的知识图谱的方法、装置及介质 | |
CN115470871A (zh) | 基于命名实体识别与关系抽取模型的政策匹配方法及系统 | |
CN116186237A (zh) | 一种基于事件因果推断的实体关系的联合抽取方法 | |
JP6757840B2 (ja) | 文抽出システム、文抽出方法、及びプログラム | |
CN115510242A (zh) | 一种中医文本实体关系联合抽取方法 | |
CN116562265A (zh) | 一种信息智能解析方法、系统及存储介质 | |
CN115757325B (zh) | 一种xes日志智能转换方法及系统 | |
CN116028608A (zh) | 问答交互方法、装置、计算机设备及可读存储介质 | |
CN116484852A (zh) | 一种基于关系图注意力网络的中文专利实体关系联合抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |