CN106446162A - 一种面向领域的本体知识库文本检索方法 - Google Patents

一种面向领域的本体知识库文本检索方法 Download PDF

Info

Publication number
CN106446162A
CN106446162A CN201610848223.2A CN201610848223A CN106446162A CN 106446162 A CN106446162 A CN 106446162A CN 201610848223 A CN201610848223 A CN 201610848223A CN 106446162 A CN106446162 A CN 106446162A
Authority
CN
China
Prior art keywords
word
dictionary
field
knowledge
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610848223.2A
Other languages
English (en)
Inventor
李莹
林博
黄杨
尹建伟
邓水光
吴健
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201610848223.2A priority Critical patent/CN106446162A/zh
Publication of CN106446162A publication Critical patent/CN106446162A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Abstract

本发明公开了一种面向领域的本体知识库文本检索方法,该方法根据对应领域所涉及的专业术语建立一个领域词库;对领域词库采用中文字典树的结构进行索引;获取用户输入的查询文本,根据领域词库,对查询文本进行分词和过滤,得到查询核心;对查询核心进行关键词转换,得到知识需求;根据知识需求,在本体知识库中检索对应的知识信息。本发明通过为对应领域知识信息建立一个领域词库,根据这个领域词库和一系列算法对用户所描述的文本进行解析,从而得到的用户的知识需求,并在本体知识库中获取相应知识信息,提高了检索质量。

Description

一种面向领域的本体知识库文本检索方法
技术领域
本发明属于信息技术领域,具体涉及一种面向领域的本体知识库文本检索方法。
背景技术
知识库是针对特定领域的问题,将知识片段相互联系并求解问题的相对独立的程序实体。在此之上,本体知识库利用本体的特点来描述知识之间的内在联系,解决了信息共享时的语义问题,使得计算机可以理解和利用知识,来提供语义级别的知识服务。
虽然本体知识库能很好的表示知识,但如何理解用户的需求并提供相应的知识服务却是一个问题。现有的技术通常根据用户输入的关键字,在知识库中匹配相关内容并返回,这种情况往往要求用户对自身需求进行明确分析并抽象出相应的关键字,而无法直接针对描述用户需求的文本进行直接检索,因此检索质量较差。
发明内容
鉴于上述,本发明提供了一种面向领域的本体知识库文本检索方法,用以解决现有技术中直接对文本检索质量较差的问题。
一种面向领域的本体知识库文本检索方法,包括如下步骤:
(1)对于任一领域,根据该领域的本体知识库以及该领域所涉及的专业术语建立领域词库;
(2)采用中文字典树对所述领域词库进行索引;
(3)获取用户输入的查询文本,根据领域词库对查询文本进行分词和过滤,得到查询核心;
(4)对查询核心中的模糊词进行替换,进而在所述本体知识库中检索出与知识需求中各词语对应的知识信息,并展现提供给用户。
所述步骤(1)中建立领域词库的过程如下:
1.1对该领域本体知识库中包含的所有知识信息进行词汇抽取,得到该领域的知识词库;
1.2采集该领域所涉及的专业术语,得到该领域的术语词库;
1.3获取已开源的至少一个公共词库;
1.4集成所述的知识词库、术语词库和公共词库并去除重复部分,得到所述的领域词库。
所述步骤(2)中对领域词库进行索引,即先要建立中文字典树,进而通过中文字典树的索引结构映射至领域词库的物理存储地址。
建立中文字典树即采用传统字典树的构建方式,区别在于:需预先设定一个存储阈值,在创建节点时对应建立容量为所述存储阈值的索引数组;当节点的链接数大于存储阈值时,则将所述索引数组替换为关联数组,并复制索引数组中的内容至所述关联数组中。
所述索引数组中内容的查找采用折半查找法,所述关联数组中内容的查找采用映射法。
所述步骤(3)中对查询文本进行分词和过滤,具体过程如下:
3.1初始查找起始位置和查找终止位置均为查询文本的第一个字;
3.2执行一次扩展查找:移动所述查找终止位置至当前位置的下一个字,将查找起始位置至查找终止位置之间的词语与中文字典树进行配对,若配对成功则将该词语加入至分词备选集,并再次执行扩展查找;若配对失败则执行步骤3.3;
3.3移动所述查找起始位置至当前位置的下一个字,重置所述查找终止位置为当前的查找起始位置,并返回执行步骤3.2,直至查找起始位置移动到查询文本的最后一个字;
3.4根据在知识词库中的出现频次、词长以及词长与分词备选集平均词长的差值大小,对分词备选集中的所有词语进行三级过滤,得到所述查询核心。
所述步骤3.4的具体实现方法为:根据以下公式计算分词备选集中每个词语的综合指标Q,取综合指标Q最高的若干词语组成所述查询核心;
Q=α1F+α2D-α3ΔD
其中,对于分词备选集中的任一词语,F为该词语在知识词库中的出现频次,D为该词语的词长,ΔD为该词语词长与分词备选集平均词长的差值大小,α1~α3均为预设的权重系数。
所述步骤(4)中对查询核心中的模糊词进行替换的具体方法为:对于查询核心中的任一模糊词,计算该模糊词与知识词库中每个词的匹配度,使知识词库中与该模糊词匹配度最高的词替换掉该模糊词;所述的模糊词为属于查询核心中的词语但不属于知识词库中的词。
所述匹配度的计算公式如下:
其中:c表示知识词库中的任一个词,k表示查询核心中的任一模糊词,Match(c,k)为c与k的匹配度,ComLen(c,k)为c与k的最长公共连续子串所包含的字符个数,Len(c)为c包含的字符个数,Len(k)为k包含的字符个数。
本发明文本检索方法通过为对应领域知识信息建立一个领域词库,根据这个领域词库和一系列算法对用户所描述的文本进行解析,从而得到的用户的知识需求,并在本体知识库中获取相应知识信息,提高了检索质量。
附图说明
图1为本发明文本检索方法的步骤流程示意图。
图2为本发明文本检索方法中的领域词库的构建流程示意图。
图3为本发明文本检索方法实现装置的结构示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
本发明本体知识库文本检索方法的主要流程涉及用户与系统之间的交互,其中系统部分主要提供对应领域的本体知识库和文本检索方法,并向外部提供访问入口,用户可以通过任意能访问系统的设备进行连接并检索。如图1所示,该文本检索方法的具体流程包括:
(1)输入查询内容,用户通过设备连接系统并输入描述知识需求的文本后向系统提交检索请求。
(2)文本分词,在领域词库所映射的字典树中,对查询文本的所有子串逐个匹配,得到分词备选集,其中包括完全匹配结果与部分匹配结果,完全匹配结果中的每个词都能映射到领域词库中的某个词,部分匹配结果中的每个词都能映射到领域词库中某个词的子串。
(3)分词结果过滤,根据在本体知识库中出现的频次,词自身路径跨度大小和词长与平均词长的差值大小,对分词备选集中的所有词进行三级过滤,得到查询核心。
(4)关键词转换,把模糊词与本体知识库中的每个词两两计算匹配度,选取匹配度最高的词替换模糊词,模糊词为在查询核心中出现但是没有在本体知识库中出现的词,把处理后的查询核心包含的所有词作为知识需求,知识需求中的每个词都能映射到对应领域的本体知识库中的一个本体、实例或属性。
(5)信息查询,根据知识需求,在本体知识库中检索对应的知识信息。
(6)展示结果,向用户返回检索出的相关知识信息,并询问用户是否需要继续查询,如果需要继续查询则重复上述步骤,否则完成所有检索步骤并断开连接。
在用户访问系统之前,系统管理员应当启动系统,让系统载入已构建的领域词库并建立一个中文字典树对领域词库进行索引。
图2为领域词库建立流程,该流程主要涉及系统管理员对领域词库的建立以或更新,具体包括:
1.载入开源词库,如果系统管理员选择创建领域词库,系统首先会载入预收集的开源词库。
2.提取知识库关键字,如果当前系统不存在知识词库,系统会首先访问本体知识库并把其中的本体、实例和属性的关键词提取出来,并生成知识词库。
3.载入知识词库,系统载入已生成的知识词库。
4.载入术语词库,系统载入预收集的对应领域的专业术语词库。
5.生成领域词库,系统集成开源词库、知识词库和术语词库,过滤重复单词后形成领域词库。
6.更新本体知识库,如果系统管理员选择更新词库,系统首先根据新提供的本体知识库替换已有的本体知识库,然后再次执行提取知识库关键字以及后续步骤。
结合图1和图2的详细流程,本实施例提供了面向高血压诊断预防领域本体知识库文本检索方法的实现装置,通过为高血压诊断预防领域知识信息建立一个领域词库,根据这个领域词库和一系列算法对用户所描述的文本进行解析,从而得到的用户的知识需求,并在本体知识库中获取相应知识信息,提高了检索质量。该领域本体知识库包括:血压分级概念中的本体对血压概念中的多个本体的关联关系、危险因素概念中的本体对个人状态概念中的多个本体的关联关系、干预措施概念中的本体对膳食推荐概念或生活习惯概念中的多个本体的关联关系。如图3所示,该实现装置具体包括:本体构建模块、概念关联模块、词库模块、获取模块、分词模块、查询模块,其中:
本体构建模块用于创建对应领域中的基本概念、基本属性和实例,对应领域中的基本概念包括多个本体,基本属性包括对象属性和数据属性。
概念关联模块用于根据基本属性,构建本体之间和本体与实例之间的关联关系。
词库模块用于根据对应领域所涉及的专业术语建立一个领域词库;具体的,对本体知识库中包含的所有知识信息进行抽取,得到对应领域的知识词库;采集对应领域所涉及的专业术语,得到对应领域的术语词库;采集已开源的公共词库,公共词库的数量至少为一个;集成知识词库、术语词库和公共词库并去除重复部分,得到领域词库。
索引模块用于对领域词库采用中文字典树的结构进行索引;具体的,通过中文字典树的索引结构映射到领域词库的物理存储地址,加快检索过程;为中文字典树设定一个节点存储阈值,中文字典树在创建节点时建立一个容量为节点存储阈值的索引数组,当节点的链接数大于节点存储阈值时,索引数组被替换为关联数组,并复制索引数组的内容到关联数组中,剩余构建过程采用传统字典树的构建方式,索引数组中元素的查找采用折半查找法,关联数组中元素的查找采用映射法。
获取模块用于获取用户输入的查询文本,查询文本包括关键词、语句和任意形式的文本。
分词模块用于根据领域词库,对查询文本进行分词和过滤,得到查询核心;具体的,建立查找起始位置和查找终止位置,查找起始位置和查找终止位置的初始值均为查询文本的第一个字;执行一次扩展查找,每次扩展查找为移动查找终止位置至当前位置的下一个字,将查找起始位置到查找终止位置之间的语句与中文字典树配对,把配对成功的语句加入分词备选集,重复这一过程直至配对第一次失败;移动查找起始位置至当前位置的下一个字,重置查找终止位置为当前查找起始位置,执行一次扩展查找,重复这一过程直至查找起始位置移动到查询文本的最后一个字;分词备选集包含完全匹配结果与部分匹配结果,完全匹配结果中的每个词都能映射到领域词库中的某个词,部分匹配结果中的每个词都能映射到领域词库中某个词的子串;根据在知识词库中出现的频次,词自身路径跨度大小和词长与平均词长的差值大小,对分词备选集中的所有词进行三级过滤,得到查询核心。
转换模块用于根据本体知识库,对查询核心进行关键词转换,得到知识需求;具体的,关键词转换是把模糊词与知识词库中的每个词两两计算匹配度,选取匹配度最高的词替换模糊词,模糊词为在查询核心中出现但是没有在知识词库中出现的词;匹配度的计算公式为其中c为知识词库中的某个词,k为模糊词,ComLen(c,k)为c和k的最长公共子串所包含字符的个数,Len(c)为c包含字符的个数,Len(k)为k包含字符的个数,Max函数的输出为两个实数的较大者;把处理后的查询核心包含的所有词添加到知识需求,知识需求中的每个词都能映射到对应领域的本体知识库中的一个本体、实例或属性。
查询模块用于根据知识需求,在本体知识库中检索对应的知识信息。
在上述模块中,本体构建模块和概念关联模块可以组成一个独立的子模块,其作用为生成一个对应领域的本体知识库,作为后续模块的输入;该子模块为所提供的装置中不可缺少的一部分,但后续模块的输入也可以用已有的本体知识库替换。
上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (9)

1.一种面向领域的本体知识库文本检索方法,包括如下步骤:
(1)对于任一领域,根据该领域的本体知识库以及该领域所涉及的专业术语建立领域词库;
(2)采用中文字典树对所述领域词库进行索引;
(3)获取用户输入的查询文本,根据领域词库对查询文本进行分词和过滤,得到查询核心;
(4)对查询核心中的模糊词进行替换,进而在所述本体知识库中检索出与知识需求中各词语对应的知识信息,并展现提供给用户。
2.根据权利要求1所述的本体知识库文本检索方法,其特征在于:所述步骤(1)中建立领域词库的过程如下:
1.1对该领域本体知识库中包含的所有知识信息进行词汇抽取,得到该领域的知识词库;
1.2采集该领域所涉及的专业术语,得到该领域的术语词库;
1.3获取已开源的至少一个公共词库;
1.4集成所述的知识词库、术语词库和公共词库并去除重复部分,得到所述的领域词库。
3.根据权利要求1所述的本体知识库文本检索方法,其特征在于:所述步骤(2)中对领域词库进行索引,即先要建立中文字典树,进而通过中文字典树的索引结构映射至领域词库的物理存储地址。
4.根据权利要求3所述的本体知识库文本检索方法,其特征在于:建立中文字典树即采用传统字典树的构建方式,区别在于:需预先设定一个存储阈值,在创建节点时对应建立容量为所述存储阈值的索引数组;当节点的链接数大于存储阈值时,则将所述索引数组替换为关联数组,并复制索引数组中的内容至所述关联数组中。
5.根据权利要求4所述的本体知识库文本检索方法,其特征在于:所述索引数组中内容的查找采用折半查找法,所述关联数组中内容的查找采用映射法。
6.根据权利要求2所述的本体知识库文本检索方法,其特征在于:所述步骤(3)中对查询文本进行分词和过滤,具体过程如下:
3.1初始查找起始位置和查找终止位置均为查询文本的第一个字;
3.2执行一次扩展查找:移动所述查找终止位置至当前位置的下一个字,将查找起始位置至查找终止位置之间的词语与中文字典树进行配对,若配对成功则将该词语加入至分词备选集,并再次执行扩展查找;若配对失败则执行步骤3.3;
3.3移动所述查找起始位置至当前位置的下一个字,重置所述查找终止位置为当前的查找起始位置,并返回执行步骤3.2,直至查找起始位置移动到查询文本的最后一个字;
3.4根据在知识词库中的出现频次、词长以及词长与分词备选集平均词长的差值大小,对分词备选集中的所有词语进行三级过滤,得到所述查询核心。
7.根据权利要求6所述的本体知识库文本检索方法,其特征在于:所述步骤3.4的具体实现方法为:根据以下公式计算分词备选集中每个词语的综合指标Q,取综合指标Q最高的若干词语组成所述查询核心;
Q=α1F+α2D-α3ΔD
其中,对于分词备选集中的任一词语,F为该词语在知识词库中的出现频次,D为该词语的词长,ΔD为该词语词长与分词备选集平均词长的差值大小,α1~α3均为预设的权重系数。
8.根据权利要求2所述的本体知识库文本检索方法,其特征在于:所述步骤(4)中对查询核心中的模糊词进行替换的具体方法为:对于查询核心中的任一模糊词,计算该模糊词与知识词库中每个词的匹配度,使知识词库中与该模糊词匹配度最高的词替换掉该模糊词;所述的模糊词为属于查询核心中的词语但不属于知识词库中的词。
9.根据权利要求8所述的本体知识库文本检索方法,其特征在于:所述匹配度的计算公式如下:
M a t c h ( c , k ) = C o m L e n ( c , k ) M a x ( L e n ( c ) , L e n ( k ) )
其中:c表示知识词库中的任一个词,k表示查询核心中的任一模糊词,Match(c,k)为c与k的匹配度,ComLen(c,k)为c与k的最长公共连续子串所包含的字符个数,Len(c)为c包含的字符个数,Len(k)为k包含的字符个数。
CN201610848223.2A 2016-09-26 2016-09-26 一种面向领域的本体知识库文本检索方法 Pending CN106446162A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610848223.2A CN106446162A (zh) 2016-09-26 2016-09-26 一种面向领域的本体知识库文本检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610848223.2A CN106446162A (zh) 2016-09-26 2016-09-26 一种面向领域的本体知识库文本检索方法

Publications (1)

Publication Number Publication Date
CN106446162A true CN106446162A (zh) 2017-02-22

Family

ID=58167354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610848223.2A Pending CN106446162A (zh) 2016-09-26 2016-09-26 一种面向领域的本体知识库文本检索方法

Country Status (1)

Country Link
CN (1) CN106446162A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330111A (zh) * 2017-07-07 2017-11-07 长沙沃本智能科技有限公司 基于通用形式化本体的领域本体的检索方法及装置
CN109670163A (zh) * 2017-10-17 2019-04-23 阿里巴巴集团控股有限公司 信息识别方法、信息推荐方法、模板构建方法及计算设备
CN109933774A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 语义识别方法、装置存储介质和电子装置
CN110134851A (zh) * 2019-05-05 2019-08-16 北京科技大学 一种基于领域内网的搜索引擎系统及构建方法
CN110245350A (zh) * 2019-05-29 2019-09-17 阿里巴巴集团控股有限公司 文案改写与更新方法、装置及设备
CN110378704A (zh) * 2019-07-23 2019-10-25 珠海格力电器股份有限公司 基于模糊识别的意见反馈的方法、存储介质和终端设备
CN110472026A (zh) * 2019-07-15 2019-11-19 中国平安人寿保险股份有限公司 文本信息处理方法及系统、可读存储介质及终端设备
CN110795476A (zh) * 2019-10-16 2020-02-14 北京百分点信息科技有限公司 一种本体库的数据写入方法及装置
CN112800316A (zh) * 2021-02-04 2021-05-14 北京易车互联信息技术有限公司 一种基于双数组字典树的搜索关键词提取系统
CN113378564A (zh) * 2021-04-30 2021-09-10 上海适享文化传播有限公司 垂直领域细分场景结合知识图谱的分词方法
CN113590736A (zh) * 2021-08-12 2021-11-02 成都数之联科技有限公司 索引管理方法、装置、电子设备和可读存储介质
CN114417387A (zh) * 2022-01-24 2022-04-29 中国电子科技集团公司第五十四研究所 基于语义内涵的消息加密方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049532A (zh) * 2012-12-21 2013-04-17 东莞中国科学院云计算产业技术创新与育成中心 基于突发事件应急管理的知识库引擎构建及其查询方法
CN104376110A (zh) * 2014-11-27 2015-02-25 武汉理工数字传播工程有限公司 一种基于本体推理的中文知识推理方法
CN105320715A (zh) * 2014-10-22 2016-02-10 武汉理工大学 基于本体的语义查询方法
CN105677822A (zh) * 2016-01-05 2016-06-15 首都师范大学 一种基于对话机器人的招生自动问答方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049532A (zh) * 2012-12-21 2013-04-17 东莞中国科学院云计算产业技术创新与育成中心 基于突发事件应急管理的知识库引擎构建及其查询方法
CN105320715A (zh) * 2014-10-22 2016-02-10 武汉理工大学 基于本体的语义查询方法
CN104376110A (zh) * 2014-11-27 2015-02-25 武汉理工数字传播工程有限公司 一种基于本体推理的中文知识推理方法
CN105677822A (zh) * 2016-01-05 2016-06-15 首都师范大学 一种基于对话机器人的招生自动问答方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄杨: "JTChroBase:基于本体的慢病管理知识库系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330111A (zh) * 2017-07-07 2017-11-07 长沙沃本智能科技有限公司 基于通用形式化本体的领域本体的检索方法及装置
CN109670163A (zh) * 2017-10-17 2019-04-23 阿里巴巴集团控股有限公司 信息识别方法、信息推荐方法、模板构建方法及计算设备
CN109670163B (zh) * 2017-10-17 2023-03-28 阿里巴巴集团控股有限公司 信息识别方法、信息推荐方法、模板构建方法及计算设备
CN109933774A (zh) * 2017-12-15 2019-06-25 腾讯科技(深圳)有限公司 语义识别方法、装置存储介质和电子装置
CN110134851A (zh) * 2019-05-05 2019-08-16 北京科技大学 一种基于领域内网的搜索引擎系统及构建方法
CN110134851B (zh) * 2019-05-05 2021-10-15 北京科技大学 一种基于领域内网的搜索引擎系统及构建方法
CN110245350B (zh) * 2019-05-29 2023-04-07 创新先进技术有限公司 文案改写与更新方法、装置及设备
CN110245350A (zh) * 2019-05-29 2019-09-17 阿里巴巴集团控股有限公司 文案改写与更新方法、装置及设备
CN110472026A (zh) * 2019-07-15 2019-11-19 中国平安人寿保险股份有限公司 文本信息处理方法及系统、可读存储介质及终端设备
CN110378704A (zh) * 2019-07-23 2019-10-25 珠海格力电器股份有限公司 基于模糊识别的意见反馈的方法、存储介质和终端设备
CN110378704B (zh) * 2019-07-23 2021-10-22 珠海格力电器股份有限公司 基于模糊识别的意见反馈的方法、存储介质和终端设备
CN110795476A (zh) * 2019-10-16 2020-02-14 北京百分点信息科技有限公司 一种本体库的数据写入方法及装置
CN110795476B (zh) * 2019-10-16 2022-03-08 北京百分点科技集团股份有限公司 一种本体库的数据写入方法及装置
CN112800316A (zh) * 2021-02-04 2021-05-14 北京易车互联信息技术有限公司 一种基于双数组字典树的搜索关键词提取系统
CN113378564A (zh) * 2021-04-30 2021-09-10 上海适享文化传播有限公司 垂直领域细分场景结合知识图谱的分词方法
CN113590736A (zh) * 2021-08-12 2021-11-02 成都数之联科技有限公司 索引管理方法、装置、电子设备和可读存储介质
CN113590736B (zh) * 2021-08-12 2024-05-07 成都数之联科技股份有限公司 索引管理方法、装置、电子设备和可读存储介质
CN114417387A (zh) * 2022-01-24 2022-04-29 中国电子科技集团公司第五十四研究所 基于语义内涵的消息加密方法
CN114417387B (zh) * 2022-01-24 2023-09-22 中国电子科技集团公司第五十四研究所 基于语义内涵的消息加密方法

Similar Documents

Publication Publication Date Title
CN106446162A (zh) 一种面向领域的本体知识库文本检索方法
CN110837550B (zh) 基于知识图谱的问答方法、装置、电子设备及存储介质
WO2021139074A1 (zh) 基于知识图谱的案件检索方法、装置、设备及存储介质
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
CN109408627B (zh) 一种融合卷积神经网络和循环神经网络的问答方法及系统
CN108345690B (zh) 智能问答方法与系统
CN111353030B (zh) 基于旅游领域知识图谱的知识问答检索方法及装置
US10289717B2 (en) Semantic search apparatus and method using mobile terminal
CN106844658B (zh) 一种中文文本知识图谱自动构建方法及系统
CN104915340B (zh) 自然语言问答方法及装置
CN104239513B (zh) 一种面向领域数据的语义检索方法
CN110188168A (zh) 语义关系识别方法和装置
CN110362660A (zh) 一种基于知识图谱的电子产品质量自动检测方法
US20210018332A1 (en) Poi name matching method, apparatus, device and storage medium
CN112650840A (zh) 一种基于知识图谱推理的医疗智能问答处理方法及系统
CN110222045A (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
Alexander et al. Natural language web interface for database (NLWIDB)
CN111414763A (zh) 一种针对手语计算的语义消歧方法、装置、设备及存储装置
CN112559684A (zh) 一种关键词提取及信息检索方法
CN110929498B (zh) 一种短文本相似度的计算方法及装置、可读存储介质
CN103646112A (zh) 利用了网络搜索的依存句法的领域自适应方法
CN108073576A (zh) 智能搜索方法、搜索装置以及搜索引擎系统
CN111061828B (zh) 一种数字图书馆知识检索方法及装置
CN110377751A (zh) 课件智能生成方法、装置、计算机设备及存储介质
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222