CN116719950A - 基于知识图谱子图检索的智能问答方法及系统 - Google Patents
基于知识图谱子图检索的智能问答方法及系统 Download PDFInfo
- Publication number
- CN116719950A CN116719950A CN202310733132.4A CN202310733132A CN116719950A CN 116719950 A CN116719950 A CN 116719950A CN 202310733132 A CN202310733132 A CN 202310733132A CN 116719950 A CN116719950 A CN 116719950A
- Authority
- CN
- China
- Prior art keywords
- keywords
- feedback
- graph
- preset
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000010586 diagram Methods 0.000 claims abstract description 23
- 238000012216 screening Methods 0.000 claims abstract description 15
- 238000013507 mapping Methods 0.000 claims description 28
- 238000012790 confirmation Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 abstract description 3
- 230000010354 integration Effects 0.000 abstract description 2
- 230000015654 memory Effects 0.000 description 15
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据检索技术领域,具体公开了一种基于知识图谱子图检索的智能问答方法及系统,所述方法包括遍历预设的应答库,提取关键词,建立并更新关键词表;在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。本发明基于选取频率将关键词转换为集成度更高的图数据,当需要检索时,借鉴图数据比对过程,即可快速地定位关键词,进而确定应答语句,极大地降低了检索过程的设计复杂性,提高了检索效率。
Description
技术领域
本发明涉及数据检索技术领域,具体是一种基于知识图谱子图检索的智能问答方法及系统。
背景技术
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
知识图谱在智能问答领域中契合度很高,尤其是检索过程,现有技术中关于检索过程的设计,几乎都基于文本识别比对技术,这种方式虽然便捷,但是无法集成式比对,也即,一次比对过程只能比对两个文本,比对效率较低;此外,文本比对过程的规则设定较为复杂,需要人工根据具体情况进行判定;因此,如何借助知识图谱优化现有的文本比对检索过程是本发明技术方案想要解决的技术问题。
发明内容
本发明的目的在于提供一种基于知识图谱子图检索的智能问答方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于知识图谱子图检索的智能问答方法,所述方法包括:
遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;
在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;
实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;
根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
作为本发明进一步的方案:所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:
遍历预设的应答库,读取应答语句;
将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;
根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;
更新目标数据项中的语句数量。
作为本发明进一步的方案:所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:
遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;
根据词串中各关键词对应的语句数量确定映射点尺寸;
连接映射点,得到图数据;
其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
作为本发明进一步的方案:所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:
实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;
接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;
根据所述确认信息实时更新所述反馈模型;
其中,所述反馈模型为训练好的神经网络识别模型。
作为本发明进一步的方案:所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:
读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;
基于图像特征遍历图数据,确定匹配图数据及匹配度;
将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;
基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;
将问句信息和匹配语句输入预设的筛选模型,确定语句对并显示。
作为本发明进一步的方案:所述基于图像特征遍历图数据,确定匹配图数据及匹配度的步骤包括:
根据预设的递增密度对图像特征进行切分,得到待比对单元;所述待比对单元的最小单元为映射点;
根据待比对单元遍历图数据,确定最大匹配度;
当最大匹配度达到预设的数值条件时,确定匹配图数据。
本发明技术方案还提供了一种基于知识图谱子图检索的智能问答系统,所述系统包括:
词表创建模块,用于遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;
图数据生成模块,用于在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;
问句反馈模块,用于实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;
遍历匹配模块,用于根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
作为本发明进一步的方案:所述词表创建模块包括:
应答语句读取单元,用于遍历预设的应答库,读取应答语句;
类型判定单元,用于将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;
目标定位单元,用于根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;
数量更新单元,用于更新目标数据项中的语句数量。
作为本发明进一步的方案:所述图数据生成模块包括:
频率计算单元,用于遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
词串生成单元,用于基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;
尺寸确定单元,用于根据词串中各关键词对应的语句数量确定映射点尺寸;
映射点连接单元,用于连接映射点,得到图数据;
其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
作为本发明进一步的方案:所述问句反馈模块包括:
信息输入单元,用于实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;
确认信息接收单元,用于接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;
模型更新单元,用于根据所述确认信息实时更新所述反馈模型;
其中,所述反馈模型为训练好的神经网络识别模型。
与现有技术相比,本发明的有益效果是:本发明对已有的应答数据进行关键词提取,创建关键词表,根据关键词在应答数据中出现的数量确定选取频率,基于选取频率将关键词转换为集成度更高的图数据,当需要检索时,借鉴图数据比对过程,即可快速地定位关键词,进而确定应答语句,极大地降低了检索过程的设计复杂性,提高了检索效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为基于知识图谱子图检索的智能问答方法的流程框图。
图2为基于知识图谱子图检索的智能问答方法的第一子流程框图。
图3为基于知识图谱子图检索的智能问答方法的第二子流程框图。
图4为基于知识图谱子图检索的智能问答方法的第三子流程框图。
图5为基于知识图谱子图检索的智能问答方法的第四子流程框图。
实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为基于知识图谱子图检索的智能问答方法的流程框图,本发明实施例中,一种基于知识图谱子图检索的智能问答方法,所述方法包括:
步骤S100:遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;
在智能问答系统中,应答语句都预先存储于一个数据库中,该数据库称为应答库,遍历所述应答库中的应答语句,在应答语句中可以提取关键词,统计所有关键词,即可创建关键词表;所述关键词表一般采用现有的词库,所有词汇都有可能成为关键词;随着遍历的应答语句的增多,关键词表也会不断地更新。
步骤S200:在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;
关键词表反映了各个词汇及其在多少个应答语句内出现,由语句数量表示;将各个词汇对应的语句数量比上总数量,即可计算出一个选取频率,通过选取频率在关键词表中选取词汇,可以得到词串,将所述词串可以转换为图数据。
其中,所述选取频率充当选取概率的作用。
步骤S300:实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;
实时获取用户发送的问句信息,借助现有的反馈模型,确定与问句信息对应的反馈关键词,这本身是一种映射关系,借助神经网络模型的相关内容,即可确定反馈关键词;随着问句及对应的反馈关键词的数量越来越多,反馈模型的准度也会越来越高。
步骤S400:根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示;
根据确定的反馈关键词遍历图数据,所述图数据为词汇的集合,根据遍历过程可以快速的确定相关的关键词,由相关的关键词再读取匹配语句即可;这种方式的单次比对过程内容更多,且数据格式单一,与字符串比对过程相比,逻辑性更强;确定的匹配语句的数量可能不唯一,还需要引入筛选过程,所述筛选过程是对问句与匹配语句共同组成的数据对进行筛选。
图2为基于知识图谱子图检索的智能问答方法的第一子流程框图,所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:
步骤S101:遍历预设的应答库,读取应答语句;
步骤S102:将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;
步骤S103:根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;
步骤S104:更新目标数据项中的语句数量。
遍历预设的应答库,读取应答语句;无论是何种语言,都会有语法存在,在现有技术中,有很多基于语法的语句拆分模型,也就是上述内容中的词性分析模型,由词性分析模型即可确定应答语句中各字词的词性,包括名词、动词和形容词等;词性分析完成后,根据词性在重多字词中选取关键词,由选取的关键词可以在预设的关键词表中定位目标数据项,这一过程非常简单,相当于“查字典”;每对一个应答语句进行分析,就可以定位一个或多个关键词,此时,需要对定位到的关键词的语句数量进行调整。
图3为基于知识图谱子图检索的智能问答方法的第二子流程框图,所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:
步骤S201:遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
根据语句数量计算总数量,将语句数量比上总数量,即可得到一个比值,将比值转换为选取频率的过程并不困难。
步骤S202:基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;
在所有关键词中随机选取关键词,选取数量达到一定程度时,得到词串;该程度就是上述内容中的预设数量,该数量可以通过调节端口进行调节。
步骤S203:根据词串中各关键词对应的语句数量确定映射点尺寸;
步骤S204:连接映射点,得到图数据;
将词串转换为图数据,在转换的过程中,根据关键词对应的语句数量可以确定映射点的尺寸。
在本发明技术方案的一个优选实施例中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词;
除了映射点尺寸以外,还可以引入色值,用于区分不同的关键词,比如,某些关键词不适合作为回答,但是可以作为检索过程中的参考,此时,就可以改变其色值,在检索中使用,在显示中规避。
图4为基于知识图谱子图检索的智能问答方法的第三子流程框图,所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:
步骤S301:实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;
步骤S302:接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;
步骤S303:根据所述确认信息实时更新所述反馈模型;
其中,所述反馈模型为训练好的神经网络识别模型。
上述内容对反馈模型的应用过程进行了限定,其中,反馈模型训练好后,接收反馈模型输出的反馈关键词,向人工端发送,接收检测(当反馈模型的准度较高时,这一步骤只是发送,检测无需实时检测),当人工端返回调节信息时,会对反馈模型本身进行更新,更新的方式是通过更新样本库,进而影响模型训练过程。
图5为基于知识图谱子图检索的智能问答方法的第四子流程框图,所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:
步骤S401:读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;
读取反馈模型输出的反馈关键词,将反馈关键词转换为图像特征,为后续的遍历比对过程做准备。
步骤S402:基于图像特征遍历图数据,确定匹配图数据及匹配度;
根据图像特征遍历上述内容中生成的图数据,可以确定较为匹配的图数据及其匹配度。
步骤S403:将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;
对匹配度进行分析,当匹配度足够高时,标记对应的匹配图数据。
步骤S404:基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;
图数据本身就是关键词的集合,由标记的匹配图数据可以查询到对应的关键词,然后再由关键词逆推应答语句;需要说明的是,逆推过程的顺序为,从语句数量最少的关键词开始,查询应答语句,作为匹配语句;这么做的意义在于,语句数量越少,对应关键词的重要性越高。
步骤S405:将问句信息和匹配语句输入预设的筛选模型,确定语句对并显示;
读取问句信息和匹配语句,创建数据对,基于现有的语义识别模型对数据对进行语义识别,可以确定最为合适的数据对,对应的匹配语句就是应答语句。
作为本发明技术方案的一个优选实施例,所述基于图像特征遍历图数据,确定匹配图数据及匹配度的步骤包括:
根据预设的递增密度对图像特征进行切分,得到待比对单元;所述待比对单元的最小单元为映射点;
根据待比对单元遍历图数据,确定最大匹配度;
当最大匹配度达到预设的数值条件时,确定匹配图数据。
上述内容对图像特征和图数据的比对过程进行了具体的限定,对图像特征进行切分,可以得到多个待比对单元,切分密度越高,待比对单元的数量越多,比对过程计算量越大,耗时越长;基于此,先以小的切分密度下的待比对单元执行遍历匹配过程,如果匹配度足够,就停止遍历;如果匹配度不够,就增加切分密度,并循环执行上述内容,直至确定匹配的图数据。
作为本发明技术方案的一个优选实施例,本发明还提供了一种基于知识图谱子图检索的智能问答系统,所述系统包括:
词表创建模块,用于遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;
图数据生成模块,用于在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;
问句反馈模块,用于实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;
遍历匹配模块,用于根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
进一步的,所述词表创建模块包括:
应答语句读取单元,用于遍历预设的应答库,读取应答语句;
类型判定单元,用于将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;
目标定位单元,用于根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;
数量更新单元,用于更新目标数据项中的语句数量。
具体的,所述图数据生成模块包括:
频率计算单元,用于遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
词串生成单元,用于基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;
尺寸确定单元,用于根据词串中各关键词对应的语句数量确定映射点尺寸;
映射点连接单元,用于连接映射点,得到图数据;
其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
除此之外,所述问句反馈模块包括:
信息输入单元,用于实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;
确认信息接收单元,用于接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;
模型更新单元,用于根据所述确认信息实时更新所述反馈模型;
其中,所述反馈模型为训练好的神经网络识别模型。
上述基于知识图谱子图检索的智能问答方法所能实现的功能均由计算机设备完成,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现所述基于知识图谱子图检索的智能问答方法的功能。
处理器从存储器中逐条取出指令、分析指令,然后根据指令要求完成相应操作,产生一系列控制命令,使计算机各部分自动、连续并协调动作,成为一个有机的整体,实现程序的输入、数据的输入以及运算并输出结果,这一过程中产生的算术运算或逻辑运算均由运算器完成;所述存储器包括只读存储器(Read-Only Memory,ROM),所述只读存储器用于存储计算机程序,所述存储器外部设有保护装置。
示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在终端设备中的执行过程。
本领域技术人员可以理解,上述服务设备的描述仅仅是示例,并不构成对终端设备的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,上述处理器是上述终端设备的控制中心,利用各种接口和线路连接整个用户终端的各个部分。
上述存储器可用于存储计算机程序和/或模块,上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如信息采集模板展示功能、产品信息发布功能等)等;存储数据区可存储根据泊位状态显示系统的使用所创建的数据(比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例系统中的全部或部分模块/单元,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个系统实施例的功能。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于知识图谱子图检索的智能问答方法,其特征在于,所述方法包括:
遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;
在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;
实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;
根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
2.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:
遍历预设的应答库,读取应答语句;
将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;
根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;
更新目标数据项中的语句数量。
3.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:
遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;
根据词串中各关键词对应的语句数量确定映射点尺寸;
连接映射点,得到图数据;
其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
4.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:
实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;
接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;
根据所述确认信息实时更新所述反馈模型;
其中,所述反馈模型为训练好的神经网络识别模型。
5.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:
读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;
基于图像特征遍历图数据,确定匹配图数据及匹配度;
将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;
基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;
将问句信息和匹配语句输入预设的筛选模型,确定语句对并显示。
6.根据权利要求5所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述基于图像特征遍历图数据,确定匹配图数据及匹配度的步骤包括:
根据预设的递增密度对图像特征进行切分,得到待比对单元;所述待比对单元的最小单元为映射点;
根据待比对单元遍历图数据,确定最大匹配度;
当最大匹配度达到预设的数值条件时,确定匹配图数据。
7.一种基于知识图谱子图检索的智能问答系统,其特征在于,所述系统包括:
词表创建模块,用于遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;
图数据生成模块,用于在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;
问句反馈模块,用于实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;
遍历匹配模块,用于根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
8.根据权利要求7所述的基于知识图谱子图检索的智能问答系统,其特征在于,所述词表创建模块包括:
应答语句读取单元,用于遍历预设的应答库,读取应答语句;
类型判定单元,用于将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;
目标定位单元,用于根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;
数量更新单元,用于更新目标数据项中的语句数量。
9.根据权利要求7所述的基于知识图谱子图检索的智能问答系统,其特征在于,所述图数据生成模块包括:
频率计算单元,用于遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
词串生成单元,用于基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;
尺寸确定单元,用于根据词串中各关键词对应的语句数量确定映射点尺寸;
映射点连接单元,用于连接映射点,得到图数据;
其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
10.根据权利要求7所述的基于知识图谱子图检索的智能问答系统,其特征在于,所述问句反馈模块包括:
信息输入单元,用于实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;
确认信息接收单元,用于接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;
模型更新单元,用于根据所述确认信息实时更新所述反馈模型;
其中,所述反馈模型为训练好的神经网络识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310733132.4A CN116719950A (zh) | 2023-06-20 | 2023-06-20 | 基于知识图谱子图检索的智能问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310733132.4A CN116719950A (zh) | 2023-06-20 | 2023-06-20 | 基于知识图谱子图检索的智能问答方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116719950A true CN116719950A (zh) | 2023-09-08 |
Family
ID=87869471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310733132.4A Pending CN116719950A (zh) | 2023-06-20 | 2023-06-20 | 基于知识图谱子图检索的智能问答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116719950A (zh) |
-
2023
- 2023-06-20 CN CN202310733132.4A patent/CN116719950A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10262062B2 (en) | Natural language system question classifier, semantic representations, and logical form templates | |
CN112163424B (zh) | 数据的标注方法、装置、设备和介质 | |
CN112380848B (zh) | 文本生成方法、装置、设备及存储介质 | |
CN111782892B (zh) | 基于前缀树的相似字符识别方法、设备、装置和存储介质 | |
CN116303537A (zh) | 数据查询方法及装置、电子设备、存储介质 | |
CN113590811A (zh) | 文本摘要生成方法、装置、电子设备及存储介质 | |
CN117609475A (zh) | 基于大模型的问答回复方法、系统、终端及存储介质 | |
CN115114420A (zh) | 一种知识图谱问答方法、终端设备及存储介质 | |
CN110795942A (zh) | 基于语义识别的关键词确定方法、装置和存储介质 | |
CN116127105B (zh) | 一种大数据平台的数据汇集方法及装置 | |
CN117592470A (zh) | 大语言模型驱动的低成本公报数据抽取方法 | |
CN117520533A (zh) | 一种图表生成方法 | |
CN114842982B (zh) | 一种面向医疗信息系统的知识表达方法、装置及系统 | |
CN111831624A (zh) | 数据表创建方法、装置、计算机设备及存储介质 | |
CN108573025B (zh) | 基于混合模板抽取句子分类特征的方法及装置 | |
CN116049376A (zh) | 一种信创知识检索回复的方法、装置和系统 | |
CN112036183B (zh) | 基于BiLSTM网络模型及CRF模型的分词方法、装置、计算机装置及计算机存储介质 | |
CN111492364A (zh) | 数据标注方法、装置及存储介质 | |
CN116719950A (zh) | 基于知识图谱子图检索的智能问答方法及系统 | |
CN117540004B (zh) | 基于知识图谱和用户行为的工业领域智能问答方法及系统 | |
CN118093795B (zh) | 一种面向aigc交互分析的数据准备方法、系统、设备及介质 | |
CN117648635B (zh) | 敏感信息分类分级方法及系统、电子设备 | |
CN113157887B (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN116049213A (zh) | 表格文档的关键词检索方法及电子设备 | |
CN117951161A (zh) | 一种结构化查询语言生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |