CN113032527B - 用于问答系统的信息生成方法、装置、终端设备 - Google Patents
用于问答系统的信息生成方法、装置、终端设备 Download PDFInfo
- Publication number
- CN113032527B CN113032527B CN202110320146.4A CN202110320146A CN113032527B CN 113032527 B CN113032527 B CN 113032527B CN 202110320146 A CN202110320146 A CN 202110320146A CN 113032527 B CN113032527 B CN 113032527B
- Authority
- CN
- China
- Prior art keywords
- knowledge graph
- graph
- probability values
- probability
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开的实施例公开了用于问答系统的信息生成方法、装置、终端设备。该方法的一具体实施方式包括:获取第一问题知识图谱和第二问题知识图谱,其中,第一问题知识图谱是用户输入的问题语句的知识图谱,第二问题知识图谱是终端存储的知识图谱;基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合;基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。该方法确定概率信息,生成能够表征第一问题知识图谱和第二问题知识图谱的互信息的结果信息。该结果信息能够更好的衡量第二问题知识图谱与用户提出的第一问题知识图谱的匹配程度,更符合问答系统的应用场景要求。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及信息生成方法、装置、终端设备。
背景技术
问答系统是信息检索系统的一种高级形式。它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。开放式的问答系统在开放的对话环境中,基于知识库,能够根据用户输入的问题语句在知识库中查找与之最为匹配的问题语句,从而通过在知识库中搜索答案,提供答案语句。
然而,当在知识库中搜索和确定匹配问题语句的时候,经常会存在如下技术问题:
第一,由于用户的说话习惯、语序、断句方式的不同,以及同一个地点、建筑、街道或商场的名称有多种称呼方式,在知识库中搜索匹配用户输入的问题语句的准确度较差。
第二,由于用户会采用缩略语、简述、附加语气词、简单词汇堆叠等方式输入问题语句,经常会出现在知识库中搜索问题语句范围出现偏差的现象,影响了搜索的准确度。
第三,基于知识图谱构建的问答系统在进行问题语句匹配时,需要将问题语句的知识图谱进行匹配,知识图谱匹配准确度较差时影响了搜索到问题语句的准确度。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了用于问答系统的信息生成方法、装置、终端设备,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种用于问答系统的信息生成方法,该方法包括:获取第一问题知识图谱和第二问题知识图谱,其中,第一问题知识图谱是用户输入的问题语句的知识图谱,第二问题知识图谱是终端存储的知识图谱;基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合;基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。
第二方面,本公开的一些实施例提供了一种用于问答系统的信息生成装置,该装置包括:接收单元,被配置成获取第一问题知识图谱和第二问题知识图谱,其中,第一问题知识图谱是用户输入的问题语句的知识图谱,第二问题知识图谱是终端存储的知识图谱;生成单元,被配置成基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合;确定单元,被配置成基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。
第三方面,本公开的一些实施例提供了一种终端设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一的方法。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的用于问答系统的信息生成方法能够确定概率信息,生成能够表征第一问题知识图谱和第二问题知识图谱的互信息的结果信息。该结果信息能够更好的衡量第二问题知识图谱与用户提出的第一问题知识图谱的匹配程度,更符合问答系统的应用场景要求。
具体来说,发明人发现,造成目前问答系统中问题语句匹配准确度不高的原因在于:用户的说话习惯、语序、断句方式的不同,以及同一个地点、建筑、街道或商场的名称有多种称呼方式,在知识库中基于知识图谱搜索匹配用户输入的问题语句的准确度较差。基于此,首先,本公开的一些实施例获取第一问题知识图谱和第二问题知识图谱。其中,第一问题知识图谱是用户输入的问题语句的知识图谱,第一问题知识图谱是待匹配的知识图谱。第二问题知识图谱是终端存储的知识图谱,第二问题知识图谱是知识库中存储的知识图谱。其次,基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合。最后,基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。根据相关的概率值信息确定结果信息,结果信息表征第一问题知识图谱和第二问题知识图谱之间的互信息。基于互信息确定结果信息,使得结果信息能够更好的表征第一问题知识图谱和第二问题知识图谱之间的范围一致性,从而更好地表征第二问题知识图谱与第一问题知识图谱的相关性,提升用户在知识库中搜索与第一问题知识图谱匹配的第二问题知识图谱的准确度。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是本公开的一些实施例可以应用于其中的示例性系统的架构图;
图2是根据本公开的用于问答系统的信息生成方法的一些实施例的流程图;
图3是示例性的授权提示框;
图4是根据本公开的用于问答系统的信息生成装置的一些实施例的流程图;
图5是适于用来实现本公开的一些实施例的终端设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的用于问答系统的信息生成方法的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如数据处理应用、信息生成应用、数据分析应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种终端设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的终端设备中。其可以实现成多个软件或软件模块(例如用来提供第一问题知识图谱输入等),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103输入的第一问题知识图谱进行存储的服务器等。服务器可以对接收到的第一问题知识图谱和服务器中存储的第二问题知识图谱进行处理,并将处理结果(例如结果集合)反馈给终端设备。
需要说明的是,本公开实施例所提供的用于问答系统的信息生成方法可以由服务器105,也可以由终端设备执行。
需要指出的是,服务器105的本地也可以直接存储第一问题知识图谱和第二问题知识图谱,服务器105可以直接提取本地的第一问题知识图谱和第二问题知识图谱通过处理后得到结果集合,此时,示例性系统架构100可以不包括终端设备101、102、103和网络104。
还需要指出的是,终端设备101、102、103中也可以安装有用于问答系统的信息生成应用,此时,处理方法也可以由终端设备101、102、103执行。此时,示例性系统架构100也可以不包括服务器105和网络104。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供信息生成服务),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的用于问答系统的信息生成方法的一些实施例的流程200。该用于问答系统的信息生成方法,包括以下步骤:
步骤201,获取第一问题知识图谱和第二问题知识图谱。
在一些实施例中,用于问答系统的信息生成方法的执行主体(例如图1所示的服务器)可以响应于接收到目标授权信号,获取第一问题知识图谱。上述目标授权信号可以是上述第一问题知识图谱对应的用户,对目标控件执行目标操作产生的信号。上述目标控件可以包含于授权提示框中。上述授权提示框可以在目标终端设备显示。上述目标终端设备可以是登录有上述用户对应账号的终端设备。上述终端设备可以是“手机”,也可以是“电脑”。上述目标操作可以是“点击操作”,也可以是“滑动操作”。上述目标控件可以是“确认按钮”。
作为示例,上述授权提示框可以如图3所示。上述授权提示框可以包括:提示信息显示部分301和控件302。其中,上述提示信息显示部分301可以用于显示提示信息。上述提示信息可以是“是否允许获取第一问题知识图谱”。上述控件302可以是“确认按钮”,也可以是“取消按钮”。
可选的,第一问题知识图谱可以是用户输入的问题语句的知识图谱。第二问题知识图谱可以是上述执行主体终端存储的知识图谱。具体的,第二问题知识图谱可以是问答系统知识库中的知识图谱。问答系统知识库中可以存储预先收集的与问答系统相关的问题知识图谱集合和答案知识图谱集合。其中,问题知识图谱集合与答案知识图谱集合是匹配的。对于问题知识图谱集合中的每条问题知识图谱,都可以有与该问题知识图谱对应的答案知识图谱。接收到用户输入的第一问题知识图谱后,可以与知识库中存储的问题知识图谱进行匹配。
具体的,知识图谱是一种表征实体之间关系的语义网络,以结构化的形式描述现实世界的事物及其相互关系,以及将事物及其相互关系存储为结构化知识。在本实施例中,知识图谱的基本结构包括节点和边,其中每个节点代表问题语句的实体,节点的连接边代表实体间的关系。具体的,应用于问答系统的问题知识图谱可以根据预先确定的结构化文本生成问题知识图谱中的节点。节点包括项目节点、属性节点和实体节点。根据预先确定的结构化文本生成问题知识图谱中的边,其中,边表示不同节点之间的关系。确定“节点-边-节点”组成的三元关系组。
步骤202,基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合。
在一些实施例中,上述执行主体基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合。具体的,预先确定的历史数据集包括第一数目个历史数据。历史数据为历史知识图谱和与上述历史图谱对应的概率值组成的数据对。具体的,历史知识图谱可以是上述执行主体中本地存储的问答系统知识库中的问题知识图谱集合。与上述历史图谱对应的概率值是基于历史知识图谱预先统计得到的。具体的,概率是反映随机事件出现的可能性大小。随机事件是指在相同条件下,可能出现也可能不出现的事件。具体的,问答系统中的随机事件是问题语句出现。与上述历史图谱对应的概率值可以是该历史图谱在问答系统的历史库中的问题知识图谱集合中出现的概率的数值。
可选的,上述执行主体在预先确定的历史数据集中查找第一问题知识图谱。从预先确定的历史数据集中选取历史数据,以及执行以下步骤一:
利用下式,确定该历史数据与第一问题知识图谱的第一相似度标识:
其中,A表示该历史数据中的历史知识图谱,B表示第一问题知识图谱,i为计数,i的取值范围为[1,n]。Ai表示历史知识图谱中的第i个节点。Bi表示第一问题知识图谱中的第i个节点,n为第一数目。具体的,n可以是A和B中节点数目较小的节点数目。S表示A和B之间的第一相似度标识。
响应于预先确定的历史数据集中的历史数据全部执行完毕,步骤一结束。生成第一相似度标识集合。
响应于查找到第一问题知识图谱,将第一问题知识图谱在预先确定的历史数据集中对应的概率值集合确定为第一概率值集合。具体的,响应于第一相似度标识集合中存在值为“1”的第一相似度标识,确定查找到第一问题知识图谱。
可选的,在预先确定的历史数据集中查找第二问题知识图谱。从预先确定的历史数据集中选取历史数据,以及执行以下步骤二:
利用下式,确定该历史数据与第二问题知识图谱的第二相似度标识:
其中,C表示该历史数据中的历史知识图谱,D表示第二问题知识图谱,i为计数,i的取值范围为[1,q]。Ci表示历史知识图谱中的第i个节点。Di表示第二问题知识图谱中的第i个节点,q为第二数目。具体的,q可以是C和D中节点数目较小的节点数目。P表示C和D之间的第二相似度标识。
响应于预先确定的历史数据集中的历史数据全部执行完毕,步骤二结束。生成第二相似度标识集合。
响应于查找到第二问题知识图谱,将第二问题知识图谱在预先确定的历史数据集中对应的概率值集合确定为第二概率值集合。具体的,响应于第二相似度标识集合中存在值为“1”的第二相似度标识,确定查找到第二问题知识图谱。
可选的,基于第一概率值集合和第二概率值集合,确定第三概率值集合。具体的,根据第一概率值集合和第二概率值集合在预先确定的历史数据集中进行查找。响应于查找到第一概率值集合和第二概率值集合的联合概率值集合,将联合概率值集合确定为第三概率值集合。具体的,第三概率值可以是第一概率值和第二概率值的联合概率的值。
上述步骤202中的可选内容,即:“确定第一相似度标识集合和第二相似度标识集合的技术内容”作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题三“基于知识图谱构建的问答系统在进行问题语句匹配时,需要将问题语句的知识图谱进行匹配,知识图谱匹配准确度较差时影响了搜索到问题语句的准确度。”。导致知识图谱匹配不准确的因素往往如下:知识图谱是图形化的数据存储结构,根据知识图谱进行匹配的难度较大。如果解决了上述因素,就能达到提高知识图谱匹配水平的效果。为了达到这一效果,本公开引入余弦相似度对知识图谱进行匹配。首先,利用相似度在预先确定的历史数据集中查找第一问题知识图谱。响应于查找到第一问题知识图谱,将历史数据集中对应的概率值集合确定为第一概率值集合。然后,利用余弦相似度在预先确定的历史数据集中查找第二问题知识图谱。响应于查找到第二问题知识图谱,将历史数据集中对应的概率值集合确定为第二概率值集合。最后,利用历史数据集中的联合概率确定第三概率值集合。通过引入余弦相似度,能够直接确定第一问题知识图谱和第二问题知识图谱中的各个节点的匹配程度,提高了知识图谱的匹配准确度,从而解决了技术问题三。
步骤203,基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。
在一些实施例中,用于问答系统的信息生成方法的执行主体基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。
可选的,上述执行主体利用下式,基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息:
其中,p表示概率值集合,x、y分别表示元素。p(x)表示第一概率值集合中元素x对应的第一概率值,p(y)表示第二概率值集合中元素y对应的第二概率值,p(x,y)表示第三概率值集合中元素(x,y)对应的第三概率值。λ为控制参数,λ是任意整数。|·|表示第一范数。表示根据x和y求和,I表示结果信息。可选的,结果信息是第一问题知识图谱和第二问题知识图谱的互信息。具体的,上式中/>确定第一问题知识图谱和第二问题知识图谱之间的概率关系,该值越大,表征第一问题知识图谱和第二问题知识图谱越相关,第二问题知识图谱与第一问题知识图谱匹配的可能性越大。上式中|p(x)-p(y)|表征第一问题知识图谱与第二问题知识图谱中元素本身的概率差异。具体的,引入|p(x)-p(y)|这个对概率差异的惩罚项,使得具有相同节点的第一问题知识图谱和第二问题知识图谱的互信息值越大。第一问题知识图谱和第二问题知识图谱中相同的节点数量多,表征第一问题知识图谱与第二问题知识图谱的问题覆盖范越接近。
上述步骤203中的可选内容,即:“确定第一问题知识图谱与第二问题知识图谱互信息的技术内容”作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题二“由于用户会采用缩略语、简述、附加语气词、简单词汇堆叠等方式输入问题语句,经常会出现在知识库中搜索问题语句范围出现偏差的现象,影响了搜索的准确度。”。导致搜索准确度较差的因素往往如下:问答系统中用户输入的第一问题语句往往存在格式不规范、缺少主语、称呼不准确等问题,直接进行搜索准确度较差。如果解决了上述因素,就能达到提高搜索准确度的效果。为了达到这一效果,本公开引入包含正则化项的互信息。首先,根据第一概率值集合、第二概率值集合和第三概率值集合确定第一问题知识图谱与第二问题知识图谱之间关联程度的互信息值。然后,引入直接第一问题知识图谱与第二问题知识图谱之间相似度的正则化项。将正则化项引入到互信息计算过程中,能够更好的直接比对第一问题知识图谱与第二问题知识图谱之间的相同节点。通过引入正则化项,得到的互信息能够更好地反映出第一问题知识图谱与第二问题知识图谱之间的匹配程度。用于后续问答系统中的问题查找,能够更好地覆盖用户可能的说话内容,符合问答系统应用场景中的匹配优化实质,提高了搜索的准确度,从而解决了技术问题二。
可选的,上述执行主体将问答系统的结果信息发送给目标显示设备,以及控制目标显示设备对问答系统的结果信息进行显示。其中,目标显示设备可以是与上述执行主体通信连接的设备,可以根据接收到的结果信息进行展示。目标显示设备可以是“手机”,也可以是“电脑”。例如,当目标显示设备显示出当前第二问题知识图谱与第一问题知识图谱结果信息时,能够判断第二问题知识图谱与第一问题知识图谱之间的关联程度,从而辅助后续问答系统进行答案的选择与输出。
图2给出的一个实施例具有如下有益效果:获取第一问题知识图谱和第二问题知识图谱,其中,第一问题知识图谱是用户输入的问题语句的知识图谱,第二问题知识图谱是终端存储的知识图谱;基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合;基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。该方法确定概率信息,生成能够表征第一问题知识图谱和第二问题知识图谱的互信息的结果信息。该结果信息能够更好的衡量第二问题知识图谱与用户提出的第一问题知识图谱的匹配程度,更符合问答系统的应用场景要求。
进一步参考图4,作为对上述各图上述方法的实现,本公开提供了一种用于问答系统的信息生成装置的一些实施例,这些装置实施例与图2上述的那些方法实施例相对应,该装置具体可以应用于各种终端设备中。
如图4所示,一些实施例的用于问答系统的信息生成装置400,装置包括:接收单元401、生成单元402、确定单元403。其中,接收单元401,被配置成获取第一问题知识图谱和第二问题知识图谱。其中,第一问题知识图谱是用户输入的问题语句的知识图谱,第二问题知识图谱是终端存储的知识图谱。生成单元402,被配置成基于第一问题知识图谱、第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合。确定单元403,被配置成基于第一概率值集合、第二概率值集合和第三概率值集合,确定结果信息。
可以理解的是,该装置400中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置400及其中包含的单元,在此不再赘述。
下面参考图5,其示出了适于用来实现本公开实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU,Central Processing Unit)501,其可以根据存储在只读存储器(ROM,Read Only Memory)502中的程序或者从存储部分508加载到随机访问存储器(RAM,Random Access Memory)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O,Input/Output)接口505也连接至总线504。
以下部件连接至I/O接口505:包括硬盘等的存储部分506;以及包括诸如LAN(局域网,Local Area Network)卡、调制解调器等的网络接口卡的通信部分507。通信部分507经由诸如因特网的网络执行通信处理。驱动器508也根据需要连接至I/O接口505。可拆卸介质509,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器508上,以便于从其上读出的计算机程序根据需要被安装入存储部分506。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分507从网络上被下载和安装,和/或从可拆卸介质509被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本公开的方法中限定的上述功能。需要说明的是,本公开所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (7)
1.一种用于问答系统的信息生成方法,包括:
获取第一问题知识图谱和第二问题知识图谱,其中,所述第一问题知识图谱是用户输入的问题语句的知识图谱,所述第二问题知识图谱是终端存储的知识图谱;
基于所述第一问题知识图谱、所述第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合;
基于所述第一概率值集合、所述第二概率值集合和所述第三概率值集合,确定结果信息;
其中,所述预先确定的历史数据集包括第一数目个历史数据,所述历史数据为历史知识图谱和与所述历史图谱对应的概率值组成的数据对,与所述历史图谱对应的概率值是该历史图谱在问答系统的历史库中的问题知识图谱集合中出现的概率的数值;
其中,所述基于所述第一问题知识图谱、所述第二问题知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合,包括:
在所述预先确定的历史数据集中查找所述第一问题知识图谱;
响应于查找到所述第一问题知识图谱,将所述第一问题知识图谱在所述预先确定的历史数据集中对应的概率值集合确定为所述第一概率值集合;
在所述预先确定的历史数据集中查找所述第二问题知识图谱;
响应于查找到所述第二问题知识图谱,将所述第二问题知识图谱在所述预先确定的历史数据集中对应的概率值集合确定为所述第二概率值集合;
基于所述第一概率值集合和所述第二概率值集合,确定所述第三概率值集合;
其中,所述基于所述第一概率值集合、所述第二概率值集合和所述第三概率值集合,确定结果信息,包括:
利用下式,基于所述第一概率值集合、所述第二概率值集合和所述第三概率值集合,确定结果信息:
其中,p表示概率值集合,x、y分别表示元素,p(x)表示所述第一概率值集合中元素x对应的第一概率值,p(y)表示所述第二概率值集合中元素y对应的第二概率值,p(x,y)表示所述第三概率值集合中元素(x,y)对应的第三概率值,λ为控制参数,λ是任意整数,||表示第一范数,表示根据x和y求和,I表示所述结果信息。
2.根据权利要求1所述的方法,其中,所述结果信息是所述第一问题知识图谱和所述第二问题知识图谱的互信息。
3.根据权利要求2所述的方法,其中,所述与所述历史图谱对应的概率值是基于历史知识图谱预先统计得到的。
4.根据权利要求3所述的方法,其中,所述在所述预先确定的历史数据集中查找所述第一问题知识图谱,包括:
对于所述预先确定的历史数据集中的每个历史数据,确定所述历史数据与所述第一问题知识图谱的第一相似度标识;
根据所述第一相似度标识,查找所述第一问题知识图谱。
5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:
将所述问答系统的结果信息发送给目标显示设备,以及控制所述目标显示设备对所述问答系统的结果信息进行显示。
6.一种用于问答系统的信息生成装置,包括:
接收单元,被配置成获取第一问题知识图谱和第二问题知识图谱,其中,所述第一问题知识图谱是用户输入的问题语句的知识图谱,所述第二问题知识图谱是终端存储的知识图谱;
生成单元,被配置成基于所述第一问题知识图谱、所述第二问题
知识图谱和预先确定的历史数据集,生成第一概率值集合、第二概率值集合和第三概率值集合;
确定单元,被配置成基于所述第一概率值集合、所述第二概率值集合和所述第三概率值集合,确定结果信息;
其中,所述预先确定的历史数据集包括第一数目个历史数据,所述历史数据为历史知识图谱和与所述历史图谱对应的概率值组成的数据对,与所述历史图谱对应的概率值是该历史图谱在问答系统的历史库中的问题知识图谱集合中出现的概率的数值;
其中,所述生成单元,进一步被配置成:在所述预先确定的历史数据集中查找所述第一问题知识图谱;响应于查找到所述第一问题知识图谱,将所述第一问题知识图谱在所述预先确定的历史数据集中对应的概率值集合确定为所述第一概率值集合;在所述预先确定的历史数据集中查找所述第二问题知识图谱;响应于查找到所述第二问题知识图谱,将所述第二问题知识图谱在所述预先确定的历史数据集中对应的概率值集合确定为所述第二概率值集合;基于所述第一概率值集合和所述第二概率值集合,确定所述第三概率值集合;其中,所述基于所述第一概率值集合、所述第二概率值集合和所述第三概率值集合,确定结果信息,包括:利用下式,基于所述第一概率值集合、所述第二概率值集合和所述第三概率值集合,确定结果信息:其中,p表示概率值集合,x、y分别表示元素,p(x)表示所述第一概率值集合中元素x对应的第一概率值,p(y)表示所述第二概率值集合中元素y对应的第二概率值,p(x,y)表示所述第三概率值集合中元素(x,y)对应的第三概率值,λ为控制参数,λ是任意整数,||表示第一范数,/>表示根据x和y求和,I表示所述结果信息。
7.一种第一终端设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110320146.4A CN113032527B (zh) | 2021-03-25 | 2021-03-25 | 用于问答系统的信息生成方法、装置、终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110320146.4A CN113032527B (zh) | 2021-03-25 | 2021-03-25 | 用于问答系统的信息生成方法、装置、终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113032527A CN113032527A (zh) | 2021-06-25 |
CN113032527B true CN113032527B (zh) | 2023-08-22 |
Family
ID=76473727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110320146.4A Active CN113032527B (zh) | 2021-03-25 | 2021-03-25 | 用于问答系统的信息生成方法、装置、终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113032527B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160103911A (ko) * | 2015-02-24 | 2016-09-02 | 한국과학기술원 | 개념 그래프 매칭을 이용한 질의응답 방법 및 시스템 |
CN109284342A (zh) * | 2018-11-22 | 2019-01-29 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110309316A (zh) * | 2018-06-08 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 一种知识图谱向量的确定方法、装置、终端设备和介质 |
CN110688470A (zh) * | 2019-09-27 | 2020-01-14 | 北京百度网讯科技有限公司 | 用于发送信息的方法和装置 |
CN110825880A (zh) * | 2019-09-18 | 2020-02-21 | 平安科技(深圳)有限公司 | 案件胜率确定方法、装置、设备及计算机可读存储介质 |
CN111090740A (zh) * | 2019-12-05 | 2020-05-01 | 北京轮子科技有限公司 | 一种用于对话系统的知识图谱生成方法 |
CN111274408A (zh) * | 2020-01-16 | 2020-06-12 | 广州拉卡拉信息技术有限公司 | 地址信息验证方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9183282B2 (en) * | 2013-03-15 | 2015-11-10 | Facebook, Inc. | Methods and systems for inferring user attributes in a social networking system |
-
2021
- 2021-03-25 CN CN202110320146.4A patent/CN113032527B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160103911A (ko) * | 2015-02-24 | 2016-09-02 | 한국과학기술원 | 개념 그래프 매칭을 이용한 질의응답 방법 및 시스템 |
CN110309316A (zh) * | 2018-06-08 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 一种知识图谱向量的确定方法、装置、终端设备和介质 |
CN109284342A (zh) * | 2018-11-22 | 2019-01-29 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110825880A (zh) * | 2019-09-18 | 2020-02-21 | 平安科技(深圳)有限公司 | 案件胜率确定方法、装置、设备及计算机可读存储介质 |
CN110688470A (zh) * | 2019-09-27 | 2020-01-14 | 北京百度网讯科技有限公司 | 用于发送信息的方法和装置 |
CN111090740A (zh) * | 2019-12-05 | 2020-05-01 | 北京轮子科技有限公司 | 一种用于对话系统的知识图谱生成方法 |
CN111274408A (zh) * | 2020-01-16 | 2020-06-12 | 广州拉卡拉信息技术有限公司 | 地址信息验证方法及装置 |
Non-Patent Citations (1)
Title |
---|
知识图谱研究综述;黄恒琪;于娟;廖晓;席运江;;计算机系统应用(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113032527A (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102554121B1 (ko) | 텍스트의 엔티티 포커스의 마이닝 방법 및 장치 | |
CN111090756B (zh) | 基于人工智能的多目标推荐模型的训练方法及装置 | |
CN111522927B (zh) | 基于知识图谱的实体查询方法和装置 | |
CN111104599B (zh) | 用于输出信息的方法和装置 | |
CN108228567B (zh) | 用于提取组织机构的简称的方法和装置 | |
CN112650841A (zh) | 信息处理方法、装置和电子设备 | |
CN111340220A (zh) | 用于训练预测模型的方法和装置 | |
CN111368973A (zh) | 用于训练超网络的方法和装置 | |
CN111353601A (zh) | 用于预测模型结构的延时的方法和装置 | |
CN116757224A (zh) | 意图理解方法、装置、设备和介质 | |
US20240161172A1 (en) | Information pushing method and apparatus | |
US20210004406A1 (en) | Method and apparatus for storing media files and for retrieving media files | |
CN113590756A (zh) | 信息序列生成方法、装置、终端设备和计算机可读介质 | |
CN112528040B (zh) | 基于知识图谱的引导教唆语料的检测方法及其相关设备 | |
CN117648422A (zh) | 问答提示系统、问答提示、库构建、模型训练方法和装置 | |
CN113032527B (zh) | 用于问答系统的信息生成方法、装置、终端设备 | |
US20230367972A1 (en) | Method and apparatus for processing model data, electronic device, and computer readable medium | |
CN113360590B (zh) | 兴趣点信息的更新方法、装置、电子设备及存储介质 | |
CN110554892A (zh) | 信息获取方法和装置 | |
CN112148847B (zh) | 一种语音信息的处理方法及装置 | |
CN114880991A (zh) | 知识图谱问答问句实体链接方法、装置、设备及介质 | |
CN112395490B (zh) | 用于生成信息的方法和装置 | |
CN112417260B (zh) | 本地化推荐方法、装置及存储介质 | |
CN115809313A (zh) | 一种文本相似度确定方法及设备 | |
CN110990528A (zh) | 一种问答方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |