CN107844531B - 答案输出方法、装置和计算机设备 - Google Patents
答案输出方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN107844531B CN107844531B CN201710963928.3A CN201710963928A CN107844531B CN 107844531 B CN107844531 B CN 107844531B CN 201710963928 A CN201710963928 A CN 201710963928A CN 107844531 B CN107844531 B CN 107844531B
- Authority
- CN
- China
- Prior art keywords
- candidate answers
- implicit
- candidate
- scoring
- explicit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种答案输出方法、装置和计算机设备,上述答案输出方法包括:接收用户输入的问题;根据所述问题进行检索,获得问题的证据资料;根据所述证据资料的显式特征,从所述证据资料中抽取所述问题的候选答案,并对所述候选答案进行评分,获得所述候选答案的显式特征评分;提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分;利用所述候选答案的隐式特征评分对所述候选答案的显式特征评分进行矫正;输出按照矫正后的评分进行排序的候选答案。本申请可以实现在问答系统中,对进行显式特征评分后的候选答案进一步基于隐式特征进行评分,提高了问答系统输出的答案的正确率,提高了用户体验。
Description
技术领域
本申请涉及技术领域,尤其涉及一种答案输出方法、装置和计算机设备。
背景技术
问答系统(Question Answering System;以下简称:QAS)的主要目标是帮助用户快速、准确地获取用户需要的问题答案,其输入是用户的自然语言问题,输出是预期的正确答案。与传统的搜索引擎相比,问答系统对答案进行了智能筛选,期望只给用户返回正确的答案,是信息检索方式的高级实现形式。
在问答系统中,候选答案的提取是整个问答系统的核心部分,问答系统的检索效率和候选答案的正确率跟候选答案的提取方法紧密相关。现有的答案提取方法包括了基于机器学习的方法、基于模式匹配、基于热词分析、基于词频词距分析和基于分本对齐的方法,这些方法都是基于答案证据中的词的显式分析,忽略了答案证据中的一些隐含特征,从而使答案选择的正确率较低,用户体验度不高。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种答案输出方法,以实现在问答系统中,对进行显式特征评分后的候选答案进一步基于隐式特征进行评分,提高了问答系统输出的答案的正确率,提高了用户体验。
本申请的第二个目的在于提出一种答案输出装置。
本申请的第三个目的在于提出一种计算机设备。
本申请的第四个目的在于提出一种非临时性计算机可读存储介质。
本申请的第五个目的在于提出一种计算机程序产品。
为达上述目的,本申请第一方面实施例提出了一种答案输出方法,包括:接收用户输入的问题;根据所述问题进行检索,获得所述问题的证据资料;根据所述证据资料的显式特征,从所述证据资料中抽取所述问题的候选答案,并对所述候选答案进行评分,获得所述候选答案的显式特征评分;提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分;利用所述候选答案的隐式特征评分对所述候选答案的显式特征评分进行矫正,输出按照矫正后的评分进行排序的候选答案。
本申请实施例的答案输出方法中,接收用户输入的问题之后,根据上述问题进行检索,获得上述问题的证据资料,根据上述证据资料的显式特征,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分,再提取上述候选答案的隐式特征,根据上述隐式特征对所述候选答案进行评分,获得上述候选答案的隐式特征评分,最后利用上述候选答案的隐式特征评分对上述候选答案的显式特征评分进行矫正,输出按照矫正后的评分进行排序的候选答案,从而可以实现在问答系统中,对进行显式特征评分后的候选答案进一步基于隐式特征进行评分,提高了问答系统输出的答案的正确率,提高了用户体验。
为达上述目的,本申请第二方面实施例提出了一种答案输出装置,包括:接收模块,用于接收用户输入的问题;检索模块,用于根据所述接收模块接收的问题进行检索,获得所述问题的证据资料;显式评分模块,用于根据所述检索模块获得的证据资料的显式特征,从所述证据资料中抽取所述问题的候选答案,并对所述候选答案进行评分,获得所述候选答案的显式特征评分;隐式评分模块,用于提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分;矫正模块,用于利用所述隐式评分模块获得的所述候选答案的隐式特征评分对所述显式评分模块获得的所述候选答案的显式特征评分进行矫正;输出模块,用于输出按照所述矫正模块矫正后的评分进行排序的候选答案。
本申请实施例的答案输出装置中,接收模块接收用户输入的问题之后,检索模块根据上述问题进行检索,获得上述问题的证据资料,显式评分模块根据上述证据资料的显式特征,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分,隐式评分模块再提取上述候选答案的隐式特征,根据上述隐式特征对所述候选答案进行评分,获得上述候选答案的隐式特征评分,最后矫正模块利用上述候选答案的隐式特征评分对上述候选答案的显式特征评分进行矫正,输出模块输出按照矫正后的评分进行排序的候选答案,从而可以实现在问答系统中,对进行显式特征评分后的候选答案进一步基于隐式特征进行评分,提高了问答系统输出的答案的正确率,提高了用户体验。
为达上述目的,本申请第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的方法。
为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
为了实现上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如上所述的方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请答案输出方法一个实施例的流程图;
图2为本申请答案输出方法另一个实施例的流程图;
图3为本申请答案输出装置一个实施例的结构示意图;
图4为本申请计算机设备一个实施例的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
图1为本申请答案输出方法一个实施例的流程图,如图1所示,上述答案输出方法可以包括:
步骤101,接收用户输入的问题。
其中,上述问题可以是用户输入的自然语言问题,本实施例中,用户可以通过语音、文本或图片的方式输入上述问题,本实施例对用户输入问题的方式不作限定。
步骤102,根据上述问题进行检索,获得上述问题的证据资料。
具体地,可以先对上述问题进行分词、词性标注和/或句法分析,然后问答系统通过外部接口,如搜索引擎或知识库,根据上述问题进行检索从而获取上述问题的相关证据资料。
步骤103,根据上述证据资料的显式特征,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分。
具体地,可以先对上述证据资料进行分词,根据问题和上述证据资料分词后获得的词的词性和显示特征(即上述证据资料分词后获得的词本身),通过对上述问题与上述证据资料分词后获得的词进行以下处理之一或组合:热词计算、模式匹配词频计算、词距计算、文本对齐和机器学习方法,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分。
步骤104,提取上述候选答案的隐式特征,根据上述隐式特征对上述候选答案进行评分,获得上述候选答案的隐式特征评分。
步骤105,利用上述候选答案的隐式特征评分对上述候选答案的显式特征评分进行矫正。
步骤106,输出按照矫正后的评分进行排序的候选答案。
具体地,可以按照矫正后的评分由高到低的顺序对上述候选答案进行排序,这样排在第一位的候选答案即为上述问题最可能的正确答案。
上述答案输出方法中,接收用户输入的问题之后,根据上述问题进行检索,获得上述问题的证据资料,根据上述证据资料的显式特征,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分,再提取上述候选答案的隐式特征,根据上述隐式特征对所述候选答案进行评分,获得上述候选答案的隐式特征评分,最后利用上述候选答案的隐式特征评分对上述候选答案的显式特征评分进行矫正,输出按照矫正后的评分进行排序的候选答案,从而可以实现在问答系统中,对进行显式特征评分后的候选答案进一步基于隐式特征进行评分,提高了问答系统输出的答案的正确率,提高了用户体验。
图2为本申请答案输出方法另一个实施例的流程图,如图2所示,本申请图1所示实施例步骤104可以包括:
步骤201,对进行显式特征评分后的候选答案按照所属的领域进行归类。
具体地,先对进行显式特征评分后的候选答案按照所属的领域进行归类,候选答案所属的领域可以包括地理、经济、体育、历史、法律、人物、生活、自然、艺术、娱乐、医疗、金融、社会或其他。
步骤202,根据上述候选答案所属的每个领域的关键词与上述问题的分词的词距值,计算上述问题属于上述候选答案所属的每个领域的概率值。
其中,上述问题的分词为对上述问题进行分词后获得的词。
具体地,可以通过式(1)计算上述问题属于上述候选答案所属的领域的概率值。
式(1)中,P(Xi)为上述问题属于上述候选答案所属的第i个领域的概率值,Xi表示第i个领域,SXi是领域的关键词与上述问题的分词的词距值。
这样,本申请图1所示实施例中,步骤105可以包括:
步骤203,利用上述概率值对上述候选答案的显式特征评分进行矫正。
本实施例中,进行显式特征评分后的候选答案列表可以为{A1,A2,A3,…An},每个候选答案的权重分值可以为{SA1,SA2,SA3,…SAn}。
利用上述概率值对上述候选答案的显式特征评分进行矫正可以如式(2)所示。
式(2)中,S′Ai为利用上述概率值对上述候选答案的显式特征评分进行矫正后的评分,SAi为上述候选答案的显式特征评分,DAi为候选答案Ai所属的领域集合,P(Xi)为上述问题属于上述候选答案所属的第i个领域的概率值。
进一步地,步骤104还可以包括:
步骤204,获取利用上述概率值矫正评分后的候选答案的隐式解释集合。
步骤205,对每个候选答案的隐式解释集合中的每个值与上述问题进行二元模型评分、跳跃二元模型评分和词距评分。
步骤206,将上述二元模型评分、上述跳跃二元模型评分和上述词距评分相加,计算获得每个候选答案基于隐式解释集合的总评分。
本实施例中,对于利用上述概率值矫正评分后的每个候选答案,获取上述候选答案的隐式解释集合RAi={A′i1,A′i2,A′i3,…,A′in},举例来说,对于候选答案“北京”,可以通过知识图谱获取“北京”的隐式解释集合为:{“中国首都”,“冯唐所著的小说”,“朱刚演唱歌曲”,“太原古代的名称”,“中华人民共和国首都”,“开封古代的称呼”,“歌手郝云专辑”}。
然后,对每个候选答案的隐式解释集合中的值A′in与上述问题进行二元模型评分f(x)、跳跃二元模型评分g(x)和词距评分h(x),计算获得每个候选答案基于隐式解释集合的总评分,计算方式如式(3)所示。
式(3)中,F(Ai)为每个候选答案基于隐式解释集合的总评分,f(A′ij)为A′ij与上述问题的二元模型评分,g(A′ij)为A′ij与上述问题的跳跃二元模型评分,h(A′ij)为A′ij与上述问题的词距评分。
这样,步骤105还可以包括:
步骤207,利用上述每个候选答案基于隐式解释集合的总评分对每个候选答案利用上述概率值进行矫正后的评分进行矫正,如式(4)所示。
ScoreAi=S′Ai×F(Ai) (4)
式(4)中,ScoreAi为每个候选答案最终矫正后的评分,S′Ai为每个候选答案利用上述概率值进行矫正后的评分,F(Ai)为每个候选答案基于隐式解释集合的总评分。
图3为本申请答案输出装置一个实施例的结构示意图,本实施例中的答案输出装置可以实现本申请实施例提供的答案输出方法,如图3所示,上述答案输出装置可以包括:接收模块31、检索模块32、显式评分模块33、隐式评分模块34、矫正模块35和输出模块36;
其中,接收模块31,用于接收用户输入的问题;其中,上述问题可以是用户输入的自然语言问题,本实施例中,用户可以通过语音、文本或图片的方式输入上述问题,本实施例对用户输入问题的方式不作限定。
检索模块31,用于根据接收模块31接收的问题进行检索,获得上述问题的证据资料;具体地,检索模块31可以先对上述问题进行分词、词性标注和/或句法分析,然后通过外部接口,如搜索引擎或知识库,根据上述问题进行检索从而获取上述问题的相关证据资料。
显式评分模块33,用于根据检索模块31获得的证据资料的显式特征,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分;具体地,显式评分模块33可以先对上述证据资料进行分词,根据问题和上述证据资料分词后获得的词的词性和显示特征(即上述证据资料分词后获得的词本身),通过对上述问题与上述证据资料分词后获得的词进行以下处理之一或组合:热词计算、模式匹配词频计算、词距计算、文本对齐和机器学习方法,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分。
隐式评分模块34,用于提取上述候选答案的隐式特征,根据上述隐式特征对上述候选答案进行评分,获得上述候选答案的隐式特征评分。
矫正模块35,用于利用隐式评分模块34获得的上述候选答案的隐式特征评分对显式评分模块33获得的上述候选答案的显式特征评分进行矫正。
输出模块36,用于输出按照矫正模块35矫正后的评分进行排序的候选答案。
具体地,输出模块36可以按照矫正后的评分由高到低的顺序对上述候选答案进行排序,这样排在第一位的候选答案即为上述问题最可能的正确答案。
本实施例中,隐式评分模块34,具体用于对进行显式特征评分后的候选答案按照所属的领域进行归类,根据上述候选答案所属的每个领域的关键词与上述问题的分词的词距值,计算上述问题属于上述候选答案所属的每个领域的概率值。其中,上述问题的分词为对上述问题进行分词后获得的词。
具体地,隐式评分模块34先对进行显式特征评分后的候选答案按照所属的领域进行归类,候选答案所属的领域可以包括地理、经济、体育、历史、法律、人物、生活、自然、艺术、娱乐、医疗、金融、社会或其他。
隐式评分模块34可以通过式(1)计算上述问题属于上述候选答案所属的领域的概率值。
这时,矫正模块35,具体用于利用上述概率值对上述候选答案的显式特征评分进行矫正。
本实施例中,进行显式特征评分后的候选答案列表可以为{A1,A2,A3,…An},每个候选答案的权重分值可以为{SA1,SA2,SA3,…SAn}。
矫正模块35利用上述概率值对上述候选答案的显式特征评分进行矫正可以如式(2)所示。
进一步地,隐式评分模块34,还用于获取利用上述概率值矫正评分后的候选答案的隐式解释集合,对每个候选答案的隐式解释集合中的每个值与上述问题进行二元模型评分、跳跃二元模型评分和词距评分,将上述二元模型评分、上述跳跃二元模型评分和上述词距评分相加,计算获得每个候选答案基于隐式解释集合的总评分。
本实施例中,对于利用上述概率值矫正评分后的每个候选答案,隐式评分模块34获取上述候选答案的隐式解释集合RAi={A′i1,A′i2,A′i3,…,A′in},举例来说,对于候选答案“北京”,隐式评分模块34可以通过知识图谱获取“北京”的隐式解释集合为:{“中国首都”,“冯唐所著的小说”,“朱刚演唱歌曲”,“太原古代的名称”,“中华人民共和国首都”,“开封古代的称呼”,“歌手郝云专辑”}。
然后,隐式评分模块34对每个候选答案的隐式解释集合中的值A′in与上述问题进行二元模型评分f(x)、跳跃二元模型评分g(x)和词距评分h(x),计算获得每个候选答案基于隐式解释集合的总评分,计算方式如式(3)所示。
这时,矫正模块35,还用于利用上述每个候选答案基于隐式解释集合的总评分对每个候选答案利用上述概率值进行矫正后的评分进行矫正,如式(4)所示。
上述答案输出装置中,接收模块31接收用户输入的问题之后,检索模块32根据上述问题进行检索,获得上述问题的证据资料,显式评分模块33根据上述证据资料的显式特征,从上述证据资料中抽取上述问题的候选答案,并对上述候选答案进行评分,获得上述候选答案的显式特征评分,隐式评分模块34再提取上述候选答案的隐式特征,根据上述隐式特征对所述候选答案进行评分,获得上述候选答案的隐式特征评分,最后矫正模块35利用上述候选答案的隐式特征评分对上述候选答案的显式特征评分进行矫正,输出模块36输出按照矫正后的评分进行排序的候选答案,从而可以实现在问答系统中,对进行显式特征评分后的候选答案进一步基于隐式特征进行评分,提高了问答系统输出的答案的正确率,提高了用户体验。
图4为本申请计算机设备一个实施例的结构示意图,本实施例中的计算机设备可以包括存储器、处理器及存储在上述存储器上并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时,可以实现本申请实施例提供的答案输出方法。
其中,上述计算机设备可以为问答系统中的服务器,也可以为终端设备,例如个人计算机(Personal Computer;以下简称:PC)等,本实施例对上述计算机设备的形态不作限定,但本实施例以上述计算机设备为问答系统中的服务器为例进行说明。
图4示出了适于用来实现本申请实施方式的示例性计算机设备12的框图。图4显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例提供的答案输出方法。
本申请还提供一种非临时性计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现本申请实施例提供的答案输出方法。
上述非临时性计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory;以下简称:ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network;以下简称:LAN)或广域网(Wide Area Network;以下简称:WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本申请还提供一种计算机程序产品,当上述计算机程序产品中的指令由处理器执行时,执行本申请实施例提供的答案输出方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(Random AccessMemory;以下简称:RAM),只读存储器(Read Only Memory;以下简称:ROM),可擦除可编辑只读存储器(Erasable Programmable Read Only Memory;以下简称:EPROM)或闪速存储器,光纤装置,以及便携式光盘只读存储器(Compact Disc Read Only Memory;以下简称:CD-ROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(ProgrammableGate Array;以下简称:PGA),现场可编程门阵列(Field Programmable Gate Array;以下简称:FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (6)
1.一种答案输出方法,其特征在于,包括:
接收用户输入的问题;
根据所述问题进行检索,获得所述问题的证据资料;
根据所述证据资料的显式特征,从所述证据资料中抽取所述问题的候选答案,并对所述候选答案进行评分,获得所述候选答案的显式特征评分;
提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分;
利用所述候选答案的隐式特征评分对所述候选答案的显式特征评分进行矫正;
输出按照矫正后的评分进行排序的候选答案;
所述提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分包括:
对进行显式特征评分后的候选答案按照所属的领域进行归类;
根据所述候选答案所属的每个领域的关键词与所述问题的分词的词距值,计算所述问题属于所述候选答案所属的每个领域的概率值;
所述利用所述候选答案的隐式特征评分对所述候选答案的显式特征评分进行矫正包括:
利用所述概率值对所述候选答案的显式特征评分进行矫正;
所述提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分包括:
获取利用所述概率值矫正评分后的候选答案的隐式解释集合;
对每个候选答案的隐式解释集合中的每个值与所述问题进行二元模型评分、跳跃二元模型评分和词距评分;
将所述二元模型评分、所述跳跃二元模型评分和所述词距评分相加,计算获得每个候选答案基于隐式解释集合的总评分。
2.根据权利要求1所述的方法,其特征在于,所述利用所述候选答案的隐式特征评分对所述候选答案的显式特征评分进行矫正包括:
利用所述每个候选答案基于隐式解释集合的总评分对每个候选答案利用所述概率值进行矫正后的评分进行矫正。
3.一种答案输出装置,其特征在于,包括:
接收模块,用于接收用户输入的问题;
检索模块,用于根据所述接收模块接收的问题进行检索,获得所述问题的证据资料;
显式评分模块,用于根据所述检索模块获得的证据资料的显式特征,从所述证据资料中抽取所述问题的候选答案,并对所述候选答案进行评分,获得所述候选答案的显式特征评分;
隐式评分模块,用于提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分;
矫正模块,用于利用所述隐式评分模块获得的所述候选答案的隐式特征评分对所述显式评分模块获得的所述候选答案的显式特征评分进行矫正;
输出模块,用于输出按照所述矫正模块矫正后的评分进行排序的候选答案;
所述隐式评分模块,具体用于对进行显式特征评分后的候选答案按照所属的领域进行归类,根据所述候选答案所属的每个领域的关键词与所述问题的分词的词距值,计算所述问题属于所述候选答案所属的每个领域的概率值;
所述利用所述候选答案的隐式特征评分对所述候选答案的显式特征评分进行矫正包括:
利用所述概率值对所述候选答案的显式特征评分进行矫正;
所述提取所述候选答案的隐式特征,根据所述隐式特征对所述候选答案进行评分,获得所述候选答案的隐式特征评分包括:
获取利用所述概率值矫正评分后的候选答案的隐式解释集合;
对每个候选答案的隐式解释集合中的每个值与所述问题进行二元模型评分、跳跃二元模型评分和词距评分;
将所述二元模型评分、所述跳跃二元模型评分和所述词距评分相加,计算获得每个候选答案基于隐式解释集合的总评分。
4.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-2中任一所述的方法。
5.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-2中任一所述的方法。
6.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-2中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710963928.3A CN107844531B (zh) | 2017-10-17 | 2017-10-17 | 答案输出方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710963928.3A CN107844531B (zh) | 2017-10-17 | 2017-10-17 | 答案输出方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107844531A CN107844531A (zh) | 2018-03-27 |
CN107844531B true CN107844531B (zh) | 2020-05-22 |
Family
ID=61662424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710963928.3A Active CN107844531B (zh) | 2017-10-17 | 2017-10-17 | 答案输出方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107844531B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846063B (zh) * | 2018-06-04 | 2020-12-22 | 北京百度网讯科技有限公司 | 确定问题答案的方法、装置、设备和计算机可读介质 |
CN109766418B (zh) * | 2018-12-13 | 2021-08-24 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN112182179B (zh) * | 2020-09-27 | 2022-09-23 | 北京字节跳动网络技术有限公司 | 实体问答处理方法、装置、电子设备和存储介质 |
CN112863627B (zh) * | 2021-03-12 | 2023-11-03 | 云知声智能科技股份有限公司 | 医疗质控信息检测方法、系统以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425635A (zh) * | 2012-05-15 | 2013-12-04 | 北京百度网讯科技有限公司 | 一种答案推荐方法和装置 |
CN104536991A (zh) * | 2014-12-10 | 2015-04-22 | 乐娟 | 答案抽取方法及装置 |
CN106095872A (zh) * | 2016-06-07 | 2016-11-09 | 北京高地信息技术有限公司 | 用于智能问答系统的答案排序方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8275803B2 (en) * | 2008-05-14 | 2012-09-25 | International Business Machines Corporation | System and method for providing answers to questions |
CN103229120A (zh) * | 2010-09-28 | 2013-07-31 | 国际商业机器公司 | 使用假设剪枝提供问题答案 |
US9262938B2 (en) * | 2013-03-15 | 2016-02-16 | International Business Machines Corporation | Combining different type coercion components for deferred type evaluation |
-
2017
- 2017-10-17 CN CN201710963928.3A patent/CN107844531B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425635A (zh) * | 2012-05-15 | 2013-12-04 | 北京百度网讯科技有限公司 | 一种答案推荐方法和装置 |
CN104536991A (zh) * | 2014-12-10 | 2015-04-22 | 乐娟 | 答案抽取方法及装置 |
CN106095872A (zh) * | 2016-06-07 | 2016-11-09 | 北京高地信息技术有限公司 | 用于智能问答系统的答案排序方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107844531A (zh) | 2018-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11062090B2 (en) | Method and apparatus for mining general text content, server, and storage medium | |
US11816888B2 (en) | Accurate tag relevance prediction for image search | |
CN108733778B (zh) | 对象的行业类型识别方法和装置 | |
CN110543592B (zh) | 信息搜索方法、装置以及计算机设备 | |
CN111858859A (zh) | 自动问答处理方法、装置、计算机设备及存储介质 | |
CN107844531B (zh) | 答案输出方法、装置和计算机设备 | |
CN109902285B (zh) | 语料分类方法、装置、计算机设备及存储介质 | |
US20180181544A1 (en) | Systems for Automatically Extracting Job Skills from an Electronic Document | |
WO2021218028A1 (zh) | 基于人工智能的面试内容精炼方法、装置、设备及介质 | |
CN105956053A (zh) | 一种基于网络信息的搜索方法及装置 | |
CN109616101B (zh) | 声学模型训练方法、装置、计算机设备和可读存储介质 | |
CN113158656B (zh) | 讽刺内容识别方法、装置、电子设备以及存储介质 | |
CN111369980A (zh) | 语音检测方法、装置、电子设备及存储介质 | |
CN108710653B (zh) | 一种绘本朗读点播方法、装置及系统 | |
CN113641794A (zh) | 简历文本的评估方法、装置及服务器 | |
CN110647613A (zh) | 一种课件构建方法、装置、服务器和存储介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN109635125B (zh) | 一种词汇图谱搭建方法及电子设备 | |
CN109408175B (zh) | 通用高性能深度学习计算引擎中的实时交互方法及系统 | |
CN110737770B (zh) | 文本数据敏感性识别方法、装置、电子设备及存储介质 | |
CN113220854B (zh) | 机器阅读理解的智能对话方法及装置 | |
CN113806500B (zh) | 信息处理方法、装置和计算机设备 | |
CN113254814A (zh) | 网络课程视频打标签方法、装置、电子设备及介质 | |
CN113505786A (zh) | 试题拍照评判方法、装置及电子设备 | |
CN112613293A (zh) | 摘要生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |