CN104951456A - 一种用于获得答案信息的方法、装置和设备 - Google Patents

一种用于获得答案信息的方法、装置和设备 Download PDF

Info

Publication number
CN104951456A
CN104951456A CN201410117635.XA CN201410117635A CN104951456A CN 104951456 A CN104951456 A CN 104951456A CN 201410117635 A CN201410117635 A CN 201410117635A CN 104951456 A CN104951456 A CN 104951456A
Authority
CN
China
Prior art keywords
information
semantic
participle
subscriber equipment
initial answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410117635.XA
Other languages
English (en)
Other versions
CN104951456B (zh
Inventor
朱频频
李波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd filed Critical SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd
Priority to CN201410117635.XA priority Critical patent/CN104951456B/zh
Priority to CN201810677005.6A priority patent/CN108984650B/zh
Publication of CN104951456A publication Critical patent/CN104951456A/zh
Application granted granted Critical
Publication of CN104951456B publication Critical patent/CN104951456B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种用于获得答案信息的方法、装置和设备。本发明提供了用于获得答案信息的方案。本发明的方案获取来自用户设备的待处理的文本序列;对所述文本序列进行分词,并获得其至少一个分词的语义信息;根据所述语义信息,在预定知识库中进行匹配查询,确定所述语义信息对应的初始答案信息;当判断所述初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息;根据所述参数信息,对所述初始答案信息进行处理,获得用于提供给所述用户设备的最终答案信息。本发明通过对文本序列进行更好的语义理解,能够提供更准确的答案信息。

Description

一种用于获得答案信息的方法、装置和设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于获得答案信息的方法、装置和设备。
背景技术
现有技术中的各种基于用户的问题来向用户提供答案信息的方案,往往只进行简单的问题文本匹配,而缺乏对问题的语义理解,使得提供的答案不尽如人意。
发明内容
本发明的目的是提供一种用于获得答案信息的方法、装置和设备。
根据本发明的一个方面,提供一种在计算机设备中用于获得答案信息的方法,其中,该方法包括以下步骤:
a获取来自用户设备的待处理的文本序列;
b对所述文本序列进行分词,并获得其至少一个分词的语义信息;
c根据所述语义信息,在预定知识库中进行匹配查询,确定所述语义信息对应的初始答案信息;
其中,该方法还包括以下步骤:
d当判断所述初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息;
e根据所述参数信息,对所述初始答案信息进行处理,获得用于提供给所述用户设备的最终答案信息。
根据本发明的另一个方面,还提供了一种在计算机设备中用于获得答案信息的问答装置,其中,该问答装置包括:
第一获取装置,用于获取来自用户设备的待处理的文本序列;
语义装置,用于对所述文本序列进行分词,并获得其至少一个分词的语义信息;
查询装置,用于根据所述语义信息,在预定知识库中进行匹配查询,确定所述语义信息对应的初始答案信息;
第二获取装置,用于当判断所述初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息;
第三获取装置,用于根据所述参数信息,对所述初始答案信息进行处理,获得用于提供给所述用户设备的最终答案信息。
与现有技术相比,本发明具有以下优点:1)通过对文本序列进行更好的语义理解,能够提供更准确的答案信息;2)能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解,且通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能;3)对于具有相似属性的大量本体实例,无需针对每个本体实例重复性地建立属性,而可通过继承本体的所有属性的方式,简便地创建新的本体实例,大大减轻了本体实例创建过程中的资源消耗。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个优选实施例的获得答案信息的方法流程图;
图2为本发明一个优选实施例的创建本体实例的方法流程图;
图3为本发明一个优选实施例的获得答案信息的问答装置的结构示意图;
图4为本发明一个优选实施例的创建本体实例的问答装置的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个优选实施例的获得答案信息的方法流程图。其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括但不限于网络设备和用户设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。
需要说明的是,所述计算机设备和网络仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
根据本实施例的方法包括下述步骤S1、步骤S2、步骤S3、步骤S4和步骤S5。
在步骤S1中,计算机设备获取来自用户设备的待处理的文本序列。
其中,该待处理的文本序列可为用户直接输入的文本序列,也可为对用户输入的语音进行识别后所得的文本序列。
例如,用户在对话框中输入“今天天气如何”,并按下发送按键以指示用户设备将“今天天气如何”发送给计算机设备,则“今天天气如何”即为来自用户设备的待处理的文本序列。
又例如,用户在某个应用中输入一段语音,该段语音被该应用经由互联网发送给计算机设备,计算机设备识别该语音并获得文本序列“今天天气如何”,则“今天天气如何”即为来自用户设备的待处理的文本序列。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取来自用户设备的待处理的文本序列的实现方式,均应包含在本发明的范围内。
接着,在步骤S2中,计算机设备对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
其中,分词的语义信息包括任何能够被计算机识别并用于表示该分词的语义的信息。优选地,分词的语义信息包括但不限于以下至少一项:
1)分词的同义词和/或同义词组合。
例如,分词“天气”的语义信息包括其同义词“气候”等。
2)分词的同类词和/或同类词组合。
其中,分词的同类词表示与该分词属于同一类别的词汇。如若分词属于地名,则该分词的同类词可包括其他地名。
例如,分词“上海”的语义信息可包括“北京”、“天津”等。
3)与分词具有相同或相似结构的实体。
其中,与分词具有相同或相似结构的实体表示该实体的信息结构与分词相同或相似。优选地,该实体可为特殊语义表达式。
例如,分词为一个特定时间结构“2013年1月1日10点45分”,则与分词具有相同或相似结构的实体可为一个日期语义表达式“XXXX年XX月XX日XX点XX分”等。该等类似的特殊语义表达式还可包括人名、地址、电话号码等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何能够被计算机识别并用于表示一个分词的语义的信息,均应包含在本发明的该分词的语义信息的范围内。
具体地,计算机设备可采用多种方式,来对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
例如,计算机设备可采用多种方式来对待处理的文本序列进行分词,并将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而将成功匹配的词汇的语义信息作为分词的语义信息等。
又例如,在上例中,在将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而确定成功匹配的词汇对应的语义信息后,还可进一步结合分词在待处理的文本序列中的语境,对成功匹配的词汇对应的语义信息进行处理,从而确定分词的语义信息等。
需要说明的是,计算机设备可获取待处理的文本序列的所有分词中每个分词的语义信息;或者,计算机设备可仅获取待处理的文本序列的部分分词中每个分词的语义信息。特别是一些无意义的分词,计算机设备可不获取该等分词的语义信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待处理的文本序列进行分词,并获得其至少一个分词的语义信息的实现方式,均应包含在本发明的范围内。
在步骤S3中,计算机设备根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息。其中,所述预定知识库包括用于与分词的语义信息进行匹配的匹配信息,且匹配信息与初始答案信息具有对应关系。则计算机设备可通过将分词的语义信息与匹配信息进行匹配查询,来确定各个分词的语义信息对应的初始答案信息。需要说明的是,作为一种优选方案,所述匹配信息可以是肯定式匹配信息,也可以是否定式匹配信息;所述肯定式匹配信息表示若分词的语义信息与该肯定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该肯定式匹配信息所对应的初始答案信息的可能性越高;所述否定式匹配信息表示若分词的语义信息与该否定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该否定式匹配信息所对应的初始答案信息的可能性越低。
其中,所述初始答案信息包括:
1)能够被直接提供给用户的答案信息,其可以是完整地、能够直接呈现给用户或者经用户设备运行后呈现给用户的答案信息。
例如,纯文本、纯多媒体信息、具有扩展标签的多媒体信息、可执行信息等;其中,所述扩展标签表示可供用户选择(如被用户点击)以链接其他信息的标签,所述可执行信息包括任何能够被用户设备运行的信息,如函数和指令等。
2)不能被直接提供给用户的答案信息,其可以是不完整的、需要进一步补充后才能呈现给用户或经用户设备运行后呈现给用户的答案信息。
例如,具有缺省项的纯文本、具有缺省项的纯多媒体信息、具有缺省扩展标签的多媒体信息、具有缺省参数的可执行信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何能够被计算机识别并用于表示一个分词的语义的信息,均应包含在本发明的该分词的语义信息的范围内。
具体地,计算机设备根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息的方式包括但不限于:
1)预定知识库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。计算机设备将各个分词的语义信息与预定知识库中的匹配信息进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息。
例如,在步骤S2中获得待处理的文本信息“10元本地流量包怎么样”的分词“10元本地流量包”和“怎么样”以及两者分别对应的语义信息,计算机设备将两者的语义信息与预定知识库中的匹配信息进行匹配,并确定两者的语义信息与三个语句“10元本地流量包提供的服务是什么”、“我想问一下,你知道10元本地流量包吗”、“10元本地流量包能给我什么服务”构成的一组匹配信息相匹配,则计算机设备将该组匹配信息对应的纯文本信息“10元本地流量包是针对XX用户推出的流量优惠活动,您只需支付10元月费,即可享受……”,作为与分词“10元本地流量包”以及“怎么样”的语义信息对应的初始答案信息。
2)预定知识库中的匹配信息包括语义匹配信息,每组语义匹配信息包括一个或多个语义匹配结构。优选地,一个语义匹配结构也可为肯定式语义匹配结构或否定式语义匹配结构;一组语义匹配信息所表达的语义相近。计算机设备将各个分词的语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
其中,一个语义匹配结构可表现为一个语义表达式。优选地,该语义匹配结构包括但不限于以下至少一项:a)多个词汇以及该多个词汇中至少一个词汇的语义信息,其中,一个词汇的语义信息与一个分词的语义信息相类似,在此不再赘述;b)所述多个词汇之间的逻辑关系,如该多个词汇之间的先后顺序关系、限定关系(如一个词汇为另一个词汇的修饰词)等。
例如,一组语义匹配信息包括以下三个语义匹配结构“[日期相关?][雨种类][对于][天气地区名][有没有][影响]”、“[天气地区名][天气相关][还是][雨种类]”和“[查询?][天气地区名][日期相关|时间?][是否?][需要|可以?][带伞]”。其中,“|”表示逻辑或,每个“[]”中的内容表示一个词汇和/或该词汇的语义信息,如“带伞”为一个词汇,“天气地区名”指代地区类词汇的特殊表达式等。
优选地,可用一个标准问题来表示与一组语义匹配信息中的所有语义匹配信息相近的自然语言含义,该标准问题可包含在预定知识库中,以便操作人员理解一组语义匹配信息表达的语义。例如,上例中包含该三个语义匹配结构的一组语义匹配信息的标准问题可为“今天会下雨么?”
具体地,计算机设备将各个分词的语义信息与多组语义匹配信息分别进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
例如,对于一组语义匹配信息中的每个语义匹配结构,计算机设备将各个分词的语义信息分别与该语义匹配结构中的各个词汇和/或词汇的语义信息进行匹配,并结合语义匹配结构中各个词汇之间的逻辑关系,确定各个分词的语义信息与该语义匹配结构的匹配程度。类似地,计算机设备还确定各个分词的语义信息与该组语义匹配信息中的其他语义匹配结构之间的匹配程度,进而确定各个分词的语义信息与该组语义匹配信息的匹配程度。并且,计算机设备以类似的方式确定各个分词的语义信息与其他多组语义匹配信息之间的匹配程度,从而根据匹配程度来确定一组语义匹配信息,并将其对应的初始答案信息,作为所述语义信息对应的初始答案信息。
需要说明的是,本实现方式中,匹配信息可同时包括语义匹配信息以及其他匹配信息,如语句等。计算机设备将各个分词的语义信息与所述预定知识库中的多组语义匹配信息以及其他匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
3)步骤S3进一步包括步骤S31和步骤S32。
在步骤S31中,当待处理的文本序列符合预定触发条件时,计算机设备获取提供该待处理的文本序列的用户设备的历史查询信息。
其中,所述预定触发条件可包括任何能够用于触发计算机设备获取用户设备的历史查询信息的条件。例如,待处理的文本序列符合预定格式和/或待处理的文本序列符合预定语义等。
其中,用户设备的历史查询信息包括但不限于:a)根据用户设备的历史文本序列获得的分词结果和/或历史语义信息等;b)用户设备的历史文本序列,如用户设备之前查询过的待处理的文本序列等,其中,可通过对该历史文本序列执行与步骤S2相同或相似的步骤,获得历史分词结果和历史语义信息。
其中,计算机设备可通过多种方式来识别一个用户设备。例如,根据用户的登录或注册信息来识别用户设备;又例如,根据用户设备中诸如cookie等记录信息来识别用户设备;又例如,根据用户设备的手机号或硬件标识码等,来识别用户设备。
在步骤S32中,计算机设备结合用户设备的历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
其中,计算机设备可采用多种方式,来结合历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
例如,计算机设备先根据历史查询信息来对语义信息进行补充,如历史查询信息包含用户的历史文本序列,则计算机设备将包含于历史文本序列中但不包含于当前处理的文本序列中的分词的语义信息补充入当前的语义信息中;接着,再根据补充后的语义信息在预定知识库中进行匹配查询,并确定初始答案信息等。
作为步骤S32的一个优选方案,用户设备的历史查询信息包括来自用户设备的文本序列的历史语义信息,则计算机设备根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充;并根据语义补充后的语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。优选地,计算机设备还可执行根据历史语义信息以及当前处理的文本序列的分词的语义信息(以下简称“当前语义信息”)来判断是否能够执行所述语义补充操作的步骤。
例如,计算机设备判断历史语义信息与当前语义信息中是否存在相类似的语义信息(如是否存在同义词、同类词或具有相似结构的实体等);当判断存在相类似的语义信息时,根据包含于历史语义信息且未包含于当前语义信息中的语义信息,对当前语义信息进行补充,从而根据补充后的语义信息,在预定知识库中进行匹配查询,确定初始答案信息。如作为一个更具体的示例,历史文本序列为“上海下雨么?”,其历史语义信息包括分词“上海”、“下雨”和“么”的语义信息,当前处理的文本序列为“北京呢?”,其语义信息包括分词“北京”和“呢”的语义信息;则计算机设备判断分词“上海”和“么”,与分词和“北京”和“呢”的语义信息相类似,并将包含于历史语义信息中且不包含于当前语义信息中的分词“下雨”的语义信息,补充入当前语义信息中。则语义补充后的语义信息包括“北京”、“下雨”和“呢”的语义信息。优选地,计算机设备还可在进一步判断历史语义信息与当前语义信息中是否存在相类似的语义信息,且该等相类似的语义信息之间的逻辑关系也相似的情况下,才执行语义补充的操作。
需要说明的是,步骤S32可与实现方式2)相结合,也即:计算机设备结合用户设备的历史查询信息,将各个分词的语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。更优选地,计算机设备可根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充,并将语义补充后的语义信息与预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息”。
本优选方案能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解;此外,通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息的实现方式,均应包含在本发明的范围内。
在步骤S4中,当判断获得的初始答案信息不能被直接提供给所述用户设备时,计算机设备从分词的语义信息中获得参数信息。其中,所述参数信息能够对初始答案信息进行补充。
其中,计算机设备可采用多种方式来判断初始答案信息是否能够被直接提供给用户设备。
例如,每个初始答案信息可对应一个标识,该标识用于指示初始答案信息是否能够被直接提供给用户设备。则当计算机设备获得初始答案信息后,可直接根据该标识来判断初始答案信息是否能够被直接提供给用户设备。
又例如,计算机设备通过判断初始答案信息对应的匹配信息的类别是否属于预定类别,或直接判断初始答案信息是否处于预定类别,来判断初始答案信息是否能够被直接提供给用户设备。如若初始答案信息或其对应的匹配信息属于天气类别,则判断其不能被直接提供给所述用户设备等。
又例如,计算机设备通过解析初始答案信息,并判断其是否具有缺省项,来判断初始答案信息是否能够被直接提供给用户设备。
其中,计算机设备可采用多种方式,来从分词的语义信息中获得参数信息。
例如,不能被直接提供给用户设备的初始答案信息中规定了其缺省项的相关信息,如缺省项的表达式等,则计算机设备根据该相关信息,从分词的语义信息中获取相应的参数信息。如基于待处理的文本序列“今天天气如何”获得的初始答案信息中规定了该初始答案信息的缺省项为地名或时间,则计算机设备在分词的语义信息中查询地名类或时间类的分词,并从时间类分词“今天”的语义信息中获得所需的时间参数信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断获得的初始答案信息不能被直接提供给所述用户设备时,从分词的语义信息中获得参数信息的实现方式,均应包含在本发明的范围内。
在步骤S5中,计算机设备根据所述参数信息,对所述初始答案信息进行处理,获得用于提供给所述用户设备的最终答案信息。
优选地,所述最终答案信息包括对初始答案信息进行处理后能够直接发送给用户设备的答案信息。优选地,最终答案信息包括但不限于以下至少一项:
1)纯文本信息。
如一段纯文本描述等。
2)纯多媒体信息。
如语音、视频等。
3)具有扩展标签的多媒体信息。
如包含链接的文本、视频、网页等。
4)可执行信息。
所述可执行信息可被用户设备运行;优选地,可执行信息包含函数和指令等。
具体地,计算机设备可根据参数信息来对初始答案信息进行补充,且计算机设备可直接将补充后的初始答案信息作为最终答案信息,也可运行将补充后的初始答案信息,并将运行结果作为最终答案信息。
例如,初始答案信息包括纯文本“你今天心情X”,其中,X表示形容词类的缺省项,且在步骤S4中获得的参数信息为“很好”,则计算机设备将补充后的初始答案信息“你今天心情很好”,直接作最终答案信息来发送给用户设备。
又例如,初始答案信息包括可执行信息,该可执行信息中包括时间类的缺省项,且在步骤S4中获得的参数信息为“今天”,则计算机设备根据该时间参数信息对初始答案信息进行补充后,获得完整的可执行信息,并运行该可执行信息来获得与时间参数“今天”相应的信息最为最终答案信息,并发送给用户设备。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据参数信息,对初始答案信息进行处理,获得用于提供给用户设备的最终答案信息的实现方式,均应包含在本发明的范围内。
需要说明的是,当判断所获得的初始答案信息能够被直接提供给所述用户设备时,计算机设备可直接将初始答案信息发送给所述用户设备,以供用户设备将其呈现给用户。
作为本实施例的优选方案之一,预定知识库包含语义匹配信息,且一组语义匹配信息对应的初始答案信息可具有多个,则在步骤S3之后还可包括以下步骤:计算机设备根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息;且步骤S4进一步为:当判断所选择的初始答案信息不能被直接提供给所述用户设备时,从分词的语义信息中获得参数信息。
其中,所述用户设备的设备信息包括任何能够影响答案信息的显示的设备信息。例如,用户设备的类别,如手机、电视机等;又例如,用户设备支持的显示格式信息等;又例如,用户设备当前的网络信息,如移动网络或Wi-Fi等。
其中,所述应用信息包括任何与答案信息在应用中的显示相关的信息。例如,应用名称或平台,如MSN、短信、微博、微信等;又例如,应用支持的代码格式等。
具体地,计算机设备根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择适用于用户设备和/或应用的初始答案信息。
例如,多个初始答案信息中包括纯文本信息和具有扩展标签的多媒体信息,则若用户设备当前连接至Wi-Fi,计算机设备选择具有扩展标签的多媒体信息作为初始答案信息,若用户设备当前连接至移动网络,则计算机设备选择纯文本信息作为初始答案信息。
又例如,多个初始答案信息中包括使用与多个平台的可执行信息,则如发送文本序列的应用为微博,则选择微博支持的可执行信息作为初始答案信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息的实现方式,均应包含在本发明的范围内。
本实施例中,通过对文本序列进行更好的语义理解,能够提供更准确的答案信息。
图2为本发明一个优选实施例的创建本体实例的方法流程图。本实施例的方法包括步骤S6和步骤S7。本实施例中,预定知识库包括本体实例,所述本体实例的至少一个属性中的每个属性包括一组语义匹配信息和与该语义匹配信息对应的初始答案信息。需要说明的是,一个本体示例可具有多个属性,每个属性还可包括其他信息,如标准问题、属性类型等。
在步骤S6中,计算机设备获取一个本体的实例项,其中,所述本体的至少一个属性中的每个属性包括本体答案信息以及具有缺省项的一组语义匹配信息。优选地,本体答案信息也可具有缺省项。
其中,本体的实例项表示该本体的缺省项的一个具体实例。例如,本体的一组语义匹配信息中的缺省项为XX,如“[XX]资费”,则作为XX的一个具体实例,本体的实例项为“3G”。
其中,计算机设备可采用多种方式来获得本体的实例项。如获得人工输入或已预先存储的实例项等。
在步骤S7中,计算机设备根据本体的实例项,对所述本体的属性中的缺省项进行处理,获得继承所述本体的全部属性的本体实例。
例如,本体的属性包括本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[XXX][收费|付费|计费][方法]”、“[XXX][多少钱]”、“[XXX][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“XXX贵吗”,本体的实例项为“神州行”,则计算机设备将本体的实例项补充至本体属性的各个缺省项中,获得继承本体的全部属性,如继承本体的全部语义匹配信息,的本体实例,该本体实例的属性包括作为初始答案信息的本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[神州行][收费|付费|计费][方法]”、“[神州行][多少钱]”、“[神州行][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“神州行贵吗”。
优选地,若本体答案信息具有缺省项,则计算机设备还可根据本体的实例项,对所述本体答案信息中的缺省项进行处理,获得初始答案信息。
需要说明的是,一个本体若为另一个本体的子本体,则该子本体也可继承其所属本体的所有属性。该实现方式与前述步骤S6和S7相似,故不再赘述。
本实施例中,对于具有相似属性的大量本体实例,无需针对每个本体实例重复性地建立属性,而可通过继承本体的所有属性的方式,简便地创建新的本体实例,大大减轻了本体实例创建过程中的资源消耗。
图3为本发明一个优选实施例的获得答案信息的问答装置的结构示意图。本实施例的问答装置可包含于计算机设备中,该问答装置包括第一获取装置1、语义装置2、查询装置3、第二获取装置4以及第三获取装置5。
第一获取装置1获取来自用户设备的待处理的文本序列。
其中,该待处理的文本序列可为用户直接输入的文本序列,也可为对用户输入的语音进行识别后所得的文本序列。
例如,用户在对话框中输入“今天天气如何”,并按下发送按键以指示用户设备将“今天天气如何”发送给计算机设备,则“今天天气如何”即为来自用户设备的待处理的文本序列。
又例如,用户在某个应用中输入一段语音,该段语音被该应用经由互联网发送给计算机设备,第一获取装置1识别该语音并获得文本序列“今天天气如何”,则“今天天气如何”即为来自用户设备的待处理的文本序列。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取来自用户设备的待处理的文本序列的实现方式,均应包含在本发明的范围内。
接着,语义装置2对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
其中,分词的语义信息包括任何能够被计算机识别并用于表示该分词的语义的信息。优选地,分词的语义信息包括但不限于以下至少一项:
1)分词的同义词和/或同义词组合。
例如,分词“天气”的语义信息包括其同义词“气候”等。
2)分词的同类词和/或同类词组合。
其中,分词的同类词表示与该分词属于同一类别的词汇。如若分词属于地名,则该分词的同类词可包括其他地名。
例如,分词“上海”的语义信息可包括“北京”、“天津”等。
3)与分词具有相同或相似结构的实体。
其中,与分词具有相同或相似结构的实体表示该实体的信息结构与分词相同或相似。优选地,该实体可为特殊语义表达式。
例如,分词为一个特定时间结构“2013年1月1日10点45分”,则与分词具有相同或相似结构的实体可为一个日期语义表达式“XXXX年XX月XX日XX点XX分”等。该等类似的特殊语义表达式还可包括人名、地址、电话号码等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何能够被计算机识别并用于表示一个分词的语义的信息,均应包含在本发明的该分词的语义信息的范围内。
具体地,语义装置2可采用多种方式,来对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
例如,语义装置2可采用多种方式来对待处理的文本序列进行分词,并将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而将成功匹配的词汇的语义信息作为分词的语义信息等。
又例如,在上例中,在将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而确定成功匹配的词汇对应的语义信息,语义装置2还可进一步结合分词在待处理的文本序列中的语境,对成功匹配的词汇对应的语义信息进行处理,从而确定分词的语义信息等。
需要说明的是,语义装置2可获取待处理的文本序列的所有分词中每个分词的语义信息;或者,语义装置2可仅获取待处理的文本序列的部分分词中每个分词的语义信息。特别是一些无意义的分词,语义装置2可不获取该等分词的语义信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待处理的文本序列进行分词,并获得其至少一个分词的语义信息的实现方式,均应包含在本发明的范围内。
查询装置3根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息。其中,所述预定知识库包括用于与分词的语义信息进行匹配的匹配信息,且匹配信息与初始答案信息具有对应关系。则查询装置3可通过将分词的语义信息与匹配信息进行匹配查询,来确定各个分词的语义信息对应的初始答案信息。需要说明的是,作为一种优选方案,所述匹配信息可以是肯定式匹配信息,也可以是否定式匹配信息;所述肯定式匹配信息表示若分词的语义信息与该肯定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该肯定式匹配信息所对应的初始答案信息的可能性越高;所述否定式匹配信息表示若分词的语义信息与该否定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该否定式匹配信息所对应的初始答案信息的可能性越低。
其中,所述初始答案信息包括:
1)能够被直接提供给用户的答案信息,其可以是完整地、能够直接呈现给用户或者经用户设备运行后呈现给用户的答案信息。
例如,纯文本、纯多媒体信息、具有扩展标签的多媒体信息、可执行信息等;其中,所述扩展标签表示可供用户选择(如被用户点击)以链接其他信息的标签,所述可执行信息包括任何能够被用户设备运行的信息,如函数和指令等。
2)不能被直接提供给用户的答案信息,其可以是不完整的、需要进一步补充后才能呈现给用户或经用户设备运行后呈现给用户的答案信息。
例如,具有缺省项的纯文本、具有缺省项的纯多媒体信息、具有缺省扩展标签的多媒体信息、具有缺省参数的可执行信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何能够被计算机识别并用于表示一个分词的语义的信息,均应包含在本发明的该分词的语义信息的范围内。
具体地,查询装置3根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息的方式包括但不限于:
1)预定知识库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。查询装置3将各个分词的语义信息与预定知识库中的匹配信息进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息。
例如,语义装置2获得待处理的文本信息“10元本地流量包怎么样”的分词“10元本地流量包”和“怎么样”以及两者分别对应的语义信息,查询装置3将两者的语义信息与预定知识库中的匹配信息进行匹配,并确定两者的语义信息与三个语句“10元本地流量包提供的服务是什么”、“我想问一下,你知道10元本地流量包吗”、“10元本地流量包能给我什么服务”构成的一组匹配信息相匹配,则查询装置3将该组匹配信息对应的纯文本信息“10元本地流量包是针对XX用户推出的流量优惠活动,您只需支付10元月费,即可享受……”,作为与分词“10元本地流量包”以及“怎么样”的语义信息对应的初始答案信息。
2)预定知识库中的匹配信息包括语义匹配信息,每组语义匹配信息包括一个或多个语义匹配结构。优选地,一个语义匹配结构也可为肯定式语义匹配结构或否定式语义匹配结构;一组语义匹配信息所表达的语义相近。查询装置3包括第一子查询装置(图未示),该第一子查询装置将各个分词的语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
其中,一个语义匹配结构可表现为一个语义表达式。优选地,该语义匹配结构包括但不限于以下至少一项:a)多个词汇以及该多个词汇中至少一个词汇的语义信息,其中,一个词汇的语义信息与一个分词的语义信息相类似,在此不再赘述;b)所述多个词汇之间的逻辑关系,如该多个词汇之间的先后顺序关系、限定关系(如一个词汇为另一个词汇的修饰词)等。
例如,一组语义匹配信息包括以下三个语义匹配结构“[日期相关?][雨种类][对于][天气地区名][有没有][影响]”、“[天气地区名][天气相关][还是][雨种类]”和“[查询?][天气地区名][日期相关|时间?][是否?][需要|可以?][带伞]”。其中,“|”表示逻辑或,每个“[]”中的内容表示一个词汇和/或该词汇的语义信息,如“带伞”为一个词汇,“天气地区名”指代地区类词汇的特殊表达式等。
优选地,可用一个标准问题来表示与一组语义匹配信息中的所有语义匹配信息相近的自然语言含义,该标准问题可包含在预定知识库中,以便操作人员理解一组语义匹配信息表达的语义。例如,上例中包含该三个语义匹配结构的一组语义匹配信息的标准问题可为“今天会下雨么?”
具体地,第一子查询装置将各个分词的语义信息与多组语义匹配信息分别进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
例如,对于一组语义匹配信息中的每个语义匹配结构,第一子查询装置将各个分词的语义信息分别与该语义匹配结构中的各个词汇和/或词汇的语义信息进行匹配,并结合语义匹配结构中各个词汇之间的逻辑关系,确定各个分词的语义信息与该语义匹配结构的匹配程度。类似地,第一子查询装置还确定各个分词的语义信息与该组语义匹配信息中的其他语义匹配结构之间的匹配程度,进而确定各个分词的语义信息与该组语义匹配信息的匹配程度。并且,第一子查询装置以类似的方式确定各个分词的语义信息与其他多组语义匹配信息之间的匹配程度,从而根据匹配程度来确定一组语义匹配信息,并将其对应的初始答案信息,作为所述语义信息对应的初始答案信息。
需要说明的是,本实现方式中,匹配信息可同时包括语义匹配信息以及其他匹配信息,如语句等。计算机设备将各个分词的语义信息与所述预定知识库中的多组语义匹配信息以及其他匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
3)查询装置3进一步包括历史获取装置(图未示)和第二子查询装置(图未示)。
当待处理的文本序列符合预定触发条件时,历史获取装置获取提供该待处理的文本序列的用户设备的历史查询信息。
其中,所述预定触发条件可包括任何能够用于触发计算机设备获取用户设备的历史查询信息的条件。例如,待处理的文本序列符合预定格式和/或待处理的文本序列符合预定语义等。
其中,用户设备的历史查询信息包括但不限于:a)根据用户设备的历史文本序列获得的分词结果和/或历史语义信息等;b)用户设备的历史文本序列,如用户设备之前查询过的待处理的文本序列等,其中,语义装置2可通过对该历史文本序列执行与待处理的文本序列相同或相似的步骤,获得历史分词结果和历史语义信息。
其中,历史获取装置可通过多种方式来识别一个用户设备。例如,根据用户的登录或注册信息来识别用户设备;又例如,根据用户设备中诸如cookie等记录信息来识别用户设备;又例如,根据用户设备的手机号或硬件标识码等,来识别用户设备。
第二子查询装置结合用户设备的历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
其中,第二子查询装置可采用多种方式,来结合历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
例如,第二子查询装置先根据历史查询信息来对语义信息进行补充,如历史查询信息包含用户的历史文本序列,则第二子查询装置将包含于历史文本序列中但不包含于当前处理的文本序列中的分词的语义信息补充入当前的语义信息中;接着,第二子查询装置再根据补充后的语义信息在预定知识库中进行匹配查询,并确定初始答案信息等。
作为第二子查询装置的一个优选方案,第二子查询装置包括补充装置(图未示)和第三子查询装置(图未示)。用户设备的历史查询信息包括来自用户设备的文本序列的历史语义信息,则补充装置根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充;第三子查询装置根据语义补充后的语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。优选地,补充装置还可执行根据历史语义信息以及当前处理的文本序列的分词的语义信息(以下简称“当前语义信息”)来判断是否能够执行所述语义补充操作的步骤。
例如,补充装置判断历史语义信息与当前语义信息中是否存在相类似的语义信息(如是否存在同义词、同类词或具有相似结构的实体等);当判断存在相类似的语义信息时,根据包含于历史语义信息且未包含于当前语义信息中的语义信息,对当前语义信息进行补充,第三子查询装置根据补充后的语义信息,在预定知识库中进行匹配查询,确定初始答案信息。如作为一个更具体的示例,历史文本序列为“上海下雨么?”,其历史语义信息包括分词“上海”、“下雨”和“么”的语义信息,当前处理的文本序列为“北京呢?”,其语义信息包括分词“北京”和“呢”的语义信息;则补充装置判断分词“上海”和“么”,与分词和“北京”和“呢”的语义信息相类似,并将包含于历史语义信息中且不包含于当前语义信息中的分词“下雨”的语义信息,补充入当前语义信息中。则语义补充后的语义信息包括“北京”、“下雨”和“呢”的语义信息。优选地,补充装置还可在进一步判断历史语义信息与当前语义信息中是否存在相类似的语义信息,且该等相类似的语义信息之间的逻辑关系也相似的情况下,才执行语义补充的操作。
需要说明的是,第一子查询装置可与第二子查询装置相结合,也即:结合用户设备的历史查询信息,将各个分词的语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。更优选地,可根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充,并将语义补充后的语义信息与预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息”。
本优选方案能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解;此外,通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据各个分词的语义信息,在预定知识库中进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息的实现方式,均应包含在本发明的范围内。
当判断获得的初始答案信息不能被直接提供给所述用户设备时,第二获取装置4从分词的语义信息中获得参数信息。其中,所述参数信息能够对初始答案信息进行补充。
其中,第二获取装置4可采用多种方式来判断初始答案信息是否能够被直接提供给用户设备。
例如,每个初始答案信息可对应一个标识,该标识用于指示初始答案信息是否能够被直接提供给用户设备。则当查询装置3获得初始答案信息后,第二获取装置4可直接根据该标识来判断初始答案信息是否能够被直接提供给用户设备。
又例如,第二获取装置4通过判断初始答案信息对应的匹配信息的类别是否属于预定类别,或直接判断初始答案信息是否处于预定类别,来判断初始答案信息是否能够被直接提供给用户设备。如若初始答案信息或其对应的匹配信息属于天气类别,则判断其不能被直接提供给所述用户设备等。
又例如,第二获取装置4通过解析初始答案信息,并判断其是否具有缺省项,来判断初始答案信息是否能够被直接提供给用户设备。
其中,第二获取装置4可采用多种方式,来从分词的语义信息中获得参数信息。
例如,不能被直接提供给用户设备的初始答案信息中规定了其缺省项的相关信息,如缺省项的表达式等,则第二获取装置4根据该相关信息,从分词的语义信息中获取相应的参数信息。如基于待处理的文本序列“今天天气如何”获得的初始答案信息中规定了该初始答案信息的缺省项为地名或时间,则第二获取装置4在分词的语义信息中查询地名类或时间类的分词,并从时间类分词“今天”的语义信息中获得所需的时间参数信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断获得的初始答案信息不能被直接提供给所述用户设备时,从分词的语义信息中获得参数信息的实现方式,均应包含在本发明的范围内。
第三获取装置5根据所述参数信息,对所述初始答案信息进行处理,获得用于提供给所述用户设备的最终答案信息。
优选地,所述最终答案信息包括对初始答案信息进行处理后能够直接发送给用户设备的答案信息。优选地,最终答案信息包括但不限于以下至少一项:
1)纯文本信息。
如一段纯文本描述等。
2)纯多媒体信息。
如语音、视频等。
3)具有扩展标签的多媒体信息。
如包含链接的文本、视频、网页等。
4)可执行信息。
所述可执行信息可被用户设备运行;优选地,可执行信息包含函数和指令等。
具体地,第三获取装置5可根据参数信息来对初始答案信息进行补充,且第三获取装置5可直接将补充后的初始答案信息作为最终答案信息,也可运行将补充后的初始答案信息,并将运行结果作为最终答案信息。
例如,初始答案信息包括纯文本“你今天心情X”,其中,X表示形容词类的缺省项,且第二获取装置4获得的参数信息为“很好”,则第三获取装置5将补充后的初始答案信息“你今天心情很好”,直接作最终答案信息来发送给用户设备。
又例如,初始答案信息包括可执行信息,该可执行信息中包括时间类的缺省项,且第二获取装置4获得的参数信息为“今天”,则第三获取装置5根据该时间参数信息对初始答案信息进行补充后,获得完整的可执行信息,并运行该可执行信息来获得与时间参数“今天”相应的信息最为最终答案信息,并发送给用户设备。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据参数信息,对初始答案信息进行处理,获得用于提供给用户设备的最终答案信息的实现方式,均应包含在本发明的范围内。
需要说明的是,当判断所获得的初始答案信息能够被直接提供给所述用户设备时,问答装置中的发送装置(图未示)可直接将初始答案信息发送给所述用户设备,以供用户设备将其呈现给用户。
作为本实施例的优选方案之一,预定知识库包含语义匹配信息,且一组语义匹配信息对应的初始答案信息可具有多个,则问答装置还包括在查询装置3之后执行操作的选择装置(图未示),改选择装置根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息;第二获取装置4进一步包括参数获取装置(图未示),当判断所选择的初始答案信息不能被直接提供给所述用户设备时,参数获取装置从分词的语义信息中获得参数信息。
其中,所述用户设备的设备信息包括任何能够影响答案信息的显示的设备信息。例如,用户设备的类别,如手机、电视机等;又例如,用户设备支持的显示格式信息等;又例如,用户设备当前的网络信息,如移动网络或Wi-Fi等。
其中,所述应用信息包括任何与答案信息在应用中的显示相关的信息。例如,应用名称或平台,如MSN、短信、微博、微信等;又例如,应用支持的代码格式等。
具体地,选择装置根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择适用于用户设备和/或应用的初始答案信息。
例如,多个初始答案信息中包括纯文本信息和具有扩展标签的多媒体信息,则若用户设备当前连接至Wi-Fi,选择装置选择具有扩展标签的多媒体信息作为初始答案信息,若用户设备当前连接至移动网络,则选择装置选择纯文本信息作为初始答案信息。
又例如,多个初始答案信息中包括使用与多个平台的可执行信息,则如发送文本序列的应用为微博,选择装置选择微博支持的可执行信息作为初始答案信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息的实现方式,均应包含在本发明的范围内。
本实施例中,通过对文本序列进行更好的语义理解,能够提供更准确的答案信息。
图4为本发明一个优选实施例的创建本体实例的问答装置的结构示意图。本实施例的问答装置可包含于计算机设备中,该问答装置包括第四获取装置6和实例生成装置7。本实施例中,预定知识库包括本体实例,所述本体实例的至少一个属性中的每个属性包括一组语义匹配信息和与该语义匹配信息对应的初始答案信息。需要说明的是,一个本体示例可具有多个属性,每个属性还可包括其他信息,如标准问题、属性类型等。
第四获取装置6获取一个本体的实例项,其中,所述本体的至少一个属性中的每个属性包括本体答案信息以及具有缺省项的一组语义匹配信息。优选地,本体答案信息也可具有缺省项。
其中,本体的实例项表示该本体的缺省项的一个具体实例。例如,本体的一组语义匹配信息中的缺省项为XX,如“[XX]资费”,则作为XX的一个具体实例,本体的实例项为“3G”。
其中,第四获取装置6可采用多种方式来获得本体的实例项。如获得人工输入或已预先存储的实例项等。
实例生成装置7根据本体的实例项,对所述本体的属性中的缺省项进行处理,获得继承所述本体的全部属性的本体实例。
例如,本体的属性包括本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[XXX][收费|付费|计费][方法]”、“[XXX][多少钱]”、“[XXX][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“XXX贵吗”,本体的实例项为“神州行”,则实例生成装置7将本体的实例项补充至本体属性的各个缺省项中,获得继承本体的全部属性,如继承本体的全部语义匹配信息,的本体实例,该本体实例的属性包括作为初始答案信息的本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[神州行][收费|付费|计费][方法]”、“[神州行][多少钱]”、“[神州行][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“神州行贵吗”。
优选地,若本体答案信息具有缺省项,则实例生成装置7还可根据本体的实例项,对所述本体答案信息中的缺省项进行处理,获得初始答案信息。
需要说明的是,一个本体若为另一个本体的子本体,则该子本体也可继承其所属本体的所有属性。该实现方式与第四获取装置6和实例生成装置7执行的操作相似,故不再赘述。
本实施例中,对于具有相似属性的大量本体实例,无需针对每个本体实例重复性地建立属性,而可通过继承本体的所有属性的方式,简便地创建新的本体实例,大大减轻了本体实例创建过程中的资源消耗。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (21)

1.一种在计算机设备中用于获得答案信息的方法,其中,该方法包括以下步骤:
a获取来自用户设备的待处理的文本序列;
b对所述文本序列进行分词,并获得其至少一个分词的语义信息;
c根据所述语义信息,在预定知识库中进行匹配查询,确定所述语义信息对应的初始答案信息;
其中,该方法还包括以下步骤:
d当判断所述初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息;
e根据所述参数信息,对所述初始答案信息进行处理,获得用于提供给所述用户设备的最终答案信息。
2.根据权利要求1所述的方法,其中,所述步骤c包括以下步骤:
-将所述语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息,其中,每组语义匹配信息包括一个或多个语义匹配结构。
3.根据权利要求2所述的方法,其中,所述语义匹配结构包括以下至少一项:
-多个词汇以及该多个词汇中至少一个词汇的语义信息;
-所述多个词汇之间的逻辑关系。
4.根据权利要求2或3所述的方法,其中,一组语义匹配信息对应的初始答案信息具有多个,该方法在所述步骤c之后还包括以下步骤:
-根据所述用户设备的设备信息和/或发送所述文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息;
其中,所述步骤d包括以下步骤:
-当判断所选择的初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息。
5.根据权利要求2至4中任一项所述的方法,其中,所述预定知识库包括本体实例,所述本体实例的至少一个属性中的每个包括一组语义匹配信息和与该语义匹配信息对应的初始答案信息,该方法还包括以下步骤:
x获取一个本体的实例项,其中,所述本体的至少一个属性中的每个包括本体答案信息以及具有缺省项的一组语义匹配信息;
y根据所述实例项,对所述本体的属性中的缺省项进行处理,获得继承所述本体的全部属性的本体实例。
6.根据权利要求1所述的方法,其中,所述步骤c包括以下步骤:
c1当所述文本序列符合预定触发条件时,获取所述用户设备的历史查询信息;
c2结合所述历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
7.根据权利要求6所述的方法,其中,所述历史查询信息包括来自所述用户设备的文本序列的历史语义信息,所述步骤c2包括以下步骤:
-根据所述历史语义信息,对所述语义信息进行语义补充;
-根据语义补充后的语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
8.根据权利要求1至7中任一项所述的方法,其中,所述最终答案信息包括以下至少一项:
-可执行信息;
-具有扩展标签的多媒体信息。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括以下步骤:
-当判断所述初始答案信息能够被直接提供给所述用户设备时,将所述初始答案信息发送给所述用户设备。
10.根据权利要求1至9中任一项所述的方法,其中,所述语义信息包括以下至少一项:
-分词的同义词和/或同义词组合;
-分词的同类词和/或同类词组合;
-与分词具有相同或相似结构的实体。
11.一种在计算机设备中用于获得答案信息的问答装置,其中,该问答装置包括:
第一获取装置,用于获取来自用户设备的待处理的文本序列;
语义装置,用于对所述文本序列进行分词,并获得其至少一个分词的语义信息;
查询装置,用于根据所述语义信息,在预定知识库中进行匹配查询,确定所述语义信息对应的初始答案信息;
第二获取装置,用于当判断所述初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息;
第三获取装置,用于根据所述参数信息,对所述初始答案信息进行处理,获得用于提供给所述用户设备的最终答案信息。
12.根据权利要求11所述的问答装置,其中,所述查询装置包括:
第一子查询装置,用于将所述语义信息与所述预定知识库中的多组语义匹配信息进行匹配查询,并将匹配得到的一组语义匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息,其中,每组语义匹配信息包括一个或多个语义匹配结构。
13.根据权利要求12所述的问答装置,其中,所述语义匹配结构包括以下至少一项:
-多个词汇以及该多个词汇中至少一个词汇的语义信息;
-所述多个词汇之间的逻辑关系。
14.根据权利要求12或13所述的问答装置,其中,一组语义匹配信息对应的初始答案信息具有多个,该问答装置还包括在所述查询装置之后执行操作的以下装置:
选择装置,用于根据所述用户设备的设备信息和/或发送所述文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息;
其中,所述第二获取装置包括:
参数获取装置,用于当判断所选择的初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息。
15.根据权利要求12至14中任一项所述的问答装置,其中,所述预定知识库包括本体实例,所述本体实例的至少一个属性中的每个包括一组语义匹配信息和与该语义匹配信息对应的初始答案信息,该问答装置还包括以下步骤:
第四获取装置,用于获取一个本体的实例项,其中,所述本体的至少一个属性中的每个包括本体答案信息以及具有缺省项的一组语义匹配信息;
实例生成装置,用于根据所述实例项,对所述本体的属性中的缺省项进行处理,获得继承所述本体的全部属性的本体实例。
16.根据权利要求11所述的问答装置,其中,所述查询装置包括:
历史获取装置,用于当所述文本序列符合预定触发条件时,获取所述用户设备的历史查询信息;
第二子查询装置,用于结合所述历史查询信息以及所述语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
17.根据权利要求16所述的问答装置,其中,所述历史查询信息包括来自所述用户设备的文本序列的历史语义信息,所述第二子查询装置包括:
补充装置,用于根据所述历史语义信息,对所述语义信息进行语义补充;
第三子查询装置,用于根据语义补充后的语义信息,在预定知识库中进行匹配查询,确定所述初始答案信息。
18.根据权利要求11至17中任一项所述的问答装置,其中,所述最终答案信息包括以下至少一项:
-可执行信息;
-具有扩展标签的多媒体信息。
19.根据权利要求11至18中任一项所述的问答装置,其中,该问答装置还包括:
发送装置,用于当判断所述初始答案信息能够被直接提供给所述用户设备时,将所述初始答案信息发送给所述用户设备。
20.根据权利要求11至19中任一项所述的问答装置,其中,所述语义信息包括以下至少一项:
-分词的同义词和/或同义词组合;
-分词的同类词和/或同类词组合;
-与分词具有相同或相似结构的实体。
21.一种计算机设备,包括如权利要求11至20中至少一项所述的问答装置。
CN201410117635.XA 2014-03-26 2014-03-26 一种用于获得答案信息的方法、装置和设备 Active CN104951456B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410117635.XA CN104951456B (zh) 2014-03-26 2014-03-26 一种用于获得答案信息的方法、装置和设备
CN201810677005.6A CN108984650B (zh) 2014-03-26 2014-03-26 计算机可读记录介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410117635.XA CN104951456B (zh) 2014-03-26 2014-03-26 一种用于获得答案信息的方法、装置和设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201810677005.6A Division CN108984650B (zh) 2014-03-26 2014-03-26 计算机可读记录介质及计算机设备

Publications (2)

Publication Number Publication Date
CN104951456A true CN104951456A (zh) 2015-09-30
CN104951456B CN104951456B (zh) 2018-07-24

Family

ID=54166119

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810677005.6A Active CN108984650B (zh) 2014-03-26 2014-03-26 计算机可读记录介质及计算机设备
CN201410117635.XA Active CN104951456B (zh) 2014-03-26 2014-03-26 一种用于获得答案信息的方法、装置和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201810677005.6A Active CN108984650B (zh) 2014-03-26 2014-03-26 计算机可读记录介质及计算机设备

Country Status (1)

Country Link
CN (2) CN108984650B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653576A (zh) * 2015-12-16 2016-06-08 上海智臻智能网络科技股份有限公司 信息搜索的方法及装置、人工座席服务方法及系统
CN105912575A (zh) * 2016-03-31 2016-08-31 百度在线网络技术(北京)有限公司 文字信息推送方法和装置
CN106095988A (zh) * 2016-06-21 2016-11-09 上海智臻智能网络科技股份有限公司 自动问答方法及装置
CN106357942A (zh) * 2016-10-26 2017-01-25 广州佰聆数据股份有限公司 基于上下文对话语义识别的智能应答方法及系统
CN106980652A (zh) * 2017-03-03 2017-07-25 竹间智能科技(上海)有限公司 智能问答方法及系统
CN107526827A (zh) * 2017-09-01 2017-12-29 上海连尚网络科技有限公司 用于问答展示的方法、设备和计算机可读存储介质
CN107766567A (zh) * 2017-11-08 2018-03-06 北京交通大学 网络表的实体扩展方法
CN107943896A (zh) * 2017-11-16 2018-04-20 百度在线网络技术(北京)有限公司 信息处理方法和装置
CN108154735A (zh) * 2016-12-06 2018-06-12 爱天教育科技(北京)有限公司 英语口语测评方法及装置
CN108446322A (zh) * 2018-02-10 2018-08-24 灯塔财经信息有限公司 一种智能问答系统的实现方法和装置
CN108491506A (zh) * 2018-03-22 2018-09-04 上海连尚网络科技有限公司 用于推送问题答案组合的方法
CN109903754A (zh) * 2017-12-08 2019-06-18 北京京东尚科信息技术有限公司 用于语音识别的方法、设备和存储器设备
CN110929014A (zh) * 2019-12-09 2020-03-27 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN112347196A (zh) * 2019-08-06 2021-02-09 上海智臻智能网络科技股份有限公司 基于神经网络的实体关系抽取方法及装置
CN117076651A (zh) * 2023-10-16 2023-11-17 彩讯科技股份有限公司 交互信息的处理方法、装置、设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070168335A1 (en) * 2006-01-17 2007-07-19 Moore Dennis B Deep enterprise search
CN101398835A (zh) * 2007-09-30 2009-04-01 日电(中国)有限公司 基于自然语言的服务选择系统与方法以及服务查询系统与方法
CN102163229A (zh) * 2011-04-13 2011-08-24 北京百度网讯科技有限公司 一种用于生成搜索结果的摘要的方法与设备
CN103177039A (zh) * 2011-12-26 2013-06-26 中国移动通信集团北京有限公司 一种数据处理方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
CN100416570C (zh) * 2006-09-22 2008-09-03 浙江大学 一种基于问答库的中文自然语言问答方法
CN101079026B (zh) * 2007-07-02 2011-01-26 蒙圣光 文本相似度、词义相似度计算方法和系统及应用系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070168335A1 (en) * 2006-01-17 2007-07-19 Moore Dennis B Deep enterprise search
CN101398835A (zh) * 2007-09-30 2009-04-01 日电(中国)有限公司 基于自然语言的服务选择系统与方法以及服务查询系统与方法
CN102163229A (zh) * 2011-04-13 2011-08-24 北京百度网讯科技有限公司 一种用于生成搜索结果的摘要的方法与设备
CN103177039A (zh) * 2011-12-26 2013-06-26 中国移动通信集团北京有限公司 一种数据处理方法及装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653576A (zh) * 2015-12-16 2016-06-08 上海智臻智能网络科技股份有限公司 信息搜索的方法及装置、人工座席服务方法及系统
CN105912575A (zh) * 2016-03-31 2016-08-31 百度在线网络技术(北京)有限公司 文字信息推送方法和装置
CN105912575B (zh) * 2016-03-31 2020-05-15 百度在线网络技术(北京)有限公司 文字信息推送方法和装置
CN106095988A (zh) * 2016-06-21 2016-11-09 上海智臻智能网络科技股份有限公司 自动问答方法及装置
CN106357942A (zh) * 2016-10-26 2017-01-25 广州佰聆数据股份有限公司 基于上下文对话语义识别的智能应答方法及系统
CN108154735A (zh) * 2016-12-06 2018-06-12 爱天教育科技(北京)有限公司 英语口语测评方法及装置
CN106980652A (zh) * 2017-03-03 2017-07-25 竹间智能科技(上海)有限公司 智能问答方法及系统
CN106980652B (zh) * 2017-03-03 2020-09-08 竹间智能科技(上海)有限公司 智能问答方法及系统
CN107526827A (zh) * 2017-09-01 2017-12-29 上海连尚网络科技有限公司 用于问答展示的方法、设备和计算机可读存储介质
CN107766567B (zh) * 2017-11-08 2020-04-21 北京交通大学 网络表的实体扩展方法
CN107766567A (zh) * 2017-11-08 2018-03-06 北京交通大学 网络表的实体扩展方法
CN107943896A (zh) * 2017-11-16 2018-04-20 百度在线网络技术(北京)有限公司 信息处理方法和装置
CN109903754A (zh) * 2017-12-08 2019-06-18 北京京东尚科信息技术有限公司 用于语音识别的方法、设备和存储器设备
CN109903754B (zh) * 2017-12-08 2022-04-26 北京京东尚科信息技术有限公司 用于语音识别的方法、设备和存储器设备
CN108446322A (zh) * 2018-02-10 2018-08-24 灯塔财经信息有限公司 一种智能问答系统的实现方法和装置
CN108491506A (zh) * 2018-03-22 2018-09-04 上海连尚网络科技有限公司 用于推送问题答案组合的方法
CN112347196A (zh) * 2019-08-06 2021-02-09 上海智臻智能网络科技股份有限公司 基于神经网络的实体关系抽取方法及装置
CN112347196B (zh) * 2019-08-06 2023-05-23 上海智臻智能网络科技股份有限公司 基于神经网络的实体关系抽取方法及装置
CN110929014A (zh) * 2019-12-09 2020-03-27 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN110929014B (zh) * 2019-12-09 2023-05-23 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN117076651A (zh) * 2023-10-16 2023-11-17 彩讯科技股份有限公司 交互信息的处理方法、装置、设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN108984650B (zh) 2020-10-16
CN108984650A (zh) 2018-12-11
CN104951456B (zh) 2018-07-24

Similar Documents

Publication Publication Date Title
CN104933084A (zh) 一种用于获得答案信息的方法、装置和设备
CN104951456A (zh) 一种用于获得答案信息的方法、装置和设备
CN103377652B (zh) 一种用于进行语音识别的方法、装置和设备
CN110268431A (zh) 对消息内容的搜索和过滤
CN104579909B (zh) 一种用户信息的分类、用户分组信息的获取方法和设备
CN104243273A (zh) 即时通讯客户端显示信息的方法及设备和信息显示系统
US8020051B2 (en) Message handling in a service-oriented architecture
CN112818224B (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN108702368A (zh) 将附加信息集成到电信呼叫中
EP2815561A1 (en) Methods and systems for displaying microblog topics
CN107729396B (zh) 数据动态查询方法及装置
CN106971004B (zh) 搜索结果提供方法及装置
CN111401044A (zh) 一种标题生成方法、装置、终端设备及存储介质
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN108140055A (zh) 触发应用信息
CN108874808A (zh) 一种页面元素联动方法、装置及服务器
CN105426384A (zh) 一种生成建议目标地点的方法和装置
CN105589680A (zh) 信息显示方法、提供方法及装置
CN107066271B (zh) 一种显示对象的层级管理方法及系统
CN105450516A (zh) 链接路由方法、电子系统及其电子设备和服务器
CN107330069B (zh) 一种多媒体数据处理方法及其装置、服务器、存储介质
CN105138576A (zh) 一种用于在移动搜索中提供推荐输入序列的方法和装置
CN108256957A (zh) 基于用户历史行为的车源搜索结果的展现方法及装置
CN105988992A (zh) 图标推送方法及装置
CN105069064B (zh) 词汇的获取方法及装置、推送方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 201803 Shanghai Jiading District Jinsha Road, Lane 1555, No. 7, layer 398,

Applicant after: SHANGHAI ZHIZHEN INTELLIGENT NETWORK SCIENCE & TECHNOLOGY CO., LTD.

Address before: 201803 Shanghai Jiading District Jinsha Road, Lane 1555, No. 7, layer 398,

Applicant before: Shanghai Zhizhen Network Technology Co., Ltd.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant