CN109308357B - 一种用于获得答案信息的方法、装置和设备 - Google Patents

一种用于获得答案信息的方法、装置和设备 Download PDF

Info

Publication number
CN109308357B
CN109308357B CN201811122621.1A CN201811122621A CN109308357B CN 109308357 B CN109308357 B CN 109308357B CN 201811122621 A CN201811122621 A CN 201811122621A CN 109308357 B CN109308357 B CN 109308357B
Authority
CN
China
Prior art keywords
information
semantic
sub
matching
libraries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811122621.1A
Other languages
English (en)
Other versions
CN109308357A (zh
Inventor
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiaoi Robot Technology Co Ltd
Original Assignee
Shanghai Xiaoi Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xiaoi Robot Technology Co Ltd filed Critical Shanghai Xiaoi Robot Technology Co Ltd
Priority to CN201811122621.1A priority Critical patent/CN109308357B/zh
Publication of CN109308357A publication Critical patent/CN109308357A/zh
Application granted granted Critical
Publication of CN109308357B publication Critical patent/CN109308357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本发明提供一种用于获得答案信息的方法、装置和设备。本发明能够获取来自用户设备的待处理的文本序列;对所述文本序列进行分词,并获得其至少一个分词的语义信息;根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息;将基于所述初始答案信息的最终答案信息提供给所述用户设备。本发明通过对文本序列进行更好的语义理解,能够提供更准确的答案信息。

Description

一种用于获得答案信息的方法、装置和设备
本申请是申请日为2015年5月4日,申请号为201510225400.7,发明创造名称为“一种用于获得答案信息的方法、装置和设备”的分案申请。
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于获得答案信息的方法、装置和设备。
背景技术
现有技术中的问答系统,往往直接基于用户提出的问题的文本信息,来向用户提供答案。然而,自然语言十分复杂,现有技术的这种答案提供方式,很容易受到用户提出的问题的表达形式的影响。
发明内容
本发明的目的是提供一种用于获得答案信息的方法、装置和设备。
根据本发明的一个方面,提供了一种在计算机设备中用于基于预定知识库来获得答案信息的问答装置,其中,所述预定知识库包括多个子库,该问答装置包括:
第一获取装置,用于获取来自用户设备的待处理的文本序列;
语义装置,用于对所述文本序列进行分词,并获得其至少一个分词的语义信息;
查询装置,用于根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息;
第一提供装置,用于将基于所述初始答案信息的最终答案信息提供给所述用户设备;
其中,该问答装置还包括在所述查询装置之前执行操作的以下装置:
第一确定装置,用于根据所述语义信息,确定所述多个子库的优先级,从而针对不同的语义,所述多个子库的优先级可被调整,以使所述多个子库的优先级设定更符合实际的语义情况,其中,所述根据所述语义信息,确定所述多个子库的优先级的操作包括:根据分词所属的类别,并结合预先确定的、在不同类别下的子库的优先级,确定所述多个子库的优先级;或者,根据所述语义信息中是否包含符合特定结构的实体,来调整子库的预定优先级,以确定所述多个子库的优先级;
所述查询装置包括:
第一子查询装置,用于根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息,其中,每组语义匹配信息包括一个或多个语义匹配结构。
根据本发明的另一个方面,还提供了一种在计算机设备中用于基于预定知识库来获得答案信息的方法,其中,所述预定知识库包括多个子库,该方法包括以下步骤:
a.获取来自用户设备的待处理的文本序列;
b.对所述文本序列进行分词,并获得其至少一个分词的语义信息;
c.根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息;
d.将基于所述初始答案信息的最终答案信息提供给所述用户设备;
其中,该方法在所述步骤c之前还包括以下步骤:
-根据所述语义信息,确定所述多个子库的优先级,从而针对不同的语义,所述多个子库的优先级可被调整,以使所述多个子库的优先级设定更符合实际的语义情况,其中,所述根据所述语义信息,确定所述多个子库的优先级的操作包括:根据分词所属的类别,并结合预先确定的、在不同类别下的子库的优先级,确定所述多个子库的优先级;或者,根据所述语义信息中是否包含符合特定结构的实体,来调整子库的预定优先级,以确定所述多个子库的优先级;
所述步骤c包括以下步骤:
c1根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息,其中,每组语义匹配信息包括一个或多个语义匹配结构。
与现有技术相比,本发明具有以下优点:1)通过对文本序列进行更好的语义理解,能够提供更准确的答案信息;2)通过基于优先级依次在子库中进行查询,能够尽量减少匹配查询带来的资源消耗;3)能够基于来自用户的文本序列获得参数,从而对提供给用户的答案信息进行补充,以使提供给用户的答案信息适应于用户的问题而变化;4)当获得匹配度较高的答案信息时,可直接锁定该答案信息并终止继续匹配查询,从而减少资源消耗,当获得多个匹配度尚可的答案信息时,可通过询问用户,来确定用户希望获得的答案;5)针对不同的语义,子库的优先级可被调整,以使子库的优先级更设定更符合实际的语义情况;6)能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解;此外,通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能;7)对于具有相似属性的大量本体实例,无需针对每个本体实例重复性地建立属性,而可通过继承本体的所有属性的方式,简便地创建新的本体实例,大大减轻了本体实例创建过程中的资源消耗。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个优选实施例的获得答案信息的方法流程图;
图2为本发明一个优选实施例的创建本体实例的方法流程图;
图3为本发明一个优选实施例的获得答案信息的问答装置的结构示意图;
图4为本发明一个优选实施例的创建本体实例的问答装置的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个优选实施例的获得答案信息的方法流程图。其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括但不限于网络设备和用户设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述计算机设备和网络仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
根据本实施例的、用于基于预定知识库来获得答案信息的方法包括下述步骤S1、步骤S2、步骤S3和步骤S4。
在步骤S1中,计算机设备获取来自用户设备的待处理的文本序列。
其中,该待处理的文本序列可为用户直接输入的文本序列,也可为对用户输入的语音进行识别后所得的文本序列。
例如,用户在对话框中输入“今天天气如何”,并按下发送按键以指示用户设备将“今天天气如何”发送给计算机设备,则“今天天气如何”即为来自用户设备的待处理的文本序列。
又例如,用户在某个应用中输入一段语音,该段语音被该应用经由互联网发送给计算机设备,计算机设备识别该语音并获得文本序列“今天天气如何”,则“今天天气如何”即为来自用户设备的待处理的文本序列。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取来自用户设备的待处理的文本序列的实现方式,均应包含在本发明的范围内。
接着,在步骤S2中,计算机设备对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
其中,分词的语义信息包括任何能够被计算机识别并用于表示该分词的语义的信息。优选地,分词的语义信息包括但不限于以下至少一项:
1)分词的同义词和/或同义词组合。
例如,分词“天气”的语义信息包括其同义词“气候”等。
2)分词的同类词和/或同类词组合。
其中,分词的同类词表示与该分词属于同一类别的词汇。如若分词属于地名,则该分词的同类词可包括其他地名。
例如,分词“上海”的语义信息可包括“北京”、“天津”等。
3)与分词具有相同或相似结构的实体。
其中,与分词具有相同或相似结构的实体表示该实体的信息结构与分词相同或相似。优选地,该实体可为特殊语义表达式。
例如,分词为一个特定时间结构“2013年1月1日10点45分”,则与分词具有相同或相似结构的实体可为一个日期语义表达式“XXXX年XX月XX日XX点XX分”等。该等类似的特殊语义表达式还可包括人名、地址、电话号码等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何能够被计算机识别并用于表示一个分词的语义的信息,均应包含在本发明的该分词的语义信息的范围内。
具体地,计算机设备可采用多种方式,来对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
例如,计算机设备可采用多种方式来对待处理的文本序列进行分词,并将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而将成功匹配的词汇的语义信息作为分词的语义信息等。
又例如,在上例中,在将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而确定成功匹配的词汇对应的语义信息后,还可进一步结合分词在待处理的文本序列中的语境,对成功匹配的词汇对应的语义信息进行处理,从而确定分词的语义信息等。
需要说明的是,计算机设备可获取待处理的文本序列的所有分词中每个分词的语义信息;或者,计算机设备可仅获取待处理的文本序列的部分分词中每个分词的语义信息。特别是一些无意义的分词,计算机设备可不获取该等分词的语义信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待处理的文本序列进行分词,并获得其至少一个分词的语义信息的实现方式,均应包含在本发明的范围内。
在步骤S3中,计算机设备根据所述语义信息,按照预定知识库中包含的多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
其中,所述预定知识库中的子库包括用于与分词的语义信息进行匹配的匹配信息,且匹配信息与初始答案信息具有对应关系。则计算机设备可通过将分词的语义信息与匹配信息进行匹配查询,来确定各个分词的语义信息对应的初始答案信息。需要说明的是,作为一种优选方案,所述匹配信息可以是肯定式匹配信息,也可以是否定式匹配信息;所述肯定式匹配信息表示若分词的语义信息与该肯定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该肯定式匹配信息所对应的初始答案信息的可能性越高;所述否定式匹配信息表示若分词的语义信息与该否定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该否定式匹配信息所对应的初始答案信息的可能性越低。
其中,所述初始答案信息包括但不限于:
1)能够被直接提供给用户的答案信息,其可以是完整地、能够直接呈现给用户或者经用户设备运行后呈现给用户的答案信息。
例如,纯文本、纯多媒体信息、具有扩展标签的多媒体信息、可执行信息等;其中,所述扩展标签表示可供用户选择(如被用户点击)以链接其他信息的标签,所述可执行信息包括任何能够被用户设备运行的信息,如函数和指令等。
2)不能被直接提供给用户的答案信息,其可以是不完整的、需要进一步补充后才能呈现给用户或经用户设备运行后呈现给用户的答案信息。
例如,具有缺省项的纯文本、具有缺省项的纯多媒体信息、具有缺省扩展标签的多媒体信息、具有缺省参数的可执行信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何通过语义匹配能够获得的答案信息,均应包含在本发明的初始答案信息的范围内。
其中,所述预定知识库的多个子库的优先级预先已被确定;或者,计算机设备可采用多种方式,根据所述语义信息,确定所述多个子库的优先级。例如,计算机设备可根据分词所属的类别,并结合预先确定的、在不同类别下的子库的优先级,确定步骤S3中使用的子库的优先级。又例如,计算机设备可根据语义信息中是否包含符合特定结构的实体,来调整子库的预定优先级,以获得步骤S3中使用的子库的优先级等。由此,针对不同的语义,子库的优先级可被调整,以使子库的优先级更设定更符合实际的语义情况。
优选地,计算机设备首先在优先级最高的子库中进行匹配查询,当能够查询到初始答案信息时,则不再进一步查询;当不能获得初始答案信息时,在优先级次高的一个或多个子库中进行查询;如此重复,直至能够查询到初始答案信息。
优选地,计算机设备根据所述语义信息,按照预定知识库中包含的多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息的实现方式包括但不限于:
1)子库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。计算机设备按照多个子库的优先级的由高至低,依次在多个子库的至少一个子库中,将各个分词的语义信息与依次与子库中的匹配信息进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息。
例如,在步骤S2中获得待处理的文本信息“10元本地流量包怎么样”的分词“10元本地流量包”和“怎么样”以及两者分别对应的语义信息。计算机设备首先在优先级最高的一个子库中,将两者的语义信息与该子库中的匹配信息进行匹配,并未获得相匹配的匹配信息。接着,计算机设备在优先级次高的一个子库中,将两者的语义信息与该子库中的匹配信息进行匹配,并确定两者的语义信息与三个语句“10元本地流量包提供的服务是什么”、“我想问一下,你知道10元本地流量包吗”、“10元本地流量包能给我什么服务”构成的一组匹配信息相匹配,则计算机设备将该组匹配信息对应的纯文本信息“10元本地流量包是针对XX用户推出的流量优惠活动,您只需支付10元月费,即可享受……”,作为与分词“10元本地流量包”以及“怎么样”的语义信息对应的初始答案信息。
2)计算机设备根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息。
其中,每组语义匹配信息包括一个或多个语义匹配结构。其中,一个语义匹配结构可表现为一个语义表达式。优选地,该语义匹配结构包括但不限于以下至少一项:a)多个词汇以及该多个词汇中至少一个词汇的语义信息,其中,一个词汇的语义信息与一个分词的语义信息相类似,在此不再赘述;b)所述多个词汇之间的逻辑关系,如该多个词汇之间的先后顺序关系、限定关系(如一个词汇为另一个词汇的修饰词)等。
例如,一组语义匹配信息包括以下三个语义匹配结构“[日期相关?][雨种类][对于][天气地区名][有没有][影响]”、“[天气地区名][天气相关][还是][雨种类]”和“[查询?][天气地区名][日期相关|@时间?][是否?][需要|可以?][带伞]”。其中,“|”表示逻辑或,每个“[]”中的内容表示一个词汇和/或该词汇的语义信息,如“带伞”为一个词汇,“天气地区名”指代地区类词汇的特殊表达式等。
优选地,可用一个标准问题来表示与一组语义匹配信息中的所有语义匹配信息相近的自然语言含义,该标准问题可包含在预定知识库中,以便操作人员理解一组语义匹配信息表达的语义。例如,上例中包含该三个语义匹配结构的一组语义匹配信息的标准问题可为“今天会下雨么?”
优选地,每组语义匹配信息还可包括各个语义匹配结构的类型,即肯定式语义匹配结构和否定式语义匹配结构。所述肯定式语义匹配结构表示若分词的语义信息与该肯定式语义匹配结构相匹配或匹配度越高,则语义信息的初始答案信息为该肯定式语义匹配结构所属语义匹配信息所对应的初始答案信息的可能性越高;所述否定式语义匹配结构表示若分词的语义信息与该否定式语义匹配结构相匹配或匹配度越高,则语义信息的初始答案信息为该否定式语义匹配结构所属语义匹配信息所对应的初始答案信息的可能性越低。
具体地,计算机设备根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将各个分词的语义信息与该子库中的多组语义匹配信息分别进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息。
例如,首先,在优先级最高的子库中,计算机设备对多组语义匹配信息中的每组语义匹配信息进行以下操作:对于该组语义匹配信息中的每个语义匹配结构,计算机设备将各个分词的语义信息分别与该语义匹配结构中的各个词汇和/或词汇的语义信息进行匹配,并结合语义匹配结构中各个词汇之间的逻辑关系,确定各个分词的语义信息与该语义匹配结构的匹配程度,由此,计算机设备确定各个分词的语义信息与该组语义匹配信息的匹配程度。从而,计算机设备能够根据各个分词的语义信息与各组语义匹配信息之间的匹配程度,来确定一组语义匹配信息,并获得其对应的答案信息,作为所述语义信息对应的初始答案信息。
需要说明的是,本实现方式中,匹配信息可同时包括语义匹配信息以及其他匹配信息,如语句等。计算机设备将各个分词的语义信息与所述预定知识库中的多组语义匹配信息以及其他匹配信息进行匹配查询,并将匹配得到的一组匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
作为本实现方式2)的一个优选方案,若所确定的一组语义匹配信息仅对应一个答案信息,则该答案信息可直接作为初始答案信息;若所确定的一组语义匹配信息对应多个答案信息,则计算机设备从该多个答案信息中选择一个答案信息,作为初始答案信息。其中,计算机设备可采用多种方式来选择答案信息。例如,随机选择答案信息。
优选地,计算机设备根据所述用户设备的设备信息和/或发送所述文本序列的应用的应用信息,从所述多个初始答案信息中选择一个答案信息,作为所述最终答案信息所基于的初始答案信息。
其中,所述用户设备的设备信息包括任何能够影响答案信息的显示的设备信息。例如,用户设备的类别,如手机、电视机等;又例如,用户设备支持的显示格式信息等;又例如,用户设备当前的网络信息,如移动网络或Wi-Fi等。
其中,所述应用信息包括任何与答案信息在应用中的显示相关的信息。例如,应用名称或平台,如MSN、短信、微博、微信等;又例如,应用支持的代码格式等。
具体地,计算机设备根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择适用于用户设备和/或应用的初始答案信息。
例如,多个初始答案信息中包括纯文本信息和具有扩展标签的多媒体信息,则若用户设备当前连接至Wi-Fi,计算机设备选择具有扩展标签的多媒体信息作为初始答案信息,若用户设备当前连接至移动网络,则计算机设备选择纯文本信息作为初始答案信息。
又例如,多个初始答案信息中包括使用与多个平台的可执行信息,则如发送文本序列的应用为微博,则选择微博支持的可执行信息作为初始答案信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息的实现方式,均应包含在本发明的范围内。
需要说明的是,作为本实施例的一种优选方案,在前述实现方式1)和2)中,若在所述匹配查询中获得与所述语义信息的匹配度高于第一阈值的答案信息时,计算机设备直接将该答案信息作为所述初始答案信息,且优选地,本次匹配查询终止;若所述匹配查询完成后获得与所述语义信息的匹配度低于第一阈值且高于第二阈值的一个或多个答案信息,则计算机设备将该一个或多个答案信息的描述信息提供给所述用户设备,并将所述用户设备反馈的、与用户所选择的描述信息对应的答案信息作为所述初始答案信息,其中,第一阈值高于第二阈值。
例如,对于前述实现方式1),子库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。计算机设备按照多个子库的优先级的由高至低,依次在多个子库的至少一个子库中,将各个分词的语义信息与依次与子库中的匹配信息进行匹配查询;当在所述匹配查询中获得所对应的一组语句/词汇与所述语义信息的匹配度高于第一阈值的答案信息时,计算机设备直接将该答案信息作为所述初始答案信息,且优选地,本次匹配查询终止;若所述匹配查询完成后获得所对应的一组语句/词汇与所述语义信息的匹配度低于第一阈值且高于第二阈值的一个或多个答案信息,则计算机设备将该一个或多个答案信息的描述信息提供给所述用户设备,并将所述用户设备反馈的、与用户所选择的描述信息对应的答案信息作为所述初始答案信息
例如,对于前述实现方式2),计算机设备根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询;若在所述匹配查询中获得与所述语义信息的匹配度高于第一阈值的语义匹配信息时,计算机设备直接获得该语义匹配信息对应的答案信息作为所述初始答案信息,且优选地,本次匹配查询终止;若所述匹配查询完成后获得与所述语义信息的匹配度低于第一阈值且高于第二阈值的一组或多组语义匹配信息,则计算机设备将该一组或多组语义匹配信息对应的一个或多个答案信息的描述信息提供给所述用户设备,并将所述用户设备反馈的、与用户所选择的描述信息对应的答案信息作为所述初始答案信息。
本优选方案中,当获得匹配度较高的答案信息时,可直接锁定该答案信息并终止继续匹配查询,从而减少资源消耗;当获得多个匹配度尚可的答案信息时,可通过询问用户,来确定用户希望获得的答案。
在步骤S4中,计算机设备将基于所述初始答案信息的最终答案信息提供给所述用户设备。
其中,所述初始答案信息可直接作为最终答案信息。或者,计算机设备对所述初始答案信息进行处理,并获得最终答案信息。优选地,最终答案信息包括但不限于以下至少一项:
1)纯文本信息。
如一段纯文本描述等。
2)纯多媒体信息。
如语音、视频等。
3)具有扩展标签的多媒体信息。
如包含链接的文本、视频、网页等。
4)可执行信息。
所述可执行信息可被用户设备运行;优选地,可执行信息包含函数和指令等。
优选地,步骤S4进一步包括下述步骤S41、步骤S42和步骤S43。
在步骤S41中当判断所述初始答案信息不能被直接提供给所述用户设备时,计算机设备从所述语义信息中获得参数信息。其中,所述参数信息能够对初始答案信息进行补充。
其中,计算机设备可采用多种方式来判断初始答案信息是否能够被直接提供给用户设备。
例如,每个初始答案信息可对应一个标识,该标识用于指示初始答案信息是否能够被直接提供给用户设备。则当计算机设备获得初始答案信息后,可直接根据该标识来判断初始答案信息是否能够被直接提供给用户设备。
又例如,计算机设备通过判断初始答案信息对应的匹配信息的类别是否属于预定类别,或直接判断初始答案信息是否处于预定类别,来判断初始答案信息是否能够被直接提供给用户设备。如若初始答案信息或其对应的匹配信息属于天气类别,则判断其不能被直接提供给所述用户设备等。
又例如,计算机设备通过解析初始答案信息,并判断其是否具有缺省项,来判断初始答案信息是否能够被直接提供给用户设备。
其中,计算机设备可采用多种方式,来从分词的语义信息中获得参数信息。
例如,不能被直接提供给用户设备的初始答案信息中规定了其缺省项的相关信息,如缺省项的表达式等,则计算机设备根据该相关信息,从分词的语义信息中获取相应的参数信息。如基于待处理的文本序列“今天天气如何”获得的初始答案信息中规定了该初始答案信息的缺省项为地名或时间,则计算机设备在分词的语义信息中查询地名类或时间类的分词,并从时间类分词“今天”的语义信息中获得所需的时间参数信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断获得的初始答案信息不能被直接提供给所述用户设备时,从分词的语义信息中获得参数信息的实现方式,均应包含在本发明的范围内。
在步骤S42中,计算机设备根据所述参数信息,对所述初始答案信息进行处理,获得所述最终答案信息。
具体地,计算机设备可根据参数信息来对初始答案信息进行补充,且计算机设备可直接将补充后的初始答案信息作为最终答案信息,也可运行将补充后的初始答案信息,并将运行结果作为最终答案信息。
例如,初始答案信息包括纯文本“你今天心情X”,其中,X表示形容词类的缺省项,且在步骤S41中获得的参数信息为“很好”,则计算机设备将补充后的初始答案信息“你今天心情很好”,直接作最终答案信息来发送给用户设备。
又例如,初始答案信息包括可执行信息,该可执行信息中包括时间类的缺省项,且在步骤S41中获得的参数信息为“今天”,则计算机设备根据该时间参数信息对初始答案信息进行补充后,获得完整的可执行信息,并运行该可执行信息来获得与时间参数“今天”相应的信息最为最终答案信息,并发送给用户设备。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据参数信息,对初始答案信息进行处理,获得用于提供给用户设备的最终答案信息的实现方式,均应包含在本发明的范围内。
在步骤S43中,计算机设备将所述最终答案信息提供给所述用户设备。需要说明的是,当判断所获得的初始答案信息能够被直接提供给所述用户设备时,计算机设备可直接将初始答案信息作为最终答案信息发送给所述用户设备,以供用户设备将其呈现给用户。
本优选方案中,能够基于来自用户的文本序列获得参数,从而对提供给用户的答案信息进行补充,以使提供给用户的答案信息适应于用户的问题而变化。
作为本实施例的一种优选方案,本发明还包括步骤S5,前述步骤S3包括步骤S31。
在步骤S5中,当待处理的文本序列符合预定触发条件时,计算机设备获取提供该待处理的文本序列的用户设备的历史查询信息。
其中,所述预定触发条件可包括任何能够用于触发计算机设备获取用户设备的历史查询信息的条件。例如,待处理的文本序列符合预定格式和/或待处理的文本序列符合预定语义等。
其中,用户设备的历史查询信息包括但不限于:a)根据用户设备的历史文本序列获得的分词结果和/或历史语义信息等;b)用户设备的历史文本序列,如用户设备之前查询过的待处理的文本序列等,其中,可通过对该历史文本序列执行与步骤S2相同或相似的步骤,获得历史分词结果和历史语义信息。
其中,计算机设备可通过多种方式来识别一个用户设备。例如,根据用户的登录或注册信息来识别用户设备;又例如,根据用户设备中诸如cookie等记录信息来识别用户设备;又例如,根据用户设备的手机号或硬件标识码等,来识别用户设备。
在步骤S31中,计算机设备结合用户设备的历史查询信息以及所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
其中,计算机设备可采用多种方式,来结合历史查询信息以及所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
例如,计算机设备先根据历史查询信息来对语义信息进行补充,如历史查询信息包含用户的历史文本序列,则计算机设备将包含于历史文本序列中但不包含于当前处理的文本序列中的分词的语义信息补充入当前的语义信息中;接着,再根据补充后的语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
作为步骤S31的一个优选方案,用户设备的历史查询信息包括来自用户设备的文本序列的历史语义信息,则计算机设备根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充;并根据语义补充后的语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。优选地,计算机设备还可执行根据历史语义信息以及当前处理的文本序列的分词的语义信息(以下简称“当前语义信息”)来判断是否能够执行所述语义补充操作。
例如,计算机设备判断历史语义信息与当前语义信息中是否存在相类似的语义信息(如是否存在同义词、同类词或具有相似结构的实体等);当判断存在相类似的语义信息时,根据包含于历史语义信息且未包含于当前语义信息中的语义信息,对当前语义信息进行补充,从而根据补充后的语义信息,在预定知识库中进行匹配查询,确定初始答案信息。如作为一个更具体的示例,历史文本序列为“上海下雨么?”,其历史语义信息包括分词“上海”、“下雨”和“么”的语义信息,当前处理的文本序列为“北京呢?”,其语义信息包括分词“北京”和“呢”的语义信息;则计算机设备判断分词“上海”和“么”,与分词和“北京”和“呢”的语义信息相类似,并将包含于历史语义信息中且不包含于当前语义信息中的分词“下雨”的语义信息,补充入当前语义信息中。则语义补充后的语义信息包括“北京”、“下雨”和“呢”的语义信息。优选地,计算机设备还可在进一步判断历史语义信息与当前语义信息中是否存在相类似的语义信息,且该等相类似的语义信息之间的逻辑关系也相似的情况下,才执行语义补充的操作。
需要说明的是,本优选方案可与前述步骤S3的各个方案相结合。
本优选方案能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解;此外,通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能。
图2为本发明一个优选实施例的创建本体实例的方法流程图。本实施例的方法包括步骤S6和步骤S7。本实施例中,预定知识库中的子库包括本体实例,所述本体实例的至少一个属性中的每个属性包括一组语义匹配信息和与该语义匹配信息对应的初始答案信息。需要说明的是,一个本体示例可具有多个属性,每个属性还可包括其他信息,如标准问题、属性类型等。
在步骤S6中,计算机设备获取一个本体的实例项,其中,所述本体的至少一个属性中的每个属性包括本体答案信息以及具有缺省项的一组语义匹配信息。优选地,本体答案信息也可具有缺省项。
其中,本体的实例项表示该本体的缺省项的一个具体实例。例如,本体的一组语义匹配信息中的缺省项为XX,如“[XX]资费”,则作为XX的一个具体实例,本体的实例项为“3G”。
其中,计算机设备可采用多种方式来获得本体的实例项。如获得人工输入或已预先存储的实例项等。
在步骤S7中,计算机设备根据本体的实例项,对所述本体的属性中的缺省项进行处理,获得继承所述本体的全部属性的本体实例。
例如,本体的属性包括本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[XXX][收费|付费|计费][方法]”、“[XXX][多少钱]”、“[XXX][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“XXX贵吗”,本体的实例项为“神州行”,则计算机设备将本体的实例项补充至本体属性的各个缺省项中,获得继承本体的全部属性,如继承本体的全部语义匹配信息,的本体实例,该本体实例的属性包括作为初始答案信息的本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[神州行][收费|付费|计费][方法]”、“[神州行][多少钱]”、“[神州行][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“神州行贵吗”。
优选地,若本体答案信息具有缺省项,则计算机设备还可根据本体的实例项,对所述本体答案信息中的缺省项进行处理,获得初始答案信息。
需要说明的是,一个本体若为另一个本体的子本体,则该子本体也可继承其所属本体的所有属性。该实现方式与前述步骤S6和S7相似,故不再赘述。
本实施例中,对于具有相似属性的大量本体实例,无需针对每个本体实例重复性地建立属性,而可通过继承本体的所有属性的方式,简便地创建新的本体实例,大大减轻了本体实例创建过程中的资源消耗。
图3为本发明一个优选实施例的获得答案信息的问答装置的结构示意图。本实施例的问答装置可包含于计算机设备中,该问答装置包括第一获取装置1、语义装置2、查询装置3和第一提供装置4。
第一获取装置1获取来自用户设备的待处理的文本序列。
其中,该待处理的文本序列可为用户直接输入的文本序列,也可为对用户输入的语音进行识别后所得的文本序列。
例如,用户在对话框中输入“今天天气如何”,并按下发送按键以指示用户设备将“今天天气如何”发送给计算机设备,则“今天天气如何”即为来自用户设备的待处理的文本序列。
又例如,用户在某个应用中输入一段语音,该段语音被该应用经由互联网发送给计算机设备,计算机设备识别该语音并获得文本序列“今天天气如何”,则“今天天气如何”即为来自用户设备的待处理的文本序列。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取来自用户设备的待处理的文本序列的实现方式,均应包含在本发明的范围内。
接着,语义装置2对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
其中,分词的语义信息包括任何能够被计算机识别并用于表示该分词的语义的信息。优选地,分词的语义信息包括但不限于以下至少一项:
1)分词的同义词和/或同义词组合。
例如,分词“天气”的语义信息包括其同义词“气候”等。
2)分词的同类词和/或同类词组合。
其中,分词的同类词表示与该分词属于同一类别的词汇。如若分词属于地名,则该分词的同类词可包括其他地名。
例如,分词“上海”的语义信息可包括“北京”、“天津”等。
3)与分词具有相同或相似结构的实体。
其中,与分词具有相同或相似结构的实体表示该实体的信息结构与分词相同或相似。优选地,该实体可为特殊语义表达式。
例如,分词为一个特定时间结构“2013年1月1日10点45分”,则与分词具有相同或相似结构的实体可为一个日期语义表达式“XXXX年XX月XX日XX点XX分”等。该等类似的特殊语义表达式还可包括人名、地址、电话号码等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何能够被计算机识别并用于表示一个分词的语义的信息,均应包含在本发明的该分词的语义信息的范围内。
具体地,语义装置2可采用多种方式,来对待处理的文本序列进行分词,并获得其至少一个分词的语义信息。
例如,语义装置2可采用多种方式来对待处理的文本序列进行分词,并将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而将成功匹配的词汇的语义信息作为分词的语义信息等。
又例如,在上例中,在将所得分词与预先已获得的语义信息所对应的词汇进行匹配,从而确定成功匹配的词汇对应的语义信息后,还可进一步结合分词在待处理的文本序列中的语境,对成功匹配的词汇对应的语义信息进行处理,从而确定分词的语义信息等。
需要说明的是,语义装置2可获取待处理的文本序列的所有分词中每个分词的语义信息;或者,语义装置2可仅获取待处理的文本序列的部分分词中每个分词的语义信息。特别是一些无意义的分词,计算机设备可不获取该等分词的语义信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待处理的文本序列进行分词,并获得其至少一个分词的语义信息的实现方式,均应包含在本发明的范围内。
查询装置3根据所述语义信息,按照预定知识库中包含的多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
其中,所述预定知识库中的子库包括用于与分词的语义信息进行匹配的匹配信息,且匹配信息与初始答案信息具有对应关系。则查询装置3可通过将分词的语义信息与匹配信息进行匹配查询,来确定各个分词的语义信息对应的初始答案信息。需要说明的是,作为一种优选方案,所述匹配信息可以是肯定式匹配信息,也可以是否定式匹配信息;所述肯定式匹配信息表示若分词的语义信息与该肯定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该肯定式匹配信息所对应的初始答案信息的可能性越高;所述否定式匹配信息表示若分词的语义信息与该否定式匹配信息相匹配或匹配度越高,则语义信息的初始答案信息为该否定式匹配信息所对应的初始答案信息的可能性越低。
其中,所述初始答案信息包括但不限于:
1)能够被直接提供给用户的答案信息,其可以是完整地、能够直接呈现给用户或者经用户设备运行后呈现给用户的答案信息。
例如,纯文本、纯多媒体信息、具有扩展标签的多媒体信息、可执行信息等;其中,所述扩展标签表示可供用户选择(如被用户点击)以链接其他信息的标签,所述可执行信息包括任何能够被用户设备运行的信息,如函数和指令等。
2)不能被直接提供给用户的答案信息,其可以是不完整的、需要进一步补充后才能呈现给用户或经用户设备运行后呈现给用户的答案信息。
例如,具有缺省项的纯文本、具有缺省项的纯多媒体信息、具有缺省扩展标签的多媒体信息、具有缺省参数的可执行信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何通过语义匹配能够获得的答案信息,均应包含在本发明的初始答案信息的范围内。
其中,所述预定知识库的多个子库的优先级预先已被确定;或者,问答装置中的第一确定装置(图未示)可采用多种方式,根据所述语义信息,确定所述多个子库的优先级。例如,第一确定装置可根据分词所属的类别,并结合预先确定的、在不同类别下的子库的优先级,确定查询装置3使用的子库的优先级。又例如,第一确定装置可根据语义信息中是否包含符合特定结构的实体,来调整子库的预定优先级,以获得查询装置3使用的子库的优先级等。由此,针对不同的语义,子库的优先级可被调整,以使子库的优先级更设定更符合实际的语义情况。
优选地,查询装置3首先在优先级最高的子库中进行匹配查询,当能够查询到初始答案信息时,则不再进一步查询;当不能获得初始答案信息时,在优先级次高的一个或多个子库中进行查询;如此重复,直至能够查询到初始答案信息。
优选地,查询装置3根据所述语义信息,按照预定知识库中包含的多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息的实现方式包括但不限于:
1)子库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。查询装置3按照多个子库的优先级的由高至低,依次在多个子库的至少一个子库中,将各个分词的语义信息与依次与子库中的匹配信息进行匹配查询,确定与各个分词的语义信息相对应的初始答案信息。
例如,语义装置2获得待处理的文本信息“10元本地流量包怎么样”的分词“10元本地流量包”和“怎么样”以及两者分别对应的语义信息。查询装置3首先在优先级最高的一个子库中,将两者的语义信息与该子库中的匹配信息进行匹配,并未获得相匹配的匹配信息。接着,查询装置3在优先级次高的一个子库中,将两者的语义信息与该子库中的匹配信息进行匹配,并确定两者的语义信息与三个语句“10元本地流量包提供的服务是什么”、“我想问一下,你知道10元本地流量包吗”、“10元本地流量包能给我什么服务”构成的一组匹配信息相匹配,则查询装置3将该组匹配信息对应的纯文本信息“10元本地流量包是针对XX用户推出的流量优惠活动,您只需支付10元月费,即可享受……”,作为与分词“10元本地流量包”以及“怎么样”的语义信息对应的初始答案信息。
2)查询装置3包括第一子查询装置(图未示)。第一子查询装置根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息。
其中,每组语义匹配信息包括一个或多个语义匹配结构。其中,一个语义匹配结构可表现为一个语义表达式。优选地,该语义匹配结构包括但不限于以下至少一项:a)多个词汇以及该多个词汇中至少一个词汇的语义信息,其中,一个词汇的语义信息与一个分词的语义信息相类似,在此不再赘述;b)所述多个词汇之间的逻辑关系,如该多个词汇之间的先后顺序关系、限定关系(如一个词汇为另一个词汇的修饰词)等。
例如,一组语义匹配信息包括以下三个语义匹配结构“[日期相关?][雨种类][对于][天气地区名][有没有][影响]”、“[天气地区名][天气相关][还是][雨种类]”和“[查询?][天气地区名][日期相关|@时间?][是否?][需要|可以?][带伞]”。其中,“|”表示逻辑或,每个“[]”中的内容表示一个词汇和/或该词汇的语义信息,如“带伞”为一个词汇,“天气地区名”指代地区类词汇的特殊表达式等。
优选地,可用一个标准问题来表示与一组语义匹配信息中的所有语义匹配信息相近的自然语言含义,该标准问题可包含在预定知识库中,以便操作人员理解一组语义匹配信息表达的语义。例如,上例中包含该三个语义匹配结构的一组语义匹配信息的标准问题可为“今天会下雨么?”
优选地,每组语义匹配信息还可包括各个语义匹配结构的类型,即肯定式语义匹配结构和否定式语义匹配结构。所述肯定式语义匹配结构表示若分词的语义信息与该肯定式语义匹配结构相匹配或匹配度越高,则语义信息的初始答案信息为该肯定式语义匹配结构所属语义匹配信息所对应的初始答案信息的可能性越高;所述否定式语义匹配结构表示若分词的语义信息与该否定式语义匹配结构相匹配或匹配度越高,则语义信息的初始答案信息为该否定式语义匹配结构所属语义匹配信息所对应的初始答案信息的可能性越低。
具体地,第一子查询装置根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将各个分词的语义信息与该子库中的多组语义匹配信息分别进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息。
例如,首先,在优先级最高的子库中,第一子查询装置对多组语义匹配信息中的每组语义匹配信息进行以下操作:对于该组语义匹配信息中的每个语义匹配结构,第一子查询装置将各个分词的语义信息分别与该语义匹配结构中的各个词汇和/或词汇的语义信息进行匹配,并结合语义匹配结构中各个词汇之间的逻辑关系,确定各个分词的语义信息与该语义匹配结构的匹配程度,由此,第一子查询装置确定各个分词的语义信息与该组语义匹配信息的匹配程度。从而,第一子查询装置能够根据各个分词的语义信息与各组语义匹配信息之间的匹配程度,来确定一组语义匹配信息,并获得其对应的答案信息,作为所述语义信息对应的初始答案信息。
需要说明的是,本实现方式中,匹配信息可同时包括语义匹配信息以及其他匹配信息,如语句等。第一子查询装置将各个分词的语义信息与所述预定知识库中的多组语义匹配信息以及其他匹配信息进行匹配查询,并将匹配得到的一组匹配信息对应的初始答案信息,作为所述语义信息对应的初始答案信息。
作为第一子查询装置的一个优选方案,第一子查询装置包括第二子查询装置(图未示)和选择装置(图未示)。若所确定的一组语义匹配信息仅对应一个答案信息,则该答案信息可直接作为初始答案信息;若所确定的一组语义匹配信息对应多个答案信息,则第一子查询装置从该多个答案信息中选择一个答案信息,作为初始答案信息。其中,第一子查询装置可采用多种方式来选择答案信息。例如,随机选择答案信息。
优选地,第一子查询装置包括第二子查询装置(图未示)和选择装置(图未示)。第二子查询装置根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息;选择装置根据所述用户设备的设备信息和/或发送所述文本序列的应用的应用信息,从所述多个初始答案信息中选择一个答案信息,作为所述最终答案信息所基于的初始答案信息。
其中,所述用户设备的设备信息包括任何能够影响答案信息的显示的设备信息。例如,用户设备的类别,如手机、电视机等;又例如,用户设备支持的显示格式信息等;又例如,用户设备当前的网络信息,如移动网络或Wi-Fi等。
其中,所述应用信息包括任何与答案信息在应用中的显示相关的信息。例如,应用名称或平台,如MSN、短信、微博、微信等;又例如,应用支持的代码格式等。
具体地,选择装置根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择适用于用户设备和/或应用的初始答案信息。
例如,多个初始答案信息中包括纯文本信息和具有扩展标签的多媒体信息,则若用户设备当前连接至Wi-Fi,选择装置选择具有扩展标签的多媒体信息作为初始答案信息,若用户设备当前连接至移动网络,则选择装置选择纯文本信息作为初始答案信息。
又例如,多个初始答案信息中包括使用与多个平台的可执行信息,则如发送文本序列的应用为微博,则选择微博支持的可执行信息作为初始答案信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据用户设备的设备信息和/或用户设备中发送待处理文本序列的应用的应用信息,从所述多个初始答案信息中选择初始答案信息的实现方式,均应包含在本发明的范围内。
需要说明的是,作为本实施例的一种优选方案,查询装置3进一步包括第二确定装置(图未示)、第二提供装置(图未示)和第三确定装置(图未示)。在前述实现方式1)和2)中,若在所述匹配查询中获得与所述语义信息的匹配度高于第一阈值的答案信息时,第二确定装置直接将该答案信息作为所述初始答案信息,且优选地,本次匹配查询终止;若所述匹配查询完成后获得与所述语义信息的匹配度低于第一阈值且高于第二阈值的一个或多个答案信息,则第二提供装置将该一个或多个答案信息的描述信息提供给所述用户设备,第三确定装置将所述用户设备反馈的、与用户所选择的描述信息对应的答案信息作为所述初始答案信息,其中,第一阈值高于第二阈值。
例如,对于前述实现方式1),子库中的匹配信息包括语句和/或词汇,且多个语句和/或词汇可构成一组来对应一个或多个初始答案信息。查询装置3按照多个子库的优先级的由高至低,依次在多个子库的至少一个子库中,将各个分词的语义信息与依次与子库中的匹配信息进行匹配查询;当在所述匹配查询中获得所对应的一组语句/词汇与所述语义信息的匹配度高于第一阈值的答案信息时,第二确定装置直接将该答案信息作为所述初始答案信息,且优选地,本次匹配查询终止;若所述匹配查询完成后获得所对应的一组语句/词汇与所述语义信息的匹配度低于第一阈值且高于第二阈值的一个或多个答案信息,则第二提供装置将该一个或多个答案信息的描述信息提供给所述用户设备,第三确定装置将所述用户设备反馈的、与用户所选择的描述信息对应的答案信息作为所述初始答案信息
例如,对于前述实现方式2),查询装置3根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询;若在所述匹配查询中获得与所述语义信息的匹配度高于第一阈值的语义匹配信息时,第二确定装置直接获得该语义匹配信息对应的答案信息作为所述初始答案信息,且优选地,本次匹配查询终止;若所述匹配查询完成后获得与所述语义信息的匹配度低于第一阈值且高于第二阈值的一组或多组语义匹配信息,则第二提供装置将该一组或多组语义匹配信息对应的一个或多个答案信息的描述信息提供给所述用户设备,第三确定装置将所述用户设备反馈的、与用户所选择的描述信息对应的答案信息作为所述初始答案信息。
本优选方案中,当获得匹配度较高的答案信息时,可直接锁定该答案信息并终止继续匹配查询,从而减少资源消耗;当获得多个匹配度尚可的答案信息时,可通过询问用户,来确定用户希望获得的答案。
第一提供装置4将基于所述初始答案信息的最终答案信息提供给所述用户设备。
其中,所述初始答案信息可直接作为最终答案信息。或者,第一提供装置4对所述初始答案信息进行处理,并获得最终答案信息。优选地,最终答案信息包括但不限于以下至少一项:
1)纯文本信息。
如一段纯文本描述等。
2)纯多媒体信息。
如语音、视频等。
3)具有扩展标签的多媒体信息。
如包含链接的文本、视频、网页等。
4)可执行信息。
所述可执行信息可被用户设备运行;优选地,可执行信息包含函数和指令等。
优选地,第一提供装置4进一步包括第三获取装置(图未示)、第四获取装置(图未示)和第三提供装置(图未示)。
当判断所述初始答案信息不能被直接提供给所述用户设备时,第三获取装置从所述语义信息中获得参数信息。其中,所述参数信息能够对初始答案信息进行补充。
其中,第三获取装置可采用多种方式来判断初始答案信息是否能够被直接提供给用户设备。
例如,每个初始答案信息可对应一个标识,该标识用于指示初始答案信息是否能够被直接提供给用户设备。则当第三获取装置获得初始答案信息后,可直接根据该标识来判断初始答案信息是否能够被直接提供给用户设备。
又例如,第三获取装置通过判断初始答案信息对应的匹配信息的类别是否属于预定类别,或直接判断初始答案信息是否处于预定类别,来判断初始答案信息是否能够被直接提供给用户设备。如若初始答案信息或其对应的匹配信息属于天气类别,则判断其不能被直接提供给所述用户设备等。
又例如,第三获取装置通过解析初始答案信息,并判断其是否具有缺省项,来判断初始答案信息是否能够被直接提供给用户设备。
其中,第三获取装置可采用多种方式,来从分词的语义信息中获得参数信息。
例如,不能被直接提供给用户设备的初始答案信息中规定了其缺省项的相关信息,如缺省项的表达式等,则第三获取装置根据该相关信息,从分词的语义信息中获取相应的参数信息。如基于待处理的文本序列“今天天气如何”获得的初始答案信息中规定了该初始答案信息的缺省项为地名或时间,则第三获取装置在分词的语义信息中查询地名类或时间类的分词,并从时间类分词“今天”的语义信息中获得所需的时间参数信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断获得的初始答案信息不能被直接提供给所述用户设备时,从分词的语义信息中获得参数信息的实现方式,均应包含在本发明的范围内。
第四获取装置根据所述参数信息,对所述初始答案信息进行处理,获得所述最终答案信息。
具体地,第四获取装置可根据参数信息来对初始答案信息进行补充,且第四获取装置可直接将补充后的初始答案信息作为最终答案信息,也可运行将补充后的初始答案信息,并将运行结果作为最终答案信息。
例如,初始答案信息包括纯文本“你今天心情X”,其中,X表示形容词类的缺省项,且第三获取装置获得的参数信息为“很好”,则第四获取装置将补充后的初始答案信息“你今天心情很好”,直接作最终答案信息。
又例如,初始答案信息包括可执行信息,该可执行信息中包括时间类的缺省项,且第三获取装置获得的参数信息为“今天”,则第四获取装置根据该时间参数信息对初始答案信息进行补充后,获得完整的可执行信息,并运行该可执行信息来获得与时间参数“今天”相应的信息最为最终答案信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据参数信息,对初始答案信息进行处理,获得用于提供给用户设备的最终答案信息的实现方式,均应包含在本发明的范围内。
第三提供装置将所述最终答案信息提供给所述用户设备。需要说明的是,当判断所获得的初始答案信息能够被直接提供给所述用户设备时,第一提供装置4可直接将初始答案信息作为最终答案信息发送给所述用户设备,以供用户设备将其呈现给用户。
本优选方案中,能够基于来自用户的文本序列获得参数,从而对提供给用户的答案信息进行补充,以使提供给用户的答案信息适应于用户的问题而变化。
作为本实施例的一种优选方案,问答装置还包括第五获取装置(图未示),查询装置3包括第三子查询装置(图未示)。
当待处理的文本序列符合预定触发条件时,第五获取装置获取提供该待处理的文本序列的用户设备的历史查询信息。
其中,所述预定触发条件可包括任何能够用于触发计算机设备获取用户设备的历史查询信息的条件。例如,待处理的文本序列符合预定格式和/或待处理的文本序列符合预定语义等。
其中,用户设备的历史查询信息包括但不限于:a)根据用户设备的历史文本序列获得的分词结果和/或历史语义信息等;b)用户设备的历史文本序列,如用户设备之前查询过的待处理的文本序列等,其中,可通过对该历史文本序列执行与语义装置2执行的相同或相似的操作,获得历史分词结果和历史语义信息。
其中,问答装置可通过多种方式来识别一个用户设备。例如,根据用户的登录或注册信息来识别用户设备;又例如,根据用户设备中诸如cookie等记录信息来识别用户设备;又例如,根据用户设备的手机号或硬件标识码等,来识别用户设备。
第三子查询装置结合用户设备的历史查询信息以及所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
其中,第三子查询装置可采用多种方式,来结合历史查询信息以及所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
例如,第三子查询装置先根据历史查询信息来对语义信息进行补充,如历史查询信息包含用户的历史文本序列,则第三子查询装置将包含于历史文本序列中但不包含于当前处理的文本序列中的分词的语义信息补充入当前的语义信息中;接着,再根据补充后的语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
作为第三子查询装置的一个优选方案,用户设备的历史查询信息包括来自用户设备的文本序列的历史语义信息,则第三子查询装置根据所述历史语义信息,对根据当前处理的文本序列的分词的语义信息进行语义补充;并根据语义补充后的语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。优选地,第三子查询装置还可执行根据历史语义信息以及当前处理的文本序列的分词的语义信息(以下简称“当前语义信息”)来判断是否能够执行所述语义补充操作。
例如,第三子查询装置判断历史语义信息与当前语义信息中是否存在相类似的语义信息(如是否存在同义词、同类词或具有相似结构的实体等);当判断存在相类似的语义信息时,根据包含于历史语义信息且未包含于当前语义信息中的语义信息,对当前语义信息进行补充,从而根据补充后的语义信息,在预定知识库中进行匹配查询,确定初始答案信息。如作为一个更具体的示例,历史文本序列为“上海下雨么?”,其历史语义信息包括分词“上海”、“下雨”和“么”的语义信息,当前处理的文本序列为“北京呢?”,其语义信息包括分词“北京”和“呢”的语义信息;则第三子查询装置判断分词“上海”和“么”,与分词和“北京”和“呢”的语义信息相类似,并将包含于历史语义信息中且不包含于当前语义信息中的分词“下雨”的语义信息,补充入当前语义信息中。则语义补充后的语义信息包括“北京”、“下雨”和“呢”的语义信息。优选地,第三子查询装置还可在进一步判断历史语义信息与当前语义信息中是否存在相类似的语义信息,且该等相类似的语义信息之间的逻辑关系也相似的情况下,才执行语义补充的操作。
需要说明的是,本优选方案可与前述查询装置3的各个方案相结合。
本优选方案能够根据用户的历史查询对用户当前需要处理的文本序列进行补充,从而能够在用户给出的文本不完整的情况下,自动实现语义补完和理解;此外,通过对触发获取历史查询信息的条件进行限制,能够使得计算机设备在适当的情况下才启动文本补充的操作,从而防止或减少计算机设备因不断对历史进行查询从而导致崩溃的可能。
图4为本发明一个优选实施例的创建本体实例的问答装置的结构示意图。本实施例的问答装置可包含于计算机设备中,该问答装置包括第二获取装置6和实例生成装置7。本实施例中,预定知识库中的子库包括本体实例,所述本体实例的至少一个属性中的每个属性包括一组语义匹配信息和与该语义匹配信息对应的初始答案信息。需要说明的是,一个本体示例可具有多个属性,每个属性还可包括其他信息,如标准问题、属性类型等。
第二获取装置6获取一个本体的实例项,其中,所述本体的至少一个属性中的每个属性包括本体答案信息以及具有缺省项的一组语义匹配信息。优选地,本体答案信息也可具有缺省项。
其中,本体的实例项表示该本体的缺省项的一个具体实例。例如,本体的一组语义匹配信息中的缺省项为XX,如“[XX]资费”,则作为XX的一个具体实例,本体的实例项为“3G”。
其中,第二获取装置6可采用多种方式来获得本体的实例项。如获得人工输入或已预先存储的实例项等。
实例生成装置7根据本体的实例项,对所述本体的属性中的缺省项进行处理,获得继承所述本体的全部属性的本体实例。
例如,本体的属性包括本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[XXX][收费|付费|计费][方法]”、“[XXX][多少钱]”、“[XXX][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“XXX贵吗”,本体的实例项为“神州行”,则实例生成装置7将本体的实例项补充至本体属性的各个缺省项中,获得继承本体的全部属性,如继承本体的全部语义匹配信息,的本体实例,该本体实例的属性包括作为初始答案信息的本体答案信息以及一组语义匹配信息,该组语义匹配信息包含以下具有缺省项的语义匹配结构“[神州行][收费|付费|计费][方法]”、“[神州行][多少钱]”、“[神州行][收费|付费|资费|扣费|缴费|计费][标准|情况]”以及语句“神州行贵吗”。
优选地,若本体答案信息具有缺省项,则实例生成装置7还可根据本体的实例项,对所述本体答案信息中的缺省项进行处理,获得初始答案信息。
需要说明的是,一个本体若为另一个本体的子本体,则该子本体也可继承其所属本体的所有属性。该实现方式与前述第二获取装置6和实例生成装置7执行的操作相似,故不再赘述。
本实施例中,对于具有相似属性的大量本体实例,无需针对每个本体实例重复性地建立属性,而可通过继承本体的所有属性的方式,简便地创建新的本体实例,大大减轻了本体实例创建过程中的资源消耗。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (10)

1.一种在计算机设备中用于基于预定知识库来获得答案信息的方法,其中,所述预定知识库包括多个子库,该方法包括以下步骤:
a.获取来自用户设备的待处理的文本序列;
b.对所述文本序列进行分词,并获得其至少一个分词的语义信息;
c.根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息;
d.将基于所述初始答案信息的最终答案信息提供给所述用户设备;
其中,该方法在所述步骤c之前还包括以下步骤:
-根据所述语义信息,确定所述多个子库的优先级,从而针对不同的语义,所述多个子库的优先级可被调整,以使所述多个子库的优先级设定更符合实际的语义情况,其中,所述根据所述语义信息,确定所述多个子库的优先级的操作包括:根据分词所属的类别,并结合预先确定的、在不同类别下的子库的优先级,确定所述多个子库的优先级;或者,根据所述语义信息中是否包含符合特定结构的实体,来调整子库的预定优先级,以确定所述多个子库的优先级;
所述步骤c包括以下步骤:
c1根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息,其中,每组语义匹配信息包括一个或多个语义匹配结构。
2.根据权利要求1所述的方法,其中,所述语义匹配结构包括以下至少一项:
-多个词汇以及该多个词汇中至少一个词汇的语义信息;
-所述多个词汇之间的逻辑关系。
3.根据权利要求1或2所述的方法,其中,所述步骤c1包括以下步骤:
-根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息;
-当所述匹配的一组语义匹配信息对应多个答案信息时,根据所述用户设备的设备信息和/或发送所述文本序列的应用的应用信息,从所述多个答案信息中选择一个答案信息,作为所述初始答案信息。
4.根据权利要求1或2所述的方法,其中,所述子库包括本体实例,所述本体实例的至少一个属性中的每个包括一组语义匹配信息和与该语义匹配信息对应的初始答案信息,该方法还包括以下步骤:
x获取一个本体的实例项,其中,所述本体的至少一个属性中的每个包括本体答案信息以及具有缺省项的一组语义匹配信息;
y根据所述实例项,对所述本体的属性中的缺省项进行处理,获得继承所述本体的全部属性的本体实例。
5.根据权利要求1或2所述的方法,其中,所述步骤d包括以下步骤:
-当判断所述初始答案信息不能被直接提供给所述用户设备时,从所述语义信息中获得参数信息;
-根据所述参数信息,对所述初始答案信息进行处理,获得所述最终答案信息
-将所述最终答案信息提供给所述用户设备。
6.根据权利要求1所述的方法,其中,该方法还包括以下步骤:
-当所述文本序列符合预定触发条件时,获取所述用户设备的历史查询信息;
其中,所述步骤c包括以下步骤:
-结合所述历史查询信息以及所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息。
7.一种在计算机设备中用于基于预定知识库来获得答案信息的问答装置,其中,所述预定知识库包括多个子库,该问答装置包括:
第一获取装置,用于获取来自用户设备的待处理的文本序列;
语义装置,用于对所述文本序列进行分词,并获得其至少一个分词的语义信息;
查询装置,用于根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中进行匹配查询,直至获得与所述语义信息匹配的初始答案信息;
第一提供装置,用于将基于所述初始答案信息的最终答案信息提供给所述用户设备;
其中,该问答装置还包括在所述查询装置之前执行操作的以下装置:
第一确定装置,用于根据所述语义信息,确定所述多个子库的优先级,从而针对不同的语义,所述多个子库的优先级可被调整,以使所述多个子库的优先级设定更符合实际的语义情况,其中,所述根据所述语义信息,确定所述多个子库的优先级的操作包括:根据分词所属的类别,并结合预先确定的、在不同类别下的子库的优先级,确定所述多个子库的优先级;或者,根据所述语义信息中是否包含符合特定结构的实体,来调整子库的预定优先级,以确定所述多个子库的优先级;
所述查询装置包括:
第一子查询装置,用于根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息,并获得与该组语义匹配信息对应的答案信息作为所述初始答案信息,其中,每组语义匹配信息包括一个或多个语义匹配结构。
8.根据权利要求7所述的问答装置,其中,所述语义匹配结构包括以下至少一项:
-多个词汇以及该多个词汇中至少一个词汇的语义信息;
-所述多个词汇之间的逻辑关系。
9.根据权利要求7或8所述的问答装置,其中,所述第一子查询装置包括以下装置:
第二子查询装置,用于根据所述语义信息,按照所述多个子库的优先级的由高至低,依次在所述多个子库的至少一个子库中,将所述语义信息与该子库中的多组语义匹配信息进行匹配查询,直至获得与所述语义信息匹配的一组语义匹配信息;
选择装置,用于当所述匹配的一组语义匹配信息对应多个答案信息时,根据所述用户设备的设备信息和/或发送所述文本序列的应用的应用信息,从所述多个答案信息中选择一个答案信息,作为所述初始答案信息。
10.一种计算机设备,包括如权利要求7或8所述的问答装置。
CN201811122621.1A 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备 Active CN109308357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811122621.1A CN109308357B (zh) 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510225400.7A CN104933084B (zh) 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备
CN201811122621.1A CN109308357B (zh) 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201510225400.7A Division CN104933084B (zh) 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备

Publications (2)

Publication Number Publication Date
CN109308357A CN109308357A (zh) 2019-02-05
CN109308357B true CN109308357B (zh) 2023-07-18

Family

ID=54120252

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201811122621.1A Active CN109308357B (zh) 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备
CN201510225400.7A Active CN104933084B (zh) 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201510225400.7A Active CN104933084B (zh) 2015-05-04 2015-05-04 一种用于获得答案信息的方法、装置和设备

Country Status (2)

Country Link
US (1) US10489435B2 (zh)
CN (2) CN109308357B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631014B (zh) * 2015-12-28 2018-12-21 网易(杭州)网络有限公司 游戏问题信息回复方法与装置
CN105893476B (zh) * 2016-03-29 2019-08-16 上海智臻智能网络科技股份有限公司 智能问答方法、知识库优化方法及装置、智能知识库
CN105893535B (zh) * 2016-03-31 2019-08-02 上海智臻智能网络科技股份有限公司 智能问答方法、知识库优化方法及装置、智能知识库
CN105912600B (zh) * 2016-04-05 2019-08-16 上海智臻智能网络科技股份有限公司 问答知识库及其建立方法、智能问答方法和系统
CN105912629B (zh) * 2016-04-07 2019-08-13 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置
CN108829682B (zh) * 2016-04-08 2022-10-28 上海智臻智能网络科技股份有限公司 计算机可读存储介质、智能问答方法及智能问答装置
CN106095972B (zh) * 2016-06-17 2020-06-19 联动优势科技有限公司 一种信息分类方法及装置
WO2018000205A1 (zh) * 2016-06-28 2018-01-04 深圳狗尾草智能科技有限公司 一种基于多意图的多技能包问答方法、系统和机器人
CN107918778B (zh) * 2016-10-11 2022-03-15 阿里巴巴集团控股有限公司 一种信息匹配方法及相关装置
CN108154735A (zh) * 2016-12-06 2018-06-12 爱天教育科技(北京)有限公司 英语口语测评方法及装置
CN106599161B (zh) * 2016-12-08 2020-02-14 竹间智能科技(上海)有限公司 延长机器人思考时间的回复方法及系统
CN106649698B (zh) * 2016-12-19 2020-12-22 宇龙计算机通信科技(深圳)有限公司 一种信息处理方法及信息处理装置
US10528612B2 (en) * 2017-02-21 2020-01-07 International Business Machines Corporation Processing request documents
CN107526827A (zh) * 2017-09-01 2017-12-29 上海连尚网络科技有限公司 用于问答展示的方法、设备和计算机可读存储介质
CN107688667A (zh) * 2017-09-30 2018-02-13 平安科技(深圳)有限公司 智能机器人客服方法、电子装置及计算机可读存储介质
CN107943822A (zh) * 2017-10-13 2018-04-20 南京邮电大学 基于miml的ogc地理信息服务语义检索方法
CN107943896A (zh) * 2017-11-16 2018-04-20 百度在线网络技术(北京)有限公司 信息处理方法和装置
CN107861684A (zh) * 2017-11-23 2018-03-30 广州视睿电子科技有限公司 书写识别方法、装置、存储介质及计算机设备
CN107992543B (zh) * 2017-11-27 2020-11-17 上海智臻智能网络科技股份有限公司 问答交互方法和装置、计算机设备及计算机可读存储介质
CN109858007B (zh) * 2017-11-30 2024-02-02 上海智臻智能网络科技股份有限公司 语义分析问答方法和装置、计算机设备和存储介质
CN108153876B (zh) * 2017-12-26 2021-07-23 爱因互动科技发展(北京)有限公司 智能问答方法及系统
JP7183600B2 (ja) 2018-07-20 2022-12-06 株式会社リコー 情報処理装置、システム、方法およびプログラム
CN109299240B (zh) * 2018-09-30 2022-02-25 北京小谛机器人科技有限公司 聊天机器人知识展示方法及装置
CN109783621B (zh) * 2018-12-17 2021-10-08 北京百度网讯科技有限公司 对话生成方法、装置及设备
CN112837684A (zh) * 2021-01-08 2021-05-25 北大方正集团有限公司 业务处理方法和系统、业务处理装置和可读存储介质
CN112989013B (zh) * 2021-04-30 2021-08-24 武汉龙津科技有限公司 一种对话处理方法、装置、电子设备及存储介质
CN113255629B (zh) * 2021-07-15 2022-08-02 北京世纪好未来教育科技有限公司 文档处理方法、装置、电子设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答系统及其处理方法
CN101398835A (zh) * 2007-09-30 2009-04-01 日电(中国)有限公司 基于自然语言的服务选择系统与方法以及服务查询系统与方法
CN101799811A (zh) * 2009-02-06 2010-08-11 北京蓝通易和科技有限公司 证照信息的查询方法和查询系统
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
CN102541924A (zh) * 2010-12-21 2012-07-04 中国移动通信集团公司 一种检索信息的缓存方法和搜索引擎系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030074353A1 (en) * 1999-12-20 2003-04-17 Berkan Riza C. Answer retrieval technique
US7212985B2 (en) * 2000-10-10 2007-05-01 Intragroup, Inc. Automated system and method for managing a process for the shopping and selection of human entities
EP1490790A2 (en) * 2001-03-13 2004-12-29 Intelligate Ltd. Dynamic natural language understanding
US7487104B2 (en) * 2001-10-08 2009-02-03 David Sciuk Automated system and method for managing a process for the shopping and selection of human entities
US8612208B2 (en) * 2004-04-07 2013-12-17 Oracle Otc Subsidiary Llc Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query
US20070168335A1 (en) * 2006-01-17 2007-07-19 Moore Dennis B Deep enterprise search
CN100578539C (zh) * 2006-02-28 2010-01-06 腾讯科技(深圳)有限公司 自动问答方法及系统
US20080059486A1 (en) * 2006-08-24 2008-03-06 Derek Edwin Pappas Intelligent data search engine
US8332394B2 (en) * 2008-05-23 2012-12-11 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation
CN103250129A (zh) * 2010-09-24 2013-08-14 国际商业机器公司 使用具有受限结构的文本提供具有延迟类型评估的问答

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118554A (zh) * 2007-09-14 2008-02-06 中兴通讯股份有限公司 智能交互式问答系统及其处理方法
CN101398835A (zh) * 2007-09-30 2009-04-01 日电(中国)有限公司 基于自然语言的服务选择系统与方法以及服务查询系统与方法
CN101799811A (zh) * 2009-02-06 2010-08-11 北京蓝通易和科技有限公司 证照信息的查询方法和查询系统
CN101986293A (zh) * 2010-09-03 2011-03-16 百度在线网络技术(北京)有限公司 用于在搜索界面中呈现搜索答案信息的方法及设备
CN102541924A (zh) * 2010-12-21 2012-07-04 中国移动通信集团公司 一种检索信息的缓存方法和搜索引擎系统

Also Published As

Publication number Publication date
CN109308357A (zh) 2019-02-05
CN104933084B (zh) 2018-11-09
US10489435B2 (en) 2019-11-26
US20160328469A1 (en) 2016-11-10
CN104933084A (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
CN109308357B (zh) 一种用于获得答案信息的方法、装置和设备
CN108984650B (zh) 计算机可读记录介质及计算机设备
WO2018224034A1 (zh) 智能问答方法、服务器、终端及存储介质
US10217059B2 (en) Method and system for generating natural language training data
US20170249309A1 (en) Interpreting and Resolving Conditional Natural Language Queries
CN107609092B (zh) 智能应答方法和装置
US11934394B2 (en) Data query method supporting natural language, open platform, and user terminal
CN113918896A (zh) 用于与服务提供者的会话建立的自然语言处理
CN116127020A (zh) 生成式大语言模型训练方法以及基于模型的搜索方法
CN114303132A (zh) 在虚拟个人助手中使用唤醒词进行上下文关联和个性化的方法和系统
CN112579733B (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
US20220004589A1 (en) Service providing apparatus and method for providing search intent
CN108306813B (zh) 会话消息的处理方法、服务器及客户端
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
CN112579031A (zh) 一种语音交互的方法、系统和电子设备
CN114297380A (zh) 一种数据处理方法、装置、设备及存储介质
CN111046151B (zh) 一种消息处理方法及装置
CN113360590A (zh) 兴趣点信息的更新方法、装置、电子设备及存储介质
CN109299240B (zh) 聊天机器人知识展示方法及装置
CN115965018B (zh) 信息生成模型的训练方法、信息生成方法和装置
CN113515719A (zh) 对社区产品进行冷启动的方法和装置
CN117421476A (zh) 信息推荐方法及装置、电子设备和存储介质
CN117390164A (zh) 自动应答处理方法、装置、电子设备及介质
CN113807148A (zh) 文本识别匹配方法和装置、终端设备
CN117112065A (zh) 大模型插件调用方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant