CN109074353A - 语言理解和信息检索的组合 - Google Patents

语言理解和信息检索的组合 Download PDF

Info

Publication number
CN109074353A
CN109074353A CN201680082203.7A CN201680082203A CN109074353A CN 109074353 A CN109074353 A CN 109074353A CN 201680082203 A CN201680082203 A CN 201680082203A CN 109074353 A CN109074353 A CN 109074353A
Authority
CN
China
Prior art keywords
knowledge
knowledge entry
feature
inquiry
entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680082203.7A
Other languages
English (en)
Other versions
CN109074353B (zh
Inventor
倪勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN109074353A publication Critical patent/CN109074353A/zh
Application granted granted Critical
Publication of CN109074353B publication Critical patent/CN109074353B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本公开提供了一种用于信息检索的方法、装置和系统。用于信息检索的方法可以包括:从用户接收以自然语言形式的查询(210);基于与所述用户相关联的知识库中的多个知识条目以及内置的特征化源来从所述查询提取多个特征向量,每个知识条目一个特征向量(220);利用经预先训练的语言理解模型来基于所述多个特征向量获得多个语言理解结果(230);以及基于所述多个语言理解结果来在所述多个条目中选择与所述查询相对应的知识条目(240)。本公开可以提取更多的特征,并且一次性地将信息检索和语言理解组合起来以改进效率。

Description

语言理解和信息检索的组合
背景技术
自然语言理解可以应用于不同的一组计算机应用,范围从小的相对简单的任务(例如,发布给机器人的短命令)到高度复杂的努力(例如,对报纸文章的完全理解)。最近,自然语言理解已经成功地应用于信息检索。然而,在实际系统中在成功地自展了自然语言理解结果之后额外地需要精力来解析和检索实际有用的信息。
发明内容
提供了该发明内容以用简化形式引入在以下的具体实施方式中进一步描述的概念的选择。该发明内容不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
在一个方面中,本公开提供了一种用于信息检索的方法。所述方法可以包括:从用户接收以自然语言形式的查询;基于与所述用户相关联的知识库中的多个知识条目以及内置特征化源来从所述查询提取多个特征向量,每个知识条目一个特征向量;利用经预先训练的语言理解模型来基于所述多个特征向量获得多个语言理解结果;以及基于所述多个语言理解结果来在所述多个条目中选择与所述查询相对应的知识条目。
在另一个方面中,本公开提供了一种用于信息检索的装置。所述装置可以包括:接收模块,其被配置用于从用户接收以自然语言形式的查询;提取模块,其被配置用于基于与所述用户相关联的知识库中的多个知识条目以及内置的特征化源来从所述查询提取多个特征向量,每个知识条目一个特征向量;获得模块,其被配置用于利用经预先训练的语言理解模型来基于所述多个特征向量获得多个语言理解结果;以及选择模块,其被配置用于基于所述多个语言理解结果来在所述多个知识条目中选择与所述查询相对应的知识条目。
在另一个方面中,本公开提供了一种用于信息检索的系统。所述系统可以包括一个或多个处理器以及存储器。所述存储器可以存储计算机可执行指令,所述计算机可执行指令当被执行时,使得所述一个或多个处理器执行根据本公开各个方面的用于信息检索的任何步骤。
应当注意的是,以上的一个或多个方面包括在下文中详细描述的并且在权利要求中特别指出的特征。以下的描述和附图详细地阐述了一个或多个方面的某些说明性特征。这些特征仅仅指示可以采用各种方面的原理的各种方式中的几种,并且该公开旨在包括所有这样的方面及其等同物。
附图说明
下文将结合附图来描述所公开的方面,所述附图被提供是为了说明而不是限制所公开的方面。
图1示出了根据本公开的实施例的示例实现中的环境。
图2示出了根据本公开的实施例的用于信息检索的方法的流程图。
图3示出了根据本公开的实施例的用于从用户查询提取一个特征向量的流程图。
图4示出了根据本公开的实施例的用于基于多个语言理解结果来计算一个知识条目与用户查询之间的相似度分数的流程图。
图5示出了根据本公开的实施例的用于信息检索的示例性装置。
图6示出了根据本公开的实施例的用于信息检索的示例性系统。
具体实施方式
现在将参考几个示例实现来讨论本公开。应当理解的是,讨论这些实现仅仅是为了使得本领域技术人员能够更好地理解并且因此实现本公开的实施例,而不是暗示对本公开范围的任何限制。
随着自然语言理解技术的发展,人类可以用自然语言(例如,语音或文本)与机器(例如,计算机、无线电话等)进行交互。用户可以利用语音命令来启动应用。用户可以命令机器保存他/她的提醒。用户可以发布语音查询以请求机器针对期望的提醒来搜索这些提醒。为了找到对查询进行响应的期望的提醒,传统的方法需要成功地自展了自然语言理解结果之后解析和检索实际有用的信息。例如,为了对“what kind of my niece wants forher birthday(我侄女生日想要什么类型)”进行响应,传统的方法需要对该用户查询执行语言理解。首先,该用户查询被映射到一个N维特征空间中,以生成可计算的特征向量以供计算。该N维特征空间是在插槽(slot)模型训练过程期间通过从训练数据集中提取信息并且利用准备好的且固定的数据集(例如,词典和语法)来建立的。这样的可计算的特征向量中的每个元素可以被称为内部模型特征。接着,针对经训练的插槽模型,可以对所生成的特征向量进行插槽标记,以用经预先定义的标记来标识某些有意义的实体。可以使用语言理解的结果(即,经标记的实体)来针对用户先前保存的提醒运行信息检索算法,以获得最好的匹配并且将该匹配回应给用户。
本公开可以通过添加基于外部知识集的更多外部特征来扩展N维特征空间。在本公开中,内部模型特征和外部特征是一对相对术语。内部模型特征可以表示基于用于训练语言理解模型的内置源所提取的特征。外部特征可以表示基于所述模型外部的信息所提取的特征。在模型训练过程期间,可能需要一些经预先准备的文件来对这些外部特征的权重进行建模,以使得在运行期间在有实时外部知识数据进入时能够使用这些外部特征来实际地产生基于用户查询的特征值。经预先准备的文件可以包括包含描述人物的词语的文本文件、包含描述时间的词语的文本文件、包含描述位置的词语的文本文件、或者包含描述事情的词语的文本文件。经预先准备的文件还可以包括包含同义词的字典。
在运行期间,可以个别地使用知识库中的多个知识条目来产生多个语言理解结果。在每个所提取的知识条目上,将存在来自输入查询的一个所生成的特征向量。在语言理解之后,将存在一组语言理解结果。由于多个知识条目是个别地使用的,因此可以在语言理解期间将一些有用的信息附加至每个知识条目,以帮助信息检索。接着,可以基于跨所有语言理解结果从每个知识条目所计算的相似度分数来在多个知识条目中选择与查询相对应的知识条目。在本公开中,当在语言理解过程中消耗外部信息时,可以嵌入信息检索处理。因此,可以一次性地组合信息检索和语言理解以改进效率。此外,由于可以从用户查询中提取出比传统方法更多的特征,所以可以获得更精确的语言理解结果。
在以下讨论中,首先描述用于采用在本文中所描述的技术的示例环境。接着,描述各种实施例的示例图示,各种实施例可以在该示例环境以及其他环境中被采用。由此,该示例环境并不限于执行所描述的实施例,并且所描述的实施例不限于该示例环境中的实现。
图1示出了能够采用本公开中描述的技术的示例实现中的环境100。所示的环境100包括可以以多种方式配置的计算设备110的示例。例如,计算设备110可以被配置为传统计算机(例如,台式个人计算机、膝上型个人计算机等)、娱乐家电、通信地耦合至电视机的机顶盒、智能电话、上网本等。因此,计算设备110的范围可以从具有大量存储器和处理器资源的全资源设备(例如,个人计算机)到具有有限存储器和/或处理资源的低资源设备(例如,传统的机顶盒、手持游戏控制器)。
计算设备110可以包括输入装置120和输出装置130。输入装置120可以包括鼠标、键盘、触摸屏、麦克风、相机等。输出装置130可以包括显示器、触摸屏、扬声器等。计算设备110还可以包括用于执行应用的处理器150以及用于存储数据和指令的存储器140。
计算设备110可以包括采用本公开中所描述的技术的人机对话应用160。人机对话应用160可以是在工厂中预先安装在计算设备110上的。人机对话应用160也可以由用户下载到计算设备110中。在启动了人机对话应用160之后,用户就可以用自然语言(例如,语音)来与计算设备110进行交互。例如,用于可以说“Remember my niece’s birthday is May4th(记住我侄女的生日是5月4日)”,其可以由诸如麦克风之类的输入装置120获得。输入装置120可以将该语音信息馈送到人机对话应用160中,人机对话应用160可以利用语音识别算法将该语音信息转换成文本,并且将所述文本作为提醒存储在存储器140中。作为另一示例,用户可以对麦克风讲“what kind of laptop my niece wants for her birthday(我侄女生日想要什么类型的笔记本电脑)”。接着,该语音信息被输入到人机对话应用160中,人机对话应用160可以利用语音识别算法将该语音信息转换成文本,并且将本公开所描述的技术应用于所述文本以获得对于该问题的答案。所述答案可以通过语音合成算法被转换成语音,并且通过诸如扬声器之类的输出设备130被输出以对用户进行响应。
在描述了可以采用在本文中所描述的技术的示例运行环境之后,现在考虑对各种实施例的讨论。
图2示出了根据本公开的实施例的用于信息检索的方法200的流程图。
在步骤210中,可以从用户接收查询。所述查询可以是包括词语序列的文本或者包括发音序列的语音。可以通过语音识别算法将语音输入转换成文本输入。所述查选可以是关于天气、位置、路线等的,例如“what is the weather today in Beijing(北京今天什么天气)”、“what kind of laptop my niece wants for her birthday”。
在步骤220中,可以基于内置特征化源以及与用户相关联的知识库中的多个知识条目来从所述查询提取多个特征向量,每个知识条目一个特征向量。在本公开中,基于内置源从用户查询所提取的特征可以被称为内部模型特征。在本公开中,基于语言理解模型外部的知识库中的知识条目从用户查询所提取的特征可以被称为外部特征。所述多个特征向量中的每一个可以由内部模型特征和外部模型特征组成。将在图3中描述如何基于内置特征化源以及所述多个知识条目中的一个知识条目来从查询提取所述多个特征向量中的一个特征向量。
内置特征化源可以与在训练过程期间用于训练语言理解模型以及建立特征空间的那些数据(例如,来自训练数据集的词汇或者预先定义的词典和语法)相关联。
与用户相关联的知识库可以存储用户的简档。例如,用户先前访问的网站、用户已经去的位置、用户的联系人信息、用户先前保存的提醒等都可以被存储在知识库中。在本公开中,在运行期间,可以将知识库用作外部信息源,以从用户查询提取外部特征。在本公开的实施例中,可以将知识条目以简单的文本格式存储在知识库中。在本公开的另一实施例中,知识库中的知识条目可以在其被获得时被预先标记。例如,当从用户获得提醒时,可以将语言理解技术应用于该提醒以得到对该提醒的预先标记。关键在于利用更示意化信息来标记原始信息,目标在于更实际的应用需求,例如针对诸如“Person(人物)”、“Time(时间)”、“Location(位置)”以及“Keyword(关键词)”之类的特定类型进行标记,以分别为用户询问“Who(谁)”、“When(何时)”、“Where(哪里)”和“What(什么)”的后续请求做好准备。
在本公开的实施例中,在预先标记期间可以使用一些语义扩展或数据挖掘技术来扩展或解析针对某些词语的信息。例如,可以引入包括同义词或类似词的字典来扩展一些词语。因此,可以获得更丰富的信息以有助于随后更精确的理解。
例如,当从用户获得提醒“Remember my niece’s birthday is May 4th”时,可以将语言理解算法应用于该提醒以获得结果为{"Id":"1","Text":"my niece's birthdayis May 4th","Attributes":[{"Name":"Person","Value":[{"Text":"niece",KnownAs:["Niece"]}]},{"Name":"Time","Value":[{"Text":"May 4th",KnownAs:["XXXX-05-04"]}]},{"Name":"Keyword","Value":[{"Text":"birthda y",KnownAs:[]}]}]}。接着,将该结果作为一个知识条目存储在与用户相关联的知识库中。在另一个示例中,对“Remember my niece wants a Surface Book as her birthday gift”的预先标记的结果可以是{"Id":"2","Text":"my niece wants a Surface Book as her birthday gift","Attributes":[{"Name":"Person","Value":[{"Text":"niece",KnownAs:["Niece"]}]},{"Name":"Keyword","Value":[{"Text":"Surface Book",KnownAs:["laptop","surface","Microsoft Surface"]},{"Text":"birthday",KnownAs:[]}]}]}。由此,与用户相关联的知识库可以存储比简单的文本信息更丰富的信息。这种具有预先标记的知识的知识库对于更精确地进行信息检索是非常有用的。
在步骤230中,可以利用经预先训练的语言理解模型,基于所述多个特征向量来获得多个语言理解结果。在本公开的实施例中,所述多个语言理解结果中的每一个可以包括一组经标记的插槽(slot),例如来自用户查询的一组关键词。在本公开的实施例中,所述多个语言理解结果中的每一个还可以包括关于相应知识条目中哪个或那些词语落入到该结果的一组经标记的插槽中的指示。在利用示意化信息标记知识条目的实施例中,所述指示可以是关于相应知识条目中哪些经标记的实体落入到所述一组关键词中的指示。例如,通过使用知识条目“my sister’s birthday is March 20(我妹妹的生日是3月20)”所获得的结果可以包括:来自用户查询“what kind of laptop my niece wants for herbirthday”的关键词“niece(侄女)”和“birthday(生日)”,以及关于该知识条目中的词语“birthday”落入到这些关键词中的指示。该指示将有助于随后的信息检索。
所述多个语言理解结果中的每一个可以包括其他结果,这取决于使用了哪种经预先训练的语言理解模型。例如,如果应用所述多个特征向量来识别用户的意图,那么每个语言理解结果可以包括意图分类。
在步骤240中,可以基于多个语言理解结果在所述多个知识条目中选择与查询相对应的知识条目。在本公开的实施例中,可以基于多个理解结果来计算所述多个知识条目与查询之间的相似度分数。接着,可以基于经计算的相似度分数来选择与查询相对应的知识条目。图4将示出如何基于所述多个语言理解结果来计算知识条目与查询之间的相似度分数。
图3示出了用于从用户查询提取一个特征向量的流程图300。
在步骤310中,可以基于内置特征化源而从用户输入提取内部模型特征子向量。如上文所描述的,内置特征化源可以包括在训练过程期间使用的来自训练数据集的词汇、预先定义的词典和语法。在本公开的实施例中,内部模型特征子向量中的第i个元素可以基于在用户查询中是否存在与来自训练数据集的词汇中的第i个词语相匹配的词语而被确定为值0或1。
在步骤320中,可以基于一个知识条目从用户查询提取外部特征子向量。在训练语言理解模型的过程期间,使用了一些经预先准备的文件(例如,描述人物、时间、地点、和事情的几个文本文件以及包括同义词的词典)来扩展特征空间的维度,并且对模型的外部特征的权重进行建模,如上文所描述的。在本公开的实施例中,在运行期间,可以通过使用具有注释的外部知识条目而不是使用内置特征化源来从用户查询提取与这些经扩展的维度相对应的外部特征值。
例如,特征空间的扩展的维度可以被表示为External_Typed_Feature_1、External_Typed_Feature_2、External_Typed_Feature_3、External_Typed_Feature_4和External_Expanded_Feature。可以分别基于在用户查询中是否存在与利用“Person”、“Time”、“Location”和“Keyword”标记的实体和经扩展的实体相匹配的词语来从用户查询提取与这些维度相对应的外部特征值。这些所提取的外部特征值可以形成外部特征子向量。
在步骤330中,可以组合内部模型特征子向量和外部特征子向量,以形成与经预先训练的语言模型具有相同维度的特征向量。表1给出了从用户向量提取的示例特征向量。在表1中,以非斜体书写的值可以表示内部模型特征子向量,而以斜体书写的值可以表示外部特征子向量。在表1中,External_Typed_Feature_1的值等于1,这表示在用户查询中存在与第二知识条目中利用“Person”标记的实体相匹配的词语(即,“niece”)。External_Typed_Feature_4的值等于1,这表示在用户查询中存在与第二知识条目中利用“Keyword”标记的实体相匹配的词语(即,“laptop”)。External_Expanded_Feature的值等于1,这表示在用户查询中存在与第二知识条目中标记的实体“surface book”的扩展信息“laptop”相匹配的词(即,“laptop”)。由于在该知识条目中不存在利用“Time”、或“Location”标记的实体,所以External_Typed_Feature_2和External_Typed_Feature_3的值等于0。
表1
通过重复图3中所描述的流程图,可以基于内置特征化源以及与用户相关联的知识库中的多个知识条目来从用户查询提取多个特征向量。
图4示出了基于多个语言理解结果来计算一个知识条目与查询之间的相似度分数的流程图400。
为了简单的目的,在图4中可以考虑存在两个知识条目的简单场景。在该场景中,第一知识条目是{"Id":"1","Text":"my niece's birthday is May 4th","Attributes":[{"Name":"Person","Value":[{"Text":"niece",KnownAs:["Niec e"]}]},{"Name":"Time","Value":[{"Text":"May 4th",KnownAs:["XXXX-05-04"]}]},{"Name":"Keyword","Value":[{"Text":"birthday",KnownAs:[]}]}]},而第二知识条目是{"Id":"2","Text":"my niece wants a Surface Book as her birthday gift","Attributes":[{"Name":"Person","Value":[{"Text":"niece",KnownAs:["Niece"]}]},{"Name":"Keyword","Value":[{"Text":"Surface Book",KnownAs:["laptop","surface","Microsoft Surface"]},{"Text":"birthday",KnownAs:[]}]}]}。基于第一知识条目所获得的第一语言理解结果可以包括第一组关键词(“niece”、“birthday”)以及关于第一知识条目中用“Person”标记的实体“niece”以及用“Keyword”标记的实体“birthday”落入到第一组关键词中的第一指示。基于第二知识条目所获得的第二语言理解结果可以包括第二组关键词(“niece”、“birthday”、“laptop”)以及关于第二知识条目中用“Person”标记的实体“niece”、用“Keyword”标记的实体“surface book”、以及用“Keyword”标记的实体“birthday”落入到第二组关键词中的第二指示。
在步骤410中,可以合并多个语言理解结果以形成新的特征空间。在所描述的场景中,可以合并第一组关键词和第二组关键词以形成具有三个维度(“niece”、“birthday”、“laptop”)的新特征空间。在语言理解结果可以包括其他经标记的插槽的复杂场景中,所形成的特征空间可以具有更多维度。
在步骤420中,可以将多个语言理解结果中的每一个表示成新特征空间中的语义向量。例如,第一组关键词(“niece”、“birthday”)可以被表示成该特征空间中的第一语义向量(1,1,0)。第二组关键词(“niece”、“birthday”、“laptop”)可以被表示成该特征空间中的第二语义向量(1,1,1)。
在步骤430中,可以将一个知识条目表示为新特征空间中的一个知识向量。在本公开的实施例中,一个知识条目可以基于根据所述一个知识条目所获得的相应语言理解结果中的指示而被表示为新空间中的向量。例如,可以基于第一指示而将第一知识条目表示为该空间中的第一知识向量(1,1,0)。
在步骤440中,可以计算多个语言理解结果的知识向量与语义向量之间的平均相似度,以作为所述一个知识条目与用户查询之间的相似度分数。例如,可以计算第一知识向量(1,1,0)与第一语义向量(1,1,0)之间的第一相似度,例如余弦距离。可以计算第一知识向量(1,1,0)与第二语义向量(1,1,1)之间的第二相似度。接着,可以将第一相似度和第二相似度平均为第一知识条目与用户查询之间的相似度分数。
通过使用类似的过程,可以计算第二知识条目与用户查询之间的相似度分数。可以选择第一知识条目和第二知识条目中具有最高相似度分数的知识条目作为与用户查询相对应的知识条目。
图5示出了根据本公开实施例的用于信息检索的装置500。
装置500可以包括:接收模块510,其用于从用户接收以自然语言形式的查询;提取模块520,用于基于内置特征化源以及与所述用户相关联的知识库中的多个知识条目来从查询中提取多个特征向量,每个知识条目一个特征向量;获得模块530,其用于利用经预先训练的语言模型基于所述多个特征向量来获得多个语言理解结果;以及选择模块540,其用于基于所述多个语言理解结果来在所述多个知识条目中选择与所述查询相对应的知识条目。
在一个实施例中,提取模块510可以被配置用于基于内置特征化源来提取内幕模型特征子向量,基于一个知识条目来提取外部特征子向量,以及组合所述内部模型特征子向量和所述外部特征子向量以形成所述多个特征向量中的一个特征向量。
在一个实施例中,选择模块520可以被配置用于基于所述多个语言理解结果来计算所述多个知识条目与所述查询之间的相似度分数;以及基于所计算的相似度分数来选择与所述查询相对应的知识条目。
在一个实施例中,选择模块520还可以被配置用于计算所述多个知识条目中的一个知识条目与所述查询之间的相似度分数,包括:合并所述多个语言理解结果以形成特征空间;将所述多个语言理解结果中的每一个表示为所述特征空间中的一个语义向量;将所述多个知识条目中的所述一个知识条目表示为所述特征空间中的一个知识向量;计算所述多个语言理解结果的所述知识向量与所述语义向量之间的平均相似度,以作为所述多个知识条目中的所述一个知识条目与所述查询之间的相似度分数。
在一个实施例中,所述多个知识条目可以是用示意化信息标记的,并且是通过应用语义扩展或数据挖掘技术扩展的,并且所述多个语言理解结果中的每一个可以包括来自所述查询的一组关键词以及关于相应知识条目中的哪些经标记的实体落入到所述一组关键词中的指示。选择模块还可以被配置用于基于根据所述多个知识条目中的所述一个知识条目所获得的语言理解结果中的指示,将所述多个知识条目中的所述一个知识条目表示为所述特征空间中的知识向量。
此外,装置500还可以包括被配置用于实现与根据本公开的用于信息检索的方法中的任何步骤相对应的功能的任何其他模块。
图6示出了根据本公开实施例的用于信息检索的示例系统600。所述系统600可以包括一个或多个处理器610。所述系统600还可以包括与所述一个或多个处理器连接的存储器620。所述存储器620可以存储计算机可执行指令,所述计算机可执行指令当被执行时使得所述一个或多个处理器执行根据本公开的用于信息检索的方法的任何步骤。
可以在非瞬时性计算机可读介质中实现本公开的方面。非瞬时性计算机可读介质可以包括指令,其当被执行时使得一个或多个处理器执行根据本公开的用于信息检索的方法的任何步骤。
已经结合各种装置和方法描述了处理器。可以使用电子硬件、计算机软件或其任意组合来实现这些处理器。这样的处理器被实现为硬件还是软件将取决于特定的应用以及施加在系统上的总体设计约束。作为示例,可以利用微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、状态机、门控逻辑、离散硬件电路以及被配置用于执行本公开通篇所描述的各种功能的其他合适的处理组件,来实现在本公开中所呈现的处理器、处理器的任意一部分、或处理器的任意组合。可以利用由微处理器、微控制器、DSP、或其他合适的平台所执行的软件来实现在本公开中所呈现的处理器、处理器的任意部分、或处理器的任意组合的功能。
应当将软件宽泛地被解释为表示指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、执行的线程、过程、函数等。软件可以驻留在计算机可读介质上。作为示例,计算机可读介质可以包括存储器,例如磁存储设备(如硬磁盘、软盘、磁带)、光盘、智能卡、闪速存储器设备、随机存取存储器(RAM)、只读存储器(ROM)、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、寄存器或可移动磁盘。尽管在本公开通篇中呈现的各种方面中,存储器被示出为与处理器是分离的,但存储器可以位于处理器内部(例如,高速缓存或寄存器)。
应当理解的是,所公开的方法中的步骤的顺序是示例性的过程的说明。基于设计偏好,可以理解的是可以重新安排这些方法中的步骤的顺序。
提供先前的描述以使得本领域技术人员能够实践在本文中所描述的各种方面。对本领域技术人员而言,对这些方面进行的各种修改都将是显而易见的,并且本文中定义的一般原理可以应用于其他方面。因此,权利要求不是要限于在本文中所示出的方面。本领域技术人员已知或者以后将知道的、在本公开通篇中所描述的各种方面的元素的所有结构和功能等同物通过引用明显地并入本文中,并且旨在由权利要求所涵盖。

Claims (20)

1.一种用于信息检索的方法,包括:
从用户接收以自然语言形式的查询;
基于与所述用户相关联的知识库中的多个知识条目以及内置特征化源来从所述查询提取多个特征向量,每个知识条目一个特征向量;
利用经预先训练的语言理解模型来基于所述多个特征向量获得多个语言理解结果;以及
基于所述多个语言理解结果来在所述多个条目中选择与所述查询相对应的知识条目。
2.如权利要求1所述的方法,其中,所述多个知识条目被标记有示意化信息。
3.如权利要求2所述的方法,其中,所述多个知识条目是通过应用语义扩展或数据挖掘技术来扩展的。
4.如权利要求3所述的方法,其中,提取所述多个特征向量包括:基于所述多个知识条目中的一个知识条目以及所述内置特征化源来从所述查询提取所述多个特征向量中的一个特征向量。
5.如权利要求4所述的方法,其中,提取所述多个特征向量中的一个特征向量包括:
基于所述内置特征化源从所述查询提取内部模型特征子向量;
基于所述多个知识条目中的所述一个知识条目从所述查询提取外部特征子向量;以及
将所述内部模型特征子向量与所述内部特征子向量组合以形成所述多个特征向量中的所述一个特征向量。
6.如权利要求5所述的方法,其中,所述外部特征子向量中的元素表示所述查询中是否存在与所述多个知识条目中的所述一个知识条目中的经标记的实体或经扩展的实体相匹配的词语。
7.如权利要求3所述的方法,其中,所述选择还包括:
基于所述多个语言理解结果来计算所述多个知识条目与所述查询之间的相似度分数;以及
基于所计算的相似度分数来选择与所述查询相对应的知识条目。
8.如权利要求7所述的方法,其中,所述计算包括计算所述多个知识条目中的一个知识条目与所述查询之间的相似度分数,其包括:
合并所述多个语言理解结果以形成特征空间;
将所述多个语言理解结果中的每个语言结果表示为所述特征空间中的语义向量;
将所述多个知识条目中的所述一个知识条目表示为所述特征空间中的知识向量;
计算所述多个语言理解结果的所述知识向量与所述语义向量之间的平均相似度,以作为所述多个知识条目中的所述一个知识条目与所述查询之间的相似度分数。
9.如权利要求8所述的方法,其中,所述多个语言理解结果中的每个语言理解结果包括来自所述查询的一组关键词以及关于相应知识条目中哪些经标记的实体落入到所述一组关键词中的指示,并且其中,将所述多个知识条目中的所述一个知识条目表示为知识向量包括:根据基于所述多个知识条目中的所述一个知识条目所获得的语言理解结果中的指示,将所述多个知识条目中的所述一个知识条目表示为所述特征空间中的知识向量。
10.如权利要求1所述的方法,其中,所述经预先训练的语言理解模型包括插槽理解注释模型和意图理解分类模型中的一个。
11.一种用于信息检索的装置,包括:
接收模块,其被配置用于从用户接收以自然语言形式的查询;
提取模块,其被配置用于基于与所述用户相关联的知识库中的多个知识条目以及内置特征化源来从所述查询提取多个特征向量,每个知识条目一个特征向量;
获得模块,其被配置用于利用经预先训练的语言理解模型来基于所述多个特征向量获得多个语言理解结果;以及
选择模块,其被配置用于基于所述多个语言理解结果来在所述多个知识条目中选择与所述查询相对应的知识条目。
12.如权利要求11所述的装置,其中,所述多个知识条目被标记有示意化信息,并且是通过应用语义扩展或数据挖掘技术来扩展的。
13.如权利要求12所述的装置,其中,所述提取模块还被配置用于基于所述多个知识条目中的一个知识条目以及所述内置特征化源来从所述查询提取所述多个特征向量中的一个特征向量。
14.如权利要求13所述的装置,其中,所述提取模块还被配置用于:
基于所述内置特征化源来从所述查询提取内部模型特征子向量;
基于所述多个知识条目中的所述一个知识条目从所述查询提取外部特征子向量;以及
组合所述内部模型特征子向量和所述外部特征子向量以形成所述多个特征向量中的所述一个特征向量。
15.如权利要求14所述的装置,其中,所述外部特征子向量中的元素表示在所述查询中是否存在与所述多个知识条目中的所述一个知识条目中的经标记的实体或经扩展的实体相匹配的词语。
16.如权利要求12所述的装置,其中,所述选择模块还被配置用于:
基于所述多个语言理解结果来计算所述多个知识条目与所述查询之间的相似度分数;以及
基于所计算的相似度分数来选择与所述查询相对应的知识条目。
17.如权利要求16所述的装置,其中,所述选择模块还被配置用于计算所述多个知识条目中的一个知识条目与所述查询之间的相似度分数,其包括:
合并所述多个语言理解结果以形成特征空间;
将所述多个语言理解结果中的每个语言结果表示为所述特征空间中的语义向量;
将所述多个知识条目中的所述一个知识条目表示为所述特征空间中的知识向量;
计算所述多个语言理解结果的所述知识向量与所述语义向量之间的平均相似度,以作为所述多个知识条目中的所述一个知识条目与所述查询之间的相似度分数。
18.如权利要求17所述的装置,其中,所述多个语言理解结果中的每个语言理解结果包括来自所述查询的一组关键词以及关于相应知识条目中哪些经标记的实体落入到所述一组关键词中的指示,并且其中,所述选择模块还被配置用于:根据基于所述多个知识条目中的所述一个知识条目所获得的语言理解结果中的指示,将所述多个知识条目中的所述一个知识条目表示为所述特征空间中的知识向量。
19.如权利要求11所述的装置,其中,所述经预先训练的语言理解模型包括插槽理解注释模型和意图理解分类模型中的一个。
20.一种系统,包括:
一个或多个处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令当被执行时,使得所述一个或多个处理器执行根据权利要求1-10的方法。
CN201680082203.7A 2016-10-10 2016-10-10 用于信息检索的方法、装置和系统 Active CN109074353B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/101649 WO2018068176A1 (en) 2016-10-10 2016-10-10 Combo of language understanding and information retrieval

Publications (2)

Publication Number Publication Date
CN109074353A true CN109074353A (zh) 2018-12-21
CN109074353B CN109074353B (zh) 2022-11-08

Family

ID=61904961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680082203.7A Active CN109074353B (zh) 2016-10-10 2016-10-10 用于信息检索的方法、装置和系统

Country Status (4)

Country Link
US (1) US11232101B2 (zh)
EP (1) EP3507708A4 (zh)
CN (1) CN109074353B (zh)
WO (1) WO2018068176A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116662582A (zh) * 2023-08-01 2023-08-29 成都信通信息技术有限公司 基于自然语言的特定领域业务知识检索方法及检索装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190207946A1 (en) * 2016-12-20 2019-07-04 Google Inc. Conditional provision of access by interactive assistant modules
US10127227B1 (en) 2017-05-15 2018-11-13 Google Llc Providing access to user-controlled resources by automated assistants
US11436417B2 (en) 2017-05-15 2022-09-06 Google Llc Providing access to user-controlled resources by automated assistants
EP3682345B1 (en) 2018-08-07 2021-11-24 Google LLC Assembling and evaluating automated assistant responses for privacy concerns
EP3857330A1 (en) 2018-09-27 2021-08-04 Google LLC Automatic navigation of interactive web documents
US10664527B1 (en) * 2019-01-18 2020-05-26 PolyAI Limited Response retrieval system and method
CN111489746B (zh) * 2020-03-05 2022-07-26 国网浙江省电力有限公司 一种基于bert的电网调度语音识别语言模型构建方法
CN111400429B (zh) * 2020-03-09 2023-06-30 北京奇艺世纪科技有限公司 文本条目搜索方法、装置、系统及存储介质
CN111428019B (zh) * 2020-04-02 2023-07-28 出门问问信息科技有限公司 用于知识库问答的数据处理方法及设备
CN114266245A (zh) * 2020-09-16 2022-04-01 北京金山数字娱乐科技有限公司 一种实体链接方法及装置
CN117609433A (zh) * 2024-01-19 2024-02-27 深圳市活力天汇科技股份有限公司 信息推荐方法、装置、电子设备和计算机可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030105589A1 (en) * 2001-11-30 2003-06-05 Wen-Yin Liu Media agent
CN1952928A (zh) * 2005-10-20 2007-04-25 梁威 建立自然语言知识库及其自动问答检索的计算机系统
CN101414310A (zh) * 2008-10-17 2009-04-22 山西大学 一种自然语言搜索的方法和装置
US20120265535A1 (en) * 2009-09-07 2012-10-18 Donald Ray Bryant-Rich Personal voice operated reminder system
CN103678576A (zh) * 2013-12-11 2014-03-26 华中师范大学 基于动态语义分析的全文检索系统
US20140278355A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Using human perception in building language understanding models
US20140337331A1 (en) * 2013-05-07 2014-11-13 International Business Machines Corporation Methods and Systems for Discovery of Linkage Points Between Data Sources
CN104765769A (zh) * 2015-03-06 2015-07-08 大连理工大学 一种基于词矢量的短文本查询扩展及检索方法
CN105095270A (zh) * 2014-05-12 2015-11-25 北京大学 检索装置和检索方法
US9424840B1 (en) * 2012-08-31 2016-08-23 Amazon Technologies, Inc. Speech recognition platforms

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
US7139695B2 (en) 2002-06-20 2006-11-21 Hewlett-Packard Development Company, L.P. Method for categorizing documents by multilevel feature selection and hierarchical clustering based on parts of speech tagging
US7421433B2 (en) * 2002-10-31 2008-09-02 Hewlett-Packard Development Company, L.P. Semantic-based system including semantic vectors
US8065151B1 (en) * 2002-12-18 2011-11-22 At&T Intellectual Property Ii, L.P. System and method of automatically building dialog services by exploiting the content and structure of websites
US7610191B2 (en) 2004-10-06 2009-10-27 Nuance Communications, Inc. Method for fast semi-automatic semantic annotation
US9275129B2 (en) * 2006-01-23 2016-03-01 Symantec Corporation Methods and systems to efficiently find similar and near-duplicate emails and files
JPWO2008114811A1 (ja) * 2007-03-19 2010-07-08 日本電気株式会社 情報検索システム、情報検索方法及び情報検索用プログラム
US20100205198A1 (en) * 2009-02-06 2010-08-12 Gilad Mishne Search query disambiguation
US20130007585A1 (en) 2009-05-30 2013-01-03 Edmond Kwok-Keung Chow Methods and systems for annotation of digital information
US20110125791A1 (en) 2009-11-25 2011-05-26 Microsoft Corporation Query classification using search result tag ratios
US8874581B2 (en) 2010-07-29 2014-10-28 Microsoft Corporation Employing topic models for semantic class mining
JP2012198277A (ja) * 2011-03-18 2012-10-18 Toshiba Corp 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム
US9483459B1 (en) 2012-03-31 2016-11-01 Google Inc. Natural language correction for speech input
US9280788B2 (en) 2012-06-13 2016-03-08 Oracle International Corporation Information retrieval and navigation using a semantic layer
US9424233B2 (en) 2012-07-20 2016-08-23 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
US8843470B2 (en) 2012-10-05 2014-09-23 Microsoft Corporation Meta classifier for query intent classification
US10235358B2 (en) 2013-02-21 2019-03-19 Microsoft Technology Licensing, Llc Exploiting structured content for unsupervised natural language semantic parsing
US9361885B2 (en) * 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US9183196B1 (en) 2013-06-25 2015-11-10 Google Inc. Parsing annotator framework from external services
US10339216B2 (en) * 2013-07-26 2019-07-02 Nuance Communications, Inc. Method and apparatus for selecting among competing models in a tool for building natural language understanding models
US10867597B2 (en) 2013-09-02 2020-12-15 Microsoft Technology Licensing, Llc Assignment of semantic labels to a sequence of words using neural network architectures
US9613027B2 (en) 2013-11-07 2017-04-04 Microsoft Technology Licensing, Llc Filled translation for bootstrapping language understanding of low-resourced languages
CN103927339B (zh) * 2014-03-27 2017-10-31 北大方正集团有限公司 知识重组系统和知识重组方法
US10417301B2 (en) * 2014-09-10 2019-09-17 Adobe Inc. Analytics based on scalable hierarchical categorization of web content
US9836527B2 (en) * 2016-02-24 2017-12-05 Google Llc Customized query-action mappings for an offline grammar model

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030105589A1 (en) * 2001-11-30 2003-06-05 Wen-Yin Liu Media agent
CN1952928A (zh) * 2005-10-20 2007-04-25 梁威 建立自然语言知识库及其自动问答检索的计算机系统
CN101414310A (zh) * 2008-10-17 2009-04-22 山西大学 一种自然语言搜索的方法和装置
US20120265535A1 (en) * 2009-09-07 2012-10-18 Donald Ray Bryant-Rich Personal voice operated reminder system
US9424840B1 (en) * 2012-08-31 2016-08-23 Amazon Technologies, Inc. Speech recognition platforms
US20140278355A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Using human perception in building language understanding models
US20140337331A1 (en) * 2013-05-07 2014-11-13 International Business Machines Corporation Methods and Systems for Discovery of Linkage Points Between Data Sources
CN103678576A (zh) * 2013-12-11 2014-03-26 华中师范大学 基于动态语义分析的全文检索系统
CN105095270A (zh) * 2014-05-12 2015-11-25 北京大学 检索装置和检索方法
CN104765769A (zh) * 2015-03-06 2015-07-08 大连理工大学 一种基于词矢量的短文本查询扩展及检索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116662582A (zh) * 2023-08-01 2023-08-29 成都信通信息技术有限公司 基于自然语言的特定领域业务知识检索方法及检索装置
CN116662582B (zh) * 2023-08-01 2023-10-10 成都信通信息技术有限公司 基于自然语言的特定领域业务知识检索方法及检索装置

Also Published As

Publication number Publication date
US20190205301A1 (en) 2019-07-04
CN109074353B (zh) 2022-11-08
EP3507708A1 (en) 2019-07-10
US11232101B2 (en) 2022-01-25
EP3507708A4 (en) 2020-04-29
WO2018068176A1 (en) 2018-04-19

Similar Documents

Publication Publication Date Title
CN109074353A (zh) 语言理解和信息检索的组合
JP6923332B2 (ja) 自動通訳方法及び装置
CN106462399B (zh) 代码推荐
CN111695345B (zh) 文本中实体识别方法、以及装置
WO2022083094A1 (zh) 文本语义识别方法、装置、电子设备及存储介质
JP2014534540A (ja) 対話型マルチモード画像検索
US20220366880A1 (en) Method and electronic device for recognizing song, and storage medium
CN110502610A (zh) 基于文本语义相似度的智能语音签名方法、装置及介质
CN109920409B (zh) 一种声音检索方法、装置、系统及存储介质
CN110136689B (zh) 基于迁移学习的歌声合成方法、装置及存储介质
US20220147835A1 (en) Knowledge graph construction system and knowledge graph construction method
CN108701144A (zh) 自动从视频中检测表达情感的内容以及丰富图像索引
US11604925B1 (en) Architecture for gazetteer-augmented named entity recognition
CN108227564A (zh) 一种信息处理方法、终端及计算机可读介质
CN110442711A (zh) 文本智能化清洗方法、装置及计算机可读存储介质
CN112749547A (zh) 文本分类器训练数据的产生
KR20200084260A (ko) 전자 장치 및 이의 제어 방법
CN108345612A (zh) 一种问题处理方法和装置、一种用于问题处理的装置
CN115062134B (zh) 知识问答模型训练及知识问答方法、装置和计算机设备
CN111444321B (zh) 问答方法、装置、电子设备和存储介质
CN113220828B (zh) 意图识别模型处理方法、装置、计算机设备及存储介质
WO2020258503A1 (zh) 基于Tensorflow的语音融合方法、电子装置及存储介质
CN111680514A (zh) 信息处理和模型训练方法、装置、设备及存储介质
WO2023009220A1 (en) Representation generation based on embedding sequence abstraction
CN112767923B (zh) 一种语音识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant