CN103562919B - 利用网络的信息检索方法及相应的语音对话方法 - Google Patents
利用网络的信息检索方法及相应的语音对话方法 Download PDFInfo
- Publication number
- CN103562919B CN103562919B CN201280026904.0A CN201280026904A CN103562919B CN 103562919 B CN103562919 B CN 103562919B CN 201280026904 A CN201280026904 A CN 201280026904A CN 103562919 B CN103562919 B CN 103562919B
- Authority
- CN
- China
- Prior art keywords
- vector
- vector space
- extended
- word
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000013598 vector Substances 0.000 claims abstract description 335
- 238000004458 analytical method Methods 0.000 claims abstract description 63
- 230000004044 response Effects 0.000 claims abstract description 15
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000009118 appropriate response Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种利用网络的信息检索方法和使用该检索方法的语音对话方法,包括:基于提供的用户查询和语言分析结果中的至少一个生成基础词矢量;在矢量空间数据库中检索与基础词矢量相对应的矢量空间;当基础词矢量和检索到的矢量空间之间的相似度低于预置的参考值时,使用扩展词矢量在矢量空间数据库中检索与该扩展词矢量相应的矢量空间,所述扩展词矢量基于使用用户查询和语言分析结果中的至少一个执行的网络检索结果而生成;基于基础检索步骤或者扩展检索步骤中检索到的矢量空间,检索知识信息。如此,提供了针对用户查询的改进检索结果。
Description
技术领域
本发明实施例涉及信息检索,更具体地,涉及一种利用网络的信息检索方法以及一种利用所述信息检索方法的语音对话方法,所述信息检索方法能够利用网络有效地执行信息检索。
背景技术
信息检索是基于特定的知识和信息针对用户的查询而提供合适响应的过程。例如,当在智能电视系统中输入查询专用程序的请求时,通过访问存储有电视程序的知识信息数据库而进行的信息检索,向用户提供查询结果。然而,用于传统信息检索方法中的知识信息数据库是关系数据库,此时问题在于:当提交的查询的格式与存储在数据库中信息的格式不一致时,检索不到合适的信息。当查询具有复杂的需要语义推理才能被理解的格式时,同样存在合适的响应不能被检索的问题。例如,当向一个小型电视系统提出“让我们看一场朴智星的足球比赛”的查询时,我们无法获得“亚洲杯”的查询结果。其原因在于,“亚洲杯”并不包含“朴智星”相关的信息。为了能够正确执行上述查询,朴智星参与亚洲杯的信息需要额外的附加。虽然本体论提供了一种考虑上述语义事件的解决方案,但是构建和管理本体是一项非常困难的工作,为了推理相关知识信息的请求而构建如此多的本体也是不可能的。此外,对于实时改变的信息进行反映也存在着限制。
发明内容
【技术问题】
相应地,本发明的实施例实质上解决了相关技术中的局限和缺点所带来的问题。
本发明实施例提供了一种利用网络的信息检索方法,其通过利用网络进行信息检索,从而向用户提供增强的响应。
本发明实施例还提供了一种语音对话方法,所述语音对话方法使用上述利用网络的信息检索方法,利用网络进行信息检索,从而针对用户的语音查询提供增加的语音响应。
【技术方案】
在一些实施例中,一种利用网络的信息检索方法,包括:生成与提供的用户查询和/或语言分析结果相关的基础词矢量,并使用至少一个基础词矢量在矢量空间数据库中检索与基础词矢量相应的矢量空间;确定基础词矢量与检索到的矢量空间之间的相似度;当所述相似度等于或者小于阈值时,基于使用提供的用户查询和/或语言分析结果而执行的网络检索结果,生成扩展词矢量,并使用所述扩展词矢量在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间;基于在基础检索步骤或者扩展检索步骤中检索到的矢量空间,检索知识信息。
其中,所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
其中,所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用知识信息执行的网络检索结果而形成。
其中,检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的至少一个矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序。
另外,在计算所述扩展检索分值时,根据从提供的用户查询或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
另外,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时,权重值配置为比当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储于扩展矢量空间数据库中的矢量空间时的权重值具有更大数值。
另外,当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,同样的,当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
在本发明的其它实施例中,一种基于利用网络的信息检索方法的语音对话方法,包括:针对用户语音查询执行语音识别,从而将所述用户语音查询转换为用户查询文本;针对转换为用户查询文本的所述用户语音查询执行语言分析;生成有关用户查询文本和/或语言分析结果的基础词矢量,使用所述基础词矢量在矢量空间数据库中检索与所述基础词矢量对应的矢量空间,确定所述基础词矢量和检索到的矢量空间之间的相似度,当所述相似度等于或者小于阈值时,基于使用用户查询文本和/或语言分析结果执行的网络检索结果,生成扩展词矢量,并使用扩展词矢量在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间,并基于检索到对应于基础词矢量或扩展词矢量的矢量空间,检索知识信息;将所述知识信息转换为与用户查询相应的响应;针对所述响应执行语音合成,从而将所述响应转换为语音。
其中,所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
其中,所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由所述知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用所述知识信息执行的网络检索结果而形成。
其中,检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序。
其中,在计算所述扩展检索分值时,根据从所提供的用户查询或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
其中,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值大于当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
其中,当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,同样的,当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
【有益效果】
在前面描述的根据本发明的利用网络的信息检索方法和相应的语音对话方法中,通过在网络检索中扩展知识信息和用户查询信息,可以向用户提供更好的检索结果。
此外,通过网络执行信息检索,不需要进行人工处理,传统的矢量空间模型仍然可用。当今,信息检索中存在大量的信息,诸如问答信息和社会网络信息,这使得执行推理和推荐变得可行并成为迫切需要。
附图说明
图1表示根据本发明实施例的基于利用网络的信息检索方法的语音对话方法的示意图;
图2表示本发明实施例的利用网络的信息检索方法的流程图;
图3表示根据本发明实施例的信息检索方法的基本检索过程的流程图;
图4表示根据本发明实施例的利用网络的信息检索方法的扩展检索过程的流程图;
图5表示根据本发明实施例的利用网络的信息检索方法的构建矢量空间数据库的过程的流程图。
具体实施方式
本说明书公开了本发明的实施例,然而此处公开的特殊的结构和功能性细节只是本发明实施例的代表性描述,本发明实施例还有作多种变形,并不局限于本说明书所描述的实施例。
相应地,由于发明容易受到改进和替换形式的影响,附图中只是给出了特定的实施例,以下将会对特定的实施例作详细的介绍。这样做的目的并不是要将发明限定在所公开的特殊形式,相反地,本发明涵盖了在不脱离本发明原理的前提下所有修饰、替换和等同方案。在附图中相同的标号表示相同的部件。
此处使用的术语用于描述特定的实施例,而非用于限制本发明。例如,除非上下文明确排除,本申请中所使用的单数形式也适用复数形式。本申请中所使用的“包含”,“包括”指定了存在的规定特征、整数、步骤、操作、元素、和/或部件,但其不排除一个或多个其它特征、整数、步骤、操作、元素、部件、和/或它们之间组合的出现或者添加。
除非另作申明,本申请所使用的术语(包括技术术语和科学术语)为本发明所属领域普通技术人员所理解的常见含义。还应当理解,例如定义在常用字典中的术语应理解为具有与相关领域中的上下文一致的含义,而不应被理解为理想化或者过于正式,除非文中明确定义。
在本发明的实施例中,利用网络的信息检索方法以及使用该方法的语音对话方法可以实现为包括至少一个服务器的系统,该系统可以包括至少一个服务器和多个用户终端。
在以下的描述中,将利用网络的信息检索方法和使用该方法的语音对话方法称为“信息检索系统”。
服务器和用户终端之间可以彼此直接连接,或者通过至少一个无线或者有线通信网络连接。此外,所述服务器可以是网络服务器,所述用户终端可以是多种具备与服务器通信功能和具有信息处理功能的终端装置中的一种,例如,便携式多媒体播放器,笔记本电脑,智能电话,智能电视等。
图1表示根据本发明实施例的基于利用网络的信息检索方法的语音对话方法的示意图。
通过图1可见,所述语音对话方法包括以下步骤:步骤S100,提供用户语音查询;步骤S200,语音识别,将所述用户语音查询转换为用户查询文本;步骤S300,对转换为用户查询文本的用户查询执行语言分析;步骤S400,基于用户查询和/或语言分析结果利用网络执行信息检索;步骤S500,将步骤S400中的检索结果转换为响应,从而产生对应于用户查询的响应;步骤S600,对所述响应执行语音合成,以便将所述响应转换为语音。
步骤S400中利用网络进行信息检索将在下文中详细介绍。
图2表示本发明实施例的利用网络的信息检索方法的流程图,图3表示根据本发明实施例的信息检索方法的基本检索过程的流程图,图4表示根据本发明实施例的利用网络的信息检索方法的扩展检索过程的流程图,图5表示根据本发明实施例的利用网络的信息检索方法的构建矢量空间数据库的过程的流程图。
由图2至图5可见,在步骤S400中,通过对存储在知识信息数据库1000中的知识信息进行检索,基于用户查询和/或用户查询的语言分析结果提供针对用户查询的响应。
上述语言分析可以是多种语言分析技术中的一种,例如,语素分析、语句结构分析、语义分析。
语言分析结果可包括言语行为、主体行为和结构信息。所述言语行为不会总是和用户查询的语句格式相匹配,但是可以大概的表示语句类型----陈述句,疑问句,请求句。所述主体行为可以表述用户所希望的行为的警示信息,例如,开/关电视机,查找程序。所述结构信息可以表示用户查询中出现的实体名称的信息,例如,节目的类型,节目的标题,频道的名称,节目的起始时间,节目的演员。另外,用户查询可以是文本类型的惯用语(语法,语音),或者是作为输入惯用语转换结果的用户查询文本。
如图2所示,在利用网络进行信息检索的方法的步骤S410中,可以提供用户查询和语言分析结果中的至少一个。
在利用网络进行信息检索的方法的步骤S420中,基于用户查询和语言分析结果中的至少一个产生基础词矢量,执行基础检索,以便在矢量空间数据库2000中检索对应于基础词矢量的矢量空间。
在步骤S430中,确定在矢量空间数据库2000中是否存在对应于基础词矢量的检索结果,或者基础检索分值是否等于或者小于预置的阈值分值。
根据判断的结果,当矢量空间数据库2000中不存在与基础词矢量相应的检索结果或者基础检索分值等于或者小于预置的阈值分值时,在步骤S440中执行扩展检索。
在执行扩展检索的步骤S440中,通过使用基于用户查询和/或语言分析结果生成的检索关键词执行网络检索并生成对应于检索到的网络文档的扩展词矢量,可以在矢量空间数据库2000中检索到对应于扩展词矢量的矢量空间。
存储在知识信息数据库1000中的与上述基础检索和扩展检索中检索到的矢量空间相对应的知识信息,可以作为检索结果输出。
此外,利用网络进行信息检索的方法的步骤S400还可进一步包括步骤S450:产生与存储在知识信息数据库1000中的知识信息相对应的矢量空间,并将所述产生的矢量空间存储至矢量空间数据库2000中。
其中,产生与知识信息相对应的矢量空间的步骤可以优选地在基础检索和扩展检索之前执行。但是,上述步骤的执行顺序并不限于以上的情况。也就是说,上述产生与知识信息相关的矢量空间的步骤可以独立于步骤S410至步骤S440在任何时间执行。
基础词矢量可以是对应于用户查询和/或语言分析结果的矢量空间,扩展词矢量可以是使用基于用户查询和/或语言分析结果而生成的检索关键词并通过网络检索而检索到的网络文档中包含的单词所对应于矢量空间。
此外,本说明书中包含的“单词”或“词”可以指单个单词、关键词或短语。根据本发明应用的领域,“单词”或“词”可以有所不同。
提供用户查询和语言分析结果的步骤S410可以是提供文本形式的用户查询以及包括前面所述的言语行为、主体行为和结构信息的语言分析结果。
如图3所示,基础检索步骤S420进一步包括:步骤S421,产生与用户查询和/或语言分析结果相对应的基础词矢量;步骤S422,在矢量空间数据库2000中检索与所述基础词矢量相对应的矢量空间。所述基础词矢量可以指使用用户查询和/或语言分析结果所形成的矢量空间。
在判断步骤S430中,对矢量空间数据库2000中是否存在与基础词矢量相对应的矢量空间或者基础检索分值是否等于或者小于预置的阈值分值进行判断。此外,由于扩展检索执行网络检索,所以扩展检索相对于基础检索具有相对滞后的响应时间,从而在步骤S430中可以执行这样的功能,即判断是否仅能执行基础检索。基础检索分值可以是表示基础词矢量和存储在矢量空间数据库2000中的矢量空间之间相关度的数值,并可以通过使用例如余弦相似度的各种计算方法进行计算。例如,所述余弦相似度可以通过以下公式1获得。
【公式1】
在上述公式1中,S表示余弦相似度,A和B表示矢量空间,||A||和||B||表示矢量空间A和B的绝对值。
此外,根据语言分析结果中显示的基础词矢量和矢量空间数据库2000中存储的矢量空间的结构信息是否相同而调整的权重值可以用于计算。
例如,假设用户查询是“观看亚洲杯足球赛”。当用户查询的语言分析结果为“标题:亚洲杯,足球赛”,基础词矢量产生的格式如下:<(标题:亚洲杯,0.5)>,<(标题:足球赛,0.5)>。另外,假设存储在矢量空间数据库2000中的矢量空间的字段为<(标题:亚洲杯,0.2)>,<(种类:足球赛,0.3)>,如果将余弦相似度用于计算此分值,则基础检索分值可计算为:(0.5×0.2+0.5×0.3)/(0.707+0.361)=0.234。然而,如果针对相同结构信息的权重值取0.7,而针对不同结构信息的权重值取0.3时,考虑到上述结构信息,所述基础检索分值如下:(0.5×0.2×0.7+0.5×0.3×0.3)/(0.707+0.361)=0.108。
当矢量空间数据库2000中不存在与基础词矢量相应的矢量空间或者基础检索分值等于或者小于预置阈值时,可以执行扩展检索步骤S440。步骤S440可进一步包括:步骤S441,产生与用户查询和/或语言分析结果相关的检索关键词;步骤S443,执行网络检索;步骤S444,产生与检索到的网络文档对应的扩展词矢量;步骤S445,在存储在矢量空间数据库2000中的矢量空间之中检索与扩展词矢量对应的矢量空间。对于检索关键词,可以使用用户查询和语言分析结果的至少一个重要字段,并可以根据哪个字段是用户经常检索的字段或者哪个字段具有典型属性来确定用于检索关键词的字段,或者还可以使用试探法进行确定。这里,在产生检索关键词时考虑用户查询的原因是考虑到了这种情况,即关键词没有在语言分析结果中表示出来。例如,假设用户查询为“看场有趣的电影”,尽管“有趣”是重要的词,在用户查询的语言分析结果中也可能不会表示出来。
使用检索关键词的网络检索可在步骤S443中执行,与通过网络检索而检索到的网络文档对应的扩展词矢量在步骤S444中产生。所述扩展词矢量可以是对应于检索到的网络文档中所包含的各个单词而产生的矢量空间。对应于扩展词矢量的矢量空间可以使用扩展的矢量空间在存储在矢量空间数据库2000中的矢量空间中进行检索。根据扩展检索分值是否等于或者大于所述预置的阈值,确定哪个矢量空间与扩展词矢量相对应,并且,检索到的矢量空间以每个检索到的矢量空间的扩展检索分值的升序进行排序。
扩展检索分值可以作为扩展词矢量和存储在矢量空间数据库2000中的矢量空间之间的相似度计算,并且,根据扩展词矢量和存储在矢量空间数据库中的矢量空间的生成方式的不同而调整的权重值可用于此计算。
特别地,所述扩展检索分值可以按照公式2计算得到。
【公式2】
在上述公式2中,表示在网络检索之前通过语言分析所产生的基础词矢量,表示在网络检索之前基于用户查询所产生的基础词矢量,表示网络检索后通过语言分析所产生的扩展词矢量,表示在网络检索之后基于用户查询所产生的扩展词矢量。
其中,表示存储在基础矢量空间数据库2100中与存储在知识信息数据库1000中的知识信息的每个字段相对应的矢量空间;表示与在扩展矢量空间数据库2200中检索到的网络文档的每个字段相对应的单词矢量
另外,α1表示在基于与存储在基础矢量空间数据库2100中的矢量空间相对应的语言分析结果产生扩展词矢量时的权重值;α2表示在基于与存储在基础矢量空间数据库2100中的矢量空间相对应的用户查询产生扩展词矢量时的权重值。另外,β1表示在基于与存储在扩展矢量空间数据库2200中的矢量空间相对应的语言分析结果产生扩展词矢量时的权重值,β2表示在基于与存储在扩展矢量空间数据库2200中的矢量空间相对应的用户查询产生扩展词矢量时的权重值。根据扩展词矢量以及矢量空间数据库的矢量空间的不同产生方式,上述权重值可以改变和配置
例如,假设存储在基础矢量空间数据库2100中未经过网络检索所产生的矢量空间的可靠性好于存储在扩展矢量空间数据库2200中经网络检索而产生的矢量空间的可靠性,则α1和α2可配置为大于β1和β2。
此外,假设用户查询的语言分析中的关键词比用户查询中的关键词更加重要,则α1可配置为大于α2,β1可配置为大于β2。
生成矢量空间并将生成的矢量空间存储于矢量空间数据库2000中的步骤S450可进一步包括:步骤S451,将知识信息数据库1000中存储的知识信息所形成的基础矢量空间存储到矢量空间数据库2100中;步骤S452,从存储在知识信息数据库1000中的知识信息中提取关键词,并使用所述关键词执行网络检索;步骤S453,从检索到的网络文档形成扩展矢量空间,并将所述扩展矢量空间存储至扩展矢量空间数据库2200中。
所述基础矢量空间可包含预先产生的对应于存储在知识信息数据库1000中的文档的每个单词的矢量空间和结构信息。
例如,假设标题为“朴智星曼彻斯特联合比赛”的文档存储在知识信息数据库1000中,并且登记识别号为10,则基础矢量空间<朴智星,10,0.3>,<曼彻斯特,10,0.2>,<联合,10,0.1>,<比赛,10,0.1>可以存储在基础矢量空间数据库2100中。其中,“朴智星”表示一个词,“10”表示该词存储的登记识别号,“0.3”表示该词的权重值。所述结构信息表示该词所属的类别,例如,所述结构信息可以是知识信息数据库1000中列的标题,以及用户查询语言分析结果中实体的名称。此外,所述结构信息还可用作在基础检索步骤S420中使用的基础检索分值的附加信息。
例如,当在知识信息数据库1000中检索到有关“演员表”的特定信息并在语言分析结果中检索到有关“演员表”的特定信息时,可以使用更大的权重值。
存储在知识信息数据库1000中的知识信息的每个词对应的权重值可按照下面的公式3进行计算,对词频(TF)和逆向文件频率(IDF)进行乘法运算。
【公式3】
在公式3中,词频(tfi,j)可通过将文档(dj)中特定词的出现次数除以文档(dj)的总词数而计算获得。逆向文件频率(idfi)则通过将总文档数(|D|)除以出现该词的文档数(|{dj:ti∈dj}|)再取对数获得。
所述扩展矢量空间数据库2200可在步骤S452和步骤S453中构建,在步骤S452中,从存储在知识信息数据库1000中的知识信息中提取关键词,在步骤S453中,形成与检索到的网络文档的每个词相对应的扩展矢量空间。
对于关键词,可使用存储在知识信息数据库1000中的知识信息的重要字段,根据哪个字段是用户频繁检索的字段或者哪个字段具有描述属性对用作关键词的上述字段进行确定,或者也可以采用试探法进行确定。
例如,在电视节目表中,“节目标题”可以是用作关键词的重要字段。例如,在检索书籍时,“书名”可以是用作关键词的重要字段。由于网络文档可能会包含没有存储在知识信息数据库1000中的信息,所以网络文档可以对知识信息数据库1000进行补充。例如,存储在知识信息数据库中的“亚洲杯”信息,经过网络检索获得有关“朴智星”和“赵光来”的附加信息后,可以得到扩展。
在前面所描述的利用网络的信息检索方法和相应的语音对话方法中,通过网络检索扩展知识信息和用户查询信息,提供了更好的用户查询检索结果。
此外,由于信息检索通过网络进行,所以可能不需要进行人工处理,传统的矢量空间模型仍然可用。大量例如问答信息和社交网络信息的最近信息可以在信息检索中得到体现,从而本发明的一个很大的优势在于能够进行推理和推荐。
尽管对本发明实施例及其优点的详尽介绍,在不脱离本发明原理的前提下,还可对针对本发明做出多种变化、替换以及改动。
Claims (8)
1.一种利用网络的信息检索方法,包括:
生成基础词矢量,所述基础词矢量是对应于所提供的用户查询文本和/或通过所提供的用户查询文本得到的语言分析结果的矢量空间,并在矢量空间数据库中检索与基础词矢量相应的矢量空间;
确定基础词矢量与检索到的矢量空间之间的相似度;
当所述相似度等于或者小于阈值时,生成扩展词矢量,所述扩展词矢量是使用基于用户查询文本和/或语言分析结果而生成的检索关键词并通过网络检索而检索到的网络文档中包含的单词所对应的矢量空间,并在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间;
基于在基础检索步骤或者扩展检索步骤中检索到的矢量空间,检索存储在知识信息数据库的知识信息,
其中所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用知识信息执行的网络检索而形成,
其中检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的至少一个矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序,
其中,在计算所述扩展检索分值时,根据从所提供的用户查询文本或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
2.如权利要求1所述的方法,其中所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
3.如权利要求1所述的方法,其中,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间或者从用户查询文本生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时,权重值比当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询文本生成的扩展词矢量对应于存储于扩展矢量空间数据库中的矢量空间时的权重值具有更大数值。
4.如权利要求1所述的方法,其中,
当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询文本生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,并且,
当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询文本生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
5.一种基于利用网络的信息检索方法的语音对话方法,包括:
针对用户语音查询执行语音识别,从而将所述用户语音查询转换为用户查询文本;
针对转换为用户查询文本的所述用户语音查询执行语言分析;
生成基础词矢量,基础词矢量是对应于用户查询文本和/或通过所提供的用户查询文本得到的语言分析结果的矢量空间,在矢量空间数据库中检索与所述基础词矢量对应的矢量空间,确定所述基础词矢量和检索到的矢量空间之间的相似度,
当所述相似度等于或者小于阈值时,生成扩展词矢量,所述扩展词矢量是使用基于用户查询文本和/或语言分析结果而生成的检索关键词并通过网络检索而检索到的网络文档中包含的单词所对应的矢量空间,并在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间,并基于检索到对应于基础词矢量或扩展词矢量的矢量空间,检索存储在知识信息数据库的知识信息;
将所述知识信息转换为与用户查询相应的响应;
针对所述响应执行语音合成,从而将所述响应转换为语音,
其中所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用知识信息执行的网络检索而形成,
其中检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的至少一个矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序,
其中,在计算所述扩展检索分值时,根据从所提供的用户查询或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
6.如权利要求5所述的语音对话方法,其中所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
7.如权利要求5所述的语音对话方法,其中,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时,权重值大于当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
8.如权利要求5所述的语音对话方法,其中,
当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,并且
当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2011-0053400 | 2011-06-02 | ||
KR1020110053400A KR101252397B1 (ko) | 2011-06-02 | 2011-06-02 | 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법 |
PCT/KR2012/004405 WO2012165929A2 (ko) | 2011-06-02 | 2012-06-04 | 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103562919A CN103562919A (zh) | 2014-02-05 |
CN103562919B true CN103562919B (zh) | 2017-02-15 |
Family
ID=47260131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280026904.0A Expired - Fee Related CN103562919B (zh) | 2011-06-02 | 2012-06-04 | 利用网络的信息检索方法及相应的语音对话方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9213746B2 (zh) |
EP (1) | EP2717176A4 (zh) |
KR (1) | KR101252397B1 (zh) |
CN (1) | CN103562919B (zh) |
WO (1) | WO2012165929A2 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116649B (zh) * | 2013-02-28 | 2016-09-14 | 用友网络科技股份有限公司 | 数据分析系统和数据分析方法 |
US20150120723A1 (en) * | 2013-10-24 | 2015-04-30 | Xerox Corporation | Methods and systems for processing speech queries |
WO2015102124A1 (ko) * | 2013-12-31 | 2015-07-09 | 엘지전자 주식회사 | 대화 서비스 제공 장치 및 방법 |
JP6400038B2 (ja) * | 2016-03-18 | 2018-10-03 | ヤフー株式会社 | 抽出装置および抽出方法 |
KR102604552B1 (ko) * | 2016-07-15 | 2023-11-22 | 삼성전자주식회사 | 단어 임베딩 방법, 단어 임베딩 장치, 음성 인식 방법 및 음성 인식 장치 |
JP6787770B2 (ja) * | 2016-12-14 | 2020-11-18 | 東京都公立大学法人 | 言語記憶方法及び言語対話システム |
CN108345580B (zh) | 2017-01-22 | 2020-05-15 | 创新先进技术有限公司 | 一种词向量处理方法及装置 |
CN107993650A (zh) * | 2017-11-30 | 2018-05-04 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
KR102069076B1 (ko) * | 2018-05-11 | 2020-01-22 | 경북대학교 산학협력단 | 대화문장 생성 장치, 이를 포함하는 대화로봇 및 대화문장 생성 방법 |
US11055329B2 (en) * | 2018-05-31 | 2021-07-06 | Microsoft Technology Licensing, Llc | Query and information meter for query session |
US11615144B2 (en) * | 2018-05-31 | 2023-03-28 | Microsoft Technology Licensing, Llc | Machine learning query session enhancement |
US20200135189A1 (en) * | 2018-10-25 | 2020-04-30 | Toshiba Tec Kabushiki Kaisha | System and method for integrated printing of voice assistant search results |
CN109635093B (zh) * | 2018-12-17 | 2022-05-27 | 北京百度网讯科技有限公司 | 用于生成回复语句的方法和装置 |
CN109920430A (zh) * | 2019-01-10 | 2019-06-21 | 上海言通网络科技有限公司 | 语音识别语义处理系统及其方法 |
CN110277086B (zh) * | 2019-06-25 | 2021-11-19 | 中国科学院自动化研究所 | 基于电网调度知识图谱的语音合成方法、系统及电子设备 |
KR20240050164A (ko) | 2022-10-11 | 2024-04-18 | 재단법인 아산사회복지재단 | 인공 지능 기반의 의료기기 상담 지원 서비스를 제공하는 방법 및 장치 |
US12111858B1 (en) * | 2023-10-04 | 2024-10-08 | Salesforce, Inc. | Database system interaction embedding and indexing for text retrieval and generation |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6480819B1 (en) * | 1999-02-25 | 2002-11-12 | Matsushita Electric Industrial Co., Ltd. | Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100467104B1 (ko) * | 2001-05-11 | 2005-01-24 | 김시환 | 정보 검색 시스템과 그 방법 |
KR100792208B1 (ko) * | 2005-12-05 | 2008-01-08 | 한국전자통신연구원 | 음성 대화 시스템에서 답변 문장 생성 방법 및 장치 |
KR100816923B1 (ko) * | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | 문서 분류 시스템 및 그 방법 |
CA2653932C (en) * | 2006-06-02 | 2013-03-19 | Telcordia Technologies, Inc. | Concept based cross media indexing and retrieval of speech documents |
KR100862583B1 (ko) * | 2007-08-20 | 2008-10-09 | 인하대학교 산학협력단 | 의사연관피드백과 비음수 행렬 분해를 이용한 문서요약장치 및 방법 |
KR101300839B1 (ko) * | 2007-12-18 | 2013-09-10 | 삼성전자주식회사 | 음성 검색어 확장 방법 및 시스템 |
US7809715B2 (en) * | 2008-04-15 | 2010-10-05 | Yahoo! Inc. | Abbreviation handling in web search |
KR101289081B1 (ko) * | 2009-09-10 | 2013-07-22 | 한국전자통신연구원 | 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법 |
US8630860B1 (en) * | 2011-03-03 | 2014-01-14 | Nuance Communications, Inc. | Speaker and call characteristic sensitive open voice search |
-
2011
- 2011-06-02 KR KR1020110053400A patent/KR101252397B1/ko active IP Right Grant
-
2012
- 2012-06-04 US US14/123,449 patent/US9213746B2/en active Active
- 2012-06-04 EP EP12792843.0A patent/EP2717176A4/en not_active Withdrawn
- 2012-06-04 WO PCT/KR2012/004405 patent/WO2012165929A2/ko active Application Filing
- 2012-06-04 CN CN201280026904.0A patent/CN103562919B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6480819B1 (en) * | 1999-02-25 | 2002-11-12 | Matsushita Electric Industrial Co., Ltd. | Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television |
Non-Patent Citations (1)
Title |
---|
"MySQL FULLTEXT Indexing and Searching";Anonymous;《http://www.petefreitag.com/item/477.cfm》;20050929;第1页第1段-第3页第1段 * |
Also Published As
Publication number | Publication date |
---|---|
KR101252397B1 (ko) | 2013-04-08 |
US9213746B2 (en) | 2015-12-15 |
WO2012165929A2 (ko) | 2012-12-06 |
CN103562919A (zh) | 2014-02-05 |
KR20120135449A (ko) | 2012-12-14 |
US20140108389A1 (en) | 2014-04-17 |
WO2012165929A3 (ko) | 2013-02-07 |
EP2717176A4 (en) | 2015-02-25 |
EP2717176A2 (en) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103562919B (zh) | 利用网络的信息检索方法及相应的语音对话方法 | |
JP6505903B2 (ja) | 会話型相互作用システムの検索入力におけるユーザ意図を推定する方法およびそのためのシステム | |
JP6657124B2 (ja) | 会話理解システムのためのセッションコンテキストモデリング | |
US8620658B2 (en) | Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition | |
CN109509470B (zh) | 语音交互方法、装置、计算机可读存储介质及终端设备 | |
US8140530B2 (en) | Similarity calculation device and information search device | |
CN101309327B (zh) | 语音聊天系统、信息处理装置、话语识别和关键字检测 | |
US20130166303A1 (en) | Accessing media data using metadata repository | |
KR101661198B1 (ko) | 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 | |
US20090319883A1 (en) | Automatic Video Annotation through Search and Mining | |
CN109920409B (zh) | 一种声音检索方法、装置、系统及存储介质 | |
JP2010026640A (ja) | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム | |
CN101952824A (zh) | 计算机执行的对数据库中的文献进行索引和检索的方法以及信息检索系统 | |
JP2010154397A (ja) | データ処理装置、データ処理方法、及び、プログラム | |
JP2008287210A (ja) | 音声チャットシステム、情報処理装置、音声認識方法およびプログラム | |
CN114880447A (zh) | 信息检索方法、装置、设备及存储介质 | |
CN109977294B (zh) | 信息/查询处理装置、查询处理/文本查询方法、存储介质 | |
CN113934869A (zh) | 一种数据库构建方法、多媒体文件的检索方法及装置 | |
CN106653006B (zh) | 基于语音交互的搜索方法和装置 | |
CN113505196B (zh) | 基于词性的文本检索方法、装置、电子设备及存储介质 | |
JP2009163358A (ja) | 情報処理装置、情報処理方法、プログラムおよび音声チャットシステム | |
CN105095270B (zh) | 检索装置和检索方法 | |
CN113593543B (zh) | 智能音箱语音服务系统、方法、装置及设备 | |
Pan et al. | Type-II dialogue systems for information access from unstructured knowledge sources | |
JP3875510B2 (ja) | 情報検索装置、その方法、そのプログラム及びそのプログラムが記録された記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170215 Termination date: 20200604 |