CN103562919A - 利用网络的信息检索方法及相应的语音对话方法 - Google Patents

利用网络的信息检索方法及相应的语音对话方法 Download PDF

Info

Publication number
CN103562919A
CN103562919A CN201280026904.0A CN201280026904A CN103562919A CN 103562919 A CN103562919 A CN 103562919A CN 201280026904 A CN201280026904 A CN 201280026904A CN 103562919 A CN103562919 A CN 103562919A
Authority
CN
China
Prior art keywords
vector
expansion
rules
data model
spatial database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280026904.0A
Other languages
English (en)
Other versions
CN103562919B (zh
Inventor
李根培
金石焕
金京德
李东贤
崔俊辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Academy Industry Foundation of POSTECH
Original Assignee
Academy Industry Foundation of POSTECH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Academy Industry Foundation of POSTECH filed Critical Academy Industry Foundation of POSTECH
Publication of CN103562919A publication Critical patent/CN103562919A/zh
Application granted granted Critical
Publication of CN103562919B publication Critical patent/CN103562919B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种利用网络的信息检索方法和使用该检索方法的语音对话方法,包括:基于提供的用户查询和语言分析结果中的至少一个生成基础词矢量;在矢量空间数据库中检索与基础词矢量相对应的矢量空间;当基础词矢量和检索到的矢量空间之间的相似度低于预置的参考值时,使用扩展词矢量在矢量空间数据库中检索与该扩展词矢量相应的矢量空间,所述扩展词矢量基于使用用户查询和语言分析结果中的至少一个执行的网络检索结果而生成;基于基础检索步骤或者扩展检索步骤中检索到的矢量空间,检索知识信息。如此,提供了针对用户查询的改进检索结果。

Description

利用网络的信息检索方法及相应的语音对话方法
技术领域
本发明实施例涉及信息检索,更具体地,涉及一种利用网络的信息检索方法以及一种利用所述信息检索方法的语音对话方法,所述信息检索方法能够利用网络有效地执行信息检索。
背景技术
信息检索是基于特定的知识和信息针对用户的查询而提供合适响应的过程。例如,当在智能电视系统中输入查询专用程序的请求时,通过访问存储有电视程序的知识信息数据库而进行的信息检索,向用户提供查询结果。然而,用于传统信息检索方法中的知识信息数据库是关系数据库,此时问题在于:当提交的查询的格式与存储在数据库中信息的格式不一致时,检索不到合适的信息。当查询具有复杂的需要语义推理才能被理解的格式时,同样存在合适的响应不能被检索的问题。例如,当向一个小型电视系统提出“让我们看一场朴智星的足球比赛”的查询时,我们无法获得“亚洲杯”的查询结果。其原因在于,“亚洲杯”并不包含“朴智星”相关的信息。为了能够正确执行上述查询,朴智星参与亚洲杯的信息需要额外的附加。虽然本体论提供了一种考虑上述语义事件的解决方案,但是构建和管理本体是一项非常困难的工作,为了推理相关知识信息的请求而构建如此多的本体也是不可能的。此外,对于实时改变的信息进行反映也存在着限制。
发明内容
【技术问题】
相应地,本发明的实施例实质上解决了相关技术中的局限和缺点所带来的问题。
本发明实施例提供了一种利用网络的信息检索方法,其通过利用网络进行信息检索,从而向用户提供增强的响应。
本发明实施例还提供了一种语音对话方法,所述语音对话方法使用上述利用网络的信息检索方法,利用网络进行信息检索,从而针对用户的语音查询提供增加的语音响应。
【技术方案】
在一些实施例中,一种利用网络的信息检索方法,包括:生成与提供的用户查询和/或语言分析结果相关的基础词矢量,并使用至少一个基础词矢量在矢量空间数据库中检索与基础词矢量相应的矢量空间;确定基础词矢量与检索到的矢量空间之间的相似度;当所述相似度等于或者小于阈值时,基于使用提供的用户查询和/或语言分析结果而执行的网络检索结果,生成扩展词矢量,并使用所述扩展词矢量在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间;基于在基础检索步骤或者扩展检索步骤中检索到的矢量空间,检索知识信息。
其中,所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
其中,所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用知识信息执行的网络检索结果而形成。
其中,检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的至少一个矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序。
另外,在计算所述扩展检索分值时,根据从提供的用户查询或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
另外,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时,权重值配置为比当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储于扩展矢量空间数据库中的矢量空间时的权重值具有更大数值。
另外,当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,同样的,当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
在本发明的其它实施例中,一种基于利用网络的信息检索方法的语音对话方法,包括:针对用户语音查询执行语音识别,从而将所述用户语音查询转换为用户查询文本;针对转换为用户查询文本的所述用户语音查询执行语言分析;生成有关用户查询文本和/或语言分析结果的基础词矢量,使用所述基础词矢量在矢量空间数据库中检索与所述基础词矢量对应的矢量空间,确定所述基础词矢量和检索到的矢量空间之间的相似度,当所述相似度等于或者小于阈值时,基于使用用户查询文本和/或语言分析结果执行的网络检索结果,生成扩展词矢量,并使用扩展词矢量在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间,并基于检索到对应于基础词矢量或扩展词矢量的矢量空间,检索知识信息;将所述知识信息转换为与用户查询相应的响应;针对所述响应执行语音合成,从而将所述响应转换为语音。
其中,所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
其中,所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由所述知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用所述知识信息执行的网络检索结果而形成。
其中,检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序。
其中,在计算所述扩展检索分值时,根据从所提供的用户查询或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
其中,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值大于当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
其中,当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,同样的,当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
【有益效果】
在前面描述的根据本发明的利用网络的信息检索方法和相应的语音对话方法中,通过在网络检索中扩展知识信息和用户查询信息,可以向用户提供更好的检索结果。
此外,通过网络执行信息检索,不需要进行人工处理,传统的矢量空间模型仍然可用。当今,信息检索中存在大量的信息,诸如问答信息和社会网络信息,这使得执行推理和推荐变得可行并成为迫切需要。
附图说明
图1表示根据本发明实施例的基于利用网络的信息检索方法的语音对话方法的示意图;
图2表示本发明实施例的利用网络的信息检索方法的流程图;
图3表示根据本发明实施例的信息检索方法的基本检索过程的流程图;
图4表示根据本发明实施例的利用网络的信息检索方法的扩展检索过程的流程图;
图5表示根据本发明实施例的利用网络的信息检索方法的构建矢量空间数据库的过程的流程图。
具体实施方式
本说明书公开了本发明的实施例,然而此处公开的特殊的结构和功能性细节只是本发明实施例的代表性描述,本发明实施例还有作多种变形,并不局限于本说明书所描述的实施例。
相应地,由于发明容易受到改进和替换形式的影响,附图中只是给出了特定的实施例,以下将会对特定的实施例作详细的介绍。这样做的目的并不是要将发明限定在所公开的特殊形式,相反地,本发明涵盖了在不脱离本发明原理的前提下所有修饰、替换和等同方案。在附图中相同的标号表示相同的部件。
此处使用的术语用于描述特定的实施例,而非用于限制本发明。例如,除非上下文明确排除,本申请中所使用的单数形式也适用复数形式。本申请中所使用的“包含”,“包括”指定了存在的规定特征、整数、步骤、操作、元素、和/或部件,但其不排除一个或多个其它特征、整数、步骤、操作、元素、部件、和/或它们之间组合的出现或者添加。
除非另作申明,本申请所使用的术语(包括技术术语和科学术语)为本发明所属领域普通技术人员所理解的常见含义。还应当理解,例如定义在常用字典中的术语应理解为具有与相关领域中的上下文一致的含义,而不应被理解为理想化或者过于正式,除非文中明确定义。
在本发明的实施例中,利用网络的信息检索方法以及使用该方法的语音对话方法可以实现为包括至少一个服务器的系统,该系统可以包括至少一个服务器和多个用户终端。
在以下的描述中,将利用网络的信息检索方法和使用该方法的语音对话方法称为“信息检索系统”。
服务器和用户终端之间可以彼此直接连接,或者通过至少一个无线或者有线通信网络连接。此外,所述服务器可以是网络服务器,所述用户终端可以是多种具备与服务器通信功能和具有信息处理功能的终端装置中的一种,例如,便携式多媒体播放器,笔记本电脑,智能电话,智能电视等。
图1表示根据本发明实施例的基于利用网络的信息检索方法的语音对话方法的示意图。
通过图1可见,所述语音对话方法包括以下步骤:步骤S100,提供用户语音查询;步骤S200,语音识别,将所述用户语音查询转换为用户查询文本;步骤S300,对转换为用户查询文本的用户查询执行语言分析;步骤S400,基于用户查询和/或语言分析结果利用网络执行信息检索;步骤S500,将步骤S400中的检索结果转换为响应,从而产生对应于用户查询的响应;步骤S600,对所述响应执行语音合成,以便将所述响应转换为语音。
步骤S400中利用网络进行信息检索将在下文中详细介绍。
图2表示本发明实施例的利用网络的信息检索方法的流程图,图3表示根据本发明实施例的信息检索方法的基本检索过程的流程图,图4表示根据本发明实施例的利用网络的信息检索方法的扩展检索过程的流程图,图5表示根据本发明实施例的利用网络的信息检索方法的构建矢量空间数据库的过程的流程图。
由图2至图5可见,在步骤S400中,通过对存储在知识信息数据库1000中的知识信息进行检索,基于用户查询和/或用户查询的语言分析结果提供针对用户查询的响应。
上述语言分析可以是多种语言分析技术中的一种,例如,语素分析、语句结构分析、语义分析。
语言分析结果可包括言语行为、主体行为和结构信息。所述言语行为不会总是和用户查询的语句格式相匹配,但是可以大概的表示语句类型----陈述句,疑问句,请求句。所述主体行为可以表述用户所希望的行为的警示信息,例如,开/关电视机,查找程序。所述结构信息可以表示用户查询中出现的实体名称的信息,例如,节目的类型,节目的标题,频道的名称,节目的起始时间,节目的演员。另外,用户查询可以是文本类型的惯用语(语法,语音),或者是作为输入惯用语转换结果的用户查询文本。
如图2所示,在利用网络进行信息检索的方法的步骤S410中,可以提供用户查询和语言分析结果中的至少一个。
在利用网络进行信息检索的方法的步骤S420中,基于用户查询和语言分析结果中的至少一个产生基础词矢量,执行基础检索,以便在矢量空间数据库2000中检索对应于基础词矢量的矢量空间。
在步骤S430中,确定在矢量空间数据库2000中是否存在对应于基础词矢量的检索结果,或者基础检索分值是否等于或者小于预置的阈值分值。
根据判断的结果,当矢量空间数据库2000中不存在与基础词矢量相应的检索结果或者基础检索分值等于或者小于预置的阈值分值时,在步骤S440中执行扩展检索。
在执行扩展检索的步骤S440中,通过使用基于用户查询和/或语言分析结果生成的检索关键词执行网络检索并生成对应于检索到的网络文档的扩展词矢量,可以在矢量空间数据库2000中检索到对应于扩展词矢量的矢量空间。
存储在知识信息数据库1000中的与上述基础检索和扩展检索中检索到的矢量空间相对应的知识信息,可以作为检索结果输出。
此外,利用网络进行信息检索的方法的步骤S400还可进一步包括步骤S450:产生与存储在知识信息数据库1000中的知识信息相对应的矢量空间,并将所述产生的矢量空间存储至矢量空间数据库2000中。
其中,产生与知识信息相对应的矢量空间的步骤可以优选地在基础检索和扩展检索之前执行。但是,上述步骤的执行顺序并不限于以上的情况。也就是说,上述产生与知识信息相关的矢量空间的步骤可以独立于步骤S410至步骤S440在任何时间执行。
基础词矢量可以是对应于用户查询和/或语言分析结果的矢量空间,扩展词矢量可以是使用基于用户查询和/或语言分析结果而生成的检索关键词并通过网络检索而检索到的网络文档中包含的单词所对应于矢量空间。
此外,本说明书中包含的“单词”或“词”可以指单个单词、关键词或短语。根据本发明应用的领域,“单词”或“词”可以有所不同。
提供用户查询和语言分析结果的步骤S410可以是提供文本形式的用户查询以及包括前面所述的言语行为、主体行为和结构信息的语言分析结果。
如图3所示,基础检索步骤S420进一步包括:步骤S421,产生与用户查询和/或语言分析结果相对应的基础词矢量;步骤S422,在矢量空间数据库2000中检索与所述基础词矢量相对应的矢量空间。所述基础词矢量可以指使用用户查询和/或语言分析结果所形成的矢量空间。
在判断步骤S430中,对矢量空间数据库2000中是否存在与基础词矢量相对应的矢量空间或者基础检索分值是否等于或者小于预置的阈值分值进行判断。此外,由于扩展检索执行网络检索,所以扩展检索相对于基础检索具有相对滞后的响应时间,从而在步骤S430中可以执行这样的功能,即判断是否仅能执行基础检索。基础检索分值可以是表示基础词矢量和存储在矢量空间数据库2000中的矢量空间之间相关度的数值,并可以通过使用例如余弦相似度的各种计算方法进行计算。例如,所述余弦相似度可以通过以下公式1获得。
【公式1】
Figure BDA0000427997600000091
上述公式1中,S表示余弦相似度,A和B表示矢量空间,||A||和||B||表示矢量空间A和B的绝对值。
此外,根据语言分析结果中显示的基础词矢量和矢量空间数据库2000中存储的矢量空间的结构信息是否相同而调整的权重值可以用于计算。
例如,假设用户查询是“观看亚洲杯足球赛”。当用户查询的语言分析结果为“标题:亚洲杯,足球赛”,基础词矢量产生的格式如下:<(标题:亚洲杯,0.5)>,<(标题:足球赛,0.5)>。另外,假设存储在矢量空间数据库2000中的矢量空间的字段为<(标题:亚洲杯,0.2)>,<(种类:足球赛,0.3)>,如果将余弦相似度用于计算此分值,则基础检索分值可计算为:(0.5×0.2+0.5×0.3)/(0.707+0.361)=0.234。然而,如果针对相同结构信息的权重值取0.7,而针对不同结构信息的权重值取0.3时,考虑到上述结构信息,所述基础检索分值如下:(0.5×0.2×0.7+0.5×0.3×0.3)/(0.707+0.361)=0.108。
当矢量空间数据库2000中不存在与基础词矢量相应的矢量空间或者基础检索分值等于或者小于预置阈值时,可以执行扩展检索步骤S440。步骤S440可进一步包括:步骤S441,产生与用户查询和/或语言分析结果相关的检索关键词;步骤S443,执行网络检索;步骤S444,产生与检索到的网络文档对应的扩展词矢量;步骤S445,在存储在矢量空间数据库2000中的矢量空间之中检索与扩展词矢量对应的矢量空间。对于检索关键词,可以使用用户查询和语言分析结果的至少一个重要字段,并可以根据哪个字段是用户经常检索的字段或者哪个字段具有典型属性来确定用于检索关键词的字段,或者还可以使用试探法进行确定。这里,在产生检索关键词时考虑用户查询的原因是考虑到了这种情况,即关键词没有在语言分析结果中表示出来。例如,假设用户查询为“看场有趣的电影”,尽管“有趣”是重要的词,在用户查询的语言分析结果中也可能不会表示出来。
使用检索关键词的网络检索可在步骤S443中执行,与通过网络检索而检索到的网络文档对应的扩展词矢量在步骤S444中产生。所述扩展词矢量可以是对应于检索到的网络文档中所包含的各个单词而产生的矢量空间。对应于扩展词矢量的矢量空间可以使用扩展的矢量空间在存储在矢量空间数据库2000中的矢量空间中进行检索。根据扩展检索分值是否等于或者大于所述预置的阈值,确定哪个矢量空间与扩展词矢量相对应,并且,检索到的矢量空间以每个检索到的矢量空间的扩展检索分值的升序进行排序。
扩展检索分值可以作为扩展词矢量和存储在矢量空间数据库2000中的矢量空间之间的相似度计算,并且,根据扩展词矢量和存储在矢量空间数据库中的矢量空间的生成方式的不同而调整的权重值可用于此计算。
特别地,所述扩展检索分值可以按照公式2计算得到。
【公式2】
score ( q , t i ) = &Sigma; k &Element; { 1,2 } &alpha; k &CenterDot; f ( q k l &RightArrow; , t i l &RightArrow; ) + &Sigma; k &Element; { 1,2 } &beta; k &CenterDot; f ( q k w &RightArrow; , t i w &RightArrow; )
在上述公式2中,
Figure BDA0000427997600000112
表示在网络检索之前通过语言分析所产生的基础词矢量,
Figure BDA0000427997600000113
表示在网络检索之前基于用户查询所产生的基础词矢量,
Figure BDA0000427997600000114
表示网络检索后通过语言分析所产生的扩展词矢量,
Figure BDA0000427997600000115
表示在网络检索之后基于用户查询所产生的扩展词矢量。
其中,
Figure BDA0000427997600000116
表示存储在基础矢量空间数据库2100中与存储在知识信息数据库1000中的知识信息的每个字段相对应的矢量空间;表示与在扩展矢量空间数据库2200中检索到的网络文档的每个字段相对应的单词矢量
另外,α1表示在基于与存储在基础矢量空间数据库2100中的矢量空间相对应的语言分析结果产生扩展词矢量时的权重值;α2表示在基于与存储在基础矢量空间数据库2100中的矢量空间相对应的用户查询产生扩展词矢量时的权重值。另外,β1表示在基于与存储在扩展矢量空间数据库2200中的矢量空间相对应的语言分析结果产生扩展词矢量时的权重值,β2表示在基于与存储在扩展矢量空间数据库2200中的矢量空间相对应的用户查询产生扩展词矢量时的权重值。根据扩展词矢量以及矢量空间数据库的矢量空间的不同产生方式,上述权重值可以改变和配置
例如,假设存储在基础矢量空间数据库2100中未经过网络检索所产生的矢量空间的可靠性好于存储在扩展矢量空间数据库2200中经网络检索而产生的矢量空间的可靠性,则α1和α2可配置为大于β1和β2
此外,假设用户查询的语言分析中的关键词比用户查询中的关键词更加重要,则α1可配置为大于α21可配置为大于β2
生成矢量空间并将生成的矢量空间存储于矢量空间数据库2000中的步骤S450可进一步包括:步骤S451,将知识信息数据库1000中存储的知识信息所形成的基础矢量空间存储到矢量空间数据库2100中;步骤S452,从存储在知识信息数据库1000中的知识信息中提取关键词,并使用所述关键词执行网络检索;步骤S453,从检索到的网络文档形成扩展矢量空间,并将所述扩展矢量空间存储至扩展矢量空间数据库2200中。
所述基础矢量空间可包含预先产生的对应于存储在知识信息数据库1000中的文档的每个单词的矢量空间和结构信息。
例如,假设标题为“朴智星曼彻斯特联合比赛”的文档存储在知识信息数据库1000中,并且登记识别号为10,则基础矢量空间<朴智星,10,0.3>,<曼彻斯特,10,0.2>,<联合,10,0.1>,<比赛,10,0.1>可以存储在基础矢量空间数据库2100中。其中,“朴智星”表示一个词,“10”表示该词存储的登记识别号,“0.3”表示该词的权重值。所述结构信息表示该词所属的类别,例如,所述结构信息可以是知识信息数据库1000中列的标题,以及用户查询语言分析结果中实体的名称。此外,所述结构信息还可用作在基础检索步骤S420中使用的基础检索分值的附加信息。
例如,当在知识信息数据库1000中检索到有关“演员表”的特定信息并在语言分析结果中检索到有关“演员表”的特定信息时,可以使用更大的权重值。
存储在知识信息数据库1000中的知识信息的每个词对应的权重值可按照下面的公式3进行计算,对词频(TF)和逆向文件频率(IDF)进行乘法运算。
【公式3】
tf i , j = n i , j &Sigma; k n k , j , idf i = log | D | | { d j : t i &Element; d j } | , tfidf i , j = tf i , j &CenterDot; idf i
在公式3中,词频(tfi,j)可通过将文档(dj)中特定词的出现次数除以文档(dj)的总词数
Figure BDA0000427997600000132
而计算获得。逆向文件频率(idfi)则通过将总文档数(|D|)除以出现该词的文档数(|{dj:ti∈dj}|)再取对数获得。
所述扩展矢量空间数据库2200可在步骤S452和步骤S453中构建,在步骤S452中,从存储在知识信息数据库1000中的知识信息中提取关键词,在步骤S453中,形成与检索到的网络文档的每个词相对应的扩展矢量空间。
对于关键词,可使用存储在知识信息数据库1000中的知识信息的重要字段,根据哪个字段是用户频繁检索的字段或者哪个字段具有描述属性对用作关键词的上述字段进行确定,或者也可以采用试探法进行确定。
例如,在电视节目表中,“节目标题”可以是用作关键词的重要字段。例如,在检索书籍时,“书名”可以是用作关键词的重要字段。由于网络文档可能会包含没有存储在知识信息数据库1000中的信息,所以网络文档可以对知识信息数据库1000进行补充。例如,存储在知识信息数据库中的“亚洲杯”信息,经过网络检索获得有关“朴智星”和“赵光来”的附加信息后,可以得到扩展。
在前面所描述的利用网络的信息检索方法和相应的语音对话方法中,通过网络检索扩展知识信息和用户查询信息,提供了更好的用户查询检索结果。
此外,由于信息检索通过网络进行,所以可能不需要进行人工处理,传统的矢量空间模型仍然可用。大量例如问答信息和社交网络信息的最近信息可以在信息检索中得到体现,从而本发明的一个很大的优势在于能够进行推理和推荐。
尽管对本发明实施例及其优点的详尽介绍,在不脱离本发明原理的前提下,还可对针对本发明做出多种变化、替换以及改动。

Claims (14)

1.一种利用网络的信息检索方法,包括:
生成与所提供的用户查询和/或语言分析结果相关的基础词矢量,并使用至少一个基础词矢量在矢量空间数据库中检索与基础词矢量相应的矢量空间;
确定基础词矢量与检索到的矢量空间之间的相似度;
当所述相似度等于或者小于阈值时,基于使用所提供的用户查询和/或语言分析结果而执行的网络检索结果,生成扩展词矢量,并使用所述扩展词矢量在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间;
基于在基础检索步骤或者扩展检索步骤中检索到的矢量空间,检索知识信息。
2.如权利要求1所述的方法,其中所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
3.如权利要求1所述的方法,其中所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用知识信息执行的网络检索结果而形成。
4.如权利要求1所述的方法,其中检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的至少一个矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序。
5.如权利要求4所述的方法,其中,在计算所述扩展检索分值时,根据从所提供的用户查询或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
6.如权利要求5所述的方法,其中,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时,权重值比当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储于扩展矢量空间数据库中的矢量空间时的权重值具有更大数值。
7.如权利要求5所述的方法,其中,
当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,并且,
当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
8.一种基于利用网络的信息检索方法的语音对话方法,包括:
针对用户语音查询执行语音识别,从而将所述用户语音查询转换为用户查询文本;
针对转换为用户查询文本的所述用户语音查询执行语言分析;
生成有关用户查询文本和/或语言分析结果的基础词矢量,使用所述基础词矢量在矢量空间数据库中检索与所述基础词矢量对应的矢量空间,确定所述基础词矢量和检索到的矢量空间之间的相似度,
当所述相似度等于或者小于阈值时,基于使用用户查询文本和/或语言分析结果执行的网络检索结果,生成扩展词矢量,并使用扩展词矢量在矢量空间数据库中检索与所述扩展词矢量相应的矢量空间,并基于检索到对应于基础词矢量或扩展词矢量的矢量空间,检索知识信息;
将所述知识信息转换为与用户查询相应的响应;
针对所述响应执行语音合成,从而将所述响应转换为语音。
9.如权利要求8所述的语音对话方法,其中所述基础词矢量、所述扩展词矢量和存储在所述矢量空间数据库中的矢量空间包括至少一个词、所述词的权重信息和所述词的结构信息。
10.如权利要求8所述的语音对话方法,其中所述矢量空间数据库进一步包括基础矢量空间数据库和扩展矢量空间数据库,所述基础矢量数据库中的矢量空间由所述知识信息形成,所述扩展矢量空间数据库中的矢量空间基于使用所述知识信息执行的网络检索结果而形成。
11.如权利要求8所述的语音对话方法,其中检索知识信息的步骤进一步包括:基于所述扩展词矢量和检索到的矢量空间计算扩展检索分值,并根据所述扩展检索分值进行排序。
12.如权利要求9所述的语音对话方法,其中,在计算所述扩展检索分值时,根据从所提供的用户查询或者语言分析结果生成的扩展词矢量以及存储在基础矢量空间数据库和扩展矢量空间数据库中的矢量空间,对权重值进行调整。
13.如权利要求12所述的语音对话方法,其中,当从语言分析结果生成的扩展词矢量对应于存储在基础矢量空间数据中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时,权重值大于当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间或者从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
14.如权利要求12所述的语音对话方法,其中,
当从语言分析结果生成的扩展词矢量对应于存储于基础矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在基础矢量空间数据库中的矢量空间时的权重值,并且
当从语言分析结果生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值大于当从用户查询生成的扩展词矢量对应于存储在扩展矢量空间数据库中的矢量空间时的权重值。
CN201280026904.0A 2011-06-02 2012-06-04 利用网络的信息检索方法及相应的语音对话方法 Expired - Fee Related CN103562919B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2011-0053400 2011-06-02
KR1020110053400A KR101252397B1 (ko) 2011-06-02 2011-06-02 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법
PCT/KR2012/004405 WO2012165929A2 (ko) 2011-06-02 2012-06-04 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법

Publications (2)

Publication Number Publication Date
CN103562919A true CN103562919A (zh) 2014-02-05
CN103562919B CN103562919B (zh) 2017-02-15

Family

ID=47260131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280026904.0A Expired - Fee Related CN103562919B (zh) 2011-06-02 2012-06-04 利用网络的信息检索方法及相应的语音对话方法

Country Status (5)

Country Link
US (1) US9213746B2 (zh)
EP (1) EP2717176A4 (zh)
KR (1) KR101252397B1 (zh)
CN (1) CN103562919B (zh)
WO (1) WO2012165929A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993650A (zh) * 2017-11-30 2018-05-04 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN109920430A (zh) * 2019-01-10 2019-06-21 上海言通网络科技有限公司 语音识别语义处理系统及其方法
CN110277086A (zh) * 2019-06-25 2019-09-24 中国科学院自动化研究所 基于电网调度知识图谱的语音合成方法、系统及电子设备
CN111104071A (zh) * 2018-10-25 2020-05-05 东芝泰格有限公司 用于语音助手搜索结果的集成打印的系统和方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116649B (zh) * 2013-02-28 2016-09-14 用友网络科技股份有限公司 数据分析系统和数据分析方法
US20150120723A1 (en) * 2013-10-24 2015-04-30 Xerox Corporation Methods and systems for processing speech queries
WO2015102124A1 (ko) * 2013-12-31 2015-07-09 엘지전자 주식회사 대화 서비스 제공 장치 및 방법
JP6400038B2 (ja) * 2016-03-18 2018-10-03 ヤフー株式会社 抽出装置および抽出方法
KR102604552B1 (ko) * 2016-07-15 2023-11-22 삼성전자주식회사 단어 임베딩 방법, 단어 임베딩 장치, 음성 인식 방법 및 음성 인식 장치
JP6787770B2 (ja) * 2016-12-14 2020-11-18 東京都公立大学法人 言語記憶方法及び言語対話システム
CN111611798B (zh) 2017-01-22 2023-05-16 创新先进技术有限公司 一种词向量处理方法及装置
KR102069076B1 (ko) * 2018-05-11 2020-01-22 경북대학교 산학협력단 대화문장 생성 장치, 이를 포함하는 대화로봇 및 대화문장 생성 방법
US11615144B2 (en) * 2018-05-31 2023-03-28 Microsoft Technology Licensing, Llc Machine learning query session enhancement
US11055329B2 (en) * 2018-05-31 2021-07-06 Microsoft Technology Licensing, Llc Query and information meter for query session
CN109635093B (zh) * 2018-12-17 2022-05-27 北京百度网讯科技有限公司 用于生成回复语句的方法和装置
KR20240050164A (ko) 2022-10-11 2024-04-18 재단법인 아산사회복지재단 인공 지능 기반의 의료기기 상담 지원 서비스를 제공하는 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6480819B1 (en) * 1999-02-25 2002-11-12 Matsushita Electric Industrial Co., Ltd. Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television
US20090157383A1 (en) * 2007-12-18 2009-06-18 Samsung Electronics Co., Ltd. Voice query extension method and system
US20090259629A1 (en) * 2008-04-15 2009-10-15 Yahoo! Inc. Abbreviation handling in web search

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100467104B1 (ko) * 2001-05-11 2005-01-24 김시환 정보 검색 시스템과 그 방법
KR100792208B1 (ko) * 2005-12-05 2008-01-08 한국전자통신연구원 음성 대화 시스템에서 답변 문장 생성 방법 및 장치
KR100816923B1 (ko) * 2006-04-13 2008-03-26 엘지전자 주식회사 문서 분류 시스템 및 그 방법
JP2009540398A (ja) * 2006-06-02 2009-11-19 テルコーディア テクノロジーズ インコーポレイテッド 音声ドキュメントに関する概念ベースのメディア間インデックス化および取り出し
KR100862583B1 (ko) * 2007-08-20 2008-10-09 인하대학교 산학협력단 의사연관피드백과 비음수 행렬 분해를 이용한 문서요약장치 및 방법
KR101289081B1 (ko) * 2009-09-10 2013-07-22 한국전자통신연구원 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법
US8630860B1 (en) * 2011-03-03 2014-01-14 Nuance Communications, Inc. Speaker and call characteristic sensitive open voice search

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6480819B1 (en) * 1999-02-25 2002-11-12 Matsushita Electric Industrial Co., Ltd. Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television
US20090157383A1 (en) * 2007-12-18 2009-06-18 Samsung Electronics Co., Ltd. Voice query extension method and system
US20090259629A1 (en) * 2008-04-15 2009-10-15 Yahoo! Inc. Abbreviation handling in web search

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: ""MySQL FULLTEXT Indexing and Searching"", 《HTTP://WWW.PETEFREITAG.COM/ITEM/477.CFM》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993650A (zh) * 2017-11-30 2018-05-04 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN111104071A (zh) * 2018-10-25 2020-05-05 东芝泰格有限公司 用于语音助手搜索结果的集成打印的系统和方法
CN109920430A (zh) * 2019-01-10 2019-06-21 上海言通网络科技有限公司 语音识别语义处理系统及其方法
CN110277086A (zh) * 2019-06-25 2019-09-24 中国科学院自动化研究所 基于电网调度知识图谱的语音合成方法、系统及电子设备
CN110277086B (zh) * 2019-06-25 2021-11-19 中国科学院自动化研究所 基于电网调度知识图谱的语音合成方法、系统及电子设备

Also Published As

Publication number Publication date
EP2717176A4 (en) 2015-02-25
US9213746B2 (en) 2015-12-15
EP2717176A2 (en) 2014-04-09
KR20120135449A (ko) 2012-12-14
CN103562919B (zh) 2017-02-15
US20140108389A1 (en) 2014-04-17
WO2012165929A2 (ko) 2012-12-06
KR101252397B1 (ko) 2013-04-08
WO2012165929A3 (ko) 2013-02-07

Similar Documents

Publication Publication Date Title
CN103562919A (zh) 利用网络的信息检索方法及相应的语音对话方法
JP6657124B2 (ja) 会話理解システムのためのセッションコンテキストモデリング
Hong et al. Improving the estimation of word importance for news multi-document summarization
CN101510222B (zh) 一种多层索引语音文档检索方法
US7310601B2 (en) Speech recognition apparatus and speech recognition method
CN102253982B (zh) 一种基于查询语义和点击流数据的查询建议方法
KR101339103B1 (ko) 의미적 자질을 이용한 문서 분류 시스템 및 그 방법
CN101576888B (zh) 中文信息检索中基于结构约束的索引词权重计算方法
CN101952824A (zh) 计算机执行的对数据库中的文献进行索引和检索的方法以及信息检索系统
KR20100041482A (ko) 콘텐츠 검색 장치 및 방법
Dinarelli et al. Discriminative reranking for spoken language understanding
Alami et al. Hybrid method for text summarization based on statistical and semantic treatment
JP5504097B2 (ja) 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置
Trnka et al. Topic modeling in fringe word prediction for AAC
Liu et al. Lexicon modeling for query understanding
CN102289482A (zh) 一种非结构化数据查询方法
Celikyilmaz et al. Leveraging web query logs to learn user intent via bayesian latent variable model
CN113515616B (zh) 一种基于自然语言的任务驱动系统
KR100341396B1 (ko) 계층 단어를 이용한 3차원 클러스터링 생성 시스템 및 그방법
KR20100073793A (ko) 집단지성을 이용한 지식 구조화 장치 및 그 방법과, 그를 이용한 지식서비스 제공 시스템
Madnani et al. Multiple alternative sentence compressions for automatic text summarization
WO2012091541A1 (en) A semantic web constructor system and a method thereof
CN103559269A (zh) 一种面向移动新闻订阅的知识推荐方法
Subhashini et al. A framework for efficient information retrieval using NLP techniques
Bendib et al. Semantic ontologies for multimedia indexing (SOMI) Application in the e-library domain

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

Termination date: 20200604

CF01 Termination of patent right due to non-payment of annual fee