CN103168298B - 基于搜索引擎推断的虚拟协助 - Google Patents
基于搜索引擎推断的虚拟协助 Download PDFInfo
- Publication number
- CN103168298B CN103168298B CN201180004870.0A CN201180004870A CN103168298B CN 103168298 B CN103168298 B CN 103168298B CN 201180004870 A CN201180004870 A CN 201180004870A CN 103168298 B CN103168298 B CN 103168298B
- Authority
- CN
- China
- Prior art keywords
- text
- word
- term
- deduction
- web search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims abstract description 91
- 238000006243 chemical reaction Methods 0.000 claims abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 10
- 230000006854 communication Effects 0.000 description 54
- 238000004891 communication Methods 0.000 description 53
- 230000008569 process Effects 0.000 description 53
- 238000010586 diagram Methods 0.000 description 19
- 238000003860 storage Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 16
- 230000006399 behavior Effects 0.000 description 14
- 238000004590 computer program Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000002203 pretreatment Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
这里所描述的技术大体涉及基于实时推断的系统。示例实施例可以提出与基于搜索引擎推断的虚拟协助相关的设备、方法和计算机可读介质。一个示例方法可以包括:计算机设备适于接收文本作为输入,以及计算机处理器被设置为基于文本内一个或多个术语的一个或多个网络搜索,确定与文本的主题有关的至少一个推断。然后,在确定了推断时,自动显示该推断。当进行用于生成文本的语音到文本转换时,从语音到文本转换器自动接收文本作为输入。
Description
相关申请的交叉引用
本申请要求2010年3月16日提交的题为“SEARCHENGINEINFERENCEBASEDVIRTUALASSISTANCE”的美国申请12/724,660(其代理人案号为MTCW001901)的优先权。
背景技术
除非本文中另行指出,否则在本节中描述的方法并非本申请的权利要求的现有技术,且不因为其被本节包括而被承认为现有技术。
当收听或参与会话、演讲或会议时,在呈现讨论的主题或话题时在与所呈现的讨论的主题或话题有关的特定通信会话期间接收附加信息通常是有帮助的。然而,在会话期间进行手动的网络搜索和逐字分析通常是不方便的,且速度很慢,会转移收听者的注意力,也会使收听者及他人的注意力远离当前的讨论。
发明内容
本公开描述了针对基于搜索引擎推断的虚拟协助的方法、计算机可读介质和设备。一些示例方法可以包括:自动确定推断,包括接收流文本作为计算设备的输入;当接收到所述文本时,基于所述文本内术语的网络搜索,确定与所述文本的主题有关的推断;以及自动显示所述推断。确定推断可以包括:分析网络搜索的结果,以确定网络搜索结果的多个命中和话题。当所返回的命中的数量在预定水平之下时,可以认为网络搜索的结果足以确立网络搜索结果的话题,以确定推断。当命中的数量在预定水平之上时,可以认为网络搜索的结果是不够的,可以使用文本中逐渐增大的术语组合来执行附加的网络搜索。接收作为输入的文本可以包括通过语音到文本转换器产生的文本,可以将推断提供给语音到文本转换器,以辅助解译后续的语音信号。一些示例计算机可读介质包括被配置为执行这里所描述的方法的计算机可执行指令,一些示例设备可以包括处理器和与处理器耦合的存储器,所述存储器具有计算机可执行指令,当执行所述计算机可执行指令时,配置处理器执行这里所描述的方法。
以上发明内容仅仅是说明性的,而绝不是限制性的。除了上述示例性的各方案、各实施例和各特征之外,参照附图和以下详细说明,将清楚其他方案、其他实施例和其他特征。
附图说明
根据以下说明和所附权利要求,结合附图,本公开的前述和其他特征将更加清楚。这些附图仅仅示出了根据本公开的一些示例,且因此不应被认为是限制本公开范围。通过使用附图以额外的特征和细节来详细描述本公开,其中:
图1是示出了针对基于搜索引擎推断的虚拟协助的示例过程的流程图;
图2A是示出了根据基于搜索引擎推断的虚拟协助的、用于从作为计算设备的输入接收的词中确定推断的示例过程的流程图;
图2B是示出了根据基于搜索引擎推断的虚拟协助的、用于从作为计算设备的输入接收的词中确定推断的示例备选过程的流程图;
图3是基于在移动设备上实时接收的通信、根据基于搜索引擎推断的虚拟协助的、显示示例推断的示例移动设备的图示;
图4是示例联网计算环境的图示,其中可以实现基于搜索引擎推断的虚拟协助的方面;
图5是示出了针对基于搜索引擎推断的虚拟协助的计算机程序产品的示意图;
图6是可以在其上实现基于搜索引擎推断的虚拟协助的示例计算设备的框图,全部根据这里所描述的至少一些实施例进行设置。
具体实施方式
在以下详细说明中,参考了作为详细说明的一部分的附图。在附图中,类似符号通常表示类似部件,除非上下文另行指明。具体实施方式部分、附图和权利要求书中记载的示例性实施例并不是限制性的。在不脱离在此所呈现主题的精神或范围的情况下,可以利用其他实施例,且可以进行其他改变。应当理解,在此一般性记载以及附图中图示的本公开的各方案可以按照在此明确公开的多种不同配置来设置、替换、组合和设计,并且构成了本公开的一部分。
如这里将会描述的,本公开尤其涉及与基于搜索引擎推断的虚拟协助相关的设备、方法和计算机程序。
这里所描述的技术通常涉及基于推断的系统。示例实施例可以提出与基于搜索引擎推断的虚拟协助相关的设备、方法和计算机程序。一个示例方法可以包括:计算设备适于接收文本作为输入,以及计算机处理器被设置为基于文本中的一个或多个术语的一个或多个网络搜索来确定与文本的主题有关的至少一个推断。然后,一旦确定推断,可以自动显示推断。
本公开认识到并理解,传统的基于推断的系统表明,可以从讨论中导出附加信息的一种方式是采用用于得到已经讨论的推断的技术。然而,当前的基于推断的系统典型地被设计为用于在静态环境下的现有文档。这种系统并不易于应用于实时发生的通信,并不随时间发展,或随着词和上下文的改变而提供更新的含义和归纳。
图1是示出了根据这里描述的至少一些实施例而设置的针对基于搜索引擎推断的虚拟协助的示例过程100的流程图。在所示出的示例中,可以描述为处理步骤、功能操作、事件和/或行为等的过程100和这里所描述的其它过程、各种功能块或行为可以通过硬件、软件和/或固件执行。本领域技术人员根据本公开将会理解,可以在各种实施方式中实践图1所示的功能块的各种变型。例如,尽管如图1所示的过程100包括一个特定顺序的块或行为,但是这些块或行为所呈现的顺序不必将所要求保护的主题局限于任何特定顺序。类似地,在不偏离所要求保护的主题的范围的情况下,可以使用图1中未示出的居间行为和/或图1中未示出的附加行为,和/或可以去除图1所示的一些行为。过程100可以包括操作101、103和/或105中的一个或多个,其中可以在块101处开始处理。
在块101,“从语音到文本引擎接收词或文本段”,可以接收词或文本段作为计算设备的输入。例如,可以在单向或双向语音或文本通信、视频会议、实时聊天会话、流音频或视频会话期间、或在预先记录的视频或音频的设备上的重放期间等,通过计算设备捕获该词或文本段。在首先以语音接收或生成通信的情况下,在计算设备上执行(或在计算设备接收到语音信号之前执行)的实时语音到文本处理将语音转换为文本,从而在这里所描述的基于搜索引擎推断的虚拟协助中,通信的各个词可以作为文本来处理。各种当前可用的话音识别和语音到文本应用和系统可以全部或部分地用于提供适合的语音到文本会话,例如由DragonSystemandNuanceCommunications公司提供的那些。示例计算设备可以包括台式计算机、笔记本计算机、移动计算设备、智能电话、个人数字助理等。块101之后可以是块103。
在块103,“实时确定推断”,按照实时约束(或近实时约束),基于词的一个或多个网络搜索或文本段内词的组合的网络搜索,通过计算设备从词或文本段中确定103一个或多个推断。推断也可以基于由先前接收到的词或在相同的通信会话或先前的通信会话期间接收到的词段构成的先前网络搜索,以及基于在通信会话的文本段和/或先前和后续文本段内特定词或词组出现的频率。在图2A和2B中示出了使用这种网络搜索确定这些推断的示例过程。块103之后可以是块105。
在块105,“实时显示针对词/文本段的最高(top)推断”,在计算设备上,实时(或接近实时)地显示105针对接收到的词和/或文本段的一个或多个最高推断。推断是在通信会话期间可以在计算设备上显示的信息,用于在通信会话期间正在向用户传送内容的主题时,提供与内容的主题有关的其它或更多详细信息。推断还可以在与计算设备的通信过程中传送到远程设备并在远程设备上显示。当针对另外的词或文本段需要另外的处理时,块105可以在块101之后。
在确定推断的过程中网络搜索引擎的使用允许其它高级选项。例如,基于搜索引擎推断的虚拟协助系统可以被配置为使得从网络搜索结果中删除通信会话内非常特定的术语。因而,如果在通信会话期间有人正在讨论电影明星并提到该电影明星的名字,则基于搜索引擎推断的协助系统可以排除该特定的名字,人们将会看到与特定的人有许多共同点但实际与他不相关的电影明星们有关的更多信息。在政治或商业上,这会允许人们实时地提供反例或其它选项,从而形成协商。
还可以将网络搜索结果设置为仅以最近的结果为目标,从而收集仅与最近的新闻相关的素材。这会帮助人们追踪他/她一段时间前所知道的话题,或者会帮助人们跟上通信会话的对话。
图2A是示出了根据按照这里描述的至少一些实施例设置的基于搜索引擎推断的虚拟协助,用于从在通信会话期间作为计算设备的输入接收的词中确定推断的示例过程200的流程图。在所示出的示例中,可以描述为处理步骤、功能操作、事件和/或行为等的过程200和这里所描述的其它过程、各种功能块或行为可以通过硬件、软件和/或固件执行。本领域技术人员根据本公开将会理解,可以在各种实施方式中实践图2所示的功能块的各种变型。例如,尽管如图2所示的过程200包括一个特定顺序的块或行为,但是这些块或行为所呈现的顺序不必将所要求保护的主题局限于任何特定顺序。类似地,在不偏离所要求保护的主题的范围的情况下,可以使用图2中未示出的居间行为和/或图2中未示出的附加行为,和/或可以去除图2所示的一些行为。过程200可以包括操作103、201、202、203、205、207、209和/或105中的一个或多个,其中可以在块201处开始处理。
在块201,“从语音到文本引擎接收词”,从语音到文本引擎接收201词。块202可以在块201之后。在块202,“词的稀有度在预定阈值之上?”,当接收200到每个词时,实时地确定202词的稀有度是否在预定阈值之上。词稀有度评分可以首先应用于词。高的词稀有度评分将意味着,该词相当少见,而低的词稀有度评分将意味着,该词相当常见。例如,可以存储并访问极常见词的初级列表(如,“如果”、“该”和“是”)。如果该词出现在极常见词的列表上,则例如可以将该词完全忽略,或者给该词0分的稀有度评分。如果该词没有出现在极常见词的列表上,则可以访问所存储的词稀有度列表,该列表具有针对列表上每个词的相关预定词稀有度评分,以确定该词是否出现在词稀有度列表上以及该词的相关词稀有度评分。
如果该词没有出现在词稀有度列表上,则可以使用该词作为网络搜索中的搜索术语来自动执行使用网络搜索引擎(例如,谷歌)的万维网(网络)搜索。从该搜索返回的命中数量可以用作该词的词稀有度评分的基础。返回的命中越少,针对该词的词稀有度评分越高。例如,使用词“评议员”作为网络搜索中的搜索术语,会产生六千八百四十万条命中,使用“Trinity大学”会返回九百万条命中。然而,词“工具”可以返回无数条命中,因而返回远低于“评议员”或“Trinity大学”的词稀有度评分。然后,可以将词和相关的词稀有度评分添加至词稀有度列表以便将来使用。
如果词的稀有度不在预定阈值之上(例如,不具有高于预定量的词稀有度评分),则该过程前行到下一接收到的词,并针对该下一个词重复上述步骤。此外,特定阈值可以是用户可通过计算设备上的一个或多个用户接口进行配置的。如果词的稀有度在预定阈值之上(例如,具有高于预定量的词稀有度),则将该词标记为稀有,并可以与任何相邻的形容词或副词结合。
块203可以在块202之后。在块203,“将词添加至推断术语表”,然后将所产生的词/词组添加203到推断术语表。因而,当接收到每个词时,可以在缓冲器中存储一个或多个相邻的词,以按照这种方式将它们组合。将稀有词与相邻的形容词和副词构成组,即使单独的形容词和副词是常见的。例如,这允许人们捕获“坏业务”与“好业务”之间的差别,这会导致明显不同的推断,即使词“坏”和“好”自身足够常见以至于可被丢弃。
块205可以在块203之后。在块205,“确定推断数量”,基于在网络搜索中使用的词/词组,自动地确定205最常见推断的数量。例如,可以通过使用词/词组作为网络搜索中的搜索术语,并相应地分析搜索结果,来确定推断数量。例如,可以从搜索结果中自动读取搜索结果的话题,并用作针对该词/词组的推断。推断数量可以是在搜索结果中发现的不同话题的数量(或在前n个搜索结果中的不同话题的数量)。搜索结果中的最常见推断是与搜索结果内其它推断相比最常出现在搜索结果中的那些推断。可以将用于从网络搜索结果的分析中得到推断的各种其它自动化技术和过程实现为以上那些过程的备选项或与以上那些过程相结合。
此外,可以通过将搜索结果输出的相关推断与用作搜索术语的词/词组进行比较来确定推断强度。例如,如果针对词/词组A的网络搜索返回搜索结果输出B,则可以自动搜索B,以确定多大比例的搜索命中也包括A。如果高比例的搜索命中包括A,则确定推断强度强于较低比例的搜索命中包括A的情况。
块207可以在块205之后。在块207,“推断数量在阈值之下?”,确定207针对词/词组的推断数量和/或网络搜索结果命中是否在特定阈值之下。可以基于以上确定的推断数量、使用词/词组作为搜索术语的网络搜索结果数量、或其任意组合来做出整体搜索相关性的确定。例如,如果在搜索结果中发现的不同推断的数量过高,则这指示任何特定推断将会是相关或有用的机率较低。此外,如果词/词组的网络搜索结果(即,命中)的数量过高,则这指示词/词组过于常见以至于无法使用它自身来确定有用推断。
所发现的不同推断的数量与搜索结果命中的数量之间的关系或所发现的不同推断占搜索结果命中的比例也可以用作确定是否满足特定阈值的因子。此外,特定阈值可以是用户可通过计算设备上的一个或多个用户接口进行配置的。
块105可以在块207之后。在块105,“显示最高推断”,如果针对该词/词组的推断和/或网络搜索结果的数量在特定阈值之下,则在计算设备上按照实时约束或接近实时约束,显示105针对该词/词组的最高推断(参见图3作为示例)。推断也可以提供到与推断有关的附加信息的链接,并且可以包括与推断相关的广告等。然后,该过程重复,以接收200通信会话中的下一个词的步骤开始(例如,从语音到文本引擎开始)
推断还可以自动反馈给语音到文本或语音到文本识别系统,以提高这种系统的解译性能。例如,英文词组“anarrowflight”和“anarrowflight”甚至对于处于安静房间中的人来说也是不可区分的,但是如果基于搜索引擎推断的虚拟协助系统做出推断,说话者刚刚在通信会话期间谈论了ErrolFlynn,则这句话更可能是关于“arrow”的。如果基于搜索引擎推断的虚拟协助系统做出推断,说话者刚刚在通信会话期间谈论了DennisLau(一位建筑师),则这句话可能是关于楼梯的,这是可以基于术语彼此的搜索相关性来确定的。
块209可以在块207之后。在块209,“组合词/词组”,如果针对该词/词组的推断和/或网络搜索结果命中的数量在特定阈值之上,则将该词/词组与推断术语表中的一个或多个其它相邻的词/词组组合209,以产生更大的词组。先前已经确定了相邻的词/词组足够稀有以添加到该推断术语表中,但是也许本身不满足使任何相关推断显示的阈值。此外,如果相邻的词尚未添加到推断术语表(例如,相邻的词在当前词组的右侧),则可以从用于存储相邻的词的缓冲器中读取该相邻的词,或者该过程可以等待,直到将其它推断术语添加到推断术语表。
例如,如果针对词“工具”的推断和/或搜索结果命中的数量在特定阈值之上,则将该词与推断术语表中在词“工具”左侧的相邻词“功率”进行组合209,以产生更长的词组“功率工具”。
然后,该过程分路,并自动重复,以在网络搜索中使用新的组合词/词组来确定205最常见推断的数量开始,同时还以接收201通信会话中的下一个词(例如,形成语音到文本引擎)开始。在以上的示例中,词组“功率工具”将用作网络搜索中的搜索术语,这表面上会导致比单独的“工具”的情况更少的数量的不同推断和总的搜索结果命中。随着过程继续,可以通过沿两个方向均添加相邻的词而增大网络搜索中使用的词/词组,直至推断和/或网络搜索结果命中的数量在显示推断的特定阈值之下,或不存在附加的词要进行组合。可选地,可以通过仅向当前词/词组的左侧或右侧添加相邻的词来继续增大在网络搜索中使用的词/词组。此外,可以有在通信会话期间等待附加的词成为可用(例如,被说出)之前词组可以增大到何种程度的限制。
图2B是示出了根据按照这里描述的至少一些实施例设置的基于搜索引擎推断的虚拟协助,用于从通信会话期间作为计算设备的输入接收的词中确定推断的示例备选过程210的流程图。
例如,可以利用图2B的过程210来从通过一次处理流文本中的一个文本段而接收到的词中确定推断,其不同于图2A所示的过程,其中一次处理流文本中的一个词。文本段的大小可以改变,并且可以由用户来选择。在块211,“从语音到文本引擎接收文本段”,可以从语音到文本引擎接收文本段。块213可以在块211之后。在块213,“选择稀有词”,一旦从语音到文本引擎或其它通信应用接收到211文本段,则如上所述,可以将文本段的稀有词与任何可应用的相邻形容词或副词结合(产生词组)。如上所述,可以参考图2A,通过将词稀有度评分分配给文本段中的词并仅选择具有高于预定阈值的词稀有度评分的那些词,来选择213稀有词。
块215可以在块213之后。在块215,“确定话题关联性”,针对所选词/词组与文本段内相邻词/词组的每个组合,通过使用该组合作为网络搜索中的搜索术语来确定215组合的话题关联性。基于在网络搜索中接收到的命中的数量,可以确定215组合中词/词组的话题关联性。通常,从网络搜索中产生的命中数量越低,组合中词/词组的话题关联性越低。
块217可以在块215之后。在块217,“话题关联性在预定阈值之下?”,可以基于针对组合的搜索结果中的命中数量来确定217任意组合的话题关联性是否在预定阈值之下。
块219可以在块217之后。在块219,“产生更大的所选词组”,如果基于搜索结果中命中的数量,不存在话题关联性在预定阈值之下的组合,则通过将一个或多个相邻的词与所选词/词组组合,产生219更大的所选词组。该过程可以以第一所选词/词组开始,通过将其与相邻的所选词/词组组合来产生更大的词/词组用于进一步的组合。然后,以针对所选词/词组与文本段内的相邻词/词组的每个组合来确定215该组合的话题关联性的步骤开始,使用更大的词/词组组合来重复该过程。
块221可以在块217之后。在块221,“添加词/词组组合作为推断术语”,如果基于搜索结果中命中的数量,存在话题关联性在预定阈值之下的任意组合,则可以添加221可应用词/词组(即,其话题关联性在预定阈值之下的那些词/词组)作为推断术语表中的推断术语。以下呈现了示例推断术语表。
如上述推断术语表所示,在表的顶部和侧边列出每个词/词组。可以通过查找列中词/词组组合中的一个词/词组,并经过该表直至到达词/词组组合中的另一词/词组的列,可以在表中发现词/词组的组合的话题关联性。然后,所得到的表的位置是根据组合的网络搜索中命中数量而言的组合的话题关联性的一个指示。针对特定组合的相当少数量的命中也可以用作该组合将会具有更高推断强度的一般指示。
块223可以在块221之后。在块223,“发现话题最不相关的推断”,可以发现223针对推断术语表中推断术语的每个组合的话题最不相关的推断。可以由用户来选择系统是选择单个话题最不相关的推断还是多个话题最不相关的推断。可以将用于从网络搜索结果的分析中得到推断的各种其它自动化技术和过程实现为以上那些过程的备选项或与以上那些过程相结合。
此外,可以通过相对于用作搜索术语的词/词组来检查搜索结果输出的相关推断来确定推断强度。例如,如果针对词/词组A的网络搜索返回搜索结果输出B,则可以自动搜索B,以确定多大比例的搜索命中也包括A。如果高比例的搜索命中包括A,则确定推断强度强于较低比例的搜索命中包括A的情况。
块225可以在块223之后。在块225,“推断强度在阈值之上?”,确定225针对每个组合的话题最不相关的推断的强度是否在特定阈值之上,和/或组合的网络搜索返回在特定阈值之下的数量的命中。确定强度是否在特定阈值之上、或者针对组合的网络搜索命中是否在特定阈值之下、或二者取决于最终显示的推断的期望质量和精确度相对于期望推断数量。如果要确定强度是否在特定阈值之上和针对组合的网络搜索命中是否在特定阈值之下,则会提高最终显示的推断的质量和精确度,但是会减少所显示的推断的数量。阈值水平也对此有影响,因为针对强度的较高阈值和针对命中数量的较低阈值也会导致最终显示的推断的质量和精确度的提高,但是会减少所显示的推断的数量。可以由用户来选择确定强度是否在特定阈值之上和/或针对组合的网络搜索命中是否在特定阈值之下、以及阈值水平本身。
如果推断强度不在特定阈值之上,和/或推断术语组合的网络搜索没有返回特定阈值之下的数量的命中,则块219可以在块225之后。上述过程以通过将文本段中的一个或多个相邻的词与所选词/词组组合来产生219更大所选词组的步骤开始重复。
块227可以在块225之后。在块227,“显示最高推断”,如果推断强度在特定阈值之上和/或推断术语组合的网络搜索返回特定阈值之下的数量的命中,则在计算设备上实时或接近实时约束地显示227针对词/词组组合的最高推断或推断。可以基于如上所述的推断的强度和共同性来确定和选择最高推断。要显示的最高推断的数量或是否仅显示最高推断还可以是基于搜索引擎推断的虚拟协助系统的用户可配置特征。
在块227之后,该过程以从语音到文本引擎或其它通信应用接收211下一文本段开始重复。然而,如果期望,可以在推断术语表中留下先前处理过的文本段中的一个或多个词/词组,以便通过考虑来自先前处理过的文本段的词/词组而增大所分析的文本的宽度。例如,先前处理过的文本段之中保留在推断术语表中的词/词组可以是与使用这种词/词组作为搜索术语所返回的网络搜索结果数量有关的尤其稀有的那些词/词组。此外,可以存在针对相同推断的显示次数的限制,该相同推断的显示会导致结合来自新的文本段中的词/词组而使用先前添加到推断术语表的词/词组。
图3是根据这里所描述的至少一些实施例、基于在移动设备301上实时接收的通信、根据基于搜索引擎推断的虚拟协助的、显示示例推断317的示例移动设备301的图示。所示出的移动设备301具有移动设备外壳303、显示屏幕305、用户输入按钮323和音频输出325。移动设备可以具有内部硬件、计算机可读介质、以及存储于其上以执行各种无线通信并运行计算机软件程序代码的适合的应用、数据和计算机可读指令,以针对基于搜索引擎推断的虚拟协助来执行这里所描述的方法和过程。进一步参照图4至6来描述这种用于针对基于搜索引擎推断的虚拟协助来执行这里所描述的方法和过程的硬件和计算机可读介质和其它适合的计算设备的示例。
在移动设备301的显示屏幕305上示出了针对移动设备301上的示例通信会话执行的基于搜索引擎推断的虚拟协助的示例。示例通信会话是示出了通过向设备301提供音频和视频信号和/或数据而传送到移动设备301的远程用户309的视频或静态图像的视频聊天会话。设备301接收到的音频信号和/或数据可以通过如上所述驻留在移动设备301上(例如,在移动设备的存储设备上,该存储设备可以是包括但不限于易失性存储器(如RAM)、非易失性存储器(如ROM、闪存等)或其任意组合的任何类型)的语音到文本引擎而本地转换为文本、或者可以在先前已经进行了转换,然后作为文本连同音频一起发送到移动设备301。示出了例如当远程用户309正在讲话时在显示屏幕305上的文本窗307内流动的相应文本。在如上所述在基于搜索引擎推断的虚拟协助过程中识别了每个推断术语311、313、315或其组合时,可以将它们高亮、加括号等,指示为文本窗307内的推断术语或组合。还可以在文本窗307中的可应用推断术语311、313、315附近显示使用相应的推断术语作为搜索术语而返回的网络搜索命中的相关数量。例如,推断术语“评议员”311返回六千八百四十万条网络搜索命中,而推断术语“Trinity大学”313仅返回九百万条命中。
示出了当通信会话出现在移动设备301上时按照实时或接近实时的约束在显示屏幕305上显示示例推断317。在显示屏幕305上的文本窗307之下显示的特定推断“讨论评议员JohnCornyn,TX”317是通过以上描述的针对移动设备301上示出的当前通信会话而执行的基于搜索引擎推断的虚拟协助过程实时或接近实时地识别并处理的推断术语“评议员”311、“Trinity大学”313和“法官”315的结果。还可以与推断317一起或在推断317附近显示附加信息,如到关于该推断的更加详细或相关的信息的链接319、以及该推断的相对强度321。与推断317一起或在推断317附近显示的其它信息可以包括但不限于与推断317相关的广告、存储或进一步处理推断317的选项、以及与推断317有关的其它统计量。
图4是示例联网计算环境400的图示,其中可以实现许多计算机化过程以执行根据这里描述的至少一些示例的基于搜索引擎推断的虚拟协助。例如,以上描述的通信会话可以出现在图4所示的联网计算环境中的各个对象之间,图4中的一个或多个对象可以利用或实现基于搜索引擎推断的虚拟协助。作为另一示例,分布式或并行的计算可以是这种联网环境的一部分,其中图4网络上的各种客户端使用和/或实现用于基于搜索引擎推断的虚拟协助的系统和方法。本领域技术人员可以理解,网络可以用于将任意计算机或其它客户端或服务器设备与独立工作或在分布式计算环境中的其它计算机或其它客户端或服务器设备连接。在这方面,可以认为具有任意数量的处理、存储器或存储单元和同时出现的任意数量的应用和过程的任意计算机系统或环境适于结合所提供的系统和方法使用。
分布式计算可以用于通过在各种计算设备和/或系统之间进行交换来共享计算资源和/或服务。这些资源和/或服务可以包括交换信息、使用高速缓存存储器和/或使用用于分布式文件存储的盘存储器。分布式计算可以利用网络连接性,允许客户端调节它们的共同功率以使整个企业受益。在这方面,各种设备可以具有可以涵盖这里所描述的基于搜索引擎推断的虚拟协助过程的应用、对象或资源。
图4的联网计算环境400可以包括各种设备,如一个或多个计算设备271、600、276、301、一个或多个对象273、274和275、和/或一个或多个数据库278。这些设备271、600、273、274、275、276、301和278中的每一个可以包括或利用程序、方法、数据存储、可编程逻辑等。计算设备301可以是图3的移动设备301。然而,设备271、600、273、274、275、276、301和/或278可以跨越相同或不同设备(如个人数字助理(PDA)、移动设备、音频/视频设备、MP3播放器、个人计算机等)的各部分。每个设备271、600、273、274、275、276、301和278可以适于通过通信网络270与另一设备271、600、273、274、275、276、301和278通信。在这方面,任意设备可以负责数据库278或其它存储元件的维护和更新。
通信网络270自身可以包括其它计算实体,该计算实体被配置为向图4的系统提供服务,因而可以代表多个互连网络。根据一些实施例的方面,每个设备271、600、273、274、275、276、301和/或278可以包含分立功能程序模块,可以利用应用编程接口(API)或其它对象、软件、固件和/或硬件,适于请求其它设备271、600、273、274、275、276、301和/或278中的一个或多个的服务。
还可以理解,对象(如275)可以寄宿在另一计算设备276上。因而,尽管所描述的物理环境可以将连接设备显示为计算机,但这种说明仅是示例,物理环境可选地可以被描述为包括各种数字设备,如PDA、电视、MP3播放器等、以及软件对象,如接口、COM对象等。
存在可以支持分布式计算环境的各种系统、组件和网络配置。例如,计算设备可以通过有线或无线系统、局域网或广域分布式网络连接到一起。目前,许多网络与因特网耦合,因特网是用于广域分布式计算的基础结构,并包括许多不同的网络。任何这种网络(无论是否与因特网耦合)均可以结合所提供的系统和方法使用。
网络基础结构可以实现网络拓扑的主机,如客户端/服务器、对等或混合结构。“客户端”是使用与之不相关的另一类或组的服务的类或组的成员。在计算中,客户端是请求由另一程序提供的服务的过程,即粗略地,指令或任务集。客户端过程利用所请求的服务,而不必“知道”与其它程序或服务本身有关的任意工作细节。在客户端/服务器结构中,尤其是联网系统中,客户端通常是访问由另一计算机(例如,服务器)提供的共享网络资源的计算机。在图4的示例中,依据环境,任意设备271、600、273、274、275、276、301和/或278可以被认为是客户端、服务器或二者。
典型地但非必需地,服务器是可通过远程或本地网络(如,因特网)访问的远程计算机系统。客户端过程可以在第一计算机系统中是活跃的,服务器过程可以在第二计算机系统中是活跃的,通过通信介质与彼此通信,因而提供分布式功能并允许多个客户端利用服务器的信息收集能力。任意软件对象可以分布在多个计算设备或对象上。
客户端和服务器可以适于利用由协议层提供的功能而彼此通信。例如,超文本传输协议(HTTP)是可以结合万维网(WWW)或“网络”使用的通用协议。诸如因特网协议(IP)地址之类的计算机网络地址或诸如通用资源定位符(URL)之类的其它引用可以用于彼此识别服务器或客户端计算机。网络地址可以被称为URL地址。可以通过通信介质来提供通信,例如,针对高容量通信,客户端和服务器可以经由TCP/IP连接彼此耦合。
按照可以根据图4中提供的通用框架构建的不同计算环境、以及可以在诸如图4的网络环境中的计算中出现的其它变体,这里所提供的系统和方法不能被解释为以任意方式限制为特定的计算结构。而是,应该根据所附权利要求在宽度和范围上解释实施例。
图5是示出了根据本公开的至少一些实施例设置的、针对基于搜索引擎推断的虚拟协助的计算机程序产品的示意图。计算机程序产品500可以包括用于执行上述且在图1、图2A和图2B中示出的方法的一个或多个可执行指令集合502。计算机程序产品500可以在单个承载介质504或另一类似通信介质506中传送。计算机程序产品500还可以记录在计算机可读介质508或另一类似可读介质510中。
图6是根据本公开的至少一些实施例设置的、可以在其上实现基于搜索引擎推断的虚拟协助的示例计算设备的框图。在非常基本的配置中,计算设备600典型包括一个或多个主机处理器604、以及系统存储器606。存储器总线608可以用于在主机处理器604与系统存储器606之间通信。
依据期望配置,主机处理器604可以是任意类型,包括但不限于微处理器(μP)、微控制器(μC)、数字信号处理器(DSP)、或其任意组合。处理器604可以包括多于一级的高速缓存,如一级高速缓存器610和二级高速缓存器612、处理器内核614、以及寄存器616。示例处理器内核614可以包括算术逻辑单元(ALU)、浮点单元(FPU)、数字信号处理内核(DSP内核)、或其任意组合。示例存储控制器618也可以与处理器604一起使用,或者在一些实施例中,存储控制器618可以是处理器604的内部部分。
依据期望配置,系统存储器606可以是任意类型,包括但不限于易失性存储器(如,RAM)、非易失性存储器(如,ROM、闪存等)、或其任意组合。系统存储器606可以包括操作系统620、一个或多个应用622、以及程序数据624。在一些实施方式中,操作系统620可以具有调度器626,并且被设置运行一个或多个应用622,以执行这里所描述的功能,包括至少关于图1、图2A和图2B所示的过程描述的功能。此外,应用622可以被设置为与程序数据624一起在操作系统620上操作。程序数据624可以包括任务相关信息,例如但不限于,与运行用于执行基于搜索引擎推断的虚拟协助的指令相关的任务数据。在图6中,通过内部虚线内的那些组件示出这里所描述的基本配置602。
计算设备600可以具有附加特征或功能、以及附加接口,用于便于基本配置602和任意所需设备和接口之间的通信。例如,总线/接口控制器630可以用于便于经由存储接口总线634的、在基本配置602和一个或多个数据存储设备632之间的通信。数据存储设备632可以是可移除存储设备636、不可移除存储设备638或其组合。可移除存储设备和不可移除存储设备的示例包括如软盘驱动和硬盘驱动(HDD)之类的磁盘设备、如紧致盘(CD)驱动或数字通用盘(DVD)驱动、固态驱动(SSD)以及带驱动之类的光盘驱动。示例计算机存储介质可以包括在用于存储信息(如计算机可读指令、数据结构、程序模块或其它数据)的任意方法或技术中实现的易失性和非易失性、可移除和不可移除的介质。
系统存储器606、可移除存储设备636和不可移除存储设备638是计算机存储介质的示例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储技术、CD-ROM、数字通用盘(DVD)或其它光存储器、磁带、磁盘存储器或其它磁存储设备或可以用于存储期望信息并可由计算设备600访问的任意其它介质。任意这种计算机存储介质可以是计算设备600的一部分。
计算设备600还可以包括接口总线640,用于便于经由总线/接口控制器630的从各种接口设备(例如,输出设备642、外设接口644和通信设备646)到基本配置602的通信。示例输出设备642包括图形处理单元648和音频处理单元650,它们可以被配置为经由一个或多个A/V端口652与诸如显示器或扬声器之类的各种外部设备通信。示例外设接口644包括串行接口控制器或并行接口控制器,它们可以被配置为经由一个或多个I/O端口658与诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备等)之类的外部设备或其他外设(例如,打印机、扫描仪等)通信。示例通信设备646包括网络控制器,可以被设置为便于经由一个或多个通信端口,在网络通信链路上与一个或多个其它计算设备622通信。在一些实施方式中,计算设备600包括多核处理器664,可以通过接口总线640与主机处理器604通信。
网络通信链路可以是通信介质的一个示例。通信介质典型可以通过计算机可读指令、数据结构、程序模块或在模块化数据信号中的其它数据(如,载波或其它传输机制)具体化,并可以包括任意信息传递介质。“模块化数据信号”可以是这样的信号,其一个或多个特征被设置或改变以便将信息编码在信号中。作为示例而非限制性地,通信介质可以包括有线介质,如有线网络或直线连接、以及无线介质,如声、射频(RF)、微波、红外(IR)和其它无线介质。这里所使用的术语计算机可读介质可以包括存储介质和通信介质。
计算设备600可以实现为小型便携式(或移动)电子设备(如,手机、个人数字助理(PDA)、个人媒体播放器设备、无线网络观察设备、个人手机设备、专用设备或包括以上任意功能的混合设备)的一部分。计算设备600也可以实现为包括膝上型计算机和非膝上型计算机配置的个人计算机。
在系统方案的硬件和软件实现方式之间存在一些小差别;硬件或软件的使用一般(但并非总是,因为在特定情况下硬件和软件之间的选择可能变得很重要)是一种体现成本与效率之间权衡的设计选择。可以各种手段(例如,硬件、软件和/或固件)来实施这里所描述的工艺和/或系统和/或其他技术,并且优选的工艺将随着所述工艺和/或系统和/或其他技术所应用的环境而改变。例如,如果实现方确定速度和准确性是最重要的,则实现方可以选择主要为硬件和/或固件配置的手段;如果灵活性是最重要的,则实现方可以选择主要是软件的实施方式;或者,同样也是可选地,实现方可以选择硬件、软件和/或固件的特定组合。
以上的详细描述通过使用方框图、流程图和/或示例,已经阐述了设备和/或工艺的众多实施例。在这种方框图、流程图和/或示例包含一个或多个功能和/或操作的情况下,本领域技术人员应理解,这种方框图、流程图或示例中的每一功能和/或操作可以通过各种硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。在一个实施例中,本公开所述主题的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或其他集成格式来实现。然而,本领域技术人员应认识到,这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中,实现为在一台或多台计算机上运行的一个或多个计算机程序(例如,实现为在一台或多台计算机系统上运行的一个或多个程序),实现为在一个或多个处理器上运行的一个或多个程序(例如,实现为在一个或多个微处理器上运行的一个或多个程序),实现为固件,或者实质上实现为上述方式的任意组合,并且本领域技术人员根据本公开,将具备设计电路和/或写入软件和/或固件代码的能力。此外,本领域技术人员将认识到,本公开所述主题的机制能够作为多种形式的程序产品进行分发,并且无论实际用来执行分发的信号承载介质的具体类型如何,本公开所述主题的示例性实施例均适用。信号承载介质的示例包括但不限于:可记录型介质,如软盘、硬盘驱动器、紧致盘(CD)、数字视频盘(DVD)、数字磁带、计算机存储器、闪存等;以及传输型介质,如数字和/或模拟通信介质(例如,光纤光缆、波导、有线通信链路、无线通信链路等)。
本领域技术人员应认识到,上文详细描述了设备和/或工艺,此后使用工程实践来将所描述的设备和/或工艺集成到数据处理系统中是本领域的常用手段。也即,这里所述的设备和/或工艺的至少一部分可以通过合理数量的试验而被集成到数据处理系统中。本领域技术人员将认识到,典型的数据处理系统一般包括以下各项中的一项或多项:系统单元外壳;视频显示设备;存储器,如易失性和非易失性存储器;处理器,如微处理器和数字信号处理器;计算实体,如操作系统、驱动程序、图形用户接口、以及应用程序;一个或多个交互设备,如触摸板或屏幕;和/或控制系统,包括反馈环和控制电动机(例如,用于感测位置和/或速度的反馈;用于移动和/或调整分量和/或数量的控制电路机)。典型的数据处理系统可以利用任意合适的商用部件(如数据计算/通信和/或网络计算/通信系统中常用的部件)予以实现。
本公开所述的主题有时说明不同部件包含在不同的其他部件内或者不同部件与不同的其他部件相连。应当理解,这样描述的架构只是示例,事实上可以实现许多能够实现相同功能的其他架构。在概念上,有效地“关联”用以实现相同功能的部件的任意设置,从而实现所需功能。因此,这里组合实现具体功能的任意两个部件可以被视为彼此“关联”从而实现所需功能,而无论架构或中间部件如何。同样,任意两个如此关联的部件也可以看作是彼此“可操作地连接”或“可操作地耦合”以实现所需功能,且能够如此关联的任意两个部件也可以被视为彼此“能可操作地耦合”以实现所需功能。能可操作地耦合的具体示例包括但不限于物理上可连接和/或物理上交互的部件,和/或无线交互和/或可无线交互的部件,和/或逻辑交互和/或可逻辑交互的部件。
至于本文中任何关于多数和/或单数术语的使用,本领域技术人员可以从多数形式转换为单数形式,和/或从单数形式转换为多数形式,以适合具体环境和应用。为清楚起见,在此明确声明单数形式/多数形式可互换。
本领域技术人员应当理解,一般而言,所使用的术语,特别是所附权利要求中(例如,在所附权利要求的主体部分中)使用的术语,一般地应理解为“开放”术语(例如,术语“包括”应解释为“包括但不限于”,术语“具有”应解释为“至少具有”等)。本领域技术人员还应理解,如果意在所引入的权利要求中标明具体数目,则这种意图将在该权利要求中明确指出,而在没有这种明确标明的情况下,则不存在这种意图。例如,为帮助理解,所附权利要求可能使用了引导短语“至少一个”和“一个或多个”来引入权利要求中的特征。然而,这种短语的使用不应被解释为暗示着由不定冠词“一”或“一个”引入的权利要求特征将包含该特征的任意特定权利要求限制为仅包含一个该特征的发明,即便是该权利要求既包括引导短语“一个或多个”或“至少一个”又包括不定冠词如“一”或“一个”(例如,“一”和/或“一个”应当典型地被解释为意指“至少一个”或“一个或多个”);在使用定冠词来引入权利要求中的特征时,同样如此。另外,即使明确指出了所引入权利要求特征的具体数目,本领域技术人员应认识到,这种列举应典型地解释为意指至少是所列数目(例如,不存在其他修饰语的短语“两个特征”典型地意指至少两个该特征,或者两个或更多该特征)。另外,在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选术语的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些术语之一、这些术语任一方、或两个术语的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
尽管已经在此公开了多个方案和实施例,但是本领域技术人员应当明白其他方案和实施例。这里所公开的多个方案和实施例是出于说明性的目的,而不是限制性的,本公开的真实范围和精神由所附权利要求表征。
Claims (10)
1.一种用于自动确定推断的方法,包括:
接收流文本作为计算设备的输入;
当所述流文本正在输入时,基于文本内一个或多个术语的一个或多个网络搜索,利用计算设备确定与文本的主题有关的至少一个推断,其中确定至少一个推断包括:
自动执行文本内一个或多个术语的至少一个网络搜索;
分析所述至少一个网络搜索的网络搜索结果,以确定命中数量;
当所述命中数量低于预定阈值时,使用所述网络搜索结果,以确定一个或多个话题;并且
基于所述一个或多个话题,确定至少一个推断;以及
一旦确定了至少一个推断,自动显示所述至少一个推断。
2.根据权利要求1所述的方法,还包括:当所述命中数量高于预定阈值时,使用计算机处理器,确定比先前在至少一个网络搜索中使用的文本内术语的组合大的文本内术语的组合,并利用所述大的文本内术语的组合确定所述至少一个推断。
3.根据权利要求2所述的方法,还包括:当确定大的文本内术语的组合不可用时,等待接收下一文本作为输入,以用于产生所述大的文本内术语的组合。
4.根据权利要求1所述的方法,其中当进行用于生成文本的语音到文本转换时,从语音到文本转换器自动接收文本作为输入。
5.根据权利要求4所述的方法,还包括:经由处理器向语音到文本转换器提供所述至少一个推断,以帮助语音到文本转换器执行对后续语音信号的解译。
6.一种计算设备,包括:
处理器;
与处理器耦合的存储器,所述存储器具有当执行时将处理器配置为执行以下操作的可执行指令:
接收流文本作为计算设备的输入;
当所述流文本正在输入时,基于文本内一个或多个术语的一个或多个网络搜索,利用计算设备确定与文本的主题有关的至少一个推断,其中将所述处理器配置为确定至少一个推断的所述指令将处理器配置为执行以下操作:
自动执行文本内一个或多个术语的至少一个网络搜索;
分析所述至少一个网络搜索的网络搜索结果,以确定命中数量;
当所述命中数量低于预定阈值时,使用所述网络搜索结果,以确定一个或多个话题;并且
基于所述一个或多个话题,确定至少一个推断;以及
一旦确定了至少一个推断,显示所述至少一个推断。
7.根据权利要求6所述的计算设备,其中当执行时,可执行指令还配置处理器执行以下操作:
当由所述至少一个网络搜索返回的所述命中数量高于预定阈值时,则使用比先前在至少一个网络搜索中使用的文本内术语的组合大的文本内术语的组合,作为至少一个下一网络搜索中的搜索术语。
8.根据权利要求7所述的计算设备,其中当执行时,可执行指令还配置处理器执行以下操作:当确定大的文本内术语的组合不可用时,等待接收下一文本作为输入,以用于产生所述大的文本内术语的组合。
9.根据权利要求6所述的计算设备,其中当执行时,可执行指令还配置处理器执行以下操作:当进行用于生成文本的语音到文本转换时,从语音到文本转换器自动接收文本作为输入。
10.根据权利要求9所述的计算设备,其中当执行时,可执行指令还配置处理器执行以下操作:向语音到文本转换器提供所述至少一个推断,以帮助语音到文本转换器执行对后续语音信号的解译。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/724,660 US8214344B2 (en) | 2010-03-16 | 2010-03-16 | Search engine inference based virtual assistance |
US12/724,660 | 2010-03-16 | ||
PCT/US2011/027390 WO2011115768A2 (en) | 2010-03-16 | 2011-03-07 | Search engine inference based virtual assistance |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610082319.2A Division CN105760464A (zh) | 2010-03-16 | 2011-03-07 | 自动显示推断术语的方法及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103168298A CN103168298A (zh) | 2013-06-19 |
CN103168298B true CN103168298B (zh) | 2016-03-09 |
Family
ID=44648030
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180004870.0A Expired - Fee Related CN103168298B (zh) | 2010-03-16 | 2011-03-07 | 基于搜索引擎推断的虚拟协助 |
CN201610082319.2A Pending CN105760464A (zh) | 2010-03-16 | 2011-03-07 | 自动显示推断术语的方法及计算设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610082319.2A Pending CN105760464A (zh) | 2010-03-16 | 2011-03-07 | 自动显示推断术语的方法及计算设备 |
Country Status (5)
Country | Link |
---|---|
US (4) | US8214344B2 (zh) |
JP (1) | JP5426779B2 (zh) |
KR (1) | KR101356310B1 (zh) |
CN (2) | CN103168298B (zh) |
WO (1) | WO2011115768A2 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8484222B1 (en) | 2006-12-01 | 2013-07-09 | Google Inc. | Method and apparatus for identifying a standalone location |
US8214344B2 (en) | 2010-03-16 | 2012-07-03 | Empire Technology Development Llc | Search engine inference based virtual assistance |
DE102010032229A1 (de) * | 2010-07-26 | 2012-01-26 | Elektrobit Automotive Gmbh | Technik zum Bestimmen von Points Of Interest für eine Navigationsvorrichtung |
US20120047247A1 (en) * | 2010-08-18 | 2012-02-23 | Openwave Systems Inc. | System and method for allowing data traffic search |
US20130273797A1 (en) * | 2012-04-17 | 2013-10-17 | E I Du Pont De Nemours And Company | Conductive polymer layers grafted onto insulating polymer surfaces |
US8984080B1 (en) | 2013-04-09 | 2015-03-17 | Kabam, Inc. | Facilitating user configured assistance requests through a chat in a virtual space |
US9332043B1 (en) | 2013-04-12 | 2016-05-03 | Kabam, Inc. | System and method for facilitating user interaction with a virtual space through a graphical chat interface |
WO2015178715A1 (en) * | 2014-05-23 | 2015-11-26 | Samsung Electronics Co., Ltd. | System and method of providing voice-message call service |
US9161193B1 (en) * | 2014-06-04 | 2015-10-13 | Grandios Technologies, Llc | Advanced telephone management |
WO2016081749A1 (en) | 2014-11-19 | 2016-05-26 | Google Inc. | Methods, systems, and media for presenting related media content items |
US10607609B2 (en) * | 2016-08-12 | 2020-03-31 | Magic Leap, Inc. | Word flow annotation |
KR101934280B1 (ko) | 2016-10-05 | 2019-01-03 | 현대자동차주식회사 | 발화내용 분석 장치 및 방법 |
US10740373B2 (en) * | 2017-02-08 | 2020-08-11 | International Business Machines Corporation | Dialog mechanism responsive to query context |
US10229683B2 (en) * | 2017-03-10 | 2019-03-12 | Soundhound, Inc. | Speech-enabled system with domain disambiguation |
US10956435B2 (en) * | 2017-05-05 | 2021-03-23 | Servicenow, Inc. | Global search |
DE102017118724A1 (de) * | 2017-08-16 | 2019-02-21 | Unify Patente Gmbh & Co. Kg | Telekommunikationsendgerät und Verfahren zum Steuern von Medienströmen |
US11386131B2 (en) * | 2018-05-29 | 2022-07-12 | Microsoft Technology Licensing, Llc | System and method for multi-language search |
CN111161717B (zh) | 2019-12-26 | 2022-03-22 | 思必驰科技股份有限公司 | 用于语音对话平台的技能调度方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0597630A1 (en) * | 1992-11-04 | 1994-05-18 | Conquest Software Inc. | Method for resolution of natural-language queries against full-text databases |
US7107218B1 (en) * | 1999-10-29 | 2006-09-12 | British Telecommunications Public Limited Company | Method and apparatus for processing queries |
CN101311928A (zh) * | 2007-05-23 | 2008-11-26 | 株式会社日立制作所 | 项目推荐系统 |
CN101477556A (zh) * | 2009-01-22 | 2009-07-08 | 苏州智讯科技有限公司 | 一种从互联网海量信息中发现热点的方法 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5844415A (en) | 1994-02-03 | 1998-12-01 | Massachusetts Institute Of Technology | Method for three-dimensional positions, orientation and mass distribution |
US6029195A (en) * | 1994-11-29 | 2000-02-22 | Herz; Frederick S. M. | System for customized electronic identification of desirable objects |
US5745899A (en) * | 1996-08-09 | 1998-04-28 | Digital Equipment Corporation | Method for indexing information of a database |
US6049796A (en) * | 1997-02-24 | 2000-04-11 | Nokia Mobile Phones Limited | Personal digital assistant with real time search capability |
US6101473A (en) * | 1997-08-08 | 2000-08-08 | Board Of Trustees, Leland Stanford Jr., University | Using speech recognition to access the internet, including access via a telephone |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6816858B1 (en) * | 2000-03-31 | 2004-11-09 | International Business Machines Corporation | System, method and apparatus providing collateral information for a video/audio stream |
US6999932B1 (en) | 2000-10-10 | 2006-02-14 | Intel Corporation | Language independent voice-based search system |
JP4135307B2 (ja) * | 2000-10-17 | 2008-08-20 | 株式会社日立製作所 | 音声通訳サービス方法および音声通訳サーバ |
US20020087312A1 (en) * | 2000-12-29 | 2002-07-04 | Lee Victor Wai Leung | Computer-implemented conversation buffering method and system |
US6993535B2 (en) * | 2001-06-18 | 2006-01-31 | International Business Machines Corporation | Business method and apparatus for employing induced multimedia classifiers based on unified representation of features reflecting disparate modalities |
KR20030012284A (ko) * | 2001-07-31 | 2003-02-12 | (주)한국음성도메인센터 | 사용자 단말기용 웹브라우저와 그 구동방법 및 웹브라우징서비스 시스템 |
US20030115191A1 (en) * | 2001-12-17 | 2003-06-19 | Max Copperman | Efficient and cost-effective content provider for customer relationship management (CRM) or other applications |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7171351B2 (en) * | 2002-09-19 | 2007-01-30 | Microsoft Corporation | Method and system for retrieving hint sentences using expanded queries |
US7729913B1 (en) * | 2003-03-18 | 2010-06-01 | A9.Com, Inc. | Generation and selection of voice recognition grammars for conducting database searches |
BRPI0410362B1 (pt) * | 2003-05-16 | 2017-06-20 | Google Inc. | Systems and methods of sharing network and network media |
KR100781507B1 (ko) * | 2003-06-07 | 2007-12-03 | 삼성전자주식회사 | 멀티미디어 데이터 전시 장치 및 전시 방법과 상기 방법을 기록한 기록매체 |
JP2005010691A (ja) * | 2003-06-20 | 2005-01-13 | P To Pa:Kk | 音声認識装置、音声認識方法、会話制御装置、会話制御方法及びこれらのためのプログラム |
CN1860544A (zh) * | 2003-09-25 | 2006-11-08 | 三星电子株式会社 | 显示音频和视频数据的设备和方法以及在其上记录有用于执行该显示方法的程序的存储介质 |
US20080235018A1 (en) | 2004-01-20 | 2008-09-25 | Koninklikke Philips Electronic,N.V. | Method and System for Determing the Topic of a Conversation and Locating and Presenting Related Content |
US20050210042A1 (en) * | 2004-03-22 | 2005-09-22 | Goedken James F | Methods and apparatus to search and analyze prior art |
US7769705B1 (en) * | 2004-05-21 | 2010-08-03 | Ray Anthony Luechtefeld | Method, artificially intelligent system and networked complex for facilitating group interactions |
US7653627B2 (en) * | 2005-05-13 | 2010-01-26 | Microsoft Corporation | System and method for utilizing the content of an online conversation to select advertising content and/or other relevant information for display |
US10585942B2 (en) * | 2005-09-14 | 2020-03-10 | Millennial Media Llc | Presentation of search results to mobile devices based on viewing history |
JP4997743B2 (ja) | 2005-11-10 | 2012-08-08 | 日本電気株式会社 | 文書検索装置、文書検索プログラムおよび文書検索方法 |
US7739221B2 (en) * | 2006-06-28 | 2010-06-15 | Microsoft Corporation | Visual and multi-dimensional search |
US7917514B2 (en) * | 2006-06-28 | 2011-03-29 | Microsoft Corporation | Visual and multi-dimensional search |
US7711668B2 (en) * | 2007-02-26 | 2010-05-04 | Siemens Corporation | Online document clustering using TFIDF and predefined time windows |
JP2009070180A (ja) * | 2007-09-13 | 2009-04-02 | Internatl Business Mach Corp <Ibm> | 情報の検索を支援する装置及び方法 |
US7966304B2 (en) * | 2007-11-30 | 2011-06-21 | Yahoo! Inc. | Enabling searching on abbreviated search terms via messaging |
US8078632B1 (en) * | 2008-02-15 | 2011-12-13 | Google Inc. | Iterated related item discovery |
JP2010072507A (ja) * | 2008-09-22 | 2010-04-02 | Toshiba Corp | 音声認識検索装置及び音声認識検索方法 |
US8214344B2 (en) | 2010-03-16 | 2012-07-03 | Empire Technology Development Llc | Search engine inference based virtual assistance |
-
2010
- 2010-03-16 US US12/724,660 patent/US8214344B2/en not_active Expired - Fee Related
-
2011
- 2011-03-07 KR KR1020127013481A patent/KR101356310B1/ko active IP Right Grant
- 2011-03-07 WO PCT/US2011/027390 patent/WO2011115768A2/en active Application Filing
- 2011-03-07 JP JP2012546268A patent/JP5426779B2/ja not_active Expired - Fee Related
- 2011-03-07 CN CN201180004870.0A patent/CN103168298B/zh not_active Expired - Fee Related
- 2011-03-07 CN CN201610082319.2A patent/CN105760464A/zh active Pending
-
2012
- 2012-05-24 US US13/479,676 patent/US8495051B2/en not_active Expired - Fee Related
-
2013
- 2013-06-17 US US13/919,705 patent/US9201970B2/en not_active Expired - Fee Related
-
2015
- 2015-09-11 US US14/851,226 patent/US10380206B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0597630A1 (en) * | 1992-11-04 | 1994-05-18 | Conquest Software Inc. | Method for resolution of natural-language queries against full-text databases |
US7107218B1 (en) * | 1999-10-29 | 2006-09-12 | British Telecommunications Public Limited Company | Method and apparatus for processing queries |
CN101311928A (zh) * | 2007-05-23 | 2008-11-26 | 株式会社日立制作所 | 项目推荐系统 |
CN101477556A (zh) * | 2009-01-22 | 2009-07-08 | 苏州智讯科技有限公司 | 一种从互联网海量信息中发现热点的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105760464A (zh) | 2016-07-13 |
CN103168298A (zh) | 2013-06-19 |
US10380206B2 (en) | 2019-08-13 |
US8214344B2 (en) | 2012-07-03 |
WO2011115768A3 (en) | 2013-09-12 |
US20120233146A1 (en) | 2012-09-13 |
JP2013515328A (ja) | 2013-05-02 |
US20130282692A1 (en) | 2013-10-24 |
US8495051B2 (en) | 2013-07-23 |
KR101356310B1 (ko) | 2014-01-28 |
US20160004780A1 (en) | 2016-01-07 |
KR20120085865A (ko) | 2012-08-01 |
US9201970B2 (en) | 2015-12-01 |
WO2011115768A2 (en) | 2011-09-22 |
JP5426779B2 (ja) | 2014-02-26 |
US20110231379A1 (en) | 2011-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103168298B (zh) | 基于搜索引擎推断的虚拟协助 | |
US11120806B2 (en) | Managing dialog data providers | |
Ram et al. | Conversational ai: The science behind the alexa prize | |
US10878011B2 (en) | Cognitive ranking of terms used during a conversation | |
EP2157571B1 (en) | Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method | |
CN1975858B (zh) | 会话控制装置 | |
CN114730429A (zh) | 用于管理联系中心系统和其用户之间的对话的系统和方法 | |
US20120108221A1 (en) | Augmenting communication sessions with applications | |
CN106205608A (zh) | 利用知识图的用于语音识别的语言建模 | |
US10474439B2 (en) | Systems and methods for building conversational understanding systems | |
US20190243917A1 (en) | Cognitive Ranking of Terms Used During a Conversation | |
US20180039618A1 (en) | Computerized group task digital assistance | |
Trippas | Spoken conversational search: audio-only interactive information retrieval | |
US20230205794A1 (en) | Generating search insight data | |
WO2023245523A1 (zh) | 用于生成训练数据的方法以及装置 | |
US10528581B2 (en) | Data analytics for access to application-specific content | |
Klein et al. | Evaluating multi-modal input modes in a wizard-of-oz study for the domain of web search | |
Weng et al. | A conversational dialogue system for cognitively overloaded users | |
KR20120079948A (ko) | 게임 실행 중 대화메시지 제공 방법 및 시스템 | |
US20210264910A1 (en) | User-driven content generation for virtual assistant | |
WO2023003537A1 (en) | Bit vector-based content matching for third-party digital assistant actions | |
CN117494179A (zh) | 保密性检测方法、模型的训练方法和装置 | |
Raghunathan et al. | A Conversational Dialogue System for Cognitively Overloaded Users |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160309 Termination date: 20200307 |