CN111344694B - 分布式网络系统的接口 - Google Patents
分布式网络系统的接口 Download PDFInfo
- Publication number
- CN111344694B CN111344694B CN201880069402.3A CN201880069402A CN111344694B CN 111344694 B CN111344694 B CN 111344694B CN 201880069402 A CN201880069402 A CN 201880069402A CN 111344694 B CN111344694 B CN 111344694B
- Authority
- CN
- China
- Prior art keywords
- search results
- attributes
- attribute
- search
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Abstract
本公开总体上针对用于在语音激活的计算机网络环境中定制内容的数据处理系统。该数据处理系统可以通过基于响应加权所选择的响应属性来提供改进的基于语音的接口。通过提供更简洁的基于音频的响应,对预定属性的选择可以减小响应数据的大小并减少网络传输。
Description
相关申请的交叉引用
本申请要求2018年3月7日提交的标题为“INTERFACE FOR A DISTRIBUTEDNETWORK SYSTEM”的美国专利申请No.15/914,949的权益和优先权,其全部内容通过引用合并于此。
背景技术
基于语音的接口可以顺序地向用户提供选项、数据和其他信息。用户记住顺序列表中每个项目的有限的能力能够导致网络传输过多,因为用户请求重复信息或请求跟进问题。计算设备之间网络流量数据的基于分组或其他方式的过多网络传输能够阻止计算设备正确处理网络流量数据,完成与网络流量数据有关的操作或及时响应网络流量数据。如果响应的计算设备达到或超过其处理能力,则网络流量数据的过多传输也能够使数据路由复杂化或降低响应质量,这可能导致带宽利用效率低下。
发明内容
根据本公开的至少一个方面,一种在语音激活系统中提供数字组成部分的系统能够包括由数据处理系统执行的自然语言处理器组件、内容选择器组件、音频信号生成组件。数据处理系统能够通过接口接收第一输入音频信号。数据处理系统可以解析第一输入音频信号以识别第一输入音频信号中的第一搜索请求。数据处理系统能够基于第一搜索请求来选择多个搜索结果。数据处理系统能够确定针对第一搜索请求的搜索上下文。数据处理系统能够选择针对多个搜索结果中的每一个搜索结果的多个属性。数据处理系统能够基于搜索上下文来确定针对多个搜索结果中的每一个搜索结果的多个属性的第一加权。数据处理系统能够基于客户端设备上下文来确定针对多个搜索结果中的每一个搜索结果的多个属性的第二加权。数据处理系统能够基于针对多个搜索结果中的每一个搜索结果的多个属性的第一加权和针对多个搜索结果中的每一个搜索结果的多个属性的第二加权来针对多个搜索结果中的每一个搜索结果从多个属性中选择属性。数据处理系统可以生成包括数据结构的数字组成部分,该数据结构具有基于针对多个搜索结果中的每一个搜索结果的多个属性的第一加权和针对多个搜索结果中的每一个搜索结果的多个属性的第二加权来针对多个搜索结果中的每一个搜索结果从多个属性中的每一个属性中选择属性。数据处理系统可以响应于输入音频信号而经由接口将数字组成部分传输到客户端设备。
根据本公开的至少一个方面,一种在语音激活的系统中提供数字组成部分的方法能够包括:通过由数据处理系统执行的自然语言处理器组件并经由数据处理系统的接口来接收第一输入音频信号。该方法可以包括由自然语言处理器组件解析第一输入音频信号以识别第一输入音频信号中的第一搜索请求。该方法能够包括:由数据处理系统执行的内容选择器组件基于第一搜索请求来选择多个搜索结果。该方法可以包括通过由数据处理系统执行的属性选择器组件来确定针对第一搜索请求的搜索上下文。该方法能够包括通过属性选择器组件选择针对多个搜索结果中的每一个搜索结果的多个属性。该方法可以包括由属性选择器组件基于搜索上下文来确定针对多个搜索结果中的每一个搜索结果的多个属性的第一加权。该方法可以包括:由属性选择器组件,基于客户端设备上下文来确定针对多个搜索结果中的每一个搜索结果的多个属性的第二加权。该方法可以包括:由属性选择器组件,针对多个搜索结果中的每一个搜索结果,基于针对多个搜索结果中的每一个搜索结果的多个属性的第一加权和针对多个搜索结果中的每一个搜索结果的多个属性的第二加权来从多个属性中选择属性。该方法能够包括,通过由数据处理系统执行的音频信号生成器组件来生成包括数据结构的数字组成部分,该数据结构具有针对多个搜索结果中的每一个搜索结果的基于针对多个搜索结果中的每一个搜索结果的多个属性的第一加权和针对多个搜索结果中的每一个搜索结果的多个属性的第二加权来从多个属性中的每一个中所选择的属性。该方法能够包括:响应于输入音频信号而由音频信号生成器经由接口将数字组成部分传输到客户端设备。
在下面详细讨论这些和其他方面以及实施方式。前述信息和以下详细描述包括各个方面和实施方式的说明性示例,并且提供用于理解所要求保护的方面和实施方式的性质和特征的概述或框架。附图提供对各个方面和实施方式的说明和进一步的理解,并且被并入本说明书中且构成本说明书的一部分。
附图说明
不旨在按比例绘制附图。在各个附图中,相同的附图标记和命名指示相同的元件。为了清楚起见,并非在每个附图中都标记每个组件。
在附图中:
图1图示在基于语音激活的数据分组(或其他协议)的计算机网络环境中定制内容的示例系统;
图2图示在图1中图示的系统中为搜索结果选择属性的示例方法的流程图;
图3图示将多个排序的搜索结果转换为数据结构的框图;以及
图4是图示用于可以被采用以实现本文描述和图示的系统和方法的元件的计算机系统的总体架构的框图。
具体实施方式
下述是与用于分组音频信号中的数据结构的属性选择的方法、装置和系统有关的各种概念以及其实施方式的更详细描述。可以以许多方式中的任何一种来实现上面介绍的和下面将更详细讨论的各种概念。
本公开总体上针对语音激活的计算机网络环境中的响应的定制。语音激活的计算机网络中设备的语音接口能够顺序地将结果呈现为列表。顺序地向用户提供结果能够要求用户记住列表中的每个结果,因为语音接口提供结果的完整列表以及与属性相关联的每个结果。用户可能难以记住结果的完整列表,因为结果列表被重复提供给用户,这能够导致增加的网络和计算机使用。
本公开的系统和方法可以为列表中的每个结果选择与客户端设备上下文或搜索上下文相关的一个或多个属性,而不是发送与每个结果相关联的所有属性。由于较少的数据被发送到客户端设备,所以包括特定的属性(与完整的属性列表相对)能够降低网络利用率。向用户提供选择的、相关属性以及搜索结果还能够使用户能够区分并记住结果列表的结果,这可以减少向用户重复结果列表的次数。减少将结果渲染给用户的次数也可以节省网络和计算资源。
图1图示示例系统100,该示例系统100在基于语音激活的数据分组(或其他协议)的计算机网络环境中响应于分组音频信号来定制内容。系统100可以包括至少一个数据处理系统102。数据处理系统102可以包括具有至少一个处理器的至少一个服务器。例如,数据处理系统102可以包括位于至少一个数据中心或服务器场中的多个服务器。数据处理系统102可以从输入音频信号中确定请求和与该请求相关联的触发关键字。数据处理系统对请求或触发的响应可以取决于用户。例如,数据处理系统102可以基于哪个用户提供输入音频信号来选择不同的响应。数据处理系统102可以使用语音辨识来确定哪个用户提供输入音频信号。数据处理系统102可以用可以包括具有响应数据的数据结构的一个或多个数字组成部分来响应于请求。可以将数据结构合并到一个或多个音频文件中,这些文件在渲染时会提供音频输出或声波。除了基于音频的内容之外,数字组成部分还可以包括其他内容格式(例如,文本、视频或图像格式的内容)。
数据处理系统102可以包括多个、按逻辑分组的服务器,并且有助于分布式计算技术。服务器的逻辑组可以称为数据中心、服务器场或机器场。服务器可以在地理位置上分散。数据中心或机器场可以作为单个实体进行管理,或者机器场可以包括多个机器场。每个机器场中的服务器可以是异构的——服务器或机器中的一个或多个可以根据一种或多种类型的操作系统平台进行操作。数据处理系统102可以包括存储在一个或多个高密度机架系统中的数据中心中的服务器,以及例如位于企业数据中心的相关联的存储系统。通过在本地化的高性能网络上定位服务器和高性能存储系统,以这种方式具有合并服务器的数据处理系统102可以改善系统的可管理性、数据安全性、系统的物理安全性和系统性能。包括服务器和存储系统的所有或一些数据处理系统102组件的集中化,以及将它们与高级系统管理工具耦合,允许更有效地利用服务器资源,这节省功率和处理需求并减少了带宽使用。
数据处理系统102可以包括至少一个自然语言处理器(NLP)组件112、至少一个接口110、至少一个属性选择器组件113、至少一个内容选择器组件118、至少一个音频信号生成器组件120、至少一个直接动作应用编程接口(API)116和至少一个数据存储库122。配置成经由至少一个计算机网络105与数据存储库122和其他计算设备(例如,客户端计算设备104或内容提供商计算设备106)进行通信的NLP组件112、接口110、属性选择器组件113、内容选择器组件118、音频信号生成器组件120和直接动作API 116可以均包括至少一个处理单元、服务器、虚拟服务器、电路、引擎、代理、电器或其他逻辑设备,诸如可编程逻辑阵列。网络105可以包括计算机网络,诸如互联网、局域网、广域网、城域网或其他区域网络、内部网、卫星网络、其他计算机网络,诸如语音或数据移动电话通信网络及其组合。
网络105可以包括显示网络,例如,与内容放置或搜索引擎结果系统相关联的,或有资格包括第三方数字组成部分作为数字组成部分放置活动的一部分的互联网上可用的信息资源的子集。数据处理系统102可以使用网络105来访问信息资源,诸如可以由客户端计算设备104呈现、输出、渲染或显示的网页、网站、域名或统一资源定位符。例如,经由网络105,客户端计算设备104的用户可以访问由内容提供商计算设备106提供的信息或数据。
网络105可以包括例如点对点网络、广播网络、广域网、局域网、电信网络、数据通信网络、计算机网络、异步传输模式(ATM)网络、同步光网络(SONET)网络、同步数字体系(SDH)网络、无线网络或有线网络及其组合。网络105可以包括无线链路,诸如红外信道或卫星频带。网络105的拓扑可以包括总线、星形或环形网络拓扑。网络105可以包括使用任何一种或多种用于在移动设备之间进行通信的协议的移动电话网络,所述协议包括高级移动电话协议(“AMPS”)、时分多址(“TDMA”)、码分多址(“CDMA”)、全球移动通信系统(“GSM”)、通用分组无线业务(“GPRS”)或通用移动电信系统(“UMTS”)。可以经由不同的协议传输不同类型的数据,或者可以通过不同的协议传输相同类型的数据。
客户端计算设备104和内容提供商计算设备106可以均包括至少一个诸如具有处理器的计算设备的逻辑设备以彼此之间或经由网络105与数据处理系统102进行通信。客户端计算设备104和内容提供商计算设备106能够均包括至少一个服务器、处理器或存储器,或者位于至少一个数据中心的多个计算资源或服务器。客户端计算设备104和内容提供商计算设备106可以均包括至少一个计算设备,诸如台式计算机、膝上型计算机、平板电脑、个人数字助理、智能手机、便携式计算机、瘦客户端计算机、虚拟服务器、基于扬声器的助理设备或其他计算设备。
客户端计算设备104可以包括至少一个传感器140、至少一个换能器142、至少一个音频驱动器144、至少一个扬声器146和至少一个预处理器148。传感器140可以包括麦克风或者音频输入传感器。传感器140还可以包括GPS传感器、接近传感器、环境光传感器、温度传感器、运动传感器、加速度计或陀螺仪中的至少之一。换能器142可以将音频输入转换成电子信号。音频驱动器144可以包括由客户端计算设备104的一个或多个处理器执行的脚本或程序,以控制传感器140、换能器142或音频驱动器144以及客户端计算设备104的其他组件,以处理音频输入或提供音频输出。扬声器146可以传输(或渲染)音频输出信号。
预处理器组件148可以与音频驱动器144、换能器142和传感器140耦合。预处理器组件148可以是或包括在将信号传输到数据处理系统102或由客户端计算设备104的其他组件处理之前对接收到的信号执行功能的一个或多个处理器。例如,预处理器组件148可以滤波由换能器142检测到的输入音频信号(或以其他方式由客户端计算设备104接收到的输入音频信号),以创建滤波后的输入音频信号。预处理器148的滤波可以包括滤波(或降低)输入音频信号中的噪声、放大输入音频信号中的预定频率、降低输入音频信号中的预定频率、或对输入音频信号的上采样或下采样。预处理器组件148可以将滤波后的输入音频信号转换为数据分组,并且经由网络105将数据分组传输到数据处理系统102。
客户端计算设备104可以与终端用户相关联,该终端用户(经由传感器140或转换器142)将基于语音的搜索请求作为音频输入输入到客户端计算设备104中,并接收以可以从数据处理系统102(或内容提供商计算设备106)提供的计算机生成的语音的形式的音频输出。客户端计算设备104可以从扬声器146输出音频输出。计算机生成的语音可以包括来自真实人或计算机生成的语言的记录。音频输出可以从由数据处理系统102生成并提供的音频文件中生成。音频输出可以从数据处理系统102提供的文本或其他数据中生成。例如,客户端计算设备104可以包括文本到语音处理器,其将由数据处理系统102提供的文本转换为音频输出。客户端计算设备104可以包括显示器,并且对基于语音的搜索请求的响应可以包括基于视觉的响应,其可以包括图像、图形、电影、动画、显示的文本等。基于视觉的响应可以补充或替换基于音频的响应。
内容提供商计算设备106可以提供基于音频的数字组成部分或其他数据以供客户端计算设备104渲染为音频输出数字组成部分。数据可以包括商品或服务的出价。数据可以包括关于内容提供商计算设备106的信息。例如,数据可以包括与内容提供商计算设备106相关联的企业的经营时间、企业的位置、资格列表、提供的服务列表、促销列表、等级或排名或其任意组合。数据处理系统102可以将由内容提供商设备106提供的数据作为内容数据128存储在数据存储库122中。数据处理系统102可以检索该数据并将该数据传输到客户端计算设备104。数据处理系统102可以选择数字音频组成部分,并将数字音频组成部分提供(或指示内容提供商计算设备106将数字音频组成部分提供)给客户端计算设备104。
数据储存库122可以包括一个或多个本地或分布式数据库,并且可以包括数据库管理系统。数据存储库122可以包括计算机数据存储或存储器,并且可以存储一个或多个策略123、简档126、内容数据128或模板130以及其他数据。内容数据128可以包括数字组成部分或相关联的元数据以及可以是与客户端计算设备104的一个或多个通信会话的部分的输入音频消息。模板130可以包括可以用于与客户端计算设备104通信的数据结构。模板130可以包括数据处理系统102可以用例如内容数据128、数字组成部分或其他数据填充的一个或多个占位符。简档126可以包括由客户端计算设备104的用户提供的偏好数据。
数据处理系统102可以包括安装在客户端计算设备104处的应用、脚本或程序,诸如用于将输入音频信号传送到数据处理系统102的接口110并驱动客户端计算设备104的组件渲染输出音频信号的app。数据处理系统102可以接收包括或识别输入音频信号的数据分组或其他信号。例如,数据处理系统102可以执行或运行NLP组件112以接收和处理从客户端计算设备104接收到的输入音频信号。
通过将输入信号与存储的代表性音频波形集进行比较并选择最接近的匹配,NLP组件112可以将输入音频信号转换或解析为已辨识的文本。可以跨大的输入信号集来生成代表性波形。用户可以提供输入信号中的一些。一旦音频信号被转换成已辨识的文本,NLP组件112就可以将文本与例如经由学习阶段与系统100可以做出的动作相关联的词匹配。经由换能器142、音频驱动器144或其他组件,客户端计算设备104可以将输入音频信号提供给数据处理系统102(例如,经由网络105),在数据处理系统102处输入音频信号可以被接收(例如,通过接口110)并作为内容数据128被提供给NLP组件112或存储在数据存储库122中。
NLP组件112可以获得输入音频信号。根据输入的音频信号,NLP组件112可以识别至少一个搜索请求。搜索请求可以包括触发词(或短语)和请求。该请求可以指示输入音频信号的意图或主题。触发关键字可以指示可能采用的动作类型。对于示例输入音频信号“Ineed a plumber(我需要水管工)”,NLP组件112可以解析输入音频信号以将触发短语识别为“I need(我需要)”,并将请求识别为“plumber(水管工)”。NLP组件112可以基于触发短语“I need”来确定用户想要执行针对“plumber”的搜索,请求。
内容选择器组件118可以基于在输入音频信号中识别的搜索请求来选择多个响应。内容选择器组件118可以从数据存储库122中选择响应,其中可以将响应存储为内容数据128的一部分。继续上面的示例,内容选择器组件118可以基于NLP组件112识别的搜索请求来选择多个搜索结果。例如,数据处理系统102可以周期性地执行web爬取以索引和缓存网站和其他基于web的内容。数据处理系统102可以将索引和缓存的结果作为内容数据128存储在数据存储库122中。内容选择器组件118可以使用请求(在上面的示例中为“plumber”)作为关键字来执行对内容数据128的搜索。基于搜索,内容选择器组件118可以选择多个搜索结果。
内容选择器组件118可以为搜索请求选择搜索上下文。内容选择器组件118可以基于搜索上下文向搜索结果中的每一个分配排名。搜索上下文可以是地理区域或位置、搜索偏好、搜索历史、使用历史或其任意组合。例如,内容选择器组件118可以使用地理搜索上下文来选择位于客户端计算设备104的预定距离内的水管工。搜索上下文可以由包括在音频输入中的信息来确定。例如,分组的音频输入当被传输到数据处理系统102时,可以包括IP地址或其他信息,其使数据处理系统102能够确定客户端计算设备104所位于的一般区域。可以通过简档126中存储的信息来确定搜索上下文。例如,客户端计算设备104的用户可能已经与数据处理系统102建立向数据处理系统102提供搜索偏好的简档126。可以通过输入音频信号中由NLP组件112识别的信息来确定搜索上下文。例如,如果输入音频信号是“Findme a plumber in New York City(在纽约市中帮我找水管工)”,则NLP组件112可以将“inNew York City(在纽约市中)”识别为搜索上下文,并将搜索结果限制为纽约市的水管工。
可以由不同的数据处理系统102执行对可能的响应数据的搜索。例如,内容选择器组件118可以经由直接动作API 116与执行搜索的单独的数据处理系统102接合。直接动作API 116可以将搜索请求和搜索上下文转换为可以传输到搜索数据处理系统102的文件格式。例如,可以将搜索请求和搜索上下文转换具有被搜索数据处理系统102识别为请求的数据的为JSON格式或编码的URL。
数据处理系统102可以包括属性选择器组件113。属性选择器组件113可以响应于输入音频信号的搜索请求而确定、权重、排序和选择针对由内容选择器组件118所识别的(或者从单独的搜索数据处理系统102返回的)搜索结果中的每一个的一个或者多个属性。属性选择器组件113可以为搜索结果中的每一个选择一个或多个属性,生成包括搜索结果的数据结构。数据结构可以与搜索结果中的每一个相关联地包括所选择的一个或多个属性。例如,数据结构可以是JSON格式的文件,其中搜索结果作为对象的有序列表被包括。对象中的每一个可以包括一个或多个属性。
属性可以是与搜索结果相关联的特性、质量、元数据或其他信息。例如,属性可以包括与搜索结果相关联的商店或其他地址、出价、营业时间、停业时间、许可证、证书、服务、专业性、能力或等级。例如并继续针对水管工的搜索的上述示例,属性可以包括水管工的地址、水管工是否提供促销的指示、水管工的许可证或专业认证的识别以及水管工是否已保险的指示。
属性选择器组件113可以在由数据处理系统的web爬取器执行的索引和缓存过程期间为搜索结果中的每一个收集属性。对于web爬取器处理的每个潜在搜索结果,web爬取器可以识别HTML标签或其他元标签。例如,作为可能的搜索结果被爬取的网页的所有者可以通过在网页的HTML中的预定标签中附上营业和停业时间来向数据处理系统102指示营业和停业时间。属性选择器组件113可以使用机器学习算法处理可能的搜索结果的文本和其他内容以识别属性。数据处理系统102还可以具有使网页的所有者(例如,内容提供商设备106)能够输入该所有者想要与网页或搜索结果相关联的属性的接口。
属性选择器组件113可以针对搜索结果中的每一个选择一个或多个属性,以包括在数据结构中,该数据结构被传输到客户端计算设备104以渲染给终端用户。该数据结构可以被包括在数字组成部分中,该数字组成部分可以在客户端计算设备104处作为音频输出信号被渲染给终端用户。属性可以成为终端用户的精神锚定(mental anchor),因为搜索结果中的每一个都会以听觉和顺序的方式呈现给用户。为了从基于音频的列表中选择搜索结果,用户可以提供基于语音的响应,其指示特定的搜索结果(例如,“Ok,select Bob’sPlumbing,Inc.(好的,选择Bob的管道有限公司)”)、搜索结果列表中的位置(例如,“Ok,select the third plumber(好的,选择第三个水管工)”)或属性(例如,“Ok,select theplumber that is open all 24hours a day(好的,选择每天24小时营业的水管工)”)。例如,属性选择器组件113可以选择“open 24hours a day(每天24小时营业)”作为第一搜索结果的属性,并且选择“located 2miles away(位于2英里远)”作为第二搜索结果的属性。在此示例中,响应于用户的输入音频信号“I need a plumber”而在客户端计算设备104处渲染的数字组成部分可以是“I found Plumber A,which is open 24hours a day andPlumber B,which is located 2miles away.(我发现每天24小时营业的水管工A和位于2英里远的水管工B)”。用户可以通过提供例如“Ok,select Plumber A(好的,选择水管工A)”或“Ok,select the one open 24hours a day(好的,选择每天24小时营业的那个)”的基于语音的输入来选择是Plumber A的搜索结果之一。
属性选择器组件113可以选择在包括针对每个搜索结果的一个或多个所选择的属性的数据结构中包括哪一个或多个属性。数据结构可以合并到数字组成部分中。属性选择器组件对属性的选择可以是基于不同属性中的每一个的加权的。属性选择器组件113可以基于搜索上下文来选择第一加权,并且可以基于客户端设备上下文来选择第二加权。对于每个属性,属性选择器组件113可以使用加权来针对相应属性中的每一个生成得分。属性选择器组件113可以基于得分来对属性进行排名,并且可以基于排名来选择要包括在数据结构中的属性。搜索结果的搜索上下文加权可以是基于属性与搜索请求的相关性、属性的唯一性(例如,多少个其他搜索结果具有相同的属性)、属性与其他属性的相似性或搜索结果排名。基于客户端设备上下文的加权可以是基于将输入音频信号提供给客户端计算设备104的用户的偏好,或者是基于用户群体的动作。例如,基于用户搜索上下文的加权可以是基于定义的用户偏好、隐含的用户偏好、过去的用户选择或客户端计算设备104位置信息。
如果一个或多个属性对应于另一搜索结果的属性,则属性选择器组件113可以移除该属性而不与搜索结果相关联。当属性的值基本上彼此匹配(例如,两个属性具有“Open24hours a day”的值)、具有含有相似含义但彼此不完全匹配的值(例如,“Open 24hours aday”和“Open all day,every day(每天全天营业)”)、或者是同一类型(例如,“Open24hours a day”和“Open 9to 5(9至5点营业)”均是“经营时间”类型)时,属性可以彼此对应。内容选择器组件118可以对搜索结果进行排名。基于搜索结果排名,属性选择器组件113可以针对每个搜索结果选择属性。当移除属性时,属性选择器组件113可以在选择针对下一个最高排名的搜索结果的属性之前首先选择针对最高排名的搜索结果的一个或多个属性。一旦属性选择器组件113选择针对搜索结果的属性,属性选择器组件113就可以不为较低排名的搜索结果选择为较高排名的搜索结果所选择的属性。例如,假设Plumber A的搜索结果和Plumber B的搜索结果均具有属性“Open 24hours a day”作为它们相应的最高排名的属性,并且Plumber A的搜索结果具有比Plumber B的搜索结果更高的搜索排名。在此示例中,属性选择器组件113可以选择“Open 24hours a day”作为Plumber A的属性,以及为Plumber B选择不同属性,即使所选择的属性是针对Plumber B的搜索结果的排名较低的属性。
当属性选择器组件113接着对搜索结果的排名之后选择搜索结果中的每一个的属性时,如果为较高排名的搜索结果选择了属性,则属性选择器组件113可以向该属性应用惩罚(例如,通过应用低或负加权或调整现有加权),而不是移除所选择的属性。例如,如果为最高排名的搜索结果选择了营业时间属性,则可以对较低排名的搜索结果的营业时间属性给予惩罚,以减少也将为较低排名的搜索结果选择该属性的可能性。因为每个属性可以具有多个加权,所以如果属性的其他加权相对高足以补偿惩罚,则属性选择器组件113可以选择具有惩罚的属性。
对于每个搜索结果,属性选择器组件113可以组合加权以生成得分。加权可以正面或负面地影响属性的得分。例如,要为对用户重要的搜索结果中的每一个进行排名和选择属性,属性的唯一性可以正面地对属性的得分产生影响。当其他搜索结果的属性不具有相同属性或具有针对给定属性的不同值时,搜索结果的属性可以是唯一的。例如,给定城市中水管工的搜索结果中的每一个的位置属性可能是不唯一的(或彼此相似),因为返回的搜索结果中的水管工中的每一个可能位于同一城市或地理区域。水管工的搜索结果的时间属性可以是唯一的,例如,如果该属性指示水管工一天24小时营业,并且其他返回的搜索结果的时间属性指示相应的水管工的营业时间在上午9点和下午5点之间。
数据处理系统102可以包括音频信号生成器组件120。音频信号生成器组件120可以生成或以其他方式获得包括或合并由属性选择器组件113生成的数据结构的输出信号。音频信号生成器组件120可以将数据结构合并到数字组成部分中。该数字组成部分可以包括指示搜索结果以及针对相应的搜索结果中的每一个搜索结果选择的属性的数据结构。数据处理系统102的接口110可以经由计算机网络105向客户端计算设备104提供或传输包括数字组成部分的一个或多个数据分组作为输出信号。在一些实施方式中,数据处理系统102可以将数据结构传输到客户端计算设备104,该客户端计算设备104将数据结构合并在数字组成部分中。
数据处理系统102可以将来自数据存储库122或来自音频信号生成器组件120的输出信号提供给客户端计算设备104。接口110可以是使数据处理系统102能够接收和传输数据的硬件接口,诸如网络端口数据端口或无线电台。接口110可以是基于图形的。例如,接口110可以是图形用户接口,该图形用户接口使用户能够输入数据或以其他方式与数据处理系统102进行交互。数据处理系统102还可以经由数据分组传输来指令内容提供商计算设备106将输出信号提供给客户端计算设备104。输出信号可以被获得、生成、转换或作为一个或多个数据分组(或其他通信协议)从数据处理系统102(或其他计算设备)传输到客户端计算设备104。
对应于数字组成部分的输出信号,例如,由音频信号生成器组件120获得或生成、经由接口110和计算机网络105传输到客户端计算设备104的输出信号,可以使客户端计算设备104执行音频驱动器144以驱动扬声器146以生成与输出信号相对应的声波。声波可以包括与数字组成部分相对应的词。当数字组成部分包括图像或文本时,客户端计算设备104可以在客户端计算设备104的显示器上显示图像或文本。
图2图示选择用于搜索结果的属性的示例方法200的流程图。方法200可以包括接收输入信号(ACT 202)。方法200可以包括解析输入信号(ACT 204)。方法200可以包括选择搜索结果(ACT 206)。方法200可以包括选择属性(ACT 208)。方法200可以包括确定加权(ACT 210)。方法200可以包括生成数据结构(ACT 212)。方法200可以包括传输数字组成部分(ACT 214)。
如上所述,方法200可以包括接收输入信号(ACT 202)。另外,参考图1等,输入信号可以是在数据处理系统102的接口110处从客户端计算设备104接收的基于音频的输入信号。例如,客户端计算设备104的用户可以向客户端计算设备104提问作为音频输入。客户端计算设备104的换能器142(例如,麦克风)可以检测音频输入并将音频输入转换成数字化信号。预处理器148可以执行对数字化信号的初始音频滤波。客户端计算设备104可以将数字化信号进行分组,并且将该信号作为输入信号传输到数据处理系统102的接口110。
方法200可以包括解析输入信号(ACT 204)。由数据处理系统102执行的NLP组件112可以解析输入信号以识别输入信号中的搜索请求。NLP组件112可以识别输入信号中的触发关键字,该触发关键字可以指示与搜索请求相关联的动作。
方法200可以包括选择搜索结果(ACT 206)。内容选择器组件118可以基于由NLP组件112识别的搜索请求来选择一个或多个搜索结果。例如,搜索请求“I need a plumber”,内容选择器组件118可以执行对被存储为内容数据128的索引的网页的搜索以识别多个不同的水管工的网页。内容选择器组件118可以对搜索结果进行排名。例如,搜索结果可以基于对每个网页的重要性的识别来被排名。网页的重要性可以是基于其他网页包括到该网页的链接的次数。内容选择器组件118可以从经由直接动作API 116从搜索数据处理系统返回的搜索结果中选择搜索结果。
方法200可以包括选择属性(ACT 208)。属性选择器组件113可以针对由内容选择器组件118识别的搜索结果中的每一个选择一个或多个属性。属性可以是与搜索结果相关联的特性、质量、元数据或其他信息。例如,属性可以包括与搜索结果相关联的商店或其他地址、出价、营业时间、停业时间、许可证、证书、服务、专业性、能力或等级。
方法200可以包括确定属性的加权(ACT 210)。属性选择器组件113可以针对属性中的每一个确定多个加权。例如,属性选择器组件113可以确定与搜索上下文相关联的第一加权和与客户端设备上下文相关联的第二加权。属性选择器组件113可以基于多个加权中的每个加权来确定得分。
例如,并且参考图3等等,内容选择器组件118可以确定多个搜索结果301。图3图示搜索结果301的排名被转换成数据结构的框图。内容选择器组件118可以对搜索结果301进行排名,并生成从搜索结果(1)到搜索结果(2)并且到搜索结果(n)的搜索结果的排名列表,其中n是搜索结果的数量。对于每个属性302,属性选择器组件113可以确定第一加权304(1)和第二加权304(2),它们通常可以被称为加权304。属性选择器组件113可以确定超过2个的加权304。例如,对于多个用户偏好中的每一个,属性选择器组件113可以确定将属性映射到用户偏好中的每一个的不同加权304。
属性选择器组件113可以针对搜索结果中的每一个选择一个或多个属性以包括在数据结构中。为了选择属性,属性选择器组件113可以针对属性中的每一个生成得分303。针对给定属性302的得分303可以是基于加权304。例如,属性选择器组件113可以将给定属性302的加权304中的每一个求和、平均或以其他方式组合,以计算针对该属性302的得分303。对于每个搜索结果,属性选择器组件113可以选择具有最高得分的预定数量的属性。例如,属性选择器组件113可以选择具有最高得分的两个属性302以合并到数据结构305中。
加权304可以是基于搜索结果301的排名。一旦搜索结果301被排名,属性选择器组件113可以基于搜索排名来调整或分配权重。例如,与针对较高排名的搜索结果301的属性302相比,对于搜索排名列表中较低的每个后续搜索结果301,属性选择器组件113可以将较小的权重分配给该搜索结果的属性302。
在一些实施方式中,基于属性302的值和搜索结果排名两者来应用基于搜索结果排名的加权。例如,仅当属性针对较高排名的搜索结果被选择时,该属性针对较低排名的搜索结果可以被给予惩罚或较低加权。例如,如果水管工的最高排名搜索结果具有“open24hrs a day(每天24小时营业)”的营业时间属性并且水管工的第二高排名搜索结果具有“open on weekends(周末营业)”的营业时间属性,则属性选择器组件113可能不会惩罚排名较低的搜索结果的营业时间属性,因为该属性的值不同于排名较高的搜索结果的营业时间属性的值。
方法200可以包括生成数据结构(ACT 212)。另外,参考图3等等,数据结构305可以包括搜索结果301中的每一个。对于搜索结果301中的每一个,数据结构305可以包括一个或多个属性302。属性选择器组件113可以确定哪个属性与给定搜索结果301相关联以包括在数据结构中。例如,对相应属性302的选择可以基于通过相关联的得分303的对属性302的排名以及通过内容选择器组件118的对搜索结果301的排名。
属性选择器组件113还可以针对搜索结果301中的每一个选择要包括的属性302的数量。属性选择器组件113可以针对搜索结果301中的每一个选择相同的数量。例如,属性选择器组件113可以针对搜索结果301中的每一个选择单个的属性302。属性选择器组件113可以针对属性302中的每一个选择不同的数量。例如,属性选择器组件113可以针对搜索结果中排名较高的搜索结果301选择更多数量的属性302,以包括在数据结构305中。属性选择器组件113确定要包括在数据结构305中的属性的数量可以基于客户端设备上下文或搜索上下文。数据处理系统102可以基于客户端计算设备104的设备类型来确定客户端设备上下文。例如,当设备类型是移动设备时,属性选择器组件113可以选择较少的属性,并且当设备类型是基于家庭的扬声器系统时,可以选择更多的属性。
在一些实施方式中,属性选择器组件113可以在数据结构305中包括用于每个属性302的渲染格式。该渲染格式可以指示属性302是否应被包括在基于音频的输出、基于图像的输出或者它们的组合中。例如,如果客户端计算设备104包括扬声器和屏幕。属性选择器组件113可以在数据结构中指示每个搜索结果的最高评分属性应包括在基于音频的输出中,而其他属性应显示在客户端计算设备的屏幕上。
音频信号生成器组件120可以将数据结构305合并到数字组成部分中。数字组成部分可以是搜索结果页面、网页、基于音频的文件或其他类型的内容项。该数字组件可以包括针对客户端计算设备104应如何渲染数据结构的指令。例如,数字组成部分可以包括模板,该模板包括客户端计算设备104应该用于渲染数据结构的顺序、布局、语言、语音或其他信息。
方法200可以包括发送数据结构(ACT 214)。数据处理系统102可以经由网络105将数据结构传输到客户端计算设备104。数据处理系统102可以在数字组成部分中将数据结构传输到客户端计算设备104。响应于接收数据结构,客户端计算设备104可以向客户端计算设备104的用户渲染数据结构(或包括该数据结构的数字组成部分)。渲染数据结构可以包括基于数据结构的内容来视觉地显示图像和/或生成输出音频信号。
图4是示例计算机系统400的框图。计算机系统或计算设备400可以包括或用于实现系统100或其组件,诸如数据处理系统102。计算系统400包括总线405或其他用于传送信息的通信组件以及耦合到总线405以处理信息的处理器410或处理电路。计算系统400还可包括一个或多个处理器410或耦合到总线以处理信息的处理电路。计算系统400还包括耦合到总线405以用于存储信息和将由处理器410执行的指令的主存储器415,诸如随机存取存储器(RAM)或其他动态存储设备。主存储器415可以是或包括数据存储库122。主存储器415也可以用于在处理器410执行指令期间存储位置信息、临时变量或其他中间信息。计算系统400还可包括只读存储器(ROM)420或耦合到总线405以用于存储静态信息和处理器410的指令的静态存储设备。诸如固态设备、磁盘或光盘的存储设备425可以耦合到总线405以持续存储信息和指令。存储设备425可以包括或作为数据存储库122的一部分。
计算系统400可以经由总线405耦合到显示器435,诸如液晶显示器或有源矩阵显示器,以向用户显示信息。诸如包括字母数字键和其他键的键盘的输入设备430可以耦合到总线405,用于将信息和命令选择传送给处理器410。输入设备430可以包括触摸屏显示器435。输入设备430还可以包括光标控件,诸如鼠标、轨迹球或光标方向键,用于将方向信息和命令选择传送给处理器410,并且用于控制显示器435上的光标移动。例如,显示器435可以是数据处理系统102、客户端计算设备104或图1的其他组件的一部分。
本文所述的过程、系统和方法可以由计算系统400响应于处理器410执行包含在主存储器415中的指令的布置来实现。这样的指令可以从诸如存储设备425的另一计算机可读介质读取到主存储器415中。执行包含在主存储器415中的指令的布置使计算系统400执行本文所述的说明性过程。也可以采用多处理布置中的一个或多个处理器来执行包含在主存储器415中的指令。硬连线电路可以代替软件指令与本文所述的系统和方法一起使用或与结合软件指令与本文所述的系统和方法一起使用。本文描述的系统和方法不限于硬件电路和软件的任何特定组合。
尽管在图4中已经描述了示例计算系统,但是包括在本说明书中描述的操作的主题可以在其他类型的数字电子电路或包括在本说明书中公开的结构及结构等同物的计算机软件、固件或硬件中实现,或者在它们中的一个或多个的组合中实现。
对于本文讨论的系统收集有关用户的个人信息或可能使用个人信息的情况,可以向用户提供以下机会:控制程序或特征是否可以收集个人信息(例如,有关个人的社交网络、社交行为或活动、用户的偏好或用户的位置的信息),或控制是否或如何从内容服务器或其他可能与用户更相关的数据处理系统接收内容。另外,某些数据可以在存储或使用之前以一种或多种方式匿名化,以便在生成参数时移除个人可识别信息。例如,可以对用户的身份匿名化,以便无法为针对该用户确定任何个人可识别信息,或者可以在获得位置信息的情况下将用户的地理位置概括化(诸如概括化为城市、邮政编码或州级别),使得无法确定用户的特定位置。因此,用户可以控制如何收集有关他或她的信息以及如何由内容服务器使用信息。
本说明书中描述的主题和操作可以在数字电子电路或包括本说明书中公开的结构及其结构等同物的计算机软件、固件或硬件中实现,或在它们中的一个或多个的组合中实现。本说明书中描述的主题可以被实现为一个或多个计算机程序,例如,计算机程序指令的一个或多个电路,该程序指令被编码在一个或多个计算机存储介质上以由数据处理装置执行或控制数据处理装置的操作。可替选地或附加地,程序指令可以被编码在人工生成的传播信号上,例如,机器生成的电、光或电磁信号,其被生成以对信息进行编码以传输到合适的接收器装置用于由数据处理装置执行。计算机存储介质可以是或包括在计算机可读存储设备、计算机可读存储基板、随机或串行访问存储器阵列或设备或它们中的一个或多个的组合中。尽管计算机存储介质不是传播信号,但是计算机存储介质可以是以人工生成的传播信号编码的计算机程序指令的源或目的地。计算机存储介质还可以是一个或多个单独的组件或介质(例如,多个CD,磁盘或其他存储设备)或包括在其中。本说明书中描述的操作可以被实现为由数据处理装置对存储在一个或多个计算机可读存储设备上或从其他源接收的数据执行的操作。
术语“数据处理系统”、“计算设备”、“组件”或“数据处理装置”涵盖用于处理数据的各种装置、设备和机器,例如,包括可编程处理器、计算机、片上系统或多个或上述的组合。该装置可以包括专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或它们中的一个或多个的组合的代码。装置和执行环境可以实现各种不同的计算模型基础设施,诸如web服务、分布式计算和网格计算基础设施。直接动作API 116、内容选择器组件118、属性选择器组件113或者NLP组件112以及其它数据处理系统102组件可以包括或共享一个或多个数据处理装置、系统、计算设备或处理器。
计算机程序(也称为程序、软件、软件应用、app、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言、声明性或过程语言,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子例程、对象或其他适合在计算环境中使用的单元。计算机程序可以对应于文件系统中的文件。计算机程序可以存储在保存其他程序或数据的文件的一部分(例如,存储在标记语言文档中的一个或多个脚本)、专用于所讨论程序的单个文件、或多个协调文件(例如,存储一个或多个模块、子程序或代码的部分的文件)中。可以将计算机程序部署为在位于一个站点或分布在多个站点并通过通信网络互连的一个计算机或多个计算机上执行。
可以通过执行一个或多个计算机程序的一个或多个可编程处理器(例如,数据处理系统102的组件)来执行本说明书中描述的处理和逻辑流程,以通过对输入数据进行操作并生成输出来执行动作。过程和逻辑流程也可以由专用逻辑电路(例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)执行,并且装置也可以实现为该专用逻辑电路。适用于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储设备,包括例如半导体存储设备,例如,EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动磁盘;磁光盘;以及CD-ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或可以被并入专用逻辑电路中。
本文描述的主题可以在包括以下的计算系统中实现:后端组件,例如,作为数据服务器;或中间件组件,例如,应用服务器;或前端组件,例如,具有用户可通过其与本说明书中描述的主题的实施方式进行交互的图形用户界面或web浏览器的客户端计算机;或者一个或多个此类后端、中间件或前端组件的组合。系统的组件可以通过数字数据通信的任何形式或介质互连,该数字数据通信例如是通信网络。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、网际网络(例如,互联网)和对等网络(例如,ad hoc对等网络)。
本文描述的计算系统可以包括客户端和服务器。客户端和服务器通常彼此远离,并且通常通过通信网络(例如,网络105)进行交互。客户端和服务器的关系是通过在相应计算机上运行并彼此具有客户端-服务器关系的计算机程序产生的。在一些实施方式中,服务器将数据(例如,表示数据组成部分的数据分组)传输到客户端计算设备(例如,出于向与客户端计算设备交互的用户显示数据以及从该用户接收用户输入的目的)。可以从服务器处的客户端计算设备接收在客户端计算设备处生成的数据(例如,用户交互的结果)(例如,由数据处理系统102从客户端计算设备104或者内容提供商计算设备106接收)。
虽然在附图中以特定顺序描绘了操作,但是不需要以所示的特定顺序或以相继顺序来执行这样的操作,并且不需要执行所有示出的操作。本文描述的动作可以以不同顺序执行。
各个系统组件的分离并不需要在所有实施方式中都进行分离,并且所描述的程序组件可以包括在单个硬件或软件产品中。例如,NLP组件112、内容选择器组件118、或者属性选择器组件113可以是单个组件、app或程序、或具有一个或多个处理电路逻辑设备、或数据处理系统102的一个或多个服务器的一部分。
现在已经描述了一些说明性实施方式,很明显,已经以示例的方式给出的前述内容是说明性的而不是限制性的。特别地,尽管本文给出的许多示例涉及方法动作或系统元素的特定组合,但是可以以其他方式组合那些动作和那些元素以实现相同的目标。结合一个实施方式讨论的动作、要素和特征不旨在被排除在其他实施方式或者多个实施方式中的类似角色之外。
这里使用的措词和术语是出于描述的目的,而不应被认为是限制性的。本文中“包括(including)”、“包括(comprising)”、“具有”、“包含”、“涉及”、“特征为”、“特征在于”及其变体的使用意在涵盖其后列出的项目、其等同物和附加项目以及仅由其后列出的项目组成的替代实施方式。在一种实施方式中,本文描述的系统和方法由所描述的元素、动作或组件中的一个、每个多于一个的组合或全部组成。
对本文中以单数形式提及的系统和方法的实施方式或元素或动作的任何引用也可以涵盖包括多个这些元素的实施方式,并且在本文中以复数形式对任何实施方式、或元素或动作的任何引用也可以涵盖仅包含单个元素的实施方式。单数或复数形式的引用不旨在将当前公开的系统或方法、它们的组件、动作或元素限制为单个或多个配置。对基于任何信息、动作或元素的任何动作或元素的引用可以包括其中该行为或元素至少部分基于任何信息、动作或元素的实施方式。
本文公开的任何实施方式可以与任何其他实施方式或实施例组合,并且对“实施方式”、“一些实施方式”,“一个实施方式”等的引用不一定是互斥的,并且旨在指示结合实施方式描述的特定特征、结构或特性可以被包括在至少一个实施方式或实施例中。如本文所使用的这样的术语不一定全部指代相同的实施方式。任何实施方式可以以与本文公开的方面和实施方式一致的任何方式包括地或排他地与任何其他实施方式相结合。
对“或”的引用可以被解释为包括性的,使得使用“或”描述的任何术语可以指示所描述术语中的单个、多于一个以及全部中的任何一个。例如,对“‘A’和‘B’中的至少一个”的引用可以包括仅“A”、仅“B”以及“A”和“B”两者。结合“包括”或其他开放式术语使用的此类引用可以包括附加项目。
在附图、具体实施方式或任何权利要求中的技术特征之后跟随有参考标记的情况下,附图标记已经被包括以增加附图、具体实施方式和权利要求的可理解性。因此,参考标记或其缺失都不会对任何权利要求要素的范围产生任何限制性影响。
本文描述的系统和方法可以以其他特定形式来体现而不背离其特征。前述实施方式是说明性的,而不是限制所描述的系统和方法。因此,在此描述的系统和方法的范围由所附权利要求而不是前述描述来指示,并且在权利要求的等同含义和范围内的改变被包含在其中。
Claims (20)
1.一种在语音激活的系统中提供数字组成部分的系统,包括:
自然语言处理器组件,由数据处理系统执行所述自然语言处理器组件以:
经由接口接收输入音频信号;以及
解析所述输入音频信号以识别所述输入音频信号中的第一搜索请求;
内容选择器组件,由所述数据处理系统执行所述内容选择器组件以基于所述第一搜索请求来选择多个搜索结果;
属性选择器组件,由所述数据处理系统执行所述属性选择器组件以:
确定针对所述第一搜索请求的搜索上下文;
确定包括与所述多个搜索结果中的每一个搜索结果相关联的信息的多个属性;
基于所述搜索上下文来针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性确定第一加权;
基于客户端设备上下文来针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性确定第二加权;以及
针对所述多个搜索结果中的每一个搜索结果,基于针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第一加权以及针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第二加权来从所述多个属性中选择属性子集;以及
音频信号生成组件,由所述数据处理系统执行所述音频信号生成组件以:
生成包括数据结构的数字组成部分,所述数据结构针对所述多个搜索结果中的每一个搜索结果具有基于针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第一加权以及针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第二加权来从所述多个属性中的每一个属性中所选择的属性子集;以及
响应于所述输入音频信号而经由所述接口将所述数字组成部分传输到客户端设备。
2.根据权利要求1所述的系统,包括所述数据处理系统:
对所述多个搜索结果进行排名;以及
基于对所述多个搜索结果的所述排名来生成针对所述多个属性的第三加权。
3.根据权利要求1所述的系统,包括所述数据处理系统:
将第一排名分配给所述多个搜索结果中的第一搜索结果;
将第二排名分配给所述多个搜索结果中的第二搜索结果;
确定所述多个搜索结果中的所述第一搜索结果具有与所述多个搜索结果中的所述第二搜索结果的第一属性相对应的第一属性;以及
基于所述多个搜索结果中的所述第一属性与所述多个搜索结果中的所述第二搜索结果的所述第一属性相对应,将惩罚加权应用于所述多个搜索结果中的所述第二搜索结果的所述第一属性。
4.根据权利要求1所述的系统,包括所述数据处理系统:
将第一排名分配给所述多个搜索结果中的第一搜索结果;
将第二排名分配给所述多个搜索结果中的第二搜索结果;
确定所述多个搜索结果中的所述第一搜索结果具有与所述多个搜索结果中的所述第二搜索结果的第一属性相对应的第一属性;以及
基于所述多个搜索结果中的所述第一属性与所述多个搜索结果中的所述第二搜索结果的所述第一属性相对应,从所述数据结构中移除所述多个搜索结果中的所述第二搜索结果的所述第一属性。
5.根据权利要求1所述的系统,包括所述数据处理系统:
对针对所述多个搜索结果中的每一个搜索结果的所述多个属性进行排名;
对所述多个搜索结果进行排名;以及
基于对针对所述多个搜索结果中的每一个搜索结果的所述多个属性的所述排名和对所述多个搜索结果的所述排名来生成针对所述多个搜索结果中的每一个搜索结果的所述多个属性的得分。
6.根据权利要求1所述的系统,包括所述数据处理系统:
基于所述客户端设备上下文来确定属性数量;以及
选择针对所述多个搜索结果中的每一个搜索结果的所述属性数量。
7.根据权利要求1所述的系统,包括所述数据处理系统:
确定针对所述多个搜索结果中的每一个搜索结果的属性数量;以及
选择针对所述多个搜索结果的所述属性数量。
8.根据权利要求7所述的系统,其中,针对所述多个搜索结果中的每一个搜索结果的所述属性数量是不同的。
9.根据权利要求1所述的系统,其中,所述多个属性能够包括对地址、出价、营业时间、停业时间、许可证、证书、服务、专业性、能力或等级的指示。
10.根据权利要求1所述的系统,包括所述数据处理系统:
选择针对从所述多个属性中所选择的属性的第一渲染格式;以及
选择针对第二所选择的属性的第二渲染格式,其中,所述第二渲染格式不同于所述第一渲染格式。
11.一种在语音激活的系统中提供数字组成部分的方法,包括:
通过由数据处理系统执行的自然语言处理器组件,经由所述数据处理系统的接口来接收输入音频信号;
通过所述自然语言处理器组件,解析所述输入音频信号以识别所述输入音频信号中的第一搜索请求;
通过由所述数据处理系统执行的内容选择器组件,基于所述第一搜索请求来选择多个搜索结果;
通过由所述数据处理系统执行的属性选择器组件,确定针对所述第一搜索请求的搜索上下文;
通过所述属性选择器组件,确定包括与所述多个搜索结果中的每一个搜索结果相关联的信息的多个属性;
通过所述属性选择器组件,基于所述搜索上下文来确定针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的第一加权;
通过所述属性选择器组件,基于客户端设备上下文来确定针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的第二加权;
通过所述属性选择器组件,针对所述多个搜索结果中的每一个搜索结果,基于针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第一加权以及针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第二加权来从所述多个属性中选择属性子集;
通过由所述数据处理系统执行的音频信号生成器,生成包括数据结构的数字组成部分,所述数据结构针对所述多个搜索结果中的每一个搜索结果具有基于针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第一加权以及针对所述多个搜索结果中的每一个搜索结果的所述多个属性中的每一个属性的所述第二加权来从所述多个属性中的每一个属性中所选择的属性子集;以及
通过所述音频信号生成器组件,响应于所述输入音频信号而经由所述接口将所述数字组成部分传输到客户端设备。
12.根据权利要求11所述的方法,包括:
对所述多个搜索结果进行排名;以及
基于对所述多个搜索结果的所述排名来生成针对所述多个属性的第三加权。
13.根据权利要求11所述的方法,包括:
将第一排名分配给所述多个搜索结果中的第一搜索结果;
将第二排名分配给所述多个搜索结果中的第二搜索结果;
确定所述多个搜索结果中的所述第一搜索结果具有与所述多个搜索结果中的所述第二搜索结果的第一属性相对应的第一属性;以及
基于所述多个搜索结果的所述第一属性与所述多个搜索结果中的所述第二搜索结果的所述第一属性相对应,调整所述多个搜索结果中的所述第二搜索结果的所述第一属性的加权。
14.根据权利要求11所述的方法,包括:
将第一排名分配给所述多个搜索结果中的第一搜索结果;
将第二排名分配给所述多个搜索结果中的第二搜索结果;
确定所述多个搜索结果中的所述第一搜索结果具有与所述多个搜索结果中的所述第二搜索结果的第一属性相对应的第一属性;以及
基于所述多个搜索结果中的所述第一属性与所述多个搜索结果中的所述第二搜索结果的所述第一属性相对应,从所述数据结构中移除所述多个搜索结果中的所述第二搜索结果的所述第一属性。
15.根据权利要求11所述的方法,包括:
对针对所述多个搜索结果中的每一个搜索结果的所述多个属性进行排名;
对所述多个搜索结果进行排名;以及
基于对针对所述多个搜索结果中的每一个搜索结果的所述多个属性的所述排名和对所述多个搜索结果的所述排名来生成针对所述多个搜索结果中的每一个搜索结果的所述多个属性的得分。
16.根据权利要求11所述的方法,包括:
基于所述客户端设备上下文来确定属性数量;以及
选择针对所述多个搜索结果中的每一个搜索结果的所述属性数量。
17.根据权利要求11所述的方法,包括:
确定针对所述多个搜索结果中的每一个搜索结果的属性数量;以及
选择针对所述多个搜索结果的所述属性数量。
18.根据权利要求17所述的方法,其中,针对所述多个搜索结果中的每一个搜索结果的所述属性数量是不同的。
19.根据权利要求11所述的方法,其中,所述多个属性能够包括对地址、出价、营业时间、停业时间、许可证、证书、服务、专业性、能力或等级的指示。
20.根据权利要求11所述的方法,包括:
选择针对从所述多个属性中所选择的属性的第一渲染格式;以及
选择针对第二所选择的属性的第二渲染格式,其中,所述第二渲染格式不同于所述第一渲染格式。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/914,949 US10896213B2 (en) | 2018-03-07 | 2018-03-07 | Interface for a distributed network system |
US15/914,949 | 2018-03-07 | ||
PCT/US2018/049782 WO2019172954A1 (en) | 2018-03-07 | 2018-09-06 | Interface for a distributed network system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111344694A CN111344694A (zh) | 2020-06-26 |
CN111344694B true CN111344694B (zh) | 2023-06-06 |
Family
ID=63794603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880069402.3A Active CN111344694B (zh) | 2018-03-07 | 2018-09-06 | 分布式网络系统的接口 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10896213B2 (zh) |
EP (1) | EP3685277A1 (zh) |
CN (1) | CN111344694B (zh) |
WO (1) | WO2019172954A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200394351A1 (en) * | 2018-02-07 | 2020-12-17 | Incucomm, Inc. | Operations and maintenance systems and methods employing sensor-less digital twins |
US20190243933A1 (en) * | 2018-02-07 | 2019-08-08 | Incucomm, Inc. | System and method that characterizes an object employing virtual representations thereof |
US11347756B2 (en) * | 2019-08-26 | 2022-05-31 | Microsoft Technology Licensing, Llc | Deep command search within and across applications |
US11900046B2 (en) | 2020-08-07 | 2024-02-13 | Microsoft Technology Licensing, Llc | Intelligent feature identification and presentation |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104795067A (zh) * | 2014-01-20 | 2015-07-22 | 华为技术有限公司 | 语音交互方法及装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6999932B1 (en) | 2000-10-10 | 2006-02-14 | Intel Corporation | Language independent voice-based search system |
US20170237801A1 (en) * | 2004-06-30 | 2017-08-17 | Google Inc. | Device configuration-based function delivery |
US20080005068A1 (en) | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Context-based search, retrieval, and awareness |
US20080071544A1 (en) | 2006-09-14 | 2008-03-20 | Google Inc. | Integrating Voice-Enabled Local Search and Contact Lists |
US9183312B2 (en) * | 2012-03-20 | 2015-11-10 | Google Inc. | Image display within web search results |
CN104969289B (zh) | 2013-02-07 | 2021-05-28 | 苹果公司 | 数字助理的语音触发器 |
US10055462B2 (en) * | 2013-03-15 | 2018-08-21 | Google Llc | Providing search results using augmented search queries |
US9760608B2 (en) * | 2013-11-01 | 2017-09-12 | Microsoft Technology Licensing, Llc | Real-time search tuning |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
-
2018
- 2018-03-07 US US15/914,949 patent/US10896213B2/en active Active
- 2018-09-06 EP EP18783170.6A patent/EP3685277A1/en not_active Withdrawn
- 2018-09-06 WO PCT/US2018/049782 patent/WO2019172954A1/en unknown
- 2018-09-06 CN CN201880069402.3A patent/CN111344694B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104795067A (zh) * | 2014-01-20 | 2015-07-22 | 华为技术有限公司 | 语音交互方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111344694A (zh) | 2020-06-26 |
WO2019172954A1 (en) | 2019-09-12 |
US10896213B2 (en) | 2021-01-19 |
EP3685277A1 (en) | 2020-07-29 |
US20190347356A1 (en) | 2019-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10535348B2 (en) | Multimodal transmission of packetized data | |
CN111344694B (zh) | 分布式网络系统的接口 | |
KR102603717B1 (ko) | 네트워크 시스템에서 도메인-특정 모델의 생성 | |
JP2020129145A (ja) | パケット化されたオーディオ信号の変調 | |
US11848009B2 (en) | Adaptive interface in a voice-activated network | |
CN115210692A (zh) | 用于数字动作执行的接口和模式选择 | |
CN110692040A (zh) | 在网络系统中激活远程设备 | |
CN110149810B (zh) | 限制在网络环境中操纵内容的传输系统和方法及数字助理装置 | |
US11798555B2 (en) | Detection of duplicate packetized data for selective transmission into one of a plurality of a user's devices | |
CN111213136B (zh) | 联网系统中特定于域的模型的生成 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |