JP7139295B2 - パケット化されたデータのマルチモーダル送信のシステムおよび方法 - Google Patents

パケット化されたデータのマルチモーダル送信のシステムおよび方法 Download PDF

Info

Publication number
JP7139295B2
JP7139295B2 JP2019163135A JP2019163135A JP7139295B2 JP 7139295 B2 JP7139295 B2 JP 7139295B2 JP 2019163135 A JP2019163135 A JP 2019163135A JP 2019163135 A JP2019163135 A JP 2019163135A JP 7139295 B2 JP7139295 B2 JP 7139295B2
Authority
JP
Japan
Prior art keywords
computing device
interface
processing system
data processing
content item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019163135A
Other languages
English (en)
Other versions
JP2020042270A (ja
Inventor
ジャスティン・ルイス
リチャード・ラップ
ガウラフ・バハヤ
ロバート・ステッツ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US15/395,703 external-priority patent/US10032452B1/en
Application filed by Google LLC filed Critical Google LLC
Publication of JP2020042270A publication Critical patent/JP2020042270A/ja
Priority to JP2022141325A priority Critical patent/JP7554797B2/ja
Application granted granted Critical
Publication of JP7139295B2 publication Critical patent/JP7139295B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S11/00Systems for determining distance or velocity not using reflection or reradiation
    • G01S11/14Systems for determining distance or velocity not using reflection or reradiation using ultrasonic, sonic, or infrasonic waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/02Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using radio waves
    • G01S5/0295Proximity-based methods, e.g. position inferred from reception of particular signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B13/00Transmission systems characterised by the medium used for transmission, not provided for in groups H04B3/00 - H04B11/00
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/70Routing based on monitoring results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S2205/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S2205/01Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations specially adapted for specific applications
    • G01S2205/02Indoor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/02Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using radio waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本願は、発明の名称を「パケット化されたデータのマルチモーダル送信」とした2017年8月11日出願の米国特許出願第15/674、838号、および発明の名称を「パケット化されたデータのマルチモーダル送信とした」2016年12月30日出願の米国特許出願第15/395、703号に対する優先権の利益を主張し、その各々は引用により全体として全ての目的で本明細書に組み込まれる。
コンピューティングリソースを利用しているコンピューティングデバイスへのデータの送信は、過度なパケット・ベースのネットワーク送信または過度のネットワークトラフィックデータのネットワーク送信をもたらし、コンピューティングデバイスが正しく前記ネットワークトラフィックデータを処理し、前記ネットワークトラフィックデータに関連する動作を完了し、または前記ネットワークトラフィックデータにタイムリーに応答することを防止しうる。コンテンツ・アイテムオブジェクトに対応するネットワーク送信の制御は、コンピューティングデバイスの間のネットワークトラフィックデータのネットワーク送信を開始しうる大量のコンテンツ・アイテムオブジェクトにより複雑化されうる。
少なくとも1つの態様は、音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムに関する。データ処理システムにより実行される自然言語プロセッサ・コンポーネントは、データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することができる。当該自然言語プロセッサ・コンポーネントは当該入力オーディオ信号を解析して、要求および当該要求に対応するトリガキーワードを識別することができる。データ処理システムのダイレクト・アクション・アプリケーション・プログラミング・インタフェースは、当該要求および当該トリガキーワードの少なくとも1つに基づいて第1のアクションデータ構造を生成することができる。データ処理システムにより実行されたコンテンツセレクタコンポーネントは、当該自然言語プロセッサにより識別された当該要求および当該トリガキーワードのうち少なくとも1つを受信することができ、リアルタイムコンテンツ選択プロセスを介して当該要求および当該トリガキーワードのうち少なくとも1つに基づいて、コンテンツ・アイテムを選択することができる。データ処理システムのインタフェース管理コンポーネントは、複数のインタフェースをポーリングして第1の候補インタフェースおよび第2の候補インタフェースを識別することができ、第1の候補インタフェースに対する第1のリソース利用値および第2の候補インタフェースに対する第2のリソース利用値を決定することができる。第1のリソース利用値および第2のリソース利用値は、バッテリステータス、プロセッサ利用率、メモリ利用率、インタフェースパラメータ、およびネットワーク帯域幅利用率の少なくとも1つに基づくことができる。当該インタフェース管理コンポーネントは、第1のリソース利用値および第2のリソース利用値の比較に基づいて、第1の候補インタフェースを、当該コンテンツ・アイテムを提供するための選択されたインタフェースとして選択することができ、第1のリソース利用値および第2のリソース利用値の比較に基づいて選択された当該選択されたインタフェースと互換なモダリティで配送するために当該コンテンツ・アイテムを変換することができる。当該インタフェース管理コンポーネントは、クライアントコンピューティングデバイスからオーディオ出力を描画するために、第1のアクションデータ構造をクライアントコンピューティングデバイスに提供でき、当該選択されたインタフェースから描画するコンテンツ・アイテムを配送するための第1のモダリティに関して変換された当該コンテンツ・アイテムを送信することができる。
少なくとも1つの態様は、音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信の方法に関する。当該方法は、データ処理システムにより実行される自然言語プロセッサ・コンポーネントにより、データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することができる。当該方法は、当該自然言語プロセッサ・コンポーネントにより、当該入力オーディオ信号から、要求および当該要求に対応するトリガキーワードを識別することができる。当該方法は、データ処理システムのダイレクト・アクション・アプリケーション・プログラミング・インタフェースにより、当該トリガキーワードの少なくとも1つに基づいて第1のアクションデータ構造を生成することができる。当該方法は、データ処理システムにより実行されたコンテンツセレクタコンポーネントにより、当該自然言語プロセッサにより識別された当該要求および当該トリガキーワードのうち少なくとも1つを受信し、リアルタイムコンテンツ選択プロセスを介して当該要求および当該トリガキーワードのうち少なくとも1つに基づいて、コンテンツ・アイテムを選択することができる。当該方法は、データ処理システムのインタフェース管理コンポーネントにより、複数のインタフェースをポーリングして、第1の候補インタフェースおよび第2の候補インタフェースを識別することができる。当該方法は、当該インタフェース管理コンポーネントにより、第1の候補インタフェースに対する第1のリソース利用値および第2の候補インタフェースに対する第2のリソース利用値を決定することができる。第1のリソース利用値および第2のリソース利用値は、バッテリステータス、プロセッサ利用率、メモリ利用率、インタフェースパラメータ、およびネットワーク帯域幅利用率の少なくとも1つに基づくことができる。当該方法は、第1のリソース利用値および第2のリソース利用値の比較に基づいて、第1の候補インタフェースを、当該コンテンツ・アイテムを提供するための選択されたインタフェースとして選択することができる。当該方法は第1のリソース利用値および第2のリソース利用値の比較に基づいて選択された当該選択されたインタフェースと互換なモダリティで配送するために当該コンテンツ・アイテムを変換することができる。当該方法は、クライアントコンピューティングデバイスからオーディオ出力を描画するために、第1のアクションデータ構造をクライアントコンピューティングデバイスに提供できる。当該方法は、当該選択されたインタフェースから描画するコンテンツ・アイテムを配送するための第1のモダリティに関して変換された当該コンテンツ・アイテムを送信することができる。
少なくとも1つの態様は、1つまたは複数のデータプロセッサにより実行されたとき、当該1つまたは複数のデータプロセッサに音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のための動作を実施させる命令を格納するコンピュータ可読記憶媒体に関する。当該動作は、データ処理システムにより実行される自然言語プロセッサ・コンポーネントにより、データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することができる。当該動作は、当該自然言語プロセッサ・コンポーネントにより、当該入力オーディオ信号から、要求および当該要求に対応するトリガキーワードを識別することができる。当該動作は、データ処理システムのダイレクト・アクション・アプリケーション・プログラミング・インタフェースにより、当該トリガキーワードの少なくとも1つに基づいて第1のアクションデータ構造を生成することができる。当該動作は、データ処理システムにより実行されたコンテンツセレクタコンポーネントにより、当該自然言語プロセッサにより識別された当該要求および当該トリガキーワードのうち少なくとも1つを受信し、リアルタイムコンテンツ選択プロセスを介して当該要求および当該トリガキーワードのうち少なくとも1つに基づいて、コンテンツ・アイテムを選択することができる。当該動作は、データ処理システムのインタフェース管理コンポーネントにより、複数のインタフェースをポーリングして、第1の候補インタフェースおよび第2の候補インタフェースを識別することができる。当該動作は、当該インタフェース管理コンポーネントにより、第1の候補インタフェースに対する第1のリソース利用値および第2の候補インタフェースに対する第2のリソース利用値を決定することができる。第1のリソース利用値および第2のリソース利用値は、バッテリステータス、プロセッサ利用率、メモリ利用率、インタフェースパラメータ、およびネットワーク帯域幅利用率の少なくとも1つに基づくことができる。当該動作は、第1のリソース利用値および第2のリソース利用値の比較に基づいて、第1の候補インタフェースを、当該コンテンツ・アイテムを提供するための選択されたインタフェースとして選択することができる。当該動作は第1のリソース利用値および第2のリソース利用値の比較に基づいて選択された当該選択されたインタフェースと互換なモダリティで配送するために当該コンテンツ・アイテムを変換することができる。当該動作は、クライアントコンピューティングデバイスからオーディオ出力を描画するために、第1のアクションデータ構造をクライアントコンピューティングデバイスに提供できる。当該動作は、当該選択されたインタフェースから描画するコンテンツ・アイテムを配送するための第1のモダリティに関して変換された当該コンテンツ・アイテムを送信することができる。
少なくとも1つの態様は、音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムに関する。データ処理システムにより実行される自然言語プロセッサ・コンポーネントは、データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することができる。当該自然言語プロセッサ・コンポーネントは当該入力オーディオ信号を解析して、要求および当該要求に対応するトリガキーワードを識別することができる。データ処理システムのダイレクト・アクション・アプリケーション・プログラミング・インタフェースは、当該要求および当該トリガキーワードの少なくとも1つに基づいて、第1のアクションデータ構造を生成することができる。データ処理システムにより実行されたコンテンツセレクタコンポーネントは、当該自然言語プロセッサにより識別された当該要求および当該トリガキーワードのうち少なくとも1つを受信することができ、リアルタイムコンテンツ選択プロセスを介して当該要求および当該トリガキーワードのうち少なくとも1つに基づいて、コンテンツ・アイテムを選択することができる。データ処理システムのインタフェース管理コンポーネントは、複数のインタフェースをポーリングして、当該コンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別し、第1の候補インタフェースに対する第1のリソース利用値および第2の候補インタフェースに対する第2のリソース利用値を決定することができる。当該インタフェース管理コンポーネントは、第1のリソース利用値および第2のリソース利用値の比較に基づいて、第1の候補インタフェースを、当該コンテンツ・アイテムを提供するための選択されたインタフェースとして選択することができ、第1のリソース利用値および第2のリソース利用値の比較に基づいて選択された当該選択されたインタフェースと互換なモダリティで配送するために当該コンテンツ・アイテムを提供することができる。当該インタフェース管理コンポーネントは、当該コンテンツ・アイテムを第1のモダリティで送信して、当該選択されたインタフェースから描画するための当該コンテンツ・アイテムを配送することができる。
少なくとも1つの態様は、音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信の方法に関する。当該方法は、データ処理システムにより実行される自然言語プロセッサ・コンポーネントにより、データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することができる。当該方法は、当該自然言語プロセッサ・コンポーネントにより、当該入力オーディオ信号から、要求および当該要求に対応するトリガキーワードを識別することができる。当該方法は、データ処理システムのダイレクト・アクション・アプリケーション・プログラミング・インタフェースにより、当該トリガキーワードの少なくとも1つに基づいて第1のアクションデータ構造を生成することができる。当該方法は、データ処理システムにより実行されたコンテンツセレクタコンポーネントにより、当該自然言語プロセッサにより識別された当該要求および当該トリガキーワードのうち少なくとも1つを受信し、リアルタイムコンテンツ選択プロセスを介して当該要求および当該トリガキーワードのうち少なくとも1つに基づいて、コンテンツ・アイテムを選択することができる。当該方法は、データ処理システムのインタフェース管理コンポーネントにより、複数のインタフェースをポーリングして、当該コンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別することができる。当該方法は、当該インタフェース管理コンポーネントにより、第1の候補インタフェースに対する第1のリソース利用値および第2の候補インタフェースに対する第2のリソース利用値を決定することができる。当該方法は、第1のリソース利用値および第2のリソース利用値の比較に基づいて、第1の候補インタフェースを、当該コンテンツ・アイテムを提供するための選択されたインタフェースとして選択することができる。当該方法は第1のリソース利用値および第2のリソース利用値の比較に基づいて選択された当該選択されたインタフェースと互換なモダリティで配送するために当該コンテンツ・アイテムを変換することができる。当該方法は当該選択されたインタフェースから描画するコンテンツ・アイテムを配送するための第1のモダリティに関して変換された当該コンテンツ・アイテムを送信することができる。
少なくとも1つの態様は、1つまたは複数のデータプロセッサにより実行されたとき、当該1つまたは複数のデータプロセッサに音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のための動作を実施させる命令を格納するコンピュータ可読記憶媒体に関する。当該動作は、データ処理システムにより実行される自然言語プロセッサ・コンポーネントにより、データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することができる。当該動作は、当該自然言語プロセッサ・コンポーネントにより、当該入力オーディオ信号から、要求および当該要求に対応するトリガキーワードを識別することができる。当該動作は、データ処理システムのダイレクト・アクション・アプリケーション・プログラミング・インタフェースにより、当該トリガキーワードの少なくとも1つに基づいて第1のアクションデータ構造を生成することができる。当該動作は、データ処理システムにより実行されたコンテンツセレクタコンポーネントにより、当該自然言語プロセッサにより識別された当該要求および当該トリガキーワードのうち少なくとも1つを受信し、リアルタイムコンテンツ選択プロセスを介して当該要求および当該トリガキーワードのうち少なくとも1つに基づいて、コンテンツ・アイテムを選択することができる。当該動作は、データ処理システムのインタフェース管理コンポーネントにより、複数のインタフェースをポーリングして、当該コンピューティングデバイスの閾値距離を有する第1の候補インタフェースおよび第2の候補インタフェースを識別することができる。当該動作は、当該インタフェース管理コンポーネントにより、第1の候補インタフェースに対する第1のリソース利用値および第2の候補インタフェースに対する第2のリソース利用値を決定することができる。当該動作は、第1のリソース利用値および第2のリソース利用値の比較に基づいて、第1の候補インタフェースを、当該コンテンツ・アイテムを提供するための選択されたインタフェースとして選択することができる。当該動作は第1のリソース利用値および第2のリソース利用値の比較に基づいて選択された当該選択されたインタフェースと互換なモダリティで配送するために当該コンテンツ・アイテムを変換することができる。当該動作は、当該選択されたインタフェースから描画するコンテンツ・アイテムを配送するための第1のモダリティに関して変換された当該コンテンツ・アイテムを送信することができる。
これらのおよび他の態様および実装を以下で説明する。以上の情報および以下の詳細な説明は様々な態様および実装の例示的な例を含み、クレームした態様および実装の性質と特徴を理解するための概要またはフレームワークを提供する。当該図面は当該様々な態様および実装の例示とさらなる理解を提供し、本明細書に組み込まれ本明細書の一部を構成する。
添付図面は正しい縮尺で描かれていない。当該様々な図面における同じ参照番号および指定は同じ要素を示す。明確さの目的のため、全てのコンポーネントが全ての図面においてラベル付けされていないかもしれない。
音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムを示す図である。 音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のための流れ図である。 音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信の方法を示す図である。 音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムの例示的な動作を示す図である。 音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムの例示的な動作を示す図である。 本明細書で説明し図示したシステムおよび方法の要素を実装するために使用されうるコンピュータシステムのための汎用アーキテクチャを示すブロック図である。
以下は様々な概念のより詳細な説明であり、音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信の方法、装置、およびシステムの実装に関連する。上で導入し以下でさらに詳細に説明する様々な概念を任意の多数の方法で実装してもよい。
本開示のシステムおよび方法は一般に、音声起動されたコンピュータ・ネットワーク環境におけるデータ・パケット(または他のプロトコルベースの)送信のための最適な送信モダリティを識別するデータ処理システムに関する。データ処理システムは、例えば、コンテンツ・アイテムのコンピュータ・ネットワークを通って1つまたは複数のクライアントコンピューティングデバイスに、または単一のクライアントコンピューティングデバイスの異なるインタフェース(例えば、異なるアプリまたはプログラム)にルーティングされるデータ・パケットに対する複数のオプションから送信モダリティを選択することによって、1つまたは複数のコンピュータ・ネットワーク上のデータ・パケット送信の効率および有効性を高めることができる。当該選択された動作に対応するデータ・パケットまたは他のプロトコルベースの信号は、複数のコンピューティングデバイスの間のコンピュータ・ネットワークを通じてルーティングされることができる。例えばデータ処理システムは、要求がそこから受信されたインタフェースと異なるインタフェースにコンテンツ・アイテムをルーティングすることができる。当該異なるインタフェースは、要求がそこから受信された同一のクライアントコンピューティングデバイスまたは異なるクライアントコンピューティングデバイスであることができる。データ処理システムは、コンテンツ・アイテム送信に対する複数の候補インタフェースからクライアントコンピューティングデバイスへの少なくとも1つの候補インタフェースを選択することができる。当該候補インタフェースを、プロセッサ能力または利用率、メモリ能力または可用性、バッテリステータス、利用可能な電力、ネットワーク帯域幅利用率、インタフェースパラメータまたは他のリソース利用値のような技術的またはコンピューティングパラメータに基づいて決定することができる。当該候補インタフェースに関連付けられた候補インタフェースまたは利用率に基づいてクライアントコンピューティングデバイスから描画するための当該コンテンツ・アイテムを受信し提供するためのインタフェースを選択することによって、データ処理システムは、当該コンテンツ・アイテムを描画するクライアントコンピューティングデバイスのネットワーク帯域幅利用率、レイテンシ、または処理の利用または電力消費を減らすことができる。これは、処理電力およびメモリのような他のコンピューティングリソースを節約し、データ処理システムによる電気電力消費および当該コンピュータ・ネットワークを介した当該削減されたデータ送信を減らし、データ処理システムの帯域幅要件および利用を減らす。
本明細書で説明するシステムおよび方法は入力オーディオクエリを受信するデータ処理システムを含むことができる。当該データ処理システをまた、入力オーディオ信号と称することができる。当該入力オーディオクエリから、データ処理システムは要求および当該要求に対応するトリガキーワードを識別することができる。当該トリガキーワードまたは当該要求に基づいて、データ処理システムは第1のアクションデータ構造を生成することができる。例えば、第1のアクションデータ構造はクライアントコンピューティングデバイスから受信された当該入力オーディオクエリに対する有機的な応答を含むことができ、データ処理システムは、当該要求がそこから受信された同一のインタフェースを介してオーディオ出力を描画するための同一のクライアントコンピューティングデバイスに第1のアクションデータ構造を提供することができる。
データ処理システムはまた、当該トリガキーワードまたは当該要求に基づいて少なくとも1つのコンテンツ・アイテムを選択することができる。データ処理システムは当該コンテンツ・アイテム(複数可)を描画するための複数の候補インタフェースを識別または決定することができる。当該インタフェースは、ディスプレイスクリーン、オーディオインタフェース、スピーカ、当該入力オーディオクエリを生成したクライアントコンピューティングデバイス上で、または異なるクライアントコンピューティングデバイス上で利用可能なアプリケーションまたはプログラムのような1つまたは複数のハードウェアまたはソフトウェアインタフェースを含むことができる。当該インタフェースは、コンテンツ・アイテムを挿入するためのオンラインドキュメントのためのjavaスクリプトスロット、ならびにプッシュ通知インタフェースを含むことができる。データ処理システムは当該異なる候補インタフェースに対する利用値を決定することができる。当該利用値は、例えば、電力、処理、メモリ、帯域幅、またはインタフェースパラメータ能力を示すことができる。当該候補インタフェースに対する当該利用値に基づいて、データ処理システムは、当該コンテンツ・アイテムの提示または描画のための選択されたインタフェースとして候補インタフェースを選択することができる。例えば、データ処理システムは、当該選択されたインタフェースと互換なモダリティで配送するために当該コンテンツ・アイテムを変換または提供することができる。当該選択されたインタフェースは、当該入力オーディオ信号を生成した同一のクライアントコンピューティングデバイスまたは異なるクライアントコンピューティングデバイスのインタフェースであることができる。候補インタフェースに関連付けられた利用値に基づいてコンピューティングネットワークを介してデータ・パケットをルーティングすることによって、データ処理システムは、利用可能なオプションから最小量の処理電力、メモリ、または帯域幅を使用できる方式、または1つまたは複数のクライアントコンピューティングデバイスの電力を保存できる方式で、当該コンテンツ・アイテムに対する。
データ処理システムは、当該コンテンツ・アイテムまたは第1のアクションデータ構造を、パケットまたは他のプロトコルベースのデータメッセージ送信によりコンピュータ・ネットワークを介して、クライアントコンピューティングデバイスに提供することができる。当該出力信号は、クライアントコンピューティングデバイスのオーディオドライバコンポーネントに、音波、例えば、オーディオ出力を生成させることができる。当該音波はクライアントコンピューティングデバイスから出力できる。当該オーディオ(または他の)出力は第1のアクションデータ構造または当該コンテンツ・アイテムに対応することができる。例えば第1のアクションデータ構造をオーディオ出力としてルーティングでき、当該コンテンツ・アイテムをテキストベースのメッセージとしてルーティングすることができる。第1のアクションデータ構造および当該コンテンツ・アイテムを異なるインタフェースにルーティングすることによって、データ処理システムは、第1のアクションデータ構造および当該コンテンツ・アイテムの両方を同一のインタフェースに提供することに対して、各インタフェースにより利用されるリソースを保存することができる。これは、第1のアクションデータ構造および当該コンテンツ・アイテムの別々のおよび独立なルーティングなしのケースよりも、当該選択されたインタフェース(またはそれらの対応するデバイス)によるより少ないデータ処理動作、より少ないメモリ利用、またはより少ないネットワーク帯域幅利用をもたらす。
データ処理システムは、マイクロフォンを介して入力オーディオ信号を検出するコンピューティングデバイスの範囲内の1つまたは複数のデバイスを識別することができる。データ処理システムは、1つまたは複数の候補インタフェースを識別するための範囲内の当該1つまたは複数の識別されたデバイスをポーリングすることができる。データ処理システムは、当該1つまたは複数の候補インタフェースの各々が、それを介して通知またはコンテンツ・アイテムを送信するためのインタフェースを選択するためのリソース利用値を決定することができる。例えば、データ処理システムは、コンテンツ・アイテムまたは通知を送信することを決定することができる。データ処理システムは、コンピューティングデバイスにより受信された音声入力に応答して当該コンテンツ・アイテムまたは当該通知を送信することを決定することができる。当該コンテンツ・アイテムまたは当該通知の送信の前に、データ処理システムは、当該コンピューティングデバイスの範囲内の1つまたは複数のコンピューティングデバイスを識別することができる。データ処理システムは当該複数のコンピューティングデバイスをポーリングして、当該コンテンツ・アイテムに対する候補インタフェースを識別することができる。データ処理システムは、例えば、第1のコンピューティングデバイスの第1の候補インタフェースが高いリソース利用値を有すると判定することができる(例えば、第1の候補インタフェースはオーディオインタフェースであることができ、データ処理システムは第1のコンピューティングデバイスが音楽を再生していると判定することができる)。データ処理システムは、第2の候補インタフェースが低いリソース利用値を有する(例えば、第2の候補インタフェースは現在使用されていない視覚ディスプレイを含むことができる)と判定することができる。データ処理システムはさらに、当該コンテンツ・アイテムをオーディオフォーマットまたは視覚フォーマットで提供しうると判定することができる。データ処理システムは次いで、第2の候補インタフェースを選択し、当該コンテンツ・アイテムを当該視覚フォーマットで変換または選択し、および第2の候補インタフェースを介して表示するための当該候補コンテンツ・アイテムを送信することができる。
図1は、音声起動されたデータ・パケット(または他のプロトコル)ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のための例示的なシステム100を示す。システム100は少なくとも1つのデータ処理システム105を含むことができる。データ処理システム105は少なくとも1つのプロセッサを有する少なくとも1つのサーバを含むことができる。例えば、データ処理システム105は、少なくとも1つのデータセンタまたはサーバ・ファームに配置された複数のサーバを含むことができる。データ処理システム105は、オーディオ入力信号から要求および当該要求に関連付けられたトリガキーワードを決定することができる。当該要求およびトリガキーワードに基づいてデータ処理システム105は少なくとも1つのアクションデータ構造を決定または選択でき、少なくとも1つのコンテンツ・アイテムを選択することができる(および本明細書で説明したように他のアクションを開始する)。データ処理システム105は、当該アクションデータ構造または当該コンテンツ・アイテムを描画するための候補インタフェースを識別でき、当該候補インタフェースに対するまたは当該インタフェースのリソース利用値に基づいて、例えば音声起動された通信または計画システムの一部として、1つまたは複数のクライアントコンピューティングデバイス上の1つまたは複数の候補インタフェースにより描画するための当該アクションデータ構造または当該コンテンツ・アイテムを提供することができる。当該アクションデータ構造(または当該コンテンツ・アイテム)は、描画するときにオーディオ出力または音波を提供する1つまたは複数のオーディオファイルを含むことができる。当該アクションデータ構造または当該コンテンツ・アイテムはオーディオ・コンテンツに加えて他のコンテンツ(例えば、テキスト、ビデオ、または画像コンテンツ)を含むことができる。
データ処理システム105は、複数の論理的にグループ化されたサーバを含むことができ、分散コンピューティング技術を促進する。サーバの当該論理グループをデータセンタ、サーバ・ファームまたはマシン・ファームと称してもよい。当該サーバは地理的に分散されることができる。データセンタまたはマシン・ファームを単一のエンティティとして管理してもよく、または当該マシン・ファームは複数のマシン・ファームを含むことができる。各マシン・ファーム内の当該サーバはであることができる不均一-当該サーバまたはマシンのうち1つまたは複数が1つまたは複数のタイプのオペレーティング・システムプラットフォームに従って動作することができる。データ処理システム105は、関連付けられた記憶システムとともに1つまたは複数の高密度ラック・システムに格納され、例えばエンタープライズデータセンタに配置された、データセンタ内のサーバを含むことができる。このように統合されたサーバを有するデータ処理システム105は、当該システムのシステム管理可能性、データセキュリティ、当該物理セキュリティ、高性能ネットワーク上にサーバおよび高性能記憶システムを配置することでシステム性能を高めることができる。サーバおよび記憶システムを含むデータ処理システム105コンポーネントの全部または一部の集約と、それらを高度なシステム管理ツールと組み合わせることで、サーバリソースのより効率的な利用が可能となり、電力および処理要件が節約され、帯域幅利用が減る。
データ処理システム105は少なくとも1つの自然言語プロセッサ(NLP)コンポーネント110、少なくとも1つのインタフェース115、少なくとも1つの予測コンポーネント120、少なくとも1つのコンテンツセレクタコンポーネント125、少なくとも1つのオーディオ信号ジェネレータコンポーネント130、少なくとも1つのダイレクト・アクション・アプリケーション・プログラミング・インタフェース(API)135、少なくとも1つのインタフェース管理コンポーネント140、および少なくとも1つのデータリポジトリ145を含むことができる。NLPコンポーネント110、インタフェース115、予測コンポーネント120、コンテンツセレクタコンポーネント125、オーディオ信号ジェネレータコンポーネント130、ダイレクト・アクションAPI135、およびインタフェース管理コンポーネント140はそれぞれ、当該少なくとも1つのコンピュータ・ネットワーク165を介してデータリポジトリ145および他のコンピューティングデバイス(例えば、少なくとも1つのクライアントコンピューティングデバイス150、少なくとも1つのコンテンツプロバイダコンピューティングデバイス155、または少なくとも1つのサービスプロバイダコンピューティングデバイス160)と通信するように構成されたプログラム可能論理アレイのような少なくとも1つの処理ユニット、サーバ、仮想サーバ、回路、エンジン、エージェント、機器、または他の論理デバイスを含むことができる。ネットワーク165は、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、メトロポリタン・ネットワーク、または他の領域ネットワーク、イントラネット、衛星ネットワーク、音声またはデータモバイル電話通信ネットワーク、およびその組合せのような他のコンピュータ・ネットワークのようなコンピュータ・ネットワークを含むことができる。
ネットワーク165は、コンテンツ配置または検索エンジン結果システムに関連付けられるか、または、サードパーティコンテンツ・アイテムをコンテンツ・アイテム配置キャンペーンの一部として含む権利があるディスプレイネットワーク、例えば、インターネット上で利用可能な情報リソースのサブセットを含むかまたは構成することができる。ネットワーク165を、クライアントコンピューティングデバイス150により提供、出力、描画、または表示できるウェブページ、ウェブサイト、ドメイン名、またはユニフォーム・リソース・ロケータのような情報リソースにアクセスするためにデータ処理システム105により使用することができる。例えば、ネットワーク165を介してクライアントコンピューティングデバイス150のユーザはデータ処理システム105、コンテンツプロバイダコンピューティングデバイス155またはサービスプロバイダコンピューティングデバイス160により提供された情報またはデータにアクセスすることができる。
ネットワーク165は、例えばポイント・ツー・ポイントネットワーク、ブロードキャストネットワーク、広帯域ネットワーク、ローカル・エリア・ネットワーク、電気通信ネットワーク、データ通信ネットワーク、コンピュータ・ネットワーク、ATM(Asynchronous Transfer Mode)ネットワーク、SONET(Synchronous Optical Network)ネットワーク、SDH(Synchronous Digital Hierarchy)ネットワーク、ワイヤレスネットワークまたは有線ネットワーク、およびその組合せを含むことができる。ネットワーク165は赤外線チャネルまたは衛星帯域のような無線リンクを含むことができる。ネットワーク165のトポロジはバス、星形、またはリング・ネットワークトポロジを含んでもよい。ネットワーク165は高度携帯電話プロトコル(「AMPS」)、時分割多重アクセス(「TDMA」)、符号分割多重アクセス(「CDMA」)、グローバル・システム・フォー・モバイル・コミュニケーション(「GSM(登録商標)」)、汎用パケット無線サービス(「GPRS」)またはユニバーサル・モバイル電気通信システム(「UMTS」)を含む、モバイルデバイスの間で通信するために使用される任意の1つまたは複数のプロトコルを用いた携帯電話ネットワークを含むことができる。様々なタイプのデータが異なるプロトコルを介して送信されてもよく、または、同一のタイプのデータが異なるプロトコルを介して送信されてもよい。
クライアントコンピューティングデバイス150、コンテンツプロバイダコンピューティングデバイス155、およびサービスプロバイダコンピューティングデバイス160はそれぞれ、ネットワーク165を介して互いにまたはデータ処理システム105と通信するためのプロセッサを有するコンピューティングデバイスのような少なくとも1つの論理デバイスを含むことができる。クライアントコンピューティングデバイス150、コンテンツプロバイダコンピューティングデバイス155、およびサービスプロバイダコンピューティングデバイス160はそれぞれ、少なくとも1つのデータセンタに配置された少なくとも1つのサーバ、プロセッサまたはメモリ、または複数の計算リソースまたはサーバを含むことができる。クライアントコンピューティングデバイス150、コンテンツプロバイダコンピューティングデバイス155、およびサービスプロバイダコンピューティングデバイス160はそれぞれ、デスクトップコンピュータ、ラップトップ、タブレット、携帯情報端末、スマートフォン、ポータブルコンピュータ、サーバ、シン・クライアントコンピュータ、仮想サーバ、または他のコンピューティングデバイスのような少なくとも1つのコンピューティングデバイスを含むことができる。
クライアントコンピューティングデバイス150は少なくとも1つのセンサ151、少なくとも1つのトランスデューサ152、少なくとも1つのオーディオドライバ153、および少なくとも1つのスピーカ154を含むことができる。センサ151はマイクロフォンまたはオーディオ入力センサを含むことができる。トランスデューサ152は当該オーディオ入力を電子信号に変換することができ、または逆も成り立つ。オーディオドライバ153は、オーディオ入力を処理するかまたはオーディオ出力を提供するようにクライアントコンピューティングデバイス150の他のコンポーネントのうちセンサ151、トランスデューサ152またはオーディオドライバ153を制御するためにクライアントコンピューティングデバイス150の1つまたは複数のプロセッサにより実行されるスクリプトまたはプログラムを含むことができる。スピーカ154は当該オーディオ出力信号を送信することができる。
クライアントコンピューティングデバイス150を、音声クエリをオーディオ入力としてクライアントコンピューティングデバイス150(センサ151を介して)に入力するおよびデータ処理システム105(またはコンテンツプロバイダコンピューティングデバイス155またはサービスプロバイダコンピューティングデバイス160)からクライアントコンピューティングデバイス150に提供できるコンピュータ生成された音声の形でオーディオ出力を受信し、スピーカ154から出力するエンド・ユーザに関連付けることができる。当該オーディオ出力は、ダイレクト・アクションAPI135から受信されたアクションデータ構造、またはコンテンツセレクタコンポーネント125により出力されたコンテンツ・アイテムに対応することができる。当該コンピュータ生成された音声は、実際の人またはコンピュータ生成された言語からの記録を含むことができる。
コンテンツプロバイダコンピューティングデバイス155(またはデータ処理システム105またはサービスプロバイダコンピューティングデバイス160)は、クライアントコンピューティングデバイス150により表示するためのオーディオベースのコンテンツ・アイテムまたはアクションデータ構造をオーディオ出力として提供することができる。当該アクションデータ構造またはコンテンツ・アイテムは、「Is today a beach day?」という音声入力クエリに対する有機的な応答として「Today it will be sunny and 80 degrees at the beach」と述べる音声ベースのメッセージのような、商品またはサービスに対する有機的な応答または申し出を含むことができる。データ処理システム105(またはコンテンツプロバイダコンピューティングデバイス155のような他のシステム100のコンポーネント)はまた、日焼け止めを提供する音声またはテキストメッセージベースのコンテンツ・アイテムのようなコンテンツ・アイテムを応答として提供することができる。
コンテンツプロバイダコンピューティングデバイス155またはデータリポジトリ145は、音声ベースのクエリに応答して提供できる一連のオーディオアクションデータ構造またはコンテンツ・アイテムを格納するためのメモリを含むことができる。当該アクションデータ構造およびコンテンツ・アイテムは、ネットワーク165を介して送信するためのパケット・ベースのデータ構造を含むことができる。コンテンツプロバイダコンピューティングデバイス155はまた、オーディオまたはテキストベースのコンテンツ・アイテム(または他のコンテンツ・アイテム)をデータ処理システム105に提供することができる。それらをデータリポジトリ145に格納することができる。データ処理システム105は、当該オーディオアクションデータ構造またはテキストベースのコンテンツ・アイテムを選択し、これらのクライアントコンピューティングデバイス150の1つから受信されたクエリに応答して、それらを同一のまたは異なるクライアントコンピューティングデバイス150に提供する(または提供するようにコンテンツプロバイダコンピューティングデバイス155に指示する)ことができる。当該オーディオベースのアクションデータ構造は、排他的にオーディオであることができ、または、テキスト、画像、またはビデオデータと組み合わせることができる。当該コンテンツ・アイテムは排他的にテキストであることができ、または、オーディオ、画像またはビデオデータと組み合わせることができる。
サービスプロバイダコンピューティングデバイス160は少なくとも1つのサービスプロバイダ自然言語プロセッサ(NLP)コンポーネント161および少なくとも1つのサービスプロバイダインタフェース162を含むことができる。サービスプロバイダNLPコンポーネント161(または他のコンポーネントのようなダイレクト・アクションAPIofサービスプロバイダコンピューティングデバイス160)は、クライアントコンピューティングデバイス150(データ処理システム105を介してまたはデータ処理システム105をバイパスして)と協調して、クライアントコンピューティングデバイス150およびサービスプロバイダコンピューティングデバイス160の間で行き来するリアルタイム音声またはオーディオベースの会話(例えば、セッション)を生成することができる。例えば、サービスプロバイダインタフェース162は、データメッセージ(例えば、アクションデータ構造またはコンテンツ・アイテム)を受信し、または、データメッセージ(例えば、アクションデータ構造またはコンテンツ・アイテム)をデータ処理システム105のダイレクト・アクションAPI135に提供することができる。ダイレクト・アクションAPI135はまた、サービスプロバイダコンピューティングデバイス160からの入力と独立にまたは当該入力なしに当該アクションデータ構造を生成することができる。サービスプロバイダコンピューティングデバイス160およびコンテンツプロバイダコンピューティングデバイス155を同一のエンティティに関連付けることができる。例えば、コンテンツプロバイダコンピューティングデバイス155は、日焼け止め、ビーチタオルまたは水着のようなビーチ関連のサービスに利用可能なコンテンツ・アイテムを生成、格納、または作成でき、サービスプロバイダコンピューティングデバイス160は、クライアントコンピューティングデバイス150とのセッションを確立して、ビーチでの天気に関する音声入力クエリに応答し、ビーチに対する方向、またはビーチエリアに対する推奨を提供し、当該クエリがそこから受信された同一のクライアントコンピューティングデバイス150のインタフェース、同一のクライアントコンピューティングデバイス150の異なるインタフェース、または異なるクライアントコンピューティングデバイスのインタフェースを介して、これらのコンテンツ・アイテムをクライアントコンピューティングデバイス150のエンド・ユーザに提供することができる。データ処理システム105はまた、ダイレクト・アクションAPI135、NLPコンポーネント110または他のコンポーネントを介して、サービスプロバイダコンピューティングデバイス160を含めるかまたはバイパスすることを含めて、クライアントコンピューティングデバイスとの当該セッションを確立し、例えばビーチ関連のクエリに対する有機的な応答を提供することができる。
データリポジトリ145は1つまたは複数のローカルまたは分散データベースを含むことができ、データベース管理システムを含むことができる。データリポジトリ145はコンピュータデータ記憶またはメモリを含むことができ、他のデータのうち1つまたは複数のパラメータ146、1つまたは複数のポリシ147、コンテンツデータ148、またはテンプレート149を格納することができる。パラメータ146、ポリシ147、およびテンプレート149はクライアントコンピューティングデバイス150およびデータ処理システム105(またはサービスプロバイダコンピューティングデバイス160)の間の音声ベースのセッションに関するルールのような情報を含むことができる。コンテンツデータ148は、オーディオ出力に対するコンテンツ・アイテムまたは関連付けられたメタデータ、ならびにクライアントコンピューティングデバイス150との1つまたは複数の通信セッションの一部でありうる入力オーディオメッセージを含むことができる。
システム100は、音声起動されたデータ・パケット(または他のプロトコル)環境におけるアクションデータ構造およびコンテンツ・アイテムの処理を最適化することができる。例えば、データ処理システム105は、音声起動されたアシスタントサービス、音声コマンドデバイス、インテリジェント・パーソナル・アシスタント、知識ナビゲータ、イベント計画、または他のアシスタントプログラムを含むことができるかまたはその一部であることができる。データ処理システム105はアクションデータ構造の1つまたは複数のインスタンスをクライアントコンピューティングデバイス150から表示するためのオーディオ出力として提供して、入力オーディオ信号に関連するタスクを実現することができる。例えば、データ処理システムはサービスプロバイダコンピューティングデバイス160または他のサードパーティコンピューティングデバイスと通信して、とりわけ、ビーチに関する情報を有するアクションデータ構造を生成することができる。例えば、エンド・ユーザは「OK, I would like to go to the beach this weekend」という入力オーディオ信号をクライアントコンピューティングデバイス150に入力でき、アクションデータ構造は、「it will be sunny and 80 degrees at the beach on Saturday, with high tide at 3pm.」のような、ビーチエリアに対する週末の天気予報を示すことができる。
当該アクションデータ構造は、当該入力オーディオ信号への幾つかの有機的なまたはスポンサーされない応答を含むことができる。例えば、当該アクションデータ構造はビーチの天気予報またはビーチへの方向を含むことができる。この例における当該アクションデータ構造は、直接に当該入力オーディオ信号に応答する有機的な、またはスポンサーされないコンテンツを含む。当該コンテンツ・アイテムは、当該入力オーディオ信号に応答して、ビーチの近くにあるコンビニエンスストアからの日焼け止めを購入する申し出のようなスポンサーされたまたは非有機的なコンテンツを含むことができる。本例では、当該有機的なアクションデータ構造(ビーチ予報)は当該入力オーディオ信号(ビーチに関連するクエリ)に応答し、当該コンテンツ・アイテム(日焼け止めのリマインダまたは申し出)はまた、同一の入力オーディオ信号に応答する。データ処理システム105は、システム100のパラメータ(例えば、電力利用、利用可能なディスプレイ、ディスプレイのフォーマット、メモリ要件、帯域幅利用、電力容量または入力電力(例えば、内部バッテリまたは壁出力からの電源のような外部電源)の時刻)を評価して、当該アクションデータ構造および当該コンテンツ・アイテムを同一のクライアントコンピューティングデバイス150上の異なる候補インタフェースに、または異なるクライアントコンピューティングデバイス150上の異なる候補インタフェースに提供することができる。
データ処理システム105は、入力オーディオ信号(例えば、パケット化されたまたは他のプロトコルベースの送信を介したデータ・パケットとして)をデータ処理システム105の少なくとも1つのインタフェース115に送信しクライアントコンピューティングデバイス150のコンポーネントを駆動して(例えば、アクションデータ構造に対する)出力オーディオ信号または他の出力信号(例えば、コンテンツ・アイテム)を描画するためのアプリのような、クライアントコンピューティングデバイス150にインストールされたアプリケーション、スクリプトまたはプログラムを含むことができる。データ処理システム105はオーディオ入力信号を含むかまたは識別するデータ・パケットまたは他の信号を受信することができる。例えば、データ処理システム105は、NLPコンポーネント110を実行して当該オーディオ入力信号を受信することができる。
NLPコンポーネント110は、オーディオ入力信号を(例えば、データリポジトリ145内の)格納された代表的な組のオーディオ波形と比較し、最も近いマッチを選択することによって、当該オーディオ入力信号を認識されたテキストに変換することができる。当該代表的な波形は多数のユーザにわたって生成され、会話サンプルで補強することができる。当該オーディオ信号を認識されたテキストに変換された後、NLPコンポーネント110は、例えばユーザにわたるトレーニングを介してまたはマニュアル仕様を通じて、データ処理システム105がサービス提供できるアクションに関連付けられる単語に当該テキストをマッチすることができる。
当該オーディオ入力信号は、クライアントコンピューティングデバイスのセンサ151(例えば、マイクロフォン)により検出されることができる。トランスデューサ152、オーディオドライバ153、または他のコンポーネントを介して、クライアントコンピューティングデバイス150は当該オーディオ入力信号をデータ処理システム105に(例えば、ネットワーク165を介して)提供することができる。当該オーディオ入力信号を、(例えば、インタフェース115により)受信し、NLPコンポーネント110に提供し、または、データリポジトリ145にコンテンツデータ148として格納することができる。
NLPコンポーネント110は当該入力オーディオ信号を受信または取得することができる。当該入力オーディオ信号から、NLPコンポーネント110は、少なくとも1つの要求または当該要求に対応する少なくとも1つのトリガキーワードを識別することができる。当該要求は当該入力オーディオ信号の意図または主題を示すことができる。当該トリガキーワードは行われる可能性があるアクションのタイプを示すことができる。例えば、NLPコンポーネント110は当該入力オーディオ信号を解析して、週末にビーチに行くための少なくとも1つの要求を識別することができる。当該トリガキーワードは、取るべきアクションを示す少なくとも1つの単語、フレーズ、語源または部分語、または派生物を含むことができる。例えば、当該入力オーディオ信号からのトリガキーワード「go」または「to go to」は輸送の必要性または家から離れる旅行を示すことができる。本例では、当該入力オーディオ信号(または識別された要求)は輸送の意図を直接表現しないが、当該トリガキーワードは、輸送が当該要求により示される少なくとも1つの他のアクションに対する付属的アクションであることを示す。
予測コンポーネント120(またはデータ処理システム105の他の機構)は、当該要求または当該トリガキーワードに基づいて、当該入力オーディオ信号に関連付けられた少なくとも1つのアクションデータ構造を生成することができる。当該アクションデータ構造は、当該入力オーディオ信号の主題に関連する情報を示すことができる。当該アクションデータ構造は、当該入力オーディオ信号への有機的な応答のような1つまたは複数のアクションを含むことができる。例えば、入力オーディオ信号「OK, I would like to go to the beach this weekend」はビーチの天気予報、サーフィンレポート、または水温情報に対する関心を示す少なくとも1つの要求を含むことができ、ビーチへ持っていきたいアイテムの必要性、またはビーチへの輸送の必要性のような、少なくとも1つのトリガキーワード、例えば、ビーチへの旅行を示す「go」を含むことができる。予測コンポーネント120は、少なくとも1つのアクションデータ構造に対する主題、ビーチの天気予報の要求の指示、ならびに、ビーチで1日を過ごすことに関連するスポンサーされたコンテンツに対するクエリの指示のようなコンテンツ・アイテムに対する主題を生成または識別することができる。当該要求または当該トリガキーワードから、予測コンポーネント120(またはNLPコンポーネント110またはダイレクト・アクションAPI135のような他のシステム100のコンポーネント)は、アクションデータ構造またはコンテンツ・アイテムに対する主題を予測、推定、または決定する。この主題から、ダイレクト・アクションAPI135は、少なくとも1つのアクションデータ構造を生成でき、少なくとも1つのコンテンツプロバイダコンピューティングデバイス155と通信して少なくとも1つのコンテンツ・アイテム155を取得することができる。予測コンポーネント120は、データリポジトリ145内のパラメータ146またはポリシ147にアクセスしてアクションデータ構造またはコンテンツ・アイテムに対する要求を決定または推定することができる。例えば、パラメータ146またはポリシ147は、ビーチの週末の天気予報アクションまたは日焼け止めに対するコンテンツ・アイテムのようなビーチ訪問に関連するコンテンツ・アイテムに対する要求を
示すことができる。
コンテンツセレクタコンポーネント125は、当該アクションデータ構造または当該コンテンツ・アイテムへの関心または要求の何れかの指示を取得することができる。例えば、予測コンポーネント120は、直接または間接に(例えば、データリポジトリ145を介して)当該アクションデータ構造またはコンテンツ・アイテムの指示をコンテンツセレクタコンポーネント125に提供することができる。コンテンツセレクタコンポーネント125はこの情報をデータリポジトリ145から取得でき、それをコンテンツデータ148の一部として格納することができる。当該アクションデータ構造の指示は、コンテンツセレクタコンポーネント125に、エンド・ユーザがビーチへの旅行に必要としうる天気予報または製品またはサービスのようなビーチエリア情報に対する必要性を知らせることができる。
コンテンツセレクタコンポーネント125により受信された情報、例えば、ビーチへの将来の旅行の指示から、コンテンツセレクタコンポーネント125は少なくとも1つのコンテンツ・アイテムを識別することができる。当該コンテンツ・アイテムは当該入力オーディオクエリの主題に応答または関連することができる。例えば、当該コンテンツ・アイテムは、日焼け止めがあるビーチ近くの店を識別するか、またはビーチへのタクシー乗車を提供するメッセージデータを含むことができる。コンテンツセレクタコンポーネント125はデータリポジトリ145に問い合わせて、当該コンテンツ・アイテムを、例えば、コンテンツデータ148から選択または識別することができる。コンテンツセレクタコンポーネント125はまた、当該コンテンツ・アイテムをコンテンツプロバイダコンピューティングデバイス155から選択することができる。例えばデータ処理システム105から受信されたクエリに応答して、コンテンツプロバイダコンピューティングデバイス155はコンテンツ・アイテムをデータ処理システム105(またはそのコンポーネント)に、当該入力オーディオ信号を生成したクライアントコンピューティングデバイス150による最終出力のために、または異なるクライアントコンピューティングデバイス150による同一のエンド・ユーザへの出力のために、提供することができる。
オーディオ信号ジェネレータコンポーネント130は、入力オーディオ信号に応答して、コンテンツ・アイテム(ならびにアクションデータ構造)を含む出力信号を生成または取得することができる。例えば、データ処理システム105は、オーディオ信号ジェネレータコンポーネント130を実行して、当該アクションデータ構造または当該コンテンツ・アイテムに対応する出力信号を生成または作成することができる。データ処理システム105のインタフェースコンポーネント115はコンピュータ・ネットワーク165を介して当該出力信号を含む1つまたは複数のデータ・パケットを任意のクライアントコンピューティングデバイス150に提供または送信することができる。インタフェース115は例えば、データ・パケットを用いて情報を送受信するように設計され、構成され、構築され、または動作することができる。インタフェース115は、ネットワークプロトコルのような1つまたは複数のプロトコルを用いて情報を送受信することができる。インタフェース115は、ハードウェアインタフェース、ソフトウェアインタフェース、有線インタフェース、またはワイヤレスインタフェースを含むことができる。インタフェース115は、或るフォーマットから別のフォーマットへのデータ変換またはデータ・フォーマットを促進することができる。例えば、インタフェース115は、システム100のソフトウェアコンポーネントのような、様々なコンポーネントの間で通信するための定義を含むアプリケーション・プログラミング・インタフェースを含むことができる。
データ処理システム105は、アクションデータ構造を含む出力信号を、データリポジトリ145からまたはオーディオ信号ジェネレータコンポーネント130からクライアントコンピューティングデバイス150に提供することができる。データ処理システム105は、当該コンテンツ・アイテムを含む出力信号をデータリポジトリ145からまたはオーディオ信号ジェネレータコンポーネント130から同一のまたは異なるクライアントコンピューティングデバイス150に提供することができる。
データ処理システム105はまた、データ・パケット送信を介して、コンテンツプロバイダコンピューティングデバイス155またはサービスプロバイダコンピューティングデバイス160に、(例えば、アクションデータ構造またはコンテンツ・アイテムに対応する)出力信号をクライアントコンピューティングデバイス150に提供するように指示することができる。当該出力信号を、取得し、生成し、1つまたは複数のデータ・パケット(または他の通信プロトコル)に変換し、または1つまたは複数のデータ・パケット(または他の通信プロトコル)としてデータ処理システム105(または他のコンピューティングデバイス)からクライアントコンピューティングデバイス150に送信することができる。
コンテンツセレクタコンポーネント125は当該コンテンツ・アイテムまたは当該アクションデータ構造をリアルタイムコンテンツ選択プロセスの一部として選択することができる。例えば、当該アクションデータ構造を、クライアントコンピューティングデバイス150のインタフェースによる入力オーディオ信号への直接応答の会話方式でのオーディオ出力として送信するために、クライアントコンピューティングデバイス150に提供することができる。当該アクションデータ構造を識別し当該コンテンツ・アイテムをクライアントコンピューティングデバイス150に提供するためのリアルタイムコンテンツ選択プロセスは、当該入力オーディオ信号の時刻から1分以下で発生することができ、リアルタイムと考えることができる。データ処理システム105はまた、当該コンテンツ・アイテムを識別し、当該コンテンツ・アイテムを、当該入力オーディオ信号を生成したクライアントコンピューティングデバイス150の少なくとも1つのインタフェースに、または異なるクライアントコンピューティングデバイス150に提供することができる。
例えばオーディオ信号ジェネレータコンポーネント130により取得または生成され、インタフェース115およびコンピュータ・ネットワーク165を介してクライアントコンピューティングデバイス150に送信されたアクションデータ構造(またはコンテンツ・アイテム)は、クライアントコンピューティングデバイス150に、オーディオドライバ153を実行してスピーカ154を駆動して、当該アクションデータ構造または当該コンテンツ・アイテムに対応する音波を生成させることができる。当該音波は当該アクションデータ構造またはコンテンツ・アイテムのまたは当該アクションデータ構造またはコンテンツ・アイテムに対応する単語を含むことができる。
当該アクションデータ構造を表す音波はクライアントコンピューティングデバイス150からコンテンツ・アイテムとは別々に出力できる。例えば、当該音波は「Today it will be sunny and 80 degrees at the beach」のオーディオ出力を含むことができる。本例では、データ処理システム105は例えば、「OK, I would like to go to the beach this weekend」の入力オーディオ信号を取得する。この情報から、NLPコンポーネント110は少なくとも1つの要求または少なくとも1つのトリガキーワードを識別し、予測コンポーネント120は当該要求(複数可)またはトリガキーワード(複数可)を使用してアクションデータ構造またはコンテンツ・アイテムの要求を識別する。コンテンツセレクタコンポーネント125(または他のコンポーネント)はコンテンツ・アイテム、例えば、ビーチ近くで利用可能な日焼け止めを識別、選択、または生成することができる。ダイレクト・アクションAPI135(または他のコンポーネント)はアクションデータ構造、例えば、週末ビーチ予報を識別、選択、または生成することができる。データ処理システム105またはオーディオ信号ジェネレータコンポーネント130のようなそのコンポーネントはクライアントコンピューティングデバイス150のインタフェースにより出力するためのアクションデータ構造を提供することができる。例えば、当該アクションデータ構造に対応する音波はクライアントコンピューティングデバイス150から出力できる。データ処理システム105は同一のクライアントコンピューティングデバイス150の異なるインタフェースまたは異なるクライアントコンピューティングデバイス150のインタフェースにより出力するために当該コンテンツ・アイテムを提供することができる。
データ処理システム105によるクライアントコンピューティングデバイス150への当該アクションデータ構造のパケット・ベースのデータ送信は、リアルタイムな人から人への会話の流れと感覚を有するデータ処理システム105およびクライアントコンピューティングデバイス150の間の通信セッションの一部であるコンピュータ・ネットワーク165を介してパケット・ベースのデータが送信されるように、「OK, I would like to go to the beach this weekend」の入力オーディオ信号への直接的またはリアルタイムな応答を含むことができる。このパケット・ベースのデータ送信の通信セッションは、またコンテンツプロバイダコンピューティングデバイス155またはサービスプロバイダコンピューティングデバイス160を含むことができる。
コンテンツセレクタコンポーネント125は、当該入力オーディオ信号の少なくとも1つの要求または少なくとも1つのトリガキーワードに基づいて、当該コンテンツ・アイテムまたはアクションデータ構造を選択することができる。例えば、当該入力オーディオ信号「OK, I would like to go to the beach this weekend」の要求はビーチの主題、ビーチへの旅行、またはビーチへの旅行を促進するためのアイテムを示すことができる。NLPコンポーネント110または予測コンポーネント120(またはダイレクト・アクションAPI135の一部として実行される他のデータ処理システム105コンポーネント)はトリガキーワード「go」「go to」または「to go to」を識別でき、少なくとも当該トリガキーワードに部分的に基づいてビーチへの輸送要求を決定することができる。NLPコンポーネント110(または他のシステム100のコンポーネント)はまた、日焼け止めまたはビーチ傘のようなビーチ活動に関連するコンテンツ・アイテムの勧誘を決定することができる。したがって、データ処理システム105は、当該入力オーディオ信号の主要な要求または主題(ビーチのこの週末に関する情報)ではない二次要求(例えば、日焼け止めの要求)である当該入力オーディオ信号からの対話であることができる。
当該アクションデータ構造およびコンテンツ・アイテムは当該入力オーディオ信号の主題に対応することができる。ダイレクト・アクションAPI135はプログラムまたはスクリプトを、例えばNLPコンポーネント110、予測コンポーネント120、またはコンテンツセレクタコンポーネント125から実行して、これらのアクションの1つまたは複数に対するアクションデータ構造またはコンテンツ・アイテムを識別することができる。ダイレクト・アクションAPI135はデータ処理システム105により決定されるものとして、指定されたアクションを実行してエンド・ユーザの意図を満たすことができる。その入力で指定されたアクションに依存して、ダイレクト・アクションAPI135は、ユーザ要求を満たすのに必要なパラメータを識別するコードまたはダイアログスクリプトを実行することができる。かかるコードは、例えば、ホーム・オートメーションサービスの名前のようなデータリポジトリ145内の追加の情報を検索することができ、または、クライアントコンピューティングデバイス150で描画するためのオーディオ出力を提供して、要求されたタクシーの意図した目的地のような質問をエンド・ユーザにすることができる。ダイレクト・アクションAPI135は必要なパラメータを決定し、当該情報をアクションデータ構造にパッケージ化することができ、それを次いで、コンテンツセレクタコンポーネント125のような別のコンポーネントにまたは満たすべきサービスプロバイダコンピューティングデバイス160に送信することができる。
データ処理システム105のダイレクト・アクションAPI135は、当該要求または当該トリガキーワードに基づいて、当該アクションデータ構造を生成することができる。当該アクションデータ構造を当該入力オーディオ信号の主題に応答して生成することができる。当該アクションデータ構造は、サービスプロバイダコンピューティングデバイス160により送受信されるメッセージに含まれることができる。NLPコンポーネント110により解析されたオーディオ入力信号に基づいて、ダイレクト・アクションAPI135は、もしあれば、複数のサービスプロバイダコンピューティングデバイス160のうちどれに当該メッセージを送信すべきかを判定することができる。例えば、入力オーディオ信号が「OK, I would like to go to the beach this weekend」を含む場合、NLPコンポーネント110は当該入力オーディオ信号を解析し、トリガキーワード単語「to go to」のような要求またはトリガキーワードをタクシーの必要性の指示として識別することができる。ダイレクト・アクションAPI135は当該要求を、タクシーサービスのサービスプロバイダコンピューティングデバイス160へのメッセージとして送信するためのアクションデータ構造へパッケージ化することができる。当該メッセージはまた、コンテンツセレクタコンポーネント125に渡すことができる。当該アクションデータ構造は当該要求を完了するための情報を含むことができる。本例では、当該情報は、ピックアップ位置(例えば、家)および目的地位置(例えば、ビーチ)を含むことができる。ダイレクト・アクションAPI135は、どのフィールドを当該アクションデータ構造に含めるべきかを判定するためにテンプレート149をデータリポジトリ145から取り出すことができる。ダイレクト・アクションAPI135はコンテンツをデータリポジトリ145から取り出して、当該データ構造のフィールドに関する情報を取得することができる。ダイレクト・アクションAPI135は、当該テンプレートからのフィールドをその情報で埋めて、当該データ構造を生成することができる。ダイレクト・アクションAPI135はまた、当該フィールドを当該入力オーディオ信号からのデータで埋めることができる。テンプレート149を、サービ
スプロバイダのカテゴリに対して標準化するか、または、特定のサービスプロバイダに対して標準化することができる。例えば、乗車共有サービスプロバイダは以下の標準化されたテンプレート149を使用してデータ構造{client_device_identifier; authentication_credentials; pick_up_location; destination_location; no_passengers; service_level}を生成することができる。
コンテンツセレクタコンポーネント125は、複数のコンテンツ選択プロセスから生ずる複数のコンテンツ・アイテムを識別、選択、または取得することができる。当該コンテンツ選択プロセスは、リアルタイムであることができ、例えば、同一の会話の一部、通信セッション、または共通の主題を含むデータ処理システム105およびクライアントコンピューティングデバイス150の間の一連の通信セッションであることができる。当該会話は例えば時間または日の期間だけ互いから分離した非対称な通信を含むことができる。当該会話または通信セッションは、第1の入力オーディオ信号に関連する最終アクションの推定されたまたは既知の結論、またはデータ処理システム105による当該会話の終了または期限切れの指示の受信まで、第1の入力オーディオ信号の受信から或る時間期間だけ継続することができる。例えば、データ処理システム105は、週末のビーチ旅行に関連する会話が、当該入力オーディオ信号の時刻または受信で開始し、週末の終了、例えば、日曜夜または月曜朝で期限切れまたは終了すると判定することができる。当該会話の動作期間中に(例えば、決定された期限切れ時刻までの当該入力オーディオ信号の受信から)クライアントコンピューティングデバイス150または別のクライアントコンピューティングデバイス150の1つまたは複数のインタフェースにより描画するためのアクションデータ構造またはコンテンツ・アイテムを提供するデータ処理システム105は、リアルタイムに動作していると考えることができる。本例では、当該コンテンツ選択プロセスおよび当該コンテンツ・アイテムおよびアクションデータ構造の描画はリアルタイムに発生する。
インタフェース管理コンポーネント140は、当該アクションデータ構造および当該入力オーディオ信号に関連するコンテンツ・アイテムを描画するためのインタフェースをポーリングし、決定し、識別し、または選択することができる。例えば、インタフェース管理コンポーネント140は、当該入力オーディオ信号(例えば、「What is the weather at the beach today?」)を、オーディオインタフェースを介してクライアントコンピューティングデバイス150の1つに入力したエンド・ユーザに関連付けられたクライアントコンピューティングデバイス150の1つまたは複数の候補インタフェースを識別することができる。当該インタフェースは、センサ151(例えば、マイクロフォン)、スピーカ154、または或るスクリーンサイズのコンピューティングデバイスのようなハードウェアを、単体で、またはスクリプトまたはプログラム(例えば、オーディオドライバ153)ならびにアプリ、コンピュータプログラム、オンラインドキュメント(例えば、ウェブページ)インタフェースおよびその組合せと組み合わせて含むことができる。
当該インタフェースは当該入力オーディオ信号を生成したクライアントコンピューティングデバイス150のエンド・ユーザに関連付けられたソーシャル・メディア・アカウント、テキストメッセージアプリケーション、または電子メールアカウントを含むことができる。インタフェースは、他のクライアントコンピューティングデバイス150のうち、スマートフォン、または当該スマートフォン、またはウェラブルコンピューティングデバイスにインストールされたアプリベースのメッセージングデバイスのオーディオ出力を含むことができる。当該インタフェースはまた、ディスプレイスクリーンパラメータ(例えば、サイズ、解像度)、オーディオパラメータ、モバイルデバイスパラメータ、(例えば、処理電力、バッテリ寿命、インストールされたアプリまたはプログラムの存在、またはセンサ151またはスピーカ154の機能)、コンテンツ・アイテムのテキスト、画像、またはビデオ描画に対するオンラインドキュメント上のコンテンツスロット、チャットアプリケーション、ラップトップパラメータ、スマートウォッチまたは他のウェラブルデバイスパラメータ(例えば、それらのディスプレイまたは処理能力の指示)、または仮想現実ヘッドセットパラメータを含むことができる。
インタフェース管理コンポーネント140は、複数のインタフェースをポーリングして、候補インタフェースを識別することができる。候補インタフェースは、入力オーディオ信号に対する応答を描画する能力を有するインタフェースを含む(例えば、オーディオ出力としてのアクションデータ構造、または非オーディオフォーマットを含む様々なフォーマットで出力できるコンテンツ・アイテム)。インタフェース管理コンポーネント140は、それらが候補インタフェースである(またはでない)と判定するためのインタフェースのパラメータまたは他の機能を決定することができる。例えば、インタフェース管理コンポーネント140は、第1のクライアントコンピューティングデバイス150(例えば、スマートウォッチウェラブルデバイス)のコンテンツ・アイテムのパラメータ146に基づいて、当該スマートウォッチが当該コンテンツ・アイテムを描画するための十分なサイズまたは解像度の利用可能な視覚インタフェースを含むと判定することができる。インタフェース管理コンポーネント140はまた、当該入力オーディオ信号を生成したクライアントコンピューティングデバイス150が、スピーカ154のハードウェアおよびインストールされたプログラム、例えば、当該アクションデータ構造を描画するためのオーディオドライバまたは他のスクリプトを有すると判定することができる。
インタフェース管理コンポーネント140は候補インタフェースに対する利用値を決定することができる。当該利用値は、候補インタフェースが入力オーディオ信号に応答して提供されたアクションデータ構造またはコンテンツ・アイテムを描画することができる(かまたはできない)と示すことができる。当該利用値は、データリポジトリ145から取得されたパラメータ146、または、帯域幅または処理の利用または要件、処理電力、電力要件、バッテリステータス、メモリ利用または能力、またはアクションデータ構造またはコンテンツ・アイテムを描画するために利用可能なインタフェースを示す他のインタフェースパラメータのような、クライアントコンピューティングデバイス150から取得された他のパラメータを含むことができる。当該バッテリステータスは、電源のタイプ(例えば、出力を介した内部バッテリまたは外部電源)、充電ステータス(例えば、現在充電しているかまたはしていない)、または残りのバッテリ電力の量を示すことができる。インタフェース管理コンポーネント140は当該バッテリステータスまたは充電ステータスに基づいてインタフェースを選択することができる。
インタフェース管理コンポーネント140は当該利用値に基づいて当該候補インタフェースを階層またはランキングで順序付けすることができる。例えば異なる利用値(例えば、処理要件、ディスプレイスクリーンサイズ、エンド・ユーザへのアクセシビリティ)に異なる重みを与えることができる。インタフェース管理コンポーネント140は、コンテンツ・アイテム(またはアクションデータ構造)を描画するための最適な対応する候補インタフェースを決定するためのそれらの重みに基づいて当該候補インタフェースの利用値の1つまたは複数を順位付けすることができる。この階層に基づいて、インタフェース管理コンポーネント140は当該コンテンツ・アイテムを描画するための最高ランクのインタフェースを選択することができる。
候補インタフェースに対する利用値に基づいて、インタフェース管理コンポーネント140は少なくとも1つの候補インタフェースを当該コンテンツ・アイテムに対する選択されたインタフェースとして選択することができる。当該コンテンツ・アイテムに対する選択されたインタフェースは、当該入力オーディオ信号がそこから受信された同一のインタフェース(例えば、クライアントコンピューティングデバイス150のオーディオインタフェース)または異なるインタフェース(例えば、同一のクライアントコンピューティングデバイス150のテキストメッセージベースのアプリ、または同一のクライアントコンピューティングデバイス150からアクセス可能な電子メールアカウントであることができる。
インタフェース管理コンポーネント140は、当該入力オーディオ信号を生成したデバイスと異なるクライアントコンピューティングデバイス150のインタフェースである、当該コンテンツ・アイテムに対するインタフェースを選択することができる。例えば、データ処理システム105は当該入力オーディオ信号を第1のクライアントコンピューティングデバイス150(例えば、スマートフォン)から受信でき、スマートウォッチのディスプレイ(または当該コンテンツ・アイテムを描画するための任意の他のクライアントコンピューティングデバイス)のようなインタフェースを選択することができる。当該複数のクライアントコンピューティングデバイス150をすべて、同一のエンド・ユーザに関連付けることができる。データ処理システム105は、複数のクライアントコンピューティングデバイス150が同一のエンド・ユーザに関連付けられると、複数のクライアントコンピューティングデバイス150にわたる共通のソーシャル・メディアまたは電子メールアカウントへのユーザ・アクセスのようなエンド・ユーザからの同意とともに受信された情報に基づいて判定することができる。
インタフェース管理コンポーネント140はまた、インタフェースが利用不可能であると判定することができる。例えばインタフェース管理コンポーネント140はインタフェースをポーリングして、当該インタフェースに関連付けられたクライアントコンピューティングデバイス150のバッテリステータスが低いか、または、10%のような閾値レベル未満であると判定することができる。あるいは、インタフェース管理コンポーネント140は、当該インタフェースに関連付けられたクライアントコンピューティングデバイス150が当該コンテンツ・アイテムを描画するための十分なディスプレイスクリーンサイズまたは処理電力が足りないこと、または、クライアントコンピューティングデバイスが現在別のアプリケーションを実行して、例えばネットワーク165を介してコンテンツをストリーミングしているので当該プロセッサ利用率が高すぎると判定することができる。これらのおよび他の例では、インタフェース管理コンポーネント140は、当該インタフェースが利用不可能であると判定し、当該コンテンツ・アイテムまたは当該アクションデータ構造を描画するための候補として当該インタフェースを排除することができる。
したがって、インタフェース管理コンポーネント140は、第1のクライアントコンピューティングデバイス150によりアクセス可能な候補インタフェースがエンド・ユーザのアカウントにリンクされ、第2のクライアントコンピューティングデバイス150によりアクセス可能な第2の候補インタフェースも同一のアカウントにリンクされると判定することができる。例えば、両方のクライアントコンピューティングデバイス150は同一のソーシャル・メディア・アカウントに、例えば、各クライアントコンピューティングデバイス150でのアプリまたはスクリプトのインストールを介してアクセスすることができる。インタフェース管理コンポーネント140はまた、複数のインタフェースは同一のアカウントに対応し、複数の異なるコンテンツ・アイテムを当該共通のアカウントに対応する当該複数のインタフェースに提供できると判定することができる。例えば、データ処理システム105は、エンド・ユーザの同意により、エンド・ユーザが異なるクライアントコンピューティングデバイス150からアカウントにアクセスしたと判定することができる。これらの複数のインタフェースは、同一のインタフェースの別々のインスタンス(例えば、異なるクライアントコンピューティングデバイス150にインストールされた同一のアプリ)または複数のクライアントコンピューティングデバイス150からアクセス可能な、両方とも共通の電子メールアドレスアカウントにリンクされた異なるソーシャル・メディア・アカウントに対する異なるアプリのような異なるインタフェースであることができる。
インタフェース管理コンポーネント140はまた、候補インタフェースに関連付けられたクライアントコンピューティングデバイス150の間の距離を決定または推定することができる。例えば、データ処理システム105は、ユーザ同意により、当該入力オーディオ信号がスマートフォンまたは仮想現実ヘッドセットのコンピューティングデバイス150から生じ、エンド・ユーザがアクティブなスマートウォッチクライアントコンピューティングデバイス150に関連付けられるという指示を取得することができる。この情報から、当該インタフェース管理コンポーネントは、当該スマートウォッチがアクティブである、例えば、エンド・ユーザが当該入力オーディオ信号を当該スマートフォンに入力したときエンド・ユーザにより着られていると判定でき、その結果、当該2つのクライアントコンピューティングデバイス150が互いの閾値距離内(例えば、1メートル、2メートル、3メートル、4メートル、または7メートル内、または音声範囲または視覚範囲内)にある。データ処理システム105はまた、エンド・ユーザの同意により、入力オーディオ信号のソースであるスマートフォンの位置を決定でき、またエンド・ユーザに関連付けられたラップトップアカウントが現在アクティブであると判定することができる。例えば、当該ラップトップは当該ユーザが当該ラップトップで現在アクティブであると示すソーシャル・メディア・アカウントにサインインすることができる。本例ではデータ処理システム105は、エンド・ユーザが当該スマートフォンの閾値距離および当該ラップトップの閾値距離内にあり、その結果、当該ラップトップは候補インタフェースを介して当該コンテンツ・アイテムを描画するための適切な選択であることができると判定することができる。
インタフェース管理コンポーネント140は、当該入力オーディオ信号を受信するコンピューティングデバイス150の閾値距離内にある1つまたは複数の他のコンピューティングデバイス150を識別し、次いでコンピューティングデバイス150の閾値距離内にあるコンピューティングデバイス150に関連付けられた候補インタフェースをポーリングすることができる。インタフェース管理コンポーネント140を、当該入力オーディオ信号を受信するコンピューティングデバイス150の閾値距離内にあるコンピューティングデバイス150を識別するための1つまたは複数の近接性検出技術で構成することができる。近接性検出技術は、例えば、非可聴音波(Sub-audiable Wave)技術、WIFIベースの技術、Bluetooth(登録商標)ベースの技術、マッチング入力オーディオ信号ベースの技術、またはトークンベースの技術を含むことができる。WIFI(またはWi-Fi)は、標準に基づくコンピューティングデバイスとのワイヤレスローカル・エリア・ネットワーキングのための技術を指すことができる。
例えば、エンド・ユーザの同意によりインタフェース管理コンポーネント140は、当該入力オーディオ信号を受信する第1のコンピューティングデバイスに、閾値距離内の他のコンピューティングデバイスを識別するための非可聴音波を送信するように指示することができる。非可聴音波は、人間の耳により認識できず、または容易に認識できない音響またはオーディオ送信を指すことができる。例えば、当該非可聴音波は、20Hzより低い周波数である音波のような超低音を含むことができる。当該非可聴音波は、20、000Hzより大きく最大1ギガヘルツ、2ギガヘルツ、またはそれ以上のような人間の耳が聴ける上限より高い周波数の音波のような超音波を含むことができる。第2のコンピューティングデバイスが当該非可聴音波(または超音波)を検出できる場合、第2のコンピューティングデバイスは応答して第2の非可聴音波(または超音波)を送信することができる。第2の非可聴音波は、識別子または他のデータを符号化して、第2のコンピューティングデバイスを示すかまたは識別することができる。第1のコンピューティングデバイスは次いで、第1のおよび第2のコンピューティングデバイスがサブ可聴音波の互いからの送受信に成功することができたので、第1のおよび第2のコンピューティングデバイスが閾値距離内にあると判定するために、当該応答を第2のコンピューティングデバイスから受信することができる。例えば、第1のコンピューティングデバイスは、第2の非可聴音波を復号化して、第2のコンピューティングデバイスの識別子を抽出することができる。第1のコンピューティングデバイスは、データ処理システム105に問い合わせて、コンテンツまたは通知の第2のコンピューティングデバイスへの送信を促進するための第2のコンピューティングデバイスに関連付けられた情報またはプロフィール情報を取得することができる。
幾つかのケースでは、第3のコンピューティングデバイスは、第1のコンピューティングデバイスにより送信された非可聴音波を受信してもよい。第3のコンピューティングデバイスは、第3の識別子で符号化された第3の非可聴音波で当該非可聴音波に応答することができる。第1のコンピューティングデバイスは第3のコンピューティングデバイスが第1のコンピューティングデバイスの範囲内にあると判定するために、第3のサブ可聴を受信することができる。
幾つかのケースでは、第1のコンピューティングデバイスはトークンを有する非可聴音波(または超音波)を送信することができる。当該トークンは一意な識別子を含むことができる。当該トークンを、ハッシュ関数に基づいて、例えばn個のタプルを用いて生成することができる。送信される当該波に対応する現在のタイムスタンプ、デバイス識別子、インターネットプロトコルアドレス、またはデータ処理システムが当該複数のコンピューティングデバイスが閾値距離内に配置されていると判定することを促進するための一意な識別子またはトークンをもたらしうる他のパラメータまたは値のような1つまたは複数の値に基づいて、当該トークンを生成することができる。第1のコンピューティングデバイスは、当該トークンでの当該非可聴音波の送信に対応する第1のタイムスタンプを記録することができる。第2のコンピューティングデバイスは当該送信されたサブ可聴信号を検出し、当該非可聴音波の検出に対応する第2のタイムスタンプを記録することができる。第1のコンピューティングデバイスは、ネットワーク165を介して、第1のタイムスタンプおよび当該トークンの指示をデータ処理システム105(例えば、インタフェース管理コンポーネント140)に送信することができる。第2のコンピューティングデバイスは当該非可聴音波を受信し、当該トークンを抽出するための当該波を復号することができる。当該トークンを識別すると、第2のコンピューティングデバイスは、データ処理システム105に、当該トークンおよび(例えば、センサ151を介した)検出または当該非可聴音波の受信に対応する第2のタイムスタンプを送信することができる。
データ処理システム105(例えば、インタフェース管理コンポーネント140)は、第1のタイムスタンプおよび当該トークンを第1のコンピューティングデバイスから受信でき、第2のタイムスタンプおよび当該トークンを第2のコンピューティングデバイスから受信することができる。データ処理システム105は、第1のコンピューティングデバイスから受信されたトークンを第2のコンピューティングデバイスから受信されたトークンとマッチすることができる。なぜならそれらが同一のトークンでありうるからである。当該トークンのマッチに応答して、データ処理システム105は、当該2つのコンピューティングデバイスの間の距離を決定するために第1のおよび第2のタイムスタンプを取り出すことができる。
例えば、データ処理システム105(例えば、インタフェース管理コンポーネント140を介して)は第2のタイムスタンプおよび第1のタイムスタンプの間の差異を決定することができる。データ処理システム105は、当該差異に基づいて、第1のコンピューティングデバイスおよび第2のコンピューティングデバイスの間の距離を決定することができる。例えば、当該差異は当該サブ可聴送信が通過する距離量に対応することができる。当該サブ可聴送信は、おおよそ毎秒340.29メートルでありうる音速で通過することができる。第1のタイムスタンプおよび第2のタイムスタンプの間の差異が0.01秒である場合、第1のコンピューティングデバイスおよび第2のコンピューティングデバイスはおおよそ(例えば、プラスマイナス10%)3.4メートルだけ分かれている。別の例では、第1のタイムスタンプおよび第2のタイムスタンプの間の差異が.001秒である場合、第1のコンピューティングデバイスおよび第2のコンピューティングデバイスはおおよそ0.34メートルだけ分かれている。したがって、データ処理システム105は、当該コンピューティングデバイスの間の距離を決定するために、当該非可聴音波の速度(例えば、音速)に当該時間差異を乗ずることができる。データ処理システム105は、第2のコンピューティングデバイスが第1のコンピューティングデバイスの閾値距離内にあると判定するために、当該決定された距離を閾値距離(例えば、1メートル、2メートル、3メートル、4メートル、5メートル、7メートル、またはそれ以上)と比較することができる。
インタフェース管理コンポーネント140は、ワイヤレス信号を利用する近接性検出技術を使用することができる。例えば、インタフェース管理コンポーネント140は、ワイヤレス信号(例えば、無線周波数信号、Bluetooth(登録商標)信号、WIFI信号、ビーコン、近接場通信信号、または低電力Bluetooth(登録商標)信号)を送信するように第1のコンピューティングデバイスに指示することができる。当該信号を受信するブロードキャストの範囲内のデバイスは第1のコンピューティングデバイスに応答するか、または、当該信号の受信を示す指示をインタフェース管理コンポーネント140に送信することができる。例えば、第2のコンピューティングデバイスは、第2のコンピューティングデバイスの識別子を含む第2の信号をブロードキャストでき、第1のコンピューティングデバイスは、第2の信号を受信し、第2のコンピューティングデバイスの識別子を抽出して、第2のコンピューティングデバイスが閾値距離内にあると当該成功した送信に基づいて判定することができる。別の例では、第2のコンピューティングデバイスは、第2のコンピューティングデバイスおよび第1のコンピューティングデバイスの間のおおよその距離を決定するために、当該ブロードキャスト信号の電力レベルを決定することができる。例えば、当該ブロードキャスト信号の電力レベルは当該信号が伝播する距離に基づいて消失することができる。当該ブロードキャスト信号の電力レベルは、おおよそ第1のコンピューティングデバイスの送信器および第2のコンピューティングデバイスの受信器の間の距離の二乗に反比例する割合で消失することができる(例えば、受信された電力=送信された電力*(1/(4*pi*距離^2)))。第2のコンピューティングデバイスは当該信号の受信された電力レベルを検出でき、当該受信された電力レベルの指示を第1のコンピューティングデバイスに提供でき、またはデータ処理システム105(例えば、インタフェース管理コンポーネント140)は、第1のコンピューティングデバイスおよび第2のコンピューティングデバイスの間の距離を決定するために、当該受信された信号電力レベルを当該送信された電力レベルと比較することができる。
データ処理システム105は(例えば、インタフェース管理コンポーネント140を介して)、第1のコンピューティングデバイスおよび第2のコンピューティングデバイスの両方が同一の入力オーディオ信号を検出したことに基づいて、第1のコンピューティングデバイスおよび第2のコンピューティングデバイスが閾値距離内にあると判定することができる。例えば、第1のコンピューティングデバイスの1のマイクロフォンは入力オーディオ信号を検出でき、第2のコンピューティングデバイスの第2のマイクロフォンは同一の入力オーディオ信号をおおよそ同時に検出することができる(例えば、時間の差異は当該入力オーディオ信号のソースおよび第1のおよび第2のコンピューティングデバイスの間の各距離における差異に起因しうる)。第1のコンピューティングデバイスは第1のマイクロフォンにより検出された入力オーディオ信号をデータ処理システム105に提供でき、第2のコンピューティングデバイスは第2のマイクロフォンにより検出された入力オーディオ信号をデータ処理システム105に提供することができる。データ処理システム105は次いで、第1のコンピューティングデバイスおよび第2のコンピューティングデバイスの両方が同一の入力オーディオ信号をおおよそ同時に検出したと判定することができる。データ処理システム105はさらに、それぞれ、第1のマイクロフォンおよび第2のマイクロフォンによる入力オーディオ信号の検出に対応する各タイムスタンプに基づいて、第1のおよび第2のコンピューティングデバイスが閾値距離内にあると判定することができる。
異なるコンピューティングデバイスにより検出された入力オーディオ信号の間のマッチを識別することで、データ処理システム105は当該異なるコンピューティングデバイスが互いに対して相対的に近いと判定することができる。なぜならば、それらの各マイクロフォンが同一の入力オーディオ信号を検出できたからである。マッチを検出することは、音響シグネチャのマッチング、オーディオ信号のフーリエ変換のマッチング、または会話テキスト技術を用いた入力オーディオ信号からテキストへの変換および当該テキストのマッチングを含むことができる。データ処理システム105は、当該頻度が実質的にマッチングする(例えば、99%マッチング、98%マッチング、95%マッチング、90%マッチング、85%マッチング)場合または当該テキストが実質的にマッチングする(例えば、99%マッチング、98%マッチング、95%マッチング、90%マッチング、または85%マッチング)場合のマッチを決定することができる。
インタフェース管理コンポーネント140は、1つまたは複数の近接性検出技術を使用して、当該入力オーディオ信号を受信する第1のコンピューティングデバイスの閾値距離内の1つまたは複数のコンピューティングデバイスを識別することができる。例えば、インタフェース管理コンポーネント140は、第1の近接性検出技術を使用して、第1のコンピューティングデバイスからの閾値距離内の第2のコンピューティングデバイスを識別することができる。インタフェース管理コンポーネント140は、第2の近接性検出技術を使用して、第1のコンピューティングデバイスからの閾値距離内の第3のコンピューティングデバイスを識別することができる。インタフェース管理コンポーネント140は、第3の近接性検出技術を使用して第1のコンピューティングデバイスからの閾値距離内の第4のコンピューティングデバイスを識別することができる。第2の、第3のおよび第4のコンピューティングデバイスの各々は各候補インタフェースを含むことができる。データ処理システム105は当該各候補インタフェースをポーリングして、当該候補インタフェースの各々に対するリソース利用値を識別し、当該候補インタフェースの1つを当該各リソース利用値の比較に基づいて選択することができる。例えば、当該リソース利用値はオーディオ出力が当該インタフェースを介して送信されている(例えば、オーディオを再生している)かどうかを示すことができる。当該候補インタフェースの何れもオーディオ出力を再生していない場合、データ処理システム105はオーディオ出力に対して構成された当該候補インタフェースを選択することができる。
オーディオ出力に対して構成された複数の利用可能なインタフェースがある場合、データ処理システム105は、ポリシまたはヒューリスティックを使用して、オーディオ出力に対する当該インタフェースの1つまたは複数を選択することができる。例えば、データ処理システム105は、オーディオ・コンテンツを再生することを指示する第1のコンピューティングデバイスに最も近いオーディオインタフェースを有するコンピューティングデバイスを選択することができる。データ処理システム105は、アクティブにエンド・ユーザにより使用されているコンピューティングデバイスに対応するオーディオインタフェースを選択することができる。データ処理システム105は、エンド・ユーザにより直近に使用されたコンピューティングデバイスに対応するオーディオインタフェースを選択することができる。データ処理システム105は、最大量のバッテリ残量を有するコンピューティングデバイス、または電源に接続されているコンピューティングデバイスに対応するオーディオインタフェースを選択することができる。
幾つかのケースでは、インタフェース管理コンポーネント140は、メモリ(例えば、データリポジトリ145)から、当該コンピューティングデバイスの閾値距離内の複数のコンピューティングデバイスを示す近接性情報を取り出す。例えば、データ処理システム105は、以前に当該複数のコンピューティングデバイスを識別し、当該複数のコンピューティングデバイスに対応する当該候補インタフェースをポーリングし、当該情報をデータリポジトリ145に格納しているかもしれない。例えば、当該複数のコンピューティングデバイス150の1つまたは複数は、一般に動かされない静止しているまたは固定されたコンピューティングデバイス(例えば、壁に取り付けられたテレビ、デスクトップコンピューティングデバイス、ホームスピーカ、またはサラウンド・サウンドスピーカシステム)であってもよい。したがって、データ処理システム105は当該コンピューティングデバイスに関する情報の少なくとも幾つかをメモリから取り出してもよい。データ処理システム105は次いで、現在のまたは更新されたリソース利用値を決定するために当該候補インタフェースをポーリングすることができる。したがって、データ処理システム105は、距離情報を既に有するかもしれず、または1つまたは複数のコンピューティングデバイスが当該入力オーディオ信号を受信する第1のコンピューティングデバイスの範囲内にあると以前に判定したかもしれず、追加のリソース利用を減らすかまたは当該デバイスを識別するステップをスキップすることで遅延し候補インタフェースをポーリングすることに進んでもよい。
データ処理システム105はコンピューティングデバイスが閾値距離内にあるかどうかを判定するために、漸進的によりリソース集約的となる近接性検出技術の階層を使用することができる。例えば、データ処理システム105は、当該複数のコンピューティングデバイスが同一のネットワーク上にあるかどうかを判定するために、WIFIまたはインターネットプロトコルアドレスベースの技術を最初に使用することができる。当該コンピューティングデバイスが異なるIPアドレスに関連付けられた別々のWIFIネットワーク上にある場合、データ処理システム105は当該2つのデバイスが当該閾値距離内にないと判定することができる。しかし、データ処理システム105が、当該2つのコンピューティングデバイスが同一のWIFIネットワーク上にあると判定した場合、データ処理システムは、当該2つのコンピューティングデバイスが互いのBluetooth(登録商標)範囲内にあるかどうかを判定するために、Bluetooth(登録商標)ブロードキャストまたはビーコンの使用に進むことができる。データ処理システム105が、当該2つのデバイスがBluetooth(登録商標)範囲内にあると判定した場合、データ処理システム105は、当該コンピューティングデバイスが当該閾値距離内にあるかどうかを判定するために、サブ可聴音波送信するように第1のコンピューティングデバイスに指示することに進むことができる。したがって、近接性検出技術の階層を利用することで、データ処理システム105は、当該閾値距離の外にあるデバイスをフィルタして除外するより高速または低速なリソース集約的近接性検出技術を用いることでリソース利用を減らし、遅延を減らし、次いで広い近接性チェックを通すコンピューティングデバイスに対してより多くのリソースを利用するより粒度の細かい近接性検出技術に進むことができる。
幾つかのケースでは、データ処理システム105は、当該入力オーディオ信号を受信する第1のコンピューティングデバイスの閾値距離内にある第2の候補インタフェースを有する第2のコンピューティングデバイスを識別することができる。データ処理システム105は、第2のリソース利用値を決定するために第2のコンピューティングデバイスで実行されているアプリケーション・プログラミング・インタフェース(「API」)を問い合わせることができる。例えば、第2のコンピューティングデバイスは、コンテンツの提示に関連付けられたオーディオ出力、ビデオ出力、ボリューム・レベル、または他の情報を制御または監視するAPIを含むことができる。当該APIは、オーディオが再生されている現在のボリューム・レベル、当該オーディオ・コンテンツの期間、オーディオ・コンテンツのタイプ(例えば、音楽、テレビ、ポッドキャスト、オーディオブック、コマーシャル、オーディオ・コンテンツが再生されているボリューム・レベルを示す第2の利用値を示すことによって、クエリに応答することができる。
インタフェース管理コンポーネント140は、1つまたは複数の技術、ポリシまたはヒューリスティックを使用して、複数の候補インタフェースからインタフェースを選択し、コンテンツ・アイテムを選択されたインタフェースと互換なモダリティに変換し、次いで当該選択されたインタフェースを介して提示するための変換されたコンテンツ・アイテムを送信することができる。例えば、データ処理システム105は、インタフェースを当該候補インタフェースから、センサ利用値のようなリソース利用値に基づいて選択することができる。当該センサは当該候補インタフェースに対応するコンピューティングデバイスのマイクロフォンを指すことができる。マイクロフォンは、オーディオが当該コンピューティングデバイスの近くで再生されていないこと、およびエンド・ユーザまたは他のユーザが当該コンピューティングデバイスの近くで話していないことを示す、低いレベルの周辺の音を検出してもよい。データ処理システム105は、マイクロフォンが低いセンサ利用値を有するので、当該インタフェースからのオーディオファイルの再生が冗長でないかまたは他のオーディオ・コンテンツの複製物でないかもしれないので、当該インタフェースを選択することを決定することができる。
別の例では、センサ利用は当該コンピューティングデバイスのスピーカを指すことができる。データ処理システム105はスピーカが使用されていないと判定し、それにより低いセンサ利用値を示すことができる。したがって、データ処理システム105は、スピーカを、コンテンツ・アイテムを提供するためのインタフェースとして選択することができる。
別の例では、センサ利用はコンピューティングデバイスの温度を指すことができる。例えば、当該コンピューティングデバイスのプロセッサが閾値上の温度で実行されている場合、データ処理システム105は、コンピューティングデバイスがプロセッサ集約的タスクが実施していると判定してもよく、当該コンピューティングデバイスまたは当該コンピューティングデバイスのインタフェースを利用しないと決定してもよい。したがって、データ処理システム105は低い温度を有する閾値距離内の別のコンピューティングデバイスのインタフェースを選択することができる。
インタフェース管理コンポーネント140は、選択されたインタフェースがコンテンツ・アイテムに対してより効率的であると示す少なくとも1つの利用値に基づいて、当該コンテンツ・アイテムに対するインタフェースを選択することができる。例えば、当該コンテンツ・アイテムがより小さくより少ないリソースで送信できるので、候補インタフェースから、スマートウォッチで当該コンテンツ・アイテムを描画するためのインタフェースは最小の帯域幅を使用する。あるいは、インタフェース管理コンポーネント140は、当該インタフェースによる当該コンテンツ・アイテムの描画が当該対応するクライアントコンピューティングデバイス150のバッテリ電力を排出しないように、当該コンテンツ・アイテムを描画するために選択された候補インタフェースが現在充電している(例えば、プラグインされている)と判定することができる。別の例では、インタフェース管理コンポーネント140は、現在別の動作より少ない処理動作を実施している候補インタフェース、現在ビデオコンテンツをネットワーク165からストリーミングしている例えば異なるクライアントコンピューティングデバイス150の選択されていないインタフェースを選択でき、したがって遅延なしに当該コンテンツ・アイテムを描画するのにはあまり利用可能でない。
インタフェース管理コンポーネント140(または他のデータ処理システム105コンポーネント)は、当該候補インタフェースと互換なモダリティで配送するためにコンテンツ・アイテムを変換することができる。例えば、当該候補インタフェースがスマートウォッチ、スマートフォン、またはタブレットコンピューティングデバイスのディスプレイである場合、インタフェース管理コンポーネント140は、当該インタフェースに関連付けられた当該ディスプレイスクリーンの次元が与えられた場合に、適切な視覚ディスプレイに対する当該コンテンツ・アイテムのサイズを決定することができる。インタフェース管理コンポーネント140はまた、当該コンテンツ・アイテムを、当該選択されたインタフェースに関連付けられたクライアントコンピューティングデバイス150に送信するための専有または業界標準フォーマットを含む、パケットまたは他のプロトコルベースのフォーマットに変換することができる。当該コンテンツ・アイテムに対するインタフェース管理コンポーネント140により選択された当該インタフェースは、エンド・ユーザにより複数のクライアントコンピューティングデバイス150からアクセス可能なインタフェースを含むことができる。例えば、当該インタフェースは、エンド・ユーザが当該入力オーディオ信号を生成したクライアントコンピューティングデバイス150(例えば、スマートフォン)ならびにタブレットまたはデスクトップコンピュータまたは他のモバイルコンピューティングデバイスのような他のクライアントコンピューティングデバイスを介してアクセスできるソーシャル・メディア・アカウントであることができるかまたはそれを含むことができる。
インタフェース管理コンポーネント140はまた、当該アクションデータ構造に対する少なくとも1つの候補インタフェースを選択することができる。このインタフェースは、当該入力オーディオ信号がそこから取得された同一のインタフェース、例えば、クライアントコンピューティングデバイス150で実行された音声起動されたアシスタントサービスであることができる。これは、同一のインタフェースまたは当該コンテンツ・アイテムに対して選択されたインタフェース管理コンポーネント140と異なるインタフェースであることができる。インタフェース管理コンポーネント140(または他のデータ処理システム105コンポーネント)は、オーディオ出力として描画するための当該入力オーディオ信号を生成した同一のクライアントコンピューティングデバイス150に、当該アシスタントサービスの一部として当該アクションデータ構造を提供することができる。インタフェース管理コンポーネント140はまた、当該選択されたインタフェースにより描画するのに適した任意の変換されたモダリティで、当該コンテンツ・アイテムを当該コンテンツ・アイテムに対する当該選択されたインタフェースに送信または提供することができる。
したがって、インタフェース管理コンポーネント140は、同一のクライアントコンピューティングデバイス150により受信された当該入力オーディオ信号に応答して、クライアントコンピューティングデバイス150のインタフェースにより描画するためのオーディオ出力として当該アクションデータ構造を提供することができる。インタフェース管理コンポーネント140はまた、同一のクライアントコンピューティングデバイス150または同一のエンド・ユーザに関連付けられた異なるクライアントコンピューティングデバイス150の異なるインタフェースにより描画するための当該コンテンツ・アイテムを提供することができる。例えば、アクションデータ構造、例えば、「it will be sunny and 80 degrees at the beach on Saturday」は、クライアントコンピューティングデバイスによるオーディオ描画をクライアントコンピューティングデバイス150で部分的に実行されているアシスタントプログラムインタフェースの一部として提供することができ、「sunscreen is available from the convenience store near the beach」を示すコンテンツ・アイテム、例えば、テキスト、オーディオ、または組合せコンテンツ・アイテムを、エンド・ユーザに関連付けられた同一のまたは異なるクライアントコンピューティングデバイス150によりアクセス可能な電子メールまたはテキストメッセージのような、同一のまたは異なるコンピューティングデバイス150のインタフェースにより描画するために、提供することができる。
当該コンテンツ・アイテムを当該アクションデータ構造から分離し、当該コンテンツ・アイテムを、例えば、オーディオメッセージではなくテキストメッセージとして送信することで、例えば、テキストメッセージデータ送信がオーディオメッセージデータ送信よりあまり計算集約的でないので、当該コンテンツ・アイテムにアクセスするクライアントコンピューティングデバイス150に対する削減された処理電力をもたらしうる。この分離はまた、当該コンテンツ・アイテムを描画するために使用される電力利用、メモリ記憶、または送信帯域幅を減らすことができる。これは、システム100ならびにクライアントコンピューティングデバイス150およびデータ処理システム105のようなデバイスの増大された処理電力、および帯域幅効率をもたらす。これは、これらのトランザクションを処理する当該コンピューティングデバイスの効率を増やし、当該コンテンツ・アイテムが描画できる速度を増やす。データ処理システム105は、何千、何万またはそれ以上の入力オーディオ信号を同時に処理でき、その結果、当該帯域幅、電力、および処理節約は大幅であり、単に増分的または偶発的なものではない。
インタフェース管理コンポーネント140は、クライアントコンピューティングデバイス150へのアクションデータ構造の配送に続いて、コンテンツ・アイテムを当該アクションデータ構造と同じクライアントコンピューティングデバイス150(または異なるデバイス)に提供または配送することができる。例えば、当該コンテンツ・アイテムを、当該アクションデータ構造のオーディオ出力描画の完了時に、選択されたインタフェースを介した描画のために提供することができる。インタフェース管理コンポーネント140はまた、当該アクションデータ構造のクライアントコンピューティングデバイス150への提供と並行して、当該コンテンツ・アイテムを選択されたインタフェースに提供することができる。インタフェース管理コンポーネント140は、NLPコンポーネント110による入力オーディオ信号の受信からの所定の時間期間内に当該選択されたインタフェースを介して配送するためのコンテンツ・アイテムを提供することができる。当該時間期間は、例えば、セッションの会話のアクティブな長さにおける任意の時間であることができる。例えば、入力オーディオ信号が「I would like to go to the beach this weekend」である場合、当該所定の時間期間は、週末の終わりを通じた当該入力オーディオ信号の受信からの任意の時間、例えば、当該会話のアクティブな期間であることができる。当該所定の時間期間はまた、この描画の5分、1時間または1日以内のような、クライアントコンピューティングデバイス150によるオーディオ出力として当該アクションデータ構造の描画からトリガされた時間であることができる。
インタフェース管理コンポーネント140は、コンテンツ・アイテムの存在の指示を有するアクションデータ構造をクライアントコンピューティングデバイス150に提供することができる。例えば、データ処理システム105は、クライアントコンピューティングデバイス150でオーディオ出力「it will be sunny and 80 degrees at the beach on Saturday, check your email for more information」を提供するように描画するアクションデータ構造を提供することができる。フレーズ「check your email for more information」は、例えば、データ処理システム105によりインタフェース(例えば、電子メール)に提供される、日焼け止めに関するコンテンツ・アイテムの存在を示すことができる。本例では、スポンサーされたコンテンツを、コンテンツ・アイテムとして電子メール(または他の)インタフェースに提供でき、天気のような有機的なコンテンツをアクションデータ構造としてオーディオ出力に提供することができる。
データ処理システム105はまた、当該コンテンツ・アイテムを取得することに対するユーザの興味を決定するために当該ユーザに問い合わせるプロンプトをアクションデータ構造に提供することができる。例えば、当該アクションデータ構造は「it will be sunny and 80 degrees at the beach on Saturday, would you like to hear about some services to assist with your trip?」を示すことができる。データ処理システム105は、プロンプト「would you like to hear about some services to assist with your trip?」に応答して「sure」のような別のオーディオ入力信号をクライアントコンピューティングデバイス150から受信することができる。NLPコンポーネント110は、この応答、例えば、「sure」を解析して、それをクライアントコンピューティングデバイス150によるコンテンツ・アイテムのオーディオ描画に対する認証として解釈することができる。応答して、データ処理システム105は、当該応答「sure」が発生した同一のクライアントコンピューティングデバイス150によるオーディオ描画のために当該コンテンツ・アイテムを提供することができる。
データ処理システム105は当該アクションデータ構造に関連付けられたコンテンツ・アイテムの送信を遅延して、処理の利用を最適化することができる。例えば、データ処理システム105は、リアルタイムで入力オーディオ信号の受信に応答してクライアントコンピューティングデバイスによるオーディオ出力として、例えば、会話方式で描画するために当該アクションデータ構造を提供し、コンテンツ・アイテム送信をデータセンタ利用のオフピークまたは非ピークの期間まで遅延することができる、これはピーク帯域幅利用、熱出力または冷却要件を減らすことで当該データセンタのより効率的な利用をもたらす。データ処理システム105はまた、車サービスのオーダのような、当該コンテンツ・アイテムに関連付けられた変換または他の活動を、当該アクションデータ構造または当該コンテンツ・アイテムへの応答に応答して、データ処理システム105を含むネットワーク165またはデータセンタのデータセンタ利用率または帯域幅メトリックまたは要件に基づいて開始することができる。
当該選択されたインタフェースを介して描画されたコンテンツ・アイテムのクリックのような、コンテンツ・アイテムまたは後続のアクションに対するアクションデータ構造への応答に基づいて、データ処理システム105は変換を識別するか、または変換またはアクションを開始することができる。データ処理システム105のプロセッサは、ダイレクト・アクションAPI135を起動して、エンド・ユーザをビーチに行き来させるカーシェアサービスからの車のオーダのような変換アクションを促進するスクリプトを実行することができる。ダイレクト・アクションAPI135は、データリポジトリ145からのコンテンツデータ148(またはパラメータ146またはポリシ147)、ならびに位置、時間、ユーザアカウント、物流またはカーシェアサービスから車を予約するための他の情報を決定するためにエンド・ユーザの同意によりクライアントコンピューティングデバイス150から受信されたデータを取得することができる。ダイレクト・アクションAPI135を用いて、データ処理システム105はまた、サービスプロバイダコンピューティングデバイス160と通信して、この例ではカーシェアのピックアップ予約を行うことによって当該変換を完了することができる。
図2は、音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のための流れ図200を示す。データ処理システム105は入力オーディオ信号205、例えば、「OK, I would like to go to the beach this weekend」を受信することができる。応答して、データ処理システムは少なくとも1つのアクションデータ構造210および少なくとも1つのコンテンツ・アイテム215を生成する。アクションデータ構造205は、「It will be sunny and 80 degrees at the beach this weekend」または「It will be sunny and 80 degrees at the beach this weekend」と述べるオーディオ描画応答のような、有機的なまたはスポンサーされないコンテンツを含むことができる。データ処理システム105は、クライアントコンピューティングデバイス150の候補インタフェースにより、例えば、リアルタイムまたは会話方式でデジタルまたは会話アシスタントプラットフォームの一部として描画するための、アクションデータ構造210を入力オーディオ信号205を生成した同一のクライアントコンピューティングデバイス150に提供することができる。
データ処理システム105は候補インタフェース220をコンテンツ・アイテムに対する選択されたインタフェース215として選択でき、コンテンツ・アイテム215を選択されたインタフェース220に提供することができる。コンテンツ・アイテム215はまたデータ構造を含むことができる。当該データ構造を、選択されたインタフェース220により描画するためにデータ処理システム105により適切なモダリティに変換することができる。コンテンツ・アイテム215は、その日のために、または日焼け止めのためにビーチチェアの貸出しの申し出のような、スポンサーされたコンテンツを含むことができる。選択されたインタフェース220は、クライアントコンピューティングデバイス150のエンド・ユーザによりアクセス可能な、同一のクライアントコンピューティングデバイス150または異なるデバイの一部であることができるか、または、それらにより実行されることができる。アクションデータ構造210およびコンテンツ・アイテム215の送信は同時に、または、互いに対して後続して発生することができる。アクションデータ構造210は、コンテンツ・アイテム215が別々に異なるモダリティまたはフォーマットを介して選択されたインタフェース200に送信されているかまたは将来送信されるインジケータを含むことができ、エンド・ユーザにコンテンツ・アイテム215の存在を警告する。
アクションデータ構造210およびコンテンツ・アイテム215をエンド・ユーザに描画するために別々に提供することができる。スポンサーされたコンテンツ(コンテンツ・アイテム215)を有機的な応答(アクションデータ構造210)から分離することで、コンテンツ・アイテム215がスポンサーされるということを示すオーディオまたは他の警告をアクションデータ構造210に提供する必要はない。これは、ネットワーク165を介したアクションデータ構造210の送信に関連付けられた帯域幅要件を減らすことができ、例えばオーディオディスクレーマまたは警告メッセージなしにアクションデータ構造210の描画を簡単化することができる。
データ処理システム105は応答オーディオ信号225を受信することができる。応答オーディオ信号225は、「great, please book me a hotel on the beach this weekend」のようなオーディオ信号を含むことができる。応答オーディオ信号225のデータ処理システム105による受信は、データ処理システムに、ダイレクト・アクションAPI135を起動して変換を実行し、例えば、ビーチのホテルの部屋を予約させることができる。ダイレクト・アクションAPI135はまた、少なくとも1つのサービスプロバイダコンピューティングデバイス160と通信して、情報をサービスプロバイダコンピューティングデバイス160を提供でき、その結果、サービスプロバイダコンピューティングデバイス160は当該予約プロセスを完了または確認することができる。
図3は、音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信の方法300を示す。方法300はデータ・パケットを受信することができる(動作305)。例えば、NLPコンポーネント110、データ処理システム105により実行され、クライアントコンピューティングデバイス105から入力オーディオ信号を含むデータ・パケットを受信することができる(動作305)。当該データ・パケットを、ネットワーク165を介してパケットまたは他のプロトコルベースのデータ送信として受信することができる(動作305)。方法300は、当該入力オーディオ信号から、要求または当該要求に対応するトリガキーワードを識別することができる(動作310)。例えば、NLPコンポーネント110は当該入力オーディオ信号を解析して、当該入力オーディオ信号の主題に関する要求を識別することができ、または、例えば、当該要求に関連付けられたアクションを示すことができるトリガキーワードを識別することができる。
方法300は少なくとも1つのアクションデータ構造を生成することができる(動作315)。例えば、ダイレクト・アクションAPI135は当該要求またはトリガキーワードに基づいてアクションデータ構造を生成することができる(動作315)。当該アクションデータ構造は当該入力オーディオ信号に関連する有機的なまたはスポンサーされないコンテンツを示すことができる。方法300は少なくとも1つのコンテンツ・アイテムを選択することができる(動作320)。例えば、コンテンツセレクタコンポーネント125は当該要求(複数可)または当該トリガキーワード(複数可)を受信でき、この情報に基づいては1つまたは複数のコンテンツ・アイテムを選択することができる。当該コンテンツ・アイテムは、当該要求または当該トリガキーワードの主題に関する主題を有するスポンサーされたアイテムを含むことができる。当該コンテンツ・アイテムを、リアルタイムコンテンツ選択プロセスを介してコンテンツセレクタコンポーネント125により選択することができる。
方法300は当該コンピューティングデバイスの閾値範囲内の複数のコンピューティングデバイスを識別し、少なくとも1つの候補インタフェースを決定するために複数のインタフェースをポーリングすることができる(動作325)。方法300は1つまたは複数の近接性検出技術を使用して、当該閾値範囲内の当該1つまたは複数のコンピューティングデバイスを識別し、次いで当該1つまたは複数のコンピューティングデバイスに関連付けられた候補インタフェースをポーリングすることができる。当該候補インタフェースは、当該選択されたコンテンツ・アイテム(またはアクションデータ構造)の描画のための候補インタフェースを含むことができる。例えば、インタフェース管理コンポーネント140はインタフェースを問い合わせて、当該インタフェースに関する利用値、例えば、パラメータ情報または他の特性を取得することができる(動作330)。当該利用値に基づいて、インタフェース管理コンポーネント140は少なくとも1つの候補インタフェースを当該コンテンツ・アイテム(または当該アクションデータ構造)を描画するための選択されたインタフェースとして選択することができる(動作335)。方法300は、当該コンテンツ・アイテムを当該選択されたインタフェースを介して描画するためのモダリティに変換するステップを含むことができる(動作340)。例えばデータ処理システム105またはインタフェース管理コンポーネント140のようなそのコンポーネントは、オンラインドキュメントのコンテンツ・アイテムスロットで描画するために(例えば、電子メールとして(例えば、選択された電子メールインタフェースを介して)またはチャットアプリで表示するためのテキストメッセージとして表示するために)当該コンテンツ・アイテムを変換することができる。幾つかのケースでは、方法300は、当該選択されたインタフェースを介して描画するためのモダリティで当該コンテンツ・アイテムを選択するステップを含むことができる(動作340)。
方法300は当該アクションデータ構造を描画するためのクライアントコンピューティングデバイス150に提供でき(動作345)、当該コンテンツ・アイテムを当該コンテンツ・アイテムを描画するために選択された当該候補インタフェースに送信することができる(動作350)。例えば、インタフェース115を介して、インタフェース管理コンポーネント140は、当該入力オーディオ信号に応答してオーディオ出力として描画するための当該アクションデータ構造をクライアントコンピューティングデバイス150に提供することができる(動作345)。データ処理システムはまた、当該変換されたモダリティで描画するための当該コンテンツ・アイテムを同一のまたは異なるクライアントコンピューティングデバイス150上の当該選択されたインタフェースに送信することができる(動作350)。
図4は、音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムの例示的な動作を示す。システム400は、例えば、データ処理システム105、ネットワーク165および1つまたは複数のコンピューティングデバイスを含む、システム100、200または600で示した1つまたは複数のコンポーネントを含むことができる。
図4に示すように、システム400は、第2のコンピューティングデバイス406から距離410離れた第1のコンピューティングデバイス404を含むことができる。第2のコンピューティングデバイス406は、オーディオ、ビデオ、画像または他のコンテンツ第1の出力デバイス408を介して出力するために第1の出力デバイス408に通信可能に接続されることができる。第1のコンピューティングデバイス405、第2のコンピューティングデバイス406および第1の出力デバイス408は、第1の部屋402(例えば、家の部屋、アパート、居住空間、オフィス、ホテル部屋または他の物理空間)に位置づけまたは配置することができる。第1のコンピューティングデバイス404および第2のコンピューティングデバイス406はネットワーク165を介してデータ処理システム105と対話および通信することができる。
システム400は1つまたは複数のユーザインタフェースを有する1つまたは複数のコンピューティングデバイスを含むことができる。第1のユーザインタフェースは、ユーザが当該ユーザインタフェース要素を要求することなく出現するユーザインタフェース要素のように、侵襲的であると考えることができる。これらのユーザインタフェース要素はコンテンツ・アイテムまたは通知を含むことができ、モバイルアプリケーションまたはウェブページを介して提供することができる。かかるユーザインタフェース要素は、視覚的に侵襲的なユーザインタフェース要素でありうるので、無視または破棄してもよい。幾つかのコンピューティングデバイスは、音声ベースのデジタルアシスタントのような主にオーディオまたはオーディオのみのデバイスであってもよい。これらのタイプのコンピューティングデバイスでは、当該ユーザインタフェース要素はオーディオの再生を含んでもよく、これは当該通知またはコンテンツ・アイテムの前に当該デバイスが出力していたコンテンツに割り込みうる。したがって、当該本開示のシステムおよび方法はこれらの通知を、特定の時点または特定のインタフェースまたは特定のコンピューティングデバイスで、例えば現在の出力に割り込むかまたは当該現在のデバイスのオーディオチャネルまたは近傍のデバイスのオーディオチャネルで再生することなく提供することができる。
データ処理システム105はいつどこでコンテンツ・アイテムまたは通知を配送するかを判定することができる。データ処理システム105は、いつユーザとオーディオ駆動の通知で関与するかを近傍のデバイスとのユーザ関与およびこれらの近傍のデバイスの媒体再生状態に基づいて判定するための機構を提供することができる。例えば、データ処理システム105は、ユーザが既に近傍のコンピューティングデバイス(例えば、モニタ、ディスプレイデバイス、テレビ、またはスピーカのような第1の出力デバイス408でビデオを再生している第2のコンピューティングデバイス406)に関与しており、当該ユーザにオーディオベースのプロモーションで割り込むことを選択しないかどうかを判定することができる。
データ処理システム105は、当該コンテンツ・アイテムまたは通知を全く表示しないか、または当該通知またはコンテンツ・アイテムを異なる媒体またはデバイスに送信する(例えば、当該コンテンツ・アイテムまたは通知をプッシュ通知として第1のコンピューティングデバイス404に送信する)と決定でき、または後の配送のために当該コンテンツ・アイテムまたは通知を遅延すると決定することができる。
例えば、システム400は第1のコンピューティングデバイス404を含むことができる。第1のコンピューティングデバイス404はコンピューティングデバイス150の1つまたは複数のコンポーネントまたは機能を含むことができる。第1のコンピューティングデバイス404はユーザにより提供された音声入力またはオーディオコマンドを含む入力オーディオ信号を受信することができる。第1のコンピューティングデバイス404は、当該オーディオコマンドに関与することができ、次いでデータ処理システム105により行われた判定に基づいてコンテンツ・アイテムまたは通知を再生するかまたは保留する。データ処理システム105は、当該ユーザが存在し第1のコンピューティングデバイス404が別の活動に割り込んでいない場合に、当該コンテンツ・アイテムまたは通知を再生または表示するように第1のコンピューティングデバイス105に指示することを決定することができる。データ処理システム105は、第1のコンピューティングデバイス404との対話または関与に基づいて表示された当該ユーザを決定することができる。
データ処理システム105はさらに、当該コンテンツ・アイテムまたは通知が別の活動に割り込むかどうかを判定することができる。例えば、データ処理システム105はローカルAPIを通じて近傍のデバイスのオーディオ状態を決定することができる。データ処理システム105は当該APIを使用して、第2のコンピューティングデバイス406を問い合わせて、第2のコンピューティングデバイス406が第1の出力デバイス408を介して現在オーディオ・コンテンツを再生しているかどうかおよびボリューム・レベルが何かを判定することができる。データ処理システム105は、当該コンテンツがオーディオを含むかまたはオーディオを含まない(例えば、オーディオなしの画像スライド・ショーを再生している)かどうかを判定するために、第2のコンピューティングデバイス406により現在再生されているコンテンツに関するメタデータを検査または処理することができる。第2のコンピューティングデバイス406がオーディオを再生しない場合、データ処理システム105は、第1のコンピューティングデバイス404を介して提示するためのオーディオ・コンテンツ・アイテムを提供することが、第2のコンピューティングデバイス406により提供されたコンテンツに割り込めないと判定することができる。
そうするために、データ処理システム105は、第1のコンピューティングデバイス404の閾値距離内のコンピューティングデバイスを検出することができる。データ処理システム105(例えば、インタフェース管理コンポーネント)は、第1のコンピューティングデバイス404および第2のコンピューティングデバイス406の間の距離410を決定するための1つまたは複数の近接性検出技術を利用して、距離410が閾値距離内にあるかどうかを判定することができる。例えば、データ処理システム105は、サブ可聴音波を送信するように第1のコンピューティングデバイス404に指示することができる。第1のコンピューティングデバイス404のスピーカからサブ可聴音を通じて別のデバイスのマイクロフォン(例えば、第2のコンピューティングデバイス406のマイクロフォン)にトークンを送信し、次いで当該トークンの値をサーバエクスチェンジと比較することで、データ処理システム105は第1のコンピューティングデバイス404および第2のコンピューティングデバイス406が同一の部屋(例えば、第1の部屋402)にあるかどうかを判定することができる。データ処理システム105はさらに、当該トークンが第1のコンピューティングデバイス404のスピーカから第2のコンピューティングデバイス406のマイクロフォンに移動するのにかかるミリ秒をカウントすることで、2つのデバイス404および406の間のおおよその距離410を近似することができる。当該2つのデバイスは同期されたであることができる。
幾つかのケースでは、データ処理システム105は、オーディオまたはビデオが第1のコンピューティングデバイス404の(例えば、距離410のような閾値距離内の)近傍のデバイスで再生されていると判定でき、オーディオ・コンテンツ・アイテムの提供または第1のコンピューティングデバイス404を介した通知のブロックを決定することができる。幾つかのケースでは、データ処理システム105は、第1のコンピューティングデバイス404のオーバライド構成(例えば、セキュリティ警告を提供するためのオーバライドブロック)に基づいて当該ブロックをオーバライドすることを決定することができる。
図5は、音声起動されたコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムの例示的な動作を示す。システム500は、例えば、データ処理システム105、ネットワーク165および1つまたは複数のコンピューティングデバイスを含むシステム100、200または600で示された1つまたは複数のコンポーネントを含むことができる。システム500は、第1のコンピューティングデバイス404、第2のコンピューティングデバイス406、および第1の出力デバイス408を含むことができる。システム500は第3のコンピューティングデバイス504を含むことができ、第3のコンピューティングデバイス504はコンピューティングデバイス150の1つまたは複数のコンポーネントまたは機能を含むことができる。システム500は第2の出力デバイス506を含むことができ、第2の出力デバイス506は第1の出力デバイス408の1つまたは複数のコンポーネントまたは機能を含むことができる。
図5に示すように、システム500は、第2のコンピューティングデバイス406から距離410だけ離れている第1のコンピューティングデバイス404を含むことができる。第2のコンピューティングデバイス406は、オーディオ、ビデオ、画像または他のコンテンツ第1の出力デバイス408を介して出力するために第1の出力デバイス408に通信可能に接続されることができる。第1のコンピューティングデバイス405、第2のコンピューティングデバイス406および第1の出力デバイス408は、第1の部屋402(例えば、家の部屋、アパート、居住空間、オフィス、ホテル部屋または他の物理空間)に位置づけまたは配置することができる。第1のコンピューティングデバイス404および第2のコンピューティングデバイス406はネットワーク165を介してデータ処理システム105と対話および通信することができる。
システム500は、第1の部屋402に隣接して配置された第2の部屋502を含むことができる。第2の部屋502は、少なくとも部分的に、第1の部屋402から壁512だけ離れていることができる。壁512は開口部514または戸口を含むことができる。第2の部屋502において、システム500は第4のコンピューティングデバイス510、および第2の出力デバイス506に通信可能に接続される第3のコンピューティングデバイス504を含むことができる。第3のコンピューティングデバイス504は第1のコンピューティングデバイス404から距離508だけ離れていることができる。
データ処理システム105は、1つまたは複数のデバイスがリソースを妨害することなく相対的に高いリソース利用値を有する(例えば、オーディオまたはビデオを再生している)環境においてコンテンツまたは通知を1つまたは複数のコンピューティングデバイスで提供することができる。例えば、データ処理システム105は、コンテンツ・アイテムを選択し、第2のコンピューティングデバイス406がオーディオを有するビデオを再生しているので、第2のコンピューティングデバイス406を介して第1の出力デバイス408上の当該コンテンツ・アイテムの提供をブロックすると決定することができる。その代わり、データ処理システム105は、プッシュ通知を介して当該コンテンツ・アイテムまたは通知を、第2のコンピューティングデバイス406から閾値距離内にあるモバイルコンピューティングデバイス(例えば、第1のコンピューティングデバイス404)に提供すると決定することができる。
データ処理システム105は1つまたは複数の近接性検出技術(例えば、サブ可聴音波、Bluetooth(登録商標)、または別々のデバイス上の同一のオーディオベースの入力信号の検出)を使用して、閾値距離内の近傍のコンピューティングデバイスを識別することができる。Bluetooth(登録商標)は、モバイル電話、コンピュータまたは他の電子デバイスのようなコンピューティングデバイスの相互接続のための短波ワイヤレス送信標準を指すことができる。当該短波ワイヤレス送信は2.4から2.485GHzへの無線波を利用することができる。当該範囲は例えば、おおよそ0.5メートル、1メートル、10メートル、100メートル、150メートル、240メートル、またはそれ以上であることができる。例えば、2つの別々のデバイス(例えば、第1のコンピューティングデバイス404および第2のコンピューティングデバイス406)により同一の入力オーディオ信号(またはオーディオコマンド)を検出することは当該デバイスが閾値距離内にあるプロキシ信号であることができる。
データ処理システム105は、コンピューティングデバイスに送信するためのコンテンツ・アイテムまたは通知を識別することができる。当該コンテンツ・アイテムまたは通知を識別したことに応答して、データ処理システム105は1つまたは複数のコンピューティングデバイスが当該閾値距離内にあるかどうかを決定することができる。幾つかの事例では近接性情報は既にデータ処理システム105に格納されていることができ、または広い近接性情報を、当該2つのデバイスがより粒度の細かいデバイス近接性(例えば、サブ可聴音)をテストするのに十分なほど近くないことを識別するために使用することができる。例えば、データ処理システム105はコンピューティングデバイスが閾値距離内にあるかどうかを判定するために、漸進的によりリソース集約的となる近接性検出技術の階層を使用することができる。
幾つかのケースでは、データ処理システム105は、アカウントでリンクされた複数のコンピューティングデバイスを識別することができる。データ処理システム105は次いで、閾値距離内の1組の近傍のデバイスを識別することができる。例えば、図500に示すように、データ処理システム105は、1つまたは複数の近接性検出技術を使用して、第1のコンピューティングデバイス404および第3のコンピューティングデバイス504の間の距離508が当該閾値距離より大きいと判定することができる。データ処理システム105は、ユーザがビデオを第2の出力デバイス506で再生するために第3のコンピューティングデバイス504と対話していると判定することができる。データ処理システム105は、当該ユーザが関与または対話している第3のコンピューティングデバイス504が第1のコンピューティングデバイス404からの当該閾値距離より大きいので、第1のコンピューティングデバイス404を介して提示するためにオーディオ・コンテンツまたは通知を提供しないと決定することができる。
幾つかのケースでは、データ処理システム105は、1つまたは複数のアプリケーションをコンテンツまたは通知を提供するための候補インタフェースとして識別することができる。例えば、データ処理システム105は、第1のコンピューティングデバイス404と統合されたアプリケーションを利用して当該コンテンツまたは通知を提供すると決定することができる。データ処理システム105は、当該コンテンツまたは通知を提供し、当該アプリケーションを複製解除し、リソース利用値または通知構成に基づいてプリプログラムされた階層(例えば、オーディオインタフェースを、テキストのみのインタフェースより高く順位付けできる画像インタフェースより高く順位付けできる)に基づいて候補インタフェース(例えば、アプリケーション)を選択できる第1のコンピューティングデバイス404と統合された複数のアプリケーションを識別することができる。
したがって、データ処理システムは通知を当該選択されたデバイスに送信することができる。この通知はペイロードを含むことができる。例えば、第1のコンピューティングデバイスは、第2の出力デバイス506を介して提示するために第3のコンピューティングデバイス504にストリーミングできる新たなコンテンツを促す通知を、第4のコンピューティングデバイス510(例えば、モバイルコンピューティングデバイス150)に送信することができる。当該ユーザは、当該通知に応答して、第2の出力デバイス506で当該新たなコンテンツをストリーミングすることを開始するのを第4のコンピューティングデバイス510に指令、命令、または示すことができる。
図6は例示的なコンピュータシステム600のブロック図である。当該コンピュータシステムまたはコンピューティングデバイス600は、システム100、またはデータ処理システム105のようなそのコンポーネントを含むことができるかまたはそれを実装するために使用される。コンピューティングシステム600は、情報を通信するためのバス605または他の通信コンポーネントおよび情報を処理するための当該バス605に接続されるプロセッサ610または処理回路を含む。コンピューティングシステム600はまた、1つまたは複数のプロセッサ610または情報を処理するための当該バスに接続される処理回路を含むことができる。コンピューティングシステム600はまた、情報、およびプロセッサ610により実行される命令を格納するための当該バス605に接続されたランダム・アクセスメモリ(RAM)または他の動的記憶デバイスのようなメイン・メモリ615を含む。当該メイン・メモリ615はデータリポジトリ145であることができるかまたはそれを含むことができる。当該メイン・メモリ615をまた、プロセッサ610による命令の実行中に位置情報、一時的変数、または他の中間情報を格納するために使用することができる。コンピューティングシステム600はさらに、プロセッサ610のための静的情報および命令を格納するための当該バス605に接続される読取専用メモリ(ROM)620または他の静的記憶デバイスを含んでもよい。固体状態デバイス、磁気ディスクまたは光ディスクのような記憶デバイス625を当該バス605に接続して、永続的に情報および命令を格納することができる。記憶デバイス625はデータリポジトリ145を含むことができるかまたはその一部であることができる。
コンピューティングシステム600を、当該バス605を介して情報をユーザに表示するために、液晶ディスプレイ、またはアクティブ行列ディスプレイのようなディスプレイ635に接続してもよい。英数字および他のキーを含むキーボードのような入力デバイス630、を、情報およびコマンド選択をプロセッサ610に通信するための当該バス605に接続してもよい。入力デバイス630はタッチ・スクリーンディスプレイ635を含むことができる。入力デバイス630はまた、方向情報およびコマンド選択をプロセッサ610に通信するためのおよび当該ディスプレイ635上のカーソル移動を制御するためのマウス、トラックボール、またはカーソル方向キーのようなカーソル・コントロールを含むことができる。当該ディスプレイ635は、例えば、図1のデータ処理システム105、クライアントコンピューティングデバイス150または他のコンポーネントの一部であることができる。
本明細書で説明したプロセス、システムおよび方法を、プロセッサ610がメイン・メモリ615に含まれる命令の配置を実行したことに応答してコンピューティングシステム600により実装することができる。かかる命令を、メイン・メモリ615に記憶デバイス625のような別のコンピュータ可読媒体から読み込むことができる。メイン・メモリ615に含まれる命令の配置の実行はコンピューティングシステム600に本明細書で説明した例示的なプロセスを実施させる。マルチプロセッシング配置における1つまたは複数のプロセッサをまた、メイン・メモリ615に含まれる命令を実行するために使用することができる。ハードワイヤード回路を、本明細書で説明するシステムおよび方法とともにソフトウェア命令の代わりにまたはそれを組み合わせて使用することができる。本明細書で説明したシステムおよび方法はハードウェア回路およびソフトウェアの任意の特定の組合せに限定されない。
例示的なコンピューティングシステムを図6で説明したが、本明細書で説明した動作を含む主題を、本明細書で開示した構造およびそれらの構造的均等物を含む他のタイプのデジタル電子回路で、またはコンピュータソフトウェア、ファームウェア、またはハードウェアで、またはそれらの1つまたは複数の組合せで実装することができる。
本明細書で説明するシステムがユーザに関する個人情報を収集するか、または個人情報を利用しうる状況に対して、プログラムまたは機能が個人情報(例えば、ユーザのソーシャルネットワーク、ソーシャルアクションまたはアクティビティ、ユーザの嗜好、またはユーザの位置に関する情報)を収集しうるかどうかを制御するか、または、当該ユーザにより関連しうるコンテンツサーバまたは他のデータ処理システムからコンテンツを受信するかどうかまたはその方法を制御するための機会を当該ユーザに与えてもよい。さらに、特定のデータはそれが格納または使用される前に1つまたは複数の方法で匿名化してもよく、その結果個人的に識別可能な情報がパラメータを生成するときに除去される。例えば、ユーザのアイデンティティを匿名化してもよく、その結果個人的に識別可能な情報を当該ユーザに対して決定できず、またはユーザの特定の位置を決定できないように、ユーザの地理的位置を位置情報が取得される場所で(例えば都市、郵便番号、または状態レベルに)一般化してもよい。したがって、当該ユーザは、どのように情報が当該ユーザに関して収集され当該コンテンツサーバにより使用されるかを制御することができる。
本明細書で説明した主題および動作を、本明細書で開示した構造およびそれらの構造的均等物を含むデジタル電子回路で、またはコンピュータソフトウェア、ファームウェア、またはハードウェアで、またはそれらの1つまたは複数の組合せで実装することができる。本明細書で説明した当該主題を、データ処理装置による実行のためにまたは当該装置の動作を制御するために1つまたは複数のコンピュータ記憶媒体で符号化された、1つまたは複数のコンピュータプログラム、例えば、コンピュータプログラム命令の1つまたは複数の回路として実装することができる。代替的にまたは追加として、当該プログラム命令を、人工的に生成された伝播信号、例えば、データ処理装置による実行のために適切な受信器装置に送信するための情報を符号化するために生成されたマシン-生成された電気、光、または電磁気信号で符号化することができる。コンピュータ記憶媒体は、コンピュータ可読記憶デバイス、コンピュータ可読記憶基板、ランダムなまたはシリアル・アクセスメモリ・アレイまたはデバイス、またはそれらの1つまたは複数の組合せであることができ、または、それらに含まれることができる。コンピュータ記憶媒体は伝播信号ではないが、コンピュータ記憶媒体は、人工的に生成された伝播信号で符号化されたコンピュータプログラム命令のソースまたは目的地であることができる。当該コンピュータ記憶媒体はまた、1つまたは複数の別々のコンポーネントまたは媒体(例えば、複数のCD、ディスク、または他の記憶デバイス)であることができ、または、それに含まれることができる。本明細書で説明した動作を、1つまたは複数のコンピュータ可読記憶デバイスに格納されまたは他のソースから受信されたデータに対してデータ処理装置により実施される動作として実装することができる。
「データ処理システム」「コンピューティングデバイス」「コンポーネント」または「データ処理装置」という用語は、例としてプログラム可能プロセッサ、コンピュータ、システム・オン・チップ、または以上のうち複数または組合せを含む、データを処理するための様々な装置、デバイス、およびマシンを包含する。当該装置は、特殊目的論理回路、例えば、FPGA(フィールドプログラム可能ゲート・アレイ)またはASIC(特殊用途向け集積回路)を含むことができる。当該装置はまた、ハードウェアに加えて、着目するコンピュータプログラムに対する実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコル・スタック、データベース管理システム、オペレーティング・システム、クロス・プラットフォームランタイム環境、仮想マシン、またはそれらの1つまたは複数の組合せを構成するコードを含むことができる。当該装置および実行環境は、ウェブサービス、分散コンピューティングおよびグリッド・コンピューティングインフラのような様々な異なるコンピューティングモデルインフラを実現することができる。インタフェース管理コンポーネント140、ダイレクト・アクションAPI135、コンテンツセレクタコンポーネント125、予測コンポーネント120またはNLPコンポーネント110および他のデータ処理システム105コンポーネントは、1つまたは複数のデータ処理装置、システム、コンピューティングデバイス、またはプロセッサを含むかまたは共有ことができる。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリ、スクリプト、またはコードとしても知られる)を、コンパイル型言語またはインタプリタ型言語、宣言型または手続型言語を含む任意の形態のプログラミング言語で書くことができ、スタンドアロンプログラムまたはモジュール、コンポーネント、サブルーチン、オブジェクト、またはコンピューティング環境で使用するのに適した他のユニットを含む任意の形態で展開することができる。コンピュータプログラムはファイルシステム内のファイルに対応することができる。コンピュータプログラムを、他のプログラムまたはデータを保持するファイル部分(例えば、マークアップ言語ドキュメントに格納された1つまたは複数のスクリプト)に、着目するプログラム専用の単一のファイルに、または複数の協調ファイルに(例えば、1つまたは複数のモジュール、サブプログラム、またはコード部分を格納するファイル)格納することができる。コンピュータプログラムを、1つのコンピュータ上でまたは1つのサイトに配置されるかまたは複数のサイトにわたって分散され通信ネットワークにより相互接続された複数のコンピュータ上で実行されるように展開することができる。
本明細書で説明した当該プロセスおよび論理フローを、1つまたは複数のプログラム可能プロセッサが、1つまたは複数のコンピュータプログラム(例えば、データ処理システム105のコンポーネント)を実行して、入力データで動作し出力を生成することでアクションを実施することにより、実施することができる。当該プロセスおよび論理フローはまた、特殊目的論理回路、例えば、FPGA(フィールドプログラム可能ゲート・アレイ)またはASIC(特殊用途向け集積回路)により実施でき、装置をまた特殊目的論理回路、例えば、FPGA(フィールドプログラム可能ゲート・アレイ)またはASIC(特殊用途向け集積回路)として実装することができる。コンピュータプログラム命令およびデータを格納するのに適したデバイスは、例として半導体メモリデバイス、例えば、EPROM、EEPROM、およびフラッシュ・メモリデバイスを含むあらゆる形態の非揮発性メモリ、媒体およびメモリデバイス、磁気ディスク、例えば、内部ハードディスクまたは取外し可能ディスク、磁気光ディスク、およびCDROMおよびDVD-ROMディスクを含む。当該プロセッサおよび当該メモリを特殊目的論理回路で補完するかまたはそれに組み込むことができる。
本明細書で説明する主題を、バックエンドコンポーネントを、例えば、データサーバとして含むか、またはミドルウェアコンポーネント、例えば、アプリケーションサーバを含むか、またはフロントエンドコンポーネント、例えば、ユーザがそれを通じて本明細書で説明した当該主題の実装と対話できるグラフィカルユーザインタフェースまたはウェブブラウザを有するクライアントコンピュータ、または1つまたは複数のかかるバックエンド、ミドルウェア、またはフロントエンドコンポーネントの組合せを含む、コンピューティングシステムで実装することができる。当該システムの当該コンポーネントはデジタルデータ通信、例えば、通信ネットワークの任意の形態または媒体により相互接続することができる。通信ネットワークの例は、ローカル・エリア・ネットワーク(「LAN」)および広帯域ネットワーク(「WAN」)、インターネットワーク(例えば、インターネット)、およびピア・ツー・ピアネットワーク(例えば、アドホックピア・ツー・ピアネットワーク)を含む。
システム100またはシステム600のような当該コンピューティングシステムはクライアントおよびサーバを含むことができる。クライアントおよびサーバは一般に互いから離れており、一般に通信ネットワークを通じて対話する(例えば、ネットワーク165)。クライアントおよびサーバの関係は、当該各コンピュータで実行され互いにクライアント-サーバ関係を有するコンピュータプログラムにより生ずる。幾つかの実装では、サーバは、(例えば、アクションデータ構造またはコンテンツ・アイテムを表すデータ・パケット)を、クライアントデバイスに(例えば、当該クライアントデバイスと対話するユーザにデータを表示しそこからユーザ入力を受信し、またはサービスプロバイダコンピューティングデバイス160またはコンテンツプロバイダコンピューティングデバイス155にデータを表示する目的でクライアントコンピューティングデバイス150に)を送信する。当該クライアントデバイスで生成されたデータ(例えば、当該ユーザ対話の結果)は当該クライアントデバイスから当該サーバでから受信されることができる(例えば、データ処理システム105によりコンピューティングデバイス150またはコンテンツプロバイダコンピューティングデバイス155またはサービスプロバイダコンピューティングデバイス160から受信される)。
動作を当該図面において特定の順序で説明したが、かかる動作を示した特定の順序でまたは逐次的な順序で実施する必要はなく、全ての図示した動作を実施する必要はない。本明細書で説明した動作を異なる順序で実施することができる。
様々なシステムコンポーネントの分離は全ての実装における分離を要求しないが、当該説明したプログラムコンポーネントを単一のハードウェアまたはソフトウェア製品に含めることができる。例えば、NLPコンポーネント110、コンテンツセレクタコンポーネント125、インタフェース管理コンポーネント140、または予測コンポーネント120は、単一のコンポーネント、アプリ、またはプログラム、または1つまたは複数の処理回路を有する論理デバイス、またはデータ処理システム105の1つまたは複数のサーバの一部であることができる。
幾つかの例示的な実装を説明したので、以上は、例示的であり限定的ではなく、例として提示されていることは明らかである。特に、本明細書で提示した例の多くは方法の動作またはシステム要素の特定の組合せを含むが、これらの動作およびこれらの要素を他の方法で組み合わせて同一の目的を実現してもよい。1実装と関連して説明した動作、要素および特徴は他の実装または実装における類似の役割から排除されるものではない。
本明細書で使用したフレーズおよび用語は説明の目的のためであり限定として解釈されるべきではない。「~を含む」、「~を備える」、「~を有する」、「~を包含する」、「~が関与する」、「~により特徴付けられる」、「~の点で特徴付けられる」、およびその本明細書における変形の使用は、その後に列挙された項目、その均等物、および追加の項目、ならびに排他的にその後に列挙された項目からなる代替的な実装を含むことを意味する。1実装では、本明細書で説明するシステムおよび方法は当該説明した要素、動作、またはコンポーネントの1つ、複数の各組合せ、または全てから成る。
本明細書で単一形で参照されるシステムおよび方法の実装または要素または動作に対する任意の言及は複数のこれらの要素を含む実装を含んでもよく、本明細書の任意の実装または要素または動作への複数形の任意の参照は単一の要素のみを含む実装を含んでもよい。単一形または複数形における参照は本明細書で開示したシステムまたは方法、それらのコンポーネント、動作、または要素を単一のまたは複数の構成に限定しようとするものではない。任意の情報、動作または要素に基づく任意の動作または要素への参照は当該動作または要素は任意の情報、動作、または要素に少なくとも部分的に基づく実装を含んでもよい。
本明細書で開示した任意の実装を任意の他の実装または実施形態と組み合わせてもよく「実装」、「幾つかの実装」、「一実装」等への言及は必ずしも相互に排他的ではなく、当該実装と関連して説明した特定の特徴、構造、または特性が少なくとも1つの実装または実施形態に含まれてもよいを示すことを意図している。本明細書で使用した用語は必ずしも全て同一の実装を参照しない。任意の実装を、任意の他の実装と、包含的にまたは排他的に、本明細書で開示した態様および実装と一貫する任意の方式で結合してもよい。
「または」に対する言及は、「または」を用いて説明された任意の用語が当該説明した用語のうち1つ、複数、および全ての何れかを示しうるように、包含的として解釈してもよい。例えば、「‘A’および‘B’のうち少なくとも1つ」への言及は‘A’のみ、‘B’のみ、ならびに‘A’および‘B’の両方を含むことができる。「~を備える」または他のオープンな用語と関連して使用されるかかる言及は追加の項目を含むことができる。
当該図面、詳細な説明または任意の請求項における技術的特徴に参照記号が続く場合、当該参照記号は当該図面、詳細な説明、および特許請求の範囲の明瞭性を高めるために含まれている。したがって、前記参照記号もそれがないことも任意のクレーム要素の範囲に対する限定効果を有さない。
本明細書で説明するシステムおよび方法をその特徴から逸脱せずに他の特定の形態で具体化してもよい。以上の実装は説明したシステムおよび方法の限定ではなく例示的なものである。本明細書で説明するシステムおよび方法の範囲はしたがって以上の説明ではなく添付の特許請求の範囲により示され、添付の特許請求の範囲の均等物の意味と範囲に入る変更がそこに包含される。
105 データ処理システム
110 自然言語プロセッサ・コンポーネント
115 インタフェース
120 予測コンポーネント
125 コンテンツセレクタコンポーネント
130 オーディオ信号生成器コンポーネント
135 ダイレクト・アクションAPI
140 インタフェース管理コンポーネント
145 データリポジトリ
146 パラメータ
147 ポリシ
148 コンテンツデータ
149 テンプレート
150 クライアント・コンピューティング・デバイス
151 センサ
152 トランスデューサ
153 オーディオドライバ
154 スピーカ
155 コンテンツ・プロバイダ・デバイス
160 サービス・プロバイダ・デバイス
161 サービスプロバイダの自然言語プロセッサ・コンポーネント
162 サービスプロバイダインタフェース
165 ネットワーク

Claims (19)

  1. 音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムであって、
    データ処理システムを備え、前記データ処理システムが、
    前記データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することと、
    前記入力オーディオ信号を解析して、要求および前記要求に対応するトリガキーワードを識別することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、第1のアクションデータ構造を生成することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、リアルタイムコンテンツ選択プロセスを介して、コンテンツ・アイテムを選択することと、
    前記クライアントコンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別することと、
    前記第1の候補インタフェースに対する第1のコンピューティングパラメータおよび前記第2の候補インタフェースに対する第2のコンピューティングパラメータを識別することと、
    前記第1のコンピューティングパラメータに基づき、前記第1の候補インタフェースに対する第1のリソース利用値を決定し、前記第2のコンピューティングパラメータならびにバッテリステータス、プロセッサ利用率、メモリ利用率、およびネットワーク帯域幅利用率の少なくとも1つに基づき、前記第2の候補インタフェースに対する第2のリソース利用値を決定することと、
    前記第1のリソース利用値と前記第2のリソース利用値との比較に基づいて、前記コンテンツ・アイテムを提示するために、選択されたインタフェースとして前記第1の候補インタフェースを選択することと、
    前記選択されたインタフェースの前記第1のコンピューティングパラメータに従って、提示するための前記コンテンツ・アイテムを提供することと
    を行うために1つまたは複数のプロセッサとメモリとを備える、システム。
  2. 前記第1の候補インタフェースが、第2のクライアントデバイスのインタフェースである、請求項1に記載のシステム。
  3. 音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムであって、
    データ処理システムを備え、前記データ処理システムが、
    前記データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することと、
    前記入力オーディオ信号を解析して、要求および前記要求に対応するトリガキーワードを識別することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、第1のアクションデータ構造を生成することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、リアルタイムコンテンツ選択プロセスを介して、コンテンツ・アイテムを選択することと、
    前記クライアントコンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別することであって、前記第1の候補インタフェースおよび前記第2の候補インタフェースが、前記クライアントコンピューティングデバイスの2つの異なるインタフェースである、識別することと、
    前記第1の候補インタフェースに対する第1のコンピューティングパラメータおよび前記第2の候補インタフェースに対する第2のコンピューティングパラメータを識別することと、
    前記第1のコンピューティングパラメータと前記第2のコンピューティングパラメータとの比較に基づいて、前記コンテンツ・アイテムを提示するために、選択されたインタフェースとして前記第1の候補インタフェースを選択することと、
    前記選択されたインタフェースの前記第1のコンピューティングパラメータに従って、提示するための前記コンテンツ・アイテムを提供することと
    を行うために1つまたは複数のプロセッサとメモリとを備える、システム。
  4. 前記第1の候補インタフェースから描画するための前記コンテンツ・アイテムまたは前記第1のアクションデータ構造を提供するための前記データ処理システムを備える、請求項3に記載のシステム。
  5. 前記第1のリソース利用値と前記第2のリソース利用値との前記比較に基づき選択された前記選択されたインタフェースと互換性のあるモダリティで配送するために前記コンテンツ・アイテムを変換する
    ための前記データ処理システムを備える、請求項1に記載のシステム。
  6. 音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムであって、
    データ処理システムを備え、前記データ処理システムが、
    前記データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することと、
    前記入力オーディオ信号を解析して、要求および前記要求に対応するトリガキーワードを識別することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、第1のアクションデータ構造を生成することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、リアルタイムコンテンツ選択プロセスを介して、コンテンツ・アイテムを選択することと、
    前記クライアントコンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別することと、
    前記第1の候補インタフェースに対する第1のコンピューティングパラメータおよび前記第2の候補インタフェースに対する第2のコンピューティングパラメータを識別することと、
    前記第1のコンピューティングパラメータと前記第2のコンピューティングパラメータとの比較に基づいて、前記コンテンツ・アイテムを提示するために、選択されたインタフェースとして前記第1の候補インタフェースを選択することと、
    前記選択されたインタフェースの前記第1のコンピューティングパラメータに従って、提示するための前記コンテンツ・アイテムを提供することと
    を行うために1つまたは複数のプロセッサとメモリとを備え、
    前記データ処理システムは、前記クライアントコンピューティングデバイスへの前記第1のアクションデータ構造の送信に続いて、前記選択されたインタフェースを介して、前記クライアントコンピューティングデバイスに前記コンテンツ・アイテムを配送するように構成される、システム。
  7. 前記第1の候補インタフェースが、アカウントにリンクされた前記クライアントコンピューティングデバイスに対応し、かつ、前記第2の候補インタフェースが、前記アカウントにリンクされた第2のクライアントコンピューティングデバイスに対応すると決定する
    ための前記データ処理システムを備える、請求項1に記載のシステム。
  8. 音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムであって、
    データ処理システムを備え、前記データ処理システムが、
    前記データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することと、
    前記入力オーディオ信号を解析して、要求および前記要求に対応するトリガキーワードを識別することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、第1のアクションデータ構造を生成することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、リアルタイムコンテンツ選択プロセスを介して、コンテンツ・アイテムを選択することと、
    前記クライアントコンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別することであって、前記第1の候補インタフェースはディスプレイスクリーンを含み、前記第2の候補インタフェースはオーディオインタフェースを含む、識別することと、
    前記第1の候補インタフェースに対する第1のコンピューティングパラメータおよび前記第2の候補インタフェースに対する第2のコンピューティングパラメータを識別することと、
    前記第1のコンピューティングパラメータと前記第2のコンピューティングパラメータとの比較に基づいて、前記コンテンツ・アイテムを提示するために、選択されたインタフェースとして前記第1の候補インタフェースを選択することと、
    前記選択されたインタフェースの前記第1のコンピューティングパラメータに従って、提示するための前記コンテンツ・アイテムを提供することと
    を行うために1つまたは複数のプロセッサとメモリとを備える、システム。
  9. 音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムであって、
    データ処理システムを備え、前記データ処理システムが、
    前記データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することと、
    前記入力オーディオ信号を解析して、要求および前記要求に対応するトリガキーワードを識別することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、第1のアクションデータ構造を生成することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、リアルタイムコンテンツ選択プロセスを介して、コンテンツ・アイテムを選択することと、
    前記クライアントコンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別することと、
    第3の候補インタフェースを識別することと、
    前記第1の候補インタフェースに対する第1のコンピューティングパラメータおよび前記第2の候補インタフェースに対する第2のコンピューティングパラメータを識別することと、
    前記第3の候補インタフェースに対する第3のコンピューティングパラメータを決定することと、
    前記第1のコンピューティングパラメータ、前記第2のコンピューティングパラメータ、および前記第3のコンピューティングパラメータに基づき、階層を前記第1の候補インタフェース、前記第2の候補インタフェース、および前記第3の候補インタフェースに割り当てることと、
    前記階層に基づいて、前記コンテンツ・アイテムを提示するために、選択されたインタフェースとして前記第1の候補インタフェースを選択することと、
    前記選択されたインタフェースの前記第1のコンピューティングパラメータに従って、提示するための前記コンテンツ・アイテムを提供することと
    を行うために1つまたは複数のプロセッサとメモリとを備える、システム。
  10. 前記階層に基づき、前記選択されたインタフェースを介して、前記コンテンツ・アイテムを前記クライアントコンピューティングデバイスに配送する
    ためのデータ処理システムを備える、請求項9に記載のシステム。
  11. 前記第1の候補インタフェースおよび前記第2の候補インタフェースは、
    ディスプレイスクリーン、オーディオインタフェース、振動インタフェース、電子メールインタフェース、プッシュ通知インタフェース、モバイルコンピューティングデバイスインタフェース、ポータブルコンピューティングデバイスアプリケーション、オンラインドキュメント上のコンテンツスロット、チャットアプリケーション、モバイルコンピューティングデバイスアプリケーション、ラップトップ、時計、仮想現実ヘッドセット、およびスピーカのうち少なくとも1つを含む複数のインタフェースから識別される、請求項1に記載のシステム。
  12. 前記クライアントコンピューティングデバイスが、第1のクライアントコンピューティングデバイスであり、
    前記第1のクライアントコンピューティングデバイスと第2のクライアントコンピューティングデバイスとの間の距離を決定することと、
    前記コンテンツ・アイテムを前記第2のクライアントコンピューティングデバイスへ送信することと
    を行うための前記データ処理システムを備える、請求項1に記載のシステム。
  13. 音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信のシステムであって、
    データ処理システムを備え、前記データ処理システムが、
    前記データ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信することであって、前記クライアントコンピューティングデバイスが、第1のクライアントコンピューティングデバイスである、受信することと、
    前記入力オーディオ信号を解析して、要求および前記要求に対応するトリガキーワードを識別することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、第1のアクションデータ構造を生成することと、
    前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、リアルタイムコンテンツ選択プロセスを介して、コンテンツ・アイテムを選択することと、
    前記クライアントコンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別することと、
    前記第1の候補インタフェースに対する第1のコンピューティングパラメータおよび前記第2の候補インタフェースに対する第2のコンピューティングパラメータを識別することと、
    前記第1のコンピューティングパラメータと前記第2のコンピューティングパラメータとの比較に基づいて、前記コンテンツ・アイテムを提示するために、選択されたインタフェースとして前記第1の候補インタフェースを選択することと、
    前記選択されたインタフェースの前記第1のコンピューティングパラメータに従って、提示するための前記コンテンツ・アイテムを提供することと
    を行うために1つまたは複数のプロセッサとメモリとを備え、
    前記データ処理システムは、自然言語プロセッサ・コンポーネントによる前記入力オーディオ信号の受信から所定の時間期間内に前記第1のクライアントコンピューティングデバイスへ前記コンテンツ・アイテムを送信するように構成される、システム。
  14. 前記第2のコンピューティングパラメータから前記第2の候補インタフェースが利用不可能であると決定する
    ための前記データ処理システムを備える、請求項1に記載のシステム。
  15. 前記コンテンツ・アイテムの指示を有する、描画のための前記第1のアクションデータ構造を、前記クライアントコンピューティングデバイスに提供することであって、前記指示が前記第1の候補インタフェースを識別する、提供すること
    を行うための前記データ処理システムを備える、請求項1に記載のシステム。
  16. 音声起動されたデータ・パケット・ベースのコンピュータ・ネットワーク環境におけるパケット化されたデータのマルチモーダル送信の方法であって、
    1つまたは複数のプロセッサとメモリとを備えるデータ処理システムのインタフェースを介して、クライアントコンピューティングデバイスのセンサにより検出された入力オーディオ信号を含むデータ・パケットを受信するステップと、
    前記データ処理システムによって、前記入力オーディオ信号を解析して、要求および前記要求に対応するトリガキーワードを識別するステップと、
    前記データ処理システムによって、前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、第1のアクションデータ構造を生成するステップと、
    前記データ処理システムによって、自然言語プロセッサ・コンポーネントによって識別された前記要求および前記トリガキーワードのうちの少なくとも1つを受信するステップと、
    前記データ処理システムによって、前記要求および前記トリガキーワードのうちの少なくとも1つに基づき、リアルタイムコンテンツ選択プロセスを介して、コンテンツ・アイテムを選択するステップと、
    前記データ処理システムによって、前記クライアントコンピューティングデバイスの閾値距離内にある第1の候補インタフェースおよび第2の候補インタフェースを識別するステップと、
    前記データ処理システムによって、前記第1の候補インタフェースに対する第1のコンピューティングパラメータおよび前記第2の候補インタフェースに対する第2のコンピューティングパラメータを識別するステップと、
    前記第1のコンピューティングパラメータに基づき、前記第1の候補インタフェースに対する第1のリソース利用値を決定し、前記第2のコンピューティングパラメータならびにバッテリステータス、プロセッサ利用率、メモリ利用率、およびネットワーク帯域幅利用率の少なくとも1つに基づき、前記第2の候補インタフェースに対する第2のリソース利用値を決定することと、
    前記データ処理システムによって、前記第1のリソース利用値と前記第2のリソース利用値との比較に基づいて、前記コンテンツ・アイテムを提示するために、選択されたインタフェースとして前記第1の候補インタフェースを選択するステップと、
    前記データ処理システムによって、前記選択されたインタフェースの前記第1のコンピューティングパラメータに従って、提示するための前記コンテンツ・アイテムを提供するステップと
    を含む、方法。
  17. 前記第1の候補インタフェースが、アカウントにリンクされた前記クライアントコンピューティングデバイスに対応し、かつ、前記第2の候補インタフェースが、前記アカウントにリンクされた第2のクライアントコンピューティングデバイスに対応すると決定するステップを含む、請求項16に記載の方法。
  18. 前記クライアントコンピューティングデバイスが、第1のクライアントコンピューティングデバイスであり、
    前記第1のクライアントコンピューティングデバイスと第2のクライアントコンピューティングデバイスとの間の距離を決定するステップと、
    前記コンテンツ・アイテムを前記第2のクライアントコンピューティングデバイスへ送信するステップと
    を含む、請求項16に記載の方法。
  19. 請求項16から18のうちのいずれか一項に記載の方法を実行するための命令を含むコンピュータプログラム。
JP2019163135A 2016-12-30 2019-09-06 パケット化されたデータのマルチモーダル送信のシステムおよび方法 Active JP7139295B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022141325A JP7554797B2 (ja) 2016-12-30 2022-09-06 パケット化されたデータのマルチモーダル送信のシステムおよび方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US15/395,703 US10032452B1 (en) 2016-12-30 2016-12-30 Multimodal transmission of packetized data
US15/395,703 2016-12-30
US15/674,838 US10708313B2 (en) 2016-12-30 2017-08-11 Multimodal transmission of packetized data
US15/674,838 2017-08-11

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017556912A Division JP6586470B2 (ja) 2016-12-30 2017-08-31 パケット化されたデータのマルチモーダル送信のシステムおよび方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022141325A Division JP7554797B2 (ja) 2016-12-30 2022-09-06 パケット化されたデータのマルチモーダル送信のシステムおよび方法

Publications (2)

Publication Number Publication Date
JP2020042270A JP2020042270A (ja) 2020-03-19
JP7139295B2 true JP7139295B2 (ja) 2022-09-20

Family

ID=59901585

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2017556912A Active JP6586470B2 (ja) 2016-12-30 2017-08-31 パケット化されたデータのマルチモーダル送信のシステムおよび方法
JP2019163135A Active JP7139295B2 (ja) 2016-12-30 2019-09-06 パケット化されたデータのマルチモーダル送信のシステムおよび方法
JP2022141325A Active JP7554797B2 (ja) 2016-12-30 2022-09-06 パケット化されたデータのマルチモーダル送信のシステムおよび方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017556912A Active JP6586470B2 (ja) 2016-12-30 2017-08-31 パケット化されたデータのマルチモーダル送信のシステムおよび方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022141325A Active JP7554797B2 (ja) 2016-12-30 2022-09-06 パケット化されたデータのマルチモーダル送信のシステムおよび方法

Country Status (8)

Country Link
US (3) US10708313B2 (ja)
EP (2) EP3961372B1 (ja)
JP (3) JP6586470B2 (ja)
KR (3) KR101996574B1 (ja)
CN (2) CN115168025B (ja)
AU (2) AU2017384996B2 (ja)
DE (2) DE112017000142T5 (ja)
WO (1) WO2018125307A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678586B (zh) 2016-01-12 2020-09-29 腾讯科技(深圳)有限公司 一种信息扶持方法和装置
CN118200349A (zh) * 2018-03-14 2024-06-14 谷歌有限责任公司 生成基于IoT的通知并提供命令的方法和系统
US11145313B2 (en) * 2018-07-06 2021-10-12 Michael Bond System and method for assisting communication through predictive speech
US11403888B2 (en) * 2018-09-24 2022-08-02 Gojo Industries, Inc. Method and system for using data packet beaconing to determine compliance with protocols
US10777186B1 (en) * 2018-11-13 2020-09-15 Amazon Technolgies, Inc. Streaming real-time automatic speech recognition service
KR102711342B1 (ko) * 2018-11-21 2024-09-27 구글 엘엘씨 서로 다른 데이터 소스들에 대한 질의의 응답들의 통합
US11785386B2 (en) * 2019-01-03 2023-10-10 Harman International Industries, Incorporated Multistep sound preference determination
EP3912024A1 (en) * 2019-05-06 2021-11-24 Google LLC Generating and updating voice-based software applications using application templates
US11361066B2 (en) * 2019-05-06 2022-06-14 Google Llc Secure digital assistant integration in web pages
US11429793B2 (en) * 2019-05-28 2022-08-30 Dell Products L.P. Site ambient audio collection
CN112783954B (zh) * 2019-11-06 2024-04-05 北京金山云网络技术有限公司 数据访问方法、装置及服务器
US11083036B1 (en) * 2020-05-27 2021-08-03 Lenovo (Singapore) Pte. Ltd. Vehicle selection of device to use to execute function
CN112735462B (zh) * 2020-12-30 2024-05-31 科大讯飞股份有限公司 分布式麦克风阵列的降噪方法和语音交互方法
DE112022002775T5 (de) 2021-05-27 2024-04-04 Sony Group Corporation Informationsverarbeitungseinrichtung, informationsverarbeitungsverfahren und informationsverarbeitungsprogramm
US12046234B1 (en) * 2021-06-28 2024-07-23 Amazon Technologies, Inc. Predicting on-device command execution

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236324A (ja) 2005-02-22 2006-09-07 Samsung Electronics Co Ltd ホームネットワークシステムおよびそのコンテンツ伝送方法
US20120054613A1 (en) 2010-08-30 2012-03-01 Samsung Electronics Co., Ltd. Method and apparatus to process audio signal
JP2013540306A (ja) 2010-09-17 2013-10-31 トムソン ライセンシング 通信方法及び通信システム
JP2015001815A (ja) 2013-06-14 2015-01-05 西日本電信電話株式会社 デジタルサイネージシステム
WO2015133022A1 (ja) 2014-03-03 2015-09-11 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2016111406A (ja) 2014-12-02 2016-06-20 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
JP2016519805A (ja) 2013-03-14 2016-07-07 ロウルズ リミテッド ライアビリティ カンパニー 複数のデバイス上でコンテンツを提供すること
WO2016158792A1 (ja) 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム

Family Cites Families (266)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04287556A (ja) 1991-03-18 1992-10-13 Nippon Telegr & Teleph Corp <Ntt> 通信端末探索方法
AU684872B2 (en) 1994-03-10 1998-01-08 Cable And Wireless Plc Communication system
JP2775140B2 (ja) 1994-03-18 1998-07-16 株式会社エイ・ティ・アール人間情報通信研究所 パターン認識方法、音声認識方法および音声認識装置
US5724521A (en) 1994-11-03 1998-03-03 Intel Corporation Method and apparatus for providing electronic advertisements to end users in a consumer best-fit pricing manner
US5835061A (en) 1995-06-06 1998-11-10 Wayport, Inc. Method and apparatus for geographic-based communications service
US6259405B1 (en) 1995-06-06 2001-07-10 Wayport, Inc. Geographic based communications service
US5740549A (en) 1995-06-12 1998-04-14 Pointcast, Inc. Information and advertising distribution system and method
US6026368A (en) 1995-07-17 2000-02-15 24/7 Media, Inc. On-line interactive system and method for providing content and advertising information to a targeted set of viewers
US5675788A (en) 1995-09-15 1997-10-07 Infonautics Corp. Method and apparatus for generating a composite document on a selected topic from a plurality of information sources
GB2305747A (en) 1995-09-30 1997-04-16 Ibm Load balancing of connections to parallel servers
JP2001525951A (ja) 1995-12-08 2001-12-11 テルコーディア テクノロジーズ インコーポレイテッド コンピュータ・ネットワークにおいて、広告を設置する方法およびシステム
US5801413A (en) 1995-12-19 1998-09-01 Micron Technology, Inc. Container-shaped bottom electrode for integrated circuit capacitor with partially rugged surface
US5848397A (en) 1996-04-19 1998-12-08 Juno Online Services, L.P. Method and apparatus for scheduling the presentation of messages to computer users
US5850433A (en) 1996-05-01 1998-12-15 Sprint Communication Co. L.P. System and method for providing an on-line directory service
US6185427B1 (en) 1996-09-06 2001-02-06 Snaptrack, Inc. Distributed satellite position system processing and application network
US5948061A (en) 1996-10-29 1999-09-07 Double Click, Inc. Method of delivery, targeting, and measuring advertising over networks
US6078914A (en) 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US6044376A (en) 1997-04-24 2000-03-28 Imgis, Inc. Content stream analysis
US6144944A (en) 1997-04-24 2000-11-07 Imgis, Inc. Computer system for efficiently selecting and providing information
US7039599B2 (en) 1997-06-16 2006-05-02 Doubleclick Inc. Method and apparatus for automatic placement of advertising
US6600930B1 (en) 1997-07-11 2003-07-29 Sony Corporation Information provision system, information regeneration terminal, and server
JPH1165950A (ja) 1997-08-15 1999-03-09 Sony Corp 情報通信方法、情報通信システム、携帯無線通信端末およびサーバ装置
US5930773A (en) 1997-12-17 1999-07-27 Avista Advantage, Inc. Computerized resource accounting methods and systems, computerized utility management methods and systems, multi-user utility management methods and systems, and energy-consumption-based tracking methods and systems
EP0930758A3 (en) 1998-01-16 2003-10-15 Kabushiki Kaisha Toshiba A distributed network computing system
JPH11265347A (ja) 1998-01-16 1999-09-28 Toshiba Corp 分散ネットワークコンピューティングシステム、及びこのシステムに用いられる情報交換装置、情報交換方法、並びに情報交換方法のプログラム情報を格納したコンピュータ読取り可能な記憶媒体
US6647257B2 (en) 1998-01-21 2003-11-11 Leap Wireless International, Inc. System and method for providing targeted messages based on wireless mobile location
US6286005B1 (en) 1998-03-11 2001-09-04 Cannon Holdings, L.L.C. Method and apparatus for analyzing data and advertising optimization
US20030154072A1 (en) 1998-03-31 2003-08-14 Scansoft, Inc., A Delaware Corporation Call analysis
US20070294229A1 (en) 1998-05-28 2007-12-20 Q-Phrase Llc Chat conversation methods traversing a provisional scaffold of meanings
US6167382A (en) 1998-06-01 2000-12-26 F.A.C. Services Group, L.P. Design and production of print advertising and commercial display materials over the Internet
US6731612B1 (en) 1998-06-29 2004-05-04 Microsoft Corporation Location-based web browsing
US6826593B1 (en) 1998-09-01 2004-11-30 Lucent Technologies Inc. Computer implemented method and apparatus for fulfilling a request for information content with a user-selectable version of a file containing that information content
US6189003B1 (en) 1998-10-23 2001-02-13 Wynwyn.Com Inc. Online business directory with predefined search template for facilitating the matching of buyers to qualified sellers
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
HK1025466A2 (en) 1999-01-15 2000-10-05 Imandi Corp Extraction of vendor information from web sites
US6332127B1 (en) 1999-01-28 2001-12-18 International Business Machines Corporation Systems, methods and computer program products for providing time and location specific advertising via the internet
US6985882B1 (en) 1999-02-05 2006-01-10 Directrep, Llc Method and system for selling and purchasing media advertising over a distributed communication network
US6269361B1 (en) 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US7035812B2 (en) 1999-05-28 2006-04-25 Overture Services, Inc. System and method for enabling multi-element bidding for influencing a position on a search result list generated by a computer network search engine
US7844594B1 (en) 1999-06-18 2010-11-30 Surfwax, Inc. Information search, retrieval and distillation into knowledge objects
US6275806B1 (en) 1999-08-31 2001-08-14 Andersen Consulting, Llp System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
US6363065B1 (en) 1999-11-10 2002-03-26 Quintum Technologies, Inc. okApparatus for a voice over IP (voIP) telephony gateway and methods for use therein
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6446045B1 (en) 2000-01-10 2002-09-03 Lucinda Stone Method for using computers to facilitate and control the creating of a plurality of functions
AU2001234986A1 (en) 2000-02-11 2001-08-20 Wynwyn.Com, Inc. Online business directory with thesaurus and search template
US6401075B1 (en) 2000-02-14 2002-06-04 Global Network, Inc. Methods of placing, purchasing and monitoring internet advertising
JP2001236410A (ja) 2000-02-21 2001-08-31 Kyota Iwaoka 相互接続型広告配信方法およびそのシステム
JP2002132827A (ja) 2000-03-06 2002-05-10 Katsuyoshi Nagashima インターネット情報からの広告宣伝情報自動検索装置及び広告宣伝情報自動検索方法
US7376729B2 (en) 2000-03-23 2008-05-20 Freebit Co., Ltd. System for internet connections, method for calculating connection fees for network connection services, billing system for network connection services, and system for network connection management
JP2002007253A (ja) 2000-06-19 2002-01-11 Freebit.Com Co Ltd インターネット接続システム、インターネット利用者への情報提供システム、及びインターネット利用者への情報提供方法
JP2001282982A (ja) 2000-03-28 2001-10-12 Hisahiro Negi Webマーケティングシステム
US7155729B1 (en) * 2000-03-28 2006-12-26 Microsoft Corporation Method and system for displaying transient notifications
JP2001297256A (ja) 2000-04-12 2001-10-26 Kuku:Kk サーバーコンピュータの制御方法
JP2001312646A (ja) 2000-04-28 2001-11-09 Occs Planning Corp 屋外広告における広告媒体賃貸システム
JP2001312649A (ja) 2000-05-01 2001-11-09 Adc Technology Kk 広告システム及び記録媒体
WO2001089183A1 (en) 2000-05-16 2001-11-22 John Taschereau Method and system for providing geographically targeted information and advertising
KR20000054165A (ko) 2000-05-24 2000-09-05 김병남 위치정보를 이용한 인터넷 광고 시스템 및 그 방법
US6684249B1 (en) 2000-05-26 2004-01-27 Sonicbox, Inc. Method and system for adding advertisements over streaming audio based upon a user profile over a world wide area network of computers
EP1286288A4 (en) 2000-05-31 2005-08-31 Ntt Docomo Inc METHOD AND SYSTEM FOR DISTRIBUTING ADVERTISEMENTS ON A NETWORK
JP4612158B2 (ja) 2000-06-29 2011-01-12 株式会社東芝 移動通信端末装置
AU2001273111A1 (en) 2000-06-30 2002-01-14 Anthony Romito Method and apparatus for a GIS based search engine utilizing real time advertising
US20040043770A1 (en) 2000-07-10 2004-03-04 Assaf Amit Broadcast content over cellular telephones
US20020082938A1 (en) 2000-07-19 2002-06-27 Dana Borger Systems, methods and computer program products that facilitate and account for call-through advertising between advertisers and users of web-enabled telephone devices
JP2002073666A (ja) 2000-08-29 2002-03-12 Sharp Corp 情報提供システム及び情報提供サーバ及び情報受信端末並びに情報提供プログラムを記録した記録媒体
US6857007B1 (en) 2000-08-30 2005-02-15 Bloomfield Enterprises, Llc Personal digital assistant facilitated communication system
US20020029226A1 (en) 2000-09-05 2002-03-07 Gang Li Method for combining data with maps
WO2002023444A1 (en) 2000-09-15 2002-03-21 Mobliss, Inc. System for conducting user-specific promotional campaigns using multiple communications device platforms
JP2002099822A (ja) 2000-09-26 2002-04-05 Minoru Sato 広告システム、広告方法および情報記憶媒体
US6983331B1 (en) 2000-10-17 2006-01-03 Microsoft Corporation Selective display of content
JP2002140359A (ja) 2000-11-01 2002-05-17 Masayuki Hasegawa 広告配信システム、広告コンテンツおよび広告配信装置ならびに広告配信方法
CA2428518A1 (en) 2000-11-10 2002-12-19 In2M Corporation Methods and systems for electronic coupon issuance transmission and management
US7376640B1 (en) 2000-11-14 2008-05-20 At&T Delaware Intellectual Property, Inc. Method and system for searching an information retrieval system according to user-specified location information
JP2002169744A (ja) 2000-12-04 2002-06-14 Ntt Me Corp 付加情報配信装置及び付加情報配信方法
JP2002170027A (ja) 2000-12-04 2002-06-14 Standard J:Kk 広告配信事業およびシステム
US7406434B1 (en) 2000-12-15 2008-07-29 Carl Meyer System and method for improving the performance of electronic media advertising campaigns through multi-attribute analysis and optimization
US6956816B1 (en) 2001-02-15 2005-10-18 Extreme Networks Fault tolerant automatic protection switching for distributed routers
JP2002245048A (ja) 2001-02-20 2002-08-30 Mitsubishi Electric Corp 画像検索方法および画像検索装置
US20030032409A1 (en) 2001-03-16 2003-02-13 Hutcheson Stewart Douglas Method and system for distributing content over a wireless communications system
JP2002288541A (ja) 2001-03-28 2002-10-04 Ntt Comware Corp 広告料課金システム、そのプログラムおよびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体
US6993326B2 (en) 2001-04-02 2006-01-31 Bellsouth Intellectual Property Corporation System and method for providing short message targeted advertisements over a wireless communications network
US7970648B2 (en) 2001-04-27 2011-06-28 Accenture Global Services Limited Advertising campaign and business listing management for a location-based services system
US7698228B2 (en) 2001-04-27 2010-04-13 Accenture Llp Tracking purchases in a location-based services system
US8402088B2 (en) 2001-06-11 2013-03-19 Apple Inc. Establishing telephone calls at a specified future time using a URI and a web-based telephony application
US8538803B2 (en) 2001-06-14 2013-09-17 Frank C. Nicholas Method and system for providing network based target advertising and encapsulation
US7089264B1 (en) 2001-06-22 2006-08-08 Navteq North America, Llc Geographic database organization that facilitates location-based advertising
US20030008661A1 (en) 2001-07-03 2003-01-09 Joyce Dennis P. Location-based content delivery
JP2003016348A (ja) 2001-07-04 2003-01-17 Nec Commun Syst Ltd 広告配信方法
KR100552468B1 (ko) 2001-07-19 2006-02-15 삼성전자주식회사 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법
AU2002321795A1 (en) 2001-07-27 2003-02-17 Quigo Technologies Inc. System and method for automated tracking and analysis of document usage
JP2003044126A (ja) 2001-08-02 2003-02-14 Mitsui Eng & Shipbuild Co Ltd リモートメンテナンスシステムおよび在庫管理システム
US7043471B2 (en) 2001-08-03 2006-05-09 Overture Services, Inc. Search engine account monitoring
US7243024B2 (en) 2001-08-11 2007-07-10 Endicott William L Computer-implemented system and method for wayfinding
US7120429B2 (en) 2001-08-13 2006-10-10 Qualcomm Inc. System and method for licensing applications on wireless devices over a wireless network
US7920682B2 (en) 2001-08-21 2011-04-05 Byrne William J Dynamic interactive voice interface
US8214342B2 (en) 2001-08-23 2012-07-03 Michael Meiresonne Supplier identification and locator system and method
US7778872B2 (en) 2001-09-06 2010-08-17 Google, Inc. Methods and apparatus for ordering advertisements based on performance information and price information
JP2003122781A (ja) 2001-10-17 2003-04-25 Super Contents Distrubutions Ltd 商品情報配信方法
KR100794424B1 (ko) * 2001-11-01 2008-01-16 엘지노텔 주식회사 오디오 패킷 스위칭 시스템 및 방법
JP2003223591A (ja) 2001-11-20 2003-08-08 Matsushita Electric Ind Co Ltd 電子商取引サービスシステム、電子商取引端末、電子商取引サービスサーバ並びにコンピュータプログラム
US7295996B2 (en) 2001-11-30 2007-11-13 Skinner Christopher J Automated web ranking bid management account system
KR200269767Y1 (ko) 2001-12-07 2002-03-25 김동춘 의자 조립용 파이프 연결부재
US7016343B1 (en) 2001-12-28 2006-03-21 Cisco Technology, Inc. PSTN call routing control features applied to a VoIP
JP4074106B2 (ja) 2002-03-07 2008-04-09 富士通株式会社 広告送信方法及び装置
WO2003081391A2 (en) 2002-03-19 2003-10-02 Mapinfo Corporation Location based service provider
US20060149624A1 (en) 2004-12-30 2006-07-06 Shumeet Baluja Generating and/or serving local area advertisements, such as advertisements for devices with call functionality
US7136875B2 (en) 2002-09-24 2006-11-14 Google, Inc. Serving advertisements based on content
JP2003337893A (ja) 2002-05-20 2003-11-28 Sharp Corp 情報配信装置、情報配信方法、情報配信プログラムおよび情報配信プログラムを記録したコンピュータ読取り可能な記録媒体
US8611919B2 (en) 2002-05-23 2013-12-17 Wounder Gmbh., Llc System, method, and computer program product for providing location based services and mobile e-commerce
JP2004032037A (ja) 2002-06-21 2004-01-29 Hitachi Ltd 情報受発信システム、それに使用される情報処理装置及び携帯端末
US20040044571A1 (en) 2002-08-27 2004-03-04 Bronnimann Eric Robert Method and system for providing advertising listing variance in distribution feeds over the internet to maximize revenue to the advertising distributor
US7617122B2 (en) 2002-08-28 2009-11-10 International Business Machines Corporation Targeted online marketing
US20040059712A1 (en) 2002-09-24 2004-03-25 Dean Jeffrey A. Serving advertisements using information associated with e-mail
US20070088609A1 (en) 2002-10-25 2007-04-19 Medio Systems, Inc. Optimizer For Selecting Supplemental Content Based on Content Productivity of a Document
US7260066B2 (en) 2002-10-31 2007-08-21 Conexant Systems, Inc. Apparatus for link failure detection on high availability Ethernet backplane
US7263086B2 (en) 2002-11-12 2007-08-28 Nokia Corporation Method and system for providing location-based services in multiple coverage area environments
US7818207B1 (en) 2003-01-10 2010-10-19 Google, Inc. Governing the serving of advertisements based on a cost target
US7007014B2 (en) 2003-04-04 2006-02-28 Yahoo! Inc. Canonicalization of terms in a keyword-based presentation system
US7826907B2 (en) 2003-07-31 2010-11-02 Hewlett-Packard Development Company, L.P. Fortuitous combinations of ad-hoc available sets of different electronic devices to respond to user jobs
KR200339736Y1 (ko) 2003-09-16 2004-01-31 고재석 초음파를 이용한 에너지 활성화 및 수처리 장치
WO2005031589A1 (en) 2003-09-23 2005-04-07 Marchex, Inc. Performance-based online advertising system and method
US20050076017A1 (en) 2003-10-03 2005-04-07 Rein Douglas R. Method and system for scheduling search terms in a search engine account
US7120235B2 (en) 2003-10-06 2006-10-10 Ingenio, Inc. Method and apparatus to provide pay-per-call performance based advertising
US20050086104A1 (en) 2003-10-17 2005-04-21 Mcfadden Jeffrey A. Delivery of advertising to telephone users
US20120102020A1 (en) 2003-12-04 2012-04-26 Mark Pearson Generating Search Result Listing with Anchor Text Based Description of Website Corresponding to Search Result
US20050144065A1 (en) 2003-12-19 2005-06-30 Palo Alto Research Center Incorporated Keyword advertisement management with coordinated bidding among advertisers
US20050137939A1 (en) 2003-12-19 2005-06-23 Palo Alto Research Center Incorporated Server-based keyword advertisement management
US20050144069A1 (en) 2003-12-23 2005-06-30 Wiseman Leora R. Method and system for providing targeted graphical advertisements
US8312014B2 (en) 2003-12-29 2012-11-13 Yahoo! Inc. Lateral search
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US20050187823A1 (en) 2004-02-23 2005-08-25 Howes Jeffrey V. Method and system for geographically-targeted internet advertising
US20050225810A1 (en) 2004-04-02 2005-10-13 Sun Fang C Image retrieval and memory-accessing business card scanning device
US7428529B2 (en) 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
US7853255B2 (en) 2004-04-16 2010-12-14 Broadcom Corporation Digital personal assistance via a broadband access gateway
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
US20060004627A1 (en) 2004-06-30 2006-01-05 Shumeet Baluja Advertisements for devices with call functionality, such as mobile phones
US7613637B2 (en) 2004-12-19 2009-11-03 Bcks Participant node for a searchable distributed information network
US7448023B2 (en) 2005-02-25 2008-11-04 Microsoft Corporation Method and system for verifying rule compliance of an application object
US7720684B2 (en) 2005-04-29 2010-05-18 Nuance Communications, Inc. Method, apparatus, and computer program product for one-step correction of voice interaction
US8099327B2 (en) 2005-06-01 2012-01-17 Google Inc. Auctioneer
US20060287919A1 (en) 2005-06-02 2006-12-21 Blue Mustard Llc Advertising search system and method
US20060274869A1 (en) 2005-06-07 2006-12-07 Yahoo! Inc. Dynamically generating content based on capabilities of a mobile device
FR2887102A1 (fr) 2005-06-13 2006-12-15 France Telecom Procede de modification du mode de service demande par un terminal de communication en fonction d'au moins un parametre de configuration et/ou representatif de la qualite de service reseau
US7672931B2 (en) 2005-06-30 2010-03-02 Microsoft Corporation Searching for content using voice search queries
US20070027760A1 (en) 2005-07-29 2007-02-01 Collins Robert J System and method for creating and providing a user interface for displaying advertiser defined groups of advertisement campaign information
US8238888B2 (en) 2006-09-13 2012-08-07 Jumptap, Inc. Methods and systems for mobile coupon placement
US8195133B2 (en) 2005-09-14 2012-06-05 Jumptap, Inc. Mobile dynamic advertisement creation and placement
US7747614B2 (en) 2005-10-31 2010-06-29 Yahoo! Inc. Difference control for generating and displaying a difference result set from the result sets of a plurality of search engines
US7904505B2 (en) 2005-11-02 2011-03-08 At&T Intellectual Property I, L.P. Service to push author-spoken audio content with targeted audio advertising to users
HRP20050953B1 (en) 2005-11-08 2012-04-30 T-Mobile Hrvatska D.O.O. Base station system performance measurement system in a gsm radio communicatioon network
US7624101B2 (en) 2006-01-31 2009-11-24 Google Inc. Enhanced search results
US8903053B2 (en) 2006-02-10 2014-12-02 Nuance Communications, Inc. Mass-scale, user-independent, device-independent voice messaging system
US20080052219A1 (en) 2006-03-31 2008-02-28 Combinenet, Inc. System for and method of expressive auctions of user events
JP4887911B2 (ja) 2006-05-31 2012-02-29 船井電機株式会社 電子機器
US8401726B2 (en) 2006-07-20 2013-03-19 The Boeing Company Maintenance interval determination and optimization tool and method
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP4188989B2 (ja) 2006-09-15 2008-12-03 本田技研工業株式会社 音声認識装置、音声認識方法、及び音声認識プログラム
US8880402B2 (en) 2006-10-28 2014-11-04 General Motors Llc Automatically adapting user guidance in automated speech recognition
US20090013255A1 (en) * 2006-12-30 2009-01-08 Matthew John Yuschik Method and System for Supporting Graphical User Interfaces
US7877384B2 (en) 2007-03-01 2011-01-25 Microsoft Corporation Scoring relevance of a document based on image text
US8843376B2 (en) 2007-03-13 2014-09-23 Nuance Communications, Inc. Speech-enabled web content searching using a multimodal browser
US7974888B2 (en) 2007-03-30 2011-07-05 Amazon Technologies, Inc. Services for providing item association data
US8583592B2 (en) 2007-03-30 2013-11-12 Innography, Inc. System and methods of searching data sources
US20080249855A1 (en) 2007-04-04 2008-10-09 Yahoo! Inc. System for generating advertising creatives
US8041709B2 (en) 2007-05-25 2011-10-18 Microsoft Corporation Domain collapsing of search results
GB2442818B (en) 2007-06-11 2008-11-05 Cvon Innovations Ltd Methodologies and systems for determining mobile device capabilities
US20090006145A1 (en) 2007-06-27 2009-01-01 Google Inc. Booking Advertising Campaigns
US8175914B1 (en) 2007-07-30 2012-05-08 Google Inc. Automatic adjustment of advertiser bids to equalize cost-per-conversion among publishers for an advertisement
US20090210491A1 (en) 2008-02-20 2009-08-20 Microsoft Corporation Techniques to automatically identify participants for a multimedia conference event
US8068604B2 (en) 2008-12-19 2011-11-29 Computer Product Introductions Corporation Method and system for event notifications
US8255224B2 (en) 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US20090240670A1 (en) 2008-03-20 2009-09-24 Yahoo! Inc. Uniform resource identifier alignment
US8504365B2 (en) 2008-04-11 2013-08-06 At&T Intellectual Property I, L.P. System and method for detecting synthetic speaker verification
US7904460B2 (en) 2008-04-23 2011-03-08 Microsoft Corporation Determining computer information from processor properties
US9978365B2 (en) * 2008-10-31 2018-05-22 Nokia Technologies Oy Method and system for providing a voice interface
US8489599B2 (en) * 2008-12-02 2013-07-16 Palo Alto Research Center Incorporated Context and activity-driven content delivery and interaction
US8145561B1 (en) 2009-01-05 2012-03-27 Sprint Communications Company L.P. Phone usage pattern as credit card fraud detection trigger
US8346709B2 (en) 2009-02-05 2013-01-01 Google Inc. Determining conversion probability using session metrics
US8326637B2 (en) * 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8019746B2 (en) 2009-03-02 2011-09-13 Yahoo! Inc. Optimized search result columns on search results pages
JP5735480B2 (ja) 2009-03-20 2015-06-17 アド−バンテージ ネットワークス,インコーポレイテッド コンテンツを検索、選択、及び表示する方法及びシステム
EP2438540A1 (en) 2009-06-01 2012-04-11 AOL Inc. Providing suggested web search queries based on click data of stored search queries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) * 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110022460A1 (en) 2009-07-22 2011-01-27 Yahoo! Inc. Explicit online advertising exposure terms
GB2476077A (en) 2009-12-10 2011-06-15 Skype Ltd Estimating VoIP call Quality before a call is set up
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8433672B2 (en) 2010-02-17 2013-04-30 GM Global Technology Operations LLC Method and apparatus for vehicle component health prognosis by integrating aging model, usage information and health signatures
JP5084858B2 (ja) 2010-03-16 2012-11-28 ヤフー株式会社 サマリ作成装置、サマリ作成方法及びプログラム
US8630200B2 (en) 2010-06-01 2014-01-14 Meltwater News International Holdings, GmbH Method and apparatus for embedding information in a short URL
US8429110B2 (en) 2010-06-10 2013-04-23 Microsoft Corporation Pattern tree-based rule learning
US20110320114A1 (en) 2010-06-28 2011-12-29 Microsoft Corporation Map Annotation Messaging
WO2012009672A1 (en) 2010-07-16 2012-01-19 Altruik, Inc. System and method for improving webpage indexing and optimization
US20120030015A1 (en) 2010-07-29 2012-02-02 Google Inc. Automatic abstracted creative generation from a web site
US8583795B2 (en) 2010-08-09 2013-11-12 Mskynet Inc. URI service system and method
US8433800B2 (en) 2011-02-28 2013-04-30 Mskynet Inc. Smart link system and method
WO2012040371A1 (en) 2010-09-22 2012-03-29 The Nielsen Company (Us), Llc. Methods and apparatus to determine impressions using distributed demographic information
US8510368B2 (en) 2010-10-20 2013-08-13 Mskynet Inc. Short URI payload-status systems and methods
US20120101776A1 (en) 2010-10-26 2012-04-26 Brower Alfred N Embedded prognostic health management system for aeronautical machines and devices and methods thereof
US9280515B2 (en) 2010-12-03 2016-03-08 Echostar Technologies L.L.C. Provision of alternate content in response to QR code
US9148686B2 (en) 2010-12-20 2015-09-29 Echostar Technologies, Llc Matrix code-based user interface
US10275782B2 (en) 2010-12-28 2019-04-30 Excalibur Ip, Llc Variation of minimum advertisement relevance quality threshold based on search query attributes
WO2012094329A1 (en) 2011-01-05 2012-07-12 Envidient, Inc. System and method for managing media content
US20140019128A1 (en) * 2011-01-05 2014-01-16 Daniel J. RISKIN Voice Based System and Method for Data Input
JP5025808B1 (ja) * 2011-03-31 2012-09-12 株式会社東芝 情報処理装置及び情報処理プログラム
US8578143B2 (en) 2011-05-17 2013-11-05 Apple Inc. Modifying operating parameters based on device use
US9230061B2 (en) * 2011-08-15 2016-01-05 Medcpu, Inc. System and method for text extraction and contextual decision support
US10120877B2 (en) 2011-09-15 2018-11-06 Stephan HEATH Broad and alternative category clustering of the same, similar or different categories in social/geo/promo link promotional data sets for end user display of interactive ad links, coupons, mobile coupons, promotions and sale of products, goods and services integrated with 3D spatial geomapping and mobile mapping and social networking
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
CN103917847B (zh) * 2011-11-10 2017-03-01 三菱电机株式会社 导航装置及方法
US20130124606A1 (en) 2011-11-14 2013-05-16 Boopsie, Inc. Automatic personalization of downloadable mobile apps
US20130144720A1 (en) 2011-12-06 2013-06-06 Yahoo! Inc. System for Advertisement Display
US20130191226A1 (en) 2012-01-20 2013-07-25 Bradley Hopkins Smallwood Pricing and delivery of advertising based on exposure time
US8453058B1 (en) 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9899026B2 (en) 2012-05-31 2018-02-20 Elwha Llc Speech recognition adaptation systems based on adaptation data
US20130339030A1 (en) * 2012-06-13 2013-12-19 Fluential, Llc Interactive spoken dialogue interface for collection of structured data
US9767479B2 (en) 2012-06-25 2017-09-19 Google Inc. System and method for deploying ads based on a content exposure interval
US20140004839A1 (en) * 2012-06-29 2014-01-02 Frederick P. Block Proximity based transfer
US8996299B2 (en) 2012-08-27 2015-03-31 Place Codes, Inc. Geographic coordinates coding software product
US9613160B2 (en) 2012-09-28 2017-04-04 Disney Enterprises, Inc. Client-side web site selection according to device capabilities
JP2014085780A (ja) 2012-10-23 2014-05-12 Samsung Electronics Co Ltd 番組推薦装置及び番組推薦プログラム
US9275637B1 (en) 2012-11-06 2016-03-01 Amazon Technologies, Inc. Wake word evaluation
US8612226B1 (en) 2013-01-28 2013-12-17 Google Inc. Determining advertisements based on verbal inputs to applications on a computing device
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9842489B2 (en) 2013-02-14 2017-12-12 Google Llc Waking other devices for additional data
KR102065045B1 (ko) * 2013-03-15 2020-01-10 엘지전자 주식회사 이동 단말기 및 그것의 제어 방법
US9026176B2 (en) 2013-05-12 2015-05-05 Shyh-Jye Wang Message-triggered voice command interface in portable electronic devices
US9706255B2 (en) 2013-06-05 2017-07-11 Thomson Licensing Method and apparatus for content distribution for multiscreen viewing wherein video program and information related to the video program are transmitted to a second device but not to a first device when the distance between the two devices is greater than a predetermined threshold
US11218434B2 (en) * 2013-06-12 2022-01-04 Google Llc Audio data packet status determination
KR20150031896A (ko) 2013-09-17 2015-03-25 한국전자통신연구원 음성인식장치 및 그 동작방법
US9443527B1 (en) * 2013-09-27 2016-09-13 Amazon Technologies, Inc. Speech recognition capability generation and control
WO2015054240A1 (en) * 2013-10-07 2015-04-16 President And Fellows Of Harvard College Computer implemented method, computer system and software for reducing errors associated with a situated interaction
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US9530416B2 (en) * 2013-10-28 2016-12-27 At&T Intellectual Property I, L.P. System and method for managing models for embedded speech and language processing
CN104683294B (zh) * 2013-11-27 2019-01-18 阿里巴巴集团控股有限公司 一种数据处理方法和系统
US9588635B2 (en) 2013-12-12 2017-03-07 Microsoft Technology Licensing, Llc Multi-modal content consumption model
KR102201634B1 (ko) * 2013-12-27 2021-01-12 엘지전자 주식회사 단말기 및 그 동작 방법
US20180322536A1 (en) 2014-01-14 2018-11-08 Google Inc. Resource utilization based cross device transmissions
US9589564B2 (en) 2014-02-05 2017-03-07 Google Inc. Multiple speech locale-specific hotword classifiers for selection of a speech locale
KR20150092996A (ko) 2014-02-06 2015-08-17 삼성전자주식회사 디스플레이 장치 및 이를 이용한 전자 장치의 제어 방법
US9153106B1 (en) 2014-07-10 2015-10-06 Google Inc. Automatically activated visual indicators on computing device
WO2016014026A1 (en) 2014-07-22 2016-01-28 Nuance Communications, Inc. Systems and methods for speech-based searching of content repositories
US9747011B2 (en) * 2014-09-16 2017-08-29 Google Inc. Continuation of playback of media content by different output devices
US9424841B2 (en) 2014-10-09 2016-08-23 Google Inc. Hotword detection on multiple devices
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
CN104916285A (zh) * 2014-10-13 2015-09-16 江苏华音信息科技有限公司 全自动外语语音现场控制汽车驾驶的控制器装置
CA2869245A1 (en) 2014-10-27 2016-04-27 MYLE Electronics Corp. Mobile thought catcher system
KR101643560B1 (ko) 2014-12-17 2016-08-10 현대자동차주식회사 음성 인식 장치, 그를 가지는 차량 및 그 방법
US9903938B2 (en) 2015-02-03 2018-02-27 Nokia Technologies Oy Radio and audio localization
US9632664B2 (en) 2015-03-08 2017-04-25 Apple Inc. Devices, methods, and graphical user interfaces for manipulating user interface objects with visual and/or haptic feedback
US10165091B1 (en) 2015-04-03 2018-12-25 Sprint Communications Company L.P. User device parameter allocation based on internet protocol version capabilities
KR20170028628A (ko) 2015-09-04 2017-03-14 삼성전자주식회사 음성인식장치, 음성인식장치의 구동방법 및 컴퓨터 판독가능 기록매체
US20170092278A1 (en) 2015-09-30 2017-03-30 Apple Inc. Speaker recognition
CN106558993A (zh) 2015-09-30 2017-04-05 株式会社村田制作所 Dc/dc转换装置
US9542941B1 (en) 2015-10-01 2017-01-10 Lenovo (Singapore) Pte. Ltd. Situationally suspending wakeup word to enable voice command input
US9747926B2 (en) 2015-10-16 2017-08-29 Google Inc. Hotword recognition
US9928840B2 (en) 2015-10-16 2018-03-27 Google Llc Hotword recognition
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US9653075B1 (en) 2015-11-06 2017-05-16 Google Inc. Voice commands across devices
US20170289596A1 (en) 2016-03-31 2017-10-05 Microsoft Technology Licensing, Llc Networked public multi-screen content delivery
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US20180133900A1 (en) * 2016-11-15 2018-05-17 JIBO, Inc. Embodied dialog and embodied speech authoring tools for use with an expressive social robot
US20180144308A1 (en) * 2016-11-23 2018-05-24 Dropbox, Inc. Natural language calendar
US20180293221A1 (en) * 2017-02-14 2018-10-11 Microsoft Technology Licensing, Llc Speech parsing with intelligent assistant
US11200894B2 (en) * 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236324A (ja) 2005-02-22 2006-09-07 Samsung Electronics Co Ltd ホームネットワークシステムおよびそのコンテンツ伝送方法
US20120054613A1 (en) 2010-08-30 2012-03-01 Samsung Electronics Co., Ltd. Method and apparatus to process audio signal
JP2013540306A (ja) 2010-09-17 2013-10-31 トムソン ライセンシング 通信方法及び通信システム
JP2016519805A (ja) 2013-03-14 2016-07-07 ロウルズ リミテッド ライアビリティ カンパニー 複数のデバイス上でコンテンツを提供すること
JP2015001815A (ja) 2013-06-14 2015-01-05 西日本電信電話株式会社 デジタルサイネージシステム
WO2015133022A1 (ja) 2014-03-03 2015-09-11 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2016111406A (ja) 2014-12-02 2016-06-20 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
WO2016158792A1 (ja) 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム

Also Published As

Publication number Publication date
CN115168025A (zh) 2022-10-11
AU2017384996B2 (en) 2020-05-14
US20220353303A1 (en) 2022-11-03
KR20180087836A (ko) 2018-08-02
KR102098847B1 (ko) 2020-04-08
US11930050B2 (en) 2024-03-12
US20200322396A1 (en) 2020-10-08
CN108541312A (zh) 2018-09-14
KR20200007095A (ko) 2020-01-21
KR20190079716A (ko) 2019-07-05
CN115168025B (zh) 2023-10-03
AU2017384996A1 (en) 2019-05-23
EP3360041A1 (en) 2018-08-15
EP3961372B1 (en) 2024-08-07
DE212017000286U1 (de) 2019-08-20
JP7554797B2 (ja) 2024-09-20
AU2020217377A1 (en) 2020-09-03
US10708313B2 (en) 2020-07-07
US11381609B2 (en) 2022-07-05
DE112017000142T5 (de) 2018-09-13
KR102068271B1 (ko) 2020-01-20
US20180191788A1 (en) 2018-07-05
WO2018125307A1 (en) 2018-07-05
EP3961372A1 (en) 2022-03-02
JP6586470B2 (ja) 2019-10-02
EP3360041B1 (en) 2022-02-23
AU2020217377B2 (en) 2021-08-12
JP2023002503A (ja) 2023-01-10
JP2019510247A (ja) 2019-04-11
KR101996574B1 (ko) 2019-07-04
JP2020042270A (ja) 2020-03-19

Similar Documents

Publication Publication Date Title
JP7139295B2 (ja) パケット化されたデータのマルチモーダル送信のシステムおよび方法
US11087760B2 (en) Multimodal transmission of packetized data
US11705121B2 (en) Multimodal transmission of packetized data
US11798555B2 (en) Detection of duplicate packetized data for selective transmission into one of a plurality of a user&#39;s devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220907

R150 Certificate of patent or registration of utility model

Ref document number: 7139295

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150