JP2021533398A - 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード - Google Patents
自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード Download PDFInfo
- Publication number
- JP2021533398A JP2021533398A JP2020569051A JP2020569051A JP2021533398A JP 2021533398 A JP2021533398 A JP 2021533398A JP 2020569051 A JP2020569051 A JP 2020569051A JP 2020569051 A JP2020569051 A JP 2020569051A JP 2021533398 A JP2021533398 A JP 2021533398A
- Authority
- JP
- Japan
- Prior art keywords
- hotwords
- assistant
- context
- specific
- default
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 claims abstract description 74
- 238000000034 method Methods 0.000 claims abstract description 60
- 230000007704 transition Effects 0.000 claims abstract description 54
- 230000000694 effects Effects 0.000 claims abstract description 45
- 238000001514 detection method Methods 0.000 claims abstract description 35
- 238000010801 machine learning Methods 0.000 claims description 18
- 230000015654 memory Effects 0.000 claims description 15
- 238000012544 monitoring process Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 9
- 230000001960 triggered effect Effects 0.000 claims description 9
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 description 53
- 230000004913 activation Effects 0.000 description 36
- 238000007792 addition Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 230000003213 activating effect Effects 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 238000010438 heat treatment Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 235000013550 pizza Nutrition 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 101710178035 Chorismate synthase 2 Proteins 0.000 description 1
- 101710152694 Cysteine synthase 2 Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000009474 immediate action Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 235000013580 sausages Nutrition 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
106 クライアントコンピューティングデバイス、クライアントデバイス
107 視覚センサー、カメラ
108 自動アシスタントクライアント
109 マイクロフォン
110 音声キャプチャモジュール
111 画像キャプチャモジュール
112 視覚キューモジュール
1121 視覚キューモジュール
1122 クラウドベースの視覚キューモジュール、視覚キューモジュール
113 起動モジュール
114 オンデバイスモデルデータベース、オンデバイス起動モデル
1141 デフォルトオンデバイス起動モデル、デフォルト起動モデル
1142〜114N コンテキスト起動モデル、コンテキスト固有の機械学習モデルまたは分類器
116 クラウドベースのテキスト対音声(「TTS」)モジュール、TSSモジュール
117 クラウドベースのSTTモジュール、STTモジュール
119 クラウドベースの自動アシスタント構成要素
120 自動アシスタント
122 自然言語プロセッサ
124 実現モジュール
126 自然言語生成器
128 動的ホットワードエンジン
129 動的ホットワードインデックス
130 第三者コンピューティングサービス、第三者サービス、第三者アプリケーション
134 ユーザ制御リソースエンジン
135 意図マッチャー
150 検索モジュール
306 クライアントコンピューティングデバイス、コンピューティングデバイス、クライアントデバイス
506A 第1のクライアントデバイス
506B 第2のクライアントデバイス
606 クライアントデバイス
611 スピーカ
613 ディスプレイ
700 方法
810 コンピューティングデバイス
812 バスサブシステム
814 プロセッサ
816 ネットワークインターフェースサブシステム
820 ユーザインターフェース出力デバイス
822 ユーザインターフェース入力デバイス
824 記憶サブシステム
825 メモリサブシステム、メモリ
826 ファイル記憶サブシステム
830 メインランダムアクセスメモリ(RAM)
832 読取り専用メモリ(ROM)
Claims (20)
少なくとも部分的にコンピューティングデバイス上で自動アシスタントを動作させるステップと、
1つまたは複数のデフォルトホットワードに対してマイクロフォンによってキャプチャされたオーディオデータを監視するステップであって、前記デフォルトホットワードのうちの1つまたは複数の検出が、前記自動アシスタントの限定ホットワード聴取状態から音声認識状態への遷移をトリガする、監視するステップと、
前記コンピューティングデバイスの所与の状態への遷移を検出するステップと、
前記検出するステップに応答して、前記1つまたは複数のデフォルトホットワードに加えて、1つまたは複数のコンテキスト固有のホットワードに対して前記マイクロフォンによってキャプチャされた前記オーディオデータを監視するステップであって、前記コンテキスト固有のホットワードのうちの1つまたは複数の検出が、前記デフォルトホットワードのうちの1つまたは複数の前記検出または前記自動アシスタントの前記音声認識状態への前記遷移を必要とせずに、前記所与の状態に関連する応答活動を実行するように前記自動アシスタントをトリガする、監視するステップと
を含む、方法。
1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサと動作可能に結合されたマイクロフォンと、
前記1つまたは複数のプロセッサと動作可能に結合された非一時的なメモリと
を備え、前記メモリが命令を記憶し、前記命令が、前記プロセッサのうちの1つまたは複数による前記命令の実行に応答して、前記1つまたは複数のプロセッサに自動アシスタントを実行させ、
前記自動アシスタントが、限定ホットワード聴取状態と1つまたは複数のコンテキスト固有の聴取状態との間で遷移可能であり、
前記限定ホットワード聴取状態では、前記自動アシスタントが、1つまたは複数のデフォルトホットワードに対して前記マイクロフォンによってサンプリングされたオーディオ入力を監視し、前記デフォルトホットワードのうちの1つまたは複数の検出が、前記自動アシスタントの前記限定ホットワード聴取状態から音声認識状態への遷移をトリガし、
前記コンテキスト固有の聴取状態のうちの少なくとも1つでは、前記自動アシスタントが、前記1つまたは複数のデフォルトホットワードに加えて、またはその代わりに、1つまたは複数のコンテキスト固有のホットワードに対して前記マイクロフォンによってサンプリングされた前記オーディオ入力を監視し、前記コンテキスト固有のホットワードのうちの1つまたは複数の検出が、前記デフォルトホットワードのうちの1つまたは複数の前記検出または前記自動アシスタントの前記音声認識状態への前記遷移を必要とせずに、前記アシスタントコンピューティングデバイスの現在のコンテキストに関連する応答活動を実行するように前記自動アシスタントをトリガする
アシスタントコンピューティングデバイス。
少なくとも部分的にコンピューティングデバイス上で自動アシスタントを動作させることと、
1つまたは複数のデフォルトホットワードに対してマイクロフォンによってキャプチャされたオーディオデータを監視することであって、前記デフォルトホットワードのうちの1つまたは複数の検出が、前記自動アシスタントの限定ホットワード聴取状態から音声認識状態への遷移をトリガする、監視することと、
前記コンピューティングデバイスの所与の状態への遷移を検出することと、
前記検出することに応答して、前記1つまたは複数のデフォルトホットワードに加えて、1つまたは複数のコンテキスト固有のホットワードに対して前記マイクロフォンによってキャプチャされた前記オーディオデータを監視することであって、前記コンテキスト固有のホットワードのうちの1つまたは複数の検出が、前記デフォルトホットワードのうちの1つまたは複数の前記検出または前記自動アシスタントの前記音声認識状態への前記遷移を必要とせずに、前記所与の状態に関連する応答活動を実行するように前記自動アシスタントをトリガする、監視することと
を前記1つまたは複数のプロセッサに実行させる、少なくとも1つの非一時的コンピュータ可読記録媒体。
少なくとも部分的にコンピューティングデバイス上で自動アシスタントを動作させることと、
1つまたは複数のデフォルトホットワードに対してマイクロフォンによってキャプチャされたオーディオデータを監視することであって、前記デフォルトホットワードのうちの1つまたは複数の検出が、前記自動アシスタントの限定ホットワード聴取状態から音声認識状態への遷移をトリガする、監視することと、
前記コンピューティングデバイスの所与の状態への遷移を検出することと、
前記検出することに応答して、前記1つまたは複数のデフォルトホットワードに加えて、1つまたは複数のコンテキスト固有のホットワードに対して前記マイクロフォンによってキャプチャされた前記オーディオデータを監視することであって、前記コンテキスト固有のホットワードのうちの1つまたは複数の検出が、前記デフォルトホットワードのうちの1つまたは複数の前記検出または前記自動アシスタントの前記音声認識状態への前記遷移を必要とせずに、前記所与の状態に関連する応答活動を実行するように前記自動アシスタントをトリガする、監視することと
を前記1つまたは複数のプロセッサに実行させる、システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022168638A JP7418526B2 (ja) | 2018-08-21 | 2022-10-20 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2018/047280 WO2020040744A1 (en) | 2018-08-21 | 2018-08-21 | Dynamic and/or context-specific hot words to invoke automated assistant |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022168638A Division JP7418526B2 (ja) | 2018-08-21 | 2022-10-20 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021533398A true JP2021533398A (ja) | 2021-12-02 |
JP7322076B2 JP7322076B2 (ja) | 2023-08-07 |
Family
ID=63668007
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020569051A Active JP7322076B2 (ja) | 2018-08-21 | 2018-08-21 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
JP2022168638A Active JP7418526B2 (ja) | 2018-08-21 | 2022-10-20 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022168638A Active JP7418526B2 (ja) | 2018-08-21 | 2022-10-20 | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード |
Country Status (6)
Country | Link |
---|---|
US (2) | US11423890B2 (ja) |
EP (1) | EP3642833B1 (ja) |
JP (2) | JP7322076B2 (ja) |
KR (1) | KR102523982B1 (ja) |
CN (1) | CN112272846A (ja) |
WO (1) | WO2020040744A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10217453B2 (en) * | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
CN112272846A (zh) | 2018-08-21 | 2021-01-26 | 谷歌有限责任公司 | 用于调用自动助理的动态的和/或特定于场境的热词 |
JP7055721B2 (ja) * | 2018-08-27 | 2022-04-18 | 京セラ株式会社 | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム |
US11798552B2 (en) * | 2018-10-05 | 2023-10-24 | Honda Motor Co., Ltd. | Agent device, agent control method, and program |
US10657968B1 (en) * | 2018-11-19 | 2020-05-19 | Google Llc | Controlling device output according to a determined condition of a user |
KR102225001B1 (ko) * | 2019-05-21 | 2021-03-08 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11705114B1 (en) * | 2019-08-08 | 2023-07-18 | State Farm Mutual Automobile Insurance Company | Systems and methods for parsing multiple intents in natural language speech |
US11393477B2 (en) * | 2019-09-24 | 2022-07-19 | Amazon Technologies, Inc. | Multi-assistant natural language input processing to determine a voice model for synthesized speech |
US11120790B2 (en) | 2019-09-24 | 2021-09-14 | Amazon Technologies, Inc. | Multi-assistant natural language input processing |
KR20220024557A (ko) * | 2019-10-15 | 2022-03-03 | 구글 엘엘씨 | 자동화된 어시스턴트에 의한 응답 액션을 트리거하기 위한 핫 명령의 검출 및/또는 등록 |
US11790173B2 (en) * | 2020-10-22 | 2023-10-17 | Google Llc | Recommending action(s) based on entity or entity type |
US11557278B2 (en) * | 2020-12-10 | 2023-01-17 | Google Llc | Speaker dependent follow up actions and warm words |
US11557293B2 (en) | 2021-05-17 | 2023-01-17 | Google Llc | Contextual suppression of assistant command(s) |
WO2023028702A1 (en) * | 2021-08-31 | 2023-03-09 | Shopify Inc. | Dynamic labeling of and generating indications of real-time communication sessions |
US11922938B1 (en) | 2021-11-22 | 2024-03-05 | Amazon Technologies, Inc. | Access to multiple virtual assistants |
KR102643796B1 (ko) * | 2022-01-11 | 2024-03-06 | 한국과학기술연구원 | 사용자 명령에 기초한 캐릭터 행동 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 |
US20230281205A1 (en) * | 2022-03-01 | 2023-09-07 | Google Llc | Contextually Relevant Suggestions |
WO2024148194A1 (en) * | 2023-01-04 | 2024-07-11 | Analog Devices, Inc. | Keyphrase detection |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6665639B2 (en) | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
SE9902229L (sv) | 1999-06-07 | 2001-02-05 | Ericsson Telefon Ab L M | Apparatus and method of controlling a voice controlled operation |
JP2001249688A (ja) * | 2000-03-06 | 2001-09-14 | Kddi Corp | 電話自動受付装置 |
JP2002251235A (ja) | 2001-02-23 | 2002-09-06 | Fujitsu Ltd | 利用者インタフェースシステム |
JP4247002B2 (ja) * | 2003-01-22 | 2009-04-02 | 富士通株式会社 | マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置 |
US8140325B2 (en) * | 2007-01-04 | 2012-03-20 | International Business Machines Corporation | Systems and methods for intelligent control of microphones for speech recognition applications |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
NZ581850A (en) * | 2009-08-27 | 2011-12-22 | Eyemagnet Ltd | Informational content scheduling system and method |
US8437455B2 (en) * | 2010-01-12 | 2013-05-07 | American Express Travel Related Services Company, Inc. | System, method and computer program product for globally portable interactive voice response (IVR) systems |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US9721563B2 (en) * | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
AU2013328923A1 (en) | 2012-10-12 | 2015-04-16 | Hallmark Cards, Incorporated | Context-based interactive plush toy |
US9734151B2 (en) | 2012-10-31 | 2017-08-15 | Tivo Solutions Inc. | Method and system for voice based media search |
US11393461B2 (en) * | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
US9747900B2 (en) | 2013-05-24 | 2017-08-29 | Google Technology Holdings LLC | Method and apparatus for using image data to aid voice recognition |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US10054327B2 (en) | 2013-08-21 | 2018-08-21 | Honeywell International Inc. | Devices and methods for interacting with an HVAC controller |
US9865255B2 (en) | 2013-08-29 | 2018-01-09 | Panasonic Intellectual Property Corporation Of America | Speech recognition method and speech recognition apparatus |
US9240182B2 (en) * | 2013-09-17 | 2016-01-19 | Qualcomm Incorporated | Method and apparatus for adjusting detection threshold for activating voice assistant function |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US9804820B2 (en) | 2013-12-16 | 2017-10-31 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US9082407B1 (en) * | 2014-04-15 | 2015-07-14 | Google Inc. | Systems and methods for providing prompts for voice commands |
EP3158427B1 (en) * | 2014-06-19 | 2022-12-28 | Robert Bosch GmbH | System and method for speech-enabled personalized operation of devices and services in multiple operating environments |
US10659851B2 (en) * | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) * | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
US10789041B2 (en) * | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
JP6514475B2 (ja) | 2014-10-03 | 2019-05-15 | 株式会社Nttドコモ | 対話装置および対話方法 |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
EP3067884B1 (en) * | 2015-03-13 | 2019-05-08 | Samsung Electronics Co., Ltd. | Speech recognition system and speech recognition method thereof |
US10097973B2 (en) * | 2015-05-27 | 2018-10-09 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
CN105204743A (zh) * | 2015-09-28 | 2015-12-30 | 百度在线网络技术(北京)有限公司 | 用于语音和视频通讯的交互控制方法及装置 |
US9542941B1 (en) | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
US9792907B2 (en) | 2015-11-24 | 2017-10-17 | Intel IP Corporation | Low resource key phrase detection for wake on voice |
JP2017144521A (ja) | 2016-02-18 | 2017-08-24 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US9820039B2 (en) * | 2016-02-22 | 2017-11-14 | Sonos, Inc. | Default playback devices |
US9691384B1 (en) * | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US10217453B2 (en) | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
US11003417B2 (en) * | 2016-12-15 | 2021-05-11 | Samsung Electronics Co., Ltd. | Speech recognition method and apparatus with activation word based on operating environment of the apparatus |
KR20180084392A (ko) * | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10469755B2 (en) | 2017-05-16 | 2019-11-05 | Google Llc | Storing metadata related to captured images |
US10950228B1 (en) * | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
US10546583B2 (en) * | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10586534B1 (en) * | 2017-09-27 | 2020-03-10 | Amazon Technologies, Inc. | Voice-controlled device control using acoustic echo cancellation statistics |
US10636421B2 (en) * | 2017-12-27 | 2020-04-28 | Soundhound, Inc. | Parse prefix-detection in a human-machine interface |
JP7044415B2 (ja) * | 2017-12-31 | 2022-03-30 | 美的集団股▲フン▼有限公司 | ホームアシスタント装置を制御するための方法及びシステム |
CN110045501A (zh) * | 2018-01-09 | 2019-07-23 | 瑞轩科技股份有限公司 | 显示装置组件 |
US11164572B2 (en) * | 2018-05-01 | 2021-11-02 | Dell Products, L.P. | Intelligent assistance across voice services |
US20200047687A1 (en) * | 2018-08-10 | 2020-02-13 | SF Motors Inc. | Exterior speech interface for vehicle |
US10929098B2 (en) * | 2018-08-17 | 2021-02-23 | The Toronto-Dominion Bank | Methods and systems for conducting a session over audible and visual interfaces |
CN112272846A (zh) | 2018-08-21 | 2021-01-26 | 谷歌有限责任公司 | 用于调用自动助理的动态的和/或特定于场境的热词 |
JP6848947B2 (ja) * | 2018-09-27 | 2021-03-24 | 横河電機株式会社 | システム、方法、プログラムおよび記録媒体 |
US11355098B1 (en) * | 2018-12-13 | 2022-06-07 | Amazon Technologies, Inc. | Centralized feedback service for performance of virtual assistant |
DK180649B1 (en) * | 2019-05-31 | 2021-11-11 | Apple Inc | Voice assistant discoverability through on-device targeting and personalization |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
-
2018
- 2018-08-21 CN CN201880094489.XA patent/CN112272846A/zh active Pending
- 2018-08-21 WO PCT/US2018/047280 patent/WO2020040744A1/en unknown
- 2018-08-21 US US16/622,112 patent/US11423890B2/en active Active
- 2018-08-21 KR KR1020207035755A patent/KR102523982B1/ko active IP Right Grant
- 2018-08-21 EP EP18773683.0A patent/EP3642833B1/en active Active
- 2018-08-21 JP JP2020569051A patent/JP7322076B2/ja active Active
-
2022
- 2022-06-16 US US17/842,577 patent/US20220335941A1/en active Pending
- 2022-10-20 JP JP2022168638A patent/JP7418526B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Also Published As
Publication number | Publication date |
---|---|
WO2020040744A1 (en) | 2020-02-27 |
CN112272846A (zh) | 2021-01-26 |
KR102523982B1 (ko) | 2023-04-20 |
US11423890B2 (en) | 2022-08-23 |
EP3642833A1 (en) | 2020-04-29 |
JP2023021975A (ja) | 2023-02-14 |
KR20210008521A (ko) | 2021-01-22 |
US20220335941A1 (en) | 2022-10-20 |
EP3642833B1 (en) | 2023-04-12 |
US20200342866A1 (en) | 2020-10-29 |
JP7418526B2 (ja) | 2024-01-19 |
JP7322076B2 (ja) | 2023-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7418526B2 (ja) | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード | |
JP7354301B2 (ja) | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 | |
EP3895161B1 (en) | Utilizing pre-event and post-event input streams to engage an automated assistant | |
US11810557B2 (en) | Dynamic and/or context-specific hot words to invoke automated assistant | |
US20240055003A1 (en) | Automated assistant interaction prediction using fusion of visual and audio input | |
US20230395066A1 (en) | Hot-word free pre-emption of automated assistant response presentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220520 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221020 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20221020 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20221031 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20221107 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20221118 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20221128 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230104 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230410 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7322076 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |