JP2021532394A - 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード - Google Patents
自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード Download PDFInfo
- Publication number
- JP2021532394A JP2021532394A JP2020569000A JP2020569000A JP2021532394A JP 2021532394 A JP2021532394 A JP 2021532394A JP 2020569000 A JP2020569000 A JP 2020569000A JP 2020569000 A JP2020569000 A JP 2020569000A JP 2021532394 A JP2021532394 A JP 2021532394A
- Authority
- JP
- Japan
- Prior art keywords
- user
- hotwords
- automation assistant
- default
- assistant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 69
- 230000004044 response Effects 0.000 claims abstract description 63
- 230000009471 action Effects 0.000 claims abstract description 47
- 230000007704 transition Effects 0.000 claims abstract description 45
- 238000001514 detection method Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 7
- 230000000007 visual effect Effects 0.000 description 63
- 238000004891 communication Methods 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 10
- 230000002452 interceptive effect Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000010438 heat treatment Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 235000013550 pizza Nutrition 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000010411 cooking Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 101710178035 Chorismate synthase 2 Proteins 0.000 description 1
- 101710152694 Cysteine synthase 2 Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical compound CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000009474 immediate action Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 235000013580 sausages Nutrition 0.000 description 1
- 230000007958 sleep Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
101A ユーザ
101B ユーザ
105 近接センサ
106 クライアントコンピューティングデバイス、クライアントデバイス
107 視覚センサ、カメラ
108 自動化アシスタントクライアント
109 マイクロフォン
110 音声キャプチャモジュール
111 画像キャプチャモジュール
112 視覚的手がかりモジュール
1121 視覚的手がかりモジュール
1122 視覚的手がかりモジュール
113 呼び出しモジュール
114 ローカルおよび/またはワイドエリアネットワーク、オンデバイスモデルデータベース、呼び出しモデル、オンデバイスモデル
1141 オンデバイス呼び出しモデル、デフォルトのオンデバイス呼び出しモデル、デフォルト呼び出しモデル
1142〜114N オンデバイス呼び出しモデル、コンテキスト呼び出しモデル、コンテキスト固有の機械学習モデルまたは分類器
116 クラウドベースのテキスト音声化(「TTS: text-to-speech」)モジュール、クラウドベースのTTSモジュール、TTSモジュール
117 クラウドベースのSTTモジュール、STTモジュール
119 クラウドベースの自動化アシスタント構成要素
120 自動化アシスタント
122 自然言語プロセッサ
124 履行モジュール
126 自然言語生成器
128 動的ホットワードエンジン
129 データベース
130 サードパーティコンピューティングサービス、サードパーティサービス
134 ユーザ制御リソースエンジン
135 意図整合器
150 検索モジュール
305 近接センサ
306 クライアントコンピューティングデバイス、コンピューティングデバイス、クライアントデバイス
406 クライアントデバイス
470 センサ
501 ユーザ
506 クライアントデバイス
515A 近接、近接範囲
515B 近接範囲
515C 近接範囲
810 コンピューティングデバイス
812 バスサブシステム
814 プロセッサ
816 ネットワークインターフェースサブシステム
820 ユーザインターフェース出力デバイス
822 ユーザインターフェース入力デバイス
824 記憶サブシステム
825 メモリサブシステム、メモリ
826 ファイル記憶サブシステム
830 メインランダムアクセスメモリ(RAM)
832 読み取り専用メモリ(ROM)
Claims (20)
デフォルトリスニング状態において自動化アシスタントを実行するステップであって、
前記自動化アシスタントが、ユーザによって操作される1つまたは複数のコンピューティングデバイス上で少なくとも部分的に実行される、ステップと、
前記デフォルトリスニング状態にある間、1つまたは複数のホットワードのデフォルトセットのうちの1つまたは複数について、1つまたは複数のマイクロフォンによってキャプチャされたオーディオデータを監視するステップであって、
前記デフォルトセットの前記ホットワードのうちの1つまたは複数の検出が、前記デフォルトリスニング状態から音声認識状態への前記自動化アシスタントの遷移をトリガする、ステップと、
前記コンピューティングデバイスのうちの1つまたは複数と一体の1つまたは複数のハードウェアセンサによって生成された1つまたは複数のセンサ信号を検出するステップと、
前記ユーザの属性を決定するために前記1つまたは複数のセンサ信号を分析するステップと、
前記分析に基づいて、前記自動化アシスタントを前記デフォルトリスニング状態から拡張リスニング状態に遷移させるステップと、
前記拡張リスニング状態にある間、1つまたは複数のホットワードの拡張セットのうちの1つまたは複数について、前記マイクロフォンのうちの1つまたは複数によってキャプチャされた前記オーディオデータを監視するステップであって、
前記拡張セットの前記ホットワードのうちの1つまたは複数の検出が、前記デフォルトセットの前記ホットワードのうちの1つまたは複数の検出を必要とすることなく応答アクションを実行するように前記自動化アシスタントをトリガし、前記拡張セットの前記ホットワードのうちの1つまたは複数が、前記デフォルトセット内にない、ステップと
を含む、方法。
前記ユーザの前記属性が、
前記ユーザが前記近接センサによって検出されていること、または
前記ユーザが前記コンピューティングデバイスのうちの1つまたは複数の所定の距離内で前記近接センサによって検出されていること
を含む、請求項1に記載の方法。
前記ユーザが前記カメラによって検出されていること、または
前記ユーザが前記コンピューティングデバイスのうちの1つまたは複数の所定の距離内で前記カメラによって検出されていること
を含む、請求項3に記載の方法。
デフォルトリスニング状態において自動化アシスタントを実行する動作であって、
前記自動化アシスタントが、ユーザによって操作される1つまたは複数のコンピューティングデバイス上で少なくとも部分的に実行される、動作と、
前記デフォルトリスニング状態にある間、1つまたは複数のホットワードのデフォルトセットのうちの1つまたは複数について、1つまたは複数のマイクロフォンによってキャプチャされたオーディオデータを監視する動作であって、
前記デフォルトセットの前記ホットワードのうちの1つまたは複数の検出が、前記デフォルトリスニング状態から音声認識状態への前記自動化アシスタントの遷移をトリガする、動作と、
前記コンピューティングデバイスのうちの1つまたは複数と一体の1つまたは複数のハードウェアセンサによって生成された1つまたは複数のセンサ信号を検出する動作と、
前記ユーザの属性を決定するために前記1つまたは複数のセンサ信号を分析する動作と、
前記分析に基づいて、前記自動化アシスタントを前記デフォルトリスニング状態から拡張リスニング状態に遷移させる動作と、
前記拡張リスニング状態にある間、1つまたは複数のホットワードの拡張セットのうちの1つまたは複数について、前記マイクロフォンのうちの1つまたは複数によってキャプチャされた前記オーディオデータを監視する動作であって、
前記拡張セットの前記ホットワードのうちの1つまたは複数の検出が、前記デフォルトセットの前記ホットワードのうちの1つまたは複数の検出を必要とすることなく応答アクションを実行するように前記自動化アシスタントをトリガし、前記拡張セットの前記ホットワードのうちの1つまたは複数が、前記デフォルトセット内にない、動作と
を実行させる、システム。
前記ユーザの前記属性が、
前記ユーザが前記近接センサによって検出されていること、または
前記ユーザが前記コンピューティングデバイスのうちの1つまたは複数の所定の距離内で前記近接センサによって検出されていること
を含む、請求項15に記載のシステム。
前記ユーザが前記カメラによって検出されていること、または
前記ユーザが前記コンピューティングデバイスのうちの1つまたは複数の所定の距離内で前記カメラによって検出されていること
を含む、請求項17に記載のシステム。
デフォルトリスニング状態において自動化アシスタントを実行する動作であって、
前記自動化アシスタントが、ユーザによって操作される1つまたは複数のコンピューティングデバイス上で少なくとも部分的に実行される、動作と、
前記デフォルトリスニング状態にある間、1つまたは複数のホットワードのデフォルトセットのうちの1つまたは複数について、1つまたは複数のマイクロフォンによってキャプチャされたオーディオデータを監視する動作であって、
前記デフォルトセットの前記ホットワードのうちの1つまたは複数の検出が、前記デフォルトリスニング状態から音声認識状態への前記自動化アシスタントの遷移をトリガする、動作と、
前記コンピューティングデバイスのうちの1つまたは複数と一体の1つまたは複数のハードウェアセンサによって生成された1つまたは複数のセンサ信号を検出する動作と、
前記ユーザの属性を決定するために前記1つまたは複数のセンサ信号を分析する動作と、
前記分析に基づいて、前記自動化アシスタントを前記デフォルトリスニング状態から拡張リスニング状態に遷移させる動作と、
前記拡張リスニング状態にある間、1つまたは複数のホットワードの拡張セットのうちの1つまたは複数について、前記マイクロフォンのうちの1つまたは複数によってキャプチャされた前記オーディオデータを監視する動作であって、
前記拡張セットの前記ホットワードのうちの1つまたは複数の検出が、前記デフォルトセットの前記ホットワードのうちの1つまたは複数の検出を必要とすることなく応答アクションを実行するように前記自動化アシスタントをトリガし、前記拡張セットの前記ホットワードのうちの1つまたは複数が、前記デフォルトセット内にない、動作と
を実行させる、少なくとも1つの非一時的なコンピュータ可読記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022164025A JP2023015054A (ja) | 2018-08-21 | 2022-10-12 | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2018/047281 WO2020040745A1 (en) | 2018-08-21 | 2018-08-21 | Dynamic and/or context-specific hot words to invoke automated assistant |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022164025A Division JP2023015054A (ja) | 2018-08-21 | 2022-10-12 | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021532394A true JP2021532394A (ja) | 2021-11-25 |
JP7341171B2 JP7341171B2 (ja) | 2023-09-08 |
Family
ID=63668008
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020569000A Active JP7341171B2 (ja) | 2018-08-21 | 2018-08-21 | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード |
JP2022164025A Pending JP2023015054A (ja) | 2018-08-21 | 2022-10-12 | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022164025A Pending JP2023015054A (ja) | 2018-08-21 | 2022-10-12 | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード |
Country Status (6)
Country | Link |
---|---|
US (2) | US11257487B2 (ja) |
EP (2) | EP3631793B1 (ja) |
JP (2) | JP7341171B2 (ja) |
KR (2) | KR102599607B1 (ja) |
CN (1) | CN112292724A (ja) |
WO (1) | WO2020040745A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3631793B1 (en) | 2018-08-21 | 2022-03-30 | Google LLC | Dynamic and/or context-specific hot words to invoke automated assistant |
US10657968B1 (en) * | 2018-11-19 | 2020-05-19 | Google Llc | Controlling device output according to a determined condition of a user |
CN111402900B (zh) * | 2018-12-29 | 2024-04-23 | 华为技术有限公司 | 一种语音交互方法,设备和系统 |
CN111475206B (zh) * | 2019-01-04 | 2023-04-11 | 优奈柯恩(北京)科技有限公司 | 用于唤醒可穿戴设备的方法及装置 |
KR20200126509A (ko) * | 2019-04-30 | 2020-11-09 | 삼성전자주식회사 | 가전기기 및 이의 제어 방법 |
CN114207710A (zh) * | 2019-10-15 | 2022-03-18 | 谷歌有限责任公司 | 检测和/或登记热命令以由自动助理触发响应动作 |
US11145315B2 (en) * | 2019-10-16 | 2021-10-12 | Motorola Mobility Llc | Electronic device with trigger phrase bypass and corresponding systems and methods |
US11741969B1 (en) * | 2020-04-09 | 2023-08-29 | Amazon Technologies, Inc. | Controlled access to device data |
CN113539251A (zh) * | 2020-04-20 | 2021-10-22 | 青岛海尔洗衣机有限公司 | 一种家电设备的控制方法、装置、设备及存储介质 |
US11557278B2 (en) * | 2020-12-10 | 2023-01-17 | Google Llc | Speaker dependent follow up actions and warm words |
US11842737B2 (en) * | 2021-03-24 | 2023-12-12 | Google Llc | Automated assistant interaction prediction using fusion of visual and audio input |
US11557293B2 (en) | 2021-05-17 | 2023-01-17 | Google Llc | Contextual suppression of assistant command(s) |
US20240161741A1 (en) * | 2022-11-14 | 2024-05-16 | Google Llc | Short-Lived Repeat Voice Commands |
KR102703054B1 (ko) * | 2022-12-21 | 2024-09-05 | 이모션웨이브 주식회사 | 인공지능 스피커 장치 및 인공지능 스피커 시스템 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002251235A (ja) * | 2001-02-23 | 2002-09-06 | Fujitsu Ltd | 利用者インタフェースシステム |
JP2004226656A (ja) * | 2003-01-22 | 2004-08-12 | Fujitsu Ltd | マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置 |
JP2016076007A (ja) * | 2014-10-03 | 2016-05-12 | 株式会社Nttドコモ | 対話装置および対話方法 |
JP2017144521A (ja) * | 2016-02-18 | 2017-08-24 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6665639B2 (en) | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
SE9902229L (sv) | 1999-06-07 | 2001-02-05 | Ericsson Telefon Ab L M | Apparatus and method of controlling a voice controlled operation |
US8140325B2 (en) * | 2007-01-04 | 2012-03-20 | International Business Machines Corporation | Systems and methods for intelligent control of microphones for speech recognition applications |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
NZ581850A (en) | 2009-08-27 | 2011-12-22 | Eyemagnet Ltd | Informational content scheduling system and method |
US8437455B2 (en) | 2010-01-12 | 2013-05-07 | American Express Travel Related Services Company, Inc. | System, method and computer program product for globally portable interactive voice response (IVR) systems |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
WO2014059416A1 (en) | 2012-10-12 | 2014-04-17 | Hallmark Cards, Incorporated | Context-based interactive plush toy |
US9734151B2 (en) * | 2012-10-31 | 2017-08-15 | Tivo Solutions Inc. | Method and system for voice based media search |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
US9747900B2 (en) | 2013-05-24 | 2017-08-29 | Google Technology Holdings LLC | Method and apparatus for using image data to aid voice recognition |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
CN105659179B (zh) * | 2013-08-21 | 2018-07-17 | 霍尼韦尔国际公司 | 用于与hvac控制器相交互的设备和方法 |
WO2015029304A1 (ja) | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声認識方法及び音声認識装置 |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US9804820B2 (en) | 2013-12-16 | 2017-10-31 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US9430186B2 (en) * | 2014-03-17 | 2016-08-30 | Google Inc | Visual indication of a recognized voice-initiated action |
US9082407B1 (en) | 2014-04-15 | 2015-07-14 | Google Inc. | Systems and methods for providing prompts for voice commands |
US10410630B2 (en) * | 2014-06-19 | 2019-09-10 | Robert Bosch Gmbh | System and method for speech-enabled personalized operation of devices and services in multiple operating environments |
US11330100B2 (en) * | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
US10789041B2 (en) * | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
EP3067884B1 (en) | 2015-03-13 | 2019-05-08 | Samsung Electronics Co., Ltd. | Speech recognition system and speech recognition method thereof |
US10097973B2 (en) | 2015-05-27 | 2018-10-09 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
CN105204743A (zh) | 2015-09-28 | 2015-12-30 | 百度在线网络技术(北京)有限公司 | 用于语音和视频通讯的交互控制方法及装置 |
US9542941B1 (en) * | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
CN105654943A (zh) * | 2015-10-26 | 2016-06-08 | 乐视致新电子科技(天津)有限公司 | 一种语音唤醒方法、装置及系统 |
US9792907B2 (en) | 2015-11-24 | 2017-10-17 | Intel IP Corporation | Low resource key phrase detection for wake on voice |
US10049670B2 (en) * | 2016-06-06 | 2018-08-14 | Google Llc | Providing voice action discoverability example for trigger term |
US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US10217453B2 (en) | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
CN106611597B (zh) * | 2016-12-02 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
US11003417B2 (en) * | 2016-12-15 | 2021-05-11 | Samsung Electronics Co., Ltd. | Speech recognition method and apparatus with activation word based on operating environment of the apparatus |
US10469755B2 (en) | 2017-05-16 | 2019-11-05 | Google Llc | Storing metadata related to captured images |
DK179549B1 (en) * | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN108335695B (zh) * | 2017-06-27 | 2020-10-30 | 腾讯科技(深圳)有限公司 | 语音控制方法、装置、计算机设备和存储介质 |
US10950228B1 (en) | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
CN107564518B (zh) * | 2017-08-21 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 智能设备控制方法、装置及计算机设备 |
US10546583B2 (en) | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10586534B1 (en) * | 2017-09-27 | 2020-03-10 | Amazon Technologies, Inc. | Voice-controlled device control using acoustic echo cancellation statistics |
US10636421B2 (en) * | 2017-12-27 | 2020-04-28 | Soundhound, Inc. | Parse prefix-detection in a human-machine interface |
EP3692522A4 (en) * | 2017-12-31 | 2020-11-11 | Midea Group Co., Ltd. | METHOD AND SYSTEM FOR THE CONTROL OF HOME ASSISTANT DEVICES |
JP6902564B2 (ja) | 2018-01-09 | 2021-07-14 | 瑞軒科技股▲分▼有限公司 | 表示装置アセンブリ |
CN108306797A (zh) * | 2018-01-30 | 2018-07-20 | 百度在线网络技术(北京)有限公司 | 声控智能家居设备方法、系统、终端以及存储介质 |
US11164572B2 (en) * | 2018-05-01 | 2021-11-02 | Dell Products, L.P. | Intelligent assistance across voice services |
US20200047687A1 (en) * | 2018-08-10 | 2020-02-13 | SF Motors Inc. | Exterior speech interface for vehicle |
US10929098B2 (en) | 2018-08-17 | 2021-02-23 | The Toronto-Dominion Bank | Methods and systems for conducting a session over audible and visual interfaces |
EP3631793B1 (en) | 2018-08-21 | 2022-03-30 | Google LLC | Dynamic and/or context-specific hot words to invoke automated assistant |
-
2018
- 2018-08-21 EP EP18773684.8A patent/EP3631793B1/en active Active
- 2018-08-21 WO PCT/US2018/047281 patent/WO2020040745A1/en unknown
- 2018-08-21 KR KR1020237004456A patent/KR102599607B1/ko active IP Right Grant
- 2018-08-21 CN CN201880094453.1A patent/CN112292724A/zh active Pending
- 2018-08-21 KR KR1020207035756A patent/KR102498811B1/ko active IP Right Grant
- 2018-08-21 EP EP22163684.8A patent/EP4036910A1/en active Pending
- 2018-08-21 JP JP2020569000A patent/JP7341171B2/ja active Active
- 2018-08-21 US US16/618,681 patent/US11257487B2/en active Active
-
2022
- 2022-02-19 US US17/676,130 patent/US11810557B2/en active Active
- 2022-10-12 JP JP2022164025A patent/JP2023015054A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002251235A (ja) * | 2001-02-23 | 2002-09-06 | Fujitsu Ltd | 利用者インタフェースシステム |
JP2004226656A (ja) * | 2003-01-22 | 2004-08-12 | Fujitsu Ltd | マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置 |
JP2016076007A (ja) * | 2014-10-03 | 2016-05-12 | 株式会社Nttドコモ | 対話装置および対話方法 |
JP2017144521A (ja) * | 2016-02-18 | 2017-08-24 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
Also Published As
Publication number | Publication date |
---|---|
JP7341171B2 (ja) | 2023-09-08 |
KR20210008089A (ko) | 2021-01-20 |
US11810557B2 (en) | 2023-11-07 |
EP4036910A1 (en) | 2022-08-03 |
KR20230023832A (ko) | 2023-02-17 |
CN112292724A (zh) | 2021-01-29 |
KR102599607B1 (ko) | 2023-11-07 |
EP3631793B1 (en) | 2022-03-30 |
US11257487B2 (en) | 2022-02-22 |
US20220246140A1 (en) | 2022-08-04 |
EP3631793A1 (en) | 2020-04-08 |
JP2023015054A (ja) | 2023-01-31 |
US20200342855A1 (en) | 2020-10-29 |
WO2020040745A1 (en) | 2020-02-27 |
KR102498811B1 (ko) | 2023-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7341171B2 (ja) | 自動化アシスタントを呼び出すための動的および/またはコンテキスト固有のホットワード | |
JP7354301B2 (ja) | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 | |
JP7418526B2 (ja) | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード | |
EP3895161B1 (en) | Utilizing pre-event and post-event input streams to engage an automated assistant | |
CN112868060B (zh) | 用户、自动化助理和其它计算服务之间的多模态交互 | |
JP2020532757A (ja) | 複数のコンピューティングデバイスを使用したインターホン式の通信 | |
US11392213B2 (en) | Selective detection of visual cues for automated assistants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220510 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221012 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20221012 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20221021 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20221024 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20221118 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20221128 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230104 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230616 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7341171 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |