JP2022539675A - 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 - Google Patents
自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 Download PDFInfo
- Publication number
- JP2022539675A JP2022539675A JP2021574854A JP2021574854A JP2022539675A JP 2022539675 A JP2022539675 A JP 2022539675A JP 2021574854 A JP2021574854 A JP 2021574854A JP 2021574854 A JP2021574854 A JP 2021574854A JP 2022539675 A JP2022539675 A JP 2022539675A
- Authority
- JP
- Japan
- Prior art keywords
- text
- command
- automated assistant
- user
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009471 action Effects 0.000 title claims abstract description 53
- 238000001514 detection method Methods 0.000 title claims description 10
- 230000004044 response Effects 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims abstract description 58
- 238000012545 processing Methods 0.000 claims abstract description 51
- 230000004913 activation Effects 0.000 claims abstract description 37
- 230000000007 visual effect Effects 0.000 claims description 71
- 239000012634 fragment Substances 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 15
- 238000010801 machine learning Methods 0.000 claims description 12
- 230000007704 transition Effects 0.000 claims description 10
- 230000001960 triggered effect Effects 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 abstract description 5
- 238000012031 short term test Methods 0.000 description 38
- 238000001994 activation Methods 0.000 description 33
- 238000004891 communication Methods 0.000 description 10
- 230000003993 interaction Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 235000013550 pizza Nutrition 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001143 conditioned effect Effects 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 235000013580 sausages Nutrition 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/19—Sensors therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Ophthalmology & Optometry (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
101A 第1のユーザ
101B 別のユーザ、第2のユーザ
105 近接度センサー
106 クライアントコンピューティングデバイス、クライアントデバイス、クラウドベースまたはオンボードクライアントデバイス
107 視覚センサー、カメラ
108 自動アシスタントクライアント
109 マイクロフォン
110 音声キャプチャモジュール
111 画像キャプチャモジュール
112 視覚キューモジュール
1121 視覚キューモジュール
1122 クラウドベースの視覚キューモジュール、視覚キューモジュール
113 起動モジュール
114 オンデバイスモデルデータベース、オンデバイス起動モデル
1141 デフォルトオンデバイス起動モデル
1142~114N コンテキスト起動モデル
116 クラウドベースのテキスト対音声(「TTS」)モジュール
117 クラウドベースのSTTモジュール、STTモジュール、構成要素
117A オンボードSTTモジュール、STT、STTモジュール
119 クラウドベースの自動アシスタント構成要素
120 自動アシスタント
122 自然言語プロセッサ
124 実現モジュール、構成要素
126 自然言語生成器
128 ホットコマンドエンジン、動的ホットワードエンジン
129 データベース
130 第三者コンピューティングサービス、第三者サービス
134 ユーザ制御リソースエンジン
135 意図マッチャー、構成要素
150 検索モジュール
406 クライアントデバイス
506A ラップトップ、クライアントデバイス
506B スマートテレビジョン、クライアントデバイス
506C クライアントデバイス、クライアントデバイス
507 視覚センサー
507A 視覚センサー
507B 視覚センサー
507C 視覚センサー
600 方法
700 方法
810 コンピューティングデバイス
812 バスサブシステム
814 プロセッサ
816 ネットワークインターフェースサブシステム
820 ユーザインターフェース出力デバイス
822 ユーザインターフェース入力デバイス
824 記憶サブシステム
825 メモリサブシステム、メモリ
826 ファイル記憶サブシステム
830 メインランダムアクセスメモリ(RAM)
832 読取り専用メモリ(ROM)
Claims (20)
前記プロセッサのうちの1つまたは複数を使用して、自動アシスタントを動作させるステップと、
トリガイベントに応答して、前記自動アシスタントを限定聴取状態から完全音声認識状態に遷移させるステップと、
前記完全音声認識状態にある間、前記自動アシスタントによって、ユーザから話されたコマンドを受信するステップと、
テキストコマンドを生成するために、前記話されたコマンドに対して音声認識処理を実行するステップと、
前記テキストコマンドがテキストコマンドのコーパス内の頻度しきい値を満たすと決定するステップと、
前記決定に応答して、前記テキストコマンドを示すデータをホットコマンドとして登録するステップであって、前記登録に続いて、前記テキストコマンドに意味的に矛盾しない別のテキストコマンドの発話が、前記自動アシスタントの明示的な起動を必要とせずに、前記自動アシスタントによる応答アクションの実行をトリガする、登録するステップと
を含む、方法。
1つまたは複数のマイクロフォンにおいてキャプチャされたオーディオデータを受信することであって、前記オーディオデータが第1および第2の話された発話を含む、受信することと、
前記第1および第2の話された発話に対応する第1および第2のテキスト断片を生成するために前記オーディオデータに対して音声認識処理を実行することと、
前記第1のテキスト断片が1つまたは複数のホットコマンド基準を満たすとの決定に応答して、前記第1のテキスト断片に基づいて応答アクションを実行することと、
前記第2のテキスト断片が前記1つまたは複数のホットコマンド基準を満たすことに失敗するとの決定に応答して、別の応答アクションを実行せずに、前記第2のテキスト断片を廃棄または無視することと
を行うためである、システム。
前記プロセッサのうちの1つまたは複数を使用して、自動アシスタントを動作させる動作と、
トリガイベントに応答して、前記自動アシスタントを限定聴取状態から完全音声認識状態に遷移させる動作と、
前記完全音声認識状態にある間、前記自動アシスタントによって、ユーザから話されたコマンドを受信する動作と、
テキストコマンドを生成するために、前記話されたコマンドに対して音声認識処理を実行する動作と、
前記テキストコマンドがテキストコマンドのコーパス内の頻度しきい値を満たすと決定する動作と、
前記決定に応答して、前記テキストコマンドを示すデータをホットコマンドとして登録する動作であって、前記登録するステップに続いて、前記テキストコマンドに意味的に矛盾しない別のテキストコマンドの発話が、前記自動アシスタントの明示的な起動を必要とせずに、前記自動アシスタントによる応答アクションの実行をトリガする、登録する動作と
を実行させる、少なくとも1つの非一時的コンピュータ可読媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023151488A JP2023169309A (ja) | 2019-10-15 | 2023-09-19 | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962915248P | 2019-10-15 | 2019-10-15 | |
US62/915,248 | 2019-10-15 | ||
PCT/US2019/065656 WO2021076164A1 (en) | 2019-10-15 | 2019-12-11 | Detection and/or enrollment of hot commands to trigger responsive action by automated assistant |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023151488A Division JP2023169309A (ja) | 2019-10-15 | 2023-09-19 | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022539675A true JP2022539675A (ja) | 2022-09-13 |
JP7354301B2 JP7354301B2 (ja) | 2023-10-02 |
Family
ID=69106202
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021574854A Active JP7354301B2 (ja) | 2019-10-15 | 2019-12-11 | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
JP2023151488A Pending JP2023169309A (ja) | 2019-10-15 | 2023-09-19 | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023151488A Pending JP2023169309A (ja) | 2019-10-15 | 2023-09-19 | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11948556B2 (ja) |
EP (1) | EP3970139A1 (ja) |
JP (2) | JP7354301B2 (ja) |
KR (1) | KR20220024557A (ja) |
CN (1) | CN114207710A (ja) |
WO (1) | WO2021076164A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7333490B1 (ja) | 2022-10-13 | 2023-08-24 | アクションパワー コーポレイション | 音声信号に関連するコンテンツを決定する方法、コンピューター可読保存媒体に保存されたコンピュータープログラム及びコンピューティング装置 |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
WO2021080033A1 (ko) * | 2019-10-23 | 2021-04-29 | 엘지전자 주식회사 | 음성 분석 방법 및 장치 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11783805B1 (en) * | 2020-09-21 | 2023-10-10 | Amazon Technologies, Inc. | Voice user interface notification ordering |
US20230035941A1 (en) * | 2021-07-15 | 2023-02-02 | Apple Inc. | Speech interpretation based on environmental context |
US12020704B2 (en) * | 2022-01-19 | 2024-06-25 | Google Llc | Dynamic adaptation of parameter set used in hot word free adaptation of automated assistant |
DE102022112444A1 (de) * | 2022-05-18 | 2023-11-23 | Bayerische Motoren Werke Aktiengesellschaft | Spracherkennungssystem |
US20240046925A1 (en) * | 2022-08-08 | 2024-02-08 | Google Llc | Dynamically determining whether to perform candidate automated assistant action determined from spoken utterance |
WO2024035424A1 (en) * | 2022-08-08 | 2024-02-15 | Google Llc | Dynamically determining whether to perform candidate automated assistant action determined from spoken utterance |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002082748A (ja) * | 2000-09-06 | 2002-03-22 | Sanyo Electric Co Ltd | ユーザ支援装置 |
JP2005011089A (ja) * | 2003-06-19 | 2005-01-13 | Fujitsu Ltd | 対話装置 |
JP2008145989A (ja) * | 2006-12-13 | 2008-06-26 | Fujitsu Ten Ltd | 音声識別装置および音声識別方法 |
JP2011003066A (ja) * | 2009-06-19 | 2011-01-06 | Ntt Docomo Inc | 情報取得装置、情報取得プログラム |
JP2014071449A (ja) * | 2012-09-28 | 2014-04-21 | Samsung Electronics Co Ltd | 電子装置、サーバー及びその制御方法 |
US8719039B1 (en) * | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
JP2017211608A (ja) * | 2016-05-27 | 2017-11-30 | トヨタ自動車株式会社 | 音声対話装置および音声対話方法 |
US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
WO2019103007A1 (ja) * | 2017-11-24 | 2019-05-31 | 株式会社Nttドコモ | 情報処理装置及び情報処理方法 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101605347B1 (ko) * | 2009-12-18 | 2016-03-22 | 삼성전자주식회사 | 휴대단말의 외부 출력 제어 방법 및 장치 |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
US9378733B1 (en) * | 2012-12-19 | 2016-06-28 | Google Inc. | Keyword detection without decoding |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
CN104700832B (zh) * | 2013-12-09 | 2018-05-25 | 联发科技股份有限公司 | 语音关键字检测系统及方法 |
US20150112690A1 (en) * | 2013-10-22 | 2015-04-23 | Nvidia Corporation | Low power always-on voice trigger architecture |
US10048748B2 (en) | 2013-11-12 | 2018-08-14 | Excalibur Ip, Llc | Audio-visual interaction with user devices |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US9792901B1 (en) * | 2014-12-11 | 2017-10-17 | Amazon Technologies, Inc. | Multiple-source speech dialog input |
US10867606B2 (en) * | 2015-12-08 | 2020-12-15 | Chian Chiu Li | Systems and methods for performing task using simple code |
US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
JP6994292B2 (ja) | 2017-05-08 | 2022-01-14 | 達闥机器人有限公司 | ロボットのウェイクアップ方法、装置及びロボット |
US10580098B2 (en) | 2017-05-29 | 2020-03-03 | Virtual OnQ Systems, LLC | Voice activated hotel room monitor |
US10515637B1 (en) * | 2017-09-19 | 2019-12-24 | Amazon Technologies, Inc. | Dynamic speech processing |
US10832668B1 (en) * | 2017-09-19 | 2020-11-10 | Amazon Technologies, Inc. | Dynamic speech processing |
US10510340B1 (en) * | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US10679615B2 (en) * | 2018-04-16 | 2020-06-09 | Google Llc | Adaptive interface in a voice-based networked system |
US10896672B2 (en) * | 2018-04-16 | 2021-01-19 | Google Llc | Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface |
CN112272846A (zh) * | 2018-08-21 | 2021-01-26 | 谷歌有限责任公司 | 用于调用自动助理的动态的和/或特定于场境的热词 |
EP3631793B1 (en) * | 2018-08-21 | 2022-03-30 | Google LLC | Dynamic and/or context-specific hot words to invoke automated assistant |
WO2020131681A1 (en) * | 2018-12-18 | 2020-06-25 | Knowles Electronics, Llc | Audio level estimator assisted false wake abatement systems and methods |
US20200202843A1 (en) * | 2018-12-21 | 2020-06-25 | Knowles Electronics, Llc | Unwanted keyword detection abatement systems and methods |
US11521599B1 (en) * | 2019-09-20 | 2022-12-06 | Amazon Technologies, Inc. | Wakeword detection using a neural network |
US11289086B2 (en) * | 2019-11-01 | 2022-03-29 | Microsoft Technology Licensing, Llc | Selective response rendering for virtual assistants |
US11694682B1 (en) * | 2019-12-11 | 2023-07-04 | Amazon Technologies, Inc. | Triggering voice control disambiguation |
WO2022100283A1 (zh) * | 2020-11-13 | 2022-05-19 | 海信视像科技股份有限公司 | 显示设备、控件触发方法及滚动文本检测方法 |
-
2019
- 2019-12-11 CN CN201980097616.6A patent/CN114207710A/zh active Pending
- 2019-12-11 EP EP19832259.6A patent/EP3970139A1/en active Pending
- 2019-12-11 KR KR1020227001309A patent/KR20220024557A/ko unknown
- 2019-12-11 JP JP2021574854A patent/JP7354301B2/ja active Active
- 2019-12-11 US US16/973,384 patent/US11948556B2/en active Active
- 2019-12-11 WO PCT/US2019/065656 patent/WO2021076164A1/en unknown
-
2023
- 2023-09-19 JP JP2023151488A patent/JP2023169309A/ja active Pending
-
2024
- 2024-02-19 US US18/581,286 patent/US20240194190A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002082748A (ja) * | 2000-09-06 | 2002-03-22 | Sanyo Electric Co Ltd | ユーザ支援装置 |
JP2005011089A (ja) * | 2003-06-19 | 2005-01-13 | Fujitsu Ltd | 対話装置 |
JP2008145989A (ja) * | 2006-12-13 | 2008-06-26 | Fujitsu Ten Ltd | 音声識別装置および音声識別方法 |
JP2011003066A (ja) * | 2009-06-19 | 2011-01-06 | Ntt Docomo Inc | 情報取得装置、情報取得プログラム |
JP2014071449A (ja) * | 2012-09-28 | 2014-04-21 | Samsung Electronics Co Ltd | 電子装置、サーバー及びその制御方法 |
US8719039B1 (en) * | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
JP2017211608A (ja) * | 2016-05-27 | 2017-11-30 | トヨタ自動車株式会社 | 音声対話装置および音声対話方法 |
US20180182390A1 (en) * | 2016-12-27 | 2018-06-28 | Google Inc. | Contextual hotwords |
WO2019103007A1 (ja) * | 2017-11-24 | 2019-05-31 | 株式会社Nttドコモ | 情報処理装置及び情報処理方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7333490B1 (ja) | 2022-10-13 | 2023-08-24 | アクションパワー コーポレイション | 音声信号に関連するコンテンツを決定する方法、コンピューター可読保存媒体に保存されたコンピュータープログラム及びコンピューティング装置 |
JP2024058553A (ja) * | 2022-10-13 | 2024-04-25 | アクションパワー コーポレイション | 音声信号に関連するコンテンツを決定する方法、コンピューター可読保存媒体に保存されたコンピュータープログラム及びコンピューティング装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3970139A1 (en) | 2022-03-23 |
US11948556B2 (en) | 2024-04-02 |
KR20220024557A (ko) | 2022-03-03 |
CN114207710A (zh) | 2022-03-18 |
JP7354301B2 (ja) | 2023-10-02 |
US20210335342A1 (en) | 2021-10-28 |
JP2023169309A (ja) | 2023-11-29 |
US20240194190A1 (en) | 2024-06-13 |
WO2021076164A1 (en) | 2021-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7354301B2 (ja) | 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録 | |
US11810557B2 (en) | Dynamic and/or context-specific hot words to invoke automated assistant | |
JP7418526B2 (ja) | 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード | |
EP3895161B1 (en) | Utilizing pre-event and post-event input streams to engage an automated assistant | |
US11023051B2 (en) | Selective detection of visual cues for automated assistants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220210 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230821 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7354301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |