JP2018533790A - 音声クエリの検索結果のプリフェッチ処理 - Google Patents
音声クエリの検索結果のプリフェッチ処理 Download PDFInfo
- Publication number
- JP2018533790A JP2018533790A JP2018520606A JP2018520606A JP2018533790A JP 2018533790 A JP2018533790 A JP 2018533790A JP 2018520606 A JP2018520606 A JP 2018520606A JP 2018520606 A JP2018520606 A JP 2018520606A JP 2018533790 A JP2018533790 A JP 2018533790A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- search query
- previously received
- transcription
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013518 transcription Methods 0.000 claims abstract description 148
- 230000035897 transcription Effects 0.000 claims abstract description 140
- 238000000034 method Methods 0.000 claims abstract description 38
- 230000004044 response Effects 0.000 claims abstract description 12
- 230000009471 action Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 abstract description 11
- 230000015654 memory Effects 0.000 description 36
- 241000251730 Chondrichthyes Species 0.000 description 21
- 238000004891 communication Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 5
- 241000269978 Pleuronectiformes Species 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
102 モバイルコンピュータデバイス
104 フロントエンドエンジン
106 連続音声認識器
108 完了エンジン
110 クエリログ
112 サーチエンジン
114 キャッシュ
116 ユーザ
200 プロセス
400 コンピュータデバイス
402 プロセッサ
404 メモリ
406 ストレージデバイス
408 高速インターフェース
410 高速拡張ポート
412 低速インターフェース
414 低速拡張ポート
416 ディスプレイ
420 サーバ
422 ラップトップコンピュータ
424 ラックサーバシステム
440 デバイス
442 拡張インターフェース
444 拡張メモリ
446 ディスプレイインターフェース
448 制御インターフェース
452 プロセッサ
454 ディスプレイ
456 ディスプレイインターフェース
458 制御インターフェース
460 オーディオコーデック
462 外部インターフェース
464 メモリ
468 トランシーバ
476 通信インターフェース
480 セルラ電話
482 スマートフォン
Claims (17)
- 発話を符号化しているオーディオデータを受信するステップと、
前記発話の中間トランスクリプションを取得するステップと、
前記発話の最終的なトランスクリプションが取得される前に、
i)前記発話の前記中間トランスクリプションが以前受信した検索クエリに関連していると決定するステップと、
ii)前記以前受信した検索クエリに応答したものとして識別された1つまたは複数の結果を取得するステップと、
iii)前記結果のうちの1つまたは複数を記憶するステップと、
前記発話の前記最終的なトランスクリプションを取得するステップと、
前記発話の前記最終的なトランスクリプションも前記以前受信した検索クエリに関連していると決定するステップと、
前記発話の前記最終的なトランスクリプションも前記以前受信した検索クエリに関連していると決定するステップに応じて、出力のために前記記憶されている1つまたは複数の結果を提供するステップと
を含む、方法。 - 前記発話の前記中間トランスクリプションが閾値サイズ有していると決定するステップであって、前記発話の前記中間トランスクリプションは、前記中間トランスクリプションが前記閾値サイズ有していると決定した後にのみ、前記以前受信した検索クエリに関連していると決定される、ステップをさらに含む、請求項1に記載の方法。
- 前記発話の前記中間トランスクリプションは、連続音声認識器によって生成され、前記1つまたは複数の結果は、サーチエンジンから取得される、請求項1または2に記載の方法。
- 前記発話の前記中間トランスクリプションが前記以前受信した検索クエリに関連していると決定するステップの後に、サーチエンジンによる再実行のために前記以前受信した検索クエリを送信するステップをさらに含む、請求項1、2、または3に記載の方法。
- 前記発話の前記中間トランスクリプションが前記以前受信した検索クエリに関連していると決定するステップは、前記発話に関連したロケーションが前記以前受信した検索クエリに関連付けられたロケーションに関連していると決定するステップを含む、請求項1から4のいずれか一項に記載の方法。
- 前記発話の前記中間トランスクリプションが前記以前受信した検索クエリに関連していると決定するステップは、前記発話の前記中間トランスクリプションが前記発話と関連している同一のユーザによって送信された以前受信した検索クエリに関連していると決定するステップを含む、請求項1から5のいずれか一項に記載の方法。
- 前記発話の前記中間トランスクリプションが前記以前受信した検索クエリに関連していると決定するステップは、前記発話の前記中間トランスクリプションが前記発話と関連しているユーザとは異なるユーザによって送信された以前受信した検索クエリに関連していると決定するステップを含む、請求項1から5のいずれか一項に記載の方法。
- 前記発話は、音声クエリ以外の音声コマンドである、請求項1から7のいずれか一項に記載の方法。
- 前記発話の前記中間トランスクリプションが以前受信した検索クエリに関連していると決定するステップは、前記発話の前記中間トランスクリプションが前記以前受信した検索クエリの一部と同一であると決定するステップをさらに含む、請求項1から8のいずれか一項に記載の方法。
- 前記発話の前記中間トランスクリプションが以前受信した検索クエリに関連していると決定するステップは、前記発話の前記中間トランスクリプションが前記以前受信した検索クエリの一部に対する閾値類似度内にあると決定するステップをさらに含む、請求項1から8のいずれか一項に記載の方法。
- システムであって、
1つまたは複数のコンピュータと、命令を記憶する1つまたは複数のストレージデバイスとを含み、前記命令は、前記1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに、
発話を符号化しているオーディオデータを受信するステップと、
前記発話の中間トランスクリプションを取得するステップと、
前記発話の最終的なトランスクリプションが取得される前に、
i)前記発話の前記中間トランスクリプションが以前受信した検索クエリに関連していると決定するステップと、
ii)前記以前受信した検索クエリに応答したものとして識別された1つまたは複数の結果を取得するステップと、
iii)前記結果のうちの1つまたは複数を記憶するステップと、
前記発話の前記最終的なトランスクリプションを取得するステップと、
前記発話の前記最終的なトランスクリプションも前記以前受信した検索クエリに関連していると決定するステップと、
前記発話の前記最終的なトランスクリプションも前記以前受信した検索クエリに関連していると決定するステップに応じて、出力のために前記記憶されている1つまたは複数の結果を提供するステップと
を含む動作を行わせるように動作可能である、システム。 - 前記動作は、前記発話の前記中間トランスクリプションが閾値サイズ有していると決定するステップであって、前記発話の前記中間トランスクリプションは、前記中間トランスクリプションが前記閾値サイズ有していると決定した後にのみ、前記以前受信した検索クエリに関連していると決定される、ステップをさらに含む、請求項11に記載のシステム。
- 前記発話の前記中間トランスクリプションは、連続音声認識器によって生成され、前記1つまたは複数の結果は、サーチエンジンから取得される、請求項11または12に記載のシステム。
- 前記動作は、前記発話の前記中間トランスクリプションが前記以前受信した検索クエリに関連していると決定するステップの後に、サーチエンジンによる再実行のために前記以前受信した検索クエリを送信するステップをさらに含む、請求項11、12、または13に記載のシステム。
- 前記発話の前記中間トランスクリプションが前記以前受信した検索クエリに関連していると決定するステップは、前記発話に関連したロケーションが前記以前受信した検索クエリに関連付けられたロケーションに関連していると決定するステップを含む、請求項11、12、13、または14に記載のシステム。
- 前記発話の前記中間トランスクリプションが前記以前受信した検索クエリに関連していると決定するステップは、前記発話の前記中間トランスクリプションが前記発話と関連している同一のユーザによって送信された以前受信した検索クエリに関連していると決定するステップを含む、請求項11、12、13、14、または15に記載のシステム。
- その実行時に、前記1つまたは複数のコンピュータに、請求項1から10のいずれか一項に記載の方法を含む動作を行わせる、1つまたは複数のコンピュータによって実行可能な命令を含むソフトウェアを記憶する、コンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/988,990 US10133821B2 (en) | 2016-01-06 | 2016-01-06 | Search result prefetching of voice queries |
US14/988,990 | 2016-01-06 | ||
PCT/US2016/062819 WO2017119956A1 (en) | 2016-01-06 | 2016-11-18 | Search result prefetching of voice queries |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018533790A true JP2018533790A (ja) | 2018-11-15 |
JP6487120B2 JP6487120B2 (ja) | 2019-03-20 |
Family
ID=57472107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018520606A Active JP6487120B2 (ja) | 2016-01-06 | 2016-11-18 | 音声クエリの検索結果のプリフェッチ処理 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10133821B2 (ja) |
EP (1) | EP3350725B1 (ja) |
JP (1) | JP6487120B2 (ja) |
KR (1) | KR102021556B1 (ja) |
CN (1) | CN107066494B (ja) |
DE (2) | DE202016008204U1 (ja) |
RU (1) | RU2701082C1 (ja) |
WO (1) | WO2017119956A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6481643B2 (ja) * | 2016-03-08 | 2019-03-13 | トヨタ自動車株式会社 | 音声処理システムおよび音声処理方法 |
CN107644095A (zh) * | 2017-09-28 | 2018-01-30 | 百度在线网络技术(北京)有限公司 | 用于搜索信息的方法和装置 |
CN109976696B (zh) * | 2017-12-28 | 2022-05-10 | 深圳市优必选科技有限公司 | 获取音频数据的方法及装置、设备、计算机可读存储介质 |
KR20190113130A (ko) * | 2018-03-27 | 2019-10-08 | 삼성전자주식회사 | 사용자 음성 입력을 처리하는 장치 |
US11710480B2 (en) * | 2019-08-07 | 2023-07-25 | International Business Machines Corporation | Phonetic comparison for virtual assistants |
KR20210042520A (ko) | 2019-10-10 | 2021-04-20 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090006343A1 (en) * | 2007-06-28 | 2009-01-01 | Microsoft Corporation | Machine assisted query formulation |
US8521526B1 (en) * | 2010-07-28 | 2013-08-27 | Google Inc. | Disambiguation of a spoken query term |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4592086A (en) | 1981-12-09 | 1986-05-27 | Nippon Electric Co., Ltd. | Continuous speech recognition system |
US5615296A (en) | 1993-11-12 | 1997-03-25 | International Business Machines Corporation | Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors |
US5995928A (en) * | 1996-10-02 | 1999-11-30 | Speechworks International, Inc. | Method and apparatus for continuous spelling speech recognition with early identification |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7027987B1 (en) * | 2001-02-07 | 2006-04-11 | Google Inc. | Voice interface for a search engine |
US7836044B2 (en) * | 2004-06-22 | 2010-11-16 | Google Inc. | Anticipated query generation and processing in a search engine |
US20060161541A1 (en) | 2005-01-19 | 2006-07-20 | Microsoft Corporation | System and method for prefetching and caching query results |
US7461059B2 (en) * | 2005-02-23 | 2008-12-02 | Microsoft Corporation | Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks |
US8751240B2 (en) * | 2005-05-13 | 2014-06-10 | At&T Intellectual Property Ii, L.P. | Apparatus and method for forming search engine queries based on spoken utterances |
US7516124B2 (en) | 2005-12-20 | 2009-04-07 | Yahoo! Inc. | Interactive search engine |
US8719265B1 (en) | 2005-11-07 | 2014-05-06 | Google Inc. | Pre-fetching information in anticipation of a user request |
US7565157B1 (en) * | 2005-11-18 | 2009-07-21 | A9.Com, Inc. | System and method for providing search results based on location |
US8874591B2 (en) * | 2006-01-31 | 2014-10-28 | Microsoft Corporation | Using user feedback to improve search results |
US8352261B2 (en) * | 2008-03-07 | 2013-01-08 | Canyon IP Holdings, LLC | Use of intermediate speech transcription results in editing final speech transcription results |
US8260809B2 (en) * | 2007-06-28 | 2012-09-04 | Microsoft Corporation | Voice-based search processing |
US20100049678A1 (en) | 2008-08-25 | 2010-02-25 | Alcatel-Lucent | System and method of prefetching and caching web services requests |
US8903793B2 (en) | 2009-12-15 | 2014-12-02 | At&T Intellectual Property I, L.P. | System and method for speech-based incremental search |
US8468012B2 (en) * | 2010-05-26 | 2013-06-18 | Google Inc. | Acoustic model adaptation using geographic information |
US8612418B2 (en) | 2011-07-14 | 2013-12-17 | Google Inc. | Mobile web browser for pre-loading web pages |
US8650031B1 (en) * | 2011-07-31 | 2014-02-11 | Nuance Communications, Inc. | Accuracy improvement of spoken queries transcription using co-occurrence information |
US10354650B2 (en) * | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
WO2014039106A1 (en) * | 2012-09-10 | 2014-03-13 | Google Inc. | Answering questions using environmental context |
US8484017B1 (en) * | 2012-09-10 | 2013-07-09 | Google Inc. | Identifying media content |
EP2706470A1 (en) * | 2012-09-10 | 2014-03-12 | Google Inc. | Answering questions using environmental context |
US8589164B1 (en) * | 2012-10-18 | 2013-11-19 | Google Inc. | Methods and systems for speech recognition processing using search query information |
US8494853B1 (en) * | 2013-01-04 | 2013-07-23 | Google Inc. | Methods and systems for providing speech recognition systems based on speech recordings logs |
US9368106B2 (en) | 2013-07-30 | 2016-06-14 | Verint Systems Ltd. | System and method of automated evaluation of transcription quality |
US9607613B2 (en) | 2014-04-23 | 2017-03-28 | Google Inc. | Speech endpointing based on word comparisons |
-
2016
- 2016-01-06 US US14/988,990 patent/US10133821B2/en active Active
- 2016-11-18 RU RU2018114071A patent/RU2701082C1/ru active
- 2016-11-18 JP JP2018520606A patent/JP6487120B2/ja active Active
- 2016-11-18 WO PCT/US2016/062819 patent/WO2017119956A1/en active Application Filing
- 2016-11-18 EP EP16805695.0A patent/EP3350725B1/en active Active
- 2016-11-18 KR KR1020187011132A patent/KR102021556B1/ko active IP Right Grant
- 2016-12-21 DE DE202016008204.4U patent/DE202016008204U1/de active Active
- 2016-12-21 DE DE102016125141.0A patent/DE102016125141B4/de active Active
- 2016-12-29 CN CN201611247711.4A patent/CN107066494B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090006343A1 (en) * | 2007-06-28 | 2009-01-01 | Microsoft Corporation | Machine assisted query formulation |
US8521526B1 (en) * | 2010-07-28 | 2013-08-27 | Google Inc. | Disambiguation of a spoken query term |
Also Published As
Publication number | Publication date |
---|---|
KR102021556B1 (ko) | 2019-11-04 |
CN107066494B (zh) | 2021-01-12 |
EP3350725B1 (en) | 2019-07-10 |
US20170193111A1 (en) | 2017-07-06 |
DE202016008204U1 (de) | 2017-05-10 |
CN107066494A (zh) | 2017-08-18 |
DE102016125141B4 (de) | 2024-05-23 |
JP6487120B2 (ja) | 2019-03-20 |
RU2701082C1 (ru) | 2019-09-24 |
EP3350725A1 (en) | 2018-07-25 |
US10133821B2 (en) | 2018-11-20 |
KR20180056723A (ko) | 2018-05-29 |
DE102016125141A1 (de) | 2017-07-06 |
WO2017119956A1 (en) | 2017-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11682396B2 (en) | Providing pre-computed hotword models | |
JP6630765B2 (ja) | 個別化されたホットワード検出モデル | |
JP6487120B2 (ja) | 音声クエリの検索結果のプリフェッチ処理 | |
US9293136B2 (en) | Multiple recognizer speech recognition | |
KR102115541B1 (ko) | 외부 데이터 소스들을 사용한 스피치 재-인식 | |
US9401146B2 (en) | Identification of communication-related voice commands | |
US9576578B1 (en) | Contextual improvement of voice query recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180613 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180514 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180613 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6487120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |