JP6113008B2 - ハイブリッド型音声認識 - Google Patents
ハイブリッド型音声認識 Download PDFInfo
- Publication number
- JP6113008B2 JP6113008B2 JP2013146533A JP2013146533A JP6113008B2 JP 6113008 B2 JP6113008 B2 JP 6113008B2 JP 2013146533 A JP2013146533 A JP 2013146533A JP 2013146533 A JP2013146533 A JP 2013146533A JP 6113008 B2 JP6113008 B2 JP 6113008B2
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- recognition result
- engine
- result
- providing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 57
- 230000005236 sound signal Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 238000004590 computer program Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241001061260 Emmelichthys struhsakeri Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Computer And Data Communications (AREA)
Description
Claims (5)
- クライアント装置が実行する、コンピュータで実施される方法であって、
(A)オーディオ信号に自動音声認識を適用するよう求める要求を、要求者から受信するステップと、
(B)前記オーディオ信号を、前記クライアント装置内の第1の自動音声認識エンジンに供給するステップと、
(C)前記オーディオ信号を、サーバ装置内の第2の自動音声認識エンジンに供給するステップと、
(D)前記第1の自動音声認識エンジンから第1の音声認識結果を、前記クライアント装置内のアービトレーション・エンジンにおいて受信するステップと、
(E)前記第2の自動音声認識エンジンから第2の音声認識結果を、前記クライアント装置内の前記アービトレーション・エンジンにおいて受信するステップであって、前記クライアント装置が、前記第1および第2の自動音声認識エンジンのうちの一方を好ましい音声認識エンジンとして扱うように構成される、前記受信するステップと、
(F)前記第1の音声認識結果および/または前記第2の音声認識結果に基づいて、ハイブリッド型音声認識結果を前記要求者に提供するステップであって、
前記提供するステップは、前記第1の音声認識結果を第1の時点で受信し、前記第2の音声認識結果を前記第1の時点よりも後の第2の時点で受信した場合、
(F)(1)前記ハイブリッド型音声認識結果として前記第1の音声認識結果を提供するステップと、
(F)(2)前記第2の自動音声認識エンジンが前記好ましい音声認識エンジンである場合にのみ、前記ハイブリッド型音声認識結果として前記第2の音声認識結果を提供するステップと、を含む方法。 - クライアント装置が実行する、コンピュータで実施される方法であって、
(A)オーディオ信号に自動音声認識を適用するよう求める要求を、要求者から受信するステップと、
(B)前記オーディオ信号を、前記クライアント装置内の第1の自動音声認識エンジンに供給するステップと、
(C)前記オーディオ信号を、サーバ装置内の第2の自動音声認識エンジンに供給するステップと、
(D)前記第1の自動音声認識エンジンから第1の音声認識結果を、前記クライアント装置内のアービトレーション・エンジンにおいて受信するステップと、
(E)前記第2の自動音声認識エンジンから第2の音声認識結果を、前記クライアント装置内の前記アービトレーション・エンジンにおいて受信するステップと、
(F)前記第1の音声認識結果および/または前記第2の音声認識結果に基づいて、ハイブリッド型音声認識結果を前記要求者に提供するステップであって、
前記提供するステップは、前記第1の音声認識結果を第1の時点で受信し、前記第2の音声認識結果を前記第1の時点よりも後の第2の時点で受信した場合、
(F)(1)前記ハイブリッド型音声認識結果として前記第1の音声認識結果を提供するステップと、
(F)(2)前記第1の音声認識結果内の任意の単語とオーバラップしない前記第2の音声認識結果内の単語を、それぞれの単語に関連するタイム・スタンプを使用して識別するステップと、
(F)(3)前記ハイブリッド型音声認識結果として前記第2の音声認識結果からのオーバラップしていない単語のみを提供するステップとを含む方法。 - (F)が、
(F)(3)前記第1の音声認識結果を、前記ハイブリッド型音声認識結果内の前記第2の音声認識結果で置き換えるステップを含む、請求項1に記載の方法。 - オーディオ信号に自動音声認識を適用するよう求める要求を、要求者から受信するための手段と、
前記オーディオ信号を、クライアント装置内の第1の自動音声認識エンジンに供給するための手段と、
前記オーディオ信号を、サーバ装置内の第2の自動音声認識エンジンに供給するための手段と、
前記第1の自動音声認識エンジンから第1の音声認識結果を、前記クライアント装置内のアービトレーション・エンジンにおいて受信するための手段と、
前記第2の自動音声認識エンジンから第2の音声認識結果を、前記クライアント装置内の前記アービトレーション・エンジンにおいて受信するための手段であって、前記クライアント装置が、前記第1および第2の自動音声認識エンジンのうちの一方を好ましい音声認識エンジンとして扱うように構成される、前記受信するための手段と、
前記第1の音声認識結果および/または前記第2の音声認識結果に基づいて、ハイブリッド型音声認識結果を前記要求者に提供するための手段であって、
前記提供するための手段は、前記第1の音声認識結果を第1の時点で受信し、前記第2の音声認識結果を前記第1の時点よりも後の第2の時点で受信した場合、
前記ハイブリッド型音声認識結果として前記第1の音声認識結果を提供するための手段と、
前記第2の自動音声認識エンジンが前記好ましい音声認識エンジンである場合にのみ、前記ハイブリッド型音声認識結果として前記第2の音声認識結果を提供するための手段と、を含む、提供するための手段とを備える装置。 - オーディオ信号に自動音声認識を適用するよう求める要求を、要求者から受信するための手段と、
前記オーディオ信号を、前記クライアント装置内の第1の自動音声認識エンジンに供給するための手段と、
前記オーディオ信号を、サーバ装置内の第2の自動音声認識エンジンに供給するための手段と、
前記第1の自動音声認識エンジンから第1の音声認識結果を、前記クライアント装置内のアービトレーション・エンジンにおいて受信するための手段と、
前記第2の自動音声認識エンジンから第2の音声認識結果を、前記クライアント装置内の前記アービトレーション・エンジンにおいて受信するための手段と、
前記第1の音声認識結果および/または前記第2の音声認識結果に基づいて、ハイブリッド型音声認識結果を前記要求者に提供するための手段であって、
前記提供する手段は、前記第1の音声認識結果を第1の時点で受信し、前記第2の音声認識結果を前記第1の時点よりも後の第2の時点で受信した場合、
前記ハイブリッド型音声認識結果として前記第1の音声認識結果を提供するための手段と、
前記第1の音声認識結果内の任意の単語とオーバラップしない前記第2の音声認識結果内の単語を、それぞれの単語に関連するタイム・スタンプを使用して識別するための手段と、
前記ハイブリッド型音声認識結果として前記第2の音声認識結果からのオーバラップしていない単語のみを提供するための手段とを含む、提供するための手段とを備える装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US9322008P | 2008-08-29 | 2008-08-29 | |
US61/093,220 | 2008-08-29 | ||
US12/550,380 US7933777B2 (en) | 2008-08-29 | 2009-08-30 | Hybrid speech recognition |
US12/550,380 | 2009-08-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011525265A Division JP2012501480A (ja) | 2008-08-29 | 2009-08-31 | ハイブリッド型音声認識 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013232001A JP2013232001A (ja) | 2013-11-14 |
JP6113008B2 true JP6113008B2 (ja) | 2017-04-12 |
Family
ID=41722338
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011525265A Pending JP2012501480A (ja) | 2008-08-29 | 2009-08-31 | ハイブリッド型音声認識 |
JP2013146533A Active JP6113008B2 (ja) | 2008-08-29 | 2013-07-12 | ハイブリッド型音声認識 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011525265A Pending JP2012501480A (ja) | 2008-08-29 | 2009-08-31 | ハイブリッド型音声認識 |
Country Status (5)
Country | Link |
---|---|
US (3) | US7933777B2 (ja) |
EP (1) | EP2329491B1 (ja) |
JP (2) | JP2012501480A (ja) |
CA (2) | CA2732255C (ja) |
WO (1) | WO2010025440A2 (ja) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8335688B2 (en) * | 2004-08-20 | 2012-12-18 | Multimodal Technologies, Llc | Document transcription system training |
US7844464B2 (en) * | 2005-07-22 | 2010-11-30 | Multimodal Technologies, Inc. | Content-based audio playback emphasis |
US20120253823A1 (en) * | 2004-09-10 | 2012-10-04 | Thomas Barton Schalk | Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing |
US7502741B2 (en) * | 2005-02-23 | 2009-03-10 | Multimodal Technologies, Inc. | Audio signal de-identification |
US7640158B2 (en) | 2005-11-08 | 2009-12-29 | Multimodal Technologies, Inc. | Automatic detection and application of editing patterns in draft documents |
US7831423B2 (en) * | 2006-05-25 | 2010-11-09 | Multimodal Technologies, Inc. | Replacing text representing a concept with an alternate written form of the concept |
US20070299665A1 (en) * | 2006-06-22 | 2007-12-27 | Detlef Koll | Automatic Decision Support |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8019608B2 (en) | 2008-08-29 | 2011-09-13 | Multimodal Technologies, Inc. | Distributed speech recognition using one way communication |
US7933777B2 (en) * | 2008-08-29 | 2011-04-26 | Multimodal Technologies, Inc. | Hybrid speech recognition |
US20100125450A1 (en) | 2008-10-27 | 2010-05-20 | Spheris Inc. | Synchronized transcription rules handling |
US8346549B2 (en) * | 2009-12-04 | 2013-01-01 | At&T Intellectual Property I, L.P. | System and method for supplemental speech recognition by identified idle resources |
US20110184740A1 (en) * | 2010-01-26 | 2011-07-28 | Google Inc. | Integration of Embedded and Network Speech Recognizers |
JP2011232619A (ja) * | 2010-04-28 | 2011-11-17 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
JP2013529794A (ja) | 2010-06-24 | 2013-07-22 | 本田技研工業株式会社 | 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法 |
US8959102B2 (en) | 2010-10-08 | 2015-02-17 | Mmodal Ip Llc | Structured searching of dynamic structured document corpuses |
US9674328B2 (en) | 2011-02-22 | 2017-06-06 | Speak With Me, Inc. | Hybridized client-server speech recognition |
CN103650034A (zh) * | 2011-07-05 | 2014-03-19 | 三菱电机株式会社 | 语音识别装置及导航装置 |
US9009041B2 (en) * | 2011-07-26 | 2015-04-14 | Nuance Communications, Inc. | Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data |
JP5658641B2 (ja) * | 2011-09-15 | 2015-01-28 | 株式会社Nttドコモ | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
US8924219B1 (en) | 2011-09-30 | 2014-12-30 | Google Inc. | Multi hotword robust continuous voice command detection in mobile devices |
US20130085753A1 (en) * | 2011-09-30 | 2013-04-04 | Google Inc. | Hybrid Client/Server Speech Recognition In A Mobile Device |
JP5821639B2 (ja) * | 2012-01-05 | 2015-11-24 | 株式会社デンソー | 音声認識装置 |
JP5957269B2 (ja) * | 2012-04-09 | 2016-07-27 | クラリオン株式会社 | 音声認識サーバ統合装置および音声認識サーバ統合方法 |
US9715879B2 (en) * | 2012-07-02 | 2017-07-25 | Salesforce.Com, Inc. | Computer implemented methods and apparatus for selectively interacting with a server to build a local database for speech recognition at a device |
US9583100B2 (en) * | 2012-09-05 | 2017-02-28 | GM Global Technology Operations LLC | Centralized speech logger analysis |
JP2014062944A (ja) * | 2012-09-20 | 2014-04-10 | Sharp Corp | 情報処理装置 |
JP5706384B2 (ja) * | 2012-09-24 | 2015-04-22 | 株式会社東芝 | 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム |
KR20140058127A (ko) * | 2012-11-06 | 2014-05-14 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9171066B2 (en) * | 2012-11-12 | 2015-10-27 | Nuance Communications, Inc. | Distributed natural language understanding and processing using local data sources |
US9704486B2 (en) * | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9190057B2 (en) * | 2012-12-12 | 2015-11-17 | Amazon Technologies, Inc. | Speech model retrieval in distributed speech recognition systems |
KR20140087717A (ko) * | 2012-12-31 | 2014-07-09 | 삼성전자주식회사 | 디스플레이 장치 및 제어 방법 |
KR20140089863A (ko) * | 2013-01-07 | 2014-07-16 | 삼성전자주식회사 | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 |
KR102112742B1 (ko) * | 2013-01-22 | 2020-05-19 | 삼성전자주식회사 | 전자장치 및 그 음성 처리 방법 |
JP6281202B2 (ja) * | 2013-07-30 | 2018-02-21 | 株式会社デンソー | 応答制御システム、およびセンター |
US10885918B2 (en) | 2013-09-19 | 2021-01-05 | Microsoft Technology Licensing, Llc | Speech recognition using phoneme matching |
DE102013219649A1 (de) * | 2013-09-27 | 2015-04-02 | Continental Automotive Gmbh | Verfahren und System zum Erstellen oder Ergänzen eines benutzerspezifischen Sprachmodells in einem mit einem Endgerät verbindbaren lokalen Datenspeicher |
JP6054283B2 (ja) * | 2013-11-27 | 2016-12-27 | シャープ株式会社 | 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラム、サーバの制御プログラムおよび音声認識端末の制御方法 |
US9905225B2 (en) | 2013-12-26 | 2018-02-27 | Panasonic Intellectual Property Management Co., Ltd. | Voice recognition processing device, voice recognition processing method, and display device |
DE102014200570A1 (de) * | 2014-01-15 | 2015-07-16 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren und System zur Erzeugung eines Steuerungsbefehls |
FR3016458B1 (fr) | 2014-01-16 | 2017-06-16 | Cie Ind Et Financiere D'ingenierie Ingenico | Procede de securisation d'une transaction realisee par carte bancaire |
US9601108B2 (en) | 2014-01-17 | 2017-03-21 | Microsoft Technology Licensing, Llc | Incorporating an exogenous large-vocabulary model into rule-based speech recognition |
KR102215579B1 (ko) | 2014-01-22 | 2021-02-15 | 삼성전자주식회사 | 대화형 시스템, 디스플레이 장치 및 그 제어 방법 |
US10749989B2 (en) | 2014-04-01 | 2020-08-18 | Microsoft Technology Licensing Llc | Hybrid client/server architecture for parallel processing |
CN104978965B (zh) | 2014-04-07 | 2019-04-26 | 三星电子株式会社 | 电子装置及利用电子装置和服务器的语音识别执行方法 |
KR101585105B1 (ko) * | 2014-08-11 | 2016-01-13 | 주식회사 케이티 | 음성 인식 장치, 방법 및 시스템 |
JP6118838B2 (ja) * | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
US20160111090A1 (en) * | 2014-10-16 | 2016-04-21 | General Motors Llc | Hybridized automatic speech recognition |
JP2015143866A (ja) * | 2015-02-25 | 2015-08-06 | 株式会社東芝 | 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム |
US20180211668A1 (en) * | 2015-07-17 | 2018-07-26 | Nuance Communications, Inc. | Reduced latency speech recognition system using multiple recognizers |
KR102365757B1 (ko) * | 2015-09-09 | 2022-02-18 | 삼성전자주식회사 | 인식 장치, 인식 방법 및 협업 처리 장치 |
US9997161B2 (en) | 2015-09-11 | 2018-06-12 | Microsoft Technology Licensing, Llc | Automatic speech recognition confidence classifier |
US10706852B2 (en) | 2015-11-13 | 2020-07-07 | Microsoft Technology Licensing, Llc | Confidence features for automated speech recognition arbitration |
CN107452383B (zh) * | 2016-05-31 | 2021-10-26 | 华为终端有限公司 | 一种信息处理方法、服务器、终端及信息处理系统 |
US10546061B2 (en) | 2016-08-17 | 2020-01-28 | Microsoft Technology Licensing, Llc | Predicting terms by using model chunks |
US11115463B2 (en) * | 2016-08-17 | 2021-09-07 | Microsoft Technology Licensing, Llc | Remote and local predictions |
KR101700099B1 (ko) * | 2016-10-11 | 2017-01-31 | 미디어젠(주) | 하이브리드 음성인식 복합 성능 자동 평가시스템 |
CN108010523B (zh) * | 2016-11-02 | 2023-05-09 | 松下电器(美国)知识产权公司 | 信息处理方法以及记录介质 |
JP6751658B2 (ja) | 2016-11-15 | 2020-09-09 | クラリオン株式会社 | 音声認識装置、音声認識システム |
US10971157B2 (en) | 2017-01-11 | 2021-04-06 | Nuance Communications, Inc. | Methods and apparatus for hybrid speech recognition processing |
US10614804B2 (en) | 2017-01-24 | 2020-04-07 | Honeywell International Inc. | Voice control of integrated room automation system |
KR20180118461A (ko) * | 2017-04-21 | 2018-10-31 | 엘지전자 주식회사 | 음성 인식 장치 및 음성 인식 방법 |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US20200211562A1 (en) * | 2017-06-22 | 2020-07-02 | Mitsubishi Electric Corporation | Voice recognition device and voice recognition method |
US10515637B1 (en) | 2017-09-19 | 2019-12-24 | Amazon Technologies, Inc. | Dynamic speech processing |
US11597519B2 (en) | 2017-10-17 | 2023-03-07 | The Boeing Company | Artificially intelligent flight crew systems and methods |
KR102471493B1 (ko) * | 2017-10-17 | 2022-11-29 | 삼성전자주식회사 | 전자 장치 및 음성 인식 방법 |
DE102017222549A1 (de) | 2017-12-13 | 2019-06-13 | Robert Bosch Gmbh | Steuerverfahren und Sprachdialogsystem |
US10192554B1 (en) * | 2018-02-26 | 2019-01-29 | Sorenson Ip Holdings, Llc | Transcription of communications using multiple speech recognition systems |
KR102517228B1 (ko) | 2018-03-14 | 2023-04-04 | 삼성전자주식회사 | 사용자의 입력에 대한 외부 전자 장치의 응답 시간에 기반하여 지정된 기능을 제어하는 전자 장치 및 그의 방법 |
US20190332848A1 (en) | 2018-04-27 | 2019-10-31 | Honeywell International Inc. | Facial enrollment and recognition system |
US10147428B1 (en) * | 2018-05-30 | 2018-12-04 | Green Key Technologies Llc | Computer systems exhibiting improved computer speed and transcription accuracy of automatic speech transcription (AST) based on a multiple speech-to-text engines and methods of use thereof |
US20190390866A1 (en) | 2018-06-22 | 2019-12-26 | Honeywell International Inc. | Building management system with natural language interface |
EP3800633B1 (en) * | 2018-06-27 | 2023-10-11 | Google LLC | Rendering responses to a spoken utterance of a user utilizing a local text-response map |
US11094326B2 (en) * | 2018-08-06 | 2021-08-17 | Cisco Technology, Inc. | Ensemble modeling of automatic speech recognition output |
US11967318B2 (en) * | 2019-01-08 | 2024-04-23 | Samsung Electronics Co., Ltd. | Method and system for performing speech recognition in an electronic device |
US20220328047A1 (en) * | 2019-06-04 | 2022-10-13 | Nippon Telegraph And Telephone Corporation | Speech recognition control apparatus, speech recognition control method, and program |
KR102266062B1 (ko) * | 2019-07-01 | 2021-06-17 | 주식회사 한글과컴퓨터 | 분할 음성 인식을 기반으로 발화자의 음성에 대응하는 텍스트의 생성이 가능한 음성 인식 장치 및 그 동작 방법 |
CN114223029A (zh) | 2019-08-13 | 2022-03-22 | 三星电子株式会社 | 支持装置进行语音识别的服务器及服务器的操作方法 |
WO2021029643A1 (en) | 2019-08-13 | 2021-02-18 | Samsung Electronics Co., Ltd. | System and method for modifying speech recognition result |
WO2021029642A1 (en) | 2019-08-13 | 2021-02-18 | Samsung Electronics Co., Ltd. | System and method for recognizing user's speech |
KR20210042520A (ko) * | 2019-10-10 | 2021-04-20 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
JP2020129130A (ja) * | 2020-04-27 | 2020-08-27 | パイオニア株式会社 | 情報処理装置 |
CN111627431B (zh) * | 2020-05-13 | 2022-08-09 | 广州国音智能科技有限公司 | 语音识别方法、装置、终端及存储介质 |
CN111681647B (zh) | 2020-06-10 | 2023-09-05 | 北京百度网讯科技有限公司 | 用于识别词槽的方法、装置、设备以及存储介质 |
CN112164392A (zh) * | 2020-11-13 | 2021-01-01 | 北京百度网讯科技有限公司 | 确定显示的识别文本的方法、装置、设备以及存储介质 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5101375A (en) * | 1989-03-31 | 1992-03-31 | Kurzweil Applied Intelligence, Inc. | Method and apparatus for providing binding and capitalization in structured report generation |
US5365574A (en) * | 1990-05-15 | 1994-11-15 | Vcs Industries, Inc. | Telephone network voice recognition and verification using selectively-adjustable signal thresholds |
ZA948426B (en) * | 1993-12-22 | 1995-06-30 | Qualcomm Inc | Distributed voice recognition system |
US6665639B2 (en) * | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
US6101473A (en) * | 1997-08-08 | 2000-08-08 | Board Of Trustees, Leland Stanford Jr., University | Using speech recognition to access the internet, including access via a telephone |
US6125345A (en) * | 1997-09-19 | 2000-09-26 | At&T Corporation | Method and apparatus for discriminative utterance verification using multiple confidence measures |
US6006183A (en) * | 1997-12-16 | 1999-12-21 | International Business Machines Corp. | Speech recognition confidence level display |
US6154465A (en) * | 1998-10-06 | 2000-11-28 | Vertical Networks, Inc. | Systems and methods for multiple mode voice and data communications using intelligenty bridged TDM and packet buses and methods for performing telephony and data functions using the same |
JP4243019B2 (ja) * | 1998-04-03 | 2009-03-25 | ヴァーティカル・ネットワークス・インコーポレーテッド | インテリジェント・ブリッジtdmおよびパケット・バスを用いて音声およびデータを伝送するシステムおよび方法 |
US6229880B1 (en) * | 1998-05-21 | 2001-05-08 | Bell Atlantic Network Services, Inc. | Methods and apparatus for efficiently providing a communication system with speech recognition capabilities |
US7003463B1 (en) * | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US6377922B2 (en) * | 1998-12-29 | 2002-04-23 | At&T Corp. | Distributed recognition system having multiple prompt-specific and response-specific speech recognizers |
WO2000058942A2 (en) * | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
US6363349B1 (en) * | 1999-05-28 | 2002-03-26 | Motorola, Inc. | Method and apparatus for performing distributed speech processing in a communication system |
US6292781B1 (en) * | 1999-05-28 | 2001-09-18 | Motorola | Method and apparatus for facilitating distributed speech processing in a communication system |
US7203651B2 (en) * | 2000-12-07 | 2007-04-10 | Art-Advanced Recognition Technologies, Ltd. | Voice control system with multiple voice recognition engines |
US6785654B2 (en) * | 2001-11-30 | 2004-08-31 | Dictaphone Corporation | Distributed speech recognition system with speech recognition engines offering multiple functionalities |
GB2383459B (en) * | 2001-12-20 | 2005-05-18 | Hewlett Packard Co | Speech recognition system and method |
US6898567B2 (en) * | 2001-12-29 | 2005-05-24 | Motorola, Inc. | Method and apparatus for multi-level distributed speech recognition |
JP2004012653A (ja) * | 2002-06-05 | 2004-01-15 | Matsushita Electric Ind Co Ltd | 音声認識システム、音声認識クライアント、音声認識サーバ、音声認識クライアントプログラムおよび音声認識サーバプログラム |
JP3759508B2 (ja) * | 2003-03-31 | 2006-03-29 | オリンパス株式会社 | アクチュエータ及びアクチュエータ駆動方法並びにアクチュエータシステム |
US20040210443A1 (en) * | 2003-04-17 | 2004-10-21 | Roland Kuhn | Interactive mechanism for retrieving information from audio and multimedia files containing speech |
US7363228B2 (en) * | 2003-09-18 | 2008-04-22 | Interactive Intelligence, Inc. | Speech recognition system and method |
JP2005249829A (ja) | 2004-03-01 | 2005-09-15 | Advanced Media Inc | 音声認識を行うコンピュータネットワークシステム |
US20050215260A1 (en) * | 2004-03-23 | 2005-09-29 | Motorola, Inc. | Method and system for arbitrating between a local engine and a network-based engine in a mobile communication network |
JP4554285B2 (ja) * | 2004-06-18 | 2010-09-29 | トヨタ自動車株式会社 | 音声認識システム、音声認識方法、及び音声認識プログラム |
US8589156B2 (en) * | 2004-07-12 | 2013-11-19 | Hewlett-Packard Development Company, L.P. | Allocation of speech recognition tasks and combination of results thereof |
US7437297B2 (en) * | 2005-01-27 | 2008-10-14 | International Business Machines Corporation | Systems and methods for predicting consequences of misinterpretation of user commands in automated systems |
KR101073190B1 (ko) | 2005-02-03 | 2011-10-13 | 주식회사 현대오토넷 | 분산 음성 인식 시스템을 이용한 텔레매틱스 시스템의정보 제공 시스템 및 방법 |
JP2007033901A (ja) | 2005-07-27 | 2007-02-08 | Nec Corp | 音声認識システム、音声認識方法、および音声認識用プログラム |
US8612230B2 (en) * | 2007-01-03 | 2013-12-17 | Nuance Communications, Inc. | Automatic speech recognition with a selection list |
US8019608B2 (en) * | 2008-08-29 | 2011-09-13 | Multimodal Technologies, Inc. | Distributed speech recognition using one way communication |
US7933777B2 (en) * | 2008-08-29 | 2011-04-26 | Multimodal Technologies, Inc. | Hybrid speech recognition |
US8150696B2 (en) * | 2008-12-08 | 2012-04-03 | At&T Intellectual Property I, L.P. | Method of providing dynamic speech processing services during variable network connectivity |
-
2009
- 2009-08-30 US US12/550,380 patent/US7933777B2/en active Active
- 2009-08-31 EP EP09810709.7A patent/EP2329491B1/en active Active
- 2009-08-31 JP JP2011525265A patent/JP2012501480A/ja active Pending
- 2009-08-31 WO PCT/US2009/055479 patent/WO2010025440A2/en active Application Filing
- 2009-08-31 CA CA2732255A patent/CA2732255C/en active Active
- 2009-08-31 CA CA3002206A patent/CA3002206C/en active Active
-
2010
- 2010-09-24 US US12/890,280 patent/US8249877B2/en active Active
-
2012
- 2012-08-01 US US13/563,981 patent/US20120296644A1/en not_active Abandoned
-
2013
- 2013-07-12 JP JP2013146533A patent/JP6113008B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CA3002206C (en) | 2020-04-07 |
JP2012501480A (ja) | 2012-01-19 |
JP2013232001A (ja) | 2013-11-14 |
WO2010025440A2 (en) | 2010-03-04 |
US8249877B2 (en) | 2012-08-21 |
WO2010025440A3 (en) | 2010-06-03 |
EP2329491A4 (en) | 2012-11-28 |
CA2732255C (en) | 2019-02-05 |
CA2732255A1 (en) | 2010-03-04 |
EP2329491A2 (en) | 2011-06-08 |
CA3002206A1 (en) | 2010-03-04 |
US20100057450A1 (en) | 2010-03-04 |
EP2329491B1 (en) | 2018-04-18 |
US20110238415A1 (en) | 2011-09-29 |
US20120296644A1 (en) | 2012-11-22 |
US7933777B2 (en) | 2011-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6113008B2 (ja) | ハイブリッド型音声認識 | |
JP7359886B2 (ja) | 強化された発話エンドポイント指定のための方法、システム、およびコンピュータ可読記憶媒体 | |
US10339917B2 (en) | Enhanced speech endpointing | |
US8849664B1 (en) | Realtime acoustic adaptation using stability measures | |
CN105122354B (zh) | 分布式语音识别系统中的语音模型检索 | |
US7490042B2 (en) | Methods and apparatus for adapting output speech in accordance with context of communication | |
US20140156268A1 (en) | Incremental speech recognition for dialog systems | |
US9196250B2 (en) | Application services interface to ASR | |
KR20220028128A (ko) | 화자 종속 음성 모델(들)을 사용한 화자 인식 | |
KR20230117239A (ko) | 자동화된 어시스턴트 상호작용에서 레이턴시를 줄이기위한 방법 및 시스템 | |
Lojka et al. | Multi-thread parallel speech recognition for mobile applications | |
EP2733697A9 (en) | Application services interface to ASR | |
WO2023086075A1 (en) | Selectively generating and/or selectively rendering continuing content for spoken utterance completion | |
CN118235197A (zh) | 选择性生成和/或选择性渲染用于所说出话语完成的延续内容 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150325 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160106 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160105 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20160304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6113008 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |