JP2016026326A - 再認識および統計的分類を使用する認識 - Google Patents
再認識および統計的分類を使用する認識 Download PDFInfo
- Publication number
- JP2016026326A JP2016026326A JP2015202120A JP2015202120A JP2016026326A JP 2016026326 A JP2016026326 A JP 2016026326A JP 2015202120 A JP2015202120 A JP 2015202120A JP 2015202120 A JP2015202120 A JP 2015202120A JP 2016026326 A JP2016026326 A JP 2016026326A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- recognition result
- computer
- grammar
- results
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 58
- 230000008569 process Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 17
- 238000007619 statistical method Methods 0.000 claims description 5
- 238000000611 regression analysis Methods 0.000 claims 4
- 238000004891 communication Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 235000014510 cooky Nutrition 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Operations Research (AREA)
- Bioethics (AREA)
- Fuzzy Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
Abstract
【解決手段】入力の認識のためにコンテキスト特定文典の1セットとして全般の文典を利用するアーキテクチャにおいて、コンテキスト特定文典のそれぞれがサブタスクカテゴリおよび地理的地域のような特定のコンテキストに対応する。文典は、共同で全体の領域をカバーする。また、同じ入力に対して、複数の認識を並行的に実行することができ、各認識パスは1つ以上のコンテキスト特定文典を用いる。異なる認識器−文典からの複数の中間認識結果は、複数の認識結果に基づいてダイナミックに構成された文典、もしくは他の領域知識を用いて再認識を実行することにより、または複数の認識結果および他の領域知識から抽出された分類特徴に基づいて作動する統計的分類器を用いて当選者を選択することにより、調整することができる。
【選択図】図1
Description
Claims (20)
- コンピュータ実装認識システムであって、
複数の認識結果の各々への複数の認識経路に沿って、同一の入力に対し独立した認識処理を行うよう構成された複数のコンテキスト特定制約の制約コンポーネントであって、異なる制約のインスタンスは統合されると前記入力にコンテキストドメイン全体を提供する、制約コンポーネントと、
前記複数の認識結果を用いてダイナミック文法を生成するよう構成され、ダイナミック文法における前記認識経路の各々に関連する重み付けを割り当てし、最終認識結果を求めるために回帰分析を行うよう構成された調整コンポーネントと、
前記制約コンポーネントおよび調整コンポーネントに関連づけられたメモリにおけるコンピュータ実行可能命令を実行するよう構成されたマイクロプロセッサと、
を備えるよう構成されたコンピュータ実装認識システム。 - 前記制約は平行パスにおいて前記入力の認識処理のための文法を含む、請求項1記載のシステム。
- 前記調整コンポーネントは再認識を用いて前記複数の認識結果を調整し、前記単一の認識結果を生成する、請求項1に記載のシステム。
- 前記再認識は、前記複数の認識結果に基づいて前記ダイナミックに構成された文法を利用する、請求項3に記載のシステム。
- 前記調整コンポーネントは、前記複数の認識結果から抽出された分類特徴を操作する統計的分類器を用いて前記複数の認識結果を調整し、前記単一の認識結果を生成するようにさらに構成される、請求項1に記載のシステム。
- 前記認識処理は、関連タスクデータを処理して前記単一の認識結果に達し、前記関連タスクデータは、認識された文字列、発話レベルおよびサブ発話レベル信頼スコア、会話カバー範囲、並行認識における相対遅延、コンテキストの事前確率、各認識の相対難易度または前記認識結果におけるコンセンサスのうち、少なくとも1つを含む、請求項1に記載のシステム。
- 並行パスのそれぞれにおいて対応するコンテキスト特定制約を用いて前記入力を別々に認識処理するための認識コンポーネントをさらに備えることを特徴とする請求項1に記載のシステム。
- 前記単一の認識結果の決定を定義する1つ以上のルールを課すためのルールコンポーネントをさらに備えることを特徴とする請求項1に記載のシステム。
- コンピュータ実装認識方法であって、前記方法はコンピュータ可読命令を実行するコンピュータシステムにより実行され、前記方法は、
発話入力を処理するために、オリジナルタスク空間の特定のサブセットをそれぞれカバーする別々のコンテキスト特定文法から構成される認識文法を受信するステップと、
各経路に対して対応する前記コンテキスト特定文法を用いて平行経路における前記発話入力を認識するステップと、
各経路から生じる1つの中間認識結果を生成するステップと、
各経路から生じる中間認識結果を利用してダイナミック文法を生成するステップと、
前記ダイナミック文法における前記認識経路の各々に対する関連の重みを割り当て、かつ最終認識結果を求めるよう回帰分析を実行するステップと、
前記受信するステップ、認識するステップ、前記中間認識結果を生成するステップ、ダイナミック文法を生成するステップ、および実行するステップの動作に関連するメモリ内の命令を実行するマイクロプロセッサを構成するステップと、
を備えることを特徴とする方法。 - 前記複数の中間認識結果からダイナミックに生成された文法を利用した再認識を用いて、前記複数の中間認識結果を調整するステップをさらに備える、請求項9に記載の方法。
- 前記再認識を用いた前記複数の中間認識結果の調整の間に、他の領域知識を入力するステップと、
1つまたは複数のルールを課して前記最終認識結果を生成するステップと
をさらに備える、請求項9に記載の方法。 - 前記分類器を用いた前記複数の中間認識結果の調整の間に、他の領域知識を入力するステップと、
1つまたは複数のルールを課して前記最終認識結果を生成するステップと
をさらに備える、請求項9に記載の方法。 - ある経路の中間認識結果の生成のために所定期間待つステップと、
前記所定時間内に生成される中間認識結果に基づいて前記最終認識結果を生成するステップと、
をさらに備えることを特徴とする請求項9に記載の方法。 - プロセッサにより実行されると認識システムを可能にする、コンピュータ実行可能な命令を備えるコンピュータ読取可能記憶デバイスであって、
複数の認識結果の各々への複数の認識経路に沿って、同一の入力に対し独立した認識処理を行うよう構成された複数のコンテキスト特定制約の制約コンポーネントであって、異なる制約のインスタンスは統合されると前記入力にコンテキストドメイン全体を提供する、制約コンポーネントと、
前記複数の認識結果を用いてダイナミック文法を生成するよう構成され、ダイナミック文法における前記認識経路の各々に関連する重み付けを割り当てし、最終認識結果を求めるために回帰分析を行うよう構成された調整コンポーネントと、
を備えるよう構成されたコンピュータ読取可能記憶デバイス。 - 前記調整コンポーネントは前記複数の認識結果の動的に構成された文法を用い、そして再認識を用いて前記複数の認識結果を調整して前記最終認識結果を生成する、請求項14に記載のコンピュータ読取可能記憶デバイス。
- 前記調整コンポーネントは前記認識結果から抽出された特徴を操作する分類を用いて前記認識結果を調整して前記最終認識結果を生成する、請求項14に記載のコンピュータ読取可能記憶デバイス。
- 前記最終認識結果の決定を定義する1以上のルールを課すためのルールコンポーネント、および分類調整のための特徴および再認識調整のためのダイナミック文法に影響を与える他の領域知識をさらに備える、請求項14に記載のコンピュータ読取可能記憶デバイス。
- 前記調整コンポーネントは、再認識の前に回帰分析を利用して前記複数の認識結果を調整し前記最終認識結果を求める、請求項14に記載のコンピュータ読取可能記憶デバイス。
- コンピュータ実装認識方法であって、前記方法はコンピュータ可読命令を実行するコンピュータシステムにより実行され、前記方法は、
各パスに対して異なる又は重なっているコンテキスト特有の文法を備える、認識文法を用いて複数の並行パスにおいて発話入力を認識するステップと、
1以上の前記パスから生じる中間認識結果を用いてダイナミック文法を生成するステップと、
前記ダイナミック文法において前記認識パスの各々に対する関連する重みを割り当てるために統計的分析を実行するステップと、
前記最終認識結果を生成するために前記ダイナミック文法を用いて前記発話入力の再認識処理を実行するステップと、
認識するステップ、生成するステップ、統計的分析を実行するステップ、再認識処理を実行するステップの動作に関連するメモリ内の命令を実行するマイクルプロセッサを構成するステップと、
を備えることを特徴とする方法。 - コンピュータ実装認識システムであって、
複数の認識器であって、前記複数の認識器はそれぞれ、対応するコンテキスト特定文法を用いて、一つの発話入力に対し独立した認識処理を行い、中間認識結果を生成するよう構成されている、複数の認識器と、
前記複数の認識器が生成した複数の前記中間認識結果に基づいて、最終認識結果を求めるよう構成された調整コンポーネントであって、前記認識器によりそれぞれ生成された前記中間認識結果と、前記発話入力との類似度を決定し、最も高い類似度を有する前記中間認識結果を最終認識結果として選択するよう構成された分類器を備える調整コンポーネントと、
を備えるシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/477,918 US8930179B2 (en) | 2009-06-04 | 2009-06-04 | Recognition using re-recognition and statistical classification |
US12/477,918 | 2009-06-04 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012514054A Division JP2012529080A (ja) | 2009-06-04 | 2010-06-01 | 再認識および統計的分類を使用する認識 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016026326A true JP2016026326A (ja) | 2016-02-12 |
Family
ID=43298454
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012514054A Pending JP2012529080A (ja) | 2009-06-04 | 2010-06-01 | 再認識および統計的分類を使用する認識 |
JP2015202120A Pending JP2016026326A (ja) | 2009-06-04 | 2015-10-13 | 再認識および統計的分類を使用する認識 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012514054A Pending JP2012529080A (ja) | 2009-06-04 | 2010-06-01 | 再認識および統計的分類を使用する認識 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8930179B2 (ja) |
EP (1) | EP2438533B1 (ja) |
JP (2) | JP2012529080A (ja) |
KR (1) | KR101700466B1 (ja) |
CN (1) | CN102460423B (ja) |
AU (1) | AU2010256788B2 (ja) |
BR (1) | BRPI1014550B1 (ja) |
CA (1) | CA2760992C (ja) |
RU (1) | RU2571519C2 (ja) |
WO (1) | WO2010141513A2 (ja) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011033680A (ja) * | 2009-07-30 | 2011-02-17 | Sony Corp | 音声処理装置及び方法、並びにプログラム |
US9711167B2 (en) * | 2012-03-13 | 2017-07-18 | Nice Ltd. | System and method for real-time speaker segmentation of audio interactions |
US9093076B2 (en) * | 2012-04-30 | 2015-07-28 | 2236008 Ontario Inc. | Multipass ASR controlling multiple applications |
US9431012B2 (en) | 2012-04-30 | 2016-08-30 | 2236008 Ontario Inc. | Post processing of natural language automatic speech recognition |
KR20140082157A (ko) * | 2012-12-24 | 2014-07-02 | 한국전자통신연구원 | 다중 음향 모델을 이용하여 음성을 인식하기 위한 장치 및 그 방법 |
CN103077718B (zh) * | 2013-01-09 | 2015-11-25 | 华为终端有限公司 | 语音处理方法、系统和终端 |
US9414004B2 (en) | 2013-02-22 | 2016-08-09 | The Directv Group, Inc. | Method for combining voice signals to form a continuous conversation in performing a voice search |
US20140365218A1 (en) * | 2013-06-07 | 2014-12-11 | Microsoft Corporation | Language model adaptation using result selection |
US9728184B2 (en) | 2013-06-18 | 2017-08-08 | Microsoft Technology Licensing, Llc | Restructuring deep neural network acoustic models |
US9589565B2 (en) | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9324321B2 (en) | 2014-03-07 | 2016-04-26 | Microsoft Technology Licensing, Llc | Low-footprint adaptation and personalization for a deep neural network |
US9529794B2 (en) | 2014-03-27 | 2016-12-27 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
EP2933067B1 (en) * | 2014-04-17 | 2019-09-18 | Softbank Robotics Europe | Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method |
US9614724B2 (en) | 2014-04-21 | 2017-04-04 | Microsoft Technology Licensing, Llc | Session-based device configuration |
US9520127B2 (en) | 2014-04-29 | 2016-12-13 | Microsoft Technology Licensing, Llc | Shared hidden layer combination for speech recognition systems |
US9384334B2 (en) | 2014-05-12 | 2016-07-05 | Microsoft Technology Licensing, Llc | Content discovery in managed wireless distribution networks |
US10111099B2 (en) | 2014-05-12 | 2018-10-23 | Microsoft Technology Licensing, Llc | Distributing content in managed wireless distribution networks |
US9430667B2 (en) | 2014-05-12 | 2016-08-30 | Microsoft Technology Licensing, Llc | Managed wireless distribution network |
US9384335B2 (en) | 2014-05-12 | 2016-07-05 | Microsoft Technology Licensing, Llc | Content delivery prioritization in managed wireless distribution networks |
US9874914B2 (en) | 2014-05-19 | 2018-01-23 | Microsoft Technology Licensing, Llc | Power management contracts for accessory devices |
US10037202B2 (en) | 2014-06-03 | 2018-07-31 | Microsoft Technology Licensing, Llc | Techniques to isolating a portion of an online computing service |
US9367490B2 (en) | 2014-06-13 | 2016-06-14 | Microsoft Technology Licensing, Llc | Reversible connector for accessory devices |
US9786276B2 (en) * | 2014-08-25 | 2017-10-10 | Honeywell International Inc. | Speech enabled management system |
KR102365757B1 (ko) * | 2015-09-09 | 2022-02-18 | 삼성전자주식회사 | 인식 장치, 인식 방법 및 협업 처리 장치 |
US20180366123A1 (en) * | 2015-12-01 | 2018-12-20 | Nuance Communications, Inc. | Representing Results From Various Speech Services as a Unified Conceptual Knowledge Base |
KR102019757B1 (ko) * | 2015-12-15 | 2019-09-10 | 한국전자통신연구원 | 언어 분석 오류 보정 장치 및 방법 |
DE102016005629B4 (de) * | 2016-05-06 | 2020-06-25 | Audi Ag | Kraftfahrzeug-Bedienvorrichtung und Verfahren zum Ermitteln zumindest eines Erkennungsergebnisses zu einem Sprachsignal |
JP2018191145A (ja) * | 2017-05-08 | 2018-11-29 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム及びディクテーション方法 |
CN107437414A (zh) * | 2017-07-17 | 2017-12-05 | 镇江市高等专科学校 | 基于嵌入式gpu系统的并行化游客识别方法 |
CN107943452B (zh) * | 2017-11-20 | 2020-07-14 | 中国运载火箭技术研究院 | 一种多用户协同开发的体系结构设计平台 |
US11360872B2 (en) | 2018-10-18 | 2022-06-14 | Hewlett-Packard Development Company, L.P. | Creating statistical analyses of data for transmission to servers |
WO2021019775A1 (ja) * | 2019-08-01 | 2021-02-04 | 三菱電機株式会社 | 多言語音声認識装置および多言語音声認識方法 |
US11238884B2 (en) * | 2019-10-04 | 2022-02-01 | Red Box Recorders Limited | Systems and methods for recording quality driven communication management |
US11961511B2 (en) | 2019-11-08 | 2024-04-16 | Vail Systems, Inc. | System and method for disambiguation and error resolution in call transcripts |
JP6786005B1 (ja) * | 2020-04-09 | 2020-11-18 | 日鉄エンジニアリング株式会社 | 情報出力装置、情報出力システム、情報出力方法、プログラム、サーバ装置及びデータ出力方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6346496A (ja) * | 1986-04-04 | 1988-02-27 | 株式会社リコー | 音声認識装置 |
JP2002540478A (ja) * | 1999-03-26 | 2002-11-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 並列する認識エンジン |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6265089A (ja) | 1985-09-18 | 1987-03-24 | 株式会社リコー | 音声認識装置 |
US5390279A (en) * | 1992-12-31 | 1995-02-14 | Apple Computer, Inc. | Partitioning speech rules by context for speech recognition |
US5677990A (en) * | 1995-05-05 | 1997-10-14 | Panasonic Technologies, Inc. | System and method using N-best strategy for real time recognition of continuously spelled names |
US6122613A (en) * | 1997-01-30 | 2000-09-19 | Dragon Systems, Inc. | Speech recognition using multiple recognizers (selectively) applied to the same input sample |
US7082391B1 (en) * | 1998-07-14 | 2006-07-25 | Intel Corporation | Automatic speech recognition |
US6434524B1 (en) * | 1998-09-09 | 2002-08-13 | One Voice Technologies, Inc. | Object interactive user interface using speech recognition and natural language processing |
JP2000181487A (ja) | 1998-12-14 | 2000-06-30 | Toshiba Tec Corp | 音声認識装置 |
DE19910234A1 (de) | 1999-03-09 | 2000-09-21 | Philips Corp Intellectual Pty | Verfahren mit mehreren Spracherkennern |
JP2001249684A (ja) * | 2000-03-02 | 2001-09-14 | Sony Corp | 音声認識装置および音声認識方法、並びに記録媒体 |
US7213027B1 (en) | 2000-03-21 | 2007-05-01 | Aol Llc | System and method for the transformation and canonicalization of semantically structured data |
US6973429B2 (en) * | 2000-12-04 | 2005-12-06 | A9.Com, Inc. | Grammar generation for voice-based searches |
US7409349B2 (en) * | 2001-05-04 | 2008-08-05 | Microsoft Corporation | Servers for web enabled speech recognition |
JP2003029783A (ja) | 2001-07-17 | 2003-01-31 | Oki Electric Ind Co Ltd | 音声認識制御方式 |
US20030149566A1 (en) | 2002-01-02 | 2003-08-07 | Esther Levin | System and method for a spoken language interface to a large database of changing records |
US7184957B2 (en) * | 2002-09-25 | 2007-02-27 | Toyota Infotechnology Center Co., Ltd. | Multiple pass speech recognition method and system |
EP1774516B1 (en) | 2004-01-12 | 2011-03-16 | Voice Signal Technologies Inc. | Normalization of cepstral features for speech recognition |
JP2006039382A (ja) | 2004-07-29 | 2006-02-09 | Nissan Motor Co Ltd | 音声認識装置 |
US7747437B2 (en) | 2004-12-16 | 2010-06-29 | Nuance Communications, Inc. | N-best list rescoring in speech recognition |
US8364481B2 (en) * | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
-
2009
- 2009-06-04 US US12/477,918 patent/US8930179B2/en active Active
-
2010
- 2010-06-01 EP EP10783961.5A patent/EP2438533B1/en active Active
- 2010-06-01 CN CN201080025833.3A patent/CN102460423B/zh active Active
- 2010-06-01 AU AU2010256788A patent/AU2010256788B2/en active Active
- 2010-06-01 KR KR1020117028895A patent/KR101700466B1/ko active IP Right Grant
- 2010-06-01 CA CA2760992A patent/CA2760992C/en active Active
- 2010-06-01 BR BRPI1014550A patent/BRPI1014550B1/pt active IP Right Grant
- 2010-06-01 WO PCT/US2010/036964 patent/WO2010141513A2/en active Application Filing
- 2010-06-01 JP JP2012514054A patent/JP2012529080A/ja active Pending
- 2010-06-01 RU RU2011149321/08A patent/RU2571519C2/ru active
-
2015
- 2015-10-13 JP JP2015202120A patent/JP2016026326A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6346496A (ja) * | 1986-04-04 | 1988-02-27 | 株式会社リコー | 音声認識装置 |
JP2002540478A (ja) * | 1999-03-26 | 2002-11-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 並列する認識エンジン |
Also Published As
Publication number | Publication date |
---|---|
AU2010256788A1 (en) | 2011-11-17 |
AU2010256788B2 (en) | 2014-09-11 |
EP2438533A2 (en) | 2012-04-11 |
RU2011149321A (ru) | 2013-06-10 |
CN102460423B (zh) | 2015-09-09 |
EP2438533A4 (en) | 2016-05-11 |
EP2438533B1 (en) | 2019-01-23 |
JP2012529080A (ja) | 2012-11-15 |
CN102460423A (zh) | 2012-05-16 |
WO2010141513A2 (en) | 2010-12-09 |
KR20120029413A (ko) | 2012-03-26 |
BRPI1014550B1 (pt) | 2020-05-05 |
KR101700466B1 (ko) | 2017-01-26 |
US8930179B2 (en) | 2015-01-06 |
CA2760992A1 (en) | 2010-12-09 |
CA2760992C (en) | 2017-04-25 |
US20100312546A1 (en) | 2010-12-09 |
WO2010141513A3 (en) | 2011-03-03 |
BRPI1014550A2 (pt) | 2016-04-05 |
RU2571519C2 (ru) | 2015-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016026326A (ja) | 再認識および統計的分類を使用する認識 | |
KR102517387B1 (ko) | 로컬 텍스트-응답 맵을 활용하여 사용자의 음성 발화에 대한 응답 렌더링 | |
US9202461B2 (en) | Sampling training data for an automatic speech recognition system based on a benchmark classification distribution | |
JP4902617B2 (ja) | 音声認識システム、音声認識方法、音声認識クライアントおよびプログラム | |
US20080059195A1 (en) | Automatic pruning of grammars in a multi-application speech recognition interface | |
CN112270925A (zh) | 用于创建可定制对话系统引擎的平台 | |
JP2017516153A (ja) | 以前の対話行為を使用する自然言語処理における文脈解釈 | |
JP2004272251A (ja) | ブロック同期復号 | |
CN106030698B (zh) | 用于智能个人助理应用的方法、系统和计算机可读介质 | |
US11532301B1 (en) | Natural language processing | |
US10861453B1 (en) | Resource scheduling with voice controlled devices | |
US20220161131A1 (en) | Systems and devices for controlling network applications | |
JP2023162265A (ja) | テキストエコー消去 | |
US11626107B1 (en) | Natural language processing | |
KR20230156427A (ko) | 연결 및 축소된 rnn-t | |
EP3635572B1 (en) | Subquery generation from a query | |
US12087279B2 (en) | Regularizing word segmentation | |
US10140981B1 (en) | Dynamic arc weights in speech recognition models | |
US11410659B1 (en) | Dynamic skill endpoint | |
US11600260B1 (en) | Utterance generation and evaluation | |
US11720964B2 (en) | System and method for natural language order fill |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161202 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170818 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180227 |