JP2007280364A - 言語モデルの切替・適応方法及び言語モデル切替・適応装置 - Google Patents
言語モデルの切替・適応方法及び言語モデル切替・適応装置 Download PDFInfo
- Publication number
- JP2007280364A JP2007280364A JP2007056012A JP2007056012A JP2007280364A JP 2007280364 A JP2007280364 A JP 2007280364A JP 2007056012 A JP2007056012 A JP 2007056012A JP 2007056012 A JP2007056012 A JP 2007056012A JP 2007280364 A JP2007280364 A JP 2007280364A
- Authority
- JP
- Japan
- Prior art keywords
- language model
- language
- request
- target application
- switching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000006978 adaptation Effects 0.000 claims abstract description 55
- 230000008859 change Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 101100008874 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DAS2 gene Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】 この言語モデル切替・適応装置は、目的アプリケーションの状態が変更される場合、現在の状態情報あるいは目的アプリケーションの言語モデルに対する要求の言語モデル切替え部に通知する通知管理部と、受信した現在の状態情報あるいは要求に従って言語モデルセットから切り替える1つ以上の言語モデルを選択する言語モデル切替え部と、選択された言語モデルを用いてユーザの入力をデコードするLMBエンジンと、デコードされた結果を受け取り、デコードされた結果に基づいて選択された言語モデルを修正する言語モデル適応部を備える。
【選択図】 図1
Description
さらに、ドメイン検出が不正確であるため、モデル適応は成功か失敗となる。
本発明は、目的アプリケーションの状態が変更された場合に、特定の場面に対して適切な言語モデルを選択する。また特定のモデルを修正するためにテキストストリームフィードバックを用いる。
従って、切り替えが様々な言語モデル間で実行される場合にドメイン依存問題が解決され、特定の言語モデルについての適応が言語モデルの特性を向上させる。
1.多数の異なるドメインにおいて動作し、かつそれらの間で頻繁に切り替えられるLMBエンジンを実現することができる。
2.各言語モデルは互いに大きく異なっていてもよいし、語彙も全く異なっていても適用することが可能である。このことはLMBエンジンをより柔軟にする。
3.言語モデルの適応が現在の特定のモデルについてなされるので、従来のモデル適応より遥かに効果的な性能向上が達成される。
4.LBMエンジンが目的アプリケーションと通信することができるので、ユニークな要求をする新しい目的アプリケーションを開発することが可能となる。また、通信手段は、新しい要求に応じる言語モデルセットに対して新しい言語モデルを追加するために用いることが可能である。この手段は、拡張性に富むLBMエンジンアプリケーションを提供する。
上述した効果に起因して、LMBエンジンの性能を向上させることが可能となる。
02:内部バス
03:ユーザ・インタフェース
04:固定記憶装置
05:言語モデルセット
07:メモリ
08:オペレーティング・システム
09:汎用アプリケーション
10:LMBエンジン
11:言語モデル切替部
12:言語モデル適応部
13:通知管理部
14:目的アプリケーション
1101:受信変換ユニット
1102:言語モデル選択ユニット
1103:受信ユニット
1301:GWESグラフィック・ユーザ・インタフェース
1302:ソフトキーボード入力パネル
14001:グローバル言語モデル対応付け部
14002:標準化された要求フラグ
Claims (16)
- 目的アプリケーションの状態が変更された場合、現在の状態情報あるいは目的アプリケーションの言語モデルに対する要求を言語モデル切替部に通知する通知管理部と、
受信した現在の状態情報あるいは要求に従って言語モデルセットから切り替える1以上の前記言語モデルを選択する言語モデル切替部と、
1以上の選択された前記言語モデルを用いてユーザの入力をデコードするLMBエンジンと、
デコード結果を受信し、当該デコード結果に基づいて、1以上の選択された前記言語モデルを修正する言語モデル適応部と
を備えることを特徴とする言語モデル切替・適応装置。 - 前記LMBエンジンが、音声認識エンジンであることを特徴とする請求項1に記載の言語モデル切替・適応装置。
- 前記LMBエンジンが、テキスト入力エンジンであることを特徴とする請求項1に記載の言語モデル切替・適応装置。
- 前記言語モデル切替部が、
前記通知管理部から現在の状態情報あるいは前記言語モデルに対する要求を受信し、現在の状態情報を受信した場合に、対応付けテーブルを検索することにより、前記状態情報を言語モデルに対する要求に変換する受信変換ユニットと、
前記言語モデルに対する要求あるいは変換された要求に基づいて前記言語モデルセットから切り替える1つ以上の言語モデルを選択する言語モデル選択ユニットを備えることを特徴とする請求項1から請求項3の何れか1項に記載の言語モデル切替・適応装置。 - 前記通知管理部が、
前記目的アプリケーションの状態の変更を検知するGWESグラフィック・ユーザ・インタフェースと、
現在の状態情報あるいは前記目的アプリケーションの言語モデルに対する要求を前記言語モデル切替部に通知するソフトウェア・キーボード入力パネルを備えることを特徴とする請求項1から請求項4の何れか1項に記載の言語モデル切替・適応装置。 - 前記言語モデルセットの1つの言語モデルが、1つの言語ドメイン内において他の言語モデルとオーバラップし、あるいはオーバラップしないことを特徴とする請求項1に記載の言語モデル切替・適応装置。
- 目的アプリケーションの状態を対応する1以上の言語モデルに対応付けるグローバル言語モデル対応付け部を備え、
前記目的アプリケーションが、要求フラグおよび前記グローバル言語モデル対応付け部によって言語モデルに対する要求を識別し、前記通知管理部へ言語モデルに対する要求を送信することを特徴とする請求項1に記載の言語モデル切替・適応装置。 - 前記言語モデル切替部が、
前記通知管理部から目的アプリケーションの言語モデルに対する要求を受信する受信モジュールと、
受信した要求に従って、前記言語モデルセットから切り替える1以上の言語モデルを選択する言語モデル選択モジュールを備えることを特徴とする請求項7に記載の言語モデル切替・適応装置。 - 目的アプリケーションの状態が変更された場合に、現在の状態情報あるいは前記目的アプリケーションの言語モデルに対する要求を通知する通知ステップと、
通知された現在の状態情報あるいは要求に従って、言語モデルセットから切り替える1以上の言語モデルを選択する言語モデル切替ステップと、
1以上の選択された言語モデルを用いて、ユーザの入力をデコードするでデコードステップと、
デコードされた結果を受け取り、デコードされた結果に基づいて1以上の選択された言語モデルを修正する言語モデル適応ステップと
を有することを特徴とする言語モデルの切替・適応方法。 - 前記ユーザの入力が、音声認識入力であることを特徴とする請求項9に記載の言語モデルの切替・適応方法。
- 前記ユーザの入力が、テキスト入力であることを特徴とする請求項9に記載の言語モデルの切替・適応方法。
- 前記言語モデル切替ステップが、
前記現在の状態情報あるいは前記言語モデルに対する要求を受信し、現在の状態情報を受信した場合に、対応付けテーブルを検索することにより、前記状態情報を言語モデルに対する要求に変換する受信変換ステップと、
前記言語モデルに対する要求あるいは変換された要求に基づいて前記言語モデルセットから切り替える1つ以上の言語モデルを選択する言語モデル選択ステップを有することを特徴とする請求項9から請求項11の何れか1項に記載の言語モデルの切替・適応方法。 - 前記通知ステップが、
前記目的アプリケーションの状態の変更を検知する検知ステップと、
現在の状態情報あるいは前記目的アプリケーションの言語モデルに対する要求を通知する通信ステップを有することを特徴とする請求項9から請求項12の何れか1項に記載の言語モデルの切替・適応方法。 - 前記言語モデルセットの1つの言語モデルが、1つの言語ドメイン内において他の言語モデルとオーバラップし、あるいはオーバラップしないことを特徴とする請求項9に記載の言語モデルの切替・適応方法。
- 目的アプリケーションの状態を対応する1以上の言語モデルに対応付けるグローバル言語モデル対応付けステップを有し、
前記目的アプリケーションが、要求フラグおよび前記グローバル言語モデル対応付けステップによって言語モデルに対する要求を識別し、前記通知ステップへ言語モデルに対する要求を提供することを特徴とする請求項9に記載の言語モデルの切替・適応方法。 - 前記言語モデル切替ステップが、
目的アプリケーションから言語モデルに対する要求を受信するステップと、
受信した要求に従って、前記言語モデルセットから切り替える1以上の言語モデルを選択する言語モデル選択ステップを有することを特徴とする請求項15に記載の言語モデルの切替・適応方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2006100547856A CN101034390A (zh) | 2006-03-10 | 2006-03-10 | 用于语言模型切换和自适应的装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007280364A true JP2007280364A (ja) | 2007-10-25 |
JP2007280364A5 JP2007280364A5 (ja) | 2009-02-26 |
Family
ID=38681697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007056012A Pending JP2007280364A (ja) | 2006-03-10 | 2007-03-06 | 言語モデルの切替・適応方法及び言語モデル切替・適応装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8078467B2 (ja) |
JP (1) | JP2007280364A (ja) |
CN (1) | CN101034390A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009216591A (ja) * | 2008-03-11 | 2009-09-24 | Hitachi High-Technologies Corp | 自動分析装置 |
WO2010100853A1 (ja) * | 2009-03-04 | 2010-09-10 | 日本電気株式会社 | 言語モデル適応装置、音声認識装置、言語モデル適応方法、及びコンピュータ読み取り可能な記録媒体 |
KR20110012920A (ko) * | 2009-07-31 | 2011-02-09 | 삼성전자주식회사 | 동적 화면에 따라 음성을 인식하는 장치 및 방법 |
JP2012008554A (ja) * | 2010-05-24 | 2012-01-12 | Denso Corp | 音声認識装置 |
WO2012105231A1 (ja) * | 2011-02-03 | 2012-08-09 | 日本電気株式会社 | モデル適応化装置、モデル適応化方法およびモデル適応化用プログラム |
JP2014523543A (ja) * | 2011-06-19 | 2014-09-11 | エムモーダル アイピー エルエルシー | コンテキストアウェア認識モデルを使用した音声認識 |
JP2018536905A (ja) * | 2015-11-06 | 2018-12-13 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 発話認識方法及び装置 |
JP7488382B2 (ja) | 2018-11-16 | 2024-05-21 | グーグル エルエルシー | 自動音声認識のためのコンテキスト非正規化 |
Families Citing this family (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7490092B2 (en) | 2000-07-06 | 2009-02-10 | Streamsage, Inc. | Method and system for indexing and searching timed media information based upon relevance intervals |
US7996219B2 (en) | 2005-03-21 | 2011-08-09 | At&T Intellectual Property Ii, L.P. | Apparatus and method for model adaptation for spoken language understanding |
US8838457B2 (en) * | 2007-03-07 | 2014-09-16 | Vlingo Corporation | Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility |
US8949130B2 (en) * | 2007-03-07 | 2015-02-03 | Vlingo Corporation | Internal and external speech recognition use with a mobile communication facility |
US20110054898A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Multiple web-based content search user interface in mobile search application |
US20090030697A1 (en) * | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Using contextual information for delivering results generated from a speech recognition facility using an unstructured language model |
US8949266B2 (en) | 2007-03-07 | 2015-02-03 | Vlingo Corporation | Multiple web-based content category searching in mobile search application |
US8886540B2 (en) * | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Using speech recognition results based on an unstructured language model in a mobile communication facility application |
US20080221884A1 (en) * | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile environment speech processing facility |
US20110054896A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Sending a communications header with voice recording to send metadata for use in speech recognition and formatting in mobile dictation application |
US8635243B2 (en) * | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US20090030687A1 (en) * | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Adapting an unstructured language model speech recognition system based on usage |
US20090030688A1 (en) * | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Tagging speech recognition results based on an unstructured language model for use in a mobile communication facility application |
US20110060587A1 (en) * | 2007-03-07 | 2011-03-10 | Phillips Michael S | Command and control utilizing ancillary information in a mobile voice-to-speech application |
US20110054897A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Transmitting signal quality information in mobile dictation application |
US20110054899A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Command and control utilizing content information in a mobile voice-to-speech application |
US20110054895A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Utilizing user transmitted text to improve language model in mobile dictation application |
US10056077B2 (en) * | 2007-03-07 | 2018-08-21 | Nuance Communications, Inc. | Using speech recognition results based on an unstructured language model with a music system |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US20080221902A1 (en) * | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile browser environment speech processing facility |
US20090030691A1 (en) * | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Using an unstructured language model associated with an application of a mobile communication facility |
US20090030685A1 (en) * | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Using speech recognition results based on an unstructured language model with a navigation system |
US7925505B2 (en) * | 2007-04-10 | 2011-04-12 | Microsoft Corporation | Adaptation of language models and context free grammar in speech recognition |
US9405513B2 (en) * | 2008-04-18 | 2016-08-02 | Software Ag | Systems and methods for graphically developing rules for transforming models between description notations |
US8713016B2 (en) | 2008-12-24 | 2014-04-29 | Comcast Interactive Media, Llc | Method and apparatus for organizing segments of media assets and determining relevance of segments to a query |
US9442933B2 (en) | 2008-12-24 | 2016-09-13 | Comcast Interactive Media, Llc | Identification of segments within audio, video, and multimedia items |
US11531668B2 (en) | 2008-12-29 | 2022-12-20 | Comcast Interactive Media, Llc | Merging of multiple data sets |
US8176043B2 (en) | 2009-03-12 | 2012-05-08 | Comcast Interactive Media, Llc | Ranking search results |
JP2010224194A (ja) * | 2009-03-23 | 2010-10-07 | Sony Corp | 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム |
GB0917753D0 (en) | 2009-10-09 | 2009-11-25 | Touchtype Ltd | System and method for inputting text into electronic devices |
GB0905457D0 (en) * | 2009-03-30 | 2009-05-13 | Touchtype Ltd | System and method for inputting text into electronic devices |
US10191654B2 (en) | 2009-03-30 | 2019-01-29 | Touchtype Limited | System and method for inputting text into electronic devices |
US9189472B2 (en) | 2009-03-30 | 2015-11-17 | Touchtype Limited | System and method for inputting text into small screen devices |
GB201016385D0 (en) * | 2010-09-29 | 2010-11-10 | Touchtype Ltd | System and method for inputting text into electronic devices |
US9424246B2 (en) * | 2009-03-30 | 2016-08-23 | Touchtype Ltd. | System and method for inputting text into electronic devices |
US8798983B2 (en) * | 2009-03-30 | 2014-08-05 | Microsoft Corporation | Adaptation for statistical language model |
US20100250614A1 (en) * | 2009-03-31 | 2010-09-30 | Comcast Cable Holdings, Llc | Storing and searching encoded data |
US8214366B2 (en) * | 2009-11-17 | 2012-07-03 | Glace Holding Llc | Systems and methods for generating a language database that can be used for natural language communication with a computer |
US9805020B2 (en) | 2009-04-23 | 2017-10-31 | Deep Sky Concepts, Inc. | In-context access of stored declarative knowledge using natural language expression |
US8972445B2 (en) | 2009-04-23 | 2015-03-03 | Deep Sky Concepts, Inc. | Systems and methods for storage of declarative knowledge accessible by natural language in a computer capable of appropriately responding |
US8275788B2 (en) | 2009-11-17 | 2012-09-25 | Glace Holding Llc | System and methods for accessing web pages using natural language |
US8533223B2 (en) | 2009-05-12 | 2013-09-10 | Comcast Interactive Media, LLC. | Disambiguation and tagging of entities |
US8442826B2 (en) * | 2009-06-10 | 2013-05-14 | Microsoft Corporation | Application-dependent information for recognition processing |
US9892730B2 (en) | 2009-07-01 | 2018-02-13 | Comcast Interactive Media, Llc | Generating topic-specific language models |
WO2011004367A1 (en) * | 2009-07-09 | 2011-01-13 | Eliyahu Mashiah | Content sensitive system and method for automatic input language selection |
US9576570B2 (en) | 2010-07-30 | 2017-02-21 | Sri International | Method and apparatus for adding new vocabulary to interactive translation and dialogue systems |
US8527270B2 (en) * | 2010-07-30 | 2013-09-03 | Sri International | Method and apparatus for conducting an interactive dialogue |
GB201200643D0 (en) | 2012-01-16 | 2012-02-29 | Touchtype Ltd | System and method for inputting text |
EP2678861B1 (en) * | 2011-02-22 | 2018-07-11 | Speak With Me, Inc. | Hybridized client-server speech recognition |
CN102122506B (zh) * | 2011-03-08 | 2013-07-31 | 天脉聚源(北京)传媒科技有限公司 | 一种语音识别的方法 |
US9679561B2 (en) | 2011-03-28 | 2017-06-13 | Nuance Communications, Inc. | System and method for rapid customization of speech recognition models |
CN102902362B (zh) * | 2011-07-25 | 2017-10-31 | 深圳市世纪光速信息技术有限公司 | 文字输入方法及系统 |
US9786281B1 (en) * | 2012-08-02 | 2017-10-10 | Amazon Technologies, Inc. | Household agent learning |
US9378737B2 (en) * | 2012-11-05 | 2016-06-28 | Mitsubishi Electric Corporation | Voice recognition device |
CN103871402B (zh) * | 2012-12-11 | 2017-10-10 | 北京百度网讯科技有限公司 | 语言模型训练系统、语音识别系统及相应方法 |
US20160154634A1 (en) * | 2013-06-26 | 2016-06-02 | Hewlett-Packard Development Company, L.P. | Modifying an analytic flow |
US11386886B2 (en) | 2014-01-28 | 2022-07-12 | Lenovo (Singapore) Pte. Ltd. | Adjusting speech recognition using contextual information |
CN103903613A (zh) * | 2014-03-10 | 2014-07-02 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US20170046330A1 (en) * | 2014-04-28 | 2017-02-16 | Google Inc. | Context specific language model for input method editor |
US9536521B2 (en) * | 2014-06-30 | 2017-01-03 | Xerox Corporation | Voice recognition |
KR102281178B1 (ko) * | 2014-07-09 | 2021-07-23 | 삼성전자주식회사 | 멀티-레벨 음성 인식 방법 및 장치 |
US9524293B2 (en) * | 2014-08-15 | 2016-12-20 | Google Inc. | Techniques for automatically swapping languages and/or content for machine translation |
US10515151B2 (en) * | 2014-08-18 | 2019-12-24 | Nuance Communications, Inc. | Concept identification and capture |
US9966073B2 (en) | 2015-05-27 | 2018-05-08 | Google Llc | Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device |
US10403271B2 (en) | 2015-06-11 | 2019-09-03 | Nice Ltd. | System and method for automatic language model selection |
US20170031897A1 (en) * | 2015-07-31 | 2017-02-02 | Lenovo (Singapore) Pte. Ltd. | Modification of input based on language content background |
CN105068870B (zh) * | 2015-09-29 | 2019-07-26 | 北京网诺星云科技有限公司 | 多语言信息切换的方法及装置 |
US10468016B2 (en) | 2015-11-24 | 2019-11-05 | International Business Machines Corporation | System and method for supporting automatic speech recognition of regional accents based on statistical information and user corrections |
CN109313896B (zh) * | 2016-06-08 | 2020-06-30 | 谷歌有限责任公司 | 可扩展的动态类语言建模方法、用于生成话语转录的系统、计算机可读介质 |
GB201610984D0 (en) | 2016-06-23 | 2016-08-10 | Microsoft Technology Licensing Llc | Suppression of input images |
CN106373565A (zh) * | 2016-08-24 | 2017-02-01 | 安徽咪鼠科技有限公司 | 一种自动切换语音识别引擎的方法 |
US10741174B2 (en) * | 2017-01-24 | 2020-08-11 | Lenovo (Singapore) Pte. Ltd. | Automatic language identification for speech |
US10089983B1 (en) * | 2017-06-08 | 2018-10-02 | Amazon Technologies, Inc. | Third party account linking for voice user interface |
CN109151155B (zh) * | 2017-06-27 | 2021-03-23 | 北京搜狗科技发展有限公司 | 一种通信处理方法、装置及机器可读介质 |
KR102426717B1 (ko) * | 2017-06-27 | 2022-07-29 | 삼성전자주식회사 | 발화 인식 모델을 선택하는 시스템 및 전자 장치 |
KR102225984B1 (ko) * | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
US10510348B1 (en) | 2018-09-28 | 2019-12-17 | International Business Machines Corporation | Smart medical room optimization of speech recognition systems |
KR20210052563A (ko) * | 2018-11-02 | 2021-05-10 | 주식회사 엘솔루 | 문맥 기반의 음성인식 서비스를 제공하기 위한 방법 및 장치 |
CN110415698B (zh) * | 2018-11-15 | 2022-05-13 | 腾讯科技(深圳)有限公司 | 一种人工智能的数据检测方法及装置、存储介质 |
US11055491B2 (en) | 2019-02-05 | 2021-07-06 | International Business Machines Corporation | Geographic location specific models for information extraction and knowledge discovery |
CN111797631B (zh) * | 2019-04-04 | 2024-06-21 | 北京猎户星空科技有限公司 | 信息处理方法、装置及电子设备 |
CN111814779A (zh) * | 2020-07-08 | 2020-10-23 | 重庆农村商业银行股份有限公司 | 一种票据文本识别方法、装置、设备及存储介质 |
CN112017645B (zh) * | 2020-08-31 | 2024-04-26 | 广州市百果园信息技术有限公司 | 一种语音识别方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000330983A (ja) * | 1999-05-17 | 2000-11-30 | Nec Software Hokkaido Ltd | かな漢字変換システム、かな漢字変換方法、および記録媒体 |
JP2004062517A (ja) * | 2002-07-29 | 2004-02-26 | Nec Corp | 音声制御装置、音声制御方法、およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5613036A (en) * | 1992-12-31 | 1997-03-18 | Apple Computer, Inc. | Dynamic categories for a speech recognition system |
US6233545B1 (en) * | 1997-05-01 | 2001-05-15 | William E. Datig | Universal machine translator of arbitrary languages utilizing epistemic moments |
US20020032564A1 (en) * | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
US6904405B2 (en) * | 1999-07-17 | 2005-06-07 | Edwin A. Suominen | Message recognition using shared language model |
US7013275B2 (en) * | 2001-12-28 | 2006-03-14 | Sri International | Method and apparatus for providing a dynamic speech-driven control and remote service access system |
US7016849B2 (en) * | 2002-03-25 | 2006-03-21 | Sri International | Method and apparatus for providing speech-driven routing between spoken language applications |
-
2006
- 2006-03-10 CN CNA2006100547856A patent/CN101034390A/zh active Pending
-
2007
- 2007-03-06 JP JP2007056012A patent/JP2007280364A/ja active Pending
- 2007-03-08 US US11/683,559 patent/US8078467B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000330983A (ja) * | 1999-05-17 | 2000-11-30 | Nec Software Hokkaido Ltd | かな漢字変換システム、かな漢字変換方法、および記録媒体 |
JP2004062517A (ja) * | 2002-07-29 | 2004-02-26 | Nec Corp | 音声制御装置、音声制御方法、およびプログラム |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009216591A (ja) * | 2008-03-11 | 2009-09-24 | Hitachi High-Technologies Corp | 自動分析装置 |
WO2010100853A1 (ja) * | 2009-03-04 | 2010-09-10 | 日本電気株式会社 | 言語モデル適応装置、音声認識装置、言語モデル適応方法、及びコンピュータ読み取り可能な記録媒体 |
KR20110012920A (ko) * | 2009-07-31 | 2011-02-09 | 삼성전자주식회사 | 동적 화면에 따라 음성을 인식하는 장치 및 방법 |
US9269356B2 (en) | 2009-07-31 | 2016-02-23 | Samsung Electronics Co., Ltd. | Method and apparatus for recognizing speech according to dynamic display |
KR101597289B1 (ko) * | 2009-07-31 | 2016-03-08 | 삼성전자주식회사 | 동적 화면에 따라 음성을 인식하는 장치 및 방법 |
JP2012008554A (ja) * | 2010-05-24 | 2012-01-12 | Denso Corp | 音声認識装置 |
WO2012105231A1 (ja) * | 2011-02-03 | 2012-08-09 | 日本電気株式会社 | モデル適応化装置、モデル適応化方法およびモデル適応化用プログラム |
JP2014523543A (ja) * | 2011-06-19 | 2014-09-11 | エムモーダル アイピー エルエルシー | コンテキストアウェア認識モデルを使用した音声認識 |
JP2018536905A (ja) * | 2015-11-06 | 2018-12-13 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 発話認識方法及び装置 |
US10741170B2 (en) | 2015-11-06 | 2020-08-11 | Alibaba Group Holding Limited | Speech recognition method and apparatus |
US11664020B2 (en) | 2015-11-06 | 2023-05-30 | Alibaba Group Holding Limited | Speech recognition method and apparatus |
JP7488382B2 (ja) | 2018-11-16 | 2024-05-21 | グーグル エルエルシー | 自動音声認識のためのコンテキスト非正規化 |
Also Published As
Publication number | Publication date |
---|---|
CN101034390A (zh) | 2007-09-12 |
US20080040099A1 (en) | 2008-02-14 |
US8078467B2 (en) | 2011-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007280364A (ja) | 言語モデルの切替・適応方法及び言語モデル切替・適応装置 | |
US10629193B2 (en) | Advancing word-based speech recognition processing | |
CN106598939B (zh) | 一种文本纠错方法及装置、服务器、存储介质 | |
US7395203B2 (en) | System and method for disambiguating phonetic input | |
US8229733B2 (en) | Method and apparatus for linguistic independent parsing in a natural language systems | |
US8738356B2 (en) | Universal text input | |
JP5513898B2 (ja) | 共有された言語モデル | |
US20090326945A1 (en) | Methods, apparatuses, and computer program products for providing a mixed language entry speech dictation system | |
US11216292B2 (en) | Adapting client application of feature phone based on experiment parameters | |
KR20220004224A (ko) | 음성 인식을 위한 컨텍스트 바이어싱 | |
KR20100065317A (ko) | 개인용 통신 장치를 위한 음성-텍스트 전사 | |
US8805869B2 (en) | Systems and methods for cross-lingual audio search | |
KR20020094760A (ko) | 컴퓨터용 소프트웨어의 언어표시방법 및언어표시시스템과, 언어표시방법과 언어표시시스템이저장된 기록매체 | |
CN113822044B (zh) | 语法纠错数据生成方法、装置、计算机设备及存储介质 | |
US7197494B2 (en) | Method and architecture for consolidated database search for input recognition systems | |
JP5998298B1 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP7250180B2 (ja) | グラフィカルユーザインターフェース内への内容の音声制御入力 | |
JP5442212B2 (ja) | 電子機器 | |
CN116306620B (zh) | 文本处理方法、训练方法、存储介质及电子设备 | |
JP2018072509A (ja) | 音声読み上げ装置、音声読み上げシステム、音声読み上げ方法、およびプログラム | |
JP5336831B2 (ja) | 文章入力を支援するための方法、並びにそのプログラム及び電子機器 | |
CN118197292A (zh) | 基于上下文信息的方言变体语音识别模型训练方法及系统 | |
JP2021085996A (ja) | 音声認識システム、音声認識方法 | |
Lin et al. | A Tibetan input method based on syllable word for mobile phone | |
JP2004178396A (ja) | 日本語変換装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091127 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100420 |