JP5233989B2 - 音声認識システム、音声認識方法、および音声認識処理プログラム - Google Patents
音声認識システム、音声認識方法、および音声認識処理プログラム Download PDFInfo
- Publication number
- JP5233989B2 JP5233989B2 JP2009505186A JP2009505186A JP5233989B2 JP 5233989 B2 JP5233989 B2 JP 5233989B2 JP 2009505186 A JP2009505186 A JP 2009505186A JP 2009505186 A JP2009505186 A JP 2009505186A JP 5233989 B2 JP5233989 B2 JP 5233989B2
- Authority
- JP
- Japan
- Prior art keywords
- user dictionary
- dictionary
- speech
- word
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 77
- 238000012545 processing Methods 0.000 claims description 72
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 description 55
- 230000008569 process Effects 0.000 description 41
- 230000005540 biological transmission Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000012546 transfer Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000002411 adverse Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 241000750004 Nestor meridionalis Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Description
音声認識に用いるユーザ辞書を格納したユーザ辞書部と、
前記ユーザ辞書から前記入力音声の認識に不要と判断した単語を排除して縮小ユーザ辞書を作成する縮小ユーザ辞書作成手段と、
予め備えているシステム辞書に前記縮小ユーザ辞書を追加し、これらの辞書に基づいて前記入力音声を認識する音声認識手段とを有することを特徴とするものである。
ユーザ辞書から前記入力音声の認識に不要と判断した単語を排除して縮小ユーザ辞書を作成し、
予め備えているシステム辞書に前記縮小ユーザ辞書を追加し、これらの辞書に基づいて前記入力音声を認識することを特徴とするものである。
前記クライアント端末装置のコンピュータに、
ユーザ辞書から前記入力音声の認識に不要と判断した単語を排除して縮小ユーザ辞書を作成する機能とを実行させ、
前記サーバのコンピュータに、
予め備えているシステム辞書に前記縮小ユーザ辞書を追加し、これらの辞書に基づいて前記入力音声を認識する機能を実行させることを特徴とするもののである。
[第1の実施形態]
本発明の第1の実施形態にかかる音声認識システムの一構成例を図1に基づいて説明する。
まず、ユーザがクライアント10の音声入力部11から音声を入力する(ステップS101:音声入力工程)。これに伴い、縮小辞書作成部13は、ステップS101で入力された音声データを参照して、ユーザ辞書部12から縮小ユーザ辞書を作成する(ステップS102:縮小ユーザ辞書作成工程)。
この縮小辞書作成部13は、入力音声と単語の照合を行い入力音声中に当該単語が現れる尤度を計算する照合部13Aと、この尤度の対象となった単語と尤度の組を仮に保持する単語仮格納部13Bと、この単語仮格納部13Bを参照して尤度の高い一乃至複数の単語を選択する単語選択部13Cとを備えて構成されている。
この縮小辞書作成部13は、ユーザ辞書12に含まれる単語のそれぞれに対して、ステップS202とステップS203の処理を繰り返す(ステップS201)。
ステップS202では、縮小辞書作成部13は、照合部13Aにおいて、注目単語が入力音声に含まれる尤度を計算する(尤度計算工程)。ステップS203では、縮小辞書作成部13は、注目単語を、計算した尤度と対応させて(組にして)縮小辞書とし、これを作成単語仮格納部13Bに格納する(単語仮格納工程)。
或いは、固定の数を予め定めておき、選択した単語数がこの数を超えない範囲で、尤度の高いものから単語を順に選択していく、というやり方で実施することもできる。
もちろん、これらを組み合わせて、例えば、選択した単語の数が予め定めた数を超えない範囲で、尤度の高いものから単語を順に選択していくが、これも予め定めた最低尤度より尤度の低い単語は選択しない、などのやり方で実施することもできる。
照合部13Aと単語選択部13Cは、例えば、メモリ上に格納されコンピュータプログラムをCPUで実行することにより構成されるようにしてもよいものである。
縮小ユーザ辞書部13Dに格納された縮小ユーザ辞書は、格納されているデータが、単語選択部13Cで選択された単語に限られることから、ユーザ辞書の部分辞書としての性質を有する。
これらについては、各工程内容をプログラム化し前述したクライアント側に予め装備したコンピュータに実行させるように構成してもよい。
マッチング結果としての距離がある閾値以下になったとき、その時点に標準パターンあり、と判定する。
上記で詳細に説明したように、照合部13Aにおける照合処理は、既知の技術を用いて様々な形態で実施することが可能である。
今、ユーザが、クライアント10の音声入力部11に対し、例えば「シェイスタジアムはどこですか」と発声(音声入力)したと想定する(図2のステップS101)。
この発声に対応する読みは、ひらがなで表記すると、「しぇいすたじあむわどこですか」となる。ユーザの音声入力に伴い、直ちに縮小辞書作成部13が起動する(図2のステップS102)。
図5(b)は、尤度計算及び単語格納の処理が完了した時点の単語仮格納部13Bの内容の一例を示す図である。ユーザ辞書の全ての単語に対して、計算された尤度が、単語と対応するように格納されている。
この図5(C)において、縮小ユーザ辞書は、先に選択された三つの単語「シェイスタジアム、シェークスピアガーデン、メイシーズ」からなり、各単語の辞書内容は、図5(a)に示したユーザ辞書と全く同じになるように構成されている。
このようにして、クライアント10で作成された縮小ユーザ辞書は、入力音声データ「しぇいすたじあむわどこですか」と一緒に、クライアント通信部14から通信回線120を介してサーバ20のサーバ通信部23に送信される(図2のステップS103)。
音声認識部22は、入力音声「しぇいすたじあむはどこですか」に対して、縮小ユーザ辞書とシステム辞書の両方を使って音声認識処理を行い、音声認識結果「シェイスタジアム/は/どこ/です/か」を得る。ここで、スラッシュ「/」は、認識された単語の区切れ目を表すために、説明上導入した記号である。
汎用の技術では、ユーザ辞書全体、即ち、図5(a)の例では10単語全てを送信する必要があった。これに対し、本第1実施形態では、上述したように縮小ユーザ辞書に格納された三単語分のデータを転送すればよい。
このように構成することにより音声認識精度の悪化を防止することができるのも、本第1実施形態の他にない優れた利点(効能)である。
これに対し、汎用の技術では、入力先のフォームのIDのように、音声以外の情報を使用することによってクライアントからサーバに送信する語彙を絞り込む必要があった。
この点は、汎用の技術が音声認識の処理対象である音声データ以外の情報がないと適用できないのと比較して、本実施形態の大きな利点である。
即ち、サーバ20における音声認識処理では、実質的にシステム辞書とユーザ辞書の双方を同時に使用して音声認識結果を得ることができる。具体的に説明すると、ユーザが携帯する携帯端末などのクライアントにはユーザ辞書が搭載されているから、ユーザはユーザ辞書に必要な単語を登録する。ユーザ辞書をそのままの容量でサーバに送信してユーザ辞書とシステム辞書とを用いて音声認識を行うことが最善の方法であるが、辞書を送信することを考慮すると、送信容量の面で問題が生じる。
次に、本発明の第2の実施形態を図6及び図7を参照して説明する。
ここで、前述した第1の実施形態と同一の構成部材については同一の符号を用いるものとする。
クライアント(クライアント端末装置)60は、図6に示すように音声入力部61、データ処理部62、記憶部63、クライアント通信部64、縮小辞書作成プログラム65、および認識結果出力部69とを備えている。
記憶部63には、ユーザ辞書63aがデータとして記憶されている。データ処理部62は、縮小辞書作成プログラム65を読み込んで、データ処理(縮小辞書作成)を制御する。
具体的には、データ処理部72は、クライアント60から送りこまれる入力音声データと縮小ユーザ辞書とをサーバ通信部71を介して受信した後、記憶部73内のシステム辞書73aと前記縮小ユーザ辞書の両方を利用して、入力音声データに対する音声認識処理を実行する。
その他各部の機能については、或いはその他の構成およびその作用効果については、前述した第1実施形態の場合と同一となっている。
まず、サーバ70における音声認識処理では、前述した第1実施形態の場合と同様に、実質的にシステム辞書とユーザ辞書とを同時に使用した場合と同じ音声認識結果を得ることができ、入力音声以外の情報が利用できない場合でもクライアント60及びサーバ70間で転送されるデータ量が少なくて済むという効果がある。
更に、クライアント60で利用可能なリソースが少ない場合でもシステム全体としての音声認識精度への悪影響が少ないという効果がある。
また、音声入力装置から音声認識装置に転送するデータ量及び通信コストを、ユーザ辞書全体を送信する場合と比べて大幅に削減でき、かかる点において回線の負担を確実に低減することができ、全体的に音声認識の処理時間を短縮することができるという利点がある。更に、音声入力装置から音声認識装置に転送するデータ量及び通信コストを、ユーザ辞書全体を送信する場合と比べて大幅に削減できる。
これにより、音声認識に用いるワードスポッティング法を縮小ユーザ辞書の作成に有効に応用し効率的な縮小ユーザ辞書を作成することができる。
音声入力装置にあって受信した音声を電気信号に変換しこれを入力音声として入力する音声入力制御機能、前記音声入力装置が備えている音声認識用のユーザ辞書から前記入力音声に関する単語を抽出して縮小ユーザ辞書を作成する縮小ユーザ辞書作成制御機能、前記入力音声及び前記縮小ユーザ辞書を音声認識処理用として前記音声入力装置から音声認識装置に送信する送信制御機能、を実行させる構成としてもよいものである。
前記音声入力装置から送信される前記入力音声と前記音声入力装置側のユーザ辞書に係る縮小ユーザ辞書とを受信する認識対象受信処理機能、この受信した前記入力音声を、当該音声認識装置が備えている音声認識用のシステム辞書と前記受信した縮小ユーザ辞書とに基づいて音声認識処理を行う音声認識処理機能、を実行させる構成としてもよいものである。
11,61 音声入力部
12 ユーザ辞書部
13 縮小辞書作成部(縮小辞書作成手段)
13A 照合部
13B 単語仮格納部
13C 単語選択部
13D 縮小ユーザ辞書部
14 クライアント通信部(送信手段、受信手段)
15,69 認識結果出力部
20,70 音声認識装置としてのサーバ
21 システム辞書部
22 音声認識部(音声認識手段)
23 サーバ通信部(送信手段、受信手段)
62 データ処理部(縮小ユーザ辞書の作成)
72 データ処理部(音声認識処理)
73 記憶部(ユーザ辞書の記憶部)
73a システム辞書
75 音声認識プログラム
120 通信回線
Claims (17)
- 電気信号に変換された入力音声を認識する音声認識システムであって、
音声認識に用いるユーザ辞書を格納したユーザ辞書部と、
前記ユーザ辞書から前記入力音声の認識に不要と判断した単語を排除して縮小ユーザ辞書を作成する縮小ユーザ辞書作成手段と、
予め備えているシステム辞書に前記縮小ユーザ辞書を追加し、これらの辞書に基づいて前記入力音声を認識する音声認識手段とを有することを特徴とする音声認識システム。 - 前記ユーザ辞書部と前記縮小ユーザ辞書作成手段とが、クライアント端末装置に搭載され、
前記音声認識手段が、前記クライアント端末装置と通信可能なサーバに搭載されている請求項1に記載の音声認識システム。 - 前記クライアント端末は、前記入力音声と前記縮小ユーザ辞書とを前記音声認識手段に送信する請求項2に記載の音声認識システム。
- 前記請求項1又は2に記載の音声認識システムにおいて、
前記縮小ユーザ辞書は、前記ユーザ辞書が有する単語の中から前記入力音声に含まれる可能性のある単語を選び出した辞書である音声認識システム。 - 前記請求項1又は2に記載の音声認識システムにおいて、
前記縮小ユーザ辞書作成手段は、前記ユーザ辞書が有する単語と前記入力音声とを照合して前記入力音声中に当該単語が現れる尤度を計算し且つその計算結果に基づいて前記尤度の高い単語を選択して前記縮小ユーザ辞書を作成する音声認識システム。 - 前記請求項1又は2に記載の音声認識システムにおいて、
前記縮小ユーザ辞書作成手段は、前記ユーザ辞書を用いたワードスポッティング法により前記縮小ユーザ辞書を作成する音声認識システム。 - 前記請求項1又は2に記載の音声認識システムにおいて、
前記縮小ユーザ辞書作成手段は、入力音声とユーザ辞書内の単語との照合を行い前記入力音声中に現れる各単語の尤度を集計する照合部と、この集計された各単語と対応する尤度との組を仮に保持する単語仮格納部と、この単語仮格納部内から用度の高い一又複数の単語を選択し縮小ユーザ辞書作成する単語選択部とを有する音声認識システム。 - 電気信号に変換された入力音声を認識する音声認識方法であって、
ユーザ辞書から前記入力音声の認識に不要と判断した単語を排除して縮小ユーザ辞書を作成し、
予め備えているシステム辞書に前記縮小ユーザ辞書を追加し、これらの辞書に基づいて前記入力音声を認識することを特徴とする音声認識方法。 - クライアント側で前記ユーザ辞書から前記縮小ユーザ辞書を作成し、
前記入力音声のデータと前記縮小ユーザ辞書とを、前記クライアント端末と通信可能なサーバに送信し、前記サーバ側で前記システム辞書と前記縮小ユーザ辞書とを用いて前記入力音声を認識する請求項8に記載の音声認識方法。 - 前記請求項8又は9に記載の音声認識方法において、
前記ユーザ辞書が有する単語と前記入力音声とを照合して前記入力音声中に当該単語が現れる尤度を計算し、その計算結果に基づいて前記尤度の高い単語を選択して前記縮小ユーザ辞書を作成する音声認識方法。 - 前記請求項8又は9に記載の音声認識方法において、
ワードスポッティング処理により前記ユーザ辞書から前記縮小ユーザ辞書を作成する音声認識方法。 - 前記請求項8又は9に記載の音声認識方法において、
前記入力音声と前記ユーザ辞書内の単語との照合を行い前記入力音声中に現れる各単語の尤度を計算し、この計算された尤度とこれに対応する単語との組を仮に保持し、この仮格納された単語内から尤度の高い一又複数の単語を選択し縮小ユーザ辞書作成し、この選択された単語を改めて辞書の形に編成し縮小ユーザ辞書を作成する音声認識方法。 - 電気信号に変換された入力音声を、通信可能に接続されたクライアント端末装置とサーバとにより認識するための音声認識プログラムであって、
前記クライアント端末装置のコンピュータに、
ユーザ辞書から前記入力音声の認識に不要と判断した単語を排除して縮小ユーザ辞書を作成する機能とを実行させ、
前記サーバのコンピュータに、
予め備えているシステム辞書に前記縮小ユーザ辞書を追加し、これらの辞書に基づいて前記入力音声を認識する機能を実行させることを特徴とする音声認識プログラム。 - 前記クライアント端末装置のコンピュータに、
前記入力音声と前記縮小ユーザ辞書とを前記サーバに向けて送信する指令を出力する機能を実行させる請求項13に記載の音声認識プログラム。 - 前記請求項13に記載の音声認識プログラムにおいて、
前記クライアント端末装置のコンピュータに、
前記ユーザ辞書が有する単語と前記入力音声とを照合して前記入力音声中に当該単語が現れる尤度を計算し、その計算結果に基づいて前記尤度の高い単語を選択して前記縮小ユーザ辞書を作成する機能を実行させる音声認識プログラム。 - 前記請求項13に記載の音声認識プログラムにおいて、
前記クライアント端末装置のコンピュータに、
ワードスポッティング処理により前記ユーザ辞書から前記縮小ユーザ辞書を作成する機能を実行させる音声認識プログラム。 - 前記請求項13に記載の音声認識プログラムにおいて、
前記クライアント端末装置のコンピュータに、
前記入力音声と前記ユーザ辞書内の単語との照合を行い前記入力音声中に現れる各単語の尤度を計算し、この計算された尤度とこれに対応する単語との組を仮に保持し、この仮格納された単語内から尤度の高い一又複数の単語を選択し縮小ユーザ辞書作成し、この選択された単語を改めて辞書の形に編成し縮小ユーザ辞書を作成する機能を実行させる音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009505186A JP5233989B2 (ja) | 2007-03-14 | 2008-03-14 | 音声認識システム、音声認識方法、および音声認識処理プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007065229 | 2007-03-14 | ||
JP2007065229 | 2007-03-14 | ||
PCT/JP2008/054705 WO2008114708A1 (ja) | 2007-03-14 | 2008-03-14 | 音声認識システム、音声認識方法、および音声認識処理プログラム |
JP2009505186A JP5233989B2 (ja) | 2007-03-14 | 2008-03-14 | 音声認識システム、音声認識方法、および音声認識処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008114708A1 JPWO2008114708A1 (ja) | 2010-07-01 |
JP5233989B2 true JP5233989B2 (ja) | 2013-07-10 |
Family
ID=39765816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009505186A Active JP5233989B2 (ja) | 2007-03-14 | 2008-03-14 | 音声認識システム、音声認識方法、および音声認識処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8676582B2 (ja) |
JP (1) | JP5233989B2 (ja) |
WO (1) | WO2008114708A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8200478B2 (en) * | 2009-01-30 | 2012-06-12 | Mitsubishi Electric Corporation | Voice recognition device which recognizes contents of speech |
JP5471106B2 (ja) | 2009-07-16 | 2014-04-16 | 独立行政法人情報通信研究機構 | 音声翻訳システム、辞書サーバ装置、およびプログラム |
US20120330662A1 (en) * | 2010-01-29 | 2012-12-27 | Nec Corporation | Input supporting system, method and program |
JP5558284B2 (ja) * | 2010-09-15 | 2014-07-23 | 株式会社Nttドコモ | 音声認識システム、音声認識方法、および音声認識プログラム |
JP5957269B2 (ja) * | 2012-04-09 | 2016-07-27 | クラリオン株式会社 | 音声認識サーバ統合装置および音声認識サーバ統合方法 |
KR101212126B1 (ko) | 2012-07-09 | 2012-12-14 | 다이알로이드(주) | 음성인식 서버, 음성인식 클라이언트 및 그 음성인식 방법 |
US9171066B2 (en) * | 2012-11-12 | 2015-10-27 | Nuance Communications, Inc. | Distributed natural language understanding and processing using local data sources |
USRE48569E1 (en) * | 2013-04-19 | 2021-05-25 | Panasonic Intellectual Property Corporation Of America | Control method for household electrical appliance, household electrical appliance control system, and gateway |
JP2015011170A (ja) * | 2013-06-28 | 2015-01-19 | 株式会社ATR−Trek | ローカルな音声認識を行なう音声認識クライアント装置 |
WO2015047515A2 (en) | 2013-07-07 | 2015-04-02 | United Technologies Corporation | Fan drive gear system manifold radial tube filters |
WO2015026899A1 (en) | 2013-08-21 | 2015-02-26 | United Technologies Corporation | Integral gutter and front center body |
US10210204B2 (en) * | 2014-06-16 | 2019-02-19 | Jeffrey E. Koziol | Voice actuated data retrieval and automated retrieved data display |
KR102325724B1 (ko) * | 2015-02-28 | 2021-11-15 | 삼성전자주식회사 | 다수의 기기에서 텍스트 데이터 동기화 |
US10083685B2 (en) * | 2015-10-13 | 2018-09-25 | GM Global Technology Operations LLC | Dynamically adding or removing functionality to speech recognition systems |
US10325592B2 (en) * | 2017-02-15 | 2019-06-18 | GM Global Technology Operations LLC | Enhanced voice recognition task completion |
CN107507615A (zh) * | 2017-08-29 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 界面智能交互控制方法、装置、系统及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59107400A (ja) * | 1982-12-13 | 1984-06-21 | シャープ株式会社 | 音声認識方法 |
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP2002162988A (ja) * | 2000-11-27 | 2002-06-07 | Canon Inc | 音声認識システム及びその制御方法、コンピュータ可読メモリ |
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2005128076A (ja) * | 2003-10-21 | 2005-05-19 | Ntt Docomo Inc | 端末からの音声データを認識する音声認識システム及び方法 |
JP2006330576A (ja) * | 2005-05-30 | 2006-12-07 | Sharp Corp | 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0800158B1 (en) * | 1996-04-01 | 2001-06-27 | Hewlett-Packard Company, A Delaware Corporation | Word spotting |
US6195641B1 (en) * | 1998-03-27 | 2001-02-27 | International Business Machines Corp. | Network universal spoken language vocabulary |
JP2000020417A (ja) | 1998-06-26 | 2000-01-21 | Canon Inc | 情報処理方法及び装置、その記憶媒体 |
WO2000058946A1 (en) * | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
JP2001255885A (ja) | 2000-03-13 | 2001-09-21 | Oki Electric Ind Co Ltd | 音声ブラウザシステム |
JP2002215184A (ja) | 2001-01-19 | 2002-07-31 | Casio Comput Co Ltd | 音声認識装置、及びプログラム |
JP3997459B2 (ja) * | 2001-10-02 | 2007-10-24 | 株式会社日立製作所 | 音声入力システムおよび音声ポータルサーバおよび音声入力端末 |
JP2003140682A (ja) | 2001-11-05 | 2003-05-16 | Alpine Electronics Inc | 音声認識装置及び音声辞書作成方法 |
US7548863B2 (en) * | 2002-08-06 | 2009-06-16 | Apple Inc. | Adaptive context sensitive analysis |
US7369988B1 (en) * | 2003-02-24 | 2008-05-06 | Sprint Spectrum L.P. | Method and system for voice-enabled text entry |
US7437296B2 (en) * | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
JP2005227510A (ja) | 2004-02-12 | 2005-08-25 | Ntt Docomo Inc | 音声認識装置及び音声認識方法 |
US20050283724A1 (en) * | 2004-06-18 | 2005-12-22 | Research In Motion Limited | Predictive text dictionary population |
JPWO2008007688A1 (ja) | 2006-07-13 | 2009-12-10 | 日本電気株式会社 | 音声認識機能を有する通話端末、その音声認識辞書の更新支援装置及び更新方法 |
JP4867654B2 (ja) * | 2006-12-28 | 2012-02-01 | 日産自動車株式会社 | 音声認識装置、および音声認識方法 |
-
2008
- 2008-03-14 WO PCT/JP2008/054705 patent/WO2008114708A1/ja active Application Filing
- 2008-03-14 JP JP2009505186A patent/JP5233989B2/ja active Active
- 2008-03-14 US US12/526,465 patent/US8676582B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59107400A (ja) * | 1982-12-13 | 1984-06-21 | シャープ株式会社 | 音声認識方法 |
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP2002162988A (ja) * | 2000-11-27 | 2002-06-07 | Canon Inc | 音声認識システム及びその制御方法、コンピュータ可読メモリ |
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2005128076A (ja) * | 2003-10-21 | 2005-05-19 | Ntt Docomo Inc | 端末からの音声データを認識する音声認識システム及び方法 |
JP2006330576A (ja) * | 2005-05-30 | 2006-12-07 | Sharp Corp | 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2008114708A1 (ja) | 2008-09-25 |
US20100324899A1 (en) | 2010-12-23 |
JPWO2008114708A1 (ja) | 2010-07-01 |
US8676582B2 (en) | 2014-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5233989B2 (ja) | 音声認識システム、音声認識方法、および音声認識処理プログラム | |
US11145292B2 (en) | Method and device for updating language model and performing speech recognition based on language model | |
US8831939B2 (en) | Voice data transferring device, terminal device, voice data transferring method, and voice recognition system | |
WO2014208231A1 (ja) | ローカルな音声認識を行なう音声認識クライアント装置 | |
US7487091B2 (en) | Speech recognition device for recognizing a word sequence using a switching speech model network | |
JP5706384B2 (ja) | 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム | |
JP2016095383A (ja) | 音声認識クライアント装置及びサーバ型音声認識装置 | |
US9601107B2 (en) | Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus | |
US9418662B2 (en) | Method, apparatus and computer program product for providing compound models for speech recognition adaptation | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
US10170122B2 (en) | Speech recognition method, electronic device and speech recognition system | |
US7392184B2 (en) | Arrangement of speaker-independent speech recognition | |
CN101183525A (zh) | 用于自动语音识别系统的自适应语境 | |
JP2013064777A (ja) | 端末装置、音声認識プログラム、音声認識方法および音声認識システム | |
CN102543071A (zh) | 用于移动设备的语音识别系统和方法 | |
US7324945B2 (en) | Method of dynamically altering grammars in a memory efficient speech recognition system | |
US20220399013A1 (en) | Response method, terminal, and storage medium | |
US7835913B2 (en) | Speaker-dependent voice recognition method and voice recognition system | |
US20190295541A1 (en) | Modifying spoken commands | |
US11482244B2 (en) | Textual echo cancellation | |
JP2002049390A (ja) | 音声認識方法およびサーバならびに音声認識システム | |
JP3914709B2 (ja) | 音声認識方法およびシステム | |
US11527244B2 (en) | Dialogue processing apparatus, a vehicle including the same, and a dialogue processing method | |
JP2003202890A (ja) | 音声認識装置及びその方法、プログラム | |
WO2024009465A1 (ja) | 音声認識装置、プログラム、音声認識方法、及び音声認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130311 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5233989 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |