JP5274711B2 - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP5274711B2 JP5274711B2 JP2012507900A JP2012507900A JP5274711B2 JP 5274711 B2 JP5274711 B2 JP 5274711B2 JP 2012507900 A JP2012507900 A JP 2012507900A JP 2012507900 A JP2012507900 A JP 2012507900A JP 5274711 B2 JP5274711 B2 JP 5274711B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- dictionary
- vocabulary
- unit
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Description
同様に、特許文献2においても、使用者の行動履歴の内容によっては認識対象の語彙数を絞り込めず、認識辞書の生成に要する時間が長時間化する可能性がある。
実施の形態1.
図1は、この発明の実施の形態1による音声認識装置の構成を示すブロック図である。実施の形態1における音声認識装置1は、使用者との対話による音声認識を行う前に予め生成しておく認識辞書と、使用者との対話途中に生成する認識辞書とを、音声認識に使用する。本発明では、使用者との対話による音声認識を行う前に、いわゆる静的に生成した認識辞書を“静的生成辞書”と呼び、また、使用者との対話途中で、いわゆる動的に生成した認識辞書を“動的生成辞書”と呼ぶこととする。
認識辞書動的生成部(動的生成部)8は、認識辞書動的生成判定部7によって認識辞書の生成が必要であると判定された語彙を用いて認識辞書を動的に生成する構成部である。
例えば、認識辞書動的生成部8は、対話管理部6によって選択された認識対象語彙又は不図示の通信手段を介して外部からオンラインで取得した認識対象語彙を用いて動的生成辞書を生成する。なお、動的生成辞書は、使用者との対話の進行に応じて変更される認識対象語彙を用いて動的に生成するので、静的生成辞書よりも辞書生成に使用する認識対象語彙の数を少なくして辞書生成に要する時間を短縮している。
さらに、認識対象語彙記憶部4、静的生成辞書記憶部5及び認識辞書記憶部9は、上記コンピュータに搭載された記憶装置、例えばハードディスク装置や外部記憶メディア等に構築することができる。
(1)静的生成辞書の生成
先ず、認識辞書静的生成判定部2は、認識対象語彙記憶部4に記憶されている各語彙について、静的生成辞書の生成が必要であるか否かを判定する。
ここでは、例えば、認識辞書を動的に生成した場合にかかる時間が、所定の時間以内に収まる語彙数であれば、静的生成辞書を生成不要と判定し、上記所定の時間を超える語彙数である場合には、静的生成辞書の生成が必要であると判定する。
また、音声認識装置1において、音声認識を行う各場面での認識対象語彙を用いた辞書生成時間(動的生成辞書の生成時間)を計測して記憶しておき、認識辞書静的生成判定部2が、音声認識装置1側に記憶された上記計測値が所定の時間を超える語彙については、静的生成辞書の生成が必要であると判定してもよい。
また、音声認識装置1の起動時や、認識対象となり得る語彙のデータベースである認識対象語彙記憶部4の記憶内容を更新したタイミングで静的生成辞書を生成するようにしてもよい。
対話管理部6は、音声認識装置1において使用者との対話で音声認識を行うにあたり、使用者から指定された音声認識の場面及び当該使用者との対話履歴などに基づいて、認識対象語彙記憶部4に記憶されている語彙のうちから認識対象語彙を順次選択する。
例えば、住所を音声認識する場合、対話管理部6は、認識開始時には、認識対象語彙記憶部4に記憶されている語彙のうち、県名を認識対象語彙として選択し、使用者が県名を入力した後は、この県名に従属する語彙である市区町村名を認識対象語彙として認識対象語彙記憶部4から選択する。このようにして、対話管理部6は、使用者との対話によって認識対象語彙及びその語彙数を求める。
つまり、使用者との対話の進行に応じて、県名、各県に含まれる市町村名、各市町村に含まれる区や字などの語彙の階層構造における各階層の語彙が、動的生成辞書の認識対象語彙として選択される。
なお、尤度が最も高い語彙ではなく、認識対象語彙のうち、尤度が高いものから上位N個を音声認識結果としても構わない。
図2は、この発明の実施の形態2による音声認識装置の構成を示すブロック図である。図2に示すように、実施の形態2における音声認識装置1Aは、上記実施の形態1で示した音声認識装置1の構成に加え、動的生成辞書管理部(記憶管理部)11及び動的生成辞書一時記憶部(一時記憶部)12を備える。なお、図2において、図1と同一若しくはこれに相当する構成には同一符号を付して説明を省略する。
さらに、認識対象語彙記憶部4、静的生成辞書記憶部5、認識辞書記憶部9及び動的生成辞書一時記憶部12は、上記コンピュータに搭載された記憶装置、例えばハードディスク装置や外部記憶メディア等に構築することができる。
動的生成辞書管理部11は、認識辞書動的生成部8によって動的生成辞書が新たに生成されると、動的生成辞書一時記憶部12の使用済みの記憶容量が所定の容量を超えているか否かを判定する。ここで、動的生成辞書一時記憶部12の使用済みの記憶容量が所定の容量未満であれば、動的生成辞書管理部11は、新たに生成された動的生成辞書を動的生成辞書一時記憶部12に記憶する。
例えば、最終の使用日時が最も古い動的生成辞書を削除対象とする。
また、音声認識装置1Aの稼働中に使用された動的生成辞書の平均使用間隔が最も長いものを削除対象としてもよい。
動的生成辞書一時記憶部12に記憶されていた動的生成辞書を削除すると、動的生成辞書管理部11は、新たに生成された動的生成辞書を動的生成辞書一時記憶部12に記憶する。
また、認識辞書動的生成判定部7は、認識対象語彙の認識辞書が、静的生成辞書記憶部5及び動的生成辞書一時記憶部12のいずれかに記憶されていれば、当該認識辞書を読み出して認識辞書記憶部9へ記憶する。音声認識部10は、認識辞書記憶部9に記憶された認識辞書を用いて、入力音声に対する音声認識を行う。
図3は、この発明の実施の形態3による音声認識装置の構成を示すブロック図である。実施の形態3における音声認識装置1Bは、使用者との対話により認識対象語彙を切り替えながら音声認識を行う装置であり、音楽検索(例えば、全デバイス中の曲、アーティスト選択後の曲、アルバム選択後の曲など)のように、語彙の階層構造を辿って対話場面(音声認識を行う場面)ごとに認識対象語彙が変化する音声認識装置を想定している。
図3に示すように、音声認識装置1Bは、認識辞書静的生成判定部2a、認識辞書静的生成部3a、認識対象語彙記憶部4a、静的生成辞書記憶部5a、対話管理部6a、認識辞書動的生成判定部7、認識辞書動的生成部8、認識辞書記憶部9、音声認識部10、認識対象語彙更新部13及び音声認識結果選択部14を備える。
音声認識結果選択部14は、音声認識部10の認識結果候補のうち、対話管理部6aで選択された認識対象語彙に対応する認識結果候補のみを選択して、音声認識の結果として出力する構成部である。
さらに、認識対象語彙記憶部4a、静的生成辞書記憶部5a及び認識辞書記憶部9は、上記コンピュータに搭載された記憶装置、例えばハードディスク装置や外部記憶メディア等に構築することができる。
(1a)静的生成辞書の生成
実施の形態3による音声認識装置1Bは、使用者との対話の進行に応じて認識対象語彙を切り替えながら音声認識を行うシステムのうち、音楽検索(全デバイス中の曲、アーティスト選択後の曲、アルバム選択後の曲など)のように、語彙の階層構造を辿って、対話場面ごとに認識対象語彙が絞り込まれるシステムに好適である。
このシステムにおいて、認識対象語彙更新部13は、認識対象語彙が変化した場合に、認識対象語彙記憶部4aに記憶される語彙を更新する。
ここで、認識対象語彙が変化するタイミングとは、例えば、音声認識装置1Bに対して外部の携帯音楽プレーヤーが接続又は切断されたときや、CDの挿入又は排出が行なわれたタイミングが挙げられる。
認識辞書静的生成部3aは、上記実施の形態1と同様に、認識辞書静的生成判定部2aによって選択された静的生成辞書を生成して静的生成辞書記憶部5aに記憶する。
音声認識時において、対話管理部6aは、使用者との対話により認識対象語彙及びその語彙数Nnを求める。これらの情報(認識対象語彙及びその語彙数Nn)は、対話管理部6aから認識辞書動的生成判定部7へ出力される。
認識辞書動的生成判定部7は、静的生成辞書記憶部5aに記憶されている静的生成辞書の認識対象語彙の包含関係及び認識対象語彙数の比率を用いて、認識辞書動的生成部8に対して新規に認識辞書を生成させるか、静的生成辞書記憶部5aに記憶される静的生成辞書を認識辞書として使用させるかを判定する。この判定は、例えば、以下のように行う。
先ず、認識辞書動的生成判定部7は、使用者との対話によって対話管理部6aが新規に選択した認識対象語彙を全て含む静的生成辞書が、静的生成辞書記憶部5aに存在するか否かを判定する(ステップST1)。例えば、対話において、ジャンルを選択し、選択されたジャンルに含まれるアーティスト名が、現在の認識場面の語彙として設定された際には、全アーティスト名辞書には現在の選択されているアーティスト名辞書が含まれているため、静的辞書が存在すると判断される。
ここで、静的生成辞書記憶部5aに上記静的生成辞書が存在しなければ(ステップST1;NO)、認識辞書動的生成判定部7は、認識辞書動的生成部8によって、対話管理部6aに選択された認識対象語彙を含む動的生成辞書を新規に生成する必要があると判定する(ステップST8;Case3)。この後、認識辞書動的生成判定部7は、認識辞書動的生成部8に対し、当該認識対象語彙についての動的生成辞書を生成するよう指示する。この指示に従い、認識辞書動的生成部8は、当該認識対象語彙についての動的生成辞書を生成して、音声認識部10による音声認識処理で使用する認識辞書として認識辞書記憶部9へ記憶する。
続いて、認識辞書動的生成判定部7は、辞書Dsに含まれる語彙数Nsを取得する(ステップST3)。
(Ns×ThR)の値が語彙数Nn未満である場合(ステップST5;YES)には、認識辞書動的生成判定部7は、ステップST7の処理(Case2)へ移行する。
ステップST7において、認識辞書動的生成判定部7は、辞書Dsを、認識辞書として認識辞書記憶部9へ記憶する。音声認識部10は、この辞書Dsを用いて、使用者の発話(入力音声)の音声認識を行い、認識結果の確からしい上位N個(尤度の上位N個)の認識結果候補を音声認識結果選択部14へ出力する。
音声認識結果選択部14では、音声認識部10によって得られた認識結果候補のうち、対話管理部6aが新規に選択した認識対象語彙に含まれる認識結果候補のみを選択(フィルタリング)し、音声認識の結果として出力する。
このように、語彙全体の辞書を予め生成してストレージに記憶しておくことで、認識辞書の更新時における認識辞書作成時間を低減することができる。
図5は、実施の形態3の認識辞書静的生成判定部2aによる判定処理の流れを示すフローチャートである。
先ず、認識辞書静的生成判定部2aは、音声認識を行う各対話場面(以下、認識場面と呼ぶ)で、認識対象語彙記憶部4aの記憶内容を参照し、各認識場面の認識対象語彙及びその語彙数をそれぞれ求める。ここで、認識辞書静的生成判定部2aは、認識対象語彙の認識辞書(静的生成辞書)を生成するか否かを判定していない認識場面のうち、認識対象語彙の語彙数が最も多い認識場面を選択する(ステップST1a)。
次に、認識辞書静的生成判定部2aは、ステップST1aで選択した認識場面の認識対象語彙の語彙数が一定数以下であるか否かを判定する(ステップST2a)。ここで、認識対象語彙数が一定数を超えていれば(ステップST2a;NO)、ステップST3aの処理へ移行する。また、一定数以下であれば(ステップST2a;YES)、ステップST7aの処理へ移行する。
続いて、認識辞書静的生成判定部2aは、ステップST1aで選択した認識場面の認識対象語彙の語彙数を、ステップST4aで選択した認識辞書の語彙数で除した値が、所定の閾値を超えるか否か(一定の割合であるか否か)を判定する(ステップST5a)。
ステップST1aで選択した認識場面の認識対象語彙の語彙数を、ステップST4aで選択した認識辞書の語彙数で除した値が上記閾値以下であると(ステップST5a;NO)、認識辞書静的生成判定部2aは、ステップST6aの処理に移行する。また、上記閾値を超える場合(ステップST5a;YES)は、ステップST7aの処理に移行する。
また、ステップST1aで選択した認識場面の認識対象語彙の語彙数と、ステップST4aで選択した認識辞書の語彙数との割合が上記閾値を超えている場合、すなわち静的生成辞書として予め生成するには語彙数が少ない場合には、当該認識辞書を予め生成する対象外とする(ステップST7a)。
このようにすることで、音声認識の認識率への影響を最小限に抑えつつ、対話途中に辞書を生成する機会を削減することができる。
図6は、この発明の実施の形態4による音声認識装置の構成を示すブロック図である。図6に示すように、実施の形態4における音声認識装置1Cは、上記実施の形態3で示した音声認識装置1Bの構成に加えて中間結果記憶部15を設けており、また認識辞書動的生成判定部7aの動作が上記実施の形態3と異なる。なお、図6において、図3と同一若しくはこれに相当する構成には同一符号を付して説明を省略する。
認識辞書動的生成判定部7aは、認識辞書動的生成部8に対して、静的生成辞書記憶部5aに記憶されている静的生成辞書と共通する認識対象語彙から動的生成辞書を生成するよう指示するにあたり、当該語彙に関して中間結果記憶部15に記憶されている中間結果を読み出して認識辞書動的生成部8に出力する。これにより、認識辞書動的生成部8は、当該中間結果を利用して動的生成辞書を生成する。
図7は、この発明の実施の形態5による音声認識装置の構成を示すブロック図である。図7に示すように、実施の形態5における音声認識装置1Dは、上記実施の形態4で示した音声認識装置1Cの構成に動的生成辞書管理部(記憶管理部)16及び動的生成辞書一時記憶部(一時記憶部)17を追加しており、また認識辞書動的生成判定部7bの動作が上記実施の形態4と異なる。
なお、図7において、図6と同一若しくはこれに相当する構成には同一符号を付して説明を省略する。
動的生成辞書一時記憶部17は、動的生成辞書管理部16により記憶対象と判定された動的生成辞書を一時的に記憶する記憶部である。
動的生成辞書管理部16は、認識辞書動的生成部8によって動的生成辞書が新たに生成されると、動的生成辞書一時記憶部17の使用済みの記憶容量が所定の容量を超えているか否かを判定する。ここで、動的生成辞書一時記憶部17の使用済みの記憶容量が所定の容量未満であれば、動的生成辞書管理部16は、新たに生成された動的生成辞書を動的生成辞書一時記憶部17に記憶する。
また、認識対象語彙の認識辞書が、静的生成辞書記憶部5a又は動的生成辞書一時記憶部17のいずれかに記憶されていれば、認識辞書動的生成判定部7bは、当該認識辞書を読み出して認識辞書記憶部9へ記憶する。音声認識部10は、認識辞書記憶部9に記憶された認識辞書を用いて、入力音声に対する音声認識を行う。
Claims (4)
- 対話により認識対象の語彙を切り替えながら音声認識を行う音声認識装置において、
認識対象となる語彙数が閾値以上である語彙に対して認識辞書を予め生成する静的生成部と、
認識対象の語彙数が前記閾値未満である語彙に対して対話の場面で認識辞書を生成する動的生成部と、
前記静的生成部又は前記動的生成部により生成された認識辞書を参照して、入力音声を音声認識する音声認識部とを備え、
前記動的生成部は、前記対話の場面で認識対象として選択された語彙を包含し、認識対象の語彙数の比率が所定の割合以上で含む認識辞書を前記静的生成部が生成していれば、前記対話の場面で当該語彙に対する認識辞書の生成を行わず、
前記音声認識部は、前記静的生成部によって生成された認識辞書を参照して、入力音声を音声認識し、認識の尤度が上位の複数の認識結果候補のうち、今回の認識対象の語彙に含まれる認識結果候補を、認識結果として出力することを特徴とする音声認識装置。 - 前記静的生成部は、対話の場面で認識対象となる語彙数が所定数を超えており、当該対話の場面における前記認識対象の語彙数が認識辞書の語彙数の所定の割合以下となるように当該認識対象の語彙に対する認識辞書を予め生成することを特徴とする請求項1記載の音声認識装置。
- 前記静的生成部による認識辞書の生成の途中結果を記憶する中間結果記憶部を備え、
前記動的生成部は、前記静的生成部により生成された認識辞書と共通する語彙に対して認識辞書を生成するにあたり、前記中間結果記憶部から読み出した前記途中結果を用いて認識辞書を生成することを特徴とする請求項1記載の音声認識装置。 - 前記動的生成部により生成された認識辞書を一時的に記憶する一時記憶部と、
前記認識辞書の使用状況に応じて前記一時記憶部に当該認識辞書を記憶するか否かを管理する記憶管理部とを備えたことを特徴とする請求項1記載の音声認識装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/002323 WO2011121649A1 (ja) | 2010-03-30 | 2010-03-30 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011121649A1 JPWO2011121649A1 (ja) | 2013-07-04 |
JP5274711B2 true JP5274711B2 (ja) | 2013-08-28 |
Family
ID=44711447
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012507900A Expired - Fee Related JP5274711B2 (ja) | 2010-03-30 | 2010-03-30 | 音声認識装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20120239399A1 (ja) |
JP (1) | JP5274711B2 (ja) |
CN (1) | CN102770910B (ja) |
DE (1) | DE112010005425T5 (ja) |
WO (1) | WO2011121649A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8868431B2 (en) * | 2010-02-05 | 2014-10-21 | Mitsubishi Electric Corporation | Recognition dictionary creation device and voice recognition device |
JP5942559B2 (ja) * | 2012-04-16 | 2016-06-29 | 株式会社デンソー | 音声認識装置 |
US9093072B2 (en) * | 2012-07-20 | 2015-07-28 | Microsoft Technology Licensing, Llc | Speech and gesture recognition enhancement |
KR102070564B1 (ko) * | 2013-08-09 | 2020-03-02 | 삼성전자주식회사 | 반도체 소자의 제조방법 |
US10565984B2 (en) | 2013-11-15 | 2020-02-18 | Intel Corporation | System and method for maintaining speech recognition dynamic dictionary |
WO2015112149A1 (en) * | 2014-01-23 | 2015-07-30 | Nuance Communications, Inc. | Method and apparatus for exploiting language skill information in automatic speech recognition |
DE112014006957B4 (de) * | 2014-09-16 | 2018-06-28 | Mitsubishi Electric Corporation | Informations-Bereitstellsystem |
US9697194B2 (en) * | 2015-06-08 | 2017-07-04 | International Business Machines Corporation | Contextual auto-correct dictionary |
US11900817B2 (en) | 2020-01-27 | 2024-02-13 | Honeywell International Inc. | Aircraft speech recognition systems and methods |
EP3855428B1 (en) * | 2020-01-27 | 2023-09-06 | Honeywell International Inc. | Aircraft speech recognition systems and methods |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208389A (ja) * | 1993-01-13 | 1994-07-26 | Canon Inc | 情報処理方法及び装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06332493A (ja) * | 1993-05-19 | 1994-12-02 | Canon Inc | 音声対話型情報検索装置及び方法 |
JPH07219590A (ja) * | 1994-01-31 | 1995-08-18 | Canon Inc | 音声情報検索装置及び方法 |
JP4581290B2 (ja) | 2001-05-16 | 2010-11-17 | パナソニック株式会社 | 音声認識装置および音声認識方法 |
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
AU2003277587A1 (en) * | 2002-11-11 | 2004-06-03 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation device and speech recognition device |
JP2007033901A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 音声認識システム、音声認識方法、および音声認識用プログラム |
JP4704254B2 (ja) * | 2006-03-16 | 2011-06-15 | 三菱電機株式会社 | 読み修正装置 |
JP4767754B2 (ja) * | 2006-05-18 | 2011-09-07 | 富士通株式会社 | 音声認識装置および音声認識プログラム |
JPWO2008007688A1 (ja) * | 2006-07-13 | 2009-12-10 | 日本電気株式会社 | 音声認識機能を有する通話端末、その音声認識辞書の更新支援装置及び更新方法 |
JP2010072507A (ja) * | 2008-09-22 | 2010-04-02 | Toshiba Corp | 音声認識検索装置及び音声認識検索方法 |
US8200478B2 (en) * | 2009-01-30 | 2012-06-12 | Mitsubishi Electric Corporation | Voice recognition device which recognizes contents of speech |
-
2010
- 2010-03-30 US US13/514,251 patent/US20120239399A1/en not_active Abandoned
- 2010-03-30 WO PCT/JP2010/002323 patent/WO2011121649A1/ja active Application Filing
- 2010-03-30 JP JP2012507900A patent/JP5274711B2/ja not_active Expired - Fee Related
- 2010-03-30 DE DE112010005425T patent/DE112010005425T5/de not_active Withdrawn
- 2010-03-30 CN CN201080064456.4A patent/CN102770910B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208389A (ja) * | 1993-01-13 | 1994-07-26 | Canon Inc | 情報処理方法及び装置 |
Non-Patent Citations (2)
Title |
---|
CSNG200400316002; 緒方 淳,有木 康雄: '大語彙連続音声認識における最ゆう単語back-off接続を用いた効率的なN-best探索法' 電子情報通信学会論文誌 第J84-DII巻 第12号, 20011201, p.2489-2500, 社団法人電子情報通信学会 * |
JPN6010023644; 緒方 淳,有木 康雄: '大語彙連続音声認識における最ゆう単語back-off接続を用いた効率的なN-best探索法' 電子情報通信学会論文誌 第J84-DII巻 第12号, 20011201, p.2489-2500, 社団法人電子情報通信学会 * |
Also Published As
Publication number | Publication date |
---|---|
WO2011121649A1 (ja) | 2011-10-06 |
CN102770910B (zh) | 2015-10-21 |
DE112010005425T5 (de) | 2013-01-10 |
CN102770910A (zh) | 2012-11-07 |
US20120239399A1 (en) | 2012-09-20 |
JPWO2011121649A1 (ja) | 2013-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5274711B2 (ja) | 音声認識装置 | |
US9805722B2 (en) | Interactive speech recognition system | |
CN106683677B (zh) | 语音识别方法及装置 | |
US9640175B2 (en) | Pronunciation learning from user correction | |
EP2862164B1 (en) | Multiple pass automatic speech recognition | |
JP5697860B2 (ja) | 情報検索装置,情報検索方法及びナビゲーションシステム | |
JP5409931B2 (ja) | 音声認識装置及びナビゲーション装置 | |
JP4942860B2 (ja) | 認識辞書作成装置、音声認識装置及び音声合成装置 | |
US10109273B1 (en) | Efficient generation of personalized spoken language understanding models | |
JP2010191400A (ja) | 音声認識装置およびデータ更新方法 | |
JP2014219614A (ja) | オーディオ装置、ビデオ装置及びコンピュータプログラム | |
JP5175325B2 (ja) | 音声認識用wfst作成装置とそれを用いた音声認識装置と、それらの方法とプログラムと記憶媒体 | |
KR20040102224A (ko) | 음성 인식 장치 | |
US8315869B2 (en) | Speech recognition apparatus, speech recognition method, and recording medium storing speech recognition program | |
CN110070859B (zh) | 一种语音识别方法及装置 | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
CN112825249A (zh) | 语音处理方法和设备 | |
US20140067400A1 (en) | Phonetic information generating device, vehicle-mounted information device, and database generation method | |
KR101905827B1 (ko) | 연속어 음성 인식 장치 및 방법 | |
EP2507792B1 (en) | Vocabulary dictionary recompile for in-vehicle audio system | |
JP6114210B2 (ja) | 音声認識装置、特徴量変換行列生成装置、音声認識方法、特徴量変換行列生成方法及びプログラム | |
JP6078435B2 (ja) | 記号列変換方法、音声認識方法、それらの装置及びプログラム | |
JP2009282835A (ja) | 音声検索装置及びその方法 | |
JP2013088488A (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP5500647B2 (ja) | 動的音声認識辞書の生成方法及びその生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5274711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |