JP5274711B2 - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP5274711B2
JP5274711B2 JP2012507900A JP2012507900A JP5274711B2 JP 5274711 B2 JP5274711 B2 JP 5274711B2 JP 2012507900 A JP2012507900 A JP 2012507900A JP 2012507900 A JP2012507900 A JP 2012507900A JP 5274711 B2 JP5274711 B2 JP 5274711B2
Authority
JP
Japan
Prior art keywords
recognition
dictionary
vocabulary
unit
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012507900A
Other languages
English (en)
Other versions
JPWO2011121649A1 (ja
Inventor
道弘 山崎
裕三 丸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2011121649A1 publication Critical patent/JPWO2011121649A1/ja
Application granted granted Critical
Publication of JP5274711B2 publication Critical patent/JP5274711B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Description

この発明は、入力音声の音声認識を行う音声認識装置に関するものである。
従来の音声認識装置では、大語彙認識で対話によって認識対象となる語彙の範囲を絞り込んでいくような音声認識の場合、一般的に、対話内容に対応する音声認識辞書(以下、認識辞書と呼ぶ)を予め生成していた。このため、様々な対話内容に対応する認識辞書をそれぞれ生成しようとした場合は、予め生成した認識辞書を記憶するために大容量の記憶装置が必要になる。
また、上述のように認識辞書を予め生成する場合の他、使用者との対話の進行状況に応じてオンラインで認識対象語彙を収集し認識辞書を生成することも行われている。この場合、全ての音声認識の場面で認識辞書を生成しようとすると、オンラインで収集する語彙数が多くなるにつれて、認識辞書の生成に要する時間(コンパイル時間等)が長時間化する。この辞書生成の時間は、対話途中での使用者の待ち時間となる。
特許文献1には、使用者との対話の進行に応じて、音声認識のための語彙を動的に変更し、使用者からの要求に応じて以前に使用した語彙に戻すことが可能な音声情報検索装置が開示されている。この装置では、以前の音声認識及び語彙検索の結果の履歴に基づいて認識対象の語彙を選択することで、認識対象の語彙数を効率的に検索できる。
また、特許文献2には、使用者の行動を予測して動的に認識辞書を変更する音声認識装置が開示されている。この装置は、使用者の行動履歴を保持しており、行動履歴から導出した行動時間帯等に基づいて使用者の行動を予測し、認識対象語彙の更新や変更を行う。これにより、使用者の行動履歴に応じて認識対象の語彙数を絞り込んでいる。
しかしながら、特許文献1では、以前の音声認識及び語彙検索の結果の履歴に基づいて認識対象の語彙を選択するので、対話内容によっては認識対象の語彙数を絞り込むことができず、対話途中の認識辞書の生成が長時間化するという課題があった。
同様に、特許文献2においても、使用者の行動履歴の内容によっては認識対象の語彙数を絞り込めず、認識辞書の生成に要する時間が長時間化する可能性がある。
この発明は、上記のような課題を解決するためになされたもので、使用者との対話途中の認識辞書の生成に要する時間を短縮するとともに、予め生成した認識辞書の記憶に必要な記憶領域の使用容量を低減することができる音声認識装置を得ることを目的とする。
特開平7−219590号公報 特開2002−341892号公報
この発明に係る音声認識装置は、対話により認識対象の語彙を切り替えながら音声認識を行う音声認識装置において、認識対象となる語彙数が閾値以上である語彙に対して認識辞書を予め生成する静的生成部と、認識対象の語彙数が閾値未満である語彙に対して対話の場面で認識辞書を生成する動的生成部と、静的生成部又は動的生成部により生成された認識辞書を参照して、入力音声を音声認識する音声認識部とを備え、動的生成部は、対話の場面で認識対象として選択された語彙を包含し、認識対象の語彙数の比率が所定の割合以上で含む認識辞書を静的生成部が生成していれば、対話の場面で当該語彙に対する認識辞書の生成を行わず、音声認識部は、静的生成部によって生成された認識辞書を参照して、入力音声を音声認識し、認識の尤度が上位の複数の認識結果候補のうち、今回の認識対象の語彙に含まれる認識結果候補を、認識結果として出力することを特徴とするものである。
この発明によれば、認識対象となる語彙数が閾値以上である語彙に対しては認識辞書を予め生成し、認識対象の語彙数が閾値未満である語彙に対して対話の場面で認識辞書を生成するので、使用者との対話途中の認識辞書の生成に要する時間を短縮するとともに、予め生成した認識辞書の記憶に必要な記憶領域の使用容量を低減することができるという効果がある。
この発明の実施の形態1による音声認識装置の構成を示すブロック図である。 この発明の実施の形態2による音声認識装置の構成を示すブロック図である。 この発明の実施の形態3による音声認識装置の構成を示すブロック図である。 実施の形態3の認識辞書動的生成判定部による判定処理の流れを示すフローチャートである。 実施の形態3の認識辞書静的生成判定部による判定処理の流れを示すフローチャートである。 この発明の実施の形態4による音声認識装置の構成を示すブロック図である。 この発明の実施の形態5による音声認識装置の構成を示すブロック図である。
以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態1.
図1は、この発明の実施の形態1による音声認識装置の構成を示すブロック図である。実施の形態1における音声認識装置1は、使用者との対話による音声認識を行う前に予め生成しておく認識辞書と、使用者との対話途中に生成する認識辞書とを、音声認識に使用する。本発明では、使用者との対話による音声認識を行う前に、いわゆる静的に生成した認識辞書を“静的生成辞書”と呼び、また、使用者との対話途中で、いわゆる動的に生成した認識辞書を“動的生成辞書”と呼ぶこととする。
認識辞書静的生成判定部2は、音声認識の対象となり得る語彙の数に応じて、当該語彙を用いた認識辞書の静的な生成が必要であるか否かを判定する構成部である。認識辞書静的生成部(静的生成部)3は、認識辞書静的生成判定部2によって認識辞書の生成が必要であると判定された語彙を用いて、認識辞書を静的に生成する構成部である。静的生成辞書は、使用者との対話に影響を与えずに生成され、また認識対象となる語彙を多数用いて生成することにより、対話のどの時点でも使用できる。
認識対象語彙記憶部4は、音声認識を行う各場面で認識対象となり得る語彙を記憶する記憶部である。例えば、本発明をカーナビゲーションシステムに適用して、当該カーナビゲーションシステムに住所等を音声認識する機能を持たせた場合、認識対象語彙記憶部4には、認識対象となり得る語彙として、県名、各県に含まれる市町村名、各市町村に含まれる区や字などが記憶される。
静的生成辞書記憶部5は、認識辞書静的生成部3によって生成された認識辞書(静的生成辞書)を記憶する記憶部である。対話管理部6は、不図示の入力装置及び表示装置を用いてHMI(Human Machine Interface)を提供して、使用者と対話処理を行う構成部である。例えば、対話管理部6は、使用者から入力された情報に基づいて、音声認識の対象となる語彙(以下、認識対象語彙と呼ぶ)を認識対象語彙記憶部4から選択する。
認識辞書動的生成判定部7は、音声認識部10が実行する音声認識に対応する認識対象語彙の静的生成辞書が静的生成辞書記憶部5に記憶されているか否かに応じて、当該認識対象語彙の認識辞書の動的な生成が必要であるか否かを判定する構成部である。
認識辞書動的生成部(動的生成部)8は、認識辞書動的生成判定部7によって認識辞書の生成が必要であると判定された語彙を用いて認識辞書を動的に生成する構成部である。
例えば、認識辞書動的生成部8は、対話管理部6によって選択された認識対象語彙又は不図示の通信手段を介して外部からオンラインで取得した認識対象語彙を用いて動的生成辞書を生成する。なお、動的生成辞書は、使用者との対話の進行に応じて変更される認識対象語彙を用いて動的に生成するので、静的生成辞書よりも辞書生成に使用する認識対象語彙の数を少なくして辞書生成に要する時間を短縮している。
認識辞書記憶部9は、音声認識部10による音声認識処理で使用される認識辞書を記憶する記憶部であり、静的生成辞書記憶部5から読み出された静的生成辞書又は認識辞書動的生成判定部7によって生成された動的生成辞書が記憶される。音声認識部10は、認識辞書記憶部9から読み出した認識辞書を用いて音声認識を実行する構成部である。
また、認識辞書静的生成判定部2、認識辞書静的生成部3、対話管理部6、認識辞書動的生成判定部7、認識辞書動的生成部8、及び音声認識部10は、この発明の趣旨に従う音声認識用プログラムをコンピュータに実行させることにより、ハードウエアとソフトウエアが協働した具体的な手段として、当該コンピュータ上で実現することができる。
さらに、認識対象語彙記憶部4、静的生成辞書記憶部5及び認識辞書記憶部9は、上記コンピュータに搭載された記憶装置、例えばハードディスク装置や外部記憶メディア等に構築することができる。
次に動作について説明する。
(1)静的生成辞書の生成
先ず、認識辞書静的生成判定部2は、認識対象語彙記憶部4に記憶されている各語彙について、静的生成辞書の生成が必要であるか否かを判定する。
ここでは、例えば、認識辞書を動的に生成した場合にかかる時間が、所定の時間以内に収まる語彙数であれば、静的生成辞書を生成不要と判定し、上記所定の時間を超える語彙数である場合には、静的生成辞書の生成が必要であると判定する。
また、音声認識装置1において、音声認識を行う各場面での認識対象語彙を用いた辞書生成時間(動的生成辞書の生成時間)を計測して記憶しておき、認識辞書静的生成判定部2が、音声認識装置1側に記憶された上記計測値が所定の時間を超える語彙については、静的生成辞書の生成が必要であると判定してもよい。
認識辞書静的生成部3は、認識辞書静的生成判定部2により静的生成辞書の生成が必要であると判定され、認識対象語彙記憶部4から読み出された語彙を用いて、静的生成辞書を生成する。認識辞書の生成方法は、語彙がテキスト文字列で与えられている場合には、G2P(Grapheme to Phoneme)でテキスト文字列に対する読み(音素など)を生成し、音声認識部10で参照可能な形式のデータに変換する。例えば、バイナリに変換して音声認識部10で受理可能な形式とする他、必要に応じて形態素解析、単語分割を行って言語制約を作成する。
認識辞書静的生成部3によって生成された静的生成辞書は、静的生成辞書記憶部5に記憶される。静的生成辞書記憶部5は、例えば、ハードディスク装置や不揮発性メモリなどのストレージ上に構築される。静的生成辞書では、住所を音声認識する場合、県名、各県に含まれる市町村名、各市町村に含まれる区や字などの語彙の階層構造における全ての階層の語彙を認識対象語彙として用いて生成することができる。
なお、静的生成辞書は、例えば、認識対象語彙が動的に変化しない住所の音声認識などにおいては、音声認識装置1の外部で生成して、静的生成辞書記憶部5に記憶するようにしても構わない。
また、音声認識装置1の起動時や、認識対象となり得る語彙のデータベースである認識対象語彙記憶部4の記憶内容を更新したタイミングで静的生成辞書を生成するようにしてもよい。
(2)対話場面での動作
対話管理部6は、音声認識装置1において使用者との対話で音声認識を行うにあたり、使用者から指定された音声認識の場面及び当該使用者との対話履歴などに基づいて、認識対象語彙記憶部4に記憶されている語彙のうちから認識対象語彙を順次選択する。
例えば、住所を音声認識する場合、対話管理部6は、認識開始時には、認識対象語彙記憶部4に記憶されている語彙のうち、県名を認識対象語彙として選択し、使用者が県名を入力した後は、この県名に従属する語彙である市区町村名を認識対象語彙として認識対象語彙記憶部4から選択する。このようにして、対話管理部6は、使用者との対話によって認識対象語彙及びその語彙数を求める。
次に、認識辞書動的生成判定部7は、対話管理部6によって求められた認識対象語彙を用いた静的生成辞書が既に生成されているか、すなわち静的生成辞書記憶部5に記憶されているか否かを判定する。ここで、認識対象語彙についての静的生成辞書が既に生成されている場合には、認識辞書動的生成判定部7が、静的生成辞書記憶部5から当該静的生成辞書を読み出し、音声認識部10による音声認識処理で使用する認識辞書として認識辞書記憶部9へ記憶する。
一方、認識対象語彙についての静的生成辞書が生成されていなければ、認識辞書動的生成判定部7は、認識辞書動的生成部8に対し、当該認識対象語彙についての動的生成辞書を生成するよう指示する。この指示に従い、認識辞書動的生成部8は、当該認識対象語彙についての動的生成辞書を生成し、音声認識部10による音声認識処理で使用する認識辞書として認識辞書記憶部9へ記憶する。なお、認識辞書の生成方法は、上述した認識辞書静的生成部3による静的生成辞書の生成方法と同様である。
例えば、住所を音声認識する場合、使用者との対話の進行に応じて、県名が認識対象語彙として選択されると、県名を認識対象語彙とした動的生成辞書が生成され、引き続き、市区町村名を認識対象語彙とした動的生成辞書が生成される。
つまり、使用者との対話の進行に応じて、県名、各県に含まれる市町村名、各市町村に含まれる区や字などの語彙の階層構造における各階層の語彙が、動的生成辞書の認識対象語彙として選択される。
音声認識部10は、認識辞書記憶部9に記憶された認識辞書を用いて入力音声に対する音声認識を行う。音声認識の方法としては、例えば、HMM(Hidden Markov Model)やDPマッチングなどを施し、入力音声に対して認識辞書に登録されている認識対象語彙の確からしさを求め、尤度(確からしさ)が最も高い語彙を音声認識結果として出力する。
なお、尤度が最も高い語彙ではなく、認識対象語彙のうち、尤度が高いものから上位N個を音声認識結果としても構わない。
以上のように、この実施の形態1によれば、認識対象となる語彙数が閾値以上である語彙に対しては認識辞書(静的生成辞書)を予め生成し、認識対象の語彙数が閾値未満である語彙に対して対話の場面で認識辞書(動的生成辞書)を生成するので、使用者との対話途中の認識辞書の生成に要する時間を短縮するとともに、予め生成した認識辞書の記憶に必要な記憶領域の使用容量を低減することができる。
実施の形態2.
図2は、この発明の実施の形態2による音声認識装置の構成を示すブロック図である。図2に示すように、実施の形態2における音声認識装置1Aは、上記実施の形態1で示した音声認識装置1の構成に加え、動的生成辞書管理部(記憶管理部)11及び動的生成辞書一時記憶部(一時記憶部)12を備える。なお、図2において、図1と同一若しくはこれに相当する構成には同一符号を付して説明を省略する。
動的生成辞書管理部11は、認識辞書動的生成部8によって生成された動的生成辞書の動的生成辞書一時記憶部12への記憶処理を管理する構成部である。動的生成辞書一時記憶部12は、動的生成辞書管理部11によって記憶対象と判断された動的生成辞書を一時的に記憶する記憶部である。
また、認識辞書静的生成判定部2、認識辞書静的生成部3、対話管理部6、認識辞書動的生成判定部7、認識辞書動的生成部8、音声認識部10、及び動的生成辞書管理部11は、この発明の趣旨に従う音声認識用プログラムをコンピュータに実行させることにより、ハードウエアとソフトウエアが協働した具体的な手段として、当該コンピュータ上で実現することができる。
さらに、認識対象語彙記憶部4、静的生成辞書記憶部5、認識辞書記憶部9及び動的生成辞書一時記憶部12は、上記コンピュータに搭載された記憶装置、例えばハードディスク装置や外部記憶メディア等に構築することができる。
次に動作について説明する。
動的生成辞書管理部11は、認識辞書動的生成部8によって動的生成辞書が新たに生成されると、動的生成辞書一時記憶部12の使用済みの記憶容量が所定の容量を超えているか否かを判定する。ここで、動的生成辞書一時記憶部12の使用済みの記憶容量が所定の容量未満であれば、動的生成辞書管理部11は、新たに生成された動的生成辞書を動的生成辞書一時記憶部12に記憶する。
一方、動的生成辞書一時記憶部12の使用済みの記憶容量が所定の容量を超えている場合は、動的生成辞書管理部11が、動的生成辞書一時記憶部12に現在記憶されている動的生成辞書の使用履歴又は使用頻度に基づいて、動的生成辞書一時記憶部12から削除する動的生成辞書を決定して削除を実施する。
例えば、最終の使用日時が最も古い動的生成辞書を削除対象とする。
また、音声認識装置1Aの稼働中に使用された動的生成辞書の平均使用間隔が最も長いものを削除対象としてもよい。
動的生成辞書一時記憶部12に記憶されていた動的生成辞書を削除すると、動的生成辞書管理部11は、新たに生成された動的生成辞書を動的生成辞書一時記憶部12に記憶する。
この他、動的生成辞書管理部11が、動的生成辞書一時記憶部12に記憶される動的生成辞書以外に、静的生成辞書記憶部5及び認識辞書記憶部9に記憶されている認識辞書の使用履歴又は使用頻度を管理し、これらに基づいて、上記と同様に、静的生成辞書記憶部5及び認識辞書記憶部9への辞書記憶を行うようにしてもよい。
認識辞書動的生成判定部7は、認識対象語彙の認識辞書が、静的生成辞書記憶部5及び動的生成辞書一時記憶部12の双方に記憶されていない場合に、認識辞書動的生成部8に対して当該認識対象語彙の動的生成辞書を生成する必要があると判定する。
また、認識辞書動的生成判定部7は、認識対象語彙の認識辞書が、静的生成辞書記憶部5及び動的生成辞書一時記憶部12のいずれかに記憶されていれば、当該認識辞書を読み出して認識辞書記憶部9へ記憶する。音声認識部10は、認識辞書記憶部9に記憶された認識辞書を用いて、入力音声に対する音声認識を行う。
このように、認識対象語彙の認識辞書として、動的生成辞書一時記憶部12に一時記憶されている動的生成辞書を利用可能とする。これにより、使用者との対話の進行に応じてその都度、動的生成辞書を新たに生成しなくてもよく、動的生成辞書の生成に要する処理負荷を軽減することができる。
以上のように、この実施の形態2によれば、認識辞書動的生成部8により生成された認識辞書(動的生成辞書)を一時的に記憶する動的生成辞書一時記憶部12と、動的生成辞書の使用状況に応じて動的生成辞書一時記憶部12に当該認識辞書を記憶するか否かを管理する動的生成辞書管理部11とを備えたので、認識辞書を記憶するストレージの使用量を最小限に抑えつつ、辞書生成のための演算量を減らすことが可能となる。
実施の形態3.
図3は、この発明の実施の形態3による音声認識装置の構成を示すブロック図である。実施の形態3における音声認識装置1Bは、使用者との対話により認識対象語彙を切り替えながら音声認識を行う装置であり、音楽検索(例えば、全デバイス中の曲、アーティスト選択後の曲、アルバム選択後の曲など)のように、語彙の階層構造を辿って対話場面(音声認識を行う場面)ごとに認識対象語彙が変化する音声認識装置を想定している。
図3に示すように、音声認識装置1Bは、認識辞書静的生成判定部2a、認識辞書静的生成部3a、認識対象語彙記憶部4a、静的生成辞書記憶部5a、対話管理部6a、認識辞書動的生成判定部7、認識辞書動的生成部8、認識辞書記憶部9、音声認識部10、認識対象語彙更新部13及び音声認識結果選択部14を備える。
認識辞書静的生成判定部2aは、認識対象語彙記憶部4aに記憶されている語彙の更新の有無に応じて、認識対象語彙記憶部4aにおける語彙を用いた認識辞書の静的な生成が必要であるか否かを判定する構成部である。認識辞書静的生成部(静的生成部)3aは、認識辞書静的生成判定部2aにおいて静的に生成すると判定された認識対象語彙記憶部4aにおける語彙を用いて、認識辞書を静的に生成する構成部である。
認識対象語彙記憶部4aは、音声認識を行う場面で認識対象となり得る語彙を記憶する記憶部であり、認識対象語彙更新部13によって記憶内容が更新される。静的生成辞書記憶部5aは、認識辞書静的生成部3aによって生成された静的生成辞書を記憶する記憶部である。
対話管理部6aは、不図示の入力装置及び表示装置を用いてHMIを提供して、使用者と対話処理を行う構成部であり、認識対象語彙を認識対象語彙記憶部4aから選択する。認識辞書動的生成判定部7は、音声認識部10が実行する音声認識に対応する認識対象語彙の静的生成辞書が静的生成辞書記憶部5aに記憶されているか否かに応じて、当該認識対象語彙の認識辞書の動的な生成が必要であるか否かを判定する構成部である。
認識辞書動的生成部8は、認識辞書動的生成判定部7によって認識辞書の生成が必要であると判定された語彙を用いて、認識辞書を動的に生成する構成部である。認識辞書記憶部9は、音声認識部10による音声認識処理で使用される認識辞書を記憶する記憶部であり、静的生成辞書記憶5aから読み出された静的生成辞書又は認識辞書動的生成判定部7によって生成された動的生成辞書が記憶される。また、音声認識部10は、認識辞書記憶部9から読み出した認識辞書を用いて音声認識を実行する構成部である。
認識対象語彙更新部13は、認識対象語彙記憶部4aに記憶される認識対象語彙を更新する構成部である。例えば、上述した音楽検索システムであれば、携帯音楽プレーヤーが接続された場合に、認識対象語彙更新部13が、当該携帯音楽プレーヤーのメモリから、全曲名辞書、全アーティスト名辞書、全アルバム名辞書などの語彙全体を読み出して、認識対象語彙記憶部4aに記憶される語彙を更新する。
音声認識結果選択部14は、音声認識部10の認識結果候補のうち、対話管理部6aで選択された認識対象語彙に対応する認識結果候補のみを選択して、音声認識の結果として出力する構成部である。
なお、認識辞書静的生成判定部2a、認識辞書静的生成部3a、対話管理部6a、認識辞書動的生成判定部7、認識辞書動的生成部8、音声認識部10、認識対象語彙更新部13、及び音声認識結果選択部14は、この発明の趣旨に従う音声認識用プログラムをコンピュータに実行させることにより、ハードウエアとソフトウエアが協働した具体的な手段として、当該コンピュータ上で実現することができる。
さらに、認識対象語彙記憶部4a、静的生成辞書記憶部5a及び認識辞書記憶部9は、上記コンピュータに搭載された記憶装置、例えばハードディスク装置や外部記憶メディア等に構築することができる。
次に動作について説明する。
(1a)静的生成辞書の生成
実施の形態3による音声認識装置1Bは、使用者との対話の進行に応じて認識対象語彙を切り替えながら音声認識を行うシステムのうち、音楽検索(全デバイス中の曲、アーティスト選択後の曲、アルバム選択後の曲など)のように、語彙の階層構造を辿って、対話場面ごとに認識対象語彙が絞り込まれるシステムに好適である。
このシステムにおいて、認識対象語彙更新部13は、認識対象語彙が変化した場合に、認識対象語彙記憶部4aに記憶される語彙を更新する。
ここで、認識対象語彙が変化するタイミングとは、例えば、音声認識装置1Bに対して外部の携帯音楽プレーヤーが接続又は切断されたときや、CDの挿入又は排出が行なわれたタイミングが挙げられる。
認識辞書静的生成判定部2aは、認識対象語彙記憶部4aに記憶される認識対象語彙が更新されたタイミングで生成すべき静的生成辞書を選択する。例えば、上述した音楽検索システムであれば、携帯音楽プレーヤーが接続された場合に、認識対象語彙記憶部4aに記憶される語彙が、曲名、アーティスト名、アルバム名などの語彙で更新され、当該認識対象語彙記憶部4aに記憶される語彙全体の辞書、すなわち全曲名辞書、全アーティスト名辞書、全アルバム名辞書などの辞書が、静的生成辞書として選択される。
認識辞書静的生成部3aは、上記実施の形態1と同様に、認識辞書静的生成判定部2aによって選択された静的生成辞書を生成して静的生成辞書記憶部5aに記憶する。
(2a)対話場面での動作
音声認識時において、対話管理部6aは、使用者との対話により認識対象語彙及びその語彙数Nnを求める。これらの情報(認識対象語彙及びその語彙数Nn)は、対話管理部6aから認識辞書動的生成判定部7へ出力される。
認識辞書動的生成判定部7は、静的生成辞書記憶部5aに記憶されている静的生成辞書の認識対象語彙の包含関係及び認識対象語彙数の比率を用いて、認識辞書動的生成部8に対して新規に認識辞書を生成させるか、静的生成辞書記憶部5aに記憶される静的生成辞書を認識辞書として使用させるかを判定する。この判定は、例えば、以下のように行う。
図4は、実施の形態3の認識辞書動的生成判定部7による判定処理の流れを示すフローチャートである。
先ず、認識辞書動的生成判定部7は、使用者との対話によって対話管理部6aが新規に選択した認識対象語彙を全て含む静的生成辞書が、静的生成辞書記憶部5aに存在するか否かを判定する(ステップST1)。例えば、対話において、ジャンルを選択し、選択されたジャンルに含まれるアーティスト名が、現在の認識場面の語彙として設定された際には、全アーティスト名辞書には現在の選択されているアーティスト名辞書が含まれているため、静的辞書が存在すると判断される。
ここで、静的生成辞書記憶部5aに上記静的生成辞書が存在しなければ(ステップST1;NO)、認識辞書動的生成判定部7は、認識辞書動的生成部8によって、対話管理部6aに選択された認識対象語彙を含む動的生成辞書を新規に生成する必要があると判定する(ステップST8;Case3)。この後、認識辞書動的生成判定部7は、認識辞書動的生成部8に対し、当該認識対象語彙についての動的生成辞書を生成するよう指示する。この指示に従い、認識辞書動的生成部8は、当該認識対象語彙についての動的生成辞書を生成して、音声認識部10による音声認識処理で使用する認識辞書として認識辞書記憶部9へ記憶する。
一方、静的生成辞書記憶部5aに上記静的生成辞書が存在する場合(ステップST1;YES)、認識辞書動的生成判定部7は、静的生成辞書記憶部5aに記憶されている、対話管理部6aが新規に選択した認識対象語彙を全て含む静的生成辞書のうちから、語彙数が最も少ない辞書Dsを選択する(ステップST2)。
続いて、認識辞書動的生成判定部7は、辞書Dsに含まれる語彙数Nsを取得する(ステップST3)。
このあと、認識辞書動的生成判定部7は、使用者との対話により対話管理部6aが新規に選択した認識対象語彙の語彙数Nnと、辞書Dsに含まれる語彙数Nsとを比較して、双方の語彙数が等しいか否かを判定する(ステップST4)。ここで、語彙数Nn,Nsが等しい場合(ステップST4;YES)、認識辞書動的生成判定部7は、静的生成辞書記憶部5aから選択した辞書Dsをそのまま使用すべきと判定して、辞書Dsを認識辞書として認識辞書記憶部9へ記憶する(ステップST6;Case1)。
また、語彙数Nn,Nsが異なる場合(ステップST4;NO)、認識辞書動的生成判定部7は、予め定めた比率ThR(例えば、0.1)を辞書Dsに含まれる語彙数Nsに乗じた値が、対話管理部6aによって新規に選択された認識対象語彙の語彙数Nn未満であるか否か(Ns×ThR<Nn)を判定する(ステップST5)。
(Ns×ThR)の値が語彙数Nn未満である場合(ステップST5;YES)には、認識辞書動的生成判定部7は、ステップST7の処理(Case2)へ移行する。
ステップST7において、認識辞書動的生成判定部7は、辞書Dsを、認識辞書として認識辞書記憶部9へ記憶する。音声認識部10は、この辞書Dsを用いて、使用者の発話(入力音声)の音声認識を行い、認識結果の確からしい上位N個(尤度の上位N個)の認識結果候補を音声認識結果選択部14へ出力する。
音声認識結果選択部14では、音声認識部10によって得られた認識結果候補のうち、対話管理部6aが新規に選択した認識対象語彙に含まれる認識結果候補のみを選択(フィルタリング)し、音声認識の結果として出力する。
(Ns×ThR)の値が語彙数Nn以上である場合(ステップST5;NO)、認識辞書動的生成判定部7は、認識辞書動的生成部8によって、対話管理部6aに選択された認識対象語彙を含む動的生成辞書を新規に生成する必要があると判定し、ステップST8の処理(Case3)へ移行する。
音声認識結果選択部14では、認識辞書動的生成判定部7の判定結果がCase1又はCase3の場合、音声認識部10から出力された認識結果候補を、認識結果として出力する。一方、認識辞書動的生成判定部7の判定結果がCase2である場合には、音声認識部10から出力された認識結果候補の中から、対話管理部6aにより新規に選択された認識対象語彙に含まれる認識結果候補のみを選択して出力する。
このように、語彙全体の辞書を予め生成してストレージに記憶しておくことで、認識辞書の更新時における認識辞書作成時間を低減することができる。
また、認識対象語彙を包含し、認識対象語彙数の比率が一定割合以上含む認識辞書が存在する場合には、当該辞書を使用して音声認識を行ない、その認識結果候補から認識対象語彙に含まれるもののみを選択して認識結果として出力する。このようにすることで、認識率への影響を最小限に抑えつつ、対話中に辞書を生成する機会を減らすことが可能となる。
上述の説明では、認識辞書静的生成判定部2aが、語彙全体の認識辞書を予め生成する対象として判定する場合を示したが、以下のように判定しても構わない。
図5は、実施の形態3の認識辞書静的生成判定部2aによる判定処理の流れを示すフローチャートである。
先ず、認識辞書静的生成判定部2aは、音声認識を行う各対話場面(以下、認識場面と呼ぶ)で、認識対象語彙記憶部4aの記憶内容を参照し、各認識場面の認識対象語彙及びその語彙数をそれぞれ求める。ここで、認識辞書静的生成判定部2aは、認識対象語彙の認識辞書(静的生成辞書)を生成するか否かを判定していない認識場面のうち、認識対象語彙の語彙数が最も多い認識場面を選択する(ステップST1a)。
次に、認識辞書静的生成判定部2aは、ステップST1aで選択した認識場面の認識対象語彙の語彙数が一定数以下であるか否かを判定する(ステップST2a)。ここで、認識対象語彙数が一定数を超えていれば(ステップST2a;NO)、ステップST3aの処理へ移行する。また、一定数以下であれば(ステップST2a;YES)、ステップST7aの処理へ移行する。
ステップST3aにおいて、認識辞書静的生成判定部2aは、ステップST1aで選択した認識場面の認識対象語彙を全て含む認識辞書が、予め生成する対象として自身に登録済みであるか否かを判定する。ここで、予め生成する対象として登録済みであれば(ステップST3a;YES)、ステップST4aの処理へ移行する。また、登録済みでなければ(ステップST3a;NO)、ステップST6aの処理へ移行する。
認識辞書静的生成判定部2aは、ステップST1aで選択した認識場面の認識対象語彙を全て含む、予め生成する対象として登録済みの認識辞書のうち、語彙数が最小の認識辞書を選択する(ステップST4a)。
続いて、認識辞書静的生成判定部2aは、ステップST1aで選択した認識場面の認識対象語彙の語彙数を、ステップST4aで選択した認識辞書の語彙数で除した値が、所定の閾値を超えるか否か(一定の割合であるか否か)を判定する(ステップST5a)。
ステップST1aで選択した認識場面の認識対象語彙の語彙数を、ステップST4aで選択した認識辞書の語彙数で除した値が上記閾値以下であると(ステップST5a;NO)、認識辞書静的生成判定部2aは、ステップST6aの処理に移行する。また、上記閾値を超える場合(ステップST5a;YES)は、ステップST7aの処理に移行する。
ステップST6aにおいて、認識辞書静的生成判定部2aは、ステップST1aで選択した認識場面の認識対象語彙を全て含む認識辞書を、予め生成する対象として登録する。
また、ステップST1aで選択した認識場面の認識対象語彙の語彙数と、ステップST4aで選択した認識辞書の語彙数との割合が上記閾値を超えている場合、すなわち静的生成辞書として予め生成するには語彙数が少ない場合には、当該認識辞書を予め生成する対象外とする(ステップST7a)。
ステップST6a又はステップST7aの処理が完了すると、認識辞書静的生成判定部2aは、静的生成辞書の生成の要否を判定していない全ての認識場面に対して上述の処理を実施したか否かを判定する(ステップST8a)。ここで、全ての認識場面に対して処理が終わっていなければ、ステップST1aの処理へ戻り、終わっていれば処理を終了する。
以上のように、この実施の形態3によれば、認識辞書静的生成部3aが認識対象となる全ての語彙に対する認識辞書を予め生成し、認識辞書動的生成部8が、対話の場面で認識対象として選択された語彙に対する認識辞書を生成する。このように、全ての語彙に対する認識辞書のみを予め生成することにより、辞書更新時に要する認識辞書の作成時間を削減することができる。
また、この実施の形態3によれば、認識辞書動的生成部8が、対話の場面で認識対象として選択された語彙を包含し、認識対象の語彙数の比率が所定の割合以上で含む認識辞書を認識辞書静的生成部3aが生成していれば、対話の場面で当該語彙に対する認識辞書の生成を行わず、音声認識部10が、認識辞書静的生成部3aによって生成された当該認識辞書を参照して入力音声を音声認識し、認識の尤度が上位の複数の認識結果候補のうち、今回の認識対象の語彙に含まれる認識結果候補を、認識結果として出力する。
このようにすることで、音声認識の認識率への影響を最小限に抑えつつ、対話途中に辞書を生成する機会を削減することができる。
さらに、この実施の形態3によれば、認識辞書静的辞書生成判定部2aで、図5に示すような判定を行うことにより、認識辞書静的生成部3aが、対話の場面で認識対象となる語彙数が所定数を超えており、当該対話の場面における認識対象の語彙数が認識辞書の語彙数の所定の割合以下となるように当該認識対象の語彙に対する認識辞書を予め生成するので、辞書更新時に要する認識辞書の生成時間の増加を最小限に抑えつつ、対話途中の辞書生成による使用者の待ち時間を低減することができる。
実施の形態4.
図6は、この発明の実施の形態4による音声認識装置の構成を示すブロック図である。図6に示すように、実施の形態4における音声認識装置1Cは、上記実施の形態3で示した音声認識装置1Bの構成に加えて中間結果記憶部15を設けており、また認識辞書動的生成判定部7aの動作が上記実施の形態3と異なる。なお、図6において、図3と同一若しくはこれに相当する構成には同一符号を付して説明を省略する。
認識辞書静的生成部3aは、認識対象語彙から静的生成辞書を生成するにあたり、認識対象語彙の言語の特定や、表記から読みへの変換処理などを行った辞書生成の途中結果を中間結果として中間結果記憶部15に記憶する。
認識辞書動的生成判定部7aは、認識辞書動的生成部8に対して、静的生成辞書記憶部5aに記憶されている静的生成辞書と共通する認識対象語彙から動的生成辞書を生成するよう指示するにあたり、当該語彙に関して中間結果記憶部15に記憶されている中間結果を読み出して認識辞書動的生成部8に出力する。これにより、認識辞書動的生成部8は、当該中間結果を利用して動的生成辞書を生成する。
以上のように、この実施の形態4によれば、静的生成辞書の生成で得られた認識対象語彙の言語の特定や、表記から読みへの変換処理を行った途中結果を、中間結果として記憶する中間結果記憶部15を備えたので、動的生成辞書の生成時間を減らすことが可能となり、対話途中における辞書生成による使用者の待ち時間を低減することができる。
実施の形態5.
図7は、この発明の実施の形態5による音声認識装置の構成を示すブロック図である。図7に示すように、実施の形態5における音声認識装置1Dは、上記実施の形態4で示した音声認識装置1Cの構成に動的生成辞書管理部(記憶管理部)16及び動的生成辞書一時記憶部(一時記憶部)17を追加しており、また認識辞書動的生成判定部7bの動作が上記実施の形態4と異なる。
なお、図7において、図6と同一若しくはこれに相当する構成には同一符号を付して説明を省略する。
動的生成辞書管理部16は、認識辞書動的生成部8によって動的に生成された認識辞書を、動的生成辞書一時記憶部17へ一時的に記憶するか否かを判定する構成部である。
動的生成辞書一時記憶部17は、動的生成辞書管理部16により記憶対象と判定された動的生成辞書を一時的に記憶する記憶部である。
次に動作について説明する。
動的生成辞書管理部16は、認識辞書動的生成部8によって動的生成辞書が新たに生成されると、動的生成辞書一時記憶部17の使用済みの記憶容量が所定の容量を超えているか否かを判定する。ここで、動的生成辞書一時記憶部17の使用済みの記憶容量が所定の容量未満であれば、動的生成辞書管理部16は、新たに生成された動的生成辞書を動的生成辞書一時記憶部17に記憶する。
一方、動的生成辞書一時記憶部17の使用済みの記憶容量が所定の容量を超えている場合は、動的生成辞書管理部16が、動的生成辞書一時記憶部17に現在記憶されている動的生成辞書の使用履歴又は使用頻度に基づいて、動的生成辞書一時記憶部16から削除する動的生成辞書を決定して削除を実施する。例えば、最終の使用日時が最も古い動的生成辞書を削除対象とする。また、音声認識装置1Dの稼働中に使用された動的生成辞書の平均使用間隔が最も長いものを削除対象としてもよい。
動的生成辞書一時記憶部17に記憶されていた動的生成辞書を削除すると、動的生成辞書管理部16は、新たに生成された動的生成辞書を、動的生成辞書一時記憶部17に記憶する。
この他、動的生成辞書管理部16が、動的生成辞書一時記憶部17に記憶される動的生成辞書以外に、静的生成辞書記憶部5a及び認識辞書記憶部9に記憶されている認識辞書の使用履歴又は使用頻度を管理し、これらに基づいて、上記と同様に、静的生成辞書記憶部5a及び認識辞書記憶部9への辞書記憶を行うようにしてもよい。
認識辞書動的生成判定部7bは、認識対象語彙の認識辞書が、静的生成辞書記憶部5a及び動的生成辞書一時記憶部17の双方に記憶されていない場合、認識辞書動的生成部8に対して、当該認識対象語彙の動的生成辞書を新たに生成する必要があると判定する。
また、認識対象語彙の認識辞書が、静的生成辞書記憶部5a又は動的生成辞書一時記憶部17のいずれかに記憶されていれば、認識辞書動的生成判定部7bは、当該認識辞書を読み出して認識辞書記憶部9へ記憶する。音声認識部10は、認識辞書記憶部9に記憶された認識辞書を用いて、入力音声に対する音声認識を行う。
以上のように、この実施の形態5によれば、上記実施の形態4の構成に加えて、動的生成辞書を一時的に記憶する動的生成辞書一時記憶部17を備えたので、上記実施の形態4と同様の効果が得られるとともに、ストレージの使用量を最小限に抑えつつ、辞書生成のための演算量を減らすことが可能となる。
この発明に係る音声認識装置は、使用者との対話途中の認識辞書の生成に要する時間を短縮するとともに、予め生成した認識辞書の記憶に必要な記憶領域の使用容量を低減することができることから、携帯音楽プレーヤー、携帯電話、車載ナビゲーションシステムなどの音声認識装置に適している。

Claims (4)

  1. 対話により認識対象の語彙を切り替えながら音声認識を行う音声認識装置において、
    認識対象となる語彙数が閾値以上である語彙に対して認識辞書を予め生成する静的生成部と、
    認識対象の語彙数が前記閾値未満である語彙に対して対話の場面で認識辞書を生成する動的生成部と、
    前記静的生成部又は前記動的生成部により生成された認識辞書を参照して、入力音声を音声認識する音声認識部とを備え
    前記動的生成部は、前記対話の場面で認識対象として選択された語彙を包含し、認識対象の語彙数の比率が所定の割合以上で含む認識辞書を前記静的生成部が生成していれば、前記対話の場面で当該語彙に対する認識辞書の生成を行わず、
    前記音声認識部は、前記静的生成部によって生成された認識辞書を参照して、入力音声を音声認識し、認識の尤度が上位の複数の認識結果候補のうち、今回の認識対象の語彙に含まれる認識結果候補を、認識結果として出力することを特徴とする音声認識装置。
  2. 前記静的生成部は、対話の場面で認識対象となる語彙数が所定数を超えており、当該対話の場面における前記認識対象の語彙数が認識辞書の語彙数の所定の割合以下となるように当該認識対象の語彙に対する認識辞書を予め生成することを特徴とする請求項記載の音声認識装置。
  3. 前記静的生成部による認識辞書の生成の途中結果を記憶する中間結果記憶部を備え、
    前記動的生成部は、前記静的生成部により生成された認識辞書と共通する語彙に対して認識辞書を生成するにあたり、前記中間結果記憶部から読み出した前記途中結果を用いて認識辞書を生成することを特徴とする請求項1記載の音声認識装置。
  4. 前記動的生成部により生成された認識辞書を一時的に記憶する一時記憶部と、
    前記認識辞書の使用状況に応じて前記一時記憶部に当該認識辞書を記憶するか否かを管理する記憶管理部とを備えたことを特徴とする請求項1記載の音声認識装置。
JP2012507900A 2010-03-30 2010-03-30 音声認識装置 Expired - Fee Related JP5274711B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/002323 WO2011121649A1 (ja) 2010-03-30 2010-03-30 音声認識装置

Publications (2)

Publication Number Publication Date
JPWO2011121649A1 JPWO2011121649A1 (ja) 2013-07-04
JP5274711B2 true JP5274711B2 (ja) 2013-08-28

Family

ID=44711447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012507900A Expired - Fee Related JP5274711B2 (ja) 2010-03-30 2010-03-30 音声認識装置

Country Status (5)

Country Link
US (1) US20120239399A1 (ja)
JP (1) JP5274711B2 (ja)
CN (1) CN102770910B (ja)
DE (1) DE112010005425T5 (ja)
WO (1) WO2011121649A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8868431B2 (en) * 2010-02-05 2014-10-21 Mitsubishi Electric Corporation Recognition dictionary creation device and voice recognition device
JP5942559B2 (ja) * 2012-04-16 2016-06-29 株式会社デンソー 音声認識装置
US9093072B2 (en) * 2012-07-20 2015-07-28 Microsoft Technology Licensing, Llc Speech and gesture recognition enhancement
KR102070564B1 (ko) * 2013-08-09 2020-03-02 삼성전자주식회사 반도체 소자의 제조방법
US10565984B2 (en) 2013-11-15 2020-02-18 Intel Corporation System and method for maintaining speech recognition dynamic dictionary
WO2015112149A1 (en) * 2014-01-23 2015-07-30 Nuance Communications, Inc. Method and apparatus for exploiting language skill information in automatic speech recognition
DE112014006957B4 (de) * 2014-09-16 2018-06-28 Mitsubishi Electric Corporation Informations-Bereitstellsystem
US9697194B2 (en) * 2015-06-08 2017-07-04 International Business Machines Corporation Contextual auto-correct dictionary
US11900817B2 (en) 2020-01-27 2024-02-13 Honeywell International Inc. Aircraft speech recognition systems and methods
EP3855428B1 (en) * 2020-01-27 2023-09-06 Honeywell International Inc. Aircraft speech recognition systems and methods

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208389A (ja) * 1993-01-13 1994-07-26 Canon Inc 情報処理方法及び装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332493A (ja) * 1993-05-19 1994-12-02 Canon Inc 音声対話型情報検索装置及び方法
JPH07219590A (ja) * 1994-01-31 1995-08-18 Canon Inc 音声情報検索装置及び方法
JP4581290B2 (ja) 2001-05-16 2010-11-17 パナソニック株式会社 音声認識装置および音声認識方法
JP2003295893A (ja) * 2002-04-01 2003-10-15 Omron Corp 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
AU2003277587A1 (en) * 2002-11-11 2004-06-03 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation device and speech recognition device
JP2007033901A (ja) * 2005-07-27 2007-02-08 Nec Corp 音声認識システム、音声認識方法、および音声認識用プログラム
JP4704254B2 (ja) * 2006-03-16 2011-06-15 三菱電機株式会社 読み修正装置
JP4767754B2 (ja) * 2006-05-18 2011-09-07 富士通株式会社 音声認識装置および音声認識プログラム
JPWO2008007688A1 (ja) * 2006-07-13 2009-12-10 日本電気株式会社 音声認識機能を有する通話端末、その音声認識辞書の更新支援装置及び更新方法
JP2010072507A (ja) * 2008-09-22 2010-04-02 Toshiba Corp 音声認識検索装置及び音声認識検索方法
US8200478B2 (en) * 2009-01-30 2012-06-12 Mitsubishi Electric Corporation Voice recognition device which recognizes contents of speech

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208389A (ja) * 1993-01-13 1994-07-26 Canon Inc 情報処理方法及び装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200400316002; 緒方 淳,有木 康雄: '大語彙連続音声認識における最ゆう単語back-off接続を用いた効率的なN-best探索法' 電子情報通信学会論文誌 第J84-DII巻 第12号, 20011201, p.2489-2500, 社団法人電子情報通信学会 *
JPN6010023644; 緒方 淳,有木 康雄: '大語彙連続音声認識における最ゆう単語back-off接続を用いた効率的なN-best探索法' 電子情報通信学会論文誌 第J84-DII巻 第12号, 20011201, p.2489-2500, 社団法人電子情報通信学会 *

Also Published As

Publication number Publication date
WO2011121649A1 (ja) 2011-10-06
CN102770910B (zh) 2015-10-21
DE112010005425T5 (de) 2013-01-10
CN102770910A (zh) 2012-11-07
US20120239399A1 (en) 2012-09-20
JPWO2011121649A1 (ja) 2013-07-04

Similar Documents

Publication Publication Date Title
JP5274711B2 (ja) 音声認識装置
US9805722B2 (en) Interactive speech recognition system
CN106683677B (zh) 语音识别方法及装置
US9640175B2 (en) Pronunciation learning from user correction
EP2862164B1 (en) Multiple pass automatic speech recognition
JP5697860B2 (ja) 情報検索装置,情報検索方法及びナビゲーションシステム
JP5409931B2 (ja) 音声認識装置及びナビゲーション装置
JP4942860B2 (ja) 認識辞書作成装置、音声認識装置及び音声合成装置
US10109273B1 (en) Efficient generation of personalized spoken language understanding models
JP2010191400A (ja) 音声認識装置およびデータ更新方法
JP2014219614A (ja) オーディオ装置、ビデオ装置及びコンピュータプログラム
JP5175325B2 (ja) 音声認識用wfst作成装置とそれを用いた音声認識装置と、それらの方法とプログラムと記憶媒体
KR20040102224A (ko) 음성 인식 장치
US8315869B2 (en) Speech recognition apparatus, speech recognition method, and recording medium storing speech recognition program
CN110070859B (zh) 一种语音识别方法及装置
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
CN112825249A (zh) 语音处理方法和设备
US20140067400A1 (en) Phonetic information generating device, vehicle-mounted information device, and database generation method
KR101905827B1 (ko) 연속어 음성 인식 장치 및 방법
EP2507792B1 (en) Vocabulary dictionary recompile for in-vehicle audio system
JP6114210B2 (ja) 音声認識装置、特徴量変換行列生成装置、音声認識方法、特徴量変換行列生成方法及びプログラム
JP6078435B2 (ja) 記号列変換方法、音声認識方法、それらの装置及びプログラム
JP2009282835A (ja) 音声検索装置及びその方法
JP2013088488A (ja) 音声検索装置、音声検索方法及びプログラム
JP5500647B2 (ja) 動的音声認識辞書の生成方法及びその生成装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130514

R150 Certificate of patent or registration of utility model

Ref document number: 5274711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees