JP4550207B2 - 音声認識装置および音声認識ナビゲーション装置 - Google Patents
音声認識装置および音声認識ナビゲーション装置 Download PDFInfo
- Publication number
- JP4550207B2 JP4550207B2 JP2000053257A JP2000053257A JP4550207B2 JP 4550207 B2 JP4550207 B2 JP 4550207B2 JP 2000053257 A JP2000053257 A JP 2000053257A JP 2000053257 A JP2000053257 A JP 2000053257A JP 4550207 B2 JP4550207 B2 JP 4550207B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- recognition
- speech recognition
- reading
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Navigation (AREA)
- Traffic Control Systems (AREA)
Description
【発明の属する技術分野】
本発明は、音声認識および音声認識ナビゲーション装置に関する。
【0002】
【従来の技術】
自動車の現在地を表示し、地図の広域・詳細表示を行い、目的地までの進行方向および残距離を誘導する車載用ナビゲーション装置(以下、ナビゲーション装置と言う)が知られている。また、ナビゲーション装置の一機能として、運転中のドライバからの操作指示を音声で行い、ドライバの安全性を高めるいわゆる音声認識ナビゲーション装置も知られている(例えば特開平09−292255号公報)。
【0003】
音声認識ナビゲーション装置で使用する音声認識ソフトは、一般的に、発話スイッチ等を押し、その後、ユーザが発話した音データと認識辞書内の認識語との相関値を算出する。その結果、相関値が最大になった認識語を認識結果と判断する。
【0004】
【発明が解決しようとする課題】
しかし、ユーザが同じ意味内容の言葉を発話しても、その言葉の一部の読みが微妙に異なったり、あるいは、他の読みであったりする場合には、誤認識とされると言う問題があった。
【0005】
本発明は、ユーザが同じ意味内容の言葉を発話した場合に、その言葉の一部の読みが微妙に異なったり、あるいは、他の読みであったりしても、確実に音声認識を成功させることが可能な音声認識装置、音声認識ナビゲーション装置、およびそのための認識語生成方法を提供する。
【0006】
【課題を解決するための手段】
請求項1の発明は、音声入力手段と、音声認識対象の言葉に対応しその言葉の読みを表す認識語を格納する格納手段と、音声入力手段により得られた音データと認識語に基づき生成された音声認識用データとを比較して音声認識処理を行う音声認識処理手段とを備えた音声認識装置に適用され、格納手段には、音声認識対象の種類を示すジャンルごとに、音声認識対象の言葉の一部に含まれる予め定めた所定の言葉の読みについてその所定の言葉の正規の読みとは異なる読みの読みデータが格納され、音声認識処理手段があるジャンルを指定して音声認識処理を行うときに、指定されたジャンルの読みデータを参照して、所定の言葉を一部に含む音声認識対象の言葉について、所定の言葉を正規の読みとは異なる読みにした新たな認識語を生成する生成手段をさらに備え、音声認識処理手段は、生成された新たな認識語を使用して音声認識処理を行うことを特徴とするものである。
請求項2の発明は、請求項1記載の音声認識装置において、所定の言葉は、複数の音声認識対象の言葉の一部に共通に含まれる言葉であり、所定の言葉の正規の読みと異なる読みは、その言葉の通常発音される読みであることを特徴とするものである。
請求項3の発明は、音声入力手段と、音声認識対象の言葉に対応しその言葉の読みを表す認識語を格納する格納手段と、音声入力手段により得られた音データと認識語に基づき生成された音声認識用データとを比較して音声認識処理を行う音声認識処理手段とを備えた音声認識装置に適用され、格納手段には、音声認識対象の言葉の一部に含まれる予め定めた所定の言葉に関するデータが格納され、所定の言葉に関するデータを参照して、所定の言葉を一部に含む音声認識対象の言葉について、所定の言葉の読みにおいてのみ、五十音のえ段の音節の後に「い」の音節が並ぶ場合、この「い」の音節を「え」の音節に置き換えた読みとした新たな認識語を生成する生成手段をさらに備えることを特徴とするものである。
請求項4の発明は、音声入力手段と、音声認識対象の言葉に対応しその言葉の読みを表す認識語を格納する格納手段と、音声入力手段により得られた音データと認識語に基づき生成された音声認識用データとを比較して音声認識処理を行う音声認識処理手段とを備えた音声認識装置に適用され、格納手段には、音声認識対象の言葉の一部に含まれる予め定めた所定の言葉に関するデータが格納され、所定の言葉に関するデータを参照して、所定の言葉を一部に含む音声認識対象の言葉について、所定の言葉の読みにおいてのみ五十音のお段の音節の後に「う」の音節が並ぶ場合、この「う」の音節を「お」の音節に置き換えた読みとした新たな認識語を生成する生成手段をさらに備えることを特徴とするものである。
請求項5の発明は、請求項3または4記載の音声認識装置において、生成手段は、五十音のえ段の音節の後に「い」の音節が並ぶ場合の「い」の音節または五十音のお段の音節の後に「う」の音節が並ぶ場合の「う」の音節を長音符号「ー」により置き換えることを特徴とするものである。
請求項6の発明は、請求項1または2記載の音声認識装置において、格納手段に、一つの音声認識対象の言葉に対して、所定の言葉の正規の読みを含む正規の認識語と新たな認識語とが共に格納されることを特徴とするものである。
請求項7の発明は、請求項1記載の音声認識装置において、新たな認識語は、所定の言葉を一部に含む音声認識対象の言葉から所定の言葉を削除して生成される認識語であることを特徴とするものである。
請求項8の発明は、請求項1記載の音声認識装置において、新たな認識語において、所定の言葉の正規の読みと異なる読みは、その言葉が漢字で表されるときその漢字の異なる読みであることを特徴とするものである。
請求項9の発明は、請求項1記載の音声認識装置において、新たな認識語において、所定の言葉の正規の読みと異なる読みは、その言葉が有する別称あるいは略称であることを特徴とするものである。
請求項10の発明は、音声認識ナビゲーション装置に適用され、請求項1から9のいずれか1項記載の音声認識装置と、地図情報を格納する地図情報格納手段と、少なくとも音声認識装置の認識結果と地図情報とに基づき、道案内のための制御を行う制御手段とを備えることを特徴とするものである。
請求項11の発明は、音声認識処理における、音声入力手段により得られた音データと比較する音声認識用データを生成するための音声認識対象の言葉の読みを表した認識語を生成する認識語生成方法に適用され、コンピュータは、一つの音声認識対象の言葉の一部に予め定めた所定の言葉を含む場合、所定の言葉の読みにおいてのみ、五十音のえ段の音節の後に「い」の音節が並ぶ場合、この「い」の音節を「え」の音節に置き換えた読みとした認識語を生成することを特徴とするものである。
請求項12の発明は、音声認識処理における、音声入力手段により得られた音データと比較する音声認識用データを生成するための音声認識対象の言葉の読みを表した認識語を生成する認識語生成方法に適用され、コンピュータは、一つの音声認識対象の言葉の一部に予め定めた所定の言葉を含む場合、所定の言葉の読みにおいてのみ、五十音のお段の音節の後に「う」の音節が並ぶ場合、この「う」の音節を「お」の音節に置き換えた読みとした認識語を生成することを特徴とするものである。
【0008】
【発明の実施の形態】
−第1の実施の形態−
図1は、本発明の車載用ナビゲーションシステムの第1の実施の形態の構成を示す図である。車載用ナビゲーションシステムは、ナビゲーション装置100および音声ユニット200により構成される。第1の実施の形態のナビゲーションシステムは、認識語の一部に所定の言葉が含まれる場合に、その所定の言葉の読みを最も音声認識に成功する読みに置き換えるようにし、確実に音声認識に成功させるようにしたものである。
【0009】
ナビゲーション装置100は、GPS受信機101と、ジャイロセンサ102と、車速センサ103と、ドライバ104と、CPU105と、RAM106と、ROM107と、CD−ROMドライブ108と、表示装置109と、バスライン110等から構成される。
【0010】
音声ユニット200は、マイク201と、A/D変換部202と、D/A変換部203と、アンプ204と、スピーカ205と、発話スイッチ206と、ドライバ207と、CPU208と、RAM209と、ROM210と、バスライン212等から構成される。ナビゲーション装置100と音声ユニット200は、通信ライン211を介して接続される。
【0011】
GPS受信機101は、GPS(Global Positioning System)衛星からの信号を受信し、自車の絶対位置、絶対方位を検出する。ジャイロセンサ102は、例えば振動ジャイロで構成され、車のヨー角速度を検出する。車速センサ103は、車が所定距離走行毎に出すパルス数に基づき、車の移動距離を検出する。ジャイロセンサ102と車速センサ103により、車の2次元的な移動が検出できる。ドライバ104は、GPS受信機101、ジャイロセンサ102、車速センサ103からの信号をバスライン110に接続するためのドライバである。すなわち、それぞれのセンサ出力をCPU105が読むことができるデータに変換する。
【0012】
CPU105は、ROM107に格納されたプログラムを実行することによりナビゲーション装置100全体を制御する。RAM106は揮発性メモリであり、ワークデータ領域を確保する。ROM107は、不揮発性メモリで、上述した制御プログラム等を格納する。CD−ROMドライブ108は、CD−ROMを記録媒体とし、ベクトル道路データ等の道路地図情報を格納する。CD−ROMドライブは、DVDを記録媒体とするDVDドライブやその他の記録装置であってもよい。表示装置109は、車の現在地および周辺の道路地図、目的地までのルート情報、次の誘導交差点情報等を表示する。例えば、液晶表示装置あるいはCRTで構成される。バスライン110は、ナビゲーション装置100のCPU105等の構成要素をバス接続するラインである。
【0013】
音声ユニット200は、音声認識、音声合成等、音声に関する処理を行う。発話スイッチ206は、ユーザが押すことにより音声認識の開始を指示するスイッチである。発話スイッチ206が押された後所定時間、音データの入力がマイク201を介して行われる。入力された音は、A/D変換部202およびドライバ207により、デジタル音声データに変換される。
【0014】
音声ユニット200のROM210には、音声認識ソフト(プログラム)、音声合成ソフト(プログラム)、音声認識辞書(以下、単に認識辞書と言う)、音声合成辞書(以下、単に合成辞書と言う)等が格納されている。音声認識ソフトは、デジタル音声データと、認識辞書内の全認識語との相関値を算出し、最も相関値の高い認識語を認識結果として求める。音声合成ソフトは、指定した文章をスピーカから発声させるためのデータを算出する。両ソフトウェアについては、公知な内容であるので詳細な説明は省略する。
【0015】
認識辞書は、音声認識の対象となる言葉(語)を複数集めたひとかたまりのデータである。具体的には、ひらがなやカタカナやローマ字(実際にはその文字コード)で指定されたそれぞれの言葉の読みデータが格納されている。認識辞書に格納された言葉を認識語という。各認識語には、読みデータの他その言葉の表示文字データや、施設名であれば座標情報などの情報が付帯している。認識辞書の詳細については後述する。合成辞書は、音声合成のために必要な音源データ等が格納されている。
【0016】
発話終了時、CPU208は、RAM209、ROM210等を使い音声認識ソフトを実行し、デジタル音声データの音声認識を行う。音声認識ソフトは、認識辞書内の認識語の読みデータ(ひらがなやカタカナやローマ字で指定されたデータ)を参照しながらその言葉の音声認識用データを生成し、デジタル音声データとの相関値を算出する。すべての認識語についてデジタル音声データとの相関値を算出し、相関値が最も高くかつ所定の値以上の認識語を決定して音声認識を完了する。その認識語にリンクしたエコーバック語を音声合成ソフトを使い、発声用のデータに変換する。その後、D/A変換部203、アンプ204、スピーカ205を用い、認識結果をエコーバック出力させる。
【0017】
もし、算出したどの相関値も所定の値以下である場合は、音声認識できなかったとしてナビの操作を行わないようにする。具体的には、「プップー」等の認識失敗を意味するビープ音を鳴らすことや、「認識できません」と応答(エコーバック)させる。バスライン212は、音声ユニット200のバスラインである。
【0018】
次に、認識辞書について詳細に説明する。図2は、8件の病院名に関する認識語を格納した従来の病院名認識辞書を示す図である。認識語は、その施設名(図2では病院名)に関する読みデータである。図2では、「読み」はカタカナで記載されているが、ひらがなあるいはローマ字であってもよい。認識辞書には指定された文字に対応する文字コードが格納される。各認識語には、「表示用文字データ」および「付帯情報」がついている。表示用文字データは、表示装置109等でその施設名の表示すべき文字コードが格納される。図2の例では、「表示」の欄に示された施設名の漢字コードが格納される。付帯情報は、その施設の地図上の座標情報、次に読み込む認識辞書の番号、施設の諸属性情報等の各種の情報が格納されている。図2では、代表して座標情報のみを示している。
【0019】
図3は、図2の従来の病院名認識辞書に対応する本発明を適用した病院名認識辞書を示す図である。図3の「表示」および「付帯情報」の内容は、図2の「表示」および「付帯情報」の内容と同じであり、「読み」のみが異なる。例えば「王子総合病院」を例に説明する。図2では、「王子総合病院」の読みは「オウジソウゴウビョウイン」となっているが、図3では「オウジソーゴービョーイン」となっている。すなわち「ソウゴウビョウイン」が「ソーゴービョーイン」に変更されている。次の「小樽病院国立療養所」の読みは、図2では「オタルビョウインコクリツリョウヨウショ」であるが、図3では「オタルビョウインコクリツリョーヨーショ」となっている。すなわち「コクリツリョウヨウショ」が「コクリツリョーヨーショ」に変更されている。
【0020】
上記の「総合病院」の正規の読みは「ソウゴウビョウイン」である。ここで言う正規の読みとは、辞書などに書かれているその言葉の本来の読みである。しかし、実際に日常会話などで発音する読みは微妙に異なり、例えば長音符号「ー」を使用した「ソーゴービョーイン」の方がより実際の発音に近い読みと言える。
そこで、第1の実施の形態では、そのジャンルで良く出てくる言葉(キーワード)のより実際の発音に近い読みを前もって調査しておき、認識辞書の中にそのキーワードを含む言葉があった場合は、そのキーワードの読みをその実際の発音に近い読みに置き換えた認識語を準備するものである。
【0021】
図3において置き換えているキーワードを列記すると図4(a)の通りである。なお、図4(b)に示すような読みに置き換えてもよい。
【0022】
図5は、図2の従来から使用されている正規の読みの認識語が格納された認識辞書301から図3の新たな認識辞書302をパーソナルコンピュータ(以下PCと言う)303により生成する構成を示す図である。認識辞書301はCD−ROM等の記録媒体に格納され、認識辞書302はハードディスク(不図示)上に生成される。キーワード304は予め調査されてファイルとしてPC303のハードディスクに格納されている。図6は、PC303で実行される処理のフローチャートを示す。キーワード304はキーボード(不図示)から入力するようにしてもよい。生成された認識辞書302はROMに書き込まれて図1の音声ユニット200のROM210に搭載される。
【0023】
以下、図6の処理について説明する。ステップS1では、図2の正規の読みの認識語が格納された認識辞書ファイルから一つの認識語を読み込む。該当ジャンルで良く出てくる言葉(キーワード)のより実際の発音に近い読みは前もって調査され、予めパーソナルコンピュータに格納されている。ステップS2では、読み込んだ認識語に所定のキーワードが含まれているかどうか判断し、所定のキーワードが含まれていると判断するとステップS3に進む。ステップS3では、認識語のそのキーワードに該当する読みを前もって調査されたより実際の発音に近い読みに置き換える。一方、ステップS2でいずれのキーワードも含まれていないと判断するとステップS3をスキップしてステップS4に進む。ステップS4では、すべての認識語について処理が終了したかを判断し、まだ終了していない場合はステップS1に戻り処理を繰り返す。終了している場合は処理を終了する。
【0024】
なお、ステップS3において、正規の読みの認識語はそのままにして、そのキーワードに該当する読みを前もって調査されたより実際の発音に近い読みに置き換えた新たな認識語を追加するようにしてもよい。これにより、正規の読みの認識語と新たな認識語の双方を使用して音声認識をすることが可能となる。
【0025】
図7は、音声ユニット200において、音声認識を行う制御のフローチャートを示す図である。制御プログラムはROM210に格納され、CPU208がその制御プログラムを実行する。ナビゲーション装置100および音声ユニット200の電源オンにより本ルーチンはスタートする。
【0026】
本ルーチンでは、例えば、「施設ジャンル名」を音声入力し、次に「施設名」を音声入力して該当施設付近の地図を表示装置109に表示する場合を想定する。ステップS11では、初期認識辞書を準備する。初期認識辞書には「病院」「警察署」「郵便局」などの施設ジャンル名に関する認識語が格納されている。ステップS12では、発話スイッチ206が押されたかどうかを判断し、押されている場合はステップS13へ進む。押されていない場合は本ステップを繰り返す。ユーザは発話スイッチ206を押した後、一定時間内に施設ジャンル名、例えば「病院」と発話する。ステップS13では、マイク201からの音声信号をデジタル音声データに変換する。ステップS14では、発話が終了したかどうかを判断する。発話の終了は、一定時間音声信号が途切れた場合を発話の終了と判断する。発話が終了したと判断した場合はステップS15に進み、発話がまだ終了していないと判断した場合はステップS13に戻る。
【0027】
ステップS15では、ステップS13で取得したデジタル音声データとステップS11で準備した初期認識辞書内の全認識語について相関値を算出し、ステップS16に進む。ステップS16では、算出された相関値のうち最も高い相関値が所定の値以上かどうかを判断する。所定の値以上であれば、その語が認識できたとしてステップS17に進む。ステップS17では、相関値の最も高かった認識語を「施設ジャンル名」として認識して該当ジャンルの施設名辞書を準備し、「施設名称をどうぞ」とエコーバック出力する。該当ジャンルが「病院」の場合は、図6のルーチンで予め生成された図3の病院名認識辞書を準備する。
【0028】
一方、ステップS16において、最も高い相関値が所定の値未満であれば発話された言葉が認識できなかったとしてステップS23に進む。ステップS23では、「認識できません」と音声によりエコーバックし、ステップS12に戻る。
【0029】
ステップS17で「施設名称をどうぞ」とエコーバック出力されると、ユーザは、例えば図3に示された病院名を発話する。ステップS18では、マイク201からの音声信号をデジタル音声データに変換する。ステップS19では、発話が終了したかどうかを判断する。発話の終了は、一定時間音声信号が途切れた場合を発話の終了と判断する。発話が終了したと判断した場合はステップS20に進み、発話がまだ終了していないと判断した場合はステップS18に戻る。
【0030】
ステップS20では、ステップS18で取得したデジタル音声データと図3の認識辞書内の全認識語について相関値を算出し、ステップS21に進む。認識辞書は、図2の認識辞書においてキーワードの読みが置き換えられた図3の認識辞書を使用する。ステップS21では、算出された相関値のうち最も高い相関値が所定の値以上かどうかを判断する。所定の値以上であれば、その語が認識できたとしてステップS22に進む。ステップS22では、相関値の最も高かった認識語を音声によりエコーバックする。
【0031】
さらに、ステップS22では該当病院名(施設名称)が認識できたことをナビゲーション装置100に知らせた後、処理を終了する。ナビゲーション装置100に知らせるときは、表示文字データや付帯情報の地図上の座標を知らせる。ナビゲーション装置100は、通信ライン211を介して送信されてきた該当病院(施設)の地図上の座標データとCD−ROMドライブ108の地図情報等に基づき、該当施設近辺の道路地図を表示装置109に表示する。
【0032】
一方、ステップS21において、最も高い相関値が所定の値未満であれば発話された言葉が認識できなかったとしてステップS24に進む。ステップS24では、「認識できません」と音声によりエコーバックし、ステップS18に戻る。
【0033】
以上のようにして、音声認識を行うときに、該当ジャンルでよく使用されるキーワードを正規の読みとは異なる実際の発音に近い読みに置き換えた認識語を格納した認識辞書を使用するようにしている。これにより、音声認識に確実に成功することができる。特に、従来から使用していた認識辞書を使用して、キーワード部分の読みのみを置き換えた認識辞書を作成しているので、音声認識のヒット率の向上した新たな認識辞書の作成が容易かつ短時間かつ低コストで行うことができる。また、市販されている正規の読みが格納された認識辞書を購入し、その購入した認識辞書に基づき、より音声認識のヒット率を向上させた認識辞書を容易かつ短時間かつ低コストで作成することもできる。
【0034】
−第2の実施の形態−
第1の実施の形態では、図5、6に示したとおり、図3の認識辞書の生成は、パーソナルコンピュータ303で予め生成し、生成された認識辞書を図1の音声ユニット200のROM210に搭載する例を示した。第2の実施の形態では、音声ユニットにおいて、図3の該当認識辞書を使用する場合に、その時点でその該当認識辞書(図3)を生成するようにしたものである。第2の実施の形態の車載用ナビゲーションシステムの構成は、第1の実施の形態の図1の構成と同様であるのでその説明を省略する。
【0035】
図8は、第2の実施の形態の音声ユニット200において、音声認識を行う制御のフローチャートを示す図である。第1の実施の形態の図7とは、ステップS17がステップS31に置き換えられ、ステップS20がステップS32に置き換えられている点のみが異なるので、ステップS31とS32の処理を中心に以下説明する。
【0036】
第2の実施の形態では、音声ユニット200のROM210が、図2の従来の認識辞書と該当ジャンルのキーワードの読みデータ(正規の読みデータと置き換え読みデータ、例えば図4(a))を持つようにする。そして、図6の認識辞書の生成と同じ内容を、ステップS31において実行する。すなわち、図8のステップS31では、まず、相関値の最も高かった認識語を「施設ジャンル名」として認識すると、該当ジャンルの施設名辞書(図2の認識辞書)を準備する。次に、準備した施設名辞書とキーワードの正規の読みデータおよび置き換え読みデータ(図4)に基づき、図6と同様の処理を行ってキーワードの読みの置き換えを行い新たな施設名辞書(図3の認識辞書)を生成する。その後、「施設名称をどうぞ」とエコーバック出力する。ステップS32では、ステップS18で取得したデジタル音声データとステップS31で生成した新たな認識辞書(図3)内の全認識語について相関値を算出する。その他の処理は、第1の実施の形態と同様であるので説明を省略する。
【0037】
第2の実施の形態では、正規の読みの認識辞書はROM210に格納されており、新たな認識辞書はRAM209に格納される。この場合、RAM209では認識辞書をそっくり新たに作り替えるのではなく、キーワードが含まれる認識語のみ追加認識語として生成するようにしてもよい。このようにすることにより、正規の認識語と追加認識語の両方において相関値を算出することが可能となり、より精度の高い音声認識が可能となる。
【0038】
以上のようにして、第2の実施の形態においても、第1の実施の形態と同様に、音声認識に確実に成功することができる。特に、ROM210には、従来の認識語に加えてキーワードのデータのみを格納しておけばよいので、少ない記憶容量でより精度の高い音声認識が可能となる。
【0039】
−第3の実施の形態−
第2の実施の形態では、そのジャンルで良く出てくる言葉(キーワード)のより実際の発音に近い読みを前もって調査してその読みデータをROM210に格納しておくものであった。しかし、図4に示されたキーワードの読みデータの置き換えには一定の法則を見いだすことができる。第3の実施の形態では、その法則を利用して新たな認識語を生成するものである。第3の実施の形態の車載用ナビゲーションシステムの構成は、第1の実施の形態の図1の構成と同様であるのでその説明を省略する。
【0040】
まず、図4(b)の「厚生病院」を例にその法則について説明する。なお、仮名1字で示される音を1音節という。「厚生病院」の正規の読みは「コウセイビョウイン」であり、その置き換えの読みとして「コオセエビョオイン」が示されている。これは、正規の読み「コウセイビョウイン」を、実際には「コオセエビョオイン」と発話(発音)する人が多いからである。これにより、次のような法則が見いだされる。「エ」「ケ」「セ」「テ」「ネ」等の五十音のえ段の語(音節)の後に「イ」が並ぶ読みの言葉の場合、その「イ」を「エ」に置き換えたように発話する人が多い。また、「オ」「コ」「ソ」「ト」「ノ」等のお段の語(音節)の後に「ウ」が並ぶ読みの言葉の場合、その「ウ」を「オ」に置き換えたように発話する人が多い。なお、この法則については、本出願の発明者が発明者として出願された特願平11−255983号に開示されている。
【0041】
図9は、第3の実施の形態の音声ユニット200において、音声認識を行う制御のフローチャートを示す図である。第2の実施の形態の図8とは、ステップS31がステップS41に置き換えられている点のみが異なるので、ステップS41の処理を中心に以下説明する。
【0042】
図9のステップS41では、まず、相関値の最も高かった認識語を「施設ジャンル名」として認識すると、該当ジャンルの施設名辞書(図2の認識辞書)を準備する。次に、準備した施設名辞書について後述する図10の処理を行って新たな施設名辞書(例えば図3の認識辞書)を生成する。その後、「施設名称をどうぞ」とエコーバック出力する。その他の処理は、第2の実施の形態と同様であるので説明を省略する。
【0043】
次に、図10の処理を説明する。図10は、図6と同様に、従来から使用されている正規の読みの認識語が格納された認識辞書から新たな認識辞書を生成する制御を示すフローチャートである。図6と異なるのは、上述した法則を利用するところである。
【0044】
ステップS51では、図2の正規の読みの認識語格納された認識辞書ファイルから一つの認識語を読み込む。該当ジャンルで良く出てくる言葉(キーワード)は前もって調査され、ROM210に格納されている。この場合、キーワードの正規の読みのデータのみが格納されている。ステップS52では、読み込んだ認識語に所定のキーワードが含まれているかどうかを判断し、所定のキーワードが含まれていると判断するとステップS53に進む。
【0045】
ステップS53では、キーワードに五十音のえ段の語(音節)の後に「イ」が並ぶ読み(これを「え段の法則」と言う)があるかどうかを判断する。ステップS53で。え段の法則があると判断するとステップS54に進む。ステップS54では、読み「イ」を「エ」に置き換える。ステップS53で。え段の法則がないと判断するとステップS54をスキップしてステップS55に進む。
【0046】
ステップS55では、キーワードに五十音のお段の語(音節)の後に「ウ」が並ぶ読み(これを「お段の法則」と言う)があるかどうかを判断する。ステップS55で。お段の法則があると判断するとステップS56に進む。ステップS56では、読み「ウ」を「オ」に置き換える。ステップS55でお段の法則がないと判断するとステップS56をスキップしてステップS57に進む。ステップS57では、すべての認識語について処理が終了したかを判断し、まだ終了していない場合はステップS51に戻り処理を繰り返す。終了している場合は処理を終了する。
【0047】
なお、図10の処理において、正規の読みの認識語はそのままにして、え段の法則あるいはお段の法則によって置き換えられた読みの認識語を新たな認識語として追加するようにしてもよい。また、「エ」あるいは「オ」に置き換える代わりに、長音符号「ー」に置き換えるようにしてもよい。さらには、「エ」または「オ」に置き換えた認識語と、長音符号「ー」に置き換えた認識語の両方を追加するようにしてもよい。
【0048】
上記は、読みの指定をひらがなやカタカナで行う音声認識システムの場合である。しかし、ローマ字で指定する場合も、同様に考えればよい。例えば、「厚生病院」は、ローマ字では正規の認識語として「kouseibyouin」と指定される。「o」に続く「u」を「o」に置き換え「e」に続く「i」を「e」に置き換えると「kooseebyooin」という新たな認識語が生成される。
【0049】
以上のようにして、正規の読みのキーワードにおいて母音が「エイ」と続く場合は「エエ」あるいは「エー」と置き換え、母音が「オウ」と続く場合は「オオ」あるいは「オー」と置き換える読みとした。これにより、実際の発話に近い認識語が準備されるため、音声認識に成功する確率が高くなる。
【0050】
なお、第3の実施の形態では、お段の法則、え段の法則を認識語全体に適用せず、所定のキーワードにのみ適用している。この理由について説明する。例えば、地名「若江岩田」に「若江岩田中央病院」という病院名があったとする。この場合の正規の読みは「ワカエイワタチュウオウビョウイン」である。この認識語全体にお段の法則、え段の法則を適用して読み替えると、「ワカエエワタチュウオオビョオイン」となる。長音符号を適用した場合は「ワカエーワタチュウオービョーイン」となる。しかし、「若江岩田」の部分は「ワカエエワタ」あるいは「ワカエーワタ」と発音することはない。
【0051】
このように、認識語全体にお段の法則、え段の法則を適用すると、本来置き換えるべきでない読みまで置き換えてしまい、逆に精度の低い音声認識になってしまう。第3の実施の形態では、このような問題を避けるために、所定のキーワードがある場合にそのキーワードのみ置き換えるようにしたものである。これにより、お段の法則、え段の法則を適用して自動的に読みの置き換え語(言い替え語、新たな認識語)が生成できるとともに、置き換えたくない読みは確実に置き換えないようにすることができる。その結果、精度の高い置き換え語を自動で生成することができる。
【0052】
なお、第3の実施の形態では、第2の実施の形態と同様に、該当ジャンルの音声認識をする時点で新たな認識辞書を生成するようにした例で説明した。しかし、第1の実施の形態と同様に、お段の法則、え段の法則を適用した新たな認識辞書をパーソナルコンピュータ303(図5)で予め生成するようにしてもよい。これにより、第1の実施の形態と同様な効果を奏すると同時に、本来置き換えるべきでない読みの置き換えを回避することも可能となる。
【0053】
−第4の実施の形態−
第1の実施の形態では、所定のキーワードについて、実際の発音により近い読みに置き換えた新たな認識語を生成する例を示した。第4の実施の形態では、所定のキーワードの読みをいくつか準備し、キーワードのそれぞれの読みを含む新たな認識語を認識辞書に追加するようにしたものである。第4の実施の形態の車載用ナビゲーションシステムの構成は、第1の実施の形態の図1の構成と同様であるのでその説明を省略する。
【0054】
第4の実施の形態の認識辞書について説明する。図11は、ジャンルが郵便局、役場、インターランプに関する認識語を格納した従来の認識辞書を示す図である。図12は、第4の実施の形態において、本発明を適用した図11に対応する認識辞書を示す図である。
【0055】
図11(a)のジャンルが「郵便局」のときに、施設名称「座間郵便局」を指定する場合について説明する。ナビゲーションシステムより「ジャンル名をどうぞ」と促されて「ゆうびんきょく」と発話する。その後「施設名称をどうぞ」と促された場合に、「ざまゆうびんきょく」と発話すべきか「ざま」とだけ発話すべきか迷うときがある。図12(a)の認識辞書には、「座間郵便局」に対して「ざまゆうびんきょく」と「ざま」の2つの読みの認識語が格納されている。従って「ざまゆうびんきょく」と発話しても「ざま」とだけ発話してもどちらも音声認識に成功する。
【0056】
次に、図11(b)のジャンルが「役場」のときに、施設名称「愛川町役場」を指定する場合について説明する。ナビゲーションシステムより「施設名称をどうぞ」と促されたときに、上記と同様に「あいかわまちやくば」と発話すべきか、「あいかわまち」とだけ発話すべきかに加えて、「あいかわちょうやくば」と発話すべきか迷うことがある。これは、地方によって「町」という漢字を「まち」と呼ぶ場合もあれば「ちょう」と呼ぶ場合もあるからである。図12(b)の認識辞書には、「あいかわまちやくば」「あいかわまち」「あいかわちょうやくば」の3つの認識語が準備されているので、どのように発話されても音声認識に成功する。「村役場」の場合も同様である。
【0057】
すなわち、図12は、認識語の最後の言葉の読みが所定のキーワードである場合に、所定のキーワードの複数の読みで置き換えられた新たな認識語が追加されたものである。図13は、図12におけるキーワードと置き換えられる読みを整理した図である。例えば、認識語が「あいかわまちやくば」という読みの場合に、その読みの中に図13のキーワードがあるかどうかを検索し、「まちやくば」というキーワードを見つけると、そのキーワードの置き換え読みに置き換えた認識語、すなわち「あいかわまち」「あいかわちょうやくば」を追加したものである。
【0058】
なお、置き換える読みには、図13の「ゆうびんきょく」や「いんたーちぇんじ」等にも示す通り、そのキーワードの読みを省略する場合も含む。また、「いんたーちぇんじ」を「あいしー」とか「いんたー」とかの読みに置き換えるのは、「インターチェンジ」の別称として通常使用されるものであるからである。「さーびすえりあ」を「ぱーきんぐ」と置き換えるのも別称と言えるからである。「ぱーきんぐえりあ」を「ぱーきんぐ」とするのは略称と言える。また、図11に示される各ジャンルの各施設名称は、地理的名称と施設名からなる名称である。従って、キーワードはそのジャンルの施設名とすることも可能である。
【0059】
図14は、図11の従来から使用されている正規の読みの認識語が格納された認識辞書から図12の認識辞書を生成する制御のフローチャートを示す。図12の認識辞書の生成は、図5と同様にパーソナルコンピュータ303で実行され、生成された認識辞書はROMに書き込まれて図1の音声ユニット200のROM210に搭載される。
【0060】
ステップS61では、図11の正規の読みの認識語が格納された認識辞書ファイルから一つの認識語を読み込む。該当ジャンルで良く出てくる言葉(キーワード)の置き換え読みは、図13に示すとおり、前もって調査され予めパーソナルコンピュータ303に格納されている。ステップS62では、読み込んだ認識語に所定のキーワードが含まれているかどうかを判断し、所定のキーワードが含まれていると判断するとステップS63に進む。ステップS63では、認識語のそのキーワードに該当する読みに置き換えた新たな認識語を生成する。一方、ステップS62でいずれのキーワードも含まれていないと判断するとステップS63をスキップしてステップS64に進む。ステップS64では、すべての認識語について処理が終了したかを判断し、まだ終了していない場合はステップS61に戻り処理を繰り返す。終了している場合は処理を終了する。
【0061】
第4の実施の形態では、図12の認識辞書の生成は、図5のパーソナルコンピュータ303で予め生成し、生成された認識辞書を図1の音声ユニット200のROM210に搭載する例を示した。しかし、第2の実施の形態と同様に、音声ユニットにおいて、該当認識辞書を使用する時点でその該当認識辞書をRAM209上に生成するようにしてもよい。この場合は、図11の認識辞書と図13のキーワードの置き換えデータのみをROM210に持てばよいので、ROM210の容量が小さくなり、コスト低減につながる。
【0062】
以上の第4の実施の形態では、認識語が予め定めたあるキーワードを含む場合、そのキーワードの読みのバリエーションが考慮された認識語が追加されるので、音声認識に確実に成功することができる。
【0063】
なお、第4の実施の形態の内容と第1〜第3の実施の形態の内容を組み合わせることも可能である。例えば、第1の実施の形態と第4の実施の形態を組み合わせる場合を考えてみる。図11の「地理的名称」+「施設名」からなる言葉のうち、地理的名称を第1の実施の形態の対象キーワードとし、施設名を第4の実施の形態の対象キーワードとする。例えば、第1の実施の形態の対象キーワードに「だんごうざか→だんごーざか」を追加する。その結果、図11(c)の「談合坂SA」は、正規の読みは「だんごうざかさーびすえりあ」であるが、新たに「だんごーざかさーびすえりあ」「だんごーざかえすえー」「だんごーざかぱーきんぐ」「だんごーざか」の認識語が生成される。
【0064】
−第5の実施の形態−
第4の実施の形態では、例えば図12(a)に示すように、認識語の中に所定のキーワードがある場合、それを削除した認識語を追加する例を説明した。第5の実施の形態では、認識語にないキーワード(ジャンル名等)を追加するものである。例えば、ジャンルが「駅」の場合、駅の認識辞書にある認識語には通常最後に「えき」という読みがついているものである。しかし、その「えき」が認識語に含まれていない場合は、「えき」を追加した認識語を追加する。第5の実施の形態の車載用ナビゲーションシステムの構成は、第1の実施の形態の図1の構成と同様であるのでその説明を省略する。
【0065】
例えば、ジャンルが「駅」の認識辞書に、「とうきょう」という認識語があった場合、新たに「とうきょうえき」という認識語を追加する。具体的には、ROM210に、あるジャンルに対応して付加すべきキーワードデータを有し、認識語を検索しそのキーワードが含まれていない場合は、そのキーワードを含む認識語を追加する。このキーワードは複数であってもよい。キーワードが複数の場合は、含まれていないキーワードそれぞれを付加した認識語を追加するようにすればよい。このようにすることによって、ジャンルが「駅」の場合に「とうきょう」と発話しても「とうきょうえき」と発話しても音声認識に成功することになる。
【0066】
上記第1〜5の実施の形態では、車載用ナビゲーションシステムについて説明をしたがこの内容に限定する必要はない。車載用に限らず携帯用のナビゲーション装置にも適用できる。さらには、ナビゲーション装置に限らず音声認識を行うすべての装置に適用できる。
【0067】
上記第1〜5の実施の形態では、ナビゲーション装置100と音声ユニット200を分離した構成で説明をしたが、この内容に限定する必要はない。音声ユニットを内部に含んだ一つのナビゲーション装置として構成してもよい。また、上記制御プログラムや認識辞書などをCD−ROMなどの記録媒体で提供することも可能である。さらには、制御プログラムや認識辞書などをCD−ROMなどの記録媒体で提供し、パーソナルコンピュータやワークステーションなどのコンピュータ上で上記システムを実現することも可能である。また、制御プログラムや認識辞書などをインターネットに代表される電気通信回線(伝送媒体)を通じて提供することも可能である。
【0068】
上記第1〜5の実施の形態では、音声ユニット200で施設名の検索に成功した場合、その内容をナビゲーション装置100に知らせ、ナビゲーション装置100では道案内等のナビゲーション処理の一つとしてその施設近辺の地図を表示する例で説明をしたが、この内容に限定する必要はない。ナビゲーション装置100では、音声ユニット200で検索に成功した結果に基づき、経路探索や経路誘導その他の各種のナビゲーション処理が考えられる。
【0069】
【発明の効果】
本発明は、以上説明したように構成しているので、次のような効果を奏する。
請求項1〜10の発明は、音声認識を行うときに、例えば、該当ジャンルでよく使用されるキーワードを正規の読みとは異なる読みに置き換えた認識語を格納した認識辞書を使用することができるので、音声認識に確実に成功することができる。特に、従来から使用していた認識辞書や市販の認識辞書を使用して、キーワード部分の読みのみを置き換えた認識辞書を作成することが可能となるので、音声認識のヒット率の向上した新たな認識辞書が容易かつ短時間かつ低コストで作成ができ、音声認識率の向上した装置の低コスト化が実現できる。
特に、請求項2の発明は、置き換える読みを通常の発音の読みとしているので、音声認識率がより向上する。
請求項3〜5の発明は、読みの置き換えを一定の法則に基づいて自動で行うようにしているので、置き換える読みのデータを予め格納しておく必要がなく、メモリ容量の削減につながる。また、予め定めた所定の言葉(キーワード)の読みのみを置き換えているので、置き換えるべきでない読みは確実に置き換えないようにできる。すなわち、一定の法則に基づいて自動で置き換えるために生じる本来置き換えたくない読みを置き換えてしまうと言う問題が、確実に回避できる。
請求項6〜9の発明は、予め定めた所定の言葉(キーワード)の読みを、正規の読みに加えて、その言葉の漢字の異なる読みや、別称、略称に置き換えたものも共に認識語として格納しているので、ユーザがいろいろなバリエーションで発話しても確実に音声認識に成功する。
請求項10の発明は、音声認識処理を実際に行う時点で第1の認識語を生成しているので、例えば、正規の読みの認識語や所定の言葉(キーワード)のデータのみをROMに予め格納しておき、それらの内容に基づいて新たな認識語をRAM上に展開することができる。これにより、ROMの記憶容量を削減できる。これに反し、RAMの記憶容量は大きくなるが、作業エリアとして随時上書きされて使用されるので問題にはならない。
請求項11の発明は、所定の言葉(キーワード)を付加して発話した場合にも確実に音声認識に成功することができる。
請求項12の発明は、音声認識ナビゲーション装置において、上述の効果を奏することができる。
請求項13の発明は、従来から使用していた認識辞書や市販の認識辞書を使用して、キーワード部分の読みのみを置き換えた認識辞書を作成することができるので、音声認識のヒット率の向上した新たな認識辞書が容易かつ短時間かつ低コストで作成ができる。
【図面の簡単な説明】
【図1】本発明の車載用ナビゲーションシステムの構成を示す図である。
【図2】第1の実施の形態における正規の読みの認識辞書を示す図である。
【図3】第1の実施の形態における新たな認識辞書を示す図である。
【図4】第1の実施の形態におけるキーワードと置き換えの読みの一覧を示す図である。
【図5】第1の実施の形態における正規の読みの認識辞書から新たな認識辞書を生成する構成を示す図である。
【図6】第1の実施の形態における正規の読みの認識辞書から新たな認識辞書を生成する処理のフローチャートを示す図である。
【図7】第1の実施の形態における音声認識を行う制御のフローチャートを示す図である。
【図8】第2の実施の形態における音声認識を行う制御のフローチャートを示す図である。
【図9】第3の実施の形態における音声認識を行う制御のフローチャートを示す図である。
【図10】第3の実施の形態における正規の読みの認識辞書から新たな認識辞書を生成する処理のフローチャートを示す図である。
【図11】第4の実施の形態における正規の読みの認識辞書を示す図である。
【図12】第4の実施の形態における新たな認識辞書を示す図である。
【図13】第4の実施の形態におけるキーワードと置き換えの読みの一覧を示す図である。
【図14】第4の実施の形態における正規の読みの認識辞書から新たな認識辞書を生成する処理のフローチャートを示す図である。
【符号の説明】
100 ナビゲーション装置
101 GPS受信機
102 ジャイロセンサ
103 車速センサ
104 ドライバ
105 CPU
106 RAM
107 ROM
108 CD−ROMドライブ
109 表示装置
110 バスライン
200 音声ユニット
201 マイク
202 A/D変換部
203 D/A変換部
204 アンプ
205 スピーカ
206 発話スイッチ
207 ドライバ
208 CPU
209 RAM
210 ROM
211 通信ライン
212 バスライン
301 正規の読みの認識辞書
302 新たな認識辞書
303 パーソナルコンピュータ
304 キーワード
Claims (12)
- 音声入力手段と、
音声認識対象の言葉に対応しその言葉の読みを表す認識語を格納する格納手段と、
前記音声入力手段により得られた音データと前記認識語に基づき生成された音声認識用データとを比較して音声認識処理を行う音声認識処理手段とを備えた音声認識装置において、
前記格納手段には、音声認識対象の種類を示すジャンルごとに、音声認識対象の言葉の一部に含まれる予め定めた所定の言葉の読みについてその所定の言葉の正規の読みとは異なる読みの読みデータが格納され、
前記音声認識処理手段があるジャンルを指定して前記音声認識処理を行うときに、指定されたジャンルの前記読みデータを参照して、前記所定の言葉を一部に含む音声認識対象の言葉について、前記所定の言葉を前記正規の読みとは異なる読みにした新たな認識語を生成する生成手段をさらに備え、
前記音声認識処理手段は、前記生成された新たな認識語を使用して前記音声認識処理を行うことを特徴とする音声認識装置。 - 請求項1記載の音声認識装置において、
前記所定の言葉は、複数の音声認識対象の言葉の一部に共通に含まれる言葉であり、
前記所定の言葉の正規の読みと異なる読みは、その言葉の通常発音される読みであることを特徴とする音声認識装置。 - 音声入力手段と、
音声認識対象の言葉に対応しその言葉の読みを表す認識語を格納する格納手段と、
前記音声入力手段により得られた音データと前記認識語に基づき生成された音声認識用データとを比較して音声認識処理を行う音声認識処理手段とを備えた音声認識装置において、
前記格納手段には、音声認識対象の言葉の一部に含まれる予め定めた所定の言葉に関するデータが格納され、
前記所定の言葉に関するデータを参照して、前記所定の言葉を一部に含む音声認識対象の言葉について、前記所定の言葉の読みにおいてのみ、五十音のえ段の音節の後に「い」の音節が並ぶ場合、この「い」の音節を「え」の音節に置き換えた読みとした新たな認識語を生成する生成手段をさらに備えることを特徴とする音声認識装置。 - 音声入力手段と、
音声認識対象の言葉に対応しその言葉の読みを表す認識語を格納する格納手段と、
前記音声入力手段により得られた音データと前記認識語に基づき生成された音声認識用データとを比較して音声認識処理を行う音声認識処理手段とを備えた音声認識装置において、
前記格納手段には、音声認識対象の言葉の一部に含まれる予め定めた所定の言葉に関するデータが格納され、
前記所定の言葉に関するデータを参照して、前記所定の言葉を一部に含む音声認識対象の言葉について、前記所定の言葉の読みにおいてのみ五十音のお段の音節の後に「う」の音節が並ぶ場合、この「う」の音節を「お」の音節に置き換えた読みとした新たな認識語を生成する生成手段をさらに備えることを特徴とする音声認識装置。 - 請求項3または4記載の音声認識装置において、
前記生成手段は、前記五十音のえ段の音節の後に「い」の音節が並ぶ場合の「い」の音節または前記五十音のお段の音節の後に「う」の音節が並ぶ場合の「う」の音節を長音符号「ー」により置き換えることを特徴とする音声認識装置。 - 請求項1または2記載の音声認識装置において、
前記格納手段に、一つの音声認識対象の言葉に対して、前記所定の言葉の正規の読みを含む正規の認識語と前記新たな認識語とが共に格納されることを特徴とする音声認識装置。 - 請求項1記載の音声認識装置において、
前記新たな認識語は、前記所定の言葉を一部に含む音声認識対象の言葉から前記所定の言葉を削除して生成される認識語であることを特徴とする音声認識装置。 - 請求項1記載の音声認識装置において、
前記新たな認識語において、前記所定の言葉の正規の読みと異なる読みは、その言葉が漢字で表されるときその漢字の異なる読みであることを特徴とする音声認識装置。 - 請求項1記載の音声認識装置において、
前記新たな認識語において、前記所定の言葉の正規の読みと異なる読みは、その言葉が有する別称あるいは略称であることを特徴とする音声認識装置。 - 請求項1から9のいずれか1項記載の音声認識装置と、
地図情報を格納する地図情報格納手段と、
少なくとも前記音声認識装置の認識結果と前記地図情報とに基づき、道案内のための制御を行う制御手段とを備えることを特徴とする音声認識ナビゲーション装置。 - 音声認識処理における、音声入力手段により得られた音データと比較する音声認識用データを生成するための音声認識対象の言葉の読みを表した認識語を生成する認識語生成方法であって、
コンピュータは、一つの音声認識対象の言葉の一部に予め定めた所定の言葉を含む場合、前記所定の言葉の読みにおいてのみ、五十音のえ段の音節の後に「い」の音節が並ぶ場合、この「い」の音節を「え」の音節に置き換えた読みとした認識語を生成することを特徴とする認識語生成方法。 - 音声認識処理における、音声入力手段により得られた音データと比較する音声認識用データを生成するための音声認識対象の言葉の読みを表した認識語を生成する認識語生成方法であって、
コンピュータは、一つの音声認識対象の言葉の一部に予め定めた所定の言葉を含む場合、前記所定の言葉の読みにおいてのみ、五十音のお段の音節の後に「う」の音節が並ぶ場合、この「う」の音節を「お」の音節に置き換えた読みとした認識語を生成することを特徴とする認識語生成方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000053257A JP4550207B2 (ja) | 2000-02-29 | 2000-02-29 | 音声認識装置および音声認識ナビゲーション装置 |
EP00307745A EP1083545A3 (en) | 1999-09-09 | 2000-09-07 | Voice recognition of proper names in a navigation apparatus |
US09/659,679 US6708150B1 (en) | 1999-09-09 | 2000-09-11 | Speech recognition apparatus and speech recognition navigation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000053257A JP4550207B2 (ja) | 2000-02-29 | 2000-02-29 | 音声認識装置および音声認識ナビゲーション装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001242887A JP2001242887A (ja) | 2001-09-07 |
JP4550207B2 true JP4550207B2 (ja) | 2010-09-22 |
Family
ID=18574667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000053257A Expired - Fee Related JP4550207B2 (ja) | 1999-09-09 | 2000-02-29 | 音声認識装置および音声認識ナビゲーション装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4550207B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3639776B2 (ja) * | 2000-07-28 | 2005-04-20 | シャープ株式会社 | 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体 |
JP3892338B2 (ja) * | 2002-05-08 | 2007-03-14 | 松下電器産業株式会社 | 単語辞書登録装置および単語登録用プログラム |
JP7202938B2 (ja) * | 2019-03-20 | 2023-01-12 | Tvs Regza株式会社 | 番組名検索支援装置、及び、番組名検索支援方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0358099A (ja) * | 1989-07-27 | 1991-03-13 | Nec Corp | 発声変形検出装置 |
JPH10274996A (ja) * | 1997-03-31 | 1998-10-13 | Toshiba Corp | 音声認識装置 |
JPH11311991A (ja) * | 1998-04-30 | 1999-11-09 | Nec Corp | 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体 |
JP2000010583A (ja) * | 1998-06-19 | 2000-01-14 | Fujitsu Ltd | 音声認識方法及び装置 |
JP2000029490A (ja) * | 1998-07-15 | 2000-01-28 | Denso Corp | 音声認識装置用の単語辞書データ構築方法、音声認識装置及びナビゲーションシステム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61128364A (ja) * | 1984-11-28 | 1986-06-16 | Matsushita Electric Ind Co Ltd | 辞書検索装置 |
-
2000
- 2000-02-29 JP JP2000053257A patent/JP4550207B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0358099A (ja) * | 1989-07-27 | 1991-03-13 | Nec Corp | 発声変形検出装置 |
JPH10274996A (ja) * | 1997-03-31 | 1998-10-13 | Toshiba Corp | 音声認識装置 |
JPH11311991A (ja) * | 1998-04-30 | 1999-11-09 | Nec Corp | 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体 |
JP2000010583A (ja) * | 1998-06-19 | 2000-01-14 | Fujitsu Ltd | 音声認識方法及び装置 |
JP2000029490A (ja) * | 1998-07-15 | 2000-01-28 | Denso Corp | 音声認識装置用の単語辞書データ構築方法、音声認識装置及びナビゲーションシステム |
Also Published As
Publication number | Publication date |
---|---|
JP2001242887A (ja) | 2001-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3573907B2 (ja) | 音声合成装置 | |
US6708150B1 (en) | Speech recognition apparatus and speech recognition navigation apparatus | |
JP2644376B2 (ja) | 車両用音声ナビゲーション方法 | |
US20080177541A1 (en) | Voice recognition device, voice recognition method, and voice recognition program | |
EP1286330A2 (en) | Method for data entry by voice under adverse conditions | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP4104313B2 (ja) | 音声認識装置、プログラム及びナビゲーションシステム | |
JP4064748B2 (ja) | 音声発生装置、音声発生方法及びナビゲーション装置 | |
JP4642953B2 (ja) | 音声検索装置、および、音声認識ナビゲーション装置 | |
JP4550207B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP4520555B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP3645104B2 (ja) | 辞書検索装置及び辞書検索プログラムを記録した記録媒体 | |
JPH07319383A (ja) | 地図表示装置 | |
JP4822847B2 (ja) | 音声変換処理装置 | |
US20070219799A1 (en) | Text to speech synthesis system using syllables as concatenative units | |
JP3513988B2 (ja) | ナビゲーションシステム | |
JP2003271183A (ja) | 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体 | |
JP3296783B2 (ja) | 車載用ナビゲーション装置および音声認識方法 | |
US20110218809A1 (en) | Voice synthesis device, navigation device having the same, and method for synthesizing voice message | |
JP2005114964A (ja) | 音声認識方法および音声認識処理装置 | |
JP2005157166A (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP4652504B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP2001083982A (ja) | 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置 | |
JP2006330486A (ja) | 音声合成装置、この音声合成装置を備えるナビゲーション装置、音声合成プログラム及びこのプログラムを記憶した情報記憶媒体 | |
KR200328847Y1 (ko) | 개인 맞춤형 지리 정보 제공 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100125 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100615 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100708 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130716 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |