JP2001083983A - 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置 - Google Patents

音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置

Info

Publication number
JP2001083983A
JP2001083983A JP25598399A JP25598399A JP2001083983A JP 2001083983 A JP2001083983 A JP 2001083983A JP 25598399 A JP25598399 A JP 25598399A JP 25598399 A JP25598399 A JP 25598399A JP 2001083983 A JP2001083983 A JP 2001083983A
Authority
JP
Japan
Prior art keywords
recognition
word
voice
speech
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25598399A
Other languages
English (en)
Other versions
JP4520555B2 (ja
Inventor
Zenichi Hirayama
善一 平山
Yoshiyuki Kobayashi
禎之 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Xanavi Informatics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xanavi Informatics Corp filed Critical Xanavi Informatics Corp
Priority to JP25598399A priority Critical patent/JP4520555B2/ja
Priority to EP00307745A priority patent/EP1083545A3/en
Priority to US09/659,679 priority patent/US6708150B1/en
Publication of JP2001083983A publication Critical patent/JP2001083983A/ja
Application granted granted Critical
Publication of JP4520555B2 publication Critical patent/JP4520555B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 発話スイッチを押してすぐに発話する場合に
も、また、実際の発話が漢字の読みとは微妙に異なる場
合にも、確実に音声認識を成功させることが可能な音声
認識装置、そのためのデータを記録した記録媒体、およ
び、音声認識ナビゲーション装置を提供すること。 【解決手段】施設名を音声により指定してその施設名を
音声認識する音声認識ナビゲーション装置において、施
設名の全体の読みの第1の認識語と、その施設名の先頭
の音節をその母音の音節に置き換えた第2の認識語を認
識辞書210内に準備する。ユーザが発話スイッチ20
6を押してすぐに施設名を発話するとき、装置200が
その音声を聞き取る準備がまだできておらず、その施設
名の先頭の子音を取りこぼして聞き取ったような場合で
も、第2の認識語との相関を取り、音声認識を成功する
ことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識、および
音声認識ナビゲーション装置に関する。
【0002】
【従来の技術】自動車の現在地を表示し、地図の広域・
詳細表示を行い、目的地までの進行方向および残距離を
誘導する車載用ナビゲーション装置(以下、ナビゲーシ
ョン装置と言う)が知られている。また、ナビゲーショ
ン装置の一機能として、運転中のドライバからの操作指
示を音声で行い、ドライバの安全性を高めるいわゆる音
声認識ナビゲーション装置も知られている(例えば特開
平09−292255号公報)。
【0003】音声認識ナビゲーション装置で使用する音
声認識ソフトは、一般的に、発話スイッチ等を押し、そ
の後、ユーザが発話した音データと認識辞書内の認識語
との相関値を算出する。その結果、相関値が最大になっ
た認識語を認識結果と判断する。
【0004】
【発明が解決しようとする課題】しかし、発話スイッチ
を押してすぐに発話する場合誤認識の確率が高くなると
言う問題があった。また、実際の発話が漢字の読みとは
微妙に異なる言葉で誤認識の確率が高くなると言う問題
があった。
【0005】本発明の目的は、発話スイッチを押してす
ぐに発話する場合にも、また、実際の発話が漢字の読み
とは微妙に異なる場合にも、確実に音声認識を成功させ
ることが可能な音声認識装置、そのためのデータを記録
した記録媒体、および、音声認識ナビゲーション装置を
提供することにある。
【0006】
【課題を解決するための手段】実施の形態を示す図1を
使用して、括弧内にその対応する要素の符号をつけて本
発明を以下に説明する。上記目的を達成するために、請
求項1の発明は、音声入力手段と、音声認識対象の言葉
に対応しその言葉の読みを表す認識語を格納する格納手
段と、前記音声入力手段により得られた音データと前記
認識語に基づき生成された音声認識用データとを比較し
て音声認識処理を行う音声認識処理手段とを備えた音声
認識装置に適用され、前記格納手段には、一つの音声認
識対象の言葉に対して、読みの異なる複数の認識語が格
納されているようにしたものである。請求項2の発明
は、音声入力手段と、音声認識対象の言葉に対応しその
言葉の読みを表す認識語を格納する格納手段と、前記音
声入力手段により得られた音データと前記認識語に基づ
き生成された音声認識用データとを比較して音声認識処
理を行う音声認識処理手段とを備えた音声認識装置に適
用され、前記格納手段には、前記音声認識対象の言葉の
全体の読みに対応する第1の認識語と、前記音声認識対
象の言葉の全体の読みのうち先頭の音節をその母音に置
き換えた第2の認識語とが、双方とも前記音声認識対象
の言葉の認識語として格納されているようにしたもので
ある。請求項3の発明は、音声入力手段と、音声認識対
象の言葉に対応しその言葉の読みを表す認識語を格納す
る格納手段と、前記音声入力手段により得られた音デー
タと前記認識語に基づき生成された音声認識用データと
を比較して音声認識処理を行う音声認識処理手段とを備
えた音声認識装置に適用され、前記格納手段には、前記
音声認識対象の言葉の全体の読みに対応する第1の認識
語と、前記音声認識対象の言葉の全体の読みのうち先頭
から所定の長さの読みを削除した第2の認識語とが、前
記音声認識対象の言葉の認識語として格納されているよ
うにしたものである。請求項4の発明は、音声入力手段
と、音声認識対象の言葉に対応しその言葉の読みを表す
認識語を格納する格納手段と、前記音声入力手段により
得られた音データと前記認識語に基づき生成された音声
認識用データとを比較して音声認識処理を行う音声認識
処理手段とを備えた音声認識装置に適用され、前記格納
手段には、前記音声認識対象の言葉の全体の読みに対応
する第1の認識語と、前記全体の読みに五十音のえ段の
音節の後に「い」の音節が並ぶ場合、この「い」の音節
を「え」の音節に置き換えた第2の認識語とが、双方と
も前記音声認識対象の言葉の認識語として格納されてい
るようにしたものである。請求項5の発明は、音声入力
手段と、音声認識対象の言葉に対応しその言葉の読みを
表す認識語を格納する格納手段と、前記音声入力手段に
より得られた音データと前記認識語に基づき生成された
音声認識用データとを比較して音声認識処理を行う音声
認識処理手段とを備えた音声認識装置に適用され、前記
格納手段には、前記音声認識対象の言葉の全体の読みに
対応する第1の認識語と、前記全体の読みに五十音のお
段の音節の後に「う」の音節が並ぶ場合、この「う」の
音節を「お」の音節に置き換えた第2の認識語とが、双
方とも前記音声認識対象の言葉の認識語として格納され
ているようにしたものである。請求項6の発明は、請求
項4または5記載の音声認識装置において、前記認識語
を長音符号「ー」を含む仮名により指定されるように
し、前記第2の認識語において前記置き換える音節を長
音符号「ー」により置き換えるようにしたものである。
請求項7の発明は、請求項2から6のいずれか1項に記
載の音声認識装置において、前記第1の認識語に基づき
前記第2の認識語を生成する生成手段をさらに備えるよ
うにし、前記格納手段は第1の格納手段と第2の格納手
段を有するようにし、前記第1の認識語を予め前記第1
の格納手段に格納されているようにし、前記第2の認識
語を、前記音声認識処理手段が音声認識処理を行うとき
に、前記生成手段により生成して前記第2の格納手段に
格納されるようにしたものである。請求項8の音声認識
ナビゲーション装置は、請求項1から7のいずれか1項
記載の音声認識装置と、地図情報を格納する地図情報格
納手段と、少なくとも前記音声認識装置の認識結果と前
記地図情報とに基づき道案内のための制御を行う制御手
段とを備えるものである。請求項9のコンピュータ読み
とり可能な記録媒体は、音声認識処理において音声入力
手段により得られた音データと比較する音声認識用デー
タを生成するための音声認識対象の言葉に対応した認識
語に関するデータであって、音声認識対象の言葉の全体
の読みに対応する第1の認識語と、前記音声認識対象の
言葉の全体の読みのうち先頭の音節をその母音に置き換
えた第2の認識語とを、双方とも前記音声認識対象の言
葉の認識語とするデータを記録したものである。請求項
10のコンピュータ読みとり可能な記録媒体は、音声認
識処理において音声入力手段により得られた音データと
比較する音声認識用データを生成するための音声認識対
象の言葉に対応した認識語に関するデータであって、音
声認識対象の言葉の全体の読みに対応する第1の認識語
と、前記音声認識対象の言葉の全体の読みのうち先頭か
ら所定の長さの読みを削除した第2の認識語とを、双方
とも前記音声認識対象の言葉の認識語とするデータを記
録したものである。請求項11のコンピュータ読みとり
可能な記録媒体は、音声認識処理において音声入力手段
により得られた音データと比較する音声認識用データを
生成するための音声認識対象の言葉に対応した認識語に
関するデータであって、音声認識対象の言葉の全体の読
みに対応する第1の認識語と、前記全体の読みに五十音
のえ段の音節の後に「い」の音節が並ぶ場合、この
「い」の音節を「え」の音節に置き換えた第2の認識語
とを、双方とも前記音声認識対象の言葉の認識語とする
データを記録したものである。請求項12のコンピュー
タ読みとり可能な記録媒体は、音声認識処理において音
声入力手段により得られた音データと比較する音声認識
用データを生成するための音声認識対象の言葉に対応し
た認識語に関するデータであって、音声認識対象の言葉
の全体の読みに対応する第1の認識語と、前記全体の読
みに五十音のお段の音節の後に「う」の音節が並ぶ場
合、この「う」の音節を「お」の音節に置き換えた第2
の認識語とを、双方とも前記音声認識対象の言葉の認識
語とするデータを記録したものである。
【0007】なお、上記課題を解決するための手段の項
では、分かりやすく説明するため実施の形態の図と対応
づけたが、これにより本発明が実施の形態に限定される
ものではない。
【0008】
【発明の実施の形態】−第1の実施の形態− 図1は、本発明の車載用ナビゲーションシステムの第1
の実施の形態の構成を示す図である。車載用ナビゲーシ
ョンシステムは、ナビゲーション装置100および音声
ユニット200により構成される。第1の実施の形態の
ナビゲーションシステムは、施設名称が長い場合にも確
実に音声認識に成功させるようにしたものである。
【0009】ナビゲーション装置100は、GPS受信
機101と、ジャイロセンサ102と、車速センサ10
3と、ドライバ104と、CPU105と、RAM10
6と、ROM107と、CD−ROMドライブ108
と、表示装置109と、バスライン110等から構成さ
れる。
【0010】音声ユニット200は、マイク201と、
A/D変換部202と、D/A変換部203と、アンプ
204と、スピーカ205と、発話スイッチ206と、
ドライバ207と、CPU208と、RAM209と、
ROM210と、バスライン212等から構成される。
ナビゲーション装置100と音声ユニット200は、通
信ライン211を介して接続される。
【0011】GPS受信機101は、GPS(Global P
ositioning System)衛星からの信号を受信し、自車の
絶対位置、絶対方位を検出する。ジャイロセンサ102
は、例えば振動ジャイロで構成され、車のヨー角速度を
検出する。車速センサ103は、車が所定距離走行毎に
出すパルス数に基づき、車の移動距離を検出する。ジャ
イロセンサ102と車速センサ103により、車の2次
元的な移動が検出できる。ドライバ104は、GPS受
信機101、ジャイロセンサ102、車速センサ103
からの信号をバスライン110に接続するためのドライ
バである。すなわち、それぞれのセンサ出力をCPU1
05が読むことができるデータに変換する。
【0012】CPU105は、ROM107に格納され
たプログラムを実行することによりナビゲーション装置
100全体を制御する。RAM106は揮発性メモリで
あり、ワークデータ領域を確保する。ROM107は、
不揮発性メモリで、上述した制御プログラム等を格納す
る。CD−ROMドライブ108は、CD−ROMを記
録媒体とし、ベクトル道路データ等の道路地図情報を格
納する。CD−ROMドライブは、DVDを記録媒体と
するDVDドライブやその他の記録装置であってもよ
い。表示装置109は、車の現在地および周辺の道路地
図、目的地までのルート情報、次の誘導交差点情報等を
表示する。例えば、液晶表示装置あるいはCRTで構成
される。バスライン110は、ナビゲーション装置10
0のCPU105等の構成要素をバス接続するラインで
ある。
【0013】音声ユニット200は、音声認識、音声合
成等、音声に関する処理を行う。発話スイッチ206
は、ユーザが押すことにより音声認識の開始を指示する
スイッチである。発話スイッチ206が押された後所定
時間、音データの入力がマイク201を介して行われ
る。入力された音は、A/D変換部202およびドライ
バ207により、デジタル音声データに変換される。
【0014】音声ユニット200のROM210には、
音声認識ソフト(プログラム)、音声合成ソフト(プロ
グラム)、音声認識辞書(以下、単に認識辞書と言
う)、音声合成辞書(以下、単に合成辞書と言う)等が
格納されている。音声認識ソフトは、デジタル音声デー
タと、認識辞書内の全認識語との相関値を算出し、最も
相関値の高い認識語を認識結果として求める。音声合成
ソフトは、指定した文章をスピーカから発声させるため
のデータを算出する。両ソフトウェアについては、公知
な内容であるので詳細な説明は省略する。
【0015】認識辞書は、音声認識の対象となる言葉
(語)を複数集めたひとかたまりのデータである。具体
的には、ひらがなやカタカナやローマ字(実際にはその
文字コード)で指定されたそれぞれの言葉の読みデータ
が格納されている。認識辞書に格納された言葉を認識語
という。各認識語には、読みデータの他その言葉の文字
データや、施設名であれば座標情報などの情報が付帯し
ている。認識辞書の詳細については後述する。合成辞書
は、音声合成のために必要な音源データ等が格納されて
いる。
【0016】発話終了時、CPU208は、RAM20
9、ROM210等を使い音声認識ソフトを実行し、デ
ジタル音声データの音声認識を行う。音声認識ソフト
は、認識辞書内の認識語の読みデータ(ひらがなやカタ
カナやローマ字で指定されたデータ)を参照しながらそ
の言葉の音声認識用データを生成し、デジタル音声デー
タとの相関値を算出する。すべての認識語についてデジ
タル音声データとの相関値を算出し、相関値が最も高く
かつ所定の値以上の認識語を決定して音声認識を完了す
る。その認識語にリンクしたエコーバック語を音声合成
ソフトを使い、発声用のデータに変換する。その後、D
/A変換部203、アンプ204、スピーカ205を用
い、認識結果をエコーバック出力させる。
【0017】もし、算出したどの相関値も所定の値以下
である場合は、音声認識できなかったとしてナビの操作
を行わないようにする。具体的には、「プップー」等の
認識失敗を意味するビープ音を鳴らすことや、「認識で
きません」と応答(エコーバック)させる。バスライン
212は、音声ユニット200のバスラインである。
【0018】次に、認識辞書について詳細に説明する。
図2は、10件のゴルフ場名に関する認識語を格納した
ゴルフ場認識辞書を示す図である。認識語は、その施設
名(図2はゴルフ場名)に関する読みデータである。図
2では、分かりやすいように漢字を含む文字で記載して
いるが、ひらがなあるいはカタカナあるいはローマ字で
指定され対応する文字コードが格納される。各認識語に
は付帯情報がついている。付帯情報は、その施設の地図
上の座標情報、次に読み込む認識辞書の番号、施設の諸
属性情報、その施設名の表示用文字データ等の各種の情
報が格納されている。図2では、代表して座標情報のみ
を示している。
【0019】図2のゴルフ場認識辞書の例で、長いゴル
フ場名(言葉)の場合に認識に失敗する確率が高いこと
について分析をする。例えば、ユーザが図2の上から3
番目のゴルフ場名「御田原ゴルフ倶楽部松田コース」を
発話して、それを音声認識させる場合を考えてみる。す
べてのユーザがこの長い言葉を一気に発話するとは限ら
ない。中には、途中で一寸休んでから話すユーザもい
る。例えば、ユーザが「御田原ゴルフ倶楽部」でいった
ん言いよどみ、その後「松田コース」と発話したと仮定
する。もし言いよどんだ時間が短い時は、音声認識ソフ
トは「御田原ゴルフ倶楽部松田コース」という音データ
を一つの入力として扱う。そのため、正しく認識でき問
題はない。
【0020】ところが、音声認識ソフトは、一般に発話
開始から発話が無くなった時点で発話終了と判断する。
言いよどみの時間が長いときは、言いよどんだ時点で発
話が終了したと判断し、言いよどみ以降再開した発話デ
ータは捨てられる。すなわち「御田原ゴルフ倶楽部」と
いう音データだけを入力として使うことになる。その結
果、特に類似語が多数存在する場合は、誤認識を犯す確
率が非常に高くなる。
【0021】以上の分析の結果、第1の実施の形態で
は、図2のゴルフ場認識辞書について以下に説明するよ
うにする。上述の「御田原ゴルフ倶楽部松田コース」で
は、ほとんどの場合「御田原ゴルフ倶楽部」と「松田コ
ース」の間で一寸休むと思われる。そこで「御田原ゴル
フ倶楽部松田コース」に対して「御田原ゴルフ倶楽部」
という短い認識語を追加する。付帯情報は「御田原ゴル
フ倶楽部松田コース」と同じ座標情報3とする。このよ
うに、正規の認識語について準備する別な言い回しの認
識語を「言い替え語」と呼ぶ。
【0022】図3は、図2のゴルフ場認識辞書に言い替
え語を追加した場合の一例を示す図である。「厚本国際
カントリー倶楽部」については「厚本国際」という言い
替え語を、「御田急藤沢ゴルフクラブ」については「御
田急藤沢」という言い替え語を、「御田原湯本カントリ
ークラブ」については「御田原湯本」という言い替え語
を、「大厚本カントリー倶楽部本コース」については
「大厚本カントリー倶楽部」という言い替え語などを追
加し同一の認識辞書に格納する。
【0023】例えば「大厚本カントリー倶楽部本コー
ス」と発話したとき、言いよどみの結果「大厚本カント
リー倶楽部」としか音が入力できなかったとしても、
「大厚本カントリー倶楽部」という短い認識語を準備し
ているため、認識に成功させることができる。このよう
に、長い言葉に関して、正規の認識語から区切りのよい
所までの言い替え語を準備し、認識辞書に追加しておけ
ば、途中でユーザが言いよどんだ時でも、確実に認識に
成功させることができる。これは、認識辞書の容量が大
きくなり、認識実行時間が長くなるというデメリットが
生じるが、長い施設名称でも言いよどみによる誤認識を
確実に低減することができるという大きなメリットが生
じる。
【0024】なお、言い替え語は、所定の長さ以上の長
い言葉だけを選択して準備するようにしもよい。また、
言葉の長さにかかわらず経験的に言いよどみが起こりそ
うな言葉のみを選択して準備するようにしてもよい。さ
らに、正規の認識語に対して長さの異なる複数個の言い
替え語を準備するようにしてもよい。
【0025】短い言い替え語を作成する場合の区切りの
決め方は、前もって実験や経験により言いよどみが最も
起こりそうなところを考察し決めればよい。また、長い
言葉は一般に複数の短い言葉の集まりであるため、例え
ば、全体の読みのちょうど半分の位置に最も近い短い言
葉の区切りの位置をその区切りとすることもできる。あ
るいは、無条件に先頭から数個目の短い言葉の区切りで
決めることも考えられる。さらには、無条件に先頭から
数音節のところで区切るようにしてもよい。
【0026】図4は、音声ユニット200において、音
声認識を行う制御のフローチャートを示す図である。制
御プログラムはROM210に格納され、CPU208
がその制御プログラムを実行する。ナビゲーション装置
100および音声ユニット200の電源オンにより本ル
ーチンはスタートする。
【0027】ステップS1では、発話スイッチ206が
押されたかどうかを判断し、押されている場合はステッ
プS2へ進む。押されていない場合は、本ルーチンを終
了する。ユーザは発話スイッチ206を押した後、一定
時間内に例えば図2に示されたゴルフ場名を発話する。
ステップS2では、マイク201からの音声信号をデジ
タル音声データに変換する。ステップS3では、発話が
終了したかどうかを判断する。発話の終了は、一定時間
音声信号が途切れた場合を発話の終了と判断する。発話
が終了したと判断した場合はステップS4に進み、発話
がまだ終了していないと判断した場合はステップS2に
戻る。
【0028】ステップS4では、ステップS2で取得し
たデジタル音声データと図3の認識辞書内の全認識語に
ついて相関値を算出し、ステップS5に進む。認識辞書
は、図2の認識辞書に言い替え語が追加された図3の認
識辞書を使用する。ステップS5では、算出された相関
値のうち最も高い相関値が所定の値以上かどうかを判断
する。所定の値以上であれば、その語が認識できたとし
てステップS6に進む。ステップS6では、相関値の最
も高かった認識語を音声によりエコーバックする。
【0029】さらに、ステップS6では該当ゴルフ場名
(施設名称)が認識できたことをナビゲーション装置1
00に知らせた後、処理を終了する。ナビゲーション装
置100に知らせるときは、付帯情報の文字情報および
地図上の座標を知らせる。ナビゲーション装置100
は、通信ライン211を介して送信されてきた該当ゴル
フ場(施設)の地図上の座標データとCD−ROMドラ
イブ108の地図情報等に基づき、該当施設近辺の道路
地図を表示装置109に表示する。
【0030】一方、ステップS5において、最も高い相
関値が所定の値未満であれば発話された言葉が認識でき
なかったとしてステップS7に進む。ステップS7で
は、「認識できません」と音声によりエコーバックし、
処理を終了する。ナビゲーション装置100においても
何も処理をしない。
【0031】以上のようにして、音声認識を行うとき言
い替え語が追加された認識辞書を使用するようにしてい
る。これにより、長い施設名などを発話するとき、途中
で言いよどんでも、その長い施設名の音声認識に確実に
成功することができる。
【0032】−第2の実施の形態− 第2の実施の形態の車載用ナビゲーションシステムは、
発話スイッチを押した後すぐに発話した場合でも確実に
音声認識に成功させるようにしたものである。第2の実
施の形態の車載用ナビゲーションシステムの構成は、図
1の第1の実施の形態の車載用ナビゲーションシステム
と同一であるので、その説明を省略する。
【0033】第1の実施の形態とは認識辞書について異
なるため、以下、その認識辞書について説明する。図5
は、5件の駅名に関する認識語を格納した駅名認識辞書
を示す図である。各認識語には付帯情報がついている。
認識語は、その施設名(駅名)に関する読みデータであ
る。認識語はひらがなあるいはカタカナあるいはローマ
字で指定されその文字コードが格納される。図5では、
ひらがなの場合を示している。仮名1字で示される音を
1音節という。付帯情報は、ナビゲーション装置に表示
させる表示データに関する情報(図5の場合は駅名の表
示用文字データ)、施設の地図上の座標に関する情報、
ナビ操作コマンドに関する情報、エコーバックデータに
関する情報などがある。図5では、代表して表示用文字
データと座標情報を示している。
【0034】図5の駅名認識辞書の例で、発話スイッチ
206を押した後すぐに発話をする場合に認識に失敗す
る確率が高いことについて分析をする。
【0035】音声認識ソフトは、一般的に、発話スイッ
チ206を押し、その後、ユーザが発話した音データと
認識辞書内の全認識語との相関値を算出する。その結
果、相関値が最大になった認識語を認識結果と判断す
る。音声認識ソフトは、発話スイッチ206が押された
後マイク201を介した音声を受け付けるまで若干準備
時間を要する。従って、ユーザが発話スイッチ206を
押した後即座に発話したとき、最悪、発話した言葉の頭
が若干抜ける場合がある。例えば「そうぶだいまえ」と
いう駅名を発話スイッチ206を押した後即座に発話し
た場合、先頭語の「そ」の子音が抜け「おうぶだいま
え」と聞こえるように入力される場合がある。その結
果、特に類似語が多数存在するときは、誤認識の確率が
極めて高くなる。
【0036】以上の分析の結果、第2の実施の形態で
は、図5の駅名認識辞書について以下に説明するように
する。例えば、「そうぶだいまえ」という駅名の認識語
を考えたとき、先頭の「そ」を取りこぼした場合を想定
する。この場合、上述のように「おうぶだいまえ」と聞
こえる場合がある。そこで、先頭の「そ」の代わりにそ
の母音である「お」で言い替えた「おうぶだいまえ」と
いう認識語を認識辞書に追加する。付帯情報は、正規の
「そうぶだいまえ」と同じ付帯情報をつける。これによ
り、発話スイッチ206を押した後即座に「そうぶだい
まえ」と発話し、最悪先頭の子音が取りこぼされても確
実に音声認識に成功する。なお、正規の認識語について
準備する別な言い回しの認識語を「言い替え語」と呼
ぶ。
【0037】また、「おだきゅうさがみはら」という駅
名の認識語を考え、先頭の「お」を取りこぼした場合を
想定する。この場合「だきゅうさがみはら」と聞こえる
場合がある。そこで、先頭の「お」を削除した「だきゅ
うさがみはら」という認識語の言い替え語を認識辞書に
追加する。付帯情報は、正規の「おだきゅうさがみは
ら」と同じ付帯情報をつける。これにより、発話スイッ
チ206を押した後即座に「おだきゅうさがみはら」と
発話し、最悪先頭の「お」が取りこぼされても確実に音
声認識に成功する。
【0038】図6は、図5の駅名辞書に言い替え語を追
加した場合の一例を示す図である。言い替え語を作成す
る場合の規則として、例えば、先頭の語をその母音で言
い替えること、特にその先頭が子音である場合にその母
音に言い替えること、先頭から所定数の語を削除した言
葉で言い替えること、先頭の語1語のみを削除した言葉
で言い替えること、先頭の語が母音である場合にのみそ
の母音を削除した言葉で言い替えることなどが考えられ
る。また、発話スイッチ206を押した後即座に発話し
たときに、実験によりあるいは経験的に聞こえる言い替
え語を追加するようにしてもよい。正規の認識語に対し
て複数個の言い替え語を準備するようにしてもよい。な
お、ここで「先頭の語」という場合の「語」は、五十音
の1語(1音節)をいうものとする。
【0039】第2の実施の形態の音声認識を行う制御の
フローチャートは、使用する認識辞書を除き第1の実施
の形態の図4と同じであるので、その説明を省略する。
認識辞書は言い替え語が追加された図6の認識辞書を使
用する。
【0040】以上のようにして、正規の認識語の先頭の
語あるいは先頭からいくつかの語を削除したり母音に言
い替えたりした言い替え語を認識辞書に追加する。これ
により、ユーザが発話スイッチ206をオンした後すぐ
に発話しても、その言葉の音声認識に確実に成功するこ
とが可能となる。
【0041】−第3の実施の形態− 第3の実施の形態の車載用ナビゲーションシステムは、
例えば「通り」を「とうり」と発話しても「とおり」と
発話しても「とーり」と発話しても、確実に音声認識に
成功させるようにしたものである。第3の実施の形態の
車載用ナビゲーションシステムの構成は、図1の第1の
実施の形態の車載用ナビゲーションシステムと同一であ
るので、その説明を省略する。
【0042】第1の実施の形態とは認識辞書について異
なるため、以下、その認識辞書について説明する。図7
は、4件の駅名に関する認識語を格納した駅名認識辞書
を示す図である。各認識語には付帯情報がついている。
認識語は、その施設名(駅名)に関する読みデータであ
る。認識語はひらがなあるいはカタカナあるいはローマ
字で指定されその文字コードが格納される。図7では、
カタカナの場合を示している。仮名1字で示される音を
1音節という。付帯情報は、ナビゲーション装置に表示
させる表示データに関する情報(図7の場合は駅名の表
示用文字データ)、施設の地図上の座標に関する情報、
ナビ操作コマンドに関する情報、エコーバックデータに
関する情報などがある。図7では、代表して表示用文字
データと情報番号を示している。
【0043】図7の駅名認識辞書の例で、例えば「明大
前」を発話をする場合に認識に失敗する確率が高いこと
について分析をする。「明大前」の漢字の読みは「メイ
ダイマエ」であるので、「メイダイマエ」の認識語が準
備されている。しかし、「明大前」を「メエダイマエ」
あるいは「メーダイマエ」と発話する人も多い。そのよ
うな場合、「メイダイマエ」の認識語との相関値が低く
なり、特に類似語が多数存在するときは、誤認識の確率
が高くなる。
【0044】以上の分析の結果、第3の実施の形態で
は、図7の駅名認識辞書について以下に説明するように
する。例えば、上記の「明大前」という駅名の認識語を
考えたとき、「メイダイマエ」と「メエダイマエ」の2
つの認識語を準備する。「調布」という駅名の認識語に
ついては、「チョウフ」と「チョオフ」の2つの認識語
を準備する。なお、正規の読みの認識語について準備す
る別な言い回しの認識語を「言い替え語」と呼ぶ。言い
替え語の付帯情報は、それぞれ正規の認識語と同じもの
が指定される。
【0045】上記より、次のような法則が見いだされ
る。「エ」「ケ」「セ」「テ」「ネ」等の五十音のえ段
の語(音節)の後に「イ」が並ぶ読みの言葉の場合、そ
の「イ」を「エ」に置き換えたように発話する人が多
い。また、「オ」「コ」「ソ」「ト」「ノ」等のお段の
語(音節)の後に「ウ」が並ぶ読みの言葉の場合、その
「ウ」を「オ」に置き換えたように発話する人が多い。
【0046】従って、この法則に従った認識語を追加す
るようにする。図8の駅名辞書は、図7の駅名辞書に対
して上記の法則により認識語を追加したものである。こ
れにより、「明大前」を、文字通りの読み「メイダイマ
エ」とは異なり、会話で一般に発話される「メエダイマ
エ」と発話しても、確実に「明大前」の駅名が認識でき
る。
【0047】なお、「エ」あるいは「オ」に置き換える
代わりに、長音符号「ー」に置き換えるようにしてもよ
い。あるいは、「エ」または「オ」に置き換えた認識語
と、長音符号「ー」に置き換えた認識語の両方を追加す
るようにしてもよい。
【0048】上記は、読みの指定をひらがなやカタカナ
で行う音声認識システムの場合である。しかし、ローマ
字で指定する場合も、同様に考えればよい。例えば、
「明大前」は、ローマ字では正規の認識語として「meid
aimae」と指定する。「e」に続く「i」を「e」に置き換
えて「meedaimae」という認識語を追加する。「調布」
については、正規の認識語として「chouhu」を指定す
る。「o」に続く「u」を「o」に置き換えて「choohu」
とする。
【0049】次に、「東名高速道路」という言葉につい
て考える。この読みは「トウメイコウソクドウロ」であ
るため、上記の法則を適用すると、置き換えの対象とな
る部分は4箇所ある。この4箇所の組み合わせを考える
と、新たに15個の認識語を追加する必要が生じる。こ
のため、認識辞書の大きさが膨大になり膨大な容量のR
OM210が必要になる。この対策として、一つは、認
識辞書をROM210に格納する代わりに、CD−RO
MやDVD−ROMのような大容量の記録媒体を使用す
るようにすればよい。
【0050】他の一つの対策として次のような内容が考
えられる。ROM210には正規の読みの認識語のみを
格納した認識辞書を準備する。そして、音声認識ソフト
が音声認識処理にあたり認識辞書を使用するときに、所
定のプログラムを実行させることにより、正規の読みの
認識語に基づく上記法則による言い替え語をRAM20
9上に生成するようにすればよい。このRAM209は
作業メモリエリアであるので、他の認識辞書を使用する
ときは、前に作成した言い替え語がクリアされ、新たに
他の認識辞書に基づく言い替え語がRAM209上に生
成される。これにより、膨大な容量のROMの必要はな
くなる。また、ROM210には漢字の読みそのままの
データのみを作成すればよいので、認識語の作成が容易
である。漢字を仮名変換するようなプログラムを使用す
れば、自動化あるいは半自動化で容易に正規の読みのみ
の認識辞書を作成することができる。
【0051】第3の実施の形態の音声認識を行う制御の
フローチャートは、使用する認識辞書を除き第1の実施
の形態の図4と同じであるので、その説明を省略する。
認識辞書は言い替え語が追加された図8の認識辞書を使
用する。
【0052】以上のようにして、正規の読みの認識語に
おいて母音が「エイ」と続く場合は「エエ」あるいは
「エー」と置き換え、母音が「オウ」と続く場合は「オ
オ」あるいは「オー」と置き換える認識語を新たに追加
する。これにより、実際の発話に近い認識語が準備され
るため、音声認識に成功する確率が高くなる。
【0053】上記第3の実施の形態では、置き換え語の
組み合わせが多く言い替え語が多数必要な場合に、音声
認識処理を行うときに、所定のプログラムを実行するこ
とにより正規の読みの認識語に基づき言い替え語の認識
語を生成する例を示した(「東名高速道路」の場合)。
この内容は、言い替え語が多くない場合にも適用できる
(例えば上述の「明大前」の場合)。さらに、第1の実
施の形態(例えば上述の「御田原ゴルフ倶楽部松田コー
ス」の場合)および第2の実施の形態(例えば上述の
「そうぶだいまえ」の場合)において言い替え語を生成
する場合にも適用できる。
【0054】上記第1〜3の実施の形態では、車載用ナ
ビゲーションシステムについて説明をしたがこの内容に
限定する必要はない。車載用に限らず携帯用のナビゲー
ション装置にも適用できる。さらには、ナビゲーション
装置に限らず音声認識を行うすべての装置に適用でき
る。
【0055】上記第1〜3の実施の形態では、ナビゲー
ション装置100と音声ユニット200を分離した構成
で説明をしたが、この内容に限定する必要はない。音声
ユニットを内部に含んだ一つのナビゲーション装置とし
て構成してもよい。また、上記制御プログラムや認識辞
書などをCD−ROMなどの記録媒体で提供することも
可能である。さらには、制御プログラムや認識辞書など
をCD−ROMなどの記録媒体で提供し、パーソナルコ
ンピュータやワークステーションなどのコンピュータ上
で上記システムを実現することも可能である。
【0056】上記第1〜3の実施の形態では、音声ユニ
ット200で施設名の検索に成功した場合、その内容を
ナビゲーション装置100に知らせ、ナビゲーション装
置100では道案内等のナビゲーション処理の一つとし
てその施設近辺の地図を表示する例で説明をしたが、こ
の内容に限定する必要はない。ナビゲーション装置10
0では、音声ユニット200で検索に成功した結果に基
づき、経路探索や経路誘導その他の各種のナビゲーショ
ン処理が考えられる。
【0057】
【発明の効果】本発明は、以上説明したように構成して
いるので、次のような効果を奏する。請求項1の発明
は、一つの音声認識対象の言葉に対して、読みの異なる
複数の認識語を準備するので、その言葉を発話したと
き、いろいろな条件で正規の読みとは微妙に異なるよう
に聞こえても、確実に音声認識に成功させることができ
る。請求項2、9の発明は、音声認識対象の言葉の全体
の読みのうち先頭の音節をその母音に置き換えた認識語
も、その言葉の認識語として準備するので、発話スイッ
チを押してすぐに発話し先頭の音節の子音を取りこぼす
ように聞こえても、確実に音声認識に成功させることが
できる。請求項3、10の発明は、音声認識対象の言葉
の全体の読みのうち先頭から所定の長さの読みを削除し
た認識語も、その言葉の認識語として準備するので、発
話スイッチを押してすぐに発話し先頭の音節のいくつか
が取りこぼすように聞こえても、確実に音声認識に成功
させることができる。請求項4、11の発明は、音声認
識対象の言葉の全体の読みに、五十音のえ段の音節の後
に「い」の音節が並ぶ場合、この「い」の音節を「え」
の音節に置き換えた実際の発話に近い認識語を、その言
葉の認識語として準備するので、確実に音声認識に成功
させることができる。請求項5、12の発明は、音声認
識対象の言葉の全体の読みに、五十音のお段の音節の後
に「う」の音節が並ぶ場合、この「う」の音節を「お」
の音節に置き換えた実際の発話に近い認識語を、その言
葉の認識語として準備するので、確実に音声認識に成功
させることができる。請求項6の発明は、認識語を長音
符号「ー」を含む仮名により指定する場合に、置き換え
る音節を長音符号「ー」により指定することにより、上
記請求項4、11、15の発明あるいは請求項5、1
2、16の発明の効果と同様の効果を奏する。請求項7
の発明は、第2の認識語を、音声認識処理手段が音声認
識処理を行うときに、生成手段により生成しているの
で、メモリ容量の削減を図ることができる。例えば、第
2認識語をある法則に基づきかなりの数を準備する場合
でも、予めそれらの認識語を格納しておくメモリの必要
が無く、認識語のためのメモリの増加をきたさずより確
実に音声認識を成功させることができる。請求項8の発
明は、上記の効果を、特に音声認識ナビゲーション装置
において道案内等のナビゲーションを行うときに有効に
発揮させることができる。
【図面の簡単な説明】
【図1】本発明の車載用ナビゲーションシステムの構成
を示す図である。
【図2】第1の実施の形態における改善前の認識辞書を
示す図である。
【図3】第1の実施の形態における改善後の認識辞書を
示す図である。
【図4】第1の実施の形態において、音声認識を行う制
御のフローチャートを示す図である。
【図5】第2の実施の形態における改善前の認識辞書を
示す図である。
【図6】第2の実施の形態における改善後の認識辞書を
示す図である。
【図7】第3の実施の形態における改善前の認識辞書を
示す図である。
【図8】第3の実施の形態における改善後の認識辞書を
示す図である。
【符号の説明】
100 ナビゲーション装置 101 GPS受信機 102 ジャイロセンサ 103 車速センサ 104 ドライバ 105 CPU 106 RAM 107 ROM 108 CD−ROMドライブ 109 表示装置 110 バスライン 200 音声ユニット 201 マイク 202 A/D変換部 203 D/A変換部 204 アンプ 205 スピーカ 206 発話スイッチ 207 ドライバ 208 CPU 209 RAM 210 ROM 211 通信ライン 212 バスライン
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/28 G10L 3/00 551Q 561H Fターム(参考) 2F029 AA02 AB01 AB07 AB13 AC09 AC14 AC18 5D015 GG03 KK02 5H180 AA01 BB13 CC12 FF04 FF05 FF22 FF25 FF32 FF38

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】音声入力手段と、 音声認識対象の言葉に対応しその言葉の読みを表す認識
    語を格納する格納手段と、 前記音声入力手段により得られた音データと前記認識語
    に基づき生成された音声認識用データとを比較して音声
    認識処理を行う音声認識処理手段とを備えた音声認識装
    置において、 前記格納手段には、一つの音声認識対象の言葉に対し
    て、読みの異なる複数の認識語が格納されていることを
    特徴とする音声認識装置。
  2. 【請求項2】音声入力手段と、 音声認識対象の言葉に対応しその言葉の読みを表す認識
    語を格納する格納手段と、 前記音声入力手段により得られた音データと前記認識語
    に基づき生成された音声認識用データとを比較して音声
    認識処理を行う音声認識処理手段とを備えた音声認識装
    置において、 前記格納手段には、前記音声認識対象の言葉の全体の読
    みに対応する第1の認識語と、前記音声認識対象の言葉
    の全体の読みのうち先頭の音節をその母音に置き換えた
    第2の認識語とが、双方とも前記音声認識対象の言葉の
    認識語として格納されていることを特徴とする音声認識
    装置。
  3. 【請求項3】音声入力手段と、 音声認識対象の言葉に対応しその言葉の読みを表す認識
    語を格納する格納手段と、 前記音声入力手段により得られた音データと前記認識語
    に基づき生成された音声認識用データとを比較して音声
    認識処理を行う音声認識処理手段とを備えた音声認識装
    置において、 前記格納手段には、前記音声認識対象の言葉の全体の読
    みに対応する第1の認識語と、前記音声認識対象の言葉
    の全体の読みのうち先頭から所定の長さの読みを削除し
    た第2の認識語とが、前記音声認識対象の言葉の認識語
    として格納されていることを特徴とする音声認識装置。
  4. 【請求項4】音声入力手段と、 音声認識対象の言葉に対応しその言葉の読みを表す認識
    語を格納する格納手段と、 前記音声入力手段により得られた音データと前記認識語
    に基づき生成された音声認識用データとを比較して音声
    認識処理を行う音声認識処理手段とを備えた音声認識装
    置において、 前記格納手段には、前記音声認識対象の言葉の全体の読
    みに対応する第1の認識語と、前記全体の読みに五十音
    のえ段の音節の後に「い」の音節が並ぶ場合、この
    「い」の音節を「え」の音節に置き換えた第2の認識語
    とが、双方とも前記音声認識対象の言葉の認識語として
    格納されていることを特徴とする音声認識装置。
  5. 【請求項5】音声入力手段と、 音声認識対象の言葉に対応しその言葉の読みを表す認識
    語を格納する格納手段と、 前記音声入力手段により得られた音データと前記認識語
    に基づき生成された音声認識用データとを比較して音声
    認識処理を行う音声認識処理手段とを備えた音声認識装
    置において、 前記格納手段には、前記音声認識対象の言葉の全体の読
    みに対応する第1の認識語と、前記全体の読みに五十音
    のお段の音節の後に「う」の音節が並ぶ場合、この
    「う」の音節を「お」の音節に置き換えた第2の認識語
    とが、双方とも前記音声認識対象の言葉の認識語として
    格納されていることを特徴とする音声認識装置。
  6. 【請求項6】請求項4または5記載の音声認識装置にお
    いて、 前記認識語は長音符号「ー」を含む仮名により指定さ
    れ、 前記第2の認識語において、前記置き換える音節を長音
    符号「ー」により置き換えることを特徴とする音声認識
    装置。
  7. 【請求項7】請求項2から6のいずれか1項に記載の音
    声認識装置において、 前記第1の認識語に基づき前記第2の認識語を生成する
    生成手段をさらに備え、 前記格納手段は第1の格納手段と第2の格納手段を有
    し、 前記第1の認識語は予め前記第1の格納手段に格納され
    ており、 前記第2の認識語は、前記音声認識処理手段が音声認識
    処理を行うときに、前記生成手段により生成して前記第
    2の格納手段に格納されることを特徴とする音声認識装
    置。
  8. 【請求項8】請求項1から7のいずれか1項記載の音声
    認識装置と、 地図情報を格納する地図情報格納手段と、 少なくとも前記音声認識装置の認識結果と前記地図情報
    とに基づき、道案内のための制御を行う制御手段とを備
    えることを特徴とする音声認識ナビゲーション装置。
  9. 【請求項9】音声認識処理において、音声入力手段によ
    り得られた音データと比較する音声認識用データを生成
    するための音声認識対象の言葉に対応した認識語に関す
    るデータであって、 音声認識対象の言葉の全体の読みに対応する第1の認識
    語と、前記音声認識対象の言葉の全体の読みのうち先頭
    の音節をその母音に置き換えた第2の認識語とを、双方
    とも前記音声認識対象の言葉の認識語とするデータを記
    録したコンピュータ読みとり可能な記録媒体。
  10. 【請求項10】音声認識処理において、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉に対応した認識語に関
    するデータであって、 音声認識対象の言葉の全体の読みに対応する第1の認識
    語と、前記音声認識対象の言葉の全体の読みのうち先頭
    から所定の長さの読みを削除した第2の認識語とを、双
    方とも前記音声認識対象の言葉の認識語とするデータを
    記録したコンピュータ読みとり可能な記録媒体。
  11. 【請求項11】音声認識処理において、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉に対応した認識語に関
    するデータであって、 音声認識対象の言葉の全体の読みに対応する第1の認識
    語と、前記全体の読みに五十音のえ段の音節の後に
    「い」の音節が並ぶ場合、この「い」の音節を「え」の
    音節に置き換えた第2の認識語とを、双方とも前記音声
    認識対象の言葉の認識語とするデータを記録したコンピ
    ュータ読みとり可能な記録媒体。
  12. 【請求項12】音声認識処理において、音声入力手段に
    より得られた音データと比較する音声認識用データを生
    成するための音声認識対象の言葉に対応した認識語に関
    するデータであって、 音声認識対象の言葉の全体の読みに対応する第1の認識
    語と、前記全体の読みに五十音のお段の音節の後に
    「う」の音節が並ぶ場合、この「う」の音節を「お」の
    音節に置き換えた第2の認識語とを、双方とも前記音声
    認識対象の言葉の認識語とするデータを記録したコンピ
    ュータ読みとり可能な記録媒体。
JP25598399A 1999-09-09 1999-09-09 音声認識装置および音声認識ナビゲーション装置 Expired - Fee Related JP4520555B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP25598399A JP4520555B2 (ja) 1999-09-09 1999-09-09 音声認識装置および音声認識ナビゲーション装置
EP00307745A EP1083545A3 (en) 1999-09-09 2000-09-07 Voice recognition of proper names in a navigation apparatus
US09/659,679 US6708150B1 (en) 1999-09-09 2000-09-11 Speech recognition apparatus and speech recognition navigation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25598399A JP4520555B2 (ja) 1999-09-09 1999-09-09 音声認識装置および音声認識ナビゲーション装置

Publications (2)

Publication Number Publication Date
JP2001083983A true JP2001083983A (ja) 2001-03-30
JP4520555B2 JP4520555B2 (ja) 2010-08-04

Family

ID=17286287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25598399A Expired - Fee Related JP4520555B2 (ja) 1999-09-09 1999-09-09 音声認識装置および音声認識ナビゲーション装置

Country Status (1)

Country Link
JP (1) JP4520555B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006251147A (ja) * 2005-03-09 2006-09-21 Canon Inc 音声認識方法
JP2009169470A (ja) * 2008-01-10 2009-07-30 Nissan Motor Co Ltd 情報案内システムおよびその認識辞書データベース更新方法
US7809563B2 (en) 2005-10-14 2010-10-05 Hyundai Autonet Co., Ltd. Speech recognition based on initial sound extraction for navigation and name search
JP2013195685A (ja) * 2012-03-19 2013-09-30 Fuji Xerox Co Ltd 言語モデル作成プログラム、言語モデル作成装置及び音声認識装置
JP2015208513A (ja) * 2014-04-28 2015-11-24 ヘルスセンシング株式会社 振動信号抽出方法及び装置
JP2020118802A (ja) * 2019-01-22 2020-08-06 菱洋エレクトロ株式会社 音声認識システム、及び音声認識装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08248979A (ja) * 1995-03-06 1996-09-27 Fuji Xerox Co Ltd 音声認識装置
JPH0942988A (ja) * 1995-07-28 1997-02-14 Mazda Motor Corp 車載用地図表示装置
JPH1069291A (ja) * 1996-08-27 1998-03-10 Nissan Motor Co Ltd 音声認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08248979A (ja) * 1995-03-06 1996-09-27 Fuji Xerox Co Ltd 音声認識装置
JPH0942988A (ja) * 1995-07-28 1997-02-14 Mazda Motor Corp 車載用地図表示装置
JPH1069291A (ja) * 1996-08-27 1998-03-10 Nissan Motor Co Ltd 音声認識装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006251147A (ja) * 2005-03-09 2006-09-21 Canon Inc 音声認識方法
JP4667082B2 (ja) * 2005-03-09 2011-04-06 キヤノン株式会社 音声認識方法
US7809563B2 (en) 2005-10-14 2010-10-05 Hyundai Autonet Co., Ltd. Speech recognition based on initial sound extraction for navigation and name search
JP2009169470A (ja) * 2008-01-10 2009-07-30 Nissan Motor Co Ltd 情報案内システムおよびその認識辞書データベース更新方法
JP2013195685A (ja) * 2012-03-19 2013-09-30 Fuji Xerox Co Ltd 言語モデル作成プログラム、言語モデル作成装置及び音声認識装置
JP2015208513A (ja) * 2014-04-28 2015-11-24 ヘルスセンシング株式会社 振動信号抽出方法及び装置
JP2020118802A (ja) * 2019-01-22 2020-08-06 菱洋エレクトロ株式会社 音声認識システム、及び音声認識装置
JP7195947B2 (ja) 2019-01-22 2022-12-26 菱洋エレクトロ株式会社 音声認識システム、及び音声認識装置

Also Published As

Publication number Publication date
JP4520555B2 (ja) 2010-08-04

Similar Documents

Publication Publication Date Title
US6708150B1 (en) Speech recognition apparatus and speech recognition navigation apparatus
KR100556050B1 (ko) 적어도위치및/또는거리이름들을위한입력시스템
US6012028A (en) Text to speech conversion system and method that distinguishes geographical names based upon the present position
US20060100871A1 (en) Speech recognition method, apparatus and navigation system
EP1505571A1 (en) Car navigation system and speech recognizing device thereof
JP4642953B2 (ja) 音声検索装置、および、音声認識ナビゲーション装置
JP4914632B2 (ja) ナビゲーション装置
JP2008089625A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP4520555B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP2000338993A (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP4942406B2 (ja) ナビゲーション装置及びその音声出力方法
JP2001125591A (ja) 音声対話システム
JP2002350146A (ja) ナビゲーション装置
US20040015354A1 (en) Voice recognition system allowing different number-reading manners
JP2001083982A (ja) 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP4652504B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP4550207B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JP2000193479A (ja) ナビゲ―ション装置及び記憶媒体
JP2005157166A (ja) 音声認識装置、音声認識方法及びプログラム
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
JP2007025076A (ja) 車載用音声認識装置
JP2001306088A (ja) 音声認識装置及び処理システム
JP4036966B2 (ja) ナビゲーションシステム及び方法並びにナビゲーション用ソフトウェアを記録した記録媒体
JP2006039954A (ja) データベース検索装置、プログラム及びナビゲーション装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090904

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20100212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100521

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees