JP2004163458A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2004163458A
JP2004163458A JP2002325788A JP2002325788A JP2004163458A JP 2004163458 A JP2004163458 A JP 2004163458A JP 2002325788 A JP2002325788 A JP 2002325788A JP 2002325788 A JP2002325788 A JP 2002325788A JP 2004163458 A JP2004163458 A JP 2004163458A
Authority
JP
Japan
Prior art keywords
vehicle
voice recognition
noise
recognition
indoors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002325788A
Other languages
English (en)
Other versions
JP4257491B2 (ja
Inventor
Koji Hasegawa
浩二 長谷川
Hiroshi Yoshida
宏 吉田
Eiji Yamamoto
英二 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002325788A priority Critical patent/JP4257491B2/ja
Publication of JP2004163458A publication Critical patent/JP2004163458A/ja
Application granted granted Critical
Publication of JP4257491B2 publication Critical patent/JP4257491B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】情報処理装置やナビゲーション装置などの装置の音声認識機能として設けられる音声認識装置において、車内でも屋内でも、高い認識率で音声認識できるようにする。
【解決手段】CPU21は、加速度センサ11の出力、角速度センサ12の出力、および入力音声信号のノイズレベルから、当該の装置が車内にあるか屋内にあるかを判断する。当該の装置が車内にあるときには、CPU21はノイズキャンセラ33のノイズキャンセル特性を車内用のノイズキャンセル特性とし、音声認識処理部34は車内用認識データベース36および車内用認識対象語彙辞書37を使用して音声認識処理を実行する。当該の装置が屋内にあるときには、CPU21はノイズキャンセラ33のノイズキャンセル特性を屋内用のノイズキャンセル特性とし、音声認識処理部34は屋内用認識データベース38および屋内用認識対象語彙辞書39を使用して音声認識処理を実行する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
この発明は、情報処理装置やナビゲーション装置などの装置の操作入力部を構成する音声認識装置に関する。
【0002】
【従来の技術】
音声認識は、PC(Personal Computer)などの情報処理装置の操作入力用として、装置において発話者の発した音声を認識し、発話者の操作内容や入力文字を判断するものとして、広く用いられている。
【0003】
一方、GPS((Global Positioning System)を利用したカーナビゲーション装置でも、運転者が音声で操作や指示をすることができるようにしたものが市販されている。
【0004】
このような音声認識につき、特許文献1(特開2000−172291公報)には、車両用の音声認識装置において、車両速度に応じたノイズ環境に応じて、音声認識用の音響モデルを選択することによって、停車時などの比較的ノイズの少ない環境から、高速道路走行時のようなノイズの多い環境まで、高い認識率で音声認識できるようにすることが示されている。
【0005】
特許文献2(特開平9−134193号公報)には、カーナビゲーション用の音声認識装置において、出発前の車が静止している、エンジン音が存在する程度のノイズ環境か、車の走行中の、ロードノイズや風切り音などが存在するノイズ環境かによって、音声認識プログラムを切り替えることが示されている。
【0006】
特許文献3(特開2002−123278公報)には、車載用の音声認識装置において、車の速度状態などの動作状態に応じて、音声認識の可聴音基準を選択することが示されている。
【0007】
特許文献4(特開2000−29500公報)には、車載用の音声認識装置において、車両状態に応じて雑音スペクトルを予測して、入力音声信号中の雑音成分を除去し、音声認識の認識率を向上させることが示されている。
【0008】
特許文献5(特開平11−327590号公報)には、カーナビゲーション用の対話型の音声認識装置で、装置からの問い掛けに対して運転者が「はい」「いいえ」などと返答する場面や、運転者から装置に「ガソリンスタンド」「レストラン」などと問い掛ける場面などの会話場面に応じて、音声認識用辞書を切り替えることが示されている。
【0009】
【特許文献1】
特開2000−172291公報。
【特許文献2】
特開平9−134193号公報。
【特許文献3】
特開2002−123278公報。
【特許文献4】
特開2000−29500公報。
【特許文献5】
特開平11−327590号公報。
【0010】
【発明が解決しようとする課題】
PCなどの情報処理装置としては、ノート型PCやPDA(PersonalDigital Assistant)などの携帯型の装置が普及し、屋内で使用するだけでなく、車で移動中に車の後部座席などで使用することができるものが普及している。
【0011】
そこで、このような車内でも使用できる情報処理装置に音声認識機能を備えれば、ユーザは、車で移動中に車の後部座席などで、音声によって装置を操作し、文字を入力するなどの処理をすることが可能となる。
【0012】
一方、ナビゲーション装置としては、車内だけに限らず、車外の屋内でも使用することができる携帯型の装置が市販されている。
【0013】
そこで、このような屋内でも使用できるナビゲーション装置に音声認識機能を備えれば、ユーザは、例えば旅行の前に自宅で、音声によって装置を操作し、目的地までの経路や旅費を調べるなどの処理をすることが可能となる。
【0014】
しかしながら、音声認識については、車内と屋内とでは状況が全く異なる。具体的に、車内では、停車中はエンジン音などのノイズが、走行中はこれに加えて走行ノイズなどのノイズが、それぞれ定常的なノイズとして存在するのに対して、屋内では、定常的なノイズは存在せず、非定常的な微小レベルのノイズが存在しうるだけである。
【0015】
そのため、ノート型PCやPDAなどの携帯型の情報処理装置で、屋内で使用されることを想定して音声認識機能が付加された装置を、上述したように車内で使用する場合には、使用環境が想定された環境と全く異なるため、音声認識の認識率が著しく低下する。
【0016】
また、携帯型のナビゲーション装置で、車内で使用されることを想定して音声認識機能が付加された装置を、上述したように屋内で使用する場合には、使用環境が想定された環境と全く異なるため、音声認識の認識率が著しく低下する。
【0017】
上述したように、特許文献1または特許文献2には、車両用またはカーナビゲーション用の音声認識装置において、車両速度に応じたノイズ環境に応じて、音声認識用の音響モデルまたはプログラムを切り替えることが示されている。
【0018】
しかしながら、このような車内で使用されることを前提とした方法では、上述したように屋内と車内の両方で使用される情報処理装置やナビゲーション装置などの装置に対しては有効に対処することができず、装置が屋内で使用されるときにも、車内で使用されるときにも、高い認識率で音声認識することはできない。
【0019】
そこで、この発明は、情報処理装置やナビゲーション装置などの装置の音声認識機能として設けられる音声認識装置において、屋内でも車内でも、高い認識率で音声認識することができるようにしたものである。
【0020】
【課題を解決するための手段】
第1の発明の音声認識装置は、
音声信号が入力される音声入力部と、
当該の音声認識装置が屋内にあるか車内にあるかを判断する使用環境判定手段と、
屋内用の音声認識データベースと、
車内用の音声認識データベースと、
前記使用環境判定手段によって当該の音声認識装置が屋内にあると判断された場合には、前記屋内用の音声認識データベースを選択し、前記使用環境判定手段によって当該の音声認識装置が車内にあると判断された場合には、前記車内用の音声認識データベースを選択する選択手段と、
この選択手段によって選択された音声認識データベースを用いて、前記音声入力部に入力された音声信号を認識処理する音声認識処理部と、
を備えるものである。
【0021】
第2の発明の音声認識装置は、
音声信号が入力される音声入力部と、
当該の音声認識装置が屋内にあるか車内にあるかを判断する使用環境判定手段と、
屋内用の音声認識対象語彙辞書と、
車内用の音声認識対象語彙辞書と、
前記使用環境判定手段によって当該の音声認識装置が屋内にあると判断された場合には、前記屋内用の音声認識対象語彙辞書を選択し、前記使用環境判定手段によって当該の音声認識装置が車内にあると判断された場合には、前記車内用の音声認識対象語彙辞書を選択する選択手段と、
この選択手段によって選択された音声認識対象語彙辞書を用いて、前記音声入力部に入力された音声信号を認識処理する音声認識処理部と、
を備えるものである。
【0022】
第3の発明の音声認識装置は、
音声信号が入力される音声入力部と、
当該の音声認識装置が屋内にあるか車内にあるかを判断する使用環境判定手段と、
前記音声入力部に入力された音声信号中のノイズを低減するノイズ低減手段と、
そのノイズ低減後の音声信号を認識処理する音声認識処理部と、
前記使用環境判定手段によって当該の音声認識装置が屋内にあると判断された場合には、前記ノイズ低減手段のノイズ低減特性を屋内用のノイズ低減特性とし、前記使用環境判定手段によって当該の音声認識装置が車内にあると判断された場合には、前記ノイズ低減手段のノイズ低減特性を車内用のノイズ低減特性とするように、前記ノイズ低減手段のノイズ低減特性を切り替える手段と、
を備えるものである。
【0023】
上記のように構成した、この発明の音声認識装置では、当該の音声認識装置が屋内で使用される場合には、音声認識データベースとして屋内用の音声認識データベースが選択され、または音声認識対象語彙辞書として屋内用の音響認識対象語彙辞書が選択され、あるいはノイズ低減手段のノイズ低減特性が屋内用のノイズ低減特性に切り替えられて、音声認識処理が実行されるので、認識率が高くなるとともに、当該の音声認識装置が車内で使用される場合には、音声認識データベースとして車内用の音声認識データベースが選択され、または音声認識対象語彙辞書として車内用の音響認識対象語彙辞書が選択され、あるいはノイズ低減手段のノイズ低減特性が車内用のノイズ低減特性に切り替えられて、音声認識処理が実行されるので、認識率が高くなり、当該の音声認識装置が屋内で使用されるときにも、車内で使用されるときにも、認識率が高くなる。
【0024】
【発明の実施の形態】
〔システムの実施形態:図1および図2〕
図1は、この発明の音声認識装置の一例を示し、車内と屋内の両方で使用できるナビゲーション装置の音声認識機能として構成した場合である。
【0025】
この例のナビゲーション装置は、音声入力部として、認識対象の音声を採取するマイクロホン31、および、これからのアナログ音声信号をデジタル音声信号に変換するA/Dコンバータ32を備え、A/Dコンバータ32からのデジタル音声信号が、ノイズキャンセラ33で後述のようにノイズキャンセルされ、DSP(Digital Signal Processor)などによって構成された音声認識処理部34に供給されるとともに、ノイズキャンセルコントローラ35を通じてCPU21のバス22に取り込まれる。
【0026】
また、この例のナビゲーション装置は、加速度センサ11および角速度センサ12を備え、それぞれの出力信号が、A/Dコンバータ13および14でデジタル信号に変換されて、バス22に取り込まれる。
【0027】
加速度センサ11は、XYZ3軸方向の加速度を検出できるものであり、角速度センサ12は、XYZ3軸の回りの角速度を検出できるものである。
【0028】
当該のナビゲーション装置を車内で使用する場合、図2に示すように、車両1の前後方向をX軸方向、左右方向をY軸方向、上下方向をZ軸方向とすると、加速度センサ11は、前後方向、左右方向および上下方向の加速度を検出できるものであり、角速度センサ12は、ロール(X軸回り)、ピッチ(Y軸回り)およびヨー(Z軸回り)の角速度を検出できるものである。
【0029】
車内では、走行中であれば車の運動によって、停車中でも車のエンジンによる振動によって、いずれの方向の加速度および角速度にも変化を生じる。これに対して、屋内では、加速度および角速度の変化をほとんど生じない。
【0030】
したがって、後述のように、加速度センサ11および角速度センサ12の出力から加速度および角速度の変化があるか否かを判断することによって、当該のナビゲーション装置が車内で使用される場合か、屋内で使用される場合かを判定することができる。
【0031】
音声認識処理部34では、入力音声信号が、帯域分割され、フィルタリングされた上で、ベクトルデータに変換されるとともに、このベクトルデータが、後述のように選択された音声認識データベース内の音響モデルデータと比較され、その比較結果によって、後述のように選択された音声認識対象語彙辞書から最適な語彙が検索される。
【0032】
音声認識処理部34は、バス22に接続されるとともに、音声認識処理部34には、車内用認識データベース36、車内用認識対象語彙辞書37、屋内用認識データベース38および屋内用認識対象語彙辞書39が接続される。
【0033】
車内用認識データベース36は、車内ではエンジン音や走行ノイズによる定常的なノイズが存在することを前提に、その定常的なノイズの周波数およびレベルを考慮して生成された、車内での音声認識用の、入力音声信号から生成された上記のベクトルデータと比較されるべき音響モデルデータを備えるものである。
【0034】
車内用認識対象語彙辞書37は、上記のように車内では定常的なノイズが存在することを前提に、車内用に必要なコマンドや情報を限定した少数の認識対象語彙を収録した辞書である。
【0035】
屋内用認識データベース38は、屋内では定常的なノイズが存在せず、ノイズが存在するとしても、周波数の特定されない微小レベルのノイズであることを考慮して生成された、屋内での音声認識用の、入力音声信号から生成された上記のベクトルデータと比較されるべき音響モデルデータを備えるものである。
【0036】
屋内用認識対象語彙辞書39は、上記のように屋内では定常的なノイズが存在しないことを前提に、屋内用にコマンドや情報を特に制限しない多数の認識対象語彙を収録した辞書である。
【0037】
当該のナビゲーション装置を車内で使用する場合、屋内用認識データベース38を使用すると、定常的なノイズの影響によって認識率が低下し、認識対象語彙数の多い屋内用認識対象語彙辞書39を使用すると、定常的なノイズの影響によって認識率が著しく低下する。
【0038】
これに対して、当該のナビゲーション装置を車内で使用する場合、車内用認識データベース36を使用すれば、認識率が高くなり、認識対象語彙数の少ない車内用認識対象語彙辞書37を使用すれば、認識率がさらに高くなる。
【0039】
また、当該のナビゲーション装置を屋内で使用する場合、定常的なノイズが存在することを前提にした車内用認識データベース36を使用すると、屋内では定常的なノイズが存在しないため、認識率が著しく低下する。
【0040】
これに対して、当該のナビゲーション装置を屋内で使用する場合、屋内用認識データベース38を使用すれば、認識率が高くなる。
【0041】
ノイズキャンセラ33は、ノイズキャンセルコントローラ35によって設定されたノイズキャンセル特性に従って、A/Dコンバータ32からの入力音声信号のノイズをキャンセルする。この場合、ノイズキャンセル特性としては、車内用および屋内用のノイズキャンセル特性が用意される。
【0042】
車内用のノイズキャンセル特性は、車内での定常的なノイズを十分に低減するような特性であり、屋内用のノイズキャンセル特性は、屋内での周波数が不特定の微小レベルのノイズを低減するような特性である。
【0043】
当該のナビゲーション装置を車内で使用する場合、屋内用ノイズキャンセル特性を使用すると、車内での定常的なノイズが十分に低減されないため、認識率が著しく低下する。また、当該のナビゲーション装置を屋内で使用する場合、車内用ノイズキャンセル特性を使用すると、ノイズではない一部の音声信号成分が失われてしまうため、認識率が著しく低下する。
【0044】
これに対して、当該のナビゲーション装置を車内で使用する場合、車内用ノイズキャンセル特性を使用すれば、車内での定常的なノイズが十分に低減されるため、認識率が著しく高くなる。また、当該のナビゲーション装置を屋内で使用する場合、屋内用ノイズキャンセル特性を使用すれば、ノイズではない音声信号成分が失われないため、認識率が著しく高くなる。
【0045】
バス22には、CPU21が実行すべき後述の処理ルーチンなどのプログラムや各種の固定データなどが書き込まれたROM23、およびCPU21のワークエリアなどとして機能するRAM24が接続される。
【0046】
さらに、この例のナビゲーション装置は、GPSアンテナ41、GPS受信部42および測位演算部43からなるGPS受信機を備え、測位演算部43からの測位出力、すなわち当該のナビゲーション装置の位置を示す情報が、DSPなどによって構成されたナビゲーション処理部44に供給される。
【0047】
ナビゲーション処理部44は、バス22に接続されるとともに、ナビゲーション処理部44には、地図情報データベース45、関連情報データベース46および描画メモリ47が接続される。
【0048】
地図情報データベース45は、必要な地域の地図情報を備えるものであり、関連情報データベース46は、その地域内に存在するガソリンスタンドやレストランなどの施設や店舗の場所や名称などの関連情報を備えるものである。
【0049】
ナビゲーション処理部44は、その時々で、地図情報データベース45および関連情報データベース46から必要な地図情報および関連情報を読み出して、描画メモリ47上に、必要な地図、必要な施設や店舗の場所や名称、および現在地や目的地などを描画する。
【0050】
描画メモリ47上に描画された情報は、表示制御部48によって表示用信号に変換されて、液晶表示部などのディスプレイ49に供給され、ディスプレイ49上に表示される。
【0051】
〔使用環境の判定および音声認識の切り替え:図3〜図7〕
上記の例のナビゲーション装置では、音声認識処理の開始時、CPU21は、A/Dコンバータ13および14によってデジタルデータに変換されてバス22に取り込まれた加速度センサ11および角速度センサ12の出力信号、およびA/Dコンバータ32によってデジタルデータに変換されてノイズキャンセラ33およびノイズキャンセルコントローラ35を通じてバス22に取り込まれたマイクロホン31からの入力音声信号から、当該のナビゲーション装置が車内にあるか屋内にあるかを判断する。
【0052】
このとき、ノイズキャンセラ33は、CPU21およびノイズキャンセルコントローラ35の制御によって、入力音声信号をノイズキャンセルしないで、そのままバス22に出力するモードとされる。
【0053】
そして、CPU21は、以下のような処理ルーチンによって、当該のナビゲーション装置の使用環境を判定し、その判定結果に応じて音声認識の切り替えを行う。
【0054】
図3は、その処理ルーチンの一例を示す。この例の処理ルーチン50では、まずステップ51で、角速度センサ12の出力信号から、角速度の変化があるか否かを判断し、角速度の変化があると判断したときには、ステップ52で、加速度センサ11の出力信号から、加速度の変化があるか否かを判断し、加速度の変化があると判断したときには、ステップ53で、入力音声信号のノイズレベルが所定レベル以上であるか否かを判断する。
【0055】
そして、ステップ53でノイズレベルが所定レベル以上であると判断したときには、ステップ61に進んで、当該のナビゲーション装置が車内にあると判断した上で、まずステップ62で、ノイズキャンセラ33のノイズキャンセル特性として上記の車内用ノイズキャンセル特性を選択し、次にステップ63で、音声認識データベースとして車内用認識データベース36を選択し、さらにステップ64で、音声認識対象語彙辞書として車内用認識対象語彙辞書37を選択する。
【0056】
これによって、当該のナビゲーション装置が車内にある場合には、車内での定常的なノイズが十分に低減された入力音声信号が音声認識処理部34に供給されるとともに、音声認識処理部34では、車内用認識データベース36および車内用認識対象語彙辞書37によって音声認識処理が実行され、認識率が著しく高くなる。
【0057】
したがって、車の運転者は、運転中でも音声認識によって的確な操作を容易に行うことができるとともに、操作に気をとられることなく安全な運転を行うことができる。
【0058】
一方、ステップ51で角速度の変化がないと判断し、またはステップ52で加速度の変化がないと判断し、あるいはステップ53でノイズレベルが所定レベルに満たないと判断したときには、ステップ65に進んで、当該のナビゲーション装置が屋内にあると判断した上で、まずステップ66で、ノイズキャンセラ33のノイズキャンセル特性として上記の屋内用ノイズキャンセル特性を選択し、次にステップ67で、音声認識データベースとして屋内用認識データベース38を選択し、さらにステップ68で、音声認識対象語彙辞書として屋内用認識対象語彙辞書39を選択する。
【0059】
これによって、当該のナビゲーション装置が屋内にある場合には、ノイズではない音声信号成分が失われない入力音声信号が音声認識処理部34に供給されるとともに、音声認識処理部34では、屋内用認識データベース38および屋内用認識対象語彙辞書39によって音声認識処理が実行され、認識率が著しく高くなる。
【0060】
したがって、屋内では、操作者は、多種多量のコマンドおよび情報による音声認識によって、様々な操作を効率的に行うことができる。
【0061】
図4は、使用環境の判定および音声認識の切り替えの処理ルーチンの他の例を示す。
【0062】
この例の処理ルーチン70では、まずステップ71で、角速度センサ12の出力信号から、角速度の変化がないか否かを判断し、角速度の変化がないと判断したときには、ステップ72で、加速度センサ11の出力信号から、加速度の変化がないか否かを判断し、加速度の変化がないと判断したときには、ステップ73で、入力音声信号のノイズレベルが所定レベルに満たないか否かを判断する。
【0063】
そして、ステップ73でノイズレベルが所定レベルに満たないと判断したときには、ステップ81に進んで、当該のナビゲーション装置が屋内にあると判断した上で、まずステップ82で、ノイズキャンセラ33のノイズキャンセル特性として上記の屋内用ノイズキャンセル特性を選択し、次にステップ83で、音声認識データベースとして屋内用認識データベース38を選択し、さらにステップ84で、音声認識対象語彙辞書として屋内用認識対象語彙辞書39を選択する。
【0064】
これによって、当該のナビゲーション装置が屋内にある場合には、ノイズではない音声信号成分が失われない入力音声信号が音声認識処理部34に供給されるとともに、音声認識処理部34では、屋内用認識データベース38および屋内用認識対象語彙辞書39によって音声認識処理が実行され、認識率が著しく高くなる。
【0065】
一方、ステップ71で角速度の変化があると判断し、またはステップ72で加速度の変化があると判断し、あるいはステップ73でノイズレベルが所定レベル以上であると判断したときには、ステップ85に進んで、当該のナビゲーション装置が車内にあると判断した上で、まずステップ86で、ノイズキャンセラ33のノイズキャンセル特性として上記の車内用ノイズキャンセル特性を選択し、次にステップ87で、音声認識データベースとして車内用認識データベース36を選択し、さらにステップ88で、音声認識対象語彙辞書として車内用認識対象語彙辞書37を選択する。
【0066】
これによって、当該のナビゲーション装置が車内にある場合には、車内での定常的なノイズが十分に低減された入力音声信号が音声認識処理部34に供給されるとともに、音声認識処理部34では、車内用認識データベース36および車内用認識対象語彙辞書37によって音声認識処理が実行され、認識率が著しく高くなる。
【0067】
図5の上段に示すように、音声認識データベースとして、車内でも屋内でも、上述した車内用認識データベース36を使用すると、車内では認識率が高くなるが、屋内では認識率が低くなる。ただし、認識率が90%というのは認識率が高いことを、認識率が50%というのは認識率が低いことを、それぞれモデル的に示したものである。
【0068】
これに対して、図5下段に発明の実施形態として示すように、車内では車内用認識データベース36を使用し、屋内では屋内用認識データベース38を使用する場合には、車内でも屋内でも、認識率が高くなる。
【0069】
また、図6の上段に示すように、音声認識対象語彙辞書として、車内でも屋内でも、語彙数の多い屋内用認識対象語彙辞書39を使用すると、屋内では認識率が高くなるが、車内では認識率が低くなる。
【0070】
これに対して、図6下段に発明の実施形態として示すように、車内では車内用認識対象語彙辞書37を使用し、屋内では屋内用認識対象語彙辞書39を使用する場合には、車内でも屋内でも、認識率が高くなる。
【0071】
さらに、図7の上段に示すように、ノイズキャンセラ33のノイズキャンセル特性を、車内でも屋内でも、上述した車内用ノイズキャンセル特性とすると、車内では認識率が高くなるが、屋内では認識率が低くなる。
【0072】
これに対して、図7下段に発明の実施形態として示すように、ノイズキャンセラ33のノイズキャンセル特性を、車内では車内用ノイズキャンセル特性とし、屋内では屋内用ノイズキャンセル特性とする場合には、車内でも屋内でも、認識率が高くなる。
【0073】
〔他の実施形態〕
上述した実施形態は、車内と屋内で、音声認識データベース、音声認識対象語彙辞書、およびノイズキャンセル特性の三者を切り替える場合であるが、音声認識対象語彙辞書としては、例えば、車内用認識対象語彙辞書37と屋内用認識対象語彙辞書39の中間的な認識対象語彙辞書を用意し、ノイズキャンセル特性は、例えば、上述した車内用ノイズキャンセル特性と屋内用ノイズキャンセル特性の中間的なノイズキャンセル特性として、音声認識データベースのみを、車内用認識データベース36と屋内用認識データベース38のいずれかに切り替えるように構成してもよい。
【0074】
また、音声認識データベースとしては、例えば、車内用認識データベース36と屋内用認識データベース38の中間的な認識データベースを用意し、ノイズキャンセル特性は、例えば、上述した車内用ノイズキャンセル特性と屋内用ノイズキャンセル特性の中間的なノイズキャンセル特性として、音声認識対象語彙辞書のみを、車内用認識対象語彙辞書37と屋内用認識対象語彙辞書39のいずれかに切り替えるように構成してもよい。
【0075】
また、音声認識データベースとしては、例えば、車内用認識データベース36と屋内用認識データベース38の中間的な認識データベースを用意し、音声認識対象語彙辞書としては、例えば、車内用認識対象語彙辞書37と屋内用認識対象語彙辞書39の中間的な認識対象語彙辞書を用意して、ノイズキャンセル特性のみを、上述した車内用ノイズキャンセル特性と屋内用ノイズキャンセル特性のいずれかに切り替えるように構成してもよい。
【0076】
さらに、ノイズキャンセル特性は、例えば、上述した車内用ノイズキャンセル特性と屋内用ノイズキャンセル特性の中間的なノイズキャンセル特性として、音声認識データベースを、車内用認識データベース36と屋内用認識データベース38のいずれかに切り替え、音声認識対象語彙辞書を、車内用認識対象語彙辞書37と屋内用認識対象語彙辞書39のいずれかに切り替えるなど、音声認識データベース、音声認識対象語彙辞書、およびノイズキャンセル特性のうちの2つを切り替えるように構成してもよい。
【0077】
また、上述した実施形態は、加速度センサ11の出力、角速度センサ12の出力、および入力音声信号のノイズレベルの三者から、当該のナビゲーション装置が車内にあるか屋内にあるかを判断する場合であるが、加速度センサ11の出力、角速度センサ12の出力、および入力音声信号のノイズレベルのうちの1つまたは2つから、当該のナビゲーション装置が車内にあるか屋内にあるかを判断するように構成してもよい。
【0078】
さらに、上述した実施形態は、この発明の音声認識装置を、車内と屋内の両方で使用できるナビゲーション装置の音声認識機能として構成した場合であるが、この発明の音声認識装置は、車内と屋内の両方で使用できるノート型PCやPDAなどの情報処理装置などの音声認識機能として構成することもできる。
【0079】
【発明の効果】
上述したように、この発明によれば、音声認識装置が屋内で使用されるときにも、車内で使用されるときにも、高い認識率で音声認識することができる。
【図面の簡単な説明】
【図1】この発明の音声認識装置の一例を備えるナビゲーション装置を示す図である。
【図2】車両の座標系を示す図である。
【図3】CPUが実行する処理ルーチンの第1の例を示す図である。
【図4】CPUが実行する処理ルーチンの第2の例を示す図である。
【図5】この発明によれば車内でも屋内でも認識率が高くなることを示す図である。
【図6】この発明によれば車内でも屋内でも認識率が高くなることを示す図である。
【図7】この発明によれば車内でも屋内でも認識率が高くなることを示す図である。
【符号の説明】
主要部については図中に全て記述したので、ここでは省略する。

Claims (5)

  1. 音声信号が入力される音声入力部と、
    当該の音声認識装置が屋内にあるか車内にあるかを判断する使用環境判定手段と、
    屋内用の音声認識データベースと、
    車内用の音声認識データベースと、
    前記使用環境判定手段によって当該の音声認識装置が屋内にあると判断された場合には、前記屋内用の音声認識データベースを選択し、前記使用環境判定手段によって当該の音声認識装置が車内にあると判断された場合には、前記車内用の音声認識データベースを選択する選択手段と、
    この選択手段によって選択された音声認識データベースを用いて、前記音声入力部に入力された音声信号を認識処理する音声認識処理部と、
    を備える音声認識装置。
  2. 音声信号が入力される音声入力部と、
    当該の音声認識装置が屋内にあるか車内にあるかを判断する使用環境判定手段と、
    屋内用の音声認識対象語彙辞書と、
    車内用の音声認識対象語彙辞書と、
    前記使用環境判定手段によって当該の音声認識装置が屋内にあると判断された場合には、前記屋内用の音声認識対象語彙辞書を選択し、前記使用環境判定手段によって当該の音声認識装置が車内にあると判断された場合には、前記車内用の音声認識対象語彙辞書を選択する選択手段と、
    この選択手段によって選択された音声認識対象語彙辞書を用いて、前記音声入力部に入力された音声信号を認識処理する音声認識処理部と、
    を備える音声認識装置。
  3. 音声信号が入力される音声入力部と、
    当該の音声認識装置が屋内にあるか車内にあるかを判断する使用環境判定手段と、
    前記音声入力部に入力された音声信号中のノイズを低減するノイズ低減手段と、
    そのノイズ低減後の音声信号を認識処理する音声認識処理部と、
    前記使用環境判定手段によって当該の音声認識装置が屋内にあると判断された場合には、前記ノイズ低減手段のノイズ低減特性を屋内用のノイズ低減特性とし、前記使用環境判定手段によって当該の音声認識装置が車内にあると判断された場合には、前記ノイズ低減手段のノイズ低減特性を車内用のノイズ低減特性とするように、前記ノイズ低減手段のノイズ低減特性を切り替える手段と、
    を備える音声認識装置。
  4. 請求項1〜3のいずれかの音声認識装置において、
    前記使用環境判定手段は、前記音声入力部に入力された音声信号のノイズ特性から、当該の音声認識装置が屋内にあるか車内にあるかを判断する音声認識装置。
  5. 請求項1〜3のいずかの音声認識装置において、
    前記使用環境判定手段は、当該の音声認識装置が備える加速度センサまたは角速度センサの出力から、当該の音声認識装置が屋内にあるか車内にあるかを判断する音声認識装置。
JP2002325788A 2002-11-08 2002-11-08 音声認識装置 Expired - Fee Related JP4257491B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002325788A JP4257491B2 (ja) 2002-11-08 2002-11-08 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002325788A JP4257491B2 (ja) 2002-11-08 2002-11-08 音声認識装置

Publications (2)

Publication Number Publication Date
JP2004163458A true JP2004163458A (ja) 2004-06-10
JP4257491B2 JP4257491B2 (ja) 2009-04-22

Family

ID=32804907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002325788A Expired - Fee Related JP4257491B2 (ja) 2002-11-08 2002-11-08 音声認識装置

Country Status (1)

Country Link
JP (1) JP4257491B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008309865A (ja) * 2007-06-12 2008-12-25 Fujitsu Ten Ltd 音声認識装置および音声認識方法
JP2012093508A (ja) * 2010-10-26 2012-05-17 Nec Corp 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862700A (ja) * 1981-10-12 1983-04-14 株式会社デンソー 音声認識装置
JPS59137999A (ja) * 1983-01-27 1984-08-08 松下電器産業株式会社 音声認識装置
JPS6242198A (ja) * 1985-08-20 1987-02-24 松下電器産業株式会社 音声認識装置
JPH02232697A (ja) * 1989-03-06 1990-09-14 Nippondenso Co Ltd 音声認識装置
JPH0667690A (ja) * 1992-08-20 1994-03-11 Ricoh Co Ltd 車載用音声認識装置
JPH0713591A (ja) * 1993-06-22 1995-01-17 Hitachi Ltd 音声認識装置および音声認識方法
JPH09134193A (ja) * 1995-11-08 1997-05-20 Nippon Telegr & Teleph Corp <Ntt> 音声認識装置
JP2003131680A (ja) * 2001-10-23 2003-05-09 Kenji Hiramatsu 表示文任意選択とその発話音声出力を行う制御方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862700A (ja) * 1981-10-12 1983-04-14 株式会社デンソー 音声認識装置
JPS59137999A (ja) * 1983-01-27 1984-08-08 松下電器産業株式会社 音声認識装置
JPS6242198A (ja) * 1985-08-20 1987-02-24 松下電器産業株式会社 音声認識装置
JPH02232697A (ja) * 1989-03-06 1990-09-14 Nippondenso Co Ltd 音声認識装置
JPH0667690A (ja) * 1992-08-20 1994-03-11 Ricoh Co Ltd 車載用音声認識装置
JPH0713591A (ja) * 1993-06-22 1995-01-17 Hitachi Ltd 音声認識装置および音声認識方法
JPH09134193A (ja) * 1995-11-08 1997-05-20 Nippon Telegr & Teleph Corp <Ntt> 音声認識装置
JP2003131680A (ja) * 2001-10-23 2003-05-09 Kenji Hiramatsu 表示文任意選択とその発話音声出力を行う制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008309865A (ja) * 2007-06-12 2008-12-25 Fujitsu Ten Ltd 音声認識装置および音声認識方法
JP2012093508A (ja) * 2010-10-26 2012-05-17 Nec Corp 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム

Also Published As

Publication number Publication date
JP4257491B2 (ja) 2009-04-22

Similar Documents

Publication Publication Date Title
US7941189B2 (en) Communicating road noise control system, in-vehicle road noise controller, and server
KR101910383B1 (ko) 차량 운전 보조 장치 및 이를 구비한 차량
JP4736982B2 (ja) 作動制御装置、プログラム
JP6604151B2 (ja) 音声認識制御システム
JP4973722B2 (ja) 音声認識装置、音声認識方法、及びナビゲーション装置
JP5413321B2 (ja) 通信システム、車載端末、および携帯端末
JP2011242594A (ja) 情報提示システム
JP2011109170A (ja) 車両周囲表示装置、車両周囲表示方法
JP4297186B2 (ja) 通信型ロードノイズ制御システム、車載ロードノイズ制御装置及びサーバ
US20200319841A1 (en) Agent apparatus, agent apparatus control method, and storage medium
JP2002351488A (ja) ノイズキャンセル装置および車載システム
JP7274404B2 (ja) 情報提供装置、情報提供方法、およびプログラム
JP4257491B2 (ja) 音声認識装置
JP2020162003A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020154994A (ja) エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラム
JP2009098217A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識方法、音声認識プログラム、および記録媒体
JP2005191668A (ja) 発音制御装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体
JP2002091488A (ja) 車載ナビゲーション装置
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
JP2005122042A (ja) 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体
CN102235864A (zh) 藉由汽车噪音判断该汽车位置的手持式导航装置及方法
JP4531819B2 (ja) ナビゲーション装置、処理制御方法、処理制御プログラムおよびコンピュータに読み取り可能な記録媒体
JPWO2010073406A1 (ja) 情報提供装置、通信端末、情報提供システム、情報提供方法、情報出力方法、情報提供プログラム、情報出力プログラムおよび記録媒体
JP2009086132A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識装置を備えた電子機器、音声認識方法、音声認識プログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090107

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090120

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130213

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140213

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees