JP2008102384A - 音声入力支援プログラム、音声入力支援装置、音声入力支援方法 - Google Patents

音声入力支援プログラム、音声入力支援装置、音声入力支援方法 Download PDF

Info

Publication number
JP2008102384A
JP2008102384A JP2006285757A JP2006285757A JP2008102384A JP 2008102384 A JP2008102384 A JP 2008102384A JP 2006285757 A JP2006285757 A JP 2006285757A JP 2006285757 A JP2006285757 A JP 2006285757A JP 2008102384 A JP2008102384 A JP 2008102384A
Authority
JP
Japan
Prior art keywords
voice
level
noise
voice input
noise level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006285757A
Other languages
English (en)
Other versions
JP4940887B2 (ja
Inventor
Kaori Nakajima
かおり 中嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006285757A priority Critical patent/JP4940887B2/ja
Priority to US11/699,021 priority patent/US8023666B2/en
Publication of JP2008102384A publication Critical patent/JP2008102384A/ja
Application granted granted Critical
Publication of JP4940887B2 publication Critical patent/JP4940887B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)

Abstract

【課題】ユーザが適切な音声入力を行うための音声入力支援プログラム、音声入力支援装置、音声入力支援方法を提供する。
【解決手段】騒音環境下の音声入力の支援をコンピュータに実行させる音声入力支援プログラムであって、騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定ステップと、登録された少なくとも1つの音声レベル基準値と前記騒音測定ステップにより測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知ステップとをコンピュータに実行させる。
【選択図】図2

Description

本発明は、騒音環境下の音声入力の支援を行う音声入力支援プログラム、音声入力支援装置、音声入力支援方法に関するものである。
近年、音声認識装置は、様々な場面で利用されている。例えば、音声認識装置を利用することにより、走行時であってもハンズフリーで操作可能なカーナビゲーションシステムが実用化されている。
なお、本発明の関連ある従来技術として、発話しようとした際に騒音レベルが所定の閾値以上である場合、音声認識を行わない音声認識装置がある(例えば、特許文献1参照)。音声合成における音量及び音質を変更でき、音声認識における音響モデルを変更できる音声認識装置がある(例えば、特許文献2参照)。
特開2003−29785号公報 特開2005−122042号公報
しかしながら、音声認識装置は、誤認識するケースが多く、ユーザをいらだたせることが多い。誤認識の原因として、走行ノイズ等の騒音の影響が大きい。また、同じ環境であっても、ユーザの声の大きさ等により認識率は異なる。誤認識の発生時、ユーザはなぜ誤認識したかが分からないため、誤認識が繰り返され、ユーザのストレスが高まるケースがある。
上述した特許文献2の技術は、なぜ音声認識が行われないか、どうすれば音声認識が行われるかがユーザに伝えられないため、再度、音声認識を受け付けない状況に陥る可能性があり、ユーザのストレスが高まるケースがある。また、この技術において、騒音レベルの閾値は一定であり、ユーザにより音声認識が不可能となる騒音レベルは異なる。
また、ユーザは、発話するにあたり、どれくらいの音量で話せばいいかが分からないため、適正な音量に対して大き過ぎる声や小さ過ぎる声で発話してしまうケースがある。更に、「大きい声」、「普通の声」、「小さめの声」などの指示をユーザに与えた場合でも、ユーザにより発話レベルは異なる。
本発明は上述した問題点を解決するためになされたものであり、ユーザが適切な音声入力を行うための音声入力支援プログラム、音声入力支援装置、音声入力支援方法を提供することを目的とする。
上述した課題を解決するため、本発明は、騒音環境下の音声入力の支援をコンピュータに実行させる音声入力支援プログラムであって、騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定ステップと、登録された少なくとも1つの音声レベル基準値と前記騒音測定ステップにより測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知ステップとをコンピュータに実行させるものである。本発明によれば、ユーザは、騒音レベルに応じて正常な音声入力が可能であるか否かを知ることができる。
また、本発明に係る音声入力支援プログラムにおいて、更に、前記音声レベル基準値を登録する登録ステップをコンピュータに実行させることを特徴とする。本発明によれば、ユーザの音声レベルに適した通知を行うことができる。
また、本発明に係る音声入力支援プログラムにおいて、前記登録ステップは、ユーザに対して音声レベルの指示を行い、該指示に対応してユーザから入力された音声の音声レベルを測定することにより音声レベル基準値を取得し、前記音声レベルの指示に対応付けて音声レベル基準値を登録することを特徴とする。本発明によれば、指示に対応する音声レベル基準値を登録することにより、音声入力支援プログラムは、音声レベル基準値を用いて騒音や音声のレベルを表現することができ、ユーザは、音声レベル基準値に基づいて、音声入力支援プログラムから通知された騒音や音声のレベルを把握することができる。
また、本発明に係る音声入力支援プログラムにおいて、更に、前記コンピュータが搭載された車両の走行ルートに関する情報であるルート情報を取得し、該ルート情報に基づいて前記走行ルート上の騒音レベルを予測することにより騒音レベル予測値を算出する騒音予測ステップを含み、前記通知ステップとして、前記騒音レベル実測値に替えて前記騒音レベル予測値に基づくユーザへの通知を行う処理をコンピュータに実行させることを特徴とする。本発明によれば、ユーザは、未来の騒音レベルを知ることができ、発話タイミングの判断に用いることができる。
また、本発明に係る音声入力支援プログラムにおいて、前記通知ステップは更に、前記騒音レベル実測値及び前記騒音レベル予測値の少なくともいずれかを通知することを特徴とする。本発明によれば、ユーザは、現在の騒音レベルと未来の騒音レベルを知ることができ、発話タイミングの判断に用いることができる。
また、本発明の構成要素、または構成要素の任意の組合せを、方法、装置、システム、記録媒体、データ構造などに適用したものも本発明に含む。
本発明によれば、音声入力の失敗を低減することができる。
以下、本発明の実施の形態について図面を参照しつつ説明する。
本実施の形態においては、本発明の音声入力支援装置を音声認識機能に適用したカーナビゲーションシステムについて説明する。
まず、本実施の形態に係るカーナビゲーションシステムの構成について説明する。
図1は、本実施の形態に係るカーナビゲーションシステムの構成の一例を示すブロック図である。このカーナビゲーションシステムは、音声入力部1、ナビゲーション制御部2、表示部3、マイク4、発話ボタン5、スピーカ6を備える。音声入力部1は、音声認識制御部11、音声認識部12、騒音分析部13、表示制御部14、騒音予測部15、騒音レベル情報記憶部16、音声レベル情報記憶部17、音声分析部18を備える。
音声入力部1は、発話ボタン5が押されたタイミングでマイク4からの音声入力に対して音声認識を行い、音声認識結果に基づいてナビゲーション制御部2への指示を行う。ナビゲーション制御部2は、音声入力部1や他のユーザインタフェースからの指示に従って、ルート検索やルート案内等の制御を行う。また、ナビゲーション制御部2は、ルート検索の結果をルート情報として保持する。表示部3は、ナビゲーション制御部2からの指示または音声入力部1からの指示に従って表示を行う。スピーカ6は、ナビゲーション制御部2からのルート案内や音声入力部1からの指示の音声を出力する。
音声認識制御部11は、音声認識部12による音声認識処理の制御を行う。音声認識部12はマイク4から入力された音声に対して音声認識を行い、音声認識結果に基づいてナビゲーション制御部2への指示を行う。騒音分析部13は、マイク4による収音結果から騒音レベルの測定を行い、騒音レベルの実測値を騒音レベル情報記憶部16の騒音レベル情報に保存する。表示制御部14は、表示部3の制御を行う。騒音予測部15は、ナビゲーション制御部2からのルート情報に基づいて、騒音レベルの予測を行い、騒音レベルの予測値を騒音レベル情報記憶部16の騒音レベル情報に保存する。音声分析部18は、マイク4による収音結果から音声レベルの測定を行い、その結果を個人音声レベル情報として音声レベル情報記憶部17に保存する。
次に、本実施の形態に係る音声入力部1の動作について説明する。
図2は、本実施の形態に係る音声入力部の動作の一例を示すフローチャートである。まず、音声認識制御部11は、使用する音声レベル情報を設定する音声レベル情報設定処理を行う(S11)。
次に、騒音予測部15は、ナビゲーション制御部2によるルート情報の更新があったか否かの判断を行い、更新がなかった場合(S12,NO)、処理S15へ移行し、更新があった場合(S12,YES)、次の処理へ移行する。次に、騒音予測部15は、ナビゲーション制御部2により更新されたルート情報に基づいて騒音予測処理を行い、騒音レベル情報における騒音レベルの予測値を更新し(S13)、更新された騒音レベル情報をユーザに通知する騒音レベル情報通知処理を行う(S14)。
次に、騒音分析部13は、前回の騒音測定処理から所定の周期が経過したか否かの判断を行い、経過していない場合(S15,NO)、処理S21へ移行し、経過した場合(S15,YES)、次の処理へ移行する。次に、騒音分析部13は、マイク4による収音結果に基づいて騒音測定処理を行い、騒音レベル情報における現在時刻の騒音レベルを更新し(S16)、更新された騒音レベル情報をユーザに通知する騒音レベル情報通知処理を行う(S17)。
次に、音声認識制御部11は、発話ボタン5が押されたか否かの判断を行い、押されていない場合(S21,NO)、処理S12へ戻り、押された場合(S21,YES)、次の処理へ移行する。次に、音声認識制御部11は、騒音レベル情報記憶部16における現在の騒音レベルが騒音レベル閾値以下であるか否かの判断を行う(S22)。騒音レベル閾値以下である場合(S22,YES)、音声認識制御部11は、音声レベル指示処理を行い(S23)、音声認識部12は、音声認識処理を行い(S24)、このフローは終了する。一方、騒音レベル閾値を超えた場合(S22,NO)、音声認識制御部11は、発話タイミング指示処理を行い(S25)、このフローは終了する。
次に、音声レベル情報設定処理について説明する。
図3は、本実施の形態に係る音声レベル情報設定処理の動作の一例を示すフローチャートである。まず、音声認識制御部11は、カーナビゲーションシステムを使用するユーザの認証を行い(S31)、使用するユーザの音声レベルを示す個人音声レベル情報が音声レベル情報記憶部17に登録済みであるか否かの判断を行う(S32)。登録済みであれば(S32,YES)、その個人音声レベル情報を取得し、音声レベル情報として設定し、このフローは終了する。未登録であれば(S32,NO)、個人音声レベル情報登録処理(S41〜S63)を行い、その個人音声レベル情報を取得し、音声レベル情報として設定し、このフローは終了する。
次に、個人音声レベル情報登録処理について説明する。
ここでは、ユーザが「大」、「中」、「小」と感じる3つの音声レベル(音声レベル基準値)を登録する場合について説明する。まず、音声認識制御部11は、ユーザに大きい声で発話させるための指示をスピーカ6に出力させる(S41)。この指示は、例えば「大きめの声で発話してください。」である。次に、音声分析部18は、指示に従ってユーザが発話した音声をマイク4から取得し、この音声の音声レベルを測定する(S42)。次に、音声分析部18は、音声レベルの測定結果を、このユーザの個人音声レベル情報における発話音量「大」の音声レベル(音声レベルa)として登録する(S43)。
同様に、音声認識制御部11は、ユーザに普通の声で発話させるための指示をスピーカ6に出力させる(S51)。この指示は、例えば「普通の声で発話してください。」である。次に、音声分析部18は、指示に従ってユーザが発話した音声をマイク4から取得し、この音声の音声レベルを測定する(S52)。次に、音声分析部18は、音声レベルの測定結果を、このユーザの個人音声レベル情報における発話音量「中」の音声レベル(音声レベルb)として登録する(S53)。
同様に、音声認識制御部11は、ユーザに小さい声で発話させるための指示をスピーカ6に出力させる(S61)。この指示は、例えば「小さめの声で発話してください。」である。次に、音声分析部18は、指示に従ってユーザが発話した音声をマイク4から取得し、この音声の音声レベルを測定する(S62)。次に、音声分析部18は、音声レベルの測定結果を、このユーザの個人音声レベル情報における発話音量「小」の音声レベル(音声レベルc)として登録する(S63)。
次に、図3の処理によって音声レベル情報記憶部17へ格納される個人音声レベル情報について説明する。
図4は、本実施の形態に係る個人音声レベル情報の一例を示す表である。この個人音声レベル情報には、ユーザAとユーザBの個人音声レベル情報が登録されている。各々の個人音声レベル情報には、音声レベルa、音声レベルb、音声レベルcに対応する音声レベル[dB]が保存されている。ここで、音声レベルaは、そのユーザの音声レベルの上限である。本実施の形態においては、説明を簡単にするため、音声認識制御部11は、音声レベルが騒音レベル以上となる場合に、音声認識が可能であると判断する。従って、音声レベルaが、騒音レベル閾値となる。
上述した音声レベル情報設定処理によれば、ユーザ毎に、音声レベルの大小の指示に対する実際の発話の音声レベルを設定することができる。
次に、騒音予測処理について説明する。
まず、騒音予測部15は、ナビゲーション制御部2からルート情報を取得する。ルートは、出発地から目的地までがいくつかの区間に分けられており、ルート情報は、区間毎に時刻、走行道路、道路種別、状態が格納されている。時刻は、その区間を走行する予定の時刻を表し、走行道路は、その区間のリンク番号を表し、道路種別は、その区間の道路の種別(高速道、トンネル、橋、一般道など)を表し、状態は、その区間の渋滞の状態(渋滞、混雑、順調など)を表す。また、騒音レベル情報記憶部16は、道路種別や状態のパラメータに対応して測定された予め騒音レベルを基準騒音レベル情報として記憶している。次に、騒音予測部15は、区間毎の道路種別や状態のパラメータに対応する基準騒音レベル情報を参照し、その区間の騒音レベルを予測し、騒音レベル情報として騒音レベル情報記憶部16に格納する。
図5は、本実施の形態に係る騒音レベル情報記憶部16に格納されている騒音レベル情報の一例を示す表である。騒音レベル予測情報は、ルート情報から得られた区間毎の時刻、走行道路、道路種別、状態の他、その区間の騒音レベル[dB]を含む。
上述した騒音予測処理によれば、予め記憶された道路状況に対する騒音レベルからルートの騒音を予測することができる。
次に、騒音測定処理について説明する。
騒音分析部13は、マイク4による収音結果から騒音レベルを測定し、騒音レベル情報中の現在走行している区間の騒音レベルを、測定した騒音レベルへ更新する。つまり、騒音レベル情報において、現在走行している区間の騒音レベルは実測値であり、その後走行する予定の区間の騒音レベルは予測値である。
上述した騒音測定処理によれば、騒音レベル情報における現在の騒音レベルの精度を高めることができる。
次に、騒音レベル通知処理について説明する。
表示制御部14は、騒音予測処理または騒音測定処理により更新された騒音レベル情報を、グラフとして表示部3に表示させる。図6は、本実施の形態に係る騒音レベル通知処理による表示部3への表示の第1の例を示す画面である。この例は、図4におけるユーザAの場合を示す。このグラフの横軸は時刻を示し、縦軸は騒音レベル[dB]を示す。また、グラフは、騒音レベルと合わせて、ユーザの個人音声レベル情報における音声レベルa(発話音量「大」)、音声レベルb(発話音量「中」)、音声レベルc(発話音量「小」)を表示する。上述したように音声レベルaは、騒音レベル閾値であり、騒音レベルが騒音レベル閾値を超える場合を正常な音声認識が不可として表示し、騒音レベルが騒音レベル閾値以下である場合を正常な音声認識が可として表示する。すなわち、ユーザAにとって発生できる一番大きな声が音声レベルaであるので、ユーザAは音声レベルaよりも大きな声は出せないとみなし、該音声レベルaよりも騒音レベルの方が大きければ、ユーザAについては音声を認識できないと判断している。また、グラフは、現在時刻を表示する。
図7は、本実施の形態に係る騒音レベル通知処理による表示部3への表示の第2の例を示す画面である。この例は、図4におけるユーザBの場合を示す。グラフの表記方法は、ユーザAの場合と同様である。図4に示すように、ユーザAの音声レベルと比較してユーザBの音声レベルは低い。また、10:00(現在)の騒音レベル(実測値)は、ユーザBの音声レベルaを超えているが、10:10からの騒音レベル(予測値)は、音声レベルa以下となり、10:14からの騒音レベル(予測値)は、音声レベルb以下となり、10:20からの騒音レベル(予測値)は、音声レベルc以下となることが出力されている。
上述した騒音レベル通知処理によれば、ユーザは、現在あるいは未来の騒音レベルと自分の音声レベルの比較を行うことができるため、音声認識が可能である時間帯はいつか、音声認識を行う場合にどの程度の音声レベルで発話を行えば良いか、などを知ることができる。
次に、音声レベル指示処理について説明する。
まず、音声認識制御部11は、騒音レベル情報における現在の騒音レベルと、音声レベル情報における3つの音声レベル(音声レベルa、音声レベルb、音声レベルc)とをそれぞれ比較し、3つの音声レベルのうち、騒音レベル以上となる最低の音声レベルを選択し、指示音声レベルとする。次に、音声認識制御部11は、指示音声レベルに対応する指示をスピーカ6に出力させる。例えば、音声認識制御部11は、指示音声レベルが音声レベルaである場合に「ピッピッピー」の音を、指示音声レベルが音声レベルbである場合に「ピッピー」の音を、指示音声レベルが音声レベルcである場合に「ピー」の音を、それぞれスピーカ6に出力させる。
また、例えば、音声認識制御部11は、指示音声レベルが音声レベルaである場合に「大きめの声で発話してください」のメッセージを、指示音声レベルが音声レベルbである場合に「普通の声で発話してください」のメッセージを、指示音声レベルが音声レベルcである場合に「小さめの声で発話してもかまいません」のメッセージを、それぞれスピーカ6に出力させる。これらのメッセージは、個人音声レベル情報登録処理における指示のメッセージに対応する表現を用いる。
図6の例において、現在時刻10:00にユーザAが発話ボタン5を押したとすると、現在の騒音レベルは、音声レベルbより大きく、音声レベルaより小さいため、指示音声レベルは音声レベルaとなり、音声認識制御部11は、「ピッピッピー」または「大きめの声で発話してください」の指示をスピーカ6に出力させる。
なお、音声認識制御部11は、指示音声レベルに対応する指示をスピーカ6に出力するだけでなく、表示部3に表示させても良い。
上述した音声レベル指示処理によれば、ユーザは、音声認識を行う際に、適切な音声レベルを知ることができる。また、騒音レベルが高い場合、ユーザは、意識的に高い音声レベルで発話することができる。また、必要以上に大きい声を出したり、必要よりも小さい声で発話したりしてしまうケースを低減することができ、音声認識率を向上させることができる。
次に、発話タイミング指示処理について説明する。
音声認識制御部11は、警告音、または警告メッセージ「現在は騒音レベルが高いため、音声認識できません。」をスピーカ6に出力させることができる。なお、音声認識制御部11は、警告メッセージをスピーカ6に出力するだけでなく、表示部3に表示させても良い。
音声認識制御部11は、騒音レベル情報を参照し、騒音レベルの予測値が騒音レベル閾値以下となる直近の時刻を探索し、発話タイミングとする。次に、音声認識制御部11は、発話タイミングを示すメッセージをスピーカ6に出力させる。なお、音声認識制御部11は、発話タイミングを示すメッセージをスピーカ6に出力するだけでなく、表示部3に表示させても良い。
図7の例において、現在時刻10:00にユーザBが発話ボタン5を押したとすると、現在の騒音レベルは、騒音レベル閾値(音声レベルa)より大きいため、音声認識制御部11は、警告音または警告メッセージをスピーカ6に出力させる。
次に、音声認識制御部11は、騒音レベル情報の探索を行い、10:10からの騒音レベルの予測値が騒音レベル閾値(音声レベルa)以下となるため、メッセージ「10時10分から、大きめの声でなら音声認識可能になります。」をスピーカ6に出力させる。更に、10:14からの騒音レベルの予測値が音声レベルb以下となるため、音声認識制御部11は、メッセージ「10時14分から、普通の声で音声認識可能になります。」をスピーカ6に出力させても良い。更に、10:20からの騒音レベルの予測値が音声レベルc以下となるため、音声認識制御部11は、メッセージ「10時20分から、小さめの声でも音声認識可能になります。」をスピーカ6に出力させても良い。また、音声認識制御部11は、図5に示した騒音レベル情報における道路種別等の情報と組み合わせ、メッセージ「橋を通過後の10時10分から、大きめの声でなら音声認識可能になります。」をスピーカ6に出力させても良い。
上述した発話タイミング指示処理によれば、騒音レベルが高く音声認識不可能な場合であっても、ユーザは、音声認識不可能であることを知ることができると共に、音声認識可能な発話タイミングを知ることができる。ユーザが発話を行おうとした際の騒音レベルが騒音レベル閾値を超えている場合、認識を受け付けず、更にいつ発話すれば良いかを提示することにより、ユーザは、提示されたタイミングで発話を行うことができ、誤認識を低減することができる。
上述した音声レベル指示処理及び発話タイミング指示処理によれば、誤認識が減少し、ユーザのストレスを低減することができる。また、ユーザ毎の音声レベルを登録することにより、ユーザの音声レベルに応じた適切な通知を行うことができる。
なお、本実施の形態において、音声認識制御部11は、音声レベルが騒音レベル以上となる場合に音声認識が可能であると判断するとしたが、個人音声レベル登録処理において、測定した音声レベルに音声認識部の性能に基づくマージンやユーザ毎の声質(スペクトラムなど)に基づいて、音声認識が可能と判断する場合の騒音レベルに対する音声レベルの比を算出し、この比をマージンとして記憶し、騒音レベル情報と音声レベル情報の比較を行う際に、これらのマージンを加算して判定しても良い。即ち、音声認識制御部11は、騒音レベルに対する音声レベルの比がマージン以上となる場合に、音声認識が可能であると判断する。
また、本実施の形態においては、本発明をカーナビゲーションシステムにおける音声認識に適用した場合について説明したが、車内における携帯電話のハンズフリー通話機能等、騒音環境下の音声入力装置に適用しても良い。
なお、騒音測定ステップは、実施の形態における騒音分析処理に対応する。また、通知ステップは、実施の形態における騒音レベル情報通知処理、音声レベル指示処理、発話タイミング指示処理に対応する。また、登録ステップは、実施の形態における個人音声レベル情報登録処理に対応する。また、騒音予測ステップは、実施の形態における騒音予測処理に対応する。また、音声認識ステップは、実施の形態における音声認識処理に対応する。また、騒音測定部は、実施の形態における騒音分析部に対応する。また、通知部は、実施の形態における音声認識制御部に対応する。また、登録部は、実施の形態における音声分析部に対応する。
また、本実施の形態に係る音声入力支援装置は、音声入力を用いる情報処理装置に容易に適用することができ、情報処理装置の性能をより高めることができる。ここで、情報処理装置には、例えばカーナビゲーションシステム、PC(Personal Computer)等が含まれ得る。
更に、音声入力支援装置を構成するコンピュータにおいて上述した各ステップを実行させるプログラムを、音声入力支援プログラムとして提供することができる。上述したプログラムは、コンピュータにより読取り可能な記録媒体に記憶させることによって、音声入力支援装置を構成するコンピュータに実行させることが可能となる。ここで、上記コンピュータにより読取り可能な記録媒体としては、ROMやRAM等のコンピュータに内部実装される内部記憶装置、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。
(付記1) 騒音環境下の音声入力の支援をコンピュータに実行させる音声入力支援プログラムであって、
騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定ステップと、
登録された少なくとも1つの音声レベル基準値と前記騒音測定ステップにより測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知ステップと
をコンピュータに実行させる音声入力支援プログラム。
(付記2) 付記1に記載の音声入力支援プログラムにおいて、
更に、前記音声レベル基準値を登録する登録ステップをコンピュータに実行させることを特徴とする音声入力支援プログラム。
(付記3) 付記2に記載の音声入力支援プログラムにおいて、
前記登録ステップは、ユーザに対して音声レベルの指示を行い、該指示に対応してユーザから入力された音声の音声レベルを測定することにより音声レベル基準値を取得し、前記音声レベルの指示に対応付けて音声レベル基準値を登録することを特徴とする音声入力支援プログラム。
(付記4) 付記2または付記3に記載の音声入力支援プログラムにおいて、
前記登録ステップは、ユーザの認証を行い、前記ユーザ毎に前記音声レベル基準値を登録することを特徴とする音声入力支援プログラム。
(付記5) 付記1乃至付記4のいずれかに記載の音声入力支援プログラムにおいて、
更に、前記コンピュータが搭載された車両の走行ルートに関する情報であるルート情報を取得し、該ルート情報に基づいて前記走行ルート上の騒音レベルを予測することにより騒音レベル予測値を算出する騒音予測ステップを含み、
前記通知ステップとして、前記騒音レベル実測値に替えて前記騒音レベル予測値に基づくユーザへの通知を行う処理をコンピュータに実行させることを特徴とする音声入力支援プログラム。
(付記6) 付記5に記載の音声入力支援プログラムにおいて、
前記ルート情報は、前記走行ルートの道路の種類、渋滞情報の少なくともいずれかを含むことを特徴とする音声入力支援プログラム。
(付記7) 付記5または付記6に記載の音声入力支援プログラムにおいて、
前記騒音予測ステップは、前記ルート情報に対応して予め測定された騒音レベルを用いて、前記騒音レベル予測値を算出することを特徴とする音声入力支援プログラム。
(付記8) 付記5乃至付記7のいずれかに記載の音声入力支援プログラムにおいて、
前記騒音予測ステップは、前記ルート情報に変更があった場合、新たに騒音レベル予測値を算出することを特徴とする音声入力支援プログラム。
(付記9) 付記1乃至付記8のいずれかに記載の音声入力支援プログラムにおいて、
前記通知ステップは更に、前記騒音レベル実測値及び前記騒音レベル予測値の少なくともいずれかを通知することを特徴とする音声入力支援プログラム。
(付記10) 付記1乃至付記9のいずれかに記載の音声入力支援プログラムにおいて、
前記通知ステップは、前記登録された少なくとも1つの音声レベルに基づいて、正常な音声入力が可能である騒音レベルの閾値である騒音レベル閾値を決定し、前記騒音レベル実測値が前記騒音レベル閾値を超えた場合、正常な音声入力が不可能であることを通知することを特徴とする音声入力支援プログラム。
(付記11) 付記10に記載の音声入力支援プログラムにおいて、
前記通知ステップは、前記騒音レベル実測値が前記騒音レベル閾値を超えた場合、更に、前記騒音レベル予測値に基づいて、正常な音声入力が可能であるタイミングを予測し、該タイミングを通知することを特徴とする音声入力支援プログラム。
(付記12) 付記11に記載の音声入力支援プログラムにおいて、
前記通知ステップは、前記騒音レベル実測値が前記騒音レベル閾値を超えた場合、更に、前記騒音レベル予測値に基づいて、前記登録された少なくとも1つの音声レベルのうち、正常な音声入力が可能である音声レベルを選択し、該音声レベルを通知することを特徴とする音声入力支援プログラム。
(付記13) 付記1乃至付記12のいずれかに記載の音声入力支援プログラムにおいて、
前記通知ステップは、前記騒音レベル実測値が前記騒音レベル閾値以下である場合、該騒音レベル実測値と前記登録された少なくとも1つの音声レベル基準値とに基づいて、正常な音声入力が可能である音声レベルを決定し、該音声レベルを通知することを特徴とする音声入力支援プログラム。
(付記14) 付記1乃至付記13のいずれかに記載の音声入力支援プログラムにおいて、
前記通知ステップは、前記騒音レベル実測値に対する特定の音声レベル基準値の比が所定のマージン以上となった場合に、該音声レベル基準値による正常な音声入力が可能であると判断することを特徴とする音声入力支援プログラム。
(付記15) 付記1乃至付記14のいずれかに記載の音声入力支援プログラムにおいて、
更に、前記騒音レベル実測値が前記騒音レベル閾値以下である場合に音声入力された音声を用いて音声認識を行う音声認識ステップをコンピュータに実行させることを特徴とする音声入力支援プログラム。
(付記16) 騒音環境下の音声入力の支援を行う音声入力支援装置であって、
騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定部と、
登録された少なくとも1つの音声レベル基準値と前記騒音測定部により測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知部と
を備える音声入力支援装置。
(付記17) 付記16に記載の音声入力支援装置において、
更に、前記コンピュータが搭載された車両の走行ルートに関する情報であるルート情報を取得し、該ルート情報に基づいて前記走行ルート上の騒音レベルを予測することにより騒音レベル予測値を算出する騒音予測部を備え、
前記通知部は、前記騒音レベル実測値に替えて前記騒音レベル予測値に基づくユーザへの通知を行う処理を行うことを特徴とする音声入力支援装置。
(付記18) コンピュータにおいて実行される騒音環境下の音声入力の支援を行う音声入力支援方法であって、
騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定ステップと、
登録された少なくとも1つの音声レベル基準値と前記騒音測定ステップにより測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知ステップと
を実行する音声入力支援方法。
本実施の形態に係るカーナビゲーションシステムの構成の一例を示すブロック図である。 本実施の形態に係る音声入力部の動作の一例を示すフローチャートである。 本実施の形態に係る音声レベル情報設定処理の動作の一例を示すフローチャートである。 本実施の形態に係る個人音声レベル情報の一例を示す表である。 本実施の形態に係る騒音レベル情報の一例を示す表である。 本実施の形態に係る騒音レベル通知処理による表示の第1の例を示す画面である。 本実施の形態に係る騒音レベル通知処理による表示の第2の例を示す画面である。
符号の説明
1 音声入力部、2 ナビゲーション制御部、3 表示部、4 マイク、5 発話ボタン、6 スピーカ、11 音声認識制御部、12 音声認識部、13 騒音分析部、14 表示制御部、15 騒音予測部、16 騒音レベル情報記憶部、17 音声レベル情報記憶部、18 音声分析部。

Claims (7)

  1. 騒音環境下の音声入力の支援をコンピュータに実行させる音声入力支援プログラムであって、
    騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定ステップと、
    登録された少なくとも1つの音声レベル基準値と前記騒音測定ステップにより測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知ステップと
    をコンピュータに実行させる音声入力支援プログラム。
  2. 請求項1に記載の音声入力支援プログラムにおいて、
    更に、前記音声レベル基準値を登録する登録ステップをコンピュータに実行させることを特徴とする音声入力支援プログラム。
  3. 請求項2に記載の音声入力支援プログラムにおいて、
    前記登録ステップは、ユーザに対して音声レベルの指示を行い、該指示に対応してユーザから入力された音声の音声レベルを測定することにより音声レベル基準値を取得し、前記音声レベルの指示に対応付けて音声レベル基準値を登録することを特徴とする音声入力支援プログラム。
  4. 請求項1乃至請求項3のいずれかに記載の音声入力支援プログラムにおいて、
    更に、前記コンピュータが搭載された車両の走行ルートに関する情報であるルート情報を取得し、該ルート情報に基づいて前記走行ルート上の騒音レベルを予測することにより騒音レベル予測値を算出する騒音予測ステップを含み、
    前記通知ステップとして、前記騒音レベル実測値に替えて前記騒音レベル予測値に基づくユーザへの通知を行う処理をコンピュータに実行させることを特徴とする音声入力支援プログラム。
  5. 請求項1乃至請求項4のいずれかに記載の音声入力支援プログラムにおいて、
    前記通知ステップは更に、前記騒音レベル実測値及び前記騒音レベル予測値の少なくともいずれかを通知することを特徴とする音声入力支援プログラム。
  6. 騒音環境下の音声入力の支援を行う音声入力支援装置であって、
    騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定部と、
    登録された少なくとも1つの音声レベル基準値と前記騒音測定部により測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知部と
    を備える音声入力支援装置。
  7. コンピュータにおいて実行される騒音環境下の音声入力の支援を行う音声入力支援方法であって、
    騒音レベルを測定することにより騒音レベル実測値を取得する騒音測定ステップと、
    登録された少なくとも1つの音声レベル基準値と前記騒音測定ステップにより測定された騒音レベル実測値とに基づいて、発話すべき音声レベル及び発話タイミングの少なくともいずれかの指示の出力を行う通知ステップと
    を実行する音声入力支援方法。
JP2006285757A 2006-10-20 2006-10-20 音声入力支援プログラム、音声入力支援装置、音声入力支援方法 Expired - Fee Related JP4940887B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006285757A JP4940887B2 (ja) 2006-10-20 2006-10-20 音声入力支援プログラム、音声入力支援装置、音声入力支援方法
US11/699,021 US8023666B2 (en) 2006-10-20 2007-01-29 Voice input support program, voice input support device, and voice input support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006285757A JP4940887B2 (ja) 2006-10-20 2006-10-20 音声入力支援プログラム、音声入力支援装置、音声入力支援方法

Publications (2)

Publication Number Publication Date
JP2008102384A true JP2008102384A (ja) 2008-05-01
JP4940887B2 JP4940887B2 (ja) 2012-05-30

Family

ID=39359764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006285757A Expired - Fee Related JP4940887B2 (ja) 2006-10-20 2006-10-20 音声入力支援プログラム、音声入力支援装置、音声入力支援方法

Country Status (2)

Country Link
US (1) US8023666B2 (ja)
JP (1) JP4940887B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011086663A1 (ja) * 2010-01-12 2011-07-21 三菱電機株式会社 エレベーターの呼び登録装置
WO2016063564A1 (ja) * 2014-10-24 2016-04-28 株式会社ソニー・コンピュータエンタテインメント 制御装置、制御方法、プログラム及び情報記憶媒体
US10339928B2 (en) 2014-10-24 2019-07-02 Sony Interactive Entertainment Inc. Control device, control method, program and information storage medium

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9129291B2 (en) * 2008-09-22 2015-09-08 Personics Holdings, Llc Personalized sound management and method
EP2707872A2 (en) * 2011-05-12 2014-03-19 Johnson Controls Technology Company Adaptive voice recognition systems and methods
JP2013106315A (ja) * 2011-11-16 2013-05-30 Toshiba Corp 情報端末、家電機器、情報処理方法および情報処理プログラム
JP6454495B2 (ja) * 2014-08-19 2019-01-16 ルネサスエレクトロニクス株式会社 半導体装置及びその故障検出方法
US10943598B2 (en) * 2019-03-18 2021-03-09 Rovi Guides, Inc. Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands
US11302323B2 (en) * 2019-11-21 2022-04-12 International Business Machines Corporation Voice response delivery with acceptable interference and attention

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62183499A (ja) * 1986-02-07 1987-08-11 松下電器産業株式会社 音声認識装置
JPH02181200A (ja) * 1989-01-05 1990-07-13 Toshiba Corp 音声認識装置
JPH039400A (ja) * 1989-06-07 1991-01-17 Oki Electric Ind Co Ltd 音声認識装置
JPH0375800A (ja) * 1989-08-18 1991-03-29 Matsushita Refrig Co Ltd 音声認識装置
JPH0635497A (ja) * 1992-07-16 1994-02-10 Nippon Telegr & Teleph Corp <Ntt> 音声入力装置
JPH0675588A (ja) * 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
JP2001343996A (ja) * 2000-06-01 2001-12-14 Mitsubishi Electric Corp 音声入力制御システム
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
JP2006154724A (ja) * 2004-10-28 2006-06-15 Fujitsu Ltd 対話システム、対話方法、及びコンピュータプログラム
JP2006227499A (ja) * 2005-02-21 2006-08-31 Toyota Motor Corp 音声認識装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040125962A1 (en) * 2000-04-14 2004-07-01 Markus Christoph Method and apparatus for dynamic sound optimization
JP2003029785A (ja) 2001-07-18 2003-01-31 Clarion Co Ltd 音声認識装置
JP2004239963A (ja) * 2003-02-03 2004-08-26 Mitsubishi Electric Corp 車載制御装置
JP2005122042A (ja) 2003-10-20 2005-05-12 Toyota Motor Corp 音声認識装置、音声認識方法、音声合成装置、音声合成方法、音声認識システム、音声合成システム、音声認識合成装置、およびナビゲーションシステム、ならびに移動体

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62183499A (ja) * 1986-02-07 1987-08-11 松下電器産業株式会社 音声認識装置
JPH02181200A (ja) * 1989-01-05 1990-07-13 Toshiba Corp 音声認識装置
JPH039400A (ja) * 1989-06-07 1991-01-17 Oki Electric Ind Co Ltd 音声認識装置
JPH0375800A (ja) * 1989-08-18 1991-03-29 Matsushita Refrig Co Ltd 音声認識装置
JPH0635497A (ja) * 1992-07-16 1994-02-10 Nippon Telegr & Teleph Corp <Ntt> 音声入力装置
JPH0675588A (ja) * 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
JP2001343996A (ja) * 2000-06-01 2001-12-14 Mitsubishi Electric Corp 音声入力制御システム
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
JP2006154724A (ja) * 2004-10-28 2006-06-15 Fujitsu Ltd 対話システム、対話方法、及びコンピュータプログラム
JP2006227499A (ja) * 2005-02-21 2006-08-31 Toyota Motor Corp 音声認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011086663A1 (ja) * 2010-01-12 2011-07-21 三菱電機株式会社 エレベーターの呼び登録装置
WO2016063564A1 (ja) * 2014-10-24 2016-04-28 株式会社ソニー・コンピュータエンタテインメント 制御装置、制御方法、プログラム及び情報記憶媒体
US10339928B2 (en) 2014-10-24 2019-07-02 Sony Interactive Entertainment Inc. Control device, control method, program and information storage medium
US10434412B2 (en) 2014-10-24 2019-10-08 Sony Interactive Entertainment Inc. Control apparatus, control method, program, and information storage medium

Also Published As

Publication number Publication date
JP4940887B2 (ja) 2012-05-30
US20080107286A1 (en) 2008-05-08
US8023666B2 (en) 2011-09-20

Similar Documents

Publication Publication Date Title
JP4940887B2 (ja) 音声入力支援プログラム、音声入力支援装置、音声入力支援方法
JP6400109B2 (ja) 音声認識システム
JP5315289B2 (ja) オペレーティングシステム及びオペレーティング方法
US7949523B2 (en) Apparatus, method, and computer program product for processing voice in speech
JP6621613B2 (ja) 音声操作システム、サーバー装置、車載機器および音声操作方法
EP2581901A2 (en) Information terminal, server device, searching system and corresponding searching method
US20130253933A1 (en) Voice recognition device and navigation device
JP2007011380A (ja) 自動車インターフェース
JP2005331882A (ja) 音声認識装置、音声認識方法、および音声認識プログラム
JP2007279975A (ja) 車載装置、音声情報提供システムおよび発話速度調整方法
JP2005534983A (ja) 自動音声認識の方法
JP2018097029A (ja) 音声認識装置および音声認識方法
JP2014038132A (ja) 情報処理装置、プログラム、及び情報処理方法
JPH10105192A (ja) 車両用音声案内装置
JP2006292918A (ja) ナビゲーション装置およびナビゲーション装置用プログラム
JP2011203434A (ja) 音声認識装置及び音声認識方法
JP2018116206A (ja) 音声認識装置、音声認識方法及び音声認識システム
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP4437047B2 (ja) 音声対話装置
JP2008058452A (ja) 音声情報認証装置及び音声情報認証方法
JP7002823B2 (ja) 案内音声出力制御システムおよび案内音声出力制御方法
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
KR100749088B1 (ko) 대화형 네비게이션 시스템 및 그 제어방법
JP4178931B2 (ja) 音声認識装置
JP2009086132A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識装置を備えた電子機器、音声認識方法、音声認識プログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120131

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120213

R150 Certificate of patent or registration of utility model

Ref document number: 4940887

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees