JP4979336B2 - 音声出力装置 - Google Patents
音声出力装置 Download PDFInfo
- Publication number
- JP4979336B2 JP4979336B2 JP2006284791A JP2006284791A JP4979336B2 JP 4979336 B2 JP4979336 B2 JP 4979336B2 JP 2006284791 A JP2006284791 A JP 2006284791A JP 2006284791 A JP2006284791 A JP 2006284791A JP 4979336 B2 JP4979336 B2 JP 4979336B2
- Authority
- JP
- Japan
- Prior art keywords
- output
- unit
- noise
- voice
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
また、以上のような音声出力装置に、さらに、マイクロフォンを設けると共に、前記騒音レベル算定部を、前記マイクロフォンの出力信号に基づいて周囲騒音の周波数帯域のパワーとを推定する騒音パワー推定手段と、前記騒音パワー推定手段が推定した周囲騒音のパワーに基づいて、前記周囲騒音の、前記スピーカから出力される音声の聴き取りの妨げとなる度合いを表す騒音レベルを推定する騒音レベル推定手段とより構成し、前記騒音レベル推定手段において、前記騒音パワー推定手段が推定した周囲騒音の周波数帯域と、前記音声出力部が出力する音声の周波数帯域とが重複する範囲がより大きいほど、より大きくなるように前記騒音レベルを推定するようにしてもよい。
このようにすることにより、音声の周波数帯域と騒音の周波数帯域の重複範囲が大きい場合、すなわち、ユーザの音声の聞き取りを大きく阻害する周波数帯域を持つ騒音が発生している場合に、再出力をより積極的に行うようにすることができる。そして、これにより、より確実に音声が表す内容をユーザに伝えることができるようになる。
また、以上の音声出力装置は、マイクロフォンを設けると共に、前記騒音レベル算定部を、前記マイクロフォンの出力信号に基づいて周囲騒音のパワーを推定する騒音パワー推定手段と、前記音声出力部が出力する音声のパワーを算出する音声パワー算出手段と、前記騒音パワー推定手段が推定した周囲騒音のパワーと、前記音声パワー算出手段が算出した音声のパワーとの関係より、前記周囲騒音の、前記スピーカから出力される音声の聴き取りの妨げとなる度合いを表す騒音レベルを推定する騒音レベル推定手段とより構成してもよい。
まず、第1の実施形態について説明する。
図1に本第1実施形態に係る音声出力装置の構成を示す。
図示した音声出力装置1は、たとえば音声出力装置1を利用して案内音声を出力するカーナビゲーション装置などである情報処理装置2から指定された、ユーザに対するメッセージを表す出力文を読み上げた音声を生成し、スピーカ3に出力する装置である。また、音声出力装置1は、周囲騒音の大きさを検出するために用いるマイクロフォン4に接続されている。
「日本橋の、交差点を、左折です。」との漢字仮名混じり文であれば、
「にほんばしの、しんごうを、させつです。」との仮名文に変換する。
すなわち、たとえば、所定文字数を5文字とすれば、仮名文
「にほんばしの、しんごうを、させつです。」は、
「にほんばしの、」と「しんごうを、」と「させつです。」との三つの発話単位に分割することができる。
図2に示すように、この処理では、音声データ再生部17による音声信号の出力が開始されるのを待ち(ステップ202)、音声信号の出力が開始されたならば、音声パワー推定部20から当該時点で推定されている音声信号のパワーをSPとして取得し、騒音パワー推定部19から当該時点で推定されている周囲騒音のパワーをNPとして取得する(ステップ204)。なお、ステップ202における、音声信号の出力の有無は、音声データ再生部17から出力される再生中の信号に基づいて判定することができる。
ここで、図3にこのような再出力制御処理の処理例を示す。
いま、再出力制御処理を行わなかった場合、図3aのように、音声データ再生部17によって「にほんばしの、」と「しんごうを、」と「させつです。」との発話単位1から発話単位3の3つの発話単位を読み上げた音声が出力される場合を考える。
このような場合において、図3bに示すように、発話単位2の「しんごうを、」を読み上げた音声を出力しているときに、周囲騒音の騒音パワーが大きくなる高騒音区間がある程度の時間以上発生すると、ユーザが、この「しんごうを、」を読み上げた音声部分を聞き取れなくなってしまう。
以上、本発明の実施形態について説明した。
なお、以上の実施形態の図2に示した再出力制御処理において、ステップ206とステップ218の高騒音区間の判定は、音声パワーSPと騒音パワーNPの周波数帯域毎の重なりの大小に応じて行うようにしてもよい。すなわち、この場合には、騒音パワー推定部19と音声パワー推定部20において、各々パワーの推定を周波数帯域毎に行って、その周波数分布を求め、求めた騒音パワーと音声パワーの周波数分布の重なる周波数範囲が大きいほど、再出力制御処理で高騒音区間の判定に用いるしきい値Th1を大きく設定したり、高騒音区間タイマのタイムアウトを短く設定することにより、再出力がより行われ易くする。
ここで、図4に示した音声出力装置1は、図1に示した音声出力装置1に、補正量算出部22、補正適用部23、語彙種別辞書24を追加した構成を示している。
また、このような構成において、補正量算出部22は、騒音パワー推定部19が推定したユーザに聞こえる周囲騒音のパワーと、音声パワー推定部20が推定したユーザに聞こえるスピーカ3から出力した音声のパワーとに基づいて、スピーカ3から出力した音声がユーザに聞こえる明瞭度を所定レベルに保つために、スピーカ3に出力する音声信号に対してアンプ18で施すべきゲイン調整の調整量を補正値として算出する処理を繰り返し行う。
次に、語彙種別辞書24には、出力文受付部11が受け付ける出力文に含まれる可能性のある各単語の種別を登録する。ここで、単語の種別としては、聞き慣れた語彙と、聞き慣れない語彙との二つの種別を用い、施設名称、都道府県名、市町村名、交差点名などの固有名詞や、30メートルなどの、数詞を含む語彙の種別は、聞き慣れない語彙の種別として語彙種別辞書24に登録し、他の語彙の種別は聞き慣れた語彙として語彙種別辞書24に登録する。
また、音声データ再生部17において、音声信号の再生中、当該音声信号を再生している音声データの発話単位識別子と共に、当該音声データの発話単位について出力音声データ形成部14より通知された発話単位種別を再出力制御部21に出力する。
そして、再出力制御部21において、発話単位種別が「聞き慣れない語彙を含む」である発話単位の音声データの音声信号が出力されている期間中、発話単位種別が「聞き慣れない語彙を含まない」である発話単位の音声データの音声信号が出力されている期間よりも、再出力制御処理で高騒音区間の判定に用いるしきい値Th1を大きく設定したり、高騒音区間タイマのタイムアウトを短く設定することにより、聞き慣れない語彙を含む発話単位の音声が、より再出力され易くする。
また、以上の実施形態による音声の再出力の技術は、日本語以外の言語、たとえば、英語の出力文を音声出力するような場合にも同様に適用することができる。
Claims (6)
- 音声を出力する音声出力装置であって、
スピーカと、
前記スピーカを用いて文または文章を表す音声を出力する音声出力部と、
周囲騒音のレベルを表す騒音レベルを算定する騒音レベル算定部と、
前記音声出力部が前記音声を出力している期間中に、前記騒音レベル算定部が算定している騒音レベルが所定レベル以上大きい所定時間長以上の時間区間である高騒音期間の発生を検出する高騒音期間検出手段と、
前記高騒音期間が発生したときに、その後の、前記騒音レベル算定部が算定している騒音レベルが所定値より小さい予め定めた時間長以上の時間区間である低騒音期間の発生時に、前記高騒音期間において出力していた音声を、前記音声出力部に出力させる再出力制御手段と、
前記音声出力部が出力する音声が表す文または文章を、当該文または文章を構成する、文節である、または、文である出力単位に分割する出力単位分割部と、
聴者が識別しづらい語彙の種別であるとして予め定めた所定種別の語彙である識別非容易語彙を、前記各出力単位が含むかどうかを判定する識別非容易語彙判定手段とを有し、
前記再出力制御手段は、前記音声出力部が前記音声を出力している期間中に前記高騒音期間が発生したときに、前記出力単位分割部が分割した出力単位に基づいて、その後の前記低騒区間の発生時に、前記高騒音期間において出力していた文または文章の、当該高騒音期間において出力していた出力単位以降の部分を表す音声を前記音声出力部に出力させ、
前記高騒音期間検出手段は、前記識別非容易語彙判定手段の判定結果に従って、前記音声出力部が、前記識別非容易語彙を含む出力単位を表す音声を出力している場合に、前記識別非容易語彙を含まない出力単位を表す音声を出力している場合に比べ、前記所定レベルを小さく設定することと、前記所定時間長を短く設定することとの少なくとも一方を行うことを特徴とする音声出力装置。 - 請求項1記載の音声出力装置であって、
マイクロフォンを有し、
前記騒音レベル算定部は、
前記マイクロフォンの出力信号に基づいて周囲騒音の周波数帯域とパワーとを推定する騒音パワー推定手段と、
前記騒音パワー推定手段が推定した周囲騒音のパワーに基づいて、前記騒音レベルを推定する騒音レベル推定手段とを有し、
当該騒音レベル推定手段は、前記騒音パワー推定手段が推定した周囲騒音の周波数帯域と、前記音声出力部が出力する音声の周波数帯域とが重複する範囲がより大きいほど、より大きくなるように前記騒音レベルを推定することを特徴とする音声出力装置。 - 請求項1または2記載の音声出力装置であって、
設定されたゲイン量で、前記音声出力部が出力する音声のゲインを調整するゲイン調整部と、
前記スピーカから出力される音声が所定の明瞭度をもって聴者に聞こえるようになる、前記ゲイン調整部におけるゲイン量を、前記騒音レベル算定部が算定した騒音レベルに基づいて算出するゲイン量算出部とを有し、
前記再出力制御手段は、前記低騒音期間の発生時に、前記高騒音期間において出力していた音声を前記音声出力部に出力させる際に、前記ゲイン量算出部が算出しているゲイン量に、前記ゲイン調整部に設定されているゲイン量を更新することを特徴とする音声出力装置。 - 請求項1記載の音声出力装置であって、
マイクロフォンを有し、
前記騒音レベル算定部は、
前記マイクロフォンの出力信号に基づいて周囲騒音のパワーを推定する騒音パワー推定手段と、
前記音声出力部が出力する音声のパワーを算出する音声パワー算出手段と、
前記騒音パワー推定手段が推定した周囲騒音のパワーと、前記音声パワー算出手段が算出した音声のパワーとの関係より、前記周囲騒音の騒音レベルを推定する騒音レベル推定手段とを有することを特徴とする音声出力装置。 - 請求項1、2、3または4記載の音声出力装置と、当該音声出力装置を用いて、経路を案内する文を表す音声を出力する経路案内部とを備えたことを特徴とするカーナビゲーション装置。
- スピーカを用いて文または文章を表す音声を出力する音声出力装置において当該音声の出力を制御する音声出力制御方法であって、
前記音声出力装置が、周囲騒音のレベルを表す騒音レベルを算定する騒音レベル算定ステップと、
前記音声出力装置が、前記音声を出力している期間中に、前記騒音レベル算定ステップで算定している騒音レベルが所定レベル以上大きい所定時間長以上の時間区間である高騒音期間の発生を検出する高騒音期間検出ステップと、
前記音声出力装置が、前記高騒音期間が発生したときに、その後の、前記騒音レベル算定ステップで算定している騒音レベルが所定値より小さい予め定めた時間長以上の時間区間である低騒音期間の発生時に、前記高騒音期間において出力していた音声を出力する再出力制御ステップと、
前記音声出力装置が、前記出力する音声が表す文または文章を、当該文または文章を構成する、文節である、または、文である出力単位に分割する出力単位分割ステップと、
前記音声出力装置が、聴者が識別しづらい語彙の種別であるとして予め定めた所定種別の語彙である識別非容易語彙を、前記各出力単位が含むかどうかを判定する識別非容易語彙判定ステップとを有し、
前記音声出力装置は、前記再出力制御ステップにおいて、前記音声を出力している期間中に前記高騒音期間が発生したときに、前記出力単位分割ステップで分割した出力単位に基づいて、その後の前記低騒区間の発生時に、前記高騒音期間において出力していた文または文章の、当該高騒音期間において出力していた出力単位以降の部分を表す音声を出力し、
前記音声出力装置は、前記高騒音期間検出ステップにおいて、前記識別非容易語彙判定ステップの判定結果に従って、前記識別非容易語彙を含む出力単位を表す音声を出力している場合に、前記識別非容易語彙を含まない出力単位を表す音声を出力している場合に比べ、前記所定レベルを小さく設定することと、前記所定時間長を短く設定することとの少なくとも一方を行うことを特徴とする音声出力制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006284791A JP4979336B2 (ja) | 2006-10-19 | 2006-10-19 | 音声出力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006284791A JP4979336B2 (ja) | 2006-10-19 | 2006-10-19 | 音声出力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008102310A JP2008102310A (ja) | 2008-05-01 |
JP4979336B2 true JP4979336B2 (ja) | 2012-07-18 |
Family
ID=39436686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006284791A Expired - Fee Related JP4979336B2 (ja) | 2006-10-19 | 2006-10-19 | 音声出力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4979336B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6582514B2 (ja) * | 2015-04-23 | 2019-10-02 | 富士通株式会社 | コンテンツ再生装置、コンテンツ再生プログラム及びコンテンツ再生方法 |
JP2019091977A (ja) * | 2017-11-13 | 2019-06-13 | クラリオン株式会社 | 音声出力システム及び音声出力方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1021049A (ja) * | 1996-06-28 | 1998-01-23 | Ricoh Co Ltd | 音声合成装置 |
JP3284176B2 (ja) * | 1996-10-25 | 2002-05-20 | シャープ株式会社 | オーディオ装置 |
JPH11166835A (ja) * | 1997-12-03 | 1999-06-22 | Alpine Electron Inc | ナビゲーション音声補正装置 |
JP2000267687A (ja) * | 1999-03-19 | 2000-09-29 | Mitsubishi Electric Corp | 音声応答装置 |
JP2005070430A (ja) * | 2003-08-25 | 2005-03-17 | Alpine Electronics Inc | 音声出力装置および方法 |
JP2006042061A (ja) * | 2004-07-28 | 2006-02-09 | Toshiba Corp | 放送受信装置、番組情報音声出力プログラム |
-
2006
- 2006-10-19 JP JP2006284791A patent/JP4979336B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008102310A (ja) | 2008-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7490039B1 (en) | Text to speech system and method having interactive spelling capabilities | |
JP5750380B2 (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP4667085B2 (ja) | 音声対話システム、コンピュータプログラム、対話制御装置及び音声対話方法 | |
US20140372117A1 (en) | Transcription support device, method, and computer program product | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
JP2013025299A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2012163692A (ja) | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム | |
JP4752516B2 (ja) | 音声対話装置および音声対話方法 | |
JP2003150194A (ja) | 音声対話装置および音声対話装置における入力音声最適化方法ならびに音声対話装置における入力音声最適化処理プログラム | |
JP2005070430A (ja) | 音声出力装置および方法 | |
JP4953767B2 (ja) | 音声生成装置 | |
JP4979336B2 (ja) | 音声出力装置 | |
US8990092B2 (en) | Voice recognition device | |
JPH05257490A (ja) | 話速変換方法および装置 | |
US7092884B2 (en) | Method of nonvisual enrollment for speech recognition | |
JP3219892B2 (ja) | リアルタイム話速変換装置 | |
JP2000206987A (ja) | 音声認識装置 | |
JP2011180416A (ja) | 音声合成装置、音声合成方法およびカーナビゲーションシステム | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP2016186646A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP3277579B2 (ja) | 音声認識方法および装置 | |
KR101104822B1 (ko) | 큰소리 발성에 기반을 둔 어학 시스템 및 방법 | |
JP2015187738A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP2005157166A (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP2002244694A (ja) | 字幕送出タイミング検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120417 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120417 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150427 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4979336 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |