JP4953767B2 - 音声生成装置 - Google Patents
音声生成装置 Download PDFInfo
- Publication number
- JP4953767B2 JP4953767B2 JP2006299101A JP2006299101A JP4953767B2 JP 4953767 B2 JP4953767 B2 JP 4953767B2 JP 2006299101 A JP2006299101 A JP 2006299101A JP 2006299101 A JP2006299101 A JP 2006299101A JP 4953767 B2 JP4953767 B2 JP 4953767B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- gain
- output
- audio signal
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
まず、第1の実施形態について説明する。
図1に本第1実施形態に係る音声生成装置の構成を示す。
図示した音声生成装置1は、たとえば音声生成装置1を利用して案内音声を出力するカーナビゲーション装置などである情報処理装置2から指定された漢字仮名交じり文を読み上げた音声を生成し、スピーカ3に出力する装置である。また、音声生成装置は、マイクロフォン4を用いて周囲騒音の大きさを検出し、検出した周囲騒音の大きさに応じて、スピーカ3に出力する音声の音量を調整する。
「次の、交差点を、左折です。」との漢字仮名混じり文であれば、
「つぎの、こうさてんを、させつです。」との仮名文に変換する。
すなわち、たとえば、所定文字数を5文字とすれば、仮名文
「つぎの、こうさてんを、させつです。」は、
「つぎの、こうさてんを、」と「させつです。」との二つの発話単位に分割することができる。なお、この際の文字数は、句読点や発音されない記号文字は含めずに計数してもよい。
また、補正適用部22は、補正タイミング制御部23から発行された補正適用指示に応じて、その時点で補正量算出部21が算出している補正値を、アンプ18に設定する。
図2に、この補正タイミング制御部23が行う補正タイミング制御処理の手順を示す。
図示するように、この処理では、まず、発話単位分割部13から出力文の発生の通知を待ち(ステップ202)、出力文の発生が通知されたならば、当該通知と共に発話単位分割部13から通知された発話単位数をnとし(ステップ204)、1からnまでの各iについて(ステップ212、214)、順次、以下の処理を行う。
そして、nまでのiについて処理を終了したならば、ステップ202に戻って、次の出力文の発生が通知されているかどうかを調べ、通知されていなければ、次の出力文の発生通知を待つ。一方、次の出力文の発生が通知されていれば、ステップ204に進んで、次の出力文についての以上の処理を行う。
図3に、本第2実施形態に係る音声生成装置1の構成を示す。
図示するように、本第2実施形態に係る音声生成装置1の構成は、図1に示した第1実施形態に係る音声生成装置1とほぼ同様であり、音素波形データベース15を用いてスピーカ3に出力する音声信号を生成する際の動作は、前記第1実施形態と同様である。
ただし、本第2実施形態に係る音声生成装置1は、音声合成部16の音声合成パラメータを設定する合成パラメータ設定部24を備えており、音声合成部16を用いてスピーカ3に出力する音声信号を生成する際には、補正タイミング制御部23において、合成パラメータ設定部24から音声合成パラメータを取得し、取得した音声合成パラメータと、音声パワー推定部20が推定したパワーとに応じて、補正適用部22に補正適用指示を発行して、アンプ18の補正値を更新するタイミングを決定する。
この場合、発話単位分割部13は、仮名変換部12から入力する仮名文を発話単位に分割したならば、発話単位と発話単位の間の各区切りについて、発話単位区切期間変数を算定する。ただし、発話単位分割部13は、最後の発話単位の終端も、発話単位の区切りと見なして、発話単位区切期間変数を算定する。
{nA+(m-1)B}-{na+(m-1)b}から{nA+mB}+{na+mb}として求められる。
{nA+(m-1)B}-{na+(m-1)b}から{nA+mB}+{na+mb}として求めるようにする。
次に、音声データ再生部17は、補正タイミング制御部23から発行される出力文音声出力指示を受け取ったならば、格納している音声データを音声信号に再生してアンプ18に出力し、出力を完了しだい補正タイミング制御部23に音声出力終了を報告する処理を行う。一方、アンプ18は音声データ再生部17から入力する音声信号のゲインを、補正適用部22によって設定されている補正値で調整しスピーカ3にする。
そして、補正タイミング制御部23は、図4に示す補正タイミング制御処理を行って、上述した音声データ再生部17への出力文音声出力指示の発行と、補正適用部22への補正適用指示の発行を行う。
すなわち、補正タイミング制御部23は、まず、発話単位分割部13から出力文の発生の通知を待ち(ステップ402)、出力文の発生が通知されたならば、当該通知と共に発話単位分割部13から通知された発話単位区切数をnとし(ステップ404)、補正適用部22に補正適用指示を発行し(ステップ406)、音声データ再生部17へ出力文音声出力指示を発行し(ステップ408)、時刻0より計時を開始する(ステップ410)。
すなわち、まず、計時時刻がi番目の発話単位区切期間内となるのを待つ(ステップ412)。ここで、i番目の発話単位区切期間は、発話単位分割部13から通知されているi番目の発話単位区切期間変数に、合成パラメータ設定部24から上述の音声合成パラメータA、B、a、bを取得し代入することにより求まる。
このような第2実施形態によっても、音声合成部16を用いてスピーカ3から出力する音声信号を生成する場合に、前記第1実施形態と同様に、スピーカ3から出力する音声の周囲騒音に応じたゲインの切替が、発話単位の区切りにおいてのみ行われるようにすることができる。
すなわち、発話単位区切検出部52は、音声ソース機器6から入力する音声信号が表す音声に対して音声認識処理を施して、当該音声が表す文章または文に変換する。そして、当該文章または文を、前記第1実施形態で示したように発話単位に分割する。そして、各発話単位と発話単位の間に対応する無音区間の音声信号を遅延部51が出力している期間に、補正適用部22に補正適用指示を発行する。
なお、以上の各実施形態では、スピーカ3から出力する音声の周囲騒音に応じたゲインの切替が、発話単位の区切りにおいてのみ行われるようにするために、アンプ18に対する補正適用部22の補正値の設定を発話単位の区切りにおいてのみ行うようにしたが、これに代えて、騒音パワー推定部19の周囲騒音のパワーの推定を、発話単位の区切りにおいてのみ行わせるようにしても同様の効果を達成することができる。
Claims (15)
- 音声信号を生成し出力する音声生成装置であって、
指定された文章を表す音声信号を生成して出力する出力音声生成部と、
前記出力音声生成部が出力した音声信号を増幅するアンプと、
前記アンプが増幅した音声信号を出力するスピーカと、
ゲイン更新部と、
前記出力音声生成部の前記文章を表す音声信号の生成に先だって、文をゲイン調整単位として、当該文章を前記ゲイン調整単位に分割するゲイン調整単位分割部と、
前記ゲイン調整単位分割部が分割したゲイン調整単位に基づいて、前記出力音声生成部が出力する音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記ゲイン更新部に、ゲインの更新を指示する調整タイミング制御部と、
前記ゲイン更新部は、前記ゲインの更新を指示されたときに、前記アンプにおいて行う音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更することを特徴とする音声生成装置。 - 音声信号を生成し出力する音声生成装置であって、
指定された文を表す音声信号を生成して出力する出力音声生成部と、
前記出力音声生成部が出力した音声信号を増幅するアンプと、
前記アンプが増幅した音声信号を出力するスピーカと、
ゲイン更新部と、
前記出力音声生成部の前記文を表す音声信号の生成に先だって、文節をゲイン調整単位として、当該文を前記ゲイン調整単位に分割するゲイン調整単位分割部と、
前記ゲイン調整単位分割部が分割したゲイン調整単位に基づいて、前記出力音声生成部が出力する音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記ゲイン更新部に、ゲインの更新を指示する調整タイミング制御部と、
前記ゲイン更新部は、前記ゲインの更新を指示されたときに、前記アンプにおいて行う音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更することを特徴とする音声生成装置。 - 音声信号を生成し出力する音声生成装置であって、
指定された文を表す音声信号を生成して出力する出力音声生成部と、
前記出力音声生成部が出力した音声信号を増幅するアンプと、
前記アンプが増幅した音声信号を出力するスピーカと、
ゲイン更新部と、
前記出力音声生成部の前記文を表す音声信号の生成に先だって、読点をゲイン調整単位の区切りとして、当該文を前記ゲイン調整単位に分割するゲイン調整単位分割部と、
前記ゲイン調整単位分割部が分割したゲイン調整単位に基づいて、前記出力音声生成部が出力する音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記ゲイン更新部に、ゲインの更新を指示する調整タイミング制御部と、
前記ゲイン更新部は、前記ゲインの更新を指示されたときに、前記アンプにおいて行う音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更することを特徴とする音声生成装置。 - 音声信号を生成し出力する音声生成装置であって、
指定された文を表す音声信号を生成して出力する出力音声生成部と、
前記出力音声生成部が出力した音声信号を増幅するアンプと、
前記アンプが増幅した音声信号を出力するスピーカと、
ゲイン更新部と、
前記出力音声生成部の前記文を表す音声信号の生成に先だって、ゲイン調整単位の区切りが読点となり、かつ、前記各ゲイン調整単位が所定文字数以上の文字列となるように、当該文を前記ゲイン調整単位に分割するゲイン調整単位分割部と、
前記ゲイン調整単位分割部が分割したゲイン調整単位に基づいて、前記出力音声生成部が出力する音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記ゲイン更新部に、ゲインの更新を指示する調整タイミング制御部と、
前記ゲイン更新部は、前記ゲインの更新を指示されたときに、前記アンプにおいて行う音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更することを特徴とする音声生成装置。 - 請求項1、2、3または4記載の音声生成装置であって、
前記出力音声生成部は、前記ゲイン調整単位分割部が分割したゲイン調整単位毎に、順次、当該ゲイン調整単位を表す音声信号を生成して出力する処理を行い、
前記調整タイミング制御部は、前記出力音声生成部が、前記ゲイン調整単位を表す音声信号を生成して出力する処理を完了する度に、前記ゲイン更新部に、前記ゲインの変更を指示することを特徴とする音声生成装置。 - 請求項1、2、3または4記載の音声生成装置であって、
前記調整タイミング制御部は、
前記ゲイン調整単位分割部が分割した各ゲイン調整単位の文字数に応じて求まる前記ゲイン調整単位分割部が分割した各ゲイン調整単位の区切りまでの文字数に前記出力音声生成部の一文字あたりの標準的な音声出力期間を乗じた値、
または、
前記ゲイン調整単位分割部が分割した各ゲイン調整単位のモーラ数に応じて求まる前記ゲイン調整単位分割部が分割した各ゲイン調整単位の区切りまでのモーラ数に前記出力音声生成部の1モーラあたりの標準的な音声出力期間を乗じた値を、
前記出力音声生成部が出力する音声信号が、各ゲイン調整単位の区切りに対応するものとなるまでに要する時間長の目安として、前記出力音声生成部が出力する音声信号が表すゲイン調整単位が切り替わる可能性のある期間を推定し、推定した期間内に、前記出力音声生成部が生成した音声信号が無音を表すものとなったときに、前記ゲイン更新部に、前記ゲインの変更を指示することを特徴とする音声生成装置。 - 請求項1、2、3、4、5または6記載の音声生成装置であって、
前記ゲイン更新部は、前記ゲインを、前記直前の期間中の周囲騒音の大きさと前記出力音声生成部が生成して出力する音声信号の大きさとに応じた値に変更することを特徴とする音声生成装置。 - 請求項1、2、3、4、5または6記載の音声生成装置であって、
前記アンプは、前記出力音声生成部が生成して出力する音声信号を周波数帯域毎に増幅し、
前記ゲイン更新部は、前記アンプにおいて行う各周波数帯域の音声信号のゲインの各々を、直前の期間中の周囲騒音の各周波数帯域毎の大きさに応じて変更することを特徴とする音声生成装置。 - 請求項1、2、3、4、5または6記載の音声生成装置であって、
周囲騒音のパワーを算出する周囲騒音パワー算出部を備え、
前記ゲイン更新部は、前記ゲインの変更を行う際に、前記ゲインを、当該時点において前記周囲騒音パワー算出部が算出している直前の期間中の前記周囲騒音のパワーの大きさに応じた値に変更することを特徴とする音声生成装置。 - 請求項1、2、3、4、5または6記載の音声生成装置であって、
周囲騒音のパワーを算出する周囲騒音パワー算出部を備え、
前記ゲイン更新部は、前記ゲインの変更を行う際に、前記ゲインを、直前に前記ゲイン調整単位を表す音声信号を出力した期間中に、前記周囲騒音パワー算出部が算出したパワーの大きさの平均値に応じた値に変更することを特徴とする音声生成装置。 - 請求項1、2、3、4、5、6、7、8、9または10記載の音声生成装置と、当該音声生成装置に、経路を案内する文を指定して、当該文を表す音声を出力させる経路案内部とを備えたことを特徴とするカーナビゲーション装置。
- 指定された文章を表す音声信号を生成し、生成した音声信号を増幅し、増幅した音声信号をスピーカから出力する音声生成装置において、前記音声信号の増幅のゲインを調整する出力ゲイン調整方法であって、
前記音声生成装置が、前記文章を表す音声信号の生成に先だって、文をゲイン調整単位として、当該文章を前記ゲイン調整単位に分割するゲイン調整単位分割ステップと、
前記音声生成装置が、前記ゲイン調整単位分割ステップで分割したゲイン調整単位に基づいて、前記出力音声生成部が生成した音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更するゲイン更新ステップとを有することを特徴とする出力ゲイン調整方法。 - 指定された文を表す音声信号を生成し、生成した音声信号を増幅し、増幅した音声信号をスピーカから出力する音声生成装置において、前記音声信号の増幅のゲインを調整する出力ゲイン調整方法であって、
前記音声生成装置が、前記文を表す音声信号の生成に先だって、文節をゲイン調整単位として、当該文を前記ゲイン調整単位に分割するゲイン調整単位分割ステップと、
前記音声生成装置が、前記ゲイン調整単位分割ステップで分割したゲイン調整単位に基づいて、前記出力音声生成部が生成した音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更するゲイン更新ステップとを有することを特徴とする出力ゲイン調整方法。 - 指定された文を表す音声信号を生成し、生成した音声信号を増幅し、増幅した音声信号をスピーカから出力する音声生成装置において、前記音声信号の増幅のゲインを調整する出力ゲイン調整方法であって、
前記音声生成装置が、前記文を表す音声信号の生成に先だって、読点をゲイン調整単位の区切りとして、当該文を前記ゲイン調整単位に分割するゲイン調整単位分割ステップと、
前記音声生成装置が、前記ゲイン調整単位分割ステップで分割したゲイン調整単位に基づいて、前記出力音声生成部が生成した音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更するゲイン更新ステップとを有することを特徴とする出力ゲイン調整方法。 - 指定された文を表す音声信号を生成し、生成した音声信号を増幅し、増幅した音声信号をスピーカから出力する音声生成装置において、前記音声信号の増幅のゲインを調整する出力ゲイン調整方法であって、
前記音声生成装置が、前記文を表す音声信号の生成に先だって、ゲイン調整単位の区切りが読点となり、かつ、前記各ゲイン調整単位が所定文字数以上の文字列となるように、当該文を前記ゲイン調整単位に分割するゲイン調整単位分割ステップと、
前記音声生成装置が、前記ゲイン調整単位分割ステップで分割したゲイン調整単位に基づいて、前記出力音声生成部が生成した音声信号が表すゲイン調整単位が切り替わる各タイミングにおいて、前記音声信号の増幅のゲインを、直前の期間中の周囲騒音の大きさに応じた値に変更するゲイン更新ステップとを有することを特徴とする出力ゲイン調整方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006299101A JP4953767B2 (ja) | 2006-11-02 | 2006-11-02 | 音声生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006299101A JP4953767B2 (ja) | 2006-11-02 | 2006-11-02 | 音声生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008116643A JP2008116643A (ja) | 2008-05-22 |
JP4953767B2 true JP4953767B2 (ja) | 2012-06-13 |
Family
ID=39502630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006299101A Expired - Fee Related JP4953767B2 (ja) | 2006-11-02 | 2006-11-02 | 音声生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4953767B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5339849B2 (ja) * | 2008-10-27 | 2013-11-13 | アルパイン株式会社 | 音声明瞭度改善方法および音声明瞭度改善システム |
JP6120206B2 (ja) * | 2012-10-11 | 2017-04-26 | 公立大学法人岩手県立大学 | 音響コードの符号化・復号化装置および音響コードの符号化・復号化方法 |
JP6507867B2 (ja) * | 2015-06-10 | 2019-05-08 | 富士通株式会社 | 音声生成装置、音声生成方法、及びプログラム |
KR20180124564A (ko) * | 2017-05-12 | 2018-11-21 | 네이버 주식회사 | 수신된 음성 입력의 입력 음량에 기반하여 출력될 소리의 출력 음량을 조절하는 사용자 명령 처리 방법 및 시스템 |
KR20230140955A (ko) * | 2022-03-30 | 2023-10-10 | 삼성전자주식회사 | 음성 안내 기능을 갖는 전자 장치 및 전자 장치에 의한 음성 안내 방법 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08317497A (ja) * | 1995-05-17 | 1996-11-29 | Kiyoshi Kawachi | 音声案内装置 |
JPH0968997A (ja) * | 1995-08-30 | 1997-03-11 | Sony Corp | 音声処理方法及び装置 |
JP3009642B2 (ja) * | 1997-10-22 | 2000-02-14 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 音声言語処理単位変換装置 |
JPH11166835A (ja) * | 1997-12-03 | 1999-06-22 | Alpine Electron Inc | ナビゲーション音声補正装置 |
JP4042435B2 (ja) * | 2002-03-07 | 2008-02-06 | 富士通株式会社 | 音声自動質問応答装置 |
JP4583781B2 (ja) * | 2003-06-12 | 2010-11-17 | アルパイン株式会社 | 音声補正装置 |
JP4729902B2 (ja) * | 2003-12-12 | 2011-07-20 | 株式会社豊田中央研究所 | 音声対話システム |
-
2006
- 2006-11-02 JP JP2006299101A patent/JP4953767B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008116643A (ja) | 2008-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5029167B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP4973337B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
US20180130462A1 (en) | Voice interaction method and voice interaction device | |
US10176797B2 (en) | Voice synthesis method, voice synthesis device, medium for storing voice synthesis program | |
JP5029168B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP4953767B2 (ja) | 音声生成装置 | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP2019008120A (ja) | 声質変換システム、声質変換方法、及び声質変換プログラム | |
JPH0632020B2 (ja) | 音声合成方法および装置 | |
JP4744338B2 (ja) | 合成音声生成装置 | |
US6832192B2 (en) | Speech synthesizing method and apparatus | |
JP6314879B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP5518621B2 (ja) | 音声合成装置およびコンピュータプログラム | |
JP4979336B2 (ja) | 音声出力装置 | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
JP2007298621A (ja) | 音声データ時間長調整装置およびそのプログラム | |
JP2000310995A (ja) | 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機 | |
JP4313724B2 (ja) | 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体 | |
JP4260071B2 (ja) | 音声合成方法、音声合成プログラム及び音声合成装置 | |
JP2010224392A (ja) | 発話補助装置、方法及びプログラム | |
JP2936773B2 (ja) | 継続時間長決定方法 | |
JP2005037423A (ja) | 音声出力装置 | |
JPH056191A (ja) | 音声合成装置 | |
JPH1011083A (ja) | テキスト音声変換装置 | |
Pan et al. | Improving Speech Synthesis for High Intelligibility under Adverse Conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4953767 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |