JP2005070430A - 音声出力装置および方法 - Google Patents

音声出力装置および方法 Download PDF

Info

Publication number
JP2005070430A
JP2005070430A JP2003300071A JP2003300071A JP2005070430A JP 2005070430 A JP2005070430 A JP 2005070430A JP 2003300071 A JP2003300071 A JP 2003300071A JP 2003300071 A JP2003300071 A JP 2003300071A JP 2005070430 A JP2005070430 A JP 2005070430A
Authority
JP
Japan
Prior art keywords
word
sound pressure
familiarity
voice
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003300071A
Other languages
English (en)
Inventor
Toru Marumoto
徹 丸本
Nozomi Saito
望 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2003300071A priority Critical patent/JP2005070430A/ja
Priority to US10/925,874 priority patent/US20050080626A1/en
Publication of JP2005070430A publication Critical patent/JP2005070430A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)

Abstract

【課題】 出力される単語の内容にかかわらず、了解度の高い(聞こえやすい)音声を出力できる音声出力装置および方法を提供する。
【解決手段】 各単語または単語列に対してどの程度なじみがあるかを表した親密度情報を記録した音声DB1と、再生部2により音声DB1から音声データと共に読み出される親密度情報に基づいて、単語または単語列の単位で音圧レベルを調整する音圧調整部3とを設け、親密度が低い単語等については音圧を大きく補正するようにすることにより、例えば聞きなれない土地名など単語親密度が低い内容の音声を出力する場合であっても、親密度が高い単語に比べて大きな音圧で出力されるようにして、親密度が低い単語も聞き取りやすくなるようにする。
【選択図】 図1

Description

本発明は音声出力装置および方法に関し、特に、車室内において車載機から出力される音声がユーザに聞き取りやすくなるように音声の補正を行う装置および方法に用いて好適なものである。
近年、ナビゲーション装置のガイド音声はもとより、ハンズフリー装置による通話相手の音声、情報通信装置で受信したWeb情報や電子メールの内容読み上げ音声など、車室内における音声出力の需要がますます高まっている。この音声出力の方式としては、DVD(Digital Versatile Disk)やハードディスク等のメディアにあらかじめ収録された音声を再生する録音再生方式と、与えられた文字情報をもとに音声波形を構築して再生するTTS(Text-to-Speech)方式とがある。
後者のTTS方式に基づく音声出力装置は、大きく分けて、与えられた文字情報に対して、テキスト解析用の辞書データによって読みやアクセントを付加する言語処理部と、波形/音素片の辞書データによって音声を生成する音声合成部との2つの処理部から構成されている。
ところで従来、音声出力に関して、ラウドネス補償に基づく音声明瞭度改善システムが提供されている。このシステムは、マイクより入力された周囲の騒音等のレベルに応じて出力音声の音圧レベルを適切に調整することにより、騒音の中でも出力音声がより明瞭に聞こえるようすることを可能にしたものである(例えば、特許文献1参照)。
特開平11−166835号公報
この明瞭度改善システムに代表される従来の音声補正装置は、騒音のレベルや車速信号といった周辺騒音環境に基づく物理量をもとに音声の音圧を補正するものである。ただ、これらの物理量をもとに出力音声が明瞭となるように補正しても、それを聞き取るのは人間であるため、全ての単語や文章が同程度に了解できる訳ではない。というのは、同じ音圧レベルの単語であっても、その単語の親密度(なじみ度合い)によって了解度が変わってしまうためである。
図5は、単語親密度と単語了解度と音圧との関係を示した試験結果の特性図である。この特性図は、音圧レベルを変えたときにどのように単語了解度が変化するのかを示すと同時に、聴取する単語の親密度によって単語了解度がどのように変化するのかを示したものである。この特性図から明らかなように、同じ音圧レベルであっても、親密度が高い単語ほど了解度も高くなり、親密度が低い単語ほど了解度も低くなっている。
このように、物理量をもとに出力音声の音圧レベルを補正しても、出力音声の内容に応じて聞こえやすさは異なってしまう。そのため、例えばナビゲーション装置の走行案内時においても、見知らぬ地名であればあるほど聞き取りづらくなってしまうという問題があった。
なお、単語の親密度を考慮した情報処理装置として、親密度の高い順に変換候補の漢字を並べて表示するようにしたかな漢字変換装置が存在する(例えば、特許文献2参照)。また、入力されたパターン列に対して同一の概念を表現する単語が複数存在する場合に、より親密度の高い単語を探索して認識結果として出力するパターン認識装置も存在する(例えば、特許文献3参照)。
特開2001−216295号公報 特開2002−162991号公報
本発明は、上述のような問題を解決するために成されたものであり、出力される単語の内容にかかわらず、了解度の高い(聞こえやすい)音声を提供できるようにすることを目的とする。
上記した課題を解決するために、本発明の音声出力装置では、複数の単語または単語列に対してどの程度なじみがあるかを表した親密度に関する情報を用意しておき、当該親密度情報に基づいて、出力対象の音声に対して単語または単語列の単位で音圧レベルを調整するようにしている。
上記のように構成した本発明によれば、例えば聞きなれない土地名など単語親密度が低い内容の音声を出力する場合であっても、親密度が高い単語に比べて大きな音圧で出力されることにより、単語の了解度を高くすることができる。これにより、出力される音声が親密度の低い単語または単語列で構成されている場合や、出力される音声中に親密度の高い単語や親密度の低い単語が混在しているような場合でも、常に了解度の高い音声を提供することができるようになる。
(第1の実施形態)
以下、本発明による第1の実施形態を図面に基づいて説明する。第1の実施形態は、本発明を録音再生方式の音声出力装置に適用したものである。図1は、第1の実施形態に係る音声出力装置の要部構成例を示す図である。図1に示すように、本実施形態の音声出力装置は、音声データベース(DB)1、再生部2、音圧調整部3およびボリューム4を備えて構成されている。
音声DB1は、波形符号化された音声データがDVDやハードディスク等のメディアに記録されて構成されている。この音声DB1には、出力対象となる音声データが、単語または単語列の単位で録音されている。単語列とは、同時に使用される可能性が高い複数の単語を組み合わせたものや、複数の単語により構成される熟語あるいは簡単な文章などを言う。以下では、「単語または単語列」をまとめて「単語等」と言うことにする。
例えば、本実施形態の音声出力装置をナビゲーション装置に適用する場合、「この先○○方面、渋滞です。」といった一連のガイド音声を、|この先|○○|方面|渋滞|です|のように単語等に区切って、それぞれを別個の音声パターンとして記録する。なお、一連のガイド音声を再生するときは、分割して記録されている複数の音声パターンを順次読み出して出力する。
この音声DB1には更に、単語等の単位で記録された個々の音声パターンに対して、どの程度なじみがあるかを表した親密度に関する情報が付加して記録されている。この親密度情報は、単語等の単位で、単語親密度がいくつであるかを数値(例えば、1.0〜7.0)として表したものである。このように音声DB1は、本発明の親密度情報記憶手段を構成する。
再生部2は、音声DB1から音声データおよび親密度情報を再生するものである。この再生部2が音声DB1から複数の音声パターンを任意に選択して読み出す(発話させたい内容に対応する音声パターンが記録されているデータ位置のタグを選択して読み出す)ことにより、任意内容のガイド音声を再生することが可能である。このとき、読み出した複数の音声パターンに対応して記憶されている親密度情報も読み出す。
音圧調整部3は、再生部2により音声DB1から読み出された親密度情報に基づいてボリューム4を制御することにより、同じく再生部2により音声DB1から読み出された各音声パターン(各単語等)の音圧レベルを調整する。具体的には、親密度が低い音声パターンほどボリューム値を大きくするように補正する。
例えば、「この先○○方面、渋滞です。」といったガイド音声を出力する場合において、地名を表す○○の部分が「郡山(こおりやま)」のように親密度が高い単語の場合は、ボリューム値の調整は行わない。一方、地名を表す○○の部分が「差塩(さいそ)」や「百槻(どうづき)」のように親密度が低い単語の場合は、ボリューム値を上げるような調整を行う。
どの程度ボリューム値を大きくするかは、単語親密度の値によって異ならせるのが好ましい。例えば、図5の特性図において、単語了解度80%を実現することを想定した場合、元々の音圧レベルが約20dBであるとすると、単語親密度が7.0〜5.5の音声パターンについては音圧レベルの調整が不要である。これに対して、単語親密度が5.5〜4.0の音声パターンは音圧レベルを約5dB大きくする。また、単語親密度が4.0〜2.5の音声パターンは音圧レベルを約15dB大きくし、単語親密度が2.5〜1.0の音声パターンは音圧レベルを約20dB大きくする。
以上詳しく説明したように、第1の実施形態によれば、出力対象の各単語等が録音された音声DB1に対して、単語等の単位で親密度情報を付加して記憶しておき、音声と共に読み出される親密度情報に基づいて、出力対象の各単語等の音圧レベルを適宜調整するようにしたので、普段聞きなれない内容の音声を出力する場合であっても、了解度の高い(聞き取りやすい)音声を提供することができる。よって、例えば本実施形態の音声出力装置を適用したナビゲーション装置を不慣れな土地で使用していても、ガイド音声は常に聞こえやすくなる。
なお、上記第1の実施形態では、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等の音圧レベルを大きく補正する例について説明したが、本発明はこれに限定されない。例えば、単語親密度が最も低い単語等を基準の音圧レベルとし、これより単語親密度が高い単語等の音圧レベルを小さく補正するようにしても良い。また、単語親密度が中程度の単語等を基準の音圧レベルとし、基準より単語親密度が高い単語等の音圧レベルを小さく補正し、基準より単語親密度が低い単語等の音圧レベルを大きく補正することによって全ての単語等の了解度が同等程度となるようにしても良い。
また、上記第1の実施形態では、単語親密度に応じて音圧レベルを調整することによって全ての単語等の了解度が同等程度となるようにする例について説明したが、本発明はこれに限定されない。例えば、音圧調整によって単語了解度が所定値よりも大きくなるようにすれば良く、必ずしも全ての単語等の了解度が同等程度となるようにする必要はない。
また、上記第1の実施形態では、親密度情報に基づいて音声の音圧レベルを調整する例について説明したが、これに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を2回以上繰り返して再生するようにしても良い。例えば、「この先差塩方面、渋滞です。」といったガイド音声を出力する場合に、音圧調整部3が「差塩」の部分で音圧レベルを上げるように調整するとともに、「この先差塩方面、渋滞です。差塩方面です。」ように単語親密度が低い単語等を2回繰り返して再生するように制御する。この繰り返し再生の制御は、再生部2において行うことが可能である。このように、馴染みの少ない単語等であっても繰り返し再生することにより、了解度を高めることができる。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、音声の再生速度を調整するようにしても良い。例えば、「この先差塩方面、渋滞です。」といったガイド音声を出力する場合に、音圧調整部3が「差塩」の部分で音圧レベルを上げるように調整するとともに、「差塩」の部分を他の部分より遅い速度で再生するように制御する。この再生速度の制御も、再生部2において行うことが可能である。このように、馴染みの少ない単語等であっても再生速度を遅くすることにより、了解度を高めることができる。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を画面上に表示するようにしても良い。この表示制御は、図示しない表示コントローラ(例えば、ナビゲーション装置の場合は、地図画像等を表示装置に表示するために通常備えられているもの)を用いて行うことが可能である。このように、馴染みの少ない単語等であっても、それを画面表示して視覚上でも確認できるようにすることにより、了解度を高めることができる。
(第2の実施形態)
次に、本発明による第2の実施形態を図面に基づいて説明する。第2の実施形態は、本発明をTTS方式の音声出力装置に適用したものである。図2は、第2の実施形態に係る音声出力装置の要部構成例を示す図である。図2に示すように、本実施形態の音声出力装置は、テキスト生成部11、TTSエンジン12、音圧調整部13およびボリューム14を備えて構成されている。
テキスト生成部11は、出力対象とする音声の内容を文字列で表したテキスト情報を生成するものである。このテキスト生成部11は、図示しないキーボードをユーザが操作することによって任意の文字列のテキスト情報を手動で生成するものであっても良いし、所定のルールに従ってコントローラが任意の文字列のテキスト情報を自動で生成するものであっても良い。
TTSエンジン12は、言語処理部15、テキスト解析用辞書16、音声合成部17および音素片辞書18を備えて構成されている。テキスト解析用辞書16は、各種の単語等から成るテキスト情報と、それらの単語等に対して付加する音韻情報および韻律情報とを対応付けて記憶したテキスト解析用の辞書データベースである。
このテキスト解析用辞書16には更に、単語等の単位で記録された個々のテキスト情報に対して、その単語等に関する親密度情報が付加して記録されている。この親密度情報は、それぞれの単語等ごとに、単語親密度がいくつであるかを数値(例えば、1.0〜7.0)として表したものである。このようにテキスト解析用辞書16は、本発明の親密度情報記憶手段を構成する。
言語処理部15は、テキスト生成部11より入力されるテキスト情報をもとにテキスト解析用辞書16を参照し、テキスト情報により示される単語等の文字列に対して該当する音韻情報や韻律情報を付加することにより、表音文字列の情報を生成する。このとき言語処理部15は、入力されたテキスト情報に対応して記憶されている親密度情報も読み出す。
音素片辞書18は、各種の単語等から成る文字列を単位として、それらの文字列に対して付加する波形情報を記憶した音素片の辞書データベースである。音声合成部17は、言語処理部15より出力された表音文字列の情報をもとに音素片辞書18を参照し、当該表音文字列を波形情報を用いて加工することにより、合成音声を生成する。
音圧調整部13は、言語処理部15によりテキスト解析用辞書16から抽出された親密度情報に基づいてボリューム14を制御することにより、音声合成部17により生成された合成音声の音圧レベルを単語等の単位で調整する。例えば、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等のボリューム値を大きくするように補正する。どの程度ボリューム値を大きくするかは、第1の実施形態と同様、単語親密度の値によって異ならせるのが好ましい。
以上詳しく説明したように、第2の実施形態によれば、与えられたテキスト情報をもとに音声波形を合成して再生するTTSエンジン12が備えるテキスト解析用辞書16に対して、単語等の単位で親密度情報を付加して記憶しておき、テキスト情報の解析の際に抽出される親密度情報に基づいて、出力対象の各単語等の音圧レベルを適宜調整するようにしたので、普段聞きなれない内容の音声を出力する場合であっても、了解度の高い(聞き取りやすい)音声を提供することができる。よって、例えば本実施形態の音声出力装置を適用したナビゲーション装置を不慣れな土地で使用していても、ガイド音声は常に聞こえやすくなる。
なお、上記第2の実施形態でも、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等の音圧レベルを大きく補正する例について説明したが、本発明はこれに限定されない。例えば、単語親密度が最も低い単語等を基準の音圧レベルとしても良いし、単語親密度が中程度の単語等を基準の音圧レベルとしても良い。
また、上記第2の実施形態でも、単語親密度に応じて音圧レベルを調整することによって全ての単語等の了解度が同等程度となるようにする必要は必ずしもなく、音圧調整によって単語了解度が所定値よりも大きくなるようにすれば良い。
また、上記第2の実施形態でも、親密度情報に基づいて音声の音圧レベルを調整する例について説明したが、これに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を2回以上繰り返して再生するようにしても良い。この繰り返し再生の制御は、例えば音声合成部17が同じ単語等を2回繰り返して合成することによって行うことが可能である。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、音声の再生速度を調整するようにしても良い。この再生速度の制御は、例えば音声合成部17から合成音声を出力する際の出力タイミングを可変とすることによって行うことが可能である。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を画面上に表示するようにしても良い。この表示制御は、図示しない表示コントローラ(例えば、ナビゲーション装置の場合は、地図画像等を表示装置に表示するために通常備えられているもの)を用いて行うことが可能である。
(第3の実施形態)
次に、本発明による第3の実施形態を図面に基づいて説明する。第3の実施形態は、ラウドネス補償技術を用いた音声明瞭度改善システムに本発明を適用したものである。図3は、第3の実施形態に係る音声明瞭度改善システムの要部構成例を示す図である。
図3に示すように、本実施形態の音声明瞭度改善システムは、音声DB21、再生部22、ボリューム又はイコライザ(以下、単にボリューム等と記す)23、音圧調整部24、ゲイン制御部25、適応フィルタ(ADF)26、スピーカ27、マイク28および減算器29を備えて構成されている。
音声DB21は、波形符号化された音声データがDVDやハードディスク等のメディアに記録されて構成されている。この音声DB21には、出力対象となる音声データが、単語等の単位で録音されている。例えば、本実施形態の音声明瞭度改善システムをナビゲーション装置に適用する場合、「この先○○方面、渋滞です。」といった一連のナビ音声を、|この先|○○|方面|渋滞|です|のように単語等に区切って、それぞれを別個の音声パターンとして記録する。
この音声DB21には更に、単語等の単位で記録された個々の音声パターンに対して親密度情報が付加して記録されている。この親密度情報は、単語等の単位で、単語親密度がいくつであるかを数値(例えば、1.0〜7.0)として表したものである。このように音声DB21は、本発明の親密度情報記憶手段を構成する。
再生部22は、音声DB21から音声データおよび親密度情報を再生するものである。この再生部22が音声DB21から複数の音声パターンを任意に選択して読み出す(発話させたい内容に対応する音声パターンが記録されているデータ位置のタグを選択して読み出す)ことにより、任意内容のナビ音声を再生することが可能である。このとき、読み出した複数の音声パターンに対応して記憶されている親密度情報も読み出す。
ボリューム等23は、再生部22により再生されたナビ音声の音量を制御する。スピーカ27は、ボリューム等23で音圧が補正されたナビ音声を出力する。マイク28は、発話音声入力用のものであるが、実際には、発声された音声コマンドだけでなく、スピーカ27から出力されるナビ音声、図示しない他のスピーカから出力されるオーディオ音、走行ノイズなど(以下、オーディオ音と走行ノイズとを合わせて「周辺ノイズ」と言う)も全て同じマイク28に入力される。
適応フィルタ26は、係数同定部および音声補正フィルタを含んで構成されている。係数同定部は、スピーカ27からマイク28の間における音響系の伝達関数(音声補正フィルタのフィルタ係数)を同定するためのフィルタであり、LMS(Least Mean Square )アルゴリズムやN−LMS(Normalized-LMS)アルゴリズムによる適応フィルタが用いられている。この係数同定部は、減算器29から出力される誤差信号(後述する)のパワーが最小となるように動作して音響系のインパルス応答を同定する。
音声補正フィルタは、係数同定部により決定されたフィルタ係数と、制御対象となる音圧補正済みのナビ音声とを用いて畳み込み演算することにより、当該音声補正済みのナビ音声に対して上述の音響系と同一の伝達特性を与える。これにより、マイク28の位置におけるナビ音声を模擬したナビ模擬音声を生成する。
減算器29は、マイク28より入力された音声(ナビ音声と周辺ノイズとが混在した音声)から、適応フィルタ26により生成されたナビ模擬音声を減算することにより、周辺ノイズを抽出する。この減算器29により抽出された周辺ノイズは、誤差信号として適応フィルタ26の係数同定部およびゲイン制御部25にフィードバックされる。
ゲイン制御部25は、適応フィルタ26から出力されるナビ模擬音声と、減算器29から出力される周辺ノイズとに基づいて、再生部22により再生される制御対象のナビ音声に対して加える最適のゲインを算出し、この算出したゲイン値を音圧調整部24に出力する。ここでは、周辺ノイズ(誤差信号)をナビ音声に対するノイズとみなして、スピーカ27から出力されるナビ音声がユーザに明瞭に聞こえるように、当該ナビ音声のゲイン調整を行う。このようにゲイン制御部25は、本発明のゲイン算出手段を構成する。
音圧調整部24は、ゲイン制御部25により算出された補正ゲインに基づいてボリューム等23を制御し、出力対象となるナビ音声の音圧レベルを全体として調整するとともに、再生部22により音声DB21から読み出された親密度情報に基づいてボリューム等23を制御し、出力対象となるナビ音声の音圧レベルを単語等の単位で調整する。例えば、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等のボリューム値を大きくするように補正する。
例えば、「この先○○方面、渋滞です。」といったナビ音声を出力する場合において、周囲音があってもこのナビ音声が明瞭に聞こえるように、一連のナビ音声に対して全体としてボリューム値を調整する。さらに、地名を表す○○の部分が「差塩(さいそ)」や「百槻(どうづき)」のように単語親密度が低い単語の場合は、その単語区間では更に補償量を加えるようにボリューム値を調整する。単語等の単位でどの程度ボリューム値を大きくするかは、第1の実施形態と同様に、単語親密度の値によって異ならせるのが好ましい。
以上詳しく説明したように、第3の実施形態によれば、ラウドネス補償型音声明瞭度改善システムにおいて、単語親密度情報に基づいて単語等の単位で音声補償量を適宜調整するようにしたので、出力対象の音声が周囲音によらず明瞭に聞こえるようにするとともに、普段聞きなれない内容の音声を出力する場合であっても、それを聞き取りやすくすることができる。よって、例えばこの音声明瞭度改善システムを適用したナビゲーション装置を不慣れな土地で使用していても、ガイド音声は常に聞こえやすくなる。
なお、上記第3の実施形態でも、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等の音圧レベルを大きく補正する例について説明したが、本発明はこれに限定されない。例えば、単語親密度が最も低い単語等を基準の音圧レベルとしても良いし、単語親密度が中程度の単語等を基準の音圧レベルとしても良い。
また、上記第3の実施形態でも、単語親密度に応じて音圧レベルを調整することによって全ての単語等の了解度が同等程度となるようにする必要は必ずしもなく、音圧調整によって単語了解度が所定値よりも大きくなるようにすれば良い。
また、上記第3の実施形態でも、親密度情報に基づいて音声の音圧レベルを調整する例について説明したが、これに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を2回以上繰り返して再生するようにしても良い。この繰り返し再生の制御は、再生部22によって行うことが可能である。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、音声の再生速度を調整するようにしても良い。この再生速度の制御も、再生部22によって行うことが可能である。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を画面上に表示するようにしても良い。この表示制御は、図示しない表示コントローラ(例えば、ナビゲーション装置の場合は、地図画像等を表示装置に表示するために通常備えられているもの)を用いて行うことが可能である。
(第4の実施形態)
次に、本発明による第4の実施形態を図面に基づいて説明する。第4の実施形態は、音声通話システム(例えば、ハンズフリーシステム)に本発明を適用したものである。図4は、第4の実施形態に係る音声通話システムの要部構成例を示す図である。
図4に示すように、本実施形態の音声通話システムは、音響モデルDB31、言語モデルDB32、第1の連続認識部33、第1の音圧調整部34、第1のボリューム35、スピーカ36、マイク37、第2の連続認識部38、第2の音圧調整部39および第2のボリューム40を備えて構成されている。
音響モデルDB31は、認識対象となる各単語等の文字列とその音声パターンの特徴量とを対応付けて記憶した音声辞書データベースである。言語モデルDB32は、認識された音声パターンの構文を解析するために必要な情報を記憶した構文解析用辞書データベースである。この言語モデルDB32には更に、各種単語等の文字列を表すテキスト情報とそれらの親密度との関係を示す情報が付加して記憶されている。このように言語モデルDB32は、本発明の親密度情報記憶手段を構成する。
第1の連続認識部33は、受話音声から特徴量を算出し、その算出した特徴量と、音響モデルDB31にあらかじめ格納されている各単語等の特徴量とを比較して類似度が最も高い音声パターンを検索し、その音声パターンを有する文字列を受話音声の文字列であると認識する。そして、入力された受話音声を、当該認識した文字列のテキスト情報に変換する。このように第1の連続認識部33は、本発明の第1の音声認識手段を構成する。
この第1の連続認識部33は、変換したテキスト情報をもとに言語モデルDB32を参照し、当該テキスト情報に対応して記憶されている親密度情報を読み出して第1の音圧調整部34に供給する処理も行う。第1の音圧調整部34は、第1の連続認識部33から供給される親密度情報に基づいて第1のボリューム35を制御することにより、受話音声の音圧レベルを単語等の単位で調整する。例えば、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等のボリューム値を大きくするように補正する。このように音圧が補正された受話音声は、スピーカ36から出力される。
第2の連続認識部38は、マイク37より入力された送話音声から特徴量を算出し、その算出した特徴量と、音響モデルDB31にあらかじめ格納されている各単語等の特徴量とを比較して類似度が最も高い音声パターンを検索し、その音声パターンを有する文字列を送話音声の文字列であると認識する。そして、入力された送話音声を、当該認識した文字列のテキスト情報に変換する。このように第2の連続認識部38は、本発明の第2の音声認識手段を構成する。
この第2の連続認識部38は、変換したテキスト情報をもとに言語モデルDB32を参照し、当該テキスト情報に対応して記憶されている親密度情報を読み出して第2の音圧調整部39に供給する処理も行う。第2の音圧調整部39は、第2の連続認識部38から供給される親密度情報に基づいて第2のボリューム40を制御することにより、送話音声の音圧レベルを単語等の単位で調整する。例えば、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等のボリューム値を大きくするように補正する。このように音圧が補正された送話音声は、通話相手に送信される。
この図4の例では、受話側と送話側との双方に連続認識部および音圧調整部を設けている。これにより、相手側の音声通信システムに図4と同様の構成が備えられていなくても、送受信とも発話内容に応じて適宜調整した音圧による通話音声を提供することができる。なお、本発明においては連続認識部と音圧調整部とを必ずしも受話側と送話側との双方に設ける必要はなく、どちらか一方のみでも良い。
また、受話側と送話側との双方に連続認識部および音圧調整部を設けた場合、相手側も同様の構成を備えていると、自分の送話側で音圧調整された音声が相手の受話側でも更に音圧調整されることになり、音圧が必要以上に調整されてしまうことになる。そこで、通話を開始する前(最初のコール時)に、所定の通信を行うことによって、通話相手が音圧調整部を備えているか否かを確認する。そして、通話相手が音圧調整部を備えている場合には、第1の音圧調整部34および第2の音圧調整部39の少なくとも一方の機能を休止させるように制御することが可能である。
例えば、最初に電話をかけるときに、発呼側の音声通信システムから着呼側の音声通信システムに問い合わせ信号を送信し、着呼側が音圧調整部を備えているか否かを問い合わせる。着呼側システムは、この問い合わせに応答して音圧調整部の有無を発呼側システムに返信する。発呼側システムは、音圧調整部が有るとの返答を受けたときに、発呼側システムにおける第1の音圧調整部34の機能を休止させるように制御する。また、着呼側システムにおける第1の音圧調整部34の機能を休止させることを指示する信号を着呼側システムに送信し、着呼側システムにおける第1の音圧調整部34の機能も休止させるように制御する。
なお、発呼側システムが着呼側システムから音圧調整部が有るとの返答を受けたときに、発呼側システムにおける第2の音圧調整部39と着呼側システムにおける第2の音圧調整部39との機能を休止させるように制御しても良い。あるいは、発呼側システムにおける第1の音圧調整部34と第2の音圧調整部39の機能を休止させるように制御し、着呼側システムの機能は休止させないようにしても良い。さらに、発呼側および着呼側のシステムにおいて双方とも音圧調整部34,39の機能は休止させず、音圧の増減幅を通常の半分程度となるように制御しても良い。
以上詳しく説明したように、第4の実施形態によれば、音声通信システムにおいて、通話音声を認識および構文解析し、その解析結果を用いて単語親密度情報に基づいて単語等の単位で音圧を適宜調整するようにしたので、通話中において馴染みのない発話内容があっても、音圧補正によってそれを聞き取りやすくすることができる。よって、常に快適な通話を行うことができる。
なお、上記第4の実施形態でも、単語親密度が最も高い単語等を基準の音圧レベルとし、これより単語親密度が低い単語等の音圧レベルを大きく補正する例について説明したが、本発明はこれに限定されない。例えば、単語親密度が最も低い単語等を基準の音圧レベルとしても良いし、単語親密度が中程度の単語等を基準の音圧レベルとしても良い。
また、上記第4の実施形態に関しても、音圧調整によって単語了解度が所定値よりも大きくなるようにすれば良く、必ずしも全ての単語等の了解度が同等程度となるようにする必要はない。
また、上記第4の実施形態でも、親密度情報に基づいて音声の音圧レベルを調整する例について説明したが、これに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を2回以上繰り返して再生するようにしても良い。この繰り返し再生の制御は、例えば次のようにして行うことが可能である。すなわち、受話音声や送話音声をデジタル化して一旦バッファメモリに蓄積し、バッファメモリからの読み出しを2回以上繰り返し行い、読み出された音声を再度アナログ信号に戻すようにする。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、単語親密度に応じて音声の再生速度を調整するようにしても良い。この再生速度の制御も、例えば次のようにして行うことが可能である。すなわち、受話音声や送話音声をデジタル化して一旦バッファメモリに蓄積し、バッファメモリからの読み出しタイミングを単語親密度に応じて可変とする。
また、親密度情報に基づいて音声の音圧レベルを調整することに加えて、またはこれに代えて、単語親密度が所定値より低い単語等を画面上に表示するようにしても良い。この表示制御は、図示しない表示コントローラ(例えば、電話番号等を表示装置に表示するために通常備えられているもの)を用いて行うことが可能である。
以上に説明した第1〜第4の実施形態による音圧調整の手法は、ハードウェア構成、DSP、ソフトウェアの何れによっても実現することが可能である。例えばソフトウェアによって実現する場合、本実施形態の音声出力装置は、実際にはコンピュータのCPUあるいはMPU、RAM、ROMなどを備えて構成され、RAMやROMに記憶されたプログラムが動作することによって実現できる。
したがって、コンピュータが上記各実施形態の機能を果たすように動作させるプログラムを例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものである。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光ディスク、光磁気ディスク、DVD、不揮発性メモリカード等を用いることができる。また、上記プログラムをインターネット等のネットワークを介してコンピュータにダウンロードすることによっても実現できる。
なお、上記第1〜第4の実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
本発明の音声出力装置および方法は、親密度に応じて単語等の単位で音圧を調整する装置あるいはシステムに広く適用することが可能であり、例えば上記実施形態で説明したナビゲーション装置や音声通話システムに有用である。また、インターネット等の情報ネットワーク上から受信したWeb情報や電子メールの内容を音声で読み上げる機能を有する情報通信装置にも有用である。さらに、会話や単語等を読み上げる語学学習システムにおいて、聞きなれない単語等や難易度の高い単語等、発音が難しい単語等の音圧を調整する場合にも有用である。
第1の実施形態に係る音声出力装置の要部構成例を示す図である。 第2の実施形態に係る音声出力装置の要部構成例を示す図である。 第3の実施形態に係る音声明瞭度改善システムの要部構成例を示す図である。 第4の実施形態に係る音声通話システムの要部構成例を示す図である。 単語親密度と単語了解度と音圧との関係を示した試験結果の特性図である。
符号の説明
1 音声DB
2 再生部
3 音圧調整部
4 ボリューム
11 テキスト生成部
12 TTSエンジン
13 音圧調整部
14 ボリューム
15 言語処理部
16 テキスト解析用辞書
17 音声合成部
18 音素片辞書
21 音声DB
22 再生部
23 ボリュームまたはイコライザ
24 音圧調整部
25 ゲイン制御部
26 適応フィルタ
27 スピーカ
28 マイク
29 減算器
31 音響モデルDB
32 言語モデルDB
33 第1の連続認識部
34 第1の音圧調整部
35 第1のボリューム
36 スピーカ
37 マイク
38 第2の連続認識部
39 第2の音圧調整部
40 第2のボリューム

Claims (20)

  1. 複数の単語または単語列に対してどの程度なじみがあるかを表した親密度に関する情報を記憶した親密度情報記憶手段と、
    上記親密度情報記憶手段に記憶されている親密度情報に基づいて、出力対象の各単語または単語列の音圧レベルを調整する音圧調整手段とを備えたことを特徴とする音声出力装置。
  2. 上記親密度情報記憶手段は、上記出力対象の各単語または単語列が録音された音声データベースに対して、単語または単語列の単位で上記親密度情報を付加して構成されたものであることを特徴とする請求項1に記載の音声出力装置。
  3. 上記親密度情報記憶手段は、与えられたテキスト情報をもとに音声波形を合成して再生する装置が備えるテキスト解析用の辞書データベースに対して、単語または単語列の単位で上記親密度情報を付加して構成されたものであることを特徴とする請求項1に記載の音声出力装置。
  4. 出力された音声の音圧レベルと、この出力音声の聴取位置において聴取可能な周囲音の音圧レベルとに基づいて、上記出力音声の補正ゲインを算出するゲイン算出手段を備え、
    上記音圧調整手段は、上記ゲイン算出手段により算出された補正ゲインに基づいて、出力対象となる音声の音圧レベルを調整するとともに、上記親密度情報記憶手段に記憶されている親密度情報に基づいて、上記出力対象となる音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項1に記載の音声出力装置。
  5. 入力された音声とあらかじめ用意されている音声辞書とを比較し、入力音声に係る単語または単語列を認識してテキスト情報に変換する音声認識手段を備え、
    上記親密度情報記憶手段は、複数の単語または単語列を表すテキスト情報と上記親密度との関係を示した情報を記憶して構成されたものであり、
    上記音圧調整手段は、上記音声認識手段により変換されたテキスト情報をもとに上記親密度情報記憶手段を参照して得られる上記親密度情報に基づいて、上記入力音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項1に記載の音声出力装置。
  6. 上記音声認識手段は、音声通話システムにおける受話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記受話音声に係る単語または単語列を認識してテキスト情報に変換することを特徴とする請求項5に記載の音声出力装置。
  7. 上記音声認識手段は、音声通話システムにおける送話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記送話音声に係る単語または単語列を認識してテキスト情報に変換することを特徴とする請求項5に記載の音声出力装置。
  8. 上記音声認識手段は、音声通話システムにおける受話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記受話音声に係る単語または単語列を認識してテキスト情報に変換する第1の音声認識手段と、上記音声通話システムにおける送話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記送話音声に係る単語または単語列を認識してテキスト情報に変換する第2の音声認識手段とを備え、
    上記音圧調整手段は、上記第1の音声認識手段により変換されたテキスト情報をもとに上記親密度情報記憶手段を参照して得られる上記親密度情報に基づいて、上記受話音声の音圧レベルを単語または単語列の単位で調整する第1の音圧調整手段と、上記第2の音声認識手段により変換されたテキスト情報をもとに上記親密度情報記憶手段を参照して得られる上記親密度情報に基づいて、上記送話音声の音圧レベルを単語または単語列の単位で調整する第2の音圧調整手段とを備えることを特徴とする請求項5に記載の音声出力装置。
  9. 上記音声通話システムにおいて通話を開始する前に、通話相手が上記音圧調整手段を備えているか否かを判定する判定手段と、
    上記判定手段により通話相手が上記音圧調整手段を備えていると判定されたときに、上記第1の音圧調整手段および上記第2の音圧調整手段の少なくとも一方の機能を休止させるように制御する制御手段とを備えたことを特徴とする請求項8に記載の音声出力装置。
  10. 上記親密度情報記憶手段に記憶されている親密度情報に基づいて、親密度が所定値より低い単語または単語列を2回以上繰り返して再生するように制御する再生制御手段を備えたことを特徴とする請求項1に記載の音声出力装置。
  11. 上記親密度情報記憶手段に記憶されている親密度情報に基づいて、上記出力対象の各単語または単語列の再生速度を調整する再生制御手段を備えたことを特徴とする請求項1に記載の音声出力装置。
  12. 上記親密度情報記憶手段に記憶されている親密度情報に基づいて、親密度が所定値より低い単語または単語列を画面上に表示するように制御する表示制御手段を備えたことを特徴とする請求項1に記載の音声出力装置。
  13. 複数の単語または単語列に対してどの程度なじみがあるかを表した親密度情報を音圧調整部が参照して、出力対象の各単語または単語列の音圧レベルを上記親密度情報に応じて調整するようにしたことを特徴とする音声出力方法。
  14. 上記出力対象の各単語または単語列が録音された音声データベースから音声を再生するときに、上記音声データベース上において単語または単語列の単位で記録されている上記親密度情報を上記音圧調整部が参照して、再生する音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。
  15. 与えられたテキスト情報をもとに音声波形を合成して再生するときに、テキスト解析用の辞書データベースにおいて単語または単語列の単位で記録されている上記親密度情報を上記音圧調整部が参照して、再生する音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。
  16. 外部より入力された音声を再生するときに、上記入力音声とあらかじめ用意されている音声辞書とを比較して上記入力音声に係る単語または単語列を音声認識部が認識し、当該認識された単語または単語列に対応する上記親密度情報を上記音圧調整部が参照して、再生する音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。
  17. 出力された音声の音圧レベルと、この出力音声の聴取位置において聴取可能な周囲音の音圧レベルとに基づいて補正ゲインを求め、当該補正ゲインに基づいて上記出力音声の音圧レベルを補正する音声明瞭度改善システムにおいて、
    上記音圧調整部が上記補正ゲインに基づいて上記出力音声の音圧レベルを調整するとともに、上記親密度情報に基づいて上記出力音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。
  18. 上記親密度情報に基づいて、親密度が所定値より低い単語または単語列を2回以上繰り返し再生して出力するようにしたことを特徴とする請求項13に記載の音声出力方法。
  19. 上記親密度情報に基づいて、親密度が所定値より低い単語または単語列を、親密度が上記所定値以上の単語または単語列よりも遅い速度で再生して出力するようにしたことを特徴とする請求項13に記載の音声出力方法。
  20. 上記親密度情報に基づいて、親密度が所定値より低い単語または単語列を画面上に表示するようにしたことを特徴とする請求項13に記載の音声出力方法。
JP2003300071A 2003-08-25 2003-08-25 音声出力装置および方法 Pending JP2005070430A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003300071A JP2005070430A (ja) 2003-08-25 2003-08-25 音声出力装置および方法
US10/925,874 US20050080626A1 (en) 2003-08-25 2004-08-24 Voice output device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003300071A JP2005070430A (ja) 2003-08-25 2003-08-25 音声出力装置および方法

Publications (1)

Publication Number Publication Date
JP2005070430A true JP2005070430A (ja) 2005-03-17

Family

ID=34405116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003300071A Pending JP2005070430A (ja) 2003-08-25 2003-08-25 音声出力装置および方法

Country Status (2)

Country Link
US (1) US20050080626A1 (ja)
JP (1) JP2005070430A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008102310A (ja) * 2006-10-19 2008-05-01 Alpine Electronics Inc 音声出力装置
JP2008250049A (ja) * 2007-03-30 2008-10-16 Yamaha Corp 音響変換装置およびプログラム
JP2010055096A (ja) * 2008-08-29 2010-03-11 Honda Motor Co Ltd 自動車車両の操作者の注意を乱すことを最小限に抑えた可変テキスト読み上げのためのシステムおよび方法
US8401844B2 (en) 2006-06-02 2013-03-19 Nec Corporation Gain control system, gain control method, and gain control program
JP2015049309A (ja) * 2013-08-30 2015-03-16 ブラザー工業株式会社 情報処理装置、話速データ生成方法、及びプログラム
JP2015049311A (ja) * 2013-08-30 2015-03-16 ブラザー工業株式会社 情報処理装置、話速データ生成方法、及びプログラム
US9992536B2 (en) 2013-07-23 2018-06-05 Fujitsu Limited Information provision device, information provision method, and information provision system

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4769031B2 (ja) * 2005-06-24 2011-09-07 マイクロソフト コーポレーション 言語モデルを作成する方法、かな漢字変換方法、その装置、コンピュータプログラムおよびコンピュータ読み取り可能な記憶媒体
JP4961807B2 (ja) * 2006-04-05 2012-06-27 株式会社Jvcケンウッド 車載装置、音声情報提供システムおよび発話速度調整方法
US20080071540A1 (en) * 2006-09-13 2008-03-20 Honda Motor Co., Ltd. Speech recognition method for robot under motor noise thereof
WO2015040751A1 (ja) * 2013-09-20 2015-03-26 株式会社東芝 音声選択支援装置、音声選択方法、およびプログラム
JP7044027B2 (ja) * 2018-10-15 2022-03-30 トヨタ自動車株式会社 車両
KR20200111853A (ko) 2019-03-19 2020-10-05 삼성전자주식회사 전자 장치 및 전자 장치의 음성 인식 제어 방법
CN111024112A (zh) * 2019-12-31 2020-04-17 联想(北京)有限公司 一种路线导航的方法、装置及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69227711T2 (de) * 1991-02-19 1999-05-27 Rolm Systems Verfahren und Gerät zur Bestimmung der Wiedergabelautstärke in einem Sprachnachrichtensystem
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
GB2305830B (en) * 1995-09-30 1999-09-22 Ibm Voice processing system and method
US6507643B1 (en) * 2000-03-16 2003-01-14 Breveon Incorporated Speech recognition system and method for converting voice mail messages to electronic mail messages
JP2002023777A (ja) * 2000-06-26 2002-01-25 Internatl Business Mach Corp <Ibm> 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器
WO2002063590A1 (en) * 2001-02-02 2002-08-15 Wisconsin Alumni Research Foundation Method and system for testing speech intelligibility in children
JP4038211B2 (ja) * 2003-01-20 2008-01-23 富士通株式会社 音声合成装置,音声合成方法および音声合成システム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8401844B2 (en) 2006-06-02 2013-03-19 Nec Corporation Gain control system, gain control method, and gain control program
JP5262713B2 (ja) * 2006-06-02 2013-08-14 日本電気株式会社 ゲイン制御システム、ゲイン制御方法及びゲイン制御プログラム
JP2008102310A (ja) * 2006-10-19 2008-05-01 Alpine Electronics Inc 音声出力装置
JP2008250049A (ja) * 2007-03-30 2008-10-16 Yamaha Corp 音響変換装置およびプログラム
JP4544258B2 (ja) * 2007-03-30 2010-09-15 ヤマハ株式会社 音響変換装置およびプログラム
JP2010055096A (ja) * 2008-08-29 2010-03-11 Honda Motor Co Ltd 自動車車両の操作者の注意を乱すことを最小限に抑えた可変テキスト読み上げのためのシステムおよび方法
US9992536B2 (en) 2013-07-23 2018-06-05 Fujitsu Limited Information provision device, information provision method, and information provision system
JP2015049309A (ja) * 2013-08-30 2015-03-16 ブラザー工業株式会社 情報処理装置、話速データ生成方法、及びプログラム
JP2015049311A (ja) * 2013-08-30 2015-03-16 ブラザー工業株式会社 情報処理装置、話速データ生成方法、及びプログラム

Also Published As

Publication number Publication date
US20050080626A1 (en) 2005-04-14

Similar Documents

Publication Publication Date Title
US7536303B2 (en) Audio restoration apparatus and audio restoration method
US8898055B2 (en) Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech
JP7244665B2 (ja) エンドツーエンドの音声変換
RU2294565C2 (ru) Способ и система динамической адаптации синтезатора речи для повышения разборчивости синтезируемой им речи
US5930755A (en) Utilization of a recorded sound sample as a voice source in a speech synthesizer
US10176797B2 (en) Voice synthesis method, voice synthesis device, medium for storing voice synthesis program
JPH10507536A (ja) 言語認識
JP2006501509A (ja) 個人適応音声セグメントを備える音声合成装置
JP2005070430A (ja) 音声出力装置および方法
JP4813796B2 (ja) 信号を合成するための方法、記憶媒体及びコンピュータシステム
JP2012159540A (ja) 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体
US11727949B2 (en) Methods and apparatus for reducing stuttering
US6546369B1 (en) Text-based speech synthesis method containing synthetic speech comparisons and updates
JPH0632020B2 (ja) 音声合成方法および装置
US20040102975A1 (en) Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect
JP2019008120A (ja) 声質変換システム、声質変換方法、及び声質変換プログラム
CN110517662A (zh) 一种智能语音播报的方法及系统
CN111837184A (zh) 声音处理方法、声音处理装置及程序
JP3518898B2 (ja) 音声合成装置
JP2008116643A (ja) 音声生成装置
JP2007025042A (ja) 音声合成装置および音声合成プログラム
JPH07200554A (ja) 文章読み上げ装置
EP1093111B1 (en) Amplitude control for speech synthesis
JPH02153397A (ja) 音声収録装置
JP2809769B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081224

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090526