JP2010175717A - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP2010175717A JP2010175717A JP2009016786A JP2009016786A JP2010175717A JP 2010175717 A JP2010175717 A JP 2010175717A JP 2009016786 A JP2009016786 A JP 2009016786A JP 2009016786 A JP2009016786 A JP 2009016786A JP 2010175717 A JP2010175717 A JP 2010175717A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- variable
- speech
- text sentence
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】数字、固有名詞等を表す可変フレーズと、それ以外のキャリアフレーズからなるテキスト文21aが音声合成装置1に入力されると、可変フレーズ特定部11が可変フレーズを特定して可変フレーズ情報11aを生成する。音声合成部12において、言語解析部122が言語辞書121を参照して言語解析を行って中間言語122aを生成し、韻律制御部123が可変パラメータに強調処理を加えた韻律パラメータ123aを設定し、波形生成部124が可変フレーズに強調処理を加えた音声波形を生成して、合成音声124aとしてスピーカ3へ出力する。
【選択図】図1
Description
図1は、この発明の実施の形態1に係る音声合成装置1の構成を示すブロック図である。図1において、音声合成装置1は、情報処理装置2から入力されたテキスト文21aに対応する合成音声124aを生成し、スピーカ3へ出力する装置であり、可変フレーズ特定部11と、言語辞書121、言語解析部122、韻律制御部123および波形生成部124から構成される音声合成部12とを備える。
本実施の形態では、可変フレーズを重要度の高いフレーズとして扱い、キャリアフレーズを重要度の低いフレーズとして扱う。
従来技術では、出現頻度が低い程高い重要度を設定した出現頻度情報を用いて強調箇所を判定すると情報としては重要だが出現頻度が高い「左に」等のフレーズが強調箇所から外される可能性があるのに対し、本実施の形態の音声合成装置1は可変フレーズとして明示的に強調箇所と判定できる。このように、可変フレーズを強調箇所とし、キャリアフレーズを強調箇所ではないとすることにより、明示的に強調箇所を判別することが可能となる。
上記実施の形態1ではテキスト文21aの可変フレーズ全体に対して強調処理を行う構成としたが、本実施の形態では可変フレーズから重要フレーズを検出し、重要フレーズに対して強調処理を行う構成とする。図4は、この発明の実施の形態2に係る音声合成装置1の構成を示すブロック図である。本実施の形態の音声合成装置1は、上記実施の形態1の音声合成装置1に新たに重要フレーズ検索部13を追加した構成である。なお、図4において図1と同一または相当の部分については同一の符号を付し説明を省略する。
さらに、上記実施の形態1のように可変フレーズ情報を括弧[]で囲う方法を組み合わせて、例えば「自宅付近の[{コンビニ}を10件]まで検索します。」というテキスト文21aを可変フレーズ特定処理および重要フレーズ検索処理対象に用いてもよい。
図7は、この発明の実施の形態3に係る音声合成装置1の構成を示すブロック図である。図7において、音声合成装置1は、情報処理装置2から入力されたテキスト文21bに対応する合成音声124bを生成し、スピーカ3へ出力する装置であり、強調対象フレーズ特定部14と、テキスト加工部15と、言語辞書121、言語解析部122、韻律制御部123および波形生成部124から構成される音声合成部12とを備える。
上記実施の形態3では、テキスト文21bの強調対象フレーズを繰り返した合成音声124bを生成することにより、ユーザの強調対象フレーズ聞き逃しを防止していた。本実施の形態では、これに加えて、韻律制御および波形生成処理においても強調処理を行うように構成し、繰り返し毎に、生成する合成音声の強調度合いを制御する。図10は、この発明の実施の形態4に係る音声合成装置1の構成を示すブロック図である。図10において図1または図7と同一または相当の部分については同一の符号を付し説明を省略する。
Claims (6)
- 可変フレーズおよびキャリアフレーズからなるテキスト文に基づいて音声を合成する音声合成装置であって、
前記テキスト文中の可変フレーズを特定し、可変フレーズ情報として出力する可変フレーズ特定部と、
前記テキスト文中の、前記可変フレーズ情報に従い特定された前記可変フレーズに強調処理を加えた合成音声を生成する音声合成部とを備えることを特徴とする音声合成装置。 - テキスト文中の、可変フレーズ情報に従い特定された可変フレーズの中から、所定の重要フレーズを検索して、該当する重要フレーズを重要フレーズ情報として出力する重要フレーズ検索部を備え、
音声合成部は、可変フレーズの強調処理に代えて、前記テキスト文中の、前記重要フレーズ情報に従い特定された前記重要フレーズに強調処理を加えた合成音声を生成することを特徴とする請求項1記載の音声合成装置。 - テキスト文中の、可変フレーズ情報に従い特定された可変フレーズの中から、所定の重要フレーズを検索して、該当する重要フレーズを重要フレーズ情報として出力する重要フレーズ検索部を備え、
音声合成部は、前記テキスト文中の、前記可変フレーズ情報に従い特定された前記可変フレーズに強調処理を加えると共に、前記重要フレーズ情報に従い特定された前記重要フレーズに、前記可変フレーズの強調処理より強い度合いの強調処理を加えた合成音声を生成することを特徴とする請求項1記載の音声合成装置。 - テキスト文中の、可変フレーズ情報に従い特定された可変フレーズまたは重要フレーズ情報に従い特定された重要フレーズを複数回繰り返した加工テキスト文を生成するテキスト加工部を備え、
音声合成部は、前記テキスト文に代えて、前記加工テキスト文中の前記可変フレーズまたは前記重要フレーズに強調処理を加えた合成音声を生成することを特徴とする請求項2または請求項3記載の音声合成装置。 - テキスト文に基づいて音声を合成する音声合成装置であって、
前記テキスト文に含まれる強調対象フレーズを特定した強調対象フレーズ情報を用いて、前記テキスト文中の前記強調対象フレーズを複数回繰り返した加工テキスト文を生成するテキスト加工部と、
前記加工テキスト文に応じた合成音声を生成する音声合成部とを備えることを特徴とする音声合成装置。 - 音声合成部は、加工テキスト文中の可変フレーズ、重要フレーズまたは強調対象フレーズに、繰り返し毎に強調度合いを制御した強調処理を加えた合成音声を生成することを特徴とする請求項4または請求項5記載の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009016786A JP2010175717A (ja) | 2009-01-28 | 2009-01-28 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009016786A JP2010175717A (ja) | 2009-01-28 | 2009-01-28 | 音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010175717A true JP2010175717A (ja) | 2010-08-12 |
Family
ID=42706775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009016786A Pending JP2010175717A (ja) | 2009-01-28 | 2009-01-28 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010175717A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016002879A1 (ja) * | 2014-07-02 | 2016-01-07 | ヤマハ株式会社 | 音声合成装置、音声合成方法およびプログラム |
CN108630213A (zh) * | 2017-03-22 | 2018-10-09 | 株式会社东芝 | 声音处理装置、声音处理方法以及存储介质 |
WO2023062816A1 (ja) * | 2021-10-15 | 2023-04-20 | パイオニア株式会社 | コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0527792A (ja) * | 1991-07-22 | 1993-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声強調装置 |
JPH0712581A (ja) * | 1993-06-25 | 1995-01-17 | Aqueous Res:Kk | 車輌用音声出力装置 |
JPH0863187A (ja) * | 1994-08-19 | 1996-03-08 | Fujitsu Ltd | 音声合成装置 |
JPH0876796A (ja) * | 1994-09-06 | 1996-03-22 | Fujitsu Ten Ltd | 音声合成装置 |
JPH08247779A (ja) * | 1995-03-09 | 1996-09-27 | Honda Motor Co Ltd | 音声出力装置 |
JPH10171485A (ja) * | 1996-12-12 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JPH11231885A (ja) * | 1998-02-19 | 1999-08-27 | Fujitsu Ten Ltd | 音声合成装置 |
WO2004066271A1 (ja) * | 2003-01-20 | 2004-08-05 | Fujitsu Limited | 音声合成装置,音声合成方法および音声合成システム |
JP2005332174A (ja) * | 2004-05-19 | 2005-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラムおよび記録媒体 |
-
2009
- 2009-01-28 JP JP2009016786A patent/JP2010175717A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0527792A (ja) * | 1991-07-22 | 1993-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声強調装置 |
JPH0712581A (ja) * | 1993-06-25 | 1995-01-17 | Aqueous Res:Kk | 車輌用音声出力装置 |
JPH0863187A (ja) * | 1994-08-19 | 1996-03-08 | Fujitsu Ltd | 音声合成装置 |
JPH0876796A (ja) * | 1994-09-06 | 1996-03-22 | Fujitsu Ten Ltd | 音声合成装置 |
JPH08247779A (ja) * | 1995-03-09 | 1996-09-27 | Honda Motor Co Ltd | 音声出力装置 |
JPH10171485A (ja) * | 1996-12-12 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JPH11231885A (ja) * | 1998-02-19 | 1999-08-27 | Fujitsu Ten Ltd | 音声合成装置 |
WO2004066271A1 (ja) * | 2003-01-20 | 2004-08-05 | Fujitsu Limited | 音声合成装置,音声合成方法および音声合成システム |
JP2005332174A (ja) * | 2004-05-19 | 2005-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラムおよび記録媒体 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016002879A1 (ja) * | 2014-07-02 | 2016-01-07 | ヤマハ株式会社 | 音声合成装置、音声合成方法およびプログラム |
CN106471569A (zh) * | 2014-07-02 | 2017-03-01 | 雅马哈株式会社 | 语音合成设备、语音合成方法及其程序 |
JPWO2016002879A1 (ja) * | 2014-07-02 | 2017-04-27 | ヤマハ株式会社 | 音声合成装置、音声合成方法およびプログラム |
US20170116978A1 (en) * | 2014-07-02 | 2017-04-27 | Yamaha Corporation | Voice Synthesizing Apparatus, Voice Synthesizing Method, and Storage Medium Therefor |
US10224021B2 (en) | 2014-07-02 | 2019-03-05 | Yamaha Corporation | Method, apparatus and program capable of outputting response perceivable to a user as natural-sounding |
JP2019045867A (ja) * | 2014-07-02 | 2019-03-22 | ヤマハ株式会社 | 音声制御方法、音声制御装置およびプログラム |
CN106471569B (zh) * | 2014-07-02 | 2020-04-28 | 雅马哈株式会社 | 语音合成设备、语音合成方法及其存储介质 |
CN108630213A (zh) * | 2017-03-22 | 2018-10-09 | 株式会社东芝 | 声音处理装置、声音处理方法以及存储介质 |
CN108630213B (zh) * | 2017-03-22 | 2021-09-28 | 株式会社东芝 | 声音处理装置、声音处理方法以及存储介质 |
WO2023062816A1 (ja) * | 2021-10-15 | 2023-04-20 | パイオニア株式会社 | コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4302788B2 (ja) | 音声合成用の基本周波数テンプレートを収容する韻律データベース | |
US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
US7991616B2 (en) | Speech synthesizer | |
JP2007086316A (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
Stöber et al. | Speech synthesis using multilevel selection and concatenation of units from large speech corpora | |
US7280969B2 (en) | Method and apparatus for producing natural sounding pitch contours in a speech synthesizer | |
JP2010175717A (ja) | 音声合成装置 | |
JP2007086309A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP3518898B2 (ja) | 音声合成装置 | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
US20070219799A1 (en) | Text to speech synthesis system using syllables as concatenative units | |
Chettri et al. | Nepali text to speech synthesis system using esnola method of concatenation | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JPH07200554A (ja) | 文章読み上げ装置 | |
JP2008058379A (ja) | 音声合成システム及びフィルタ装置 | |
EP1589524B1 (en) | Method and device for speech synthesis | |
JPH037995A (ja) | 歌音声合成データの作成装置 | |
JP2703253B2 (ja) | 音声合成装置 | |
JP2005181998A (ja) | 音声合成装置および音声合成方法 | |
JPH11109992A (ja) | 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置 | |
JP3034554B2 (ja) | 日本語文章読上げ装置及び方法 | |
KR20180103273A (ko) | 음성 합성 장치 및 음성 합성 방법 | |
JP2006330486A (ja) | 音声合成装置、この音声合成装置を備えるナビゲーション装置、音声合成プログラム及びこのプログラムを記憶した情報記憶媒体 | |
JPH06214585A (ja) | 音声合成装置 | |
JPH064090A (ja) | テキスト音声変換方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120829 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130326 |