JP2005070430A - 音声出力装置および方法 - Google Patents
音声出力装置および方法 Download PDFInfo
- Publication number
- JP2005070430A JP2005070430A JP2003300071A JP2003300071A JP2005070430A JP 2005070430 A JP2005070430 A JP 2005070430A JP 2003300071 A JP2003300071 A JP 2003300071A JP 2003300071 A JP2003300071 A JP 2003300071A JP 2005070430 A JP2005070430 A JP 2005070430A
- Authority
- JP
- Japan
- Prior art keywords
- word
- sound pressure
- familiarity
- voice
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
Abstract
【解決手段】 各単語または単語列に対してどの程度なじみがあるかを表した親密度情報を記録した音声DB1と、再生部2により音声DB1から音声データと共に読み出される親密度情報に基づいて、単語または単語列の単位で音圧レベルを調整する音圧調整部3とを設け、親密度が低い単語等については音圧を大きく補正するようにすることにより、例えば聞きなれない土地名など単語親密度が低い内容の音声を出力する場合であっても、親密度が高い単語に比べて大きな音圧で出力されるようにして、親密度が低い単語も聞き取りやすくなるようにする。
【選択図】 図1
Description
以下、本発明による第1の実施形態を図面に基づいて説明する。第1の実施形態は、本発明を録音再生方式の音声出力装置に適用したものである。図1は、第1の実施形態に係る音声出力装置の要部構成例を示す図である。図1に示すように、本実施形態の音声出力装置は、音声データベース(DB)1、再生部2、音圧調整部3およびボリューム4を備えて構成されている。
次に、本発明による第2の実施形態を図面に基づいて説明する。第2の実施形態は、本発明をTTS方式の音声出力装置に適用したものである。図2は、第2の実施形態に係る音声出力装置の要部構成例を示す図である。図2に示すように、本実施形態の音声出力装置は、テキスト生成部11、TTSエンジン12、音圧調整部13およびボリューム14を備えて構成されている。
次に、本発明による第3の実施形態を図面に基づいて説明する。第3の実施形態は、ラウドネス補償技術を用いた音声明瞭度改善システムに本発明を適用したものである。図3は、第3の実施形態に係る音声明瞭度改善システムの要部構成例を示す図である。
次に、本発明による第4の実施形態を図面に基づいて説明する。第4の実施形態は、音声通話システム(例えば、ハンズフリーシステム)に本発明を適用したものである。図4は、第4の実施形態に係る音声通話システムの要部構成例を示す図である。
2 再生部
3 音圧調整部
4 ボリューム
11 テキスト生成部
12 TTSエンジン
13 音圧調整部
14 ボリューム
15 言語処理部
16 テキスト解析用辞書
17 音声合成部
18 音素片辞書
21 音声DB
22 再生部
23 ボリュームまたはイコライザ
24 音圧調整部
25 ゲイン制御部
26 適応フィルタ
27 スピーカ
28 マイク
29 減算器
31 音響モデルDB
32 言語モデルDB
33 第1の連続認識部
34 第1の音圧調整部
35 第1のボリューム
36 スピーカ
37 マイク
38 第2の連続認識部
39 第2の音圧調整部
40 第2のボリューム
Claims (20)
- 複数の単語または単語列に対してどの程度なじみがあるかを表した親密度に関する情報を記憶した親密度情報記憶手段と、
上記親密度情報記憶手段に記憶されている親密度情報に基づいて、出力対象の各単語または単語列の音圧レベルを調整する音圧調整手段とを備えたことを特徴とする音声出力装置。 - 上記親密度情報記憶手段は、上記出力対象の各単語または単語列が録音された音声データベースに対して、単語または単語列の単位で上記親密度情報を付加して構成されたものであることを特徴とする請求項1に記載の音声出力装置。
- 上記親密度情報記憶手段は、与えられたテキスト情報をもとに音声波形を合成して再生する装置が備えるテキスト解析用の辞書データベースに対して、単語または単語列の単位で上記親密度情報を付加して構成されたものであることを特徴とする請求項1に記載の音声出力装置。
- 出力された音声の音圧レベルと、この出力音声の聴取位置において聴取可能な周囲音の音圧レベルとに基づいて、上記出力音声の補正ゲインを算出するゲイン算出手段を備え、
上記音圧調整手段は、上記ゲイン算出手段により算出された補正ゲインに基づいて、出力対象となる音声の音圧レベルを調整するとともに、上記親密度情報記憶手段に記憶されている親密度情報に基づいて、上記出力対象となる音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項1に記載の音声出力装置。 - 入力された音声とあらかじめ用意されている音声辞書とを比較し、入力音声に係る単語または単語列を認識してテキスト情報に変換する音声認識手段を備え、
上記親密度情報記憶手段は、複数の単語または単語列を表すテキスト情報と上記親密度との関係を示した情報を記憶して構成されたものであり、
上記音圧調整手段は、上記音声認識手段により変換されたテキスト情報をもとに上記親密度情報記憶手段を参照して得られる上記親密度情報に基づいて、上記入力音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項1に記載の音声出力装置。 - 上記音声認識手段は、音声通話システムにおける受話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記受話音声に係る単語または単語列を認識してテキスト情報に変換することを特徴とする請求項5に記載の音声出力装置。
- 上記音声認識手段は、音声通話システムにおける送話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記送話音声に係る単語または単語列を認識してテキスト情報に変換することを特徴とする請求項5に記載の音声出力装置。
- 上記音声認識手段は、音声通話システムにおける受話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記受話音声に係る単語または単語列を認識してテキスト情報に変換する第1の音声認識手段と、上記音声通話システムにおける送話音声を入力してあらかじめ用意されている音声辞書とを比較し、上記送話音声に係る単語または単語列を認識してテキスト情報に変換する第2の音声認識手段とを備え、
上記音圧調整手段は、上記第1の音声認識手段により変換されたテキスト情報をもとに上記親密度情報記憶手段を参照して得られる上記親密度情報に基づいて、上記受話音声の音圧レベルを単語または単語列の単位で調整する第1の音圧調整手段と、上記第2の音声認識手段により変換されたテキスト情報をもとに上記親密度情報記憶手段を参照して得られる上記親密度情報に基づいて、上記送話音声の音圧レベルを単語または単語列の単位で調整する第2の音圧調整手段とを備えることを特徴とする請求項5に記載の音声出力装置。 - 上記音声通話システムにおいて通話を開始する前に、通話相手が上記音圧調整手段を備えているか否かを判定する判定手段と、
上記判定手段により通話相手が上記音圧調整手段を備えていると判定されたときに、上記第1の音圧調整手段および上記第2の音圧調整手段の少なくとも一方の機能を休止させるように制御する制御手段とを備えたことを特徴とする請求項8に記載の音声出力装置。 - 上記親密度情報記憶手段に記憶されている親密度情報に基づいて、親密度が所定値より低い単語または単語列を2回以上繰り返して再生するように制御する再生制御手段を備えたことを特徴とする請求項1に記載の音声出力装置。
- 上記親密度情報記憶手段に記憶されている親密度情報に基づいて、上記出力対象の各単語または単語列の再生速度を調整する再生制御手段を備えたことを特徴とする請求項1に記載の音声出力装置。
- 上記親密度情報記憶手段に記憶されている親密度情報に基づいて、親密度が所定値より低い単語または単語列を画面上に表示するように制御する表示制御手段を備えたことを特徴とする請求項1に記載の音声出力装置。
- 複数の単語または単語列に対してどの程度なじみがあるかを表した親密度情報を音圧調整部が参照して、出力対象の各単語または単語列の音圧レベルを上記親密度情報に応じて調整するようにしたことを特徴とする音声出力方法。
- 上記出力対象の各単語または単語列が録音された音声データベースから音声を再生するときに、上記音声データベース上において単語または単語列の単位で記録されている上記親密度情報を上記音圧調整部が参照して、再生する音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。
- 与えられたテキスト情報をもとに音声波形を合成して再生するときに、テキスト解析用の辞書データベースにおいて単語または単語列の単位で記録されている上記親密度情報を上記音圧調整部が参照して、再生する音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。
- 外部より入力された音声を再生するときに、上記入力音声とあらかじめ用意されている音声辞書とを比較して上記入力音声に係る単語または単語列を音声認識部が認識し、当該認識された単語または単語列に対応する上記親密度情報を上記音圧調整部が参照して、再生する音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。
- 出力された音声の音圧レベルと、この出力音声の聴取位置において聴取可能な周囲音の音圧レベルとに基づいて補正ゲインを求め、当該補正ゲインに基づいて上記出力音声の音圧レベルを補正する音声明瞭度改善システムにおいて、
上記音圧調整部が上記補正ゲインに基づいて上記出力音声の音圧レベルを調整するとともに、上記親密度情報に基づいて上記出力音声の音圧レベルを単語または単語列の単位で調整することを特徴とする請求項13に記載の音声出力方法。 - 上記親密度情報に基づいて、親密度が所定値より低い単語または単語列を2回以上繰り返し再生して出力するようにしたことを特徴とする請求項13に記載の音声出力方法。
- 上記親密度情報に基づいて、親密度が所定値より低い単語または単語列を、親密度が上記所定値以上の単語または単語列よりも遅い速度で再生して出力するようにしたことを特徴とする請求項13に記載の音声出力方法。
- 上記親密度情報に基づいて、親密度が所定値より低い単語または単語列を画面上に表示するようにしたことを特徴とする請求項13に記載の音声出力方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003300071A JP2005070430A (ja) | 2003-08-25 | 2003-08-25 | 音声出力装置および方法 |
US10/925,874 US20050080626A1 (en) | 2003-08-25 | 2004-08-24 | Voice output device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003300071A JP2005070430A (ja) | 2003-08-25 | 2003-08-25 | 音声出力装置および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005070430A true JP2005070430A (ja) | 2005-03-17 |
Family
ID=34405116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003300071A Pending JP2005070430A (ja) | 2003-08-25 | 2003-08-25 | 音声出力装置および方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050080626A1 (ja) |
JP (1) | JP2005070430A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008102310A (ja) * | 2006-10-19 | 2008-05-01 | Alpine Electronics Inc | 音声出力装置 |
JP2008250049A (ja) * | 2007-03-30 | 2008-10-16 | Yamaha Corp | 音響変換装置およびプログラム |
JP2010055096A (ja) * | 2008-08-29 | 2010-03-11 | Honda Motor Co Ltd | 自動車車両の操作者の注意を乱すことを最小限に抑えた可変テキスト読み上げのためのシステムおよび方法 |
US8401844B2 (en) | 2006-06-02 | 2013-03-19 | Nec Corporation | Gain control system, gain control method, and gain control program |
JP2015049309A (ja) * | 2013-08-30 | 2015-03-16 | ブラザー工業株式会社 | 情報処理装置、話速データ生成方法、及びプログラム |
JP2015049311A (ja) * | 2013-08-30 | 2015-03-16 | ブラザー工業株式会社 | 情報処理装置、話速データ生成方法、及びプログラム |
US9992536B2 (en) | 2013-07-23 | 2018-06-05 | Fujitsu Limited | Information provision device, information provision method, and information provision system |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4769031B2 (ja) * | 2005-06-24 | 2011-09-07 | マイクロソフト コーポレーション | 言語モデルを作成する方法、かな漢字変換方法、その装置、コンピュータプログラムおよびコンピュータ読み取り可能な記憶媒体 |
JP4961807B2 (ja) * | 2006-04-05 | 2012-06-27 | 株式会社Jvcケンウッド | 車載装置、音声情報提供システムおよび発話速度調整方法 |
US20080071540A1 (en) * | 2006-09-13 | 2008-03-20 | Honda Motor Co., Ltd. | Speech recognition method for robot under motor noise thereof |
WO2015040751A1 (ja) * | 2013-09-20 | 2015-03-26 | 株式会社東芝 | 音声選択支援装置、音声選択方法、およびプログラム |
JP7044027B2 (ja) * | 2018-10-15 | 2022-03-30 | トヨタ自動車株式会社 | 車両 |
KR20200111853A (ko) | 2019-03-19 | 2020-10-05 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 인식 제어 방법 |
CN111024112A (zh) * | 2019-12-31 | 2020-04-17 | 联想(北京)有限公司 | 一种路线导航的方法、装置及电子设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69227711T2 (de) * | 1991-02-19 | 1999-05-27 | Rolm Systems | Verfahren und Gerät zur Bestimmung der Wiedergabelautstärke in einem Sprachnachrichtensystem |
US5175769A (en) * | 1991-07-23 | 1992-12-29 | Rolm Systems | Method for time-scale modification of signals |
GB2305830B (en) * | 1995-09-30 | 1999-09-22 | Ibm | Voice processing system and method |
US6507643B1 (en) * | 2000-03-16 | 2003-01-14 | Breveon Incorporated | Speech recognition system and method for converting voice mail messages to electronic mail messages |
JP2002023777A (ja) * | 2000-06-26 | 2002-01-25 | Internatl Business Mach Corp <Ibm> | 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器 |
WO2002063590A1 (en) * | 2001-02-02 | 2002-08-15 | Wisconsin Alumni Research Foundation | Method and system for testing speech intelligibility in children |
JP4038211B2 (ja) * | 2003-01-20 | 2008-01-23 | 富士通株式会社 | 音声合成装置,音声合成方法および音声合成システム |
-
2003
- 2003-08-25 JP JP2003300071A patent/JP2005070430A/ja active Pending
-
2004
- 2004-08-24 US US10/925,874 patent/US20050080626A1/en not_active Abandoned
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8401844B2 (en) | 2006-06-02 | 2013-03-19 | Nec Corporation | Gain control system, gain control method, and gain control program |
JP5262713B2 (ja) * | 2006-06-02 | 2013-08-14 | 日本電気株式会社 | ゲイン制御システム、ゲイン制御方法及びゲイン制御プログラム |
JP2008102310A (ja) * | 2006-10-19 | 2008-05-01 | Alpine Electronics Inc | 音声出力装置 |
JP2008250049A (ja) * | 2007-03-30 | 2008-10-16 | Yamaha Corp | 音響変換装置およびプログラム |
JP4544258B2 (ja) * | 2007-03-30 | 2010-09-15 | ヤマハ株式会社 | 音響変換装置およびプログラム |
JP2010055096A (ja) * | 2008-08-29 | 2010-03-11 | Honda Motor Co Ltd | 自動車車両の操作者の注意を乱すことを最小限に抑えた可変テキスト読み上げのためのシステムおよび方法 |
US9992536B2 (en) | 2013-07-23 | 2018-06-05 | Fujitsu Limited | Information provision device, information provision method, and information provision system |
JP2015049309A (ja) * | 2013-08-30 | 2015-03-16 | ブラザー工業株式会社 | 情報処理装置、話速データ生成方法、及びプログラム |
JP2015049311A (ja) * | 2013-08-30 | 2015-03-16 | ブラザー工業株式会社 | 情報処理装置、話速データ生成方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20050080626A1 (en) | 2005-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7536303B2 (en) | Audio restoration apparatus and audio restoration method | |
US8898055B2 (en) | Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech | |
JP7244665B2 (ja) | エンドツーエンドの音声変換 | |
RU2294565C2 (ru) | Способ и система динамической адаптации синтезатора речи для повышения разборчивости синтезируемой им речи | |
US5930755A (en) | Utilization of a recorded sound sample as a voice source in a speech synthesizer | |
US10176797B2 (en) | Voice synthesis method, voice synthesis device, medium for storing voice synthesis program | |
JPH10507536A (ja) | 言語認識 | |
JP2006501509A (ja) | 個人適応音声セグメントを備える音声合成装置 | |
JP2005070430A (ja) | 音声出力装置および方法 | |
JP4813796B2 (ja) | 信号を合成するための方法、記憶媒体及びコンピュータシステム | |
JP2012159540A (ja) | 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体 | |
US11727949B2 (en) | Methods and apparatus for reducing stuttering | |
US6546369B1 (en) | Text-based speech synthesis method containing synthetic speech comparisons and updates | |
JPH0632020B2 (ja) | 音声合成方法および装置 | |
US20040102975A1 (en) | Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect | |
JP2019008120A (ja) | 声質変換システム、声質変換方法、及び声質変換プログラム | |
CN110517662A (zh) | 一种智能语音播报的方法及系统 | |
CN111837184A (zh) | 声音处理方法、声音处理装置及程序 | |
JP3518898B2 (ja) | 音声合成装置 | |
JP2008116643A (ja) | 音声生成装置 | |
JP2007025042A (ja) | 音声合成装置および音声合成プログラム | |
JPH07200554A (ja) | 文章読み上げ装置 | |
EP1093111B1 (en) | Amplitude control for speech synthesis | |
JPH02153397A (ja) | 音声収録装置 | |
JP2809769B2 (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081224 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090526 |