JP2000352991A - スペクトル補正機能つき音声合成器 - Google Patents

スペクトル補正機能つき音声合成器

Info

Publication number
JP2000352991A
JP2000352991A JP11166138A JP16613899A JP2000352991A JP 2000352991 A JP2000352991 A JP 2000352991A JP 11166138 A JP11166138 A JP 11166138A JP 16613899 A JP16613899 A JP 16613899A JP 2000352991 A JP2000352991 A JP 2000352991A
Authority
JP
Japan
Prior art keywords
spectrum
corrected
section
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11166138A
Other languages
English (en)
Inventor
Noboru Sonehara
曽根原  登
Shinya Nakajima
信弥 中嶌
Hideyuki Mizuno
秀之 水野
Kazuo Hakoda
和雄 箱田
Mizuhiro Hida
瑞広 飛田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11166138A priority Critical patent/JP2000352991A/ja
Publication of JP2000352991A publication Critical patent/JP2000352991A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 本発明は、個人の聴覚特性が異なる高齢者に
対して、合成音声を生成する段階で、周波数パラメータ
領域で聴覚特性を補正することにより、聞きやすい合成
音声を生成することを目的としている。 【解決手段】 音声合成器に聴覚特性を補正するスペク
トルパタンを用意して蓄積する手段と、蓄えられた音声
素片に対してスペクトル周波数領域でスペクトルパタン
を変形する手段を持つ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音素、音節、あ
るいは、単語、フレーズを単位とする音声素片を組み合
わせて、任意の合成音声を生成するスペクトル補正機能
つき音声合成器に関する。
【0002】
【従来の技術】この種の音声合成器の従来例について説
明する。
【0003】従来、視覚障害者用に開発されたテキスト
読み上げ機器や各種電話サービスを提供する音声応答装
置に使われる音声合成器は、音声メッセージの内容に応
じて、特定の人が発声した音素、音節、あるいは、単
語、フレーズを単位とする音声素片が蓄えられた音声フ
ァイルから、適当な素片を選択し、編集加工して出力音
声を生成している。
【0004】音声素片は、スペクトルパラメータの形
式、または音声波形の形式で蓄積されている。従って、
限られたメモリ容量で、任意の音声が生成できる利点を
有するが、合成音声の品質は、人が発声した音声に比べ
て明瞭性や了解性に欠ける。
【0005】この合成器の利用者は、通常付属のヘッド
ホンやハンドセット、スピーカを用いて、騒音環境の異
なる種々の環境下で、出力される音声を聞いている。高
齢化に伴い音響信号受容能力が低下する高齢者にとって
は、人が発話する音声に比べて明瞭性や了解性に欠ける
合成音声を一般の健常者と同じように聞き取ることがで
きないために、サービスの利用範囲が制限されていた。
【0006】一方、合成音声を利用者の好みや使用環境
に応じて聞きやすく調整するための手段として、周波数
領域の高域、あるいは低域を強調するトーンコントロー
ル機能が具備された音声合成器もあるが、音響信号受容
能力の低下した高齢者にとっては、オージオメータを使
って補聴器を調整するように周波数帯域ごとに細かく音
量レベルを調整することができない従来のトーンコント
ロール機能では、不十分である。また、補聴器を用いて
合成音声を聞く手段もあるが、騒音の種類や騒音レベル
の異なる使用環境下では、入力音声に加えて周囲雑音も
増幅してしまうことから、かえって聞きずらくなる。
【0007】
【発明が解決しようとする課題】音響信号受容能力の低
下した高齢者が、人が発話する音声に比べ品質の劣化を
伴う合成音声を一般の健常者と同じように聞き取ること
は困難である。
【0008】本発明は、個人の聴覚特性が異なる高齢者
に対して、合成音声を生成する段階で、周波数パラメー
タ領域で聴覚特性を補正することにより、聞きやすい合
成音声を生成することを可能とすることを目的としてい
る。
【0009】
【課題を解決するための手段】上記目的を達成する手段
として、音声合成器に聴覚特性を補正するスペクトルパ
タンを複数用意して蓄積する手段と、音声ファイルに蓄
えられた音声素片に対しスペクトル周波数領域でスペク
トルパタンを変形する手段を具備せしめた。
【0010】補正用のスペクトルは、以下のように求め
られる。なお、図1はオージオメータを用いて聴覚特性
を得る態様を示し、図2は健常者と高齢者とのスペクト
ル差異を求める態様を示す。
【0011】まず、図1に示すように、健常者の聴覚特
性をオージオメータ等を用いて測定し、そのスペクトル
形状を求めておく。次に図2に示すように聴覚特性の異
なる高齢者に対して、同様に聴覚特性を測定し、その典
型的なものを複数選択し、そのスペクトル形状S(ω)
を求めたあと、健常者のスペクトルXi (ω)とのスペ
クトル差異D(ω)を求め、その特性を示すスペクトル
形状(logD(ω))を聴覚補正用スペクトルとして
求める。その概形をn次のフィルタ(V(z))で近似
して、そのフィルタ係数を複数蓄えることも考えられ
る。また、音声合成で良く使われるLPC(Linear Pred
ective Codeing) パラメータなども考えられる。
【0012】スペクトル変形は、音声ファイルに蓄えら
れた音声素片に対し、補正用に求められたn次のフィル
タやLPCフィルタを用いて、フィルタリング処理する
ことにより達成される。
【0013】
【発明の実施の形態】本発明での実施例を図3に示す。
図中の符号1はコマンド解析部、2は主制御部、3は補
正スペクトル選択部、4は補正スペクトル蓄積部、5は
スペクトル変換部、6は音声素片蓄積部、7は補正済音
声素片蓄積部、8は音声合成部を表わしている。
【0014】この実施例においては、まずスペクトル補
正コマンドがコマンド解析部1に入力される(処理)
と、主制御部2を介して、補正スペクトル選択部3へ補
正スペクトルの種別を示すコードが送られる(処理
)。
【0015】補正スペクトル選択部3では、種別コード
に対応する補正スペクトルを補正スペクトル蓄積部4か
らスペクトル変換部5へ転送する(処理)。スペクト
ル変換部5では、音声素片蓄積部6に蓄積されたすべて
の音声素片に対し(処理)。補正スペクトルを用いて
スペクトル変形処理のためのフィルタリング演算処理を
行う。
【0016】スペクトル補正が施された音声素片は、補
正済音声素片蓄積部7へ送られる(処理)。音声合成
部8では、入力されたメッセージ内容により、適当な音
声素片を補正済音声素片蓄積部7から選択し(処理)
結合されて出力音声が生成される(処理)。
【0017】
【発明の効果】以上の通りであって、本発明によれば、
高齢化に伴い音響信号受容能力が低下する高齢者に対
し、人が発話する音声に比べて明瞭性や了解性に欠ける
合成音声を聞き取るための負担を大幅に軽減でき、従来
の音声合成器に比べて、音声サービスの適用範囲の拡大
が期待できる。
【0018】また、補聴器を用いて合成音声を聞く手段
と比較して、補聴器が騒音の種類や騒音レベルの異なる
使用環境下では、入力音声に加えて周囲雑音も増幅して
しまうのに対して、合成音声を生成する段階で、聴覚特
性を補正し聞きやすい合成音声を生成した後に、スピー
カ、ヘッドホン等の付属の出力装置から音声出力される
ので、雑音が一緒に増幅されることが無くなり、形態端
末に実装された音声合成器を用いて屋外で合成音声を聞
く場合にも効果が期待される。
【図面の簡単な説明】
【図1】聴覚特性を求める態様を示す。
【図2】補正スペクトルを求める態様を示す。
【図3】本発明によるスペクトル補正機能付音声合成器
のブロック図を示す。
【符号の説明】
1 コマンド解析部 2 主制御部 3 補正スペクトル選択部 4 補正スペクトル蓄積部 5 スペクトル変換部 6 音声素片蓄積部 7 補正済音声素片蓄積部 8 音声合成部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 水野 秀之 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 箱田 和雄 東京都武蔵野市御殿山一丁目1番3号 エ ヌ・ティ・ティ・アドバンステクノロジ株 式会社内 (72)発明者 飛田 瑞広 東京都武蔵野市御殿山一丁目1番3号 エ ヌ・ティ・ティ・アドバンステクノロジ株 式会社内 Fターム(参考) 5D045 AA07 BA01

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音素、音節、あるいは、単語、フレーズ
    を単位とする音声素片を組み合わせて、任意の合成音声
    を生成する音声合成装置において、 個人の聴覚特性に応じて、あらかじめ用意された複数の
    聴覚補正用スペクトルを蓄積する補正スペクトル蓄積部
    と、 最適な補正パタンを選択し、音声ファイルに蓄えられた
    音声素片に対し、周波数スペクトル領域で聴覚特性を補
    正するスペクトル補正処理を加えるスペクトル変換部
    と、 音声合成処理を行う音声合成部とを具備することを特徴
    とするスペクトル補正機能つき音声合成器。
JP11166138A 1999-06-14 1999-06-14 スペクトル補正機能つき音声合成器 Pending JP2000352991A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11166138A JP2000352991A (ja) 1999-06-14 1999-06-14 スペクトル補正機能つき音声合成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11166138A JP2000352991A (ja) 1999-06-14 1999-06-14 スペクトル補正機能つき音声合成器

Publications (1)

Publication Number Publication Date
JP2000352991A true JP2000352991A (ja) 2000-12-19

Family

ID=15825754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11166138A Pending JP2000352991A (ja) 1999-06-14 1999-06-14 スペクトル補正機能つき音声合成器

Country Status (1)

Country Link
JP (1) JP2000352991A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930863A (zh) * 2012-10-19 2013-02-13 河海大学常州校区 一种基于简化自适应内插加权谱模型的语音转换及重构方法
WO2020232578A1 (zh) * 2019-05-17 2020-11-26 Xu Junli 存储器、麦克风、音频数据处理方法、装置、设备和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06242794A (ja) * 1993-02-16 1994-09-02 Hitachi Ltd 音声処理装置
JPH0863188A (ja) * 1994-08-18 1996-03-08 Nec Corp 音声合成装置
JPH09127970A (ja) * 1995-09-01 1997-05-16 At & T Ipm Corp 合成音声の音声特性を修正するための方法と装置
JP2000066692A (ja) * 1998-08-25 2000-03-03 Yutaka Sugama 文字情報音声変換装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06242794A (ja) * 1993-02-16 1994-09-02 Hitachi Ltd 音声処理装置
JPH0863188A (ja) * 1994-08-18 1996-03-08 Nec Corp 音声合成装置
JPH09127970A (ja) * 1995-09-01 1997-05-16 At & T Ipm Corp 合成音声の音声特性を修正するための方法と装置
JP2000066692A (ja) * 1998-08-25 2000-03-03 Yutaka Sugama 文字情報音声変換装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930863A (zh) * 2012-10-19 2013-02-13 河海大学常州校区 一种基于简化自适应内插加权谱模型的语音转换及重构方法
CN102930863B (zh) * 2012-10-19 2014-05-28 河海大学常州校区 一种基于简化自适应内插加权谱模型的语音转换及重构方法
WO2020232578A1 (zh) * 2019-05-17 2020-11-26 Xu Junli 存储器、麦克风、音频数据处理方法、装置、设备和系统

Similar Documents

Publication Publication Date Title
US6212496B1 (en) Customizing audio output to a user's hearing in a digital telephone
US10582312B2 (en) Hearing aid and a method for audio streaming
US9943253B2 (en) System and method for improved audio perception
KR100800725B1 (ko) 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치
US20150199977A1 (en) Hearing aid and a method for improving speech intelligibility of an audio signal
KR101201442B1 (ko) 측정장치, 측정방법 및 프로그램
US20090285406A1 (en) Method of fitting a portable communication device to a hearing impaired user
EP2650872A1 (en) Masking sound generation device, masking sound output device, and masking sound generation program
JP2002536930A (ja) 適応ダイナミックレンジ最適化サウンドプロセッサ
EP1687812B1 (en) System and method for audio signal processing
WO2010103724A1 (ja) 補聴器
US8488807B2 (en) Audio signal compensation device and audio signal compensation method
JP3269669B2 (ja) 聴覚補償装置
JP2000152394A (ja) 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置
JP3482465B2 (ja) モバイルフィッティングシステム
KR20020044416A (ko) 청각 보정 기능을 갖는 개인용 무선 통신 장치 및 방법
JP2000352991A (ja) スペクトル補正機能つき音声合成器
US20220345831A1 (en) Endoscopic three-dimensional imaging systems and methods
JPH0580796A (ja) 話速制御型補聴方法および装置
JP2002062886A (ja) 感度調整機能を有する音声受信装置
JP2005160038A (ja) 音信号の加工装置および加工方法
JP3351745B2 (ja) 音程調整機能付き補聴器
JP3102553B2 (ja) 音声信号処理装置
JPH06289896A (ja) 音声の特徴強調方式および装置
JP4739887B2 (ja) オーディオ再生装置