JPH0580796A - 話速制御型補聴方法および装置 - Google Patents
話速制御型補聴方法および装置Info
- Publication number
- JPH0580796A JPH0580796A JP3245960A JP24596091A JPH0580796A JP H0580796 A JPH0580796 A JP H0580796A JP 3245960 A JP3245960 A JP 3245960A JP 24596091 A JP24596091 A JP 24596091A JP H0580796 A JPH0580796 A JP H0580796A
- Authority
- JP
- Japan
- Prior art keywords
- section
- pitch
- voiced
- processing
- silent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Analogue/Digital Conversion (AREA)
Abstract
受聴することができるようにする。 【構成】 区間分割処理部によって入力音声を無音区
間、無声区間および有声区間に分割する区間分割処理を
施し、有声区間に対してピッチ周期抽出処理部によって
ピッチ周期を抽出し、ピッチ区間分割処理部によってピ
ッチ区間ごとに分割し、ピッチ区間長延長・繰り返し処
理部によって各ピッチ区間長を話速設定部の定める比率
にしたがって延長させる。また、無音区間に対して無音
区間延長処理部によって話速設定部の定める比率にした
がって延長させる。そして、合成部において、前記延長
処理の施された無音区間、何も処理の施されていない無
音区間、および前記ピッチ区間の延長処理の施された有
声区間を入力音声と同じ順序で再合成し、音声として出
力する。
Description
オ、テープレコーダ、補聴器などの音響機器や医療機器
などにおいて、発話者の音声を加工して、ほぼリアルタ
イムで受聴者の受聴能力に音声スピードをフィットさ
せ、補聴を行なう話速制御型補聴方法および装置に関す
る。
何らかの障害などによって低下する音声識別臨界速度
(音声を正確に識別できる最大の話速)などの受聴能力
を補うための話速制御型補聴方法および装置に関し、発
話者の個人性、音韻性を保持したまま、受聴者自身の操
作によって高品質に話速を変換し、受聴者にとって最適
な音声了解度を得るものである。
障害などによって音声識別臨界速度(音声を正確に識別
できる最大の話速)などの受聴能力が低下すると、通常
の速さの音声や早口で話される音声の識別度が大幅に低
下するようになる。
ような聴力障害を持つ人のための補聴手段としては補聴
器しか知られておらず、補聴器は、単に周波数特性の改
善、利得制御などによって聴覚系の外耳、中耳の伝達特
性のみを補償するものであるために、主として聴覚中枢
の劣化が関与する音声の識別能力の低下を補償すること
は不可能であった。
に鑑みなされたもので、発話速度を受聴者の受聴能力に
最適になるように高品質のものに変換することにより、
主として聴覚中枢に起因する聴覚の劣化を補償すること
ができる話速制御型補聴方法および装置を提供すること
を目的とする。
聴方法は、入力音声を無音区間、無声区間および有声区
間に分割する区間分割処理を施し、前記有声区間に対し
てピッチ周期を抽出し、ピッチ区間ごとに分割し、各ピ
ッチ区間長をあらかじめ定められた比率によって延長さ
せ、前記無音区間に対してあらかじめ定められた比率に
よって延長させ、前記延長処理の施された無音区間、何
ら処理の施されていない無音区間、および前記ピッチ区
間の延長処理の施された有声区間を入力音声と同じ順序
で再合成し、音声として出力するものである。
入力音声を無音区間、無声区間および有声区間に分割す
る区間分割処理を施す区間分割処理部と、前記区間分割
処理部によって分割された有声区間に対してピッチ周期
を抽出するピッチ周期抽出処理部と、前記ピッチ周期抽
出処理部が抽出した各ピッチ区間ごとに有声区間を分割
するピッチ区間分割処理部と、前記ピッチ区間分割処理
部が分割した各ピッチ区間長をあらかじめ定められた比
率によって延長させるピッチ区間長延長・繰り返し処理
部と、前記区間分割処理部によって分割された無音区間
に対してあらかじめ定められた比率によって延長させる
無音区間延長処理部と、前記有声区間のピッチ区間の延
長比率、および無音区間の延長比率の設定を行なう話速
設定部と、前記延長処理の施された無音区間、何ら処理
の施されていない無音区間、および前記ピッチ区間の延
長処理の施された有声区間を入力音声と同じ順序で再合
成し、音声として出力する合成部とを備えたものであ
る。
処理部によって入力音声を無音区間、無声区間および有
声区間に分割する区間分割処理を施す。
処理部によってピッチ周期を抽出し、ピッチ区間分割処
理部によってピッチ区間ごとに分割し、ピッチ区間長延
長・繰り返し処理部によって各ピッチ区間長を話速設定
部の定める比率にしたがって延長させる。
無音区間延長処理部によって話速設定部の定める比率に
したがって延長させる。
施された無音区間、何ら処理の施されていない無音区
間、および前記ピッチ区間の延長処理の施された有声区
間を入力音声と同じ順序で再合成し、音声として出力す
る。
がって発話者の話速を受聴者の受聴能力に応じた速さに
変換して受聴させる。
する。
現する話速制御型補聴装置の実施例を示している。この
実施例の話速制御型補聴装置は、区間分割処理部1、無
音区間延長処理部2、ピッチ周期抽出部3、ピッチ区間
分割処理部4、ピッチ区間長延長・繰り返し処理部5、
話速設定部6および合成部7から構成されている。
間、無声区間および有声区間に分割する区間分割処理を
施す部分である。
理部1によって分割された無音区間に対して、話速設定
部6があらかじめ定めた比率によって延長させる部分で
ある。
部1によって分割された有声区間に対してピッチ周期を
抽出する部分であり、ピッチ区間分割処理部4は、ピッ
チ周期抽出処理部3が抽出した各ピッチ区間ごとに有声
区間を分割する部分であり、ピッチ区間長延長・繰り返
し部5は、ピッチ区間分割処理部が分割した各ピッチ区
間長を話速設定部6があらかじめ定めた比率によって延
長させる部分である。
者の受聴能力に応じて無音区間の延長比率および有声区
間のピッチ区間の延長比率の設定を行なう部分である。
音区間、何も処理の施されていない無音区間、およびピ
ッチ区間の延長処理の施された有声区間を入力音声と同
じ順序で再合成し、音声として出力する部分である。
動作について説明する。なお、これはまた、話速制御型
補聴方法の一実施例の説明ともなる。
において無音区間i、無声区間ii、有声区間iii に分割
する。
音区間iに対して話速設定部6が定める所定の比率で延
長処理を施し、話しの間の制御を行なう。
周期抽出処理部3によって有声区間iii のピッチ周期を
抽出し、続いて、ピッチ区間分割処理部4によってピッ
チ周期抽出処理部3で抽出されたピッチ周期にしたがっ
てピッチ区間を分割する。さらに、ピッチ区間長延長・
繰り返し処理部5によってピッチ区間分割処理部4で分
割されたピッチ区間を話速設定部6であらかじめ定めた
数だけ繰り返して有声区間iii の延長を行なう。
するために無声区間iiについては、何ら加工を行なわな
い。
音区間i、無声区間iiおよび有声区間iii に対して、合
成部7において入力音声と同じ順序で再合成し、音声と
して出力する。こうして、出力される音声は、話速が受
聴者の受聴能力に応じて変換されたものとなる。
する。図2はこの発明の話速制御型補聴装置の他の実施
例のハードウェア構成を示している。
タ上で実現されるが、この場合には、大量の演算を要す
るために信号処理に長時間を必要とし、リアルタイム性
に欠ける他、可搬性、操作性にも欠ける。このため、入
力音声の継続時間は必然的にメモリ容量に依存し、有限
長で打ち切らざるを得ない。
ランスピュータモジュール(並列演算用IC)を縦続接
続し、各モジュールに信号処理アルゴリズムを最適配分
して高速化を実現することにより、処理時間の大幅な短
縮を行ない、リアルタイム性を実現するものである。し
たがって、これによって入力音声が無制限に継続した場
合でも処理可能となるばかりでなく、小型軽量で可搬性
にも優れたものとなる。また、使用者自らが、簡単な手
動操作によって話速変換に必要なパラメータ(無音区間
iおよび有声区間iii の延長比率)を可変でき、使用者
にとっての最適値を設定できるので、操作性にも優れた
ものとすることができる。
ロックはトランスピュータモジュール(TRPM)1個
分に相当し、個々のアルゴリズムがそれぞれのモジュー
ル上で縦続的に高速演算処理を分担している。
D変換モジュール11、入力バッファモジュール12、
第1〜第5分析モジュール13〜17、ロータリエンコ
ーダ18、合成モジュール19、出力バッファモジュー
ル20およびD/A変換モジュール21から構成されて
いる。
号を16ビット量子化、48kHzサンプリングでA/
D変換する。
換された時系列音声データを逐次取り込み、フレーム単
位で処理するためにバッファリングを行なう。
ル13は、平均パワー、零交差数、および自己相関係数
を算出し、これらのしきい値により無音、無声、および
有声音フレームi,ii,iiiを決定する。
にデシメーションを行なう。
ジュール15は、デシメーションを施した時系列音声デ
ータの自己相関係数を求め、これを用い、フレームごと
に音声のピッチ周波数を算出する。
る第4分析モジュール16は、ピッチ周波数軌跡の平滑
化を行ない、ピッチの開始点およびピッチ数を決定す
る。
求めたパラメータの最終的な誤り訂正などの微調整を行
い、無音区間i、無声区間ii、有声区間iii と各ピッチ
区間を決定する。
り与えられる話速変換に必要なパラメータ(無音区間お
よび有声区間の延長比率)を角度情報として8ビット量
子化する。
は、第5分析モジュール17から得られた無音区間i、
無声区間ii、有声区間iii 、およびロータリエンコーダ
18から得られた無音、有声区間の延長比率に合うよう
に話速を変換して音声合成を行なう。
音声が伸張しているため、この延長部分を吸収するため
にバッファリングを行なう。
声をD/A変換し、音声信号として出力する。
聴装置でも、入力音声を無音区間、無声区間および有声
区間に分割する区間分割処理を施し、無音区間に対して
はあらかじめ定められた比率によって延長させ、無声区
間に対しては何ら加工を施さず、さらに有声区間に対し
てピッチ周期を抽出し、ピッチ区間ごとに分割し、各ピ
ッチ区間長をあらかじめ定められた比率によって延長さ
せ、これら延長処理の施された無音区間、何も処理の施
されていない無音区間、およびピッチ区間の延長処理の
施された有声区間を入力音声と同じ順序で再合成し、受
聴者の受聴能力に応じた話速に変換して出力することが
できるのである。
の個人性、および音韻性を保持したまま高品質に話速を
変換する処理を施し、受聴者自身の操作によって受聴者
の受聴能力に話速をフィットさせ、受聴者にとって最適
な話速に変換するので、加齢ないしは何らかの障害など
によって音声識別臨界速度が低下している受聴者の受聴
能力を補い、最適な速度で受聴させることができる。
Claims (2)
- 【請求項1】 入力音声を無音区間、無声区間および有
声区間に分割する区間分割処理を施し、 前記有声区間に対してピッチ周期を抽出し、ピッチ区間
ごとに分割し、各ピッチ区間長をあらかじめ定められた
比率によって延長させ、 前記無音区間に対してあらかじめ定められた比率によっ
て延長させ、 前記延長処理の施された無音区間、何ら処理の施されて
いない無音区間、および前記ピッチ区間の延長処理の施
された有声区間を入力音声と同じ順序で再合成し、音声
として出力することを特徴とする話速制御型補聴方法。 - 【請求項2】 入力音声を無音区間、無声区間および有
声区間に分割する区間分割処理を施す区間分割処理部
と、 前記区間分割処理部によって分割された有声区間に対し
てピッチ周期を抽出するピッチ周期抽出処理部と、 前記ピッチ周期抽出処理部が抽出した各ピッチ区間ごと
に有声区間を分割するピッチ区間分割処理部と、 前記ピッチ区間分割処理部が分割した各ピッチ区間長を
あらかじめ定められた比率によって延長させるピッチ区
間長延長・繰り返し処理部と、 前記区間分割処理部によって分割された無音区間に対し
てあらかじめ定められた比率によって延長させる無音区
間延長処理部と、 前記有声区間のピッチ区間の延長比率、および無音区間
の延長比率の設定を行なう話速設定部と、 前記延長処理の施された無音区間、何ら処理の施されて
いない無音区間、および前記ピッチ区間の延長処理の施
された有声区間を入力音声と同じ順序で再合成し、音声
として出力する合成部とを備えて成る話速制御型補聴装
置。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24596091A JP3327936B2 (ja) | 1991-09-25 | 1991-09-25 | 話速制御型補聴装置 |
US07/950,411 US5305420A (en) | 1991-09-25 | 1992-09-22 | Method and apparatus for hearing assistance with speech speed control function |
EP92116292A EP0534410B1 (en) | 1991-09-25 | 1992-09-23 | Method and apparatus for hearing assistance with speech speed control function |
DK96119237T DK0766229T3 (da) | 1991-09-25 | 1992-09-23 | Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion |
DK92116292T DK0534410T3 (da) | 1991-09-25 | 1992-09-23 | Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion |
EP96119237A EP0766229B1 (en) | 1991-09-25 | 1992-09-23 | Method and apparatus for hearing assistance with speech speed control function |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24596091A JP3327936B2 (ja) | 1991-09-25 | 1991-09-25 | 話速制御型補聴装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0580796A true JPH0580796A (ja) | 1993-04-02 |
JP3327936B2 JP3327936B2 (ja) | 2002-09-24 |
Family
ID=17141409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24596091A Expired - Lifetime JP3327936B2 (ja) | 1991-09-25 | 1991-09-25 | 話速制御型補聴装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3327936B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5825853A (en) * | 1995-09-07 | 1998-10-20 | Hitachi, Ltd. | Communication device |
US5995925A (en) * | 1996-09-17 | 1999-11-30 | Nec Corporation | Voice speed converter |
JP2006523117A (ja) * | 2003-03-11 | 2006-10-12 | コクレア リミテッド | 遺伝的アルゴリズムを用いてmap適化を行った蝸牛インプラントシステム |
WO2007086365A1 (ja) * | 2006-01-24 | 2007-08-02 | Matsushita Electric Industrial Co., Ltd. | 変換装置 |
JP2008171017A (ja) * | 1994-08-05 | 2008-07-24 | Qualcomm Inc | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
US9443537B2 (en) | 2013-05-23 | 2016-09-13 | Fujitsu Limited | Voice processing device and voice processing method for controlling silent period between sound periods |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4675692B2 (ja) | 2005-06-22 | 2011-04-27 | 富士通株式会社 | 話速変換装置 |
-
1991
- 1991-09-25 JP JP24596091A patent/JP3327936B2/ja not_active Expired - Lifetime
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008171017A (ja) * | 1994-08-05 | 2008-07-24 | Qualcomm Inc | 減少レート、可変レートの音声分析合成を実行する方法及び装置 |
US5825853A (en) * | 1995-09-07 | 1998-10-20 | Hitachi, Ltd. | Communication device |
US5995925A (en) * | 1996-09-17 | 1999-11-30 | Nec Corporation | Voice speed converter |
JP2006523117A (ja) * | 2003-03-11 | 2006-10-12 | コクレア リミテッド | 遺伝的アルゴリズムを用いてmap適化を行った蝸牛インプラントシステム |
WO2007086365A1 (ja) * | 2006-01-24 | 2007-08-02 | Matsushita Electric Industrial Co., Ltd. | 変換装置 |
US8073704B2 (en) | 2006-01-24 | 2011-12-06 | Panasonic Corporation | Conversion device |
JP5096932B2 (ja) * | 2006-01-24 | 2012-12-12 | パナソニック株式会社 | 変換装置 |
US9443537B2 (en) | 2013-05-23 | 2016-09-13 | Fujitsu Limited | Voice processing device and voice processing method for controlling silent period between sound periods |
Also Published As
Publication number | Publication date |
---|---|
JP3327936B2 (ja) | 2002-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100369111C (zh) | 话音增强装置 | |
JP2955247B2 (ja) | 話速変換方法およびその装置 | |
EP0534410B1 (en) | Method and apparatus for hearing assistance with speech speed control function | |
JP3151459B2 (ja) | パブリックアドレス明瞭度強調システム | |
JPH10509256A (ja) | ピッチ操作器を使用する音声信号の変換方法 | |
US20030216907A1 (en) | Enhancing the aural perception of speech | |
US8311842B2 (en) | Method and apparatus for expanding bandwidth of voice signal | |
CN112786064A (zh) | 一种端到端的骨气导语音联合增强方法 | |
US4586193A (en) | Formant-based speech synthesizer | |
JPH0580796A (ja) | 話速制御型補聴方法および装置 | |
KR20170098761A (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
JP3432443B2 (ja) | 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体 | |
JP3266124B2 (ja) | アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置 | |
JPH05307395A (ja) | 音声合成装置 | |
JPH06289898A (ja) | 音声信号処理装置 | |
JPH1070790A (ja) | 話速検出方法、話速変換方法および話速変換機能付補聴器 | |
JP2841797B2 (ja) | 音声分析・合成装置 | |
JP3185363B2 (ja) | 補聴器 | |
JP3219892B2 (ja) | リアルタイム話速変換装置 | |
JP3197975B2 (ja) | ピッチ制御方法及び装置 | |
JP3102553B2 (ja) | 音声信号処理装置 | |
JPH07210192A (ja) | 出力データ制御方法及び装置 | |
KR100746680B1 (ko) | 음성 강조 장치 | |
JPH07281691A (ja) | 話速変換方法 | |
JPH08254992A (ja) | 話速変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090712 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100712 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110712 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |