JPH0580796A - 話速制御型補聴方法および装置 - Google Patents

話速制御型補聴方法および装置

Info

Publication number
JPH0580796A
JPH0580796A JP3245960A JP24596091A JPH0580796A JP H0580796 A JPH0580796 A JP H0580796A JP 3245960 A JP3245960 A JP 3245960A JP 24596091 A JP24596091 A JP 24596091A JP H0580796 A JPH0580796 A JP H0580796A
Authority
JP
Japan
Prior art keywords
section
pitch
voiced
processing
silent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3245960A
Other languages
English (en)
Other versions
JP3327936B2 (ja
Inventor
Akira Nakamura
章 中村
Nobumasa Seiyama
信正 清山
Toru Tsugi
徹 都木
Eiichi Miyasaka
栄一 宮坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP24596091A priority Critical patent/JP3327936B2/ja
Priority to US07/950,411 priority patent/US5305420A/en
Priority to EP92116292A priority patent/EP0534410B1/en
Priority to DK96119237T priority patent/DK0766229T3/da
Priority to DK92116292T priority patent/DK0534410T3/da
Priority to EP96119237A priority patent/EP0766229B1/en
Publication of JPH0580796A publication Critical patent/JPH0580796A/ja
Application granted granted Critical
Publication of JP3327936B2 publication Critical patent/JP3327936B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【目的】 受聴者の受聴能力を補い、最適な発話速度で
受聴することができるようにする。 【構成】 区間分割処理部によって入力音声を無音区
間、無声区間および有声区間に分割する区間分割処理を
施し、有声区間に対してピッチ周期抽出処理部によって
ピッチ周期を抽出し、ピッチ区間分割処理部によってピ
ッチ区間ごとに分割し、ピッチ区間長延長・繰り返し処
理部によって各ピッチ区間長を話速設定部の定める比率
にしたがって延長させる。また、無音区間に対して無音
区間延長処理部によって話速設定部の定める比率にした
がって延長させる。そして、合成部において、前記延長
処理の施された無音区間、何も処理の施されていない無
音区間、および前記ピッチ区間の延長処理の施された有
声区間を入力音声と同じ順序で再合成し、音声として出
力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、例えばテレビ、ラジ
オ、テープレコーダ、補聴器などの音響機器や医療機器
などにおいて、発話者の音声を加工して、ほぼリアルタ
イムで受聴者の受聴能力に音声スピードをフィットさ
せ、補聴を行なう話速制御型補聴方法および装置に関す
る。
【0002】[発明の概要]この発明は、加齢ないしは
何らかの障害などによって低下する音声識別臨界速度
(音声を正確に識別できる最大の話速)などの受聴能力
を補うための話速制御型補聴方法および装置に関し、発
話者の個人性、音韻性を保持したまま、受聴者自身の操
作によって高品質に話速を変換し、受聴者にとって最適
な音声了解度を得るものである。
【0003】
【従来の技術】一般に、受聴者が加齢ないしは何らかの
障害などによって音声識別臨界速度(音声を正確に識別
できる最大の話速)などの受聴能力が低下すると、通常
の速さの音声や早口で話される音声の識別度が大幅に低
下するようになる。
【0004】
【発明が解決しようとする課題】ところが、従来、この
ような聴力障害を持つ人のための補聴手段としては補聴
器しか知られておらず、補聴器は、単に周波数特性の改
善、利得制御などによって聴覚系の外耳、中耳の伝達特
性のみを補償するものであるために、主として聴覚中枢
の劣化が関与する音声の識別能力の低下を補償すること
は不可能であった。
【0005】この発明は、このような従来の技術的課題
に鑑みなされたもので、発話速度を受聴者の受聴能力に
最適になるように高品質のものに変換することにより、
主として聴覚中枢に起因する聴覚の劣化を補償すること
ができる話速制御型補聴方法および装置を提供すること
を目的とする。
【0006】
【課題を解決するための手段】この発明の話速制御型補
聴方法は、入力音声を無音区間、無声区間および有声区
間に分割する区間分割処理を施し、前記有声区間に対し
てピッチ周期を抽出し、ピッチ区間ごとに分割し、各ピ
ッチ区間長をあらかじめ定められた比率によって延長さ
せ、前記無音区間に対してあらかじめ定められた比率に
よって延長させ、前記延長処理の施された無音区間、何
ら処理の施されていない無音区間、および前記ピッチ区
間の延長処理の施された有声区間を入力音声と同じ順序
で再合成し、音声として出力するものである。
【0007】また、この発明の話速制御型補聴装置は、
入力音声を無音区間、無声区間および有声区間に分割す
る区間分割処理を施す区間分割処理部と、前記区間分割
処理部によって分割された有声区間に対してピッチ周期
を抽出するピッチ周期抽出処理部と、前記ピッチ周期抽
出処理部が抽出した各ピッチ区間ごとに有声区間を分割
するピッチ区間分割処理部と、前記ピッチ区間分割処理
部が分割した各ピッチ区間長をあらかじめ定められた比
率によって延長させるピッチ区間長延長・繰り返し処理
部と、前記区間分割処理部によって分割された無音区間
に対してあらかじめ定められた比率によって延長させる
無音区間延長処理部と、前記有声区間のピッチ区間の延
長比率、および無音区間の延長比率の設定を行なう話速
設定部と、前記延長処理の施された無音区間、何ら処理
の施されていない無音区間、および前記ピッチ区間の延
長処理の施された有声区間を入力音声と同じ順序で再合
成し、音声として出力する合成部とを備えたものであ
る。
【0008】
【作用】この発明の話速制御型補聴装置では、区間分割
処理部によって入力音声を無音区間、無声区間および有
声区間に分割する区間分割処理を施す。
【0009】そして、有声区間に対してピッチ周期抽出
処理部によってピッチ周期を抽出し、ピッチ区間分割処
理部によってピッチ区間ごとに分割し、ピッチ区間長延
長・繰り返し処理部によって各ピッチ区間長を話速設定
部の定める比率にしたがって延長させる。
【0010】また、これと並行して、無音区間に対して
無音区間延長処理部によって話速設定部の定める比率に
したがって延長させる。
【0011】そして、合成部において、前記延長処理の
施された無音区間、何ら処理の施されていない無音区
間、および前記ピッチ区間の延長処理の施された有声区
間を入力音声と同じ順序で再合成し、音声として出力す
る。
【0012】こうして、話速設定部の定める比率にした
がって発話者の話速を受聴者の受聴能力に応じた速さに
変換して受聴させる。
【0013】
【実施例】以下、この発明の実施例を図に基づいて詳説
する。
【0014】図1はこの発明の話速制御型補聴方法を実
現する話速制御型補聴装置の実施例を示している。この
実施例の話速制御型補聴装置は、区間分割処理部1、無
音区間延長処理部2、ピッチ周期抽出部3、ピッチ区間
分割処理部4、ピッチ区間長延長・繰り返し処理部5、
話速設定部6および合成部7から構成されている。
【0015】区間分割処理部1は、入力音声を無音区
間、無声区間および有声区間に分割する区間分割処理を
施す部分である。
【0016】無音区間延長処理部2は、この区間分割処
理部1によって分割された無音区間に対して、話速設定
部6があらかじめ定めた比率によって延長させる部分で
ある。
【0017】ピッチ周期抽出処理部3は、区間分割処理
部1によって分割された有声区間に対してピッチ周期を
抽出する部分であり、ピッチ区間分割処理部4は、ピッ
チ周期抽出処理部3が抽出した各ピッチ区間ごとに有声
区間を分割する部分であり、ピッチ区間長延長・繰り返
し部5は、ピッチ区間分割処理部が分割した各ピッチ区
間長を話速設定部6があらかじめ定めた比率によって延
長させる部分である。
【0018】話速設定部6は、発話者の話す速さと受聴
者の受聴能力に応じて無音区間の延長比率および有声区
間のピッチ区間の延長比率の設定を行なう部分である。
【0019】そして合成部7は、延長処理の施された無
音区間、何も処理の施されていない無音区間、およびピ
ッチ区間の延長処理の施された有声区間を入力音声と同
じ順序で再合成し、音声として出力する部分である。
【0020】次に、上記の構成の話速制御型補聴装置の
動作について説明する。なお、これはまた、話速制御型
補聴方法の一実施例の説明ともなる。
【0021】入力音声に対して、まず区間分割処理部1
において無音区間i、無声区間ii、有声区間iii に分割
する。
【0022】そして無音区間延長処理部2において、無
音区間iに対して話速設定部6が定める所定の比率で延
長処理を施し、話しの間の制御を行なう。
【0023】また、有声区間iii に対して、まずピッチ
周期抽出処理部3によって有声区間iii のピッチ周期を
抽出し、続いて、ピッチ区間分割処理部4によってピッ
チ周期抽出処理部3で抽出されたピッチ周期にしたがっ
てピッチ区間を分割する。さらに、ピッチ区間長延長・
繰り返し処理部5によってピッチ区間分割処理部4で分
割されたピッチ区間を話速設定部6であらかじめ定めた
数だけ繰り返して有声区間iii の延長を行なう。
【0024】なお、発話者の個人性および音韻性を維持
するために無声区間iiについては、何ら加工を行なわな
い。
【0025】このようにして各部で処理が行なわれた無
音区間i、無声区間iiおよび有声区間iii に対して、合
成部7において入力音声と同じ順序で再合成し、音声と
して出力する。こうして、出力される音声は、話速が受
聴者の受聴能力に応じて変換されたものとなる。
【0026】次に、この発明の他の実施例について説明
する。図2はこの発明の話速制御型補聴装置の他の実施
例のハードウェア構成を示している。
【0027】通常、上記の第1実施例は大型コンピュー
タ上で実現されるが、この場合には、大量の演算を要す
るために信号処理に長時間を必要とし、リアルタイム性
に欠ける他、可搬性、操作性にも欠ける。このため、入
力音声の継続時間は必然的にメモリ容量に依存し、有限
長で打ち切らざるを得ない。
【0028】そこで、この実施例は、複数個の超小型ト
ランスピュータモジュール(並列演算用IC)を縦続接
続し、各モジュールに信号処理アルゴリズムを最適配分
して高速化を実現することにより、処理時間の大幅な短
縮を行ない、リアルタイム性を実現するものである。し
たがって、これによって入力音声が無制限に継続した場
合でも処理可能となるばかりでなく、小型軽量で可搬性
にも優れたものとなる。また、使用者自らが、簡単な手
動操作によって話速変換に必要なパラメータ(無音区間
iおよび有声区間iii の延長比率)を可変でき、使用者
にとっての最適値を設定できるので、操作性にも優れた
ものとすることができる。
【0029】図2に示すブロック図において、各々のブ
ロックはトランスピュータモジュール(TRPM)1個
分に相当し、個々のアルゴリズムがそれぞれのモジュー
ル上で縦続的に高速演算処理を分担している。
【0030】この実施例の話速制御型補聴装置は、A/
D変換モジュール11、入力バッファモジュール12、
第1〜第5分析モジュール13〜17、ロータリエンコ
ーダ18、合成モジュール19、出力バッファモジュー
ル20およびD/A変換モジュール21から構成されて
いる。
【0031】A/D変換モジュール11は、入力音声信
号を16ビット量子化、48kHzサンプリングでA/
D変換する。
【0032】入力バッファモジュール12は、A/D変
換された時系列音声データを逐次取り込み、フレーム単
位で処理するためにバッファリングを行なう。
【0033】区間分割処理を担当する第1分析モジュー
ル13は、平均パワー、零交差数、および自己相関係数
を算出し、これらのしきい値により無音、無声、および
有声音フレームi,ii,iiiを決定する。
【0034】第2分析モジュール14は、高速化のため
にデシメーションを行なう。
【0035】ピッチ周期抽出処理を担当する第3分析モ
ジュール15は、デシメーションを施した時系列音声デ
ータの自己相関係数を求め、これを用い、フレームごと
に音声のピッチ周波数を算出する。
【0036】ピッチ区間長延長・繰り返し処理を担当す
る第4分析モジュール16は、ピッチ周波数軌跡の平滑
化を行ない、ピッチの開始点およびピッチ数を決定す
る。
【0037】第5分析モジュール17は、各ブロックで
求めたパラメータの最終的な誤り訂正などの微調整を行
い、無音区間i、無声区間ii、有声区間iii と各ピッチ
区間を決定する。
【0038】ロータリエンコーダ18は、手動操作によ
り与えられる話速変換に必要なパラメータ(無音区間お
よび有声区間の延長比率)を角度情報として8ビット量
子化する。
【0039】合成処理を担当する合成モジュール19
は、第5分析モジュール17から得られた無音区間i、
無声区間ii、有声区間iii 、およびロータリエンコーダ
18から得られた無音、有声区間の延長比率に合うよう
に話速を変換して音声合成を行なう。
【0040】出力バッファモジュール20は、合成した
音声が伸張しているため、この延長部分を吸収するため
にバッファリングを行なう。
【0041】D/A変換モジュール21は、合成した音
声をD/A変換し、音声信号として出力する。
【0042】こうして、この第2実施例の話速制御型補
聴装置でも、入力音声を無音区間、無声区間および有声
区間に分割する区間分割処理を施し、無音区間に対して
はあらかじめ定められた比率によって延長させ、無声区
間に対しては何ら加工を施さず、さらに有声区間に対し
てピッチ周期を抽出し、ピッチ区間ごとに分割し、各ピ
ッチ区間長をあらかじめ定められた比率によって延長さ
せ、これら延長処理の施された無音区間、何も処理の施
されていない無音区間、およびピッチ区間の延長処理の
施された有声区間を入力音声と同じ順序で再合成し、受
聴者の受聴能力に応じた話速に変換して出力することが
できるのである。
【0043】
【発明の効果】以上のようにこの発明によれば、発話者
の個人性、および音韻性を保持したまま高品質に話速を
変換する処理を施し、受聴者自身の操作によって受聴者
の受聴能力に話速をフィットさせ、受聴者にとって最適
な話速に変換するので、加齢ないしは何らかの障害など
によって音声識別臨界速度が低下している受聴者の受聴
能力を補い、最適な速度で受聴させることができる。
【図面の簡単な説明】
【図1】この発明の一実施例の機能ブロック図。
【図2】この発明の他の実施例のブロック図。
【符号の説明】
1 区間分割処理部 2 無音区間延長処理部 3 ピッチ周期抽出処理部 4 ピッチ区間分割処理部 5 ピッチ区間長延長・繰り返し処理部 6 話速設定部 7 合成部 11 A/D変換モジュール 12 入力バッファモジュール 13 第1分析モジュール 14 第2分析モジュール 15 第3分析モジュール 16 第4分析モジュール 17 第5分析モジュール 18 ロータリエンコーダ 19 合成モジュール 20 出力バッファモジュール 21 D/A変換モジュール
───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮坂 栄一 東京都世田谷区砧一丁目10番11号 日本放 送協会放送技術研究所内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を無音区間、無声区間および有
    声区間に分割する区間分割処理を施し、 前記有声区間に対してピッチ周期を抽出し、ピッチ区間
    ごとに分割し、各ピッチ区間長をあらかじめ定められた
    比率によって延長させ、 前記無音区間に対してあらかじめ定められた比率によっ
    て延長させ、 前記延長処理の施された無音区間、何ら処理の施されて
    いない無音区間、および前記ピッチ区間の延長処理の施
    された有声区間を入力音声と同じ順序で再合成し、音声
    として出力することを特徴とする話速制御型補聴方法。
  2. 【請求項2】 入力音声を無音区間、無声区間および有
    声区間に分割する区間分割処理を施す区間分割処理部
    と、 前記区間分割処理部によって分割された有声区間に対し
    てピッチ周期を抽出するピッチ周期抽出処理部と、 前記ピッチ周期抽出処理部が抽出した各ピッチ区間ごと
    に有声区間を分割するピッチ区間分割処理部と、 前記ピッチ区間分割処理部が分割した各ピッチ区間長を
    あらかじめ定められた比率によって延長させるピッチ区
    間長延長・繰り返し処理部と、 前記区間分割処理部によって分割された無音区間に対し
    てあらかじめ定められた比率によって延長させる無音区
    間延長処理部と、 前記有声区間のピッチ区間の延長比率、および無音区間
    の延長比率の設定を行なう話速設定部と、 前記延長処理の施された無音区間、何ら処理の施されて
    いない無音区間、および前記ピッチ区間の延長処理の施
    された有声区間を入力音声と同じ順序で再合成し、音声
    として出力する合成部とを備えて成る話速制御型補聴装
    置。
JP24596091A 1991-09-25 1991-09-25 話速制御型補聴装置 Expired - Lifetime JP3327936B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP24596091A JP3327936B2 (ja) 1991-09-25 1991-09-25 話速制御型補聴装置
US07/950,411 US5305420A (en) 1991-09-25 1992-09-22 Method and apparatus for hearing assistance with speech speed control function
EP92116292A EP0534410B1 (en) 1991-09-25 1992-09-23 Method and apparatus for hearing assistance with speech speed control function
DK96119237T DK0766229T3 (da) 1991-09-25 1992-09-23 Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion
DK92116292T DK0534410T3 (da) 1991-09-25 1992-09-23 Fremgangsmåde og apparat til hørehjælp med talehastighedsstyrefunktion
EP96119237A EP0766229B1 (en) 1991-09-25 1992-09-23 Method and apparatus for hearing assistance with speech speed control function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24596091A JP3327936B2 (ja) 1991-09-25 1991-09-25 話速制御型補聴装置

Publications (2)

Publication Number Publication Date
JPH0580796A true JPH0580796A (ja) 1993-04-02
JP3327936B2 JP3327936B2 (ja) 2002-09-24

Family

ID=17141409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24596091A Expired - Lifetime JP3327936B2 (ja) 1991-09-25 1991-09-25 話速制御型補聴装置

Country Status (1)

Country Link
JP (1) JP3327936B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5825853A (en) * 1995-09-07 1998-10-20 Hitachi, Ltd. Communication device
US5995925A (en) * 1996-09-17 1999-11-30 Nec Corporation Voice speed converter
JP2006523117A (ja) * 2003-03-11 2006-10-12 コクレア リミテッド 遺伝的アルゴリズムを用いてmap適化を行った蝸牛インプラントシステム
WO2007086365A1 (ja) * 2006-01-24 2007-08-02 Matsushita Electric Industrial Co., Ltd. 変換装置
JP2008171017A (ja) * 1994-08-05 2008-07-24 Qualcomm Inc 減少レート、可変レートの音声分析合成を実行する方法及び装置
US9443537B2 (en) 2013-05-23 2016-09-13 Fujitsu Limited Voice processing device and voice processing method for controlling silent period between sound periods

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4675692B2 (ja) 2005-06-22 2011-04-27 富士通株式会社 話速変換装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171017A (ja) * 1994-08-05 2008-07-24 Qualcomm Inc 減少レート、可変レートの音声分析合成を実行する方法及び装置
US5825853A (en) * 1995-09-07 1998-10-20 Hitachi, Ltd. Communication device
US5995925A (en) * 1996-09-17 1999-11-30 Nec Corporation Voice speed converter
JP2006523117A (ja) * 2003-03-11 2006-10-12 コクレア リミテッド 遺伝的アルゴリズムを用いてmap適化を行った蝸牛インプラントシステム
WO2007086365A1 (ja) * 2006-01-24 2007-08-02 Matsushita Electric Industrial Co., Ltd. 変換装置
US8073704B2 (en) 2006-01-24 2011-12-06 Panasonic Corporation Conversion device
JP5096932B2 (ja) * 2006-01-24 2012-12-12 パナソニック株式会社 変換装置
US9443537B2 (en) 2013-05-23 2016-09-13 Fujitsu Limited Voice processing device and voice processing method for controlling silent period between sound periods

Also Published As

Publication number Publication date
JP3327936B2 (ja) 2002-09-24

Similar Documents

Publication Publication Date Title
CN100369111C (zh) 话音增强装置
JP2955247B2 (ja) 話速変換方法およびその装置
EP0534410B1 (en) Method and apparatus for hearing assistance with speech speed control function
JP3151459B2 (ja) パブリックアドレス明瞭度強調システム
JPH10509256A (ja) ピッチ操作器を使用する音声信号の変換方法
US20030216907A1 (en) Enhancing the aural perception of speech
US8311842B2 (en) Method and apparatus for expanding bandwidth of voice signal
CN112786064A (zh) 一种端到端的骨气导语音联合增强方法
US4586193A (en) Formant-based speech synthesizer
JPH0580796A (ja) 話速制御型補聴方法および装置
KR20170098761A (ko) 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법
JP3432443B2 (ja) 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP3266124B2 (ja) アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置
JPH05307395A (ja) 音声合成装置
JPH06289898A (ja) 音声信号処理装置
JPH1070790A (ja) 話速検出方法、話速変換方法および話速変換機能付補聴器
JP2841797B2 (ja) 音声分析・合成装置
JP3185363B2 (ja) 補聴器
JP3219892B2 (ja) リアルタイム話速変換装置
JP3197975B2 (ja) ピッチ制御方法及び装置
JP3102553B2 (ja) 音声信号処理装置
JPH07210192A (ja) 出力データ制御方法及び装置
KR100746680B1 (ko) 음성 강조 장치
JPH07281691A (ja) 話速変換方法
JPH08254992A (ja) 話速変換装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090712

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100712

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110712

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10