JP2000349893A - 音声再生方法および音声再生装置 - Google Patents

音声再生方法および音声再生装置

Info

Publication number
JP2000349893A
JP2000349893A JP11161369A JP16136999A JP2000349893A JP 2000349893 A JP2000349893 A JP 2000349893A JP 11161369 A JP11161369 A JP 11161369A JP 16136999 A JP16136999 A JP 16136999A JP 2000349893 A JP2000349893 A JP 2000349893A
Authority
JP
Japan
Prior art keywords
voice
audio
masking
recording medium
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11161369A
Other languages
English (en)
Inventor
Masayuki Misaki
正之 三▲崎▼
Akira Tagami
亮 田上
Satoru Ibaraki
悟 茨木
Takeo Kanamori
丈郎 金森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11161369A priority Critical patent/JP2000349893A/ja
Publication of JP2000349893A publication Critical patent/JP2000349893A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 受信した音声データの再聴取を行なう際
に、再生時の周囲の騒音状況等にかかわらず、できるだ
け明瞭な再聴取を可能とすること。 【解決手段】 受信した音声を音声記録メディア12に
蓄積し、必要に応じて読み出して再聴取を行なう。この
際、音声強調処理手段13により、再生信号に対して適
応的な強調処理を施す。この適応的な信号処理は、第2
の音声分析処理手段15による再聴取時(再生時)の周
囲騒音の分析結果と、音声記録メディア12から読み出
した音声信号の分析結果とに基づき、マスキング量推定
手段16がマスキング量を推定し、そのマスキング推定
量を補償するように、その処理の内容や程度を適宜に変
更することで実現される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声を蓄積する機能
を搭載する音声再生装置および音声再生方法に係わり、
特に、蓄積した音声データを聴き取りやすくする信号処
理を行う機能を兼ね備える音声再生装置および音声再生
方法に関するものである。
【0002】
【従来の技術】現在、携帯電話などの音声通信サービス
あるいはその携帯端末には、音声データを記録再生する
留守番電話機能が付加されているものがある。従来の音
声蓄積機能を搭載する音声再生装置は、例えば、特開平
10−341279公報に開示されている。その音声再
生装置の構成概要を図8に示す。
【0003】以下、図8の音声再生装置の構成と動作に
ついて説明する。
【0004】この音声再生装置は、無線伝送路を介して
音声信号等の電波を受信する入力部231と、入力部2
31により受信された電波を符号データに変換するRF
受信部232と、符号データの各フレームを格納するメ
モリ部233と、メモリ部233に格納された上記符号
データから信号を復元する復号部236と、2フレーム
毎にデータ伝送に関する信頼度を計算する信頼度計算部
201と、信頼度に基づいて前記符号データのメモリ部
233への格納を制御する符号制御部202とを具備し
ている。
【0005】次に動作を説明する。まず、入力部231
から入力信号の電波を受信し、受信信号はRF受信部2
32で符号データに変換される。変換された符号データ
は、信頼度計算部201に入力される。
【0006】信頼度計算部201では、含まれている誤
り訂正符号を基に符号データの各フレームに対して誤り
訂正が行われ、誤りが完全に訂正可能かどうかにより、
信頼度が計算される。例えば、完全に訂正可能な場合は
信頼度を示すフラグ情報に1を設定し、それ以外の場合
には0が設定される。
【0007】次に、符号制御部202では、信頼度フラ
グ情報が1の場合には、符号データと信頼度フラグの値
の両方をメモリ部233に格納し、信頼度フラグ情報が
0の場合には、符号データはメモリ部233に格納せず
信頼度フラグのみを格納しておく。
【0008】このように、誤り訂正不可能なフレームデ
ータは、メモリ部233には格納されていない。復号部
236では、不足する分のフレームは直前のフレームの
情報を利用して補間した後に復号化処理を行われる。
【0009】
【発明が解決しようとする課題】上述の従来例は、メモ
リの使用によって、ハードウエアの使用効率を高めつ
つ、留守番電話機能や通話録音機能といった基本的な機
能を実現するものである。したがって、送られてくる発
信者音声を聴き取りやすくするといった、さらなる機能
の向上は実現されない。
【0010】一般に、携帯電話などを屋外で使用する場
合には、受信した音声を受信者側の環境下で聴取するこ
とになる。例えば、送信側が静かな環境で送信してお
り、かつ、発声速度(送信者の話速)が大きい時に、受
信側の周囲の環境騒音が大きかった場合等を想定する
と、受信側の聴取が困難であると予想される。
【0011】このような状況下で、受信側聴取者が再聴
取を希望し、メモリ部に記録されている音声を再生する
場合、記録された音声をそのまま再生したのでは、周囲
の雑音状況が改善されていない限り、再聴取もまた、困
難となってしまう場合が多いと考えられる。したがっ
て、このような状況では、音声記録メディアに記録した
音声を何度聴取しても聞こえない可能性がある。
【0012】かといって、単純に大きな音で聞こえるよ
うに再生することは、聴覚への負担が大きくなり、難聴
を誘発するなどの問題を有している。
【0013】本発明はこのような問題に着目してなされ
たものであり、聞き取れなかったり、あるいは聞き逃し
たりした音声を再聴取する際に、その再生音声を明瞭に
理解できる音声再生装置と音声再生方法を提供すること
を目的とする。
【0014】
【課題を解決するための手段】本発明では、メモリなど
の記録メディア(記録媒体)に一旦記録された音声を再
生する際に、記録音声の特性や受信側における再生時の
周囲騒音等を考慮して適応的に信号処理を施すことによ
り、聞き逃したり聴取不能であった音声を聴き取りやす
く加工して再生するものである。
【0015】再生時における適応的な信号処理を施すこ
とにより、その時点にふさわしい音声の再生が実現さ
れ、再聴取時の音声の了解性が向上する。例えば、音声
受信時には騒音がひどくて聞き取れなかったが、その騒
音は一過性のもので再聴取の時点には無くなっていたと
いうのであれば、通常の再生が行われ、再生時にも騒音
が継続しているのならば、音声強調や話速変換がなされ
た再生が行われることになる。これによって、音声記録
時と再生時の時間間隔のギャップを克服して、最新の時
点の雑音状況等に基づき、最適な信号再生処理が実行さ
れることになる。
【0016】
【発明の実施の形態】本発明の音声再生方法の一態様で
は、周囲騒音の状況等に応じた適応的な音声再生のため
の信号処理を行う。この場合に、相手側の話速も考慮し
た適応制御をするのが望ましい。
【0017】また、本発明の音声再生方法の他の態様で
は、受信した音声の分析や話速の推定等の処理を、その
受信時に行なっておき、音声信号と共にそれらの分析結
果も記録媒体に蓄積しておき、その分析した結果を、聴
取時におけるマスキング量の判定等に利用することで迅
速な処理を可能とする。
【0018】また、本発明の音声再生装置の一態様は、
第1/第2の音声分析手段と、マスキング量推定手段
と、騒音によるマスキング効果を補償して音声信号を明
瞭に強調する処理を行う音声強調処理手段と、受信した
音声データを記録する音声記録メディアと、を有した構
成となっている。
【0019】また、他の態様では、一つの音声分析手段
と、マスキング量推定手段と、マスキング量推定手段で
求めた音声データへのマスキング総和量あるいはマスキ
ング総和量の変化度合いを基に前記音声記録メディアへ
の書き込み制御を行う記録制御手段と、騒音によるマス
キング効果を補償して音声信号を明瞭に強調する処理を
行う音声強調処理手段と、受信した音声データと音声分
析手段で分析した結果を記録する音声記録メディアとを
有した構成となっている。
【0020】また、他の態様では、第1/第2の音声分
析手段と、話速推定手段と、マスキング量推定手段と、
騒音によるマスキング効果の補償と話速の低減化を施し
て音声信号を明瞭にゆっくりとした早さの音声に強調す
る処理を行う音声強調処理手段と、受信した音声データ
を記録する音声記録メディアとを有した構成となってい
る。
【0021】また、他の態様では、音声分析手段と、マ
スキング量推定手段と、マスキング量推定手段で求めた
音声データへのマスキング総和量あるいはマスキング総
和量の変化度合いを基に前記音声記録メディアへの書き
込み制御を行う記録制御手段と、騒音によるマスキング
効果の補償と話速の低減化を施して音声信号を明瞭にゆ
っくりとした早さの音声に強調する処理を行う音声強調
処理手段と、受信した音声データと音声分析手段で分析
した結果と話速推定手段で推定した結果とを記録する音
声記録メディアとを有した構成となっている。
【0022】また、他の態様では、音声データの主要な
成分が音声であるか非音声であるかの判別を行う音声・
非音声判別手段を備えて分析区間の音声・非音声判定結
果とその周波数成分結果を出力する第1の音声分析手段
と主として音声区間に対して強調処理を行うように制御
を行う再生制御手段を有した構成となっている。
【0023】また、他の態様では、音声・非音声判定結
果を元に音声データの始端からの音声区間継続時間長を
計算し、始端からの継続時間長に対応して関連付けた再
生速度に低減する制御を行う再生制御手段を有した構成
となっている。
【0024】また、他の態様では、音声・非音声判定結
果を元に音声データの始端からの継続時間長を計算し、
連続した音声区間が所定の時間長以上の場合に、音声区
間へのマスキング補償を行ない、かつ連続した音声区間
が所定の時間長以上の場合に次第に再生速度を低減する
制御を行う再生制御手段を有した構成となっている。
【0025】また、他の態様では、請求項7の構成にお
いて、音声データの主要スペクトル部分への周囲騒音に
よるマスキング総和量を計算し、そのマスキング総和量
あるいはマスキング総和量の変化度合いに関連付けた再
生速度に低減する制御を行う再生制御手段を有した構成
となっている。
【0026】また、他の態様では、請求項7の構成にお
いて、音声・非音声判定結果を元に音声データの始端か
らの音声区間継続時間長を計算するとともに音声データ
の主要スペクトル部分へのマスキング総和量を計算し、
始端からの音声区間継続時間長とマスキング総和量ある
いはマスキング総和量の変化度合いとに対応して関連付
けた再生速度に低減する制御を行う再生制御手段と、を
有した構成となっている。
【0027】以下、本発明の実施の形態について図面を
参照して具体的に説明する。
【0028】(実施の形態1)図1は本発明の実施の形
態1における音声再生装置の構成を示すブロック図であ
る。
【0029】図1において、11はRF受信部、12は
音声記録メディア、13は音声強調処理手段、14は第
1の音声分析手段、15は第2の音声分析手段、16は
マスキング量推定手段、17は再生制御手段、18は切
り換え手段である。
【0030】以下、その動作について説明する。
【0031】まず、本音声再生装置全体の動作に関して
概要を述べる。本実施形態では、屋外で使用する携帯電
話機などを想定した例である。使用者は通常の使用形態
において受信中の音声を聴取しているが、周囲の環境騒
音が急に大きくなった場合、あるいは、何かで注意をそ
らしてしまった場合に受信中の音声を聴取不可能となる
あるいは聞き逃してしまうことが考えられる。その際、
受信した音声を常時音声記録メディアに保存しておれ
ば、時間的に遡って聞き逃した音声を聴取することも可
能である。
【0032】しかしながら、聞き取り不可能であった音
声を再聴取する時も、周囲の環境騒音が大きい場合など
には、やはり聞き取りは困難なままであり、容易に聞き
取れるように音声強調の信号処理を施して明瞭な音声を
再生することが必要と考えられる。逆に、聞き逃した音
声を再聴取する際、周囲の環境騒音が大きくない場合に
は、音声強調などの信号処理によって加工する必要な
く、原音に近い形で聴取できれば十分である。このよう
に聴取者の周囲の環境騒音の状況に応じて、聞き取り困
難な音声あるいは聞き逃した音声の再聴取をするための
信号処理方法を適応的に制御することが本実施の形態の
目的である。
【0033】すなわち、図1の装置では、入力信号の電
波を受信し、この高周波信号をRF受信部11で音声符
号データに変換し、音声記録メディア12に随時記録す
る。音声記録メディア12は、例えば、リングメモリ構
成で、過去に受信した音声データの所定の時間長分を記
録できる記録容量を備えている。
【0034】受信された信号は一旦必ずこの記録メディ
ア12に記録されているため、所定の時間内に存在する
直前に聞き逃した音声は、使用者からの指示によって即
座に音声記録メディア内の音声データを再生することに
よって再聴取可能となる。
【0035】第1の音声分析手段14は、音声記録メデ
ィア内の音声データをフレーム単位で周波数分析し、第
2の音声分析手段15は、マイクロホンで収音した周囲
の環境騒音をフレーム単位で周波数分析し、それぞれマ
スキング量推定手段16に出力する。
【0036】そして、マスキング量推定手段は、対応す
る所定の周波数帯域幅毎に第1,第2の音声分析手段
(14,15)の出力信号を比較し、受信した音声が周
囲の環境騒音により同時マスキングされるマスキング量
を推定し、再生制御手段17に出力する。
【0037】再生制御手段17は、各周波数帯域幅毎に
音声強調手段の強調パラメータを制御する。音声強調処
理手段13は、強調処理パラメータを調整して、再生す
る音声の強調度合いを変化させる。最後に、強調処理さ
れた音声は切り換え手段18を経由して出力され、再聴
取の要求が発生した場合には、音声記録メディア12か
ら読み出し、かつ強調処理を施して得られた音声を出力
する側を選択するものとする。
【0038】次に、マスキング量推定手段16の具体的
な動作に関して説明する。
【0039】まず、第1、第2の音声分析手段(14,
15)では、周波数分析を行い、臨界帯域幅毎の平均エ
ネルギーを求める。そして、マスキング量推定手段16
は、対応する臨界帯域幅におけるマスキング量を推定す
る。
【0040】この値は、例えば、文献:村瀬、中村、飯
田、“周囲騒音によるマスキングを考慮した音質制御方
式”、日本音響学会講演論文集、平成9年3月、2-3-10
などに示されているように、信号源と騒音源の双方の値
をパラメータとして関数の形で表される。ここで、同時
マスキング効果に関しては、例えばB.C.J.ムーア著、大
串健吾 監訳“聴覚心理学概論”、の第3章(誠信書
房)などに詳しいので解説を省略する。
【0041】このようにして求められた各臨界帯域毎の
マスキング量は、音声強調処理手段13の強調処理を行
う度合いを決定するパラメータとして用いられる。
【0042】次に、音声強調処理手段13で実施される
音声信号処理に関して説明を行う。受信した音声信号
は、聴取者の周囲の環境騒音によってマスキングを受け
て、聴覚的に聞こえない成分を生じるため、そのマスキ
ングされる周波数帯域を補償するための処理を行う。
【0043】まず、各臨界帯域幅毎に求められたマスキ
ング量は、その帯域における一定値の利得調整を行うこ
とで、マスキングの影響を補償することが可能となる。
しかし、周波数分解能を高めるために分析フレームのポ
イント数が大きくなると、その区間における平均的な利
得調整値としては有効であるが、フレーム内で振幅が定
常的でない過渡的な場合には大振幅部分での音声の過大
増幅になり、耳障りになる可能性がある。
【0044】そこで、ここでは補聴器などで使用される
ことが多いダイナミックレンジ圧縮処理を適用した。図
5に音声強調処理手段13の具体的な構成例を示す。
【0045】図示されるように、音声強調手段13は、
帯域分割手段131と、ダイナミックレンジ圧縮処理手
段132と、で構成され、まず、臨界帯域幅の周波数帯
域に帯域分割し、その各帯域毎にダイナミックレンジ圧
縮を施すことでマスキング補償を行うようになってい
る。
【0046】帯域分割手段131は、臨界帯域幅ごとに
帯域分割を行い、次段のダイナミックレンジ圧縮処理手
段では各帯域毎に与えられるマスキング量をもとに、最
小可聴レベル(HTL)を定め、不快閾値(UCL)との間に
音声信号を収めるダイナミックレンジの圧縮処理を行う
ものである。この時のダイナミックレンジ圧縮処理とし
て図6に示すような入出力特性を示す。
【0047】この図では、マスキング補償のために入力
信号が40dB(HL)時において、20dBのゲインアップとなる
折れ線型の入出力特性を与えている。この特性では、入
力信号が90dB(HL)をUCLと想定し、この値以上に出力信
号が増幅されない。また、このような非線形な利得調整
を実施することにより、所定の範囲へのダイナミックレ
ンジの圧縮処理を行うことが可能となり、その結果、各
帯域毎にマスキング補償を行うことができる。
【0048】このように、再聴取する要求が発生した時
点での周囲騒音と受信音声信号とのマスキング補償を行
うことで、聞こえにくかった音声部分を明瞭に聴取する
処理を提供する音声再生装置を実現するものである。
【0049】受信音声を明瞭にする手段としてはダイナ
ミックレンジ圧縮以外にも考えられる。例えば、リミッ
ター動作により上限値を制限する動作を行うグラフィッ
クイコライザなども同等の動作が可能である。また、ホ
ルマント周波数を推定することにより、このホルマント
周波数近傍帯域のマスキング補償のみを実施しても、明
瞭度の改善効果が期待される。あるいはこれらを組み合
わせた構成も考えられる。
【0050】なお、以上の説明では受信した音声信号の
みを音声記録メディアに記録しているが、同時に音声分
析した結果を記録しておき、再聴取要求が発生した時点
でこの記録メディアに保存した音声分析結果と現在の周
囲騒音を音声分析した結果を比較してマスキング量を推
定するようにしてもよい。
【0051】(実施の形態2)以下、本発明の実施の形
態2について、図面を参照しながら説明する。
【0052】図2は本発明の実施の形態2における音声
再生装置の構成を示すブロック図である。
【0053】図2において、11はRF受信部、12は
音声記録メディア、13は音声強調処理手段、14は音
声分析手段、16はマスキング量推定手段、17は再生
制御手段、18は切り換え手段、19は記録制御手段で
ある。
【0054】以下、その動作について説明する。
【0055】まず、本音声再生装置全体の動作に関して
概要を述べる。本実施形態も先の実施形態と同様に、屋
外で使用する携帯電話機などを想定した例である。
【0056】使用者は通常の使用形態において受信中の
音声を聴取しているが、特に、周囲の環境騒音が急に大
きくなり受信中の音声を聴取不可能となった場合への対
応を想定している。そのため、聴取者の周囲の環境騒音
の状況に応じて、受信した音声データおよびその音声分
析した結果を音声記録メディアに記録/削除する制御を
行い、再聴取要求が発生した時点で記録済みの音声デー
タとその時点での周囲騒音とのマスキング補償を行うこ
とで聞き取り困難な音声の再聴取するための信号処理方
法を適応的に制御することが、本実施の形態の音声再生
装置の目的である。
【0057】入力信号の電波を受信し、この高周波信号
はRF部11で音声符号データに変換され、音声記録メ
ディア12に随時記録されると同時に音声分析手段14
へ出力される。
【0058】音声記録メディア12は、例えばリングメ
モリ構成で、過去に受信した音声データの所定の時間長
分を記録できる記録容量を備えており、受信した音声信
号は一旦必ずこの記録メディア12に記録されているた
め、所定の時間内に存在する直前に聞き逃した音声は、
使用者からの指示によって即座に音声記録メディア内の
音声データを再生することによって再聴取可能となる。
【0059】音声分析手段14は、まず、受信した音声
データをフレーム単位で周波数分析し、次に同時刻に現
在の受信側の周囲騒音に関しても周波数分析を行い、こ
れら両方の音声分析結果をマスキング量推定手段16に
出力する。
【0060】マスキング量推定手段16は、対応する臨
界帯域幅におけるマスキング量を推定する。続いて、受
信した音声データが周囲騒音によってマスキングされる
度合いが、各臨界帯域毎のマスキング量から推定され
る。
【0061】そして、記録制御手段19は周囲騒音が大
きくなってマスキング度合いが所定の閾値より大きくな
った場合にのみ、音声記録メディア12に、すでに記録
した音声データ部分の保存の確保と、音声分析データの
記録とを指示し、それ以外の場合には、一旦記録した音
声データを保存せずに削除する指示を行う。再聴取の可
能性がある音声データを予測し、その音声データ(およ
び関連するデータ)のみを選択的に保存することで、音
声記録メディア12のメモリ容量を有効利用できるよう
になる。
【0062】次に、周囲騒音が大きくなって受信した音
声データを聴き取り不可能になった時、使用者は再聴取
の要求を出して、記録済みである音声データの再聴取を
行う。ここで、音声分析手段14は、マイクロホンで収
音した最新の時刻での周囲の環境騒音をフレーム単位で
周波数分析し、先に音声記録メディア12に記録されて
いる音声分析結果を読み出し、それぞれマスキング量推
定手段16に出力する。そしてマスキング量推定手段1
6は、対応する所定の周波数帯域幅毎に周囲の環境騒音
と音声記録メディア12に記録されている音声分析結果
を比較し、受信した音声が周囲の環境騒音により同時に
マスキングされるマスキング量を推定し、再生制御手段
17に出力する。
【0063】この場合、受信音声の分析は受信時になさ
れて記録メディアに既に保存されているため、聴取時の
音声分析は周囲騒音に関してのみでよく、したがって、
処理が簡素化されると共に迅速な処理が可能となる。
【0064】再生制御手段17は、各周波数帯域幅毎に
音声強調手段の強調パラメータを制御する。音声強調処
理手段13は、強調処理パラメータを調整して、再生す
る音声の強調度合いを変化させる。最後に、強調処理さ
れた音声は切り換え手段18を経由して出力され、再聴
取の要求が発生した場合には、強調処理を施した音声を
出力する側を選択するものとする。
【0065】なお、マスキング量推定手段16および音
声強調処理手段13の動作に関しては、前掲の実施の形
態1と同様である。
【0066】このように、記録制御手段19で、予め周
囲騒音によって受信した音声データがマスキングによっ
て聴取困難なことを予測し、その予測された聴取不可能
な部分の音声データと音声分析結果とを選択的に音声記
録メディア12に保存しておくことで、記録メディアの
記録容量の有効活用が行なえると共に、使用者が再聴取
の要求を入力すると即座に再生を行うことが可能とな
る。
【0067】また、再聴取する要求が発生した時点での
周囲騒音と受信音声データとのマスキング補償を行うこ
とで、聞こえにくかった音声部分を明瞭に聴取する処理
を提供する音声再生装置を実現するものである。
【0068】受信音声を明瞭にする手段としては先と同
様にダイナミックレンジ圧縮以外にも考えられる。例え
ば、リミッター動作により上限値を制限する動作を行う
グラフィックイコライザなども同等の動作が可能であ
る。また、ホルマント周波数を推定することにより、こ
のホルマント周波数近傍帯域のマスキング補償のみを実
施しても、明瞭度の改善効果が期待される。
【0069】(実施の形態3)以下、本発明の実施の形
態3について、図面を参照しながら説明する。
【0070】図3は本発明の実施の形態3における音声
再生装置の構成を示すブロック図である。
【0071】図3において、11はRF受信部、12は
音声記録メディア、13は音声強調処理手段、14は第
1の音声分析手段、15は第2の音声分析手段、16は
マスキング量推定手段、17は再生制御手段、18は切
り換え手段、20は話速推定手段である。
【0072】以下、その動作について説明する。
【0073】まず、本音声再生装置全体の動作に関して
概要を述べる。本実施形態でも、前掲の実施の形態と同
様に、屋外で使用する携帯電話機などを想定している。
【0074】使用者は通常の使用形態において受信中の
音声を聴取しているが、周囲の環境騒音が急に大きくな
った場合、あるいは、何かで注意をそらしてしまった場
合に受信中の音声を聴取不可能となるあるいは聞き逃し
てしまうことが考えられる。その際、受信した音声を常
時音声記録メディアに保存しておれば、時間的に遡って
聞き逃した音声を聴取することも可能である。しかしな
がら、聞き取り不可能であった音声を再聴取する時も、
周囲の環境騒音が大きい場合や、受信した音声データの
話速が速い場合にはやはり聞き取りは困難なままであ
り、容易に聞き取れるように騒音によるマスキング効果
の補償と同時に話速の低減化を行うなどの音声強調の信
号処理を施し、明瞭な音声を再生することが必要と考え
られる。逆に、聞き逃した音声を再聴取する際、周囲の
環境騒音が大きくない場合や、受信した音声データの話
速が早くない場合には、騒音によるマスキング効果の補
償や同話速の低減化などの音声強調処理はあまり必要な
く、原音に近い形で聴取できれば十分である。このよう
に聴取者の周囲の環境騒音の状況に応じて、聞き取り困
難な音声あるいは聞き逃した音声の再聴取するための信
号処理方法を適応的に制御することが本実施の形態の音
声再生装置の目的である。
【0075】入力信号の電波を受信し、この高周波信号
はRF部11で音声符号データに変換され、音声記録メ
ディア12に随時記録される。音声記録メディア12
は、リングメモリ構成で、過去に受信した音声データの
所定の時間長分を記録できる記録容量を備えている。受
信された信号は一旦必ずこの記録メディアに記録されて
いるため、所定の時間内に存在する直前に聞き逃した音
声は、使用者からの指示によって即座に音声記録メディ
ア内の音声データを再生することによって再聴取可能と
なる。
【0076】第1の音声分析手段14は、音声記録メデ
ィア12内の音声データをフレーム単位で周波数分析
し、第2の音声分析手段15は、マイクロホンで収音し
た周囲の環境騒音をフレーム単位で周波数分析し、それ
ぞれマスキング量推定手段16に出力する。そしてマス
キング量推定手段16は、対応する所定の周波数帯域幅
毎に第1、第2の音声分析手段(14,15)の出力信
号を比較し、受信した音声が周囲の環境騒音により同時
マスキングされるマスキング量を推定し、再生制御手段
17に出力する。
【0077】一方、話速推定手段20は、音声記録メデ
ィア内のデータから発声者の話速を推定する。そして、
再生制御手段17は、各周波数帯域幅毎に音声強調手段
のマスキング補償に関する強調パラメータを制御すると
ともに、話速の低減化を行う処理パラメータをも制御す
る。
【0078】音声強調処理手段13は、強調処理パラメ
ータである、マスキング補償パラメータと話速低減化パ
ラメータとを調整して、再生する音声の強調度合いを変
化させる。最後に、強調処理された音声は切り換え手段
を経由して出力され、再聴取の要求が発生した場合には
音声記録メディアに蓄え強調処理を施した音声を出力す
る側を選択するものとする。
【0079】マスキング量推定手段の動作に関しては第
1の実施形態と同様である。
【0080】次に、音声強調処理手段で実施される音声
信号処理に関して説明を行う。受信した音声信号は、聴
取者の周囲の環境騒音によって受信した音声がマスキン
グを受けることに対するマスキング補償処理と、受信し
た音声データの話速が早いことに対する話速低減化処理
の2つの信号処理を実施するものである。
【0081】マスキングの補償に関しては前掲の実施の
形態1と同様であるので省略する。話速推定結果から、
受信した音声データの話速の値に応じて、話速の低減化
のため速度変換処理を行う。
【0082】例えば、話速の値を15%程度低減するよ
うに速度変換処理を行うことで、連続した文章などの了
解度試験成績を改善することが可能である。マスキング
補償は聴覚末梢系の聞こえを補償するものであるが、話
速低減化はより高次な中枢系に近い部位への補償を行う
ものと考えられる。この話速の低減化を行うための信号
処理方式には速度変換処理(話速変換処理)が使用され
る。速度変換処理は例えば、例えば文献:鈴木、三崎、
“高品質音声速度変換方式のDSPによる実現”、電子
情報通信学会 音声研究会資料、SP90-34(1990)に詳細
に記述されている。
【0083】このように、再聴取する要求が発生した時
点での周囲騒音と受信音声信号とのマスキング補償を行
うことで、聞こえにくかった音声部分を明瞭に聴取する
処理と同時に、受信した話速の早い音声を話速の低減化
処理を行うことで、聞き取りできない音声をよく理解で
きるようにする処理とを併用して提供する音声再生装置
を実現することができる。
【0084】なお、受信音声を明瞭にする手段としては
ダイナミックレンジ圧縮以外にも考えられる。例えば、
リミッター動作により上限値を制限する動作を行うグラ
フィックイコライザなども同等の動作が可能である。ま
た、ホルマント周波数を推定することにより、このホル
マント周波数近傍帯域のマスキング補償のみを実施して
も、明瞭度の改善効果が期待される。あるいはこれらを
組み合わせた構成も考えられる。
【0085】なお、以上の説明では受信した音声信号の
みを音声記録メディアに記録しているが、同時に音声分
析した結果を記録することで、再聴取要求が発生した時
点でこの記録メディアに保存した音声分析結果と現在の
周囲騒音を音声分析した結果を比較するようにしてもよ
い。
【0086】(実施の形態4)以下、本発明の実施の形
態4について、図面を参照しながら説明する。
【0087】図4は本発明の実施の形態4における音声
再生装置の構成を示すブロック図である。
【0088】図4において、11はRF受信部、12は
音声記録メディア、13は音声強調処理手段、14は音
声分析手段、16はマスキング量推定手段、17は再生
制御手段、18は切り換え手段、19は記録制御手段、
20は話速推定手段である。
【0089】以下、その動作について説明する。
【0090】まず、本音声再生装置全体の動作に関して
概要を述べる。本実施の形態も先の実施形態と同様に、
屋外で使用する携帯電話機などを想定した例である。使
用者は通常の使用形態において受信中の音声を聴取して
いるが、ここでは特に周囲の環境騒音が急に大きくなり
受信中の音声を聴取不可能となった場合への対応を想定
している。そのため、聴取者の周囲の環境騒音の状況に
応じて、受信した音声データおよびその音声分析した結
果および推定した話速の情報を音声記録メディアに記録
/削除する制御を行い、再聴取要求が発生した時点での
マスキング補償および話速低減化を行うことで聞き取り
困難な音声の再聴取するための信号処理方法を適応的に
制御することが本実施の形態の目的である。
【0091】入力信号の電波を受信し、この高周波信号
はRF部11で音声符号データに変換され、音声記録メ
ディア12に随時記録されると同時に音声分析手段14
へ出力される。
【0092】音声記録メディア12は、リングメモリ構
成で、過去に受信した音声データの所定の時間長分を記
録できる記録容量を備えており、受信した音声信号は一
旦必ずこの記録メディアに記録されているため、所定の
時間内に存在する直前に聞き逃した音声は、使用者から
の指示によって即座に音声記録メディア内の音声データ
を再生することによって再聴取可能となる。
【0093】音声分析手段14は、まず受信した音声デ
ータをフレーム単位で周波数分析し、次に同時刻に現在
の受信側の周囲騒音に関しても周波数分析を行い、これ
ら両方の音声分析結果をマスキング量推定手段16に出
力する。一方、話速推定手段20は、受信した音声デー
タから発声者の話速を推定する。マスキング量推定手段
16は、対応する臨界帯域幅におけるマスキング量を推
定する。そして、受信した音声データが周囲騒音によっ
てマスキングされる度合いは、各臨界帯域毎のマスキン
グ量から推定する。
【0094】そして、記録制御手段19は周囲騒音が大
きくなってマスキング度合いが所定の閾値より大きくな
った場合にのみ、音声記録メディア12に、すでに記録
した音声データ部分の保存確保と、音声分析データおよ
び、話速推定手段20で推定した話速の情報の記録を指
示し、それ以外の場合には一旦記録した音声データを保
存せずに削除する指示を行う。
【0095】次に、周囲騒音が大きくなって受信した音
声データを聴き取り不可能になった時、使用者は再聴取
の要求を出して、記録済みである音声データの再聴取を
行う。ここで、音声分析手段14は、マイクロホンで収
音した最新の時刻での周囲の環境騒音をフレーム単位で
周波数分析し、先に音声記録メディア12に記録されて
いる音声分析結果を読み出し、それぞれマスキング量推
定手段16に出力する。そして、マスキング量推定手段
16は、対応する所定の周波数帯域幅毎に周囲の環境騒
音と音声記録メディア12に記録されている音声分析結
果を比較し、受信した音声が周囲の環境騒音により同時
マスキングされるマスキング量を推定し再生制御手段1
7に出力する。
【0096】また、音声記録メディア12から対応する
話速推定結果も読み出し、再生制御手段17に出力す
る。再生制御手段17は各周波数帯域幅毎に音声強調手
段のマスキング補償に関する強調パラメータを制御する
とともに、話速の低減化を行う処理パラメータをも制御
する。
【0097】音声強調処理手段13は、強調処理パラメ
ータである、マスキング補償パラメータと話速低減化パ
ラメータとを調整して、再生する音声の強調度合いを変
化させる。最後に、強調処理された音声は切り換え手段
を経由して出力され、再聴取の要求が発生した場合に
は、強調処理を施した音声を出力する側を選択するもの
とする。
【0098】マスキング量推定手段16の動作に関して
は、実施の形態1と同様である。また、音声強調処理手
段13の動作に関しては前掲の実施の形態3と同様であ
る。
【0099】このように、記録制御手段で予め周囲騒音
によって受信した音声データがマスキングによって聴取
困難なことを予測し、その予測された聴取不可能な部分
の音声データと音声分析結果と話速推定結果とを選択的
に音声記録メディア12に保存しておくことで、メモリ
容量の有効利用が可能となると共に、使用者が再聴取の
要求を発生した場合に即座に再生を行うことが可能とな
る。
【0100】また、再聴取する要求が発生した時点での
周囲騒音と受信音声データとのマスキング補償を行うこ
とで、聞こえにくかった音声部分を明瞭に聴取する処理
と同時に、話速推定結果に応じて話速の低減を行うこと
で、聞き取りできない音声をよく理解できるようにする
処理とを併用して提供する音声再生装置を実現するもの
である。
【0101】受信音声を明瞭にする手段としては、先と
同様にダイナミックレンジ圧縮以外にも、例えば、リミ
ッター動作により上限値を制限する動作を行うグラフィ
ックイコライザや、ホルマント周波数近傍帯域のマスキ
ング補償のみを実施しても、明瞭度の改善効果が期待さ
れる。
【0102】(実施の形態5)以下、本発明の実施の形
態5について、図面を参照しながら説明する。
【0103】本実施の形態における音声再生装置の構成
図は図2と同様であり、第2の実施の形態と異なる部分
は、音声分析手段の動作および音声強調処理を制御する
再生制御手段の動作である。
【0104】基本的な動作に関しては実施の形態2と同
様であるので説明を省略する。
【0105】本実施の形態の特徴は、音声分析手段にお
いて音声・非音声判別を行い、音声と判定された区間と
その前後数十msecの区間にのみ音声強調処理を実行する
ことである。
【0106】非音声区間への音声強調処理は、音声情報
を含まない非音声信号部分、例えば扉を閉める衝撃音や
交通騒音など、に対するマスキング補償によって不必要
な信号をより強調して聴取させることになり、使用者の
疲労を増大させる恐れがある。したがって、本実施例で
は、音声情報を含み、聞き取りを必要とする音声区間と
その前後の区間に重点的に音声強調処理を実施し、疲労
することなく明瞭な音声を再生することを目的としてい
る。
【0107】この音声・非音声判別技術に関しては、例
えば、特許番号第2797861号などを用いれば、人
間の音声が含まれる区間を検出して区間の判別が可能と
なる。このように、記録制御手段で予め周囲騒音によっ
て受信した音声データがマスキングによって聴取困難な
ことを予測し、聴取不可能な部分の音声データと音声分
析結果とを音声記録メディアに保存しておくことで、使
用者が再聴取の要求を発生しても即座に再生を行うこと
が可能となる。
【0108】また、再聴取する要求が発生した時点での
周囲騒音と受信音声データとのマスキング補償を行い、
さらに音声区間とその前後数十msecの区間にのみ音声強
調処理を適用することで、聞こえにくかった音声部分を
明瞭にかつ、耳障りな非音声区間はそのまま聴取する処
理を提供する音声再生装置を実現するものである。
【0109】なお、本実施の形態では、音声記録メディ
アへの記録/削除をマスキング総和量あるいはマスキン
グ総和量の変化度合いに基づいて制御を行うが、これに
音声・非音声判別結果を考慮して、長い時間の非音声区
間は削除するものとしてもよい。
【0110】(実施の形態6)以下、本発明の実施の形
態6について、図面を参照しながら説明する。
【0111】本実施の形態における音声再生装置の構成
は図3と同様であり、実施の形態3と異なる部分は、音
声分析手段の動作および音声強調処理を制御する再生制
御手段の動作である。基本的な動作に関しては実施の形
態3と同様であるので説明を省略する。
【0112】本実施の形態の特徴は、音声分析手段にお
いて音声・非音声判別を行い、音声と判定された区間と
その前後数十msecの区間にのみ音声強調処理を実行する
ことである。
【0113】非音声区間への音声強調処理は、音声情報
を含まない非音声信号部分、例えば扉を閉める衝撃音や
交通騒音など、に対するマスキング補償によって不必要
な信号をより強調して聴取させることになり、使用者の
疲労を増大させる恐れがある。また、音声始端からの連
続する音声の継続時間が長い文章の場合、周囲騒音が大
きい状況では聞き取り理解することが困難であることが
多い。
【0114】したがって、本実施例では、音声情報を含
み、聞き取りを必要とする音声区間とその前後の区間に
重点的にマスキング補償による音声強調処理を実施し、
長い文章の音声データの場合には話速の低減化も同時に
施して、明瞭で理解しやすい音声を再生することを目的
としている。
【0115】話速の低減化はNHKなどによっても提案さ
れているが、この場合、文頭の部分はゆっくりと再生
し、その後は次第に話速を早める処理を行うことを特徴
としている。この場合、文頭の情報は知覚・理解されや
すくなることが考えられるが、連続する文章の後方部分
の単語などの了解度が十分に向上できない課題を有する
ものである。したがって本発明では、音声始端からの連
続する音声の継続時間が所定の時間長の閾値を越える場
合には、それ以降の音声区間の話速をしだいに低減する
制御を行うものである。
【0116】この処理を実現するためには速度変換処理
の時間軸伸長比のパラメータを連続的に変化させればよ
い。
【0117】図7には速度変換処理の時間軸伸長比を連
続的に変化させる一例を示す。この例では、所定の時間
長の閾値をこえるまでは、時間軸伸長比1.0、すなわ
ち、時間軸伸長は適用されない。
【0118】そして、この閾値を越える継続時間長の音
声区間に対しては、しだいに話速を低減し、終端部では
時間軸伸長比1.2で速度変換処理されることになる。こ
れにより長い文章における後方部分の理解が補償される
ため、より理解しやすい音声として聴取可能となる。
【0119】このように、再聴取する要求が発生した時
点での周囲騒音と受信音声信号とのマスキング補償を音
声区間に対して行うことで、聞こえにくかった音声部分
を明瞭に聴取する処理と同時に、受信した音声の始端か
らの継続時間長が長い場合に話速の低減化処理を行うこ
とで、聞き取りできない音声をよく理解できるようにす
る処理とを併用して提供する音声再生装置を実現するも
のである。
【0120】受信音声を明瞭にする手段としてはダイナ
ミックレンジ圧縮以外にも考えられる。例えば、リミッ
ター動作により上限値を制限する動作を行うグラフィッ
クイコライザなども同等の動作が可能である。また、ホ
ルマント周波数を推定することにより、このホルマント
周波数近傍帯域のマスキング補償のみを実施しても、明
瞭度の改善効果が期待される。あるいはこれらを組み合
わせた構成も考えられる。
【0121】(実施の形態7)以下本発明の第7の実施
の形態について、図面を参照しながら説明する。本実施
の形態における音声再生装置の構成図は図4と同様であ
り、第4の実施の形態と異なる部分は、音声分析手段の
動作および音声強調処理を制御する再生制御手段の動作
である。
【0122】基本的な動作に関しては実施の形態4と同
様であるので説明を省略する。
【0123】本実施の形態の特徴は、音声分析手段にお
いて音声・非音声判別を行い、音声と判定された区間と
その前後数十msecの区間にのみ音声強調処理を実行する
ことである。
【0124】非音声区間への音声強調処理は、音声情報
を含まない非音声信号部分、例えば扉を閉める衝撃音や
交通騒音など、に対するマスキング補償によって不必要
な信号をより強調して聴取させることになり、使用者の
疲労を増大させる恐れがある。また、周囲騒音によるマ
スキング量が大きくなると聴覚的な負担が大きくなり、
受信した音声データの理解が困難になる。
【0125】したがって、本実施の形態では、音声情報
を含み、聞き取りを必要とする音声区間とその前後の区
間に重点的にマスキング補償を行うとともに、周囲騒音
によるマスキング総和量あるいはマスキング総和量の変
化度合いに応じて聴取する音声の話速を低減する処理を
施す音声強調処理を実施し、明瞭で理解しやすい音声を
再生する。
【0126】このように、記録制御手段で予め周囲騒音
によって受信した音声データがマスキングによって聴取
困難なことを予測し、聴取不可能な部分の音声データと
音声分析結果と話速推定結果とを音声記録メディアに保
存しておくことで、使用者が再聴取の要求を発生しても
即座に再生を行うことが可能となる。
【0127】また、再聴取する要求が発生した時点での
周囲騒音と受信音声データとのマスキング補償を行い、
さらに音声区間とその前後数十msecの区間にのみ音声強
調処理を適用し、また、話速推定結果と周囲騒音による
マスキング総和量とを考慮した話速の低減を行うこと
で、聞き取りできない音声をよく理解できるようにする
処理とを併用して提供する音声再生装置を実現するもの
である。
【0128】この実施形態では、話速低減化のための時
間軸伸長比を、話速推定結果とマスキング総和量を考慮
して決定しているが、これに、さらに音声始端からの継
続時間長を考慮して決定する方法でも、より有効な文章
了解度を得るために有効であると考えられる。
【0129】なお、本実施の形態では、音声記録メディ
アへの記録/削除をマスキング総和量あるいはマスキン
グ総和量の変化度合いに基づいて制御を行うが、これに
音声・非音声判別結果を考慮して、長い時間の非音声区
間は削除するものとしてもよい。
【0130】
【発明の効果】以上のように、本発明では、受信した音
声データを音声記録メディアに記録し、聞き逃した音声
を再聴取する際に、適応的な信号処理を実行すること
で、再生音声の了解性を向上することができる。例え
ば、周囲騒音と受信した音声データとのマスキング補償
を行うと同時に話速の低減を行うことによりマスキング
の影響を除去した明瞭な音声を、理解しやすい速度で聴
取することが可能となる音声再生装置を実現できる。
【0131】また、周囲騒音によって受信した音声デー
タがマスキングによって聴取困難であることを予測し、
その区間の音声記録メディアに記録することで、メモリ
容量を節約しつつ、再聴取の要求に対して、迅速かつ確
実に聞き逃した音声を聴取することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声再生装置の
構成を示すブロック図
【図2】本発明の実施の形態2における音声再生装置の
構成を示すブロック図
【図3】本発明の実施の形態3における音声再生装置の
構成を示すブロック図
【図4】本発明の実施の形態4における音声再生装置の
構成を示すブロック図
【図5】音声強調処理手段の内部構成例を示すブロック
【図6】ダイナミックレンジ圧縮処理の入出力特性を示
す図
【図7】速度変換処理の時間軸伸長比を示す図
【図8】従来の音声再生装置の構成例示すブロック図
【符号の説明】
11 RF受信部 12 音声記録メディア 13 音声強調処理手段 14 第1の音声分析手段 15 第2の音声分析手段 16 マスキング量推定手段 17 再生制御手段 18 切り換え手段 19 記録制御手段 20 話速推定手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 茨木 悟 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 金森 丈郎 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5K027 AA11 BB03 DD14 DD16 DD18 5K039 AA03 AA08 BB04 CC04 CC06 EE06 JJ01 9A001 BB01 BB03 BB04 CC05 CC07 EE02 HH15 HH16 LL02

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 受信した音声信号を記録メディアに保存
    しておき、必要に応じて前記音声信号を前記記録メディ
    アから読み出し、所定の信号処理を施して再生するに際
    し、再生時点における聴取者の周囲の環境騒音のレベル
    に基づき、前記信号処理を適応的に変化させることを特
    徴とする音声再生方法。
  2. 【請求項2】 受信した音声信号を記録メディアに保存
    しておき、必要に応じて前記音声信号を前記記録メディ
    アから読み出し、所定の信号処理を施して再生するに際
    し、再生時点における聴取者の周囲の環境騒音のレベル
    および再生しようとする音声の話速の情報に基づき、前
    記信号処理を適応的に変化させることを特徴とする音声
    再生方法。
  3. 【請求項3】 信号の受信時点における聴取者の周囲の
    環境騒音の状況に応じて、受信した音声信号とその分析
    結果の記録メディアへの保存/非保存を選択し、再聴取
    要求が発生すると、その要求発生時点において前記記録
    メディアに保存されている音声信号とその分析結果を読
    み出すと共に、その要求発生時点における聴取者の周囲
    の環境騒音を分析し、その環境騒音の分析結果と前記記
    録メディアから読み出された受信した音声信号について
    の分析結果とを比較して、受信した信号が前記再聴取要
    求が発生した時点の環境騒音によってマスキングされる
    量を推定し、その推定されたマスキング量を補償するよ
    うに、前記読み出された音声信号について適応的な信号
    処理を施し、これによって音声を再生することを特徴と
    する音声再生方法。
  4. 【請求項4】 信号の受信時点における聴取者の周囲の
    環境騒音の状況に応じて、受信した音声信号とその分析
    結果,および前記音声信号の話速情報の記録メディアへ
    の保存/非保存を選択し、再聴取要求が発生すると、そ
    の要求発生時点において前記記録メディアに保存されて
    いる音声信号とその分析結果,および前記話速情報を読
    み出すと共に、その要求発生時点における聴取者の周囲
    の環境騒音を分析し、その環境騒音の分析結果と前記記
    録メディアから読み出された受信した音声信号について
    の分析結果とを比較して、受信した信号が前記再聴取要
    求が発生した時点の環境騒音によってマスキングされる
    量を推定し、その推定されたマスキング量および前記読
    み出された話速情報に基づいて、前記読み出された音声
    信号について適応的な信号処理を施し、これによって音
    声を再生することを特徴とする音声再生方法。
  5. 【請求項5】 受信した音声データを分析する第1の音
    声分析手段と、前記受信した音声データを記録する音声
    記録メディアと、収音した受信側周囲騒音を分析する第
    2の音声分析手段と、前記第1および第2の音声分析手
    段の分析結果に基づき記録した音声データが周囲騒音か
    らマスキングされる値を推定するマスキング量推定手段
    と、騒音によるマスキング効果を補償して音声信号を明
    瞭に強調する処理を行う音声強調処理手段と、前記推定
    されたマスキング量をもとに前記音声強調処理手段にお
    ける音声強調処理パラメータを制御する再生制御手段
    と、を有することを特徴とする音声再生装置。
  6. 【請求項6】 受信した音声データおよび収音した受信
    側周囲騒音を分析する音声分析手段と、前記受信した音
    声データとこの音声データを前記音声分析手段によって
    分析した結果とを記録する音声記録メディアと、前記音
    声分析手段による、前記受信した音声データの分析結果
    および収音した受信側周囲騒音の分析結果とに基き、記
    録した音声データが周囲騒音からマスキングされる値を
    推定するマスキング量推定手段と、このマスキング量推
    定手段で求めた音声データへのマスキング総和量あるい
    はマスキング総和量の変化度合いを基にして前記音声記
    録メディアへの書き込み制御を行う記録制御手段と、騒
    音によるマスキング効果を補償して音声信号を明瞭に強
    調する処理を行う音声強調処理手段と、前記推定された
    マスキング量をもとに、前記音声強調手段における音声
    強調処理パラメータを制御する再生制御手段と、を有
    し、前記記録メディアには、周囲騒音が増大して受信音
    声へのマスキングが所定レベルになった場合における受
    信音声が記録されることを特徴とする音声再生装置。
  7. 【請求項7】 受信した音声データを分析する第1の音
    声分析手段と、前記受信した音声データを記録する音声
    記録メディアと、前記受信した音声データの話速を推定
    する話速推定手段と、収音した受信側周囲騒音を分析す
    る第2の音声分析手段と、前記第1および第2の音声分
    析手段による分析結果に基づき記録した音声データが周
    囲騒音からマスキングされる値を推定するマスキング量
    推定手段と、騒音によるマスキング効果の補償と話速の
    低減化を施して音声信号を明瞭にゆっくりとした早さの
    音声に強調する処理を行う音声強調処理手段と、前記推
    定されたマスキング量および話速をもとに前記音声強調
    処理手段における音声強調処理パラメータを制御する再
    生制御手段と、を有することを特徴とする音声再生装
    置。
  8. 【請求項8】 受信した音声データおよび収音した受信
    側周囲騒音の分析をを行なう音声分析手段と、前記受信
    した音声データの話速を推定する話速推定手段と、前記
    受信した音声データとこの音声データを前記音声分析手
    段により分析した結果と前記話速推定手段で推定した結
    果とを記録する音声記録メディアと、前記受信した音声
    データを分析した結果と収音した受信側周囲騒音の分析
    結果とに基き、記録した音声データが周囲騒音からマス
    キングされる値を推定するマスキング量推定手段と、前
    記マスキング量推定手段で求めた音声データへのマスキ
    ング総和量あるいはマスキング総和量の変化度合いを基
    に前記音声記録メディアへの書き込み制御を行う記録制
    御手段と、騒音によるマスキング効果の補償と話速の低
    減化を施して音声信号を明瞭にゆっくりとした早さの音
    声に強調する処理を行う音声強調処理手段と、前記推定
    されたマスキング量および音声記録メディアに記録した
    話速をもとに前記音声強調処理手段における音声強調処
    理のパラメータを制御する再生制御手段と、を有し、前
    記記録メディアには、周囲騒音が増大して受信音声への
    マスキングが所定レベルになった場合における受信音声
    が記録されることを特徴とする音声再生装置。
  9. 【請求項9】 前記音声強調処理手段は、ダイナミック
    レンジ圧縮処理手段,周波数特性補正手段,ホルマント
    強調処理手段のいずれかを含んで構成されることを特徴
    とする請求項5または請求項6記載の音声再生装置。
  10. 【請求項10】 前記音声強調処理手段は、ダイナミッ
    クレンジ圧縮処理手段,周波数特性補正手段,ホルマン
    ト強調処理手段,話速変換処理手段のいずれかを含んで
    構成されることを特徴とする請求項5〜請求項8のいず
    れか記載の音声再生装置。
  11. 【請求項11】 前記第1の音声分析手段は、音声デー
    タの主要な成分が音声であるか非音声であるかの判別を
    行う音声・非音声判別手段を備え、分析区間の音声・非
    音声判定結果とその周波数分析結果を出力し、前記再生
    制御手段は、主として音声区間に対して強調処理を行わ
    せるように前記音声強調処理手段を制御することを特徴
    とする請求項7または請求項8記載の音声再生装置。
  12. 【請求項12】 前記再生制御手段は、音声・非音声判
    定結果を元に音声データの始端からの音声区間継続時間
    長を計算し、始端からの継続時間長に対応して関連付け
    た再生速度に低減するように前記音声強調処理手段を制
    御することを特徴とする請求項11記載の音声再生装
    置。
  13. 【請求項13】 前記再生制御手段は、音声・非音声判
    定結果を元に音声データの始端からの音声区間継続時間
    長を計算し、音声区間へのマスキング補償を行いかつ、
    連続した音声区間が所定の時間長以上の場合に次第に再
    生速度を低減するように前記音声強調処理手段を制御す
    ることを特徴とする請求項11記載の音声再生装置。
  14. 【請求項14】 前記再生制御手段は、音声データの主
    要スペクトル部分への周囲騒音によるマスキング総和量
    を求め、そのマスキング総和量あるいはマスキング総和
    量の変化度合いに関連付けた再生速度に低減するように
    前記音声強調処理手段を制御することを特徴とする請求
    項11記載の音声再生装置。
  15. 【請求項15】 前記再生制御手段は、音声・非音声判
    定結果を元に音声データの始端からの音声区間継続時間
    長を計算するとともに音声データの主要スペクトル部分
    への周囲騒音によるマスキング総和量を計算し、始端か
    らの音声区間継続時間長とマスキング総和量あるいはマ
    スキング総和量の変化度合いとに対応して関連付けた再
    生速度に低減するように前記音声強調処理手段を制御す
    ることを特徴とする請求項11記載の音声再生装置。
  16. 【請求項16】 請求項5〜請求項15のいずれかに記
    載の音声再生装置を搭載した通信装置。
JP11161369A 1999-06-08 1999-06-08 音声再生方法および音声再生装置 Withdrawn JP2000349893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11161369A JP2000349893A (ja) 1999-06-08 1999-06-08 音声再生方法および音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11161369A JP2000349893A (ja) 1999-06-08 1999-06-08 音声再生方法および音声再生装置

Publications (1)

Publication Number Publication Date
JP2000349893A true JP2000349893A (ja) 2000-12-15

Family

ID=15733787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11161369A Withdrawn JP2000349893A (ja) 1999-06-08 1999-06-08 音声再生方法および音声再生装置

Country Status (1)

Country Link
JP (1) JP2000349893A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置
JP2007243493A (ja) * 2006-03-07 2007-09-20 Sanyo Electric Co Ltd 携帯機器
EP2141695A1 (en) 2008-07-02 2010-01-06 Fujitsu Limited Speech sound enhancement device
JP2010200350A (ja) * 2001-08-07 2010-09-09 Emma Mixed Signal Cv 音響心理学的モデル及びオーバーサンプル型フィルタバンクを用いる音声明瞭度の向上
US8457955B2 (en) 2009-09-02 2013-06-04 Fujitsu Limited Voice reproduction with playback time delay and speed based on background noise and speech characteristics
US9330679B2 (en) 2012-12-12 2016-05-03 Fujitsu Limited Voice processing device, voice processing method

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010200350A (ja) * 2001-08-07 2010-09-09 Emma Mixed Signal Cv 音響心理学的モデル及びオーバーサンプル型フィルタバンクを用いる音声明瞭度の向上
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置
US7428488B2 (en) 2002-07-25 2008-09-23 Fujitsu Limited Received voice processing apparatus
JP2007243493A (ja) * 2006-03-07 2007-09-20 Sanyo Electric Co Ltd 携帯機器
EP2141695A1 (en) 2008-07-02 2010-01-06 Fujitsu Limited Speech sound enhancement device
US8560308B2 (en) 2008-07-02 2013-10-15 Fujitsu Limited Speech sound enhancement device utilizing ratio of the ambient to background noise
US8457955B2 (en) 2009-09-02 2013-06-04 Fujitsu Limited Voice reproduction with playback time delay and speed based on background noise and speech characteristics
US9330679B2 (en) 2012-12-12 2016-05-03 Fujitsu Limited Voice processing device, voice processing method

Similar Documents

Publication Publication Date Title
US7577263B2 (en) System for audio signal processing
US9208767B2 (en) Method for adaptive audio signal shaping for improved playback in a noisy environment
US20070053528A1 (en) Method and apparatus for automatic volume control in an audio player of a mobile communication terminal
JP5151762B2 (ja) 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2730868B2 (ja) オーディオシステムおよび明瞭度増加方法
JP4018571B2 (ja) 音声強調装置
KR101068227B1 (ko) 명료도 향상장치와 이를 이용한 음성출력장치
JP5012995B2 (ja) オーディオ信号処理装置及びオーディオ信号処理方法
US7242784B2 (en) Dynamic gain control of audio in a communication device
CN102804260A (zh) 声音信号处理装置以及声音信号处理方法
JP2004061617A (ja) 受話音声処理装置
US20040158458A1 (en) Narrowband speech signal transmission system with perceptual low-frequency enhancement
JP2008309955A (ja) ノイズサプレス装置
US7565283B2 (en) Method and system for controlling potentially harmful signals in a signal arranged to convey speech
JP2000349893A (ja) 音声再生方法および音声再生装置
JP2012095047A (ja) 音声処理装置
JP2002232247A (ja) 適応音質音量制御装置、並びに、適応音質音量制御装置を用いた音響装置、通信端末装置および情報端末装置
WO2007049222A1 (en) Adaptive volume control for a speech reproduction system
JP2001188599A (ja) オーディオ信号復号装置
JP2010085913A (ja) 音補正装置
WO2011027437A1 (ja) 音声再生装置および音声再生方法
JP2965788B2 (ja) 音声用利得制御装置および音声記録再生装置
JP2022547860A (ja) コンテキスト適応の音声了解度を向上させる方法
JP2003345375A (ja) 音声再生装置および音声再生システム
JP2586847B2 (ja) 電子電話機

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060116

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070228