JP2011170261A - 音声強調装置及び音声強調プログラム - Google Patents

音声強調装置及び音声強調プログラム Download PDF

Info

Publication number
JP2011170261A
JP2011170261A JP2010036229A JP2010036229A JP2011170261A JP 2011170261 A JP2011170261 A JP 2011170261A JP 2010036229 A JP2010036229 A JP 2010036229A JP 2010036229 A JP2010036229 A JP 2010036229A JP 2011170261 A JP2011170261 A JP 2011170261A
Authority
JP
Japan
Prior art keywords
pitch
speech
signal
lpc
emphasis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010036229A
Other languages
English (en)
Inventor
Atsushi Tashiro
厚史 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2010036229A priority Critical patent/JP2011170261A/ja
Publication of JP2011170261A publication Critical patent/JP2011170261A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 フォルマント強調より効果的に明瞭度を向上できる音声強調装置を提供する。
【解決手段】 本発明は、音声の明瞭度を向上させる音声強調装置に関する。そして、入力された音声信号の音高を推定する音高推定手段と、推定された音高から音高の調整量を決定する音高調整量決定手段と、音高調整量に基づき、入力された音声信号の音高を変化させる音高変更手段とを有することを特徴とする。音高操作は、人間の聴覚は、約4kHz付近が最も敏感に聞き取ることができ、この周波数から離れるほど鈍感になるという特性に合致し、より効果的に明瞭度を向上させることができる。
【選択図】 図1

Description

本発明は音声強調装置及び音声強調プログラムに関し、例えば、電話端末や、電話端末を複数収容したゲートウェイ装置に適用し得るものである。
音声強調装置は、騒音環境下など音声の聴取がし難い環境下においても、音声を明瞭に聞くことができるように処理する装置であり、既に様々な音声強調技術が提案されている。例えば、特許文献1に記載の技術がある。
特許文献1の記載技術では、入力音声信号を音声分析部で分析して線形予測係数(LPC)を求め、このLPCを音声信号の線スペクトル対(LSP)に変換する。その後、音声復号部では、このLSPについてLSP解析部により隣接する次元間の距離を算出し、LSP調整量算出部によりこのLSPの次元間の距離がより接近しているLSPに対して、より大きな値となるLSP調整量を算出する。LSP調整部は算出されたLSP調整量を基に、隣接次元間距離がより近いLSP同士が更に接近するようにLSPを調整する。このように調整されたLSPをLPCに変換し、LPC合成部はこのLPCと音源パラメータとを用いて、フォルマント強調された音声を合成して出力する。
すなわち、特許文献1の記載技術は、線形予測係数より計算される線スペクトル対を分析、調整することにより、音声信号のフォルマントを強調し、音声の明瞭度を向上させるものである。
特開2004−86102号
しかしながら、特許文献1の記載技術を含め、音声信号のフォルマント強調による音声明瞭化技術は、明瞭化に限界があって明瞭化が不十分なことも生じている。
そのため、より効果的な明瞭度を実現できる音声強調装置及び音声強調プログラムが望まれている。
第1の本発明は、音声の明瞭度を向上させる音声強調装置において、(1)入力された音声信号の音高を推定する音高推定手段と、(2)推定された音高から音高の調整量を決定する音高調整量決定手段と、(3)上記音高調整量に基づき、入力された上記音声信号の音高を変化させる音高変更手段とを有する音高操作部を有することを特徴とする。
第2の本発明の音声強調プログラムは、コンピュータを、(1)入力された音声信号の音高を推定する音高推定手段と、(2)推定された音高から音高の調整量を決定する音高調整量決定手段と、(3)上記音高調整量に基づき、入力された上記音声信号の音高を変化させる音高変更手段として機能させることを特徴とする。
本発明によれば、音高を操作して音声の明瞭度を高めるようにしたので、人間の聴覚は、約4kHz付近が最も敏感に聞き取ることができ、この周波数から離れるほど鈍感になるという特性に合致し、より効果的に明瞭度を向上させることができる。
第1の実施形態に係る音声強調装置の機能的構成を示すブロック図である。 第2の実施形態に係る音声強調装置の機能的構成を示すブロック図である。 第3の実施形態に係る音声強調装置の機能的構成を示すブロック図である。
(A)第1の実施形態
以下、本発明による音声強調装置及び音声強調プログラムの第1の実施形態を、図面を参照しながら説明する。
第1の実施形態は、音声信号のフォルマント強調(包絡強調)により音声の明瞭度向上と、新たな音声の明瞭度向上方法とを組み合わせたものである。新たな音声の明瞭度向上方法は、音声信号の音高を操作させる方法である。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声強調装置の機能的構成を示すブロック図である。
第1の実施形態の音声強調装置は、電話端末、若しくは、電話端末を複数収容したゲートウェイ装置に搭載されるものであり、搭載される電話端末はソフトフォンであっても良い。第1の実施形態の音声強調装置は、近端話者からの音声信号を強調して遠端話者側に送出する位置に設けられたものであっても良く、また、遠端話者からの音声信号を強調する位置に設けられたものであっても良い。さらに、第1の実施形態の音声強調装置は、ハードウェアによって実現されるものであっても良く、また、CPUが音声強調プログラムを実行することにより実現されるものであっても良い。搭載される装置や位置、実現構成を問わず、第1の実施形態の音声強調装置の構成は、機能的には、図1で表すことができる。
図1において、第1の実施形態の音声強調装置1は、フォルマント強調部10と音高操作部20とを有する。フォルマント強調部10は、LPC分析器11、LPC調整器12及びLPC合成器13を有し、音高操作部20は、基本周期推定器21、出力制御器22及び出力調整器23を有する。
フォルマント強調部10は、音声信号のフォルマント強調により音声の明瞭度を向上させようとした部分であり、音高操作部20は、音声信号の音高を高音にシフトさせることにより音声の明瞭度を向上させようとした部分である。
例えば、野球場などは観客の声で騒がしいが、高音のウグイス嬢の声は良く通る。また例えば、車掌は、自己の通常会話の音高より高い音で発声し、車内への連絡事項が良く伝わることを意図している。本件発明者は、このような事態に着目し、音声信号の音高を(高音に)シフトさせることにより音声の明瞭度を向上させることを発想した。人間の聴覚は、約4kHz付近が最も敏感に聞き取ることができ、この周波数から離れるほど鈍感な特性となっている。第1の実施形態においては、周波数修正処理によって、音声聴取において重要な基本周期T0に対応する基本周波数(1/T0)を4kHzへ近付くように修正することで、基本周波数を聞き取り易くし、結果として音声の明瞭度を改善させようとしている。
LPC分析器11には入力信号(デジタル音声信号)SIが入力され、LPC分析器11は、入力信号に対してLPC分析を実施し、得られたLPC係数LCxをLPC調整器12に与え、得られた残差信号SRをLPC合成器104に与える。
LPC調整器12は、LPC分析器11から与えられたLPC分析結果(LPC係数LCx)からスペクトル包絡のピークを求めると共に、当該ピークがより強調されるようにスペクトル包絡(フォルマント)の特性を調整し、その調整後のLPC係数MCxをLPC合成器13に与える。具体的な調整方法については、動作の項で明らかにする。
LPC合成器13は、残差信号SRに対し、調整後のLPC係数MCxを用いてLPC合成を実施し、合成結果をフォルマントが強調された音声信号(特性強調信)SFとして、音高操作部20の基本周期推定器21及び出力調整器23に与える。
入力された音声信号SIのフォルマント強調方法は、図1に示した方法に限定されず、既存又は将来提案されるいかなる方法を適用しても良い。例えば、特許文献1の記載方法を適用しても良く、さらには、特開2005−331783号公報や、特開2004−219757号公報や、特開平6−289986号公報に記載の方法などを適用しても良い。
音高操作部20における基本周期推定器21は、LPC合成器13から与えられた特性強調信号SFの基本周期(信号SFの音高を表す中心周波数についての周期)を推定し、当該推定結果を基本周期情報EPとして出力制御器22に与えるものである。図1では、基本周期推定器21が、特性強調信号SFの基本周期を捉えるものを示したが、基本周期推定器21が、入力信号SIの基本周期を捉えるものであっても良く、また、残差信号SRの基本周期を捉えるものであっても良い。要は、明瞭化対象の音声信号の基本周期を捉えるものであれば良い。また、自己相関処理などにより、基本周期を捉える方法の方が基本周波数を捉える方法より一般的に簡易な方法であるが、基本周波数を捉える方法を適用しても良い。要は、音声信号の音高を表すパラメータを推定できれば良い。
出力制御器22は、与えられた基本周期情報EPに基づいて、出力調整器23が特性強調信号SFの音高を高めるように制御するための出力調整情報ELを形成するものである。第1の実施形態の場合、出力制御器22は、1オクターブだけ音高を高めるための出力調整情報ELを形成する。
出力調整器23は、特性強調信号SFに対し、出力調整情報ELに基づき、周波数上昇処理(高音化処理)を実施し、その処理結果を音声が明瞭化された信号SOとして出力するものである。
音高操作部20における各部の処理の詳細については、後述する動作の項の説明で明らかにする。
(A−2)第1の実施形態の動作
次に、第1の実施形態の音声強調装置1の動作を説明する。以下では、第1の実施形態の音声強調装置1へ、サンプリング周波数が8kHzのデジタル音声信号(デジタルデータ)が、10ms毎のフレーム単位に入力されるとして説明する。ここで、相前後するフレームは、例えば、時間軸が1/2ずつオーバーラップしているものである。
なお、フレームの長さ(例えば、20msごと)や、サンプリング周波数(例えば、48kHz)が上記と異なるものであっても良いことは勿論である。さらに、フレーム単位の処理に限定されるものでもない。
まず、フォルマント強調部10の動作を説明する。
第1の実施形態の音声強調装置1へ入力された入力信号SIは、LPC分析器11により、LPC分析される。具体的なLPC分析方法としては、例えば、レビンソン・ダービン法を適用できる。このLPC分析では、LPC係数LCxだけでなく、後段でのLPC合成(LPC合成器13)のために、LPC残差(残差信号SR)も求める。
このようにして生成されたLPC係数LCxに基づいて、LPC調整器12によって、包絡強調処理(フォルマント強調処理)を実施し、処理後(調整後)のLPC係数MCxを得る。LPC係数LCx(のそれぞれの次数の値)に、対応するLPC係数LCxの次数の値xで累乗した任意のリーク係数α(0<α<1)を乗算して、調整後のLPC係数MCxを生成する。例えば、LPC係数の3次LCに対してαを乗算するようにする。この方法に代え、特許文献1に記載の方法を適用するようにしても良い。
調整LPC係数MCxと残差信号SRにより、LPC合成器13がLPC合成を実施し、包絡強調(フォルマント強調)された音声信号SFを得る。
このような包絡強調された音声信号SFが音高操作部20に入力され、音高が所定のオクターブだけ高められる。以下、音高操作部20における動作を説明する。
包絡強調音声信号SFは、基本周期推定器21に与えられ、基本周期推定器21によって基本周期T0が求められ、基本周期情報EPとして出力制御器22に与えられる。基本周期T0の計算方法としては自己相関法を適用できる。
基本周期情報EPは、出力制御器22によよって調整周波数dfに変換され、出力調整情報ELとし出力調整器23に与えられる。調整周波数dfへの変換には、例えば、(1)式を適用できる。
df=(230/1200−1)/T0 …(1)
(1)式は、基本周期T0に対応する周波数を、それより1/400オクターブだけ高くさせた周波数へ変換する式となっており、オクターブバンドでの調整になっている。この(1)式は、入力音声信号の周波数を4kHz付近に近付けるために経験的に得られた変換式であり、高くする度合いは、装置の使用者などに応じて、設計者が任意に設定することもできる。例えば、(2)式のように、基本周期T0に対応する周波数に比例した周波数を調整周波数dfとするようにしても良い。
df=1/(96×T0) …(2)
(1)式及び(2)式のいずれを適用する場合であっても、基本周期T0はT0>0を満足するので、調整周波数dfは常に正数をとる。
出力調整器23においては、出力調整情報ELに応じて、特性強調信号(包絡強調音声信号)SFの周波数が修正される。この修正方法としては、信号の周波数を、指示された変化周波数だけシフトさせる既存のいかなる方法を適用することができる。例えば、音声符号化で用いられているような基本周波数の分析・合成手法を適用し、合成前に基本周波数を変換することにより、特性強調信号SFの周波数を修正することができる。また例えば、FFT(高速フーリエ変換)−逆FFTなどを用いた周波数操作手法を適用することができる。
以下、修正方法の一例を具体的に説明する。特性強調信号SFに含まれる周波数sfに対応する時刻tでの角周波数ωs(ωs=2・π・sf、πは円周率)を用いて、特性強調信号SFをsin(ωs・t)で表し、出力調整情報ELに含まれる調整周波数dfに対応する角周波数をωd(ωd=2・π・df)で表すこととする。特性強調信号SFと、調整周波数dfを用いた余弦信号cos(ωd・t)とを乗算し、第1の乗算結果sin(ωs・t)・cos(ωd・t)を得る。同様に、特性強調信号SFを位相π/2だけ遅延させた信号sin(ωs・t−π/2)と正弦信号−sin(ωd・t)を乗算し、第2の乗算結果−sin(ωs・t−π/2)・sin(ωd・t)=cos(ωs・t)・sin(ωd・t)を得る。これら2つの乗算結果を加算して、特性強調信号SFの周波数を修正した信号を得る。ここで、加算結果は、sin(ωs・t)・cos(ωd・t)+cos(ws・t)・sin(ωd・t)=sin((ωs+ωd)・t)となり、元の特性強調信号SFに比べ、角周波数ωdに対応する周波数dfだけ周波数を高めた信号となっている。
音高操作部20は、上述のように、人間の聴覚が約4kHz付近を最も敏感に聞き取ることができることに基づいて、音高を、4kHzへより近付くようにさせることを意図して修正するものである。但し、当該周波数の修正は、原音を崩さない程度の値が望ましく、上述した(1)式や(2)式は、このような点を踏まえて決定されている。
なお、周波数修正処理に先立っては、サンプリング定理に係る折返し成分による音声品質の劣化を防止するため、カットオフ周波数をfn−df(fnは、特性強調信号SFのナイキスト周波数)とする低域通過フィルタを通過させておく必要がある。例えば、図1の位置P1又はP2に低域通過フィルタを介挿させるようにすれば良い。
(A−3)第1の実施形態の効果
第1の実施形態によれば、人間の聴覚が最も敏感に聞き取ることが周波数に近付くように、入力音声信号の基本周波数(音高)を操作するようにしたので、音声の聴取品質を高めることができ、言い換えると、音声信号の明瞭度を高めることができる。
また、第1の実施形態によれば、さらに、フォルマントの強調によっても、音声信号を明瞭化させているので、トータルとして、音声信号を従来よりも格段的に明瞭化させることができる。
(B)第2の実施形態
次に、本発明による音声強調装置及び音声強調プログラムの第2の実施形態を、図面を参照しながら説明する。以下では、第1の実施形態のとの相違点を中心に説明する。
図2は、第2の実施形態に係る音声強調装置の機能的構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図2において、第2の実施形態の音声強調装置1Aは、フォルマント強調部10Aと、音高操作部20Aと、有音/無音判定器30とを有する。フォルマント強調部10Aは、LPC分析器11、LPC調整器12A及びLPC合成器13を有し、音高操作部20は、基本周期推定器21、出力制御器22A及び出力調整器23を有する。
有音/無音判定器30は、入力信号SIが有音か無音かをフレーム単位に判定するものであり、有音又は無音を表す判定情報PJをLPC調整器12A及び出力制御器22Aに与えるものである。有音/無音判定方法としては、既存のいかなる方法を適用しても良いが、一例を挙げると以下の通りである。
フレーム(ここでは、10ms)毎に、入力される信号のRMS(2乗平均平方根)パワーPtを測定する。また、所定時間(例えば、1秒)ごとに、最小となるRMSパワーPmを検出して記憶しておく。記憶されている最小RMSパワーPmに所定のオフセットを足し込んだパワーを閾値(例えば、Pm+4dB)とし、現在、測定されたRMSパワーPtとの大小比較を行う。RMSパワーPtが閾値よりも大きければ音声がある(有音)と判定し、そうでなければ、音声がない(無音)と判定する。ここで、閾値の定め方やフレームの長さなどは、上記の値に限定されるものではない。有音又は無音を表す判定情報PJは、例えば、「0」又は「1」の論理値であっても良く、また例えば、Pt−(Pm+4dB)の差分結果であって、差分結果が与えられる構成要素が、差分結果の正負によって無音(負数の場合)、有音(0又は正数の場合)を認識するものであっても良い。
第2の実施形態の場合、フォルマント強調部10Aは、音声判定情報PJが有音を指示している場合に、第1の実施形態と同様の動作を行い、音声判定情報PJが無音を指示している場合に、入力信号SI、若しくは、入力信号SIと同等の信号を音高操作部20Aに出力するものである。このような出力の切替えを、第2の実施形態では、LPC調整器12Aが行っている。なお、無音時に、入力信号SIがフォルマント強調部10Aをバイパスするようなスイッチを設けるようにしても良い。
LPC調整器12Aは、音声判定情報PJが有音を指示している場合には、第1の実施形態と同様の動作を行う。これに対し、音声判定情報PJが無音を指示している場合には、LPC調整器12Aは、LPC分析器11から与えられたLPC係数LCxをそのまま調整LPC係数MCxとしてLPC合成器13へ出力する。従って、第1の実施形態とは異なり、音声判定情報PJが無音を指示している場合には、LPC調整器12Aからはフォルマント強調したLPC係数は出力されず、フォルマント強調部10Aからは、入力信号SIと同等の信号が音高操作部20Aに出力される。
第2の実施形態の場合、音高操作部20Aは、音声判定情報PJが有音を指示している場合に、第1の実施形態と同様の動作を行い、音声判定情報PJが無音を指示している場合に、当該音高操作部20Aへの入力信号SF、若しくは、入力信号SFと同等の信号を出力するものである。このような出力の切替えを、第2の実施形態では、出力制御器22Aが行っている。なお、結果として同様な動作が実施できるのであれば、音声判定情報PJを基本周期推定器21若しくは出力調整器23へ与えるようにしても良い。また、無音時に、特性強調信号SFが音高操作部20Aをバイパスするようなスイッチを設けるようにしても良い。
出力制御器22Aは、音声判定情報PJが有音を指示している場合には、第1の実施形態と同様の動作を行う。これに対し、音声判定情報PJが無音を指示している場合には、出力調整情報ELとして、出力調整器23が周波数修正処理を実施しないことを示す情報(例えば、0)を出力する。
なお、第1の実施形態と同様に、折返し成分による音声品質の劣化を防止するための低域通過フィルタを通過させておく必要があることはいうまでもない。
第2の実施形態によれば、第1の実施形態と同様な明瞭化効果に加え、以下の効果を奏することができる。入力信号が無音である場合に、周波数修正処理(音高操作)、包絡強調処理を停止させるようにしたので、背景騒音などの発話以外の信号が強調されることを抑止でき、結果として音声品質をさらに高めることができる。
(C)第3の実施形態
次に、本発明による音声強調装置及び音声強調プログラムの第3の実施形態を、図面を参照しながら説明する。以下では、第2の実施形態のとの相違点を中心に説明する。
図3は、第3の実施形態に係る音声強調装置の機能的構成を示すブロック図であり、第2の実施形態に係る図2との同一、対応部分には同一、対応符号を付して示している。
図3において、第3の実施形態の音声強調装置1Bは、フォルマント強調部10Bと、音高操作部20Bと、有音/無音判定器30と、強調指示スイッチ部31とを有する。フォルマント強調部10Bは、LPC分析器11、LPC調整器12B及びLPC合成器13を有し、音高操作部20は、基本周期推定器21、出力制御器22B及び出力調整器23を有する。
強調指示スイッチ部31は、例えば、利用者が操作するプッシュスイッチを備え、プッシュスイッチが操作される毎に、強調モードを巡回的に切り替えるものである。ここで、強調モードとしては、フォルマント強調部10B及び音高操作部20Bが共に強調動作する第1の強調モードと、音高操作部20Bだけが強調動作する第2の強調モードと、フォルマント強調部10Bだけが強調動作する第3の強調モードと、フォルマント強調部10B及び音高操作部20Bが共に強調動作しない非強調モードとの4つのモードがある。なお、強調指示スイッチ部31は、いずれのモードが選択されているかを利用者に示す表示素子などを備えていても構わない。
強調指示スイッチ部31は、第1の強調モードの選択時には、LPC調整器12B及び出力制御器22Bに強調を指示する信号B1、B2を出力する。強調指示スイッチ部31は、第2の強調モードの選択時には、LPC調整器12Bに対し、強調しないことを指示する信号B1を出力し、出力制御器22Bに対し強調を指示する信号B2を出力する。強調指示スイッチ部31は、第3の強調モードの選択時には、LPC調整器12Bに対し、強調を指示する信号B1を出力し、出力制御器22Bに対し強調しないことを指示する信号B2を出力する。強調指示スイッチ部31は、非強調モードの選択時には、LPC調整器12B及び出力制御器22Bに強調しないことを指示する信号B1、B2を出力する。
LPC調整器12Bは、音声判定情報PJが無音を指示している場合には、信号B1の内容に拘わらず、第2の実施形態と同様に動作する。LPC調整器12Bは、音声判定情報PJが有音を指示している場合であって、信号B1が強調を指示している場合には、第2の実施形態における有音時と同様な動作を行う。一方、LPC調整器12Bは、音声判定情報PJが有音を指示している場合であって、信号B1が強調しないことを指示している場合には、第2の実施形態における無音時と同様な動作を行う。
出力制御器22Bは、音声判定情報PJが無音を指示している場合には、信号B2の内容に拘わらず、第2の実施形態と同様に動作する。出力制御器22Bは、音声判定情報PJが有音を指示している場合であって、信号B2が強調を指示している場合には、第2の実施形態における有音時と同様な動作を行う。一方、出力制御器22Bは、音声判定情報PJが有音を指示している場合であって、信号B2が強調しないことを指示している場合には、第2の実施形態における無音時と同様な動作を行う。
なお、第1の実施形態と同様に、折返し成分による音声品質の劣化を防止するための低域通過フィルタを通過させておく必要があることはいうまでもない。
第3の実施形態によれば、第2の実施形態と同様な明瞭化効果に加え、利用者が明瞭化モードを任意に選択できるという効果を奏することができる。
(D)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記各実施形態においては、音高操作部に加え、フォルマント強調部を有するものを示したが、音高操作部だけを備える音声強調装置であっても良い。また、音高操作部と組み合わせる音声強調構成が、背景雑音除去部(ノイズキャンセラ)であっても良く、音高操作部とフォルマント強調部と背景雑音除去部とを組み合わせるようにしても良い。
また、上記各実施形態においては、フォルマント強調部による強調処理が終了した後に、音高操作部による強調を行うものを示したが、逆に、音高操作部による強調を行った後に、フォルマント強調部による強調を行うようにしても良い。
さらに、上記各実施形態においては、音高操作部による強調が音高を高くする操作のものを示したが、場合によっては、音高を低くする操作を行うようにしても良い。例えば、基本周期推定器が推定した基本周期に対応する基本周波数(音高)が、人間の聴覚が最も敏感に聞き取ることがでる4kHzより所定のマージンを超えて高い場合には、音高を低くする操作を行うようにしても良い。
上記第2の実施形態においては、無音時には、フォルマント強調部及び音高操作部による強調動作を実行させないものを示したが、無音時に、フォルマント強調部による強調は行うが、音高操作部による強調を実行しないものであっても良い。第3の実施形態についても、同様な変形実施形態を挙げることができる。
上記第2の実施形態においては、有音/無音によって、強調(明瞭化)するか否かを切り替えるものを示したが、他のパラメータによって、強調するか否かを切り替えるようにしても良い。例えば、入力音声信号のSN比を検出し、SN比が閾値より悪い場合に、強調動作を実行させるようにしても良い。
上記第3の実施形態は、第2の実施形態に、利用者のモード選択機能を追加したものを示したが、第1の実施形態に、利用者のモード選択機能を追加するようにしても良い。
上記第3の実施形態は、フォルマント強調部及び音高操作部のうち、強調動作するものを利用者が選択できるものを示したが、強調度合を利用者が選択できるようにしても良い。例えば、音高操作部について言えば、(1)式や(2)式で示す高音化の段階と、その半分程度の高音化の段階との2段階を設け、利用者が2段階の中から強調段階を選択できるようにしても良い。また例えば、フォルマント強調部について言えば、LPC調整器が利用する重み係数αiとして、2段階(2種類)を設け、利用者が2段階の中から強調段階を選択できるようにしても良い。
1、1A、1B…音声強調装置、10、10A、10B…フォルマント強調部、11…LPC分析器、12、12A、12B…LPC調整器、13…LPC合成器、20、20A、20B…音高操作部、21…基本周期推定器、22…出力制御器、23、23A、23B…出力調整器、30…有音/無音判定器、31…強調指示スイッチ部。

Claims (7)

  1. 音声の明瞭度を向上させる音声強調装置において、
    入力された音声信号の音高を推定する音高推定手段と、
    推定された音高から音高の調整量を決定する音高調整量決定手段と、
    上記音高調整量に基づき、入力された上記音声信号の音高を変化させる音高変更手段とを有する音高操作部を有する
    ことを特徴とする音声強調装置。
  2. 入力された音声信号が、明瞭度を向上させる必要があるか否かを判定する第1の強調判定手段を備え、明瞭度を向上させる必要があると判定されたときに、上記音高操作部が処理を実行することを特徴とする請求項1に記載の音声強調装置。
  3. 上記音高操作部の前段又は後段に、フォルマント強調により音声の明瞭化を向上させるフォルマント強調部を有することを特徴とする請求項1又は2に記載の音声強調装置。
  4. 入力された音声信号が、明瞭度を向上させる必要があるか否かを判定する第2の強調判定手段を備え、明瞭度を向上させる必要があると判定されたときに、上記フォルマント強調部が処理を実行することを特徴とする請求項3に記載の音声強調装置。
  5. 上記音高変更手段は、上記音声信号の音高を高くさせることを特徴とする請求項1〜4のいずれかに記載の音声強調装置。
  6. 上記音高調整量決定手段は、オクターブバンドを基準に音高の調整量を決定することを特徴とする請求項1〜5のいずれかに記載の音声強調装置。
  7. コンピュータを、
    入力された音声信号の音高を推定する音高推定手段と、
    推定された音高から音高の調整量を決定する音高調整量決定手段と、
    上記音高調整量に基づき、入力された上記音声信号の音高を変化させる音高変更手段と
    して機能させることを特徴とする音声強調プログラム。
JP2010036229A 2010-02-22 2010-02-22 音声強調装置及び音声強調プログラム Pending JP2011170261A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010036229A JP2011170261A (ja) 2010-02-22 2010-02-22 音声強調装置及び音声強調プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010036229A JP2011170261A (ja) 2010-02-22 2010-02-22 音声強調装置及び音声強調プログラム

Publications (1)

Publication Number Publication Date
JP2011170261A true JP2011170261A (ja) 2011-09-01

Family

ID=44684423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010036229A Pending JP2011170261A (ja) 2010-02-22 2010-02-22 音声強調装置及び音声強調プログラム

Country Status (1)

Country Link
JP (1) JP2011170261A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105788601A (zh) * 2014-12-25 2016-07-20 联芯科技有限公司 VoLTE的抖动隐藏方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006010907A (ja) * 2004-06-24 2006-01-12 Yamaha Corp 音声効果付与装置及び音声効果付与プログラム
JP2006119647A (ja) * 2005-09-16 2006-05-11 Yasuto Takeuchi ささやき声を通常の有声音声に擬似的に変換する装置
JP2006243006A (ja) * 2005-02-28 2006-09-14 Casio Comput Co Ltd 音響効果付与装置、基音抽出装置、及びプログラム
JP2008145841A (ja) * 2006-12-12 2008-06-26 Sony Corp 再生装置、再生方法、信号処理装置、信号処理方法
JP2008275836A (ja) * 2007-04-27 2008-11-13 National Institute Of Information & Communication Technology 読み上げ用ドキュメント処理方法及び装置
JP2009530680A (ja) * 2006-03-24 2009-08-27 ソニー コンピュータ エンタテインメント ヨーロッパ リミテッド 音声処理および装置
JP2010008922A (ja) * 2008-06-30 2010-01-14 Toshiba Corp 音声処理装置、音声処理方法及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006010907A (ja) * 2004-06-24 2006-01-12 Yamaha Corp 音声効果付与装置及び音声効果付与プログラム
JP2006243006A (ja) * 2005-02-28 2006-09-14 Casio Comput Co Ltd 音響効果付与装置、基音抽出装置、及びプログラム
JP2006119647A (ja) * 2005-09-16 2006-05-11 Yasuto Takeuchi ささやき声を通常の有声音声に擬似的に変換する装置
JP2009530680A (ja) * 2006-03-24 2009-08-27 ソニー コンピュータ エンタテインメント ヨーロッパ リミテッド 音声処理および装置
JP2008145841A (ja) * 2006-12-12 2008-06-26 Sony Corp 再生装置、再生方法、信号処理装置、信号処理方法
JP2008275836A (ja) * 2007-04-27 2008-11-13 National Institute Of Information & Communication Technology 読み上げ用ドキュメント処理方法及び装置
JP2010008922A (ja) * 2008-06-30 2010-01-14 Toshiba Corp 音声処理装置、音声処理方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6014018063; Dong-Yan Huang, et al.: 'Biologically Inspired Algorithm for Enhancement of Speech Intelligibility Over Telephone Channel' Proc. MMSP '09 , 20091005, pp.1-6, IEEE *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105788601A (zh) * 2014-12-25 2016-07-20 联芯科技有限公司 VoLTE的抖动隐藏方法和装置

Similar Documents

Publication Publication Date Title
JP6147744B2 (ja) 適応音声了解度処理システムおよび方法
JP5341128B2 (ja) 補聴器における安定性の改善
RU2585987C2 (ru) Устройство и способ обработки речевого/аудио сигнала
JP4836720B2 (ja) ノイズサプレス装置
EP2517202B1 (en) Method and device for speech bandwidth extension
JP5984943B2 (ja) 聴覚装置における安定性と音声の聴き取り易さの改善
US9589573B2 (en) Wind noise reduction
TWI559298B (zh) 用於音訊信號之諧波頻寬延展之方法、裝置及電腦可讀儲存器件
US20100217606A1 (en) Signal bandwidth expanding apparatus
JP2014232331A (ja) アダプティブ・インテリジェント・ノイズ抑制システム及び方法
RU2666316C2 (ru) Аппарат и способ улучшения аудиосигнала, система улучшения звука
WO2007069400A1 (ja) 帯域変換信号生成器及び帯域拡張装置
RU2411595C2 (ru) Улучшение разборчивости речи в мобильном коммуникационном устройстве путем управления работой вибратора в зависимости от фонового шума
JP2008309955A (ja) ノイズサプレス装置
GB2439660A (en) Voice band extension device
JP5777041B2 (ja) 帯域拡張装置及びプログラム、並びに、音声通信装置
JP2007310298A (ja) 帯域外信号生成装置及び周波数帯域拡張装置
JP2007310296A (ja) 帯域拡張装置及び方法
JP2011170261A (ja) 音声強調装置及び音声強調プログラム
EP1278185A2 (en) Method for improving noise reduction in speech transmission
JP3360423B2 (ja) 音声強調装置
JP2010151965A (ja) 音声処理装置、及び、音声処理方法
JP5458057B2 (ja) 信号広帯域化装置、信号広帯域化方法、及びそのプログラム
JP2002366178A (ja) オーディオ信号の帯域拡張方法及び帯域拡張装置
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140930