JP2010028663A - 音声レベル調整装置、音声レベル調整方法およびプログラム - Google Patents

音声レベル調整装置、音声レベル調整方法およびプログラム Download PDF

Info

Publication number
JP2010028663A
JP2010028663A JP2008189983A JP2008189983A JP2010028663A JP 2010028663 A JP2010028663 A JP 2010028663A JP 2008189983 A JP2008189983 A JP 2008189983A JP 2008189983 A JP2008189983 A JP 2008189983A JP 2010028663 A JP2010028663 A JP 2010028663A
Authority
JP
Japan
Prior art keywords
level
formant
specific
sound
change amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008189983A
Other languages
English (en)
Inventor
Nozomi Toki
望 土岐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Saitama Ltd
Original Assignee
NEC Saitama Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Saitama Ltd filed Critical NEC Saitama Ltd
Priority to JP2008189983A priority Critical patent/JP2010028663A/ja
Publication of JP2010028663A publication Critical patent/JP2010028663A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音割れの発生を抑制し、音声を聴き取り易くする。
【解決手段】標準ホルマント補正部18は、音声分析部13が検出した音声レベル同士の差と標準音声レベルSTとの比較に基づいて、第1ホルマント以外のホルマントの音声レベルを補正する。変更量算出部16は、補正された各ホルマントの音声レベルと当該ホルマントに対応する周波数での雑音レベルとの差に基づく、補正された各ホルマントの特定音声信号レベルの変更量の算出と、第1ホルマントP1の音声レベルと第1雑音レベルとに基づく第1ホルマントP1の音声レベルの変更量G1の算出とを行う。レベル変更部17は、変更量G1に基づいてホルマントの特定音声信号レベルをそれぞれ変更して出力する。
【選択図】図1

Description

本発明は、音声レベル調整装置、音声レベル調整方法およびプログラムに関する。
一般的に、マイクなどの音声入力機器へ音声とともに周囲の雑音が入力されてしまうと、その雑音が音声とともに増幅器や通信機器を介してスピーカなどの音声出力機器から出力されてしまう。そのため、出力される音声が聴き取りにくくなってしまうおそれがある。
このような状況となることを回避するために、音声の明瞭度を改善するための技術が考えられている。
一般的に音声の明瞭度を改善するために用いられる音声レベル調整装置200は、図16に示すように、レベル変更部240を用いて、マイク210で集音した音声VOのホルマントの強調と音量アップとを行う。これにより、当該音声VOにレベルの大きな雑音が含まれている場合でも、雑音レベルに対するホルマントのレベルが相対的に大きくなり、音声が聴き取り易いようにその明瞭度が改善される。
ここで「ホルマント(Formant)」とは、音声VOのスペクトラムにおける音声レベルのピークのことを指し、当該ピークが表れる周波数を「ホルマント周波数」という。ホルマント周波数のうちで最も低い(つまり、周波数が最も小さい)第1ホルマント周波数f1に表れるピークを第1ホルマントP1といい、n番目のホルマント周波数fnに表れるピークを第nホルマントPnという。
図17(a)に示すように、通常の人間の声のスペクトラムでは、当該スペクトラムに表れるホルマントのうちの第1ホルマントP1が有する音声レベルが最も大きく、周波数帯域が高くなるに伴って、第nホルマントにおける音声レベルは小さくなる。図17(a)の例では、第2ホルマントP2の音声レベルは、第1ホルマントP1の音声レベルよりも小さくなる。また、第3ホルマントP3の音声レベルは、第2ホルマントP2の音声レベルよりもさらに小さくなる。
レベル検出部220は、マイク210で集音した音声VOに含まれている雑音を示す雑音信号NSの雑音信号レベル(以下、「雑音レベルNLV」という)を検出する。
変更量算出部230は、レベル検出部220が検出した雑音レベルNLVに応じて、音声品質の改善対象である「特定音声信号OB」の音声レベルの調整を行う。
より具体的には、変更量算出部230は、雑音信号NSの雑音レベルNLVが大きくなるに伴って、特定音声信号OBの音声レベルOLV(「特定音声信号レベルOLV」)の変更量Gを大きくする。また、音声レベルOLVの変更量Gが大きくなるに伴って、音声レベルの総和である「音量」も大きくなる。
レベル変更部240は、変更量算出部230が大きくした音声レベルの変更量Gに基づいて、特定音声信号OBに含まれているホルマントの音声レベルOLVを変更する。これにより、特定音声信号OBが示す音声の明瞭度を改善する。
例えば、図17(b)に示すようなスペクトラムであれば、第1ホルマントP1の音声レベルOLVを小さくして、第2ホルマントP3および第3ホルマントP3それぞれの音声レベルOLVを大きくする。
また、レベル変更部240は、音声レベルOLVを変更した特定音声信号OBである「ホルマント強調信号FE」を出力する。
上述した一般的な音声レベル調整装置200は、話者ごとの声質の違いがあっても、音声ホルマントを強調と音量アップとを一律に行う、つまり、話者の声質に応じた調整を行わない。しかしながら、同じ雑音に対する音声の明瞭度は、個人ごと(例えば、男性と女性との間、大人と子供との間など)の声質などに応じて異なる。そのため、この音声レベル調整装置200においては、声質によっては音声が聴き取りにくいものとなってしまったり、音質が不自然なものとなってしまったりするおそれがある。
また、一般的に、雑音を構成する周波数成分それぞれによる違いなどによって、特定音声信号OBが雑音信号NSによってマスキングされる周波数も異なり、音声の明瞭度も相対的に異なる。しかしながら、上述した音声レベル調整装置200は、雑音レベルNLVによって音声ホルマントを強調するため、雑音の種類に対応した音声レベルの変更を行わない。そのため、当該音声レベル調整装置200においては、雑音信号を構成する周波数成分によって、音声が聴き取りにくいものとなってしまうおそれがある。
このような問題を回避するために、話者の声質や雑音に応じて音声の明瞭度を調整するための技術が考えられている(例えば、特許文献1参照。)。
特許文献1に開示された技術によれば、マイクが入力した音声を示す入力音声信号を、当該音声の声質に対応した低域と中域と高域との3つの周波数帯域に分割する。さらに、低域、中域および高域ごとの振幅制御特性に従って、低域、中域および高域それぞれにおける各出力音声レベルが最小可聴レベルと不快レベルとの間となるように設定する。さらに、特許文献1に開示された技術によれば、最小可聴レベルと不快レベルとの間で各出力音声レベルを設定する際に、低域、中域および高域ごとの雑音レベルに応じて、当該出力音声レベルそれぞれを調整する。
特開平09−068997号公報
特許文献1に開示された技術においては、第1ホルマントP1〜第3ホルマントP3ごとの出力音声レベルがそれぞれ不快レベル以下となるように、第1ホルマントP1〜第3ホルマントP3の各音質を個別に改善するが、第1ホルマントP1〜第3ホルマントP3同士の間における音声レベルの相対的な大きさについては考慮されていない。そのため、音質の改善がそれぞれ個別に施された第1ホルマントP1〜第3ホルマントP3の出力音声レベルすべてを総和した音量が過度に大きい場合、改善後の音質の劣化により、ホルマントの波形のピーク部分が潰れることにより特定音声信号OBがクリップする現象である「音割れ」が発生してしまうおそれがあるという問題点がある。音割れが発生した場合、音声品質を改善するための処理を施したにも関わらず、却って音声が聴き取りにくいものとなってしまう。
本発明は、上述した課題を解決する音声レベル調整装置、音声レベル調整方法およびプログラムを提供することを目的とする。
上記課題を解決するために、本発明の音声レベル調整装置は、音声を入力し、該音声のレベルに応じた音声信号を出力するマイクと、前記マイクが出力した音声信号を、特定音源が出力した音声を示す特定音声信号と、雑音を示す雑音信号とに分離してそれぞれ出力する信号分離部と、前記分離された特定音声信号に含まれる複数のホルマントそれぞれの特定音声信号レベルを検出する音声分析部と、前記ホルマントそれぞれの特定音声信号レベルがピークとなる周波数における前記雑音信号の雑音信号レベルを検出する雑音検出部と、前記検出された互いの特定音声信号レベルの差を示すホルマントレベル差と、該特定音声信号レベルを補正する際の基準となる標準音声レベルとの比較に基づいて、周波数が最も小さなホルマント以外のホルマントの特定音声信号レベルそれぞれを補正する標準ホルマント補正部と、前記補正されたホルマントの特定音声信号レベルそれぞれと該ホルマントに対応する周波数における雑音信号レベルそれぞれとのレベル差に基づいて、該補正されたホルマントそれぞれの特定音声信号レベルの変更量を算出するとともに、前記周波数が最も小さなホルマントの特定音声信号レベルと該周波数における雑音信号レベルとに基づいて、該周波数が最も小さなホルマントの特定音声信号レベルの変更量を算出する変更量算出部と、前記算出された変更量に基づいて前記ホルマントの特定音声信号レベルをそれぞれ変更し、該特定音声信号レベルが変更されたホルマントを含む前記特定音声信号を出力するレベル変更部とを有する。
上記課題を解決するために、本発明の音声レベル調整方法は、音声を入力し、該音声のレベルに応じた音声信号を出力する処理と、前記出力した音声信号を、特定音源が出力した音声を示す特定音声信号と、雑音を示す雑音信号とに分離してそれぞれ出力する処理と、前記分離された特定音声信号に含まれる複数のホルマントそれぞれの特定音声信号レベルを検出する処理と、前記ホルマントそれぞれの特定音声信号レベルがピークとなる周波数における前記雑音信号の雑音信号レベルを検出する処理と、前記検出された互いの特定音声信号レベルの差を示すホルマントレベル差と、該特定音声信号レベルを補正する際の基準となる標準音声レベルとの比較に基づいて、周波数が最も小さなホルマント以外のホルマントの特定音声信号レベルそれぞれを補正する処理と、前記補正されたホルマントの特定音声信号レベルそれぞれと該ホルマントに対応する周波数における雑音信号レベルそれぞれとのレベル差に基づいて、該補正されたホルマントそれぞれの特定音声信号レベルの変更量を算出するとともに、前記周波数が最も小さなホルマントの特定音声信号レベルと該周波数における雑音信号レベルとに基づいて、該周波数が最も小さなホルマントの特定音声信号レベルの変更量を算出する変更量算出処理と、前記算出された変更量に基づいて前記ホルマントの特定音声信号レベルをそれぞれ変更し、該特定音声信号レベルが変更されたホルマントを含む前記特定音声信号を出力するレベル変更処理とを有する。
また、コンピュータに実行させるプログラムであって、コンピュータに、音声を入力し、該音声のレベルに応じた音声信号を出力する手順と、前記出力した音声信号を、特定音源が出力した音声を示す特定音声信号と、雑音を示す雑音信号とに分離してそれぞれ出力する手順と、前記分離された特定音声信号に含まれる複数のホルマントそれぞれの特定音声信号レベルを検出する手順と、前記ホルマントそれぞれの特定音声信号レベルがピークとなる周波数における前記雑音信号の雑音信号レベルを検出する手順と、前記検出された互いの特定音声信号レベルの差を示すホルマントレベル差と、該特定音声信号レベルを補正する際の基準となる標準音声レベルとの比較に基づいて、周波数が最も小さなホルマント以外のホルマントの特定音声信号レベルそれぞれを補正する手順と、前記補正されたホルマントの特定音声信号レベルそれぞれと該ホルマントに対応する周波数における雑音信号レベルそれぞれとのレベル差に基づいて、該補正されたホルマントそれぞれの特定音声信号レベルの変更量を算出するとともに、前記周波数が最も小さなホルマントの特定音声信号レベルと該周波数における雑音信号レベルとに基づいて、該周波数が最も小さなホルマントの特定音声信号レベルの変更量を算出する変更量算出手順と、前記算出された変更量に基づいて前記ホルマントの特定音声信号レベルをそれぞれ変更し、該特定音声信号レベルが変更されたホルマントを含む前記特定音声信号を出力するレベル変更手順とを実行させる。
本発明によれば、入力した音声のレベルに応じて出力した音声信号を、特定音源が出力した音声を示す特定音声信号と、雑音を示す雑音信号とに分離してそれぞれ出力し、分離された特定音声信号に含まれる複数のホルマントそれぞれの特定音声信号レベルを検出し、ホルマントそれぞれの特定音声信号レベルがピークとなる周波数における雑音信号の雑音信号レベルを検出し、検出された互いの特定音声信号レベルの差を示すホルマントレベル差と、特定音声信号レベルを補正する際の基準となる標準音声レベルとの比較に基づいて、周波数が最も小さなホルマント以外のホルマントの特定音声信号レベルそれぞれを補正し、補正されたホルマントの特定音声信号レベルそれぞれとホルマントに対応する周波数における雑音信号レベルそれぞれとのレベル差に基づいて、補正されたホルマントそれぞれの特定音声信号レベルの変更量を算出するとともに、周波数が最も小さなホルマントの特定音声信号レベルと周波数における雑音信号レベルとに基づいて、周波数が最も小さなホルマントの特定音声信号レベルの変更量を算出し、算出された変更量に基づいてホルマントの特定音声信号レベルをそれぞれ変更し、特定音声信号レベルが変更されたホルマントを含む特定音声信号を出力する。
このような構成としたため、音声レベルの調整による音質の改善を施した際に、音割れが発生しない範囲で当該音質の改善を行うことができ、音声を聴き取り易くすることができる。
(実施形態1)
以下、本発明の実施形態1に従った音声レベル調整装置(音声レベル調整方法およびプログラムを含む)を説明する。
まず、実施形態1の音声レベル調整装置1の構成を説明する。
図1に示すように、音声レベル調整装置1は、マイク11と、信号分離部12と、音声分析部13と、雑音分析部14と、比較部15と、変更量算出部16と、レベル変更部17とを有する。
マイク11は、周囲から到来した音声VOのレベルに応じて、当該音声VOを音声信号SV(電気信号)へ変換し、該音声信号SVを出力する。
マイク11から出力された音声信号SVには、特定音源SRが出力した音声を示す特定音声信号OBと、該特定音源SR以外の音源が出力した雑音を示す雑音信号NSとが含まれている。なお、特定音声信号OBは、音声レベル調整装置1によって行われる音声品質の改善対象となる。
なお、以下では、特定音源SRは「話者」であり、音声品質の改善対象となる特定音声信号OBが「話者が発声した声」を示す音声信号である場合を例に挙げて説明する。また、特定音声信号OBには、第1ホルマントP1〜第3ホルマントP3の3つのホルマントが含まれている。
信号分離部12は、所定のタイミングごとに、マイク11が集音した音声VOを示す音声信号SVの音声レベルと、特定音声検出レベルLdとを比較する。
ここでいう「特定音声検出レベルLd」とは、特定音源SR(この例では、話者)からの音声がマイク11に到達したことを検出するための所定値である。
また、信号分離部12は、比較の結果、音声信号SVの音声レベルが特定音声検出レベルLdよりも大きい場合、該音声信号SVから特定音声信号OBを抽出し、当該特定音声信号OBを音声分析部13へ出力する。
ここで、音声信号VOから特定音声信号OBを抽出する方法については特に限定しない。
以下の説明例では、信号分離部12は、特定音声検出レベルLdよりも大きな音声レベルを有する音声信号SVから、当該音声信号SVが入力される直前に集音された音声信号SV(つまり、特定音声検出レベルLdよりも小さな音声レベルの音声信号SV)を減算する。そして、信号分離部12は、当該減算によって抽出された特定音声信号OBを音声分析部13へ出力する。
また、信号分離部12は、特定音声信号OBの抽出の際、特定音声検出レベルLdよりも大きな音声レベルの音声信号SVから減算された音声信号SVを、雑音信号NSとして雑音分析部14へ出力する。
音声分析部13は、信号分離部12から出力されてきた特定音声信号OBのスペクトルにおいて、「特定音声信号レベルOLV」である第1ホルマントP1〜第3ホルマントP3の音声レベルOLV1〜OLV3を検出する。
なお、以下では、第1ホルマントP1の音声レベルOLV1を「第1音声レベルOLV1」という。また、第2ホルマントP2の音声レベルOLV2を「第2音声レベルOLV2」といい、第3ホルマントP3の音声レベルOLV3を「第3音声レベルOLV3」という。
図2に示すように、音声分析部13は、帯域分割部131と、音声レベル検出部132−1〜132−3とを有する。なお、音声レベル検出部132−1〜132−3の数は、周波数帯域B1〜B3の数と同じである。
帯域分割部131は、例えば、バンドパスフィルタ(Band-pass filter;BPF)で構成される。帯域分割部131は、信号分離部12から出力されてきた特定音声信号OBを、所定の帯域幅をそれぞれ有する周波数帯域B1〜B3に分割する。
図3に示すように、帯域分割部131によって分割された周波数帯域B1〜B3それぞれには、第1ホルマント周波数f1〜第3ホルマント周波数f3が含まれている。なお、周波数帯域B1〜B3の数は「3」に限らず、任意でよい。
また、帯域分割部131は、周波数帯域B1〜B3ごとに分割した特定音声信号OBである「第1分割音声信号OB−1〜第3分割音声信号OB−3」を、音声レベル検出部132−1〜132−3へそれぞれ出力する。
より具体的には、帯域分割部131は、図4(a)に示す第1分割音声信号OB−1を音声レベル検出部132−1へ出力する。また、帯域分割部131は、図4(b)に示す第2分割音声信号OB−2を音声レベル検出部132−2へ出力する。また、帯域分割部131は、図4(c)に示す第3分割音声信号OB−3を音声レベル検出部132−3へ出力する。
さらに、帯域分割部131は、第1分割音声信号OB−1〜第3分割音声信号OB−3すべてをレベル変更部17へ出力する。
音声レベル検出部132−1〜132−3それぞれは、図4(a)〜4(c)に示した第1分割音声信号OB−1〜第3分割音声信号OB−3それぞれに含まれている第1ホルマントP1〜第3ホルマントP3の第1音声レベルOLV1〜第3音声レベルOLV3を検出する。なお、第1ホルマントP1〜第3ホルマントP3の第1音声レベルOLV1〜第3音声レベルOLV3の検出方法については特に限定しないが、ピークピッキングなどの一般的な検出方法でよい。
また、音声レベル検出部132−1〜132−3それぞれは、周波数帯域B1〜B3それぞれにて検出した第1音声レベルOLV1〜第3音声レベルOLV3を比較部15へ出力する。
図1に示した雑音分析部14は、信号分離部12から出力されてきた雑音信号NSのスペクトル(つまり、雑音を構成する周波数成分)について、第1ホルマント周波数f1〜第3ホルマント周波数f3それぞれにおける雑音信号NSの雑音信号レベルNLV1〜NLV3を検出する。
なお、以下では、第1ホルマント周波数f1における雑音信号NSの雑音信号レベルNLV1を「第1雑音レベルNLV1」という。また、第2ホルマント周波数f2における雑音信号NSの雑音信号レベルNLV2を「第2雑音レベルNLV2」といい、第3ホルマント周波数f3における雑音信号NSの雑音信号レベルNLV3を「第3雑音レベルNLV3」という。
図5に示すように、雑音分析部14は、雑音帯域分割部141と、雑音レベル検出部142−1〜142−3とを有する。なお、雑音レベル検出部142−1〜142−3の数は、周波数帯域B1〜B3の数と同じである。
雑音帯域分割部141は、例えば、バンドパスフィルタ(Band-pass filter;BPF)で構成される。雑音帯域分割部141は、信号分離部12からの雑音信号NSを、所定の帯域幅をそれぞれ有する周波数帯域B1〜B3に分割する。なお、周波数帯域B1〜B3それぞれの帯域幅は、互いに同一でもよく、また、互いに異なっていてもよい。
雑音帯域分割部141は、周波数帯域B1〜B3それぞれに分割した雑音信号NSである「第1分割雑音信号NS−1〜第3分割雑音信号NS−3」を、雑音レベル検出部142−1〜142−3へ出力する。
より具体的には、雑音帯域分割部141は、図6(a)に示す第1分割雑音信号NS−1を雑音レベル検出部142−1へ出力する。また、雑音帯域分割部141は、図6(b)に示す第2分割雑音信号NS−2を雑音レベル検出部142−2へ出力する。また、雑音帯域分割部141は、図6(c)に示す第3分割雑音信号NS−3を雑音レベル検出部142−3へ出力する。
図5に示した雑音レベル検出部142−1〜142−3それぞれは、雑音帯域分割部141からの第1分割雑音信号NS−1〜第3分割雑音信号NS−3それぞれについて、第1ホルマント周波数f1〜第3ホルマント周波数f3における雑音信号NSの雑音レベル、つまり、図6(a)〜6(c)に示した第1雑音レベルNLV1〜第3雑音レベルNLV3を検出する。
また、雑音レベル検出部142−1〜142−3それぞれは、検出した第1雑音レベルNLV1〜第3雑音レベルNLV3を比較部15へ出力する。
比較部15は、周波数帯域B1〜B3ごとに、第1音声レベルOLV1〜第3音声レベルOLV3それぞれと第1雑音レベルNLV1〜第3雑音レベルNLV3それぞれとの比較により、音声レベルOLV1〜OLV3それぞれと雑音レベルNLV1〜NLV3それぞれとの差分であるレベル差DF1〜DF3を算出する。また、比較部15は、算出した第1レベル差DF1〜第3レベル差DF3を変更量算出部16へ出力する。
なお、以下では、第1音声レベルOLV1と第1雑音レベルNLV1との差を「第1レベル差DF1」という。また、第2音声レベルOLV2と第2雑音レベルNLV2との差を「第2レベル差DF2」といい、第3音声レベルOLV3と第3雑音レベルNLV3との差を「第3レベル差DF3」という。
図7に示すように、比較部15は、第1レベル比較部151−1、第2レベル比較部151−2および第3レベル比較部151−3を有する。
第1レベル比較部151−1〜第3レベル比較部151−3それぞれには、第1音声レベルOLV1〜第3音声レベルOLV3が音声レベル検出部132−1〜132−3それぞれから入力され、第1雑音レベルNLV1〜第3雑音レベルNLV3が雑音レベル検出部142−1〜142−3それぞれから入力される。
第1レベル比較部151−1〜第3レベル比較部151−3それぞれは、周波数帯域B1〜B3ごとに、「第1レベル差DF1〜第3レベル差DF3」を算出する。例えば、帯域レベル比較部151−1は、第1ホルマント周波数f1において、第1音声レベルOLV1と第1雑音レベルNLV1とに基づいて、第1レベル差DF1を算出し、当該第1レベル差DF1を変更量算出部16へ出力する。
なお、ここでいう第1レベル差DF1〜第3レベル差DF3は、第1音声レベルOLV1〜第3音声レベルOLV3それぞれから、第1雑音レベルNLV1〜第3雑音レベルNLV3それぞれを減じた各差分でもよい。
また、ここでいう第1レベル差DF1〜第3レベル差DF3は、第1雑音レベルNLV1〜第3雑音レベルNLV3それぞれに対する、第1音声レベルOLV1〜第3音声レベルOLV3それぞれの割合(例えば、第1音声レベルOLV1/第1雑音レベルNLV1など)の常用対数を所定倍したデシベル(dB)で表わした量などでもよい。
図1に示した変更量算出部16は、「変更量算出処理」を実行する。図8に示すように、変更量算出部16は、第1変更量算出部161−1と、第2変更量算出部161−2と、第3変更量算出部161−3とを有する。
第1変更量算出部161−1〜第3変更量算出部161−3それぞれは、第1レベル差DF1〜第3レベル差DF3と増減判別値Vidとの比較に基づいて、第1ホルマントP1〜第3ホルマントP3が有する第1音声レベルOLV1〜第3音声レベルOLV3それぞれの「変更量G1〜G3」を算出する。
ここで、「増減判別値Vid」とは、変更量G1〜変更量G3それぞれの値を決定するための基準値である。
第1変更量算出部161−1は、図9(a)に例示するような第1変更量算出情報GCI−1などを参照して、「変更量G1」を算出してもよい。
例えば、周波数帯域B1について、第1変更量算出部161−1は、第1レベル差DF1が小さい場合、変更量G1を大きくする。また、第1変更量算出部161−1は、第1レベル差DF1が大きくなるに伴って、変更量G1を小さくする。
また、第2変更量算出部161−2〜第3変更量算出部161−3それぞれは、図9(b)に例示するような第2変更量算出情報GCI−2などを参照して、「変更量G2〜G3」を算出してもよい。なお、第2変更量算出部161−2が参照する変更量算出情報と、第3変更量算出部161−3が参照する変更量算出情報とは、互いに異なる内容を有する情報でもよい。
図10に示すように、「音声レベルOLV1〜OLV3の変更量G1〜G3」とは、例えば、特定音声信号OBのゲインの変更量である。以下では、第1ホルマントP1における変更量G1を「第1変更量G1」という。また、第2ホルマントP2における変更量G2を「第2変更量G2」といい、第3ホルマントP3における変更量G3を「第3変更量G3」という。
例えば、周波数帯域B2について、第2レベル差DF2の値が5dBである場合、第2変更量算出部161−2は第2変更量G2の値(図9(b)の例では、「−14dB」)を相対的に小さくする。また、例えば、第2レベル差DF2の値が0dBである場合、第2変更量算出部161−2は第2変更量G2の値(図9(b)の例では、「−4dB」)を相対的に大きくする。
また、第2変更量算出部161−2または第3変更量算出部161−3(「符号決定部」)は、「符号決定処理」の実行により、第2レベル差DF2または第3レベル差DF3と、増減判別値Vidとを比較した結果に基づいて、第2ホルマントP2の第2音声レベルOLV2または第3ホルマントP3の第3音声レベルOLV3それぞれを増大させるか、または、減少させるかを決定する。
ここでは、上述した「増減判別値Vid」は、第2ホルマントP2または第3ホルマントP3それぞれを増大させるか、それとも、減少させるかを判別するための基準値としての役割を果たす。
第2変更量算出部161−2または第3変更量算出部161−3は、レベル変更部17が、第2変更量G2または第3変更量G3を、第2音声レベルOLV2または第3音声レベルOLV3に加算するか減算するかを示す符号(プラスまたはマイナスのどちらか一方)を決定する。以下では、第2変更量G2についての加減を示す符号を「第2符号SGN2」といい、第3変更量G3についての加減を示す符号を「第3符号SGN3」という。
例えば、周波数帯域B2について、基準とする増減判別値Vidが「6dB」であるとする。なお、「6dB」である場合とは、第2音声レベルOLV2の値が第2雑音レベルNLV2の値のおよそ2倍である場合である。第2変更量算出部161−2は、第2レベル差DF2が増減判別値Vid(6dB)よりも大きい際には、レベル変更部17が第2ホルマントP2を増大させるように、第2符号SGN2をプラスに決定する。
また、第2変更量算出部161−2は、第2レベル差DF2が増減判別値Vid(6dB)以下である場合、レベル変更部17が第2ホルマントP2を減少させるように、第2符号SGN2をマイナスに決定する。
また、この例では、第1変更量算出部161−1(「符号決定部」)は、「符号決定処理」において、第1ホルマントP1の第1音声レベルOLV1については「減少」させるように決定する。つまり、第1変更量G1についての「第1符号SGN1」をマイナスに設定する。これは、特定音声信号OBが示す特定音源SRからの音声の明瞭度を向上させるためである。
音量算出部162は、第1音声レベルOLV1〜第3音声レベルOLV3と、第1符号SGN1〜第3符号SGN3を含めた第1変更量G1〜第3変更量G3との総和を算出することにより、周波数帯域B1〜B3全体における音声レベルである「音量VL」を算出する。
なお、音量算出部162が算出した音量VLが過度に大きい場合(例えば、最大音量の上限値を超過した場合)、特定音声信号OB再生時の音質が劣化して、却って聴き取りにくくなってしまう「音割れ」のおそれがある。音割れが発生した場合には、ホルマントの波形のピーク部分が潰れた状態となってしまうため、特定音声信号OBのクリップが発生してしまう。
音割れを回避するために、音量算出部162は、第1変更量G1〜第3変更量G3を用いて第1音声レベルOLV1〜第3音声レベルOLV3を変更する際に、当該変更による第1音声レベルOLV1〜第3音声レベルOLV3全体のバランスが好適となるよう、音量VLを調整する。
図1に示したレベル変更部17は、「レベル変更処理」を実行する。図11に示すように、レベル変更部17は、第1変更部171−1〜第3変更部171−3と、音声重畳部172とを有する。
第1変更部171−1〜第3変更部171−3は、変更量算出部16が算出した第1変更量G1〜第3変更量G3と第1符号SGN1〜第3符号SGN3とに基づいて、音声分析部13からの第1分割音声信号OB−1〜第3分割音声信号OB−3それぞれに含まれている第1ホルマントP1〜第3ホルマントP3を強調するためのホルマント強調処理を施す。
ここでいう「ホルマント強調処理」とは、第1ホルマントP1〜第3ホルマントP3の第1音声レベルOLV1〜第3音声レベルOLV3ごとに、第1符号SGN1〜第3符号SGN3に従って、第1変更量G1〜第3変更量G3それぞれを加算または減算する処理を指す。これにより、第1音声レベルOLV1〜第3音声レベルOLV3が変更される。
音声重畳部172は、第1変更量G1〜第3変更量G3それぞれを用いて第1音声レベルOLV1〜第3音声レベルOLV3が変更された第1分割音声信号OB−1〜第3分割音声信号OB−3すべてを重畳する。
当該重畳により、音声重畳部172は、分割されていた周波数帯域B1〜B3を結合し、音声品質が改善された特定音声信号OBを再構成する。また、音声重畳部172は、再構成された特定音声信号OBを、「ホルマント強調信号FE」として外部へ出力する。
なお、第1ホルマントP1〜第3ホルマントP3の第1音声レベルOLV1〜第3音声レベルOLV3を第1変更部171−1〜第3変更部171−3が変更する際の基本動作は以下の通りである。
第1変更部171−1は、第1ホルマントP1については、第1符号SGN1(符号はマイナス)に従って、第1変更量G1だけ第1音声レベルOLV1を「下げる」動作を行う。
つまり、レベル変更部17は、第1ホルマントP1を「減少させる」動作を行う。
一方、第2変更部171−2は、第2変更量G2および第2符号SGN2に従って、第2ホルマントP2の第2音声レベルOLV2を「上げる」または「下げる」動作を行う。
また、第2変更部171−2と同様に、第3変更部171−3も、第3変更量G3および第3符号SGN3に従って、第3ホルマントP3の第3音声レベルOLV3を「上げる」または「下げる」動作を行う。
つまり、第2変更部171−2または第3変更部171−3は、第2ホルマントP2または第3ホルマントP3それぞれについて、「増大または減少」のどちらか一方を行う。
例えば、第2符号SGN2が「マイナス」である場合、第2変更部171−2は、第2変更量G2だけ第2ホルマントP2を「減少」させる。
なお、第2変更量算出部161−2は、第2レベル差DF2が増減判別値Vid以下の際において、第2レベル差DF2の値が相対的に小さい場合、第2変更量G2の値を大きくする。この場合には、第2変更部171−2が第2ホルマントP2を減少させる量も相対的に大きくなる。また、第2変更量算出部161−2は、第2レベル差DF2の値が大きい場合、第2変更量G2の値を小さくする。この場合、第2変更部171−2が第2ホルマントP2を減少させる量も相対的に小さくなる。
つぎに、上記構成を有する音声レベル調整装置1が、特定音声信号OBと雑音信号NSとの比較に基づいて、当該特定音声信号OBの音声レベルを変更する動作を説明する。
信号分離部12は、所定のタイミングごとに、マイク11から出力されてきた音声信号SVの音声レベルと、特定音声検出レベルLdとを比較する。
当該比較の結果、音声信号SVの音声レベルが特定音声検出レベルLdよりも大きい場合、図12に示すステップ301にて、信号分離部12は、該音声信号SVから特定音声信号OBを抽出する。例えば、信号分離部12は、特定音声検出レベルLdよりも音声レベルが大きな音声信号SVから、当該音声信号SVを入力する直前の音声信号SVを減算することにより、特定音声信号OBを抽出する。
そして、信号分離部12は、特定音声信号OBを音声分析部13へ出力する。
また、信号分離部12は、上述した「直前の音声信号SV」を、雑音信号NSとして雑音分析部14へ出力する。
音声分析部13の帯域分割部131は、ステップ302にて、信号分離部12からの図3に示した特定音声信号OBを、図4(a)〜4(c)に示した第1ホルマントP1、第2ホルマントP2および第3ホルマントP3それぞれを含む第1分割音声信号OB−1〜第3分割音声信号OB−3に分割する。
音声レベル検出部132−1〜132−3それぞれは、ステップ304にて、第1音声レベルOLV1〜第3音声レベルOLV3をそれぞれ検出する。
また、雑音分析部14の雑音帯域分割部141は、ステップ303にて、信号分離部12からの図3に示した雑音信号NSを、図6(a)〜6(c)に示した第1分割雑音信号NS−1〜第3分割雑音信号NS−3に分割する。
雑音レベル検出部142−1〜142−3それぞれは、ステップ305にて、第1雑音レベルNLV1〜第3雑音レベルNLV3をそれぞれ検出する。
比較部15の第1レベル比較部151−1〜第3レベル比較部153−1それぞれは、ステップ306にて、第1レベル差DF1〜第3レベル差DF3を算出し、変更量算出部16へ出力する。
図6(a)および6(b)に示した例では、第1ホルマント周波数f1における第1雑音レベルNLV1が、第2ホルマント周波数f2における第2雑音レベルNLV2よりも大きな状態にある。
第1ホルマントP1の第1音声レベルOLV1が、第2ホルマントP2の第2音声レベルOLV2、第3ホルマントP3の第3音声レベルOLV3よりもかなり大きい。また、周波数帯域B1における雑音信号NSの第1雑音レベルNLV1も大きい。
そのため、図3に示した周波数帯域B1では、図4(a)に示した第1音声レベルOLV1と、図6(a)に示した第1雑音レベルNLV1との間の第1レベル差DF1が小さくなる。
この場合、第1変更量算出部161−1は、図12に示したステップ307にて、第1音声レベルOLV1の変更量である第1変更量G1を相対的に大きくする。なお、第1変更量算出部161−1は、図9(a)に示した第1変更量算出情報GCI−1に基づいて第1変更量G1を算出してもよい。
また、第1変更量算出部161−1(符号決定部)は、ステップ308および309にて、第1ホルマントP1〜第3ホルマントP3のうちでホルマント周波数が最も小さな第1ホルマントP1については第1音声レベルOLV1を減少させるよう、第1符号SGN1を「マイナス」に決定する。
この場合、図10に示したように、第1変更部171−1は、ステップ313にて、第1ホルマントP1の第1音声レベルOLV1を、大きく、第1符号SGN1に従って下げる。
一方、図3に示した周波数帯域B2については、図4(b)に示した第2音声レベルOLV2と、図6(b)に示した第2雑音レベルNLV2との間の第2レベル差DF2はかなり大きい。
第2レベル差DF2が増減判別値Vid(図9(b)の例では「6dB」)よりも大きい場合、ステップ307にて、第2変更量算出部161−2は、第2レベル差DF2が大きくなるに伴って、第2変更量G2を大きくする。第2変更量算出部161−2は、例えば、図9(b)に示した第2変更量算出情報GCI−2に基づいて第2変更量G2を算出してもよい。なお、第2レベル差DF2は第3レベル差DF3よりも小さいため、第2変更量G2は第3変更量G3よりも小さくなる。
ステップ310にて当該第2レベル差DF2が増減判別値Vidよりも大きい場合、第2変更量算出部161−2(符号決定部)は、ステップ311にて、第2ホルマントP2の第2音声レベルOLV2を増大させるよう、第2符号SGN2を「プラス」に決定する。
そのため、図9に示した例では、第2変更部171−2は、ステップ313にて、第2ホルマントP2の第2音声レベルOLV2を、第3ホルマントP3の第3変更量G3よりも小さく、第2符号SGN2に従って上げる。
また、図3に示した周波数帯域B3については、図4(c)に示した第3音声レベルOLV3と、図6(c)に示した第3雑音レベルNLV3との間の第3レベル差DF3が大きい。
ステップ310にて当該第3レベル差DF3が増減判別値Vidよりも大きい場合、第3変更量算出部161−3(符号決定部)は、ステップ311にて、第3ホルマントP3の第3音声レベルOLV3を増大させるよう、第3符号SGN3を「プラス」に決定する。
また、第3レベル差DF3が増減判別値Vid(図9(b)の例では「6dB」)よりも大きい場合、第3変更量算出部161−3は、第3レベル差DF3が大きくなるに伴って、第3変更量G3を大きくする。第3レベル差DF3は第2レベル差DF2よりも大きいため、第3変更量G3は第2変更量G2よりも大きくなる。
そのため、図10に示した例では、第3変更部171−3は、図12に示したステップ313にて、第3ホルマントP3の第3音声レベルOLV3を、第2ホルマントP2の第2変更量G2よりも大きく、第3符号SGN3に従って上げる。
さらに、ステップ314にて、音声重畳部172は、第1変更部171−1〜第3変更部171−3により第1音声レベルOLV1〜第3音声レベルOLV3がそれぞれ変更された第1分割音声信号OB−1〜第3分割音声信号OB−3すべてを重畳する。
そして、音声重畳部172は、重畳によって構成したホルマント強調信号FEを外部へ出力する。該ホルマント強調信号FEは、例えば、スピーカなどによって放音される。以上で、音声レベル調整装置1が、特定音声信号OBと雑音信号NSとの比較に基づいて、当該特定音声信号OBの音声レベルを変更する際の一連の動作が終了する。
また、図13(a)に示した例では、点線で表わした雑音信号NSのスペクトラムにおいて、第1ホルマント周波数f1における第1雑音レベルNLV1が、第2ホルマント周波数f2における第2雑音レベルNLV2よりも小さな状態にある。
また、図13(a)に示した第1ホルマントP1の第1音声レベルOLV1は、第2ホルマントP2の第2音声レベルOLV2または第3ホルマントP3の第3音声レベルOLV3それぞれよりも大きい。
この場合、第1ホルマント周波数f1において、第1音声レベルOLV1と第1雑音レベルNLV1との第1レベル差DF1が大きくなっている。
この場合、図13(b)に示すように音声の明瞭度が改善されるよう、第1変更量算出部161−1は、図12に示したステップ307にて、第1ホルマントP1の音声レベルについての第1変更量G1が小さな値となるように、当該第1変更量G1を算出する。第1変更量算出部161−1は、例えば、図9(a)に示した第1変更量算出情報GCI−1に基づいて第1変更量G1を算出してもよい。
また、第1変更量算出部161−1(符号決定部)は、ステップ308および309にて、第1ホルマントP1については第1音声レベルOLV1を減少させるよう、第1符号SGN1を「マイナス」に決定する。
そして、ステップ313にて、第1変更部171−1は、第1音声レベルOLV1を、第1変更量算出部161−1が算出した第1変更量G1に基づいてわずかに、第1符号SGN1に従って下げる。
また、周波数帯域B2における第2ホルマントP2については、第2音声レベルOLV2と第2雑音レベルNLV2との第2レベル差DF2が小さくなる。
ステップ310にて当該第2レベル差DF2が増減判別値Vid以下である場合、第2変更量算出部161−2(符号決定部)は、ステップ312にて、第2音声レベルOLV2を減少させるよう、第2符号SGN2を「マイナス」に決定する。
そのため、図13(b)に示すように、第2変更部171−2は、ステップ313にて、第2ホルマントP2の音声レベルを大きく、第2符号SGN2に従って下げる。
また、周波数帯域B3においては、第3音声レベルOLV3と、第3雑音レベルNLV3との間の第3レベル差DF3が大きい。ステップ310にて当該第3レベル差DF3が増減判別値Vidよりも大きい場合、第3変更量算出部161−3(符号決定部)は、ステップ311にて、第3音声レベルOLV3を増大させるよう、第3符号SGN3を「プラス」に決定する。
また、第3レベル差DF3が増減判別値Vidよりも大きい場合、第3変更量算出部161−3は、第3レベル差DF3が大きくなるに伴って第3変更量G3を大きくするように設定する。
そのため、図13(b)に示すように、第1変更部171−3は、ステップ313にて、第3音声レベルOLV3を、大きく、第3符号SGN3に従って上げる。
さらに、ステップ314にて、音声重畳部172は、第1音声レベルOLV1〜第3音声レベルOLV3が変更された第1分割音声信号OB−1〜第3分割音声信号OB−3すべてを重畳し、該重畳により構成したホルマント強調信号FEを外部へ出力する。
以上説明したように、本発明の実施形態1によれば、音声レベル調整装置1は、特定音声信号OBを、第1ホルマントP1〜第3ホルマントP3をそれぞれ含む周波数領域B1〜B3に分割する。そして、分割された周波数領域B1〜B3ごとに、第1ホルマントP1〜第3ホルマントP3それぞれの音声レベルOLV1〜OLV3と、第1ホルマント周波数f1〜第3ホルマント周波数f3それぞれにおける雑音レベルNLV1〜NLV3とを比較する。そして、当該比較に基づいて算出したレベル差DF1〜DF3に応じて、特定音声信号OB内の第1ホルマントP1〜第3ホルマントP3の減少または増大と、当該減少または増大を行う際の変更量G1〜G3を制御する。
ここで、一般的に、話者ごとの声質によって、第1ホルマントP1の第1音声レベルOLV1に対する第2ホルマントP2の第2音声レベルOLV2の割合は異なる。
第1音声レベルOLV1に対して第2音声レベルOLV2が相対的に小さい場合、つまり、第1ホルマントP1に対して第2ホルマントP2が弱い声の場合、レベル変更部17は、第2ホルマントP2をより大きく強調する。その理由は、このような状況下では、音声レベルOLVと雑音レベルNLVとの間のレベル差DFが小さくなり易いことが想定されるためである。
一方、第1音声レベルOLV1に対して第2音声レベルOLV2が相対的に大きい場合、つまり、第1ホルマントP1に対して第2ホルマントP2が相対的に強い声の場合、第2ホルマントP2をより小さく強調する。
これにより、話者それぞれの声質により特定音声信号OBのスペクトルが異なる場合でも、当該声質の差異に応じて、特定音声信号OBの音声レベルを調整することが可能となる。つまり、話者の声質に応じて、適切な音声の明瞭度を得ることが可能となる。
(実施形態2)
一般的に、特定音声信号OBの音声レベルOLVと雑音信号NSの雑音レベルNLVとの間のレベル差DFが大きい周波数帯域では、特定音源SR(この例では、話者)から発生した音声がその周囲の雑音によってマスキングされにくい。
ここでいう「マスキング」とは、ある音声(例えば、特定音源SRからの音声)の最小可聴値が、他の音声(例えば、周囲の雑音)のために上昇し、聴き取りにくくなる現象のことを指す。
一方、特定音声信号OBの音声レベルOLVと雑音信号NSの雑音レベルNLVとのレベル差DFが小さい周波数帯域では、特定音源SR(この例では、話者)から発生した音声がその周囲の雑音によってマスキングされ易くなる。
以下では、上述したマスキングが発生した場合でも、音声の明瞭度を改善することが可能な実施形態2の音声レベル調整装置1Aについて説明する。
実施形態2の音声レベル調整装置1Aの構成は、実施形態1において図1に示した音声レベル調整装置1が有する構成と基本的に同じである。
ただし、図14に示すように、音声レベル調整装置1Aは、図1に示した構成に加えて、標準ホルマント補正部18を有する。
標準ホルマント補正部18は、音声分析部13と比較部15との間に設けられている。実施形態2の音声分析部13は、第1音声レベルOLV1〜第3音声レベルOLV3を標準ホルマント補正部18へ出力する。また、実施形態2の音声分析部13は、第1音声レベルOLV1を比較部15へ出力する。
標準ホルマント補正部18は、「標準ホルマント補正処理」を実行する。図15に示すように、標準ホルマント補正部18は、ホルマント比較部181と、補正判別部182と、補正量算出部183−1〜183−2と、補正部184−1〜184−2とを有する。
ホルマント比較部181は、音声分析部13からの第1音声レベルOLV1〜第3音声レベルOLV3同士を比較することにより、「第1ホルマントレベル差FDF12〜第2ホルマントレベル差FDF13」を算出する。
そして、ホルマント比較部181は、第1ホルマントレベル差FDF12〜第2ホルマントレベル差FDF13を補正判別部182へ出力する。
ここでいう「第1ホルマントレベル差FDF12〜第2ホルマントレベル差FDF13」は、ホルマント同士の音声レベルの差を示す量であればよい。例えば、第1ホルマントレベル差FDF12または第2ホルマントレベル差FDF13は、第1音声レベルOLV1に対する、第2音声レベルOLV2または第3音声レベルOLV3それぞれの割合(例えば、第1音声レベルOLV1/第2音声レベルOLV2など)の常用対数を所定倍したデシベル(dB)で表わした量などでもよい。
補正判別部182は、ホルマント比較部181からの第1ホルマントレベル差FDF12〜第2ホルマントレベル差FDF13と、「標準音声レベルST」とを比較する。
ここで、「標準音声レベルST」とは、第2ホルマントP2および第3ホルマントP3を補正する際の基準となる標準ホルマントの音声レベルである。
補正量算出部183−1〜183−2は、補正判別部182による比較の結果に基づいて、第2ホルマントP2の第2音声レベルOLV2および第3ホルマントP3の第3音声レベルOLV3それぞれの補正量である「第1補正量REV1〜第2補正量REV2」を算出する。
補正判別部182による比較の結果、第1ホルマントレベル差FDF12または第2ホルマントレベル差FDF13が標準音声レベルST以下である場合、補正量算出部183−1または183−2は、その周波数帯域B2またはB3に含まれるホルマントの音声レベルを下げるように、第1補正量REV1または第2補正量REV2を算出する。
例えば、補正量算出部183−1は、第1ホルマントレベル差FDF12が標準音声レベルSTよりも大きい場合、つまり、第2ホルマントP2の第1ホルマントP1に対する割合が相対的に大きい場合、第2ホルマントP2の第2音声レベルOLV2を下げるように、第1補正量REV1の値を算出する。この場合、補正部184−1は、第2音声レベルOLV2を第1補正量REV1だけ下げる。そして、補正部184−1は、第1補正量REV1を用いて補正した第2補正音声信号ROB−2を比較部15へ出力する。
また、補正判別部182による比較の結果、第1ホルマントレベル差FDF12または第2ホルマントレベル差FDF13が標準音声レベルST以下である場合、補正量算出部183−1または183−2は、その周波数帯域B2またはB3に含まれるホルマントの音声レベルを上げるように、第1補正量REV1または第2補正量REV2を算出する。
この場合、補正部184−1は、第2ホルマントP2の第2音声レベルOLV2を、補正量算出部183−1が算出した第1補正量REV1だけ上げる。そして、補正部184−1は、第1補正量REV1を用いて補正した第2補正音声信号ROB−2を比較部15へ出力する。
標準ホルマント補正部18が音声レベルを補正した後の実施形態2の音声レベル調整装置1Aの動作は、実施形態1の音声レベル調整装置1が行う動作と基本的に同じである。
比較部15には、音声分析部13からの第1音声レベルOLV1と、標準ホルマント補正部18からの第2補正音声信号ROB−2〜第3補正音声信号ROB−3それぞれの第2補正音声レベルRLV2〜第3補正音声レベルRLV3と、雑音分析部14からの第1雑音レベルNLV1〜第3雑音レベルNLV3とが入力される。
比較部15は、第1音声レベルOLV1および第2補正音声レベルRLV2〜第3補正音声レベルRLV3と、第1雑音レベルNLV1〜第3雑音レベルNLV3とを比較する。
当該比較により、比較部15の第1レベル比較部151−1〜第3レベル比較部151−3は、第1補正レベル差RDF1〜第3補正レベル差RDF3を検出する。例えば、第1レベル比較部151−1は、第1音声レベルOLV1と第1雑音レベルNLV1との間の第1補正レベル差RDF1を検出する。また、例えば、第2レベル比較部151−2は、第2補正音声レベルRLV2と第2雑音レベルNLV2との間の第2補正レベル差RDF2を検出する。
変更量算出部16は、比較部15が検出した第1補正レベル差RDF1〜第3補正レベル差RDF3と増減判別値Vidとの比較に基づいて、第1変更量G1〜第3変更量G3と第1符号SGN1〜第3符号SGN3とを算出する。
レベル変更部17は、変更量算出部16が算出した第1変更量G1〜第3変更量G3と第1符号SGN1〜第3符号SGN3とを用いて、第1補正音声信号ROB−2〜第2補正音声信号ROB−3の音声レベルを変更する。そして、レベル変更部17は、当該変更が施された第1補正音声信号ROB−2〜第2補正音声信号ROB−3の重畳により構成されたホルマント強調信号FEを出力する。
以上説明したように、実施形態2によれば、レベル変更部17によるホルマント強調処理に先立ち、第1ホルマントP1〜第3ホルマントP3の第1音声レベルOLV1〜第3音声レベルOLV3同士の比較に基づいて、第1ホルマントP1〜第3ホルマントP3の補正を行う。
そのため、雑音レベルが小さい静かな環境において、音声の個人差によって明瞭度がそれぞれ異なる場合でも、標準的なホルマントの音声レベルに補正することで一定の明瞭度を得ることが可能となる。
また、実施形態2によれば、補正音声レベルRLVと雑音レベルNLVとの補正レベル差RDFに対応して、特定音声信号OB内の第1ホルマントP1〜第3ホルマントP3の音声レベルの変更量G1〜G3を算出する。
補正レベル差RDFが大きい場合、特定音源SRからの音声は周囲の雑音によってマスキングされにくい。そのため、変更量算出部16は、マスキングされにくい周波数帯域に含まれているホルマントの補正音声レベルRLVについて、その変更量Gを大きくする。つまり、補正音声レベルRLVを強調する程度を大きくする。
また、補正レベル差RDFが小さい場合、特定音源SRからの音声は周囲の雑音によってマスキングされ易い。この場合、マスキングされ易い周波数帯域に含まれているホルマントの補正音声レベルRLVについて、その変更量Gを小さくする。つまり、補正音声レベルRLVを強調する程度を小さくする。
これにより、特定音源SRからの音声が雑音によってマスキングされにくい周波数帯域において、特定音声信号OBに含まれるホルマントの強調が行われる。そのため、マイク11によって集音された雑音を示す雑音信号NSのスペクトルが異なる場合でも、適切な音声の明瞭度を得ることが可能となる。
また、音割れが発生しない範囲で当該音質の改善を行うことができるため、音声を聴き取り易くすることができる。
なお、本発明の要旨を逸脱しない範囲で各種の変形が可能である。
なお、本発明においては、音声レベル調整装置1内の処理は上述の専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを音声レベル調整装置1にて読取可能な記録媒体に記録し、この記録媒体に記録されたプログラムを音声レベル調整装置1に読み込ませ、実行するものであってもよい。音声レベル調整装置1にて読取可能な記録媒体とは、フロッピーディスク(登録商標)、光磁気ディスク、DVD、CDなどの移設可能な記録媒体の他、音声レベル調整装置1に内蔵されたHDD等を指す。この記録媒体に記録されたプログラムは、例えば、音声レベル調整装置1が有する信号分離部12、音声分析部13、雑音分析部14、比較部15、変更量算出部16、レベル変更部17および標準ホルマント補正部18の制御によって、上述したものと同様の処理が行われる。
ここで、音声レベル調整装置1が有する信号分離部12、音声分析部13、雑音分析部14、比較部15、変更量算出部16、レベル変更部17および標準ホルマント補正部18は、プログラムが記録された記録媒体から読み込まれたプログラムを実行するコンピュータとして動作するものである。
本発明の実施形態1に従った音声レベル調整装置の構成を示す図である。 図1に示した音声分析部の構成を示す図である。 特定音声信号または雑音信号それぞれについての、音声レベルと周波数との関係の第1の例を示す図である。 (a)図3に示した特定音声信号を帯域分割したときに出力される分割音声信号の第1の例を示す図である。(b)図3に示した特定音声信号を帯域分割したときに出力される分割音声信号の第2の例を示す図である。(c)図3に示した特定音声信号を帯域分割したときに出力される分割音声信号の第3の例を示す図である。 図1に示した雑音分析部の構成を示す図である。 (a)図3に示した雑音信号を帯域分割したときに出力される分割雑音信号の第1の例を示す図である。(b)図3に示した雑音信号を帯域分割したときに出力される分割雑音信号の第2の例を示す図である。(c)図3に示した雑音信号を帯域分割したときに出力される分割雑音信号の第3の例を示す図である。 図1に示した比較部の構成を示す図である。 図1に示した変更量算出部の構成を示す図である。 (a)第1変更量算出情報のデータ構造の一例を示す図である。(b)第2変更量算出情報のデータ構造の一例を示す図である。 図3に示した特定音声信号のレベルを変更したときに出力されるホルマント強調信号の第1の例を示す図である。 図1に示したレベル変更部の構成を示す図である。 特定音声信号と雑音信号との比較に基づいて、特定音声信号のレベルを変更する際の動作を示すフローチャートである。 (a)特定音声信号または雑音信号それぞれについての、音声レベルと周波数との関係の第2の例を示す図である。(b)特定音声信号のレベルを変更したときに出力されるホルマント強調信号の第2の例を示す図である。 実施形態2に従った音声レベル調整装置の構成を示す図である。 図14に示した標準ホルマント補正部の構成を示す図である。 一般的な音声レベル調整装置の構成を示す図である。 (a)一般的な音声レベル調整装置へ入力される特定音声信号または雑音信号それぞれについての、音声レベルと周波数との関係の第1の例を示す図である。(b)一般的な音声レベル調整装置によるホルマントの強調前後における、特定音声信号または雑音信号それぞれの音声レベルと周波数との関係の第2の例を示す図である。
符号の説明
1、1A 音声レベル調整装置
11 マイク
12 信号分離部
13 音声分析部
131 帯域分割部
132−1〜132−3 音声レベル検出部
14 雑音分析部
141 雑音帯域分割部
142−1〜142−3 雑音レベル検出部
15 比較部
151−1 第1レベル比較部
151−2 第2レベル比較部
151−3 第3レベル比較部
16 変更量算出部
161−1 第1変更量算出部
161−2 第2変更量算出部
161−3 第3変更量算出部
17 レベル変更部
171−1 第1変更部
171−2 第2変更部
171−3 第3変更部
172 音声重畳部
18 標準ホルマント補正部
181 ホルマント比較部
182 補正判別部
183−1〜183−2 補正量算出部
184−1〜184−2 補正部

Claims (9)

  1. 音声を入力し、該音声のレベルに応じた音声信号を出力するマイクと、
    前記マイクが出力した音声信号を、特定音源が出力した音声を示す特定音声信号と、雑音を示す雑音信号とに分離してそれぞれ出力する信号分離部と、
    前記分離された特定音声信号に含まれる複数のホルマントそれぞれの特定音声信号レベルを検出する音声分析部と、
    前記ホルマントそれぞれの特定音声信号レベルがピークとなる周波数における前記雑音信号の雑音信号レベルを検出する雑音検出部と、
    前記検出された互いの特定音声信号レベルの差を示すホルマントレベル差と、該特定音声信号レベルを補正する際の基準となる標準音声レベルとの比較に基づいて、周波数が最も小さなホルマント以外のホルマントの特定音声信号レベルそれぞれを補正する標準ホルマント補正部と、
    前記補正されたホルマントの特定音声信号レベルそれぞれと該ホルマントに対応する周波数における雑音信号レベルそれぞれとのレベル差に基づいて、該補正されたホルマントそれぞれの特定音声信号レベルの変更量を算出するとともに、前記周波数が最も小さなホルマントの特定音声信号レベルと該周波数における雑音信号レベルとに基づいて、該周波数が最も小さなホルマントの特定音声信号レベルの変更量を算出する変更量算出部と、
    前記算出された変更量に基づいて前記ホルマントの特定音声信号レベルをそれぞれ変更し、該特定音声信号レベルが変更されたホルマントを含む前記特定音声信号を出力するレベル変更部とを有する音声レベル調整装置。
  2. 請求項1に記載の音声レベル調整装置において、
    前記特定音声信号レベルと前記雑音信号レベルとの間のレベル差と、前記ホルマントの増大または減少を判別するための基準となる増減判別値との比較に基づいて、前記変更量算出部が算出した変更量の加算または減算を示す符号を決定する符号決定部を有し、
    前記レベル変更部は、前記符号決定部が決定した符号に従って、前記ホルマントの特定音声信号レベルに対して前記変更量の加算または減算を行うことを特徴とする音声レベル調整装置。
  3. 請求項2に記載の音声レベル調整装置において、
    前記符号決定部は、前記ホルマント周波数が最も小さなホルマントについては、前記変更量の減算を示すように前記符号を決定することを特徴とする音声レベル調整装置。
  4. 音声を入力し、該音声のレベルに応じた音声信号を出力する処理と、
    前記出力した音声信号を、特定音源が出力した音声を示す特定音声信号と、雑音を示す雑音信号とに分離してそれぞれ出力する処理と、
    前記分離された特定音声信号に含まれる複数のホルマントそれぞれの特定音声信号レベルを検出する処理と、
    前記ホルマントそれぞれの特定音声信号レベルがピークとなる周波数における前記雑音信号の雑音信号レベルを検出する処理と、
    前記検出された互いの特定音声信号レベルの差を示すホルマントレベル差と、該特定音声信号レベルを補正する際の基準となる標準音声レベルとの比較に基づいて、周波数が最も小さなホルマント以外のホルマントの特定音声信号レベルそれぞれを補正する処理と、
    前記補正されたホルマントの特定音声信号レベルそれぞれと該ホルマントに対応する周波数における雑音信号レベルそれぞれとのレベル差に基づいて、該補正されたホルマントそれぞれの特定音声信号レベルの変更量を算出するとともに、前記周波数が最も小さなホルマントの特定音声信号レベルと該周波数における雑音信号レベルとに基づいて、該周波数が最も小さなホルマントの特定音声信号レベルの変更量を算出する変更量算出処理と、
    前記算出された変更量に基づいて前記ホルマントの特定音声信号レベルをそれぞれ変更し、該特定音声信号レベルが変更されたホルマントを含む前記特定音声信号を出力するレベル変更処理とを有する音声レベル調整方法。
  5. 請求項4に記載の音声レベル調整方法において、
    前記特定音声信号レベルと前記雑音信号レベルとの間のレベル差と、前記ホルマントの増大または減少を判別するための基準となる増減判別値との比較に基づいて、前記変更量算出処理にて算出した変更量の加算または減算を示す符号を決定する符号決定処理を有し、
    前記レベル変更処理では、前記符号決定処理にて決定した符号に従って、前記ホルマントの特定音声信号レベルに対して前記変更量の加算または減算を行うことを特徴とする音声レベル調整方法。
  6. 請求項5に記載の音声レベル調整方法において、
    前記符号決定処理では、前記周波数が最も小さなホルマントについては、前記変更量の減算を示すように前記符号を決定することを特徴とする音声レベル調整方法。
  7. コンピュータに、
    音声を入力し、該音声のレベルに応じた音声信号を出力する手順と、
    前記出力した音声信号を、特定音源が出力した音声を示す特定音声信号と、雑音を示す雑音信号とに分離してそれぞれ出力する手順と、
    前記分離された特定音声信号に含まれる複数のホルマントそれぞれの特定音声信号レベルを検出する手順と、
    前記ホルマントそれぞれの特定音声信号レベルがピークとなる周波数における前記雑音信号の雑音信号レベルを検出する手順と、
    前記検出された互いの特定音声信号レベルの差を示すホルマントレベル差と、該特定音声信号レベルを補正する際の基準となる標準音声レベルとの比較に基づいて、周波数が最も小さなホルマント以外のホルマントの特定音声信号レベルそれぞれを補正する手順と、
    前記補正されたホルマントの特定音声信号レベルそれぞれと該ホルマントに対応する周波数における雑音信号レベルそれぞれとのレベル差に基づいて、該補正されたホルマントそれぞれの特定音声信号レベルの変更量を算出するとともに、前記周波数が最も小さなホルマントの特定音声信号レベルと該周波数における雑音信号レベルとに基づいて、該周波数が最も小さなホルマントの特定音声信号レベルの変更量を算出する変更量算出手順と、
    前記算出された変更量に基づいて前記ホルマントの特定音声信号レベルをそれぞれ変更し、該特定音声信号レベルが変更されたホルマントを含む前記特定音声信号を出力するレベル変更手順とを実行させるプログラム。
  8. 請求項7に記載のプログラムにおいて、
    前記特定音声信号レベルと前記雑音信号レベルとの間のレベル差と、前記ホルマントの増大または減少を判別するための基準となる増減判別値との比較に基づいて、前記変更量算出手順にて算出した変更量の加算または減算を示す符号を決定する符号決定手順を前記コンピュータに実行させ、
    前記レベル変更手順では、前記符号決定手順にて決定した符号に従って、前記ホルマントの特定音声信号レベルに対して前記変更量の加算または減算を行うことを特徴とするプログラム。
  9. 請求項8に記載のプログラムにおいて、
    前記符号決定手順では、前記周波数が最も小さなホルマントについては、前記変更量の減算を示すように前記符号を決定することを特徴とするプログラム。
JP2008189983A 2008-07-23 2008-07-23 音声レベル調整装置、音声レベル調整方法およびプログラム Pending JP2010028663A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008189983A JP2010028663A (ja) 2008-07-23 2008-07-23 音声レベル調整装置、音声レベル調整方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008189983A JP2010028663A (ja) 2008-07-23 2008-07-23 音声レベル調整装置、音声レベル調整方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2010028663A true JP2010028663A (ja) 2010-02-04

Family

ID=41734032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008189983A Pending JP2010028663A (ja) 2008-07-23 2008-07-23 音声レベル調整装置、音声レベル調整方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2010028663A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014500676A (ja) * 2010-12-08 2014-01-09 ヴェーデクス・アクティーセルスカプ 補聴器および音声再生増強方法
JP2016110050A (ja) * 2014-01-17 2016-06-20 寿通信機株式会社 音声処理装置及び音声明瞭化装置並びに音声処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014500676A (ja) * 2010-12-08 2014-01-09 ヴェーデクス・アクティーセルスカプ 補聴器および音声再生増強方法
JP2016110050A (ja) * 2014-01-17 2016-06-20 寿通信機株式会社 音声処理装置及び音声明瞭化装置並びに音声処理方法

Similar Documents

Publication Publication Date Title
US9881635B2 (en) Method and system for scaling ducking of speech-relevant channels in multi-channel audio
KR101465379B1 (ko) 개선된 오디오 재생 방법 및 보청기
JP6832968B2 (ja) クロストーク処理の方法
JP4649546B2 (ja) 補聴器
US20080082327A1 (en) Sound Processing Apparatus
JP2013190470A (ja) 音響信号処理装置および音響信号処理方法
US20050094828A1 (en) Bass boost circuit
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
US9478235B2 (en) Voice signal processing device and voice signal processing method
US20100189283A1 (en) Tone emphasizing device, tone emphasizing method, tone emphasizing program, and recording medium
Kates Modeling the effects of single-microphone noise-suppression
KR101712101B1 (ko) 신호 처리 방법 및 장치
JP2009296298A (ja) 音声信号処理装置および方法
WO2012098856A1 (ja) 補聴器、及び、補聴器の制御方法
JP2010028663A (ja) 音声レベル調整装置、音声レベル調整方法およびプログラム
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
US20230360662A1 (en) Method and device for processing a binaural recording
US20170332180A1 (en) Feedback Reduction For High Frequencies
CN109791773B (zh) 音频输出产生系统、音频通道输出方法和计算机可读介质
CN106328159B (zh) 一种音频流的处理方法及装置
US20190342661A1 (en) Dominant sub-band determination
JP6159570B2 (ja) 音声強調装置、及びプログラム
JP2005257748A (ja) 収音方法、収音装置、収音プログラム
JP2010016430A (ja) 周波数特性調整装置および周波数特性調整方法ならびにプログラム
JP2008283385A (ja) 雑音抑制装置