JP4785563B2 - 音声処理装置および音声処理方法 - Google Patents

音声処理装置および音声処理方法 Download PDF

Info

Publication number
JP4785563B2
JP4785563B2 JP2006058095A JP2006058095A JP4785563B2 JP 4785563 B2 JP4785563 B2 JP 4785563B2 JP 2006058095 A JP2006058095 A JP 2006058095A JP 2006058095 A JP2006058095 A JP 2006058095A JP 4785563 B2 JP4785563 B2 JP 4785563B2
Authority
JP
Japan
Prior art keywords
spectrum
envelope
speech
voice
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006058095A
Other languages
English (en)
Other versions
JP2007233284A (ja
Inventor
佳洋 入江
良種 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2006058095A priority Critical patent/JP4785563B2/ja
Publication of JP2007233284A publication Critical patent/JP2007233284A/ja
Application granted granted Critical
Publication of JP4785563B2 publication Critical patent/JP4785563B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

本発明は、話者のプライバシーを保護する(会話の秘密保持含む)ために話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理装置および音声処理方法に関し、特に、話者の音声に被せて出力される音声が甲高い音になってしまうのを効果的に防止し、人に不快感を与えることなく話者のプライバシーを保護することができる音声処理装置および音声処理方法に関する。
従来、銀行、病院、証券会社などのオープンスペースでは、プライバシーに関わる内容の会話が頻繁におこなわれている。このため、話者のプライバシーを保護することを目的として、話者の音声(会話による音声)に対してマスキング音を出力するマスキング装置が開発されている(たとえば、特許文献1を参照)。
具体的には、かかる「マスキング音」としてホワイトノイズやBGMなど、話者の発話音声を不明瞭にする妨害音を話者の発話音声に被せて出力し、話者の発話音声をかき消して発言内容を聞き取りにくくすることにより、話者のプライバシーを保護する。
特開平6−175666号公報
しかしながら、上述した従来技術では、話者のプライバシーを精度良く保護することができないという問題点があった。すなわち、上述した従来技術では、話者の音声との関連性が少ない音声をマスキング音として出力するため、話者の音声とマスキング音は別々の音声であると区別して傍聴者に認識されてしまうこととなり、話者のプライバシーを精度良く保護することができなかった。
このような問題を解決するため、話者の発話音声を用いて防聴音(後述にて説明)を生成し、マスキング音として出力することも考えられる。具体的には、話者の発話音声の音声スペクトルを検出し、音声スペクトルにおける山および谷の位置を反転・シフトして音声スペクトルを変形することにより防聴音を生成する。
ところが、単に音声スペクトルにおける山および谷を反転・シフトした場合には、防聴音が甲高い音になってしまい、防聴音を聞く人に不快感を与えてしまうという問題があった。そのため、防聴音が甲高い音になってしまうのをいかに効果的に防止し、防聴音を聞く人に不快感を与えないようにするかが重要な問題となる。
本発明は、上述した従来技術による問題点を解消するためになされたものであり、防聴音が甲高い音になってしまうのを効果的に防止し、人に不快感を与えることなく話者のプライバシーを保護することができる音声処理装置および音声処理方法を提供することを目的とする。
上述した課題を解決し、目的を達成するため、請求項1の発明に係る音声処理装置は、話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理装置であって、人の代表的な音声信号のスペクトル包絡を複数個記憶するスペクトル包絡データベースと、話者の音声信号からスペクトル微細構造を抽出するスペクトル微細構造抽出手段と、前記スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択するスペクトル包絡選択手段と、前記スペクトル包絡選択手段により選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成手段とを備えたことを特徴とする。
また、請求項2の発明に係る音声処理装置は、請求項1の発明において、前記スペクトル包絡選択手段は、話者の音声の時間変化量が所定値以上である場合に前記スペクトル包絡データベースからスペクトル包絡に係るデータを新たに選択し、前記音声スペクトル生成手段は、前記スペクトル包絡選択手段により新たに選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを新たに生成することを特徴とする。
また、請求項3の発明に係る音声処理装置は、請求項1または2の発明において、前記スペクトル包絡選択手段は、前記スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータをランダムに選択することを特徴とする。
また、請求項4の発明に係る音声処理装置は、請求項1または2の発明において、話者の音声信号からスペクトル包絡を抽出するスペクトル包絡抽出手段をさらに備え、前記スペクトル包絡選択手段は、前記スペクトル包絡抽出手段により抽出されたスペクトル包絡と、前記スペクトル包絡データベースにデータが記憶されたスペクトル包絡との間の類似度に基づいて、前記スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択することを特徴とする。
また、請求項5の発明に係る音声処理装置は、話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理装置であって、話者の音声信号からスペクトル微細構造を抽出するスペクトル微細構造抽出手段と、前記スペクトル微細構造抽出手段により抽出されたスペクトル微細構造と所定周波数帯域のスペクトル強度が補正されたスペクトル包絡とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成手段と、前記音声スペクトル生成手段により生成された音声スペクトルの所定の周波数領域におけるスペクトル強度を抑制することにより当該音声スペクトルを補正する周波数強度補正手段とを備えたことを特徴とする。
また、請求項6の発明に係る音声処理装置は、請求項5の発明において、前記周波数強度補正手段は、話者の音声信号から得られる音声スペクトルと、前記音声スペクトル生成手段により生成された音声スペクトルとの差に基づいてスペクトル強度の補正量を設定することを特徴とする。
また、請求項7の発明に係る音声処理方法は、話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理方法であって、人の代表的な音声信号のスペクトル包絡をスペクトル包絡データベースに複数個記憶する記憶工程と、話者の音声信号からスペクトル微細構造を抽出するスペクトル抽出工程と、前記スペクトル微細構造抽出工程によりスペクトル微細構造が抽出された場合に、あらかじめスペクトル包絡データベースに記憶された異なる複数のスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択するスペクトル包絡選択工程と、前記スペクトル包絡選択工程により選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成工程とを含んだことを特徴とする。
また、請求項8の発明に係る音声処理方法は、話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理方法であって、話者の音声信号からスペクトル微細構造を抽出するスペクトル微細構造抽出工程と、前記スペクトル微細構造抽出手段により抽出されたスペクトル微細構造と所定周波数帯域のスペクトル強度が補正されたスペクトル包絡とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成工程と、前記音声スペクトル生成工程により生成された音声スペクトルの所定の周波数領域におけるスペクトル強度を抑制することにより当該音声スペクトルを補正する周波数強度補正工程とを含んだことを特徴とする。
請求項1または7の発明によれば、スペクトル包絡データベースが人の代表的な音声信号のスペクトル包絡を複数個記憶し、話者の音声信号からスペクトル微細構造を抽出し、スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択し、選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成することとしたので、話者の音源情報を保持したスペクトル微細構造とスペクトル包絡とを利用して防聴音のスペクトルを生成するので、防聴音は話者の音源情報を保持しているため、話者の会話音声と融合し、話者の発言内容を聞き取りにくくすることができるとともに、話者の音声スペクトルを変形して防聴音を生成するのではなく、スペクトル包絡データベースにあらかじめ登録されたスペクトル包絡を用いて防聴音を生成するので、防聴音が甲高い音になって、人に不快感を与えてしまうことを効果的に防止することができるという効果を奏する。
また、請求項2の発明によれば、話者の音声の時間変化量が所定値以上である場合にスペクトル包絡データベースからスペクトル包絡に係るデータを新たに選択し、新たに選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを新たに生成することとしたので、話者の発言内容を聞き取りにくくするのに適したスペクトル包絡を話者の音声の変化に追従して選択することができるという効果を奏する。
また、請求項3の発明によれば、スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータをランダムに選択することとしたので、人に不快感を与えることのない防聴音の生成に用いられるスペクトル包絡を効率的に選択することができるという効果を奏する。
また、請求項4の発明によれば、話者の音声信号からスペクトル包絡をさらに抽出し、抽出されたスペクトル包絡と、スペクトル包絡データベースにデータが記憶されたスペクトル包絡との間の類似度に基づいて、スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択することとしたので、話者の音韻とかけ離れた音韻を表すスペクトル包絡を効果的に選択することができ、話者の発言内容を聞き取りにくくする防聴音を生成することができるという効果を奏する。
また、請求項5または8の発明によれば、話者の音声信号からスペクトル微細構造を抽出し、抽出されたスペクトル微細構造と所定周波数帯域のスペクトル強度が補正されたスペクトル包絡とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成し、生成された音声スペクトルの所定の周波数領域におけるスペクトル強度を抑制することにより当該音声スペクトルを補正することとしたので、防聴音が甲高い音になる原因となる周波数領域のスペクトル強度を抑制することにより、人に不快感を与えてしまうことを効果的に防止することができるという効果を奏する。
また、請求項6の発明によれば、話者の音声信号から抽出されたスペクトル微細構造および所定のスペクトル包絡を合成することにより生成された音声スペクトルと、話者の音声信号から得られる音声スペクトルとの差に基づいてスペクトル強度の補正量を設定することとしたので、防聴音が甲高い音になる原因となる周波数領域のスペクトル強度の補正量を適切に設定することができるという効果を奏する。
以下に添付図面を参照して、本発明に係る音声処理装置および音声処理方法の好適な実施例を詳細に説明する。
まず、本実施例1に係る音声処理の概念について説明する。図1は、実施例1に係る音声処理の概念を説明する図である。
図1に示すように、この音声処理では、話者の会話音声を不明瞭にする音声(この音声は会話音声が第三者に聞き取られる(聴かれる)のを防ぐことが目的であるため、以下、この音声を防聴音と呼ぶ)を生成する場合に、マイクロフォン等により話者の音声信号を取得し、所定の時間間隔で音声信号のスペクトル分析をおこなって、音圧や周波数分布などの会話音声の特徴を抽出する。図1には、「あ」、「い」、「う」、「え」、「お」という音声波形10に対してスペクトル分析を適用した結果得られるスペクトログラム11の例が示されている。
そして、このようなスペクトログラム11から得られる短時間スペクトル12から、音韻情報を表すスペクトル包絡13と、音源情報を表すスペクトル微細構造14とが抽出される。
一方、この音声処理においては、あらかじめ人の代表的な音声信号をクラスタリングなどの統計手法を用いて抽出し、抽出された音声信号のスペクトル包絡をスペクトル包絡データベース15に複数登録しておく。
そして、話者の会話音声のスペクトル分析から得られたスペクトル包絡13と最も類似していない(スペクトル距離が最大である)スペクトル包絡がスペクトル包絡データベース15に登録されたスペクトル包絡の中から選択され、選択されたスペクトル包絡16により話者の会話音声から得られたスペクトル包絡13が置換される。
ここで、話者の会話音声のスペクトル分析から得られたスペクトル包絡13と最も類似していないスペクトル包絡を選択する理由は、話者の音声の音韻とかけ離れた音韻を表すスペクトル包絡を基にして防聴音を生成することにより話者の発言内容を聞き取りにくくするためである。
続いて、話者の会話音声から得られたスペクトル包絡13を置換したスペクトル包絡16とスペクトル微細構造14とが合成され、防聴音のスペクトル17が生成される。そして、この防聴音のスペクトル17から防聴音が生成され、スピーカからその防聴音が出力される。
このように、この音声処理では、話者の音源情報を保持したスペクトル微細構造14と、人の代表的な音声信号のスペクトル包絡とを利用して防聴音のスペクトルを生成するので、防聴音は話者の音源情報を保持しているため、防聴音を話者の会話音声と融合させることができ、話者の発言内容を聞き取りにくくすることができる。
また、話者の音声スペクトルにおける山および谷の位置を反転・シフトして防聴音を生成するのではなく、人の代表的な音声信号のスペクトル包絡をそのまま用いて防聴音を生成するため、防聴音が不自然に甲高い音になって防聴音を聞く人に不快感を与えてしまうことを防止することができる。
図2は、実施例1における防聴音のスペクトログラムと従来の防聴音のスペクトログラムとの比較を示す図である。図2には、話者が発声した原音声のスペクトログラム20と、従来の防聴音のスペクトログラム21と、本実施例の防聴音のスペクトログラム22とが示されている。図2の各スペクトログラムにおいては色の濃い領域が強度の大きい領域に対応している。
ここで、従来の防聴音のスペクトログラム21とは、話者の会話音声のスペクトル包絡13における山および谷の位置を反転・シフトして、スペクトル微細構造14と合成することにより生成された防聴音のスペクトログラムである。また、本実施例の防聴音のスペクトログラム22とは、図1で説明したようにして生成された防聴音のスペクトログラムである。
図2に示すように、従来の防聴音のスペクトログラム21では、中域(1kHz〜4kHz)の周波数領域における強度が原音声のスペクトログラム20に比べて増大している。そして、この中域の周波数範囲における強度の増大が甲高い音の原因となっている。
それに対して、本実施例の防聴音のスペクトログラム22では、中域の周波数範囲における強度の増大が抑制されていることがわかる。このように、中域の周波数範囲における強度の増大を抑制することにより、防聴音が甲高い音になることを効果的に防止することができる。
なお、本実施例のように、人の代表的な音声信号のスペクトル包絡を利用して防聴音のスペクトルを生成する場合には、図2に示したような原音声のスペクトログラム20の時間変化に応じて防聴音の生成に用いられるスペクトル包絡が再選択される。
具体的には、図2に示したように、原音声の時間変化が所定値以上になった場合には、話者の音声信号から抽出されたスペクトル包絡と最も類似していないスペクトル包絡がスペクトル包絡データベース14に登録されたスペクトル包絡の中から新たに選択され、選択されたスペクトル包絡を用いて防聴音のスペクトルが生成される。これにより、話者の発言内容を聞き取りにくくするのに適したスペクトル包絡を原音声の変化に追従して適切に選択することができる。
つぎに、実施例1に係る音声処理装置の機能構成について説明する。図3は、実施例1に係る音声処理装置30の機能構成を示す図である。図3に示すように、この音声処理装置30は、入力部31、表示部32、音声入力受付部33、スペクトル包絡データベース34、音声生成部35、音声出力部36、制御部37を有する。
入力部31は、各種情報の入力に用いられるキーボードやマウスなどの入力デバイスである。表示部32は、各種情報を出力するディスプレイなどの表示デバイスである。音声入力受付部33は、マイクロフォンなどから話者の音声信号を受け付け、A/D変換および増幅処理をおこなって制御部37に出力する受付部である。
スペクトル包絡データベース34は、図1で説明したようにして防聴音のスペクトルを生成する場合に、話者の音声信号から抽出されたスペクトル包絡を置き換える候補となるスペクトル包絡のデータを記憶したデータベースである。
音声生成部35は、後に説明する制御部37により生成された防聴音のスペクトルから防聴音の音声信号を生成する生成部である。音声出力部36は、音声生成部35により生成された音声信号のD/A変換および増幅処理をおこなってスピーカに出力する出力部である。
制御部37は、OS(Operating System)などの制御プログラム、各種処理の処理手順を規定したプログラム、および、各種データを格納するためのメモリを有し、種々の処理を実行する制御部である。
この制御部37は、スペクトル分析部37a、スペクトル微細構造抽出部37b、スペクトル包絡抽出部37c、スペクトル包絡選択部37d、スペクトル生成部37eを有する。
スペクトル分析部37aは、音声入力受付部33からデジタル化された音声信号を受け付けてケプストラム分析をおこない、その結果得られるケプストラム係数のうち、高ケフレンシ部と低ケフレンシ部とをスペクトル微細構造抽出部37b、スペクトル包絡抽出部37cにそれぞれ出力する分析部である。
具体的には、スペクトル分析部37aは、音声信号に対してハニング窓やハミング窓などの所定の窓関数を適用し、高速フーリエ変換(FFT, Fast Fourier Transform)を用いた短時間スペクトル分析を実行する。
続いて、スペクトル分析部37aは、高速フーリエ変換の結果得られた値の絶対値を求め、さらにその絶対値の対数を算出する。そして、スペクトル分析部37aは、算出された対数の値に逆高速フーリエ変換(IFFT, Inverse Fast Fourier Transform)を適用し、ケプストラム係数を算出する。
その後、スペクトル分析部37aは、算出されたケプストラム係数に対してケプストラム窓を用いてリフタリングをおこなうことにより高ケフレンシ部と低ケフレンシ部とを抽出する。
また、このスペクトル分析部37aは、過去に音声入力受付部33から受け付けた音声信号のスペクトルを記憶しておく。そして、スペクトル分析部37aは、新たに受け付けた音声信号のスペクトルと、過去に受け付けた音声信号のスペクトルとの間のスペクトル距離を算出し、そのスペクトル距離が所定値以上になった場合にスペクトル包絡選択部37dに対して新たなスペクトル包絡を選択するよう指示する処理をおこなう。
スペクトル微細構造抽出部37bは、スペクトル分析部37aから高ケフレンシ部を受け付け、高速フーリエ変換を適用することによりスペクトル微細構造を抽出する抽出部である。スペクトル包絡抽出部37cは、スペクトル分析部37aから低ケフレンシ部を受け付け、高速フーリエ変換を適用することによりスペクトル包絡を抽出する抽出部である。
スペクトル包絡選択部37dは、スペクトル包絡抽出部37cにより抽出されたスペクトル包絡と、スペクトル包絡データベース34に登録されたスペクトル包絡との間のスペクトル距離を算出し、スペクトル包絡データベース34に登録されたスペクトル包絡のうちスペクトル距離が最大であるスペクトル包絡を、スペクトル包絡抽出部37cにより抽出されたスペクトル包絡を置換するものとして選択する選択部である。
ここで、スペクトル距離としては、低ケフレンシ部の成分からなるベクトルのユークリッド距離が用いられる。なお、ここで用いられるスペクトル距離はこれに限定されず、FFTによるスペクトル距離や、線形予測(LPC, Linear Predictive Coding)分析により得られたスペクトル包絡に基づくスペクトル距離など、従来提案されているさまざまなスペクトル距離を用いてもよい。
スペクトル生成部37eは、スペクトル微細構造抽出部37bにより抽出されたスペクトル微細構造と、スペクトル包絡選択部37dにより選択されたスペクトル包絡とを合成して防聴音のスペクトルを生成する生成部である。
つぎに、実施例1に係る音声処理の処理手順について説明する。図4は、実施例1に係る音声処理の処理手順を示すフローチャートである。図4に示すように、まず、音声処理装置30の音声入力受付部33は、マイクロフォンから音声信号の入力を受け付ける(ステップS101)。
そして、スペクトル分析部37aは、入力された音声信号の音声波形のスペクトル分析を実行し、ケプストラム係数における高ケフレンシ部および低ケフレンシ部を算出する(ステップS102)。
続いて、スペクトル微細構造抽出部37bは、スペクトル分析部37aから高ケフレンシ部を取得して、スペクトル微細構造を抽出する(ステップS103)。そして、スペクトル包絡抽出部37cは、スペクトル分析部37aから低ケフレンシ部を取得して、スペクトル包絡を抽出する(ステップS104)。
その後、スペクトル分析部37aは、入力された音声信号のスペクトルと、過去に入力された音声信号のスペクトルとを比較して、スペクトルの時間変動が所定値以上となったか否かを調べる(ステップS105)。
スペクトルの時間変動が所定値以上でない場合には(ステップS105,No)、スペクトル包絡選択部37dは、スペクトル包絡が選択済みか否かを調べる(ステップS106)。
そして、スペクトル包絡が選択済みでない場合には(ステップS106,No)、スペクトル包絡選択部37dは、スペクトル包絡データベース34に登録されたスペクトル包絡のデータを読み込む(ステップS107)。
続いて、スペクトル包絡選択部37dは、スペクトル包絡抽出部37cにより抽出されたスペクトル包絡とスペクトル距離が最も大きいスペクトル包絡をスペクトル包絡データベース34に登録されたスペクトル包絡の中から選択する(ステップS108)。
その後、スペクトル生成部37eは、選択されたスペクトル包絡と、スペクトル微細構造抽出部37bにより抽出されたスペクトル微細構造とを合成した防聴音のスペクトルを生成する(ステップS109)。
ステップS105において、スペクトルの時間変動が所定値以上である場合には(ステップS105,Yes)、ステップS107に移行して、それ以後の処理を継続する。また、ステップS106において、スペクトル包絡が選択済みである場合には(ステップS106,Yes)、ステップS109に移行して、それ以後の処理を継続する。
ステップS109の後、音声生成部35は、スペクトル生成部37eにより生成された防聴音のスペクトルから防聴音の音声信号を生成する(ステップS110)。そして、音声出力部36は、音声生成部35により生成された防聴音の音声信号をスピーカに出力する(ステップS111)。
その後、制御部37は、防聴音の出力処理の終了指示がなされたか否かを調べ(ステップS112)、終了指示がなされた場合には(ステップS112,Yes)、この処理を終了する。終了指示がなされていない場合には(ステップS112,No)、ステップS101に移行して、それ以後の処理を繰り返す。
ステップS105において、スペクトルの時間変動が所定値以上となった場合には(ステップS105,Yes)、スペクトル生成部37eは、設定済みのスペクトル包絡を棄却し、ステップS107に移行して、スペクトル包絡を新たに設定する処理をおこなう。
なお、上記実施例では、スペクトル包絡データベース34に登録されたスペクトル包絡の中からスペクトル包絡をスペクトル距離に基づいて選択することとしたが、スペクトル包絡データベース34に登録されたスペクトル包絡の中からスペクトル包絡をランダムに選択してもよく、あるいは、その他の方法で選択してもよい。
上述してきたように、実施例1によれば、異なる複数のスペクトル包絡に係るデータをスペクトル包絡データベース34が記憶し、スペクトル微細構造抽出部37bが、話者の音声信号からスペクトル微細構造を抽出し、スペクトル包絡選択部37dが、スペクトル包絡データベース34に記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択し、スペクトル生成部37eが、選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される防聴音のスペクトルを生成することとしたので、話者の音源情報を保持したスペクトル微細構造とスペクトル包絡とを利用して防聴音のスペクトルを生成するので、防聴音は話者の音源情報を保持しているため、話者の会話音声と融合し、話者の発言内容を聞き取りにくくすることができるとともに、話者の音声スペクトルを変形して防聴音を生成するのではなく、スペクトル包絡データベース34にあらかじめ登録されたスペクトル包絡を用いて防聴音を生成するので、防聴音が甲高い音になって、人に不快感を与えてしまうことを効果的に防止することができる。
また、実施例1によれば、スペクトル包絡選択部37dが、話者の音声の時間変化量が所定値以上である場合にスペクトル包絡データベース34からスペクトル包絡に係るデータを新たに選択し、スペクトル生成部37eが、新たに選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを新たに生成することとしたので、話者の発言内容を聞き取りにくくするのに適したスペクトル包絡を話者の音声の変化に追従して選択することができる。
また、実施例1によれば、スペクトル包絡選択部37dが、スペクトル包絡データベース34に記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータをランダムに選択することとしたので、人に不快感を与えることのない防聴音の生成に用いられるスペクトル包絡を効率的に選択することができる。
また、実施例1によれば、スペクトル包絡抽出部37cが、話者の音声信号からスペクトル包絡を抽出し、スペクトル包絡選択部37dが、抽出されたスペクトル包絡と、スペクトル包絡データベース34にデータが記憶されたスペクトル包絡との間のスペクトル距離に基づいて、スペクトル包絡データベース34に記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択することとしたので、話者の音韻とかけ離れた音韻を表すスペクトル包絡を効果的に選択することができ、話者の発言内容を聞き取りにくくする防聴音を生成することができる。
ところで、実施例1では、人の代表的な音声信号のスペクトル包絡を利用して、甲高さが抑制された防聴音のスペクトルを生成することとしたが、生成された防聴音のスペクトルにおいて甲高さの原因となる周波数領域のスペクトル強度を抑制することにより、防聴音が甲高い音になるのを防止することとしてもよい。そこで、本実施例2では、防聴音のスペクトルにおいて甲高さの原因となる周波数領域のスペクトル強度を抑制する場合について説明する。
まず、本実施例2に係る音声処理の概念について説明する。図5は、実施例2に係る音声処理を説明する図である。
この音声処理では、防聴音のスペクトルにおいて甲高さの原因となる周波数領域のスペクトル強度補正量40をあらかじめ算出しておく。図5の例では、1kHz〜2kHzの周波数領域が甲高さの大きな原因となっており、特に補正量が大きくなっている。
図5に示したようなスペクトル強度補正量40は、さまざまな話者の音声信号のスペクトルの特徴と、それらの話者の音声信号に基づいて生成された防聴音のスペクトルとを比較することにより算出される。
図6は、スペクトル強度補正量40の算出方法について説明する図である。図6に示すように、スペクトル強度補正量40を算出する場合には、さまざまな話者の音声信号のスペクトルを収集し、収集したスペクトルの平均値(原音のスペクトル平均)を算出する。一方で、さまざまな話者の音声信号から生成された防聴音の音声信号のスペクトルを収集し、収集したスペクトルの平均値(防聴音のスペクトル平均)を算出する。
そして、防聴音のスペクトル平均から原音のスペクトル平均を差し引いたスペクトルの増加分(防聴音のスペクトル増加分)を算出する。そして、防聴音のスペクトル増加分が正の値である周波数帯域を検出し、その周波数帯域における防聴音のスペクトル増加分を防聴音のスペクトルのスペクトル強度から減ずるスペクトル強度補正量40として設定する。
このようにして、甲高さの原因となる周波数領域のスペクトル強度を抑制することにより、防聴音が甲高い音になることを効果的に防止することができる。
つぎに、実施例2に係る音声処理装置の機能構成について説明する。図7は、実施例2に係る音声処理装置50の機能構成を示す図である。なお、ここでは、音声処理装置50は、防聴音のスペクトルを話者の音声信号から抽出したスペクトル包絡を変化させることにより生成することとする。しかしながら、防聴音のスペクトルの生成方法はこれに限定されず、実施例1で説明したような方法など、その他の方法で生成することとしてもよい。
図7に示すように、この音声処理装置50は、入力部51、表示部52、音声入力受付部53、音声生成部54、音声出力部55、制御部56を有する。
入力部51は、各種情報の入力に用いられるキーボードやマウスなどの入力デバイスである。表示部52は、各種情報を出力するディスプレイなどの表示デバイスである。音声入力受付部53は、マイクロフォンなどから話者の音声信号を受け付け、A/D変換および増幅処理をおこなって制御部56に出力する受付部である。
音声生成部54は、後に説明する制御部56により生成された防聴音のスペクトルから防聴音の音声信号を生成する生成部である。音声出力部55は、音声生成部54により生成された音声信号のD/A変換および増幅処理をおこなってスピーカに出力する出力部である。
制御部56は、OSなどの制御プログラム、各種処理の処理手順を規定したプログラム、および、各種データを格納するためのメモリを有し、種々の処理を実行する制御部である。
この制御部56は、スペクトル分析部56a、スペクトル微細構造抽出部56b、スペクトル包絡抽出部56c、スペクトル包絡変形部56d、スペクトル生成部56e、周波数強度補正量算出部56f、周波数強度補正部56gを有する。
スペクトル分析部56aは、実施例1で説明したスペクトル分析部56aと同様にして、音声入力受付部53からデジタル化された音声信号を受け付けてケプストラム分析をおこない、その結果得られるケプストラム係数のうち、高ケフレンシ部と低ケフレンシ部とをスペクトル微細構造抽出部56b、スペクトル包絡抽出部56cにそれぞれ出力する分析部である。
スペクトル微細構造抽出部56bは、スペクトル分析部56aから高ケフレンシ部を受け付け、高速フーリエ変換を適用することによりスペクトル微細構造を抽出する抽出部である。スペクトル包絡抽出部56cは、スペクトル分析部56aから低ケフレンシ部を受け付け、高速フーリエ変換を適用することによりスペクトル包絡を抽出する抽出部である。
スペクトル包絡変形部56dは、抽出されたスペクトル包絡の山や谷の位置を変化させることによりスペクトル包絡の形状を変形させる変形部である。具体的には、スペクトル包絡変形部56dは、スペクトル包絡に対して所定の反転軸を設定して、その反転軸を中心として山や谷の位置を反転させる。
スペクトル生成部56eは、スペクトル微細構造抽出部56bにより抽出されたスペクトル微細構造と、スペクトル包絡変形部56dにより変形されたスペクトル包絡とを合成して防聴音のスペクトルを生成する生成部である。
周波数強度補正量算出部56fは、スペクトル生成部56eにより生成された防聴音のスペクトルにおけるスペクトル強度の補正量を算出する算出部である。具体的には、周波数強度補正量算出部56fは、スペクトル分析部56aから、さまざまな話者の音声信号のスペクトルの情報を受信し、受信したスペクトルの平均値(原音のスペクトル平均)を算出する。
また、周波数強度補正量算出部56fは、スペクトル生成部56eからさまざまな話者の音声信号に基づいて生成された防聴音のスペクトルの情報を受信し、受信したスペクトルの平均値(防聴音のスペクトル平均)を算出する。
その後、周波数強度補正量算出部56fは、防聴音のスペクトル平均から原音のスペクトル平均を差し引いたスペクトルの増加分(防聴音のスペクトル増加分)を算出する。そして、周波数強度補正量算出部56fは、防聴音のスペクトル増加分が正の値である周波数帯域を検出し、その周波数帯域における防聴音のスペクトル増加分をスペクトル強度の補正量として設定する。
周波数強度補正部56gは、スペクトル生成部56eにより生成された防聴音のスペクトルの所定の周波数領域におけるスペクトル強度を補正し、スペクトル強度が補正された防聴音のスペクトルを音声生成部54に出力する補正部である。具体的には、周波数強度補正部56gは、周波数強度補正量算出部56fにより算出された補正量の情報に基づいて、防聴音のスペクトルのスペクトル強度を補正する。
つぎに、実施例2に係る音声処理の処理手順について説明する。図8は、実施例2に係る音声処理の処理手順を示すフローチャートである。図8に示すように、まず、音声処理装置50の音声入力受付部53は、マイクロフォンから音声信号の入力を受け付ける(ステップS201)。
そして、スペクトル分析部56aは、入力された音声信号の音声波形のスペクトル分析を実行し、ケプストラム係数における高ケフレンシ部および低ケフレンシ部を算出する(ステップS202)。
続いて、スペクトル微細構造抽出部56bは、スペクトル分析部56aから高ケフレンシ部を取得して、スペクトル微細構造を抽出する(ステップS203)。そして、スペクトル包絡抽出部56cは、スペクトル分析部56aから低ケフレンシ部を取得して、スペクトル包絡を抽出する(ステップS204)。
その後、スペクトル包絡変形部56dは、スペクトル包絡抽出部56cにより抽出されたスペクトル包絡の山と谷の位置を変化させることによりスペクトル包絡を変形する(ステップS205)。
そして、スペクトル生成部56eは、スペクトル包絡変形部56dにより変形されたスペクトル包絡と、スペクトル微細構造抽出部56bにより抽出されたスペクトル微細構造とを合成した防聴音のスペクトルを生成する(ステップS206)。
続いて、周波数強度補正部56gは、スペクトル生成部56eにより生成された防聴音のスペクトルのあらかじめ設定された周波数領域におけるスペクトル強度を補正する(ステップS207)。このスペクトル強度の補正量の設定手順は、後に詳しく説明する。
そして、音声生成部54は、周波数強度補正部56gによりスペクトル強度が補正された防聴音のスペクトルから防聴音の音声信号を生成する(ステップS208)。そして、音声出力部55は、音声生成部54により生成された防聴音の音声信号をスピーカに出力する(ステップS209)。
その後、制御部56は、防聴音の出力処理の終了指示がなされたか否かを調べ(ステップS210)、終了指示がなされた場合には(ステップS210,Yes)、この処理を終了する。終了指示がなされていない場合には(ステップS210,No)、ステップS201に移行して、それ以後の処理を繰り返す。
つぎに、スペクトル強度補正量の設定処理の処理手順について説明する。図9は、スペクトル強度補正量の設定処理の処理手順を示すフローチャートである。図9に示すように、まず、音声処理装置50の周波数強度補正量算出部56fは、スペクトル分析部56aから入力音声のスペクトルの情報を受信して、その情報を蓄積する(ステップS301)。
また、周波数強度補正量算出部56fは、周波数強度補正量算出部56fは、スペクトル生成部56eから入力音声に基づいて生成された防聴音のスペクトルの情報を取得して、その情報を蓄積する(ステップS302)。
その後、周波数強度補正量算出部56fは、入力音声のスペクトルの平均(原音のスペクトル平均)を算出する(ステップS303)。また、周波数強度補正量算出部56fは、防聴音のスペクトルの平均(防聴音のスペクトル平均)を算出する(ステップS304)。
そして、周波数強度補正量算出部56fは、防聴音のスペクトル平均から入力音声信号のスペクトル平均を差し引いたスペクトルの増加分(防聴音のスペクトル増加分)を算出する(ステップS305)。
その後、周波数強度補正量算出部56fは、防聴音のスペクトル増加分が正の値である周波数帯域を検出し(ステップS306)、その周波数帯域における防聴音のスペクトル増加分をスペクトル強度の補正量として設定する(ステップS307)。
なお、上記実施例2では、周波数強度補正部56gが、防聴音のスペクトルのスペクトル強度をあらかじめ設定された補正量だけ自動的に補正することとしたが、周波数強度補正部56gが、入力部51を介してユーザにより入力された補正量を受け付け、その補正量分だけ防聴音のスペクトルのスペクトル強度を補正することとしてもよい。
この場合、周波数強度補正部56gは、図6に示したような防聴音のスペクトル増加分の情報を表示部52に出力するとともに、周波数領域ごとにスペクトル強度の補正量の指定をユーザから受け付けるスペクトル強度補正受付画面を表示部52に出力する。
図10は、表示部52に出力されるスペクトル強度補正受付画面60の一例を示す図である。ユーザは、防聴音が甲高い音になることを防止するため、防聴音のスペクトル増加分の情報を参照し、周波数帯域ごとにマウス等を操作してスペクトル強度の増減を調節するスライダを動かし、スペクトル強度の補正量を決定する。
そして、周波数強度補正部56gは、このスペクトル強度の補正量の情報を受け付け、受け付けた補正量の情報に基づいて防聴音のスペクトルのスペクトル強度の補正をおこなう。
上述してきたように、実施例2によれば、スペクトル微細構造抽出部56bが、話者の音声信号からスペクトル微細構造を抽出し、スペクトル生成部56eが、抽出されたスペクトル微細構造と所定のスペクトル包絡とを合成することにより話者の音声に被せて出力される防聴音のスペクトルを生成し、周波数強度補正部56gが、生成されたスペクトルの所定の周波数領域におけるスペクトル強度を抑制することにより当該スペクトルを補正することとしたので、防聴音が甲高い音になる原因となる周波数領域のスペクトル強度を抑制することにより、人に不快感を与えてしまうことを効果的に防止することができる。
また、実施例2によれば、周波数強度補正量算出部56fが、話者の音声信号から抽出されたスペクトル微細構造および所定のスペクトル包絡を合成することにより生成された防聴音のスペクトルと、話者の音声信号から得られるスペクトルとの差に基づいてスペクトル強度の補正量を設定することとしたので、防聴音が甲高い音になる原因となる周波数領域のスペクトル強度の補正量を適切に設定することができる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施例にて実施されてもよいものである。
また、上記実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
なお、上記実施例で説明した音声処理方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。このプログラムは、インターネットなどのネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク(FD)、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することもできる。
以上のように、本発明にかかる音声処理装置および音声処理方法は、話者の音声に被せて出力される音声が甲高い音になってしまうのを効果的に防止し、人に不快感を与えることなく話者のプライバシーを保護することが必要な音声処理システムに対して有用である。
実施例1に係る音声処理の概念を説明する図である。 実施例1における防聴音のスペクトログラムと従来の防聴音のスペクトログラムとの比較を示す図である。 実施例1に係る音声処理装置30の機能構成を示す図である。 実施例1に係る音声処理の処理手順を示すフローチャートである。 実施例2に係る音声処理を説明する図である。 スペクトル強度補正量40の算出方法について説明する図である。 実施例2に係る音声処理装置50の機能構成を示す図である。 実施例2に係る音声処理の処理手順を示すフローチャートである。 スペクトル強度補正量の設定処理の処理手順を示すフローチャートである。 表示部52に出力されるスペクトル強度変更受付画面60の一例を示す図である。
符号の説明
10 音声波形
11 スペクトログラム
12 短時間スペクトル
13 スペクトル包絡
14 スペクトル微細構造
15 スペクトル包絡データベース
16 置換したスペクトル包絡
17 防聴音のスペクトル
20 原音声のスペクトログラム
21 従来の防聴音のスペクトログラム
22 本実施例の防聴音のスペクトログラム
30 音声処理装置
31 入力部
32 表示部
33 音声入力受付部
34 スペクトル包絡データベース
35 音声生成部
36 音声出力部
37 制御部
37a スペクトル分析部
37b スペクトル微細構造抽出部
37c スペクトル包絡抽出部
37d スペクトル包絡選択部
37e スペクトル生成部
40 スペクトル強度補正量
50 音声処理装置
51 入力部
52 表示部
53 音声入力受付部
54 音声生成部
55 音声出力部
56 制御部
56a スペクトル分析部
56b スペクトル微細構造抽出部
56c スペクトル包絡抽出部
56d スペクトル包絡変形部
56e スペクトル生成部
56f 周波数強度補正量算出部
56g 周波数強度補正部
60 スペクトル強度補正受付画面

Claims (8)

  1. 話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理装置であって、
    人の代表的な音声信号のスペクトル包絡を複数個記憶するスペクトル包絡データベースと、
    話者の音声信号からスペクトル微細構造を抽出するスペクトル微細構造抽出手段と、
    前記スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択するスペクトル包絡選択手段と、
    前記スペクトル包絡選択手段により選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成手段と
    を備えたことを特徴とする音声処理装置。
  2. 前記スペクトル包絡選択手段は、話者の音声の時間変化量が所定値以上である場合に前記スペクトル包絡データベースからスペクトル包絡に係るデータを新たに選択し、前記音声スペクトル生成手段は、前記スペクトル包絡選択手段により新たに選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを新たに生成することを特徴とする請求項1に記載の音声処理装置。
  3. 前記スペクトル包絡選択手段は、前記スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータをランダムに選択することを特徴とする請求項1または2に記載の音声処理装置。
  4. 話者の音声信号からスペクトル包絡を抽出するスペクトル包絡抽出手段をさらに備え、前記スペクトル包絡選択手段は、前記スペクトル包絡抽出手段により抽出されたスペクトル包絡と、前記スペクトル包絡データベースにデータが記憶されたスペクトル包絡との間の類似度に基づいて、前記スペクトル包絡データベースに記憶されたスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択することを特徴とする請求項1または2に記載の音声処理装置。
  5. 話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理装置であって、
    話者の音声信号からスペクトル微細構造を抽出するスペクトル微細構造抽出手段と、
    前記スペクトル微細構造抽出手段により抽出されたスペクトル微細構造と所定周波数帯域のスペクトル強度が補正されたスペクトル包絡とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成手段と、
    前記音声スペクトル生成手段により生成された音声スペクトルの所定の周波数領域におけるスペクトル強度を抑制することにより当該音声スペクトルを補正する周波数強度補正手段と
    を備えたことを特徴とする音声処理装置。
  6. 前記周波数強度補正手段は、話者の音声信号から得られる音声スペクトルと、前記音声スペクトル生成手段により生成された音声スペクトルとの差に基づいてスペクトル強度の補正量を設定することを特徴とする請求項5に記載の音声処理装置。
  7. 話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理方法であって、
    人の代表的な音声信号のスペクトル包絡をスペクトル包絡データベースに複数個記憶する記憶工程と、
    話者の音声信号からスペクトル微細構造を抽出するスペクトル抽出工程と、
    前記スペクトル微細構造抽出工程によりスペクトル微細構造が抽出された場合に、あらかじめスペクトル包絡データベースに記憶された異なる複数のスペクトル包絡に係るデータの中からスペクトル包絡に係るデータを選択するスペクトル包絡選択工程と、
    前記スペクトル包絡選択工程により選択されたスペクトル包絡とスペクトル微細構造とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成工程と
    を含んだことを特徴とする音声処理方法。
  8. 話者の音声に被せて出力される音声の音声スペクトルを生成する音声処理方法であって、
    話者の音声信号からスペクトル微細構造を抽出するスペクトル微細構造抽出工程と、
    前記スペクトル微細構造抽出手段により抽出されたスペクトル微細構造と所定周波数帯域のスペクトル強度が補正されたスペクトル包絡とを合成することにより話者の音声に被せて出力される音声の音声スペクトルを生成する音声スペクトル生成工程と、
    前記音声スペクトル生成工程により生成された音声スペクトルの所定の周波数領域におけるスペクトル強度を抑制することにより当該音声スペクトルを補正する周波数強度補正工程と
    を含んだことを特徴とする音声処理方法。
JP2006058095A 2006-03-03 2006-03-03 音声処理装置および音声処理方法 Expired - Fee Related JP4785563B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006058095A JP4785563B2 (ja) 2006-03-03 2006-03-03 音声処理装置および音声処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006058095A JP4785563B2 (ja) 2006-03-03 2006-03-03 音声処理装置および音声処理方法

Publications (2)

Publication Number Publication Date
JP2007233284A JP2007233284A (ja) 2007-09-13
JP4785563B2 true JP4785563B2 (ja) 2011-10-05

Family

ID=38553903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006058095A Expired - Fee Related JP4785563B2 (ja) 2006-03-03 2006-03-03 音声処理装置および音声処理方法

Country Status (1)

Country Link
JP (1) JP4785563B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140326B2 (en) * 2008-06-06 2012-03-20 Fuji Xerox Co., Ltd. Systems and methods for reducing speech intelligibility while preserving environmental sounds
JP5511342B2 (ja) * 2009-12-09 2014-06-04 日本板硝子環境アメニティ株式会社 音声変更装置、音声変更方法および音声情報秘話システム
JP5605062B2 (ja) * 2010-08-03 2014-10-15 大日本印刷株式会社 騒音源の快音化方法および快音化装置
JP6537953B2 (ja) * 2015-10-23 2019-07-03 武藤工業株式会社 測色による作画調整方法及び装置
KR102658693B1 (ko) * 2019-06-06 2024-04-19 미쓰비시 덴키 빌딩 솔루션즈 가부시키가이샤 분석 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03276998A (ja) * 1990-03-27 1991-12-09 Matsushita Electric Works Ltd 環境音制御装置
JPH04282697A (ja) * 1991-03-12 1992-10-07 Mazda Motor Corp 雑音制御装置
US7143028B2 (en) * 2002-07-24 2006-11-28 Applied Minds, Inc. Method and system for masking speech
JP4336552B2 (ja) * 2003-09-11 2009-09-30 グローリー株式会社 マスキング装置

Also Published As

Publication number Publication date
JP2007233284A (ja) 2007-09-13

Similar Documents

Publication Publication Date Title
JP4761506B2 (ja) 音声処理方法と装置及びプログラム並びに音声システム
Lai et al. A deep denoising autoencoder approach to improving the intelligibility of vocoded speech in cochlear implant simulation
JP5127754B2 (ja) 信号処理装置
JP5103974B2 (ja) マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム
JP2009294642A (ja) 音声信号を合成する方法、システム、およびプログラム
JP2002014689A (ja) デジタルに圧縮されたスピーチの了解度を向上させる方法および装置
Maruri et al. V-speech: Noise-robust speech capturing glasses using vibration sensors
Hummersone A psychoacoustic engineering approach to machine sound source separation in reverberant environments
JP4785563B2 (ja) 音声処理装置および音声処理方法
Nathwani et al. Speech intelligibility improvement in car noise environment by voice transformation
JP3960834B2 (ja) 音声強調装置及び音声強調方法
JP4680099B2 (ja) 音声処理装置および音声処理方法
JP2014130251A (ja) 会話保護システム及び会話保護方法
JP2011186143A (ja) ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム
JP6349112B2 (ja) サウンドマスキング装置、方法及びプログラム
Jokinen et al. The Use of Read versus Conversational Lombard Speech in Spectral Tilt Modeling for Intelligibility Enhancement in Near-End Noise Conditions.
Hussain et al. A Novel Speech Intelligibility Enhancement Model based on Canonical Correlation and Deep Learning
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
Hussain et al. A speech intelligibility enhancement model based on canonical correlation and deep learning for hearing-assistive technologies
Kociński et al. Time-compressed speech intelligibility in different reverberant conditions
JP2011170113A (ja) 会話保護度合評価システムおよび会話保護度合評価方法
Chen et al. Understanding frequency-compressed Mandarin sentences: Role of vowels
JP2905112B2 (ja) 環境音分析装置
Pourmand et al. Computational auditory models in predicting noise reduction performance for wideband telephony applications
JP5745453B2 (ja) 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110712

R150 Certificate of patent or registration of utility model

Ref document number: 4785563

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees