JP5644359B2 - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP5644359B2
JP5644359B2 JP2010236019A JP2010236019A JP5644359B2 JP 5644359 B2 JP5644359 B2 JP 5644359B2 JP 2010236019 A JP2010236019 A JP 2010236019A JP 2010236019 A JP2010236019 A JP 2010236019A JP 5644359 B2 JP5644359 B2 JP 5644359B2
Authority
JP
Japan
Prior art keywords
sound
unit
voice
masker
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010236019A
Other languages
English (en)
Other versions
JP2012088577A (ja
Inventor
小林 詠子
詠子 小林
利晃 石橋
利晃 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010236019A priority Critical patent/JP5644359B2/ja
Priority to CN2011800448169A priority patent/CN103189912A/zh
Priority to PCT/JP2011/074255 priority patent/WO2012053629A1/ja
Priority to US13/822,490 priority patent/US9117436B2/en
Publication of JP2012088577A publication Critical patent/JP2012088577A/ja
Application granted granted Critical
Publication of JP5644359B2 publication Critical patent/JP5644359B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/80Jamming or countermeasure characterized by its function
    • H04K3/82Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
    • H04K3/825Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/1752Masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/40Jamming having variable characteristics
    • H04K3/45Jamming having variable characteristics characterized by including monitoring of the target or target signal, e.g. in reactive jammers or follower jammers for example by means of an alternation of jamming phases and monitoring phases, called "look-through mode"
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/40Jamming having variable characteristics
    • H04K3/46Jamming having variable characteristics characterized in that the jamming signal is produced by retransmitting a received signal, after delay or processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/80Jamming or countermeasure characterized by its function
    • H04K3/84Jamming or countermeasure characterized by its function related to preventing electromagnetic interference in petrol station, hospital, plane or cinema
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • H04K1/02Secret communication by adding a second signal to make the desired signal unintelligible
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K2203/00Jamming of communication; Countermeasures
    • H04K2203/10Jamming or countermeasure used for a particular application
    • H04K2203/12Jamming or countermeasure used for a particular application for acoustic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback

Description

この発明は、周囲で発生している音声を収音し、収音した音声に基づいて出力する音声を変化させる音声処理装置に関するものである。
従来、周囲で発生している音声を収音して加工し、収音した音声とミキシングしてスピーカから出力することにより、周囲で発生している音声とは異なる音声を聴取者に聞かせるものが提案されている(例えば、特許文献1参照)。これにより、周囲で発生している音声(例えば話者の音声)を聞き取り難くし、話者の音声をマスクすることが可能となる。
特開2009−118062号公報
しかし、スピーカから出力された音声が再び収音されると、収音された音声のある周波数成分が増幅されて出力される可能性もあり、ハウリングが発生するおそれがある。また、話者の音声とは異なる音声が収音されると、目的の話者の音声を適切にマスクするマスカ音を出力することができない場合がある。
そこで、本発明は、ハウリングを防止しつつ、適切なマスカ音を生成する音声処理装置を提供することを目的とする。
この発明の音声処理装置は、音声信号を入力する入力部と、入力した音声信号を解析する解析部と、汎用マスカ音を記憶する記憶部と、マスカ音生成部と、マスカ音生成部が生成した出力用マスカ音を出力する出力部と、を備えている。
汎用マスカ音とは、どの様な話者であってもある程度マスク効果が期待できるものである。例えば、男性および女性を含む複数人の音声を録音したものであり、語彙的には何ら意味をなさない(会話内容が理解できない)撹乱音が含まれている。聴取者は、このような撹乱音を話者の音声と同時に聞くことで、話者の発言内容を理解することが困難となる。ただし、本人の音声を加工して撹乱音として出力する場合に比べ、マスク効果は低くなる。
そこで、本発明のマスカ音生成部は、解析部の解析結果、および前記記憶部に記憶されている汎用マスカ音に基づいて、出力用マスカ音を生成する。例えば、解析部は、入力した音声信号に含まれている話者の音声特徴量(ピッチやフォルマント等)を抽出し、マスカ音生成部は、抽出した話者の音声特徴量に基づいて記憶部に記憶されている汎用マスカ音を加工して出力用マスカ音を生成する。具体的には、記憶部に記憶されている汎用マスカ音のピッチを入力音声信号のピッチに変換したり、汎用マスカ音のフォルマントを入力音声信号のフォルマントに変換(中心周波数を合わせる、帯域幅を合わせる、等)したりする。これにより、実際の話者の声質に近似した声質の撹乱音が出力されるため、汎用マスカ音よりもマスク効果が高くなり、話者の音声を適切にマスクすることができる。また、入力された話者の音声は、解析に用いられるだけであり、話者の音声が増幅等されて出力されることはなく、出力された音声が再び収音されて増幅されることがない(ループ系が形成されない)ため、ハウリングが発生するおそれはない。
さらに、入力した音声信号から出力用マスカ音を削減する削減部を備えると、出力された出力用マスカ音が再び収音された場合であっても、話者の音声だけを適切に解析することができる。
また、解析結果を所定時間保持する解析結果保持部を備え、マスカ音生成部は、解析部の解析結果と、解析結果保持部に保持されている解析結果を比較し、異なる解析結果が算出された場合に解析部の解析結果に基づく出力用マスカ音の生成を停止する態様としてもよい。
この場合、話者の音声とは異なる音声が突発的に入力された場合であっても、出力用マスカ音が大きく変化しない(誤った解析結果が出力用マスク音に反映されない)ため、マスキング効果を安定させることができる。
この発明によれば、ハウリングを防止しつつ、適切なマスカ音を生成することができる。
サウンドマスキングシステムの構成を示すブロック図である。 音声信号の周波数特性を示す図である。 変形例1に係る音声処理装置の構成を示すブロック図である。 変形例2に係る音声処理装置の構成を示すブロック図である。 撹乱音と背景音、演出音の対応付けテーブルを示した図である。
図1は、本発明の音声処理装置を備えたサウンドマスキングシステムの構成を示すブロック図である。サウンドマスキングシステムは、音声処理装置1、話者2、および聴取者3からなる。音声処理装置1は、話者2の音声を収音し、聴取者3に対して話者2の音声をマスクするマスカ音を放音する。
図1において、音声処理装置1は、マイク11、A/D変換部12、音声解析部13、マスカ音生成部14、データベース15、D/A変換部16、およびスピーカ17を備えている。
マイク11は、装置周囲で発生する音声(この例では主に話者2の発話音声)を収音する。収音された音声は、A/D変換部12でデジタル音声信号に変換され、音声解析部13に入力される。なお、A/D変換部12におけるサンプリングレートFsは、人の声の主成分が含まれる帯域(例えば10kHz以下)に対応する周波数(例えばFs=20kHz)とすれば十分である。
音声解析部13は、入力された音声信号を解析し、音声特徴量を抽出する。音声特徴量は、話者を識別するための指標となる物理パラメータであり、例えばフォルマントやピッチ等からなる。フォルマントは、音声の周波数スペクトル上の複数のピークを示したものであり、声質に影響を与える物理パラメータである。ピッチは、音高(基本周波数)を表す物理パラメータである。聴取者は、2つの音声を聴取したとき、これら2つの音声の声質や音高が近似していれば、これら2つの音声を区別することが困難となる。したがって、スピーカ17から話者2の音声に近似し、かつ異なる内容の音声(例えば語彙的に意味をなさないもの)を撹乱音としてマスカ音に含めて出力すれば、聴取者3は、話者2の発言内容を理解することが困難となり、高いマスク効果が期待できる。
そこで、音声解析部13は、まず入力音声信号からピッチを算出する。ピッチは、例えば時間軸上のゼロクロス点(振幅が0となる点)から算出する。また、音声解析部13は、入力音声信号の周波数解析(例えばFFT:高速フーリエ変換)を行い、周波数スペクトルを算出する。そして、音声解析部13は、周波数スペクトルから周波数ピークを検出する。周波数ピークは、周波数スペクトルのなかで、前後の周波数成分よりもレベルが高くなっている周波数成分であり、複数が検出される。ただし、図2(A)に示すように、人の声には非常に微細な周波数ピークが多数含まれるため、包絡成分の周波数ピークだけを抽出する。この周波数ピークがフォルマントとなる。各フォルマントを表すパラメータとしては、中心周波数やレベル、帯域幅(半値幅)等が抽出される。なお、音声特徴量としては、スペクトルの傾斜度等、他の物理パラメータを抽出してもよい。
音声解析部13は、以上のようにして抽出した音声特徴量をマスカ音生成部14に出力する。
マスカ音生成部14は、入力された音声特徴量、およびデータベース15に記憶されている音源(汎用マスカ音)に基づいて、出力用マスカ音を生成する。具体的には以下の処理を行う。
まず、マスカ音生成部14は、データベース15から汎用マスカ音の音声データを読み出す。汎用マスカ音とは、どの様な話者であってもある程度のマスク効果が期待できる汎用的なものである。例えば、男性および女性を含む複数人の音声を録音したものであり、語彙的には何ら意味をなさない(会話内容が理解できない)撹乱音が含まれる。なお、後述のように、汎用マスカ音には、撹乱音の他にも、聴取者の不快感を緩和させるための背景音(川のせせらぎ等)や演出音(鳥の鳴き声等)が含まれていてもよい。データベース15には、汎用マスカ音の音声データとして、撹乱音や背景音、演出音等の周波数軸上の音声信号(または時間軸上の音声信号でもよい。)が記憶されている。
マスカ音生成部14は、音声解析部13から入力された音声特徴量に基づいて、読み出した汎用マスカ音のうち、撹乱音に係る音声データを加工する。例えば、読み出した撹乱音のピッチを、入力音声信号のピッチに変換する。この場合、撹乱音の基本周波数成分を、入力音声信号の基本周波数成分に一致させるように周波数シフトする。
また、図2(B)に示すように、撹乱音の各フォルマント成分を、入力音声信号のフォルマント成分に一致させる。例えば同図(B)において、撹乱音の第1フォルマント、第2フォルマントおよび第3フォルマントは、入力音声信号の第1フォルマント、第2フォルマントおよび第3フォルマントよりもそれぞれ中心周波数が低いため、高域側にシフトする処理を行う。また、第2フォルマントについては、入力音声信号のレベルよりも高いレベルを有するため、レベルを下げる処理を行う。さらに、第3フォルマントについては、入力音声信号のレベルよりも低いレベルを有するため、レベルを上げる処理を行うとともに、入力音声信号のレベルよりも帯域幅が広いため、帯域幅を狭くする処理も行う。また、第4フォルマントについては低域側にシフトする処理を行うとともに、帯域幅を広くする処理も行う。なお、同図の例では第1フォルマント乃至第4フォルマントについて加工する処理を示したが、加工するフォルマントの次数はこの例に限るものではない。例えば、さらに高次のフォルマント成分を加工してもよい。
なお、音声特徴量にスペクトルの傾斜度等の他のパラメータが含まれる場合には、これらのパラメータに基づいてさらに撹乱音の音声データを加工する。
マスカ音生成部14は、以上のようにして撹乱音を加工することで出力用マスカ音を生成する。生成された出力用マスカ音は、D/A変換部16でアナログ音声信号に変換され、スピーカ17から放音され、聴取者3に聴取される。
このようにしてスピーカ17から放音されたマスカ音は、語彙的には何ら意味をなさないものであり、かつ声質や音高は話者2と近似した撹乱音が含まれているため、聴取者3は、話者2の音声とともに同じような声質や音高で意味の理解できない音声を聞くことになり、実際の話者2の発言内容を抽出して理解することが困難となる。
また、このような撹乱音は、声質や音高が話者2に近似しているため、低い音量であってもマスク効果が高く、聴取者3がマスカ音を聞くことによる不快感を低減することができる。さらに、上述のように、背景音(川のせせらぎ等)や演出音(鳥の鳴き声等)の音声データをデータベース15に記憶しておき、出力用マスカ音に含めて出力することにより、より不快感を低減するような態様も可能である。
さらに、上記のマスカ音は、入力音声信号に基づいて新たに生成された音声であるため、入力音声信号が増幅して出力されたものではなく、スピーカから放音された音声がマイクに入力され、再び放音されるようなループ系が形成されることはなく、ハウリングが発生するおそれはない。したがって、本実施形態に示すサウンドマスキングシステムでは、マイクやスピーカの配置関係を考慮する必要なく、どの様な設置環境においても安定したマスカ音を出力することができる。
また、音声解析部13において抽出されるフォルマント等の音声特徴量は、人の声に特有の物理パラメータであるため、人の声以外の音から抽出することはほとんどない。したがって、装置周囲で発生する環境音(例えばエアコンのノイズ等)によってマスカ音が変化するおそれは低く、安定して適切なマスカ音を生成することができる。
なお、上記実施形態においては、データベース15に1種類の撹乱音を記憶しておく例を示したが、フォルマントやピッチの異なる複数種類の撹乱音をデータベース15に記憶しておく態様も可能である。この場合、入力音声信号の音声特徴量に最も近い撹乱音を選択して読み出し、加工して(あるいは加工しないで)出力用マスカ音を生成することにより、演算量を抑えることもできる。
また、上記実施形態においては、撹乱音が常に出力される例として説明したが、撹乱音は常に出力される必要はない。例えば話者2が発話していない状態においては撹乱音を出力する必要がないため、音声解析部13において音声特徴量を抽出できなかったときは撹乱音の出力を停止してもよい。
また、マスカ音は、連続的に発生する音声と、断続的に発生する音声とを組み合わせてもよい。例えば、話者2が発話していない状態で、音声解析部13において音声特徴量を抽出できなかったときは、データベース15に記憶されている撹乱音をそのまま出力用マスカ音として出力し、話者2が発話し、音声解析部13において音声特徴量を抽出できたときには、撹乱音を加工した出力用マスカ音を出力する。これにより、聴取者3がマスカ音に慣れ、実際の話者2の音声を聞き分けてしまう状態(いわゆるカクテルパーティ効果)を防止することができる。
また、連続的に発生する音声として撹乱音と小川のせせらぎ等の背景音とを用い、断続的に発生する音声として鳥の鳴き声等の演出音を用いる態様であってもよい。例えば、撹乱音と背景音については連続的に出力し、演出音については所定のタイミングで断続的に出力する。このとき、背景音については、所定時間分の録音データ(実際の小川のせせらぎを録音したもの等)を繰り返し連続再生し、演出音については、同じく所定時間分の録音データ(実際の鳥の鳴き声を録音したもの等)をランダムあるいは一定時間毎(環境音の繰り返しタイミングに合わせる等)に再生する。この場合も、聴取者3に聞こえる音が常時同じ音にならないため、カクテルパーティ効果を防止することができる。さらに、連続的に発生する音声と断続的に発生する音声の組み合わせは、以下のような応用例も可能である。
図5は、撹乱音と背景音、演出音の対応付けテーブルを示した図である。このテーブルは、データベース15に記憶され、マスカ音生成部14が読み出すものである。同図の例では、フォルマントやピッチの異なる複数種類の撹乱音をデータベース15に記憶しておく態様として説明する。
同図(A)に示すように、対応付けテーブルには、データベース15に記憶されている各撹乱音と背景音、演出音の組み合わせが記載されている。例えば、撹乱音Aには、背景音A(例えば小川のせせらぎとする。)、演出音A(例えば鳥の鳴き声とする。)が対応づけられている。各撹乱音には、マスク効果が高い背景音や演出音が対応づけられていることが望ましい。
この場合、マスカ音生成部14は、入力音声信号の音声特徴量に最も近い撹乱音(例えば撹乱音A)を選択して読み出すとともに、さらにテーブルを参照して、対応づけられている背景音(例えば背景音A)と演出音(例えば演出音A)を選択して読み出す。これにより、入力音声信号に適した撹乱音と背景音が連続的に再生され、演出音が断続的に再生される。
さらに、同図(B)に示すように、各撹乱音に対応付けられる背景音や演出音は1つに限るものではない。例えば、同図(B)のように、撹乱音Aについては、背景音Aおよび演出音Aの組み合わせの他にも、背景音Aおよび演出音Bの組み合わせや、背景音Bおよび演出音Bの組み合わせが対応付けテーブルに記載されている。撹乱音Bについては、背景音Bおよび演出音Bの組み合わせの他にも、背景音Cおよび演出音Cの組み合わせが対応付けテーブルに記載されている。
この場合、音声処理装置1にユーザ操作用のインタフェースを設け、マスカ音生成部14は、ユーザによる手動選択を受け付け、受け付けた背景音と演出音の組み合わせを選択して読み出す態様とすればよい。また、時間帯、季節、場所等によって自動選択される態様であってもよい。例えば午前中は背景音Aおよび演出音A(川のせせらぎ+鳥の鳴き声)が選択される態様や、夏の午後は背景音Aおよび演出音B(川のせせらぎ+セミの鳴き声)が選択される態様、海に近い場所では背景音B(さざ波音等)が選択される態様、等である。この場合、音の変化がさらに多様化するため、より適切にカクテルパーティ効果を防止することができる。
また、同図(C)に示すように、各音の音量比についてもテーブルに記載されていてもよい。なお、同図に示す音量比の数値は、相対的な値を示したものであり、実際の音量値(dB)を表したものではない。
例えば、撹乱音Aについては、音量100に対し、背景音Aが音量50、演出音Aが音量10の音量比として記載されている。したがって、マスカ音生成部14は、背景音Aを撹乱音Aの半分程度の音量とし、演出音Aを撹乱音Aの1/10程度の音量としたマスカ音を出力する。また、同図(C)に示す撹乱音A、背景音B、演出音Bの組み合わせのように、演出音の音量を0とし、演出音を出力しない、という態様も可能である。このように、入力音声信号によって発生する背景音や演出音が変化する態様に加え、音量も変化させることができる。
また、上述のように、音声処理装置1にユーザ操作用のインタフェースを設ける場合、ユーザから組み合わせの内容や音量比の指定を受け付け、テーブルの記載内容を変更できるようにしてもよい。
さらに、本実施形態に示した音声処理装置は、以下のような変形例も可能である。
図3は、変形例1に係る音声処理装置の構成を示すブロック図である。なお、同図においては、図1に示した音声処理装置と同一の構成については、同一の符号を付し、その説明を省略する。
図3に示す変形例1に係る音声処理装置1は、図1に示した音声処理装置と同様の構成に加えて、削減部18を備えている。
削減部18は、いわゆるエコーキャンセラであり、マイク11から入力された音声信号(A/D変換後の信号)のエコー成分を削減する処理を行う。これにより、音声解析部13には、装置周囲で発生する音声(話者の音声)だけが入力されることになり、音声特徴量の抽出精度を向上することができる。
削減部18のエコーキャンセルの態様はどの様な態様であってもよいが、例えばスピーカ17からマイク11に至る音響伝達系の伝達特性を模擬した適応型フィルタを用いて出力用マスカ音をフィルタ処理し、マイク11から減算処理することでエコー成分を削減する。
ただし、本実施形態では、上述したように、入力音声信号がループしてマイクに入力される系が存在しないため、音声解析部13において、単に出力用マスカ音の成分を除去(無視)して音声特徴量を抽出すればよい。この場合、適応型フィルタは不要である。
図4は、変形例2に係る音声処理装置の構成を示すブロック図である。同図においても、図1に示した音声処理装置と同一の構成については、同一の符号を付し、その説明を省略する。
図4に示す音声処理装置1は、バッファ19を備えている。バッファ19は、音声解析部13からマスカ音生成部14に入力された音声特徴量を所定時間保持する解析結果保持部に相当する。
マスカ音生成部14は、音声解析部13から入力される最新の音声特徴量と、バッファ19に保持されている過去の音声特徴量とを比較し、異なる音声特徴量が算出された場合には、最新の音声特徴量に基づく出力用マスカ音の生成処理を停止し、バッファ19に保持されている過去の音声特徴量に基づいて出力用マスカ音を生成する。この場合、突発的に話者2以外の発話音声が入力された場合であっても、出力用マスカ音が大きく変化しない(誤った音声特徴量が出力用マスク音に反映されない)ため、マスキング効果を安定させることができる。
なお、実際の話者が変わって異なる音声特徴量が抽出された場合、所定時間が経過した後も新たな話者の音声特徴量が抽出されるため、バッファ19に保持される音声特徴量が新たな話者の音声特徴量に更新され、再び音声解析部13から入力される最新の音声特徴量と、バッファ19に保持されている過去の音声特徴量と、が一致することになる。そのため、所定時間経過後は、適切なマスカ音を生成することができる。
1…音声処理装置
2…話者
3…聴取者
11…マイク
12…A/D変換部
13…音声解析部
14…マスカ音生成部
15…データベース
17…スピーカ

Claims (4)

  1. 音声信号を入力する入力部と、
    入力した音声信号を解析する解析部と、
    汎用マスカ音を記憶する記憶部と、
    前記解析部の解析結果、および前記記憶部に記憶されている汎用マスカ音に基づいて、出力用マスカ音を生成するマスカ音生成部と、
    前記出力用マスカ音を出力する出力部と、
    前記解析結果を所定時間保持する解析結果保持部と、を備え
    前記マスカ音生成部は、前記解析部の解析結果と、前記解析結果保持部に保持されている解析結果を比較し、異なる解析結果が算出された場合に、前記解析部の解析結果に基づく前記出力用マスカ音の生成を停止する音声処理装置。
  2. 前記解析部は、前記入力した音声信号の音声特徴量を抽出し、
    前記マスカ音生成部は、前記音声特徴量に基づいて前記記憶部に記憶されている汎用マスカ音を加工して前記出力用マスカ音を生成する請求項1に記載の音声処理装置。
  3. 前記入力した音声信号から前記出力用マスカ音を削減する削減部を備えた請求項1または請求項2に記載の音声処理装置。
  4. 前記出力用マスカ音は、連続的に発生する音声と断続的に発生する音声との組み合わせからなる請求項1乃至請求項のいずれかに記載の音声処理装置。
JP2010236019A 2010-10-21 2010-10-21 音声処理装置 Expired - Fee Related JP5644359B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010236019A JP5644359B2 (ja) 2010-10-21 2010-10-21 音声処理装置
CN2011800448169A CN103189912A (zh) 2010-10-21 2011-10-21 声音处理设备和声音处理方法
PCT/JP2011/074255 WO2012053629A1 (ja) 2010-10-21 2011-10-21 音声処理装置及び音声処理方法
US13/822,490 US9117436B2 (en) 2010-10-21 2011-10-21 Sound processing apparatus and sound processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010236019A JP5644359B2 (ja) 2010-10-21 2010-10-21 音声処理装置

Publications (2)

Publication Number Publication Date
JP2012088577A JP2012088577A (ja) 2012-05-10
JP5644359B2 true JP5644359B2 (ja) 2014-12-24

Family

ID=45975337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010236019A Expired - Fee Related JP5644359B2 (ja) 2010-10-21 2010-10-21 音声処理装置

Country Status (4)

Country Link
US (1) US9117436B2 (ja)
JP (1) JP5644359B2 (ja)
CN (1) CN103189912A (ja)
WO (1) WO2012053629A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130251A (ja) * 2012-12-28 2014-07-10 Glory Ltd 会話保護システム及び会話保護方法
JP6197367B2 (ja) * 2013-05-23 2017-09-20 富士通株式会社 通話装置及びマスキング音生成プログラム
CN103617797A (zh) * 2013-12-09 2014-03-05 腾讯科技(深圳)有限公司 一种语音处理方法,及装置
CN104575486B (zh) * 2014-12-25 2019-04-02 中国科学院信息工程研究所 基于声掩蔽原理的声泄漏防护方法及系统
EP3048608A1 (en) * 2015-01-20 2016-07-27 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Speech reproduction device configured for masking reproduced speech in a masked speech zone
JP2016177204A (ja) * 2015-03-20 2016-10-06 ヤマハ株式会社 サウンドマスキング装置
JP6033927B1 (ja) * 2015-06-24 2016-11-30 ヤマハ株式会社 情報提供システムおよび情報提供方法
US10277581B2 (en) * 2015-09-08 2019-04-30 Oath, Inc. Audio verification
CN106558303A (zh) * 2015-09-29 2017-04-05 苏州天声学科技有限公司 阵列式声音掩蔽器及声音掩蔽方法
JP6160794B1 (ja) * 2015-10-15 2017-07-12 ヤマハ株式会社 情報管理システムおよび情報管理方法
US10354638B2 (en) 2016-03-01 2019-07-16 Guardian Glass, LLC Acoustic wall assembly having active noise-disruptive properties, and/or method of making and/or using the same
WO2017201269A1 (en) 2016-05-20 2017-11-23 Cambridge Sound Management, Inc. Self-powered loudspeaker for sound masking
JP6837214B2 (ja) * 2016-12-09 2021-03-03 パナソニックIpマネジメント株式会社 騒音マスキング装置、車両、及び、騒音マスキング方法
US10726855B2 (en) * 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
US10304473B2 (en) 2017-03-15 2019-05-28 Guardian Glass, LLC Speech privacy system and/or associated method
US10373626B2 (en) 2017-03-15 2019-08-06 Guardian Glass, LLC Speech privacy system and/or associated method
CN110998711A (zh) * 2017-08-16 2020-04-10 谷歌有限责任公司 动态音频数据传输掩蔽
CN108922516B (zh) * 2018-06-29 2020-11-06 北京语言大学 检测调域值的方法和装置
JP2021068490A (ja) * 2019-10-25 2021-04-30 東京瓦斯株式会社 音声再生システムおよびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050254663A1 (en) * 1999-11-16 2005-11-17 Andreas Raptopoulos Electronic sound screening system and method of accoustically impoving the environment
GB9927131D0 (en) 1999-11-16 2000-01-12 Royal College Of Art Apparatus for acoustically improving an environment and related method
GB0023207D0 (en) * 2000-09-21 2000-11-01 Royal College Of Art Apparatus for acoustically improving an environment
US7363227B2 (en) * 2005-01-10 2008-04-22 Herman Miller, Inc. Disruption of speech understanding by adding a privacy sound thereto
JP5103973B2 (ja) * 2007-03-22 2012-12-19 ヤマハ株式会社 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
JP2009118062A (ja) 2007-11-05 2009-05-28 Pioneer Electronic Corp 音発生装置

Also Published As

Publication number Publication date
WO2012053629A1 (ja) 2012-04-26
CN103189912A (zh) 2013-07-03
US20130182866A1 (en) 2013-07-18
US9117436B2 (en) 2015-08-25
JP2012088577A (ja) 2012-05-10

Similar Documents

Publication Publication Date Title
JP5644359B2 (ja) 音声処理装置
CA2382175C (en) Noisy acoustic signal enhancement
JP5929786B2 (ja) 信号処理装置、信号処理方法及び記憶媒体
KR100643310B1 (ko) 음성 데이터의 포먼트와 유사한 교란 신호를 출력하여송화자 음성을 차폐하는 방법 및 장치
EP1667416A2 (en) Reverberation estimation and suppression system
JP5849411B2 (ja) マスカ音出力装置
JP2014174255A5 (ja)
US10510361B2 (en) Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user
CN110956976A (zh) 一种回声消除方法、装置、设备及可读存储介质
CN113035167A (zh) 一种主动降噪的音频调教方法及存储介质
JP5673256B2 (ja) マスカ音測定装置、およびサウンドマスキング装置
US20210211812A1 (en) Personal hearing device, external sound processing device, and related computer program product
JP2006333396A (ja) 音声信号拡声装置
JP2007187748A (ja) 音選択加工装置
JP5747490B2 (ja) マスカ音生成装置、マスカ音出力装置、およびマスカ音生成プログラム
JP4527654B2 (ja) 音声通信装置
TWI738409B (zh) 指向助聽裝置及其方法
CN102341853B (zh) 用于分离信号路径的方法及用于改善电子喉语音的应用
CN115580678A (zh) 一种数据处理方法、装置和设备
EP4258689A1 (en) A hearing aid comprising an adaptive notification unit
JP2011040831A (ja) デジタルノイズキャンセルヘッドホン及びデジタルノイズキャンセル方法
JP2022030448A (ja) マスカ音調整方法およびマスカ音調整装置
JP2023130254A (ja) 音声処理装置および音声処理方法
JPH0954592A (ja) アクティブノイズイレーサ
CN117475976A (zh) 音频处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141020

R150 Certificate of patent or registration of utility model

Ref document number: 5644359

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees