JP6652978B2 - 状況認識を備えたスポーツヘッドフォン - Google Patents

状況認識を備えたスポーツヘッドフォン Download PDF

Info

Publication number
JP6652978B2
JP6652978B2 JP2017559517A JP2017559517A JP6652978B2 JP 6652978 B2 JP6652978 B2 JP 6652978B2 JP 2017559517 A JP2017559517 A JP 2017559517A JP 2017559517 A JP2017559517 A JP 2017559517A JP 6652978 B2 JP6652978 B2 JP 6652978B2
Authority
JP
Japan
Prior art keywords
audio signals
audio
signal
amplitude
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017559517A
Other languages
English (en)
Other versions
JP2018518893A (ja
Inventor
ジェイムズ エム. キルシュ,
ジェイムズ エム. キルシュ,
ジェフリー ハッチングズ,
ジェフリー ハッチングズ,
Original Assignee
ハーマン インターナショナル インダストリーズ インコーポレイテッド
ハーマン インターナショナル インダストリーズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ハーマン インターナショナル インダストリーズ インコーポレイテッド, ハーマン インターナショナル インダストリーズ インコーポレイテッド filed Critical ハーマン インターナショナル インダストリーズ インコーポレイテッド
Publication of JP2018518893A publication Critical patent/JP2018518893A/ja
Application granted granted Critical
Publication of JP6652978B2 publication Critical patent/JP6652978B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Headphones And Earphones (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本開示の実施形態は、概して音声信号処理に関し、より詳細には、状況認識を備えたスポーツヘッドフォンに関する。
ヘッドフォン、イヤフォン、イヤバッド、及び他の個人用聴取デバイスは、通常、周辺にいる他の人々の邪魔をすることなく、音楽、スピーチ、または映画のサウンドトラックなどの音源を聞きたいと望む個人によって使用される。良質な音声を提供するために、このようなデバイスは、典型的には、耳全体を覆うか、または外耳道を完全に密封する。典型的には、これらのデバイスは、音声再生デバイスの音声出力への差し込み用音声プラグを含む。音声プラグは、音声再生デバイスから、聴取者の耳を覆うかまたは耳に挿入される一対のヘッドフォンまたはイヤフォンへ音声信号を搬送するケーブルに接続している。その結果、ヘッドフォンまたはイヤフォンは、良好な音響密封をもたらし、それによって、音声信号の漏出を減少させ、特に低音のレスポンスに関して、聴取者の体感品質を向上させる。
上記デバイスでの1つの問題は、デバイスが耳と良好な音響密封を形成するために、聴取者の環境音を聞く能力が実質的に低下することである。その結果、聴取者は、近付いてくる車両、インターホンシステムによる告知、または警報などの、環境からのある一定の重要な音を聞くことができない場合がある。一例では、ペースライン内を走っている自転車乗用者が音楽を聴いているが、前方及び後方を走るペースライン内の他の自転車乗用者の声もやはり聞きたい場合がある。別の例では、食事する客が、その客のテーブルが準備できたというアナウンスを待っている間、音楽を聴いている場合がある。
上記問題の1つの解決策は、環境からの音声を、再生デバイスから受信される音声信号と音響的または電子的に混合することである。このとき、聴取者は、再生デバイスからの音声と環境からの音声の両方を聞くことができる。しかしながら、このような解決策の1つの欠点は、聴取者には、典型的に、聴取者が聞きたい特定の環境音だけでなく、環境からの全ての音声が聞こえるということである。その結果、聴取者の体感品質が、実質的に低下し得る。
前述の例示のように、再生音声及び環境音の両方を個人用聴取デバイスに提供するためのより効果的な技術が、有用であろう。
1つまたは複数の実施形態は、マイクロフォンのセット、ノイズリダクションモジュール、音声ダッカー、及びミキサを含む個人用聴取デバイスのための音声処理システムを説明する。マイクロフォンのセットは、個人用聴取デバイスに統合され、環境から音声信号の第1のセットを受信するように構成される。ノイズリダクションモジュールは、第1の複数のマイクロフォンに連結され、着目信号が第1の複数の音声信号内に存在する場合に検出し、着目信号を検出後、ダッキング制御信号を送信するように構成される。音声ダッカーは、ノイズリダクションモジュールに連結され、ダッキング制御信号を受信し、再生デバイスを介して第2の複数の音声信号を受信するように構成される。音声ダッカーは、ダッキング制御信号に基づいて、着目信号と比較して第2の複数の音声信号の振幅を減少させるようにさらに構成される。ミキサは、音声ダッカーに連結され、第1の複数の音声信号と第2の複数の音声信号を結合するように構成される。
他の実施形態は、開示される技術の1つまたは複数の態様を実行するための命令を含むコンピュータ可読媒体、及び開示される技術の1つまたは複数の態様を実行するための方法を、限定ではなく含む。
開示される手法の少なくとも1つの利点は、開示される個人用聴取デバイスを使用する聴取者が、再生デバイスからの高品質な音声信号に加えて、環境からのある一定の着目音声の音を聞き、同時に、環境からの他の音が、着目する音と比較して抑制されるということである。結果として、聴取者が所望の音声信号だけを聞くための潜在力が向上し、聴取者にとってより良好な品質のオーディオ体験をもたらす。
本明細書は、例えば、以下の項目も提供する。
(項目1)
個人用聴取デバイスのための音声処理システムであって、
前記個人用聴取デバイスに統合され、環境から第1の複数の音声信号を受信するように構成される第1の複数のマイクロフォンと、
前記第1の複数のマイクロフォンに連結され、
着目信号が前記第1の複数の音声信号内に存在する場合に検出し、
着目信号を検出後、ダッキング制御信号を送信するように構成されるノイズリダクションモジュールと、
前記ノイズリダクションモジュールに連結され、
前記ダッキング制御信号を受信し、
再生デバイスを介して第2の複数の音声信号を受信し、
前記ダッキング制御信号に基づいて、前記着目信号と比較して第2の複数の音声信号の振幅を減少させるように構成される音声ダッカーと、
前記音声ダッカーに連結され、前記第1の複数の音声信号と第2の複数の音声信号とを結合するように構成されるミキサと、
を備える、前記音声処理システム。
(項目2)
前記ノイズリダクションモジュールが、
第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分がノイズ信号を含むことを判断し、
前記第1の複数の音声信号の前記第1の部分の前記振幅を減少させるようにさらに構成される、項目1に記載の音声処理システム。
(項目3)
前記ノイズリダクションモジュールが、
第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分が着目信号を含むことを判断し、
前記第1の複数の音声信号の前記第1の部分を増幅させるようにさらに構成される、項目1に記載の音声処理システム。
(項目4)
前記個人用聴取デバイスの物理特性から生じる音響変化を補償するために、前記第1の複数の音声信号に対して周波数に基づく振幅調整を行うように構成される、イコライザをさらに備える、項目1に記載の音声処理システム。
(項目5)
前記第1の複数の音声信号の第1の部分が、閾値振幅より小さいことを判断し、
前記第1の複数の音声信号の前記第1の部分の振幅を減少させるように構成される、ゲートをさらに備える、項目1に記載の音声処理システム。
(項目6)
前記第1の複数の音声信号の第1の部分が、最大許容振幅より大きいことを判断し、
前記第1の複数の音声信号の前記第1の部分の振幅を、前記最大許容振幅以下であるように制限するように構成される、リミッタをさらに備える、項目1に記載の音声処理システム。
(項目7)
前記第2の複数の音声信号の少なくとも一部に対応する1つまたは複数の低調波信号を合成して第3の複数の音声信号を生成し、
前記第2の音声信号を前記第3の複数の音声信号と結合するように構成される、低調波プロセッサをさらに備える、項目1に記載の音声処理システム。
(項目8)
前記第2の複数の音声信号に対応する目標音声レベルを計算し、
前記第2の複数の音声信号の少なくとも一部が、前記目標音声レベルとは異なること判断し、
前記第2の複数の音声信号がスケール係数により乗算されるとき、結果として得られる音声信号が前記目標音声レベルに近いように、前記スケール係数を計算し、
前記第2の複数の音声信号を前記スケール係数により乗算するように構成される、自動利得コントローラをさらに備える、項目1に記載の音声処理システム。
(項目9)
前記着目信号が、前記第1の複数の音声信号に関連する平均音声信号レベルと比較して高い音声レベルを有する断続的音声の音を含む、項目1に記載の音声処理システム。
(項目10)
前記第3の複数の音声信号を増幅させ、
前記第3の複数の音声信号をスピーカに送信して音出力を生成するように構成される、増幅器をさらに備える、項目9に記載の音声処理システム。
(項目11)
再生及び環境の音声信号を処理するための方法であって、
第1の複数の音声信号を環境から受信することと、
着目信号が前記第1の複数の音声信号内に存在する場合に検出することであって、前記着目信号が、前記第1の複数の音声信号に関連する平均音声信号レベルと比較して高い音声レベルを有する断続的音声の音を含む、前記検出することと、
着目信号を検出後、ダッキング制御信号を送信することと、
前記ダッキング制御信号を受信することと、
再生デバイスを介して第2の複数の音声信号を受信することと、
前記ダッキング制御信号に基づいて、前記着目信号と比較して第2の複数の音声信号の振幅を減少させることと、
前記第1の複数の音声信号と第2の複数の音声信号とを結合することと、
を含む、前記方法。
(項目12)
前記第1の複数の音声信号が発生している方向を識別することと、
前記方向に基づいて前記第1の複数の音声信号を減衰させることと、
をさらに含む、項目11に記載の方法。
(項目13)
前記第1の複数の音声信号を減衰させることが、
ビームフォーミングモードの選択を受信することと、
前記ビームフォーミングモード及び前記方向に基づいてスケール係数を計算することと、
前記スケール係数を前記第1の複数の音声信号に適用することと、
を含む、項目12に記載の方法。
(項目14)
前記ビームフォーミングモードが、全方向性モード、ダイポールモード、またはカージオイドモードを含む、項目13に記載の方法。
(項目15)
第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分がノイズ信号を含むことを判断することと、
前記第1の複数の音声信号の前記第1の部分の前記振幅を減少させることと、
をさらに含む、項目11に記載の方法。
(項目16)
第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分が着目信号を含むことを判断することと、
前記第1の複数の音声信号の前記第1の部分を増幅させることと、
をさらに含む、項目11に記載の方法。
(項目17)
第1の複数の音声信号を環境から受信するステップと、
着目信号が前記第1の複数の音声信号内に存在する場合に検出するステップであって、前記着目信号が、前記第1の複数の音声信号に関連する平均音声信号レベルと比較して高い音声レベルを有する断続的音声の音を含む、前記検出するステップと、
着目信号を検出後、ダッキング制御信号を送信するステップと、
前記ダッキング制御信号を受信するステップと、
再生デバイスを介して第2の複数の音声信号を受信するステップと、
前記ダッキング制御信号に基づいて、前記着目信号と比較して第2の複数の音声信号の振幅を減少させるステップと、
前記第1の複数の音声信号と第2の複数の音声信号とを結合するステップと
を実行することによって、プロセッサによる実行時に再生及び環境の音声信号を前記プロセッサに処理させる命令を含む、コンピュータ可読記憶モジュール。
(項目18)
プロセッサによる実行時に、
前記第1の複数の音声信号が発生している方向を識別するステップと、
前記方向に基づいて前記第1の複数の音声信号を減衰させるステップと、
を前記プロセッサに実行させる命令をさらに含む、項目17に記載のコンピュータ可読記憶媒体。
(項目19)
前記第1の複数の音声信号を減衰させることが、
ビームフォーミングモードの選択を受信することと、
前記ビームフォーミングモード及び前記方向に基づいてスケール係数を計算することと、
前記スケール係数を前記第1の複数の音声信号に適用することと、
を含む、項目18に記載のコンピュータ可読記憶媒体。
(項目20)
前記ビームフォーミングモードが、全方向性モード、ダイポールモード、またはカージオイドモードを含む、項目19に記載のコンピュータ可読記憶媒体。
上述の1つまたは複数の実施形態の列挙された特徴が詳細に理解され得るように、上記で簡潔に要約された1つまたは複数の実施形態のより詳細な説明が、ある特定の実施形態への参照によって行われてもよく、そのうちのいくつかが、添付図面に示されている。しかしながら、添付図面は、典型的な実施形態のみを示しており、したがって、いかなるやり方でもその範囲を限定するものと考えられるべきでなく、開示の範囲は、他の実施形態も同様に包含することに留意されたい。
様々な実施形態の1つまたは複数の態様を実施するように構成される音声処理システムを示す。 様々な実施形態による、図1の音声処理システムの1つの適用を概念的に示す。 様々な他の実施形態による、図1の音声処理システムの別の適用を概念的に示す。 様々な実施形態による、再生及び環境の音声信号を処理するための方法ステップのフロー図である。 様々な実施形態による、再生及び環境の音声信号を処理するための方法ステップのフロー図である。
以下の説明において、ある特定の実施形態のより完全な理解を提供するために、多くの特定の詳細が記述されている。しかしながら、これらの特定の詳細の1つもしくは複数なしに、または追加的な特定の詳細とともに、他の実施形態が実施され得ることは当業者には明らかであろう。
システム概要
図1は、様々な実施形態の1つまたは複数の態様を実施するように構成される音声処理システム100を示す。図示するように、音声処理システム100は、マイクロフォン(マイク)アレイ105(0)及び105(1)、ビームフォーマ110(0)及び110(1)、ノイズリダクション115、イコライザ120、ゲート125、リミッタ130、ミキサ135(0)及び135(1)、増幅器(アンプ)140(0)及び140(1)、スピーカ145(0)及び145(1)、低調波処理155、自動利得制御(AGC)160、ならびにダッカー165を、限定ではなく含む。
様々な実施形態では、音声処理システム100は、状態機械、中央処理装置(CPU)、デジタル信号プロセッサ(DSP)、マイクロコントローラ、特定用途向け集積回路(ASIC)、またはデータを処理しソフトウェアアプリケーションを実行するように構成される任意のデバイスもしくは構造として実施されてもよい。いくつかの実施形態では、図1に示されるブロックの1つまたは複数は、分離したアナログまたはデジタル回路で実施されてもよい。一例では、限定ではなく、左増幅器140(0)及び右増幅器140(1)は、演算増幅器で実施され得る。
マイクロフォンアレイ105(0)及び105(1)は、物理的環境から音声を受信する。マイクロフォンアレイ105(0)は、聴取者の左耳の周辺の物理的環境から音声を受信する。これに対応して、マイクロフォンアレイ105(1)は、聴取者の右耳の周辺の物理的環境から音声を受信する。マイクロフォンアレイ105(0)及び105(1)のそれぞれが、複数のマイクロフォンを含む。マイクロフォンアレイ105(0)及び105(1)は、それぞれ2つのマイクロフォンを含むものとして示されているが、本開示の範囲内において、それぞれ2つよりも多くのマイクロフォンを含んでもよい。マイクロフォンアレイ105(0)及び105(1)は、複数のマイクロフォンを含むため、ビームフォーマ110(0)及び110(1)は、本明細書でさらに説明されるように、方向性の方式で環境音声を空間的にフィルタリングすることが可能である。マイクロフォンアレイ105(0)及び105(1)は、受信した音声をビームフォーマ110(0)及び110(1)にそれぞれ送信する。
ビームフォーマ110(0)及び110(1)は、マイクロフォンアレイ105(0)及び105(1)から音声信号をそれぞれ受信する。ビームフォーマ110(0)及び110(1)は、受信した音声信号をいくつかのモードのうちの1つに従って処理する。モードは、全方向性モード、ダイポールモード、及びカージオイドモードを、限定ではなく含む。様々な実施形態では、モードは、製造業者によって事前にプログラムされてもよく、またはユーザが選択可能な設定であってもよい。ビームフォーマ110(0)及び110(1)は、対応するマイクロフォンアレイ105(0)及び105(1)内の各マイクロフォンから受信した音声の強度を測定し、到来音声の方向を判断する。いくつかの実施形態では、マイクロフォンアレイ105(0)及び105(1)内のマイクロフォンのうちの1つから受信した信号は、デジタル的に遅延され、次いで、マイクロフォンアレイ105(0)及び105(1)内のマイクロフォンのうちの別の1つからの信号から減算される。
選択されたモードに応じて、ビームフォーマ110(0)及び110(1)は、ある方向から発生する信号を増幅させ、他の方向から発生する信号を減衰させる。例えば、限定ではなく、選択されたモードが全方向性モードである場合、ビームフォーマ110(0)及び110(1)は、全ての方向から発生する信号を均等に増幅させることになる。選択されたモードが、本明細書で「8の字」モードとも呼ばれるダイポールモードである場合、ビームフォーマ110(0)及び110(1)は、2方向、典型的には前後方向から発生する音声信号を増幅させ、他の方向、典型的には左右方向から発生する音声信号を減衰させ得る。選択されたモードが、カージオイドモードである場合、ビームフォーマ110(0)及び110(1)は、横方向及び上方からなどの、ほとんどの方向から発生する音声信号を増幅させ、聴取者の下方など、特定の方向から発生する音声信号を減衰させ得る。代替的には、選択されたモードが、カージオイドモードである場合、ビームフォーマ110(0)及び110(1)は、聴取者の前方から発生する音声信号を増幅させ、聴取者の後方から発生する音声信号を減衰させ得る。ビームフォーマ110(0)及び110(1)が、マイクロフォンアレイ105(0)及び105(1)それぞれから受信した信号を、選択されたモードに従って増幅及び減衰させた後、ビームフォーマ110(0)及び110(1)は、結果として得られる音声信号をノイズリダクション115に送信する。
ノイズリダクション115は、ビームフォーマ110(0)及び110(1)から音声信号を受信するモジュールである。ノイズリダクション115は、受信した音声信号を分析し、定常状態またはノイズ信号などのあまり着目しないと判断される信号を抑制し、過渡信号などの着目信号であると判断される信号を通過させる。いくつかの実施形態では、ノイズリダクション115は、ある期間にわたる周波数領域において、受信した信号を分析してもよい。このような実施形態では、ノイズリダクション115は、受信した信号を周波数領域に変換し、周波数領域を適切なビンに分割してもよく、各ビンは、特定の周波数範囲に対応する。ノイズリダクション115は、どの周波数ビンが定常状態信号に対応し、どの周波数ビンが過渡信号に対応するかを判断するために、時間経過とともに複数のサンプルにわたって振幅を測定してもよい。概して、定常状態信号は、交通騒音、ハム音、ヒス音、雨、及び風を限定ではなく含む背景ノイズに対応してもよい。特定の周波数ビンが、時間が経過しても比較的一定のままである振幅に関連付けられる場合、ノイズリダクション115は、その周波数ビンが定常状態信号に関連付けられると判断してもよい。ノイズリダクション115は、そのような定常状態信号を減衰させてもよい。
一方、過渡信号は、人のスピーチ、自動車の警笛、及びサイレンを限定ではなく含む、着目信号に対応してもよい。特定の周波数ビンが、時間経過とともに著しく変動する振幅に関連付けられる場合、ノイズリダクション115は、その周波数ビンが過渡信号に関連付けられると判断してもよい。ノイズリダクション115は、そのような過度信号をイコライザ120に渡し、任意選択で、過渡信号を増幅させてもよい。
一例では、限定ではなく、ノイズリダクション115が、256の周波数領域サンプルを分析してもよく、その場合に、周波数領域サンプルは、1秒の期間にわたって均等に分散されることになる。ノイズリダクション115は、どの周波数ビンが定常状態信号に関連付けられ、どのビンが過渡信号に関連付けられるかを判断するために、各周波数ビンに関する256のサンプルを分析することになる。ノイズリダクションは、別の256の周波数領域サンプルを分析してもよい。256の周波数領域サンプルの各セットが、256の周波数領域サンプルの先行のセット及び256の周波数領域サンプルの後続のセットと指定された重複を有してもよい。重複が50%であるように指定される場合、256の周波数領域サンプルの各セットは、サンプルの直前のセットの最後の128サンプル及びサンプルの直後のセットの最初の128サンプルを含むことになる。いくつかの実施形態では、ノイズリダクション115は、最初に周波数領域に変換せず、時間領域で動作を実行してもよい。そのような実施形態では、ノイズリダクション115は、本明細書で説明される周波数ビンに対応する、複数の並列なバンドパスフィルタ(明示せず)を含んでもよい。
さらに、ノイズリダクション115は、ノイズリダクション115が聴取者の環境内の着目信号を検出する場合に識別する制御信号を生じさせる。概して、着目信号は、低レベルの定常状態音ではない、環境からの任意の音を含み、人のスピーチ、自動車の警笛、近付いてくる車両の音、及び警報を限定ではなく含む。環境から発出するこの種の重要な音は、典型的には、平均的な背景音声レベルと比較して高い音声レベルを有する、断続的な音声信号として特徴付けられ、割り込みの役割をする。別の言い方をすると、着目信号は、マイクロフォンアレイ150(0)及び150(1)によって受信される平均音声信号レベルと比較して高い音声レベルを有する任意の断続的音声の音を含む。ノイズリダクション115がそのような信号を検出する場合、ノイズリダクション115は、本明細書でさらに説明されるように、対応する信号をダッカー165に送信する。様々な実施形態では、ノイズリダクション115は、スペクトル減算、ならびにスピーチ検出、認識、及び抽出を限定ではなく含む、他の手法によって受信した信号内のノイズを減少させてもよい。
いくつかの実施形態では、ノイズリダクション115は、また、能動型ノイズ消去(ANC)機能性(明示せず)も含んでもよい。そのような実施形態では、ノイズリダクション115は、200Hzなどの閾値周波数以下の周波数に関連付けられる周波数ビンに関してANC機能を実行してもよい。ノイズリダクション115は、200Hzなどの閾値周波数を超える周波数に関連付けられる周波数ビンに関して、本明細書で説明されるようにノイズリダクション機能を実行してもよい。
ノイズリダクションを実行し、任意選択でANCを実行した後、ノイズリダクション115は、結果として得られる音声信号をイコライザ120に送信する。
イコライザ120は、ノイズリダクション115から音声信号を受信する。イコライザ120は、聴取者の環境から受信される音声信号についての音声品質を向上させるために、受信した音声信号に対して周波数に基づく振幅調整を行う。音声処理システム100のマイクロフォンアレイ110(0)及び110(1)を介して聴取者の耳に達する環境スタジオ信号は、典型的には、音声処理システム100が使用されないときに聴取者の耳に達する同一音声の音と比較して、聴取者には異なって聞こえる。このような音響の違いは、耳をヘッドフォンで覆うこと、または外耳道にイヤフォンを差し込むことに起因して発生する音響の変化から生じる。イコライザ120は、可聴範囲内の様々な周波数帯の音量レベルを選択的に増加、減少、または維持することによって、そのような違いを補償する。
いくつかの実施形態では、このような増幅が音声信号をあまり自然に聞こえないようにするとしても、イコライザ120は、そのような音声信号をユーザに対してより顕著にするために、ある周波数帯の音声信号を増幅してもよい。このようにして、聴取者がこれらのある一定の音声信号を容易に聞き得るように、イコライザ120は、スピーチまたは警報などの一定の音声信号を増幅してもよい。例えば、限定ではなく、イコライザ120は、人のスピーチに対応する周波数帯で発生する信号を増幅し得る。その結果、得られる音声信号が聴取者にはあまり自然に聞こえないとしても、聴取者は、環境を介して人のスピーチを容易に聞き取ることになる。いくつかの実施形態では、イコライザ120は、聴取者の着目しないある周波数範囲内の信号をフィルタリングで除去してもよい。一例では、限定ではなく、イコライザ120は、120Hzより低い周波数を有する信号をフィルタリングで除去してもよく、そのような信号が、背景ノイズに関連付けられてもよい。イコライザ120は、イコライズされた音声信号をゲート125に送信する。
ゲート125は、イコライザ120から音声信号を受信し、閾値音量、即ち振幅、レベルよりも下に下がる音声信号を抑制する。閾値音量、即ち振幅、レベルを超える音声信号が、ゲート125を通ってリミッタ130に渡る。その結果、ゲート125は、ヒス音及びハム音などの低レベルの音声信号をさらに抑制する。いくつかの実施形態では、閾値レベルは、関連のある周波数帯にわたって一定であってもよい。他の実施形態では、閾値レベルは、関連のある周波数帯にわたって変動してもよい。これらの後者の実施形態では、ゲート閾値レベルは、ある周波数帯においてより高く、他の周波数帯ではより低くてもよい。言い換えると、ゲート125によって実行されるゲーティング機能は、音声信号周波数の関数である。ゲート125は、結果として得られる音声信号をリミッタ130に送信する。
リミッタ130は、音の大きな信号が聴取者の耳に達する前にそのような大きな音を素早く検出し、最大許容音声レベルを超えないようにそのような大きな信号を制限する。このように、リミッタ130は、聴取者を保護するために音の大きな信号を減衰させる。一例では、限定ではなく、リミッタ130は、95dB SPLの最大許容音声レベルを有し得る。このような場合、リミッタ130が、95dB SPLを超える音声信号を受信すると、リミッタ130は、結果として得られる音声信号が95dB SPLを越えないように、音声信号を減衰させることになる。いくつかの実施形態では、リミッタ130は、また、最大許容音声レベルを超える全ての音声信号を突然抑えるのではなく、音量が増加するにつれて徐々に音声レベル制限が発生するように、圧縮機能を実行してもよい。概して、大きな音量変動が減少するため、このようなダイナミックレンジ処理が、より快適な聴取体験をもたらす。リミッタは、結果として得られる音声信号をミキサ135(0)及び135(1)に送信する。
低調波処理155は、音声フィード150から、再生デバイス(明示せず)からの音声信号を受信する。低調波処理155は、有線接続、Bluetooth(登録商標)またはBluetoothLE接続、及び無線イーサネット(登録商標)接続を限定ではなく含む、任意の技術的に実行可能な技術によって、これらの音声信号を受信する。低調波処理155は、受信した音声信号の低調波信号である音声信号を合成し、ブーストする。このような低調波合成は、受信した音声信号を、合成された低調波信号と混合または結合して、そのような処理がされていない音声信号と比較して高い低音レベルを有する、結果としての音声信号を生成する。一定の聴取者が、低調波処理155を好む場合がある一方、他の聴取者は、このような処理を好まない場合がある。さらに、他の聴取者が、あるジャンルについては低調波処理155を好むが、他のジャンルについてはこのような処理を好まないこともある。いくつかの実施形態では、聴取者は、低調波処理155が使用可能かどうかを制御してもよく、低調波処理155によって行われる低調波ブーストのレベルも制御してもよい。低調波処理155は、結果として得られる音声信号を自動利得制御160に送信する。
自動利得制御160は、低調波処理155から音声信号を受信する。自動利得制御160は、より静かな音の音声レベルを増幅させ、より大きな音のレベルを低下させて、時間経過につれてより一貫した出力音量を生じさせる。自動利得制御160は、受信した音声信号の固定の目標音声レベルで調整される。典型的には、固定の目標音声レベルは、製品開発及び製造中に製造業者によって確立される工場出荷時の設定である。一実施形態では、この固定の目標音声レベルは、−24dBである。自動利得制御160は、次いで、受信した音声信号の一部が、この固定の目標音声レベルとは異なることを判断する。受信した音声信号がスケール係数により乗算されるときに、結果として得られる音声信号が固定の目標音声レベルにより近くなるように、自動利得制御160は、スケール係数を計算する。一例では、限定ではなく、曲は、その曲が制作された期間及び曲のジャンルなどの様々な要因に基づいて、異なる音量レベルでマスタが作られ得る。聴取者が、マスタ録音レベルが変動する曲を選択すると、その聴取者は、これらの曲を聴きづらく感じ得る。聴取者が、静かな曲を聴くために音量レベルを調整すると、音が大きな曲が再生される際に音量が不快なほど大きくなり得る。同様に、聴取者が、音が大きな曲を聴くために音量レベルを調整すると、音量が小さすぎて静かな曲が聞こえないことがある。自動利得制御160は、音楽の聴取音量が時間経過とともにより一貫したものとなるように、受信した音声信号を処理する。
ダッカー165は、自動利得制御160から音声信号を受信する。ダッカーは、また、ノイズリダクション115から制御信号を受信する。この制御信号は、ノイズリダクション115が、聴取者の環境において着目信号を検出した場合を識別する。このような信号が検出されると、ダッカー165は、受信した音声信号の音量レベルを一時的に低下させる。このように、環境から着目信号が受信されるときに、ダッカー165は、再生デバイスからの音声を低下させ、またはダッキングする。その結果、聴取者には、環境からの着目信号がより容易に聞こえる。言い換えると、着目信号がマイクロフォンアレイ105(0)及び105(1)上に存在するとき、ダッカー165が音楽のレベルを低下させ、またはダッキングし、それによって着目信号が聞こえ理解され得る。ダッカー165は、結果として得られる音声信号をミキサ140(0)及び140(1)に送信する。
ミキサ135(0)及び135(1)は、処理済みの環境音声信号をリミッタ130から受信し、処理済みの音楽またはたの音声をダッカー165から受信する。ミキサ135(0)は、左音声チャネル用の受信された音声信号を混合または結合し、それに対応してミキサ135(1)は、右音声チャネル用の受信された音声信号を混合する。いくつかの実施形態では、ミキサ135(0)及び135(1)は、受信した音声信号の単純な加法混合または乗法混合を実行してもよい。他の実施形態では、ミキサ135(0)及び135(1)は、ユーザの音量設定に基づいて、到来音声信号のそれぞれに重み付けしてもよい。これらの後者の実施形態では、聴取者が聴取音量を上げるときなど、ダッカー165から受信される大きな音声信号によって、リミッタ130から受信される音声信号が、おそらくダッカー165からの音声信号と比較して異なる量だけ増加する。混合機能の実行後、左ミキサ135(0)及び右ミキサ135(1)は、結果として得られる信号を左増幅器140(0)及び右増幅器140(1)に送信する。左増幅器140(0)及び右増幅器140(1)は、音量制御(明示せず)に基づいて受信した音声信号を増幅させ、結果として得られる音声信号を左スピーカ145(0)及び右スピーカ145(1)にそれぞれ送信する。左スピーカ145(0)及び右スピーカ145(1)は、ダイレクトフィード170からも音声信号を受信する。ダイレクトフィードは、聴取者の環境から受信される音響信号を表す。バッテリ電源が閾値電圧レベルより下がったときなど、音声処理システム100がもはや機能していない場合に、左スピーカ145(0)及び右スピーカ145(1)は、左増幅器140(0)及び右スピーカ140(1)それぞれから受信される処理済みの音声信号ではなく、ダイレクトフィード170からの信号を送信する。
いくつかの実施形態では、聴取者は、1つまたは複数の静電容量式タッチセンサ(明示せず)によって音声処理システム100のある機能を制御し、またはあるパラメータを設定してもよい。聴取者がそのようなセンサに触れると、静電容量式タッチセンサの静電容量の変化が検出される。このような静電容量の変化によって、音声処理システム100は、ビームフォーミングモードの変更及びフィルタパラメータの変更を限定ではなく含む機能を実行する。聴取者は、動きを検出する複数の静電容量式タッチセンサを介して、音声処理システム100のある機能を制御し、またはあるパラメータを設定してもよい。例えば、限定ではなく、3つ以上の静電容量式タッチセンサが縦一列に配置されている場合に、聴取者が、下部の静電容量式タッチセンサに指で触れ、中央及び上部の静電容量式タッチセンサへ垂直に指を動かすことによって、音量レベルを上げることができる。これに対応して、聴取者が、上部の静電容量式タッチセンサに指で触れ、中央及び下部の静電容量式タッチセンサへ垂直に指を動かすことによって、音量レベルを下げることができる。他の実施形態では、聴取者は、スマートフォン、タブレットコンピュータ、またはラップトップコンピュータを限定ではなく含むコンピューティングデバイス上で実行するアプリケーションを介して、音声処理システム100のある機能を制御し、またはあるパラメータを設定してもよい。このようなアプリケーションは、Bluetooth(登録商標)、BluetoothLE、及び無線イーサネット(登録商標)を限定ではなく含む、任意の技術的に実行可能な手法によって音声処理システム100と通信してもよい。
音声処理システムの動作
図2は、様々な実施形態による、図1の音声処理システムの1つの適用を概念的に示す。図示するように、ライダー210(0)、210(1)、210(2)、210(3)、及び210(4)が、一直線で自転車に乗っている。ライダー210(2)は、ダイポールパターン220(0)及び220(1)で示されるような、ダイポール、即ち、8の字パターンを表す個人用聴取デバイス(明示せず)を装着している。ダイポールパターン220(0)及びダイポールパターン220(1)は、ライダー210(2)の右耳及び左耳にそれぞれ対応している。
図示されるように、ライダー210(2)の右耳及び左耳からのダイポールパターン220(0)及びダイポールパターン220(1)の外形の距離は、角度の関数として信号強度を示している。自転車ライダーは、ペースラインを形成することが多く、その場合、自転車乗用者は、一直線に互いの前方/後方にいる。このペースラインパターンは、空気抵抗を減少させ(先頭ライダーのみが、抵抗を阻んでいるため)、道路に車がいるときにもより安全である。ライダー210(2)は、ダイポールパターン220(0)及び220(1)を有する個人用聴取デバイスを装着しているため、ライダー210(2)には、前方ライダー210(0)及び210(1)、ならびに後方ライダー210(3)及び210(4)からの音声信号が、ライダー210(2)の左側方及び右側方からの音声信号と比較して、より容易に聞こえる。
図3は、様々な他の実施形態による、図1の音声処理システムの別の適用を概念的に示す。図示されるように、スキーヤー310は、カージオイドパターン320によって示されるようなカージオイドパターンを表す個人用聴取デバイス(明示せず)を装着している。カージオイドパターン320は、スキーヤー310の左耳に対応している。明確にするために、スキーヤー310の右耳に対応するカージオイドパターンは、図3では明示されていない。図示されるように、スキーヤー310の左耳からのカージオイドパターン320の外形の距離は、角度の関数として信号強度を示している。雪及び氷に対するスキーの音などの、スキーヤー310の下からの音は、スキーヤー310の横方向または上方から発生している音を含む、他の方向からの音と比較して抑制される。図3に示される適用は、スノーボード、ランニング、及びトレッドミルエクササイズを限定ではなく含む、他の関連アクティビティにも関連する。
図4A〜図4Bは、様々な実施形態による、再生及び環境の音声信号を処理するための方法ステップのフロー図を示す。方法ステップは、図1〜図3のシステムと併せて説明されるが、当業者であれば、方法ステップを任意の順序で実行するように構成される任意のシステムが、本開示の範囲内にあることを理解するであろう。
図示されるように、方法400は、ステップ402において開始し、ステップ402において、音声処理システム100に関連付けられるマイクロフォンアレイ105(0)及び105(1)が、聴取者の環境から音声信号を受信する。ステップ404において、ビームフォーマ110(0)及び110(1)が、全方向性、ダイポール、及びカージオイドパターンを限定ではなく含む、特定のビームフォーミングモードに従って、マイクロフォンアレイ110(0)及び110(1)からの音声信号を方向的に減衰及び増幅させる。ステップ406において、ノイズリダクション115が、ハム音、ヒス音、及び風などの定常状態信号の音声レベルを低下させ、一方、人のスピーチ、車の警笛、及び警報などの過渡信号の音声レベルを増幅させる。ステップ408において、ノイズリダクション115が、また、受信した音声信号の一部に対して能動型ノイズ消去も実行する。ステップ410において、イコライザが、いかなる個人用聴取デバイスも装着していないのと比較した、ヘッドフォンまたはイヤフォンを装着していることに関連する不均衡などの、周波数不均衡を補償する。
ステップ412において、ゲート125が、閾値音量、即ち、振幅レベルより低い音声信号を抑制する。いくつかの実施形態では、ゲート125の閾値音量は、関連のある周波数範囲にわたって一定であってもよい。他の実施形態では、閾値音量は、周波数の関数として変動してもよい。ステップ414において、リミッタ130は、指定された最大許容音声レベルを超える音声信号を減衰させる。ステップ416において、低調波処理155が、再生デバイスから受信される音声信号フィードに基づいて、低周波数音声信号を合成する。ステップ418において、自動利得制御160が、再生デバイスから受信される音声信号フィードの音量を調整する。例えば、限定ではなく、自動利得制御160が、静かな曲の音量を増加させてもよく、大きな音の曲の音量を減少させてもよい。ステップ420において、ダッカー165は、着目源が聴取者の環境から受信されることを示す、ノイズリダクション115からの制御信号に基づいて、再生デバイスから受信される音声信号フィードの音量を一時的に減少させる。
ステップ422において、左ミキサ135(0)及び右ミキサ135(1)は、それぞれ左及び右チャネルのために、リミッタ130から受信した音声をダッカー165から受信した音声と混合する。ステップ424において、左増幅器140(0)及び右増幅器140(1)は、それぞれ左ミキサ135(0)及び右ミキサ135(1)から受信した音声信号を増幅させる。ステップ426において、左増幅器140(0)及び右増幅器140(1)は、それぞれ左スピーカ145(0)及び右スピーカ145(1)に最終的な音声信号を送信する。次いで、方法400が終了する。いくつかの実施形態では、方法400は、終了するのではなく、音声処理システム100の構成要素が、連続ループで方法400のステップを実行し続ける。これらの実施形態では、ステップ426が実行された後、方法400は、上述のステップ402に進む。方法400のステップは、音声処理システム100を含むデバイスの電源を落とすなどのある一定のイベントが発生するまで、連続ループで実行され続ける。
要約すると、開示された技術によって、個人用聴取デバイスを使用する聴取者が、音楽または所望の音声を聴取者の環境からのある着目する音と混合したものを聞くことが可能となる。ヒス音、ハム音、及び交通騒音などの、環境からの定常状態信号は、音声環境から除去され、音楽及び着目する環境音が強化される。聴取者の環境からの音声は、マイクロフォンアレイを介して受信され、ビームフォーマ、ノイズリダクション、イコライゼーション、ゲーティング、及びリミッティングによって処理される。再生デバイスから受信される音楽及び他の音声信号は、低調波処理、自動利得制御、及びダッキングによって処理される。ミキサは、環境音声と再生音声の混合を行い、結果として得られる信号を増幅器に送信し、増幅器は、同様に音声信号を一対のヘッドフォン、イヤフォン、イヤバッド、または他の個人用聴取デバイス内のスピーカに送信する。
本明細書で説明した手法の少なくとも1つの利点は、開示される個人用聴取デバイスを使用する聴取者が、再生デバイスからの高品質な音声信号に加えて、環境からのある一定の着目音声の音を聞き、同時に、環境からの他の音が、着目する音と比較して抑制されるということである。結果として、聴取者が所望の音声信号だけを聞くための潜在力が向上し、聴取者にとってより良好な品質のオーディオ体験をもたらす。
様々な実施形態の説明が、例示の目的で提示されてきたが、網羅的であること、または開示された実施形態に限定することを意図するものではない。開示された実施形態の範囲及び思想から逸脱することなく、多くの修正及び変形が当業者には明らかであろう。
本実施形態の態様は、システム、方法、またはコンピュータプログラム製品として具現化され得る。したがって、本開示の態様は、完全なハードウェア実施形態、完全なソフトウェア実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、または、全て概して、本明細書において「回路」、「モジュール」、もしくは「システム」と呼ばれ得るソフトウェア及びハードウェア態様を組み合わせる実施形態の形式を取ってもよい。さらに、本開示の態様は、その上で具現化されるコンピュータ可読プログラムコードを有する、1つまたは複数のコンピュータ可読媒体(複数可)において具現化されるコンピュータプログラム製品の形式を取ってもよい。
1つまたは複数のコンピュータ可読媒体(複数可)の任意の組み合わせが利用されてもよい。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁気、赤外線、または半導体のシステム、装置、もしくはデバイス、または前述したものの任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的なリスト)は、以下、1つまたは複数の配線を有する電気接続、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROM、またはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD−ROM)、光記憶デバイス、磁気記憶デバイス、または前述したものの任意の適当な組み合わせを含むものとする。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、もしくはデバイスによって、または命令実行システム、装置、もしくはデバイスと併せて、使用するプログラムを含み、または記憶することが可能な、任意の有形媒体であってもよい。
本開示の態様は、本開示の実施形態による、方法、装置(システム)、及びコンピュータプログラム製品のフローチャート図及び/またはブロック図を参照して上述される。フローチャート図及び/またはブロック図の各ブロック、ならびにフローチャート図及び/またはブロック図におけるブロックの組み合わせは、コンピュータプログラム命令によって実施され得ると理解されたい。これらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、または機械を製造するための他のプログラマブルデータ処理装置のプロセッサに提供されてもよく、それによって、コンピュータまたは他のプログラマブルデータ処理装置のプロセッサにより実行する命令が、フローチャート及び/またはブロック図のブロックにおいて指定される機能/動作の実施を可能にする。このようなプロセッサは、限定ではなく、汎用プロセッサ、専用プロセッサ、アプリケーション固有プロセッサ、またはフィールドプログラマブルであってもよい。
図面中のフローチャート及びブロック図は、本開示の様々な実施形態によるシステム、方法、及びコンピュータプログラム製品の考えられる実施態様のアーキテクチャ、機能性、及び動作を示している。この点に関して、フローチャートまたはブロック図内の各ブロックは、指定された論理機能(複数可)を実施する1つまたは複数の実行可能命令を含む、モジュール、セグメント、またはコードの一部を表してもよい。いくつかの代替的な実施態様では、ブロック内に記載された機能は、図中に記載された順序ではない順序で発生してもよいことにも留意すべきである。例えば、連続して示された2つのブロックが、実際には、実質的に同時に実行されてもよく、または、ブロックが、必要とされる機能性次第で、逆の順序で実行されることがあってもよい。ブロック図及び/またはフローチャート図の各ブロック、ならびにブロック図及び/またはフローチャート図のブロックの組み合わせが、指定された機能もしくは動作を実行する専用ハードウェアベースシステム、または専用ハードウェア及びコンピュータ命令の組み合わせによって実施され得ることにも留意されたい。
上記は、本開示の実施形態を対象とするものであるが、開示の他の及びさらなる実施形態が、その基本的範囲及び以下の特許請求の範囲によって決定されるその範囲から逸脱することなく考案されてもよい。

Claims (20)

  1. 個人用聴取デバイスのための音声処理システムであって、前記音声処理システムは、
    前記個人用聴取デバイスに統合される第1の複数のマイクロフォンであって、前記第1の複数のマイクロフォンは、環境から第1の複数の音声信号を受信するように構成される第1の複数のマイクロフォンと、
    前記第1の複数のマイクロフォンに連結されるノイズリダクション回路であって、前記ノイズリダクション回路は
    前記第1の複数の音声信号を複数の周波数ビンに分割すること、及び、閾値量よりも大きく変動する振幅に前記複数の周波数ビンのうちの少なくとも1つの周波数ビンが関連付けられていることを判断することによって、着目信号が前記第1の複数の音声信号内に存在することを検出することと
    前記閾値量よりも大きく変動する振幅に前記複数の周波数ビンのうちの前記少なくとも1つの周波数ビンが関連付けられていることを判断したことに応答して、前記複数の周波数ビンのうちの前記少なくとも1つの周波数ビンを増幅させることと、
    前記着目信号を検出した後、ダッキング制御信号を送信することと
    を実行するように構成されるノイズリダクション回路と、
    前記ノイズリダクション回路に連結される音声ダッカーであって、前記音声ダッカーは
    前記ダッキング制御信号を受信することと
    再生デバイスを介して第2の複数の音声信号を受信することと
    前記ダッキング制御信号に基づいて、前記着目信号と比較して前記第2の複数の音声信号の振幅を減少させることと
    を実行するように構成される音声ダッカーと、
    前記音声ダッカーに連結されるミキサであって、前記ミキサは、前記第1の複数の音声信号と前記第2の複数の音声信号とを結合するように構成されるミキサ
    を備える音声処理システム。
  2. 前記ノイズリダクション回路が、
    第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分がノイズ信号を含むことを判断することと
    前記第1の複数の音声信号の前記第1の部分の振幅を減少させることと
    を実行するようにさらに構成される、請求項1に記載の音声処理システム。
  3. 前記ノイズリダクション回路が、
    第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分が前記着目信号を含むことを判断することと
    前記第1の複数の音声信号の前記第1の部分を増幅させることと
    を実行するようにさらに構成される、請求項1に記載の音声処理システム。
  4. 前記個人用聴取デバイスの物理特性から生じる音響変化を補償するために前記第1の複数の音声信号に対して周波数に基づく振幅調整を行うように構成されるイコライザをさらに備える、請求項1に記載の音声処理システム。
  5. 前記第1の複数の音声信号の第1の部分が閾値振幅より小さいことを判断することと
    前記第1の複数の音声信号の前記第1の部分の振幅を減少させることと
    を実行するように構成されるゲートをさらに備える、請求項1に記載の音声処理システム。
  6. 前記第1の複数の音声信号の第1の部分が最大許容振幅より大きいことを判断することと
    前記第1の複数の音声信号の前記第1の部分の振幅を、前記最大許容振幅以下であるように制限することと
    を実行するように構成されるリミッタをさらに備える、請求項1に記載の音声処理システム。
  7. 前記第2の複数の音声信号の少なくとも一部に対応する1つまたは複数の低調波信号を合成して第3の複数の音声信号を生成することと
    前記第2の音声信号を前記第3の複数の音声信号と結合することと
    を実行するように構成される低調波プロセッサをさらに備える、請求項1に記載の音声処理システム。
  8. 前記第2の複数の音声信号に対応する目標音声レベルを計算することと
    前記第2の複数の音声信号の少なくとも一部が前記目標音声レベルとは異なること判断することと
    前記第2の複数の音声信号がスケール係数により乗算されるとき結果として得られる音声信号が前記目標音声レベルに近いように前記スケール係数を計算することと
    前記第2の複数の音声信号を前記スケール係数により乗算することと
    を実行するように構成される自動利得コントローラをさらに備える、請求項1に記載の音声処理システム。
  9. 前記着目信号が、前記第1の複数の音声信号に関連する平均音声信号レベルと比較して高い音声レベルを有する断続的音声の音を含む、請求項1に記載の音声処理システム。
  10. 前記第の複数の音声信号を増幅させることと
    前記第の複数の音声信号をスピーカに送信して音出力を生成することと
    を実行するように構成される増幅器をさらに備える、請求項9に記載の音声処理システム。
  11. 再生及び環境の音声信号を処理するための方法であって、前記方法は、
    第1の複数の音声信号を環境から受信することと、
    前記第1の複数の音声信号を複数の周波数ビンに分割すること、及び、閾値量よりも大きく変動する振幅に前記複数の周波数ビンのうちの少なくとも1つの周波数ビンが関連付けられていることを判断することによって、着目信号が前記第1の複数の音声信号内に存在することを検出することであって、前記着目信号が、前記第1の複数の音声信号に関連する平均音声信号レベルと比較して高い音声レベルを有する断続的音声の音を含むことと、
    前記閾値量よりも大きく変動する振幅に前記複数の周波数ビンのうちの前記少なくとも1つの周波数ビンが関連付けられていることを判断したことに応答して、前記複数の周波数ビンのうちの前記少なくとも1つの周波数ビンを増幅させることと、
    前記着目信号を検出した後、ダッキング制御信号を生成することと
    再生デバイスを介して第2の複数の音声信号を受信することと、
    前記ダッキング制御信号に基づいて、前記着目信号と比較して前記第2の複数の音声信号の振幅を減少させることと、
    前記第1の複数の音声信号と前記第2の複数の音声信号とを結合することと
    を含む方法。
  12. 前記第1の複数の音声信号が発生している方向を識別することと、
    前記方向に基づいて前記第1の複数の音声信号を減衰させること
    をさらに含む、請求項11に記載の方法。
  13. 前記第1の複数の音声信号を減衰させることが、
    ビームフォーミングモードの選択を受信することと、
    前記ビームフォーミングモード及び前記方向に基づいてスケール係数を計算することと、
    前記スケール係数を前記第1の複数の音声信号に適用することと
    を含む、請求項12に記載の方法。
  14. 前記ビームフォーミングモードが、全方向性モード、ダイポールモード、またはカージオイドモードを含む、請求項13に記載の方法。
  15. 第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分がノイズ信号を含むことを判断することと、
    前記第1の複数の音声信号の前記第1の部分の振幅を減少させることと
    をさらに含む、請求項11に記載の方法。
  16. 第1の周波数帯に対応する前記第1の複数の音声信号の第1の部分が前記着目信号を含むことを判断することと、
    前記第1の複数の音声信号の前記第1の部分を増幅させることと
    をさらに含む、請求項11に記載の方法。
  17. 命令を含む非一過性のコンピュータ可読記憶媒体であって、前記命令は、プロセッサによって実行されたときに、
    第1の複数の音声信号を環境から受信するステップと、
    前記第1の複数の音声信号を複数の周波数ビンに分割すること、及び、閾値量よりも大きく変動する振幅に前記複数の周波数ビンのうちの少なくとも1つの周波数ビンが関連付けられていることを判断することによって、着目信号が前記第1の複数の音声信号内に存在することを検出するステップであって、前記着目信号が、前記第1の複数の音声信号に関連する平均音声信号レベルと比較して高い音声レベルを有する断続的音声の音を含むステップと、
    前記閾値量よりも大きく変動する振幅に前記複数の周波数ビンのうちの前記少なくとも1つの周波数ビンが関連付けられていることを判断したことに応答して、前記複数の周波数ビンのうちの前記少なくとも1つの周波数ビンを増幅させるステップと、
    前記着目信号を検出した後、ダッキング制御信号を生成するステップと
    再生デバイスを介して第2の複数の音声信号を受信するステップと、
    前記ダッキング制御信号に基づいて、前記着目信号と比較して前記第2の複数の音声信号の振幅を減少させるステップと、
    前記第1の複数の音声信号と前記第2の複数の音声信号とを結合するステップと
    を実行することによって再生及び環境の音声信号を前記プロセッサに処理させる、非一過性のコンピュータ可読記憶媒体
  18. 前記プロセッサによって実行されたときに
    前記第1の複数の音声信号が発生している方向を識別するステップと、
    前記方向に基づいて前記第1の複数の音声信号を減衰させるステップと
    を前記プロセッサに実行させる命令をさらに含む、請求項17に記載の非一過性のコンピュータ可読記憶媒体。
  19. 前記第1の複数の音声信号を減衰させることが、
    ビームフォーミングモードの選択を受信することと、
    前記ビームフォーミングモード及び前記方向に基づいてスケール係数を計算することと、
    前記スケール係数を前記第1の複数の音声信号に適用することと
    を含む、請求項18に記載の非一過性のコンピュータ可読記憶媒体。
  20. 前記ビームフォーミングモードが、全方向性モード、ダイポールモード、またはカージオイドモードを含む、請求項19に記載の非一過性のコンピュータ可読記憶媒体。
JP2017559517A 2015-06-26 2015-06-26 状況認識を備えたスポーツヘッドフォン Active JP6652978B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2015/038158 WO2016209295A1 (en) 2015-06-26 2015-06-26 Sports headphone with situational awareness

Publications (2)

Publication Number Publication Date
JP2018518893A JP2018518893A (ja) 2018-07-12
JP6652978B2 true JP6652978B2 (ja) 2020-02-26

Family

ID=57586379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017559517A Active JP6652978B2 (ja) 2015-06-26 2015-06-26 状況認識を備えたスポーツヘッドフォン

Country Status (6)

Country Link
US (1) US10582288B2 (ja)
JP (1) JP6652978B2 (ja)
KR (1) KR102331233B1 (ja)
DE (1) DE112015006654T5 (ja)
GB (1) GB2556496B (ja)
WO (1) WO2016209295A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
WO2016105455A1 (en) 2014-12-23 2016-06-30 Degraye Timothy Method and system for audio sharing
CN109310525B (zh) * 2016-06-14 2021-12-28 杜比实验室特许公司 媒体补偿通过和模式切换
US9980075B1 (en) 2016-11-18 2018-05-22 Stages Llc Audio source spatialization relative to orientation sensor and output
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
DK3343956T3 (en) 2016-12-30 2021-05-03 Sonion Nederland Bv A circuit and a receiver comprising the circuit
WO2019003525A1 (ja) * 2017-06-28 2019-01-03 ソニー株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム
CA3084890A1 (en) * 2017-12-07 2019-06-13 Hed Technologies Sarl Voice aware audio system and method
KR20230015513A (ko) 2017-12-07 2023-01-31 헤드 테크놀로지 에스아에르엘 음성인식 오디오 시스템 및 방법
WO2019130282A1 (en) * 2017-12-29 2019-07-04 Harman International Industries, Incorporated Acoustical in-cabin noise cancellation system for far-end telecommunications
WO2019222648A1 (en) * 2018-05-18 2019-11-21 Gentex Corporation Headset communication system
KR102316509B1 (ko) * 2019-07-17 2021-10-22 충남대학교산학협력단 음원 출력 제어 장치 및 그 방법
KR102293391B1 (ko) * 2020-11-24 2021-08-25 (주)힐링사운드 청력보호용 소리 제어 시스템 및 방법

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4855723A (en) * 1988-04-29 1989-08-08 Proto Quick, Inc. Audio-visual alarm system with address display
JP3254789B2 (ja) 1993-02-05 2002-02-12 ソニー株式会社 補聴装置
CA2341834C (en) * 2001-03-21 2010-10-26 Unitron Industries Ltd. Apparatus and method for adaptive signal characterization and noise reduction in hearing aids and other audio devices
WO2003018722A2 (en) * 2001-08-28 2003-03-06 Koninklijke Philips Electronics N.V. Circuit and method for processing an audio signal
US20030220705A1 (en) * 2002-05-24 2003-11-27 Ibey Jarry A. Audio distribution system with remote control
US6912289B2 (en) * 2003-10-09 2005-06-28 Unitron Hearing Ltd. Hearing aid and processes for adaptively processing signals therein
WO2006036262A2 (en) * 2004-09-23 2006-04-06 Thomson Licensing Method and apparatus for controlling a headphone
JP5098404B2 (ja) * 2006-10-27 2012-12-12 ソニー株式会社 音声処理方法および音声処理装置
US8194865B2 (en) * 2007-02-22 2012-06-05 Personics Holdings Inc. Method and device for sound detection and audio control
US20090076636A1 (en) * 2007-09-13 2009-03-19 Bionica Corporation Method of enhancing sound for hearing impaired individuals
KR101422838B1 (ko) * 2007-10-02 2014-08-14 엘지전자 주식회사 외부음 청취가 가능한 음원출력장치 및 휴대용 전자기기그리고 그 방법
KR20080000095U (ko) 2008-01-03 2008-01-23 노신광 휴대용 오디오 기기의 경고 장치
US8818000B2 (en) 2008-04-25 2014-08-26 Andrea Electronics Corporation System, device, and method utilizing an integrated stereo array microphone
US8577052B2 (en) * 2008-11-06 2013-11-05 Harman International Industries, Incorporated Headphone accessory
KR101093847B1 (ko) 2009-08-06 2011-12-13 영남대학교 산학협력단 안전 이어폰 시스템 및 그 구동 방법
JP5549299B2 (ja) * 2010-03-23 2014-07-16 ヤマハ株式会社 ヘッドフォン
CN106131735B (zh) * 2010-12-01 2019-07-30 索纳麦克斯科技股份有限公司 先进的通信耳机装置及方法
JP5857403B2 (ja) * 2010-12-17 2016-02-10 富士通株式会社 音声処理装置および音声処理プログラム
GB2493327B (en) * 2011-07-05 2018-06-06 Skype Processing audio signals
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US20130329908A1 (en) * 2012-06-08 2013-12-12 Apple Inc. Adjusting audio beamforming settings based on system state
US9191744B2 (en) * 2012-08-09 2015-11-17 Logitech Europe, S.A. Intelligent ambient sound monitoring system
US9946680B2 (en) * 2012-10-05 2018-04-17 Analog Devices, Inc. Peripheral device diagnostics and control over a two-wire communication bus
US10034087B2 (en) * 2012-10-26 2018-07-24 Asius Technologies, Llc Audio signal processing for listening devices
KR101382553B1 (ko) 2013-02-27 2014-04-07 한밭대학교 산학협력단 외부상황 인지 리시버
US9842608B2 (en) * 2014-10-03 2017-12-12 Google Inc. Automatic selective gain control of audio data for speech recognition
US10231056B2 (en) * 2014-12-27 2019-03-12 Intel Corporation Binaural recording for processing audio signals to enable alerts

Also Published As

Publication number Publication date
GB2556496A (en) 2018-05-30
DE112015006654T5 (de) 2018-03-08
GB2556496B (en) 2021-06-30
US20180160211A1 (en) 2018-06-07
JP2018518893A (ja) 2018-07-12
GB201721743D0 (en) 2018-02-07
WO2016209295A1 (en) 2016-12-29
US10582288B2 (en) 2020-03-03
KR102331233B1 (ko) 2021-11-25
KR20180021368A (ko) 2018-03-02

Similar Documents

Publication Publication Date Title
JP6652978B2 (ja) 状況認識を備えたスポーツヘッドフォン
US20230179160A1 (en) Compensation for ambient sound signals to facilitate adjustment of an audio volume
US8335324B2 (en) Method and apparatus for automatic volume adjustment
US9557960B2 (en) Active acoustic filter with automatic selection of filter parameters based on ambient sound
JP6323089B2 (ja) レベル調整方法およびレベル調整装置
JPH0389706A (ja) 自動音量調整装置
TW201727619A (zh) 具有可控制位準的主動式雜訊消除技術
JP7143852B2 (ja) 制御装置、制御方法、プログラム
US20140294193A1 (en) Transducer apparatus with in-ear microphone
AU2016219549A1 (en) System and method for enhancing virtual audio height perception
JP5682539B2 (ja) 音響再生装置
US9813039B2 (en) Multiband ducker
US20120033835A1 (en) System and method for modifying an audio signal
JP4791613B2 (ja) 音声調整装置
JP2008228198A (ja) 再生音調整装置及び再生音調整方法
JP4086019B2 (ja) 音量制御装置
JP6875164B2 (ja) 信号処理装置およびアクティブノイズキャンセルシステム
CN211352437U (zh) 一种音频输出装置及电子设备
US9571950B1 (en) System and method for audio reproduction
KR101721406B1 (ko) 적응형 음장 제어 방법 및 이를 위한 장치
JP5998357B2 (ja) 車載用音響再生装置
JP2012187995A (ja) 車載用音響再生装置
JP2009200777A (ja) オーディオ信号の利得制御装置および利得制御方法
JP6807769B2 (ja) 音響装置及び音質調整方法
US9653065B2 (en) Audio processing device, method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200124

R150 Certificate of patent or registration of utility model

Ref document number: 6652978

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250