WO2021111965A1 - 音場生成システム、音声処理装置および音声処理方法 - Google Patents

音場生成システム、音声処理装置および音声処理方法 Download PDF

Info

Publication number
WO2021111965A1
WO2021111965A1 PCT/JP2020/043951 JP2020043951W WO2021111965A1 WO 2021111965 A1 WO2021111965 A1 WO 2021111965A1 JP 2020043951 W JP2020043951 W JP 2020043951W WO 2021111965 A1 WO2021111965 A1 WO 2021111965A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound
audible
frequency
acoustic content
audible sound
Prior art date
Application number
PCT/JP2020/043951
Other languages
English (en)
French (fr)
Inventor
理絵子 鈴木
靖 佐藤
Original Assignee
株式会社ティーオースウィング
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ティーオースウィング filed Critical 株式会社ティーオースウィング
Publication of WO2021111965A1 publication Critical patent/WO2021111965A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/04Sound-producing devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

可聴周波数帯域の音声である可聴音が存在する空間100に対して、ユーザにより非可聴周波数帯域の低周波音声である非可聴音を出力する第1の音声処理装置101を備え、可聴音に対して非可聴音が適用された音場を生成することにより、非可聴音が人の耳には聞こえない低周波の振動として作用し、可聴音が人の耳に聞こえる音声として作用するようにして、可聴音による聴覚的効果と振動による触覚的効果との相乗効果を有する音場を提供することができるようにする。

Description

音場生成システム、音声処理装置および音声処理方法
 本発明は、音場生成システム、音声処理装置および音声処理方法に関するものである。
 従来、人間が有する五感のうち、視覚を利用した映像コンテンツや、聴覚を利用した音声コンテンツが様々な産業分野において広く提供されている。また、視覚(映像)および/または聴覚(音声)に触覚(振動)を第3の感覚として用いたコンテンツを提供することで、ユーザに対して何らかのメッセージを伝えたり、映像または音声に関するリアリティや臨場感を高めたりすることができるようにした技術も広く提供されている(例えば、特許文献1,2参照)。
 特許文献1には、音楽の再生音に合わせて振動を発生させることができる振動発生装置が開示されている。この特許文献1に記載の振動発生装置では、複数の楽器の音が混在したアナログの音楽情報から、ベースの再生音の音域に対応する音データと、ドラムの再生音の音域に対応する音データとをバンドパスフィルターによって抽出し、ベース音の音データが所定のレベル以上となるデータ区間の期間内に低域の周波数の駆動パルスを発生させる一方、ドラム音の音データが所定のレベル以上となるデータ区間の期間内に高域の周波数の駆動パルスを発生させることにより、音楽の再生音に合わせて振動を発生するようにしている。ここで、音楽情報はスピーカまたはイヤホンのいずれかから再生され、振動情報は振動機構部の振動体に供給される。
 特許文献2には、高音の音声と低音の振動とを出力することにより、臨場感のある快適な音声信号を再生することができるようにした音声再生装置(携帯型の音声再生プレーヤ)が開示されている。この特許文献2に記載の音声再生装置において、体感モードが選択されたときには、DSP(Digital Signal Processor)では、入力されたLch信号およびRch信号を加算器により加算し、ローパスフィルタにより音声信号に含まれる低周波成分を取り出してMBS(Mobile Body Sonic)信号を生成する。
 この特許文献2に記載の音声再生装置は、そのジャックにヘッドホンのプラグを接続して使用される。ヘッドホンのプラグは、Lch信号を入力するLch接続端子部と、Rch信号を入力するLch接続端子部と、MBS信号を入力するMBS接続端子部と、GND信号を入力するGND接続端子部とを有する4端子構造の接続端子である。音声再生装置のL-RアンプおよびMBSアンプからヘッドホンのプラグに入力されたLch信号、Rch信号およびMBS信号は、それぞれLchスピーカ、Rchスピーカおよびトランスデューサに出力される。そして、MBS信号は、ユーザの衣服などに取り付けられたトランスデューサによって機械的振動に変換される。
 一般に、振動によって音が発生すると、それはスピーカやイヤホンから出力される音声にとって邪魔になるもの(ノイズ)と考えられており、いかに音楽再生の邪魔とならないように振動を付与するかが課題とされて、その課題を解決するための工夫を凝らしているものが殆どである。従来、振動は騒音の一種とされ、その防音または制振に関する研究および技術開発がなされてきた。これに対し、特許文献1,2には、音声情報と振動情報とを同時に出力することに関する技術が開示されている。何れの技術も、音楽の再生音に合わせて振動を発生させることにより、利アリティや臨場感を高めた音声の視聴ができるようにしたものである。
特開2013-56309号公報 特開2006-33591号公報
 本発明は、従来とは全く異なる方法によって、可聴音と振動とにより相乗効果を有する音場を提供できるようにすることを目的とする。
 上記した課題を解決するために、本発明では、可聴周波数帯域の音声である可聴音が存在する空間に対して、ユーザにより選択された非可聴周波数帯域の低周波音声である非可聴音を出力することにより、可聴音に対して非可聴音が適用された音場を生成するようにしている。
 上記のように構成した本発明によれば、ユーザにより選択された非可聴音が人の耳には聞こえない低周波の振動として作用し、可聴音が人の耳に聞こえる音声として作用する。本発明によれば、このような非可聴音の振動と可聴音とにより音場が生成されることにより、可聴音による聴覚的効果と非可聴音の振動による触覚的効果との相乗効果を有する音場を提供することができる。
本実施形態による音場生成システムの構成例を示す図である。 自然界に存在する音を解析することによって非可聴音を得ることを説明するための図である。 本実施形態による第1の音声処理装置の機能構成例を示すブロック図である。 様々なパワースポットで採取した自然音の分析結果を示す図である。 様々なパワースポットで採取した自然音の分析結果を示す図である。 本実施形態による音場生成システムの他の構成例を示す図である。 本実施形態による音響コンテンツ出力装置の機能構成例を示すブロック図である。 可聴音と非可聴音との融合音である音響コンテンツの生成方法を説明するための図である。 可聴音と非可聴音との融合について説明するための図である。 本実施形態による音響コンテンツ出力装置の他の機能構成例を示すブロック図である。 音響コンテンツの他の生成方法を説明するための図である。
 以下、本発明の一実施形態を図面に基づいて説明する。図1は、本実施形態による音場生成システムの構成例を示す図である。図1に示すように、本実施形態の音場生成システムは、第1の音声処理装置101(特許請求の範囲の音声処理装置に相当)と、第2の音声処理装置102とを備え、可聴周波数帯域の音声である可聴音が存在する空間100に対して、ユーザにより選択された非可聴周波数帯域の低周波音声である非可聴音(本実施形態では、これを深層振動とも呼ぶ)を出力することにより、可聴音に対して非可聴音が適用された音場を生成する。
 非可聴音および可聴音が出力される空間100は、例えば部屋、コンサート会場、劇場、会議室、車内などの屋内の閉空間であってもよいし、屋外の開空間であってもよい。
 第1の音声処理装置101は、非可聴音を空間100に出力する装置である。第2の音声処理装置102は、可聴音を空間100に出力する装置である。本実施形態の音場生成システムは、第2の音声処理装置102によって出力された可聴音が存在する空間100に対して、第1の音声処理装置101から非可聴音を出力することにより、可聴音に対して非可聴音が適用された音場を生成する。
 第1の音声処理装置101は、キーボードやマウス、タッチパネル等の入力デバイスと、ディスプレイ等の第1出力デバイスと、音声(振動)を出力するスピーカまたは振動呈示機構等の第2出力デバイスとを備えた端末、またはこれらのデバイスを接続可能な端末であり、例えばスマートフォン、タブレット、パーソナルコンピュータ、テレビ、オーディオ装置などにより構成される。第2の音声処理装置102は、音声を出力するスピーカを備えた装置であり、例えばスマートフォン、タブレット、パーソナルコンピュータ、テレビ、オーディオ装置などにより構成される。
 図1に示すように、人は、第2の音声処理装置102から出力された可聴音を耳から受け、第1の音声処理装置101から出力された非可聴音を深層振動として身体で受ける。深層振動を人間の身体に当てることにより、自律神経系の変化(リラックスまたは興奮)を促したり、人間の肉体的状態または精神的状態の改善または悪化抑止を誘起させたりすることが期待できる。
 本実施形態の非可聴音は、自然界に存在する音を解析することによって得ることが可能である。本実施形態では、非可聴音の一例として、パワースポットの自然音から生成された非可聴周波数帯域の低周波音声を用いる。図2は、パワースポットの音を解析することによって非可聴音を得ることを説明するための図である。図2(a)は、パワースポットにおいて発生している自然音の波形データを示す図である。図2(b)は、図2(a)に示す波形データを解析することによって得た周波数スペクトルを示す図である。
 パワースポットの自然音について、図2(b)のように周波数スペクトルを解析したところ、人間の耳には聞こえない低域の音が強く出ていることが分かった。周波数スペクトルから明らかな通り、40Hz以下の低周波域において、人の耳には聞こえないが大きなパワーを持った音が存在している(20~40Hzは一般的に可聴音域の一部と言われているが、この音域の音は殆ど聞こえない。本明細書では、この20~40Hzも非可聴の音域として説明する)。このような低域の強い音は身体を揺らすので、深層心理に影響を与え、人がパワースポットで景色を見たり、自然音を聞いたりする際の感動に繋がっている。
 このようなパワースポットの自然音を音響分析することにより、本実施形態の深層振動として使える非可聴音を得ることが可能である。例えば、パワースポットの自然音から40Hz以下(好ましくは20Hz以下、更に好ましくは10Hz以下、更に好ましくは5Hz以下(図4参照))の低周波成分を抽出し、抽出した低周波成分の音声を非可聴音(深層振動)として用いることが可能である。または、抽出した低周波成分の音声を加工して非可聴音を生成するようにしてもよい。ここでいう加工は、周波数の変動を伴わない加工である。例えば、パワースポットの自然音から抽出した40Hz以下の低周波音声を複製して時間軸方向に連結することにより、非可聴音を生成するようにしてもよい。このとき、音圧を調整するようにしてもよい。
 図3は、本実施形態による第1の音声処理装置101の機能構成例を示すブロック図である。ここでは2つのタイプの機能構成例を示している。図3(a)に示す第1タイプに係る第1の音声処理装置101は、機能構成として、パワースポット選択部11および非可聴音出力部12を備えている。また、第1タイプに係る第1の音声処理装置101は、記憶媒体として、非可聴音記憶部10を備えている。
 また、図3(b)に示す第2タイプの第1の音声処理装置101は、機能構成としてパワースポット選択部11および非可聴音出力部12を備える一方、記憶媒体としての非可聴音記憶部10は備えていない。非可聴音記憶部10は、インターネットまたは携帯電話網等の通信ネットワーク500を介して第1の音声処理装置101と接続されるサーバ200が備えており、サーバ200は機能構成として非可聴音提供部21を備えている。
 上記各機能ブロック11~12は、ハードウェア、DSP、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック11~12は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。
 非可聴音記憶部10は、複数箇所のパワースポットで採取した自然音から生成した複数の非可聴音のデータを、パワースポットの識別情報に関連付けて記憶する。パワースポットの識別情報としては、例えばパワースポットの名称を用いることが可能である。ただし、これに限定されるものではない。
 図4および図5は、様々なパワースポットで採取した自然音の分析結果を示す図である。図4では、様々なパワースポットで採取した自然音の周波数スペクトルを示している。図4に示すように、どのパワースポットにおいて発生している自然音の中にも非可聴音が含まれている。図5では、様々なパワースポットで採取した自然音から生成した非可聴音の波形に対して触質特徴量を用いた解析を行うことによって作成したグラフを示している。
 図5に示すグラフの解析は、例えば以下のようにして行う。まず、非可聴音の音声波形を時間軸方向に複数の等区間に分割し、複数の等区間のそれぞれにおいて2種類の触質特徴量を算出する。そして、当該2種類の触質特徴量をそれぞれ座標軸とする座標空間上に、2種類の触質特徴量の組み合わせに基づく座標位置を複数組の触質特徴量ごとにマッピングすることによってグラフを作成する。2種類の触質特徴量は、例えば、WO2018/211767号公報に記載の方法によって算出する。
 例えば、非可聴音の音声波形を複数の等区間に分割し、当該分割した複数の等区間のそれぞれにおいて、それぞれが触感の一要素を表した第1の触質パラメータと第2の触質パラメータとの組み合わせを2組以上生成する。第1の触質パラメータは波形の強度に関するパラメータ、第2の触質パラメータは波形の分割区間の長さに関するパラメータであり、何れも触感の一要素(触感の強さ、長さ)を成すものである。
 そして、このように生成した第1の触質パラメータおよび第2の触質パラメータの2組以上の組み合わせに基づいて、第1の触質パラメータと第2の触質パラメータとを用いた四則演算値を算出し、同じ四則演算値が現れる区間の長さを第1の触質特徴量P1として算出する。また、四則演算値の多様度を第2の触質特徴量P2として算出する。このように求められる第1の触質特徴量P1は、波形情報が潜在的に持っている触感のリズムを表している。また、第2の触質特徴量P2は、波形情報が潜在的に持っている触感の多様度を表している。
 この触感のリズムおよび多様度を示唆する2種類の触質特徴量P1,P2を、非可聴音の音声波形から分割された複数の等区間ごとに算出することにより、これら複数組の触質特徴量によって非可聴音の波形情報を特徴付けることが可能である。図4および図5の分析結果は、様々なパワースポットで採取した自然音から生成した非可聴音が、触感のリズムや多様度の点で異なる特徴を有していることを示している。
 パワースポット選択部11は、所望のパワースポットをユーザに選択させる。このパワースポット選択部11は、非可聴音をユーザに選択させる非可聴音選択部に相当するものである。
 例えば、第1の音声処理装置101が図3(a)に示す第1タイプの場合、パワースポット選択部11は、非可聴音記憶部10に記憶されている複数の非可聴音に対応するパワースポットの名称をディスプレイに表示させ、その中から何れかをユーザに選択させる。ユーザは、ディスプレイに表示された複数箇所のパワースポットの名称の中から、希望するパワースポットの名称を入力デバイスを用いて選択する。
 第1の音声処理装置101が図3(b)に示す第2タイプの場合、パワースポット選択部11は、サーバ200にアクセスしてパワースポットの一覧表示を要求する。この要求を受けて、非可聴音提供部21は、非可聴音記憶部10に記憶されている複数の非可聴音に対応するパワースポットの名称を第1の音声処理装置101に提供してディスプレイに表示させる。ユーザは、ディスプレイに表示された複数箇所のパワースポットの名称の中から、希望するパワースポットの名称を入力デバイスを用いて選択する。
 非可聴音出力部12は、非可聴音記憶部10に記憶されている複数箇所のパワースポットの自然音から生成された複数の非可聴音のうち、ユーザにより選択されたパワースポットの非可聴音を空間100に出力する。例えば、第1の音声処理装置101が図3(a)に示す第1タイプの場合、非可聴音出力部12は、パワースポット選択部11により選択された非可聴音のデータを非可聴音記憶部10から取得し、第2出力デバイスから非可聴音を出力する。
 第1の音声処理装置101が図3(b)に示す第2タイプの場合、非可聴音出力部12は、パワースポット選択部11により選択された非可聴音の取得をサーバ200に要求する。この要求を受けて、非可聴音提供部21は、対応する非可聴音のデータを非可聴音記憶部10から取得し、第1の音声処理装置101に送信する。非可聴音出力部12は、サーバ200から送信された非可聴音のデータを受信して、第2出力デバイスから非可聴音を出力する。
 以上詳しく説明したように、本実施形態では、可聴周波数帯域の音声である可聴音が存在する空間100に対して、パワースポットの自然音から生成された非可聴周波数帯域の低周波音声である非可聴音を出力することにより、可聴音に対して非可聴音が適用された音場を生成するようにしている。
 このように構成した本実施形態によれば、パワースポットの自然音から生成された非可聴音が人の耳には聞こえない低周波の振動として作用し、可聴音が人の耳に聞こえる音声として作用する。パワースポットの自然音から生成された非可聴音は、大地の気がみなぎる場所に存在する振動であり、気の力(人を癒す力または活動の源となるエネルギーを与える力など)が潜在し、人の深層心理に影響を与える深層振動と言える。本実施形態によれば、このような深層振動と可聴音とにより音場が生成されることにより、可聴音による聴覚的効果と気の力が潜在する深層振動による触覚的効果との相乗効果を有する音場を提供することができる。
 なお、上記実施形態では、第2の音声処理装置102によって可聴音を空間100に出力する例について説明したが、本発明はこれに限定されない。例えば、第2の音声処理装置102は設けず、人の会話、ペットの鳴き声、風や山川草木等の自然の音、調理音やものづくりをするときの工作音など、自然音が存在する空間100に対して、第1の音声処理装置101から非可聴音を出力するようにしてもよい。
 また、可聴音として、パワースポットの自然音を用いるようにすることも可能である。この場合、ユーザは、パワースポットの自然音を耳から受けると同時に、パワースポットの深層振動を身体で受けることができる。これにより、パワースポット以外の場所で、あたかもパワースポットにいるようなリアルな体験を楽しむことができる。音声を聞くと同時に、パワースポットで撮影した映像を観ることにより、パワースポットでの感動的な体験を遠隔地に居ながら得ることも可能である。
 また、上記実施形態では、パワースポットを選択することを通じて非可聴音を選択する例について説明したが、これに限定されない。例えば、第1の触質特徴量P1が示唆する触質のリズムと、第2の触質特徴量P2が示唆する触質の多様度との組み合わせをユーザが選択できるようにして、選択された組み合わせに応じた非可聴音を選択するようにしてもよい。ここで、選択された組み合わせに応じた非可聴音が複数ある場合はそれらをリスト表示し、その中から何れかをユーザが選択するようにしてもよい。あるいは、触質のリズムと多様度とに基づいて任意のネーミングを行い、そのネーミングをディスプレイに表示してユーザに選択させるようにしてもよい。その他、これ以外の方法で非可聴音を選択するようにしてもよい。
 また、上記実施形態では、パワースポットにおいて採取した自然音から40Hz以下の低周波音声を抽出して非可聴音を生成する例について説明したが、非可聴音はこのようなものに限定されない。例えば、非可聴音は、パワースポットの自然音に含まれる低周波音声を模擬するように生成された人工音の低周波音声であってもよい。例えば、イコライザ等の音響機器を用いて、40Hzより大きい周波数帯域では音圧をゼロとし、40Hz以下の周波数帯域ではスペクトル波形がパワースポットにおいて採取した自然音のスペクトル波形と同等となるように音圧を調整することにより、パワースポットの低周波音声を模擬した非可聴音を生成することが可能である。
 また、上記実施形態では、第1の音声処理装置101から非可聴音を出力し、第2の音声処理装置102から可聴音を出力する例について説明したが、本発明はこれに限定されない。例えば、図6に示すように、第1の音声処理装置101に代えて音響コンテンツ出力装置103を備え、可聴音と非可聴音とをミキシングすることによって生成された、可聴音の周波数の性質と非可聴音の周波数の性質とを有する波形の融合音である音響コンテンツを空間100に出力するようにしてもよい。
 音響コンテンツ出力装置103は、キーボードやマウス、タッチパネル等の入力デバイスと、ディスプレイ等の第1出力デバイスと、音声(振動)を出力するスピーカまたは振動呈示機構等の第2出力デバイスとを備えた端末、またはこれらのデバイスを接続可能な端末であり、例えばスマートフォン、タブレット、パーソナルコンピュータ、テレビ、オーディオ装置などにより構成される。
 図6に示す例において、第2の音声処理装置102を備えることは必須ではなく、自然音が存在する空間100に対して、音響コンテンツ出力装置103から音響コンテンツを出力するようにすることが可能である。図6に示すように、人は、音響コンテンツ出力装置103から出力された音響コンテンツにおける可聴音の成分を耳から受け、音響コンテンツ出力装置103から出力された音響コンテンツにおける非可聴音の成分を深層振動として身体で受ける。
 図7は、本実施形態による音響コンテンツ出力装置103の機能構成例を示すブロック図である。ここでは2つのタイプの機能構成例を示している。図7(a)に示す第1タイプに係る音響コンテンツ出力装置103は、機能構成として、パワースポット選択部11(非可聴音選択部)、可聴音選択部13、音響コンテンツ生成部14および音響コンテンツ出力部15を備えている。また、第1タイプに係る音響コンテンツ出力装置103は、記憶媒体として、非可聴音記憶部10Aおよび可聴音記憶部10Bを備えている。
 また、図7(b)に示す第2タイプの音響コンテンツ出力装置103は、機能構成としてパワースポット選択部11、可聴音選択部13、音響コンテンツ生成部14および音響コンテンツ出力部15を備える一方、記憶媒体としての非可聴音記憶部10Aおよび可聴音記憶部10Bは備えていない。非可聴音記憶部10Aおよび可聴音記憶部10Bは、通信ネットワーク500を介して音響コンテンツ出力装置103と接続されるサーバ201が備えており、サーバ201は機能構成として非可聴音提供部21および可聴音提供部22を備えている。
 非可聴音記憶部10Aは、図3に示した非可聴音記憶部10と同様のものである。可聴音記憶部10Bは、複数の可聴音のデータを、可聴音の識別情報に関連付けて記憶する。可聴音の識別情報としては、例えば可聴音の名称を用いることが可能であるが、これに限定されない。パワースポット選択部11は、図3に示したものと同様の機能を有するものである。
 可聴音選択部13は、所望の可聴音をユーザに選択させる。例えば、音響コンテンツ出力装置103が図7(a)に示す第1タイプの場合、可聴音選択部13は、可聴音記憶部10Bに記憶されている複数の可聴音に対応する名称をディスプレイに表示させ、その中から何れかをユーザに選択させる。ユーザは、ディスプレイに表示された複数の可聴音の名称の中から、希望する可聴音の名称を入力デバイスを用いて選択する。
 音響コンテンツ出力装置103が図7(b)に示す第2タイプの場合、可聴音選択部13は、サーバ201にアクセスして可聴音の一覧表示を要求する。この要求を受けて、可聴音提供部22は、可聴音記憶部10Bに記憶されている複数の可聴音に対応する名称を音響コンテンツ出力装置103に提供してディスプレイに表示させる。ユーザは、ディスプレイに表示された複数の可聴音の名称の中から、希望する可聴音の名称を入力デバイスを用いて選択する。
 音響コンテンツ生成部14は、ユーザにより選択された可聴音と、ユーザにより選択された非可聴音とをミキシングすることにより、可聴音の周波数の性質と非可聴音の周波数の性質とを有する波形の融合音である音響コンテンツを生成する。
 例えば、音響コンテンツ出力装置103が図7(a)に示す第1タイプの場合、音響コンテンツ生成部14は、パワースポット選択部11により選択された非可聴音のデータを非可聴音記憶部10Aから取得するとともに、可聴音選択部13により選択された可聴音のデータを可聴音記憶部10Bから取得し、これらをミキシングすることによって音響コンテンツを生成する。
 音響コンテンツ出力装置103が図7(b)に示す第2タイプの場合、音響コンテンツ生成部14は、パワースポット選択部11により選択された非可聴音の取得をサーバ201に要求する。この要求を受けて、非可聴音提供部21は、対応する非可聴音のデータを非可聴音記憶部10Aから取得し、音響コンテンツ出力装置103に送信する。また、音響コンテンツ生成部14は、可聴音選択部13により選択された可聴音の取得をサーバ201に要求する。この要求を受けて、可聴音提供部22は、対応する可聴音のデータを可聴音記憶部10Bから取得し、音響コンテンツ出力装置103に送信する。音響コンテンツ生成部14は、このようにしてサーバ201から取得した非可聴音のデータと可聴音のデータとミキシングすることによって音響コンテンツを生成する。
 音響コンテンツ出力部15は、音響コンテンツ生成部14により生成された音響コンテンツを第2出力デバイスから空間100に出力する。
 図8は、可聴音と非可聴音との融合音である音響コンテンツの生成方法を説明するための図である。図9は、可聴音と非可聴音(深層振動)との融合について説明するための図である。図8(a)に示す可聴音と図8(b)に示す非可聴音とをミキシングすることにより、図8(c)に示すような融合音の音響コンテンツを生成することが可能である。融合音の音響コンテンツは、可聴音の高周波成分を有しながら、ミキシングされる低周波の非可聴音によって全体的なエンベロープが形成された音声情報である。言い換えると、融合音の音響コンテンツは、非可聴音による低周波のエンベロープ波形に沿って可聴音の高周波成分が重畳した音声情報であり、可聴音の周波数の性質と非可聴音の周波数の性質とを有する波形の音声と言える。
 ここで、図9に示すように、非可聴音を含むパワースポットの自然音と可聴音とをミキシングするようにしてもよい。この場合、非可聴音の音圧と可聴音の音量とを適切に調整して融合音を生成することにより、図9に示すように、パワースポットの自然音から発生する倍音が可聴音に付加され、可聴音の音質がクリアで豊かになる。また、低周波音のエネルギーを利用して可聴音を遠くまで伝達することが可能となる。これを利用して、防災音声をより遠くまで届けたり、コンサート会場で演奏音や歌唱音を聴者に対してより強く響くように届けたりすることが可能である。
 なお、非可聴音の音圧を可聴音の音量よりも大きくすることにより、可聴音の音声(例えば、環境ノイズ)を消す(非可聴化する)ことが可能である(非可聴音が可聴音をマスクすることによる消音)。
 可聴音に融合する非可聴音の音圧が小さい場合は、非可聴音を加えた後の融合音は全体的にレベルが下がり、いわゆるサウンドマスキングが生じる。これに対し、非可聴音の音圧を上げていくと、非可聴音が融合音の全体の音圧を上げて、可聴音に倍音が加えられて音がクリアになる。さらに非可聴音の音圧を上げて、非可聴音の音圧が可聴音の音量より大きくなると、非可聴音によって可聴音が完全にマスキングされるので、無音化する。このようなことが可能なのは、非可聴音だからである。
 ここでは、音響コンテンツ出力装置103において可聴音と非可聴音とをミキシングすることによって融合音の音響コンテンツを生成し、生成した音響コンテンツを出力する例について説明したが、この構成に限定されない。例えば、図10に示すように、音響コンテンツ出力装置103’の内部で音響コンテンツを生成するのではなく、あらかじめ生成した音響コンテンツを音響コンテンツ出力装置103’の音響コンテンツ記憶部10Cまたはサーバ201’の音響コンテンツ記憶部10Cに記憶しておき、音響コンテンツ選択部16を通じてユーザにより選択された音響コンテンツを音響コンテンツ出力部17が音響コンテンツ記憶部10Cから取得して出力するようにしてもよい。
 また、上記実施形態では、図8に示したように、可聴音と非可聴音とをミキシングすることによって融合音の音響コンテンツを生成する例について説明したが、本発明はこれに限定されない。例えば、図11に示すように、可聴周波数帯域の音声である可聴音の音圧または振幅を加工することにより、加工後の音声のエンベロープ波形により規定される周波数が非可聴周波数帯域の周波数となるようにして音響コンテンツを生成するようにしてもよい。そして、図10と同様に、以上のようにしてあらかじめ生成した音響コンテンツを音響コンテンツ出力装置103’の音響コンテンツ記憶部10Cまたはサーバ201’の音響コンテンツ記憶部10Cに記憶しておき、音響コンテンツ選択部16を通じてユーザにより選択された音響コンテンツを音響コンテンツ出力部17が音響コンテンツ記憶部10Cから取得して出力するようにしてもよい。
 その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
 10,10A 非可聴音記憶部
 10B 可聴音記憶部
 10C 音響コンテンツ記憶部
 11 パワースポット選択部(非可聴音選択部)
 12 非可聴音出力部
 13 可聴音選択部
 14 音響コンテンツ生成部
 15 音響コンテンツ出力部
 16 音響コンテンツ選択部
 17 音響コンテンツ出力部
 100 空間
 101 第1の音声処理装置(音声処理装置)
 102 第2の音声処理装置
 103,103’ 音響コンテンツ出力装置

Claims (24)

  1.  可聴周波数帯域の音声である可聴音が存在する空間に対して、ユーザにより選択された非可聴周波数帯域の低周波音声である非可聴音または当該非可聴音の周波数の性質を有する波形の音声を出力することにより、上記可聴音に対して上記非可聴音が適用された音場を生成することを特徴とする音場生成システム。
  2.  上記非可聴音を上記空間に出力する音声処理装置を備えたことを特徴とする請求項1に記載の音場生成システム。
  3.  上記可聴音を上記空間に出力する第2の音声処理装置を更に備えたことを特徴とする請求項2に記載の音場生成システム。
  4.  上記音声処理装置は、
     上記非可聴音をユーザに選択させる非可聴音選択部と、
     上記ユーザにより選択された上記非可聴音を上記空間に出力する非可聴音出力部とを備えた
    ことを特徴とする請求項2または3に記載の音場生成システム。
  5.  上記可聴音と上記非可聴音とをミキシングすることによって生成された、上記可聴音の周波数の性質と上記非可聴音の周波数の性質とを有する波形の融合音である音響コンテンツを上記空間に出力する音響コンテンツ出力装置を備えた
    ことを特徴とする請求項1に記載の音場生成システム。
  6.  上記音響コンテンツ出力装置は、
     上記可聴音をユーザに選択させる可聴音選択部と、
     上記非可聴音をユーザに選択させる非可聴音選択部と、
     上記ユーザにより選択された上記可聴音と、上記ユーザにより選択された上記非可聴音とをミキシングすることにより、上記音響コンテンツを生成する音響コンテンツ生成部と、
     上記音響コンテンツ生成部により生成された上記音響コンテンツを上記空間に出力する音響コンテンツ出力部とを備えた
    ことを特徴とする請求項5に記載の音場生成システム。
  7.  上記音響コンテンツ生成部は、上記非可聴音を含むパワースポットの自然音と上記可聴音とをミキシングし、その際に上記非可聴音の音圧と上記可聴音の音量とを調整して上記融合音の音響コンテンツを生成することを特徴とする請求項6に記載の音場生成システム。
  8.  上記音響コンテンツをユーザに選択させる音響コンテンツ選択部と、
     上記ユーザにより選択された上記音響コンテンツを上記空間に出力する音響コンテンツ出力部とを備えた
    ことを特徴とする請求項5に記載の音場生成システム。
  9.  上記非可聴音は、パワースポットの自然音から生成された低周波音声であることを特徴とする請求項1~8の何れか1項に記載の音場生成システム。
  10.  上記非可聴音は、パワースポットの自然音に含まれる低周波音声を模擬するように生成された人工音の低周波音声であることを特徴とする請求項1~8の何れか1項に記載の音場生成システム。
  11.  上記非可聴音は、40Hz以下の低周波音声であることを特徴とする請求項1~10の何れか1項に記載の音場生成システム。
  12.  上記非可聴音は、上記パワースポットの自然音から抽出した40Hz以下の低周波音声または当該低周波音声に対して周波数の変化を伴わない加工を施した低周波音声であることを特徴とする請求項9の何れか1項に記載の音場生成システム。
  13.  上記可聴音の音圧または振幅が加工されて、加工後の音声のエンベロープ波形により規定される周波数が非可聴周波数帯域の周波数となるように生成された、上記可聴音の周波数の性質と上記非可聴音の周波数の性質とを有する波形の音響コンテンツを上記空間に出力する音響コンテンツ出力装置を備えた
    ことを特徴とする請求項1に記載の音場生成システム。
  14.  上記音響コンテンツをユーザに選択させる音響コンテンツ選択部と、
     上記ユーザにより選択された上記音響コンテンツを上記空間に出力する音響コンテンツ出力部とを備えた
    ことを特徴とする請求項13に記載の音場生成システム。
  15.  非可聴周波数帯域の低周波音声である非可聴音をユーザに選択させる非可聴音選択部と、
     上記ユーザにより選択された上記非可聴音を、可聴周波数帯域の音声である可聴音が存在する空間に出力する非可聴音出力部とを備えた
    ことを特徴とする音声処理装置。
  16.  可聴周波数帯域の音声である可聴音を上記ユーザに選択させる可聴音選択部と、
     上記ユーザにより選択された上記可聴音と、上記ユーザにより選択された上記非可聴音とをミキシングすることにより、上記可聴音の周波数の性質と上記非可聴音の周波数の性質とを有する波形の融合音である音響コンテンツを生成する音響コンテンツ生成部とを更に備え、
     上記音響コンテンツ生成部により生成された上記音響コンテンツを上記空間に出力する音響コンテンツ出力部を上記非可聴音出力部に代えて備えた
    ことを特徴とする請求項15に記載の音声処理装置。
  17.  可聴周波数帯域の音声である可聴音と、非可聴周波数帯域の低周波音声である非可聴音とがミキシングされて成る、上記可聴音の周波数の性質と上記非可聴音の周波数の性質とを有する波形の融合音である音響コンテンツをユーザに選択させる音響コンテンツ選択部と、
     上記ユーザにより選択された上記音響コンテンツを、上記可聴音が存在する空間に出力する音響コンテンツ出力部とを備えた
    ことを特徴とする音声処理装置。
  18.  上記非可聴音は、パワースポットの自然音から生成された低周波音声であることを特徴とする請求項15~17の何れか1項に記載の音声処理装置。
  19.  上記非可聴音は、パワースポットの自然音に含まれる低周波音声を模擬するように生成された人工音の低周波音声であることを特徴とする請求項15~17の何れか1項に記載の音声処理装置。
  20.  可聴周波数帯域の音声である可聴音の周波数の性質と非可聴周波数帯域の低周波音声である非可聴音の周波数の性質とを有する波形の音響コンテンツをユーザに選択させる音響コンテンツ選択部と、
     上記ユーザにより選択された上記音響コンテンツを、上記可聴音が存在する空間に出力する音響コンテンツ出力部とを備え、
     上記音響コンテンツは、上記可聴音の音圧または振幅が加工されて、加工後の音声のエンベロープ波形により規定される周波数が上記非可聴音の周波数となるように生成された音声である
    ことを特徴とする音声処理装置。
  21.  コンピュータの非可聴音選択部が、非可聴周波数帯域の低周波音声である非可聴音をユーザに選択させる非可聴音選択ステップと、
     上記コンピュータの非可聴音出力部が、上記ユーザにより選択された上記非可聴音を、可聴周波数帯域の音声である可聴音が存在する空間に出力する非可聴音出力ステップとを有する
    ことを特徴とする音声処理方法。
  22.  上記コンピュータの可聴音選択部が、可聴周波数帯域の音声である可聴音を上記ユーザに選択させる可聴音選択ステップと、
     上記コンピュータの音響コンテンツ生成部が、上記ユーザにより選択された上記可聴音と、上記ユーザにより選択された上記非可聴音とをミキシングすることにより、上記可聴音の周波数の性質と上記非可聴音の周波数の性質とを有する波形の融合音である音響コンテンツを生成する音響コンテンツ生成ステップとを更に有し、
     上記音響コンテンツ生成部により生成された上記音響コンテンツを上記空間に出力する音響コンテンツ出力ステップを上記非可聴音出力ステップに代えて有する
    ことを特徴とする請求項21に記載の音声処理方法。
  23.  コンピュータの音響コンテンツ選択部が、可聴周波数帯域の音声である可聴音と、非可聴周波数帯域の低周波音声である非可聴音とがミキシングされて成る、上記可聴音の周波数の性質と上記非可聴音の周波数の性質とを有する波形の融合音である音響コンテンツをユーザに選択させる音響コンテンツ選択ステップと、
     上記コンピュータの音響コンテンツ出力部が、上記ユーザにより選択された上記音響コンテンツを、上記可聴音が存在する空間に出力する音響コンテンツ出力ステップとを有する
    ことを特徴とする音声処理方法。
  24.  コンピュータの音響コンテンツ選択部が、可聴周波数帯域の音声である可聴音の周波数の性質と非可聴周波数帯域の低周波音声である非可聴音の周波数の性質とを有する波形の音響コンテンツをユーザに選択させる音響コンテンツ選択ステップと、
     上記コンピュータの音響コンテンツ出力部が、上記ユーザにより選択された上記音響コンテンツを、上記可聴音が存在する空間に出力する音響コンテンツ出力ステップとを有し、
     上記音響コンテンツは、上記可聴音の音圧または振幅が加工されて、加工後の音声のエンベロープ波形により規定される周波数が上記非可聴音の周波数となるように生成された音声である
    ことを特徴とする音声処理方法。
     
PCT/JP2020/043951 2019-12-04 2020-11-26 音場生成システム、音声処理装置および音声処理方法 WO2021111965A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-219466 2019-12-04
JP2019219466A JP2023027416A (ja) 2019-12-04 2019-12-04 音声処理装置、音声処理方法および音声処理用プログラム

Publications (1)

Publication Number Publication Date
WO2021111965A1 true WO2021111965A1 (ja) 2021-06-10

Family

ID=76221084

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/043951 WO2021111965A1 (ja) 2019-12-04 2020-11-26 音場生成システム、音声処理装置および音声処理方法

Country Status (2)

Country Link
JP (1) JP2023027416A (ja)
WO (1) WO2021111965A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001086580A (ja) * 1999-09-14 2001-03-30 Akuubu Lab:Kk 振動音楽の表現方法及びその装置
US20070110253A1 (en) * 1996-08-30 2007-05-17 Anderson Troy G Customizability Digital Sound Relaxation System
JP2010532181A (ja) * 2007-06-18 2010-10-07 サイラー・ブロック 振動履物装置及び振動履物装置と共に使用するエンタテインメントシステム
JP2013215587A (ja) * 2007-12-28 2013-10-24 Hamamatsu Photonics Kk 音響再生装置
JP2019016915A (ja) * 2017-07-06 2019-01-31 株式会社伊川総合研究所 音声発生装置
WO2020080204A1 (ja) * 2018-10-19 2020-04-23 株式会社ティーオースウィング 音響コンテンツ生成装置、音響コンテンツ生成方法、音響コンテンツ再生装置、音響コンテンツ再生方法、音響コンテンツ再生用プログラム、音響コンテンツ提供装置および音響コンテンツ配信システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070110253A1 (en) * 1996-08-30 2007-05-17 Anderson Troy G Customizability Digital Sound Relaxation System
JP2001086580A (ja) * 1999-09-14 2001-03-30 Akuubu Lab:Kk 振動音楽の表現方法及びその装置
JP2010532181A (ja) * 2007-06-18 2010-10-07 サイラー・ブロック 振動履物装置及び振動履物装置と共に使用するエンタテインメントシステム
JP2013215587A (ja) * 2007-12-28 2013-10-24 Hamamatsu Photonics Kk 音響再生装置
JP2019016915A (ja) * 2017-07-06 2019-01-31 株式会社伊川総合研究所 音声発生装置
WO2020080204A1 (ja) * 2018-10-19 2020-04-23 株式会社ティーオースウィング 音響コンテンツ生成装置、音響コンテンツ生成方法、音響コンテンツ再生装置、音響コンテンツ再生方法、音響コンテンツ再生用プログラム、音響コンテンツ提供装置および音響コンテンツ配信システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKE OUT SWING INC., 20 October 2020 (2020-10-20), Retrieved from the Internet <URL:http://web.archive.org/web/20201020062038/https://www.gsound.co> [retrieved on 20201216] *

Also Published As

Publication number Publication date
JP2023027416A (ja) 2023-03-02

Similar Documents

Publication Publication Date Title
US11503421B2 (en) Systems and methods for processing audio signals based on user device parameters
Toole Sound reproduction: The acoustics and psychoacoustics of loudspeakers and rooms
US7725203B2 (en) Enhancing perceptions of the sensory content of audio and audio-visual media
Zacharov Sensory evaluation of sound
Merchel et al. The influence of vibrations on musical experience
CN102754148A (zh) 用于选择性的声音消除的方法,系统以及项目
JP6246922B2 (ja) 音響信号処理方法
CN109565632A (zh) 有源监听耳机及其校准方法
CN109565633A (zh) 有源监听耳机及其双声道方法
CN109155895A (zh) 有源监听耳机及用于正则化其反演的方法
Tahmasebi et al. Design and evaluation of a real-time audio source separation algorithm to remix music for cochlear implant users
Schoeffler et al. On the validity of virtual reality-based auditory experiments: a case study about ratings of the overall listening experience
Ehret et al. Evaluating the influence of phoneme-dependent dynamic speaker directivity of embodied conversational agents' speech
Mengual et al. Modal synthesis of weapon sounds
JP2006509439A (ja) パーソナライズされたサラウンドサウンドヘッドホンシステム
JP7347421B2 (ja) 情報処理装置、情報処理方法及びプログラム
WO2021111965A1 (ja) 音場生成システム、音声処理装置および音声処理方法
CN111128208B (zh) 一种便携式激励器
Tatlow Authenticity in sound design for virtual reality
Jenny et al. Can I trust my ears in VR? Literature review of head-related transfer functions and valuation methods with descriptive attributes in virtual reality
WO2020080204A1 (ja) 音響コンテンツ生成装置、音響コンテンツ生成方法、音響コンテンツ再生装置、音響コンテンツ再生方法、音響コンテンツ再生用プログラム、音響コンテンツ提供装置および音響コンテンツ配信システム
Coker et al. A survey on virtual bass enhancement for active noise cancelling headphones
US20200258493A1 (en) Binaural recording-based demonstration of wearable audio device functions
Rumsey Audio in multimodal applications
Zagorski-Thomas et al. Recorded music

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20895818

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 02.09.2022)

NENP Non-entry into the national phase

Ref country code: JP

NENP Non-entry into the national phase

Ref country code: JP

122 Ep: pct application non-entry in european phase

Ref document number: 20895818

Country of ref document: EP

Kind code of ref document: A1