JP7179250B1

JP7179250B1 - 音質生成手段と音響データ生成手段

Info

Publication number: JP7179250B1
Application number: JP2022103159A
Authority: JP
Inventors: 裕児玉; 純一角元
Original assignee: Individual
Current assignee: Individual
Priority date: 2022-06-28
Filing date: 2022-06-28
Publication date: 2022-11-29
Anticipated expiration: 2042-06-28
Also published as: JP2024003855A

Abstract

【課題】音質を抽出する部分は複雑で制限された環境にある。意図する音質を自在に表現することは技術的にも簡単ではない。特に、音質仕上げの段階では、様々な要因による妥協点探りの状態に陥る。【解決手段】音質作りの工程で、フィルターの設計やパラメータの選択に依存することなく、一単位毎の音響データに関し、あらかじめ複数の音質成分を抽出したデータを用意しておく。一つの音響データの音質成分のデータのそれぞれに特定の係数を乗じ、加算して目的とする音質の音響データを合成する。【選択図】図１

Description

ディジタル音響信号処理技術
人の聴感、聴感を表現する言葉、言葉に対応する信号処理機能、それらの関係の曖昧さ
スマートフォンの音響信号処理環境
インターネット通信環境
仮想空間と呼ばれる分野の音質の表現技術

請求項の用語を適用する。
ＡＰＫはアプリケーションプログラムのこととする。

背景技術との関連事項１、
音質評価は感性に依存する。感性は評価する人によって異なる。純粋に理論に基づく計算処理を人の感性に合わせて仕上げる作業は技術担当者泣かせである。
感性による音質の評価に関して、客観的な数値で表現することには限界があることから、多くの現状は、熟練者の感性によって音質が決定される。
商品の生産を担当するマニファクチャーでは、ターゲットとする市場の商品との比較に
よって自社商品の音質をターゲット商品ン合わせて仕上げるというケースは少なくない。

背景技術との関連事項２、
人の音質に関する感性に照らして商品を企画開発する工程、特にＡＰＫ開発業務に関し、高度な音響信号処理の技術者を投入しなくても済む、という環境の整備は、業界関係者の潜在ニーズでもある。

独立した音質成分の加算による音質生成が可能であることは公知である。
しかし、この手法を使うと、フィルターの設計が、通常の参考書に説明されているフィルターとは微妙に違う性質を持つ。複数のフィルターの出力が加算されるので、最終出力を計算式で表現すると解かりにくいという側面もある。
一般には使われていない手法である。
取り上げる文献は特に無い。

請求項で定義された用語については以下の説明でも同様であるものとする。

次の第１と第２の課題がある。
第１の課題は、
納得できる音質への仕上げの際、
カットアンドトライに頼らざるを得ないケースが多く、正確な工程見積もりが難しい。
信号処理の目的が人の感性を対象とすることから、
音質評価の基準の設定と結果の評価のバラツキへの対処が容易なプログラミング技術や
ＧＵＩの設計やパラメータのバリエーションの選択手法、等に熟練を要する。

第２の課題は、
近年、AVコンテンツの表現が多様になっている。映像は、非線型処理を
作用させることで映像効果を表現することは全く問題ない。音響は極めて特殊な場合を除いて線型処理でなければならない。線型信号処理であることの必要条件は、
信号処理やそのプログラミング手法に制限が伴う。
さらに視覚と違って、感性の個人差や仕事に携わるメンバー間での正確な評価の共有が
難しい。多様なコンテンツ表現に対応して、その都度、信号処理に手を加えることは面倒でもある。

本案の本質は、音質仕上げの工程を、独立した二つの仕事に分業させるところにある。
複数種類の元音響データに関わる音質成分の抽出手段をあらかじめ用意しておく。
この仕事は、音響信号処理のスキルの高い者が担当する。音質成分の抽出の手段は
音響データ全般に共通であることから音質名称を付けて標準化、共通化が可能である。
用意された音質成分を組み合わせることで目的とする音質を仕上げる。
音質成分の抽出手段によって抽出された音質成分のデータを組み合わせる、という簡単な手法で目的の音質を作ることができる。
あるいは、リスナーが好む音質選択に委ねることもできる。

本案発明は、手間暇がかからず、簡素にもかかわらず、音質名称と感覚との乖離が少なく、高度な音質表現と高い自由度の音質生成環境を提供できる。
第１の課題に関しては、
通常のプログラマーであれば誰でも記述できる程度に簡単で簡素にもかかわらず、
作ろうとする音質のイメージに合わせて高度な音質制御の仕組みを設計できる。
音質の調節に伴うフィルター自身の発振や、計算行程のダイナミックレンジオーバーなど、
不安定な現象は皆無であり、調節時のノイズ発生に関しては係数のスムーシング処理が必要なだけである。極めて使い安い。
第２の課題に関しては、
音質の制御軸が感性と一致していて、その軸上の強度の調節が係数の調節に対応している、という理由により、音質評価に携わるメンバー間での、実態と評価の共有度が高い。

請求項１の一実施例と応用例について、データの流れを示すブロック図請求項１の係数セットを使っての音質選択と決定の実施例請求項２の低音成分抽出手段の一実施例のゲイン位相特性請求項２の高音成分抽出手段の一実施例のゲイン位相特性請求項２の低音と高音の成分抽出手段による一実施例の再生音データの総合特性請求項３の明瞭成分均一化データを得る手段の一例のブロック図請求項３の抽出フィルターの一実施例のゲイン位相特性請求項３の明瞭成分均一化手段による一実施例の明瞭度改善効果

再生音データGh(t) の生成
人の音質感覚に馴染みやすい音質表現のＧＵＩと成分データFk{S(t)} の生成
複数の、成分データFk{S(t)} と係数データHk(t) からなる音響データの生成
音質名称nameh と再生音データGh(t) のセットからなる音響データの生成

音質を表現する仕組みの標準化、規格化
音質成分の抽出アルゴリズムのライブラリ化
通常のプログラミング技術のスキルで高度な音質仕上げが可能

以下は図面を用いての請求項の捕捉説明である。
図１は請求項１の一実施例と応用例について、データの流れを示すブロック図である。
成分係数セットHk(t) を使っての音質選択の実施例と応用例である。
S(t) は元音響データ、Gh(t) は成分係数セットが H の場合の再生音データ、
Fk{} k=1,2,,,n は各音質成分を抽出する抽出フィルター
Fk{S(t)} k=0,1,2,,,n は元音響データの各音質成分、但し、F0{S(t)}=S(t)} とする。
Hk(t) k=0,1,2,,,n は音質生成に使われる成分係数セット、
Hk*Fk{S(t)} k=0,1,2,,,n は音質の合成使われる各音質成分、
SV はサーバー、 Ga(t),Gb(t),Gc(t) は成分係数セット H がそれぞれ A,B,C である場合の再生に供せられる再生音データセット、
TH はリスナーの端末器、Ａ、Ｂ、Ｃは端末器側が選択する音質の種類、である。
Gh(t)=Σ{Hk(t)*Fk{S(t)} k=0,1,2,,,n
は成分係数セットが H の場合の再生データ、
Ga(t)=Σ{Hak(t)*Fk{S(t))}、Gb(t)=Σ{Hbk(t)*Fk{S(t))}、Gc(t)=Σ{Hck(t)*Fk{S(t))} k=0,1,2,,,n
は成分係数セットがそれぞれＡ、Ｂ、Ｃの場合の再生データである。

図１では、
複数の音質成分はあらかじめ用意されていて、
それぞれの音質成分ごとに係数があって、
それぞれの音質成分ごとに係数を決めることで全体の音質を決定する場合の
実施例と応用例を示すブロック図である。
成分データはあらかじめ抽出され、保管データとして存在するものとする。
目的の音質合成が、音質成分に係数を乗じたデータの加算によって合成されることから、音質表現は直感的であり、構造が簡素である。
それぞれの音質成分について、音質の抽出フィルターの、種類やパラメータは固定であることから音質変更に伴うところのフィルター内部の不安定動作、ノイズの発生、
オーバーダイナミックレンジの対策を必要としない。それぞれの音質成分に
それぞれの係数を乗ずる計算処理だけなので、動的な音質可変が極めて容易である。

図２は、請求項１の音質データセットと成分係数セットを使っての、音質の選択と決定の実施例の説明図である。
成分データの各音質成分は、元音響データの供給側と第三者のいずれかによって作られる。
そして、音質選択は音響データを作る側、第三者、リスナーのいずれかによる。
図２による音質の決定方法は、関係者間で音質名と実質効果と感覚評価の一致度が高い。
音質は、独立した音質軸の選択とその大きさの組合せで表現できる。
Namek k=0,1,2,,,n は音質 Fk{S(t)} の名称、
Hk(t) k=0,1,2,,,n は音質生成に使われる成分係数セット、
Vk(t) k=0,1,2,,,n はそれぞれの成分係数の値
である
図２（ａ）は、音質成分の強度を音質軸の長さとする音質選択ＧＵＩの一例である。
図２（ｂ）は、音質成分の強度を音質軸の長さとする音質選択ＧＵＩの一例である。
図２（ｃ）は、音質成分の強度を横位置に対応させる音質選択ＧＵＩの一例である。
図２（ｄ）は、音質成分の強度を数値に対応させる音質選択ＧＵＩの一例である。
図２（ａ）、（ｂ）、（Ｃ）、（ｄ）それぞれの音質選択ＧＵＩの表現方法は異なるが、
名称付けられた、個々の音質の強度を決める仕組みは共通である。
請求項１の音質生成方法は、一般に用いられる音質調整卓のような帯域フィルターの組合せによる方法と比べ、音質の表現と感覚の一致度が高い。このことは音質設計が、強度を選択された各種音質成分を加算合成することで叶うところにある。
そして、音質を設計する側、評価する側、利用する側、のそれぞれが図２の例に示す音質表現によって、表現と感覚の共有度と一致度を高めることが容易であることを示す。
結果、音質成分の抽出アルゴリズムとソフトウェアの生成手段と供給手段の標準化と
音質の選択と決定手段の標準化と評価に関しての標準化が可能となる。

図３は、請求項２の低音成分抽出手段の一実施例の特性である。
図４は、請求項２の高音成分抽出手段の一実施例の特性である。
図３と図4は低音と高音の違いであるので（）内を図４高音の説明とする。
抽出フィルターそのものは公知であるが、
請求項１の音質成分の生成手段とすることが請求項２の本質である。
低音(高音)成分抽出手段は、請求項１に記述の音質成分の一つであって、元音響データが楽曲である場合の最も重要な成分である。本案に供せられる音質成分は請求項１に記述の
音質効果の有効帯域で、元音響データに対し同相または逆相の関係になければならない。
特に、低音（高音）の音質効果のボーカル帯域への影響は、
低音（高音）域とボーカル域の音質のトレードオフ関係を生むことになり、音質仕上げ段階での妥協を迫られことから、
低音（高音）であっても、ボーカル帯域には感覚に影響を与えないようなフィルターが望ましい。
請求項２に記述の２次高域（低域）遮断フィルターは図３（図４）の特性を持つ。
これらは最も単純な公知のフィルターの一種である。
この特性は超低音（超高音）領域で高いゲインを確保しても、ボーカル帯域には強度にも位相にも与える影響は極めて小さい。なおかつ、全帯域で極を持たないので、音質に癖がなく、請求項１に供する最適フィルターの一つである。
2nd Low(High) Pass Gain はグラフが周波数ゲイン特性であること、
2nd Low(High) Pass Phase はグラフが周波数位相特性であることを示す。
Frequency Hz は横軸が周波数であることを示す。
Gain*30(Gain*15) は縦軸がゲインであって、抽出フィルターに、30倍(15倍)のゲインを持たせていることを示す。
70Hz(8000Hz) 上で約６倍(8倍)のゲインを持つ、この出力データを位相反転し、
元音響データに加えると、強力でも自然に感じる低音（高音）強調効果が得られる。
また、実験的にではあるが低音高音とも音源に接近したときに感じる音質となる。
Phase Degree は縦軸が度単位の位相であることを示す。

図５は、請求項２の低音と高音の成分抽出手段の組み合わせによる一実施例の総合特性であって、低音音質と高音音質の係数を変化させた場合の合成音質の周波数―ゲイン特性である。実験的に、係数の増減が音源との距離感に対応している、と感じる。
Gh(t)=H0*S(t)+H1*Low{S(t)}+H2*High{S(t)} は
元音響データH0*S(t)、低音成分H1*Low{S(t)}、高音成分H2*High{S(t)} とし、それらを加算することで全体の再生データを得ることを示す。
図５は、H0,H1,H2 が時間に関係なく固定係数の場合である。
{H0,H1,H2}={1,(30,21,15,9,6,3),(20,14,10,6,4,2}} は
H0 が1、H1とH2の組合せが (30,20),(21,14),(15,10),(9,6),(6,4),(3,2) であることを示す。Hz は横軸が周波数、dBV は縦軸の強度がデシベルであることを示す。

図６は、請求項３の明瞭成分均一化データを得る手段の一例のブロック図である。
フィルター Band1{}, Band2{}, Band3{} は公知の2次帯域フィルターであるが、
請求項１の音質成分の抽出手段することが請求項３の本質である。
明瞭成分均一化データは、請求項１に記述の音質成分の一つであって、元音響データが
アナウンスやセリフである場合の最も重要な成分である。本案に供せられる音質成分は
請求項１に記述の音質効果の有効帯域で元音響データに対し同相または逆相の関係になければならない。
S(t) は元音響データ、Element(t) は明瞭成分均一化データ、
SALC は元音響データの強度の短時間内の抑揚を均一化する強度均一化手段である。特に部分的に強度が弱い区間の強度の均一化が重要である。短時間内の抑揚とはアナウンサー
の固有の癖にありがちな、強い語尾や弱い語尾による聞き取り難さをカバーすると同時に、明瞭成分を均一化するに必要なデータの前処理でもある。
SALC{S(t)} は強度が均一化された元音響データ、強度均一化データである。
PK{SALC{S(ｔ)}} は強度均一化データの強度であって均一化データ強度である。
元音響データの強度が均一であっても明瞭成分の強度に大きな抑揚がある。明瞭成分の
抑揚は弱難聴、難聴のリスナーにとって聞き取り難さの最大の要因の一つである。
Band1,Band2,Band3 は明瞭成分の検出のための3個の抽出フィルター、
PK は音響データの強度の検出手段、
COEFF1,COEFF2,COEFF3 はリスナーが感じるアナウンスやセリフの明瞭成分の強度を一定の水準に調節する係数調節手段、
R1,R2,R3 は元音響データの強度に対し、それぞれの帯域ごとに必要な明瞭成分の
強度の比率、
R1*PK{SALC{S(t)}}*Band1{S(t)},R2*PK{SALC{{S(t)}}*Band2{S(t)},
R3*PK{SALC{S(t)}}*Band3{S(t)} は、それぞれの帯域において、必要な強度の明瞭成分、
強度が均一化された元音響データである強度均一化データの強度であるところの、
均一化データ強度 PK{SALC{S(t}} に対し、明瞭度の改善に必要なウェイト R1,R2,R3 なる値を乗じることで、目標とする水準の明瞭度の明瞭成分を得ることができる。
Element(t)=
R1*PK{SALC{S(t)}}*Band1{S(t)}+R2*PK{SALC{S(t)}}*Band2{S(t)}+
R3*PK{SALC{S(t)}}*Band3{S(t)}
は、明瞭成分が均一化されたデータであって、請求項１の音質成分の一つである。

図７は、請求項３の明瞭成分抽出フィルターの一実施例の特性である。
2nd Band Pass Gain Gain=3 1045,2080Hz,4180Hz はそれぞれの抽出フィルターの、
ゲインが３で、中心周波数が 1045,2080Hz,4180Hz の周波数－ゲイン特性であることを示す。
2nd Band Pass Phase Gain=3 1045,2080Hz,4180Hz はそれぞれの抽出フィルターの、
周波数－位相特性であることを示す。
Frequency は横軸が周波数、Gain*3 は中心周波数におけるゲインが３、
Phase Degree は縦軸の単位が度であることを示す。
これらの特性は極めて一般的な帯域フィルターである。
帯域フィルターを、複数個に分け、それぞれ、明瞭度にとって重要な特性とする。
例えば、第1フォルマントの帯域の強度に対し第３フォルマントの帯域の強度が弱いと、
第３フォルマントの帯域を補強することで明瞭度は改善される。
さらに、弱難聴と難聴では必要な明瞭成分の配分と強度に違いがあることから、
供給側は用途に応じたデータを供給することで、リスナーの選択に委ねることができる。

図８は、請求項３の明瞭成分均一化手段を使っての合成音質の効果の一例である。
図８（ａ）は、弱難聴者にとって聞き取り難い、
ナウンスの場合の、抽出明瞭成分の強度の一例のグラフである。
横軸は時間、縦軸は振幅である。難聴に自覚あるケースでは、聞き取りに
必要な明瞭成分の強度は一例として Required Clearness にある。この強度を満足する回数は２回である。明瞭成分は元音響データの強度とは一般的には必ずしも相関を持たない。訓練されたアナウンサーによる明瞭度は一様に近い。
同時通訳者の場合、声の抑揚が変化するケースは少なくない。
音量が放送設備によって均一に保たれても明瞭度は極度に頻繁に変動する。

図８（ｂ）は、
図８(a)の変動する明瞭成分を図６の手法による一実施例を使って均一化したデータの
明瞭成分の強度である。 Required Clearness を満足する回数を正確に数えることは
難しいが、図８（ａ）に比べ大幅に改善されていることがわかる。
実際、図（ａ）と図（ｂ）の再生アナウンスを聞き比べると明瞭度の改善効果は著しい。

図８（ｃ）は、図８（ａ）と図８（ｂ）の明瞭成分のスペクトラム強度の比較を示す。
Not Needed Element for Clearness は明瞭度にとって不必要な帯域の成分、
Needed Element for Clearness は明瞭度にとって必要な帯域の成分である。
Original は図（ａ）の明瞭成分、Improved は図（ｂ）の明瞭成分である。
明瞭度にとって不要な帯域、例えばピッチに相当する部分の強度は減衰され、
有用なフォルマント帯域の抑揚は均一化され、補正され、そして強調される。
時系列の強度とスペクトラムの強度バランスが均一化されていることから明瞭成分の強調によって音量ばかり大きくなって不快感が強調されることはない。
図６のブロック図を図８の結果が得られる実働のＡＰＫに仕上げる作業は、
高度な信号処理のスキルを必要とする。めんどうなＡＰＫの製作にマンパワーを割くことなく、完成された、この種類の信号処理手段による抽出された成分データと音質合成手段を組合せることが請求項３の本質である。

請求項１の捕捉説明
本案の本質は、音質を作る工程の分業化を可能ならしめるところの信号生成手段にある。
分業とは、それぞれの音質成分を作る複雑な作業工程と
前もって準備された音質成分を組み合わせる簡素な作業で全体の音質を仕上げる工程と
に分けることである。
音質成分を抽出するＡＰＫの供給側は完成度の高い音質成分抽出ＡＰＫを供給する。
音質の供給側は、既に準備されている音質成分抽出ＡＰＫが抽出する音質成分を組み合わせて、一種類または複数種類の供給音響データをリスナーに供給する。
リスナーから見れば、音質が一種類であれば、供給された音質を無条件に選択、
ネーミングされた複数の音質が提供されていれば、その内のいずれかを選択する。

請求項２の捕捉説明
音質作りの最も基本は低音と高音である。
低音に関しては、１次の高域遮断をカスケードに接続した２次の高域遮断フィルター、
高音に関しては、１次の低域遮断をカスケードに接続した２次の低域遮断フィルター、
を音質成分抽出フィルターとする方法は最適な方法の一つである。
これらのフィルターそのものは公知であるが、図１の手法にこれらのフィルターを使うことが請求項２の本質である。

請求項３の捕捉説明
音質作りにとって、アナウンスやセリフの明瞭化は重要である。
メッセージを伝える声の音質成分の内、ピッチ成分は不要、フォルマント帯域を主とする成分が重要である。特に、弱難聴者や難聴者にとって、明瞭成分の強度が安定していると聞き取りやすい。しかし、明瞭成分の強度の抑揚は、聞き取り難くさの要因の一つとなる。
聞き取り難いからといって全体の音量を上げると周囲に迷惑をかける。
高性能の明瞭化には複雑な信号処理を必要とするが、
複雑な信号処理を担当する作業と
高明瞭成分のデータと元音響データを組み合わせて高明瞭度の音質を作る作業と、
に分業化することで、高明瞭度の音質を提供することが容易になる。

請求項４の捕捉説明
請求項１の仕組みの内、音質成分を作る機能と作られた成分データが端末器内部に存在する状態で、端末器単独で選択した音質の再生音データを合成する。

S(t) 元音響データ
Gh(t) 成分係数セットが H の再生音データ
Fk{S(t)} k=0,1,2,,,n 音質データセット
Hk(t) k=0,1,2,,,n 成分係数セット
MIX 音質データセットの加算手段
SV サーバー
TM 端末器
Ａ、Ｂ、Ｃ音質の種類
Ga(ｔ),Gb(t),Gc(t) それぞれ音質Ａ、音質Ｂ、音質Ｃ、の音質データセット
Hak(t) k=0,1,2,,,n 音質Ａ生成用の成分係数セット
Hbk(t) k=0,1,2,,,n 音質Ｂ生成用の成分係数セット
Hck(t) k=0,1,2,,,n 音質Ｃ生成用の成分係数セット

Name0 元音響データ S(t) の音質名称
Namek k=1,2,,,n 音質成分 Fk{S(t)} の音質名称

2nd Low Pass Gain 2次低域フィルターの周波数－ゲイン特性
2nd Low Pass Phase 2次低域フィルターの周波数－位相特性
Gain*30 縦軸がゲイン、中心周波数での縦軸ゲインが30倍
Frequency Hz 横軸が周波数
Phase Degree 縦軸が位相（度）

2nd High Pass Gain 2次高域フィルターの周波数－ゲイン特性
2nd High Pass Phase 2次高域フィルターの周波数－位相特性
Gain*15 縦軸がゲイン、中心周波数での縦軸ゲインが１５倍

Gh(t)=H0*S(t)+H1*Low{S(t)}+H2*High{S(t)} 低音と高音の音質データセット
{H0,H1,H2}={1,(30,21,15,9,6,3),(20,14,10,6,4,2}} 固定の成分係数セット
Hz 横軸が周波数
dBV 縦軸がゲイン単位はデシベル

S(t) 元音響データ
SALC 強度均一化手段
SALC{S(t)} 強度均一化データ
Element(t) 明瞭成分均一化データ
PK データ強度の計算手段
Pk{SALC{S(t)}} 均一化データ強度
Band1,Band2,Band3 明瞭成分の抽出フィルター
COFF1,COFF2,COFF3 係数器
R1,R2,R3 均一化データ強度に対する抽出フィルターの出力強度の比
R1*PK{SALC{S(t)}}*Band1{S(t)}, R2*PK{SALC{S(t)}}*Band2{S(t)},
R3*PK{SALC{S(t)}}*Band3{S(t)}
それぞれの抽出フィルターの出力データの強度
Element(t)=
R1*PK{SALC{S(t)}}*Band1{S(t)}+R2*PK{SALC{S(t)}}*Band2{S(t)}+
R3*PK{SALC{S(t)}}*Band3{S(t)}
明瞭成分均一化データ

2nd Band Pass Gain Gain=3 1045Hz,2080Hz,4180Hz 記載の周波数であって
ゲインが３の３個の抽出フィルターの周波数―ゲイン特性であることを示す。
2nd Band Pass Phase Gain=3 1045,2080Hz,4180Hz 記載の周波数であって
ゲインが３の３個の抽出フィルターの周波数―位相特性であることを示す。
Gain*3 抽出フィルターの中心周波数におけるゲインが３
Frequency 周波数
Phase Degree 単位が度の位相

Clearness Element in S(t) 元音響データS(t) の明瞭成分強度特性
Required Clearness 必要な明瞭成分強度
Un-stable Clearness 抑揚が激しい明瞭成分の強度
Clearness Element in Element{S(t)} 明瞭成分の強度
Stable Clearness 抑揚が均一な明瞭成分の強度
Formant Spectrum 音声フォルマントのスペクトラム
Not Needed Element for Clearness 明瞭度にとって不必要な成分
Needed Element for Clearness 明瞭度にとって必要な成分

Claims

音信号を再生して聴く人をリスナーとし、
リスナーに供する音響データを元音響データとし、
元音響データは単一または複数の時系列データから構成されるものとし、
元音響データを S(t) とし、(t) は時系列データを意味するものとし、
音の質感の表現に対応する言葉を音質名称とし、
元音響データS(t) を元にして計算で抽出する、複数種類の音質名称に対応するところの、
特定の音質成分を Fk{S(t)} k=1,2,,,n とし、
Fk{S(t)} k=1,2,,,n とは、
F1{S(t)}, F2{S(t)},,, Fn{S(t)} なる n個の音質データとし、
音質成分を抽出する手段を音質成分抽出手段とし、
音質成分Fk{S(t)} は、元音響データS(t) との、
音質名称に対応する音質を決定する帯域における双方の関係において、
同相または逆相の関係にあるものとし、
同相とは元音響データとの位相がプラスマイナス90度の関係にあるものとし、
逆相とは元音響データとの位相が上記の同相に対し逆相の関係にあるものとし、
Fk{S(t)} k=1,2,,,n のそれぞれを、元音響データから抽出された成分データ
とし、
成分データは、ＰＣＭ形式を基準として、圧縮変換されている場合は復調された状態の
ＰＣＭ形式の時系列データとし、
F0{S(t)} を元音響データS(t) とするところの
Fk{S(t)} k=0,1,2,,,n を音質データセットとし、
音質データセットを得る手段を第１とし、
Hk(t) k=0,1,2,,,n を成分係数セットとし、
Hk(t) k=0.1.2,,,n とは
H0(t),H1(t),,,Hn(t) なる n+1個の係数とし、
成分係数セットは、
大きさが 0 を含む符号が負、正の値であって、
終始一定の係数の場合も含めて一般的には時系列変数である場合と、
があるものとし、
Hk(t)*Fk{S(t)} k=0,1,2,,,n とは、
サンプリング時刻 tj j=0,1,2,,,m における Hk(tj) と Fk{S(tj)} の積
Hk(tj)*Fk{S(tj)} であるものとし、
Gh(t)=Σ{Hk(t)*Fk{S(t))} k=0,1,2,,,n を再生音データとし、
再生音データ Gh(t) を得る手段を第２とし、
再生音データ Gh(t) の供給側と利用側の関係において、
再生音データの生成手段は，元音響データの供給側による場合と、第三者側による場合と
のいずれかであるとし、
複数種類の成分係数セットを Ha(t), Hb(t), Hc(t),,, とし、
成分係数セット Hk(t) k=0,1,2,,,n HがＡ、Ｂ、Ｃ、、、の場合の
音質データセット Gh(t) をそれぞれ
Ga(t)=Σ{Hak(t)*Fk{S(t))} k=0,1,2,,,n
Gb(t)=Σ{Hbk(t)*Fk{S(t))} k=0,1,2,,,n
Gc(t)=Σ{Hck(t)*Fk{S(t))} k=0,1,2,,,n
,,,,
とし、
H に関し、Ａ,Ｂ,Ｃ,,, なるHが持つ音質名称を、
それぞれ Namea,Nameb,Namec,,, とし、
音質名称と再生音データのセット｛Nameh,Gh(t)｝を供給することで、
リスナーが音質名称Nameh を選択し、再生音データGh(t) を利用することができる
手段を供給音響データ選択手段とし、
供給音響データ選択手段は、再生音データGh(t) が一種類の場合も含むものとし、
供給音響データ選択手段を第３とし、
第１と第２と第３を有する音響データの生成手段。
請求項１に記述の用語を適用するものとし、
請求項１の音質成分抽出手段に関し、
公知の、１次の高域遮断フィルターをカスケードに２段接続した２次フィルターを
低音成分抽出手段とし、低音成分抽出手段の出力データを請求項１に記述の
音質データセットHk*Fk{S(t)} の k=p なる Hp*Fp{S(t)} とすることを第４とし、
公知の、１次の低域遮断フィルターをカスケードに２段接続した２次フィルターを
高音成分抽出手段とし、高音成分抽出手段の出力データを請求項１に記述の
音質データセットHk(t)*Fk{S(t)} の k=q なる Hq(t)*Fq{S(t)} とすることを第５とし、
請求項１に記述の再生音データGh(t) を構成する音質データセットが少なくとも
第４のHp(t)*Fp{S(t)} と第５のHｑ(t)*Fｑ{S(t)} を有するところの、
請求項１の第１と第２と第３の手段を有する音響データの生成手段。
請求項１に記述の用語を適用するものとし、
元音響データが音声データの場合、元音響データの短時間区間内の強度の抑揚を均一化する手段を強度均一化手段とし、
強度均一化手段の出力を強度均一化データとし、
強度均一化データの強度を均一化データ強度とし、
請求項１の音質成分抽出手段に関し、
公知の、２次の帯域フィルターを２次帯域フィルターとし、
強度均一化データを共通入力とし、有効帯域が音声の明瞭度と相関を持つところの、
複数の2次帯域フィルターから構成されるフィルターを明瞭成分抽出フィルターとし、
明瞭成分抽出フィルターの出力を明瞭成分とし、
明瞭成分の少なくとも1個が、明瞭成分の強度と均一化データ強度の比を一定に保つ手段を有するものとし、この機能を明瞭成分均一化手段とし、
複数の明瞭化成分抽出フィルターの内の少なくとも一つが明瞭成分均一化手段を有するところの、複数の明瞭成分抽出フィルターの出力データを加算したデータを
明瞭成分均一化データとし、
明瞭成分均一化データを請求項１の明瞭成分FkS(t)} の k=r とするところの
Fr{S(t)} とし、
Fr{S(t)} の係数を Hr とし、
請求項１の音質データセット Gh(t) が Hr(t)*Fr{S(t)} を有するものとし、
明瞭成分均一化手段を第６とし、
第６を有するところの、
請求項１の第１と第２と第３の手段を有する音響データの生成手段。
請求項１に記述の用語を適用するものとし、
端末器とは、コンピューターを内蔵し、音響再生機能を持つ電子装置とし、
請求項１の音質データセットFk{S(t)} k=0,1,2,,,n に関し、
供給側から供給を受けた、または端末器内で生成された、
音質データセット Fk{S(t)} k=0,1,2,,,n を端末器内に保有する手段を第７とし、
請求項１に記述の再生音データ Hk*Fk{S(t)} k=0,1,2,,,n を端末器内で生成する手段を第8とし、
第７と第８を有する端末器の音質生成手段。