JP7179250B1 - 音質生成手段と音響データ生成手段 - Google Patents

音質生成手段と音響データ生成手段 Download PDF

Info

Publication number
JP7179250B1
JP7179250B1 JP2022103159A JP2022103159A JP7179250B1 JP 7179250 B1 JP7179250 B1 JP 7179250B1 JP 2022103159 A JP2022103159 A JP 2022103159A JP 2022103159 A JP2022103159 A JP 2022103159A JP 7179250 B1 JP7179250 B1 JP 7179250B1
Authority
JP
Japan
Prior art keywords
data
sound quality
sound
component
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022103159A
Other languages
English (en)
Other versions
JP2024003855A (ja
Inventor
裕 児玉
純一 角元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2022103159A priority Critical patent/JP7179250B1/ja
Application granted granted Critical
Publication of JP7179250B1 publication Critical patent/JP7179250B1/ja
Publication of JP2024003855A publication Critical patent/JP2024003855A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

【課題】音質を抽出する部分は複雑で制限された環境にある。意図する音質を自在に表現することは技術的にも簡単ではない。特に、音質仕上げの段階では、様々な要因による妥協点探りの状態に陥る。【解決手段】音質作りの工程で、フィルターの設計やパラメータの選択に依存することなく、一単位毎の音響データに関し、あらかじめ複数の音質成分を抽出したデータを用意しておく。一つの音響データの音質成分のデータのそれぞれに特定の係数を乗じ、加算して目的とする音質の音響データを合成する。【選択図】図1

Description

ディジタル音響信号処理技術
人の聴感、聴感を表現する言葉、言葉に対応する信号処理機能、それらの関係の曖昧さ
スマートフォンの音響信号処理環境
インターネット通信環境
仮想空間と呼ばれる分野の音質の表現技術
請求項の用語を適用する。
APKはアプリケーションプログラムのこととする。
背景技術との関連事項1、
音質評価は感性に依存する。感性は評価する人によって異なる。純粋に理論に基づく計算処理を人の感性に合わせて仕上げる作業は技術担当者泣かせである。
感性による音質の評価に関して、客観的な数値で表現することには限界があることから、多くの現状は、熟練者の感性によって音質が決定される。
商品の生産を担当するマニファクチャーでは、ターゲットとする市場の商品との比較に
よって自社商品の音質をターゲット商品ン合わせて仕上げるというケースは少なくない。
背景技術との関連事項2、
人の音質に関する感性に照らして商品を企画開発する工程、特にAPK開発業務に関し、高度な音響信号処理の技術者を投入しなくても済む、という環境の整備は、業界関係者の潜在ニーズでもある。
独立した音質成分の加算による音質生成が可能であることは公知である。
しかし、この手法を使うと、フィルターの設計が、通常の参考書に説明されているフィルターとは微妙に違う性質を持つ。複数のフィルターの出力が加算されるので、最終出力を計算式で表現すると解かりにくいという側面もある。
一般には使われていない手法である。
取り上げる文献は特に無い。
請求項で定義された用語については以下の説明でも同様であるものとする。
次の第1と第2の課題がある。
第1の課題は、
納得できる音質への仕上げの際、
カットアンドトライに頼らざるを得ないケースが多く、正確な工程見積もりが難しい。
信号処理の目的が人の感性を対象とすることから、
音質評価の基準の設定と結果の評価のバラツキへの対処が容易なプログラミング技術や
GUIの設計やパラメータのバリエーションの選択手法、等に熟練を要する。
第2の課題は、
近年、AVコンテンツの表現が多様になっている。映像は、非線型処理を
作用させることで映像効果を表現することは全く問題ない。音響は極めて特殊な場合を除いて線型処理でなければならない。線型信号処理であることの必要条件は、
信号処理やそのプログラミング手法に制限が伴う。
さらに視覚と違って、感性の個人差や仕事に携わるメンバー間での正確な評価の共有が
難しい。多様なコンテンツ表現に対応して、その都度、信号処理に手を加えることは面倒でもある。
本案の本質は、音質仕上げの工程を、独立した二つの仕事に分業させるところにある。
複数種類の元音響データに関わる音質成分の抽出手段をあらかじめ用意しておく。
この仕事は、音響信号処理のスキルの高い者が担当する。音質成分の抽出の手段は
音響データ全般に共通であることから音質名称を付けて標準化、共通化が可能である。
用意された音質成分を組み合わせることで目的とする音質を仕上げる。
音質成分の抽出手段によって抽出された音質成分のデータを組み合わせる、という簡単な手法で目的の音質を作ることができる。
あるいは、リスナーが好む音質選択に委ねることもできる。
本案発明は、手間暇がかからず、簡素にもかかわらず、音質名称と感覚との乖離が少なく、高度な音質表現と高い自由度の音質生成環境を提供できる。
第1の課題に関しては、
通常のプログラマーであれば誰でも記述できる程度に簡単で簡素にもかかわらず、
作ろうとする音質のイメージに合わせて高度な音質制御の仕組みを設計できる。
音質の調節に伴うフィルター自身の発振や、計算行程のダイナミックレンジオーバーなど、
不安定な現象は皆無であり、調節時のノイズ発生に関しては係数のスムーシング処理が必要なだけである。極めて使い安い。
第2の課題に関しては、
音質の制御軸が感性と一致していて、その軸上の強度の調節が係数の調節に対応している、という理由により、音質評価に携わるメンバー間での、実態と評価の共有度が高い。
請求項1の一実施例と応用例について、データの流れを示すブロック図 請求項1の係数セットを使っての音質選択と決定の実施例 請求項2の低音成分抽出手段の一実施例のゲイン位相特性 請求項2の高音成分抽出手段の一実施例のゲイン位相特性 請求項2の低音と高音の成分抽出手段による一実施例の再生音データの総合特性 請求項3の明瞭成分均一化データを得る手段の一例のブロック図 請求項3の抽出フィルターの一実施例のゲイン位相特性 請求項3の明瞭成分均一化手段による一実施例の明瞭度改善効果
再生音データGh(t) の生成
人の音質感覚に馴染みやすい 音質表現のGUI と 成分データFk{S(t)} の生成
複数の、成分データFk{S(t)} と 係数データHk(t) からなる音響データの生成
音質名称nameh と 再生音データGh(t) のセットからなる音響データの生成
音質を表現する仕組みの標準化、規格化
音質成分の抽出アルゴリズムのライブラリ化
通常のプログラミング技術のスキルで高度な音質仕上げが可能
以下は図面を用いての請求項の捕捉説明である。
図1は請求項1の一実施例と応用例について、データの流れを示すブロック図である。
成分係数セットHk(t) を使っての音質選択の実施例と応用例である。
S(t) は元音響データ、Gh(t) は成分係数セットが H の場合の再生音データ、
Fk{} k=1,2,,,n は各音質成分を抽出する抽出フィルター
Fk{S(t)} k=0,1,2,,,n は元音響データの各音質成分、但し、F0{S(t)}=S(t)} とする。
Hk(t) k=0,1,2,,,n は音質生成に使われる成分係数セット、
Hk*Fk{S(t)} k=0,1,2,,,n は音質の合成使われる各音質成分、
SV はサーバー、 Ga(t),Gb(t),Gc(t) は 成分係数セット H がそれぞれ A,B,C である場合の再生に供せられる再生音データセット、
TH はリスナーの端末器、A、B、C は端末器側が選択する音質の種類、である。
Gh(t)=Σ{Hk(t)*Fk{S(t)} k=0,1,2,,,n
は成分係数セットが H の場合の再生データ、
Ga(t)=Σ{Hak(t)*Fk{S(t))}、Gb(t)=Σ{Hbk(t)*Fk{S(t))}、Gc(t)=Σ{Hck(t)*Fk{S(t))} k=0,1,2,,,n
は成分係数セットが それぞれ A、B、C の場合の再生データである。
図1では、
複数の音質成分はあらかじめ用意されていて、
それぞれの音質成分ごとに係数があって、
それぞれの音質成分ごとに係数を決めることで全体の音質を決定する場合の
実施例と応用例を示すブロック図である。
成分データはあらかじめ抽出され、保管データとして存在するものとする。
目的の音質合成が、音質成分に係数を乗じたデータの加算によって合成されることから、音質表現は直感的であり、構造が簡素である。
それぞれの音質成分について、音質の抽出フィルターの、種類やパラメータは固定であることから音質変更に伴うところの フィルター内部の 不安定動作、ノイズの発生、
オーバーダイナミックレンジ の対策を必要としない。それぞれの音質成分に
それぞれの係数を乗ずる計算処理だけなので、動的な音質可変が極めて容易である。
図2は、請求項1の音質データセットと成分係数セットを使っての、音質の選択と決定の実施例の説明図である。
成分データの各音質成分は、元音響データの供給側と第三者のいずれかによって作られる。
そして、音質選択は音響データを作る側、第三者、リスナーのいずれかによる。
図2による音質の決定方法は、関係者間で音質名と実質効果と感覚評価の一致度が高い。
音質は、独立した音質軸の選択とその大きさの組合せで表現できる。
Namek k=0,1,2,,,n は音質 Fk{S(t)} の名称、
Hk(t) k=0,1,2,,,n は音質生成に使われる成分係数セット、
Vk(t) k=0,1,2,,,n はそれぞれの成分係数の値
である
図2(a)は、音質成分の強度を音質軸の長さとする音質選択GUIの一例である。
図2(b)は、音質成分の強度を音質軸の長さとする音質選択GUIの一例である。
図2(c)は、音質成分の強度を横位置に対応させる音質選択GUIの一例である。
図2(d)は、音質成分の強度を数値に対応させる音質選択GUIの一例である。
図2(a)、(b)、(C)、(d)それぞれの音質選択GUIの表現方法は異なるが、
名称付けられた、個々の音質の強度を決める仕組みは共通である。
請求項1の音質生成方法は、一般に用いられる音質調整卓のような帯域フィルターの組合せによる方法と比べ、音質の表現と感覚の一致度が高い。このことは音質設計が、強度を選択された各種音質成分を加算合成することで叶うところにある。
そして、音質を 設計する側、評価する側、利用する側、のそれぞれが 図2の例に示す音質表現によって、表現と感覚の共有度と一致度を高めることが容易であることを示す。
結果、音質成分の抽出アルゴリズムとソフトウェアの生成手段と供給手段の標準化
音質の選択と決定手段の標準化と評価に関しての標準化が可能となる。
図3は、請求項2の低音成分抽出手段の一実施例の特性である。
図4は、請求項2の高音成分抽出手段の一実施例の特性である。
図3と図4は低音と高音の違いであるので()内を図4高音の説明とする。
抽出フィルターそのものは公知であるが、
請求項1の音質成分の生成手段とすることが請求項2の本質である。
低音(高音)成分抽出手段は、請求項1に記述の音質成分の一つであって、元音響データが楽曲である場合の最も重要な成分である。本案に供せられる音質成分は請求項1に記述の
音質効果の有効帯域で、元音響データに対し同相または逆相の関係になければならない。
特に、低音(高音)の音質効果のボーカル帯域への影響は、
低音(高音)域とボーカル域の音質のトレードオフ関係を生むことになり、音質仕上げ段階での妥協を迫られことから、
低音(高音)であっても、ボーカル帯域には感覚に影響を与えないようなフィルターが望ましい。
請求項2に記述の2次高域(低域)遮断フィルターは図3(図4)の特性を持つ。
これらは最も単純な公知のフィルターの一種である。
この特性は超低音(超高音)領域で高いゲインを確保しても、ボーカル帯域には強度にも位相にも与える影響は極めて小さい。なおかつ、全帯域で極を持たないので、音質に癖がなく、請求項1に供する最適フィルターの一つである。
2nd Low(High) Pass Gain はグラフが周波数ゲイン特性であること、
2nd Low(High) Pass Phase はグラフが周波数位相特性であることを示す。
Frequency Hz は横軸が周波数であることを示す。
Gain*30(Gain*15) は縦軸がゲインであって、抽出フィルターに、30倍(15倍)のゲインを持たせていることを示す。
70Hz(8000Hz) 上で約6倍(8倍)のゲインを持つ、この出力データを位相反転し、
元音響データに加えると、強力でも自然に感じる低音(高音)強調効果が得られる。
また、実験的にではあるが低音高音とも音源に接近したときに感じる音質となる。
Phase Degree は縦軸が度単位の位相であることを示す。
図5は、請求項2の低音と高音の成分抽出手段の組み合わせによる一実施例の総合特性であって、低音音質と高音音質の係数を変化させた場合の合成音質の周波数―ゲイン特性である。実験的に、係数の増減が音源との距離感に対応している、と感じる。
Gh(t)=H0*S(t)+H1*Low{S(t)}+H2*High{S(t)} は
元音響データH0*S(t)、低音成分H1*Low{S(t)}、高音成分H2*High{S(t)} とし、それらを加算することで全体の再生データを得ることを示す。
図5は、H0,H1,H2 が時間に関係なく固定係数の場合である。
{H0,H1,H2}={1,(30,21,15,9,6,3),(20,14,10,6,4,2}} は
H0 が1、H1とH2の組合せが (30,20),(21,14),(15,10),(9,6),(6,4),(3,2) であることを示す。Hz は横軸が周波数、dBV は縦軸の強度がデシベルであることを示す。
図6は、請求項3の明瞭成分均一化データを得る手段の一例のブロック図である。
フィルター Band1{}, Band2{}, Band3{} は公知の2次帯域フィルターであるが、
請求項1の音質成分の抽出手段することが請求項3の本質である。
明瞭成分均一化データは、請求項1に記述の音質成分の一つであって、元音響データが
アナウンスやセリフである場合の最も重要な成分である。本案に供せられる音質成分は
請求項1に記述の音質効果の有効帯域で元音響データに対し同相または逆相の関係になければならない。
S(t) は元音響データ、Element(t) は明瞭成分均一化データ、
SALC は元音響データの強度の短時間内の抑揚を均一化する強度均一化手段である。特に部分的に強度が弱い区間の強度の均一化が重要である。短時間内の抑揚とはアナウンサー
の固有の癖にありがちな、強い語尾や弱い語尾による聞き取り難さをカバーすると同時に、明瞭成分を均一化するに必要なデータの前処理でもある。
SALC{S(t)} は 強度が均一化された元音響データ、強度均一化データ である。
PK{SALC{S(t)}} は強度均一化データの強度であって 均一化データ強度 である。
元音響データの強度が均一であっても明瞭成分の強度に大きな抑揚がある。明瞭成分の
抑揚は弱難聴、難聴のリスナーにとって聞き取り難さの最大の要因の一つである。
Band1,Band2,Band3 は明瞭成分の検出のための3個の抽出フィルター、
PK は音響データの強度の検出手段、
COEFF1,COEFF2,COEFF3 はリスナーが感じるアナウンスやセリフの明瞭成分の強度を一定の水準に調節する係数調節手段、
R1,R2,R3 は 元音響データの強度に対し、それぞれの帯域ごとに必要な明瞭成分の
強度の比率、
R1*PK{SALC{S(t)}}*Band1{S(t)},R2*PK{SALC{{S(t)}}*Band2{S(t)},
R3*PK{SALC{S(t)}}*Band3{S(t)} は、それぞれの帯域において、必要な強度の明瞭成分、
強度が均一化された元音響データである強度均一化データの強度であるところの、
均一化データ強度 PK{SALC{S(t}} に対し、明瞭度の改善に必要なウェイト R1,R2,R3 なる値 を乗じることで、目標とする水準の明瞭度の 明瞭成分を得ることができる。
Element(t)=
R1*PK{SALC{S(t)}}*Band1{S(t)}+R2*PK{SALC{S(t)}}*Band2{S(t)}+
R3*PK{SALC{S(t)}}*Band3{S(t)}
は、明瞭成分が均一化されたデータであって、請求項1の音質成分の一つである。
図7は、請求項3の明瞭成分抽出フィルターの一実施例の特性である。
2nd Band Pass Gain Gain=3 1045,2080Hz,4180Hz はそれぞれの抽出フィルターの、
ゲインが 3 で、中心周波数が 1045,2080Hz,4180Hz の周波数-ゲイン特性であることを示す。
2nd Band Pass Phase Gain=3 1045,2080Hz,4180Hz はそれぞれの抽出フィルターの、
周波数-位相特性 であることを示す。
Frequency は横軸が周波数、Gain*3 は中心周波数におけるゲインが 3、
Phase Degree は縦軸の単位が度であることを示す。
これらの特性は極めて一般的な帯域フィルターである。
帯域フィルターを、複数個に分け、それぞれ、明瞭度にとって重要な特性とする。
例えば、第1フォルマントの帯域の強度に対し第3フォルマントの帯域の強度が弱いと、
第3フォルマントの帯域を補強することで明瞭度は改善される。
さらに、弱難聴と難聴では必要な明瞭成分の配分と強度に違いがあることから、
供給側は用途に応じたデータを供給することで、リスナーの選択に委ねることができる。
図8は、請求項3の明瞭成分均一化手段を使っての合成音質の効果の一例である。
図8(a)は、弱難聴者にとって聞き取り難い、
ナウンスの場合の、抽出明瞭成分の強度の一例のグラフである。
横軸は時間、縦軸は振幅である。難聴に自覚あるケースでは、聞き取りに
必要な明瞭成分の強度は 一例として Required Clearness にある。この強度を満足する回数は2回である。明瞭成分は元音響データの強度とは一般的には必ずしも相関を持たない。訓練されたアナウンサーによる明瞭度は一様に近い。
同時通訳者の場合、声の抑揚が変化するケースは少なくない。
音量が放送設備によって均一に保たれても明瞭度は極度に頻繁に変動する。
図8(b)は、
図8(a)の変動する明瞭成分を図6の手法による一実施例を使って均一化したデータの
明瞭成分の強度である。 Required Clearness を満足する回数を正確に数えることは
難しいが、図8(a)に比べ大幅に改善されていることがわかる。
実際、図(a)と図(b)の再生アナウンスを聞き比べると明瞭度の改善効果は著しい。
図8(c)は、図8(a)と図8(b)の明瞭成分のスペクトラム強度の比較を示す。
Not Needed Element for Clearness は明瞭度にとって不必要な帯域の成分、
Needed Element for Clearness は明瞭度にとって必要な帯域の成分である。
Original は図(a)の明瞭成分、Improved は図(b)の明瞭成分である。
明瞭度にとって不要な帯域、例えばピッチに相当する部分の強度は減衰され、
有用なフォルマント帯域の抑揚は均一化され、補正され、そして強調される。
時系列の強度とスペクトラムの強度バランスが均一化されていることから明瞭成分の強調によって音量ばかり大きくなって不快感が強調されることはない。
図6のブロック図を図8の結果が得られる実働のAPKに仕上げる作業は、
高度な信号処理のスキルを必要とする。めんどうなAPKの製作にマンパワーを割くことなく、完成された、この種類の信号処理手段による抽出された成分データと音質合成手段を組合せることが請求項3の本質である。
請求項1の捕捉説明
本案の本質は、音質を作る工程の分業化を可能ならしめるところの信号生成手段にある。
分業とは、それぞれの音質成分を作る複雑な作業工程 と
前もって準備された音質成分を組み合わせる簡素な作業で全体の音質を仕上げる工程 と
に分けることである。
音質成分を抽出するAPKの供給側は完成度の高い音質成分抽出APKを供給する。
音質の供給側は、既に準備されている音質成分抽出APKが抽出する音質成分を組み合わせて、一種類または複数種類の供給音響データをリスナーに供給する。
リスナーから見れば、音質が一種類であれば、供給された音質を無条件に選択、
ネーミングされた複数の音質が提供されていれば、その内のいずれかを選択する。
請求項2の捕捉説明
音質作りの最も基本は低音と高音である。
低音に関しては、1次の高域遮断をカスケードに接続した2次の高域遮断フィルター、
高音に関しては、1次の低域遮断をカスケードに接続した2次の低域遮断フィルター、
を音質成分抽出フィルターとする方法は最適な方法の一つである。
これらのフィルターそのものは公知であるが、図1の手法にこれらのフィルターを使うことが請求項2の本質である。
請求項3の捕捉説明
音質作りにとって、アナウンスやセリフの明瞭化は重要である。
メッセージを伝える声の音質成分の内、ピッチ成分は不要、フォルマント帯域を主とする成分が重要である。特に、弱難聴者や難聴者にとって、明瞭成分の強度が安定していると聞き取りやすい。しかし、明瞭成分の強度の抑揚は、聞き取り難くさの要因の一つとなる。
聞き取り難いからといって全体の音量を上げると周囲に迷惑をかける。
高性能の明瞭化には複雑な信号処理を必要とするが、
複雑な信号処理を担当する作業と
高明瞭成分のデータと元音響データを組み合わせて高明瞭度の音質を作る作業と、
に分業化することで、高明瞭度の音質を提供することが容易になる。
請求項4の捕捉説明
請求項1の仕組みの内、音質成分を作る機能と作られた成分データが端末器内部に存在する状態で、端末器単独で選択した音質の再生音データを合成する。
S(t) 元音響データ
Gh(t) 成分係数セットが H の再生音データ
Fk{S(t)} k=0,1,2,,,n 音質データセット
Hk(t) k=0,1,2,,,n 成分係数セット
MIX 音質データセットの加算手段
SV サーバー
TM 端末器
A、B、C 音質の種類
Ga(t),Gb(t),Gc(t) それぞれ 音質A、音質B、音質C、の音質データセット
Hak(t) k=0,1,2,,,n 音質A生成用の 成分係数セット
Hbk(t) k=0,1,2,,,n 音質B生成用の 成分係数セット
Hck(t) k=0,1,2,,,n 音質C生成用の 成分係数セット
Name0 元音響データ S(t) の音質名称
Namek k=1,2,,,n 音質成分 Fk{S(t)} の音質名称
2nd Low Pass Gain 2次低域フィルターの周波数-ゲイン特性
2nd Low Pass Phase 2次低域フィルターの周波数-位相特性
Gain*30 縦軸がゲイン、中心周波数での縦軸ゲインが30倍
Frequency Hz 横軸が周波数
Phase Degree 縦軸が位相(度)
2nd High Pass Gain 2次高域フィルターの周波数-ゲイン特性
2nd High Pass Phase 2次高域フィルターの周波数-位相特性
Gain*15 縦軸がゲイン、中心周波数での縦軸ゲインが15倍
Gh(t)=H0*S(t)+H1*Low{S(t)}+H2*High{S(t)} 低音と高音の音質データセット
{H0,H1,H2}={1,(30,21,15,9,6,3),(20,14,10,6,4,2}} 固定の成分係数セット
Hz 横軸が周波数
dBV 縦軸がゲイン 単位はデシベル
S(t) 元音響データ
SALC 強度均一化手段
SALC{S(t)} 強度均一化データ
Element(t) 明瞭成分均一化データ
PK データ強度の計算手段
Pk{SALC{S(t)}} 均一化データ強度
Band1,Band2,Band3 明瞭成分の抽出フィルター
COFF1,COFF2,COFF3 係数器
R1,R2,R3 均一化データ強度に対する抽出フィルターの出力強度の比
R1*PK{SALC{S(t)}}*Band1{S(t)}, R2*PK{SALC{S(t)}}*Band2{S(t)},
R3*PK{SALC{S(t)}}*Band3{S(t)}
それぞれの抽出フィルターの出力データの強度
Element(t)=
R1*PK{SALC{S(t)}}*Band1{S(t)}+R2*PK{SALC{S(t)}}*Band2{S(t)}+
R3*PK{SALC{S(t)}}*Band3{S(t)}
明瞭成分均一化データ
2nd Band Pass Gain Gain=3 1045Hz,2080Hz,4180Hz 記載の周波数であって
ゲインが3の3個の抽出フィルターの周波数―ゲイン特性であることを示す。
2nd Band Pass Phase Gain=3 1045,2080Hz,4180Hz 記載の周波数であって
ゲインが3の3個の抽出フィルターの周波数―位相特性であることを示す。
Gain*3 抽出フィルターの中心周波数におけるゲインが3
Frequency 周波数
Phase Degree 単位が度の位相
Clearness Element in S(t) 元音響データS(t) の明瞭成分強度特性
Required Clearness 必要な明瞭成分強度
Un-stable Clearness 抑揚が激しい明瞭成分の強度
Clearness Element in Element{S(t)} 明瞭成分の強度
Stable Clearness 抑揚が均一な明瞭成分の強度
Formant Spectrum 音声フォルマントのスペクトラム
Not Needed Element for Clearness 明瞭度にとって不必要な成分
Needed Element for Clearness 明瞭度にとって必要な成分

Claims (4)

  1. 音信号を再生して聴く人をリスナーとし、
    リスナーに供する音響データを 元音響データ とし、
    元音響データは単一または複数の時系列データから構成されるものとし、
    元音響データを S(t) とし、(t) は時系列データを意味するものとし、
    音の質感の表現に対応する言葉を 音質名称 とし、
    元音響データS(t) を元にして計算で抽出する、複数種類の音質名称に対応するところの、
    特定の音質成分を Fk{S(t)} k=1,2,,,n とし、
    Fk{S(t)} k=1,2,,,n とは、
    F1{S(t)}, F2{S(t)},,, Fn{S(t)} なる n個 の音質データとし、
    音質成分を抽出する手段を 音質成分抽出手段 とし、
    音質成分Fk{S(t)} は、元音響データS(t) との、
    音質名称に対応する音質を決定する帯域における双方の関係において、
    同相または逆相の関係にあるものとし、
    同相とは 元音響データとの位相がプラスマイナス90度の関係にあるものとし、
    逆相とは 元音響データとの位相が 上記の同相に対し逆相の関係にあるものとし、
    Fk{S(t)} k=1,2,,,n のそれぞれを、元音響データから抽出された 成分データ
    とし、
    成分データ は、PCM形式を基準として、圧縮変換されている場合は復調された状態の
    PCM形式の時系列データとし、
    F0{S(t)} を 元音響データS(t) とするところの
    Fk{S(t)} k=0,1,2,,,n を 音質データセット とし、
    音質データセットを得る手段を第1とし、
    Hk(t) k=0,1,2,,,n を成分係数セットとし、
    Hk(t) k=0.1.2,,,n とは
    H0(t),H1(t),,,Hn(t) なる n+1個 の係数とし、
    成分係数セットは、
    大きさが 0 を含む 符号が 負、正 の値であって、
    終始一定の係数の場合も含めて一般的には時系列変数である場合と、
    があるものとし、
    Hk(t)*Fk{S(t)} k=0,1,2,,,n とは、
    サンプリング時刻 tj j=0,1,2,,,m における Hk(tj) と Fk{S(tj)} の積
    Hk(tj)*Fk{S(tj)} であるものとし、
    Gh(t)=Σ{Hk(t)*Fk{S(t))} k=0,1,2,,,n を 再生音データ とし、
    再生音データ Gh(t) を得る手段を第2とし、
    再生音データ Gh(t) の供給側と利用側の関係において、
    再生音データの生成手段は,元音響データの供給側による場合と、第三者側による場合と
    のいずれかであるとし、
    複数種類の成分係数セットを Ha(t), Hb(t), Hc(t),,, とし、
    成分係数セット Hk(t) k=0,1,2,,,n HがA、B、C、、、 の場合の
    音質データセット Gh(t) をそれぞれ
    Ga(t)=Σ{Hak(t)*Fk{S(t))} k=0,1,2,,,n
    Gb(t)=Σ{Hbk(t)*Fk{S(t))} k=0,1,2,,,n
    Gc(t)=Σ{Hck(t)*Fk{S(t))} k=0,1,2,,,n
    ,,,,
    とし、
    H に関し、 A,B,C,,, なるHが持つ音質名称を、
    それぞれ Namea,Nameb,Namec,,, とし、
    音質名称 と 再生音データ のセット{Nameh,Gh(t)} を供給することで、
    リスナーが 音質名称Nameh を選択し、再生音データGh(t) を利用することができる
    手段を 供給音響データ選択手段 とし、
    供給音響データ選択手段は、再生音データGh(t) が一種類の場合も含むものとし、
    供給音響データ選択手段 を第3とし、
    第1と第2と第3を有する 音響データの生成手段
  2. 請求項1に記述の用語を適用するものとし、
    請求項1の音質成分抽出手段に関し、
    公知の、1次の高域遮断フィルターをカスケードに2段接続した2次フィルターを
    低音成分抽出手段 とし、低音成分抽出手段の出力データを請求項1に記述の
    音質データセットHk*Fk{S(t)} の k=p なる Hp*Fp{S(t)} とすることを第4とし、
    公知の、1次の低域遮断フィルターをカスケードに2段接続した2次フィルターを
    高音成分抽出手段 とし、高音成分抽出手段の出力データを請求項1に記述の
    音質データセットHk(t)*Fk{S(t)} の k=q なる Hq(t)*Fq{S(t)} とすることを第5とし、
    請求項1に記述の再生音データGh(t) を構成する音質データセットが少なくとも
    第4のHp(t)*Fp{S(t)} と 第5のHq(t)*Fq{S(t)} を有するところの、
    請求項1の第1と第2と第3の手段を有する 音響データの生成手段
  3. 請求項1に記述の用語を適用するものとし、
    元音響データが音声データの場合、元音響データの短時間区間内の強度の抑揚を均一化する手段を 強度均一化手段 とし、
    強度均一化手段の出力を 強度均一化データ とし、
    強度均一化データの強度を 均一化データ強度 とし、
    請求項1の音質成分抽出手段に関し、
    公知の、2次の帯域フィルターを 2次帯域フィルター とし、
    強度均一化データを共通入力とし、有効帯域が音声の明瞭度と相関を持つところの、
    複数の2次帯域フィルターから構成されるフィルターを 明瞭成分抽出フィルター とし、
    明瞭成分抽出フィルターの出力を 明瞭成分 とし、
    明瞭成分の少なくとも1個が、明瞭成分の強度と均一化データ強度の比 を一定に保つ手段を有するものとし、この機能を 明瞭成分均一化手段とし、
    複数の明瞭化成分抽出フィルターの内の少なくとも一つが明瞭成分均一化手段を有するところの、複数の明瞭成分抽出フィルターの出力データを加算したデータを
    明瞭成分均一化データ とし、
    明瞭成分均一化データを請求項1の明瞭成分FkS(t)} の k=r とするところの
    Fr{S(t)} とし、
    Fr{S(t)} の係数を Hr とし、
    請求項1の音質データセット Gh(t) が Hr(t)*Fr{S(t)} を有するものとし、
    明瞭成分均一化手段を第6とし、
    第6を有するところの、
    請求項1の第1と第2と第3の手段を有する 音響データの生成手段
  4. 請求項1に記述の用語を適用するものとし、
    端末器とは、コンピューターを内蔵し、音響再生機能を持つ電子装置とし、
    請求項1の音質データセットFk{S(t)} k=0,1,2,,,n に関し、
    供給側から供給を受けた、または端末器内で生成された、
    音質データセット Fk{S(t)} k=0,1,2,,,n を端末器内に保有する手段を第7とし、
    請求項1に記述の再生音データ Hk*Fk{S(t)} k=0,1,2,,,n を端末器内で生成する手段を第8とし、
    第7と第8を有する端末器の音質生成手段。
JP2022103159A 2022-06-28 2022-06-28 音質生成手段と音響データ生成手段 Active JP7179250B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022103159A JP7179250B1 (ja) 2022-06-28 2022-06-28 音質生成手段と音響データ生成手段

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022103159A JP7179250B1 (ja) 2022-06-28 2022-06-28 音質生成手段と音響データ生成手段

Publications (2)

Publication Number Publication Date
JP7179250B1 true JP7179250B1 (ja) 2022-11-29
JP2024003855A JP2024003855A (ja) 2024-01-16

Family

ID=84237872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022103159A Active JP7179250B1 (ja) 2022-06-28 2022-06-28 音質生成手段と音響データ生成手段

Country Status (1)

Country Link
JP (1) JP7179250B1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090024662A1 (en) 2007-07-18 2009-01-22 Samsung Electronics Co., Ltd. Method of setting an equalizer in an apparatus to reproduce a media file and apparatus thereof
JP2009147629A (ja) 2007-12-13 2009-07-02 Mitsubishi Electric Corp 音響装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05173584A (ja) * 1991-12-24 1993-07-13 Casio Comput Co Ltd 効果付加装置
KR20110064901A (ko) * 2009-12-09 2011-06-15 현대모비스 주식회사 음장효과 자동 설정 기능을 갖는 차량용 오디오 장치 및 음장효과 설정 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090024662A1 (en) 2007-07-18 2009-01-22 Samsung Electronics Co., Ltd. Method of setting an equalizer in an apparatus to reproduce a media file and apparatus thereof
JP2009147629A (ja) 2007-12-13 2009-07-02 Mitsubishi Electric Corp 音響装置

Also Published As

Publication number Publication date
JP2024003855A (ja) 2024-01-16

Similar Documents

Publication Publication Date Title
US9391579B2 (en) Dynamic compensation of audio signals for improved perceived spectral imbalances
JP4747835B2 (ja) オーディオ再生の効果付加方法およびその装置
AU2011244268B2 (en) Apparatus and method for modifying an input audio signal
JP5057535B1 (ja) ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法
US20060147050A1 (en) System for simulating sound engineering effects
CN105957515A (zh) 声音合成方法、声音合成装置和存储声音合成程序的介质
US6673995B2 (en) Musical signal processing apparatus
Bernardi et al. Subjective and objective sound-quality evaluation of adaptive feedback cancellation algorithms
US8660845B1 (en) Automatic separation of audio data
CN114067827A (zh) 一种音频处理方法、装置及存储介质
Reiss et al. Applications of cross-adaptive audio effects: Automatic mixing, live performance and everything in between
Deruty et al. Human–made rock mixes feature tight relations between spectrum and loudness
JP7179250B1 (ja) 音質生成手段と音響データ生成手段
US11430463B2 (en) Dynamic EQ
Wilmering et al. Audio effect classification based on auditory perceptual attributes
Ibnyahya et al. A method for matching room impulse responses with feedback delay networks
Bourbon Plugging In: Exploring Innovation in Plugin Design and Utilization
Czyzewski et al. Adaptive personal tuning of sound in mobile computers
JP6798392B2 (ja) 効果付与装置及び効果付与プログラム
US11380345B2 (en) Real-time voice timbre style transform
JP4900062B2 (ja) 音声信号処理装置、音声再生装置および音声信号処理方法
Benjamin et al. Exploring level-and spectrum-based music mixing transforms for hearing-impaired listeners
US11950089B2 (en) Perceptual bass extension with loudness management and artificial intelligence (AI)
WO2023243454A1 (ja) パラメータ推定方法、音処理装置、および音処理プログラム
Vega et al. Quantifying masking in multi-track recordings

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220628

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221018

R150 Certificate of patent or registration of utility model

Ref document number: 7179250

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150