JP2017092817A - 音響特徴量調節装置およびプログラム - Google Patents

音響特徴量調節装置およびプログラム Download PDF

Info

Publication number
JP2017092817A
JP2017092817A JP2015223319A JP2015223319A JP2017092817A JP 2017092817 A JP2017092817 A JP 2017092817A JP 2015223319 A JP2015223319 A JP 2015223319A JP 2015223319 A JP2015223319 A JP 2015223319A JP 2017092817 A JP2017092817 A JP 2017092817A
Authority
JP
Japan
Prior art keywords
acoustic feature
value
audio signal
feature amount
adjustment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015223319A
Other languages
English (en)
Other versions
JP6637735B2 (ja
Inventor
岳大 杉本
Takehiro Sugimoto
岳大 杉本
大出 訓史
Norifumi Oide
訓史 大出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2015223319A priority Critical patent/JP6637735B2/ja
Publication of JP2017092817A publication Critical patent/JP2017092817A/ja
Application granted granted Critical
Publication of JP6637735B2 publication Critical patent/JP6637735B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音声信号を異なる音声フォーマットに変換して再生する場合においても、基準となる音響特徴量に合わせて音声信号を再生する。【解決手段】本発明に係る音響特徴量調節装置10は、基準となる音響特徴量に合わせて、調節対象の音声信号である被調節音声信号の音響特徴量を調節するものであり、調節音声信号の音響特徴量を抽出し、基準となる音響特徴量と抽出した被調節音声信号の音響特徴量とに基づき、被調節音声信号の音響特徴量の調節値を決定する分析部11と、分析部11により決定された調節値により被調節音声信号の音響特徴量を調節する調節部12と、を備える。【選択図】図1

Description

本発明は、基準となる音響特徴量に合わせて、調節対象の音声信号である被調節音声信号の音響特徴量を調節する音響特徴量調節装置およびプログラムに関する。
ARIB(Association of Radio Industries Business)標準規格で規定されている放送用の音声フォーマットは、2chステレオ、5.1chサラウンド、22.2マルチチャンネル音響など、多岐にわたる(非特許文献1参照)。これらの音声フォーマットは、元の音声信号のチャンネル数のまま再生されることを前提としているが、再生環境に応じて、ダウンミックスやレンダリングによるチャンネル数変換により、チャンネル数を異ならせて音声信号が再生されることもある(非特許文献1,2参照)。
ARIB STD−B32「デジタル放送における映像符号化、音声符号化及び多重化方式」 3.3版(2015) T.Sugimoto,S.Oode, and Y.Nakayama,"Downmixing method for 22.2 multichannel sound signal in 8K Super Hi−Vision broadcasting," J.Audio Eng. Soc. Vol.63,No.7/8 pp.590−599(2015)
ダウンミックスやレンダリングによるチャンネル数変換により、チャンネル数を異ならせて音声信号が再生される場合、ラウドネス値やエネルギーなどの音声信号の音響特徴量が変換前の音声信号から変化してしまい、基準となる変換前の音声信号の音響特徴量に合わせた再生ができなくなってしまう。
本発明の目的は、上述した課題を解決し、音声信号を異なる音声フォーマットに変換して再生する場合においても、変換前の音声信号の音響特徴量に合わせて音声信号を再生することができる音響特徴量調節装置およびプログラムを提供することにある。
上記課題を解決するために本発明の音響特徴量調節装置は、基準となる音響特徴量に合わせて、調節対象の音声信号である被調節音声信号の音響特徴量を調節する音響特徴量調節装置であって、前記被調節音声信号の音響特徴量を抽出し、前記基準となる音響特徴量と前記抽出した被調節音声信号の音響特徴量とに基づき、前記被調節音声信号の音響特徴量の調節値を決定する分析部と、前記分析部により決定された調節値により前記被調節音声信号の音響特徴量を調節する調節部と、を備える。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記分析部は、基準となる音声信号である基準音声信号の音響特徴量を前記基準となる音響特徴量として抽出することが好ましい。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記分析部は、音声信号を予め定められた量だけ蓄積した後、該蓄積した音声信号の音響特徴量を抽出することが好ましい。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記分析部は、前記調節部による音響特徴量の調節後の被調節音声信号の音響特徴量を抽出することが好ましい。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記調節部の前段に設けられ、前記被調節音声信号を遅延させて前記調節部に入力する遅延部をさらに備えることが好ましい。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記分析部は、所定のタイミング毎に、前記調節値を決定し、前記調節値を直前の調節値から今回のタイミングで決定した調節値に更新する場合、前記直前の調節値から前記今回のタイミングで決定した調節値まで、前記調節値を所定の時間をかけて連続的に変化させることが好ましい。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記分析部は、所定のタイミング毎に、前記調節値を決定し、直前の調節値と今回のタイミングにおける調節値との差分が所定の範囲内に含まれるように、調節値を決定することが好ましい。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記分析部は、所定のタイミング毎に、前記調節値が所定の範囲内に含まれるように、調節値を決定することが好ましい。
また、上記課題を解決するため、本発明に係る音響特徴量調節装置において、前記分析部は、時間窓を移動させながら、該時間窓に含まれる音声信号に基づき、前記音響特徴量の抽出および前記調節値の決定の少なくとも一方を行い、調節の条件に応じて、前記時間窓を、連続する時間窓を重複させずに移動させるか、または、連続する時間窓が部分的に重複するように移動させるかを適宜選択することが好ましい。
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを上記音響特徴量調節装置として機能させる。
本発明に係る音響特徴量調節装置およびプログラムによれば、音声信号を異なる音声フォーマットに変換して再生する場合においても、基準となる音響特徴量に合わせて音声信号を再生することができる。
本発明の第1の実施形態に係る音響特徴量調節装置の構成を示すブロック図である。 図1に示す分析部の構成を示すブロック図である。 図1に示す音響特徴量調節装置の動作を示すフローチャートである。 本発明の第2の実施形態に係る音響特徴量調節装置の構成を示すブロック図である。 図4に示す音響特徴量調節装置の動作を示すフローチャートである。 本発明の第3の実施形態に係る音響特徴量調節装置の構成を示すブロック図である。
以下、本発明の実施の形態について説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る音響特徴量調節装置10の構成を示すブロック図である。本発明は、基準となる音声信号である基準音声信号の音響特徴量に合わせて、調節対象の音声信号である被調節音声信号の音響特徴量を調節するものである。以下では、8K SHV(Super Hi−Vision)用の22.2ch音声信号を基準音声信号とし、その22.2ch音声信号をダウンミックスして生成される5.1ch音声信号が被調節音声信号である例を用いて説明する。
図1に示す音響特徴量調節装置10は、分析部11と、調節部12とを備える。
分析部11は、基準音声信号である22.2ch音声信号と、22.2ch音声信号をダウンミックスして生成された、被調節音声信号である5.1ch音声信号とが入力され、入力された22.2ch音声信号の音響特徴量および5.1ch音声信号の音響特徴量を抽出する。
分析部11が抽出する音声信号の音響特徴量の具体例としては、音声信号のエネルギー、ラウドネス値、振幅の最大値、ホルマントなど種々のものがある。なお、ラウドネス値とは、人が感じる音の大きさを示す指標であり、400msの瞬間値であるモーメンタリラウドネス値、3秒間のラウドネス値の平均値であるショートタームラウドネス値、ショートタームラウドネス値よりも長い期間における平均値である平均ラウドネス値などが一般的である。本実施形態においては、分析部11が抽出する音声信号の音響特徴量には、これらのラウドネス値の他に、ショートタームラウドネス値(400ms)よりも短い期間の瞬時値なども含まれる。なお、このような瞬時値も一般的なラウドネス値と同様の計算式を用いて求めることができる。
分析部11は、22.2ch音声信号および5.1ch音声信号それぞれの音響特徴量に基づき、被調節音声信号である5.1ch音声信号の音響特徴量が、基準音声信号である22.2ch音声信号の音響特徴量に合うような5.1ch音声信号の音響特徴量の調節値を決定する。具体的には、例えば、分析部11は、音響特徴量として音声信号のエネルギーを抽出する場合には、22.2ch音声信号および5.1ch音声信号それぞれのエネルギーの差分に応じた調節値を算出する。
分析部11は、決定した調節値を調節部12に出力する。
調節部12は、被調節音声信号である5.1ch音声信号が入力され、分析部11から出力された調節値を入力された5.1ch音声信号に適応する(調節値に基づき、5.1ch音声信号の音響特徴量を調節する)。そして、調節部12は、音響特徴量の調節後の5.1ch音声信号を音響特徴量調節装置10の外部に出力する。
次に、分析部11の構成について、より詳細に説明する。
図2は、分析部11の構成を示すブロック図である。
図2に示す分析部11は、音響特徴量抽出部111−1,111−2と、差分算出部112と、調節値比較部113とを備える。なお、以下では、音響特徴量抽出部111−1,111−2を区別しない場合には、音響特徴量抽出部111と称する。
音響特徴量抽出部111−1は、22.2ch音声信号が入力され、入力された22.2ch音声信号の音響特徴量を抽出して、差分算出部112に出力する。
音響特徴量抽出部111−2は、5.1ch音声信号が入力され、入力された5.1ch音声信号の音響特徴量を抽出して、差分算出部112に出力する。
音響特徴量抽出部111は、入力された音声信号を予め定められた量(予め定められた期間分)だけ蓄積した後、音声信号の音響特徴量を抽出する。また、音響特徴量抽出部111は、蓄積した音声信号について、所定の時間窓を移動させながら、時間窓毎に、時間窓に含まれる音声信号の音響特徴量を抽出する。ここで、音響特徴量抽出部111は、連続する時間窓が部分的に重複するように時間窓を移動させてもよい。こうすることで、音響特徴量を移動平均値として求めることができるので、瞬時的な音声信号の変動による影響を低減することができる。
差分算出部112は、音響特徴量抽出部111−1から出力された22.2ch音声信号の音響特徴量と、音響特徴量抽出部111−2から出力された5.1ch音声信号の音響特徴量との差分anを算出し、算出した差分anを調節値比較部113に出力する。
調節値比較部113は、所定のタイミング毎に、調節値を決定し、調節部12に出力する。ここで、調節値比較部113は、前回のタイミングで決定した調節値(直前の調節値bn-1)と差分算出部112から出力された差分anとを比較し、直前の調節値bn-1と差分anとの差分が所定の範囲内に含まれる場合には、差分anを今回のタイミングにおける調節値bnとして決定する。また、調節値比較部113は、直前の調節値bn-1と差分anとの差分が所定の範囲内に含まれない場合には、その所定の範囲内の上限値または下限値を今回のタイミングにおける調節値bnとして決定する。こうすることで、調節値が急激に変動することを防ぐことができる。
また、調節値比較部113は、差分算出部112から出力された差分anが所定の範囲内に含まれる場合には、今回のタイミングで算出した調節値を今回のタイミングにおける調節値として決定する。また、調節値比較部113は、算出した調節値が所定の範囲内に含まれない場合には、その所定の範囲内の上限値または下限値を今回のタイミングにおける調節値として決定することもできる。こうすることで、調節値が急激に変動することを防ぐことができる。さらに、算出した差分anの絶対値が予め指定した数値より小さい場合は、調節値を0とすることもできる。
また、調節値比較部113は、所定の時間窓を移動させながら、時間窓毎に、時間窓に含まれる音声信号の音響特徴量に基づき調節値を決定する。ここで、調節値比較部113は、時間窓を、連続する時間窓を重複させずに移動させるか、または、連続する時間窓が部分的に重複するように移動させながら、調節値を決定してもよい。こうすることで、調節値を移動平均値として求めることができるので、瞬時的な音声信号の変動による影響を低減することができる。
また、調節値比較部113は、時間窓を、連続する時間窓を重複させずに移動させるか、または、連続する時間窓が部分的に重複するように移動させるかを、調節の条件に応じて、適宜選択するようにしてもよい。なお、調節の条件の条件としては、例えば、音響特徴量の時間微分値がある。この場合、調節値比較部113は、音響特徴量の時間微分値が所定の値より小さい場合には、連続する時間窓を重複させずに時間窓を移動させ、音響特徴量の時間微分値が所定の値より大きい場合には、連続する時間窓が重複するように時間窓を移動させる。
また、調節値比較部113は、調節値を更新する場合、直前の調節値から今回のタイミングで決定した調節値まで、所定の時間をかけて連続的に調節値を変化させる。こうすることで、調節値の急激な変動が生じるのを防ぐことができる。なお、調節値は、線形的に変化させても、非線形的に変化させてもよい。
次に、本実施形態に係る音響特徴量調節装置10の動作について、図3に示すフローチャートを参照して説明する。
分析部11は、音声信号(基準音声信号および被調節音声信号)が入力されると(ステップS101)、分析を開始する。
具体的には、音響特徴量抽出部111−1は、基準音声信号の音響特徴量を抽出し、音響特徴量抽出部111−2は、被調節音声信号の音響特徴量を抽出する(ステップS102)。
差分算出部112は、音響特徴量抽出部111−1により抽出された基準音声信号の音響特徴量と、音響特徴量抽出部111−2により抽出された被調節音声信号の音響特徴量との差分anを算出する(ステップS103)。
調節値比較部113は、差分算出部112により算出された差分anから今回のタイミングにおける調節値bnを導出する(ステップS104)。具体的には、調節値比較部113は、差分anが所定の範囲内に含まれる場合には、差分anを今回のタイミングにおける調節値bnとして導出し、差分anが所定の範囲内に含まれない場合には、所定の範囲内の上限値または下限値を今回のタイミングにおける調節値bnとして導出する。なお、上述したように、調節値比較部113は、直前の調節値bn-1と差分anとの比較により、今回のタイミングにおける調節値bnを導出してもよい。
次に、調節値比較部113は、調節値の更新が必要であるか否かを判定する(ステップS105)。具体的には、調節値比較部113は、今回のタイミングで導出した調節値bnが直前の調節値bn-1と同じである場合には、調節値の更新が必要でないと判定し、今回のタイミングで導出した調節値bnが直前の調節値bn-1と異なる場合には、調節値の更新が必要であると判定する。
調節値の更新が必要でないと判定した場合には(ステップS105:No)、音響特徴量調節装置10は処理を終了する。
調節値の更新が必要であると判定した場合には(ステップS105:Yes)、調節値比較部113は、導出した調節値を今回のタイミングにおける調節値として決定し(ステップS106)、調節部12に出力する。調節部12は、調節値比較部113から出力された調節値に基づき、被調節音声信号の音響特徴量を調節し(ステップS107)、処理を終了する。
なお、本実施形態においては、基準音声信号の音響特徴量に合わせて、すなわち、基準音声信号の音響特徴量を基準となる音響特徴量として、被調節音声信号の音響特徴量を調節する例を用いて説明したが、これに限られるものではない。例えば、予め定められた音響特徴量を基準となる音響特徴量として、被調節音声信号の音響特徴量を調節するようにしてもよい。この場合、基準となる音響特徴量を直接、差分算出部112に入力することになるので、基準音声信号の音響特徴量を抽出する音響特徴量抽出部111−1は設ける必要がない。
このように本実施形態においては、音響特徴量調節装置10は、被調節音声信号の音響特徴量を抽出し、基準となる音響特徴量と抽出した被調節音声信号の音響特徴量とに基づき、被調節音声信号の音響特徴量の調節値を決定する分析部11と、分析部11により決定された調節値により被調節音声信号を調節する調節部12とを備える。
そのため、被調節音声信号の音響特徴量が基準となる音響特徴量と合うように、被調節音声信号の音響特徴量を調節することができるので、音声信号を異なる音声フォーマットに変換して再生する場合においても、基準となる音響特徴量に合わせて音声信号を再生することができる。
(第2の実施形態)
図4は、本発明の第2の実施形態に係る音響特徴量調節装置10aの構成を示すブロック図である。図4において、図1と同様の構成については同じ符号を付し、説明を省略する。
図4に示す音響特徴量調節装置10aは、図1に示す音響特徴量調節装置10と比較して、調節部12による音響特徴量の調節後の被調節音声信号(5.1ch音声信号)が分析部11に入力される点が異なる。
分析部11は、入力された基準音声信号である22.2ch音声信号および調節部12から出力された音響特徴量の調節後の5.1ch音声信号それぞれの音響特徴量を抽出する。そして、分析部11は、22.2ch音声信号および5.1ch音声信号それぞれの音響特徴量から調節値を決定する。なお、調節値の決定方法は、第1の実施形態と同様である。
次に、本実施形態に係る音響特徴量調節装置10aの動作について、図5に示すフローチャートを参照して説明する。なお、図5において、図3と同様の処理については同じ符号を付し、説明を省略する。
分析部11は、音声信号(基準音声信号および被調節音声信号)が入力されると(ステップS101)、直前の調節値bn-1があるか否かを判定する(ステップS201)。
直前の調節値bn-1がない場合には(ステップS201:No)、分析部11は、ステップS102の処理に進む。
直前の調節値bn-1がある場合には(ステップS201:Yes)、分析部11は、その直前の調節値bn-1を調節部12に出力する。調節部12は、被調節音声信号に分析部11から出力された調節値を適用する(被調節音声信号の音響特徴量を調節値に基づき調節する)(ステップS202)。
直前の調節値bn-1に基づき被調節音声信号の音響特徴量を調節した後、分析部11は、ステップS102の処理、すなわち、音響特徴量抽出部111−1による基準音声信号の音響特徴量を抽出する処理、および、音響特徴量抽出部111−2により被調節音声信号の音響特徴量を抽出する処理に進む。
なお、上述したように、調節値比較部113は、ステップS104において、直前の調節値bn-1と差分anとの比較により、今回のタイミングにおける調節値bnを導出してもよい。この場合、調節値比較部113は、直前の調節値bn-1と差分算出部112により算出された差分anとを比較する。そして、調節値比較部113は、直前の調節値bn-1と差分anとの差分が所定の範囲内に含まれる場合には、差分anを今回のタイミングにおける調節値bnとして導出し、直前の調節値bn-1と差分anとの差分が所定の範囲内に含まれない場合には、所定の範囲内の上限値を今回のタイミングにおける調節値bnとして導出する。
このように本実施形態においては、分析部11には、調節部12による音響特徴量の調節後の被調節音声信号から音響特徴量が入力される。
音響特徴量の調節後の被調節音声信号が分析部11に入力されることで、分析部11では、調節値に基づく被調節音声信号の音響特徴量の調節が適切であるか否かを把握しながら、調節値を決定することができる。そのため、被調節音声信号の音響特徴量が基準音声信号の音響特徴量に合うように調節精度を高めることができる。
(第3の実施形態)
図6は、本発明の第3の実施形態に係る音響特徴量調節装置10bの構成を示すブロック図である。図6において、図1と同様の構成については同じ符号を付し、説明を省略する。
図6に示す音響特徴量調節装置10bは、図1に示す音響特徴量調節装置10と比較して、遅延部13を追加した点が異なる。
遅延部13は、調節部12の前段に設けられており、被調節音声信号である5.1ch音声信号が入力される。そして、遅延部13は、入力された5.1ch音声信号を予め定められた時間だけ遅延させて、調節部12に出力する。ここで、遅延部13が被調節音声信号を遅延させる時間は、分析部11による音響特徴量の抽出や調節値の決定による時間遅れに相当する時間である。
このように、本実施形態においては、音響特徴量調節装置10bは、調節部12の前段に設けられ、入力された被調節音声信号を予め定められた時間だけ遅延させて、調節部12に出力する遅延部13を備える。
そのため、調節値の決定に用いられた音声信号と、調節される音声信号とを一致させることができる。
なお、上述した各実施形態においては、基準音声信号が22.2ch音声信号であり、被調節音声信号が、22.2ch音声信号をダウンミックスして生成された5.1ch音声信号である例を用いて説明したが、本発明は、これに限られるものではない。例えば、基準音声信号が5.1ch音声信号であり、被調節音声信号が、5.1ch音声信号をアップミックスして生成された22.2ch音声信号である場合にも、本発明は適用可能である。また、5.1ch音声信号、22.2ch音声信号以外の他の音声フォーマットの音声信号にも本発明は適用可能である。また、被調節音声信号が、基準音声信号をダウンミックスあるいはアップミックスして生成された音声信号ではない場合にも、本発明は適用可能である。
本発明に係る音響特徴量調節装置10,10a,10bにて行われる方法は、コンピュータに実行させるためのプログラムに適用してもよい。また、そのプログラムを記憶媒体に格納することも可能であり、ネットワークを介して外部に提供することも可能である。
本発明を図面および実施形態に基づき説明してきたが、当業者であれば本開示に基づき種々の変形または修正を行うことが容易であることに注意されたい。したがって、これらの変形または修正は本発明の範囲に含まれることに留意されたい。例えば、各ブロックあるいはステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数のブロックあるいはステップを1つに組み合わせたり、或いは分割したりすることが可能である。
10,10a,10b 音響特徴量調節装置
11 分析部
12 調節部
13 遅延部
111−1,111−2 音響特徴量抽出部
112 差分算出部
113 調節値比較部

Claims (10)

  1. 基準となる音響特徴量に合わせて、調節対象の音声信号である被調節音声信号の音響特徴量を調節する音響特徴量調節装置であって、
    前記被調節音声信号の音響特徴量を抽出し、前記基準となる音響特徴量と前記抽出した被調節音声信号の音響特徴量とに基づき、前記被調節音声信号の音響特徴量の調節値を決定する分析部と、
    前記分析部により決定された調節値により前記被調節音声信号の音響特徴量を調節する調節部と、
    を備えることを特徴とする音響特徴量調節装置。
  2. 請求項1に記載の音響特徴量調節装置において、
    前記分析部は、基準となる音声信号である基準音声信号の音響特徴量を前記基準となる音響特徴量として抽出することを特徴とする音響特徴量調節装置。
  3. 請求項1または2に記載の音響特徴量調節装置において、
    前記分析部は、音声信号を予め定められた量だけ蓄積した後、該蓄積した音声信号の音響特徴量を抽出することを特徴とする音響特徴量調節装置。
  4. 請求項1から3のいずれか一項に記載の音響特徴量調節装置において、
    前記分析部は、前記調節部による音響特徴量の調節後の被調節音声信号の音響特徴量を抽出することを特徴とする音響特徴量調節装置。
  5. 請求項1から4のいずれか一項に記載の音響特徴量調節装置において、
    前記調節部の前段に設けられ、前記被調節音声信号を遅延させて前記調節部に入力する遅延部をさらに備えることを特徴とする音響特徴量調節装置。
  6. 請求項1から5のいずれか一項に記載の音響特徴量調節装置において、
    前記分析部は、所定のタイミング毎に、前記調節値を決定し、前記調節値を直前の調節値から今回のタイミングで決定した調節値に更新する場合、前記直前の調節値から前記今回のタイミングで決定した調節値まで、前記調節値を所定の時間をかけて連続的に変化させることを特徴とする音響特徴量調節装置。
  7. 請求項1から6のいずれか一項に記載の音響特徴量調節装置において、
    前記分析部は、所定のタイミング毎に、前記調節値を決定し、直前の調節値と今回のタイミングにおける調節値との差分が所定の範囲内に含まれるように、調節値を決定することを特徴とする音響特徴量調節装置。
  8. 請求項1から6のいずれか一項に記載の音響特徴量調節装置において、
    前記分析部は、所定のタイミング毎に、前記調節値が所定の範囲内に含まれるように、調節値を決定することを特徴とする音響特徴量調節装置。
  9. 請求項1から8のいずれか一項に記載の音響特徴量調節装置において、
    前記分析部は、時間窓を移動させながら、該時間窓に含まれる音声信号に基づき、前記音響特徴量の抽出および前記調節値の決定の少なくとも一方を行い、調節の条件に応じて、前記時間窓を、連続する時間窓を重複させずに移動させるか、または、連続する時間窓が部分的に重複するように移動させるかを適宜選択することを特徴とする音響特徴量調節装置。
  10. コンピュータを、請求項1から9のいずれか一項に記載の音響特徴量調節装置として機能させるためのプログラム。
JP2015223319A 2015-11-13 2015-11-13 音響特徴量調節装置およびプログラム Active JP6637735B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015223319A JP6637735B2 (ja) 2015-11-13 2015-11-13 音響特徴量調節装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015223319A JP6637735B2 (ja) 2015-11-13 2015-11-13 音響特徴量調節装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2017092817A true JP2017092817A (ja) 2017-05-25
JP6637735B2 JP6637735B2 (ja) 2020-01-29

Family

ID=58769334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015223319A Active JP6637735B2 (ja) 2015-11-13 2015-11-13 音響特徴量調節装置およびプログラム

Country Status (1)

Country Link
JP (1) JP6637735B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108322818A (zh) * 2018-02-28 2018-07-24 北京酷我科技有限公司 一种音频播放中的音频格式处理策略

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004048741A (ja) * 2002-06-24 2004-02-12 Agere Systems Inc オーディオミキシングのための等化技術
JP2015195545A (ja) * 2014-03-25 2015-11-05 日本放送協会 チャンネル数変換装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004048741A (ja) * 2002-06-24 2004-02-12 Agere Systems Inc オーディオミキシングのための等化技術
JP2015195545A (ja) * 2014-03-25 2015-11-05 日本放送協会 チャンネル数変換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108322818A (zh) * 2018-02-28 2018-07-24 北京酷我科技有限公司 一种音频播放中的音频格式处理策略
CN108322818B (zh) * 2018-02-28 2020-10-09 北京酷我科技有限公司 一种音频播放中的音频格式处理方法

Also Published As

Publication number Publication date
JP6637735B2 (ja) 2020-01-29

Similar Documents

Publication Publication Date Title
US10276173B2 (en) Encoded audio extended metadata-based dynamic range control
JP6982604B2 (ja) 符号化されたオーディオメタデータに基づくラウドネス等化及びdrc中の動的等化
JP6753499B2 (ja) 復号化装置および方法、並びにプログラム
US20200169233A1 (en) Metadata for loudness and dynamic range control
EP3369175B1 (en) Object-based audio signal balancing
RU2467406C2 (ru) Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
RU2639663C2 (ru) Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах
JP5695677B2 (ja) 単一再生モードにおいてラウドネス測定値を合成するシステム
US20160065160A1 (en) Terminal device and audio signal output method thereof
US20160049162A1 (en) Audio signal size control method and device
JP6228701B2 (ja) チャンネル数変換装置
US20160049914A1 (en) Audio signal size control method and device
JP6637735B2 (ja) 音響特徴量調節装置およびプログラム
JP4706666B2 (ja) 音量制御装置及びコンピュータプログラム
JP6637736B2 (ja) ラウドネス調節装置およびプログラム
Lupşa-Tătaru Novel technique of customizing the audio fade-out shape
US20230230607A1 (en) Automated mixing of audio description
JP6510870B2 (ja) 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム
KR20240014462A (ko) 공간 오디오 객체의 동적 범위 조정
CN118072701A (zh) 音频处理方法、计算机设备和存储介质
JP2019033352A (ja) チャンネル数変換装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191223

R150 Certificate of patent or registration of utility model

Ref document number: 6637735

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250