JP2016514856A - オーディオ信号大きさの制御方法及び装置 - Google Patents

オーディオ信号大きさの制御方法及び装置 Download PDF

Info

Publication number
JP2016514856A
JP2016514856A JP2016505384A JP2016505384A JP2016514856A JP 2016514856 A JP2016514856 A JP 2016514856A JP 2016505384 A JP2016505384 A JP 2016505384A JP 2016505384 A JP2016505384 A JP 2016505384A JP 2016514856 A JP2016514856 A JP 2016514856A
Authority
JP
Japan
Prior art keywords
audio signal
magnitude
size
control
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016505384A
Other languages
English (en)
Inventor
チェ、ベョン、ホ
キム、ジェ、ウ
シン、ファ、ソン
チョ、チュン、サン
Original Assignee
インテレクチュアル ディスカバリー カンパニー リミテッド
インテレクチュアル ディスカバリー カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR20130030136A external-priority patent/KR101482946B1/ko
Priority claimed from KR1020130036475A external-priority patent/KR101603992B1/ko
Priority claimed from KR1020130036468A external-priority patent/KR101583294B1/ko
Priority claimed from KR1020130036431A external-priority patent/KR101583293B1/ko
Priority claimed from KR1020130036523A external-priority patent/KR101602273B1/ko
Application filed by インテレクチュアル ディスカバリー カンパニー リミテッド, インテレクチュアル ディスカバリー カンパニー リミテッド filed Critical インテレクチュアル ディスカバリー カンパニー リミテッド
Publication of JP2016514856A publication Critical patent/JP2016514856A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】オーディオ信号大きさの制御方法が開示される。【解決手段】この制御方法は、入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定するステップと、既に設定された初期ピーク重み付け値を用いて、入力されたオーディオ信号をスケーリングし、スケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定するステップと、出力されるオーディオ信号の音のバラツキを維持するための既に設定されたマッピングテーブルに第1のオーディオ信号の大きさを適用して、第3のオーディオ信号の大きさを検出するステップ及び第1のオーディオ信号の大きさと、第2のオーディオ信号の大きさ及び第3のオーディオ信号の大きさを用いて、入力されたオーディオ信号の大きさを制御するステップを含む。

Description

本発明は、マルチメディアにおいて再生されるオーディオ信号の大きさを制御する方法及びその装置に関する。
人間は、日常生活を営みながら様々な環境におかれ、且つ、様々な音に露出される。人間が露出される音は、様々な原因により発生するが、図1に示すように、人間が聞いたときに不快感を発生する環境騒音、人間を楽しくするマルチメディア音及び音楽、並びに人間の間において対話及び情報をやり取りするときに発生する音などがある。
人間の周りの種々の音は、音の大きさ及び種類に応じて人間に苦痛を与えることもあれば、楽しさを与えることもあり、しかも、様々な情報を提供することもある。これは、人間の聴覚構造は、空気を介して伝達された音の音圧レベルを通して音を認知するため、音の大きさ及び強さは、音による聴覚的疲労度及び音の物理的特徴を定義する有用な数値となっているためである。
音を評価する方法のうち、音の大きさ(ラウドネス)は、ある音が人間の耳に伝達されたとき、人間の聴覚システムが認知する主観的な音の大きさであり、音の強さは、人間の聴覚システムに伝達された客観的な音の強さであり、音のパワーを意味し、一般に、周知のデシベル(dB)として測定される。一般に、人間の間の対話は60〜70dBであり、交通量が多くて且つ騒音が激しい大通りは約80dBであり、一般に、約70dBの範囲で人間は楽さを感じる。
図1を参照すると、現代人がオーディオに接する方法及び機会は益々増えつつあり、携帯用マルチメディアオーディオ機器の発達に伴い、どこでも、且つ、どのような状況下でも自分が希望するマルチメディアコンテンツ及び音楽を楽しむことが可能になった。特に、オーディオ分野においては、1990年代の後半にMP3(MPEG−1 Layer III)の登場及びインターネットの大衆化が行われ、これに伴い、MP3に圧縮されたデジタル音源をインターネットを介して手軽にダウンロードし且つ聴き取ることが可能になった。
商業的なオーディオ音源市場は、マルチメディア機器の大衆化と相俟って急激に膨張された。また、オーディオ音源は、領域における競争が激しくなるにつれて、人間の関心を引くためにオーディオ音源の再生可能な最大の音響と最小の音響との間の差分比(ダイナミックレンジ)が急激に減少し、波形の最大値が増加してオーディオ音の大きさがかなり増加した。これは、「オーディオ音の大きさが大きいほど、人間が良い音楽として認識するであろう。」という考えから一層進んだ。
図2の(イ)は、1970年代の音楽(Pops)の波形を、(ロ)は、2011年の韓国歌謡(K−Pops)の波形を示す。図2を参照すると、昔に録音された音楽は、ダイナミックレンジが最近に発売された音源よりも広いことが分かり、最近、全世界的な大衆化を達成したK−pops音源の波形は最大値に達するか、あるいは、最大値を超えることを確認することができる。
これに伴い、マルチメディア機器においてオーディオ音の大きさを正確に測定し、且つ、音の大きさを調節する技術が必要であり、オーディオ音の大きさを制御するための技術が必要である。
本発明は、様々なマルチメディア環境において提供されるオーディオ信号の大きさを効率よく制御することのできる方法及びその装置を提供することを目的としている。
また、本発明は、録画及び予め製作された放送番組に対してオーディオ信号の大きさを規格に合うように制御することのできる装置及び方法を提供することを他の目的としている。
さらに、本発明は、ゲート重み付け値の補間によるゲート遅延が発生することを防ぎながらも、オーディオ信号の大きさを規格に合うように制御することのできる装置及び方法を提供することをさらに他の目的としている。
さらにまた、本発明は、リアルタイム/ライブで取得されたオーディオ信号のオーディオ信号の大きさを規格に合うように制御することのできる装置及び方法を提供することをさらに他の目的としている。
上述した目的を達成するための本発明の第1の実施形態によれば、録画及び予め製作された放送番組に対してオーディオ信号の大きさを規格に合うように制御することのできる装置及び方法を提供する。
また、上述した目的を達成するための本発明の第2の実施形態によれば、リアルタイム/ライブで取得された放送番組に対してオーディオ信号の大きさを規格に合うように制御することのできる装置及び方法を提供する。
さらに、上述した目的を達成するための本発明の第3の実施形態によれば、オーディオ信号の大きさの正規化による聴感的なオーディオ音質の劣化を極力抑えながらオーディオ信号の大きさを制御することのできる装置及び方法を提供する。
さらにまた、上述した目的を達成するための本発明の第4の実施形態によれば、オーディオ信号の大きさの正規化を考慮して、新たなオーディオ制御機能を提供する装置及び方法を提供する。
上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御方法は、入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定するステップと、既に設定された初期ピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングし、前記スケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定するステップと、前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び目標値オーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するステップと、を含む。
また、前記制御するステップは、「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の差分である第2の差分」で除算して、「オーディオ信号の大きさ制御比」を算出するステップと、前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出するステップと、前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して、新たなピーク重み付け値を算出するステップと、前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングするステップと、を含んでいてもよい。
さらに、本発明の一実施形態によるオーディオ信号大きさの制御方法は、前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の第3の差分を既に設定された誤差範囲と比較するステップをさらに含んでいてもよい。
さらにまた、本発明の一実施形態によるオーディオ信号大きさの制御方法は、前記比較の結果、前記第3の差分が前記既に設定された誤差範囲よりも大きければ、前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさを前記第2のオーディオ信号の大きさとして、前記入力されたオーディオ信号の大きさを制御するステップをさらに含んでいてもよい。
また、上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御装置は、入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定し、前記入力されたオーディオ信号に既に設定された初期ピーク重み付け値を適用してスケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定するオーディオ信号大きさ測定部と、前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び目標値オーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するオーディオ信号大きさ制御部と、を備える。
また、本発明の一実施形態によるオーディオ信号大きさの制御装置は、「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の差分である第2の差分」で除算して「オーディオ信号の大きさ制御比」を算出し、前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出し、前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して新たなピーク重み付け値を算出する重み付け値算出部をさらに備え、前記オーディオ信号大きさ制御部は、前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングして、前記入力されたオーディオ信号の大きさを制御してもよい。
さらに、前記オーディオ信号大きさ制御部は、前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の第3の差分を既に設定された誤差範囲と比較してもよい。
さらにまた、前記オーディオ信号大きさ制御部は、前記比較の結果、前記第3の差分が前記既に設定された誤差範囲よりも大きければ、前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさを前記第2のオーディオ信号の大きさとして、前記入力されたオーディオ信号の大きさを制御してもよい。
さらに、上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御方法は、既に定義されたゲートサイズを有する第1のゲートブロック及び第2のゲートブロックを入力されたオーディオ信号に適用して、前記第1のゲートブロックに対応する第1のオーディオ信号の大きさ及び前記第2のゲートブロックに対応する第2のオーディオ信号の大きさを測定するステップと、前記測定された第1のオーディオ信号の大きさを用いて、前記第1のゲートブロックに対応する第1のゲート重み付け値を算出し、前記測定された第2のオーディオ信号の大きさを用いて、前記第2のゲートブロックに対応する第2のゲート重み付け値を算出するステップと、前記第1のゲートブロック及び前記第2のゲートブロックにおいてゲートハンドオーバーが発生したフレームを検出するステップと、前記算出された第1及び第2の重み付け値を用いて、前記検出されたフレームからフレーム重み付け値を補間するステップと、前記補間されたフレーム重み付け値と、前記第1及び第2のゲート重み付け値を用いて、入力されたオーディオ信号に対するスケーリングを行って、オーディオ信号の大きさを制御するステップと、を含む。
また、前記第2のゲートブロックは、前記第1のゲートブロック内の既に定義されたサイズ分だけを重ね合わせながら移動させたゲートブロックであってもよい。
さらに、前記第1及び第2のゲートブロックは、少なくとも一枚のフレームを備え、前記フレームは、一回に受け取るデータのサイズを決定してもよい。
さらにまた、前記補間されるフレーム重み付け値の数は、可変的であってもよい。
さらにまた、上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御装置は、既に定義されたゲートサイズを有する第1のゲートブロック及び第2のゲートブロックを入力されたオーディオ信号に適用して、前記第1のゲートブロックに対応する第1のオーディオ信号の大きさ及び前記第2のゲートブロックに対応する第2のオーディオ信号の大きさを測定するオーディオ信号大きさ測定部と、前記測定された第1のオーディオ信号の大きさを用いて、前記第1のゲートブロックに対応する第1のゲート重み付け値を算出し、前記測定された第2のオーディオ信号の大きさを用いて、前記第2のゲートブロックに対応する第2のゲート重み付け値を算出する重み付け値算出部と、前記第1のゲートブロック及び前記第2のゲートブロックにおいてゲートハンドオーバーが発生したフレームを検出する検出部と、前記算出された第1及び第2の重み付け値を用いて、前記検出されたフレームからフレーム重み付け値を補間し、前記補間されたフレーム重み付け値と、前記第1及び第2のゲート重み付け値を用いて、入力されたオーディオ信号に対するスケーリングを行って、オーディオ信号の大きさを制御するオーディオ信号大きさ制御部と、を備える。
また、前記第2のゲートブロックは、前記第1のゲートブロック内の既に定義されたサイズ分だけを重ね合わせながら移動させたゲートブロックであってもよい。
さらに、前記第1及び第2のゲートブロックは、少なくとも一枚のフレームを備え、前記フレームは、一回に受け取るデータのサイズを決定してもよい。
さらにまた、前記補間されるフレーム重み付け値の数は、可変的であってもよい。
さらにまた、上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御方法は、入力されたオーディオ信号の制御に関する手動ラウドネス制御モード、半自動ラウドネス制御モード、自動ラウドネス制御モードのうちのいずれか一つのモードが選択されるステップと、前記選択された制御モードが半自動ラウドネス制御モードである場合、前記入力されたオーディオ信号の制御のために必要とされる制御情報を算出するステップと、前記算出された制御情報を表示するステップと、を含む。
また、前記制御情報は、瞬間オーディオ信号の大きさ情報、短期(3s)オーディオ信号の大きさ情報、集積オーディオ信号の大きさ情報、再生オーディオ信号の大きさ情報、残留オーディオ信号の大きさ情報、推奨制御要因情報のうちの少なくとも一つを含んでいてもよい。
さらに、前記再生オーディオ信号の大きさ情報は、これまで出力されたオーディオ信号に関するオーディオ信号の大きさ情報であり、前記残留オーディオ信号の大きさ情報は、目標値オーディオ信号の大きさに比べての再生オーディオ信号の大きさの不足分または超過分のオーディオ信号の大きさ情報であり、前記推奨制御要因情報は、残留オーディオ信号の大きさ情報を用いて算出したオーディオ信号の大きさを制御するための重み付け値情報であってもよい。
さらにまた、上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御装置は、入力されたオーディオ信号の制御に関する手動ラウドネス制御モード、半自動ラウドネス制御モード、自動ラウドネス制御モードのうちのいずれか一つのモードが選択される入力部と、前記選択された制御モードが半自動ラウドネス制御モードである場合、前記入力されたオーディオ信号の制御のために必要とされる制御情報を算出する制御部と、前記算出された制御情報を表示する表示部と、を備える。
また、前記制御情報は、瞬間オーディオ信号の大きさ情報、短期(3s)オーディオ信号の大きさ情報、集積オーディオ信号の大きさ情報、再生オーディオ信号の大きさ情報、残留オーディオ信号の大きさ情報、推奨制御要因情報のうちの少なくとも一つを含んでいてもよい。
さらに、前記再生オーディオ信号の大きさ情報は、これまで出力されたオーディオ信号に関するオーディオ信号の大きさ情報であり、前記残留オーディオ信号の大きさ情報は、目標値オーディオ信号の大きさに比べての再生オーディオ信号の大きさの不足分または超過分のオーディオ信号の大きさ情報であり、前記推奨制御要因情報は、残留オーディオ信号の大きさ情報を用いて算出したオーディオ信号の大きさを制御するための重み付け値情報であってもよい。
さらにまた、上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御方法は、入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定するステップと、既に設定された初期ピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングし、前記スケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定するステップと、出力されるオーディオ信号の音のバラツキを維持するための既に設定されたマッピングテーブルに前記第1のオーディオ信号の大きさを適用して、第3のオーディオ信号の大きさを検出するステップと、前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び前記第3のオーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するステップと、を含む。
また、前記入力されたオーディオ信号は、リアルタイムにて入力されるオーディオ信号であってもよい。
さらに、前記既に設定されたマッピングテーブルは、前記第1のオーディオ信号の大きさが既に設定された値よりも小さな領域においては、線形マッピングを用いてマッピングを行うテーブルであり、前記第1のオーディオ信号の大きさが既に設定された値よりも大きな領域においては、下記の数式を用いてマッピングを行うテーブルであり、
ここで、iLKFSは、前記第1のオーディオ信号の大きさであり、oLKFSは、前記第3のオーディオ信号の大きさであり、wは、変更可能な重み付け値であってもよい。
さらにまた、前記制御するステップは、「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記第3のオーディオ信号の大きさとの間の差分である第2の差分」で除算して「オーディオ信号の大きさ制御比」を算出するステップと、前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出するステップと、前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して、新たなピーク重み付け値を算出するステップと、前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングするステップと、を含んでいてもよい。
さらにまた、上述した目的を達成するための本発明の一実施形態によるオーディオ信号大きさの制御装置は、入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定し、既に設定された初期ピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングし、前記スケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定し、出力されるオーディオ信号の音のバラツキを維持するための既に設定されたマッピングテーブルに前記第1のオーディオ信号の大きさを適用して、第3のオーディオ信号の大きさを検出するオーディオ信号大きさ測定部と、前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び前記第3のオーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するオーディオ信号大きさ制御部と、を備える。
また、前記入力されたオーディオ信号は、リアルタイムにて入力されるオーディオ信号であってもよい。
さらに、前記既に設定されたマッピングテーブルは、前記第1のオーディオ信号の大きさが既に設定された値よりも小さな領域においては、線形マッピングを用いてマッピングを行うテーブルであり、前記第1のオーディオ信号の大きさが既に設定された値よりも大きな領域においては、下記の数式を用いてマッピングを行うテーブルであり、
ここで、iLKFSは、前記第1のオーディオ信号の大きさであり、oLKFSは、前記第3のオーディオ信号の大きさであり、wは、変更可能な重み付け値であってもよい。
さらにまた、本発明の一実施形態によるオーディオ信号大きさの制御装置は、「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記第3のオーディオ信号の大きさとの間の差分である第2の差分」で除算して「オーディオ信号の大きさ制御比」を算出し、前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出し、前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して、新たなピーク重み付け値を算出する重み付け値算出部をさらに備え、前記オーディオ信号大きさ制御部は、前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングして前記入力されたオーディオ信号の大きさを制御してもよい。
本発明の様々な実施形態によれば、ユーザーがマルチメディア機器のボリュームを固定し、様々なオーディオ音源を鑑賞する場合にオーディオ音源の間に発生するオーディオ音の大きさの差分による不便さと高い聴覚的疲労を効果的に低減することができる。
上述した本発明の様々な実施形態によれば、録画及び予め製作された放送番組に対してオーディオ信号の大きさを規格に合うように自動的に制御することができる。これにより、ユーザーがマルチメディア機器のボリュームを固定し、様々なオーディオ音源を鑑賞する場合にオーディオ音源の間に発生する大きさの差分による不便さと高い聴覚的疲労を効果的に低減することができる。
上述した本発明の様々な実施形態によれば、ゲートハンドオーバーが発生するフレームからゲート重み付け値を補間して、ゲート重み付け値の補間によるゲート遅延が発生することを防ぐことができる。
また、ゲート重み付け値が補間される数を可変的に制御することができる。
上述した本発明の様々な実施形態によれば、オーディオ信号の大きさの制御に必要な情報を提供することにより、ユーザーがより手軽にオーディオ信号の大きさを制御することができる。
上述した本発明の様々な実施形態によれば、リアルタイム/ライブで取得されたオーディオ信号のオーディオ信号の大きさを規格に合うように制御することができる。
日常生活を営みながら発生する様々な聴覚的疲労要因を説明するための図である。 オーディオ信号の波形に対する例を示す図である。 オーディオデータのクリッピングによる歪み現象を説明するための図である。 オーディオ及び騒音による聴覚損失を説明するための図である。 デジタル放送番組のオーディオ信号の大きさの正規化を説明するための図である。 オーディオ信号の大きさを測定する方法を示す図である。 プレフィルターの周波数応答特性に対する一例を示すグラフである。 RLBフィルターの周波数応答特性に対する一例を示すグラフである。 録画及び予め製作された放送番組に対する放送システムの構造に対する一例を説明するための図である。 オーディオ信号の大きさを制御する方法に対する第1の実施形態を示す図である。 オーディオ信号の大きさを制御する方法に対する第1の実施形態を具体的に説明するための図である。 オーディオ信号の大きさを調節するためのピーク値に基づくラウドネス制御比の演算に対する基本構造を示す図である。 リアルタイム放送システムの構造に対する一例を示す図である。 オーディオ信号の大きさを制御する方法に対する第2の実施形態を示す図である。 オーディオ信号の大きさを制御する方法に対する第2の実施形態を具体的に説明するための図である。 第1の実施形態及び第2の実施形態の最終端にライブLD制御ステップが追加された方法を説明するための図である。 オーディオ信号の大きさの制御による音質の劣化を補償するための方法に対する第3の実施形態を示す図である。 端末においてオーディオ信号の大きさを制御する方法に対する第4の実施形態を示す図である。 本発明の第1の実施形態によるオーディオ信号大きさの制御装置のオーディオ信号大きさの制御方法を具体的に、示すフローチャートである。 ITU−R 1770−2において言及されたオーディオゲーティング方式が追加されたオーディオ信号の大きさの測定方法を説明するための図である。 本発明の第5の実施形態によるオーディオ信号大きさの制御方法を説明するためにゲートハンドオーバーを説明する図である。 本発明の第5の実施形態によるオーディオ信号大きさの制御方法を説明する図である。 本発明の第5の実施形態による補間の一例である線形補間を説明する図である。 本発明の第2の実施形態の半自動ラウドネス制御モードにおいて提供される情報の一例を示す図である。 本発明の第2の実施形態の半自動ラウドネス制御モードにおいて提供される情報のうち推奨制御要因を算出する方法を示す図である。 本発明の第2の実施形態の自動ラウドネス制御モードにおけるオーディオ信号大きさの制御方法を示す図である。 図26によるマッピングオーディオ信号の大きさ(マッピングLKFS)を算出するためのマッピング曲線を設計するための方法を示す図である。 入力オーディオ信号の波形と正規化したオーディオ信号の波形を比較した図である。 入力オーディオ信号の波形と正規化したオーディオ信号の波形を比較した図である。 入力オーディオ信号の波形と正規化したオーディオ信号の波形を比較した図である。
以下の内容は単に本発明の原理を例示する。そのため、当業者はたとえこの明細書に明確に説明または図示されていないが、本発明の原理を実現し、本発明の概念と範囲に含まれている様々な装置を発明することができる筈である。なお、この明細書に列挙されたあらゆる条件付き用語及び実施形態は、原則的に、本発明の概念を理解させるための目的にのみ明確に意図され、このように特別に列挙された実施形態及び状態に制限的ではないものと理解されるべきである。
また、本発明の原理、観点及び実施形態だけではなく、特定の実施形態を列挙するあらゆる詳細な説明は、このような事項の構造的及び機能的な均等物を含むように意図されるものと理解されるべきである。なお、このような均等物は現在公知の均等物だけではなく、将来に開発される均等物、すなわち、構造とは無関係に同じ機能を行うように発明されたあらゆる素子を備えるものと理解されるべきである。
よって、例えば、この明細書のブロック図は、本発明の原理を具体化させる例示的な回路の概念的な観点を示すものと理解されるべきである。これと同様に、全てのフローチャート、状態変換図、疑似コードなどはコンピューターにて読み取り可能な媒体に実質的に開示することができ、コンピューターまたはプロセッサーが明示されているか否かを問わず、コンピューターまたはプロセッサーにより行われる様々なプロセスを示すものと理解されるべきである。
プロセッサーまたはこれと同じ概念として表示された機能ブロックを備える図示の様々な素子の機能は、専用ハードウェアだけではなく、適切なソフトウェアと関連してソフトウェアを起動する能力を有するハードウェアの使用により提供可能である。プロセッサーにより提供されるとき、前記機能は単一専用プロセッサー、単一共有プロセッサーまたは複数の個別的プロセッサーにより提供可能であり、これらのうちの一部は共有可能である。
また、プロセッサー、制御またはこれと同じ概念として提示される用語の明確な使用は、ソフトウェアを起動する能力を有するハードウェアを排他的に引用して解釈されてはならず、制限なしにデジタル信号プロセッサー(DSP)ハードウェア、ソフトウェアを格納するためのROM、RAM及び不揮発性メモリを暗示的に備えるものと理解されるべきである。周知慣用の他のハードウェアも備えられる。
この明細書の請求範囲において、詳細な説明に記載の機能を行うための手段として表現された構成要素は、例えば、前記機能を行う回路素子の組み合わせまたはフォームウェア/マイクロコードなどをはじめとするあらゆる形式のソフトウェアをはじめとする機能を行うあらゆる方法を含むものと意図され、前記機能を行うように前記ソフトウェアを起動するための適切な回路と結合される。このような請求範囲により定義される本発明は、種々に列挙された手段により提供される機能が結合され、請求項が求める方式と結合されるため、前記機能を提供し得るいかなる手段もこの明細書から把握されるものと均等ものであると理解されるべきである。
上述した目的、特徴及び長所は、添付図面に関する次の詳細な説明から一層明らかになり、これにより、本発明が属する技術分野において通常の知識を有する者が本発明の技術的思想を容易に実施することができる筈である。また、本発明を説明するに当たって、本発明に関する公知技術についての具体的な説明が本発明の要旨を曖昧にする虞があると認められる場合に、その詳細な説明を省略する。
以下、添付図面に基づき、本発明による好適な一実施形態について詳細に説明する。
図3は、オーディオデータクリッピングによる歪み現象を説明するための図である。
音源の波形がデジタルデータにおいて許容可能なデータ分解能の範囲を超える場合、音源の波形が削られ、このような現象がオーディオデータクリッピングである。
図3の(イ)は、クリッピングなし正弦波、(ロ)は、クリッピングなし波形周波数特性、(ハ)は、クリッピング付き正弦波、(ニ)は、クリッピング付き波形の周波数特性を示す。
図3を参照すると、オーディオデータクリッピング現象は、オーディオ信号を歪ませ、単なる正弦波形の周波数特性(図3の(ロ))とクリッピングされた正弦波形の周波数特性(図3の(ニ))を比較したとき、図3の(ニ)の点線で表示された領域のようにクリッピングなし正弦波形に存在しなかった信号歪み成分がオーディオデータクリッピングにより発生することを確認することができる。
一方、オーディオ音の大きさの増加による問題は、携帯用マルチメディア機器の大衆化により増幅されている。現在、マルチメディア機器によりオーディオ聴き取り時間がかなり増えた青少年がかなり高いオーディオ音の大きさを有する音源に持続的に長時間露出されている。
図4を参照すると、1990年代前半のMP3に基づく携帯用マルチメディア機器の登場前と比較して、2000年代の半ばの携帯用マルチメディア機器の方が大衆化したときに米国の青少年の聴覚損失がかなり増大されたことが分かる。
また、韓国でも、騒音性難聴患者が2000年代の前半と後半を比較すれば、約50%増加してマルチメディア機器、騒音環境などによる聴覚的疲労が臨界値を超えて聴覚機能の劣化に影響を及ぼしているということが分かる。
このため、人間が暮らしを営む間に安全にオーディオ及び音楽鑑賞を一生楽しむためにはオーディオによる聴覚的疲労を下げる作業が必要である。
このために、本発明の一実施形態は、マルチメディア機器においてオーディオ音の大きさを正確に測定し、音の大きさを調節する方法に関する。
図5は、デジタル放送番組のオーディオ信号の大きさの正規化を説明するための図である。
韓国では、放送法の改正を通して各放送局、コンテンツ間のオーディオ信号の大きさ(ラウドネス)の差分を低減するための努力が行われている。現在、放送から送出される番組は、放送社間、放送コンテンツ間にかなりの大きさ差を示す。
図5を参照すると、2種類の音楽コンテンツのオーディオ信号の大きさ(例えば、Channel1 :−23.4LKFS, Channel2 : −8.5LKFS)がかなりの差分を示す。このような差分が放送の視聴者にかなりの不便さを引き起こしている。これを克服するために、TTAのPG803 WG8034傘下で「デジタル放送番組音量レベル基準」という内容の標準化作業が行われている。
標準化の目標は、図5に示すように、かなりの大きさ差を有するチャンネル/放送番組を標準化した音量標準規格に基づいて調節して正規化したオーディオ信号の大きさ(例えば、Channel1 : −24LKFS, Channel2 : −24LKFS)を有するように出力する基準を設けるところにある。
前記標準化は放送法と連携される筈であるため、標準の重要性及び使用可能性がかなり高ければ、標準では国際オーディオ信号大きさ測定標準であるITU−1770−1/2に基づいて韓国の状況に合うオーディオ信号基準及び規格を提示する筈であり、これを守るように役立つ技術及び現在のデジタル放送信号の大きさに対する分析などを行う筈である。
図6は、オーディオ信号の大きさを測定する方法を示す図である。
オーディオ信号の大きさ測定方法に対する研究は、2000年代半ばから始まってITUにおいてオーディオ信号の大きさ測定に対する標準であるITU−R BS.1770−1を2006年に発表し、ゲーティング方式が追加されたITU−R BS.1770−2が2011年度に発表された。
発表された標準では、オーディオ信号の大きさ測定に対する方法とトゥルーピーク測定方法のみを提示しており、オーディオ信号の大きさ制御に対する部分は行われていない。これまでもオーディオ信号の大きさを制御する方法に対する部分は標準化が行われていない。
ITU−Rにおいて標準化したオーディオ信号の大きさ測定方法は、図6に示すようなLKFS(loudness, K weighted, relative to nominal full scale)を用いて測定する。
アルゴリズムの最初のモジュール(Pre−filter)においては、人間の頭による音響的影響を考慮するために2次IIRフィルターとして構成される。
図7は、プレフィルター(pre−filter)の周波数応答特性に対する一例を示すグラフである。
フィルターの周波数特性は、図7に示すように、約1kHzを基準として1kHz以下の領域を除去し、1kHz以上の領域に対して通過させる。一般的に多用される48kHzデータに対するフィルター係数は、球状の頭モデルに基づいてITU−R BS.1770−1において提供されている。
図8は、RLBフィルターの周波数応答特性に対する一例を示すグラフである。
第二のモジュール(RLB filter)においては、人間の聴覚的な特性に基づく重み付け値フィルターを適用する。このフィルターは、図8の(イ)に示すように、人間の聴覚が入力された音に対する周波数領域において互いに異なる敏感度を有する特性に基づいている。
例えば、図8の(イ)において最小レベルを基準として250Hzにおける約20dBと1kHzにおける約1dBが同じオーディオ音の大きさとして人間に認知されるということを示している。このため、人間の聴覚を考慮するためのフィルター応答は、図8の(ロ)に示すように、ISO226に定義された同じオーディオ音の大きさ輪郭線を逆に適用した場合と同じフィルター応答を有するように帯域別重み付け値フィルターが設計された。
設計された重み付け値フィルターについて説明すると、低周波領域の重み付け値は減少させたのに対し、1kHz以上の領域は低周波領域に比べて相対的な重み付け値が高く設計された。また、重み付け値フィルターを単純化させるために約1kHz以上の領域は平らに設計された。RLB重み付け値フィルターは、2次IIRフィルター構造を有し、ITU−R文書に48kHzデータに対するフィルター係数を提供している。
重み付け値フィルターを通過した結果は、図6の平均自乗エネルギーモジュールにおいて下記の数式のように変換される。
重み付け値が適用されたエネルギーを下記の数式のように各チャンネルのエネルギーにチャンネル別の重み付け値を適用して合算した後にログ数式に適用してデシベルに変換する。下記の数式により得られた音の大きさに対する単位としては、LKFS(loudness, K weighted, relative to nominal full scale)を用いる。
式中、Nはチャンネル数であり、Gは、チャンネルに対する重み付け値である。
このように設計されたITUに基づくオーディオ音の大きさの測定方法が正確に設計されたか否かを検証するためには、0dB、1kHzの正弦波形を入力した場合、音の大きさの測定値が−3.01 LKFSが出力されなければならない。
既存のオーディオ信号の大きさに対する研究は、大きく2種類に分けられる。第一は、ITU−R1770−1のように人間が聴覚的に認知するオーディオ音量レベルに近い客観的なオーディオ信号の大きさ測定アルゴリズムの開発である。
第二に、既存にはオーディオ信号の大きさが非正規化して転送され、これにより、我々が聴き取るオーディオファイル及び音源の音量がそれぞれ別々であるため互いに異なるサイズを有するオーディオファイルが入力されたときに自動的にオーディオ信号の大きさを制御する研究が行われた。
各国においてオーディオ信号の大きさに対する問題を克服するためにITU−1770−1/2に基づいてオーディオ信号の大きさを測定し、これを基準としてオーディオ信号の大きさ正規化基準値及び誤差範囲を提示している。現在、日本は積極的に行われているが、それ以外の国は未だ初期段階であるか、あるいは、商業広告などの一部分にのみ適用している。
すなわち、標準化及び規制法案に含まれている内容は、正規化基準と誤差範囲、適用範囲を定義しているが、このような規格を守るための方法を提示していない。すなわち、必ず達成しなければならない目標のみを提示し、方法については提示されていない。
一方、2011年3月に改正されたITU−Rオーディオ信号の大きさ測定方法にはオーディオゲーティング方法が追加された。オーディオゲーティングとは、オーディオ音量が低い部分は除いてオーディオ音量を測定するための方法である。
オーディオ音量測定ゲーティングのためのブロックは1周期とし、隣り合うブロックとは75%重なり合う。なお、ファイルの最後にブロック大きさを満たしていないサンプルに対しては測定しない。
まず、ブロック単位の平均自乗は、下記の数式のように演算される。
各ゲートブロックのオーディオ音量は、既存の数式に基づいて下記のように演算される。
各ブロックにゲーティングが適用される場合、ITU−R1770−2においては−70LKFS以上の信号に対してのみ考慮してゲーティングが適用された信号に対するLFKSを下記の数式のように測定する。
改正された方法においては、既存に用いられていたプレフィルター及びRLBフィルターは同様に用いられれば、アルゴリズムの正確度の検証方法もまた同様である。
上述した内容を参照するとき、これまでの標準化及び規制法案に含まれている内容は、正規化基準、誤差範囲、適用範囲を定義しているが、このような規格を守るための方法について明確に開示していない。
これにより、後述する本発明の第1の実施形態によれば、録画及び予め製作された放送番組に対してオーディオ信号の大きさを規格に合うように制御することができる。
また、後述する本発明の第2の実施形態によれば、リアルタイム/ライブで取得された放送番組に対してオーディオ信号の大きさを規格に合うように制御することができる。
さらに、後述する本発明の第3の実施形態によれば、オーディオ信号の大きさの正規化による聴感的オーディオ音質の劣化を極力抑えながらオーディオ信号の大きさを制御することができる。
さらにまた、後述する本発明の第4の実施形態によれば、オーディオ信号の大きさの正規化を考慮して、端末(TV、スマートフォン)における新たなオーディオ制御機能を提供することができる。
図9は、録画及び予め製作された放送番組に対する放送システムの構造に対する一例を説明するための図である。
図9を参照すると、現場で取得されたオーディオデータは、インジェストサーバーに格納され、格納されたファイルは編集システムに転送される。編集システムにおいては、周知の映像/音響効果、オーディオノイズ除去、映像/オーディオ同期化など各パート別に編集が行われる。
パート別の編集が行われたデータは、総合編集システムにおいて最終的に加工が行われ、主調整室において編集済みの放送番組を送出する。このような構造を見るとき、オーディオ信号の大きさ規制による録画及び予め製作された放送番組に対するオーディオ信号の大きさ正規化作業は、編集システム及び総合編集システムにおいて行われてもよい。好ましくは、ファイルとして製作されるステップにおいては、編集システムにおいてオーディオデータをそれぞれ別々に制御するため、編集システムの後処理作業により行われ得る。
図10は、オーディオ信号の大きさを制御する方法に対する第1の実施形態を示す図である。
既存に録画された放送番組ファイルの場合には、格納されたファイルを分析してオーディオ信号の大きさ正規化が行われなければならない。これにより、図10を参照すると、デマルチプレクサーは、既存に録画された放送番組ファイルを分離(demux)してオーディオデータを選択することができる(ステップS101)。
また、正規化判断部は、オーディオデータが予め正規化したか否かを判断することができる(ステップS102)。ここで、正規化とは、上述した図5に示すように、オーディオ信号の大きさを標準化したオーディオ信号の大きさ標準規格に基づいて調節して正規化させることを意味する。
もし、オーディオデータに予め正規化が行われたならば(ステップS102:Y)、正規化が行われたオーディオデータを格納装置に格納することができる(ステップS103)。
もし、オーディオデータに予め正規化が行われなかったならば(ステップS102:N)、オーディオデコーダーは、オーディオデータを復号化させることができる(ステップS104)。また、オーディオ信号の大きさ制御器は、復号化したオーディオデータを用いてオーディオ信号の大きさの正規化を行うことができる(ステップS105)。なお、オーディオエンコーダーは、正規化が行われたオーディオデータを符号化させることができる(ステップS106)。
一方、マルチプレクサーは、符号化したオーディオデータをデマルチプレクサーにおいて選択されていない他のデータと多重化させることができる(ステップS107)。これにより、格納部は、オーディオ信号の大きさが正規化したオーディオデータを格納することができる(ステップS103)。
格納部に格納されたデータは送出室に提供することができる(ステップS108)。
ここで、オーディオ信号の大きさ制御器の具体的な動作については、図11から図12を参照して具体的に説明する。
一方、図示の点線ブロック、例えば、ステップS101、ステップS104、ステップS106、ステップS107は、オーディオデータのフォーマットなどに応じて、且つ、場合によって省略可能である。例えば、オーディオデータの圧縮有無に応じて、ステップS104、ステップS106は省略可能である。
このような本発明の第1の実施形態によれば、録画及び予め製作された放送番組に対してオーディオ音量規格に合うように変換するためのオーディオ音量を制御可能にするために、まず、放送番組制作段階に対する分析を行い、これに基づいて、オーディオ音量規制により必須的なオーディオ音量測定及び制御を行うことができる。
図11は、オーディオ信号の大きさを制御する方法に対する第1の実施形態を具体的に説明するための図である。図12は、オーディオ信号の大きさを調節するためのピーク値に基づくラウドネス制御比演算に対する基本構造を示す図である。以下、図11及び図12を説明するに当たって、図10において説明した部分についての具体的な説明を省略して説明する。
図11を参照すると、制御情報が録画された放送番組を制御するために提供されてもよい。
まず、世界のいくつかの国が規定及び法案で定めた目標値オーディオ信号の大きさ(目標値LKFS)値とオーディオ信号の大きさ誤差範囲が提供されてもよい。一般に、米国/日本は24LKFS(目標値LKFS)+/−2dB(誤差範囲)であり、ヨーロッパーは23LKFS(目標値LKFS)+/−1dB(誤差範囲)の範囲を有する。
オーディオゲーティングに関する部分は、ITU−R1770−2において最初に言及された部分であり、重畳及び移動方式を適用してブロック別のLKFSを測定して低いブロックLKFSを有するものはサイレンスとして見なし、この分に対する平均値を使用しない方式である。
米国のATSCの場合には、AC−3オーディオシステムを用いており、且つ、「ダイヤルノーム」パラメーターをメタデータパラメーターに格納するようになっている。ダイヤルノームにはアンカーエレメントに対する聴覚的オーディオ信号の大きさを入れるようになっており、すなわち、部分には基準点またはエレメントの聴覚的オーディオ信号の大きさを入れるようになっている。
アンカーエレメントは、現在放送番組の中心となるものに対する標準オーディオ信号の大きさを示すものであり、放送番組は、アンカーエレメントを基準として最終的な釣合せが行われる。なお、ダイヤルノームにはLKFS値が格納されるが、変数空間が5bitsであり、−1〜−31LKFS値が格納可能である。
一方、ITU−Rに基づいてオーディオ信号の大きさを測定するためには、2種類のフィルターを適用しなければならない。このため、測定されたLKFSと目標値LKFSとの間の差分値をLKFS測定数式を用いて逆算してオーディオ信号の大きさ変換値を取り出しても二つのフィルターに対する影響があるため正確な値が得られない。
このような問題を克服するために、本発明の第1の実施形態によれば、ピーク値を用いた方式を設計して所望の目標値LKFSに合うオーディオ信号の大きさ変換重み付け値要因を取得するアルゴリズムを提供することができる。
上述したように、入力されたオーディオのLKFS(原値)及び目標値LKFSだけで正確なラウドネス(LD)制御比を上述した理由により求めることができない。
このため、本発明の第1の実施形態によれば、二つのフィルターを考慮したLD制御比を求めるためにピーキング方式を用いてピークに基づく制御比を演算することができる。ピーキング方式とは、ピークに基づく制御比を用いてオーディオ信号をラウドネス制御してピークされたLKFSを取得する方式を意味する。すなわち、オーディオ信号の大きさ制御器は、入力されたオーディオデータ(ステップS105−1)、ピーク重み付け値(例えば、0.9)(ステップS105−2)、目標値LKFS(ステップS105−3)及びLKFS誤差範囲(105−4)を受信してオーディオ信号の大きさを制御するための制御比(ラウドネス制御比)を演算して(ステップS105−5)、LD制御比を算出(ステップS105−6)することができる。具体的に、入力されたオーディオデータに基づいて算出された入力されたオーディオデータのLKFS、入力されたオーディオデータにピーク重み付け値を適用して算出されたピークLKFS及び受信された目標値LKFSを用いて、目標値LKFSに近付けるための重み付け値要因(LD制御比)を演算することができる。
また、オーディオ信号の大きさ制御器は、算出された制御比(LD制御比)を用いて入力されたオーディオ信号の大きさを調節して正規化を行うことができる。
このような本発明の第1の実施形態によれば、録画及び予め製作された放送番組に対してオーディオ信号の大きさを規格に合うように制御することができる。
図13は、リアルタイム放送システムの構造に対する一例を示す図である。
図13を参照すると、ライブ放送システムは、録画放送システムとは多くの違いを示す。中継システムにはインジェストサーバーが組み込まれておらず、パート別の編集システムを別途に用いない。その代わりに、ライブ放送システムにおいては、中継システムがこのような機能をまとめて行う。
中継システムにおいては、映像/音響編集及び効果などの作業を行い、番組の全体の製作を司る副調整室(総合編集室)との相互指示を通じて生中継されるオーディオ音響に対する制御を行う。
このようにして調律された放送番組は、主調整室から送出される。また、衛星を介して受信される生中継データは、オーディオ音響に対する作業及び字幕埋め込みなどの追加作業を副調整室(総合編集室)において行って主調整室を介して送出される。このため、生中継放送のオーディオ音量を正確に制御するためにより多くの変数が存在する。
図14は、オーディオ信号の大きさを制御する装置の方法に対する第2の実施形態を示す図である。
図14を参照すると、ライブ環境においては、上述したように、マイクにより取得された信号と、衛星を介して受信された信号(以下、ライブ放送信号)を考慮することができる。デマルチプレクサーは、ライブ放送信号を分離してオーディオデータを選択することができる(ステップS201)。また、オーディオデコーダーは、選択されたオーディオデータを復号化させることができる(ステップS203)。
また、オーディオ信号の大きさ制御器は、復号化したオーディオデータを用いてオーディオ信号の大きさの正規化を行うことができる(ステップS206)。具体的に、オーディオ信号の大きさ制御器は、ライブオーディオデータのオーディオ信号の大きさを分析して、ライブオーディオ信号の大きさを制御して正規化を行うことができる。ここで、オーディオ信号の大きさ制御器は、ユーザーから手動で入力されたオーディオ信号の大きさ制御値を用いて正規化を行うことができる(ステップS205)。
さらに、オーディオエンコーダーは、正規化が行われたオーディオデータを符号化させることができる(ステップS207)。そして、マルチプレクサーは、符号化したオーディオデータをデマルチプレクサーにおいて選択されていない他のデータと多重化させることができる(ステップS208)。
一方、上述したデータ処理が行われると、データは送出室に提供される(ステップS209)。
ここで、オーディオ信号の大きさ制御器の具体的な動作については、図15を参照して具体的に説明する。
一方、図示の点線ブロック、例えば、ステップS201、ステップS203、ステップS205、ステップS207、ステップS208は、オーディオデータのフォーマットなどに応じて、且つ、場合によって省略可能である。例えば、入力ファイルがオーディオ未加工データである場合には、オーディオ復号化が不要であり、出力としてオーディオ未加工ファイルを求める場合にオーディオ符号化モジュールが不要である。信号がストリーミングにより転送されるとき、オーディオ信号の大きさ制御システムはファイルを分離(デマックス)した後に、オーディオデータが圧縮ビットストリームである場合にオーディオ信号に復号化させ、未加工データである場合にはオーディオ復号化ブロックをバイパスする。オーディオ未加工信号は、ライブオーディオ信号を自動的にオーディオ信号の大きさ基準に従い調節し、調節された信号は、必要に応じて、オーディオ符号化及びファイルフォーマッティングが行われて送出装置を介して放送される。あるいは、出力における要求に応じて、オーディオ未加工ファイルが出力可能である。
図15は、オーディオ信号の大きさを制御する方法に対する第2の実施形態を具体的に説明するための図である。以下、図15を説明するに当たって、図14において説明した部分についての具体的な説明を省略して説明する。
図15を参照すると、既存のシステムとは異なり、提案されたシステムは、オーディオ信号の大きさの正規化に関し(ステップS206)、3種類のモードが採択可能な構造を有することが特徴である。第一は、手動ラウドネス制御モード、第二は、半自動ラウドネス制御モード、第三は、自動ラウドネス制御モードである。各モードはそれぞれ別々に動作可能であり、各モードにおいて動作していて途中に他のモードに切り換え可能であり、モードの切り換えによる両モード間の差分は、モード切り換え制御により補償可能である。
手動ラウドネス制御モードは、人間(例えば、オーディオ信号編集者)が入力されたオーディオ信号の大きさの制御のための重み付け値を手動で選択(例えば、オーディオ信号処理装置に配設された様々なボタンを用いて)し、選択された重み付け値を用いて入力されたオーディオ信号をスケーリングしてオーディオ信号の大きさを目標値オーディオ信号の大きさに整合されるように制御するモードであってもよい。半自動ラウドネス制御モードは、制御のための重み付け値を人間が手動で選択するという点は、手動ラウドネス制御モードと同様であるが、半自動ラウドネス制御モードにおいては、オーディオ信号の大きさの制御に必要な情報(例えば、オーディオ信号の大きさをスケーリングするための重み付け値、入力されたオーディオ信号の大きさ)を人間が利用可能なように、上述した情報を提供するという点で異なる。自動ラウドネス制御モードは、人間の手動制御なしに自動的にオーディオ信号の大きさを目標値オーディオ信号の大きさに整合されるように制御するモードであってもよい。ここで、各モード間を切り換えは、オーディオ信号処理装置に配設された半自動ラウドネス制御モード選択ボタン、手動ラウドネス制御モード選択ボタン、自動ラウドネス制御モード選択ボタンにより行われる。あるいは、オーディオ信号処理装置は、ラウドネス制御モードの切り換えのための一つのモード切り換えボタンを備えていてもよく、このモード切り換えボタンが選択されれば、各モードの間に順次に切り換えられる。
一方、モード切り換えによる両モード間の差分は、モード切り換え制御により補償可能である。例えば、半自動ラウドネス制御モードから自動ラウドネス制御モードに切り換えられる場合、ピーク重み付け値が変更可能であり、または、図22及び図23に説明された、ゲート重み付け値を補間する必要がある。この場合、モード切り換え制御は、このような変化を補償する動作を行うことができる。
また、図15において、リアルタイム入力オーディオ信号に対しては、目標値オーディオ信号の大きさ(目標値LKFS)に合わせるために必要な重み付け値は、上述したピーキング方式により演算可能である。
このような本発明の第2の実施形態によれば、リアルタイム/ライブで取得された放送番組に対してオーディオ信号の大きさを規格に合うように制御することができる。
図16は、第1の実施形態及び第2の実施形態の最終端にライブLD制御ステップが追加された方法を説明するための図である。図16を参照すると、本発明の第1の実施形態及び第2の実施形態による方法の最終端にライブLD制御ステップをさらに含んでいてもよい。
すなわち、上述したところによれば、ファイル/ローカル放送番組は、ローカルLD制御(ステップS105)により格納部に格納されていて(ステップS103)、送出するのに使用可能である。また、上述したところによれば、ライブ放送番組は、ライブLD制御(ステップS206)を用いてリアルタイム処理して送出することができる。
但し、放送局にとっては、規制に備えるために、最終端にライブLD制御(ステップS210)をさらに行うことができる。すなわち、放送局にとっては、前端において誤って入力された放送番組が転送されるとしても、最終端において探し出すようにライブLD制御(ステップS210)をさらに設けてもよい。この場合、ライブLD制御(ステップS210)においては、手動ラウドネス制御モード、半自動ラウドネス制御モードまたは自動ラウドネス制御モードを利用することができる。但し、好ましくは、24時間常に自動的に処理できるように自動ラウドネス制御モードが利用可能である。
図17は、オーディオ信号の大きさの制御による音質の劣化を補償するための方法に対する第3の実施形態を示す図である。
オーディオ信号の大きさを制御する方法は、上述したように、入力されるデータの条件に応じて種々に行われる。但し、オーディオ信号の大きさを目標値LKFS及び誤差範囲に合わせると、オーディオ信号の構成が平らであるという感じが強くなることがある。
これは、オーディオ信号の大きさの正規化による逆効果である。オーディオ信号の大きさの正規化の目的を達成しながら、正規化による逆効果を解決しなければ、オーディオ正規化の波及力及びユーザーの満足度が向上できない。
これにより、本発明の第3の実施形態によれば、上述した逆効果を補償するための聴覚的劣化補償モジュールをさらに備えていてもよい。すなわち、図17を参照すると、デマルチプレクサーは、既存に録画された放送番組データまたはライブ放送番組データを分離してオーディオデータを選択することができる(ステップS301)。
また、正規化判断部は、オーディオデータが予め正規化したか否かを判断することができる(ステップS302)。
もし、オーディオデータに予め正規化が行われたならば(ステップS302:Y)、正規化が行われたオーディオデータに対する今後の手続きを行うことができる(ステップS303)。
もし、オーディオデータに予め正規化が行われなかったならば(ステップS302:N)、オーディオデコーダーはオーディオデータを復号化させることができる(ステップS304)。そして、Live Audi Mixing & EQなどの編集者制御を行うことができる(ステップS305)。なお、オーディオ信号の大きさ制御器は、復号化したオーディオデータを用いて、オーディオ信号の大きさの正規化を行うことができる(ステップS306)。
さらに、聴覚的劣化補償モジュールは、オーディオ信号の大きさ制御器において行われた正規化による逆効果を補償することができる(ステップS307)。なお、オーディオエンコーダーは、聴覚的劣化補償が行われたオーディオデータを符号化させることができる(ステップS308)。
そして、マルチプレクサーは、符号化したオーディオデータをデマルチプレクサーにおいて選択されていない他のデータと多重化させることができる(ステップS309)。
一方、図示の点線ブロック、例えば、ステップS301、ステップS304、ステップS308、ステップS309は、オーディオデータのフォーマットなどに応じて、且つ、場合によって省略可能である。例えば、オーディオデータの圧縮有無に応じて、ステップS304及びステップS308は省略可能である。
このような本発明の第3の実施形態によれば、オーディオ信号の大きさの正規化による聴感的オーディオ音質の劣化を極力抑えながらオーディオ信号の大きさを制御することができる。
一方、上述した方法によるオーディオ信号の大きさ正規化は、デジタル放送消費者にかなりの聴き取り環境の変化を引き起こす。また、オーディオ信号の大きさが正規化することにより、デジタル放送端末に新たに求められるサービス/機能が生成可能である。すなわち、デジタル放送端末において放送オーディオ音量に関する機能を提供することができる。
図18は、端末においてオーディオ信号の大きさを制御する方法に対する第4の実施形態を示す図である。以下、図18を説明するに当たって、図17において説明した部分(正規化したオーディオ信号の転送に関する処理部分(ステップS301〜S3010)についての具体的な説明を省略して説明する。
図18を参照すると、端末は、正規化したオーディオ信号を受信し(ステップS401)、受信されたオーディオ信号を処理して(ステップS402)、出力することができる(ステップS403)。ここで、オーディオ信号処理(ステップS402)は、例えば、ユーザー注文型により制御可能である。すなわち、デジタル放送においては、放送に関する情報がユーザーに提供され、ユーザーが持続的に端末を用いる場合、ユーザーの使用情報も累積される。このような情報に基づいて、ユーザー情報の分析が行われてユーザーに注文型オーディオ音響サービスを提供することができる。また、ユーザー設定情報により放送情報に基づくユーザー音響サービスが直ちに適用可能である。
図19は、本発明の第1の実施形態によるオーディオ信号大きさの制御装置のオーディオ信号大きさの制御方法を具体的に示すフローチャートである。図19を参照すると、まず、オーディオ信号が入力される(ステップS501)。ここで、入力されたオーディオ信号は、例えば、図10から図12に示す分離、復号化などの動作(省略可能な動作)によるオーディオ信号であってもよい。このようなオーディオ信号は、様々な波形を有していてもよく、例えば、図5の前端に示す(すなわち、正規化する前の)波形を有するオーディオ信号であってもよい。
この場合、オーディオ信号大きさ測定部は、図6から図8において説明されたオーディオ信号の大きさ測定方法を用いて、入力オーディオ信号のLKFS(原値LKFS)を測定することができる(ステップS503)。
また、オーディオ信号大きさ測定部は、初期ピークLKFSを測定(ステップS502)することができる。ここで、初期ピークLKFSは、既に設定された初期ピーク重み付け値を用いて、入力されたオーディオ信号をスケーリングし、スケーリングされたオーディオ信号に基づいてLKFSを測定することにより測定可能である。
ここで、既に設定された初期ピーク重み付け値と、オーディオ信号及び映像信号を含む放送信号に制御情報の形で提供可能である。または、オーディオ信号大きさの制御装置の設計当時に既に格納された値として提供可能である。または、ユーザーからの入力により提供可能である。
一方、重み付け値算出部は、最初には(ステップS505:Y)、目標値LKFS(ステップS504)と、測定された初期ピークLKFS(初期ピーク重み付け値)(ステップS502)及び測定された入力オーディオ信号のLKFS(原値LKFS)(ステップS503)を用いて、オーディオ信号の大きさ制御比(ラウドネス制御比)を算出することができる(ステップS506)。具体的に、重み付け値算出部は、下記の数式9を用いてオーディオ信号の大きさ制御比(ラウドネス制御比)を算出することができる。
ここで、オーディオ信号の大きさ制御比(ラウドネス制御比)は、diff1/diff2であってもよい。
また、重み付け値算出部は、算出されたオーディオ信号の大きさ制御比(ラウドネス制御比)を下記の数式10に適用して新たなピーク重み付け値を算出することができる(ステップS507)。
ここで、new_Peek_weightとは、新たなピーク重み付け値を意味し、previous_Peek_weightとは、new_Peek_weightの算出前に用いたピーク重み付け値を意味し、new_weightとは、数式10において算出された重み付け値を意味する。例えば、上述した数式9及び10によれば、最初には(ステップS505:Y)、初期ピーク重み付け値に新たな重み付け値を乗算して、新たなピーク重み付け値を算出することができる。
一方、数式10によれば、原値LKFSとピークLKFSとの間の差分が原値LKFSと目標値LKFSとの間の差分よりも小さな場合には、以前のピーク重み付け値をデクリメントして新たなピーク重み付け値を算出し、原値LKFSとピークLKFSとの間の差分が原値LKFSと目標値LKFSとの間の差分よりも大きな場合には、以前のピーク重み付け値をインクリメントして新たなピーク重み付け値を算出することができる。
このような数式10においては、デクリメントのための重み付け値としては0.9、インクリメントのための重み付け値としては1.1を用いたが、このような重み付け値に限定されるものではなく、様々な重み付け値が使用可能である。例えば、より細かいオーディオ信号の大きさの調節のために、デクリメントのための重み付け値としては0.99、インクリメントのための重み付け値としては1.01が使用可能である。
一方、ここで、目標値LKFSは、世界のいくつかの国が規定及び法案で定めた目標値LKFSに応じて異なる。例えば、図5の後端に示す(すなわち、正規化した後)ように、目標値LKFSは?24LKFSであってもよい。このような目標値LKFSは、オーディオ信号及び映像信号を含む放送信号に制御情報の形式で提供可能である。または、オーディオ信号大きさの制御装置の設計当時に既に格納された値として提供可能である。または、ユーザーからの入力により提供可能である。
一方、オーディオ信号大きさ制御部は、上述した動作により算出された新たなピーク重み付け値を用いてオーディオ信号の大きさを制御することができる。具体的に、オーディオ信号大きさ制御部は、算出された新たなピーク重み付け値を用いて入力されたオーディオ信号(ステップS501)をスケーリングすることにより、オーディオ信号の大きさを制御することができる(ステップS508)。
また、オーディオ信号大きさ測定部は、新たなピーク重み付け値に応じてオーディオ信号の大きさが制御されたオーディオ信号(ステップS508)のLKFS(新たなピークLKFS)を測定することができる(ステップS509)。
一方、オーディオ信号大きさ制御部は、目標値LKFS(ステップS504)と測定された新たなピークLKFS(ステップS509)を比較して、LKFS誤差を算出することができる(ステップS511)。
そして、オーディオ信号大きさ制御部は、LKFS誤差(D)と既に設定された誤差範囲(T)を比較することができる(ステップS512)。例えば、目標値LKFSとオーディオ信号の大きさの誤差範囲が24LKFS(目標値LKFS)+/−2dB(誤差範囲)である場合、目標値LKFSと新たなピークLKFSとの間の差分が誤差範囲よりも大きいか否かを判断することができる。このような既に設定された誤差範囲(LKFS誤差範囲)(ステップS510)は、オーディオ信号及び映像信号を含む放送信号に制御情報の形式で提供可能である。または、オーディオ信号大きさの制御装置の設計当時に既に格納された値として提供可能である。または、ユーザーからの入力により提供可能である。
もし、目標値LKFSと新たなピークLKFSとの間の差分が誤差範囲よりも小さな場合(ステップS513:Y)、オーディオ信号大きさ制御部は、新たなピーク重み付け値に応じて、オーディオ信号の大きさが制御されたオーディオ信号を出力することができる。
もし、目標値LKFSと新たなピークLKFSとの間の差分が誤差範囲よりも大きな場合(ステップS513:N)、オーディオ信号大きさ制御部は、上述した制御動作を繰り返し行うように制御することができる。ここで、上述した制御動作を繰り返し行う場合、重み付け値算出部は最初ではないため(ステップS505:N)、目標値LKFS(ステップS504)と、測定された新たなピークLKFS(ステップS509)及び測定された原値LKFS(ステップS503)を用いて、新たなオーディオ信号の大きさ制御比(ラウドネス制御比)を算出することができる(ステップS506)。この場合、重み付け値算出部は、上述した数式9を用いてラウドネス制御比を算出することができる。また、重み付け値算出部は、算出されたオーディオ信号の大きさ制御比(ラウドネス制御比)を上述した数式10に適用して新たなピーク重み付け値を算出することができる(ステップS507)。すなわち、オーディオ信号の大きさが目標値LKFS及び誤差範囲を満たすまで、上述した動作を繰り返し行うことができる。
一方、本発明の第1の実施形態による入力オーディオ信号(ステップS501)は、予め製作された放送番組に対するオーディオ信号であるが、放送番組の開始から終了までに対するオーディオ信号であってもよい。これにより、本発明の第1の実施形態によれば、放送番組の開始から終了までに対するオーディオ信号のオーディオ信号の大きさ(原値LKFS)に基づいて、オーディオ信号の大きさを制御することができる。
一方、出力されたオーディオ信号(ステップS513)には、図10から図12に示す符号化動作、多重化動作(省略可能)などが行われてもよい。
このような本発明の第1の実施形態によるオーディオ信号大きさの制御装置または方法は、オーディオ信号を製作する製作者側、または、製作されたオーディオ信号を供給する供給者側に配設または実行可能である。または、本発明の第1の実施形態によるオーディオ信号大きさの制御装置または方法は、オーディオ信号を提供されて出力するユーザー側(例えば、MP3プレーヤーなどの携帯用マルチ機器)に配設または実行可能である。
上述した本発明の第1の実施形態によれば、録画及び予め製作された放送番組に対してオーディオ信号の大きさを規格に合うように自動的に制御することができる。
図20は、ITU−R1770−2において言及されたオーディオゲーティング方式が追加されたオーディオ信号の大きさ測定方法を説明するための図である。ここで、オーディオゲーティング方式は、図20に示すように、ゲートブロック1に対するLKFSを測定し、重畳及び移動方式を適用して、ゲートブロック2に対するLKFSを測定し、重畳及び移動方式を繰り返し行ってゲートブロック別のLKFSを測定し、測定されたゲートブロックのLKFSが臨界LKFS(ITU−R1770−2においては、−70LKFS)以下であれば、一括処理して、ゲーティングが適用されたオーディオ信号に対するオーディオ信号の大きさの測定を行うことができる。
ここで、上述したゲートブロックに対し、ITU−R1770−2においては、ゲートブロックは0.4sのゲートサイズを有し、75%重畳される構造を有している。
一方、リアルタイム/ライブ環境においては、オーディオ信号がそれぞれのゲートブロック別に取得されるが、それぞれのゲートブロック別のLKFSが、上述した数式4及び5により測定され、それぞれのゲートブロック別にオーディオ信号の大きさを制御するための新たなピーク重み付け値が、上述した図19の方法により算出される。但し、それぞれのゲートブロック別に算出された新たなピーク重み付け値を用いて、それぞれのゲートブロック別にオーディオ信号の大きさを制御すれば、隣り合うゲートブロック間の重み付け値の差分により、不連続的な音が発生する虞がある。
このような問題を解消するために、本発明の第5の実施形態によるオーディオ信号大きさの制御方法は、下記の処理を行うことができる。
図21は、本発明の第5の実施形態によるオーディオ信号大きさの制御方法を説明するためにゲートハンドオーバーを説明する図である。図21を参照すると、ゲートブロックの非重畳領域のゲートサイズは、例えば、4800サンプルであってもよい。また、AAC、AC−3などのコーデックを用いる場合、一回に受け取るデータサイズを決定する一枚のフレームのサイズは、1024サンプルであってもよい。この場合、一枚のフレームが二つのゲートブロックに跨るゲートハンドオーバーが発生する虞がある。
図22は、本発明の第5の実施形態によるオーディオ信号大きさの制御方法を説明する図である。図22を参照すると、本発明の第5の実施形態によるオーディオ信号大きさの制御方法は、ゲートハンドオーバーが発生するフレームからゲート重み付け値を補間してオーディオ信号の大きさを制御することができる。ここで、ゲート重み付け値は、それぞれのゲートブロックに対して上述した図19の方法を用いて算出した新たなピーク重み付け値であってもよい。
このような本発明の第5の実施形態によれば、ゲート重み付け値の補間によるゲート遅延が発生しない。すなわち、ゲートハンドオーバーが発生するフレームにおいてデータが受信される時点では、ゲートハンドオーバーが発生するフレームが跨る二つのゲートブロックに対するゲート重み付け値を予め算出することができるため、予め算出された二つのゲートブロックに対するゲート重み付け値を用いて、ゲートハンドオーバーが発生するフレーム時点から遅延なしにゲート重み付け値を補間することができるためである。
一方、本発明の第5の実施形態によれば、ゲート重み付け値を補間するために、様々な補間方法を用いることができる。例えば、この線形補間を用いることができる。これについては、図23を参照して具体的に説明する。
図23は、本発明の第5の実施形態による補間の一例である線形補間を説明する図である。図23を参照すると、下記の数式のような線形補間を用いることができる。
数式11において、WG1は、ゲートブロック1のゲート重み付け値であり、WG2は、ゲートブロック2のゲート重み付け値であり、iは、補間するゲート重み付け値の数であり、InterFrameは、補間開始フレームから種類フレームまでのフレーム枚数である。
例えば、InterFrameの数を3にして前記数式11に適用すれば、図22に示すように、二枚のフレームに適用されるゲート重み付け値(赤色で示す重み付け値:W、W2)が算出可能である。すなわち、InterFrameの数の選択的に調節して、ゲート重み付け値が補間される数を可変的に制御することができる。
一方、上述した本発明の第5の実施形態によるゲート重み付け値補間方法は、ゲート重み付け値を用いてオーディオ信号の大きさを制御する方法にいずれも適用可能である。例えば、既存に録画された放送番組に適用されてオーディオ信号の大きさを制御することができ、ライブ放送番組に適用されてオーディオ信号の大きさを制御することができる。
また、本発明の第5の実施形態によるオーディオ信号大きさの制御装置または方法は、オーディオ信号を製作する製作者側、または、製作されたオーディオ信号を供給する供給者側に配設または実行可能である。または、本発明の第5の実施形態によるオーディオ信号大きさの制御装置または方法は、オーディオ信号を提供されて出力するユーザー側(例えば、MP3プレーヤーなどの携帯用マルチ機器)に配設または実行可能である。
このような本発明の第5の実施形態によれば、ゲートハンドオーバーが発生するフレームからゲート重み付け値を補間して、ゲート重み付け値の補間によるゲート遅延が発生することを防ぐことができる。
また、ゲート重み付け値が補間される数を可変的に制御することができる。
図24は、本発明の第2の実施形態の半自動ラウドネス制御モードにおいて提供される情報の一例を示す図である。ここで、半自動ラウドネス制御モードは、制御のための重み付け値を人間が手動で選択するという点は、手動ラウドネス制御モードと同様であるが、半自動ラウドネス制御モードにおいてはオーディオ信号の大きさの制御に必要な情報を人間が利用できるように、上述した情報を提供するという点で相違点がある。
このような半自動ラウドネス制御モードにおいて提供されるオーディオ信号の大きさの制御のための情報は、図24に示すように、瞬間LKFS601、短期(3s)LKFS602、集積LKFS603、再生LKFS604、残留LKFS605、推奨制御要因606のうちの少なくとも一つを備えていてもよい。
ここで、瞬間LKFS601は、ゲートブロックに入力されたオーディオ信号に対するLKFS(例えば、図20に示すように、0.4Sの間に入力されたオーディオ信号に対するLKFS)、短期(3s)LKFS602は、3Sの間に入力されたオーディオ信号に対するLKFS、集積LKFS603は、これまで入力されたオーディオ信号に対するLKFS、再生LKFS604は、これまで出力されたオーディオ信号に対するLKFS、残留LKFS605は、目標値LKFSに比べての再生LKFS604の不足分または超過分のLKFS、推奨制御要因606は、残留LKFS605を用いて算出したオーディオ信号の大きさを制御するための重み付け値であってもよい。
このような瞬間LKFS601、短期(3s)LKFS602、集積LKFS603は、上述した数式4及び5を用いて測定することができる。
一方、再生LKFS604は、出力されたオーディオ信号(すなわち、上述した図22から図23の動作に応じて、オーディオ信号の大きさが制御されてオーディオ再生装置に出力可能である。)、すなわち、オーディオ信号の大きさが制御されたオーディオ信号であるという点で、オーディオ信号の大きさが制御されていない入力オーディオ信号に対するLKFSである集積LKFS603とは異なる。
このような再生LKFS604は、下記の数式12を用いて算出することができる。
ここで、xは、LKFS測定アルゴリズムに定義された二つのフィルターを通過した信号に対してこれまで出力されたオーディオ信号であり、Mは、ゲートブロックのサンプル数であり、Nは、これまでオーディオ信号が入力されたゲートブロックの数である。
すなわち、図20を参照すると、リアルタイム/ライブ環境においては、毎回ゲートブロックごとにオーディオ信号が入力されるため、数式12に示すように、これまで出力されたオーディオ信号の平均(played_mean)を持続的に演算しなければならない。これにより、平均(played_mean)が得られると、ITU−R1770−2に言及された数式に適用して再生LKFS604を測定することができる。
一方、上述した数式12のように計算する場合、オーディオ信号に対するデータが多くなると、N値がかなり大きくなるため、固定点プロセッサーの場合、previous_MeanとN−1との間の乗算の結果がプロセッサー範囲を超える場合がある。なお、浮動点プロセッサーにおいてもかなり大きな値になる。プロセッサーの処理及びメモリの格納容量に負担が生じる虞がある。
このような問題を補うために、本発明の一実施形態によれば、下記の数式13に示すように、Nを乗算する方式ではなく、Nを除算する方式を用いて、これまで出力されたオーディオ信号に対する平均(present_mean)を算出することができる。この場合、算出されたpresent_meanを上述した数式12のplayed_meanに適用することにより、再生LKFS604を測定することができる。この場合、プロセッサーの処理及びメモリの格納容量への負担が軽減される。
図25は、本発明の第2の実施形態の半自動ラウドネス制御モードにおいて提供される情報のうちの推奨制御要因を算出する方法を示す図である。図25を参照すると、下記の数式14を用いて残留LKFS605を測定し、測定された残留LKFS605を用いて推奨制御要因606を算出することができる。
ここで、残留LKFS605は、再生LKFS604、目標値LKFS607、合計で出力されるオーディオ信号の時間(Total Play Time(Ts))608、現在出力されたオーディオ信号の時間(Played Time(Ps))609を用いて算出することができる。このような数式14を参照すると、残留LKFS605とは、目標値LKFSに比べての再生LKFS604の不足分または超過分のLKFSを意味する。
推奨制御要因606は、残留LKFS605を用いて算出したオーディオ信号の大きさを制御するための重み付け値であってもよい。すなわち、残留LKFS605とは、目標値LKFS607に比べての再生LKFS604の不足分または超過分のLKFSを意味するが、重み付け値算出部は、残留LKFS605を用いて、合計で出力されるオーディオ信号のオーディオ信号の大きさが目標値LKFS607になるための重み付け値を算出することができる。
一方、上述した瞬間LKFS601、短期(3s)LKFS602、集積LKFS603、再生LKFS604、残留LKFS605、推奨制御要因606などの半自動ラウドネス制御モードにおいては、オーディオ信号の大きさ制御に必要な情報は、オーディオ信号大きさの制御装置に配設された表示画面を介して提供可能である。
このような本発明の実施形態によれば、オーディオ信号の大きさの制御に必要な情報を提供することにより、リアルタイム/ライブ環境においてユーザーがより手軽にオーディオ信号の大きさを制御することができる。
図26は、本発明の第2の実施形態の自動ラウドネス制御モードにおけるオーディオ信号大きさの制御方法を示す図である。ここで、自動ラウドネス制御モードは、人間の手動制御なしに自動的にオーディオ信号の大きさを目標値オーディオ信号の大きさに整合されるように制御するモードであってもよい。このような自動ラウドネス制御モードにおいては、各ゲートブロック別に適用されるべきゲート重み付け値を自動的に算出しなければならない。
このために、本発明の一実施形態による自動ラウドネス制御モードにおいては、重み付け値算出部は、それぞれのゲートブロック別にリアルタイム取得された入力オーディオ信号の大きさ(原値LKFS)、それぞれのゲートブロック別にリアルタイムにて取得された入力オーディオ信号にピーク重み付け値を用いてスケーリングしたオーディオ信号の大きさ(ピークLKFS)、入力されたオーディオ信号の大きさ(原値LKFS)をマッピング曲線に適用して算出されたマッピングLKFSを用いて、ゲート別にオーディオ信号をスケーリングするためのゲート重み付け値を自動的に算出し、オーディオ信号大きさ制御部は、算出されたゲート重み付け値を用いてオーディオ信号の大きさを制御することができる。
ここで、マッピング曲線は、オーディオ信号の開始から終了までに対して入力された全体のオーディオ信号のオーディオ信号の大きさを目標値オーディオ信号の大きさ(目標値LKFS)(例えば、−24LKFS)にしながら、出力されるオーディオ信号の全体的なサイズバラツキは維持するようにした曲線であってもよい。すなわち、入力された全体のオーディオ信号のオーディオ信号の大きさを目標値オーディオ信号の大きさ(目標値LKFS)(例えば、−24LKFS)にする正規化作業が行われると、それぞれのゲートブロック別にオーディオ信号の大きさが小さなブロックはサイズが大きくなり、サイズが大きなブロックはサイズが小さくなるが、人間の耳に伝達される音の大きさのバラツキが小さくなって問題になる虞がある。これにより、本発明の一実施形態によれば、出力されるオーディオ信号の全体的なサイズバラツキを維持するマッピング曲線を用いることにより、人間の耳に伝達される音の大きさのバラツキを維持することができる。
一方、重み付け値算出部は、上述した数式9の目標値LKFSにマッピングLKFSを適用してオーディオ信号の大きさ制御比(ラウドネス制御比)であるdiff1/diff2を算出し、算出されたオーディオ信号の大きさ制御比(ラウドネス制御比)を数式10に適用してゲート重み付け値(新たなピーク重み付け値)を算出することができる。
また、オーディオ信号大きさ制御部は、それぞれのゲートブロック別に算出されたオーディオ信号をスケーリングするためのゲート重み付け値を用いてオーディオ信号の大きさを制御することができる。このような動作に関する具体的な説明は、図19において上述したため省略する。
図27は、図26によるマッピングオーディオ信号の大きさ(マッピングLKFS)を算出するためのマッピング曲線を設計するための方法を示す図である。ここで、マッピング曲線は、それぞれのゲートブロック別に入力されたオーディオ信号の大きさ(原値LKFS)とマッピングオーディオ信号の大きさ(マッピングLKFS)との間の関係を示す曲線である。図27(a)を参照すると、マッピング曲線を設計するために、主要LKFS領域と非主要LKFS領域(低いLKFS領域)を分離してマッピング曲線を設計することができる。
ここで、非主要LKFS領域(低いLKFS領域)は、人間の耳に小さく伝達される入力オーディオ信号の大きさが既に設定された値よりも小さなLKFS領域であってもよく、主要LKFS領域は、人間の耳に大きく伝達される入力オーディオ信号の大きさが既に設定された値よりも大きなLKFS領域であってもよい。
すなわち、図27(b)を参照すると、主要LKFS領域は、可変重み付け値に基づいてマッピング曲線を設計し、非主要LKFS領域は、線形状にマッピング曲線を設計することができる。
ここで、主要LKFS領域に対するマッピング曲線は、下記の数式15を用いて設計することができる。
ここで、iLKFSは、ゲート別に入力されるオーディオ信号の大きさ(原値LKFS)であり、oLKFSは、ゲート別にマッピングされたオーディオ信号の大きさ(マッピングLKFS)であり、wは、重み付け値である。これにより、主要LKFS領域に対する可変マッピング曲線を生成することができる。このようなマッピング曲線は、マッピング曲線を制御して調節可能である。
このような本発明の一実施形態によれば、入力されたオーディオ信号をマッピング曲線を用いて正規化させて出力することにより、正規化して出力されるオーディオ信号が入力されたオーディオ信号の大きさのバラツキを維持することができ、これにより、人間の耳に伝達される音の大きさのバラツキを維持することができる。
図28から図30は、入力オーディオ信号の波形と正規化したオーディオ信号の波形を比較した図である。
図28(a)は、popの入力オーディオ信号の波形、図28(b)は、popの正規化したオーディオ信号の波形を示す図である。図28を参照すると、入力オーディオ信号の大きさは−22.23LKFSであったが、上述した正規化動作が行われて正規化したオーディオ信号の大きさは−22.72LKFSになって目標値オーディオ信号の大きさ及び誤差範囲内に正規化したことが分かる。
図29(a)は、Kpopの入力オーディオ信号の波形、図29(b)は、Kpopの正規化したオーディオ信号の波形を示す図である。図29を参照すると、入力オーディオ信号の大きさは−8.9LKFSであったが、上述した正規化動作が行われて正規化したオーディオ信号の大きさは−23.28LKFSになって目標値オーディオ信号の大きさ及び誤差範囲内に正規化したことが分かる。
図30(a)は、クラシックの入力オーディオ信号の波形、図30(b)は、クラシックの正規化したオーディオ信号の波形を示す図である。図30を参照すると、入力オーディオ信号の大きさは−26LKFSであったが、上述した正規化動作が行われて正規化したオーディオ信号の大きさは−25.34LKFSになって目標値オーディオ信号の大きさ及び誤差範囲内に正規化したことが分かる。
一方、上述した本発明の様々な実施形態による方法は、コンピューターにおいて実行されるためのプログラムとして製作されてコンピューターにて読み取り可能な記録媒体に格納可能であり、コンピューターにて読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ格納装置などが挙げられ、なお、キャリアウェーブ(例えば、インターネットを介して転送)の形式で実現されるものも含む。
コンピューターにて読み取り可能な記録媒体は、ネットワークを介して接続されたコンピューターシステムに分散されて、分散方式を用いてコンピューターにて読み取り可能なコードが格納されて実行可能である。なお、前記方法を実現するための機能的なプログラム、コード及びコードセグメントは、本発明が属する技術分野におけるプログラマーにより容易に推論可能である。
また、以上、本発明の好適な実施形態について図示及び説明したが、本発明は上述した特定の実施形態に何ら限定されるものではなく、請求範囲において請求する本発明の要旨を逸脱することなく、当該発明が属する技術分野において通常の知識を有する者により様々な変形実施が行えるということはいうまでもなく、このような変形実施は本発明の技術的思想や見込みから個別的に理解されてはならない。

Claims (40)

  1. 入力されるオーディオ信号の大きさを測定するステップと、
    前記測定された原オーディオ信号の大きさにピーク重み付け値を適用してピークオーディオ信号の大きさを求めるステップと、
    前記原オーディオ信号の大きさ及び前記ピークオーディオ信号の大きさを用いて、オーディオ信号の大きさを調整するための制御比を求めるステップと、
    前記求められた制御比に基づいて、入力されるオーディオ信号の大きさを調節するステップと、
    を含むオーディオ信号大きさの制御方法。
  2. 前記制御比に基づいて調整されたオーディオ信号の大きさが目標とするオーディオ信号の大きさの誤差範囲内に存在するか否かを確認するステップをさらに含む請求項1に記載のオーディオ信号大きさの制御方法。
  3. 前記制御比に基づいて調整されたオーディオ信号の大きさが前記誤差範囲から外れた場合、
    前記ピークオーディオ信号の大きさを前記制御比に基づいて調整されたオーディオ信号の大きさとして前記制御比を再計算するステップをさらに含む請求項2に記載のオーディオ信号大きさの制御方法。
  4. 前記制御比に基づいて調整されたオーディオ信号の大きさが前記誤差範囲内に存在するまで前記制御比を再計算するステップが繰り返し行われる請求項3に記載のオーディオ信号大きさの制御方法。
  5. 前記誤差範囲は、ユーザーにより設定可能である請求項2に記載のオーディオ信号大きさの制御方法。
  6. 請求項1から請求項5のうちのいずれか一項に記載の方法をコンピューターに実行させるためのプログラムを記録した記録媒体。
  7. 入力されるオーディオ信号の大きさを測定する大きさ測定部と、
    前記測定された原オーディオ信号の大きさにピーク重み付け値を適用してピークオーディオ信号の大きさを求める重み付け値適用部と、
    前記原オーディオ信号の大きさ及び前記ピークオーディオ信号の大きさを用いて、オーディオ信号の大きさを調整するための制御比を求める制御比計算部と、
    前記求められた制御比に基づいて、入力されるオーディオ信号の大きさを調節する制御部と、
    を備えるオーディオ信号大きさの制御装置。
  8. 前記制御部は、
    前記制御比に基づいて調整されたオーディオ信号の大きさが目標とするオーディオ信号の大きさの誤差範囲内に存在するか否かを確認し、
    前記制御比に基づいて調整されたオーディオ信号の大きさが前記誤差範囲から外れた場合、前記ピークオーディオ信号の大きさを前記制御比に基づいて調整されたオーディオ信号の大きさとして前記制御比を再計算するように前記制御比計算部を制御する請求項7に記載のオーディオ信号大きさの制御装置。
  9. 前記制御部は、
    前記制御比に基づいて調整されたオーディオ信号の大きさが前記誤差範囲内に存在するまで前記制御比を繰り返し再計算するように前記制御比計算部を制御する請求項8に記載のオーディオ信号大きさの制御装置。
  10. 前記誤差範囲は、ユーザーにより設定可能である請求項8に記載のオーディオ信号大きさの制御装置。
  11. オーディオ信号大きさの制御方法において、
    入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定するステップと、
    既に設定された初期ピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングし、前記スケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定するステップと、
    前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び目標値オーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するステップと、
    を含む制御方法。
  12. 前記制御するステップは、
    「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の差分である第2の差分」で除算して、「オーディオ信号の大きさ制御比」を算出するステップと、
    前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出するステップと、
    前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して、新たなピーク重み付け値を算出するステップと、
    前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングするステップと、
    を含む請求項11に記載の制御方法。
  13. 前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の第3の差分を既に設定された誤差範囲と比較するステップをさらに含むことを特徴とする請求項12に記載の制御方法。
  14. 前記比較の結果、前記第3の差分が前記既に設定された誤差範囲よりも大きければ、前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさを前記第2のオーディオ信号の大きさとして、前記入力されたオーディオ信号の大きさを制御するステップをさらに含むことを特徴とする請求項13に記載の制御方法。
  15. オーディオ信号大きさの制御装置において、
    入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定し、前記入力されたオーディオ信号に既に設定された初期ピーク重み付け値を適用してスケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定するオーディオ信号大きさ測定部と、
    前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び目標値オーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するオーディオ信号大きさ制御部と、
    を備えるオーディオ信号大きさの制御装置。
  16. 「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の差分である第2の差分」で除算して「オーディオ信号の大きさ制御比」を算出し、
    前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出し、
    前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して新たなピーク重み付け値を算出する重み付け値算出部をさらに備え、
    前記オーディオ信号大きさ制御部は、
    前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングして、前記入力されたオーディオ信号の大きさを制御することを特徴とする請求項15に記載のオーディオ信号大きさの制御装置。
  17. 前記オーディオ信号大きさ制御部は、
    前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさと前記目標値オーディオ信号の大きさとの間の第3の差分を既に設定された誤差範囲と比較することを特徴とする請求項16に記載のオーディオ信号大きさの制御装置。
  18. 前記オーディオ信号大きさ制御部は、
    前記比較の結果、前記第3の差分が前記既に設定された誤差範囲よりも大きければ、前記算出された新たなピーク重み付け値を用いてスケーリングしたオーディオ信号のオーディオ信号の大きさを前記第2のオーディオ信号の大きさとして、前記入力されたオーディオ信号の大きさを制御することを特徴とする請求項17に記載のオーディオ信号大きさの制御装置。
  19. オーディオ信号大きさの制御方法において、
    既に定義されたゲートサイズを有する第1のゲートブロック及び第2のゲートブロックを入力されたオーディオ信号に適用して、前記第1のゲートブロックに対応する第1のオーディオ信号の大きさ及び前記第2のゲートブロックに対応する第2のオーディオ信号の大きさを測定するステップと、
    前記測定された第1のオーディオ信号の大きさを用いて、前記第1のゲートブロックに対応する第1のゲート重み付け値を算出し、前記測定された第2のオーディオ信号の大きさを用いて、前記第2のゲートブロックに対応する第2のゲート重み付け値を算出するステップと、
    前記第1のゲートブロック及び前記第2のゲートブロックにおいてゲートハンドオーバーが発生したフレームを検出するステップと、
    前記算出された第1及び第2の重み付け値を用いて、前記検出されたフレームからフレーム重み付け値を補間するステップと、
    前記補間されたフレーム重み付け値と、前記第1及び第2のゲート重み付け値を用いて、入力されたオーディオ信号に対するスケーリングを行って、オーディオ信号の大きさを制御するステップと、
    を含む制御方法。
  20. 前記第2のゲートブロックは、前記第1のゲートブロック内の既に定義されたサイズ分だけを重ね合わせながら移動させたゲートブロックであることを特徴とする請求項19に記載の制御方法。
  21. 前記第1及び第2のゲートブロックは、
    少なくとも一枚のフレームを備え、前記フレームは、一回に受け取るデータのサイズを決定することを特徴とする請求項19に記載の制御方法。
  22. 前記補間されるフレーム重み付け値の数は、可変的であることを特徴とする請求項19に記載の制御方法。
  23. オーディオ信号大きさの制御装置において、
    既に定義されたゲートサイズを有する第1のゲートブロック及び第2のゲートブロックを入力されたオーディオ信号に適用して、前記第1のゲートブロックに対応する第1のオーディオ信号の大きさ及び前記第2のゲートブロックに対応する第2のオーディオ信号の大きさを測定するオーディオ信号大きさ測定部と、
    前記測定された第1のオーディオ信号の大きさを用いて、前記第1のゲートブロックに対応する第1のゲート重み付け値を算出し、前記測定された第2のオーディオ信号の大きさを用いて、前記第2のゲートブロックに対応する第2のゲート重み付け値を算出する重み付け値算出部と、
    前記第1のゲートブロック及び前記第2のゲートブロックにおいてゲートハンドオーバーが発生したフレームを検出する検出部と、
    前記算出された第1及び第2の重み付け値を用いて、前記検出されたフレームからフレーム重み付け値を補間し、前記補間されたフレーム重み付け値と、前記第1及び第2のゲート重み付け値を用いて、入力されたオーディオ信号に対するスケーリングを行って、オーディオ信号の大きさを制御するオーディオ信号大きさ制御部と、
    を備えるオーディオ信号大きさの制御装置。
  24. 前記第2のゲートブロックは、前記第1のゲートブロック内の既に定義されたサイズ分だけを重ね合わせながら移動させたゲートブロックであることを特徴とする請求項23に記載のオーディオ信号大きさの制御装置。
  25. 前記第1及び第2のゲートブロックは、
    少なくとも一枚のフレームを備え、前記フレームは、一回に受け取るデータのサイズを決定することを特徴とする請求項23に記載のオーディオ信号大きさの制御装置。
  26. 前記補間されるフレーム重み付け値の数は、可変的であることを特徴とする請求項23に記載のオーディオ信号大きさの制御装置。
  27. オーディオ信号大きさの制御方法において、
    入力されたオーディオ信号の制御に関する手動ラウドネス制御モード、半自動ラウドネス制御モード、自動ラウドネス制御モードのうちのいずれか一つのモードが選択されるステップと、
    前記選択された制御モードが半自動ラウドネス制御モードである場合、前記入力されたオーディオ信号の制御のために必要とされる制御情報を算出するステップと、
    前記算出された制御情報を表示するステップと、
    を含む制御方法。
  28. 前記制御情報は、
    瞬間オーディオ信号の大きさ情報、短期(3s)オーディオ信号の大きさ情報、集積オーディオ信号の大きさ情報、再生オーディオ信号の大きさ情報、残留オーディオ信号の大きさ情報、推奨制御要因情報のうちの少なくとも一つを含むことを特徴とする請求項27に記載の制御方法。
  29. 前記再生オーディオ信号の大きさ情報は、
    これまで出力されたオーディオ信号に関するオーディオ信号の大きさ情報であり、
    前記残留オーディオ信号の大きさ情報は、
    目標値オーディオ信号の大きさに比べての再生オーディオ信号の大きさの不足分または超過分のオーディオ信号の大きさ情報であり、
    前記推奨制御要因情報は、
    残留オーディオ信号の大きさ情報を用いて算出したオーディオ信号の大きさを制御するための重み付け値情報であることを特徴とする請求項28に記載の制御方法。
  30. オーディオ信号大きさの制御装置において、
    入力されたオーディオ信号の制御に関する手動ラウドネス制御モード、半自動ラウドネス制御モード、自動ラウドネス制御モードのうちのいずれか一つのモードが選択される入力部と、
    前記選択された制御モードが半自動ラウドネス制御モードである場合、前記入力されたオーディオ信号の制御のために必要とされる制御情報を算出する制御部と、
    前記算出された制御情報を表示する表示部と、
    を備えるオーディオ信号大きさの制御装置。
  31. 前記制御情報は、
    瞬間オーディオ信号の大きさ情報、短期(3s)オーディオ信号の大きさ情報、集積オーディオ信号の大きさ情報、再生オーディオ信号の大きさ情報、残留オーディオ信号の大きさ情報、推奨制御要因情報のうちの少なくとも一つを含むことを特徴とする請求項30に記載のオーディオ信号大きさの制御装置。
  32. 前記再生オーディオ信号の大きさ情報は、
    これまで出力されたオーディオ信号に関するオーディオ信号の大きさ情報であり、
    前記残留オーディオ信号の大きさ情報は、
    目標値オーディオ信号の大きさに比べての再生オーディオ信号の大きさの不足分または超過分のオーディオ信号の大きさ情報であり、
    前記推奨制御要因情報は、
    残留オーディオ信号の大きさ情報を用いて算出したオーディオ信号の大きさを制御するための重み付け値情報であることを特徴とする請求項30に記載のオーディオ信号大きさの制御装置。
  33. オーディオ信号大きさの制御方法において、
    入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定するステップと、
    既に設定された初期ピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングし、前記スケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定するステップと、
    出力されるオーディオ信号の音のバラツキを維持するための既に設定されたマッピングテーブルに前記第1のオーディオ信号の大きさを適用して、第3のオーディオ信号の大きさを検出するステップと、
    前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び前記第3のオーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するステップと、
    を含む制御方法。
  34. 前記入力されたオーディオ信号は、リアルタイムにて入力されるオーディオ信号であることを特徴とする請求項33に記載の制御方法。
  35. 前記既に設定されたマッピングテーブルは、
    前記第1のオーディオ信号の大きさが既に設定された値よりも小さな領域においては、線形マッピングを用いてマッピングを行うテーブルであり、
    前記第1のオーディオ信号の大きさが既に設定された値よりも大きな領域においては、下記の数式を用いてマッピングを行うテーブルであり、
    ここで、iLKFSは、前記第1のオーディオ信号の大きさであり、oLKFSは、前記第3のオーディオ信号の大きさであり、wは、変更可能な重み付け値であることを特徴とすることを特徴とする請求項33に記載の制御方法。
  36. 前記制御するステップは、
    「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記第3のオーディオ信号の大きさとの間の差分である第2の差分」で除算して「オーディオ信号の大きさ制御比」を算出するステップと、
    前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出するステップと、
    前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して、新たなピーク重み付け値を算出するステップと、
    前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングするステップと、
    を含む請求項33に記載の制御方法。
  37. オーディオ信号大きさの制御装置において、
    入力されたオーディオ信号の大きさである第1のオーディオ信号の大きさを測定し、既に設定された初期ピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングし、前記スケーリングされたオーディオ信号の大きさである第2のオーディオ信号の大きさを測定し、出力されるオーディオ信号の音のバラツキを維持するための既に設定されたマッピングテーブルに前記第1のオーディオ信号の大きさを適用して、第3のオーディオ信号の大きさを検出するオーディオ信号大きさ測定部と、
    前記第1のオーディオ信号の大きさと、前記第2のオーディオ信号の大きさ及び前記第3のオーディオ信号の大きさを用いて、前記入力されたオーディオ信号の大きさを制御するオーディオ信号大きさ制御部と、
    を備えるオーディオ信号大きさの制御装置。
  38. 前記入力されたオーディオ信号は、リアルタイムにて入力されるオーディオ信号であることを特徴とする請求項37に記載のオーディオ信号大きさの制御装置。
  39. 前記既に設定されたマッピングテーブルは、
    前記第1のオーディオ信号の大きさが既に設定された値よりも小さな領域においては、線形マッピングを用いてマッピングを行うテーブルであり、
    前記第1のオーディオ信号の大きさが既に設定された値よりも大きな領域においては、下記の数式を用いてマッピングを行うテーブルであり、
    ここで、iLKFSは、前記第1のオーディオ信号の大きさであり、oLKFSは、前記第3のオーディオ信号の大きさであり、wは、変更可能な重み付け値であることを特徴とすることを特徴とする請求項37に記載のオーディオ信号大きさの制御装置。
  40. 「前記第1のオーディオ信号の大きさと前記第2のオーディオ信号の大きさとの間の差分である第1の差分」を、「前記第1のオーディオ信号の大きさと前記第3のオーディオ信号の大きさとの間の差分である第2の差分」で除算して「オーディオ信号の大きさ制御比」を算出し、
    前記算出された「オーディオ信号の大きさ制御比」を用いて、第1の重み付け値を算出し、
    前記算出された第1の重み付け値に前記既に設定された初期ピーク重み付け値を乗算して、新たなピーク重み付け値を算出する重み付け値算出部をさらに備え、
    前記オーディオ信号大きさ制御部は、
    前記算出された新たなピーク重み付け値を用いて、前記入力されたオーディオ信号をスケーリングして前記入力されたオーディオ信号の大きさを制御することを特徴とする請求項37に記載のオーディオ信号大きさの制御装置。
JP2016505384A 2013-03-21 2014-03-20 オーディオ信号大きさの制御方法及び装置 Pending JP2016514856A (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
KR10-2013-0030136 2013-03-21
KR20130030136A KR101482946B1 (ko) 2013-03-21 2013-03-21 오디오 신호 크기 제어 방법 및 장치
KR1020130036475A KR101603992B1 (ko) 2013-04-03 2013-04-03 오디오 신호 크기 제어 방법 및 장치
KR1020130036468A KR101583294B1 (ko) 2013-04-03 2013-04-03 오디오 신호 크기 제어 방법 및 장치
KR10-2013-0036475 2013-04-03
KR1020130036431A KR101583293B1 (ko) 2013-04-03 2013-04-03 오디오 신호 크기 제어 방법 및 장치
KR10-2013-0036468 2013-04-03
KR1020130036523A KR101602273B1 (ko) 2013-04-03 2013-04-03 오디오 신호 크기 제어 방법 및 장치
KR10-2013-0036523 2013-04-03
KR10-2013-0036431 2013-04-03
PCT/KR2014/002362 WO2014148845A1 (ko) 2013-03-21 2014-03-20 오디오 신호 크기 제어 방법 및 장치

Publications (1)

Publication Number Publication Date
JP2016514856A true JP2016514856A (ja) 2016-05-23

Family

ID=51580434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016505384A Pending JP2016514856A (ja) 2013-03-21 2014-03-20 オーディオ信号大きさの制御方法及び装置

Country Status (3)

Country Link
US (1) US20160049162A1 (ja)
JP (1) JP2016514856A (ja)
WO (1) WO2014148845A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10630254B2 (en) 2016-10-07 2020-04-21 Sony Corporation Information processing device and information processing method

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014148848A2 (ko) * 2013-03-21 2014-09-25 인텔렉추얼디스커버리 주식회사 오디오 신호 크기 제어 방법 및 장치
CN105741835B (zh) * 2016-03-18 2019-04-16 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端
US9998082B1 (en) * 2017-01-16 2018-06-12 Gibson Brands, Inc. Comparative balancing
KR102583931B1 (ko) 2017-01-25 2023-10-04 삼성전자주식회사 음향 출력 장치 및 그의 제어 방법
CN110175015B (zh) * 2019-05-29 2022-05-27 Oppo广东移动通信有限公司 一种控制终端设备的音量的方法、装置及终端设备
CN113542963B (zh) * 2021-07-21 2022-12-20 RealMe重庆移动通信有限公司 声音模式控制方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005537510A (ja) * 2002-08-30 2005-12-08 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声その他のオーディオ素材を有する信号中の音声の大きさの制御
JP2008518565A (ja) * 2004-10-26 2008-05-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
JP2011071806A (ja) * 2009-09-28 2011-04-07 Toshiba Corp 電子機器、及び電子機器の音量制御プログラム
JP2013521539A (ja) * 2010-03-10 2013-06-10 ドルビー・インターナショナル・アーベー 単一再生モードにおいてラウドネス測定値を合成するシステム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7050965B2 (en) * 2002-06-03 2006-05-23 Intel Corporation Perceptual normalization of digital audio signals
US7596234B2 (en) * 2003-06-26 2009-09-29 Microsoft Corporation Method and apparatus for playback of audio files
DE102006046316B4 (de) * 2006-09-29 2010-09-02 Siemens Audiologische Technik Gmbh Verfahren zum halbautomatischen Einstellen einer Hörvorrichtung und entsprechende Hörvorrichtung
JP5059677B2 (ja) * 2008-04-18 2012-10-24 ルネサスエレクトロニクス株式会社 ノイズ除去装置、及びノイズ除去方法
US8977407B2 (en) * 2009-05-27 2015-03-10 Honeywell International Inc. Adaptive user interface for semi-automatic operation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005537510A (ja) * 2002-08-30 2005-12-08 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声その他のオーディオ素材を有する信号中の音声の大きさの制御
JP2008518565A (ja) * 2004-10-26 2008-05-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
JP2011071806A (ja) * 2009-09-28 2011-04-07 Toshiba Corp 電子機器、及び電子機器の音量制御プログラム
JP2013521539A (ja) * 2010-03-10 2013-06-10 ドルビー・インターナショナル・アーベー 単一再生モードにおいてラウドネス測定値を合成するシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10630254B2 (en) 2016-10-07 2020-04-21 Sony Corporation Information processing device and information processing method

Also Published As

Publication number Publication date
US20160049162A1 (en) 2016-02-18
WO2014148845A1 (ko) 2014-09-25

Similar Documents

Publication Publication Date Title
JP2016514856A (ja) オーディオ信号大きさの制御方法及び装置
US10276173B2 (en) Encoded audio extended metadata-based dynamic range control
JP2016522597A (ja) 端末装置及びそのオーディオ信号の出力方法
JP6476192B2 (ja) 多様な再生環境のためのダイナミックレンジ制御
US9197181B2 (en) Loudness enhancement system and method
CN108432130B (zh) 基于对象的音频信号平衡
US9361901B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
EP3694103A1 (en) System for combining loudness measurements in a single playback mode
US20120275625A1 (en) Signal processing device, method thereof, program, and data recording medium
KR20180034565A (ko) 인코딩된 오디오 메타데이터 기반 라우드니스 등화 및 drc 동안의 동적 등화
KR101482945B1 (ko) 단말 장치 및 그의 오디오 신호 출력 방법
JP2016520854A (ja) オーディオ信号大きさの制御方法及び装置
JP2023103223A (ja) ラウドネスレベルを制御するオーディオ信号処理方法及び装置
JP2009296298A (ja) 音声信号処理装置および方法
KR101583294B1 (ko) 오디오 신호 크기 제어 방법 및 장치
JP2006333396A (ja) 音声信号拡声装置
KR101603992B1 (ko) 오디오 신호 크기 제어 방법 및 장치
Brouckxon et al. Time and frequency dependent amplification for speech intelligibility enhancement in noisy environments
KR101583296B1 (ko) 오디오 신호 크기 제어 방법 및 장치
KR101482946B1 (ko) 오디오 신호 크기 제어 방법 및 장치
KR101583293B1 (ko) 오디오 신호 크기 제어 방법 및 장치
KR101602273B1 (ko) 오디오 신호 크기 제어 방법 및 장치
GB2494894A (en) Dynamic range control

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170627