JP2006171663A - 復調音響信号レベル判定方式 - Google Patents

復調音響信号レベル判定方式 Download PDF

Info

Publication number
JP2006171663A
JP2006171663A JP2004382620A JP2004382620A JP2006171663A JP 2006171663 A JP2006171663 A JP 2006171663A JP 2004382620 A JP2004382620 A JP 2004382620A JP 2004382620 A JP2004382620 A JP 2004382620A JP 2006171663 A JP2006171663 A JP 2006171663A
Authority
JP
Japan
Prior art keywords
level
signal
speech
function
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004382620A
Other languages
English (en)
Inventor
Junichi Kakumoto
純一 角元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2004382620A priority Critical patent/JP2006171663A/ja
Publication of JP2006171663A publication Critical patent/JP2006171663A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Receiver Circuits (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】テレビジョン放送やラジオ放送など、放送チャネル間の再生音量に差異があれば、音量をセットし直さなければならない。多くの改善方法が実施されているが、人の感性に照らして、完全なものがない。
【解決手段】どのような番組でも、ニュースなどの内容を正確に伝えなければならない番組の音量が標準状態であると仮定し、信号がスピーチ信号であるか否かの判定結果を利用し、スピーチ信号であれば、このときの音量を標準音量として、期待の再生音量に合わせるべく、その放送チャネルにおける再生器の増幅率を補正し、その補正量を記憶することにより、放送チャネル間の音量の差異を自動的に補正する。
【選択図】図1

Description

用語の定義
特許請求範囲を含む全文を通じ、以下の用語を定義する。
スピーチ とはニュースや株式や解説などの、内容を正確に伝えようとする音響信号とする。
非スピーチとは、音楽や自然の音など、情感を伝える音響信号とする。
スピーチ判定 とは、信号がスピーチであるか否か、いずれかに決定するプロセスであるとする。その決定結果の確からしさの如何については本発明の本質とするところではない。
レベル判定とは、音響信号の大きさの評価である。それが一定時間内の最大値であるか、あるいは実行値または何らかの平均値であるかは本発明の本質とするところではない。
チャネルとは テレビジョン放送やラジオ放送など、多くの放送の各放送に割り当てられたキャリヤ周波数に対応する番号であるとする。
放送、受信、音響再生、音響フィルタ制御、音響信号統計処理、信号処理プログラミング、集積回路、音響映像製品、スピーチ信号検出、復調音響信号レベル一定化。
以下の13例は参考にできる出願特許の例である。
いずれも、チャネル間で異なる音量による不快感を回避する目的で、工夫されていて、具現化しやすい、現実的な手法である。しかしながら、いずれの手法も完全ではなく、部分的に問題を解決するものであり、また、音量検出の不完全さから発生する、不要な副産物も生まれることもあり、2004年現在でも 多くのテレビジョンセットが レベル一定化の機能を備えていない。
特開2003−169270 音声デコーダ付き映像機器
特開2002−084589 音響再生装置
特開2002−009648 放送受信装置
特開2003−125391 画面切り替え出力制御装置およびその方法
特開2000−311446 音声自動調整回路と音声自動調整方法
特開平11−284456 音量調整回路
特開平10−284964 音量調節装置
特開平10−107567 音量制御装置
特開平09−232892 音量制御装置
特開平08−316753 音の出力方法および音の出力装置
特開平07−312530 音量制御装置
特開平05−226953 オーディオ出力装置及びその装置
特開2002−529757 入力信号に対するレベル補償を行う装置
発明が解決しようとしている課題
いずれも、音響信号のレベルをチャネルの切り替えによって違和感がない音量に制御しようとするものである。しかしながら、音というものは、一般的に強い音もあれば弱い音もあり、無音状態もあることから、現在測定中の音量が基準に照らして大きいのか小さいのかの、的確な判定は難しい。特に映画の場面では無音から最大音量まで、その変動範囲は著しく大きい。
その一方では、テレビジョンなどは、通信網の発達により、多種多様な放送を多種多様な中継経路や変調方式を介して受信することは日常的であり、10dB程度ぐらいのチャネル間音量差があることは少なくない。完全な音量一定化の機能が低コストで具現化されていないことから、特に、衛星放送などの、チャネル数の多いテレビ放送で、このようなチャネル間の音量の違いが顕著に見られる。
本発明は非の打ち所のない完璧な音量一定化機能を具現化するものではなく、音量一定化に有効な一つの手法に関する。
課題を解決するための手段
本発明とは本質的には関連性のない技術で、スピーチ信号検出技術が、ある程度の完成度で確立され、一部に実用化されている。
以下の5件はスピーチ信号の検出に関する特許出願である。
特開2002−366189 音楽と音声の識別検出方式
特開H05−088695 オーディオ帯域信号の音声/音楽判別装置
特開H06−332492 音声検出方法および検出装置
特開H07−064598 音声信号弁別装置及びオーディオ装置
特開H07−013584 音声検出装置
スピーチ信号検出は、音楽の場合は豊かな音質、スピーチの場合は明瞭な音質として、自動的に音質を制御し、再生するに必要な機能である。これらのスピーチ信号検出方法によって、現在の再生信号が、専門に訓練されたアナウンサーによるニュースとか株式情報とかの読み上げの声の信号であるか否かは容易に判定できることは公知であり 実用的な手法の特許出願がなされていて コンシューマ商品には既に一部で実用化されている。
本発明は、ニュースとか解説とか株式情報とか、明瞭に内容を伝える必要のある番組の場合に限り、その時の評価音量を適正音量仮定し、あらかじめ決めた標準音量と比較し、大きければ小さく、小さければ大きくするよう制御することで、音量を自動的に一定化する機能に必要なレベル判定機能である。スピーチ検出時の音量とチャネル番号と対応させて記憶することにより、選択チャネルが変わっても、常に基準音量に対する適正音量の設定を可能となる。ニュースや解説など、情報を正確に伝える必要のある番組では、いずれの放送もその放送局の規格または何らかの規格による基準となる音量で放送されていると推定できる。また、このような仮定の基に、各チャネルの音量補正を決めることは合理的である。
さらに、コマーシャル番組に入ったときに発生する、適正より大きいの音量を抑制しようとする場合にも、そのチャネルの基準の音量が既にわかっていれば、より正確に音量制御ができる。
図1
は本発明の一実施例を示すブロック図である。
Inputは入力信号、Outputは出力信号、Level Compensationは音量補正機能、Speech Detection は信号がスピーチ信号であることの度合いを検出するスピーチ検出機能、Speech Judgment は入力信号がスピーチか否かを判定するスピーチ判定機能、Level Detectionは入力信号のレベルを検出する機能、Level Judgmentは入力信号のレベルを判定する機能、Channel Number は入力信号がどのチャネルのものかを示すチャネル番号信号、Table(Channel,Level)はチャネル番号とそのチャネルのレベルを対応づけてLevel Compensationのレベル補償を決定するところのチャネルレベル補償テーブルである。
図1中、いずれの機能についても、既に具現化されていて、公知のものである。
スピーチ信号の検出については、多種多様な方法があるが、一例を挙げると、音響信号の短時間平均エネルギーを求め、無音部分と有音部分の音量比、無音部分の区間の長さと頻度、などを評価することで、訓練されたアナウンサーの声であるかどうかの判定技術は既に実用化され公知のものである。
さらに、子音と母音の区間区別や発生順序、強度のスペクトル分布などを評価することで、さらに判定精度を上げることができる。
レベルを判定する手法 と チャネル番号とそのチャネルのレベルを関連づけるテーブル等については、マイコロコンピュータの記憶機能を使うなど、数多くの公知の手法がある。
信号がアナウンスであることを検出すると、その時の信号の大きさを判定する。信号の大きさは最大値、平均実効値、などいくつかの方法がある。その大きさがあらかじめ決められた規定値に照らして 大きければ、その分ゲインを下げ、逆に小さければゲインを上げ、同時にそのチャネルのゲイン補正量を記憶する。
アナウンスの信号の大きさが 一定の基準に基づいて決められている ということについては決定的な普遍性はないものの、技術的な観点からは常識の範囲にあって合理的であると判断できる。
以上の説明のとおり、本発明はこれらの公知の機能を組み合わせることによって、信頼性の高い、かつ、聴感上、違和感のない、信号レベル補償機能を実現できる。
図2
(a)から(h)は音響信号の波形の例である。横軸は時間、縦軸は大きさである。いずれも、20秒程度の録音波形である。
(a)は日本語のニュース、(b)は英語のニュース、(c)はスペイン語のニュース(d)は中国語のニュース、(e)はオーケストラ演奏の音楽、(f)は4人によるボーカル、ギター、ベースによる音楽、(g)は5人のアカペラ、(h)はスポーツ実況中継、の信号である。
ニュースの場合、訓練されたアナウンサーが一定時間の中で、少し早口で歯切れ良く話す口調は、図2の例でわかるように、最大レベルの変化が小さく安定していて、音節と音節の間には短時間の無音区間が頻繁に存在する。日本語、英語、スペイン語、中国語、に限らず、いずれの国の言語も同じような性質を持つ。
音楽の場合は、アカペラであっても顕著な音節がないことから、切れ目は少なく、連続していてレベルの変化も大きい。また、実況中継の場合は間合いが不規則で、音節の切れ目には環境ノイズが入っていることが多い。
図2の例はアナウンスの信号はレベルを判定するに適した信号であることを示す。
発明の効果
特に、衛生放送など、音響レベルにおいてチャンネル間に違いが見られる。いつも適正音量で聴いているユーザにとって、このような現象に不快を感じる。本発明は、このような現象のほとんどのケースを解決する。
本発明のシーケンスをプログラムとして音響信号処理DSPに組み込む。
そのDSPをテレビ受信機の音響信号再生系に組み込む。
音響DSPへプログラムとして組み込み
音響信号処理用DSPのプログラム。
TVセット、カーステレオセット
ラジオCDプレーヤなどの音響セット。
一実施例の説明図。 音響信号の波形例
符号の説明
Input 入力信号
Output 出力信号
Level Compensation 信号レベル補正機能
Speech Detection 信号のスピーチ性度合い測定部
Speech Judgment 信号のスピーチ判定機能
Level Detection 信号のレベル検出機能
Level Judgment 信号のレベル判定機能
Table(Channel,Level) チャネル番号とチャネルの音量レベルとの対応表
Channel Number 現在選択中のチャネル番号の信号

Claims (1)

  1. 音響信号のレベルを測定し そのレベルを判定する機能をレベル判定機能とし、レベル判定機能の出力を音響信号レベルとし、音響信号の内容がスピーチ信号であるか否か または その度合い を検出する検出機能をスピーチ検出機能とし、スピーチ検出機能の出力状態を判定することによって 入力信号がスピーチであるか否かを判定する機能をスピーチ判定機能とし、スピーチ判定機能がスピーチであると判定したときの音響信号レベルをスピーチ信号レベルとし、スピーチ信号レベル または スピーチ信号レベルに依存する値 または スピーチ信号レベルをあらかじめ定めたレベルとするに必要なゲイン補正量 のいずれかと、その時の受信チャネル番号 とを 対応づけて記憶する機能をチャネルレベル補正量記憶機能とし、そのチャネルが選択されている間は そのチャネルのスピーチ信号レベル または 記憶されているレベルまたはゲイン補正量 に依存して再生音量を決定する機能を チャネルレベル補正機能とし、少なくとも上記、レベル判定機能とスピーチ検出機能とスピーチ判定機能を備えたことを特徴とする復調音響信号レベル判定方式。
JP2004382620A 2004-12-18 2004-12-18 復調音響信号レベル判定方式 Pending JP2006171663A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004382620A JP2006171663A (ja) 2004-12-18 2004-12-18 復調音響信号レベル判定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004382620A JP2006171663A (ja) 2004-12-18 2004-12-18 復調音響信号レベル判定方式

Publications (1)

Publication Number Publication Date
JP2006171663A true JP2006171663A (ja) 2006-06-29

Family

ID=36672462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004382620A Pending JP2006171663A (ja) 2004-12-18 2004-12-18 復調音響信号レベル判定方式

Country Status (1)

Country Link
JP (1) JP2006171663A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010136080A (ja) * 2008-12-04 2010-06-17 Sony Corp 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010136080A (ja) * 2008-12-04 2010-06-17 Sony Corp 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
US8548173B2 (en) 2008-12-04 2013-10-01 Sony Corporation Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus
EP2194732A3 (en) * 2008-12-04 2013-10-30 Sony Corporation Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment

Similar Documents

Publication Publication Date Title
JP5530720B2 (ja) エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体
US5878391A (en) Device for indicating a probability that a received signal is a speech signal
CN101807894B (zh) 音量校正装置,音量校正方法以及电子设备
KR101249239B1 (ko) 오디오 레벨 제어
KR101538623B1 (ko) 두 개의 입력 오디오 신호 믹싱 방법, 및 이를 실행하기 위한 디코더 및 컴퓨터 판독가능한 매체, 및 입력 오디오 신호 믹싱 디바이스
US20150237454A1 (en) Content-aware audio modes
US20160065160A1 (en) Terminal device and audio signal output method thereof
KR20060110100A (ko) 오디오 데이터 처리 장치 및 방법
US20100142729A1 (en) Sound volume correcting device, sound volume correcting method, sound volume correcting program and electronic apparatus
US8837744B2 (en) Sound quality correcting apparatus and sound quality correcting method
JPH08102687A (ja) 音声送受信方式
US8750529B2 (en) Signal processing apparatus
US20160049162A1 (en) Audio signal size control method and device
US8050541B2 (en) System and method for altering playback speed of recorded content
US20160049914A1 (en) Audio signal size control method and device
JP2006171663A (ja) 復調音響信号レベル判定方式
JP4869420B2 (ja) 音情報判定装置、及び音情報判定方法
JP4587916B2 (ja) 音声信号判別装置、音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
JP2006254187A (ja) 音場判定方法及び音場判定装置
JP2007158873A (ja) 音声補正装置
JP2006148609A (ja) 音質調整装置、放送受信機、プログラム、及び記録媒体
JP2006171458A (ja) 音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
KR950004986A (ko) 모드별 볼륨 자동 콘트롤 방법
IT202000010435A1 (it) Metodo per migliorare la percezione della qualita' di un segnale audio digitale emesso da un ricevitore di segnali televisivi, in particolare del tipo a schermo piatto, e relativo dispositivo
JP2010231241A (ja) 音声信号判別装置、音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体