JP4750010B2 - 音響音声再生装置 - Google Patents
音響音声再生装置 Download PDFInfo
- Publication number
- JP4750010B2 JP4750010B2 JP2006352297A JP2006352297A JP4750010B2 JP 4750010 B2 JP4750010 B2 JP 4750010B2 JP 2006352297 A JP2006352297 A JP 2006352297A JP 2006352297 A JP2006352297 A JP 2006352297A JP 4750010 B2 JP4750010 B2 JP 4750010B2
- Authority
- JP
- Japan
- Prior art keywords
- component
- speaker
- formant
- data
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
図1は、本発明の実施の形態1に係る音響音声再生装置の構成を示すブロック図である。この例の音響音声再生装置は、地上デジタルテレビジョン放送、BSデジタルテレビジョン放送やCSデジタルテレビジョン放送等で採用されている音声圧縮符号化技術の1つであるAAC(Advanced Audio Coding)方式が適用されている。この例の音響音声再生装置は、アンパッキング・逆量子化部1と、ブロックサイズ判定部2と、周波数・時間変換部3と、ホルマント周波数検出部4と、パワー比加算部5と、スピーカ構成決定部6と、再生データ生成部7と、アンプ8と、L(左)チャンネルスピーカ9と、C(センター)チャンネルスピーカ10と、R(右)チャンネルスピーカ11とから構成されている。
Pow(Nsum)=Pow(Ssum)−Pow(Fsum) ・・・(2)
従って、ホルマント周波数検出部4は、ホルマント成分のパワーとホルマント成分を除いた成分のパワー又はエネルギの比Pow(Fsum)/Pow(Nsum)を算出することができる。これ以降、パワー比又はエネルギ比を総称して、「パワー比」と称する。
(1)パワー比Pow(Fsum)/Pow(Nsum)の累積加算値が、ソースがホルマント成分のみであり、ホルマント成分を除いた成分がないことを示す場合(例えば、日本語の場合、50%以上)は、ソースがニュース、対談又は討論等の音声が主であるコンテンツであると判断し、スピーカ構成をCチャンネルスピーカ10の1台と決定する。
上述の実施の形態1においては、ホルマント周波数検出部4によりホルマントを分析し、パワー比加算部5によりパワー比Pow(Fsum)/Pow(Nsum)を累積加算する例を示したが、これに限定されない。例えば、ホルマント周波数検出部4及びパワー比加算部5に換えて、一定時間のフレームごとに音響音声信号の音響パワーを算出するパワー算出部と、算出された音響パワー値を予め設定したしきい値と比較してそのフレームの有音無音を判定する有音無音判定部と、フレームごとに音響信号の波形の零交差回数を算出する零交差算出部と、算出された零交差回数を予め設定したしきい値と比較してそのフレームの子音性を判定する子音性判定部と、連続する所定複数フレーム区間におけるパワー値の最大値と最小値を検出し、その差分値を算出する定常性判定部と、複数フレームにおいて無音と判定されたフレームの存在比率と、子音性が高いと判定されたフレームの存在比率と、差分値とがそれぞれに予め設定したしきい値よりもすべて大きい場合にその複数フレーム区間における音響信号は音声と判定し、音声と判定されない場合であって、複数フレームにおいて無音と判定されたフレームの存在比率と、差分値とがそれぞれに予めしきい値以下に設定されたしきい値よりも小さい場合にはその複数フレーム区間の音響信号は非音声と判定し、それ以外を不定と判定し、判定結果を複数フレームごとに出力する音声判定部とを設けても良い。そして、スピーカ構成決定部6は、音声判定部の判定結果に基づいて、スピーカ構成を決定しても良い。この構成によれば、上記した実施の形態1と略同様の効果が得られる。なお、上記パワー算出部、上記有音無音判定部、上記零交差算出部、上記子音性判定部、上記定常性判定部及び上記音声判定部については、例えば、特許第2835483号公報を参照されたい。
上述の実施の形態1においては、ホルマント周波数検出部4、パワー比加算部5、スピーカ構成決定部6及び再生データ生成部7が処理を行うタイミングについては特に言及していないが、そのタイミングは任意で良い。例えば、ソースのコンテンツが切り替わった直後にスピーカ構成決定部6が上記(1)〜(5)の判断を行っても良いし、所定時間経過後に上記判断を行っても良い。また、今まで(3)〜(5)の判断を行っていたが、コンテンツが切り替わることにより(1)及び(2)の判断を行った場合でも、直ちにCチャンネルスピーカ10にモノラルの音声データ又は台詞成分の音声データのすべてを供給するように制御するのではなく、Cチャンネルスピーカ10に供給する音声データの割合を時間の経過とともに増加させるように構成しても良い。逆に、今まで(1)又は(2)の判断を行っていたが、コンテンツが切り替わることにより(3)〜(5)の判断を行った場合でも、直ちにCチャンネルスピーカ10へのモノラルの音声データ又は台詞成分の音声データの供給を中止するように制御するのではなく、Cチャンネルスピーカ10に供給する音声データの割合を時間の経過とともに減少させるように構成しても良い。このように構成すれば、聴取者に違和感を与えることが少ない。
上述の実施の形態1においては、音響音声再生装置をハードウェアで構成した例を示したが、これに限定されない。即ち、上記音響音声再生装置のうち、アンパッキング・逆量子化部1、ブロックサイズ判定部2、周波数・時間変換部3、ホルマント周波数検出部4、パワー比加算部5、スピーカ構成決定部6、再生データ生成部7を、CPU(中央処理装置)と、ROMやRAM等の内部記憶装置と、FDドライブ、HDドライブ、MOディスクドライブ、CD/DVDドライブ等の外部記憶装置と、出力手段と、入力手段とを有するコンピュータによって構成しても良い。そして、CPUの機能が音響音声再生プログラムとして、ROM等の半導体メモリや、FD、HDやCD−ROM等の記憶媒体に記憶されていると構成しても良い。この場合、音響音声再生プログラムは、記憶媒体からCPUに各々読み込まれ、CPUの動作を制御する。音響音声再生プログラムが起動されると、CPUは上記アンパッキング・逆量子化部1、上記ブロックサイズ判定部2、上記周波数・時間変換部3、上記ホルマント周波数検出部4、上記パワー比加算部5、上記スピーカ構成決定部6、上記再生データ生成部7として機能し、音響音声再生プログラムの制御により、上記した処理を実行するのである。
例えば、上述の各実施の形態では、本発明は、AAC方式が適用された音響音声再生装置に適用する例を示したが、これに限定されない。本発明は、例えば、MP3(MPEG Audio Layer-3)方式、AC−3(Audio Code number 3)方式、あるいはWMA(Windows Media Audio)(Windowsは登録商標)方式等の音声圧縮符号化技術が適用された音響音声再生装置にも適用することができる。
また、上述の各実施の形態では、符号化デジタルデータを生成するための変換方法としては、MDCTを挙げたが、DCTといった直交変換する変換方法であれば本発明が適用可能である。
2 ブロックサイズ判定部
3 周波数・時間変換部
4 ホルマント周波数検出部
5 パワー比加算部(パワー比又はエネルギ比加算部)
6 スピーカ構成決定部
7 再生データ生成部
8 アンプ
9 Lチャンネルスピーカ(左チャンネルのスピーカ)
10 Cチャンネルスピーカ(センターチャンネルのスピーカ)
11 Rチャンネルスピーカ(右チャンネルのスピーカ)
Claims (6)
- デジタル音響音声データのスペクトル成分からホルマント成分を抽出し、前記スペクトル成分の前記ホルマント成分のパワー又はエネルギと、前記スペクトル成分から前記ホルマント成分を除いた成分のパワー又はエネルギとのパワー比又はエネルギ比を算出するホルマント周波数検出部と、
前記パワー比又はエネルギ比を累積加算するパワー比又はエネルギ比加算部と、
前記パワー比又はエネルギ比の累積加算値に応じてスピーカ構成を決定するスピーカ構成決定部と
を有することを特徴とする音響音声再生装置。 - 前記スピーカ構成決定部は、前記パワー比又はエネルギ比の累積加算値が、前記ホルマント成分のみであり、前記ホルマント成分を除いた成分がないことを示す場合には、前記スピーカ構成をセンターチャンネルのスピーカの1台と決定することを特徴とする請求項1記載の音響音声再生装置。
- 前記スピーカ構成決定部が前記スピーカ構成をセンターチャンネルのスピーカの1台と決定した場合には、前記デジタル音響音声データの時間領域のデータである左チャンネルの音響音声データ及び右チャンネルの音響音声データからモノラルの音声データを生成する再生データ生成部をさらに有することを特徴とする請求項2記載の音響音声再生装置。
- 前記スピーカ構成決定部は、前記パワー比又はエネルギ比の累積加算値が、前記ホルマント成分と、少ない前記ホルマント成分を除いた成分とからなることを示す場合は、前記スピーカ構成を左チャンネルのスピーカ、前記センターチャンネルのスピーカ及び右チャンネルのスピーカの3台と決定することを特徴とする請求項1乃至3のいずれかに記載の音響音声再生装置。
- 前記再生データ生成部は、前記スピーカ構成決定部が前記スピーカ構成を前記左チャンネルのスピーカ、前記センターチャンネルのスピーカ及び前記右チャンネルのスピーカの3台と決定した場合には、前記左チャンネルの音響音声データ及び前記右チャンネルの音響音声データの同一成分から台詞成分の音声データを抽出することを特徴とする請求項4記載の音響音声再生装置。
- 前記スピーカ構成決定部は、前記パワー比又はエネルギ比の累積加算値が、前記ホルマント成分と、多くの前記ホルマント成分を除いた成分とからなることを示す場合又は、多くの前記ホルマント成分を除いた成分のみであり、前記ホルマント成分がないことを示す場合は、前記スピーカ構成を左チャンネルのスピーカ及び右チャンネルのスピーカの2台と決定することを特徴とする請求項1乃至5のいずれかに記載の音響音声再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006352297A JP4750010B2 (ja) | 2006-12-27 | 2006-12-27 | 音響音声再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006352297A JP4750010B2 (ja) | 2006-12-27 | 2006-12-27 | 音響音声再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008166976A JP2008166976A (ja) | 2008-07-17 |
JP4750010B2 true JP4750010B2 (ja) | 2011-08-17 |
Family
ID=39695852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006352297A Expired - Fee Related JP4750010B2 (ja) | 2006-12-27 | 2006-12-27 | 音響音声再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4750010B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011250311A (ja) | 2010-05-28 | 2011-12-08 | Panasonic Corp | 聴覚ディスプレイ装置及び方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03236691A (ja) * | 1990-02-14 | 1991-10-22 | Hitachi Ltd | テレビジョン受信機用音声回路 |
JPH03285500A (ja) * | 1990-03-31 | 1991-12-16 | Mazda Motor Corp | 音響装置 |
JPH04249484A (ja) * | 1991-02-06 | 1992-09-04 | Hitachi Ltd | テレビジョン受信機用音声回路 |
JPH0560100U (ja) * | 1992-01-27 | 1993-08-06 | クラリオン株式会社 | 音響再生装置 |
DE69423922T2 (de) * | 1993-01-27 | 2000-10-05 | Koninkl Philips Electronics Nv | Tonsignalverarbeitungsanordnung zur Ableitung eines Mittelkanalsignals und audiovisuelles Wiedergabesystem mit solcher Verarbeitungsanordnung |
JPH07115606A (ja) * | 1993-10-19 | 1995-05-02 | Sharp Corp | 音声モード自動切替装置 |
JP3331297B2 (ja) * | 1997-01-23 | 2002-10-07 | 株式会社東芝 | 背景音/音声分類方法及び装置並びに音声符号化方法及び装置 |
JP2002095095A (ja) * | 2000-09-13 | 2002-03-29 | Toshiba Corp | 音量制御装置 |
JP4243829B2 (ja) * | 2002-09-27 | 2009-03-25 | 日本電気株式会社 | ブロードバンド信号検出方法及び装置 |
JP2006254187A (ja) * | 2005-03-11 | 2006-09-21 | Yamaha Corp | 音場判定方法及び音場判定装置 |
-
2006
- 2006-12-27 JP JP2006352297A patent/JP4750010B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008166976A (ja) | 2008-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9837086B2 (en) | Encoded audio extended metadata-based dynamic range control | |
JP6026678B2 (ja) | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 | |
US20050157884A1 (en) | Audio encoding apparatus and frame region allocation circuit for audio encoding apparatus | |
CN101421779B (zh) | 用于产生环境信号的设备和方法 | |
US10861475B2 (en) | Signal-dependent companding system and method to reduce quantization noise | |
JP2017187790A (ja) | オーディオ信号符号化方法および装置 | |
JP2011501225A (ja) | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 | |
WO2006003813A1 (ja) | オーディオ符号化及び復号化装置 | |
JP4750010B2 (ja) | 音響音声再生装置 | |
US11830507B2 (en) | Coding dense transient events with companding | |
JP2005114813A (ja) | オーディオ信号再生装置及び再生方法 | |
JP2003280691A (ja) | 音声処理方法および音声処理装置 | |
JP2008028574A (ja) | オーディオ処理装置、オーディオ処理方法、プログラム、および集積回路 | |
US20230162743A1 (en) | Audio watermark to indicate post-processing | |
KR101567665B1 (ko) | 퍼스널 오디오 스튜디오 시스템 | |
KR101536855B1 (ko) | 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법 | |
JP2000151414A (ja) | ディジタルオーディオ符号化装置、同符号化方法、及び同符号化プログラムを記録した記録媒体 | |
JP2005003835A (ja) | オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム | |
Stanković et al. | Digital Audio | |
JP2011081316A (ja) | 音量制御装置及び電子機器 | |
Wittenburg | Effects of Compression on Linguistically Relevant Speech Analysis Parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110406 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110518 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140527 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |