JP4743228B2 - デジタル音声信号解析方法、その装置、及び映像音声記録装置 - Google Patents
デジタル音声信号解析方法、その装置、及び映像音声記録装置 Download PDFInfo
- Publication number
- JP4743228B2 JP4743228B2 JP2008134090A JP2008134090A JP4743228B2 JP 4743228 B2 JP4743228 B2 JP 4743228B2 JP 2008134090 A JP2008134090 A JP 2008134090A JP 2008134090 A JP2008134090 A JP 2008134090A JP 4743228 B2 JP4743228 B2 JP 4743228B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency domain
- domain information
- audio signal
- digital audio
- coefficient matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
以下、図を用いて本実施の形態1に係るデジタル音声信号解析方法、及びその装置を説明する。本実施の形態1に係るデジタル音声信号解析方法は、AAC方式で符号化圧縮された音声信号からハイライトシーンや、楽曲シーン等を検出することに特徴がある。
本実施の形態2は、3チャンネル以上のマルチチャンネル音声が符号化圧縮されたデジタル音声信号からハイライトシーンや楽曲シーンを検出することに特徴がある。ここでは、図1に示したシステムにおいて、例えば5.1chのAAC音声ストリームが含まれる放送波に対して処理を行う場合について説明する。
Claims (11)
- 符号化圧縮されたデジタル音声信号を入力するデータ入力ステップと、
前記デジタル音声信号内において符号化された第1のMDCT係数行列である周波数領域情報を取り出すステップと、
前記周波数領域情報を所定の次数の第2のMDCT係数行列である周波数領域情報の形式に周波数軸上で変換するステップとを備え、
前記符号化圧縮されたデジタル音声信号は、1フレームを1つのブロックから構成して符号化圧縮されている場合は、次数が前記所定の次数よりも大きい第1のMDCT係数行列である周波数領域情報で、1フレームを複数のブロック数から構成して符号化圧縮されている場合は、次数に前記ブロック数を掛けたものが前記所定の次数よりも大きい第1のMDCT係数行列である周波数領域情報で符号化されていることを特徴とするデジタル音声信号解析方法。 - 請求項1に記載のデジタル音声信号解析方法であって、
前記符号化圧縮されたデジタル音声信号は、前記所定の周波数領域情報とは異なるサンプリング周波数を有することを特徴とするデジタル音声信号解析方法。 - 請求項1または2に記載のデジタル音声信号解析方法であって、
前記所定の形式の周波数領域情報に変換するステップにおいて、ブロック数をn、ブロックのナンバーをy、各ブロックの周波数領域情報の係数行列の要素番号をxとした場合に、次式
T[nx+y]=Sy[x]
を用いて、短い次数の複数のブロックからなる周波数領域情報の係数行列Sy[x]を高い次数の1ブロックの周波数領域情報の係数行列T[k]に変換を行う処理を含むことを特徴とするデジタル音声信号解析方法。 - 請求項1または2に記載のデジタル音声信号解析方法であって、
前記所定の形式の周波数領域情報に変換するステップは、前記符号化圧縮されたデジタル音声信号が、1フレームを1つのブロックから構成して符号化圧縮されている場合に、前記第1のMDCT係数行列である周波数領域情報に対し、係数値を平均することによるダウンサンプリング変換を行い、前記所定の次数の第2のMDCT係数行列である周波数領域情報へ変換を行う処理を含むことを特徴とするデジタル音声信号解析方法。 - 請求項1から4のいずれか1項に記載のデジタル音声信号解析方法であって、
前記所定の形式の周波数領域情報を解析して所望のシーン情報を算出するステップをさらに備え、
前記周波数領域情報を解析して所望のシーン情報を算出するステップは、あらかじめ主観で所望のシーンの音声と判断した音声の周波数領域情報から作成したモデルとの尤度比較によって、入力音声の種別を特定することを特徴とするデジタル音声信号解析方法。 - 請求項1から5のいずれか1項に記載のデジタル音声信号解析方法であって、
前記周波数領域情報を取り出すステップは、マルチチャンネル音声のうちフロントチャンネル音声に限定して周波数領域情報を取り出すことを特徴とするデジタル音声信号解析方法。 - 請求項1から6のいずれか1項に記載のデジタル音声信号解析方法であって、
前記所定の形式の周波数領域情報に変換するステップは、フロントチャンネル音声の周波数領域情報に対して2チャンネルの信号へのダウンミックス処理を行うことを特徴とするデジタル音声信号解析方法。 - 符号化圧縮されたデジタル音声信号を入力するデータ入力手段と、
前記デジタル音声信号内において符号化された第1のMDCT係数行列である周波数領域情報を取り出す手段と、
前記周波数領域情報を所定の次数の第2のMDCT係数行列である周波数領域情報に周波数軸上で変換する手段と
を備え、
前記符号化圧縮されたデジタル音声信号は、1フレームを1つのブロックから構成して符号化圧縮されている場合は、次数が前記所定の次数よりも大きい第1のMDCT係数行列である周波数領域情報で、1フレームを複数のブロック数から構成して符号化圧縮されている場合は、次数に前記ブロック数を掛けたものが前記所定の次数よりも大きい第1のMDCT係数行列である周波数領域情報で符号化されていることを特徴とするデジタル音声信号解析装置。 - 請求項8に記載のデジタル音声信号解析装置であって、
前記符号化圧縮されたデジタル音声信号は、前記所定の周波数領域情報とは異なるサンプリング周波数を有することを特徴とするデジタル音声信号解析装置。 - 請求項8または9に記載のデジタル音声信号解析装置であって、
前記所定の形式の周波数領域情報に変換する手段は、ブロック数をn、ブロックのナンバーをy、各ブロックの周波数領域情報の係数行列の要素番号をxとした場合に、次式
T[nx+y]=Sy[x]
を用いて、短い次数の複数のブロックからなる周波数領域情報の係数行列Sy[x]を高い次数の1ブロックの周波数領域情報の係数行列T[k]に変換することを特徴とするデジタル音声信号解析装置。 - 請求項8から10のいずれか1項に記載のデジタル音声信号解析装置を備えたことを特徴とする映像音声記録装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008134090A JP4743228B2 (ja) | 2008-05-22 | 2008-05-22 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008134090A JP4743228B2 (ja) | 2008-05-22 | 2008-05-22 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009284212A JP2009284212A (ja) | 2009-12-03 |
JP4743228B2 true JP4743228B2 (ja) | 2011-08-10 |
Family
ID=41454206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008134090A Expired - Fee Related JP4743228B2 (ja) | 2008-05-22 | 2008-05-22 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4743228B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI557723B (zh) * | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
KR101756838B1 (ko) * | 2010-10-13 | 2017-07-11 | 삼성전자주식회사 | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 |
KR101369270B1 (ko) * | 2012-03-29 | 2014-03-10 | 서울대학교산학협력단 | 멀티 채널 분석을 이용한 비디오 스트림 분석 방법 |
US9883228B2 (en) | 2013-10-15 | 2018-01-30 | Mitsubishi Electric Corporation | Digital broadcast reception device and channel selection method |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228388A (ja) * | 2002-02-04 | 2003-08-15 | Fujitsu Ltd | 音声符号変換方法及び装置 |
JP2005004820A (ja) * | 2003-06-10 | 2005-01-06 | Hitachi Ltd | ストリームデータ編集方法及びその装置 |
JP2006209890A (ja) * | 2005-01-28 | 2006-08-10 | Pioneer Electronic Corp | 音声信号再生装置、音声信号出力装置および音声信号出力方法 |
JP2006267943A (ja) * | 2005-03-25 | 2006-10-05 | Toshiba Corp | ステレオオーディオ信号符号化方法およびステレオオーディオ信号符号化装置 |
JP2006287574A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Ten Ltd | 音響再生装置 |
JP2007149151A (ja) * | 2005-11-24 | 2007-06-14 | Funai Electric Co Ltd | 光ディスク再生装置、音声信号出力装置及びavシステム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007023660A1 (ja) * | 2005-08-24 | 2007-03-01 | Matsushita Electric Industrial Co., Ltd. | 音識別装置 |
-
2008
- 2008-05-22 JP JP2008134090A patent/JP4743228B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228388A (ja) * | 2002-02-04 | 2003-08-15 | Fujitsu Ltd | 音声符号変換方法及び装置 |
JP2005004820A (ja) * | 2003-06-10 | 2005-01-06 | Hitachi Ltd | ストリームデータ編集方法及びその装置 |
JP2006209890A (ja) * | 2005-01-28 | 2006-08-10 | Pioneer Electronic Corp | 音声信号再生装置、音声信号出力装置および音声信号出力方法 |
JP2006267943A (ja) * | 2005-03-25 | 2006-10-05 | Toshiba Corp | ステレオオーディオ信号符号化方法およびステレオオーディオ信号符号化装置 |
JP2006287574A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Ten Ltd | 音響再生装置 |
JP2007149151A (ja) * | 2005-11-24 | 2007-06-14 | Funai Electric Co Ltd | 光ディスク再生装置、音声信号出力装置及びavシステム |
Also Published As
Publication number | Publication date |
---|---|
JP2009284212A (ja) | 2009-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1667110B1 (en) | Error reconstruction of streaming audio information | |
US7328161B2 (en) | Audio decoding method and apparatus which recover high frequency component with small computation | |
JP5032314B2 (ja) | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 | |
JP5455647B2 (ja) | オーディオデコーダ | |
JP5302977B2 (ja) | オーディオ信号のフィンガープリントを計算するための装置及び方法、同期のための装置及び方法、並びに試験オーディオ信号の特徴付けのための装置及び方法 | |
US8818539B2 (en) | Audio encoding device, audio encoding method, and video transmission device | |
US20060031075A1 (en) | Method and apparatus to recover a high frequency component of audio data | |
JP4442585B2 (ja) | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 | |
US20200202871A1 (en) | Systems and methods for implementing efficient cross-fading between compressed audio streams | |
WO2013027629A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP2011512555A (ja) | マルチチャネル拡張データのオーディオ信号との同期及びオーディオ信号の処理のための装置並びに方法 | |
JPWO2005112002A1 (ja) | オーディオ信号符号化装置及びオーディオ信号復号化装置 | |
WO2016203994A1 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
JP4743228B2 (ja) | デジタル音声信号解析方法、その装置、及び映像音声記録装置 | |
US20020169599A1 (en) | Digital audio compression and expansion circuit | |
RU2383941C2 (ru) | Способ и устройство для кодирования и декодирования аудиосигналов | |
US20150104158A1 (en) | Digital signal reproduction device | |
JP2008262000A (ja) | オーディオ信号特徴検出装置及び特徴検出方法 | |
JP2003029797A (ja) | 符号化装置、復号化装置および放送システム | |
AU2013200578A1 (en) | Apparatus and method for generating audio output signals using object based metadata | |
EP2357645A1 (en) | Music detecting apparatus and music detecting method | |
JP2008145716A (ja) | 音声信号処理装置 | |
JP2009157278A (ja) | オーディオ信号特徴検出装置及び特徴検出方法 | |
KR20080010981A (ko) | 데이터 부호화/복호화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101012 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110425 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4743228 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |