JP2009284212A - デジタル音声信号解析方法、その装置、及び映像音声記録装置 - Google Patents
デジタル音声信号解析方法、その装置、及び映像音声記録装置 Download PDFInfo
- Publication number
- JP2009284212A JP2009284212A JP2008134090A JP2008134090A JP2009284212A JP 2009284212 A JP2009284212 A JP 2009284212A JP 2008134090 A JP2008134090 A JP 2008134090A JP 2008134090 A JP2008134090 A JP 2008134090A JP 2009284212 A JP2009284212 A JP 2009284212A
- Authority
- JP
- Japan
- Prior art keywords
- frequency domain
- domain information
- audio signal
- digital audio
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】本発明に係るデジタル音声信号解析方法は、デジタル音声信号を入力するデータ入力ステップと、デジタル音声信号内に符号化された周波数領域情報を取り出すステップと、前記周波数領域情報を統一の形式に変換するステップと、前記統一された周波数領域情報を解析して所望のシーン情報を算出するステップとを備える。
【選択図】図1
Description
デジタル音声信号を入力するデータ入力ステップと、
このデジタル音声信号内において符号化された周波数領域情報を取り出すステップと、
この周波数領域情報を統一の形式に変換するステップと、
この統一された形式の周波数領域情報から所望のシーン情報を算出するステップと
を備えるものである。
以下、図を用いて本実施の形態1に係るデジタル音声信号解析方法、及びその装置を説明する。本実施の形態1に係るデジタル音声信号解析方法は、AAC方式で符号化圧縮された音声信号からハイライトシーンや、楽曲シーン等を検出することに特徴がある。
本実施の形態2は、3チャンネル以上のマルチチャンネル音声が符号化圧縮されたデジタル音声信号からハイライトシーンや楽曲シーンを検出することに特徴がある。ここでは、図1に示したシステムにおいて、例えば5.1chのAAC音声ストリームが含まれる放送波に対して処理を行う場合について説明する。
Claims (11)
- デジタル音声信号を入力するデータ入力ステップと、
前記デジタル音声信号内において符号化された周波数領域情報を取り出すステップと、
前記周波数領域情報を統一の形式に変換するステップと、
前記統一された周波数領域情報を解析して所望のシーン情報を算出するステップと
を備えることを特徴とするデジタル音声信号解析方法。 - 請求項1に記載のデジタル音声信号解析方法であって、
前記周波数領域情報を統一の形式に変換するステップは、異なるサンプリング周波数および次数を有する周波数領域情報を、同じ周波数軸を有しかつ次数が等しい周波数領域情報へ変換することを特徴とするデジタル音声信号解析方法。 - 請求項1または2に記載のデジタル音声信号解析方法であって、
前記周波数領域情報を解析して所望のシーン情報を算出するステップは、あらかじめ主観で所望のシーンの音声と判断した音声の周波数領域情報から作成したモデルとの尤度比較によって、入力音声の種別を特定することを特徴とするデジタル音声信号解析方法。 - 請求項1から3のいずれかに記載のデジタル音声信号解析方法であって、
前記周波数領域情報を取り出すステップは、マルチチャンネル音声のうちフロントチャンネル音声に限定して周波数領域情報を取り出すことを特徴とするデジタル音声信号解析方法。 - 請求項1から4のいずれかに記載のデジタル音声信号解析方法であって、
前記周波数領域情報を統一の形式に変換するステップは、フロントチャンネル音声の周波数領域情報に対して2チャンネルの信号へのダウンミックス処理を行うことを特徴とするデジタル音声信号解析方法。 - デジタル音声信号を入力するデータ入力手段と、
前記デジタル音声信号内において符号化された周波数領域情報を取り出す手段と、
前記周波数領域情報を統一の形式に変換する手段と、
前記統一された周波数領域情報を解析して所望のシーン情報を算出する手段と
を備えることを特徴とするデジタル音声信号解析装置。 - 請求項6に記載のデジタル音声信号解析装置であって、
前記周波数領域情報を統一の形式に変換する手段は、異なるサンプリング周波数および次数を有する周波数領域情報を、同じ周波数軸を有しかつ次数が等しい周波数領域情報へ変換することを特徴とするデジタル音声信号解析装置。 - 請求項6または7に記載のデジタル音声信号解析装置であって、
前記周波数領域情報を解析して所望のシーン情報を算出する手段は、あらかじめ主観で所望のシーンの音声と判断した音声の周波数領域情報から作成したモデルとの尤度比較によって、入力音声の種別を特定することを特徴とするデジタル音声信号解析装置。 - 請求項6から8のいずれかに記載のデジタル音声信号解析装置であって、
前記周波数領域情報を取り出す手段は、マルチチャンネル音声のうちフロントチャンネル音声に限定して周波数領域情報を取り出すことを特徴とするデジタル音声信号解析装置。 - 請求項6から9のいずれかに記載のデジタル音声信号解析装置であって、
前記周波数領域情報を統一の形式に変換する手段は、フロントチャンネル音声の周波数領域情報に対して2チャンネルの信号へのダウンミックス処理を行うことを特徴とするデジタル音声信号解析装置。 - 請求項6から10のいずれかに記載のデジタル音声信号解析装置を備えたことを特徴とする映像音声記録装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008134090A JP4743228B2 (ja) | 2008-05-22 | 2008-05-22 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008134090A JP4743228B2 (ja) | 2008-05-22 | 2008-05-22 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009284212A true JP2009284212A (ja) | 2009-12-03 |
JP4743228B2 JP4743228B2 (ja) | 2011-08-10 |
Family
ID=41454206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008134090A Expired - Fee Related JP4743228B2 (ja) | 2008-05-22 | 2008-05-22 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4743228B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400581A (zh) * | 2010-02-18 | 2013-11-20 | 杜比实验室特许公司 | 使用高效下混合的音频解码器和解码方法 |
JP2013545128A (ja) * | 2010-10-13 | 2013-12-19 | サムスン エレクトロニクス カンパニー リミテッド | 多チャネルオーディオ信号をダウンミックスする方法及び装置 |
KR101369270B1 (ko) * | 2012-03-29 | 2014-03-10 | 서울대학교산학협력단 | 멀티 채널 분석을 이용한 비디오 스트림 분석 방법 |
US9883228B2 (en) | 2013-10-15 | 2018-01-30 | Mitsubishi Electric Corporation | Digital broadcast reception device and channel selection method |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228388A (ja) * | 2002-02-04 | 2003-08-15 | Fujitsu Ltd | 音声符号変換方法及び装置 |
JP2005004820A (ja) * | 2003-06-10 | 2005-01-06 | Hitachi Ltd | ストリームデータ編集方法及びその装置 |
JP2006209890A (ja) * | 2005-01-28 | 2006-08-10 | Pioneer Electronic Corp | 音声信号再生装置、音声信号出力装置および音声信号出力方法 |
JP2006267943A (ja) * | 2005-03-25 | 2006-10-05 | Toshiba Corp | ステレオオーディオ信号符号化方法およびステレオオーディオ信号符号化装置 |
JP2006287574A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Ten Ltd | 音響再生装置 |
WO2007023660A1 (ja) * | 2005-08-24 | 2007-03-01 | Matsushita Electric Industrial Co., Ltd. | 音識別装置 |
JP2007149151A (ja) * | 2005-11-24 | 2007-06-14 | Funai Electric Co Ltd | 光ディスク再生装置、音声信号出力装置及びavシステム |
-
2008
- 2008-05-22 JP JP2008134090A patent/JP4743228B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228388A (ja) * | 2002-02-04 | 2003-08-15 | Fujitsu Ltd | 音声符号変換方法及び装置 |
JP2005004820A (ja) * | 2003-06-10 | 2005-01-06 | Hitachi Ltd | ストリームデータ編集方法及びその装置 |
JP2006209890A (ja) * | 2005-01-28 | 2006-08-10 | Pioneer Electronic Corp | 音声信号再生装置、音声信号出力装置および音声信号出力方法 |
JP2006267943A (ja) * | 2005-03-25 | 2006-10-05 | Toshiba Corp | ステレオオーディオ信号符号化方法およびステレオオーディオ信号符号化装置 |
JP2006287574A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Ten Ltd | 音響再生装置 |
WO2007023660A1 (ja) * | 2005-08-24 | 2007-03-01 | Matsushita Electric Industrial Co., Ltd. | 音識別装置 |
JP2007149151A (ja) * | 2005-11-24 | 2007-06-14 | Funai Electric Co Ltd | 光ディスク再生装置、音声信号出力装置及びavシステム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400581A (zh) * | 2010-02-18 | 2013-11-20 | 杜比实验室特许公司 | 使用高效下混合的音频解码器和解码方法 |
JP2014146040A (ja) * | 2010-02-18 | 2014-08-14 | Dolby Lab Licensing Corp | 効率的なダウンミキシングを使ったオーディオ・デコーダおよびデコード方法 |
US9311921B2 (en) | 2010-02-18 | 2016-04-12 | Dolby Laboratories Licensing Corporation | Audio decoder and decoding method using efficient downmixing |
JP2013545128A (ja) * | 2010-10-13 | 2013-12-19 | サムスン エレクトロニクス カンパニー リミテッド | 多チャネルオーディオ信号をダウンミックスする方法及び装置 |
KR101369270B1 (ko) * | 2012-03-29 | 2014-03-10 | 서울대학교산학협력단 | 멀티 채널 분석을 이용한 비디오 스트림 분석 방법 |
US9883228B2 (en) | 2013-10-15 | 2018-01-30 | Mitsubishi Electric Corporation | Digital broadcast reception device and channel selection method |
Also Published As
Publication number | Publication date |
---|---|
JP4743228B2 (ja) | 2011-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1667110B1 (en) | Error reconstruction of streaming audio information | |
US8824688B2 (en) | Apparatus and method for generating audio output signals using object based metadata | |
JP6356832B2 (ja) | 高次アンビソニックス信号の圧縮 | |
JP4939933B2 (ja) | オーディオ信号符号化装置及びオーディオ信号復号化装置 | |
JP5455647B2 (ja) | オーディオデコーダ | |
JP5273858B2 (ja) | データストリームおよびマルチチャネル表現を生成するための装置および方法 | |
JP5461437B2 (ja) | マルチチャネル拡張データのオーディオ信号との同期及びオーディオ信号の処理のための装置並びに方法 | |
JP5302977B2 (ja) | オーディオ信号のフィンガープリントを計算するための装置及び方法、同期のための装置及び方法、並びに試験オーディオ信号の特徴付けのための装置及び方法 | |
US20200202871A1 (en) | Systems and methods for implementing efficient cross-fading between compressed audio streams | |
US20040008615A1 (en) | Audio decoding method and apparatus which recover high frequency component with small computation | |
US20060031075A1 (en) | Method and apparatus to recover a high frequency component of audio data | |
JP4442585B2 (ja) | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 | |
US20110002393A1 (en) | Audio encoding device, audio encoding method, and video transmission device | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
CN1930914A (zh) | 参数多声道编码系统中基于频率的音频声道编码 | |
US20020169599A1 (en) | Digital audio compression and expansion circuit | |
JP4743228B2 (ja) | デジタル音声信号解析方法、その装置、及び映像音声記録装置 | |
RU2383941C2 (ru) | Способ и устройство для кодирования и декодирования аудиосигналов | |
US20150104158A1 (en) | Digital signal reproduction device | |
KR20080010980A (ko) | 부호화/복호화 방법 및 장치. | |
AU2013200578B2 (en) | Apparatus and method for generating audio output signals using object based metadata | |
JP2008262000A (ja) | オーディオ信号特徴検出装置及び特徴検出方法 | |
EP2357645A1 (en) | Music detecting apparatus and music detecting method | |
JP2003029797A (ja) | 符号化装置、復号化装置および放送システム | |
JP2009157278A (ja) | オーディオ信号特徴検出装置及び特徴検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101012 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110425 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4743228 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |