JP2009098510A - 音声記録装置 - Google Patents
音声記録装置 Download PDFInfo
- Publication number
- JP2009098510A JP2009098510A JP2007271471A JP2007271471A JP2009098510A JP 2009098510 A JP2009098510 A JP 2009098510A JP 2007271471 A JP2007271471 A JP 2007271471A JP 2007271471 A JP2007271471 A JP 2007271471A JP 2009098510 A JP2009098510 A JP 2009098510A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- unit
- image
- signal
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【解決手段】音声処理部6内の音声符号化決定部64に対して、画像処理部5内の対象物検出部50による対象物の検出結果が与えられる。そして、音声符号化決定部64では、対象物の検出結果に基づいて、圧縮処理部7内の音声符号化処理部70で用いる音声符号化方式のパラメータを設定する。
【選択図】図3
Description
まず、撮像装置の内部構成について、図面を参照して説明する。図1は、撮像装置の内部構成を示すブロック図である。
このように構成される撮像装置における動画撮影時の基本動作について、図2のフローチャートを参照して説明する。まず、ユーザが音声記録装置を動画撮影用に設定して電源をONにすると(STEP201)、撮像装置の駆動モード、即ち、イメージセンサ1の駆動モードが、プレビューモードに設定される(STEP202)。このプレビューモードとは、撮影対象となる画像を記録することなくディスプレイ部12に表示するモードであり、撮影対象を定め、構図を決定するために用いることができる。
又、外部メモリ22に記録された動画を再生することが、操作部19を通じて指示されると、外部メモリ22に記録された圧縮信号は、ドライバ部8によって読み出されて伸長処理部9に与えられる。そして、伸長処理部9において、MPEG圧縮符号方式及び指定された音声符号化方式に基づいて、伸長復号されて、画像信号及び音声信号が取得される。
本発明の第1の実施形態について、図面を参照して説明する。図3は、本実施形態の撮像装置において音声符号化処理を行うための音声処理部と圧縮処理部を含む各部の構成を示すブロック図である。尚、本実施形態において、Dolby Digital方式による音声符号化処理が成されるものを例に挙げて説明する。
図3に示すように、音声処理部6には、ステレオマイク4から出力された音声信号に対してアナログ/デジタル変換を行うAD変換部61と、AD変換部61で変換されたデジタル信号となる音声信号を時間軸の信号から周波数軸の信号に変換する時間周波数変換部62と、時間周波数変換部62によって得られた音声信号の周波数スペクトラムエンベロープを解析する音声解析部63と、圧縮処理部7での音声符号化方式を設定する音声符号化方式決定部64とが備えられる。
画像処理部5は、画像解析部として、人物などの対象物の有無や大きさや位置を検出する対象物検出部50を備え、その検出結果が、音声処理部6内の音声符号化方式決定部64に与えられる。尚、以下では、対象物検出部50において、検出する対象物が人物の顔であるものとして説明するが、音声が出力される対象物であれば、人物の顔以外の対象物としても構わない。
このように構成する対象物検出部50による対象物検出処理動作について、図面を参照にして、以下で説明する。図4は、縮小画像生成部52によって得られる階層画像の一例を示している。この例では、縮小率を0.8に設定した場合に、生成される複数の階層画像を示している。図4において、150は入力画像を、151〜155は縮小画像を示している。161は判定領域を示している。この例では、判定領域は縦24画素、横24画素の大きさに設定されている。判定領域161の大きさは、入力画像160及び各縮小画像151〜155のいずれにおいても同等の大きさで設定される。
音声処理部6内に設けられた音声符号化方式決定部64は、音声解析部63で形成した複数の音声信号それぞれの周波数スペクトラムエンベロープが与えられてマスキング曲線を算出するマスキング曲線算出部641と、マスキング曲線算出部641で算出されたマスキング曲線の値と音声解析部63で得られた周波数スペクトラムエンベロープの値との差分を周波数帯域毎に算出する差分値算出部642と、差分値算出部642で得られた差分値に基づいて周波数帯域毎に割り当てるビット配分を設定する1次ビット配分決定部643と、1次ビット配分決定部643で決定されたビット配分量を対象物検出部50からの検出結果に基づいて補正するビット配分補正部644と、音声解析部63での音声信号間の類似性及び対象物検出部50からの検出結果に基づいてマトリクス処理の可否を設定するマトリクス処理判定部645と、を備える。
まず、周波数帯域毎のビット配分量の算出動作について説明する。上述したように、音声解析部63において、各音声信号に対する周波数スペクトラムエンベロープが形成されると、この各音声信号に対する周波数スペクトラムエンベロープが、マスキング曲線算出部641及び差分値算出部642に与えられる。又、対象物検出部50において上述の対象物検出処理が成されると、対象物検出部50による対象物の検出結果がビット配分補正部644に与えられる。
更に、上述の周波数帯域毎のビット配分量だけでなく、マトリクス処理の可否についても、圧縮処理部7での音声符号化方式を設定するパラメータの一つとして、マトリクス処理判定部645で設定される。まず、圧縮処理部7で行われるマトリクス処理について、簡単に説明する。例えば、ステレオマイク4よりL信号及びR信号の2チャンネルの音声信号が入力される場合、圧縮処理部7では、まず、L信号とR信号とを加算した和信号L+Rと、L信号とR信号とを減算した差信号L−Rとが算出される。そして、算出して得られた和信号L+R及び差信号L−Rに対して、音声符号化処理が成されることで、圧縮符号化された音声信号が取得される。
このように音声処理部6内の音声符号化方式決定部64で設定されたビット配分量が、音声符号化方式のパラメータとして、圧縮処理部7内の音声符号化処理部70に与えられる。この音声符号化処理部70は、図3に示すように、音声処理部6内のAD変換部61でデジタル信号に変換された複数の音声信号に対してMDCT(Modified Discrete Cosine Transform)などによって時間軸の信号から周波数軸の信号に変換する時間周波数変換部71と、時間周波数変換部71からの周波数軸の信号となる音声信号に対してマトリクス処理を施すマトリクス処理部72と、時間周波数変換部71からの音声信号又はマトリクス処理部72からの音声信号のいずれかを選択する選択部73と、選択部73で選択された周波数軸の信号に変換された音声信号の指数部分に対して差分符号化を施す差分符号化部74と、選択部73で選択された周波数軸の信号に変換された音声信号の仮数部分に対して量子化を施す量子化部75と、選択部73で選択された周波数軸の信号に変換された音声信号の指数部分に基づいて近似的にビット配分量を設定する近似ビット配分設定部76と、音声処理部6のビット配分補正部644で設定されたビット配分量と近似ビット配分設定部76で設定したビット配分量との差を補正情報として算出する減算部77と、差分符号化部74及び量子化部75で符号化された音声信号を多重化する多重化部78と、を備える。
本発明の第2の実施形態について、図面を参照して説明する。図11は、本実施形態の撮像装置において音声符号化処理を行うための音声処理部と圧縮処理部を含む各部の構成を示すブロック図である。尚、本実施形態においても、第1の実施形態と同様、Dolby Digital方式による音声符号化処理が成されるものを例に挙げて説明する。又、図11の構成において、図3の構成と同一の部分については、同一の符号を付して、その詳細な説明は省略する。
本実施形態における画像処理部5は、上述したように、画像解析部として、対象物検出部50に加えて、対象物検出部50で検出された対象物の位置をフレーム間で比較することで対象物の移動量を算出する移動量測定部57を備えた構成となる。この移動量測定部57は、対象物検出部50で検出された対象物の大きさと画像内の座標位置とが与えられて記憶するメモリ571と、対象物検出部50で検出された現フレームにおける対象物の画像内の座標位置とメモリ571に記憶された1フレーム前の対象物の画像内の座標位置との位置関係により対象物の移動量を算出する移動量算出部572と、対象物検出部50で検出された現フレームにおける対象物の大きさとメモリ571に記憶された1フレーム前の対象物の大きさとの大小変化を確認して対象物との距離の変化量を算出する距離変化量算出部573と、を備える。
本実施形態における音声処理部6は、上述したように、音声符号化方式決定部64において、オーディオブロックのブロック長を決定するブロック長決定部646が追加された構成とされる。又、画像処理部5内の移動量測定部57で検出された移動量が、音声符号化方式決定部64内におけるマトリクス処理判定部645及びブロック長決定部646に与えられる。更に、画像処理部5内の対象物検出部50で検出された対象物の検出結果が、マトリクス処理判定部645及びビット配分補正部644に与えられる。
音声符号化方式決定部64では、第1の実施形態のものと同様、マスキング曲線算出部641において、複数の音声信号それぞれについての周波数スペクトラムエンベロープと最小可聴限特性情報に基づいて、各音声信号に対するマスキング曲線が算出される。この各音声信号に対するマスキング曲線が差分値算出部642に与えられることによって、各周波数帯域における周波数スペクトラムエンベロープとマスキング曲線との差分比率が、各音声信号に対して算出される。
又、本実施形態においても、第1の実施形態と同様、マトリクス処理の可否についても、圧縮処理部7での音声符号化方式を設定するパラメータの一つとして、マトリクス処理判定部645で設定される。但し、本実施形態においては、第1の実施形態と異なり、対象物検出部50での対象物の検出結果だけでなく、移動量測定部57で検出された移動量によっても、マトリクス処理の可否が設定される。
更に、圧縮処理部7内の時間周波数変換部71においてMDCTを施す際、各オーディオブロックに対して、(1)512点のMDCTを施す場合(以下、「長ブロックモード」とする。)と、(2)256点のMDCTを2回施す場合(以下、「短ブロックモード」とする。)と、がある。そして、この長ブロックモード及び短ブロックモードを設定するために、本実施形態では、第1の実施形態と異なり、ブロック長決定部646において、MDCTを施すブロック長(「長ブロックモード」の場合は512点、「短ブロックモード」の場合は256点)を決定する。このブロック長決定部646におけるブロック長の決定動作について、以下に説明する。
上述の第1及び第2の実施形態では、音声符号化処理部70内にマトリクス処理部72を設けて、マトリクス処理により圧縮符号化を施すものとしたが、マトリクス処理ではなく、カップリング処理によって圧縮符号化を施すものもある。即ち、図12に示すように、圧縮部7において、マトリクス処理部72及び選択部73の代わりに、時間周波数変換部71からの音声信号を周波数帯域毎に相関のある信号をまとめるカップリング処理を行うカップリング処理部79を備える。尚、図12に示す構成は、第2の実施形態における図11に示す構成に基づくものである。
2 レンズ部
3 AFE
4 ステレオマイク
5 画像処理部
6 音声処理部
7 圧縮処理部
8 ドライバ部
9 伸長処理部
10 画像出力回路部
11 画像出力端子
12 ディスプレイ部
13 音声出力回路部
14 音声出力端子
15 スピーカ部
16 タイミングジェネレータ(TG)
17 CPU
18 メモリ
19 操作部
20,21 バス回線
22 外部メモリ
50 対象物検出部
52 縮小画像生成部
55 対象物判定部
56 検出結果出力部
57 移動量測定部
61 AD変換部
62 時間周波数変換部
63 音声解析部
64 音声符号化方式決定部
70 音声符号化処理部
71 時間周波数変換部
72 マトリクス処理部
73 選択部
74 差分符号化部
75 量子化部
76 近似ビット配分設定部
77 減算部
78 多重化部
79 カップリング処理部
150 入力画像
151〜155 縮小画像
161 判定領域
571 メモリ
572 移動量算出部
573 距離変化量算出部
641 マスキング曲線算出部
642 差分値算出部
643 1次ビット配分決定部
644 ビット配分補正部
645 マトリクス処理判定部
646 ブロック長決定部
Claims (9)
- 連続する複数フレームの画像より成る映像と共に取得される音声による音声信号を符号化する音声符号化部を備え、該音声符号化部で符号化された音声信号を記録する音声記録装置において、
取得した映像による画像信号をフレーム毎に解析して、各フレームの画像に関する解析情報を取得する画像処理部と、
取得した音声による音声信号を解析するとともに、当該音声信号の解析情報及び/又は前記画像処理部での前記画像信号の解析情報に基づいて、前記音声符号化部で音声符号化方式におけるパラメータを設定する音声処理部と、
を備えることを特徴とする音声記録装置。 - 前記音声処理部が、更に、映像及び音声取得時の操作情報に基づいて、前記音声符号化部での前記音声符号化方式におけるパラメータを設定することを特徴とする請求項1に記載の音声記録装置。
- 前記音声処理部において、前記音声符号化方式におけるパラメータを設定するために、前記画像信号の解析情報として、前記画像信号による画像における音声を発生する対象物の有無、該対象物の前記画像中での大きさ、又は、該対象物の前記画像中での位置が用いられることを特徴とする請求項1又は請求項2に記載の音声記録装置。
- 前記音声処理部において、前記画像信号の解析情報より、前記画像信号による画像内に前記対象物を確認したとき、該対象物の発生する音声帯域におけるビット配分量を多くするように、前記音声符号化方式におけるパラメータを設定することを特徴とする請求項3に記載の音声記録装置。
- 前記音声処理部において、前記画像信号の解析情報より、前記画像信号による画像内に前記対象物が所定の大きさ以上となることを確認したとき、該対象物の発生する音声帯域におけるビット配分量を多くするように、前記音声符号化方式におけるパラメータを設定することを特徴とする請求項3に記載の音声記録装置。
- 前記音声信号が、複数のマイクより成るステレオマイクから取得された複数の音声信号であり、
前記音声処理部において、前記画像信号の解析情報より、前記画像信号による画像内の中央に前記対象物が位置することを確認したとき、前記複数の音声信号間での演算処理を施して圧縮するように、前記音声符号化方式におけるパラメータを設定することを特徴とする請求項3〜請求項5のいずれかに記載の音声記録装置。 - 前記音声処理部において、前記音声符号化方式におけるパラメータを設定するために、前記画像信号の解析情報として、前記画像信号による画像における音声を発生する対象物による、フレーム間における移動量が用いられることを特徴とする請求項1〜請求項6のいずれかに記載の音声記録装置。
- 前記音声処理部において、前記画像信号の解析情報より、フレーム間における前記対象物の移動量が所定値より大きいことを確認したとき、前記音声信号を周波数軸の信号に変換する際の単位ブロック長を短くして符号化するように、前記音声符号化方式におけるパラメータを設定することを特徴とする請求項7に記載の音声記録装置。
- 前記音声信号が、複数のマイクより成るステレオマイクから取得された複数の音声信号であり、
前記音声処理部において、前記画像信号の解析情報より、フレーム間における前記対象物の移動量が所定値より大きいことを確認したとき、前記複数の音声信号を独立して符号化するように、前記音声符号化方式におけるパラメータを設定することを特徴とする請求項7又は請求項8に記載の音声記録装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007271471A JP5230164B2 (ja) | 2007-10-18 | 2007-10-18 | 音声記録装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007271471A JP5230164B2 (ja) | 2007-10-18 | 2007-10-18 | 音声記録装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009098510A true JP2009098510A (ja) | 2009-05-07 |
JP5230164B2 JP5230164B2 (ja) | 2013-07-10 |
Family
ID=40701556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007271471A Expired - Fee Related JP5230164B2 (ja) | 2007-10-18 | 2007-10-18 | 音声記録装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5230164B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011055386A (ja) * | 2009-09-04 | 2011-03-17 | Sanyo Electric Co Ltd | 音響信号処理装置及び電子機器 |
WO2017091887A1 (en) | 2015-12-01 | 2017-06-08 | Ati Technologies Ulc | Audio encoding using video information |
CN108632551A (zh) * | 2017-03-16 | 2018-10-09 | 南昌黑鲨科技有限公司 | 基于深度学习的视频录摄方法、装置及终端 |
KR20200012861A (ko) * | 2017-04-25 | 2020-02-05 | 디티에스, 인코포레이티드 | 디지털 오디오 신호에서의 차분 데이터 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04259171A (ja) * | 1991-02-14 | 1992-09-14 | Fuji Photo Film Co Ltd | ステレオマイク付携帯用vtr |
JPH0818622A (ja) * | 1994-06-30 | 1996-01-19 | Toshiba Corp | 情報通信端末装置 |
JP2000270347A (ja) * | 1999-03-17 | 2000-09-29 | Sharp Corp | 記録装置、及び該記録装置を用いた監視システム |
JP2002149316A (ja) * | 2000-11-06 | 2002-05-24 | Sony Corp | データ送信装置、データ受信装置、およびデータ送信方法、並びにプログラム記憶媒体 |
-
2007
- 2007-10-18 JP JP2007271471A patent/JP5230164B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04259171A (ja) * | 1991-02-14 | 1992-09-14 | Fuji Photo Film Co Ltd | ステレオマイク付携帯用vtr |
JPH0818622A (ja) * | 1994-06-30 | 1996-01-19 | Toshiba Corp | 情報通信端末装置 |
JP2000270347A (ja) * | 1999-03-17 | 2000-09-29 | Sharp Corp | 記録装置、及び該記録装置を用いた監視システム |
JP2002149316A (ja) * | 2000-11-06 | 2002-05-24 | Sony Corp | データ送信装置、データ受信装置、およびデータ送信方法、並びにプログラム記憶媒体 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011055386A (ja) * | 2009-09-04 | 2011-03-17 | Sanyo Electric Co Ltd | 音響信号処理装置及び電子機器 |
KR102419514B1 (ko) * | 2015-12-01 | 2022-07-11 | 에이티아이 테크놀로지스 유엘씨 | 비디오 정보를 이용한 오디오 인코딩 |
CN108292506A (zh) * | 2015-12-01 | 2018-07-17 | Ati科技无限责任公司 | 使用视频信息的音频编码 |
KR20180088807A (ko) * | 2015-12-01 | 2018-08-07 | 에이티아이 테크놀로지스 유엘씨 | 비디오 정보를 이용한 오디오 인코딩 |
JP2019504340A (ja) * | 2015-12-01 | 2019-02-14 | エーティーアイ・テクノロジーズ・ユーエルシーAti Technologies Ulc | ビデオ情報を用いたオーディオエンコーディング |
WO2017091887A1 (en) | 2015-12-01 | 2017-06-08 | Ati Technologies Ulc | Audio encoding using video information |
EP3384491B1 (en) * | 2015-12-01 | 2023-06-21 | ATI Technologies ULC | Audio encoding using video information |
CN108632551A (zh) * | 2017-03-16 | 2018-10-09 | 南昌黑鲨科技有限公司 | 基于深度学习的视频录摄方法、装置及终端 |
KR20200012861A (ko) * | 2017-04-25 | 2020-02-05 | 디티에스, 인코포레이티드 | 디지털 오디오 신호에서의 차분 데이터 |
CN110870005A (zh) * | 2017-04-25 | 2020-03-06 | Dts公司 | 数字音频信号中的差异数据 |
EP3616325A4 (en) * | 2017-04-25 | 2020-12-09 | DTS, Inc. | DIFFERENTIAL DATA IN DIGITAL AUDIO SIGNALS |
CN110870005B (zh) * | 2017-04-25 | 2023-12-12 | Dts公司 | 编码系统和解码系统 |
KR102615901B1 (ko) | 2017-04-25 | 2023-12-19 | 디티에스, 인코포레이티드 | 디지털 오디오 신호에서의 차분 데이터 |
Also Published As
Publication number | Publication date |
---|---|
JP5230164B2 (ja) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109313904B (zh) | 视频音频处理设备和方法以及存储介质 | |
US8401364B2 (en) | Imaging device and playback device | |
US8218033B2 (en) | Sound corrector, sound recording device, sound reproducing device, and sound correcting method | |
US8947557B2 (en) | Photographing apparatus and method for dynamic range adjustment and stereography | |
JP2009156888A (ja) | 音声補正装置及びそれを備えた撮像装置並びに音声補正方法 | |
KR101626004B1 (ko) | 디지털 영상처리장치에서 raw포맷을 선택적으로 지원하는 방법 및 장치 | |
JP5345025B2 (ja) | 画像記録装置及び方法 | |
JP2008263498A (ja) | 風雑音低減装置、音響信号録音装置及び撮像装置 | |
US20130129245A1 (en) | Compression of image data | |
JP2009065587A (ja) | 音声記録装置及び音声再生装置 | |
KR20120023901A (ko) | 디지털 영상 처리 장치, 디지털 영상 신호 처리 방법 및 상기 방법을 기록한 기록 매체 | |
JP2010103972A (ja) | 画像処理装置及び電子機器 | |
JP2010103884A (ja) | 画像処理装置、画像処理方法及び電子機器 | |
JP5230164B2 (ja) | 音声記録装置 | |
US20120162470A1 (en) | Moving image photographing method and moving image photographing apparatus | |
JP2008263483A (ja) | 風雑音低減装置、音響信号録音装置及び撮像装置 | |
JP2009124644A (ja) | 画像処理装置、撮像装置及び画像再生装置 | |
JP4909063B2 (ja) | 撮像装置及び画像記録方法 | |
JP5656586B2 (ja) | 撮像装置とその制御方法並びに音声処理装置及び方法 | |
JP2011155582A (ja) | 撮像装置 | |
JP2014122978A (ja) | 撮像装置、音声認識方法、及びプログラム | |
JP2006318260A (ja) | 画像処理装置およびその方法 | |
JP2009021893A (ja) | 撮像装置及び撮像方法 | |
JP5072714B2 (ja) | 音声記録装置及び音声再生装置 | |
US20220383891A1 (en) | Sound processing apparatus and control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100929 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120508 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |