JP2006211570A - 撮影装置 - Google Patents

撮影装置 Download PDF

Info

Publication number
JP2006211570A
JP2006211570A JP2005024019A JP2005024019A JP2006211570A JP 2006211570 A JP2006211570 A JP 2006211570A JP 2005024019 A JP2005024019 A JP 2005024019A JP 2005024019 A JP2005024019 A JP 2005024019A JP 2006211570 A JP2006211570 A JP 2006211570A
Authority
JP
Japan
Prior art keywords
unit
data
voice
audio
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005024019A
Other languages
English (en)
Inventor
Yasunori Sato
泰教 佐藤
Akihiro Miyazaki
秋弘 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005024019A priority Critical patent/JP2006211570A/ja
Publication of JP2006211570A publication Critical patent/JP2006211570A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 動画の撮影中に撮影者が自由に通話や会話を行った場合でも、撮影者の通話や会話による音声が、撮影用の音声に重なって録音されない撮影装置を提供する。
【解決手段】 記録音声作成部34は、第1のマイク部52で取得した音声から、第2のマイク部53で取得した音声信号成分を除去した音声を作成する。AVデータ作成部36は、記録音声作成部34で作成された音声及カメラ部51で取得した映像データに基づいてAVデータを作成する。
【選択図】 図2

Description

本発明は、動画を撮影可能な撮影装置に関し、より特定的には、動画の撮影中に撮影者が通話や会話を自由に行うことができる撮影装置に関する。
従来の動画撮影装置としては、例えば、動画を撮影することができるカメラ付き携帯電話端末がある。カメラ付き携帯電話端末は、単一の機器で、音声通話などの通信を行うこと、動画撮影を行うこと、更には撮影した動画をその場で送信することが可能であり、その便利さから、近年爆発的に普及している。
しかし、従来のカメラ付き携帯電話端末では、動画の撮影中に他の端末から着信があった場合、例えば、動画の撮影が強制的に中止されるなど、動画を撮影しながら着信に対して応答することができないという課題を有していた。そこで、従来、動画の撮影中に着信があった場合に、自動的に固定メッセージを応答し、動画の撮影をそのまま継続できるカメラ付き携帯電話端末が開示されている(例えば、特許文献1)。このようなカメラ付き携帯電話端末によると、動画撮影中の着信に対して、固定メッセージを応答することが可能となる。
特開2001−78078号公報
しかしながら、従来のカメラ付き携帯電話端末においては、動画撮影中に着信があった場合に、固定メッセージを応答することができても、撮影者が着信に応答して、動画撮影と同時に通話を行うことができなかった。
また、従来のカメラ付き携帯電話端末において、動画撮影中の着信に対して何らかの手段を用いて応答して、撮影者が動画撮影と同時に通話を行った場合を考える。このような場合、撮影者の意図に関わらず、通話による音声が動画撮影に使用するマイクに入力されることになる。このようにして撮影された動画を視聴とすると、突然、撮影者の通話による音声が再生され、視聴した人に違和感を与えることになる。このため、従来のカメラ付き携帯電話端末は、単純には動画撮影と同時に通話を行うことができなかった。
また、従来の動画撮影装置として、ビデオカメラを考えた場合も、動画の撮影中に撮影者が会話をした場合、撮影された動画に撮影者の会話に伴う音声が録音されることになる。そのため、従来のビデオカメラにおいても、動画撮影と同時に撮影者が自由に会話を行うことができなかった。
それ故に、本発明の目的は、動画の撮影中に撮影者が自由に通話や会話を行った場合でも、撮影者の通話や会話による音声が、撮影用の音声に重なって録音されない撮影装置を提供することである。
本発明は、動画の撮影が可能な撮影装置に向けられている。そして上記目的を達成するために、本発明の動画撮影装置は、インタフェース部、カメラ部、第1のマイク部、第2のマイク部、撮影制御部、音声制御部、及び主処理部を備える。
インタフェース部には、使用者の操作内容が入力される。カメラ部は、映像データを取得する。第1のマイク部は、撮影用の音声を取得する。第2のマイク部は、所定の音声を取得する。撮影制御部は、カメラ部で取得した映像データに基づいて作成されたビデオデータと、第1のマイク部で取得した音声及び第2のマイク部で取得した音声に基づいて作成された少なくとも1つのオーディオデータとを多重化し、AVデータを作成する。音声制御部は、第2のマイク部で取得した音声に所定の処理を施す。主処理部は、インタフェース部を介して入力される操作内容に応じた指示を、撮影制御部と音声制御部とに与える。
好ましくは、撮影制御部は、第1のマイク部で取得された音声から、第2のマイク部で取得された音声成分が除去されたオーディオデータを作成する。
このような場合、音声制御部は、第2のマイク部から取得した音声を符号化してPCMデータを作成する。撮影制御部は、映像入力部、映像処理部、音声入力部、記録音声作成部、音声処理部、及びAVデータ作成部を含む。映像入力部は、カメラ部で取得した映像データが入力され、入力された映像データをビデオフレーム単位で出力する。映像処理部は、映像入力部から出力された映像データをエンコードして、ビデオデータを作成する。音声入力部は、第1のマイク部で取得した音声が入力され、入力された音声を符号化してPCMデータを作成する。記録音声作成部は、音声入力部で作成されたPCMデータ、及び音声制御部で作成されたPCMデータに基づいて、第1のマイク部で取得した音声から、第2のマイク部で取得した音声成分を除去したPCMデータを作成する。音声処理部は、記録音声作成部で作成されたPCMデータを圧縮して、オーディオデータを作成する。AVデータ作成部は、映像処理部で作成されたビデオデータと、音声処理部で作成されたオーディオデータとを多重化して、AVデータを作成する。
また、撮影制御部は、第1のマイク部で取得された音声に基づくオーディオデータと、第2のマイク部で取得された音声に基づくオーディオデータとを作成してもよい。
このような場合、音声制御部は、第2のマイク部から取得した音声を符号化してPCMデータを作成する。撮影制御部は、映像入力部、映像処理部、音声入力部、スイッチ部、音声処理部、及びAVデータ作成部を含む。映像入力部は、カメラ部で取得した映像データが入力され、入力された映像データをビデオフレーム単位で出力する。映像処理部は、映像入力部から出力された映像データをエンコードして、ビデオデータを作成する。音声入力部は、第1のマイク部で取得した音声が入力され、入力された音声を符号化してPCMデータを作成する。スイッチ部は、音声制御部と接続される。音声処理部は、音声入力部で作成されたPCMデータを圧縮して第1のオーディオデータと、スイッチ部を介して入力される音声制御部で作成されたPCMデータを圧縮して第2のオーディオデータとを作成する。AVデータ作成部は、映像処理部で作成されたビデオデータと、第1のオーディオデータと、第2のオーディオデータとを多重化して、AVデータを作成する。
記録音声作成部は、音声入力部で作成されたPCMデータが入力されるスイッチ部と、音声制御部で作成されたPCMデータに基づいて、第1のマイク部で取得されたであろう所定の音声成分を推定し、推定した音声成分からなるPCMデータを作成するフィルタ部と、スイッチ部を介して入力されたPCMデータから、フィルタ部で作成されたPCMデータを除去する引き算部とを備える。
好ましくは、所定の音声は通話用の音声である。このような場合、音声制御部は、外部の通信機器との間でデータを送受信するアンテナ部と、第2のマイク部から取得した通話用の音声を変調し、アンテナ部を介して外部に送信し、アンテナ部を介して受信するデータから音声を復調する通信制御部と、復調された音声を再生するスピーカ部とを備える。
通信制御部は、第2のマイク部から取得した通話用の音声をPCMデータに変換する第2の音声入力部と、第2の音声入力部で変換されたPCMデータを変調してアンテナ部を介して外部に送信し、アンテナ部を介して受信するデータからPCMデータを復調する通信処理部と、通信処理部で復調されたPCMデータを音声に変換して、スピーカ部から再生させる音声出力部とを備える。
インタフェース部は、動画の撮影を開始する撮影開始手段と、外部の通信機器からの着信に応答する着信応答手段とを含む。主処理部は、撮影開始手段が操作されると、撮影制御部に撮影を開始する指示を与え、着信応答手段が操作されると、通信制御部に着信に対して応答する指示を与える。
所定の音声は、会話に伴う音声であってもよい。このような場合、音声制御部は、第2のマイク部から取得した会話に伴う音声を符号化して、PCMデータに変換する第2の音声入力部を備える。
以上のように、本発明によれば、動画撮影と同時に通話を行った場合に、記録音声作成部で、第1のマイク部を介して取得した音声のPCMデータから、第2のマイク部を介して取得した音声の成分を除去したPCMデータを作成する。そして、記録音声作成部で作成されたPCMデータに基づくオーディオデータと、カメラ部で取得した映像データに基づくビデオデータとを多重化してAVデータを作成する。これによって、動画撮影装置は、撮影用である第1のマイク部で取得された音声から、通話用である第2のマイク部で取得された音声を除去した、AVデータを作成することができる。
また、本発明によれば、通話中であれば撮影されるAVデータに第1のマイク部で取得した音声のオーディオデータと、第2のマイク部で取得した音声のオーディオデータとを多重化することが可能となる。これにより、動画撮影中に通話を行った場合に、第1のマイク部から取得される音声、第2のマイク部から取得される音声の両方を記録することができる。
以下、本発明の実施形態について、図面を参照しながら説明する。
(第1の実施形態)
本発明の第1の実施形態に係る動画撮影装置の構成を説明する前に、まず、本発明の動画撮影装置の外観から説明する。
<動画撮影装置の外観>
図1は、本発明の第1の実施形態に係る動画撮影装置の外観の一例を示す斜視図である。なお、図1では、動画撮影装置が動画を撮影可能なカメラ付き携帯電話端末である場合を示している。図1(a)は、折りたたんだ状態のカメラ付き携帯電話端末の外観を示している。図1(b)は、開いた状態のカメラ付き携帯電話端末の外観を示している。図1(c)は、撮影を行う場合のカメラ付き携帯電話端末の外観を示している。図1(d)は、撮影と同時に通話を行う場合のカメラ付き携帯電話の外観を示している。
図1において、動画撮影装置は、蓋部101、本体部102、カメラ103、及びアンテナ104等を備える。蓋部101は、各種情報を表示する液晶表示部106、及び音声を取得するマイク107等を含む。本体部102は、電話番号の入力や各種機能の設定などに用いられるキー群105、及び動画等を記憶するためのメモリカードが挿入されるメモリカード挿入部108等を含む。
図1(a)において、蓋部101と本体部102とは互いに接続されていて、この接続部分を回転軸として、蓋部101を本体部102に対して回転させることが可能である。そして、蓋部101を回転させたのが図1(b)の状態である。さらに、蓋部101は、この回転軸に垂直な軸を回転軸として回転させることが可能である。そして、蓋部101をこの垂直な軸を回転軸にして回転させたのが図1(c)の状態である。図1(c)において、動画撮影装置は、カメラ103から映像データを、マイク107から音声データを取得して、映像データ及び音声データを多重化してAVデータを作成する。そして、作成したAVデータをメモリカードに記録する。動画撮影装置の使用者は、キー群105を操作することで撮影開始の操作を行い、記録している映像データを液晶表示部106で確認しながら撮影を行うことができる。
図1(d)において、動画撮影装置は、ヘッドホン110及びヘッドセットマイク111を有するハンズフリー装置を接続している。動画撮影装置は、ハンズフリー装置を接続することで、AVデータを作成すると同時に、アンテナ104を介して外部の通信機器と通信を行うことができる。動画撮影装置の使用者は、キー群105を操作することで撮影開始及び通話着信への応答操作を行い、動画の撮影を行いながら、ヘッドホン110及びヘッドセットマイク111を用いて通話を行う。
<動画撮影装置の構成>
図2は、本発明の第1の実施形態に係る動画撮影装置の構成の一例を示すブロック図である。図2において、第1の実施形態に係る動画撮影装置は、主処理部10、インタフェース部20、撮影制御部30、通信制御部40、カメラ部51、第1のマイク部52、第2のマイク部53、スピーカ部54、及びアンテナ部55を備える。
主処理部10は、動画撮影装置の各所構成に対して所定の指示を与える。主処理部10は、インタフェース部20を介して通知される使用者の操作内容に基づいて、例えば、動画撮影制御部30に対して動画撮影に関する指示や、通信制御部40に対して着信応答などの通信に関する指示を与える。
インタフェース部20は、使用者の操作内容を主処理部10等に対して通知する。インタフェース部20は、撮影開始手段21、及び着信応答手段22を含む。撮影開始手段21は、動画の撮影を開始する手段である。着信応答手段22は、動画撮影装置に着信があった時にその着信に応答する手段である。また、着信応答手段22は、動画撮影装置が通話中であるか否かの情報を記録音声作成部34に対して通知する。
撮影制御部30は、主処理部10からの指示を受け、動画撮影に関する制御を行う。撮影制御部30は、映像入力部31、映像処理部32、音声入力部33、記録音声作成部34、音声処理部35、及びAVデータ作成部36を含む。
映像入力部31は、カメラ部51で撮像されたYUV(輝度信号および色差信号)などの画素を表す映像データをビデオフレーム単位で映像処理部32に出力する。映像処理部32は、映像入力部31から取得した映像データをビデオフレーム単位で圧縮して、ビデオデータにエンコードし、AVデータ作成部36に対して出力する。ビデオデータとは、例えば、MPEG2ビデオ規格(ISO/IEC13812−2)、MPEG4ビデオ規格(ISO/IEC14496−2)、及びMPEG4AVC規格(ISO/IEC14496−10)等に準拠した映像信号を圧縮したデータである。
音声入力部33は、第1のマイク部52を制御し、第1のマイク部52から取得したアナログ音声信号をPCMデータ(非圧縮デジタル音声信号)に変換して、記録音声作成部34へ出力する。記録音声作成部34は、着信応答手段22から通知された通話中であるか否かの情報に基づいて、音声処理部35へ出力すべきPCMデータを作成する。記録音声作成部34の詳細については後述する。
音声処理部35は、記録音声作成部34から取得したPCMデータを圧縮し、AVデータ作成部36に対してオーディオデータを出力する。オーディオデータとは、例えば、MPEG2オーディオ規格(ISO/IEC13812−3)、及びMPEG2AAC規格(ISO/IEC13812−7)などに準拠した音声信号を圧縮したデータである。
AVデータ作成部36は、映像処理部32から取得したビデオデータ、及び音声処理部35から取得したオーディオデータを多重化してAVデータを作成する。AVデータとは、MPEG2システム規格(ISO/IEC13812−1)の定めるPS(プログラム・ストリーム)やTS(トランスポート・ストリーム)、マイクロソフト社のAdvanced Systems Format(ASF) Specificationなどの規格に準拠して、ビデオデータおよびオーディオデータを多重化したデータである。
通信制御部40は、主処理部10からの指示を受け、外部との通信に関する制御を行う。通信制御部40は、音声入力部41、通信処理部42、及び音声出力部43を含む。音声入力部41は、第2のマイク部53を制御し、第2のマイク部53から取得したアナログ音声信号をPCMデータに変換して、記録音声作成部34及び通信処理部42へ出力する。
通信処理部42は、アンテナ部55を介して外部の通信機器とデータの送受信を行う。データ送信の場合、通信処理部42は、音声入力部41から出力されるPCM(Pulse Code Modulation、非圧縮デジタル音声信号)データを、例えば、3GPP(3rd Generation Partnership Project)で規定されたAMR符号化などの通信用の音声信号符号化方法で符号化した後に変調し、アンテナ部55を介して外部に送信する。データ受信の場合、通信処理部42は、アンテナ部55を介して受信したデータを復調して生成された音声データ(例えば、AMR符号化などの音声通信用の符号化方法で符号化されたデータ)をPCMデータに復号化して、音声出力部43へ出力する。音声出力部43は、通信処理部42から出力されたPCMデータを音声に変換して、スピーカ部54から再生させる。
カメラ部51は、撮影で取得するAVデータのうちビデオデータのもとになる(すなわち、撮影用の)映像データを取得する。カメラ部51は、例えば、レンズ、露光の絞りを行うアイリス、入光を受光する撮像素子、及び撮像素子の出力を増幅出力する増幅回路等から構成される。図1においては、カメラ103がカメラ部51に相当する。第1のマイク部52は、撮影で取得するAVデータのうちオーディオデータのもとになる(すなわち、撮影用の)アナログ音声信号を取得する。図1においては、マイク107が第1のマイク部52に相当する。
第2のマイク部53は、外部の通信機器との通話に伴って発生する(すなわち、通話用の)アナログ音声信号を取得する。図1においては、ヘッドセットマイク111が第2のマイク部53に相当する。スピーカ部54は、アンテナ部55を介して受信した音声データを再生する。図1においては、ヘッドホン110がスピーカ部54に相当する。アンテナ部55は、外部の通信機器と通信データを送受信する。
なお、通信制御部40、スピーカ部54、及びアンテナ部55は、撮影者が発した音声を外部に送信するなど、撮影者が発した音声に所定の処理を施すための構成であるので、まとめて音声制御部とすることができる。
<記録音声作成部24の詳細な構成>
図3は、記録音声作成部34の詳細な構成の一例を示すブロック図である。図3において、記録音声作成部34は、フィルタ部6、スイッチ部7、スイッチ部8、及び引き算器9を有する。
ここでは、第1のマイク部52には、撮影用の音声S1と、撮影者の通話に伴う音声S2の一部である音声S2Nとが入力されるものとする。また、第2のマイク部53には、撮影者の通話に伴う音声S2(通話用の音声)が入力されるものとする。
フィルタ部6は、第2のマイク部53から取得した音声S2のPCMデータに基づいて、第1のマイク部52から取得した音声S1+S2NのPCMデータのうち、音声S2N成分を推定した音声S2nのPCMデータを作成する。フィルタ部6には、例えば、FIR(Finite Impulse Response)フィルタなどが用いられる。
スイッチ部7及びスイッチ部8は、着信応答手段22から通知された通話中であるか否かの情報に基づいて内部接続を切替える。具体的には、通話中である場合、スイッチ部7が端子7aと端子7cとを、スイッチ部8が端子8aと端子8cとをそれぞれ接続させる。また、通話中でない場合、スイッチ部7が端子7aと端子7bとを、スイッチ部8が端子8aと端子8bとをそれぞれ接続させる。引き算器9は、第1のマイク部52から取得した音声S1+S2NのPCMデータから、フィルタ部6で作成された音声S2nのPCMデータを除去する。
すなわち、通話中である場合は、記録音声作成部34は、音声入力部33を介して出力されるPCMデータから、音声入力部41を介して出力されるPCMデータの成分を除去したPCMデータを音声処理部35に出力する。一方、通話中でない場合は、記録音声作成部34は、音声入力部33を介して出力されるPCMデータをそのまま音声処理部35に出力する。
<動画撮影装置の動作>
次に、第1の実施形態に係る動画撮影装置の動作について、図4及び図5を用いて説明する。図4は、動画撮影のみを行う場合における動画撮影装置の動作の一例を示すフローチャートである。図5は、動画撮影と同時に通話を行う場合における動画撮影装置の動作の一例を示すフローチャートである。
まず、動画撮影のみを行う場合における動画撮影装置の動作について説明する。図4を参照して、撮影者が動画撮影を開始すると、第1のマイク部52は、撮影用の音声S1を取得し(ステップS101)、音声入力部33にアナログ音声信号を出力する(ステップS102)。音声入力部33は、アナログ音声信号を基にPCMデータを作成し(ステップS103)、作成したPCMデータを記録音声作成部34へ出力する(ステップS104)。記録音声作成部34は、取得したPCMデータを、そのまま音声処理部35へ出力する(ステップS105)。音声処理部35は、PCMデータを符号化してオーディオデータを作成し(ステップS106)、作成したオーディオデータをAVデータ作成部36に出力する(ステップS107)。
また、第1のマイク部52が音声S1を取得するのと同時に、カメラ部51は、撮像データを取得し(ステップS108)、映像入力部31に映像データを出力する(ステップS109)。映像入力部31は、ビデオフレームごとに映像データを映像処理部32に出力する(ステップS110)。映像処理部32は、映像データを符号化してビデオデータを作成し(ステップS111)、作成したビデオデータをAVデータ作成部36に出力する(ステップS112)。
AVデータ作成部36は、音声処理部35から出力されたオーディオデータと映像処理部32から出力されたビデオデータとを多重化して、撮影が終了するまでAVデータを生成する(ステップS113、S114)。
次に、動画撮影と同時に通話を行う場合における動画撮影装置の動作について説明する。図5を参照して、撮影者が動画撮影と同時に通話を開始すると、第1のマイク部52は、撮影用の音声S1と、通話用の音声S2の一部である音声S2Nとを取得し(ステップS201)、音声入力部33にアナログ音声信号を出力する(ステップS202)。音声入力部33は、アナログ音声信号を基にPCMデータを作成し(ステップS203)、作成したPCMデータを記録音声作成部34へ出力する(ステップS204)。
また、同時に第2のマイク部53は、通話用の音声S2を取得し(ステップS205)、音声入力部41にアナログ音声信号を出力する(ステップS206)。音声入力部41は、アナログ音声信号を基にPCMデータを作成し(ステップS207)、作成したPCMデータを記録音声作成部34へ出力する(ステップS208)。
記録音声作成部34には、音声入力部33から音声S1+S2NのPCMデータ、及び音声入力部41から音声S2のPCMデータが入力される。記録音声作成部34は、音声S2のPCMデータに基づいて、第1のマイク部52から取得されたであろう音声S2Nを推定する。そして、音声S1+S2NのPCMデータから、推定した音声S2NのPCMデータを除去し、撮影用の音声S1のみのPCMデータを音声処理部35へ出力する(ステップS209)。
音声処理部35は、取得したPCMデータを符号化してオーディオデータを作成し(ステップS210)、作成したオーディオデータをAVデータ作成部36に出力する(ステップS211)。
また、第1のマイク部52が音声S1を取得するのと同時に、カメラ部51は、撮像データを取得し(ステップS212)、映像入力部31に映像データを出力する(ステップS213)。映像入力部31は、ビデオフレームごとに映像データを映像処理部32に出力する(ステップS214)。映像処理部32は、映像データを符号化してビデオデータを作成し(ステップS215)、作成したビデオデータをAVデータ作成部36に出力する(ステップS216)。
AVデータ作成部36は、音声処理部35から出力されたオーディオデータと映像処理部32から出力されたビデオデータとを多重化して、通話あるいは撮影が終了までAVデータを生成する(ステップS217、S218)。
以上のように、第1の実施形態に係る動画撮影装置によれば、動画撮影と同時に通話を行った場合に、記録音声作成部34で、第1のマイク部52を介して取得した音声のPCMデータから、第2のマイク部53を介して取得した音声の成分を除去したPCMデータを作成する。そして、記録音声作成部34で作成されたPCMデータに基づくオーディオデータと、カメラ部51で取得した映像データに基づくビデオデータとを多重化してAVデータを作成する。これによって、動画撮影装置は、撮影用である第1のマイク部52で取得された音声から、通話用である第2のマイク部53で取得された音声を除去した、AVデータを作成することができる。
なお、第1の実施形態において、記録音声作成部34は、通話中であるか否かの情報を着信応答手段22から取得していたが、通信処理部42や主処理部10等の通話中であるか否かを判断できる構成から取得してもよい。
(第2の実施形態)
本発明の第2の実施形態に係る動画撮影装置は、第1のマイク部52で取得した音声から、第2のマイク部53で取得した音声の成分を除去せずに、両方の音声をそれぞれ別のストリームとして記録する。そして、撮影後において専用の編集機器等を用いて、第1のマイク部52で取得した音声から、第2のマイク部53で取得した音声を除去することを想定している。
<動画撮影装置の構成>
図6は、本発明の第2の実施形態に係る動画撮影装置の構成の一例を示すブロック図である。第2の実施形態に係る動画撮影装置において、第1の実施形態と同様の構成については、同一の参照符号を付して説明を省略する。
図6において、第2の実施形態に係る動画撮影装置は、主処理部10、インタフェース部202、撮影制御部302、通信制御部40、カメラ部51、第1のマイク部52、第2のマイク部53、スピーカ部54、及びアンテナ部55を備える。すなわち、第2の実施形態に係る動画撮影装置においては、インタフェース部202及び撮影制御部302が第1の実施形態と異なる。
インタフェース部202は、第1の実施形態と同様に使用者の操作内容を主処理部10等に対して通知する。インタフェース部202は、撮影開始手段21及び着信応答手段222を含む。着信応答手段222は、動画撮影装置が通話中であるか否かの情報(又は通話開始及び通話停止の情報)を映像処理部322、スイッチ部342、及びAVデータ作成部362に対して通知する。
撮影制御部302は、第1の実施形態と同様に主処理部10からの指示を受け、動画撮影に関する制御を行う。撮影制御部302は、映像入力部31、映像処理部322、音声入力部33、スイッチ部342、音声処理部352、及びAVデータ作成部362を含む。
映像処理部322は、映像入力部31から取得した映像データをエンコードし、AVデータ作成部362に対してビデオデータを出力する。映像処理部322で生成されるビデオデータは、第1の実施形態と同様にMPEG2ビデオ規格等に準拠して映像データを圧縮したデータである。映像データを圧縮する場合、通常、圧縮率を向上させるために数ビデオフレーム単位でフレーム間の相関を取って圧縮を行う。MPEG2ビデオ規格では、GOP(Group Of Picture)単位でビデオフレーム間の相関をとって圧縮を行っている。以降では説明を簡単にするために、相互に相関を取って圧縮した数フレームのビデオフレームの単位をGOPとして説明する。映像処理部322は、着信応答手段222から通話開始および通話停止の情報を受けると、その時点で映像入力部31から受け取っているビデオフレームをGOPの最終フレームとする。そして、映像入力部31から次に受け取るビデオフレームをGOPの先頭フレームとする。
スイッチ部342は、着信応答手段222から通知された通話中であるか否かの情報に基づいて、音声処理部352にPCMデータを出力するか否かを決定する。スイッチ部342は、通知された情報が通話中であれば、音声入力部41からPCMデータを取得して、音声処理部352に出力する。
音声処理部352は、入力されたPCMデータを圧縮し、AVデータ作成部362に対してオーディオデータを出力する。音声処理部352は、スイッチ部342の状態によっては、音声入力部33および音声入力部41の両方からPCMデータを取得することになる。このような場合、音声処理部352は、両方のPCMデータをそれぞれ別のストリームのオーディオデータとして、AVデータ作成部362出力する。
AVデータ作成部362は、映像処理部322から取得したビデオデータ、及び音声処理部352から取得したオーディオデータを多重化してAVデータを作成する。AVデータ作成部362には、2つのモードがあり、作成するAVデータの種類により通話時モードと非通話時モードとに分けられる。通話時モードの場合、AVデータ作成部362は、カメラ部51で取得した映像データをもとに作成されたビデオデータ、第1のマイク部52で取得した音声データをもとに作成されたオーディオデータ、第2のマイク部53で取得した音声データをもとに作成されたオーディオデータの少なくとも3つのストリームを多重化してAVデータを作成する。
また、非通話時モードの場合、AVデータ作成部362は、カメラ部51で取得した映像データをもとに作成されたビデオデータと、第1のマイク部52で取得した音声データをもとに作成されたオーディオデータとの少なくとも2つのストリームを多重化してAVデータを作成する。
<通話時モードと非通話時モードとの間の遷移について>
本発明の第2の実施形態に係る動画撮影装置が作成するAVデータは、通話時には最低でもビデオデータ1ストリームと、オーディオデータ2ストリームとが多重化されている。また、非通話時には最低でもビデオデータ1ストリームと、オーディオデータ1ストリームとが多重化されている。そのため、通話開始時及び通話停止時には、多重化されるストリーム数が変化することになる。公知の規格に従ったAVデータの場合、AVデータの途中で多重化されるストリーム数が変更されると、ストリーム数の変更がAVデータのどの部分からであるかが明確になるように、AVデータの中にストリーム数の変更点についての情報が記録される。更にMPEG2システム規格などでは、AVデータにおけるストリーム数の変更点は、多重化されているビデオデータのGOP境界、オーディオデータのオーディオフレーム境界である必要がある。
そのため、第2の実施形態に係るAVデータ作成部362は、着信応答手段222から通話開始および通話停止の情報を受けても、すぐには、通話時モードや非通話時モードにモードを変更させない(多重化させるストリーム数を変更しない)。すなわち、AVデータ作成部362は、ビデオデータのGOP境界が来るまでモードを変更せずに多重化を続けた後、作成しているAVデータに多重化されるストリーム数が変更されることを明示的に記録した上で、通話時モードや非通話時モードにモードを変化させて、多重化させるストリーム数を変更する。
このAVデータ作成部362のモード変化の詳細な様子を図7、図8を用いて説明する。図7は、非通話時モードから通話時モードへの遷移の様子を示すフローチャートである。図8は、通話時モードから非通話時モードへの遷移の様子を示すフローチャートである。
まず、図7を用いて、非通話時モードから通話時モードへの遷移の様子について説明する。AVデータ作成部362及び映像処理部322には、着信応答手段222から通話開始の情報が通知される(ステップS301)。映像処理部322は、着信応答手段222から通話開始の情報が通知されると、その時点で符号化しているビデオフレームをGOPの境界とする。AVデータ作成部362は、映像処理部322からGOPの先頭にあたるデータを取得するまでは、非通話時モードのままビデオデータとオーディオデータとを多重化する(ステップS302)。AVデータ作成部362は、映像処理部322からGOPの先頭を取得すると、多重化されるストリーム数が変更されることを、作成するAVデータに明示した上で(ステップS303)、非通話時モードから通話時モードにモードを変化させる(ステップS304)。以降、AVデータ作成部362は、カメラ部51で取得した映像データをもとにしたビデオデータ、第1のマイク部52で取得した音声をもとにしたオーディオデータ、第2のマイク部53で取得した音声をもとにしたオーディオデータの3つのストリームを多重化して、AVデータを作成する。
次に、図8を用いて、通話時モードから非通話時モードへ遷移する様子について説明する。AVデータ作成部362及び映像処理部322には、着信応答手段222から通話終了の情報が通知される(ステップS401)。映像処理部322は、着信応答手段222から通話終了の情報が通知されると、その時点で符号化しているビデオフレームをGOPの境界とする。AVデータ作成部362は、映像処理部322からGOPの先頭にあたるデータを取得するまでは、通話時モードのままビデオデータとオーディオデータとを多重化する(ステップS402)。AVデータ作成部362は、映像処理部322からGOPの先頭を取得すると、多重化されるストリーム数が変更されることを、作成するAVデータに明示した上で(ステップS403)、通話時モードから非通話時モードにモードを変化させる(ステップS404)。以降、AVデータ作成部362は、カメラ部51で取得した映像データをもとにしたビデオデータ、第1のマイク部52で取得した音声をもとにしたオーディオデータの2つのストリームを多重化して、AVデータを作成する。
<動画撮影装置の動作>
次に、第2の実施形態に係る動画撮影装置の動作について、図9及び図10を用いて説明する。図9は、非通話時モードにおける動画撮影装置の動作の一例を示すフローチャートである。図10は、通話時モードにおける動画撮影装置の動作の一例を示すフローチャートである。
まず、図9を用いて、非通話時モードにおける動画撮影装置の動作について説明する。図9を参照して、撮影者が撮影を開始すると、第1のマイク部52は、撮影用の音声S1を取得し(ステップS501)、音声入力部33にアナログ音声信号を出力する(ステップS502)。音声入力部33は、アナログ音声信号を基にPCMデータを作成し(ステップS503)、作成したPCMデータを音声処理部352へ出力する(ステップS504)。音声処理部352は、取得したPCMデータを符号化してオーディオデータを作成し(ステップS505)、作成したオーディオデータをAVデータ作成部362に出力する(ステップS506)。
また、第1のマイク部52から音声S1を取得するのと同時に、カメラ部51は、撮像データを取得し(ステップS507)、映像入力部31に映像データを出力する(ステップS508)。映像入力部31は、ビデオフレームごとに映像データを映像処理部322に出力する(ステップS509)。映像処理部322は、映像信号を符号化してビデオデータを作成し(ステップS510)、作成したビデオデータをAVデータ作成部362に出力する(ステップS511)。
AVデータ作成部362は、音声処理部352から出力されたオーディオデータと映像処理部322から出力されたビデオデータとを多重化して、撮影が終了するかあるいはAVデータ作成部362が通話時モードになるまでAVデータを生成する(ステップS512、S513)。
次に、図10を用いて、通話時モードにおける動画撮影装置の動作について説明する。図10を参照して、撮影者が動画撮影中に通話を開始すると、第1のマイク部52は、撮影用の音声S1と、通話用の音声S2の一部である音声S2Nとを取得し(ステップS601)、音声入力部33にアナログ音声信号を出力する(ステップS602)。音声入力部33は、アナログ音声信号を基にPCMデータを作成し(ステップS603)、作成したPCMデータを音声処理部352へ出力する(ステップS604)。音声処理部352は、取得したPCMデータを符号化して第1のオーディオデータを作成し(ステップS605)、作成した第1のオーディオデータをAVデータ作成部362に出力する(ステップS606)。
また、同時に第2のマイク部53は、通話用の音声S2を取得し(ステップS607)、音声入力部41にアナログ音声信号を出力する(ステップS608)。音声入力部41は、アナログ音声信号を基にPCMデータを作成し(ステップS609)、作成したPCMデータを音声処理部352へ出力する(ステップS610)。音声処理部352は、取得したPCMデータを符号化して第2のオーディオデータを作成し(ステップS611)、作成した第2のオーディオデータをAVデータ作成部362に出力する(ステップS612)。
また、第1のマイク部52が音声S1+S2Nを取得するのと同時に、カメラ部51は、撮像データを取得し(ステップS613)、映像入力部31に映像データを出力する(ステップS614)。映像入力部31は、ビデオフレームごとに映像データを映像処理部322に出力する(ステップS615)。映像処理部322は、映像データを符号化してビデオデータを作成し(ステップS616)、作成したビデオデータをAVデータ作成部362に出力する(ステップS617)。
AVデータ作成部362は、音声処理部352から出力された第1のオーディオデータ、第2のオーディオデータ、及び映像処理部322から出力されたビデオデータを多重化して、撮影が終了するかあるいは通話時モードになるまで、AVデータを生成する(ステップS618、S619)。
以上のように、第2の実施形態に係る動画撮影装置によれば、通話中であれば撮影されるAVデータに第1のマイク部52で取得した音声のオーディオデータと、第2のマイク部53で取得した音声のオーディオデータとを多重化することが可能となる。これにより、動画撮影中に通話を行った場合に、第1のマイク部52から取得される音声、第2のマイク部53から取得される音声の両方を記録することができる。
なお、第2の実施形態において、AVデータ作成部362、映像処理部322、及びスイッチ部342は、通話中であるか否かの情報を着信応答手段222から取得しているが、通信処理部42や主処理部10等の通話中であるか否かを判断できる構成から取得してもよい。
また、第2の実施形態においては、第1のマイク部52から取得した音声から作成した第1のオーディオデータ、第2のマイク部53から取得した音声から作成した第2のオーディオデータ、及びカメラ部51から取得した映像データから作成したビデオデータを多重化するデータとしたが、これ以外のデータをさらに多重化してもよい。例えば、AVデータ作成部362は、通話時モードでは「通話中」であることを表す文字情報データをさらに多重化してもよい。
本発明の第3の実施形態に係る動画撮影装置は、第1及び第2の実施形態に係る動画撮影装置が動画撮影と同時に通信を介した通話が行われることを想定しているのに対して、動画撮影と同時に会話が行われることを想定している。具体的には、第3の実施形態に係る動画撮影装置は、ビデオカメラ等の撮影装置に適用されることを想定している。
図11は、本発明の第3の実施形態に係る動画撮影装置の構成の一例を示すブロック図である。図11において、第3の実施形態に係る動画撮影装置は、音声制御部の構成が第1及び第2の実施形態と異なる。音声制御部は、音声入力部41を含む。音声入力部41は、第2のマイク部53を制御し、第2のマイク部53から取得したアナログ音声信号をPCMデータに変換して、記録音声作成部34(又はスイッチ部)及び通信処理部42へ出力する。
以上のように、第3の実施形態に係る動画撮影装置によれば、動画撮影と同時に会話を行った場合も、第1及び第2の実施形態と同様の効果を得ることができる。
本発明の動画撮影装置は、動画撮影中に通話すること等に適している。
本発明の第1の実施形態に係る動画撮影装置の外観の一例を示す斜視図 本発明の第1の実施形態に係る動画撮影装置の構成の一例を示すブロック図 記録音声作成部34の詳細な構成の一例を示すブロック図 動画撮影のみを行う場合における動画撮影装置の動作の一例を示すフローチャート 動画撮影と同時に通話を行う場合における動画撮影装置の動作の一例を示すフローチャート 本発明の第2の実施形態に係る動画撮影装置の構成の一例を示すブロック図 非通話時モードから通話時モードへの遷移の様子を示すフローチャート 通話時モードから非通話時モードへの遷移の様子を示すフローチャート 非通話時モードにおける動画撮影装置の動作の一例を示すフローチャート 通話時モードにおける動画撮影装置の動作の一例を示すフローチャート 本発明の第3の実施形態に係る動画撮影装置の構成の一例を示すブロック図
符号の説明
10 主処理部
20、105 インタフェース部
21 撮影開始手段
22 着信応答手段
30 撮影制御部
31 映像入力部
32、322 映像処理部
33 音声入力部
34 記録音声作成部
342 スイッチ部
35、352 音声処理部
36、362 AVデータ作成部
40 通信制御部
41 音声入力部
42 通信処理部
43 音声出力部
51、103 カメラ部
52、107 第1のマイク部
53、111 第2のマイク部
54、110 スピーカ部
55、104 アンテナ部
101 蓋部
102 本体部
106 液晶表示部
108 メモリカード挿入部

Claims (10)

  1. 動画の撮影が可能な撮影装置であって、
    使用者の操作内容が入力されるインタフェース部と、
    映像データを取得するカメラ部と、
    撮影用の音声を取得する第1のマイク部と、
    所定の音声を取得する第2のマイク部と、
    前記カメラ部で取得した映像データに基づいて作成されたビデオデータと、前記第1のマイク部で取得した音声及び前記第2のマイク部で取得した音声に基づいて作成された少なくとも1つのオーディオデータとを多重化し、AVデータを作成する撮影制御部と、
    前記第2のマイク部で取得した音声に所定の処理を施す音声制御部と、
    前記インタフェース部を介して入力される操作内容に応じた指示を、前記撮影制御部と前記音声制御部とに与える主処理部とを備えることを特徴とする、撮影装置。
  2. 前記撮影制御部は、前記第1のマイク部で取得された音声から、前記第2のマイク部で取得された音声成分が除去されたオーディオデータを作成することを特徴とする、請求項1に記載の撮影装置。
  3. 前記撮影制御部は、前記第1のマイク部で取得された音声に基づくオーディオデータと、前記第2のマイク部で取得された音声に基づくオーディオデータとを作成することを特徴とする、請求項1に記載の撮影装置。
  4. 前記音声制御部は、前記第2のマイク部から取得した音声を符号化してPCMデータを作成し、
    前記撮影制御部は、
    前記カメラ部で取得した映像データが入力され、当該入力された映像データをビデオフレーム単位で出力する映像入力部と、
    前記映像入力部から出力された映像データをエンコードして、ビデオデータを作成する映像処理部と、
    前記第1のマイク部で取得した音声が入力され、当該入力された音声を符号化してPCMデータを作成する音声入力部と、
    前記音声入力部で作成されたPCMデータ、及び前記音声制御部で作成されたPCMデータに基づいて、前記第1のマイク部で取得した音声から、前記第2のマイク部で取得した音声成分を除去したPCMデータを作成する記録音声作成部と、
    前記記録音声作成部で作成されたPCMデータを圧縮して、前記オーディオデータを作成する音声処理部と、
    前記映像処理部で作成されたビデオデータと、前記音声処理部で作成されたオーディオデータとを多重化して、前記AVデータを作成するAVデータ作成部とを含むことを特徴とする、請求項2に記載の撮影装置。
  5. 前記音声制御部は、前記第2のマイク部から取得した音声を符号化してPCMデータを作成し、
    前記撮影制御部は、
    前記カメラ部で取得した映像データが入力され、当該入力された映像データをビデオフレーム単位で出力する映像入力部と、
    前記映像入力部から出力された映像データをエンコードして、ビデオデータを作成する映像処理部と、
    前記第1のマイク部で取得した音声が入力され、当該入力された音声を符号化してPCMデータを作成する音声入力部と、
    前記音声制御部と接続されるスイッチ部と、
    前記音声入力部で作成されたPCMデータを圧縮して第1のオーディオデータと、前記スイッチ部を介して入力される前記音声制御部で作成されたPCMデータを圧縮して第2のオーディオデータとを作成する音声処理部と、
    前記映像処理部で作成されたビデオデータと、前記第1のオーディオデータと、前記第2のオーディオデータとを多重化して、前記AVデータを作成するAVデータ作成部とを含むことを特徴とする、請求項3に記載の撮影装置。
  6. 前記記録音声作成部は、
    前記音声入力部で作成されたPCMデータが入力されるスイッチ部と、
    前記音声制御部で作成されたPCMデータに基づいて、前記第1のマイク部で取得されたであろう所定の音声成分を推定し、当該推定した音声成分からなるPCMデータを作成するフィルタ部と、
    前記スイッチ部を介して入力されたPCMデータから、前記フィルタ部で作成されたPCMデータを除去する引き算部とを備えることを特徴とする、請求項4に記載の撮影装置。
  7. 前記所定の音声は通話用の音声であり、
    前記音声制御部は、
    外部の通信機器との間でデータを送受信するアンテナ部と、
    前記第2のマイク部から取得した通話用の音声を変調し、前記アンテナ部を介して外部に送信し、前記アンテナ部を介して受信するデータから音声を復調する通信制御部と、
    前記復調された音声を再生するスピーカ部とを備えることを特徴とする、請求項1〜6のいずれかに記載の撮影装置。
  8. 前記通信制御部は、
    前記第2のマイク部から取得した通話用の音声をPCMデータに変換する第2の音声入力部と、
    前記第2の音声入力部で変換されたPCMデータを変調して前記アンテナ部を介して外部に送信し、前記アンテナ部を介して受信するデータからPCMデータを復調する通信処理部と、
    前記通信処理部で復調されたPCMデータを音声に変換して、前記スピーカ部から再生させる音声出力部とを備えることを特徴とする、請求項7に記載の撮影装置。
  9. 前記インタフェース部は、
    動画の撮影を開始する撮影開始手段と、
    前記外部の通信機器からの着信に応答する着信応答手段とを含み、
    前記主処理部は、前記撮影開始手段が操作されると、前記撮影制御部に撮影を開始する指示を与え、前記着信応答手段が操作されると、前記通信制御部に着信に対して応答する指示を与えることを特徴とする、請求項8に記載の撮影装置。
  10. 前記所定の音声は会話に伴う音声であり、
    前記音声制御部は、前記第2のマイク部から取得した会話に伴う音声を符号化して、PCMデータに変換する第2の音声入力部を備えることを特徴とする、請求項1〜6のいずれかに記載の撮影装置。

JP2005024019A 2005-01-31 2005-01-31 撮影装置 Pending JP2006211570A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005024019A JP2006211570A (ja) 2005-01-31 2005-01-31 撮影装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005024019A JP2006211570A (ja) 2005-01-31 2005-01-31 撮影装置

Publications (1)

Publication Number Publication Date
JP2006211570A true JP2006211570A (ja) 2006-08-10

Family

ID=36967877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005024019A Pending JP2006211570A (ja) 2005-01-31 2005-01-31 撮影装置

Country Status (1)

Country Link
JP (1) JP2006211570A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008278315A (ja) * 2007-05-01 2008-11-13 Casio Comput Co Ltd 撮像装置及びそのプログラム
JP2010112996A (ja) * 2008-11-04 2010-05-20 Sony Corp 音声処理装置、音声処理方法およびプログラム
JP2010112995A (ja) * 2008-11-04 2010-05-20 Sony Corp 通話音声処理装置、通話音声処理方法およびプログラム
JP2019061624A (ja) * 2017-09-28 2019-04-18 アルパイン株式会社 ドライブレコーダシステム、および、ドライブレコーダシステムによるファイル生成方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008278315A (ja) * 2007-05-01 2008-11-13 Casio Comput Co Ltd 撮像装置及びそのプログラム
JP2010112996A (ja) * 2008-11-04 2010-05-20 Sony Corp 音声処理装置、音声処理方法およびプログラム
JP2010112995A (ja) * 2008-11-04 2010-05-20 Sony Corp 通話音声処理装置、通話音声処理方法およびプログラム
US8818805B2 (en) 2008-11-04 2014-08-26 Sony Corporation Sound processing apparatus, sound processing method and program
JP2019061624A (ja) * 2017-09-28 2019-04-18 アルパイン株式会社 ドライブレコーダシステム、および、ドライブレコーダシステムによるファイル生成方法

Similar Documents

Publication Publication Date Title
KR20050015932A (ko) 전화 통신 시스템
KR100605935B1 (ko) 동영상 촬영 방법
JP2008182463A (ja) テレビジョン受信装置
KR20070117284A (ko) 듀얼 카메라를 구비한 이동 통신 단말기에서 복수의 영상합성방법
KR100689419B1 (ko) 카메라를 구비한 이동 단말에서 촬영 이미지 합성 장치 및방법
JP2006211570A (ja) 撮影装置
US7606432B2 (en) Apparatus and method for providing thumbnail image data on a mobile terminal
JP4247666B2 (ja) 画像処理方法及び画像処理システム
JP2005184060A (ja) 電子カメラ
JP4103361B2 (ja) 携帯通信装置
JP4186416B2 (ja) カメラ付きドアホン
JP2006140596A (ja) 通信端末
KR100769672B1 (ko) 화상 통신이 가능한 이동통신단말기
JP2000151832A (ja) 通信装置及びその制御方法
JP2003209600A (ja) 通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体
JP2006332968A (ja) テレビ電話装置
JP2007006085A (ja) 無線携帯端末、並びに、それを用いた撮像方法および通信方法
KR100617564B1 (ko) 이동단말기의 화상통화를 이용한 멀티미디어 데이터 전송방법
KR20240002919A (ko) 촬상장치, 그 제어방법, 및 기억매체
JPH11308589A (ja) 画像送信装置及び方法
JPH03136546A (ja) 留守番テレビ電話機
JP4497241B2 (ja) 通信機能付きカメラ
CN114625336A (zh) 通话方法、装置、终端设备及存储介质
JP4683117B2 (ja) 通信機能付カメラ
KR100574665B1 (ko) 동영상촬영을 위한 이동통신 단말기의 스테레오오디오입력장치