JP2019062448A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2019062448A JP2019062448A JP2017186627A JP2017186627A JP2019062448A JP 2019062448 A JP2019062448 A JP 2019062448A JP 2017186627 A JP2017186627 A JP 2017186627A JP 2017186627 A JP2017186627 A JP 2017186627A JP 2019062448 A JP2019062448 A JP 2019062448A
- Authority
- JP
- Japan
- Prior art keywords
- image
- area
- voice
- image processing
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims description 46
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000003384 imaging method Methods 0.000 claims description 98
- 238000000034 method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 230000036544 posture Effects 0.000 description 38
- 230000002093 peripheral effect Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 102100022530 45 kDa calcium-binding protein Human genes 0.000 description 6
- 101000899406 Homo sapiens 45 kDa calcium-binding protein Proteins 0.000 description 6
- 101000617130 Homo sapiens Stromal cell-derived factor 1 Proteins 0.000 description 6
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000009434 installation Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 101000684994 Homo sapiens Stromal cell-derived factor 2 Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 101100029154 Mus musculus Serpinf1 gene Proteins 0.000 description 2
- 102100023184 Stromal cell-derived factor 2 Human genes 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/62—Control of parameters via user interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2621—Cameras specially adapted for the electronic generation of special effects during image pickup, e.g. digital cameras, camcorders, video cameras having integrated special effects capability
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B13/00—Optical objectives specially designed for the purposes specified below
- G02B13/06—Panoramic objectives; So-called "sky lenses" including panoramic objectives having reflecting surfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
- G06T3/047—Fisheye or wide-angle transformations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/698—Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
- H04N25/60—Noise processing, e.g. detecting, correcting, reducing or removing noise
- H04N25/61—Noise processing, e.g. detecting, correcting, reducing or removing noise the noise originating only from the lens unit, e.g. flare, shading, vignetting or "cos4"
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/01—Input selection or mixing for amplifiers or loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Optics & Photonics (AREA)
- Theoretical Computer Science (AREA)
- Studio Devices (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【解決手段】 制御部21は、記憶部23に記憶されている画像(例えば、魚眼動画像)と、この画像に対応する音声を記憶部23から取得した後、取得した画像全体のうち、その平面上の一部の領域を特定すると共に、取得した音声全体のうち特定した一部の領域に対応する方向からの音声を取得し、この特定した音声をスピーカ部27から出力させる。
【選択図】 図2
Description
画像を取得する画像取得手段と、
前記画像に対応する音声を取得する音声取得手段と、
前記画像取得手段により取得された画像全体のうち、その一部の領域を特定する領域特定手段と、
前記音声取得手段により取得された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する音声を取得する特定音声取得手段と、
を備えることを特徴とする画像処理装置である。
本実施形態は、画像処理装置としてデジタルカメラに適用した場合を例示したもので、このデジタルカメラは、後述する撮像部を備える撮像装置10と、後述する表示部を備える本体装置20とに分離可能なセパレート型デジタルカメラである。図1(1)は、撮像装置10と本体装置20とを一体的に組み合わせた状態を示し、図1(2)は、撮像装置10と本体装置20とを分離した状態を示している。このセパレート型デジタルカメラを構成する撮像装置10と本体装置20とは、それぞれが利用可能な無線通信を用いてペアリング(無線接続認識)が可能なもので、無線通信としては、無線LAN(Wi−Fi)又はBluetooth(登録商標)を使用している。本体装置20は、撮像装置10側で撮像された画像を受信取得して、この撮像画像(ライブビュー画像)をモニタ画面(ライブビュー画面)に表示する。
図2(1)において、撮像装置10は、制御部11、電源部12、記憶部13、通信部14、操作部15、撮像部16、姿勢検出部17、音声処理部18、4個のマイクM1、M2、M3、M4を備えている。制御部11は、電源部(二次電池)12からの電力供給によって動作し、記憶部13内の各種のプログラムに応じてこの撮像装置10の全体動作を制御するもので、この制御部11には図示しないCPU(中央演算処理装置)やメモリなどが設けられている。記憶部13は、例えば、ROM、フラッシュメモリなどを有する構成で、本実施形態を実現するためのプログラムや各種のアプリケーションなどが格納されている。通信部14は、撮像した画像などを本体装置20側に送信したり、本体装置20からの操作指示信号などを受信したりする通信インターフェイスである。操作部15は、電源スイッチなどの基本的な操作キー(ハードウェアキー)を備えている。
図5(1)は、屋外で食卓に座っている親子を正面から撮像した場合(光軸方向が略水平方向となる縦置き姿勢で母子を撮像した場合)の円形魚眼画像が横長画面(横向き)で表示されているライブビュー画面と、各マイクM1〜M4の向きとの関係を例示した図である。この例では、魚眼画像の上側が第1マイクM1の向き、下側が第3マイクM3の向き、右側が第3マイクM3の向き、左側が第4マイクM4の向きに対応付けられたものとなる。
データメモリ23C(例えば、SDカード)は、撮影された各静止画像や各動画像を順次記憶するメモリで、図示の例は、音声付動画像、つまり、動画像(魚眼画像)を撮像して記憶すると共に、その撮像時に集音して記憶した場合のデータ構造を模式的に示したもので、動画像データファイルVGFに対応してマイク別の音声データファイルSDF1〜SDF4及び姿勢データファイルSTFを有している。
図中、四角形の破線で示した領域(矩形枠)は、再生対象である魚眼動画像の全体のうち、その平面上の一部の領域を特定した状態を例示したもので、平面上の一部の領域とは、魚眼動画像の時間軸上の一部ではなく、フレーム上(平面座標上)における一部の領域を示している。制御部21は、特定した一部の領域の画像をフレーム毎に逐次切り出すと共に、その切り出した画像を拡大してタッチ表示部25の再生画面に逐次表示させる。すなわち、画像全体のうち、その平面上の一部の領域を切り出し対象として特定して、その領域の画像を再生させるようにしている。以下、一部の領域を“切り出し領域”と呼称し、また、この切り出し領域の画像の再生を、“切り出し再生”と呼称する。
先ず、本体装置20側の制御部21は、撮像装置10によって撮像された魚眼動画像を受信取得する(ステップA1)と共に、この取得した魚眼動画像をタッチ表示部25にライブビュー画像として表示させる(ステップA2)。このライブビュー画像の表示中において、魚眼動画像の撮影開始がユーザ操作によって指示されたかを調べ(ステップA3)、その撮影開始が指示されるまでライブビュー画像を逐次表示させる処理に戻るが(ステップA1、A2)、撮影開始が指示されると(ステップA3でYES)、撮像装置10に対して撮影開始を指示して、撮像装置10側の姿勢検出部17及び各マイクM1〜M4を起動させる(ステップA4)。
先ず、本体装置20側の制御部21は、撮影画像の再生モードに切り替えられた状態において、その再生対象として音声付動画像がユーザ操作によって選択されてその音声付動画像の再生が指示されると、図9のフローに移り、上述した切り出し再生がユーザ操作によって指示されたかを調べる(図9のステップB1)。
なお、上述した実施形態においては、4個のマイクM1〜M4を撮像装置10の外側面S1〜S4の中央部に1個ずつ異なる向きに配置するようにしたが、複数のマイクの配置状態は、これに限らない。
図13(1)は、撮像装置10の正面(魚眼レンズ16B側の面)に4個のマイクM11〜M14を四角形状に配置した場合である。すなわち、撮像装置10の正面において、図中、第1マイクM11を左上角部、第2マイクM12を右上角部、第3マイクM13を左下角部、第4マイクM14を右下角部に配置した場合で、これら全てのマイクM11〜M14のマイク面(集音方向)を同一方向(光軸方向)とした場合である。このように複数のマイクを同じ方向に向けるようにしてもよい。また、複数のマイクは、4個に限らず、その数を多くてもよいが、少なくとも3個のマイクを配置するようにすればよい。このように複数のマイクの配置状態を任意とすることにより実装上の自由度を増すことができる。
上述した実施形態においては、4個のマイクM1〜M4を二次元上に配置するようにしたが、三次元上に配置するようにしてもよい。
図13(2)は、5個のマイクを三次元上に配置した場合を例示したもので、図示の例は、上述した図13(1)の場合と同様に第1マイクM21〜第4マイクM24を撮像装置10の正面(魚眼レンズ16B側の面)に配置するが、第5マイクM25を撮像装置10の正面中心部に配置した場合である。すなわち、第1マイクM21、第2マイクM22をX軸の−側と+側に配置し、第3マイクM23、第4マイクM24をY軸の−側と+側に配置し、第5マイクM25をZ軸の−側に配置した場合である。このように複数のマイクを三次元上に配置することにより、各マイクから入力された音声を混合して出力することにより更に臨場感のある音声を得ることができると共に、音源が光軸方向の反対側(背後)であっても、その音声も集音して出力させることができる。
上述した実施形態においては、4個のマイクM1〜M4と撮像素子16Cの各端面との位置関係から切り出し領域対応のマイクを選択するようにしたが、複数のマイクに対応する音声データを分析することによって、切り出し領域に対応する方向からの音声を取得して、切り出し領域対応のマイクを選択するようにしてもよい。例えば、複数のマイクへの音声到達時間のずれ、マイク間の距離、音量値比較などに基づいて音源の方向を特定して、その音源方向に対応するマイクを選択するようにしてもよい。このような音声データを分析によって切り出し領域対応のマイクを選択することができる。
上述した実施形態においては、4個のマイクM1〜M4と撮像素子16Cの各端面との位置関係が固定的されているため、魚眼動画像内の一部の領域(切り出し領域)に基づいて切り出し領域対応のマイクを選択可能としたが、これに限らず、この切り出し領域対応のマイク(例えば、第1マイクM1)を除く他の第2マイクM2、第3マイクM3、第4マイクM4を出力対象から外す(出力禁止とする)ことにより切り出し領域対応のマイクからの音声データのみを出力させるようにしてもよい。これによって自由度を増すことができる。
上述した実施形態においては、撮像時の姿勢に基づいて魚眼動画像上の所定の位置に切り出し領域を特定する場合に、人物を含む領域を切り出し領域として特定するようにしたが、人物に拘わらず、動物など主要被写体を特定してその主要被写体を含む領域を切り出し領域として特定したり、主要被写体の有無に拘わらず、魚眼動画像上の所定の位置、例えば、縦置き姿勢であれば、その画像の中央部所定位置、横置き姿勢であれば、その画像の周辺部所定位置を切り出し領域として特定したりするようにしてもよい。
上述した実施形態においては、魚眼動画像上に特定した切り出し領域の画像(一部の領域)を拡大表示して再生するようにしたが、その一部の領域の画像を表示しなくてもよい。すなわち、魚眼動画像が再生されている状態において、その画像上に一部の領域を案内表示(例えば、枠表示)するだけで、その一部の領域の画像を表示しなくても、その切り出し領域対応のマイクを選択してそのマイクからの音声を再生するようにしてもよい。これによってユーザは、一部の領域の画像が表示されていなくても魚眼動画像の一部とそれに対応する音声との関係を確認することが可能となる。
上述した実施形態においては、画角が略180゜という1枚の広角レンズ(魚眼レンズ)16Bを使用して半天球360°の撮影を行うようにしたが、全天球360°の撮影を、例えば、2枚の広角レンズ(魚眼レンズ)16Bを使用して行うようにしてもよい。この全天球360°の撮影画像に対しては、上述した三次元配置のマイクを使用するようにすればよい。
以下、本願出願の特許請求の範囲に記載された発明を付記する。
(付記)
(請求項1)
請求項1に記載の発明は、
画像を取得する画像取得手段と、
前記画像に対応する音声を取得する音声取得手段と、
前記画像取得手段により取得された画像全体のうち、その一部の領域を特定する領域特定手段と、
前記音声取得手段により取得された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する音声を取得する特定音声取得手段と、
を備えることを特徴とする画像処理装置。
(請求項2)
請求項2に記載の発明は、請求項1に記載の画像処理装置において、
前記特定音声取得手段は、複数のマイクから入力された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する方向からの音声を集音するマイクを選択して、そのマイクから入力された音声を当該領域に対応する方向からの音声として取得する、
ことを特徴とする。
(請求項3)
請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記画像取得手段は、撮像記憶された画像を再生対象として取得し、
前記音声取得手段は、前記画像の撮像時にその撮像記憶に同期して集音記憶された音声を再生対象として取得する、
ことを特徴とする。
(請求項4)
請求項4に記載の発明は、請求項3に記載の画像処理装置において、
前記撮像記憶された画像は、魚眼レンズを使用して撮像された魚眼画像であり、
前記画像の撮像時にその撮像記憶に同期して集音記憶された音声は、前記魚眼レンズの周辺部の異なる位置に配置された複数のマイクから入力された音声である、
ことを特徴とする。
(請求項5)
請求項5に記載の発明は、請求項2又は4に記載の画像処理装置において、
前記特定音声取得手段は、前記複数のマイク別に集音記憶された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する音声を集音するマイクが2以上存在している場合には、その2以上のマイクを選択してそれらの音声を組み合わせることにより当該領域に対応する方向からの音声を取得する、
ことを特徴とする。
(請求項6)
請求項6に記載の発明は、請求項1又は乃至5の何れか1項に記載の画像処理装置において、
前記特定音声取得手段は、前記音声取得手段により取得された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する方向からの音声を除いた他の音声を出力対象から外すことにより当該領域に対応する方向からの音声を取得する、
ことを特徴とする。
(請求項7)
請求項7に記載の発明は、請求項1乃至6の何れか1項に記載の画像処理装置において、
前記画像の撮像時の姿勢を取得する姿勢取得手段を更に備え、
前記領域特定手段は、前記姿勢取得手段により取得された撮像時の姿勢に応じて、前記画像取得手段により取得された画像全体のうち、その平面上の一部の領域を特定する、
ことを特徴とする。
(請求項8)
請求項8に記載の発明は、請求項1乃至6の何れか1項に記載の画像処理装置において、
前記領域特定手段は、前記画像取得手段により取得された画像のうちユーザ操作によって任意に指定された切り出し領域を一部の領域として特定する、
ことを特徴とする。
(請求項9)
請求項9に記載の発明は、請求項1乃至8の何れか1項に記載の画像処理装置において、
前記画像取得手段により取得された画像を表示している状態において、前記領域特定手段により特定された一部の領域の画像を表示する表示手段を更に備える、
ことを特徴とする。
(請求項10)
請求項10に記載の発明は、請求項9に記載の画像処理装置において、
前記画像取得手段により取得された画像は、魚眼レンズで撮像された魚眼画像であり、
前記表示手段は、前記領域特定手段により特定された一部の領域の画像に対してその歪曲歪を補正した画像を表示する、
ことを特徴とする。
(請求項11)
請求項11に記載の発明は、請求項1乃至10の何れか1項に記載の画像処理装置において、
前記特定音声取得手段により特定された音声を出力する出力手段を備え、
前記出力手段は、前記領域特定手段により特定された一部の領域の画像を表示すると共に、前記特定音声取得手段により取得された音声を出力する、
ことを特徴とする。
(請求項12)
請求項12に記載の発明は、請求項1乃至11の何れか1項に記載の画像処理装置において、
前記特定音声取得手段により取得された音声と、前記領域特定手段により特定された一部の領域とを関連付けて記憶する記憶手段を備える、
ことを特徴とする。
(請求項13)
請求項13に記載の発明は、
画像処理装置における画像処理方法であって、
画像を取得する処理と、
前記画像に対応する音声を取得する処理と、
前記取得された画像全体のうち、その一部の領域を特定する処理と、
前記取得された音声全体のうち、前記特定された一部の領域に対応する音声を取得する処理と、
を含むことを特徴とする画像処理方法。
(請求項14)
請求項14に記載の発明は、
画像処理装置のコンピュータに対して、
画像を取得する機能と、
前記画像に対応する音声を取得する機能と、
前記取得された画像全体のうち、その一部の領域を特定する機能と、
前記取得された音声の中から前記特定された一部の領域に対応する音声を取得する機能と、
を実現させるためのプログラム。
11、21 制御部
13、23 記憶部
16 撮像部
17、26 姿勢検出部
18 音声処理部
20 本体装置
25 タッチ表示部
27 スピーカ部
M1〜M4 マイク
VGF 動画像データファイル
SDF1〜SDF4 音声データファイル
STF 姿勢データファイル
Claims (14)
- 画像を取得する画像取得手段と、
前記画像に対応する音声を取得する音声取得手段と、
前記画像取得手段により取得された画像全体のうち、その一部の領域を特定する領域特定手段と、
前記音声取得手段により取得された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する音声を取得する特定音声取得手段と、
を備えることを特徴とする画像処理装置。 - 前記特定音声取得手段は、複数のマイクから入力された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する方向からの音声を集音するマイクを選択して、そのマイクから入力された音声を当該領域に対応する方向からの音声として取得する、
ことを特徴とする請求項1に記載の画像処理装置。 - 前記画像取得手段は、撮像記憶された画像を再生対象として取得し、
前記音声取得手段は、前記画像の撮像時にその撮像記憶に同期して集音記憶された音声を再生対象として取得する、
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記撮像記憶された画像は、魚眼レンズを使用して撮像された魚眼画像であり、
前記画像の撮像時にその撮像記憶に同期して集音記憶された音声は、前記魚眼レンズの周辺部の異なる位置に配置された複数のマイクから入力された音声である、
ことを特徴とする請求項3に記載の画像処理装置。 - 前記特定音声取得手段は、前記複数のマイク別に集音記憶された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する音声を集音するマイクが2以上存在している場合には、その2以上のマイクを選択してそれらの音声を組み合わせることにより当該領域に対応する方向からの音声を取得する、
ことを特徴とする請求項2又は4に記載の画像処理装置。 - 前記特定音声取得手段は、前記音声取得手段により取得された音声全体のうち、前記領域特定手段により特定された一部の領域に対応する方向からの音声を除いた他の音声を出力対象から外すことにより当該領域に対応する方向からの音声を取得する、
ことを特徴とする請求項1又は乃至5の何れか1項に記載の画像処理装置。 - 前記画像の撮像時の姿勢を取得する姿勢取得手段を更に備え、
前記領域特定手段は、前記姿勢取得手段により取得された撮像時の姿勢に応じて、前記画像取得手段により取得された画像全体のうち、その平面上の一部の領域を特定する、
ことを特徴とする請求項1乃至6の何れか1項に記載の画像処理装置。 - 前記領域特定手段は、前記画像取得手段により取得された画像のうちユーザ操作によって任意に指定された切り出し領域を一部の領域として特定する、
ことを特徴とする請求項1乃至6の何れか1項に記載の画像処理装置。 - 前記画像取得手段により取得された画像を表示している状態において、前記領域特定手段により特定された一部の領域の画像を表示する表示手段を更に備える、
ことを特徴とする請求項1乃至8の何れか1項に記載の画像処理装置。 - 前記画像取得手段により取得された画像は、魚眼レンズで撮像された魚眼画像であり、
前記表示手段は、前記領域特定手段により特定された一部の領域の画像に対してその歪曲歪を補正した画像を表示する、
ことを特徴とする請求項9に記載の画像処理装置。 - 前記特定音声取得手段により取得された音声を出力する出力手段を備え、
前記出力手段は、前記領域特定手段により特定された一部の領域の画像を表示すると共に、前記特定音声取得手段により取得された音声を出力する、
ことを特徴とする請求項1乃至10の何れか1項に記載の画像処理装置。 - 前記特定音声取得手段により取得された音声と、前記領域特定手段により特定された一部の領域とを関連付けて記憶する記憶手段を備える、
ことを特徴とする請求項1乃至11の何れか1項に記載の画像処理装置。 - 画像処理装置における画像処理方法であって、
画像を取得する処理と、
前記画像に対応する音声を取得する処理と、
前記取得された画像全体のうち、その一部の領域を特定する処理と、
前記取得された音声全体のうち、前記特定された一部の領域に対応する音声を取得する処理と、
を含むことを特徴とする画像処理方法。 - 画像処理装置のコンピュータに対して、
画像を取得する機能と、
前記画像に対応する音声を取得する機能と、
前記取得された画像全体のうち、その一部の領域を特定する機能と、
前記取得された音声の中から前記特定された一部の領域に対応する音声を取得する機能と、
を実現させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017186627A JP2019062448A (ja) | 2017-09-27 | 2017-09-27 | 画像処理装置、画像処理方法及びプログラム |
US16/132,007 US10805557B2 (en) | 2017-09-27 | 2018-09-14 | Image processing device, image processing method and storage medium correcting distortion in wide angle imaging |
CN201811104628.0A CN109561250A (zh) | 2017-09-27 | 2018-09-20 | 图像处理装置、图像处理方法以及记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017186627A JP2019062448A (ja) | 2017-09-27 | 2017-09-27 | 画像処理装置、画像処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019062448A true JP2019062448A (ja) | 2019-04-18 |
Family
ID=65808162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017186627A Pending JP2019062448A (ja) | 2017-09-27 | 2017-09-27 | 画像処理装置、画像処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10805557B2 (ja) |
JP (1) | JP2019062448A (ja) |
CN (1) | CN109561250A (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012119803A (ja) * | 2010-11-30 | 2012-06-21 | Canon Inc | 超広角映像の記録及び再生装置 |
JP2015019162A (ja) * | 2013-07-09 | 2015-01-29 | 大日本印刷株式会社 | 会議支援システム |
JP2017085372A (ja) * | 2015-10-28 | 2017-05-18 | 株式会社リコー | 通信システム、通信装置、通信方法およびプログラム |
WO2017149124A1 (en) * | 2016-03-03 | 2017-09-08 | Centricam Technologies Limited | A method, system and device for generating associated audio and visual signals in a wide angle image system |
JP2017168882A (ja) * | 2016-03-14 | 2017-09-21 | カシオ計算機株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2018005526A (ja) * | 2016-06-30 | 2018-01-11 | 株式会社リコー | 情報処理装置、及びプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5561359A (en) | 1978-10-27 | 1980-05-09 | Hitachi Ltd | Continuous casting method |
US6593956B1 (en) * | 1998-05-15 | 2003-07-15 | Polycom, Inc. | Locating an audio source |
US7428000B2 (en) * | 2003-06-26 | 2008-09-23 | Microsoft Corp. | System and method for distributed meetings |
JP2007295335A (ja) * | 2006-04-26 | 2007-11-08 | Opt Kk | カメラ装置および画像記録再生方法 |
JP5111088B2 (ja) | 2007-12-14 | 2012-12-26 | 三洋電機株式会社 | 撮像装置及び画像再生装置 |
JP2009163644A (ja) * | 2008-01-09 | 2009-07-23 | Sony Corp | 映像検索装置、編集装置、映像検索方法およびプログラム |
CN101820565B (zh) * | 2009-02-27 | 2015-01-07 | 本田技研工业株式会社 | 音源位置的推断方法及其装置 |
JP5493551B2 (ja) | 2009-07-30 | 2014-05-14 | 沖電気工業株式会社 | 情報処理システム、情報処理装置、及び情報処理方法 |
CN101951492A (zh) * | 2010-09-15 | 2011-01-19 | 中兴通讯股份有限公司 | 视频通话中视频录制的方法及装置 |
US20150146078A1 (en) * | 2013-11-27 | 2015-05-28 | Cisco Technology, Inc. | Shift camera focus based on speaker position |
JP6125457B2 (ja) | 2014-04-03 | 2017-05-10 | 日本電信電話株式会社 | 収音システム及び放音システム |
WO2015170368A1 (ja) | 2014-05-09 | 2015-11-12 | パナソニックIpマネジメント株式会社 | 指向性制御装置、指向性制御方法、記憶媒体及び指向性制御システム |
US10057542B2 (en) * | 2014-08-15 | 2018-08-21 | Thereo LLC | System for immersive telepresence |
CN105812969A (zh) * | 2014-12-31 | 2016-07-27 | 展讯通信(上海)有限公司 | 一种拾取声音信号的方法、系统及装置 |
CN105407282A (zh) * | 2015-11-16 | 2016-03-16 | 中科创达软件股份有限公司 | 一种照相和回放的实现方法 |
US9942518B1 (en) * | 2017-02-28 | 2018-04-10 | Cisco Technology, Inc. | Group and conversational framing for speaker tracking in a video conference system |
US10187579B1 (en) * | 2017-06-30 | 2019-01-22 | Polycom, Inc. | People detection method for auto-framing and tracking in a video conference |
-
2017
- 2017-09-27 JP JP2017186627A patent/JP2019062448A/ja active Pending
-
2018
- 2018-09-14 US US16/132,007 patent/US10805557B2/en active Active
- 2018-09-20 CN CN201811104628.0A patent/CN109561250A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012119803A (ja) * | 2010-11-30 | 2012-06-21 | Canon Inc | 超広角映像の記録及び再生装置 |
JP2015019162A (ja) * | 2013-07-09 | 2015-01-29 | 大日本印刷株式会社 | 会議支援システム |
JP2017085372A (ja) * | 2015-10-28 | 2017-05-18 | 株式会社リコー | 通信システム、通信装置、通信方法およびプログラム |
WO2017149124A1 (en) * | 2016-03-03 | 2017-09-08 | Centricam Technologies Limited | A method, system and device for generating associated audio and visual signals in a wide angle image system |
JP2017168882A (ja) * | 2016-03-14 | 2017-09-21 | カシオ計算機株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2018005526A (ja) * | 2016-06-30 | 2018-01-11 | 株式会社リコー | 情報処理装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US10805557B2 (en) | 2020-10-13 |
CN109561250A (zh) | 2019-04-02 |
US20190098225A1 (en) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10237495B2 (en) | Image processing apparatus, image processing method and storage medium | |
US10440307B2 (en) | Image processing device, image processing method and medium | |
JP7100824B2 (ja) | データ処理装置、データ処理方法及びプログラム | |
CN107018316B (zh) | 图像处理装置、图像处理方法以及存储介质 | |
JP6455474B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US10873824B2 (en) | Apparatus, system, and method of processing data, and recording medium | |
JP7428763B2 (ja) | 情報取得システム | |
WO2017149124A1 (en) | A method, system and device for generating associated audio and visual signals in a wide angle image system | |
WO2015198964A1 (ja) | 音声入出力機能付き撮像装置およびテレビ会議システム | |
JP2023026477A (ja) | 撮像装置、撮像システム | |
JP2013123171A (ja) | 画像処理装置、画像処理方法、画像処理システム及びプログラム | |
JP2019062448A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6450604B2 (ja) | 画像取得装置及び画像取得方法 | |
JP2013232830A (ja) | 画像処理システム、画像処理装置、画像処理方法および画像処理プログラム | |
JP2013187841A (ja) | 電子機器及び出力制御方法並びにプログラム | |
JP2018157314A (ja) | 情報処理システム、情報処理方法及びプログラム | |
US11863871B2 (en) | Communication terminal, image communication system, and method of displaying image | |
WO2022220306A1 (ja) | 映像表示システム、情報処理装置、情報処理方法、及び、プログラム | |
WO2018003081A1 (ja) | 全天球カメラ撮像画像表示システム、方法及びプログラム | |
JP2019169762A (ja) | 情報処理装置 | |
JP2021124526A (ja) | 記録装置、記録システム、ファイル生成方法およびプログラム | |
JP2023178054A (ja) | 会議デバイスユニット及び会議システム | |
JP2016181938A (ja) | オペレータ端末、携帯端末、指示送信方法、オペレータ端末用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210909 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220215 |