JP4782797B2 - ビデオ処理 - Google Patents
ビデオ処理 Download PDFInfo
- Publication number
- JP4782797B2 JP4782797B2 JP2007543899A JP2007543899A JP4782797B2 JP 4782797 B2 JP4782797 B2 JP 4782797B2 JP 2007543899 A JP2007543899 A JP 2007543899A JP 2007543899 A JP2007543899 A JP 2007543899A JP 4782797 B2 JP4782797 B2 JP 4782797B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- frame data
- data
- image
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Photoreceptors In Electrophotography (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Closed-Circuit Television Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
(a)前記ビデオの各フレーム内で顔を検出することと、
(b)フレームデータの対応する組を処理し、
(i)前記顔によって占有されている画像の領域を実質的に一定に保ち、
(ii)前記顔に入射する光の見かけの方向を実質的に一定に保ち、及び/又は
(iii)前記顔の見かけの色を実質的に一定に保つことと、
を備える。
ここで図4を参照して、該未処理画像データの各フレームの頭部画像を位置合わせする段階(400)が説明される。頭部画像を位置合わせすることは、(i)該頭部を追跡すること(401)と、(ii)該頭部がすべてのフレーム(450)で同じ場所、向き、及び規模のままとなるように該未処理画像データ300のアファインワープ(affine warp)(直線状の変形及び回転の組み合わせ)とクロップ(crop)を実行することの2つの段階からなる。該頭部画像位置合わせ段階400の擬似コード例が以下に示される。
追跡は、複数のフレームにわたり、ユーザの頭部の特定の特長の動きについていく反復プロセスである。代替策は、未処理画像内のすべてのピクセルにわたり、所望される特長の新たな検索を実行することであろう。しかしながら、初期の推定値が与えられると、該推定値の周辺だけ検索すればよいので、使用される計算処理リソースはさらに少なくなるため、追跡の方がよい。本実施形態では、頭部の追跡は、ユーザの目の動きを追跡することにより達成される。チェックされる狭い領域の中に特長を見つけることが不可能な場合には、追跡が失敗する可能性がある。これは、例えば、該特長が塞がれている(例えば該ユーザの手等の何らかの他の物体により隠されている)場合、あるいは該特長がチェックされている領域外に移動する場合(例えば、カメラが突然動くことにより、該特長がフレームを大きく横切る場合)に起こることがある。
目の組413の座標を取得したので、頭部が全データフレームで同じ位置、向き及び規模に留まるように、該未処理画像300のアフィンワープ(affine warp)及びクロップ(crop)(450)を実行できる。本実施形態では、アフィンワープ及びクロップは、該頭部のx、y位置、縮尺及び横揺れの変化に対処するにすぎない。該アフィンワープ及びクロップは、頭部の横揺れと偏揺れの変化、あるいは異なる遠近的な歪み(つまり、顔がカメラに非常に近いとき、顔は短縮されて見える)が異なることに起因する変化には対応しない。しかしながら、ユーザがカメラに視線を合わせ続ける場合には、これらの変化は、小さくなりがちである。
図7を参照すると、段階400で検出された該頭部にあたる光方向の正規化プロセス(500)がここで説明される。
図8を参照すると、段階500から出力されたバランスのとれた光方向と、位置合わせされた画像(550)のカラーバランスを補正するプロセス(600)がここで説明される。
代替例では、安定化した出力画像700が別の人間のユーザに提供されるのではなく、人間への送信の前にさらなる何らかの画像処理を実行するであろう機械に提供される可能性がある。機械が該機械自体顔の表情に関する自動的な理解に到達することも考えられ、これは特定の顔の表情(例えば笑み)のダイナミクスが、例えばコンピュータネットワーク又は安全な場所へのアクセスを可能にするために使用される応用例で有用であろう。
Claims (10)
- モバイルビデオデータ捕捉手段により捕捉されるビデオデータを処理する方法であって、前記ビデオデータはフレームデータの組を複数備え、前記方法は、
(a)前記ビデオの各フレーム内で顔を検出するステップと、
(b)フレームデータの対応する組を処理し、
(i)前記顔によって占有される画像の領域を実質的に一定に保つ、及び/又は、
(ii)前記顔の見かけの色を実質的に一定に保つステップと、
を備え、
前記ステップ(b)はさらに、
(iii)(1)前記フレームデータを低域フィルタリングするステップと、
(2)前記フレームデータから、前記フレームデータの低域フィルタリングされたバージョンを減算するステップと、
(3)前記フレームデータの低域フィルタリングされたバージョンに、以前に記憶された基準フレームデータであって、無色照明の下での前記顔の画像を備える前記以前に記憶された基準データフレームの低域フィルタリングされたバージョンを加算するステップとによって、前記顔に当たっている光の見かけの方向を保つステップと、
を備える方法。 - 顔を検出するステップは、前記顔の1つ以上の特長を特定するステップを備える、請求項1に記載の方法。
- 1つ以上の特長を特定するステップは、
記憶されている特長テンプレートと前記フレームデータの領域を比較するステップであって、前記特長テンプレートのそれぞれは顔の特長の画像を備え、かつ前記領域にサイズが対応している、ステップと、
前記フレームデータの領域と前記テンプレートの1つとの間の一致を特定することにより各特長を特定するステップと、
を備える、請求項2に記載の方法。 - 領域を比較するステップは、領域内の各ピクセルをテンプレート内の該ピクセルに対応するピクセルと比較するステップを備え、前記方法はさらに、
領域内のピクセルと、記憶されている目のテンプレート内の該ピクセルに対応するピクセルとの比較のそれぞれにスコアを生成するステップと、
最大スコアを有するピクセルを選択することにより特長を特定するステップと、
を備える、請求項3に記載の方法。 - フレームデータを低域フィルタリングするステップは、前記フレームデータを所定のフィルタカーネルと畳み込み積分することにより達成される、請求項1に記載の方法。
- 前記顔の見かけの色を実質的に一定に保つステップは、各カラーチャネルの相対的なオフセット及び絶対値を実質的に一定に保つために、前記フレームデータの各カラーチャネルを個別に調整するステップを備える、請求項1乃至請求項5のいずれか1項に記載の方法。
- 前記フレームデータの各カラーチャネルの平均ピクセル値を、所定のシフト量だけ、シフトするステップをさらに備える、請求項6に記載の方法。
- 選択されたカラーチャネルについて、前記シフト量が、前記フレームデータ内の前記選択されたチャネルの平均ピクセル値と、無色照明の下での前記顔の画像を備える以前に記憶された基準フレームデータ内の前記選択されたチャネルの平均ピクセル値との差異に対応する、請求項7に記載の方法。
- 請求項1乃至請求項8のいずれか1項に記載されている方法ステップを実行するために処理装置によって実行可能な命令のプログラムを保持するデジタルデータキャリヤ。
- モバイルビデオデータ捕捉手段によって捕捉されるビデオデータを処理するために処理可能なプロセッサ読み取り可能コードが記録されている記憶媒体を備える装置であって、前記ビデオデータがフレームデータの組を複数備え、前記コードが、
前記ビデオの各フレーム内で顔を特定するために処理可能な特定コードと、
フレームデータの対応する組を処理し、
(i)前記顔により占有される画像の領域を実質的に一定に保つ、及び/又は、
(ii)前記顔の見かけの色を実質的に一定に保つ、ために処理可能なフレームデータ処理コードと、
を備え、
前記フレームデータ処理コードはさらに、
(iii)(a)前記フレームデータを低域フィルタリングするステップと、
(b)前記フレームデータから、前記フレームデータの低域フィルタリングされたバージョンを減算するステップと、
(c)前記フレームデータの低域フィルタリングされたバージョンに、以前に記憶された基準フレームデータであって、無色照明の下での前記顔の画像を備える前記以前に記憶された基準データフレームの低域フィルタリングされたバージョンを加算するステップとによって、前記顔に当たっている光の見かけの方向を保つステップとを実行するコードを含んでいる、装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0426523.7 | 2004-12-02 | ||
GBGB0426523.7A GB0426523D0 (en) | 2004-12-02 | 2004-12-02 | Video processing |
PCT/GB2005/004261 WO2006059060A1 (en) | 2004-12-02 | 2005-11-04 | Video processing |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008522523A JP2008522523A (ja) | 2008-06-26 |
JP2008522523A5 JP2008522523A5 (ja) | 2008-12-11 |
JP4782797B2 true JP4782797B2 (ja) | 2011-09-28 |
Family
ID=34043985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007543899A Active JP4782797B2 (ja) | 2004-12-02 | 2005-11-04 | ビデオ処理 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8098902B2 (ja) |
EP (1) | EP1817714B1 (ja) |
JP (1) | JP4782797B2 (ja) |
CN (1) | CN101069191A (ja) |
AT (1) | ATE420407T1 (ja) |
DE (1) | DE602005012314D1 (ja) |
GB (1) | GB0426523D0 (ja) |
WO (1) | WO2006059060A1 (ja) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100808987B1 (ko) * | 2006-11-14 | 2008-03-04 | 삼성전자주식회사 | 영상 통화를 수행하는 이동통신 단말기 및 그의 대화메시지 저장 방법 |
US9769354B2 (en) | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
EP1895466A1 (en) * | 2006-08-30 | 2008-03-05 | BRITISH TELECOMMUNICATIONS public limited company | Providing an image for display |
JP4663699B2 (ja) * | 2007-09-27 | 2011-04-06 | 富士フイルム株式会社 | 画像表示装置、及び画像表示方法 |
MX2010003166A (es) * | 2007-10-26 | 2010-06-23 | Jean Chouraqui | Metodos y sistemas para transferir contenidos de multimedia utilizando un protocolo de transferencia digital de sonido ya existente. |
NO332009B1 (no) * | 2008-12-12 | 2012-05-21 | Cisco Systems Int Sarl | Fremgangsmate for a igangsette kommunikasjonsforbindelser |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US20110216153A1 (en) * | 2010-03-03 | 2011-09-08 | Michael Edric Tasker | Digital conferencing for mobile devices |
US8315443B2 (en) * | 2010-04-22 | 2012-11-20 | Qualcomm Incorporated | Viewpoint detector based on skin color area and face area |
CN102447913B (zh) * | 2011-12-22 | 2015-02-18 | 深圳万兴信息科技股份有限公司 | 一种移色处理方法及系统 |
US9165187B2 (en) | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
WO2014056112A1 (en) * | 2012-10-10 | 2014-04-17 | Broadbandtv, Corp. | Intelligent video thumbnail selection and generation |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
JP2014209707A (ja) * | 2013-03-25 | 2014-11-06 | パナソニック株式会社 | 映像再生装置および映像再生方法 |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
DE202014011407U1 (de) | 2013-05-03 | 2020-04-20 | Kofax, Inc. | Systeme zum Erkennen und Klassifizieren von Objekten in durch Mobilgeräte aufgenommenen Videos |
US9386235B2 (en) | 2013-11-15 | 2016-07-05 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
CA2939375A1 (en) * | 2014-01-10 | 2015-07-16 | Revolve Robotics, Inc. | Systems and methods for controlling robotic stands during videoconference operation |
WO2015142951A1 (en) * | 2014-03-17 | 2015-09-24 | Washington University | System and method for quantifying deformation, disruption, and development in a sample |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
CN104821100A (zh) * | 2015-04-22 | 2015-08-05 | 深圳市航盛电子股份有限公司 | 基于OpenCv卡尔曼滤波器的车载向前碰撞预警方法及系统 |
US10467465B2 (en) | 2015-07-20 | 2019-11-05 | Kofax, Inc. | Range and/or polarity-based thresholding for improved data extraction |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US11249548B2 (en) | 2016-11-10 | 2022-02-15 | Neurotrack Technologies, Inc. | Method and system for correlating an image capturing device to a human user for analyzing gaze information associated with cognitive performance |
US10984237B2 (en) | 2016-11-10 | 2021-04-20 | Neurotrack Technologies, Inc. | Method and system for correlating an image capturing device to a human user for analyzing gaze information associated with cognitive performance |
US11163359B2 (en) | 2016-11-10 | 2021-11-02 | Neurotrack Technologies, Inc. | Method and system for correlating an image capturing device to a human user for analyzing gaze information associated with cognitive performance |
CN109863502A (zh) | 2016-11-10 | 2019-06-07 | 纽诺创科技术公司 | 将图像拍摄设备与人类用户相关联以分析认知能力的方法和系统 |
US10728683B2 (en) * | 2017-09-01 | 2020-07-28 | Dts, Inc. | Sweet spot adaptation for virtualized audio |
US10423821B2 (en) * | 2017-10-25 | 2019-09-24 | Microsoft Technology Licensing, Llc | Automated profile image generation based on scheduled video conferences |
US10803350B2 (en) | 2017-11-30 | 2020-10-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
CN111147925A (zh) * | 2020-01-02 | 2020-05-12 | 南京巨鲨显示科技有限公司 | 一种能兼容wpf播放视频流的处理方法、系统及装置 |
WO2021252940A1 (en) * | 2020-06-12 | 2021-12-16 | University Of Washington | Eye tracking in near-eye displays |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539099B1 (en) * | 1999-08-30 | 2003-03-25 | Electric Planet | System and method for visual chat |
JP3575679B2 (ja) * | 2000-03-31 | 2004-10-13 | 日本電気株式会社 | 顔照合方法と該照合方法を格納した記録媒体と顔照合装置 |
US6680745B2 (en) | 2000-11-10 | 2004-01-20 | Perceptive Network Technologies, Inc. | Videoconferencing method with tracking of face and dynamic bandwidth allocation |
US7155036B2 (en) * | 2000-12-04 | 2006-12-26 | Sony Corporation | Face detection under varying rotation |
US20020076116A1 (en) | 2000-12-15 | 2002-06-20 | Xerox Corporation | Fast implementation of homomorphic filters for image enhancement |
US7130446B2 (en) * | 2001-12-03 | 2006-10-31 | Microsoft Corporation | Automatic detection and tracking of multiple individuals using multiple cues |
DE60230192D1 (de) * | 2002-04-12 | 2009-01-15 | Agency Science Tech & Res | Robuste gesichtsregistrierung über mehrfach-gesichtsprototypensynthese |
EP1398733A1 (en) | 2002-09-12 | 2004-03-17 | GRETAG IMAGING Trading AG | Texture-based colour correction |
GB2395779A (en) * | 2002-11-29 | 2004-06-02 | Sony Uk Ltd | Face detection |
KR20050084263A (ko) | 2002-12-11 | 2005-08-26 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 비디오 폰 이미지에서 머리 자세를 보정하기 위한 방법 및장치 |
-
2004
- 2004-12-02 GB GBGB0426523.7A patent/GB0426523D0/en not_active Ceased
-
2005
- 2005-11-04 CN CNA2005800414684A patent/CN101069191A/zh active Pending
- 2005-11-04 US US11/791,747 patent/US8098902B2/en active Active
- 2005-11-04 AT AT05800170T patent/ATE420407T1/de not_active IP Right Cessation
- 2005-11-04 DE DE602005012314T patent/DE602005012314D1/de active Active
- 2005-11-04 WO PCT/GB2005/004261 patent/WO2006059060A1/en active Application Filing
- 2005-11-04 JP JP2007543899A patent/JP4782797B2/ja active Active
- 2005-11-04 EP EP05800170A patent/EP1817714B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008522523A (ja) | 2008-06-26 |
EP1817714A1 (en) | 2007-08-15 |
US8098902B2 (en) | 2012-01-17 |
CN101069191A (zh) | 2007-11-07 |
GB0426523D0 (en) | 2005-01-05 |
US20080166025A1 (en) | 2008-07-10 |
DE602005012314D1 (de) | 2009-02-26 |
WO2006059060A1 (en) | 2006-06-08 |
EP1817714B1 (en) | 2009-01-07 |
ATE420407T1 (de) | 2009-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4782797B2 (ja) | ビデオ処理 | |
US11037278B2 (en) | Systems and methods for transforming raw sensor data captured in low-light conditions to well-exposed images using neural network architectures | |
US9479754B2 (en) | Depth map generation | |
US7724952B2 (en) | Object matting using flash and no-flash images | |
US7430333B2 (en) | Video image quality | |
JP4234195B2 (ja) | 画像分割方法および画像分割システム | |
US8170350B2 (en) | Foreground/background segmentation in digital images | |
US9275445B2 (en) | High dynamic range and tone mapping imaging techniques | |
US7457477B2 (en) | Digital photography with flash/no flash extension | |
CN110619593A (zh) | 一种基于动态场景的双曝光视频成像系统 | |
EP2987134A1 (en) | Generation of ghost-free high dynamic range images | |
KR20220117324A (ko) | 다양한 초상화들로부터 학습 조명 | |
US11620738B2 (en) | Hue preservation post processing with early exit for highlight recovery | |
JP2004157778A (ja) | 鼻位置の抽出方法、およびコンピュータに当該鼻位置の抽出方法を実行させるためのプログラムならびに鼻位置抽出装置 | |
Lee et al. | Efficient Low Light Video Enhancement Based on Improved Retinex Algorithms | |
Restrepo et al. | Filtering and luminance correction for aged photographs | |
Friederichsen | Recent Advances in Smartphone Computational Photography | |
Paliy | Local approximations in demosaicing and deblurring of digital sensor data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081023 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110707 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140715 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4782797 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |