JP4640155B2 - 画像処理装置および方法、並びにプログラム - Google Patents
画像処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP4640155B2 JP4640155B2 JP2005361347A JP2005361347A JP4640155B2 JP 4640155 B2 JP4640155 B2 JP 4640155B2 JP 2005361347 A JP2005361347 A JP 2005361347A JP 2005361347 A JP2005361347 A JP 2005361347A JP 4640155 B2 JP4640155 B2 JP 4640155B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- score
- context
- recognition
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
Description
図1は、本発明を適用した画像処理装置の一実施の形態の構成を示す図である。図1に示した画像処理装置は、撮影された静止画像や動画像から、所定の人や物、動作(予め登録されている人や物、動作)を検出し、認識する装置である。
P(友人A、友人B)= P(友人B、友人A)=0.3 ・・・(1)
P(友人A、同僚C)= P(同僚C、友人A)=0.01 ・・・(2)
p(ソファーに座る|フレームイン)=0.4 ・・・(3)
p(フレームイン|ソファーに座る)=0.0 ・・・(4)
P'(ソファーに座る|フレームイン) = α(t) P(ソファーに座る|フレームイン)
P(O|I) = P(I|O)P(O)/P(I) ・・・(5)
P(O|I) = P(I|O)P(O)・・・(5)’
logP = logP(I|O) + αlogP(O) ・・・(6)
式(6)も、画像スコアとコンテキストスコアを統合したスコア(統合スコア)を演算するための式であるが、重み付けも行われるような演算とされている。式(6)において、Pは、統合スコアを示し、αは重み付けの値を示す。P(I|O)やP(O)は、式(5)と同等の意味である。
P(O|I) = P(I|O)・・・(7)
P(X)=(1−α(t))p(A,X)+α(t)p(B,X) ・・・(8)
図7は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータの構成の例を示すブロック図である。CPU(Central Processing Unit)101は、ROM(Read Only Memory)102、または記憶部108に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)103には、CPU101が実行するプログラムやデータなどが適宜記憶される。これらのCPU101、ROM102、およびRAM103は、バス104により相互に接続されている。
Claims (4)
- 処理対象とされる画像内から、認識対象が存在する可能性のある領域を抽出する領域抽出手段と、
前記領域抽出手段により抽出された領域毎に特徴量を抽出する特徴量抽出手段と、
全ての前記領域の組み合わせについて、画像スコアと、コンテキストスコアを統合したスコアを計算する計算手段と、
前記画像スコアである前記認識対象に関するパラメータを保持するパラメータ保持手段と、
前記コンテキストスコアである前記認識対象に関するコンテキストを保持するコンテキスト保持手段と
を備え、
前記コンテキストは、複数の認識対象間の同時刻における画像中の異なる領域から検出された認識対象間の共起確率であり、
前記計算手段は、前記画像スコアを利用した確率と、前記コンテキストスコアを利用した確率を乗算することで前記スコアを計算し、
前記スコアの高い前記組み合わせを選択することで、認識処理を実行する
画像処理装置。 - 前記認識対象がユーザにより新たに設定された場合、新たに設定された認識対象が存在する画像を、記憶されている複数の画像内から読み出し、
読み出された画像内に他の認識対象があるか否かを判断し、
その判断結果に基づいて、新たに設定された前記認識対象と前記画像内の前記他の認識対象との共起確率を算出し、前記コンテキスト保持部に保持されている新たに設定された認識対象に関するコンテキストを更新する
請求項1に記載の画像処理装置。 - 領域抽出手段、特徴量抽出手段、計算手段、パラメータ保持手段、およびコンテキスト保持手段を備える画像処理装置の画像処理方法において、
前記領域抽出手段が、処理対象とされる画像内から、認識対象が存在する可能性のある領域を抽出し、
前記特徴量抽出手段が、抽出された前記領域毎に特徴量を抽出し、
前記計算手段が、全ての前記領域の組み合わせについて、画像スコアと、コンテキストスコアを統合したスコアを計算し、
前記パラメータ保持手段が、前記画像スコアである前記認識対象に関するパラメータを保持し、
前記コンテキスト保持手段が、前記コンテキストスコアである前記認識対象に関するコンテキストを保持する
ステップを含み、
前記コンテキストは、複数の認識対象間の同時刻における画像中の異なる領域から検出された認識対象間の共起確率であり、
前記計算手段が、前記画像スコアを利用した確率と、前記コンテキストスコアを利用した確率を乗算することで前記スコアを計算し、
前記スコアの高い前記組み合わせが選択されることで、認識処理を実行する
画像処理方法。 - 領域抽出手段、特徴量抽出手段、計算手段、パラメータ保持手段、およびコンテキスト保持手段を備える画像処理装置に、
前記領域抽出手段が、処理対象とされる画像内から、認識対象が存在する可能性のある領域を抽出し、
前記特徴量抽出手段が、抽出された前記領域毎に特徴量を抽出し、
前記計算手段が、全ての前記領域の組み合わせについて、画像スコアと、コンテキストスコアを統合したスコアを計算し、
前記パラメータ保持手段が、前記画像スコアである前記認識対象に関するパラメータを保持し、
前記コンテキスト保持手段が、前記コンテキストスコアである前記認識対象に関するコンテキストを保持する
ステップを含む処理を実行させ、
前記コンテキストは、複数の認識対象間の同時刻における画像中の異なる領域から検出された認識対象間の共起確率であり、
前記計算手段が、前記画像スコアを利用した確率と、前記コンテキストスコアを利用した確率を乗算することで前記スコアを計算し、
前記スコアの高い前記組み合わせが選択されることで、認識処理を実行する
処理を実行させるコンピュータが読み取り可能なプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005361347A JP4640155B2 (ja) | 2005-12-15 | 2005-12-15 | 画像処理装置および方法、並びにプログラム |
EP06256256A EP1798666A1 (en) | 2005-12-15 | 2006-12-08 | image processing apparatus, method and programproduct |
US11/638,013 US7907751B2 (en) | 2005-12-15 | 2006-12-13 | Image processing apparatus, method, and program |
KR1020060127643A KR20070064269A (ko) | 2005-12-15 | 2006-12-14 | 화상 처리 장치 및 방법, 및 프로그램 |
CNB2006101669719A CN100545859C (zh) | 2005-12-15 | 2006-12-15 | 图像处理设备、方法及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005361347A JP4640155B2 (ja) | 2005-12-15 | 2005-12-15 | 画像処理装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007164560A JP2007164560A (ja) | 2007-06-28 |
JP4640155B2 true JP4640155B2 (ja) | 2011-03-02 |
Family
ID=37891793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005361347A Expired - Fee Related JP4640155B2 (ja) | 2005-12-15 | 2005-12-15 | 画像処理装置および方法、並びにプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US7907751B2 (ja) |
EP (1) | EP1798666A1 (ja) |
JP (1) | JP4640155B2 (ja) |
KR (1) | KR20070064269A (ja) |
CN (1) | CN100545859C (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2913510B1 (fr) * | 2007-03-07 | 2009-07-03 | Eastman Kodak Co | Procede pour determiner automatiquement une probabilite de saisie d'images avec un terminal a partir de donnees contextuelles |
JP4924886B2 (ja) * | 2007-03-22 | 2012-04-25 | 日本電気株式会社 | 映像図形文字認識システム、映像図形文字認識方法および映像図形文字認識用プログラム |
JP4755632B2 (ja) * | 2007-08-15 | 2011-08-24 | ヤフー株式会社 | アイテム認識装置及びアイテム認識方法 |
JP4962961B2 (ja) * | 2007-08-15 | 2012-06-27 | ヤフー株式会社 | 空間共起辞書作成装置及び空間共起辞書作成方法 |
NO331287B1 (no) | 2008-12-15 | 2011-11-14 | Cisco Systems Int Sarl | Fremgangsmate og anordning for gjenkjenning av ansikter i en videostrom |
JP2010231256A (ja) * | 2009-03-25 | 2010-10-14 | Hitachi Ltd | データ認識装置、データ認識方法及びプログラム |
JP5662670B2 (ja) * | 2009-10-27 | 2015-02-04 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
JP4661980B2 (ja) * | 2009-12-09 | 2011-03-30 | カシオ計算機株式会社 | 画像認識装置およびプログラム |
JP5423566B2 (ja) * | 2010-04-28 | 2014-02-19 | 富士通株式会社 | 対象物検出装置、対象物検出方法、及びプログラム |
JP5742267B2 (ja) | 2011-02-08 | 2015-07-01 | 富士ゼロックス株式会社 | 画像処理プログラム及び画像処理装置 |
US9058806B2 (en) | 2012-09-10 | 2015-06-16 | Cisco Technology, Inc. | Speaker segmentation and recognition based on list of speakers |
US8886011B2 (en) | 2012-12-07 | 2014-11-11 | Cisco Technology, Inc. | System and method for question detection based video segmentation, search and collaboration in a video processing environment |
JP2015005172A (ja) * | 2013-06-21 | 2015-01-08 | ソニー株式会社 | 情報処理装置、情報処理システム、及びプログラムを記憶した記憶媒体 |
CN105593901B (zh) | 2013-06-28 | 2020-06-12 | 日本电气株式会社 | 训练数据生成设备、方法和程序以及人群状态识别设备、方法和程序 |
JP6255944B2 (ja) | 2013-11-27 | 2018-01-10 | 株式会社リコー | 画像解析装置、画像解析方法及び画像解析プログラム |
JP6320112B2 (ja) * | 2014-03-27 | 2018-05-09 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
US10474949B2 (en) | 2014-08-19 | 2019-11-12 | Qualcomm Incorporated | Knowledge-graph biased classification for data |
US9576203B2 (en) | 2015-04-29 | 2017-02-21 | Canon Kabushiki Kaisha | Devices, systems, and methods for knowledge-based inference for material recognition |
EP3357019A4 (en) * | 2015-09-30 | 2019-03-27 | The Nielsen Company (US), LLC. | INTERACTIVE EXAMINATION OF PRODUCTS WITH A MOBILE DEVICE |
EP3196785B1 (en) * | 2016-01-20 | 2021-12-08 | Ricoh Company, Ltd. | Information processing system and information processing method |
JP6942464B2 (ja) * | 2016-12-09 | 2021-09-29 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
KR101932008B1 (ko) * | 2017-12-29 | 2018-12-24 | (주)제이엘케이인스펙션 | 영상의 특징 및 맥락에 기초한 영상 분석 장치 및 방법 |
TWI649697B (zh) * | 2018-03-14 | 2019-02-01 | 群光電能科技股份有限公司 | 影像辨識模組擴充盒及其擴充使用方法 |
JP7119912B2 (ja) * | 2018-10-31 | 2022-08-17 | 富士通株式会社 | 行動認識方法、行動認識プログラムおよび行動認識装置 |
US11158100B2 (en) * | 2019-02-13 | 2021-10-26 | Adobe Inc. | Automatic generation of context-aware composite images |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07219703A (ja) * | 1994-02-03 | 1995-08-18 | Canon Inc | ジェスチャー入力方法及びその装置 |
JPH0934863A (ja) * | 1995-07-14 | 1997-02-07 | Hitachi Ltd | ニューラルネットワークによる情報統合処理方法 |
JPH11175665A (ja) * | 1997-12-16 | 1999-07-02 | Hitachi Software Eng Co Ltd | 文字認識後処理装置 |
JP2000311180A (ja) * | 1999-03-11 | 2000-11-07 | Fuji Xerox Co Ltd | 特徴セット選択方法、ビデオ画像クラス統計モデルの生成方法、ビデオフレームの分類及びセグメント化方法、ビデオフレームの類似性決定方法、およびコンピュータ可読媒体、並びにコンピュータシステム |
JP2003216955A (ja) * | 2002-01-23 | 2003-07-31 | Sharp Corp | ジェスチャ認識方法、ジェスチャ認識装置、対話装置及びジェスチャ認識プログラムを記録した記録媒体 |
JP2005196750A (ja) * | 2003-12-12 | 2005-07-21 | Mitsubishi Electric Research Laboratories Inc | 映像の構造を学習する方法 |
JP2005339000A (ja) * | 2004-05-25 | 2005-12-08 | Casio Comput Co Ltd | 画像認識装置およびプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4610025A (en) * | 1984-06-22 | 1986-09-02 | Champollion Incorporated | Cryptographic analysis system |
JP3288474B2 (ja) * | 1993-03-31 | 2002-06-04 | 富士通株式会社 | 画像処理装置 |
US6819783B2 (en) | 1996-09-04 | 2004-11-16 | Centerframe, Llc | Obtaining person-specific images in a public venue |
US6643400B1 (en) * | 1999-03-31 | 2003-11-04 | Minolta Co., Ltd. | Image processing apparatus and method for recognizing specific pattern and recording medium having image processing program recorded thereon |
US6611622B1 (en) * | 1999-11-23 | 2003-08-26 | Microsoft Corporation | Object recognition system and process for identifying people and objects in an image of a scene |
US7340079B2 (en) * | 2002-09-13 | 2008-03-04 | Sony Corporation | Image recognition apparatus, image recognition processing method, and image recognition program |
JP2004145416A (ja) | 2002-10-22 | 2004-05-20 | Nippon Telegr & Teleph Corp <Ntt> | 画像認識用サーバ、画像認識用携帯端末装置、画像認識方法、画像認識用プログラム、画像認識用プログラムを記録した記録媒体 |
JP2005039354A (ja) | 2003-07-16 | 2005-02-10 | Matsushita Electric Ind Co Ltd | メタデータ入力方法と編集システム |
-
2005
- 2005-12-15 JP JP2005361347A patent/JP4640155B2/ja not_active Expired - Fee Related
-
2006
- 2006-12-08 EP EP06256256A patent/EP1798666A1/en not_active Ceased
- 2006-12-13 US US11/638,013 patent/US7907751B2/en not_active Expired - Fee Related
- 2006-12-14 KR KR1020060127643A patent/KR20070064269A/ko not_active Application Discontinuation
- 2006-12-15 CN CNB2006101669719A patent/CN100545859C/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07219703A (ja) * | 1994-02-03 | 1995-08-18 | Canon Inc | ジェスチャー入力方法及びその装置 |
JPH0934863A (ja) * | 1995-07-14 | 1997-02-07 | Hitachi Ltd | ニューラルネットワークによる情報統合処理方法 |
JPH11175665A (ja) * | 1997-12-16 | 1999-07-02 | Hitachi Software Eng Co Ltd | 文字認識後処理装置 |
JP2000311180A (ja) * | 1999-03-11 | 2000-11-07 | Fuji Xerox Co Ltd | 特徴セット選択方法、ビデオ画像クラス統計モデルの生成方法、ビデオフレームの分類及びセグメント化方法、ビデオフレームの類似性決定方法、およびコンピュータ可読媒体、並びにコンピュータシステム |
JP2003216955A (ja) * | 2002-01-23 | 2003-07-31 | Sharp Corp | ジェスチャ認識方法、ジェスチャ認識装置、対話装置及びジェスチャ認識プログラムを記録した記録媒体 |
JP2005196750A (ja) * | 2003-12-12 | 2005-07-21 | Mitsubishi Electric Research Laboratories Inc | 映像の構造を学習する方法 |
JP2005339000A (ja) * | 2004-05-25 | 2005-12-08 | Casio Comput Co Ltd | 画像認識装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN100545859C (zh) | 2009-09-30 |
US20070160294A1 (en) | 2007-07-12 |
US7907751B2 (en) | 2011-03-15 |
CN1983303A (zh) | 2007-06-20 |
KR20070064269A (ko) | 2007-06-20 |
JP2007164560A (ja) | 2007-06-28 |
EP1798666A1 (en) | 2007-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4640155B2 (ja) | 画像処理装置および方法、並びにプログラム | |
CN108256433B (zh) | 一种运动姿态评估方法及系统 | |
Mao et al. | Generation and comprehension of unambiguous object descriptions | |
CN105005777B (zh) | 一种基于人脸的音视频推荐方法及系统 | |
JP5106271B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
JP2006172437A (ja) | データのストリームにおけるセグメント境界の位置の決定方法、データサブセットを近隣のデータサブセットと比較してセグメント境界を決定する方法、コンピュータによって実行可能な命令のプログラム、ならびにデータのストリームにおける境界及び非境界を識別するシステム又は装置 | |
US9110501B2 (en) | Method and apparatus for detecting talking segments in a video sequence using visual cues | |
JP2007272896A (ja) | 適応型文脈支援による人間分類を行うためのデジタル画像処理方法および装置 | |
CN104487915A (zh) | 维持扩增的连续性 | |
CN101853391A (zh) | 信息处理设备和方法、程序及记录介质 | |
JP2012208710A (ja) | 属性推定装置 | |
WO2018196718A1 (zh) | 图像消歧方法、装置、存储介质和电子设备 | |
CN111161314B (zh) | 目标对象的位置区域确定方法、装置、电子设备及存储介质 | |
JP6850751B2 (ja) | 物体追跡装置、物体追跡方法、及びコンピュータプログラム | |
CN113052061A (zh) | 一种基于人体姿态估计的速度滑冰运动员动作识别方法 | |
JP2005208850A (ja) | 顔画像認識装置及び顔画像認識プログラム | |
JP7438690B2 (ja) | 情報処理装置、画像認識方法及び学習モデル生成方法 | |
JP7370050B2 (ja) | 読唇装置及び読唇方法 | |
CN113591731B (zh) | 一种基于知识蒸馏的弱监督视频时序行为定位方法 | |
JP2021177312A (ja) | 情報処理装置、情報処理方法 | |
JP4449483B2 (ja) | 画像解析装置、および画像解析方法、並びにコンピュータ・プログラム | |
JP2022013256A (ja) | キーワード抽出装置、キーワード抽出方法及びキーワード抽出プログラム | |
Taranta II et al. | Machete: Easy, efficient, and precise continuous custom gesture segmentation | |
JP7216175B1 (ja) | 画像解析システム、画像解析方法およびプログラム | |
KR20200018341A (ko) | 유전자 정보를 이용한 얼굴 재현 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100603 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |