JP6823449B2 - 画像検出デバイスを動作させる方法およびコンピュータ・プログラム製品(サッカードを使用する視覚オブジェクトおよびイベントの検出および予測システム) - Google Patents
画像検出デバイスを動作させる方法およびコンピュータ・プログラム製品(サッカードを使用する視覚オブジェクトおよびイベントの検出および予測システム) Download PDFInfo
- Publication number
- JP6823449B2 JP6823449B2 JP2016246240A JP2016246240A JP6823449B2 JP 6823449 B2 JP6823449 B2 JP 6823449B2 JP 2016246240 A JP2016246240 A JP 2016246240A JP 2016246240 A JP2016246240 A JP 2016246240A JP 6823449 B2 JP6823449 B2 JP 6823449B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- cluster
- sequence
- computer
- patches
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/44—Event detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Ophthalmology & Optometry (AREA)
- Image Analysis (AREA)
Description
・コンテキストに依存する、関連性のあるオブジェクトの迅速な識別
・各々のフレームが明確に以前のものに関係付けられる、ビデオでのような、一連のフレームを通しての1つまたは複数のオブジェクトの時間的な追尾
・画像の部分的な処理のみによる、より低いエネルギー
202 patchID
301 符号化
401 トレーニング画像
402 クラスタID
501 トレーニング画像
502 クラスタ表現
503 クラスタ表現を使用するパッチの例示的な再構築
601 パス
603 サッカディック・パス符号化
701 トレーニング・セット
704 クラスタ−方向シーケンス
1401 プロセッサ
1402 メモリ
1403 ディスプレイ
1404 入力デバイス
1405 ネットワーク・インターフェイス(I/F)
1406 媒体I/F
1407 媒体
Claims (12)
- 画像検出デバイスを動作させる方法であって、
画像を受信するステップと、
前記画像を複数のパッチに分割するステップと、
前記複数のパッチのパッチをグループ化するステップと、
前記画像の前記複数のパッチを通るサッカディック・パスのセットを生成するステップと、
クラスタ−方向シーケンスを、各々のサッカディック・パスに対して生成するステップと、
新しい画像内のオブジェクトを識別するためのポリシー機能を、前記クラスタ−方向シーケンスの組合せを使用して生成するステップと、
前記画像検出デバイスを、前記ポリシー機能を使用して動作させて、前記新しい画像内のオブジェクトを識別するステップと
を含む、方法。 - 前記グループ化を実行することに先行して前記複数のパッチのスパース表現を生成するステップをさらに含む、請求項1に記載の方法。
- 前記クラスタ−方向シーケンスの前記組合せを生成するステップをさらに含む、請求項1に記載の方法。
- シーケンス−頻度テーブルをインスタンス化するステップと、
前記シーケンス−頻度テーブルを前記クラスタ−方向シーケンスによって設定するステップであって、前記シーケンス−頻度テーブルは、前記クラスタ−方向シーケンスに現れる異なるシーケンスに対する集計を与える、前記設定するステップと
をさらに含む、請求項3に記載の方法。 - 前記新しい画像のパッチを通して方向選定を誘導するためのポリシー・マトリックスとして、前記ポリシー機能を前記画像検出デバイスのメモリに記憶するステップをさらに含む、請求項1に記載の方法。
- 画像検出デバイスを動作させる方法であって、
画像を受信するステップと、
前記画像を複数のパッチに分割するステップと、
クラスタ−方向シーケンスを、調査されることになる複数のサッカディック・パスの各々に対して生成するステップであって、前記複数のサッカディック・パスはポリシー・マトリックスにより与えられる、前記生成するステップと、
前記画像内のオブジェクトを、前記クラスタ−方向シーケンスを使用して識別するステップと
を含む、方法。 - 前記クラスタ−方向シーケンスを、調査されることになる前記複数のサッカディック・パスの各々に対して生成するステップは、
前記ポリシー・マトリックスにより定義される、前記画像が各々のクラスに属するという公算を割り当てるステップと、
前記画像内の前記オブジェクトを、前記クラスタ−方向シーケンスにわたる前記公算の平均を使用して識別するステップと
をさらに含む、請求項6に記載の方法。 - 前記公算の少なくとも1つを重み付けするステップをさらに含む、請求項7に記載の方法。
- 前記重み付けは、前記ポリシー・マトリックスにより定義される、所与のクラスに対する、前記ポリシー・マトリックス内の前記クラスタ−方向シーケンスの発生の総合的な頻度を使用する、請求項8に記載の方法。
- 複数のサッカードからの結果をプールするステップをさらに含む、請求項6に記載の方法。
- 画像検出デバイスを動作させるためのコンピュータ・プログラムを記憶する記憶媒体であって、前記コンピュータ・プログラムは、コンピュータに請求項1ないし10のいずれか1項に記載の方法を実行させるためのプログラムである、記憶媒体。
- 画像検出デバイスを動作させるためのコンピュータ・プログラムであって、コンピュータに請求項1ないし10のいずれか1項に記載の方法を実行させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/985596 | 2015-12-31 | ||
US14/985,596 US9870503B2 (en) | 2015-12-31 | 2015-12-31 | Visual object and event detection and prediction system using saccades |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017120631A JP2017120631A (ja) | 2017-07-06 |
JP6823449B2 true JP6823449B2 (ja) | 2021-02-03 |
Family
ID=58284443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016246240A Active JP6823449B2 (ja) | 2015-12-31 | 2016-12-20 | 画像検出デバイスを動作させる方法およびコンピュータ・プログラム製品(サッカードを使用する視覚オブジェクトおよびイベントの検出および予測システム) |
Country Status (5)
Country | Link |
---|---|
US (2) | US9870503B2 (ja) |
JP (1) | JP6823449B2 (ja) |
CN (1) | CN106934337B (ja) |
DE (1) | DE102016222036A1 (ja) |
GB (1) | GB2547752B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157235A (zh) * | 2015-04-03 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 图片合成方法、装置及即时通信方法、图片合成服务器 |
US9870503B2 (en) | 2015-12-31 | 2018-01-16 | International Business Machines Corporation | Visual object and event detection and prediction system using saccades |
US10890968B2 (en) * | 2018-05-07 | 2021-01-12 | Apple Inc. | Electronic device with foveated display and gaze prediction |
CN109308460B (zh) * | 2018-09-06 | 2021-04-02 | 深兰科技(上海)有限公司 | 物品检测方法、系统及计算机可读存储介质 |
CN109360191B (zh) * | 2018-09-25 | 2020-06-12 | 南京大学 | 一种基于变分自编码器的图像显著性检测方法 |
CN109858352B (zh) * | 2018-12-26 | 2020-09-18 | 华中科技大学 | 一种基于压缩感知与改进多尺度网络的故障诊断方法 |
CN110245660B (zh) * | 2019-06-03 | 2022-04-22 | 西北工业大学 | 基于显著性特征融合的网页扫视路径预测方法 |
CN110298303B (zh) * | 2019-06-27 | 2022-03-25 | 西北工业大学 | 一种基于长短时记忆网络扫视路径学习的人群识别方法 |
US11379733B2 (en) * | 2019-07-10 | 2022-07-05 | International Business Machines Corporation | Detecting and predicting object events from images |
CN112378382B (zh) * | 2020-10-13 | 2022-09-16 | 歌尔光学科技有限公司 | 一种视觉检测系统的控制方法、装置和视觉检测系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6061086A (en) * | 1997-09-11 | 2000-05-09 | Canopular East Inc. | Apparatus and method for automated visual inspection of objects |
CN101398902B (zh) * | 2008-09-27 | 2012-07-04 | 宁波新然电子信息科技发展有限公司 | 一种自然手写阿拉伯字母联机识别方法 |
US8340435B2 (en) * | 2009-06-11 | 2012-12-25 | California Institute Of Technology | Method and system for object recognition search |
US8942466B2 (en) * | 2010-08-26 | 2015-01-27 | Brain Corporation | Sensory input processing apparatus and methods |
JP6098318B2 (ja) * | 2013-04-15 | 2017-03-22 | オムロン株式会社 | 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 |
CN103761531B (zh) * | 2014-01-20 | 2016-04-06 | 西安理工大学 | 基于形状轮廓特征的稀疏编码车牌字符识别方法 |
US9870503B2 (en) | 2015-12-31 | 2018-01-16 | International Business Machines Corporation | Visual object and event detection and prediction system using saccades |
US10133955B2 (en) * | 2015-12-31 | 2018-11-20 | Adaptive Computation, Llc | Systems and methods for object recognition based on human visual pathway |
-
2015
- 2015-12-31 US US14/985,596 patent/US9870503B2/en active Active
-
2016
- 2016-11-10 DE DE102016222036.5A patent/DE102016222036A1/de active Pending
- 2016-11-30 CN CN201611089874.4A patent/CN106934337B/zh active Active
- 2016-12-20 JP JP2016246240A patent/JP6823449B2/ja active Active
- 2016-12-20 GB GB1621726.7A patent/GB2547752B/en active Active
-
2017
- 2017-12-24 US US15/853,828 patent/US10025981B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9870503B2 (en) | 2018-01-16 |
GB2547752A (en) | 2017-08-30 |
CN106934337A (zh) | 2017-07-07 |
US10025981B2 (en) | 2018-07-17 |
JP2017120631A (ja) | 2017-07-06 |
US20180121723A1 (en) | 2018-05-03 |
GB2547752B (en) | 2018-01-24 |
DE102016222036A1 (de) | 2017-07-06 |
GB201621726D0 (en) | 2017-02-01 |
CN106934337B (zh) | 2020-12-15 |
US20170193294A1 (en) | 2017-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6823449B2 (ja) | 画像検出デバイスを動作させる方法およびコンピュータ・プログラム製品(サッカードを使用する視覚オブジェクトおよびイベントの検出および予測システム) | |
US10417501B2 (en) | Object recognition in video | |
US20210110196A1 (en) | Deep Learning Network for Salient Region Identification in Images | |
CN109635838B (zh) | 人脸样本图片标注方法、装置、计算机设备及存储介质 | |
EP3223237B1 (en) | Systems and methods for detecting and tracking a marker | |
WO2020042895A1 (en) | Device and method of tracking poses of multiple objects based on single-object pose estimator | |
KR101607934B1 (ko) | 전염병 모니터링 방법 및 이를 이용한 시스템, 이를 수행하기 위한 기록매체 | |
EP2806374B1 (en) | Method and system for automatic selection of one or more image processing algorithm | |
US20170330320A1 (en) | Systems and methods for automatic detection and quantification of pathology using dynamic feature classification | |
US10423852B1 (en) | Text image processing using word spacing equalization for ICR system employing artificial neural network | |
WO2020000876A1 (zh) | 用于生成模型的方法和装置 | |
WO2014210334A1 (en) | Machine learning enchanced by human measurements | |
Monteiro et al. | A de-identification pipeline for ultrasound medical images in DICOM format | |
US10943697B2 (en) | Determining information based on an analysis of images and video | |
CN111046956A (zh) | 遮挡图像检测方法、装置、电子设备及存储介质 | |
JP7480811B2 (ja) | サンプル分析の方法、電子装置、コンピュータ可読記憶媒体、及びコンピュータプログラム | |
CN107133629B (zh) | 图片分类方法、装置和移动终端 | |
GB2602581A (en) | Automatic detection and replacement of identifying information in images using machine learning | |
WO2021169642A1 (zh) | 基于视频的眼球转向确定方法与系统 | |
CN116188392A (zh) | 图像处理方法、计算机可读存储介质以及计算机终端 | |
Mar et al. | Cow detection and tracking system utilizing multi-feature tracking algorithm | |
CN111967529B (zh) | 识别方法、装置、设备及系统 | |
CN112989869B (zh) | 人脸质量检测模型的优化方法、装置、设备及存储介质 | |
Yang et al. | Characteristics and prevalence of fake social media profiles with AI-generated faces | |
CN111062436B (zh) | 蟑螂交配行为的分析方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200908 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6823449 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |