JP6986576B2 - 物品識別方法及びシステム、電子機器 - Google Patents
物品識別方法及びシステム、電子機器 Download PDFInfo
- Publication number
- JP6986576B2 JP6986576B2 JP2019566841A JP2019566841A JP6986576B2 JP 6986576 B2 JP6986576 B2 JP 6986576B2 JP 2019566841 A JP2019566841 A JP 2019566841A JP 2019566841 A JP2019566841 A JP 2019566841A JP 6986576 B2 JP6986576 B2 JP 6986576B2
- Authority
- JP
- Japan
- Prior art keywords
- article
- image
- result
- information
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 74
- 230000004927 fusion Effects 0.000 claims description 80
- 238000001514 detection method Methods 0.000 claims description 50
- 238000003860 storage Methods 0.000 claims description 33
- 238000007781 pre-processing Methods 0.000 claims description 25
- 230000005484 gravity Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 10
- 238000003066 decision tree Methods 0.000 claims description 6
- 239000010419 fine particle Substances 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000001629 suppression Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000003707 image sharpening Methods 0.000 description 3
- 238000003706 image smoothing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- PICXIOQBANWBIZ-UHFFFAOYSA-N zinc;1-oxidopyridine-2-thione Chemical class [Zn+2].[O-]N1C=CC=CC1=S.[O-]N1C=CC=CC1=S PICXIOQBANWBIZ-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07F—COIN-FREED OR LIKE APPARATUS
- G07F11/00—Coin-freed apparatus for dispensing, or the like, discrete articles
- G07F11/72—Auxiliary equipment, e.g. for lighting cigars, opening bottles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01B—MEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
- G01B11/00—Measuring arrangements characterised by the use of optical techniques
- G01B11/22—Measuring arrangements characterised by the use of optical techniques for measuring depth
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S17/00—Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
- G01S17/88—Lidar systems specially adapted for specific applications
- G01S17/89—Lidar systems specially adapted for specific applications for mapping or imaging
- G01S17/894—3D imaging with simultaneous measurement of time-of-flight at a 2D array of receiver pixels, e.g. time-of-flight cameras or flash lidar
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/08—Payment architectures
- G06Q20/20—Point-of-sale [POS] network systems
- G06Q20/208—Input by product or record sensing, e.g. weighing or scanner processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
- G06T7/248—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/80—Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07G—REGISTERING THE RECEIPT OF CASH, VALUABLES, OR TOKENS
- G07G1/00—Cash registers
- G07G1/0036—Checkout procedures
- G07G1/0045—Checkout procedures with a code reader for reading of an identifying code of the article to be registered, e.g. barcode reader or radio-frequency identity [RFID] reader
- G07G1/0054—Checkout procedures with a code reader for reading of an identifying code of the article to be registered, e.g. barcode reader or radio-frequency identity [RFID] reader with control of supplementary check-parameters, e.g. weight or number of articles
- G07G1/0063—Checkout procedures with a code reader for reading of an identifying code of the article to be registered, e.g. barcode reader or radio-frequency identity [RFID] reader with control of supplementary check-parameters, e.g. weight or number of articles with means for detecting the geometric dimensions of the article of which the code is read, such as its size or height, for the verification of the registration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/08—Payment architectures
- G06Q20/20—Point-of-sale [POS] network systems
- G06Q20/201—Price look-up processing, e.g. updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Electromagnetism (AREA)
- Computer Networks & Wireless Communication (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Control Of Vending Devices And Auxiliary Devices For Vending Devices (AREA)
Description
画像取得装置により物品の複数フレームの画像を取得するステップS202と、
物品の複数フレームの画像を処理して、各フレームの画像における物品の位置情報及び種別情報を取得するステップS204と、
情報取得装置により物品の補助情報を取得するステップS206と、
位置情報及び補助情報に対してマルチモーダル融合を行って、融合結果を得るステップS208と、
種別情報と融合結果に基づいて、物品の識別結果を決定するステップS210とを含む。
ここで、rは、直前のフレームの検出結果と現在のフレームの検出結果とのマッチング率であり、IOU(BBoxcurrent,BBoxpredict)は、現在の物品検出枠と予測された候補枠との空間的な重なり類似度であり、f(BBoxcurrent,BBoxpredict)は、現在の物品検出枠と予測された候補枠との特徴類似度であり、α及びβは、それぞれ、重なり類似度と特徴類似度の重み係数であり、ここで、予測された候補枠は、直前のフレームの物品の位置情報を基に物品の移動傾向に応じて取得される。
Claims (22)
- 画像取得装置により物品の複数フレームの画像を取得することと、
前記物品の複数フレームの画像を処理して、各フレームの画像における前記物品の位置情報及び種別情報を取得することと、
情報取得装置により前記物品の補助情報を取得することと、
前記位置情報及び前記補助情報に対してマルチモーダル融合を行って、融合結果を取得することと、
前記種別情報と前記融合結果に基づいて、前記物品の識別結果を決定することとを含み、
前記融合結果に基づいて、物品の追跡軌跡を決定することと、
前記追跡軌跡を分類して、物品の移動結果に対応する軌跡分類結果を得ることと、
前記軌跡分類結果に基づいて、物品取り出し結果及び物品戻し結果を決定することと、
物品取り出し結果及び物品戻し結果に基づいて、物品管理リストを更新することとをさらに含み、
前記融合結果に基づいて、物品の追跡軌跡を決定することは、
前記融合結果に基づいて、前記物品の位置情報及び前記物品の移動傾向を取得することと、
前記物品の現在の検出枠と予測された候補枠との間の重なり類似度及び特徴類似度に基づいて、現在の検出結果と直前のフレームの検出結果とのマッチング率を判断して、物品の追跡軌跡を得ることとを含み、
前記予測された候補枠は、直前のフレームの前記物品の位置情報を基に、前記物品の移動傾向に基づいて取得され、前記追跡軌跡は、各時間ノードでの物品の位置、物品の種類、物品移動のタイムスタンプを含む、物品識別方法。 - 前記物品の複数フレームの画像を処理して、各フレームの画像における前記物品の位置情報及び種別情報を取得することは、
前記物品の各フレームの画像に対して画像前処理を行うことと、
画像前処理が行われた各フレームの画像における、少なくとも1つの物品が含まれた物品検出枠と、前記種別情報とを決定することと、
前記物品検出枠に基づいて前記物品の位置情報を決定することとを含む、請求項1に記載の方法。 - 前記物品検出枠に対して非最大値抑制を行うことをさらに含む、請求項2に記載の方法。
- 画像取得装置により目標部位の複数フレームの画像を取得することと、
前記目標部位の複数フレームの画像を処理して、各フレームの画像における前記目標部位の位置情報及び判別結果を取得することとをさらに含む、請求項1に記載の方法。 - 前記各フレームの画像における前記目標部位の位置情報及び判別結果、前記物品の前記種別情報及び前記融合結果に基づいて、前記物品の識別結果を決定する、請求項4に記載の方法。
- 前記目標部位の複数フレームの画像を処理して、各フレームの画像における前記目標部位の位置情報及び判別結果を取得することは、
前記目標部位の各フレームの画像に対して画像前処理を行って、ユーザの目標部位の画像輪郭を強調することと、
画像前処理が行われた各フレームの画像における、ユーザの目標部位が現れる部位候補領域を選択することと、
前記部位候補領域における特徴情報を抽出して、複数の部位特徴を得ることと、
予めトレーニングされた分類器により前記複数の部位特徴を識別して、各フレームの画像における前記目標部位の位置情報及び判別結果を得ることとを含む、請求項4に記載の方法。 - 画像前処理が行われた各フレームの画像における、ユーザの目標部位が現れる部位候補領域を選択することは、
サブウィンドウにより各フレームの画像を走査して、各フレームの画像における、ユーザの目標部位が現れる可能性のある部位候補領域を決定することを含む、請求項6に記載の方法。 - 前記物品に対して細粒度分類を行うことをさらに含む、請求項1に記載の方法。
- 前記情報取得装置は、深度カメラ、カードリーダ、重力装置、匂いセンサのうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記情報取得装置が前記深度カメラである場合、前記深度カメラにより、前記物品の深度画像を取得し、前記物品の補助情報には深度情報が含まれる請求項9に記載の方法。
- 前記位置情報及び前記補助情報に対してマルチモーダル融合を行って、融合結果を取得することは、
前記画像取得装置及び前記深度カメラのレンズパラメータ及び位置パラメータを取得することと、
前記深度カメラのレンズパラメータ、前記深度情報、及び前記深度画像における前記物品の位置に基づいて、前記深度カメラの座標系における前記物品の位置を取得することと、
前記画像取得装置及び前記深度カメラの位置パラメータに基づいて、前記深度カメラの座標系を基準として、前記画像取得装置の前記深度カメラに対する相対的な位置関係を標定することと、
前記レンズパラメータ、前記深度画像における前記物品の位置、前記深度情報、及び前記相対的な位置関係に基づいて、前記深度画像における前記物品の位置を前記画像取得装置で取得された画像における前記物品の位置に対応させるマッピング位置情報を決定することと、
前記位置情報と前記マッピング位置情報とを比較して、前記融合結果を得ることとを含む、請求項10に記載の方法。 - 画像取得装置により物品の複数フレームの画像を取得することは、
前記画像取得装置を起動して前記物品のビデオを取得することと、
前記ビデオから前記物品の複数フレームの画像をキャプチャすることとを含む、請求項1に記載の方法。 - 前記追跡軌跡を分類して、軌跡分類結果を取得するステップは、
前記追跡軌跡から物品移動の長さを抽出することと、
予めトレーニングされた分類決定木モデルと前記物品移動の長さとを組み合わせて、前記追跡軌跡を分類して、軌跡分類結果を取得することとを含む、請求項1に記載の方法。 - 前記軌跡分類結果に基づいて、物品取り出し結果又は物品戻し結果を決定するステップは、
前記画像取得装置、又は前記画像取得装置と前記情報取得装置の組み合わせの同一の時刻での軌跡分類結果を取得することと、
前記画像取得装置、又は前記画像取得装置と前記情報取得装置の組み合わせの同一の時刻での軌跡分類結果に基づいて、分類ルールベースに基づく分類判別スキームを確立することと、
前記分類判別スキーム及び前記軌跡分類結果に基づいて、物品取り出し結果又は物品戻し結果を決定することとを含む、請求項13に記載の方法。 - 各種の物品の価格を含む物品価格表を取得することと、
物品取り出し結果及び物品戻し結果に基づいて、取り出された物品及び物品の数を決定することと、
取り出された物品及び物品の数、及び各種の物品の価格に基づいて、物品の決済総額を決定することとをさらに含む、請求項1に記載の方法。 - 無人販売店舗、スマート販売機を少なくとも含む新小売シーンに設定されるべきである、請求項1に記載の方法。
- 物品の複数フレームの画像を取得するように構成される画像取得装置と、
前記物品の補助情報を取得するように構成される情報取得装置と、
前記物品の複数フレームの画像を処理して、各フレームの画像における前記物品の位置情報及び種別情報を取得し、前記位置情報及び前記補助情報に対してマルチモーダル融合を行って、融合結果を取得してから、前記種別情報と前記融合結果に基づいて前記物品の識別結果を決定するように構成されるサーバとを含み、
前記サーバは、さらに、前記融合結果に基づいて、物品の追跡軌跡を決定し、前記追跡軌跡を分類して、物品の移動結果に対応する軌跡分類結果を得、前記軌跡分類結果に基づいて、物品取り出し結果及び物品戻し結果を決定し、物品取り出し結果及び物品戻し結果に基づいて、物品管理リストを更新するように構成され、
前記サーバは、さらに、前記融合結果に基づいて、前記物品の位置情報及び前記物品の移動傾向を取得し、前記物品の現在の検出枠と予測された候補枠との間の重なり類似度及び特徴類似度に基づいて、現在の検出結果と直前のフレームの検出結果とのマッチング率を判断して、物品の追跡軌跡を得るように構成され、
前記予測された候補枠は、直前のフレームの前記物品の位置情報を基に、前記物品の移動傾向に基づいて取得され、前記追跡軌跡は、各時間ノードでの物品の位置、物品の種類、物品移動のタイムスタンプを含む、物品識別システム。 - 前記画像取得装置は、さらに、目標部位の複数フレームの画像を取得するように構成される、請求項17に記載の物品識別システム。
- 前記サーバは、さらに、前記目標部位の複数フレームの画像を処理して、各フレームの画像における前記目標部位の位置情報及び判別結果を取得し、前記各フレームの画像における前記目標部位の位置情報及び判別情報、前記種別情報及び前記融合結果に基づいて、前記物品の識別結果を決定するように構成される、請求項18に記載の物品識別システム。
- 開かれた場合に、前記画像取得装置及び前記情報取得装置が起動する物品貯蔵装置をさらに含む、請求項17に記載の物品識別システム。
- プロセッサと、
前記プロセッサの実行可能な命令を記憶するように構成されるメモリとを含む電子機器であって、
前記プロセッサは、前記実行可能な命令を実行することにより、請求項1〜16のいずれか一項に記載の物品識別方法を実行するように構成される、電子機器。 - 記憶されたプログラムを含む記憶媒体において、前記プログラムは実行される場合、前記記憶媒体の存在する装置を制御して請求項1〜16のいずれか一項に記載の物品識別方法を実行する、記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910016934.7A CN111415461B (zh) | 2019-01-08 | 2019-01-08 | 物品识别方法及系统、电子设备 |
CN201910016934.7 | 2019-01-08 | ||
PCT/CN2019/092405 WO2020143179A1 (zh) | 2019-01-08 | 2019-06-21 | 物品识别方法及系统、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021513690A JP2021513690A (ja) | 2021-05-27 |
JP6986576B2 true JP6986576B2 (ja) | 2021-12-22 |
Family
ID=71490812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019566841A Active JP6986576B2 (ja) | 2019-01-08 | 2019-06-21 | 物品識別方法及びシステム、電子機器 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11335092B2 (ja) |
EP (1) | EP3910608B1 (ja) |
JP (1) | JP6986576B2 (ja) |
KR (1) | KR102329369B1 (ja) |
CN (1) | CN111415461B (ja) |
WO (1) | WO2020143179A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7191671B2 (ja) * | 2018-12-19 | 2022-12-19 | フォルシアクラリオン・エレクトロニクス株式会社 | キャリブレーション装置、キャリブレーション方法 |
CN111860326B (zh) * | 2020-07-20 | 2023-09-26 | 品茗科技股份有限公司 | 一种建筑工地物品移动检测方法、装置、设备及存储介质 |
CN112242940B (zh) * | 2020-07-31 | 2023-06-06 | 广州微林软件有限公司 | 一种箱柜食物智能管理系统及管理方法 |
CN112001770B (zh) * | 2020-07-31 | 2024-05-03 | 广州微林软件有限公司 | 一种食物app管理系统及管理方法 |
CN111967352A (zh) * | 2020-07-31 | 2020-11-20 | 广州微林软件有限公司 | 一种手持物品的多目标跟踪和行为判定的装置和方法 |
CN111950414A (zh) * | 2020-07-31 | 2020-11-17 | 广州微林软件有限公司 | 一种箱柜食物识别系统及识别方法 |
CN112508109B (zh) * | 2020-12-10 | 2023-05-19 | 锐捷网络股份有限公司 | 一种图像识别模型的训练方法及装置 |
CN112749638A (zh) * | 2020-12-28 | 2021-05-04 | 深兰人工智能(深圳)有限公司 | 视觉识别轨迹的筛错方法和售货柜的视觉识别方法 |
CN112381184B (zh) * | 2021-01-15 | 2021-05-25 | 北京每日优鲜电子商务有限公司 | 图像检测方法、装置、电子设备和计算机可读介质 |
CN112966766B (zh) * | 2021-03-18 | 2022-06-07 | 北京三快在线科技有限公司 | 物品分类方法、装置、服务器及存储介质 |
CN113111932B (zh) * | 2021-04-02 | 2022-05-20 | 支付宝(杭州)信息技术有限公司 | 智能货柜的物品核对方法及系统 |
CN112991380B (zh) * | 2021-04-28 | 2021-08-31 | 北京每日优鲜电子商务有限公司 | 基于视频图像的轨迹生成方法、装置、电子设备和介质 |
CN113642425A (zh) * | 2021-07-28 | 2021-11-12 | 北京百度网讯科技有限公司 | 基于多模态的图像检测方法、装置、电子设备及存储介质 |
CN113822859B (zh) * | 2021-08-25 | 2024-02-27 | 日立楼宇技术(广州)有限公司 | 基于图像识别的物品检测方法、系统、装置和存储介质 |
CN113643473A (zh) * | 2021-10-13 | 2021-11-12 | 北京每日优鲜电子商务有限公司 | 信息识别方法、装置、电子设备和计算机可读介质 |
CN113723383B (zh) * | 2021-11-03 | 2022-06-28 | 武汉星巡智能科技有限公司 | 异视角同步识别同区域商品的订单生成方法及智能售货机 |
CN114359973A (zh) * | 2022-03-04 | 2022-04-15 | 广州市玄武无线科技股份有限公司 | 基于视频的商品状态识别方法、设备及计算机可读介质 |
CN115601686B (zh) * | 2022-12-09 | 2023-04-11 | 浙江莲荷科技有限公司 | 物品交付确认的方法、装置和系统 |
CN116021526A (zh) * | 2023-02-07 | 2023-04-28 | 台州勃美科技有限公司 | 一种农业机器人控制方法、装置及农业机器人 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7639841B2 (en) * | 2004-12-20 | 2009-12-29 | Siemens Corporation | System and method for on-road detection of a vehicle using knowledge fusion |
US20080249870A1 (en) * | 2007-04-03 | 2008-10-09 | Robert Lee Angell | Method and apparatus for decision tree based marketing and selling for a retail store |
TWI391876B (zh) * | 2009-02-16 | 2013-04-01 | Inst Information Industry | 利用多重模組混合圖形切割之前景偵測方法、系統以及電腦程式產品 |
US9111351B2 (en) * | 2011-12-15 | 2015-08-18 | Sony Corporation | Minimizing drift using depth camera images |
JP6270065B2 (ja) * | 2013-03-04 | 2018-01-31 | 日本電気株式会社 | 物品管理システム、情報処理装置およびその制御方法と制御プログラム |
CN104008571B (zh) * | 2014-06-12 | 2017-01-18 | 深圳奥比中光科技有限公司 | 基于深度相机的人体模型获取方法及网络虚拟试衣系统 |
KR102317247B1 (ko) * | 2015-06-15 | 2021-10-26 | 한국전자통신연구원 | 영상정보를 이용한 증강현실 기반 손 인터랙션 장치 및 방법 |
CN105205454A (zh) * | 2015-08-27 | 2015-12-30 | 深圳市国华识别科技开发有限公司 | 自动捕捉目标物的系统和方法 |
JP6710031B2 (ja) | 2015-09-14 | 2020-06-17 | 日機装株式会社 | 自動販売機 |
CN106781121A (zh) * | 2016-12-14 | 2017-05-31 | 朱明� | 基于视觉分析的超市自助结账智能系统 |
JP6889279B2 (ja) * | 2017-04-28 | 2021-06-18 | トヨタ モーター ヨーロッパ | デジタル画像内の物体を検出するためのシステムおよび方法、ならびに物体検出を再スコアリングするためのシステムおよび方法 |
CN108470332B (zh) * | 2018-01-24 | 2023-07-07 | 博云视觉(北京)科技有限公司 | 一种多目标跟踪方法及装置 |
CN108389316B (zh) * | 2018-03-02 | 2021-07-13 | 北京京东尚科信息技术有限公司 | 自动售货方法、装置和计算机可读存储介质 |
CN108470339A (zh) * | 2018-03-21 | 2018-08-31 | 华南理工大学 | 一种基于信息融合的重叠苹果视觉识别与定位方法 |
CN108921645B (zh) * | 2018-06-07 | 2021-07-13 | 深圳码隆科技有限公司 | 一种商品购买判定方法、装置和用户终端 |
CN108921048A (zh) * | 2018-06-14 | 2018-11-30 | 深圳码隆科技有限公司 | 一种购物结算方法、装置和用户终端 |
CN108985359B (zh) * | 2018-06-29 | 2021-07-13 | 深圳和而泰数据资源与云技术有限公司 | 一种商品识别方法、无人售货机及计算机可读存储介质 |
CN109035579A (zh) | 2018-06-29 | 2018-12-18 | 深圳和而泰数据资源与云技术有限公司 | 一种商品识别方法、无人售货机及计算机可读存储介质 |
CN108961547A (zh) | 2018-06-29 | 2018-12-07 | 深圳和而泰数据资源与云技术有限公司 | 一种商品识别方法、无人售货机及计算机可读存储介质 |
CN109003390B (zh) * | 2018-06-29 | 2021-08-10 | 深圳和而泰数据资源与云技术有限公司 | 一种商品识别方法、无人售货机及计算机可读存储介质 |
CN109117746A (zh) * | 2018-07-23 | 2019-01-01 | 北京华捷艾米科技有限公司 | 手部检测方法及机器可读存储介质 |
-
2019
- 2019-01-08 CN CN201910016934.7A patent/CN111415461B/zh active Active
- 2019-06-21 EP EP19908887.3A patent/EP3910608B1/en active Active
- 2019-06-21 WO PCT/CN2019/092405 patent/WO2020143179A1/zh unknown
- 2019-06-21 JP JP2019566841A patent/JP6986576B2/ja active Active
- 2019-06-21 US US16/479,222 patent/US11335092B2/en active Active
- 2019-06-21 KR KR1020197036280A patent/KR102329369B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR102329369B1 (ko) | 2021-11-19 |
EP3910608A4 (en) | 2022-02-16 |
WO2020143179A1 (zh) | 2020-07-16 |
JP2021513690A (ja) | 2021-05-27 |
US11335092B2 (en) | 2022-05-17 |
EP3910608B1 (en) | 2024-04-03 |
US20210397844A1 (en) | 2021-12-23 |
CN111415461B (zh) | 2021-09-28 |
CN111415461A (zh) | 2020-07-14 |
KR20200088219A (ko) | 2020-07-22 |
EP3910608A1 (en) | 2021-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6986576B2 (ja) | 物品識別方法及びシステム、電子機器 | |
US11360571B2 (en) | Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data | |
EP3418944B1 (en) | Information processing apparatus, information processing method, and program | |
CN109271847B (zh) | 无人结算场景中异常检测方法、装置及设备 | |
KR101964397B1 (ko) | 정보처리장치 및 정보처리방법 | |
CN109727275B (zh) | 目标检测方法、装置、系统和计算机可读存储介质 | |
EP3065082A1 (en) | Method and apparatus for detecting object in moving image and storage medium storing program thereof | |
Wei et al. | Face detection for image annotation | |
KR101697161B1 (ko) | 열 영상에서 온라인 랜덤 펀 학습을 이용하여 보행자를 추적하는 장치 및 방법 | |
CN112005272A (zh) | 影像分析装置、人物检索系统和人物检索方法 | |
Ali et al. | Visual tree detection for autonomous navigation in forest environment | |
CN106603968A (zh) | 信息处理装置及信息处理方法 | |
US20230394792A1 (en) | Information processing device, information processing method, and program recording medium | |
KR102476496B1 (ko) | 인공지능 기반의 바코드 복원을 통한 상품 식별 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
CN113468914A (zh) | 一种商品纯净度的确定方法、装置及设备 | |
Bartl et al. | PersonGONE: Image inpainting for automated checkout solution | |
US20080198237A1 (en) | System and method for adaptive pixel segmentation from image sequences | |
CN104899544A (zh) | 图像处理装置和图像处理方法 | |
KR102469015B1 (ko) | 서로 다른 파장 범위를 갖는 복수의 카메라를 이용한 상품 식별 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
Achakir et al. | An automated AI-based solution for out-of-stock detection in retail environments | |
Roth et al. | Multi-object tracking evaluated on sparse events | |
JP2021107989A (ja) | 情報処理装置、情報処理方法、プログラム | |
Coutts et al. | Human detection and tracking through temporal feature recognition | |
Boufama et al. | Tracking multiple people in the context of video surveillance | |
KR102476498B1 (ko) | 인공지능 기반의 복합 인식을 통한 상품 식별 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6986576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |