JP6255762B2 - Image recognition apparatus, image recognition method, and program - Google Patents

Image recognition apparatus, image recognition method, and program Download PDF

Info

Publication number
JP6255762B2
JP6255762B2 JP2013148722A JP2013148722A JP6255762B2 JP 6255762 B2 JP6255762 B2 JP 6255762B2 JP 2013148722 A JP2013148722 A JP 2013148722A JP 2013148722 A JP2013148722 A JP 2013148722A JP 6255762 B2 JP6255762 B2 JP 6255762B2
Authority
JP
Japan
Prior art keywords
recognition
image
image recognition
recognized
specific information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013148722A
Other languages
Japanese (ja)
Other versions
JP2015022432A (en
Inventor
昭彦 石井
昭彦 石井
博一 山田
博一 山田
岩元 浩太
浩太 岩元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013148722A priority Critical patent/JP6255762B2/en
Publication of JP2015022432A publication Critical patent/JP2015022432A/en
Application granted granted Critical
Publication of JP6255762B2 publication Critical patent/JP6255762B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cash Registers Or Receiving Machines (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像認識装置、画像認識方法及びプログラムに関する。   The present invention relates to an image recognition apparatus, an image recognition method, and a program.

近年、画像認識技術が様々な場面で利用されている。特許文献1に関連する技術が開示されている。特許文献1には、画像データを入力する入力手段と、入力した画像データから認識すべき構造物を含む認識領域を取得する取得手段と、認識領域から枠線を抽出する枠線抽出手段とを備える画像認識装置が開示されている。   In recent years, image recognition technology has been used in various situations. A technique related to Patent Document 1 is disclosed. Patent Document 1 includes input means for inputting image data, acquisition means for acquiring a recognition area including a structure to be recognized from the input image data, and frame line extraction means for extracting a frame line from the recognition area. An image recognition apparatus is disclosed.

特開2005−196283号公報JP 2005-196283 A

所定の媒体に付された情報を認識し、認識した情報が所定の条件を満たすか否かを判定する作業を行う場合がある。例えば、シート状の媒体に貼付された複数のシール各々に示された得点(数値)を認識し、それらの合計値が所定の値以上か否かを判定する場合がある。   There is a case where information attached to a predetermined medium is recognized, and an operation of determining whether the recognized information satisfies a predetermined condition is performed. For example, a score (numerical value) shown on each of a plurality of stickers affixed to a sheet-like medium may be recognized, and it may be determined whether or not the total value is a predetermined value or more.

当該作業は、所定の媒体に付された情報(例:得点)が増えるほど、作業効率が悪くなるほか、認識ミス、判定ミス等が発生し易くなる。また、判定対象となる媒体の数が増え、同じ判定作業を繰り返し実行しなければならない場合、認識ミス、判定ミス等が発生し易くなる。   In this work, as the information (for example, a score) attached to a predetermined medium increases, the work efficiency becomes worse, and a recognition error, a determination error, and the like are more likely to occur. Further, when the number of media to be determined increases and the same determination operation must be repeatedly performed, recognition errors, determination errors, and the like are likely to occur.

本発明は、所定の媒体に付された情報を認識し、認識した情報が所定の条件を満たすか否かを判定する作業の助けとなる技術を提供することを課題とする。   It is an object of the present invention to provide a technique for assisting an operation of recognizing information attached to a predetermined medium and determining whether the recognized information satisfies a predetermined condition.

本発明によれば、
特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得手段と、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識手段と、
前記画像認識手段が認識した前記特定情報に基づいて、当該特定情報の統計値を算出し、前記統計値が所定の条件を満たすか否かを判断する算出手段と、
を有する画像認識装置が提供される。
According to the present invention,
Image acquisition means for acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Image recognition means for performing image recognition processing on the image data and recognizing the specific information of each of the recognition objects present in the image;
Calculation means for calculating a statistical value of the specific information based on the specific information recognized by the image recognition means, and determining whether the statistical value satisfies a predetermined condition ;
Is provided.

また、本発明によれば、
コンピュータを、
特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得手段、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識手段、
前記画像認識手段が認識した前記特定情報に基づいて、当該特定情報の統計値を算出し、前記統計値が所定の条件を満たすか否かを判断する算出手段、
として機能させるためのプログラムが提供される。
Moreover, according to the present invention,
Computer
Image acquisition means for acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Image recognition means for performing image recognition processing on the image data and recognizing the specific information of each of the recognition objects present in the image;
Calculation means for calculating a statistical value of the specific information based on the specific information recognized by the image recognition means, and determining whether the statistical value satisfies a predetermined condition ;
A program for functioning as a server is provided.

また、本発明によれば、
コンピュータが、
特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得工程と、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識工程と、
前記画像認識工程で認識した前記特定情報に基づいて、当該特定情報の統計値を算出し、前記統計値が所定の条件を満たすか否かを判断する算出工程と、
を実行する画像認識方法が提供される。
Moreover, according to the present invention,
Computer
An image acquisition step of acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Performing an image recognition process on the image data, and recognizing the specific information of each of the recognition objects present in the image;
A calculation step of calculating a statistical value of the specific information based on the specific information recognized in the image recognition step, and determining whether the statistical value satisfies a predetermined condition ;
An image recognition method for performing is provided.

本発明によれば、所定の媒体に付された情報を認識し、認識した情報が所定の条件を満たすか否かを判定する作業の助けとなる技術が実現される。   ADVANTAGE OF THE INVENTION According to this invention, the technique which assists the operation | work which recognizes the information attached | subjected to the predetermined medium and determines whether the recognized information satisfy | fills predetermined conditions is implement | achieved.

本実施形態の画像認識装置のハードウェア構成の一例を概念的に示す図である。It is a figure which shows notionally an example of the hardware constitutions of the image recognition apparatus of this embodiment. 本実施形態の画像認識装置の機能ブロック図の一例を示す図である。It is a figure which shows an example of the functional block diagram of the image recognition apparatus of this embodiment. 本実施形態の認識対象の一例を模式的に示す平面図である。It is a top view which shows typically an example of the recognition target of this embodiment. 本実施形態の画像認識装置の機能ブロック図の一例を示す図である。It is a figure which shows an example of the functional block diagram of the image recognition apparatus of this embodiment. 本実施形態の画像認識部が出力する情報の一例を模式的に示す図である。It is a figure which shows typically an example of the information which the image recognition part of this embodiment outputs. 本実施形態の算出部が出力する情報の一例を模式的に示す図である。It is a figure which shows typically an example of the information which the calculation part of this embodiment outputs. 本実施形態の決定部が出力する情報の一例を模式的に示す図である。It is a figure which shows typically an example of the information which the determination part of this embodiment outputs. 本実施形態の算出部が出力する情報の一例を模式的に示す図である。It is a figure which shows typically an example of the information which the calculation part of this embodiment outputs. 本実施形態の画像認識装置の機能ブロック図の一例を示す図である。It is a figure which shows an example of the functional block diagram of the image recognition apparatus of this embodiment. 本実施形態の画像認識装置の機能ブロック図の一例を示す図である。It is a figure which shows an example of the functional block diagram of the image recognition apparatus of this embodiment. 本実施形態の画像認識装置の機能ブロック図の一例を示す図である。It is a figure which shows an example of the functional block diagram of the image recognition apparatus of this embodiment. 本実施形態の出力部によりディスプレイに表示される画面の一例を模式的に示す図である。It is a figure which shows typically an example of the screen displayed on a display by the output part of this embodiment. 本実施形態の出力部によりディスプレイに表示される画面の一例を模式的に示す図である。It is a figure which shows typically an example of the screen displayed on a display by the output part of this embodiment. 本実施形態の出力部によりディスプレイに表示される画面の一例を模式的に示す図である。It is a figure which shows typically an example of the screen displayed on a display by the output part of this embodiment. 本実施形態の画像認識装置の処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of a process of the image recognition apparatus of this embodiment. 本実施形態の画像認識装置の処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of a process of the image recognition apparatus of this embodiment.

以下、本発明の実施の形態について図面を用いて説明する。なお、同様の構成要素には同様の符号を付し、適宜説明を省略する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In addition, the same code | symbol is attached | subjected to the same component and description is abbreviate | omitted suitably.

<ハードウェア構成>
本実施形態の画像認識装置は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされたプログラム(あらかじめ装置を出荷する段階からメモリ内に格納されているプログラムのほか、CD(Compact Disc)等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムも含む)、そのプログラムを格納するハードディスク等の記憶ユニット、ネットワーク接続用インタフェイスを中心にハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
<Hardware configuration>
The image recognition apparatus according to this embodiment includes a CPU (Central Processing Unit), a memory, and a program loaded in the memory (a program stored in the memory from the stage of shipping the apparatus in advance, a CD (Compact Disc) and other storage media and programs downloaded from servers on the Internet), storage units such as hard disks for storing the programs, and any combination of hardware and software, centering on the network connection interface Is done. It will be understood by those skilled in the art that there are various modifications to the implementation method and apparatus.

図1は、本実施形態の画像認識装置のハードウェア構成の一例を概念的に示す図である。画像認識装置は据置型の装置であってもよいし、携帯端末であってもよい。図示するように、本実施形態の画像処理装置、例えば、バス10Aで相互に接続されるCPU1A、RAM(Random Access Memory)2A、ROM(Read Only Memory)3A、通信部4A、表示制御部5A、ディスプレイ6A、操作受付部7A、操作部8A、補助記憶装置9A等を有する。なお、図示しないが、動画像や静止画像を撮像するカメラ部などのその他の要素を含むこともできる。   FIG. 1 is a diagram conceptually illustrating an example of a hardware configuration of the image recognition apparatus according to the present embodiment. The image recognition device may be a stationary device or a portable terminal. As shown in the figure, the image processing apparatus of this embodiment, for example, a CPU 1A, a RAM (Random Access Memory) 2A, a ROM (Read Only Memory) 3A, a communication unit 4A, a display control unit 5A, It includes a display 6A, an operation receiving unit 7A, an operation unit 8A, an auxiliary storage device 9A, and the like. Although not shown, other elements such as a camera unit that captures a moving image or a still image can also be included.

CPU1Aは各要素とともに画像認識装置のコンピュータ全体を制御する。ROM3Aは、コンピュータを動作させるためのプログラムや各種アプリケーションプログラム、それらのプログラムが動作する際に使用する各種設定データなどを記憶する領域を含む。RAM2Aは、プログラムが動作するための作業領域など一時的にデータを記憶する領域を含む。補助記憶装置9Aは大量のデータを記憶可能であり、例えば磁気記憶のハードディスクであってもよい。   CPU1A controls the whole computer of an image recognition apparatus with each element. The ROM 3A includes an area for storing programs for operating the computer, various application programs, various setting data used when these programs operate. The RAM 2A includes an area for temporarily storing data, such as a work area for operating a program. The auxiliary storage device 9A can store a large amount of data, and may be a magnetic storage hard disk, for example.

操作部8Aは、操作キー、操作ボタン、スイッチ、ジョグダイヤル、タッチパッド、ディスプレイと一体になったタッチパネルなどを含む。操作受付部7Aは、ユーザが操作部8Aを操作することでなされるユーザ入力を受付ける。   The operation unit 8A includes operation keys, operation buttons, switches, a jog dial, a touch pad, a touch panel integrated with a display, and the like. The operation reception unit 7A receives user input made by the user operating the operation unit 8A.

通信部4Aは、有線で接続された外部機器と通信を行うことができる。また、通信部4Aは、あらゆる無線通信技術(近距離無線通信、無線LAN(Local Area Network)通信、携帯電話通信網を利用した通信等)を利用して外部機器と通信を行うことができる。   The communication unit 4A can communicate with an external device connected by wire. The communication unit 4A can communicate with an external device using any wireless communication technology (short-range wireless communication, wireless LAN (Local Area Network) communication, communication using a mobile phone communication network, etc.).

ディスプレイ6Aは、LED(Light Emitting Diode)表示器や、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイなどを含む。表示制御部5Aは、CPU1Aからの指示に従い、ディスプレイ6Aに各種画面表示を行う。   The display 6A includes an LED (Light Emitting Diode) display, a liquid crystal display, an organic EL (Electro Luminescence) display, and the like. The display control unit 5A displays various screens on the display 6A in accordance with instructions from the CPU 1A.

<第1の実施形態>
本実施形態では、所定の媒体に付された情報を認識し、認識した情報が所定の条件を満たすか否かを判定する作業の助けとなる技術として、画像認識技術を利用した技術を提供する。
<First Embodiment>
In the present embodiment, a technique using an image recognition technique is provided as a technique for recognizing information attached to a predetermined medium and assisting in determining whether the recognized information satisfies a predetermined condition. .

具体的には、本実施形態の画像認識装置は、特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する。そして、取得した画像のデータに対して画像認識処理を行い、1つ又は複数の認識対象各々が含む特定情報の内容を認識する。そして、認識した特定情報の内容に基づいて、被認識媒体に付された特定情報が所定の条件を満たすか否かを判定するために利用される情報を生成する。   Specifically, the image recognition apparatus of the present embodiment acquires data of an image obtained by capturing a recognized medium to which one or more recognition targets including specific information are attached. Then, image recognition processing is performed on the acquired image data to recognize the content of the specific information included in each of the one or more recognition targets. And based on the content of the recognized specific information, the information used in order to determine whether the specific information attached | subjected to the to-be-recognized medium satisfy | fills a predetermined condition is produced | generated.

ここで、本実施形態の画像認識装置の詳細な説明を理解し易くするため、本実施形態の画像認識装置の適用場面の一例を示す。当然、本実施形態の画像認識装置はここで例示する適用場面で利用されるものに限定されない。   Here, in order to facilitate understanding of the detailed description of the image recognition apparatus of the present embodiment, an example of an application scene of the image recognition apparatus of the present embodiment is shown. Of course, the image recognition apparatus of the present embodiment is not limited to the one used in the application scene exemplified here.

図3に、被認識媒体20の一例を示す。被認識媒体20は、例えば、1つ又は複数の認識対象22が付されたシート状媒体21である。シート状媒体21は、紙や樹脂フィルムなどであってもよい。   FIG. 3 shows an example of the recognized medium 20. The recognized medium 20 is, for example, a sheet-like medium 21 with one or more recognition targets 22 attached thereto. The sheet-like medium 21 may be paper or a resin film.

認識対象22は、シート状媒体21と別個に設けられた子媒体であり、シート状媒体21の表面に貼付されたものであってもよい。例えば、認識対象22はシールであってもよいし、又は、糊などの貼付用材料でシート状媒体21の表面に貼付された紙や樹脂フィルムであってもよい。認識対象22の形状はあらかじめ定められた形状とすることができる。図示する例では丸であるが、三角、四角などその他の形状であってもよい。   The recognition target 22 is a child medium provided separately from the sheet medium 21 and may be affixed to the surface of the sheet medium 21. For example, the recognition target 22 may be a seal, or may be paper or a resin film affixed to the surface of the sheet-like medium 21 with a pasting material such as glue. The shape of the recognition target 22 can be a predetermined shape. In the illustrated example, it is a circle, but other shapes such as a triangle and a square may be used.

認識対象22は、文字、数字、記号、図形、絵等を用いて形成された特定情報を含む。図示する認識対象22は、特定情報として得点(数値)を含んでいる。   The recognition target 22 includes specific information formed using letters, numbers, symbols, figures, pictures, and the like. The recognition target 22 shown in the figure includes a score (numerical value) as specific information.

例えば、認識対象22はシールであり、パン、菓子、飲み物などの商品に貼付されている。各認識対象22に記されている得点(数値)は、商品の価格に応じた値(例:価格が高いほど高い値)となっていてもよい。商品の販売者は、シート状媒体21を作成し、顧客に配布する。認識対象22付き商品を購入した顧客は、商品から認識対象22をはがし、シート状媒体21の所定の位置に貼付する。そして、シート状媒体21に貼付された認識対象22が含む得点の合計(以下、「被認識媒体20に付された得点の合計」)が所定の値になると、顧客はその被認識媒体20を商品引き換え業者に渡し、代わりに所定のサービス(例:商品)を受け取る。   For example, the recognition target 22 is a seal and is affixed to a product such as bread, confectionery, or drink. The score (numerical value) described in each recognition target 22 may be a value corresponding to the price of the product (for example, a higher value as the price is higher). The merchandise seller creates the sheet-like medium 21 and distributes it to the customer. The customer who has purchased the product with the recognition target 22 peels off the recognition target 22 from the product and attaches it to a predetermined position on the sheet-like medium 21. When the total score included in the recognition target 22 attached to the sheet-like medium 21 (hereinafter, “total score given to the recognized medium 20”) reaches a predetermined value, the customer selects the recognized medium 20. The product is delivered to a merchandise exchange company and a predetermined service (eg, product) is received instead.

上記適用例の場合、本実施形態の画像認識装置は、例えば、商品引き換え業者によって利用される。被認識媒体20を顧客から受取った商品引き換え業者は、画像認識装置を利用して、受取った被認識媒体20に付された得点の合計(合計得点)が商品との引き換え条件を満たしているか判定することができる。   In the case of the above application example, the image recognition apparatus of the present embodiment is used by, for example, a merchandise exchange trader. The merchandise exchange trader who received the recognized medium 20 from the customer uses the image recognition apparatus to determine whether the total score (total score) given to the received recognized medium 20 satisfies the condition for redeeming the merchandise. can do.

また、上記適用例の場合、本実施形態の画像認識装置は、顧客によっても利用される。シート状媒体21に認識対象22を貼付した顧客は、画像認識装置を利用して、被認識媒体20に付された得点の合計(合計得点)が、商品との引き換え条件を満たしているか判定する。この場合、顧客は、例えば自身のカメラ機能付き携帯端末に所定のプログラムをインストールし、当該携帯端末を本実施形態の画像認識装置として利用することができる。   In the case of the above application example, the image recognition apparatus of the present embodiment is also used by a customer. The customer who has attached the recognition target 22 to the sheet-like medium 21 uses the image recognition apparatus to determine whether the total score (total score) given to the recognized medium 20 satisfies the condition for redeeming the product. . In this case, for example, the customer can install a predetermined program in his / her mobile terminal with a camera function and use the mobile terminal as the image recognition apparatus of the present embodiment.

以下、本実施形態の画像認識装置10の構成について詳細に説明する。図2に、本実施形態の画像認識装置10の機能ブロック図の一例を示す。図示するように、画像認識装置10は、画像取得部11と、画像認識部12と、算出部13とを有する。なお、画像認識装置10は据置型の装置であってもよいし、携帯端末であってもよい。   Hereinafter, the configuration of the image recognition device 10 of the present embodiment will be described in detail. FIG. 2 shows an example of a functional block diagram of the image recognition apparatus 10 of the present embodiment. As illustrated, the image recognition device 10 includes an image acquisition unit 11, an image recognition unit 12, and a calculation unit 13. The image recognition device 10 may be a stationary device or a mobile terminal.

画像取得部11は、特定情報を含む認識対象22が1つ又は複数付された被認識媒体20を撮像した画像のデータ(以下、「画像データ」)を取得する。画像取得部11が画像データを取得する手段は特段制限されない。例えば、画像取得部11はカメラ機能を備えおり、被認識媒体20を撮像することで、画像データを取得してもよい。または、画像取得部11は、無線及び/又は有線での通信により、外部機器から画像データを取得してもよい。画像取得部11が取得する画像データは、動画像のデータ(単位時間内に連続的に撮像された所定数の画像フレームを含む画像データ)であってもよいし、静止画像のデータ(連続的に撮像されていない画像データ)であってもよい。   The image acquisition unit 11 acquires image data (hereinafter, “image data”) obtained by capturing an image of the recognized medium 20 with one or more recognition targets 22 including specific information. The means by which the image acquisition unit 11 acquires image data is not particularly limited. For example, the image acquisition unit 11 may have a camera function, and may acquire image data by capturing the recognized medium 20. Alternatively, the image acquisition unit 11 may acquire image data from an external device by wireless and / or wired communication. The image data acquired by the image acquisition unit 11 may be moving image data (image data including a predetermined number of image frames continuously captured within a unit time) or still image data (continuous). (Image data not captured).

画像認識部12は、画像取得部11が取得した画像データに対して画像認識処理を行い、その画像内に存在する認識対象22各々の特定情報を認識する。画像認識部12が画像内に存在する認識対象22を特定する手段及び認識対象22が含む特定情報を認識する手段は特段制限されず、あらゆる技術を採用することができる。例えば、所定の規格により定まった認識対象22の形状や、特定情報がとり得る値の範囲(例:1〜3の数値など)、特定情報の表記態様(例:アラビア数字、漢数字、アルファベット、カタカナ、ひらがな、漢字等)等を利用して、画像中に存在する認識対象22対象を特定したり、認識対象22が有する特定情報を認識したりしてもよい。   The image recognition unit 12 performs image recognition processing on the image data acquired by the image acquisition unit 11 and recognizes specific information of each recognition target 22 existing in the image. The means by which the image recognition unit 12 identifies the recognition target 22 existing in the image and the means for recognizing the specific information included in the recognition target 22 are not particularly limited, and any technique can be adopted. For example, the shape of the recognition target 22 determined by a predetermined standard, the range of values that can be taken by the specific information (eg, numeric values 1 to 3), the notation mode of the specific information (eg, Arabic numerals, Chinese numerals, alphabets, Katakana, hiragana, kanji, etc.) may be used to identify the target 22 to be recognized existing in the image, or to recognize specific information possessed by the target 22 to be recognized.

算出部13は、画像認識部12が認識した特定情報に基づいて、当該特定情報の統計値を算出する。統計値としては、合計値、最大値、最小値、最頻値、平均値、分散値などが考えられる。例えば、画像認識部12が図3に示すような被認識媒体20を撮像した画像データに対して画像認識処理を行い、12個の認識対象22各々が有する数値(1〜3のいずれか)を個別に認識すると、算出部13はそれらの数値の統計値を算出する。算出部13が算出した統計値は、当該被認識媒体20に付された特定情報が所定の条件を満たすか否かを判定するために利用される。   The calculation unit 13 calculates a statistical value of the specific information based on the specific information recognized by the image recognition unit 12. As the statistical value, a total value, a maximum value, a minimum value, a mode value, an average value, a variance value, and the like can be considered. For example, the image recognition unit 12 performs image recognition processing on the image data obtained by capturing the recognized medium 20 as shown in FIG. 3, and sets the numerical value (any one of 1 to 3) of each of the 12 recognition targets 22. When individually recognized, the calculation unit 13 calculates a statistical value of those numerical values. The statistical value calculated by the calculation unit 13 is used to determine whether the specific information attached to the recognized medium 20 satisfies a predetermined condition.

なお、算出部13は、算出した統計値が所定の条件(例:所定の値以上)を満たすか否かをさらに判定してもよい。算出部13による判定結果は、ユーザに向けて出力されてもよい。出力手段は特段制限されず、ディスプレイ、スピーカ、メール、プリンター、通知用ライト(例:所定の条件を満たす時点灯)などのあらゆる出力装置を用いて実現することができる。   Note that the calculation unit 13 may further determine whether or not the calculated statistical value satisfies a predetermined condition (eg, a predetermined value or more). The determination result by the calculation unit 13 may be output to the user. The output means is not particularly limited, and can be realized by using any output device such as a display, a speaker, an e-mail, a printer, a notification light (eg, lighting when a predetermined condition is satisfied), and the like.

ここで、図15のフローチャートを用いて、本実施形態の画像認識装置10の処理の流れの一例を説明する。   Here, an example of the flow of processing of the image recognition apparatus 10 of the present embodiment will be described using the flowchart of FIG.

S10では、画像取得部11が、特定情報を含む認識対象22が1つ又は複数付された被認識媒体20を撮像した画像のデータを取得する。例えば、画像取得部11は、外部機器との通信により、外部機器が撮像した画像のデータ、又は、外部機器に記憶されている画像のデータを取得する。または、画像取得部11は、ユーザ操作に応じて、自己が有するカメラ機能を起動して被認識媒体20を撮像した画像のデータを生成し、当該画像のデータを取得する。   In S <b> 10, the image acquisition unit 11 acquires image data obtained by capturing the recognized medium 20 to which one or more recognition targets 22 including specific information are attached. For example, the image acquisition unit 11 acquires image data captured by the external device or image data stored in the external device through communication with the external device. Alternatively, the image acquisition unit 11 activates a camera function of the image acquisition unit 11 to generate image data of the recognized medium 20 and acquires the image data.

S20では、画像認識部12が、S10で画像取得部11により取得された画像のデータに対して画像認識処理を行い、画像内に存在する認識対象22各々の特定情報を認識する。   In S20, the image recognition unit 12 performs image recognition processing on the image data acquired by the image acquisition unit 11 in S10, and recognizes specific information of each recognition target 22 existing in the image.

S30では、算出部13が、S20で画像認識部12により認識された特定情報に基づいて、当該特定情報の統計値を算出する。その後、算出部13は、S30で算出した統計値が所定の条件を満たすか判定し、判定結果をユーザに向けて出力してもよい。判定結果の出力は、ディスプレイ、スピーカ、メール、プリンター、通知用ライトなどのあらゆる出力装置を利用することができる。   In S30, the calculation unit 13 calculates a statistical value of the specific information based on the specific information recognized by the image recognition unit 12 in S20. Thereafter, the calculation unit 13 may determine whether the statistical value calculated in S30 satisfies a predetermined condition, and output the determination result to the user. For output of the determination result, any output device such as a display, a speaker, an e-mail, a printer, and a notification light can be used.

以上説明した本実施形態の画像認識装置10によれば、コンピュータ処理により、所定の媒体に付された情報が所定の条件を満たすか否かを判定する作業の助けとなる情報を生成することができる。当該判定作業を行うユーザが本実施形態の画像認識装置10を用いた場合、ユーザは、被認識媒体20を撮像した画像を画像認識装置10に入力し、判定作業を行わせる操作を行うだけでよい。すなわち、ユーザは、特定情報の内容を認識したり、それらが所定の条件を満たすか否か判定したりする必要はない。結果、作業効率を向上させることができるほか、認識ミス、判定ミス等の人為的なミスを軽減することが可能となる。   According to the image recognition apparatus 10 of the present embodiment described above, it is possible to generate information that assists in the work of determining whether or not information attached to a predetermined medium satisfies a predetermined condition by computer processing. it can. When the user who performs the determination work uses the image recognition apparatus 10 of the present embodiment, the user simply inputs an image obtained by capturing the recognized medium 20 to the image recognition apparatus 10 and performs an operation for performing the determination work. Good. That is, the user does not need to recognize the contents of the specific information or determine whether or not they satisfy a predetermined condition. As a result, work efficiency can be improved, and human errors such as recognition errors and determination errors can be reduced.

<第2の実施形態>
本実施形態の画像認識装置10は、被認識媒体20を撮像した動画像データを取得し、複数のフレームのデータに対して画像認識処理を行った後、複数のフレームのデータ各々に対応する画像認識処理の結果に基づいて、被認識媒体20に付された特定情報の統計値を決定する点で、第1の実施形態と異なる。その他の構成は、第1の実施形態と同様である。
<Second Embodiment>
The image recognition apparatus 10 according to the present embodiment acquires moving image data obtained by capturing the recognized medium 20, performs image recognition processing on a plurality of frames of data, and then images corresponding to the plurality of frames of data. The difference from the first embodiment is that the statistical value of the specific information attached to the recognized medium 20 is determined based on the result of the recognition process. Other configurations are the same as those of the first embodiment.

図4に、本実施形態の画像認識装置10の機能ブロック図の一例を示す。図示するように、画像認識装置10は、画像取得部11と、画像認識部12と、算出部13と、決定部14とを有する。   FIG. 4 shows an example of a functional block diagram of the image recognition apparatus 10 of the present embodiment. As illustrated, the image recognition device 10 includes an image acquisition unit 11, an image recognition unit 12, a calculation unit 13, and a determination unit 14.

画像取得部11は、被認識媒体20を撮像した動画像データ(以下、「動画像データ」)を取得する。すなわち、画像取得部11は、被認識媒体20を撮像した複数のフレームのデータを取得する。画像取得部11は、動画像を撮像する機能を備えており、被認識媒体20の動画像を撮像することで、動画像データの取得を実現してもよい。または、画像取得部11は、無線及び/又は有線での通信により、外部機器から動画像データを取得してもよい。外部機器から動画像データを取得する場合、画像取得部11は、外部機器である撮像装置(不図示)が撮像した動画像データをリアルタイム処理で取得してもよいし、バッチ処理で取得してもよい。   The image acquisition unit 11 acquires moving image data obtained by capturing the recognized medium 20 (hereinafter “moving image data”). That is, the image acquisition unit 11 acquires data of a plurality of frames obtained by imaging the recognized medium 20. The image acquisition unit 11 has a function of capturing a moving image, and may acquire moving image data by capturing a moving image of the recognized medium 20. Alternatively, the image acquisition unit 11 may acquire moving image data from an external device by wireless and / or wired communication. When acquiring moving image data from an external device, the image acquisition unit 11 may acquire moving image data captured by an imaging device (not shown), which is an external device, by real-time processing or by batch processing. Also good.

画像認識部12は、画像取得部11が取得した複数のフレームのデータに対して画像認識処理を行う。そして、画像認識部12は、複数のフレーム各々の中に存在する認識対象各々の特定情報を認識する。画像認識部12は、画像取得部11が取得した複数のフレームのデータすべてに対して画像認識処理を行ってもよいし、一部の複数のフレームのデータに対してのみ行ってもよい。後者の例としては、例えば撮像順に時系列に複数のフレームのデータを並べ、所定数おきのフレームを画像認識処理対象としてもよい。   The image recognition unit 12 performs image recognition processing on the data of a plurality of frames acquired by the image acquisition unit 11. And the image recognition part 12 recognizes the specific information of each recognition object which exists in each of a some flame | frame. The image recognition unit 12 may perform image recognition processing on all the data of a plurality of frames acquired by the image acquisition unit 11, or may perform only on data of some of the plurality of frames. As an example of the latter, for example, data of a plurality of frames may be arranged in time series in the imaging order, and every predetermined number of frames may be set as an image recognition processing target.

ここで、図5に、画像認識部12により出力される情報の一例を模式的に示す。図5に示す情報は、フレームIDに、被認識媒体20のID、認識対象22のID、画像認識部12が認識した特定情報の値、当該値の信頼度を対応付けた情報である。   Here, FIG. 5 schematically shows an example of information output by the image recognition unit 12. The information shown in FIG. 5 is information in which the ID of the recognized medium 20, the ID of the recognition target 22, the value of the specific information recognized by the image recognition unit 12, and the reliability of the value are associated with the frame ID.

フレームIDは、画像認識部12が画像認識処理を行ったフレームのデータに対して所定の規則に従って付したIDである。被認識媒体20のIDは、画像認識部12が画像認識処理を行ったフレームから抽出した被認識媒体20に、所定の規則に従って付したIDである。原則、1つのフレームには1つの被認識媒体20が撮像されているものとする。以下の実施形態で一例を説明するが、画像認識装置10は、例えば時間的に前後する2つのフレーム間のデータの差分などに基づいて、撮像されている被認識媒体20が切り替わったことを判断する機能を備えてもよい。そして、被認識媒体20が切り替わったと判断すると、新たな被認識媒体20に対して所定の規則に従い新たなIDを付与してもよい。   The frame ID is an ID assigned to data of a frame that has been subjected to image recognition processing by the image recognition unit 12 according to a predetermined rule. The ID of the recognized medium 20 is an ID given to the recognized medium 20 extracted from the frame subjected to the image recognition processing by the image recognition unit 12 according to a predetermined rule. In principle, it is assumed that one recognized medium 20 is captured in one frame. An example will be described in the following embodiment, but the image recognition apparatus 10 determines that the recognized recognition medium 20 has been switched based on, for example, a difference in data between two frames that are temporally changed. The function to perform may be provided. When it is determined that the recognized medium 20 has been switched, a new ID may be assigned to the new recognized medium 20 according to a predetermined rule.

認識対象IDは、画像認識部12がフレームのデータから抽出した1つ又は複数の認識対象22各々に所定の規則に従って付したIDである。画像認識部12は、所定のフレームのデータから認識対象22を抽出してIDを付した後に、時間的にそれ以降のフレームのデータに対して画像認識処理を行う際は、IDを付した認識対象22各々の位置を追跡することで、複数のフレームのデータに跨って存在する認識対象22の対応関係を把握することができる。複数のフレームのデータに跨って存在する認識対象22の対応関係を把握する手段はこれに限定されず、あらゆる技術を利用することができる。また、画像認識部12が認識した特定情報の値の信頼度を算出する手段は特段制限されず、あらゆる技術を利用することができる。   The recognition target ID is an ID assigned to each of one or more recognition targets 22 extracted from the frame data by the image recognition unit 12 according to a predetermined rule. When the image recognition unit 12 extracts the recognition target 22 from the data of a predetermined frame and attaches the ID, and then performs image recognition processing on the data of the subsequent frames in time, the recognition with the ID attached By tracking the position of each of the objects 22, it is possible to grasp the correspondence relationship of the recognition objects 22 existing across a plurality of frames of data. The means for grasping the correspondence relationship of the recognition target 22 existing across the data of a plurality of frames is not limited to this, and any technique can be used. The means for calculating the reliability of the value of the specific information recognized by the image recognition unit 12 is not particularly limited, and any technique can be used.

図4に戻り、算出部13は、画像認識部12により出力される情報(例:図5)を利用して、複数のフレームのデータ各々に対応する統計値を算出する。   Returning to FIG. 4, the calculation unit 13 uses the information output from the image recognition unit 12 (for example, FIG. 5) to calculate a statistical value corresponding to each of data of a plurality of frames.

ここで、図6に、算出部13により出力される情報の一例を模式的に示す。図6に示す情報は、フレームIDに、被認識媒体20のID、算出部13が算出した統計値、統計値の信頼度を対応付けた情報である。図示する統計値の信頼度は、各フレームに含まれる複数の認識対象22各々の認識結果(値)の信頼度(例:図5)の平均値である。なお、平均値に代えて、合計値等の他の統計値とすることもできる。   Here, FIG. 6 schematically illustrates an example of information output by the calculation unit 13. The information illustrated in FIG. 6 is information in which the ID of the recognized medium 20, the statistical value calculated by the calculation unit 13, and the reliability of the statistical value are associated with the frame ID. The reliability of the statistical value shown in the figure is an average value of the reliability (example: FIG. 5) of the recognition result (value) of each of the plurality of recognition objects 22 included in each frame. In addition, it can replace with an average value and can also set it as other statistical values, such as a total value.

図4に戻り、決定部14は、複数のフレームのデータ各々に対する画像認識処理の結果に基づいて、被認識媒体20の統計値を決定する。すなわち、決定部14は、算出部13により出力される情報(例:図6)を利用して、各被認識媒体20の統計値を決定する。   Returning to FIG. 4, the determination unit 14 determines the statistical value of the recognized medium 20 based on the result of the image recognition processing for each of a plurality of frames of data. That is, the determination unit 14 determines the statistical value of each recognized medium 20 using the information output from the calculation unit 13 (example: FIG. 6).

例えば、決定部14は、第1の被認識媒体20に対応づけられた複数のフレーム各々に対応する統計値の中の最大値、最小値、平均値、又は、最頻値を、第1の被認識媒体の統計値として決定してもよい。その他、決定部14は、統計値の信頼度が最も高いフレームに対応する統計値を、第1の被認識媒体の統計値として決定してもよい。なお、決定部14は、算出部13が算出した複数のフレームのデータ各々に対する統計値のすべてを利用して上記決定処理を行ってもよいし、一部を利用して上記決定処理を行ってもよい。   For example, the determination unit 14 sets the maximum value, the minimum value, the average value, or the mode value among the statistical values corresponding to each of the plurality of frames associated with the first recognized medium 20 as the first value. You may determine as a statistical value of a to-be-recognized medium. In addition, the determination unit 14 may determine the statistical value corresponding to the frame having the highest statistical value reliability as the statistical value of the first recognized medium. The determination unit 14 may perform the determination process using all of the statistical values for each of the data of the plurality of frames calculated by the calculation unit 13, or may perform the determination process using a part thereof. Also good.

ここで、図7に、決定部14により出力される情報の一例を模式的に示す。図7に示す情報は、被認識媒体20のIDに、決定部14が決定した統計値(最終統計値)を対応付けた情報である。   Here, FIG. 7 schematically illustrates an example of information output by the determination unit 14. The information illustrated in FIG. 7 is information in which the ID of the recognized medium 20 is associated with the statistical value (final statistical value) determined by the determination unit 14.

なお、算出部13は、決定部14が決定した統計値が所定の条件(例:所定の値以上)を満たすか否かをさらに判定してもよい。算出部13による判定結果は、ユーザに向けて出力されてもよい。出力手段は特段制限されず、ディスプレイ、スピーカ、メール、プリンター、通知用ライトなどのあらゆる出力装置を用いて実現することができる。   The calculation unit 13 may further determine whether or not the statistical value determined by the determination unit 14 satisfies a predetermined condition (eg, a predetermined value or more). The determination result by the calculation unit 13 may be output to the user. The output means is not particularly limited, and can be realized by using any output device such as a display, a speaker, an email, a printer, a notification light, and the like.

ここで、図16のフローチャートを用いて、本実施形態の画像認識装置10の処理の流れの一例を説明する。   Here, an example of the flow of processing of the image recognition apparatus 10 of the present embodiment will be described using the flowchart of FIG.

S10では、画像取得部11が、特定情報を含む認識対象22が1つ又は複数付された被認識媒体20を撮像した動画像のデータを取得する。例えば、画像取得部11は、外部機器との通信により、外部機器が撮像した動画像のデータ、又は、外部機器に記憶されている動画像のデータを、リアルタイム処理又はバッチ処理で取得する。または、画像取得部11は、ユーザ操作に応じて、自己が有するカメラ機能を起動して被認識媒体20を撮像した動画像のデータを生成し、当該動画像のデータを取得する。   In S <b> 10, the image acquisition unit 11 acquires moving image data obtained by capturing the recognized medium 20 to which one or more recognition targets 22 including specific information are attached. For example, the image acquisition unit 11 acquires, by communication with an external device, moving image data captured by the external device or moving image data stored in the external device by real-time processing or batch processing. Alternatively, the image acquisition unit 11 activates a camera function of the image acquisition unit 11 to generate data of a moving image obtained by capturing the recognized medium 20, and acquires the data of the moving image.

S20では、画像認識部12が、S10で画像取得部11により取得された動画像のデータに対して画像認識処理を行い、画像内に存在する認識対象22各々の特定情報を認識する。   In S20, the image recognition unit 12 performs image recognition processing on the moving image data acquired by the image acquisition unit 11 in S10, and recognizes specific information of each recognition target 22 existing in the image.

S10において画像取得部11がリアルタイム処理で動画像のデータを外部機器から取得している場合、画像認識部12はリアルタイム処理で画像認識処理を行ってもよい。これに対し、S10において画像取得部11がバッチ処理で外部機器から動画像のデータを取得している場合、画像認識部12はバッチ処理で画像認識処理を行ってもよい。また、S10において画像取得部11が自己のカメラ機能により動画像データを生成している場合、画像取得部11による動画像の撮像と並行して、リアルタイム処理で画像認識処理を行ってもよいし、又は、画像取得部11による動画像の撮像が終了後、バッチ処理で画像認識処理を行ってもよい。   In S10, when the image acquisition unit 11 acquires moving image data from an external device by real-time processing, the image recognition unit 12 may perform image recognition processing by real-time processing. On the other hand, when the image acquisition unit 11 acquires moving image data from an external device in batch processing in S10, the image recognition unit 12 may perform image recognition processing in batch processing. Further, when the image acquisition unit 11 generates moving image data by using its own camera function in S10, the image recognition processing may be performed by real-time processing in parallel with the imaging of the moving image by the image acquisition unit 11. Alternatively, after the moving image is captured by the image acquisition unit 11, image recognition processing may be performed by batch processing.

S30では、算出部13が、S20で画像認識部12により認識された特定情報に基づいて、当該特定情報の統計値を算出する。S20において画像認識部12がリアルタイム処理で画像認識処理を行っている場合、算出部13はリアルタイム処理で統計値の算出を行ってもよい。一方、S20において画像認識部12がバッチ処理で画像認識処理を行っている場合、算出部13はバッチ処理で統計値の算出を行ってもよい。   In S30, the calculation unit 13 calculates a statistical value of the specific information based on the specific information recognized by the image recognition unit 12 in S20. When the image recognition unit 12 performs image recognition processing in real time processing in S20, the calculation unit 13 may calculate statistical values in real time processing. On the other hand, when the image recognition unit 12 performs the image recognition processing by batch processing in S20, the calculation unit 13 may calculate the statistical value by batch processing.

S40では、決定部14が、複数のフレームのデータ各々に対する画像認識処理の結果に基づいて、被認識媒体20の統計値を決定する。   In S <b> 40, the determination unit 14 determines the statistical value of the recognized medium 20 based on the result of the image recognition process for each of a plurality of frames of data.

S30において算出部13がリアルタイム処理で統計値を算出している場合、決定部14はリアルタイム処理で統計値の決定を行ってもよい。この場合、決定部14は、例えばその時点までに蓄積された画像認識処理の結果を利用して、被認識媒体20の統計値の決定を行う。そして、新たな画像認識処理の結果が追加されると、新たに追加されたデータを加えて、被認識媒体20の統計値を決定し直す。   When the calculation unit 13 calculates the statistical value by real-time processing in S30, the determination unit 14 may determine the statistical value by real-time processing. In this case, the determination unit 14 determines the statistical value of the recognized medium 20 using, for example, the results of the image recognition processing accumulated up to that point. When a new image recognition processing result is added, the newly added data is added to re-determine the statistical value of the recognized medium 20.

一方、S30において算出部13がバッチ処理で統計値を算出している場合、決定部14はバッチ処理で統計値の決定を行ってもよい。   On the other hand, when the calculation unit 13 calculates the statistical value by batch processing in S30, the determination unit 14 may determine the statistical value by batch processing.

S40の後、算出部13は、S40で決定部14が決定した統計値が所定の条件を満たすか判定し、判定結果をユーザに向けて出力してもよい。判定結果の出力は、ディスプレイ、スピーカ、メール、プリンター、通知用ライトなどのあらゆる出力装置を利用することができる。   After S40, the calculation unit 13 may determine whether the statistical value determined by the determination unit 14 in S40 satisfies a predetermined condition, and output the determination result to the user. For output of the determination result, any output device such as a display, a speaker, an e-mail, a printer, and a notification light can be used.

S40において決定部14がリアルタイム処理で統計値の決定を行っている場合、算出部13はリアルタイム処理で所定の条件を満たすか判定する処理を行い、その結果を出力してもよい。この場合、最新の判定結果のみを出力してもよい。   When the determination unit 14 determines the statistical value in real time processing in S40, the calculation unit 13 may perform processing for determining whether or not a predetermined condition is satisfied in real time processing, and output the result. In this case, only the latest determination result may be output.

一方、S40において決定部14がバッチ処理で統計値の決定を行っている場合、算出部13はバッチ処理で所定の条件を満たすか判定する処理を行い、その結果をまとめて出力してもよい。この場合、例えば、被認識媒体20毎の判定結果を示す一覧を出力してもよい。   On the other hand, when the determination unit 14 determines the statistical value in batch processing in S40, the calculation unit 13 may perform processing for determining whether or not a predetermined condition is satisfied in batch processing, and output the results collectively. . In this case, for example, a list indicating the determination result for each recognized medium 20 may be output.

以上説明した本実施形態の画像認識装置10によれば、第1の実施形態と同様の作用効果を実現することができる。また、複数のフレームのデータを利用した所定の処理により各被認識媒体20の統計値を決定することができるので、撮像された画像データ中に瞬間的にノイズ等が重畳しても、信頼度の高い統計値を算出することができる。   According to the image recognition device 10 of the present embodiment described above, the same operational effects as those of the first embodiment can be realized. In addition, since the statistical value of each recognized medium 20 can be determined by a predetermined process using data of a plurality of frames, reliability can be improved even if noise or the like is instantaneously superimposed on the captured image data. A high statistical value can be calculated.

<第3の実施形態>
本実施形態の画像認識装置10は、算出部13及び決定部14の構成が第2の実施形態と異なる。具体的には、第2の実施形態では、フレームのデータごとの統計値を算出した後、複数の統計値を利用して1つの統計値を決定した。これに対し、本実施形態では、複数のフレームのデータに跨って存在する各認識対象22の特定情報をフレームのデータ毎に認識した後、複数の認識結果を利用して、まず、認識対象22毎に1つの値(認識結果)を決定する。そして、認識対象22毎に決定した1つの値(認識結果)を利用して、ある被認識対象の統計値を算出する。その他の構成は、第2の実施形態と同様である。
<Third Embodiment>
The image recognition apparatus 10 according to the present embodiment is different from the second embodiment in the configuration of the calculation unit 13 and the determination unit 14. Specifically, in the second embodiment, after calculating a statistical value for each frame data, a single statistical value is determined using a plurality of statistical values. On the other hand, in this embodiment, after recognizing the specific information of each recognition target 22 that exists across data of a plurality of frames for each frame data, first, the recognition target 22 is used by using a plurality of recognition results. One value (recognition result) is determined every time. Then, a statistical value of a certain recognition target is calculated using one value (recognition result) determined for each recognition target 22. Other configurations are the same as those of the second embodiment.

本実施形態の画像認識装置10の機能ブロック図の一例は、第2の実施形態と同様に図4で示される。すなわち、図示するように、画像認識装置10は、画像取得部11と、画像認識部12と、算出部13と、決定部14とを有する。画像取得部11及び画像認識部12の構成は、第2の実施形態と同様であるので、ここでの説明は省略する。   An example of a functional block diagram of the image recognition apparatus 10 of the present embodiment is shown in FIG. 4 as in the second embodiment. That is, as illustrated, the image recognition device 10 includes an image acquisition unit 11, an image recognition unit 12, a calculation unit 13, and a determination unit 14. Since the configurations of the image acquisition unit 11 and the image recognition unit 12 are the same as those in the second embodiment, description thereof is omitted here.

算出部13は、認識対象22毎に、複数のフレームのデータ各々に対応する複数の画像認識処理の結果(各認識対象22が有する特定情報の認識結果)に基づいて一の特定情報を決定する。   For each recognition target 22, the calculation unit 13 determines one specific information based on a plurality of image recognition processing results (recognition results of specific information included in each recognition target 22) corresponding to each of a plurality of frames of data. .

すなわち、算出部13は、画像認識部12により出力される情報(例:図5)に含まれる、第1の被認識媒体20に対応付けられている複数の認識対象22のうち、まず、1つに着目する。そして、着目した認識対象22が有する複数の認識結果(図5の値。複数のフレーム各々の認識結果。)を利用して、着目した認識対象22に対応する1つの値(特定情報)を決定する。当該処理を第1の被認識媒体20に対応付けられている複数の認識対象22各々に対して行う。   That is, the calculation unit 13 first selects 1 out of a plurality of recognition targets 22 associated with the first recognized medium 20 included in the information (eg, FIG. 5) output from the image recognition unit 12. Focus on one. Then, one value (specific information) corresponding to the focused recognition target 22 is determined using a plurality of recognition results (values in FIG. 5; recognition results of each of the plurality of frames) of the focused recognition target 22. To do. This process is performed for each of the plurality of recognition targets 22 associated with the first recognized medium 20.

例えば、算出部13は、第1の被認識媒体20に対応付けられている第1の認識対象22の複数の認識結果(フレームごとの値。特定情報。)の中の最大値、最小値、平均値、又は、最頻値を、第1の認識対象の1つの値(特定情報)として決定してもよい。   For example, the calculation unit 13 includes a maximum value, a minimum value, and a plurality of recognition results (values for each frame. Specific information) of the first recognition target 22 associated with the first recognized medium 20. The average value or the mode value may be determined as one value (specific information) of the first recognition target.

ここで、図8に、算出部13によるここまでの処理により出力される情報の一例を模式的に示す。図8に示す情報は、被認識媒体20のIDに、認識対象22のID、算出部13が決定した各認識対象22の1つの値(特定情報)を対応付けている。   Here, FIG. 8 schematically shows an example of information output by the processing up to this point by the calculation unit 13. In the information illustrated in FIG. 8, the ID of the recognition target medium 20 is associated with the ID of the recognition target 22 and one value (specific information) of each recognition target 22 determined by the calculation unit 13.

その後、算出部13は、認識対象22毎に決定した1つの値(特定情報)に基づいて、被認識媒体20毎に統計値を算出する。統計値は、各被認識媒体20に対応付けられている複数の認識対象22の値(特定情報)の合計値、最大値、最小値、最頻値、平均値、分散値などが考えられる。   Thereafter, the calculation unit 13 calculates a statistical value for each recognized medium 20 based on one value (specific information) determined for each recognition target 22. As the statistical value, a total value, a maximum value, a minimum value, a mode value, an average value, a variance value, and the like of the values (specific information) of a plurality of recognition targets 22 associated with each recognized medium 20 can be considered.

決定部14は、算出部13が算出した統計値を、被認識媒体20の統計値として決定する。   The determination unit 14 determines the statistical value calculated by the calculation unit 13 as the statistical value of the recognized medium 20.

以上説明した本実施形態の画像認識装置10によれば、第1乃至第3の実施形態と同様の作用効果を実現することができる。また、複数のフレームのデータを利用した所定の処理により各被認識媒体20の統計値を決定することができるので、撮像された画像データ中に瞬間的にノイズ等が重畳しても、信頼度の高い統計値を算出することができる。   According to the image recognition device 10 of the present embodiment described above, the same operational effects as those of the first to third embodiments can be realized. In addition, since the statistical value of each recognized medium 20 can be determined by a predetermined process using data of a plurality of frames, reliability can be improved even if noise or the like is instantaneously superimposed on the captured image data. A high statistical value can be calculated.

<第4の実施形態>
本実施形態の画像認識装置10は、動画像データ中に含まれる被認識媒体20が切り替わったことを判断する機能を備える。その他の構成は、第2及び第3の実施形態と同様である。
<Fourth Embodiment>
The image recognition apparatus 10 according to the present embodiment has a function of determining that the recognized medium 20 included in the moving image data has been switched. Other configurations are the same as those of the second and third embodiments.

図9に、本実施形態の画像認識装置10の機能ブロック図の一例を示す。図示するように、画像認識装置10は、画像取得部11と、画像認識部12と、算出部13と、決定部14と、切替決定部15とを有する。画像取得部11、画像認識部12、算出部13及び決定部14の構成は、第2及び第3の実施形態と同様であるので、ここでの説明は省略する。   FIG. 9 shows an example of a functional block diagram of the image recognition apparatus 10 of the present embodiment. As illustrated, the image recognition device 10 includes an image acquisition unit 11, an image recognition unit 12, a calculation unit 13, a determination unit 14, and a switching determination unit 15. Since the configurations of the image acquisition unit 11, the image recognition unit 12, the calculation unit 13, and the determination unit 14 are the same as those in the second and third embodiments, description thereof is omitted here.

切替決定部15は、複数のフレームのデータ、及び、画像認識処理の結果の少なくとも一方に基づいて、フレームのデータ内に存在する被認識媒体20が他の被認識媒体20に切り替わったことを判定する。判定手段は特段制限されず、あらゆる技術を採用することができる。以下一例を説明するが、これに限定されない。   The switching determination unit 15 determines that the recognized medium 20 existing in the frame data is switched to another recognized medium 20 based on at least one of the data of a plurality of frames and the result of the image recognition process. To do. The determination means is not particularly limited, and any technique can be adopted. An example will be described below, but the present invention is not limited to this.

例えば、切替決定部15は、複数のフレームのデータ(動画像データ)内において時間的な位置関係が互いに前後する(隣接する)2つのフレームのデータ各々に対応する統計値(画像認識処理の結果)の差分が所定の閾値以上となると、被認識媒体20が切り替わったと判定してもよい。または、上記2つのフレームのデータ各々に対応する複数の認識対象22各々の値の組み合わせの差分が所定の閾値以上となると、被認識媒体20が切り替わったと判定してもよい。その他、フレーム内に入ってきた被認識媒体20を特定した後、当該被認識媒体20の移動を追跡してもよい。そして、当該被認識媒体20がフレーム外に移動した後に、1つの被認識媒体20がフレーム内に入ってくると、被認識媒体20が切り替わったと判定してもよい。   For example, the switching determination unit 15 includes statistical values (results of image recognition processing) corresponding to data of two frames whose temporal positional relations are adjacent to each other (adjacent) in the data (moving image data) of a plurality of frames. ) May be determined that the recognized medium 20 has been switched. Alternatively, it may be determined that the recognized medium 20 has been switched when the difference between the combinations of the values of the plurality of recognition targets 22 corresponding to the data of the two frames is equal to or greater than a predetermined threshold. In addition, after identifying the recognized medium 20 that has entered the frame, the movement of the recognized medium 20 may be tracked. Then, when one recognized medium 20 enters the frame after the recognized medium 20 moves out of the frame, it may be determined that the recognized medium 20 has been switched.

本実施形態によれば、第1乃至第3の実施形態と同様の作用効果を実現することができる。また、複数の被認識媒体20を連続的に動画像として撮像した場合であっても、複数の被認識媒体20各々を個別に識別し、各々の統計値を算出することができる。   According to the present embodiment, it is possible to achieve the same operational effects as the first to third embodiments. Further, even when a plurality of recognized media 20 are continuously captured as moving images, each of the plurality of recognized media 20 can be individually identified and the respective statistical values can be calculated.

<第5の実施形態>
本実施形態の画像認識装置10は、所定の条件を満たす被認識媒体20の数を特定するための情報を外部機器に送信する機能を有する。その他の構成は、第2乃至第4の実施形態と同様である。
<Fifth Embodiment>
The image recognition apparatus 10 of this embodiment has a function of transmitting information for specifying the number of recognized media 20 that satisfy a predetermined condition to an external device. Other configurations are the same as those of the second to fourth embodiments.

図10に、本実施形態の画像認識装置10の機能ブロック図の一例を示す。図示するように、画像認識装置10は、画像取得部11と、画像認識部12と、算出部13と、決定部14と、切替決定部15と、送信部16とを有する。画像取得部11、画像認識部12、算出部13、決定部14及び切替決定部15の構成は、第2及び第4の実施形態と同様であるので、ここでの説明は省略する。   FIG. 10 shows an example of a functional block diagram of the image recognition apparatus 10 of the present embodiment. As illustrated, the image recognition device 10 includes an image acquisition unit 11, an image recognition unit 12, a calculation unit 13, a determination unit 14, a switching determination unit 15, and a transmission unit 16. Since the configurations of the image acquisition unit 11, the image recognition unit 12, the calculation unit 13, the determination unit 14, and the switching determination unit 15 are the same as those in the second and fourth embodiments, description thereof is omitted here.

送信部16は、決定部14が決定した統計値が所定の条件を満たす被認識媒体20の数を特定するための情報(以下、「特定情報」)を外部機器に送信する。   The transmission unit 16 transmits information (hereinafter, “specific information”) for specifying the number of recognized media 20 for which the statistical value determined by the determination unit 14 satisfies a predetermined condition to an external device.

特定情報は、図7に示すような決定部14が決定した各被認識媒体20の統計値であってもよい。当該情報を受信した外部機器は、当該情報を利用して所定の条件(例:統計値が20以上)を満たす認識対象22を抽出し、その数をカウントすることができる。   The specific information may be a statistical value of each recognized medium 20 determined by the determination unit 14 as illustrated in FIG. The external device that has received the information can extract recognition targets 22 that satisfy a predetermined condition (for example, a statistical value of 20 or more) by using the information, and can count the number.

その他の例として、特定情報は、図7に示すような決定部14が決定した各被認識媒体20の統計値を利用して算出された、所定の条件を満たす被認識媒体20の数(カウント値)そのものであってもよい。すなわち、画像認識装置10が、所定の条件を満たす被認識媒体20の数(カウント値)をカウントし、その結果を特定情報として外部機器に送信してもよい。かかる場合、画像認識装置10は、所定の条件を満たす被認識媒体20の数(カウント値)をカウントする手段を備えることができる。   As another example, the specific information is the number (count) of the recognized media 20 that satisfies a predetermined condition calculated using the statistical value of each recognized media 20 determined by the determining unit 14 as shown in FIG. Value) itself. That is, the image recognition apparatus 10 may count the number (count value) of the recognized media 20 that satisfies a predetermined condition, and transmit the result to the external device as specific information. In such a case, the image recognition apparatus 10 can include a unit that counts the number (count value) of the recognized media 20 that satisfies a predetermined condition.

本実施形態によれば、外部機器は、所定の条件を満たした被認識媒体20の数を把握することができる。   According to this embodiment, the external device can grasp the number of recognized media 20 that satisfy a predetermined condition.

例えば、第1の実施形態で説明した適用場面の例のように、所定の条件を満たす被認識媒体20と引き換えに所定の商品を提供するサービスを行っている場合、当該サービスの提供者は、送信部16から送信されてきた特定情報を利用して、顧客に提供された商品の数や在庫の数を把握し、今後の生産計画などに反映させることができる。結果、商品が不足するなどの不都合を回避することができる。   For example, as in the example of the application scene described in the first embodiment, when a service is provided that provides a predetermined product in exchange for a recognized medium 20 that satisfies a predetermined condition, the provider of the service Using the specific information transmitted from the transmission unit 16, the number of products and the number of inventory provided to the customer can be grasped and reflected in future production plans and the like. As a result, inconveniences such as a shortage of products can be avoided.

<第6の実施形態>
本実施形態の画像認識装置10は、画像取得部11が取得した画像データをディスプレイ6Aに表示するとともに、あわせて、当該画像データに含まれる被認識媒体20に対する画像認識処理の結果をディスプレイ6Aに表示する。その他の構成は、第1乃至第5の実施形態と同様である。
<Sixth Embodiment>
The image recognition apparatus 10 of the present embodiment displays the image data acquired by the image acquisition unit 11 on the display 6A, and also displays the result of the image recognition processing for the recognized medium 20 included in the image data on the display 6A. indicate. Other configurations are the same as those of the first to fifth embodiments.

図11に、本実施形態の画像認識装置10の機能ブロック図の一例を示す。図示するように、画像認識装置10は、画像取得部11と、画像認識部12と、算出部13と、特定部17と、出力部18とを有する。なお、図示しないが、決定部14、切替決定部15、送信部16をさらに有してもよい。画像取得部11、画像認識部12、算出部13、決定部14、切替決定部15及び送信部16の構成は、第1乃至第5の実施形態と同様である。   FIG. 11 shows an example of a functional block diagram of the image recognition apparatus 10 of the present embodiment. As illustrated, the image recognition device 10 includes an image acquisition unit 11, an image recognition unit 12, a calculation unit 13, a specification unit 17, and an output unit 18. In addition, although not illustrated, you may further have the determination part 14, the switching determination part 15, and the transmission part 16. FIG. The configurations of the image acquisition unit 11, the image recognition unit 12, the calculation unit 13, the determination unit 14, the switching determination unit 15, and the transmission unit 16 are the same as those in the first to fifth embodiments.

画像認識部12は、第1の実施形態で説明したように、認識対象22各々から認識した特定情報各々の認識信頼度を示す信頼度情報を算出する(例:図5)。また、画像認識部12は、画像データ中から抽出した認識対象22各々の位置情報を特定してもよい。位置情報は、画像データ中に定められた2次元座標の座標データで示された情報であってもよい。   As described in the first embodiment, the image recognition unit 12 calculates reliability information indicating the recognition reliability of each specific information recognized from each recognition target 22 (example: FIG. 5). Further, the image recognition unit 12 may specify position information of each recognition target 22 extracted from the image data. The position information may be information indicated by coordinate data of two-dimensional coordinates defined in the image data.

特定部17は、認識信頼度が予め定められた所定レベル以下の認識対象22を特定する。出力部18は、画像取得部11が取得した画像のデータを用いて被認識媒体20をディスプレイ6Aに表示するとともに、特定手部17が特定した認識対象22を他の認識対象22と識別する情報を出力する。   The specifying unit 17 specifies the recognition target 22 whose recognition reliability is equal to or lower than a predetermined level. The output unit 18 displays the recognized medium 20 on the display 6 </ b> A using the image data acquired by the image acquisition unit 11, and information for identifying the recognition target 22 specified by the specific hand unit 17 from other recognition targets 22. Is output.

ここで、図12に、出力部18がディスプレイ6Aに表示する情報の一例を模式的に示す。   Here, FIG. 12 schematically shows an example of information that the output unit 18 displays on the display 6A.

図12に示すようにディスプレイ6Aには、撮像画像表示領域31と、認識結果表示領域32とを含む画像が表示されている。   As shown in FIG. 12, an image including a captured image display area 31 and a recognition result display area 32 is displayed on the display 6A.

撮像画像表示領域31には、画像取得部11が取得した画像データが表示される。画像データは静止画像のデータであってもよいし、動画像のデータであってもよい。動画像のデータの場合、出力部18は、リアルタイム処理で、画像取得部11が取得した動画像のデータを撮像画像表示領域31に表示してもよい。   In the captured image display area 31, image data acquired by the image acquisition unit 11 is displayed. The image data may be still image data or moving image data. In the case of moving image data, the output unit 18 may display the moving image data acquired by the image acquisition unit 11 in the captured image display area 31 by real-time processing.

出力部18は、図示するように、撮像画像表示領域31に表示した画像データに重畳して、認識対象表示マーク33を表示する。認識対象表示マーク33は、画像認識装置10が認識対象22として認識している認識対象22を示すための情報である。すなわち、認識対象表示マーク33により囲まれている認識対象22は、画像認識装置10に認識対象22として認識されている。画像認識部12が算出した各認識対象22の位置情報を利用して、認識対象表示マーク33を表示すべき位置を特定することができる。このような認識対象表示マーク33により、ユーザは、どの認識対象22が正しく認識され、どの認識対象22が正しく認識されていないかを把握することができる。   As illustrated, the output unit 18 displays a recognition target display mark 33 so as to be superimposed on the image data displayed in the captured image display area 31. The recognition target display mark 33 is information for indicating the recognition target 22 recognized as the recognition target 22 by the image recognition apparatus 10. That is, the recognition target 22 surrounded by the recognition target display mark 33 is recognized as the recognition target 22 by the image recognition apparatus 10. Using the position information of each recognition target 22 calculated by the image recognition unit 12, the position where the recognition target display mark 33 should be displayed can be specified. With such a recognition target display mark 33, the user can grasp which recognition target 22 is correctly recognized and which recognition target 22 is not correctly recognized.

また、認識対象表示マーク33は、認識している特定情報の内容(図の場合、1、2、3のいずれか)に応じて表示態様が異なる。図示する例の場合、特定情報の内容に応じて、認識対象表示マーク33の形状が異なっている。特定情報が「1」と認識されている認識対象22は、四角の認識対象表示マーク33で囲まれている。特定情報が「2」と認識されている認識対象22は、三角の認識対象表示マーク33で囲まれている。特定情報が「3」と認識されている認識対象22は、丸の認識対象表示マーク33で囲まれている。ユーザは、認識対象表示マーク33の形状により、各認識対象22の特定情報がどのように認識されているのかを把握することができる。   Further, the display mode of the recognition target display mark 33 differs depending on the content of the specific information recognized (in the case of the figure, 1, 2, or 3). In the illustrated example, the shape of the recognition target display mark 33 differs depending on the content of the specific information. The recognition target 22 whose specific information is recognized as “1” is surrounded by a square recognition target display mark 33. The recognition target 22 whose specific information is recognized as “2” is surrounded by a triangular recognition target display mark 33. The recognition target 22 whose specific information is recognized as “3” is surrounded by a round recognition target display mark 33. The user can grasp how the specific information of each recognition target 22 is recognized by the shape of the recognition target display mark 33.

なお、認識している特定情報の内容に応じて認識対象表示マーク33の表示態様を異ならせる手法は図12に示す形状の変化に限定されず、色の変化、線種(点線、破線等)の変化など、あらゆる手法を採用することができる。   Note that the method of changing the display mode of the recognition target display mark 33 according to the content of the recognized specific information is not limited to the shape change shown in FIG. 12, and the color change, line type (dotted line, broken line, etc.) Any method can be employed, such as changes in

認識結果表示領域32には、画像認識部12による認識結果及び算出部13による算出結果(統計値)が表示される。   In the recognition result display area 32, the recognition result by the image recognition unit 12 and the calculation result (statistical value) by the calculation unit 13 are displayed.

ところで、図12に示すように、認識対象22の中に欠損部分を有する認識対象22´が存在するなどの理由により、ある認識対象22から認識した特定情報の認識信頼度が所定のレベル以下となる場合がある。出力部18は、認識信頼度が所定レベル以下である認識対象22を、他の認識対象22と識別可能に表示する。例えば、図示する欠損部分を有する認識対象22´の認識信頼度が所定レベル以下であるとする。かかる場合、出力部18は、欠損部分を有する認識対象22´を他の認識対象22と識別可能に表示する。識別可能に表示する手段は特段制限されないが、例えば、図示するように、認識信頼度が所定のレベル以下である認識対象22のみを点滅表示するなどして強調表示してもよい。ユーザは、当該表示により、認識信頼度が所定のレベル以下である認識対象22を容易に把握することができる。そして、その認識対象22の特定情報の認識内容が正しいか、特に注意して確認することができる。   By the way, as shown in FIG. 12, the recognition reliability of the specific information recognized from a certain recognition target 22 is below a predetermined level due to the presence of a recognition target 22 ′ having a missing part in the recognition target 22. There is a case. The output unit 18 displays the recognition target 22 whose recognition reliability is equal to or lower than a predetermined level so that it can be distinguished from other recognition targets 22. For example, it is assumed that the recognition reliability of the recognition target 22 ′ having the missing portion shown in the figure is below a predetermined level. In such a case, the output unit 18 displays the recognition target 22 ′ having a missing portion so as to be distinguishable from other recognition targets 22. The means for displaying the information in an identifiable manner is not particularly limited. For example, as shown in the figure, only the recognition target 22 whose recognition reliability is equal to or lower than a predetermined level may be highlighted and displayed. From the display, the user can easily grasp the recognition target 22 whose recognition reliability is equal to or lower than a predetermined level. Then, it can be confirmed with particular care whether the recognition content of the specific information of the recognition target 22 is correct.

さらに、認識対象22の状態によっては、認識対象22としては認識できるものの、特定情報を全く認識できない場合が存在し得る。出力部18は、このような認識対象22を、さらに他の認識対象22と識別可能に表示してもよい。例えば、出力部22は、複数の認識対象22を、所定のレベルより高い信頼度で認識している認識対象22、所定のレベル以下の信頼度で認識している認識対象22、及び、特定情報を全く認識できない認識対象22の中の何れに該当するのか識別可能に表示してもよい。識別可能に表示する手法は特段制限されない。   Furthermore, depending on the state of the recognition target 22, there may be a case where the recognition target 22 can be recognized but the specific information cannot be recognized at all. The output unit 18 may display such a recognition target 22 so that it can be further distinguished from other recognition targets 22. For example, the output unit 22 recognizes a plurality of recognition objects 22 with a reliability higher than a predetermined level, a recognition object 22 recognized with a reliability lower than a predetermined level, and specific information. May be displayed so as to be identifiable as to which of the recognition targets 22 cannot be recognized at all. There is no particular limitation on the method for displaying the information in an identifiable manner.

なお、図12に示す例の場合、欠損部分を有する認識対象22´の特定情報の認識内容は正しいが、図13に示すように誤って認識される場合がある。図13に示す例の場合、欠損部分を有する認識対象22´の特定情報が三角の認識対象表示マーク33で囲まれていることから、「2」と認識されていることが分かる。このような場合、ユーザは、間違っている特定情報の内容を修正することができてもよい。これを実現するため、画像認識装置10は、特定情報の訂正を受付ける訂正受付部をさらに有してもよい。訂正受付部は、出力部18により、画像認識部12が認識した特定情報を識別可能に出力されている認識対象22(図13の場合、認識対象表示マーク33の表示態様により、画像認識部12が認識している特定情報を識別可能に表示されている認識対象22)の中の1つを選択して、画像認識部12が認識している特定情報を訂正する入力を受付ける。   In the case of the example shown in FIG. 12, the recognition content of the specific information of the recognition target 22 ′ having the missing portion is correct, but may be erroneously recognized as shown in FIG. 13. In the case of the example shown in FIG. 13, it can be seen that “2” is recognized because the specific information of the recognition target 22 ′ having the missing portion is surrounded by the triangular recognition target display mark 33. In such a case, the user may be able to correct the content of the specific information that is wrong. In order to realize this, the image recognition apparatus 10 may further include a correction reception unit that receives correction of specific information. The correction receiving unit is configured to recognize the specific information recognized by the image recognition unit 12 by the output unit 18 so that the specific information recognized by the output unit 18 (in the case of FIG. One of the recognition targets 22) displayed so as to be able to identify the specific information recognized by the image recognition unit 22) is selected, and an input for correcting the specific information recognized by the image recognition unit 12 is received.

例えば、ユーザは、図13に示す画面において、認識されている特定情報の内容が間違っている認識対象22に対応する認識対象表示マーク33を選択する入力操作を行う。当該入力操作はディスプレイ6A上の対象となる認識対象表示マーク33が表示されている位置をタッチする操作であってもよいし、その他の操作であってもよい。訂正受付部が当該入力操作を受付けると、出力部18は、図14に示すように、ディスプレイ6Aに修正受付領域34を新たに表示する。訂正受付部は、修正受付領域34を介して特定情報を修正する入力を受付けてもよい。   For example, on the screen shown in FIG. 13, the user performs an input operation to select a recognition target display mark 33 corresponding to the recognition target 22 in which the content of the recognized specific information is incorrect. The input operation may be an operation of touching a position where the recognition target display mark 33 as a target on the display 6A is displayed, or may be another operation. When the correction acceptance unit accepts the input operation, the output unit 18 newly displays the correction acceptance region 34 on the display 6A as shown in FIG. The correction reception unit may receive an input for correcting the specific information via the correction reception area 34.

ユーザは、撮像画像表示領域31に表示された画像データを観察することで、欠損部分を有する認識対象22´の特定情報は「3」であることを認識し、修正受付領域23における変更後の特定情報として「3」を選択する。図の場合、変更後の特定情報として入力されている値に応じて、撮像画像表示領域31における欠損部分を有する認識対象22´を囲っている認識対象表示マーク33の表示態様、及び、認識結果表示領域32の表示内容が変更されている。なお、出力部18は、修正対象として選択されている認識対象22(又はそれを囲っている認識対象表示マーク33)を、他の認識対象22(認識信頼度が所定のレベルより高い認識対象22、及び、認識信頼度が所定のレベル以下であるその他の認識対象22)と識別可能に表示してもよい。   By observing the image data displayed in the captured image display area 31, the user recognizes that the specific information of the recognition target 22 ′ having a missing portion is “3”, and the modified reception area 23 is changed. “3” is selected as the specific information. In the case of the figure, the display mode of the recognition target display mark 33 surrounding the recognition target 22 ′ having the missing portion in the captured image display area 31 according to the value input as the specific information after the change, and the recognition result The display content of the display area 32 has been changed. The output unit 18 selects the recognition target 22 selected as the correction target (or the recognition target display mark 33 surrounding it) as another recognition target 22 (recognition target 22 with a recognition reliability higher than a predetermined level). , And other recognition objects 22) whose recognition reliability is below a predetermined level may be displayed in a distinguishable manner.

ここで、本実施形態の変形例を説明する。本実施形態の画像認識装置10は、特定情報の統計値を算出する構成(算出部13)を備えなくてもよい。かかる場合、出力部18は、図12、図13及び図14に示す認識結果表示領域32内の合計値を表示しない。その他の構成は、上述した本実施形態の構成と同様とすることができる。   Here, a modification of the present embodiment will be described. The image recognition apparatus 10 according to the present embodiment may not include the configuration (calculation unit 13) that calculates the statistical value of the specific information. In such a case, the output unit 18 does not display the total value in the recognition result display area 32 illustrated in FIGS. 12, 13, and 14. Other configurations can be the same as those of the above-described embodiment.

以上説明した本実施形態の画像認識装置10によれば、第1乃至第5の実施形態と同様の作用効果を実現することができる。また、ユーザに、認識内容を提示するとともに、認識内容を修正する入力を受付けることができる。結果、画像認識処理に基づいて認識した結果に誤りが含まれる場合であっても、ユーザによる確認及び修正作業により当該誤りを訂正することができる。このように、本実施形態の画像認識装置10は、ユーザによる確認作業及び修正作業が可能な構成となっているので、認識結果の信頼度をさらに向上させることができる。   According to the image recognition device 10 of the present embodiment described above, the same operational effects as those of the first to fifth embodiments can be realized. Further, it is possible to present the recognition content to the user and accept an input for correcting the recognition content. As a result, even if an error is included in the result of recognition based on the image recognition process, the error can be corrected by the confirmation and correction work by the user. As described above, since the image recognition apparatus 10 according to the present embodiment is configured to allow the user to perform confirmation work and correction work, the reliability of the recognition result can be further improved.

以下、参考形態の例を付記する。
1. 特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得手段と、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識手段と、
前記画像認識手段が認識した前記特定情報に基づいて、当該特定情報の統計値を算出する算出手段と、
を有する画像認識装置。
2. 1に記載の画像認識装置において、
前記画像取得手段は、前記被認識媒体を撮像した複数のフレームのデータを取得し、
前記画像認識手段は、前記複数のフレームのデータに対して画像認識処理を行い、
前記複数のフレームのデータ各々に対する前記画像認識処理の結果に基づいて、前記被認識媒体の統計値を決定する決定手段をさらに有する画像認識装置。
3. 2に記載の画像認識装置において、
前記算出手段は、前記複数のフレームのデータ各々に対応する前記統計値を算出し、前記決定手段は、前記複数のフレームのデータ各々に対応する前記統計値を利用して、前記被認識媒体の統計値を決定する画像認識装置。
4. 3に記載の画像認識装置において、
前記決定手段は、前記算出手段により算出された前記複数のフレームのデータ各々に対応する前記統計値の中の最大値、最小値、平均値、又は、最頻値を、前記被認識媒体の統計値として決定する画像認識装置。
5. 2に記載の画像認識装置において、
前記算出手段は、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記画像認識処理の結果に基づいて一の前記特定情報を決定し、前記認識対象毎に決定した前記特定情報の統計値を算出し、
前記決定手段は、前記認識対象毎に決定した前記特定情報の統計値を、前記被認識媒体の前記統計値として決定する画像認識装置。
6. 5に記載の画像認識装置において、
前記算出手段は、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記特定情報の中の最大値、最小値、平均値、又は、最頻値を前記認識対象各々の一の前記特定情報として決定し、前記認識対象毎に決定した一の前記特定情報に基づいて前記統計値を算出する画像認識装置。
7. 2から6のいずれかに記載の画像認識装置において、
前記複数のフレームのデータ、及び、前記画像認識処理の結果の少なくとも一方に基づいて、前記フレーム内に存在する前記被認識媒体が他の前記被認識媒体に切り替わったことを判定する切替判定手段をさらに有する画像認識装置。
8. 7に記載の画像認識装置において、
前記決定手段が決定した前記統計値が所定の条件を満たす前記被認識媒体の数を特定するための情報を外部機器に送信する送信手段をさらに有する画像認識装置。
9. 2から8のいずれかに記載の画像認識装置において、
前記決定手段が決定した前記統計値が所定の条件を満たすか否かを報知する手段をさらに有する画像認識装置。
10. 1から9のいずれかに記載の画像認識装置において、
前記画像認識手段は、前記認識対象各々から認識した複数の前記特定情報各々の認識信頼度を示す信頼度情報を算出し、
前記認識信頼度が所定レベル以下の前記認識対象を特定する特定手段と、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記特定手段が特定した前記認識対象を他の前記認識対象と識別する情報を出力する出力手段と、
を有する画像認識装置。
11. 1から10のいずれかに記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象を識別する情報を出力する出力手段をさらに有する画像認識装置。
12. 1から11のいずれかに記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象の前記特定情報を識別する情報を出力する出力手段をさらに有する画像認識装置。
13. 1から12のいずれかに記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記算出手段が算出した前記統計値を出力する出力手段をさらに有する画像認識装置。
14. 1から13のいずれかに記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段により前記認識対象として認識されているが、前記特定情報を認識されていない前記認識対象を、他の前記認識対象と識別する情報を出力する出力手段をさらに有する画像認識装置。
15. 1から14のいずれかに記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象の前記特定情報を識別する情報を出力する出力手段と、
前記出力手段により前記特定情報を識別する情報を出力された前記認識対象の中の1つを選択して、前記画像認識手段が認識した前記特定情報を訂正する入力を受付ける訂正受付手段と、
をさらに有する画像認識装置。
16. 1から15のいずれかに記載の画像認識装置において、
前記被認識媒体は、シート状の媒体に、前記特定情報を含む1つ又は複数の前記認識対象を貼付した媒体である画像認識装置。
17. コンピュータを、
特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得手段、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識手段、
前記画像認識手段が認識した前記特定情報に基づいて、当該特定情報の統計値を算出する算出手段、
として機能させるためのプログラム。
17−2. 17に記載のプログラムにおいて、
前記画像取得手段に、前記被認識媒体を撮像した複数のフレームのデータを取得させ、
前記画像認識手段に、前記複数のフレームのデータに対して画像認識処理を行わせ、
前記コンピュータを、さらに、前記複数のフレームのデータ各々に対する前記画像認識処理の結果に基づいて、前記被認識媒体の統計値を決定する決定手段として機能させるプログラム。
17−3. 17−2に記載のプログラムにおいて、
前記算出手段に、前記複数のフレームのデータ各々に対応する前記統計値を算出させ、前記決定手段に、前記複数のフレームのデータ各々に対応する前記統計値を利用して、前記被認識媒体の統計値を決定させるプログラム。
17−4. 17−3に記載のプログラムにおいて、
前記決定手段に、前記算出手段により算出された前記複数のフレームのデータ各々に対応する前記統計値の中の最大値、最小値、平均値、又は、最頻値を、前記被認識媒体の統計値として決定させるプログラム。
17−5. 17−2に記載のプログラムにおいて、
前記算出手段に、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記画像認識処理の結果に基づいて一の前記特定情報を決定させ、前記認識対象毎に決定した前記特定情報の統計値を算出させ、
前記決定手段に、前記認識対象毎に決定した前記特定情報の統計値を、前記被認識媒体の前記統計値として決定させるプログラム。
17−6. 17−5に記載のプログラムにおいて、
前記算出手段に、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記特定情報の中の最大値、最小値、平均値、又は、最頻値を前記認識対象各々の一の前記特定情報として決定させ、前記認識対象毎に決定した一の前記特定情報に基づいて前記統計値を算出させるプログラム。
17−7. 17−2から17−6のいずれかに記載のプログラムにおいて、
前記コンピュータを、前記複数のフレームのデータ、及び、前記画像認識処理の結果の少なくとも一方に基づいて、前記フレーム内に存在する前記被認識媒体が他の前記被認識媒体に切り替わったことを判定する切替判定手段として機能させるプログラム。
17−8. 17−7に記載のプログラムにおいて、
前記コンピュータを、前記決定手段が決定した前記統計値が所定の条件を満たす前記被認識媒体の数を特定するための情報を外部機器に送信する送信手段として機能させるプログラム。
17−9. 17−2から17−8のいずれかに記載のプログラムにおいて、
前記コンピュータを、前記決定手段が決定した前記統計値が所定の条件を満たすか否かを報知する手段として機能させるプログラム。
17−10. 17から17−9のいずれかに記載のプログラムにおいて、
前記画像認識手段に、前記認識対象各々から認識した複数の前記特定情報各々の認識信頼度を示す信頼度情報を算出させ、
前記コンピュータを、
前記認識信頼度が所定レベル以下の前記認識対象を特定する特定手段、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記特定手段が特定した前記認識対象を他の前記認識対象と識別する情報を出力する出力手段、
として機能させるプログラム。
17−11. 17から17−10のいずれかに記載のプログラムにおいて、
前記コンピュータを、前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象を識別する情報を出力する出力手段として機能させるプログラム。
17−12. 17から17−11のいずれかに記載のプログラムにおいて、
前記コンピュータを、前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象の前記特定情報を識別する情報を出力する出力手段として機能させるプログラム。
17−13. 17から17−12のいずれかに記載のプログラムにおいて、
前記コンピュータを、前記画像のデータを用いて前記被認識媒体を表示するとともに、前記算出手段が算出した前記統計値を出力する出力手段として機能させるプログラム。
17−14. 17から17−13のいずれかに記載のプログラムにおいて、
前記コンピュータを、前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段により前記認識対象として認識されているが、前記特定情報を認識されていない前記認識対象を、他の前記認識対象と識別する情報を出力する出力手段として機能させるプログラム。
17−15. 17から17−14のいずれかに記載のプログラムにおいて、
前記コンピュータを、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象の前記特定情報を識別する情報を出力する出力手段、
前記出力手段により前記特定情報を識別する情報を出力された前記認識対象の中の1つを選択して、前記画像認識手段が認識した前記特定情報を訂正する入力を受付ける訂正受付手段、
として機能させるプログラム。
17−16. 17から17−15のいずれかに記載のプログラムにおいて、
前記被認識媒体は、シート状の媒体に、前記特定情報を含む1つ又は複数の前記認識対象を貼付した媒体であるプログラム。
18. コンピュータが、
特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得工程と、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識工程と、
前記画像認識工程で認識した前記特定情報に基づいて、当該特定情報の統計値を算出する算出工程と、
を実行する画像認識方法。
18−2. 18に記載の画像認識方法において、
前記画像取得工程では、前記被認識媒体を撮像した複数のフレームのデータを取得し、
前記画像認識工程では、前記複数のフレームのデータに対して画像認識処理を行い、
前記複数のフレームのデータ各々に対する前記画像認識処理の結果に基づいて、前記被認識媒体の統計値を決定する決定工程をさらに実行する画像認識方法。
18−3. 18−2に記載の画像認識方法において、
前記算出工程では、前記複数のフレームのデータ各々に対応する前記統計値を算出し、前記決定工程では、前記複数のフレームのデータ各々に対応する前記統計値を利用して、前記被認識媒体の統計値を決定する画像認識方法。
18−4. 18−3に記載の画像認識方法において、
前記決定工程では、前記算出工程で算出された前記複数のフレームのデータ各々に対応する前記統計値の中の最大値、最小値、平均値、又は、最頻値を、前記被認識媒体の統計値として決定する画像認識方法。
18−5. 18−2に記載の画像認識方法において、
前記算出工程では、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記画像認識処理の結果に基づいて一の前記特定情報を決定し、前記認識対象毎に決定した前記特定情報の統計値を算出し、
前記決定工程では、前記認識対象毎に決定した前記特定情報の統計値を、前記被認識媒体の前記統計値として決定する画像認識方法。
18−6. 18−5に記載の画像認識方法において、
前記算出工程では、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記特定情報の中の最大値、最小値、平均値、又は、最頻値を前記認識対象各々の一の前記特定情報として決定し、前記認識対象毎に決定した一の前記特定情報に基づいて前記の統計値を算出する画像認識方法。
18−7. 18−2から18−6のいずれかに記載の画像認識方法において、
前記複数のフレームのデータ、及び、前記画像認識処理の結果の少なくとも一方に基づいて、前記フレーム内に存在する前記被認識媒体が他の前記被認識媒体に切り替わったことを判定する切替判定工程をさらに実行する画像認識方法。
18−8. 18−7に記載の画像認識方法において、
前記決定工程で決定した前記統計値が所定の条件を満たす前記被認識媒体の数を特定するための情報を外部機器に送信する送信工程をさらに実行する画像認識方法。
18−9. 18−2から18−8のいずれかに記載の画像認識方法において、
前記決定工程で決定した前記統計値が所定の条件を満たすか否かを報知する工程をさらに実行する画像認識方法。
18−10. 18から18−9のいずれかに記載の画像認識方法において、
前記画像認識工程では、前記認識対象各々から認識した複数の前記特定情報各々の認識信頼度を示す信頼度情報を算出し、
前記認識信頼度が所定レベル以下の前記認識対象を特定する特定工程と、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記特定工程で特定した前記認識対象を他の前記認識対象と識別する情報を出力する出力工程と、
を実行する画像認識方法。
18−11. 18から18−10のいずれかに記載の画像認識方法において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識工程で認識した前記認識対象を識別する情報を出力する出力工程をさらに実行する画像認識方法。
18−12. 18から18−11のいずれかに記載の画像認識方法において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識工程で認識した前記認識対象の前記特定情報を識別する情報を出力する出力工程をさらに実行する画像認識方法。
18−13. 18から18−12のいずれかに記載の画像認識方法において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記算出工程で算出した前記統計値を出力する出力工程をさらに実行する画像認識方法。
18−14. 18から18−13のいずれかに記載の画像認識方法において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識工程で前記認識対象として認識されているが、前記特定情報を認識されていない前記認識対象を、他の前記認識対象と識別する情報を出力する出力工程をさらに実行する画像認識方法。
18−15. 18から18−14のいずれかに記載の画像認識方法において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識工程で認識した前記認識対象の前記特定情報を識別する情報を出力する出力工程と、
前記出力工程で前記特定情報を識別する情報を出力された前記認識対象の中の1つを選択して、前記画像認識工程で認識した前記特定情報を訂正する入力を受付ける訂正受付工程と、
をさらに実行する画像認識方法。
18−16. 18から18−15のいずれかに記載の画像認識方法において、
前記被認識媒体は、シート状の媒体に、前記特定情報を含む1つ又は複数の前記認識対象を貼付した媒体である画像認識方法。
Hereinafter, examples of the reference form will be added.
1. Image acquisition means for acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Image recognition means for performing image recognition processing on the image data and recognizing the specific information of each of the recognition objects present in the image;
Calculation means for calculating a statistical value of the specific information based on the specific information recognized by the image recognition means;
An image recognition apparatus.
2. The image recognition apparatus according to 1, wherein
The image acquisition means acquires data of a plurality of frames obtained by imaging the recognized medium,
The image recognition means performs image recognition processing on the data of the plurality of frames,
An image recognition apparatus, further comprising: a determination unit that determines a statistical value of the recognized medium based on a result of the image recognition process for each of the data of the plurality of frames.
3. In the image recognition device according to 2,
The calculating means calculates the statistical value corresponding to each of the data of the plurality of frames, and the determining means uses the statistical value corresponding to each of the data of the plurality of frames, An image recognition device that determines statistical values.
4). In the image recognition device according to 3,
The determining means calculates a maximum value, a minimum value, an average value, or a mode value among the statistical values corresponding to each of the data of the plurality of frames calculated by the calculating means, from the statistics of the recognized medium. An image recognition device that determines the value.
5. In the image recognition device according to 2,
The calculation means determines one specific information for each recognition target based on a plurality of results of the image recognition processing corresponding to each of the data of the plurality of frames, and the specific determination determined for each recognition target Calculate statistics of information,
The determination unit is an image recognition apparatus that determines a statistical value of the specific information determined for each recognition target as the statistical value of the recognized medium.
6). In the image recognition device according to 5,
For each recognition object, the calculation means calculates a maximum value, a minimum value, an average value, or a mode value among the plurality of specific information corresponding to each of the data of the plurality of frames. An image recognition device that calculates the statistical value based on the one specific information determined for each recognition target.
7). In the image recognition device according to any one of 2 to 6,
Switching determining means for determining that the recognized medium existing in the frame is switched to another recognized medium based on at least one of the data of the plurality of frames and the result of the image recognition processing; Furthermore, the image recognition apparatus which has.
8). In the image recognition apparatus according to 7,
An image recognition apparatus, further comprising: a transmission unit configured to transmit, to an external device, information for specifying the number of recognized media whose statistical values determined by the determination unit satisfy a predetermined condition.
9. In the image recognition device according to any one of 2 to 8,
An image recognition apparatus further comprising means for notifying whether or not the statistical value determined by the determining means satisfies a predetermined condition.
10. In the image recognition device according to any one of 1 to 9,
The image recognition means calculates reliability information indicating recognition reliability of each of the plurality of specific information recognized from each of the recognition targets,
Identifying means for identifying the recognition object whose recognition reliability is a predetermined level or less;
An output means for displaying the recognized medium using the image data and outputting information for identifying the recognition target specified by the specifying means from the other recognition targets;
An image recognition apparatus.
11. In the image recognition device according to any one of 1 to 10,
An image recognition apparatus further comprising: output means for displaying the recognized medium using the image data and outputting information for identifying the recognition object recognized by the image recognition means.
12 In the image recognition device according to any one of 1 to 11,
An image recognition apparatus further comprising an output unit that displays the recognized medium using the image data and outputs information for identifying the specific information of the recognition target recognized by the image recognition unit.
13. In the image recognition device according to any one of 1 to 12,
An image recognition apparatus further comprising an output unit that displays the recognized medium using the image data and outputs the statistical value calculated by the calculation unit.
14 In the image recognition device according to any one of 1 to 13,
The recognized medium is displayed using the image data, and the recognition target that is recognized as the recognition target by the image recognition unit but is not recognized as the specific information is defined as another recognition target. An image recognition apparatus further comprising output means for outputting identification information.
15. In the image recognition device according to any one of 1 to 14,
An output means for displaying the recognized medium using the image data and outputting information for identifying the specific information of the recognition target recognized by the image recognition means;
Correction accepting means for selecting one of the recognition targets from which information for identifying the specific information is output by the output means and receiving an input for correcting the specific information recognized by the image recognition means;
An image recognition apparatus further comprising:
16. In the image recognition device according to any one of 1 to 15,
The recognition medium is an image recognition device in which one or a plurality of recognition objects including the specific information is attached to a sheet-like medium.
17. Computer
Image acquisition means for acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Image recognition means for performing image recognition processing on the image data and recognizing the specific information of each of the recognition objects present in the image;
Calculation means for calculating a statistical value of the specific information based on the specific information recognized by the image recognition means;
Program to function as.
17-2. In the program described in 17,
Causing the image acquisition means to acquire data of a plurality of frames obtained by imaging the recognized medium;
Causing the image recognition means to perform image recognition processing on the data of the plurality of frames;
A program that causes the computer to further function as a determination unit that determines a statistical value of the recognized medium based on a result of the image recognition processing for each of the data of the plurality of frames.
17-3. In the program described in 17-2,
The calculating means calculates the statistical value corresponding to each of the data of the plurality of frames, and the determining means uses the statistical value corresponding to each of the data of the plurality of frames, A program that determines statistics.
17-4. In the program described in 17-3,
The determination unit is configured to obtain a maximum value, a minimum value, an average value, or a mode value among the statistical values corresponding to each of the data of the plurality of frames calculated by the calculation unit. A program that determines the value.
17-5. In the program described in 17-2,
The calculation means causes the specific information to be determined for each recognition target based on a plurality of the image recognition processing results corresponding to the data of the plurality of frames, and the specific determination determined for each recognition target. Let's calculate the statistics of the information,
The program which makes the said determination means determine the statistical value of the said specific information determined for every said recognition object as the said statistical value of the said to-be-recognized medium.
17-6. In the program described in 17-5,
For each recognition object, the calculating means calculates a maximum value, a minimum value, an average value, or a mode value among the plurality of specific information corresponding to each of the data of the plurality of frames. A program for determining the statistical value based on the specific information determined for each recognition target.
17-7. In the program according to any one of 17-2 to 17-6,
The computer determines, based on at least one of the data of the plurality of frames and the result of the image recognition processing, that the recognized medium existing in the frame has been switched to another recognized medium. A program that functions as a switching determination unit.
17-8. In the program described in 17-7,
A program that causes the computer to function as a transmission unit that transmits information for specifying the number of recognized media for which the statistical value determined by the determination unit satisfies a predetermined condition to an external device.
17-9. In the program according to any one of 17-2 to 17-8,
A program for causing the computer to function as means for notifying whether or not the statistical value determined by the determining means satisfies a predetermined condition.
17-10. In the program according to any one of 17 to 17-9,
Causing the image recognition means to calculate reliability information indicating recognition reliability of each of the plurality of specific information recognized from each of the recognition targets;
The computer,
A specifying means for specifying the recognition object whose recognition reliability is a predetermined level or less;
An output means for displaying the recognized medium using the image data and outputting information for identifying the recognition target specified by the specifying means from the other recognition targets;
Program to function as.
17-11. In the program according to any one of 17 to 17-10,
A program that causes the computer to function as an output unit that displays the recognized medium using the image data and outputs information for identifying the recognition target recognized by the image recognition unit.
17-12. In the program according to any one of 17 to 17-11,
A program that causes the computer to function as an output unit that displays the recognized medium using the image data and outputs information that identifies the specific information of the recognition target recognized by the image recognition unit.
17-13. In the program according to any one of 17 to 17-12,
A program that causes the computer to function as an output unit that displays the recognized medium using the image data and outputs the statistical value calculated by the calculation unit.
17-14. In the program according to any one of 17 to 17-13,
The computer displays the recognized medium using the image data, and recognizes the recognition target that is recognized as the recognition target by the image recognition unit but has not recognized the specific information. A program that functions as an output unit that outputs information for identifying the recognition target.
17-15. In the program according to any one of 17 to 17-14,
The computer,
An output means for displaying the recognized medium using the image data and outputting information for identifying the specific information of the recognition target recognized by the image recognition means;
Correction accepting means for selecting one of the recognition targets from which information for identifying the specific information is output by the output means and receiving an input for correcting the specific information recognized by the image recognition means;
Program to function as.
17-16. In the program according to any one of 17 to 17-15,
The recognized medium is a program in which one or more recognition targets including the specific information are pasted on a sheet-like medium.
18. Computer
An image acquisition step of acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Performing an image recognition process on the image data, and recognizing the specific information of each of the recognition objects present in the image;
A calculation step of calculating a statistical value of the specific information based on the specific information recognized in the image recognition step;
An image recognition method to execute.
18-2. The image recognition method according to claim 18,
In the image acquisition step, data of a plurality of frames obtained by imaging the recognized medium is acquired,
In the image recognition step, image recognition processing is performed on the data of the plurality of frames,
An image recognition method that further executes a determination step of determining a statistical value of the recognized medium based on a result of the image recognition processing for each of the data of the plurality of frames.
18-3. In the image recognition method described in 18-2,
In the calculating step, the statistical value corresponding to each of the data of the plurality of frames is calculated, and in the determining step, using the statistical value corresponding to each of the data of the plurality of frames, An image recognition method for determining statistical values.
18-4. In the image recognition method described in 18-3,
In the determination step, a maximum value, a minimum value, an average value, or a mode value among the statistical values corresponding to each of the data of the plurality of frames calculated in the calculation step is used as the statistics of the recognized medium. Image recognition method determined as a value.
18-5. In the image recognition method described in 18-2,
In the calculation step, for each recognition target, one specific information is determined based on a plurality of results of the image recognition processing corresponding to each of the data of the plurality of frames, and the specific information determined for each recognition target is determined. Calculate statistics of information,
In the determining step, an image recognition method for determining a statistical value of the specific information determined for each recognition target as the statistical value of the recognized medium.
18-6. In the image recognition method described in 18-5,
In the calculation step, for each recognition target, a maximum value, a minimum value, an average value, or a mode value among the plurality of specific information corresponding to each of the data of the plurality of frames is determined for each recognition target. An image recognition method for calculating the statistical value based on the one specific information determined for each recognition target.
18-7. In the image recognition method according to any one of 18-2 to 18-6,
A switching determination step of determining whether the recognized medium existing in the frame is switched to another recognized medium based on at least one of the data of the plurality of frames and the result of the image recognition processing. An image recognition method to be further executed.
18-8. In the image recognition method described in 18-7,
An image recognition method for further executing a transmission step of transmitting information for specifying the number of recognized media for which the statistical value determined in the determination step satisfies a predetermined condition to an external device.
18-9. In the image recognition method according to any one of 18-2 to 18-8,
An image recognition method further executing a step of notifying whether or not the statistical value determined in the determination step satisfies a predetermined condition.
18-10. In the image recognition method according to any one of 18 to 18-9,
In the image recognition step, the reliability information indicating the recognition reliability of each of the plurality of specific information recognized from each of the recognition objects is calculated,
A specifying step of specifying the recognition target whose recognition reliability is a predetermined level or less;
An output step of displaying the recognized medium using the image data and outputting information for identifying the recognition target specified in the specifying step from the other recognition targets;
An image recognition method to execute.
18-11. In the image recognition method according to any one of 18 to 18-10,
An image recognition method for further executing an output step of displaying the recognized medium using the image data and outputting information for identifying the recognition target recognized in the image recognition step.
18-12. In the image recognition method according to any one of 18 to 18-11,
An image recognition method for further executing an output step of displaying the recognized medium using the image data and outputting information for identifying the specific information of the recognition target recognized in the image recognition step.
18-13. In the image recognition method according to any one of 18 to 18-12,
An image recognition method that further executes an output step of displaying the recognized medium using the image data and outputting the statistical value calculated in the calculation step.
18-14. In the image recognition method according to any one of 18 to 18-13,
The recognized medium is displayed using the image data, and the recognition target that is recognized as the recognition target in the image recognition step but is not recognized as the specific information is defined as another recognition target. An image recognition method for further executing an output step of outputting identification information.
18-15. In the image recognition method according to any one of 18 to 18-14,
An output step of displaying the recognized medium using the image data and outputting information for identifying the specific information of the recognition target recognized in the image recognition step;
A correction accepting step of selecting one of the recognition targets from which information identifying the specific information is output in the output step, and receiving an input for correcting the specific information recognized in the image recognition step;
An image recognition method for further executing.
18-16. In the image recognition method according to any one of 18 to 18-15,
The image recognition method, wherein the recognized medium is a sheet in which one or more recognition targets including the specific information are pasted on a sheet-like medium.

1A CPU
2A RAM
3A ROM
4A 通信部
5A 表示制御部
6A ディスプレイ
7A 操作受付部
8A 操作部
9A 補助記憶装置
10A バス
10 画像認識装置
11 画像取得部
12 画像認識部
13 算出部
14 決定部
15 切替決定部
16 送信部
17 特定部
18 出力部
20 被認識媒体
21 シート状媒体
22 認識対象
22´ 欠損部分を有する認識対象
31 撮像画像表示領域
32 認識結果表示領域
33 認識対象表示マーク
34 修正受付領域
1A CPU
2A RAM
3A ROM
4A Communication unit 5A Display control unit 6A Display 7A Operation reception unit 8A Operation unit 9A Auxiliary storage device 10A Bus 10 Image recognition device 11 Image acquisition unit 12 Image recognition unit 13 Calculation unit 14 Determination unit 15 Switching determination unit 16 Transmission unit 17 Identification unit DESCRIPTION OF SYMBOLS 18 Output part 20 Recognized medium 21 Sheet-like medium 22 Recognition target 22 'Recognition target which has a missing part 31 Captured image display area 32 Recognition result display area 33 Recognition target display mark 34 Correction acceptance area

Claims (18)

特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得手段と、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識手段と、
前記画像認識手段が認識した前記特定情報に基づいて、当該特定情報の統計値を算出し、前記統計値が所定の条件を満たすか否かを判断する算出手段と、
を有する画像認識装置。
Image acquisition means for acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Image recognition means for performing image recognition processing on the image data and recognizing the specific information of each of the recognition objects present in the image;
Calculation means for calculating a statistical value of the specific information based on the specific information recognized by the image recognition means, and determining whether the statistical value satisfies a predetermined condition ;
An image recognition apparatus.
請求項1に記載の画像認識装置において、  The image recognition apparatus according to claim 1,
前記統計値が前記所定の条件を満たすか否かを報知する手段をさらに有する画像認識装置。  An image recognition apparatus further comprising means for notifying whether or not the statistical value satisfies the predetermined condition.
請求項1又は2に記載の画像認識装置において、
前記画像取得手段は、前記被認識媒体を撮像した複数のフレームのデータを取得し、
前記画像認識手段は、前記複数のフレームのデータに対して画像認識処理を行い、
前記複数のフレームのデータ各々に対する前記画像認識処理の結果に基づいて、前記被認識媒体の統計値を決定する決定手段をさらに有する画像認識装置。
The image recognition apparatus according to claim 1 or 2 ,
The image acquisition means acquires data of a plurality of frames obtained by imaging the recognized medium,
The image recognition means performs image recognition processing on the data of the plurality of frames,
An image recognition apparatus, further comprising: a determination unit that determines a statistical value of the recognized medium based on a result of the image recognition process for each of the data of the plurality of frames.
請求項3に記載の画像認識装置において、
前記算出手段は、前記複数のフレームのデータ各々に対応する前記統計値を算出し、前記決定手段は、前記複数のフレームのデータ各々に対応する前記統計値を利用して、前記被認識媒体の統計値を決定する画像認識装置。
The image recognition apparatus according to claim 3 .
The calculating means calculates the statistical value corresponding to each of the data of the plurality of frames, and the determining means uses the statistical value corresponding to each of the data of the plurality of frames, An image recognition device that determines statistical values.
請求項4に記載の画像認識装置において、
前記決定手段は、前記算出手段により算出された前記複数のフレームのデータ各々に対応する前記統計値の中の最大値、最小値、平均値、又は、最頻値を、前記被認識媒体の統計値として決定する画像認識装置。
The image recognition apparatus according to claim 4 .
The determining means calculates a maximum value, a minimum value, an average value, or a mode value among the statistical values corresponding to each of the data of the plurality of frames calculated by the calculating means, from the statistics of the recognized medium. An image recognition device that determines the value.
請求項3に記載の画像認識装置において、
前記算出手段は、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記画像認識処理の結果に基づいて一の前記特定情報を決定し、前記認識対象毎に決定した前記特定情報の統計値を算出し、
前記決定手段は、前記認識対象毎に決定した前記特定情報の統計値を、前記被認識媒体の前記統計値として決定する画像認識装置。
The image recognition apparatus according to claim 3 .
The calculation means determines one specific information for each recognition target based on a plurality of results of the image recognition processing corresponding to each of the data of the plurality of frames, and the specific determination determined for each recognition target Calculate statistics of information,
The determination unit is an image recognition apparatus that determines a statistical value of the specific information determined for each recognition target as the statistical value of the recognized medium.
請求項6に記載の画像認識装置において、
前記算出手段は、前記認識対象毎に、前記複数のフレームのデータ各々に対応する複数の前記特定情報の中の最大値、最小値、平均値、又は、最頻値を前記認識対象各々の一の前記特定情報として決定し、前記認識対象毎に決定した一の前記特定情報に基づいて前記統計値を算出する画像認識装置。
The image recognition device according to claim 6 .
For each recognition object, the calculation means calculates a maximum value, a minimum value, an average value, or a mode value among the plurality of specific information corresponding to each of the data of the plurality of frames. An image recognition device that calculates the statistical value based on the one specific information determined for each recognition target.
請求項3から7のいずれか1項に記載の画像認識装置において、
前記複数のフレームのデータ、及び、前記画像認識処理の結果の少なくとも一方に基づいて、前記フレーム内に存在する前記被認識媒体が他の前記被認識媒体に切り替わったことを判定する切替判定手段をさらに有する画像認識装置。
The image recognition apparatus according to any one of claims 3 to 7 ,
Switching determining means for determining that the recognized medium existing in the frame is switched to another recognized medium based on at least one of the data of the plurality of frames and the result of the image recognition processing; Furthermore, the image recognition apparatus which has.
請求項8に記載の画像認識装置において、
前記決定手段が決定した前記統計値が所定の条件を満たす前記被認識媒体の数を特定するための情報を外部機器に送信する送信手段をさらに有する画像認識装置。
The image recognition apparatus according to claim 8 .
An image recognition apparatus, further comprising: a transmission unit configured to transmit, to an external device, information for specifying the number of recognized media for which the statistical value determined by the determination unit satisfies a predetermined condition.
請求項1から9のいずれか1項に記載の画像認識装置において、
前記画像認識手段は、前記認識対象各々から認識した複数の前記特定情報各々の認識信頼度を示す信頼度情報を算出し、
前記認識信頼度が所定レベル以下の前記認識対象を特定する特定手段と、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記特定手段が特定した前記認識対象を他の前記認識対象と識別する情報を出力する出力手段と、
を有する画像認識装置。
The image recognition apparatus according to any one of claims 1 to 9,
The image recognition means calculates reliability information indicating recognition reliability of each of the plurality of specific information recognized from each of the recognition targets,
Identifying means for identifying the recognition object whose recognition reliability is a predetermined level or less;
An output means for displaying the recognized medium using the image data and outputting information for identifying the recognition target specified by the specifying means from the other recognition targets;
An image recognition apparatus.
請求項1から10のいずれか1項に記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象を識別する情報を出力する出力手段をさらに有する画像認識装置。
The image recognition device according to any one of claims 1 to 10,
An image recognition apparatus further comprising: output means for displaying the recognized medium using the image data and outputting information for identifying the recognition object recognized by the image recognition means.
請求項1から11のいずれか1項に記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象の前記特定情報を識別する情報を出力する出力手段をさらに有する画像認識装置。
The image recognition device according to any one of claims 1 to 11,
An image recognition apparatus further comprising an output unit that displays the recognized medium using the image data and outputs information for identifying the specific information of the recognition target recognized by the image recognition unit.
請求項1から12のいずれか1項に記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記算出手段が算出した前記統計値を出力する出力手段をさらに有する画像認識装置。
The image recognition device according to any one of claims 1 to 12,
An image recognition apparatus further comprising an output unit that displays the recognized medium using the image data and outputs the statistical value calculated by the calculation unit.
請求項1から13のいずれか1項に記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段により前記認識対象として認識されているが、前記特定情報を認識されていない前記認識対象を、他の前記認識対象と識別する情報を出力する出力手段をさらに有する画像認識装置。
The image recognition device according to any one of claims 1 to 13,
The recognized medium is displayed using the image data, and the recognition target that is recognized as the recognition target by the image recognition unit but is not recognized as the specific information is defined as another recognition target. An image recognition apparatus further comprising output means for outputting identification information.
請求項1から14のいずれか1項に記載の画像認識装置において、
前記画像のデータを用いて前記被認識媒体を表示するとともに、前記画像認識手段が認識した前記認識対象の前記特定情報を識別する情報を出力する出力手段と、
前記出力手段により前記特定情報を識別する情報を出力された前記認識対象の中の1つを選択して、前記画像認識手段が認識した前記特定情報を訂正する入力を受付ける訂正受付手段と、
をさらに有する画像認識装置。
The image recognition apparatus according to any one of claims 1 to 14,
An output means for displaying the recognized medium using the image data and outputting information for identifying the specific information of the recognition target recognized by the image recognition means;
Correction accepting means for selecting one of the recognition targets from which information for identifying the specific information is output by the output means and receiving an input for correcting the specific information recognized by the image recognition means;
An image recognition apparatus further comprising:
請求項1から15のいずれか1項に記載の画像認識装置において、
前記被認識媒体は、シート状の媒体に、前記特定情報を含む1つ又は複数の前記認識対象を貼付した媒体である画像認識装置。
The image recognition device according to any one of claims 1 to 15,
The recognition medium is an image recognition device in which one or a plurality of recognition objects including the specific information is attached to a sheet-like medium.
コンピュータを、
特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得手段、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識手段、
前記画像認識手段が認識した前記特定情報に基づいて、当該特定情報の統計値を算出し、前記統計値が所定の条件を満たすか否かを判断する算出手段、
として機能させるためのプログラム。
Computer
Image acquisition means for acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Image recognition means for performing image recognition processing on the image data and recognizing the specific information of each of the recognition objects present in the image;
Calculation means for calculating a statistical value of the specific information based on the specific information recognized by the image recognition means, and determining whether the statistical value satisfies a predetermined condition ;
Program to function as.
コンピュータが、
特定情報を含む認識対象が1つ又は複数付された被認識媒体を撮像した画像のデータを取得する画像取得工程と、
前記画像のデータに対して画像認識処理を行い、前記画像内に存在する前記認識対象各々の前記特定情報を認識する画像認識工程と、
前記画像認識工程で認識した前記特定情報に基づいて、当該特定情報の統計値を算出し、前記統計値が所定の条件を満たすか否かを判断する算出工程と、
を実行する画像認識方法。
Computer
An image acquisition step of acquiring data of an image obtained by imaging a recognized medium to which one or more recognition targets including specific information are attached;
Performing an image recognition process on the image data, and recognizing the specific information of each of the recognition objects present in the image;
A calculation step of calculating a statistical value of the specific information based on the specific information recognized in the image recognition step, and determining whether the statistical value satisfies a predetermined condition ;
An image recognition method to execute.
JP2013148722A 2013-07-17 2013-07-17 Image recognition apparatus, image recognition method, and program Active JP6255762B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013148722A JP6255762B2 (en) 2013-07-17 2013-07-17 Image recognition apparatus, image recognition method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013148722A JP6255762B2 (en) 2013-07-17 2013-07-17 Image recognition apparatus, image recognition method, and program

Publications (2)

Publication Number Publication Date
JP2015022432A JP2015022432A (en) 2015-02-02
JP6255762B2 true JP6255762B2 (en) 2018-01-10

Family

ID=52486846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013148722A Active JP6255762B2 (en) 2013-07-17 2013-07-17 Image recognition apparatus, image recognition method, and program

Country Status (1)

Country Link
JP (1) JP6255762B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017091035A (en) * 2015-11-05 2017-05-25 株式会社野村総合研究所 Verification device and method of string of figure and/or character, and computer program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4742404B2 (en) * 2000-05-17 2011-08-10 コニカミノルタビジネステクノロジーズ株式会社 Image recognition apparatus, image forming apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JP2004199141A (en) * 2002-12-16 2004-07-15 Nec Saitama Ltd Symbol recognition device and symbol recognition method
JP4970008B2 (en) * 2006-11-27 2012-07-04 東芝テック株式会社 Sticker reader, data code reader, privilege sticker

Also Published As

Publication number Publication date
JP2015022432A (en) 2015-02-02

Similar Documents

Publication Publication Date Title
KR102596920B1 (en) Camera platform and object inventory control
US20200151657A1 (en) Information processing apparatus, control method, and program
US10205871B1 (en) Focus specification and focus stabilization
EP3234750B1 (en) Floating soft trigger for touch displays on electronic device
JP6489262B2 (en) Guided image capture user interface
US20170011606A1 (en) Systems, Devices, and/or Methods for Managing Transactions
JP6439566B2 (en) Multilingual display device, multilingual display system, multilingual display method, and multilingual display program
EP2568412A1 (en) Apparatus for recognizing character and barcode simultaneously and method for controlling the same
JP7096804B2 (en) How to process a large number of decryptable stamps
US10452707B2 (en) Product auditing in point-of-sale images
WO2020142744A1 (en) Networked system including a recognition engine for identifying products within an image captured using a terminal device
CN103189864A (en) Methods and apparatuses for determining shared friends in images or videos
WO2018016214A1 (en) Image processing device, image processing method, and program
JP5605725B2 (en) Information notification system, information notification method, information processing apparatus, control method thereof, and control program
JP6624063B2 (en) Vending machine recognition device, merchandise shelf recognition device, vending machine recognition method, program and image processing device
WO2020227845A1 (en) Compressed network for product recognition
JPWO2015147333A1 (en) Sales registration device, program and sales registration method
WO2006011556A1 (en) Information processing system, and information processing method
JP5744944B2 (en) Promotion information display system and promotion information display method
US20170161387A1 (en) Content Provisioning System for Wearable Technology Devices
JP2008257462A (en) Commodity sales registration data processor
JP5250670B2 (en) Product sales registration data processing device
JP6255762B2 (en) Image recognition apparatus, image recognition method, and program
US11966435B2 (en) Information processing apparatus, control method, and program
JP2022093466A (en) Information processing device, information processing system, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171120

R150 Certificate of patent or registration of utility model

Ref document number: 6255762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150