JP7375497B2 - Number recognition device and method - Google Patents

Number recognition device and method Download PDF

Info

Publication number
JP7375497B2
JP7375497B2 JP2019213143A JP2019213143A JP7375497B2 JP 7375497 B2 JP7375497 B2 JP 7375497B2 JP 2019213143 A JP2019213143 A JP 2019213143A JP 2019213143 A JP2019213143 A JP 2019213143A JP 7375497 B2 JP7375497 B2 JP 7375497B2
Authority
JP
Japan
Prior art keywords
detected
digit
waiting
detection
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019213143A
Other languages
Japanese (ja)
Other versions
JP2020102203A (en
Inventor
ジュ・シエヌタヌ
タヌ・ジミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2020102203A publication Critical patent/JP2020102203A/en
Application granted granted Critical
Publication of JP7375497B2 publication Critical patent/JP7375497B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報技術分野に関し、特に、ナンバー認識装置及び方法に関する。 The present invention relates to the field of information technology, and in particular to a number recognition device and method.

情報技術の進歩に伴い、ナンバー認識が広く応用されるようになっている。例えば、サインボード、選手、作業員、受験生などの検出待ちオブジェクトにおけるナンバーに対して認識を行うことにより、様々な応用を行うことができる。 With the advancement of information technology, number recognition has become widely applied. For example, by recognizing numbers on objects waiting to be detected, such as signboards, athletes, workers, and students taking entrance exams, various applications can be achieved.

例えば、バスケットボール試合では、ナンバー検出は、多くのビデオ監視の面での応用がある。例えば、選手のユニフォームにおけるナンバーに対して検出及び認識を行うことで、認識結果に基づいて、対応する選手を確定することができる。このように、試合のビデオを用いて、各選手の軌跡を追跡及び記述することで、技術補助を提供することができる。従来のナンバー認識方法では、分類器により、全ての可能なナンバーに対して分類を行う。例えば、バスケットボール選手について言えば、その可能なナンバーが0~99でああり、この場合、該分類器の類別が100種類ある。 For example, at a basketball game, number detection has many applications in video surveillance. For example, by detecting and recognizing the number on a player's uniform, the corresponding player can be determined based on the recognition result. In this way, video of the match can be used to track and describe the trajectory of each player to provide technical assistance. In conventional number recognition methods, a classifier classifies all possible numbers. For example, for a basketball player, the possible numbers are 0 to 99, and in this case, there are 100 classifications of the classifier.

なお、上述の背景技術についての紹介は、本発明の技術案を明確且つ完全に説明し、また、当業者がそれを理解しやすいためのものである。これらの技術案は、本発明の背景技術の一部に記述されているため、当業者にとって周知であると解釈すべきではない。 It should be noted that the above background art introduction is intended to clearly and completely explain the technical solution of the present invention, and to help those skilled in the art easily understand it. Since these technical solutions are described as part of the background art of the present invention, they should not be interpreted as being well known to those skilled in the art.

発明者が次のようなことを発見した。即ち、分類器を使用した従来の方法では、各分類について、大量の訓練データを収集し、訓練を行う必要があるため、時間及び手間がかかりまた、また、幾つかの類別の訓練データを収集し難い場合もある。例えば、バスケットボール選手のナンバーの認識の場合、100種類の訓練データを収集する必要があるが、幾つかのナンバー関して、該ナンバーを使用する選手がとても少ないため、このようなナンバーの訓練データを収集し、訓練を行うことがかなり困難である。 The inventor discovered the following. In other words, in the conventional method using a classifier, it is necessary to collect and train a large amount of training data for each classification, which is time-consuming and labor-intensive. Sometimes it is difficult. For example, in the case of recognizing the numbers of basketball players, it is necessary to collect 100 types of training data, but for some numbers, there are very few players who use the numbers, so training data for such numbers is not collected. It is quite difficult to collect and conduct training.

本発明の目的は、ナンバー認識装置及び方法を提供することにある。このようなナンバー認識装置及び方法は、1桁のみの数字を検出する必要があるため、0~9の10種類の訓練サンプルだけを収集し、分類器に対して訓練を行うことで、簡単且つ迅速に分類器の訓練を完成することができ、また、1桁のみの数字に対して検出及び合併を行うのであるから、比較的高い認識精度も有する。 An object of the present invention is to provide a number recognition device and method. These number recognition devices and methods need to detect only one digit number, so they can be easily and easily implemented by collecting only 10 types of training samples from 0 to 9 and training the classifier. The training of the classifier can be completed quickly, and since detection and merging are performed for only one-digit numbers, the recognition accuracy is relatively high.

本発明の実施例の第一側面によれば、ナンバー認識装置が提供され、前記装置は、入力画像のうちから、検出待ちオブジェクトを検出するための第一検出ユニット;検出された前記検出待ちオブジェクトの所在する領域のうちから、1桁の数字を検出するための第二検出ユニット;及び、前記検出待ちオブジェクトの所在する領域のうちから検出された1桁の数字に対して合併を行い、前記検出待ちオブジェクトの所在する領域におけるナンバーを得るための合併ユニットを含む。 According to a first aspect of an embodiment of the present invention, there is provided a number recognition device, the device comprising: a first detection unit for detecting a detection object from an input image; a first detection unit for detecting a detection object from an input image; a second detection unit for detecting a one-digit number from the area where the object to be detected is located; It includes a merging unit for obtaining a number in the area where the object waiting to be detected is located.

本発明の実施例の第二側面によれば、電子機器が提供され、前記電子機器は、本発明の実施例の第一側面に記載のナンバー認識装置を含む。 According to a second aspect of an embodiment of the invention, there is provided an electronic device, said electronic device comprising a number recognition device according to the first aspect of the embodiment of the invention.

本発明の実施例の第三側面によれば、ナンバー認識方法が提供され、前記方法は、入力画像のうちから、検出待ちオブジェクトを検出し;検出された前記検出待ちオブジェクトの所在する領域のうちから、1桁の数字を検出し;及び、前記検出待ちオブジェクトの所在する領域のうちから検出された1桁の数字に対して合併を行い、前記検出待ちオブジェクトの所在する領域におけるナンバーを得ることを含む。 According to a third aspect of the embodiment of the present invention, there is provided a number recognition method, the method comprising: detecting an object to be detected from an input image; Detecting a one-digit number from; and merging the one-digit numbers detected from the area where the object waiting to be detected is located to obtain a number in the area where the object waiting to be detected is located. including.

本発明の有益な効果が次の通りである。即ち、先ず、各検出待ちオブジェクトを検出し、その後、各検出待ちオブジェクトの所在する領域内の1桁の数字を検出し、最後に、これらの1桁の数字を合併することで、各検出待ちオブジェクトに対応するナンバーを取得することができる。1桁のみの数字を検出する必要があるため、0~9の10種類の訓練サンプルだけを収集し、分類器に対して訓練を行うことで、簡単且つ迅速に分類器の訓練を完成することができ、また、1桁のみの数字に対して検出及び合併を行うのであるから、比較的高い認識精度も有する。 The beneficial effects of the present invention are as follows. That is, first, each object waiting to be detected is detected, then a one-digit number within the area where each object waiting to be detected is located, and finally, these one-digit numbers are merged to detect each object waiting to be detected. You can get the number corresponding to the object. Since it is necessary to detect only one digit number, we can complete the training of the classifier easily and quickly by collecting only 10 types of training samples from 0 to 9 and training the classifier. Furthermore, since detection and merging are performed for only one-digit numbers, the recognition accuracy is relatively high.

なお、「含む/有する」のような用語は、本明細書に使用されるときに、特徴、要素、ステップ、又はアセンブルの存在を指すが、1つの又は複数の他の特徴、要素、ステップ、又はアセンブリの存在又は付加を排除しないということも指す。 Note that terms such as "comprising/having" as used herein refer to the presence of a feature, element, step, or assembly, but also include one or more other features, elements, steps, It also refers to not excluding the existence or addition of an assembly.

本発明の実施例1におけるナンバー認識装置を示す図である。1 is a diagram showing a number recognition device in Example 1 of the present invention. FIG. 本発明の実施例1における入力画像を示す図である。FIG. 3 is a diagram showing an input image in Example 1 of the present invention. 図2における検出待ちオブジェクトの所在する検出枠及びその1桁の数字の検出結果を示す図である。FIG. 3 is a diagram showing a detection frame in which a detection-waiting object is located in FIG. 2 and a detection result of its one-digit number. 本発明の実施例1において1つの検出待ちオブジェクトの所在する領域のうちから1桁の数字を検出することを示す図である。FIG. 3 is a diagram illustrating detecting a one-digit number from an area where one detection-waiting object is located in the first embodiment of the present invention. 本発明の実施例1において1つの検出待ちオブジェクトの所在する領域のうちから1桁の数字を検出することを示す他の図である。FIG. 7 is another diagram showing detecting a one-digit number from a region where one detection-waiting object is located in the first embodiment of the present invention. 本発明の実施例2における電子機器を示す図である。FIG. 3 is a diagram showing an electronic device in Example 2 of the present invention. 本発明の実施例2における電子機器のシステム構成を示す図である。FIG. 3 is a diagram showing a system configuration of an electronic device in Example 2 of the present invention. 本発明の実施例3におけるナンバー認識方法を示す図である。FIG. 7 is a diagram showing a number recognition method in Example 3 of the present invention.

以下、添付した図面を参照しながら、本発明を実施するための好適な実施形態を詳しく説明する。 Hereinafter, preferred embodiments for carrying out the present invention will be described in detail with reference to the accompanying drawings.

本発明の実施例は、ナンバー認識装置を提供する。図1は、本発明の実施例1におけるナンバー認識装置を示す図である。図1に示すように、ナンバー認識装置100は、以下のようなものを含む。 Embodiments of the invention provide a number recognition device. FIG. 1 is a diagram showing a number recognition device in Embodiment 1 of the present invention. As shown in FIG. 1, the number recognition device 100 includes the following.

第一検出ユニット101:入力画像から検出待ちオブジェクトを検出し;
第二検出ユニット102:検出された検出待ちオブジェクトの所在する領域から1桁の数字を検出し;及び
合併ユニット103:該検出待ちオブジェクトの所在する領域から検出された1桁の数字に対して合併を行うことで、該検出待ちオブジェクトの所在する領域中のナンバーを取得する。
First detection unit 101: detects an object waiting to be detected from an input image;
Second detection unit 102: detects a one-digit number from the area where the detected object waiting to be detected is located; and Merging unit 103: merges the one-digit number detected from the area where the object waiting to be detected is located. By doing this, the number in the area where the object waiting to be detected is located is obtained.

上述の実施例から分かるように、1桁のみの数字を検出する必要があるため、0~9の10種類の訓練サンプルだけを収集し、分類器に対して訓練を行っても良いので、簡単且つ迅速に分類器の訓練を完成することができ、また、1桁のみの数字に対して検出及び合併を行うのであるから、比較的高い認識精度も有する。 As you can see from the example above, it is necessary to detect only one digit number, so it is easy to collect only 10 types of training samples from 0 to 9 and train the classifier. Moreover, the training of the classifier can be completed quickly, and since detection and merging are performed for only one-digit numbers, the recognition accuracy is relatively high.

本実施例では、該検出待ちオブジェクトは、そのナンバーを認識するニーズを有する任意のオブジェクトであっても良い。例えば、該検出待ちオブジェクトは、試合中の選手、ナンバーを含む標識ボード、イベントに参加するスタッフ、テストに参加する学生、試合に参加する選手などである。 In this embodiment, the object waiting to be detected may be any object whose number needs to be recognized. For example, the objects waiting to be detected include players in a match, signboards including numbers, staff members participating in an event, students participating in a test, players participating in a match, and the like.

例えば、試合に参加するバスケットボール又はサッカー選手の場合、その可能なナンバーが0~99であり、試合に参加する陸上競技選手の場合、その可能なナンバーが0000~9999である。 For example, for a basketball or soccer player participating in a game, the possible numbers are 0-99, and for a track and field athlete participating in the game, the possible numbers are 0000-9999.

本実施例では、該入力画像は、検出待ちオブジェクトを含む可能性がある画像である。例えば、該検出待ちオブジェクトは、バスケットボール選手であり、該入力画像は、バスケットボール試合のビデオにおける少なくとも1つの画像である。 In this embodiment, the input image is an image that may include an object waiting to be detected. For example, the object awaiting detection is a basketball player and the input image is at least one image in a video of a basketball game.

本実施例では、第一検出ユニット101の検出待ちオブジェクトへの検出、及び、第二検出ユニット102の1桁の数字への検出が、各種の検出方法に基づいても良く、例えば、該第一検出ユニット101及び該第二検出ユニット102は、畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)により、それぞれ、該入力画像中の検出待ちオブジェクト、及び該検出待ちオブジェクトの所在する領域中の1桁の数字に対して検出を行っても良い。 In this embodiment, the detection of the object waiting to be detected by the first detection unit 101 and the detection of the one-digit number by the second detection unit 102 may be based on various detection methods. The detection unit 101 and the second detection unit 102 use a convolutional neural network (CNN) to detect the object to be detected in the input image and the one-digit number in the area where the object to be detected is located, respectively. Detection may also be performed for.

本実施例では、該畳み込みニューラルネットワークの具体的構成について、従来技術を参照することができる。例えば、該畳み込みニューラルネットワークは、Faster R-CNN、FPN(Feature Pyramid Networks for object Detection)又はYOLO(You Only Look Once:Unified,Real-Time Object Detection)である。 In this embodiment, the prior art can be referred to for the specific configuration of the convolutional neural network. For example, the convolutional neural network is Faster R-CNN, FPN (Feature Pyramid Networks for object Detection) or YOLO (You Only Look Once: Unified, Real-Time Object Detection).

本実施例では、畳み込みニューラルネットワークに対しての訓練方法についても、従来技術を参照することができるため、ここでは、その詳しい説明を省略する。 In this embodiment, the prior art can also be referred to for the training method for the convolutional neural network, so a detailed explanation thereof will be omitted here.

畳み込みニューラルネットワークが高い目標認識能力を有し、また、リアル環境中の複雑なファクターを簡略化することもできるので、検出効率及び検出精度をさらに向上させることができる。 Since the convolutional neural network has high target recognition ability and can also simplify complex factors in the real environment, the detection efficiency and detection accuracy can be further improved.

本実施例では、バスケットボール試合中の選手のユニフォーム上のナンバーを例として例示的に説明する。 In this embodiment, numbers on the uniforms of players during a basketball game will be exemplified.

図2は、本発明の実施例1における入力画像を示す図である。図2に示すように、該入力画像は、バスケットボール試合ビデオにおける1つの画像であり、それは、検出待ちオブジェクトとしての複数の選手を含む。第一検出ユニット101は、該入力画像中の各選手を検出し、各選手の所在する領域を取得し、また、このような領域は、各検出枠で示される。 FIG. 2 is a diagram showing an input image in Example 1 of the present invention. As shown in FIG. 2, the input image is one image in a basketball game video, which includes multiple players as objects waiting to be detected. The first detection unit 101 detects each player in the input image and obtains the area where each player is located, and such area is indicated by each detection frame.

図3は、図2における検出待ちオブジェクトの所在する検出枠、及びその1桁の数字の検出結果を示す図である。図3に示すように、検出された各選手の所在する領域は、各検出枠で示されており、各検出枠中の1桁の数字の検出結果は、順に、“結果無し”、“3及び0”、“2”、“結果無し”、“2及び3”、“0”、及び“8”である。 FIG. 3 is a diagram showing the detection frame in which the detection-waiting object in FIG. 2 is located, and the detection result of its one-digit number. As shown in Figure 3, the area where each detected player is located is shown in each detection frame, and the detection results of the one-digit number in each detection frame are sequentially “No result”, “3 and 0”, “2”, “no result”, “2 and 3”, “0”, and “8”.

本実施例では、各検出待ちオブジェクトの所在する領域から1桁の数字を検出した後、且つ、各領域内の1桁の数字に対して合併を行う前に、幾つかの前処理を行っても良い。例えば、図1に示すように、該装置100は、さらに、以下のようなものを含んでも良い。 In this example, after detecting a single digit number from the area where each object waiting to be detected is located, and before merging the single digit numbers in each area, some preprocessing is performed. Also good. For example, as shown in FIG. 1, the device 100 may further include the following.

第一除去ユニット104:検出された1桁の数字について、該畳み込みニューラルネットワークにより出力されるスコア(score)が第一閾値よりも低いときに、該1桁の数字を検出結果から除去する。 First removal unit 104: for a detected one-digit number, when the score output by the convolutional neural network is lower than a first threshold, remove the one-digit number from the detection result.

本実施例では、畳み込みニューラルネットワークを用いて1桁の数字に対して検出を行うときに、その出力結果は、検出された1桁の数字の所在する座標位置、及び、該1桁の数字のスコア、即ち、検出された1桁の数字が該1桁の数字の類別(class)に属する確率を含んでも良い。 In this example, when a convolutional neural network is used to detect a single digit number, the output results include the coordinate position of the detected single digit number and the coordinate position of the detected single digit number. The score may include a probability that the detected single-digit number belongs to the class of the single-digit number.

本実施例では、該第一閾値は、実際のニーズに応じて設定されても良く、例えば、該第一閾値は、0.5である。 In this embodiment, the first threshold value may be set according to actual needs, for example, the first threshold value is 0.5.

このように、スコアが比較的低い1桁の数字を除去することで、幾つかの誤検出結果を有効に除去することができ、これにより、ナンバー認識の認識精度をさらに向上させることができる。 By removing single-digit numbers with relatively low scores in this way, some false positive results can be effectively removed, thereby further improving the recognition accuracy of number recognition.

図1に示すように、該装置100は、さらに、以下のようなものを含んでも良い。 As shown in FIG. 1, the device 100 may further include the following.

第二除去ユニット105:該検出待ちオブジェクトの所在する領域の中から検出された少なくとも2つの隣接する1桁の数字の間の距離が第二閾値よりも大きいときに、該少なくとも2つの隣接する1桁の数字のうち、該畳み込みニューラルネットワークにより出力されるスコアが第三閾値によりも低い1桁の数字を除去する。 Second removal unit 105: When the distance between the at least two adjacent one-digit numbers detected in the area where the detection-waiting object is located is greater than the second threshold, the at least two adjacent one-digit numbers are removed. Among the digits, one digit whose score output by the convolutional neural network is lower than a third threshold is removed.

本実施例では、該第二閾値及び第三閾値は、実際のニーズに応じて確定されても良い。例えば、該第二閾値は、隣接する2つの1桁の数字の検出枠の幅の和であり、該第三閾値は、0.9である。 In this embodiment, the second threshold value and the third threshold value may be determined according to actual needs. For example, the second threshold is the sum of the widths of detection frames of two adjacent one-digit numbers, and the third threshold is 0.9.

図4は、本発明の実施例1において1つの検出待ちオブジェクトの所在する領域から検出された1桁の数字を示す図である。図4に示すように、1つの検出待ちオブジェクトの所在する領域内で2つの隣接する1桁の数字が検出されており、それぞれ、2及び3であり、この2つの1桁の数字の中心の距離がdであり、また、この2つの1桁の数字について、畳み込みニューラルネットワークにより出力されるスコアがそれぞれ0.68及び0.99である。 FIG. 4 is a diagram showing a one-digit number detected from an area where one detection-waiting object is located in the first embodiment of the present invention. As shown in Figure 4, two adjacent single-digit numbers are detected within the area where one detection-waiting object is located, 2 and 3, respectively, and the center of the two single-digit numbers is 2 and 3. The distance is d, and the scores output by the convolutional neural network for these two single-digit numbers are 0.68 and 0.99, respectively.

例えば、該距離dが1桁の数字2及び3の検出枠の幅の和よりも大きい場合、スコアが0.9よりも低い1桁の数字、即ち、スコアが0.68である1桁の数字2を除去することができる。 For example, if the distance d is larger than the sum of the widths of the detection frames of single-digit numbers 2 and 3, remove the single-digit number with a score lower than 0.9, that is, the single-digit number 2 with a score of 0.68. can do.

このように、距離が比較的大きい隣接する1桁の数字のうち、スコアが比較的低い1桁の数字を除去することで、合併の結果が同一検出待ちオブジェクトのナンバーであるように保証することができ、これにより、ナンバー認識の認識精度をさらに向上させることができる。 In this way, by removing a single digit number with a relatively low score among adjacent single digit numbers with a relatively large distance, it is possible to ensure that the result of the merger is the number of the same object waiting to be detected. This makes it possible to further improve the recognition accuracy of number recognition.

図1に示すように、該装置100は、さらに、以下のようなものを含んでも良い。 As shown in FIG. 1, the device 100 may further include the following.

確定ユニット106:該検出待ちオブジェクトの所在する領域における重畳(overlap)した少なくとも2つの検出領域のうちから、それぞれ、1桁の数字が検出されたときに、該畳み込みニューラルネットワークにより出力されるスコアが最も高い1桁の数字を合併処理に用いる。 Determining unit 106: A score output by the convolutional neural network when a one-digit number is detected from each of at least two overlapping detection areas in the area where the object waiting for detection is located. The highest single digit number is used for the merge process.

図5は、本発明の実施例1において1つの検出待ちオブジェクトの所在する領域から検出された1桁の数字を示す他の図である。図5に示すように、1つの検出待ちオブジェクトの所在する領域に対して、重畳した2つの検出領域(検出枠)が検出され、その検出結果が、それぞれ、1桁の数字7及び1であり、この場合、スコアが比較的低い1桁の数字1を除去する。 FIG. 5 is another diagram showing a one-digit number detected from an area where one detection-waiting object is located in the first embodiment of the present invention. As shown in Figure 5, two superimposed detection areas (detection frames) are detected for the area where one object waiting for detection is located, and the detection results are one-digit numbers 7 and 1, respectively. , in this case, remove the single digit number 1, which has a relatively low score.

このように、誤検出された1桁の数字をさらに除去することができ、そのため、ナンバー認識の認識精度をより一層向上させることができる。 In this way, erroneously detected one-digit numbers can be further removed, and therefore the recognition accuracy of number recognition can be further improved.

本実施例では、第一除去ユニット104、第二除去ユニット105及び確定ユニット106は、オプションであっても良い。 In this embodiment, the first removal unit 104, the second removal unit 105, and the determination unit 106 may be optional.

本実施例では、各検出待ちオブジェクトの所在する領域から1桁の数字が検出された後に、上述の少なくとも1つの前処理を行ってから、1桁の数字の合併を行っても良く、又は、これらの前処理を行わず、1桁の数字の合併を直接行っても良い。 In this embodiment, after a one-digit number is detected from the area where each object waiting to be detected is located, at least one preprocessing described above may be performed, and then the one-digit numbers may be merged. One-digit numbers may be directly merged without performing these pre-processing steps.

本実施例では、合併ユニット103は、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字に対して合併を行うことにより、該検出待ちオブジェクトの所在する領域におけるナンバーを得ることができる。言い換えると、入力画像から複数の検出待ちオブジェクトが検出されたときに、合併ユニット103は、各検出待ちオブジェクトの所在する領域に対して、1つずつ、1桁の数字の合併を行うことで、各検出待ちオブジェクトに対応するナンバーを取得することができる。なお、1つの検出待ちオブジェクトの所在する領域において1つのみの1桁の数字が検出されたときに、合併処理を行わなくても良い。 In this embodiment, the merging unit 103 obtains the number in the area where the object waiting to be detected is located by merging the one-digit numbers detected in the area where the object waiting to be detected is located. I can do it. In other words, when a plurality of objects waiting to be detected are detected from the input image, the merging unit 103 merges one-digit numbers one by one for the area where each object waiting to be detected is located. A number corresponding to each object waiting to be detected can be obtained. Note that when only one one-digit number is detected in the area where one detection-waiting object is located, it is not necessary to perform the merging process.

以下、合併ユニット103が1桁の数字に対して合併を行う具体的な方法について例示的に説明する。 A specific method by which the merging unit 103 performs merging on one-digit numbers will be exemplified below.

本実施例では、合併ユニット103は、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字の中心位置に基づいて、左から右への順序に従って各1桁の数字を合併する。 In this embodiment, the merging unit 103 merges each one-digit number in order from left to right based on the center position of the one-digit number detected in the area where the object waiting for detection is located. .

図3に示すように、合併ユニット103は、各検出待ちオブジェクトの所在する領域に対して、1つずつ、1桁の数字の合併を行い、各検出待ちオブジェクトに対応するナンバー認識結果を取得し、それぞれは、“結果無し”、“30”、“2”、“結果無し”、“23”、“0”及び“8”である。 As shown in FIG. 3, the merging unit 103 merges one-digit numbers one by one for the area where each object waiting to be detected is located, and obtains a number recognition result corresponding to each object waiting to be detected. , respectively, are "no result", "30", "2", "no result", "23", "0" and "8".

本実施例では、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字の個数が該ナンバーの最大桁数よりも大きいときに、該畳み込みニューラルネットワークにより出力されるスコアに基づいて、検出された1桁の数字のうちから、該最大桁数と同じ数の1桁の数字に対して合併を行っても良い。 In this embodiment, when the number of one-digit numbers detected in the area where the object waiting for detection is located is greater than the maximum number of digits of the number, the score output by the convolutional neural network is calculated based on the score output by the convolutional neural network. , the same number of single-digit numbers as the maximum number of digits may be merged from among the detected single-digit numbers.

例えば、バスケットボール選手について、そのナンバーが2桁であり、1つの検出待ちオブジェクトの所在する領域において3つ又はより多くの1桁の数字が検出されるときに、各1桁の数字について該畳み込みニューラルネットワークにより出力されるスコアに基づいて、2つの1桁の数字を選択して合併を行っても良い。例えば、3つ又はより多くの1桁の数字について、スコアの高から低への順序に従って並び替えた後に、その前の2つの1桁の数字を選択し、合併を行っても良い。 For example, for a basketball player, when his number is 2 digits and three or more 1-digit numbers are detected in the area where one detection waiting object is located, the convolutional neural network for each 1-digit number is Based on the score output by the network, two single-digit numbers may be selected and merged. For example, after sorting three or more single-digit numbers according to the order of their scores from high to low, the previous two single-digit numbers may be selected and merged.

このように、誤ったナンバー認識結果の出力を避けることができる。 In this way, it is possible to avoid outputting incorrect number recognition results.

上述の実施例から分かるように、先ず、各検出待ちオブジェクトを検出し、その後、各検出待ちオブジェクトの所在する領域内の1桁の数字を検出し、最後に、これらの1桁の数字を合併し、これにより、各検出待ちオブジェクトに対応するナンバーを得ることができる。1桁のみの数字を検出する必要があるため、0~9の10種類の訓練サンプルだけを収集し、分類器に対して訓練を行うことで、簡単且つ迅速に分類器の訓練を完成することができ、また、1桁のみの数字に対して検出及び合併を行うのであるから、比較的高い認識精度も有する。 As can be seen from the above example, first, each object to be detected is detected, then a one-digit number within the area where each object to be detected is located, and finally, these one-digit numbers are merged. In this way, a number corresponding to each object waiting to be detected can be obtained. Since it is necessary to detect only one digit number, we can complete the training of the classifier easily and quickly by collecting only 10 types of training samples from 0 to 9 and training the classifier. Furthermore, since detection and merging are performed for only one-digit numbers, the recognition accuracy is relatively high.

本発明の実施例は、さらに、電子機器を提供し、図6は、本発明の実施例2における電子機器を示す図である。図6に示すように、電子機器600は、ナンバー認識装置601を含み、該ナンバー認識装置601の構成及び機能が実施例1中の記載と同じであるため、ここでは、その詳しい説明を省略する。 The embodiment of the present invention further provides an electronic device, and FIG. 6 is a diagram showing the electronic device in a second embodiment of the present invention. As shown in FIG. 6, the electronic device 600 includes a number recognition device 601, and the configuration and function of the number recognition device 601 are the same as those described in the first embodiment, so a detailed explanation thereof will be omitted here. .

図7は、本発明の実施例2における電子機器のシステム構成を示すブロック図である。図7に示すように、電子機器700は、中央処理装置701及び記憶器702を含み、該記憶器702は、該中央処理装置701に接続される。なお、該図は、例示に過ぎず、該構造に対して、他の類型の構造により補充又は代替を行うことで、電気通信機能又は他の機能を実現しても良い。 FIG. 7 is a block diagram showing the system configuration of an electronic device in Example 2 of the present invention. As shown in FIG. 7, electronic device 700 includes a central processing unit 701 and a memory 702, and the memory 702 is connected to the central processing unit 701. Note that the figure is merely an example, and the telecommunication function or other functions may be realized by supplementing or replacing the structure with other types of structures.

図7に示すように、該電子機器700は、さらに、入力ユニット703、表示器704、電源705などを含んでも良い。 As shown in FIG. 7, the electronic device 700 may further include an input unit 703, a display 704, a power source 705, and the like.

1つの実施方式では、実施例1に記載のナンバー認識装置の機能は、該中央処理装置701に統合されても良い。そのうち、該中央処理装置701は、次のように構成されても良く、即ち、入力画像から検出待ちオブジェクトを検出し、検出された該検出待ちオブジェクトの所在する領域の中から1桁の数字を検出し、及び、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字に対して合併を行い、該検出待ちオブジェクトの所在する領域の中のナンバーを取得する。 In one implementation, the functionality of the number recognition device described in Example 1 may be integrated into the central processing unit 701. The central processing unit 701 may be configured as follows, that is, detects an object waiting to be detected from an input image, and calculates a one-digit number from the area where the detected object waiting to be detected is located. The one-digit number detected in the area where the object waiting to be detected is located is merged to obtain the number in the area where the object waiting to be detected is located.

例えば、畳み込みニューラルネットワークにより、それぞれ、該検出待ちオブジェクト及び該1桁の数字を検出する。 For example, the object to be detected and the one-digit number are respectively detected by a convolutional neural network.

例えば、検出された1桁の数字について、該畳み込みニューラルネットワークにより出力されるスコアが第一閾値よりも低いときに、該1桁の数字を検出結果から除去する。 For example, when the score output by the convolutional neural network for a detected one-digit number is lower than a first threshold, the one-digit number is removed from the detection results.

例えば、該検出待ちオブジェクトの所在する領域の中から検出された少なくとも2つの隣接する1桁の数字の間の距離が第二閾値よりも大きいときに、該少なくとも2つの隣接する1桁の数字のうち、該畳み込みニューラルネットワークにより出力されるスコアが第三閾値よりも低い1桁の数字を除去する。 For example, when the distance between at least two adjacent one-digit numbers detected in the area where the detection-waiting object is located is greater than a second threshold, the distance between the at least two adjacent one-digit numbers is Among them, one-digit numbers whose scores output by the convolutional neural network are lower than the third threshold are removed.

例えば、該検出待ちオブジェクトの所在する領域における重畳した少なくとも2つの検出領域内でそれぞれ1桁の数字を検出するときに、該畳み込みニューラルネットワークにより出力されるスコアが最も高い1桁の数字を合併処理に用いる。 For example, when detecting one-digit numbers in each of at least two overlapping detection areas in the area where the detection-waiting object is located, the one-digit number output by the convolutional neural network with the highest score is merged. used for

例えば、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字に対して合併を行うことは、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字の中心位置に基づいて、左から右への順序に従って各1桁の数字を合併することを含む。 For example, merging the one-digit numbers detected from the area where the object waiting to be detected is located means that the center position of the one-digit number detected from the area where the object waiting to be detected is located. involves merging each single-digit number according to left-to-right order based on .

例えば、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字に対して合併を行うことは、該検出待ちオブジェクトの所在する領域の中から検出された1桁の数字の個数が該ナンバーの最大桁数よりも大きいときに、該畳み込みニューラルネットワークにより出力されるスコアに基づいて、検出された1桁の数字のうち、該最大桁数と同じ数の1桁の数字に対して合併を行うことを含む。 For example, merging one-digit numbers detected from the area where the object waiting to be detected is located means that the number of one-digit numbers detected from the area where the object waiting to be detected is located is Based on the score output by the convolutional neural network when the number is greater than the maximum number of digits, among the detected one-digit numbers, for the same number of one-digit numbers as the maximum number of digits. Including undertaking a merger.

もう1つの実施方式では、実施例1に記載のナンバー認識装置は、該中央処理装置701と別々で配置されても良く、例えば、該ナンバー認識装置を、該中央処理装置701に接続されるチップ(chip)として構成し、該中央処理装置701の制御により、該ナンバー認識装置の機能を実現しても良い。 In another implementation, the number recognition device described in Example 1 may be arranged separately from the central processing unit 701, for example, the number recognition device can be placed on a chip connected to the central processing unit 701. (chip), and the functions of the number recognition device may be realized under the control of the central processing unit 701.

本実施例では、該電子機器700は、図7に示す全ての部品を含む必要がない。 In this embodiment, the electronic device 700 does not need to include all the components shown in FIG.

図7に示すように、該中央処理装置701は、制御器又は操作コントローラと称される場合があり、マイクロプロセッサ、他の処理器装置及び/又は論理装置を含んでも良く、該中央処理装置701は、入力を受信して該電子機器700の各部品の操作を制御することができる。 As shown in FIG. 7, the central processing unit 701 may be referred to as a controller or operating controller, and may include a microprocessor, other processor devices, and/or logic devices; can receive input and control the operation of each component of the electronic device 700.

該記憶器702は、例えば、バッファ、フレッシュメモリ、HDD、移動可能な媒体、揮発記憶器、不揮発記憶器、或いは、他の適切な装置のうちの1つ又は複数であっても良い。また、該中央処理装置701は、該記憶器702に記憶されたプログラムを実行することで、情報の記憶、処理などを実現することができる。なお、他の機能は、従来技術と類似したので、ここでは、その詳しい説明を省略する。また、該電子機器700の各部品は、専用ハードウェア、ファームウェア、ソフトウェア、又はその組み合わせにより実現されても良いが、その全ては、本発明の範囲に属する。 The storage 702 may be, for example, one or more of a buffer, fresh memory, HDD, movable media, volatile storage, non-volatile storage, or other suitable device. Further, the central processing unit 701 can store and process information by executing a program stored in the storage device 702. Note that other functions are similar to those of the prior art, so detailed explanation thereof will be omitted here. Furthermore, each component of the electronic device 700 may be realized by dedicated hardware, firmware, software, or a combination thereof, all of which fall within the scope of the present invention.

上述の実施例から分かるように、1桁のみの数字を検出する必要があるため、0~9の10種類の訓練サンプルだけを収集し、分類器に対して訓練を行うことで、簡単且つ迅速に分類器の訓練を完成することができ、1桁のみの数字に対して検出及び合併を行うのであるから、比較的高い認識精度も有する。 As you can see from the example above, since it is necessary to detect only one digit number, we can easily and quickly collect only 10 types of training samples from 0 to 9 and train the classifier. It is possible to complete the training of the classifier in a short period of time, and since detection and merging are performed for only one digit number, the recognition accuracy is relatively high.

本発明の実施例は、さらに、ナンバー認識方法を提供し、該方法は、実施例1におけるナンバー認識装置に対応する。図8は、本発明の実施例3におけるナンバー認識方法を示す図である。図8に示すように、該方法は、以下のようなステップを含む。 The embodiment of the present invention further provides a number recognition method, which corresponds to the number recognition device in the first embodiment. FIG. 8 is a diagram showing a number recognition method in Example 3 of the present invention. As shown in FIG. 8, the method includes the following steps.

ステップ801:入力画像から検出待ちオブジェクトを検出し;
ステップ802:検出された該検出待ちオブジェクトの所在する領域から1桁の数字を検出し;及び
ステップ803:該検出待ちオブジェクトの所在する領域から検出された1桁の数字に対して合併を行い、該検出待ちオブジェクトの所在する領域におけるナンバーを取得する。
Step 801: Detect the object waiting to be detected from the input image;
Step 802: Detecting a one-digit number from the area where the detected object waiting to be detected is located; and Step 803: Merging the one-digit numbers detected from the area where the object waiting to be detected is located; The number in the area where the object waiting to be detected is located is acquired.

本実施例では、上述の各ステップの具体的な実現方法は、実施例1中の記載を参照することができ、ここでは、その重複説明を割愛する。 In this embodiment, the description in Embodiment 1 can be referred to for the specific implementation method of each of the above-mentioned steps, and redundant explanation thereof will be omitted here.

上述の実施例から分かるように、1桁のみの数字を検出する必要があるため、0~9の10種類の訓練サンプルだけを収集し、分類器に対して訓練を行うことで、簡単且つ迅速に分類器の訓練を完成することができ、また、1桁のみの数字に対して検出及び合併を行うのであるから、比較的高い認識精度も有する。 As you can see from the example above, since it is necessary to detect only one digit number, we can easily and quickly collect only 10 types of training samples from 0 to 9 and train the classifier. It is possible to complete the training of the classifier in a short period of time, and since detection and merging are performed for only one digit number, the recognition accuracy is relatively high.

また、本発明の実施例は、さらに、コンピュータ可読プログラムを提供し、そのうち、ナンバー認識装置又は電子機器中で前記プログラムを実行するときに、前記プログラムは、コンピュータに、前記ナンバー認識装置又は電子機器中で実施例3に記載のナンバー認識方法を実行させる。 The embodiment of the present invention further provides a computer readable program, wherein when the program is executed in a number recognition device or an electronic device, the program causes the computer to read the number recognition device or the electronic device. Inside, the number recognition method described in Example 3 is executed.

本発明の実施例は、さらに、コンピュータ可読プログラムを記憶した記憶媒体を提供し、そのうち、前記コンピュータ可読プログラムは、コンピュータに、ナンバー認識装置又は電子機器中で実施例3に記載のナンバー認識方法を実行させることができる。 The embodiment of the present invention further provides a storage medium storing a computer-readable program, wherein the computer-readable program causes a computer to perform the number recognition method according to embodiment 3 in a number recognition device or an electronic device. can be executed.

また、本発明の実施例による装置、方法などは、ソフトウェアにより実現されても良く、ハードェアにより実現されてもよく、ハードェア及びソフトウェアの組み合わせにより実現されても良い。本発明は、このようなコンピュータ可読プログラムにも関し、即ち、前記プログラムは、ロジック部品により実行されるときに、前記ロジック部品に、上述の装置又は構成要素を実現させることができ、又は、前記ロジック部品に、上述の方法又はそのステップを実現させることができる。さらに、本発明は、上述のプログラムを記憶した記憶媒体、例えば、ハードディスク、磁気ディスク、光ディスク、DVD、フレッシュメモリなどにも関する。 Further, the apparatuses, methods, etc. according to the embodiments of the present invention may be implemented by software, hardware, or a combination of hardware and software. The invention also relates to such a computer readable program, i.e. said program, when executed by a logic component, is capable of causing said logic component to implement the above-mentioned device or component; A logic component may implement the method or steps thereof described above. Furthermore, the present invention also relates to a storage medium storing the above program, such as a hard disk, a magnetic disk, an optical disk, a DVD, and a fresh memory.

また、上述の実施例などに関して、さらに以下の付記も開示する。 Further, regarding the above-mentioned embodiments, the following additional notes are also disclosed.

(付記1)
ナンバー認識方法であって、
入力画像から検出待ちオブジェクトを検出し;
検出された前記検出待ちオブジェクトの所在する領域から、1桁の数字を検出し;及び
前記検出待ちオブジェクトの所在する領域から検出された1桁の数字に対して合併を行い、前記検出待ちオブジェクトの所在する領域におけるナンバーを得ることを含む、方法。
(Additional note 1)
A number recognition method,
Detect the object waiting to be detected from the input image;
detecting a one-digit number from the area where the detected object waiting to be detected is located; and merging the one-digit numbers detected from the area where the object waiting to be detected is located; A method comprising obtaining a number in a region.

(付記2)
付記1に記載の方法であって、
畳み込みニューラルネットワークにより、それぞれ、前記検出待ちオブジェクト及び前記1桁の数字を検出する、方法。
(Additional note 2)
The method described in Appendix 1,
A method for detecting the object to be detected and the one-digit number, respectively, by a convolutional neural network.

(付記3)
付記2に記載の方法であって、さらに、
検出された1桁の数字について、前記畳み込みニューラルネットワークにより出力されるスコアが第一閾値よりも低いときに、該1桁の数字を検出結果から除去することを含む、方法。
(Appendix 3)
The method described in Appendix 2, further comprising:
A method comprising removing a detected single-digit number from a detection result when a score output by the convolutional neural network for the detected single-digit number is lower than a first threshold.

(付記4)
付記2に記載の方法であって、さらに、
前記検出待ちオブジェクトの所在する領域から検出された少なくとも2つの隣接する1桁の数字の間の距離が第二閾値よりも大きいときに、前記少なくとも2つの隣接する1桁の数字のうち、前記畳み込みニューラルネットワークにより出力されるスコアが第三閾値よりも低い1桁の数字を除去することを含む、方法。
(Appendix 4)
The method described in Appendix 2, further comprising:
When the distance between at least two adjacent one-digit numbers detected from the area where the detection-waiting object is located is greater than a second threshold, the convolution A method comprising removing single digit numbers for which the score output by the neural network is lower than a third threshold.

(付記5)
付記2に記載の方法であって、さらに、
前記検出待ちオブジェクトの所在する領域における重畳した少なくとも2つの検出領域から、それぞれ、1桁の数字を検出するときに、前記畳み込みニューラルネットワークにより出力されるスコアが最も高い桁の数字を前記合併に用いる、方法。
(Appendix 5)
The method described in Appendix 2, further comprising:
When detecting one-digit numbers from each of at least two overlapping detection areas in the area where the detection-waiting object is located, the number with the highest score output by the convolutional neural network is used for the merging. ,Method.

(付記6)
付記1に記載の方法であって、
前記検出待ちオブジェクトの所在する領域から検出された1桁の数字に対して合併を行うことは、
前記検出待ちオブジェクトの所在する領域から検出された1桁の数字の中心位置に基づいて、左から右へ順序に従って各1桁の数字を合併することを含む、方法。
(Appendix 6)
The method described in Appendix 1,
Merging the one-digit numbers detected from the area where the object waiting for detection is located includes:
The method includes merging each single-digit number in order from left to right based on the center position of the single-digit number detected from the area where the detection-waiting object is located.

(付記7)
付記2に記載の方法であって、
前記検出待ちオブジェクトの所在する領域から検出された1桁の数字に対して合併を行うことは、
前記検出待ちオブジェクトの所在する領域から検出された1桁の数字の個数が前記ナンバーの最大桁数より大きいときに、前記畳み込みニューラルネットワークにより出力されるスコアに基づいて、検出された1桁の数字のうちから、前記最大桁数と同じ数の1桁の数字を選択し、合併を行うことを含む、方法。
(Appendix 7)
The method described in Appendix 2,
Merging the one-digit numbers detected from the area where the object waiting for detection is located includes:
A single-digit number detected based on a score output by the convolutional neural network when the number of single-digit numbers detected from the area where the object awaiting detection is located is greater than the maximum number of digits of the number. A method comprising selecting the same number of one-digit numbers as the maximum number of digits from among the numbers and performing a merger.

以上、本発明の好ましい実施形態を説明したが、本発明はこの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の技術的範囲に属する。 Although the preferred embodiments of the present invention have been described above, the present invention is not limited to these embodiments, and any changes to the present invention fall within the technical scope of the present invention unless they depart from the spirit of the present invention.

Claims (7)

ナンバー認識装置であって、
入力画像から検出待ちオブジェクトを検出するための第一検出ユニット;
検出された前記検出待ちオブジェクトの所在する領域から1桁の数字を検出するための第二検出ユニット;及び
前記検出待ちオブジェクトの所在する領域から検出された1桁の数字に対して合併を行い、前記検出待ちオブジェクトの所在する領域におけるナンバーを得るための合併ユニットを含み、
前記第一検出ユニット及び前記第二検出ユニットは、畳み込みニューラルネットワークにより、それぞれ、前記検出待ちオブジェクト及び前記1桁の数字を検出し、
前記ナンバー認識装置は、さらに、
前記検出待ちオブジェクトの所在する領域から検出された少なくとも2つの隣接する1桁の数字の間の距離が第二閾値よりも大きいときに、前記少なくとも2つの隣接する1桁の数字のうち、前記畳み込みニューラルネットワークにより出力されるスコアが第三閾値よりも低い1桁の数字を除去するための第二除去ユニットを含む、ナンバー認識装置。
A number recognition device,
a first detection unit for detecting an object to be detected from an input image;
a second detection unit for detecting a one-digit number from the area where the detected object waiting to be detected is located; and merging the one-digit numbers detected from the area where the object waiting to be detected is located; comprising a merging unit for obtaining a number in an area where the object waiting to be detected is located;
The first detection unit and the second detection unit detect the object waiting to be detected and the one-digit number, respectively, by a convolutional neural network;
The number recognition device further includes:
When the distance between at least two adjacent one-digit numbers detected from the area where the detection-waiting object is located is greater than a second threshold, the convolution A number recognition device, comprising a second removal unit for removing single-digit numbers whose score output by the neural network is lower than a third threshold.
請求項に記載のナンバー認識装置であって、さらに、
検出された1桁の数字について、前記畳み込みニューラルネットワークにより出力されるスコアが第一閾値よりも低いときに、該1桁の数字を検出結果から除去するための第一除去ユニットを含む、ナンバー認識装置。
The number recognition device according to claim 1 , further comprising:
Number recognition , comprising a first removal unit for removing the detected one-digit number from the detection result when the score output by the convolutional neural network is lower than a first threshold. Device.
請求項に記載のナンバー認識装置であって、さらに、
前記検出待ちオブジェクトの所在する領域における重畳した少なくとも2つの検出領域から、それぞれ、1桁の数字を検出するときに、前記畳み込みニューラルネットワークにより出力されるスコアが最も高い1桁の数字を前記合併に用いるための確定ユニットを含む、ナンバー認識装置。
The number recognition device according to claim 1 , further comprising:
When detecting one-digit numbers from at least two overlapping detection areas in the area where the detection-waiting object is located, the one-digit number with the highest score output by the convolutional neural network is used in the combination. Number recognition device, including a confirmation unit for use.
請求項1に記載のナンバー認識装置であって、
前記合併ユニットは、前記検出待ちオブジェクトの所在する領域から検出された1桁の数字の中心位置に基づいて、左から右へとの順序に従って各1桁の数字を合併する、ナンバー認識装置。
The number recognition device according to claim 1,
The merging unit is a number recognition device that merges each one-digit number in order from left to right based on the center position of the one-digit number detected from the area where the detection-waiting object is located.
請求項に記載のナンバー認識装置であって、
前記合併ユニットは、前記検出待ちオブジェクトの所在する領域から検出された1桁の数字の個数が前記ナンバーの最大桁数よりも大きいときに、前記畳み込みニューラルネットワークにより出力されるスコアに基づいて、検出された1桁の数字のうちから、前記最大桁数と同じ数の1桁の数字を選択し、合併を行う、ナンバー認識装置。
The number recognition device according to claim 1 ,
The merging unit performs detection based on the score output by the convolutional neural network when the number of one-digit numbers detected from the area where the detection -waiting object is located is greater than the maximum number of digits of the number. A number recognition device that selects the same number of one-digit numbers as the maximum number of digits from among the one-digit numbers and merges them.
請求項1~のうちの任意の一項に記載のナンバー認識装置を含む、電子機器。 An electronic device comprising the number recognition device according to any one of claims 1 to 5 . ナンバー認識方法であって、
入力画像から検出待ちオブジェクトを検出し;
検出された前記検出待ちオブジェクトの所在する領域から1桁の数字を検出し;及び
前記検出待ちオブジェクトの所在する領域から検出された1桁の数字に対して合併を行い、前記検出待ちオブジェクトの所在する領域におけるナンバーを得ることを含み、
畳み込みニューラルネットワークにより、それぞれ、前記検出待ちオブジェクト及び前記1桁の数字を検出し、
前記ナンバー認識方法は、さらに、
前記検出待ちオブジェクトの所在する領域から検出された少なくとも2つの隣接する1桁の数字の間の距離が第二閾値よりも大きいときに、前記少なくとも2つの隣接する1桁の数字のうち、前記畳み込みニューラルネットワークにより出力されるスコアが第三閾値よりも低い1桁の数字を除去することを含む、ナンバー認識方法。
A number recognition method,
Detect the object waiting to be detected from the input image;
Detecting a one-digit number from the area where the detected object waiting to be detected is located; and merging the one-digit numbers detected from the area where the object waiting to be detected is located, and determining the location of the object waiting to be detected. including obtaining a number in an area where
respectively detecting the object waiting to be detected and the one-digit number by a convolutional neural network;
The number recognition method further includes:
When the distance between at least two adjacent one-digit numbers detected from the area where the detection-waiting object is located is greater than a second threshold, the convolution A number recognition method comprising removing single digit numbers whose score output by a neural network is lower than a third threshold .
JP2019213143A 2018-12-20 2019-11-26 Number recognition device and method Active JP7375497B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811561218.9 2018-12-20
CN201811561218.9A CN111353511B (en) 2018-12-20 2018-12-20 Number recognition device and method

Publications (2)

Publication Number Publication Date
JP2020102203A JP2020102203A (en) 2020-07-02
JP7375497B2 true JP7375497B2 (en) 2023-11-08

Family

ID=71139686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019213143A Active JP7375497B2 (en) 2018-12-20 2019-11-26 Number recognition device and method

Country Status (2)

Country Link
JP (1) JP7375497B2 (en)
CN (1) CN111353511B (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183345A (en) * 2020-09-28 2021-01-05 天地伟业技术有限公司 Clothing number identification method in complex scene

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018519574A (en) 2016-01-05 2018-07-19 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Text image processing method and apparatus
JP2018132894A (en) 2017-02-14 2018-08-23 株式会社Pfu Date identification device, date identification method, and date identification program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050471B (en) * 2014-05-27 2017-02-01 华中科技大学 Natural scene character detection method and system
CN105224939B (en) * 2014-05-29 2021-01-01 小米科技有限责任公司 Digital area identification method and identification device and mobile terminal
CN107346448B (en) * 2016-05-06 2021-12-21 富士通株式会社 Deep neural network-based recognition device, training device and method
CN106650641B (en) * 2016-12-05 2019-05-14 北京文安智能技术股份有限公司 A kind of traffic lights positioning identifying method, apparatus and system
CN107133616B (en) * 2017-04-02 2020-08-28 南京汇川图像视觉技术有限公司 Segmentation-free character positioning and identifying method based on deep learning
CN108388894A (en) * 2017-12-26 2018-08-10 新智数字科技有限公司 A kind of recognition methods, device and the equipment of number meter reading
CN108304842A (en) * 2018-02-01 2018-07-20 重庆中陆承大科技有限公司 Meter reading recognition methods, device and electronic equipment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018519574A (en) 2016-01-05 2018-07-19 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Text image processing method and apparatus
JP2018132894A (en) 2017-02-14 2018-08-23 株式会社Pfu Date identification device, date identification method, and date identification program

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Sebastian Gerke et al.,Soccer Jersey Number Recognition Using Convolutional Neural Networks,IEEE Access [online],2016年02月15日,https://ieeexplore.ieee.org/document/7406449
Shaoqing Ren et al.,Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks,IEEE Access [online],2016年06月06日,https://ieeexplore.ieee.org/document/7485869
大槻 涼 Ryo Otsuki,深層学習を用いた医療機器に表示される数値の認識モデルの提案 Medical Numerical Record Recognition using Deep Learning,一般社団法人人工知能学会 研究会 AIMED:医用人工知能研究会 SIG-AIMED-005 [online] ,日本,一般社団法人人工知能学会,2018年03月14日

Also Published As

Publication number Publication date
CN111353511A (en) 2020-06-30
CN111353511B (en) 2024-03-08
JP2020102203A (en) 2020-07-02

Similar Documents

Publication Publication Date Title
Stadler et al. Improving multiple pedestrian tracking by track management and occlusion handling
Huang et al. Tracknet: A deep learning network for tracking high-speed and tiny objects in sports applications
EP3826317B1 (en) Method and device for identifying key time point of video, computer apparatus and storage medium
Zhang et al. Learning regression and verification networks for long-term visual tracking
CN108352072A (en) Object tracking methods, object tracking apparatus and program
US9053374B2 (en) Biometric training and matching engine
Zheng et al. Localisation of colorectal polyps by convolutional neural network features learnt from white light and narrow band endoscopic images of multiple databases
CN105617638B (en) Badminton racket swing action identification method and device
CN111104925B (en) Image processing method, image processing apparatus, storage medium, and electronic device
US7643674B2 (en) Classification methods, classifier determination methods, classifiers, classifier determination devices, and articles of manufacture
JP6646815B2 (en) Person tracking method and person tracking device
JP7375497B2 (en) Number recognition device and method
US20220108112A1 (en) System and Method for Merging Asynchronous Data Sources
US20220207259A1 (en) Object detection method and apparatus, and electronic device
JP6623851B2 (en) Learning method, information processing device and learning program
JP7396076B2 (en) Number recognition device, method and electronic equipment
US9070045B2 (en) Crosstalk cascades for use in object detection
JP2015215893A (en) Identification method and facility for sign character of exercise participant
Varkarakis et al. Dataset cleaning—a cross validation methodology for large facial datasets using face recognition
Ruiz et al. Weakly supervised polyp segmentation from an attention receptive field mechanism
Hsu et al. Deep hybrid network for automatic quantitative analysis of facial paralysis
JP2008186150A (en) Template matching device and method
US20230047821A1 (en) Active Learning Event Models
Shen et al. Unsupervised human skeleton extraction from Kinect depth images
Zhu et al. Robust visual tracking via samples ranking

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220809

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231009

R150 Certificate of patent or registration of utility model

Ref document number: 7375497

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150