JP2023543640A - 酒ラベル識別方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体 - Google Patents

酒ラベル識別方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体 Download PDF

Info

Publication number
JP2023543640A
JP2023543640A JP2023543251A JP2023543251A JP2023543640A JP 2023543640 A JP2023543640 A JP 2023543640A JP 2023543251 A JP2023543251 A JP 2023543251A JP 2023543251 A JP2023543251 A JP 2023543251A JP 2023543640 A JP2023543640 A JP 2023543640A
Authority
JP
Japan
Prior art keywords
liquor
label
image
target
product information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023543251A
Other languages
English (en)
Inventor
杰 郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2023543640A publication Critical patent/JP2023543640A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/68Food, e.g. fruit or vegetables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19013Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V30/1902Shifting or otherwise transforming the patterns to accommodate for positional errors
    • G06V30/19067Matching configurations of points or features, e.g. constellation matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19093Proximity measures, i.e. similarity or distance measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1912Selecting the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

酒ラベル識別方法、酒製品情報管理方法及びその装置、コンピュータデバイス及びコンピュータ可読記憶媒体を提供する。酒製品画像を取得し、所定のOCR識別方式で酒製品画像のOCR識別を行うことで、酒製品画像に含まれる文字を得る(S21)。所定の深層学習識別方式で酒製品画像の深層学習識別を行うことで、酒製品画像に含まれる画像特徴を得る(S22)。文字と画像特徴に基づいて、文字及び画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、目標酒ラベルを酒製品画像に対応する酒ラベルとする(S33)。酒製品の所在する複雑な環境下でOCR文字識別による酒ラベル文字識別の欠点を深層学習を用いて克服し、深層学習による酒ラベル画像識別の欠点をOCR文字識別を十分に利用して克服することで、酒ラベル識別の正確性と効率を高め、酒製品情報管理の自動化効率を高める。【選択図】図2

Description

(関連出願の相互参照)
本願は、出願番号202011040731.0、出願日2020年9月28日の中国特許出願を基礎として、その優先権を主張しており、その全てがここでは全体として本願に導入されている。
(技術分野)
本願は、酒製品情報管理の技術分野に関し、特に酒ラベル識別方法、酒製品情報管理方法及びその装置、コンピュータデバイス及びコンピュータ可読記憶媒体に関する。
酒類は、古くから今に至って社交の中で重要な役割を果たしてきた。例えば、ワインは、現在の社交の中でますます重要な役割を果たしている。酒類の貯蔵は、一般的に酒蔵に貯蔵される。酒類の貯蔵は、酒蔵に対して特定の環境条件を必要とし、また、酒蔵中の酒製品を管理する必要がある。例えば、ワインの貯蔵について、特に温度と湿度に対する要求が極めて厳しい。また、伝統的なワインセラーについて、その機能の限界から、ワインセラー中に貯蔵されたワイン製品の管理が主に人工的に行われており、ワインの管理効率が低い。
本願は、酒ラベル識別方法、酒製品情報管理方法及びその装置、コンピュータデバイス及びコンピュータ可読記憶媒体を提供し、従来技術の中で酒ラベル識別の正確性が低いという問題を解決することができ、それによって従来技術の中で酒製品の自動化管理効率が低いという問題を解決することができる。
第1の態様では、本願は、酒ラベル識別方法を提供する。前記方法は、酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るステップと、所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るステップと、前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップと、を含む。
第2の態様では、本願は、サーバ側に適用される酒製品情報管理方法を提供する。前記方法は、酒製品画像を含む酒製品情報を取得するステップと、前記酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るステップと、前記酒ラベルに基づいて、前記酒製品情報を管理するステップと、を含む。
第3の態様では、本願は、端末に適用される酒製品情報管理方法を提供する。前記方法は、ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するステップであって、それによって、前記所定のサーバが、前記酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにするステップと、前記所定のサーバから送信された前記目標酒製品情報を受信するステップと、前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するステップと、を含む。
第4の態様では、本願は、更に酒ラベル識別装置を提供し、酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るための第1の識別ユニットと、所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るための第2の識別ユニットと、前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするための第1の選別ユニットと、を含む。
第5の態様では、本願は、更に、サーバ側に適用される酒製品情報管理装置を提供し、酒製品画像を含む酒製品情報を取得するための取得ユニットと、前記酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るための第3の識別ユニットと、前記酒ラベルに基づいて、前記酒製品情報を管理するための管理ユニットと、を含む。
第6の態様では、本願は、更に、端末に適用される酒製品情報管理装置を提供し、ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するための送信ユニットであって、前記所定のサーバが、前記酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにするための送信ユニットと、前記所定のサーバから送信された前記目標酒製品情報を受信するための受信ユニットと、前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するための表示ユニットと、を含む。
第7の態様では、本願は、更に、コンピュータデバイスを提供し、コンピュータプログラムを格納するためのメモリと、前記メモリに接続されたプロセッサであって、前記コンピュータプログラムを実行すると、前記酒ラベル識別方法のステップを実行し、又はサーバ側に適用される前記酒製品情報管理方法のステップを実行し、又は端末に適用される前記酒製品情報管理方法のステップを実行するためのプロセッサとを含む。
第8の態様では、本願は、更に、コンピュータ可読記憶媒体を提供する。前記コンピュータ可読記憶媒体にはコンピュータプログラムが格納されている。前記コンピュータプログラムは、プロセッサによって実行されると、前記酒ラベル識別方法のステップ、又はサーバ側に適用される前記酒製品情報管理方法のステップ、又は端末に適用される前記酒製品情報管理方法のステップを前記プロセッサに実現させる。
本願は、酒ラベル識別方法、酒製品情報管理方法及びその装置、コンピュータデバイス及びコンピュータ可読記憶媒体を提供する。本願において、酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得る。所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得る。前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとする。本願は、OCR文字識別と深層学習画像識別を結合して、機械視覚に基づく酒ラベルの自動識別を実現する。OCR光学識別と深層学習識別の優位性を十分に融合したため、規範文字の識別が速く且つ正確であるというOCR文字識別の利点を十分に利用して、前記酒製品画像に含まれる規範フォントの文字を迅速に識別し、そして、深層学習による画像識別の利点を用いて、酒製品の所在する複雑な環境下でOCR文字識別による酒ラベル文字識別の欠点を克服することができるとともに、深層学習による画像識別が比較的正確であるという利点を十分に利用することもできる。機械視覚に基づく深層学習識別は、多言語文字に対する良好な互換性を実現し、そしてOCR文字識別による規範文字識別の利点を十分に利用して深層学習の検索範囲を縮小し、それによって、深層学習による酒ラベル画像識別の訓練データ量の要求が高すぎ、計算量が大きいという欠点を克服することができる。同時に、深層学習に基づく酒ラベル画像識別は、OCR文字識別を経た小さい目標酒ラベルの範囲内から検索すればよいため、システムの計算資源に対する需要を低減し、リアルタイムで効率的に酒ラベルを正確に識別することができ、酒ラベル識別の正確性と効率を高める。酒ラベルの正確な識別に基づいて、酒蔵中の酒製品に対する自動化管理を実現し、酒製品に対する自動化管理の効率を高める。例えば、ワインを貯蔵するワインセラーの中で、ワインに対してリアルタイムで自動的及び高品質の管理を行うことができ、それによってワインに対する自動化管理の効率を高める。
本願の実施例の技術的態様をより明確に説明するために、以下に、実施例の説明において使用する必要がある図面を簡単に紹介する。明らかに、以下の説明における図面は、本願の一部の実施例であり、当業者にとっては、創造的な労働を払わずに、これらの図面に基づいて他の図面を得ることができる。
本願の実施例による酒ラベル識別方法の適用環境図である。 本願の実施例による酒ラベル識別方法のフローの概略図である。 本願の実施例による酒ラベル識別方法における第1のサブフローの概略図である。 本願の実施例による酒ラベル識別方法における第2のサブフローの概略図である。 本願の実施例によるサーバ側に適用される酒製品情報管理方法のフローの概略図である。 本願の実施例による端末に適用される酒製品情報管理方法のフローの概略図である。 本願の実施例による酒ラベル識別装置のブロック概略図である。 本発明の実施例によるサーバ側に適用される酒製品情報管理装置のブロック概略図である。 本願の実施例による端末に適用される酒製品情報管理装置のブロック概略図である。 本発明の実施例によるコンピュータデバイスのブロック概略図である。
以下、本願の実施例の図面に関連して、本願の実施例の技術的態様を明確に、完全に説明する。明らかに、説明された実施例は、本願の一部の実施例であり、すべての実施例ではない。本願における実施例に基づいて、当業者が創造的な労働を行うことなく取得した他のすべての実施例は、本願の保護範囲に属する。
なお、本明細書及び添付の特許請求の範囲で使用される場合、用語「含む」及び「からなる」は、説明された特徴、全体、ステップ、動作、要素及び/又はコンポーネントの存在を示すが、1つ又は複数の他の特徴、全体、ステップ、動作、要素、コンポーネント、及び/又はそれらの集合の存在又は追加を排除するものではない。
図1を参照する。図1は、本願の実施例による酒ラベル識別方法の適用環境図である。図1に示すように、この適用環境は、以下を含む。
(1)酒蔵
酒蔵の異なる位置には、複数のカメラが設置されている。図1に示すように、この例の酒蔵には、酒蔵の中の酒製品を撮影するためのカメラ1、カメラ2、カメラ3及びカメラ4が設置されている。引き続き図を参照する。図1に示すように、この例では、ワイン1、ワイン2及びワイン3が含まれている。カメラ1とカメラ2は、ワイン1を撮影するために用いられ、カメラ3は、ワイン2を撮影するために用いられ、カメラ4は、ワイン3を撮影するために用いられる。酒製品は、酒キャビネットに格納された酒製品であってもよい。また、酒製品は、酒蔵の出入り口に出入りする酒製品であってもよい。その場合、酒蔵の出入り口にカメラを設置する必要があり、酒蔵に出入りする酒製品を酒蔵の出入り口のカメラで撮影し、酒製品の自動化管理を行う。
(2)サーバ
カメラが撮影してアップロードした酒製品に対応する酒製品画像を受信し、酒製品画像に対して酒ラベル識別を行い、酒ラベル識別に対応する酒ラベル識別結果に基づいて、酒製品画像に対応する酒製品に対して酒製品情報を管理するために使用される。
(3)端末
酒製品に対応する酒製品情報に対するユーザの照会、編集、削除などの操作を受信し、ユーザの操作に応答して、サーバからユーザの操作に対応する酒製品情報を取得するために使用される。端末にインストールされた酒製品情報管理のAPPを通じて、酒製品情報に対する操作を行うことができる。
以上の各主体の動作過程は、以下の通りである。
1)酒蔵の中のカメラは、酒蔵の中の酒製品に対応する酒製品画像を撮影し、そして酒製品画像をサーバにアップロードする。例えば、図1のカメラ1とカメラ2は、ワイン1に対応するワイン製品画像1を撮影し、カメラ3は、ワイン2に対応するワイン製品画像2を撮影し、カメラ4は、ワイン3に対応するワイン製品画像3を撮影し、そしてワイン製品画像1、ワイン製品画像2及びワイン製品画像3をサーバにアップロードする。
2)サーバは、酒製品画像を含む酒製品情報を受信し、例えば、ワイン製品画像1、ワイン製品画像2又はワイン製品画像3を受信する。酒製品画像を受信した後に、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得る。所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得る。前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとする。識別された酒ラベルに基づいて、前記酒製品画像に対応する酒製品の酒製品情報に対して、記録、削除、編集などの酒製品情報の管理を行う。
3)ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信する。それによって、前記所定のサーバが、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにする。前記目標酒製品情報は、前記酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含む。前記所定のサーバから送信された前記目標酒製品情報を受信する。前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示する。
図2を参照する。図2は、本願の実施例による酒ラベル識別方法のフローの概略図である。図2に示すように、本方法は、以下のステップS21~S23を含む。
S21において、酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得る。
ここで、光学文字識別OCR(Optical Character Recognition)は、光学的な方法で文書中の文字を白黒格子の画像ファイルに変換し、識別ソフトウェアを通じて画像中の文字をテキストフォーマットに変換する。
具体的には、酒ラベル識別を行う際には、ユーザがスマートフォンなどのカメラ付き画像収集装置を介して酒製品に対応する酒製品画像を収集するようにしてもよいし、酒蔵に設置されたカメラを介して酒蔵の中の酒製品画像を収集するようにしてもよい。酒ラベル識別を行うコンピュータデバイスに酒製品画像をアップロードして、前記コンピュータデバイスは、識別すべき酒製品画像を取得する。次いで、前記コンピュータデバイスは、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を抽出し、前記文字を目標文字とする。OCR技術は、規範的な文字などの文字型コンテンツを識別するのが得意なため、酒製品画像に含まれる文字を正確に識別することができる。例えば、ワインセラーにおいてワインに対して酒ラベルの自動化識別をしてワイン製品情報を管理する場合、ワインセラーにおいて、ワインセラーに配置された複数のカメラを介してワイン製品の酒製品画像を撮影する。前記酒製品画像は、カメラを介して撮影された1枚の画像(即ちピクチャ形式の画面)であり、バックグラウンドのワイン製品情報サーバにアップロードされてもよいし、カメラによって収集されたビデオであってもよく、バックグラウンドのワイン製品情報サーバにアップロードされてもよい。その後、前記ビデオ中のビデオフレームから得られた画像を抽出することによって、バックグラウンドのワイン製品情報サーバは、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得て、前記文字を酒ラベルに対応する目標文字とする。また、別の応用シーンにおいて、ワイン製品情報を管理する際に、携帯電話のカメラでワイン製品のワインラベルビデオを撮影し、ワインラベルビデオに含まれる画像を抽出することでワインラベル画像を得たり、ワイン製品のワインラベル画像を直接撮影して、所定のOCR識別方式で前記ワインラベル画像のOCR識別を行うことによって、前記ワインラベル画像に含まれる文字を得て、前記文字を目標文字とする。
更に、前記の酒製品画像を取得するステップの前に、前記酒製品画像に対応する初期酒製品画像を取得するステップと、前記初期酒製品画像を分割し、前記初期酒製品画像に所定の酒ラベルを含む部分画像に対応する酒製品画像を得るステップとを更に含む。
具体的には、異なる物体間、又は同じ物体の異なる部分間、例えば、酒製品と周囲の環境との間、異なる酒製品の間、又は同じ酒製品の異なる部分の間で、異なる輝度、テクスチャ、又は色などの画像特徴を示す確率が高い。これに鑑みて、管理が必要な酒製品は所定の酒製品範囲内にあり、また、識別が必要な酒ラベルも所定の酒ラベル範囲内にあるため、酒ラベルを自動識別するステップの前に、前記酒製品画像に対応する初期酒製品画像を取得した後であって酒ラベルの自動識別を行う前に、取得された初期酒製品画像を分割して、初期酒製品画像に含まれる酒製品以外の環境画像、酒ラベル以外の酒瓶などの酒製品の他の部分画像をスマートに分割し、分割後の所定の酒ラベルを含む部分画像を目標酒ラベル画像の略位置とし、前記目標酒ラベル画像を、酒ラベルの識別を行う酒製品画像とする。識別すべき画像を酒ラベルを含む部分画像に絞ることで、特に酒蔵など多くの環境要素を含む複雑な環境下で、酒瓶に対応する酒製品画像を正確に識別することができ、対応する正確な画像特徴を得ることができる。それによって後続の酒ラベル識別の正確性を高めることができ、また初期酒製品画像全体を識別するよりもデータ処理量を低減することができ、これにより、酒ラベル識別の効率が向上する。
更に、前記の前記初期酒製品画像を分割するステップの後に、前記初期酒製品画像に所定の酒類ラベルが含まれているか否かを判断するステップと、前記初期酒製品画像に所定の酒ラベルが含まれていれば、前記の前記初期酒製品画像に所定の酒ラベルを含む部分画像に対応する酒製品画像を得るステップと、前記初期酒製品画像に所定の酒ラベルが含まれていなければ、前記初期酒製品画像のエラーの提示を出すステップとを更に含む。
具体的には、異なる物体間、又は同じ物体の異なる部分間、例えば、酒製品と周囲の環境との間、異なる酒製品の間、又は同じ酒製品の異なる部分の間で、異なる輝度、テクスチャ、又は色などの画像特徴を示す確率が高い。各種類の酒製品に酒ラベルを含む部分画像に対応する画像特徴は、ユニークであり、画像特徴的には、酒ラベルを含む酒瓶中の部分画像に対応する画像特徴は、唯一で顕著である。前記初期酒製品画像を分割した後、前記初期酒製品画像を分割した画像特徴に基づいて、酒ラベルを含む所定の部分画像に対応する顕著な酒ラベル画像特徴と結合して、前記初期酒製品画像に所定の酒ラベルが含まれているかどうかを初歩的に判断する。前記初期酒製品画像に所定の酒ラベルが含まれていれば、前記の前記初期酒製品画像に所定の酒ラベルを含む部分画像に対応する酒製品画像を得るステップを実行して、前記初期酒製品画像に対してより詳細な画像識別を行い、前記初期酒製品画像に含まれる酒ラベルを識別する。前記初期酒製品画像に所定の酒ラベルが含まれていなければ、例えば酒瓶本体画像、酒瓶キャップ画像など、酒ラベル以外の酒瓶中の他の部位の画像であったり、又は、前記画像が顔画像、酒キャビネット画像又は周囲環境画像などの非酒ラベル画像であったりすると、前記初期酒製品画像を更に処理する必要はなく、前記初期酒製品画像が必要な画像ではなく捨ててもよい旨の、前記初期酒製品画像のエラーの提示を出す。酒ラベルを含む酒瓶中の部分画像に対応する画像特徴に対応する画像データ量が相対的に少ないため、前記初期酒製品画像に所定の酒ラベルが含まれていなければ、前記初期酒製品画像に対して大画像データ量の責任処理を行う必要がなく、前記酒製品画像に対する識別結果をできるだけ早く得ることができ、酒ラベル識別の流れを短縮することができ、酒ラベル画像に対する識別効率を高めることができる。また、前記初期酒製品画像を撮像し直す提示を出すことができ、酒ラベル識別の処理効率を高めることができる。
S22において、所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を抽出する。
ここで、深層学習(Deep Learning)は、人間の脳が分析学習を行うニューラルネットワークを構築してシミュレーションし、人間の脳のメカニズムを模倣してデータを解釈する。深層学習のモデルは、Feed forward neural networks(FF or FFNN)and perceptrons(P)、Boltzmann machines(BM)などを含み、テストサンプルを通じて、多くの深層学習モデルから、酒ラベルの識別効果が比較的良い深層学習モデルを選別する。
具体的には、酒製品画像を取得した後、所定の深層学習識別方式で前記酒製品画像の深層学習識別を行う。深層学習は、特徴学習(又は表現学習と呼ぶ)であるため、特徴工学であり、深層学習によって、前記酒製品画像に含まれる画像特徴を得ることができる。深層学習は、訓練サンプル画像及び前記訓練サンプル画像に対応するタグの学習が得意であるため、事前訓練後の深層学習に基づく深層学習モデルは、画像特徴の識別が得意であり、それによって、前記酒製品画像に含まれる画像特徴を正確に識別し、前記画像特徴を前記酒製品画像に対応する目標画像特徴とすることを実現することができる。例えば、ワインに対して、ワインラベルの自動化識別を行ってワイン製品情報を管理する場合、ワイン製品に対応するワイン製品画像を取得した後、所定の深層学習識別方式で前記ワイン製品画像の深層学習識別を行うことによって、前記ワイン製品画像に含まれる画像特徴を識別し、前記画像特徴を前記ワイン製品画像に対応する目標画像特徴とする。
ここで、前記所定の深層学習識別方式に対応する所定の深層学習モデルを訓練するプロセスは、以下のステップを含む。
1)所定の酒製品に対応する酒ラベル画像にタグを付け、酒ラベル画像の事前訓練サンプルを得る。前記酒ラベル画像の事前訓練サンプルは、前記訓練酒ラベル画像及び前記訓練酒ラベル画像に対応する訓練酒ラベルタグを含む。具体的には、管理が必要な酒製品に対応する酒類ラベルに対して酒ラベル画像を撮影し、特に当該酒製品上の酒類ラベル画像を様々な角度から撮影し、撮影した酒類ラベル画像にタグを付ける。いわゆるタグを付けることは、即ち、撮影した酒類ラベル画像とその酒ラベルに対応する酒ラベル名とを対応的に関連付け、その酒ラベル画像がその酒類ラベル名に対応することを記述する。この酒ラベル名は、その酒ラベル画像に対応する酒ラベルタグである。
2)前記所定の深層学習モデルに対して、前記酒ラベル画像の事前訓練サンプルを用いて訓練を行う。具体的には、酒ラベル画像の事前訓練サンプルを所定の深層学習モデルに入力し、所定の深層学習モデルは、前記訓練酒ラベル画像及び前記訓練酒ラベル画像に対応する訓練酒ラベルタグに基づいて自動学習し、訓練酒ラベル画像に対応する訓練画像特徴と訓練酒ラベルタグとの関連関係を学習して深層学習モデルの訓練を完成する。
3)酒ラベル画像テストサンプルを用いて、前記所定の深層学習モデルをテストする。前記酒ラベル画像テストサンプルは、前記テスト酒ラベル画像及び前記テスト酒ラベル画像に対応するテスト酒ラベルタグを含む。具体的には、訓練後の所定の深層学習モデルを酒ラベル画像テストサンプルを用いてテストする。所定の深層学習モデルは、前記テスト酒ラベル画像を識別して、テスト目標酒ラベルを得る。前記テスト目標酒ラベルを前記テスト酒ラベル画像に対応するテスト酒ラベルタグと比較して、前記テスト目標酒ラベルと前記テスト酒ラベル画像に対応するテスト酒ラベルタグが一致するかどうかを判断する。前記テスト目標酒ラベルが前記テスト酒ラベル画像に対応するテスト酒ラベルタグと一致する場合、深層学習モデルが所定の酒ラベル識別に対して比較的に正確な識別効果を有することを示す。前記テスト目標酒ラベルが前記テスト酒ラベル画像に対応するテスト酒ラベルタグと一致しない場合、深層学習モデルが所定の酒ラベル識別に対して比較的に正確な識別効果を持たないことを示す。それによって、所定の深層学習モデルが所期の目標に達したかどうかを判断する。所期の目標に達した場合、前記所定の深層学習モデルを生産環境に投入する。所期の目標に達していない場合、より多くの訓練サンプル、訓練サンプルの調整、及び所定の深層学習モデルの調整により、所定の深層学習モデルが最終的に所期の目標に合致するまで訓練を再開する。
S23において、前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとする。
具体的には、酒ラベルを識別する際に、酒ラベルの範囲については予め決定することができ、例えば、酒蔵にどの種類の酒製品が存在するかについては予め決定することができるので、管理が必要な酒製品に対応する酒ラベルに基づいて所定の酒ラベルデータベースを構成し、酒製品画像から酒製品画像に含まれる文字と画像特徴を抽出した後、前記文字と前記画像特徴に基づいて、前記文字と前記画像特徴を結合し、前記文字及び前記画像特徴に整合する酒ラベルを目標酒ラベルとして所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとし、それによって、前記酒製品画像に対応する酒ラベルを識別し、識別された酒ラベルに基づいて酒製品情報を自動化管理する。例えば、ワインセラーによる酒製品情報の管理時に、ワイン製品画像を取得した後、前記ワイン製品画像中の文字と画像特徴を識別し、前記文字と前記画像特徴に基づいて、前記ワイン製品画像に対応するワインラベルを識別し、識別したワインラベルに基づいてワイン製品情報を管理する。
本願の実施例において、酒ラベルは、一般的に文字と画像からなり、しかも異なる酒ラベルには大きな差が存在し、特にワインラベルについて、異なるメーカーが生産するワインの酒ラベルのフォントの種類、文字の大きさ及び言語などは、すべて大きなフォントの差が存在し、特に複雑な酒蔵環境条件の下で、しかも多言語などの多くの酒ラベルの差が存在する。酒製品に対して統一的な自動化管理を実現する際、従来技術では光学文字識別のみに基づいて酒ラベルを自動識別する場合、フォントの違いのほか、多言語文字の互換性が悪いという問題もあり、酒ラベル文字の識別精度が低いことによる識別効果の不安定化が発生する。従来の深層学習技術は、比較的正確な深層学習識別モデルを訓練するには、訓練サンプルデータ量に対する要求が高すぎる。深層学習技術に基づく画像識別は、計算量が大きく、訓練サンプルが十分に大きくない場合には、酒ラベルの識別効率も低い。一般的には、酒製品情報管理の応用環境に対して、十分に大きい酒ラベル訓練データサンプルを蓄積するのは難しい。そのため、コンピュータデバイスによる多種類の酒ラベルの正確な識別は、非常に困難である。本願の実施例の出願人は、複雑な環境下で多種類の酒ラベルに大きな差が存在し、統一的に正確な識別を行う必要があることに直面し、酒ラベルが文字と画像からなる特徴に基づいて、OCR文字識別と深層学習画像識別を結合して酒ラベルに対して機械視覚に基づく自動識別を実現する。OCR光学識別と深層学習識別の優位性を十分に融合したため、規範文字の識別が速く且つ正確であるというOCR文字識別の利点を十分に利用して、前記酒製品画像に含まれる規範フォントの文字を迅速に識別することがのみならず、深層学習による画像識別が正確であるという利点を十分に利用することもできる。機械視覚に基づく深層学習識別は、深層学習による画像識別の利点を採用してOCR文字識別の欠点を克服して、同時に多言語文字に対する良好な互換性を実現する。従って、OCR文字識別の利点を十分に利用して深層学習の検索範囲を縮小し、深層学習による画像識別の訓練データ量の要求が高すぎ、計算量が大きいという欠点を克服する。同時に、深層学習に基づく画像識別は、小さい検索範囲内から検索するだけで、深層学習モデルのネットワーク構造を最適化し、システムの計算資源に対する需要を低減することができる。従って、光学文字識別と深層学習識別を結合することにより、2種類の識別方式のそれぞれの識別結果を総合し、多種類の酒ラベルに対して、おおざっぱから精密、正確な知能識別過程を実現し、特にワインラベルに対して多言語の大きな差異が存在し、酒ラベル訓練サンプルデータ量が十分に大きくできないという状態に対して、酒ラベルに対する識別速度と精度を高めることができ、深層学習による訓練の酒ラベル識別を満たし、リアルタイムで効率的に酒製品ラベルに対して正確な識別を行うことができ、酒製品ラベル識別の正確性と効率を高める。
一実施例において、前記の前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、前記文字に基づいて、前記文字に整合する所定の酒ラベルを所定の酒ラベルデータベースから選別し、前記所定の酒ラベルを集合に構成して目標酒ラベル集合を得るステップと、前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップとを含む。
具体的には、画像からOCR識別によって前記画像に含まれる文字を抽出した後、前記文字に基づいて、前記文字に整合する所定の酒ラベルを所定の酒ラベルデータベースから選別し、そして前記所定の酒ラベルを集合に構成して、目標酒ラベル集合を得る。それによって、OCRの規範文字識別が速くて正確である利点を十分に利用して、深層学習による酒ラベル検索範囲を目標酒ラベル集合に縮小する。
更に、一般的には、酒ラベルは、文字と画像からなるか、又は識別された文字が正確ではない。例えば、識別された文字は、他の文字と類似し又は同一であり、又は他の文字組み合わせに含まれる。そのため、識別された文字だけで酒製品画像に対応する酒ラベルを正確に特定することはできない。前記目標酒ラベル集合を得た後、前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、即ち、前記画像特徴と最も整合する酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとすることによって、前記酒製品画像に対応する酒ラベルを識別する。事前訓練された深層学習モデルは、画像識別が比較的に正確であるという特徴から、深層学習モデルの酒ラベル検査範囲がすでに目標酒ラベル集合に縮小された場合、所定の酒ラベルデータベースから直接検索して目標酒ラベルを得るよりも、深層学習モデルの計算量を大幅に削減することができ、酒蔵などの複雑な環境の中でOCRモデルによる文字識別の際の識別正確度が低いという欠点を克服する。これにより、目標酒ラベル集合から正確な目標酒ラベルを選別し、正確な前記酒製品画像に対応する酒ラベルを得ることができ、前記酒製品画像に対応する酒ラベルを識別する正確性と効率を高める。
更に、前記の前記文字に基づいて、前記文字に整合する所定の酒ラベルを所定の酒ラベルデータベースから選別し、前記所定の酒ラベルを集合に構成して目標酒ラベル集合を得るステップの前に、更に、前記文字と、前記所定の酒ラベルデータベース中の所定の酒ラベルに対応する所定の酒ラベル文字との文字類似度を統計するステップと、前記文字類似度が所定の文字類似度閾値以上であるか否かを判断するステップと、前記文字類似度が所定の文字類似度閾値以上であれば、前記所定の酒ラベル文字を目標文字とし、前記目標文字を前記酒製品画像に対応する文字とするステップを含む。
更に、前記の前記文字類似度が所定の文字類似度閾値以上であれば、前記所定の酒ラベル文字を目標文字とし、前記目標文字を前記酒製品画像に対応する文字とするステップは、前記文字類似度が所定の文字類似度閾値以上であれば、前記文字類似度が最も高い所定の酒ラベル文字を目標文字とするステップを含む。
具体的には、識別された前記酒製品画像に含まれる文字と、所定の酒ラベル文字との文字類似度を判断し、前記文字と、前記所定の酒ラベルデータベース中の所定の酒ラベルに対応する所定の酒ラベル文字との文字類似度を統計し、前記文字類似度が所定の文字類似度閾値以上であるか否かを判断する。前記文字類似度が所定の文字類似度閾値以上であれば、前記文字と所定の酒ラベル文字とが同一又は類似であると判断し、前記所定の酒ラベル文字を目標文字とし、前記目標文字を前記酒製品画像に対応する文字とする。前記文字類似度が所定の文字類似度閾値未満であれば、前記文字と所定の酒ラベル文字との差異が大きすぎると判断し、酒ラベルの識別ミス又は酒ラベルの識別失敗の提示を出して、そして前記酒製品画像を再撮影する提示を出して、目標酒ラベルを所定の文字類似度閾値で更に濾過して、酒ラベルの識別の正確性と酒ラベルの識別の効率を更に高めることができる。
更に、前記所定の酒ラベル文字を目標文字とする。同一又は類似の所定の酒ラベル文字を目標文字とするため、目標文字は、複数の所定の酒ラベル文字を含む場合がある。文字の目標範囲を更に縮小し、酒ラベルの識別範囲を縮小し、酒ラベルの識別効率を高めるために、前記文字類似度が最も高い所定の酒ラベル文字を目標文字とすることによって、唯一の目標文字を特定し、目標酒ラベルの範囲を縮小し、酒ラベル識別の効率を高めることができる。
更に、前記の前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、前記画像特徴と、前記目標酒ラベル集合に含まれる所定の酒ラベルとの画像類似度を統計して、すべての前記画像類似度を得るステップと、すべての画像類似のうち画像類似度が最も高い目標画像類似度を選別するステップと、前記目標画像類似度が所定の画像類似度閾値以上であるか否かを判断するステップと、前記目標画像類似度が所定の画像類似度閾値以上であれば、前記目標画像類似度に対応する所定の酒ラベルを目標酒ラベルとし、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップを含む。
具体的には、識別された前記酒製品画像に含まれる画像特徴と、前記目標酒ラベル集合に含まれる所定の酒ラベルとの画像類似度を判断し、前記画像特徴と、前記目標酒ラベル集合に含まれる所定の酒ラベルとの画像類似度を統計してすべての前記画像類似度を得る。すべての画像類似度の中で画像類似度が最も高い目標画像類似度を選別し、前記目標画像類似度が所定の画像類似度閾値以上であるか否かを判断する。前記目標画像類似度が所定の画像類似度閾値以上であれば、前記目標画像類似度に対応する所定の酒ラベルが前記酒製品画像に含まれる酒ラベルと同一又は類似であることを示し、前記目標画像類似度に対応する所定の酒ラベルを目標酒ラベルとし、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとする。前記目標画像類似度が所定の画像類似度閾値未満であれば、前記目標画像類似度に対応する所定の酒ラベルと前記酒製品画像に含まれる酒ラベルとの差異が大きすぎ、前記酒製品画像に含まれる酒ラベルを所定範囲内の目標酒ラベルとして正確に識別するには不十分であることを示し、酒ラベルの識別ミス又は酒ラベルの識別失敗の提示を出して、そして前記酒製品画像を再撮影する提示を出し、目標酒ラベルを所定の画像類似度閾値で更に濾過して、酒ラベルの識別の正確性を更に高めることができる。
図3を参照する。図3は、本願の実施例による酒ラベル識別方法における第1のサブフローの概略図である。図3に示すように、この実施例において、前記目標酒ラベル集合は、複数の初期目標酒ラベルを含み、前記の前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、以下を含む。
S31において、前記画像特徴と前記初期目標酒ラベルのそれぞれとの画像類似度を計算する。
S32において、すべての前記画像類似度を高い順にソートしてソートキューを得る。
S33において、前記ソートキューから第1位の画像類似度を目標画像類似度として選択し、前記目標画像類似度に対応する初期目標酒ラベルを目標酒ラベルとする。
S34において、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとする。
具体的には、画像に対してサンプリングと量子化を経て、画像を画像ベクトルに量子化し、画像特徴及び初期目標酒ラベルの各々を画像ベクトルに変換して、画像特徴及び初期目標酒ラベルの各々を量子化し、更に2つの画像ベクトル間の類似度を計算する。例えば画像ベクトル間の余弦類似度を計算して、前記画像特徴と前記初期目標酒ラベルの各々との画像類似度を計算する。前記画像特徴と前記初期目標酒ラベルの各々との画像類似度を得た後、すべての前記画像類似度を高い順にソートして、ソートキューを得る。各画像の類似度は、前記画像特徴と前記初期目標酒ラベルのそれぞれとの画像類似度であることに対応し、ソートキューは、前記初期目標酒ラベルのソートを記述する。前記ソートキューから第1位の目標画像類似度を選択し、前記目標画像類似度に対応する初期目標酒ラベルを目標酒ラベルとし、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとし、それによって前記目標酒ラベル集合から前記画像特徴との整合度が最も高い酒ラベルを目標酒ラベルとして選別する。前記目標酒ラベル集合は、すでにOCR識別によって縮小された酒ラベル範囲であるため、また前記目標酒ラベル集合から前記画像特徴と最も整合する酒ラベルを目標酒ラベルとして選別するので、前記酒製品画像に対応する酒ラベルを識別する効率と正確性を高める。
一実施例において、前記の前記目標画像類似度に対応する初期目標酒ラベルを目標酒ラベルとするステップの前に、更に、前記目標画像類似度が所定の画像類似度閾値以上であるか否かを判断するステップと、前記目標画像類似度が所定の画像類似度閾値以上であれば、前記の前記目標画像類似度に対応する初期目標酒ラベルを目標酒ラベルとするステップを実行するステップを含む。
具体的には、酒ラベルの識別正確度を更に向上させるために、目標画像類似度に画像類似度閾値を設定し、前記目標画像類似度が所定の画像類似度閾値以上であるか否かを判断する。前記目標画像類似度が所定の画像類似度閾値以上であれば、前記目標画像類似度に対応する初期目標酒ラベルを目標酒ラベルとし、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとすることにより、前記酒製品画像に対応する酒ラベルを識別する。前記目標画像類似度が所定の画像類似度閾値未満の場合、前記画像特徴と所定の酒ラベルデータベース中の酒ラベルとの画像類似度が要求を満たしておらず、識別が正確でないリスクが大きいことを示す。後続の酒製品情報の錯乱を避けるため、前記目標画像類似度に対応する初期目標酒ラベルを目標酒ラベルとしない。酒ラベルの識別誤りによる酒製品情報の混乱を避けるために、酒製品画像を再取得し、再取得した酒製品画像を再度に酒ラベル自動識別する必要があり、識別すべき酒ラベルに対応する酒製品画像を再撮影する提示を出す。更に、識別すべき酒ラベルに対応する酒製品画像を撮像する提示を出す際には、前記酒製品画像には完全な酒ラベル画像が含まれるべきであったり、真正面から酒ラベル画像を撮像する必要があるなど、酒製品画像を撮像するためのアドバイスを与えることもできる。
図4を参照する。図4は、本願の実施例による酒ラベル識別方法における第2のサブフローの概略図である。図4に示すように、この実施例において、前記酒製品画像は、同一の目標酒製品の複数の画像を含み、前記の前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、以下を含む。
S41において、各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとする。
前記の各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするステップの後に、更に以下を含む。
S42において、すべての前記画像のそれぞれに対応する酒ラベルのうち、同じ酒ラベルに属する酒ラベルを同一種類の酒ラベルに帰属する。
S43において、各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数を統計する。
S44において、各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数に基づいて、すべての前記同一種類の酒ラベルのうち、数値が最も大きい酒ラベルを選別し、前記目標酒製品に対応する目標酒製品ラベルとする。
具体的には、1つの適用環境において、同一の目標酒製品の複数の画像を取得する。各画像に対して上記酒ラベル識別方法をそれぞれ実行して、各画像のそれぞれに対応する目標酒類ラベルを得る。各画像のそれぞれに対応する目標酒類ラベルを該画像に対応する酒類ラベルとする。その後、すべての前記画像のそれぞれに対応する酒ラベルから目標酒製品に対応する目標酒製品類ラベルを選別する。同一の目標酒製品の複数の画像に対してそれぞれ酒ラベルを識別し、その中から最も要求に合った酒ラベルを目標酒製品に対応する目標酒ラベルとして選別するため、目標酒製品に対応する酒ラベル識別の正確性を高める。例えば、ワイン管理システムでは、ワインセラーに異なる角度でカメラを設置し、同一の目標酒製品を複数のカメラで撮影するのが一般的である。各カメラがビデオを撮影し、ビデオをサーバのバックグラウンドにアップロードする。サーバのバックグラウンドは、複数のカメラで撮影された複数のビデオから同一の目標酒製品の複数の画像を抽出し、複数の画像に対してそれぞれ酒ラベルを識別する。画像の撮像角度が異なるため、画像毎に対応する目標酒ラベルを識別する場合、同一の目標酒製品であるが、識別結果に差がある可能性があり、同一の目標酒製品に対する酒レベル識別結果が複数であることになる。すべての前記画像のそれぞれに対応する酒ラベルの中から最も所期に合った酒ラベルを選別し、最も所期に合った酒ラベルを目標酒製品の対応する目標酒製品ラベルとする必要がある。例えば、すべての前記画像のそれぞれに対応する酒ラベルの中から、識別される確率が最も大きい酒ラベルを最も所期に合う酒ラベルとして選別するか、又は、画像と所定の酒ラベルデータベースの中の酒ラベル画像との類似度から、すべての前記画像のそれぞれに対応する酒ラベルの中から、画像と所定の酒ラベルデータベースの中の酒ラベル画像との類似度が最も大きい酒ラベルを最も所期に合う酒ラベルとして選別し、目標酒製品に対応する目標酒製品酒ラベル識別の正確性を高めることができる。
更に、すべての前記画像のそれぞれに対応する酒ラベルの中から、識別される確率が最も大きい酒ラベルを前記酒製品画像の対応する最も所期に合う酒ラベルとして選別する場合、すべての前記画像のそれぞれに対応する酒ラベルを分類し、すべての前記画像のそれぞれに対応する酒ラベルの中で同じ酒ラベルに属する酒ラベルを同一種類の酒ラベルに帰属して、異なる類別の同一種類の酒ラベルを得る。各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数量を統計し、酒ラベルを含む数が最大の酒ラベルを目標酒製品に対応する目標酒製品ラベルとする。酒ラベルを含む数が最大の酒ラベルは、識別される確率が最大の酒ラベルに対応するため、目標酒製品に対応する目標酒製品酒ラベル識別の正確性を高める。例えば、ワイン製品管理システムにおいて、同一の目標酒製品に対して酒ラベルの識別を行う場合、同一の目標酒ラベルに対して50枚の画像を取得し、そのうち30枚は、酒ラベルAと識別され、15枚は、酒ラベルBと識別され、5枚は、酒ラベルCと識別される。酒ラベルを含む数が最大の酒ラベルが、識別された確率が最大の酒ラベルに対応する選別方式に基づいて、酒ラベルAが当該目標酒製品の酒ラベルである確率が最大であると判定することができ、これにより、酒ラベルAを目標酒製品の酒ラベルとして決定する。
一実施例において、前記の酒製品画像を取得するステップは、端末からアップロードされた酒製品画像を受信するステップを含む。前記酒製品画像は、前記端末によって撮影されてアップロードされる。前記端末は、酒蔵に予め設置されたカメラを含む。
具体的には、酒製品画像は、スマートフォンなどのカメラ付き端末がピクチャ又はビデオ(ビデオ中のビデオフレームが即ち酒製品画像である)を撮影した後、端末から酒レベル識別を行うコンピュータデバイスにアップロードされる。又は、酒蔵に予め設置されたカメラなどの端末収集装置を通じて酒製品画像を収集する。前記酒製品画像は、酒蔵中のカメラがピクチャ又はビデオ(ビデオ中のビデオフレームが即ち酒製品画像である)を撮影した後、酒製品情報管理を行うサーババックグラウンドなど、酒ラベル識別を行うコンピュータデバイスにアップロードされる。
一実施例において、前記酒製品画像が前記端末によって撮影してアップロードされるステップは、複数の前記画像が所定の酒蔵に予め設置された複数のカメラによって取得されることを含み、前記酒製品画像は、複数の画像を含み、複数の前記カメラは、前記酒蔵の中で異なる所定の位置に設置される。
具体的には、酒蔵に予め設置された複数のカメラによって複数の画像が取得され、複数のカメラが前記酒蔵の異なる所定位置に設置され、異なる角度から同じ目標酒製品を撮影する。酒製品情報自動管理システムでは、携帯電話などのカメラ付き撮影装置で酒製品のピクチャを撮影したり、酒製品のビデオを撮影したり、ビデオを抽出してビデオフレームを抽出することで酒製品画像を得る。その後、酒製品画像を識別して酒ラベルの自動識別を実現する。更に、識別した酒ラベルに基づいて酒製品について酒製品情報の取得と管理を行う。一方、酒蔵に対応する酒製品情報自動管理システム、例えばワインセラー自動管理システムでは、ワインセラーにおけるワイン製品の酒製品情報自動管理を実現するために、一般にワインセラーに複数のカメラを設置し、複数の前記カメラを前記ワインセラーの異なる所定位置に設置し、異なる位置又は同じ位置の異なる角度から目標ワイン製品を撮影する。ワインセラーに予め設置された複数のカメラで酒製品のピクチャ又はビデオを取得することで、酒製品の複数の画像を取得した後、撮影された酒製品画像を識別し、目標ワイン製品の酒ラベルを識別し、識別された酒ラベルに基づいて、目標ワインの酒製品情報を取得し、それから酒製品情報を処理することで、目標ワインに対して自動的管理を行うことができる。
なお、上述した各実施例に記載された酒ラベル識別方法は、必要に応じて異なる実施例に含まれる技術的特徴を組み合わせ直して、組み合わせられた実施態様を取得することができるが、いずれも本願で要求される保護範囲内である。
図5を参照する。図5は、本願の実施例によるサーバ側に適用される酒製品情報管理方法のフローの概略図である。図5に示すように、本方法は、以下のステップS51~S53を含む。
S51において、酒製品画像を含む酒製品情報を取得する。
S52において、前記酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得る。
S53において、前記酒ラベルに基づいて、前記酒製品情報を管理する。
具体的には、サーバが酒製品に対応する酒製品情報を自動化管理する際には、酒製品画像を取得し、上記各実施例に記載の酒ラベル識別方法で前記酒製品画像の酒ラベルを識別して、前記酒製品画像に対応する酒ラベルを取得するだけでなく、酒製品年度、酒製品産地、生産日、及び酒蔵への出入り時間など、酒製品の他の面の酒製品情報を取得し、そして、前記酒製品画像に対応する酒ラベルを識別した後、前記酒ラベルに基づいて、前記酒製品情報に対して添加、修正、編集などの記録操作を行い、前記酒製品に対する自動化管理を実現する。酒製品の酒ラベル識別の正確性と効率を高めたため、酒ラベルの正確及び迅速な識別に基づいて、酒蔵中の酒製品を自動化管理する時、酒製品を自動化管理する効率と正確性を高めることもできる。例えば、ワインを貯蔵するワインセラーにおいて、ワインの酒ラベル識別の正確性と迅速さにより、ワインをリアルタイムで自動的に高品質に管理することができ、ワインの自動管理効率を高めることができる。
図6を参照する。図6は、本願の実施例による端末に適用される酒製品情報管理方法のフローの概略図である。図6に示すように、本方法は、以下のステップS61~S63を含む。
S61において、ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信する。それによって、前記所定のサーバが、前記酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにする。
S62において、前記所定のサーバから送信された前記目標酒製品情報を受信する。
S63において、前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示する。
具体的には、ユーザが端末を介して酒製品情報に対して照会、修正、追加又は削除等の編集操作を行う場合、端末は、ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信する。それによって、前記所定のサーバが、以上の各実施例で記載した前記酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにする。端末は、前記所定のサーバから送信された前記目標酒製品情報を受信し、前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示する。酒製品の酒ラベル識別の正確性と効率が向上するため、酒ラベルの正確及び迅速な識別に基づいて、酒蔵の中の酒製品に対して自動化管理を実現する場合、ユーザが酒製品に対する自動化管理の効率、正確性と利便性の向上を実現しやすくなる。例えば、ワインを貯蔵するワインセラーの中で、ワインの酒ラベルの識別の正確性と迅速さのため、ワインに対してリアルタイムで自動的に高品質の管理を行うことができ、従来技術の中で人工的に酒蔵の中の酒製品を管理する方式に比べて、ワインの自動化管理効率、利便性と管理品質を高める。
図7を参照する。図7は、本願の実施例による酒ラベル識別装置のブロック概略図である。上記の前記酒ラベル識別方法に対応して、本願の実施例は、更に酒ラベル識別装置を提供する。図7に示すように、この酒ラベル識別装置は、上記の前記酒ラベル識別方法を実行するためのユニットを含み、この酒ラベル識別装置は、サーバなどのコンピュータデバイスに配置される。具体的には、図7を参照し、この酒ラベル識別装置70は、第1の識別ユニット71と、第2の識別ユニット72と、第1の選別ユニット73を含む。
ここで、第1の識別ユニット71は、酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るために使用される。第2の識別ユニット72は、所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るために使用される。第1の選別ユニット73は、前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするために使用される。
一実施例において、前記第1の選別ユニット73は、前記文字に基づいて、前記文字に整合する所定の酒ラベルを所定の酒ラベルデータベースから選別し、前記所定の酒ラベルを集合に構成して目標酒ラベル集合を得るための第1の選別サブユニットと、前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするための第2の選別サブユニットとを含む。
一実施例において、前記酒製品画像は、同一の目標酒製品の複数の画像を含み、前記第1の選別ユニット73は、各画像のそれぞれに対応する前記文字及び前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするために使用される。
前記酒ラベル識別装置70は、すべての前記画像のそれぞれに対応する酒ラベルのうち、同じ酒ラベルに属する酒ラベルを同一種類の酒ラベルに帰属するための帰属ユニットと、各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数を統計するための統計ユニットと、各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数に基づいて、すべての前記同一種類の酒ラベルのうち、数値が最も大きい酒ラベルを選別し、前記目標酒製品に対応する目標酒製品ラベルとするための第2の選別ユニットとを更に含む。
図8を参照する。図8は、本願の実施例によるサーバ側に適用される酒製品情報管理装置のブロック概略図である。上記サーバ側に適用された前記酒製品情報管理方法に対応して、本願の実施例は、更に、サーバ側に適用された酒製品情報管理装置を提供する。図8に示すように、このサーバ側に適用される酒製品情報管理装置80は、上記の前記サーバ側に適用される酒製品情報管理方法を実行するためのユニットを含み、この酒製品情報管理装置80は、サーバなどのコンピュータデバイスに配置される。具体的には、図8を参照して、この酒製品情報管理装置80は、取得ユニット81と、第3の識別ユニット82と、管理ユニット83とを含む。
ここで、取得ユニット81は、酒製品画像を含む酒製品情報を取得するために使用される。第3の識別ユニット82は、前記酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るために使用される。管理ユニット83は、前記酒ラベルに基づいて、前記酒製品情報を管理するために使用される。
図9を参照する。図9は、本願の実施例による端末に適用される酒製品情報管理装置のブロック概略図である。上記の端末に適用される前記酒製品情報管理方法に対応して、本願の実施例は、更に、端末に適用される酒製品情報管理装置を提供する。図9に示すように、この端末に適用される酒製品情報管理装置90は、上記の前記端末に適用される酒製品情報管理方法を実行するためのユニットを含み、この酒製品情報管理装置90は、スマートフォンなどの端末機器に配置される。具体的には、図9を参照して、この酒製品情報管理装置90は、送信ユニット91と、受信ユニット92と、表示ユニット93を含む。
ここで、送信ユニット91は、ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するために使用される。それによって、前記所定のサーバが、前記酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにする。受信ユニット92は、前記所定のサーバから送信された前記目標酒製品情報を受信するために使用される。表示ユニット93は、前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するために使用される。
一適用例において、上記サーバ側に適用される前記酒製品情報管理方法及び端末に適用される前記酒製品情報管理方法の両方は、酒蔵、端末及びサーバを含む酒製品情報管理システムに使用される。ここで、前記酒蔵には、酒製品を置くための酒キャビネットが設置されている。酒蔵の所定位置にカメラが設置されている。前記カメラを通じて前記酒製品に対応する酒製品画像を撮影し、前記酒製品画像を前記サーバにアップロードする。前記サーバは、以上の各実施例で説明したサーバ側に適用される前記酒製品情報管理方法のステップを実行するために使用される。前記端末は、以上の各実施例で説明した端末に適用される前記酒製品情報管理方法のステップを実行するために使用される。
なお、上記酒ラベル識別装置及び各ユニットの具体的な実現過程、上記サーバ側に適用される酒製品情報管理装置及び各ユニットの具体的な実現過程、上記端末に適用される酒製品情報管理装置及び各ユニットの具体的な実現過程は、当業者が上記各実施例でそれぞれの対応する方法の実施例での対応する説明を参照して明らかであり、説明の便利さと簡潔さのために、ここでは詳しく説明しない。
同時に、前記酒ラベル識別装置、前記サーバ側に適用される酒製品情報管理装置、又は前記端末に適用される酒製品情報管理装置における各ユニットの区分及び接続形態は、例示的な説明のみに使用される。他の実施例では、酒ラベル識別装置、前記サーバ側に適用される酒製品情報管理装置又は前記端末に適用される酒製品情報管理装置は、必要に応じて異なるユニットに区分されていてもよい。酒ラベル識別装置、前記サーバ側に適用される酒製品情報管理装置又は前記端末に適用される酒製品情報管理装置の各ユニットは、前記酒ラベル識別装置、前記サーバ側に適用される酒製品情報管理装置又は前記端末に適用される酒製品情報管理装置の全部又は一部の機能を完成するために、異なる接続順序及び方式を用いてもよい。
前記酒ラベル識別装置、前記サーバ側に適用される酒製品情報管理装置、又は前記端末に適用される酒製品情報管理装置は、それぞれ図10に示すようなコンピュータデバイス上で実行可能なコンピュータプログラムの形態として実現することができる。
図10を参照する。図10は、本願の実施例によるコンピュータデバイスのブロック概略図である。このコンピュータデバイス500は、デスクトップコンピュータやサーバなどのコンピュータデバイスであってもよいし、他の機器におけるコンポーネントや部品であってもよい。
図10を参照すると、このコンピュータデバイス500は、システムバス501を介して接続されたプロセッサ502、メモリ及びネットワークインターフェース505を含む。ここで、メモリは、不揮発性記憶媒体503及び内部記憶装置504を含んでもよく、揮発性コンピュータ可読記憶媒体であってもよい。
この不揮発性記憶媒体503は、オペレーティングシステム5031及びコンピュータプログラム5032を記憶することができる。このコンピュータプログラム5032が実行されると、上記酒ラベル識別方法、上記のサーバ側に適用される前記酒製品情報管理方法、又は上記の端末に適用される酒製品情報管理方法をプロセッサ502に実行させることができる。このプロセッサ502は、コンピュータデバイス500全体の動作をサポートするための計算及び制御能力を提供するために使用される。この内部記憶装置504は、不揮発性記憶媒体503中のコンピュータプログラム5032の実行に環境を提供する。このコンピュータプログラム5032がプロセッサ502によって実行されると、上記酒ラベル識別方法、上記のサーバ側に適用される前記酒製品情報管理方法、又は上記の端末に適用される酒製品情報管理方法をプロセッサ502に実行させることができる。このネットワークインターフェース505は、他の機器とネットワーク通信するために使用される。図10に示す構成は、本願の態様に関連する一部の構成のブロック図にすぎず、本願の態様が適用されるコンピュータデバイス500の限定を構成するものではない。具体的なコンピュータデバイス500は、図示よりも多く又は少ない部品を含んだり、又はいくつかの部品を組み合わせたり、異なる部品配置を有したりすることができる。これは、当業者にとって明らかである。例えば、いくつかの実施例において、コンピュータデバイスは、メモリ及びプロセッサのみを含む。そのような実施例において、メモリ及びプロセッサの構造及び機能は、図10に示す実施例に一致し、ここでは説明しない。
一実施例において、前記プロセッサ502は、メモリに格納されたコンピュータプログラム5032を実行するために使用される。それによって、上記酒ラベル識別方法を実現する際に、前記プロセッサ502は、酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るステップと、所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るステップと、前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップを実行する。
一実施例において、前記プロセッサ502は、前記の前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップを実現する際に、具体的に、前記文字に基づいて、前記文字に整合する所定の酒ラベルを所定の酒ラベルデータベースから選別し、前記所定の酒ラベルを集合に構成して目標酒ラベル集合を得るステップと、前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップとを実現する。
一実施例において、前記酒製品画像は、同一の目標酒製品の複数の画像を含み、前記プロセッサ502は、前記の前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップを実現する際に、具体的に、各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするステップを実現する。前記プロセッサ502は、前記の各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするステップを実現した後に、更に、すべての前記画像のそれぞれに対応する酒ラベルのうち、同じ酒ラベルに属する酒ラベルを同一種類の酒ラベルに帰属するステップと、各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数を統計するステップと、各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数に基づいて、すべての前記同一種類の酒ラベルのうち、数値が最も大きい酒ラベルを選別して、前記目標酒製品に対応する目標酒製品ラベルとするステップとを実現する。
一実施例において、前記プロセッサ502は、メモリに格納されたコンピュータプログラム5032を実行するために使用される。それによって、上記のサーバ側に適用される前記酒製品情報管理方法を実現する際に、前記プロセッサ502は、酒製品画像を含む酒製品情報を取得するステップと、上記実施例で記載した前記酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るステップと、前記酒ラベルに基づいて、前記酒製品情報を管理するステップとを実行する。
一実施例において、前記プロセッサ502は、メモリに格納されたコンピュータプログラム5032を実行するために使用される。それによって、上記の端末に適用される前記酒製品情報管理方法を実現する際に、前記プロセッサ502は、ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するステップであって、それによって、前記所定のサーバが、上記実施例で説明した前記酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにするステップと、前記所定のサーバから送信された前記目標酒製品情報を受信するステップと、前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するステップとを実行する。
なお、本願の実施例において、プロセッサ502は、中央処理ユニットCPU(Central Processing Unit)であってもよく、他の汎用プロセッサ、デジタル信号プロセッサDSP(Digital Signal Processor)、専用集積回路ASIC(Application Specific Integrated Circuit)、フィールドプログラマブルゲートアレイFPGA(Field-Programmable Gate Array)又は他のプログラマブル論理デバイス、ディスクリートゲート又はトランジスタ論理デバイス、ディスクリートハードウェアコンポーネントなどであってもよい。ここで、汎用プロセッサは、マイクロプロセッサであってもよく、又は任意の従来のプロセッサなどであってもよい。
上記実施例の方法のすべて又は一部の流れの実現は、コンピュータ可読記憶媒体に格納されたコンピュータプログラムによって完成することができる。これは、当業者にとって明らかである。このコンピュータプログラムは、このコンピュータシステムのうちの少なくとも1つのプロセッサによって実行され、上記方法の実施例のステップを実現する。
従って、本願は、更にコンピュータ可読記憶媒体を提供する。このコンピュータ可読記憶媒体は、不揮発性のコンピュータ可読記憶媒体であってもよいし、揮発性のコンピュータ可読記憶媒体であってもよい。このコンピュータ可読記憶媒体にはコンピュータプログラムが格納されている。このコンピュータプログラムがプロセッサによって実行されると、以上の各実施例で説明した前記酒ラベル識別方法のステップをプロセッサに実行させ、又は、以上の各実施例で説明した上記のサーバ側に適用される前記酒製品情報管理方法をプロセッサに実行させ、又は、以上の各実施例で説明した上記の端末に適用される酒製品情報管理方法をプロセッサに実行させる。
前記コンピュータ可読記憶媒体は、デバイスのハードディスク又はメモリなど、前記デバイスの内部記憶ユニットであってもよい。前記コンピュータ可読記憶媒体は、前記デバイスに搭載されたソケットハードディスク、スマートメモリカードSMC(Smart Media Card)、セキュアデジタルSD(Secure Digital)カード、フラッシュメモリカード(Flash Card)など、前記デバイスの外部記憶デバイスであってもよい。更に、前記コンピュータ可読記憶媒体は、前記デバイスの内部記憶ユニットと外部記憶機器の両方を含むこともできる。
上述したデバイス、装置、ユニットの具体的な動作手順は、当業者にとって、上述した方法の実施例における対応手順を参照して明らかである。説明の容易さと簡潔さのために、ここではこれ以上説明しない。
前記記憶媒体は、実体的で非瞬時的な記憶媒体であり、例えば、Uディスク、リムーバブルハードディスク、読み取り専用メモリROM(Read-Only Memory、)、磁気ディスク、又は光ディスクなど、コンピュータプログラムを記憶可能な各種の実体記憶媒体であってもよい。
本明細書に開示された実施例に関連して説明された各例のユニット及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、又は両方の組み合わせで実現することができ、ハードウェアとソフトウェアの互換性を明確に説明するために、上記の説明では、各例の構成及びステップが機能的に一般的に説明されている。これは、当業者にとって明らかである。これらの機能がハードウェアそれともソフトウェアで実行されるかは、技術的態様の特定のアプリケーション及び設計制約に決められる。当業者は、それぞれの特定のアプリケーションに対して、異なる方法を使用し、説明された機能を実現してもよいが、このような実現は、本願の範囲を超えているとは考えられない。
本願によるいくつかの実施例において、開示された装置及び方法は、他の方法で実現されてもよいことを理解すべきである。例えば、上述した装置の実施例は、単なる例示的なものである。例えば、各ユニットの分割は、単なる論理機能分割であり、実際に実現する際には別の分割方式があってもよい。例えば、複数のユニット又はコンポーネントを組み合わせてもよいし、別のシステムに統合してもよいし、いくつかの特徴を無視してもよいし、実行しなくてもよい。
本願の実施例の方法のステップは、実際の必要に応じて順序の調整、合併及び削減を行うことができる。本願の実施例の装置におけるユニットは、実際の必要に応じて合併、分割及び削減することができる。また、本願の各実施例における各機能ユニットは、1つの処理ユニットに集積されていてもよいし、各ユニットが単独で物理的に存在していてもよいし、2つ以上のユニットが1つのユニットに集積されていてもよい。
この集積されたユニットは、ソフトウェア機能ユニットとして実現され、独立した製品として販売又は使用される場合、1つの記憶媒体に記憶することができる。このような理解に基づいて、本願の技術的態様は、本質的に、あるいは既存の技術に貢献した部分、あるいはその技術的態様の全部又は一部がソフトウェア製品の形で具現化することができる。1つの記憶媒体に記憶されたこのコンピュータソフトウェア製品は、1台の電子機器(パーソナルコンピュータ、端末又はネットワーク装置などであってもよい)が本願の各実施例に記載された方法のすべて又は一部のステップを実行するようにするためのいくつかの命令を含む。
上述したのは、本願の具体的な実施形態にすぎないが、本願の保護範囲は、これに限定されるものではない。当技術分野に詳しいいかなる技術者も、本願に開示された技術範囲内で、さまざまな等価な修正又は置換を容易に思いつくことができ、これらの修正又は置換は、本願の保護範囲内に含まれるべきである。従って、本願の保護範囲は、請求項の保護範囲に準じなければならない。
(付記)
(付記1)
酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るステップと、
所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るステップと、
前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップと、を含む、
ことを特徴とする酒ラベル識別方法。
(付記2)
前記の前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、
前記文字に基づいて、前記文字に整合する所定の酒ラベルを所定の酒ラベルデータベースから選別し、前記所定の酒ラベルを集合に構成して目標酒ラベル集合を得るステップと、
前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップと、を含む、
ことを特徴とする付記1に記載の酒ラベル識別方法。
(付記3)
前記酒製品画像は、同一の目標酒製品の複数の画像を含み、
前記の前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、
各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするステップを含み、
前記の各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするステップの後に、
すべての前記画像のそれぞれに対応する酒ラベルのうち、同じ酒ラベルに属する酒ラベルを同一種類の酒ラベルに帰属するステップと、
各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数を統計するステップと、
各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数に基づいて、すべての前記同一種類の酒ラベルのうち、数値が最も大きい酒ラベルを選別し、前記目標酒製品に対応する目標酒製品ラベルとするステップと、を更に含む、
ことを特徴とする付記1又は2に記載の酒ラベル識別方法。
(付記4)
サーバ側に適用される酒製品情報管理方法であって、
酒製品画像を含む酒製品情報を取得するステップと、
付記1~3のいずれか一つに記載の酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るステップと、
前記酒ラベルに基づいて、前記酒製品情報を管理するステップと、を含む、
ことを特徴とする酒製品情報管理方法。
(付記5)
端末に適用される酒製品情報管理方法であって、
ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するステップであって、それによって、前記所定のサーバが、付記1~3のいずれか一つに記載の酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにするステップと、
前記所定のサーバから送信された前記目標酒製品情報を受信するステップと、
前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するステップと、を含む、
ことを特徴とする酒製品情報管理方法。
(付記6)
酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るための第1の識別ユニットと、
所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るための第2の識別ユニットと、
前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするための第1の選別ユニットと、を含む、
ことを特徴とする酒ラベル識別装置。
(付記7)
サーバ側に適用される酒製品情報管理装置であって、
酒製品画像を含む酒製品情報を取得するための取得ユニットと、
付記1~3のいずれか一つに記載の酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るための第3の識別ユニットと、
前記酒ラベルに基づいて、前記酒製品情報を管理するための管理ユニットと、を含む、
ことを特徴とする酒製品情報管理装置。
(付記8)
端末に適用される酒製品情報管理装置であって、
ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するための送信ユニットであって、前記所定のサーバが、付記1~3のいずれか一つに記載の酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにするための送信ユニットと、
前記所定のサーバから送信された前記目標酒製品情報を受信するための受信ユニットと、
前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するための表示ユニットと、を含む、
ことを特徴とする酒製品情報管理装置。
(付記9)
コンピュータプログラムを格納するためのメモリと、
前記メモリに接続されたプロセッサであって、前記コンピュータプログラムを実行して、付記1~3のいずれか一つに記載の方法のステップを実行し、又は付記4に記載の方法のステップを実行し、又は付記5に記載の方法のステップを実行するためのプロセッサと、を含む、
ことを特徴とするコンピュータデバイス。
(付記10)
コンピュータ可読記憶媒体であって、
前記記憶媒体にはコンピュータプログラムが格納されており、
前記コンピュータプログラムがプロセッサによって実行されると、付記1~3のいずれか一つに記載の方法のステップが実現され、又は付記4に記載の方法のステップが実現され、又は付記5に記載の方法のステップが実現される、
ことを特徴とするコンピュータ可読記憶媒体。

Claims (10)

  1. 酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るステップと、
    所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るステップと、
    前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップと、を含む、
    ことを特徴とする酒ラベル識別方法。
  2. 前記の前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、
    前記文字に基づいて、前記文字に整合する所定の酒ラベルを所定の酒ラベルデータベースから選別し、前記所定の酒ラベルを集合に構成して目標酒ラベル集合を得るステップと、
    前記画像特徴に基づいて、前記画像特徴との整合度が最も高い酒ラベルを前記目標酒ラベル集合から目標酒ラベルとして選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップと、を含む、
    ことを特徴とする請求項1に記載の酒ラベル識別方法。
  3. 前記酒製品画像は、同一の目標酒製品の複数の画像を含み、
    前記の前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするステップは、
    各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするステップを含み、
    前記の各画像のそれぞれに対応する目標酒ラベルを当該画像に対応する酒ラベルとするステップの後に、
    すべての前記画像のそれぞれに対応する酒ラベルのうち、同じ酒ラベルに属する酒ラベルを同一種類の酒ラベルに帰属するステップと、
    各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数を統計するステップと、
    各種類の前記同一種類の酒ラベルに含まれる酒ラベルの数に基づいて、すべての前記同一種類の酒ラベルのうち、数値が最も大きい酒ラベルを選別し、前記目標酒製品に対応する目標酒製品ラベルとするステップと、を更に含む、
    ことを特徴とする請求項1又は2に記載の酒ラベル識別方法。
  4. サーバ側に適用される酒製品情報管理方法であって、
    酒製品画像を含む酒製品情報を取得するステップと、
    請求項1~3のいずれか一項に記載の酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るステップと、
    前記酒ラベルに基づいて、前記酒製品情報を管理するステップと、を含む、
    ことを特徴とする酒製品情報管理方法。
  5. 端末に適用される酒製品情報管理方法であって、
    ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するステップであって、それによって、前記所定のサーバが、請求項1~3のいずれか一項に記載の酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにするステップと、
    前記所定のサーバから送信された前記目標酒製品情報を受信するステップと、
    前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するステップと、を含む、
    ことを特徴とする酒製品情報管理方法。
  6. 酒製品画像を取得し、所定のOCR識別方式で前記酒製品画像のOCR識別を行うことによって、前記酒製品画像に含まれる文字を得るための第1の識別ユニットと、
    所定の深層学習識別方式で前記酒製品画像の深層学習識別を行うことによって、前記酒製品画像に含まれる画像特徴を得るための第2の識別ユニットと、
    前記文字と前記画像特徴に基づいて、前記文字及び前記画像特徴に整合する目標酒ラベルを所定の酒ラベルデータベースから選別し、前記目標酒ラベルを前記酒製品画像に対応する酒ラベルとするための第1の選別ユニットと、を含む、
    ことを特徴とする酒ラベル識別装置。
  7. サーバ側に適用される酒製品情報管理装置であって、
    酒製品画像を含む酒製品情報を取得するための取得ユニットと、
    請求項1~3のいずれか一項に記載の酒ラベル識別方法で前記酒製品画像の識別を行うことによって、前記酒製品画像に含まれる酒ラベルを得るための第3の識別ユニットと、
    前記酒ラベルに基づいて、前記酒製品情報を管理するための管理ユニットと、を含む、
    ことを特徴とする酒製品情報管理装置。
  8. 端末に適用される酒製品情報管理装置であって、
    ユーザの操作に応答して、酒製品情報取得要求を所定のサーバに送信するための送信ユニットであって、前記所定のサーバが、請求項1~3のいずれか一項に記載の酒ラベル識別方法で酒製品画像を識別して得られた所定の酒ラベルに基づいて関連付けられた酒製品情報を含み、前記酒製品情報取得要求に対応する目標酒製品情報を前記酒製品情報取得要求に基づいて取得し、前記目標酒製品情報を前記端末に返信するようにするための送信ユニットと、
    前記所定のサーバから送信された前記目標酒製品情報を受信するための受信ユニットと、
    前記ユーザが前記目標酒製品情報を取得するよう、前記目標酒製品情報を表示するための表示ユニットと、を含む、
    ことを特徴とする酒製品情報管理装置。
  9. コンピュータプログラムを格納するためのメモリと、
    前記メモリに接続されたプロセッサであって、前記コンピュータプログラムを実行して、請求項1~3のいずれか一項に記載の方法のステップを実行し、又は請求項4に記載の方法のステップを実行し、又は請求項5に記載の方法のステップを実行するためのプロセッサと、を含む、
    ことを特徴とするコンピュータデバイス。
  10. コンピュータ可読記憶媒体であって、
    前記記憶媒体にはコンピュータプログラムが格納されており、
    前記コンピュータプログラムがプロセッサによって実行されると、請求項1~3のいずれか一項に記載の方法のステップが実現され、又は請求項4に記載の方法のステップが実現され、又は請求項5に記載の方法のステップが実現される、
    ことを特徴とするコンピュータ可読記憶媒体。
JP2023543251A 2020-09-28 2020-10-26 酒ラベル識別方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体 Pending JP2023543640A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011040731.0A CN112115950A (zh) 2020-09-28 2020-09-28 酒标识别方法、酒品信息管理方法、装置、设备及存储介质
CN202011040731.0 2020-09-28
PCT/CN2020/123638 WO2022062028A1 (zh) 2020-09-28 2020-10-26 酒标识别方法、酒品信息管理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
JP2023543640A true JP2023543640A (ja) 2023-10-17

Family

ID=73797077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023543251A Pending JP2023543640A (ja) 2020-09-28 2020-10-26 酒ラベル識別方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体

Country Status (5)

Country Link
US (1) US20230237824A1 (ja)
JP (1) JP2023543640A (ja)
CN (1) CN112115950A (ja)
GB (1) GB2614169A (ja)
WO (1) WO2022062028A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580620A (zh) * 2020-12-25 2021-03-30 北京百度网讯科技有限公司 标志图片处理方法、装置、设备和介质
CN112883965A (zh) * 2021-02-08 2021-06-01 中兴盛达电气技术(郑州)有限公司 包装器皿上的日期检测方法、电子设备和计算机可读存储介质
CN115035360B (zh) * 2021-11-22 2023-04-07 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043349B1 (en) * 2012-11-29 2015-05-26 A9.Com, Inc. Image-based character recognition
US10043231B2 (en) * 2015-06-30 2018-08-07 Oath Inc. Methods and systems for detecting and recognizing text from images
CN106682683B (zh) * 2016-11-03 2020-09-29 知酒(上海)网络科技有限公司 一种酒标图片的识别方法以及装置
CN107748772B (zh) * 2017-09-30 2020-10-30 深圳市谷熊网络科技有限公司 一种商标识别方法及装置
CN109101561B (zh) * 2018-07-13 2021-10-01 深圳红酒世界电商股份有限公司 一种酒标识别的方法
CN109784385A (zh) * 2018-12-29 2019-05-21 广州海昇计算机科技有限公司 一种商品自动识别方法、系统、装置及存储介质
CN110889365A (zh) * 2019-11-21 2020-03-17 上海烟草集团有限责任公司 一种标签信息获取方法及装置

Also Published As

Publication number Publication date
US20230237824A1 (en) 2023-07-27
GB2614169A (en) 2023-06-28
GB202304281D0 (en) 2023-05-10
WO2022062028A1 (zh) 2022-03-31
GB2614169A8 (en) 2023-07-12
CN112115950A (zh) 2020-12-22

Similar Documents

Publication Publication Date Title
JP2023543640A (ja) 酒ラベル識別方法、酒製品情報管理方法及びその装置、デバイス及び記憶媒体
US9721183B2 (en) Intelligent determination of aesthetic preferences based on user history and properties
US11270099B2 (en) Method and apparatus for generating facial feature
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
CN111881913A (zh) 图像识别方法及装置、存储介质和处理器
WO2021042505A1 (zh) 基于文字识别技术的笔记生成方法、装置和计算机设备
CN110490193B (zh) 单个字符区域检测方法及票据内容识别方法
US20230237825A1 (en) Wine product positioning method, wine product information management method and apparatus, device, and storage medium
CN112084812B (zh) 图像处理方法、装置、计算机设备及存储介质
CN105121620A (zh) 图像处理设备、图像处理方法、程序和存储介质
CN111027450A (zh) 银行卡信息识别方法、装置、计算机设备及存储介质
CN113763348A (zh) 图像质量确定方法、装置、电子设备及存储介质
WO2022193911A1 (zh) 指令信息获取方法及装置、可读存储介质、电子设备
JP2012048624A (ja) 学習装置、方法及びプログラム
US11659123B2 (en) Information processing device, information processing system, information processing method and program for extracting information of a captured target image based on a format of the captured image
CN111144141A (zh) 基于拍照功能的翻译方法
CN112101479B (zh) 一种发型识别方法及装置
JP2018137639A (ja) 動画像処理システム、並びに、符号化装置及びプログラム、並びに、復号装置及びプログラム
CN113052067A (zh) 实时翻译方法、装置、存储介质及终端设备
CN111291619A (zh) 一种在线识别理赔单据中文字的方法、装置及客户端
CN112052729B (zh) 一种基于人脸识别的智能动态高清视频检测方法及系统
CN115375954B (zh) 一种化学实验溶液识别方法、装置、设备及可读存储介质
CN112270297B (zh) 用于显示识别结果的方法和计算机系统
CN113542866B (zh) 视频处理方法、装置、设备及计算机可读存储介质
US20240040232A1 (en) Information processing apparatus, method thereof, and program thereof, and information processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230327

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240418