JP2021521558A - コーディングパターン処理方法及び装置、電子装置、並びにコンピュータプログラム - Google Patents

コーディングパターン処理方法及び装置、電子装置、並びにコンピュータプログラム Download PDF

Info

Publication number
JP2021521558A
JP2021521558A JP2020562183A JP2020562183A JP2021521558A JP 2021521558 A JP2021521558 A JP 2021521558A JP 2020562183 A JP2020562183 A JP 2020562183A JP 2020562183 A JP2020562183 A JP 2020562183A JP 2021521558 A JP2021521558 A JP 2021521558A
Authority
JP
Japan
Prior art keywords
coding pattern
coding
pattern
model
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020562183A
Other languages
English (en)
Other versions
JP7045483B2 (ja
Inventor
ミアオ,ジエ
ルァン,チェン
シュイ,ディエンピン
ジィア,シアオイ
ジェン,メイ
リン,ユィゴン
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2021521558A publication Critical patent/JP2021521558A/ja
Application granted granted Critical
Publication of JP7045483B2 publication Critical patent/JP7045483B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14172D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K19/00Record carriers for use with machines and with at least a part designed to carry digital markings
    • G06K19/06Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
    • G06K19/06009Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking
    • G06K19/06037Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking multi-dimensional coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K19/00Record carriers for use with machines and with at least a part designed to carry digital markings
    • G06K19/06Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
    • G06K19/06009Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking
    • G06K19/06018Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking one-dimensional coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14131D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/146Methods for optical code recognition the method including quality enhancement steps
    • G06K7/1482Methods for optical code recognition the method including quality enhancement steps using fuzzy logic or natural solvers, such as neural networks, genetic algorithms and simulated annealing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Electromagnetism (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Automation & Control Theory (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Fuzzy Systems (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

コーディングパターン処理方法、装置、記憶媒体及び電子装置が提供される。前記方法は、コーディング情報をエンコードしたパターンである第1のコーディングパターンを取得するステップ(S202)と、第3のコーディングパターン及び所定の第4のコーディングパターンを利用してトレーニングしたターゲットモデルによって、第1のコーディングパターンの解像度を上げ、第2のコーディングパターンを取得するステップ(S204)と、端末のコーディング認識モジュールに第2のコーディングパターンを提供するステップ(S206)と、を含む。前記方法は、コーディングパターンを正確に認識できないという技術的な問題を解決できる。

Description

本出願は、2018年11月14日に中国特許庁に提出された、出願番号が201811363056.8であって、出願の名称が「コーディングパターン処理方法及び装置、記憶媒体、電子装置」である中国特許出願の優先権を主張するものであり、その全内容を本出願に参照により援用する。
本出願は、イメージ処理の分野に関し、具体的にコーディングパターン処理に関する。
現在、2次元コードは、大量の情報保存、高い機密性、低コストなどの特点を持つため、商工業、交通輸送、金融、医療などの分野で適用され普及されている。近年、モバイル通信の分野で急成長しているモバイル端末の2次元コードサービスにより、モバイル端末のユーザーは情報が容易に入手できるようになっている。
2次元コードとは、一次元コードに対するもので、ある特定の幾何学図形に応じて、データシンボル情報を一定の規則に従って平面に分布する白黒の図形に記録する。実際に適用する場合、例えば、2次元コードでインターネットにアクセスする場合、まず、モバイル端末に付属するカメラを利用して2次元コードの写真を撮影し、次に、2次元コードの写真に含まれているネットワークアドレス情報を認識し、当該ネットワークアドレスに対応するウェブサイトにアクセスできるようにする。
本出願の実施例は、関連技術におけるコーディングパターンを正確に認識することができないという技術的な問題を少なくとも解决できるコーディングパターン処理方法及び装置、記憶媒体、電子装置を提供する。
本出願の実施例の一態様によれば、コーディングパターン処理方法を提供し、端末認識対象の、コーディング情報をエンコードしたパターンである第1のコーディングパターンを取得するステップと、ターゲットモデルによって第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、ターゲットモデルは第3のコーディングパターンと所定の第4のコーディングパターンを利用してトレーニングして得られたものであり、第3のコーディングパターンは第4のコーディングパターンの解像度を下げることで得られたものであり、第3のコーディングパターンは第1のコーディングパターンと同じコーディング方式を利用するものであるステップと、端末のコーディング認識モジュールに第2のコーディングパターンを提供するステップと、を含む。
本出願の実施例による他の態様は、さらに、コーディングパターン処理装置を提供し、端末認識対象の、コーディング情報をエンコードしたパターンである第1のコーディングパターンを取得するための第1の取得ユニットと、ターゲットモデルによって第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、ターゲットモデルは第3のコーディングパターンと所定の第4のコーディングパターンを利用してトレーニングした得られたものであり、第3のコーディングパターンが第4のコーディングパターンの解像度を下げることで得られたものであり、第3のコーディングパターンは第1のコーディングパターンと同じコーディング方式を利用するものである処理ユニットと、端末のコーディング認識モジュールに第2のコーディングパターンを提供するためのインタラクションユニットと、を含む。
本出願の実施例による他の態様は、さらに、記憶媒体を提供し、当該記憶媒体はプログラムを記憶しており、プログラムが実行される場合上記の方法を実行する。
本出願の実施例による他の態様は、さらに、電子装置を提供し、メモリと、プロセッサーと、メモリに記憶されてプロセッサーで実行されるコンピュータプログラムとを含み、プロセッサーはコンピュータプログラムによって上記の方法を実行する。
本出願の実施例による他の態様は、さらに、指令を含むコンピュータプログラムを提供し、それがコンピュータで実行される場合、前記コンピュータに上記の方法を実行させる。
本出願の実施例では、認識対象の第1のコーディングパターンを取得した場合に、ターゲットモデルによって、第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、端末のコーディング認識モジュールに解像度のより高い第2のコーディングパターンを提供することで、関連技術におけるコーディングパターンを正確に認識できないという技術的な問題を解決し、コーディングパターンへの認識精度を向上させる技術的効果を達成できる。
ここで説明する図面は、本出願のさらなる理解を提供し、本出願の一部を構成し、本出願の例示的な実施例およびその説明は、本出願を解釈するためのもので、本出願に対する不適切な制限を構成するものではない。
本出願の実施例によるコーディングパターン処理方法のハードウェア環境の概略図である。 本出願の実施例による選択可能なコーディングパターン処理方法のフローチャートである。 本出願の実施例による選択可能なコーディングパターンを備えるポスターの概略図である。 本出願の実施例による選択可能なコーディングパターン処理モデルの概略図である。 本出願の実施例による選択可能なコーディングパターンの概略図である。 本出願の実施例による選択可能なコーディングパターンの概略図である。 本出願の実施例による選択可能なコーディングパターン処理モデルの概略図である。 本出願の実施例による選択可能なコーディングパターン処理モデルの概略図である。 本出願の実施例による選択可能なコーディングパターン処理装置の概略図である。 本出願の実施例による端末の構成ブロック図である。
当業者に本出願の解決策をよりよく理解させるために、以下、本出願の実施例における図面に基づいて、本出願の実施例における技術案を明らかに完全に説明する。勿論、説明の実施例は、全ての実施例ではなく、本出願の一部の実施例に過ぎない。本出願の実施例に基づいて、当業者により創造的な作業なしに得られる他のすべての実施例は、本出願の保護範囲に属するべきである。
なお、本出願の明細書及び特許請求の範囲ならびに上記の図面における「第1の」、「第2の」などの用語は、類似するオブジェクトを区別するために使用され、必ずしも特定の順序又はシーケンスを記述するために使用されない。このように使用されるデータは、適切な状況で交換でき、ここで説明される本出願の実施例は、ここで図示又は説明される順序以外の順序で実施できる。また、「含む」と「有する」という用語及びそれらのバリエーションは、非排他的な包含をカバーすることを目的とする。例えば、一連のステップ又はユニットを含む手順、方法、システム、製品又はデバイスは、明確にリストされたステップ又はユニットに必ずしも限定されるわけではなく、明確にリストされていないか又はこれらのプロセス、方法、製品、またはデバイスに固有のその他のステップまたはユニットを含むことができる。
まず、本出願の実施例を説明する過程で現れる一部の用語又は専門用語は、以下のように解釈できる。
2次元コード:2次元コードは2次元バーコードとも呼ばれて、一般的な2次元コードはQR Codeであり、QRの完全な英語名はQuick Responseであり、ある特定の幾何学図形を使用して、一定の規則に従って平面(2次元方向)に分布する白黒の図形で、データシンボル情報を記録するコーディング方式である。従来のバーコード(Bar Code)に比べて、多くの情報を記憶でき、より多くのデータタイプを表すこともできる。
一次元バーコード(一次元コード又はバーコードとも呼ばれる):バーコードバーとスペースの配置規則を指し、一般的な一次元コードのコード体系には、EANコード、39コード、クロス25コード、UPCコード、128コード、93コード、ISBNコード、およびCodabarコード(Codabar)等が含まれる。
ミニプログラム(Mini Program):ダウンロードしてインストールしなくても使用できるアプリケーションであり、ミニプログラムは親プログラムに依存して実行され、当該親プログラムには、インスタントメッセージングアプリケーション、ソーシャルアプリケーション、支払いアプリケーションが含まれるが、これらに限定されない。ユーザーは、親プログラムにおいてスキャン又は検索などの動作で、ミニプログラムを起動することができる。
本出願の実施例による一態様によれば、コーディングパターン処理方法の方法実施例を提供する。
任意選択で、本実施例では、上記のコーディングパターン処理方法は、図1に示すような、サーバー101と端末103で構成されるハードウェア環境に適用することができる。図1に示すように、サーバー101はネットワークを介して端末103に接続され、端末又は端末にインストールされたクライアントにサービス(例えば、ゲームサービス、アプリケーションサービス、インスタントメッセージングサービスなど)を提供できる。データベース105は、サーバー上に設置されるか、又はサーバーとは独立して設置され、サーバー101にデータ記憶サービスを提供できる。上記のネットワークには、ワイドエリアネットワーク、メトロポリタンエリアネットワーク、又はローカルネットワークが含まれるが、これらに限定されず、端末103は、PC、携帯電話、タブレットコンピューターなどに限定されない。
本出願の方法は、ソーシャルインタラクション、インスタントメッセージング、支払いなどの、デジタルコーディング情報を伝送する必要があるシナリオに適用できる。当該シナリオのハードウェア環境については、図1を参照して、コーディングパターンはサーバーから端末へ提供したり、1つの端末から他の端末へ提供したりすることができる。本出願のコーディングパターンを最適化する方法は、端末によって実行されてもよい。即ち、本出願の実施例のコーディングパターン処理方法は、端末103によって実行されてもよい。図2は本出願の実施例による選択可能なコーディングパターン処理方法のフローチャートである。図2に示すように、当該方法は、次のステップを含んでもよい。
S202、端末は、認識対象(即ち、コーディング情報認識対象)の第1のコーディングパターンを取得し、第1のコーディングパターンはコーディング情報を符号化したパターンである。
上記のコーディングパターンとは、パターンコーディング技術を利用して、コーディング情報を符号化することを指し、第1のコーディングパターンにおける異なるパターンは異なるコーディング情報を表すことができ、一般的なコーディングパターンには、2次元コード、一次元コード、ミニプログラムコード等が含まれる。
上記のコーディング情報は端末へ伝播するためのデジタル情報であり、例えば、ネットワークアドレス、支払い情報、プロモーション情報、インスタントメッセージングアカウント、ソーシャルグループなどのである。
S204、端末は、ターゲットモデルによって、第1のコーディングパターンの解像度を向上し、第2のコーディングパターンを取得し、ターゲットモデルは第3のコーディングパターンを入力とし所定の第4のコーディングパターンを出力としトレーニングしたものであり、第3のコーディングパターンは第4のコーディングパターンの解像度を下げることで得られたものであり、第3のコーディングパターンは第1のコーディングパターンと同じコーディング方式を利用するものである。
上記のターゲットモデルは、ニューラルネットワークモデルであってもよい。モデルは低解像度の第3のコーディングパターンを入力とし、高解像度の第4のコーディングパターンを予定出力としトレーニングしたものであるため、モデルに低解像度のコーディングパターンを高解像度のコーディングパターンに復元する機能を学習させることに相当する。S204は、トレーニング済みモデルを利用して超解像度復元を実行する。ここでの超解像度とは、イメージ超解像度の略称であり、即ち、低解像度イメージから高解像度イメージを復元するものである。
S206、端末は、コーディング認識モジュールに第2のコーディングパターンを提供する。
上記のコーディング認識モジュールは、2次元コード認識エンジン、ミニプログラムコード認識エンジンなどの、端末におけるコーディング認識エンジンであり得る。
上記の実施例では、本出願のコーディングパターン処理方法がサーバー101によって実行される例を説明したが、本出願のコーディングパターンを最適化する解決策も、端末で実行されてもよい。即ち、本出願のコーディングパターン処理方法は、端末103で実行されてもよく、サーバー101と端末103で共同実行されてもよい。さらに、端末103が本出願の実施例のコーディングパターン処理方法を実行する場合、端末103に搭載されたクライアントで実行されてもよい。
上記のS202からS206を経て、認識対象第1のコーディングパターンを取得した場合に、ターゲットモデルによって、第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、端末のコーディング認識モジュールに解像度のより高い第2のコーディングパターンを提供することで、関連技術におけるコーディングパターンを正確に認識できないという技術的な問題を解決し、コーディングパターンへの認識精度を向上させる技術的効果を達成できる。
現在の2次元コード認識技術では、入力のイメージの品質に対する要求が比較的に高く、ぼやけた、解像度が小さすぎる画像の場合、認識率は理想的ではない。インスタントメッセージング、ソーシャルなどのシナリオでは、図3に示すように、多くのポスター写真は写真の下部に小さな2次元コード(第1のコーディングパターンに相当)を付けて、2次元コードの解像度が低すぎるため、この2次元コードの認識に影響を与える。チャットするとき、同一の2次元コードの写真は通常、何度も転送されるため圧縮され、何度も圧縮されるため、小さい解像度とぼやけが同時に発生してしまう。このようなシナリオでは、2次元コードの認識がより困難になる。
上記の問題に直面した場合、本出願の技術案を利用できる。S202によって提供される技術案では、ポスター写真の下部の2次元コード、複数回圧縮後の2次元コードなどを第1のコーディングパターンとして端末に提供してもよい。この時、端末は、コーディング情報認識対象の第1のコーディングパターンを取得して、第1のコーディングパターンはコーディング情報を符号化したパターンである。
任意選択で、端末認識対象の第1のコーディングパターンを取得することは、端末認識対象の2次元コードコーディングパターンを取得することと、端末認識対象のミニプログラムコーディングパターンを取得することと、端末認識対象の一次元コードコーディングパターンを取得することとの一つを含む。
任意選択で、コーディングパターンの中央領域にあるLOGO(LOGOの中国語はロゴ又は商標であり、LOGOtypeの略称であり、ロゴを所有する会社の認識及び宣伝に役割を果たす)は不規則である場合が多いため、トレーニングに干渉しやすく、コーディングパターンの特徴の抽出をトレーニングすることに何の利点もなく、トレーニングする前にコーディングパターンの中央領域にあるLOGOを削除して、トレーニングへのLOGOの干渉を回避することができる。
S204によって提供される技術案では、端末は、ターゲットモデルによって第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを得る。
上記のターゲットモデルは、コーディングパターンのイメージ超解像度処理を行うことと、明瞭度を向上させることとを学習したモデルである。S204では、予めトレーニングしたターゲットモデルを使用してもよく、使用中にトレーニングしてもよい。モデルをトレーニングする一般的な考え方は、低解像度の第3のコーディングパターンを入力とし高解像度の第4のコーディングパターンを予定出力とし、トレーニングプロセスで、モデルはパラメータの値を調整することで、実際に出力されるコーディングパターンと第4のコーディングパターンとを同じにするか、基本的に同じにし、モデルのトレーニングが完了する。一つの選択可能なトレーニング方式は、次のようになる。
S11、ターゲットモデルによって第1のコーディングパターンの解像度を上げる前に、複数組のトレーニングイメージ(トレーニング画像とも言う)を取得し、各組のトレーニングイメージは一枚の第3のコーディングパターンと一枚の第4のコーディングパターンを含み、第4のコーディングパターンは事前に準備されたトレーニングデータであり、例えば、コーディングパターン生成ソフトウェアによって自動的に生成され、インターネットから収集され、同じ組のトレーニングイメージにおける2つのコーディングパターンが所持するコーディング情報は、同じであるか、基本的に同じである。
S12、複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングし、オリジナルモデルにおけるパラメータを初期化する。
任意選択で、図4に示すように、複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングし、オリジナルモデルにおけるパラメータを初期化することは、第3のコーディングパターンにおけるピクセルのグレースケール値をオリジナルモデルの入力とし(例えば、3*3の全接続層(全結合層とも言う))、第4のコーディングパターンをオリジナルモデルの予定出力とし、アクティベーション関数LReLU(完全名:LeakyRectified Linear Unit)を介してオリジナルモデルにおけるパラメータを初期化し、オリジナルモデルは複数の畳み込み層を含み、複数の畳み込み層のうち1番目の畳み込み層(例えば、畳み込み層1)の入力は第3のコーディングパターンにおけるピクセルのグレースケール値であり、複数の畳み込み層のうちi番目の畳み込み層の出力はi-1番目の畳み込み層の出力とi番目の畳み込み層によってi-1番目の畳み込み層の出力に対して畳み込み操作を実行した結果との和であり、例えば、畳み込み層2の入力は畳み込み層1の出力及び入力を含み、整数iは2からNまでの値をとり、Nは複数の畳み込み層の層数であり、オリジナルモデルにおけるパラメータは複数の畳み込み層の畳み込み操作で使用されるパラメータを含み、複数の畳み込み層のいずれかによって出力される1つのタイプ(クラス(class)とも言う)の特徴は当該畳み込み層における1つの畳み込みカーネルで畳み込み操作を行うことによって得られる。
上記の特徴とは、モデルにより認識された特徴を指し、例えば、2次元コードにおける左下の四角の場合、転送のプロセスで、境界が徐々にぼやけになり、イメージをより鮮明になるように、最近隣内挿法を利用して境界を復元してもよい。ひし形、三角形などの形状特徴の場合、境界をより鮮明になるように、最適方式を利用してもよい。
畳み込み層では、入力の情報はピクセルのグレースケール値で構成される行列又は他の畳み込み層から出力された特徴値行列であり、出力は特徴値行列であり、モデルにおけるパラメータは入力を出力にマッピングする関数におけるパラメータである。
S13、数回のトレーニングの後、テストに使用された第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力されたコーディングイメージ(コーディング画像とも言う)が検証用の第6のコーディングパターンとマッチングするかどうか、つまり、両者のイメージ類似度が指定された閾値(例えば、99%)に到達するかどうかを判断する。
S14、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングする場合に、トレーニングされたオリジナルモデルをターゲットモデルとし、第5のコーディングパターンは第6のコーディングパターンの解像度を下げたものであり、第5のコーディングパターンは第3のコーディングパターンと同じコーディング方式を利用するものである。
S15、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングしない場合に、S12に戻って、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とする場合、オリジナルモデルから出力されたコーディングイメージが第6のコーディングパターンとマッチングするまで、複数組のトレーニングイメージにおけるトレーニングイメージを使用してオリジナルモデルをトレーニングし続けて、オリジナルモデルにおけるパラメータを調整する。
なお、コーディングフォーマット又はコーディング方式が異なるイメージは特徴が異なるため、異なるコーディングフォーマットのコーディングパターンに適応するために、必要に応じて対応するコーディングフォーマットのトレーニングイメージを利用してトレーニングしてもよい。例えば、2次元コードパターンを認識しようとする場合、対応して2次元コードパターンを利用してトレーニングすればよい。
任意選択で、コーディングパターンについて、ぼやけるシナリオは多様である。出願人は、ほとんどのモデルがいくつかの固定のシナリオ(ターゲットシナリオと表記し、1つのシナリオは一種のイメージ劣化タイプと見なすことができる)に集中することを発見した。トレーニングの効率及びイメージ超解像度処理の正確率を向上させるために、複数の組のトレーニングイメージに主にこれらのターゲットシナリオにおいてぼやけが生じた第3のコーディングパターンとオリジナル第4のコーディングパターンが含まれるように、モデルをトレーニングして、これらのシナリオでぼやけたパターンに対して正確なイメージ超解像度処理を実行する機能を備える。
通常、低解像度イメージと比較して、高解像度イメージはより豊かな細部を提供し、優れた視覚効果を現し、2次元コード認識のような、イメージを入力とする後続の流れでは、システムの全体的な表現の向上にも役立つ。しかしながら、撮像デバイス、ストレージスペース及びネットワークリソース、使用シナリオなどの制限により、多くの場合、低解像度のコーディングイメージしか取得できない。従って、本出願の技術案を使用して超解像度動作を実行できる。任意の方式では、上記のトレーニングされたモデルによって実現する。
モデルをトレーニングした後、上記のモデルを使用してイメージ超解像度処理を実行することができる。ターゲットモデルによって第1のコーディングパターンの解像度を向上させて、イメージ超解像度処理後の第2のコーディングパターンを得る。イメージ超解像度処理は、具体的に次の2つのステップを含む。
ステップ21、ターゲットモデルによって、第1のコーディングパターンの解像度をターゲット解像度に上げて、ターゲットコーディングパターンを得る。
ステップ22、ターゲットモデルによって、ターゲットコーディングパターンにおけるサブパターンのエッジを修正し、第2のコーディングパターンを得る。
任意選択で、ターゲットモデルによって、ターゲットコーディングパターンにおけるサブパターンのエッジを修正し、第2のコーディングパターンを得ることは、ターゲットコーディングパターンにおける各サブパターンに対して、次のような処理を実行することを含む。即ち、ターゲットモデルによってサブパターンの特徴情報(feature)を認識し、例えば、当該サブパターンの形状を認識し、ターゲットモデルによってサブパターンの特徴情報とマッチングする修正情報を取得し、当該修正情報は、より明確にするために、どのような修正方式を利用してエッジを修正するかことを示し、ターゲットモデルによって、サブパターンの特徴情報とマッチングする修正情報に応じて、サブパターンのエッジを修正し、例えば、四角の場合、最近隣内挿法を利用して境界を復元し、イメージをより鮮明にする。
任意選択で、ターゲットモデルによってサブパターンの特徴情報を認識することは、ターゲットモデルの複数の畳み込み層によって、サブパターンの特徴情報を認識することと、複数の畳み込み層を直列に接続し(即ち、これらの複数の畳み込み層は一列又は一行に配置し、前の畳み込み層の出力を次の畳み込み層の入力とする)、複数の畳み込み層のうちいずれかの畳み込み層の出力が当該畳み込み層の後に直列に接続された少なくとも1つの畳み込み層の入力、例えば後の各畳み込み層の入力とされることと、を含む。換言すれば、本出願では、ネットワークで密集接続を利用する方式を利用している。このような方式は、損失を削減し、ネットワーク浅層特徴を深層特徴に接続することで、層間の情報伝送を最大化し、同時にトレーニング時間を短縮し、勾配の消失(vanishing-gradient)による問題を減らすことができる。
上記のステップにより、勾配の消失による問題が軽減され、特徴情報の伝送が強化され、特徴情報をより効果的に使用でき、パラメータの数も減らすことができる。
上記のイメージ超解像度処理は、低解像度イメージ(例えば、第1のコーディングパターン)を入力とし、高解像度イメージ(例えば、第2のコーディングパターン)の出力に再構成する。バイリニア(bilinear)補間及びバイキュービック(Bicubic)補間は様々なイメージコンテンツに適応できなく、認識能力が低く、イメージの高周波情報を再構築することが困難であり、出力画像がぼやけすぎて、圧縮イメージに適用される場合人工効果の干渉を増幅することを考えると、本出願では、画素補間に基づくイメージ超解像度アルゴリズムを利用し、当該アルゴリズムは、簡単な計算と高速の利点があるので、良い適用シナリオがあり、例えば、最近傍(nearest)補間を利用する。
S206によって提供される技術案では、端末はコーディング認識モジュールに第2のコーディングパターンを提供するので、端末はイメージ超解像度処理後の第2のコーディングパターンを使用して運ばれるコーディング情報を正確に認識することができる。
本出願は、コードスキャンイメージの特点に応じて、モバイル端末に適したイメージ超解像度処理ネットワークを設計し、高速で効率的なコードイメージの再構成を実現し、画質を向上させ、コードスキャンアルゴリズムの認識成功率を大幅に向上させる。図5は、本出願のイメージ復元の再構成効果を示し、その中で、501は圧縮対象イメージで、503は関連技術における復元解決策(例えば、Bicubic)によって得られたもので、505は本出願の技術案を利用して得られたものである。
以下、任意の実施例として、具体的な実施方式に基づいて本出願の技術案を詳細に説明する。
本出願は、圧縮写真における2次元コードを高度に復元することにより、2次元コード認識性能を向上させる方法を提供する。当該方法は主に、写真が圧縮された後に、2次元コードがぼやけ過ぎて認識しにくいという問題を解決するために提案された。図6に示すように、インスタントメッセージングで2次元コードを長押しして認識するシナリオでは、多くのコードイメージがスクリーンショット、モーメンツ及びチャットを通じて何度も圧縮され転送されるため、品質が著しく損なわれ、解像度が低下し、エッジがぼやけて、認識が非常に困難になる。具体的には、これは主に次の2つの側面に反映される。
一つ目は、イメージの解像度が小さいことである。例えば、図3に示すように、ポスターに埋め込まれるか、又は遠くから撮影された2次元コードは、解像度が通常の状況でのコードイメージよりもはるかに小さい。2つ目は、画質が低い。図6に示すように、長押しで認識されたコードイメージの多くは、何度も圧縮及び転送されており、深刻な人工効果(例えば、リンギング効果など)の干渉がある。以上は関連技術における2次元コード認識アルゴリズムに深刻な影響を及ぼす。これらの低品質のコードイメージに出会うと、多くの場合、従来のアルゴリズムでは満足の結果を得ることが困難である。
これらの問題に対して、本出願は、認識流れに超解像度戦略を導入し、スキャンコードイメージの解像度を向上させながら、画質を向上させて、認識率を高める。本出願の技術案は、2次元コード認識エンジンの一部として使用できる。当該アルゴリズムは、簡潔で効率的で、2次元コード、ミニプログラムコード、一次元コード、PDF417などの複数の主流のコードフォーマットをサポートする。実際のシナリオのテストにより、この戦略により、コードスキャンエンジンの低品質イメージへのロバスト性及び認識成功率を大幅に向上し、より広範囲で複雑なシナリオに適用できることを表明した。
本出願の深層学習に基づいて設計されたイメージ超解像度処理アルゴリズムは、特徴マップを完全に再利用し、計算量を削減しながら、良好な再構成効果を維持する。同時に、2次元コードイメージの特点に応じて、特定の損失関数を利用して、後続の認識の成功率を向上させた。
ネットワーク構造設計では、モデル体積を簡素化し、計算速度を上げるために、ニューラルネットワークの深さ及び幅を圧縮してもよい。このようにすれば、精度が多少失われるが、本出願はネットワークで密集接続を使用する方式を利用しているため、この方式は損失を削減し、ネットワーク浅層特徴を深層特徴に接続して、層間の情報伝送を最大限に確保することができる。
本出願は、より簡素化したボトルネック構造を利用しているため、3*3の畳み込みカーネルを成長率よりも低い特徴次元で実行させて、モデルの体積及び計算量をさらに削減した。図7は、両者の違いを示している(簡潔にするために、アクティベーション関数とバッチ正規化(Batch Normalization、BN)を無視して、バッチ正規化はトレーニング最適化方法であり、Normalizationはデータ正規化であり、Batchはバッチとして理解でき、それらを組み合わせてバッチ正規化になる。モデルでは、Batchはトレーニングネットワークによって設定された写真数(batch_size)であり、BN層を削除した。また、パラメータ及び計算量がともに大きい左側の3*3畳み込みカーネルに対して、レイヤーごとの(depthwise)畳み込みに変更し、即ち、ネットワークのアップサンプリングと再構成のモジュールであり、本出願は類似するdepthwiseに基づくボトルネック構造を利用してアップサンプリングと再構成を実現し、最後に出力の前に1つの1*1畳み込みカーネルを追加し、特徴チャネルの組み合わせと次元のアップグレードに使用し、モジュールでは畳み込み層の後ろにLReLUをアクティベーション関数として使用する。
モデルトレーニング階段では、本出願は残差学習を利用する。図8に示すように、オリジナルの低解像度2次元コードイメージを入力とし、基本的なネットワークは畳み込み層で構成されるネットワークであり、ネットワークの最終的な再構成層にデコンボリューションでターゲット解像度にアップサンプリングする。このように、計算プロセス全体が低解像度の空間で実行されるため、計算量が削減される。
モデルトレーニングのプロセスでは、2次元コードイメージ及び認識流れの特点に応じて、本出願は境界損失とバイナリモード制限損失という損失関数を試した。具体的に、境界損失では、モデルが明確なエッジをできるだけ正確に再構築できるようにするために、本出願はsobelオペレーターを使用してイメージのエッジ情報を抽出し、損失関数の重みとし、これらの位置予測偏差のコストを増加させる。バイナリモード制限損失では、本出願はバイナリモード制限損失関数を利用して、誤って計算されたグレーピクセルのペナルティを増やし、L2Lossに基づき、シグモイド(Sigmoid)関数の1次導関数を重みとする。しかしながら、これらの損失関数が本出願の技術案に適用された場合、効果はあまりよくない。
超解像度プロセスで、主なタスクは、イメージの高周波情報を推定することであり、収束を高速化するために、本出願は計算量が小さい最近隣内挿法を使用して、入力イメージをターゲットサイズに直接拡大し、ネットワーク出力に加算して、最終的な出力を得る。このような方式によって、ネットワークは残差を学習するだけでよい。実践が証明するように、残差学習は収束を加速するだけでなく、再構成の正確度も向上させる。
任意選択で、本出願は、トレーニングデータに対して処理を追加してもよい。例えば、2次元コードの中央領域にあるLOGO情報は認識には役立たず、直接に消去できる。イメージ超解像度拡大とともに画質を向上させるために、本出願はモデルのロバスト性と一般化能力を強化するように、トレーニングデータに複数のイメージ劣化タイプを集中に導入してもよい。
表1に示すように、大きなモデルは認識率が高いが多くのリソースを消費し、小さなモデルは反対である。小さなモデルの効果をさらに向上させるために、本出願は圧縮なしの大きなモデルを使用して小さなモデルのトレーニングをガイドし、小さなモデルを大きなモデルの予測結果に直接に適合させる。モデルの蒸留は、テストプロセスに追加のオーバーヘッドをもたらすことはなく、速度とモデル体積に影響を与えることはないが、モデルの正確度を効果的に向上させることができる。
Figure 2021521558
本出願は、シンプルで効率的なネットワーク構造を提供し、超解像アルゴリズムをモバイルデバイスで迅速に実行でき、一つのフレームにかかる時間は10ms未満である。図4は、当該アルゴリズムの完全なネットワーク構造を示している。
本出願の技術案によれば、スキャンコードイメージのイメージ超解像度の復元を実現でき、解像度が小さいコードイメージに対してイメージ超解像度の復元を実行し、高解像度の出力を取得し、コーディング領域のエッジが鋭利で、明瞭であることを保証し、画質が強化されることで、何度も圧縮され転送されたコードに対しても画質を強化し、人工効果による後続の認識流れへの干渉を低減し、モデル体積が小さく、計算が高速であるため、定量化圧縮されたネットワークモデルはわずか13Kであり、現在学術界で一般的に使用されている主流のイメージ超解像度モデル(例えば、マルチスケールの超解像アーキテクチャMDSR、加速されたディープCNN超解像ネットワークFSRCNNなど) よりもはるかに小さい。本出願は、圧縮写真における2次元コードを高度に復元することにより、2次元コードの認識性能を向上させる方法を提供する。
なお、前述の各方法の実施例では、説明を簡略化するために、それをすべて一連のアクション組み合わせとして表したが、本出願は説明されたアクション順序によって制限されない。本出願では、一部のステップは他の順序で又は同時に実行できる。また、明細書に記載された実施例はいずれも好ましい実施例に属し、言及されたアクションとモジュールは本出願に必ずしも必要ではない。
以上の実施形態の説明により、当業者は、上記の実施例による方法が、ソフトウェアに加えて必要な一般的なハードウェアプラットフォームによって実現され得て、もちろん、ハードウェアによって実現され得ることが理解できる。多くの場合、前者はより最適化された実施方式である。このような理解に基づいて、本出願の技術案の本質的に又は先行技術に寄与する部分は、ソフトウェア製品の形で表現できる。当該コンピュータソフトウェア製品は、1つの記憶媒体(例えば、ROM/RAM、磁気ディスク、光ディスク)に記憶され、端末デバイス(携帯電話、コンピュータ、サーバー、又はネットワークデバイスなど)に本出願の各実施例に記載の方法を実行させるためのいくつかの指示が含まれている。
本出願の実施例による他の態様は、上記のコーディングパターン処理方法を実施するためのコーディングパターン処理装置を提供する。図9は、本出願の実施例による選択可能なコーディングパターン処理装置の概略図である。図9に示すように、当該装置は、第1の取得ユニット901と、処理ユニット903と、インタラクションユニット905とを含んでよい。
第1の取得ユニット901は、認識対象の第1のコーディングパターンを取得し、第1のコーディングパターンはコーディング情報を符号化したパターンである。
処理ユニット903は、ターゲットモデルによって、第1のコーディングパターンの解像度を向上し、第2のコーディングパターンを取得し、ターゲットモデルは第3のコーディングパターンと所定の第4のコーディングパターンを利用してトレーニングしたものであり、第3のコーディングパターンが第4のコーディングパターンの解像度を下げることで得られたものであり、第3のコーディングパターンは第1のコーディングパターンと同じコーディング方式を利用するものである。
インタラクションユニット905は、端末のコーディング認識モジュールに第2のコーディングパターンを提供する。
なお、当該実施例における第1の取得ユニット901は本出願の実施例におけるS202を実行でき、当該実施例における処理ユニット903は本出願の実施例におけるS204を実行でき、当該実施例におけるインタラクションユニット905は本出願の実施例におけるS206を実行できる。
なお、上記のモジュールと対応するステップによって実現される例及び適用シナリオは同じであるが、上記の実施例で開示された内容に限定されない。上記のモジュールは、装置の一部として図1に示すハードウェア環境で実行でき、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。
上記のモジュールによって、認識対象の第1のコーディングパターンを取得した場合に、ターゲットモデルによって、第1のコーディングパターンの解像度を上げ、第2のコーディングパターンを取得し、端末のコーディング認識モジュールに解像度のより高い第2のコーディングパターンを提供することで、関連技術におけるコーディングパターンを正確に認識できないという技術的な問題を解決し、コーディングパターンへの認識精度を向上させる技術的効果を達成できる。
任意選択で、処理ユニットは、ターゲットモデルによって、第1のコーディングパターンの解像度をターゲット解像度に上げ、ターゲットコーディングパターンを得るための超解像モジュールと、ターゲットモデルによって、ターゲットコーディングパターンにおけるサブパターンのエッジを修正し、第2のコーディングパターンを得るための修正モジュールと、を含む。
任意選択で、修正モジュールは、さらに、ターゲットコーディングパターンにおけるサブパターンに対して次のような処理を実行する。即ち、ターゲットモデルによってサブパターンの特徴情報を認識することと、ターゲットモデルによって、サブパターンの特徴情報とマッチングする修正情報を取得することと、ターゲットモデルによって、サブパターンの特徴情報とマッチングする修正情報に応じて、サブパターンのエッジを修正することと、を含む。
任意選択で、修正モジュールは、さらに、ターゲットモデルの複数の畳み込み層によって、サブパターンの特徴情報を認識し、複数の畳み込み層が直列に接続され、複数の畳み込み層のいずれか1つの出力は当該畳み込み層の後に直列に接続された少なくとも1つの畳み込み層の入力として使用される。
任意選択で、本出願の装置は、ターゲットモデルによって第1のコーディングパターンの解像度を上げる前に、それぞれ一枚の第3のコーディングパターンと一枚の第4のコーディングパターンを含む複数組のトレーニングイメージを取得するための第2の取得ユニットと、複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングするための第1のトレーニングユニットと、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングする場合に、トレーニングされたオリジナルモデルをターゲットモデルとし、第5のコーディングパターンは第6のコーディングパターンの解像度を下げたものであり、第5のコーディングパターンは第3のコーディングパターンと同じコーディング方式を利用するものである確定ユニットと、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングしない場合に、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とする場合オリジナルモデルから出力されたコーディングイメージが第6のコーディングパターンとマッチングするまで、複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングし続けて、オリジナルモデルにおけるパラメータを調整するための第2のトレーニングユニットと、をさらに含む。
任意選択で、第1のトレーニングユニットは、さらに、第3のコーディングパターンにおけるピクセルのグレースケール値をオリジナルモデルの入力とし、第4のコーディングパターンをオリジナルモデルの予定出力とし、オリジナルモデルにおけるパラメータを初期化することができ、ただし、オリジナルモデルは複数の畳み込み層を含み、複数の畳み込み層のうち1番目の畳み込み層の入力は第3のコーディングパターンにおけるピクセルのグレースケール値であり、複数の畳み込み層のうちi番目の畳み込み層の出力はi-1番目の畳み込み層の出力とi番目の畳み込み層によりi-1番目の畳み込み層の出力に対して畳み込み操作を実行した結果との和であり、整数iは2からNまでの値をとり、Nは複数の畳み込み層の層数であり、オリジナルモデルにおけるパラメータに複数の畳み込み層の畳み込み操作で使用されるパラメータが含まれ、複数の畳み込み層のいずれかによって出力される1つのタイプの特徴は、当該畳み込み層における1つの畳み込みカーネルで畳み込み操作を行うことによって得られる。
任意選択で、第1の取得ユニットは、端末認識対象第1のコーディングパターンを取得する場合、端末認識対象の2次元コードコーディングパターンを取得してもよく、端末認識対象のミニプログラムコーディングパターンを取得してもよく、端末認識対象の一次元コードコーディングパターンを取得してもよい。
なお、上記のモジュールと対応するステップによって実現される例及び適用シナリオは同じであるが、上記の実施例で開示された内容に限定されない。なお、上記のモジュールは、装置の一部として図1に示すようなハードウェア環境で実行でき、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。ハードウェア環境はネットワーク環境を含む。
本出願の実施例による他の態様は、上記のコーディングパターン処理方法を実施するためのサーバー又は端末を提供する。
図10は、本出願の実施例による端末の構成ブロック図である。図10に示すように、当該端末は、1つ又は複数の(図10には1つだけが示されている)プロセッサー1001、メモリ1003、及び伝送装置1005を含んでもよい。図10に示すように、当該端末は、入出力デバイス1007を含んでもよい。
メモリ1003は、ソフトウェアプログラム及びモジュールを記憶でき、例えば、本出願の実施例におけるコーディングパターン処理方法及び装置に対応するプログラム指令/モジュールを記憶できる。プロセッサー1001は、メモリ1003に記憶されるソフトウェアプログラム及びモジュールを実行することで、各機能適用及びデータ処理を実行し、即ち、上記のコーディングパターン処理方法を実現する。メモリ1003は、高速ランダムメモリを含んでもよく、1つ又は複数の磁気記憶装置、フラッシュメモリ、又は他の非揮発性ソリッドステートメモリのような非揮発性メモリを含んでもよい。いくつかの例では、メモリ1003は、プロセッサー1001に対してリモートに設置されるメモリをさらに含み得、これらのリモートメモリはネットワークを介して端末に接続されてもよい。上記のネットワークの例には、インターネット、企業イントラネット、ローカルネットワーク、モバイル通信ネットワーク、及びこれらの組み合わせが含まれが、これらに限定されない。
上記の伝送装置1005は、1つのネットワークを介してデータを送受信し、プロセッサーとメモリとの間のデータを伝送してもよい。上記のネットワーク具体的な例は、有線ネットワークと無線ネットワークを含み得る。1つの例では、伝送装置1005は、インターネット又はローカルネットワークと通信するように、ネットワークケーブルを介して他のネットワークデバイス及びルータに接続できる1つのネットワークインターフェースコントローラ(Network Interface Controller、NIC)を含む。1つの例では、伝送装置1005は、無線方式でインターネットと通信するための無線周波数(Radio Frequency、RF)モジュールである。
具体的に、メモリ1003はアプリケーションプログラムを記憶する。
プロセッサー1001は、伝送装置1005により、メモリ1003に記憶されたアプリケーションプログラムを呼び出して、次のステップを実行する。即ち、
端末認識対象の第1のコーディングパターンを取得し、第1のコーディングパターンはコーディング情報をエンコードしたパターンである、ステップと、
ターゲットモデルによって、第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、ターゲットモデルは第3のコーディングパターンを入力とし第4のコーディングパターンを出力としトレーニングしたものであり、第3のコーディングパターンは第4のコーディングパターンの解像度を下げることで得られたものであり、第3のコーディングパターンは第1のコーディングパターンと同じコーディング方式を利用するものであるステップと、
端末のコーディング認識モジュールに第2のコーディングパターンを提供するステップと、を含む。
プロセッサー1001は、次のステップをさらに実行する。即ち、
複数組のトレーニングイメージの組を取得し、各組のトレーニングイメージは一枚の第3のコーディングパターンと一枚の第4のコーディングパターンを含むステップと、
複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングし、オリジナルモデルにおけるパラメータを初期化するステップと、
第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングする場合に、トレーニングされたオリジナルモデルをターゲットモデルとし、第5のコーディングパターンは第6のコーディングパターンの解像度を下げたものであり、第5のコーディングパターンは第3のコーディングパターンと同じコーディング方式を利用するものであるステップと、
第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングしない場合に、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とする場合オリジナルモデルから出力されたコーディングイメージが第6のコーディングパターンとマッチングするまで、複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングし続けて、オリジナルモデルにおけるパラメータを調整するステップと、
をさらに実行する。
本出願の実施例によれば、「コーディング情報をエンコードしたパターンである、端末認識対象の第1のコーディングパターンを取得し、ターゲットモデルによって、第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、ターゲットモデルは第3のコーディングパターンを入力とし第4のコーディングパターンを出力としトレーニングしたものであり、第3のコーディングパターンは第4のコーディングパターンの解像度を下げることで得られたものであり、第3のコーディングパターンは第1のコーディングパターンと同じコーディング方式を利用するものであり、端末のコーディング認識モジュールに第2のコーディングパターンを提供する」ということによって、認識対象の第1のコーディングパターンを取得した場合に、ターゲットモデルによって、第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、端末のコーディング認識モジュールに解像度のより高い第2のコーディングパターンを提供することで、関連技術におけるコーディングパターンを正確に認識できないという技術的な問題を解決し、コーディングパターンへの認識精度を向上させる技術的効果を達成できる。
任意選択で、本実施例における具体的な例は、上記の実施例で説明した例を参照することができるため、本実施例は、ここで繰り返さない。
任意選択で、当業者は、図10に示した構造は、説明のためのものに過ぎず、端末は、スマートフォン(例えば、Androidフォン、iOSフォンなど)、タブレット、ハンドヘルドコンピューター、及びモバイルインターネットデバイス(Mobile Internet Devices、MID)、PADなどの端末デバイスであってもよいことが理解できる。図10は、上記の電子装置の構造を制限するものではない。例えば、電子装置は、図10に示したものよりも多いまたは少ないコンポーネント(例えば、ネットワークインターフェース、表示装置など) を含み得、又は図10に示したものとは異なる配置を有し得る。
上記の実施例に係る各種方法におけるステップの全て又は一部は、プログラムによって端末デバイスに関連するハードウェアに指示して完成でき、当該プログラムがコンピュータ可読記憶媒体に記憶され、記憶媒体は、フラッシュメモリディスク、読み取り専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク又は光ディスクなどを含む。
本出願の実施例は、さらに、記憶媒体を提供する。任意選択で、本実施例では、上記の記憶媒体は、コーディングパターン処理方法のプログラムコードを実行することができる。
任意選択で、本実施例では、上記の記憶媒体は、上記の実施例に示したネットワークにおける複数のネットワークデバイスのうち少なくとも1つにあってもよい。
任意選択で、本実施例では、記憶媒体は、次のステップを実行するためのプログラムコードを記憶するように設置される。即ち、
コーディング情報をエンコードしたパターンである、端末認識対象の第1のコーディングパターンを取得するステップと、
ターゲットモデルによって、第1のコーディングパターンの解像度を上げて、第2のコーディングパターンを取得し、ターゲットモデルは第3のコーディングパターンと所定の第4のコーディングパターンを利用してトレーニングしたものであり、第3のコーディングパターンは第4のコーディングパターンの解像度を下げることで得られたものであり、第3のコーディングパターンは第1のコーディングパターンと同じコーディング方式を利用するものであるステップと、
端末のコーディング認識モジュールに第2のコーディングパターンを提供するステップと、を含む。
任意選択で、記憶媒体は、次のステップを実行するためのプログラムコードを記憶するように設置される。即ち、
複数組のトレーニングイメージを取得し、各組のトレーニングイメージに一枚の第3のコーディングパターンと一枚の第4のコーディングパターンが含まれるステップと、
複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングし、オリジナルモデルにおけるパラメータを初期化するステップと、
第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングする場合に、トレーニングされたオリジナルモデルをターゲットモデルとし、第5のコーディングパターンは第6のコーディングパターンの解像度を下げたものであり、第5のコーディングパターンは第3のコーディングパターンと同じコーディング方式を利用するものであるステップと、
第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とし、オリジナルモデルから出力したコーディングイメージと第6のコーディングパターンがマッチングしない場合に、第5のコーディングパターンをトレーニングされたオリジナルモデルの入力とする場合オリジナルモデルから出力されたコーディングイメージが第6のコーディングパターンとマッチングするまで、複数組のトレーニングイメージにおけるトレーニングイメージを使用して、オリジナルモデルをトレーニングし続けて、オリジナルモデルにおけるパラメータを調整するステップと、を含む。
任意選択で、本実施例における具体的な例は、上記の実施例で説明した例を参照することができ、本実施例はここで繰り返さない。
任意選択で、本実施例では、上記の記憶媒体は、Uディスク、読み取り専用メモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、モバイルハードディスク、磁気ディスク、又は光ディスクなどの、プログラムコードを記憶できる媒体を含むが、これらに限定されない。
本出願の実施例は、さらに、指令を含むコンピュータプログラム製品を提供し、コンピュータで実行される場合、コンピュータに上記の実施例によって提供される方法を実行させる。
上記の本出願の実施例のシリアル番号は、説明のためのものであり、実施例の優位性を表すものではない。
上記の実施例における集積ユニットがソフトウェア機能ユニットの形で実現され、独立した製品として販売又は使用される場合、上記のコンピュータ可読取記憶媒体に記憶されてもよい。このような理解に基づいて、本出願の技術案は、本質的に、又は先行技術に寄与する一部、又は当該技術案の全て又は一部は、ソフトウェア製品の形で具現化することができる。当該コンピュータソフトウェア製品は、記憶媒体に記憶され、一つ又は複数のコンピュータデバイス(パーソナルコンピュータ、サーバー、又はネットワークデバイスなどであり得る)に本出願の各実施例に記載の方法のステップの全て又は一部を実行させるように、いくつかの指令を含む。
上記の本出願の実施例では、各実施例に対する説明にそれぞれ重点があり、ある実施例において詳細に説明されていない部分については、他の実施例の関連説明を参照できる。
本出願によって提供されるいくつかの実施例では、開示のクライアントは、他の方式で実現できる。なお、上記の装置の実施例は単なる例示であり、例えば前記ユニットの分割は、論理機能の分割に過ぎず、実際の実現に他の分割方式もあり得る。例えば、複数のユニット又はコンポーネントは組み合わせたり、他のシステムに集積したり、一部の特徴を省略したり、実行しないことができる。また、表示又は議論の相互結合又は直接結合又は通信接続は、インターフェース、ユニット又はモジュールを介した間接結合又は通信接続であってもよく、電気的または他の形態であってもよい。
前記の分割部材として説明したユニットは、物理的に分割されてもされなくてもよい。ユニットとして表示した部材は、物理的なユニットであってもなくてもよい。即ち、1つの場所にあってもよく、複数のネットワークユニットに分散されてもよい。実際の必要に応じて、一部又は全てユニットを選択して本実施例の技術案の目的を実現してもよい。
また、本出願の各実施例における各機能ユニットは、1つの処理ユニットに集積されてもよく、各ユニットは物理的に単独で存在してもよく、2つ以上のユニットが1つのユニットに集積されてもよい。上記の集積されたユニットは、ハードウェアの形で実現されてもよく、ソフトウェア機能ユニットの形で実現されてもよい。
以上は、本出願の好ましい実施形態に過ぎず、本出願の原理から逸脱することなく、改良および修正を行うことができ、これらの改良および修正もまた、本出願の保護範囲と見なされるべきである。

Claims (15)

  1. 電子装置が実行するコーディングパターン処理方法であって、
    前記電子装置が、
    端末の認識対象となる第1のコーディングパターンを取得するステップであって、前記第1のコーディングパターンはコーディング情報をエンコードしたパターンである、ステップと、
    ターゲットモデルによって前記第1のコーディングパターンの解像度を上げ、第2のコーディングパターンを取得するステップであって、前記ターゲットモデルは第3のコーディングパターン及び所定の第4のコーディングパターンを利用してトレーニングして得られたものであり、前記第3のコーディングパターンは前記第4のコーディングパターンの解像度を下げることで得られたものであり、前記第3のコーディングパターンは前記第1のコーディングパターンと同じコーディング方式を利用する、ステップと、
    前記端末のコーディング認識モジュールに前記第2のコーディングパターンを提供するステップと、
    を含むことを特徴とするコーディングパターン処理方法。
  2. ターゲットモデルによって前記第1のコーディングパターンの解像度を上げ、第2のコーディングパターンを取得する前記ステップは、
    前記ターゲットモデルによって、前記第1のコーディングパターンの解像度をターゲット解像度に上げ、ターゲットコーディングパターンを取得するステップと、
    前記ターゲットモデルによって、前記ターゲットコーディングパターンにおけるサブパターンのエッジを修正し、前記第2のコーディングパターンを取得するステップと、
    を含む、ことを特徴とする請求項1に記載のコーディングパターン処理方法。
  3. 前記ターゲットモデルによって、前記ターゲットコーディングパターンにおけるサブパターンのエッジを修正し、前記第2のコーディングパターンを取得する前記ステップは、
    前記ターゲットモデルによって、前記サブパターンの特徴情報を認識するステップと、
    前記ターゲットモデルによって、前記サブパターンの特徴情報とマッチングする修正情報を取得するステップと、
    前記ターゲットモデルによって、前記サブパターンの特徴情報とマッチングする修正情報に応じて、前記サブパターンのエッジを修正するステップと、
    を含む、ことを特徴とする請求項2に記載のコーディングパターン処理方法。
  4. 前記ターゲットモデルによって、前記サブパターンの特徴情報を認識する前記ステップは、
    前記ターゲットモデルの複数の畳み込み層によって、前記サブパターンの特徴情報を認識するステップであって、前記複数の畳み込み層は直列に接続され、前記複数の畳み込み層のいずれか1つの畳み込み層の出力は当該畳み込み層の後に直列に接続される少なくとも1つの畳み込み層の入力とされる、ステップを含む、
    ことを特徴とする請求項3に記載のコーディングパターン処理方法。
  5. 前記ターゲットモデルは、
    前記電子装置が複数組のトレーニング画像を取得するステップであって、各組の前記トレーニング画像は1つの前記第3のコーディングパターン及び1つの前記第4のコーディングパターンを含む、ステップと、
    前記電子装置が、前記複数組のトレーニング画像におけるトレーニング画像を使用して、オリジナルモデルをトレーニングするステップと、
    前記電子装置が、第5のコーディングパターンをトレーニングされた前記オリジナルモデルの入力とし、かつ前記オリジナルモデルから出力したコーディング画像と第6のコーディングパターンがマッチングする場合に、トレーニングされた前記オリジナルモデルを前記ターゲットモデルとするステップであって、前記第5のコーディングパターンは前記第6のコーディングパターンの解像度を下げることで得られたものであり、前記第5のコーディングパターンは前記第3のコーディングパターンと同じコーディング方式を利用する、ステップと、
    前記電子装置が、前記第5のコーディングパターンをトレーニングされた前記オリジナルモデルの入力とし、かつ前記オリジナルモデルから出力したコーディング画像と前記第6のコーディングパターンがマッチングしない場合に、前記複数組のトレーニング画像におけるトレーニング画像を使用して、オリジナルモデルをトレーニングする前記ステップを引き続き実行するステップと、
    によりトレーニングされる、ことを特徴とする請求項1から4のいずれか1項に記載のコーディングパターン処理方法。
  6. 前記電子装置が、前記複数組のトレーニング画像におけるトレーニング画像を使用して、オリジナルモデルをトレーニングする前記ステップは、
    前記電子装置が、前記第3のコーディングパターンにおけるピクセルのグレースケール値を前記オリジナルモデルの入力とし、前記第4のコーディングパターンを前記オリジナルモデルの予定出力とするステップであって、前記オリジナルモデルは複数の畳み込み層を含み、前記複数の畳み込み層のうち1番目の畳み込み層の入力は前記第3のコーディングパターンにおけるピクセルのグレースケール値であり、前記複数の畳み込み層のうちi番目の畳み込み層の出力はi-1番目の畳み込み層の出力と、i番目の畳み込み層によりi-1番目の畳み込み層の出力に対して畳み込み操作を行った結果と、を含み、整数iは2からNまでの値をとり、Nは前記複数の畳み込み層の層数であり、前記オリジナルモデルにおけるパラメータは前記複数の畳み込み層の畳み込み操作に使用されるパラメータを含み、前記複数の畳み込み層のいずれか1つの畳み込み層によって出力される1つのクラスの特徴は当該畳み込み層における1つの畳み込みカーネルにより畳み込み操作を行うことによって得られるものである、ステップを含む、
    ことを特徴とする請求項5に記載のコーディングパターン処理方法。
  7. 前記第1のコーディングパターンは、
    2次元コードコーディングパターン、
    ミニプログラムコーディングパターン、及び
    1次元コードコーディングパターン
    のうちの一つを含む、ことを特徴とする請求項1から6のいずれか1項に記載のコーディングパターン処理方法。
  8. コーディングパターン処理装置であって、
    端末の認識対象となる第1のコーディングパターンを取得するための第1の取得ユニットであって、前記第1のコーディングパターンはコーディング情報をエンコードしたパターンである、第1の取得ユニットと、
    ターゲットモデルによって前記第1のコーディングパターンの解像度を上げ、第2のコーディングパターンを取得するための処理ユニットであって、前記ターゲットモデルは第3のコーディングパターン及び所定の第4のコーディングパターンを利用してトレーニングして得られたものであり、前記第3のコーディングパターンは前記第4のコーディングパターンの解像度を下げることで得られたものであり、前記第3のコーディングパターンと前記第1のコーディングパターンは同じコーディング方式を利用する、処理ユニットと、
    前記端末のコーディング認識モジュールに前記第2のコーディングパターンを提供するためのインタラクションユニットと、
    を含む、ことを特徴とするコーディングパターン処理装置。
  9. 前記処理ユニットは、
    前記ターゲットモデルによって、前記第1のコーディングパターンの解像度をターゲット解像度に上げ、ターゲットコーディングパターンを取得するための超解像モジュールと、
    前記ターゲットモデルによって、前記ターゲットコーディングパターンにおけるサブパターンのエッジを修正し、前記第2のコーディングパターンを取得するための修正モジュールと、
    を含む、ことを特徴とする請求項8に記載のコーディングパターン処理装置。
  10. 前記修正モジュールは、さらに、前記ターゲットコーディングパターンにおけるサブパターンに対して、
    前記ターゲットモデルによって、前記サブパターンの特徴情報を認識し、
    前記ターゲットモデルによって、前記サブパターンの特徴情報とマッチングする修正情報を取得し、及び
    前記ターゲットモデルによって、前記サブパターンの特徴情報とマッチングする修正情報に応じて、前記サブパターンのエッジを修正する処理を行う、
    ことを特徴とする請求項9に記載のコーディングパターン処理装置。
  11. 前記修正モジュールは、さらに、前記ターゲットモデルの複数の畳み込み層によって、前記サブパターンの特徴情報を認識するために用いられ、
    前記複数の畳み込み層は直列に接続され、前記複数の畳み込み層のいずれか1つの畳み込み層の出力は当該畳み込み層の後に直列に接続される少なくとも1つの畳み込み層の入力とされる、
    ことを特徴とする請求項10に記載のコーディングパターン処理装置。
  12. ターゲットモデルによって前記第1のコーディングパターンの解像度を上げる前に、複数組のトレーニング画像を取得するための第2の取得ユニットであって、各組の前記トレーニング画像は1つの前記第3のコーディングパターン及び1つの前記第4のコーディングパターンを含む、第2の取得ユニットと、
    前記複数組のトレーニング画像におけるトレーニング画像を使用して、オリジナルモデルをトレーニングするための第1のトレーニングユニットと、
    第5のコーディングパターンをトレーニングされた前記オリジナルモデルの入力とし、かつ前記オリジナルモデルから出力したコーディング画像と第6のコーディングパターンがマッチングする場合に、トレーニングされた前記オリジナルモデルを前記ターゲットモデルとするための確定ユニットであって、前記第5のコーディングパターンは前記第6のコーディングパターンの解像度を下げることで得られたものであり、前記第5のコーディングパターンと前記第3のコーディングパターンは同じコーディング方式を利用する、確定ユニットと、
    前記第5のコーディングパターンをトレーニングされた前記オリジナルモデルの入力とし、かつ前記オリジナルモデルから出力したコーディング画像と前記第6のコーディングパターンがマッチングしない場合に、前記第1のトレーニングユニットをトリガーするための第2のトレーニングユニットと、
    をさらに含む、ことを特徴とする請求項8から11のいずれか1項に記載のコーディングパターン処理装置。
  13. 前記第1のトレーニングユニットは、さらに、前記第3のコーディングパターンにおけるピクセルのグレースケール値を前記オリジナルモデルの入力とし、前記第4のコーディングパターンを前記オリジナルモデルの予定出力とするために用いられ、
    前記オリジナルモデルは複数の畳み込み層を含み、前記複数の畳み込み層のうち1番目の畳み込み層の入力は前記第3のコーディングパターンにおけるピクセルのグレースケール値であり、前記複数の畳み込み層のうちi番目の畳み込み層の出力はi-1番目の畳み込み層の出力と、i番目の畳み込み層によりi-1番目の畳み込み層の出力に対して畳み込み操作を行った結果と、を含み、整数iは2からNまでの値をとり、Nは前記複数の畳み込み層の層数であり、前記オリジナルモデルにおけるパラメータは前記複数の畳み込み層の畳み込み操作に使用されるパラメータを含み、前記複数の畳み込み層のいずれか1つの畳み込み層によって出力される1つのクラスの特徴は当該畳み込み層における1つの畳み込みカーネルにより畳み込み操作を行うことによって得られる、
    ことを特徴とする請求項12に記載のコーディングパターン処理装置。
  14. プロセッサーと、
    前記プロセッサーに接続されるメモリと、を含む電子装置であって、
    前記メモリにはコンピュータプログラムが記憶されており、
    前記プロセッサーは、前記コンピュータプログラムを実行して、請求項1から7のいずれか1項に記載のコーディングパターン処理方法を実現するように構成される、ことを特徴とする電子装置。
  15. コンピュータに、請求項1から7のいずれか1項に記載のコーディングパターン処理方法を実行させるためのプログラム。
JP2020562183A 2018-11-14 2019-10-10 コーディングパターン処理方法及び装置、電子装置、並びにコンピュータプログラム Active JP7045483B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201811363056.8A CN110147864B (zh) 2018-11-14 2018-11-14 编码图案的处理方法和装置、存储介质、电子装置
CN201811363056.8 2018-11-14
PCT/CN2019/110282 WO2020098422A1 (zh) 2018-11-14 2019-10-10 编码图案的处理方法和装置、存储介质、电子装置

Publications (2)

Publication Number Publication Date
JP2021521558A true JP2021521558A (ja) 2021-08-26
JP7045483B2 JP7045483B2 (ja) 2022-03-31

Family

ID=67588452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020562183A Active JP7045483B2 (ja) 2018-11-14 2019-10-10 コーディングパターン処理方法及び装置、電子装置、並びにコンピュータプログラム

Country Status (5)

Country Link
US (2) US11507766B2 (ja)
EP (1) EP3882822A4 (ja)
JP (1) JP7045483B2 (ja)
CN (1) CN110147864B (ja)
WO (1) WO2020098422A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147864B (zh) 2018-11-14 2022-02-22 腾讯科技(深圳)有限公司 编码图案的处理方法和装置、存储介质、电子装置
CN110782395B (zh) * 2019-10-28 2024-02-09 西安电子科技大学 图像处理方法及装置、电子设备和计算机可读存储介质
CN113141532B (zh) * 2020-01-20 2024-04-05 海信视像科技股份有限公司 图形识别码的识别方法和显示设备
CN112069853A (zh) * 2020-09-16 2020-12-11 福州大学 基于深度学习的二维条码图像超分辨方法
CN112364675B (zh) * 2020-10-28 2022-11-01 三维码(厦门)网络科技有限公司 一种基于三维码和图像识别的离线识读方法及装置
CN112561815B (zh) * 2020-12-11 2024-03-05 浙江大华技术股份有限公司 一种图像处理方法、装置、存储介质及电子装置
CN112767247A (zh) * 2021-01-13 2021-05-07 京东方科技集团股份有限公司 图像超分辨率重建方法、模型蒸馏方法、装置及存储介质
WO2022218438A1 (en) * 2021-04-16 2022-10-20 Shanghai United Imaging Healthcare Co., Ltd. Calibration methods and systems for imaging field
CN113469937A (zh) * 2021-05-25 2021-10-01 长兴云尚科技有限公司 基于管廊视频和二维码检测的管廊异常位置定位方法及系统
CN113660486A (zh) * 2021-07-28 2021-11-16 阿里巴巴(中国)有限公司 图像编码、解码、重建、分析方法、系统及电子设备
CN113538606B (zh) * 2021-08-17 2022-07-22 数坤(北京)网络科技股份有限公司 图像关联方法、装置、计算机可读存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157244A (zh) * 2016-06-08 2016-11-23 南京航空航天大学 一种基于稀疏表示的QR Code图像超分辨重建方法
CN108022212A (zh) * 2017-11-24 2018-05-11 腾讯科技(深圳)有限公司 高分辨率图片生成方法、生成装置及存储介质
CN110852951A (zh) * 2019-11-08 2020-02-28 Oppo广东移动通信有限公司 图像处理方法、装置、终端设备及计算机可读存储介质
JP2021516827A (ja) * 2018-08-16 2021-07-08 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 識別コードの識別方法並びに、その装置、コンピュータ機器及びコンピュータプログラム

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4232042B2 (ja) * 2005-01-07 2009-03-04 セイコーエプソン株式会社 投写制御システム、プロジェクタ、プログラム、情報記憶媒体および投写制御方法
US7617949B2 (en) * 2005-12-16 2009-11-17 Kevin Brown Flow volume limiting device
JP2007281672A (ja) * 2006-04-04 2007-10-25 Fuji Xerox Co Ltd 画像読取装置および画像読取プログラム
JP4830652B2 (ja) * 2006-06-12 2011-12-07 日産自動車株式会社 画像処理装置及び画像処理方法
US7628330B2 (en) * 2006-09-29 2009-12-08 Konica Minolta Systems Laboratory, Inc. Barcode and decreased-resolution reproduction of a document image
JP4553000B2 (ja) * 2007-11-26 2010-09-29 富士ゼロックス株式会社 画像形成装置、画像形成システムおよび画像形成プログラム
JP2010041336A (ja) * 2008-08-04 2010-02-18 Toshiba Corp 画像処理装置、および画像処理方法
US20100053166A1 (en) * 2008-08-29 2010-03-04 Kabushiki Kaisha Toshiba Information processing apparatus, and super-resolution achievement method and program
CN101901329A (zh) * 2009-05-25 2010-12-01 汉王科技股份有限公司 一种低分辨率条形码的识别方法和设备
JP5736652B2 (ja) * 2010-03-09 2015-06-17 セイコーエプソン株式会社 画像表示装置および画像表示方法
JP5679791B2 (ja) * 2010-12-14 2015-03-04 キヤノン株式会社 画像投影装置及びその制御方法、プログラム
US9667823B2 (en) * 2011-05-12 2017-05-30 Moon J. Kim Time-varying barcode in an active display
KR101860569B1 (ko) * 2011-09-08 2018-07-03 삼성전자주식회사 문자 및 바코드를 동시에 인식하는 문자 및 바코드 인식 장치 및 그 제어 방법
US8551677B2 (en) * 2011-09-23 2013-10-08 Globalfoundries Inc. Lithographic CD correction by second exposure
US8574795B2 (en) * 2011-09-23 2013-11-05 Globalfoundries Inc. Lithographic CD correction by second exposure
US20130153662A1 (en) * 2011-12-19 2013-06-20 MindTree Limited Barcode Photo-image Processing System
US8915440B2 (en) * 2011-12-23 2014-12-23 Konica Minolta Laboratory U.S.A., Inc. Four dimensional (4D) color barcode for high capacity data encoding and decoding
CN102693409B (zh) * 2012-05-18 2014-04-09 四川大学 一种快速的图像中二维码码制类型识别方法
CN103516952B (zh) * 2012-06-21 2016-12-28 精工爱普生株式会社 图像处理装置、图像处理系统以及打印方法
US10057498B1 (en) * 2013-03-15 2018-08-21 Cognex Corporation Light field vision system camera and methods for using the same
US10453046B2 (en) * 2014-06-13 2019-10-22 Conduent Business Services, Llc Store shelf imaging system
US9619665B2 (en) * 2014-07-22 2017-04-11 Cheng-Han KO Method and system for adding dynamic labels to a file and encrypting the file
CN105205782B (zh) * 2015-09-06 2019-08-16 京东方科技集团股份有限公司 超解像方法和系统、服务器、用户设备及其方法
WO2017075768A1 (zh) * 2015-11-04 2017-05-11 北京大学深圳研究生院 一种基于字典匹配的图像超分辨率重建方法及装置
CN106790762B (zh) 2017-01-11 2022-05-24 腾讯科技(深圳)有限公司 域名解析方法和装置
CN108629402A (zh) * 2017-03-20 2018-10-09 上海荆虹电子科技有限公司 用于图像处理的方法和装置
US10666929B2 (en) * 2017-07-06 2020-05-26 Matterport, Inc. Hardware system for inverse graphics capture
CN108259997B (zh) * 2018-04-02 2019-08-23 腾讯科技(深圳)有限公司 图像相关处理方法及装置、智能终端、服务器、存储介质
CN108629743B (zh) * 2018-04-04 2022-03-25 腾讯科技(深圳)有限公司 图像的处理方法、装置、存储介质和电子装置
CN110147864B (zh) * 2018-11-14 2022-02-22 腾讯科技(深圳)有限公司 编码图案的处理方法和装置、存储介质、电子装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157244A (zh) * 2016-06-08 2016-11-23 南京航空航天大学 一种基于稀疏表示的QR Code图像超分辨重建方法
CN108022212A (zh) * 2017-11-24 2018-05-11 腾讯科技(深圳)有限公司 高分辨率图片生成方法、生成装置及存储介质
JP2021516827A (ja) * 2018-08-16 2021-07-08 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 識別コードの識別方法並びに、その装置、コンピュータ機器及びコンピュータプログラム
CN110852951A (zh) * 2019-11-08 2020-02-28 Oppo广东移动通信有限公司 图像处理方法、装置、终端设备及计算机可读存储介质

Also Published As

Publication number Publication date
US20210042488A1 (en) 2021-02-11
US11790198B2 (en) 2023-10-17
CN110147864B (zh) 2022-02-22
US11507766B2 (en) 2022-11-22
EP3882822A4 (en) 2022-01-05
CN110147864A (zh) 2019-08-20
US20230048075A1 (en) 2023-02-16
WO2020098422A1 (zh) 2020-05-22
JP7045483B2 (ja) 2022-03-31
EP3882822A1 (en) 2021-09-22

Similar Documents

Publication Publication Date Title
JP7045483B2 (ja) コーディングパターン処理方法及び装置、電子装置、並びにコンピュータプログラム
Wang et al. Real-esrgan: Training real-world blind super-resolution with pure synthetic data
US20220222786A1 (en) Image processing method, smart device, and computer readable storage medium
WO2021048607A1 (en) Motion deblurring using neural network architectures
CN110781923B (zh) 特征提取方法及装置
JP2020532916A (ja) 画像処理方法、端末及び記憶媒体
CN110569844B (zh) 基于深度学习的船舶识别方法及系统
CN111353956B (zh) 图像修复方法、装置、计算机设备及存储介质
CN109993824B (zh) 图像处理方法、智能终端及具有存储功能的装置
Guan et al. Srdgan: learning the noise prior for super resolution with dual generative adversarial networks
CN110223245B (zh) 基于深度神经网络的模糊图片清晰化处理方法及系统
US20220067888A1 (en) Image processing method and apparatus, storage medium, and electronic device
CN109598270B (zh) 扭曲文字的识别方法及装置、存储介质及处理器
KR102493492B1 (ko) 초해상도 모델의 메타 러닝을 통한 빠른 적응 방법 및 장치
CN116189265A (zh) 基于轻量化语义Transformer模型的素描人脸识别方法、装置及设备
CN115187456A (zh) 基于图像强化处理的文本识别方法、装置、设备及介质
US11887277B2 (en) Removing compression artifacts from digital images and videos utilizing generative machine-learning models
CN111435533A (zh) 图像分割方法、装置、设备及计算机可读存储介质
CN115909378A (zh) 单据文本检测模型的训练方法及单据文本检测方法
CN116152391A (zh) 用于高分辨率人脸图像的多样化编辑方法及系统
KR20230086999A (ko) 가상 인물 콘텐츠 생성 프로그램을 기록한 기록매체
KR20230086998A (ko) 얼굴 세그먼트 영역에 노이즈를 부가하여 가상 인물 콘텐츠를 생성하는 컴퓨터 프로그램
KR20230086996A (ko) 노이즈 추가 프로세스를 수행하는 컴퓨터 프로그램
CN113744158A (zh) 图像生成方法、装置、电子设备和存储介质
CN114299105A (zh) 图像处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220318

R150 Certificate of patent or registration of utility model

Ref document number: 7045483

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150