JP2020508531A - 画像品質の評価方法及び画像品質の評価システム - Google Patents

画像品質の評価方法及び画像品質の評価システム Download PDF

Info

Publication number
JP2020508531A
JP2020508531A JP2019546794A JP2019546794A JP2020508531A JP 2020508531 A JP2020508531 A JP 2020508531A JP 2019546794 A JP2019546794 A JP 2019546794A JP 2019546794 A JP2019546794 A JP 2019546794A JP 2020508531 A JP2020508531 A JP 2020508531A
Authority
JP
Japan
Prior art keywords
layer
image quality
quality evaluation
image
network architecture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019546794A
Other languages
English (en)
Other versions
JP6866495B2 (ja
Inventor
宏宇 李
宏宇 李
帆 朱
帆 朱
雪峰 李
雪峰 李
Original Assignee
ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド
ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド, ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド filed Critical ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド
Publication of JP2020508531A publication Critical patent/JP2020508531A/ja
Application granted granted Critical
Publication of JP6866495B2 publication Critical patent/JP6866495B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

画像品質の評価方法及び画像品質の評価システムであって、当該画像品質の評価方法は、画像サンプルを用いて画像品質評価モデルを生成するステップと、画像品質評価モデルによって評価対象となる画像に対して評価作業を行うステップと、を含む。本発明に係る画像品質の評価方法は、画像サンプルを用いて画像品質評価モデルを生成し、次に生成した画像品質評価モデルによって評価対象となる画像に対して評価作業を行うというような方式によって、評価対象となる画像に対する品質評価作業を実現することができる。従来の画像品質の評価方法と比較して、本発明の実施例に係る画像品質の評価方法は、計算量が少なく、評価プロセスが簡単で早くて便利であり、評価効率を向上させることができる。さらに、本発明に係る画像品質の評価方法は、画像サンプルに基づいて生成される画像品質評価モデルによって評価作業を実現するため、評価結果の精度が高い。

Description

本願は、2017年9月8日に出願された中国特許出願「NO.201710804804.0」の優先権を主張し、そのすべての内容を参照より本願に組み込む。
本発明は、画像処理の技術分野に関し、特に画像品質の評価方法及び画像品質の評価システムに関する。
光学的文字認識(Optical Character Recognition,OCR)技術の応用が広がるに連れて、OCR技術によって採集されるテキスト画像の品質が益々注目されるようになってきた。また、テキスト画像に対する品質評価方法も、学術界と産業界においてより広く興味が持たれている。
従来の画像品質の評価方法は、主に2つの大きなカテゴリーに分類することができる。1つは参照画像有りの品質評価であり、他の1つは参照画像無しの品質評価である。なお、参照画像有りの品質評価とは、劣化した画像及び元の画像に対して特徴(例えば、勾配、コントラストなど)の比較を行って、劣化した画像に対する品質評価結果を得ることである。参照画像無しの品質評価とは、劣化した画像の一部の特徴(例えば、エッジの強度、ぼかしの程度など)を直接抽出し、さらに抽出した特徴に基づいて劣化した画像の品質評価結果を導出することである。従来の画像品質の評価方法には、アルゴリズムが複雑であり、計算量が大きいという欠点が存在する。さらに、ほとんどの既存の画像品質の評価方法では、評価対象となる画像に対して予め処理を行う必要があり、評価対象となる画像が処理されなければ評価作業に入ることができず、評価プロセスが複雑である。また、従来の画像品質の評価方法は、ほとんど自然場面の画像を対象としたものであるため、テキスト画像の品質評価には適していない。
以上に鑑みて、本発明の実施例は、画像品質の評価方法及び画像品質の評価システムを提供することによって、従来の画像品質の評価方法、特にテキスト画像に対する評価作業において課題となっている、評価の精度が低く、評価効率が悪いという問題を解決する。
第1の態様によると、本発明の実施例は画像品質の評価方法を提供する。当該画像品質の評価方法は、画像サンプルを用いて画像品質評価モデルを生成するステップと、画像品質評価モデルによって評価対象となる画像に対して評価作業を行うステップと、を含む。
本発明の一実施例において、画像サンプルを用いて画像品質評価モデルを生成するステップは、画像サンプルの基準品質指標値をラベリングするステップと、画像サンプルに基づいてニューラルネットワークアーキテクチャを生成するステップと、画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成するステップと、を含む。
本発明の一実施例において、画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成するステップは、トレーニングパラメータによって画像サンプルをニューラルネットワークアーキテクチャに入力するステップと、ニューラルネットワークアーキテクチャにおける損失層の出力結果と基準品質指標値との間の誤差データを算出するステップと、誤差データによってニューラルネットワークアーキテクチャにおける階層パラメータを更新し、さらに更新後のニューラルネットワークアーキテクチャに基づいて新たに誤差データを反復計算するステップと、反復計算により算出される誤差データが予め設定された誤差範囲に入ると、ニューラルネットワークアーキテクチャに基づいて画像品質評価モデルを生成するステップと、を含む。
本発明の一実施例において、トレーニングパラメータは、反復の総回数と、毎回の反復するサンプル数と、テスト間隔と、学習率と、初期のニューラルネットワークアーキテクチャにおける各階層の重みと、バイアスと、バイアス及び初期のニューラルネットワークアーキテクチャにおける各階層の重みの学習率とのうちの少なくとも1つを含む。
本発明の一実施例において、ニューラルネットワークアーキテクチャは、畳み込み層と、活性化関数層と、損失層と、を含む。
本発明の一実施例において、活性化関数層は、正規化線形ユニット層及びシグモイド曲線層を含む。
本発明の一実施例において、ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、シグモイド曲線層、損失層となる。
本発明の一実施例において、ニューラルネットワークアーキテクチャは、プーリング層と、ドロップアウト層と、SPP層と、を更に含む。
本発明の一実施例において、ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、ドロップアウト層、畳み込み層、SPP層、シグモイド曲線層、損失層となる。
本発明の一実施例において、畳み込み層の階層パラメータは、畳み込み核の数と、畳み込み核の大きさと、畳み込みウィンドウのスライド距離と、パディングエッジの画素値と、を含む。
本発明の一実施例において、プーリング層の階層パラメータは、サンプリング規則と、サンプリングウィンドウの大きさと、サンプリングウィンドウのスライド距離と、を含む。
本発明の一実施例において、ドロップアウト層の階層パラメータは、ドロップアウト率を含む。
本発明の一実施例において、SPP層の階層パラメータは、サンプリング規則と、ピラミッドの層数と、を含む。
本発明の一実施例において、画像はテキスト画像である。
第2の態様によると、本発明の実施例は画像品質の評価システムを更に提供する。当該画像品質の評価システムは、画像サンプルを用いて画像品質評価モデルを生成する画像品質評価モデル生成モジュールと、画像品質評価モデルによって評価対象となる画像に対して評価作業を行う評価モジュールと、を備える。
本発明の一実施例において、画像品質評価モデル生成モジュールは、画像サンプルの基準品質指標値をラベリングするラベリングユニットと、画像サンプルに基づいてニューラルネットワークアーキテクチャを生成するニューラルネットワークアーキテクチャ生成ユニットと、画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成する反復トレーニングユニットと、を備える。
本発明の一実施例において、反復トレーニングユニットはさらに、トレーニングパラメータによって画像サンプルをニューラルネットワークアーキテクチャに入力することと、ニューラルネットワークアーキテクチャにおける損失層の出力結果と基準品質指標値との間の誤差データを算出することと、誤差データによってニューラルネットワークアーキテクチャにおける階層パラメータを更新し、更新後のニューラルネットワークアーキテクチャに基づいて新たに誤差データを反復計算することと、反復計算により算出される誤差データが予め設定された誤差範囲に入る場合にニューラルネットワークアーキテクチャに基づいて画像品質評価モデルを生成することと、を行う。
本発明の一実施例において、トレーニングパラメータは、反復の総回数と、毎回の反復するサンプル数と、テスト間隔と、学習率と、初期のニューラルネットワークアーキテクチャにおける各階層の重みと、バイアスと、バイアス及び初期のニューラルネットワークアーキテクチャにおける各階層の重みの学習率とのうちの少なくとも1つを含む。
本発明の一実施例において、ニューラルネットワークアーキテクチャは、畳み込み層と、活性化関数層と、損失層と、を含む。
本発明の一実施例において、活性化関数層は、正規化線形ユニット層及びシグモイド曲線層を含む。
本発明の一実施例において、ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、シグモイド曲線層、損失層となる。
本発明の一実施例において、ニューラルネットワークアーキテクチャは、プーリング層と、ドロップアウト層と、SPP層と、を更に含む。
本発明の一実施例において、ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、ドロップアウト層、畳み込み層、SPP層、シグモイド曲線層、損失層となる。
本発明の一実施例において、畳み込み層の階層パラメータは、畳み込み核の数と、畳み込み核の大きさと、畳み込みウィンドウのスライド距離と、パディングエッジの画素値と、を含む。
本発明の一実施例において、プーリング層の階層パラメータは、サンプリング規則と、サンプリングウィンドウの大きさと、サンプリングウィンドウのスライド距離と、を含む。
本発明の一実施例において、ドロップアウト層の階層パラメータは、ドロップアウト率を含む。
本発明の一実施例において、SPP層の階層パラメータは、サンプリング規則と、ピラミッドの層数と、を含む。
本発明の一実施例において、画像はテキスト画像である。
第3の態様によると、本発明の実施例はコンピュータ読取可能な記憶媒体を更に提供する。当該コンピュータ読取可能な記憶媒体には画像品質の評価プログラムが記憶されており、当該画像品質の評価プログラムは、プロセッサにより実行されると、上述のいずれかの実施例に係る画像品質の評価方法の作業を実現する。
本発明の実施例により提供される画像品質の評価方法は、画像サンプルを用いて画像品質評価モデルを生成し、次に生成した画像品質評価モデルによって評価対象となる画像に対して評価作業を行うというような方式によって、評価対象となる画像に対する品質評価作業を実現する。従来の画像品質の評価方法と比較して、本発明の実施例に係る画像品質の評価方法は、計算量が少なく、評価プロセスが簡単で早くて便利であり、ひいては評価効率を向上させることができる。また、本発明の実施例に係る画像品質の評価方法は、画像サンプルから生成された画像品質評価モデルによって評価作業を実現するため、評価結果の精度が高い。特に画像サンプル及び評価対象となる画像の画像タイプが両方ともテキスト画像である場合、本発明の実施例に係る画像品質の評価方法はテキスト画像に対して、精度が高く且つ効率が良い評価作業を実現することができる。
また、本発明の実施例により提供される画像品質の評価システムも同様に、上述の利点と有益な効果を有する。
本発明の実施例に係る技術案をより明確に説明するために、以下、実施例の記述において使用する必要のある図面について簡単に説明する。明らかに、ここで説明する図面は本発明の一部の実施例に過ぎず、当業者であれば、創造的な労働を行わなくても、これらの図面に基づいて別の図面を取得することができる。
本発明の一実施例に係る画像品質の評価方法のフローチャートである。 本発明の一実施例に係る画像品質の評価方法における画像サンプルを用いて画像品質評価モデルを生成するステップのフローチャートである。 本発明の他の実施例に係るニューラルネットワークアーキテクチャの階層構造の模式図である。 本発明の別の実施例に係るニューラルネットワークアーキテクチャの階層構造の模式図である。 本発明のさらにもう一つの実施例に係る画像品質の評価方法における画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成するステップのフローチャートである。 本発明のさらにもう一つの実施例に係る画像品質評価モデルを反復トレーニングする方法のフローチャートである。 本発明のさらにもう一つの実施例に係るトレーニングに用いられるテキスト画像サンプルの模式図である。 本発明のさらにもう一つの実施例に係るテキスト画像品質評価モデルのテキスト品質ネットワークアーキテクチャの構成模式図である。 本発明のさらにもう一つの実施例に係るテキスト品質ネットワークアーキテクチャ中の各階層により出力されるM×Nのグレースケール図のサイズ変化模式図である。 本発明のさらにもう一つの実施例に係るトレーニングされたテキスト画像品質評価モデルによってテキスト画像品質評価を行うフローチャートである。 本発明のさらにもう一つの実施例に係る評価対象となる画像の模式図である。 本発明のさらにもう一つの実施例に係る評価対象となる画像の模式図である。 本発明の一実施例に係る画像品質の評価システムの構成模式図である。 本発明の他の実施例に係る画像品質の評価システムの画像品質評価モデル生成モジュールの構成模式図である。 本発明の別の実施例に係るテキスト画像品質評価デバイスの構成模式図である。 本発明の一実施例に係る電子デバイスの構成模式図である。
本発明の目的、技術案及び利点をより明確にするために、以下、本発明の実施例における図面を参照して本発明の実施例における技術案に対して明確且つ完全な説明を行う。明らかに、ここで説明する実施例は本発明の一部の実施例に過ぎず、すべての実施例ではない。本発明の実施例に基づいて、当業者が創造的な労働をせずに取得し得る他の実施例は、すべて本発明の保護範囲に属する。
図1は、本発明の一実施例に係る画像品質の評価方法のフローチャートである。図1に示すように、本発明の実施例に係る画像品質の評価方法は、以下の内容を含む。
10:画像サンプルを用いて画像品質評価モデルを生成する。
画像品質評価モデルは、画像サンプルに基づくトレーニングによって生成される画像品質評価モデルである。つまり、画像品質評価モデルにおける階層構造や階層パラメータなどの具体的な情報は、すべて画像サンプルの具体的状況に基づいてトレーニングされて生成される。
なお、本発明の実施例に係る画像品質の評価方法の適応性と汎用性をより向上させるために、画像サンプルの画像タイプは、自然場面を含む場面画像であってもよく、テキスト情報を含むテキスト画像であってもよく、本発明の実施例ではそれについて統一した限定をしない。
好ましく、評価対象となる画像の画像タイプは、画像サンプルの画像タイプに一致すべきである。例えば、画像サンプルの画像タイプがテキスト画像である場合、評価対象となる画像の画像タイプもテキスト画像であるべきである。なお、画像品質評価モデルは画像サンプルに基づいて生成されるため、評価対象となる画像の画像タイプが画像サンプルの画像タイプと一致する場合、画像品質評価モデルの評価の精度を十分に向上させることができる。
本発明の一実施例において、画像サンプル及び評価対象となる画像の画像タイプは両方ともテキスト画像である。
20:画像品質評価モデルによって評価対象となる画像に対して評価作業を行う。
実際に応用する場合、最初に画像サンプルを選定し、選定した画像サンプルを用いて画像品質評価モデルを生成する。次に、生成した画像品質評価モデルによって、評価対象となる画像に対して評価作業を行って、評価対象となる画像の評価データを生成する。
本発明の実施例に係る画像品質の評価方法は、画像サンプルを用いて画像品質評価モデルを生成し、次に生成した画像品質評価モデルによって評価対象となる画像に対して評価作業を行うというような方式によって、評価対象となる画像に対する品質評価作業を実現することができる。従来の画像品質の評価方法と比較して、本発明の実施例に係る画像品質の評価方法は、計算量が少なく、評価プロセスが簡単で早くて便利であり、ひいては評価効率を向上させることができる。また、本発明の実施例に係る画像品質の評価方法は、画像サンプルから生成される画像品質評価モデルによって評価作業を実現するため、精度が高い評価結果を有する。特に画像サンプル及び評価対象となる画像の画像タイプが両方ともテキスト画像である場合、本発明の実施例に係る画像品質の評価方法はテキスト画像に対して、精度が高く且つ効率が良い評価作業を実現することができる。
図2は、本発明の一実施例に係る画像品質の評価方法における画像サンプルを用いて画像品質評価モデルを生成するステップのフローチャートである。図2に示すように、本発明の実施例に係る画像品質の評価方法において、画像サンプルを用いて画像品質評価モデルを生成するステップは、以下の内容を含む。
11:画像サンプルの基準品質指標値をラベリングする。
なお、画像サンプルの基準品質指標値のラベリングは、コンピュータプログラムなどによって実現される自動ラベリングであってもよく、人工による手動ラベリングであってもよく、さらに他のラベリング方式であってもよく、本発明の実施例ではそれについて統一した限定をしない。
12:画像サンプルに基づいてニューラルネットワークアーキテクチャを生成する。
なお、ニューラルネットワークアーキテクチャは、後続の機械学習をサポートするネットワークアーキテクチャであり、入力層、出力層及び中間層を含む。
好ましく、ニューラルネットワークアーキテクチャは、畳み込みニューラルネットワークアーキテクチャである。
好ましく、ニューラルネットワークアーキテクチャは、畳み込み(Convolution)層、活性化関数(Activation Function)層及び損失(Loss)層を含むネットワークアーキテクチャである。ここで、畳み込み層は画像サンプルに対して特徴抽出作業を行い、活性化関数層は非線形因子の導入を行い、損失層はトレーニングプロセスにおいて、取得した評価結果と基準品質指標値との間の差によって反復トレーニングを続けるか否かを決定する。
好ましく、活性化関数層は、正規化線形ユニット(Rectified Linear Unit,ReLU)層及びシグモイド曲線(Sigmoid)層を含む。
より好ましく、ニューラルネットワークアーキテクチャは、プーリング(Pooling)層と、ドロップアウト(Dropout)層と、SPP(Spatial Pyramid Pooling,SPP)層と、を更に含む。ここで、プーリング層は計算複雑度を低減させて過学習を改善するために特徴の圧縮を行い、ドロップアウト層は過学習を改善し、SPP層は抽出された特徴を固定のサイズを有する特徴ベクトルに転換する。
13:画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成する。
好ましく、畳み込み層の階層パラメータは、畳み込み核の数、畳み込み核の大きさ、畳み込みウィンドウのスライド距離及びパディングエッジの画素値を含む。
好ましく、プーリング層の階層パラメータは、サンプリング規則、サンプリングウィンドウの大きさ及びサンプリングウィンドウのスライド距離を含む。
好ましく、ドロップアウト層の階層パラメータはドロップアウト率を含む。
好ましく、SPP層の階層パラメータは、サンプリング規則及びピラミッドの層数を含む。
実際に応用する場合、最初に画像サンプルを選定し、画像サンプルの基準品質指標値をラベリングする。次に、選定した画像サンプルによってニューラルネットワークアーキテクチャを生成し、画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成する。最後に、生成した画像品質評価モデルを用いて評価対象となる画像に対して評価作業を行って,評価対象となる画像の評価データを生成する。
本発明の実施例に係る画像品質の評価方法は、画像サンプルによって基礎となるニューラルネットワークアーキテクチャを構築し、さらに画像サンプルによってニューラルネットワークアーキテクチャに対してディープラーニングを行って、画像品質評価モデルを生成するというような方式によって、画像品質評価モデルの評価の精度をより一層向上させることができる。また、ニューラルネットワークアーキテクチャに正規化線形ユニット層、シグモイド曲線層、プーリング層、ドロップアウト層及びSPP層などの階層構造が含まれる場合には、生成する画像品質評価モデルの評価の精度と評価効率をより一層向上させることができる。
図3は、本発明の他の実施例に係るニューラルネットワークアーキテクチャの階層構造の模式図である。図3に示すように、本発明の実施例に係るニューラルネットワークアーキテクチャにおいて、階層順序は、順に畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、シグモイド曲線層、損失層となる。
実際に応用する場合、データの伝送順序は、順に畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、シグモイド曲線層、損失層となる。つまり、データは、最初の層である畳み込み層から入力され、最終的に損失層を介して出力される。
図4は、本発明の別の実施例に係るニューラルネットワークアーキテクチャの階層構造の模式図である。図4に示すように、本発明の実施例に係るニューラルネットワークアーキテクチャにおいて、階層順序は、順に畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、ドロップアウト層、畳み込み層、SPP層、シグモイド曲線層、損失層となる。
実際に応用する場合、データ伝送順序は、順に畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、ドロップアウト層、畳み込み層、SPP層、シグモイド曲線層、損失層となる。つまり、データは、最初の層である畳み込み層から入力され、最終的に損失層を介して出力される。
図5は、本発明のさらにもう一つの実施例に係る画像品質の評価方法における画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成するステップのフローチャートである。図5に示すように、本発明の実施例に係る画像品質の評価方法において、画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成するステップは、以下の内容を含む。
131:トレーニングパラメータによって画像サンプルをニューラルネットワークアーキテクチャに入力する。
好ましく、トレーニングパラメータは、反復の総回数と、毎回の反復するサンプル数と、テスト間隔と、学習率と、初期のニューラルネットワークアーキテクチャにおける各階層の重みと、バイアスと、バイアス及び初期のニューラルネットワークアーキテクチャにおける各階層の重みの学習率と、のうちの少なくとも1つを含む。
132:ニューラルネットワークアーキテクチャにおける損失層の出力結果と基準品質指標値との間の誤差データを算出する。
133:誤差データによってニューラルネットワークアーキテクチャにおける階層パラメータを更新し、更新後のニューラルネットワークアーキテクチャに基づいて新たに誤差データを反復計算する。
134:反復計算により算出される誤差データが予め設定された誤差範囲に入ると、ニューラルネットワークアーキテクチャに基づいて画像品質評価モデルを生成する。
なお、本発明の実施例に係る画像品質の評価方法の適応性と汎用性をより向上させるために、予め設定される誤差範囲は実際の状況によって別途設定してもよく、本発明の実施例ではそれについて統一した限定をしない。
実際に応用する場合、最初に画像サンプルを選定し、画像サンプルの基準品質指標値をラベリングするとともに、選定した画像サンプルによってニューラルネットワークアーキテクチャを生成する。次にトレーニングパラメータを選定し、生成したニューラルネットワークアーキテクチャへトレーニングパラメータによって画像サンプルを入力し、ニューラルネットワークアーキテクチャにおける損失層の出力結果と基準品質指標値との間の誤差データを算出する。さらに、誤差データによってニューラルネットワークアーキテクチャにおける階層パラメータを更新し、更新後のニューラルネットワークアーキテクチャに基づいて新たに誤差データを反復計算する。反復計算により算出される誤差データが予め設定された誤差範囲に入った場合、当該誤差データに対応するニューラルネットワークアーキテクチャが画像品質評価モデルとなる。最後に、生成した画像品質評価モデルを用いて、評価対象となる画像に対して評価作業を行って、評価対象となる画像の評価データを生成する。
図6は、本発明のさらにもう一つの実施例に係る画像品質評価モデルを反復トレーニングする方法のフローチャートである。本発明の実施例において、画像サンプル及び評価対象となる画像の画像タイプは両方ともテキスト画像である。
本発明の実施例においては、テキスト画像品質評価モデルによってテキスト画像(すなわち評価対象となる画像)の品質に対して評価を行う前に、当該テキスト画像品質評価モデルを予めトレーニングする必要がある。
図6を参照すると、当該テキスト画像品質評価モデルをトレーニングするプロセスは、具体的に以下の内容を含む。
101:トレーニングに用いられるテキスト画像サンプルを取得し、各テキスト画像サンプルに対して品質指標値をラベリングする。
なお、101に記載の品質指標値は、上述の実施例において言及した基準品質指標値である。
具体的に、トレーニングに用いられる当該テキスト画像サンプルは、公開されたテキスト画像品質データベースから取得したテキスト画像サンプルを含み、さらに合成したテキスト画像サンプルも含む。当該テキスト画像サンプルは、マルチスペクトル画像、一般的なカラー画像又はグレースケール画像であってもよい。テキスト画像サンプル中のテキストは、中国語、英語及び他の音声文字のテキスト画像を含む。
各テキスト画像サンプルに対する品質指標値のラベリングには、コンピュータによる自動ラベリングを採用することができ、例えば、OCRにより認識されたテキスト画像の品質パラメータをテキスト画像の品質指標値とする。又は人工による手動ラベリングを採用し、肉眼でテキスト画像を観察してテキスト画像の品質指標値をラベリングすることもできる。さらに、他の方式を採用してテキスト画像サンプルに対して品質指標値のラベリングを行ってもよい。本発明の実施例では、採用される具体的方式について限定をしない。
ここで、テキスト画像の品質指標値は、浮動小数点数で表すことができ、浮動小数点数が大きければ大きいほど、テキスト画像の品質が良い。各テキスト画像サンプルに対して品質指標値のラベリングを行った後、さらにラベリングされたすべてのテキスト画像の品質指標値を浮動小数点数の0−0.1の範囲内に入るように転換する。
一例として、図7は、本発明のさらにもう一つの実施例に係るトレーニングに用いられるテキスト画像サンプルの模式図である。図7に示すように、テキスト画像品質評価モデルのトレーニングに用いられるテキスト画像サンプルとして、図7における4つのテキスト画像a、b、c、dを用いることができる。ここで、当該4つのテキスト画像サンプルa、b、c、dに対してラベリングする品質指標値はそれぞれ、0.91、0.8658、0.2733、0.9067である。
102:テキスト画像品質評価モデルのテキスト品質ネットワークを設置する。
なお、当該テキスト画像品質評価モデルは、ディープラーニングの畳み込みニューラルネットワークに基づいてトレーニングされるものであるため、ニューラルネットワークアーキテクチャ、すなわちテキスト品質ネットワークを設置する必要がある。
まず、テキスト品質ネットワークアーキテクチャの基礎階層構造を構築する。具体的に、テキスト品質ネットワークアーキテクチャは、5つのConvolution層と、4つのReLU層と、3つのPooling層と、1つのDropout層と、1つのSPP層と、1つのSigmoid層と、1つのLoss層とを含み、且つテキスト品質ネットワークアーキテクチャの階層分布順序がConvolution/ReLU/Pooling/Convolution/ReLU/Pooling/Convolution/ReLU/Pooling/Convolution/ReLU/Dropout/Convolution/SPP/Sigmoid/Lossとなる。
一例として、図8は、本発明のさらにもう一つの実施例に係るテキスト画像品質評価モデルのテキスト品質ネットワークアーキテクチャの構成模式図である。具体的に、図8は、テキスト品質ネットワークアーキテクチャにおける階層分布の構成模式図であり、ここで、CONVはConvolutionであり、POOLはPoolingであり、DROPはDropoutである。
次に、テキスト品質ネットワークアーキテクチャにおけるConvolution層、Pooling層、Dropout層及びSPP層の階層パラメータを設定する。
なお、設置したConvolution層の階層パラメータは、畳み込み核の数、畳み込み核の大きさ、畳み込みウィンドウのスライド距離及びパディングエッジの画素値を含む。Pooling層の階層パラメータは、サンプリング規則、サンプリングウィンドウの大きさ及びサンプリングウィンドウのスライド距離を含む。Dropout層の階層パラメータは、ドロップアウト率を含む。SPP層の階層パラメータは、サンプリング規則及びピラミッドの層数を含む。
好ましく、Convolution層、Pooling層、Dropout層及びSPP層の階層パラメータを以下のように設定する。第1のConvolution層は、畳み込み核の数が96であり、畳み込み核の大きさが3×3であり、畳み込みウィンドウのスライド距離が1であり、パディングエッジの画素値が0である。第1のPooling層は、サンプリング規則が最大値サンプリングであり、サンプリングウィンドウの大きさが3であり、サンプリングウィンドウのスライド距離が2である。第2のConvolution層は、畳み込み核の数が96であり、畳み込み核の大きさが3×3であり、畳み込みウィンドウのスライド距離が1であり、パディングエッジの画素値が2である。第2のPooling層は、サンプリング規則が最大値サンプリングであり、サンプリングウィンドウの大きさが3×3であり、サンプリングウィンドウのスライド距離が2である。第3のConvolution層は、畳み込み核の数が128であり、畳み込み核の大きさが3×3であり、畳み込みウィンドウのスライド距離が1であり、パディングエッジの画素値が1である。第3層のPooling層は、サンプリング規則が最大値サンプリングであり、サンプリングウィンドウの大きさが3であり、サンプリングウィンドウのスライド距離が2である。第4のConvolution層は、畳み込み核の数が192であり、畳み込み核の大きさが1であり、畳み込みウィンドウのスライド距離が1であり、パディングエッジの画素値が0である。Dropout層のドロップアウト率は0.35である。第5のConvolution層は、畳み込み核の数が1であり、畳み込み核の大きさが1であり、畳み込みウィンドウのスライド距離が1であり、パディングエッジ画素が0である。SPP層は、サンプリング規則が最大値サンプリングであり、ピラミッドの層数が1である。
なお、ここで示したConvolution層、Pooling層、Dropout層及びSPP層の階層パラメータの設置値は好ましい値に過ぎず、実際にトレーニングを行うときには、必要に応じて調整してもよい。本発明の実施例では、各階層の具体的な階層パラメータについて限定をしない。
103:テキスト画像サンプル及びラベリングの品質指標値に基づいて、テキスト品質ネットワークによって初期のテキスト画像品質評価モデルのパラメータに対して反復トレーニングを行って、テキスト画像品質評価モデルを取得する。
具体的に、103において言及したテキスト画像品質評価モデルを取得するステップは、以下の内容を含む。
a、トレーニングパラメータを決定する。
具体的に、トレーニングパラメータは、反復の総回数と、毎回の反復するサンプル数と、テスト間隔と、学習率と、初期のネットワーク各層の重みと、バイアスと、バイアス及び初期のネットワーク各層の重みの学習率と、のうちの少なくとも1つを含む。
b、トレーニングパラメータによって、テキスト画像サンプルを最初のテキスト画像品質評価モデルに入力する。
c、テキスト画像サンプルに対してテキスト品質ネットワークのConvolution層、ReLU層、Pooling層、Dropout層、SPP層、Sigmoid層により行われた処理の出力結果を取得する。
具体的に、トレーニングに用いられるテキスト画像サンプルのデータは、順にConvolution層、ReLU層、Pooling層における作業を受け、さらにDropout層、SPP層及びSigmoid層におけるネットワーク演算が行われ、Sigmoid層において最終の出力結果を取得する。
d、テキスト品質ネットワークのLoss層において、出力結果とラベリングの品質指標値との間の誤差を算出し、さらに誤差を逆方向にテキスト品質ネットワークアーキテクチャの各層に伝送して、各層の階層パラメータを更新する。誤差が予め設定された範囲に入るまでに反復計算を続ける。
具体的に、各層の階層パラメータを更新することは、初期のネットワーク各層の重みを更新することを含む。
図9は、本発明のさらにもう一つの実施例に係るテキスト品質ネットワークアーキテクチャにおける各階層により出力されるM×Nのグレースケール図のサイズ変化模式図である。さらに、当該トレーニングプロセスを説明するために、サイズがM×Nとなるグレースケール画像を例として挙げる。当該M×Nのグレースケール画像をトレーニング中のテキスト画像品質評価モデルに入力すると、当該テキスト画像品質評価モデルのテキスト品質ネットワークアーキテクチャの各層において出力されるサイズ変化は図9に示すようになり、具体的には以下の通りである。
第1層のConvolution層により返される構成のサイズは1×96×M×Nである。
第1層のPooling層により返される構成のサイズは1×96×M/2×N/2である。
第2層のConvolution層により返される構成のサイズは1×96×M/2×N/2である。
第2層のPooling層により返される構成のサイズは1×96×M/4×N/4である。
第3層のConvolution層により返される構成のサイズは1×128×M/4×N/4である。
第3層のPooling層により返される構成のサイズは1×128×M/8×N/8である。
第4層のConvolution層により返される構成のサイズは1×192×M/8×N/8である。
第5層のConvolution層により返される構成のサイズは1×1×M/8×N/8である。
SPP層により返される構成のサイズは1×1×1×1である。
Sigmoid層により返される構成のサイズは1×1×1×1である。
さらに、Loss層において、Sigmoid層の出力結果と当該テキスト画像サンプルラベリングの品質指標値とに対して誤差演算を行い、以上の各層に誤差を返し、各層のネットワークパラメータを更新する。Loss層の誤差が予め設定された範囲に入るまでに、大量のテキスト画像サンプルを用いて当該プロセスを反復する。
e、最終的に生成されるテキスト画像品質評価モデルを取得する。
図10は、本発明のさらにもう一つの実施例に係るトレーニングされたテキスト画像品質評価モデルによってテキスト画像品質評価を行うフローチャートである。図10に示すように、トレーニングされて生成されたテキスト画像品質評価モデルによってテキスト画像品質評価を行うプロセスは、具体的に以下の内容を含む。
501:評価対象となるテキスト画像を取得する。
具体的に、当該評価対象となるテキスト画像は、図6に示した101におけるテキスト画像サンプルと同様であるので、ここでは説明を省略する。101に記載のテキスト画像サンプルの特徴は、いずれも本明細書のテキスト画像に用いられることができる。
502:テキスト画像を予めトレーニングされたテキスト画像品質評価モデルに入力して処理を行い、テキスト画像品質評価モデルの出力値に基づいて、テキスト画像の品質指標値を決定する。
当該品質指標値は、浮動小数点数を含む。
一例として、図11は、本発明のさらにもう一つの実施例に係る評価対象となる画像の模式図である。図12は、本発明のさらにもう一つの実施例に係る評価対象となる画像の模式図である。図11及び図12に示すテキスト画像を予めトレーニングされた当該テキスト画像品質評価モデルに入力して処理を行い、処理によって取得した図11に示すテキスト画像の品質指標値は0.9756であり、取得した図12に示すテキスト画像の品質指標値は0.9805である。
本発明の実施例は、テキスト画像品質の評価方法を提供する。当該方法においては、評価対象となるテキスト画像を取得し、当該テキスト画像を予めトレーニングされたテキスト画像品質評価モデルに入力し、テキスト画像品質評価モデルの出力値に基づいて、テキスト画像の品質指標値を決定する。したがって、予めトレーニングされたテキスト画像品質評価モデルは、テキスト画像の品質に対する評価に専用することができる。また、当該評価は、プロセスが簡単のため作業しやすく、OCRを行う前の前処理作業としてもよく、計算による消耗を削減することができる。さらに、従来技術による画像品質の評価方法と比較して、計算複雑度及び計算量を大幅に低減し、且つ予め画像に対して処理などの作業を行う必要がなく、評価プロセスが早くて便利である。また、当該テキスト画像品質評価モデルはディープラーニングのニューラルネットワークに基づいてトレーニングされて生成されるものであるため、評価において、人間の視覚によるテキスト画像品質評価の過程を模擬することができる。さらに、当該モデルのパラメータは、反復の方式で繰り返してトレーニングを受けるため、このような事前トレーニングを受けたテキスト画像品質評価モデルを用いてテキスト画像の品質を評価すると、より効果的且つ正確な品質評価結果を出し、評価効率を向上させることができる。
図13は、本発明の一実施例に係る画像品質の評価システムの構成模式図である。図13に示すように、本発明の実施例に係る画像品質の評価システムは以下の部分を備える。
画像品質評価モデル生成モジュール100:画像サンプルを用いて画像品質評価モデルを生成する。
評価モジュール200:画像品質評価モデルによって評価対象となる画像に対して評価作業を行う。
なお、画像品質評価モデルは、画像サンプルに基づいてトレーニングされて生成される画像品質評価モデルである。つまり、画像品質評価モデルにおける階層構造や階層パラメータなどの具体的情報は、すべて画像サンプルの具体的状況に基づいてトレーニングされて生成されるものである。
また、本発明の実施例に係る画像品質の評価方法の適応性及び汎用性をより向上させるために、画像サンプルの画像タイプは、自然場面を含む場面画像であってもよく、テキスト情報を含むテキスト画像であってもよく、本発明の実施例ではそれについて統一した限定をしない。
好ましく、評価対象となる画像の画像タイプは、画像サンプルの画像タイプに一致する。例えば、画像サンプルの画像タイプがテキスト画像であれば、評価対象となる画像の画像タイプもテキスト画像であるべきである。なお、画像品質評価モデルは画像サンプルに基づいて生成されるため、評価対象となる画像の画像タイプと画像サンプルの画像タイプと一致する場合、画像品質評価モデルの評価の精度をより向上させることができる。
好ましく、画像サンプル及び評価対象となる画像の画像タイプは、両方ともテキスト画像である。
図14は、本発明の他の実施例に係る画像品質の評価システムの画像品質評価モデル生成モジュールの構成模式図である。図14に示すように、本発明の実施例において、画像品質評価モデル生成モジュール100は以下の部分を備える。
ラベリングユニット110:画像サンプルの基準品質指標値をラベリングする。
ニューラルネットワークアーキテクチャ生成ユニット120:画像サンプルに基づいてニューラルネットワークアーキテクチャを生成する。
反復トレーニングユニット130:画像サンプルを用いてニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成する。
なお、ニューラルネットワークアーキテクチャは、後続の機械学習をサポートするネットワークアーキテクチャであり、入力層、出力層及び中間層を含む。
好ましく、ニューラルネットワークアーキテクチャは、畳み込みニューラルネットワークアーキテクチャである。
好ましく、ニューラルネットワークアーキテクチャは、畳み込み(Convolution)層、活性化関数(Activation Function)層及び損失(Loss)層を含むネットワークアーキテクチャである。ここで、畳み込み層は画像サンプルに対して特徴抽出作業を行い、活性化関数層は非線形因子を導入し、損失層はトレーニングプロセスにおいて、得られた評価結果と基準品質指標値との間の差によって反復トレーニングを続けるか否かを決定する。
好ましく、活性化関数層は、正規化線形ユニット(Rectified Linear Unit,ReLU)層及びシグモイド曲線(Sigmoid)層を含む。
より好ましく、ニューラルネットワークアーキテクチャは、プーリング(Pooling)層、ドロップアウト(Dropout)層、SPP(Spatial PyraMid Pooling,SPP)層を更に含む。ここで、プーリング層は計算複雑度を低減させて過学習を改善するために特徴の圧縮を行い、ドロップアウト層は過学習を改善し、SPP層は抽出された特徴を固定のサイズを有する特徴ベクトルに転換する。
好ましく、畳み込み層の階層パラメータは、畳み込み核の数、畳み込み核の大きさ、畳み込みウィンドウのスライド距離及びパディングエッジの画素値を含む。
好ましく、プーリング層の階層パラメータは、サンプリング規則、サンプリングウィンドウの大きさ及びサンプリングウィンドウのスライド距離を含む。
好ましく、ドロップアウト層の階層パラメータはドロップアウト率を含む。
好ましく、SPP層の階層パラメータは、サンプリング規則及びピラミッドの層数を含む。
本発明の他の実施例において、反復トレーニングユニット130はさらに、トレーニングパラメータによって画像サンプルをニューラルネットワークアーキテクチャに入力し、ニューラルネットワークアーキテクチャにおける損失層の出力結果と基準品質指標値との間の誤差データを算出し、誤差データによってニューラルネットワークアーキテクチャにおける階層パラメータを更新し、更新後のニューラルネットワークアーキテクチャに基づいて新たに誤差データを反復計算する。なお、反復計算により算出される誤差データが予め設定された誤差範囲に入ると、誤差データに対応するニューラルネットワークアーキテクチャが画像品質評価モデルとなる。
なお、図13及び図14に係る画像品質の評価システム中の画像品質評価モデル生成モジュール100、評価モジュール200、ラベリングユニット110、ニューラルネットワークアーキテクチャ生成ユニット120及び反復トレーニングユニット130の作業と機能は、上述の図1、図2及び図5に係る画像品質の評価方法を参照すればよく、重複を避けるためにここでは説明を省略する。
図15は、本発明の別の実施例に係るテキスト画像品質評価デバイスの構成模式図である。図15に示すように、本発明の実施例に係るテキスト画像品質評価デバイス8は以下の部分を備える。
テキスト画像取得モジュール81:評価対象となるテキスト画像を取得する。
評価モジュール82:予めトレーニングされたテキスト画像品質評価モデルにテキスト画像を入力して処理を行い、テキスト画像品質評価モデルの出力値に基づいてテキスト画像の品質指標値を決定する。品質指標値は、浮動小数点数を含む。
さらに、テキスト画像品質評価デバイス8は以下の部分を更に備える。
テキスト画像サンプル取得モジュール83:トレーニングに用いられるテキスト画像サンプルを取得する。
品質指標値ラベリングモジュール84:各テキスト画像サンプルに対して品質指標値ラベリングを行う。
テキスト品質ネットワーク設置モジュール85:テキスト画像品質評価モデルのテキスト品質ネットワークを設置する。
テキスト画像品質評価モデル取得モジュール86:テキスト画像サンプル及びラベリングされた品質指標値に基づいて、テキスト品質ネットワークによって最初のテキスト画像品質評価モデルのパラメータに対して反復計算トレーニングを行って、テキスト画像品質評価モデルを取得する。
さらに、テキスト品質ネットワーク設置モジュール85は以下の部分を備える。
テキスト品質ネットワークアーキテクチャ設置サブモジュール851:テキスト品質ネットワークアーキテクチャを設置する。なお、テキスト品質ネットワークアーキテクチャは、5つのConvolution層、4つのReLU層、3つのPooling層、1つのDropout層、1つのSPP層、1つのSigmoid層、1つのLoss層から構成される。
また、テキスト品質ネットワークアーキテクチャにおける順序は、Convolution/ReLU/Pooling/Convolution/ReLU/Pooling/Convolution/ReLU/Pooling/Convolution/ReLU/Dropout/Convolution/SPP/Sigmoid/Lossとなる。
階層構造パラメータ設置サブモジュール852:テキスト品質ネットワークアーキテクチャにおけるConvolution層、Pooling層、Dropout層及びSPP層の階層パラメータを設定する。
さらに、設定されるConvolution層の階層パラメータは、畳み込み核の数、畳み込み核の大きさ、畳み込みウィンドウのスライド距離及びパディングエッジの画素値を含む。Pooling層の階層パラメータは、サンプリング規則、サンプリングウィンドウの大きさ、サンプリングウィンドウのスライド距離を含む。Dropout層の階層パラメータはドロップアウト率を含む。SPP層の階層パラメータは、サンプリング規則及びピラミッドの層数を含む。
さらに、テキスト画像品質評価モデル取得モジュール86は具体的に以下の部分を備える。
トレーニングパラメータ決定サブモジュール861:トレーニングパラメータを決定する。
入力サブモジュール862:トレーニングパラメータによって、テキスト画像サンプルを初期のテキスト画像品質評価モデルに入力する。
出力結果取得サブモジュール863:テキスト画像サンプルがテキスト品質ネットワークのConvolution層、ReLU層、Pooling層、Dropout層、SPP層、Sigmoid層により処理された後の出力結果を取得する。
誤差計算サブモジュール864:テキスト品質ネットワークのLoss層において、出力結果とラベリングの品質指標値との間の誤差を計算する。
反復計算モジュール865:誤差を逆方向にテキスト品質ネットワークアーキテクチャの各層に伝送して、各層のネットワークパラメータを更新し、誤差が予め設定された範囲に入るまでに反復計算を続ける。
テキスト画像品質評価モデル生成サブモジュール866:最終的に生成されるテキスト画像品質評価モデルを取得する。
本発明の実施例は、テキスト画像品質評価デバイスを提供する。当該デバイスは、評価対象となるテキスト画像を取得し、当該テキスト画像を予めトレーニングされたテキスト画像品質評価モデルに入力し、テキスト画像品質評価モデルの出力値に基づいてテキスト画像の品質指標値を決定する。したがって、予めトレーニングされたテキスト画像品質評価モデルは、テキスト画像の品質に対する評価に専用することができる。また、当該評価は、プロセスが簡単のため作業しやすく、OCRを行う前の前処理作業としてもよく、計算による消耗を削減することができる。さらに、従来技術による画像品質の評価方法と比較して、計算複雑度及び計算量を大幅に低減し、且つ予め画像に対して処理などの作業を行う必要がなく、評価プロセスが早くて便利である。また、当該テキスト画像品質評価モデルはディープラーニングのニューラルネットワークに基づいてトレーニングされて生成されるものであるため、評価において、人間の視覚によるテキスト画像品質評価の過程を模擬することができる。さらに、当該モデルのパラメータは、反復の方式で繰り返してトレーニングを受けるため、このような事前トレーニングを受けたテキスト画像品質評価モデルを用いてテキスト画像の品質を評価すると、より効果的且つ正確な品質評価結果を出し、評価効率を向上させることができる。
上述のすべての選択可能な技術案は、任意の組み合わせによって、本発明の選択肢となる実施例を形成することができ、ここでは詳しい説明を省略する。
なお、上述の実施例に係るテキスト画像品質評価デバイスは、テキスト画像品質の評価方法を実行する場合についての説明では上述の各機能モジュールの分け方を例としたが、実際に応用する場合、必要に応じて上述の機能を異なる機能モジュールに配分して実行させてもよい。つまり、デバイスの内部構成を異なる機能モジュールに分割して、上述のすべて又は一部の機能を実現する。また、上述の実施例に係るテキスト画像品質評価デバイスは、テキスト画像品質の評価方法に係る実施例と同様の発想に基づくものであり、その具体的な実現プロセスについては方法の実施例を参照すればよく、ここでは説明を省略する。
当業者であれば理解できる通り、上述の実施例のすべて又は一部のステップは、ハードウェアによって実現されてもよく、プログラムが関連するハードウェアに命令を出して実現されてもよい。当該プログラムは、コンピュータ読取可能な記憶媒体に記憶されることができ、上述の記憶媒体はリードオンリーメモリ、磁気ディスク又はコンパクトディスクなどであってもよい。
図16は、本発明の一実施例に係る電子デバイスの構成模式図である。図16によるデバイスは、上述の実施例に係る画像品質の評価方法を実行する。図16に示すように、当該電子デバイスは、プロセッサ161、メモリ162及びバス163を含む。
プロセッサ161は、バス163を介してメモリ162に保存されているコードを呼び出して、画像サンプルを用いて画像品質評価モデルを生成し、画像品質評価モデルによって評価対象となる画像に対して評価作業を行う。
なお、当該電子デバイスは、携帯電話、タブレットなどの電子デバイスを含むが、これらに限定されない。
本発明の一実施例においては、コンピュータ読取可能な記憶媒体を更に提供する。当該コンピュータ読取可能な記憶媒体には、画像品質の評価プログラムが記憶されており、当該画像品質の評価プログラムがプロセッサにより実行されると、上述のいずれかの実施例に係る画像品質の評価方法の作業を実現する。
なお、当該コンピュータ読取可能な媒体は、例えば、CD−ROM、ソフトディスク、ハードディスク、デジタルバーサタイルディスク(DVD)、ブルーレイディスク又は他の形式を有するメモリである。代替的に、上述の実施例による画像品質の評価方法における一部の作業又はすべての作業は、専用集積回路(ASIC)、プログラマブルロジックデバイス(PLD)、EPLD、個別論理、ハードウェア、ファームウェアなどの任意の組み合わせにより実現されることができる。また、上述の実施例のフローチャートによって当該画像品質の評価方法を説明したが、当該画像品質の評価方法における作業に対する変更、削除又は合併は可能である。
上述の通り、コード命令(例えば、コンピュータ読取可能な命令)を用いて上述のいずれかの実施例に係る画像品質の評価方法を実現することができる。当該コード命令は有形のコンピュータ読取可能な媒体、例えば、ハードディスク、フラッシュメモリ、リードオンリーメモリ(ROM)、コンパクトディスク(CD)、デジタルバーサタイルディスク(DVD)、キャッシュメモリ、ランダムアクセスメモリ(RAM)及び/又は任意の他の記憶媒体に記憶されており、当該記憶媒体において情報は任意の期間(例えば、長時間、永久、短時間、一時的なバッファ及び/又は情報のキャッシュ)に亘って記憶されることができる。本明細書で使用される場合、有形のコンピュータ読取可能な媒体という用語は、コンピュータが読取及び記憶することが可能な任意タイプの信号を含むと明確に定義されている。追加的に、又は代替的に、コード命令(例えば、コンピュータ読取可能な命令)によって上述の画像品質の評価方法の実施例に係る例としてのプロセスを実現することができる。当該コード命令は、非一時的なコンピュータ読取可能な媒体、例えば、ハードディスク、フラッシュメモリ、リードオンリーメモリ、コンパクトディスク、デジタルバーサタイルディスク、キャッシュメモリ、ランダムアクセスメモリ及び/又は任意の他の記憶媒体に記憶されており、当該記憶媒体において情報は任意の期間(例えば、長時間、永久、短時間、一時的なバッファ及び/又は情報のキャッシュ)に亘って記憶されることができる。
以上の内容は本発明の好適な実施例に過ぎず、本発明を制限するものではない。本発明の精神及び原則の範囲以内で行われる変更、同等の置換、修正などは、すべて本発明の保護範囲に属すべきである。

Claims (27)

  1. 画像品質の評価方法であって、
    画像サンプルを用いて画像品質評価モデルを生成するステップと、
    前記画像品質評価モデルによって、評価対象となる画像に対して評価作業を行うステップと、を含む
    ことを特徴とする画像品質の評価方法。
  2. 前記画像サンプルを用いて画像品質評価モデルを生成する前記ステップは、
    前記画像サンプルの基準品質指標値をラベリングするステップと、
    前記画像サンプルに基づいてニューラルネットワークアーキテクチャを生成するステップと、
    前記画像サンプルを用いて前記ニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成するステップと、を含む
    ことを特徴とする請求項1に記載の画像品質の評価方法。
  3. 前記画像サンプルを用いて前記ニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成する前記ステップは、
    トレーニングパラメータによって前記画像サンプルを前記ニューラルネットワークアーキテクチャに入力するステップと、
    前記ニューラルネットワークアーキテクチャにおける損失層の出力結果と、前記基準品質指標値との間の誤差データを算出するステップと、
    前記誤差データに基づいて、前記ニューラルネットワークアーキテクチャにおける階層パラメータを更新し、さらに更新後の前記ニューラルネットワークアーキテクチャに基づいて新たに前記誤差データを反復計算するステップと、
    反復計算により算出される前記誤差データが予め設定された誤差範囲に入ると、前記ニューラルネットワークアーキテクチャに基づいて前記画像品質評価モデルを生成するステップと、を含む
    ことを特徴とする請求項2に記載の画像品質の評価方法。
  4. 前記トレーニングパラメータは、反復の総回数と、毎回の反復するサンプル数と、テスト間隔と、学習率と、初期のニューラルネットワークアーキテクチャにおける各階層の重みと、バイアスと、バイアス及び初期のニューラルネットワークアーキテクチャにおける各階層の重みの学習率とのうちの少なくとも1つを含む
    ことを特徴とする請求項3に記載の画像品質の評価方法。
  5. 前記ニューラルネットワークアーキテクチャは、畳み込み層と、活性化関数層と、損失層と、を含む
    ことを特徴とする請求項2乃至4のいずれか一項に記載の画像品質の評価方法。
  6. 前記活性化関数層は、正規化線形ユニット層と、シグモイド曲線層と、を含む
    ことを特徴とする請求項5に記載の画像品質の評価方法。
  7. 前記ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、シグモイド曲線層、損失層となる
    ことを特徴とする請求項6に記載の画像品質の評価方法。
  8. 前記ニューラルネットワークアーキテクチャは、プーリング層と、ドロップアウト層と、SPP層と、を更に含む
    ことを特徴とする請求項6に記載の画像品質の評価方法。
  9. 前記ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、ドロップアウト層、畳み込み層、SPP層、シグモイド曲線層、損失層となる
    ことを特徴とする請求項8に記載の画像品質の評価方法。
  10. 前記畳み込み層の階層パラメータは、畳み込み核の数と、畳み込み核の大きさと、畳み込みウィンドウのスライド距離と、パディングエッジの画素値と、を含む
    ことを特徴とする請求項5乃至9のいずれか一項に記載の画像品質の評価方法。
  11. 前記プーリング層の階層パラメータは、サンプリング規則と、サンプリングウィンドウの大きさと、サンプリングウィンドウのスライド距離と、を含む
    ことを特徴とする請求項8又は9に記載の画像品質の評価方法。
  12. 前記ドロップアウト層の階層パラメータは、ドロップアウト率を含む
    ことを特徴とする請求項8又は9に記載の画像品質の評価方法。
  13. 前記SPP層の階層パラメータは、サンプリング規則と、ピラミッドの層数と、を含む
    ことを特徴とする請求項8又は9に記載の画像品質の評価方法。
  14. 画像品質の評価システムであって、
    画像サンプルを用いて画像品質評価モデルを生成する画像品質評価モデル生成モジュールと、
    前記画像品質評価モデルによって評価対象となる画像に対して評価作業を行う評価モジュールと、を備える
    ことを特徴とする画像品質の評価システム。
  15. 前記画像品質評価モデル生成モジュールは、
    前記画像サンプルの基準品質指標値をラベリングするラベリングユニットと、
    前記画像サンプルに基づいてニューラルネットワークアーキテクチャを生成するニューラルネットワークアーキテクチャ生成ユニットと、
    前記画像サンプルを用いて前記ニューラルネットワークアーキテクチャの階層パラメータに対して反復トレーニングを行って、画像品質評価モデルを生成する反復トレーニングユニットと、を備える
    ことを特徴とする請求項14に記載の画像品質の評価システム。
  16. 前記反復トレーニングユニットはさらに、
    トレーニングパラメータによって前記画像サンプルを前記ニューラルネットワークアーキテクチャに入力することと、
    前記ニューラルネットワークアーキテクチャにおける損失層の出力結果と、前記基準品質指標値との間の誤差データを算出することと、
    前記誤差データによって前記ニューラルネットワークアーキテクチャにおける階層パラメータを更新し、更新後の前記ニューラルネットワークアーキテクチャに基づいて新たに前記誤差データを反復計算することと、
    反復計算により算出される前記誤差データが予め設定された誤差範囲に入ると、前記ニューラルネットワークアーキテクチャに基づいて前記画像品質評価モデルを生成することと、を行う
    ことを特徴とする請求項15に記載の画像品質の評価システム。
  17. 前記トレーニングパラメータは、反復の総回数と、毎回の反復するサンプル数と、テスト間隔と、学習率と、初期のニューラルネットワークアーキテクチャにおける各階層の重みと、バイアスと、バイアス及び初期のニューラルネットワークアーキテクチャにおける各階層の重みの学習率とのうちの少なくとも1つを含む
    ことを特徴とする請求項16に記載の画像品質の評価システム。
  18. 前記ニューラルネットワークアーキテクチャは、畳み込み層と、活性化関数層と、損失層と、を含む
    ことを特徴とする請求項15乃至17のいずれか一項に記載の画像品質の評価システム。
  19. 前記活性化関数層は、正規化線形ユニット層と、シグモイド曲線層と、を含む
    ことを特徴とする請求項18に記載の画像品質の評価システム。
  20. 前記ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、畳み込み層、正規化線形ユニット層、シグモイド曲線層、損失層となる
    ことを特徴とする請求項19に記載の画像品質の評価システム。
  21. 前記ニューラルネットワークアーキテクチャは、プーリング層と、ドロップアウト層と、SPP層と、を更に含む
    ことを特徴とする請求項19に記載の画像品質の評価システム。
  22. 前記ニューラルネットワークアーキテクチャにおける階層順序は、順に畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、プーリング層、畳み込み層、正規化線形ユニット層、ドロップアウト層、畳み込み層、SPP層、シグモイド曲線層、損失層となる
    ことを特徴とする請求項21に記載の画像品質の評価システム。
  23. 前記畳み込み層の階層パラメータは、畳み込み核の数と、畳み込み核の大きさと、畳み込みウィンドウのスライド距離と、パディングエッジの画素値と、を含む
    ことを特徴とする請求項18乃至22のいずれか一項に記載の画像品質の評価システム。
  24. 前記プーリング層の階層パラメータは、サンプリング規則と、サンプリングウィンドウの大きさと、サンプリングウィンドウのスライド距離と、を含む
    ことを特徴とする請求項21又は22に記載の画像品質の評価システム。
  25. 前記ドロップアウト層の階層パラメータは、ドロップアウト率を含む
    ことを特徴とする請求項21又は22に記載の画像品質の評価システム。
  26. 前記SPP層の階層パラメータは、サンプリング規則と、ピラミッドの層数と、を含む
    ことを特徴とする請求項21又は22に記載の画像品質の評価システム。
  27. コンピュータ読取可能な記憶媒体であって、
    前記コンピュータ読取可能な記憶媒体には、画像品質の評価プログラムが記憶されており、
    前記画像品質の評価プログラムがプロセッサにより実行されると、請求項1乃至13のいずれか一項に記載の画像品質の評価方法の作業を実現する
    ことを特徴とするコンピュータ読取可能な記憶媒体。
JP2019546794A 2017-09-08 2018-09-10 画像品質の評価方法及び画像品質の評価システム Active JP6866495B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710804804.0 2017-09-08
CN201710804804.0A CN107644415B (zh) 2017-09-08 2017-09-08 一种文本图像质量评估方法及设备
PCT/CN2018/104842 WO2019047949A1 (zh) 2017-09-08 2018-09-10 图像质量评估方法及图像质量评估系统

Publications (2)

Publication Number Publication Date
JP2020508531A true JP2020508531A (ja) 2020-03-19
JP6866495B2 JP6866495B2 (ja) 2021-04-28

Family

ID=61110396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019546794A Active JP6866495B2 (ja) 2017-09-08 2018-09-10 画像品質の評価方法及び画像品質の評価システム

Country Status (4)

Country Link
JP (1) JP6866495B2 (ja)
CN (1) CN107644415B (ja)
SG (1) SG11201912457PA (ja)
WO (1) WO2019047949A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421237A (zh) * 2021-06-18 2021-09-21 西安电子科技大学 基于深度特征迁移学习的无参考图像质量评价方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644415B (zh) * 2017-09-08 2019-02-22 众安信息技术服务有限公司 一种文本图像质量评估方法及设备
CN111127386B (zh) * 2019-07-08 2023-04-18 杭州电子科技大学 一种基于深度学习的图像质量评价方法
CN110517237B (zh) * 2019-08-20 2022-12-06 西安电子科技大学 基于膨胀三维卷积神经网络的无参考视频质量评价方法
US11157783B2 (en) * 2019-12-02 2021-10-26 UiPath, Inc. Training optical character detection and recognition models for robotic process automation
CN111128355B (zh) * 2019-12-20 2024-04-26 创业慧康科技股份有限公司 一种目标事件评估方法及装置
CN111127452A (zh) * 2019-12-27 2020-05-08 上海箱云物流科技有限公司 一种基于云端处理的集装箱智能ocr识别方法
CN111291794A (zh) * 2020-01-21 2020-06-16 上海眼控科技股份有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质
CN111753873A (zh) * 2020-05-12 2020-10-09 北京捷通华声科技股份有限公司 一种图像检测方法和装置
CN111583259B (zh) * 2020-06-04 2022-07-22 南昌航空大学 一种文档图像质量评价方法
CN111739617B (zh) * 2020-06-15 2023-07-11 中国医学科学院医学信息研究所 医疗影像人工智能质控标注方法、装置、设备及存储介质
CN111914898B (zh) * 2020-06-30 2022-06-28 电子科技大学 一种基于自适应阈值的机载sar任务适应性评估方法
CN111932500B (zh) * 2020-07-10 2023-10-13 泰康保险集团股份有限公司 一种图像处理方法及装置
CN111986157B (zh) * 2020-07-21 2024-02-09 万达信息股份有限公司 一种数字病理图像质量评价系统
CN112017171B (zh) * 2020-08-27 2021-10-26 四川云从天府人工智能科技有限公司 一种图像处理指标评估方法、系统、设备和介质
CN112151179B (zh) * 2020-09-29 2023-11-14 上海联影医疗科技股份有限公司 影像数据评估方法、装置、设备及存储介质
CN112700425B (zh) * 2021-01-07 2024-04-26 云南电网有限责任公司电力科学研究院 一种用于电力设备x射线图像质量的判定方法
CN112950567A (zh) * 2021-02-25 2021-06-11 北京金山云网络技术有限公司 质量评价方法、装置、电子设备及存储介质
CN114549429B (zh) * 2022-01-29 2024-06-25 清华大学 基于超图结构的深度数据质量评价方法及装置
CN114820515A (zh) * 2022-04-26 2022-07-29 渭南日报社印刷厂 基于通道注意力的无参考型图像质量评价方法
CN117953508A (zh) * 2022-10-21 2024-04-30 华为技术有限公司 文本图像的ocr识别方法、电子设备及介质
CN117788461B (zh) * 2024-02-23 2024-05-07 华中科技大学同济医学院附属同济医院 一种基于图像分析的磁共振图像质量评估系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314879A (ja) * 1995-05-16 1996-11-29 Sanyo Electric Co Ltd ニュ−ラルネットの学習方法及びニュ−ラルネット型パターン認識装置
JPH08329032A (ja) * 1995-05-31 1996-12-13 Sanyo Electric Co Ltd ニュ−ラルネット型パターン認識装置及びニュ−ラルネットの学習方法
JP2001094711A (ja) * 1999-09-20 2001-04-06 Toshiba Corp ドキュメント画像処理装置及びドキュメント画像処理方法
JP2004171326A (ja) * 2002-11-21 2004-06-17 Hitachi Ltd ソフトウェアの使用方法
JP2006178543A (ja) * 2004-12-20 2006-07-06 Canon Marketing Japan Inc 画像処理方法、画像処理装置
WO2013088707A1 (ja) * 2011-12-16 2013-06-20 日本電気株式会社 辞書学習装置、パターン照合装置、辞書学習方法および記憶媒体
JP2017049996A (ja) * 2015-09-02 2017-03-09 富士通株式会社 画像認識に用いられるニューラルネットワークの訓練方法及び訓練装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9082047B2 (en) * 2013-08-20 2015-07-14 Xerox Corporation Learning beautiful and ugly visual attributes
CN105488515B (zh) * 2014-09-17 2019-06-25 富士通株式会社 一种对图像进行分类的图像处理方法和图像处理装置
US9741107B2 (en) * 2015-06-05 2017-08-22 Sony Corporation Full reference image quality assessment based on convolutional neural network
CN105046277B (zh) * 2015-07-15 2019-06-14 华南农业大学 特征显著性在图像质量评价中的鲁棒机理研究方法
CN106296690A (zh) * 2016-08-10 2017-01-04 北京小米移动软件有限公司 图像素材的质量评估方法及装置
CN106326886B (zh) * 2016-11-07 2019-05-10 重庆工商大学 基于卷积神经网络的手指静脉图像质量评估方法
CN107644415B (zh) * 2017-09-08 2019-02-22 众安信息技术服务有限公司 一种文本图像质量评估方法及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314879A (ja) * 1995-05-16 1996-11-29 Sanyo Electric Co Ltd ニュ−ラルネットの学習方法及びニュ−ラルネット型パターン認識装置
JPH08329032A (ja) * 1995-05-31 1996-12-13 Sanyo Electric Co Ltd ニュ−ラルネット型パターン認識装置及びニュ−ラルネットの学習方法
JP2001094711A (ja) * 1999-09-20 2001-04-06 Toshiba Corp ドキュメント画像処理装置及びドキュメント画像処理方法
JP2004171326A (ja) * 2002-11-21 2004-06-17 Hitachi Ltd ソフトウェアの使用方法
JP2006178543A (ja) * 2004-12-20 2006-07-06 Canon Marketing Japan Inc 画像処理方法、画像処理装置
WO2013088707A1 (ja) * 2011-12-16 2013-06-20 日本電気株式会社 辞書学習装置、パターン照合装置、辞書学習方法および記憶媒体
JP2017049996A (ja) * 2015-09-02 2017-03-09 富士通株式会社 画像認識に用いられるニューラルネットワークの訓練方法及び訓練装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421237A (zh) * 2021-06-18 2021-09-21 西安电子科技大学 基于深度特征迁移学习的无参考图像质量评价方法

Also Published As

Publication number Publication date
WO2019047949A1 (zh) 2019-03-14
CN107644415B (zh) 2019-02-22
CN107644415A (zh) 2018-01-30
JP6866495B2 (ja) 2021-04-28
SG11201912457PA (en) 2020-01-30

Similar Documents

Publication Publication Date Title
JP2020508531A (ja) 画像品質の評価方法及び画像品質の評価システム
CN109816589B (zh) 用于生成漫画风格转换模型的方法和装置
KR102166458B1 (ko) 인공신경망 기반의 영상 분할을 이용한 불량 검출 방법 및 불량 검출 장치
CN110659582A (zh) 图像转换模型训练方法、异质人脸识别方法、装置及设备
CN110379020B (zh) 一种基于生成对抗网络的激光点云上色方法和装置
CN110675368B (zh) 一种融合图像分割与分类的细胞图像语义分割方法
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN110766050B (zh) 模型生成方法、文本识别方法、装置、设备及存储介质
CN111767962B (zh) 基于生成对抗式网络的一阶段目标检测方法、系统及装置
CN110956126A (zh) 一种联合超分辨率重建的小目标检测方法
CN109902662B (zh) 一种行人重识别方法、系统、装置和存储介质
CN111461212A (zh) 一种用于点云目标检测模型的压缩方法
CN109934095A (zh) 一种基于深度学习的遥感图像水体提取方法及系统
CN112528934A (zh) 一种基于多尺度特征层的改进型YOLOv3的交通标志检测方法
CN109345559B (zh) 基于样本扩充和深度分类网络的运动目标跟踪方法
CN111339902A (zh) 一种数显仪表的液晶屏示数识别方法及装置
CN112464798A (zh) 文本识别方法及装置、电子设备、存储介质
CN111291761A (zh) 用于识别文字的方法和装置
CN112528782A (zh) 水下鱼类目标检测方法及装置
CN114495006A (zh) 遗留物体的检测方法、装置及存储介质
CN113963333B (zh) 一种基于改进yolof模型的交通标志牌检测方法
CN112634174B (zh) 一种图像表示学习方法及系统
CN112560925A (zh) 一种复杂场景目标检测数据集构建方法及系统
CN117058716A (zh) 基于图像预融合的跨域行为识别方法及装置
CN108876853B (zh) 图像定位方法、装置、系统和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210407

R150 Certificate of patent or registration of utility model

Ref document number: 6866495

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250