JPH08263649A - ニューラルベースの空間画像強化システム - Google Patents

ニューラルベースの空間画像強化システム

Info

Publication number
JPH08263649A
JPH08263649A JP8050843A JP5084396A JPH08263649A JP H08263649 A JPH08263649 A JP H08263649A JP 8050843 A JP8050843 A JP 8050843A JP 5084396 A JP5084396 A JP 5084396A JP H08263649 A JPH08263649 A JP H08263649A
Authority
JP
Japan
Prior art keywords
image
resolution
neural network
input
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8050843A
Other languages
English (en)
Inventor
U Shaodong
ウ シアオドング
G Sterns Richard
ジー.スターンズ リチャード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH08263649A publication Critical patent/JPH08263649A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 ビットマップ画像の空間解像度を強化するニ
ューラルネットワークベースのシステムを提供する。 【解決手段】 ビットマップ画像はニューラルネットワ
ークの入力レイヤへ伝送される。ニューラルネットワー
クはルックアップテーブルに適切に実現される。ニュー
ラルネットワークの出力は、入力レイヤの解像度よりも
高い解像度を有するビットマップ画像データを含む。オ
リジナル画像に備えられる冗長な情報からより高い解像
度の画像を抽出できるよう、ニューラルネットワークの
ためのウェイトのトレーニングセットが得られる。トレ
ーニングセットは、ニューラルネットワークの出力を所
望の出力解像度を表すデータと組み合わせることによっ
て生成される。この比較はフィードバック信号を生成
し、該信号はニューラルネットワークへも提供される。
空間的に強化された出力画像に収束を生じるように、ウ
ェイティングが選択される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデジタル画像の強化
技術に関し、より詳細には人工知能技法を用いる画像強
化に関する。
【0002】本発明はよりコンパクトな伝送画像の有効
解像度を増加するのに特に適用可能であり、よりコンパ
クトな伝送画像の有効解像度の増加を特に言及して説明
される。しかし、本発明は、例えばより低い有効空間解
像度を有するデジタル入力の使用によって出力デバイス
の解像度を整合させることが望ましい任意のデジタル画
像形成システムにおいてなどのより広範囲のアプリケー
ションを有することが理解される。
【0003】
【従来の技術】デジタル化は写真及びグラフィック技術
においてしっかりと定着されている。デジタル化された
画像は、画素( "picture elements" )と呼ばれる多く
の画像部分の各々に1つの数値を割り当てる。デジタル
化された画像は、画像の解像度即ち濃度によって特徴づ
けられる。これは、しばしばドットパーインチ( "DP
I" )と定義される。解像度は一般に、平らな画像上を
水平方向に及び垂直方向に測定される。別の値が各画素
に関連する。これは、白黒画像の場合、 "0" 又は "1"
のいずれかである。各画素の数値範囲は、色の区別を識
別する人間の能力の限界としてしばしばみなされる24
ビットを越えることができる。
【0004】画像の明瞭性又は完全性は共に解像度及び
カラーパレットによって示される。もちろん、これらの
値のうちの1つ又は双方を増加すると、写真の情報を記
憶及び/又は伝送するのに必要な情報量は実質的に増加
する。
【0005】デジタル画像デバイスは、捕捉デバイス、
記憶デバイス、伝送デバイス及び出力デバイスに分類さ
れることができる。各段階において、可能な限り最も少
ない量のデータを用いて動作することが望ましい。しか
し、目的は出力として最も高い解像度の画像を得ること
である。データ量を少なくすると、より安価でより複雑
でない画像捕捉又はデジタル化デバイスが可能になる。
データがより少なくなると、より少ないキャリアバンド
幅を用いて画像をより迅速に伝送することも可能にな
る。
【0006】捕捉画像に関連する解像度と表示画像に関
連する解像度とが一致しないと、特定の問題が生じる。
例えば、画像がある解像度で捕捉されて別の解像度で表
示される場合、モアレ効果などの干渉パターンが出力画
像を実質的に歪める可能性がある。
【0007】画像のデジタル化、特に画像データの伝送
及び保存がより遍在するにつれ、様々な圧縮方式が生じ
ている。静止画像では、現在の水準はJPEG("Joint
Photographic Experts Group")によって提供されてい
る。動く画像の水準はMPEG("Motion Picture Expe
rts Group")によって提供されている。これらのシステ
ムは、中間記憶又は伝送のためのデータを "圧縮" する
ように比較的高い入力解像度画像のアルゴリズム集中分
析に強く依存している。より高い解像度の画像を抽出す
るように、リバースアルゴリズムが画像の生成前に適用
される。これらのシステムは有効であるが得られた画像
の解像度を強化することに関連せず、むしろ得られた画
像と最終的に眺められる画像との整合を試みることに関
連する。更に、このようなシステムは画像入力デバイス
の解像度を画像出力デバイスの解像度と整合することに
関連しない。最後に、このようなシステムは圧縮/圧縮
解除( "CODEC")を実行するのにかなりの量の計算
力を必要とする。これらのシステムのアルゴリズムの複
雑さに依存すると、リアルタイムで圧縮/圧縮解除動作
をすることが不可能になりうる。
【0008】
【発明が解決しようとする課題】本発明は、上述の問題
及び他の問題全てを克服する、デジタル化画像の解像度
変換のための新しい改良されたシステムを意図し、比較
的低い解像度の画像内に提供される冗長な情報から高解
像度の画像が抽出可能なシステムを提供する。
【0009】
【課題を解決するための手段】本発明によると、2次元
のビットマップ画像を表すデータを受け取る入力部を含
む、ビットマップ画像のためのニューラルベースの空間
解像度強化システムが提供される。ニューラルウェイト
がトレーニングセットデータに従って予めセットされて
いるニューラルネットワークは、この入力画像を受け取
る。特定の解像度を有する入力画像とより高い解像度を
有する出力画像との間に収束を生じるために選択される
トレーニングセットデータが提供される。
【0010】本発明の別の態様によると、上述のことを
実行するためにトレーニングセットデータを得る手段が
提供される。
【0011】本発明の更により限定される態様による
と、比較的低い解像度の画像から高解像度画像を抽出す
る方法が提供される。
【0012】本発明の更に別の態様によると、ビットマ
ップ画像のためのニューラルベースの空間画像強化シス
テムであって、関連するオリジナル画像を表すN1 ×N
2 画素のビットマップ画像から成る入力データを受け取
る入力手段を含み、N1 及びN2 はそれぞれ正の整数と
定義され、入力レイヤ及び出力レイヤ間の移動の間に収
束を生じるように、ニューラルウェイトがトレーニング
セットデータに従って予めセットされるニューラルネッ
トワークを含み、前記入力データを前記ニューラルネッ
トワークの前記入力レイヤへ伝送する手段を含み、少な
くとも1つのm1 ×m2 のビットマップ画像部分から形
成されるM1 ×M2 のビットマップ画像を表す出力デー
タを前記ニューラルネットワークの前記出力レイヤから
出力する手段を含み、M1 、M2 、m1 及びm2 はそれ
ぞれ正の整数と定義され、M1 ×M2 の画像が前記関連
するオリジナル画像に対して前記N1 ×N2 のビットマ
ップ画像よりも高い画素の解像度を有するように画定さ
れる。
【0013】本発明の利点は、いかなる事前圧縮も必要
とせずに低解像度の画像から高解像度の画像を得るシス
テムを備えることである。
【0014】本発明の別の利点は、顕著な画像の劣化又
はアーチファクト(人工生成物)なしに低解像度の画像
から高解像度の画像を生成するシステムを備えることで
ある。
【0015】本発明の更に別の利点は、デジタル化又は
入力デバイスの解像度と視覚的出力デバイスの解像度を
整合させるシステムである。
【0016】本発明の更に別の利点は、ルックアップテ
ーブルによって安価に構成される人工知能ベースの解像
度強化システムを備えることである。
【0017】本発明の更に別の利点は、単一画像に配置
される様々な画像タイプを識別し強化する画像解像度強
化システムを備えることである。
【0018】本発明の更に別の利点は、上述のことを非
常に迅速に即ちリアルタイムで達成できるシステムを備
えることである。
【0019】本発明の更に別の利点は、捕捉されデジタ
ル化された画像をスキャナーから得て、得られた画像の
アーチファクトをニューラルネットワークを介して補正
するシステムを備えることである。
【0020】本発明の更なる利点は、以下を読み理解す
るにつれ当業者には明白になるであろう。
【0021】本発明はいくつかの部分及び部分の構成に
おいて物理的な形をとりうるため、本発明の好適な実施
の形態が本明細書中で詳細に述べられ、その一部を形成
する付随図面に例示される。
【0022】
【発明の実施の形態】本発明の好適な実施の形態を限定
する目的ではなく例示する目的のみである図面を参照す
ると、図面はより低い解像度のビットマップ画像からよ
り高い解像度のビットマップ画像への変換を実行するニ
ューラルネットワークベースのシステムを詳細に述べて
いる。用紙の文書を高解像度で走査することは、有効な
電子保存システム又は高忠実度ネットワークプリントシ
ステムにとって重要である。人間の眼の応答特性のた
め、(水平及び垂直双方の)300DPI又は600D
PIがレーザプリンタなどのプリントマシンに一般に使
用される解像度を提供する。プリントされた文書を顕著
なモアレ効果を生じずに走査するためには、文書を少な
くとも600spi(スポットパーインチ)の解像度の
デジタル形式で走査又は入力することが望ましい。
【0023】600DPIのプリントマシンは比較的一
般的であるが、この解像度を備える走査又はデジタル化
デバイスは進歩した製造技術をセンサアレイに必要とす
る。従って、このような高解像度入力デバイスは高価で
ある。
【0024】本明細書中に述べられるシステムは走査さ
れた画像内の冗長な情報を使用して、その空間解像度を
強化する。低解像度の画像はオリジナル画像の特性のた
めに冗長な情報を提供することが認識されるべきであ
る。例えば、スキャナー又は入力デバイスの解像度が十
分なレベル(テキスト文書の場合は200DPIなど)
に達すると、隣接画素の値は一般的に密接に関連してい
る。この限定された情報はテキストのエッジを生成する
のに有益に把握され、実際に入力された即ち走査された
画像よりも高い解像度の出力を形成することができる。
より低い解像度で得られた画像にはニューラルウェイテ
ィングが実施され、この変換が実行される。
【0025】付加的な冗長な情報が、走査された各画素
のグレースケール(又はカラー)値に提供される。これ
は、殆どのセンサの特性によって示される。典型的なス
キャナーシステムは8ビット又はそれより多くのグレー
スケール解像度を有する。この情報は把握され、テキス
ト及び背景のレベルがわかる場合は走査された画素内の
テキストエッジの位置を決定することができる。
【0026】本明細書中に述べられるシステムは、エッ
ジの情報が重要である2レベルのテキスト画像で特に有
効である。これは、テキスト画像が隣接画素の間に強い
空間相関関係を有する限り当てはまる。通常の写真画像
は、非常に細かなピッチ及び鋭いエッジがない限り20
0DPIで申し分なく走査されることが可能である。人
間の視覚認識は優れた統合を提供し、写真のコンテクス
トからグレースケール画像の詳細な情報を外挿する。好
適な実施の形態の解像度の強化は、2つの段階を用い
る。第1の段階は、サンプル画像を用いてニューラルネ
ットワークを設定しトレーニングすることである。第2
の段階は、ニューラルネットワークを走査された低解像
度の画像に適用し、より高い空間解像度を有する画素値
を生じることである。
【0027】図1を特に参照すると、示されるのは低解
像度の走査された画像の画素グリッドAである。開示さ
れる実施の形態では、N1 ×N2 隣接画素の値を使用し
て、低解像度グリッドAの特定の画素(i、j)内の高
解像度画素の画素値を計算する。画素14(即ち部分
B)の解像度強化は、m1 ×m2 によって示される。完
全な強化画像が、1つ又はそれより多くのm1 ×m2
域から形成されるM1 ×M2 アレイによって提供され
る。M1 、M2 はそれぞれ正の整数である。m1 及びm
2 の値は正の整数であり、走査された又は入力された画
像による要件セットによって決定される。値N1 及びN
2 は双方とも正の整数であり、以下により詳細に述べら
れるように、収束解をニューラルネットワークに与える
最小のものである。本明細書中に使用されるように、N
1 及びN2 のような下付きの変数は別個の値を示し、必
ずしも等しいとは限らない。
【0028】画素グリッドAは複数の画素10から成
る。図1の例示では、解像度強化部分Bは画素の境界線
が12で示されるN1 ×N2 画像から抽出され、例えば
画素14である。
【0029】ここで図2を参照すると、本明細書中に述
べられる発明において提供されるようなニューラルネッ
トワークCの概略図が述べられる。ニューラルネットワ
ークCはL層のニューロンレイヤから成り、Lは正の整
数である。以下に詳細に述べられるように、ニューラル
ネットワークCの各ニューロン20は図3に提供される
例の構成によって示される。
【0030】ネットワークCは入力レイヤ22に複数の
入力を有し、好適な実施の形態ではN1 ×N2 である。
同様に、好適な実施の形態はm1 ×m2 のニューロンを
有する出力レイヤ24を提供する。
【0031】図3を特に参照すると、図2のニューロン
20の各々の構成が詳細に述べられる。各ニューロン2
0には、複数の入力値(x1、x2、・・・、xs)が
入力される。各入力に対応するのは、関連するウェイト
値(w1、w2、・・・、ws)である。これらの値は
加算ユニット28に提供される。得られた出力は、非線
形関数変換f(z)に伝送される。従って、z=w1×
x1+w2×x2+・・・+ws×xsである。ニュー
ロン20の数は、レイヤLの数と共に非常にアプリケー
ション固有であり、画像の特性に依存する。
【0032】本明細書中に述べられるシステムでは、全
てのウェイトwはトレーニングプロセスによって決定さ
れる。トレーニングを実行するために、低解像度の画素
グリッド及び高解像度のグリッドがスキャナーの解像度
及び所望の出力解像度に応じてセットされる。例とし
て、図1に示されるようにN1 =N2 =5及びm1 =m
2 =3である場合、双方のグリッドをテストサンプル画
像にスライドさせることによって適切なトレーニングセ
ットが生成される。
【0033】許容可能なテキストサンプルは様々なフォ
ントとサイズのテキストから成り、このフォントは完全
な又は完全に近いエッジの画定を有する。トレーニング
を簡潔にするため、2レベルのテキスト、即ち白黒のみ
を有するテキストが適切に選択される。8ビットのグレ
ースケールシステムでは、レベルは0〜255の範囲の
値で測定される。グレーレベルテキスト又は反転テキス
トでは、文字内の又は文字の外側の完全な画素のグレー
スケールは、セグメンテーションによって適切に決定さ
れる。従って、テキストは白黒テキストに変換され、本
文中に詳細に述べられるシステムによって処理されるこ
とができる。強化後、オリジナル文書を表すため、画素
値は適切に変換されてオリジナルなグレースケールレベ
ルに戻される。
【0034】図4を参照すると、トレーニングセットの
適切な例が提供される。図において、シェード部分30
はテキストを表す。同様に、白領域32は文字同士の間
の又は文字内の空白を表す。小さなm1 ×m2 マトリッ
クス36はしきい値によって処理されてフィルタリング
され、電子プリンタによって適切に容認されるバイナリ
(二値)ビットマップを生成する。しかし、このような
しきい値処理はしばしば望ましいことであるが、常に必
要であるとは限らないことが理解される。得られたm1
×m2 マトリックス38は、ニューラルネットワークC
の所望の出力を形成する。ニューラルネットワークC
は、収束ウェイトパラメータが設けられると完全にトレ
ーニングされる。N1 ×N2 のグレーレベル画素入力に
よって完全にトレーニングされたネットワークは、非常
に小さな誤差で所望のm1 ×m2 の高解像度マトリック
スを生成する。
【0035】ここで図5を参照すると、トレーニングの
ための概略的なネットワークが提供される。一連のトレ
ーニングセットを入力としてニューラルネットワークC
に提供することにより、正確なウェイトパラメータの許
容可能なセットが得られる。トレーニングは、初めにお
およそのウェイトパラメータを推定することにより適切
に開始される。テストサンプルセットがN1 ×N2 の入
力ライン52に提供される。得られた値は次にm1 ×m
2 の出力ライン54に提供される。ライン52の出力
は、ライン54に提供されるm1 ×m2 マトリックスの
所望の出力と比較される。この所望の出力は、一連の加
算器56(1)、56(2)・・・、56(n)によっ
て出力52と比較される。加算器56の出力は、サブシ
ステム58の平均2乗誤差分析を受ける。この分析によ
って決定された平均2乗誤差は、ネットワーク予測の測
定値としてニューラルネットワークCへライン60を介
して伝送される。次に最小平均2乗アルゴリズム又は逆
伝搬トレーニングアルゴリズムが適切に実施され、平均
2乗誤差を最小にするのに選択されたウェイトパラメー
タの新しいセットを計算する。
【0036】N1 ×N2 、各レイヤのニューロンの数、
及びL、即ちニューラルネットワークCにおけるニュー
ロンのレイヤの数が許容可能に選択されると、ウェイト
パラメータはm1 ×m2 マトリックスの最良の予測を与
える値の1セットにおいて収束する。即ち、それらの値
は最小の平均2乗誤差を供給する。これらのウェイトパ
ラメータを用いて、システムは(グレースケール情報を
適切に有する)低解像度のスキャンテキスト画像を用い
てより高い解像度の画像を得ることができる。
【0037】上述の実施の形態は、テキスト画像につい
て言及された。しかし、このシステムは他のタイプの画
像、例えば写真、手書き、ファクシミリ、ハーフトーン
画像又は写真上のテキストでさえも有益に適用可能であ
る。
【0038】ニューラルネットワークが一度トレーニン
グされると、ニューラルネットワークC、入力50及び
出力52を含む図5の部分のように、実施はニューラル
ネットワークを直接適用することによって達成される。
入力されたN1 ×N2 の画像はニューラルネットワーク
Cによって変換され、52において高解像度の小さなm
1 ×m2 出力を形成する。
【0039】次に、200spi、8ビット/画素の画
像から600spi、1ビット/画素の出力画像への実
際の変化が述べられる。この代表的な変換において、初
めのビットマップの各画素は9個のバイナリ出力画素に
変換される。図6(a)及び(b)を参照のこと。
【0040】代表的なネットワークにおいて、ニューラ
ルネットワークは低解像度の情報、仮定上は対象となる
画素の値(図6(b)のwi,j )を入力として使用す
る。隣接画素の値を反映する更なる情報が使用される。
ニューラルネットワークの出力は、wi,j 内に含まれる
600spi画素のための9つの値から成る。ニューラ
ルネットワークは、既知の出力画像データを使用してト
レーニングされる。即ち、200spiの画像が使用さ
れ、200spiの画像に対して高品質の600spi
バージョンの画像が利用可能である。このような画像の
対は、600spi、8ビット/画素の画像で始めて該
画像を600spiのバイナリ画像及び200spi、
8ビット/画素の画像に変換することにより適切に生成
される。
【0041】このアプローチを実施するため、公知の3
レイヤパーセプトロンネットワークが適切に使用され
る。ネットワークは、標準の逆伝搬アルゴリズムを使用
してトレーニングされる。ネットワークの出力レイヤ
は、図6(b)のo3i-1,3j-1 〜o3i+1,3j+1 の画素に
相当する9つのニューロンを含むよう条件付けられてい
る。ネットワークの入力は、より柔軟である。この実施
の形態において入力値は、目標画素wi,j 及び8個の最
も近い隣接画素からのみの情報を使用して生成される。
更に離れた画素からの情報は、更により良い結果を生じ
うることが理解される。このような追加の情報は、本明
細書中に述べられる開示によりたやすく実施されうるこ
とも理解される。
【0042】画素の特定の選択はかなりアプリケーショ
ン固有であり、処理時間、メモリのオーバーヘッドなど
を考慮に入れなくてはならない。
【0043】ニューラルネットワークを構成する簡素な
アプローチは、ネットワークへの入力情報として画素w
i,j の値を8つの最も近い隣接画素wi-1,j-1 〜w
i+1,j+1の値と共に使用する。これにより、200sp
iのビットマップ画像の小さな部分に相当する9つの入
力のネットワークが提供される。画素wi,j についての
局所のスロープ情報を提供することにより、改良された
表示が達成されることも可能である。例えば、適切な入
力は下の表1に提供されるように構成されることができ
る。
【0044】
【表1】
【0045】表に示される9つの数量は線形的に独立し
ており、画素wi,j に関する画像情報の級数展開にほぼ
対応する。即ち、表1の9つの数量から9個の画素w
i-1,j-1 〜wi+1,j+1 が正確に決定されることができ
る。従って、この表示を使用することによってネットワ
ークには追加の情報は与えられない。しかし、いくつか
のアプリケーションは、差し迫る問題に対して自然な物
理的意義を有する入力表示を使用することにより、より
高効率の改良されたニューラルネットワークを提供する
ことができる。以下に明白であるように、上記の表示に
より、例えば級数展開の高次の項(単数又は複数)を取
り除くことによって、必要に応じて十分な次数に入力の
数を減らすことができる。
【0046】この例において、9つの入力ユニット、8
5の隠れユニット及び9つの出力ユニットから成る3レ
イヤニューラルネットワークは、200spiで8ビッ
ト/画素のテキスト及びラインアート画像をバイナリ
(2ビット/画素)で600spiの画像に変換するよ
うにトレーニングされる。図7において明らかなよう
に、ネットワーク入力は600spiの画像の一部から
得られ、200spiに変換され、上記の表1に従って
変換された。このトレーニングセットは、600spi
画像のテキスト及びラインアートから得られる20,0
00の入力/出力の対から成る。この例では、ネットワ
ークは小さな画像フィールド(3×3の画素)を使用し
てトレーニングされた。従って、このネットワークはロ
ーテーション、フォントのタイプ又はサイズなどの全体
的な画像特性に敏感ではなかった。しかし、トレーニン
グセットの多種のテキスト及びラインアートのタイプに
ネットワークをさらすことは有益である。ネットワーク
は一般に、その誤り率に明らかな収束が生じるまでトレ
ーニングされる。例えば、このネットワークは50万回
の大きさのトレーニングサイクルを必要とするかもしれ
ない。
【0047】ニューラルネットワークが一度トレーニン
グされると、即ちネットワークのウェイトが一度決定さ
れると、ネットワークは新しい低解像度画像の解像度変
換を実行するのに使用されることができる。このため、
低解像度画像の各画素がその3×3の近隣画素と共に抽
出される。表1の代表的な変換が、3×3の画素グルー
プに対して実行される。ネットワークの9つの入力ニュ
ーロンの値が設定される。ネットワークは通常のフィー
ドフォーワードの態様で実行される。ネットワークの9
つの出力ニューロンの得られた値はスレショルディング
され、解像度が3倍高い画像の9つの画素値を生じる。
例えば、図6(b)を参照のこと。
【0048】ほぼリアルタイムで画像変換を行うため
に、ルックアップテーブルが先のトレーニングされたネ
ットワークを使用して適切に構成される。従って、最終
の画像解像度の収束は実際のニューラルネットワークを
実行して行われるのではなく、低解像度画像の3×3の
近隣画素の値をルックアップテーブルのメモリアドレス
を用いて処理することによって行われ、ルックアップテ
ーブルの値はより高解像度の出力情報に対応する。
【0049】現在では、経済的に適したルックアップテ
ーブルは数メガバイトのサイズしか提供しない。もちろ
ん、メモリサイズ又はコストの進歩及び全体の処理能力
の進歩はこれを変える。ルックアップテーブルはまた、
特定の実施の要件に関して非常にアプリケーション固有
である。この特定のサイズとは、ニューラルネットワー
クをトレーニングするのに使用される入力情報は約20
ビットに制限されなくてはならない、ということであ
る。上述では、ネットワークへの入力データを生成する
のに8ビット低解像度画像の3×3の部分が使用された
ため、使用された情報は約9×8=72ビットである。
【0050】ネットワークへの入力情報を20ビットに
減らすために、次のアプローチが適切にとられる。ま
ず、低解像度画像から、図6(b)の基本画素wi,j
びその最も近い4個の近隣画素が考慮され、これらの画
素からニューラルネットワークへの入力が構成される。
更に、これらの5個の低解像度画素を組み合わせて(5
つの入力を含む)新しいニューラルネットワークへの入
力値を得る前に、低解像度の画素値は4ビット値に切捨
てられる。これは、20ビットの情報に相当する。これ
らの5つの4ビット低解像度画素は組み合わされて、上
の表1に示される最初の5つの入力の組み合わせを生成
する。これは、新しいニューラルネットワークへの入力
として役立つ。
【0051】ここでニューラルネットワークは、その9
つの出力において適切な値を生成するように、このより
限定された入力情報に対してトレーニングされる。これ
らはより高い解像度のデータ(図6(b)のoi,j )に
相当する。トレーニングが完了すると、ネットワークは
20ビットのルックアップテーブルを充填するのに使用
される。ルックアップテーブルの各アドレスは、5個の
ソース画素の4ビット値の組み合わせに対応する。即
ち、図6(b)の画素wi,j 、wi,j+1 、wi,j-1 、w
i+1,j 及びwi-1,j である。5個の低解像度画素の各値
である各アドレスにつき、適切な入力ニューロン値が計
算される(表1)。更に、トレーニングされたニューラ
ルネットワークは、各画素wi,j に関連する9個の高解
像度画素に相当する出力を生成するように動作される。
次に、ニューラルネットワークのスレショルディングさ
れた出力が対応するメモリアドレスに配置される。全て
のアドレスがニューラルネットワークを通過すると、ル
ックアップテーブルは完了する。
【0052】トレーニング及びルックアップテーブルの
生成の概略図が図8によって提供される。ルックアップ
テーブルを形成するため、システムはトレーニングセッ
ト即ちトレーニングウェイトの収集とこれらのウェイト
の実際の適用の双方を示す。ブロック100から始める
と、高解像度バイナリ画像が入力される。ブロック10
2に進むと、この画像は走査デバイスに選択的に提供さ
れる。この点から、走査処理のために低解像度グレース
ケール画像即ち空間的に歪められた画像がブロック10
4において形成される。この後、最も近い近隣画素の組
み合わせが完了し、ニューラルネットワークへの入力値
(必ずしも画素値とは限らない)が計算される。ブロッ
ク106において、これらの値はトレーニングのために
ニューラルネットワークへ伝送される。
【0053】ブロック100の高解像度バイナリ画像
は、トレーニングのためにブロック108のニューラル
ネットワークへも伝送される。
【0054】収束のテストの後、システムはブロック1
08からブロック110へ進む。この点でネットワーク
はトレーニングされ、適切なウェイトが決定される。こ
れによりニューラルネットワークに入力が提供され、ブ
ロック112でニューラルネットワークがランされる。
【0055】ブロック116において、全ての可能な入
力値が使用されてニューラルネットワーク入力を生成す
る。これらの値は、ニューラルネットワークへ入力され
る。ブロック112及びブロック116からの双方の出
力が伝送されてルックアップテーブルを形成し、該ルッ
クアップテーブルはブロック114において完全に構成
される。
【0056】本明細書中に述べられるシステムによって
画像全体の解像度の総変換についての特定な詳細が述べ
られたが、画像全体の一部分又はサブセットのみをアド
レスすることがしばしば有益であることが理解される。
例えば、画像の特定の領域のみが特に重要である又は特
に対象になる場合がある。更に、全体の画像を介して進
む又はステップを進む間にこのような手順を繰り返し指
令することにより、各部分ごとに処理する態様で同様の
全体変換を達成することが可能である。
【0057】ここで図9を参照すると、様々な上述の画
像タイプに順応する一般化されたシステムが提供され
る。ブロック70において、生の低解像度画像が提供さ
れる。この画像はブロック72においてセグメント化さ
れる。この点で、画像タイプに関する決定がなされる。
図では、テキスト、写真、ハーフトーン及び写真上のテ
キストの区別がなされる。
【0058】本質的にテキストであると決定された画像
は、ブロック74へ移る。この点で、システムはテキス
トのどの部分が黒でどの部分が白かを確定する。ブロッ
ク74のテキストレベル情報はブロック76へ伝送され
る。標準化されたテキスト情報はブロック78のニュー
ラルネットワークへ提供され、その出力はまたブロック
76へ伝送される。ブロック76からの情報によって画
像の再構成がブロック80でなされ、ブロック80から
高解像度画像の出力が得られることが可能になる。
【0059】画像セグメント化ブロック72において対
象の画像が本質的に写真であると決定されると、ブロッ
ク82へ進められる。この点で、写真用にトレーニング
されるニューラルネットワークの直接の適用が写真の情
報と共に提供される。これによって画像の再構成がブロ
ック80においてなされ、高解像度画像の出力が得られ
ることが可能になる。
【0060】ブロック72においてハーフトーン画像と
決定されるとブロック84へ進められ、ここでハーフト
ーン用にトレーニングされるニューラルネットワークの
適用が提供される。この後に画像再構成ブロック80へ
進められ、高解像度画像の出力が可能になる。
【0061】画像セグメント化ブロック72によって写
真上のテキストの部分の存在が決定されると、ブロック
86へ進められる。この点で、特に写真上のテキスト画
像用のニューラルネットワークの適用が提供される。こ
の後ブロック80に進められ、この点から画像再構成及
び高解像度画像出力の生成がなされることが可能であ
る。ブロック82、84及び86に使用されるニューラ
ルネットワークは、標準テキスト用のニューラルネット
ワークにおいて述べられる方法と非常に類似した方法で
設定されトレーニングされることができる。
【0062】本発明は好適な実施の形態を参照して述べ
られてきた。本明細書を読み理解するにつれ、変更及び
変形が他の実施の形態に生じることは明らかである。請
求の範囲又はそれに相当するものの範囲内である限り、
全てのこのような変更及び変形が含まれるものと意図さ
れる。
【図面の簡単な説明】
【図1】本発明のシステムへの入力として提供されるよ
うな低解像度の走査画像の画素グリッドを示す。
【図2】本発明において適切に実施されるようなニュー
ラルネットワークの概略図を提供する。
【図3】図2に示されるような各ニューロンの基本構造
を示す。
【図4】本発明のニューラルネットワークにおいて適切
に実施されるトレーニングセットの一例を提供する。
【図5】本発明のネットワークトレーニングシステムの
概略図である。
【図6】(a)及び(b)は、より低い解像度のグレー
スケールからより高い解像度のバイナリ画像への所望の
解像度変換を示す。
【図7】ニューラルトレーニングのシーケンスを要約す
るフロー図である。
【図8】ルックアップテーブルの構成のためのトレーニ
ング処理を要約するフローチャートである。
【図9】本発明の一般化された被走査画像の解像度強化
システムの概略図である。
【符号の説明】
A 画素グリッド C ニューラルネットワーク 22 入力レイヤ 24 出力レイヤ
フロントページの続き (72)発明者 リチャード ジー.スターンズ アメリカ合衆国 95031 カリフォルニア 州 ロス ガトス グレンウッド ドライ ヴ 2300

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 ビットマップ画像のためのニューラルベ
    ースの空間画像強化システムであって、 関連するオリジナル画像を表すN1 ×N2 画素のビット
    マップ画像から成る入力データを受け取る入力手段を含
    み、N1 及びN2 はそれぞれ正の整数と定義され、 入力レイヤ及び出力レイヤ間の移動の間に収束を生じる
    ように、ニューラルウェイトがトレーニングセットデー
    タに従って予めセットされるニューラルネットワークを
    含み、 前記入力データを前記ニューラルネットワークの前記入
    力レイヤへ伝送する手段を含み、 少なくとも1つのm1 ×m2 のビットマップ画像部分か
    ら形成されるM1 ×M2 のビットマップ画像を表す出力
    データを前記ニューラルネットワークの前記出力レイヤ
    から出力する手段を含み、M1 、M2 、m1 及びm2
    それぞれ正の整数と定義され、M1 ×M2 の画像が前記
    関連するオリジナル画像に対して前記N1 ×N2 のビッ
    トマップ画像よりも高い画素の解像度を有するように画
    定される、 ニューラルベースの空間画像強化システム。
JP8050843A 1995-02-21 1996-02-14 ニューラルベースの空間画像強化システム Withdrawn JPH08263649A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US395364 1982-07-06
US39536495A 1995-02-21 1995-02-21

Publications (1)

Publication Number Publication Date
JPH08263649A true JPH08263649A (ja) 1996-10-11

Family

ID=23562734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8050843A Withdrawn JPH08263649A (ja) 1995-02-21 1996-02-14 ニューラルベースの空間画像強化システム

Country Status (1)

Country Link
JP (1) JPH08263649A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012018282A1 (ru) * 2010-08-06 2012-02-09 Shmunk Dmitry Valerievich Способ суперразрешения изображений и нелинейный цифровой фильтр для его осуществления
JP2018151443A (ja) * 2017-03-10 2018-09-27 株式会社半導体エネルギー研究所 半導体装置
JP2018206371A (ja) * 2017-06-02 2018-12-27 三菱電機株式会社 コンピューター実施画像再構成システムおよび画像再構成方法
WO2019087905A1 (ja) * 2017-10-31 2019-05-09 シャープ株式会社 画像フィルタ装置、画像復号装置、および画像符号化装置
CN110612549A (zh) * 2017-12-15 2019-12-24 谷歌有限责任公司 用于快速图像增强的基于机器学习的技术
JP2022514566A (ja) * 2019-02-15 2022-02-14 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド 画像復元方法及びその装置、電子機器並びに記憶媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012018282A1 (ru) * 2010-08-06 2012-02-09 Shmunk Dmitry Valerievich Способ суперразрешения изображений и нелинейный цифровой фильтр для его осуществления
US9020302B2 (en) 2010-08-06 2015-04-28 Dmitry Valerievich Shmunk Method for producing super-resolution images and nonlinear digital filter for implementing same
JP2018151443A (ja) * 2017-03-10 2018-09-27 株式会社半導体エネルギー研究所 半導体装置
JP2018206371A (ja) * 2017-06-02 2018-12-27 三菱電機株式会社 コンピューター実施画像再構成システムおよび画像再構成方法
WO2019087905A1 (ja) * 2017-10-31 2019-05-09 シャープ株式会社 画像フィルタ装置、画像復号装置、および画像符号化装置
CN110612549A (zh) * 2017-12-15 2019-12-24 谷歌有限责任公司 用于快速图像增强的基于机器学习的技术
JP2022514566A (ja) * 2019-02-15 2022-02-14 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド 画像復元方法及びその装置、電子機器並びに記憶媒体

Similar Documents

Publication Publication Date Title
US6343159B1 (en) Method and apparatus for modeling and reconstruction of halftoned images
EP0320755B1 (en) Image processing system and method employing combined black and white and gray scale image data
US5689343A (en) Area mapping employing reference clusters for high quality noninteger resolution conversion with enhancement
US20100182637A1 (en) Image forming apparatus, control method, and program
CN114372913A (zh) 一种基于热敏打印机的打印十六级灰度图像的图像增强处理方法
US20040037472A1 (en) System and method for directed acuity segmentation resolution compression and decompression
JPH08263649A (ja) ニューラルベースの空間画像強化システム
JP3514050B2 (ja) 画像処理装置
US6002493A (en) Method for reproducing an image
JP2756371B2 (ja) 画像処理装置
JPH03259193A (ja) グレースケール文字表示装置
KR100251551B1 (ko) 디지탈영상양자화를위한비인과성오차확산계수의위치및결정방법
DE60311384T2 (de) Transformation eines Eingangsbildes zur Herstellung eines Ausgangsbildes
JP3539552B2 (ja) 画像処理装置
JP2004246110A (ja) 検版装置、印刷システム、印刷データの検版方法、およびプログラム
JP3783815B2 (ja) 画像処理装置
JPS6259512B2 (ja)
JP2023080454A (ja) 解像度変換を行う画像処理装置、その制御方法、プログラム
JP2811469B2 (ja) 疑似中間調画像処理機能を備えた情報処理装置
JP2778669B2 (ja) 網点領域検出方法
JP2913867B2 (ja) カラ―画像情報処理方法
JPH10126613A (ja) 画像処理装置
JP2836992B2 (ja) 画像変倍処理装置
JPS6026340B2 (ja) サンプリング画像の高密度予測復元法
JPH065881B2 (ja) 二値化処理装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030506