JP2007226803A - 希な複数文字のクラスタに対して品質プロトタイプとしての合成リガチャーを生成するシステムおよび方法 - Google Patents

希な複数文字のクラスタに対して品質プロトタイプとしての合成リガチャーを生成するシステムおよび方法 Download PDF

Info

Publication number
JP2007226803A
JP2007226803A JP2007040953A JP2007040953A JP2007226803A JP 2007226803 A JP2007226803 A JP 2007226803A JP 2007040953 A JP2007040953 A JP 2007040953A JP 2007040953 A JP2007040953 A JP 2007040953A JP 2007226803 A JP2007226803 A JP 2007226803A
Authority
JP
Japan
Prior art keywords
ligature
prototype
prototypes
character
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007040953A
Other languages
English (en)
Inventor
Dennis G Nicholson
デニス・ジイ・ニコルソン
Robert Filippini
ロバート・フィリッピーニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adobe Inc
Original Assignee
Adobe Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adobe Systems Inc filed Critical Adobe Systems Inc
Publication of JP2007226803A publication Critical patent/JP2007226803A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1914Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

【課題】希な複数文字のクラスタに対して品質プロトタイプとしての合成リガチャーを生成することによって、スキャン画像の品質を向上させる方法およびシステムを提供する。
【解決手段】スキャン文書内で2つ以上の接触する文字を含むリガチャーを識別する方法であって、前記リガチャーの前記2つ以上の接触する文字が複数のプロトタイプと比較されて2つ以上の合致するプロトタイプを識別する。次いで合成リガチャーが前記2つ以上の合致するプロトタイプに基づいて生成される。
【選択図】図1

Description

本出願は、一実施形態による、希な複数文字(sparse multi-character)のクラスタに対して品質プロトタイプとしての合成リガチャーを生成することによって、スキャン画像の品質を向上させる方法およびシステムに関する。
現在、スキャンされた文書、すなわちスキャン文書が現代の団体間の通信文のかなりの部分を占めている。しかし、これらスキャン文書の品質には、スキャナの品質、選択したスキャンの解像度、元の文書の品質など様々な要因によって相当な幅がある。スキャン文書の品質があまりにも劣る場合、読むのが困難あるいは不可能なこともある。
スキャン文書に特定な問題は、2つ以上の接触する文字(touching characters)であるリガチャーの発生である。例えば、「f」はしばしば「i」と接触して「fi」リガチャーを作り、また2つの「f」が接触して「ff」リガチャーになる。視覚的により高品質の文書を生成しようと試みて、より視覚的に魅力ある文字を生成するために、スキャン画像に何らかの処理を施すことができる。しかし、一般にはスキャン文書中にリガチャーを描出したスキャン画像が滅多にないことから、より視覚的に魅力あるリガチャーを生成することは難しい。その結果が、視覚的に調和に欠ける魅力のない文書となる。
例示的な一態様によれば、スキャン文書の品質を向上させる方法が提供される。スキャン文書が受け取られ、そのスキャン文書内のリガチャーが識別される。この場合、リガチャーは2つ以上の接触する文字を含む。複数のプロトタイプが、識別されたリガチャーの1つまたは複数の接触する文字と比較され、2つ以上の合致するプロトタイプを識別する。次いで、そのリガチャーに対して、2つ以上の合致するプロトタイプに基づいて、合成リガチャーが生成される。
他の特徴は、添付の図面および以下の詳細な説明から明らかとなろう。
添付の図面の諸図に限定でなく例示のために実施形態が示され、同じ参照番号は同様の要素を示す。
以下の説明では、説明の目的で、本発明の一実施形態の包括的理解を提供するために多数の具体的詳細が示される。しかし、本発明がそうした具体的詳細なしでも実行されてよいことは当業者には明らかであろう。例示的な一実施形態では、グリフがタイプ文字(タイプ・キャラクタ)の一意の特徴的形態あるいは表現である。グリフの真の形態は、その輪郭を正確に定義する1組の式である。タイプ文字(以下、「キャラクタ・タイプ」と代替可能)は、名付けられた、あるいは分類されたグリフ(例えば、文字「a」)である。リガチャーは、2つ以上の接触するタイプ文字のグリフである。ブロブ(blob)は、1つまたは複数のグリフのスキャン画像であり、リガチャーのスキャン画像を含んでいる。クラスタはブロブの集合(例えば、類似のブロブ)である。希な複数文字クラスタは、僅かなブロブ(例えば10またはそれ以下。この閾値は設定可能である)を含むクラスタであり、これはリガチャーに相当している。プロトタイプは、クラスタの理想化された表現である。フォントは、(例えば、共通のタイプフェイス・デザインやサイズ(例えば、12ポイント、Helvetica Bold)をもつ)タイプ文字の集合である。合成フォントは、スキャンされたグリフから抽出されたフォントである。合成フォントは、未知の「ノーマル」フォントによって生成されてもよく、各クラスタから抽出された分類されたプロトタイプ(例えば、文字「a」の理想化された変形形態)を含んでもよい。スキャン画像は、文書撮像デバイス(例えば、スキャナ)によって生成されるデータである。次いでスキャン画像のデータが処理されて、元の文書の視覚的表現を生成するのに使用される。
例示的な一実施形態では、スキャン文書を基にするスキャンしたグリフ画像(ブロブ)の自動分析を用いて合成フォントが抽出され、この合成フォントを用いて、より高品質テキストをもつ元の文書の知覚的に劣化のない複製を生成する。スキャン画像が、ごく稀にしか生じることのないリガチャー(例えば、2つ以上の接触するタイプ文字)である場合でも、元の文書に見られるそのリガチャーの元の間隔と向き(spacing and orientation)をなお失わず、元のリガチャーのより高品質な複製である合成フォントが生成される。この例示的な実施形態では、この自動化された手順によって、例えば、フォトコピー、ファックス、スキャンを何度も繰り返すことによって生じることのある元の文書の歪みに対応できる。
図1は、例示的な一実施形態による、スキャン文書の高品質(例えば、知覚的に劣化のない)バージョンを生成するように構成されたシステム100を示す構成図である。システム100は、合成フォント生成器102を含み、この合成フォント生成器が、プロトタイプ・モジュール104とクラスタ・モジュール106を含む。クラスタ・モジュール106が、データ記憶デバイス110からスキャン文書108を受け取る。一実施形態では、スキャン文書108は、スキャナ・アプリケーション114や任意選択でOCR(光学式文字認識)アプリケーション115によって処理された元の文書112から生成される。OCRアプリケーション115は、コンピュータ・ソフトウェアに実装され、スキャナ・アプリケーション114によってキャプチャされてよく、タイプされたテキストの画像(例えば、グリフ)を機械で編集可能なテキストに変換する、あるいは文字の画像をそれらを表す標準符号化方式(ASCIIあるいはUnicode)に変換するように構成されている。
スキャン文書108は、グリフのスキャン画像を表す、ブロブの形式でのデータで構成される。2つ以上の接触する文字から成るグリフ、すなわちリガチャーであるブロブもあってよい。クラスタ・モジュール106は、スキャン画像からブロブを抽出し、視覚的に類似のブロブをクラスタにグループ分けする。図2は、ブロブ、クラスタ、プロトタイプの例を示す。クラスタ202とクラスタ206は各々、ブロブ・セット204とブロブ・セット208をそれぞれ含む。クラスタ210はブロブ212を含み、これは2つの接触する文字によって示されるリガチャーである。
一実施形態では、クラスタ・モジュール106が、マッチング・アルゴリズム(matching algorithm)109を利用して、各ブロブをスキャン文書のその他のブロブと比較して、各クラスタを生成する。マッチング・アルゴリズム109は、対のグリフの共通グリッド上でのオーバーレイを含み、両方のグリフが同じ色(例えば、黒)を有する、グリッド・セルの百分比を計算する。リガチャーも同様にしてグループ化されるが、リガチャーの生じる可能性が低いため、クラスタ中にリガチャーが1つ程度と僅かであろう。スキャン文書108内のブロブをつき合わせるマッチング・アルゴリズム109には多数のアルゴリズムが存在していることは理解されるであろう。どのアルゴリズムを実装するかは、ハードウェアおよび/またはソフトウェアの機能などの要因に基づいた設計上の選択である。
クラスタ・モジュール106がクラスタ202、206、210を生成すると、プロトタイプ・モジュール104が各クラスタについてプロトタイプ集合105を生成する。例えば、クラスタ・モジュール106が、それぞれクラスタ210、202、206からのプロトタイプ213、214、216で構成されるプロトタイプ集合105を生成する。一実施形態では、プロトタイプ・モジュール104が、1つまたは複数の複製アルゴリズム103を用いて各クラスタのブロブ(例えば、単一の文字またはリガチャー)を処理して、個々のブロブのどれよりも元のグリフの真の姿のより正確な複製であるプロトタイプを生成する。他の実施形態では、クラスタ内のブロブ数が最小閾値を越える場合、プロトタイプ・モジュール104が、1つまたは複数の複製アルゴリズム103を用いてクラスタのブロブを処理するだけである。プロトタイプ・モジュール104は、単一タイプ文字クラスタやリガチャーのクラスタに対してカウント・オペレーションを実施して、各クラスタ内のタイプ文字とリガチャーの総数を決定する。次いでプロトタイプ・モジュールは、各クラスタの総数が閾値107を越える(例えば、一クラスタで50ブロブ以上)場合、1つまたは複数の複製アルゴリズム103を使用して各クラスタを処理して、各プロトタイプを生成する。より高品質なリガチャー(例えば、合成リガチャー218)の生成についての詳細は、以下でさらに詳細に論じられる。
様々な実施形態で、最小閾値は設定可能であり、かつ/またはプロトタイプを生成するのにどの選択されたプロトタイプ・アルゴリズムが使用されるかに基づく。例えば、クラスタ内のブロブ数が30を越える場合、プロトタイプ・モジュール104は、そのクラスタの各ブロブ(例えば、クラスタ202のブロブ・セット204の)を、中心軸と境界位置(例えば、各ブロブの左下角)に合わせてアラインさせるかオーバーレイさせ、プロトタイプを生成するために各ブロブのピクセル毎の比較を実施する。ブロブの半数以上が共通のピクセルをもつ場合、プロトタイプ・モジュール104はそのピクセルをプロトタイプに加える。同様の分析が、プロトタイプが完成するまで、クラスタ内のブロブの対応するピクセルすべてに対してなされる。プロトタイプを生成する例示的なアルゴリズムは、最適なブロブ・アラインメントを達成するか、プロトタイプの各ピクセルの黒さが、対応する黒のピクセルをもつグリフの百分比を反映する灰色プロトタイプの生成を達成する部分的なピクセル・シフトの使用を含む。例えば、オーバレイさせた40のグリフのうち30がグリッド・セルに黒のピクセルをもつ場合、対応するプロトタイプのピクセルのシェードは75パーセントの黒さである。
元のグリフの真の形態のより正確な複製であるプロトタイプを生成するアルゴリズムが多数存在してよいことは理解されるであろう。どのアルゴリズムが使用されるかは、ハードウェアおよび/またはソフトウェアの機能などの要因に基づいた設計上の選択である。
図2に戻ると、プロトタイプ・モジュール104が、上記で説明したように、クラスタ202のブロブ・セット204を処理して、ブロブ・セット204のブロブの真の形態の高品質な複製であるプロトタイプ214(「e」)を生成する。同様にして、プロトタイプ・モジュール104は、クラスタ206のブロブ・セット208を処理して、プロトタイプ216を生成する。しかし、クラスタが僅かな数のブロブしか含まない場合、例えばクラスタ210のブロブ212で表されているような、希な複数文字(例えば、リガチャー)のクラスタの場合、生成されるプロトタイプ213は、1つまたは複数のブロブそれ自体(元のリガチャー)とほとんど変わらないノイズのある品質のものとなるので、限られた値をもつことになる。このことは一般にリガチャーに当てはまる。スキャン文書中にリガチャーが生じることがごく稀だからである。
一実施形態では、希な複数文字のリガチャーを克服するために、プロトタイプ・モジュール104が、リガチャーの2つ以上のタイプ文字(またはキャラクタ・タイプ、例えば、文字「e」)を識別し合成リガチャー(例えば、合成リガチャー218)を生成して、リガチャーで識別されたのと同じタイプ文字に一致する、先に生成されたプロトタイプに基づいて、不適切なプロトタイプ(例えば、プロトタイプ213)と取り換える。一実施形態では、プロトタイプ・モジュール104が、スキャン文書108のOCRデータに基づいて、各プロトタイプを、そのキャラクタ・タイプ(例えば、「e」「c」など)に従って分類する。言い換えると、クラスタ内のブロブ(例えば、ブロブ・セット204やブロブ212(リガチャー))のタイプ文字は、スキャン文書108やスキャナ・アプリケーション114によって、各プロトタイプの生成より先に知られ、それにしたがってプロトタイプ・モジュール104は各プロトタイプを分類する。例えば、プロトタイプ214はタイプ文字「e」に分類され、プロトタイプ216はタイプ文字「c」に分類され、プロトタイプ213は「ec」リガチャーに分類される。
他の実施形態では、プロトタイプ・モジュール104が、OCRアプリケーション115によって提供されるのと同様のOCR処理を各プロトタイプに適用して、各プロトタイプのタイプ文字またはリガチャータイプ文字を識別、分類する。同一のタイプ文字に対して複数のクラスタが存在してよいことに留意されたい。例えば、タイプ・スタイル(例えば、太さ(boldness))、ページの歪み(page skew)、コピー機でのスケーリングなど物理的属性やそれに関連した属性値に基づいて、タイプ文字「a」に3つの変形形態があることがある。したがって、「a」の各変形形態それぞれが、処理されてタイプ文字「a」の各変形形態に対応する3つの一意のプロトタイプを生成する一意のクラスタをもつ。
一実施形態では、リガチャーのタイプ文字が識別された後、プロトタイプ・モジュール104が部分的テンプレート・マッチングを使用して、リガチャーで識別された各タイプ文字(例えば、「e」と「c」)を類似のプロトタイプの集合につき合わせる。プロトタイプ・モジュール104は、部分的テンプレート・マッチングを使用するとき、リガチャーの各タイプ文字の幾何学的特徴を各プロトタイプの幾何学的特徴と、合致が見つかるまで比較する。例えば、幾何学的特徴は、文字のピクセル値、文字寸法値、リガチャー・ピクセル値、リガチャー寸法値など属性値をもつ文字属性、プロトタイプ属性、リガチャー属性などを含む。合致は、例えばオーバーレイ、あるいはその他のかかる比較アルゴリズムによって決定される。例えば、「ec」リガチャー(例えば、プロトタイプ213)は、左端とベースラインをもち、これらが共に部分的テンプレート・マッチングで、リガチャーの「e」の上にプロトタイプ「e」(例えば、プロトタイプ214)の最初の位置を決定する(例えば、プロトタイプとリガチャーの左端やベースラインを揃える)。しかし、これは各「e」のピクセルのほとんどを揃えるに足るだけ正確な配置とならないことがある。例示的な一実施形態では、プロトタイプ・モジュール104が、例えば1または2ピクセル垂直および/または水平方向に最初の位置を調整することによって多数の配置を試みてよい。
他の実施形態では、プロトタイプ・モジュール104は、(左端とベースラインを用いる)初期配置を使用し、ピクセルをXOR(排他的OR)の対称差で検査する。高機能になると、多数の配置を試みるのではなく、初期配置を注意深く検査することで、その後の配置を試すのにどちらの方向にシフトすべきかが示唆される。例えば、プロトタイプ214が(リガチャーの)プロトタイプ213にオーバレイされる場合、プロトタイプ213に相対するプロトタイプ214の端が検査されて、正確なアラインメントを達成するにはプロトタイプ214の配置をどちらの方向に調整すべきか決定される。プロトタイプ214の垂直面の端がプロトタイプ213の垂直面の端と完全に揃う場合、このことは申し分のない水平アラインメントを示すことになる。一方、プロトタイプ214の垂直面の端がプロトタイプ213の垂直面の端より右(左)にある場合、このことはプロトタイプ214が左(右)に移動されなければならないことを示している。この一辺の端を検査することによって、カウンタH(水平インデックス)は申し分のない水平アラインメントを示すために増分され、カウンタxPはプロトタイプ214が(プロトタイプ213に対して)右に移動されなければならないことを示すために増分され、あるいはカウンタxNはプロトタイプ214が左に移動されなければならないことを示すために増分される。同様に、カウンタV(垂直インデックス)は申し分のない垂直アラインメントを示すために増分され、カウンタyPはプロトタイプ214が(プロトタイプ213に対して)上に移動されなければならないことを示すために増分され、カウンタyNはプロトタイプ214が下に移動されなければならないことを示すために増分される。次いで、これらのカウンタは、各ブロブの相対する端の他の部分の位置をさらに検査するに当たって調整されてもよい。
他の実施形態では、プロトタイプ214が、プロトタイプ213に、それぞれの左端とベースラインを用いてオーバレイされ、プロトタイプ214のある黒ピクセルがプロトタイプ213の白ピクセルの上にある場合、またプロトタイプ213の白ピクセルの隣8つを検査して右に2つ黒ピクセルがあるとわかった場合、このことは初期配置が1ピクセル右に移動されなければならないことを示唆していることになる。このようにして、上記で論じたように、カウンタxP、xN、yP、yNが計算され、それぞれ水平あるいは垂直方向に1ピクセル移動することを示唆する。また、ある種のピクセル検査は、それ以上の水平または垂直方向への移動が生じないことを示唆する。例えば、プロトタイプ214の1列内に0、1、1(オフ、オン、オンを意味する)の3つの連続するピクセルがある場合、そしてプロトタイプ213の対応するピクセルも同じである場合、水平カウンタH(Hインデックス)は増分されて「水平方向を固定する」位置になってよい。
一実施形態では、HおよびVインデックスが以下のように計算される。カウンタHが初期化されて0になる。プロトタイプ(例えば、プロトタイプ214)の水平移行ピクセルは、その左または右のどちらかのピクセルがオフになっている、オンのピクセルである。例えば、プロトタイプ214の水平移行ピクセルPがプロトタイプ213の水平ピクセルP’の上にある場合、またPの左のピクセルがP’の左のピクセルに一致する場合(例えば、どちらもオン、あるいはどちらもオフ)、なおかつPの右のピクセルがP’の右のピクセルに一致する場合、Hは増分される。Vインデックスも同様に計算される。
したがって、水平安定度インデックスHおよび垂直安定度インデックスVが計算され、このことはxP、xN、yP、yNと共に、その後の配置を(あるのであれば)どちらの方向に試すべきかを示唆する。この処理を1、2度繰り返すことで、リガチャー・ブロブが、各プロトタイプに対応する断片にどのように切り分けられてよいかを示唆することができる。次いでプロトタイプの重心が、各断片の重心とアラインされて正確な位置決めが行われる。リガチャーとプロトタイプを比較するアルゴリズムが多数存在してよいことは理解できるであろう。どのアルゴリズムが使用されるかは、ハードウェアおよび/またはソフトウェアの機能などの要因に基づいた設計上の選択である。
上記で論じたように、単一のタイプ文字に対して(複数のクラスタから)複数のプロトタイプがあってよい。その結果、プロトタイプ・モジュール104は、各プロトタイプをリガチャーの対応する識別されたタイプ文字と比較する。例えば、(3つの一意のクラスタから)3つのプロトタイプが文字「e」について生成された場合、プロトタイプ・モジュール104が、各「e」プロトタイプをリガチャー内で識別された「e」と比較する。次いで3つのプロトタイプのうちでもっとも合致する「e」が選択されて、合成リガチャーの「e」の部分が表される。同様にして、プロトタイプ・モジュール104は、部分テンプレート・マッチングを用いてリガチャーの残りのタイプ文字を他のプロトタイプとつき合わせる。
図2に戻ると、合成リガチャー218が、例示的な一実施形態に従って、テンプレート・マッチングを用いて合成リガチャーを生成したプロトタイプ・モジュール104の結果を示す。上記で論じたように、プロトタイプ・モジュール104が、プロトタイプ214とプロトタイプ216を生成し、それらをそれぞれ「e」と「c」に(例えば、OCRデータによって)分類する。ブロブ212は、プロトタイプ・モジュール104によって「ec」リガチャーと(例えば、OCRデータによって)識別され、上記で説明したように、テンプレート・マッチングを用いて、同じタイプ文字のプロトタイプをブロブ212のリガチャーの対応する文字とつき合わせる。プロトタイプ214(「e」)とプロトタイプ216(「c」)がもっとも合致していると決定した後、プロトタイプ・モジュール104は2つのプロトタイプを合成リガチャー218(「ec」)に組み合わせる。その結果は、スキャン文書108内の希な複数文字のリガチャーを基にしているにも関わらず、合成リガチャー218のより高品質なリガチャーとなる。
他の実施形態では、部分テンプレート・マッチングが、リガチャーの文字をスキャン文書108から抽出した元のブロブ(文字)とつき合わせるプロトタイプ・モジュール104を含んでいる。例えば、上記で説明したマッチング・アルゴリズムのいずれかを用いて、ブロブ・セット208(「c」)のブロブをブロブ212の対応するリガチャーの文字(「c」)とつき合わせる。プロトタイプ・モジュール104が、リガチャーの各文字について合致を決定すると、プロトタイプ・モジュール104は、クラスタ206から生成されたプロトタイプ216(「c」)とプロトタイプ214(「e」)を用いて、合成リガチャー218(「ec」)を生成する。
合成リガチャー(例えば、合成リガチャー218)は、2つ以上の文字を含むが、これは単一の合成フォント要素とも考えられる。他の実施形態では、部分テンプレート・マッチングの後、プロトタイプ・モジュール104が、合成リガチャーを2つの個々のつき合わせ用プロトタイプに分け、任意選択で、そのプロトタイプを、元のリガチャー(例えば、ブロブ212)の向きおよび/または幾何学的特徴に従ってページ上に設定する。
スキャン文書108を描出するプロトタイプや合成リガチャーがすべて生成された後、プロトタイプ・モジュール104は、対応する位置データ118を伴う合成フォント・ライブラリ116を生成する。位置データ118は、例えば、絶対ページ座標(例えば、プロトタイプの左下ピクセルといった参照ピクセルの座標)、あるいはプロトタイプの配置に対する前の文字やローカル・ベースラインからの相対座標を含むデータを含む。
一実施形態では、文書表示アプリケーション120は、ページ表示モジュール122を利用して、合成フォント・ライブラリ116のより高品質な文字を用いて、スキャン文書108の元の空間的向きとの知覚的な合致を失うことなく、新しい文書を生成する。新しい文書を生成するために、一実施形態によれば、ページ表示モジュール122が合成フォント・ライブラリ116や位置データ118にアクセスし、Adobe(登録商標)PostScript、Hewlett−Packard(登録商標)PCL(Printer Control Language)、および Microsoft(登録商標)XML (Extensible Markup Language)Paper Specificationなどページ記述言語(PDL)を用いて、新しい文書を割り付ける。次いで文書表示アプリケーション120は、PDLを解釈して新しい文書の視覚的表現をユーザ・ディスプレイ(図示せず)上に生成する。
図3Aは、スキャン文書(例えば、スキャン文書108)の一部を表すスキャン画像から成る画像300を示す。画像300は、タイプ文字ブロブやリガチャー・ブロブの例を含む。ブロブ302はタイプ文字「e」、ブロブ304はタイプ文字「t」、ブロブ306は2つの接触する「f」から成るリガチャー、ブロブ308は接触する「e」と「c」から成るリガチャーである。ブロブの境界を検査することによって、粗悪な画像品質が確認できる。例えば、ブロブ308(リガチャー)の境界310は、その全般的に粗い境界に加えて、タイプ文字「e」がタイプ文字「c」に接触しているのを示している。
上記で説明したように、例示的な一実施形態では、合成フォント生成器102が、各ブロブの幅(例えば、幅312)など位置データ118をキャプチャする。このデータは、スキャン文書108の外観をより正確に再生するために、ページ表示モジュール122によって使用される。
図3Bは、図3Aで示したスキャン文書の一部の新しい画像350を示す。一実施形態では、文書表示アプリケーション120が、プロトタイプ・モジュール104によって生成された合成フォント・ライブラリ116と位置データ118に基づいて新しい画像を生成する。合成フォント313、314、316、318は、本明細書で説明するシステムと方法によって生成された、図3Aに示したブロブに比して品質の向上した合成フォントを表す。例えば、合成フォント318の境界320は、画像300の対応するブロブ308の境界310に対して向上した例を示す。一実施形態では、合成フォント・ライブラリ116を生成する際、プロトタイプ・モジュール104が、生成されたプロトタイプと合成リガチャーの元の寸法を維持する。例えば、ブロブ308の幅312が、対応する合成フォント318の幅322に維持される。また、例示的な一実施形態では、寸法をもつ合成フォントを伴うスキャン文書108の元のタイプ文字の位置が複製されて、スキャン文書108のそれと視覚的に合致する文書を生成するように、文書表示アプリケーション120が、位置データ118を用いて各合成フォント(例えば、合成フォント318)を新しい画像350内に置く。
図4は、例示的な一実施形態による、合成フォント・ライブラリ116とブロブ位置データ118の生成に基づいてスキャン文書を再構築する方法400を示す流れ図である。以下で説明する各処理を詳細に述べた特定の例示的な実施形態が、図1、2、3を参照しながら上記で論じられてきたことに留意されたい。
オペレーション402に移ると、スキャン文書のページ画像が処理されてブロブを抽出する。ブロブは、オペレーション404で、類似性に応じてクラスタにグループ分けされる。オペレーション406でクラスタが処理されて、各クラスタに描出されたブロブの真の姿のより高品質な複製であるプロトタイプを生成する。一実施形態では、オペレーション408で、各プロトタイプ(例えば、文字やリガチャーの)が、どのタイプ文字(例えばタイプ文字「e」)にそれぞれがマッチするかに応じて分類される。他の実施形態では、もっと早い段階のオペレーション(図示せず)で、プロトタイプが、類似のブロブから成る各クラスタになされた分類に従って分類される。
オペレーション410で、プロトタイプが希な複数文字のプロトタイプ(例えば、リガチャー「ec」)である場合、オペレーション412で合成リガチャーが生成される(例えば、図5を参照)。プロトタイプが、希な複数文字のプロトタイプでない場合は、オペレーション414で、オペレーション412で生成された合成リガチャーと共に、合成フォント・ライブラリ116が生成される。合成フォント・ライブラリ116は、分類された単一の文字のプロトタイプと合成リガチャーから成る。最後に、オペレーション416で、スキャン文書が合成フォント・ライブラリ116を用いて再構築されて、元のスキャン文書に知覚的に類似のより高品質な文書を生成する。
図5は、例示的な一実施形態による、合成リガチャーを生成する方法500を示す流れ図である。以下で説明する各処理を詳細に述べた特定の例示的な実施形態が、図1、2、3を参照しながら上記で論じられてきたことに留意されたい。
オペレーション502に移ると、一実施形態では、単一文字のプロトタイプのシーケンスが、生成されたプロトタイプとそのそれぞれの分類(例えば、タイプ文字)に基づいて生成される。他の実施形態では、単一文字のプロトタイプ・シーケンスが、類似のブロブの生成された各クラスタの代表的なブロブに基づいて生成される。
オペレーション504で、単一文字のプロトタイプ・シーケンスの要素が、希な複数文字のプロトタイプの対応する部分と比較される。オペレーション506で、希な複数文字のプロトタイプのすべての部分が合致している場合、処理が完了し、オペレーション512で合成リガチャーが生成される。そうでない場合は、他の単一文字のプロトタイプ・シーケンスを用いて処理が繰り返される。単一文字のプロトタイプ・シーケンスがすべて試されると、オペレーション508で決定がなされて、もっとも近い合致を使用して(オペレーション510)、オペレーション512で合成リガチャーを生成する。
図6は、コンピュータ・システム600の例示的な形態での機械の図を示しており、この機械において、本明細書で論じる1つまたは複数の手順をこの機械に実施させる命令セットが実行される。他の実施形態では、機械はスタンドアローン・デバイスとして動作するか、あるいは他の機械に接続(ネットワーク化)されてもよい。ネットワークに配置された場合、機械は、サーバ・クライアント・ネットワーク環境でサーバまたはクライアント機械の機能で動作するか、あるいはピア・トゥ・ピア(すなわち分散)ネットワーク環境でピア機械として動作する。機械はパーソナル・コンピュータ(PC)でも、タブレットPCでも、セット・トップ・ボックス(STB)でも、携帯情報端末(PDA)でも、携帯電話でも、ウェブ家電でも、ネットワーク・ルータ、交換器、もしくはブリッジでも、あるいはその機械のとる行動を指定する(順次または他のやり方の)命令セットを実行できればどんな機械であってもよい。また、単一の機械だけが示されているが、用語「機械」は、個別で、または合わせて1つの(あるいは複数の)命令セットを実行して本明細書で論じる1つまたは複数の方法を実施する機械のいかなる集合をも含むと受け取られてよい。
例示的なコンピュータ・システム600は、プロセッサ602(例えば、中央演算処理ユニット(CPU)、グラフィック処理ユニット(GPU)、あるいはその両方)、メインメモリ604、スタティックメモリ606を含み、これらはバス608を介してお互いに通信する。コンピュータ・システム600はさらに、ビデオ表示ユニット610(例えば、液晶ディスプレイ(LCD)またはシェード極線管(CRT))を含む。コンピュータ・システム600はまた、英数字入力デバイス612(例えば、キーボード)、ユーザ・インターフェース(UI)ナビゲーション・デバイス614(例えば、マウス)、ディスク・ドライブ・ユニット616、信号発生デバイス618(例えば、スピーカ)、ネットワーク・インターフェース・デバイス620を含む。
ディスク・ドライブ・ユニット616は機械可読媒体622を含み、そこに、本明細書で説明したあらゆる1つまたは複数の手順または関数を実施する、またはそれに利用される1つまたは複数の命令セットやデータ構造(例えば、ソフトウェア624)が格納される。ソフトウェア624はまた、コンピュータ・システム600によってそれが実行されている間、完全に、または少なくとも部分的に、メインメモリ604および/またはプロセッサ602内に常駐してよく、メインメモリ604とプロセッサ602もまた機械可読媒体を構成する。
ソフトウェア624はさらに、ネットワーク626を介して、ネットワーク・インターフェース・デバイス620によって、数多くのよく知られた転送プロトコル(例えば、HTTP)の任意の1つを利用して、送信または受信される。
例示的な一実施形態で、機械可読媒体622が単一の媒体として示されているが、用語「機械可読媒体」は、1つまたは複数の命令セットを格納する単一の媒体または複数の媒体(例えば、集中型または分散型データベース、および/または関連するキャッシュおよびサーバ)を含むと受け取られなければならない。用語「機械可読媒体」はまた、機械によって実行される命令セットを格納、符号化、あるいは携行することが可能であり、本発明のあらゆる1つまたは複数の手順をも機械に実施させる、あるいはかかる命令セットによって利用される、またはそれに関連するデータ構造を格納、符号化、あるいは携行することが可能な任意の有形の媒体を含むと受け取られたい。したがって用語「機械可読媒体」は、ただしそれだけには限らないが、固体メモリ、光学式および磁気媒体、搬送波信号を含むと受け取られたい。
以上、諸実施形態が特定の例を参照しながら説明されてきたが、これらの実施形態に対して、本発明の広範な趣旨および範囲を逸脱することなく様々な修正および変更がなされてよいことは明らかであろう。したがって、本明細書および図面は、限定ではなく説明的な意味において見なされなければならない。
例示的な一実施形態における、スキャン文書のより高品質で知覚的に劣化のないバージョンを生成するために使用されるシステムを示す図である。 例示的な一実施形態によるブロブ、クラスタ、プロトタイプの例を示す図である。 A:例示的な一実施形態による、スキャン文書の一部を描出したスキャン画像を示す図と、B:例示的な一実施形態に従って生成された、図3Aに示すスキャン文書の一部の新しい画像の例を示す図である。 例示的な一実施形態による、合成フォント・ライブラリとブロブ位置データの生成に基づいてスキャン文書を再構築する方法を示す流れ図である。 例示的な一実施形態による、合成リガチャーを生成する方法を示す流れ図である。 当該機械に本明細書で論じられる1つまたは複数の手順を実施させる命令セットが実行されるコンピュータ・システムの例示的な形態での機械を示す図である。
符号の説明
100 システム、102 合成フォント生成器、103 複製アルゴリズム、104 プロトタイプ・モジュール、105 プロトタイプ集合、106 クラスタ・モジュール、107 閾値、108 スキャン文書、109 マッチング・アルゴリズム、110 データ記憶デバイス、112 元の文書、114 スキャナ・アプリケーション、115 OCRアプリケーション、116 合成フォント・ライブラリ、118 位置データ、120 文書表示アプリケーション、122 ページ表示モジュール

Claims (34)

  1. スキャン文書内の2つ以上の接触する文字を含むリガチャーを識別するステップと、
    複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別するステップと、
    前記2つ以上の合致するプロトタイプに基づいて合成リガチャーを生成するステップとを含む方法。
  2. 前記スキャン文書内の類似のスキャン画像を複数のクラスタにグループ分けするステップと、
    前記複数のクラスタのうちの1つのクラスタに対してプロトタイプを生成するステップであって、前記プロトタイプが前記クラスタの類似のスキャン画像を処理することに基づく、前記ステップとをさらに含む請求項1に記載の方法。
  3. 前記クラスタのスキャン画像の属性が知られているキャラクタ・タイプとリガチャー・タイプと比較することに基づいて、キャラクタ・タイプあるいはリガチャー・タイプに従って前記クラスタを分類するステップをさらに含む請求項2に記載の方法。
  4. 前記スキャン文書に関連する光学式文字認識(OCR)データを用いて、前記クラスタをタイプ文字あるいはリガチャーとして分類するステップをさらに含む請求項2に記載の方法。
  5. 前記スキャン文書に関連する光学式文字認識(OCR)データを用いて、前記プロトタイプをタイプ文字あるいはリガチャーとして分類するステップをさらに含む請求項2に記載の方法。
  6. 前記複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別するステップが、
    前記リガチャーの前記2つ以上の接触する文字に対応する2つ以上のタイプ文字を識別するステップと、
    識別された2つ以上のタイプ文字を前記複数のプロトタイプの対応するプロトタイプとつき合わせて前記2つ以上の合致するプロトタイプを識別するステップとをさらに含む請求項2に記載の方法。
  7. それぞれの単一タイプ文字とそれぞれ生成された各合成リガチャーに対応するプロトタイプから合成フォント・ライブラリを生成するステップをさらに含む請求項6に記載の方法。
  8. 前記合成フォント・ライブラリを用いて、前記スキャン文書に対応する新しい画像を生成するステップをさらに含む請求項7に記載の方法。
  9. 前記クラスタの前記類似のスキャン画像を処理して前記プロトタイプを生成するステップが、前記クラスタの前記スキャン画像に関連する1つまたは複数の属性値を平均化するステップをさらに含む請求項2に記載の方法。
  10. 前記1つまたは複数の属性値が、文字ピクセル値、文字寸法値、リガチャー・ピクセル値、およびリガチャー寸法値のうちの少なくとも1つを含む請求項9に記載の方法。
  11. 前記クラスタの特定のスキャン画像がリガチャーである場合、かつ前記クラスタのスキャン画像の数が最小閾値を越える場合、前記合成リガチャーを生成するステップが、前記クラスタの前記スキャン画像に関連する1つまたは複数の属性値を平均化するステップをさらに含む請求項10に記載の方法。
  12. 前記複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別するステップが、
    前記複数のプロトタイプのうちの1つのプロトタイプを前記合成リガチャーの前記2つ以上の文字のうちの第1の文字にオーバーレイさせるステップと、
    前記プロトタイプと前記リガチャーの前記第1の文字のそれぞれのピクセルを、ピクセル毎に検査するステップとをさらに含む請求項1に記載の方法。
  13. 前記オーバレイされたプロトタイプと前記第1の文字との間で共通するピクセルを検査してカウンタxP、xN、yP、yNを計算し、かつ垂直と水平安定度インデックスを計算するステップと、
    カウンタxP、xN、yP、yN、および垂直と水平安定度インデックスを用いて、前記オーバレイされたプロトタイプの前記合成リガチャー内の配置を決定するステップとによって、
    前記第1の文字の配置を計算するステップをさらに含む請求項12に記載の方法。
  14. スキャン文書内の2つ以上の接触する文字からなるリガチャーを識別し、複数のプロトタイプから、前記リガチャーの2つ以上の接触する文字に対応する2つ以上の合致するプロトタイプをつき合わせるクラスタ・モジュールと、
    前記2つ以上の合致するプロトタイプから合成リガチャーを生成するプロトタイプ・モジュールとを含むシステム。
  15. 前記スキャン文書内の類似のスキャン画像を複数のクラスタにグループ分けするクラスタ・モジュールと、
    前記複数のクラスタのうちの1つのクラスタに対してプロトタイプを生成するプロトタイプ・モジュールであって、前記プロトタイプが前記クラスタの類似のスキャン画像を処理することに基づくプロトタイプ・モジュールとをさらに含む請求項14に記載のシステム。
  16. 前記クラスタ・モジュールが、前記クラスタのスキャン画像の属性を知られているキャラクタ・タイプとリガチャー・タイプとを比較することに基づいて、キャラクタ・タイプあるいはリガチャー・タイプに従って前記類似のスキャン画像のクラスタを分類することになる請求項15に記載のシステム。
  17. 前記クラスタ・モジュールが、前記スキャン文書に関連する光学式文字認識(OCR)データに基づいて、前記類似のスキャン画像のクラスタをタイプ文字あるいはリガチャーとして分類することになる請求項15に記載のシステム。
  18. 前記クラスタ・モジュールが、前記スキャン文書に関連する光学式文字認識(OCR)データに基づいて、前記プロトタイプをタイプ文字あるいはリガチャーとして分類することになる請求項15に記載のシステム。
  19. 前記複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別する前記プロトタイプ・モジュールが、
    前記リガチャーの前記2つ以上の接触する文字に対応する2つ以上のタイプ文字を識別し、
    識別された2つ以上のタイプ文字を対応する分類されたプロトタイプとつき合わせて前記2つ以上の合致するプロトタイプを識別するプロトタイプ・モジュールをさらに含む請求項18に記載のシステム。
  20. 前記プロトタイプ・モジュールが、それぞれの単一タイプ文字およびそれぞれ生成された合成リガチャーに対応するプロトタイプから合成フォント・ライブラリを生成することになる請求項19に記載のシステム。
  21. 前記合成フォント・ライブラリを用いて、前記スキャン文書に対応する新しい画像を生成するページ表示モジュールをさらに含む請求項20に記載のシステム。
  22. 前記クラスタの前記類似のスキャン画像を処理して前記プロトタイプを生成する前記プロトタイプ・モジュールが、前記クラスタの前記スキャン画像に関連する1つまたは複数の属性値を平均化することになる請求項15に記載のシステム。
  23. 前記1つまたは複数の属性値が、文字ピクセル値、文字寸法値、リガチャー・ピクセル値、リガチャー寸法値のうちの少なくとも1つを含む請求項22に記載のシステム。
  24. 前記クラスタの特定のスキャン画像がリガチャーである場合、かつ前記クラスタのスキャン画像の数が閾値を越える場合、前記合成リガチャーを生成する前記プロトタイプ・モジュールが、前記クラスタの前記スキャン画像に関連する1つまたは複数の属性値を平均化することになる請求項23に記載のシステム。
  25. 複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別する前記プロトタイプ・モジュールが、
    前記複数のプロトタイプのうちの1つのプロトタイプを前記合成リガチャーの2つ以上の文字のうちの第1の文字に、前記第1の文字の1つまたは複数の端に基づく初期配置を用いてオーバーレイし、
    前記プロトタイプと前記リガチャーの前記第1の文字のそれぞれのピクセルを、ピクセル毎に検査するプロトタイプ・モジュールをさらに含む請求項14に記載のシステム。
  26. 前記合致した文字の最良の配置を計算する前記プロトタイプ・モジュールが、
    前記オーバレイされたプロトタイプと前記リガチャーの前記文字との間で共通するピクセルを検査してカウンタxP、xN、yP、yNを計算し、かつ垂直と水平安定度インデックスを計算し、
    カウンタxP、xN、yP、yN、および垂直と水平安定度インデックスを用いて、前記オーバレイされたプロトタイプの前記合成リガチャー内の配置を決定し、前記配置が前記スキャン文書内の前記リガチャーの元の配置に近似する請求項25に記載のシステム。
  27. 機械によって実行されるとき、
    スキャン文書内の2つ以上の接触する文字であるリガチャーを識別することと、
    複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別することと、
    前記2つ以上の合致するプロトタイプに基づいて合成リガチャーを生成することと
    を含むオペレーションを前記機械に実施させる命令を実装する有形の機械可読媒体。
  28. 前記複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別することが、
    前記複数のプロトタイプのうちの1つのプロトタイプを前記合成リガチャーの前記2つ以上の文字のうちの第1の文字にオーバーレイすることと、
    前記プロトタイプと前記リガチャーの前記第1の文字のそれぞれのピクセルを、ピクセル毎に検査することとをさらに含む請求項27に記載の有形の機械可読媒体。
  29. 前記スキャン文書内の類似のスキャン画像を、複数のクラスタにグループ分けすることと、
    前記複数のクラスタのうちの1つのクラスタに対してプロトタイプを生成することであって、前記プロトタイプが前記クラスタの前記類似のスキャン画像を処理することに基づくこととをさらに含む請求項27に記載の有形の機械可読媒体。
  30. 前記クラスタのスキャン画像の属性を知られているキャラクタ・タイプとリガチャー・タイプとを比較することに基づいて、キャラクタ・タイプあるいはリガチャー・タイプに従って、前記クラスタを分類することをさらに含む請求項29に記載の有形の機械可読媒体。
  31. 前記複数のプロトタイプを前記リガチャーの前記2つ以上の接触する文字と比較して2つ以上の合致するプロトタイプを識別することが、
    前記リガチャーの前記2つ以上の接触する文字に対応する2つ以上のタイプ文字を識別することと、
    識別された2つ以上のタイプ文字を前記複数のプロトタイプの対応するプロトタイプとつき合わせて前記2つ以上の合致するプロトタイプを識別することとをさらに含む請求項29に記載の有形の機械可読媒体。
  32. それぞれの単一タイプ文字とそれぞれ生成された各合成リガチャーに対応するプロトタイプから合成フォント・ライブラリを生成することをさらに含む請求項31に記載の有形の機械可読媒体。
  33. 前記合成フォント・ライブラリを用いて、前記スキャン文書に対応する新しい画像を生成することをさらに含む請求項32に記載の有形の機械可読媒体。
  34. スキャン文書内の2つ以上の接触する文字であるリガチャーを識別する手段と、
    前記リガチャーの前記2つ以上の接触する文字を複数のプロトタイプとつき合わせて対応する2つ以上の合致するプロトタイプを識別する手段と、
    前記2つ以上の合致するプロトタイプから合成リガチャーを生成する手段と
    を含むコンピュータ・システム。
JP2007040953A 2006-02-21 2007-02-21 希な複数文字のクラスタに対して品質プロトタイプとしての合成リガチャーを生成するシステムおよび方法 Withdrawn JP2007226803A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/359,199 US7873228B2 (en) 2006-02-21 2006-02-21 System and method for creating synthetic ligatures as quality prototypes for sparse multi-character clusters

Publications (1)

Publication Number Publication Date
JP2007226803A true JP2007226803A (ja) 2007-09-06

Family

ID=38428246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007040953A Withdrawn JP2007226803A (ja) 2006-02-21 2007-02-21 希な複数文字のクラスタに対して品質プロトタイプとしての合成リガチャーを生成するシステムおよび方法

Country Status (2)

Country Link
US (1) US7873228B2 (ja)
JP (1) JP2007226803A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009070033A1 (en) * 2007-11-30 2009-06-04 Lumex A/S A method for processing optical character recognition (ocr) output data, wherein the output data comprises double printed character images
US20130077856A1 (en) * 2011-09-23 2013-03-28 General Electric Company Processes and systems for training machine typesets for character recognition
JP6938408B2 (ja) * 2018-03-14 2021-09-22 株式会社日立製作所 計算機及びテンプレート管理方法
US11610046B2 (en) * 2019-10-29 2023-03-21 Adobe Inc. Automatic generation of responsive font effects based on font elements

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5313840A (en) * 1976-07-23 1978-02-07 Hitachi Ltd Analogy calculator
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4887301A (en) * 1985-06-05 1989-12-12 Dest Corporation Proportional spaced text recognition apparatus and method
GB2281997B (en) * 1993-09-20 1997-10-15 Ricoh Kk Method and apparatus for improving a text image by using character regeneration

Also Published As

Publication number Publication date
US20070196021A1 (en) 2007-08-23
US7873228B2 (en) 2011-01-18

Similar Documents

Publication Publication Date Title
EP1999688B1 (en) Converting digital images containing text to token-based files for rendering
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US7376272B2 (en) Method for image segmentation to identify regions with constant foreground color
JP4904175B2 (ja) 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
RU2619712C1 (ru) Оптическое распознавание символов серии изображений
JPH08305803A (ja) 文字テンプレートセット学習マシン動作方法
RU2613849C1 (ru) Оптическое распознавание символов серии изображений
RU2581786C1 (ru) Определение преобразований изображения для повышения качества оптического распознавания символов
JP2010056689A (ja) 画像処理装置及び画像処理方法
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP2007226803A (ja) 希な複数文字のクラスタに対して品質プロトタイプとしての合成リガチャーを生成するシステムおよび方法
JP2008312139A (ja) 印刷装置及び印刷方法
JP2009004990A (ja) 画像形成装置および画像形成方法
JP2008028716A (ja) 画像処理方法及び装置
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
JP2009294870A (ja) 画像処理装置及び方法
JP4164458B2 (ja) 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2010218106A (ja) 画像処理装置、画像処理方法及びプログラム
Spitz Correcting for variable skew in document images
JP2021158441A (ja) 画像処理装置、画像処理方法及びプログラム
JP2019195117A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2010049587A (ja) 差分抽出装置及び差分抽出プログラム
JP2010026986A (ja) 画像形成装置
Hu et al. Document image retrieval based on multi-density features

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20070709

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100511