JP6080586B2 - 文字認識システム、文字認識プログラム及び文字認識方法 - Google Patents

文字認識システム、文字認識プログラム及び文字認識方法 Download PDF

Info

Publication number
JP6080586B2
JP6080586B2 JP2013025232A JP2013025232A JP6080586B2 JP 6080586 B2 JP6080586 B2 JP 6080586B2 JP 2013025232 A JP2013025232 A JP 2013025232A JP 2013025232 A JP2013025232 A JP 2013025232A JP 6080586 B2 JP6080586 B2 JP 6080586B2
Authority
JP
Japan
Prior art keywords
character
recognition
font
display
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013025232A
Other languages
English (en)
Other versions
JP2014154066A (ja
JP2014154066A5 (ja
Inventor
輝夫 相原
輝夫 相原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Findex Inc
Original Assignee
Findex Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2013025232A priority Critical patent/JP6080586B2/ja
Application filed by Findex Inc filed Critical Findex Inc
Priority to KR1020157018711A priority patent/KR102024127B1/ko
Priority to EP13875167.2A priority patent/EP2958055A4/en
Priority to SG11201506275XA priority patent/SG11201506275XA/en
Priority to PCT/JP2013/059508 priority patent/WO2014125658A1/ja
Priority to CN201380072613.XA priority patent/CN104981819A/zh
Priority to MYPI2015702473A priority patent/MY173006A/en
Publication of JP2014154066A publication Critical patent/JP2014154066A/ja
Priority to US14/826,163 priority patent/US9639970B2/en
Publication of JP2014154066A5 publication Critical patent/JP2014154066A5/ja
Application granted granted Critical
Publication of JP6080586B2 publication Critical patent/JP6080586B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/39Control of the bit-mapped memory

Description

本発明は、文字認識システムに関する。
従来から、紙に印刷された文字を光学的に読み取って認識するための光学文字認識システムが提供されており、例えば、下記特許文献1,2に開示されている。
一方、下記特許文献3に開示されているように、システム間やアプリケーション間でデータの受け渡しを行うために、コンピュータのディスプレイ上に表示された文字を、画面キャプチャによる画像データを介して認識するといった需要がある。
特開2008−305126号公報 特開2010−26805号公報 特開2011−81537号公報
しかし、紙に印刷された文字と比較して、ディスプレイ上の表示文字は、ドット解像度が粗いため、従来の光学文字認識の手法を採用しても、認識率が大きく低下してしまう場合があった。特に、表示データ量を増やすために用いられる小さな文字サイズの文字については、認識率が極端に低くなってしまう。
本発明は、このような課題に鑑みてなされたものであり、コンピュータのディスプレイ上に表示される文字を高い確率で認識することの可能な文字認識システムを提供することを目的とする。
上記課題を解決するために、本発明に係る文字認識システムは、コンピュータのディスプレイ上に表示される文字を認識するための文字認識システムにおいて、所定の表示フォント及び文字サイズの組み合わせについて、当該表示フォント及び文字サイズを有する各文字の構成ドットの配置に関する情報を有する認識辞書を記録しておく記憶装置と、前記ディスプレイ上に表示される認識対象文字の画像データを画面キャプチャによりビデオメモリから取得し、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字の表示フォント及び文字サイズの取得を行うフォントチェック部と、前記ディスプレイ上に表示される前記認識対象文字の画像データを画面キャプチャにより前記ビデオメモリから取得し、前記認識辞書を参照して前記フォントチェック部が取得した前記認識対象文字の表示フォント及び文字サイズと同一の表示フォント及び文字サイズの組み合わせの認識辞書を用いて、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字を特定する文字認識部と、を備えることを特徴とする。
また、本発明に係る文字認識プログラムは、ディスプレイ上に表示される文字をコンピュータに認識させるための文字認識プログラムにおいて、所定の表示フォント及び文字サイズの組み合わせについて、当該表示フォント及び文字サイズを有する各文字の構成ドットの配置に関する情報を有する認識辞書を作成する認識辞書作成ステップと、前記ディスプレイ上に表示される認識対象文字の画像データを画面キャプチャによりビデオメモリから取得し、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字の表示フォント及び文字サイズの取得を行うフォントチェックステップと、前記ディスプレイ上に表示される前記認識対象文字の画像データを画面キャプチャにより前記ビデオメモリから取得し、前記認識辞書を参照して、前記フォントチェックステップにおいて取得された前記認識対象文字の表示フォント及び文字サイズと同一の表示フォント及び文字サイズの組み合わせの認識辞書を用いて、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字を特定する文字認識ステップと、を前記コンピュータに実行させることを特徴とする。
また、本発明に係る文字認識方法は、コンピュータのディスプレイ上に表示される文字を認識するための文字認識方法において、所定の表示フォント及び文字サイズの組み合わせについて、当該表示フォント及び文字サイズを有する各文字の構成ドットの配置に関する情報を有する認識辞書を作成する認識辞書作成工程と、前記ディスプレイ上に表示される認識対象文字の画像データを画面キャプチャによりビデオメモリから取得し、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字の表示フォント及び文字サイズの取得を行うフォントチェック工程と、前記ディスプレイ上に表示される前記認識対象文字の画像データを画面キャプチャにより前記ビデオメモリから取得し、前記認識辞書を参照して、前記フォントチェック工程において取得された前記認識対象文字の表示フォント及び文字サイズと同一の表示フォント及び文字サイズの組み合わせの認識辞書を用いて、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字を特定する文字認識工程と、を備えることを特徴とする。
本発明によれば、コンピュータのディスプレイ上に表示された解像度の低い文字であっても高精度に文字認識を行うことができる。
図1は、本発明の実施形態に係る文字認識システムの構成を概略的に示す模式図である。 図2は、本発明の実施形態に係る認識辞書の内容を示す図である。 図3は、本発明の実施形態に係る文字認識システムの機能を概略的に示すブロック図である。 図4は、本発明の実施形態に係る認識辞書の作成処理の流れを示すフローチャートである。 図5は、本発明の実施形態に係る文字認識の処理の流れを示すフローチャートである。 図6は、本発明の実施形態に係る文字認識の処理を説明するための図である。
以下、図面を参照しながら、本発明の実施形態である文字認識システムについて詳細に説明する。図1は、本実施形態に係る文字認識システムの構成を概略的に示す模式図である。図2は、本実施形態に係る認識辞書の内容を示す図である。図3は、本実施形態に係る文字認識システムの機能を概略的に示すブロック図である。
図1に示すように、文字認識システム1は、コンピュータ本体10と、コンピュータ本体10からの出力情報を表示する表示装置であるディスプレイ30と、コンピュータ本体10に情報を入力するためのキーボードやマウス等の入力装置32とを備える。
本実施形態に係る文字認識システム1は、ディスプレイ30上に表示された文字を認識するためのシステムであり、文字認識の際に、光学的な文字認識ではなく、文字を構成する構成ドットの配置に関する情報が完全に一致するか否かにより文字の特定を行うことを特徴としている。本実施形態では、アプリケーションAによるディスプレイ30上の表示ウィンドウ内の所定の認識対象領域に表示された表示文字を認識する場合を例に挙げて説明する。
コンピュータ本体10は、各種演算を行うためのCPU(Central
Processing Unit)等の演算装置11と、各種情報を記憶するためのHDD(Hard Disc
Drive)や演算処理のワークエリアとして使用されるRAM(Random Access Memory)等の記憶装置12とを備えている。
記憶装置12は、コンピュータ本体10にインストールされているOS(オペレーティングシステム)、文字認識プログラム、認識辞書作成プログラム、フォントチェックプログラム、アプリケーションA等の各種プログラムを格納しておくプログラム格納部121と、文字認識をする際に使用される認識辞書を格納しておく認識辞書DB122と、フォントチェックのためのフォントチェック用辞書DB123と、ディスプレイ30上に表示する画面内容を一時的に保持するビデオメモリ125とを備えている。
プログラム格納部121に関して、文字認識プログラムは、後述する文字認識処理を実行するためのプログラム、認識辞書作成プログラムは、後述する認識辞書の作成処理を実行するためのプログラムである。また、フォントチェックプログラムは、認識辞書の作成や文字認識の際に、認識対象文字の表示フォント及び文字サイズの情報を取得するためのプログラムである。
認識辞書DB122には、表示フォント及び文字サイズの組み合わせ毎に認識辞書が作成されて記録されている。認識辞書の認識辞書レコードの内容について、図2を参照しながら説明する。認識辞書DB122内の各レコードは、「辞書ID」、「表示フォント」、「文字サイズ」、「文字コード」、「外枠内ドット配置」、「外枠サイズ」、「外枠位置」の項目を備えている。
「辞書ID」は、各認識辞書の識別子であり、同一の表示フォント及び文字サイズの組み合わせであれば同じ識別子となり、表示フォントと文字サイズの少なくとも一方が異なれば異なる識別子となる。「表示フォント」、「文字サイズ」及び「文字コード」は、当該レコードの作成元となった文字のフォント、サイズ、文字コードである。
「外枠内ドット配置」は、辞書作成元の文字を構成する全ての構成ドットを含む最小矩形外枠内のドット配置位置の情報である。例えば、黒色ドットが配置された場所を「1」、配置されていない空白場所を「0」として、矩形外枠内の左上から右下に向けて各行毎に「00110101110000」といった形式で記録される。
「外枠サイズ」は、上記最小矩形外枠の縦横のサイズ情報(ドット数)である。「外枠位置」は、ベースライン(標準最下線)から上記最小矩形外枠の下辺までの距離である。本実施形態では、「外枠内ドット配置」、「外枠サイズ」、「外枠位置」の項目が、文字の構成ドットの配置に関する情報に相当する。
フォントチェック用辞書DB123内に記録されているフォントチェック用辞書は、認識辞書の作成や文字認識の際に認識対象文字の表示フォント及び文字サイズの情報を取得するための辞書である。フォントチェック用辞書は、例えば、「あいうえお」等の所定のチェック用の数種類の文字についてのみ、コンピュータ本体10にインストールされている全てのフォントの全てのサイズに関する上記認識辞書と同じ情報を有している。
続いて、図3を参照しながら、文字認識システム1の機能について説明する。同図に示すように、文字認識システム1は、ディスプレイ30上に表示される表示文字の表示フォント及び文字サイズを認識する機能を有するフォントチェック部20と、上述した認識辞書を予め作成する機能を有する辞書作成部21と、文字認識を行う機能を有する文字認識部25とを備えている。
これら各部の機能は、演算装置11が、プログラム格納部121に格納されているフォントチェックプログラム、認識辞書作成プログラム、文字認識プログラムを実行することで実現される。
続いて、認識辞書DB122に記録される認識辞書の作成処理の流れについて、さらに、図4を参照しながら説明する。図4は、本実施形態に係る認識辞書の作成処理の流れを示すフローチャートである。
認識辞書の作成は、後述する文字認識処理に先立って行われ、辞書作成部21は、これから認識する認識対象文字の表示フォント及び文字サイズの組み合わせについての認識辞書を作成する。もちろん、同一の表示フォント及び文字サイズの組み合わせに関して既に認識辞書が作成されている場合には、再度辞書の作成を行う必要は無く、既に登録されている認識辞書を用いれば良い。
認識辞書の作成時には、コンピュータ本体10において、認識辞書作成プログラムが実行される。まず、S11において、認識辞書を作成する表示フォント及び文字サイズの取得が行われる。この文字サイズ等の取得は、フォントチェックプログラムを起動して行われる。
ここで作成される認識辞書は、アプリケーションAの表示ウィンドウ内の所定の認識対象領域内に表示される認識対象文字の表示フォント及び文字サイズの組み合わせの認識辞書であるため、フォントチェックプログラムは、フォントチェック用辞書DB123内に記録されているフォントチェック用辞書を参照しながら、この認識対象文字の表示フォント及び文字サイズを自動的に特定する。
具体的には、フォントチェック部20が、画面キャプチャによりビデオメモリ125から認識対象文字の画像データを取得し、フォントチェック用辞書DB123を参照しながら、認識対象文字を構成するドットの配置情報と完全に一致する文字を抽出する。これにより、認識対象文字と同一フォント及び同一サイズの文字が特定され、認識対象領域に表示される文字の表示フォント及び文字サイズの情報を取得することができる。
なお、このフォントチェック用辞書DB123を参照して文字を抽出する処理は、後述する文字認識の処理と同じであるため、詳細な説明は省略する。また、フォントチェック用辞書は、チェック用の数種類の文字についてのみの辞書であるため、フォントチェックの際には、認識対象文字として、このチェック用の文字が認識対象領域内に表示されるように、予めオペレータが文字を入力しておく等の作業が必要である。
従来の光学文字認識と異なり、本実施形態では、文字の構成ドットの配置位置が同一であるか否かにより文字の認識を行っており、表示フォントや文字サイズが異なれば別の文字と認識されてしまう。このため、認識辞書も表示フォント及び文字サイズの組み合わせ毎に、別々の認識辞書を作成する必要がある。なお、S11のフォントチェックは、可能であるならばオペレータが手動で設定するようにしても良い。
続いて、S12に進み、S11で取得した表示フォント及び文字サイズの文字を順次ディスプレイ30(ビデオメモリ125)上に表示させる。ここで表示させる文字は、当該表示フォント及び文字サイズを有してコンピュータ本体10にインストールされている全ての文字である。具体的には、表示フォントによって異なるが、例えば、JIS非漢字、JIS第一漢字、JIS第二漢字に含まれる全ての文字である。
最初の文字が表示されると、S13において、外枠の設定が行われる。この外枠は、表示された文字を構成する全ての構成ドットを含む最小の矩形外枠である。続いて、S14において、外枠内のドットの配置に関する情報と共に、認識辞書レコードが認識辞書DB122内に登録される。具体的な認識辞書レコードの内容は、上述した、「辞書ID」、「表示フォント」、「文字サイズ」、「文字コード」、「外枠内ドット配置」、「外枠サイズ」、「外枠位置」の情報となる。
続いて、S15では、当該表示フォント及び文字サイズの組み合わせに関する全ての文字について辞書登録が終了したか否かが判定され、まだ登録されていない文字がある場合には、S12に戻り、S12〜S14の処理を繰り返し、次の文字について辞書登録を行う。S15において、全ての文字について辞書登録されたと判断された場合には、当該表示フォント及び文字サイズの組み合わせについての認識辞書の登録が終了する。
この認識辞書の作成は、コンピュータ本体10のOSが有する全ての表示フォントの全ての文字サイズに関して予め行っておく必要はなく、文字認識を行う際に、認識対象領域内に表示される文字の表示フォント及び文字サイズの組み合わせを有する文字の全てについて認識辞書を作成すれば良い。
続いて、本実施形態における文字認識の処理の流れについて、図5及び図6を参照しながら説明する。図5は、本実施形態に係る文字認識の処理の流れを示すフローチャートである。図6は、本実施形他に係る文字認識の処理を説明するための図である。
まず、S21において、認識対象文字の表示フォント及び文字サイズの取得が行われる。この文字サイズ等の取得は、フォントチェックプログラムを起動して行われ、上述したS11と同じ処理である。また、認識辞書の作成に引き続いて文字認識処理を行う場合には、S11により既に表示フォント及び文字サイズの取得が行われているので、S21を省略しても良い。
この表示フォント及び文字サイズの取得により、認識辞書DB122内に記録されている認識辞書のうち、今回の文字認識で使用される認識辞書が決定される。
続いて、S22において、認識対象文字の外枠設定が行われる。具体的には、ビデオメモリ125からアプリケーションAの認識対象領域の画像データを取得し、当該領域内に表示されている文字毎に分割したうえで、文字毎に各文字の全ての構成ドットが含まれる最小の矩形外枠を設定する。図6は、文字毎に最小矩形外枠を設定した様子を示している。
S23では、「外枠サイズ」の情報による文字の絞り込み(一次スクリーニング)が行われる。すなわち、認識辞書に含まれる文字のうち、認識対象文字に設定された外枠のサイズと同じサイズを有する文字が抽出される。
続いて、S24では、S23でのスクリーニングにより文字が一つに特定されたか否かが判定される。一次スクリーニングにより一つの文字に絞られた場合には、認識対象文字がその文字であると特定することができるため、文字認識処理は終了する。
S24において、特定されていないと判断された場合には、S25に進み、「外枠内ドット配置」の情報による文字の絞り込み(二次スクリーニング)が行われる。すなわち、一次スクリーニングにより抽出された文字のうち、認識対象文字に設定された外枠内のドット配置位置と同じ配置位置を持つ文字が抽出される。
続いて、S26では、S25でのスクリーニングにより文字が一つに特定されたか否かが判定され、特定された場合には、文字認識は終了し、そうでない場合には、S27に進み、三次スクリーニングが行われる。例えば、認識対象文字が、「’」又は「,」の文字の場合には、「外枠サイズ」及び「外枠内ドット配置」が同じになるため、S27へと進むことになる。S27では、「外枠位置」の情報により文字の絞り込みが行われ、文字が特定される。
認識対象領域内に複数の文字が含まれている場合には、文字毎にS23〜S27を繰り返して行えば良い。また、S21のフォントチェックにより、認識対象領域内に複数の表示フォント及び文字サイズの組み合わせがあった場合には、複数の認識辞書を参照しながら文字認識を行えば良い。
また、上述したスクリーニングの順序は適宜変更しても良い。また、上記実施形態では、最小矩形外枠を設定したうえで、「外枠サイズ」、「外枠位置」、「外枠内ドット配置」を用いて文字認識を行ったが、文字認識のための「文字を構成するドットの配置に関する情報」としては、種々の他の情報を用いることができ、例えば、外枠内の1ライン目の黒ドットの数等を用いることができる。
以上、本実施形態に係る文字認識システムについて説明したが、本実施形態によれば、ディスプレイ30上に表示された表示文字の認識を、文字を構成するドットの配置情報に基づいて行うことでほぼ100%の認識率により文字認識を行うことができる。
本実施形態に係る認識対象文字は、コンピュータのディスプレイ30(ビデオメモリ125)上に表示される文字であり、紙に印刷された文字のように汚れたり欠けたりすることがないため、ドットの配置情報に基づけば、確実に文字を特定することが可能である。
但し、文字の表示フォントや文字サイズが異なれば、ドット配置も異なるため、本実施形態による文字認識の場合には、予め認識対象文字の表示フォント及び文字サイズを把握したうえで、同一の表示フォント及び文字サイズの組み合わせによる認識辞書を作成し、文字認識処理を実行する必要がある。
また、本実施形態のように、文字を構成するドットの配置情報を複数用い、段階的にスクリーニングを行うことで、文字認識の処理負荷を低減させ、高速で効率的な文字認識を行うことができる。
続いて、本実施形態変形例について説明する。まず、ディスプレイ30上の表示文字がアンチエイリアス処理されている文字の場合には、上述したフォントチェック、認識辞書の作成、文字認識等の処理を行う前に、文字の画像データから指定彩度以外、指定明度以外のドットを同じ基準で減算するようすれば、アンチエイリアス処理の影響を除外した文字認識を行うことが可能である。
また、ディスプレイ30上の表示文字が、下線、太文字等の文字修飾が施された文字の場合には、認識辞書及びフォントチェック用辞書を作成する際に、同じ文字修飾を施した文字の認識辞書レコードも追加で作成しておくことで、修飾された文字についても確実に文字認識を行うことができる。
また、半角文字が含まれている場合であっても半角文字の認識辞書を作成しておくことで、確実に文字認識を行うことが可能である。
以上、本発明の実施の形態について説明したが、本発明の実施の形態は、上記実施形態に限定されるものではなく、本発明の主旨を逸脱しない範囲内でさらに種々の変形が可能である。例えば、上記実施形態では、単一のコンピュータで文字認識システムを実現しているが、複数のコンピュータによる分散処理で実現しても良い。
1 文字認識システム
10 コンピュータ本体
11 演算装置
12 記憶装置
121 プログラム格納部
122 認識辞書DB
123 フォントチェック用辞書DB
125 ビデオメモリ
20 フォントチェック部
21 辞書作成部
25 文字認識部
30 ディスプレイ
32 入力装置

Claims (5)

  1. コンピュータのディスプレイ上に表示される文字を認識するための文字認識システムにおいて、
    所定の表示フォント及び文字サイズの組み合わせについて、当該表示フォント及び文字サイズを有する各文字の構成ドットの配置に関する情報を有する認識辞書を記録しておく記憶装置と、
    前記ディスプレイ上に表示される認識対象文字の画像データを画面キャプチャによりビデオメモリから取得し、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字の表示フォント及び文字サイズの取得を行うフォントチェック部と、
    前記ディスプレイ上に表示される前記認識対象文字の画像データを画面キャプチャにより前記ビデオメモリから取得し、前記認識辞書を参照して前記フォントチェック部が取得した前記認識対象文字の表示フォント及び文字サイズと同一の表示フォント及び文字サイズの組み合わせの認識辞書を用いて、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字を特定する文字認識部と、
    を備えることを特徴とする文字認識システム。
  2. 前記フォントチェック部が取得した前記認識対象文字の表示フォント及び文字サイズと同一の表示フォント及び文字サイズを有する文字を前記ビデオメモリ上に順次表示させながら、各文字の構成ドットの配置に関する情報を取得して前記認識辞書を作成する辞書作成部を備えることを特徴とする請求項1記載の文字認識システム。
  3. 前記記憶装置は、チェック用の文字についてのみ前記コンピュータにインストールされている全てのフォントの全てのサイズに関する構成ドットの配置に関する情報を有するフォントチェック用辞書を記録しており、
    前記フォントチェック部は、前記フォントチェック用辞書を参照しながら前記認識対象文字の表示フォント及び文字サイズの取得を行うことを特徴とする請求項1又は2記載の文字認識システム。
  4. ディスプレイ上に表示される文字をコンピュータに認識させるための文字認識プログラムにおいて、
    所定の表示フォント及び文字サイズの組み合わせについて、当該表示フォント及び文字サイズを有する各文字の構成ドットの配置に関する情報を有する認識辞書を作成する認識辞書作成ステップと、
    前記ディスプレイ上に表示される認識対象文字の画像データを画面キャプチャによりビデオメモリから取得し、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字の表示フォント及び文字サイズの取得を行うフォントチェックステップと、
    前記ディスプレイ上に表示される前記認識対象文字の画像データを画面キャプチャにより前記ビデオメモリから取得し、前記認識辞書を参照して、前記フォントチェックステップにおいて取得された前記認識対象文字の表示フォント及び文字サイズと同一の表示フォント及び文字サイズの組み合わせの認識辞書を用いて、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字を特定する文字認識ステップと、
    を前記コンピュータに実行させることを特徴とする文字認識プログラム。
  5. コンピュータのディスプレイ上に表示される文字を認識するための文字認識方法において、
    所定の表示フォント及び文字サイズの組み合わせについて、当該表示フォント及び文字サイズを有する各文字の構成ドットの配置に関する情報を有する認識辞書を作成する認識辞書作成工程と、
    前記ディスプレイ上に表示される認識対象文字の画像データを画面キャプチャによりビデオメモリから取得し、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字の表示フォント及び文字サイズの取得を行うフォントチェック工程と、
    前記ディスプレイ上に表示される前記認識対象文字の画像データを画面キャプチャにより前記ビデオメモリから取得し、前記認識辞書を参照して、前記フォントチェック工程において取得された前記認識対象文字の表示フォント及び文字サイズと同一の表示フォント及び文字サイズの組み合わせの認識辞書を用いて、当該認識対象文字の構成ドットの配置に関する情報と完全に一致するか否かにより前記認識対象文字を特定する文字認識工程と、
    を備えることを特徴とする文字認識方法。
JP2013025232A 2013-02-13 2013-02-13 文字認識システム、文字認識プログラム及び文字認識方法 Active JP6080586B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2013025232A JP6080586B2 (ja) 2013-02-13 2013-02-13 文字認識システム、文字認識プログラム及び文字認識方法
EP13875167.2A EP2958055A4 (en) 2013-02-13 2013-03-29 CHARACTER DETECTING SYSTEM, CHARACTER RECOGNITION PROGRAM AND CHARACTER RECOGNITION METHOD
SG11201506275XA SG11201506275XA (en) 2013-02-13 2013-03-29 Character recognition system, character recognition program and character recognition method
PCT/JP2013/059508 WO2014125658A1 (ja) 2013-02-13 2013-03-29 文字認識システム、文字認識プログラム及び文字認識方法
KR1020157018711A KR102024127B1 (ko) 2013-02-13 2013-03-29 문자인식 시스템, 문자인식 프로그램 및 문자인식방법
CN201380072613.XA CN104981819A (zh) 2013-02-13 2013-03-29 字符识别系统、字符识别程序以及字符识别方法
MYPI2015702473A MY173006A (en) 2013-02-13 2013-03-29 Character recognition system, character recognition program, and character recognition method
US14/826,163 US9639970B2 (en) 2013-02-13 2015-08-13 Character recognition system, character recognition program and character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013025232A JP6080586B2 (ja) 2013-02-13 2013-02-13 文字認識システム、文字認識プログラム及び文字認識方法

Publications (3)

Publication Number Publication Date
JP2014154066A JP2014154066A (ja) 2014-08-25
JP2014154066A5 JP2014154066A5 (ja) 2016-01-14
JP6080586B2 true JP6080586B2 (ja) 2017-02-15

Family

ID=51353681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013025232A Active JP6080586B2 (ja) 2013-02-13 2013-02-13 文字認識システム、文字認識プログラム及び文字認識方法

Country Status (8)

Country Link
US (1) US9639970B2 (ja)
EP (1) EP2958055A4 (ja)
JP (1) JP6080586B2 (ja)
KR (1) KR102024127B1 (ja)
CN (1) CN104981819A (ja)
MY (1) MY173006A (ja)
SG (1) SG11201506275XA (ja)
WO (1) WO2014125658A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6269256B2 (ja) * 2014-03-31 2018-01-31 京セラドキュメントソリューションズ株式会社 情報処理装置、画像形成装置、情報処理方法、及び情報処理プログラム
JP7087829B2 (ja) * 2018-08-27 2022-06-21 富士通株式会社 情報処理装置、書込制御プログラム、及び書込制御方法
KR102643324B1 (ko) * 2020-10-29 2024-03-07 닛폰세이테츠 가부시키가이샤 식별 장치, 식별 방법 및 프로그램

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106882A (ja) * 1986-10-24 1988-05-11 Tokyo Keiki Co Ltd 活字文字認識装置の文字フオント決定方式
JPH03214377A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
US5781914A (en) * 1995-06-30 1998-07-14 Ricoh Company, Ltd. Converting documents, with links to other electronic information, between hardcopy and electronic formats
JPH0922442A (ja) * 1995-07-04 1997-01-21 Advantest Corp イメージ・ドキュメント資料の電子管理システム
JP3382071B2 (ja) * 1995-09-13 2003-03-04 株式会社東芝 文字コード取得装置
JPH1196289A (ja) * 1997-09-19 1999-04-09 Nec Corp 画面データ変換装置及び方法
US6151423A (en) * 1998-03-04 2000-11-21 Canon Kabushiki Kaisha Character recognition with document orientation determination
US6473517B1 (en) * 1999-09-15 2002-10-29 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
JP4566740B2 (ja) * 2002-08-07 2010-10-20 パナソニック株式会社 携帯端末装置
JP3990253B2 (ja) * 2002-10-17 2007-10-10 埼玉日本電気株式会社 携帯電話装置
JP3945778B2 (ja) * 2004-03-12 2007-07-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 設定装置、プログラム、記録媒体、及び設定方法
CN100356390C (zh) * 2004-09-24 2007-12-19 北京中星微电子有限公司 一种显示操作终端进行光符识别的方法
JP2008071214A (ja) * 2006-09-15 2008-03-27 Kochi Univ Of Technology 文字認識辞書作成方法及びその装置及び文字認識方法及びその装置及びプログラムを格納した記憶媒体
JP2008305126A (ja) 2007-06-07 2008-12-18 Seiko Epson Corp 文字認識方法および文字認識システム
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US7929764B2 (en) * 2007-06-15 2011-04-19 Microsoft Corporation Identifying character information in media content
CN101419661B (zh) 2007-10-26 2011-08-24 国际商业机器公司 基于图像中的文本进行图像显示的方法和系统
JP2010026805A (ja) 2008-07-18 2010-02-04 Denso Corp 文字認識装置及び文字認識方法
US20100128994A1 (en) 2008-11-24 2010-05-27 Jan Scott Zwolinski Personal dictionary and translator device
JP5493807B2 (ja) * 2009-02-04 2014-05-14 株式会社リコー 画像通信装置、画像通信システム及び制御プログラム
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
JP5469985B2 (ja) 2009-10-06 2014-04-16 株式会社ピーエスシー データ受渡方法及び汎用データ取得方法

Also Published As

Publication number Publication date
US20150356764A1 (en) 2015-12-10
US9639970B2 (en) 2017-05-02
KR20150116821A (ko) 2015-10-16
EP2958055A4 (en) 2016-09-21
CN104981819A (zh) 2015-10-14
SG11201506275XA (en) 2015-09-29
KR102024127B1 (ko) 2019-09-23
JP2014154066A (ja) 2014-08-25
EP2958055A1 (en) 2015-12-23
WO2014125658A1 (ja) 2014-08-21
MY173006A (en) 2019-12-18

Similar Documents

Publication Publication Date Title
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
US9436882B2 (en) Automated redaction
US20130181995A1 (en) Handwritten character font library
CN109726369B (zh) 一种基于标准文献的智能模板化题录技术实现方法
CN106202058B (zh) 反映排印文字中的手写体属性的设备和方法
JP6080586B2 (ja) 文字認識システム、文字認識プログラム及び文字認識方法
US10679091B2 (en) Image box filtering for optical character recognition
US20120163718A1 (en) Removing character from text in non-image form where location of character in image of text falls outside of valid content boundary
JP2019057311A (ja) 帳票情報認識装置および帳票情報認識方法
US20170154023A1 (en) Information processing system, control method for information processing system, information processing apparatus, and storage medium
JP2014154066A5 (ja)
JP6390858B2 (ja) グラフィックエレメントおよびテキストエレメントを含む2つのデータの比較装置および比較方法
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP2016517037A (ja) ディスプレイ装置及びその文字出力方法
JP2019057115A (ja) 帳票情報認識装置および帳票情報認識方法
US9075776B2 (en) Document processing apparatus, document processing method, and program
CN109409370B (zh) 一种远程桌面字符识别方法和装置
JP2021111157A (ja) 情報処理装置、及び情報処理プログラム
GB2473228A (en) Segmenting Document Images
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2014078168A (ja) 文字認識装置及びプログラム
JP2010061449A (ja) 原画像探索装置及び原画像探索プログラム
US10659654B2 (en) Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document
WO2014203905A2 (ja) 符号抽出方法、符号抽出装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151124

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170117

R150 Certificate of patent or registration of utility model

Ref document number: 6080586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350