JP7379876B2 - 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム - Google Patents

文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム Download PDF

Info

Publication number
JP7379876B2
JP7379876B2 JP2019112238A JP2019112238A JP7379876B2 JP 7379876 B2 JP7379876 B2 JP 7379876B2 JP 2019112238 A JP2019112238 A JP 2019112238A JP 2019112238 A JP2019112238 A JP 2019112238A JP 7379876 B2 JP7379876 B2 JP 7379876B2
Authority
JP
Japan
Prior art keywords
character
candidate
document file
area
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019112238A
Other languages
English (en)
Other versions
JP2020204905A (ja
Inventor
貴之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2019112238A priority Critical patent/JP7379876B2/ja
Priority to US16/901,441 priority patent/US11146705B2/en
Publication of JP2020204905A publication Critical patent/JP2020204905A/ja
Application granted granted Critical
Publication of JP7379876B2 publication Critical patent/JP7379876B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00801Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to characteristics of the original
    • H04N1/00806According to type of the original, e.g. colour paper or transparency, or reading a plurality of different types of original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00824Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity for displaying or indicating, e.g. a condition or state
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文字認識装置、文書ファイル生成方法、文書ファイル生成プログラムに関する。
文字や画像が記されている原稿をスキャナで読み取り、光学文字認識(OCR:Optical Character Recognition/Reader)の技術を用いてテキストデータを抽出することが、日常的に行われている。
関連する技術として、検索精度を高める目的で、文字認識において複数の認識候補が得られた場合に、画像データの対応する所定区切り単位の位置または近傍に、候補となるデータを透明で生成する開示されている(例えば特許文献1)。
OCRを活用した従来技術では、もとの文字の痕跡が消去されてしまうため、誤認識が発生した場合、認識後の文書データのみではもとの文書に何が書いてあるかを判別することができなくなる。
特許文献1の技術では、誤認識の可能性のある文字については、その他の候補文字を組み入れた文書データを生成することができる。しかしながら特許文献1の技術では、文字検索に活用するため、すなわち検索でヒットさせるために候補文字を組み入れることから、候補となる文字を不可視の状態で組み入れる。よって、認識後のデータを通常のやり方で表示させ、もしくは印刷した場合、従来技術と同様にもとの文字を判別することができない。
また特許文献1の技術では、編集困難なファイル形式で文字認識後のデータを出力するため、生成した文書データに誤認識があり、利用者がこれに気付いても、容易に修正するのができない。
本発明は、OCRによる文字認識で誤認識があった場合でも、利用者にもとの文字を推測するための手がかりを与える技術を提供することを目的とする。
上記課題を解決するために、文字認識装置は、原稿を読み取って得られたスキャン画像に描かれている文字をデジタルデータに変換する文字認識装置であって、スキャン画像に対して文字認識処理を行い、認識した文字または文字列ごとに、候補となる文字または文字列と当該候補の確からしさをあらわす認識度とを対応付けたデータを生成する文字認識部と、前記文字認識部により認識された文字または文字列の候補の中から最も認識度の高い第1候補を表示し、当該第1候補よりも前記認識度が低いその他の候補を、前記第1候補とは態様を異ならせて、前記第1候補に対応付けて当該第1候補と同時に表示する形式の文書ファイルを生成する文書ファイル生成部と、を有し、前記文書ファイル生成部は、前記第1候補を第1領域に表示し、前記その他の候補を前記第1領域よりも表示面積の小さい第2領域に表示し、前記第1候補と前記その他の候補との対応付けを、前記第1領域から第2領域へと至る線分を用いて対応関係を視覚により認識可能な状態で表示する形式の文書ファイルを生成する、ことを特徴とする。
本発明によれば、OCRによる文字認識で誤認識があった場合でも、利用者にもとの文字を推測するための手がかりを与えることができる。
実施形態のシステム構成例を示す図である。 実施形態の画像形成装置の内部構成例を示すブロック図である。 実施形態のパーソナルコンピュータの内部構成例を示すブロック図である。 実施形態の画像形成装置に組み込まれている文字認識装置の機能ブロックを例示する図である。 原稿シートのスキャン後の画像、および実施形態の文字認識装置が作成する各種中間データを例示する図である。 実施形態の文字認識装置が作成する文書ファイルを表示もしくは印刷したときの画面表示例を示す図である。 実施形態の文字認識装置の全体動作例を示すフローチャートである。 実施形態の文書ファイル作成処理の動作例を示すフローチャートである。 実施形態の一文字出力処理の動作例を示すフローチャートである。
以下、本実施形態に係る文字認識装置、文書ファイル生成方法、文書ファイル生成プログラムについて、図面などを参照しながら説明する。
<システム構成>
図1は、本実施形態のシステム構成を例示する図である。システム1は、画像形成装置110、ファイルサーバ120、2つのパーソナルコンピュータであるPC140、PC150を有し、これらが通信ネットワーク190を介して相互にデータの送受信を行う構成となっている。
画像形成装置110は、原稿シートを読み取るスキャナ部231、シート上に画像を形成するプリンタ部232、および通信機能などを備えるMFP(Multifunction Peripheral)である。スキャナ部231は、ADF(Auto Document Feeder:自動原稿送り装置)が設けられている場合はADFにセットされた原稿シートを読み取る。画像形成装置110は、スキャナ部231、プリンタ部232を用いることで、コピー、プリンタ、スキャナ、ファクシミリの各機能を利用者に提供する。また操作パネル240を介して利用者から指示を受け付け、もしくは通信ネットワーク190を介してPC140、PC150から指示を受け付けることで、画像形成装置110はこれら機能を実行する。
また画像形成装置110は、光学文字認識(以下、必要に応じて単に「文字認識」、もしくは「OCR」と称する)の技術を用いて、スキャナ部231により読み取られたスキャン画像から、電子データのテキストを抽出する機能も有している。
PC140、PC150は、画像形成装置110を利用する一般ユーザが用いる端末(コンピュータ)である。
ファイルサーバ120は、画像形成装置110の読取機能によって読み取られた画像データを蓄積するサーバ(コンピュータ)である。ファイルサーバ120には、利用者ごとに専用フォルダが設けられ、当該専用フォルダ内にファイルを格納して各種データを保持する。またファイルサーバ120は、画像形成装置110のOCR機能により抽出されたテキストデータや、後述の動作によって得られる文書ファイルを格納する。
<各装置のハードウェア構成>
図2は、画像形成装置110のハードウェア構成例を示す図である。図2に示されているように、画像形成装置110は、コントローラ210、近距離通信回路220、エンジン制御部230、操作パネル240、ネットワークI/F(Interface)250を備えている。
コントローラ210は、コンピュータの主要部であるCPU201、システムメモリ(MEM-P)202、ノースブリッジ(NB)203、サウスブリッジ(SB)204、ASIC(Application Specific Integrated Circuit)206、記憶部であるローカルメモリ(MEM-C)207、HDD(Hard Disk Drive)コントローラ208、および、記憶部であるHD209を有する。またNB203とCPU201とは、SoC(System on a Chip)215により統合されている。
CPU201は、画像形成装置110の全体制御を行う制御部である。NB203は、CPU201と、MEM-P202、SB204とを接続するためのブリッジであり、MEM-P202に対する読み書きなどを制御するメモリコントローラと、PCI(Peripheral Component Interconnect)マスタおよびAGPターゲットとを有する。
MEM-P202は、コントローラ210の各機能を実現させるプログラムやデータの格納用メモリであるROM202a、プログラムやデータの展開、およびメモリ印刷時の描画用メモリなどとして用いるRAM202bとからなる。尚、RAM202bに記憶されているプログラムは、インストール可能な形式または実行可能な形式のファイルでCD-ROM、CD-R、DVD等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
SB204は、NB203とPCIデバイス、周辺デバイスとを接続するためのブリッジである。ASIC206は、画像処理用のハードウェア要素を有する画像処理用途向けのIC(Integrated Circuit)であり、PCIバス222、HDDコントローラ208およびMEM-C207をそれぞれ接続するブリッジの役割を有する。このASIC206は、PCIターゲットおよびAGPマスタ、ASIC206の中核をなすアービタ(ARB)、MEM-C907を制御するメモリコントローラ、ハードウェアロジックなどにより画像データの回転などを行う複数のDMAC(Direct Memory Access Controller)、並びに、スキャナ部231およびプリンタ部232との間でPCIバス222を介したデータ転送を行うPCIユニットからなる。尚、ASIC206には、USB(Universal Serial Bus)のインターフェースや、IEEE1394(Institute of Electrical and Electronics Engineers 1394)のインターフェースを接続するようにしてもよい。
MEM-C207は、コピー用画像バッファおよび符号バッファとして用いるローカルメモリである。HD209は、後述の動作を実行するためのプログラムや各種制御用のデータを事前に記憶したストレージであり、画像データの蓄積、印刷時に用いるフォントデータやフォームの蓄積を行う用途にも用いられる。HD209は、CPU201の制御にしたがってHD209に対するデータの読出または書込を制御する。
また、近距離通信回路220には、NFC、Bluetooth(登録商標)等の通信回路220aが備わっており、ユーザが所持しているICカードとの間でのデータ通信を実現する。ユーザがICカードを通信回路220aの近傍にかざすと、近距離通信回路220は、ICカードに記録されている各種データを読み取る。
エンジン制御部230は、スキャナ部231およびプリンタ部232の制御を行う。操作パネル240は、現在の設定値や選択画面等を表示させ、操作者からの入力を受け付けるタッチパネル等のパネル表示部240a、並びに、濃度の設定条件などの画像形成に関する条件の設定値を受け付けるテンキーおよびコピー開始指示を受け付けるスタートキー等からなる操作パネル240bを備えている。コントローラ210は、画像形成装置110全体の制御を行い、例えば、描画、通信、操作パネル240からの入力等を制御する。スキャナ部231またはプリンタ部232には、誤差拡散やガンマ変換などの画像処理部分が含まれている。
尚、画像形成装置110は、操作パネル240のアプリケーション切り替えキーにより、ドキュメントボックス機能(=スキャナ機能)、コピー機能、プリンタ機能、およびファクシミリ機能を順次に切り替えて選択することが可能となる。またドキュメントボックス機能(スキャナ機能)には、OCRにより画像からテキストを抽出し、オフィス系の各種アプリケーションで使用可能なフォーマットに変換する機能も備えられている。
また、ネットワークI/F250は、通信ネットワーク190を利用してデータ通信をするためのインターフェースである。近距離通信回路220およびネットワークI/F250は、PCIバス222を介して、ASIC206に電気的に接続されている。
図3は、PC140のハードウェア構成を示した図である。図3ではPC140を例にしているが、PC150やファイルサーバ120などのコンピュータについても同様構成となっている。
PC140はコンピュータによって構築されており、CPU301、ROM302、RAM303、HD304、HDDコントローラ305、ディスプレイ306、外部機器接続I/F308、ネットワークI/F309、データバス310、キーボード311、ポインティングデバイス312、DVD-RW(Digital Versatile Disk Rewritable)ドライブ314、メディアI/F316を備えている。
CPU301は、PC140の全体動作を制御する。ROM302は、IPL等のCPU301の駆動に用いられるプログラムを記憶する。RAM303は、CPU301のワークエリアとして使用される。HD304は、プログラム等の各種データを記憶する。HDDコントローラ305は、CPU301の制御にしたがってHD304に対する各種データの読み出しまたは書き込みを制御する。ディスプレイ306は、カーソル、メニュー、ウィンドウ、文字、または画像などの各種情報を表示する。外部機器接続I/F308は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F309は、通信ネットワーク190を利用してデータ通信をするためのインターフェースである。データバス310は、図3に示されているCPU301等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
キーボード311は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス312は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ314は、着脱可能な記録媒体の一例としてのDVD-RW313に対する各種データの読み出しまたは書き込みを制御する。尚、DVD-RWに限らず、DVD-R等、その他のメディアであってもよい。メディアI/F316は、フラッシュメモリ等の記録メディア315に対するデータの読み出しまたは書き込み(記憶)を制御する。
<本実施形態の態様>
図4は、本実施形態の文字認識装置の構成例を示すブロック図であり、図5は、図4に示す各機能部が生成するデータを例示する図である。本実施形態の文字認識装置400は、原稿を読み取って得られたスキャン画像に描かれている文字をデジタルデータに変換する装置である。文字認識装置400は画像形成装置110に組み込まれており、画像形成装置110の各種ハードウェアリソースを共用する構成となっている。また図2に示すコントローラ210が、文字認識装置400の主要部となっている。
文字認識装置400は、上記のスキャナ部231を有し、またコントローラ210が動作することで実現される前処理部401、2値化部402、文字領域抽出部403、文字認識部404、文字消去部405、文書ファイル生成部406を有している。前処理部401、2値化部402、文字領域抽出部403、文字認識部404、文字消去部405、および文書ファイル生成部406は、コントローラ210内のCPU301が、HD209に記憶されているプログラムをRAM202bに展開し、演算実行することで実現される機能部である。
スキャナ部231は、画像読取の命令を受けて、読み取り面に載置された原稿シートを読み取り、フルカラーの画像に変換して出力する。このように原稿を読み取ったフルカラーの画像をスキャン画像と称し、このスキャン画像の一例を図5(A)に示す。
前処理部401は、文字の抽出を行う上で前提となる処理をスキャン画像に対し行う。前処理部401は、例えば原稿の傾き補正、スキャナ部231の機種の差異を吸収した画像を得るための補正(シェーディング補正等)などを実施する。
前処理部401によって得られる画像は、2値化部402、および文字消去部405に引き渡され、2つのパスで処理される。2値化部402を通るパスは文字抽出のための処理となり、文字消去部405を通るパスは文字を画像から消去するためのパスとなる。
2値化部402は、前処理部401によって処理された後の画像を取得し、当該画像を2値化した2値化画像を生成する。2値化部402により生成される2値化画像は、文字領域抽出部403に引き渡される。
文字領域抽出部403は、文字部分となる矩形領域を2値化画像から抽出する処理である。文字領域抽出部403は、連続した文字列(例えば画像内の1行分の文字列)を含めた矩形領域を抽出して切出し、この矩形領域の画像(「文字部2値化画像」と称する)と、当該文字部2値化画像の画像全体での位置情報とを文字認識部404に引き渡す。また文字領域抽出部403は、文字を構成する画素の集合を2値化画像から抽出し、文字部領域情報として文字消去部405に引き渡す。
文字認識部404は、既存のOCR技術を用いて文字部2値画像に描かれている文字の認識処理を行う。文字認識部404は、最も認識度の高かった文字を第1候補として選定し、この第1候補の選定処理を文字部2値画像内に描かれている文字ごとに行う。ここで認識度は、認識の確からしさをあらわした指標値である。
文字認識部404は、認識結果として、第1候補として選定した文字をテキスト文字情報として文書ファイル生成部406に引き渡す。また文字認識部404は、文字領域抽出部403から取得した位置情報、認識対象となった文字の画像データ(文字画像)、認識した文字の大きさ、フォントなどの付帯情報を生成し、文書ファイル生成部406に引き渡す。また文字認識部404は、文字認識処理の結果である候補文字とその認識度とを対応付けたリストを生成し、これを付帯情報として文字認識部404に引き渡す。図5(B)は、文字認識部404により生成されたテキスト文字情報および付帯情報(位置、大きさ、フォント)をあらわす図となっている。
文字消去部405は、前処理部401から引き渡された前処理後の画像、および文字領域抽出部403により引き渡された文字部領域情報を用いて、前処理後の画像から文字を除外した画像を生成する。この生成後の画像を「文字抜き画像」と称し、一例を図5(C)に示す。文字消去部405は、前処理後の画像から、文字部領域情報に示される部分を除外した文字抜き画像を生成するが、除外した部分の各画素の値(画素値)については、周囲の画素値から補間値を算出して、割り当てるものとする。文字消去部405は、このようにして生成した文字抜き画像を、文書ファイル生成部406に引き渡す。尚、文字抜き画像に関しては、画像領域ごとに分割し、領域ごとの画像、位置情報を付記する形式で保存することも想定される。
文書ファイル生成部406は、テキスト文字情報、付帯情報、および文字抜き画像に基づき、既存のワードプロセッサ用ソフトウェアで閲覧や編集を行うことのできる文書ファイルを出力する。この文書ファイルは、図5(D)に示すように、テキスト文字情報を文字抜き画像に重畳させた形式で表示される。
ここで本実施形態により生成される文書ファイルについて説明する。本実施形態では、「Open XML」のファイルフォーマットで文書ファイルを作成する。「Open XML」は、ISO/IEC 29500として標準化されたxmlベースのフォーマットであり、複数のファイルやフォルダから構成される。「Open XML」を構成する各ファイルの中には、例えばテキストのコンテンツを記述する「document.xml」、使用するフォントを規定する「fontTable.xml」、テキストのスタイルを規定する「styles.xml」などが含まれている。各ファイルはxml形式のテキストデータであるため、バイナリデータに比べて容易に視認することができ、且つこれら各ファイルを容易に編集することができる。文書ファイル生成部406は、「Open XML」を構成する各ファイルを圧縮して1つのファイルにまとめ、当該圧縮ファイルに「docx」の拡張子を付与して文書ファイルを生成する。
このようにして生成された文書ファイルは、ファイルサーバ120などの利用者が指定した送信先に送られる。利用者は、PC140、150でワードプロセッサソフトウェアを起動し、ファイルサーバ120にアクセスすることで、生成された文書ファイルを閲覧、編集する。
尚、ここでは文字を画像から除去して文字抜き画像を生成し、テキストデータを文字抜き画像に重畳する例を示したが、例えば罫線や矢印などのオブジェクト(図形)を操作可能とするため、画像(ラスタデータ)からオブジェクトの領域を抽出してベクタライズしてもよい。
図5(D)では、第1候補の認識度がいずれの文字においても常に高かった場合の文書ファイルを例示している。これに対し、第1候補の認識度が低い文字があり、当該文字について複数の候補文字がある場合の表示例を図6に例示する。
本実施形態の手法により生成された文書ファイルを開いて閲覧状態にすると、図6(A)に示すように境界線603を境にして2つの領域が画面上に形成される。ここでは、一方をコンテンツ領域601(第1領域)とし、他方をコメント領域602(第2領域)とする。
コンテンツ領域601は、テキスト文字情報を配置した表示構成となっており、第1候補の文字がコンテンツ領域601内に配置される。コメント領域602は、コンテンツ領域601よりも表示面積の小さい領域であり、候補文字が表示される領域となっている。
図6(A)の文字611に示すように、第1候補の認識度が第1の閾値(後述のTh_A)を下回る場合、その他の候補文字604が文字611とリンク線605で紐づけられてコメント領域602に表示される。図6(A)の例では、「優」の文字についての認識度が低いため、その他の候補文字604(「憂」の文字)がコメント領域602に表示される。このように本実施形態では、認識された文字の表示領域と分けて候補文字を表示し、且つ認識された文字とその他の候補文字とを同時に表示する。
図6(B)の例では、認識度がさらに低く、適当な文字を第1候補として選定できなかったケースを例示している。本実施形態では、第1候補の認識度が第2の閾値(後述のTh_B。第2の閾値<第1の閾値)を下回る場合、当該文字の元画像606をコメント領域602に挿入して、利用者に文字の判別を促す。このように該当文字の元画像を切り出して貼り付けることで、利用者に実際の文字画像を視認してもらい、正規文字の想起を促すことができる。
利用者は、コメント領域602内に記載されている内容を確認しながらコンテンツ領域601内の文字を直接編集することで、正規の文書ファイルとなるように修正することができる。また文書ファイルの印刷を行う際にも、図6の各図に示される状態で印刷される。また、不要となった場合はコメント領域内602内の候補文字を削除する操作を行うことで、コンテンツ領域601のみの文書ファイルとすることができる。
図7は、文字認識装置400の全体動作例を示すフローチャートである。
スキャナ部231は、操作パネル240を介して利用者から文字認識の実行指示を受け付けると、読み取り面に載置された原稿シートをスキャンして電子データに変換する。これにより、スキャン画像が生成される(S001)。
前処理部401は、スキャン画像に対してシェーディング補正等の前処理を行う(S002)。2値化部402は、前処理後の画像を取得して、2値化画像を生成する(S003)。文字領域抽出部403は、2値化画像を取得して、当該2値化画像内で文字が描かれた矩形領域を特定する。そして文字領域抽出部403は、特定した矩形領域の2値化画像内での位置、および当該矩形領域の切り出しを行い、文字部2値化画像を生成する(S004)。
文字認識部404は、既存のOCR技術を用いて、文字部2値化画像に描かれている文字およびフォントの認識処理を行うと共に、文字サイズについての判別を行う(S005)。文字認識部404は、認識度の高い順で、認識した候補文字と当該候補文字の認識度と対応付けたリストを作成し、作成したリストに識別情報(「ID」と称する)を付与する。このようにして生成されるデータのうち、第1候補の文字がテキスト文字情報であり、候補文字のリスト(第1候補もリスト内に含まれる)、ID、フォント、文字サイズ、処理対象となる文字画像、および位置情報を含めたデータ構造が付帯情報である。テキスト文字情報および付帯情報は、文字を認識した数だけ生成される。
一方、文字消去部405は、前処理部401から前処理後の画像を取得し、文字領域抽出部403から文字部領域情報を取得して、文字抜き画像を作成する(S005)。
文書ファイル生成部406は、テキスト文字情報、付帯情報を、文字ごとに文字認識部404から取得し、文字抜き画像を文字消去部405から取得する。そして文書ファイル生成部406は、所定のフォーマットの文書ファイルを生成する(S007)。文書ファイル生成部406の詳細動作については、図8、図9を用いて後述する。
文書ファイル生成部406は、生成した文書ファイルを、ファイルサーバ120内の利用者が指定したフォルダに送信する(S008)。これにより利用者は、文書ファイルにアクセスし、規定のワードプロセッサソフトウェアを使用して閲覧、編集などの作業を行うことができる。
図8は、S007の文書ファイル作成処理の詳細動作を例示するフローチャートである。図8のフローチャートでは、スキャナ部231を介して、対象とする原稿シートがすべて読み込まれて、すべてのページにおいて、文字抜き画像、テキスト文字情報、および付帯情報が抽出されているものとする。
文書ファイル生成部406は、まずは文書ファイルを新規に作成する(S101)。文書ファイル生成部406は、文書ファイルを保存するためのファイルのオープン、ならびに文書ファイル全体で用いられる共通コードを作成して保存する。
文書ファイル生成部406は、次に「ページ毎処理ループ」を実施する(S102A~S102B)。このループを抜ける条件は、「次ページが存在するか」であり、文書ファイル生成部406は、入力された1ページないし複数ページの全ての処理が終わるまで、S102AからS102Bまでの各ステップを実行する。
文書ファイル生成部406は、ページ追加処理を行う(S103)。ここでは、1ページ毎に必要な、文書ファイルの生成すべきコードを作成して保存する。
文書ファイル生成部406は、文字抜き画像がページの背景画像となるように貼り付ける(S104)。ここでは、文字抜き画像をS103で生成した1ページの画像に貼り付ける。
文書ファイル生成部406は、「文字領域毎処理ループ」を実施する(S105A~S105B)。このループは、1ページ内の文字領域ごとに処理を行うものであり、当該ページで文字領域が無くなると、文書ファイル生成部406はこのループを抜ける。ここでの文字領域とは、文字領域抽出部403により抽出された連続した文字列(例えば画像内の1行分の文字列)を含めた矩形領域を意味し、同じ位置情報となっている文字同士は、同じ文字領域に属するものとして扱われる。また文書ファイル生成部406は、この付帯情報内の位置情報を用いて、次の文字領域の有無を判定している。
文書ファイル生成部406は、「文字領域毎処理ループ」内で「一文字毎処理ループ」を実施する(S106A~S106B)。ここでは、文字領域内の文字列を構成する一文字ごとの処理となり、文字領域内に処理対象の文字が無くなるまで、「一文字出力処理」(S107)が繰り返し行われる。
図9は、S107の「一文字出力処理」についての詳細動作を例示するフローチャートである。図9のフローチャートは、文字認識部404が生成したリスト(候補文字と認識度とを対応付けて認識度順としたリスト)を上から1行ずつ順に処理するものである。また図9中の各符号は、以下を意味している。
・nは、候補文字の数(リスト内のレコード件数)。
・C(k)は、第k候補の文字(C(1)が第1候補文字)。
・P(k)は、第k候補の文字の認識度(P(1)が第1候補文字の認識度)。P(k)については、以下の関係が成立しているものとする。
Figure 0007379876000001
また、Th_xは、文字の認識度と比較するための閾値であり、比較結果により各文字の配置構成が変わる。本実施形態では、Th_A>Th_B>Th_Cの関係を有するものとする。
ここで図9のフローチャートの概要について説明する。第1候補文字C(1)の認識度P(1)が閾値Th_Aよりも大きかった場合、注目した文字は第1候補文字C(1)であると決定し、C(1)をコンテンツ領域601に配置する。またP(1)が閾値Th_Aと閾値Th_Bとの範囲内である場合、当該第1候補文字C(1)をコンテンツ領域601に配置するとともに、その他の候補(Th_C以上の認識度の候補文字)をコメント領域602に配置する。P(1)がTh_Bを下回る場合は、当該注目した文字の元画像(=文字画像)をコメント領域602に表示する。
引き続き、図9のフローチャートの詳細動作について説明する。
文書ファイル生成部406は、リストの最初の1行、すなわち最も認識度の高かった第1候補文字C(1)とその認識度P(1)をリストから取得し、P(1)と閾値Th_Aとを比較する(S201)。ここでP(1)がTh_Aよりも大きい場合(S201:Yes)、文書ファイル生成部406は、C(1)をコンテンツ領域601に配置する(S207)。ここでは、「Open XML」の「document.xml」にC(1)を組み入れる処理となる。S207を通る処理の場合、誤認識の発生していない正当な認識結果であったものとして扱われ、他の候補文字をコメント領域602に配置することなく、処理終了となる。
一方、P(1)がTh_A以下の場合(S201:No)、文書ファイル生成部406は、次にP(1)と閾値Th_Bとを比較する(S202)。ここでP(1)がTh_Bよりも大きい場合(S202:Yes)、文書ファイル生成部406は、C(1)をコンテンツ領域601に配置し(S203)、処理をS210Aへ進める。
P(1)がTh_B以下である場合(S202:No)、文書ファイル生成部406は注目した文字に対応する元画像を、コメント領域602に貼り付ける(S204)。文書ファイル生成部406は、該当の元画像に識別情報を付与して「Open XML」の「media」フォルダに格納する。そして文書ファイル生成部406は、「Open XML」の「comments.xml」内に「認識度の低い文字です。」などの文字列とともに、元画像の識別情報を登録する。
次いで文書ファイル生成部406は、P(1)と閾値Th_Cとを比較する(S205)。P(1)がTh_C以下の場合(S205:No)、1文字も候補文字に相当するものが見つけられなかったとして扱い、図9の処理は終了となる。一方、P(1)がTh_Cよりも大きい場合(S205:No)、C(1)を候補文字としてコメント領域602にテキストデータとして配置して(S206)、S210Aへ処理を進める。S206において、文書ファイル生成部406は「comments.xml」内にC(1)の文字(テキストデータ)とIDとを登録し、「document.xml」の該当位置に同じIDを記述することで対応付けを行う。尚、ここでは付帯情報内のIDを用いるものとするが、新たに払い出したIDでもよい。
S203にてC(1)をコンテンツ領域601に配置した後、もしくはS205にてC(1)をコメント領域602に配置した後、文書ファイル生成部406は、S210A~S210Bのループ処理を実行する。このループ処理では、変数kを2~nに順次変更しながら行われる。
文書ファイル生成部406は、P(k)と閾値Th_Cとを比較し(S211)、P(k)がTh_C以上である場合(S211:Yes)、C(k)を候補として扱い、コメント領域602に配置する(S212)。ここでは、「comments.xml」内にC(k)の文字(テキストデータ)、IDを登録するとともに、当該IDを「document.xml」の該当位置に付与して対応付ける動作となる。一方、P(k)がTh_Cを下回る場合(S211:No)、当ループを抜けて図9の処理は終了となる。
このような処理が行われることで、図6で説明した表示形式を持った文書ファイルを生成することができる。尚、図6(A)の文字611は、S203を経由してS210A~S210Bのループ処理が行われた場合の表示例であり、各閾値との関係が以下のとおりであった場合の表示例である。
Th_B<P(1)≦Th_A
P(2)≧Th_C
P(3)<Th_C
尚、図6(A)において、C(1)は「優」であり、C(2)は「憂」である。
図6(B)の空欄611Aの箇所は、第1候補の認識度がTh_Cよりも低く(P(1)≦Th_B)、Th_Cよりも大きい場合(Th_C<P(1))の例であり、S204、S205を経由して、S210A~S210Bのループ処理が行われた場合の表示例である。尚、第1候補の認識度が低い場合、本実施形態では図6(B)のようにコンテンツ領域601に第1候補を配置せずに空欄とするが、第1候補については常にコンテンツ領域601に配置する実装でもよい。
上記の実施形態では、1文字ごとに処理を行い、1文字ごとに候補となる文字をコメント領域に配置する方法を記載しているが、単語・文節レベル等の文字列ごとにひとまとめにして処理を行い、コメント領域に配置することも可能である。
また本実施形態では、OCRによる文字認識の認識確度に合わせて、「コメント機能」を用いて他の候補文字を表示、もしくはスキャン画像を添付することができる。これにより、利用者にもとの文字を推測するための手がかりを与えることができる。
また誤認識があった場合の修正作業においても、コメント領域に配置されている候補のうちで正当な文字がある場合は、「コピー&ペースト」の操作を行うことで、利用者は容易に文字を置き換えることが可能となる。
尚、図6などに示した表示形式は、あくまでも一例である。同じオフィス系のアプリケーションを用いても、閲覧モードやアウトラインモードなどの表示モードの切り替えによって表示形式が変化したり、バージョンの差異によっては見え方が変更されたりすることもあり得る。本実施形態では、認識した文字(第1候補)と、その他の候補文字とを紐付けたデータを生成し、これらが紐付けられて表示する構成であればよい。換言すると、本実施形態では、認識した文字(第1候補)と、その他の候補文字とを対応付けて表示可能となるような形式のデータを生成できればよい。このようなデータ形式として、本実施形態では「Open XML」を例示したが、他のデータ形式であっても構わない。
本実施形態では、画像形成装置内に文字認識装置が組み入れられている態様について説明したが、上記で説明した文字認識装置の機能は、PC140やスマートフォンなどに組み入れられてもよい。また、スマートフォンなどのカメラ付き携帯端末で原稿シートを接写し、これをスキャン画像として用いてもよい。尚、カメラ機能によって原稿を接写することを含めて、原稿をスキャンして読み取る、と表現してもよい。また、「スキャン画像」は、本実施形態ではスキャン部により読み取られた画像そのままを指すものとして説明したが、読み取られた画像に対して画像処理(前処理や2値化処理など)を行った後の画像を、「スキャン画像」と称してもよい。
上記の文書ファイル生成部では、第1候補をコンテンツ領域に表示し、その他の候補文字をコメント領域に表示する形式の文書ファイルを作成するものとした。これ以外にも、その他の候補文字については第1候補と書体を異ならせて表示する形式とした文書ファイルを作成してもよい。ここで書体とは、フォント透明度やフォント種別、フォントサイズ、フォントの色、太字、斜体、アンダーラインやマーカーの付与の有無、文字色と背景色とを反転させるなどを意味する。また、候補文字同士においても、認識度の違いに応じて相互に書体を変更してもよい。すなわち本実施形態の文書ファイル生成部は、最も認識度の高かった第1候補とその他の候補文字とを、態様を異ならせて同時に表示する形式、且つ利用者により編集可能な形式の文書ファイルを生成する。尚、第1候補とその他の候補とで書体を異ならせた場合、当該その他の候補をコンテンツ領域に配置してもよい。
以上、上記で説明した各実施形態の態様により、OCRによる文字認識で誤認識があった場合でも、利用者にもとの文字を推測するための手がかりを与えることができる。
110 :画像形成装置
120 :ファイルサーバ
140、150:PC
210 :コントローラ
231 :スキャナ部
232 :プリンタ部
240 :操作パネル
400 :文字認識装置
401 :前処理部
403 :文字領域抽出部
404 :文字認識部
405 :文字消去部
406 :文書ファイル生成部
601 :コンテンツ領域
602 :コメント領域
特開2010-211470号公報

Claims (5)

  1. 原稿を読み取って得られたスキャン画像に描かれている文字をデジタルデータに変換する文字認識装置であって、
    スキャン画像に対して文字認識処理を行い、認識した文字または文字列ごとに、候補となる文字または文字列と当該候補の確からしさをあらわす認識度とを対応付けたデータを生成する文字認識部と、
    前記文字認識部により認識された文字または文字列の候補の中から最も認識度の高い第1候補を表示し、当該第1候補よりも前記認識度が低いその他の候補を、前記第1候補とは態様を異ならせて、前記第1候補に対応付けて当該第1候補と同時に表示する形式の文書ファイルを生成する文書ファイル生成部と、
    を有し、
    前記文書ファイル生成部は、前記第1候補を第1領域に表示し、前記その他の候補を前記第1領域よりも表示面積の小さい第2領域に表示し、
    前記第1候補と前記その他の候補との対応付けを、前記第1領域から第2領域へと至る線分を用いて対応関係を視覚により認識可能な状態で表示する形式の文書ファイルを生成する、
    ことを特徴とする文字認識装置。
  2. 前記文書ファイル生成部は、さらに、前記文字認識部により認識された文字または文字列が描かれた元画像を、前記第2領域に表示する形式の文書ファイルを生成する、
    ことを特徴とする請求項に記載の文字認識装置。
  3. 前記文書ファイル生成部は、利用者により編集可能な形式で前記文書ファイルを生成する、
    ことを特徴とする請求項1又は2に記載の文字認識装置。
  4. 原稿を読み取って得られたスキャン画像に描かれている文字をデジタルデータに変換する文字認識装置の文書ファイル生成方法であって、
    スキャン画像に対して文字認識処理を行い、認識した文字または文字列ごとに、候補となる文字または文字列と当該候補の確からしさをあらわす認識度とを対応付けたデータを生成し、
    認識された文字または文字列の候補の中から最も認識度の高い第1候補を表示し、当該第1候補よりも前記認識度が低いその他の候補を、前記第1候補とは態様を異ならせて、前記第1候補に対応付けて当該第1候補と同時に表示する形式の文書ファイルを生成し、
    前記文書ファイルの生成において、
    前記第1候補を第1領域に表示し、前記その他の候補を前記第1領域よりも表示面積の小さい第2領域に表示し、
    前記第1候補と前記その他の候補との対応付けを、前記第1領域から第2領域へと至る線分を用いて対応関係を視覚により認識可能な状態で表示する、
    形式の文書ファイルを生成する、
    ことを特徴とする文書ファイル生成方法。
  5. 原稿を読み取って得られたスキャン画像に描かれている文字をデジタルデータに変換するコンピュータによって実行される文書ファイル生成プログラムであって、
    スキャン画像に対して文字認識処理を行い、認識した文字または文字列ごとに、候補となる文字または文字列と当該候補の確からしさをあらわす認識度とを対応付けたデータを生成し、
    認識された文字または文字列の候補の中から最も認識度の高い第1候補を表示し、当該第1候補よりも前記認識度が低いその他の候補を、前記第1候補とは態様を異ならせて、前記第1候補に対応付けて当該第1候補と同時に表示する形式の文書ファイルを生成し、
    前記文書ファイルの生成において、
    前記第1候補を第1領域に表示し、前記その他の候補を前記第1領域よりも表示面積の小さい第2領域に表示し、
    前記第1候補と前記その他の候補との対応付けを、前記第1領域から第2領域へと至る線分を用いて対応関係を視覚により認識可能な状態で表示する、
    形式の文書ファイルを生成する、
    ことを、コンピュータに実行させるための文書ファイル生成プログラム。
JP2019112238A 2019-06-17 2019-06-17 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム Active JP7379876B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019112238A JP7379876B2 (ja) 2019-06-17 2019-06-17 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
US16/901,441 US11146705B2 (en) 2019-06-17 2020-06-15 Character recognition device, method of generating document file, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019112238A JP7379876B2 (ja) 2019-06-17 2019-06-17 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム

Publications (2)

Publication Number Publication Date
JP2020204905A JP2020204905A (ja) 2020-12-24
JP7379876B2 true JP7379876B2 (ja) 2023-11-15

Family

ID=73745292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019112238A Active JP7379876B2 (ja) 2019-06-17 2019-06-17 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム

Country Status (2)

Country Link
US (1) US11146705B2 (ja)
JP (1) JP7379876B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11501548B2 (en) * 2019-04-02 2022-11-15 Edgeverve Systems Limited Method and system for determining one or more target objects in an image
JP7234024B2 (ja) * 2019-04-23 2023-03-07 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109475A (ja) 2000-09-27 2002-04-12 Internatl Business Mach Corp <Ibm> アプリケーションデータの誤り訂正支援方法、コンピュータ装置、アプリケーションデータ提供システム、および記憶媒体
JP2002358481A (ja) 2001-06-01 2002-12-13 Ricoh Elemex Corp 画像処理装置
JP2007109118A (ja) 2005-10-17 2007-04-26 Hitachi Ltd 入力指示処理装置および入力指示処理プログラム

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61188681A (ja) * 1985-02-15 1986-08-22 Matsushita Electric Ind Co Ltd 文字認識装置
JPS6373385A (ja) * 1986-09-17 1988-04-02 Hitachi Ltd 文字認識装置における候補文字表示方式
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
JPH06176189A (ja) * 1992-12-10 1994-06-24 Ricoh Co Ltd 文字認識装置の画面表示方法
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP3027321B2 (ja) * 1994-09-27 2000-04-04 財団法人工業技術研究院 拘束のない手書き英数字のオンライン認識の方法及び装置
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image
US5682439A (en) * 1995-08-07 1997-10-28 Apple Computer, Inc. Boxed input correction system and method for pen based computer systems
JPH1063775A (ja) * 1996-08-21 1998-03-06 Toshiba Corp 文書作成装置及び認識候補表示方法
EP0961218B1 (en) * 1998-05-28 2004-03-24 International Business Machines Corporation Method of binarization in an optical character recognition system
US6636631B2 (en) * 1998-06-04 2003-10-21 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and its application
MC2491A1 (fr) * 1999-06-21 1999-11-22 Stringa Luigi Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
JP2001297303A (ja) * 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US7010166B2 (en) * 2000-11-22 2006-03-07 Lockheed Martin Corporation Character recognition system and method using spatial and structural feature extraction
CN1459761B (zh) * 2002-05-24 2010-04-21 清华大学 基于Gabor滤波器组的字符识别技术
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
JP4603807B2 (ja) * 2004-03-10 2010-12-22 富士通株式会社 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4909576B2 (ja) * 2005-11-29 2012-04-04 株式会社リコー 文書編集装置、画像形成装置およびプログラム
JP3963394B2 (ja) * 2005-12-28 2007-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション ソフトウェア障害情報をレポートするための装置
JP4897520B2 (ja) * 2006-03-20 2012-03-14 株式会社リコー 情報配信システム
US8763038B2 (en) * 2009-01-26 2014-06-24 Sony Corporation Capture of stylized TV table data via OCR
US8204896B2 (en) * 2008-01-08 2012-06-19 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
US8041139B2 (en) * 2008-09-05 2011-10-18 The Neat Company, Inc. Method and apparatus for calculating the background color of an image
JP5353325B2 (ja) 2009-03-10 2013-11-27 株式会社リコー 文書データ生成装置と文書データ生成方法
JP2010218098A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 情報処理装置、情報処理方法、制御プログラム及び記録媒体
US20110258150A1 (en) * 2010-01-15 2011-10-20 Copanion, Inc. Systems and methods for training document analysis system for automatically extracting data from documents
JP5636807B2 (ja) * 2010-08-12 2014-12-10 富士ゼロックス株式会社 画像処理装置及びプログラム
US8626236B2 (en) * 2010-10-08 2014-01-07 Blackberry Limited System and method for displaying text in augmented reality
US20120087537A1 (en) * 2010-10-12 2012-04-12 Lisong Liu System and methods for reading and managing business card information
JP5280425B2 (ja) * 2010-11-12 2013-09-04 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US8612307B2 (en) * 2011-01-03 2013-12-17 Stanley Benjamin Smith System and method to price and exchange data producers and data consumers through formatting data objects with necessary and sufficient item definition information
JP5952428B2 (ja) * 2012-01-23 2016-07-13 マイクロソフト コーポレーション ボーダレステーブル検出エンジン
US8830487B2 (en) * 2012-07-09 2014-09-09 Xerox Corporation System and method for separating image and text in a document
CN102831106A (zh) * 2012-08-27 2012-12-19 腾讯科技(深圳)有限公司 一种移动终端的电子文档生成方法及移动终端
JP6318506B2 (ja) 2012-09-18 2018-05-09 株式会社リコー 動線管理装置、動線管理システム、及び動線管理プログラム
US9413912B2 (en) * 2012-10-26 2016-08-09 Abbyy Development Llc Scanning device having a bed cover including a pattern of repeated design elements
EP2963584B1 (en) * 2013-02-28 2020-07-15 Glory Ltd. Character recognition method and character recognition system
US9148675B2 (en) * 2013-06-05 2015-09-29 Tveyes Inc. System for social media tag extraction
CN104298982B (zh) * 2013-07-16 2019-03-08 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
JP2015055534A (ja) 2013-09-11 2015-03-23 株式会社リコー 情報処理装置、情報処理装置の制御プログラム及び情報処理装置の制御方法
JP6194711B2 (ja) 2013-09-11 2017-09-13 株式会社リコー 画像形成装置、印刷方法及びプログラム
US8965117B1 (en) * 2013-12-17 2015-02-24 Amazon Technologies, Inc. Image pre-processing for reducing consumption of resources
RU2571378C2 (ru) * 2013-12-18 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Устройство и способ поиска различий в документах
RU2648636C2 (ru) * 2014-03-31 2018-03-26 Общество с ограниченной ответственностью "Аби Девелопмент" Сохранение контента в конвертированных документах
EP3133387B1 (en) 2014-04-16 2020-05-20 Glory Ltd. Method and device for removing background of character in color image, method for adjusting installation of line camera, and chart for adjusting installation
US9747499B2 (en) * 2015-03-03 2017-08-29 Fuji Xerox Co., Ltd. Systems and methods for detection and high-quality capture of documents on a cluttered tabletop with an automatically controlled camera
US9959406B2 (en) * 2015-12-02 2018-05-01 Institute For Development And Research In Banking Technology System and method for zero-day privilege escalation malware detection
US10262139B2 (en) * 2015-12-02 2019-04-16 Institute For Development And Research In Banxing Technology System and method for detection and prevention of data breach and ransomware attacks
US20200234003A1 (en) * 2017-02-27 2020-07-23 Alex Bakman Method, system and apparatus for generating, editing, and deploying native mobile apps and utilizing deep learning for instant digital conversion
JP2018046360A (ja) 2016-09-13 2018-03-22 株式会社リコー 画像処理装置、方法およびプログラム
US20180101726A1 (en) * 2016-10-10 2018-04-12 Insurance Services Office Inc. Systems and Methods for Optical Character Recognition for Low-Resolution Documents
US10460192B2 (en) * 2016-10-21 2019-10-29 Xerox Corporation Method and system for optical character recognition (OCR) of multi-language content
US20180253599A1 (en) * 2017-03-03 2018-09-06 Bank Of America Corporation Document image processing and advanced correlation of image data
US10776903B2 (en) * 2017-07-17 2020-09-15 Open Text Corporation Systems and methods for image modification and image based content capture and extraction in neural networks
JP6841197B2 (ja) * 2017-09-28 2021-03-10 京セラドキュメントソリューションズ株式会社 画像形成装置
US10586133B2 (en) * 2018-07-23 2020-03-10 Scribe Fusion, LLC System and method for processing character images and transforming font within a document
US11501548B2 (en) * 2019-04-02 2022-11-15 Edgeverve Systems Limited Method and system for determining one or more target objects in an image
US11188745B2 (en) * 2019-09-13 2021-11-30 At&T Intellectual Property I, L.P. Enhancing electronic documents for character recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109475A (ja) 2000-09-27 2002-04-12 Internatl Business Mach Corp <Ibm> アプリケーションデータの誤り訂正支援方法、コンピュータ装置、アプリケーションデータ提供システム、および記憶媒体
JP2002358481A (ja) 2001-06-01 2002-12-13 Ricoh Elemex Corp 画像処理装置
JP2007109118A (ja) 2005-10-17 2007-04-26 Hitachi Ltd 入力指示処理装置および入力指示処理プログラム

Also Published As

Publication number Publication date
US11146705B2 (en) 2021-10-12
US20200396351A1 (en) 2020-12-17
JP2020204905A (ja) 2020-12-24

Similar Documents

Publication Publication Date Title
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
JP5223284B2 (ja) 情報検索装置、方法およびプログラム
JP5042562B2 (ja) 画像処理装置、手書き情報認識方法、手書き情報認識プログラム
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP4502385B2 (ja) 画像処理装置およびその制御方法
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
JP2012151722A (ja) 画像処理装置、画像処理システム、画像処理方法、および、プログラム
JP7262993B2 (ja) 画像処理システム、画像処理方法、画像処理装置
JP7337612B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US9614984B2 (en) Electronic document generation system and recording medium
JP7379876B2 (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
US8181108B2 (en) Device for editing metadata of divided object
JP6579331B2 (ja) 画像形成装置、文書電子化プログラムおよび文書電子化方法
JP7497620B2 (ja) 文書データ生成装置、画像形成装置、及び文書データ生成プログラム
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP5673277B2 (ja) 画像処理装置およびプログラム
JP7342518B2 (ja) 画像処理装置及び画像処理プログラム
JP2020047138A (ja) 情報処理装置
JP5935376B2 (ja) 複写装置
JP6844574B2 (ja) 画像処理装置、及び画像処理方法
JP2023013501A (ja) 画像処理装置、画像処理方法、及びプログラム
JP4957570B2 (ja) 画像処理装置
JP2010026986A (ja) 画像形成装置
JP2006261772A (ja) 画像形成装置及び画像形成方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20200107

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20200226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230720

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231016

R151 Written notification of patent or utility model registration

Ref document number: 7379876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151