JP6963728B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP6963728B2
JP6963728B2 JP2018032607A JP2018032607A JP6963728B2 JP 6963728 B2 JP6963728 B2 JP 6963728B2 JP 2018032607 A JP2018032607 A JP 2018032607A JP 2018032607 A JP2018032607 A JP 2018032607A JP 6963728 B2 JP6963728 B2 JP 6963728B2
Authority
JP
Japan
Prior art keywords
font type
word
processing unit
character
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018032607A
Other languages
English (en)
Other versions
JP2019148941A (ja
Inventor
嶺雪 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2018032607A priority Critical patent/JP6963728B2/ja
Priority to US16/281,383 priority patent/US10817759B2/en
Publication of JP2019148941A publication Critical patent/JP2019148941A/ja
Application granted granted Critical
Publication of JP6963728B2 publication Critical patent/JP6963728B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、画像処理装置に関するものである。
あるファクシミリ装置は、原稿画像における1文字ずつ文字コードおよびフォント種別を特定している(例えば特許文献1参照)。
ある文字認識装置は、帳票内の複数のフィールドのそれぞれにおける複数のフォント種別(フォント辞書)の出現頻度を特定し、その出現頻度に基づいて各フィールドのフォント種別を特定している(例えば特許文献2参照)。
特開平07−177279号公報 特開平10−261048号公報
しかしながら、上述のファクシミリ装置では、1文字ずつフォント種別の特定を行うため、文章中のすべての文字のフォント種別を特定するための時間が長くなってしまう。
また、上述の文字認識装置では、帳票内のすべてのフィールドのフォント種別を1フィールドずつ特定しているため、帳票全体についてフォント種別を特定するための時間が長くなってしまう。さらに、上述の文字認識装置は、帳票内のフィールド単位または帳票単位でフォント種別を特定しているため、ただちに、一般的な文章における各文字のフォント種別を特定することは困難である。
本発明は、上記の問題に鑑みてなされたものであり、画像内の文字のフォント種別を高速に特定する画像処理装置を得ることを目的とする。
本発明に係る画像処理装置は、画像における所定処理単位のテキスト内の文字の文字コードを特定する文字認識部と、前記文字のフォント種別を特定するフォント種別特定部とを備える。そして、前記フォント種別特定部は、フォント種別特定処理を実行し、前記フォント種別特定処理において、(a)1文字ずつフォント種別を特定していき、(b)前記所定処理単位のテキストの全文字数に対する、同一フォント種別の文字の文字数の割合が所定閾値を超えたときに、前記所定処理単位のテキスト内の文字のフォント種別をすべて前記同一フォント種別とする。そして、前記フォント種別特定部は、前記所定処理単位のテキストのすべての文字に対してフォント種別を特定しても、前記割合が前記所定閾値を超えているフォント種別がない場合には、前記所定処理単位のテキスト内の文字のフォント種別を、前記割合が最も多いフォント種別とする。

本発明によれば、画像内の文字のフォント種別を高速に特定する画像処理装置が得られる。
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。 図2は、フォント種別特定処理の所定処理単位を説明する図である。 図3は、実施の形態1に係る画像処理装置の動作について説明するフローチャートである。 図4は、実施の形態3に係る画像処理装置の動作を説明する図である。
以下、図に基づいて本発明の実施の形態を説明する。
実施の形態1.
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。図1に示す画像処理装置は、画像読取装置1、通信装置2、記憶装置3、および演算処理装置4を備える。
画像読取装置1は、テキストを含む原稿から原稿画像を読み取り、原稿画像のラスター画像データを生成する。
通信装置2は、図示せぬ外部装置とデータ通信を行い、テキストを含む画像のラスター画像データを受信する。
記憶装置3は、不揮発性の記憶装置であって、テキストを含む画像のラスター画像データを記憶する。
演算処理装置4は、プログラムを実行するコンピューター、ASIC(Application Specific Integrated Circuit)などを備え、そのコンピューター、ASICなどで各種処理部として動作する。
ここでは、演算処理装置4は、文字認識部21、フォント種別特定部22、およびファイル生成部23として動作する。
文字認識部21は、既知の方法で、ラスター画像データに基づく画像(ラスター画像)における所定処理単位のテキスト内の文字の文字コードを特定する。
フォント種別特定部22は、フォント種別特定処理を実行し、文字コードが特定された上述の文字のフォント種別を特定する。
具体的には、フォント種別特定部22は、フォント種別特定処理において、(a)既知の文字比較方法で1文字ずつフォント種別を特定していき、(b)所定処理単位のテキストの全文字数に対する、同一フォント種別の文字の文字数の割合が所定閾値を超えたときに、所定処理単位のテキスト内の文字のフォント種別をすべて、その同一フォント種別とする。したがって、その割合が所定閾値を超えたときまでに上述の既知の文字比較方法でのフォント種別の特定を行っていない文字に対しては、上述の既知の文字比較方法でのフォント種別の特定のための処理を行わずに、フォント種別が特定される。その結果、所定処理単位のテキストのフォント種別特定処理が短時間で終わる。
上述の文字比較方法では、例えば、対象文字の文字画像と複数のフォント種別のフォント辞書に登録されている文字画像(対象文字の文字コードに関連付けられている文字画像)とが比較され、両者が一致する確度が最も高いフォント種別が、対象文字のフォント種別であると判定される。
図2は、フォント種別特定処理の所定処理単位を説明する図である。この「所定処理単位」は、例えば図2に示すような単語、行、ブロックなどであり、文字認識部21により文字コードが特定される文字の集合の単位とされる。つまり、文字認識部21は、単語、行、ブロックなどを単位として、その中に含まれる文字の文字コードの集合を生成し、フォント種別特定部22は、その単位となる文字の集合ごとに文字コードを取得し、これにより、所定処理単位のテキストを特定する。
例えば、所定処理単位が単語であり、上述の所定閾値が50%であり、所定処理単位のテキストが「This」である場合において、文字「T」、文字「h」、および文字「i」のフォント種別が先頭から順番に既知の文字比較方法で特定され、文字「T」、文字「h」、および文字「i」のフォント種別が、すべて「Arial」であるときには、残りの文字「s」のフォント種別は、既知の文字比較方法で特定されずに、文字「i」のフォント種別が特定されたときに、ただちに、「Arial」とされる。
また、実施の形態1では、フォント種別特定部22は、所定処理単位のテキストのすべての文字に対してフォント種別を上述の既知の文字比較方法で特定しても、上述の割合が上述の所定閾値を超えているフォント種別がない場合には、所定処理単位のテキスト内の文字のフォント種別を、上述の割合が最も多いフォント種別とする。
例えば、所定処理単位が単語であり、上述の所定閾値が50%であり、所定処理単位のテキストが、「This」である場合において、文字「T」、文字「h」、文字「i」、および文字「s」のフォント種別が先頭から順番に既知の文字比較方法で特定され、文字「T」のフォント種別がゴシックであり、文字「i」のフォント種別が明朝であり、文字「h」および文字「s」のフォント種別が「Arial」であるときには、当該単語「This」のすべての文字のフォント種別は、上述の割合が最も多い(=50%)フォント種別である「Arial」とされる。
ファイル生成部23は、所定のファイル形式(例えば、PDFや、特定アプリケーション(例えばマイクロソフト社製品)用に規定されているファイル形式)で、テキストにおける各文字の文字コードおよびフォント種別を含む文書データファイルを生成する。なお、生成された文書データファイルは、記憶装置3に格納されたり、通信装置2で外部の装置へ送信されたりする。
次に、実施の形態1に係る画像処理装置の動作について説明する。図3は、実施の形態1に係る画像処理装置の動作について説明するフローチャートである。
文字認識部21における所定処理単位のテキストの文字認識処理の完了後、フォント種別特定部22は、その所定処理単位のテキストに対して、以下のフォント種別特定処理を実行する。
フォント種別特定部22は、所定処理単位のテキストにおいて、フォント種別を特定していない文字(文字コード)を1つ選択する(ステップS1)。ここでは、所定処理単位のテキストの先頭の文字から順番に1つの文字が選択される。
次に、フォント種別特定部22は、既知の文字比較方法で、選択した文字のフォント種別を特定する(ステップS2)。例えば、その文字比較方法では、フォント種別特定部22は、選択した文字について所定の確度以上であってかつ最大確度のフォント種別を、当該選択した文字のフォント種別として特定し、選択した文字に対して所定の確度以上のフォント種別が発見されなかった場合には、選択した文字のフォント種別を「不定」とする。
そして、フォント種別特定部22は、その所定処理単位のテキストにおいて、その所定処理単位のテキストの全文字数に対する、特定されたフォント種別が同一である文字の文字数の割合を特定し、特定した割合が所定閾値を超えているか否かを判定する(ステップS3)。なお、所定処理単位で区切られた各テキストの文字数は、文字認識処理の結果(つまり、各テキストに対応して特定された文字コードの数)に基づいて特定される。また、所定処理単位のテキストの文字数をNとし、所定閾値をTHとすると(0<TH<1)、フォント種別特定部22は、既知の文字比較方法でフォント種別を特定した文字数がN×THを超えるまで、ステップS3およびステップS5の判定をスキップし、連続的に、既知の文字比較方法でフォント種別を特定してもよい。
所定処理単位のテキストにおいて現時点までに特定されたフォント種別のいずれかについて上述の割合が所定閾値を超えている場合、フォント種別特定部22は、その所定処理単位のテキストにおける全文字のフォント種別を、上述の割合が所定閾値を超えているそのフォント種別とする(ステップS4)。
一方、現時点までに特定されているすべてのフォント種別について、特定した割合が所定閾値を超えていない場合、フォント種別特定部22は、その所定処理単位のテキストにおけるすべての文字のフォント種別を特定したか否かを判定する(ステップS5)。その所定処理単位のテキストにおけるすべての文字のフォント種別を特定していない場合には、フォント種別特定部22は、ステップS1に戻り、フォント種別を特定していない次の文字を選択する。
つまり、上述の割合が所定閾値を超えるフォント種別が出現するか(ステップS3)、すべての文字のフォント種別が既知の文字比較方法で特定される(ステップS5)まで、1文字ずつ文字のフォント種別が既知の文字比較方法で特定される。
例えば所定閾値が50%であり、図2における単語「This」が所定処理単位のテキストである場合において、先頭の文字「T」のフォント種別が「Arial」であると特定され、文字「h」,「i」,「s」が未処理であるときには、全文字数が4であり、フォント種別が「Arial」である文字の文字数が1であるため、上述の割合は25%となり、所定閾値を超えていないと判定される。
例えば所定閾値が50%であり、図2における単語「This」が所定処理単位のテキストである場合において、先頭の文字「T」,「h」,「i」のフォント種別が「Arial」であると特定され、文字「s」が未処理であるときには、全文字数が4であり、フォント種別が「Arial」である文字の文字数が3であるため、上述の割合は75%となり、所定閾値を超えていると判定され、既知の文字比較方法でフォント種別を特定されていない文字「s」のフォント種別が「Arial」とされる。
なお、ステップS4において、既知の文字比較方法でフォント種別を特定されていない文字のフォント種別が、上述のようにして確定された場合、その文字に対して、既知の文字比較方法でのフォント種別の特定は実行されない。
また、所定処理単位のテキストにおいて、すべての文字のフォント種別が既知の文字比較方法で特定された場合(ステップS5)、フォント種別特定部22は、所定処理単位のテキストにおいて特定されたフォント種別のうち、上述の割合が最も多いフォント種別を特定し(ステップS6)、所定処理単位のテキストにおける全文字のフォント種別を、ステップS6で特定したフォント種別とする(ステップS7)。
このようにして、所定処理単位のテキストのフォント種別が特定され、文字認識処理の結果において、所定処理単位の複数のテキスト(例えば、複数の単語や複数の行)があれば、その所定処理単位の次のテキストが選択され、上述のようにして同様に処理される。
以上のように、上記実施の形態1によれば、文字認識部21は、画像における所定処理単位のテキスト内の文字の文字コードを特定する。フォント種別特定部22は、文字コードが特定された所定処理単位のテキストに対するフォント種別特定処理を実行し、フォント種別特定処理において、(a)1文字ずつフォント種別を特定していき、(b)所定処理単位のテキストの全文字数に対する、同一フォント種別の文字の文字数の割合が所定閾値を超えたときに、所定処理単位のテキスト内の文字のフォント種別をすべて同一フォント種別とする。
これにより、既知の文字比較方法でフォント種別を特定すべき文字の数が減るため、画像内の文字のフォント種別が高速に特定される。
実施の形態2.
実施の形態2に係る画像処理装置では、フォント種別特定部22は、所定処理単位が単語である場合において、(a)3文字以上の単語および1文字の単語に対しては上述のフォント種別特定処理(つまり、実施の形態1と同様の処理)を実行し、(b)2文字の単語については、以下に示す処理を実行する。
実施の形態2では、2文字の単語については、フォント種別特定部22は、当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とする。
例えば、実施の形態2では、2文字の単語については、フォント種別特定部22は、(b1)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、上述のフォント種別特定処理をせずに、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とし、(b2)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが互いに異なる場合には、当該2文字の単語に対して上述のフォント種別特定処理を実行する。
また、例えば、実施の形態2では、ここで、フォント種別特定部22は、2文字の単語について、1文字ずつ既知の文字比較方法でフォント種別を特定し、単語内の2文字に対して同一のフォント種別が特定されなかった場合、当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一であるとき、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とし、単語内の2文字に対して同一のフォント種別が特定された場合には、直前および直後の単語のフォント種別に拘わらず、その単語内の2文字のフォント種別を、その特定されたフォント種別とするようにしてもよい。
また、実施の形態2において、2文字の単語が連続している場合(例えば図2における「is」「an」の場合)、それらの2文字の単語の最初の単語(例えば図2における「is」「an」のうちの「is」)の直前の単語(例えば図2における「is」「an」の前の「This」)および最後の単語(例えば図2における「is」「an」のうちの「an」)の直後の単語(例えば図2における「is」「an」の後の「announcement」)が同一のフォント種別とされた場合には、それらの2文字の単語(例えば図2における「is」「an」)のフォント種別は、それらの直前および直後の単語(例えば図2における「This」と「announcement」)のフォント種別と同一とするようにしてもよい。
2文字の単語には、be動詞、前置詞など、それ単体で大きな意味を持たない単語が多く、2文字の単語のフォント種別を、直前および直後の単語のフォント種別とは異なるように設定される可能性は低いため、実施の形態2では、上述のような処理が実行される。また、1文字の単語には、冠詞「a」の他、記号として使用されている文字の場合などもあるため、既知の文字比較方法でフォント種別が特定される。
なお、実施の形態2に係る画像処理装置のその他の構成および動作については実施の
形態1と同様であるので、その説明を省略する。
実施の形態3.
実施の形態3に係る画像処理装置では、フォント種別特定部22は、所定処理単位に対する上位処理単位のテキストに関し、上位処理単位のテキストにおける所定処理単位のテキストの全個数に対する、同一フォント種別の所定処理単位のテキストの個数の割合が所定閾値を超えたときに、上位処理単位のテキスト内の文字のフォント種別をすべて、その同一フォント種別とする。
例えば、実施の形態3では、「所定処理単位」は、単語であり、「上位処理単位」は、行、または、行の集合としてのブロックである。つまり、上位処理単位のテキストは、複数の所定処理単位のテキストで構成されている。
図4は、実施の形態3に係る画像処理装置の動作を説明する図である。
例えば図2に示すブロックにおける2つの行がそれぞれ上位処理単位とされ、各行内の単語が所定処理単位とされ、所定閾値が40%とされる場合、図4に示すように、最初の行では、7つの単語のうち、6つの単語までのフォント種別特定処理が完了した時点で、3つの単語「This」,「announcement」,「next」のフォント種別が「Arial」であると判定されたときには、残りの1つの単語「meeting」の、文字比較方法によるフォント種別特定は実行されず、その単語「meeting」のフォント種別(およびフォント種別が「不定」であった単語「is」,「an」,「of」のフォント種別)が、「Arial」とされる。
また、その場合において、図4に示すように、2つ目の行では、8つの単語のうち、5つの単語までのフォント種別特定処理が完了した時点で、4つの単語「Next」,「meeting」,「will」,「held」のフォント種別が「Arial」であると判定されたときには、残りの3つの単語「on」,「next」,「Tuesday」の、文字比較方法によるフォント種別特定は実行されず、それらの単語「on」,「next」,「Tuesday」のフォント種別(およびフォント種別が「不定」であった単語「be」のフォント種別)が、「Arial」とされる。
なお、実施の形態3に係る画像処理装置のその他の構成および動作については実施の形態1または実施の形態2と同様であるので、その説明を省略する。
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求の範囲に含まれることを意図している。
例えば、上記実施の形態1,2,3において、所定処理単位のテキストが、括弧やクオーテーションで囲われた範囲を含んである場合、その範囲を抽出して、独立した所定処理単位として、上述の処理を実行するようにしてもよい。
本発明は、例えば、複合機などに適用可能である。
21 文字認識部
22 フォント種別特定部

Claims (5)

  1. 画像における所定処理単位のテキスト内の文字の文字コードを特定する文字認識部と、
    前記文字のフォント種別を特定するフォント種別特定部とを備え、
    前記フォント種別特定部は、フォント種別特定処理を実行し、前記フォント種別特定処理において、(a)1文字ずつフォント種別を特定していき、(b)前記所定処理単位のテキストの全文字数に対する、同一フォント種別の文字の文字数の割合が所定閾値を超えたときに、前記所定処理単位のテキスト内の文字のフォント種別をすべて前記同一フォント種別とし、
    前記フォント種別特定部は、前記所定処理単位のテキストのすべての文字に対してフォント種別を特定しても、前記割合が前記所定閾値を超えているフォント種別がない場合には、前記所定処理単位のテキスト内の文字のフォント種別を、前記割合が最も多いフォント種別とすること、
    を特徴とする画像処理装置。
  2. 前記フォント種別特定部は、前記所定処理単位が単語である場合において、(a)3文字以上の単語および1文字の単語に対しては前記フォント種別特定処理を実行し、(b)2文字の単語については、当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とすることを特徴とする請求項1記載の画像処理装置。
  3. 前記フォント種別特定部は、2文字の単語については、(b1)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが同一である場合には、前記フォント種別特定処理をせずに、当該2文字の単語のフォント種別を、当該2文字の単語の直前および直後の単語のフォント種別と同一とし、(b2)当該2文字の単語の直前の単語のフォント種別と当該2文字の単語の直後の単語のフォント種別とが互いに異なる場合には、当該2文字の単語に対して前記フォント種別特定処理を実行することを特徴とする請求項記載の画像処理装置。
  4. 前記フォント種別特定部は、前記所定処理単位に対する上位処理単位のテキストに関し、前記上位処理単位のテキストにおける前記所定処理単位のテキストの全個数に対する、同一フォント種別の前記所定処理単位のテキストの個数の割合が所定閾値を超えたときに、前記上位処理単位のテキスト内の文字のフォント種別をすべて前記同一フォント種別とすることを特徴とする請求項1から請求項のうちのいずれか1項記載の画像処理装置。
  5. 前記所定処理単位は、単語であり、
    前記上位処理単位は、行、または、行の集合としてのブロックであること、
    を特徴とする請求項記載の画像処理装置。
JP2018032607A 2018-02-26 2018-02-26 画像処理装置 Active JP6963728B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018032607A JP6963728B2 (ja) 2018-02-26 2018-02-26 画像処理装置
US16/281,383 US10817759B2 (en) 2018-02-26 2019-02-21 Image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018032607A JP6963728B2 (ja) 2018-02-26 2018-02-26 画像処理装置

Publications (2)

Publication Number Publication Date
JP2019148941A JP2019148941A (ja) 2019-09-05
JP6963728B2 true JP6963728B2 (ja) 2021-11-10

Family

ID=67684571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018032607A Active JP6963728B2 (ja) 2018-02-26 2018-02-26 画像処理装置

Country Status (2)

Country Link
US (1) US10817759B2 (ja)
JP (1) JP6963728B2 (ja)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177279A (ja) 1993-12-16 1995-07-14 Canon Inc ファクシミリ装置
JPH10261048A (ja) 1997-01-14 1998-09-29 Fujitsu Ltd 文字認識装置及び文字認識プログラムを記憶した記憶媒体
US6337924B1 (en) * 1999-02-26 2002-01-08 Hewlett-Packard Company System and method for accurately recognizing text font in a document processing system
US6853980B1 (en) * 1999-09-07 2005-02-08 Bitstream Inc. System for selecting, distributing, and selling fonts
JP5601027B2 (ja) * 2010-05-24 2014-10-08 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN102385570A (zh) * 2010-08-31 2012-03-21 国际商业机器公司 字体匹配方法和系统
US9330070B2 (en) * 2013-03-11 2016-05-03 Microsoft Technology Licensing, Llc Detection and reconstruction of east asian layout features in a fixed format document
JP5915628B2 (ja) * 2013-11-26 2016-05-11 コニカミノルタ株式会社 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム
JP6808330B2 (ja) * 2016-02-26 2021-01-06 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP6624120B2 (ja) * 2017-02-27 2019-12-25 京セラドキュメントソリューションズ株式会社 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体
EP3841523A4 (en) * 2018-08-22 2021-10-13 Leverton Holding LLC DIFFERENT FONT TEXT LINE IMAGE DIVISION

Also Published As

Publication number Publication date
US20190266452A1 (en) 2019-08-29
JP2019148941A (ja) 2019-09-05
US10817759B2 (en) 2020-10-27

Similar Documents

Publication Publication Date Title
JP2009009527A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
CN106599940A (zh) 图片文字的识别方法及装置
KR20150099936A (ko) 전자문서의 레이아웃 유지를 위한 대체폰트 적용 방법 및 그 장치
CN107403123B (zh) 识别目标图像中的条码图像的图像分析设备
US8259374B2 (en) Image processing apparatus and image forming apparatus
JP3021278B2 (ja) 均一幅線の生成装置及び均一幅線の生成方法
JP4470913B2 (ja) 文字列検索装置およびプログラム
JP6963728B2 (ja) 画像処理装置
JP5661214B1 (ja) 文字データ修正方法、文字データ修正装置およびプログラム
US6701023B1 (en) Reducing appearance differences between coded and noncoded units of text
US8587837B2 (en) Image processing apparatus embedding additional information in document data
CN116933728A (zh) 文本处理方法、电子设备及存储介质
JP6432179B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
CN106471743B (zh) 普通ascii数据流的编码
JP2850979B2 (ja) 文字処理装置および方法
JP2011040075A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP5632110B1 (ja) 文字データ修正方法、文字データ修正装置およびプログラム
JP7302175B2 (ja) 情報処理装置、及び情報処理プログラム
JP2023143001A (ja) 情報処理装置及びプログラム
KR101365404B1 (ko) 이미지 인식 방법 및 이를 이용한 인식 장치
JP2020123232A (ja) 情報処理装置、及び情報処理プログラム
JP6489041B2 (ja) 情報処理装置及びプログラム
JP2024004321A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2005275820A (ja) 帳票認識装置、方法、プログラムおよび記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210929

R150 Certificate of patent or registration of utility model

Ref document number: 6963728

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150