JP6432179B2 - 文書ファイル生成装置及び文書ファイル生成方法 - Google Patents

文書ファイル生成装置及び文書ファイル生成方法 Download PDF

Info

Publication number
JP6432179B2
JP6432179B2 JP2014130606A JP2014130606A JP6432179B2 JP 6432179 B2 JP6432179 B2 JP 6432179B2 JP 2014130606 A JP2014130606 A JP 2014130606A JP 2014130606 A JP2014130606 A JP 2014130606A JP 6432179 B2 JP6432179 B2 JP 6432179B2
Authority
JP
Japan
Prior art keywords
character
vector data
image
coordinate
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014130606A
Other languages
English (en)
Other versions
JP2016009395A (ja
Inventor
元規 平塚
元規 平塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2014130606A priority Critical patent/JP6432179B2/ja
Publication of JP2016009395A publication Critical patent/JP2016009395A/ja
Application granted granted Critical
Publication of JP6432179B2 publication Critical patent/JP6432179B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、文字認識によって得られる原稿の文字画像をデータ化し、たとえばPDF(Portable Document Format)形式などの文書ファイルを生成する文書ファイル生成装置及び文書ファイル生成方法に関する。
電子書類の規格の一種としてPDF(Portable Document Format)形式がある。PDF形式のファイル(以下、「PDFファイル」という)には、文書内で用いられるフォント情報をそのPFDファイル自体に埋め込んでおくことができる。そのため、フォントを埋め込んだPFDファイルは、それを作成した環境以外でも、文書に埋め込まれたフォントを用いて作成者の意図通りに描画(表示あるいは印刷)することができる。
また、PDFでは、文書を電子化するに際してファイルサイズを抑えるために、高圧縮方式が用いられている。これは、画像に含まれる文字や図形といったオブジェクト毎に文字層や画層の画像層(画像レイヤ)で識別し、それぞれの文字層や画層の画像レイヤに含まれるオブジェクトに応じて画像処理や画像圧縮が行われるようにしたものである。これにより、高画質と高圧縮とが同時に達成されるようになっている。
ところで、PDFで描画される、たとえば文字画像を細かく綺麗に描画させる手段の一つとして、文字画像のベクトル化が挙げられる。ところが、文字画像をベクトル化すると、ベクトル化したフォントデータの描画処理をPDFファイル上に記載する必要があり、テキストデータに対して大きくなってしまう。
このような不具合を解消する場合、たとえば特許文献1に示されている文書作成方法を適用することが考えられる。すなわち、特許文献1では、フォントを文書ファイルに埋め込むか否かの基準となるフォント名及びポイント数(すなわちサイズ)の閾値をテーブルとして入力し、処理対象の元データからその中で使用されているフォント名とポイント数とを獲得し、元データ内で使用されているフォント名がテーブル中に登録されていれば、その元データ中におけるポイント数とテーブル中のポイント数閾値とを比較し、閾値よりも大きいポイントの文字があれば、そのフォントを埋め込むものと決定するようにした文書作成方法を提案している。
特開2005−063052
上述した特許文献1では、フォント情報を含むことのできる文書情報を作成する際に、フォントの名前のみならず、フォントのポイント数(すなわちサイズ)にも着目するようにしているため、作成される文書ファイルのサイズの縮小が可能となっている。
ところが、フォント毎にポイント数などを持たせるようにすると、フォント毎のパターンが必要となり、登録されるフォント数が多くなるに従い、ファイルサイズが大きくなってしまうという問題があった。
本発明は、このような状況に鑑みてなされたものであり、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文字画像のベクトル化を容易にかつ確実に行うことができる文書ファイル生成装置及び文書ファイル生成方法を提供することを目的とする。
本発明の文書ファイル生成装置は、制御部とスキャナー部とを備えた文書ファイル生成装置であって、前記制御部は、原稿の文字が前記スキャナー部によって読み取られた文字画像のOpticalCharacterReader(OCR)を行う画像認識手段と、前記画像認識手段によって認識された前記文字画像毎の文字数をカウントして、前記文字画像を文字毎に登録するカウンターと、前記カウンターにより登録されたそれぞれの前記文字画像をベクトル化するベクトル化手段と、前記カウンターにより登録されたそれぞれの前記文字画像に対して、前記ベクトル化手段によりベクトル化されたベクトルデータによりフォント置き換え処理を行い、前記ベクトルデータを書き込んだ文書ファイルであるベクトル化ファイルを生成する画像処理手段とを有し、前記OCRで得られるOCR情報は文字座標と文字コードとを少なくとも含み、前記ベクトルデータは線の起終点の座標を少なくとも含み、前記OCR情報は、認識順に登録され、前記ベクトル化手段は、前記画像認識手段によって認識され、前記カウンターにより文字毎に登録された前記文字画像の左端から右端の間で描画開始位置が一致するX座標を、前記OCR情報から検索し、前記文字画像の前記OCR情報の前記X座標と、前記ベクトルデータの描画開始位置のX座標とが一致した前記文字画像について、一致した前記文字画像の前記OCR情報のY座標の上端から下端間で前記ベクトルデータの描画開始位置のY座標を検索し、前記OCR情報のX座標及びY座標と前記ベクトルデータのX座標及びY座標とが一致した場合、該当文字と判断し、前記文字画像のベクトルデータをフォント辞書に登録し、前記フォント辞書に既に登録済みの文字が検索で見つかった場合、前記文字画像のベクトルデータの前記フォント辞書への登録を行なわず、前記ベクトルデータを再度検索し、前記OCR情報の前記X座標及びY座標と、前記ベクトルデータの描画開始位置のX座標及びY座標とが一致しない文字画像のベクトルデータを検索し、一致した文字画像のベクトルデータを破棄し、前記一致しない文字画像のベクトルデータを前記フォント辞書に追加登録し、前記一致しない文字画像のベクトルデータは、前記OCRで認識できていない文字についてのベクトル列をまとめたものであり、前記画像処理手段は、前記フォント辞書に登録された前記文字画像のベクトルデータを用いて前記ベクトル化ファイルを生成することを特徴としている。
本発明の文書ファイル生成方法は、スキャナー部を備えた文書ファイル生成装置による文書ファイル生成方法であって、原稿の文字が前記スキャナー部によって読み取られた文字画像のOpticalCharacterReader(OCR)を行う画像認識工程と、前記画像認識工程において認識された前記文字画像毎の文字数をカウントして、前記文字画像を文字毎に登録するカウンター工程と、前記カウンター工程において登録されたそれぞれの前記文字画像をベクトル化するベクトル化工程と、前記カウンター工程において登録されたそれぞれの前記文字画像に対して、前記ベクトル化工程においてベクトル化されたベクトルデータによりフォント置き換え処理を行い、前記ベクトルデータを書き込んだ文書ファイルであるベクトル化ファイルを生成する画像処理工程とを有し、前記OCRで得られるOCR情報は文字座標と文字コードとを少なくとも含み、前記ベクトルデータは線の起終点の座標を少なくとも含み、前記OCR情報は、認識順に登録され、前記ベクトル化工程は、前記画像認識工程において認識され、前記カウンター工程により文字毎に登録された前記文字画像の左端から右端の間で描画開始位置が一致するX座標を、前記OCR情報から検索する工程と、前記文字画像の前記OCR情報の前記X座標と、前記ベクトルデータの描画開始位置のX座標とが一致した前記文字画像について、一致した前記文字画像の前記OCR情報のY座標の上端から下端間で前記ベクトルデータの描画開始位置のY座標を検索する工程と、前記OCR情報のX座標及びY座標と前記ベクトルデータのX座標及びY座標とが一致した場合、該当文字と判断し、前記文字画像のベクトルデータをフォント辞書に登録する工程と、前記フォント辞書に既に登録済みの文字が検索で見つかった場合、前記文字画像のベクトルデータの前記フォント辞書への登録を行なわず、前記ベクトルデータを再度検索し、前記OCR情報の前記X座標及びY座標と、前記ベクトルデータの描画開始位置のX座標及びY座標とが一致しない文字画像のベクトルデータを検索し、一致した文字画像のベクトルデータを破棄し、前記一致しない文字画像のベクトルデータを前記フォント辞書に追加登録する工程とを有し、前記一致しない文字画像のベクトルデータは、前記OCRで認識できていない文字についてのベクトル列をまとめたものであり、前記画像処理工程は、前記フォント辞書に登録された前記文字画像のベクトルデータを用いて前記ベクトル化ファイルを生成する工程を有することを特徴としている。
本発明の文書ファイル生成装置及び文書ファイル生成方法は、ファイルサイズを増大させることなく、画像を細かく綺麗に描画することができる。
本発明の文書ファイル生成装置の一実施形態を説明するための図である。 図1の文書ファイル生成装置による文書ファイル生成方法の概要を説明するためのフローチャートである。 図1の文書ファイル生成装置による画像処理の概要を説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とパターンマッチングを利用したベクトル化処理について説明するための図である。 図1の文書ファイル生成装置における、ベクトル化とパターンマッチングを利用したベクトル化処理について説明するための図である。
以下、本発明の文書ファイル生成装置の一実施形態を、図1〜図3を参照しながら説明する。まず、図1に示すように、文書ファイル生成装置10は、制御部11、操作部12、表示部13、スキャナー部14を備えている。
制御部11は、図示しないROM内の所定のプログラムに基づき、文書ファイル生成装置10の全体の動作を制御するものであり、操作受付部11a、画像認識部11b、画像処理部11c、メモリー11d、カウンター11e、ベクトル化部11fを備えている。
操作受付部11aは、操作部12による画像処理に係わる操作を受け付ける。画像認識部11bは、スキャナー部14によって読み取られた文字画像のOCR(Optical Character Reader:文字認識)を行う。すなわち、スキャナー部14によって読み取られた文字画像が予め記憶されているパターンと照合されて特定され、その特定された文字画像のデータが得られる。
画像処理部11cは、ベクトル化部11fによってベクトル化されているデータを書き込んだ文書ファイル(以下、ベクトル化ファイルという)、又は後述の原稿20のファイル形式に従った文書ファイルの生成などを行う。メモリー11dには、スキャナー部14によって読み取られた文字画像などが記憶される。
カウンター11eは、画像認識部11bによって認識された文字毎の数(例えば文字画像「a」、「b」、「c」が認識された場合、文字画像「a」、「b」、「c」毎の文字数)をカウントして登録する。ベクトル化部11fは、画像認識部11bによって認識された文字画像のベクトル化を行うものであるが、その詳細についても後述する。
操作部12は、画像処理を指示する際に操作されるものであり、たとえばタッチパネルで構成されている。表示部13は、画像処理などをガイドするメッセージや、画像処理を選択させる項目などを表示する。スキャナー部14は、イメージセンサ(図示省略)によって読み取られる後述の原稿20の文字画像を光学的に読み取る。
次に、図2及び図3を参照し、画像処理の概要について説明する。まず、スキャナー部14により、たとえば図3に示すような原稿20の読み取りによるOCR(文字認識)を実行させる(ステップS1)。なお、図3に示す原稿20は、たとえばPDF形式のファイル(以下、PDFファイルという)を印字した文書であり、説明の都合上、たとえばa〜dの文字画像が表示されている文字層のみを示している。
すなわち、そのPDFファイルは、上述したように、文字層や画層の画像層(画像レイヤ)に含まれるオブジェクトに応じて画像処理や画像圧縮が行われる高圧縮方式による構成となっている。
また、スキャナー部14による原稿20の読み取りは、矢印で示すように、たとえば上段から順に1行ずつ行われるようになっているものとする。ここで、原稿20が読み取られると、新規の文字画像がOCR(文字認識)される毎に、それぞれ認識された文字画像の登録がカウンター11eにて行われる(ステップS2)。
すなわち、まず「a」の文字画像が認識されると、その認識された「a」の文字画像がカウンター11eのaカウンター11e−1として登録される。続いて、次の「a」の文字画像が認識されると、aカウンター11e−1の文字数が加算される。つまり、「a」の文字画像が認識される毎に、aカウンター11e−1の文字数が加算されていく。
次に、「b」の文字画像が認識されると、その認識された「b」の文字画像がカウンター11eのbカウンター11e−2として登録される。続いて、次の「b」の文字画像が認識されると、bカウンター11e−2の文字数が加算される。つまり、「b」の文字画像が認識される毎に、bカウンター11e−2の文字数が加算されていく。
次に、「c」の文字画像が認識されると、その認識された「c」の文字画像がカウンター11eのcカウンター11e−3として登録される。続いて、次の「c」の文字画像が認識されると、cカウンター11e−3の文字数が加算される。つまり、「c」の文字画像が認識される毎に、cカウンター11e−3の文字数が加算されていく。
次に、ベクトル化部11fによる文字画像のベクトル化が行われる(ステップS3)。すなわち、上述したカウンター11eのaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算されたそれぞれの文字画像である「a」〜「c」のベクトル化が行われる。
次に、画像処理部11cにより、aカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算されたそれぞれの文字画像に対して、OCR(文字認識)で得られる文字座標とベクトル化したデータの文字座標とを照らし合わせ、対象文字の抽出が行われる(ステップS4)。ちなみに、OCR(文字認識)で得られるOCR(文字認識)情報には文字座標や文字コードなどが含まれている。また、ベクトル化したデータには、線の起終点の座標(位置)などが含まれている。よって、OCR(文字認識)情報とベクトル化したデータの文字座標を照らし合わせることで、対象文字の抽出が可能となる。
次に、画像処理部11cによりフォント置き換え処理が実行される(ステップS5)。すなわち、ステップS3で行われたベクトル化部11fによるそれぞれの文字画像のベクトル化されたデータがたとえば上述したメモリー11dに記憶される。
次に、ステップS5でメモリー11dに記憶された文字画像のベクトル化されたデータに基づき、画像処理部11cによりベクトル化ファイルの生成が行われる(ステップS6)。
以上のように、本実施形態では、ステップS3でのベクトル化部11fによるそれぞれの文字画像のベクトル化の処理が行われ、ステップS6でのベクトル化部11fによりベクトル化ファイルが生成される。
次に、上述した画像処理の具体例について説明する。図4〜図8は、ベクトル化とOCR(文字認識)を利用した文書ファイルの低サイズ化のためのベクトル化処理について説明するものである。なお、以下に説明するベクトル化処理は、上述したベクトル化部11fが行うものとする。
まず、図4に示すように、原稿20を上述したスキャナー部14により読み込み、文字画像とOCR(文字認識)情報bとを取得する。なお、ベクトル画像情報(ベクトルデータ)aは、上述したように、原稿20そのもののPDFファイルの情報であり、既に取得されているものとする。また、以下に説明するフォント辞書cは、PDFファイル内に含まれているものである。ここで、描画される文字が、ベクトル画像情報(ベクトルデータ)aからでは特定できないため、OCR(文字認識)情報bから文字コードと文字座標とを取得し、以下の手順でフォント辞書cへの登録を行う。
すなわち、図5及び図6に示すように、
(1)たとえば「K」の文字画像がOCR(文字認識)されたとすると、「K」の文字画像の左端から右端の間で描画開始位置が一致するX座標を、OCR(文字認識)情報bから検索する。
(2)OCR座標(OCR(文字認識)情報bの文字座標)とベクトル画像情報aの描画開始位置のX座標とが一致した場合、Y座標の上端から下端間で描画開始位置が一致するY座標を検索する。
(3)どちらも一致した場合は、該当文字と判断しベクトル画像情報aのfillまでを文字としてフォント辞書cに登録する。
(4)既に登録済みの文字が検索で見つかった場合はフォント辞書cへの登録を行わない。
なお、図6に示すように、フォント辞書cに登録された文字がたとえば「K」「y」「o」「c」となっていると、それぞれの文字が描画処理の際にそのフォント辞書cから読み出されることになる。
次に、図7に示すように、ベクトル画像情報aのEOF(データの終端)までの検索を終えたら、次はベクトル画像情報aのベクトル座標からOCR(文字認識)情報bに対して検索をかける。ここで、OCR(文字認識)で認識できていない文字があり得るので、以下の手順でベクトル画像情報aから再度検索する。
(5)ベクトルデータの書き出し開始位置について、OCR(文字認識)で認識された文字に一致しないものを検索する。
(6)一致した文字は、別認識した記号や既にフォント辞書cに登録済みであるため破棄する。
(7)一致しない文字は、ベクトル列をまとめて1つのフォント辞書cに追加登録する。
ここで、一致しない文字のブロックができるが、9割以上はフォント辞書cに登録されるためファイルのサイズの低減につながる。
次に、図8に示すように、
(8)文字を登録したフォント辞書cからフォントを取得し、サイズ、記載座標を指定して描画処理を行う。すなわち、たとえば「K」「y」「o」「c」「o」「o」を描画する場合、それぞれの文字のフォントがフォント辞書cから取得されることになる。
次に、図9などを参照し、ベクトル化とパターンマッチングを利用した文書ファイルの低サイズ化のためのベクトル化処理について説明する。なお、以下に説明するパターンマッチングは、上述したベクトル化部11fが行うものとする。
まず、図9に示すように、原稿20を上述したスキャナー部14により読み込み、文字画像を取得し、以下の手順でフォント辞書cへの登録を行う。
すなわち、図10(a)に示すように、
(1)ベクトル化前の2値画像の近傍画素において同じ輝度を持つ要素を探し出しラベルを作成する。ここでは、たとえば「K」の文字のラベルが取得されることになる。
(2)ラベル取得時の基点dの場所の座標と、縦横のドット幅を記憶する。
(3)文字画像内の記載座標に対して検索をかける。
(4)横ドット幅(X座標)の文字画像の左端から右端間で、描画開始位置が一致するX座標をベクトル画像情報aから検索する。
(5)X座標が一致した場合は、縦ドット幅(Y座標)の上端から下端間で描画開始位置が一致するY座標をベクトル画像情報aから検索する。
(6)どちらも一致した場合は該当文字と判断し、ベクトル画像情報aのfillまでを文字として上述したフォント辞書cに登録する。
(7)既に登録済みの文字が検索で見つかった場合はフォント辞書cへの登録を行わない。
次に、図10(b)に示すように、
(8)ラベルの重心eを決め、その重心eの位置からのラベルの特徴量を算出する。
なお、特徴量は、ラベルの重心eから最外周輪郭線間までの距離(点線矢印で示している)である。これにより対象ラベルが拡大/縮小、回転をしても特徴の周期で一致させることが可能となる。
(9)特徴量の一致する文字をベクトル画像情報aから検索する。
(10)一致した文字の座標と縦横の幅を記憶する。
(11)文字が見つからなくなるまで(9)、(10)を繰り返す。
(12)次のラベルを取得し、上記同様のパターンマッチングを行う。
このとき、記憶した文字と座標を次の検索対象から外す。
(13)描画処理の際は、フォント辞書cからフォントを取得し、サイズ、記載座標が指定される。
このように、本実施形態では、画像処理部11cにより、文字認識により得られる文字座標とベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書cに登録できる。また、文字認識により得られる文字画像から算出される特徴量との照合(パターンマッチング)により一致する文字画像のベクトル化データをフォント辞書に登録できる。
また、フォント辞書cへの登録を行う場合、既に登録済みの文字についてはその登録が行われないようにしているため、登録すべき文字画像が増えてもファイルサイズが増大してしまうことを抑制することができる。
このような本発明の文書ファイル生成装置及び文書ファイル生成方法は、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文字画像のベクトル化を容易にかつ確実に行うことができる。
以上、具体的な実施の形態により本発明を説明したが、上記実施の形態は本発明の例示であり、この実施の形態に限定されないことは言うまでもない。
本発明は、文書ファイル生成装置及び文書ファイル生成方法に好適であるが、文書ファイル生成装置及び文書ファイル生成方法に限られるものではなく、文書ファイルを生成する機能を備える装置及び文書ファイル生成一般に適用できる。
10 文書ファイル生成装置
11 制御部
11a 操作受付部
11b 画像認識部
11c 画像処理部
11d メモリー
11e カウンター
11e−1 aカウンター
11e−2 bカウンター
11e−3 cカウンター
11f ベクトル化部
12 操作部
13 表示部
14 スキャナー部
20 原稿
a ベクトル画像情報(ベクトルデータ)
b OCR(文字認識)情報
c フォント辞書
d 基点
e 重心

Claims (2)

  1. 制御部とスキャナー部とを備えた文書ファイル生成装置であって、
    前記制御部は、
    原稿の文字が前記スキャナー部によって読み取られた文字画像のOptical Character Reader(OCR)を行う画像認識手段と、
    前記画像認識手段によって認識された前記文字画像毎の文字数をカウントして、前記文字画像を文字毎に登録するカウンターと、
    前記カウンターにより登録されたそれぞれの前記文字画像をベクトル化するベクトル化手段と、
    前記カウンターにより登録されたそれぞれの前記文字画像に対して、前記ベクトル化手段によりベクトル化されたベクトルデータによりフォント置き換え処理を行い、前記ベクトルデータを書き込んだ文書ファイルであるベクトル化ファイルを生成する画像処理手段とを有し、
    前記OCRで得られるOCR情報は文字座標と文字コードとを少なくとも含み、前記ベクトルデータは線の起終点の座標を少なくとも含み、
    前記OCR情報は、認識順に登録され、
    前記ベクトル化手段は、
    前記画像認識手段によって認識され、前記カウンターにより文字毎に登録された前記文字画像の左端から右端の間で描画開始位置が一致するX座標を、前記OCR情報から検索し、
    前記文字画像の前記OCR情報の前記X座標と、前記ベクトルデータの描画開始位置のX座標とが一致した前記文字画像について、一致した前記文字画像の前記OCR情報のY座標の上端から下端間で前記ベクトルデータの描画開始位置のY座標を検索し、
    前記OCR情報のX座標及びY座標と前記ベクトルデータのX座標及びY座標とが一致した場合、該当文字と判断し、前記文字画像のベクトルデータをフォント辞書に登録し、
    前記フォント辞書に既に登録済みの文字が検索で見つかった場合、前記文字画像のベクトルデータの前記フォント辞書への登録を行なわず、
    前記ベクトルデータを再度検索し、前記OCR情報の前記X座標及びY座標と、前記ベクトルデータの描画開始位置のX座標及びY座標とが一致しない文字画像のベクトルデータを検索し、一致した文字画像のベクトルデータを破棄し、前記一致しない文字画像のベクトルデータを前記フォント辞書に追加登録し、
    前記一致しない文字画像のベクトルデータは、前記OCRで認識できていない文字についてのベクトル列をまとめたものであり、
    前記画像処理手段は、
    前記フォント辞書に登録された前記文字画像のベクトルデータを用いて前記ベクトル化ファイルを生成することを特徴とする文書ファイル生成装置。
  2. スキャナー部を備えた文書ファイル生成装置による文書ファイル生成方法であって、
    原稿の文字が前記スキャナー部によって読み取られた文字画像のOptical Character Reader(OCR)を行う画像認識工程と、
    前記画像認識工程において認識された前記文字画像毎の文字数をカウントして、前記文字画像を文字毎に登録するカウンター工程と、
    前記カウンター工程において登録されたそれぞれの前記文字画像をベクトル化するベクトル化工程と、
    前記カウンター工程において登録されたそれぞれの前記文字画像に対して、前記ベクトル化工程においてベクトル化されたベクトルデータによりフォント置き換え処理を行い、前記ベクトルデータを書き込んだ文書ファイルであるベクトル化ファイルを生成する画像処理工程とを有し、
    前記OCRで得られるOCR情報は文字座標と文字コードとを少なくとも含み、前記ベクトルデータは線の起終点の座標を少なくとも含み、
    前記OCR情報は、認識順に登録され、
    前記ベクトル化工程は、
    前記画像認識工程において認識され、前記カウンター工程により文字毎に登録された前記文字画像の左端から右端の間で描画開始位置が一致するX座標を、前記OCR情報から検索する工程と、
    前記文字画像の前記OCR情報の前記X座標と、前記ベクトルデータの描画開始位置のX座標とが一致した前記文字画像について、一致した前記文字画像の前記OCR情報のY座標の上端から下端間で前記ベクトルデータの描画開始位置のY座標を検索する工程と、
    前記OCR情報のX座標及びY座標と前記ベクトルデータのX座標及びY座標とが一致した場合、該当文字と判断し、前記文字画像のベクトルデータをフォント辞書に登録する工程と、
    前記フォント辞書に既に登録済みの文字が検索で見つかった場合、前記文字画像のベクトルデータの前記フォント辞書への登録を行なわず、前記ベクトルデータを再度検索し、前記OCR情報の前記X座標及びY座標と、前記ベクトルデータの描画開始位置のX座標及びY座標とが一致しない文字画像のベクトルデータを検索し、一致した文字画像のベクトルデータを破棄し、前記一致しない文字画像のベクトルデータを前記フォント辞書に追加登録する工程とを有し、
    前記一致しない文字画像のベクトルデータは、前記OCRで認識できていない文字についてのベクトル列をまとめたものであり、
    前記画像処理工程は、前記フォント辞書に登録された前記文字画像のベクトルデータを用いて前記ベクトル化ファイルを生成する工程を有することを特徴とする文書ファイル生成方法。
JP2014130606A 2014-06-25 2014-06-25 文書ファイル生成装置及び文書ファイル生成方法 Expired - Fee Related JP6432179B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014130606A JP6432179B2 (ja) 2014-06-25 2014-06-25 文書ファイル生成装置及び文書ファイル生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014130606A JP6432179B2 (ja) 2014-06-25 2014-06-25 文書ファイル生成装置及び文書ファイル生成方法

Publications (2)

Publication Number Publication Date
JP2016009395A JP2016009395A (ja) 2016-01-18
JP6432179B2 true JP6432179B2 (ja) 2018-12-05

Family

ID=55226895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014130606A Expired - Fee Related JP6432179B2 (ja) 2014-06-25 2014-06-25 文書ファイル生成装置及び文書ファイル生成方法

Country Status (1)

Country Link
JP (1) JP6432179B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108339B (zh) * 2018-01-10 2018-12-04 北京仁和汇智信息技术有限公司 一种pdf边界及网格线标识的方法及装置
CN109460701B (zh) * 2018-09-10 2020-09-25 昆明理工大学 一种基于纵横直方图的字体识别方法
CN109670461A (zh) * 2018-12-24 2019-04-23 广东亿迅科技有限公司 Pdf文字提取方法、装置、计算机设备和存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096315A (ja) * 1995-06-22 1997-01-10 Canon Inc フォントデータ管理方法およびフォントデータ管理装置
JP2002287674A (ja) * 2001-03-28 2002-10-04 Toshiba Corp 広告挿入方法および広告挿入装置およびプログラム
JP2003085164A (ja) * 2001-09-07 2003-03-20 Xelo Inc 文書出力装置、方法及びコンピュータプログラム
JP2006202026A (ja) * 2005-01-20 2006-08-03 Canon Inc 情報処理装置及び制御方法
EP1736895A1 (en) * 2005-06-21 2006-12-27 PDFlib GmbH Method of determining Unicode values corresponding to the text in digital documents
US8201088B2 (en) * 2006-07-25 2012-06-12 Monotype Imaging Inc. Method and apparatus for associating with an electronic document a font subset containing select character forms which are different depending on location
JP2008117037A (ja) * 2006-11-01 2008-05-22 Fujitsu Ltd 文字認識辞書作成プログラム及び文字認識辞書作成方法
JP2008148263A (ja) * 2006-12-13 2008-06-26 Canon Inc 画像形成装置及びその制御方法
JP2008199249A (ja) * 2007-02-13 2008-08-28 Fuji Xerox Co Ltd 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム
JP4123299B1 (ja) * 2007-02-21 2008-07-23 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5159588B2 (ja) * 2008-12-05 2013-03-06 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム

Also Published As

Publication number Publication date
JP2016009395A (ja) 2016-01-18

Similar Documents

Publication Publication Date Title
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
CN109409398B (zh) 图像处理装置、图像处理方法以及存储介质
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
JP6527410B2 (ja) 文字認識装置、文字認識方法、及びプログラム
US8254721B2 (en) Data input system, data input receiving device, data input receiving method and computer readable medium
US10339657B2 (en) Character detection apparatus and method
JP2009238217A (ja) 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP6432179B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
US10032059B2 (en) Image analyzing apparatus that identifies barcode image in target image
JP2011090578A (ja) 画像処理装置、画像処理方法及びプログラム
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
JP5623574B2 (ja) 帳票識別装置および帳票識別方法
CN111338733A (zh) 用户界面适配方法和系统
JP6624120B2 (ja) 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体
JP2020087112A (ja) 帳票処理装置および帳票処理方法
JP2014154066A (ja) 文字認識システム、文字認識プログラム及び文字認識方法
JP6118646B2 (ja) 帳票処理装置、帳票処理方法、帳票処理プログラム
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP5169648B2 (ja) 原画像探索装置及び原画像探索プログラム
JP2021034778A (ja) 情報処理装置及び情報処理プログラム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP2004005761A (ja) キーワード抽出・検索装置
WO2015189941A1 (ja) 情報処理装置、情報処理方法、および、プログラム
JP2017207837A (ja) 画像検査装置、画像検査方法、およびプログラム
JP2016128990A (ja) 画像補正装置、画像補正システム、画像補正方法、及び画像補正プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181009

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181022

R150 Certificate of patent or registration of utility model

Ref document number: 6432179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees