JP2016162211A - 情報処理装置、制御方法及びプログラム - Google Patents
情報処理装置、制御方法及びプログラム Download PDFInfo
- Publication number
- JP2016162211A JP2016162211A JP2015040536A JP2015040536A JP2016162211A JP 2016162211 A JP2016162211 A JP 2016162211A JP 2015040536 A JP2015040536 A JP 2015040536A JP 2015040536 A JP2015040536 A JP 2015040536A JP 2016162211 A JP2016162211 A JP 2016162211A
- Authority
- JP
- Japan
- Prior art keywords
- line
- image
- information processing
- calibration
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】文脈の前後関係を勘案して校正を実行させつつ、校正作業の効率性及び正確性を好適に向上させることが可能な情報処理装置、制御方法及びプログラムを提供する。【解決手段】校正用端末2は、底本からスキャンした画像とOCRで読み取った文字とを一行単位で並列表示し、これらの見た目上のずれが生じないようにフォントサイズ等を設定する。また、校正用端末2は、校正に関し注目すべき個所を検索し、当該箇所を校正用画面においてマーカにより強調表示する。また、校正用端末2は、検索した箇所がゴミと推定される部分であるか、圏点が誤認識された部分であるか、又はルビ置換が適切に実行されなかった部分であるか等に応じて、付すべきマーカの色分けを行う。さらに、校正用端末2は、校正用画面の左上に、一行画像として使用した部分を半透明オブジェクトで重ねた一頁画像を表示させ、OCRソフトウェアで認識できなかった文字を明示する。【選択図】図3
Description
本発明は、光学文字認識(OCR:Optical Character Recognition)で認識した文字を校正する技術に関する。
従来から、OCRの結果に基づくテキストデータの校正作業を支援するシステムが知られている。特許文献1には、校正を行う画面において、OCRの対象となる原稿画像とOCRにより認識した文章とを、所定の単位で対比させて表示する点について記載されている。
特許文献1に記載のシステムでは、原稿画像とOCRにより認識した文章とを対比表示した画面を参照して校正者が校正作業を行うことができるため、原稿画像とOCRにより認識した文章との違いを文脈の前後関係を勘案して判定することができる。一方、OCRにより認識した全ての文字について、校正者が原稿画像中の文字と比較し、校正すべき箇所を検出するのは手間がかかるという問題がある。
本発明は、文脈の前後関係を勘案して校正を実行させつつ、校正作業の効率性及び正確性を好適に向上させることが可能な情報処理装置、制御方法及びプログラムを提供することを主な課題とする。
本発明の1つの観点では、文章を校正する情報処理装置であって、原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段と、前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御手段と、を備え、前記表示制御手段は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示する。
上記情報処理装置は、記憶手段と、表示制御手段とを備える。記憶手段は、原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する。表示制御手段は、記憶手段が記憶する文章の情報及び体裁に関する情報に基づき、原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる。このとき、表示制御手段は、光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示する。ここで、「文章の体裁に関する情報」とは、原稿画像に表示された文章の各文字を、原稿画像に表示されたレイアウトを再現するように並べて表示するのに必要な情報を指し、例えば行幅、各文字の大きさ及び位置情報などが該当する。このように、情報処理装置は、原稿画像と光学文字認識の結果とを一行単位で対比して表示すると共に、校正に関し注目すべき箇所を強調表示することで、校正が必要な箇所を容易にユーザに把握させ、校正作業の効率性及び正確性を好適に向上させることができる。
上記情報処理装置の一態様では、前記表示制御手段は、前記原稿画像を、前記一行画像及び前記一行分の文章と重ならない位置に表示する。この態様により、ユーザは、原稿画像の元となる紙等を参照することなく、校正作業を効率的に実行することができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、前記一行画像として表示した箇所を強調して前記原稿画像を表示させる。この態様により、情報処理装置は、OCRで認識できなかった行を好適にユーザに把握させることができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、前記原稿画像における行の幅に基づき、前記表示手段に表示させる前記文章の文字の大きさを決定する。この態様により、情報処理装置は、原稿画像と光学文字認識の結果とを一行単位で対比して表示する際に、文字の大きさを比較しやすいように揃えて表示することができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、前記校正に関し注目すべき箇所を、色分けすることで分類して表示させる。これにより、情報処理装置は、強調表示した箇所に対して必要な作業を、色により好適に把握させることができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、前記光学文字認識の誤認識により発生した不要な文字又は記号を前記文章から検索し、当該文字又は記号を前記校正に関し注目すべき箇所として強調表示する。これにより、情報処理装置は、不要な文字又は記号を好適にユーザに認識させて削除を促すことができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、前記光学文字認識が圏点を誤認識した箇所を前記文章から検索し、当該箇所を前記校正に関し注目すべき箇所として強調表示する。これにより、情報処理装置は、圏点に関する校正作業が必要な箇所をユーザに好適に把握させることができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、親文字とルビとの組み合わせが指定されている箇所を前記文章から検索し、当該箇所を前記親文字に前記ルビが付加された文字に置換する。この態様により、情報処理装置は、原稿画像においてルビが付された文字部分に対し、原稿画像と同様にルビを付した状態に校正することができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、外部入力に基づき、選択された箇所の字間を調整する。この態様により、情報処理装置は、原稿画像と光学文字認識の結果とを一行単位で対比して表示する際に、ユーザ操作に基づき、対応する文字の位置を好適に揃えることができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を、段落末尾に付す改行記号と異ならせる。これにより、情報処理装置は、原稿画像と光学文字認識の結果とを比較するために付した改行を、段落終了に伴う改行と好適に識別することができる。
上記情報処理装置の他の一態様では、前記表示制御手段は、外部入力に基づき、前記一行画像、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を削除する。この態様により、情報処理装置は、校正作業が終了した際に、校正作業時の比較のために便宜上挿入した一行画像や改行等を好適に削除することができる。
本発明に好適なさらに別の実施形態では、プログラムは、上記いずれか記載の情報処理装置としてコンピュータを機能させる。このプログラムをコンピュータにインストールして機能させることで、本発明に係る情報処理装置を構成させることができる。
本発明に係る他の好適な実施形態では、原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段を有する情報処理装置が実行する制御方法であって、前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御工程を有し、前記表示制御工程は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示する。情報処理装置は、この制御方法を実行することで、校正が必要な箇所を容易にユーザに把握させ、校正作業の効率性及び正確性を好適に向上させることができる。
本発明に係る情報処理装置によれば、原稿画像と光学文字認識の結果とを一行単位で対比して表示すると共に、校正に関し注目すべき箇所を強調表示することで、校正が必要な箇所を容易にユーザに把握させ、校正作業の効率性及び正確性を好適に向上させることができる。
以下、図面を参照しながら、本発明を実施するのに好適な実施形態について説明する。
[校正システムの構成]
図1は、本実施例に係る校正システムのブロック図である。本実施例に係る校正システムは、OCRにより認識した文字の校正を行うためのシステムであり、スキャナ1と、校正用端末2とを有する。
図1は、本実施例に係る校正システムのブロック図である。本実施例に係る校正システムは、OCRにより認識した文字の校正を行うためのシステムであり、スキャナ1と、校正用端末2とを有する。
スキャナ1は、紙の本(所謂底本)の頁をスキャンした画像を生成して校正用端末2へ供給する。以後では、スキャナ1が読み取って生成した底本の一頁分の画像を「一頁画像」とも呼ぶ。一頁画像は、本発明における「原稿画像」の一例である。
校正用端末2は、スキャナ1が生成した底本の各頁の一頁画像を取得し、各一頁画像に対して光学文字認識(OCR)を行うことで、各一頁画像に記載の文字及びその体裁に関するファイル(「OCR結果ファイルFo」とも呼ぶ。)を生成する。そして、校正用端末2は、校正を行う対象となる頁(「対象頁」とも呼ぶ。)をユーザが指定した場合に、対応する一頁画像及びOCR結果ファイルFoを用いて校正用画面を表示し、校正に関する入力を受け付ける。校正用画面では、校正用端末2は、後述するように、対象頁の一頁画像を一行ごとにトリミングした画像(「一行画像」とも呼ぶ。)と、当該一行画像部分の文字認識結果に相当する一行分の文章(「一行文章」とも呼ぶ。)とを並べて表示する。校正用端末2は、本発明における「情報処理装置」の一例である。
なお、校正用端末2は、画像情報が既に存在する底本の場合には、当該画像情報に基づきOCRを実行し、校正画面の表示等を行ってもよい。また、校正用端末2は、OCRを自ら実行してOCR結果ファイルFoを取得する代わりに、スキャナ1と接続した他の端末が生成したOCR結果ファイルFoを取得してもよい。
[校正用端末の構成]
図2は、校正用端末2のブロック構成を示す。校正用端末2は、ディスプレイなどの表示部11と、タッチパネル、マウス、キーボードなどの入力部12と、記憶部13と、スキャナ1等とデータ通信を行う通信部14と、制御部15とを備える。これらの各要素は、バスライン10を介して相互に接続されている。
図2は、校正用端末2のブロック構成を示す。校正用端末2は、ディスプレイなどの表示部11と、タッチパネル、マウス、キーボードなどの入力部12と、記憶部13と、スキャナ1等とデータ通信を行う通信部14と、制御部15とを備える。これらの各要素は、バスライン10を介して相互に接続されている。
記憶部13は、ハードディスク又はフラッシュメモリといったメモリによって構成され、制御部15が実行するプログラムや校正処理に必要な情報を予め記憶する。例えば、記憶部13は、例えば「WinReaderPRO」などのOCRソフトウェアのプログラムや、OCR結果ファイルFoに基づき文章を表示するWORD(登録商標)などの文書表示ソフトウェアのプログラムを記憶する。さらに、本実施例では、記憶部13は、文書表示ソフトウェアに組み込む校正用のマクロプログラム(「校正用マクロ」とも呼ぶ。)を記憶する。さらに、記憶部13は、底本の各頁をスキャンした一頁画像の情報(「底本画像情報Is」とも呼ぶ。)と、対応するOCR結果ファイルFoとを記憶する。また、記憶部13は、校正により削除すべき文字又は記号(単に「ゴミ」とも呼ぶ。)を識別する際に参照するテーブル(「ゴミ識別テーブルTg」とも呼ぶ。)を記憶する。ゴミ識別テーブルTgのデータ構造については後述する。
制御部15は、図示しないCPU、ROM及びRAMなどを備え、校正用端末2内の各構成要素に対して種々の制御を行う。本実施形態では、制御部15は、OCRソフトウェアに基づき、底本画像情報Isに含まれる各一頁画像に対してOCRを実行し、OCR結果ファイルFoを生成する。また、制御部15は、校正用マクロが組み込まれた文書表示ソフトウェアに基づき、校正用画面を表示する。このとき、制御部15は、ルビを置換する処理(「ルビ置換処理」とも呼ぶ。)、ゴミ部分を特定して強調表示する処理(「ゴミ処理」とも呼ぶ。)、及び圏点部分を特定して強調表示する処理(「圏点処理」とも呼ぶ。)を行う。さらに、制御部15は、校正用画面上に、OCRにより認識した文章を校正するための各種入力ボタンを備えたウィンドウ(「操作用ウィンドウ」とも呼ぶ。)を表示し、上記各種入力ボタンの押下を入力部12への入力により検知することで、強調表示した箇所の校正に関する入力を受け付ける。
なお、制御部15は、本発明における「表示制御手段」及びプログラムを実行する「コンピュータ」の一例である。
[校正処理の詳細]
(1)校正用画面のレイアウト
図3は、校正用画面の表示例である。なお、図3では、ツールバーや操作ウィンドウなどの操作用インタフェース等は便宜上図示していない。制御部15は、入力部12により、読み込むべきOCR結果ファイルFo、表示すべきテキストの組方向、及び対象頁を指定する入力を受け付けることで、図3に示す校正用画面を表示している。なお、図3では、対象頁の中間部分の文章にあたる表示を便宜上省略している。また、校正用画面は、指定された箇所を単色で塗りつぶして表示する機能(所謂マーカ機能)を有しているものとする。
(1)校正用画面のレイアウト
図3は、校正用画面の表示例である。なお、図3では、ツールバーや操作ウィンドウなどの操作用インタフェース等は便宜上図示していない。制御部15は、入力部12により、読み込むべきOCR結果ファイルFo、表示すべきテキストの組方向、及び対象頁を指定する入力を受け付けることで、図3に示す校正用画面を表示している。なお、図3では、対象頁の中間部分の文章にあたる表示を便宜上省略している。また、校正用画面は、指定された箇所を単色で塗りつぶして表示する機能(所謂マーカ機能)を有しているものとする。
図3の例では、まず、制御部15は、ユーザ入力により指定されたOCR結果ファイルFoを読み込むと共に、対象頁の一頁画像を底本画像情報Isから抽出する。そして、制御部15は、指定された組方向に基づき、対象頁の一頁画像の各行の認識結果である一行文章21〜25を縦組で表示すると共に、各一行文章21〜25の左側に、対応する一行画像31〜35を挿入している。なお、図3の例では、制御部15は、一行文章21〜25を縦組で表示しているが、組方向が横組に指定された場合には、横組で表示する。
ここで、制御部15は、一行画像31〜35を、対象頁の一頁画像から行ごとにトリミングすることで生成する。このとき、制御部15は、ルビや圏点を表示させるため、一行画像31〜35を一頁画像からトリミングする際には、一行画像31〜35の行の幅を、OCR結果ファイルFoで示される行の幅の1.5倍に設定している。また、制御部15は、段落開始部分(例えば一行画像33)などでの字下げを目立たせるため、一行画像31〜35をトリミングする上端位置を、字下げの有無に関わらず全て同一位置に揃えて設定している。
また、制御部15は、OCR結果ファイルFoに含まれる行幅等の体裁情報に基づき、一行文章21〜25に適用すべきフォントサイズを決定している。これにより、制御部15は、一行画像31〜35と一行文章21〜25とを、対応する文字ごとに揃えて表示させ、これらの比較を容易にしている。フォントサイズ等の決定方法については、「(2)フォントサイズ及び行送りの設定」のセクションで詳しく説明する。
また、制御部15は、一行文章21〜25のうち、段落が終了する文章の文末には、上方に折れ曲がった矢印「A1」により表された段落記号(横組の場合には上から下に延びて左に垂直に曲がる矢印)を改行記号として挿入し、それ以外の文章の文末には、左方向を指した矢印「A2」により表された任意指定の行区切りを改行記号として挿入している。これにより、制御部15は、文字の比較がし易いように校正用画面のレイアウトを適切に保つと共に、校正終了時に、校正時の比較用に便宜上挿入した改行を、段落終了の改行と混同することなく削除することができる。同様に、制御部15は、一行画像31〜35の末尾には、段落記号と分けて削除可能な任意指定の行区切りを挿入している。
また、制御部15は、並べて表示した一行文章21〜25及び一行画像31〜35の末尾部分に、改ページ記号(即ちページ区切り)を挿入している。このように、制御部15は、一頁毎に改ページ記号を挿入することで、一頁画像の内容を文書表示ソフトウェアのドキュメント上での一頁に留め、一頁ごとの比較を容易にする。
さらに、図3の例では、制御部15は、ルビ置換処理を行った部分の文字を薄く塗りつぶすことで強調表示している。具体的には、制御部15は、ハッチング領域R1、R2に囲まれた文字に対してルビ置換処理を実行したことから、ハッチング領域R1、R2内を強調表示している。また、図3の例では、制御部15は、ゴミ処理によりゴミであると判定した部分を、所定色(ここでは赤色とする)のマーカにより強調表示している。具体的には、制御部15は、一点鎖線枠G1内の記号等がゴミであると判断し、一点鎖線枠G1内を赤色マーカで塗りつぶしている。ゴミ処理については、「(3)ゴミ処理」のセクションで詳しく説明する。さらに、図3の例では、制御部15は、圏点部分を文字認識することにより発生した記号等を、所定色(ここでは黄色とする)のマーカにより強調表示している。具体的には、制御部15は、二点鎖線枠K1内の記号等が圏点の誤認識により生じた部分であると判断し、二点鎖線枠K1内を黄色マーカで表示している。圏点処理については、「(5)圏点処理」のセクションで詳しく説明する。
また、制御部15は、校正用画面の左上に、対象頁の画像である一頁画像40を表示させている。これにより、ユーザは、紙の底本を参照することなく、底本でのレイアウトを確認しながら校正を行うことができる。さらに、制御部15は、一頁画像40上の各一行画像31〜35に対応する範囲に、半透明オブジェクト41〜45を重ねて表示している。これにより、制御部15は、一頁画像40内で一行画像31〜35としてトリミングした部分を明示し、OCRで認識できなかった行がないかユーザが確認できるようにする。本実施例では、OCRソフトウェアの仕様が、罫線が文字認識結果に反映されない仕様となっている。よって、図3の例では、一頁画像40内の区切りマーク46の行が、罫線のみから形成されていることにより、当該行の存在は無視されて所謂行抜けが発生している。この場合であっても、一頁画像40内の区切りマーク46に半透明オブジェクトが重ならないので、他の行と比べて色が濃く表示されるため、ユーザは、半透明オブジェクト41〜45が重ねられた一頁画像40を参照することで、行抜け部分(図3の例では区切りマーク46の行)の存在を好適に認識することができる。
また、制御部15は、一頁画像40及び半透明オブジェクト41〜45に対してグループ化設定を行い、一頁画像40と半透明オブジェクト41〜45との相対位置がずれないようにする。
(2)フォントサイズ及び行送りの設定
次に、OCRにより認識した文字を校正用画面で表示する際のフォントサイズ及び行送りの設定方法について説明する。
次に、OCRにより認識した文字を校正用画面で表示する際のフォントサイズ及び行送りの設定方法について説明する。
制御部15は、OCR結果ファイルFoを参照し、一頁画像内において段落やセクションごとに分けられた一又は複数行からなるブロックごとに、各一行画像の行の幅の平均値を算出する。そして、制御部15は、算出した平均値に基づき、ブロックごとのフォントサイズを決定する。これにより、制御部15は、字種によって字面が異なる場合であっても、一行画像とこれに対応する一行文章との文字の大きさを均一にし、対応する行ごとに位置を揃えて表示することができる。
また、制御部15は、算出したフォントサイズに基づき、行送りを計算する。図4は、行送りの設定方法の概要を示す図である。図4は、一例として、横組の場合について説明した図である。
図4に示すように、制御部15は、親文字のフォントサイズを「X」pt(Xは正数)とすると、ルビのフォントサイズを親文字の半分である「X/2」ptであるとみなす。また、制御部15は、親文字とルビとの距離を、固定値の1ptに定める。そして、制御部15は、行幅を、親文字のフォントサイズと、ルビのフォントサイズと、親文字とルビの距離との合計値(即ち「3X/2+1」pt)に定める。また、制御部15は、行間を、行幅の1/4(即ち、「{3X/2+1}/4」pt)に定める。そして、制御部15は、行送りを、行幅と行間との合計値(即ち、「{15X/2+5}/4」pt)に定める。
以上の前提によれば、制御部15は、親文字のフォントサイズから行送りを好適に計算することができる。よって、制御部15は、各一行画像の行の幅の平均値に基づきフォントサイズ(上述の説明のX)を設定することで、行送りについても好適に設定することができる。
なお、文書表示ソフトウェアとしてWORDを用いた場合、親文字のフォントの設定は、0.5pt区切りとなる。よって、この場合、制御部15は、フォントサイズを0.5区切りにより小数部分を近似する。この場合、制御部15は、各一行画像の行の幅の平均値の整数部を「α」、少数部を「β」とした場合、「0.25≦β≦0.75」の場合に整数部αに0.5を加算した値をフォントサイズとし、「0.75≦β」の場合に整数部αに1を加算した値をフォントサイズとして設定する。例えば、各一行画像の行の幅の平均値が「10.38」ptの場合、親文字のフォントサイズを「10.5」ptに設定し、上述の平均値が「9.89」ptの場合、親文字のフォントサイズを「10.0」ptに設定する。
(3)ゴミ処理
次に、ゴミ処理について説明する。本実施例では、制御部15は、一例として、2つ以上の空白と、ゴミ識別テーブルTgに登録されている文字とが連続している箇所を、ゴミとして認識し、赤色マーカにより印をつけて表示する。なお、ゴミの定義は、上記記載に限定されない。
次に、ゴミ処理について説明する。本実施例では、制御部15は、一例として、2つ以上の空白と、ゴミ識別テーブルTgに登録されている文字とが連続している箇所を、ゴミとして認識し、赤色マーカにより印をつけて表示する。なお、ゴミの定義は、上記記載に限定されない。
図5は、ゴミ識別テーブルTgに登録されている文字(記号)及び文字コード(ここではユニコードとする)の一覧を示す。表示制御部15は、空白が連続した後に、図5に示される文字が存在する場合に、当該箇所をゴミとして認識する。図3の例では、一行画像32の行末部分に付いた汚れをスキャンした部分が、OCRの誤認識により、一点鎖線枠G1内の文字に変換されている。この場合、制御部15は、一点鎖線枠G1内において、空白が4つ連続した後に、ゴミ識別テーブルTgに登録されている「、」が連続していることから、一点鎖線枠G1内の部分をゴミとして認識し、赤色マーカにより印をつけている。
(4)ルビ置換処理
次に、ルビ置換処理について図6を参照して説明する。
次に、ルビ置換処理について図6を参照して説明する。
図6(A)は、底本におけるルビを含む文章50Aと、文章50Aに対してOCRを行った結果として出力される文章50Bと、文章50Bに対してルビ置換処理を行った後の文章50Cとを示す。図6(A)の例では、文章50Aに対してOCRを行った場合、OCRソフトウェアの設定に基づき、ルビ付き文字が「#親文字{ルビ}」の形式で出力されている。なお、上記の「#{}」の各記号は全角になっているが、実際には半角の記号が使用される。
この場合、制御部15は、「#」及び波括弧の組合せを検索することで、ルビ付き文字に相当する箇所を認識する。そして、制御部15は、これらの記号の位置に基づき、ルビ付き文字の親文字とルビとをそれぞれ認識し、該当箇所をルビ付き文字に置換する処理を行う。これにより、制御部15は、OCRの対象となる画像中のルビ付き文字を好適に校正画面上で再現して表示することができる。なお、制御部15は、ゴミ等と判定されてマーカで印が付けられている箇所については、ルビ置換処理の対象外とする。
図6(B)は、ルビ置換処理における例外処理の流れを示す。図6(B)では、底本において行を跨いでルビ付き文字が存在する2行分の文章51Aと、文章51Aに対してOCRを行った結果に基づき校正用画面に出力される文章51Bと、文章51Bに対してルビ置換処理を行った後の文章51Cとを示す。なお、文章51B、51Cには、行間に一行画像51Dが挿入されている。
図6(B)の例では、OCR後の文章51Bでは、「#親文字{ルビ}」の箇所が行を跨ぐため、本実施例における校正用画面の仕様上、「#」と波括弧との間に一行画像が挿入されてしまう。よって、この場合、制御部15は、図6(A)で説明した原則に基づいたルビ置換処理を行うことができない。よって、この場合には、制御部15は、ルビ付き文字の親文字及び波括弧内のルビ(即ち実線枠内の文字)に対して所定色(ここでは緑色とする)のマーカを付す。これにより、制御部15は、ルビ置換処理が適切にできなかった部分を強調し、校正が必要な箇所(即ちルビ置換が必要な箇所)であることをユーザに認識させる。
(5)圏点処理
次に、圏点処理について説明する。OCRソフトウェアによっては、圏点を認識する機能がなく、この場合、平仮名の「へ」若しくはカタカナの「ヘ」のルビとして誤認識される。この場合、制御部15は、圏点が誤認識された部分に対して黄色マーカを付して強調表示する。
次に、圏点処理について説明する。OCRソフトウェアによっては、圏点を認識する機能がなく、この場合、平仮名の「へ」若しくはカタカナの「ヘ」のルビとして誤認識される。この場合、制御部15は、圏点が誤認識された部分に対して黄色マーカを付して強調表示する。
図7(A)は、圏点を含む底本における文章52Aと、文章52Aに対してOCRを行った結果として出力される文章52Bと、文章52Bに対して圏点処理を実行した後の文章52Cとを示す。図7(A)の文章52Bでは、OCRソフトウェアが圏点を認識する機能がないことにより、圏点付きの文字「蜘蛛」がルビ「へへ」が付された親文字として変換されている。
この場合、制御部15は、平仮名若しくはカタカナの「へ」のみからなるルビを指定する箇所を検索し、該当する箇所に対して黄色マーカを付す。図7(A)の例では、制御部15は、二点鎖線枠内の「{へへ}」に対して黄色マーカを付して強調表示している。これにより、制御部15は、黄色マーカの部分が圏点である可能性が高いことをユーザに好適に認識させる。
また、制御部15は、OCRソフトウェアでは、漢字以外の文字にルビが付されないこと等に起因して、ルビが正しい形式で指定されていない場合についても、図7(A)の例と同様、該当箇所に対して黄色マーカを付して強調表示する。以後では、この処理も圏点処理と呼ぶことにする。
図7(B)は、ルビ付きのローマ字を含む底本中の文章53Aと、文章53Aに対してOCRを行った結果として出力される文章53Bと、文章53Bに対して圏点処理を行った場合の実行結果である文章53Cとを示す。図7(B)の例では、OCRソフトウェアは、漢字以外にルビが付されるのを想定した仕様となっていないため、適切でない位置に、ルビを指定する文字列を挿入している。この場合、制御部15は、「#」と波括弧の位置が適切でないことを検知し、二点鎖線枠内の「#」に対して黄色マーカを付す。これにより、制御部15は、ルビ置換処理が適切に行われない部分を、好適にユーザに認識させることができる。
(6)操作ウィンドウ
校正用画面において表示される各操作ウィンドウについて、図8(A)〜(C)を参照して説明する。
校正用画面において表示される各操作ウィンドウについて、図8(A)〜(C)を参照して説明する。
図8(A)は、ユーザの判断が必要なマーカ部分の対応を決定するための操作ウィンドウ(「マーカ処理ウィンドウ」とも呼ぶ。)の一例である。図8(A)に示すマーカ処理ウィンドウは、例えば図3に示す校正用画面の図示しないツールバー等での操作に基づき表示されるものであって、ボタン55A〜55Kを有する。
ボタン55Aは、赤色マーカが付された「ゴミ」、黄色マーカが付された「圏点」、緑色マーカが付された「行末ルビ」のいずれかの箇所を選択するためのラジオボタンである。制御部15は、ボタン55Bが選択された場合、ボタン55Aで指定された箇所にカーソルをジャンプさせ、ジャンプ先のマーカ部分を選択状態とする。そして、制御部15は、マーカ部分が選択状態のときにボタン55C〜55Kの押下を検知した場合に、所定の処理を実行する。
具体的には、制御部15は、「マーカ解除」のボタン55Cが選択された場合、選択状態の文字のマーカを解除(消去)する。また、制御部15は、「マーカ文字削除」のボタン55Dが押下された場合、選択状態の文字を削除する。制御部15は、「赤マーカ文字削除」のボタン55Eが押下された場合、赤いマーカで印が付けられている文字(即ちゴミと認識した文字)を一括で削除する。制御部15は、「圏点(・)付与」のボタン55Fが押下された場合、選択状態の文字に圏点「・」を付与する。制御部15は、「圏点(、)付与」のボタン55Gが押下された場合、選択状態の文字に圏点「、」を付与する。制御部15は、「圏点解除」のボタン55Hが押下された場合、選択状態の文字に付与されている圏点を解除する。制御部15は、「ルビ置換」のボタン55Iが押下された場合、全ての文章を対象に、「#」及び波括弧により規定された親文字及びルビの組合せを検索してルビ置換処理を実行する。制御部15は、「ルビ解除」のボタン55Jが押下された場合、選択状態の文字に付与されているルビを解除する。制御部15は、「全マーカ解除」のボタン55Kが押下された場合、全文章中の全てのマーカを解除する。
そして、ユーザは、マーカ処理ウィンドウでの各ボタン操作により、校正用画面の一行画像及び一頁画像を参照しつつ、マーカ部分に関する校正を指示する。これにより、制御部15は、校正が必要なマーカ部分を好適に校正することができる。
図8(B)は、一行文章の字間を調整するための操作ウィンドウ(「字間調整ウィンドウ」とも呼ぶ。)を示す。字間調整ウィンドウは、例えば図3に示す校正用画面のツールバー等での操作に基づき表示されるものであって、選択状態の文字の各字間の調整の指示を受け付ける。ユーザは、字間調整ウィンドウを操作することで、一行文章の文字の字間と一行画像の字間とが異なる場合に、これらを見比べやすくするように、文章中の字間を調整する。具体的には、制御部15は、矢印56Aが押下された場合、選択中の文字の字間を0.05pt単位で縮小する。また、制御部15は、矢印56Bが押下された場合、選択中の文字の字間を0.05pt単位で拡大する。また、テキストフォーム56Cは、直接入力が可能であり、制御部15は、テキストフォーム56に値が入力された場合、入力値に基づき選択中の文字の字間を調整する。
図8(C)は、校正が終了した後に、校正用画面上に配置されている不要なオブジェクトを削除するための操作ウィンドウ(「クリアウィンドウ」とも呼ぶ。)を示す。クリアウィンドウは、ボタン57A〜57Fを有する。
制御部15は、「一行画像の削除」のボタン57Aが押下された場合、全ての一行画像(図3では一行画像31〜35)を削除する。制御部15は、「一頁画像の削除」のボタン57Bが押下された場合、校正用画面の左上に表示する一頁画像(図3では一頁画像40)を削除する。制御部15は、「任意指定の改行の削除」のボタン57Cが押下された場合、任意指定の改行(図3の矢印A2)を削除する。制御部15は、「ノンブル削除」のボタン57Dが押下された場合、文書表示ソフトウェアのドキュメント上で設定されたノンブルを削除する。なお、上記ノンブルは、後述する図9のステップS102とステップS103の間で設定される。制御部15は、「一括削除」のボタン57Eが押下された場合、ボタン57A〜57Dが一括で押下された場合と同一の処理を実行する。制御部15は、「改ページ記号の削除」のボタン57Fが押下された場合、改ページ記号を削除する。
[処理フロー]
次に、本実施形態に係る校正処理のフローについて、図9及び図10を参照して説明する。
次に、本実施形態に係る校正処理のフローについて、図9及び図10を参照して説明する。
(1)校正処理の概要
図9は、本実施例に係る校正処理の概要を示すフローチャートである。
図9は、本実施例に係る校正処理の概要を示すフローチャートである。
まず、制御部15は、入力部12により、OCR結果ファイルFo、組方向、及び対象頁を指定する入力を受け付ける(ステップS101)。そして、制御部15は、ステップS101で入力された情報に基づき、校正用画面を生成する処理(校正用画面生成処理)を実行する(ステップS102)。ステップS102で実行する校正用画面生成処理については、図10を参照して後述する。
次に、制御部15は、ゴミ処理、圏点処理、及びルビ置換処理を順に実行する(ステップS103)。これにより、制御部15は、ゴミ及び圏点の誤認識部分をマーカ表示したり、ルビを付したりする。そして、制御部15は、ステップS103の処理結果を反映した校正用画面を表示部11に表示させる(ステップS104)。
そして、制御部15は、操作ウィンドウへの入力に基づき、字間調整処理、マーカ処理、又はクリア処理の少なくとも一つを実行する(ステップS105)。具体的には、制御部15は、ユーザ操作に基づき、図8(A)のマーカ処理ウィンドウ、図8(B)の字間調整ウィンドウ、及び図8(C)のクリア処理ウィンドウを適宜表示する。そして、制御部15は、表示したウィンドウ上でのボタン操作に基づき、一行文章の字間調整、マーカが付された部分の処理、又は一行画像等をクリアする処理の少なくとも一つを実行する。
(2)校正用画面生成処理
図10は、校正用画面生成処理の手順を示すフローチャートである。制御部15は、図10のフローチャートの処理を、図9のステップS102において実行する。
図10は、校正用画面生成処理の手順を示すフローチャートである。制御部15は、図10のフローチャートの処理を、図9のステップS102において実行する。
まず、制御部15は、図9のステップS101で指定されたOCR結果ファイルFoから文字を読み込む(ステップS201)。次に、制御部15は、対象頁に対応する一頁画像を底本画像情報Isから抽出し、当該一頁画像から一行画像をトリミングする(ステップS202)。そして、制御部15は、一行画像と、これに対応する一行文章とを並べ、体裁整形する(ステップS203)。この場合、制御部15は、一行文章と一行画像とを任意指定の行区切りにより改行して並べて表示すると共に、前述の「(2)フォントサイズ及び行送りの設定」のセクションの説明に従い、各一行文章のフォントサイズ及び行送りの設定を行う。次に、制御部15は、一頁画像を校正用画面の左上に配置し、一行画像をトリミングした部分に半透明オブジェクトを重ねてグループ化する(ステップS204)。
[校正システムの作用効果]
実施形態の校正システムによれば、校正用端末2は、底本からスキャンした画像とOCRで読み取った文字とを一行単位で並列表示し、これらの見た目上のずれが生じないようにフォントサイズ等を設定する。これにより、校正者に底本の画像とOCRの認識結果とを好適に比較させて効率的な校正作業を可能にする。
実施形態の校正システムによれば、校正用端末2は、底本からスキャンした画像とOCRで読み取った文字とを一行単位で並列表示し、これらの見た目上のずれが生じないようにフォントサイズ等を設定する。これにより、校正者に底本の画像とOCRの認識結果とを好適に比較させて効率的な校正作業を可能にする。
また、校正用端末2は、校正に関し注目すべき個所を検索し、当該箇所を校正用画面においてマーカにより強調表示する。これにより、校正用端末2は、注目すべき個所を校正者に好適に認識させることができる。また、校正用端末2は、検索した箇所がゴミと推定される部分であるか、圏点が誤認識された部分であるか、又はルビ置換が適切に実行されなかった部分であるか等に応じて、付すべきマーカの色分けを行う。これにより、校正用端末2は、校正に必要な作業ごとに検索した箇所を好適に区別して表示ことができる。
さらに、校正用端末2は、校正用画面の左上に、一行画像として使用した部分を半透明オブジェクトで重ねた一頁画像を表示させる。これにより、校正者は、OCRソフトウェアで認識できなかった行の有無を確認でき、紙の底本を参照することなく、校正を好適に行うことができる。
[変形例]
校正システムは、図1に示す構成に代えて、校正用端末2とデータ通信が可能なサーバ装置を有してもよい。この場合、サーバ装置は、実施例で校正用端末2が実行した処理の一部を実行する。例えば、サーバ装置は、校正用端末2からOCR結果ファイルFo及び底本画像情報Isなどを受信し、図9のステップS102の校正用画面生成処理やステップS103のゴミ処理等を実行し、校正用画面の画面情報を校正用端末2に送信して校正用画面を校正用端末2に表示させる。また、サーバ装置は、校正用端末2へのユーザ入力に基づき、各種操作ウィンドウを校正用端末2上で表示させ、操作ウィンドウで押下されたボタンの情報を校正用端末2から受信する。そして、サーバ装置は、受信したボタンの情報に基づき、所定の処理を実行し、校正用端末2に表示させる校正用画面の表示を更新するための表示情報を校正用端末2に送信する。
校正システムは、図1に示す構成に代えて、校正用端末2とデータ通信が可能なサーバ装置を有してもよい。この場合、サーバ装置は、実施例で校正用端末2が実行した処理の一部を実行する。例えば、サーバ装置は、校正用端末2からOCR結果ファイルFo及び底本画像情報Isなどを受信し、図9のステップS102の校正用画面生成処理やステップS103のゴミ処理等を実行し、校正用画面の画面情報を校正用端末2に送信して校正用画面を校正用端末2に表示させる。また、サーバ装置は、校正用端末2へのユーザ入力に基づき、各種操作ウィンドウを校正用端末2上で表示させ、操作ウィンドウで押下されたボタンの情報を校正用端末2から受信する。そして、サーバ装置は、受信したボタンの情報に基づき、所定の処理を実行し、校正用端末2に表示させる校正用画面の表示を更新するための表示情報を校正用端末2に送信する。
また、実施例では、制御部15は、ユーザ入力により指定された1頁分の校正用画面を表示する場合について説明したが、複数頁を対象頁として指定する入力を受け付けてもよい。この場合、制御部15は、指定された各頁に対して実施例と同様の処理を行う。この場合、制御部15は、一頁毎に改ページ記号(即ちページ区切り)を挿入すると共に、校正用画面に表示させる頁をユーザ入力に応じて適宜切り替える。
制御部15は、図9のステップS101において、読み込むべきOCR結果ファイルFo、表示すべきテキストの組方向、及び対象頁を指定する入力を受け付けた場合、文書表示ソフトウェアにより表示されるドキュメントのヘッダ部分に、指定されたOCR結果ファイルFo、組方向及び対象頁を白い文字で入力する。この場合、制御部15は、OCR結果ファイルFo、組方向及び対象頁をヘッダ部分に保持したまま、校正用画面を表示するためのファイルを保存する。制御部15は、再び同一のファイルを開くユーザ入力があった場合に、OCR結果ファイルFo、表示すべきテキストの組方向、及び対象頁が指定された状態で文書表示ソフトウェアのドキュメントを表示する。これにより、ユーザ入力の負担を好適に低減することができる。なお、対象頁は、開始頁と終了頁の差分が計算され、次回の読み込みでは差分が加算される。例えば、制御部15は、対象頁の開始頁を「10」、終了頁を「20」とするファイルを保存した場合、次に当該ファイルを再び読み込んだ時には、対象頁の開始頁を「21」、終了頁を「31」とするように対象頁を設定する。OCR結果ファイルFoがCドライブ直下にあり、これを指定した場合、入力画面には、「XMLファイル:C:¥OCR結果ファイルFo.xml」、「組方向:縦組」、「読み込む頁数:10〜20」と表示され、このドキュメントのヘッダ部分には、白い文字で「C:¥OCR結果ファイルFo.xml|10|20|Ver」と入力される。ここで、「Ver」は「Vertical」の略字である。
1…スキャナ
2…校正用端末
11…表示部
12…入力部
13…記憶部
14…通信部
15…制御部
2…校正用端末
11…表示部
12…入力部
13…記憶部
14…通信部
15…制御部
Claims (13)
- 文章を校正する情報処理装置であって、
原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段と、
前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御手段と、を備え、
前記表示制御手段は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示することを特徴とする情報処理装置。 - 前記表示制御手段は、前記原稿画像を、前記一行画像及び前記一行分の文章と重ならない位置に表示することを特徴とする請求項1に記載の情報処理装置。
- 前記表示制御手段は、前記一行画像として表示した箇所を強調して前記原稿画像を表示させることを特徴とする請求項2に記載の情報処理装置。
- 前記表示制御手段は、前記原稿画像における行の幅に基づき、前記表示手段に表示させる前記文章の文字の大きさを決定することを特徴とする請求項1〜3のいずれか一項に記載の情報処理装置。
- 前記表示制御手段は、前記校正に関し注目すべき箇所を、色分けすることで分類して表示させることを特徴とする請求項1〜4のいずれか一項に記載の情報処理装置。
- 前記表示制御手段は、前記光学文字認識の誤認識により発生した不要な文字又は記号を前記文章から検索し、当該文字又は記号を前記校正に関し注目すべき箇所として強調表示することを特徴とする請求項1〜5のいずれか一項に記載の情報処理装置。
- 前記表示制御手段は、前記光学文字認識が圏点を誤認識した箇所を前記文章から検索し、当該箇所を前記校正に関し注目すべき箇所として強調表示することを特徴とする請求項1〜6のいずれか一項に記載の情報処理装置。
- 前記表示制御手段は、親文字とルビとの組み合わせが指定されている箇所を前記文章から検索し、当該箇所を前記親文字に前記ルビが付加された文字に置換することを特徴とする請求項1〜7のいずれか一項に記載の情報処理装置。
- 前記表示制御手段は、外部入力に基づき、選択された箇所の字間を調整することを特徴とする請求項1〜8のいずれか一項に記載の情報処理装置。
- 前記表示制御手段は、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を、段落末尾に付す改行記号と異ならせることを特徴とする請求項1〜9のいずれか一項に記載の情報処理装置。
- 前記表示制御手段は、外部入力に基づき、前記一行画像、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を削除することを特徴とする請求項10に記載の情報処理装置。
- 請求項1〜11のいずれか一項に記載の情報処理装置としてコンピュータを機能させることを特徴とするプログラム。
- 原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段を有する情報処理装置が実行する制御方法であって、
前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御工程を有し、
前記表示制御工程は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示することを特徴とする制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015040536A JP2016162211A (ja) | 2015-03-02 | 2015-03-02 | 情報処理装置、制御方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015040536A JP2016162211A (ja) | 2015-03-02 | 2015-03-02 | 情報処理装置、制御方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016162211A true JP2016162211A (ja) | 2016-09-05 |
Family
ID=56847000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015040536A Pending JP2016162211A (ja) | 2015-03-02 | 2015-03-02 | 情報処理装置、制御方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016162211A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020052571A (ja) * | 2018-09-25 | 2020-04-02 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
KR102468975B1 (ko) * | 2022-06-13 | 2022-11-28 | 주식회사 엘박스 | 인공지능 기반의 판례 인식의 정확도 향상 방법 및 장치 |
-
2015
- 2015-03-02 JP JP2015040536A patent/JP2016162211A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020052571A (ja) * | 2018-09-25 | 2020-04-02 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7263721B2 (ja) | 2018-09-25 | 2023-04-25 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
KR102468975B1 (ko) * | 2022-06-13 | 2022-11-28 | 주식회사 엘박스 | 인공지능 기반의 판례 인식의 정확도 향상 방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100454293C (zh) | 文档编辑方法和文档编辑设备 | |
US11113464B2 (en) | Synchronizing data-entry fields with corresponding image regions | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
JP5121599B2 (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
US9460089B1 (en) | Flow rendering of annotation characters | |
US20120117461A1 (en) | Document generating apparatus, document generating method, computer program and recording medium | |
US20210073535A1 (en) | Information processing apparatus and information processing method for extracting information from document image | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
JP2013196479A (ja) | 情報処理システム、情報処理プログラム、情報処理方法 | |
US9277094B2 (en) | Image processing apparatus and recording medium | |
US20080037051A1 (en) | Document display processor, computer readable medium storing document display processing program, computer data signal and document display processing method | |
JP5790082B2 (ja) | 文書認識装置、文書認識方法、プログラム及び記憶媒体 | |
JP2016162211A (ja) | 情報処理装置、制御方法及びプログラム | |
JP7241506B2 (ja) | 光学式文字認識結果の修正支援装置および修正支援用プログラム | |
JP4924990B2 (ja) | 文書処理装置および文書処理プログラム | |
JP2013152564A (ja) | 文書処理装置及び文書処理方法 | |
JP7206740B2 (ja) | 情報処理装置及びプログラム | |
JP6201686B2 (ja) | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム | |
JP2015055891A (ja) | 文字認識結果検証装置及び文字読取システム | |
JP5381225B2 (ja) | 情報処理装置およびプログラム | |
JP5724286B2 (ja) | 帳票作成装置、帳票作成方法、プログラム | |
KR102571209B1 (ko) | 문서비교방법 및 그 장치 | |
JP4919521B2 (ja) | 文字入力方法、及び入力文字校正方法 | |
JP2005050094A (ja) | 光学的文字読取装置 |