JP2016162211A

JP2016162211A - 情報処理装置、制御方法及びプログラム

Info

Publication number: JP2016162211A
Application number: JP2015040536A
Authority: JP
Inventors: 俊季平岡; Toshiki Hiraoka
Original assignee: Dai Nippon Printing Co Ltd
Current assignee: Dai Nippon Printing Co Ltd
Priority date: 2015-03-02
Filing date: 2015-03-02
Publication date: 2016-09-05

Abstract

【課題】文脈の前後関係を勘案して校正を実行させつつ、校正作業の効率性及び正確性を好適に向上させることが可能な情報処理装置、制御方法及びプログラムを提供する。【解決手段】校正用端末２は、底本からスキャンした画像とＯＣＲで読み取った文字とを一行単位で並列表示し、これらの見た目上のずれが生じないようにフォントサイズ等を設定する。また、校正用端末２は、校正に関し注目すべき個所を検索し、当該箇所を校正用画面においてマーカにより強調表示する。また、校正用端末２は、検索した箇所がゴミと推定される部分であるか、圏点が誤認識された部分であるか、又はルビ置換が適切に実行されなかった部分であるか等に応じて、付すべきマーカの色分けを行う。さらに、校正用端末２は、校正用画面の左上に、一行画像として使用した部分を半透明オブジェクトで重ねた一頁画像を表示させ、ＯＣＲソフトウェアで認識できなかった文字を明示する。【選択図】図３

Description

本発明は、光学文字認識（ＯＣＲ：ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ）で認識した文字を校正する技術に関する。

従来から、ＯＣＲの結果に基づくテキストデータの校正作業を支援するシステムが知られている。特許文献１には、校正を行う画面において、ＯＣＲの対象となる原稿画像とＯＣＲにより認識した文章とを、所定の単位で対比させて表示する点について記載されている。

特開２０１３−７７１５７号公報

特許文献１に記載のシステムでは、原稿画像とＯＣＲにより認識した文章とを対比表示した画面を参照して校正者が校正作業を行うことができるため、原稿画像とＯＣＲにより認識した文章との違いを文脈の前後関係を勘案して判定することができる。一方、ＯＣＲにより認識した全ての文字について、校正者が原稿画像中の文字と比較し、校正すべき箇所を検出するのは手間がかかるという問題がある。

本発明は、文脈の前後関係を勘案して校正を実行させつつ、校正作業の効率性及び正確性を好適に向上させることが可能な情報処理装置、制御方法及びプログラムを提供することを主な課題とする。

本発明の１つの観点では、文章を校正する情報処理装置であって、原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段と、前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御手段と、を備え、前記表示制御手段は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示する。

上記情報処理装置は、記憶手段と、表示制御手段とを備える。記憶手段は、原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する。表示制御手段は、記憶手段が記憶する文章の情報及び体裁に関する情報に基づき、原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる。このとき、表示制御手段は、光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示する。ここで、「文章の体裁に関する情報」とは、原稿画像に表示された文章の各文字を、原稿画像に表示されたレイアウトを再現するように並べて表示するのに必要な情報を指し、例えば行幅、各文字の大きさ及び位置情報などが該当する。このように、情報処理装置は、原稿画像と光学文字認識の結果とを一行単位で対比して表示すると共に、校正に関し注目すべき箇所を強調表示することで、校正が必要な箇所を容易にユーザに把握させ、校正作業の効率性及び正確性を好適に向上させることができる。

上記情報処理装置の一態様では、前記表示制御手段は、前記原稿画像を、前記一行画像及び前記一行分の文章と重ならない位置に表示する。この態様により、ユーザは、原稿画像の元となる紙等を参照することなく、校正作業を効率的に実行することができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、前記一行画像として表示した箇所を強調して前記原稿画像を表示させる。この態様により、情報処理装置は、ＯＣＲで認識できなかった行を好適にユーザに把握させることができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、前記原稿画像における行の幅に基づき、前記表示手段に表示させる前記文章の文字の大きさを決定する。この態様により、情報処理装置は、原稿画像と光学文字認識の結果とを一行単位で対比して表示する際に、文字の大きさを比較しやすいように揃えて表示することができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、前記校正に関し注目すべき箇所を、色分けすることで分類して表示させる。これにより、情報処理装置は、強調表示した箇所に対して必要な作業を、色により好適に把握させることができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、前記光学文字認識の誤認識により発生した不要な文字又は記号を前記文章から検索し、当該文字又は記号を前記校正に関し注目すべき箇所として強調表示する。これにより、情報処理装置は、不要な文字又は記号を好適にユーザに認識させて削除を促すことができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、前記光学文字認識が圏点を誤認識した箇所を前記文章から検索し、当該箇所を前記校正に関し注目すべき箇所として強調表示する。これにより、情報処理装置は、圏点に関する校正作業が必要な箇所をユーザに好適に把握させることができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、親文字とルビとの組み合わせが指定されている箇所を前記文章から検索し、当該箇所を前記親文字に前記ルビが付加された文字に置換する。この態様により、情報処理装置は、原稿画像においてルビが付された文字部分に対し、原稿画像と同様にルビを付した状態に校正することができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、外部入力に基づき、選択された箇所の字間を調整する。この態様により、情報処理装置は、原稿画像と光学文字認識の結果とを一行単位で対比して表示する際に、ユーザ操作に基づき、対応する文字の位置を好適に揃えることができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を、段落末尾に付す改行記号と異ならせる。これにより、情報処理装置は、原稿画像と光学文字認識の結果とを比較するために付した改行を、段落終了に伴う改行と好適に識別することができる。

上記情報処理装置の他の一態様では、前記表示制御手段は、外部入力に基づき、前記一行画像、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を削除する。この態様により、情報処理装置は、校正作業が終了した際に、校正作業時の比較のために便宜上挿入した一行画像や改行等を好適に削除することができる。

本発明に好適なさらに別の実施形態では、プログラムは、上記いずれか記載の情報処理装置としてコンピュータを機能させる。このプログラムをコンピュータにインストールして機能させることで、本発明に係る情報処理装置を構成させることができる。

本発明に係る他の好適な実施形態では、原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段を有する情報処理装置が実行する制御方法であって、前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御工程を有し、前記表示制御工程は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示する。情報処理装置は、この制御方法を実行することで、校正が必要な箇所を容易にユーザに把握させ、校正作業の効率性及び正確性を好適に向上させることができる。

本発明に係る情報処理装置によれば、原稿画像と光学文字認識の結果とを一行単位で対比して表示すると共に、校正に関し注目すべき箇所を強調表示することで、校正が必要な箇所を容易にユーザに把握させ、校正作業の効率性及び正確性を好適に向上させることができる。

実施例に係る校正システムのブロック図である。校正用端末のブロック構成を示す。校正用画面の表示例である。行送りの設定方法の概要を示す図である。ゴミ識別テーブルに登録されている文字と文字コードの一覧を示す。ルビ置換処理の概要を説明する図である。圏点処理の概要を説明する図である。校正用画面において表示される操作ウィンドウを示す。校正処理の概要を示すフローチャートである。校正用画面生成処理の手順を示すフローチャートである。

以下、図面を参照しながら、本発明を実施するのに好適な実施形態について説明する。

［校正システムの構成］
図１は、本実施例に係る校正システムのブロック図である。本実施例に係る校正システムは、ＯＣＲにより認識した文字の校正を行うためのシステムであり、スキャナ１と、校正用端末２とを有する。

スキャナ１は、紙の本（所謂底本）の頁をスキャンした画像を生成して校正用端末２へ供給する。以後では、スキャナ１が読み取って生成した底本の一頁分の画像を「一頁画像」とも呼ぶ。一頁画像は、本発明における「原稿画像」の一例である。

校正用端末２は、スキャナ１が生成した底本の各頁の一頁画像を取得し、各一頁画像に対して光学文字認識（ＯＣＲ）を行うことで、各一頁画像に記載の文字及びその体裁に関するファイル（「ＯＣＲ結果ファイルＦｏ」とも呼ぶ。）を生成する。そして、校正用端末２は、校正を行う対象となる頁（「対象頁」とも呼ぶ。）をユーザが指定した場合に、対応する一頁画像及びＯＣＲ結果ファイルＦｏを用いて校正用画面を表示し、校正に関する入力を受け付ける。校正用画面では、校正用端末２は、後述するように、対象頁の一頁画像を一行ごとにトリミングした画像（「一行画像」とも呼ぶ。）と、当該一行画像部分の文字認識結果に相当する一行分の文章（「一行文章」とも呼ぶ。）とを並べて表示する。校正用端末２は、本発明における「情報処理装置」の一例である。

なお、校正用端末２は、画像情報が既に存在する底本の場合には、当該画像情報に基づきＯＣＲを実行し、校正画面の表示等を行ってもよい。また、校正用端末２は、ＯＣＲを自ら実行してＯＣＲ結果ファイルＦｏを取得する代わりに、スキャナ１と接続した他の端末が生成したＯＣＲ結果ファイルＦｏを取得してもよい。

［校正用端末の構成］
図２は、校正用端末２のブロック構成を示す。校正用端末２は、ディスプレイなどの表示部１１と、タッチパネル、マウス、キーボードなどの入力部１２と、記憶部１３と、スキャナ１等とデータ通信を行う通信部１４と、制御部１５とを備える。これらの各要素は、バスライン１０を介して相互に接続されている。

記憶部１３は、ハードディスク又はフラッシュメモリといったメモリによって構成され、制御部１５が実行するプログラムや校正処理に必要な情報を予め記憶する。例えば、記憶部１３は、例えば「ＷｉｎＲｅａｄｅｒＰＲＯ」などのＯＣＲソフトウェアのプログラムや、ＯＣＲ結果ファイルＦｏに基づき文章を表示するＷＯＲＤ（登録商標）などの文書表示ソフトウェアのプログラムを記憶する。さらに、本実施例では、記憶部１３は、文書表示ソフトウェアに組み込む校正用のマクロプログラム（「校正用マクロ」とも呼ぶ。）を記憶する。さらに、記憶部１３は、底本の各頁をスキャンした一頁画像の情報（「底本画像情報Ｉｓ」とも呼ぶ。）と、対応するＯＣＲ結果ファイルＦｏとを記憶する。また、記憶部１３は、校正により削除すべき文字又は記号（単に「ゴミ」とも呼ぶ。）を識別する際に参照するテーブル（「ゴミ識別テーブルＴｇ」とも呼ぶ。）を記憶する。ゴミ識別テーブルＴｇのデータ構造については後述する。

制御部１５は、図示しないＣＰＵ、ＲＯＭ及びＲＡＭなどを備え、校正用端末２内の各構成要素に対して種々の制御を行う。本実施形態では、制御部１５は、ＯＣＲソフトウェアに基づき、底本画像情報Ｉｓに含まれる各一頁画像に対してＯＣＲを実行し、ＯＣＲ結果ファイルＦｏを生成する。また、制御部１５は、校正用マクロが組み込まれた文書表示ソフトウェアに基づき、校正用画面を表示する。このとき、制御部１５は、ルビを置換する処理（「ルビ置換処理」とも呼ぶ。）、ゴミ部分を特定して強調表示する処理（「ゴミ処理」とも呼ぶ。）、及び圏点部分を特定して強調表示する処理（「圏点処理」とも呼ぶ。）を行う。さらに、制御部１５は、校正用画面上に、ＯＣＲにより認識した文章を校正するための各種入力ボタンを備えたウィンドウ（「操作用ウィンドウ」とも呼ぶ。）を表示し、上記各種入力ボタンの押下を入力部１２への入力により検知することで、強調表示した箇所の校正に関する入力を受け付ける。

なお、制御部１５は、本発明における「表示制御手段」及びプログラムを実行する「コンピュータ」の一例である。

［校正処理の詳細］
（１）校正用画面のレイアウト
図３は、校正用画面の表示例である。なお、図３では、ツールバーや操作ウィンドウなどの操作用インタフェース等は便宜上図示していない。制御部１５は、入力部１２により、読み込むべきＯＣＲ結果ファイルＦｏ、表示すべきテキストの組方向、及び対象頁を指定する入力を受け付けることで、図３に示す校正用画面を表示している。なお、図３では、対象頁の中間部分の文章にあたる表示を便宜上省略している。また、校正用画面は、指定された箇所を単色で塗りつぶして表示する機能（所謂マーカ機能）を有しているものとする。

図３の例では、まず、制御部１５は、ユーザ入力により指定されたＯＣＲ結果ファイルＦｏを読み込むと共に、対象頁の一頁画像を底本画像情報Ｉｓから抽出する。そして、制御部１５は、指定された組方向に基づき、対象頁の一頁画像の各行の認識結果である一行文章２１〜２５を縦組で表示すると共に、各一行文章２１〜２５の左側に、対応する一行画像３１〜３５を挿入している。なお、図３の例では、制御部１５は、一行文章２１〜２５を縦組で表示しているが、組方向が横組に指定された場合には、横組で表示する。

ここで、制御部１５は、一行画像３１〜３５を、対象頁の一頁画像から行ごとにトリミングすることで生成する。このとき、制御部１５は、ルビや圏点を表示させるため、一行画像３１〜３５を一頁画像からトリミングする際には、一行画像３１〜３５の行の幅を、ＯＣＲ結果ファイルＦｏで示される行の幅の１．５倍に設定している。また、制御部１５は、段落開始部分（例えば一行画像３３）などでの字下げを目立たせるため、一行画像３１〜３５をトリミングする上端位置を、字下げの有無に関わらず全て同一位置に揃えて設定している。

また、制御部１５は、ＯＣＲ結果ファイルＦｏに含まれる行幅等の体裁情報に基づき、一行文章２１〜２５に適用すべきフォントサイズを決定している。これにより、制御部１５は、一行画像３１〜３５と一行文章２１〜２５とを、対応する文字ごとに揃えて表示させ、これらの比較を容易にしている。フォントサイズ等の決定方法については、「（２）フォントサイズ及び行送りの設定」のセクションで詳しく説明する。

また、制御部１５は、一行文章２１〜２５のうち、段落が終了する文章の文末には、上方に折れ曲がった矢印「Ａ１」により表された段落記号（横組の場合には上から下に延びて左に垂直に曲がる矢印）を改行記号として挿入し、それ以外の文章の文末には、左方向を指した矢印「Ａ２」により表された任意指定の行区切りを改行記号として挿入している。これにより、制御部１５は、文字の比較がし易いように校正用画面のレイアウトを適切に保つと共に、校正終了時に、校正時の比較用に便宜上挿入した改行を、段落終了の改行と混同することなく削除することができる。同様に、制御部１５は、一行画像３１〜３５の末尾には、段落記号と分けて削除可能な任意指定の行区切りを挿入している。

また、制御部１５は、並べて表示した一行文章２１〜２５及び一行画像３１〜３５の末尾部分に、改ページ記号（即ちページ区切り）を挿入している。このように、制御部１５は、一頁毎に改ページ記号を挿入することで、一頁画像の内容を文書表示ソフトウェアのドキュメント上での一頁に留め、一頁ごとの比較を容易にする。

さらに、図３の例では、制御部１５は、ルビ置換処理を行った部分の文字を薄く塗りつぶすことで強調表示している。具体的には、制御部１５は、ハッチング領域Ｒ１、Ｒ２に囲まれた文字に対してルビ置換処理を実行したことから、ハッチング領域Ｒ１、Ｒ２内を強調表示している。また、図３の例では、制御部１５は、ゴミ処理によりゴミであると判定した部分を、所定色（ここでは赤色とする）のマーカにより強調表示している。具体的には、制御部１５は、一点鎖線枠Ｇ１内の記号等がゴミであると判断し、一点鎖線枠Ｇ１内を赤色マーカで塗りつぶしている。ゴミ処理については、「（３）ゴミ処理」のセクションで詳しく説明する。さらに、図３の例では、制御部１５は、圏点部分を文字認識することにより発生した記号等を、所定色（ここでは黄色とする）のマーカにより強調表示している。具体的には、制御部１５は、二点鎖線枠Ｋ１内の記号等が圏点の誤認識により生じた部分であると判断し、二点鎖線枠Ｋ１内を黄色マーカで表示している。圏点処理については、「（５）圏点処理」のセクションで詳しく説明する。

また、制御部１５は、校正用画面の左上に、対象頁の画像である一頁画像４０を表示させている。これにより、ユーザは、紙の底本を参照することなく、底本でのレイアウトを確認しながら校正を行うことができる。さらに、制御部１５は、一頁画像４０上の各一行画像３１〜３５に対応する範囲に、半透明オブジェクト４１〜４５を重ねて表示している。これにより、制御部１５は、一頁画像４０内で一行画像３１〜３５としてトリミングした部分を明示し、ＯＣＲで認識できなかった行がないかユーザが確認できるようにする。本実施例では、ＯＣＲソフトウェアの仕様が、罫線が文字認識結果に反映されない仕様となっている。よって、図３の例では、一頁画像４０内の区切りマーク４６の行が、罫線のみから形成されていることにより、当該行の存在は無視されて所謂行抜けが発生している。この場合であっても、一頁画像４０内の区切りマーク４６に半透明オブジェクトが重ならないので、他の行と比べて色が濃く表示されるため、ユーザは、半透明オブジェクト４１〜４５が重ねられた一頁画像４０を参照することで、行抜け部分（図３の例では区切りマーク４６の行）の存在を好適に認識することができる。

また、制御部１５は、一頁画像４０及び半透明オブジェクト４１〜４５に対してグループ化設定を行い、一頁画像４０と半透明オブジェクト４１〜４５との相対位置がずれないようにする。

（２）フォントサイズ及び行送りの設定
次に、ＯＣＲにより認識した文字を校正用画面で表示する際のフォントサイズ及び行送りの設定方法について説明する。

制御部１５は、ＯＣＲ結果ファイルＦｏを参照し、一頁画像内において段落やセクションごとに分けられた一又は複数行からなるブロックごとに、各一行画像の行の幅の平均値を算出する。そして、制御部１５は、算出した平均値に基づき、ブロックごとのフォントサイズを決定する。これにより、制御部１５は、字種によって字面が異なる場合であっても、一行画像とこれに対応する一行文章との文字の大きさを均一にし、対応する行ごとに位置を揃えて表示することができる。

また、制御部１５は、算出したフォントサイズに基づき、行送りを計算する。図４は、行送りの設定方法の概要を示す図である。図４は、一例として、横組の場合について説明した図である。

図４に示すように、制御部１５は、親文字のフォントサイズを「Ｘ」ｐｔ（Ｘは正数）とすると、ルビのフォントサイズを親文字の半分である「Ｘ／２」ｐｔであるとみなす。また、制御部１５は、親文字とルビとの距離を、固定値の１ｐｔに定める。そして、制御部１５は、行幅を、親文字のフォントサイズと、ルビのフォントサイズと、親文字とルビの距離との合計値（即ち「３Ｘ／２＋１」ｐｔ）に定める。また、制御部１５は、行間を、行幅の１／４（即ち、「｛３Ｘ／２＋１｝／４」ｐｔ）に定める。そして、制御部１５は、行送りを、行幅と行間との合計値（即ち、「｛１５Ｘ／２＋５｝／４」ｐｔ）に定める。

以上の前提によれば、制御部１５は、親文字のフォントサイズから行送りを好適に計算することができる。よって、制御部１５は、各一行画像の行の幅の平均値に基づきフォントサイズ（上述の説明のＸ）を設定することで、行送りについても好適に設定することができる。

なお、文書表示ソフトウェアとしてＷＯＲＤを用いた場合、親文字のフォントの設定は、０．５ｐｔ区切りとなる。よって、この場合、制御部１５は、フォントサイズを０．５区切りにより小数部分を近似する。この場合、制御部１５は、各一行画像の行の幅の平均値の整数部を「α」、少数部を「β」とした場合、「０．２５≦β≦０．７５」の場合に整数部αに０．５を加算した値をフォントサイズとし、「０．７５≦β」の場合に整数部αに１を加算した値をフォントサイズとして設定する。例えば、各一行画像の行の幅の平均値が「１０．３８」ｐｔの場合、親文字のフォントサイズを「１０．５」ｐｔに設定し、上述の平均値が「９．８９」ｐｔの場合、親文字のフォントサイズを「１０．０」ｐｔに設定する。

（３）ゴミ処理
次に、ゴミ処理について説明する。本実施例では、制御部１５は、一例として、２つ以上の空白と、ゴミ識別テーブルＴｇに登録されている文字とが連続している箇所を、ゴミとして認識し、赤色マーカにより印をつけて表示する。なお、ゴミの定義は、上記記載に限定されない。

図５は、ゴミ識別テーブルＴｇに登録されている文字（記号）及び文字コード（ここではユニコードとする）の一覧を示す。表示制御部１５は、空白が連続した後に、図５に示される文字が存在する場合に、当該箇所をゴミとして認識する。図３の例では、一行画像３２の行末部分に付いた汚れをスキャンした部分が、ＯＣＲの誤認識により、一点鎖線枠Ｇ１内の文字に変換されている。この場合、制御部１５は、一点鎖線枠Ｇ１内において、空白が４つ連続した後に、ゴミ識別テーブルＴｇに登録されている「、」が連続していることから、一点鎖線枠Ｇ１内の部分をゴミとして認識し、赤色マーカにより印をつけている。

（４）ルビ置換処理
次に、ルビ置換処理について図６を参照して説明する。

図６（Ａ）は、底本におけるルビを含む文章５０Ａと、文章５０Ａに対してＯＣＲを行った結果として出力される文章５０Ｂと、文章５０Ｂに対してルビ置換処理を行った後の文章５０Ｃとを示す。図６（Ａ）の例では、文章５０Ａに対してＯＣＲを行った場合、ＯＣＲソフトウェアの設定に基づき、ルビ付き文字が「＃親文字｛ルビ｝」の形式で出力されている。なお、上記の「＃｛｝」の各記号は全角になっているが、実際には半角の記号が使用される。

この場合、制御部１５は、「＃」及び波括弧の組合せを検索することで、ルビ付き文字に相当する箇所を認識する。そして、制御部１５は、これらの記号の位置に基づき、ルビ付き文字の親文字とルビとをそれぞれ認識し、該当箇所をルビ付き文字に置換する処理を行う。これにより、制御部１５は、ＯＣＲの対象となる画像中のルビ付き文字を好適に校正画面上で再現して表示することができる。なお、制御部１５は、ゴミ等と判定されてマーカで印が付けられている箇所については、ルビ置換処理の対象外とする。

図６（Ｂ）は、ルビ置換処理における例外処理の流れを示す。図６（Ｂ）では、底本において行を跨いでルビ付き文字が存在する２行分の文章５１Ａと、文章５１Ａに対してＯＣＲを行った結果に基づき校正用画面に出力される文章５１Ｂと、文章５１Ｂに対してルビ置換処理を行った後の文章５１Ｃとを示す。なお、文章５１Ｂ、５１Ｃには、行間に一行画像５１Ｄが挿入されている。

図６（Ｂ）の例では、ＯＣＲ後の文章５１Ｂでは、「＃親文字｛ルビ｝」の箇所が行を跨ぐため、本実施例における校正用画面の仕様上、「＃」と波括弧との間に一行画像が挿入されてしまう。よって、この場合、制御部１５は、図６（Ａ）で説明した原則に基づいたルビ置換処理を行うことができない。よって、この場合には、制御部１５は、ルビ付き文字の親文字及び波括弧内のルビ（即ち実線枠内の文字）に対して所定色（ここでは緑色とする）のマーカを付す。これにより、制御部１５は、ルビ置換処理が適切にできなかった部分を強調し、校正が必要な箇所（即ちルビ置換が必要な箇所）であることをユーザに認識させる。

（５）圏点処理
次に、圏点処理について説明する。ＯＣＲソフトウェアによっては、圏点を認識する機能がなく、この場合、平仮名の「へ」若しくはカタカナの「ヘ」のルビとして誤認識される。この場合、制御部１５は、圏点が誤認識された部分に対して黄色マーカを付して強調表示する。

図７（Ａ）は、圏点を含む底本における文章５２Ａと、文章５２Ａに対してＯＣＲを行った結果として出力される文章５２Ｂと、文章５２Ｂに対して圏点処理を実行した後の文章５２Ｃとを示す。図７（Ａ）の文章５２Ｂでは、ＯＣＲソフトウェアが圏点を認識する機能がないことにより、圏点付きの文字「蜘蛛」がルビ「へへ」が付された親文字として変換されている。

この場合、制御部１５は、平仮名若しくはカタカナの「へ」のみからなるルビを指定する箇所を検索し、該当する箇所に対して黄色マーカを付す。図７（Ａ）の例では、制御部１５は、二点鎖線枠内の「｛へへ｝」に対して黄色マーカを付して強調表示している。これにより、制御部１５は、黄色マーカの部分が圏点である可能性が高いことをユーザに好適に認識させる。

また、制御部１５は、ＯＣＲソフトウェアでは、漢字以外の文字にルビが付されないこと等に起因して、ルビが正しい形式で指定されていない場合についても、図７（Ａ）の例と同様、該当箇所に対して黄色マーカを付して強調表示する。以後では、この処理も圏点処理と呼ぶことにする。

図７（Ｂ）は、ルビ付きのローマ字を含む底本中の文章５３Ａと、文章５３Ａに対してＯＣＲを行った結果として出力される文章５３Ｂと、文章５３Ｂに対して圏点処理を行った場合の実行結果である文章５３Ｃとを示す。図７（Ｂ）の例では、ＯＣＲソフトウェアは、漢字以外にルビが付されるのを想定した仕様となっていないため、適切でない位置に、ルビを指定する文字列を挿入している。この場合、制御部１５は、「＃」と波括弧の位置が適切でないことを検知し、二点鎖線枠内の「＃」に対して黄色マーカを付す。これにより、制御部１５は、ルビ置換処理が適切に行われない部分を、好適にユーザに認識させることができる。

（６）操作ウィンドウ
校正用画面において表示される各操作ウィンドウについて、図８（Ａ）〜（Ｃ）を参照して説明する。

図８（Ａ）は、ユーザの判断が必要なマーカ部分の対応を決定するための操作ウィンドウ（「マーカ処理ウィンドウ」とも呼ぶ。）の一例である。図８（Ａ）に示すマーカ処理ウィンドウは、例えば図３に示す校正用画面の図示しないツールバー等での操作に基づき表示されるものであって、ボタン５５Ａ〜５５Ｋを有する。

ボタン５５Ａは、赤色マーカが付された「ゴミ」、黄色マーカが付された「圏点」、緑色マーカが付された「行末ルビ」のいずれかの箇所を選択するためのラジオボタンである。制御部１５は、ボタン５５Ｂが選択された場合、ボタン５５Ａで指定された箇所にカーソルをジャンプさせ、ジャンプ先のマーカ部分を選択状態とする。そして、制御部１５は、マーカ部分が選択状態のときにボタン５５Ｃ〜５５Ｋの押下を検知した場合に、所定の処理を実行する。

具体的には、制御部１５は、「マーカ解除」のボタン５５Ｃが選択された場合、選択状態の文字のマーカを解除（消去）する。また、制御部１５は、「マーカ文字削除」のボタン５５Ｄが押下された場合、選択状態の文字を削除する。制御部１５は、「赤マーカ文字削除」のボタン５５Ｅが押下された場合、赤いマーカで印が付けられている文字（即ちゴミと認識した文字）を一括で削除する。制御部１５は、「圏点（・）付与」のボタン５５Ｆが押下された場合、選択状態の文字に圏点「・」を付与する。制御部１５は、「圏点（、）付与」のボタン５５Ｇが押下された場合、選択状態の文字に圏点「、」を付与する。制御部１５は、「圏点解除」のボタン５５Ｈが押下された場合、選択状態の文字に付与されている圏点を解除する。制御部１５は、「ルビ置換」のボタン５５Ｉが押下された場合、全ての文章を対象に、「＃」及び波括弧により規定された親文字及びルビの組合せを検索してルビ置換処理を実行する。制御部１５は、「ルビ解除」のボタン５５Ｊが押下された場合、選択状態の文字に付与されているルビを解除する。制御部１５は、「全マーカ解除」のボタン５５Ｋが押下された場合、全文章中の全てのマーカを解除する。

そして、ユーザは、マーカ処理ウィンドウでの各ボタン操作により、校正用画面の一行画像及び一頁画像を参照しつつ、マーカ部分に関する校正を指示する。これにより、制御部１５は、校正が必要なマーカ部分を好適に校正することができる。

図８（Ｂ）は、一行文章の字間を調整するための操作ウィンドウ（「字間調整ウィンドウ」とも呼ぶ。）を示す。字間調整ウィンドウは、例えば図３に示す校正用画面のツールバー等での操作に基づき表示されるものであって、選択状態の文字の各字間の調整の指示を受け付ける。ユーザは、字間調整ウィンドウを操作することで、一行文章の文字の字間と一行画像の字間とが異なる場合に、これらを見比べやすくするように、文章中の字間を調整する。具体的には、制御部１５は、矢印５６Ａが押下された場合、選択中の文字の字間を０．０５ｐｔ単位で縮小する。また、制御部１５は、矢印５６Ｂが押下された場合、選択中の文字の字間を０．０５ｐｔ単位で拡大する。また、テキストフォーム５６Ｃは、直接入力が可能であり、制御部１５は、テキストフォーム５６に値が入力された場合、入力値に基づき選択中の文字の字間を調整する。

図８（Ｃ）は、校正が終了した後に、校正用画面上に配置されている不要なオブジェクトを削除するための操作ウィンドウ（「クリアウィンドウ」とも呼ぶ。）を示す。クリアウィンドウは、ボタン５７Ａ〜５７Ｆを有する。

制御部１５は、「一行画像の削除」のボタン５７Ａが押下された場合、全ての一行画像（図３では一行画像３１〜３５）を削除する。制御部１５は、「一頁画像の削除」のボタン５７Ｂが押下された場合、校正用画面の左上に表示する一頁画像（図３では一頁画像４０）を削除する。制御部１５は、「任意指定の改行の削除」のボタン５７Ｃが押下された場合、任意指定の改行（図３の矢印Ａ２）を削除する。制御部１５は、「ノンブル削除」のボタン５７Ｄが押下された場合、文書表示ソフトウェアのドキュメント上で設定されたノンブルを削除する。なお、上記ノンブルは、後述する図９のステップＳ１０２とステップＳ１０３の間で設定される。制御部１５は、「一括削除」のボタン５７Ｅが押下された場合、ボタン５７Ａ〜５７Ｄが一括で押下された場合と同一の処理を実行する。制御部１５は、「改ページ記号の削除」のボタン５７Ｆが押下された場合、改ページ記号を削除する。

［処理フロー］
次に、本実施形態に係る校正処理のフローについて、図９及び図１０を参照して説明する。

（１）校正処理の概要
図９は、本実施例に係る校正処理の概要を示すフローチャートである。

まず、制御部１５は、入力部１２により、ＯＣＲ結果ファイルＦｏ、組方向、及び対象頁を指定する入力を受け付ける（ステップＳ１０１）。そして、制御部１５は、ステップＳ１０１で入力された情報に基づき、校正用画面を生成する処理（校正用画面生成処理）を実行する（ステップＳ１０２）。ステップＳ１０２で実行する校正用画面生成処理については、図１０を参照して後述する。

次に、制御部１５は、ゴミ処理、圏点処理、及びルビ置換処理を順に実行する（ステップＳ１０３）。これにより、制御部１５は、ゴミ及び圏点の誤認識部分をマーカ表示したり、ルビを付したりする。そして、制御部１５は、ステップＳ１０３の処理結果を反映した校正用画面を表示部１１に表示させる（ステップＳ１０４）。

そして、制御部１５は、操作ウィンドウへの入力に基づき、字間調整処理、マーカ処理、又はクリア処理の少なくとも一つを実行する（ステップＳ１０５）。具体的には、制御部１５は、ユーザ操作に基づき、図８（Ａ）のマーカ処理ウィンドウ、図８（Ｂ）の字間調整ウィンドウ、及び図８（Ｃ）のクリア処理ウィンドウを適宜表示する。そして、制御部１５は、表示したウィンドウ上でのボタン操作に基づき、一行文章の字間調整、マーカが付された部分の処理、又は一行画像等をクリアする処理の少なくとも一つを実行する。

（２）校正用画面生成処理
図１０は、校正用画面生成処理の手順を示すフローチャートである。制御部１５は、図１０のフローチャートの処理を、図９のステップＳ１０２において実行する。

まず、制御部１５は、図９のステップＳ１０１で指定されたＯＣＲ結果ファイルＦｏから文字を読み込む（ステップＳ２０１）。次に、制御部１５は、対象頁に対応する一頁画像を底本画像情報Ｉｓから抽出し、当該一頁画像から一行画像をトリミングする（ステップＳ２０２）。そして、制御部１５は、一行画像と、これに対応する一行文章とを並べ、体裁整形する（ステップＳ２０３）。この場合、制御部１５は、一行文章と一行画像とを任意指定の行区切りにより改行して並べて表示すると共に、前述の「（２）フォントサイズ及び行送りの設定」のセクションの説明に従い、各一行文章のフォントサイズ及び行送りの設定を行う。次に、制御部１５は、一頁画像を校正用画面の左上に配置し、一行画像をトリミングした部分に半透明オブジェクトを重ねてグループ化する（ステップＳ２０４）。

［校正システムの作用効果］
実施形態の校正システムによれば、校正用端末２は、底本からスキャンした画像とＯＣＲで読み取った文字とを一行単位で並列表示し、これらの見た目上のずれが生じないようにフォントサイズ等を設定する。これにより、校正者に底本の画像とＯＣＲの認識結果とを好適に比較させて効率的な校正作業を可能にする。

また、校正用端末２は、校正に関し注目すべき個所を検索し、当該箇所を校正用画面においてマーカにより強調表示する。これにより、校正用端末２は、注目すべき個所を校正者に好適に認識させることができる。また、校正用端末２は、検索した箇所がゴミと推定される部分であるか、圏点が誤認識された部分であるか、又はルビ置換が適切に実行されなかった部分であるか等に応じて、付すべきマーカの色分けを行う。これにより、校正用端末２は、校正に必要な作業ごとに検索した箇所を好適に区別して表示ことができる。

さらに、校正用端末２は、校正用画面の左上に、一行画像として使用した部分を半透明オブジェクトで重ねた一頁画像を表示させる。これにより、校正者は、ＯＣＲソフトウェアで認識できなかった行の有無を確認でき、紙の底本を参照することなく、校正を好適に行うことができる。

［変形例］
校正システムは、図１に示す構成に代えて、校正用端末２とデータ通信が可能なサーバ装置を有してもよい。この場合、サーバ装置は、実施例で校正用端末２が実行した処理の一部を実行する。例えば、サーバ装置は、校正用端末２からＯＣＲ結果ファイルＦｏ及び底本画像情報Ｉｓなどを受信し、図９のステップＳ１０２の校正用画面生成処理やステップＳ１０３のゴミ処理等を実行し、校正用画面の画面情報を校正用端末２に送信して校正用画面を校正用端末２に表示させる。また、サーバ装置は、校正用端末２へのユーザ入力に基づき、各種操作ウィンドウを校正用端末２上で表示させ、操作ウィンドウで押下されたボタンの情報を校正用端末２から受信する。そして、サーバ装置は、受信したボタンの情報に基づき、所定の処理を実行し、校正用端末２に表示させる校正用画面の表示を更新するための表示情報を校正用端末２に送信する。

また、実施例では、制御部１５は、ユーザ入力により指定された１頁分の校正用画面を表示する場合について説明したが、複数頁を対象頁として指定する入力を受け付けてもよい。この場合、制御部１５は、指定された各頁に対して実施例と同様の処理を行う。この場合、制御部１５は、一頁毎に改ページ記号（即ちページ区切り）を挿入すると共に、校正用画面に表示させる頁をユーザ入力に応じて適宜切り替える。

制御部１５は、図９のステップＳ１０１において、読み込むべきＯＣＲ結果ファイルＦｏ、表示すべきテキストの組方向、及び対象頁を指定する入力を受け付けた場合、文書表示ソフトウェアにより表示されるドキュメントのヘッダ部分に、指定されたＯＣＲ結果ファイルＦｏ、組方向及び対象頁を白い文字で入力する。この場合、制御部１５は、ＯＣＲ結果ファイルＦｏ、組方向及び対象頁をヘッダ部分に保持したまま、校正用画面を表示するためのファイルを保存する。制御部１５は、再び同一のファイルを開くユーザ入力があった場合に、ＯＣＲ結果ファイルＦｏ、表示すべきテキストの組方向、及び対象頁が指定された状態で文書表示ソフトウェアのドキュメントを表示する。これにより、ユーザ入力の負担を好適に低減することができる。なお、対象頁は、開始頁と終了頁の差分が計算され、次回の読み込みでは差分が加算される。例えば、制御部１５は、対象頁の開始頁を「１０」、終了頁を「２０」とするファイルを保存した場合、次に当該ファイルを再び読み込んだ時には、対象頁の開始頁を「２１」、終了頁を「３１」とするように対象頁を設定する。ＯＣＲ結果ファイルＦｏがＣドライブ直下にあり、これを指定した場合、入力画面には、「ＸＭＬファイル：Ｃ：￥ＯＣＲ結果ファイルＦｏ．ｘｍｌ」、「組方向：縦組」、「読み込む頁数：１０〜２０」と表示され、このドキュメントのヘッダ部分には、白い文字で「Ｃ：￥ＯＣＲ結果ファイルＦｏ．ｘｍｌ｜１０｜２０｜Ｖｅｒ」と入力される。ここで、「Ｖｅｒ」は「Ｖｅｒｔｉｃａｌ」の略字である。

１…スキャナ
２…校正用端末
１１…表示部
１２…入力部
１３…記憶部
１４…通信部
１５…制御部

Claims

文章を校正する情報処理装置であって、
原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段と、
前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御手段と、を備え、
前記表示制御手段は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示することを特徴とする情報処理装置。
前記表示制御手段は、前記原稿画像を、前記一行画像及び前記一行分の文章と重ならない位置に表示することを特徴とする請求項１に記載の情報処理装置。
前記表示制御手段は、前記一行画像として表示した箇所を強調して前記原稿画像を表示させることを特徴とする請求項２に記載の情報処理装置。
前記表示制御手段は、前記原稿画像における行の幅に基づき、前記表示手段に表示させる前記文章の文字の大きさを決定することを特徴とする請求項１〜３のいずれか一項に記載の情報処理装置。
前記表示制御手段は、前記校正に関し注目すべき箇所を、色分けすることで分類して表示させることを特徴とする請求項１〜４のいずれか一項に記載の情報処理装置。
前記表示制御手段は、前記光学文字認識の誤認識により発生した不要な文字又は記号を前記文章から検索し、当該文字又は記号を前記校正に関し注目すべき箇所として強調表示することを特徴とする請求項１〜５のいずれか一項に記載の情報処理装置。
前記表示制御手段は、前記光学文字認識が圏点を誤認識した箇所を前記文章から検索し、当該箇所を前記校正に関し注目すべき箇所として強調表示することを特徴とする請求項１〜６のいずれか一項に記載の情報処理装置。
前記表示制御手段は、親文字とルビとの組み合わせが指定されている箇所を前記文章から検索し、当該箇所を前記親文字に前記ルビが付加された文字に置換することを特徴とする請求項１〜７のいずれか一項に記載の情報処理装置。
前記表示制御手段は、外部入力に基づき、選択された箇所の字間を調整することを特徴とする請求項１〜８のいずれか一項に記載の情報処理装置。
前記表示制御手段は、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を、段落末尾に付す改行記号と異ならせることを特徴とする請求項１〜９のいずれか一項に記載の情報処理装置。
前記表示制御手段は、外部入力に基づき、前記一行画像、前記一行画像の末尾に付す改行記号、及び、前記光学文字認識により得られた文章を前記一行分の文章ごとに区切るのに挿入する改行記号を削除することを特徴とする請求項１０に記載の情報処理装置。
請求項１〜１１のいずれか一項に記載の情報処理装置としてコンピュータを機能させることを特徴とするプログラム。
原稿画像から光学文字認識により得られた文章の情報及び当該文章の体裁に関する情報を記憶する記憶手段を有する情報処理装置が実行する制御方法であって、
前記文章の情報及び前記体裁に関する情報に基づき、前記原稿画像に含まれる行ごとに、当該原稿画像の一行分の画像に相当する一行画像と、当該一行画像に対応する文字を表す一行分の文章とを並べて表示手段に表示させる表示制御工程を有し、
前記表示制御工程は、前記光学文字認識により得られた文章から、校正に関し注目すべき箇所を検索し、当該箇所を強調表示することを特徴とする制御方法。