JP2009294788A - 情報処理装置、情報処理方法、制御プログラム及び記録媒体 - Google Patents

情報処理装置、情報処理方法、制御プログラム及び記録媒体 Download PDF

Info

Publication number
JP2009294788A
JP2009294788A JP2008146115A JP2008146115A JP2009294788A JP 2009294788 A JP2009294788 A JP 2009294788A JP 2008146115 A JP2008146115 A JP 2008146115A JP 2008146115 A JP2008146115 A JP 2008146115A JP 2009294788 A JP2009294788 A JP 2009294788A
Authority
JP
Japan
Prior art keywords
information
character
area
correspondence
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008146115A
Other languages
English (en)
Inventor
Yoshihisa Oguro
慶久 大黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008146115A priority Critical patent/JP2009294788A/ja
Priority to US12/475,881 priority patent/US8290312B2/en
Priority to CN2009101427215A priority patent/CN101600032B/zh
Priority to EP09161697A priority patent/EP2148280A1/en
Publication of JP2009294788A publication Critical patent/JP2009294788A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Abstract

【課題】入力された画像データ等の情報に含まれる文字情報の構成を保ったまま、文字情報に対応する情報を付加して出力することが容易な情報処理手段を提供すること。
【解決手段】複数の文字情報を含む画像データを取得し、取得された画像データに含まれる文字情報に対応する対応情報を取得し、文字情報を含む文字行の構成に基づいて、対応情報を挿入するための領域を示す領域情報を取得し、取得された領域情報に基づいて対応情報の挿入態様を決定することを特徴とする。
【選択図】図11

Description

本発明は、情報処理装置、情報処理方法、制御プログラム及び記録媒体に関し、特に、入力された情報に含まれる文字情報に対応した情報を挿入して出力する際の情報の処理に関する。
近年、情報の電子化が推進される傾向にあり、電子化された情報の出力に用いられるプリンタやファクシミリ等の画像形成装置、画像処理装置は欠かせない機器となっている。このような画像処理装置は、撮像機能、画像形成機能及び通信機能等を備えることにより、プリンタ、ファクシミリ、スキャナ、複写機等として利用可能な複合機として構成されることが多い。
このような複合機において、原稿の複写を実行する際に、単語の訳語を付加した原稿の画像データを出力する方法が提案されている(例えば、特許文献1)。特許文献1に開示された方法においては、行間への訳語の付加を可能とするための手段が開示されている。具体的には、訳語を付すべき単語が属する行と次の行との行間を広げることにより、訳語を付加すべきスペースを確保している。また、訳語を付加するスペースを確保する他の手段としては、表や図等、文書中に含まれる文章以外の情報を削除する例などがある。
特開平5−266075号公報
しかしながら、特許文献1の手段等を用いる場合、複写すべき元の原稿の構成が変更され、若しくは元の原稿に含まれていた情報が削除されてしまうという課題がある。例えば、原稿の画像データにおける行間を広げる場合、当然に1ページ中に含めることができる行数が減る。その結果、文書を構成する夫々のページの構成が変化し、ページ数も増大してしまう。また、元の文書に含まれていた表や図等の情報を削除する場合、文書の内容の理解が困難若しくは不能となり得る。
また、訳語の挿入に際して、対象の単語の近傍に数字や記号などを挿入し、他のスペースに上記数字や記号等と訳語とを関連付けて脚注として表示することにより、訳語を挿入すべきスペースの課題を解決する態様もあり得る。ここで、脚注とは、書物等の文書の本文とは異なる部分(主として本文の下部)に付された注釈を示す。文書の読み易さのためには、可能な限り対象となる単語の近傍に訳語そのものを挿入することが好ましい。しかしながら、対象となる単語の近傍に十分なスペースがない場合、文字サイズの極小化等を回避するため、上記記号等による脚注での対応となる。このような、対象の単語の近傍に挿入する情報を訳語そのものとするか上記記号等とするかの判断はユーザが行なう必要があり、ユーザの手間となっていた。
このような課題は、文書の言語を他の言語に訳す訳語を付加する場合に限らず、同一の言語間においても同様に課題となり得る。例えば、難解な専門用語や文書における造語に対する注釈を付加する場合等である。即ち、上記課題は、入力された情報に含まれる文字情報に対応した情報を挿入して出力する際に、同様に問題となり得る。
本発明は、上記実情を考慮してなされたものであり、取得された画像データの構成を保ったまま、文字情報に対応する情報が付加された画像データを出力することが容易な情報処理手段を提供することを目的とする。
上記課題を解決するために、請求項1に記載の発明は、画像データに含まれる文字情報に対応する対応情報を該画像データに挿入する情報処理装置であって、複数の文字情報を含む画像データを取得する画像データ取得部と、取得された前記画像データに含まれる文字情報に対応する対応情報を取得する対応情報取得部と、前記文字情報を含む文字行の構成に基づいて、前記対応情報を挿入するための領域を示す領域情報を取得する領域情報取得部と、取得された前記領域情報に基づいて前記対応情報の挿入態様を決定する挿入態様決定部とを有することを特徴とする。
また、請求項2に記載の発明は、請求項1に記載の情報処理装置において、前記挿入態様決定部が、取得された前記対応情報が前記領域に収まるように前記対応情報の挿入態様を決定することを特徴とする。
また、請求項3に記載の発明は、請求項2に記載の情報処理装置において、前記挿入態様決定部が、取得された前記対応情報を表示するための文字サイズを決定する文字サイズ決定手段を有し、前記挿入態様として前記決定した文字サイズを用いることを特徴とする。
また、請求項4に記載の発明は、請求項3に記載の情報処理装置において、前記文字サイズ決定手段が、取得された前記対応情報が前記領域に収まるように前記対応情報を表示するための文字サイズを決定し、前記挿入態様決定部が、前記決定された文字サイズと予め設定された閾値との関係に基づいて前記挿入態様を決定することを特徴とする。
また、請求項5に記載の発明は、請求項4に記載の情報処理装置において、前記挿入態様決定部が、前記文字サイズが前記閾値よりも小さい場合、前記対応情報を前記領域とは異なる他の領域に表示するように前記挿入態様を決定することを特徴とする。
また、請求項6に記載の発明は、請求項2乃至5いずれか1項に記載の情報処理装置において、前記挿入態様決定部が、前記挿入態様として、取得された前記対応情報を表示するための行数を決定することを特徴とする。
また、請求項7に記載の発明は、請求項2乃至6いずれか1項に記載の情報処理装置において、前記対応情報取得部が、1つの前記文字情報に対応する対応情報として複数の対応情報を取得し、前記挿入態様決定部は、取得された複数の前記対応情報の一部を抽出し、抽出された該対応情報の挿入態様を決定することを特徴とする。
また、請求項8に記載の発明は、請求項2乃至7いずれか1項に記載の情報処理装置において、前記挿入態様決定部は、前記画像データに含まれる文字情報に隣接する他の文字情報に対応する対応情報に基づいて、取得された前記領域情報を修正することを特徴とする。
また、請求項9に記載の発明は、請求項1乃至8いずれか1項に記載の情報処理装置において、前記領域情報取得部が、前記文字情報に隣接する余白の領域を示す領域情報を取得することを特徴とする。
また、請求項10に記載の発明は、請求項1乃至8いずれか1項に記載の情報処理装置において、前記領域情報取得部が、前記文字情報が含まれる対象文字行と該対象文字行に隣接する隣接行との行間の領域を示す領域情報を取得することを特徴とする。
また、請求項11に記載の発明は、請求項10に記載の情報処理装置において、前記領域情報取得部が、対応情報を挿入するための領域を示す領域情報として、前記文字列の幅に応じた前記行間における領域の情報を取得することを特徴とする。
また、請求項12に記載の発明は、請求項1乃至11いずれか1項に記載の情報処理装置において、前記領域情報取得部が、対応情報を挿入するための領域の外周に関する情報を取得することを特徴とする。
また、請求項13に記載の発明は、請求項1乃至11いずれか1項に記載の情報処理装置において、前記領域情報取得部が、対応情報を挿入するための領域の座標を示す情報を取得することを特徴とする。
また、請求項14に記載の発明は、請求項1乃至13いずれか1項に記載の情報処理装置において、前記対応情報取得部が、前記文字情報の訳語を示す情報を取得することを特徴とする。
また、請求項15に記載の発明は、請求項1乃至13いずれか1項に記載の情報処理装置において、前記対応情報取得部は、前記文字情報を解説する情報を取得することを特徴とする。
また、請求項16に記載の発明は、画像データに含まれる文字情報に対応する対応情報を該画像データに挿入する情報処理方法であって、複数の文字情報を含む画像データを取得し、取得された前記画像データに含まれる文字情報に対応する対応情報を取得し、前記文字情報を含む文字行の構成に基づいて、前記対応情報を挿入するための領域を示す領域情報を取得し、取得された前記領域情報に基づいて前記対応情報の挿入態様を決定することを特徴とする。
また、請求項17に記載の発明は、情報処理プログラムであって、請求項16に記載の情報処理方法を情報処理装置に実行させることを特徴とする。
また、請求項18に記載の発明は、記録媒体であって、請求項17に記載の情報処理プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする。
本発明によれば、取得された画像データの構成を保ったまま、文字情報に対応する情報が付加された画像データ出力することが容易な情報処理手段を提供することが可能となる。
実施の形態1.
以下、図面を参照して、本発明の実施形態を詳細に説明する。
本実施形態においては、入力された情報に訳語等の情報を挿入する情報処理装置として、スキャナ、プリンタ及び複写機としての機能を有する複合機としての画像処理装置を例として説明する。本実施形態に係る画像処理装置は、プリントアウトや複写等の画像形成動作を実行する際に、画像形成対象として入力された情報を解析し、単語を翻訳する訳語や言葉を解説する注釈等の情報を挿入する。本実施形態においては、画像処理装置による上記入力された情報の解析及び訳語等の挿入処理が要旨となる。
図1は、本実施形態に係る画像処理装置1のハードウェア構成を示すブロック図である。図1に示すように、本実施形態に係る画像処理装置1は、一般的なサーバやPC(Personal Computer)等の情報処理端末と同様の構成を含む。即ち、本実施形態に係る画像処理装置1は、CPU(Central Processing Unit)10、RAM(Random Access Memory)20、エンジン30、ROM(Read Only Memory)40、NVRAM(Non―Volatile Random Access Memory)50及びI/F60がバス90を介して接続されている。また、I/F60にはLCD(Liquid Crystal Display)70及び操作部80が接続されている。
CPU10は演算手段であり、画像処理装置1全体の動作を制御する。RAM20は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU10が情報を処理する際の作業領域として用いられる。エンジン30は、スキャナやプリンタ等の画像処理機能を実行する画像処理エンジンである。ROM40は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。
NVRAM50は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム及びアプリケーション・プログラムの動作パラメータの情報等が格納される。I/F60は、バス90と各種のハードウェアやネットワーク等を接続し制御する。LCD70は、ユーザが画像処理装置1の状態を確認するための視覚的ユーザインタフェースである。操作部80は、キーボードやマウス等、ユーザが画像処理装置1に情報を入力するためのユーザインタフェースである。
このようなハードウェア構成において、ROM40やNVRAM50若しくは図示しないHDD(Hard Disk Drive)や光学ディスク等の記憶媒体に格納されたプログラムがRAM20に読み出され、RAM20に読み出されたプログラムに従ってCPU10が動作することにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る画像処理装置1の機能を実現する機能ブロックが構成される。
図2は、本実施形態に係る画像処理装置1の機能構成を示すブロック図である。図2に示すように、本実施例に係る画像処理装置1は、コントローラ100、ADF(Auto Document Feeder:原稿自動搬送装置)101、スキャナユニット102、排紙トレイ103、ネットワークI/F104、ディスプレイパネル105、給紙テーブル106、プリントエンジン107、排紙トレイ108及び語意情報DB109を有する。
また、コントローラ100は、主制御部111、エンジン制御部112、入出力制御部113、画像処理部114及び情報挿入制御部120を有する。尚、図2においては、電気的接続を実線の矢印で示しており、用紙の流れを破線の矢印で示している。コントローラ100は、図1に示すRAM20にロードされたプログラムに従ってCPU10が動作することにより実現される。
ネットワークI/F104は、画像処理装置1がクライアント端末等の他の機器と通信する際のインタフェースである。ネットワークI/F104は、図1に示すI/F60によって実現される。クライアント端末が送信した印刷ジョブは、ネットワークI/F104を介してコントローラ100に入力され、コントローラ100の制御に従って印刷ジョブに基づいた画像形成処理が実行される。
ディスプレイパネル105は、画像処理装置1の状態を視覚的に表示する出力インタフェースであると共に、タッチパネルとしてユーザが画像処理装置1を直接操作する際の入力インタフェースでもある。ディスプレイパネル105は、図1に示すLCD70及び操作部80によって実現される。
語意情報DB109は、単語とその意味とが関連付けられた辞書情報や、専門用語等の難解な用語とその意味とが関連付けられた情報等を含む。語意情報DB109は、図1に示すNVRAM50や図示しないHDD等の不揮発性の記憶媒体に記憶された情報によって実現される。
主制御部111は、コントローラ100に含まれる各部を制御する役割を担い、コントローラ100の各部に命令を与える。エンジン制御部112は、プリントエンジン107やスキャナユニット102等を制御若しくは駆動する駆動手段としての役割を担う。入出力制御部113は、ネットワークI/F104を介して入力される印刷ジョブ等の情報を主制御部111に入力する。また、入出力制御部113は、主制御部111の命令に従ってネットワークI/F104を介してネットワークに接続された他の装置に情報を送信する。
画像処理部114は、主制御部111の制御に従い、印刷ジョブに含まれる情報等に基づいて描画情報を生成する。この描画情報とは、プリントエンジン107が画像形成動作において形成すべき画像を描画するための情報である。また、画像処理部114は、スキャナユニット102から入力される撮像データを処理し、画像データを生成する。この画像データとは、スキャナ動作の結果物として図示しないHDDに格納され若しくはネットワークI/F104を介してクライアント端末等に送信される情報である。
情報挿入制御部120は、主制御部111の制御に従い、画像形成出力対象として入力された情報の解析及び情報の挿入を行なう。情報挿入制御部120は、語意情報DB109を参照して、上記の解析及び情報の挿入処理を行なう。情報挿入制御部120によって提供される機能が本実施形態の要旨の1つとなる。
画像処理装置1がプリンタとして動作する場合は、まず、入出力制御部113がネットワークI/F104に接続されたUSB(Universal Serial Bus)やLAN(Local Area Network)を介して印刷ジョブを受信することにより印刷ジョブが発生する。印刷ジョブが発生すると、主制御部111は、印刷ジョブに含まれる画像情報を情報挿入制御部120に入力する。情報挿入制御部120は、主制御部111の制御に従い、訳語や注釈等の情報挿入を実行し、出力情報を生成する。この処理については後に詳述する。
情報挿入が完了すると、情報挿入制御部120は、生成した出力情報を主制御部111に送信する。次に、画像処理部114が主制御部111の命令に従い、情報挿入制御部120によって生成された出力情報に基づいて描画情報を生成する。画像処理部114によって生成された描画情報は、順次図示しないHDDに一時的に保持される。
エンジン制御部112は、主制御部111の制御に従い、給紙テーブル106を駆動して印刷用紙をプリントエンジン107に搬送する。また、エンジン制御部112は、図示しないHDDに保持された描画情報を取得し、プリントエンジン107に入力する。プリントエンジン107は、エンジン制御部112から受信した描画情報に基づき、給紙テーブル106から搬送される用紙に対して画像形成を実行する。即ち、プリントエンジン107が画像形成部として動作する。プリントエンジン107の具体的態様としては、インクジェット方式による画像形成機構や電子写真方式による画像形成機構等を用いることが可能である。プリントエンジン107によって画像形成が施された文書は排紙トレイ108に排紙される。
このような画像処理装置1において、上述したように、本実施形態の要旨は情報挿入制御部120による訳語や注釈の挿入処理にある。本実施形態に係る情報挿入制御部120について、図3を参照して更に詳細に説明する。
図3は、本実施形態に係る情報挿入制御部120の詳細及び情報挿入制御部と主制御部111、語意情報DB109との接続関係を示すブロック図である。図3に示すように、本実施形態に係る情報挿入制御部120は、入力情報取得部121、文字情報認識部122、情報挿入処理部123及び出力情報生成部124を有する。本実施形態に係る情報挿入制御部120は、図1に示すRAM20にロードされたプログラムに従ってCPU10が動作することにより構成される。
入力情報取得部121は、画像形成出力の対象となる情報、即ち訳語や注釈を付す対象となる情報として入力された情報(以降、入力情報とする)を取得する。入力情報は、スキャナユニット102によるスキャン処理によって生成される画像情報若しくはネットワークI/F104を介して入力される印刷ジョブに含まれる画像情報として画像処理装置1に入力される。入力情報取得部121は、上記入力情報を主制御部111から取得する。入力情報取得部121は、取得した入力情報を文字情報認識部122に入力する。
文字情報認識部122は、入力情報取得部121が取得した入力情報に含まれる文字情報を認識する。尚、文字情報認識部122が実行する文字情報の認識処理は、OCR(Optical Character Recognition:光学文字認識)処理に限られず、印刷ジョブ等により入力された画像情報に含まれる文字コードを認識する処理であってもよい。
ここで、文字情報認識部122による文字認識処理について、図を参照して説明する。図4は、本実施形態における文字情報認識部122による文字認識動作を示すフローチャートである。図4に示すように、本実施形態に係る文字認識処理において、文字情報認識部122は、先ず入力情報取得部121から入力情報を取得する(S401)。図4の説明においては、図5に示すような画像500を入力情報として取得する場合を例とする。図5に示す入力情報は、白地に黒い文字で文章が表示された画像情報である。
図5に示すような入力情報を取得すると、文字情報認識部122は、入力情報において連続している黒画素を認識する(S402)。そして、文字情報認識部122は、認識した黒画素の外接矩形を抽出する(S403)。図6は、文字認識部122による矩形抽出処理の態様を示す図である。図6に示すように外接矩形を抽出すると、文字情報認識部122は、隣接する矩形同士を連結し、一定方向に延長することによって行を抽出する(S404)。図7は、文字認識部122による行抽出処理の態様を示す図である。
S404における行抽出処理においては、縦書き若しくは横書きのいずれかによって短形同士を連結する方向が異なる。即ち、入力情報に含まれる文書が縦書きであれば、文字情報認識部122は、縦方向に短形同士を連結するように処理する。他方、入力情報に含まれる文書が横書きであれば、文字情報認識部122は、横方向に短形同士を連結するように処理する。図7に示すように、本実施形態においては、入力情報に表示された文書が横書きである。従って、文字情報認識部122は、横方向に短形同士を連結して行抽出を行なう。S404の処理により、図4の例においては、図7に示すように、行画像501〜504が抽出される。尚、文字情報認識部122は、S404の処理により、図7に示すように行画像を抽出する場合の他、例えば英単語毎の単語毎の表示領域を抽出することも可能である。このような例については後述する。
図7に示すように行抽出を行なうと、文字情報認識部122は、抽出された行画像の夫々に対して、文字抽出処理を実行する(S405)。文字情報認識部122は、文字抽出処理において、特徴抽出、パターン辞書照合により文字画像に対応するテキストデータを抽出し、文字認識を実行する。文字認識処理においては、公知の技術を用いることが可能であり、本実施形態においては詳細な説明を省略する。
文字情報認識部122は、図4に示す文字認識動作により、文字情報抽出を抽出すると、抽出した文字情報と入力情報の画像においてその文字情報が表示されている領域とが関連付けられた情報(以降、文字表示領域情報)を生成する。図8に、図4の例において生成される文字表示領域情報に含まれる情報の例を示す。図8に示すように、本実施形態に係る文字表示領域情報には、図4のS404において抽出した行毎の文字情報(以降、行文字情報とする)と、夫々の行文字情報が表示される領域を示す座標情報とを含む。尚、上述したようにS404において英単語毎の表示領域を抽出した場合、S405の処理によって生成される情報は、行文字情報ではなく単語文字情報となる。このような例については後述する。
文字情報認識部122は、図8に示すように文字表示領域情報を生成すると、透明テキスト情報510を生成する。ここで、透明テキスト情報510とは、文字表示領域情報に含まれる夫々の行文字情報であって透明な文字情報が、夫々の表示領域に配置された情報である。文字情報認識部122は、図9に示すように、透明テキスト情報510を入力情報500に重ねる。このように、画像情報である入力情報500に透明テキスト情報510が重ねられた情報が、本実施形態において画像データである出力対象情報として用いられる。
図9に示すように、入力情報500に透明テキスト情報510を重ねることにより、画像として表示されている文字情報を文字検索の対象とすることが可能となる。このような態様は、出力対象情報(若しくは後述する出力情報)をPDF(Portable Document Format)形式等の情報形式で保存する場合に特に有効である。文字情報認識部122は、図9に示す画像データである出力対象情報を情報挿入処理部123に入力する。即ち、情報挿入処理部123が画像データ取得部として機能する。
情報挿入処理部123は、文字情報認識部123から取得した出力対象情報と語意情報DB115に基づき、訳語や注釈等の挿入情報を出力対象情報に挿入する。ここで、挿入情報とは、訳語や注釈等、出力対象情報に含まれる文字情報に対応する情報、即ち対応情報である。情報挿入処理部123は、出力対象情報への訳語や注釈等の挿入態様を示す挿入態様情報を生成し、出力情報生成部124に入力する。情報挿入処理部123による処理が、本実施形態に係る要旨の1つとなる。情報挿入処理部123の機能については、後に詳述する。
出力情報生成部124は、情報挿入処理部123から取得した挿入態様情報に基づき、出力対象情報に訳語や注釈等の挿入情報を挿入して最終的に出力すべき出力情報を生成する。このような情報挿入制御部120の機能により、本実施形態に係る情報挿入動作が実現される。
次に、本実施形態に係る情報挿入制御部120による情報挿入動作について、実例を示しながら説明する。以降、図10に示すような英文の文書を表示する画像を入力情報として取得し、訳語を挿入する場合を例として説明する。図11は、本実施形態に係る情報挿入制御部120の動作を示すフローチャートである。図11に示すように、まず、入力情報取得部121が、図10に示す入力情報を取得する(S1101)。入力情報取得部121は、取得した入力情報を文字情報認識部122に入力する。
入力情報取得部121から入力情報を取得すると、文字情報認識部122は、図4において説明した処理により文字認識処理を実行する(S1102)。ここで、図4においては、図5に示すように日本語の文書を入力情報とする場合を例とした。そして、図8に示すように、文字表示領域情報が、夫々の行画像が表示される領域を示す座標情報を含む場合を例とした。他方、図10に示すように、英文の文書を入力情報とする場合、単語画像が表示される領域を示す座標情報を抽出することが可能である。夫々の単語がスペースで区切られていることにより、夫々の単語が表示される範囲を容易に判別可能なためである。
従って、文字情報認識部122は、文字表示領域情報として、図12に示すように、単語の文字情報(以降、単語文字情報とする)とその単語が表示される領域を示す座標情報とが関連付けられた情報を生成する。文字情報認識部122は、文字表示領域情報及び図9に示す出力対象情報を情報挿入処理部123に入力する。
情報挿入処理部123は、文字情報認識部122から情報を取得すると、文字表示領域情報に含まれる単語を1つ選択する(S1103)。つまり、情報挿入処理部123は、S1103において、文字表示領域情報に含まれる複数の単語のうち、訳語等の対応情報を付加すべき対象の単語を取得する。即ち、情報挿入処理部123が、文字情報取得部として機能する。
そして、情報挿入処理部123は、語意情報DB109を参照し、選択した単語に対して辞書検索を実行する(S1104)。辞書検索の結果、S1103において選択された単語の訳語がある場合(S1105/YES)、情報挿入処理部123は、語意情報DB109から該当する訳語を対応情報として抽出する(S1106)。即ち、情報挿入処理部123が、対象文字情報に対応する対応情報を取得する対応情報取得部として機能する。
対応情報を抽出すると、情報挿入処理部123は、S1103において選択した単語(以降、対象単語とする)が含まれる行と次の行との行間等の余白の情報に基づき、対応情報の挿入態様を決定する(S1107)。S1107の処理の結果、情報挿入処理部123は、挿入すべき訳語とその挿入態様とを関連付けて示す挿入態様情報を生成する。ここで、上記挿入態様とは、挿入すべき単語の文字サイズや行数及び対象単語の近傍に表示するか脚注として表示するかの情報を含む。S1107の処理については、後に詳述する。
S1107の処理の後、出力対象情報に含まれる単語を全て選択し終わっていれば(S1108/YES)、情報挿入処理部123は、生成した挿入態様情報を出力情報生成部124に入力する。出力情報生成部124は、情報挿入処理部123によって生成された挿入態様情報に基づき、出力対象情報に訳語や注釈等の挿入情報が挿入された出力情報を生成し(S1109)、処理を終了する。S1107の処理の後、また全単語を選択し終えていない場合(S1108/NO)、S1103からの処理を繰り返す。尚、辞書検索(S1104)の結果、訳語が無い場合(S1105/NO)、S1106及びS1107の処理を行なわずにS1108の判断を実行する。
次に、図13を参照して、図11におけるS1107の処理の詳細について説明する。情報挿入制御部123は、図11のS1106において訳語情報を抽出すると、訳語情報を挿入する際に使用することができる領域(以降、挿入可能領域とする)を算出し(S1301)、算出された領域を示す領域情報を取得する。即ち、情報挿入処理部123が領域情報取得部として機能する。
挿入可能領域の算出処理について、図14及び図15を参照して説明する。図14の例においては、“document”という単語を対象単語とした場合の挿入可能領域を例とする。図14に示すように、情報挿入処理部123は、対象単語が表示されている領域に隣接する余白の領域を挿入可能領域とする。また、情報挿入処理部123は、図14に示すように、対象単語が含まれる行とその行に隣接する行との行間の領域を挿入可能領域とする。
図14に示すように、情報挿入処理部123は、“document”という単語に訳語を挿入するための挿入可能領域として、座標“(Xa,Ya)―(Xb,Yb)”で画定される領域を抽出する。具体的な手順として、先ず情報挿入処理部123は、図12に示す文字表示領域情報のうち、“document”に関連付けられた座標情報“(X3,Y3)―(X4,Y4)”を参照する。ここで、文字表示領域情報は、出力対象情報における文字情報構成を示す文字列構成情報として用いられる。そして、情報挿入処理部123は、“X3”及び“X4”に基づいて“Xa”、“Xb”を算出する。即ち、情報挿入処理部123は、対象単語の幅に応じた領域を挿入可能領域とする。また、情報挿入処理部124は、“Y4”に基づいて“Ya”を算出する。更に、情報挿入処理部123は、図14に示す単語“and”及び“U.S.”の上端の座標に基づいて“Yb”を抽出する。このような処理により、図14に破線で示す挿入可能領域を画定する座標の情報が算出される。
情報挿入処理部123は、図14に示す座標“(Xa,Ya)―(Xb,Yb)”を算出すると、その座標情報に基づき、訳語等の情報を挿入可能な幅及び高さを算出する。図15が上記幅及び高さの算出態様を示す図である。そして、情報挿入処理部123は、算出された幅“W”及び高さ“H”の情報を挿入可能領域の情報として用いる。即ち、情報挿入処理部123は、挿入可能領域の外周に関する情報を取得する。
情報挿入処理部123は、挿入可能領域を算出すると、図11におけるS1106において抽出された訳語の挿入態様を決定する(S1302)。S1302の処理において、情報挿入処理部123は、上記抽出された訳語がS1301において算出された挿入可能領域に収まるように、訳語の文字サイズや表示行数等を調整する。図16は、S1302における情報挿入処理部123の処理の例を示す図である。図16においては、“document”という単語の訳語として“文書”という単語がS1106において抽出された場合を例として説明する。
S1302の処理において、情報挿入処理部123は、図16に示すように、挿入情報を表示するために必要な領域の幅“FW”及び高さ“FH”が、挿入可能領域の幅“W”及び高さ“H”に収まるように、挿入情報の文字サイズを決定する。ここで、挿入情報の文字数及び挿入可能領域の幅“W”によっては、複数行で表示する方が一行で表示するよりも大きな文字サイズで表示可能な場合もあり得る。情報挿入処理部123は、S1302において、挿入情報を表示する行数も考慮して、上記最大の文字サイズを算出する。このような処理は、情報挿入処理部123に含まれる文字サイズ決定手段が実行する。
情報挿入処理部123は、S1302の処理により上記最大の文字サイズを算出すると、算出された文字サイズと予め定められた閾値となるサイズ(以降、閾値サイズと比較する)とを比較する(S1303)。算出された文字サイズが閾値サイズ以上である場合(S1303/YES)、情報挿入処理部123は、挿入情報を挿入可能領域に直接挿入することを決定する(S1304)。換言すると、情報挿入処理部123は、上記算出された文字サイズと予め定められた閾値との関係に基づいて対応情報の挿入態様を決定する。即ち、情報挿入処理部123が挿入態様決定部として機能する。
他方、算出された文字サイズが閾値サイズ未満である場合(S103/NO)、情報挿入処理部123は、対応情報を脚注として他の領域に挿入することを決定(S1305)する。S1304若しくはS1305の処理が終了すると、情報挿入処理部123は、S1302において決定した挿入態様若しくはS1305において決定された脚注としての挿入態様に基づいて挿入態様情報を生成し(S1306)、処理を終了する。
訳語や注釈等の対応情報は可能な限り対象単語の近傍(上記の例における挿入可能領域)に挿入することが好ましい。しかしながら、挿入可能領域が狭い場合、図16に示す幅“FW”及び高さ“FH”を挿入可能領域の幅“W”及び高さ“H”に合わせると、挿入情報の文字サイズが非常に小さくなる。その結果、挿入した訳語や注釈を読むことが困難となってしまう。このような課題に対して、図13に示す処理を実行することにより、対応情報をそのまま挿入可能領域に表示するか他の領域に表示するかの判断を好適に実行することが可能となる。
S1303の処理に際しては、文字サイズの閾値を予め設定しておく必要がある。この閾値は、人間が視認可能な最低限の文字サイズとして設定される。この閾値の設定は、例えばJIS(Japanese Industrial Standards:日本工業規格)において採用されているアメリカ式のポイントやPostScript Pointによって設定される。設定すべき値としては、例えば、多くの分野において標準として採用されている10.5ポイントや、官報の文字サイズとして採用されている8ポイントを用いることができる。
また、入力画像に含まれる文字サイズ(以降、入力文字サイズ)に基づいて決定することも可能である。例えば、図4において説明した文字認識動作において、文字サイズも抽出する。この文字サイズは、図4のS404において抽出された行画像の高さに基づいて抽出することが可能である。そして、このようにして抽出された入力文字サイズの所定の割合を文字サイズの閾値とする。この所定の割合としては、例えば50%、75%、80%等の値を用いることができる。また、入力文字サイズと同一の文字サイズを用いるようにすることもできる。
尚、図13の説明においては、対応情報を挿入可能領域に直接挿入する態様(S1304)、若しくは脚注として挿入する態様(S1305)のいずれかを判断する例を説明した。しかしながら、脚注に限らず、挿入可能領域以外の領域に挿入することを決定する処理であれば同様に可能である。上記挿入可能領域以外の領域としては、文章の末尾、ヘッダー、フッター及び異なるページ等が考えられる。
図17に、図11におけるS1109において生成される出力態様情報の例を示す。図17に示すように、情報挿入処理部123が、図11のS1109において生成する出力態様情報には、対応情報、挿入可能領域及び態様詳細の情報が含まれる。ここで、挿入態様の情報は、対応情報を挿入可能領域に“直接”挿入するか、若しくは“脚注”として挿入するか示す情報に加え、夫々の場合における詳細が含まれる。即ち、“直接”の場合、挿入態様情報は、対応情報を表示する文字サイズの情報を含む。他方、“脚注”の場合、挿入態様情報は、対象単語と脚注とを関連付けるための記号の情報を含む。
図18は、対応情報を挿入可能領域に直接挿入した場合の例を示す図である。他方、図19は、対応情報を脚注として挿入した場合の例を示す図である。尚、図18、図19の例においては、“document”の訳語として“文書”という単語を挿入する場合を例とする。図19に示すように、対応情報を脚注として挿入する場合、挿入可能領域には“※1”のような数字乃至記号を表示する。そして、他の余白スペースに“※1:文書”のように、挿入可能領域に表示した数字乃至記号と対応情報とを関連付けて表示する。
図19に示す態様により、挿入可能領域に対応情報を直接表示出来ない場合であっても、対象単語と対応情報との関連を容易に明示することが可能となる。出力情報生成部124は、図18若しくは図19に示すように対応情報を挿入した出力情報を生成すると、その出力情報を主制御部111に送信する。このような処理により、情報挿入制御部120による情報挿入動作が完了する。
尚、対応情報の挿入に際しては、図9に示す出力対象情報のように、対応情報を異なるレイヤーとして生成することが好ましい。これにより、入力情報500及び透明テキスト510と対応情報とを容易に分離することが可能となる。また、対応情報を透明テキスト510と同一のレイヤー(以降、追加レイヤーとする)に追加しても良い。この場合においても、入力情報500と追加レイヤーとの分離は容易なままであり、同様の効果を得ることが可能である。
以上説明したように、本実施形態に係る画像処理装置1は、情報挿入制御部120の機能により、入力情報のフォーマットを変更することなく、好適に訳語等の挿入を行なうことが可能となる。尚、上記図18、図19の説明においては、入力文書に含まれる単語の訳語を挿入する例を説明した。この他、上述した専門用語等の難解な用語に対する注釈や、独自に定義された造語に対する注釈等を挿入することも可能である。
上記の難解な用語若しくは造語の態様は、語意情報DB109に情報を追加することにより可能となる。即ち、難解な用語若しくは独自に定義された造語とそれらに対する説明とを関連付けて語意情報DB109に格納する。そして、情報挿入処理部123が、図11に示すS1104の辞書検索において、それら格納された用語若しくは造語に対する説明を抽出することにより、それらの説明を挿入情報として用いることが可能となる。
また、上記の説明においては、画像処理装置1がプリンタとして動作する場合に、情報挿入制御部120が機能し、訳語等が挿入される例を説明した。しかしながら、画像処理装置1がスキャナとして動作する場合であっても、適用することが可能である。画像処理装置1がスキャナとして動作する場合、まず入出力制御部113がスキャン実行指示を受信する。スキャン実行指示は、ユーザによるディスプレイパネル109に設けられたスタートキー198の操作若しくはネットワークI/F104を介して外部のホスト装置から入力される。このようなスキャン実行指示の入力により、入出力制御部113が主制御部111にスキャン実行信号を送信する。主制御部111は、入出力制御部113から受信したスキャン実行信号に基づき、エンジン制御部112を制御する。
エンジン制御部112は、ADF101を駆動し、ADF101にセットされた撮像対象原稿をスキャナユニット102に搬送する。また、エンジン制御部112は、スキャナユニット102を駆動し、ADF101から搬送される原稿を撮像する。また、ADF101に原稿がセットされておらず、スキャナユニット102に直接原稿がセットされた場合、スキャナユニット102は、エンジン制御部112の制御に従い、セットされた原稿を撮像する。即ち、スキャナユニット102が撮像部として動作する。
撮像動作においては、スキャナユニット102に含まれるCCD等の撮像素子が原稿を光学的に走査し、光学情報に基づいて生成された撮像情報が生成される。エンジン制御部112は、スキャナユニット102が生成した撮像情報を画像処理部114に転送する。画像処理部114は、主制御部111の制御に従い、エンジン制御部112から受信した撮像情報に基づいて画像情報を生成する。
画像処理部114が生成した画像情報は、主制御部111によって情報挿入制御部120に入力される。即ち、画像処理部114が生成した画像情報が入力情報として用いられる。情報挿入制御部120は、図11及び図13において説明した動作により情報挿入処理を実行し出力情報を生成する。情報挿入制御部120が生成した出力情報は、ユーザの指示に応じてHDDに格納され若しくは入出力制御部113及びネットワークI/F104を介して外部のホスト装置に送信される。
また、画像処理装置1が複写機として動作する場合であっても、本実施形態に係る情報挿入制御部120の機能を用いることが可能である。画像処理装置1が複写機として動作する場合は、エンジン制御部112がスキャナユニット102から受信した撮像情報若しくは画像処理部114が生成した画像情報が、主制御部111によって情報挿入制御部120に入力される。即ち、上記撮像情報若しくは画像処理部114が生成した画像情報が入力情報として用いられる。情報挿入制御部120は、上述した動作により情報挿入処理を実行し出力情報を生成する。エンジン制御部112は、主制御部111の制御に従い、情報挿入制御部120が生成した出力情報に基づいて、プリンタ動作の場合と同様に、プリントエンジン107を駆動する。
また、上記の説明においては、S1302における挿入態様の決定処理において、複数行の場合を考慮する例を説明した。しかしながら、出力対象情報若しくは出力情報をPDF形式等の情報として保存し、文字情報の検索対象とする場合、検索語が複数行に分割されていると、異なる別々の文言として判断され、好適な文字検索が出来ない場合があり得る。このような課題は、S1302による処理において、挿入情報を複数行で表示する場合を除外することにより解決することが可能となる。即ち、挿入情報を一の行で挿入すると文字サイズが閾値未満となってしまう場合は、脚注により挿入する。これにより、挿入情報の文字列が複数行に分割されないようにすることが可能となる。
また、上記の説明においては、図15に示すように、挿入可能領域の幅を対象単語(図14における“document”)の幅に限る例を説明した。しかしながら、対象単語の直前若しくは直後の単語に対して、訳語や注釈を付さない場合もあり得る。このような場合、図20に示すように、対象単語の幅を超えて挿入可能領域を決定しても良い。
また、対象単語の直前若しくは直後の単語に対して、訳語や注釈を付す場合であっても、対象単語の幅を超えて挿入可能領域を設定することも可能である。そのような例について図21に示す。図21に示す例においては、“document”という単語に対する対応情報の挿入可能領域が、“document”の幅を超えて設定されている。他方、“document”の直前の単語である“original”及び直後の単語である“establishing”に対する挿入情報の挿入可能領域は、夫々の単語の幅よりも狭い幅で設定されている。即ち、“document”に対する挿入情報の挿入可能領域を広げた分、直前及び直後の単語に対する対応情報の挿入可能領域が狭くなっている。
図21に示す例のような場合、図20の例と同様に、“document”という単語に対する対応情報の挿入可能領域を広げることが可能となる。この場合、直前及び直後の単語である“original”及び“establishing”という単語に対する対応情報の挿入可能領域が狭くなる。しかしながら、狭くなった領域内に対応情報を挿入可能であれば、特に問題となることはなく、文書の理解を助けることが可能となる。即ち、このような場合、情報挿入処理部123は、対象文字列である“document”に隣接する文字列(図21においては、“original”、“establishing”)に付加すべき対応情報に基づいて、対象文字列に対する挿入可能領域を修正する。
図20、図21に示す例のような挿入可能領域の設定処理は、情報挿入処理部123によって実行される。具体的には、図13のS1302において、情報挿入処理部123は、対象単語の前後に配置されている単語に基づき、S1301において算出された挿入可能領域の幅を修正する。即ち、情報挿入処理部123は、挿入すべき対応情報の幅(図16に示す“FW”)が狭い場合には、挿入可能領域の幅を狭くする。また、情報挿入処理部123は、挿入すべき対応情報の幅が広い場合には、挿入可能領域の幅を広くする。このような幅の調整は、図14に示す“original”、“document”、“establishing”のように、隣接する単語の挿入可能領域に挿入すべき単語の幅に基づいて実行される。
また、図18〜図21に示す例を組み合わせても良い。そのような例について、図22に示す。図22においては、“original”という単語及び“establishing”という単語に対する対応情報を脚注として挿入し、“document”という単語に対する対応情報を挿入可能領域に表示する例を示している。図22に示す態様により、互いに隣接する単語に対して挿入すべき対応情報の幅がいずれも広い場合において、脚注を用いる頻度を軽減し、文書の理解をより容易化することが可能となる。
尚、図22に示す態様においては、理解が容易であり対応情報を確認する必要性の低いものを脚注とし、理解が困難であり挿入情報を確認する必要性の高いものを挿入可能領域に挿入することが好ましい。このような判断は、例えば語意情報DB109に格納されている各単語について、語意の難易度を示す情報(以降、難易度情報とする)を付加しておくことにより可能となる。情報挿入処理部123は、上記難易度情報を参照し、難易度が高い対応情報を挿入可能領域に直接表示し、難易度が低い対応情報を脚注とする。
また、図22に示す例においては、1つの対象単語について複数の意味を示す対応情報が表示されている。1つの単語であっても複数の意味を有することは少なくない。このような例については、実施の形態2において詳述する。
また、上記の説明においては、図10に示すように、英文を入力情報とし、日本語の訳語を挿入する場合を例として説明した。しかしながら、図5に示すように、和文を入力情報とする場合もあり得る。このような場合、図12に示すように、文章を単語毎に区切ることが困難である。従って、和文を入力情報とする場合、図11のS1103において、情報挿入処理部123は形態素解析を実行することにより、単語を抽出する、このような態様により、上記と同様の効果を得ることが可能となる。尚、形態素解析処理においては、公知の技術を用いることが可能であり、本実施形態においては詳細な説明を省略する。
また、上記の説明においては、脚注を用いる場合、図19に示すように、挿入可能領域に記号等を挿入し、その記号と対応情報とを関連付けて他の領域に表示する例を説明した。しかしながら、文章の行間が非常に狭い場合、記号等を挿入することも困難な場合があり得る。このような場合の例について、図23に示す。図23の例においては、対象単語に下線を付すことにより、その対象単語に訳語や注釈等が存在することを示す。そして、図23に示すように、脚注により、対象単語とその訳語とを関連付けて示している。このような態様により、本文中には下線を付すのみで、文章の理解を助ける情報を挿入することが可能となる。
尚、図23に示す例においては、対象単語に訳語や注釈等が存在することを示すため下線を付す例を示した。この他、対象単語のフォントの種類を変える態様や対象単語の色を変える態様若しくは対象単語を太字にする態様等が考えられる。図23に示す態様の実行は、情報挿入処理部123が、図13に示すS1301において算出された挿入可能領域の幅に基づいて判断する。
また、上記の説明においては、印刷ジョブやスキャン若しくは複写動作の結果生成された画像情報を入力情報として取得し、図4において説明したように文字認識を行なう例を説明した。しかしながら、入力情報として、テキスト情報によって構成される文書情報を取得することも考えられる。このような場合、図11の動作において、S1102の処理は不要となる。
また、上記の説明においては、図13のS1301において、図12に示す文字表示領域情報に基づいて挿入可能領域を算出する例を説明した。しかしながら、入力情報として用いる文書情報がフォーマット情報として行間の余白に関する情報を含む場合もあり得る。このような場合、情報挿入処理部123は、図13のS1301において、そのフォーマット情報を参照して挿入可能領域を容易に算出することが可能となる。尚、上記行間の余白に関する情報を含む文書情報は、PCのディスプレイモニタやプリントアウト出力等において画像を表現するための情報であり、画像データに含まれる。
また、図18、図19の例においては、挿入可能領域の左端から対応情報を表示する例を説明した。この他、情報挿入処理部123は、対応情報を挿入可能領域の中央に配置するように出力態様情報を生成しても良い。
また、上記の説明においては、図10に示すように、白地に黒の文字列が表示されている画像を入力情報とする例を説明した。しかしながら、入力情報の背景色及び文字色は白や黒とは限らない。従って、情報挿入処理部123は、入力情報の背景色や文字色に応じた処理を実行することが好ましい。例えば、図4においては黒画素を抽出して文字認識を実行する例を説明したが、入力情報の背景色及び文字色に応じて抽出する画素の色を変更することが好ましい。このような画素の色の変更は、ユーザが手動で設定しても良いし、情報挿入処理部123が色を検知することによって実行しても良い。
また、上記の説明においては、図14に示すように、対象単語が含まれる行とその次の行との行間に挿入可能領域を設定する例を説明した。この他、対象単語が含まれる行とその前の行との行間に挿入可能領域を設定するようにしても良い。
実施の形態2.
実施の形態1においては、図17に示すように、情報挿入処理部123が、1つの対象単語に対して1つの挿入情報を抽出する例を説明した。しかしながら、1つの単語に対して1つの挿入情報が関連付けられているとは限らない。本実施形態においては、語意情報DB109において、1つの単語の意味として複数の情報が格納されている場合について説明する。尚、実施の形態1と同様の符号を付す構成については、実施の形態1と同一または相当部を示し、説明を省略する。
図24は、本実施形態に係る語意情報DB109に記憶されている情報の例を示す図である。図24に示すように、語意情報DB109は、“original”という単語の意味として、複数の情報を記憶している。このような場合、情報挿入処理部123は、図11のS1106において、複数の訳語を対応情報として抽出する。そして、図13におけるS1302及びS1303において、複数の対応情報に対応した挿入態様の決定処理を実行する。
本実施形態に係るS1302及びS1303において、情報挿入処理部123は、抽出された全対応情報が挿入可能領域に閾値サイズ以上のサイズで収まるか否かを判断する。収まると判断された場合、情報挿入処理部123は、抽出された全対応情報を直接挿入可能領域に挿入する。図25は、抽出された全対応情報を直接挿入可能領域に挿入した場合を示す図である。
抽出された全対応情報が挿入可能領域内に閾値サイズ以上のサイズで収まらないと判断した場合、情報挿入処理部123は、抽出された対応情報を1つ削除し、再度上記の判断を実行する。そして、情報挿入処理部123は、上記判断の結果、対応情報が挿入可能領域に収まると判断されたところで、図13に示すS1306の処理を実行する。図26に、そのような例の一態様を示す。図26は、図24に示す複数の意味のうち、“原作”及び“独創的な人”という単語を削除したところで挿入可能となった状態を示す図である。
他方、抽出された全対応情報が1つになっても、対応情報が挿入可能領域に収まると判断されなかった場合、情報挿入処理部123は、図13に示すS1305以降の処理を実行する。このような処理により、1つの単語について複数の対応情報が抽出された場合に、可能な限り多くの対応情報を挿入することが可能となる。
尚、上記の説明においては、抽出された全対応情報が挿入可能領域に閾値サイズ以上のサイズで収まらないと判断した場合、情報挿入処理部123は、抽出された対応情報を1つ削除する例を説明した。この対応情報を削除する順番は、例えば、情報挿入処理部123が、挿入可能領域の幅及び高さに基づいて決定することが可能である。閾値サイズで対応情報を挿入するために必要な領域が挿入可能領域をわずかにオーバーする場合、文字列長の短い対応情報を削除すれば良いと考えられる。他方、上記必要な領域が挿入可能領域を大幅にオーバーする場合、なるべく文字列長の長い対応情報を削除するべきであると考えられる。
また、図24に示すように、語意情報DB109が1つの単語の意味として複数の意味を記憶している場合、さらに夫々の意味に優先順位を設定しておくことができる。そして、情報挿入処理部123は、上述したように対応情報を削除する場合、上記優先順位の低い順番に削除する。このような態様により、優先順位の高い訳語が挿入されるようにすることができる。
また、情報挿入処理部123は、図13のS1301において算出した挿入可能領域に基づき、複数の訳語のうちいずれか1つを選択するようにしても良い。例えば、図27に示すように、情報挿入処理部123は、挿入可能領域が広い場合は、文字列長の長い訳語を選択する。他方、図28に示すように、挿入可能領域が狭い場合、情報挿入処理部123は、文字列長の短い訳語を選択する。尚、図27、図28においては、挿入可能領域を破線で示している。
また、複数の対応情報が抽出された場合において、全対応情報を挿入することを前提としても良い。この場合、情報挿入処理部123は、上述したような訳語を順番に削除する処理を行なわず、複数の訳語を対応情報として図13に示す処理を実行する。
以上説明したように、本実施形態に係る画像処理装置1により、1つの単語に対して複数の訳語や注釈が対応情報として抽出された場合であっても、好適に文書の理解を助ける訳語等の挿入を行なうことが可能となる。
本発明の実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。 本発明の実施形態に係る画像処理装置の機能構成を示すブロック図である。 本発明の実施形態に係る情報挿入制御部の機能構成を示すブロック図である。 本発明の実施形態に係る文字情報認識部の動作を示すフローチャートである。 本発明の実施形態に係る入力情報の例を示す図である。 本発明の実施形態に係る入力情報の例を示す図である。 本発明の実施形態に係る入力情報の例を示す図である。 本発明の実施形態に係る文字表示領域情報の例を示す図である。 本発明の実施形態に係る出力対象情報の例を示す図である。 本発明の実施形態に係る入力情報の例を示す図である。 本発明の実施形態に係る情報挿入処理部の動作を示すフローチャートである。 本発明の実施形態に係る文字表示領域情報の例を示す図である。 本発明の実施形態に係る情報挿入処理部の動作を示すフローチャートである。 本発明の実施形態に係る挿入可能領域の抽出態様を示す図である。 本発明の実施形態に係る挿入可能領域の算出態様を示す図である。 本発明の実施形態に係る対応情報のサイズを示す図である。 本発明の実施形態に係る挿入態様情報の例を示す図である。 本発明の実施形態に係る対応情報の挿入態様の例を示す図である。 本発明の実施形態に係る対応情報の挿入態様の例を示す図である。 本発明の実施形態に係る挿入可能領域の抽出態様を示す図である。 本発明の実施形態に係る挿入可能領域の抽出態様を示す図である。 本発明の実施形態に係る対応情報の挿入態様の例を示す図である。 本発明の実施形態に係る対応情報の挿入態様の例を示す図である。 本発明の他の実施形態に係る語意情報DBに格納されている情報の例を示す図である。 本発明の他の実施形態に係る対応情報の挿入態様の例を示す図である。 本発明の他の実施形態に係る対応情報の挿入態様の例を示す図である。 本発明の他の実施形態に係る対応情報の挿入態様の例を示す図である。 本発明の他の実施形態に係る対応情報の挿入態様の例を示す図である。
符号の説明
1 画像処理装置
10 CPU
20 RAM
30 エンジン
40 ROM
50 NVRAM
60 I/F
70 LCD
80 操作部
100 コントローラ
101 ADF
102 スキャナユニット
103 排紙トレイ
104 ネットワークI/F
105 ディスプレイパネル
106 給紙テーブル
107 プリントエンジン
108 排紙トレイ
109 語意情報DB
111 主制御部
112 エンジン制御部
113 入出力制御部
114 画像処理装置
120 情報挿入制御部
121 入力情報取得部
122 文字情報認識部
123 情報挿入処理部
124 出力情報生成部

Claims (18)

  1. 画像データに含まれる文字情報に対応する対応情報を該画像データに挿入する情報処理装置であって、
    複数の文字情報を含む画像データを取得する画像データ取得部と、
    取得された前記画像データに含まれる文字情報に対応する対応情報を取得する対応情報取得部と、
    前記文字情報を含む文字行の構成に基づいて、前記対応情報を挿入するための領域を示す領域情報を取得する領域情報取得部と、
    取得された前記領域情報に基づいて前記対応情報の挿入態様を決定する挿入態様決定部とを有することを特徴とする、情報処理装置。
  2. 前記挿入態様決定部は、取得された前記対応情報が前記領域に収まるように前記対応情報の挿入態様を決定することを特徴とする、請求項1に記載の情報処理装置。
  3. 前記挿入態様決定部は、取得された前記対応情報を表示するための文字サイズを決定する文字サイズ決定手段を有し、前記挿入態様として前記決定した文字サイズを用いることを特徴とする、請求項2に記載の情報処理装置。
  4. 前記文字サイズ決定手段は、取得された前記対応情報が前記領域に収まるように前記対応情報を表示するための文字サイズを決定し、
    前記挿入態様決定部は、前記決定された文字サイズと予め設定された閾値との関係に基づいて前記挿入態様を決定することを特徴とする、請求項3に記載の情報処理装置。
  5. 前記挿入態様決定部は、前記文字サイズが前記閾値よりも小さい場合、前記対応情報を前記領域とは異なる他の領域に表示するように前記挿入態様を決定することを特徴とする、請求項4に記載の情報処理装置。
  6. 前記挿入態様決定部は、前記挿入態様として、取得された前記対応情報を表示するための行数を決定することを特徴とする、請求項2乃至5いずれか1項に記載の情報処理装置。
  7. 前記対応情報取得部は、1つの前記文字情報に対応する対応情報として複数の対応情報を取得し、
    前記挿入態様決定部は、取得された複数の前記対応情報の一部を抽出し、抽出された該対応情報の挿入態様を決定することを特徴とする、請求項2乃至6いずれか1項に記載の情報処理装置。
  8. 前記挿入態様決定部は、前記画像データに含まれる文字情報に隣接する他の文字情報に対応する対応情報に基づいて、取得された前記領域情報を修正することを特徴とする、請求項2乃至7いずれか1項に記載の情報処理装置。
  9. 前記領域情報取得部は、前記文字情報に隣接する余白の領域を示す領域情報を取得することを特徴とする、請求項1乃至8いずれか1項に記載の情報処理装置。
  10. 前記領域情報取得部は、前記文字情報が含まれる対象文字行と該対象文字行に隣接する隣接行との行間の領域を示す領域情報を取得することを特徴とする、請求項1乃至8いずれか1項に記載の情報処理装置。
  11. 前記領域情報取得部は、対応情報を挿入するための領域を示す領域情報として、前記文字列の幅に応じた前記行間における領域の情報を取得することを特徴とする、請求項10に記載の情報処理装置。
  12. 前記領域情報取得部は、対応情報を挿入するための領域の外周に関する情報を取得することを特徴とする、請求項1乃至11いずれか1項に記載の情報処理装置。
  13. 前記領域情報取得部は、対応情報を挿入するための領域の座標を示す情報を取得することを特徴とする、請求項1乃至11いずれか1項に記載の情報処理装置。
  14. 前記対応情報取得部は、前記文字情報の訳語を示す情報を取得することを特徴とする、請求項1乃至13いずれか1項に記載の情報処理装置。
  15. 前記対応情報取得部は、前記文字情報を解説する情報を取得することを特徴とする、請求項1乃至13いずれか1項に記載の情報処理装置。
  16. 画像データに含まれる文字情報に対応する対応情報を該画像データに挿入する情報処理方法であって、
    複数の文字情報を含む画像データを取得し、
    取得された前記画像データに含まれる文字情報に対応する対応情報を取得し、
    前記文字情報を含む文字行の構成に基づいて、前記対応情報を挿入するための領域を示す領域情報を取得し、
    取得された前記領域情報に基づいて前記対応情報の挿入態様を決定することを特徴とする、情報処理方法。
  17. 請求項16に記載の情報処理方法を情報処理装置に実行させることを特徴とする情報処理プログラム。
  18. 請求項17に記載の情報処理プログラムを情報処理装置が読み取り可能な形式で記録したことを特徴とする記録媒体。
JP2008146115A 2008-06-03 2008-06-03 情報処理装置、情報処理方法、制御プログラム及び記録媒体 Pending JP2009294788A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2008146115A JP2009294788A (ja) 2008-06-03 2008-06-03 情報処理装置、情報処理方法、制御プログラム及び記録媒体
US12/475,881 US8290312B2 (en) 2008-06-03 2009-06-01 Information processing apparatus, method of processing information, control program, and recording medium
CN2009101427215A CN101600032B (zh) 2008-06-03 2009-06-02 信息处理装置、信息处理方法、控制程序及记录介质
EP09161697A EP2148280A1 (en) 2008-06-03 2009-06-02 Information processing apparatus, method of processing information, control program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008146115A JP2009294788A (ja) 2008-06-03 2008-06-03 情報処理装置、情報処理方法、制御プログラム及び記録媒体

Publications (1)

Publication Number Publication Date
JP2009294788A true JP2009294788A (ja) 2009-12-17

Family

ID=41334531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008146115A Pending JP2009294788A (ja) 2008-06-03 2008-06-03 情報処理装置、情報処理方法、制御プログラム及び記録媒体

Country Status (4)

Country Link
US (1) US8290312B2 (ja)
EP (1) EP2148280A1 (ja)
JP (1) JP2009294788A (ja)
CN (1) CN101600032B (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011150599A (ja) * 2010-01-22 2011-08-04 Ricoh Co Ltd 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2012118890A (ja) * 2010-12-02 2012-06-21 Sharp Corp 文書画像生成装置および文書画像生成方法
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
US8958080B2 (en) 2010-01-07 2015-02-17 Sharp Kabushiki Kaisha Document image generating apparatus, document image generating method and computer program, with adjustment of ruby-added image
JP2015041309A (ja) * 2013-08-23 2015-03-02 株式会社ナカヨ 文書表示中に参照情報を表示する方法
JP2015172792A (ja) * 2014-03-11 2015-10-01 株式会社リコー 翻訳システム、情報処理装置、情報処理方法およびプログラム
WO2016129515A1 (ja) * 2015-02-11 2016-08-18 藤田 一郎 外国語学習用プログラム及び方法
JP2017084184A (ja) * 2015-10-29 2017-05-18 コニカミノルタ株式会社 情報付加文書生成装置、プログラム
JP2017094535A (ja) * 2015-11-19 2017-06-01 コニカミノルタ株式会社 画像形成装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4626356B2 (ja) * 2005-03-25 2011-02-09 富士ゼロックス株式会社 付加情報を含む電子文書を編集する方法、装置およびプログラム
US9069550B2 (en) 2010-11-29 2015-06-30 International Business Machines Corporation System and method for adjusting inactivity timeout settings on a display device
JP5631362B2 (ja) * 2011-08-08 2014-11-26 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
CN103568607B (zh) * 2012-07-20 2017-04-26 精工爱普生株式会社 印刷系统
KR20150006740A (ko) * 2013-07-09 2015-01-19 류중하 문자에 대한 기호 이미지 구성 방법, 및 기호 이미지에 대한 대응되는 문자의 분석 방법
CN104346616B (zh) * 2013-08-09 2017-12-12 北大方正集团有限公司 字符识别装置和字符识别方法
CN104572605B (zh) * 2013-10-16 2019-03-08 北大方正集团有限公司 脚注排版的实现方法和装置
US9442923B1 (en) * 2015-11-24 2016-09-13 International Business Machines Corporation Space constrained text translator
US9639528B1 (en) * 2016-01-29 2017-05-02 Sap Se Translation-based visual design
US10140260B2 (en) 2016-07-15 2018-11-27 Sap Se Intelligent text reduction for graphical interface elements
US10503808B2 (en) 2016-07-15 2019-12-10 Sap Se Time user interface with intelligent text reduction
JP6610471B2 (ja) * 2016-08-31 2019-11-27 京セラドキュメントソリューションズ株式会社 画像形成装置
CN108133214B (zh) * 2017-12-25 2021-01-26 广东小天才科技有限公司 一种基于图片纠正的信息搜索方法及移动终端
JP7105210B2 (ja) 2019-03-26 2022-07-22 富士フイルム株式会社 画像処理方法、プログラム、及び画像処理システム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04311262A (ja) * 1991-04-10 1992-11-04 Fujitsu Ltd 辞書情報表示装置
JPH0962670A (ja) * 1995-08-24 1997-03-07 Sharp Corp 自動ルビ付加装置
JPH09284446A (ja) * 1996-04-18 1997-10-31 Ricoh Co Ltd 情報処理装置およびデジタル複写機および情報記憶媒体
JP2003122737A (ja) * 2001-10-10 2003-04-25 Seiko Epson Corp ディジタルコンテンツ作成システム及びディジタルコンテンツ作成プログラム、並びにディジタルコンテンツ作成方法
JP2003308310A (ja) * 2002-04-15 2003-10-31 Sharp Corp 表示方法、表示装置、表示プログラム、および表示プログラムを記録した記録媒体
JP2004362541A (ja) * 2003-05-15 2004-12-24 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体
JP2006261821A (ja) * 2005-03-15 2006-09-28 Fuji Xerox Co Ltd 画像形成装置および画像読み取り装置
JP2006331258A (ja) * 2005-05-30 2006-12-07 Sharp Corp 訳振り装置、画像処理装置、プログラム、及び記録媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59149526A (ja) 1983-01-28 1984-08-27 Fujitsu Ltd フイ−ルド内文書編集処理装置
JP2993528B2 (ja) 1991-05-18 1999-12-20 富士通株式会社 テキスト管理・復元方式
JPH05266074A (ja) 1992-03-24 1993-10-15 Ricoh Co Ltd 対訳画像形成装置
JP3269842B2 (ja) 1992-03-24 2002-04-02 株式会社リコー 対訳画像形成装置
US20030200078A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for language translation of character strings occurring in captured image data
US7639257B2 (en) 2002-07-31 2009-12-29 Adobe Systems Incorporated Glyphlets
JP2006268372A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US7697757B2 (en) * 2005-06-15 2010-04-13 Hewlett-Packard Development Company, L.P. Computer assisted document modification

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04311262A (ja) * 1991-04-10 1992-11-04 Fujitsu Ltd 辞書情報表示装置
JPH0962670A (ja) * 1995-08-24 1997-03-07 Sharp Corp 自動ルビ付加装置
JPH09284446A (ja) * 1996-04-18 1997-10-31 Ricoh Co Ltd 情報処理装置およびデジタル複写機および情報記憶媒体
JP2003122737A (ja) * 2001-10-10 2003-04-25 Seiko Epson Corp ディジタルコンテンツ作成システム及びディジタルコンテンツ作成プログラム、並びにディジタルコンテンツ作成方法
JP2003308310A (ja) * 2002-04-15 2003-10-31 Sharp Corp 表示方法、表示装置、表示プログラム、および表示プログラムを記録した記録媒体
JP2004362541A (ja) * 2003-05-15 2004-12-24 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体
JP2006261821A (ja) * 2005-03-15 2006-09-28 Fuji Xerox Co Ltd 画像形成装置および画像読み取り装置
JP2006331258A (ja) * 2005-05-30 2006-12-07 Sharp Corp 訳振り装置、画像処理装置、プログラム、及び記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSND200201175006; 岩田 眞介: '10分でわかる!!読み切りビジネスソフト講座 31 「読んde!!ココ Ver.8」' ASAHIパソコン 第318号, 20020915, p.72-75, 朝日新聞社 *
JPN6013027790; 岩田 眞介: '10分でわかる!!読み切りビジネスソフト講座 31 「読んde!!ココ Ver.8」' ASAHIパソコン 第318号, 20020915, p.72-75, 朝日新聞社 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
US8958080B2 (en) 2010-01-07 2015-02-17 Sharp Kabushiki Kaisha Document image generating apparatus, document image generating method and computer program, with adjustment of ruby-added image
JP2011150599A (ja) * 2010-01-22 2011-08-04 Ricoh Co Ltd 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2012118890A (ja) * 2010-12-02 2012-06-21 Sharp Corp 文書画像生成装置および文書画像生成方法
JP2015041309A (ja) * 2013-08-23 2015-03-02 株式会社ナカヨ 文書表示中に参照情報を表示する方法
JP2015172792A (ja) * 2014-03-11 2015-10-01 株式会社リコー 翻訳システム、情報処理装置、情報処理方法およびプログラム
WO2016129515A1 (ja) * 2015-02-11 2016-08-18 藤田 一郎 外国語学習用プログラム及び方法
JP2017084184A (ja) * 2015-10-29 2017-05-18 コニカミノルタ株式会社 情報付加文書生成装置、プログラム
US10417312B2 (en) 2015-10-29 2019-09-17 Konica Minolta, Inc. Information added document preparation device, non-transitory computer-readable recording medium and information added document preparation method for selecting a format for adding information to a document to satisfy a layout condition
JP2017094535A (ja) * 2015-11-19 2017-06-01 コニカミノルタ株式会社 画像形成装置

Also Published As

Publication number Publication date
CN101600032A (zh) 2009-12-09
EP2148280A1 (en) 2010-01-27
CN101600032B (zh) 2012-10-31
US20090296124A1 (en) 2009-12-03
US8290312B2 (en) 2012-10-16

Similar Documents

Publication Publication Date Title
JP2009294788A (ja) 情報処理装置、情報処理方法、制御プログラム及び記録媒体
US8508795B2 (en) Information processing apparatus, information processing method, and computer program product for inserting information into in image data
KR102613255B1 (ko) 화상 처리 방법 및 화상 처리 시스템
JP2011100356A (ja) 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
US8923618B2 (en) Information output device and information output method
US11216695B2 (en) Image processing system and image processing method
US9614984B2 (en) Electronic document generation system and recording medium
JP2006259917A (ja) 文書処理装置、文書処理プログラム、及び文書処理方法
US20070226748A1 (en) Information processing device
JP6205973B2 (ja) 変更履歴出力装置、プログラム
JP2006270589A (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP2009223363A (ja) 文書処理装置および文書処理プログラム
JP2008040928A (ja) 印刷文書加工装置
JP2010130500A (ja) 画像読取装置、画像読取方法および画像読取プログラム
JP2008065594A (ja) 文書変換装置及びコンピュータのプログラム
JP4998176B2 (ja) 翻訳装置及びプログラム
JP2006264062A (ja) バリアブル印刷装置およびバリアブル印刷システム
US9256814B2 (en) Image processing apparatus, image processing method and computer-readable storage device
JP2010220046A (ja) 文書管理装置、文書管理システム、印刷制御方法、印刷制御プログラム、及びそのプログラムを記録した記録媒体
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
JP2007194713A (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
JP2022169232A (ja) 画像処理装置
JP2012186765A (ja) 画像処理装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム
JP2010165217A (ja) 文書情報処理装置、文書情報処理方法、制御プログラム及び記録媒体
JP2019055572A (ja) 画像形成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110119

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130611