JP6379813B2 - 情報処理システム、方法、情報処理装置およびプログラム - Google Patents

情報処理システム、方法、情報処理装置およびプログラム Download PDF

Info

Publication number
JP6379813B2
JP6379813B2 JP2014155475A JP2014155475A JP6379813B2 JP 6379813 B2 JP6379813 B2 JP 6379813B2 JP 2014155475 A JP2014155475 A JP 2014155475A JP 2014155475 A JP2014155475 A JP 2014155475A JP 6379813 B2 JP6379813 B2 JP 6379813B2
Authority
JP
Japan
Prior art keywords
character
characters
unit
extracted
print data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014155475A
Other languages
English (en)
Other versions
JP2015062112A (ja
Inventor
将幸 佐伯
将幸 佐伯
輝壮 高橋
輝壮 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2014155475A priority Critical patent/JP6379813B2/ja
Priority to US14/464,031 priority patent/US9471856B2/en
Publication of JP2015062112A publication Critical patent/JP2015062112A/ja
Application granted granted Critical
Publication of JP6379813B2 publication Critical patent/JP6379813B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/02Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
    • G06K15/18Conditioning data for presenting it to the physical printing elements
    • G06K15/1848Generation of the printable image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/02Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
    • G06K15/18Conditioning data for presenting it to the physical printing elements
    • G06K15/1801Input data handling means
    • G06K15/1822Analysing the received data before processing

Description

本発明は、印刷データの出力制御技術に関し、より詳細には、印刷データから特定の情報を検出して印刷データを処理する情報処理システム、方法、情報処理装置およびプログラムに関する。
従来、企業や行政庁、教育機関、病院等では、複数の印刷装置をネットワークに接続した情報処理システムが導入されている。このような情報処理システムでは、ユーザは、複数の印刷装置の中から印刷処理を実行する印刷装置を指定して印刷を行う。
このような情報処理システムにおいて、印刷データから特定の情報を抽出し、抽出した情報に応じて印刷データの出力条件を決定する技術が提案されている。例えば、特許文献1が開示する情報処理システムは、EMF(Enhanced MetaFile)形式等の印刷データから文字列を抽出し、特定のキーワードに合致する文字列を検出し、当該文字列に応じた出力条件を決定し、当該出力条件に応じた処理、例えば、地紋印刷や文字の置換等を行う。
しかしながら、図8に示すように、EMF形式の印刷データに含まれる文字は、印刷データを生成したアプリケーションが当該文字を描画した順序で記述されるため、実際に用紙に印刷される印刷データの表示イメージの文字の並び順と、印刷データに記述された文字の並び順とが異なる場合がある。このため、特許文献1が開示する情報処理システムでは、文字の並び順が表示イメージと異なる印刷データ、すなわち、文字の並び順が未整列の印刷データからキーワードに合致する文字列を抽出するため、キーワードの検出精度が低いという問題があった。
本発明は、上述した従来技術の問題点に鑑みてなされたものであり、文字列の検出精度を向上させることができる情報処理システム、方法、情報処理装置およびプログラムを提供することを目的とする。
本発明の情報処理システムは、印刷データを処理する情報処理システムであって、前記印刷データから印刷対象の文字および当該文字の座標情報を抽出する抽出手段と、前記抽出手段により抽出された文字群が横書きか縦書きかを判定する第1判定手段と、前記抽出手段が抽出した前記文字群を、前記第1判定手段の判定結果に応じて、当該文字群の座標情報を用いて並び替える整列処理手段と、前記判定結果に応じて、前記文字群を、当該文字群の座標情報を用いて行単位または列単位に振り分ける振分手段と、前記整列処理手段が並び替え、前記振分手段が振り分けた前記文字群について、前記判定結果が横書きを示す場合、前記文字群を行毎に結合し、前記判定結果が縦書きを示す場合、前記文字群を列毎に結合する結合手段とを含むことを特徴とする
本発明は、上述した手段を採用することにより、検索対象の文字群を、表示イメージと同じ並び順で整列させることができるため、文字列の検出精度を向上させることができる。
図1は、本発明の情報処理システムの一実施の形態を示す図である。 図2は、本発明のプリンタサーバのハードウェア構成図の一実施の形態を示す図である。 図3は、本発明の第1の実施の形態のプリンタサーバの機能構成を示すブロック図である。 図4は、本発明の第1の実施の形態のキーワード検出部の機能構成を示す図である。 図5は、本発明の第1の実施の形態のキーワード検出部が実行する処理を示すフローチャートである。 図6は、キーワード検出部が実行する処理を示す概念図である。 図7は、キーワード検出部が実行する検索対象情報の振り分け処理の一実施の形態を示す図である。 図8は、印刷データの表示イメージおよびEMF形式の印刷データを示す図である。 図9は、複数の行単位の文字列を結合した場合の例を示す図である。 図10は、本発明の第2の実施の形態のキーワード検出部の機能構成を示す図である。 図11は、本発明の第2の実施の形態のキーワード検出部が実行する処理を示すフローチャートである。 図12は、本発明の第3の実施の形態のキーワード検出部の機能構成を示す図である。 図13は、本発明の第3の実施の形態のキーワード検出部が実行する処理を示すフローチャートである。
以下、本発明について実施の形態をもって説明するが、本発明は、後述する実施の形態に限定されるものではない。
(第1の実施の形態)
図1は、本発明の情報処理システムの一実施の形態を示す図である。情報処理システム100は、ネットワーク130を介して接続されたクライアントPC112a,112b,112cと、プリンタサーバ110と、印刷装置120a,120b,120cとを含んで構成される。
クライアントPC112a,112b,112cは、プリンタサーバ110に対し、印刷要求と共に印刷データを送信し、印刷処理を実行させる情報処理装置である。クライアントPC112a,112b,112cは、文書やグラフ、図形等の生成、編集または表示が可能なアプリケーションを備えており、アプリケーションが生成したデータを、印刷データとしてプリンタサーバ110に送信する。
本実施の形態では、クライアントPC112a,112b,112cとして、デスクトップ型PCやノート型PC、タブレット型PC、スマートフォン等の種々の情報処理装置を採用することができる。また、アプリケーションとして、例えば、文書生成ソフトや表計算ソフト、描画ソフト、ドキュメントリーダ等の種々のアプリケーションソフトを採用することができる。
プリンタサーバ110は、クライアントPC112a,112b,112cの印刷要求に応じて、印刷を行う印刷装置を決定し、当該印刷装置に印刷データを送信して印刷物を出力させる情報処理装置である。
印刷装置120a,120b,120cは、プリンタサーバ110の指示により、印刷処理を実行して印刷物を出力する装置である。本実施の形態では、印刷装置120a,120b,120cとして、スキャナ装置を備えるMFP(Multiple Function Printer)やレーザプリンタ、インクジェットプリンタなどの様々な印刷装置を採用することができる。
ネットワーク130は、イーサネット(登録商標)、光ネットワーク、無線ネットワークを含んで構成できるネットワークである。また、ネットワーク130は、LANの他、VPN(Virtual Private Network)などによるセキュア環境下で構築されたインターネットなどの広域ネットワークを含んで構成してもよい。
クライアントPC112a,112b,112c、プリンタサーバ110および印刷装置120a,120b,120cは、ネットワーク130を介して、フレーム、TCP/IPプロトコルまたはRDP(Remote Desktop Protocol)に基づく通信によって相互通信を行うことができる。
図2は、本発明のプリンタサーバのハードウェア構成図の一実施の形態を示す図である。以下、図2を参照して、プリンタサーバ110のハードウェア構成について説明する。
プリンタサーバ110は、CPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、HDD(Hard Disc Drive)204と、ネットワークインタフェース(I/F)205と、外部装置I/F206とを含んで構成される。
CPU201は、プリンタサーバ110の動作を制御するプロセッサである。ROM202は、種々のデータが記憶される不揮発性の記憶装置である。RAM203は、プリンタサーバ110が実行する種々のプログラムの実行空間を提供する揮発性の記憶装置である。HDD204は、本発明のプログラムなどの種々のデータを持続的に保存可能な記憶装置である。
ネットワークI/F205は、ネットワーク130とプリンタサーバ110との間の通信を可能にする物理インタフェースである。外部装置I/F206は、USBメモリ等の可搬型の記憶装置などの外部装置をプリンタサーバ110に接続可能な物理インタフェースである。
プリンタサーバ110は、WINDOWS(登録商標)シリーズ、Mac(登録商標)OS(Operating System)、UNIX(登録商標)、LINUX(登録商標)などの種々のOSの管理下で、HDD204から本発明のプログラムを読み出し、RAM203に展開して実行することにより、後述する機能手段をプリンタサーバ110上に実現する。本発明のプログラムは、アセンブラ、C、C++、JAVA(登録商標)、JAVA SCRIPT(登録商標)、PERL、RUBY、PYTHON、PHP、VISUAL BASIC(登録商標)、COBOL、PL/SQLなどの様々なプログラミング言語で記述することができる。
図3は、本発明の第1の実施の形態のプリンタサーバの機能構成を示すブロック図である。以下、図3を参照して、プリンタサーバ110の機能構成について説明する。
プリンタサーバ110は、仮想プリンタドライバ300と、中間データ記憶部301と、印刷制御部302と、キーワード検出部303とを含む。
仮想プリンタドライバ300は、クライアントPC112a,112b,112cが提供する印刷データからページイメージである中間データを作成する手段である。本実施の形態では、仮想プリンタドライバ300は、印刷データからEMF形式の画像データを作成し、印刷データに付加されているジョブ情報と共に、中間データ記憶部301に保存する。中間データ記憶部301に保存される画像データには、文字群および当該文字の座標情報が含まれている。
印刷制御部302は、印刷データの出力先である印刷装置を決定し、当該出力先に印刷データを送信する手段である。印刷制御部302は、中間データ記憶部301に保存されているジョブ情報を参照し、当該ジョブ情報に含まれる印刷要求元のユーザ名、クライアントPCの固有識別情報または印刷設定情報(例えば、白黒印刷、カラー印刷等)に関連付けられている出力先に印刷データを送信して印刷処理を実行させる。
また、印刷制御部302は、キーワード検出部303に対し、中間データ記憶部301に保存されている画像データに特定の文字列が含まれているか検索させる。印刷制御部302は、キーワード検出部303に対し、検出すべき文字列や検索領域等の検出条件を提供し、検索処理を実行させる。
キーワード検出部303は、印刷制御部302の指示により、中間データである画像データに特定の文字列が含まれているか検索し、その結果を印刷制御部302に通知する。図4は、本発明の第1の実施の形態のキーワード検出部303の機能構成を示す図である。キーワード検出部303は、抽出部400と、整列処理部401と、振分部402と、結合部403と、検索部404とを含む。
抽出部400は、中間データである画像データから印刷対象の文字群および当該文字の座標情報を抽出する手段である。抽出部400は、中間データ記憶部301から画像データを取得し、検出条件として指定された検索領域が示す領域内に存在する文字群を抽出し、当該文字の座標情報を抽出する。
整列処理部401は、画像データから抽出した文字群を並び替える手段である。整列処理部401は、抽出した文字群の座標情報である当該文字のX座標およびY座標を用いて文字群を並び替える。
振分部402は、画像データから抽出した文字群を行単位または列単位に振り分ける手段である。振分部402は、抽出した文字群のY座標を用いて、当該文字群を行単位に振り分ける。本実施の形態では、横書きの文字列を処理するため、抽出した文字群を行単位に振り分けるが、縦書きの文字列を処理する実施の形態では、振分部402は、抽出した文字群のX座標を用いて、抽出した文字群を列単位に振り分ける。
結合部403は、画像データから抽出した文字群を行毎または列毎に結合する手段である。本実施の形態では、結合部403は、振分部402によって行単位に振り分け、整列処理部401によってX座標を基準に並び替えられた文字群を行毎に結合する。他の実施の形態では、結合部403は、振分部402によって列単位に振り分け、整列処理部401によってY座標を基準に並び替えられた文字群を列毎に結合する。
検索部404は、画像データから抽出した文字群を検索する手段である。検索部404は、結合部403が結合した文字列を検索対象とし、検出条件として指定された検出すべき文字列を検索し、検索結果を印刷制御部302に通知する。
図4に示す実施の形態では、キーワード検出部303の各機能手段がプリンタサーバ110に実装されるが、他の実施の形態では、これらの機能手段を別々の情報処理装置に実装してもよい。
図5は、本発明の第1の実施の形態のプリンタサーバ110に実装されるキーワード検出部303が実行する処理を示すフローチャートである。以下、図5を参照し、キーワード検出処理について説明する。
図5に示す処理は、ステップS500から開始し、ステップS501では、抽出部400が、中間データ記憶部301から画像データを取得し、検出条件として指定された検索領域が示す領域内に存在する文字群および当該文字の座標情報を抽出する。ステップS502では、整列処理部401が、抽出した文字群の座標情報である当該文字のY座標を用いて、文字群を並び替える。ステップS503では、振分部402が、抽出した文字群のY座標を用いて、当該文字群を行単位に振り分ける。
ステップS504では、整列処理部401が、行単位に振り分けられた文字群を、文字群の座標情報である文字群のX座標を用いて並び替える。ステップS505では、結合部403が、ステップS504で並び替えた文字群を行毎に結合する。ステップS506では、検索部404が、ステップS505で結合した文字列を検索対象とし、検出条件として指定された検出すべき文字列を検索し、検索結果を印刷制御部302に通知し、ステップS507で処理が終了する。
図5に示す処理は、画像データに横書き文字列が記述されている場合に実行される処理である。画像データに縦書きの文字列が記述されている場合には、キーワード検出部303は、座標情報であるX座標を用いて文字群を並び替えて列単位に振り分け、さらにY座標を用いて文字群を並び替え、列単位で結合する。
図6は、キーワード検出部303が実行する処理を示す概念図である。以下、図6を参照して、キーワードの検索処理の前に実行する処理について説明する。
検索対象情報601は、キーワード検出部303が、中間データである画像データから抽出した文字および当該文字の座標情報である。検索対象情報601には、複数の文字(「か」、「き」、「く」、「け」、「こ」、「い」、「え」、「お」、「あ」および「う」)と、当該文字の座標情報とが含まれる。キーワード検出部303は、検索対象情報601に含まれる文字を、当該文字のY座標を基準にして並び替える。図6に示す実施の形態では、Y座標の値が昇順となるように文字を並び替える。
次に、キーワード検出部303は、Y座標を基準にして並び替えた検索対象情報602に含まれる文字および座標情報を行単位に振り分ける。図6に示す実施の形態では、キーワード検出部303は、Y座標の値が同じ文字は同一の行に属すると判断する。すなわち、キーワード検出部303は、Y座標の値が「1」である文字(「い」、「え」、「お」、「あ」および「う」)が行1に属すると判断し、Y座標の値が「2」である文字(「か」、「き」、「く」、「け」および「こ」)が行2に属すると判断する。
次いで、キーワード検出部303は、行単位に振り分けた検索対象情報603に含まれる文字を、当該文字のX座標を基準にして並び替える。図6に示す実施の形態では、X座標の値が昇順となるように文字を並び替える。
そして、キーワード検出部303は、X座標を基準にして並び替えた検索対象情報604に含まれる文字を行毎に結合して検索対象情報605を生成し、検索対象情報605を検索対象としてキーワード検出処理を実行する。図6に示す実施の形態では、キーワード検出部303は、行1の文字列「あいうえお」、行2の文字列「かきくけこ」を検索対象の文字列として検索する。これにより、表示イメージ600と同じ並び順の文字列を検索対象とすることができ、キーワードの検出精度を向上させることができる。
図7は、キーワード検出部303が実行する検索対象情報の振り分け処理の一実施の形態を示す図である。以下、図7を参照して、検索対象情報の振り分け処理の一実施の形態について説明する。
表示イメージ700は、印刷データを実際に印刷したときに出力されるイメージである。表示イメージ700には、太字の文字「氏名」と、標準の文字「:山田太郎」とが同一の行に表示されており、これらの文字列はフォントサイズが異なる。検索対象情報701は、Y座標を基準にして並び替えた検索対象情報である。検索対象情報701では、太字の文字「名」および「氏」のY座標の値が「1」であり、「:」、「山」、「田」、「太」および「郎」のY座標の値が「2」である。図7に示す実施の形態では、文字列「氏名」および文字列「:山田太郎」は、文字の太さと大きさが異なるため、これらの文字列のY座標の値が異なる。
キーワード検出部303は、検索対象情報701に含まれる文字および座標情報を行単位に振り分ける。このとき、Y座標の値が同一の文字のみを同一の行に属すると判断すると、検索対象情報705,706,707に示すように、文字列「氏名」および文字列「:山田太郎」が別の行に属すると判断され、文字群を正しく振り分けることができない。このため、本実施の形態では、キーワード検出部303は、各文字のY座標の値を参照し、Y座標の値の差分が所定値以下であるときには、当該文字が同一の行に属すると判断する。
具体的には、図7に示す実施の形態では、文字「名」および「氏」のY座標の値「1」と、「:」、「山」、「田」、「太」および「郎」のY座標の値が「2」との差分が「1」であり、所定値(例えば、「10」)以下であるため、キーワード検出部303は、これらの文字が同一の行に属すると判断する。所定値は、同一の行に属する文字のY座標の差異が採り得る任意の値とすることが好適である。
このように、本実施の形態では、文字を行単位に振り分ける場合に、Y座標の値が同一の文字のみを同一の行に属すると判断せず、Y座標の値が近似する文字を同一の行に属すると判断するため、同一の行に属する文字の大きさや太さが異なる場合でも、表示イメージ700と合致するように、文字群を正しく振り分けることができる。
なお、結合部403によって結合された行毎(または列毎)の文字列は、図6の検索対象情報605に示すように、行毎(または列毎)の複数の文字列として示すことに限定されるものではない。例えば、図9に示す検索対象情報605aのように、行毎(または列毎)の複数の文字列を結合した1行(または1列)の文字列として扱うものとしてもよい。これによって、キーワードの検出を容易にすることができる。また、結合部403は、すべての複数の文字列を結合する必要はなく、少なくとも一部の文字列を結合するものとしてもよい。
(第2の実施の形態)
本実施の形態に係る情報処理システムについて、第1の実施の形態に係る情報処理システムと相違する点を中心に説明する。本実施の形態の情報処理システムは、図1に示す情報処理システム100と同様の構成を有する。また、本実施の形態のプリンタサーバ110は、図2に示すプリンタサーバ110と同様のハードウェア構成を有する。また、本実施の形態のプリンタサーバ110は、図3に示すプリンタサーバ110と同様の機能構成を有するが、キーワード検出部303の代わりに、後述する図10に示すキーワード検出部303aを備えている。本実施の形態では、画像データから抽出した文字群が横書きまたは縦書きのいずれかを判定して文字群を並べ替える動作について説明する。
図10は、本発明の第2の実施の形態のキーワード検出部の機能構成を示す図である。図10を参照して、本実施の形態のキーワード検出部303aの機能構成について説明する。
図10に示すように、本実施の形態のキーワード検出部303aは、抽出部400と、整列処理部401と、振分部402と、結合部403と、検索部404と、第1判定部405とを含む。本実施の形態の抽出部400、整列処理部401、結合部403および検索部404の動作は、それぞれ第1の実施の形態の抽出部400、整列処理部401、結合部403および検索部404の動作と同様である。
振分部402は、画像データから抽出した文字群を行単位または列単位に振り分ける手段である。振分部402は、抽出した文字群のY座標またはX座標を用いて、それぞれ当該文字群を行単位または列単位に振り分ける。
第1判定部405は、抽出部400によって画像データから抽出された印刷対象の文字群が横書きであるか、または縦書きであるかを判定する手段である。
なお、図10に示すように、キーワード検出部303aの各機能手段がプリンタサーバ110に実装されるが、これらの機能手段は別々の情報処理装置に実装されてもよい。
図11は、本発明の第2の実施の形態のキーワード検出部が実行する処理を示すフローチャートである。以下、図11を参照し、キーワード検出処理について説明する。
図11に示す処理は、ステップS600から開始し、ステップS601では、抽出部400が、中間データ記憶部301から画像データを取得し、検出条件として指定された検索領域が示す領域内に存在する文字群および当該文字の座標情報を抽出する。ステップS602では、第1判定部405が、抽出部400によって抽出された文字群が横書きであるか、または縦書きであるかを判定する。抽出部400によって抽出された文字群が横書きである場合(ステップS602:横書き)、ステップS603へ移行する。一方、抽出部400によって抽出された文字群が縦書きである場合(ステップS602:縦書き)、ステップS607へ移行する。
ステップS603では、整列処理部401が、抽出した文字群の座標情報である当該文字のY座標を用いて、文字群を並び替える。ステップS604では、振分部402が、抽出した文字群のY座標を用いて、当該文字群を行単位に振り分ける。
ステップS605では、整列処理部401が、行単位に振り分けられた文字群を、文字群の座標情報である文字群のX座標を用いて並び替える。ステップS606では、結合部403が、ステップS605で並び替えた文字群を行毎に結合する。
ステップS607では、整列処理部401が、抽出した文字群の座標情報である当該文字のX座標を用いて、文字群を並び替える。ステップS608では、振分部402が、抽出した文字群のX座標を用いて、当該文字群を列単位に振り分ける。
ステップS609では、整列処理部401が、列単位に振り分けられた文字群を、文字群の座標情報である文字群のY座標を用いて並び替える。ステップS610では、結合部403が、ステップS609で並び替えた文字群を列毎に結合する。
ステップS611では、検索部404が、ステップS606またはステップS610で結合した文字列を検索対象とし、検出条件として指定された検出すべき文字列を検索し、検索結果を印刷制御部302に通知し、ステップS612で処理が終了する。
以上のように、本実施の形態では、第1判定部405が、抽出部400によって画像データから抽出された印刷対象の文字群が横書きであるか、または縦書きであるかを判定し、その判定結果に応じて、文字群を並び替えて、行単位または列単位に振分け、さらにX座標またはY座標を用いて文字群を並び替え、行単位または列単位で結合するものとしている。これによって、画像データに横書き文字列が記述されていようと、縦書き文字列が記述されていようと、いずれかを判定して、表示イメージと同じ並び順で文字列を検索対象とすることができ、キーワードの検出精度をさらに向上させることができる。
(第3の実施の形態)
本実施の形態に係る情報処理システムについて、第1の実施の形態に係る情報処理システムと相違する点を中心に説明する。本実施の形態の情報処理システムは、図1に示す情報処理システム100と同様の構成を有する。また、本実施の形態のプリンタサーバ110は、図2に示すプリンタサーバ110と同様のハードウェア構成を有する。また、本実施の形態のプリンタサーバ110は、図3に示すプリンタサーバ110と同様の機能構成を有するが、キーワード検出部303の代わりに、後述する図12に示すキーワード検出部303bを備えている。本実施の形態では、画像データから抽出され、並べ替えられ、そして振り分けられた文字群のうち、検索領域に存在する領域の文字群のみを結合させる動作について説明する。
図12は、本発明の第3の実施の形態のキーワード検出部の機能構成を示す図である。図12を参照して、本実施の形態のキーワード検出部303bの機能構成について説明する。
図12に示すように、本実施の形態のキーワード検出部303bは、抽出部400と、整列処理部401と、振分部402と、結合部403と、検索部404と、第2判定部406とを含む。本実施の形態の整列処理部401、振分部402、および検索部404の動作は、それぞれ第1の実施の形態の整列処理部401、振分部402、および検索部404の動作と同様である。
抽出部400は、中間データ記憶部301から中間データである画像データを取得し、画像データから印刷対象の文字群および当該文字の座標情報を抽出する手段である。
第2判定部406は、整列処理部401により並び替えられ、振分部402により振り分けられた文字群が、検索条件として指定された検索領域が示す領域内に存在するか否かを判定する手段である。
結合部403は、画像データから抽出した文字群のうち、第2判定部406によって検索領域が示す領域内に存在すると判定された文字群を、行毎または列毎に結合する手段である。例えば、結合部403は、振分部402によって行単位に振り分け、整列処理部401によってX座標を基準に並び替えられた文字群のうち、検索領域が示す領域内に存在する文字群について行毎に結合する。
なお、図12に示すように、キーワード検出部303bの各機能手段がプリンタサーバ110に実装されるが、これらの機能手段は別々の情報処理装置に実装されてもよい。
図13は、本発明の第3の実施の形態のキーワード検出部が実行する処理を示すフローチャートである。以下、図13を参照し、キーワード検索処理について説明する。
図13に示す処理は、ステップS700から開始し、ステップS701では、抽出部400が、中間データ記憶部301から画像データを取得し、画像データから印刷対象の文字群および当該文字の座標情報を抽出する。ステップS702では、整列処理部401が、抽出した文字群の座標情報である当該文字のY座標を用いて、文字群を並び替える。ステップS703では、振分部402が、抽出した文字群のY座標を用いて、当該文字群を行単位に振り分ける。
ステップS704では、整列処理部401が、行単位に振り分けられた文字群を、文字群の座標情報である文字群のX座標を用いて並び替える。ステップS705では、第2判定部406が、ステップS704で並び替えられた文字群が、検索条件として指定された検索領域が示す領域内に存在するか否かを判定する。ステップS706では、結合部403が、ステップS705で検索領域が示す領域内に存在すると判定した文字群を行毎に結合する。ステップS707では、検索部404が、ステップS706で結合した文字列を検索対象とし、検出条件として指定された検出すべき文字列を検索し、検索結果を印刷制御部302に通知し、ステップS708で処理が終了する。
図13に示す処理は、画像データに横書き文字列が記述されている場合に実行される処理である。画像データに縦書きの文字列が記述されている場合には、キーワード検出部303は、座標情報であるX座標を用いて文字群を並び替えて列単位に振り分け、さらにY座標を用いて文字群を並び替え、列単位で結合する。
以上のように、本実施の形態では、第2判定部406が、整列処理部401により並び替えられ、振分部402により振り分けられた文字群が、検索条件として指定された検索領域が示す領域内に存在するか否かを判定し、結合部403が、検索領域が示す領域内に存在すると判定された文字群を結合するものとしている。これによって、画像データに記述されたすべての文字列について、すべてを行単位または列単位で結合することなく、指定された検索領域内に存在する文字群のみを結合させ、キーワードの検索対象とするので、キーワードの検出効率を向上させることができる。
なお、上述の各実施の形態における抽出部400、整列処理部401、振分部402、結合部403、検索部404、第1判定部405、および第2判定部406の一部または全部は、ソフトウェアであるプログラムではなく、ハードウェア回路によって実現されるものとしてもよい。
また、上述の各実施の形態における抽出部400、整列処理部401、振分部402、結合部403、検索部404、第1判定部405、および第2判定部406の少なくともいずれかがプログラムの実行によって実現される場合、そのプログラムは、ROM202等に予め組み込まれて提供される。各実施の形態のプリンタサーバ110で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、各実施の形態のプリンタサーバ110で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、各実施の形態のプリンタサーバ110で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。各実施の形態のプリンタサーバ110で実行されるプログラムは、上述した抽出部400、整列処理部401、振分部402、結合部403、検索部404、第1判定部405、および第2判定部406の少なくともいずれかを含むモジュール構成となっており、実際のハードウェアとしてはCPU201が上述のROM202またはHDD204等からプログラムを読み出して実行することにより、上述の各機能部が主記憶装置上にロードされて生成されるようになっている。
これまで上述の各実施の形態につき説明してきたが、本発明は、上述した実施の形態に限定されるものではなく、上述した実施の形態の構成要素を変更、組み合わせ若しくは削除し、または上述した実施の形態の構成要素に他の構成要素を追加するなど、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用効果を奏する限り、本発明の範囲に含まれるものである。
100…情報処理システム、110…プリンタサーバ、112a,112b,112c…クライアントPC、120a,120b,120c…印刷装置、130…ネットワーク
特開2011−002881号公報

Claims (12)

  1. 印刷データを処理する情報処理システムであって、
    前記印刷データから印刷対象の文字および当該文字の座標情報を抽出する抽出手段と、
    前記抽出手段により抽出された文字群が横書きか縦書きかを判定する第1判定手段と、
    前記抽出手段が抽出した前記文字を、前記第1判定手段の判定結果に応じて、当該文字の座標情報を用いて並び替える整列処理手段と、
    前記判定結果に応じて、前記文字を、当該文字の座標情報を用いて行単位または列単位に振り分ける振分手段と、
    前記整列処理手段が並び替え、前記振分手段が振り分けた前記文字群について、前記判定結果が横書きを示す場合、前記文字群を行毎に結合し、前記判定結果が縦書きを示す場合、前記文字群を列毎に結合する結合手段と
    を含む、情報処理システム。
  2. 印刷データを処理する情報処理システムであって、
    前記印刷データから印刷対象の文字および当該文字の座標情報を抽出する抽出手段と、
    前記抽出手段が抽出した文字を、当該文字の座標情報を用いて並び替える整列処理手段と、
    前記抽出手段が抽出した文字を、当該文字の座標情報を用いて行単位または列単位に振り分ける振分手段と、
    前記整列処理手段が並び替え、前記振分手段が振り分けた文字が、前記印刷データにおいて、指定された検索領域内にあるか否かを判定する第2判定手段と、
    前記整列処理手段が並び替え、前記振分手段が振り分けた文字のうち、前記第2判定手段により前記検索領域内にあると判定された文字を結合する結合手段と
    を含む、情報処理システム。
  3. 前記振分手段は、前記抽出した文字の座標情報が示すX座標またはY座標が同一または近似する文字を同一の行または同一の列に属すると判断する、請求項1または2に記載の情報処理システム。
  4. 前記整列処理手段は、前記印刷データの表示イメージの文字の並び順と同じ並び順となるよう、前記抽出した文字を並び替える、請求項1〜3のいずれか1項に記載の情報処理システム。
  5. 前記結合手段は、行毎または列毎の複数の文字列のうち、少なくとも一部を1行または1列の文字列に結合する、請求項1〜のいずれか1項に記載の情報処理システム。
  6. 前記情報処理システムは、
    前記結合手段が結合した文字列を検索対象として検索する検索手段をさらに備える、請求項1〜のいずれか1項に記載の情報処理システム。
  7. 印刷データを処理する情報処理システムが実行する方法であって、前記方法は、前記情報処理システムが、
    前記印刷データから印刷対象の文字および当該文字の座標情報を抽出するステップと、
    前記抽出するステップが抽出した文字を、当該文字の座標情報を用いて並び替えるステップと、
    前記抽出するステップが抽出した文字を、当該文字の座標情報を用いて行単位または列単位に振り分けるステップと、
    前記並び替えるステップが並び替え、前記振り分けるステップが振り分けた文字が、前記印刷データにおいて、指定された検索領域内にあるか否かを判定するステップと、
    前記並び替えるステップが並び替え、前記振り分けるステップが振り分けた文字のうち、前記判定するステップが前記検索領域内にあると判定した文字を結合するステップと
    を含む、方法。
  8. 前記振り分けるステップは、前記抽出した文字の座標情報が示すX座標またはY座標が同一または近似する文字を同一の行または同一の列に属すると判断するステップを含む、請求項に記載の方法。
  9. 前記並び替えるステップは、前記印刷データの表示イメージの文字の並び順と同じ並び順となるよう、前記抽出した文字を並び替える、請求項またはに記載の方法。
  10. 前記方法は、前記情報処理システムが、
    前記結合するステップで結合した文字列を検索対象として検索するステップをさらに含む、請求項のいずれか1項に記載の方法。
  11. 印刷データを処理する情報処理装置であって、
    前記印刷データから印刷対象の文字および当該文字の座標情報を抽出する抽出手段と、
    前記抽出手段が抽出した文字を、当該文字の座標情報を用いて並び替える整列処理手段と、
    前記抽出手段が抽出した文字を、当該文字の座標情報を用いて行単位または列単位に振り分ける振分手段と、
    前記整列処理手段が並び替え、前記振分手段が振り分けた文字が、前記印刷データにおいて、指定された検索領域内にあるか否かを判定する第2判定手段と、
    前記整列処理手段が並び替え、前記振分手段が振り分けた文字のうち、前記第2判定手段により前記検索領域内にあると判定された文字を結合する結合手段と
    を含む、情報処理装置。
  12. コンピュータを、
    印刷データから印刷対象の文字および当該文字の座標情報を抽出する抽出手段と、
    前記抽出手段が抽出した文字を、当該文字の座標情報を用いて並び替える整列処理手段と、
    前記抽出手段が抽出した文字を、当該文字の座標情報を用いて行単位または列単位に振り分ける振分手段と、
    前記整列処理手段が並び替え、前記振分手段が振り分けた文字が、前記印刷データにおいて、指定された検索領域内にあるか否かを判定する第2判定手段と、
    前記整列処理手段が並び替え、前記振分手段が振り分けた文字のうち、前記第2判定手段により前記検索領域内にあると判定された文字を結合する結合手段と、
    して機能させるためのプログラム。
JP2014155475A 2013-08-23 2014-07-30 情報処理システム、方法、情報処理装置およびプログラム Expired - Fee Related JP6379813B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014155475A JP6379813B2 (ja) 2013-08-23 2014-07-30 情報処理システム、方法、情報処理装置およびプログラム
US14/464,031 US9471856B2 (en) 2013-08-23 2014-08-20 Method and apparatus for processing information, and computer-readable storage medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013173199 2013-08-23
JP2013173199 2013-08-23
JP2014155475A JP6379813B2 (ja) 2013-08-23 2014-07-30 情報処理システム、方法、情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2015062112A JP2015062112A (ja) 2015-04-02
JP6379813B2 true JP6379813B2 (ja) 2018-08-29

Family

ID=52480106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014155475A Expired - Fee Related JP6379813B2 (ja) 2013-08-23 2014-07-30 情報処理システム、方法、情報処理装置およびプログラム

Country Status (2)

Country Link
US (1) US9471856B2 (ja)
JP (1) JP6379813B2 (ja)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009196A (en) * 1995-11-28 1999-12-28 Xerox Corporation Method for classifying non-running text in an image
US6952803B1 (en) * 1998-12-29 2005-10-04 Xerox Corporation Method and system for transcribing and editing using a structured freeform editor
JP2001022747A (ja) * 1999-07-07 2001-01-26 Just Syst Corp 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4743686B2 (ja) * 2005-01-19 2011-08-10 京セラ株式会社 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム
JP2008153764A (ja) * 2006-12-14 2008-07-03 Canon Inc 画像処理システム
JP2008311828A (ja) * 2007-06-13 2008-12-25 Ricoh Co Ltd 画像処理装置、画像処理方法、そのプログラムおよび記録媒体
JP2010128574A (ja) * 2008-11-25 2010-06-10 Fuji Xerox Co Ltd 画像形成装置、分割された文字列の検出プログラム及び文字列の結合プログラム
JP5338505B2 (ja) 2009-06-16 2013-11-13 株式会社リコー 情報処理装置、プログラムおよび記録媒体
JP5458747B2 (ja) 2009-08-28 2014-04-02 株式会社リコー 情報処理装置及びプログラム
JP5531791B2 (ja) 2009-09-08 2014-06-25 株式会社リコー 印刷システム、印刷制御装置および印刷制御方法
JP5249387B2 (ja) * 2010-07-06 2013-07-31 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5870527B2 (ja) 2011-07-26 2016-03-01 株式会社リコー 出力振り分けシステム、出力振り分け装置、出力先情報提供装置および記録媒体
JP6205878B2 (ja) 2012-07-25 2017-10-04 株式会社リコー データ処理装置、システムおよびプログラム

Also Published As

Publication number Publication date
US9471856B2 (en) 2016-10-18
JP2015062112A (ja) 2015-04-02
US20150055156A1 (en) 2015-02-26

Similar Documents

Publication Publication Date Title
JP6040701B2 (ja) 印刷システム、印刷方法及びプログラム
US9250846B2 (en) Print service providing apparatus that supplies conversion data and printing system including the same
JP2010066987A (ja) データ処理装置、ジョブ検査方法、及びコンピュータプログラム
US11715068B2 (en) Data processing apparatus, data processing system, data processing method, and non-transitory computer readable medium
US20120069395A1 (en) Image forming apparatus and job log management method
TWI467469B (zh) 使用虛擬印表機及安全特色服務而內建光學安全特色的方法
US9998616B2 (en) Image forming apparatus, non-transitory computer readable recording medium, and information processing system
US9886227B2 (en) Computer, print control method, and networked system
US11416445B2 (en) Method and system for using dynamic content types
CN107066217B (zh) 图像形成设备和图像形成设备的控制方法
JP6379813B2 (ja) 情報処理システム、方法、情報処理装置およびプログラム
US10133521B2 (en) Server device, recording medium, and information processing system
JP2004265049A (ja) データ処理システム、データ処理装置、データ処理方法及びプログラム
JP6668769B2 (ja) 情報処理装置、情報処理プログラム、画像形成システム、画像形成システムの制御方法
JP5910193B2 (ja) 印刷システム、情報処理装置および方法
JP2015064652A (ja) 管理システム、画像形成装置及び端末装置
JP2021012324A (ja) 画像処理装置、システム、サーバー、制御方法及びプログラム
JP6256138B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP5785989B2 (ja) 画像形成システム、画像形成装置、および表示装置
JP4350343B2 (ja) 印刷制御装置、印刷制御方法、プログラム及び記憶媒体
JP2010220046A (ja) 文書管理装置、文書管理システム、印刷制御方法、印刷制御プログラム、及びそのプログラムを記録した記録媒体
JP6366366B2 (ja) 画像形成装置、その制御方法およびコンピュータプログラム
JP7047509B2 (ja) 情報処理システム、電子帳票仕分け方法及びプログラム
JP6888350B2 (ja) 画像形成装置、画像形成方法、情報処理システム、及びプログラム
JP2008269155A (ja) テンプレート表示システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180716

R151 Written notification of patent or utility model registration

Ref document number: 6379813

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees