JP2018036794A - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP2018036794A
JP2018036794A JP2016168417A JP2016168417A JP2018036794A JP 2018036794 A JP2018036794 A JP 2018036794A JP 2016168417 A JP2016168417 A JP 2016168417A JP 2016168417 A JP2016168417 A JP 2016168417A JP 2018036794 A JP2018036794 A JP 2018036794A
Authority
JP
Japan
Prior art keywords
character
handwritten
area
attribute
structured data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016168417A
Other languages
English (en)
Other versions
JP6780380B2 (ja
Inventor
純 黒木
Jun Kuroki
純 黒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2016168417A priority Critical patent/JP6780380B2/ja
Publication of JP2018036794A publication Critical patent/JP2018036794A/ja
Application granted granted Critical
Publication of JP6780380B2 publication Critical patent/JP6780380B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】紙文書に追記した情報が紙文書から生成した電子画像において容易に視認できる。【解決手段】入力されたイメージデータを文字、図形、写真等の領域判別を行い、判別結果に従ってベクタライズし構造化データに変換する処理において、領域判別処理で文字領域と判断された領域をさらに解析し、文字領域の文字列が印字文字か手書き文字かを判別する。印字文字の場合には、変換先の構造化データの本体属性に変換し、手書き文字の場合には、変換先の構造化データの補足属性に変換する。本体属性に対応する本体領域の手書き文字列が存在した部分は、補足属性に変換した手書き文字列との関連性を示す情報に置き換えて構造化データを作成する。【選択図】図3

Description

本発明は、画像処理装置及びプログラムに関し、手書きで加筆された紙文書を読み取って得られる画像データを構造化データに変換する技術に係る。
従来、ワードプロセッサやプレゼンテーション資料作成ソフトウェアで作成され印刷された紙文書に、鉛筆やボールペン等で手書きメモを書き込む場合がある。手書き文字が追加された紙文書をスキャナ等で画像化し、文字認識処理を実施し、Microsoft Office(登録商標)のアプリケーションファイル(例えばPowerPoint(登録商標)ファイル)のような構造化データに変換した場合、元から紙文書に印字された文字なのか、手書きで追加した文字なのか判別がつかない。そのため、構造化データからだけではどのような文字(情報)を追記したか分からなくなっていた。
また、手書き情報を含まない形で文書を共有したい場合に、手書き文字を消しゴムで消したり修正液で消したりする手間が発生していた。
例えば特許文献1には、元文書に対して加筆されたと判断された部分を加筆の特徴に応じて電子文書のレイヤーに配置し、統合された電子文書に変換する技術が開示されている。
特開2012−48637号公報
しかしながら、特許文献1に記載の技術は、電子文書がレイヤー構造であることを閲覧者が認識する必要がある。また、統合された電子文書の表示もしくはレイヤーごとの表示から、どの部分が加筆されたかを閲覧者が判断することが難しい。
本発明は、上記の状況から、紙文書に追記した情報が紙文書から生成した電子画像において容易に視認できることを目的とする。
本発明の一態様の画像処理装置は、手書きで加筆された紙文書を読み取って得られた画像データを解析し、画像データに含まれる文字と文字以外の領域を判別する領域判別部と、該領域判別部により判別された文字領域を解析し、文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する文字種別判別部と、印字文字及び手書き文字を文字コード化する文字コード化処理部と、領域判別部により判別された文字以外の領域、及び、文字コード化した印字文字を含む文字領域を構造化データの本体属性に変換する構造化データ変換部と、文字コード化された手書き文字を構造化データの補足属性に変換する補足属性変換部と、文字種別判別部により判定された手書き文字が存在した本体属性に対応する本体領域の手書き文字部を、手書き文字が存在したことを表す情報に置き換える手書き文字置換部と、を備える。
本発明の少なくとも一態様によれば、紙文書に追記した情報が紙文書から生成した電子画像において容易に視認することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本発明の第1の実施形態に係る画像処理装置を含むシステムの全体構成を示す概略図である。 本発明の第1の実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。 本発明の第1の実施形態に係る画像処理装置の機能構成を示すブロック図である。 本発明の第1の実施形態に係る画像処理装置の動作を示すフローチャートである。 手書き文字を含む入力画像の例を示す図である。 本発明の第1の実施形態に係る、入力画像に対し領域判別処理を実施した結果を示す図である。 本発明の第1の実施形態に係る文字種判別処理を示すフローチャートである。 本発明の第1の実施形態に係る文字種別判別処理を実施した結果を示す図である。 本発明の第1の実施形態に係る、PowerPointファイルアプリケーションによるアプリケーション画面の表示例である。 ノート属性を含む一般的なPowerPointファイルのファイルフォーマットの構造例を示す図である。 本発明の第1の実施形態の第1例に係る、手書き文字をPowerPointファイルのノート領域に配置したアプリケーション画面の表示例を示す図である。 本発明の第1の実施形態の第2例に係る、手書き文字をPowerPointファイルのノート領域に配置したアプリケーション画面の表示例を示す図である。 本発明の第2の実施形態の第1例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す図である。 コメント属性を含む一般的なPowerPointファイルのファイルフォーマットの構造例を示す図である。 本発明の第2の実施形態の第2例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す図である。 本発明の第2の実施形態の第3例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す図である。 本発明の第2の実施形態の第4例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す図である。 本発明の第2の実施形態の第5例に係る、PowerPointファイルのコメント領域に表示された手書き文字情報の内容を削除したアプリケーション画面の表示例を示す図である。 本発明の第3の実施形態に係る、手書き文字をPDFファイルの注釈領域に配置したアプリケーション画面の表示例を示す図である。 本発明の第4の実施形態に係る画像処理装置の機能構成を示すブロック図である。
以下、本発明を実施するための形態の例について、添付図面を参照しながら説明する。説明は下記の順序で行う。なお、各図において実質的に同一の機能又は構成を有する構成要素については、同一の符号を付して重複する説明を省略する。
1.第1の実施形態(PowerPointファイルのノート領域を用いる例)
2.第2の実施形態(PowerPointファイルのノート領域を用いる例)
3.第3の実施形態(PDFファイルの注釈機能を用いる例)
4.第4の実施形態(出力形態を選択する例)
5.その他
<1.第1の実施形態>
[システム構成]
図1は、第1の実施形態に係る画像処理装置を含むシステムの全体構成を示す概略図である。
図1のシステム10では、クライアント端末1、プリンタコントローラー2、画像形成装置3、スキャナ4、及びカメラ5がネットワークNを介して相互に通信可能に接続されている。ネットワークNは、例えばイーサネット(登録商標)などの規格に準拠したLAN等のネットワークである。クライアント端末1、プリンタコントローラー2、画像形成装置3は、画像処理装置の一例である。
クライアント端末1は、例えばパーソナルコンピューター(PC)等の端末装置である。クライアント端末1は、ユーザーの入力操作によって印刷出力が指示された印刷ジョブを、ネットワークNを介してプリンタコントローラー2に送信する。この印刷ジョブは、例えば、PDL(Page Description Language)に従ってクライアント端末1により生成されるデータであり、出力設定や入力データが含まれる。また、クライアント端末1は、他装置から電子文書(画像データ)を受信し、記憶する。
プリンタコントローラー2は、画像形成装置3に画像の印刷出力を行わせる。このプリンタコントローラー2は、ネットワークNを介してクライアント端末1から印刷ジョブを受信する。そして、プリンタコントローラー2は、受信した印刷ジョブから取り出した入力データにラスタライズ処理(RIP処理)を実行し、ビットマップデータ(画像形成用データ)を生成する。
プリンタコントローラー2と画像形成装置3はネットワークNを介して接続されているが、直接接続してもよい。このときプリンタコントローラー2と画像形成装置3は、ビデオインタフェース回線等の専用回線を介して接続されてもよい。
画像形成装置3は、プリンタコントローラー2から受信した印刷ジョブに基づいて、用紙に画像を形成して出力する。画像形成装置3は、複数種類の機能(印刷機能、複写機能、スキャン機能等)を備えた複合機(MFP:Multi Function Peripheral)でもよい。
スキャナ4は、読み取り面に載置された紙文書Pの表面を読み取って画像データ(ビットマップデータ)を生成し、ネットワークN又は無線を介してクライアント端末1等へ出力する。
カメラ5は、紙文書Pを撮像して画像データを生成し、ネットワークNを介してクライアント端末1等へ出力する。
[各装置のハードウェア構成]
図2は、各装置のハードウェア構成を示すブロック図である。
ここでは、上述したシステム10に示されたクライアント端末1、プリンタコントローラー2、画像形成装置3、スキャナ4、及びカメラ5を構成するコンピューター20のハードウェア構成を説明する。なお、各装置の機能、使用目的に合わせてコンピューター20の各部は取捨選択される。
コンピューター20は、バス24にそれぞれ接続されたCPU(Central Processing Unit)21、ROM(Read Only Memory)22、RAM(Random Access Memory)23を備える。さらに、コンピューター20は、表示部25、操作部26、不揮発性ストレージ27、ネットワークインターフェース28を備える。
CPU21は、本実施形態に係る各機能を実現するソフトウェアのプログラムコードをROM22から読み出して実行する。なお、コンピューター20は、CPU21の代わりに、MPU(Micro-Processing Unit)等の処理装置を備えるようにしてもよい。
RAM23には、演算処理の途中に発生した変数やパラメータ等が一時的に書き込まれる。表示部25は、例えば、液晶ディスプレイモニタであり、コンピューター20で行われる処理の結果等を表示する。操作部26には、例えば、キーボード、マウス又はタッチパネル等が用いられ、ユーザーが所定の操作入力、指示を行うことが可能である。
不揮発性ストレージ27としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フレキシブルディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード等が用いられる。この不揮発性ストレージ27には、OS(Operating System)、各種のパラメータの他に、コンピューター20を機能させるためのプログラムが記録されている。例えば不揮発性ストレージ27には、電子文書の画像データが保存される。
ネットワークインターフェース28には、例えば、NIC(Network Interface Card)等が用いられ、LAN等のネットワークNを介して各装置間で各種のデータを送受信することが可能である。
本発明に係る画像処理装置は、図2のようなコンピューター20上で動作する。よって、画像処理装置は、パーソナルコンピューター、スマートフォンやタブレット端末などの携帯端末、ネットワークN上に配置されたサーバー(例えばプリンタコントローラー2)、MFPのような複合機、スキャナ4、カメラ5、及びその他の装置でも動作可能である。
[画像処理装置の機能]
図3は、第1の実施形態に係る画像処理装置が備えるコンピューター20の機能構成を示す。ここでは、画像処理装置をクライアント端末1に適用した例について説明する。以降の説明において、紙文書を読み取って得た画像データを構造化データの本体属性に変換する技術は周知(例えば特開2005−149097号公報等)であるので、詳細な説明は割愛する。
図3に示すように、クライアント端末1は、入力画像受信部31、画像データ記録部32、領域判別部33、文字種別判別部34、文字コード化処理部35、構造化データ変換部36、手書き文字置換部37、構造化データ記録部38、及び構造化データ出力部39を備える。コンピューター20のCPU21が、ROM22に格納されたプログラムを実行することにより各部の機能が実現される。
入力画像受信部31は、手書きで加筆された紙文書Pを読み取って得られる画像データ(入力画像)を受信する。画像データは、例えばスキャナ4やカメラ5により得られる。あるいは、ネットワークNを介して不図示のサーバーから受信したり、リムーバブルメディアから取得したりしてもよい。
画像データ記録部32は、入力画像受信部31により受信した画像データを記録する。画像データ記録部32には、例えば不揮発性ストレージ27が用いられる。
領域判別部33は、入力画像受信部31又は画像データ記録部32から画像データを取得して解析する。画像データに含まれる文字と文字以外の領域を判別し、判別結果を文字種別判別部34及び構造化データ変換部36に出力する。例えば領域判別部33では、文字領域、図形領域、写真領域を判別する。
文字種別判別部34は、領域判別部33により判別された文字領域を解析し、文字領域に存在する文字が印字手書き文字又は印字文字のいずれであるかを判定する。この文字種別判別部34は、印字文字認識処理部341、手書き文字認識処理部342、及び手書き文字判定部343を備える。
印字文字認識処理部341は、文字領域と判別された画像に対して印字文字認識処理を実行する。また手書き文字認識処理部342は、文字領域と判別された画像に対して手書き文字認識処理を実行する。さらに印字文字認識処理部341は、印字文字認識処理後に印字文字認識度を算出する。また手書き文字認識処理部342は、手書き文字認識処理後に手書き文字認識度を算出する。印字文字認識処理部341と手書き文字認識処理部342を、一つのブロックにまとめてもよい。
手書き文字判定部343は、印字文字認識処理部341で算出された印字文字認識度と手書き文字認識処理部342で算出された手書き文字認識度から、双方の文字の認識度の比率から印字文字と手書き文字を判別する。
文字コード化処理部35は、手書き文字判定部343から受信した文字領域に含まれる印字文字及び手書き文字を文字コード化する処理を行う。
構造化データ変換部36は、入力された画像データをベクタライズ処理して構造化データの本体属性に変換し、構造化データ記録部38又は構造化データ出力部39へ出力する。この構造化データ変換部36は、本体属性変換部361と、補足属性変換部362を備える。
本体属性変換部361は、領域判別部33により判別された文字以外(図形、写真)の領域、及び、文字コード化した印字文字を含む文字領域を構造化データの本体属性に変換する。補足属性変換部362は、文字コード化された手書き文字を構造化データの補足属性に変換し、補足属性に対応する補足領域(後述するノート領域、コメント領域、注釈機能のポップアップウィンドウ等)に配置する。
補足属性に対応する補足領域は、文書作成ソフトウェアで利用される構造化データのコメント属性で定義される領域、ノート属性で定義される領域、あるいは注釈機能のポップアップウィンドウ等で定義される領域である。
手書き文字置換部37は、文字種別判別部34により判定された手書き文字が存在した本体属性に対応する本体領域の手書き文字部を、手書き文字が存在したことを表す情報に置き換える。言い換えると、手書き文字置換部37は、本体領域の手書き文字部に対応する部分に、補足属性に変換した手書き文字との関連性を示す情報(記号、図形、文字列、画像等)を生成する。
構造化データ記録部38は、構造化データ変換部36から入力された構造化データを記録する。構造化データ記録部38には、例えば不揮発性ストレージ27が用いられる。
構造化データ出力部39は、構造化データ変換部36から出力された又は構造化データ記録部38から読み出した構造化データを、表示部25等へ出力する。
[画像処理装置の動作]
図4は、第1の実施形態に係る画像処理装置が適用されたクライアント端末1の動作を示すフローチャートである。コンピューター20のCPU21が、ROM22に格納されたプログラムを実行することにより図4のフローチャートの処理が実現される。
まず、入力画像受信部31は、印刷文書に手書きでメモを加えた紙文書Pをスキャナ4もしくはカメラ5等の電子画像化手段で電子画像化した画像データを、入力画像として受信する(S1)。入力画像の例を図5に示す。
図5は、手書き文字を含む入力画像の例を示す。
図5の入力画像Dの場合、印字領域40の「2017年4月:リリース」と印字された行の下に、「遅すぎる!」という文字が手書きで追加されている。左斜め上を向いた矢印と「遅すぎる!」という文字を含む領域を、手書き領域41とする。
次に、領域判別部33は、この入力画像を走査して領域判別処理を実施し、文字領域、図形領域、写真領域を判別する(S2)。判別結果を図6に示す。
図6は、入力画像に対し領域判別処理を実施した結果を示す。
破線の枠が図形領域Ag、実線の枠が文字領域Atとして判別されている。図6の例では、写真領域は存在しない。手書き領域41では、矢印が図形領域42に、手書き文字が文字領域43に判別される。
次に、領域判別部33は、領域判別処理の結果が文字領域であるか否かを判定し(S3)、文字領域以外の領域である場合(S3のNO)にはステップS4へ進み、文字領域である場合(S3のYES)にはステップS6へ進む。
次に、構造化データ変換部36の本体属性変換部361は、領域判別部33により判別された文字以外の領域(図形領域、写真領域)に対して認識処理を実施し(S4)、構造化データの本体属性に変換する(S5)。ステップS5の処理が終了後、ステップS11へ進む。
次に、領域判別処理の結果が文字領域である場合(S3のYES)には、文字種別判別部34による文字種別判別処理を実施する(S6)。文字種別判別処理のフローチャート(サブルーチン)を図7に示す
[文字種別判別処理]
図7は、図4のステップS5の文字種別判別処理を示すフローチャートである。
まず文字種別判別部34に、入力画像Dの文字領域が入力される(S21)。次に、文字種別判別部34の印字文字認識処理部341は、文字領域と判別された画像に対して印字文字認識処理(S22)を実施し、印字文字認識度を算出する。
また、文字種別判別部34の手書き文字認識処理部342は、文字領域と判別された画像に対して手書き文字認識処理(S23)を実施し、手書き文字認識度を算出する。
次に、手書き文字判定部343は、印字文字認識処理部341で算出された印字文字認識度と、手書き文字認識処理部342で算出された手書き文字認識度を比較する(S24)。ここで、印字文字認識度をOCRS、手書き文字認識度をICRSとする。
印字文字認識度(OCRS)が手書き文字認識度(ICRS)よりも大きい場合には(S24のYES)、手書き文字判定部343は、文字領域に含まれる文字は印字文字であると判定する(S25)。
一方、印字文字認識度(OCRS)が手書き文字認識度(ICRS)以下である場合には(S24のNO)、手書き文字判定部343は、文字領域に含まれる文字は手書き文字であると判定する(S26)。
次に、ステップS25,S26により印字文字又は手書き文字と判定された文字に対して、それぞれに文字コード化処理部35が文字コード化処理を行う(S27)。ステップS27の処理とステップS22,S23の処理を順不同とすることができる。ステップS27の処理が終了後、図4のステップS7に進む。
なお、文字コード化処理部35の機能を、印字文字認識処理部341及び手書き文字認識処理部342が備えていてもよい。即ち、印字文字認識処理部341及び手書き文字認識処理部342がそれぞれの文字認識を実施する際に、文字コード化処理を実施してもよい。ここで、文字種別判別結果の例を図8に示す。
図8は、入力画像Dの文字領域に対し文字種別判別処理を実施した結果である。手書き文字を含む文字領域はドットで塗りつぶしてある。
図8において、ドットで図6の文字領域43がドットで塗りつぶされており、文字領域43の文字が手書き文字(手書き文字部43A)と判別されたことがわかる。この判別結果を元に、構造化データへの変換が行われる。
構造化データとは、OOXMLやODF、PDF(登録商標)等のフォーマットで記述されたデータのことである。
OOXML(Office Open XML, OpenXML)は、XMLをベースとしたオフィススイート用のファイルフォーマットである。Microsoft Word(登録商標)、Microsoft Excel(登録商標)、Power Pointは、OOXMLに準拠している。
ODF(Open Document Format)は、ワープロ文書や表計算ソフトのワークシートなど、オフィスソフトの扱う文書ファイルを保存するためのXMLベースのオープンなファイルフォーマットである。
PDF(Portable Document Format)とは、Adobe Systems社によって開発された、電子文書のためのフォーマットである。PDF形式のファイルには文字情報だけでなく、フォントや文字の大きさ、字飾り、埋め込まれた画像、それらのレイアウトなどの情報を保存できる。
図4のフローチャートの説明に戻る。文字種別判別部34の手書き文字判定部343により、入力画像Dの文字領域が手書き文字であるか否かを判定する(S7)。手書き文字ではない場合(S7のNO)、構造化データ変換部36の本体属性変換部361は、印字文字と判別された文字列を構造化データの本体属性に変換する(S8)。ステップS8の処理が終了後、ステップS11へ進む。
一方、入力画像Dの文字領域が手書き文字である場合(S7のYES)、構造化データ変換部36の補足属性変換部362は、手書き文字と判別された文字列を構造化データの補足属性に変換する(S9)。
以下、構造化データの補足属性の例として、Microsoft OfficeのPowerPointのノート属性に変換する場合について説明する。図9にPowerPointファイルをアプリケーションで開いた表示例を示す。
(アプリケーションの表示例)
図9は、第1の実施形態に係るPowerPointファイルをアプリケーションにより開いたときの表示例である。
図9に示すアプリケーション画面50には、ホームメニュー51や校閲メニュー52などの複数のメニューが用意されている。それらの複数のメニューの下側に本体属性に対応する本体領域53と、本体領域53の下側に補足属性に対応するノート領域54が設けられている。本体領域53は、アプリケーション画面50の中央において広い面積を占める。このファイルフォーマットは、ISO29500で標準化されたXML形式のフォーマットである。
(ファイルフォーマットの構造例)
図10は、ノート属性を含む一般的なPowerPointファイルのファイルフォーマットの構造例を示す。
図9に示した本体領域53のオブジェクトは‘slides’フォルダ61(本体属性ディレクトリ)内の‘slide1.xml’に記述され、ノート領域54の文字列は‘notesSlides’フォルダ62(ノート属性ディレクトリ)内の‘notesSlide1.xml’に記述される。
図4のフローチャートの説明に戻る。次に、手書き文字置換部37は、構造化データの手書き文字部が存在した本体領域の手書き文字部を、手書き文字が存在したことを表す情報(構造化データ)に置き換える(S10)。構造化データ変換部36は、これらの構造化データを、構造化データ記録部38に記録する。
次に、構造化データ出力部39は、ユーザーの指示に応じて、構造化データ記録部38に記録された構造化データを出力する。例えば、構造化データ出力部39は、アプリケーションにより表示部25に構造化データを表示する(S11)。ステップS11の処理が終了したら本フローチャートの処理を終了する。
[手書き文字が存在していたことを表す情報の例]
手書き文字が存在した本体領域53の手書き文字部に作成する、手書き文字が存在したことを表す情報の例について説明する。
[第1例]
図11は、第1の実施形態の第1例に係る、手書き文字をPowerPointファイルのノート領域に配置したアプリケーション画面の表示例を示す。
図11のアプリケーション画面50Aでは、「遅すぎる!」と書かれた手書き文字列541をノート領域54に配置する。また、本体領域53の文書画像530Aの手書き文字列が存在していた部分(手書き文字部531)に、ノート領域54に配置された手書き文字列541との対比が取れる情報(図11の例では★の記号)を配置する。図11では、本体領域53の文書画像530Aに配置した手書き文字が存在したことを表す情報(★)と同じ情報が、ノート領域54にも配置されている。これによりユーザーは、ノート領域54の文字列と本体領域53の手書き文字部531との対応関係を、容易に認識することができる。
また、記号だけではそこに手書き文字列が存在していたことをユーザーが見逃す可能性があるため、手書き文字列が存在していたことを表す文字列も追加し配置してもよい。例えば図11では、手書き文字部531に「手書き有」の文字列が配置されている。このおうに、手書き文字が存在したことを表す情報との関連性を示す情報を、本体領域53又はノート領域54(補足領域)の少なくともいずれか一方に配置するとよい。
[第2例]
第2例では、紙文書に手書き文字が複数存在していた場合には、複数の手書き文字が存在していたことを表す情報と、該手書き文字が存在していたことを表す情報との関連性を示す情報の各々に、対応関係を表す情報を付加する。例えば、紙文書に加筆された手書き文字列が多数存在する場合には、‘記号+通し番号’としてもよい。
図12は、第1の実施形態の第2例に係る、手書き文字をPowerPointファイルのノート領域に配置したアプリケーション画面の表示例を示す。
図12のアプリケーション画面50Bでは、ノート領域54に2つの手書き文字列541a,541bが存在し、本体領域53の文書画像530Bにも2箇所に手書き文字部531a,531bが存在する。そして、ノート領域54の手書き文字列541a,541bに対応する本体領域53の手書き文字部531a,531bの前に、‘★1’,‘★2’の記号が配置されている。
また、本体領域53に追加する文字列は、元から本体領域53に存在する他の情報(印字文字列等)と区別できるように、文字色、文字サイズ、文字の太さ、斜体などの異なる装飾で追加してもよい。図12の例では、文字列が斜体で表示されている。
[第1の実施形態の効果]
上述した構成の本発明によれば、印字文字と手書き文字が混在した紙文書を電子画像化し、その電子画像をベクタライズ処理して清書化されたファイルフォーマットに変換する処理において、印字文字と手書き文字を容易に判別できるようになる。
<2.第2の実施形態>
第1の実施形態に係る構造化データの別の補足属性の例として、手書き文字をMicrosoft OfficeのPowerPointのコメント属性に変換する場合について説明する。
[第1例]
図13は、第2の実施形態の第1例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。
図12のアプリケーション画面70Aにおいて、本体領域73の文書画像730Aの手書き文字が存在していた部分(手書き文字部531)に、透明オブジェクト731aを配置する。また、配置した透明オブジェクト731aに関連するコメントとして、手書き文字列「遅すぎる!」をコメント領域75のコメント欄751に追加する。コメント表示ボタン521をマウスポインタ等で押すことにより、コメント領域75が表示される。
透明オブジェクト731aは、非可視文字コード(空白、タブ)でもよいし、透明な図形オブジェクトでもよい。
またコメント欄751の「遅すぎる!」の左側にクライアント端末1のユーザー名(KUROKI)が表示されているが、操作部26を操作して後から手書きコメントを加筆したユーザー名を入力してもよい。あるいは、コメント欄751にユーザー名を表示しなくてもよい。
コメント機能を利用すると、アプリケーションが自動でコメント領域75にコメントが存在することを表すマーク732a(記号、図形等)を本体領域73の対応する場所に表示し、コメント欄751の手書き文字列との関連を示すことが可能である。本体領域73の対応する場所とは、手書き文字部531に対応する位置である。
図13において、本体領域73の文書画像730Aに透明オブジェクト731a及びマーク732aが配置され、そこにコメントがあることがアプリケーションにより示されている。また図13において、透明オブジェクト731a及びマーク732aに関連するコメントとして、手書き文字列がコメント領域75のコメント欄751に追加されている。
(ファイルフォーマットの構造例)
図14は、コメント属性を含む一般的なPowerPointファイルのファイルフォーマットの構造例を示す。
図13に示した本体領域73の透明オブジェクト731aは‘slides’フォルダ61(本体属性ディレクトリ)内の‘slide1.xml’に記述され、コメント領域75のコメントは‘comments’フォルダ63(コメント属性ディレクトリ)内の‘comment1.xml’に記述される。
[第2例]
図13の本体領域73に配置する透明オブジェクトは、手書き文字列があったことを表す可視文字列であってもよい。
図15は、第2の実施形態の第2例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。
図15のアプリケーション画面70Bでは、本体領域73の文書画像730Bの手書き文字部531に、マーク732aの横に可視文字列‘手書き有’からなるオブジェクト731bが配置されている。
このように本体領域73に可視文字列からなるオブジェクト731bを配置することにより、そこに手書き文字列が存在していたことをユーザーが見逃す可能性が減少する。
[第3例]
図16は、第2の実施形態の第3例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。
図16のアプリケーション画面70Cでは、本体領域73の文書画像730Cの手書き文字部531に、可視文字列‘手書き有’からなるオブジェクト731bの右上に、マーク732cが配置されている。
[第4例]
図17は、第2の実施形態の第4例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。
図17のアプリケーション画面70Dでは、本体領域73の文書画像730Dの手書き文字部531にマーク732aのみが表示され、オブジェクトが配置されない又は透明オブジェクト731a(図13)が配置される。そして、コメント領域75のコメント欄751に、手書き文字列の存在を示す可視文字列751d‘手書き有’とともに、手書きコメント「遅すぎる!」が表示される。
これにより、本体領域73にマーク732aのみを表示し、手書き文字列の存在を示す可視文字列を表示しなくても、ユーザーはコメント領域75に配置された可視文字列751d‘手書き有’を見ることにより、手書き文字の存在を認識することができる。
[第5例]
図18は、第2の実施形態の第5例に係る、PowerPointファイルのコメント領域に表示された手書き文字情報の内容を削除したアプリケーション画面の表示例を示す。
図18のアプリケーション画面70Eでは、本体領域73に図17と同じ文書画像730Dを表示しているが、コメント領域75のコメント欄751のコメントが削除されている。
Microsoft Office等のXMLベースの文書作成アプリケーションの機能として、補足領域(ノート領域やコメント領域)の文字列を一括で削除する一括削除機能が用意されている。手書き文字列を補足領域に配置した場合に、この一括削除機能を利用することで、手書き文字列を含まない形で文書配布したいという要望にも簡単に対応可能となる。本例は、第1の実施形態にも適用可能である。
<3.第3の実施形態>
PDFやMicrosoft Wordの機能にも同様のコメント機能(注釈機能)があり、この機能を使ってそれぞれのフォーマットに変換することで、第1及び第2の実施形態と同様の効果を持たせることが可能である。
図19は、第3の実施形態に係る、手書き文字をPDFファイルの注釈領域に配置したアプリケーション画面の表示例を示す。
図19のアプリケーション画面70Eでは、本体領域に対応する文書画像80の手書き文字部531に、図形や記号等からなる注釈アイコン81が配置され、注釈アイコン81と紐付けられたポップアップウィンドウ82が表示される。ポップアップウィンドウ82は補足属性に対応する補足領域である。ポップアップウィンドウ82に、手書き文字列‘遅すぎる!’が配置される。
PDFの場合は、ページ毎のページオブジェクトのAnnots配列に手書き文字列(注釈データ)を登録することで実現可能である。
上述した第3の実施形態によれば、PDFファイルを用いた場合でも、第1の実施形態及び第2の実施形態と同様の作用効果を奏する。
なお、PDFの場合でも、注釈アイコン81の近くに可視文字列(例えば‘手書き文字有’)からなるオブジェクトを配置してもよい。
<4.第4の実施形態>
この構造化データ変換機能を実装するアプリケーション(クライアント端末1や画像形成装置3など)に、出力形態を選択可能なUIを持たせる。そして、手書き文字列を「ノート領域に配置」、「コメント領域に配置」、「本体領域に配置」、「完全に削除してどこにも配置しない」などの選択肢をユーザーが選択することも可能である。
図20は、第4の実施形態に係る画像処理装置が備えるコンピューター20Aの機能構成を示す。ここでは、画像処理装置をクライアント端末1に適用した例について説明する。
図20のコンピューター20Aは、図3のコンピューター20に対して出力形態設定部90を備える点が異なる。
出力形態設定部90は、スキャナ4等の電子画像化手段により得られた電子データを、どのフォーマット(データ形式)の構造化データに変換するか選択を促すフォーマット選択画面(図示略)を表示部25に表示する。次に、出力形態設定部90は、選択されたフォーマットが複数の出力形態(手書き文字列の配置態様)を備える場合には、上記の出力形態を選択させる出力形態選択画面(図示略)を表示する。そして、出力形態設定部90は、ユーザーの選択に基づく出力形態で、手書き文字列をアプリケーション画面に出力する。
なお、出力形態設定部90は、「完全に削除してどこにも配置しない」が選択された場合には、ベクタライズ処理時に手書き文字以外の情報(例えば図形領域42として判別された矢印)も含めて変換後の構造化データに加筆した情報を反映しない。このようにすることで、手書き情報を含まない形で文書を他ユーザーと共有、配布することができる。
<5.その他>
なお、スキャナ4及びカメラ5等の電子画像化手段であっても、図2に示すようなコンピューターを搭載していれば、画像処理装置を適用することが可能である。
さらに、本発明は上述した各実施形態例に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、その他種々の応用例、変形例を取り得ることは勿論である。
例えば、上述した実施形態例は本発明を分かりやすく説明するために装置及びシステムの構成を詳細且つ具体的に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態例の構成の一部を他の実施形態例の構成に置き換えることは可能である。また、ある実施形態例の構成に他の実施形態例の構成を加えることも可能である。また、各実施形態例の構成の一部について、他の構成の追加、削除、置換をすることも可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、又はICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
また、本明細書において、時系列的な処理を記述する処理ステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)をも含むものである。
1…クライアント端末、 4…スキャナ、 5…カメラ、 10…システム、 21…CPU、 27…不揮発性ストレージ、 31…入力画像受信部、 33…領域判別部、 34…文字種別判別部、 35…文字コード化処理部、 36…構造化データ変換部、 37…手書き文字置換部、 39…構造化データ出力部、 40…印字文字領域、 41…手書き領域、 42…図形領域、 43…文字領域、 43A…手書き文字部、 53…本体領域、 54…ノート領域、 61…本体属性フォルダ、 62…ノート属性フォルダ、 63…コメント属性フォルダ、 73…本体領域、 74…補正領域、 75…コメント領域、 361…本体属性変換部、 362…補正属性変換部、 521…コメント表示ボタン、 531,531a,531b…手書き文字部、 541,541a,541b…手書き文字列、751…コメント欄、 P…紙文書、 D…画像データ

Claims (10)

  1. 手書きで加筆された紙文書を読み取って得られた画像データを解析し、前記画像データに含まれる文字領域と文字以外の領域を判別する領域判別部と、
    前記領域判別部により判別された前記文字領域を解析し、前記文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する文字種別判別部と、
    前記印字文字及び前記手書き文字を文字コード化する文字コード化処理部と、
    前記領域判別部により判別された前記文字以外の領域、及び、文字コード化した前記印字文字を含む文字領域を構造化データの本体属性に変換する構造化データ変換部と、
    文字コード化された前記手書き文字を前記構造化データの補足属性に変換する補足属性変換部と、
    前記文字種別判別部により判定された前記手書き文字が存在した前記本体属性に対応する本体領域の手書き文字部を、前記手書き文字が存在したことを表す情報に置き換える手書き文字置換部と、
    を備える画像処理装置。
  2. 前記本体領域に配置した前記手書き文字が存在したことを表す情報と同じ情報を、前記補足属性に対応する補足領域にも配置する
    請求項1に記載の画像処理装置。
  3. 前記手書き文字が存在したことを表す情報との関連性を示す情報を、前記本体領域及び前記補足属性に対応する補足領域の少なくともいずれか一方に配置する
    請求項1に記載の画像処理装置。
  4. 前記手書き文字が複数存在していた場合には、複数の前記手書き文字が存在していたことを表す情報と、前記手書き文字が存在していたことを表す情報との関連性を示す情報の各々に、対応関係を表す情報を付加する
    請求項3に記載の画像処理装置。
  5. 前記手書き文字が存在したことを表す情報には、前記本体領域に存在する他の情報と区別できる装飾が施される
    請求項1に記載の画像処理装置。
  6. 前記補足属性に対応する前記補足領域は、文書作成ソフトウェアで利用される前記構造化データのコメント属性で定義される領域又はノート属性で定義される領域である
    請求項1に記載の画像処理装置。
  7. 前記文書作成ソフトウェアで利用される前記構造化データは、OOXML、ODFのフォーマットで記述されるデータである
    請求項1に記載の画像処理装置。
  8. 前記構造化データがPDF(登録商標)で記述されるデータである場合、前記補足属性にはAnnots配列で定義される注釈機能を利用する
    請求項1に記載の画像処理装置。
  9. 前記手書き文字が存在したことを表す情報は少なくとも、記号、文字列、図形、又は画像のいずれかである
    請求項1乃至8のいずれかに記載の画像処理装置。
  10. 手書きで加筆された紙文書を読み取って得られた画像データを解析し、前記画像データに含まれる文字領域と文字以外の領域を判別する手順と、
    判別された前記文字領域を解析し、前記文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する手順と、
    前記印字文字及び前記手書き文字を文字コード化する手順と、
    判別された前記文字以外の領域、及び、文字コード化した前記印字文字を含む文字領域を構造化データの本体属性に変換する手順と、
    文字コード化された前記手書き文字を前記構造化データの補足属性に変換する手順と、
    前記手書き文字が存在した前記本体属性に対応する本体領域の手書き文字部を、前記手書き文字が存在したことを表す情報に置き換える手順と、
    をコンピューターに実行させるためのプログラム。
JP2016168417A 2016-08-30 2016-08-30 画像処理装置及びプログラム Active JP6780380B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016168417A JP6780380B2 (ja) 2016-08-30 2016-08-30 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016168417A JP6780380B2 (ja) 2016-08-30 2016-08-30 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2018036794A true JP2018036794A (ja) 2018-03-08
JP6780380B2 JP6780380B2 (ja) 2020-11-04

Family

ID=61564645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016168417A Active JP6780380B2 (ja) 2016-08-30 2016-08-30 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6780380B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210406619A1 (en) * 2020-06-30 2021-12-30 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus for visual question answering, computer device and medium
JP7429374B2 (ja) 2021-10-31 2024-02-08 株式会社Datafluct 情報処理システム、情報処理方法及び情報処理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092027A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
JP2008181485A (ja) * 2006-12-28 2008-08-07 Konica Minolta Business Technologies Inc 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092027A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
JP2008181485A (ja) * 2006-12-28 2008-08-07 Konica Minolta Business Technologies Inc 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KONICA MINOLTA: "bizhub C754e/C654eカタログ", BIZHUB C754E/C654Eカタログ, JPN6020022534, January 2016 (2016-01-01), JP, pages 1 - 12, ISSN: 0004295759 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210406619A1 (en) * 2020-06-30 2021-12-30 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus for visual question answering, computer device and medium
JP2022013643A (ja) * 2020-06-30 2022-01-18 北京百度網訊科技有限公司 画像質問応答方法、装置、コンピュータ装置、媒体及びプログラム
JP7206309B2 (ja) 2020-06-30 2023-01-17 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 画像質問応答方法、装置、コンピュータ装置、媒体及びプログラム
US11854283B2 (en) 2020-06-30 2023-12-26 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus for visual question answering, computer device and medium
JP7429374B2 (ja) 2021-10-31 2024-02-08 株式会社Datafluct 情報処理システム、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP6780380B2 (ja) 2020-11-04

Similar Documents

Publication Publication Date Title
US8689100B2 (en) Document processing apparatus, control method therefor, and computer program
US8045198B2 (en) System and method for processing a change history of a PDF file
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
US20090204888A1 (en) Document processing apparatus, document processing method, and storage medium
JP2010218098A (ja) 情報処理装置、情報処理方法、制御プログラム及び記録媒体
CN104238970A (zh) 图像形成装置以及印刷控制方法
JP2012203491A (ja) 文書処理装置及び文書処理プログラム
JP6780380B2 (ja) 画像処理装置及びプログラム
JP2015187846A (ja) 文書処理システム、及び文書処理装置
JP2009020553A (ja) 電子ファイル管理装置および電子ファイル管理プログラム
JP6205973B2 (ja) 変更履歴出力装置、プログラム
US8896862B2 (en) Image processing apparatus, control method, and storage medium for print control using metadata
JP2012048637A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2017083996A (ja) 情報処理装置及びその制御方法とプログラム
US9430446B2 (en) Information processing apparatus, method and storage medium including a function for establishing exceptions applied to print settings when specified conditions are met
JP5481955B2 (ja) 文書出力装置、文書出力プログラム及び文書処理システム
JP6656845B2 (ja) 手書き内容集約装置およびプログラム
JP2013161459A (ja) 文書処理方法
JP2009140311A (ja) 文書処理装置および文書処理方法
EP2711847A2 (en) Page data generation apparatus, recording medium and page data generation method
JP6657576B2 (ja) 出力制御プログラム、出力制御方法及び出力制御装置
JP6432237B2 (ja) 画像処理装置および画像処理プログラム
JP2023047133A (ja) 情報処理装置、情報処理システム、及びプログラム
JP2007087197A (ja) 文書処理装置、文書処理方法およびプログラム
US8817318B2 (en) Printer

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190521

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200928

R150 Certificate of patent or registration of utility model

Ref document number: 6780380

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150