JP6780380B2 - Image processing equipment and programs - Google Patents
Image processing equipment and programs Download PDFInfo
- Publication number
- JP6780380B2 JP6780380B2 JP2016168417A JP2016168417A JP6780380B2 JP 6780380 B2 JP6780380 B2 JP 6780380B2 JP 2016168417 A JP2016168417 A JP 2016168417A JP 2016168417 A JP2016168417 A JP 2016168417A JP 6780380 B2 JP6780380 B2 JP 6780380B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- handwritten
- main body
- information indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、画像処理装置及びプログラムに関し、手書きで加筆された紙文書を読み取って得られる画像データを構造化データに変換する技術に係る。 The present invention relates to an image processing apparatus and a program, and relates to a technique for converting image data obtained by reading a handwritten paper document into structured data.
従来、ワードプロセッサやプレゼンテーション資料作成ソフトウェアで作成され印刷された紙文書に、鉛筆やボールペン等で手書きメモを書き込む場合がある。手書き文字が追加された紙文書をスキャナ等で画像化し、文字認識処理を実施し、Microsoft Office(登録商標)のアプリケーションファイル(例えばPowerPoint(登録商標)ファイル)のような構造化データに変換した場合、元から紙文書に印字された文字なのか、手書きで追加した文字なのか判別がつかない。そのため、構造化データからだけではどのような文字(情報)を追記したか分からなくなっていた。 Conventionally, a handwritten memo may be written with a pencil, a ballpoint pen, or the like on a paper document created and printed by a word processor or presentation material creation software. When a paper document with handwritten characters added is imaged with a scanner, etc., character recognition processing is performed, and it is converted into structured data such as an application file of Microsoft Office (registered trademark) (for example, PowerPoint (registered trademark) file). , I can't tell if the characters were originally printed on a paper document or added by hand. Therefore, it was not possible to know what kind of characters (information) were added only from the structured data.
また、手書き情報を含まない形で文書を共有したい場合に、手書き文字を消しゴムで消したり修正液で消したりする手間が発生していた。 In addition, when it is desired to share a document in a form that does not include handwritten information, it takes time and effort to erase the handwritten characters with an eraser or a correction fluid.
例えば特許文献1には、元文書に対して加筆されたと判断された部分を加筆の特徴に応じて電子文書のレイヤーに配置し、統合された電子文書に変換する技術が開示されている。
For example,
しかしながら、特許文献1に記載の技術は、電子文書がレイヤー構造であることを閲覧者が認識する必要がある。また、統合された電子文書の表示もしくはレイヤーごとの表示から、どの部分が加筆されたかを閲覧者が判断することが難しい。
However, the technique described in
本発明は、上記の状況から、紙文書に追記した情報が紙文書から生成した電子画像において容易に視認できることを目的とする。 From the above situation, it is an object of the present invention that the information added to the paper document can be easily visually recognized in the electronic image generated from the paper document.
本発明の一態様の画像処理装置は、手書きで加筆された紙文書を読み取って得られた画像データを解析し、画像データに含まれる文字と文字以外の領域を判別する領域判別部と、該領域判別部により判別された文字領域を解析し、文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する文字種別判別部と、印字文字及び手書き文字を文字コード化する文字コード化処理部と、領域判別部により判別された文字以外の領域、及び、文字コード化した印字文字を含む文字領域を構造化データの本体属性に変換する構造化データ変換部と、文字コード化された手書き文字を構造化データの補足属性に変換する補足属性変換部と、文字種別判別部により判定された手書き文字が存在した本体属性に対応する本体領域の手書き文字部を、手書き文字が存在したことを表す情報に置き換える手書き文字置換部と、を備える。 The image processing apparatus according to one aspect of the present invention includes an area discriminating unit that analyzes image data obtained by reading a handwritten paper document and discriminates between characters and areas other than characters included in the image data. A character type determination unit that analyzes the character area determined by the area determination unit and determines whether the character existing in the character area is a printed character or a handwritten character, and a character that encodes the printed character and the handwritten character. A coding processing unit, a structured data conversion unit that converts an area other than the characters determined by the area determination unit, and a character area including a character-coded printed character into the main body attribute of the structured data, and character coding. The handwritten character exists in the supplementary attribute conversion unit that converts the handwritten character to the supplementary attribute of the structured data, and the handwritten character part in the main body area that corresponds to the main body attribute in which the handwritten character determined by the character type determination unit exists. It is provided with a handwritten character replacement unit that replaces information indicating that the data has been performed.
本発明の少なくとも一態様によれば、紙文書に追記した情報が紙文書から生成した電子画像において容易に視認することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
According to at least one aspect of the present invention, the information added to the paper document can be easily visually recognized in the electronic image generated from the paper document.
Issues, configurations and effects other than those described above will be clarified by the description of the following embodiments.
以下、本発明を実施するための形態の例について、添付図面を参照しながら説明する。説明は下記の順序で行う。なお、各図において実質的に同一の機能又は構成を有する構成要素については、同一の符号を付して重複する説明を省略する。
1.第1の実施形態(PowerPointファイルのノート領域を用いる例)
2.第2の実施形態(PowerPointファイルのノート領域を用いる例)
3.第3の実施形態(PDFファイルの注釈機能を用いる例)
4.第4の実施形態(出力形態を選択する例)
5.その他
Hereinafter, examples of embodiments for carrying out the present invention will be described with reference to the accompanying drawings. The explanation will be given in the following order. In each figure, components having substantially the same function or configuration are designated by the same reference numerals, and duplicate description will be omitted.
1. 1. First embodiment (example of using a note area of a PowerPoint file)
2. Second embodiment (example of using a note area of a PowerPoint file)
3. 3. Third embodiment (example of using the annotation function of the PDF file)
4. Fourth embodiment (example of selecting an output mode)
5. Other
<1.第1の実施形態>
[システム構成]
図1は、第1の実施形態に係る画像処理装置を含むシステムの全体構成を示す概略図である。
<1. First Embodiment>
[System configuration]
FIG. 1 is a schematic view showing an overall configuration of a system including an image processing apparatus according to the first embodiment.
図1のシステム10では、クライアント端末1、プリンタコントローラー2、画像形成装置3、スキャナ4、及びカメラ5がネットワークNを介して相互に通信可能に接続されている。ネットワークNは、例えばイーサネット(登録商標)などの規格に準拠したLAN等のネットワークである。クライアント端末1、プリンタコントローラー2、画像形成装置3は、画像処理装置の一例である。
In the
クライアント端末1は、例えばパーソナルコンピューター(PC)等の端末装置である。クライアント端末1は、ユーザーの入力操作によって印刷出力が指示された印刷ジョブを、ネットワークNを介してプリンタコントローラー2に送信する。この印刷ジョブは、例えば、PDL(Page Description Language)に従ってクライアント端末1により生成されるデータであり、出力設定や入力データが含まれる。また、クライアント端末1は、他装置から電子文書(画像データ)を受信し、記憶する。
The
プリンタコントローラー2は、画像形成装置3に画像の印刷出力を行わせる。このプリンタコントローラー2は、ネットワークNを介してクライアント端末1から印刷ジョブを受信する。そして、プリンタコントローラー2は、受信した印刷ジョブから取り出した入力データにラスタライズ処理(RIP処理)を実行し、ビットマップデータ(画像形成用データ)を生成する。
The
プリンタコントローラー2と画像形成装置3はネットワークNを介して接続されているが、直接接続してもよい。このときプリンタコントローラー2と画像形成装置3は、ビデオインタフェース回線等の専用回線を介して接続されてもよい。
Although the
画像形成装置3は、プリンタコントローラー2から受信した印刷ジョブに基づいて、用紙に画像を形成して出力する。画像形成装置3は、複数種類の機能(印刷機能、複写機能、スキャン機能等)を備えた複合機(MFP:Multi Function Peripheral)でもよい。
The
スキャナ4は、読み取り面に載置された紙文書Pの表面を読み取って画像データ(ビットマップデータ)を生成し、ネットワークN又は無線を介してクライアント端末1等へ出力する。
The
カメラ5は、紙文書Pを撮像して画像データを生成し、ネットワークNを介してクライアント端末1等へ出力する。
The
[各装置のハードウェア構成]
図2は、各装置のハードウェア構成を示すブロック図である。
[Hardware configuration of each device]
FIG. 2 is a block diagram showing a hardware configuration of each device.
ここでは、上述したシステム10に示されたクライアント端末1、プリンタコントローラー2、画像形成装置3、スキャナ4、及びカメラ5を構成するコンピューター20のハードウェア構成を説明する。なお、各装置の機能、使用目的に合わせてコンピューター20の各部は取捨選択される。
Here, the hardware configuration of the
コンピューター20は、バス24にそれぞれ接続されたCPU(Central Processing Unit)21、ROM(Read Only Memory)22、RAM(Random Access Memory)23を備える。さらに、コンピューター20は、表示部25、操作部26、不揮発性ストレージ27、ネットワークインターフェース28を備える。
The
CPU21は、本実施形態に係る各機能を実現するソフトウェアのプログラムコードをROM22から読み出して実行する。なお、コンピューター20は、CPU21の代わりに、MPU(Micro-Processing Unit)等の処理装置を備えるようにしてもよい。
The
RAM23には、演算処理の途中に発生した変数やパラメータ等が一時的に書き込まれる。表示部25は、例えば、液晶ディスプレイモニタであり、コンピューター20で行われる処理の結果等を表示する。操作部26には、例えば、キーボード、マウス又はタッチパネル等が用いられ、ユーザーが所定の操作入力、指示を行うことが可能である。
Variables, parameters, etc. generated during the arithmetic processing are temporarily written in the
不揮発性ストレージ27としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フレキシブルディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード等が用いられる。この不揮発性ストレージ27には、OS(Operating System)、各種のパラメータの他に、コンピューター20を機能させるためのプログラムが記録されている。例えば不揮発性ストレージ27には、電子文書の画像データが保存される。
Examples of the
ネットワークインターフェース28には、例えば、NIC(Network Interface Card)等が用いられ、LAN等のネットワークNを介して各装置間で各種のデータを送受信することが可能である。
For the
本発明に係る画像処理装置は、図2のようなコンピューター20上で動作する。よって、画像処理装置は、パーソナルコンピューター、スマートフォンやタブレット端末などの携帯端末、ネットワークN上に配置されたサーバー(例えばプリンタコントローラー2)、MFPのような複合機、スキャナ4、カメラ5、及びその他の装置でも動作可能である。
The image processing apparatus according to the present invention operates on the
[画像処理装置の機能]
図3は、第1の実施形態に係る画像処理装置が備えるコンピューター20の機能構成を示す。ここでは、画像処理装置をクライアント端末1に適用した例について説明する。以降の説明において、紙文書を読み取って得た画像データを構造化データの本体属性に変換する技術は周知(例えば特開2005−149097号公報等)であるので、詳細な説明は割愛する。
[Functions of image processing device]
FIG. 3 shows the functional configuration of the
図3に示すように、クライアント端末1は、入力画像受信部31、画像データ記録部32、領域判別部33、文字種別判別部34、文字コード化処理部35、構造化データ変換部36、手書き文字置換部37、構造化データ記録部38、及び構造化データ出力部39を備える。コンピューター20のCPU21が、ROM22に格納されたプログラムを実行することにより各部の機能が実現される。
As shown in FIG. 3, the
入力画像受信部31は、手書きで加筆された紙文書Pを読み取って得られる画像データ(入力画像)を受信する。画像データは、例えばスキャナ4やカメラ5により得られる。あるいは、ネットワークNを介して不図示のサーバーから受信したり、リムーバブルメディアから取得したりしてもよい。
The input
画像データ記録部32は、入力画像受信部31により受信した画像データを記録する。画像データ記録部32には、例えば不揮発性ストレージ27が用いられる。
The image
領域判別部33は、入力画像受信部31又は画像データ記録部32から画像データを取得して解析する。画像データに含まれる文字と文字以外の領域を判別し、判別結果を文字種別判別部34及び構造化データ変換部36に出力する。例えば領域判別部33では、文字領域、図形領域、写真領域を判別する。
The
文字種別判別部34は、領域判別部33により判別された文字領域を解析し、文字領域に存在する文字が印字手書き文字又は印字文字のいずれであるかを判定する。この文字種別判別部34は、印字文字認識処理部341、手書き文字認識処理部342、及び手書き文字判定部343を備える。
The character type determination unit 34 analyzes the character area determined by the
印字文字認識処理部341は、文字領域と判別された画像に対して印字文字認識処理を実行する。また手書き文字認識処理部342は、文字領域と判別された画像に対して手書き文字認識処理を実行する。さらに印字文字認識処理部341は、印字文字認識処理後に印字文字認識度を算出する。また手書き文字認識処理部342は、手書き文字認識処理後に手書き文字認識度を算出する。印字文字認識処理部341と手書き文字認識処理部342を、一つのブロックにまとめてもよい。
The print character
手書き文字判定部343は、印字文字認識処理部341で算出された印字文字認識度と手書き文字認識処理部342で算出された手書き文字認識度から、双方の文字の認識度の比率から印字文字と手書き文字を判別する。
The handwritten
文字コード化処理部35は、手書き文字判定部343から受信した文字領域に含まれる印字文字及び手書き文字を文字コード化する処理を行う。
The character
構造化データ変換部36は、入力された画像データをベクタライズ処理して構造化データの本体属性に変換し、構造化データ記録部38又は構造化データ出力部39へ出力する。この構造化データ変換部36は、本体属性変換部361と、補足属性変換部362を備える。
The structured
本体属性変換部361は、領域判別部33により判別された文字以外(図形、写真)の領域、及び、文字コード化した印字文字を含む文字領域を構造化データの本体属性に変換する。補足属性変換部362は、文字コード化された手書き文字を構造化データの補足属性に変換し、補足属性に対応する補足領域(後述するノート領域、コメント領域、注釈機能のポップアップウィンドウ等)に配置する。
The main body attribute conversion unit 361 converts the area other than the characters (figure, photograph) determined by the
補足属性に対応する補足領域は、文書作成ソフトウェアで利用される構造化データのコメント属性で定義される領域、ノート属性で定義される領域、あるいは注釈機能のポップアップウィンドウ等で定義される領域である。 The supplementary area corresponding to the supplementary attribute is an area defined by the comment attribute of the structured data used in the document creation software, an area defined by the note attribute, or an area defined by the pop-up window of the annotation function. ..
手書き文字置換部37は、文字種別判別部34により判定された手書き文字が存在した本体属性に対応する本体領域の手書き文字部を、手書き文字が存在したことを表す情報に置き換える。言い換えると、手書き文字置換部37は、本体領域の手書き文字部に対応する部分に、補足属性に変換した手書き文字との関連性を示す情報(記号、図形、文字列、画像等)を生成する。
The handwritten
構造化データ記録部38は、構造化データ変換部36から入力された構造化データを記録する。構造化データ記録部38には、例えば不揮発性ストレージ27が用いられる。
The structured
構造化データ出力部39は、構造化データ変換部36から出力された又は構造化データ記録部38から読み出した構造化データを、表示部25等へ出力する。
The structured
[画像処理装置の動作]
図4は、第1の実施形態に係る画像処理装置が適用されたクライアント端末1の動作を示すフローチャートである。コンピューター20のCPU21が、ROM22に格納されたプログラムを実行することにより図4のフローチャートの処理が実現される。
[Operation of image processing device]
FIG. 4 is a flowchart showing the operation of the
まず、入力画像受信部31は、印刷文書に手書きでメモを加えた紙文書Pをスキャナ4もしくはカメラ5等の電子画像化手段で電子画像化した画像データを、入力画像として受信する(S1)。入力画像の例を図5に示す。
First, the input
図5は、手書き文字を含む入力画像の例を示す。
図5の入力画像Dの場合、印字領域40の「2017年4月:リリース」と印字された行の下に、「遅すぎる!」という文字が手書きで追加されている。左斜め上を向いた矢印と「遅すぎる!」という文字を含む領域を、手書き領域41とする。
FIG. 5 shows an example of an input image including handwritten characters.
In the case of the input image D of FIG. 5, the characters "too late!" Are added by hand below the line printed with "April 2017: Release" in the
次に、領域判別部33は、この入力画像を走査して領域判別処理を実施し、文字領域、図形領域、写真領域を判別する(S2)。判別結果を図6に示す。
Next, the
図6は、入力画像に対し領域判別処理を実施した結果を示す。
破線の枠が図形領域Ag、実線の枠が文字領域Atとして判別されている。図6の例では、写真領域は存在しない。手書き領域41では、矢印が図形領域42に、手書き文字が文字領域43に判別される。
FIG. 6 shows the result of performing the area discrimination processing on the input image.
The broken line frame is determined as the graphic area Ag, and the solid line frame is determined as the character area At. In the example of FIG. 6, there is no photographic area. In the
次に、領域判別部33は、領域判別処理の結果が文字領域であるか否かを判定し(S3)、文字領域以外の領域である場合(S3のNO)にはステップS4へ進み、文字領域である場合(S3のYES)にはステップS6へ進む。
Next, the
次に、構造化データ変換部36の本体属性変換部361は、領域判別部33により判別された文字以外の領域(図形領域、写真領域)に対して認識処理を実施し(S4)、構造化データの本体属性に変換する(S5)。ステップS5の処理が終了後、ステップS11へ進む。
Next, the main body attribute conversion unit 361 of the structured
次に、領域判別処理の結果が文字領域である場合(S3のYES)には、文字種別判別部34による文字種別判別処理を実施する(S6)。文字種別判別処理のフローチャート(サブルーチン)を図7に示す Next, when the result of the area discrimination process is the character area (YES in S3), the character type discrimination process is performed by the character type discrimination unit 34 (S6). FIG. 7 shows a flowchart (subroutine) of the character type discrimination process.
[文字種別判別処理]
図7は、図4のステップS5の文字種別判別処理を示すフローチャートである。
[Character type discrimination processing]
FIG. 7 is a flowchart showing the character type discrimination process of step S5 of FIG.
まず文字種別判別部34に、入力画像Dの文字領域が入力される(S21)。次に、文字種別判別部34の印字文字認識処理部341は、文字領域と判別された画像に対して印字文字認識処理(S22)を実施し、印字文字認識度を算出する。
First, the character area of the input image D is input to the character type determination unit 34 (S21). Next, the print character
また、文字種別判別部34の手書き文字認識処理部342は、文字領域と判別された画像に対して手書き文字認識処理(S23)を実施し、手書き文字認識度を算出する。
Further, the handwritten character
次に、手書き文字判定部343は、印字文字認識処理部341で算出された印字文字認識度と、手書き文字認識処理部342で算出された手書き文字認識度を比較する(S24)。ここで、印字文字認識度をOCRS、手書き文字認識度をICRSとする。
Next, the handwritten
印字文字認識度(OCRS)が手書き文字認識度(ICRS)よりも大きい場合には(S24のYES)、手書き文字判定部343は、文字領域に含まれる文字は印字文字であると判定する(S25)。
When the printed character recognition degree (OCRS) is larger than the handwritten character recognition degree (ICRS) (YES in S24), the handwritten
一方、印字文字認識度(OCRS)が手書き文字認識度(ICRS)以下である場合には(S24のNO)、手書き文字判定部343は、文字領域に含まれる文字は手書き文字であると判定する(S26)。
On the other hand, when the printed character recognition degree (OCRS) is equal to or lower than the handwritten character recognition degree (ICRS) (NO in S24), the handwritten
次に、ステップS25,S26により印字文字又は手書き文字と判定された文字に対して、それぞれに文字コード化処理部35が文字コード化処理を行う(S27)。ステップS27の処理とステップS22,S23の処理を順不同とすることができる。ステップS27の処理が終了後、図4のステップS7に進む。
Next, the character
なお、文字コード化処理部35の機能を、印字文字認識処理部341及び手書き文字認識処理部342が備えていてもよい。即ち、印字文字認識処理部341及び手書き文字認識処理部342がそれぞれの文字認識を実施する際に、文字コード化処理を実施してもよい。ここで、文字種別判別結果の例を図8に示す。
The printed character
図8は、入力画像Dの文字領域に対し文字種別判別処理を実施した結果である。手書き文字を含む文字領域はドットで塗りつぶしてある。 FIG. 8 shows the result of performing the character type discrimination processing on the character area of the input image D. The character area including handwritten characters is filled with dots.
図8において、ドットで図6の文字領域43がドットで塗りつぶされており、文字領域43の文字が手書き文字(手書き文字部43A)と判別されたことがわかる。この判別結果を元に、構造化データへの変換が行われる。
In FIG. 8, it can be seen that the
構造化データとは、OOXMLやODF、PDF(登録商標)等のフォーマットで記述されたデータのことである。 Structured data is data described in a format such as OOXML, ODF, or PDF (registered trademark).
OOXML(Office Open XML, OpenXML)は、XMLをベースとしたオフィススイート用のファイルフォーマットである。Microsoft Word(登録商標)、Microsoft Excel(登録商標)、Power Pointは、OOXMLに準拠している。
ODF(Open Document Format)は、ワープロ文書や表計算ソフトのワークシートなど、オフィスソフトの扱う文書ファイルを保存するためのXMLベースのオープンなファイルフォーマットである。
PDF(Portable Document Format)とは、Adobe Systems社によって開発された、電子文書のためのフォーマットである。PDF形式のファイルには文字情報だけでなく、フォントや文字の大きさ、字飾り、埋め込まれた画像、それらのレイアウトなどの情報を保存できる。
OOXML (Office Open XML, OpenXML) is an XML-based file format for office suites. Microsoft Word (registered trademark), Microsoft Excel (registered trademark), and Power Point are OOXML compliant.
ODF (Open Document Format) is an XML-based open file format for storing document files handled by office software such as word processing documents and spreadsheets of spreadsheet software.
PDF (Portable Document Format) is a format for electronic documents developed by Adobe Systems. In the PDF format file, not only character information but also information such as font, character size, character decoration, embedded image, and their layout can be stored.
図4のフローチャートの説明に戻る。文字種別判別部34の手書き文字判定部343により、入力画像Dの文字領域が手書き文字であるか否かを判定する(S7)。手書き文字ではない場合(S7のNO)、構造化データ変換部36の本体属性変換部361は、印字文字と判別された文字列を構造化データの本体属性に変換する(S8)。ステップS8の処理が終了後、ステップS11へ進む。
Returning to the description of the flowchart of FIG. The handwritten
一方、入力画像Dの文字領域が手書き文字である場合(S7のYES)、構造化データ変換部36の補足属性変換部362は、手書き文字と判別された文字列を構造化データの補足属性に変換する(S9)。
On the other hand, when the character area of the input image D is a handwritten character (YES in S7), the supplementary
以下、構造化データの補足属性の例として、Microsoft OfficeのPowerPointのノート属性に変換する場合について説明する。図9にPowerPointファイルをアプリケーションで開いた表示例を示す。 The following describes the case of converting to the PowerPoint note attribute of Microsoft Office as an example of the supplementary attribute of structured data. FIG. 9 shows a display example in which a PowerPoint file is opened by an application.
(アプリケーションの表示例)
図9は、第1の実施形態に係るPowerPointファイルをアプリケーションにより開いたときの表示例である。
(Application display example)
FIG. 9 is a display example when the PowerPoint file according to the first embodiment is opened by an application.
図9に示すアプリケーション画面50には、ホームメニュー51や校閲メニュー52などの複数のメニューが用意されている。それらの複数のメニューの下側に本体属性に対応する本体領域53と、本体領域53の下側に補足属性に対応するノート領域54が設けられている。本体領域53は、アプリケーション画面50の中央において広い面積を占める。このファイルフォーマットは、ISO29500で標準化されたXML形式のフォーマットである。
The
(ファイルフォーマットの構造例)
図10は、ノート属性を含む一般的なPowerPointファイルのファイルフォーマットの構造例を示す。
(File format structure example)
FIG. 10 shows a structural example of a file format of a general PowerPoint file including note attributes.
図9に示した本体領域53のオブジェクトは‘slides’フォルダ61(本体属性ディレクトリ)内の‘slide1.xml’に記述され、ノート領域54の文字列は‘notesSlides’フォルダ62(ノート属性ディレクトリ)内の‘notesSlide1.xml’に記述される。
The object of the
図4のフローチャートの説明に戻る。次に、手書き文字置換部37は、構造化データの手書き文字部が存在した本体領域の手書き文字部を、手書き文字が存在したことを表す情報(構造化データ)に置き換える(S10)。構造化データ変換部36は、これらの構造化データを、構造化データ記録部38に記録する。
Returning to the description of the flowchart of FIG. Next, the handwritten
次に、構造化データ出力部39は、ユーザーの指示に応じて、構造化データ記録部38に記録された構造化データを出力する。例えば、構造化データ出力部39は、アプリケーションにより表示部25に構造化データを表示する(S11)。ステップS11の処理が終了したら本フローチャートの処理を終了する。
Next, the structured
[手書き文字が存在していたことを表す情報の例]
手書き文字が存在した本体領域53の手書き文字部に作成する、手書き文字が存在したことを表す情報の例について説明する。
[Example of information indicating that handwritten characters existed]
An example of information indicating that a handwritten character exists, which is created in the handwritten character portion of the
[第1例]
図11は、第1の実施形態の第1例に係る、手書き文字をPowerPointファイルのノート領域に配置したアプリケーション画面の表示例を示す。
[First example]
FIG. 11 shows a display example of an application screen in which handwritten characters are arranged in a note area of a PowerPoint file according to the first example of the first embodiment.
図11のアプリケーション画面50Aでは、「遅すぎる!」と書かれた手書き文字列541をノート領域54に配置する。また、本体領域53の文書画像530Aの手書き文字列が存在していた部分(手書き文字部531)に、ノート領域54に配置された手書き文字列541との対比が取れる情報(図11の例では★の記号)を配置する。図11では、本体領域53の文書画像530Aに配置した手書き文字が存在したことを表す情報(★)と同じ情報が、ノート領域54にも配置されている。これによりユーザーは、ノート領域54の文字列と本体領域53の手書き文字部531との対応関係を、容易に認識することができる。
In the
また、記号だけではそこに手書き文字列が存在していたことをユーザーが見逃す可能性があるため、手書き文字列が存在していたことを表す文字列も追加し配置してもよい。例えば図11では、手書き文字部531に「手書き有」の文字列が配置されている。このおうに、手書き文字が存在したことを表す情報との関連性を示す情報を、本体領域53又はノート領域54(補足領域)の少なくともいずれか一方に配置するとよい。
In addition, since the user may overlook the existence of the handwritten character string only with the symbol, a character string indicating that the handwritten character string existed may be added and arranged. For example, in FIG. 11, a character string of “with handwriting” is arranged in the
[第2例]
第2例では、紙文書に手書き文字が複数存在していた場合には、複数の手書き文字が存在していたことを表す情報と、該手書き文字が存在していたことを表す情報との関連性を示す情報の各々に、対応関係を表す情報を付加する。例えば、紙文書に加筆された手書き文字列が多数存在する場合には、‘記号+通し番号’としてもよい。
[Second example]
In the second example, when a plurality of handwritten characters exist in the paper document, the relationship between the information indicating that the plurality of handwritten characters existed and the information indicating that the handwritten characters existed. Information indicating the correspondence is added to each of the information indicating the sex. For example, when there are many handwritten character strings added to a paper document, it may be'symbol + serial number'.
図12は、第1の実施形態の第2例に係る、手書き文字をPowerPointファイルのノート領域に配置したアプリケーション画面の表示例を示す。 FIG. 12 shows a display example of an application screen in which handwritten characters are arranged in a note area of a PowerPoint file according to a second example of the first embodiment.
図12のアプリケーション画面50Bでは、ノート領域54に2つの手書き文字列541a,541bが存在し、本体領域53の文書画像530Bにも2箇所に手書き文字部531a,531bが存在する。そして、ノート領域54の手書き文字列541a,541bに対応する本体領域53の手書き文字部531a,531bの前に、‘★1’,‘★2’の記号が配置されている。
In the
また、本体領域53に追加する文字列は、元から本体領域53に存在する他の情報(印字文字列等)と区別できるように、文字色、文字サイズ、文字の太さ、斜体などの異なる装飾で追加してもよい。図12の例では、文字列が斜体で表示されている。
Further, the character string added to the
[第1の実施形態の効果]
上述した構成の本発明によれば、印字文字と手書き文字が混在した紙文書を電子画像化し、その電子画像をベクタライズ処理して清書化されたファイルフォーマットに変換する処理において、印字文字と手書き文字を容易に判別できるようになる。
[Effect of the first embodiment]
According to the present invention having the above-described configuration, in the process of converting a paper document in which printed characters and handwritten characters are mixed into an electronic image and vectorizing the electronic image into a clean copy file format, the printed characters and the handwritten characters are converted. Can be easily identified.
<2.第2の実施形態>
第1の実施形態に係る構造化データの別の補足属性の例として、手書き文字をMicrosoft OfficeのPowerPointのコメント属性に変換する場合について説明する。
<2. Second embodiment>
As an example of another supplementary attribute of the structured data according to the first embodiment, a case where handwritten characters are converted into a comment attribute of PowerPoint of Microsoft Office will be described.
[第1例]
図13は、第2の実施形態の第1例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。
[First example]
FIG. 13 shows a display example of an application screen in which handwritten characters are arranged in a comment area of a PowerPoint file according to the first example of the second embodiment.
図12のアプリケーション画面70Aにおいて、本体領域73の文書画像730Aの手書き文字が存在していた部分(手書き文字部531)に、透明オブジェクト731aを配置する。また、配置した透明オブジェクト731aに関連するコメントとして、手書き文字列「遅すぎる!」をコメント領域75のコメント欄751に追加する。コメント表示ボタン521をマウスポインタ等で押すことにより、コメント領域75が表示される。
In the
透明オブジェクト731aは、非可視文字コード(空白、タブ)でもよいし、透明な図形オブジェクトでもよい。
The
またコメント欄751の「遅すぎる!」の左側にクライアント端末1のユーザー名(KUROKI)が表示されているが、操作部26を操作して後から手書きコメントを加筆したユーザー名を入力してもよい。あるいは、コメント欄751にユーザー名を表示しなくてもよい。
Also, the user name (KUROKI) of the
コメント機能を利用すると、アプリケーションが自動でコメント領域75にコメントが存在することを表すマーク732a(記号、図形等)を本体領域73の対応する場所に表示し、コメント欄751の手書き文字列との関連を示すことが可能である。本体領域73の対応する場所とは、手書き文字部531に対応する位置である。
When the comment function is used, the application automatically displays a
図13において、本体領域73の文書画像730Aに透明オブジェクト731a及びマーク732aが配置され、そこにコメントがあることがアプリケーションにより示されている。また図13において、透明オブジェクト731a及びマーク732aに関連するコメントとして、手書き文字列がコメント領域75のコメント欄751に追加されている。
In FIG. 13, the application indicates that the
(ファイルフォーマットの構造例)
図14は、コメント属性を含む一般的なPowerPointファイルのファイルフォーマットの構造例を示す。
(File format structure example)
FIG. 14 shows a structural example of a file format of a general PowerPoint file including a comment attribute.
図13に示した本体領域73の透明オブジェクト731aは‘slides’フォルダ61(本体属性ディレクトリ)内の‘slide1.xml’に記述され、コメント領域75のコメントは‘comments’フォルダ63(コメント属性ディレクトリ)内の‘comment1.xml’に記述される。
The
[第2例]
図13の本体領域73に配置する透明オブジェクトは、手書き文字列があったことを表す可視文字列であってもよい。
[Second example]
The transparent object arranged in the
図15は、第2の実施形態の第2例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。 FIG. 15 shows a display example of an application screen in which handwritten characters are arranged in a comment area of a PowerPoint file according to a second example of the second embodiment.
図15のアプリケーション画面70Bでは、本体領域73の文書画像730Bの手書き文字部531に、マーク732aの横に可視文字列‘手書き有’からなるオブジェクト731bが配置されている。
In the application screen 70B of FIG. 15, an
このように本体領域73に可視文字列からなるオブジェクト731bを配置することにより、そこに手書き文字列が存在していたことをユーザーが見逃す可能性が減少する。
By arranging the
[第3例]
図16は、第2の実施形態の第3例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。
[Third example]
FIG. 16 shows a display example of an application screen in which handwritten characters are arranged in a comment area of a PowerPoint file according to a third example of the second embodiment.
図16のアプリケーション画面70Cでは、本体領域73の文書画像730Cの手書き文字部531に、可視文字列‘手書き有’からなるオブジェクト731bの右上に、マーク732cが配置されている。
In the
[第4例]
図17は、第2の実施形態の第4例に係る、手書き文字をPowerPointファイルのコメント領域に配置したアプリケーション画面の表示例を示す。
[4th example]
FIG. 17 shows a display example of an application screen in which handwritten characters are arranged in a comment area of a PowerPoint file according to a fourth example of the second embodiment.
図17のアプリケーション画面70Dでは、本体領域73の文書画像730Dの手書き文字部531にマーク732aのみが表示され、オブジェクトが配置されない又は透明オブジェクト731a(図13)が配置される。そして、コメント領域75のコメント欄751に、手書き文字列の存在を示す可視文字列751d‘手書き有’とともに、手書きコメント「遅すぎる!」が表示される。
In the application screen 70D of FIG. 17, only the
これにより、本体領域73にマーク732aのみを表示し、手書き文字列の存在を示す可視文字列を表示しなくても、ユーザーはコメント領域75に配置された可視文字列751d‘手書き有’を見ることにより、手書き文字の存在を認識することができる。
As a result, even if only the
[第5例]
図18は、第2の実施形態の第5例に係る、PowerPointファイルのコメント領域に表示された手書き文字情報の内容を削除したアプリケーション画面の表示例を示す。
[Example 5]
FIG. 18 shows a display example of the application screen in which the content of the handwritten character information displayed in the comment area of the PowerPoint file is deleted according to the fifth example of the second embodiment.
図18のアプリケーション画面70Eでは、本体領域73に図17と同じ文書画像730Dを表示しているが、コメント領域75のコメント欄751のコメントが削除されている。
In the
Microsoft Office等のXMLベースの文書作成アプリケーションの機能として、補足領域(ノート領域やコメント領域)の文字列を一括で削除する一括削除機能が用意されている。手書き文字列を補足領域に配置した場合に、この一括削除機能を利用することで、手書き文字列を含まない形で文書配布したいという要望にも簡単に対応可能となる。本例は、第1の実施形態にも適用可能である。 As a function of an XML-based document creation application such as Microsoft Office, a batch deletion function for deleting character strings in a supplementary area (note area or comment area) at once is provided. When the handwritten character string is placed in the supplementary area, by using this batch deletion function, it is possible to easily respond to the request to distribute the document in a form that does not include the handwritten character string. This example is also applicable to the first embodiment.
<3.第3の実施形態>
PDFやMicrosoft Wordの機能にも同様のコメント機能(注釈機能)があり、この機能を使ってそれぞれのフォーマットに変換することで、第1及び第2の実施形態と同様の効果を持たせることが可能である。
<3. Third Embodiment>
The PDF and Microsoft Word functions also have a similar comment function (annotation function), and by converting to each format using this function, it is possible to have the same effect as in the first and second embodiments. It is possible.
図19は、第3の実施形態に係る、手書き文字をPDFファイルの注釈領域に配置したアプリケーション画面の表示例を示す。 FIG. 19 shows a display example of the application screen in which the handwritten characters are arranged in the annotation area of the PDF file according to the third embodiment.
図19のアプリケーション画面70Eでは、本体領域に対応する文書画像80の手書き文字部531に、図形や記号等からなる注釈アイコン81が配置され、注釈アイコン81と紐付けられたポップアップウィンドウ82が表示される。ポップアップウィンドウ82は補足属性に対応する補足領域である。ポップアップウィンドウ82に、手書き文字列‘遅すぎる!’が配置される。
In the
PDFの場合は、ページ毎のページオブジェクトのAnnots配列に手書き文字列(注釈データ)を登録することで実現可能である。 In the case of PDF, it can be realized by registering a handwritten character string (annotation data) in the Annots array of the page object for each page.
上述した第3の実施形態によれば、PDFファイルを用いた場合でも、第1の実施形態及び第2の実施形態と同様の作用効果を奏する。 According to the third embodiment described above, even when the PDF file is used, the same effects as those of the first embodiment and the second embodiment are obtained.
なお、PDFの場合でも、注釈アイコン81の近くに可視文字列(例えば‘手書き文字有’)からなるオブジェクトを配置してもよい。
Even in the case of PDF, an object composed of a visible character string (for example,'with handwritten characters') may be placed near the
<4.第4の実施形態>
この構造化データ変換機能を実装するアプリケーション(クライアント端末1や画像形成装置3など)に、出力形態を選択可能なUIを持たせる。そして、手書き文字列を「ノート領域に配置」、「コメント領域に配置」、「本体領域に配置」、「完全に削除してどこにも配置しない」などの選択肢をユーザーが選択することも可能である。
<4. Fourth Embodiment>
An application (such as a
図20は、第4の実施形態に係る画像処理装置が備えるコンピューター20Aの機能構成を示す。ここでは、画像処理装置をクライアント端末1に適用した例について説明する。
FIG. 20 shows the functional configuration of the
図20のコンピューター20Aは、図3のコンピューター20に対して出力形態設定部90を備える点が異なる。
The
出力形態設定部90は、スキャナ4等の電子画像化手段により得られた電子データを、どのフォーマット(データ形式)の構造化データに変換するか選択を促すフォーマット選択画面(図示略)を表示部25に表示する。次に、出力形態設定部90は、選択されたフォーマットが複数の出力形態(手書き文字列の配置態様)を備える場合には、上記の出力形態を選択させる出力形態選択画面(図示略)を表示する。そして、出力形態設定部90は、ユーザーの選択に基づく出力形態で、手書き文字列をアプリケーション画面に出力する。
The output
なお、出力形態設定部90は、「完全に削除してどこにも配置しない」が選択された場合には、ベクタライズ処理時に手書き文字以外の情報(例えば図形領域42として判別された矢印)も含めて変換後の構造化データに加筆した情報を反映しない。このようにすることで、手書き情報を含まない形で文書を他ユーザーと共有、配布することができる。
When "Completely delete and do not place anywhere" is selected, the output
<5.その他>
なお、スキャナ4及びカメラ5等の電子画像化手段であっても、図2に示すようなコンピューターを搭載していれば、画像処理装置を適用することが可能である。
<5. Others>
Even if the electronic imaging means such as the
さらに、本発明は上述した各実施形態例に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、その他種々の応用例、変形例を取り得ることは勿論である。 Furthermore, the present invention is not limited to the above-described embodiments, and it goes without saying that various other application examples and modifications can be taken as long as the gist of the present invention described in the claims is not deviated. is there.
例えば、上述した実施形態例は本発明を分かりやすく説明するために装置及びシステムの構成を詳細且つ具体的に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態例の構成の一部を他の実施形態例の構成に置き換えることは可能である。また、ある実施形態例の構成に他の実施形態例の構成を加えることも可能である。また、各実施形態例の構成の一部について、他の構成の追加、削除、置換をすることも可能である。 For example, the above-described embodiment describes the configurations of the apparatus and the system in detail and concretely in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to those including all the described configurations. .. In addition, it is possible to replace a part of the configuration of one embodiment with the configuration of another embodiment. It is also possible to add the configuration of another embodiment to the configuration of one embodiment. Further, it is also possible to add, delete, or replace a part of the configuration of each embodiment with another configuration.
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、又はICカード、SDカード、DVD等の記録媒体に置くことができる。 Further, each of the above configurations, functions, processing units, processing means and the like may be realized by hardware by designing a part or all of them by, for example, an integrated circuit. Further, each of the above configurations, functions, and the like may be realized by software by the processor interpreting and executing a program that realizes each function. Information such as programs, tables, and files that realize each function can be placed in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD.
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。 In addition, the control lines and information lines indicate those that are considered necessary for explanation, and do not necessarily indicate all the control lines and information lines in the product. In practice, it can be considered that almost all configurations are interconnected.
また、本明細書において、時系列的な処理を記述する処理ステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)をも含むものである。 Further, in the present specification, the processing steps for describing the time-series processing are not necessarily the processing performed in the time-series according to the described order, but are parallel or individual. It also includes processing executed in (for example, parallel processing or processing by an object).
1…クライアント端末、 4…スキャナ、 5…カメラ、 10…システム、 21…CPU、 27…不揮発性ストレージ、 31…入力画像受信部、 33…領域判別部、 34…文字種別判別部、 35…文字コード化処理部、 36…構造化データ変換部、 37…手書き文字置換部、 39…構造化データ出力部、 40…印字文字領域、 41…手書き領域、 42…図形領域、 43…文字領域、 43A…手書き文字部、 53…本体領域、 54…ノート領域、 61…本体属性フォルダ、 62…ノート属性フォルダ、 63…コメント属性フォルダ、 73…本体領域、 74…補正領域、 75…コメント領域、 361…本体属性変換部、 362…補正属性変換部、 521…コメント表示ボタン、 531,531a,531b…手書き文字部、 541,541a,541b…手書き文字列、751…コメント欄、 P…紙文書、 D…画像データ 1 ... Client terminal, 4 ... Scanner, 5 ... Camera, 10 ... System, 21 ... CPU, 27 ... Non-volatile storage, 31 ... Input image receiver, 33 ... Area discriminator, 34 ... Character type discriminator, 35 ... Character Coding processing unit, 36 ... Structured data conversion unit, 37 ... Handwritten character replacement unit, 39 ... Structured data output unit, 40 ... Printed character area, 41 ... Handwritten area, 42 ... Graphic area, 43 ... Character area, 43A ... Handwritten character part, 53 ... Main body area, 54 ... Note area, 61 ... Main body attribute folder, 62 ... Note attribute folder, 63 ... Comment attribute folder, 73 ... Main body area, 74 ... Correction area, 75 ... Comment area, 361 ... Body attribute conversion unit, 362 ... Correction attribute conversion unit, 521 ... Comment display button, 531, 531a, 531b ... Handwritten character part, 541, 541a, 541b ... Handwritten character string, 751 ... Comment field, P ... Paper document, D ... image data
Claims (10)
前記領域判別部により判別された前記文字領域を解析し、前記文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する文字種別判別部と、
前記印字文字及び前記手書き文字を文字コード化する文字コード化処理部と、
前記領域判別部により判別された前記文字以外の領域、及び、文字コード化した前記印字文字を含む文字領域を構造化データの本体属性に変換する構造化データ変換部と、
文字コード化された前記手書き文字を前記構造化データの補足属性に変換する補足属性変換部と、
前記文字種別判別部により判定された前記手書き文字が存在した前記本体属性に対応する本体領域の手書き文字部を、前記手書き文字が存在したことを表す情報に置き換える手書き文字置換部と、を備え、
前記本体領域に配置した前記手書き文字が存在したことを表す情報と同じ情報を、前記補足属性に対応する補足領域にも配置する
画像処理装置。 An area determination unit that analyzes the image data obtained by reading a handwritten paper document and discriminates between the character area and the non-character area included in the image data.
A character type determination unit that analyzes the character area determined by the area determination unit and determines whether the character existing in the character area is a printed character or a handwritten character.
A character encoding processing unit that converts the printed characters and the handwritten characters into character codes,
A structured data conversion unit that converts an area other than the character determined by the area determination unit and a character area including the character-encoded printed character into the main body attribute of the structured data.
A supplementary attribute conversion unit that converts the character-encoded handwritten characters into supplementary attributes of the structured data, and
It is provided with a handwritten character replacement unit that replaces the handwritten character unit of the main body area corresponding to the main body attribute in which the handwritten character determined by the character type determination unit exists with information indicating that the handwritten character exists .
An image processing device that arranges the same information as the information indicating that the handwritten character arranged in the main body area exists in the supplementary area corresponding to the supplementary attribute .
前記領域判別部により判別された前記文字領域を解析し、前記文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する文字種別判別部と、
前記印字文字及び前記手書き文字を文字コード化する文字コード化処理部と、
前記領域判別部により判別された前記文字以外の領域、及び、文字コード化した前記印字文字を含む文字領域を構造化データの本体属性に変換する構造化データ変換部と、
文字コード化された前記手書き文字を前記構造化データの補足属性に変換する補足属性変換部と、
前記文字種別判別部により判定された前記手書き文字が存在した前記本体属性に対応する本体領域の手書き文字部を、前記手書き文字が存在したことを表す情報に置き換える手書き文字置換部と、を備え、
前記手書き文字が存在したことを表す情報との関連性を示す情報を、前記本体領域及び前記補足属性に対応する補足領域の少なくともいずれか一方に配置し、前記手書き文字が複数存在していた場合には、複数の前記手書き文字が存在していたことを表す情報と、前記手書き文字が存在していたことを表す情報との関連性を示す情報の各々に、対応関係を表す情報を付加する
画像処理装置。 An area determination unit that analyzes the image data obtained by reading a handwritten paper document and discriminates between the character area and the non-character area included in the image data.
A character type determination unit that analyzes the character area determined by the area determination unit and determines whether the character existing in the character area is a printed character or a handwritten character.
A character encoding processing unit that converts the printed characters and the handwritten characters into character codes,
A structured data conversion unit that converts an area other than the character determined by the area determination unit and a character area including the character-encoded printed character into the main body attribute of the structured data.
A supplementary attribute conversion unit that converts the character-encoded handwritten characters into supplementary attributes of the structured data, and
It is provided with a handwritten character replacement unit that replaces the handwritten character unit of the main body area corresponding to the main body attribute in which the handwritten character determined by the character type determination unit exists with information indicating that the handwritten character exists .
When information indicating the relevance to the information indicating the existence of the handwritten character is arranged in at least one of the main body area and the supplementary area corresponding to the supplementary attribute, and a plurality of the handwritten characters are present. Is added with information indicating a correspondence relationship to each of the information indicating the existence of the plurality of handwritten characters and the information indicating the relevance of the information indicating the existence of the handwritten characters. Image processing device.
請求項1に記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the information indicating the presence of the handwritten character in the main body area is decorated so as to be distinguishable from other information existing in the main body area.
請求項2に記載の画像処理装置。The image processing apparatus according to claim 2.
請求項1又は2に記載の画像処理装置。 The image processing according to claim 1 or 2 , wherein the supplementary area corresponding to the supplementary attribute is an area defined by the comment attribute of the structured data or an area defined by the note attribute used in the document creation software. apparatus.
請求項5に記載の画像処理装置。 The image processing apparatus according to claim 5 , wherein the structured data used in the document creation software is data described in an OOXML or ODF format.
請求項1又は2に記載の画像処理装置。 The image processing apparatus according to claim 1 or 2 , wherein when the structured data is data described in PDF (registered trademark), the annotation function defined by the Annots array is used for the supplementary attribute.
請求項1乃至7のいずれかに記載の画像処理装置。 The image processing apparatus according to any one of claims 1 to 7 , wherein the information indicating the existence of the handwritten character is at least one of a symbol, a character string, a figure, and an image.
に含まれる文字領域と文字以外の領域を判別する手順と、
判別された前記文字領域を解析し、前記文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する手順と、
前記印字文字及び前記手書き文字を文字コード化する手順と、
判別された前記文字以外の領域、及び、文字コード化した前記印字文字を含む文字領域を構造化データの本体属性に変換する手順と、
文字コード化された前記手書き文字を前記構造化データの補足属性に変換する手順と、
前記手書き文字が存在した前記本体属性に対応する本体領域の手書き文字部を、前記手書き文字が存在したことを表す情報に置き換える手順と、
前記本体領域に配置した前記手書き文字が存在したことを表す情報と同じ情報を、前記補足属性に対応する補足領域にも配置する手順と、
をコンピューターに実行させるためのプログラム。 A procedure for analyzing image data obtained by reading a handwritten paper document and determining a character area and a non-character area included in the image data, and
A procedure for analyzing the determined character area and determining whether the character existing in the character area is a printed character or a handwritten character.
The procedure for character-coding the printed characters and the handwritten characters, and
A procedure for converting the identified area other than the character and the character area including the character-encoded printed character into the main body attribute of the structured data, and
The procedure for converting the character-encoded handwritten character into the supplementary attribute of the structured data, and
A procedure for replacing the handwritten character portion of the main body area corresponding to the main body attribute in which the handwritten character exists with information indicating that the handwritten character exists, and
A procedure for arranging the same information as the information indicating that the handwritten character arranged in the main body area exists in the supplementary area corresponding to the supplementary attribute, and
A program that lets your computer run.
に含まれる文字領域と文字以外の領域を判別する手順と、
判別された前記文字領域を解析し、前記文字領域に存在する文字が印字文字又は手書き文字のいずれであるかを判定する手順と、
前記印字文字及び前記手書き文字を文字コード化する手順と、
判別された前記文字以外の領域、及び、文字コード化した前記印字文字を含む文字領域を構造化データの本体属性に変換する手順と、
文字コード化された前記手書き文字を前記構造化データの補足属性に変換する手順と、
前記手書き文字が存在した前記本体属性に対応する本体領域の手書き文字部を、前記手書き文字が存在したことを表す情報に置き換える手順と、
前記手書き文字が存在したことを表す情報との関連性を示す情報を、前記本体領域及び前記補足属性に対応する補足領域の少なくともいずれか一方に配置し、前記手書き文字が複数存在していた場合には、複数の前記手書き文字が存在していたことを表す情報と、前記手書き文字が存在していたことを表す情報との関連性を示す情報の各々に、対応関係を表す情報を付加する手順と、
をコンピューターに実行させるためのプログラム。 A procedure for analyzing image data obtained by reading a handwritten paper document and determining a character area and a non-character area included in the image data, and
A procedure for analyzing the determined character area and determining whether the character existing in the character area is a printed character or a handwritten character.
The procedure for character-coding the printed characters and the handwritten characters, and
A procedure for converting the identified area other than the character and the character area including the character-encoded printed character into the main body attribute of the structured data, and
The procedure for converting the character-encoded handwritten character into the supplementary attribute of the structured data, and
A procedure for replacing the handwritten character portion of the main body area corresponding to the main body attribute in which the handwritten character exists with information indicating that the handwritten character exists, and
When information indicating the relevance to the information indicating the existence of the handwritten character is arranged in at least one of the main body area and the supplementary area corresponding to the supplementary attribute, and a plurality of the handwritten characters are present. Is added information indicating a correspondence relationship to each of the information indicating the existence of the plurality of handwritten characters and the information indicating the relationship between the information indicating the existence of the handwritten characters. Procedure and
A program that lets your computer run.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016168417A JP6780380B2 (en) | 2016-08-30 | 2016-08-30 | Image processing equipment and programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016168417A JP6780380B2 (en) | 2016-08-30 | 2016-08-30 | Image processing equipment and programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018036794A JP2018036794A (en) | 2018-03-08 |
JP6780380B2 true JP6780380B2 (en) | 2020-11-04 |
Family
ID=61564645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016168417A Active JP6780380B2 (en) | 2016-08-30 | 2016-08-30 | Image processing equipment and programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6780380B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111782839B (en) * | 2020-06-30 | 2023-08-22 | 北京百度网讯科技有限公司 | Image question-answering method, device, computer equipment and medium |
JP7429374B2 (en) | 2021-10-31 | 2024-02-08 | 株式会社Datafluct | Information processing system, information processing method, and information processing program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092027A (en) * | 2004-09-21 | 2006-04-06 | Fuji Xerox Co Ltd | Capital letter recognizing device, capital letter recognizing method and capital letter recognizing program |
JP5181631B2 (en) * | 2006-12-28 | 2013-04-10 | コニカミノルタビジネステクノロジーズ株式会社 | Image forming apparatus, electronic document data creation method, and electronic document data creation program |
-
2016
- 2016-08-30 JP JP2016168417A patent/JP6780380B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018036794A (en) | 2018-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8045198B2 (en) | System and method for processing a change history of a PDF file | |
US20070220425A1 (en) | Electronic mail editing device, image forming apparatus, and electronic mail editing method | |
JP2006350867A (en) | Document processing device, method, program, and information storage medium | |
JP2007279828A (en) | Business form processor, business form format preparation device, business form, program for processing business form and program for preparing business form format | |
JP2006174462A (en) | Method and apparatus for information processing | |
JP6780380B2 (en) | Image processing equipment and programs | |
JP5712489B2 (en) | Image processing apparatus, image processing system, and program | |
US9117158B2 (en) | Image forming apparatus, image forming method, and non-transitory computer readable medium | |
JP6205973B2 (en) | Change history output device, program | |
US8896862B2 (en) | Image processing apparatus, control method, and storage medium for print control using metadata | |
US9588942B2 (en) | Information processing apparatus and information processing method | |
JP2017083996A (en) | Information processing device, control method and program thereof | |
JP5010520B2 (en) | Trimming range optimization method, apparatus and program | |
JP6656845B2 (en) | Handwritten content aggregation device and program | |
JP6682827B2 (en) | Information processing apparatus and information processing program | |
KR101458155B1 (en) | Apparatus and method for generating edited document | |
JP5935376B2 (en) | Copy machine | |
JP2009170979A (en) | Document management system, document management apparatus and program | |
JP2009140311A (en) | Document processing apparatus and method | |
JP2011135322A (en) | Image processing apparatus and control method thereof, and program | |
JP2008244612A (en) | Image processing apparatus and method | |
JP2010092141A (en) | Image processing system, image reader, image processor, and image processing program | |
JP2006293970A (en) | Image processor, image processing method and image processing program | |
JP2023047133A (en) | Information processing device, information processing system, and program | |
JP6432237B2 (en) | Image processing apparatus and image processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190521 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6780380 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |