JP4341620B2 - 記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法 - Google Patents

記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法 Download PDF

Info

Publication number
JP4341620B2
JP4341620B2 JP2005503672A JP2005503672A JP4341620B2 JP 4341620 B2 JP4341620 B2 JP 4341620B2 JP 2005503672 A JP2005503672 A JP 2005503672A JP 2005503672 A JP2005503672 A JP 2005503672A JP 4341620 B2 JP4341620 B2 JP 4341620B2
Authority
JP
Japan
Prior art keywords
entry
document
unit
information
embedded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005503672A
Other languages
English (en)
Other versions
JPWO2004084539A1 (ja
Inventor
明利 塚本
欽也 遠藤
昌彦 須崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Publication of JPWO2004084539A1 publication Critical patent/JPWO2004084539A1/ja
Application granted granted Critical
Publication of JP4341620B2 publication Critical patent/JP4341620B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3243Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of type information, e.g. handwritten or text document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • H04N2201/327Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs which are undetectable to the naked eye, e.g. embedded codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Description

【技術分野】
【0001】
本発明は、例えばアンケート調査票や答案用紙等の書面に記入された回答を自動的に抽出しデータ化するための記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法、記入用文書に関する。
【背景技術】
【0002】
従来、アンケート調査票や答案用紙等に記入された回答内容を抽出する方法として次のようなものがあった。
(1)マークシートを用いるもの(例えば、非特許文献1参照)。
(2)答案用紙をOCR装置を用いて回答を抽出するもの(例えば、特許文献1、2、非特許文献2参照)。
【特許文献1】
特開平8−315066号公報
【特許文献2】
特開平10−49593号公報
【非特許文献1】
Education Software Co., Ltd “OMIR-300”[online]、2002年、[2003年3月7日検索]、インターネット<URL:http://www.edsoft.co.jp/2/3/7/index.html>
【非特許文献2】
Media Drive Corporation “採点くん”[online]、 2001年、[2003年3月7日検索]、インターネット<URL:http://www.mediadrive.co.jp/products/solution/saiten/index.html>
【0003】
従来、アンケート調査票や答案用紙の書面に記入された内容をデータ化するためには、記入内容をキーボード入力するか、または、上記の(1)や(2)の方法を利用する必要があった。
しかしながら、キーボード入力を行うためにはオペレータの操作ミスが避けられないため、通常は入力を行うオペレータを2名用意して同一の内容をそれぞれが入力し、その結果を突き合わせて入力ミスを検出する、といった、いわゆる「ベリファイ方式」が用いられている。その結果、人件費がかさむ、また、手入力のため時間がかかるという問題があった。
【0004】
一方、上記従来の(1)の方法では、ドロップアウトカラーを用いて印刷した特殊な用紙(マークシート用紙)を用意する必要があり、そこに回答を記入させる必要があった。このような方式では、マークシート用紙は特殊なためコスト高となり、また、通常、このような方式では問題用紙と回答用マークシート用紙が別々に配布されるため物量が増えることでもコストを押し上げる要因となり、また、回答者にとっても回答欄を間違えやすいという問題があった。
【0005】
また、(2)の方法の場合は、用紙は普通紙でよく、問題用紙に回答欄を設けることもできるので、上記(1)のような方式に比べて低コストで扱いやすいものとなっている。また、手書き文字も認識しデータ化できる利点もある。しかしながら、一般に手書き文字認識の性能は低く(OCRのみによる精確な認識は非常に困難であり)、また、認識用辞書も用意しなければならないという問題があった。また、認識対象の文字位置や処理方法(どの設問に対する回答欄か)を表すフォーマット情報をシステムに保持しておく必要があり、例えば、問題作成者とデータ化業者が異なる場合(例えば、作成を外部に委託するような場合等)、このフォーマット情報をどうやって伝達するかが問題であった。また、このような方式では、文字認識を行うため、処理速度が遅いという問題があった。
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明は、前述の課題を解決するため、予め文書に設けた回答欄に関するフォーマット情報を作成し、また、文書に対する記入箇所を検出するための記入箇所検出情報を作成し、これらの情報を文書に埋め込むようにしたものである。即ち、本発明は、次のような構成を採用する。
【課題を解決するための手段】
【0007】
〈構成1〉
本発明は、所定の記入箇所を有する文書の文書画像データを作成する文書画像作成部と、文書上の記入箇所と記入内容とを示すフォーマット情報と、記入箇所に記入があったか否かを検出するための記入箇所検出情報である各記入箇所に記録されるシンボルユニット数とを文書画像データへの埋め込み情報として作成する埋め込み情報作成部と、文書画像データと埋め込み情報とを合成して、文書データを作成する文書データ作成部とを備え、文書データ作成部は、文書画像データから、所定のフィルタによって所定のシンボルを識別可能なシンボルユニットを埋め込むための埋め込み領域を算出し、該埋め込み領域に対して文字領域の割合が所定の閾値以下であるか否かを判断し、文字領域の割合が所定の閾値以下である場合に、埋め込み領域の文字領域と重ならない領域に、埋め込み情報を成すシンボルを識別可能なシンボルユニットを所定の数埋め込み、埋め込み領域の文字領域と重なる領域に背景ユニットを埋め込み、見かけの濃淡が均一となる透かし画像を形成することを特徴とする記入用文書作成装置である。
【0008】
〈構成2〉
また本発明は、所定の記入箇所を有する文書の文書画像データを作成する文書画像作成部と、文書上の記入箇所と記入内容とを示すフォーマット情報と、記入箇所に記入があったか否かを検出するための記入箇所検出情報とを文書画像データへの埋め込み情報として作成する埋め込み情報作成部と、文書画像データと埋め込み情報である各記入箇所に記録さるたシンボルユニット数とを一体の文書データとして記憶するデータ記憶部と、データ記憶部に記憶された文書画像データと埋め込み情報とを合成して文書データを作成し、かつ、文書データを印刷して記入用文書を出力する印刷処理装置とを備え、印刷処理装置は、文書画像データから、所定のフィルタによって所定のシンボルを識別可能なシンボルユニットを埋め込むための埋め込み領域を算出し、該埋め込み領域に対して文字領域の割合が所定の閾値以下であるか否かを判断し、文字領域の割合が所定の閾値以下である場合に、埋め込み領域の文字領域と重ならない領域に、埋め込み情報を成すシンボルを識別可能なシンボルユニットを所定の数埋め込み、埋め込み領域の文字領域と重なる領域に背景ユニットを埋め込み、見かけの濃淡が均一となる透かし画像を形成することを特徴とする記入用文書作成装置である。
【0009】
〈構成3〉
また本発明は、構成1または2に記載の記入用文書作成装置において、文書画像データに、ドットパターンで表される埋め込み情報を埋め込んで文書データを作成する文書データ作成部を備えたことを特徴とする記入用文書作成装置である。
【0010】
〈構成4〉
また本発明は、構成1〜3のいずれかに記載の記入用文書作成装置において、文書識別情報を含めて文書データを作成する文書データ作成部とを備えたことを特徴とする記入用文書作成装置である。
【0011】
〈構成5〉
また本発明は、記入用文書作成装置を用いて、所定の記入箇所を有する文書の文書画像データを作成する文書画像データ作成ステップと、記入箇所と記入内容とを示すフォーマット情報を作成するフォーマット情報作成ステップと、記入箇所に記入があったか否かを検出するための記入箇所検出情報である各記入箇所に記録されるシンボルユニット数を作成する記入箇所検出情報作成ステップと、文書画像データと、該文書画像データの埋め込み情報であるフォーマット情報と記入箇所検出情報とを一体の文書データとして作成する文書データ作成ステップとを実行し、文書データ作成ステップは、文書画像データから、所定のフィルタによって所定のシンボルを識別可能なシンボルユニットを埋め込むための埋め込み領域を算出し、該埋め込み領域に対して文字領域の割合が所定の閾値以下であるか否かを判断し、文字領域の割合が所定の閾値以下である場合に、埋め込み領域の文字領域と重ならない領域に、埋め込み情報を成すシンボルを識別可能なシンボルユニットを所定の数埋め込み、埋め込み領域の文字領域と重なる領域に背景ユニットを埋め込み、見かけの濃淡が均一となる透かし画像を形成することを特徴とする記入用文書作成方法である。
【0012】
〈構成6〉
また本発明は、構成5に記載の記入用文書作成方法において、文書データ作成ステップは、文書画像データに、ドットパターンで表される埋め込み情報を埋め込んで文書データを作成するステップであることを特徴とする記入用文書作成方法である。
【0013】
〈構成7〉
また本発明は、文書中の記入箇所の位置と記入箇所への記入内容を判定するためのフォーマット情報と、記入箇所に記入があったか否かを検出するための記入箇所検出情報である各記入箇所に記録されるシンボルユニット数とを一体に有する記入用文書から記入内容を抽出する記入内容抽出装置であって、記入文書に埋め込まれた記入用文書のフォーマット情報と記入箇所検出情報を取り出す埋め込み情報取出部と、フォーマット情報における記入位置の情報と、記入箇所検出情報とを用いて記入箇所を検出する記入箇所検出部と、検出した記入箇所とフォーマット情報の記入内容の判定情報とを用いて、記入内容を判定する回答データ変換部とを備え、記入箇所検出部は、埋め込み情報から所定のシンボルを識別可能な複数種類のフィルタを備え、各埋め込み領域ごとに、複数種類のフィルタによりマッチングを行い、一つのフィルタのマッチング数が他の全てのフィルタのマッチング数に比べて非常に大きい埋め込み領域から、一つのフィルタに対応する埋め込み情報を検出することを特徴とする記入内容抽出装置である。
【0014】
〈構成8〉
また本発明は、構成7に記載の記入内容抽出装置において、記入箇所検出情報はドットパターンで表され、記入箇所検出部は、ドットパターンの検出状態の変化に基づいて記入の有無を判定するよう構成されたことを特徴とする記入内容抽出装置である。
【0015】
〈構成9〉
また本発明は、構成7または8に記載の記入内容抽出装置において、自由記載欄を有する記入用文書に対して、自由記載欄への記入内容を目視確認するためのイメージ出力を行う目視情報出力部を備えたことを特徴とする記入内容抽出装置である。
【0016】
〈構成10〉
また本発明は、記入内容抽出装置を用いて、文書中の記入箇所の位置と記入箇所への記入内容を判定するためのフォーマット情報と、記入箇所に記入があったか否かを検出するための記入箇所検出情報である各記入箇所に記録されるシンボルユニット数とを一体に有する記入用文書から記入内容を抽出する記入内容抽出方法であって、記入用文書の埋め込み情報であるフォーマット情報と記入箇所検出情報を取り出す埋め込み情報取出ステップと、フォーマット情報における記入位置の情報と、記入箇所検出情報とを用いて記入箇所を検出する記入箇所検出ステップと、検出した記入箇所とフォーマット情報の記入内容の判定情報とを用いて、記入内容を判定する回答データ変換ステップとを備え、記入箇所検出ステップは、各埋め込み領域ごとに、複数種類のフィルタによりマッチングを行い、一つのフィルタのマッチング数が他の全てのフィルタのマッチング数に比べて非常に大きい埋め込み領域から、一つのフィルタに対応する埋め込み情報を検出するステップであることを特徴とする記入内容抽出方法である。
【0017】
〈構成11〉
また本発明は、構成10に記載の記入内容抽出方法において、記入箇所検出情報はドットパターンで表され、記入箇所検出ステップは、ドットパターンの検出状態の変化に基づいて記入の有無を判定するステップであることを特徴とする記入内容抽出方法である。
【0018】
〈構成12〉
また本発明は、構成10または11に記載の記入内容抽出方法において、自由記載欄を有する記入用文書に対して、自由記載欄への記入内容を目視確認するためのイメージ出力を行う目視情報出力ステップを備えたことを特徴とする記入内容抽出方法である。
【発明を実施するための最良の形態】
以下、本発明の実施の形態を具体例を用いて詳細に説明する。
《具体例1》
【0019】
〈構成〉
第1図は、本発明の記入用文書作成装置と記入内容抽出装置の具体例1を示す構成図である。
図において、100は記入用文書作成装置、200は記入内容抽出装置、300は、記入用文書を示している。記入用文書作成装置100は、文書作成部101、文書画像作成部102、埋め込み情報作成部103、文書データ作成部104、文書出力部105からなる。
【0020】
文書作成部101は、アンケート調査票といった文書(書面)を作成する機能部であり、例えば、一般的なワードプロセッサソフトウェアを用いて実現されるものである。文書画像作成部102は、文書作成部101で作成した文書のデータを画像データに変換する機能部である。これは、例えば文書の印刷イメージを画像として記録する画像化ソフトウェアを用いることにより実現することができる。埋め込み情報作成部103は、文書画像作成部102で画像化された文書データを用いて次の三つの情報からなる埋め込み情報を作成する機能部である。
1.記入箇所検出を行うための情報である「記入箇所検出情報」
2.回答欄の位置や設問番号との対応を示す「フォーマット情報」
3.文書の識別番号を示す「識別情報」
【0021】
文書データ作成部104は、上記埋め込み情報を、用紙上のドットパターン(地紋パターン)として記録し、文書の画像データとこれらの埋め込み情報を一体の文書データとして作成する機能部である。
文書出力部105は、例えばプリンタ等からなり、文書データ作成部104で作成された文書データを印刷して記入用文書300として出力する機能部である。
記入内容抽出装置200は、文書読み込み部201、埋め込み情報取り出し部202、記入箇所検出部203、回答データ変換部204、目視情報出力部205を備えている。
【0022】
文書読み込み部201は、スキャナを備え、回答記入済みの記入用文書300の画像を読み込み、このスキャン画像データを出力する機能部である。埋め込み情報取り出し部202は、文書読み込み部201から出力されたスキャン画像データから、埋め込み情報を取り出す機能部である。即ち、記入用文書作成装置100の埋め込み情報作成部103で作成された上記三つの情報(記入箇所検出情報、フォーマット情報、識別情報)を取り出す機能を有している。記入箇所検出部203は、埋め込み情報取り出し部202によって取り出された埋め込み情報の記入箇所検出情報とフォーマット情報とに基づいて、文書読み込み部201から出力されたスキャン画像データから記入箇所を検出する機能部である。
【0023】
回答データ変換部204は、記入箇所検出部203で検出された検出箇所の情報に対して、フォーマット情報を用いて回答内容に変換する機能部である。目視情報出力部205は、回答データ変換部204で得られた回答内容とスキャン画像とをディスプレイ等に出力し、オペレータが回答内容の変換結果が正しいか否かを目視確認するための目視情報を表示させるための機能部である。
【0024】
上記記入用文書作成装置100における文書作成部101〜文書データ作成部104、記入内容抽出装置200における文書読み込み部201〜目視情報出力部205は、それぞれ各機能に対応したソフトウェアと、これらソフトウェアを実行するための、CPUやメモリ等のハードウェアとによって実現されているものである。
【0025】
〈動作〉
次に、具体例1の動作を、記入用文書作成装置100と記入内容抽出装置200の動作に分けて説明する。尚、具体例1における記入用文書300はアンケート調査票であるとして以下の動作を説明する。
【0026】
[記入用文書作成装置100の動作]
第2図は、具体例1の記入用文書作成装置100の動作を示すフローチャートである。
先ず、文書作成部101により調査票の書面を作成する(ステップS1)。即ち、設問と回答欄とを含む書面を作成する。次に、文書画像作成部102は、文書作成部101で作成された書面データを画像データに変換し、調査票画像を作成する(ステップS2)。
【0027】
第3図は、作成した調査票画像の説明図である。
このような調査票では、回答欄はチェック記入欄(図中、例えばAで示す)と自由記載欄(図中、Bで示す)を含み、チェック記入欄への回答記入は、その記入欄へのチェック記入、自由記載欄への記入は文字入力等で行うものである。
次に、埋め込み情報作成部103にて、フォーマット情報作成(ステップS3)、記入箇所検出情報作成(ステップS4)、識別情報作成(ステップS5)を行ってこれらの情報を含む埋め込み情報を作成する(ステップS6)。そして、文書データ作成部104にて、これらの埋め込み情報と文書画像作成部102で作成された文書画像データとを合成した文書データを作成する(ステップS7)。
【0028】
第4図は、回答記入領域の説明図である。
この第4図は、第3図の調査票画像における回答記入領域を示したものである。図において、チェック記入欄を順にC11、C12などと呼び、自由記載欄をF、Fなどと呼ぶ。各自由記載欄は同図に示す通りブロックBからB28まで分割されているものとする。また、各欄の座標位置をそれぞれ同図に示す通りとする。但し、座標系は左上端を原点(0,0)とする。
先ず、ステップS3のフォーマット情報の作成について説明する。フォーマット情報とは各回答欄の位置とその回答欄がどの設問の何番目の回答欄であるかを示すものであり、第4図に示す回答記入領域に関するフォーマット情報は次の通りとなる。
【0029】
第5図は、フォーマット情報の説明図である。
図示のように、フォーマット情報は、回答欄の左上と右下の座標(A,A)(B,B)と設問番号および回答判定の情報からなる。
また、記入箇所検出情報の作成については、チェック記入欄や自由記載欄の画像特徴情報を作成するものであり、これについては後述する。尚、記入箇所検出のための情報は、チェック記入欄については各欄毎に個別に作成し、自由記載欄については各ブロック毎に個別に作成する。
【0030】
次に、ステップS5における識別情報の作成処理について説明する。
識別情報とは、調査票の種別番号、部単位のIDやページ番号などであり、回答データを分類するためのキーとして用いるものである。これは手動で付与してもよく、また、通し番号としてシステムが自動的に付与してもよい。
また、ステップS6における埋め込み情報の作成については、本具体例では文書データ作成部104によるステップS7の文書データ作成処理と一体の処理として行う。以下、埋め込み情報の作成処理と文書データ作成処理について詳細に説明する。
先ず、埋め込み情報をドットパターンからなる透かし画像で表すための原理について説明する。
透かし画像を構成する透かし信号は、ドット(黒画素)の配列によって任意の波長と方向を持つ波を表現した信号ユニットで表される。
【0031】
第6図は、信号ユニットの一例を示す図である。
以下、幅と高さがSw,Shの矩形を一つの信号の単位として信号ユニットと称する。幅Swと高さShは異なっていてもよいが、本具体例では説明を容易にするためSw=Shとする。長さの単位は画素数であり、第6図の例ではSw=Sh=12である。これらの信号が紙面に印刷されたときの大きさは、画像情報の解像度に依存しており、例えば、画像情報が600dpiの画像であるとした場合、第6図の信号ユニットの幅と高さは、印刷文書上で、12/600=0.02(インチ)となる。
【0032】
第6図(1)は、ドット間の距離が水平軸に対してarctan(3)の方向に密であり、波の伝搬方向はarctan(−1/3)である。以下、この信号ユニットをユニットAと称する。第6図(2)は、ドット間の距離が水平軸に対してarctan(−3)の方向に密であり、波の伝搬方向はarctan(1/3)である。以下、この信号ユニットをユニットBと称する。
【0033】
第7図は、画素値の変化をarctan(1/3)方向から見た断面図である。
第7図において、ドットが配列されている部分が波の最小値の腹(振幅が最大となる点)となり、ドットが配列されていない部分は波の最大値の腹となっている。また、ドットが密に配列されている領域はそれぞれ1ユニットの中に二つ存在するため、この例では1ユニット当たりの周波数は2となる。波の伝搬方向はドットが密に配列されている方向に垂直になるため、ユニットAの波は水平方向に対してarctan(−1/3)、ユニットBの波はarctan(1/3)となる。尚、arctan(a)の方向とarctan(b)の方向が垂直のとき、a×b=−1である。尚、信号ユニットにはこれ以外のドット配列による信号ユニットも考えられる。
【0034】
信号ユニットに符号語のシンボルを割り当て、信号ユニットを透かし画像に埋め込むことにより、埋め込み情報を透かし画像に埋め込むことができる。以下、符号語のシンボルを割り当てた信号ユニットを「シンボルユニット」と称する。
埋め込み情報を符号語に変換する際の次元数により、必要なシンボルユニットの数が定まる。埋め込み情報を2元符号化(N=2)する場合には、シンボルユニットを2種類(例えば、ユニットA、ユニットB)用意し、例えば、ユニットAにシンボル0を割り当て、ユニットBにシンボル1を割り当てることができる。また、埋め込み情報を更に多くの次元数の符号化を行う場合には、その次元数に対応した種類のシンボルユニットを用意する。
【0035】
また、例えば、ユニットCに符号語のシンボルとは無関係のシンボル(例えば、機密語をN元符号化する場合、シンボルN)を割り当て、これを背景ユニットと定義し、これを隙間なく並べて透かし画像の背景とすることができる。以下、符号語のシンボルとは無関係のシンボルを割り当てた信号ユニットを「背景ユニット」と称する。背景ユニットを隙間なく並べて、そこにシンボルユニットを埋め込む場合には、埋め込もうとする位置の背景ユニットと、埋め込むシンボルユニットを入れ替える。
【0036】
第8図は、背景画像の説明図である。
第8図(1)はユニットCを背景ユニットと定義し、これを隙間なく並べて透かし画像の背景とした場合を示している。第8図(2)は、第8図(1)の背景画像の中にシンボルユニットとしてのユニットAを埋め込んだ一例を示し、第8図(3)は、第8図(1)の背景画像の中にシンボルユニットとしてのユニットBを埋め込んだ一例を示している。
これら第8図(1)〜第8図(3)に示すように、各信号ユニット中のドットの数を全て等しくしているため、これら信号ユニットを隙間なく並べることにより、透かし画像の見かけの濃淡が均一となる。従って、印刷された紙面上では、単一の濃度を持つグレー画像が背景として埋め込まれているように見える。また、信号ユニットに対するシンボルの割り当ての組み合わせは無数に考えられる。このようにして、回答者あるいは第三者(不正者)に埋め込み情報を簡単に解読できないようにすることができる。
【0037】
埋め込み情報を符号化した符号語の各シンボルについて、単に対応するシンボルユニットを配置していくことによっても、透かし画像に埋め込み情報を埋め込むことは可能である。本具体例では、更に、第三者による不正な解読を防止効果を高めるため、符号語の各シンボルに対して、信号ユニットの配置パターン(以下、ユニットパターンと称する)を定義し、ユニットパターンを配置することによって透かし画像に埋め込み情報を埋め込む方法について説明する。
【0038】
第9図は、ユニットパターンとそのユニットパターンが表すシンボルの一例を示す説明図である。
ここで、一つのユニットパターンを幅(列)×高さ(行)=4×2の信号ユニットの行列とする。また、背景ユニットをユニットC(シンボル2)とし、これに埋め込まれるシンボルユニットをユニットA(シンボル0)およびシンボルB(1)とする。
第9図(1)では、ユニットA(シンボル0)を所定の閾値(例えば6)以上配置して、ユニットパターン全体としてシンボル0を表す。第9図(2)では、ユニットB(シンボル1)を所定の閾値(例えば6)以上配置して、ユニットパターン全体としてシンボル1を表す。第9図(3)では、ユニットAとユニットBをほぼ同数(同数あるいはいずれかのシンボルユニットが一つ多い)配置して、ユニットパターン全体としてシンボル2を表す。
【0039】
次に、実際の透かし画像の作成処理について説明する。
尚、調査票で表すデータは白黒2値であり、例えば、回答欄の枠や文字は黒(1)、背景は白(0)であるとする。
第10図は、透かし画像の形成処理を示すフローチャートである。
先ず、ステップS11において、埋め込み情報をN元符号に変換する。Nは任意であるが、以下では説明を簡単にするため、N=2(埋め込み情報を2元符号に変換する)とする。従って、このステップS11で生成される符号語は、0と1のビット列で表現されているものとする。また、埋め込み情報はそのまま符号化しても良いし、暗号化したものを符号化しても良い。また、誤り訂正符号を用いて符号化しても良い。
【0040】
次に、符号語の各シンボルに対して、第9図に示したようにユニットパターンを割り付ける(ステップS12)。
次に、シンボルユニット配置可否行列を定義する(ステップS13)。シンボルユニット配置可否行列は文書画像を一つのブロックの大きさがSw(幅)×Sh(高さ)画素のブロック画像に分割した画像を行列で表したものであり、文書画像の対応するブロックにシンボルユニットを埋め込めるかどうかを表すものである。これは文字領域(実際の文字部分や枠部分も含むものとする)にシンボルユニットを挿入した場合には検出不可能となるため、予めシンボルユニットを埋め込むことが可能な場所を指定するための行列である。行列の要素の値が1であれば、文書画像の対応するブロックにはシンボルユニットを埋め込むことが可能であり、値が0であれば背景ユニットを埋め込むことになる。ここで、Sw,Shはそれぞれ信号ユニットの幅と高さであり、入力文書画像の大きさをW×Hとすると、ユニット行列Umの要素数は、幅(列)×高さ(行)=Mw×Mh=W/Sw×H/Shとなる。
【0041】
シンボルユニット配置可否行列の各要素は文書画像の対応するブロック中に文字領域が存在するかどうかによって決定する。例えば、シンボルユニット配置可否行列の任意の要素(X,Y)(Y行,X列)は入力文書画像のx=X×Sw〜(X+1)×Sw,y=Y×Sh〜(Y+1)×Shの中に含まれている文字領域(輝度値が0の画素)がTn画素以下である場合には1、文字領域がTn画素より大きい場合には0とする。Tnは閾値であり、Sw×Sh×0.5以下の小さな数とする。
【0042】
第11図は、シンボルユニット配置可否行列作成の説明図である。
第11図(1)は、シンボルユニット配置可否行列の各要素に対応するブロックを入力文書画像上に重ねて示したものである。第11図(2)では、各ブロックに文字領域が含まれている場合に、対応するブロックの値を0としていることを示している。第11図(3)では、文字領域判定結果からシンボルユニット配置可否行列の各要素の値を決定している。
【0043】
次に、ユニットパターン配置可否行列を作成する(ステップS14)。これは、文書画像中のこの行列に対応する領域にユニットパターンを挿入可能な場合には要素の値が1となり、挿入不可能な場合は0となる。ユニットパターンを幅(列)×高さ(行)=4×2の信号ユニットの行列と定義すると、ユニットパターン挿入可否の判定は以下のように行う。先ず、第11図(3)に示したシンボルユニット配置可否行列を4×2の領域に区分する。一つの領域を構成する8個の信号ユニットのうち、所定の閾値Tu個(Tuは6程度)以上がシンボルユニット埋め込み可能(シンボルユニット配置可否行列の値が1)であればユニットパターン埋め込み可能とし、それ以外の場合はユニットパターン埋め込み不可能とする。
【0044】
第12図は、ユニットパターン配置可否行列の作成過程の例を示す説明図である。
第12図(1)は一つのユニットパターンが8個の信号ユニットから構成されていることを示している。第12図(2)は、各ユニットパターンに対し、対応するシンボルユニット配置可否行列の要素が1である数がTu(=6)以上のユニットパターンには1が、それ以外のユニットパターンには0が与えられていることを示している。第12図(3)はユニットパターン配置可否行列の各要素の値をセットしていることを示している。
【0045】
次に、ユニットパターン配置可否行列を参照してユニットパターン行列を作成する(ステップS15)。符号語のシンボルは、ユニットパターン行列中に繰り返しセットされるが、ユニットパターンが埋め込み不可能な要素にはセットされない。
【0046】
第13図は、ユニットパターン行列の一例を示す説明図である。
例えば、この第13図に示すように、ユニットパターン行列およびユニットパターン配置可否行列の大きさをPw×Ph=4×3であるとし、符号語のシンボルが(0011)の4ビットであったとする。この図ではユニットパターン配置可否行列の1行2列目の要素の値が0であるため、符号語のシンボルの2ビット目(シンボル0)はセットされずにシンボル2がセットされ、1行3列目に符号語のシンボルの2ビット目がセットされる。
次に、ユニットパターン行列とシンボルユニット配置可否行列を基にユニット行列Umを作成する(ステップS16)。ユニット行列Umはシンボルユニット配置可否行列と同じ大きさであり、信号ユニットの配置パターンを記述する行列である。信号ユニットの配置のルールを以下のように定める。
【0047】
第14図は、ユニット行列の一例を示す説明図である。
・ルール1:シンボルユニット配置可否行列において要素が0の位置には背景ユニット(シンボル2)をセットする(第14図(1))。
・ルール2:ユニットパターン行列の要素が符号語のシンボルの場合には、ユニット行列Umの対応する領域にそのシンボルに対応するシンボルユニットをセットする(第14図(2))。
・ルール3:ユニットパターン行列が符号語のシンボル以外(ユニットパターン配置可否行列の値が0)の場合には、0を表すシンボルユニットと1を表すシンボルユニットを同じ数だけセットする(第14図(3))。
・ルール4:信号ユニットがセットされていない領域に背景ユニットをセットする(第14図(4))。
【0048】
要約すれば、文字領域には背景シンボルをセットし、任意のユニットパターンのうち背景領域がTu(=6)以上あれば符号語のシンボルを割り当て、それ以外の場合は背景領域に2種類のシンボルユニットを同じ数だけ割り当てる。背景領域が奇数の場合は残りの一つには背景シンボルをセットすることになる。これにより、符号語のシンボルが割り当てられているユニットパターンには同じユニットパターンが6個以上セットされているため、検出時には埋め込んだシンボルユニットに対するフィルタの出力値の合計値が、もう片方のフィルタの出力の合計値よりも大幅に大きくなり、符号語のシンボルが割り当てられていないユニットパターンは二つのフィルタの出力値の合計の差が小さくなる。従って、符号語を割り当てたユニットパターンであるか割り当てていないユニットパターンであるかの判定が容易になる効果がある。
次に透かし入り画像(文書画像データと埋め込み情報を重ね合わせた画像)を作成する(ステップS17)。
【0049】
第15図は、透かし入り画像作成の一例を示す説明図である。
このステップS17では、ステップS16で作成したユニット行列Um(第15図(1))に従って信号ユニットを背景画像に配置する(第15図(2))。信号ユニットを並べることにより作成した背景画像に文書画像を重ね合わせ、透かし入り文書画像を作成する(第15図(3))。
【0050】
次に、埋め込み信号数を記録する。
第16図は、埋め込み信号数記録処理のフローチャートである。
先ず、ユニット行列のブロック化を行う(ステップS21)。
第17図は、ステップS21の説明図である。
ステップS21では、先ず、ユニット行列Um(第17図(2))の左端のIw個分の要素を埋め込みシンボルユニット数の記録用のユニット(記録用ユニット帯と呼ぶ)として使用する(第17図(3))。次に、ユニット行列Umの記録用ユニット帯を除いた部分を(横×縦=)Bw×Bh個のブロックに分割する(これをユニット数記録単位行列Nu(x,y)x=1〜Bw,y=1〜Bhと呼ぶ)。各ブロックの大きさはユニット行列Umの要素数を大きさの単位として(幅×高さ=)bw×bhとする(第17図(4))。
ユニット行列Umの左端に記録用ユニット帯を配置する場合、ユニット数記録単位行列に関して設定可能なパラメータは、横方向のブロック数、ブロックの高さ方向の大きさである。残りの縦方向のブロック数とブロックの幅方向の大きさは、設定したパラメータおよび記録用ユニット帯の幅、ユニット行列Umのパラメータから自動的に決定される。
【0051】
以下の説明では、ユニット行列Umの大きさ(要素数)をMw×Mhとしたとき、横方向のブロック数をBw=4、ブロック高さ方向の大きさをbh=16、記録用ユニット帯の幅をIw=4とする。従って、縦方向のブロック数はBh=Mh/bh=Mh/16、ブロックの幅方向の大きさはbw=(Mh−Iw)/Bw=(Mh−4)/4となる。
次に、各ブロックの信号数を計測し(ステップS22)、更に、信号数をコード化し、これを記録する(ステップS23)。
【0052】
第18図は、ステップS22およびステップS23の説明図である。
ステップS22では、ユニット行列Umにおいてユニット数記録単位行列の各要素に対応する領域に含まれるシンボルユニットの数を計測する。第18図の例ではユニット数記録単位行列Nu(X,Y)におけるシンボルユニット数の計測方法を示しており、以下のステップにより実行される。
・ステップ1:Nu(X,Y)に対応するユニット行列Umでの領域を取り出す(第18図−1、−2)。
・ステップ2:ステップ1で取り出された領域内に埋め込まれているシンボルユニットの数を計測する(第18図−3、−4)。尚、ここで、シンボルユニットの埋め込み規則は前述したように、入力文書画像の文字領域にはシンボルユニットは埋め込まれていないものとする。第18図の例では、この領域に埋め込まれたシンボルユニット数は71であったものとする。
ステップS23では、ステップS22で計測されたシンボルユニット数を記録用ユニット帯に記録する。以下にそのステップを示す。
・ステップ3:N(X,Y)=71を2進数で表現する(第18図−6)。
・ステップ4:ステップ3の結果を記録用ユニット帯の対応する領域にセットする(第18図−7、−8)。
【0053】
ここで示した例は、ユニット数記録単位行列の1行に対応するユニット行列Umの行数bhを16、記録用ユニット帯の幅Iwを4としているため、ユニット数記録単位行列の各行に対して記録用のユニット数はIw×bh=4×16=64となる。また、ユニット数記録単位行列の列数Bwは4であるため、ユニット数記録単位行列の一つの要素に割り当てられる記録用のユニット数(単位記録ユニット数と呼ぶ)はIw×bh/Bw=64/4=8となる。従って、ユニット記録単位行列の各行に対応する記録用ユニット帯の1〜2行目にはユニット記録単位行列の1列目の情報を、3〜4行目には2列目、5〜6行目には3列目、7〜8行目には4列目の情報をそれぞれ単位記録ユニット数(8ビット)で記録することになる。
【0054】
この具体例ではユニット数を記録しているが、ユニット記録単位行列の「各要素に対応するユニット行列Umの領域中に埋め込むことができる信号ユニット数の最大値」に対する「シンボルユニット数」の割合を記録しても良い。割合を記録する方式は、「ユニット記録単位行列の各要素に対応するユニット行列Umの範囲が大きく、その中に含まれるユニット数も多くなり、この数を表現するために必要なビット数が単位記録ユニット数を超えるような場合」や「ユニット記録単位行列の列数を増やしたため、ユニット記録単位行列の一つの要素の情報を表現するために割り当てられる単位記録ユニット数が少なくなった場合」に有効となる。また、記入箇所の特定はユニット記録単位行列の要素単位に行うため、同じ入力文書画像に対してユニット記録単位行列の行数や列数を増やすことにより、印刷文書に対する記入箇所の特定の詳細に行うことができる利点があるが、それだけ記録用ユニット帯を大きく取るか、または単位記録ユニット数を小さくする必要がある。
【0055】
尚、記録用ユニット帯は文書画像の文字領域に重ならないよう、文書画像の余白部分に設定する。また、記録用ユニット帯はユニット行列Umの右端、または上端、下端に設定しても、以降の処理を「記録用ユニット帯が文書画像の上下にある」という前提で行えば同様の効果が得られる。
更に、ユニット行列Umの左右に記録用ユニット帯を設定し、それぞれ同じ情報をセットしても良い。この場合、用紙が汚れたりして片方の記録用ユニット帯の情報が読み取れなくなった場合でも、もう一方の記録用ユニット帯から情報を読み取ることにより、安定して記入箇所検出処理を行うことができる。これは上下方向についても同様である。
【0056】
第2図に戻り、ステップS8において、文書出力部105は文書データ作成部104から出力された文書データを印刷し、記入用文書300として出力する。尚、記入用文書300としては、第3図で示した調査票画像に、例えば第8図で示したようなパターンが地紋パターンとして印刷されたものである。
【0057】
[記入内容抽出装置200の動作]
第19図は、具体例1における記入内容抽出装置200の動作フローチャートである。
先ず、文書読み込み部201は、回答記入のなされた調査票(記入用文書300)を読み込む(ステップS31)。この結果、調査票のスキャン画像が得られる。次に、埋め込み情報取り出し部202にて埋め込み情報を取り出し(ステップS32)、更に、記入箇所検出情報、フォーマット情報、識別情報のそれぞれの情報を分離する(ステップS33)。
次に、記入箇所検出部203において、記入箇所検出情報を用いて調査票に対する記入箇所の検出を行う(ステップS34)。記入箇所検出情報はチェック記入欄毎、または自由記載欄のブロック毎に記録されているため、この情報を用いた記入箇所検出の結果、チェックされた欄や自由記入されたブロックの識別ができる。即ち、記入箇所検出は、ドットパターンの検出状態の変化に基づいて記入の有無を検出することにより行う。
【0058】
以下、これらの埋め込み情報の取り出し(ステップS32)〜記入箇所検出(ステップS34)の動作を詳細に説明する。
第20図は、埋め込み情報の取り出し処理を示す動作フローチャートである。
先ず、スキャン画像から信号ユニットが埋め込まれている領域(以下、信号領域と称する)の輪郭線を検出し、画像の回転などの補正を行う。
【0059】
第21図は、信号領域の検出方法の説明図である。
第21図(1)は、例えば上記ステップS31で読み込まれたスキャン画像であるとする。ここでは、信号領域の上端を検出する例を示している。入力された画像をImg(x,y),x=0〜Wi−1,y=0〜Hi−1とする。また、記入用文書作成装置100によって文書中に埋め込んだ信号ユニットの大きさが幅×高さ=Sw×Sh(画素)、文書出力部105の印刷解像度をDout(dpi)、文書読み込み部201におけるスキャナの読み取り解像度をDin(dpi)として、
tSw=Sw×Din/Dout
tSh=Sh×Din/Dout
とする。即ち、tSwとtShはImgにおける理論上の信号ユニットの大きさであり、フィルタAやフィルタBといった信号検出フィルタはこの値を基に設計される。
【0060】
この画像Imgから信号領域の上端検出のためのサンプル領域S(x),x=1〜Snを設定する。SnはWi/Np(Npは10〜20程度の整数)であるものとする。また、S(x)の幅はWs=tSw×Nt(Ntは2〜5程度の整数)、高さはHs=Hi/Nh(Nhは8程度)とし、S(x)のImgにおける水平方向の位置はx×Npとする。
【0061】
任意のS(n)における信号領域の上端SY0(n)の検出方法を次に説明する。
・ステップ1:ImgからS(n)に対応する領域を切り取る(第21図−1)。
・ステップ2:S(n)に対してフィルタAとフィルタBを施し、S(n)内の水平方向における最大値をFs(y)に記録する(第21図−2)。
・ステップ3:ある閾値Tyを設定し、Fs(1)〜Fs(Ty−1)の平均値をV0(Ty)、Fs(Ty)−Fs(Ty)〜Fs(Hs)の平均値をV1(Ty)とする。V1(Ty)−V0(Ty)が最大となるTyをS(n)における信号領域の上端の位置としてSY0(n)にセットする(第21図−3)。
【0062】
第21図(4)は、Fs(y)のyに対する値の変化を示した図である。図示のように、Imgの信号ユニットのない領域は信号検出フィルタの出力値の平均値は小さく、一方、記入用文書作成装置100によって調査票の背景部分にはシンボルユニット(ユニットAまたはユニットB)を密に配置しているため、信号検出フィルタの出力値が大きくなる(文書の余白部分は背景部分であり、ここにも密に埋め込んである)。従って、信号領域とそれ以外の領域の境界付近を境に信号検出フィルタの出力値が大きく変動し、これを領域検出に利用している。
【0063】
上記のステップ1〜ステップ3をS(x)、x=1〜Snについて行い、SY0(x)、x=1〜Snを得る。信号領域の上端はこれによって得られたサンプル点S0(x×Np,SY0(x))、x=1〜Snを最小二乗法などを用いて直線近似して得る。他の輪郭線も上記と同様の方法を用いて検出し、例えば、信号領域の上端が水平になるように信号領域を回転移動した画像を以下では入力画像と呼ぶ。
【0064】
第22図は、属性領域に埋め込まれたユニット行列の大きさを復元する方法の例を示す説明図である。
ここでは、入力画像の信号領域は(Ix0,Iy0)〜(Ix1,Iy1)とし、属性記録領域の情報を復元する例を示す。
・ステップ1:入力画像の(Ix0,Iy0)付近の領域を切り取る(第22図−1)。
・ステップ2:切り取られた領域に対して属性領域を設定する(第22図−2)。属性領域は記入用文書作成装置100で設定したものと同じものであるとし、例えばMwを16ビットで表したときの最上位ビットは(Ix0+tSw,Iy0)に、最下位ビットは(Ix0+tSw×17,Iy0)に埋め込まれているものとして検出する。
・ステップ3:ステップ2で設定したMwのに対し、フィルタAとフィルタBを施し、各ビット位置でフィルタAとフィルタBの出力値の大きい方に対応するシンボルユニットが、そのビット位置に埋め込まれているものと判定する(第22図−3)。
・ステップ4:記入用文書作成装置100でセットしたときと逆の順序でMwの値を復元する(第22図−4、−5)。
【0065】
入力画像における信号ユニットの大きさの理論値tSw,tShは誤差が含まれているものの、属性記録領域における信号検出位置は、第21図で検出した境界線をそれぞれ基準としているため、例えばSw=Sh=12、Dout=600、Din=400の場合では、tSw=tSh=12×400/600=8であるため、属性記録領域は8×17=136画素程度の大きさしかなく、仮に誤差が1%(実際はこれより少ない)程度であっても、属性領域の基準点から最も離れた位置でも1画素程度の誤差となり、ほぼ正確に信号検出位置を設定することができる。
入力画像における信号ユニットの真の幅Siwは、属性記録領域から取り出されたユニット行列の幅Mwと第21図から得られた信号領域の幅Ix1−Ix0を基に、
Siw=Mw/(Ix1−Ix0)
によって算出できる。同様に信号ユニットの真の幅Sihは、
Sih=Mh/(Iy1−Iy0)
によって算出できる。
【0066】
第23図は、第20図におけるステップS42とステップS43の説明図である。
ステップS42では、ユニットパターン毎にフィルタ出力値の合計を計算する。第23図において、ユニットパターンU(x,y)を構成する信号ユニット毎にフィルタAとのコンボリューション(たたみこみ積分)を計算し、それぞれの信号ユニットに対するコンボリューションの出力値の総和をユニットパターンに対するフィルタAの出力値Fu(A,x,y)と定義する。但し、信号ユニット毎のコンボリューションは、フィルタAの位置を信号ユニット毎に水平・垂直方向にずらしながら計算した結果の最大値とする。
【0067】
フィルタBについても同様にしてユニットパターンU(x,y)に対する出力値Fu(B,x,y)を計算する。
ステップS43では、Fu(A,x,y)とFu(B,x,y)を比較し、これらの差の絶対値|Fu(A,x,y)−Fu(B,x,y)|が予め定められた閾値Tpより小さければ符号語のシンボルが割り当てられていないものとする。それ以外の場合は、Fu(A,x,y)とFu(B,x,y)の大きい方のシンボルが割り当てられているものと判定する。即ち、Fu(A,x,y)>Fu(B,x,y)であれば、U(x,y)にはシンボル0が埋め込まれ、Fu(A,x,y)<Fu(B,x,y)であればU(x,y)にはシンボル1が埋め込まれているものとする。
【0068】
入力画像から得られる全てのユニットパターンに対して第23図の処理を行い、ユニットパターン行列Uを作成する。
ステップS44では、判定されたシンボルを基に埋め込まれた情報を復号する。
【0069】
第24図は、ユニットパターン行列から符号語を取り出す方法の例を示す説明図である。
第24図ではシンボルが割り当てられていない要素にはシンボル2がセットされているものとし、シンボル2がセットされている要素を無視してシンボルを取り出して符号語を復元する。
【0070】
次に、記入箇所検出の動作について説明する。
以下の説明では、
・記入用文書作成装置100で文書中に埋め込んだ信号ユニットの大きさがSw×Sh(画素)である。
・埋め込んだ信号ユニット数は、横×高さ=nw×nhである。
・埋め込んだシンボルユニットはユニットAとユニットBの二種類である。
・入力画像における信号ユニットの大きさはSiw×Sihである。
という前提で説明を行う。
【0071】
第25図は、埋め込み信号数検出処理の説明図である。
埋め込み信号数の検出は以下のステップで行う。
・ステップ1:入力画像をSw×Sh個のブロックに分割して、ユニット行列Umを設定する(第25図−1)。
・ステップ2:ユニット行列Umの記録用ユニット帯に相当する部分を取り出す(第25図−2)。
・ステップ3:記録用ユニット帯に信号検出フィルタを施すことによって、埋め込んだビット列を復元する(第25図−3、−4)。第25図−3において、記録用ユニット帯に相当するユニット行列Umの各要素に対応する入力画像上の領域に対し、二つのフィルタ(フィルタAとフィルタB)の出力値を計算し、出力値が大きい方のフィルタに対応するシンボルユニットが埋め込まれているものとする。この例ではフィルタAの出力値が大きいため、ユニットA(シンボル0)が埋め込まれていると判定されている。
・ステップ4:復元されたビット列を基にユニット数記録単位行列を復元する(第25図−5)。
【0072】
次に、フィルタ出力値の算出処理を行う。
第26図は、フィルタ出力値算出処理の説明図である。
ここでは、埋め込み信号数の検出処理で設定したユニット行列Umの各要素に対して、以下のステップにより信号検出フィルタの出力値を記録する。
・ステップ1:ユニット行列Umの任意の要素に対応する入力画像の領域に対して信号検出フィルタ(フィルタAとフィルタB)の出力値を計算する(第26図−1)。信号検出フィルタはそれぞれ対象とする領域に対して上下左右にずらしながら出力値を計算し、フィルタAによる出力値の最大値とフィルタBによる出力値の最大値の大きい方を求める。
・ステップ2:ユニット行列Umの全ての要素についてステップ1を行い、出力値をフィルタ出力値行列Fm(x,y)、x=1〜Sw、y=1〜Shの対応する要素に記録する。
【0073】
次に、最適閾値を判定する。
第27図は、最適閾値の判定処理の説明図である。
ここでの閾値は、ユニット行列Umの各領域に対応する入力画像の領域にシンボルユニットが埋め込まれているかどうかを判定するための閾値(Tsと呼ぶ)であり、フィルタ出力値行列の任意の要素の値が閾値Tsを超えたならば、入力画像のそれに対応する位置にはシンボルユニットが埋め込まれているものと判定する。
・ステップ1:フィルタ出力値行列の要素(信号検出フィルタの出力値)の平均Fa、標準偏差Fsなどから閾値tsの初期値を設定する(第27図−1)。ここでは例えば初期値をts=Fa−Fs*3とする。
・ステップ2:フィルタ出力値行列をtsによって二値化し、ユニット抽出画像を形成する(第27図−2)。
・ステップ3:ユニット抽出画像に対してユニット数記録単位行列を当てはめる(第27図−3)。
・ステップ4:ユニット抽出画像のユニット数記録単位行列の各要素に対応する領域中のシンボルユニット数を数え、ユニット数記録単位行列に記録する(第27図−4)。
・ステップ5:埋め込み信号数検出処理で復号された記録用ユニット帯に記録されていたシンボルユニット数とステップ4から得られたシンボルユニット数の差分の絶対値をユニット数記録単位行列の要素毎に計算し、全ての要素についての合計値をSf(ts)とする(第27図−5)。
・ステップ6:Sf(ts)が最小となるtsをTsとして記録する(第27図−6)。
・ステップ7:tsにΔtを加え、tsを更新する(第27図−7)。Δtは予め定めた値が、ステップ1で求めた標準偏差Fs(例えばΔt=Fs×0.1とするなど)から算出してもよい。
・ステップ8:Tsが予定した値に達したならば終了する。そうでなければステップ1に戻る(第27図−8)。
【0074】
次に、検出信号の計数処理を行う。
第28図は、検出信号計数処理の説明図である。
この部分の処理は、最適閾値判定処理で得られた最適閾値Tsによってフィルタ出力値行列を二値化したユニット抽出画像を用いて、最適閾値判定処理とほぼ同一の処理を行う。
・ステップ1:フィルタ出力値行列をTsによって二値化し、ユニット抽出画像を作成する(第28図−1)。
・ステップ2:ユニット抽出画像に対してユニット数記録単位行列を当てはめる(第28図−2)。
・ステップ3:ユニット抽出画像のユニット数記録単位行列の各要素に対応する領域中のシンボルユニット数を数え、ユニット数記録単位行列に記録する(第28図−3)。
・ステップ4:埋め込み信号数検出処理で復号された記録用ユニット帯に記録されていたシンボルユニット数とステップ3から得られたシンボルユニット数の差分D(X,Y)をユニット数記録単位行列の要素毎に計算する(第28図−4)。ユニット数記録単位行列の任意の要素Nu(X,Y)におけるD(X,Y)は、記録用ユニット帯から復元されたシンボルユニット数をR(X,Y)、ステップ3で計測されたシンボルユニット数をC(X,Y)としてD(X,Y)=R(X,Y)−C(X,Y)によって計算されるものとする。
【0075】
次に、記入判定を行う。
ユニット数記録単位の任意の要素N(X,Y)における記入判定は、D(X,Y)を用いて以下のように行う。
・チェック印や文字等が追加された記入:D(X,Y)>TA(TAは正の整数)「記録されていたシンボルユニット数より検出されたシンボルユニット数の方が少ない場合には、本来埋め込まれていたシンボルユニットの上にチェック印や文字等の追加があったために検出不能になったと判断する」。
尚、この判定方法によって、文字等の削除も検出可能であるが、本具体例では特に必要がないため、これを使用しない。
【0076】
第19図に戻って、記入位置が検出されると、回答データ変換部204は、記入から回答データへの変換を行う(ステップS35)。ここでは、ステップS33で取り出されたフォーマット情報を利用する。例えば、ステップS34の記入箇所検出において、第4図中のC11がチェックされたものと識別されたとする。このとき、第5図に示すフォーマット情報を用いれば、R11の設問と回答の番号はそれぞれ1、1であることが分かる。従って、設問1に対する回答の記入内容は回答欄1(つまり男性)であったことが分かる。また、ステップS34の記入箇所検出において自由記入されたと識別されたブロックの画像を切り抜き、これを回答データとして得ることもできる。
次に、目視情報出力部205は、回答のデータ変換結果を出力し、これが図示しないディスプレイ等で表示される(ステップS36)。
【0077】
第29図は、画面表示の一例を示す説明図である。
図示例では、画面表示の一例として、スキャン画像と記入検出結果、調査票識別情報および回答データ変換結果を表示している。スキャン画像は、文書読み込み部201で読み取った調査票のイメージであり、記入検出結果は、埋め込み情報取り出し部202〜回答データ変換部204による上述した処理で得られた検出結果を示している。ここでは、設問1の「男」に対応するC11と、設問2の「会社員」に対応するC21が記入検出結果として表示されている。また、自由記載欄にはブロック毎の記入検出結果が表示されることにより、複数のブロックで「紫色」と記入された文字を表示している。更に、調査票識別情報は、埋め込まれていた識別情報を埋め込み情報取り出し部202によって取り出した調査票のID等の情報である。そして、回答データ変換結果は、回答データ変換部204によって変換された設問に対する回答番号や回答が記入されていた自由記載欄のブロックを切り抜いた画像である。
記入内容抽出装置200のオペレータは、このような表示結果に対して、回答のデータ変換結果に対する目視確認および修正を行う(ステップS37)。
【0078】
〈効果〉
以上のように、具体例1によれば、記入用文書300として、そのフォーマット情報や記入箇所検出のための情報および識別情報を全て備えているため、記入内容抽出装置200側で、記入用文書300のフォーマット情報等を保持しておく必要がない。従って、記入内容抽出装置200側では、記入用文書300がどのようなフォーマットであっても全て対応できるという効果がある。
また、ベリファイ入力のための人員確保や、マークシート用紙といった特殊な用紙の準備、およびOCRでの処理に必要なフォーマット情報の伝達や識別番号の記載も不要である。しかも、記入内容の抽出処理では、文字認識を行うのではないため、OCR等の処理に比べて高速にデータ化できるという効果がある。
また、埋め込み情報をドットパターンで表しているため、記入用文書300としてレイアウト上の制約がほとんどなく、しかも、記入用文書300で汚れや折り曲げ等があった場合でも、読み取りエラーが発生しにくく、従って、記入箇所検出の信頼性向上を図ることができる。
更に、具体例1によれば、スキャン画像や記入検出結果、回答データ変換結果を目視情報として出力するようにしたので、オペレータは、このような表示を見て容易に確認、修正を行うことができる。特に、自由記載欄への記入内容を出力するようにしているため、例えば、オペレータは、この部分のみに対して記入内容の確認、修正を集中して行うといったことが可能となる。
《具体例2》
【0079】
具体例2は、上記具体例1の構成に対して、更に目視チェックを効率的に行えるよう、回答データ変換結果を外部記憶装置に蓄積し、別途目視チェックを行えるようにしたものである。
【0080】
〈構成〉
第30図は、具体例2の構成図である。
図において、記入用文書作成装置100およびこれにより作成される記入用文書300は具体例1と同様であるため、対応する部分に同一符号を付してその説明を省略する。記入内容抽出装置200aは、文書読み込み部201、埋め込み情報取り出し部202、記入箇所検出部203および回答データ変換部204からなり、これらの構成は具体例1における記入内容抽出装置200の構成と同様であるため、ここでの説明は省略する。結果記憶部400は、例えば、ハードディスク装置からなり、回答データ変換部204から出力された回答データ変換結果を格納する記憶部である。また、目視情報出力部500は、結果記憶部400に記憶されているデータを用いて、回答データ変換結果を表示出力する機能部であり、例えば、パーソナルコンピュータ等で構成されている。
【0081】
〈動作〉
具体例2における記入用文書作成装置100による文書作成処理は具体例1と同様であるため、その説明は省略する。
第31図は、記入内容抽出処理の説明図である。
ステップS41〜ステップS45の動作は、具体例1におけるステップS31〜ステップS35の動作と同様である。即ち、調査票の読み込み、埋め込み情報の取り出し、取り出し情報の分離、記入箇所検出および回答データ変換を行う。
【0082】
次に、回答データ変換部204の結果出力を結果記憶部400に記憶する(ステップS46)。データ変換結果は、第29図に示したように、設問に対する回答番号と自由記載欄への回答内容を切り抜いた画像データであり、これをスキャン画像と共に記憶する。
次に、結果記憶部400に記憶されたデータを用い、目視情報出力部500にて回答のデータ変換結果を表示する(ステップS47)。この表示内容は、第29図に示したものと同様である。
記入内容をチェックするオペレータは、このような表示結果に対して、具体例1と同様に、回答のデータ変換結果に対する目視確認および修正を行う(ステップS48)。
【0083】
〈効果〉
以上のように、具体例2によれば、具体例1の効果に加えて次のような効果がある。即ち、回答データの変換結果を結果記憶部400に記憶しておき、目視チェック時には記憶したデータを用いてそのチェックを行うようにしたため、例えば、回答データは調査票を用いて一拠点で高速に変換し、その結果の目視チェックは遠隔地にいる複数のオペレータで行うといった、記入内容の抽出処理とオペレータの目視確認作業を別の場所で行うといった形態が可能となる。その結果、記入内容抽出処理を更に効率的に行うことが可能となる。
《具体例3》
【0084】
具体例3は、具体例1の記入用文書作成装置100に対して、例えば、調査票の印刷データ作成および印刷を専門の業者が行えるよう、調査票画像および埋め込み情報を可搬型の外部記憶装置に蓄積し、これを用いて作業を行えるようにしたものである。
【0085】
〈構成〉
第32図は、具体例3の構成図である。
記入用文書作成装置100aは、文書作成部101、文書画像作成部102および埋め込み情報作成部103からなる。これら構成は具体例1と同様であるため、対応する部分に同一符号を付してその説明を省略する。データ記憶部600は、可搬型の外部記憶装置であり、例えば、MO、CD−ROMあるいはDVD−RAMといった大容量の可搬型記憶媒体であることが望ましい。
印刷処理装置700は、データ記憶部600に格納されている調査票画像および埋め込み情報に基づいて、調査票を印刷する装置であり、文書データ作成部701と文書出力部702を備えている。尚、印刷処理装置700は、例えば、記入用文書作成装置100aとは別の場所に設置されている装置である。印刷処理装置700における文書データ作成部701は、具体例1、2における文書データ作成部104と同様に、文書画像データと埋め込み情報とを一体の文書データとして作成する機能を有している。また、文書出力部702は、具体例1、2における文書出力部105と同様に、文書データ作成部701で作成された文書データを印刷して、記入用文書300を得る機能を有している。
また、具体例3の記入内容抽出装置200については、具体例1と同様であるため、対応する部分に同一符号を付してその説明を省略する。
【0086】
〈動作〉
第33図は、記入用文書300の作成処理を示すフローチャートである。
先ず、ステップS51〜ステップS56までの動作は、具体例1におけるステップS1〜ステップS6までの動作と同様である。即ち、調査票の作成および調査票画像の作成、フォーマット情報、記入箇所検出情報および識別情報の作成、更にこれらの情報を統合することによる埋め込み情報の作成が記入用文書作成装置100aで行われる。
次に、埋め込み情報作成部103から出力された調査票画像および埋め込み情報をデータ記憶部600に格納する(ステップS57)。
【0087】
次に、印刷処理装置700では、データ記憶部600に格納された調査票画像および埋め込み情報のデータから、文書データ作成部701によって、埋め込み情報をドットパターンとして表現した画像データを作成し、これを調査票画像と重ね合わせた文書データを作成する(ステップS58)。そして、文書出力部702は、文書データ作成部701によって作成された文書データを印刷し、記入用文書300として出力する(ステップS59)。
【0088】
〈効果〉
以上のように、具体例3によれば、文書画像データと埋め込み情報を一体の文書データとして記憶するためのデータ記憶部600を設け、このデータ記憶部600の文書データを用いて印刷処理装置700で記入用文書300を印刷するようにしたので次のような効果がある。例えば記入用文書作成装置100aを調査会社に設置し、印刷処理装置700を印刷業者に設置し、また、その間のデータの受け渡しをデータ記憶部600とすることで、調査会社が調査票の印刷を印刷業者に依頼するといった、文書データの作成処理と印刷処理とを別々の場所で行うような形態にも柔軟に対処することが容易に可能となる。
《利用形態》
【0089】
・上記各具体例では、埋め込み情報はドットパターンで表し、かつ、記入箇所検出をドットパターンの検出状態の変化に基づいて行うようにしたが、これらの構成に限定されるものではない。例えば、文書中の文字領域以外の部分に、埋め込み情報を二次元バーコード等を用いて記録するようにしてもよい。この場合、記入箇所検出情報は、例えば何も記入されていない回答欄の画像特徴情報(元画像特徴情報)とする。そして、記入箇所検出部203が行う記入位置の検出処理は、記入後の調査票の回答欄の画像特徴情報を同じように求め、これを元画像特徴情報と比較することで、記入の有無を検出することができる。
【0090】
また、このような画像特徴情報の表し方として、調査票の対象となる領域を複数のブロックに分割し、各ブロックの画像の特徴を抽出する。これには次のような方法がある。
(1)ブロック画像を周波数変換し、周波数スペクトルをサンプリングした値。
(2)ブロック画像に対して、フィルタリング処理(帯域通過フィルタや任意のパターンのテンプレートなどによるフィルタリング処理)を行って得られる値。
(3)ブロック画像中の白い画素(背景領域)と、黒画素(文字領域)の面積の比。
更に、これ以外にも、文字領域の画像特徴量のエッジの長さを用いて記入の有無を検出する、といった方法を用いてもよい。
更に、各具体例において、例えば、フォーマット情報と記入箇所検出情報は、具体例で説明したようにドットパターンで表し、識別情報はバーコードや二次元バーコード等の別手段を用いて表す等、埋め込み情報を複数の方法で表現するようにしてもよい。
【0091】
また、各具体例では、記入箇所検出のための情報は各チェック記入欄および自由記載欄の各ブロック毎に個別に作成するものとして説明したが、これ以外の構成として次のようなものがある。即ち、調査票全体を自由記載欄と見なしてブロックに分割し、その各ブロック毎に個別に作成してもよい。この場合、記入位置と識別されたブロックの位置から、フォーマット情報を用いてどの回答記入位置に回答があったかを判別し、回答データへの変換を行えばよい。このような構成をとった場合、例えば、回答方法として、チェック回答欄にチェック印を記入するのではなく、番号に丸を付けるといった方式である場合、番号に大きく丸を付けたり、丸を付けた位置が多少ずれているような場合でも正確に回答記入位置を検出することができる効果がある。
【0092】
更に、上記具体例3ではデータ記憶部600を可搬型記憶媒体であるとしたが、記入用文書作成装置100aから印刷処理装置700に文書データを転送することができる手段であればどのようなものであってもよく、例えば、これ以外にネットワークといった通信手段であってもよい。
【0093】
以上のように本発明によれば、文書中の記入箇所の位置とその記入内容を判定するためのフォーマット情報と、記入箇所に記入があったか否かを検出するための記入箇所検出情報とを一体に有する記入用文書を作成し、これらフォーマット情報と記入箇所検出情報を用いて、記入文書の記入内容を判定するようにしたので、記入内容を抽出する場合に、予めフォーマット情報等を保持しておく必要がない。従って、どのようなフォーマットであっても対処できるという効果がある。また、ベリファイ入力のための人員確保や、マークシート用紙といった特殊な用紙の準備、およびOCRでの処理に必要なフォーマット情報の伝達や識別番号の記載も不要である。しかも、記入内容の抽出処理では、文字認識を行うのではないため、OCR等の処理に比べて高速にデータ化できるという効果がある。
【図面の簡単な説明】
【0094】
第1図は、本発明の記入内容抽出装置と記入用文書作成装置の具体例1を示す構成図である。
第2図は、具体例1の記入用文書作成処理を示すフローチャートである。
第3図は、調査票画像の説明図である。
第4図は、回答記入領域の説明図である。
第5図は、フォーマット情報の説明図である。
第6図は、信号ユニットの一例を示す図である。
第7図は、画素値の変化を示す説明図である。
第8図は、背景画像の説明図である。
第9図は、ユニットパターンとそのユニットパターンが表すシンボルの一例を示す説明図である。
第10図は、透かし画像の形成処理を示すフローチャートである。
第11図は、シンボルユニット配置可否行列作成の説明図である。
第12図は、ユニットパターン配置可否行列の作成過程の例を示す説明図である。
第13図は、ユニットパターン行列の一例を示す説明図である。
第14図は、ユニット行列の一例を示す説明図である。
第15図は、透かし入り画像作成の一例を示す説明図である。
第16図は、埋め込み信号数記録処理のフローチャートである。
第17図は、ステップS21の説明図である。
第18図は、ステップS22およびステップS23の説明図である。
第19図は、具体例1における記入内容抽出処理のフローチャートである。
第20図は、埋め込み情報取り出し処理の動作フローチャートである。
第21図は、信号領域の検出方法の説明図である。
第22図は、属性領域に埋め込まれたユニット行列の大きさを復元する方法の例を示す説明図である。
第23図は、ステップS42とステップS43の説明図である。
第24図は、ユニットパターン行列から符号語を取り出す方法の例を示す説明図である。
第25図は、埋め込み信号数検出処理の説明図である。
第26図は、フィルタ出力値算出処理の説明図である。
第27図は、最適閾値の判定処理の説明図である。
第28図は、検出信号計数処理の説明図である。
第29図は、画面表示の一例を示す説明図である。
第30図は、具体例2の構成図である。
第31図は、具体例2における記入内容抽出処理の説明図である。
第32図は、具体例3の構成図である。
第33図は、具体例3における記入用文書の作成処理を示すフローチャートである。

Claims (12)

  1. 所定の記入箇所を有する文書の文書画像データを作成する文書画像作成部と、
    前記文書上の記入箇所と記入内容とを示すフォーマット情報と、前記記入箇所に記入があったか否かを検出するための記入箇所検出情報である前記各記入箇所に記録されるシンボルユニット数とを前記文書画像データへの埋め込み情報として作成する埋め込み情報作成部と、
    前記文書画像データと埋め込み情報とを合成して、文書データを作成する文書データ作成部とを備え
    前記文書データ作成部は、前記文書画像データから、所定のフィルタによって所定のシンボルを識別可能なシンボルユニットを埋め込むための埋め込み領域を算出し、該埋め込み領域に対して文字領域の割合が所定の閾値以下であるか否かを判断し、
    文字領域の割合が所定の閾値以下である場合に、前記埋め込み領域の文字領域と重ならない領域に、前記埋め込み情報を成すシンボルを識別可能なシンボルユニットを所定の数埋め込み、前記埋め込み領域の文字領域と重なる領域に背景ユニットを埋め込み、見かけの濃淡が均一となる透かし画像を形成することを特徴とする記入用文書作成装置。
  2. 所定の記入箇所を有する文書の文書画像データを作成する文書画像作成部と、
    前記文書上の記入箇所と記入内容とを示すフォーマット情報と、前記記入箇所に記入があったか否かを検出するための記入箇所検出情報である前記各記入箇所に記録されるシンボルユニット数とを前記文書画像データへの埋め込み情報として作成する埋め込み情報作成部と、
    前記文書画像データと前記埋め込み情報とを一体の文書データとして記憶するデータ記憶部と、
    前記データ記憶部に記憶された前記文書画像データと埋め込み情報とを合成して文書データを作成し、かつ、当該文書データを印刷して記入用文書を出力する印刷処理装置とを備え
    前記印刷処理装置は、前記文書画像データから、所定のフィルタによって所定のシンボルを識別可能なシンボルユニットを埋め込むための埋め込み領域を算出し、該埋め込み領域に対して文字領域の割合が所定の閾値以下であるか否かを判断し、
    文字領域の割合が所定の閾値以下である場合に、前記埋め込み領域の文字領域と重ならない領域に、前記埋め込み情報を成すシンボルを識別可能なシンボルユニットを所定の数埋め込み、前記埋め込み領域の文字領域と重なる領域に背景ユニットを埋め込み、見かけの濃淡が均一となる透かし画像を形成することを特徴とする記入用文書作成装置。
  3. 請求の範囲第1項または第2項に記載の記入用文書作成装置において、
    文書画像データに、ドットパターンで表される埋め込み情報を埋め込んで文書データを作成する文書データ作成部を備えたことを特徴とする記入用文書作成装置。
  4. 請求の範囲第1項〜第3項のいずれかに記載の記入用文書作成装置において、
    文書識別情報を含めて文書データを作成する文書データ作成部とを備えたことを特徴とする記入用文書作成装置。
  5. 記入用文書作成装置を用いて、
    所定の記入箇所を有する文書の文書画像データを作成する文書画像データ作成ステップと、
    前記記入箇所と記入内容とを示すフォーマット情報を作成するフォーマット情報作成ステップと、
    前記記入箇所に記入があったか否かを検出するための記入箇所検出情報である前記各記入箇所に記録されるシンボルユニット数を作成する記入箇所検出情報作成ステップと、
    前記文書画像データと、該文書画像データの埋め込み情報である前記フォーマット情報と前記記入箇所検出情報とを一体の文書データとして作成する文書データ作成ステップとを実行し、
    前記文書データ作成ステップは、前記文書画像データから、所定のフィルタによって所定のシンボルを識別可能なシンボルユニットを埋め込むための埋め込み領域を算出し、該埋め込み領域に対して文字領域の割合が所定の閾値以下であるか否かを判断し、
    文字領域の割合が所定の閾値以下である場合に、前記埋め込み領域の文字領域と重ならない領域に、前記埋め込み情報を成すシンボルを識別可能なシンボルユニットを所定の数埋め込み、前記埋め込み領域の文字領域と重なる領域に背景ユニットを埋め込み、見かけの濃淡が均一となる透かし画像を形成することを特徴とする記入用文書作成方法。
  6. 請求の範囲第5項に記載の記入用文書作成方法において、
    文書データ作成ステップは、文書画像データに、ドットパターンで表される埋め込み情報を埋め込んで文書データを作成するステップであることを特徴とする記入用文書作成方法。
  7. 文書中の記入箇所の位置と当該記入箇所への記入内容を判定するためのフォーマット情報と、前記記入箇所に記入があったか否かを検出するための記入箇所検出情報である前記各記入箇所に記録されるシンボルユニット数とを一体に有する記入用文書から記入内容を抽出する記入内容抽出装置であって、
    前記記入文書に埋め込まれた前記記入用文書のフォーマット情報と記入箇所検出情報を取り出す埋め込み情報取出部と、
    前記フォーマット情報における記入位置の情報と、前記記入箇所検出情報とを用いて記入箇所を検出する記入箇所検出部と、
    前記検出した記入箇所と前記フォーマット情報の記入内容の判定情報とを用いて、記入内容を判定する回答データ変換部とを備え
    前記記入箇所検出部は、前記埋め込み情報から所定のシンボルを識別可能な複数種類のフィルタを備え、
    各埋め込み領域ごとに、前記複数種類のフィルタによりマッチングを行い、
    一つの前記フィルタのマッチング数が他の全てのフィルタのマッチング数に比べて非常に大きい前記埋め込み領域から、前記一つのフィルタに対応する前記埋め込み情報を検出することを特徴とする記入内容抽出装置。
  8. 請求の範囲第7項に記載の記入内容抽出装置において、
    記入箇所検出情報はドットパターンで表され、
    記入箇所検出部は、前記ドットパターンの検出状態の変化に基づいて記入の有無を判定するよう構成されたことを特徴とする記入内容抽出装置。
  9. 請求の範囲第7項または第8項に記載の記入内容抽出装置において、
    自由記載欄を有する記入用文書に対して、前記自由記載欄への記入内容を目視確認するためのイメージ出力を行う目視情報出力部を備えたことを特徴とする記入内容抽出装置。
  10. 記入内容抽出装置を用いて、文書中の記入箇所の位置と当該記入箇所への記入内容を判定するためのフォーマット情報と、前記記入箇所に記入があったか否かを検出するための記入箇所検出情報である前記各記入箇所に記録されるシンボルユニット数とを一体に有する記入用文書から記入内容を抽出する記入内容抽出方法であって、
    前記記入用文書の埋め込み情報であるフォーマット情報と記入箇所検出情報を取り出す埋め込み情報取出ステップと、
    前記フォーマット情報における記入位置の情報と、前記記入箇所検出情報とを用いて記入箇所を検出する記入箇所検出ステップと、
    前記検出した記入箇所と前記フォーマット情報の記入内容の判定情報とを用いて、記入内容を判定する回答データ変換ステップとを備え
    前記記入箇所検出ステップは、各埋め込み領域ごとに、前記複数種類のフィルタによりマッチングを行い、
    一つの前記フィルタのマッチング数が他の全てのフィルタのマッチング数に比べて非常に大きい前記埋め込み領域から、前記一つのフィルタに対応する前記埋め込み情報を検出するステップであることを特徴とする記入内容抽出方法。
  11. 請求の範囲第10項に記載の記入内容抽出方法において、
    記入箇所検出情報はドットパターンで表され、
    記入箇所検出ステップは、前記ドットパターンの検出状態の変化に基づいて記入の有無を判定するステップであることを特徴とする記入内容抽出方法。
  12. 請求の範囲第10項または第11項に記載の記入内容抽出方法において、
    自由記載欄を有する記入用文書に対して、前記自由記載欄への記入内容を目視確認するためのイメージ出力を行う目視情報出力ステップを備えたことを特徴とする記入内容抽出方法。
JP2005503672A 2003-03-17 2004-03-12 記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法 Expired - Fee Related JP4341620B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003072193 2003-03-17
JP2003072193 2003-03-17
PCT/JP2004/003359 WO2004084539A1 (ja) 2003-03-17 2004-03-12 記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法、記入用文書

Publications (2)

Publication Number Publication Date
JPWO2004084539A1 JPWO2004084539A1 (ja) 2006-06-29
JP4341620B2 true JP4341620B2 (ja) 2009-10-07

Family

ID=33027716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005503672A Expired - Fee Related JP4341620B2 (ja) 2003-03-17 2004-03-12 記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法

Country Status (2)

Country Link
JP (1) JP4341620B2 (ja)
WO (1) WO2004084539A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4532349B2 (ja) * 2005-06-07 2010-08-25 株式会社リコー 画像処理方法および画像処理装置および画像処理プログラムおよび記録媒体
JP4672513B2 (ja) * 2005-10-11 2011-04-20 株式会社沖データ 情報処理システム,地紋重畳装置,回答抽出装置,地紋重畳方法,回答抽出方法
AU2007254661A1 (en) 2007-12-24 2009-07-09 Canon Kabushiki Kaisha Printing and authentication of a security document on a substrate
JP5009414B2 (ja) * 2010-12-24 2012-08-22 株式会社沖データ 地紋重畳装置、および地紋重畳方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3247446B2 (ja) * 1992-09-28 2002-01-15 キヤノン株式会社 画像処理装置及び画像処理方法
JP2000168294A (ja) * 1998-12-11 2000-06-20 Ricoh Elemex Corp 電子黒板システム
JP2000196857A (ja) * 1998-12-25 2000-07-14 Canon Inc 印刷装置、情報読取装置、画像処理装置、画像処理システム、情報読取方法、及び記憶媒体
JP3394988B2 (ja) * 1999-03-30 2003-04-07 沖電気工業株式会社 画像処理システム
JP2001338262A (ja) * 2000-05-25 2001-12-07 Oki Electric Ind Co Ltd イメージ認識装置およびイメージ認識装置における画面表示方法
JP3837999B2 (ja) * 2000-06-05 2006-10-25 富士ゼロックス株式会社 画像生成方法および画像生成装置
JP2002007951A (ja) * 2000-06-19 2002-01-11 Hitachi Ltd 帳票入力方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP2002108846A (ja) * 2000-09-27 2002-04-12 Fuji Xerox Co Ltd 文書画像処理装置、文書画像処理方法、および記録媒体

Also Published As

Publication number Publication date
WO2004084539A1 (ja) 2004-09-30
JPWO2004084539A1 (ja) 2006-06-29

Similar Documents

Publication Publication Date Title
US7245740B2 (en) Electronic watermark embedding device, electronic watermark detection device, electronic watermark embedding method, and electronic watermark detection method
JP3964684B2 (ja) 電子透かし埋め込み装置,電子透かし検出装置,電子透かし埋め込み方法,及び,電子透かし検出方法
US7860266B2 (en) Image processing system and image processing method
US7965892B2 (en) Image processing apparatus, control method thereof, and program
KR101016712B1 (ko) 워터마크 정보검출 방법
US7640269B2 (en) Image processing system and image processing method
CN101257545B (zh) 图像处理装置和图像处理方法
JP5015540B2 (ja) 電子透かし埋め込み装置および検出装置
US20030099374A1 (en) Method for embedding and extracting text into/from electronic documents
JP4819723B2 (ja) 情報抽出装置、情報抽出方法、情報抽出プログラム及び記録媒体
KR101535534B1 (ko) 프린터 스테가노그래피 기법을 이용한 위조방지수단이 구비된 문서의 생성 방법 및 그 문서에 대한 위변조 확인 방법
JP5724454B2 (ja) 画像処理装置及び画像処理方法
JP4341620B2 (ja) 記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法
JP4469301B2 (ja) 情報埋め込み装置、印刷用媒体、および、情報読み取り装置
JP4757677B2 (ja) 情報埋込装置、情報埋込方法、情報埋込プログラム及び記録媒体
JP4232676B2 (ja) 情報検出装置,画像処理システム,および情報検出方法
JP5720182B2 (ja) 画像処理装置及び画像処理プログラム
JP4672513B2 (ja) 情報処理システム,地紋重畳装置,回答抽出装置,地紋重畳方法,回答抽出方法
JP4192887B2 (ja) 改ざん検出装置,透かし入り画像出力装置,透かし入り画像入力装置,透かし入り画像出力方法,および透かし入り画像入力方法
JP3822879B2 (ja) 改ざん検証データ入り文書およびその画像、文書出力装置およびその方法、ならびに文書入力装置およびその方法
JP3499294B2 (ja) 書類機密管理方法及び画像処理装置
JP5009414B2 (ja) 地紋重畳装置、および地紋重畳方法
JP5434273B2 (ja) 画像処理装置及び画像処理プログラム
JP4218541B2 (ja) 情報埋込み装置および情報検証装置、ならびにその情報検証方法
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090616

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090629

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130717

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees