JP4359721B2 - 画像処理システム、画像処理方法、及びプログラム - Google Patents

画像処理システム、画像処理方法、及びプログラム Download PDF

Info

Publication number
JP4359721B2
JP4359721B2 JP2007100410A JP2007100410A JP4359721B2 JP 4359721 B2 JP4359721 B2 JP 4359721B2 JP 2007100410 A JP2007100410 A JP 2007100410A JP 2007100410 A JP2007100410 A JP 2007100410A JP 4359721 B2 JP4359721 B2 JP 4359721B2
Authority
JP
Japan
Prior art keywords
information
image data
image processing
character recognition
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007100410A
Other languages
English (en)
Other versions
JP2008259012A (ja
Inventor
隆義 大河内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007100410A priority Critical patent/JP4359721B2/ja
Priority to CN2008100845572A priority patent/CN101282395B/zh
Priority to US12/060,720 priority patent/US8184908B2/en
Publication of JP2008259012A publication Critical patent/JP2008259012A/ja
Application granted granted Critical
Publication of JP4359721B2 publication Critical patent/JP4359721B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/001Sharing resources, e.g. processing power or memory, with a connected apparatus or enhancing the capability of the still picture apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimiles In General (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Facsimile Scanning Arrangements (AREA)

Description

本発明は、画像処理システム、画像処理方法、及びプログラムに関し、より詳細には、名刺など表裏をもつ原稿に対し、その画像情報を複数枚分同時に読み取って文字認識する画像処理システム、画像処理方法、及びプログラムに関する。
従来から、原稿読取装置において名刺などサイズが小さい原稿を光学的に読み込む際、装置の機構上の制限によって自動原稿送りが難しいため、一枚毎に原稿台に載置して原稿の読み込みが実行される。
特許文献1に記載の画像処理システムでは、所定の大きさの名刺が挿入されたケース全体の画像情報が読み取られて、画像データに変換され、この画像データはインターフェース手段を介してコンピュータ側に送出され、コンピュータ側では、この送出され受信された画像データから、挿入された各名刺の範囲領域毎に画像解析がなされ、この画像解析された画像データは当該用紙毎に管理される。このケースとしては透明状のシート(以下、透明シートという)が用いられている。
特開平8−289102号公報
しかしながら、特許文献1に記載のシステムでは、情報が表裏一対で記憶されている名刺等の原稿が複数枚収納された透明シートの表裏を、汎用スキャナで片面ずつ(又は両面を一気に)読み込みOCR(Optical Character Reader)処理・データベース化したとしても、表面と裏面がそれぞれ別のデータとして扱われる。従って、同時に画像データを読み取らせた複数の原稿に対しても、全て手作業で表裏の情報を示すデータを一つのデータとしてまとめ直すという作業が必要であった。
本発明は、上述のごとき実情に鑑みてなされたものであり、情報が表裏一対で印刷された原稿を複数枚収納した透明シートに対し、手間をかけずに情報を同じ原稿の表裏で関連付けて記憶することが可能な画像処理システム、画像処理方法、及びそのシステムに組み込むためのプログラムを提供することを、その目的とする。
上記の課題を解決するために、本発明に係る画像処理システムは、コンピュータと、該コンピュータに接続された画像処理装置とを備えた画像処理システムであって、前記画像処理装置は、文字情報が記述された所定の大きさの原稿を複数枚収納可能な透明シートを光学的に読み取って画像データに変換する読取手段と、該読取手段によって片面全体を光学的に読み取って得た片面の画像データと前記読取手段によって他面全体を光学的に読み取って得た他面の画像データとでなる表裏の画像データを、前記コンピュータに送信する送信手段とを有し、前記コンピュータは、前記画像処理装置から送信された表裏の画像データを受信する受信手段と、該受信手段で受信した表裏の画像データそれぞれに対して、文字認識により前記透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得る文字認識手段と、片面の原稿と他面の原稿との表裏の位置関係を示す予め関連付けされた表裏情報に基づいて、前記文字認識手段で認識された文字情報を、前記データ領域毎に表裏で関連付けて記憶する原稿情報記憶手段とを有し、前記文字認識手段は、前記片面の画像データと前記他面の画像データとで使用言語を異ならしめて文字認識を行うことを特徴としたものである。
本発明に係る画像処理方法は、コンピュータと該コンピュータに接続された画像処理装置とを用いた画像処理方法であって、前記画像処理装置の読取手段が、文字情報が記述された所定の大きさの原稿を複数枚収納可能な透明シートに対し、片面全体を光学的に読み取って片面の画像データに変換するステップと他面全体を光学的に読み取って他面の画像データに変換するステップとでなる読取ステップと、前記画像処理装置の送信手段が、前記読取ステップで得られた表裏の画像データを前記コンピュータに送信する送信ステップと、前記コンピュータの受信手段が、前記送信ステップで前記画像処理装置から送信された表裏の画像データを受信する受信ステップと、前記コンピュータの文字認識手段が、前記受信ステップで受信した表裏の画像データそれぞれに対して、文字認識により前記透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得る認識ステップと、前記コンピュータの原稿情報記憶手段が、片面の原稿と他面の原稿との表裏の位置関係を示す予め関連付けされた表裏情報に基づいて、前記認識ステップで認識された文字情報を、前記データ領域毎に表裏で関連付けて記憶する記憶ステップとを含み、前記文字認識ステップは、前記片面の画像データと前記他面の画像データとで使用言語を異ならしめて文字認識を行うことを特徴としたものである。
本発明に係るプログラムは、画像処理装置に接続可能なコンピュータに組み込むプログラムであって、コンピュータに、文字情報が記述された所定の大きさの原稿を複数枚収納可能な透明シートの表裏を前記画像処理装置で光学的に読み取って得られた表裏の画像データを、前記画像処理装置から受信する受信ステップと、該受信したセットの画像データそれぞれに対して、文字認識により前記透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得る文字認識ステップと、片面の原稿と他面の原稿との表裏の位置関係を示す予め関連付けされた表裏情報に基づいて、前記文字認識ステップで認識された文字情報を、前記データ領域毎に表裏で関連付けて記憶する原稿情報記憶ステップとを実行させるためのプログラムであり、前記文字認識ステップは、前記片面の画像データと前記他面の画像データとで使用言語を異ならしめて文字認識を行うことを特徴としたものである。
本発明によれば、情報が表裏一対で印刷された原稿を複数枚収納した透明シートに対し、手間をかけずに情報を同じ原稿の表裏で関連付けて記憶することが可能となる。
本発明に係る画像処理システムは、コンピュータとそのコンピュータに接続された画像処理装置とを備えたシステムである。この画像処理装置としては、少なくともスキャナの機能、及びコンピュータとの通信機能をもつものとし、以下に例示するデジタル複合機の他、より機能の多い或いは少ない複合機や、単なるスキャナ装置(原稿読取装置)などであっても適用可能である。また、コンピュータとしては、画像処理装置に接続可能で、汎用のコンピュータに後述する所定の制御プログラムが組み込まれたものであればよい。コンピュータと画像処理装置との接続は、有線/無線に限ったものではなく、例示するようにLAN等で画像処理装置に対し複数のコンピュータを接続するようにしてもよいし、単純にUSBケーブル等で接続するなどしてもよい。
図1は、本発明の一実施形態に係る画像処理システムの一構成例を示すブロック図で、図2は、図1の画像処理システムで画像読取を行う透明シートの一例を示す図で、図3は、図1の画像処理システムで使用される表裏情報を説明するための模式図である。
図1において、1はコンピュータ(以下、PCで例示)、2はデジタル複合機(以下、MFPという)、3はLAN等のネットワークを示し、図2において4は透明シートを示し、図3において、5は表面(奇数ページ)の画像データ、6は裏面(偶数ページ)の画像データを示している。
図1で例示するPC1は、キーボードやポインティングデバイス等の操作部11、液晶パネル等の表示部12、ハードディスク等のデータ記憶部13、MFP2とネットワーク3を介して接続可能なLANアダプタ等の通信部14、及びそれらを制御する制御部15から構成される。
制御部15は、後述する名刺サイズ分割部15a、OCR部15b、及び表裏関連登録部15cを有し、画像データの画像解析などPC1の全体を制御する。例えば、制御部15は、CPU、プログラム格納領域としてのROM、作業領域としてのRAM等のハードウェアを備え、ROMやハードディスクに所定の制御プログラムを格納しておくとよい。これにより、ROM等に格納された所定の制御プログラムをCPUでRAM上に読み出して実行させ、各部15a〜15cの機能を含め制御部15の機能を実現することができる。
一方、図1で例示するMFP2は、PC1とネットワーク3を介して接続可能なLANアダプタ等の通信部21、ハードディスク等のデータ記憶部22、原稿を光学的に読み取りするスキャナ部23、スキャナ部23で読み取った画像データやデータ記憶部22に記憶された電子ファイルの印刷が可能なプリンタ部24、タッチパネル等の操作表示部25、及びそれらを制御する制御部26から構成される。
制御部26は、後述する名刺画像送信制御部26aを有し、スキャン、スキャン画像データ生成、印刷データ生成、印刷等、MFP2の全体を制御する。例えば、制御部26も制御部15と同様に、CPU、ROM、RAM等のハードウェアを備え、ROMに所定の制御プログラムを格納しておくことで、名刺画像送信制御部26aの機能を含め制御部26の機能を実現することができる。
次に、上述のごとき構成例に基づき、本発明の主たる特徴部分について説明する。まず、本発明に係る画像処理システムでスキャンの対象となる透明シートは、縦ライン41及び横ライン42で区切るなどして、所定の大きさの原稿を複数枚配列した状態で収納可能なシートである。この透明シートは、本発明の実現のために別途用意しなくてもよく、名刺などを複数枚配列した状態で見やすく収納するための市販の透明シートをそのまま利用すればよい。以下、透明シートとして、図2で例示する2×5の両面名刺収納可能(合計10枚の名刺が収納可能)なA4サイズの透明シート4を挙げて例示するが、これに限らず、名刺以外の原稿でもよく、さらに複数枚の原稿の両面がスキャナ部23で判読可能なような色のシートであればよい。なお、透明シートは、冊子としてファイリングするための穴が横側或いは縦側に複数設けられたものが一般的であるが、これに限ったものではない。また、複数の収納箇所のうちの一部に原稿が実際に収納されていなくても、本発明の処理は可能である。
MFP2は、ユーザが透明シート4を載置して操作表示部25から行った名刺読取操作に対し、片面全体を光学的に読み取って片面の画像データに変換し、他面全体も光学的に読み取って他面の画像データに変換する。MFP2は、さらに変換で得られた表裏(両面)の画像データをネットワーク3を介してPC1に送信する。表裏の画像データは、連続して読み取った透明シート4の表面(又は裏面)の画像データ及び透明シート4の裏面(又は表面)の画像データからなるセットとして定義できる。
MFP2は、これらの処理を名刺画像送信制御部26aでスキャナ23及び通信部21を制御することにより実行する。また、名刺画像送信制御部26aは、表裏の画像データのセットとして送信しなくてもよく、スキャナ部23での透明シート4のスキャンによって片面の画像データを得たときに通信部21で送信し、次に同じく他面の画像データをスキャンで得たときに通信部21で送信するような制御を行ってもよい。片面の画像データと他面の画像データとは、データ名やヘッダなどから判別可能なようMFP2から送信してもよいし、連続する一対の画像データとしてPC1で組み合わせてもよい。
このように、MFP2は、名刺画像送信制御部26a及びスキャナ23、名刺画像送信制御部26a及び通信部21でそれぞれ例示した読取手段、送信手段を備える。
PC1は、通信部14で例示するように、MFP2から送信された表裏の画像データを受信する受信手段を備える。また、PC1は、通信部14で受信した表裏の画像データそれぞれに対して、文字認識により透明シート上の各原稿の収納範囲(上述の所定の大きさの範囲)に対応するデータ領域毎の文字情報を得る文字認識手段を備える。
この文字認識手段では、受信した表裏の画像データそれぞれに対して、名刺サイズ分割部15aが透明シート4上の各原稿の収納範囲に対応するデータ領域毎に分けてから、OCR部15bが各データ領域毎に文字認識を実行する。また、その代替として、文字認識手段では、受信した表裏の画像データそれぞれに対してOCR部15bが文字認識を行った後に、名刺サイズ分割部15aが表面の画像データをデータ領域毎に分け、裏面の画像データもデータ領域毎に分けるようにしてもよい。さらに、データ領域毎の分割はMFP2側で予め実行しておいてもよい。
また、PC1は、表裏関連登録部15c及びその登録先のデータ記憶部13で例示したように、予め関連付けされた表裏情報に基づいて、文字認識手段で認識された文字情報を、データ領域毎に表裏で関連付けて記憶する原稿情報記憶手段とを備える。
ここで、表裏情報は、片面の原稿と他面の原稿との表裏の位置関係(原稿位置関係)を示す情報を指す。表裏情報としては、例えば図2のごとき透明シート4に対し、例えば図3における表面の画像データ5と裏面の画像データ6とで、「表1−1」とその裏の「裏1−2」、「表1−2」とその裏の「裏1−1」、「表2−1」とその裏の「裏2−2」などと表裏の位置関係を対応付けておけばよい。この表裏情報は、表裏関係登録部15cで格納しておくか、或いはデータ記憶部13で格納しておくとよい。
このように名刺の表裏を関連付けしておくことにより、文字認識処理後、表面と裏面とで名刺1枚分のデータとして、データベース化することができる。また、ユーザが透明シート4の裏面を原稿台に載置する場合に逆方向に載置してしまってそのまま読み込んだ場合にも、後述の文字認識により文字方向が分かるので逆向き載置であることが分かる。このとき、逆向け用の対応付けを行っておいてもよいし、一方の画像データを反転させてから処理してもよい。また、表裏情報として正方向用の対応付け及び逆方向用の対応付けを用意しておき、ユーザ選択可能としておいてもよい。
このように、本発明で使用するPC1は、受信した画像データから収納された各原稿の範囲領域毎に、関連付けされた表裏の情報をもとに、両面の画像解析(文字認識等)を行い、画像解析された画像データを当該原稿毎に関連付けて記憶する。
以下、本発明の画像処理システムを、具体的な制御例を挙げて説明する。図4は、図1の画像処理システムで実際に透明シートの両面を読み込んだ一対の画像データの一例を示す図で、図中、50は名刺群の表面の画像データ、60は名刺群の裏面の画像データを示している。図5は、図4の一対の画像データから生成されたデータテーブルの一例を示す図で、図中、7はデータテーブルを示している。図6は、図1の画像処理システムにおける制御の例を説明するためのフロー図で、図7は、図6の制御例におけるデータ登録処理の一例を説明するためのフロー図である。
まず、MFP2の名刺画像送信制御部26aが、ユーザからの操作表示部25から直接なされた或いはPC1を介してなされた指示に基づきモードを設定する(ステップS1)。ここで設定するモードとは、表裏関連付けで自動的に文字認識・記憶を実行するモードを指し、他のモードが設定されているときには以降の処理は実行しない。そして、このモード設定においては、スキャン時の操作の一部として「関連づけが必要な両面原稿(ここでは名刺)か否か」の設定や、「名刺/両面原稿/2×5枚のA4シート」といったようにシートフォーマットの設定も、ユーザ選択させる必要がある。実際、透明シートでない原稿の場合や、透明シート4を使用しているが各ページ表面のみで収納している(つまり裏面には別の名刺を入れている)場合には、表裏関連付けは不要となるためである。
続いて、ユーザが透明シート4を原稿台に載置して操作表示部25から行った名刺読取操作に対し、名刺画像送信制御部26aが片面ずつ読み取りを開始し(ステップS2)、その終了を待つ(ステップS3)。ここで、透明シート4のごときシートに対しては自動原稿送り装置が対応していないことが多いため、基本的には原稿台への載置、並びに裏面での再載置はユーザが実行する。但し、対応した自動原稿送り装置を備え、両面を一度に読み取りしてもよい。
具体的には、図2のような2×5の両面名刺収納A4透明シート4を、片面ずつスキャン又は両面スキャンすることで、例えば図4のように表面(奇数ページ)の画像データ50と、裏面(偶数ページ)の画像データ60とが生成される。なお、画像データ50,60では、一部の画像内容を省略し、図3で説明した表裏情報に基づき表裏対応する箇所に同じ記号E〜Jを付して表記している。
続いて、名刺画像送信制御部26aが、PC1に表裏の画像データを送信し(ステップS4)、その終了を待つ(ステップS5)。ステップS4では、画像データと共に、「モード設定」での選択値をXML等でPC側に送るようにしてもよい。PC1側は、その情報をもとに「関連付けが必要な両面原稿」としてスキャンされた画像であるか否かを判断して、必要に応じて後述するような表裏関連付け処理を実行するようにすればよい。
PC1側では、通信部14がMFP2から受信した画像データ(スキャン画像)に基づいて、名刺サイズ分割部15aが、表裏関連付け処理と、名刺サイズのm個分(図4の例の場合m=10)の領域の切り出し(領域分割)を実行する(ステップS6)。
ここでの、表裏関連付け処理とは受信した2つの画像データに対する関連付け処理であり、受信した画像データが一対としてセットであればそのセットである旨を確認するだけの処理となり、セットでなく順次送信されてくる場合には連続する2枚の画像データを表裏の画像データとして関連付ける処理である。
続いて、OCR部15bが、n=1に設定し(ステップS7)、切り出された表面の領域nについてOCR解析を開始し(ステップS8)、その終了を待つ(ステップS9)。その後、OCR部15bが、図3で例示した表裏情報を参照してステップS8でOCR解析対象となった領域nについて、その裏面の領域を検出し、その裏面の領域nに対してOCR解析を開始し(ステップS10)、その終了を待つ(ステップS11)。表裏関連登録部15cが、ステップS8,S10での解析結果(文字認識結果)に基づき、表裏の領域nに対する解析結果を、後述するように1データとしてデータ記憶部13に登録する(ステップS12)。
ステップS12では、データ記憶部13に、データテーブル7で例示するようにアドレス帳などのデータベースとして登録することができる。これにより、表面の領域nが図3の「表1−1」を読み取った画像領域(図4の名刺画像51)であった場合、その名刺画像51に含まれる各情報51a〜51eは、対応する裏面の領域n(図3の「裏1−2」を読み取った画像領域)である名刺画像61に含まれる各情報61a〜61eと関連付けられて、データテーブル7に登録される。ここでは、表面の領域nを基準として説明するが、名刺画像61にはメールアドレスの情報61fが存在し、その表面にはメールアドレスの情報が存在しない。このような場合に対応するため、情報が多い方(ここでは裏面の名刺画像61)の領域数をnとして以下の処理を実行すれば、領域61fに対応する領域が表面に存在しないことが分かるため、領域61fの情報のみをデータテーブル7に登録できる。
ステップS12の後、OCR部15bが、n=mになったかを判定し(ステップS13)、YESであれば処理を終了し、NOであれば、nをインクリメントし(ステップS14)、ステップS8に戻り、残りの領域に対してもステップS8〜S13の処理を繰り返す。このような繰り返しにより、全ての名刺画像に対してデータテーブル7への登録が可能となる。例えば、図4において、名刺画像52内の各情報は名刺画像62内の各情報と関連付けられ、名刺画像53内の各情報は名刺画像63内の各情報と関連付けられ、名刺画像54内の各情報は名刺画像64内の各情報と関連付けられ、表の名刺画像E〜J内の各情報はそれぞれ裏の名刺画像E〜J内の各情報と関連付けられ、データテーブル7に登録される。
ステップS12では、図7に例示するように、表裏関連登録部15cが、領域nの裏面は白紙であるか否かを判定し(ステップS21)、白紙の場合には文字認識により個々に得られた表面のみのデータ項目をデータ記憶部13へ登録し(ステップS26)、処理を終了する。例えば、図4の裏面の名刺画像64は白紙であり、このような場合ステップS26の処理がなされる。一方、ステップS21で白紙でなかった場合には、領域nの両面の文字情報を用いてデータ記憶部13への登録を実行し(後述のステップS22〜S25)、処理を終了する。なお、ステップS22〜S25の順序は問わない。
このように、PC1は、受信した表裏の画像データそれぞれに対して、文字認識の前にデータ領域毎に画像解析を行い白紙か否かを判定する白紙判定手段を備えることが好ましい。そして、文字認識は、この白紙判定手段で白紙であると判定されたデータ領域に対しては文字認識を実行しないようにしておくとよい。そして、表裏関連登録部15cは、白紙判定手段で白紙であると判定されたデータ領域と表裏関係にあるデータ領域が、白紙であると判定されず文字認識できた場合に、文字認識ができた方の文字情報のみを記憶すればよい。画像解析の際、一方の面が白紙であることを検知した場合、他方の面にある画像データのみ記憶することで、裏面がない名刺であれば、表面のデータのみ記憶することができ、データの少量化を図れる。
また、このような白紙判定手段を設けない場合には、表裏関連登録部15cは、表裏関係にあるデータ領域に対して双方文字認識を施した結果としての文字情報のセットのうち、一方の文字情報に文字が存在しない場合には、他方の文字情報のみを記憶するとよい。このような形態においても、一方の面が白紙である場合には文字がない状態で認識されるため、他方の面にある画像データのみ記憶することで、裏面がない名刺であれば、表面のデータのみ記憶することができ、データの少量化を図れる。
ステップS22では、領域nに対し、裏面の名前(例えば図4の情報61b)を読み仮名として翻訳し、表面の名前(例えば図4の情報51b)と関連付けて登録し、ステップS23では、領域nに対し、裏面の住所(例えば図4の情報61c)を読み仮名として翻訳し、表面の住所(例えば図4の情報51c)と関連付けて登録する。
このように、OCR部15bは、片面の画像データと他面の画像データとで使用言語を異ならしめて文字認識を行うようにしてもよい。これにより、表面の画像データと裏面の画像データは言語が異なっていても、関連付けて登録することができる。但し表面も「FAX」などの英語表記があるが、十分日本語辞書データで対応可能なものとして取り扱える。
さらに、ステップS22,S23のように、表裏関連登録部15cは、表裏関係にあるデータ領域に対して認識された文字情報のセットに対しては、各文字情報が同一内容の情報(項目の情報、例えば名前情報51bと名前情報61b等)を含んでいた場合、同一内容の情報同士を関連付けて記憶することが好ましい。これにより、例えば名前や住所や会社名の英語版と日本語版を関連付けて登録することができる。
さらに、ステップS22,S23のように、同一内容の情報同士の関連付けは、一方の面の情報を他方の面の情報の言語に翻訳して実行することが好ましい。これにより、例えば名前や住所や会社名の英語版の翻訳である読み仮名と日本語版を関連付けて登録することができる。勿論、翻訳の元となった英語表記も残したままデータテーブル7への登録を行ってもよい。
ステップS24では、FAX番号、TEL番号、メールアドレス等、表面と裏面に同一のデータ項目があれば、表面(又は裏面)のデータのみを登録する。このように、表裏関連登録部15cは、表裏関係にあるデータ領域に対して認識された文字情報のセットに対し、各文字情報が同一表記の情報を含んでいた場合、一方の情報は記憶しないようにすることが好ましい。同一の内容を示す項目のうちでメールアドレスやFAX番号などのように表裏と表記が同一であれば、重複するデータの重複登録を防ぐことができ、データ量の増大を防ぐことができる。また、電話番号やFAX番号などは国番号が含まれていた場合に、国番号を省いて登録するようにしてもよい。
ステップS25では、ステップS22〜S24に該当しないその他のデータ項目を表面と裏面とで関連付けて登録する。このように、PC1の制御部15は、名刺サイズ分割部15aによりスキャン画像に基づいて名刺サイズに分割することで、一枚毎の表面の名刺画像データ及び裏面の名刺画像データを生成し、表面と裏面の名刺の画像データは、OCR部15bにより名刺に含まれる各文字情報を認識し、その認識結果を表裏関連登録部15cにより表面と裏面で関連付けて登録する。
以上のごとき登録により、データ記憶部13には、図5で例示するように、自動付与したID70と共に、名前71、名前(読み仮名)72、会社73、会社(読み仮名)74、住所75、住所(読み仮名)76、電話番号77、FAX番号78、及びメールアドレス79を含むデータテーブル7が格納されることとなる。なお、情報に対応する読み仮名の情報は、名前71と名前(読み仮名)72とのように隣に格納すると見易くなる。
また、名刺画像52のように、画像解析の結果、文字ではなく画像として認識された顔写真等の画像データ52Pが存在した場合には、添付された画像として処理すればよく、データとしてはその画像を保存し、保存先をデータテーブル7に格納すればよい。また、データ記憶部13は、受信した一対の画像データそのものも記憶するようにしてもよく、その場合、データテーブル7にその保存先を示す情報を付加しておいてもよい。
また、図6及び図7では、1シート分の処理についてのみ説明したが、実際は複数シートを連続的にスキャンする処理も考えられる。その場合は、表面だけのスキャン画像を複数枚送った後、裏面だけのスキャン画像を複数枚送った場合、表面の一枚目と裏面の一枚目の関連付け、表面の二枚目と裏面の二枚目の関連付け、といった具合に、枚数に合わせて関連付けを行うとよい。若しくは、表面、裏面のスキャンを繰り返し、それら2枚ずつをセットとして関連付けを行ってもよい。また、スキャン自体は、自動原稿送り装置を使用して実行しても、使用せずに原稿台に手作業で載置して行ってもよい。
また、図6では、ステップS1〜S5までをMFP2側の処理として説明し、ステップS6〜S14をPC1側の処理として説明したが、MFP2の操作表示部25での「モード設定」で、「名刺/両面原稿/2×5 A4シート」といったように、シートのフォーマットまでを選ばせ、MFP2側で名刺毎の表裏関連付け処理を実行しておいてもよい。ここでいう名刺毎の表裏関連付け処理とは、1名刺領域毎の切り出し処理、表裏画像を1画像データに合成する(対の画像データとして関連付けするだけで合成はしなくてもよい)までが該当する。いずれの場合にも、上述した文字認識手段で、受信した表裏の画像データそれぞれに対して、文字認識により透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得ることができ、上述した原稿情報記憶手段で、表裏情報に基づいて、認識された文字情報をデータ領域毎に表裏で関連付けて記憶することが可能であればよい。
上述のように、複数枚の名刺が収納された透明シートの表裏を、汎用スキャナで片面ずつ(又は両面を一気に)読み込むような場合であっても、表裏の関連付け処理を「自動で適切に行う」ことによって、表面と裏面で名刺1枚分のデータとして扱えるようになるため、表裏のデータを一つのデータとしてデータベース化することが可能となる。すなわち、1シートに複数枚の名刺を収納できる複数枚の透明シートから成る名刺ホルダに名刺を収納し、それら複数枚の名刺を一度に読み込み、自動的にOCR処理・データベース化することができるようなシステムにおいて、特に両面印刷された名刺が収納された透明シートの両面スキャンを実行して、その表裏の関連付けを行うことができる。従って、本発明では、従来技術で必要となっていた作業、すなわち全ての名刺に対し表裏の情報を示すデータを一つのデータとしてまとめ直すという手作業が、必要無くなる。
以上、図1乃至図7を参照しながら、本発明の画像処理システムについて各実施形態を説明してきたが、その制御の流れを説明したように、本発明はPC1等のコンピュータ及びMFP2等の画像処理装置を用いた画像処理方法としての形態も採り得る。
また、本発明は、画像処理装置に組み込むプログラムやコンピュータに組み込むプログラムとしての形態も採り得る。これらプログラムは、制御部26内の制御プログラムや制御部15内の制御プログラムとして例示したものである。
例えば、MFP2用のプログラムは、スキャナ部23、PC1との通信が可能な通信部21、及び制御部26を備えたMFP2に組み込むものであり、制御部26に、本発明のごとき透明シートの読み込みを実行する操作をユーザから受け付けると、スキャナ23で透明シートを両面読み込み、PC1に表裏の画像データを送信する処理を実行させるためのプログラムである。
また、PC1用のプログラムは、MFP2との通信が可能な通信部22、及び制御部21を有するPC1に組み込むためのプログラムである。このプログラムは、制御部15(制御部15内のCPU)に、MFP2で所定の大きさの原稿を複数枚収納可能な透明シートの表裏を光学的に読み取って得られた表裏の画像データを、MFP2から受信する受信ステップと、受信した表裏の画像データそれぞれに対して、文字認識により透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得る文字認識ステップと、予め関連付けされた表裏情報に基づいて、文字認識ステップで認識された文字情報を、データ領域毎に表裏で関連付けて記憶する原稿情報記憶ステップとを実行させるためのプログラムである。
そして、このようなプログラムは、それを記録したコンピュータ読み取り可能な記録媒体としての配布することやネットワーク経由で配信することができ、画像処理装置やコンピュータに実行可能に組み込むことができる。
本発明の一実施形態に係る画像処理システムの一構成例を示すブロック図である。 図1の画像処理システムで画像読取を行う透明シートの一例を示す図である。 図1の画像処理システムで使用される表裏情報を説明するための模式図である。 図1の画像処理システムで実際に透明シートの両面を読み込んだ一対の画像データの一例を示す図である。 図4の一対の画像データから生成されたデータテーブルの一例を示す図である。 図1の画像処理システムにおける制御の例を説明するためのフロー図である。 図6の制御例におけるデータ登録処理の一例を説明するためのフロー図である。
符号の説明
1…コンピュータ(PC)、2…デジタル複合機(MFP)、3…ネットワーク、4…透明シート、5…表面(奇数ページ)の画像データ、6…裏面(偶数ページ)の画像データ、7…データテーブル、11…操作部、12…表示部、13…PC側のデータ記憶部、14…PC側の通信部、15…PC側の制御部、15a…名刺サイズ分割部、15b…OCR部、15c…表裏関連登録部、21…MFP側の通信部、22…MFP側のデータ記憶部、23…スキャナ部、24…プリンタ部、25…操作表示部、26…MFP側の制御部、26a…名刺画像送信制御部、50…名刺群の表面の画像データ、60…名刺群の裏面の画像データ。

Claims (10)

  1. コンピュータと、該コンピュータに接続された画像処理装置とを備えた画像処理システムにおいて、
    前記画像処理装置は、文字情報が記述された所定の大きさの原稿を複数枚収納可能な透明シートを光学的に読み取って画像データに変換する読取手段と、該読取手段によって片面全体を光学的に読み取って得た片面の画像データと前記読取手段によって他面全体を光学的に読み取って得た他面の画像データとでなる表裏の画像データを、前記コンピュータに送信する送信手段とを有し、
    前記コンピュータは、前記画像処理装置から送信された表裏の画像データを受信する受信手段と、該受信手段で受信した表裏の画像データそれぞれに対して、文字認識により前記透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得る文字認識手段と、片面の原稿と他面の原稿との表裏の位置関係を示す予め関連付けされた表裏情報に基づいて、前記文字認識手段で認識された文字情報を、前記データ領域毎に表裏で関連付けて記憶する原稿情報記憶手段とを有し、
    前記文字認識手段は、前記片面の画像データと前記他面の画像データとで使用言語を異ならしめて文字認識を行うことを特徴とする画像処理システム。
  2. 前記コンピュータは、前記受信手段で受信した表裏の画像データそれぞれに対して、前記文字認識手段での文字認識の前に、前記データ領域毎に画像解析を行い、白紙か否かを判定する白紙判定手段を有し、前記文字認識手段は、少なくとも前記白紙判定手段で白紙であると判定されたデータ領域に対しては文字認識を実行しないことを特徴とする請求項に記載の画像処理システム。
  3. 前記原稿情報記憶手段は、前記白紙判定手段で白紙であると判定されたデータ領域と表裏関係にあるデータ領域が、白紙であると判定されず前記文字認識手段で文字認識できた場合に、文字認識ができた方の文字情報のみを記憶することを特徴とする請求項に記載の画像処理システム。
  4. 前記原稿情報記憶手段は、前記文字認識手段で表裏関係にあるデータ領域に対して認識された文字情報のセットのうち、一方の文字情報に文字が存在しない場合には、他方の文字情報のみを記憶することを特徴とする請求項に記載の画像処理システム。
  5. 前記文字認識手段は、前記受信手段で受信した表裏の画像データそれぞれに対して、前記データ領域毎に分けて文字認識を実行するか、或いは、前記受信手段で受信した表裏の画像データそれぞれに対して文字認識を行った後に前記データ領域毎に分けることを特徴とする請求項1乃至4のいずれか1項に記載の画像処理システム。
  6. 前記原稿情報記憶手段は、前記文字認識手段で表裏関係にあるデータ領域に対して認識された文字情報のセットに対し、各文字情報が同一内容の情報を含んでいた場合、前記同一内容の情報同士を関連付けて記憶することを特徴とする請求項1乃至5のいずれか1項に記載の画像処理システム。
  7. 前記同一内容の情報同士の関連付けは、一方の面の情報を他方の面の情報の言語に翻訳して実行することを特徴とする請求項に記載の画像処理システム。
  8. 前記原稿情報記憶手段は、前記文字認識手段で表裏関係にあるデータ領域に対して認識された文字情報のセットに対し、各文字情報が同一表記の情報を含んでいた場合、一方の情報は記憶しないことを特徴とする請求項1乃至のいずれか1項に記載の画像処理システム。
  9. コンピュータと該コンピュータに接続された画像処理装置とを用いた画像処理方法において、
    前記画像処理装置の読取手段が、文字情報が記述された所定の大きさの原稿を複数枚収納可能な透明シートに対し、片面全体を光学的に読み取って片面の画像データに変換するステップと他面全体を光学的に読み取って他面の画像データに変換するステップとでなる読取ステップと、
    前記画像処理装置の送信手段が、前記読取ステップで得られた表裏の画像データを前記コンピュータに送信する送信ステップと、
    前記コンピュータの受信手段が、前記送信ステップで前記画像処理装置から送信された表裏の画像データを受信する受信ステップと、
    前記コンピュータの文字認識手段が、前記受信ステップで受信した表裏の画像データそれぞれに対して、文字認識により前記透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得る文字認識ステップと、
    前記コンピュータの原稿情報記憶手段が、片面の原稿と他面の原稿との表裏の位置関係を示す予め関連付けされた表裏情報に基づいて、前記文字認識ステップで認識された文字情報を、前記データ領域毎に表裏で関連付けて記憶する記憶ステップとを含み、
    前記文字認識ステップは、前記片面の画像データと前記他面の画像データとで使用言語を異ならしめて文字認識を行うことを特徴とする画像処理方法。
  10. 画像処理装置に接続可能なコンピュータに組み込むプログラムであって、当該プログラムは、コンピュータに、文字情報が記述された所定の大きさの原稿を複数枚収納可能な透明シートの表裏を前記画像処理装置で光学的に読み取って得られた表裏の画像データを、前記画像処理装置から受信する受信ステップと、該受信した表裏の画像データそれぞれに対して、文字認識により前記透明シート上の各原稿の収納範囲に対応するデータ領域毎の文字情報を得る文字認識ステップと、片面の原稿と他面の原稿との表裏の位置関係を示す予め関連付けされた表裏情報に基づいて、前記文字認識ステップで認識された文字情報を、前記データ領域毎に表裏で関連付けて記憶する原稿情報記憶ステップとを実行させるためのプログラムであり、前記文字認識ステップは、前記片面の画像データと前記他面の画像データとで使用言語を異ならしめて文字認識を行うことを特徴とするプログラム。
JP2007100410A 2007-04-06 2007-04-06 画像処理システム、画像処理方法、及びプログラム Active JP4359721B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007100410A JP4359721B2 (ja) 2007-04-06 2007-04-06 画像処理システム、画像処理方法、及びプログラム
CN2008100845572A CN101282395B (zh) 2007-04-06 2008-03-25 图像处理系统及图像处理方法
US12/060,720 US8184908B2 (en) 2007-04-06 2008-04-01 Image processing system, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007100410A JP4359721B2 (ja) 2007-04-06 2007-04-06 画像処理システム、画像処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2008259012A JP2008259012A (ja) 2008-10-23
JP4359721B2 true JP4359721B2 (ja) 2009-11-04

Family

ID=39982133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007100410A Active JP4359721B2 (ja) 2007-04-06 2007-04-06 画像処理システム、画像処理方法、及びプログラム

Country Status (3)

Country Link
US (1) US8184908B2 (ja)
JP (1) JP4359721B2 (ja)
CN (1) CN101282395B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9519829B2 (en) 2013-11-28 2016-12-13 Ricoh Company, Ltd. Image processing system, information processing apparatus, and recordable medium

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8411956B2 (en) * 2008-09-29 2013-04-02 Microsoft Corporation Associating optical character recognition text data with source images
JP4843705B2 (ja) * 2009-11-20 2011-12-21 株式会社東芝 名刺読取装置
JP2012096434A (ja) * 2010-11-01 2012-05-24 Kyocera Mita Corp 画像形成装置及び画像形成プログラム
CN102831625B (zh) * 2011-06-13 2016-01-06 深圳富泰宏精密工业有限公司 双面图片处理系统和方法
JP6157146B2 (ja) * 2012-03-29 2017-07-05 キヤノン株式会社 読み取り装置及びその制御方法
CN102833449B (zh) * 2012-07-27 2015-06-10 富士施乐实业发展(中国)有限公司 一种基于多功能机的文档自动处理方法
CN104883467B (zh) * 2014-02-28 2019-01-11 日本冲信息株式会社 图像形成装置以及方法
CN105472202A (zh) * 2014-08-25 2016-04-06 日本冲信息株式会社 图像形成装置和图像形成方法
US9923991B2 (en) 2015-08-31 2018-03-20 Microsoft Technology Licensing, Llc Automatic online registration based on data extracted from a digital image
US10127469B2 (en) * 2015-08-31 2018-11-13 Microsoft Technology Licensing, Llc Leveraging digital images of user information in a social network
JP6620582B2 (ja) * 2016-02-09 2019-12-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6690278B2 (ja) * 2016-02-10 2020-04-28 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2019045932A (ja) * 2017-08-30 2019-03-22 セイコーエプソン株式会社 処理装置、処理システム、処理方法および処理プログラム
CN110138992A (zh) * 2018-02-08 2019-08-16 精工爱普生株式会社 收据处理装置、程序的存储介质以及报告的制作方法
JP6935809B2 (ja) * 2019-03-14 2021-09-15 セイコーエプソン株式会社 情報処理装置、およびプログラム
JP2022140886A (ja) 2021-03-15 2022-09-29 富士フイルムビジネスイノベーション株式会社 画像読取装置及び画像読取プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07306927A (ja) 1994-05-11 1995-11-21 Matsushita Electric Ind Co Ltd 電子ファイル装置
US5717941A (en) 1994-05-11 1998-02-10 Matsushita Electric Industrial Co., Ltd. Electronic file system for storing documents with front and back pages
JPH08289102A (ja) 1995-04-14 1996-11-01 Canon Inc 画像処理システム
JP2002288169A (ja) * 2001-03-26 2002-10-04 Sharp Corp 画像形成装置
JP4067870B2 (ja) * 2002-05-14 2008-03-26 シャープ株式会社 画像読取り装置
CN1520148A (zh) * 2003-01-24 2004-08-11 力捷电脑股份有限公司 双面扫描装置的运作方法
JP2006261821A (ja) 2005-03-15 2006-09-28 Fuji Xerox Co Ltd 画像形成装置および画像読み取り装置
JP2006339770A (ja) * 2005-05-31 2006-12-14 Canon Inc 画像処理システムおよびその制御方法
JP4795038B2 (ja) 2006-02-01 2011-10-19 キヤノン株式会社 名刺管理システム、はがき管理システム、名刺管理方法およびはがき管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9519829B2 (en) 2013-11-28 2016-12-13 Ricoh Company, Ltd. Image processing system, information processing apparatus, and recordable medium
US9866725B2 (en) 2013-11-28 2018-01-09 Ricoh Company, Ltd. Image processing system, information processing apparatus, and recordable medium

Also Published As

Publication number Publication date
US8184908B2 (en) 2012-05-22
US20080298686A1 (en) 2008-12-04
CN101282395B (zh) 2011-05-11
CN101282395A (zh) 2008-10-08
JP2008259012A (ja) 2008-10-23

Similar Documents

Publication Publication Date Title
JP4359721B2 (ja) 画像処理システム、画像処理方法、及びプログラム
US7864353B2 (en) Document processing system using imbedded metadata and method using the same
US7414743B2 (en) Print control apparatus, method and program using a tag of a document list for printing a plurality of documents in various formats
JP4807068B2 (ja) 画像読取システム
US9521279B2 (en) Image reproducing method and digital processing machine using such method
JP2009164719A (ja) 通信装置
US20060050292A1 (en) Data management device and method, image output device, and computer program product
US8175880B2 (en) Image processing apparatus, image processing method and recording medium
US20030233414A1 (en) Digital transmitting from remote capture
JP2020184276A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2009164721A (ja) 画像処理装置
US7783111B2 (en) Writing image acquisition apparatus, writing information extraction method, and storage medium
JP7187145B2 (ja) 画像送信装置、画像送信装置の制御方法、及びプログラム
US11838457B2 (en) Image processing apparatus, control method, for directly registering image data received by the image forming apparatus as voucher data in an expense processing system without printing the image data
JP4766089B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
TWI549472B (zh) 影像複製方法以及使用該方法之事務機與文件處理系統
JP5821186B2 (ja) 画像情報入力システム、画像情報入力装置、画像情報入力方法、画像情報入力プログラム及び記録媒体
JP4683628B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN111669478A (zh) 图像处理装置、图像处理系统、存储介质及图像处理方法
US20090284789A1 (en) Information displaying and printing system
JP5963643B2 (ja) 画像形成装置及び画像形成方法
JP4118797B2 (ja) インターネットファクシミリ装置
JP2009141771A (ja) 印刷装置
JP2007280264A (ja) ジョブフロー指定プログラム、ジョブフロー指定方法及びジョブフロー実行システム
JP6772595B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090727

R150 Certificate of patent or registration of utility model

Ref document number: 4359721

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130821

Year of fee payment: 4