JP2013131922A - 情報処理装置、その制御方法、及びプログラム - Google Patents

情報処理装置、その制御方法、及びプログラム Download PDF

Info

Publication number
JP2013131922A
JP2013131922A JP2011280266A JP2011280266A JP2013131922A JP 2013131922 A JP2013131922 A JP 2013131922A JP 2011280266 A JP2011280266 A JP 2011280266A JP 2011280266 A JP2011280266 A JP 2011280266A JP 2013131922 A JP2013131922 A JP 2013131922A
Authority
JP
Japan
Prior art keywords
character
image data
data
information processing
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011280266A
Other languages
English (en)
Inventor
Noriko Itakura
紀子 板倉
Hiroshi Hashimoto
紘 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Canon MJ IT Group Holdings Inc
Original Assignee
Canon Marketing Japan Inc
Canon MJ IT Group Holdings Inc
Canon Software Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon MJ IT Group Holdings Inc, Canon Software Inc filed Critical Canon Marketing Japan Inc
Priority to JP2011280266A priority Critical patent/JP2013131922A/ja
Publication of JP2013131922A publication Critical patent/JP2013131922A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

【課題】画像データに含まれる文字の読み取り成否に応じて、圧縮率を変更すること。
【解決手段】文字含む画像データを取得して、当該画像データに対して文字読み取りのためのOCR処理を実行する。OCR処理の成否を画像データに含まれる文字ごとに記憶しておき、画像データを圧縮する場合に、OCR処理が失敗した文字が含まれる領域には圧縮率を低くして圧縮を行い、OCR処理が成功した文字が含まれる領域には圧縮率を高くして圧縮を行う。こうすることで、OCR処理が失敗した文字の可読性を保ちつつ、画像データのデータサイズを削減できる。
【選択図】図6

Description

本発明は、画像データのデータ圧縮に関し、特に文字の読み取りの成否によってデータ圧縮率を変更する情報処理装置、その制御方法、及びプログラムに関する。
従来、情報処理装置をはじめとする各種装置では様々なデータを記憶している。装置が記憶可能な容量は装置に接続された外部メモリやメモリーカードごとに限界があり、その容量を超えて記憶することはできない。よって、記憶するデータの容量(データサイズ)が大きいと、装置の外部メモリ等を圧迫してしまう。特にデジタルカメラや携帯端末の容量はあまり多くない上、撮影されることによって生成される画像データのデータサイズが大きいため、デジタルカメラや携帯端末の容量を圧迫しやすい。
そこで、撮影された画像データを圧縮して、データサイズを小さくすることが考えられる。画像データの圧縮方式としては、JPEG(Joint Photographic Expert Group)がある。JPEG形式では、量子化と符号化を行い、非可逆圧縮を実現している。まず画像を8×8ピクセル単位のブロックに分割し、1ブロック毎に離散コサイン変換を行い、色成分を周波数に変換する。そしてブロック単位に量子化を行い、人があまり差を意識できない高周波成分を間引く。その後、ランレングス符号化とハフマン符号化を行い、データを圧縮している。
例えば下記の特許文献1には、画像データを圧縮する場合に、文字部分と画像部分に分けて、文字部分は画像圧縮に影響しない黒色の文字フォントに置換して圧縮することでそれぞれに対して適切な画像圧縮を行って、当該画像データを表示する場合には合成して表示させることで、圧縮しつつも画像データを劣化させずに記憶可能な仕組みが開示されている。
特開平5−328147号公報
一方、画像データに対してOCR(Optical Character Recognition)処理を行い、取得したテキストデータを記憶する仕組みが存在する。特にこのような仕組みはMFP(Multifunction Printer)でスキャンした文書のテキストをテキストデータとして抽出したり、携帯端末で名刺を撮影して名刺のデータベースに登録したりすることに利用される。
このようにOCR処理された画像データは破棄されるのではなく、確認用に保存しておくことが多い。特に名刺の場合には、旧字体のような複雑な漢字を使用した名前であった場合に、OCR処理を失敗することが多く、名刺を撮影した画像データを取っておいてあとで見返す必要がある。
しかしながら、画像データを圧縮してデータサイズを削減しないと、装置の容量を圧迫してしまう問題がある。特に名刺管理を行う携帯端末では記憶可能な容量が少ないので、画像データを大量に記憶しておくことは難しい。
そこで、本発明の目的は、画像データに含まれる文字の読み取り成否に応じて、圧縮率を変更することの可能な仕組みを提供することである。
上記の目的を達成するために、本発明の情報処理装置は、文字を含む画像データを管理する情報処理装置であって、前記画像データに含まれる文字を読み取る文字読取手段と、前記文字読取手段で読み取られた文字のうち、読み取りが失敗した文字を読取失敗文字データとして特定する読取失敗文字データ特定手段と、前記画像データのデータサイズを削減するべく、前記文字読取手段で読み取られた画像データの圧縮を行う画像データ圧縮手段とを備え、前記画像データ圧縮手段は、前記読取失敗文字データ特定手段で特定された読取失敗文字データを含む領域に対して圧縮率の低い圧縮を行い、前記読取失敗文字データ特定手段で特定された読取失敗文字データを含まない領域に対して圧縮率の高い圧縮を行うことを特徴とする。
本発明によれば、画像データに対して文字の読み取りを行い、読み取りが成功した文字の領域は圧縮率を高くし、読み取りが失敗した文字の領域は圧縮率を低くすることが可能となるので、あとで見返した場合であってもユーザが確認でき、かつ画像データの容量を削減することのできる効果を奏する。
本発明の実施形態における情報処理システム100の一例を示す構成図である。 図1に示す情報処理装置101及びサーバ102のハードウェア構成の一例を示す構成図である。 図1に示す情報処理装置101及びサーバ102のモジュール構成の一例を示す構成図である。 本発明の実施形態における一連の処理の流れを示すフローチャートである。 図4のステップS104における名刺撮影処理の詳細を示すフローチャートである。 図5のステップS211における画像データ圧縮処理の詳細を示すフローチャートである。 図4のステップS106における名刺閲覧処理の詳細を示すフローチャートである。 本実施例における名刺データテーブル800の構成の一例を示す構成図である。 本実施例におけるメニュー画面900の一例を示す構成図である。 本実施例における撮影画面1000の一例を示す構成図である。 本実施例における名刺データ編集画面1100の一例を示す構成図である。 本実施例における画像データの圧縮方法の一例を示す模式図である。 本実施例における名刺データ閲覧画面1300の一例を示す構成図である。
以下、図面を参照して、本発明の実施の形態の一例について説明する。
図1は、本発明の情報処理システム100のシステム構成の一例を示す図である。本発明の情報処理システム100は、情報処理装置101、サーバ102が設置されており、それら装置はLAN(Local Area Network)等のネットワーク103を介して相互にデータ通信可能に接続されている。図1のネットワーク103上に接続される各種端末あるいはサーバの構成は一例であり、用途や目的に応じて様々な構成例があることは言うまでもない。
情報処理装置101は、名刺管理アプリケーションを実行する装置である。名刺管理アプリケーションは後述する図2のROM202または外部メモリ211に記憶されており、ユーザからの指示に応じて、CPU201がRAM203に読み出して各種動作を行う。尚、本実施例においては、情報処理装置101は携帯端末のようなデバイスを想定して説明を行うが、PC(Personal computer)でもMFPでもよいし、その他の装置でもよい。
名刺管理アプリケーションは、ユーザからの操作に応じて名刺を撮影し、撮影された名刺の画像データに対してOCR処理を行う。そして、OCR処理で得られたテキストデータと撮影された名刺の画像データとを記憶して、データベースを構築するものである。本実施例においては名刺管理を基に説明するが、これに限らない。尚、名刺管理アプリケーションで表示する各種情報は情報処理装置101と通信可能に接続されたサーバ102に記憶されても、情報処理装置101の外部メモリ211に記憶されてもよい。
サーバ102は、情報処理装置101で作成された各種データを記憶管理する装置である。名刺管理アプリケーションで取り扱う各種データは、ユーザごとに記憶される。
尚、情報処理装置101が、サーバ102の構成を含んでもよいし、サーバ102が情報処理装置101の構成を含んでもよい。また、本実施例においては、情報処理装置101に各種データが記憶され、ユーザからの操作によって動作させる形態に基づいて説明を行う。
図2は、本発明の実施形態における各種端末のハードウェア構成を示す図である。
CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。
また、ROM202あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / OutputSystem)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。RAM203は、CPU201の主メモリ、ワークエリア等として機能する。
CPU201は、処理の実行に際して必要なプログラム等をRAM203にロードして、プログラムを実行することで各種動作を実現するものである。
また、入力コントローラ(入力C)205は、キーボード209や不図示のマウス等のポインティングデバイスからの入力を制御する。
ビデオコントローラ(VC)206は、CRTディスプレイ(CRT)210等の表示器への表示を制御する。表示器はCRTだけでなく、液晶ディスプレイでも構わない。これらは必要に応じて管理者が使用するものである。
メモリコントローラ(MC)207は、ブートプログラム、ブラウザソフトウエア、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶するハードディスク(HD)やフロッピーディスク(登録商標 FD)或いはPCMCIAカードスロットにアダプタを介して接続されるカード型メモリ等の外部メモリ211へのアクセスを制御する。
通信I/Fコントローラ(通信I/FC)208は、ネットワークを介して、外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いたインターネット通信等が可能である。
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、CRT210上での表示を可能としている。また、CPU201は、CRT210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
本発明の情報処理装置101が後述する各種処理を実行するために用いられる各種プログラム等は外部メモリ211に記録されており、必要に応じてRAM203にロードされることによりCPU201によって実行されるものである。さらに、本発明に係わるプログラムが用いる定義ファイルや各種情報テーブルは外部メモリ211に格納されている。
次に、情報処理装置101及びサーバ102のモジュール構成を示す機能構成図について、図3を用いて説明する。尚、図3の各種端末あるいはサーバのモジュール構成は一例であり、用途や目的に応じて様々な構成例があることは言うまでもない。
情報処理装置101は、記憶モジュール301、画面表示モジュール302、送受信モジュール303、撮影モジュール304、OCRモジュール305を備える。
記憶モジュール301は、各種データやテーブルを記憶するためのモジュールである(記憶手段)。本実施例では特に後述する名刺データテーブル800(図8参照)や撮影された画像データの記憶を行う。画面表示モジュール302は、記憶モジュール301で記憶された各種データやテーブルを取得して、CRT210に表示するためのモジュールである。送受信モジュール303は、サーバ102をはじめとする各種装置とデータの送受信をするためのモジュールである。撮影モジュール304は、情報処理装置101に備えられた撮影装置、または情報処理装置101に接続された撮影装置を制御して被写体を撮影し、画像データを生成するモジュールである。OCRモジュール305は、生成された画像データに対してOCR処理を行い、画像データに含まれる文字をテキストデータとして出力するモジュールである。
サーバ102は、記憶モジュール306、送受信モジュール307、OCRモジュールを備える。記憶モジュール306は、各種データやテーブルを記憶するためのモジュールである(記憶手段)。また、送受信モジュール307は、情報処理装置101をはじめとする各種装置とデータの送受信をするためのモジュールである。OCRモジュール305は、生成された画像データに対してOCR処理を行い、画像データに含まれる文字をテキストデータとして出力するモジュールである。尚、本実施例では情報処理装置101のみで動作させるため、サーバ102の各種モジュールは動作しない。しかし、情報処理装置101で取得した画像データをサーバ102に送信し、サーバ102でOCR処理を行う場合が想定される。この場合には、サーバ102に備えられた各種モジュールを動作させて、処理結果を情報処理装置101に送信する。
次に、本発明の実施例における情報処理装置101によって行われる一連の処理について、図4に示すフローチャートを用いて説明する。尚、S101乃至S108の各ステップは情報処理装置101におけるCPU201の制御の下、処理が行われる。
尚、この処理を情報処理装置101に実行させるためのプログラムは、情報処理装置101にインストールされている名刺管理アプリケーションの一部、若しくはアドオンプログラムとして用意されていてもよいし、名刺管理アプリケーションとは別にインストールされたプログラムとして用意されていてもよい。
まず、ステップS101では、情報処理装置101は、ユーザからの指示に応じて名刺管理アプリケーションを起動する。
ステップS102では、情報処理装置101は、名刺管理アプリケーションのメニューの選択を受け付けるためのメニュー画面900(図9参照)をCRT210に表示させ、ユーザからの入力を受け付ける。
ステップS103では、情報処理装置101は、メニュー画面900に備えられた名刺撮影ボタン901が押下されたか否かを判定する。名刺撮影ボタン901が押下されたと判定された場合には、ステップS104に処理を進め、そうでない場合には、ステップS105に処理を進める。
ステップS104では、情報処理装置101は、名刺をカメラで撮影して画像データに変換し、後述する名刺データテーブル800(図8参照)に格納する処理を行う。名刺撮影処理の詳細は、後述する図5に示す。
ステップS105では、情報処理装置101は、メニュー画面900に備えられた名刺閲覧ボタン902が押下されたか否かを判定する。名刺閲覧ボタン902が押下されたと判定された場合には、ステップS106に処理を進め、そうでない場合には、ステップS107に処理を進める。
ステップS106では、情報処理装置101は、ステップS104の名刺撮影処理で取り込んだ名刺の画像データや名刺に関するデータを閲覧する処理を行う。名刺閲覧処理の詳細は、後述する図7に示す。
ステップS107では、情報処理装置101は、メニュー画面900に備えられた終了ボタン903が押下されたか否かを判定する。終了ボタン903が押下されたと判定された場合には、ステップS108に処理を進め、そうでない場合には、ステップS102に処理を戻して、ユーザからの入力を受け付ける。
ステップS108では、情報処理装置101は、ステップS101で起動した名刺管理アプリケーションを終了させ、本一連の処理を終了する。
次に、名刺撮影処理について、図5に示すフローチャートを用いて説明する。尚、S201乃至S213の各ステップは情報処理装置101におけるCPU201の制御の下、処理が行われる。
尚、この処理を情報処理装置101に実行させるためのプログラムは、情報処理装置101にインストールされている名刺管理アプリケーションの一部、若しくはアドオンプログラムとして用意されていてもよいし、名刺管理アプリケーションとは別にインストールされたプログラムとして用意されていてもよい。
まず、ステップS201では、情報処理装置101は、CRT210に撮影画面1000(図10参照)を表示し、撮影ボタン1001の押下を受け付ける。このとき、ユーザは撮影装置を用いて名刺を被写体として捉える。尚、撮影装置は情報処理装置101に備えられていてもよいし、情報処理装置101と通信可能に接続された撮影装置を使用する形態でもよい。本実施例では、情報処理装置101に撮影装置が備えられているものとして説明を行う。
ステップS202では、情報処理装置101は、撮影ボタン1001が押下され、撮影が指示されたか否かを判定する。撮影が指示されたと判定された場合には、ステップS203に処理を進め、そうでない場合には、撮影が指示されるまで待機する。尚、情報処理装置101と通信可能に接続された撮影装置を用いる場合には、情報処理装置101から撮影装置の操作を行ってもよい。
ステップS203では、情報処理装置101は、撮影装置を通じて名刺の撮影を行い、当該名刺の画像データを生成する。尚、情報処理装置101と通信可能に接続された撮影装置を用いる場合には、撮影装置に内蔵されたプログラムを起動し撮影を行ったものを情報処理装置101に送信する形態でもよい。または、撮影装置に備えられたメモリーカード等の記憶媒体に撮影された画像データを記憶し、当該記憶媒体を情報処理装置101に接続して、画像データを取り込んでもよい。この場合には、ステップS201乃至ステップS203は撮影装置によって行われる。
ステップS204では、情報処理装置101は、ステップS203で生成された画像データに対して、当該画像データに含まれる文字を読み取るべく、OCR処理を実行する(文字読取手段)。OCR処理では、名刺に記された名前や会社名、住所といった情報が画像データから読み取られ、当該各種情報をテキストデータとして出力する。
ステップS205では、情報処理装置101は、ステップS204でOCR処理された結果を取得し、名刺データ編集画面1100(図11参照)の各入力フォームに格納して表示する。入力フォームに格納する際に、OCR処理によって読み取りができなかった文字は特定の記号に置き換えて表示する。例えば、図11の名刺データ編集画面1100に表示されているように、OCR処理の結果「渡邉」の「邉」の読み取りができなかった場合、「●」を代替テキストとして表示する。尚、本実施例では、よみ1101には何も格納しない状態で名刺データ編集画面1100を初期表示する。OCR処理の結果、漢字の読みも出力可能であるならば、よみ1101に出力結果を表示してもよい。
ステップS206では、情報処理装置101は、ステップS205で表示された名刺データ編集画面1100の各入力フォームに表示されたテキストデータに対して編集を受け付ける。OCR処理の精度は上がってきているものの、間違って認識したテキストデータを出力してしまうこともある。よって、OCR処理した結果をそのままデータベースに登録するのではなく、一旦ユーザからの編集操作を受け付けるようにする。尚、後述するステップS210で使用するため、ユーザから編集された項目と文字をRAM203に記憶しておく。
ステップS207では、情報処理装置101は、もう一度撮影しなおすために、再撮影ボタン1102が押下されたか否かを判定する。いわゆる手ぶれや焦点が合っていない等の理由で画像データが鮮明でなく、うまくOCR処理できないことがある。このような場合には、もう一度撮影をし直す。再撮影ボタン1102が押下されたと判定された場合には、ステップS201に処理を戻して再撮影を行い、そうでない場合には、ステップS208に処理を進める。
ステップS208では、情報処理装置101は、名刺データ編集画面1100の各入力フォームに格納されたテキストデータ(名刺データ)を後述する名刺データテーブル800(図8参照)に格納するために、登録ボタン1103が押下されたか否かを判定する。登録ボタン1103が押下されたと判定された場合には、ステップS209に処理を進め、そうでない場合には、ステップS207に処理を戻す。
ステップS209では、情報処理装置101は、名刺データ編集画面1100の各入力フォームに格納された名刺データを、項目ごとに名刺データテーブル800(図8参照)に格納する。ここでは、名刺データとして姓名と姓名の読み、会社名、住所を名刺データテーブル800の新たに作成されたレコードに格納する。この時点では、画像データ808、失敗文字項目809、失敗文字箇所810には何も格納しない。
名刺データテーブル800(図8参照)は、名刺データごとに一意な名刺ID801、漢字表記の姓名と姓名の読みを示す姓802、姓読み803、名804、名読み805、会社の名称を示す会社名806、会社の住所を示す住所807、撮影された画像データへの参照先または画像データそのものを格納する画像データ808、OCR処理が失敗した項目を示す失敗文字項目809(読取失敗文字データ)、OCR処理が失敗した文字列の箇所を示す失敗文字箇所810(読取失敗文字データ)から構成される。
ステップS210では、情報処理装置101は、ステップS206で編集された項目を失敗文字項目809に格納し、当該項目の文字列のうち編集された文字が何文字目なのかを示す情報を失敗文字箇所810に格納する(読取失敗文字データ特定手段)。つまり、編集がされたということは、OCR処理が失敗したので正しいテキストデータに編集したということである。よって、このように編集された項目と文字をOCR処理が失敗した箇所として記憶しておく。
具体的には、例えば、図11の名刺データ編集画面1100に示すように「姓」に「渡●」と表示されていたが、ユーザが正しく「渡邉」に編集した場合を想定する。この場合、まず編集された項目は「姓」である。よって、失敗文字項目809には「姓」を格納する。次に、「渡邉」の2文字目である「邉」が編集されたので、失敗文字箇所810に「2文字目」と格納する。尚、ステップS206でRAM203に格納された情報を基に格納してもよいし、ステップS210で編集箇所を特定して格納するようにしてもよい。
ステップS211では、情報処理装置101は、OCR処理の成否に応じて圧縮率を変更して画像データを圧縮する処理を行う(画像データ圧縮手段)。画像データ圧縮処理の詳細は、後述する図6に示す。
ステップS212では、情報処理装置101は、ステップS211で圧縮された画像データを名刺データテーブル800の画像データ808に格納する。画像データ808に格納する情報は、圧縮された画像データ自体でもよいし、画像データが記憶されたフォルダ等への参照パスでもよい。
ステップS213では、情報処理装置101は、更に他の名刺を撮影する旨が指示されたか否かを判定する。具体的には、次の撮影を行うボタン(不図示)等の押下がなされたか否かで判定してもよいし、ステップS201の前に取り込む名刺の枚数の設定を受け付けてその枚数分だけ撮影を行うようにしてもよい。他の名刺を撮影する旨が指示された場合には、ステップS201に処理を戻し、そうでない場合には、名刺撮影処理を終了し、呼び出し元に処理を戻す。
次に、画像データ圧縮処理について、図6に示すフローチャートを用いて説明する。尚、S301乃至S307の各ステップは情報処理装置101におけるCPU201の制御の下、処理が行われる。
尚、この処理を情報処理装置101に実行させるためのプログラムは、情報処理装置101にインストールされている名刺管理アプリケーションの一部、若しくはアドオンプログラムとして用意されていてもよいし、名刺管理アプリケーションとは別にインストールされたプログラムとして用意されていてもよい。
まず、ステップS301では、情報処理装置101は、図5のステップS203で生成された画像データを特定のブロックに分割する。本実施例では、縦8ピクセル、横8ピクセルのマス目に分割するが、これに限らない。このブロックは圧縮を行う単位であり、後述するステップS302乃至ステップS307でブロックごとに圧縮を行っていく。
ステップS302では、情報処理装置101は、ステップS301で分割されたブロックのうちの1つを参照する。参照する順番は特に問わない。
ステップS303では、情報処理装置101は、ステップS302で参照したブロックが文字を構成するブロックであるか否かを判定する。例えば、図12に示すようなブロックで分割されたとすると、文字を構成するブロックは斜線で識別表示されたブロックである。一方、それ以外のブロックは文字を構成していないブロックとなる。文字を構成するブロックであると判定された場合には、ステップS304に処理を進め、そうでない場合には、ステップS306に処理を進める。
ステップS304では、情報処理装置101は、ステップS302で参照したブロックが構成する文字は、OCR処理が失敗した文字か否かを判定する。具体的には、ステップS210で失敗文字項目809と失敗文字箇所810に格納された情報を基に、OCR処理が失敗した文字か否かを判定する。例えば、名刺ID801の失敗文字項目809と失敗文字箇所810を参照すると、「姓」の「2文字目」を編集されたことがわかる。つまり、姓802に格納された「渡邉」の2文字目であるので、「邉」が特定できる。よって、ステップS302で参照したブロックがこの「邉」を構成しているか否かを判定すればよい。OCR処理が失敗した文字であると判定された場合には、ステップS305に処理を進め、そうでない場合には、ステップS306に処理を進める。
ステップS305では、情報処理装置101は、OCR処理が失敗した文字を構成するブロックであるので、圧縮率を低くして当該ブロックの画像データを圧縮する。つまり、OCR処理が失敗した文字ということは、複雑な漢字や情報処理装置101には登録されていない文字である可能性が高い。よって、これらの文字はあとでユーザが見返して確認できることが望ましいので、可読性を下げないためにも圧縮率は低くする。本実施例では、圧縮率を低くして圧縮するが、当該ブロックは圧縮しない形態も考えられる。こちらは圧縮する場合と比べて画像データのデータサイズが大きくなってしまうが、可読性はまったく落ちない利点がある。
ステップS306では、情報処理装置101は、OCR処理が成功した文字を構成するブロック、または文字を構成しないブロックであるので、圧縮率を高くして当該ブロックの画像データを圧縮する。OCR処理が成功した文字は正常にテキストデータに出力されており、あとで見返すことも少ない。また、文字を構成しないブロックは圧縮率を高くしても文字には影響しない。よって、これらのブロックに関しては、圧縮率を高くして画像データのデータサイズを削減する。
ステップS307では、情報処理装置101は、ステップS301で分割された全てのブロックについて、ステップS302乃至ステップS306における各処理が終了したか否かを判定する。すべてのブロックが終了したと判定された場合には、画像データ圧縮処理を終了し、呼び出し元に処理を戻し、そうでない場合には、ステップS302に処理を戻してすべてのブロックが終了するまで処理を繰り返す。
このようにすることで、OCR処理が失敗した箇所については圧縮率を低くして、OCR処理が成功した箇所と文字を構成しない箇所については圧縮率を高くすることができるので、OCR処理が失敗した箇所は可読性を上げて、かつ画像データのデータサイズを小さくすることができる。
次に、名刺閲覧処理について、図7に示すフローチャートを用いて説明する。尚、S401乃至S410の各ステップは情報処理装置101におけるCPU201の制御の下、処理が行われる。
尚、この処理を情報処理装置101に実行させるためのプログラムは、情報処理装置101にインストールされている名刺管理アプリケーションの一部、若しくはアドオンプログラムとして用意されていてもよいし、名刺管理アプリケーションとは別にインストールされたプログラムとして用意されていてもよい。
まず、ステップS401では、情報処理装置101は、名刺データテーブル800に格納された姓802や名804、会社名806を取得する。ここで取得する名刺データは、後述するステップS402で表示される名刺データ閲覧画面1300の名刺データ一覧1301に表示し、選択を受け付ける選択肢として表示する。よって、取得する名刺データ項目はこれに限らない。
ステップS402では、情報処理装置101は、ステップS401で取得した名刺データに基づいて、名刺データ閲覧画面1300(図13参照)を作成し、CRT210に表示する。その際に、名刺データ閲覧画面1300に備えられた名刺データ一覧1301に、ステップS401で取得した名刺データを表示する。
ステップS403では、情報処理装置101は、ステップS402で表示された名刺データ閲覧画面1300の名刺データ一覧1301のうち、いずれか1つの名刺データが選択されたか否かを判定する。つまり、名刺データの詳細を閲覧すべく、閲覧指示がなされたか否かを判定する。閲覧指示がなされたと判定された場合には、ステップS404に処理を進め、そうでない場合には、閲覧指示がなされるまで待機する。
ステップS404では、情報処理装置101は、ステップS403で選択されたものに関する名刺データを名刺データテーブル800から取得する。更に、画像データ808に格納された情報に基づいて圧縮された画像データを取得する。画像データ808に圧縮された画像データ自体が記憶されているのであれば、そのまま取得する。
ステップS405では、情報処理装置101は、ステップS403で選択された名刺データにOCR処理を失敗した文字があるか否かを判定する。具体的には、ステップS404で取得した失敗文字項目809または失敗文字箇所810に情報が格納されているか否かで判定する。OCR処理を失敗した文字があると判定された場合には、ステップS406に処理を進め、そうでない場合には、ステップS407に処理を進める。
ステップS406では、情報処理装置101は、OCR処理が失敗した文字を圧縮された画像データ上で識別表示する(表示手段)。具体的には、ステップS404で取得した失敗文字項目809と失敗文字箇所810に基づいて、OCR処理が失敗した文字を特定し、当該文字を画像データ上で識別表示させる。識別表示の方法はなんでもよい。例えば、図13の識別表示1302に示すように、下線を引いて識別表示してもよいし、他の方法でもよい。こうすることで、どの文字がOCR処理を失敗したのかがわかる。
ステップS407では、情報処理装置101は、ステップS404で取得した名刺データを名刺データ閲覧画面1300に表示する。圧縮された画像データは、画像データ表示領域1303に縮小表示する。この縮小表示された画像データが選択されると、縮小されていない等倍の画像データが表示される。
ステップS408では、情報処理装置101は、画像データ表示領域1303に縮小表示された画像データが選択されたか否かを判定する。選択されたと判定された場合には、ステップS409に処理を進め、そうでない場合には、ステップS410に処理を進める。
ステップS409では、情報処理装置101は、縮小表示された画像データに対応する元の画像データを表示する。こうすることで圧縮された画像データを閲覧することができる。
ステップS410では、情報処理装置101は、終了ボタン1304が押下されたか否かを判定する。終了ボタン1304が押下されたと判定された場合には、名刺閲覧処理を終了して、呼び出し元に処理を戻し、そうでない場合には、ステップS403に処理を戻す。
以上説明したように、本実施形態によれば、画像データに対して文字の読み取りを行い、読み取りが成功した文字の領域は圧縮率を高くし、読み取りが失敗した文字の領域は圧縮率を低くすることが可能となるので、あとで見返した場合であってもユーザが確認でき、かつ画像データの容量を削減することができる。
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリーカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
100 情報処理システム
101 情報処理装置
102 サーバ
103 ネットワーク
201 CPU
202 RAM
203 ROM
204 システムバス
205 入力コントローラ
206 ビデオコントローラ
207 メモリコントローラ
208 通信I/F(インターフェース)コントローラ
209 入力装置
210 ディスプレイ装置
211 外部メモリ

Claims (7)

  1. 文字を含む画像データを管理する情報処理装置であって、
    前記画像データに含まれる文字を読み取る文字読取手段と、
    前記文字読取手段で読み取られた文字のうち、読み取りが失敗した文字を読取失敗文字データとして特定する読取失敗文字データ特定手段と、
    前記画像データのデータサイズを削減するべく、前記文字読取手段で読み取られた画像データの圧縮を行う画像データ圧縮手段とを備え、
    前記画像データ圧縮手段は、前記読取失敗文字データ特定手段で特定された読取失敗文字データを含む領域に対して圧縮率の低い圧縮を行い、前記読取失敗文字データ特定手段で特定された読取失敗文字データを含まない領域に対して圧縮率の高い圧縮を行うことを特徴とする情報処理装置。
  2. 前記画像データ圧縮手段は、更に前記文字読み取り手段で読み取られた文字を含まない領域に対して圧縮率の高い圧縮を行うことを特徴とする請求項1に記載の情報処理装置。
  3. 前記読取失敗文字データ特定手段は、前記文字読取手段で読み取られた文字のうち、ユーザから編集された文字を読取失敗文字データとして特定することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記情報処理装置は、
    前記画像データ圧縮手段で圧縮された画像データを表示する表示手段を更に備え、
    前記表示手段は、前記読取失敗文字データ特定手段で特定された読取失敗文字データを前記画像データ上で識別表示することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記文字読取手段は、前記画像データに含まれる文字を読み取って、テキストデータを出力することを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 文字を含む画像データを管理する情報処理装置の制御方法であって、
    前記情報処理装置の文字読取手段が、前記画像データに含まれる文字を読み取る文字読取ステップと、
    前記情報処理装置の読取失敗文字データ特定手段が、前記文字読取ステップで読み取られた文字のうち、読み取りが失敗した文字を読取失敗文字データとして特定する読取失敗文字データ特定ステップと、
    前記情報処理装置の画像データ圧縮手段が、前記画像データのデータサイズを削減するべく、前記文字読取ステップで読み取られた画像データの圧縮を行う画像データ圧縮ステップとを備え、
    前記画像データ圧縮ステップは、前記読取失敗文字データ特定ステップで特定された読取失敗文字データを含む領域に対して圧縮率の低い圧縮を行い、前記読取失敗文字データ特定ステップで特定された読取失敗文字データを含まない領域に対して圧縮率の高い圧縮を行うことを特徴とする情報処理装置の制御方法。
  7. 文字を含む画像データを管理する情報処理装置の制御方法をコンピュータに実行させるためのコンピュータに読み取り実行可能なプログラムであって、
    前記情報処理装置を、
    前記画像データに含まれる文字を読み取る文字読取手段と、
    前記文字読取手段で読み取られた文字のうち、読み取りが失敗した文字を読取失敗文字データとして特定する読取失敗文字データ特定手段と、
    前記画像データのデータサイズを削減するべく、前記文字読取手段で読み取られた画像データの圧縮を行う画像データ圧縮手段として機能させ、
    前記画像データ圧縮手段は、前記読取失敗文字データ特定手段で特定された読取失敗文字データを含む領域に対して圧縮率の低い圧縮を行い、前記読取失敗文字データ特定手段で特定された読取失敗文字データを含まない領域に対して圧縮率の高い圧縮を行うことを特徴とするコンピュータに読み取り実行可能なプログラム。
JP2011280266A 2011-12-21 2011-12-21 情報処理装置、その制御方法、及びプログラム Pending JP2013131922A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011280266A JP2013131922A (ja) 2011-12-21 2011-12-21 情報処理装置、その制御方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011280266A JP2013131922A (ja) 2011-12-21 2011-12-21 情報処理装置、その制御方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2013131922A true JP2013131922A (ja) 2013-07-04

Family

ID=48909164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011280266A Pending JP2013131922A (ja) 2011-12-21 2011-12-21 情報処理装置、その制御方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2013131922A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016192070A (ja) * 2015-03-31 2016-11-10 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016192070A (ja) * 2015-03-31 2016-11-10 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム

Similar Documents

Publication Publication Date Title
US20130268624A1 (en) Apparatus, system, and method of processing request, and recording medium storing processing request control program
US9282206B2 (en) Portable information terminal and recording medium
EP2105930B1 (en) Selection and positioning of images within a template based on relative comparison of image attributes
CN106453572B (zh) 基于云服务器同步图像的方法及系统
US9507796B2 (en) Relay apparatus and image processing device
US10762043B2 (en) Information processing system, information processing apparatus, and information processing method
US20140051418A1 (en) Secure method to exchange digital content between a scanning appliance and sms-enabled device
US11765299B2 (en) Information processing apparatus and method
JP2006060540A (ja) 画像復号縮小装置および方法
CN102054150A (zh) 使用安全防护功能的图像处理的设备和方法
JP5231613B2 (ja) 画像処理装置、演算装置、通信システム、送信方法、操作方法、プログラム及び記録媒体
JP5849177B2 (ja) 画像情報処理システム
US20070050830A1 (en) Image data transmission apparatus and method, remote display control apparatus and control method thereof, program, and storage medium
KR20210100853A (ko) 이미지를 저장하는 전자 장치 및 방법
JP2013131922A (ja) 情報処理装置、その制御方法、及びプログラム
GB2417658A (en) Automating process flows in image processing
US8958108B2 (en) Apparatus and program product for processing page images with defined page order to increase editing flexibilty
CN114039969A (zh) 一种数据传输方法及装置
JP5208043B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9052989B2 (en) Storage control apparatus and storage method therefor
JP2007207027A (ja) 情報管理装置、端末装置、情報管理システム及び情報管理方法
JP6705984B2 (ja) 情報処理装置と、その処理方法及びプログラム
WO2015104983A1 (ja) 画像読取システムおよび画像読取装置
JP7467834B2 (ja) 画像処理システム、閲覧画像生成装置、端末装置、情報処理装置及びプログラム
JP2016126763A (ja) 情報処理システムと、その処理方法及びプログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130531

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130531