JP2011070601A - Device, and method for managing image, and computer program - Google Patents
Device, and method for managing image, and computer program Download PDFInfo
- Publication number
- JP2011070601A JP2011070601A JP2009223458A JP2009223458A JP2011070601A JP 2011070601 A JP2011070601 A JP 2011070601A JP 2009223458 A JP2009223458 A JP 2009223458A JP 2009223458 A JP2009223458 A JP 2009223458A JP 2011070601 A JP2011070601 A JP 2011070601A
- Authority
- JP
- Japan
- Prior art keywords
- data
- shooting
- storage
- character
- subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
- Telephone Function (AREA)
Abstract
Description
本発明は、画像の文字を文字データとして認識する技術に関する。 The present invention relates to a technique for recognizing characters of an image as character data.
近年、携帯電話機等の携帯端末の多くがデジタルカメラを搭載しており、撮影する画像の高画素化が進んでいる。そのデジタルカメラを用いて名刺を撮影し、名刺の撮影画像を携帯端末に保存することがなされている。 In recent years, many mobile terminals such as mobile phones are equipped with a digital camera, and the number of pixels to be captured is increasing. A business card is photographed using the digital camera, and a photographed image of the business card is stored in a portable terminal.
一方、携帯端末は小型化が進んでおり、それに伴って、表示画面の大きさは限られたものとなっている。 On the other hand, miniaturization of portable terminals is progressing, and accordingly, the size of the display screen is limited.
従って、通常の風景写真のように1画面に名刺全体を表示した場合には、電話番号等の小さな文字が読み取れず、拡大しないと見えない場合が生じ得る。 Therefore, when an entire business card is displayed on one screen as in a normal landscape photograph, small characters such as telephone numbers cannot be read and cannot be viewed unless enlarged.
そこで、名刺の撮影画像の表示を工夫し、名刺ならではの操作性を高める技術が提案されている。 Therefore, a technique for improving the operability unique to a business card by devising the display of a captured image of the business card has been proposed.
例えば、電話番号が記載されている部分を表示するときは拡大して表示する、及び、電話番号が記載されている部分を表示しながら、電話番号の入力を可能にする等である(特許文献1等参照)。 For example, when a portion where a telephone number is described is displayed, it is displayed in an enlarged manner, and it is possible to input a telephone number while displaying a portion where a telephone number is described (Patent Literature). 1 etc.).
また、名刺の撮影画像から文字を認識して、電話番号等を電話帳に登録し、名刺の撮影画像をアイコンとして登録することもなされている。 In addition, a character is recognized from a captured image of a business card, a telephone number or the like is registered in the phone book, and a captured image of the business card is registered as an icon.
カメラが高機能化して解像度が高くなっていることから、拡大しても画像が鮮明であるので電話番号を読み取ることができ、また、画像の文字を認識して文字データとすることが可能となっている。 Since the camera is highly functional and the resolution is high, the phone number can be read because the image is clear even when enlarged, and the character of the image can be recognized and converted to character data. It has become.
しかし、カメラが高機能化して高画素化が進んでいる(解像度が高くなっている)ことから、名刺の撮影画像のデータのサイズは大きいものとなってきている。 However, since the cameras have become more sophisticated and the number of pixels has been increased (resolution has been increased), the size of the data of the captured images of business cards has become large.
また一方で、高機能化及び多機能化が進む携帯端末においては、動作する際に多くの作業用メモリを必要とする機能もある。また、複数の機能を並行して動作させる場合は、それぞれの機能の動作に必要な作業用メモリを合わせた容量の作業用メモリが必要となる。 On the other hand, mobile terminals that are becoming increasingly sophisticated and multifunctional have functions that require a large amount of work memory when operating. Further, when a plurality of functions are operated in parallel, a working memory having a capacity combined with working memories necessary for the operation of each function is required.
しかし、高機能化及び多機能化に加えて小型化が進む携帯端末においては、搭載できるメモリにも限度があり、作業用メモリの有効利用が望まれる。 However, in portable terminals that are becoming smaller in addition to higher functionality and multi-function, there is a limit to the memory that can be mounted, and effective use of work memory is desired.
そこで、本発明は、名刺等の文字が記載されている被写体をカメラで撮影して、被写体の文字を電話帳等に登録する際に、必要となる作業用メモリを少なくすることを目的とする。 Therefore, the present invention has an object to reduce a working memory required when a subject on which characters such as business cards are written is photographed with a camera and characters of the subject are registered in a telephone directory or the like. .
本発明の1形態に係る画像管理装置は、被写体の文字の大きさに応じた画素数を決定する決定手段と、前記被写体を撮影し、前記決定された画素数の撮影データを出力する撮像手段と、前記撮像手段で出力された撮影データを記憶する撮影データ記憶手段と、前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識する文字読取手段と、前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成する保存用データ生成手段と、前記保存用データを記憶する保存用データ記憶手段と、を有する。 An image management apparatus according to an aspect of the present invention includes a determination unit that determines the number of pixels according to a character size of a subject, and an imaging unit that captures the subject and outputs shooting data of the determined number of pixels. Shooting data storage means for storing shooting data output by the imaging means, character reading means for recognizing characters of the subject from shooting data stored in the shooting data storage means, and shooting data storage means Storage data generation means for generating storage data of the number of pixels that can visually recognize the character of the subject from the captured data stored in the storage data storage means for storing the storage data, Have
上記構成の画像管理装置は、名刺等の文字が記載されている被写体をカメラで撮影して、被写体の文字を電話帳等に登録する際に、必要となる作業用メモリを少なくすることができる。 The image management apparatus having the above configuration can reduce a work memory required when a subject on which characters such as business cards are written is photographed by a camera and characters of the subject are registered in a telephone directory or the like. .
<実施形態>
携帯端末等に搭載されているカメラは、風景及び人物等を撮影することが主な目的であり、きれいな撮影画像となるように、解像度が高いものが好まれる。
<Embodiment>
A camera mounted on a portable terminal or the like has a main purpose of photographing landscapes and people, and a camera with high resolution is preferable so that a beautiful photographed image is obtained.
しかし、名刺の撮影画像に求められることは、きれいな画像であることではなく、名刺の文字を読めること、名刺の文字をOCR(Optical Character Recognition)等で認識できること、及び、名刺に記載されているマーク等を視認できること等である。 However, what is required for a photographed image of a business card is not that it is a beautiful image, but that the characters on the business card can be read, that the characters on the business card can be recognized by OCR (Optical Character Recognition), etc. For example, the mark can be visually recognized.
従って、カメラで撮影した撮影画像に対して求められる解像度は、風景等を撮影した撮影画像に求められるものと、名刺を撮影した撮影画像に求められるものとは異なるのが必然である。 Therefore, the resolution required for a photographed image photographed by a camera is inevitably different from that required for a photographed image obtained by photographing a landscape or the like, and that required for a photographed image obtained by photographing a business card.
実施形態の携帯端末等では、風景等を撮影する場合とは別に、名刺をカメラで撮影して電話帳に登録する場合の名刺登録機能を有する。 The mobile terminal or the like of the embodiment has a business card registration function for capturing a business card with a camera and registering it in the phone book separately from capturing a landscape or the like.
以下、実施形態の名刺登録機能を有する携帯電話機について説明する。 Hereinafter, a mobile phone having the business card registration function of the embodiment will be described.
図1は、実施形態の携帯電話機1000の外観及び電話帳表示時の画面の例を示す図である。
FIG. 1 is a diagram illustrating an example of the appearance of a
携帯電話機1000は、いわゆる折り畳み式携帯電話機であり、図1は、開いた携帯電話機1000を正面から見たところを示している。
The
携帯電話機1000は、第1筐体1001と第2筐体1002と、これらを結合するヒンジ1003とを有する。
The
第1筐体1001は、ディスプレイ2000を備える。
The
ユーザが電話帳を表示させた場合、ディスプレイ2000には、2つの画面が並んで表示される。個人情報表示画面2010及びソフトキー表示画面2020である。
When the user displays the phone book, the
個人情報表示画面2010は、電話帳に登録されている個人情報の内容を表示する画面であり、個人情報である電話番号等の文字データ及びアイコン2001を表示する。アイコン2001として、顔写真及び図柄等を表示することができる。図1では、横書きの名刺のアイコン2001が表示されている。
The personal
ソフトキー表示画面2020は、電話帳を表示させる操作で用いるソフトキーを表示する画面である。表示されるソフトキーは、個人情報表示画面2010に表示されている内容及びカーソルの位置に応じて異なる。
The soft
例えば、図1においてソフトキー表示画面2020に表示されたソフトキー「修正」は、現在表示されている個人情報を修正するためのキーである。「発信」は、個人情報表示画面2010に表示されている電話番号に発信するためのキーである。また「メニュー」は、メニューを表示するためのキーである。
For example, the soft key “correct” displayed on the soft
また、第2筐体1002は、操作キーを備える。操作キーは、ソフトキー対応キー10、機能キー20及び文字入力キー30に分類される。
The
ソフトキー対応キー10のうち、キー11は、中央のソフトキー、図1においては「発信」に対応する。また、キー13及びキー14は、それぞれ、左のソフトキー「修正」及びソフトキー「メニュー」に対応する。
Of the
ソフトキー対応キー10のうち、キー12は、ディスプレイ2000に表示されるカーソルを上下左右に移動するために使用するキーである。以下、「カーソルキー12」というものとする。
Of the soft key
機能キー20のキー「発信」は、電話発信キーであり、キー「切断」は、電話通話切断キーである。キー「クリア」は、文字の入力において文字を消去するためのキーである。
The key “call” of the
文字入力キー30は、いわゆるテンキーであり、それぞれのキーに対応付けされている文字を入力するためのキーである。尚、図1では、各キーには数字が記載されているが、数字の他に「あ行」〜「わ行」等が対応付けられている。例えば、キー「1」には「あ行」が、キー「2」には「か行」が割り当てられている。
The
ここで、図2〜図4を用いて、携帯電話機1000における名刺登録機能の使い方について説明する。
Here, the usage of the business card registration function in the
図2を用いて、名刺を撮影する場合を説明する。また、図3を用いて、撮影した名刺を参照する場合を説明する。これらの説明をする際、図4を参照する。 A case where a business card is photographed will be described with reference to FIG. In addition, the case of referring to a taken business card will be described with reference to FIG. In describing these, reference is made to FIG.
図4は、名刺登録処理における撮影データの流れ等を示す図である。図4における、撮像部1300等の各機能部の詳細については、<機能>の項で説明する。
FIG. 4 is a diagram illustrating a flow of shooting data in the business card registration process. Details of each functional unit such as the
まず、名刺を撮影する場合を説明する。尚、実施形態では、名刺登録機能を用いて、「名刺撮影モード」でカメラを起動して名刺を撮影すると、自動的に電話帳に登録されるものとする。 First, a case where a business card is photographed will be described. In the embodiment, when a business card is photographed by starting the camera in the “business card photographing mode” using the business card registration function, it is automatically registered in the telephone directory.
図2は、名刺撮影時の携帯電話機1000を正面から見たところを示す図である。
FIG. 2 is a diagram showing the
名刺を登録するために、まず、ユーザが名刺を撮影する。 In order to register a business card, a user first takes a business card.
具体的には、「名刺撮影モード」でカメラ(図4の撮像部1300に該当する。)を起動して、名刺登録機能を有効にする。カメラが起動されると、撮影する名刺の画像の位置合わせの為に、ディスプレイ2000の四隅にガイド枠2101が表示される。
Specifically, the camera (corresponding to the
ユーザは、ディスプレイ2000に表示されたガイド枠2101に名刺の画像が収まるようにして、「撮影」が対応するキー11を押下する。この場合、名刺が逆さまになっていてもよく、また、文字が横になっていてもよい。後で画像を手動または自動で90度毎に回転してもよいし、OCRで認識して、文字認識率が低ければ回転して、再度、OCRで認識して認識率の最も高い時の回転した画像を、名刺の向きが正しい画像としてもよい。
The user presses the key 11 corresponding to “shooting” so that the business card image fits in the
撮像部1300によって撮影された名刺画像3001は、名刺登録作業用記憶部3000に記憶される(図4参照)。
The
この名刺画像3001から、文字認識部1500によって名前等の文字データが認識され、名前等が電話帳記憶部3200に記憶される(図4の電話帳データ3210参照)。
From this
また、名刺画像3001は、文字の向きが正しく補正された名刺画像3101として名刺画像記憶部3100に記憶される。尚、この名刺画像3101には識別子、例えば、「G002」が付けられる。
The
この名刺画像3101が記憶されたら、名刺登録作業用記憶部3000の名刺画像3001は削除される。すなわち、名刺登録作業用記憶部3000は、名刺画像3001を記憶することができる領域があればよい。
When this
次に、図3は、ユーザが電話帳の個人情報をディスプレイ2000に表示させた場合の、画面の遷移の例を示す図である。図3において、反転文字、又は、太線の矩形は、カーソルでフォーカスされている位置を示している。
Next, FIG. 3 is a diagram showing an example of screen transition when the user displays personal information in the phone book on the
ユーザがメニュー等を操作して、電話帳から、「○山△男」の個人情報を表示させる(図3の画面2201参照)。画面2201では、電話番号がカーソルでフォーカスされている。
The user operates the menu or the like to display the personal information of “Oyama △ male” from the telephone directory (see
この画面2201は、電話帳記憶部3200に記憶されている電話帳データ3210と、名刺画像記憶部3100に記憶されている名刺画像3101とから、電話帳表示部1700によってディスプレイ2000に表示される(図4の画面2201参照)。電話帳データ3210の「画像」として設定されている「G002」が識別子として付けられている名刺画像3101を表示する。
This
ここで、ユーザがカーソルキー12を操作してアイコン2001にカーソルを移動する(図3の画面2202のカーソル2204参照)。
Here, the user operates the
画面2002の状態で、ユーザが、「拡大」に対応するキー11を押下して、アイコン2001の拡大表示を指示する。
In the state of the screen 2002, the user presses the key 11 corresponding to “enlarge” to instruct the enlargement display of the
ユーザの指示により、アイコン2001が拡大されて表示される(図3の画面2203参照)。ここで、更にユーザが、「拡大」に対応するキー11を押下して、拡大表示を指示すると、更に拡大された名刺画像が表示される。「縮小」に対応するキー14を押下して、縮小表示を指示すると、縮小された名刺画像が表示される。また、カーソルキー12を押下して表示位置を変える指示を行うと、指示に応じて表示されている名刺の部分が移動する。これらの表示の際には、名刺画像記憶部3100に記憶されている名刺画像3101が必要に応じて読み出されて使用される。
In accordance with a user instruction, the
ユーザが名刺のアイコン2001を拡大表示させるのは、ユーザが知りたい情報を知るためである。例えば、電話帳に登録された電話番号が合っているかを確認するために、名刺に記載されている電話番号を見る、及び、名刺に記載されている会社のロゴを確認する等である。
The reason why the user enlarges and displays the
名刺登録作業用記憶部3000に記憶されている名刺画像3001と、名刺画像記憶部3100に記憶されている名刺画像3101との違いは、その画素数である。
The difference between the
名刺画像3001は、文字認識部1500が文字認識を行うことができる画素数の画像である。この画素数は、文字認識を行うOCR等の性能によって異なる。
The
一方、名刺画像3101は、ディスプレイ2000に表示した場合に(図3の画面2203参照)、人間が文字を視認できる程度の画素数の画像である。名刺に印刷される文字の大きさが限られていることから、予め名刺画像3101の画素数を決めておくことが可能である。
On the other hand, the
画素数は、通常、名刺画像3001よりも名刺画像3101の方が小さくなる場合が多い。従って、記憶する圧縮データも、名刺画像3101の方が小さい場合が多い。例えば、JPEG形式の名刺画像3001のデータが960KB(キロバイト)であり、JPEG形式の名刺画像3001のデータは、圧縮されて240KBのように小さくなる。
The number of pixels is usually smaller in the
<機能>
以下、図5を用いて、携帯電話機1000の機能について説明する。
<Function>
Hereinafter, functions of the
図5は、携帯電話機1000の機能的構成の例を示すブロック図である。
FIG. 5 is a block diagram illustrating an example of a functional configuration of the
携帯電話機1000は、携帯電話機が通常有する通話機能及びメール機能等を有するが、図5においては、名刺登録処理に関係する機能部のみを記載している。
The
また、図5において、点線矢印は名刺のデータの流れを示す。 In FIG. 5, dotted arrows indicate the flow of business card data.
携帯電話機1000は、インタフェース部1100、名刺登録制御部1200、撮像部1300、撮影モード設定部1400、文字認識部1500、縮小画像生成部1600、電話帳表示部1700、ディスプレイ2000、名刺登録作業用記憶部3000、名刺画像記憶部3100及び電話帳記憶部3200を有する。
The
インタフェース部1100は、第2筐体1002の操作キーを含み、ユーザからの操作、例えば、キーの押下等を検出する機能を有する。
The
名刺登録制御部1200は、以下に説明する各機能部に指示を出して名刺登録処理を行う機能を有する。
The business card
撮像部1300は、いわゆるカメラであり、複数の撮影モードで撮影できる機能を有する。ここで、撮影モードとは、撮像部1300が出力する撮影データの撮影画像の画素数と色数をいう。
The
例えば、16色の640×480画素の撮影データを出力するモード等である。 For example, there is a mode for outputting shooting data of 640 × 480 pixels of 16 colors.
この撮像部1300が撮影する撮影モードは、撮影モード設定部1400によって設定される。
The shooting mode for shooting by the
また、この撮像部1300は、撮影した結果である撮影データを、所定のフォーマットで名刺登録作業用記憶部3000に記憶させる。この所定のフォーマットは、撮影モード設定部1400から通知される。
The
以下、「撮影データ」とは、画素のデータをいうものとする。また、「撮影画像」とは、撮影データに基づいてディスプレイに表示されたイメージをいうものとする。 Hereinafter, “photographing data” refers to pixel data. The “photographed image” refers to an image displayed on the display based on the photographing data.
撮影モード設定部1400は、撮影モードを決定し、撮像部1300に決定した撮影モードを設定する機能を有する。撮影モードの決定方法は、<撮影モードの決定方法>の項で説明する。
The shooting
文字認識部1500は、いわゆるOCRであり、撮影画像の文字を認識し、文字データとして出力する機能を有する。また、文字認識部1500は、次の2つの情報を撮影モード設定部1400に通知する機能も有する。
The
1つ目は、文字認識部1500自身が認識できる文字のサイズ、及び、処理可能な画像データのフォーマットに関する情報である。例えば、文字サイズ「縦5ドット」、フォーマット「JPEG(Joint Photographic Experts Group)」等と通知する。
The first is information regarding the size of characters that can be recognized by the
2つ目は、文字認識部1500が認識した撮影画像の向きに関する情報である。この向きに関する情報とは、撮影画像の文字が正しい向きになる為には、撮影画像を何度回転させる必要があるかを示す情報である。例えば、撮影画像が傾いている場合には、向きに関する情報として傾きの角度が通知される。また、撮影画像が逆さまである場合には、向きに関する情報として「180度」が通知される。尚、角度以外の情報を向きに関する情報として通知してもよい。
The second is information regarding the orientation of the captured image recognized by the
縮小画像生成部1600は、名刺登録作業用記憶部3000に記憶されている撮影データから、保存用の撮影データを生成する機能を有する。縮小画像生成部1600は、文字認識部1500が通知した撮影画像の向きに関する情報に基づいて、名刺登録作業用記憶部3000に記憶されている撮影データの撮影画像の向きを補正し、予め決めてある画素数の保存用の撮影データを生成する。
The reduced
また、縮小画像生成部1600は、生成した保存用の撮影データを、名刺画像記憶部3100に記憶させる機能を有する。
Further, the reduced
電話帳表示部1700は、電話帳の表示を行う機能を有する。具体的には、電話帳記憶部3200から個人情報を読み出してディスプレイ2000に表示する。また、名刺画像記憶部3100から撮影データを読み出してアイコン2001としてディスプレイ2000に表示する。
The phone
ディスプレイ2000は、液晶等のディスプレイパネルを含み、撮像部1300が撮影する画像、及び、電話帳の個人情報等を表示する機能を有する。
The
名刺登録作業用記憶部3000は、撮像部1300が出力した撮影データ(以下、「作業用撮影データ」という場合がある。)を記憶しておく機能を有する。尚、図4においては、作業用撮影データは、名刺画像3001のデータである。
The business card registration
名刺画像記憶部3100は、保存用の撮影データ(以下、「保存用撮影データ」という場合がある。)を記憶しておく機能を有する。保存用撮影データは、識別子と対応付けて記憶されている。尚、図4においては、保存用撮影データは、名刺画像3101のデータである。
The business card
電話帳記憶部3200は、電話番号等の個人情報を記憶しておく機能を有する。個人情報には、アイコン2001を表示するための画像の識別子が含まれている。この識別子は、名刺画像記憶部3100に記憶されている撮影データに対応付けられている識別子と同じである。
The telephone
上述した機能の全部または一部は、携帯電話機1000の有するCPUが、携帯電話機1000のメモリ等に記録されているプログラムを実行することにより実現される。
All or part of the functions described above are realized by the CPU of the
<データ>
次に、実施形態の携帯電話機1000で用いるデータについて図6及び図7を用いて説明する。
<Data>
Next, data used in the
図6は、変換テーブル1410の構成及び内容の例を示す図である。 FIG. 6 is a diagram illustrating an example of the configuration and contents of the conversion table 1410.
この変換テーブル1410は、撮影モード設定部1400が、いかなる撮影モードを撮像部1300に設定すべきかを判断するために用いるテーブルである。
This conversion table 1410 is a table used by the shooting
変換テーブル1410の説明をする前に、撮影モード設定部1400が設定すべき撮影モードを決定する方法について説明する。
Before describing the conversion table 1410, a method for determining the shooting mode to be set by the shooting
<撮影モードの決定方法>
撮影モード設定部1400は、文字認識部1500の性能に応じて撮像部1300に設定する撮影モードを決定する。
<How to determine the shooting mode>
The shooting
具体的には、撮影モード設定部1400は文字認識部1500に、文字認識部1500が認識可能な文字サイズの最小値、及び、文字認識部1500が処理可能なフォーマットを問い合わせる。文字サイズの最小値は、1文字の縦のドット数で示される。
Specifically, the shooting
撮影モード設定部1400は、文字認識部1500が認識可能な文字サイズを上回るドット数で撮影できる撮影モードを、撮像部1300に設定する撮影モードとして決定する。
The shooting
通常の名刺で用いられる印刷文字の最小サイズは、予め知ることができる。従って、名刺の大きさ(例えば、91mm×55mm)、印刷文字の最小サイズ等から、名刺の撮影画像に必要な画素数を求めることができる。 It is possible to know in advance the minimum size of printed characters used in ordinary business cards. Therefore, the number of pixels necessary for the business card photographed image can be obtained from the size of the business card (for example, 91 mm × 55 mm), the minimum size of printed characters, and the like.
撮影モード設定部1400は、撮像部1300に設定できる複数の撮影モードのうちから、名刺の撮影画像に必要な画素数を保証できる撮影モードを、撮像部1300に設定する撮影モードとして決定する。名刺の撮影画像に必要な画素数を保証できる撮影モードが複数ある場合は、画素数の小さい方の撮影モードを選択する。
The shooting
このようにすることで、名刺登録作業用記憶部3000には文字認識可能な撮影データであって、無駄のない量の撮影データを記憶することが可能となる。
By doing so, the business card registration
また、文字認識部1500に問い合わせた性能に基づいて撮影モードを決定することから、文字認識部1500のバージョンアップがあった場合、及び、異なる性能の文字認識部1500に替わった場合等であっても、他の機能部を変更する必要がない。
In addition, since the shooting mode is determined based on the performance inquired of the
尚、撮影モード設定部1400は、文字認識部1500から受け取ったフォーマットを、撮像部1300に通知する。撮像部1300は、通知されたフォーマットで撮影データを名刺登録作業用記憶部3000に記憶させる。これは、文字認識のために、文字認識部1500に撮影データをそのまま渡せるようにするためである。
Note that the shooting
以下、変換テーブル1410について説明する。この変換テーブル1410は、撮影モード設定部1400が内部に記憶しているものである。
Hereinafter, the conversion table 1410 will be described. This conversion table 1410 is stored in the photographing
変換テーブル1410は、文字サイズ1411、画素数1412及びフォーマット1413を有する。
The conversion table 1410 has a
文字サイズ1411は、文字サイズを示す。詳細には、文字の縦のサイズをドット数で示す。
A
画素数1412は、撮影データの画素数を示す。すなわち、名刺の撮影データが備えるべき最小の画素数を示す。
The number of
フォーマット1413は、文字認識部1500が処理可能な撮影データのフォーマットを示す。「−」は、ビットマップを示す。
A
例えば、文字認識部1500が認識可能な文字サイズが「9ドット」であり、処理可能なフォーマットが「JPEG」であるとする。撮影モード設定部1400は、文字サイズ1411「5〜10」ドットに対応する画素数1412「320×240」ドット以上の撮影画像を撮影することができる撮影モードを文字認識部1500に設定する。また。撮影モード設定部1400は、フォーマットとして「JPEG」を文字認識部1500に通知する。
For example, it is assumed that the character size recognizable by the
次に、図7は、電話帳データ3210の構成及び内容の例を示す図である。
Next, FIG. 7 is a diagram showing an example of the configuration and contents of the
この電話帳データ3210は1つの個人情報であり、通常、複数の電話帳データ3210が電話帳記憶部3200に記憶されている。
The
電話帳データ3210は、項目3211及び内容3212を有する。
The
項目3211は、電話帳データ3210に含まれる項目を示す。
An
内容3212は、項目3211で示される項目の内容を示す。
A
例えば、項目3211「名前」は、電話帳データ3210が誰に関するデータであるかを示し、その内容3212は「○山△男」である。従って、この電話帳データ3210は、「○山△男」の個人情報である。
For example, the
また、項目3211「画像」は、電話帳データ3210の個人情報に関する画像の識別子を示し、その内容3212は「G002」である。従って、名刺画像記憶部3100に記憶されている識別子「G002」で識別される画像が、「○山△男」に関する画像である。
The
<動作>
以下、実施形態の携帯電話機1000の動作について図8及び図9を用いて説明する。
<Operation>
Hereinafter, the operation of the
図8は、携帯電話機1000の名刺登録処理のフローチャートである。図9は、電話帳に登録されている個人情報の名刺画像表示処理のフローチャートである。
FIG. 8 is a flowchart of the business card registration process of the
図8を用いて、携帯電話機1000のユーザが名刺を登録する場合を説明する。
A case where the user of the
ユーザが、メニューから「名刺撮影モード」を選択してカメラを起動する操作を行う。 The user selects the “business card shooting mode” from the menu and performs an operation to activate the camera.
カメラが「名刺撮影モード」で起動する操作を検出したインタフェース部1100は(ステップS100)、名刺登録制御部1200に名刺登録処理を開始するよう指示する。
The
指示を受けた名刺登録制御部1200は、文字認識部1500の性能に関する情報を問い合わせて取得する(ステップS110)。
Upon receiving the instruction, the business card
具体的には、文字認識部1500から、文字認識部1500が認識可能な文字サイズの最小値、及び、文字認識部1500が処理可能なフォーマットを文字認識部1500に問い合わせて受け取る(ステップS200)。
Specifically, the
文字認識部1500から性能に関する情報を受け取った撮影モード設定部1400は、変換テーブル1410を参照して、撮影モードを決定する。撮影モードの決定方法は、上述した<撮影モードの決定方法>の通りである。
The shooting
撮影モードを決定した撮影モード設定部1400は、決定した撮影モードを撮像部1300に設定し、文字認識部1500から受け取ったフォーマットを通知して、撮像部1300を起動する(ステップS120)。
The shooting
起動された撮像部1300は、ディスプレイ2000の四隅にガイド枠2101を表示し、ディスプレイ2000に撮影画像を表示する(図2参照)。
The activated
ここで、ユーザは、ディスプレイ2000に表示されたガイド枠2101に名刺の画像が収まるようにして、「撮影」が対応するソフトキー11を押下する。
Here, the user presses the soft key 11 corresponding to “shoot” so that the image of the business card fits in the
「撮影」が対応するソフトキー11の押下を検出したインタフェース部1100は(ステップS130)、キーが押下された旨を撮像部1300に通知する。
The
通知を受けた撮像部1300は、撮影モード設定部1400から通知されたフォーマットの形式の作業用撮影データを生成して、名刺登録作業用記憶部3000に記憶させる(ステップS140、図4の名刺画像3001を参照)。
Upon receiving the notification, the
「撮影」が対応するソフトキー11が押下された旨を撮像部1300に通知したインタフェース部1100は、撮影された旨を名刺登録制御部1200に通知する。
The
通知を受けた名刺登録制御部1200は、名刺登録作業用記憶部3000に記憶されている作業用撮影データから、文字データを認識するよう文字認識部1500に依頼する。
Upon receiving the notification, the business card
文字データを認識するよう依頼を受けた文字認識部1500は、作業用撮影データから生成する撮影画像(図4の名刺画像3001を参照)の文字を認識し、認識した文字データを名刺登録制御部1200に渡す(ステップS150、ステップS210)。
Upon receiving a request to recognize the character data, the
なお、撮影した名刺の画像データを、JPEGなどで圧縮して登録する場合は、圧縮する前に記憶する名刺画像データを上向きにしておく方が望ましい。なぜなら、JPEGは、ロスレス圧縮ではないため、元の名刺画像を復元してから画像を回転する度に、画像が劣化するからである。 Note that when registering the image data of a photographed business card by compressing it with JPEG or the like, it is desirable to keep the business card image data stored before compression upward. This is because JPEG is not lossless compression, and the image deteriorates every time the image is rotated after the original business card image is restored.
また、文字認識部1500は、文字認識時に判定した撮影画像の向きに関する情報を名刺登録制御部1200に渡す(ステップS160、ステップS220)。
In addition, the
文字情報の向きに関する情報を渡された名刺登録制御部1200は、受け取った向きに関する情報を渡して、縮小画像生成部1600に保存用撮影データを生成するよう依頼する。
The business card
保存用撮影データを生成するよう依頼を受けた縮小画像生成部1600は、作業用撮影データ、及び、受け取った向きに関する情報から保存用撮影データ(図4の名刺画像3101を参照)を生成し、名刺画像記憶部3100に記憶させる。記憶させる際、識別子を付与し、識別子と対応付けて記憶させる(ステップS170)。
The reduced
保存用撮影データを記憶させた縮小画像生成部1600は、対応付けた識別子を名刺登録制御部1200に渡す。
The reduced
また、縮小画像生成部1600は、名刺登録作業用記憶部3000に記憶されている作業用撮影データを削除する。すなわち、名刺登録作業用記憶部3000における作業用撮影データが記憶されている領域を解放する(ステップS180)。
Further, the reduced
文字認識部1500から文字データを渡され、縮小画像生成部1600から識別子を渡された名刺登録制御部1200は、文字データと識別子とから電話帳データ3210を生成して電話帳記憶部3200に記憶させる(ステップS190、図4又は図7の電話帳データ3210を参照)。
The business card
次に、ユーザが電話帳に登録した個人情報から名刺画像を表示する場合を、図9を用いて説明する。 Next, a case where a business card image is displayed from personal information registered in the phone book by the user will be described with reference to FIG.
ユーザが、電話帳に登録されている個人を指定して情報の表示を指示する操作を行う。 The user performs an operation of designating information display by designating an individual registered in the telephone directory.
個人情報の表示を指示する操作を検出したインタフェース部1100は(ステップS300)、電話帳表示部1700に個人情報の表示処理を開始するよう指示する。
The
指示を受けた電話帳表示部1700は、電話帳記憶部3200から指定された個人の電話帳データ3210(図7参照)を読み出す(ステップS400)。
Receiving the instruction, the phone
また、電話帳表示部1700は、読み出した電話帳データ3210の項目3211「画像」の内容3212として設定されている画像の識別子を読み出す(ステップS410)。次に電話帳表示部1700は、読み出した識別子に対応付けられている保存用撮影データを、名刺画像記憶部3100から読み出す。電話帳表示部1700は、読み出した保存用データを用いて、より小さな画像であるアイコン2001(図1参照)を生成する。
Further, the phone
電話帳表示部1700は、読み出した電話帳データ3210、及び、生成したアイコン2001をディスプレイ2000に表示する(ステップS310、図4の画面2201を参照)。
The phone
ここで、ユーザは、カーソルの移動を指示する操作、又は、画像の拡大を指示する操作等を行う。 Here, the user performs an operation for instructing movement of the cursor or an operation for instructing enlargement of the image.
ユーザの指示を検出したインタフェース部1100は(ステップS320)、電話帳表示部1700に検出した指示を通知する。
The
指示が画像の拡大を行う指示である場合(ステップS320:画像の拡大)、電話帳表示部1700は、電話帳データ3210から読み出した識別子に対応付けられている保存用撮影データを、名刺画像記憶部3100から読み出し、ディスプレイ2000に表示し(ステップS330)、ユーザの指示を待つ。
When the instruction is an instruction for enlarging an image (step S320: enlargement of image), the phone
指示が終了の指示である場合(ステップS320:終了)、電話帳表示部1700は、処理を終了する。
If the instruction is an end instruction (step S320: end), the telephone
また、指示が他の処理の指示である場合(ステップS320:他の処理)、指示に従い他の処理を行い(ステップS340)、ユーザの指示を待つ。 If the instruction is an instruction for other processing (step S320: other processing), other processing is performed according to the instruction (step S340), and the user's instruction is waited.
<補足>
以上、本発明の実施形態について説明したが、本発明は上記形態に限らず、以下のようにしてもよい。
(1)実施形態の文字認識部1500は、作業用撮影データから文字を認識する際に、文字認識率をもとに、名刺の正しい向きを求める。具体的には、まず、作業用撮影データから文字を認識する。その文字認識率が所定値より低い場合は、更に、前記撮像データを90度回転又は180度回転してそれぞれ文字を認識する。最も文字認識率が高いときの撮像データを、前記被写体の正しい向きとみなす。
(2)実施形態では、1枚の名刺を撮影する毎に電話帳に登録することとしているが、作業用撮影データを複数枚記憶した後に、電話帳に登録することとしてもよい。
(3)実施形態では、作業用撮影データから保存用撮影データを生成した後に、縮小画像生成部1600が作業用撮影データを削除することとしている。しかし、保存用撮影データを生成しない場合には、文字認識部1500が文字を認識後に作業用撮影データを削除することとしてもよい。
(4)携帯電話機1000は、図5等の各構成要素の全部又は一部を、1チップ又は複数チップの集積回路で実現してもよい。
(5)携帯電話機1000は、図5等の各構成要素の全部又は一部を、コンピュータのプログラムで実現してもよいし、その他どのような形態で実施してもよい。
<Supplement>
As mentioned above, although embodiment of this invention was described, this invention may be as follows not only the said form.
(1) The
(2) In the embodiment, each time a business card is photographed, it is registered in the phone book. However, it is also possible to register a plurality of work shooting data and then register them in the phone book.
(3) In the embodiment, the reduced
(4) The
(5) The
コンピュータプログラムの場合、メモリカード、CD−ROMなどいかなる記録媒体に書き込まれたものをコンピュータに読み込ませて実行させる形にしてもよいし、ネットワークを経由してプログラムをダウンロードして実行させる形にしてもよい。 In the case of a computer program, a program written on any recording medium such as a memory card or CD-ROM may be read and executed by a computer, or a program may be downloaded and executed via a network. Also good.
上に述べた実施例には、以下に述べるような付記も開示されている。
(付記1)
撮像対象を撮影し、撮影データを取得する画像撮像装置と、出力装置と連携可能な画像管理装置であって、
前記画像撮像装置で撮影された文字を含む撮像対象を、撮影データを取得する撮像手段と、
前記撮影データから文字を認識する文字読取手段と、
前記撮影データに含まれる文字の大きさと前記文字読取手段で読取可能な文字の大きさに応じて、視認可能な保存する撮影データの画素数を決定する決定手段と、
該生成した視認可能な画像データを記憶可能な保存用データ記憶手段と、
前記撮影データから視認可能な保存用データとそれに対応する識別子を生成し、該生成した保存用データと識別子を前記保存用データ記憶手段に記憶させる保存用データ生成手段と、
該保存用データを前記出力装置に出力する出力手段と、
を備える画像管理装置。
(付記2)
撮像対象を撮影し、撮影データを取得する画像撮像手段と、
文字を含む撮像対象を撮影し、撮影データを取得する撮像手段と、
前記撮影データから文字を認識する文字読取手段と、
前記撮影データに含まれる文字の大きさと前記文字読取手段で読取可能な文字の大きさに応じて、視認可能な保存する前記画像データの画素数を決定する決定手段と、
該生成した視認可能な画像データを記憶可能な保存用データ記憶手段と、
前記撮影データから視認可能な保存用データそれに対応する識別子を生成し、該生成した保存用データと識別子を前記保存用データ記憶手段に記憶させる保存用データ生成手段と、
前記保存用データ記憶手段に記憶されている前記保存用データの中から表示したい保存用データの識別子を指定する指定手段と、
該指定された識別子の保存用データを画面に表示する表示手段と、
を備える画像管理装置。
In the embodiment described above, the following notes are also disclosed.
(Appendix 1)
An image capturing device that captures an imaging target and obtains captured data, and an image management device that can cooperate with an output device,
An imaging means for acquiring imaging data for an imaging target including characters captured by the image imaging device;
Character reading means for recognizing characters from the photographed data;
A determining unit that determines the number of pixels of the captured image data to be stored in accordance with the size of the character included in the imaged data and the size of the character that can be read by the character reading unit;
A storage data storage means capable of storing the generated visually recognizable image data;
Saving data generating means for generating visible saving data and an identifier corresponding thereto from the photographing data, and storing the generated saving data and identifier in the saving data storage means;
Output means for outputting the storage data to the output device;
An image management apparatus comprising:
(Appendix 2)
Image capturing means for capturing an imaging target and acquiring captured data;
An imaging means for capturing an imaging target including characters and acquiring imaging data;
Character reading means for recognizing characters from the photographed data;
A determining unit that determines the number of pixels of the image data to be stored that can be visually recognized according to the size of the character included in the photographed data and the size of the character that can be read by the character reading unit;
A storage data storage means capable of storing the generated visually recognizable image data;
Save data generation means for generating visible save data and an identifier corresponding to the save data from the image data, and storing the generated save data and the identifier in the save data storage means;
Designating means for designating an identifier of storage data to be displayed from the storage data stored in the storage data storage means;
Display means for displaying storage data of the designated identifier on the screen;
An image management apparatus comprising:
10 ソフトキー対応キー
20 機能キー
30 文字入力キー
1000 携帯電話機
1100 インタフェース部
1200 名刺登録制御部
1300 撮像部
1400 撮影モード設定部
1410 変換テーブル
1500 文字認識部
1600 縮小画像生成部
1700 電話帳表示部
2000 ディスプレイ
2001 アイコン
2101 ガイド枠
2204 カーソル
3000 名刺登録作業用記憶部
3001 3101 名刺画像
3100 名刺画像記憶部
3200 電話帳記憶部
3210 電話帳データ
10 Soft
Claims (6)
前記被写体を撮影し、前記決定された画素数の撮影データを出力する撮像手段と、
前記撮像手段で出力された撮影データを記憶する撮影データ記憶手段と、
前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識する文字読取手段と、
前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成する保存用データ生成手段と、
前記保存用データを記憶する保存用データ記憶手段と
を備える画像管理装置。 Determining means for determining the number of pixels according to the size of the character of the subject;
Imaging means for imaging the subject and outputting imaging data of the determined number of pixels;
Shooting data storage means for storing shooting data output by the imaging means;
Character reading means for recognizing characters of the subject from shooting data stored in the shooting data storage means;
Storage data generation means for generating storage data for the number of pixels capable of visually recognizing characters of the subject from the shooting data stored in the shooting data storage means;
An image management apparatus comprising: a storage data storage unit that stores the storage data.
請求項1に記載の画像管理装置。 The image management apparatus according to claim 1, wherein the determination unit determines the number of pixels of the shooting data that allows the character reading unit to recognize the character of the subject.
請求項1ないし請求項3のいずれかに記載の画像管理装置。 When the character recognition unit recognizes a character from the photographed data, if the character recognition rate is lower than a predetermined value, the character reading unit further rotates the imaging data by 90 degrees or 180 degrees to recognize the character, The image management apparatus according to any one of claims 1 to 3, wherein imaging data when the recognition rate is high is regarded as a correct orientation of the subject and is replaced with the imaging data.
請求項1ないし請求項3のいずれかに記載の画像管理装置。 The character reading unit deletes the photographic data after the character is recognized from the photographic data stored in the photographic data storage unit and after the storage data is stored in the storage data storage unit. The image management device according to any one of claims 1 to 3.
前記被写体の文字の大きさに応じた画素数を決定させ、
前記被写体を撮影し、前記決定された画素数の撮影データを出力させ、
前記出力された撮影データを撮影データ記憶手段に記憶させ、
前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識させ、
前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成させ、
前記保存用データを保存用データ記憶手段に記憶させ、
前記保存用データ記憶手段に前記保存用データが記憶された後に、前記撮影データを削除させる
画像管理方法。 An image management method for causing an image management apparatus that captures a subject and stores data for storage to manage the data,
Determine the number of pixels according to the size of the character of the subject,
Shooting the subject, outputting shooting data of the determined number of pixels,
The output shooting data is stored in shooting data storage means,
The character of the subject is recognized from the shooting data stored in the shooting data storage means;
From the shooting data stored in the shooting data storage means, generating storage data of the number of pixels that can visually recognize the character of the subject,
Storing the storage data in a storage data storage means;
An image management method for deleting the photographing data after the storage data is stored in the storage data storage means.
被写体の文字の大きさに応じた画素数を決定する決定処理を実行させ、
前記被写体を撮影し、前記決定された画素数の撮影データを出力する撮像処理を実行させ、
前記撮像処理で出力された撮影データを撮影データ記憶手段に記憶させる処理を実行させ、
前記撮影データ記憶手段に記憶されている撮影データから前記被写体の文字を認識する文字読取処理を実行させ、
前記撮影データ記憶手段に記憶されている撮影データから、前記被写体の文字を視認することが可能な画素数の保存用データを生成する保存用データ生成処理を実行させ、
前記保存用データを保存用データ記憶手段に記憶させる処理を実行させ、
前記保存用データ記憶手段に前記保存用データが記憶された後に、前記撮影データを削除させる処理を実行させる
コンピュータプログラム。 A computer program that takes an image of a subject and causes an image management device that stores data for storage to manage the data,
Execute the decision process to decide the number of pixels according to the size of the subject character,
Shooting the subject, and executing an imaging process for outputting shooting data of the determined number of pixels,
Causing the shooting data storage means to store the shooting data output in the shooting process;
A character reading process for recognizing the character of the subject from the shooting data stored in the shooting data storage means;
From the shooting data stored in the shooting data storage means, the storage data generation processing for generating the storage data of the number of pixels that can visually recognize the character of the subject,
Causing the storage data storage means to store the storage data,
A computer program for executing processing for deleting the photographing data after the storage data is stored in the storage data storage means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009223458A JP2011070601A (en) | 2009-09-28 | 2009-09-28 | Device, and method for managing image, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009223458A JP2011070601A (en) | 2009-09-28 | 2009-09-28 | Device, and method for managing image, and computer program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011070601A true JP2011070601A (en) | 2011-04-07 |
Family
ID=44015795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009223458A Pending JP2011070601A (en) | 2009-09-28 | 2009-09-28 | Device, and method for managing image, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011070601A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015045910A (en) * | 2013-08-27 | 2015-03-12 | 株式会社新生銀行 | Registration information confirmation method and registration information confirmation server |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001061060A (en) * | 1999-06-17 | 2001-03-06 | Canon Inc | Method and device for generating reduced image and storage medium |
JP2004013704A (en) * | 2002-06-10 | 2004-01-15 | Sumitomo Denko Systems Kk | Original direction distinguishing method for character recognition processing |
JP2005260663A (en) * | 2004-03-12 | 2005-09-22 | Casio Comput Co Ltd | Digital camera and program |
-
2009
- 2009-09-28 JP JP2009223458A patent/JP2011070601A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001061060A (en) * | 1999-06-17 | 2001-03-06 | Canon Inc | Method and device for generating reduced image and storage medium |
JP2004013704A (en) * | 2002-06-10 | 2004-01-15 | Sumitomo Denko Systems Kk | Original direction distinguishing method for character recognition processing |
JP2005260663A (en) * | 2004-03-12 | 2005-09-22 | Casio Comput Co Ltd | Digital camera and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015045910A (en) * | 2013-08-27 | 2015-03-12 | 株式会社新生銀行 | Registration information confirmation method and registration information confirmation server |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4250543B2 (en) | Imaging apparatus, information processing apparatus, and control method thereof | |
JP4374610B2 (en) | Imaging apparatus, image data storage method, and program | |
US7085590B2 (en) | Mobile terminal with ergonomic imaging functions | |
JP4450783B2 (en) | Imaging device | |
JP4665986B2 (en) | Imaging apparatus, image data storage method, and program | |
KR101433157B1 (en) | Mobile terminal and method for transmitting image thereof | |
US20060061659A1 (en) | Image capturing apparatus and control method thereof | |
JP2008022514A (en) | Image display apparatus | |
JP2006094082A (en) | Image photographing device, and program | |
KR100630007B1 (en) | Method for taking a panorama photograph | |
JP4288134B2 (en) | Imaging device | |
JP2006344168A (en) | Image display apparatus and photographing apparatus | |
JP5749115B2 (en) | Portable terminal device, program, and electronic document creation method | |
JP2011070601A (en) | Device, and method for managing image, and computer program | |
JP4294433B2 (en) | Mobile terminal device | |
KR100976470B1 (en) | Method for editing picture in mobile terminal | |
JP2004199141A (en) | Symbol recognition device and symbol recognition method | |
JP2005055973A (en) | Personal digital assistant | |
JP4565121B2 (en) | Imaging apparatus and imaging program | |
JP2003134359A (en) | Digital camera | |
JP4809462B2 (en) | Mobile terminal device | |
JP2007081459A (en) | Communication apparatus with camera | |
JP2005318091A (en) | Image processor | |
JP4436288B2 (en) | Mobile terminal device | |
JP5243280B2 (en) | Mobile terminal and synthesis program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130917 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131112 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140121 |