JP2010113735A - データ名決定装置 - Google Patents
データ名決定装置 Download PDFInfo
- Publication number
- JP2010113735A JP2010113735A JP2010010951A JP2010010951A JP2010113735A JP 2010113735 A JP2010113735 A JP 2010113735A JP 2010010951 A JP2010010951 A JP 2010010951A JP 2010010951 A JP2010010951 A JP 2010010951A JP 2010113735 A JP2010113735 A JP 2010113735A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- data
- name
- input image
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【課題】ユーザの所望するファイル名などを自動的に決定するための装置を提供すること。
【解決手段】データ名決定装置は、入力された画像中に含まれる文字列を抽出・認識し、各認識結果の文字列をその内容などに従って複数のカテゴリに分類する。ユーザによって、ユーザがデータ名として所望するカテゴリが指定・設定などされると、データ名決定装置は、ユーザによる指定・設定に応じたカテゴリに属する文字列を、所定のデータの名前として決定する。
【選択図】図1
【解決手段】データ名決定装置は、入力された画像中に含まれる文字列を抽出・認識し、各認識結果の文字列をその内容などに従って複数のカテゴリに分類する。ユーザによって、ユーザがデータ名として所望するカテゴリが指定・設定などされると、データ名決定装置は、ユーザによる指定・設定に応じたカテゴリに属する文字列を、所定のデータの名前として決定する。
【選択図】図1
Description
本発明は、画像中の文字を認識する装置や画像を記録する装置などに適用されて有効な技術に関する。
従来から、デジタルカメラ等のデジタル撮像機器によって撮像された画像のデータファイルの名前(ファイル名)を自動的に設定する方法が提案されている。例えば、撮像日時に基づいた設定方法や連番の数字を順に付与することによる設定方法などが提案されている。また、自動的に設定するのではなく、ユーザが個別に名前を設定する方法もある。しかし、これらの自動的な設定方法では、ファイル名とファイルの内容とにほとんど関連が無いため、ファイル名からファイルの内容を推測することが困難となる。また、ユーザが個別に設定する方法ではこのような問題は生じないが、当然、ユーザの負担が多くなってしまう。
このような問題に対し、データファイルの画像から文字列を認識し、文字サイズの大きな文字列をこのデータファイルの名前として自動的に設定する技術が提案されている(特許文献1参照)。また、スケジューラ等からの情報とファイル名変換テーブルとを用いてファイル名を自動的に設定する技術も提案されている(特許文献2参照)。
しかしながら、文字サイズの大きな文字列がどのような文字列であるかは不明であり、必ずしもファイル名として適切な文字列であるとは限らない。また、文字サイズの大きな文字列がユーザの望むファイル名ではない場合、結局、ユーザは手動でファイル名を再設定しなければならず手間が生じてしまっていた。
また、スケジューラなどからの情報に基づいて設定されるファイル名も、必ずしもユーザが所望するファイル名であるとは限らないという問題があった。さらに、スケジューラに登録された情報と実際のスケジュールとに差異が生じた場合には、ファイルの内容とはかけ離れたファイル名が誤算的に設定されてしまうという問題もあった。これらの場合、結局、ユーザは手動でファイル名を再設定しなければならなかった。
そこで本発明はこれらの問題を解決し、ユーザの所望するファイル名などを自動的に決定するための装置を提供することを目的とする。
上記問題を解決するため、本発明は以下のような構成をとる。本発明の第一の態様は、文字列認識手段及びカテゴリ判断手段を含む。文字列認識手段は、入力された画像から1以上の文字列を抽出し、抽出された文字列について文字列認識を行う。カテゴリ判断手段は、まず、文字列認識手段によって認識された各文字列についてその文字列が属するカテゴリを判断する。カテゴリとは、文字列が示す意味の分類を示し、具体的な例としては電話番号,FAX番号,会社名,店舗名,郵便番号,住所,URL,E−mailアドレス
,氏名,役職名,部署名などがある。カテゴリの判断は、例えば各文字列に所定の文字列が含まれるか否か等に応じて行われても良い。そして、カテゴリ判断手段は、所定のカテゴリに属する文字列を所定のデータの名前として決定する。所定のカテゴリとは、ユーザによって指定・選択されたカテゴリであっても良いし、予め設定されているカテゴリであっても良い。所定のデータの名前とは、データファイルの名前やディレクトリ(フォルダ)の名前などを示す。カテゴリ判断手段は、入力された画像のファイル名を決定するように構成されても良いし、入力された画像とは異なる他のデータファイルの名前を決定するように構成されても良い。
,氏名,役職名,部署名などがある。カテゴリの判断は、例えば各文字列に所定の文字列が含まれるか否か等に応じて行われても良い。そして、カテゴリ判断手段は、所定のカテゴリに属する文字列を所定のデータの名前として決定する。所定のカテゴリとは、ユーザによって指定・選択されたカテゴリであっても良いし、予め設定されているカテゴリであっても良い。所定のデータの名前とは、データファイルの名前やディレクトリ(フォルダ)の名前などを示す。カテゴリ判断手段は、入力された画像のファイル名を決定するように構成されても良いし、入力された画像とは異なる他のデータファイルの名前を決定するように構成されても良い。
このように構成された本発明の第一の態様では、ファイルやディレクトリ等のデータの名前が、入力画像から抽出・認識された文字列を用いて決定される。従って、ユーザは自らデータ名を入力する必要が無く、手間を省くことが可能となる。また、本発明の第一の態様では、抽出・認識された各文字列は各カテゴリに分類され、ユーザにより指定されたカテゴリや予め設定されているカテゴリに属する文字列がデータ名として決定される。このため、ユーザがわざわざデータ名の文字列入力を行うことなく、ユーザの所望するデータ名を決定することが可能となる。
特に、本発明の第一の態様が、入力される画像のファイル名や、入力される画像のファイルを含むディレクトリの名前を決定するように構成された場合、ファイルの内容やディレクトリの内容と密接な関係を有するデータ名を決定することが可能となる。この場合、ファイル名やディレクトリ名から、ファイルやディレクトリの内容を推測することが容易となる。
また、本発明の第一の態様が、入力される画像と関連する他のデータファイルの名前や、入力される画像と関連する他のディレクトリの名前を決定するように構成された場合にも、上記と同様の効果を得ることが可能となる。
また、本発明の第一の態様は、入力された動画像から静止画像を抽出する静止画像抽出手段をさらに備えるように構成されても良い。この場合、文字列認識手段は、静止画像抽出手段によって抽出された静止画像に対し文字列の抽出や文字列認識を行うように構成される。このように構成された本発明の第一の態様では、データ名の基となる文字列は、入力された動画像から抽出される。従って、静止画像のみならず、動画像を入力データとしてデータ名決定装置に付与することも可能となる。
また、本発明の第一の態様における文字列認識手段及び/又はカテゴリ判断手段は、ユーザによる修正指示に応じて、文字列認識の結果及び/又は所定のデータの名前を修正するように構成されても良い。ユーザの修正指示とは、文字列認識の結果や所定のデータの名前を、ユーザによって入力された文字列に置き換えることを示す指示であっても良い。また、ユーザの修正指示とは、文字列認識の結果や所定のデータの名前の一部の文字列を変更することを示す指示であっても良い。このように構成されることにより、文字列認識の結果や、カテゴリ判断手段により決定された名前がユーザの所望する文字列でない場合に、ユーザが修正することが可能となる。このとき、文字列認識手段及び/又はカテゴリ判断手段は、ユーザの修正指示が容易となるように、修正候補を提示するように構成されても良い。
また、本発明の第一の態様は、文字列認識手段による文字列認識の結果及び/又はカテゴリ判断手段により決定された所定のデータの名前に含まれる文字列の中から、予め決められた不要文字列を削除する削除手段をさらに備えるように構成されても良い。不要文字列とは、データ名に含む必要のない文字列(言い換えれば、データ名から削除されたとしてもデータ名が示す内容をユーザが認識する上で障害を生じないと認められる文字列)と
して予め定められたものである。不要文字列は、全カテゴリに共通して定められた文字列であっても良いし、カテゴリ毎に定められた文字列であっても良い。このように構成された本発明の第一の態様では、文字列認識手段による文字列認識の結果やカテゴリ判断手段により決定された所定のデータの名前の文字数を削減する際に、ユーザが削減対象となる文字列を指示する必要や、改めて削減後の文字列を入力するなどの必要がない。
して予め定められたものである。不要文字列は、全カテゴリに共通して定められた文字列であっても良いし、カテゴリ毎に定められた文字列であっても良い。このように構成された本発明の第一の態様では、文字列認識手段による文字列認識の結果やカテゴリ判断手段により決定された所定のデータの名前の文字数を削減する際に、ユーザが削減対象となる文字列を指示する必要や、改めて削減後の文字列を入力するなどの必要がない。
また、削除手段は、文字列認識手段による文字列認識の結果やカテゴリ判断手段により決定された所定のデータの名前に含まれる文字数が、所定の制限数を超えているか否か判断するように構成されても良い。そして、削除手段は、これらの文字数が所定の制限数を超えていると判断した場合にのみ、不要文字列の削除を行うように構成されても良い。
このように構成された本発明の第一の態様では、これらの文字数が所定の制限数を超えていた場合にも、ユーザがわざわざ文字数の調整や文字列の入力などを行う必要がない。
また、本発明の第一の態様におけるカテゴリ判断手段は、決定した所定のデータの名前と同一名のデータが所定のデータと同一のデータ領域に既に存在する場合、決定した所定のデータの名前に対し新たな文字列を付加するように構成されても良い。データ領域とは、例えばディレクトリやフォルダやデータ階層を示す。一般的に、同一のデータ領域に同一の名前を有する複数のデータが存在することは、情報処理装置等の都合上認められない。このため、同一のデータ領域に同一の名前を有するデータを記録しようとする場合には、ユーザがそのデータの名前を変更する必要があった。しかし、上記のように構成された本発明の第一の態様では、データの名前が重複した場合、カテゴリ判断手段がデータの名前の変更を行う。従って、ユーザはこのような場合にもデータの名前の変更などを行う必要がない。
また、本発明の第一の態様におけるカテゴリ判断手段は、優先順位を伴ったカテゴリの設定内容に従い、対応する文字列認識結果を有するカテゴリのうち最も優先順位の高いカテゴリに属する文字列を所定のデータの名前として決定するように構成されても良い。優先順位を伴ったカテゴリの設定内容とは、複数のカテゴリがユーザによって選択され、且つ各カテゴリに優先順位が設定されている設定内容を示す。対応する文字列認識結果を有するカテゴリとは、そのカテゴリに属する文字列認識結果が存在するカテゴリを示す。このように構成された本発明の第一の態様では、ユーザは、予めカテゴリと優先順位とを設定しておけば、データの名前を決定する度にカテゴリを選択・指示する必要が無い。
本発明の第二の態様は、入力された画像の略中心に位置する文字列を抽出し、抽出された文字列について文字列認識を行う文字列認識手段と、文字列認識手段によって認識された文字列を所定のデータの名前として決定するデータ名決定手段とを含む。本発明の第二の態様では、文字列認識手段は、入力された画像に含まれる文字列のうち、画像の略中心に位置する文字列を抽出する。このとき、文字列認識手段は、画像の略中心に位置する文字列のみを抽出するように構成されても良い。そして、文字列認識手段はこの抽出された文字列について文字認識を行い、データ名決定手段はこの文字列認識の結果を所定のデータの名前として決定する。
本発明の第二の態様によれば、本発明の第一の態様の場合と同様に、ファイルやディレクトリ等のデータの名前が、入力画像から抽出・認識された文字列を用いて決定される。従って、ユーザは自らデータ名を入力する必要が無く、手間を省くことが可能となる。また、本発明の第二の態様では、画像の略中心に位置する文字列がデータの名前として決定される。従って、ユーザは、わざわざデータ名の文字列入力を行うことなく、データ名として所望する文字列を略中心に含む画像を入力するのみで、データ名を決定することが可能となる。また、一般的に携帯電話機などに搭載される安価な撮像装置はそのレンズの精
度が低く、画像中心付近では精度が維持されているが中心から離れるに従って精度が低下してしまう。このような問題に対し、本発明の第二の態様は、画像の略中心に位置する文字を抽出し認識するため、低精度のレンズの影響を受けることなく、高い精度の文字認識を実現することが可能となる。
度が低く、画像中心付近では精度が維持されているが中心から離れるに従って精度が低下してしまう。このような問題に対し、本発明の第二の態様は、画像の略中心に位置する文字を抽出し認識するため、低精度のレンズの影響を受けることなく、高い精度の文字認識を実現することが可能となる。
本発明の第三の態様は、入力された画像から1以上の文字列を抽出し、入力された画像の中心と抽出された各文字列との距離を算出し、この距離が最も小さい文字列についてのみ文字列認識を行う文字列認識手段と、文字列認識手段によって認識された文字列を所定のデータの名前として決定するデータ名決定手段とを含む。本発明の第三の態様では、文字列認識手段は、まず入力された画像から1以上の文字列を抽出する。次に、文字列認識手段は、画像の中心と、抽出した各文字列との距離を算出する。そして、文字列認識手段はこの距離が最小となった文字列についてのみ文字列認識を行い、データ名決定手段はこの文字列認識の結果を所定のデータの名前として決定する。
本発明の第三の態様によれば、本発明の第一の態様の場合と同様に、ファイルやディレクトリ等のデータの名前が、入力画像から抽出・認識された文字列を用いて決定される。従って、ユーザは自らデータ名を入力する必要が無く、手間を省くことが可能となる。また、本発明の第三の態様では、画像の中心に最も近い文字列がデータの名前として決定される。従って、ユーザは、わざわざデータ名の文字列入力を行うことなく、データ名として所望する文字列を中心付近に含む画像を入力するのみで、データ名を決定することが可能となる。
本発明の第四の態様は、入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、入力された画像内においてこのデータが示す位置又は領域に位置する文字列を抽出し、抽出された文字列について文字列認識を行う文字列認識手段と、文字列認識手段によって認識された文字列を所定のデータの名前として決定するデータ名決定手段とを含む。入力画像内の位置とは、入力画像内のどの位置でも良く、例えば中心やそれ以外の特定の位置を示す。また、入力画像内の領域とは、どのような領域であっても良く、例えば中心付近の領域やそれ以外の特定の領域を示す。
本発明の第四の態様によれば、本発明の第一の態様の場合と同様に、ファイルやディレクトリ等のデータの名前が、入力画像から抽出・認識された文字列を用いて決定される。従って、ユーザは自らデータ名を入力する必要が無く、手間を省くことが可能となる。また、本発明の第四の態様では、画像内の特定の位置や領域に位置する文字列がデータの名前として決定される。従って、ユーザは、わざわざデータ名の文字列入力を行うことなく、データ名として所望する文字列を画像内の特定の位置や領域に含む画像を入力するのみで、データ名を決定することが可能となる。
本発明の第五の態様は、入力された画像から1以上の文字列を抽出し、入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、このデータが示す位置又は領域と抽出された各文字列との距離を算出し、この距離が最も小さい文字列についてのみ文字列認識を行う文字列認識手段と、文字列認識手段によって認識された文字列を所定のデータの名前として決定するデータ名決定手段とを含む。
本発明の第五の態様によれば、本発明の第一の態様の場合と同様に、ファイルやディレクトリ等のデータの名前が、入力画像から抽出・認識された文字列を用いて決定される。従って、ユーザは自らデータ名を入力する必要が無く、手間を省くことが可能となる。また、本発明の第五の態様では、画像内の特定の位置や領域の最も近くに位置する文字列がデータの名前として決定される。従って、ユーザは、わざわざデータ名の文字列入力を行うことなく、データ名として所望する文字列を画像内の特定の位置や領域の付近に含む画
像を入力するのみで、データ名を決定することが可能となる。
像を入力するのみで、データ名を決定することが可能となる。
本発明の第四の態様又は第五の態様における入力画像内の位置又は領域とは、入力画像が撮像される際にファインダ又はプレビュー画面に表示される照準の位置又は領域であっても良い。このように構成されることにより、ユーザは、ファインダ又はプレビュー画面において表示される照準の位置にデータ名として所望する文字列を配置させ、その画像を撮像しデータ名決定装置に入力することにより、所望のデータ名を決定することが可能となる。
第一〜第五の態様は、プログラムが情報処理装置によって実行されることによって実現されても良い。即ち、本発明は、上記した第一〜第五の態様における各手段が実行する処理を、情報処理装置に対して実行させるためのプログラム、或いは当該プログラムを記録した記録媒体として特定することができる。また、本発明は、上記した各手段が実行する処理を情報処理装置が実行する方法をもって特定されても良い。
本発明によれば、ファイルやディレクトリ等のデータの名前が、入力画像から抽出・認識された文字列を用いて決定される。従って、ユーザは自らデータ名の文字列を入力する必要が無く、手間を省くことが可能となる。また、本発明によれば、ユーザは、カテゴリの指定や、所定の位置等に文字列を含む画像の入力など、文字列の入力作業以外の簡易な処理によって所望の文字列をデータ名として決定することが可能となる。
〔システム構成〕
まず、データ名決定装置3を含む画像記録装置1のシステム構成について説明する。画像記録装置1は、ハードウェア的には、バスを介して接続されたCPU(中央演算処理装置),主記憶装置(RAM),補助記憶装置などを備える。補助記憶装置は、不揮発性記憶装置を用いて構成される。ここで言う不揮発性記憶装置とは、いわゆるROM(Read-Only Memory:EPROM(Erasable Programmable Read-Only Memory),EEPROM(Electrically Erasable Programmable Read-Only Memory),マスクROM等を含む),
FRAM(Ferroelectric RAM),ハードディスク等を指す。
まず、データ名決定装置3を含む画像記録装置1のシステム構成について説明する。画像記録装置1は、ハードウェア的には、バスを介して接続されたCPU(中央演算処理装置),主記憶装置(RAM),補助記憶装置などを備える。補助記憶装置は、不揮発性記憶装置を用いて構成される。ここで言う不揮発性記憶装置とは、いわゆるROM(Read-Only Memory:EPROM(Erasable Programmable Read-Only Memory),EEPROM(Electrically Erasable Programmable Read-Only Memory),マスクROM等を含む),
FRAM(Ferroelectric RAM),ハードディスク等を指す。
図1は、画像記録装置1の機能ブロックを示す図である。画像記録装置1は、補助記憶装置に記憶された各種のプログラム(OS,アプリケーション等)が主記憶装置にロードされCPUにより実行されることによって、画像入力部2,データ名決定装置3,入力部4,画像記憶部5,及び表示部6等を含む装置として機能する。次に、画像記録装置1が含む各機能部について説明する。
〈画像入力部〉
画像入力部2は、画像のデータを画像記録装置1へ入力するためのインタフェースとして機能する。画像入力部2によって、画像記録装置1に記録される画像のデータが画像記
録装置1へ入力される。画像入力部2は、画像記録装置1へ画像のデータを入力するためのどのような既存技術を用いて構成されても良い。
画像入力部2は、画像のデータを画像記録装置1へ入力するためのインタフェースとして機能する。画像入力部2によって、画像記録装置1に記録される画像のデータが画像記
録装置1へ入力される。画像入力部2は、画像記録装置1へ画像のデータを入力するためのどのような既存技術を用いて構成されても良い。
例えば、ネットワーク(例えばローカル・エリア・ネットワークやインターネット)を介して画像のデータが画像記録装置1へ入力されても良い。この場合、画像入力部2はネットワークインタフェース等を用いて構成される。また、デジタルカメラやスキャナやパーソナルコンピュータや記録装置(例えばハードディスクドライブ)等から画像のデータが画像記録装置1へ入力されても良い。この場合、画像入力部2は、デジタルカメラやパーソナルコンピュータや記録装置などと画像記録装置1とをデータ通信可能に接続する規格(例えばUSB(Universal Serial Bus)やSCSI(Small Computer System Interface)等の有線接続やbluetooth等の無線接続の規格)に応じて構成される。ま
た、記録媒体(例えば各種フラッシュメモリやフロッピー(登録商標)ディスクやCD(Compact Disk)やDVD(Digital Versatile Disc、Digital Video Disc))に記録された画像のデータが画像記録装置1へ入力されても良い。この場合、画像入力部2は、記録媒体からデータを読み出す装置(例えばフラッシュメモリリーダやフロッピーディスクドライブやCDドライブやDVDドライブ)を用いて構成される。
た、記録媒体(例えば各種フラッシュメモリやフロッピー(登録商標)ディスクやCD(Compact Disk)やDVD(Digital Versatile Disc、Digital Video Disc))に記録された画像のデータが画像記録装置1へ入力されても良い。この場合、画像入力部2は、記録媒体からデータを読み出す装置(例えばフラッシュメモリリーダやフロッピーディスクドライブやCDドライブやDVDドライブ)を用いて構成される。
また、画像記録装置1がデジタルカメラ等の撮像装置又はデジタルカメラ等の撮像装置を備える各種装置(例えばPDA(Personal Digital Assistant)や携帯電話機)の内部に含まれ、撮像された画像のデータが画像記録装置1へ入力されても良い。この場合、画像入力部2は、CCD(Charge-Coupled Devices)やCMOS(Complementary Metal-Oxide Semiconductor)センサ等を用いて構成されても良いし、CCDやCMOSセンサな
どによって撮像された画像のデータをデータ名決定装置3に入力させるためのインタフェースとして構成されても良い。
どによって撮像された画像のデータをデータ名決定装置3に入力させるためのインタフェースとして構成されても良い。
また、画像入力部2は上記された複数の場合に応じることが可能となるように構成されても良い。
〈データ名決定装置〉
データ名決定装置3は、画像記録装置1に入力された画像や画像記憶部5に既に記憶されている画像から文字列を抽出し、ユーザによる入力・設定などに従ってデータ名(ファイル名やディレクトリ名(フォルダ名)など)を決定する。データ名決定装置3が、いずれのデータファイルのファイル名又はディレクトリ名を決定するかは、ユーザによって指示されても良い。即ち、データ名決定装置3は、ユーザによって指定されたデータファイル又はディレクトリの名前を決定するように構成されても良い。このとき、文字列抽出の対象となる画像のデータファイルと、ファイル名が決定されるデータファイルとが同一である必要はない。また、データ名決定装置3は、ユーザの指定によらず、文字列抽出の対象となった画像のデータファイルの名前や、文字列抽出の対象となった画像のデータファイルを含むディレクトリの名前などを決定するように構成されても良い。
データ名決定装置3は、画像記録装置1に入力された画像や画像記憶部5に既に記憶されている画像から文字列を抽出し、ユーザによる入力・設定などに従ってデータ名(ファイル名やディレクトリ名(フォルダ名)など)を決定する。データ名決定装置3が、いずれのデータファイルのファイル名又はディレクトリ名を決定するかは、ユーザによって指示されても良い。即ち、データ名決定装置3は、ユーザによって指定されたデータファイル又はディレクトリの名前を決定するように構成されても良い。このとき、文字列抽出の対象となる画像のデータファイルと、ファイル名が決定されるデータファイルとが同一である必要はない。また、データ名決定装置3は、ユーザの指定によらず、文字列抽出の対象となった画像のデータファイルの名前や、文字列抽出の対象となった画像のデータファイルを含むディレクトリの名前などを決定するように構成されても良い。
データ名決定装置3は、画像入力部2から入力された画像を処理の対象として決定しても良いし、画像記憶部5に記憶される画像の中からユーザによって選択された画像を処理の対象として決定しても良い。
上記のような作用を実現するため、データ名決定装置3は、文字列認識部7及びカテゴリ判断部8を含む装置として構成される。データ名決定装置3は、画像記録装置1から独立してCPU及び/又はRAM等を備える装置として構成されても良いし、画像記録装置1に備えられたCPU及び/又はRAM等を用いて処理を行う装置として構成されても良い。また、データ名決定装置3は、画像記録装置1のCPUやRAM等によって実行されるプログラムによって実現される仮想的な装置として構成されても良い。以下、データ名
決定装置3に含まれる各機能部について説明する。
決定装置3に含まれる各機能部について説明する。
〈〈文字列認識部〉〉
文字列認識部7は、データ名決定装置3に入力される画像を処理の対象とし、この画像から文字列を抽出し認識する。このとき、処理の対象となる画像のデータは、画像記録装置1に含まれるRAMやROM等の一時記憶装置に記憶されても良いし、データ名決定装置3固有のRAMやROM等に記憶されても良い。以下、文字列認識部7の具体的な処理について説明する。
文字列認識部7は、データ名決定装置3に入力される画像を処理の対象とし、この画像から文字列を抽出し認識する。このとき、処理の対象となる画像のデータは、画像記録装置1に含まれるRAMやROM等の一時記憶装置に記憶されても良いし、データ名決定装置3固有のRAMやROM等に記憶されても良い。以下、文字列認識部7の具体的な処理について説明する。
まず、文字列認識部7は、処理の対象となる画像の中から文字列の画像を切り出す(抽出する)。文字列認識部7には、文字列を抽出する技術として、既存のどのような技術が適用されても良い。例えば、文字列認識部7は、処理の対象となる画像をグレースケールの濃淡画像に変換し、濃度値に関するヒストグラムを生成することにより文字列を抽出する。このとき、例えば文字列認識部7は、一行文字列毎に短冊状の行画像として各文字列を抽出しても良い。図2は、文字列認識部7によって一行文字列毎に短冊状の行画像として抽出される文字列の例を示す図である。図2では、矩形によって囲まれた各文字列がそれぞれ一つの行画像として抽出される。
次に、文字列認識部7は、抽出された各文字列の画像に対して文字認識処理を実施することにより文字列認識結果(テキストデータ)を取得する。文字列認識部7には、文字列を認識する技術として、既存のどのような技術が適用されても良い。文字列認識部7は、取得された文字列認識結果をカテゴリ判断部8へ渡す。このとき、文字列認識部7は、文字列認識結果として、各文字の修正候補を併せてカテゴリ判断部8へ渡すように構成されても良い。
〈〈カテゴリ判断部〉〉
カテゴリ判断部8は、文字列認識部7から受け取る各文字列認識結果を各カテゴリに分類し、ユーザによる入力・設定などに応じたカテゴリに属する文字列認識結果を選択する。そして、カテゴリ判断部8は、選択した文字列認識結果に基づき、データ名を決定する。以下、カテゴリ判断部8の具体的な処理について説明する。
カテゴリ判断部8は、文字列認識部7から受け取る各文字列認識結果を各カテゴリに分類し、ユーザによる入力・設定などに応じたカテゴリに属する文字列認識結果を選択する。そして、カテゴリ判断部8は、選択した文字列認識結果に基づき、データ名を決定する。以下、カテゴリ判断部8の具体的な処理について説明する。
カテゴリ判断部8は、まず、文字列認識部7から受け取る各文字列認識結果を各カテゴリに分類する。このとき、カテゴリ判断部8は、各文字列認識結果に含まれる文字列に応じて分類を行う。図3は、各カテゴリの名称と、各カテゴリの条件例とを示す図である。例えば、文字列認識結果に“TEL”や“電話番号”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列の後の数字列を電話番号として判断する。また、例えば、文字列認識結果に“FAX”や“ファクシミリ”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列の後の数字列をFAX番号として判断する。また、例えば、文字列認識結果に“会社”や“(株)”や“店”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列認識結果の文字列を会社名や店舗名として判断する。また、例えば、文字列認識結果に郵便記号(アルファベットの“T”の上に横棒を1本引いた記号)や“郵便番号”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列の後の数字列(3桁又は7桁)を郵便番号として判断する。また、例えば、文字列認識結果に都道府県名や“市”,“町”,“村”,“郡”,“丁”,“番”などの文字列が含まれる場合、カテゴリ判断部8は、その文字列認識結果の文字列を住所と判断する。このとき、都道府県名は、都道府県名ライブラリを用いたマッチング等を行うことにより判断できる。また、例えば、文字列認識結果に“URL”や“ホームページ”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列の後の文字列をURLとして判断する。また、例えば、文字列認識結果に“http”,“www”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列認識結果をURLとして判断する。また、例えば、文字列認識結果に“E−mail
”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列の後の文字列をE−mailアドレスとして判断する。また、例えば、文字列認識結果に“@”という文字列が含まれる場合、カテゴリ判断部8は、この文字列認識結果をE−mailアドレスとして判断する。また、例えば、文字列認識結果に、氏名ライブラリ(日本又は世界に存在する氏名をライブラリ化したもの)に存在するキーワードが含まれる場合、カテゴリ判断部8は、その文字列認識結果を氏名として判断する。また、例えば、文字列認識結果に、役職名ライブラリ(日本又は世界に存在する役職名をライブラリ化したもの)に存在するキーワードが含まれる場合、カテゴリ判断部8は、その文字列認識結果を役職名として判断する。また、例えば、文字列認識結果に、部署名ライブラリ(日本又は世界に存在する部署名をライブラリ化したもの)に存在するキーワードが含まれる場合、カテゴリ判断部8は、その文字列認識結果を部署名として判断する。そして、カテゴリ判断部8は、各文字列認識結果に対し、判断結果となるカテゴリ名を付加する。
”等の文字列が含まれる場合、カテゴリ判断部8は、その文字列の後の文字列をE−mailアドレスとして判断する。また、例えば、文字列認識結果に“@”という文字列が含まれる場合、カテゴリ判断部8は、この文字列認識結果をE−mailアドレスとして判断する。また、例えば、文字列認識結果に、氏名ライブラリ(日本又は世界に存在する氏名をライブラリ化したもの)に存在するキーワードが含まれる場合、カテゴリ判断部8は、その文字列認識結果を氏名として判断する。また、例えば、文字列認識結果に、役職名ライブラリ(日本又は世界に存在する役職名をライブラリ化したもの)に存在するキーワードが含まれる場合、カテゴリ判断部8は、その文字列認識結果を役職名として判断する。また、例えば、文字列認識結果に、部署名ライブラリ(日本又は世界に存在する部署名をライブラリ化したもの)に存在するキーワードが含まれる場合、カテゴリ判断部8は、その文字列認識結果を部署名として判断する。そして、カテゴリ判断部8は、各文字列認識結果に対し、判断結果となるカテゴリ名を付加する。
次に、カテゴリ判断部8は、ユーザによる入力・設定などに従って、該当するカテゴリの文字列認識結果を選択する。例えば、ユーザが入力部4を介して所望のカテゴリを選択した場合、カテゴリ判断部8は、ユーザにより選択されたカテゴリに対応する文字列認識結果を選択する。また、カテゴリ判断部8は、ユーザによって予めカテゴリが設定されている場合、設定されているカテゴリに対応する文字列認識結果を選択する。このとき、複数のカテゴリが優先順位を持って設定されていても良い。この場合、カテゴリ判断部8は、文字列認識結果が正常に存在するカテゴリのうち、優先順位の最も高いカテゴリに対応する文字列認識結果を選択する。また、カテゴリ判断部8は、選択した文字列認識結果を表示部6へ表示しユーザに確認させるように構成されても良い。このとき、カテゴリ判断部8は、文字列認識部7から受け取った修正候補を併せて表示することにより、ユーザが修正候補を用いて入力部4を介し文字列認識結果の内容を修正できるように構成されても良い。
また、カテゴリ判断部8は、選択した文字列認識結果に含まれる文字数が、所定の制限数以内であるか否か判断し、制限数以内でない場合に文字列認識結果に含まれる文字数を削減するように構成されても良い(以下、この処理を「文字数削減処理」と呼ぶ)。
例えば、カテゴリ判断部8は、予め設定されている不要な文字列(以下、「不要文字列」と呼ぶ)を文字列認識結果から削除することにより文字数を削減する。不要文字列とは、全カテゴリに共通して不要な文字列として設定されても良いし、各カテゴリについて特有の不要な文字列が設定されても良い。全カテゴリに共通する不要文字列の例として、“−(ハイフン)”や“,(カンマ)”等がある。また、各カテゴリに特有の不要文字列の例として、E−mailアドレスの場合には@(アットマーク)以降の文字列などがある。また、カテゴリ特有の不要文字列の例として、URLの場合には“http://”という文字列や、“http://www”という文字列がある。同様に、カテゴリ特有の不要文字列の例として、電話番号やFAX番号の場合には、“(”,“)”や、“−(ハイフン)”や、局番を示す文字列などがある。他にも、カテゴリ特有の不要文字列の例として、会社名・店舗名の場合には“株式会社”,“(株)”,“有限会社”,“(有)”,“店”等の文字列、住所の場合には都道府県名を示す文字列などがある。
また、カテゴリ判断部8は、不要文字列を、不要文字列よりも文字数の少ない他の文字列に置き換えることによって文字数を削減するように構成されても良い。例えば、“株式会社”という文字列を“(株)”や“株”という文字列(このとき、一文字分の文字列として(株)が示されても良い)に置き換えることや、住所において“1丁目2番地3号”という文字列を“1−2−3”と置き換える、即ち“丁目”,“番地”という文字列を“−(ハイフン)”に置き換えると同時に“号”という文字列を削除することなども可能である。
また、カテゴリ判断部8は、上記のような文字数削減処理によっても、文字数が制限数内におさまらない場合、文字数強制削減処理を実施することにより、さらに文字数を削減するように構成されても良い。文字数強制削減処理では、文字数削減処理よりも多くの文字列が削減される。言い換えれば、文字数強制削減処理では、文字列の削除によって文字列認識結果の意味が多少不明確になるとしても、文字列を削除することにより文字数を強制的に削減する。例えば、文字数強制削減処理では、E−mailアドレスやURLにおいて、“.co.jp”という文字列が“.c”という文字列に置き換えられる。また、住所において、国名、都道府県名、市町村名、町名、等の順に従って、制限数に文字数がおさまるまで文字列が順に削除される。
また、カテゴリ判断部8は、文字数削減処理により得られる文字列認識結果をファイル名として決定する場合、これらのファイルを含むディレクトリの名前を、文字数削減処理により削除した文字列を用いて決定するように構成されても良い。例えば、カテゴリ判断部8は、E−mailアドレスのカテゴリにおいて、@(アットマーク)以前の文字列をファイル名とし、@(アットマーク)以降の文字列を、これらのデータファイルを含むディレクトリの名前として決定するように構成されても良い。また例えば、カテゴリ判断部8は、住所のカテゴリにおいて、都道府県名が削除された文字列をファイル名とし、都道府県名を、これらのデータファイルを含むディレクトリの名前として決定するように構成されても良い。また、カテゴリ判断部8は、URLのカテゴリにおいて、“/〜(スラッシュとチルダ)”の後の文字列をファイル名とし、この前の文字列を、これらのデータファイルを含むディレクトリの名前として決定するように構成されても良い。
また、カテゴリ判断部8は、文字数削減処理において、文字列認識結果に含まれる文字数を削減するのではなく以下のような処理を行うように構成されても良い。即ち、カテゴリ判断部8は、文字列認識結果であるテキストデータのデータ量について、制限内におさまっているか否かを判断し、判断結果に応じてそのデータ量を削減するように構成されても良い。例えば、カテゴリ判断部8は、全角の数字やアルファベットやカタカナにより示される文字列を、半角の文字列に置き換えることによりデータ量を削減するように構成されても良い。
次に、カテゴリ判断部8は、選択した文字列認識結果を、ファイル名やディレクトリ名として画像記憶部5へ渡す。例えば、ファイル名を決定するようにデータ名決定装置3が設定されている場合やユーザからの指示があった場合、カテゴリ判断部8は、選択した文字列認識結果を所定のデータファイルの名前として画像記憶部5へ渡す。また、例えば、ディレクトリ名を決定するようにデータ名決定装置3が設定されている場合やユーザからの指示があった場合、カテゴリ判断部8は、選択した文字列認識結果を所定のディレクトリの名前として画像記憶部5へ渡す。
〈入力部〉
入力部4は、ユーザがデータ名決定装置3に対し、カテゴリの入力・設定や、処理対象となるデータファイルの指示や、名前を決定する対象となるデータファイルやディレクトリの指示・選択などを行うための装置である。入力部4は、例えばキーボードやポインティングデバイス(マウス,トラックボール,タブレットなど)や、ダイヤル式入力装置や、タッチパネルや、テンキーや、各種ボタンや、音声入力装置などを用いて構成される。入力部4は、ユーザがカテゴリの入力や設定などを行うことが可能であれば、その他どのような入力装置を用いて構成されても良い。
入力部4は、ユーザがデータ名決定装置3に対し、カテゴリの入力・設定や、処理対象となるデータファイルの指示や、名前を決定する対象となるデータファイルやディレクトリの指示・選択などを行うための装置である。入力部4は、例えばキーボードやポインティングデバイス(マウス,トラックボール,タブレットなど)や、ダイヤル式入力装置や、タッチパネルや、テンキーや、各種ボタンや、音声入力装置などを用いて構成される。入力部4は、ユーザがカテゴリの入力や設定などを行うことが可能であれば、その他どのような入力装置を用いて構成されても良い。
〈画像記憶部〉
画像記憶部5は、いわゆる不揮発性記憶装置とこの不揮発性記憶装置を制御する機能部
によって構成される。画像記憶部5は、他の機能部や装置の命令に従い、画像のデータファイルをはじめとする各種データのファイルを記憶できる。また、画像記憶部5は、データ名決定装置3からファイル名を受け取った場合、このファイル名を所定のデータファイルの名称として記憶する。所定の画像データとは、データ名決定装置3において処理の対象となった画像のデータであっても良いし、ユーザによって指定された他のデータファイルであっても良い。また、画像記憶部5は、データ名決定装置3からディレクトリ名を受け取る場合、所定のディレクトリの名前として記憶しても良い。この所定のディレクトリはユーザによって指定されたディレクトリであっても良いし、データ名決定装置3において処理の対象となった画像のデータファイルを含むディレクトリであっても良い。また、所定のディレクトリは、作成された新たなディレクトリであっても良い。
画像記憶部5は、いわゆる不揮発性記憶装置とこの不揮発性記憶装置を制御する機能部
によって構成される。画像記憶部5は、他の機能部や装置の命令に従い、画像のデータファイルをはじめとする各種データのファイルを記憶できる。また、画像記憶部5は、データ名決定装置3からファイル名を受け取った場合、このファイル名を所定のデータファイルの名称として記憶する。所定の画像データとは、データ名決定装置3において処理の対象となった画像のデータであっても良いし、ユーザによって指定された他のデータファイルであっても良い。また、画像記憶部5は、データ名決定装置3からディレクトリ名を受け取る場合、所定のディレクトリの名前として記憶しても良い。この所定のディレクトリはユーザによって指定されたディレクトリであっても良いし、データ名決定装置3において処理の対象となった画像のデータファイルを含むディレクトリであっても良い。また、所定のディレクトリは、作成された新たなディレクトリであっても良い。
〈表示部〉
表示部6は、CRT(Cathode Ray Tube)や液晶ディスプレイ等の表示装置やその制御部などを用いて構成される。表示部6は、様々なデータを表示できる。例えば、表示部6は、データ名決定装置3による処理結果や画像入力部2により入力された画像や、画像記憶部5に記憶される画像や、入力部4を介して入力された入力結果などを表示する。
表示部6は、CRT(Cathode Ray Tube)や液晶ディスプレイ等の表示装置やその制御部などを用いて構成される。表示部6は、様々なデータを表示できる。例えば、表示部6は、データ名決定装置3による処理結果や画像入力部2により入力された画像や、画像記憶部5に記憶される画像や、入力部4を介して入力された入力結果などを表示する。
〔動作例〕
図4,5は、画像記録装置1の動作例を示すフローチャートである。図4,5を用いて、画像記録装置1の動作例について説明する。
図4,5は、画像記録装置1の動作例を示すフローチャートである。図4,5を用いて、画像記録装置1の動作例について説明する。
まず、データ名決定装置3における処理の対象となる画像が決定されると、文字列認識部7は、処理の対象となる画像から文字列を抽出する(S01)。次に、文字列認識部7は、抽出した各文字列について文字認識を行い、文字列認識結果(テキストデータ)を取得する(S02)。文字列認識部7は、取得した全ての文字列認識結果をカテゴリ判断部8へ渡す。
カテゴリ判断部8は、文字列認識部7によって取得された各文字列認識結果についてカテゴリを判断する(S03)。そして、カテゴリ判断部8は、文字列認識結果に、判断結果であるカテゴリ名を付加する(S04)。カテゴリ判断部8は、全ての文字列認識結果に対しカテゴリ名を付加したか否か判断する(S05)。カテゴリ名が付加されていない文字列認識結果が存在すると認められる場合(S05−No)、カテゴリ判断部8は、カテゴリ名が付加されていない文字列認識結果に対し、S03,S04の処理を実施し、カテゴリ名を付加する。
一方、全ての文字列認識結果に対してカテゴリ名が付加されたと認められる場合(S05−Yes)、カテゴリ判断部8は、文字列認識結果とカテゴリ名とを対応づけて表示部6へ渡す。そして、表示部6は文字列認識結果とカテゴリ名とを対応づけて表示する(S06)。そして、カテゴリ判断部8は、表示部6を介してユーザに対しカテゴリの選択を促す(S07)。例えば、カテゴリ判断部8は、「カテゴリを選択して下さい」等の表示を表示部6に実施させることにより、ユーザに対してカテゴリの選択を促す。
入力部4を介してユーザにより選択されたカテゴリに対応する文字列認識結果が存在しない場合(S08−No)、カテゴリ判断部8は、別のカテゴリが選択されるように、改めてカテゴリを選択することをユーザに対し促す(S07)。一方、指示されたカテゴリに対応する文字列認識結果が存在する場合(S08−Yes)、カテゴリ判断部8は、この文字列認識結果に含まれる文字数が、制限数内であるか否か判断する。文字数が制限数を超えている場合(S09−No)、カテゴリ判断部8は、文字数削減処理を実施することにより、この文字列認識結果に含まれる文字数を削減させる(S10)。カテゴリ判断部8は、削減された文字数について再度制限数内であるか否か判断し、まだ制限数を超え
ている場合には、制限数内に収まるまで文字数強制削減処理を繰り返し行うように構成されても良い。
ている場合には、制限数内に収まるまで文字数強制削減処理を繰り返し行うように構成されても良い。
文字列認識結果に含まれる文字数が制限数内である(又は制限数内となった)場合(S09−Yes)、カテゴリ判断部8は、表示部6を介して、ユーザによって指示されたカテゴリに対応する文字列認識結果(文字数削減処理や文字数強制削減処理が実施された場合は、その処理結果)を表示する(S11)。表示された文字列認識結果についてユーザから承認を示す入力が無かった場合、又は否認する入力があった場合(S12−No)、S06以降の処理が改めて行われる。一方、ユーザから承認を示す入力があった場合(S12−Yes)、カテゴリ判断部8は画像記憶部5に対し文字列認識結果をデータ名として与える。そして、画像記憶部5は、所定のデータに対して文字列認識結果をデータ名として付与し記憶する(S13)。
〔作用/効果〕
画像記録装置1では、データ名設定装置3により、ユーザによって入力・設定されたカテゴリに対応する文字列が、画像内から抽出・認識され、ファイル名やディレクトリ名として決定される。このため、ユーザは、ファイル名やディレクトリ名を決める際に、わざわざこれらの名前をテキストデータとして入力する必要がない。また、データ名設定装置3では、決定されるファイル名やディレクトリ名は、意味のない連番や日付などではなく、ユーザにより入力・設定されたカテゴリに対応する文字列である。そして、この文字列は、所定の画像(例えばファイル名が決定されるデータファイルそのものの画像や、名前が決定されるディレクトリに含まれるデータファイルの画像や、ファイル名が決定されるデータファイルと密接に関連する画像(例えば顔写真のデータファイルの名前を決定する際の、顔写真の人物の名刺の画像など)など)から抽出・認識される。この文字列は、例えば、電話番号やURLやE−mailアドレスや氏名などである(具体例は図3参照)。従って、画像記憶装置1において設定されるファイル名やディレクトリ名(即ち、データ名決定装置3によって決定されるファイル名やディレクトリ名)からデータファイルやディレクトリの内容を推測することが容易に可能となる。
画像記録装置1では、データ名設定装置3により、ユーザによって入力・設定されたカテゴリに対応する文字列が、画像内から抽出・認識され、ファイル名やディレクトリ名として決定される。このため、ユーザは、ファイル名やディレクトリ名を決める際に、わざわざこれらの名前をテキストデータとして入力する必要がない。また、データ名設定装置3では、決定されるファイル名やディレクトリ名は、意味のない連番や日付などではなく、ユーザにより入力・設定されたカテゴリに対応する文字列である。そして、この文字列は、所定の画像(例えばファイル名が決定されるデータファイルそのものの画像や、名前が決定されるディレクトリに含まれるデータファイルの画像や、ファイル名が決定されるデータファイルと密接に関連する画像(例えば顔写真のデータファイルの名前を決定する際の、顔写真の人物の名刺の画像など)など)から抽出・認識される。この文字列は、例えば、電話番号やURLやE−mailアドレスや氏名などである(具体例は図3参照)。従って、画像記憶装置1において設定されるファイル名やディレクトリ名(即ち、データ名決定装置3によって決定されるファイル名やディレクトリ名)からデータファイルやディレクトリの内容を推測することが容易に可能となる。
また、このとき、カテゴリ判断部8は、例えば図3に示されるような条件に従って独自に文字列認識結果の分類を行う。このため、ユーザは文字列認識結果を各カテゴリに分類する必要はない。
また、画像記録装置1では、ユーザは複数のカテゴリを優先順位づけて予め設定しておくことができる。この場合、優先順位に従ってカテゴリが自動的に決定され、決定されたカテゴリに対応する文字列認識結果がデータ名として設定される。このため、ユーザはデータ名を決定する度にわざわざカテゴリの選択を行う必要が無く、ユーザにとっての処理の簡易化、高速化を図ることができる。
また、画像記録装置1では、選択された文字列認識結果に含まれる文字数が制限数を超えている場合、文字数削減処理や文字数強制削減処理が実行され、制限数におさまるように文字数の調整が行われる。このため、例え文字列認識結果の文字数が制限数を超えていたとしても、ユーザがわざわざ手入力を行うことによって文字列認識結果の調整や、新たなデータ名を入力する必要がない。
〔変形例〕
画像記録装置1又は画像入力部2がデジタルカメラ等の撮像装置を用いて構成される場合、ファインダーやプレビュー画面において、照準を示す表示が行われるように構成されても良い。図6は、照準を示す表示の例を示す図である。図6では、十字の真ん中(即ち、円の中心部)が照準の中心となる。このように構成された場合、文字列認識部7には、
入力画像のデータとともに、照準の中心位置が渡される。そして、文字列認識部7は、照準の中心が含まれる(又は照準の中心に最も近い)文字列のみを抽出・認識する。この場合、カテゴリ判断部8は、カテゴリに関する判断を行うことなく、この文字列認識結果をデータ名として決定する。また、ユーザがこのような照準を示す表示を行うか否かについて設定することができるように、画像記録装置1が構成されても良い。この場合、例えば照準を示す表示が行われないように設定された場合には、カテゴリに関する判断が実施され、上記表示が行われるように設定された場合には、カテゴリに関する判断を実施せず照準の中心が含まれる文字列等のみを抽出・認識するように構成されても良い。
画像記録装置1又は画像入力部2がデジタルカメラ等の撮像装置を用いて構成される場合、ファインダーやプレビュー画面において、照準を示す表示が行われるように構成されても良い。図6は、照準を示す表示の例を示す図である。図6では、十字の真ん中(即ち、円の中心部)が照準の中心となる。このように構成された場合、文字列認識部7には、
入力画像のデータとともに、照準の中心位置が渡される。そして、文字列認識部7は、照準の中心が含まれる(又は照準の中心に最も近い)文字列のみを抽出・認識する。この場合、カテゴリ判断部8は、カテゴリに関する判断を行うことなく、この文字列認識結果をデータ名として決定する。また、ユーザがこのような照準を示す表示を行うか否かについて設定することができるように、画像記録装置1が構成されても良い。この場合、例えば照準を示す表示が行われないように設定された場合には、カテゴリに関する判断が実施され、上記表示が行われるように設定された場合には、カテゴリに関する判断を実施せず照準の中心が含まれる文字列等のみを抽出・認識するように構成されても良い。
また、文字列認識部7は、画像の中心が含まれる(又は画像の中心に最も近い)文字列のみを抽出・認識するように構成されても良い。この場合、カテゴリ判断部8は、カテゴリに関する判断を行うことなく、この文字列認識結果をデータ名として決定する。このとき、文字列認識部7は、例えば各文字列の中心線と画像の中心との距離を算出し、この値が最も小さい文字列を画像の中心に最も近い文字列として判断するように構成されても良い。また、文字列認識部7は、各文字列について、各文字列に含まれる文字のうち最も画像の中心に近いものと画像の中心との距離を算出し、この値が最も小さい文字列を画像の中心に最も近い文字列として判断するように構成されても良い。また、文字列認識部7は、各文字列について、各文字列の中心(例えば各文字列の領域の重心や、各文字列を囲む矩形の中心など)と画像の中心との距離を算出し、この値が最も小さい文字列を画像の中心に最も近い文字列として判断するように構成されても良い。
また、画像記録装置1は、S06において表示された文字列認識結果にユーザの所望の文字列が無い場合、ユーザがカテゴリを選択することなく自らデータ名を入力することができるように構成されても良い。このような入力は、入力部4又は別途設けられた入力装置によって行われる。例えば、このような入力は、テンキーやキーボードやタッチパネル等の様々な既存の入力装置によって実現可能である。また、このような入力は、S06においてのみならず、他のステップにおいて(例えば、S12とS13との間、S10の代わり等)実施されるように構成されても良い。また、このような入力が行われた場合には、すぐにS13の処理を行うことにより、入力されたデータ名を採用するように構成されても良い。
また、文字列認識結果の文字数が制限数を超えている場合、カテゴリ判断部8は、文字数削減処理を行うことなく、ユーザに他のカテゴリを選択するように又は文字列認識結果の内容を修正するように指示しても良い。同様に、文字数削減処理を実施したにもかかわらず文字数が制限数を超えている場合、カテゴリ判断部8は、文字数強制削減処理を行うことなく、ユーザに他のカテゴリを選択するように又は文字列認識結果の内容を修正するように指示しても良い。
また、カテゴリ判断部8は、データ名として決定した文字列認識結果と同じファイル名又はディレクトリ名が、このデータ名を与えるデータファイル又はディレクトリが含まれるディレクトリに存在する場合、この文字列認識結果に対し所定の文字列を付加するように構成されても良い。所定の文字列とは、例えば連番や日付などである。
また、画像記録装置1の説明では、文字列認識部7によって抽出・認識される文字列は左から右方向に横に並ぶ文字列のみが例示したが、他の方向、例えば上から下方向に並ぶ文字列などが抽出・認識されるように構成されても良い。どのような文字列を抽出・認識するかはユーザによって設定可能に構成されても良い。
〔適用例〕
画像記録装置1は、以下のように実際の場面で用いることが可能である。例えば、画像
記録装置1を用いて名刺の画像データを記録する場合、各名刺の画像データに対し、名刺の画像から抽出される任意のカテゴリ(例えば、氏名や会社名やE−mailアドレスや電話番号(内線番号を含む)など)の文字列をファイル名として決定することができる(記録するデータファイルと文字列抽出の対象となるデータファイルとが同一である場合の具体例)。
画像記録装置1は、以下のように実際の場面で用いることが可能である。例えば、画像
記録装置1を用いて名刺の画像データを記録する場合、各名刺の画像データに対し、名刺の画像から抽出される任意のカテゴリ(例えば、氏名や会社名やE−mailアドレスや電話番号(内線番号を含む)など)の文字列をファイル名として決定することができる(記録するデータファイルと文字列抽出の対象となるデータファイルとが同一である場合の具体例)。
また、人の顔の画像データを記録する場合、この人の名刺の画像から抽出される任意のカテゴリの文字列を、人の顔の画像データのファイル名として決定することもできる。また、建物や場所などの画像データを記録する場合、この建物や場所の名称や説明などが記載された物の画像(例えば看板や観光案内や地図などの画像)から抽出される任意のカテゴリの文字列をファイル名として決定することもできる(記録するデータファイルと文字列抽出の対象となるデータファイルとが異なる場合の具体例)。
また、同一の会社の複数人の名刺の画像データを記録する場合、これらの画像データを含むディレクトリの名前を、これらの画像から抽出・認識された文字列を用いて決定することもできる(ディレクトリ名を決定する場合の具体例)。このとき、さらに、複数の名刺の画像データから抽出された文字列のうち、全てに共通する文字列(文字列認識結果の一部分の文字列であっても良い)をディレクトリ名として決定するようにデータ名決定装置3が構成されても良い。この場合、例えば、E−mailアドレスの@(アットマーク)より前の文字列を各名刺画像のファイル名とし、@(アットマーク)以降の共通する文字列をディレクトリ名として決定することもできる。
1 画像記録装置
2 画像入力部
3 データ名決定装置
4 入力部
5 画像記憶部
6 表示部
7 文字列認識部
8 カテゴリ判断部
2 画像入力部
3 データ名決定装置
4 入力部
5 画像記憶部
6 表示部
7 文字列認識部
8 カテゴリ判断部
Claims (10)
- 入力された画像から1以上の文字列を抽出し、入力された画像の中心と抽出された各文字列との距離を算出し、この距離が最も小さい文字列についてのみ文字列認識を行う文字列認識手段と、
前記文字列認識手段によって認識された文字列を所定のデータの名前として決定するデータ名決定手段と
を含むデータ名決定装置。 - 入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、入力された画像内においてこのデータが示す位置又は領域に位置する文字列を抽出し、抽出された文字列について文字列認識を行う文字列認識手段と、
前記文字列認識手段によって認識された文字列を所定のデータの名前として決定するデータ名決定手段と
を含むデータ名決定装置。 - 入力された画像から1以上の文字列を抽出し、入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、このデータが示す位置又は領域と抽出された各文字列との距離を算出し、この距離が最も小さい文字列についてのみ文字列認識を行う文字列認識手段と、
前記文字列認識手段によって認識された文字列を所定のデータの名前として決定するデータ名決定手段と
を含むデータ名決定装置。 - 前記入力画像内の位置又は領域とは、前記入力画像が撮像される際にファインダ又はプレビュー画面に表示される照準の位置又は領域である請求項2又は3に記載のデータ名決定装置。
- 入力された画像から1以上の文字列を抽出するステップと、
入力された画像の中心と抽出された各文字列との距離を算出するステップと、
算出された距離が最も小さい文字列についてのみ文字列認識を行うステップと、
認識された文字列を所定のデータの名前として決定するステップと
を情報処理装置に実行させるためのプログラム。 - 入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、入力された画像内においてこのデータが示す位置又は領域に位置する文字列を抽出するステップと、
抽出された文字列について文字列認識を行うステップと、
認識された文字列を所定のデータの名前として決定するステップと
を情報処理装置に実行させるためのプログラム。 - 入力された画像から1以上の文字列を抽出するステップと、
入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、このデータが示す位置又は領域と抽出された各文字列との距離を算出するステップと、
この距離が最も小さい文字列についてのみ文字列認識を行うステップと、
認識された文字列を所定のデータの名前として決定するステップと
を情報処理装置に実行させるためのプログラム。 - 情報処理装置が、入力された画像から1以上の文字列を抽出するステップと、
情報処理装置が、入力された画像の中心と抽出された各文字列との距離を算出するステッ
プと、
情報処理装置が、算出された距離が最も小さい文字列についてのみ文字列認識を行うステップと、
情報処理装置が、認識された文字列を所定のデータの名前として決定するステップと
を含むデータ名決定方法。 - 情報処理装置が、入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、入力された画像内においてこのデータが示す位置又は領域に位置する文字列を抽出するステップと、
情報処理装置が、抽出された文字列について文字列認識を行うステップと、
情報処理装置が、認識された文字列を所定のデータの名前として決定するステップと
を含むデータ名決定方法。 - 情報処理装置が、入力された画像から1以上の文字列を抽出するステップと、
情報処理装置が、入力画像とともに入力される入力画像内の位置又は領域を示すデータに基づき、このデータが示す位置又は領域と抽出された各文字列との距離を算出するステップと、
情報処理装置が、この距離が最も小さい文字列についてのみ文字列認識を行うステップと、
情報処理装置が、認識された文字列を所定のデータの名前として決定するステップと
を含むデータ名決定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010010951A JP2010113735A (ja) | 2010-01-21 | 2010-01-21 | データ名決定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010010951A JP2010113735A (ja) | 2010-01-21 | 2010-01-21 | データ名決定装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004168531A Division JP4599896B2 (ja) | 2004-06-07 | 2004-06-07 | データ名決定装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010113735A true JP2010113735A (ja) | 2010-05-20 |
Family
ID=42302192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010010951A Pending JP2010113735A (ja) | 2010-01-21 | 2010-01-21 | データ名決定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010113735A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014013534A (ja) * | 2012-07-05 | 2014-01-23 | Ricoh Co Ltd | 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム |
JP2017142690A (ja) * | 2016-02-10 | 2017-08-17 | キヤノン株式会社 | 情報処理装置及びその制御方法 |
JP2019120642A (ja) * | 2018-01-10 | 2019-07-22 | オムロン株式会社 | 画像検査装置および照明装置 |
JP2020140564A (ja) * | 2019-02-28 | 2020-09-03 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
JP2020145665A (ja) * | 2019-03-10 | 2020-09-10 | 株式会社北陸テクノソリューションズ | ファクシミリ文書管理支援システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08202731A (ja) * | 1995-01-27 | 1996-08-09 | Canon Inc | 画像処理方法 |
JPH11212992A (ja) * | 1998-01-27 | 1999-08-06 | Sharp Corp | 画像ファイリングシステムおよび画像ファイリングシステムを制御するプログラムを記録した記録媒体 |
JP2001147990A (ja) * | 1999-11-24 | 2001-05-29 | Sharp Corp | 画像データ処理装置及び方法並びにこれに利用される記憶媒体 |
JP2003037770A (ja) * | 2001-07-24 | 2003-02-07 | Casio Comput Co Ltd | 電子カメラ、電子カメラの制御方法、動画カメラ及び動画カメラの制御方法 |
JP2003078640A (ja) * | 2001-09-05 | 2003-03-14 | Hitachi Ltd | 携帯端末装置及び通信システム |
-
2010
- 2010-01-21 JP JP2010010951A patent/JP2010113735A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08202731A (ja) * | 1995-01-27 | 1996-08-09 | Canon Inc | 画像処理方法 |
JPH11212992A (ja) * | 1998-01-27 | 1999-08-06 | Sharp Corp | 画像ファイリングシステムおよび画像ファイリングシステムを制御するプログラムを記録した記録媒体 |
JP2001147990A (ja) * | 1999-11-24 | 2001-05-29 | Sharp Corp | 画像データ処理装置及び方法並びにこれに利用される記憶媒体 |
JP2003037770A (ja) * | 2001-07-24 | 2003-02-07 | Casio Comput Co Ltd | 電子カメラ、電子カメラの制御方法、動画カメラ及び動画カメラの制御方法 |
JP2003078640A (ja) * | 2001-09-05 | 2003-03-14 | Hitachi Ltd | 携帯端末装置及び通信システム |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014013534A (ja) * | 2012-07-05 | 2014-01-23 | Ricoh Co Ltd | 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム |
EP2682881A3 (en) * | 2012-07-05 | 2016-10-26 | Ricoh Company, Ltd. | Document Processing Apparatus, Image Processing Apparatus, Document Processing Method, and Medium |
JP2017142690A (ja) * | 2016-02-10 | 2017-08-17 | キヤノン株式会社 | 情報処理装置及びその制御方法 |
JP2019120642A (ja) * | 2018-01-10 | 2019-07-22 | オムロン株式会社 | 画像検査装置および照明装置 |
US10984515B2 (en) | 2018-01-10 | 2021-04-20 | Omron Corporation | Image inspection device and illumination device |
JP2020140564A (ja) * | 2019-02-28 | 2020-09-03 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
JP7353771B2 (ja) | 2019-02-28 | 2023-10-02 | キヤノン株式会社 | プログラム、記憶媒体、情報処理装置の制御方法、及び情報処理装置 |
US11811979B2 (en) | 2019-02-28 | 2023-11-07 | Canon Kabushiki Kaisha | Image processing apparatus, method for controlling the same, and storage medium |
JP2020145665A (ja) * | 2019-03-10 | 2020-09-10 | 株式会社北陸テクノソリューションズ | ファクシミリ文書管理支援システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8279173B2 (en) | User interface for selecting a photo tag | |
US9589198B2 (en) | Camera based method for text input and keyword detection | |
US8667384B2 (en) | User interface for editing photo tags | |
US20150242404A1 (en) | Selectively emphasizing digital content | |
US20100321534A1 (en) | Method for creating content using a camera of a portable terminal and a portable terminal adapted therefor | |
EP3528140A1 (en) | Picture processing method, device, electronic device and graphic user interface | |
JP2010113735A (ja) | データ名決定装置 | |
US11836442B2 (en) | Information processing apparatus, method, and storage medium for associating metadata with image data | |
JP2010217996A (ja) | 文字認識装置、文字認識プログラム、および文字認識方法 | |
EP1990744A1 (en) | User interface for editing photo tags | |
EP2040185A1 (en) | User Interface for Selecting a Photo Tag | |
JP4599896B2 (ja) | データ名決定装置 | |
US8218876B2 (en) | Information processing apparatus and control method | |
US20110231430A1 (en) | Content collecting apparatus, content collecting method, and non-transitory computer-readable recording medium encoded with content collecting program | |
US9645716B2 (en) | Display processing apparatus for controlling display, method of display processing, and nontransitory storage medium storing display processing program | |
JP4597644B2 (ja) | 文字認識装置、プログラムおよび記録媒体 | |
JP2013121114A (ja) | Fax送信装置、システム、制御方法、及びプログラム | |
KR20150026382A (ko) | 전자 장치 및 전자 장치에서 연락처 관리 방법 | |
JP7263721B2 (ja) | 情報処理装置及びプログラム | |
JP6268930B2 (ja) | 画像処理装置、画像編集方法、および画像編集プログラム | |
JP2005346628A (ja) | 文字入力方法、文字入力装置、及びプログラム | |
JP7031465B2 (ja) | 情報処理装置及びプログラム | |
JP5447769B2 (ja) | コンテンツデータの処理方法、プログラム及び携帯情報処理装置 | |
JP2005055973A (ja) | 携帯情報端末 | |
JP6394270B2 (ja) | 情報処理装置、記録システム、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120321 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121106 |