JP2011123567A - 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 - Google Patents
画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2011123567A JP2011123567A JP2009278821A JP2009278821A JP2011123567A JP 2011123567 A JP2011123567 A JP 2011123567A JP 2009278821 A JP2009278821 A JP 2009278821A JP 2009278821 A JP2009278821 A JP 2009278821A JP 2011123567 A JP2011123567 A JP 2011123567A
- Authority
- JP
- Japan
- Prior art keywords
- line segment
- input
- polygon
- image
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
【課題】簡単な操作によって画像内から所望の多角形を指定可能な画像処理装置を提供する。
【解決手段】画像処理装置101は、ユーザによる入力を受け付け可能な入力装置104と接続される、画像を処理するための画像処理装置であって、入力画像から抽出する多角形の辺の数を特定する辺数特定部1011と、多角形を構成しうるように入力画像から抽出された線分を、多角形をなす各辺の候補群に分類する線分分類部1013と、線分分類部1013により分類された各候補群について、入力装置104が受け付けた入力に応じて、ユーザが所望とする線分を選択する線分選択部1014と、線分選択部1014によって各候補群から選択された線分により、多角形を形成する多角形形成部1015と、を備える。
【選択図】図1
【解決手段】画像処理装置101は、ユーザによる入力を受け付け可能な入力装置104と接続される、画像を処理するための画像処理装置であって、入力画像から抽出する多角形の辺の数を特定する辺数特定部1011と、多角形を構成しうるように入力画像から抽出された線分を、多角形をなす各辺の候補群に分類する線分分類部1013と、線分分類部1013により分類された各候補群について、入力装置104が受け付けた入力に応じて、ユーザが所望とする線分を選択する線分選択部1014と、線分選択部1014によって各候補群から選択された線分により、多角形を形成する多角形形成部1015と、を備える。
【選択図】図1
Description
本発明は、画像内の複数の線分から、ユーザが望む多角形を指定することが可能な画像処理装置に関する。
近年、CCD(Charge Coupled Device Image Sensor)、CMOS(Complementary Metal Oxide Semiconductor)等の撮像装置を搭載するデジタル機器において、名刺を撮影して該名刺に記載されている内容を自動的に読み込む技術や、看板等を撮影して該看板に記載された情報から処理を行う技術が盛んに研究開発されている。これらを実現するためには、撮影した画像内に存在する、名刺、看板等の矩形領域を検出することが必要となる。
しかし、名刺や看板等の撮影においては、背景や、名刺、看板内に様々な模様が存在する可能性が高く、その模様によって、間違った矩形候補が生じることがある。この場合、最終的に、ユーザがどの矩形候補が正解かを選択する必要が生じる。また、矩形候補の数が多くなった場合、ユーザが望む矩形を選択することが困難となる。
特許文献1によると、撮像して得られた画像データから複数の直線を抽出し、その抽出された複数の直線が囲む閉領域を抽出することで、閉領域の四辺の一部がとぎれて観察される場合であっても、画像から閉領域を抽出する手法が提案されている。
特許文献2によると、画像上に設定された一群の連続する多節線分または点列で既定される関心領域の形状を修正する場合、多節線分または点列を等間隔に配列し、その内の一つを選択してこれをドラッグすることによって、選択した多節線分はたは点列に隣接する他の多節線分または点列の一つまたは複数を、所定の張力に応じて追随して移動させることで、操作する数を軽減して、関心領域の形状修正が実施できる手法が提案されている。
しかしながら、上記特許文献1および2には、画像内においてユーザが望む多角形を、少ない回数の直感的かつ簡単な操作によって指定することができる技術は開示されていない。
すなわち、特許文献1では、求めた複数の閉領域をデジタルカメラの表示部に表示し、十字キー等の操作によって、所望の閉領域をユーザが選択できるようにし、そのようなユーザインタフェースによって、ユーザの領域の部分的修正を行う、と説明されているが、具体的な閉領域の選択方法が提示されていない。
また、特許文献2では、関心領域選択候補は一つであり、ユーザはその関心領域選択候補の各変更対象の頂点を選択する。この場合、頂点数が多くなった場合に、ユーザにとって、ユーザが望む関心領域を選択するために、多数の頂点の選択が必要となる。また、頂点の操作はマウスで行われるため、特に表示画面が小さい場合等、ユーザにとって操作が困難となる問題があった。
本発明は以上の問題に鑑みてなされたものであり、少ない回数の直感的かつ簡単な操作により入力画像内から任意の多角形の指定を行うことを目的としている。
本発明に係る画像処理装置は、上記の課題を解決するために、ユーザによる入力を受け付け可能な入力装置と接続される、画像を処理するための画像処理装置であって、入力画像から抽出する多角形の辺の数を特定する辺数特定手段と、上記多角形を構成しうるように入力画像から抽出された線分を、当該多角形をなす各辺の候補群に分類する線分分類手段と、上記線分分類手段により分類された上記各候補群について、上記入力装置が受け付けた入力に応じて、ユーザが所望とする線分を選択する線分選択手段と、上記線分選択手段によって上記各候補群から選択された線分により、多角形を形成する多角形形成手段と、を備えることを特徴としている。
本発明に係る画像処理方法は画像を処理するための画像処理方法であって、入力画像から抽出する多角形の辺の数を特定する辺数特定ステップと、上記多角形を構成しうるように入力画像から抽出された線分を、当該多角形をなす各辺の候補群に分類する線分分類ステップと、上記線分分類ステップにより分類された上記各候補群について、ユーザによる入力を受け付け可能な入力装置が受け付けた入力に応じて、ユーザが所望とする線分を選択する線分選択ステップと、上記線分選択ステップによって上記各候補群から選択された線分により、多角形を形成する多角形形成ステップと、を備えることを特徴としている。
上記構成によると、線分分類手段は、辺数特定手段により特定された数の辺を持つ多角形を構成しうるように入力画像から抽出された線分を、上記多角形の各辺の候補群に分類し、線分選択手段は、入力装置が受け付けた入力に応じて、ユーザが所望する線分を上記候補群から選択する。そして多角形形成手段が、各候補群から選択された線分から多角形を形成する。また、上記画像処理方法の各ステップにおいては、上記画像処理装置の各手段と同一の処理が実現されている。
上記のようにユーザは、入力装置を介して、各候補群について線分を1本ずつ選択すればよい。すなわち、入力画像から抽出された線分は多角形の辺の各候補群に分類されているので、ユーザは、所望とする多角形の各辺を指定する時に、該各辺の候補群以外は無視して選択を行うことが可能となる。
よって、煩雑な操作を行うことなく、少ない回数の簡単な操作で、所望の多角形を構成する辺を選択し、多角形の指定を行うことができる。
また、上記入力装置は2次元方向の入力が可能であると同時に上記多角形の辺と同数の入力方向を有し、上記入力方向のそれぞれと、上記多角形の各辺の候補群の位置関係とが一対一の関係で対応しており、上記線分選択手段は、上記入力装置が受け付けた入力方向に対応する候補群内で線分の選択を行うことが好ましい。
上記構成によれば、入力装置の各入力方向が、多角形をなす各辺の候補群の位置関係と一対一で対応付けられている。そして、線分選択手段は、上記入力装置が受け付けた入力方向に対応する候補群の選択を行う。
よってユーザは、上記入力装置の各入力方向を入力するだけで、各候補群から所望とする線分の選択を行うことができ、さらに、選択を行いたい線分が属する候補群の存在する方向に入力を行えば、該候補群内で線分の選択を行うことができる。よって、感覚的な操作で所望の多角形を構成する辺を指定することが可能となる。
また、上記線分選択手段は、現在選択されている線分が当該線分の属する候補群の端に存在する場合、上記入力装置がユーザの入力を受け付けると、当該候補群の他方の端に存在する線分を選択することが好ましい。
上記構成によれば、現在選択されている線分が当該線分の属する候補群の端に存在する場合、入力装置がユーザの入力を受け付けると、線分選択手段は、当該候補群の他方の端に存在する線分を選択する。
よって、ユーザは、一度選択した線分を、該線分の属する候補群に対応する方向への入力を繰り返すことによって再び選択することが可能となる。
また、上記入力装置は、2次元方向に上記多角形の辺と同数の入力方向を有する方向入力手段と、選択される線分を指示するための線分指示手段とを有し、上記方向入力手段の上記入力方向のそれぞれは、上記多角形の各辺の候補群の位置関係と一対一の関係で対応しており、上記線分選択手段は、上記方向入力手段が受け付けた入力方向に対応する候補群内で、上記線分指示手段により指示された線分を選択することが好ましい。
上記構成によれば、方向入力手段が受け付けた入力方向に対応する候補群内で、線分指示手段によって選択する線分の指示を行うことが出来る。すなわち、候補群の選択と、当該選択された候補群内での線分の指示とが、それぞれ独立した操作によって行われる。
よって、方向入力手段および線分指示手段はそれぞれ1つずつの役割のみを担っているため、1つの手段に対して複数の動作が割り当てられる構成に比べて、ユーザの操作に対してユーザの意図しない動作が発生し難くなり、またそのため、ユーザは快適に操作を行うことが可能となる。
また、上記線分選択手段は、各辺の候補群がいずれの入力方向に対応しているかをユーザに提示することが好ましい。
上記構成によれば、線分選択手段は、入力装置の各入力方向が各辺の候補群のいずれに対応しているかをユーザに提示する。
よって、上記提示に従うことで、ユーザは選択を行いたい辺候補群に対してどの方向に入力すればいいかを間違えることなく、スムーズに線分の選択を行うことが出来る。
また、前記入力装置がタッチパネルであり、タッチパネル上に、該候補群に対応しユーザが入力可能なキーを表示するための、キー表示処理手段を備えることが好ましい。
上記構成によると、前記入力装置がタッチパネルであり、キー表示処理手段がタッチパネル上に、該候補群に対応するキーを表示する。
よって、ユーザは、画面上の選択を行いたい候補群の近傍に表示されるキーに直接ふれることで、所望の候補群の選択を行うことができ、感覚的な操作で所望の線分を選択することができる。
また、上記多角形形成手段は、上記各候補群において選択された全ての線分を延長または短縮したものを各辺とする多角形を形成することが好ましい。
また、上記線分選択手段は、上記入力画像から抽出された線分のうち、選択している線分と、選択していない線分とを、互いに異なる種類の線としてユーザに提示することが好ましい。
上記構成によれば、線分選択手段は、選択している線分と、選択していない線分とを互いに異なる種類の線としてユーザに提示する。
よって、ユーザは、どの線分が現在選択されているかを簡単に確認することが可能となる。また、現在選択されている線分から形成される多角形の位置および形状をある程度予想し、所望の多角形を選択できているか否かを確認することが可能になる。
本発明にかかる画像処理プログラムは、上記画像処理方法をコンピュータに実行させることを特徴としている。
本発明に係る記録媒体は、上記画像処理方法をコンピュータに実行させるための画像処理プログラムを記録したことを特徴としている。
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記画像処理装置をコンピュータにて実現させる画像処理装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の技術的範囲に含まれる。
本発明に係る画像処理装置は、以上のように、ユーザは多角形を構成しうる各辺の候補群に分類された画像内の複数の線分から、ユーザが望む目的の辺を、多角形を構成しうる各辺に対応付けられた入力装置で選択する構成である。
それゆえ、ユーザは、煩雑な操作を行うことなく、少ない回数の簡単な操作で、所望の多角形を構成する辺を選択し、多角形の指定を行うことができる。
(第1の実施形態)
以下、この発明の第1の実施形態について図1〜19を参照して説明する。以下の説明では同一の部分には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
以下、この発明の第1の実施形態について図1〜19を参照して説明する。以下の説明では同一の部分には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
本実施の形態に係る画像処理装置における処理は、コンピュータまたは情報端末、デジタルカメラに搭載されるCPU(Central Processing Unit)上で実行されるソフトウェアによって実現される。なお、情報端末やデジタルカメラなどにおいては、画像処理や制御を行うCPU上で実行されるソフトウェアにより実現されてもよいし、専用のハードウェアとして実現されてもよい。
(装置の構成)
図2(a)は本実施形態に係る情報処理端末1の概観を示す斜視図であり、図2(b)は情報処理端末1の背面の概観を示す斜視図である。図1は、画像処理装置101の構成を示すブロック図である。まず、図1および2を参照して情報処理端末1の構成を説明する。
図2(a)は本実施形態に係る情報処理端末1の概観を示す斜視図であり、図2(b)は情報処理端末1の背面の概観を示す斜視図である。図1は、画像処理装置101の構成を示すブロック図である。まず、図1および2を参照して情報処理端末1の構成を説明する。
図2(a)に示すように、情報処理端末1は、平板上の筐体である情報処理端末本体11からなり、情報処理端末本体11の正面には情報を表示するためのLCD(Liquid Crystal Display)またはOEL(Organic Electro−Luminescence)などからなる表示装置102が配置され、情報処理端末本体11の下面には、表示されたメニュー項目等を選択するための上下左右を指示可能なカーソルキー(方向入力手段)1041および確定ボタン1042が配置されている。
カーソルキー1041は、表示装置102上に表示されたメニュー項目等を移動するものであり、デジタル画像内の矩形抽出の際に後述する候補線分を選択する際にも利用される。ここでは、カーソルキー1041は上方向キー、下方向キー、左方向キーおよび右方向キーの4つのキーから成っている。確定ボタン1042は、各種動作モードのメニュー項目が表示されている状態では、選択/実行キーとして機能し、デジタル画像内の矩形抽出の際に多角形の確定ボタンとしても利用される。
そして、図2(b)に示すように、情報処理端末本体11の背面上部には、撮像装置103が設置されている。撮像装置103として、CCD、CMOS等が用いられる。
また、図1に示すように、情報処理端末1は、該情報処理端末自体を集中的に制御するためのCPUにより実現される、画像を処理するための画像処理装置101と、情報を表示するためのLCDまたはOELなどからなる表示装置102と、上記カーソルキー1041および確定ボタン1042により構成される入力装置104と、ROM(Read Only Memory)またはRAM(Random Access Memory)を含んで構成されるメモリ105と、固定ディスク106と、FD(Flexible Disk)1071が着脱自在に装着されて、装着されたFD1071にアクセスするFD駆動装置107と、光ディスク1081が着脱自在に装着されて、装着された光ディスク1081にアクセスする光ディスク駆動装置108と、通信I/F109とを含む。上述より、上記画像処理装置101は、上記入力装置104(カーソルキー1041および確定ボタン1042)と接続される、画像を処理するための画像処理装置であるといえる。
画像処理装置101は、辺数特定部(辺数特定手段)1011、線分抽出部(線分抽出手段)1012、線分分類部(線分分類手段)1013、線分選択部(線分選択手段)1014および多角形形成部(多角形形成手段)1015を備えている。
辺数特定部1011は、上記撮像装置103が撮像した画像である入力画像から抽出する多角形の辺の数を特定し、特定した辺数を線分抽出部1012に送信する。
線分抽出部1012は、上記入力画像から、上記多角形を構成しうるような線分を抽出し、抽出された線分を含む画像データを線分選択部1014に送信する。
線分分類部1013は、線分抽出部1012によって、上記多角形を構成しうるように上記入力画像から抽出された線分を、当該多角形をなす各辺の候補群に分類し、当該分類された線分を含む画像データを線分選択部1014に送信する。
線分選択部1014は、上記線分分類部1013により分類された上記各候補群について、上記入力装置104が受け付けた入力に応じて、ユーザが所望とする線分を選択し、多角形形成部1015に送信する。また、線分選択部1014は、キー表示処理部1016(キー表示処理手段)を備えるが、当該キー表示処理部1016が行う処理については実施形態2において説明する。
多角形形成部1015は、上記線分選択部1014によって上記各候補群から選択された線分により、多角形を形成する。なお、上述した各部の処理の詳細については後述する。
光ディスク1081は、光学ドライブ装置を使い、光(半導体レーザ)の反射により情報を読み書きする記録媒体であり、例えば、CD−ROM(Compact Disc Read Only Memory)、DVD−ROM(Digital Versatile Disc)、BD(Blu−Ray Disc)等がある。
通信I/F109は通信路110と該情報処理端末1とを通信可能に接続する機能を有する。通信路110にはインターネットを含む各種ネットワークを適用できる。
図1に示す情報処理端末1に搭載されるソフトウェアはFD1071、光ディスク1081などの記録媒体に格納されて流通し、情報処理端末1の所定記録エリアに、CPUによりFD駆動装置107または光ディスク駆動装置108を介して読み込まれて実行される。また通信I/F109および通信路110を通してソフトウェアを読み込んでもよい。
図1および図2における情報処理端末1が備えるハードウェア自体は一般的なものである。そして、本発明の最も本質的な部分はCPUにおいて実行されるソフトウェア(プログラムやデータ)である。
(処理手順について)
図3は、画像処理装置101で実行される、プログラムの制御手順を示すフローチャートである。図3を参照して、画像処理装置101で実行されるプログラムについて説明する。本実施の形態に係る情報処理端末1においてCPUにより読み出されて実行されるプログラムは、以下のような制御手順を有する。
図3は、画像処理装置101で実行される、プログラムの制御手順を示すフローチャートである。図3を参照して、画像処理装置101で実行されるプログラムについて説明する。本実施の形態に係る情報処理端末1においてCPUにより読み出されて実行されるプログラムは、以下のような制御手順を有する。
まず、CPUは、ステップ(以下、ステップをSと略す)100において、デジタル画像の取得を行う。図4は、当該デジタル画像の一例を示した図である。このとき、線分抽出部1012は、撮像装置103が撮像したデジタル画像(入力画像)の取得を行い、当該入力画像を線分抽出部1012に送信する。
S101において、辺数特定部1011は、本発明において最終的に決定する多角形を構成する辺の数(以下、辺数と称する)を予め特定し、特定した辺数を線分抽出部1012に送信する。なお、当該処理の詳細については後述する。本実施の形態では、辺数を4と特定する。
S102において、線分抽出部1012は、撮像装置103から受信した上記入力画像のエッジ候補から、辺数特定部1011から受信した上記辺数の多角形を構成しうるような線分群の抽出を行う。図5は、線分抽出部における処理の実行によって抽出される線分の一例を示す図である。当該図5において太線となっている線分が、当該線分抽出部1012による処理により抽出された線分である。なお、当該処理の詳細については後述する。
そして、線分抽出部1012は、抽出された線分を含む画像データを線分分類部1013に送信する。
図7は、線分分類部1013における処理の説明図である。S103において、線分分類部1013は、線分抽出部1012から受信した上記抽出された線分を含む画像データをもとに、辺数特定部1011が特定した辺数に応じて、図7に示すように、線分抽出部1012により抽出された線分L1〜L15を、矩形を構成しうる上辺L1〜L4、左辺L5、6、下辺L7〜L11および右辺L12〜L15の4つの候補群に分類する。なお、当該処理の詳細については後述する。
そして、線分分類部1013は、上記分類された線分を含む画像データを生成し、当該画像データを線分選択部1014に送信する。
S104において、線分選択部1014はユーザのカーソルキー1041による入力に応じて、S103で分類した辺候補の選択を行う。
ここで、図15(a)〜(e)は辺候補の選択処理において、カーソルキーの下方向キーを押した際に、辺候補BL5〜BL1が順次選択される様子を示した図である。
具体的には、線分選択部1014は、上記カーソルキー1041が受け付けた入力に応じて、線分分類部1013から受信した画像データに含まれる分類された線分を各候補群から一本ずつ選択する。なお、当該処理のさらなる詳細については後述する。
S105において、線分選択部1014は、確定ボタン1042の操作を受け付けることで、その時点において選択されている線分および選択されていない線分を含む画像データを多角形形成部1015に送信する。そして、多角形形成部1015は、上記線分選択部1014から受信した画像データにおいて、選択されている辺から多角形を確定する。以上により、ユーザが所望とする多角形を指定する処理は完了する。以下に、上記各ステップにおける処理の詳細を述べる。
(入力画像取得処理)
入力画像の取得を行うS100の説明を行う。入力画像は、撮像装置103によって撮影し、メモリ105に格納される。あるいは、FD1071、光ディスク1081等の記録媒体をFD駆動装置107または光ディスク駆動装置108を介して読み込まれたデジタル画像や、通信I/F109および通信路110を通して読み込まれたデジタル画像であってもよい。デジタル画像の形式には、ビットマップ、JPEG(Joint Photographic Experts Groups)等の画像形式であるが、前述の形式に限定しない。
入力画像の取得を行うS100の説明を行う。入力画像は、撮像装置103によって撮影し、メモリ105に格納される。あるいは、FD1071、光ディスク1081等の記録媒体をFD駆動装置107または光ディスク駆動装置108を介して読み込まれたデジタル画像や、通信I/F109および通信路110を通して読み込まれたデジタル画像であってもよい。デジタル画像の形式には、ビットマップ、JPEG(Joint Photographic Experts Groups)等の画像形式であるが、前述の形式に限定しない。
(辺数特定処理)
辺数の特定を行うS101の説明を行う。S101においては、辺数特定部1011が、本発明において最終的に決定する多角形を構成する辺の数を予め特定する。特定方法としては、本発明を適用するアプリケーションにおいて、予め辺の数が決められている場合は、メモリ105内部に予め辺の固定数を格納しておく。
辺数の特定を行うS101の説明を行う。S101においては、辺数特定部1011が、本発明において最終的に決定する多角形を構成する辺の数を予め特定する。特定方法としては、本発明を適用するアプリケーションにおいて、予め辺の数が決められている場合は、メモリ105内部に予め辺の固定数を格納しておく。
また、辺数特定部1011は、S100において取得された入力画像の形状から自動的に辺数を判断し、形成する多角形の辺数の候補を、入力装置104を介して、ユーザに提示して選択させることもできる。当該辺数判断の方法の詳細については、後述する(線分分類処理)の項にて説明する。
ユーザによる選択方法としては、キーボードによる数値の入力、リストボックスによる選択等を用いるが、前述の方法に限定しない。本実施の形態では、矩形を抽出することを目的とし、辺の数は4とする。
(線分抽出処理)
線分の抽出を行うS102の説明を行う。まず、S100において取得された入力画像に対して、グレースケール処理を施した後、入力画像のエッジ検出を行う。エッジ検出方法としては、画像全体にSobelフィルタ、Laplacianフィルタ、Cannyフィルタ等、既存技術を用いるが、前述の方法に限定しない。
線分の抽出を行うS102の説明を行う。まず、S100において取得された入力画像に対して、グレースケール処理を施した後、入力画像のエッジ検出を行う。エッジ検出方法としては、画像全体にSobelフィルタ、Laplacianフィルタ、Cannyフィルタ等、既存技術を用いるが、前述の方法に限定しない。
次に、エッジ検出フィルタをかけた後の画像に対して、線分の検出を行う。線分検出方法としては、ハフ変換、標準的ハフ変換等、既存技術を用いて、変換後に得られたスコアの高いものを線分とするが、前述の方法に限定しない。
画像サイズが大きくなった場合、これらの処理に負荷がかかる可能性があるため、グレースケール処理を施す前に、画像の縮小処理を行ってもよい。この場合の縮小処理には、ニアレストネイバー法、バイリニア法、バイキュービック法等、既存技術を用いるが、前述の方法に限定しない。
(線分分類処理)
図6は、線分分類部1013における処理の手順を示すフローチャートである。上記抽出された線分を辺候補群に分類するS103について、図6および図7を参照しつつ説明する。
図6は、線分分類部1013における処理の手順を示すフローチャートである。上記抽出された線分を辺候補群に分類するS103について、図6および図7を参照しつつ説明する。
まず、S200において、線分分類部1013は全辺候補の端点の座標を平均した位置CPの取得を行う。具体的には、図7に示す、S102において抽出された線分である辺L1〜L15の、各辺の端点の座標を平均した値を示す位置をCPとする。
次に、S201において、線分分類部1013はCPを原点とした各辺候補の法線ベクトルの取得を行う。この場合の法線ベクトルとは、具体的には、CPから各辺に対して垂線を引いた際の直線である。
S202において、CPを通る水平線分と各法線ベクトルとのなす角度の算出を行う。なす角度は0°≦θ<360°とする。図7の例では、L1に対してθ1、L2に対してθ2、・・・、L15に対してθ15が算出される。なお、上記線分のうち互いに平行となっている線分の各法線ベクトルは、上記CPを通る水平線分と同じ角度を成す。
S203において、各角度を最終的に抽出する辺の数に応じてクラスタリング処理による分類を行う。本実施形態においては、図7のように、θ1〜θ15を角度に対して4つのグループに分けることになる。この場合、θ1〜θ4、θ5とθ6、θ7〜θ11およびθ12〜θ15が近い角度を示すことによって、それぞれ同じグループとなることがわかる。クラスタリング処理の方法としては、階層的クラスタリング、非階層的クラスタリングがあり、非階層的クラスタリングの例としては、k−means法、ISODATA等があるが、前述の方法に限定しない。
なお、辺数が4以外の場合は、上記クラスタリング処理による分類を行う際のグループ数を当該辺数と同数にすればよいので、上記線分分類処理は、他の辺数にも容易に適用可能である。
また、上述の(辺数特定処理)の項にて、形成する多角形の辺数をユーザに提示するために、入力画像の形状から自動的に辺数判断を行う処理を、以上の説明と同様の処理によって行うことが出来る。
すなわち、S202における処理と同様に、CPを通る水平線分と各法線ベクトルとのなす角度の算出を行う。そして、算出した角度に対して、適当と考えられる分類数を、
・BealeのF値
・Pseudo T2 Test
・Cubic Clustering Criterion(CCC)統計量
などの指標を用いて算出する(http://ua.t.u-tokyo.ac.jp/okabelab/asami/clustering.pdf.P28参照のこと)。このようにして算出された分類数を辺数とすることで、辺数判断の自動化が可能となる。なお、指標は上記のものに限定しない。
・BealeのF値
・Pseudo T2 Test
・Cubic Clustering Criterion(CCC)統計量
などの指標を用いて算出する(http://ua.t.u-tokyo.ac.jp/okabelab/asami/clustering.pdf.P28参照のこと)。このようにして算出された分類数を辺数とすることで、辺数判断の自動化が可能となる。なお、指標は上記のものに限定しない。
また、図8は、線分分類部1013における処理の他の例を示す説明図である。上述した線分分類方法とは別の処理を、図8を参照しつつ説明する。当該線分分類処理においては、図8に示すように、辺の数を4と設定するために画像の対角線によって上部A1、下部A2、左部A3および右部A4の四分割した場合に、各々の辺候補がどの領域に含まれるかによって、分類を行う。
辺候補が2つの領域にまたがって存在する場合、領域により多く含まれる方に分類する。図8に記載されている辺候補TL4を例にとると、辺候補TL4は、上部A1、左部A3および右部A4の領域にまたがって存在している。しかし、辺候補TL4のうち上部A1の領域に存在する部分の割合が最も大きいため、辺候補TL4は上部A1に分類される。
これを踏まえると、S102で抽出された辺候補は、上部A1に対してTL1〜TL4、下部A2に対してBL1〜BL5、左部A3に対してLL1〜LL2、右部A4に対してRL1〜RL4に分類される。ただし、この分類方法は、既存技術を用いており、前述の方法に限定しない。例えば、線分分類部1013は、上述の複数の領域にまたがった辺候補の分類において、辺候補の全長のうち所定の閾値を超える割合が存在する領域に、当該辺候補を分類してもよい。図8を例に取ると、辺候補TL4は上部A1、左部A3および右部A4にまたがって存在するが、当該辺候補TL4の全長のうち上部A1が占める割合が、例えば60パーセント以上であれば辺候補TL4を上部A1に分類する。
(線分選択処理)
図9は、カーソルキー1041の上下左右の方向キーと、分類された各辺の候補群の対応を表す図である。図10は、カーソルキー1041と辺候補の対応をユーザに提示する様子を示す図である。図11は、つまみ1044を有するスティック状の操作装置を示す図である。図12(a)は、つまみ1044の回転方向が4分割されたスティック状の操作装置を示す図であり、図12(b)は、つまみ1044の回転方向が3分割されたスティック状の操作装置を示す図である。図14は、辺候補から矩形を構成する方法を示す図である。図13は入力装置104としてタッチパネルを採用した場合におけるインタフェース図である。辺候補の切替えを行うS104において線分選択部1014が行う処理の流れを、図9〜15を参照しつつ説明する。
図9は、カーソルキー1041の上下左右の方向キーと、分類された各辺の候補群の対応を表す図である。図10は、カーソルキー1041と辺候補の対応をユーザに提示する様子を示す図である。図11は、つまみ1044を有するスティック状の操作装置を示す図である。図12(a)は、つまみ1044の回転方向が4分割されたスティック状の操作装置を示す図であり、図12(b)は、つまみ1044の回転方向が3分割されたスティック状の操作装置を示す図である。図14は、辺候補から矩形を構成する方法を示す図である。図13は入力装置104としてタッチパネルを採用した場合におけるインタフェース図である。辺候補の切替えを行うS104において線分選択部1014が行う処理の流れを、図9〜15を参照しつつ説明する。
線分選択部1014が辺候補の切替えを行う際のユーザインタフェースとして、カーソルキー1041を用いる。ここでは、カーソルキー1041は上方向キー、下方向キー、左方向キーおよび右方向キーの4つのキーから成っており、図9に示すようにそれぞれのキーがS103で分類した各候補群と対応付けられる。
具体的には、上方向キーが、辺候補群TL1〜TL4の切替え操作に割り当てられ、下方向キーが、辺候補群BL1〜BL5の切替え操作に割り当てられ、左方向キーが、辺候補群LL1およびLL2の切替え操作に割り当てられ、右方向キーが辺候補群RL1〜RL4の切替え操作に割り当てられる。切替え操作は、方向キーを押すと、画像の最も内側に存在する辺候補から、画像の最も外側に存在する辺候補に向かって、辺候補の切替えが行われる。上方向キーを押して辺候補群TL1〜TL4の切替えを行う例を示すと、辺候補の切替えの初期位置がTL3であった場合、上方向キーを押す度に、TL3→TL2→TL1と、外側に向かって切替わる。最も外側の辺候補に切替わった時点で上方向キーを押すと、TL1→TL4と、最も内側の辺候補に切替わる。下方向キー、左方向キー、右方向キーに対しても、上方向キーと同様の切替え操作となり、右方向キーを押して辺候補RL1〜RL4の切替えを行う場合、辺候補の初期位置がRL3であった場合、右方向キーを押すと、RL3→RL2→RL1→RL4→RL3となる。
また、図10に示すように、ユーザが辺候補とボタンとの割り当て関係がわかるように、画面内に描かれている辺候補付近に、割り当てられたカーソルキーの画像201(a)〜(d)を提示してもよい。換言すれば、線分選択部は、各辺の候補群がいずれの入力方向に対応しているかをユーザに提示してもよい。カーソルキーの位置は、例えば、各辺候補の中心位置に表示する等が挙げられる。
また、当該辺方向の切替え方向はこの方向に限られるものではなく、画像の最も外側に存在する辺候補から、画像の最も内側に存在する辺候補に向かって、辺候補の切替えが行われてもよい。その場合は、最も内側の辺候補、例えばTL4に切替わった時点で上方向キーを押すと、TL4→TL1と、最も外側の辺候補に切替わる。換言すれば、現在選択されている線分が当該線分の属する候補群の端に存在する場合、上記入力装置がユーザの入力を受け付けると、当該候補群の他方の端に存在する線分を選択する。
また、入力装置104の変更例として、図11に示すスティック状の操作装置を使用することも考えられる。当該操作装置は、つまみ1044(入力装置)を倒すことで方向を入力でき、2次元方向における、360度の方向を認識することができる。これを、図12(a)に示すように、矢印で囲まれた範囲につまみ1044を倒した際に、同じ方向として認識するように設定した場合、方向を四分割することで、上下左右の四方向入力装置にもなり、また、図12(b)に示すように、方向を三分割することで、三方向入力装置にもなる。これによって、線分候補から、矩形以外の多角形を構成する場合に、入力装置の物理的な形状の変更を行うことなく、辺候補と入力装置の対応付けが可能となる。換言すれば、上記スティック状の操作装置は、2次元方向の入力が可能であると同時に上記多角形の辺と同数の入力方向を有する。そして、上記入力方向のそれぞれと、上記多角形の各辺の候補群の位置関係とが一対一の関係で対応しており、上記線分選択部1014は、上記入力装置が受け付けた入力方向に対応する候補群の選択を行う。
入力装置104のさらに別の変更例として、図13に示すようなタッチパネル1043を入力装置104として用いてもよい。タッチパネル1043の詳細は後述する第2の実施形態にて説明するが、線分選択部1014に備えられるキー表示処理部1016(キー表示処理手段)によって画面下方に表示されるカーソルキー画像aおよびボタン画像bは、それぞれカーソルキー1041および確定ボタン1042と同様の機能を持つ。すなわち、線分選択部1014は、当該カーソルキー画像aおよびボタン画像bが受け付けた入力方向に対応する辺の候補群の選択を行う。よって、タッチパネル上に表示されたカーソルキー画像aおよびボタン画像bにふれることで、上述のような線分の選択を行うことが可能である。
次に、辺候補の切替えを行った際に構成される矩形に関する説明を、図14を用いて行う。図14の例では、S104における操作によって、上部A1に対して辺候補TL1、下部A2に対して辺候補BL5、左部A3に対して辺候補LL1、右部A4に対して辺候補RL1が選択されている。この場合、辺候補BL5の長さが短いため、四本の辺候補によって矩形を構成することができない。したがって、それぞれの辺候補を延長し、他の辺候補と交わる四点からなる矩形とすることで、前記問題を解決する。
また、ユーザに対しては、図14の右部に示すように、選択した辺候補によって構成される矩形を実線で、それ以外の線分を点線で表示することで、選択した辺候補によってどのような矩形が構成されるかが、直感的にわかるようになっている。ただし、この表示方法に限定せず、選択した辺候補によって構成される矩形を赤の実線、それ以外の線分を黒の実線にすることや、選択した辺候補によって構成される矩形を太線、それ以外の線分を細線にする等、ユーザが、選択した辺候補によって構成される矩形と、それ以外の線分の区別が行えればよい。換言すれば、線分選択部1014は、上記入力画像から抽出された線分のうち、選択している線分と選択していない線分とを、色または線種が互いに異なる線としてユーザに提示してもよい。
これらを踏まえて、S104における操作のうち、カーソルキー1041の下方向キーを押したときの、選択した辺候補によって構成される矩形の変化を図15に示す。図15において、選択されている辺候補は実線で、それ以外は破線で示されている。ここで、図15(a)は、BL5を選択しているときに構成される矩形を図示し、同様に、図15(b)〜(e)は、それぞれBL4、BL3、BL2およびBL1を選択しているときに構成される矩形を図示する。辺候補の初期値は、例として、上部A1に対して辺候補TL1、下部A2に対して辺候補BL5、左部A3に対して辺候補LL1、右部A4に対して辺候補RL1とする。そして、下方向キーを押す度に、図15(a)→(b)→(c)→(d)→(e)→(a)・・・の順番で矩形が順次変化する。
また、上述した線分選択方法とは別の、下記の方法をとることも考えられる。
図16は、線分選択部1014における処理の他の例におけるカーソルキー1041、確定ボタン1042、内側指示ボタン1045および外側指示ボタン1046を示す図である。
当該線分選択処理において、入力装置104は、内側指示ボタン(入力装置、線分指示手段)1045および外側指示ボタン(入力装置、線分指示手段)1046をさらに備えてもよい。前記内側指示ボタン1045は、辺候補を外側から内側へと順次指示可能なボタンであり、前記外側指示ボタン1046は、辺候補を内側から外側へと順次指示可能なボタンである。
図17は、線分選択部1014における処理の他の例の手順を示すフローチャートである。当該処理の流れを図17を参照しつつ説明する。
まず、S300において、線分選択部1014は、ユーザによるカーソルキー1041への入力に応じて候補群の選択を行う。図18(a)〜(c)は、カーソルキー1041、内側指示ボタン1045および外側指示ボタン1046を用いて辺候補群TL1〜TL4を選択する様子を示す図である。図18(a)に示すように、カーソルキー1041の上方向キーを押すことにより、当該カーソルキー1041の上方向キーに対応付けられた辺候補群TL1〜TL4が選択される。ここで、選択されている辺候補群TL1〜TL4は、図18(a)において太線で描かれている。他の方向キーを押した際には、その方向キーに対応付けられた辺候補群が選択される。
次に、S301において、線分選択部1014は、S300にて選択された辺候補群からの辺候補の選択を行う。具体的には、内側指示ボタン1045を押すと、図18(b)のように、図18(a)で指示されている辺候補より一つ内側の辺候補を指示する。このとき、指示される辺候補は、TL1→TL2となり、その後内側指示ボタン1045を押す度に、TL3→TL4→TL1の順番で辺候補が指示されていく。また、外側指示ボタン1046を押すと、図18(c)のように、図18(a)で指示されている辺候補より一つ外側の辺候補を指示する。このとき、辺候補が指示される順番は、TL1→TL4→TL3→TL2→TL1となる。このように、S301とS302とを繰り返すことによって、全辺の候補を指示する。
そして、S303において、確定ボタン1042による辺候補の確定を行う。具体的には、確定ボタン1042を押すことによって、S301およびS302で選択した辺候補の確定を行う。
内側指示ボタン1045および外側指示ボタン1046は特定のボタンに限られるものではなく、他のボタンを代用して用いることも可能である。また、内側指示ボタン1045および外側指示ボタン1046はタッチパネルによって実施することも可能である。
また、入力装置104は、クリアボタン1047をさらに備えてもよい。当該クリアボタン1047を押すことによって、直前の操作を取り消すことが可能である。
図19は、カーソルキー1041、確定ボタン1042およびクリアボタン1047を示す図である。
クリアボタン1047は特定のボタンに限られるものではなく、他のボタンを代用して用いることも可能である。また、前記クリアボタン1047はタッチパネルによって実施することも可能である。
(多角形確定処理)
次に多角形の確定を行うS105の説明を行う。S103において選択した辺候補によって構成される多角形を、確定ボタン1042を押すことで確定させる。確定とは、すなわち、多角形形成部1015が、上記各候補群において選択された全ての線分を延長または短縮したものを各辺とする多角形を形成することである。
次に多角形の確定を行うS105の説明を行う。S103において選択した辺候補によって構成される多角形を、確定ボタン1042を押すことで確定させる。確定とは、すなわち、多角形形成部1015が、上記各候補群において選択された全ての線分を延長または短縮したものを各辺とする多角形を形成することである。
(本実施形態の利点)
最後に、上述した一連の処理によって得られる本実施形態の利点について説明する。上記辺候補の選択処理において、上部A1に対する候補数が4、下部A2に対する候補数が5、左部A3に対する候補が2、右部A4に対する候補が4であるため、矩形候補数は、
4×5×2×4=160
通り存在することになる。しかし、上記選択処理においては、各辺候補をそれぞれ独立したキーを押すことで選択するため、選択回数は最多でも、
4+5+2+4=15
回で済むこととなる。
最後に、上述した一連の処理によって得られる本実施形態の利点について説明する。上記辺候補の選択処理において、上部A1に対する候補数が4、下部A2に対する候補数が5、左部A3に対する候補が2、右部A4に対する候補が4であるため、矩形候補数は、
4×5×2×4=160
通り存在することになる。しかし、上記選択処理においては、各辺候補をそれぞれ独立したキーを押すことで選択するため、選択回数は最多でも、
4+5+2+4=15
回で済むこととなる。
確定した多角形によって、様々な処理が可能となる。例えば、入力画像が、斜め方向から撮影した名刺や、ホワイトボード、看板等の矩形領域を含む場合、その矩形領域を囲むように多角形を確定させ、その多角形を用いて透視変換処理を行い、多角形内の画像の補正を行うことができる。特に、名刺の場合、画像が補正されることによって、名刺内の文字列を様々な角度から撮影してもOCR(Optical Character Reader)で読み取ることが容易となり、情報処理端末1を名刺リーダとして用いることが可能となる。
以上のように、本発明によれば、ユーザは多角形を構成しうる各辺の候補群に分類された画像内の複数の線分から、ユーザが望む目的の辺を、多角形を構成しうる各辺に対応付けられた入力装置で選択することによって、少ない回数で直感的に選択し、多角形を指定することが可能になる。
(第2の実施形態)
以下、この発明の第2の実施の形態について図面を参照して説明する。以下の説明では同一の部分には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
以下、この発明の第2の実施の形態について図面を参照して説明する。以下の説明では同一の部分には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
本実施の形態に係る画像処理装置における処理は、コンピュータまたは情報端末、デジタルカメラに搭載されるCPU上で実行されるソフトウェアによって実現される。なお、情報端末やデジタルカメラなどにおいては、画像処理や制御を行うCPU上で実行されるソフトウェアにより実現されてもよいし、専用のハードウェアとして実現されてもよい。
(装置の構成)
図20(a)は本発明の第2の実施形態に係る情報処理端末2の概観を示す斜視図であり、図20(b)は本発明の第2の実施形態に係る情報処理端末2の背面の概観を示す斜視図である。
図20(a)は本発明の第2の実施形態に係る情報処理端末2の概観を示す斜視図であり、図20(b)は本発明の第2の実施形態に係る情報処理端末2の背面の概観を示す斜視図である。
情報処理端末2は、平板上の筐体である情報処理端末本体12からなり、情報処理端末本体12の正面には情報を表示するためのLCDまたはOELなどからなる表示装置102とタッチパネル1043(入力手段)が配置されている。タッチパネルとしては、抵抗膜方式、静電容量方式、光センサ方式等、既存技術を用いるが、前述の方法に限定しない。
また、情報処理端末本体12の背面上部には、撮像装置103が設置されている。撮像装置21として、CCD、CMOS等が用いられる。
本発明の実施の形態に係る情報処理端末の構成を示すブロック図については、第1の実施形態と同一で、図1のように構成されるため説明を省略する。
(処理手順について)
本実施の形態に係る画像処理装置101で実行されるプログラムについて説明する。なお、本実施の形態において、S101のステップにおける処理は第1の実施の形態と同一であるため、ここでは説明を省略する。
本実施の形態に係る画像処理装置101で実行されるプログラムについて説明する。なお、本実施の形態において、S101のステップにおける処理は第1の実施の形態と同一であるため、ここでは説明を省略する。
まず、S102において実施形態1と同様に辺数の特定を行う。本実施形態では、辺数を3と設定する。
次に、辺候補の分類を行うS103の説明を行う。
図21は線分分類部1013における処理の、辺数が3である場合の処理の概要を示す説明図である。当該図21において、L11〜L19は線分抽出部1012により入力画像中から抽出された線分である。L11〜L13、L14〜L16、L17〜L19はそれぞれ並行となっており、図6に示すS202において、実施形態1におけるS202における説明と同様に、L11〜L13に対してθ11〜θ13、L14〜L16に対してθ14〜θ16、L17〜L19に対してθ17〜θ19が算出される。これら線分群に対して、S203において辺数3としてクラスタリング処理による分類を行った場合、θ11〜θ13、θ14〜θ16、θ17〜θ19がそれぞれ同じ角度を示すことによって、それぞれ同じグループとなり、L11〜L19は3つの辺候補群に分類される。
ここで、図22は本実施形態に係る辺候補の切替えを行う際のインタフェース図である。図22を参照しながら、辺候補の切替えを行うS104の説明を行う。辺候補の切替えを行うユーザインタフェースとして、タッチパネル1043を用いる。ここで、タッチパネル1043は表示装置102上にあるため、表示装置102の座標系と、タッチパネル1043の座標系が等しい、あるいは、ほぼ等しいため、ユーザは画面上の表示物に対して直感的に操作を行えるものとなっているとする。
本実施形態において、線分選択部1014は、タッチパネル上に、該候補群に対応しユーザが入力可能なキーを表示するための、図1に示すようなキー表示処理部1016(キー表示処理手段)を備える。表示装置102の画面上部には、S100で取得したデジタル画像と、S102およびS103で抽出、分類された辺候補が表示されており、画面下部には、キー表示処理部1016が、上方向キー、左下方向キーおよび右下方向キーの三つの方向キーから成るカーソルキー画像cを表示する。そして、タッチパネル1043によって、それぞれの方向キーを操作することができ、それぞれの方向キーがS103で分類した領域と対応付けられる。ただし、デジタル画像とカーソルキー画像cの位置関係や形状は、これに限定されることはない。
切替え操作は、方向キーを押すと、画像の最も内側に存在する辺候補から、画像の最も外側に存在する辺候補に向かって、辺候補の切替えが行われる。また、ユーザが辺候補とボタンとの割り当て関係がわかるように、画面内に描かれている辺候補付近に割り当てられたカーソルキーの画像を提示する。カーソルキーの位置は、例えば、各辺候補の中心位置に表示する等が挙げられる。
次に辺候補の確定を行うS105の説明を行う。S104において選択した辺候補によって構成される三角形の情報を、画面上に描かれたボタン画像bを押すことで確定させる。
この辺候補の切替え方法により、上部B1に対する候補数が3、左下部B2に対する候補数が3、右下部B3に対する候補が3であるため、矩形候補数は、
3×3×3=27
通り存在することになるが、選択回数は、
3+3+3=9
回で済むこととなる。
3×3×3=27
通り存在することになるが、選択回数は、
3+3+3=9
回で済むこととなる。
以上のように、本発明によれば、ユーザは多角形を構成しうる各辺の候補群に分類された画像内の複数の線分から、ユーザが望む目的の辺を、多角形を構成しうる各辺に対応付けられた入力装置で選択することによって、少ない回数で直感的に選択し、多角形を指定することが可能になる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
また、上述した情報処理端末1および2の各ブロック、特に画像処理装置101は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、情報処理端末1および2は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである情報処理端末1および2の制御プログラム(画像処理装置101)のプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記画像処理装置101に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、情報処理端末1および2を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR(high data rate)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
なお、本発明は、以下のようにも表現できる。
すなわち、本発明に係る画像処理装置は、画像内の複数の線分から多角形の構成に必要な辺を選択して多角形を構成する画像処理装置であって、前記複数の線分を多角形を構成しうる各辺の候補群に分類する線分分類手段と、前記候補群から入力装置によって前記各辺の候補群の線分から目的の辺を選択する辺選択手段と、前記選択された辺から多角形を形成する多角形形成手段を備えたことを特徴としている。また、上記辺選択手段は、入力装置は二次元の方向を入力することができ、前記入力装置が入力できる入力方向数が前記多角形を構成する辺の数に等しく、各入力方向と前記各辺の候補群の配置関係が一対一で対応付けられており、前記各入力方向の入力によって前記各辺の候補群から目的の辺を選択することが好ましい。また、上記辺選択手段は、前記各辺に対応付けられた前記入力方向を入力すると前記各辺の候補群内の線分が前記多角形の中心から外側に向かって選択し、選択されている前記線分が前記多角形の最も外側の場合に前記各辺に対応付けられた前記各入力方向を入力すると前記多角形の最も中心位置にある線分が選択することが好ましい。また、上記辺選択手段は、前記各入力方向と前記各辺の候補群の配置関係がユーザに提示されることことが好ましい。また、上記辺選択手段において前記入力装置はソフトウェアで構成されることが好ましい。また、上記辺選択手段において、前記入力装置がタッチパネルで構成されることが好ましい。また、上記多角形形成手段は、選択された各辺を延長して交わった交点から前記多角形が形成されることが好ましい。また、前記多角形形成手段は、形成された多角形を構成する各辺と前記各辺を除く線分を互いに異なる種類の線としてユーザに提示することが好ましい。本発明にかかる画像処理方法は、画像内の複数の線分から多角形の構成に必要な辺を選択して多角形を構成する画像処理方法であって、前記複数の線分を多角形を構成しうる各辺の候補群に分類する線分分類ステップと、前記候補群から入力装置によって前記各辺の候補群の線分から目的の辺を選択する辺選択ステップと、前記選択された辺から多角形を形成する多角形形成ステップを備えてもよい。
本発明は、入力画像の中から任意の多角形を簡単に指定可能な画像処理装置、特に、名刺や、看板等に描かれた文字の読み取りに利用することができる。そして、本発明に係る画像処理装置を、携帯電話、デジタルカメラ、PDA等の撮像装置が設けられた情報処理端末に実装することで、簡便に入力画像内の多角形(名刺等)を指定できる情報処理端末を提供できる。
101 画像処理装置
1011 辺数特定部(辺数特定手段)
1013 線分分類部(線分分類手段)
1014 線分選択部(線分選択手段)
1015 多角形形成部(多角形形成手段)
1016 キー表示処理部(キー表示処理手段)
104 入力装置
1041 カーソルキー(入力装置、方向入力手段)
1042 確定ボタン(入力装置)
1043 タッチパネル(入力装置)
1044 つまみ(入力装置)
1045 内側指示ボタン(入力装置、線分指示手段)
1046 外側指示ボタン(入力装置、線分指示手段)
1047 クリアボタン(入力装置)
a カーソルキー画像(入力装置)
b ボタン画像(入力装置)
c カーソルキー画像(入力装置)
1011 辺数特定部(辺数特定手段)
1013 線分分類部(線分分類手段)
1014 線分選択部(線分選択手段)
1015 多角形形成部(多角形形成手段)
1016 キー表示処理部(キー表示処理手段)
104 入力装置
1041 カーソルキー(入力装置、方向入力手段)
1042 確定ボタン(入力装置)
1043 タッチパネル(入力装置)
1044 つまみ(入力装置)
1045 内側指示ボタン(入力装置、線分指示手段)
1046 外側指示ボタン(入力装置、線分指示手段)
1047 クリアボタン(入力装置)
a カーソルキー画像(入力装置)
b ボタン画像(入力装置)
c カーソルキー画像(入力装置)
Claims (11)
- ユーザによる入力を受け付け可能な入力装置と接続される、画像を処理するための画像処理装置であって、
入力画像から抽出する多角形の辺の数を特定する辺数特定手段と、
上記多角形を構成しうるように入力画像から抽出された線分を、当該多角形をなす各辺の候補群に分類する線分分類手段と、
上記線分分類手段により分類された上記各候補群について、上記入力装置が受け付けた入力に応じて、ユーザが所望とする線分を選択する線分選択手段と、
上記線分選択手段によって上記各候補群から選択された線分により、多角形を形成する多角形形成手段と、を備えることを特徴とする画像処理装置。 - 上記入力装置は2次元方向の入力が可能であると同時に上記多角形の辺と同数の入力方向を有し、
上記入力方向のそれぞれと、上記多角形の各辺の候補群の位置関係とが一対一の関係で対応しており、
上記線分選択手段は、上記入力装置が受け付けた入力方向に対応する候補群内で線分の選択を行うことを特徴とする請求項1に記載の画像処理装置。 - 上記線分選択手段は、現在選択されている線分が当該線分の属する候補群の端に存在する場合、上記入力装置がユーザの入力を受け付けると、当該候補群の他方の端に存在する線分を選択することを特徴とする請求項2に記載の画像処理装置。
- 上記入力装置は、2次元方向に上記多角形の辺と同数の入力方向を有する方向入力手段と、選択される線分を指示するための線分指示手段とを有し、
上記方向入力手段の上記入力方向のそれぞれは、上記多角形の各辺の候補群の位置関係と一対一の関係で対応しており、
上記線分選択手段は、上記方向入力手段が受け付けた入力方向に対応する候補群内で、上記線分指示手段により指示された線分を選択することを特徴とする請求項1から3のいずれかに記載の画像処理装置。 - 上記線分選択手段は、各辺の候補群がいずれの入力方向に対応しているかをユーザに提示することを特徴とする請求項2から4のいずれかに記載の画像処理装置。
- 前記入力装置がタッチパネルであり、
タッチパネル上に、該候補群に対応しユーザが入力可能なキーを表示するための、キー表示処理手段を備えることを特徴とする請求項1から5のいずれかに記載の画像処理装置。 - 上記多角形形成手段は、上記各候補群において選択された全ての線分を延長または短縮したものを各辺とする多角形を形成することを特徴とする請求項1から6のいずれかに記載の画像処理装置。
- 上記線分選択手段は、上記入力画像から抽出された線分のうち、選択している線分と、選択していない線分とを、互いに異なる種類の線としてユーザに提示することを特徴とする請求項1から6のいずれかに記載の画像処理装置。
- 画像を処理するための画像処理方法であって、
入力画像から抽出する多角形の辺の数を特定する辺数特定ステップと、
上記多角形を構成しうるように入力画像から抽出された線分を、当該多角形をなす各辺の候補群に分類する線分分類ステップと、
上記線分分類ステップにより分類された上記各候補群について、ユーザによる入力を受け付け可能な入力装置が受け付けた入力に応じて、ユーザが所望とする線分を選択する線分選択ステップと、
上記線分選択ステップによって上記各候補群から選択された線分により、多角形を形成する多角形形成ステップと、を備えることを特徴とする画像処理方法。 - 請求項9に記載の画像処理方法をコンピュータに実行させるための画像処理プログラム。
- 請求項10に記載の画像処理方法をコンピュータに実行させるための画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009278821A JP2011123567A (ja) | 2009-12-08 | 2009-12-08 | 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009278821A JP2011123567A (ja) | 2009-12-08 | 2009-12-08 | 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011123567A true JP2011123567A (ja) | 2011-06-23 |
Family
ID=44287425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009278821A Pending JP2011123567A (ja) | 2009-12-08 | 2009-12-08 | 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011123567A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016139334A (ja) * | 2015-01-28 | 2016-08-04 | キヤノン株式会社 | 情報処理装置、情報処理方法、コンピュータプログラム |
JP2017028462A (ja) * | 2015-07-21 | 2017-02-02 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
-
2009
- 2009-12-08 JP JP2009278821A patent/JP2011123567A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016139334A (ja) * | 2015-01-28 | 2016-08-04 | キヤノン株式会社 | 情報処理装置、情報処理方法、コンピュータプログラム |
US10354162B2 (en) | 2015-01-28 | 2019-07-16 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
JP2017028462A (ja) * | 2015-07-21 | 2017-02-02 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11113523B2 (en) | Method for recognizing a specific object inside an image and electronic device thereof | |
KR102500060B1 (ko) | 전자 장치 및 이의 제어 방법 | |
CN110321047B (zh) | 一种显示控制方法及设备 | |
JP6314975B2 (ja) | 表示制御装置、表示制御方法および表示制御プログラム | |
AU2013263767B2 (en) | Apparatus and method of managing a plurality of objects displayed on touch screen | |
KR102042169B1 (ko) | 컨텐츠를 표시하는 사용자 단말 장치 및 그 방법 | |
EP3547218B1 (en) | File processing device and method, and graphical user interface | |
US20120032988A1 (en) | Display control apparatus that displays list of images onto display unit, display control method, and storage medium storing control program therefor | |
CN113805745B (zh) | 一种悬浮窗的控制方法及电子设备 | |
CN103729055A (zh) | 多显示设备、输入笔、多显示控制方法和多显示系统 | |
CN104508684A (zh) | 使用照片来设置操作系统颜色 | |
CN110221655A (zh) | 多显示设备和多显示方法 | |
KR102218041B1 (ko) | 이동 단말기 | |
CN113485604B (zh) | 交互终端、交互系统、交互方法及计算机可读存储介质 | |
US9946456B2 (en) | Mobile terminal and method of controlling the same | |
CN109710155A (zh) | 一种信息处理方法及终端设备 | |
KR102255087B1 (ko) | 객체를 디스플레이하는 전자 장치 및 방법 | |
JP5015097B2 (ja) | 画像処理装置、画像処理プログラム、コンピュータ読み取り可能な記録媒体、電子機器及び画像処理方法 | |
KR102303206B1 (ko) | 전자장치에서 이미지 내의 특정 객체를 인식하기 위한 방법 및 장치 | |
CN111597592B (zh) | 一种输入方法、输入装置及移动终端 | |
JP2011123567A (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 | |
JP2013214188A (ja) | 文字認識処理装置、文字認識処理方法、文字認識処理プログラム、および、コンピュータ読み取り可能な記録媒体 | |
KR102181131B1 (ko) | 이동 단말기 및 그 제어방법 | |
JP2012226439A (ja) | 情報処理装置及び表示装置 | |
CN109710201B (zh) | 显示系统、显示装置、终端装置及记录介质 |