JP2014186549A - Image processor, image processing program and image processing method - Google Patents
Image processor, image processing program and image processing method Download PDFInfo
- Publication number
- JP2014186549A JP2014186549A JP2013060992A JP2013060992A JP2014186549A JP 2014186549 A JP2014186549 A JP 2014186549A JP 2013060992 A JP2013060992 A JP 2013060992A JP 2013060992 A JP2013060992 A JP 2013060992A JP 2014186549 A JP2014186549 A JP 2014186549A
- Authority
- JP
- Japan
- Prior art keywords
- straight line
- image processing
- black pixel
- search window
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 12
- 239000000284 extract Substances 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims description 197
- 238000000034 method Methods 0.000 claims description 65
- 238000000605 extraction Methods 0.000 claims description 43
- 238000010586 diagram Methods 0.000 description 44
- 238000004891 communication Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000005484 gravity Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 1
- 229910052704 radon Inorganic materials 0.000 description 1
- SYUHGPGVQRZVTB-UHFFFAOYSA-N radon atom Chemical compound [Rn] SYUHGPGVQRZVTB-UHFFFAOYSA-N 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Abstract
Description
本発明は、画像処理装置等に関する。 The present invention relates to an image processing apparatus and the like.
テレビ番組のCM(Commercial Message)等で検索窓が表示される場合がある。例えば、ユーザは、検索窓に表示されたキーワードを覚えておき、PC(Personal Computer)等を利用して覚えておいたキーワードをWeb検索することで、CMの内容に関して更に多くの情報を得ることができる。 A search window may be displayed in a TV program CM (Commercial Message) or the like. For example, the user can acquire more information regarding the contents of the CM by remembering the keyword displayed in the search window and searching the keyword using a PC (Personal Computer) or the like. Can do.
また、近年では、静止画像から検索窓を検出し、検索窓内の文字列を認識する各種の技術がある。ここでは一例として、従来技術1および従来技術2について説明する。
In recent years, there are various techniques for detecting a search window from a still image and recognizing a character string in the search window. Here, as an example, the
従来技術1は、入力画像からエッジを抽出し、エッジの輪郭線により囲まれた矩形状の領域を抽出する。そして、従来技術1は、矩形状の領域内の画素値の分散値が閾値以下となる領域を、検索窓として判定し、検索窓の領域を2値化して文字認識を行う。
従来技術2は、エッジ画像に対してラドン変換を行うことで、色々な角度の線分を抽出し、線分の隣接関係を用いて閉領域を形成する線分集合を抽出する。そして、従来技術2は、閉領域を形成する線分集合を多角形に近似し、該多角形が所定の条件を満たす場合に、多角形に対応する領域を検索窓として判定する。例えば、従来技術2は、多角形を構成する辺のうち最長の2本を選択し、選択した線分が画像に対して平行であり、かつ多角形全体が横長領域の場合に、多角形に対応する領域を検索窓とする。 Prior art 2 extracts line segments of various angles by performing Radon transform on the edge image, and extracts a line segment set that forms a closed region using the adjacency relation of the line segments. Then, the related art 2 approximates the line segment set forming the closed region to a polygon, and determines the region corresponding to the polygon as a search window when the polygon satisfies a predetermined condition. For example, the conventional technique 2 selects the longest two of the sides constituting the polygon, the selected line segment is parallel to the image, and the entire polygon is a horizontally long region. Let the corresponding area be the search window.
しかしながら、上述した従来技術では、精度良く検索窓を検出することができないという問題がある。 However, the above-described conventional technique has a problem that the search window cannot be detected with high accuracy.
例えば、従来技術1,2では、強いエッジだけを抽出すると、エッジの輪郭線が途切れる場合があり、閉領域を抽出することができず、検索窓を抽出することができない。また、強いエッジだけでなく、弱いエッジを含めてエッジ抽出を行うと、検索窓に対応するエッジの他に、背景領域や検索窓内のキーワードからもエッジが抽出され、正しい検索窓を識別することができない。
For example, in the
一つの側面では、精度良く検索窓を検出することができる画像処理装置、画像処理プログラムおよび画像処理方法を提供することを目的とする。 An object of one aspect is to provide an image processing apparatus, an image processing program, and an image processing method that can detect a search window with high accuracy.
第1の案では、画像処理装置は、直線抽出部と判定部とを有する。直線抽出部は、画像からエッジを抽出したエッジ画像を基にして、水平方向の複数の直線を抽出する。判定部は、エッジ画像内のエッジを連結させた黒画素連結領域を抽出し、複数の直線の組みの間に所定の範囲内の黒画素連結領域を有する直線の組み合わせを判定する。 In the first plan, the image processing apparatus includes a straight line extraction unit and a determination unit. The straight line extraction unit extracts a plurality of horizontal lines based on an edge image obtained by extracting edges from the image. The determination unit extracts a black pixel connection region obtained by connecting edges in the edge image, and determines a combination of straight lines having a black pixel connection region within a predetermined range between a plurality of straight line combinations.
本発明の一実施態様によれば、画像処理装置によれば、精度良く検索窓を検出することができる。 According to the embodiment of the present invention, the image processing apparatus can detect the search window with high accuracy.
以下に、本願の開示する画像処理装置、画像処理プログラムおよび画像処理方法の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。 Embodiments of an image processing apparatus, an image processing program, and an image processing method disclosed in the present application will be described below in detail with reference to the drawings. Note that the present invention is not limited to the embodiments.
本実施例に係るTVの構成の一例について説明する。図1は、本実施例に係るTVの構成の一例を示す図である。図1に示すように、このTV50は、チューナー51、モニタ52、通信部53、リモコン受信部54、TV制御部55、画像処理装置100を有する。チューナー51、モニタ52、通信部53、リモコン受信部54、TV制御部55、画像処理装置100は、接続線60によって相互に電気的に接続される。TV50は、ネットワーク10を介して図示しない各種のサーバに接続される。その他の構成は、周知のTVと同様であるため、ここでは説明を省略する。
An example of the configuration of the TV according to the present embodiment will be described. FIG. 1 is a diagram illustrating an example of a configuration of a TV according to the present embodiment. As shown in FIG. 1, the
チューナー51は、アンテナ5を利用してテレビ放送を受信する装置である。チューナー51は、テレビ放送の情報を、TV制御部55に出力する。
The tuner 51 is a device that receives a television broadcast using the antenna 5. The tuner 51 outputs TV broadcast information to the
モニタ52は、TV制御部55から出力されるテレビ放送の情報を表示する表示装置である。また、モニタ52は、画像処理装置100から出力される情報を表示する。画像処理装置100から出力される情報には、テレビ番組のCM等で表示される検索窓のキーワードのWeb検索結果等が含まれる。
The monitor 52 is a display device that displays information on the television broadcast output from the
通信部53は、ネットワーク10を介して図示しない各種のサーバとデータ通信を実行する処理部である。後述する画像処理装置100は、通信部53を介して、外部のサーバ等とデータをやり取りする。通信部53は、例えば、NIC(Network Interface Card)等の通信装置に対応する。
The
リモコン受信部54は、利用者の操作するリモコン(リモートコントローラ)からの情報を受信する装置である。リモコン受信部54は、受信した情報を、TV制御部55に出力する。なお、リモコン受信部54は、検索窓に表示されたキーワードに関する検索要求を受け付けた場合には、検索要求を、画像処理装置100に出力する。
The remote
TV制御部55は、TV50全体を制御する装置である。例えば、TV制御部55は、チューナー51が受信する各テレビ番組の情報のうち、リモコンによって指定されたチャンネルの番組をモニタ52に出力して表示させる。また、TV制御部55は、モニタ52に表示させているテレビ番組の映像データを、画像処理装置100に出力する。
The
画像処理装置100は、テレビ番組で表示される検索窓を抽出する装置である。また、画像処理装置100は、検索窓に含まれるキーワードをWeb検索し、検索結果をモニタ52に表示させる。
The
図1に示した画像処理装置100の構成の一例について説明する。図2は、本実施例に係る画像処理装置の構成を示す図である。図2に示すように、この画像処理装置100は、インタフェース部110、記憶部120、制御部130を有する。
An example of the configuration of the
インタフェース部110は、例えば、TV制御部55との間でデータ通信を実行する処理部である。また、インタフェース部110は、通信部53を介して、ネットワーク10上のサーバとデータ通信を実行する。後述する制御部130は、インタフェース部110を介して、TV制御部55、サーバ等とデータをやり取りする。
The
記憶部120は、画像データ121、エッジ画像データ122、直線テーブル123、黒画素連結領域テーブル124、検索窓領域データ125を記憶する。記憶部120は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子などの記憶装置に対応する。
The
画像データ121は、テレビ番組の映像データから抽出された静止画像のデータである。図3は、画像データの一例を示す図である。
The
エッジ画像データ122は、画像データ121からエッジを抽出されることで生成される画像データである。図4は、エッジ画像データの一例を示す図である。なお、画像122bは、エッジ画像122の領域122aを拡大したものである。
The
直線テーブル123は、エッジ画像データ122から抽出される水平方向の直線の情報を保持するテーブルである。図5は、直線テーブルのデータ構造の一例を示す図である。図5に示すように、この直線テーブル123は、直線識別情報と、始点座標と、終点座標とを対応付ける。直線識別情報は、エッジ画像データ122から抽出される水平方向の直線を一意に識別する情報である。始点座標は、水平方向の直線の始点座標を示す。終点座標は、水平方向の直線の終点座標を示す。
The straight line table 123 is a table that holds horizontal straight line information extracted from the
黒画素連結領域テーブル124は、エッジ画像データのエッジを連結させた黒画素連結領域の情報を保持するテーブルである。例えば、黒画素連結領域は、矩形に近似される。図6は、黒画素連結領域テーブルのデータ構造の一例を示す図である。図6に示すように、この黒画素連結領域テーブル124は、黒画素識別情報と、左上矩形座標と、右下矩形座標とを対応付ける。黒画素識別情報は、黒画素連結領域を一意に識別する情報である。左上矩形座標は、黒画素連結領域の左上隅の座標を示す。右下矩形座標は、黒画素連結領域の右下隅の座標を示す。 The black pixel connection area table 124 is a table that holds information on black pixel connection areas in which edges of edge image data are connected. For example, the black pixel connection area is approximated to a rectangle. FIG. 6 is a diagram illustrating an example of the data structure of the black pixel connection area table. As shown in FIG. 6, this black pixel connection area table 124 associates black pixel identification information, upper left rectangular coordinates, and lower right rectangular coordinates. Black pixel identification information is information that uniquely identifies a black pixel connection region. The upper left rectangular coordinates indicate the coordinates of the upper left corner of the black pixel connection area. The lower right rectangular coordinates indicate the coordinates of the lower right corner of the black pixel connection area.
検索窓領域データ125は、後述する検索窓検出部133によって検出された画像データ121上の検索窓の領域を示す情報を含む。例えば、検索窓領域データ125は、画面データ121上の検索窓の座標に対応する。
The search
制御部130は、取得部131、変換部132、検索窓検出部133、文字認識処理部134、Web検索部135を有する。制御部130は、例えば、ASIC(Application Specific Integrated Circuit)や、FPGA(Field Programmable Gate Array)などの集積装置に対応する。また、制御部130は、例えば、CPUやMPU(Micro Processing Unit)等の電子回路に対応する。
The control unit 130 includes an
なお、制御部130は、リモコン受信部54から検索要求を取得したことを契機にして、処理を開始しても良い。
Note that the control unit 130 may start the process when the search request is acquired from the remote
取得部131は、TV制御部55から映像データを取得する処理部である。取得部131は、取得した映像データから、静止画像となる画像データを抽出し、抽出した画像データを記憶部120に記憶させる。
The
変換部132は、画像データ121からエッジを抽出することにより、エッジ画像データ122を生成する処理部である。例えば、変換部132は、画像データ121をグレースケール(Grayscale)画像データに変換する。そして、変換部132は、グレースケール画像データに対して、Canny Edge等のアルゴリズムを適用することで、エッジ画像データ122を生成する。
The
検索窓検出部133は、検索窓を検出する処理部である。検索窓検出部133は、直線抽出部133aと、黒画素連結領域抽出部133bと、判定部133cとを有する。
The search
直線抽出部133aは、エッジ画像データ122から水平方向の直線を抽出する処理部である。直線抽出部133aは、抽出した直線の情報を直線テーブル123に登録する。
The straight
直線抽出部133aの処理を具体的に説明する。直線抽出部133aは、エッジ画像データ122から小線分抽出した後に、各小線分を統合することで、水平方向の直線を得る。小線分を抽出する処理について説明する。
The process of the straight
図7は、直線抽出部の処理を説明するための図である。直線抽出部133aは、エッジ画像データ122に対して、32画素幅の短冊領域を設定する。直線抽出部133aは、各短冊領域のy座標毎に、黒画素の横投影ヒストグラムp(i)を作成する。iはy座標を示す。例えば、短冊領域のy座標(y1)について、黒画素の画素数が30画素の場合には、p(y1)の値は、30となる。
FIG. 7 is a diagram for explaining processing of the straight line extraction unit. The straight
直線抽出部133aは、下記の直線抽出条件1〜3の何れか一つの条件を満たす場合に、y座標iの短冊幅の小線分を抽出する。直線抽出条件1は、p(i)の値が30以上という条件である。直線抽出条件2は、p(i)の値と、p(i+1)の値とを加算した値が、30以上という条件である。直線抽出条件3は、p(i)の値と、p(i+1)の値と、p(i−1)の値とを加算した値が30以上という条件である。エッジの直線が水平方向から若干ずれた場合でも、係る直線を、直線抽出条件2,3によって救済することができる。
The straight
例えば、図7の短冊領域1aのあるy座標iについて、直線抽出条件1〜3の何れか一つの条件を満たす場合に、直線抽出部133aは、短冊領域1a内のy座標i上の直線1bを抽出する。直線抽出部133aは、他の短冊領域についても同様の処理を繰り返し実行することで、小線分を抽出する。
For example, for a certain y coordinate i in the
直線抽出部133aは、小線分を抽出した後に、各小線分を横方向に統合することで、水平方向の直線を得る。例えば、直線抽出部133aは、各小線分の始点座標および終点座標を比較し、横方向に連続する各小線分を統合する。図8は、直線抽出部が抽出した各直線の一例を示す図である。直線抽出部133aは、統合した各直線の情報を、直線テーブル123に登録する。
The straight
図2の説明に戻る。黒画素連結領域抽出部133bは、エッジ画像データ122に含まれる各エッジを連結することで黒画素連結領域を抽出する処理部である。例えば、黒画素連結領域抽出部133bは、エッジ画像データ122に対して、ラベリングを実行し、同じラベルの塊の外接矩形を求める。黒画素連結領域抽出部133bは、外接矩形で近似した黒画素連結領域の情報を、黒画素連結領域テーブル124に登録する。
Returning to the description of FIG. The black pixel connection
図9は、黒画素連結領域抽出部の処理を説明するための図である。図9に示すように、黒画素連結領域抽出部133bがラベリング処理を実行することで、複数の外接矩形が抽出される。
FIG. 9 is a diagram for explaining the processing of the black pixel connection region extraction unit. As shown in FIG. 9, the black pixel connection
判定部133cは、直線テーブル123および黒画素連結領域テーブル124を基にして、検索窓の領域を判定する処理部である。判定部133cは、判定した検索窓の領域の情報を、検索窓領域データ125に登録する。以下において、判定部133cの処理を具体的に説明する。判定部133cは、直線と黒画素連結領域とを対応付ける処理、直線のペアを判定する処理、検索窓を構成する直線のペアを判定する処理を実行する。また、判定部133は、候補領域を抽出する処理を実行する。
The
判定部133cが、直線と黒画素連結領域とを対応付ける処理について説明する。図10は、判定部の処理を説明するための図(1)である。まず、判定部133cは、直線との距離が同一となる黒画素連結領域の組みを判定し、それぞれを対応付ける。例えば、図10に示す例では、直線2aと、黒画素連結領域3a,3b,3c,3d,3e,3fとの距離がそれぞれ同一となる。このため、判定部133cは、直線2aと、黒画素連結領域3a〜3fを対応付ける。また、直線2aと、黒画素連結領域4a,4b,4c,4d,4eとの距離がそれぞれ同一となる。このため、判定部133cは、直線2aと、黒画素連結領域4a〜4fとを対応付ける。
A process in which the
判定部133cは、対応付けた直線の直線識別情報と、各黒画素連結領域の黒画素識別情報とを対応付けて、対応管理情報に登録する。図11は、判定部が生成する対応管理情報の一例を示す図である。
The
判定部133cが直線のペアを判定する処理について説明する。例えば、判定部133cは、直線テーブル123および黒画素連結領域テーブル124を基にして、各直線の長さの差が所定の閾値未満でy方向に重複し、且つ、各直線間に黒画素連結領域が存在する場合に、係る各直線をペアとする。判定部133cは、各直線のペアの情報をペア管理情報に登録する。ここでは図示を省略するが、ペア管理情報は、ペアとなる各直線の直線識別情報が対応付けられる情報である。
A process in which the
判定部133cが検索窓を構成する直線のペアを判定する処理について説明する。図12は、判定部の処理を説明するための図(2)である。判定部133cは、上記対応付けた直線のペアを選択し、選択した直線に対応付けられた黒画素連結領域が所定の条件を満たす場合に、選択した直線のペアを、検索窓を構成する直線のペアとして判定する。具体的に、式(1)に示す条件を満たす場合に、選択した直線のペアを、検索窓を構成する直線のペアとして判定する。式(1)の閾値は、利用者が適宜設定する値である。
A process in which the
直線ペアに対応付けられた黒画素連結領域のうち、直線ペアで共通する黒画素連結領域の数/直線ペアに対応付けられた黒画素連結領域の数(ただし、重複する黒画素連結領域は、1つとカウントする)>閾値・・・(1) Of the black pixel connection areas associated with the straight line pairs, the number of black pixel connection areas common to the straight line pairs / the number of black pixel connection areas associated with the straight line pairs (however, the overlapping black pixel connection areas are Count as 1)> Threshold ... (1)
式(1)の内容を、図12を用いて説明する。図12では、直線2aと直線2bとが直線ペアとなっている。直線2aには、黒画素連結領域4a,4b,4c,4d,4eが対応付けられている。直線2bには、黒画素連結領域4a,4b,4c,4e,4fが対応付けられている。また、直線ペアで共通する黒画素連結領域は、黒画素連結領域4a,4b,4c,4eとなる。このため、図12に示す例では、直線ペアに対応付けられた黒画素連結領域のうち、直線ペアで共通する黒画素連結領域の数は「4」となり、直線ペアに対応付けられた黒画素連結領域の数は「6」となる。すなわち、直線ペアに黒画素連結領域4f、4dが更に対応付けられる。
The contents of equation (1) will be described with reference to FIG. In FIG. 12, the
判定部が候補領域を抽出する処理について説明する。図13は、判定部の処理を説明するための図(3)である。図13に示す直線ペア2a,2bは、上記の処理により、検索窓を構成する直線のペアとして判定されたものとする。判定部133cは、直線ペア2a,2b内の領域にある黒画素連結領域4a〜4fを囲む領域3aを候補領域として抽出する。
A process in which the determination unit extracts candidate areas will be described. FIG. 13 is a diagram (3) for explaining the processing of the determination unit. It is assumed that the straight line pairs 2a and 2b shown in FIG. 13 are determined as straight line pairs constituting the search window by the above processing. The
図14は、判定部の処理を説明するための図(4)である。判定部133cは、抽出した2つの候補領域がほぼ同じy座標を持ち、隣接し、且つ、線分、黒画素連結領域のy方向位置がほぼ同じ場合に、2つの候補領域を統合する。例えば、図14に示す例では、2つの候補領域3a,3bの左上および右下のy座標の差が閾値未満であり、かつ、直線2aおよび直線2cのy座標の差が閾値未満であり、かつ、直線2bおよび直線2dのy座標の差が閾値未満とする。また、黒画素連結領域4a〜4fの重心のy方向位置と、黒画素連結領域4g〜4lの重心のy方向位置との差が閾値未満であるとする。この場合には、判定部133cは、候補領域3a,3bを統合して、候補領域3cを生成する。
FIG. 14 is a diagram (4) for explaining the processing of the determination unit. The
図15は、判定部の処理を説明するための図(5)である。ここでは、候補領域3d,3eを用いて説明する。判定部133cは、候補領域3dの左端から左方向に32画素の地点を開始点とし、右方向に縦方向の黒画素投影ヒストグラムでピーク点を検索し、ピーク点を候補領域の左端とする。また、候補領域3dの右端から右方向に32画素の地点を開始点とし、左方向に縦方向の黒画素投影ヒストグラムでピーク点を検索し、ピーク点を候補領域の右端とする。判定部133cが係る処理を実行することで、候補領域3dの領域は、候補領域3fとなる。判定部133cは、候補領域3eについても同様の処理を実行することで、候補領域3eの領域は、候補領域3gとなる。
FIG. 15 is a diagram (5) for explaining the processing of the determination unit. Here, a description will be given using the
図16は、判定部の処理を説明するための図(6)である。ここでは、候補領域3h,3iを用いて説明する。判定部133cは、候補領域の4辺の1画素内部の領域を走査して、白画素から黒画素あるいは黒画素から白画素に変化する回数を計数する。判定部133cは、変化する回数が閾値以上の場合には、対応する候補領域を削除する。例えば、候補領域3hについて、候補領域の4辺の1画素内部の領域を走査すると、変化する回数が閾値未満となる。このため、判定部133cは、候補領域3hを残す。これに対して、候補領域3iについて、候補領域の4辺の1画素内部の領域を走査すると、変化する回数が閾値以上となる。このため、判定部133cは、候補領域3iを削除する。
FIG. 16 is a diagram (6) for explaining the processing of the determination unit. Here, a description will be given using the
図17は、判定部の処理を説明するための図(7)である。判定部133cは、座標が類似する各候補領域を統合する。ここでは、候補領域3j,3kを用いて説明する。また、候補領域3jのx座標のうち、最小のx座標をxmin1とし、最大のx座標をxmax1とする。候補領域3jのy座標のうち、最小のy座標をymin1とし、最大のy座標をymax1とする。また、候補領域3kのx座標のうち、最小のx座標をxmin2とし、最大のx座標をxmax2とする。候補領域3jのy座標のうち、最小のy座標をymin2とし、最大のy座標をymax2とする。
FIG. 17 is a diagram (7) for explaining the processing of the determination unit. The
判定部133cは、式(2)に示す条件を満たす場合に、候補領域3j,3kを統合する。例えば、判定部133cは、候補領域3j,3kを統合することで、候補領域3lを生成する。
The
|xmin1−xmin2|+|xmax1−xmax2|+|ymin1−ymin2|+|ymax1−ymax2|<閾値・・・(2) | Xmin1-xmin2 | + | xmax1-xmax2 | + | ymin1-ymin2 | + | ymax1-ymax2 | <threshold value (2)
図18は、判定部の処理を説明するための図(8)である。判定部133cは、候補領域内で、左右端点から一定距離離れているところで、縦方向の黒画素投影ヒストグラムのピーク点が存在する場合には、候補領域を分割する。ここでは、候補領域3mを用いて説明する。例えば、候補領域3m内で、縦方向の黒画素投影ヒストグラムのピーク点6aが存在する場合には、判定部133cは、候補領域3mを、ピーク点6aの位置を基準として、候補領域3n,3oに分割する。
FIG. 18 is a diagram (8) for explaining the process of the determination unit. The
図19は、判定部の処理を説明するための図(9)である。判定部133cは、候補領域に含まれる黒画素連結領域に対して文字認識をそれぞれ実行する。判定部133cは、各文字認識結果の確信度の平均値が閾値未満の場合に、候補領域を削除する。ここでは、候補領域3p,3qを用いて説明する。なお、黒画素連結領域に対して文字認識を実行する技術や、確信度を算出する技術は、如何なる従来技術を利用しても良い。判定部133cは、例えば、候補領域3pに対して文字認識を実行し、各文字認識結果の確信度の平均値が、閾値以上の場合には、候補領域3pを残す。
FIG. 19 is a diagram (9) for explaining the processing of the determination unit. The
なお、判定部133cは、各文字認識結果の確信度の平均値が閾値以上の場合であっても、候補領域に特定の文字が含まれている場合には、候補領域を削除する。例えば、文字認識で認識された文字に「検」、「索」または「Q」の文字が含まれる場合に、候補領域を削除する。例えば、検索の意味を示す虫眼鏡マークに対する文字認識結果が「Q」となる場合がある。候補領域3qに対して文字認識を実行すると、「検」、「索」の文字が含まれるので、判定部133cは、候補領域3qを削除する。なお、判定部133cは、「検」、「索」または「Q」を含む候補領域の座標を記録しておく。
Note that the
図20は、判定部の処理を説明するための図(10)である。判定部133cは、上記処理によって、候補領域が複数存在する場合に、以下に説明する処理を実行しても良い。判定部133cは、「検」、「索」または「Q」の文字が含まれる領域が存在した場合には、係る領域の左右にある最も近い領域を検索窓として検出する。例えば、図10に示す例では、領域3rに、「検索」が含まれており、領域3rの左右に最も近い領域は候補領域3sとなる。このため、判定部133cは、候補領域3rを検索窓の領域として検出する。判定部133cは、検出した検索窓の情報を検索窓領域データ125に登録する。
FIG. 20 is a diagram (10) for explaining the processing of the determination unit. The
図2の説明に戻る。文字認識処理部134は、検索窓の領域に対して文字認識を実行し、文字認識結果となるキーワードをWeb検索部135に出力する処理部である。文字認識処理部134は、検索窓領域データに登録された検索窓の座標を基にして、エッジ画像データ上の検索窓の領域を特定し、特定した領域に対して文字認識を実行する。領域に対して文字認識を実行する処理は、如何なる従来技術を用いても良い。
Returning to the description of FIG. The character
Web検索部135は、文字認識処理部134から取得するキーワードに対してWeb検索を実行する処理部である。例えば、Web検索部135は、ネットワーク10に接続されたサーバにアクセスして、Web検索を実行する。Web検索部135は、検索結果を、モニタ52に表示する。
The
次に、本実施例に係る画像処理装置100の処理手順について説明する。図21は、本実施例に係る画像処理装置の処理手順を示すフローチャートである。例えば、図21に示す処理は、検索要求を受け付けたことを契機にして実行される。
Next, a processing procedure of the
図21に示すように、画像処理装置100は、映像データから1フレームの画像データを取得し(ステップS101)、検索窓領域検出処理を実行する(ステップS102)。
As shown in FIG. 21, the
画像処理装置100は、検索窓領域に対して文字認識処理を実行し(ステップS103)、Web検索を実行する(ステップS104)。そして、画像処理装置100は、検索結果を出力する(ステップS105)。
The
次に、図21に示した検索窓領域検出処理について説明する。図22は、本実施例に係る検索窓領域検出処理の処理手順を示すフローチャートである。図22に示すように、画像処理装置100は、画像データ121からエッジ画像データ122を生成する(ステップS110)。画像処理装置100は、黒画素連結領域を抽出する(ステップS111)。
Next, the search window area detection process shown in FIG. 21 will be described. FIG. 22 is a flowchart illustrating a processing procedure of search window area detection processing according to the present embodiment. As shown in FIG. 22, the
画像処理装置100は、エッジ画像データから水平方向の直線を抽出する(ステップS112)。画像処理装置100は、直線ペア抽出処理を実行する(ステップS113)。画像処理装置100は、直線ペアのうち、直線ペア間に黒画素が存在するペアのみを選択する(ステップS114)。画像処理装置100は、選択した直線ペアが1つであるか否かを判定する(ステップS115)。画像処理装置100は、選択した直線ペアが1つの場合には(ステップS115,Yes)、ステップS121に移行する。
The
一方、画像処理装置100は、選択した直線ペアが2つ以上の場合には(ステップS115,No)、ステップS116に移行する。画像処理装置100は、黒画素連結領域と直線ペアとの位置関係に基づいて、直線ペアを選択する処理を実行する(ステップS116)。画像処理装置100は、選択した直線ペアが1つであるか否かを判定する(ステップS117)。画像処理装置100は、選択した直線ペアが1つの場合には(ステップS117,Yes)、ステップS121に移行する。
On the other hand, if there are two or more selected straight line pairs (step S115, No), the
一方、画像処理装置100は、選択した直線ペアが2つ以上の場合には(ステップS117,No)、ステップS118に移行する。画像処理装置100は、直線ペア間の領域に対して文字認識を実行し、文字認識の確信度を基にして直線ペアを選択する処理を実行する(ステップS118)。画像処理装置100は、選択した直線ペアが1つであるか否かを判定する(ステップS119)。画像処理装置100は、選択した直線ペアが1つの場合には(ステップS119,Yes)、ステップS121に移行する。
On the other hand, when the number of selected straight line pairs is two or more (step S117, No), the
一方、画像処理装置100は、選択した直線ペアが2つ以上の場合には(ステップS119,No)、特定文字を基にして、直線ペアを選択する(ステップS120)。画像処理装置100は、直線ペアの領域座標を抽出する(ステップS121)。
On the other hand, when there are two or more selected straight line pairs (step S119, No), the
次に、図22のステップS113に示した直線ペア抽出処理について説明する。図23は、直線ペア抽出処理の処理手順を示すフローチャートである。図23に示すように、画像処理装置100は、iに1を設定する(ステップS130)。画像処理装置100は、iの値に1を加算した値をjに設定する(ステップS131)。
Next, the straight line pair extraction process shown in step S113 of FIG. 22 will be described. FIG. 23 is a flowchart illustrating a processing procedure of straight line pair extraction processing. As shown in FIG. 23, the
画像処理装置100は、i番目の直線と、j番目の直線とを選択する(ステップS132)。画像処理装置100は、i番目の直線とj番目の直線とがほぼ同じ長さで、y方向に重複するか否かを判定する(ステップS133)。画像処理装置100は、i番目の直線とj番目の直線とがほぼ同じ長さでない、または、y方向に重複しない場合には(ステップS133,No)、ステップS136に移行する。
The
一方、画像処理装置100は、i番目の直線とj番目の直線とがほぼ同じ長さで、y方向に重複する場合には(ステップS133,Yes)、ステップS134に移行する。画像処理装置100は、直線ペア間に黒画素が存在するか否かを判定する(ステップS134)。画像処理装置100は、直線ペア間に黒画素が存在しない場合には(ステップS134,No)、ステップS136に移行する。
On the other hand, when the i-th straight line and the j-th straight line have substantially the same length and overlap in the y direction (step S133, Yes), the
一方、画像処理装置100は、直線ペア間に黒画素が存在する場合には(ステップS134,Yes)、直線ペアを記録する(ステップS135)。
On the other hand, if there is a black pixel between the straight line pair (step S134, Yes), the
画像処理装置100は、jの値が「N−1」の値未満であるか否かを判定する(ステップS136)。Nは、直線の総数である。画像処理装置100は、jの値が「N−1」の値未満である場合には(ステップS136,Yes)、jの値に1を加算した値を、jに設定し(ステップS137)、ステップS132に移行する。
The
一方、画像処理装置100は、jの値が「N−1」の値未満でない場合には(ステップS136,No)、iの値が「N−1」の値未満であるか否かを判定する(ステップS138)。画像処理装置100は、iの値が「N−1」の値未満である場合には(ステップS138,Yes)、iの値に1を加算した値を、iに設定し(ステップS139)、ステップS131に移行する。
On the other hand, when the value of j is not less than the value of “N−1” (step S136, No), the
一方、画像処理装置100は、iの値が「N−1」の値未満でない場合には(ステップS138,No)、直線ペア抽出処理を終了する。
On the other hand, when the value of i is not less than the value of “N−1” (No in step S138), the
次に、図22のステップS116に示した黒画素連結領域と直線ペアとの位置関係に基づいて直線ペアを選択する処理について説明する。図24は、黒画素連結領域と直線ペアとの位置関係に基づいて直線ペアを選択する処理手順を示すフローチャートである。 Next, the process of selecting a straight line pair based on the positional relationship between the black pixel connection region and the straight line pair shown in step S116 of FIG. 22 will be described. FIG. 24 is a flowchart illustrating a processing procedure for selecting a straight line pair based on the positional relationship between the black pixel connection region and the straight line pair.
図24に示すように、画像処理装置100は、iに1を設定する(ステップS150)。画像処理装置100は、iの値に1を加算した値をjに設定する(ステップS151)。画像処理装置100は、i番目の直線と、j番目の直線とを選択する(ステップS152)。
As shown in FIG. 24, the
画像処理装置100は、i番目の直線とj番目の直線との間の距離が一定の矩形を選択する(ステップS153)。画像処理装置100は、式(1)の条件を満たすか否かを判定する(ステップS154)。式(1)の条件を満たさない場合には(ステップS155,No)、ステップS157に移行する。
The
一方、画像処理装置100は、式(1)の条件を満たす場合には(ステップS155,Yes)、条件を満たす直線ペアを記録する(ステップS156)。画像処理装置100は、jの値が「N−1」の値未満であるか否かを判定する(ステップS157)。Nは、直線の総数である。画像処理装置100は、jの値が「N−1」の値未満である場合には(ステップS157,Yes)、jの値に1を加算した値を、jに設定し(ステップS158)、ステップS152に移行する。
On the other hand, when the condition of the expression (1) is satisfied (step S155, Yes), the
一方、画像処理装置100は、jの値が「N−1」の値未満でない場合には(ステップS157,No)、ステップS159に移行する。画像処理装置100は、iの値が「N−1」の値未満であるか否かを判定する(ステップS159)。画像処理装置100は、iの値が「N−1」の値未満である場合には(ステップS159,Yes)、iの値に1を加算した値を、iに設定し(ステップS160)、ステップS151に移行する。
On the other hand, when the value of j is not less than the value of “N−1” (No at Step S157), the
一方、画像処理装置100は、iの値が「N−1」の値未満でない場合には(ステップS159,No)、黒画素連結領域と直線ペアとの位置関係に基づいて直線ペアを選択する処理を終了する。
On the other hand, when the value of i is not less than “N−1” (No in step S159), the
次に、図22のステップS118に示した直線ペア間の領域に対して文字認識を実行し、文字認識の確信度を基にして直線ペアを選択する処理について説明する。図25は、直線ペア間の領域に対して文字認識を実行し、文字認識の確信度を基にして直線ペアを選択する処理手順を示すフローチャートである。 Next, a process of performing character recognition on the area between straight line pairs shown in step S118 of FIG. 22 and selecting straight line pairs based on the certainty of character recognition will be described. FIG. 25 is a flowchart showing a processing procedure for executing character recognition on an area between straight line pairs and selecting a straight line pair based on the certainty of character recognition.
図25に示すように、画像処理装置100は、iに1を設定する(ステップS180)。画像処理装置100は、i番目の直線ペアの内側に対して文字認識を実行し、各文字の確信度の平均値を算出する(ステップS181)。
As shown in FIG. 25, the
画像処理装置100は、認識結果の文字がノイズ文字でなく、かつ、平均値が閾値以上か否かを判定する(ステップS182)。画像処理装置100は、認識結果の文字がノイズ文字である場合、または、平均値が閾値未満の場合には(ステップS182,No)、ステップS184に移行する。
The
一方、画像処理装置100は、認識結果の文字がノイズ文字でなく、かつ、平均値が閾値以上の場合には(ステップS182,Yes)、i番目の直線ペアを記録する(ステップS183)。画像処理装置100は、iの値が「N−1」の値未満であるか否かを判定する(ステップS184)。画像処理装置100は、iの値が「N−1」の値未満の場合には(ステップS184,Yes)、iの値に1を加算した値を、iに設定し(ステップS185)、ステップS181に移行する。
On the other hand, if the recognition result character is not a noise character and the average value is equal to or greater than the threshold (Yes in step S182), the
一方、画像処理装置100は、iの値が「N−1」の値未満でない場合には(ステップS184,No)、処理を終了する。
On the other hand, when the value of i is not less than the value of “N−1” (No in step S184), the
次に、図22のステップS120に示した特定文字を基にして直線ペアを選択する処理について説明する。図26は、特定文字を基にして直線ペアを選択する処理手順を示すフローチャートである。 Next, processing for selecting a straight line pair based on the specific character shown in step S120 of FIG. 22 will be described. FIG. 26 is a flowchart showing a processing procedure for selecting a straight line pair based on a specific character.
図26に示すように、画像処理装置100は、iに1を設定する(ステップS190)。画像処理装置100は、i番目の直線ペアの領域の上下端の延長線に囲まれる範囲で、画像端までの領域、かつ、i番目の直線ペア以外の領域を文字認識する(ステップS191)。画像処理装置100は、文字認識結果に「検索」等の特定文字が存在するか否かを判定する(ステップS192)。
As shown in FIG. 26, the
画像処理装置100は、文字認識結果に「検索」等の特定文字が存在しない場合には(ステップS192,No)、ステップS195に移行する。一方、画像処理装置100は、文字認識結果に「検索」等の特定文字が存在する場合には(ステップS192,Yes)、ステップS193に移行する。
If there is no specific character such as “search” in the character recognition result (step S192, No), the
画像処理装置100は、候補領域から「検索」等の特定文字までの距離が最も近いか否かを判定する(ステップS193)。画像処理装置100は、候補領域から「検索」等の特定文字までの距離が最も近くない場合には(ステップS193,No)、ステップS195に移行する。
The
画像処理装置100は、画像処理装置100は、候補領域から「検索」等の特定文字までの距離が最も近い場合には(ステップS193,Yes)、最も近い候補領域を記憶する(ステップS194)。
When the distance from the candidate area to a specific character such as “search” is the shortest (step S193, Yes), the
画像処理装置100は、iの値が「N−1」の値未満であるか否かを判定する(ステップS195)。画像処理装置100は、iの値が「N−1」の値未満である場合には(ステップS195,Yes)、iの値に1を加算した値を、iに設定し(ステップS196)、ステップS191に移行する。一方、画像処理装置100は、iの値が「N−1」の値未満でない場合には(ステップS195,No)、処理を終了する。
The
次に、本実施例に係る画像処理装置100の効果について説明する。画像処理装置100は、エッジ画像データ122を基にして、水平方向の複数の直線を抽出し、複数の直線の組の間に所定の範囲内の画素連結領域を有する直線の組み合わせを判定する。このように、画像処理装置100が判定した直線の組み合わせは、検索窓を構成する矩形の上側の直線と下側の直線であるといえ、精度良く検索窓を検出することができる。また、画像処理装置100は、水平方向以外の直線を抽出しないので、ノイズとなる直線を抽出することを防ぐことができると共に、処理負荷を軽減することもできる。
Next, effects of the
また、画像処理装置100は、直線毎に該直線との距離が同一の複数の黒画素連結領域を対応付け、直線毎に対応付けられた黒画素連結領域をそれぞれ比較し、比較した各黒画素連結領域の一部が一致する直線の組み合わせを判定する。このように、検索窓にはキーワードに相当する黒画素が存在するという特性をいかして、画像処理装置100が判定を行うことで、キーワードを含む検索窓を精度良く検出することができる。
In addition, the
また、画像処理装置100は、更に、直線の組みの間の領域を候補領域として文字認識を実行し、文字認識結果の確信度を基にして、候補領域が検索窓であるか否かを判定する。このため、複数の候補領域の中から、検索窓に相当する領域を精度よく抽出することができる。
Further, the
また、画像処理装置100は、候補領域に特定文字が含まれる場合に、該特定文字を含む候補領域に対して水平方向に存在する他の候補領域を選択し、選択した候補領域が検索窓であるか否かを判定する。通常、検索窓の横には「検索」などの特定文字が表示される場合がある。このため、該特定文字を含む候補領域に対して水平方向に存在する他の候補領域を選択することで、複数の候補領域の中から、検索窓に相当する領域を精度よく抽出することができる。
When the candidate area includes a specific character, the
また、画像処理装置100は、検索窓に含まれる文字に関連する情報を、ネットワーク上から検索し、検索結果を表示させるので、利用者が煩雑な操作を行わなくても、テレビ番組のCMで検索窓に表示されたキーワードに関する詳しい情報を利用者に通知することができる。
Further, the
ところで、上述した画像処理装置100の実施例は上記のものに限られない。このため、以下では、画像処理装置100のその他の実施例について説明する。画像処理装置100は、例えば、デジタルカメラが撮影した検索窓を含む画像データを取得し、取得した画像データから検索窓の領域を検出しても良い。係る画像データから検索窓を検出する処理は、上記の画像処理装置とほぼ同じであるが、線分と黒画素連結領域との対応付ける処理が一部異なるので、以下において説明する。
By the way, the embodiment of the
図27は、画像処理装置のその他の実施例を説明するための図である。画像処理装置100は、デジタルカメラが撮影したテレビ画像の画像データからエッジ画像を抽出し、横方向の直線を抽出する。例えば、画像処理装置100は、水平方向を基準として、直線の角度が所定の角度以内の直線を抽出する。これは、デジタルカメラで画像データを撮影した場合には、検索窓の水平方向の直線が斜めに写ってしまうことを考慮した処理である。図27に示す例では、画像処理装置100は、直線2cおよび2dを抽出する。また、画像処理装置100が、直線ペアを選択する場合には、各直線の長さの差が所定の閾値未満でy方向に重複し、且つ、各直線間に黒画素連結領域が存在する場合に、係る各直線をペアとする。
FIG. 27 is a diagram for explaining another embodiment of the image processing apparatus. The
画像処理装置100は、直線と黒画素連結領域とを対応付ける場合には、黒画素連結領域の矩形の隅と、直線との距離がそれぞれ同一となる黒画素連結領域を対応付ける。例えば、黒画素連結領域4h,4i,4j,4k,4mの左上隅と、直線2cとの距離は同一である。このため、直線2cと、黒画素連結領域4h,4i,4j,4k,4mとを対応付ける。また、黒画素連結領域4h,4i,4j,4l,4mの左下隅と、直線2dとの距離は同一である。このため、直線2dと、黒画素連結領域4h,4i,4j,4l,4mとを対応付ける。
When the straight line and the black pixel connection area are associated with each other, the
画像処理装置100は、直線2cと直線2dとの関係が、上記実施例で示した式(1)の条件を満たす場合に、直線2cと直線2dとの直線ペアを、検索窓の候補領域として判定する。その他の処理は、上記実施例と同様である。画像処理装置がこのような処理を実行することで、デジタルカメラで撮影した画像からでも検索窓を精度良く検出することができる。
When the relationship between the
また、上記実施例では、画像処理装置100が、TV50に内蔵されている場合について説明したが、これに限定されるものではない。例えば、ネットワーク10のサーバ装置内に、画像処理装置100と同様の機能を設けてもよい。例えば、TV制御部55は、検索要求を取得した場合に、映像データをサーバに送信し、サーバ装置は、上記画像処理装置100と同様の処理を実行して、検索窓を抽出し、検索窓のキーワードの検索結果を、TV制御部55に通知しても良い。TV制御部55は、通知された検索結果を、モニタ52に表示させる。また、例えばデジタルカメラ、スマートフォン、携帯電話等の携帯型カメラを備えた装置において、画像処理装置100と同様の機能を設けてもよい。この場合は、ハードウェア構成は、画像取得部、画像処理装置、通信部、モニタとなり、画像取得部で取得された画像が画像処理装置に入力され、画像処理装置で検索窓内のテキストを取得して、それを通信部へ送り、インターネット検索を行い、その結果を通信部で取得し、モニタに表示することになる。
In the above embodiment, the case where the
次に、上記の実施例に示した画像処理装置100と同様の機能を実現する画像処理プログラムを実行するコンピュータの一例を説明する。図28は、制御プログラムを実行するコンピュータの一例を示す図である。
Next, an example of a computer that executes an image processing program that realizes the same function as the
図28に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザからのデータの入力を受け付ける入力装置202と、ディスプレイ203を有する。また、コンピュータ200は、記憶媒体からプログラム等を読取る読み取り装置204と、ネットワークを介して他のコンピュータとの間でデータの授受を行うインタフェース装置205とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM206と、ハードディスク装置207を有する。そして、各装置201〜207は、バス208に接続される。
As illustrated in FIG. 28, the
ハードディスク装置207は、例えば、直線抽出プログラム207a、判定プログラム207bを有する。CPU201は、各プログラム207a,207bを読み出してRAM206に展開する。
The
直線抽出プログラム207aは、直線抽出プロセス206aとして機能する。判定プログラム207bは、判定プロセス206bとして機能する。
The straight
例えば、直線抽出プロセス206aは、直線抽出部133aに対応する。判定プロセス206bは、判定部133cに対応する。
For example, the
なお、各プログラム207a,207bについては、必ずしも最初からハードディスク装置207に記憶させておかなくてもよい。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200がこれらから各プログラム207a,207bを読み出して実行するようにしてもよい。
Note that the
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。 The following supplementary notes are further disclosed with respect to the embodiments including the above examples.
(付記1)画像からエッジを抽出したエッジ画像を基にして、水平方向の複数の直線を抽出する直線抽出部と、
前記エッジ画像内のエッジを連結させた黒画素連結領域を抽出し、前記複数の直線の組みの間に所定の範囲内の黒画素連結領域を有する直線の組み合わせを判定する判定部と
を有することを特徴とする画像処理装置。
(Appendix 1) A straight line extraction unit that extracts a plurality of horizontal straight lines based on an edge image obtained by extracting edges from an image;
A determination unit that extracts a black pixel connection region obtained by connecting edges in the edge image, and determines a combination of straight lines having a black pixel connection region within a predetermined range between the plurality of straight line combinations. An image processing apparatus.
(付記2)前記判定部は、直線毎に該直線との距離が同一の複数の黒画素連結領域を対応付け、直線毎に対応付けられた黒画素連結領域をそれぞれ比較し、比較した各黒画素連結領域の一部が一致する直線の組み合わせを判定することを特徴とする付記1に記載の画像処理装置。
(Additional remark 2) The said determination part matches the some black pixel connection area | region with the same distance with this straight line for every straight line, compares each black pixel connection area matched for every straight line, and compares each black The image processing apparatus according to
(付記3)前記判定部は、直線毎に該直線と黒画素連結領域の所定の隅との距離が同一となる複数の黒画素連結領域を対応付けることを特徴とする付記2に記載の画像処理装置。 (Additional remark 3) The said determination part matches the some black pixel connection area | region where the distance of this straight line and the predetermined | prescribed corner of a black pixel connection area | region becomes the same for every straight line, The image processing of Additional remark 2 characterized by the above-mentioned apparatus.
(付記4)前記判定部は、更に、直線の組みの間の領域を検索窓候補領域として文字認識を実行し、文字認識結果の確信度を基にして、前記検索窓候補領域が検索窓であるか否かを判定することを特徴とする付記1、2または3に記載の画像処理装置。
(Additional remark 4) The said determination part further performs character recognition by making the area | region between the group of straight lines into a search window candidate area | region, and based on the certainty of a character recognition result, the said search window candidate area | region is a search window. 4. The image processing apparatus according to
(付記5)前記判定部は、前記検索窓候補領域に特定文字が含まれる場合に、該特定文字を含む検索窓候補領域に対して水平方向に存在する他の検索窓候補領域を選択し、選択した検索窓候補領域が検索窓であるか否かを判定することを特徴とする付記4に記載の画像処理装置。 (Supplementary Note 5) When the search window candidate area includes a specific character, the determination unit selects another search window candidate area that exists in a horizontal direction with respect to the search window candidate area including the specific character, The image processing apparatus according to appendix 4, wherein it is determined whether or not the selected search window candidate area is a search window.
(付記6)前記判定部が判定した検索窓に含まれる文字に関連する情報を、ネットワーク上から検索する検索部を更に有することを特徴とする付記4または5に記載の画像処理装置。 (Supplementary note 6) The image processing apparatus according to supplementary note 4 or 5, further comprising a search unit that searches the network for information related to characters included in the search window determined by the determination unit.
(付記7)コンピュータに、
画像からエッジを抽出したエッジ画像を基にして、水平方向の複数の直線を抽出し、
前記エッジ画像内のエッジを連結させた黒画素連結領域を抽出し、前記複数の直線の組みの間に所定の範囲内の黒画素連結領域を有する直線の組み合わせを判定する
各処理を実行させることを特徴とする画像処理プログラム。
(Appendix 7)
Based on the edge image extracted from the image, to extract a plurality of horizontal straight lines,
Extracting a black pixel connection region obtained by connecting edges in the edge image, and executing each process for determining a combination of straight lines having a black pixel connection region within a predetermined range between the plurality of straight line combinations. An image processing program characterized by the above.
(付記8)前記判定する処理は、直線毎に該直線との距離が同一の複数の黒画素連結領域を対応付け、直線毎に対応付けられた黒画素連結領域をそれぞれ比較し、比較した各黒画素連結領域の一部が一致する直線の組み合わせを判定することを特徴とする付記7に記載の画像処理プログラム。 (Supplementary note 8) The determination process is performed by associating a plurality of black pixel connection regions having the same distance from the straight line for each straight line, comparing the black pixel connection regions associated with each straight line, and comparing The image processing program according to appendix 7, wherein a combination of straight lines in which a part of the black pixel connection region matches is determined.
(付記9)前記判定する処理は、直線毎に該直線と黒画素連結領域の所定の隅との距離が同一となる複数の黒画素連結領域を対応付けることを特徴とする付記7に記載の画像処理プログラム。 (Supplementary note 9) The image according to supplementary note 7, wherein the determining process associates, for each straight line, a plurality of black pixel connection regions having the same distance between the straight line and a predetermined corner of the black pixel connection region. Processing program.
(付記10)前記判定する処理は、更に、直線の組みの間の領域を検索窓候補領域として文字認識を実行し、文字認識結果の確信度を基にして、前記検索窓候補領域が検索窓であるか否かを判定することを特徴とする付記7、8または9に記載の画像処理プログラム。 (Additional remark 10) The said determination process further performs character recognition by making the area | region between the group of straight lines into a search window candidate area | region, and based on the certainty of a character recognition result, the said search window candidate area | region is a search window. 10. The image processing program according to appendix 7, 8 or 9, wherein it is determined whether or not.
(付記11)前記判定する処理は、前記検索窓候補領域に特定文字が含まれる場合に、該特定文字を含む検索窓候補領域に対して水平方向に存在する他の検索窓候補領域を選択し、選択した検索窓候補領域が検索窓であるか否かを判定することを特徴とする付記10に記載の画像処理プログラム。
(Supplementary Note 11) When the search window candidate area includes a specific character, the determination process selects another search window candidate area that exists in a horizontal direction with respect to the search window candidate area including the specific character. The image processing program according to
(付記12)判定した検索窓に含まれる文字に関連する情報を、ネットワーク上から検索する処理を更に実行させることを特徴とする付記10または11に記載の画像処理プログラム。
(Additional remark 12) The image processing program as described in
(付記13)コンピュータが実行する画像処理方法であって、
画像からエッジを抽出したエッジ画像を基にして、水平方向の複数の直線を抽出し、
前記エッジ画像内のエッジを連結させた黒画素連結領域を抽出し、前記複数の直線の組みの間に所定の範囲内の黒画素連結領域を有する直線の組み合わせを判定する
各処理を実行することを特徴とする画像処理方法。
(Supplementary note 13) An image processing method executed by a computer,
Based on the edge image extracted from the image, to extract a plurality of horizontal straight lines,
Extracting a black pixel connection region obtained by connecting edges in the edge image, and determining each combination of straight lines having a black pixel connection region within a predetermined range between the plurality of straight line combinations. An image processing method characterized by the above.
(付記14)前記判定する処理は、直線毎に該直線との距離が同一の複数の黒画素連結領域を対応付け、直線毎に対応付けられた黒画素連結領域をそれぞれ比較し、比較した各黒画素連結領域の一部が一致する直線の組み合わせを判定することを特徴とする付記13に記載の画像処理方法。 (Supplementary Note 14) The determination process is performed by associating a plurality of black pixel connection regions having the same distance from the straight line for each straight line, comparing the black pixel connection regions associated with each straight line, and comparing The image processing method according to appendix 13, wherein a combination of straight lines in which a part of the black pixel connection region matches is determined.
(付記15)前記判定する処理は、直線毎に該直線と黒画素連結領域の所定の隅との距離が同一となる複数の黒画素連結領域を対応付けることを特徴とする付記13に記載の画像処理方法。 (Supplementary note 15) The image according to supplementary note 13, wherein the determining process associates, for each straight line, a plurality of black pixel connection regions having the same distance between the straight line and a predetermined corner of the black pixel connection region. Processing method.
(付記16)前記判定する処理は、更に、直線の組みの間の領域を検索窓候補領域として文字認識を実行し、文字認識結果の確信度を基にして、前記検索窓候補領域が検索窓であるか否かを判定することを特徴とする付記13、14または15に記載の画像処理方法。 (Additional remark 16) The said determination process further performs character recognition by making the area | region between the group of straight lines into a search window candidate area | region, and based on the certainty of a character recognition result, the said search window candidate area | region is a search window. 16. The image processing method according to appendix 13, 14 or 15, wherein it is determined whether or not.
(付記17)前記判定する処理は、前記検索窓候補領域に特定文字が含まれる場合に、該特定文字を含む検索窓候補領域に対して水平方向に存在する他の検索窓候補領域を選択し、選択した検索窓候補領域が検索窓であるか否かを判定することを特徴とする付記16に記載の画像処理方法。 (Supplementary Note 17) When the search window candidate area includes a specific character, the determination process selects another search window candidate area that exists in the horizontal direction with respect to the search window candidate area including the specific character. The image processing method according to appendix 16, wherein it is determined whether or not the selected search window candidate area is a search window.
(付記18)判定した検索窓に含まれる文字に関連する情報を、ネットワーク上から検索する処理を更に実行することを特徴とする付記16または17に記載の画像処理方法。 (Supplementary note 18) The image processing method according to supplementary note 16 or 17, further comprising a process of searching the network for information related to the character included in the determined search window.
10 ネットワーク
50 TV
100 画像処理装置
10
100 Image processing apparatus
Claims (8)
前記エッジ画像内のエッジを連結させた黒画素連結領域を抽出し、前記複数の直線の組みの間に所定の範囲内の黒画素連結領域を有する直線の組み合わせを判定する判定部と
を有することを特徴とする画像処理装置。 A line extraction unit that extracts a plurality of horizontal lines based on an edge image obtained by extracting edges from the image;
A determination unit that extracts a black pixel connection region obtained by connecting edges in the edge image, and determines a combination of straight lines having a black pixel connection region within a predetermined range between the plurality of straight line combinations. An image processing apparatus.
画像からエッジを抽出したエッジ画像を基にして、水平方向の複数の直線を抽出し、
前記エッジ画像内のエッジを連結させた黒画素連結領域を抽出し、前記複数の直線の組みの間に所定の範囲内の黒画素連結領域を有する直線の組み合わせを判定する
各処理を実行させることを特徴とする画像処理プログラム。 On the computer,
Based on the edge image extracted from the image, to extract a plurality of horizontal straight lines,
Extracting a black pixel connection region obtained by connecting edges in the edge image, and executing each process for determining a combination of straight lines having a black pixel connection region within a predetermined range between the plurality of straight line combinations. An image processing program characterized by the above.
画像からエッジを抽出したエッジ画像を基にして、水平方向の複数の直線を抽出し、
前記エッジ画像内のエッジを連結させた黒画素連結領域を抽出し、前記複数の直線の組みの間に所定の範囲内の黒画素連結領域を有する直線の組み合わせを判定する
各処理を実行することを特徴とする画像処理方法。 An image processing method executed by a computer,
Based on the edge image extracted from the image, to extract a plurality of horizontal straight lines,
Extracting a black pixel connection region obtained by connecting edges in the edge image, and determining each combination of straight lines having a black pixel connection region within a predetermined range between the plurality of straight line combinations. An image processing method characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013060992A JP6155740B2 (en) | 2013-03-22 | 2013-03-22 | Image processing apparatus, image processing program, and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013060992A JP6155740B2 (en) | 2013-03-22 | 2013-03-22 | Image processing apparatus, image processing program, and image processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014186549A true JP2014186549A (en) | 2014-10-02 |
JP6155740B2 JP6155740B2 (en) | 2017-07-05 |
Family
ID=51834057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013060992A Active JP6155740B2 (en) | 2013-03-22 | 2013-03-22 | Image processing apparatus, image processing program, and image processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6155740B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03265999A (en) * | 1990-03-15 | 1991-11-27 | Sumitomo Electric Ind Ltd | Automatic car number reader |
JP2009044658A (en) * | 2007-08-10 | 2009-02-26 | Fujitsu Ltd | Keyword extraction method |
JP2009188886A (en) * | 2008-02-08 | 2009-08-20 | Omron Corp | Information processing apparatus and program for information processing apparatus |
JP2010152800A (en) * | 2008-12-26 | 2010-07-08 | Kddi Corp | Image processing apparatus, image processing method and program |
JP2012003480A (en) * | 2010-06-16 | 2012-01-05 | Nippon Hoso Kyokai <Nhk> | Telop character area detector and program |
JP2012160023A (en) * | 2011-01-31 | 2012-08-23 | Toshiba Corp | Character extracting device, display method, and character extracting method |
-
2013
- 2013-03-22 JP JP2013060992A patent/JP6155740B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03265999A (en) * | 1990-03-15 | 1991-11-27 | Sumitomo Electric Ind Ltd | Automatic car number reader |
JP2009044658A (en) * | 2007-08-10 | 2009-02-26 | Fujitsu Ltd | Keyword extraction method |
JP2009188886A (en) * | 2008-02-08 | 2009-08-20 | Omron Corp | Information processing apparatus and program for information processing apparatus |
JP2010152800A (en) * | 2008-12-26 | 2010-07-08 | Kddi Corp | Image processing apparatus, image processing method and program |
JP2012003480A (en) * | 2010-06-16 | 2012-01-05 | Nippon Hoso Kyokai <Nhk> | Telop character area detector and program |
JP2012160023A (en) * | 2011-01-31 | 2012-08-23 | Toshiba Corp | Character extracting device, display method, and character extracting method |
Non-Patent Citations (1)
Title |
---|
島田 隆寛 外3名: "ビジョン技術を利用した商業・マーケティング支援", 画像ラボ 第25巻 第3号, vol. 第25巻 第3号, JPN6016041471, 10 March 2014 (2014-03-10), JP, pages 65 - 68, ISSN: 0003553111 * |
Also Published As
Publication number | Publication date |
---|---|
JP6155740B2 (en) | 2017-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11295114B2 (en) | Creation of representative content based on facial analysis | |
US9098888B1 (en) | Collaborative text detection and recognition | |
WO2019041519A1 (en) | Target tracking device and method, and computer-readable storage medium | |
US10438086B2 (en) | Image information recognition processing method and device, and computer storage medium | |
KR101050866B1 (en) | Character recognition devices, character recognition programs, and character recognition methods | |
WO2019033574A1 (en) | Electronic device, dynamic video face recognition method and system, and storage medium | |
WO2018228118A1 (en) | Method and device for identifying similar pictures and storage medium | |
US9082000B2 (en) | Image processing device and image processing method | |
US10621730B2 (en) | Missing feet recovery of a human object from an image sequence based on ground plane detection | |
CN111666907B (en) | Method, device and server for identifying object information in video | |
EP2827284A1 (en) | Key word detection device, control method and control program for same, and display apparatus | |
WO2020078215A1 (en) | Video-based information acquisition method and device | |
CN110619656B (en) | Face detection tracking method and device based on binocular camera and electronic equipment | |
EP3910590A2 (en) | Method and apparatus of processing image, electronic device, and storage medium | |
JP6365024B2 (en) | Service providing apparatus, method, and program | |
CN111080665B (en) | Image frame recognition method, device, equipment and computer storage medium | |
WO2018184255A1 (en) | Image correction method and device | |
TW202042179A (en) | Method and computing device for adjusting region of interest | |
JP6155740B2 (en) | Image processing apparatus, image processing program, and image processing method | |
JP4550768B2 (en) | Image detection method and image detection apparatus | |
CN115457055A (en) | Illuminance meter value identification method, electronic device, and storage medium | |
WO2017128273A1 (en) | Error block determination | |
JP6244887B2 (en) | Information processing apparatus, image search method, and program | |
JP7452120B2 (en) | Image processing method, image processing program, and image processing device | |
WO2023123213A1 (en) | Hand pressing depth measurement method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6155740 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |