JP2005182402A - Field area detection method, system therefor and program - Google Patents

Field area detection method, system therefor and program Download PDF

Info

Publication number
JP2005182402A
JP2005182402A JP2003421303A JP2003421303A JP2005182402A JP 2005182402 A JP2005182402 A JP 2005182402A JP 2003421303 A JP2003421303 A JP 2003421303A JP 2003421303 A JP2003421303 A JP 2003421303A JP 2005182402 A JP2005182402 A JP 2005182402A
Authority
JP
Japan
Prior art keywords
field
image
projection
template
camera shooting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003421303A
Other languages
Japanese (ja)
Inventor
Yoshinori Haseyama
美紀 長谷山
Yuki Watanabe
友樹 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hokkaido University NUC
Original Assignee
Hokkaido University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hokkaido University NUC filed Critical Hokkaido University NUC
Priority to JP2003421303A priority Critical patent/JP2005182402A/en
Publication of JP2005182402A publication Critical patent/JP2005182402A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To automatically specify an imaging area (an area of an athletic field present inside an imaging screen) from a wide-angle image in a soccer video or the like. <P>SOLUTION: A field template generation means 110 generates a field template wherein a field line is arranged as a wire frame. A projection parameter group generation means 120 varies respective projection parameters independently of each other to generate a projection parameter group. A perspective conversion means 130 perspectively converts the field template from world coordinates into screen coordinates by use of each of the projection parameter group to obtain a plurality of template projection images. An image matching means 150 compares a binary field image with each of the plurality of template projection images to find a best-matched template projection image. A field detection means 160 finds a maximum coincident parameter, and detects the athletic field area inside a field image on the basis thereof. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、フィールド領域検出方法、そのシステム、及びプログラムに関するものであり、より詳細には、スポーツ競技を撮影した映像データ中の競技フィールド領域を自動的に検出するフィールド領域検出方法、そのシステム、及びプログラムに関する。   The present invention relates to a field area detection method, a system thereof, and a program. More specifically, the present invention relates to a field area detection method and system for automatically detecting a competition field area in video data obtained by photographing a sports competition. And the program.

ケーブルテレビ、デジタルテレビ放送、地上波テレビなどでは多数のスポーツ番組が放送されており、特にケーブルテレビやデジタルテレビなどでは多チャンネル化が進み、これらのスポーツ番組の映像資料は膨大なものとなっている。そして高速ネットワークの普及により、これらの大量のスポーツ映像がオンラインで閲覧可能となっている。このような膨大な映像ライブラリーから、ユーザーが希望するシーンを効率よく検索できるシステムの実現が必要とされており、特に、サッカーは人気があり映像データは膨大であり、サッカー映像に関する手法はそのニーズが高い。従来、サッカーの試合の映像(TV放送を目的として撮影されたものを指し、以下「サッカー映像」と称する。)から選手やボール、コーナーエリアを検出し、それらの位置関係からコーナーキックのシーンの抽出を実現する手法、フィールド上の固定された範囲を撮影するカメラの映像から選手を検出し、各チームの勢力範囲を算出する手法などが提案されている。しかしながら、どの手法も、解決すべき間違が多く、単なる提案のみにとどまり実用には至っていない。   Many sports programs are broadcast on cable TV, digital TV broadcasting, terrestrial TV, etc., especially on cable TV and digital TV, etc., and the number of channels for these sports programs is enormous. Yes. With the widespread use of high-speed networks, a large amount of these sports videos can be viewed online. There is a need for a system that can efficiently search for scenes desired by users from such a vast video library. Especially, soccer is popular and video data is huge. Needs are high. Conventionally, a player, a ball, and a corner area are detected from a video of a soccer game (referred to as a “soccer video”, which is taken for the purpose of TV broadcasting), and the corner kick scene is detected based on their positional relationship. There have been proposed a method for realizing extraction, a method for detecting a player from a video of a camera that captures a fixed range on the field, and calculating a range of power of each team. However, each method has many mistakes to be solved, and is merely a proposal and has not been put into practical use.

従来技術として、サッカー映像からコーナーキックのシーンを取り出す手法がある(非特許文献1を参照されたい。)。これは、サッカーの試合の映像(以下、サッカー映像)から選手やボール、コーナーエリアを検出し、それらの位置関係からコーナーキックのシーンを抽出するという手法である。この従来手法は、「ゴールポスト」を基準としてコーナーエリアを検出しているため、ゴールポストが選手によって隠蔽された場合、コーナーエリア(即ち、撮影画像内の競技フィールド領域)が検出できず、コーナーキックのシーンが検出できないという問題がある。   As a conventional technique, there is a method of extracting a corner kick scene from a soccer video (see Non-Patent Document 1). This is a technique in which players, balls, and corner areas are detected from a video of a soccer game (hereinafter referred to as soccer video), and a corner kick scene is extracted from their positional relationship. Since this conventional method detects the corner area based on the “goal post”, when the goal post is concealed by the player, the corner area (that is, the competition field area in the photographed image) cannot be detected, and the corner area is not detected. There is a problem that the kick scene cannot be detected.

また、他の従来技術として、フィールド上の固定された範囲を撮影するカメラの映像から選手の位置を検出し、各チームの勢力範囲を特定する手法(非特許文献1を参照されたい。)。この従来手法では、フィールド上の固定された範囲を撮影するカメラの映像を対象としているため、パンやズームを含む映像(即ち、カメラの移動やズームなどで撮影映像中の競技フィールド領域(グラウンド、コート、ピッチなど)の変化を含む映像)への適用は非常に困難である。一般にTV放送を目的としてサッカー映像が撮像される場合、パンやズームなどのような映像効果を含むことは避けられない。従って、TV中継用の映像には、この手法は適用できない。
丸尾二郎、岩井儀雄、谷内田正彦、越後富夫、飯作俊一著、「サッカー映像からの特定映像イベントの抽出」(信学技報I,IE99−17,PRMU99−41,MVE99−37,Ju1y 1999.) 瀧剛志、長谷川純一著「チームスポーツにおける集団行動解析のため特徴量とその応用」(電子情報通信学会論文誌D−II,vol.J81−DII,pp.1802−1811,August 1998.)
As another conventional technique, a method of detecting the position of a player from a video of a camera that captures a fixed range on the field and specifying the power range of each team (see Non-Patent Document 1). In this conventional method, since the video of a camera that captures a fixed range on the field is targeted, video including panning and zooming (that is, a competition field region (ground, It is very difficult to apply to images including changes in the coat, pitch, etc.). In general, when a soccer video is captured for the purpose of TV broadcasting, it is inevitable to include video effects such as panning and zooming. Therefore, this method cannot be applied to TV relay video.
Maruo Jiro, Yoshio Iwai, Masahiko Taniuchi, Tomio Echigo, Shunichi Iizaku, “Extraction of specific video events from soccer video” (Science Technical Report I, IE99-17, PRMU99-41, MVE99-37, Ju1y 1999. ) Tsuyoshi Tsuji and Junichi Hasegawa “Characteristics and Application for Group Behavior Analysis in Team Sports” (The IEICE Transactions D-II, vol.J81-DII, pp. 1802-1181, August 1998.)

上述したような従来手法をテレビ放送のために取得された映像のインデキシングや試合内容の分析目的として実用化するためには、サッカー映像などにおいて広角画像から、撮像領域(撮影画面中に存在する競技フィールドの領域)を自動的に特定する手法が必要である。即ち、カメラ位置の移動、さらに撮影効果(パンやズームなど)を含む場合においては、上述した従来技術は適用できない。また、通常のスポーツ中継の映像では、「競技フィールド領域の特定」が困難である場面が多く、上述した従来技術を使用するためには、例えば、人間が撮影画像を観察してその中から広角画像を探し出し、画面上で、競技フィールドを規定する幾つかの点(或いは線)をコントロールポイント(例えば、競技フィールドの4隅の点など)として人手で指示することによって競技フィールド領域を特定する方法などが考えられるが、人的労力が多大であり自動化が困難であった。   In order to put the above-described conventional methods into practical use for the purpose of indexing the video acquired for television broadcasting and analyzing the content of the game, a wide-angle image is captured from a wide-angle image in a soccer video or the like. A method for automatically identifying the field area) is required. That is, in the case where the movement of the camera position and the shooting effect (such as panning and zooming) are included, the above-described conventional technique cannot be applied. In addition, in normal sports broadcast video, there are many scenes where it is difficult to “specify the competition field area”. In order to use the above-described conventional technology, for example, a human observes a photographed image and a wide-angle image is displayed. A method for identifying a competition field area by searching for an image and manually indicating on the screen several points (or lines) defining the competition field as control points (for example, four corner points of the competition field). However, it was difficult to automate because of the great human labor.

本発明によるフィールド領域検出方法は、
競技フィールド領域を検出するフィールド領域検出方法であって、
競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成すフィールドテンプレート作成ステップと、
前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する投影パラメータ群生成ステップと、
前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る透視変換ステップと、
前記競技フィールドが撮影されているフィールド画像を2値フィールド画像に変換してフィールドラインを抽出する2値化ステップと、
前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める画像マッチングステップと、
前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき、所定の式を使用して前記フィールド画像中の競技フィールド領域を検出(演算)するフィールド検出ステップと、
を含む方法である。
本発明によれば、サッカー(或いは、ラグビー、バスケットボール、アメリカンフットボールなど)を代表とする何本かのラインで規定された競技フィールド内で競技するスポーツの映像データ中の競技フィールド領域を人手を介さずに自動的かつ高精度に検出する(即ち、画像中のフィールドラインに基づき、撮影画面中のどこにフィールド領域が占めるかを求め、この求めたフィールド領域が競技フィールド全体においてどこに存在するのかを検出する)ことが可能となる。このようにして撮影領域を自動的に求めることは、その他の映像解析手法の前処理として最適であり、広く応用可能である。例えば、サッカーなどのスポーツ影像データベースの検索や、試合内容の分析の前処理として本発明を実施することが可能であり、本発明の処理により、効率的に、かつ高精度にインデキシングが実現され、試合内容の分析をスムースに行うことが可能となる。
The field region detection method according to the present invention includes:
A field area detection method for detecting a competition field area,
A field template creation step for creating a field template in which the field line is arranged as a wire frame in world coordinates based on a standard that defines a field line of a competition field;
Projection parameter group generation step for generating a projection parameter group that includes projection parameters that can generate different projection images by independently changing parameters included in projection parameters used for perspective transformation from the world coordinates to the screen coordinates. When,
Using each of the projection parameter groups, the field template is perspective-transformed from the world coordinates to the screen coordinates to obtain a plurality of template projection images;
A binarization step of extracting a field line by converting a field image in which the competition field is photographed into a binary field image;
An image matching step of comparing the binary field image with each of the plurality of template projection images to obtain a template projection image that most closely matches;
A field detection step of setting a projection parameter of the most matched template projection image as a maximum matching parameter and detecting (calculating) a competition field region in the field image using a predetermined formula based on the maximum matching parameter;
It is a method including.
According to the present invention, the competition field area in the video data of the sport that competes in the competition field defined by several lines represented by soccer (or rugby, basketball, American football, etc.) is manually inserted. Automatic detection with high accuracy (ie, based on the field lines in the image, determine where the field area occupies in the shooting screen, and detect where this field area exists in the entire competition field) Be possible). Obtaining the imaging region automatically in this way is optimal as a pre-processing for other video analysis methods and can be widely applied. For example, it is possible to implement the present invention as a pre-processing of sports image database such as soccer or analysis of game content, and the processing of the present invention realizes indexing efficiently and with high accuracy, It becomes possible to analyze the game content smoothly.

また、本発明によるフィールド領域検出方法は、
前記2値フィールド画像に少なくとも1回の膨張処理を施すステップをも含む、
ことを特徴とする。
本発明によれば、フィールドライン上のゴミやかすれなどのノイズや2値化のときに混入した様々な画素ノイズを低減して、競技フィールドを構成するフィールドライン(例えば、サッカーではゴールライン、ハーフライン、またはタッチラインなど)の検出誤差を顕著に減少させ、より高精度に領域を検出することが可能となる。
The field region detection method according to the present invention includes:
Including the step of performing at least one expansion process on the binary field image,
It is characterized by that.
According to the present invention, noise such as dust and blur on the field line and various pixel noises mixed during binarization are reduced to reduce the field line (for example, goal line, half in soccer) Detection error of a line or a touch line) can be significantly reduced, and a region can be detected with higher accuracy.

さらにまた、本発明によるフィールド領域検出方法は、
前記2値フィールド画像にクロージング処理(少なくとも1回の膨張処理及び少なくとも1回の収縮処理)を施すステップをも含む、
ことを特徴とする。
本発明によれば、フィールドライン上のゴミやかすれなどのノイズや2値化のときに混入した様々な画素ノイズを低減して競技フィールドを構成するフィールドラインの検出誤差をさらに顕著に減少させ、より高精度に領域を検出することが可能となる。画面上のフィールドラインが細すぎる場合、或いはテレビ画像などのようにアスペクト比が横長の場合などには、横方向のラインが消えてしまう恐れもあるが、画面上のラインが十分に太い場合には本構成は効果的に機能する。
Furthermore, the field region detection method according to the present invention includes:
Including performing a closing process (at least one expansion process and at least one contraction process) on the binary field image,
It is characterized by that.
According to the present invention, noise such as dust and blur on the field line and various pixel noises mixed at the time of binarization are reduced to further significantly reduce the detection error of the field line constituting the competition field, It becomes possible to detect the region with higher accuracy. If the field line on the screen is too thin, or the aspect ratio is horizontally long, such as a TV image, the horizontal line may disappear, but the line on the screen is sufficiently thick. This configuration works effectively.

さらにまた、本発明によるフィールド領域検出方法は、
前記フィールド画像にカメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき広角画像を含むような前記フィールド画像を検出する広角画像検出ステップと、
を含むことを特徴とする。
本発明は、画像中のフィールドライン(ゴールラインやサイドライン)に基づき領域を検出する手法であるため、競技フィールド全体が広範囲にわたり画像に適用する場合に最も精度が高く効果的である。最近のデジタル映像データには、焦点距離、像面サイズ、画角、被写体距離などのカメラ撮影時の様々なデータが一体として保持されている場合もあり、このカメラ撮影時データを利用して画像データベースから広角で撮影された画像を自動的に検出することによって、領域の検出をより高精度かつ効果的にに行うことが可能となる。例えば、焦点距離と像面サイズの情報に基づき、画角を求めることができるため、この求めた画角に基づき広角画像のみを抽出することが可能となる。
Furthermore, the field region detection method according to the present invention includes:
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A wide-angle image detection step of reading out the field image and camera shooting time information associated with the field image from the image database, and detecting the field image including a wide-angle image based on the camera shooting time information;
It is characterized by including.
Since the present invention is a technique for detecting an area based on a field line (goal line or side line) in an image, it is most accurate and effective when applied to an image over a wide range of the competition field. In recent digital video data, various data at the time of camera shooting such as focal length, image plane size, angle of view, subject distance, etc. may be held together, and images using this camera shooting data can be used. By automatically detecting an image photographed at a wide angle from the database, it becomes possible to detect a region more accurately and effectively. For example, since the angle of view can be obtained based on information on the focal length and the image plane size, only a wide-angle image can be extracted based on the obtained angle of view.

さらにまた、本発明によるフィールド領域検出方法は、
前記フィールド画像に、カメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき、前記投影パラメータ群を限定する限定ステップと、
を含むことを特徴とする。
本発明によれば、例えば、競技フィールドに対するカメラの相対的な位置、撮影角度、画角、焦点距離、像面サイズ、被写体距離などのカメラ撮影時情報に基づいて、パラメータ群をそれぞれが取り得る範囲内に限定することができるため、大量のコンピューティングパワーを消費する透視変換処理やその後のマッチング処理を顕著に低減させることが可能となり、全体的な検出処理の迅速化を達成できる。
Furthermore, the field region detection method according to the present invention includes:
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A step of reading out the field image and camera shooting time information associated therewith from the image database, and limiting the projection parameter group based on the camera shooting time information;
It is characterized by including.
According to the present invention, for example, each parameter group can be taken based on camera shooting information such as the relative position of the camera with respect to the competition field, shooting angle, field angle, focal length, image plane size, subject distance, and the like. Since it can be limited within the range, it is possible to remarkably reduce the perspective transformation process that consumes a large amount of computing power and the subsequent matching process, and the overall detection process can be speeded up.

上述したように本発明の解決手段を方法として説明してきたが、本発明はこれらに実質的に相当するシステム(装置)、プログラム、プログラムを記録した記憶媒体としても実現され得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。
例えば、本発明をシステムとして実現させると、本発明によるフィールド領域検出システムは、
競技フィールド領域を検出するフィールド領域検出システムであって、
競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成すフィールドテンプレート作成手段と、
前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する投影パラメータ群生成手段と、
前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る透視変換手段と、
前記競技フィールドが撮影されているフィールド画像を2値フィールド画像に変換してフィールドラインを抽出する2値化手段と、
前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める画像マッチング手段と、
前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき前記フィールド画像中の競技フィールド領域を検出(演算)するフィールド検出手段と、
を含むフィールド領域検出システムである。
As described above, the solution of the present invention has been described as a method. However, the present invention can also be realized as a system (apparatus), a program, and a storage medium that records the program. It should be understood that these are included in the scope of the invention.
For example, when the present invention is realized as a system, the field region detection system according to the present invention is:
A field area detection system for detecting a competition field area,
Field template creation means for creating a field template in which the field line is arranged as a wire frame in world coordinates based on a standard that defines the field line of the competition field;
Projection parameter group generation means for generating a projection parameter group including projection parameters that can independently change parameters included in projection parameters used when perspective-transforming from the world coordinates to the screen coordinates, and that can generate different projection images. When,
Using each of the projection parameter groups, perspective transformation means for perspective transformation of the field template from the world coordinates to the screen coordinates to obtain a plurality of template projection images;
Binarizing means for converting a field image in which the competition field is photographed into a binary field image and extracting a field line;
Image matching means for comparing the binary field image and each of the plurality of template projection images to obtain a template projection image that most closely matches;
Field detection means for setting a projection parameter of the most matched template projection image as a maximum matching parameter and detecting (calculating) a competition field region in the field image based on the maximum matching parameter;
Is a field region detection system including:

また、本発明によるフィールド領域検出システムは、
前記2値フィールド画像に膨張処理を施す手段と、
前記2値フィールド画像にクロージング処理を施す手段と、
前記フィールド画像に、カメラ撮影時情報を関連付けた形式で画像データベースに格納する格納手段と、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき広角画像を含む前記フィールド画像を検出する広角画像検出手段と、
を含むことを特徴とする。
さらにまた、本発明によるフィールド領域検出システムは、
前記フィールド画像に、カメラ撮影時情報を関連付けた形式で画像データベースに格納する格納手段と、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき、前記投影パラメータ群を限定する限定手段と、
を含むことを特徴とする。
Moreover, the field area detection system according to the present invention includes:
Means for subjecting the binary field image to expansion processing;
Means for applying a closing process to the binary field image;
Storage means for storing the field image in an image database in a format associated with camera shooting information;
Wide-angle image detection means for reading out the field image and camera shooting time information associated with the field image from the image database, and detecting the field image including a wide-angle image based on the camera shooting time information;
It is characterized by including.
Furthermore, the field area detection system according to the present invention comprises:
Storage means for storing the field image in an image database in a format associated with camera shooting information;
Limiting means for reading out the field image and camera shooting time information associated therewith from the image database, and limiting the projection parameter group based on the camera shooting time information;
It is characterized by including.

また、本発明によるプログラムは、
競技フィールド領域を検出するフィールド領域検出方法をコンピュータに実行させるためのプログラムであって、
競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成すフィールドテンプレート作成ステップと、
前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する投影パラメータ群生成ステップと、
前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る透視変換ステップと、
前記競技フィールドが撮影されているフィールド画像を2値フィールド画像に変換してフィールドラインを抽出する2値化ステップと、
前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める画像マッチングステップと、
前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき前記フィールド画像中の競技フィールド領域を検出(演算)するフィールド検出ステップと、
を含むプログラム。
The program according to the present invention is
A program for causing a computer to execute a field area detection method for detecting a competition field area,
A field template creation step for creating a field template in which the field line is arranged as a wire frame in world coordinates based on a standard that defines a field line of a competition field;
Projection parameter group generation step for generating a projection parameter group that includes projection parameters that can generate different projection images by independently changing parameters included in projection parameters used for perspective transformation from the world coordinates to the screen coordinates. When,
Using each of the projection parameter groups, the field template is perspective-transformed from the world coordinates to the screen coordinates to obtain a plurality of template projection images;
A binarization step of extracting a field line by converting a field image in which the competition field is photographed into a binary field image;
An image matching step of comparing the binary field image with each of the plurality of template projection images to obtain a template projection image that most closely matches;
A field detection step of setting a projection parameter of the most matched template projection image as a maximum matching parameter, and detecting (calculating) a competition field region in the field image based on the maximum matching parameter;
Including programs.

さらにまた、本発明によるプログラムは、
前記2値フィールド画像に膨張処理を施すステップと、
前記2値フィールド画像にクロージング処理を施すステップと、
前記フィールド画像に、カメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき広角画像を含む前記フィールド画像を検出する広角画像検出ステップと、
を含むことを特徴とする。
さらにまた、本発明によるプログラムは、
前記フィールド画像に、カメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき、前記投影パラメータ群を限定する限定ステップと、
を含むことを特徴とする。
Furthermore, the program according to the present invention is:
Performing a dilation process on the binary field image;
Applying a closing process to the binary field image;
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A wide-angle image detection step of reading out the field image and camera shooting time information associated with the field image from the image database, and detecting the field image including a wide-angle image based on the camera shooting time information;
It is characterized by including.
Furthermore, the program according to the present invention is:
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A step of reading out the field image and camera shooting time information associated therewith from the image database, and limiting the projection parameter group based on the camera shooting time information;
It is characterized by including.

以降、諸図面を参照しつつ、本発明の実施態様を詳細に説明する。
図1は、本発明によるフィールド領域検出システムの基本的な構成を示すブロック図である。図に示すように、本発明のフィールド領域検出システム100は、フィールドテンプレート作成手段110、投影パラメータ群生成手段120、透視変換手段130、2値化手段140、画像マッチング手段150、及びフィールド検出手段160を具える。
フィールドテンプレート作成手段110は、競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成する。投影パラメータ群生成手段120は、前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する。透視変換手段130は、前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る。2値化手段140は、前記競技フィールドが撮影されているフィールド画像を画像データベースから読み出し、読み出した画像を2値フィールド画像に変換してフィールドラインを抽出する。画像マッチング手段150は、前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める。フィールド検出手段160は、前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき前記フィールド画像中の競技フィールド領域を検出する。検出したフィールド領域は当該画像と関連付け、その他の画像検出システム(図示せず)に渡し、その後の処理に利用される。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a block diagram showing a basic configuration of a field area detection system according to the present invention. As shown in the figure, the field region detection system 100 of the present invention includes a field template creation unit 110, a projection parameter group generation unit 120, a perspective transformation unit 130, a binarization unit 140, an image matching unit 150, and a field detection unit 160. With
The field template creation means 110 creates a field template in which the field lines are arranged as wire frames in world coordinates based on a standard that defines the field lines of the competition field. The projection parameter group generation means 120 changes the parameters included in the projection parameters used when perspective-transforming from the world coordinates to the screen coordinates, and includes projection parameters that can generate different projection images. Is generated. The perspective conversion unit 130 performs perspective conversion of the field template from the world coordinates to the screen coordinates using each of the projection parameter groups, and obtains a plurality of template projection images. The binarization means 140 reads a field image in which the competition field is photographed from an image database, converts the read image into a binary field image, and extracts a field line. The image matching means 150 compares the binary field image and each of the plurality of template projection images to obtain a template projection image that most closely matches. The field detection unit 160 uses the projection parameter of the most matched template projection image as a maximum matching parameter, and detects a competition field region in the field image based on the maximum matching parameter. The detected field area is associated with the image, passed to another image detection system (not shown), and used for subsequent processing.

図2は、本発明によるフィールド領域検出方法を説明するフローチャートである。
テンプレート作成ステップS110は、競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成する。投影パラメータ群生成ステップS120は、前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する。透視変換ステップS130は、前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る。2値化ステップS140は、フィールドラインを抽出するために、前記競技フィールドが撮影されているフィールド画像を画像データベースから読み出し、読み出した画像を2値フィールド画像に変換する。画像マッチングステップS150は、前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める。フィールド検出ステップS160は、前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき前記フィールド画像中の競技フィールド領域を検出する。
FIG. 2 is a flowchart illustrating a field region detection method according to the present invention.
The template creation step S110 creates a field template in which the field lines are arranged as wire frames in world coordinates based on a standard that defines the field lines of the competition field. In the projection parameter group generation step S120, parameters included in the projection parameters used when performing perspective transformation from the world coordinates to the screen coordinates are independently changed, and projection parameter groups each including a projection parameter that can generate different projection images. Is generated. The perspective transformation step S130 perspectively transforms the field template from the world coordinates to the screen coordinates using each of the projection parameter groups to obtain a plurality of template projection images. In the binarization step S140, in order to extract a field line, a field image in which the competition field is photographed is read from an image database, and the read image is converted into a binary field image. The image matching step S150 compares the binary field image with each of the plurality of template projection images to obtain a template projection image that most closely matches. In the field detection step S160, the projection parameter of the best matching template projection image is set as the maximum matching parameter, and the competition field region in the field image is detected based on the maximum matching parameter.

スポーツ中継番組ではサッカーが特に人気があり、そして、サッカー映像中で重要なシーンは得点が入るようなシュートシーンであるが、このようなシーンは全体から見てごく僅かであり、このようなシーンを膨大な映像データから抽出する様々な技法の前処理に、本発明の検出技法を適用することが好適である。本発明は、様々なスポーツに適用可能であるが、上述した点を踏まえて、スポーツ競技の例示としてサッカー映像を取り上げ、サッカー映像のサッカー競技フィールド領域の検出する方法・システムとして説明する。
まず、サッカー映像における試合内容の分析を際には、事前に、サッカー映像において多くを占めるフィールドが広範囲に撮影された画像(以下、広角画像)から、撮像領域を特定する必要がある。本発明は、カメラ位置や撮影効果(パンやズームなど)に制限を与えずに撮影された映像において、フィールド領域検出を実現するものである。
Soccer is particularly popular in sports broadcast programs, and the important scenes in soccer video are shoot scenes where scores can be scored, but such scenes are very few overall, such scenes It is preferable to apply the detection technique of the present invention to pre-processing of various techniques for extracting a large amount of video data. Although the present invention can be applied to various sports, in light of the above points, a soccer video is taken as an example of a sports competition and will be described as a method / system for detecting a soccer competition field area of a soccer video.
First, when analyzing the content of a game in a soccer video, it is necessary to specify an imaging region in advance from an image (hereinafter referred to as a wide-angle image) in which a field that occupies a large amount in the soccer video is captured. The present invention realizes field region detection in a video shot without limiting the camera position and shooting effect (such as pan and zoom).

本発明は、サッカー映像中の広角映像から、サッカーフィールドにおける撮影領域を特定する。実施のために下記の構成を持つ。
1)サッカー映像から広角映像を抽出する。
2)広角画像からフィールドラインを抽出する。
3)フィールドラインをワイヤーフレームモデル(以下、フィールドテンプレート)として用い、このフィールドテンプレートを透視変換により平面に投影した画像を得る。
4)2)で得られたフィールドラインと3)で得られた画像とを比致し、両者の位置が最も近くなる投影パラメータを検出する。
5)得られた投影パラメータを用いて撮影されたフィールドの領域を特定する。
The present invention specifies a shooting area in a soccer field from a wide-angle video in a soccer video. It has the following configuration for implementation.
1) Extract wide-angle video from soccer video.
2) Extract field lines from wide-angle images.
3) Using a field line as a wire frame model (hereinafter referred to as a field template), an image obtained by projecting the field template onto a plane by perspective transformation is obtained.
4) Compare the field line obtained in 2) with the image obtained in 3), and detect the projection parameter whose position is closest.
5) Use the obtained projection parameters to identify the field area captured.

本発明によって、サッカー映像の分析およびインデキシングのために、必要不可欠な広角影像における現像フィールド領域を特定することが可能となる。本発明は、一般にテレビ映像の編集で行われる撮影効果(パンやズームなど)を含む場合においても、それを実現することが可能であり、汎用性がある。
本発明は、パンとズームを行うカメラによってフィールドが広範囲に撮影された画像(以下、広角画像)について、撮影されたフィールドの範囲を検出する手法を提供する。本発明では,フィールドラインをワイヤーフレームモデル(以下、フィールドテンプレートと称する。)として用いる。このフィールドテンプレートを透視変換により平面に投影した画像と、広角画像から抽出きれたフィールドラインを比較し、両者の位置が最も近くなる投影パラメータを検出する。得られた投影パラメータを用いて提影されたフィールドの領域が特定できる。
本発明による方法では、フィールドテンプレートを透視変換により平面に投影した画像と、広角画像からフィールドラインを構成する画策を抽出した画像を、画素ごとに比較する。比較により、画像の一致の度合が最も高くなる投影パラメータを検出し、その値を用いて撮影された領域を算出する。本発明で用いるフィールドテンプレートは複数のラインにより構成されているため、選手による隠蔽の影響を受けずに撮影された領域を検出可能である。以下で各処理について説明する。
According to the present invention, it is possible to identify a development field region in a wide-angle image that is indispensable for analyzing and indexing a soccer video. The present invention can be realized even when it includes a shooting effect (panning, zooming, etc.) generally performed in editing of a television image, and is versatile.
The present invention provides a technique for detecting a range of a field that has been captured from an image (hereinafter, a wide-angle image) in which the field is captured over a wide range by a camera that performs panning and zooming. In the present invention, a field line is used as a wire frame model (hereinafter referred to as a field template). An image obtained by projecting the field template onto a plane by perspective transformation and a field line extracted from the wide-angle image are compared, and a projection parameter with the closest position is detected. The region of the projected field can be specified using the obtained projection parameter.
In the method according to the present invention, an image obtained by projecting a field template onto a plane by perspective transformation is compared with an image obtained by extracting an image forming a field line from a wide-angle image for each pixel. Through the comparison, a projection parameter with the highest degree of matching of images is detected, and a photographed region is calculated using the value. Since the field template used in the present invention is composed of a plurality of lines, it is possible to detect an imaged region without being affected by concealment by the player. Each process will be described below.

フィールドテンプレートの投影
日本サッカー協会および国際サッカー連盟により、日本国内での国際試合、国民体育大会等の全国的規模の大会(例えば、ウールドカップ、オリンピック、ワールドユース大会等)では図3に示すフィールドを使用することが定められている(「サッカー競技規則、1999/2000」を参照されたい。(財団法人日本サッカー協会審判委員会、”財団法人日本サッカー協会,pp,6−10,1999))。そこで、本発明では図3に示すモデルをフィールドテンプレートとして採用する。
Projection of field templates The Japan Football Association and the International Football Federation have adopted the fields shown in Figure 3 for national-scale tournaments (such as Wooled Cup, Olympics, World Youth Games, etc.) (Please refer to "Soccer Competition Rules, 1999/2000" (Japan Football Association Referee Committee, "Japan Football Association, pp, 6-10, 1999)"). Therefore, in the present invention, the model shown in FIG. 3 is adopted as the field template.

フィールドテンプレートの投影像を表現するために、ワールド座標x,y,zおよびスクリーン座標X,Yをそれぞれ図4のA、Bに示すように設定する。フィールドテンプレートをワールド座標のxy平面上に、タッチラインとゴールラインがそれぞれx,y軸に並行になるように配置し、さらに視点をPv(xv,yv,zv)、投影方向をP(x,y,0)、視点からスクリーンまでの距離をrで表す。ただし、PvPを通る直線はスクリーンに対し垂直である。また、線分PvPをxy平面に投影した線分lとx軸がなす角をθ,線分lと線分PvPのなす角を、ワールド座標におけるスクリーンの中心の点をP(x,y,z)、線分PvPの長さをr′とおく。このとき、ワールド座標からスクリーン座標への透視変換は式(1)および(2)で表される。

Figure 2005182402

である。以降、上の座標変換によって得られた画像をテンプレート投影画像と呼ぶ。ただし、テンプレート投影画像において、ラインを1,それ以外を0で表現する。 In order to express the projected image of the field template, world coordinates x, y, z and screen coordinates X, Y are set as shown in A and B of FIG. Place the field template on the xy plane of world coordinates so that the touch line and goal line are parallel to the x and y axes, respectively, and the viewpoint is P v (x v , y v , z v ), and the projection direction is P f (x f , y f , 0), and the distance from the viewpoint to the screen is represented by r. However, the straight line passing through P v P f is perpendicular to the screen. Also, the angle formed by the line segment l and the x axis projected from the line segment P v P f on the xy plane is θ, the angle formed by the line segment l and the line segment P v P f is the center point of the screen in world coordinates. P s (x s, y s , z s), the length of the line segment P v P s is denoted by r '. At this time, perspective transformation from world coordinates to screen coordinates is expressed by equations (1) and (2).
Figure 2005182402

It is. Hereinafter, the image obtained by the above coordinate conversion is referred to as a template projection image. However, in the template projection image, the line is represented by 1 and the others are represented by 0.

テンプレート投影画像の生成に用いる投影パラメータPvPrは、実際のサッカー映像から推測されるカメラの状態に基づいて、投影パラメータのそれぞれが取り得る範囲を次のように限定できる。視点Pvは、サッカーの試合で広角画像を撮影するカメラが、タッチライン側の観客席の中央付近に設置されることを利用して

Figure 2005182402

の範囲に限定できる。即ち、この式は、サッカースタジアムの外にカメラは設置されないこと、及び、サッカーフィールドの中にカメラは設置されないことを意味する。このように設定された範囲は、可能な設定値を網羅するよう十分に大きく設定されている。従って、競技場によるカメラの設置位置の違いにより、フィールド領域の検出結果に劣化が生じる危険性は少ない。投影方向はカメラの撮影角度を表しているので、カメラが常にフィールド内を撮影しているとすれば、フィールドの大きさの規格より
Figure 2005182402

の範囲に限定される。スクリーンまでの距離rはカメラの画角に関係しているので、フィールドがスクリーン内に納まるように範囲を定める。このように投影パラメータの取り得る範囲を限定して、投影パラメータ群を構成する数を減少させれば、透視変換やマッチング処理などの計算負荷を顕著に低減でき、処理の迅速化、ひいては検出精度の向上も図れる。 The projection parameter P v P fr used for generating the template projection image can limit the range that each projection parameter can take based on the state of the camera estimated from the actual soccer video as follows. Viewpoint P v is based on the fact that a camera that captures wide-angle images in soccer matches is installed near the center of the audience seat on the touchline side.
Figure 2005182402

Can be limited to the range. That is, this equation means that no camera is installed outside the soccer stadium and no camera is installed in the soccer field. The range set in this way is set sufficiently large to cover the possible set values. Therefore, there is little risk that the detection result of the field area is deteriorated due to the difference in the camera installation position depending on the stadium. Since the projection direction represents the shooting angle of the camera, if the camera is always shooting in the field, the field size standard
Figure 2005182402

It is limited to the range. Since the distance r to the screen is related to the angle of view of the camera, the range is determined so that the field fits within the screen. By limiting the range of projection parameters that can be taken in this way and reducing the number of projection parameter groups, the computational load such as perspective transformation and matching processing can be significantly reduced. Can be improved.

広角画像からフィールドラインの抽出
次に、広角画像からフィールドラインを構成する画素を抽出する方法を説明する。
多くの競技ではフィールドラインは白色であり、白色は輝度が高いという特徴を持つ。また、フィールドラインは緑色の芝の上に引かれることが多いため、画像上でフィールドラインを構成する画素は白色と緑色の混色となる。そこで、YIQ表色系のy(輝度)とHSV表色系の方(色相)を用いて

Figure 2005182402

を満たす画素をフィールドラインとする。ただし、ThYは閾値であり、2/5π、πはマンセル表色系でそれぞれ5Y(yellow),5BG(bluegreen)を表している。この処理により得られたラインを1、それ以外を0とした画像を以降、2値フィールド画像と呼ぶ。また、2値フィールド画像に膨張処理を施した画像(以下、膨張2値フィールド画像)を準備し、以降で行われるフィールド投影画像の比較の対象とすることにより、ラインの検出誤差の影響を軽減する。 Extraction of Field Line from Wide Angle Image Next, a method for extracting pixels constituting the field line from the wide angle image will be described.
In many competitions, the field line is white, and white is characterized by high brightness. Further, since the field line is often drawn on the green grass, the pixels constituting the field line on the image are a mixed color of white and green. Therefore, y (luminance) of the YIQ color system and the HSV color system (hue) are used.
Figure 2005182402

Pixels that satisfy are defined as field lines. However, Th Y is a threshold value, and 2 / 5π and π represent 5Y (yellow) and 5BG (bluegreen) in the Munsell color system, respectively. An image in which the line obtained by this processing is 1 and the others are 0 is hereinafter referred to as a binary field image. In addition, by preparing an image obtained by performing dilation processing on a binary field image (hereinafter, dilated binary field image) and making it a target for comparison of field projection images to be performed later, the influence of line detection errors is reduced. To do.

テンプレート投影画像と膨張2値フィールド画像の比較による撮影範囲の検出
上述したように限定した範囲において、Yv,Zv,xf,yf,rをそれぞれ独立に刻みδyz,δyv,δyf,δrで変化させ、各パラメータのすべての値の組み合わせについて、テンプレート投影画像と膨張2値フィールド画像の比較を行う。このとき比較の指標として、テンプレート投影画像と膨張2値フィールド画像の論理積を取ることにより得られる画像において、値が1である画素の数を用いる(以下、テンプレート一致度と称する。)。この処理により、最も高いテンプレート一致度が得られたときのPv,Pf,rを、本明細書では以降、最大一致パラメータと呼ぶ。ただし、カメラ操作のパンとズームによって変化する投影パラメータはPf,r,のみなので、動画を対象に最大一致パラメータを検出する際は、初めのフレームでPvを算出すれば、以降はPf,rのみの探索となる。また、カメラが常にボールを追っていると仮定すると、ボールの速さはシュート時に40m/sであるから、Nfpsでサンプリングされた映像において、隣接フレームでのPが既知であれば、その40/Nm近傍のみを探索すればよい。同様にrも隣接フレームでは変化が少ないことを用いて、探索の範囲が縮小できる。
In limiting the scope as detected above the shooting range by comparison with the template projection image and the expansion binary field image, change Yv, Zv, x f, δyz increments y f, r the independently, δyv, δyf, in δr The template projection image and the expanded binary field image are compared for all combinations of values of the parameters. At this time, as an index for comparison, the number of pixels having a value of 1 in the image obtained by taking the logical product of the template projection image and the expanded binary field image is used (hereinafter referred to as template matching degree). In this specification , P v, P f, r when the highest template matching degree is obtained by this processing will be hereinafter referred to as a maximum matching parameter. However, since the only projection parameter that changes due to panning and zooming of the camera is P f, r, when detecting the maximum matching parameter for moving images, if P v is calculated in the first frame, then P f , R only search. Assuming that the camera is always following the ball, the speed of the ball is 40 m / s at the time of shooting. Therefore, if P f at an adjacent frame is known in the video sampled at Nfps, the 40 / Only the neighborhood of Nm needs to be searched. Similarly, the search range can be reduced by using the fact that r also changes little in adjacent frames.

次に、最大一致パラメータから、撮影されたフィールドの領域を算出する方法を示す。スクリーンの4隅を頂点とした矩形は撮影範囲に対応している。そこで、この4点に投影されるxy平面上の点の座標を以下で求める。Z=0とおいて式(1)および(2)を変形し、スクリーン座標からワールド座標へ変換を行う式を得る。

Figure 2005182402

Figure 2005182402

式(10)および(11)にスクリーンの4隅の座標を代入し、xy平面上に撮影された領域を算出する。 Next, a method for calculating the area of the photographed field from the maximum matching parameter will be described. The rectangles with the four corners of the screen as vertices correspond to the shooting range. Therefore, the coordinates of the points on the xy plane projected onto these four points are obtained as follows. Transform equations (1) and (2) with Z = 0 to obtain an equation that converts from screen coordinates to world coordinates.
Figure 2005182402

Figure 2005182402

Substituting the coordinates of the four corners of the screen into equations (10) and (11), the area photographed on the xy plane is calculated.

本発明の有効性を確認するため、以下の実験を行い、その結果を示す。実験にはサッカー映像を10fpsでサンプリングした約14秒間(137フレーム)のRGB形式の広角画像(360×240)を用いた。実験に用いた閾値はThy=0.47、膨張処理の回数は3回、rの探索範囲はr∈[800,1300],Pv,Pf,rの刻み幅はδyz,δyv,δyf,δr=10とした。実験結果の一部を図5(Aは広角画像、Bは投影画像、Cは本発明によって検出した撮影領域を示す図)に示す。図より、実際の競技フィールドを撮影した広角画像(A)とテンプレート投影画像(B)のフィールドラインが一致しており、撮影された領域(C)が正しく検出されていることが確認できる。本発明による検証システムの検出結果の正誤を目視により判定すると、撮影された領域が正しく検出されたのは137フレーム中131フレームであった。従って、本発明によれば、映像データに何ら手作業を加えずにかなりの高精度でフィールド領域を検出することが可能であることが判明した。 In order to confirm the effectiveness of the present invention, the following experiment is performed and the results are shown. The experiment used a wide-angle image (360 x 240) in RGB format for about 14 seconds (137 frames) sampled at 10 fps. The threshold used in the experiment is Thy = 0.47, the number of expansion processes is 3, the search range of r is r∈ [800, 1300], P v, P f, and the step size of r are δy z , δy v , δy f , Δr = 10. A part of the experimental results is shown in FIG. 5 (A is a wide-angle image, B is a projected image, and C is a diagram showing an imaging region detected by the present invention). From the figure, it can be confirmed that the field lines of the wide-angle image (A) and the template projection image (B) obtained by photographing the actual competition field match, and the photographed region (C) is correctly detected. When the correctness / incorrectness of the detection result of the verification system according to the present invention is visually determined, 131 frames out of 137 frames have been correctly detected. Therefore, according to the present invention, it has been found that the field region can be detected with considerably high accuracy without any manual work on the video data.

本発明は、スポーツ映像分析などを必要とする、放送業界やスポーツ映像データベースなどを扱う産業で利用が期待される。   The present invention is expected to be used in the broadcasting industry and sports video database industries that require sports video analysis and the like.

本明細書では、様々な実施態様で本発明の原理を説明してきたが、本発明は上述した実施例に限定されず、当業者であれば幾多の変形および修正を施すことが可能であり、これら変形および修正されたものも本発明に含まれることを理解されたい。
例えば、実施例ではマッチング処理は、画素毎に比較した形式のものを挙げたが下記のような様々なマッチング処理を本発明では利用することが可能である。
マッチング処理の変形例1
フィールドテンプレートに透視変換を適用した結果(ワイヤーフレームモデルのままでビットマップ画像にはしないもの) の各線分について、2値フィールド画像中でその線分のd画素近傍に存在する値が1の画素数を算出し、全線分の総和をテンプレート一致度とする。
マッチング処理の変形例2
2値フィールド画像について既存の線抽出手法を適用し、得られた線分とフィールドテンプレートの投影像を比較する。
In the present specification, the principle of the present invention has been described in various embodiments. However, the present invention is not limited to the above-described embodiments, and many variations and modifications can be made by those skilled in the art. It should be understood that these variations and modifications are also included in the present invention.
For example, in the embodiment, the matching process is of the type compared for each pixel, but various matching processes as described below can be used in the present invention.
Modification 1 of matching process
For each line segment of the result of applying perspective transformation to the field template (the wire frame model is not converted into a bitmap image), a pixel with a value of 1 near the d pixel of the line segment in the binary field image The number is calculated, and the total sum of all line segments is set as the template matching degree.
Modification 2 of matching process
The existing line extraction method is applied to the binary field image, and the obtained line segment is compared with the projected image of the field template.

上述した実施例では、一般的なサッカー競技スタジアムのサイズで一般的なカメラ配置を想定してパラメータの探索範囲を限定したが、撮影時にカメラによって自動的に取得されたカメラ撮影時情報、または人手で付加されたカメラ撮影時情報を得ることができれば、さらに、パラメータの探索範囲を限定することが可能であり、迅速に領域検出をすることができるようになる。カメラ撮影時情報としては、例えば、競技フィールドに対するカメラの相対的な位置、撮影角度、画角、焦点距離、像面サイズ、被写体距離などがあり、これらの情報の一部を得ることができれば、パラメータの探索範囲を相当限定することが可能となる。   In the above-described embodiment, the search range of the parameters is limited by assuming a general camera arrangement with the size of a general soccer competition stadium, but the camera shooting information automatically acquired by the camera at the time of shooting, If it is possible to obtain the camera shooting information added in step (1), it is possible to further limit the parameter search range, and to quickly detect the area. As the information at the time of camera shooting, for example, there are a relative position of the camera with respect to the competition field, shooting angle, angle of view, focal length, image plane size, subject distance, etc. It is possible to considerably limit the parameter search range.

本発明によるフィールド領域検出システムの基本的な構成を示すブロック図である。It is a block diagram which shows the fundamental structure of the field area | region detection system by this invention. 本発明によるフィールド領域検出方法を説明するフローチャートである。5 is a flowchart illustrating a field region detection method according to the present invention. サッカーフィールドに対応するフィールドテンプレートを示す平面図である。It is a top view which shows the field template corresponding to a soccer field. Aはフィールドテンプレートの投影像を3次元で表現するワールド座標x,y,zを示す図であり、Bはフィールドテンプレートの投影像を2次元で表現するスクリーン座標x,yを示す図である。A is a diagram illustrating world coordinates x, y, and z that represent the projected image of the field template in three dimensions, and B is a diagram illustrating screen coordinates x and y that represent the projected image of the field template in two dimensions. Aは実際のフィールドを撮影した広角画像を示す図であり、Bはテンプレート投影画像を示す図であり、Cは本発明によって検出した撮影領域を示す図である。A is a diagram showing a wide-angle image obtained by photographing an actual field, B is a diagram showing a template projection image, and C is a diagram showing an imaging region detected by the present invention.

符号の説明Explanation of symbols

100 フィールド領域検出システム
110 フィールドテンプレート作成手段
120 投影パラメータ群生成手段
130 透視変換手段
140 2値化手段
150 画像マッチング手段
160 フィールド検出手段
DESCRIPTION OF SYMBOLS 100 Field area | region detection system 110 Field template preparation means 120 Projection parameter group production | generation means 130 Perspective transformation means 140 Binarization means 150 Image matching means 160 Field detection means

Claims (12)

競技フィールド領域を検出するフィールド領域検出方法であって、
競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成すフィールドテンプレート作成ステップと、
前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する投影パラメータ群生成ステップと、
前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る透視変換ステップと、
前記競技フィールドが撮影されているフィールド画像を2値フィールド画像に変換してフィールドラインを抽出する2値化ステップと、
前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める画像マッチングステップと、
前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき前記フィールド画像中の競技フィールド領域を検出するフィールド検出ステップと、
を含むフィールド領域検出方法。
A field area detection method for detecting a competition field area,
A field template creation step for creating a field template in which the field line is arranged as a wire frame in world coordinates based on a standard that defines a field line of a competition field;
Projection parameter group generation step for generating a projection parameter group that includes projection parameters that can generate different projection images by independently changing parameters included in projection parameters used for perspective transformation from the world coordinates to the screen coordinates. When,
Using each of the projection parameter groups, the field template is perspective-transformed from the world coordinates to the screen coordinates to obtain a plurality of template projection images;
A binarization step of extracting a field line by converting a field image in which the competition field is photographed into a binary field image;
An image matching step of comparing the binary field image with each of the plurality of template projection images to obtain a template projection image that most closely matches;
A field detection step of setting a projection parameter of the most matched template projection image as a maximum matching parameter and detecting a competition field region in the field image based on the maximum matching parameter;
Field area detection method including:
請求項1に記載のフィールド領域検出方法において、
前記2値フィールド画像に膨張処理を施すステップをも含む、
ことを特徴とするフィールド領域検出方法。
The field region detection method according to claim 1,
Including the step of dilating the binary field image,
A field region detection method characterized by the above.
請求項1または2に記載のフィールド領域検出方法において、
前記フィールド画像にカメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき広角画像を含む前記フィールド画像を検出する広角画像検出ステップと、
を含むことを特徴とするフィールド領域検出方法。
In the field area detection method according to claim 1 or 2,
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A wide-angle image detection step of reading out the field image and camera shooting time information associated with the field image from the image database, and detecting the field image including a wide-angle image based on the camera shooting time information;
A field region detection method comprising:
請求項1または2に記載のフィールド領域検出方法において、
前記フィールド画像にカメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき、前記投影パラメータ群を限定する限定ステップと、
を含むことを特徴とするフィールド領域検出方法。
In the field area detection method according to claim 1 or 2,
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A step of reading out the field image and camera shooting time information associated therewith from the image database, and limiting the projection parameter group based on the camera shooting time information;
A field region detection method comprising:
競技フィールド領域を検出するフィールド領域検出システムであって、
競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成すフィールドテンプレート作成手段と、
前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する投影パラメータ群生成手段と、
前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る透視変換手段と、
前記競技フィールドが撮影されているフィールド画像を2値フィールド画像に変換してフィールドラインを抽出する2値化手段と、
前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める画像マッチング手段と、
前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき前記フィールド画像中の競技フィールド領域を検出するフィールド検出手段と、
を含むフィールド領域検出システム。
A field area detection system for detecting a competition field area,
Field template creation means for creating a field template in which the field line is arranged as a wire frame in world coordinates based on a standard that defines the field line of the competition field;
Projection parameter group generation means for generating a projection parameter group including projection parameters that can independently change parameters included in projection parameters used when perspective-transforming from the world coordinates to the screen coordinates, and that can generate different projection images. When,
Using each of the projection parameter groups, perspective transformation means for perspective transformation of the field template from the world coordinates to the screen coordinates to obtain a plurality of template projection images;
Binarizing means for converting a field image in which the competition field is photographed into a binary field image and extracting a field line;
Image matching means for comparing the binary field image and each of the plurality of template projection images to obtain a template projection image that most closely matches;
Field detection means for setting a projection parameter of the most matched template projection image as a maximum matching parameter, and detecting a competition field region in the field image based on the maximum matching parameter;
Including field area detection system.
請求項5に記載のフィールド領域検出システムにおいて、
前記2値フィールド画像に膨張処理を施す手段をも含む、
ことを特徴とするフィールド領域検出システム。
The field region detection system according to claim 5,
Means for subjecting the binary field image to expansion processing;
A field region detection system characterized by that.
請求項5または6に記載のフィールド領域検出システムにおいて、
前記フィールド画像にカメラ撮影時情報を関連付けた形式で画像データベースに格納する格納手段と、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき広角画像を含む前記フィールド画像を検出する広角画像検出手段と、
を含むことを特徴とするフィールド領域検出システム。
The field region detection system according to claim 5 or 6,
Storage means for storing in the image database in a format in which camera field shooting time information is associated with the field image;
Wide-angle image detection means for reading out the field image and camera shooting time information associated with the field image from the image database, and detecting the field image including a wide-angle image based on the camera shooting time information;
A field region detection system comprising:
請求項5または6に記載のフィールド領域検出システムにおいて、
前記フィールド画像にカメラ撮影時情報を関連付けた形式で画像データベースに格納する格納手段と、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき、前記投影パラメータ群を限定する限定手段と、
を含むことを特徴とするフィールド領域検出システム。
The field region detection system according to claim 5 or 6,
Storage means for storing in the image database in a format in which camera field shooting time information is associated with the field image;
Limiting means for reading out the field image and camera shooting time information associated therewith from the image database, and limiting the projection parameter group based on the camera shooting time information;
A field region detection system comprising:
競技フィールド領域を検出するフィールド領域検出方法をコンピュータに実行させるためのプログラムであって、
競技フィールドのフィールドラインを規定する規格に基づき、ワールド座標に前記フィールドラインをワイヤーフレームとして配置したフィールドテンプレートを作成すフィールドテンプレート作成ステップと、
前記ワールド座標からスクリーン座標に透視変換するときに用いる投影パラメータに含まれるパラメータを各々独立に変化させ、それぞれが異なる投影画像を生成し得る投影パラメータを含む投影パラメータ群を生成する投影パラメータ群生成ステップと、
前記投影パラメータ群の各々を用いて、前記フィールドテンプレートを前記ワールド座標から前記スクリーン座標に透視変換して、複数のテンプレート投影画像を得る透視変換ステップと、
前記競技フィールドが撮影されているフィールド画像を2値フィールド画像に変換してフィールドラインを抽出する2値化ステップと、
前記2値フィールド画像と前記複数のテンプレート投影画像の各々とを比較して最もマッチするテンプレート投影画像を求める画像マッチングステップと、
前記の最もマッチするテンプレート投影画像の投影パラメータを最大一致パラメータとし、この最大一致パラメータに基づき前記フィールド画像中の競技フィールド領域を検出するフィールド検出ステップと、
を含むプログラム。
A program for causing a computer to execute a field area detection method for detecting a competition field area,
A field template creation step for creating a field template in which the field line is arranged as a wire frame in world coordinates based on a standard that defines a field line of a competition field;
Projection parameter group generation step for generating a projection parameter group that includes projection parameters that can generate different projection images by independently changing parameters included in projection parameters used for perspective transformation from the world coordinates to the screen coordinates. When,
Using each of the projection parameter groups, the field template is perspective-transformed from the world coordinates to the screen coordinates to obtain a plurality of template projection images;
A binarization step of extracting a field line by converting a field image in which the competition field is photographed into a binary field image;
An image matching step of comparing the binary field image with each of the plurality of template projection images to obtain a template projection image that most closely matches;
A field detection step of setting a projection parameter of the most matched template projection image as a maximum matching parameter and detecting a competition field region in the field image based on the maximum matching parameter;
Including programs.
請求項9に記載のプログラムにおいて、
前記2値フィールド画像に膨張処理を施すステップをも含む、
ことを特徴とするプログラム。
The program according to claim 9,
Including the step of dilating the binary field image,
A program characterized by that.
請求項9または10に記載のプログラムにおいて、
前記フィールド画像にカメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき広角画像を含む前記フィールド画像を検出する広角画像検出ステップと、
を含むことを特徴とするプログラム。
The program according to claim 9 or 10,
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A wide-angle image detection step of reading out the field image and camera shooting time information associated with the field image from the image database, and detecting the field image including a wide-angle image based on the camera shooting time information;
The program characterized by including.
請求項9または10のいずれか1項に記載のプログラムにおいて、
前記フィールド画像にカメラ撮影時情報を関連付けた形式で画像データベースに格納する格納ステップと、
前記画像データベースから前記フィールド画像及びこれに関連付けられたカメラ撮影時情報を読み出し、前記カメラ撮影時情報に基づき、前記投影パラメータ群を限定する限定ステップと、
を含むことを特徴とするプログラム。
The program according to any one of claims 9 and 10,
A storage step of storing the field image in an image database in a format associated with camera shooting information;
A step of reading out the field image and camera shooting time information associated therewith from the image database, and limiting the projection parameter group based on the camera shooting time information;
The program characterized by including.
JP2003421303A 2003-12-18 2003-12-18 Field area detection method, system therefor and program Pending JP2005182402A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003421303A JP2005182402A (en) 2003-12-18 2003-12-18 Field area detection method, system therefor and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003421303A JP2005182402A (en) 2003-12-18 2003-12-18 Field area detection method, system therefor and program

Publications (1)

Publication Number Publication Date
JP2005182402A true JP2005182402A (en) 2005-07-07

Family

ID=34782567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003421303A Pending JP2005182402A (en) 2003-12-18 2003-12-18 Field area detection method, system therefor and program

Country Status (1)

Country Link
JP (1) JP2005182402A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011053816A (en) * 2009-08-31 2011-03-17 Nippon Hoso Kyokai <Nhk> Image processor and program
CN103745483A (en) * 2013-12-20 2014-04-23 成都体育学院 Mobile-target position automatic detection method based on stadium match video images
US9020259B2 (en) 2009-07-20 2015-04-28 Thomson Licensing Method for detecting and adapting video processing for far-view scenes in sports video
CN104680560A (en) * 2015-02-28 2015-06-03 东华大学 Fast sports venues detection method based on image line element correspondence

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9020259B2 (en) 2009-07-20 2015-04-28 Thomson Licensing Method for detecting and adapting video processing for far-view scenes in sports video
JP2011053816A (en) * 2009-08-31 2011-03-17 Nippon Hoso Kyokai <Nhk> Image processor and program
CN103745483A (en) * 2013-12-20 2014-04-23 成都体育学院 Mobile-target position automatic detection method based on stadium match video images
CN104680560A (en) * 2015-02-28 2015-06-03 东华大学 Fast sports venues detection method based on image line element correspondence
CN104680560B (en) * 2015-02-28 2017-10-24 东华大学 Based on the corresponding sports place quick determination method of image line element

Similar Documents

Publication Publication Date Title
US9437012B2 (en) Multiple-object tracking and team identification for game strategy analysis
D’Orazio et al. A review of vision-based systems for soccer video analysis
RU2498404C2 (en) Method and apparatus for generating event registration entry
US8922718B2 (en) Key generation through spatial detection of dynamic objects
EP3668093B1 (en) Method, system and apparatus for capture of image data for free viewpoint video
US20070030396A1 (en) Method and apparatus for generating a panorama from a sequence of video frames
US20130094696A1 (en) Integrated Background And Foreground Tracking
KR20090084563A (en) Method and apparatus for generating the depth map of video image
Martín et al. A semi-supervised system for players detection and tracking in multi-camera soccer videos
JP4906588B2 (en) Specific operation determination device, reference data generation device, specific operation determination program, and reference data generation program
JP4728795B2 (en) Person object determination apparatus and person object determination program
US8311269B2 (en) Blocker image identification apparatus and method
JP2019101892A (en) Object tracking device and program thereof
Hasegawa et al. Synthesis of a stroboscopic image from a hand-held camera sequence for a sports analysis
CN107194954B (en) Player tracking method and device of multi-view video
CN112508998A (en) Visual target alignment method based on global motion
JP7198661B2 (en) Object tracking device and its program
JP2005182402A (en) Field area detection method, system therefor and program
Szenberg et al. Automatic camera calibration for image sequences of a football match
TW201742006A (en) Method of capturing and reconstructing court lines
JP4181313B2 (en) Scene content information adding device and scene content information adding program
Polceanu et al. Real time tennis match tracking with low cost equipment
Ruiz-del-Solar et al. An automated refereeing and analysis tool for the Four-Legged League
Martín et al. Automatic players detection and tracking in multi-camera tennis videos
Manafifard A review on camera calibration in soccer videos

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060829

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070109