JP5243888B2 - データ分類装置及びデータ分類プログラム - Google Patents
データ分類装置及びデータ分類プログラム Download PDFInfo
- Publication number
- JP5243888B2 JP5243888B2 JP2008209473A JP2008209473A JP5243888B2 JP 5243888 B2 JP5243888 B2 JP 5243888B2 JP 2008209473 A JP2008209473 A JP 2008209473A JP 2008209473 A JP2008209473 A JP 2008209473A JP 5243888 B2 JP5243888 B2 JP 5243888B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- classification
- learning
- input
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、映像や音楽、テキスト情報等の各種データに対して分類分けを行う。具体的には、例えば、映像解析による重要シーンの抽出を目的とした場合、被写体が出現する映像区間とフレーム内での被写体領域の検出を行う際には様々な被写体を検出するために、被写体とそれ以外の背景を区別するための画像特徴量と、その特徴量に基づいた有効な識別手法の検討が必要となる。そこで、本発明では、例えば、各キーフレームにおけるブロック領域に対して様々なテクスチャ特徴を取得し、その情報からランダムフォレスト法によって被写体とそれ以外の背景領域とに分類する。
ここで、本実施形態で適用されるランダムフォレスト法について説明する。ランダムフォレスト学習アルゴリズムは、集団学習の一種であり、多数の決定木を組み合わせることによって高い分類精度を実現する手法である(ランダムフォレスト学習アルゴリズムについては、例えば非特許文献1(L.Breiman,“Random Forests,”Machine Learning,vol.45,pp.5−32,2001.)等参照。)。
(1)まず、学習データの中から、生成する決定木の数だけのデータ集合であるブートストラップサンプルを生成する。ここで、ブートストラップサンプルとは、学習データから復元抽出でランダムサンプルすることによって生成したデータ集合を示す。
(2)次に、生成したブートストラップサンプルを用いて決定木を学習する。決定木としては、CART(例えば、非特許文献2(L.Breiman,J.H.Friedman,R.A.Olshen and C.J.Stone,“Classification and Regression Trees,”Wadsworth International Group,Belmont,1984.)等参照。)を用いる。
(3)識別器の出力結果は、全ての決定木の出力の多数決によって決定する。ランダムフォレスト法では、学習データにおいて各クラスに属するデータが均等である場合は、良好な識別器を学習することができる。しかしながら、一部のクラスに含まれるデータ数が極端に多い等、データ数に偏りがある場合には、殆ど全ての入力データを、学習データの多数を占めるクラスとして分類するような識別器が学習されてしまう。例えば、表1に示すような偏りのある学習データに対して、全てをクラスBと分類しても80%のデータは正しく分類できることになる。そこで、上述した非特許文献1に示すような技術では、各学習データに対して、各クラスに含まれるデータ数に反比例した重みを設定することによって、問題の解決を図っている。
まず、本実施形態におけるデータ分類装置10における装置構成例について説明する。データ分類装置10は、例えば、汎用のパーソナルコンピュータ、サーバ等を用いることができ、本発明に係る各処理をコンピュータに実行させることができる実行プログラム(データ分類プログラム)をインストールすることにより、本発明におけるデータ分類処理を実現することができる。
次に、図3は、本実施形態におけるデータ分類装置の機能構成の一例を示す図である。図3に示すデータ分類装置10は、データ集合生成手段としてのブートストラップサンプル生成手段21と、決定木学習手段22と、データ分類手段23とを有するよう構成されている。
次に、データ集合生成手段としてのブートストラップサンプル生成手段21における生成処理について具体的に説明する。上述したデータ分類装置10では、まず学習データからブートストラップサンプルを生成する。
ここで、Dは学習データの総数を表し、Cは学習データに含まれるクラス数を表す。また、上述した式(2)における「class_no(di)」は、データdiが属するクラス番号を表している。
次に、上述したデータ分類装置を用いた具体的な実施形態について図を用いて説明する。なお、以下の説明では、実際の放送番組として動物番組を対象に、映像中に出現する動物被写体を画像処理によって検出する処理について説明する。つまり、本実施形態では、各キーフレームにおけるブロック領域に対して様々なテクスチャ特徴を算出し、ランダムフォレスト法によって被写体とそれ以外の背景領域とに分類する処理内容について説明する。また、放送番組に対して上述した本発明手法を適用し、被写体領域及び被写体出現フレームの検出精度を評価する。
次に、上述した図5に示す特徴量抽出手段43における各種画像特徴量の具体的な算出手法について、具体的に説明する。
<テクスチャ特徴>
特徴量抽出手段43により求められるテクスチャ特徴としては、例えば上述したカラーモーメント特徴,エッジ方向ヒストグラム,ガボール(Gabor)特徴,ローカルバイナリパターン(LBP:Local Binary Pattern)の4種類を用い、更に本実施形態では元のフレームにおけるブロック位置も特徴量として利用している。以下に、それぞれのテクスチャ特徴について簡単に説明する。
カラーモーメント特徴では、入力画像をHSV色空間,Lab色空間のそれぞれに変換し、各コンポーネントに対して,画素値の平均μ,標準偏差σ,歪度の立方根sを算出する。
エッジ方向ヒストグラムでは、−90度から+90度の範囲を5度毎に区切った36方向と、非エッジ点について頻度ヒストグラムを求め、特徴量とする。また、検出には、例えば画像の持つ2次元的な特徴を対象物体の輪郭(エッジ)として抽出し認識する手法であるSobelフィルタ等を用いる。
ガボール特徴におけるガボールフィルタは、濃淡特徴の方向と周期を特徴量として抽出できるフィルタである。解像度m,方向nのガボールフィルタを式(4)に示す。
ローカルバイナリパターンは、注目画素に対する周辺画素の濃度の大小パターンを表した特徴量である(LBPについては、例えば、T.Ojala M.Pietikaninen and T.Maenpaa,“Multiresolution grayscale and rotation invariant texture classification with local binary patterns,”IEEE Trans.Pattern analysis and machine intelligence,vol.24,no.7,pp.971−987,2002.等参照。)。ここで、例えば、半径Rの位置にあるP個の画素のLBPは式(5)で算出できる。
ブロック位置では、入力データとして入力される映像中に含まれるフレーム内でのブロック位置をx,y座標で表す。
次に、上述した被写体フレーム判定手段44におけるフレーム判定手法について、説明する。
次に、上述した図5に示す実施形態を適用して実際に放送の動物番組に対して動物被写体の抽出を試みた。なお、実験には、番組名“ふしぎ大自然「大絶壁をヒヒが登る」”を利用した。なお、番組長は43分である。
再現率=Nb/Ng,適合率=Nb/No
なお、Ngは正解数、Noは提案手法による検出数、Nbは正解のうち本発明手法でも検出できた数を表す。
11 入力装置
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 メモリ装置
16 CPU
17 ネットワーク接続装置
18 記録媒体
21 ブートストラップサンプル生成手段
22 決定木学習手段
23 データ分類手段
24 学習結果データベース
31 選択データ
32 ブートストラップサンプル
41 データ分類システム
41 キーフレーム抽出手段
42 ブロック領域分割手段
43 特徴量抽出手段
44 被写体フレーム判定手段
Claims (6)
- 入力データを予め設定された複数の異なる分類のうち何れか1つに分類分けするデータ分類装置において、
前記入力データに関連する学習データを入力して復元抽出でランダムサンプルすることにより1又は複数のクラスに分類し、分類されたクラスに対して予め設定された数のデータ集合を生成するデータ集合生成手段と、
前記データ集合を生成するデータ集合生成手段により得られる前記データ集合に対して決定木により学習し、前記複数の異なる分類を設定する決定木学習手段と、
前記入力データの入力に対して前記決定木学習手段により得られた学習結果を用いて、前記複数の異なる分類のうち何れか1つに分類分けするデータ分類手段とを有し、
前記データ集合生成手段は、前記分類されたクラスに対して等確率でランダムにデータを抽出し、データを抽出する数が予め設定された数を超えた場合に、抽出されたデータを用いてデータ集合を生成することを特徴とするデータ分類装置。 - 前記データ集合生成手段は、
前記分類されたクラスの中から1つのクラスをランダムに選択し、選択したクラスに対してランダムにデータを抽出し、データを抽出する数が予め設定された数を超えた場合に、抽出されたデータを用いてデータ集合を生成することを特徴とする請求項1に記載のデータ分類装置。 - 前記データ集合生成手段は、
前記分類されたクラスの中から1つのクラスをランダムに選択する処理を所定回数行うことを特徴とする請求項2に記載のデータ分類装置。 - 前記データ集合生成手段は、
前記分類されたクラスの全てに対してランダムにデータを抽出し、データを抽出する数が予め設定された数を超えた場合に、抽出されたデータを用いてデータ集合を生成することを特徴とする請求項1に記載のデータ分類装置。 - 前記入力データが映像である場合、入力される映像信号からショット境界を検出し、各ショットの中間位置にあるフレームをキーフレームとして抽出するキーフレーム抽出手段と、
前記キーフレーム抽出手段により抽出されたキーフレームを1又は複数のブロック領域に分割するデータブロック領域分類手段と、
前記データブロック領域分類手段により分割されたブロック領域毎に各領域に対して予め設定された各種画像特徴量を算出する特徴量抽出手段と、
前記特徴量抽出手段により得られる各種画像特徴量に基づいて、前記データ分類手段により前記学習結果を用いて前記複数の異なる分類のうち何れか1つに分類分けされた前記ブロック領域の分類結果を統合し、統合したフレームに被写体が映っているかの判定を行う被写体フレーム判定手段とを有することを特徴とする請求項1乃至4の何れか1項に記載のデータ分類装置。 - 入力データを予め設定された複数の異なる分類のうち何れか1つに分類分けするデータ分類処理をコンピュータに実行させるためのデータ分類プログラムにおいて、
コンピュータを、
前記入力データに関連する学習データを入力して復元抽出でランダムサンプルすることにより1又は複数のクラスに分類し、分類されたクラスに対して予め設定された数のデータ集合を生成するデータ集合生成手段、
前記データ集合を生成するデータ集合生成手段により得られる前記データ集合に対して決定木により学習し、前記複数の異なる分類を設定する決定木学習手段、及び、
前記入力データの入力に対して前記決定木学習手段により得られた学習結果を用いて、前記複数の異なる分類のうち何れか1つに分類分けするデータ分類手段として機能させ、
前記データ集合生成手段は、前記分類されたクラスに対して等確率でランダムにデータを抽出し、データを抽出する数が予め設定された数を超えた場合に、抽出されたデータを用いてデータ集合を生成することを特徴とするデータ分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008209473A JP5243888B2 (ja) | 2008-08-18 | 2008-08-18 | データ分類装置及びデータ分類プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008209473A JP5243888B2 (ja) | 2008-08-18 | 2008-08-18 | データ分類装置及びデータ分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010044674A JP2010044674A (ja) | 2010-02-25 |
JP5243888B2 true JP5243888B2 (ja) | 2013-07-24 |
Family
ID=42015994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008209473A Expired - Fee Related JP5243888B2 (ja) | 2008-08-18 | 2008-08-18 | データ分類装置及びデータ分類プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5243888B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5537285B2 (ja) * | 2010-06-28 | 2014-07-02 | 日本放送協会 | 要約映像生成装置及び要約映像生成プログラム |
JP5521881B2 (ja) * | 2010-08-12 | 2014-06-18 | 富士ゼロックス株式会社 | 画像識別情報付与プログラム及び画像識別情報付与装置 |
JP5953151B2 (ja) * | 2012-07-13 | 2016-07-20 | 日本放送協会 | 学習装置、及びプログラム |
JP6075279B2 (ja) * | 2013-12-12 | 2017-02-08 | 日本電信電話株式会社 | データ分析装置、方法およびプログラム |
JP6680707B2 (ja) * | 2017-02-22 | 2020-04-15 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US11354601B2 (en) | 2018-03-16 | 2022-06-07 | Ricoh Company, Ltd. | Learning classification device and learning classification method |
US11250346B2 (en) * | 2018-09-10 | 2022-02-15 | Google Llc | Rejecting biased data using a machine learning model |
US11392852B2 (en) * | 2018-09-10 | 2022-07-19 | Google Llc | Rejecting biased data using a machine learning model |
CN110717509B (zh) * | 2019-09-03 | 2024-04-05 | 中国平安人寿保险股份有限公司 | 基于树分裂算法的数据样本分析方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232884A (ja) * | 1996-11-29 | 1998-09-02 | Media Rinku Syst:Kk | 映像ソフトウェア処理方法及び映像ソフトウェア処理装置 |
JP3802964B2 (ja) * | 1997-03-31 | 2006-08-02 | 日本放送協会 | 映像編集システムおよび動画像分割方法 |
JP5211486B2 (ja) * | 2007-01-19 | 2013-06-12 | 日本電気株式会社 | 化合物の仮想スクリーニング方法及び装置 |
-
2008
- 2008-08-18 JP JP2008209473A patent/JP5243888B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010044674A (ja) | 2010-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5243888B2 (ja) | データ分類装置及びデータ分類プログラム | |
Raghuveera et al. | A depth-based Indian sign language recognition using microsoft kinect | |
JP5202148B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
US8452108B2 (en) | Systems and methods for image recognition using graph-based pattern matching | |
US10949702B2 (en) | System and a method for semantic level image retrieval | |
US20020165839A1 (en) | Segmentation and construction of segmentation classifiers | |
Lasseck | Large-scale Identification of Birds in Audio Recordings. | |
CN111326139B (zh) | 一种语种识别方法、装置、设备及存储介质 | |
JP5214679B2 (ja) | 学習装置、方法及びプログラム | |
CN113222062A (zh) | 烟叶分类的方法、装置和计算机可读取介质 | |
Saleem et al. | Hybrid Trainable System for Writer Identification of Arabic Handwriting. | |
JP2013117861A (ja) | 学習装置、学習方法およびプログラム | |
CN110516638A (zh) | 一种基于轨迹和随机森林的手语识别方法 | |
Agranat | Bat species identification from zero crossing and full spectrum echolocation calls using Hidden Markov Models, Fisher scores, unsupervised clustering and balanced winnow pairwise classifiers | |
Sadak et al. | Dynamic and static feature fusion for increased accuracy in signature verification | |
Amid et al. | Unsupervised feature extraction for multimedia event detection and ranking using audio content | |
JP2004178569A (ja) | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 | |
JP4219539B2 (ja) | 音響分類装置 | |
Lakshmi et al. | A new hybrid algorithm for Telugu word retrieval and recognition | |
Bouibed et al. | Evaluation of gradient descriptors and dissimilarity learning for writer retrieval | |
Kalkan et al. | Online feature selection and classification | |
CN115705688A (zh) | 基于人工智能的古代及近现代艺术品鉴定方法和系统 | |
JP6397439B2 (ja) | 属性推定装置 | |
CN116994099B (zh) | 特征解耦的少量样本预训练模型鲁棒性微调方法及装置 | |
Mehta et al. | Optical music notes recognition for printed piano music score sheet |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130405 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5243888 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |