JP2014115737A - 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム - Google Patents

画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2014115737A
JP2014115737A JP2012267627A JP2012267627A JP2014115737A JP 2014115737 A JP2014115737 A JP 2014115737A JP 2012267627 A JP2012267627 A JP 2012267627A JP 2012267627 A JP2012267627 A JP 2012267627A JP 2014115737 A JP2014115737 A JP 2014115737A
Authority
JP
Japan
Prior art keywords
image
learning
topic
image dictionary
topic model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012267627A
Other languages
English (en)
Other versions
JP5870014B2 (ja
Inventor
Yongqing Sun
泳青 孫
Kyoko Sudo
恭子 数藤
Yukinobu Taniguchi
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012267627A priority Critical patent/JP5870014B2/ja
Publication of JP2014115737A publication Critical patent/JP2014115737A/ja
Application granted granted Critical
Publication of JP5870014B2 publication Critical patent/JP5870014B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】画像辞書の精度を向上させること。
【解決手段】複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出し、特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる特徴量に基づいてトピックモデルを生成し、トピックモデルと学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付けし、トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを意味ラベルの画像辞書として取得する。
【選択図】図1

Description

本発明は、画像辞書を生成する技術に関する。
従来の画像辞書生成方法として次のような方法がある。
まず、ある意味ラベルに関する画像を学習データとして収集する。次に、学習データから色や形状などの特徴量を抽出する。最後に、機械学習手法を用いて、識別モデルを構築する。以上の処理により、学習データから求めた識別モデルを、任意の意味ラベルの画像辞書として生成することができる。(非特許文献1参照)
Yongqing Sun, Satoshi Shimada, Masashi Morimoto, "Visual pattern discovery using web images", ACM MIR workshop , 2006
しがしながら、上記の非特許文献1に示す画像辞書生成方法には、以下の問題がある。
意味ラベルが、画像における複数の要素(以下、「トピック」という。)の組み合わせで構成されることがある。例えば、“ビーチ”という意味ラベルは、“海”、“太陽”、“砂”、“人”などの複数のトピックの組み合わせで構成される。ところが、画像全体から抽出された一つの特徴量(例えば色や形状のヒストグラム)は、複数のトピックと意味ラベルとの対応関係を明確に規定できない。そのため、画像全体から抽出された一つの特徴量を用いる非特許文献1の方法では、画像辞書の精度が低くなってしまうという問題がある。
上記事情に鑑み、本発明は、画像辞書の精度を向上させることを可能とする技術の提供を目的としている。
本発明の一態様は、複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出する特徴量抽出部と、前記特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる前記特徴量に基づいてトピックモデルを生成するトピックモデル生成部と、前記トピックモデルと前記学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付ける学習画像対応付け部と、前記トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを前記意味ラベルの画像辞書として取得する画像辞書生成部と、を備える画像辞書生成装置である。
本発明の一態様は、上記の画像辞書生成装置であって、前記画像辞書生成部は、前記複数の意味ラベルのうち処理の対象となっている意味ラベルについて、前記意味ラベルに対応付けられており且つトピックモデルに対応付けられた前記学習画像をトピックラベル毎に取得し、取得された学習画像に基づいてトピックモデル毎に識別器を生成し、生成された複数の識別器の組み合わせを、前記処理の対象となっている意味ラベルの画像辞書として取得する。
本発明の一態様は、複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出する特徴量抽出ステップと、前記特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる前記特徴量に基づいてトピックモデルを生成するトピックモデル生成ステップと、前記トピックモデルと前記学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付ける学習画像対応付けステップと、前記トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを前記意味ラベルの画像辞書として取得する画像辞書生成ステップと、を有する画像辞書生成方法である。
本発明の一態様は、コンピュータを上記の画像辞書生成装置として機能させるためのコンピュータプログラムである。
本発明により、画像辞書の精度を向上させることが可能となる。
画像辞書生成装置10の構成を示す概略ブロック図である。 画像辞書生成装置10の処理の具体例を示すフローチャートである。 学習画像対応付け部5が学習画像をトピックに対応付ける処理の具体例を示すフローチャートである。 画像辞書生成部6が画像辞書を生成する処理の具体例を示すフローチャートである。 画像辞書生成装置10によって生成された画像辞書を用いて、画像や映像に意味ラベルを付与する処理の具体例を表すフローチャートである。 画像辞書を用いて画像や映像に意味ラベルを付与する処理の概略を表す概略図である。
本発明における画像辞書生成装置の一実施例の詳細について説明する。
図1は、画像辞書生成装置10の構成を示す概略ブロック図である。画像辞書生成装置10は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、画像辞書生成プログラムを実行する。画像辞書生成装置10は、画像辞書生成プログラムの実行によって、蓄積部1、学習画像群収集部2、特徴量抽出部3、トピックモデル生成部4、学習画像対応付け部5及び画像辞書生成部6を備える装置として機能する。なお、画像辞書生成装置10の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されても良い。画像辞書生成プログラムは、コンピュータ読み取り可能な記録媒体に記録されても良い。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。
蓄積部1は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。蓄積部1は、事前に用意された学習画像を意味ラベル毎に蓄積する。学習画像と意味ラベルとの対応付けは、どのような処理によって行われても良い。例えば、人の手によって意味ラベルに学習画像が対応付けされても良い。例えば、Web上に存在する画像及びタグを、対応付けられた学習画像及び意味ラベルとして取得しても良い。蓄積部1は、学習画像群収集部2から意味ラベルの指定を受けると、指定された意味ラベルに対応付けられた複数の学習画像を学習画像群収集部2に対して出力する。
学習画像群収集部2は、蓄積部1に対して意味ラベルの指定を出力することによって、蓄積部1に格納された学習画像を受け取る。学習画像群収集部2は、受け取った複数の学習画像(以下、「学習画像群」という。)を特徴量抽出部3へ出力する。学習画像群には、各学習画像の意味ラベルに関する情報(以下、「意味ラベル情報」という。)も含まれる。
特徴量抽出部3は、学習画像群収集部2から意味ラベルに関する学習画像群を受け取る。特徴量抽出部3は、受け取った学習画像群に含まれる個々の学習画像について、特徴量を抽出する。特徴量抽出部3は、例えば、色ヒストグラムや模様ヒストグラムなどの特徴量(物理特徴量)を抽出しても良い。特徴量抽出部3は、学習画像を分割し、各領域から特徴量を抽出しても良い。特徴量抽出部3は、学習画像からSIFT特徴点を抽出し、SIFTなどの局所特徴量を抽出しても良い。特徴量抽出部3は、抽出された特徴量をトピックモデル生成部4へ出力する。
トピックモデル生成部4は、特徴量抽出部3によって抽出された複数の特徴量を受け取る。トピックモデル生成部4は、受け取った複数の特徴量についてクラスタリング処理を行い、複数のクラスタを生成する。生成された各クラスタが一つのトピックに対応する。また、各クラスタを表すパラメータがトピックモデルである。例えば、クラスタリング処理は、k-means法、LDA(Latent Dirichlet Allocation)法などを用いて実行されても良い。k-means法が用いられた場合、トピックモデルはトピックに属する複数の特徴量(以下、「特徴量群」という。)の平均値である。LDA法が用いられた場合、トピックモデルは、トピックに属する特徴量群のDirichlet分布を表すgamma matrixである。
クラスタリング処理では、特徴量から算出される画像類似度が近い画像群が、一つのクラスタ(トピック)として出力される。物理特徴量が用いられる場合、学習画像群における色及び模様の組み合わせ(例えば、赤と丸、緑と三角、青と楕円などの組み合わせ)に対応付けられたトピックモデルが生成される。領域特徴量やSIFTが特徴量として用いられる場合、学習画像群における実世界のオブジェクト(顔、手、車、海など)に対応付けられたトピックモデルが生成される。
トピックモデル生成部4は、生成されたトピックモデルを蓄積部1に格納する。また、トピックモデル生成部4は、生成されたトピックモデルを学習画像対応付け部5へ出力する。
学習画像対応付け部5は、トピックモデル生成部4から、生成された複数のトピックモデルを受け取る。学習画像対応付け部5は、学習画像群における各学習画像とトピックモデルとの類似度を算出することで、各学習画像をトピックに対応付ける。学習画像対応付け部5は、トピックと学習画像との対応関係を画像辞書生成部6へ出力する。
画像辞書生成部6は、学習画像対応付け部5からトピック毎の学習画像を受け取る。画像辞書生成部6は、画像辞書を生成しようとしている意味ラベル(以下、「処理対象意味ラベル」という。)に付与された学習画像を収集し、機械学習手法を用いてトピック毎の識別モデルを構築する。そして、画像辞書生成部6は、トピック毎の識別モデルを合わせて、処理対象意味ラベルの画像辞書を生成する。画像辞書生成部6は、生成した画像辞書を蓄積部1に格納する。
図2は、画像辞書生成装置10の処理の具体例を示すフローチャートである。以下、図2を用いて画像辞書生成装置10の処理例について説明する。
まず、学習画像群収集部2が、蓄積部1から、意味ラベルに対応付けられた全ての学習画像(学習画像群)を読み出す(ステップS201)。次に、特徴量抽出部3が、読み出された学習画像群において、学習画像毎に特徴量を抽出する(ステップS202)。次に、トピックモデル生成部4が、抽出された特徴量に対してクラスタリング処理を行う。そして、トピックモデル生成部4が、各クラスタを表すパラメタとしてトピックモデルを生成する(ステップS203)。
次に、学習画像対応付け部5が、トピックモデル生成部4によって生成された複数のトピックモデルに基づいて、学習画像群における各学習画像を各トピックに対応付ける(ステップS204)。
図3は、学習画像対応付け部5が学習画像をトピックに対応付ける処理の具体例を示すフローチャートである。まず、学習画像対応付け部5は、全ての意味ラベルに関する学習画像群(N枚の学習画像を含む:Nは1以上の整数)を読み出す(ステップS301)。次に、学習画像対応付け部5は、ステップS203において生成された複数のトピックモデル(M個とする:Mは2以上の整数)を読み出す(ステップS302)。
次に、学習画像対応付け部5は、変数nに1を代入する(ステップS303)。学習画像対応付け部5は、M個の各トピックモデルとn番目の学習画像との類似度を算出する(ステップS304)。例えばk-means法を用いた場合は以下のような処理によって類似度が算出される。学習画像対応付け部5は、ステップS202において抽出されたn番目の学習画像の特徴量と、各トピックに属する特徴量群の平均値との距離を算出する。学習画像対応付け部5は、算出された距離を、n番目の学習画像と各トピックとの類似度として取り扱う。
次に、学習画像対応付け部5は、学習画像群に含まれる全ての学習画像について類似度の算出が完了したか否か判定する(ステップS305)。具体的には、学習画像対応付け部5は、変数nが学習画像群の枚数Nよりも小さいか否か判定する。変数nがNよりも小さい場合(ステップS305−YES)、学習画像対応付け部5は、変数nをインクリメントしてステップS304の処理に戻る(ステップS307)。一方、変数nがN以上である場合(ステップS305−NO)、学習画像対応付け部5は、各トピックについて、算出された類似度の高い方から順に上位P個(Pは1以上の整数)の学習画像をそのトピックに対応付ける。
以上の処理によって、学習画像が複数のトピックに対応付けられる。例えば、SIFT点や領域特徴量が用いられた場合、意味ラベル“ビーチ”に対応付けられた学習画像が、“太陽”、“人”、“海”のようなトピックに対応付けられる。
図2の説明に戻る。ステップS204の処理の後、画像辞書生成部6は、トピック毎に対応付けられた学習画像に基づいて、意味ラベルに関する画像辞書を生成する(ステップS205)。
図4は、画像辞書生成部6が画像辞書を生成する処理の具体例を示すフローチャートである。まず、画像辞書生成部6が、M個のトピックモデル毎に、各トピックモデルに対応付けられた複数の学習画像を読み込む(ステップS401)。次に、画像辞書生成部6が、変数cに1を代入する(ステップS402)。次に、画像辞書生成部6が、変数mに1を代入する(ステップS403)。
次に、画像辞書生成部6が、m番目のトピックモデルに対応付けられた学習画像の中から、c番目の意味ラベルに付与された学習画像を取得する(ステップS404)。この処理において、画像辞書生成部6は、このような条件に該当する全ての学習画像を取得する。次に、画像辞書生成部6が、取得された学習画像の数が所定の閾値以上であるか否か判定する(ステップS405)。所得された学習画像の数が所定の閾値以上である場合(ステップS405−YES)、画像辞書生成部6が、機械学習手法を用いて、c番目の意味ラベルに関するm番目のトピックの識別器を生成する(ステップS406)。機械学習手法の具体例として、SVM(Support vector machine)がある。識別器を生成する際に用いられる特徴量については、ステップS202において抽出される特徴量が物理的な特徴量(色や模様など)である場合、そのまま特徴量が使用されても良い。ステップS202において抽出される特徴量がSIFT特徴点や領域特徴量の場合、n番目の学習画像におけるm番目のトピックモデルとの類似度が一定の値以上である特徴点や領域特徴量を特徴量として用いれば良い。
ステップS405の処理において、取得された学習画像の数が所定の閾値未満である場合(ステップS405−NO)、又はステップS406の処理の後、画像辞書生成部6が、c番目の意味ラベルに関して、全てのトピックに対してステップS404〜S406の処理が完了したか否か判定する(ステップS407)。処理が完了していないトピックが存在する場合、すなわち変数mがMより小さい場合(ステップS407−YES)、画像辞書生成部6が、mをインクリメントして(ステップS410)、ステップS404の処理に戻る。
一方、ステップS407の処理において、全てのトピックについてステップS404〜S406の処理が完了した場合(ステップS407−NO)、すなわち変数mがM以上である場合、画像辞書生成部6が、各トピックの識別器をc番目の意味ラベルの画像辞書として蓄積部1に格納する(ステップS408)。
次に、画像辞書生成部6が、全ての意味ラベルに対してステップS408の処理が行われたか否か判定する(ステップS409)。ステップS408の処理が行われていない意味ラベルが存在する場合(ステップS409−YES)、すなわち変数cがCよりも小さい場合、画像辞書生成部6が、変数cをインクリメントしてステップS403の処理に戻る。一方、全ての意味ラベルについてステップS408の処理が完了している場合(ステップS409−NO)、すなわち変数cがC以上である場合、画像辞書生成部6は処理を終了する。
図5は、画像辞書生成装置10によって生成された画像辞書を用いて、画像や映像に意味ラベルを付与する処理の具体例を表すフローチャートである。図6は、画像辞書を用いて画像や映像に意味ラベルを付与する処理の概略を表す概略図である。以下、画像辞書を用いて画像や映像に意味ラベルを付与する処理の具体例について説明する。なお、以下の処理は不図示の意味ラベル付与装置によって行われる。
まず、意味ラベル付与装置は、M個のトピックモデルを蓄積部1から取得する(ステップS501)。次に、意味ラベル付与装置は、意味ラベルの付与対象となる画像(例えばJ枚)を読み込む(ステップS502)。次に、意味ラベル付与装置は、変数fjに1を代入する(ステップS503)。次に、意味ラベル付与装置は、fj番目の画像とトピックモデルTm(m=1、・・・、M:m及びMは1以上の整数)との類似度を算出する。意味ラベル付与装置は、所定の閾値以上の類似度が算出されたトピックモデルTmとfj番目の画像とを対応付ける。例えば、図6において、クロス“×”で表示されているトピックモデル(T1及びTm−1)と画像fjとが対応付けられている。
次に、意味ラベル付与装置は、図6の表の列毎に、fjが対応付けられたトピックモデルに関する特徴量とその列にある個々の識別器との類似度とを算出する。そして、意味ラベル付与装置は、意味ラベルCi(i=1,…,L:i及びLは1以上の整数)毎に算出した類似度の組み合わせを、画像fjと意味ラベルCiとの類似度として取得する(ステップS505)。
次に、意味ラベル付与装置は、ステップS505において取得された類似度の高い方から順にP個までの意味ラベルを画像fjに付与する(ステップS506)。次に意味ラベル付与装置は、全ての画像に意味ラベルを付与したか否か判定する(ステップS507)。意味ラベルが付与されていない画像が存在する場合(ステップS507−YES)、すなわち変数fjがJよりも小さい場合、意味ラベル付与装置は変数fjをインクリメントしてステップS504の処理に戻る。一方、意味ラベルが付与されていない画像が存在しない場合(ステップS507−NO)、すなわち変数fjがJ以上である場合、意味ラベル付与装置は処理を終了する。
画像辞書生成装置10では、一つの意味ラベルの画像辞書が複数のトピックの識別器によって構成される。そのため、複数のトピックの組み合わせで構成される意味ラベルについても、精度良く画像辞書を生成することがかのうとなる。
また、画像辞書生成装置10では、全ての意味ラベルに関する学習画像群(様々な意味合いを持つ画像群)に基づいて、全ての意味ラベルに共通したトピックモデルが生成される。そのため、よりバリエーションに長けたトピックモデルを生成することが可能となる。例えば、“ビーチ”という意味ラベルに関する画像群のみから“人”のトピックモデルを生成する場合に比べて、“ビーチ”、“祭り”、“会議”、“野生”、“飲み会”などの豊富な意味ラベルに関する画像群から“人”のトピックモデルを生成した方が、より精度が良く汎用性の高いトピックモデルを生成することが可能となる。
なお、画像辞書の生成に際して機械学習手法が用いられるため、従来は学習データが多くなるにつれて処理時間が多くなるという問題もあった。例えば、非特許文献1のように一つの意味ラベルに対して全ての学習データを用いて一つの識別モデルを算出するような画像辞書生成方法では、学習画像の量に応じて膨大な処理時間を要してしまうという問題があった。このような問題に対し、画像辞書生成装置10では、全ての意味ラベルに対して共通したトピックモデルを生成するため、学習画像の量が増大した場合に処理時間の増大を抑える事が可能となる。
また、意味ラベルが大量に存在する場合や、意味ラベル付与対象となる画像が大量に存在する場合、より効率よく意味ラベルを付与することが可能となる。
<変形例>
図3のフローチャートのステップS306の処理において、学習画像対応付け部5は、類似度に基づいて他の基準でトピックと学習画像との対応付けを行っても良い。例えば、学習画像対応付け部5は、各トピックについて、予め定められた閾値を超える類似度の画像を全てそのトピックに対応付けても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
10…画像辞書生成装置, 1…蓄積部, 2…学習画像群収集部, 3…特徴量抽出部, 4…トピックモデル生成部, 5…学習画像対応付け部, 6…画像辞書生成部

Claims (4)

  1. 複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出する特徴量抽出部と、
    前記特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる前記特徴量に基づいてトピックモデルを生成するトピックモデル生成部と、
    前記トピックモデルと前記学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付ける学習画像対応付け部と、
    前記トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを前記意味ラベルの画像辞書として取得する画像辞書生成部と、
    を備える画像辞書生成装置。
  2. 前記画像辞書生成部は、前記複数の意味ラベルのうち処理の対象となっている意味ラベルについて、前記意味ラベルに対応付けられており且つトピックモデルに対応付けられた前記学習画像をトピックラベル毎に取得し、取得された学習画像に基づいてトピックモデル毎に識別器を生成し、生成された複数の識別器の組み合わせを、前記処理の対象となっている意味ラベルの画像辞書として取得する、請求項1に記載の画像辞書生成装置。
  3. 複数の意味ラベルそれぞれに対応付けられた複数の学習画像について特徴量を抽出する特徴量抽出ステップと、
    前記特徴量をクラスタリングし、クラスタ毎にそのクラスタに含まれる前記特徴量に基づいてトピックモデルを生成するトピックモデル生成ステップと、
    前記トピックモデルと前記学習画像との類似度に基づいて、各トピックモデルに対して複数の学習画像を対応付ける学習画像対応付けステップと、
    前記トピックモデルと複数の学習画像との対応付けに基づいて複数のトピックモデルの識別器を生成し、複数の識別器の組み合わせを前記意味ラベルの画像辞書として取得する画像辞書生成ステップと、
    を有する画像辞書生成方法。
  4. コンピュータを請求項1又は2に記載の画像辞書生成装置として機能させるためのコンピュータプログラム。
JP2012267627A 2012-12-06 2012-12-06 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム Expired - Fee Related JP5870014B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012267627A JP5870014B2 (ja) 2012-12-06 2012-12-06 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012267627A JP5870014B2 (ja) 2012-12-06 2012-12-06 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2014115737A true JP2014115737A (ja) 2014-06-26
JP5870014B2 JP5870014B2 (ja) 2016-02-24

Family

ID=51171695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012267627A Expired - Fee Related JP5870014B2 (ja) 2012-12-06 2012-12-06 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5870014B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005638A (ja) * 2016-07-04 2018-01-11 日本電信電話株式会社 映像認識モデル学習装置、映像認識装置、方法、及びプログラム
CN107657276A (zh) * 2017-09-15 2018-02-02 赤峰学院 一种基于寻找语义类簇的弱监督语义分割方法
CN111427996A (zh) * 2020-03-02 2020-07-17 云知声智能科技股份有限公司 一种人机交互文本中抽取日期时间的方法和装置
JP7470016B2 (ja) 2020-11-10 2024-04-17 株式会社日立製作所 機械学習を用いた物体検出用識別モデル生成装置およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193183A (ja) * 2008-02-13 2009-08-27 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体
JP2009258953A (ja) * 2008-04-16 2009-11-05 Univ Of Electro-Communications 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム
JP2010017274A (ja) * 2008-07-09 2010-01-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2012022419A (ja) * 2010-07-13 2012-02-02 Yahoo Japan Corp 学習データ作成装置、学習データ作成方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193183A (ja) * 2008-02-13 2009-08-27 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体
JP2009258953A (ja) * 2008-04-16 2009-11-05 Univ Of Electro-Communications 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム
JP2010017274A (ja) * 2008-07-09 2010-01-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2012022419A (ja) * 2010-07-13 2012-02-02 Yahoo Japan Corp 学習データ作成装置、学習データ作成方法及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005638A (ja) * 2016-07-04 2018-01-11 日本電信電話株式会社 映像認識モデル学習装置、映像認識装置、方法、及びプログラム
CN107657276A (zh) * 2017-09-15 2018-02-02 赤峰学院 一种基于寻找语义类簇的弱监督语义分割方法
CN111427996A (zh) * 2020-03-02 2020-07-17 云知声智能科技股份有限公司 一种人机交互文本中抽取日期时间的方法和装置
CN111427996B (zh) * 2020-03-02 2023-10-20 云知声智能科技股份有限公司 一种人机交互文本中抽取日期时间的方法和装置
JP7470016B2 (ja) 2020-11-10 2024-04-17 株式会社日立製作所 機械学習を用いた物体検出用識別モデル生成装置およびプログラム

Also Published As

Publication number Publication date
JP5870014B2 (ja) 2016-02-24

Similar Documents

Publication Publication Date Title
Turcot et al. Better matching with fewer features: The selection of useful features in large database recognition problems
Lee et al. Adaboost for text detection in natural scene
WO2012032788A1 (ja) 排他的分類器による一般物体の画像認識装置及び方法
JP2016517291A5 (ja)
Lim et al. Context by region ancestry
Marini et al. Bird species classification based on color features
Lei et al. Saliency-driven image classification method based on histogram mining and image score
JP5870014B2 (ja) 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム
CN108764302A (zh) 一种基于颜色特征和词袋特征的票据图像分类方法
CN103745207A (zh) 一种人脸识别的特征提取方法及装置
CN103995864B (zh) 一种图像检索方法和装置
CN104317946A (zh) 一种基于多张关键图的图像内容检索方法
Khan et al. Scale coding bag-of-words for action recognition
JP2015109024A (ja) 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム
Shekar et al. An unification of inner distance shape context and local binary pattern for shape representation and classification
Ramanathan et al. Quadtree decomposition based extended vector space model for image retrieval
Hao et al. Improved bags-of-words algorithm for scene recognition
Cun-Zhao et al. Multi-scale graph-matching based kernel for character recognition from natural scenes
JP2016081472A (ja) 画像処理装置、画像処理方法及びプログラム
Sahoo et al. Indian sign language recognition using a novel feature extraction technique
Mimaroglu et al. ASOD: Arbitrary shape object detection
Meng et al. A new co-saliency model via pairwise constraint graph matching
Ghildiyal et al. Image-based monument classification using bag-of-word architecture
JP2017215784A (ja) 物体検出装置、方法、及びプログラム
Gupta et al. The semantic multinomial representation of images obtained using dynamic kernel based pseudo-concept SVMs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160108

R150 Certificate of patent or registration of utility model

Ref document number: 5870014

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees