JP6039518B2 - 情報処理装置、情報抽出装置、及びプログラム - Google Patents

情報処理装置、情報抽出装置、及びプログラム Download PDF

Info

Publication number
JP6039518B2
JP6039518B2 JP2013171586A JP2013171586A JP6039518B2 JP 6039518 B2 JP6039518 B2 JP 6039518B2 JP 2013171586 A JP2013171586 A JP 2013171586A JP 2013171586 A JP2013171586 A JP 2013171586A JP 6039518 B2 JP6039518 B2 JP 6039518B2
Authority
JP
Japan
Prior art keywords
image
feature
text
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013171586A
Other languages
English (en)
Other versions
JP2015041225A (ja
Inventor
数藤 恭子
恭子 数藤
島村 潤
潤 島村
行信 谷口
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013171586A priority Critical patent/JP6039518B2/ja
Publication of JP2015041225A publication Critical patent/JP2015041225A/ja
Application granted granted Critical
Publication of JP6039518B2 publication Critical patent/JP6039518B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、画像情報とテキスト情報とを関連付けて処理する情報処理装置、情報抽出装置、及びプログラムに関する。
従来、料理の画像を認識し、画像の特徴に基づいて料理の栄養などを推定する方法(非特許文献1)や、画像の特徴から料理の品目を識別する方法がある(非特許文献2)。非特許文献2の識別方法は複数品目が含まれる画像においても有効である。
ユーザは、上記の方法によって、画像から料理の情報を取得することができる。ユーザは、料理のレシピに関して、専門家が作成したレシピ情報を掲載する料理レシピサイト(非特許文献3〜4)を参照することもできる。
FoodLog:画像による食の記録と解析、相澤清晴、日本色彩学会誌 第36巻 第4号 pp.293-296, 2012. 候補領域推定による食事画像の複数品目認識、松田裕司、甫足創、柳井啓司、情報処理学会研究報告Vol.2011-CVIM-176, No.9,2011. "ホームクッキング〔キッコーマン〕"、[online]、[平成25年8月21日検索]、インターネット〈URL:http://www.kikkoman.co.jp/homecook/〉 "レシピ レシピ大百科〔AJINOMOTO PARK〕"、[online]、[平成25年8月21日検索]、インターネット〈URL:http://park.ajinomoto.co.jp/〉
しかし、上記の情報取得方法には、次のような問題点が生じていた。
非特許文献1の方法を利用するためには、予め、人手で画像に栄養素などの正解情報を与える必要があり、学習データを用意する手間を要することが問題である。また、必ずしも画像の見た目と栄養素の相関が高くない場合があった。
また、非特許文献2の方法は、「オムライス」や「カレー」などのような通有性を有する料理名によってカテゴリ分類可能な料理画像については比較的有効であるが、昨今の料理レシピサイトに多く掲載される、叙述によって特定される料理名にはあまり有効でなかった。
叙述によって特定される料理名とは「えびとヤングコーンの炒めもの」「トマトとチンゲン菜のスープ」「ベーコンとほうれんそうのキッシュ」「舌びらめのムニエルのサフランライス添え」「海の幸のクリームシチュー」などである。
このような叙述によって特定される料理名を持つ料理品目においては、同一の調理形態でも材料が異なるバリエーションが多く存在し、有効な画像の特徴である色特徴が料理品目毎に大きく異なる。そのため、上記の従来技術では、画像の特徴に基づく料理品目の識別精度が必ずしも良好ではなかった。
このような理由から、画像と関連付けられたテキスト情報を用いて、人手を要しない学習機能によってより多くのデータ量を蓄積し、より共起性の高いテキスト情報を画像に関連付けることのできるモデルが求められていた。
上記事情に鑑み、本発明は、学習データにおける画像と関連付けられたテキスト情報を用いて、より共起性の高いテキスト情報を画像に関連付けるモデルを提供する情報処理装置、情報抽出装置、及びプログラムを提供することにある。
本発明の一態様は、学習データとして入力された第1画像データ及び当該第1画像データに関連するテキストデータに基づいた学習処理を行う情報処理装置であって、前記第1画像データの画像特徴を示す第1画像特徴量を抽出する第1画像特徴抽出部と、形態素解析処理によって前記テキストデータに含まれる名詞または名詞接尾辞を抽出し、当該名詞または名詞接尾辞の登場頻度に基づいてテキスト特徴量を抽出するテキスト特徴抽出部と、学習処理によって前記第1画像特徴量と前記テキスト特徴量との組を複数のクラスに分類するクラスタリング部と、前記第1画像特徴量と前記テキスト特徴量とを基に当該テキスト特徴量が属する前記クラスに対応するテキスト情報を特定する特徴生成モデルを生成する特徴生成モデル抽出部とを備える情報処理装置である。
また、本発明の一態様においては、前記第1画像データの一部を切り出す画像切り出し部を更に備え、前記第1画像特徴抽出部は、前記画像切り出し部が切り出した画像データの画像特徴を示す第1画像特徴量を抽出する。
また、本発明の一態様においては、前記第1画像特徴量を基に前記クラスを識別する代表ベクトルを生成する代表ベクトル抽出部と、前記代表ベクトルと前記特徴生成モデルとを組にして生成する生成部とを更に備える。
また、本発明の一態様は、上記の情報処理装置によって生成された前記代表ベクトルと前記特徴生成モデルとの組からテキスト情報を抽出する情報抽出装置であって、入力された第2画像データの第2画像特徴量を抽出する第2画像特徴抽出部と、前記第2画像特徴量に対応する画像ベクトルを、前記代表ベクトルと比較することにより、一の代表ベクトルと組をなす特徴生成モデルを識別する識別部とを備える情報抽出装置である。
また、本発明の一態様においては、前記識別部は、識別した特徴生成モデルが特定するテキスト情報に基づいて、データベース装置に記憶された情報を抽出する。
また、本発明の一態様は、上記の情報処理装置によって生成された前記特徴生成モデルからテキスト情報を抽出する情報抽出装置であって、入力された第2画像データの第2画像特徴量を抽出する第2画像特徴抽出部と、前記第2画像特徴量に対応する画像ベクトルが前記特徴生成モデルから生成される尤度を計算し、最も高い尤度に対応するクラスを特定し、当該クラスに対応するテキスト情報を抽出する識別部とを備える情報抽出装置である。
また、本発明の一態様は、コンピュータを、上記の情報処理装置における各部、又は、上記の情報抽出装置における各部として機能させるためのプログラムである。
本発明によれば、学習データにおける画像と関連付けられたテキスト情報を用いて、より共起性の高いテキスト情報を画像に関連付けるモデルを提供することが可能となる。
本発明の一実施形態による情報処理装置の構成を示す機能ブロック図である。 本発明の一実施形態による情報抽出装置の構成を示す機能ブロック図である。 情報処理装置のテキスト特徴抽出部が、テキストデータを形態素解析したテキストの例を示す図である。 情報処理装置のクラスタリング部が用いるトピックモデルの例を示す図である。 情報処理装置の学習部におけるクラスタリングと特徴生成モデルとのイメージを示す図である。
〔1.情報処理装置〕
以下、図面を参照して、本発明の一実施形態による情報処理装置を説明する。
図1は、情報処理装置100の構成を示す機能ブロック図である。
情報処理装置100は、料理レシピサイトのデータのようなテキストデータT1を料理画像I1とともにカテゴリ学習の対象として入力することにより、料理画像に関連付けたテキスト情報またはテキストに関連する情報をモデル・パラメータ・代表ベクトル・特徴生成モデル記憶部500(以下、単に「記憶部500」と記載する)に記憶させる。
情報処理装置100は、画像切り出し部110、特徴ベクトル抽出部120、学習部130を備えている。学習部130の出力データは、記憶部500に出力されて記憶される。記憶部500は、情報処理装置100の内部に備えられてもよい。情報処理装置100の学習データは、画像データI1と、画像データI1に関連付けられたテキストデータT1とを含む。
画像切り出し部110は、学習データとして入力された画像データI1から解析対象画像部分(この実施形態では背景を除いた料理の撮像部分)を切り出す。画像データI1から解析対象画像部分を切り出すには、円検出、サリエンシー領域の抽出など、任意の切り出し方法を組み合わせればよい。画像切り出し部110は、切り出し画像を特徴ベクトル抽出部120に送信する。画像切り出し部110は、画像データI1を切り取らずにそのまま特徴ベクトル抽出部120に送信してもよい。また、解析対象画像部分を更に小領域に分割して特徴ベクトル抽出部120に送信してもよい。
特徴ベクトル抽出部120は、テキストデータT1から所定のテキスト特徴を抽出するテキスト特徴抽出部120aと、画像切り出し部110が出力した画像データから所定の画像特徴を抽出する画像特徴抽出部120bとを備える。
テキスト特徴抽出部120aのテキスト特徴抽出手法については後述する。
画像特徴抽出部120bは、画像切り出し部110が出力した画像データにおいて料理画像の見た目の属性に関わる特徴量を抽出する。例えば、特徴量として、SIFT(Scale-Invariant Feature Transform)などの局所特徴量、勾配特徴や周波数特徴などテクスチャや輝度勾配に基づく特徴量、色ヒストグラム(RGB、Lab、HSV)やカラーSIFTなど色や形の特徴に基づく特徴量、さらに、これら特徴量を学習画像集合から抽出してクラスタリングしたビジュアルワード(Visual Words)でヒストグラムのビン(bin)を構成しなおしたものを抽出する。画像特徴抽出部120bが、スケールや回転によらない形の特徴や色の特徴を抽出すれば、後述の学習処理や識別処理を安定したものとすることができる。画像特徴抽出部120bは、抽出した特徴量を特徴ベクトルとして学習部130に出力する。
テキスト特徴抽出部120aは、テキストデータT1に含まれる料理名やレシピから単語をタグとして抽出する。例えば、形態素解析をして名詞、名詞接尾辞に注目することでより効果的に自動的にタグを抽出することができる。とりわけ料理名を解析した場合、その中に含まれる名詞と名詞接尾辞は概ね材料名や調理法名になっている。名詞と名詞接尾辞とを解析することにより、材料名や調理法の情報を効果的に抽出できることが、料理名やレシピなど料理関連情報の特徴である。
ただし、テキストデータT1に含まれるレシピ(材料リストや作り方)を解析する場合、レシピには調理器具や調味料や時間など料理の特徴と無関係な不要単語が頻出するため、これら不要単語のリストを予め別に用意しておき、これら不要単語を除いてからタグを抽出するとよい。
テキスト特徴抽出部120aは、テキストデータT1から抽出した単語から頻度の高い単語を選択する。テキスト特徴抽出部120aは、選択した単語をビン(bin)として、テキストに含まれるか含まれないかを、1(含まれる)又は0(含まれない)の数字で表現することで特徴ベクトルとする。ビン(bin)に対応する単語群の情報は、学習時および識別時に必要となるため、学習部130に出力する。学習部130に出力された上記の情報は、特徴生成モデルの一部として記憶部500に記憶される。
テキスト特徴抽出部120a及び画像特徴抽出部120bにおいては、画像データI1(またはその切り出し画像)やテキストデータT1の特徴量を得たのちに特徴量を連結して特徴ベクトルとしてもよいし、クラスタリングによって量子化してから並べたものを特徴ベクトルとしてもよいし、上記の特徴量を連結した新たな特徴量としてからクラスタリングによって量子化して特徴ベクトルとしてもよい。
学習部130は、クラスタリング部130aと代表ベクトル抽出部130bと特徴生成モデル抽出部130cとを備える。学習部130は、特徴ベクトル抽出部120で得られた特徴ベクトル群のモデルを学習する。
クラスタリング部130aは、教師なしクラスタリングを行う。クラスタリング部130aは、特徴ベクトル抽出部120で得られた特徴ベクトル群をトピックモデル分析によって複数のトピックに割り当てる。特徴ベクトル抽出部120で得られた特徴ベクトル群は、画像データI1(またはその切り出し画像)の画像特徴とテキストデータT1のタグから成るテキスト特徴とから生成されている。
クラスタリング部130aは、上記の特徴ベクトル群が生成されやすいカテゴリ名(例えば料理カテゴリ)をトピックと考えてトピックモデルにあてはめて推定することで、画像特徴とテキスト特徴の共起性に注目したモデルを推定する。
クラスタリング部130aによるクラスタリングは、上記のトピックモデル分析による手法に限られるものではない。
例えば、クラスタリング部130aは、k−平均法などによって単純にクラスタリングしてもよい。また、クラスタリング部130aは、多クラスのSVM(Support vector machine)によって識別モデルを生成してもよい。
代表ベクトル抽出部130bは、後の識別時に用いる代表ベクトルを生成する。代表ベクトル抽出部130bは、クラスタリング部130aでクラスタリングしたクラスごとに代表ベクトルを求めて出力する。例えば、代表ベクトルとしては、各クラスタに属するサンプルに対応する画像特徴抽出部120bで得られた画像特徴ベクトル群の平均ベクトルを用いる。代表ベクトルは単一であっても複数であってもよい。SVMによって識別モデルを生成した場合には、サポートベクタやSVMのパラメータを代表ベクトルとする。なお、代表ベクトル抽出部130bを備えるか否かは任意である。学習部130をクラスタリング部130aと特徴生成モデル抽出部130cとのみを備える形で構成することも可能である。
特徴生成モデル抽出部130cは、各クラスタに属するサンプルに対応する、テキスト特徴抽出部120aで得られたテキストデータの特徴ベクトル群から、そのクラスタにおいて発生しやすいテキストを推定し、発生しやすさの確率モデルを特徴生成モデルとして出力する。
学習部130は、クラスタリング部130aが出力したモデルのパラメータ、代表ベクトル抽出部130bが出力した代表ベクトル、特徴生成モデル抽出部130cが出力した特徴生成モデルを記憶部500に出力する。この際、学習部130は、代表ベクトルと特徴生成モデルとを組にして生成する。記憶部500は、これらデータを記憶する。
〔2.情報抽出装置〕
以下、図面を参照して、本発明の一実施形態による情報抽出装置を説明する。
情報抽出装置200は、情報処理装置100により記憶部500に記憶された情報に基づいて、所定の画像データI2に関連するテキスト情報を抽出する装置である。
図2(a)は、情報抽出装置200の構成を示す機能ブロック図である。情報抽出装置200は、画像切り出し部210、特徴ベクトル抽出部220、識別部230を備えている。識別部230は、記憶部500と接続されている。
画像切り出し部210は、入力された画像データI2から解析対象画像部分(この実施形態では背景を除いた料理の撮像部分)を切り出す。画像データI2から解析対象画像部分を切り出すには、円検出、サリエンシー領域の抽出など、任意の切り出し方法を組み合わせればよい。画像切り出し部210は、切り出し画像を特徴ベクトル抽出部220に送信する。画像切り出し部210は、画像データI2を切り取らずにそのまま特徴ベクトル抽出部220に送信してもよい。
特徴ベクトル抽出部220は、所定のテキスト特徴を抽出するテキスト特徴抽出部220aと、画像切り出し部210が出力した画像データから所定の画像特徴を抽出する画像特徴抽出部220bとを備える。
画像特徴抽出部220bは、情報処理装置100の画像特徴抽出部120bと同一の手法によって、画像切り出し部210が出力した画像データの特徴量を示す特徴ベクトルを生成して識別部230に出力する。
識別部230は、画像特徴抽出部220bが出力した特徴ベクトルを、記憶部500に記憶された代表ベクトルと比較し、両ベクトルのベクトル間距離を算出することによって代表ベクトルと最も近いクラス(類似する料理のカテゴリ)を推定する。
または、クラスタリング部130aが出力したモデルがトピックモデル等の確率モデルの場合、その確率モデルによって画像特徴抽出部220bが出力した特徴ベクトルから、これに含まれるトピック分布を推定し、それに基づいて尤度を最大化するテキストを推定する。すなわち、識別部230は、入力された画像データの画像特徴量に対応する画像ベクトルが特徴生成モデルから生成される尤度を計算し、最も高い尤度に対応するクラスを特定し、そのクラスに対応するテキスト情報を抽出する。識別部230は、上記のクラスの特徴生成モデルによって、画像データI2の画像と関連付けられたテキスト情報(例えば、単語やその組み合わせ)を生成する。
前述のテキスト特徴について補足すれば、名詞は主に料理の材料名、名詞接尾辞は主に料理の調理法と対応することが多いため、これらを分けてテキスト特徴としてもよい。その場合、例えば発生確率が上位2位の名詞として例えば「N1」及び「N2」を選択し、発生確率が上位1位の名詞接尾辞「C1」を選択することで、「N1とN2とのC1」のように料理名を疑似的に推測することができる。
また、図2(b)に示すように、情報抽出装置200の識別部230は、記憶部500に加えて料理名データベース600と接続されてもよい。料理名データベースには、料理名情報、レシピ情報、栄養情報などが多数蓄積されている。
図2(b)の構成の場合、識別部230は、画像データI2の画像と関連付けられたテキスト情報(例えば、単語やその組み合わせ)に基づいて、料理名データベース600の蓄積情報を参照する。
例えば、識別部230は、料理名データベース600の料理名情報を参照し、上記テキスト情報と少なくとも部分的に一致する料理名が存在すれば、その料理に関する情報を任意に抽出することができる。これにより、情報抽出装置200は、画像データI2の画像に関する料理名情報を抽出したり、レシピ情報を抽出したりすることができる。
〔3.データ例〕
図3は、情報処理装置100のテキスト特徴抽出部120aが、テキストデータT1を形態素解析したテキストの例を示す図である。
テキストデータT1として「いかと白菜の煮物」を入力した場合、テキスト特徴抽出部120aは、「イカ」「ハクサイ」「ニモノ」という名詞、「ト」「ノ」という格助詞を抽出する。
また、テキストデータT1として「キムチ鍋」を入力した場合、テキスト特徴抽出部120aは、「キムチ」という名詞、「ナベ」という名詞接尾辞を抽出する。
また、テキストデータT1として「たことチンゲン菜のにんにく炒め」を入力した場合、テキスト特徴抽出部120aは、「タコ」「チンゲンサイ」「ニンニク」という名詞、「イタメ」という名詞接尾辞を生成する。
これらの例から、料理関連情報を含むテキストデータT1においては、名詞および名詞接尾辞が材料名や調理法になっていることがわかる。
図4は、情報処理装置100のクラスタリング部130aが用いるトピックモデルの例を示す図である。図4においては、「word」が特徴ベクトルを示し、「topic」が推定される料理のカテゴリを示している。α、θ、βは推定されるパラメータである。ワードのトピックはトピック分布θに従って発生する。ワードのトピックからはパラメータβに従ってワードが生成される。βはこのトピックとワードのパラメータ組み合わせ、すなわちトピックごとのワードの生成確率のマトリクスである。θが料理のカテゴリの分布、トピックは個々のレシピのトピック、ワードはそのレシピに含まれる画像とテキストの特徴ベクトルとしてモデルにあてはめ、パラメータを推定する。パラメータαはトピック分布θをディリクレ分布に従って生成する際のパラメータであり、適用するユースケースにおいてどのようなカテゴリの料理が多いかというイメージに相当する。
図5は、情報処理装置100の学習部130におけるクラスタリングと特徴生成モデルとのイメージを示す図である。
図5(a)は、画像特徴空間において、5つのトピック「topic1」「topic2」「topic3」「topic4」「topic5」が分布している様子を示すグラフである。なお、各トピックの示す領域は、必ずしも分離されているとは限らない。
図5(b)は、「野菜」「ソース」「エビ」「ニワトリ」「豚肉」「牛肉」「キノコ」の名詞について、各トピックの「topic1」「topic2」「topic3」「topic4」「topic5」にどの程度当てはまっているかを示すグラフである。
上記の情報処理装置100によれば、学習データにおける画像と関連付けられたテキスト情報を用いて、より共起性の高いテキスト情報を画像に関連付けるモデルを提供することが可能となる。
また、上記の情報抽出装置200によれば、情報処理装置100によって提供されたモデルに基づいて、所定の画像から、より共起性の高いテキスト情報またはその関連情報を抽出することが可能となる。例えば、情報抽出装置200によれば、所定の料理の画像に基づいて、料理名情報、レシピ情報、栄養情報などを適宜抽出することができる。
また、図1又は図2の各機能ブロックを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計も含まれる。なお、当然ながら、上述した実施の形態および複数の変形例は、その内容が相反しない範囲で組み合わせることができる。また、上述した実施の形態および変形例では、各部の構造などを具体的に説明したが、その構造などは本願発明を満足する範囲で各種に変更することができる。
100…情報処理装置, 110…画像切り出し部, 120…特徴ベクトル抽出部, 120a…テキスト特徴抽出部, 120b…画像特徴抽出部, 130…学習部, 130a…クラスタリング部, 130b…代表ベクトル抽出部, 130c…特徴生成モデル抽出部, 200…情報抽出装置, 210…画像切り出し部, 220…特徴ベクトル抽出部, 220a…テキスト特徴抽出部, 220b…画像特徴抽出部, 230…識別部, 500…モデル・パラメータ・代表ベクトル・特徴生成モデル記憶部, 600…料理名データベース

Claims (5)

  1. 学習データとして入力された第1画像データ及び当該第1画像データに関連するテキストデータに基づいた学習処理を行う情報処理装置であって、
    前記第1画像データの画像特徴を示す第1画像特徴量を抽出する第1画像特徴抽出部と、
    形態素解析処理によって前記テキストデータに含まれる名詞または名詞接尾辞を抽出し、当該名詞または名詞接尾辞の登場頻度に基づいてテキスト特徴量を抽出するテキスト特徴抽出部と、
    前記第1画像特徴量と前記テキスト特徴量とを連結し、連結した前記第1画像特徴量及び前記テキスト特徴量を学習処理によって数のクラスに分類するクラスタリング部と、
    前記第1画像特徴量と前記テキスト特徴量とを基に当該テキスト特徴量が属する前記クラスに対応するテキスト情報を特定する特徴生成モデルを生成する特徴生成モデル抽出部とを備える情報処理装置。
  2. 前記第1画像特徴量を基に前記クラスを識別する代表ベクトルを生成する代表ベクトル抽出部と、
    前記代表ベクトルと前記特徴生成モデルとを組にして生成する生成部とを更に備える請求項1記載の情報処理装置。
  3. 請求項に記載の情報処理装置によって生成された前記代表ベクトルと前記特徴生成モデルとの組からテキスト情報を抽出する情報抽出装置であって、
    入力された第2画像データの第2画像特徴量を抽出する第2画像特徴抽出部と、
    前記第2画像特徴量に対応する画像ベクトルを、前記代表ベクトルと比較することにより、一の代表ベクトルと組をなす特徴生成モデルを識別する識別部とを備える情報抽出装置。
  4. 学習データとして入力された第1画像データ及び当該第1画像データに関連するテキストデータに基づいた学習処理を行う情報処理装置であって、前記第1画像データの画像特徴を示す第1画像特徴量を抽出する第1画像特徴抽出部と、形態素解析処理によって前記テキストデータに含まれる名詞または名詞接尾辞を抽出し、当該名詞または名詞接尾辞の登場頻度に基づいてテキスト特徴量を抽出するテキスト特徴抽出部と、学習処理によって前記第1画像特徴量と前記テキスト特徴量との組を複数のクラスに分類するクラスタリング部と、前記第1画像特徴量と前記テキスト特徴量とを基に当該テキスト特徴量が属する前記クラスに対応するテキスト情報を特定する特徴生成モデルを生成する特徴生成モデル抽出部とを備える情報処理装置によって生成された前記特徴生成モデルからテキスト情報を抽出する情報抽出装置であって、
    入力された第2画像データの第2画像特徴量を抽出する第2画像特徴抽出部と、
    前記第2画像特徴量に対応する画像ベクトルが前記特徴生成モデルから生成される尤度を計算し、最も高い尤度に対応するクラスを特定し、当該クラスに対応するテキスト情報を抽出する識別部とを備える情報抽出装置。
  5. コンピュータを、請求項1若しくは2に記載の情報処理装置における各部、又は、請求項3若しくは4に記載の情報抽出装置における各部として機能させるためのプログラム。
JP2013171586A 2013-08-21 2013-08-21 情報処理装置、情報抽出装置、及びプログラム Active JP6039518B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013171586A JP6039518B2 (ja) 2013-08-21 2013-08-21 情報処理装置、情報抽出装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013171586A JP6039518B2 (ja) 2013-08-21 2013-08-21 情報処理装置、情報抽出装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2015041225A JP2015041225A (ja) 2015-03-02
JP6039518B2 true JP6039518B2 (ja) 2016-12-07

Family

ID=52695354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013171586A Active JP6039518B2 (ja) 2013-08-21 2013-08-21 情報処理装置、情報抽出装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6039518B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101778679B1 (ko) * 2015-10-02 2017-09-14 네이버 주식회사 딥러닝을 이용하여 텍스트 단어 및 기호 시퀀스를 값으로 하는 복수 개의 인자들로 표현된 데이터를 자동으로 분류하는 방법 및 시스템

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004287670A (ja) * 2003-03-20 2004-10-14 Dainippon Printing Co Ltd 画像データベース作成装置、画像データベース作成方法、プログラム、及び記録媒体
JP2009032154A (ja) * 2007-07-30 2009-02-12 Olympus Corp 情報処理装置およびプログラム
JP4964798B2 (ja) * 2008-02-13 2012-07-04 日本電信電話株式会社 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体
JP5462414B2 (ja) * 2011-06-30 2014-04-02 パナソニック株式会社 類似症例検索装置および関連度データベース作成装置並びに類似症例検索方法および関連度データベース作成方法

Also Published As

Publication number Publication date
JP2015041225A (ja) 2015-03-02

Similar Documents

Publication Publication Date Title
Min et al. A survey on food computing
US9797873B1 (en) Prediction of recipe preparation time
Singh et al. Social media data analytics to improve supply chain management in food industries
US9489377B1 (en) Inferring recipe difficulty
Singla et al. Food/non-food image classification and food categorization using pre-trained googlenet model
Isola et al. Discovering states and transformations in image collections
AU2016238832B2 (en) Evaluation of multimedia summarization
US9311568B1 (en) Recipe text and image extraction
Pouladzadeh et al. Using graph cut segmentation for food calorie measurement
Maruyama et al. Real-time mobile recipe recommendation system using food ingredient recognition
US9824152B1 (en) Recipe recommendation
CA2801298C (en) Device and method for selecting instances in expanded set containing given seed string
JP6920136B2 (ja) 情報処理システム
Kazama et al. A neural network system for transformation of regional cuisine style
JP5821590B2 (ja) 画像識別情報付与プログラム及び画像識別情報付与装置
Li et al. Hybrid fusion with intra-and cross-modality attention for image-recipe retrieval
Li et al. Cross-modal image-recipe retrieval via intra-and inter-modality hybrid fusion
Xie et al. Learning joint embedding with modality alignments for cross-modal retrieval of recipes and food images
JP2015095155A (ja) 情報推定装置及びコンピュータプログラム
CN110675389A (zh) 一种食品推荐方法、存储介质以及智能家居设备
JP6039518B2 (ja) 情報処理装置、情報抽出装置、及びプログラム
Amano et al. Food category representatives: Extracting categories from meal names in food recordings and recipe data
Yanai et al. A Cooking Recipe Recommendation System with Visual Recognition of Food Ingredients.
Eftimov et al. FoodEx2vec: New foods’ representation for advanced food data analysis
Matsunaga et al. Tastes and textures estimation of foods based on the analysis of its ingredients list and image

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150827

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161104

R150 Certificate of patent or registration of utility model

Ref document number: 6039518

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150