JP6039518B2 - 情報処理装置、情報抽出装置、及びプログラム - Google Patents
情報処理装置、情報抽出装置、及びプログラム Download PDFInfo
- Publication number
- JP6039518B2 JP6039518B2 JP2013171586A JP2013171586A JP6039518B2 JP 6039518 B2 JP6039518 B2 JP 6039518B2 JP 2013171586 A JP2013171586 A JP 2013171586A JP 2013171586 A JP2013171586 A JP 2013171586A JP 6039518 B2 JP6039518 B2 JP 6039518B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- text
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ユーザは、上記の方法によって、画像から料理の情報を取得することができる。ユーザは、料理のレシピに関して、専門家が作成したレシピ情報を掲載する料理レシピサイト(非特許文献3〜4)を参照することもできる。
非特許文献1の方法を利用するためには、予め、人手で画像に栄養素などの正解情報を与える必要があり、学習データを用意する手間を要することが問題である。また、必ずしも画像の見た目と栄養素の相関が高くない場合があった。
叙述によって特定される料理名とは「えびとヤングコーンの炒めもの」「トマトとチンゲン菜のスープ」「ベーコンとほうれんそうのキッシュ」「舌びらめのムニエルのサフランライス添え」「海の幸のクリームシチュー」などである。
このような叙述によって特定される料理名を持つ料理品目においては、同一の調理形態でも材料が異なるバリエーションが多く存在し、有効な画像の特徴である色特徴が料理品目毎に大きく異なる。そのため、上記の従来技術では、画像の特徴に基づく料理品目の識別精度が必ずしも良好ではなかった。
以下、図面を参照して、本発明の一実施形態による情報処理装置を説明する。
図1は、情報処理装置100の構成を示す機能ブロック図である。
情報処理装置100は、料理レシピサイトのデータのようなテキストデータT1を料理画像I1とともにカテゴリ学習の対象として入力することにより、料理画像に関連付けたテキスト情報またはテキストに関連する情報をモデル・パラメータ・代表ベクトル・特徴生成モデル記憶部500(以下、単に「記憶部500」と記載する)に記憶させる。
テキスト特徴抽出部120aのテキスト特徴抽出手法については後述する。
ただし、テキストデータT1に含まれるレシピ(材料リストや作り方)を解析する場合、レシピには調理器具や調味料や時間など料理の特徴と無関係な不要単語が頻出するため、これら不要単語のリストを予め別に用意しておき、これら不要単語を除いてからタグを抽出するとよい。
クラスタリング部130aは、上記の特徴ベクトル群が生成されやすいカテゴリ名(例えば料理カテゴリ)をトピックと考えてトピックモデルにあてはめて推定することで、画像特徴とテキスト特徴の共起性に注目したモデルを推定する。
例えば、クラスタリング部130aは、k−平均法などによって単純にクラスタリングしてもよい。また、クラスタリング部130aは、多クラスのSVM(Support vector machine)によって識別モデルを生成してもよい。
以下、図面を参照して、本発明の一実施形態による情報抽出装置を説明する。
情報抽出装置200は、情報処理装置100により記憶部500に記憶された情報に基づいて、所定の画像データI2に関連するテキスト情報を抽出する装置である。
または、クラスタリング部130aが出力したモデルがトピックモデル等の確率モデルの場合、その確率モデルによって画像特徴抽出部220bが出力した特徴ベクトルから、これに含まれるトピック分布を推定し、それに基づいて尤度を最大化するテキストを推定する。すなわち、識別部230は、入力された画像データの画像特徴量に対応する画像ベクトルが特徴生成モデルから生成される尤度を計算し、最も高い尤度に対応するクラスを特定し、そのクラスに対応するテキスト情報を抽出する。識別部230は、上記のクラスの特徴生成モデルによって、画像データI2の画像と関連付けられたテキスト情報(例えば、単語やその組み合わせ)を生成する。
前述のテキスト特徴について補足すれば、名詞は主に料理の材料名、名詞接尾辞は主に料理の調理法と対応することが多いため、これらを分けてテキスト特徴としてもよい。その場合、例えば発生確率が上位2位の名詞として例えば「N1」及び「N2」を選択し、発生確率が上位1位の名詞接尾辞「C1」を選択することで、「N1とN2とのC1」のように料理名を疑似的に推測することができる。
図2(b)の構成の場合、識別部230は、画像データI2の画像と関連付けられたテキスト情報(例えば、単語やその組み合わせ)に基づいて、料理名データベース600の蓄積情報を参照する。
例えば、識別部230は、料理名データベース600の料理名情報を参照し、上記テキスト情報と少なくとも部分的に一致する料理名が存在すれば、その料理に関する情報を任意に抽出することができる。これにより、情報抽出装置200は、画像データI2の画像に関する料理名情報を抽出したり、レシピ情報を抽出したりすることができる。
図3は、情報処理装置100のテキスト特徴抽出部120aが、テキストデータT1を形態素解析したテキストの例を示す図である。
テキストデータT1として「いかと白菜の煮物」を入力した場合、テキスト特徴抽出部120aは、「イカ」「ハクサイ」「ニモノ」という名詞、「ト」「ノ」という格助詞を抽出する。
また、テキストデータT1として「キムチ鍋」を入力した場合、テキスト特徴抽出部120aは、「キムチ」という名詞、「ナベ」という名詞接尾辞を抽出する。
また、テキストデータT1として「たことチンゲン菜のにんにく炒め」を入力した場合、テキスト特徴抽出部120aは、「タコ」「チンゲンサイ」「ニンニク」という名詞、「イタメ」という名詞接尾辞を生成する。
これらの例から、料理関連情報を含むテキストデータT1においては、名詞および名詞接尾辞が材料名や調理法になっていることがわかる。
図5(a)は、画像特徴空間において、5つのトピック「topic1」「topic2」「topic3」「topic4」「topic5」が分布している様子を示すグラフである。なお、各トピックの示す領域は、必ずしも分離されているとは限らない。
図5(b)は、「野菜」「ソース」「エビ」「ニワトリ」「豚肉」「牛肉」「キノコ」の名詞について、各トピックの「topic1」「topic2」「topic3」「topic4」「topic5」にどの程度当てはまっているかを示すグラフである。
また、上記の情報抽出装置200によれば、情報処理装置100によって提供されたモデルに基づいて、所定の画像から、より共起性の高いテキスト情報またはその関連情報を抽出することが可能となる。例えば、情報抽出装置200によれば、所定の料理の画像に基づいて、料理名情報、レシピ情報、栄養情報などを適宜抽出することができる。
Claims (5)
- 学習データとして入力された第1画像データ及び当該第1画像データに関連するテキストデータに基づいた学習処理を行う情報処理装置であって、
前記第1画像データの画像特徴を示す第1画像特徴量を抽出する第1画像特徴抽出部と、
形態素解析処理によって前記テキストデータに含まれる名詞または名詞接尾辞を抽出し、当該名詞または名詞接尾辞の登場頻度に基づいてテキスト特徴量を抽出するテキスト特徴抽出部と、
前記第1画像特徴量と前記テキスト特徴量とを連結し、連結した前記第1画像特徴量及び前記テキスト特徴量を学習処理によって複数のクラスに分類するクラスタリング部と、
前記第1画像特徴量と前記テキスト特徴量とを基に当該テキスト特徴量が属する前記クラスに対応するテキスト情報を特定する特徴生成モデルを生成する特徴生成モデル抽出部とを備える情報処理装置。 - 前記第1画像特徴量を基に前記クラスを識別する代表ベクトルを生成する代表ベクトル抽出部と、
前記代表ベクトルと前記特徴生成モデルとを組にして生成する生成部とを更に備える請求項1に記載の情報処理装置。 - 請求項2に記載の情報処理装置によって生成された前記代表ベクトルと前記特徴生成モデルとの組からテキスト情報を抽出する情報抽出装置であって、
入力された第2画像データの第2画像特徴量を抽出する第2画像特徴抽出部と、
前記第2画像特徴量に対応する画像ベクトルを、前記代表ベクトルと比較することにより、一の代表ベクトルと組をなす特徴生成モデルを識別する識別部とを備える情報抽出装置。 - 学習データとして入力された第1画像データ及び当該第1画像データに関連するテキストデータに基づいた学習処理を行う情報処理装置であって、前記第1画像データの画像特徴を示す第1画像特徴量を抽出する第1画像特徴抽出部と、形態素解析処理によって前記テキストデータに含まれる名詞または名詞接尾辞を抽出し、当該名詞または名詞接尾辞の登場頻度に基づいてテキスト特徴量を抽出するテキスト特徴抽出部と、学習処理によって前記第1画像特徴量と前記テキスト特徴量との組を複数のクラスに分類するクラスタリング部と、前記第1画像特徴量と前記テキスト特徴量とを基に当該テキスト特徴量が属する前記クラスに対応するテキスト情報を特定する特徴生成モデルを生成する特徴生成モデル抽出部とを備える情報処理装置によって生成された前記特徴生成モデルからテキスト情報を抽出する情報抽出装置であって、
入力された第2画像データの第2画像特徴量を抽出する第2画像特徴抽出部と、
前記第2画像特徴量に対応する画像ベクトルが前記特徴生成モデルから生成される尤度を計算し、最も高い尤度に対応するクラスを特定し、当該クラスに対応するテキスト情報を抽出する識別部とを備える情報抽出装置。 - コンピュータを、請求項1若しくは2に記載の情報処理装置における各部、又は、請求項3若しくは4に記載の情報抽出装置における各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013171586A JP6039518B2 (ja) | 2013-08-21 | 2013-08-21 | 情報処理装置、情報抽出装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013171586A JP6039518B2 (ja) | 2013-08-21 | 2013-08-21 | 情報処理装置、情報抽出装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015041225A JP2015041225A (ja) | 2015-03-02 |
JP6039518B2 true JP6039518B2 (ja) | 2016-12-07 |
Family
ID=52695354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013171586A Active JP6039518B2 (ja) | 2013-08-21 | 2013-08-21 | 情報処理装置、情報抽出装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6039518B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101778679B1 (ko) * | 2015-10-02 | 2017-09-14 | 네이버 주식회사 | 딥러닝을 이용하여 텍스트 단어 및 기호 시퀀스를 값으로 하는 복수 개의 인자들로 표현된 데이터를 자동으로 분류하는 방법 및 시스템 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287670A (ja) * | 2003-03-20 | 2004-10-14 | Dainippon Printing Co Ltd | 画像データベース作成装置、画像データベース作成方法、プログラム、及び記録媒体 |
JP2009032154A (ja) * | 2007-07-30 | 2009-02-12 | Olympus Corp | 情報処理装置およびプログラム |
JP4964798B2 (ja) * | 2008-02-13 | 2012-07-04 | 日本電信電話株式会社 | 画像辞書生成装置,画像辞書生成方法,画像辞書生成プログラムおよびその記録媒体 |
JP5462414B2 (ja) * | 2011-06-30 | 2014-04-02 | パナソニック株式会社 | 類似症例検索装置および関連度データベース作成装置並びに類似症例検索方法および関連度データベース作成方法 |
-
2013
- 2013-08-21 JP JP2013171586A patent/JP6039518B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015041225A (ja) | 2015-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Min et al. | A survey on food computing | |
US9797873B1 (en) | Prediction of recipe preparation time | |
Singh et al. | Social media data analytics to improve supply chain management in food industries | |
US9489377B1 (en) | Inferring recipe difficulty | |
Singla et al. | Food/non-food image classification and food categorization using pre-trained googlenet model | |
Isola et al. | Discovering states and transformations in image collections | |
AU2016238832B2 (en) | Evaluation of multimedia summarization | |
US9311568B1 (en) | Recipe text and image extraction | |
Pouladzadeh et al. | Using graph cut segmentation for food calorie measurement | |
Maruyama et al. | Real-time mobile recipe recommendation system using food ingredient recognition | |
US9824152B1 (en) | Recipe recommendation | |
CA2801298C (en) | Device and method for selecting instances in expanded set containing given seed string | |
JP6920136B2 (ja) | 情報処理システム | |
Kazama et al. | A neural network system for transformation of regional cuisine style | |
JP5821590B2 (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
Li et al. | Hybrid fusion with intra-and cross-modality attention for image-recipe retrieval | |
Li et al. | Cross-modal image-recipe retrieval via intra-and inter-modality hybrid fusion | |
Xie et al. | Learning joint embedding with modality alignments for cross-modal retrieval of recipes and food images | |
JP2015095155A (ja) | 情報推定装置及びコンピュータプログラム | |
CN110675389A (zh) | 一种食品推荐方法、存储介质以及智能家居设备 | |
JP6039518B2 (ja) | 情報処理装置、情報抽出装置、及びプログラム | |
Amano et al. | Food category representatives: Extracting categories from meal names in food recordings and recipe data | |
Yanai et al. | A Cooking Recipe Recommendation System with Visual Recognition of Food Ingredients. | |
Eftimov et al. | FoodEx2vec: New foods’ representation for advanced food data analysis | |
Matsunaga et al. | Tastes and textures estimation of foods based on the analysis of its ingredients list and image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160719 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6039518 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |