JP2011018178A

JP2011018178A - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP2011018178A
Application number: JP2009161970A
Authority: JP
Inventors: Shunichi Honma; 俊一本間; Yoshiaki Iwai; 嘉昭岩井
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2009-07-08
Filing date: 2009-07-08
Publication date: 2011-01-27
Also published as: US20110010363A1; CN101950288A

Abstract

【課題】ユーザのイメージする概念毎に分類された画像群をもとにユーザプロファイルを作成する。
【解決手段】情報処理装置１０は、複数の画像と各画像に関連する複数の関連言語とを関連付けて記憶している記憶部１５６と、所定の概念を示す概念言語を入力する入力部１５２と、入力部１５２により入力された概念言語と関連言語とが一致する場合に、関連言語に関連付けられている複数の画像を記憶部から抽出する抽出部１５４と、抽出部１５４により抽出された複数の画像から、概念言語の概念に適合する画像を選別する選別部１６０と、選別部１６０により選別された概念言語の概念に適合する画像に関連付けられている関連言語を収集する収集部１６２と、収集部１６２により収集された関連言語の言語群の言語特徴量を算出する算出部１６４と、を備える。
【選択図】図３

Description

本発明は、情報処理装置、情報処理方法およびプログラムに関し、特に、ユーザのプロファイルを作成・制御する情報処理装置、情報処理方法およびプログラムに関する。

近年、各ユーザの検索履歴や購入履歴などをもとに各ユーザのプロファイルが作成され、該プロファイルを利用した商品の検索やコンテンツの推薦などが行われている。プロファイルの作成においては、ユーザが購入した商品の種類やメーカーなどをもとにあらかじめ用意されたユーザ属性や、ユーザ自身が入力したキーワードなどが利用されている。例えば、ユーザ自身が入力したキーワードと、あらかじめ用意されたユーザ属性とをマッチングさせて、入力されたキーワードに関連する商品やコンテンツを推薦する。

しかし、上記の方法では、ユーザ自身が入力したキーワードと、あらかじめ用意されたキーワードや属性とがうまくマッチングしない場合が多い。すなわち、ユーザが何らかの概念を持ってキーワードを入力したとしても、その概念を有するものが極めて少なかったり、その概念と異なるものが得られてしまったりする場合がある。また、ユーザ自身も、イメージする概念をうまく言語化することができなければ、検索キーとなるクエリの作成自体が困難となるという問題があった。

そこで、検索クエリ言語と検索クエリ言語を用いた検索履歴をもとに各ユーザのプロファイルを生成し、ユーザの所望する検索結果を提供する技術が開示されている（例えば、特許文献１）。

特表２００８−５０７０４１号公報

しかし、特許文献１では、具体的な物体名称や固有名に対する嗜好を抽出することはできるが、形容詞をはじめとする感性的な表現など、個人により受け取り方が異なる場合に、ユーザの概念とかけ離れた情報を提供してしまう可能性があった。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、ユーザのイメージする概念毎に分類された画像群をもとに、ユーザプロファイルを作成することが可能な、新規かつ改良された情報処理装置、情報処理方法およびプログラムを提供することにある。

上記課題を解決するために、本発明のある観点によれば、複数の画像と各画像に関連する複数の関連言語とが関連付けられており、所定の概念を示す概念言語を入力する入力部と、入力部により入力された概念言語と関連言語とが一致する場合に、関連言語に関連付けられている複数の画像を記憶部から抽出する抽出部と、抽出部により抽出された複数の画像から、概念言語の概念に適合する画像を選別する選別部と、選別部により選別された概念言語の概念に適合する画像に関連付けられている関連言語を収集する収集部と、収集部により収集された関連言語の言語群の言語特徴量を算出する算出部と、を備える、情報処理装置が提供される。

かかる構成によれば、ユーザ操作などにより所定の概念を示す概念言語が入力され、概念言語と記憶部に記憶されている複数の画像に関連する関連言語とが一致する場合に、該関連言語に関連付けられている複数の画像を記憶部から抽出する。そして、ユーザ操作に応じて、抽出された複数の画像から概念言語の概念に適合する画像を選別する。選別された概念言語の概念に適合する画像に関連付けられている関連言語を収集して、収集された関連言語の言語群の言語特徴量を算出する。これにより、ユーザのイメージする概念毎に分類された画像群をもとに、ユーザプロファイルを作成することが可能となる。

また、選別部は、ユーザ操作に応じて、抽出部により抽出された複数の画像から、概念言語の概念に適合する画像を選別するようにしてもよい。また、算出部は、収集部により収集された関連言語の出現頻度に応じて言語特徴量を算出するようにしてもよい。また、算出部は、選別部により概念言語に適合されない画像として選別された画像群に関連付けられた関連言語の出現頻度に応じて言語特徴量を算出するようにしてもよい。

また、選別部により選別された概念言語の概念に適合する画像群から、所定の画像特徴量を認識可能な画像認識器を作成する作成部を備えるようにしてもよい。また、算出部により算出された言語特徴量を、概念言語に対応付けて概念情報として記憶媒体に記録する記録部を備えるようにしてもよい。

また、記録部は、言語特徴量に応じて概念言語を所定の概念地図上にマッピングして記録するようにしてもよい。また、記録部は、概念言語に、選別部により選別された画像を含む関連画像群と、収集部により収集された関連言語を含む関連言語群と、算出部により算出された言語特徴量とを対応付けて概念情報として記憶媒体に記録してもよい。

また、複数の画像に加えて、新たに複数の画像と各画像に関連する複数の関連言語とが関連付けられた場合、抽出部は、概念言語と一致する関連言語に関連付けられている複数の画像を抽出し、選別部は、概念言語の概念に適合する画像を新たに選別し、収集部は、概念言語の概念に適合する画像に関連付けられている関連言語を再収集し、算出部は、収集部により再収集された関連言語の言語群の言語特徴量を再算出するようにしてもよい。

また、選別部は、ユーザ操作に応じて、概念言語の概念に適合する画像を新たに選別するようにしてもよい。

また、選別部は、作成部により作成された画像認識器による画像認識度に応じて、概念言語の概念に適合する画像を新たに選別するようにしてもよい。

また、ユーザ操作に応じて、記録部に記録されている言語特徴量に応じた概念言語の概念地図上のマッピングが変更された場合に、算出部は、更新された概念地図上の概念言語のマッピング位置に基づいて、概念言語の言語特徴量を再算出するようにしてもよい。

また、選別部は、作成部により作成された画像認識器による画像認識度に応じて、抽出部により抽出された複数の画像から概念言語の概念に適合する画像を選別するようにしてもよい。

上記課題を解決するために、本発明の別の観点によれば、所定の概念を示す概念言語を入力するステップと、入力された概念言語と複数の画像に関連付けられている関連言語とが一致する場合に、関連言語に関連付けられている複数の画像を記憶部から抽出するステップと、抽出された複数の画像から、概念言語の概念に適合する画像を選別するステップと、選別された概念言語の概念に適合する画像に関連付けられている関連言語を収集するステップと、収集された関連言語の言語群の言語特徴量を算出するステップと、を含む、情報処理方法が提供される。

上記課題を解決するために、本発明の別の観点によれば、コンピュータを、複数の画像と各画像に関連する複数の関連言語とが関連付けられており、所定の概念を示す概念言語を入力する入力部と、入力部により入力された概念言語と関連言語とが一致する場合に、関連言語に関連付けられている複数の画像を抽出する抽出部と、抽出部により抽出された複数の画像から、概念言語の概念に適合する画像を選別する選別部と、選別部により選別された概念言語の概念に適合する画像に関連付けられている関連言語を収集する収集部と、収集部により収集された関連言語の言語群の言語特徴量を算出する算出部と、を備える、情報処理装置として機能させるためのプログラムが提供される。

以上説明したように本発明によれば、ユーザのイメージする概念毎に分類された画像群をもとにユーザプロファイルを作成することができる。

本発明の一実施形態にかかるプロファイル作成の概要について説明する説明図である。同実施形態にかかる情報処理装置のハードウェア構成の一例を示した説明図である。同実施形態にかかる情報処理装置の機能構成を示すブロック図である。同実施形態にかかる言語＋画像データベースの内容について説明する説明図である。同実施形態にかかる概念情報データベースに記憶される概念情報の内容について説明する説明図である。同実施形態にかかる概念地図上に表される概念言語の関連度について説明する説明図である。同実施形態にかかるプロファイル作成処理の詳細を示すフローチャートである。同実施形態にかかるＳＶＭを用いたフィードバック処理について説明する説明図である。同実施形態にかかるＴＦ−ＩＤＦの使用方法について説明する説明図である。同実施形態にかかるプロファイルの更新例について説明する説明図である。同実施形態にかかるプロファイルの更新例について説明する説明図である。同実施形態にかかるプロファイルの利用例について説明する説明図である。同実施形態にかかるプロファイルの利用例について説明する説明図である。

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

〔１〕本実施形態の目的
〔２〕情報処理装置のハードウェア構成
〔３〕情報処理装置の機能構成
〔４〕情報処理装置におけるプロファイル作成処理の詳細
〔５〕プロファイルの更新例
〔６〕プロファイルの利用例

〔１〕本実施形態の目的
近年、各ユーザの検索履歴や購入履歴などをもとに各ユーザのプロファイルが作成され、該プロファイルを利用した商品の検索やコンテンツの推薦などが行われている。このようなプロファイルを利用した推薦技術や、それによるユーザビリティの向上は今後も拡大することが予想される。また、これらのプロファイルは、特定のサイトや目的に依存するのではなく、他のサイトや家電機器上での利用など、様々な状況で共有されている。

昨今のプロファイルの作成においては、ユーザが購入した商品の種類やメーカーなどをもとにあらかじめ用意されたユーザ属性や、ユーザ自身が入力したキーワードなどが利用されている。例えば、ユーザ自身が入力したキーワードと、あらかじめ用意されたユーザ属性とをマッチングさせて、入力されたキーワードに関連する商品やコンテンツを推薦する。

しかし、上記の方法では、ユーザ自身が入力したキーワードと、あらかじめ用意されたキーワードや属性とがうまくマッチングしない場合が多い。すなわち、ユーザが何らかの概念を持ってキーワードを入力したとしても、その概念を有するものが極めて少なかったり、その概念と異なるものが得られてしまったりする場合がある。また、ユーザ自身も、イメージする概念をうまく言語化することができなければ、検索キーとなるクエリの作成自体が困難となるという問題があった。また、同音異義語や部分一致するキーワード、人名や商品名といったまったく新しい言葉への対応、言語同士の距離計測など、ユーザがイメージする概念とうまくマッチングできない様々な場面が想定される。

そこで、検索クエリ言語と検索クエリ言語を用いた検索履歴をもとに各ユーザのプロファイルを生成し、ユーザの所望する検索結果を提供する技術が開示されている。しかし、この技術では、具体的な物体名称や固有名に対する嗜好を抽出することはできるが、形容詞をはじめとする感性的な表現など、個人により受け取り方が異なる場合に、ユーザの概念とかけ離れた情報を提供してしまう可能性があった。

上記の問題は、プロファイルの利用や更新において大きな障害となってくる。特に、プロファイルを自動更新する場合には、ユーザの概念と言語の一致度が曖昧なまま、それらの言語を用いて新たな情報を収集することになる。この場合、ユーザが所望の情報を得るためには、一度生成されたプロファイルを修正する必要があった。そこで、上記のような事情を一着原点として、本発明の実施形態にかかる情報処理装置１０が創作されるに至った。本実施形態にかかる情報処理装置１０によれば、ユーザのイメージする概念毎に分類された画像群をもとに、ユーザプロファイルを作成することが可能となる。

次に、図１を参照して、本実施形態にかかる情報処理装置１０におけるプロファイル作成の概要について説明する。例えば、ユーザ５０がパーソナルコンピュータ等のコンピュータ装置から、「桜」という言語クエリ（キーワード）５１を入力したとする。そして、情報処理装置１０において、「桜」という言語を関連語に含む画像が収集される。関連語は、例えば、画像に関連付けられた言語やユーザにより画像に設定された言語である。「桜」という言語を関連語に含む画像としては、例えば、「桜もち」、「桜模様のワンピース」、「桜の木」、「桜茶」などの画像が考えられる。

例えば、ユーザは、「桜の木」をイメージして「桜」を言語クエリとして入力したとしても、「桜」に関連する画像は、ユーザの概念である「桜の木」以外の画像も収集されることとなる。そこでユーザは、収集された画像をユーザの概念に一致するように分類する。すなわち、「桜」という言語を関連語に含む画像から、「桜の木」が含まれる画像を選別する。このように、ユーザの概念を一旦画像として表現し、ユーザ操作に応じて画像を選別することにより、言語クエリだけでは曖昧となっていたユーザの概念を明確化することができる。

さらに、情報処理装置１０は、ユーザ操作により選別された画像に関連付けられた文字情報５４を収集して、入力された「桜」という言語クエリに関連付ける。これにより、ユーザ５０がイメージする「桜」という概念に適合する文字情報が言語クエリ「桜」に関連付けられることとなる。例えば、ユーザのイメージする概念と画像とを結びつける言語と、コンテンツ作成者のイメージする概念と画像とを結びつける言語が一致しないとしても、画像を通して概念と両者の言語とを結びつけることが可能となる。

さらに、情報処理装置１０は、収集された文字情報５４の言語特徴量を算出して、該特徴量をもとに、より的確にユーザの概念を表すことを可能とする。言語特徴量は、ユーザ操作によりユーザの概念に適合せずに選別されなかった画像群に関連付けられた言語群や、収集された言語５４における特定言語の出現頻度を鑑みて算出される。これにより、所定の概念を示す言語（概念言語）に対して、概念言語に適合する画像群と、該画像に紐付けられた言語群と、該言語群をもとに算出された言語特徴量とが新しい概念情報としてユーザプロファイルに追加されることとなる。以上、情報処理装置１０の概要について説明した。

〔２〕情報処理装置のハードウェア構成
次に、図２を参照して、情報処理装置１０のハードウェア構成について説明する。図２は、本実施形態にかかる情報処理装置１０のハードウェア構成の一例を示した説明図である。

情報処理装置１０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１０２と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１０３と、ホストバス１０４と、ブリッジ１０５と、外部バス１０６と、インタフェース１０７と、入力装置１０８と、出力装置１０９と、ストレージ装置（ＨＤＤ）１１０と、ドライブ１１１と、通信装置１１２とを備える。

ＣＰＵ１０１は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置１０内の動作全般を制御する。また、ＣＰＵ１０１は、マイクロプロセッサであってもよい。ＲＯＭ１０２は、ＣＰＵ１０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ１０３は、ＣＰＵ１０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一次記憶する。これらはＣＰＵバスなどから構成されるホストバス１０４により相互に接続されている。

ホストバス１０４は、ブリッジ１０５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス１０６に接続されている。なお、必ずしもホストバス１０４、ブリッジ１０５および外部バス１０６を分離構成する必要はなく、一のバスにこれらの機能を実装してもよい。

入力装置１０８は、例えば、マウス、キーボード、タッチパネル、ボタン、マイク、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ１０１に出力する入力制御回路などから構成されている。情報処理装置１０のユーザは、該入力装置１０８を操作することにより、情報処理装置１０に対して各種のデータを入力したり処理動作を指示したりすることができる。

出力装置１０９は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）ディスプレイ装置、液晶ディスプレイ（ＬＣＤ）装置、ＯＬＥＤ（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｓｐｌａｙ）装置およびランプなどの表示装置と、スピーカおよびヘッドホンなどの音声出力装置で構成される。出力装置１０９は、例えば、再生されたコンテンツを出力する。具体的には、表示装置は再生された映像データ等の各種情報をテキストまたはイメージで表示する。一方、音声出力装置は、再生された音声データ等を音声に変換して出力する。

ストレージ装置１１０は、本実施形態にかかる情報処理装置１０の記憶部の一例として構成されたデータ格納用の装置であり、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含むことができる。ストレージ装置１１０は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）で構成される。このストレージ装置１１０は、ハードディスクを駆動し、ＣＰＵ１０１が実行するプログラムや各種データを格納する。

ドライブ１１１は、記憶媒体用リーダライタであり、情報処理装置１０に内蔵、あるいは外付けされる。ドライブ１１１は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体１２０に記録されている情報を読み出して、ＲＡＭ１０３に出力する。

通信装置１１２は、例えば、通信網５０に接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置１１２は、無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）対応通信装置であっても、ワイヤレスＵＳＢ対応通信装置であっても、有線による通信を行うワイヤー通信装置であってもよい。

〔３〕情報処理装置の機能構成
以上、情報処理装置１０のハードウェア構成について説明した。次に、図３を参照して、情報処理装置１０の機能構成について説明する。図３に示したように、情報処理装置１０は、入力部１５２、抽出部１５４、記憶部１５６、選別部１６０、収集部１６２、算出部１６４、記録部１６６、作成部１６８、画像認識器１７０などを備える。

入力部１５２は、ユーザ操作に応じて、所定の概念を示す概念言語を入力する機能を有する。ここで、概念とは、ある言語に対するユーザ個人が持つ意図やイメージ、それを表現する情報群を意味する。本実施形態では、このようなユーザがイメージする概念を示す言語を概念言語という。概念言語は例えば、「桜」や「時計」などの文字情報である。ユーザは、上記した入力装置１０８を介して、「桜」や「時計」などイメージしている概念を示す概念言語を文字入力する。

抽出部１５４は、入力部１５２により入力された概念言語と、後述する記憶部１５６に記憶されている画像に関連している関連言語とが一致する場合に、関連言語に関連付けられている複数の画像を記憶部１５６から抽出する機能を有する。記憶部１５６には、複数の画像と各画像に関連する複数の関連言語とが関連付けられて、言語＋画像データベース１５７として記憶されている。本実施形態では、記憶部１５６は、情報処理装置１０に備えられている構成としたが、かかる例に限定されず、記憶部１５６を情報処理装置１０とは別体の装置に備えられ、ネットワークを介して記憶部１５６に記憶されている情報を取得するようにしてもよい。

ここで、図４を参照して、言語＋画像データベース１５７の内容について説明する。図４は、言語＋画像データベース１５７の内容について説明する説明図である。例えば、図４に示したように、海や砂浜を含む画像２０１には、「海」、「沖縄」、「修学旅行」、「晴れ」、「水着」など、画像２０１に関連する複数の関連言語が紐付けられている。また、例えば、天体の画像２０２には、「銀河」、「星」、「宇宙」などの関連言語が紐付けられており、ケーキを含む画像２０３には、「ケーキ」、「銀座」、「セレブ」などの関連言語が紐付けられている。言語＋画像データベース１５７に記憶されている画像や関連言語は、コンテンツ推薦者などにより設定、追加されてもよいし、ユーザ自らが設定、追加するようにしてもよい。

上記したように、抽出部１５４は、言語＋画像データベース１５７に記憶されている複数の関連言語から、入力部１５２により入力された概念言語と一致する言語を検索する。そして、概念言語に一致した関連言語に関連付けられている画像群を抽出する。例えば、概念言語として「桜」が入力された場合には、関連言語に「桜」を含む画像が抽出される。「桜」を関連言語に含む画像としては、「桜の木」だけでなく、「桜もち」、「桜模様のワンピース」、「桜茶」なども考えられる。抽出部１５４は、記憶部１５６から抽出した複数の画像を選別部１６０に提供する。

選別部１６０は、抽出部１５４により提供された複数の画像から、概念言語の概念に適合する画像を選別する機能を有する。概念言語の概念に適合するとは、概念言語を入力したユーザがイメージしている概念に適合することである。例えば、概念言語として「桜」を入力した場合に、ユーザは「桜の木」をイメージしていたとしても、「桜」を関連言語に含む画像は「桜もち」、「桜模様のワンピース」など「桜の木」以外のものも含まれる。この場合、概念言語の概念に適合する画像は、「桜もち」の画像や「桜模様のワンピース」の画像などではなく、「桜の木」の画像となる。

また、選別部１６０は、ユーザ操作に応じて、抽出部１５４により抽出された複数の画像から概念言語の概念に適合する画像を選別するようにしてもよい。例えば、抽出部１５４により抽出された複数の画像を表示装置（図示せず）の表示画面に表示させ、ユーザが入力装置を介して複数の画像から概念言語の概念に適合する画像を選別するようにしてもよい。ユーザ操作による画像の選別は、概念言語の概念に適合するものと適合しないものとに分類することによって行ってもよい。
また、概念言語の概念に適合しないものを表示画面から削除することによって行われてもよい。また、ユーザ操作により、段階的に画像が選別されるようにしてもよい。例えば、ユーザ操作により、数枚の画像が選別されて、その画像の画像特徴量をもとに適切な画像を選別するようにしてもよい。そして、選別した画像をユーザに提示して、その画像のなかから再度ユーザ操作により適切な画像が選別されるようにしてもよい。このように、画像に対する概念との一致、不一致を複数回フィードバックするようにしてもよい。

例えば、ユーザは「桜の木」のみの画像をイメージして「桜」という概念言語を入力したとする。この場合、最初に選別された段階では、「桜の木」と桜の木以外の建物等が含まれる画像が選別されるが、複数回のフィードバックののち、「桜の木」のみの画像が選別されることとなる。上記のフィードバック機能は、ＳＶＭ（Ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ）やＢｏｏｓｔｉｎｇ等の機械学習を含む技術と装置とのインタラクションによって実現することができる。フィードバック機能の詳細については後で詳細に説明する。

ユーザ操作によりユーザがイメージする概念に一致するか一致しないかがフィードバックされることにより、選別部１６０は、よりユーザにとって適切な画像を選別することが可能となる。例えば、「桜」という文字情報だけでは、ユーザのイメージする概念が「桜の木」を意味することまで把握することができないが、「桜」に関連する画像を表示して選別させることにより、ユーザのイメージする概念をより明確に把握することが可能となる。選別部１６０は、選別した画像の情報を収集部１６２に提供する。また、選別部１６０は、選別した画像の情報を作成部１６８に提供する。作成部１６８は、選別部１６０により選別された概念言語の概念に適合する画像群から、所定の画像特徴量を認識可能な画像認識器１７０を作成する機能を有する。画像認識器１７０は、概念言語毎に作成される。画像認識器１７０は、複数の画像の画像特徴量を抽出して学習する。

例えば、画像認識器１７０は、「桜」の概念言語に適合する画像群から抽出された画像特徴量と、入力された画像の画像特徴量とを比較して、入力画像が「桜」の概念言語に適合するか否かを判定することが可能となる。すなわち、ユーザ操作により入力画像が選別されることを上記したが、複数画像を学習した画像認識器１７０を用いて入力画像を選別することも可能となる。ただし、入力画像を選別する前に、予めユーザ操作に応じて選別された所定の概念に適合する画像群を学習しておく必要がある。

収集部１６２は、選別部１６０により選別された概念言語の概念に適合する画像に関連付けられている関連言語を収集する機能を有する。収集部１６２は、画像にメタデータとして付加されている文字情報を収集してもよいし、言語＋画像データベース１５７から該当画像に紐付けられている言語を収集してもよい。例えば、最終的に選別された画像が「桜の木」のみの画像であり、該画像に「さくら」、「４月」、「入学式」、「マクロモード」、「接写」等、「桜」の概念に直接的に結びつく言語だけでなく、直接的に結びつかない言語も含まれる。収集部１６２は、収集した関連言語を算出部１６４に提供する。

算出部１６４は、収集部１６２により収集された関連言語の言語群の言語特徴量を算出する機能を有する。算出部１６４は、収集部１６２により収集された関連言語の出現頻度に応じて言語特徴量を算出する。また、算出部１６４は、選別部１６０により概念言語に適合されない画像として選別された画像群に関連付けられた関連言語の出現頻度に応じて言語特徴量を算出するようにしてよい。

言語特徴量とは、収集部１６２により収集された言語群とその出現頻度とを用いて生成される言語特徴ベクトルを意味する。上記したように、言語特徴ベクトルは、フィードバックによって取り除かれた画像郡に関連付けられた言語群や、データベース中の全言語群における特定言語の出現頻度を鑑みながら行うことにより、より的確にユーザの概念を表すことが可能となる。言語群の中から重要語を取り出す方法としては、形態素解析やＴＦ−ＩＤＦなどが用いられる。これらの方法による言語特徴量の作成については後で詳細に説明する。算出部１６４は、算出した言語特徴量を記録部１６６に提供する。

記録部１６６は、算出部１６４により提供された言語特徴量を、概念言語に対応付けて概念情報として記憶媒体に記録する機能を有する。さらに、記録部１６６は、概念言語に対応付けて、選別部１６０により選別された概念言語に関連する関連画像群と、収集部１６２により収集された関連言語群と、算出部１６４により算出された言語特徴量とを対応付けて概念情報として記憶媒体に記録するようにしてもよい。本実施形態では、概念情報データベース１５８を言語＋画像データベースとともに記憶部１５６に記録するようにしたが、かかる例に限定されず、各データベースを別の記憶媒体に記録するようにしてもよい。

ここで、図５を参照して、概念情報データベース１５８に記憶される概念情報の内容について説明する。図５に示したように、ユーザ操作により入力された言語クエリ（概念言語）２２１に、概念に適合する画像群２２２と、画像群２２２に紐付けられている関連言語群２２３と、関連言語群２２３の言語特徴量２２４とが対応付けられて、ひとつの概念情報として記憶される。さらに、画像群２２２から作成される画像認識器１７０も関連付けて記憶される。上記したように、画像と画像に関連する関連言語とは、すでに言語＋画像データベース１５７内であらかじめ関連付けて記憶されている。したがって、概念情報データベース１５８内では、言語＋画像データベース１５７内の関連情報を用いてデータ管理するようにしてもよい。

また、本実施形態では、画像認識器１７０は、情報処理装置１０内に有しているとしたが、情報処理装置１０とは別体の装置に画像認識器１７０を有するようにしてもよい。この場合、情報処理装置１０と別体の装置との間で、画像認識器１７０と概念情報との関連付けを行う必要がある。図３に戻り、情報処理装置１０の機能構成の説明を続ける。

また、記録部１６６は、算出部１６４により算出された言語特徴量に応じて、概念言語を所定の概念地図上にマッピングして記録するようにしてもよい。ユーザのプロファイルとして、ユーザにより入力された概念言語を用いる場合、概念言語同士がどのような関係にあるかを把握する必要がある。例えば、概念言語間の距離を計算することにより、概念言語同士がどのような関係かを明確とすることができる。概念言語間の距離は、概念言語同士の距離を直接比較することにより算出できる。概念言語同士の距離を直接比較するとは、例えば、概念辞書等により表される言語の階層構造をもとに、階層の差を比較することである。

しかし、概念辞書等により表される言語の階層構造は、各ユーザの概念を反映しているものではないため、このような階層構造をもとに比較するのは適切ではない。そこで、本実施形態では、算出部１６４により算出された言語特徴量をもとに、概念言語同士の距離を計算することにより、各ユーザの概念が反映された距離計算を行う。そして、算出された概念同士の距離をもとに、概念言語同士の関連度が得られ、この関連度を概念地図上にマッピングすることができる。ここで、図６を参照して、概念地図上に表される概念言語の関連度について説明する。図６は、概念地図上に表される概念言語の関連度について説明する説明図である。

図６に示したように、例えば、「Ｏｒａｎｇｅ」には、果物の「オレンジ」という概念と「オレンジ社」という概念が含まれているとする。それぞれの概念言語に対して言語特徴量が算出され、例えば、オレンジ社という概念を示す「Ｏｒａｎｇｅ」には言語特徴量２３５のような言語特徴量が算出される。また、果物の「オレンジ」という概念を示す「Ｏｒａｎｇｅ」には言語特徴量２３６のような言語特徴量が算出される。両者は、「Ｏｒａｎｇｅ」という同じ文字列の言語であっても、言語特徴量２３５と言語特徴量２３６との関連度は低く、距離が離れているといえる。したがって、概念地図２３０上に表されたオレンジ社の「Ｏｒａｎｇｅ」２３１と、果物の「Ｏｒａｎｇｅ」は離れた位置にそれぞれマッピングされる。さらに、概念言語のマッピングの方法として、多次元尺度構成法などにより、視覚情報としてマッピングするようにしてもよい。

また、オレンジ社の概念を示す「Ｏｒａｎｇｅ」２３１の付近には、Ｓｏｍｙ社の「Ｓｏｍｙ」、Ｂｅｌｌ社の「Ｂｅｌｌ」等企業の概念を表す言語がマッピングされる。また、果物のオレンジの概念を示す「Ｏｒａｎｇｅ」２３２の付近には、「Ａｐｐｌｅ」等果物の概念を表す言語がマッピングされる。このように、ユーザ操作により入力された概念言語の中で、同一の文字列の概念言語があったとしても、異なる概念を２つ以上含むものであれば、異なる概念毎に言語特徴量を得ることができる。また、それぞれ異なる概念として各ユーザのプロファイルに作成することが可能となる。以上、情報処理装置１０の機能構成について説明した。

〔４〕情報処理装置におけるプロファイル作成処理の詳細
次に、図７を参照して、情報処理装置１０におけるプロファイル作成処理の詳細について説明する。図７は、情報処理装置１０におけるプロファイル作成処理の詳細を示すフローチャートである。図７に示したように、まず、ユーザ操作に応じて、入力部１５２により言語クエリ（概念言語）が入力される（Ｓ１０２）。そして、抽出部１５４は、ステップＳ１０２において、入力された言語クエリと一致する言語（関連言語）と関連付けられた画像群を検索する（Ｓ１０４）。

そして、ステップＳ１０４において検索された関連画像群をユーザに提示する（Ｓ１０６）。ステップＳ１０６においてユーザに提示する関連画像は、抽出部１５４により抽出されたすべての画像でもよいし、一部の画像であってもよい。そして、ユーザにより提示された画像群とユーザが示した概念とが一致しているか否かが判断される。選別部１６０は、ユーザ操作に応じて複数の画像が入力された言語クエリの概念に適合するか否かを判断する（Ｓ１０８）。ステップＳ１０８において、選別部１６０は、ユーザによる判断結果をもとに、よりユーザにとって適切な画像を検索する（Ｓ１１０）。ステップＳ１１０においては、複数の画像を言語クエリの概念に適合する画像と適合しない画像に分類する。

そして、検索した結果を再度ユーザに提示する（Ｓ１０６）。さらに、ユーザは、ステップＳ１０６において提示された画像から、ユーザがイメージする概念により適合した画像を選択する。このように、ユーザのインタラクションをもとに学習され、よりユーザにとって適切な画像が検索されることとなる。ステップＳ１０８において、適切な画像が得られるまで、ステップＳ１０６〜ステップＳ１１０の処理が繰り返される。ステップＳ１０６〜ステップＳ１１０のフィードバック処理により適切な画像を選別することが可能となる。

ここで、図８を参照して、ＳＶＭを用いたフィードバック処理について詳細に説明する。図８は、ＳＶＭを用いたフィードバック処理について説明する説明図である。まず、ＳＶＭの概要について説明する。ＳＶＭはいくつかのｐｏｓｉｔｉｖｅｓａｍｐｌｅとｎｅｇａｔｉｖｅｓａｍｐｌｅを用いてデータ空間に識別境界面を張るアルゴリズムであり、この境界面はサポートベクターと呼ばれるサンプル群によって形成される。トレーニングデータがＮ個の入力ベクトルｘ_１,・・・,ｘ_Ｎとそれに対応するラベルｔ_１,・・・,ｔ_Ｎからなり、未知のデータ点ｘは、

の符号によって分類されるとする。このとき、重みベクトルｗ及びバイアスパラメータｂは、マージン最大化の基準から次の式を最適化することによって得られる。

マージンとは、識別平面からサポートベクターまでの最短の距離を表し、これを最大化することで高い汎化性能を得ることができる。
式（１．２）は、ラグランジュ乗数とＫＫＴ条件の導入により、次の目的関数のαに対する最大化に書き換えられる。

これらをもとに式（１．１）を書き直すと、

となる。式（１．３）の最適化問題は、２次計画法を解くことによって得られ、αが求まれば、バイアスパラメータｂを求めることができる。

適合フィードバックは、一度集まったデータをユーザが評価し、その評価をもとに分類を修正していく手法である。適合フィードバックによる学習及び分類は、“Ｓｅｌｅｃｔｏｒ”と“Ｌｅａｒｎｅｒ”によって行われる。Ｓｅｌｅｃｔｏｒは、ひとつ前の学習及び分類をもとにユーザからフィードバックを受けるべきデータを決定し、Ｌｅａｒｎｅｒは、受けたフィードバックをもとに再学習を行うものである。

ここで、図８を参照して、適合フィードバックによる画像分類について説明する。図８は、適合フィードバックによる画像分類について説明する説明図である。フィードバックの入力を、適合と不適合の２値に限った場合の適合フィードバックは次のような流れとなる。以下では、ユーザに分類対象画像群３０１が提示されて（Ｓｔｅｐ２０２）、ユーザにより適合画像と不適合画像の選択がなされた後のフィードバック処理について説明する。

Ｓｅｌｅｃｔｏｒがフィードバックの対象となる画像をデータベース内からサンプリングし、ユーザに提示する（Ｓｔｅｐ２１０）。そして、ユーザは提示された画像に対して、適合（ｐｏｓｉｔｉｖｅ）か不適合（ｎｅｇａｔｉｖｅ）のフィードバックを与える（Ｓｔｅｐ２０４）。その後、Ｌｅａｒｎｅｒは、Ｓｔｅｐ２０４において受けたフィードバックをトレーニングデータに加え、学習及び分類を行う（Ｓｔｅｐ２０６）。ユーザは、Ｓｔｅｐ２０６において得られた分類結果がユーザのイメージする概念に沿ったものであるかどうかの評価を行う（Ｓｔｅｐ２０８）。分類結果が不十分であれば、フィードバックを続けるため再度Ｓｔｅｐ２１０におけるサンプリングがなされ、新たに選択された画像がユーザに提示される（Ｓｔｅｐ２０４）。

Ｓｔｅｐ２１０でのＳｅｌｅｃｔｏｒによるサンプリングはＭｏｓｔＡｍｂｉｇｕｏｕｓなどの基準で行われる。ＭｏｓｔＡｍｂｉｇｕｏｕｓはＳＶＭによって引かれた識別境界面にもっとも近いデータをサンプリングするものであり、識別の曖昧さを減らすことができる。学習の行われていないインタラクション開始時は、言語検索によって得られた画像群がユーザに提示される。

上記適合フィードバックのＬｅａｒｎｅｒにＳＶＭを用いることで、ユーザ概念にマッチした画像群を集めることができる。画像群によって構築される画像識別器は、適合フィードバックの際に使用したＳＶＭの識別器をそのまま用いても良いし、一度インタラクションが終了すれば、ユーザに対するレスポンス速度を考える必要がなくなるため、計算コストは高いがより強力なＢｏｏｓｔｉｎｇやＢｏｏｔｓｔｒａｐを用いた学習アルゴリズムを用いても良い。

以上、ＳＶＭを用いたフィードバック処理について説明した。図７に戻り、情報処理装置１０におけるプロファイル作成処理の説明を続ける。ステップＳ１０８において、ユーザのイメージする概念に適合すると判定された場合には、収集部１６２は、フィードバック処理により選別された画像に関連付けられた言語情報を収集する（Ｓ１１２）。ステップＳ１１２において収集される言語群は、ユーザの入力した言語クエリには表れなかったものも含まれる。

ユーザの入力した言語クエリに表れなかった言語群は、ユーザの概念を適切に表すものといえる。これは、ユーザの概念を画像として表現することにより、ユーザの概念と画像とを結びつける言語と、コンテンツ作成者の概念と画像を結びつける言語が一致しなかったとしても、画像を通してそれらの概念と両者の言語とを結びつけることが可能となったことを示している。

そして、算出部１６４は、ステップＳ１１２において収集された言語情報から、言語特徴ベクトルを作成する（Ｓ１１４）。ここで、画像に紐付けられた関連言語群から言語特徴量を算出する方法について説明する。図７のステップＳ１１２では、既に行われた概念マッチにより、データベース内の画像はユーザの概念に沿った画像群と、そうでない画像群とに分類されている。また、分類された画像群は、個々の画像に関連付けられた言語群をともなっている。これらの情報をもとに言語特徴量を作成する手段のひとつとしてＴＦ−ＩＤＦ法が考えられる。

ＴＦ−ＩＤＦ法は文書中に現れる単語に対し重要度の重み付けを行う手法である。重要度の重み付けは、文書中の特定単語の出現頻度を表すＴＦ−ＴｅｒｍＦｒｅｑｕｅｎｃｙと、特定単語を含む文書の少なさを表すＩＤＦ−ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙによって計算される。

ある文書における単語ｔ_ｉの出現頻度をｎ_ｉとしたとき、ｔf_iは

となり、idf_１は

となる。このとき{d|t_i∈d}は単語t_iを含む文書数、Ｄは全文書数を表し、idfは多くの文書に出現する単語の重要度を下げ、特定の文書にしか出現しない単語の重要度を上げる働きをしている。このようにtfidfは文書を特徴付ける単語の性質を、その文書内での出現頻度と、少ない文書にしか出現しないという２つの面から表現している。

次に、図９を参照して、本手法におけるＴＦ−ＩＤＦの使用方法について説明する。図９は、ＴＦ−ＩＤＦの使用方法について説明する説明図である。まず、概念マッチにより図９のような画像分類が行われる。すなわち、概念１に属する画像群や、概念２に属する画像群や、どの概念にも属さない画像群に分類される。このとき、それぞれの画像群をひとつの文書とみなし、その画像群に関連付けられている関連言語群を文書に含まれる単語とみなす。これらの文書と単語の集合にＴＦ−ＩＤＦ法を用いることで、ユーザの各概念を特徴付ける単語は、各文書において大きい値のtfidfを持つことになる。各文書から得られた全単語のtfidf値ｗをベクトルとして保存することで、言語特徴量とすることができる。各特徴量同士の距離はユークリッド距離やコサイン距離によって計算することが可能である。

以上、言語特徴量を算出する方法について説明した。図７に戻り、プロファイル作成処理の説明を続ける。ステップＳ１１４において言語特徴ベクトルが作成された後、記録部１６６は、ユーザのプロファイルに図５に示した概念情報を追加する（Ｓ１１６）。ステップＳ１１６においては、図５に示した概念情報のすべてを記録してもよいし、言語クエリと言語特徴量のみ記録するようにしてもよい。また、図６に示した概念地図上に表される概念言語の関連度を記録するようにしてもよい。

本実施形態にかかる情報処理装置１０によれば、ユーザ操作により所定の概念を示す概念言語が入力され、概念言語と記憶部１５６に記憶されている複数の画像に関連する関連言語とが一致する場合に、該関連言語に関連付けられている複数の画像を記憶部から抽出する。そして、ユーザ操作に応じて、抽出された複数の画像から概念言語の概念に適合する画像を選別する。選別された概念言語の概念に適合する画像に関連付けられている関連言語を収集して、収集された関連言語の言語群の言語特徴量を算出する。

このように、ユーザの概念を画像として表現することにより、ユーザの概念と画像とを結びつける言語と、コンテンツ作成者の概念と画像を結びつける言語が一致しなかったとしても、画像を通してそれらの概念と両者の言語とを結びつけることが可能となったことを示している。すなわち、画像を利用した装置とのインタラクションによるプロファイル作成により、各ユーザによって異なる言語と概念の隔たりを緩和することが可能となる。また、画像に付与された言語群を間接的に利用することにより、ユーザ概念に適合した言語特徴量を作成することが可能となる。また、作成した言語特徴量を用いて、ユーザの意図に沿った概念地図を作成することが可能となる。

〔５〕プロファイルの更新例
以上、情報処理装置１０におけるプロファイル作成処理の詳細について説明した。次に、図１０および図１１を参照して、プロファイルの更新例について説明する。プロファイルの更新としては、ユーザの意識的な操作や、情報処理装置１０による自動動作によって行われる。まず、図１０を参照して、ユーザの意識的な操作によるプロファイルの更新について説明する。

ユーザの意識的な操作によるプロファイルの更新の１つには、クエリ言語に対する更新が挙げられる。例えば、すでにプロファイル上に存在するクエリ言語（概念言語）を更新する場合、プロファイル作成機能で示した画像へのフィードバックを通した装置とのインタラクションをもとに、関連画像が収集される。関連画像が収集され更新されると、関連画像に紐付く関連言語群も更新され、概念クエリ以下の情報が更新される。また、同一のクエリ言語に対して異なる概念が作成される場合には、同じクエリ言語を用いて新た概念情報を作成することにより、プロファイルが更新される。

また、複数のクエリ言語（概念言語）がプロファイル上に作成されている場合、図６に示した概念地図の更新をすることも考えられる。上記したように、概念地図は、言語特徴ベクトルに基づく距離計算により作成されている。概念地図作成時は、各特徴量における次元の重みは均等としている。そこで、ユーザ操作に応じて、概念地図に対し、各概念の位置関係を修復する場合、各特徴量における次元の重みを更新することにより地図および距離尺度の更新を実現できる。例えば、図１０に示したように、重みの更新を実現する方法として、概念地図を二次元上に射影し、ＧＵＩを通してユーザが各概念の位置を操作（矢印４０２）し、操作後の位置関係を用いて重みを決定することが考えられる。

次に、図１１を参照して、情報処理装置１０によるプロファイルの更新について説明する。ユーザの操作を入力としない自動更新においては、プロファイル情報がユーザの意図しない方向へ更新されないように注意する必要がある。したがって、本実施形態では、クエリ言語や関連言語などの人によって解釈や言語同士の距離などが大幅に異なる情報は用いないものとする。以下では、クエリ言語に適合する画像から作成された画像認識器１７０を用いたプロファイルの更新について説明する。

図１１に示したように、各概念を認識するための画像認識器１７０は、任意のタイミングで言語＋画像データベース１５７内の画像を認識する。そして、画像認識器１７０に適合した画像および関連言語群４１０を収集する。図５に示したように、画像認識器１７０は、特定の概念と紐付けられているため、収集したデータがどの概念に関連するかがわかる。

これにより、既存の画像および関連言語群に、新たに収集した画像および関連言語群を追加し、言語特徴量の作成を行うことで、各クエリ言語に関連付けられた概念情報データベースの更新を行う。このような更新方法を用いることにより、ユーザの概念からはずれることなく、新たな言語を取り入れることが可能となる。なお、プロファイルの自動更新は、言語＋画像データベース１５７が更新された際や、ユーザの指定したタイミングなどで行われるようにしてもよい。画像認識器１７０を用いてプロファイルを更新することにより、ユーザ概念に適した更新を行うことが可能となる。

〔６〕プロファイルの利用例
以上、プロファイルの更新例について説明した。次に、図１２および図１３を参照して、プロファイルの利用例について説明する。情報処理装置１０により作成されたプロファイルの利用は、プロファイル上に作成された各概念に関連付けられた各種情報や、概念同士の距離を表した概念地図を用いて実現される。プロファイルを利用したサービス例として、検索補助や推薦サービス、コンテンツ作成補助などが考えられる。以下、各サービス例におけるプロファイルの利用例について説明する。

検索補助として利用する際には、例えば、ユーザにより入力されたクエリ言語に関連する関連語を提示することができる。これにより、ユーザが思い浮かべた概念を表す言語を表現できない場合でも、提示された関連語から適合する言語を選択することが可能となる。また、提示された関連語を複数用いることにより、検索対象を絞り込むことも可能となる。また、ユーザにより入力されたクエリ言語の言語特徴量をもとにした検索を実行することもできる。
さらには、作成された画像認識器１７０を介して、検索により得られた画像の認識結果を利用するようにしてもよい。また、ユーザにより入力されたクエリ言語に関連する概念情報データベース１５８が記憶されていなかった場合には、他の概念の関連言語としてクエリ言語が登録されていれば、その概念および関連語を提示することができる。

また、作成されたプロファイルを、コンテンツ等の推薦に利用することができる。図１２は、プロファイルを利用した推薦について説明する説明図である。例えば、図１２に示したように、まず、推薦したいコンテンツ５０１の言語特徴量５０２を算出する。そして、言語特徴量５０２が、各ユーザの概念地図上のどの位置に現れるかを算出する。例えば、ユーザＡの概念地図５０３およびユーザＣの概念地図５０５では、推薦したいコンテンツ５０１の近くに興味の対象となる概念があるため、ユーザＡおよびユーザＣにコンテンツ５０１を推薦する。また、ユーザＢの概念地図５０３では、推薦したいコンテンツ５０１の近くに興味の対象となる概念がないため、ユーザＢにコンテンツ５０１を推薦しない。このように、各ユーザの概念地図を利用することにより、コンテンツ等の推薦の対象となるユーザを的確に把握することが可能となる。

また、概念情報データベース１５８に記憶されている画像認識器１７０を利用して、画像認識器が反応したコンテンツを推薦の対象とするようにしてもよい。また、プロファイルをコンテンツの作成補助として用いることもできる。例えば、各ユーザの持つ概念の関連画像、関連言語を調査することにより、どのようなコンテンツを作成すれば、ユーザビリティを向上することができるのかを検討することが可能となる。

次に、図１３を参照して、プロファイルの物理エージェントにおける利用について説明する。図１３に示したように、例えば、ユーザにより「あれ」という言語が概念として登録されていたとする。例えば、「あれ」の概念は「リモコン」であることが登録されていうとする。この場合、ユーザが「あれ取って来て」という言葉を発した場合、物理エージェント５１１は、「あれ」の画像認識機を取得する。そして、物理エージェント５１１の付近にある認識対象を検索して、画像認識機によりリモコン５１５を認識してユーザの指示に応答することができる。作成されたプロファイルを特定の用途に限定されることなく利用することが可能となる。また、作成されたプロファイルを利用して、各ユーザの意図に沿った検索や推薦をはじめとする様々なサービスや情報を提供することができる。

以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。

例えば、本明細書の情報処理装置１０の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。すなわち、情報処理装置１０の処理における各ステップは、異なる処理であっても並列的に実行されてもよい。

また、情報処理装置１０などに内蔵されるＣＰＵ、ＲＯＭおよびＲＡＭなどのハードウェアを、上述した情報処理装置１０の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。

１０情報処理装置
１５２入力部
１５４抽出部
１５６記憶部
１５７言語＋画像データベース
１５８概念情報データベース
１６０選別部
１６２収集部
１６４算出部
１６６記録部
１６８作成部
１７０画像認識器

Claims

複数の画像と各画像に関連する複数の関連言語とが関連付けられており、
所定の概念を示す概念言語を入力する入力部と、
前記入力部により入力された前記概念言語と前記関連言語とが一致する場合に、前記関連言語に関連付けられている前記複数の画像を抽出する抽出部と、
前記抽出部により抽出された前記複数の画像から、前記概念言語の概念に適合する画像を選別する選別部と、
前記選別部により選別された前記概念言語の概念に適合する画像に関連付けられている関連言語を収集する収集部と、
前記収集部により収集された関連言語の言語群の言語特徴量を算出する算出部と、
を備える、情報処理装置。
前記選別部は、ユーザ操作に応じて、前記抽出部により抽出された前記複数の画像から、前記概念言語の概念に適合する画像を選別する、請求項１に記載の情報処理装置。
前記算出部は、前記収集部により収集された前記関連言語の出現頻度に応じて言語特徴量を算出する、請求項１に記載の情報処理装置。
前記算出部は、前記選別部により前記概念言語に適合されない画像として選別された画像群に関連付けられた関連言語の出現頻度に応じて言語特徴量を算出する、請求項３に記載の情報処理装置。
前記選別部により選別された前記概念言語の概念に適合する画像群から、所定の画像特徴量を認識可能な画像認識器を作成する作成部を備える、請求項１に記載の情報処理装置。
前記算出部により算出された前記言語特徴量を、前記概念言語に対応付けて概念情報として記憶媒体に記録する記録部を備える、請求項１に記載の情報処理装置。
前記記録部は、前記言語特徴量に応じて前記概念言語を所定の概念地図上にマッピングして記録する、請求項６に記載の情報処理装置。
前記記録部は、前記概念言語に、前記選別部により選別された画像を含む関連画像群と、前記収集部により収集された関連言語を含む関連言語群と、前記算出部により算出された前記言語特徴量とを対応付けて前記概念情報として前記記憶媒体に記録している、請求項６に記載の情報処理装置。
前記複数の画像に加えて、新たに複数の画像と各画像に関連する複数の関連言語とが関連付けられた場合、
前記抽出部は、前記概念言語と一致する関連言語に関連付けられている前記複数の画像を抽出し、
前記選別部は、前記概念言語の概念に適合する画像を新たに選別し、
前記収集部は、前記概念言語の概念に適合する画像に関連付けられている関連言語を再収集し、
前記算出部は、前記収集部により再収集された関連言語の言語群の言語特徴量を再算出する、請求項１に記載の情報処理装置。
前記選別部は、ユーザ操作に応じて、前記概念言語の概念に適合する画像を新たに選別する、請求項９に記載の情報処理装置。
前記選別部は、前記作成部により作成された画像認識器による画像認識度に応じて、前記概念言語の概念に適合する画像を新たに選別する、請求項９に記載の情報処理装置。
ユーザ操作に応じて、前記記録部に記録されている前記言語特徴量に応じた前記概念言語の前記概念地図上のマッピングが変更された場合に、
前記算出部は、前記更新された概念地図上の概念言語のマッピング位置に基づいて、前記概念言語の言語特徴量を再算出する、請求項７に記載の情報処理装置。
前記選別部は、前記作成部により作成された前記画像認識器による画像認識度に応じて、前記抽出部により抽出された前記複数の画像から前記概念言語の概念に適合する画像を選別する、請求項１に記載の情報処理装置。
所定の概念を示す概念言語を入力するステップと、
前記入力された前記概念言語と複数の画像に関連付けられている関連言語とが一致する場合に、前記関連言語に関連付けられている前記複数の画像を抽出するステップと、
前記抽出された前記複数の画像から、前記概念言語の概念に適合する画像を選別するステップと、
前記選別された前記概念言語の概念に適合する画像に関連付けられている関連言語を収集するステップと、
前記収集された関連言語の言語群の言語特徴量を算出するステップと、
を含む、情報処理方法。
コンピュータを、
複数の画像と各画像に関連する複数の関連言語とが関連付けられており、
所定の概念を示す概念言語を入力する入力部と、
前記入力部により入力された前記概念言語と前記関連言語とが一致する場合に、前記関連言語に関連付けられている前記複数の画像を抽出する抽出部と、
前記抽出部により抽出された前記複数の画像から、前記概念言語の概念に適合する画像を選別する選別部と、
前記選別部により選別された前記概念言語の概念に適合する画像に関連付けられている関連言語を収集する収集部と、
前記収集部により収集された関連言語の言語群の言語特徴量を算出する算出部と、
を備える、情報処理装置として機能させるためのプログラム。