JP2011203991A

JP2011203991A - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: JP2011203991A
Application number: JP2010070493A
Authority: JP
Inventors: Hiroshi Tateno; 啓舘野
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-03-25
Filing date: 2010-03-25
Publication date: 2011-10-13
Also published as: CN102200959A; US20110238605A1; US8510235B2

Abstract

【課題】能動学習によるコンテンツのラベルの予測精度を向上させる。
【解決手段】正解ラベル取得部１４は、複数のコンテンツの中から選択されたサンプルに対してユーザが付与した正解ラベルを取得し、ユーザ確信度設定部１６は、ユーザが付与した正解ラベルに対するユーザ確信度を設定する。ラベル予測学習部１７は、ラベル予測学習を行い、ラベル予測・確信度計算部１８は、未評価コンテンツのラベルを予測し、予測したラベルに対するラベル確信度を計算する。ユーザ確信度予測部１９は、ユーザ確信度予測学習を行い、未評価コンテンツの予測ラベルに対するユーザ確信度を予測する。サンプル選択部２１は、未評価コンテンツの中から次のサンプルを選択する。本発明は、例えば、コンテンツのラベルを予測するための学習装置に適用できる。
【選択図】図１

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、能動学習（Active Learning）によりコンテンツのラベルを予測する場合に用いて好適な情報処理装置、情報処理方法、およびプログラムに関する。

従来、コンテンツ（例えば、文書）のラベル（例えば、文書カテゴリ）を予測するという課題に対して、能動学習（active learning）が用いられている（例えば、特許文献１参照）。

従来の能動学習では、システムで予測したラベルに対する確信度が低いコンテンツをサンプルに選択し、選択したサンプルにユーザ（ラベルを付与する人）がラベル（以下、正解ラベルとも称する）を付与することにより、少ないサンプル数で効率的に予測性能を上げていた。

特開２００９−１０４６３２号公報

Ben Hachey他，"Investigating the Effects of Selective Sampling on the Annotation Task"，Proceedings of the Ninth Conference on Computational Natural Language Learning, University of Michigan, USA, June 2005, p.144-151

しかし、ラベルの確信度が低いコンテンツ、すなわち、システムでのラベルの予測が難しいコンテンツに対しては、ユーザも適切なラベルを付与するのに困難を伴うことが多い。例えば、楽曲から感じ取る印象をラベルとしてコンテンツ（楽曲データ）に付与する場合、ユーザの判断が揺らぎ、類似する楽曲に対して異なるラベルを付与したり、あまり似ていない楽曲に対して同様のラベルを付与したりする可能性がある。あるいは、複数のユーザ間で印象が大きく異なり、ラベルのバラツキが大きくなる可能性がある。その結果、ユーザが付与する正解ラベルの信頼度が低下し、システムがラベルを予測するための学習を適切に実行できなくなる場合がある。（例えば、非特許文献１参照）。そして、ラベルの予測精度が低下してしまう。

本発明は、このような状況を鑑みてなされたものであり、能動学習によるコンテンツのラベルの予測精度を向上させるようにするものである。

本発明の一側面の情報処理装置は、複数のコンテンツの中から選択されたコンテンツに対してユーザが付与したラベルを取得するラベル取得手段と、前記ユーザが付与した前記ラベルの確からしさを示すユーザ確信度を設定するユーザ確信度設定手段と、前記ラベルが付与されたコンテンツの特徴量および前記ラベルに基づいて、前記ラベルを予測するためのラベル予測学習を行うラベル予測学習手段と、前記ラベルが付与されていないコンテンツに対して、前記ラベル予測学習の結果および当該コンテンツの前記特徴量に基づいて前記ラベルを予測し、予測した前記ラベルの確からしさを示すラベル確信度を計算するラベル予測手段と、前記ラベルが付与されたコンテンツの前記特徴量および前記ユーザ確信度に基づいて、前記ユーザ確信度を予測するためのユーザ確信度予測学習を行い、前記ラベルが付与されていないコンテンツに対して、前記ユーザ確信度予測学習の結果および当該コンテンツの前記特徴量に基づいて、予測された前記ラベルに対する前記ユーザ確信度を予測するユーザ確信度予測手段と、前記ラベルが付与されていないコンテンツの中から、次に前記ラベルを付与するコンテンツを選択する選択手段とを含む。

前記ユーザ確信度設定手段には、前記ユーザがコンテンツに付与する前記ラベルを確定するまでの所要時間または修正回数のうち少なくとも一方に基づいて、前記ユーザ確信度を設定させることができる。

前記ユーザ確信度設定手段には、複数の前記ユーザが付与した前記ラベルのバラツキに基づいて、前記ユーザ確信度を設定させることができる。

前記選択手段には、予測された前記ラベルに対する前記ラベル確信度がより低く、前記ユーザ確信度がより高いコンテンツを優先して次に前記ラベルを付与するコンテンツに選択させることができる。

前記選択手段には、前記ラベルがコンテンツに対する評価である場合、さらに、予測された前記ラベルとしての予測評価値がより高いコンテンツを優先して次に前記ラベルを付与するコンテンツに選択させることができる。

前記選択手段には、さらに、前記ユーザが過去に利用したコンテンツを優先して次に前記ラベルを付与するコンテンツに選択させることができる。

本発明の一側面の情報処理方法は、情報処理装置が、複数のコンテンツの中から選択されたコンテンツに対してユーザが付与したラベルを取得し、前記ユーザが付与した前記ラベルの確からしさを示すユーザ確信度を設定し、前記ラベルが付与されたコンテンツの特徴量および前記ラベルに基づいて、前記ラベルを予測するためのラベル予測学習を行い、前記ラベルが付与されていないコンテンツに対して、前記ラベル予測学習の結果および当該コンテンツの前記特徴量に基づいて前記ラベルを予測し、予測した前記ラベルの確からしさを示すラベル確信度を計算し、前記ラベルが付与されたコンテンツの前記特徴量および前記ユーザ確信度に基づいて、前記ユーザ確信度を予測するためのユーザ確信度予測学習を行い、前記ラベルが付与されていないコンテンツに対して、前記ユーザ確信度予測学習の結果および当該コンテンツの前記特徴量に基づいて、予測された前記ラベルに対する前記ユーザ確信度を予測し、前記ラベルが付与されていないコンテンツの中から、次に前記ラベルを付与するコンテンツを選択するステップを含む。

本発明の一側面のプログラムは、複数のコンテンツの中から選択されたコンテンツに対してユーザが付与したラベルを取得し、前記ユーザが付与した前記ラベルの確からしさを示すユーザ確信度を設定し、前記ラベルが付与されたコンテンツの特徴量および前記ラベルに基づいて、前記ラベルを予測するためのラベル予測学習を行い、前記ラベルが付与されていないコンテンツに対して、前記ラベル予測学習の結果および当該コンテンツの前記特徴量に基づいて前記ラベルを予測し、予測した前記ラベルの確からしさを示すラベル確信度を計算し、前記ラベルが付与されたコンテンツの前記特徴量および前記ユーザ確信度に基づいて、前記ユーザ確信度を予測するためのユーザ確信度予測学習を行い、前記ラベルが付与されていないコンテンツに対して、前記ユーザ確信度予測学習の結果および当該コンテンツの前記特徴量に基づいて、予測された前記ラベルに対する前記ユーザ確信度を予測し、前記ラベルが付与されていないコンテンツの中から、次に前記ラベルを付与するコンテンツを選択するステップを含む処理をコンピュータに実行させる。

本発明の一側面においては、複数のコンテンツの中から選択されたコンテンツに対してユーザが付与したラベルが取得され、前記ユーザが付与した前記ラベルの確からしさを示すユーザ確信度が設定され、前記ラベルが付与されたコンテンツの特徴量および前記ラベルに基づいて、前記ラベルを予測するためのラベル予測学習が行われ、前記ラベルが付与されていないコンテンツに対して、前記ラベル予測学習の結果および当該コンテンツの前記特徴量に基づいて前記ラベルを予測し、予測した前記ラベルの確からしさを示すラベル確信度が計算され、前記ラベルが付与されたコンテンツの前記特徴量および前記ユーザ確信度に基づいて、前記ユーザ確信度を予測するためのユーザ確信度予測学習が行われ、前記ラベルが付与されていないコンテンツに対して、前記ユーザ確信度予測学習の結果および当該コンテンツの前記特徴量に基づいて、予測された前記ラベルに対する前記ユーザ確信度が予測され、前記ラベルが付与されていないコンテンツの中から、次に前記ラベルを付与するコンテンツが選択される。

本発明の一側面によれば、コンテンツのラベルを予測することができる。特に、本発明の一側面によれば、能動学習によるコンテンツのラベルの予測精度を向上させることができる。

本発明を適用した情報処理装置の第１の実施の形態の構成例を示すブロック図である。ラベル予測処理を説明するためのフローチャートである。コンテンツの特徴量の例を示す表である。コンテンツの正解ラベルおよびユーザ確信度の例を示す表である。コンテンツの予測ラベル、ラベル確信度、予測ユーザ確信度、サンプル選択用スコアの例を示す表である。本発明を適用した情報処理装置の第２の実施の形態の構成例を示すブロック図である。評価予測処理を説明するためのフローチャートである。本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

以下、本発明を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．第１の実施の形態（基本構成）
２．第２の実施の形態（コンテンツの推薦処理に適用した例）

＜１．第１の実施の形態＞
まず、図１乃至図５を参照して、本発明の第１の実施の形態について説明する。

［情報処理装置の構成例］
図１は、本発明を適用した情報処理装置１の構成例を示すブロック図である。情報処理装置１は、コンテンツのラベルの予測を行う装置である。ここで、コンテンツとは、例えば、画像データ、動画データ、楽曲データ、各種の商品、文書データなどを指し、特定の種類に限定されるものではない。また、ラベルとは、コンテンツの特徴を表す情報であり、例えば、コンテンツが属するジャンルもしくはカテゴリ、ユーザの主観的な印象（例えば、面白い、悲しいなど）、または、主観的な印象を連続値で表したものなどである。

情報処理装置１は、コンテンツ情報保持部１１、初期サンプル選択部１２、提示部１３、正解ラベル取得部１４、ラベル情報保持部１５、ユーザ確信度設定部１６、ラベル予測学習部１７、ラベル予測・確信度計算部１８、ユーザ確信度予測部１９、終了判定部２０、および、サンプル選択部２１を含むように構成される。

コンテンツ情報保持部１１は、複数のコンテンツに関する各種の情報（例えば、名称、種類、特徴など）を保持している。また、コンテンツに関する情報のうちの一部または全部が、後述するラベルの予測において特徴量として用いられる。例えば、特徴量は、コンテンツが属するジャンル、コンテンツの特徴を表すキーワードなどを含む。また、画像データや楽曲データなどコンテンツが各種の信号（例えば、画像信号、音楽信号など）により表される場合、例えば、それらの信号の特徴を特徴量とすることも可能である。

なお、画像データや楽曲データなど、コンテンツ情報保持部１１で保持可能な形式のコンテンツについては、関連情報とともにコンテンツ自身もコンテンツ情報保持部１１に保持される場合がある。

初期サンプル選択部１２は、コンテンツ情報保持部１１に情報が保持されているコンテンツの中から、初期サンプルを選択する。ここで、初期サンプルとは、最初にユーザが正解ラベルを付与する対象となるコンテンツのことである。初期サンプル選択部１２は、選択した初期サンプルに関する情報を、コンテンツ情報保持部１１から取得し、提示部１３に供給する。

提示部１３は、初期サンプル選択部１２により選択された初期サンプルに関する情報、および、サンプル選択部２１により選択されたサンプルに関する情報をユーザに提示する。また、提示部１３は、ユーザに提示したサンプルに関する情報を正解ラベル取得部１４に供給する。

正解ラベル取得部１４は、図示せぬ入力手段を介して、提示部１３により提示されたサンプルに対してユーザが付与する正解ラベルを取得する。また、正解ラベル取得部１４は、各サンプルに正解ラベルを付与するときのユーザの行動に関する情報（以下、ユーザ行動情報と称する）を取得する。正解ラベル取得部１４は、取得した正解ラベルおよびユーザ行動情報を、対応するコンテンツ（サンプル）との対応関係が分かるようにラベル情報保持部１５に保持させる。

ユーザ確信度設定部１６は、正解ラベルが付与されたサンプルに対する正解ラベルおよびユーザ行動情報をラベル情報保持部１５から取得する。そして、ユーザ確信度設定部１６は、ユーザが各サンプルに付与した正解ラベルに対して、その正解ラベルの確からしさを示すユーザ確信度を設定する。ユーザ確信度設定部１６は、設定したユーザ確信度を、対応するコンテンツ（サンプル）との対応関係が分かるようにラベル情報保持部１５に保持させる。

なお、以下、あるコンテンツ（サンプル）の正解ラベルに対するユーザ確信度を、単に、当該コンテンツのユーザ確信度とも称する。

ラベル予測学習部１７は、既に正解ラベルが付与されているコンテンツ（以下、評価済コンテンツと称する）の特徴量をコンテンツ情報保持部１１から取得し、評価済コンテンツの正解ラベルをラベル情報保持部１５から取得する。そして、ラベル予測学習部１７は、評価済コンテンツの特徴量および正解ラベルに基づいて、所定の手法を用いて各コンテンツのラベルを予測するための学習を行う。ラベル予測学習部１７は、ラベル予測の学習結果をラベル予測・確信度計算部１８に供給する。

ラベル予測・確信度計算部１８は、正解ラベルが付与されていないコンテンツ（以下、未評価コンテンツと称する）の特徴量をコンテンツ情報保持部１１から取得する。そして、ラベル予測・確信度計算部１８は、ラベル予測学習部１７によるラベル予測の学習結果、および、各未評価コンテンツの特徴量に基づいて、各未評価コンテンツのラベルを予測する。また、ラベル予測・確信度計算部１８は、予測したラベル（以下、予測ラベルと称する）の確からしさを示すラベル確信度を計算する。ラベル予測・確信度計算部１８は、予測ラベルを、対応するコンテンツとの対応関係が分かるようにラベル情報保持部１５に保持させる。また、ラベル予測・確信度計算部１８は、各未評価コンテンツに対する予測ラベルおよびラベル確信度を終了判定部２０に供給する。さらに、ラベル予測・確信度計算部１８は、各未評価コンテンツの予測ラベルに対するラベル確信度をサンプル選択部２１に供給する。

なお、以下、あるコンテンツの予測ラベルに対するラベル確信度を、単に、当該コンテンツのラベル確信度とも称する。

ユーザ確信度予測部１９は、各評価済コンテンツの特徴量をコンテンツ情報保持部１１から取得し、各評価済コンテンツのユーザ確信度をラベル情報保持部１５から取得する。そして、ユーザ確信度予測部１９は、各評価済コンテンツのユーザ確信度および特徴量に基づいて、所定の手法を用いて、ユーザ確信度を予測するための学習を行う。また、ユーザ確信度予測部１１９は、各未評価コンテンツの特徴量をコンテンツ情報保持部１１から取得する。そして、ユーザ確信度予測部１１９は、ユーザ確信度予測の学習結果、および、各未評価コンテンツの特徴量に基づいて、各未評価コンテンツの予測ラベルに対するユーザ確信度を予測する。ユーザ確信度予測部１１９は、各未評価コンテンツの予測ラベルに対するユーザ確信度（以下、予測ユーザ確信度と称する）をサンプル選択部２１に供給する。なお、予測ユーザ確信度は、各未評価コンテンツに対して、ユーザがどの程度正確にラベルを付与できるかを示す予測値である。

なお、以下、あるコンテンツの予測ラベルに対する予測ユーザ確信度を、単に、当該コンテンツの予測ユーザ確信度と称する。

終了判定部２０は、ラベル予測処理の終了条件を満たしているか否かを判定し、判定結果をサンプル選択部２１に通知する。

サンプル選択部２１は、ラベル確信度および予測ユーザ確信度に基づいて、未評価コンテンツの中からサンプルを選択する。サンプル選択部２１は、選択したサンプルに関する情報を、コンテンツ情報保持部１１から取得し、提示部１３に供給する。

［ラベル予測処理］
次に、図２のフローチャートを参照して、情報処理装置１により実行されるラベル予測処理について説明する。

なお、以下、図３に示されるように、コンテンツＣ１乃至Ｃ６を含むコンテンツに関する情報がコンテンツ情報保持部１１に保持されているものとする。また、各コンテンツの情報には、特徴量１乃至３の３種類の特徴量が含まれるものとする。なお、以下、説明を簡単にするために、コンテンツＣ１乃至Ｃ６以外のコンテンツに関する説明は省略する。

ステップＳ１において、初期サンプル選択部１２は、コンテンツ情報保持部１１に情報が保持されているコンテンツの中から、初期サンプルを選択する。このとき、初期サンプル選択部１２は、初期サンプルをランダムに選択するようにしてもよいし、初期サンプルの特徴量がばらつくように選択するようにしてもよい。なお、選択する初期サンプルの数は任意の値に設定することが可能である。初期サンプル選択部１２は、選択した初期サンプルに関する情報を、コンテンツ情報保持部１１から取得し、提示部１３に供給する。

なお、以下、図３に示されるコンテンツの中からコンテンツＣ１およびコンテンツＣ２が初期サンプルに選択されたものとする。

ステップＳ２において、提示部１３は、ユーザに対して、サンプルを提示する。なお、サンプルを提示する方法は、特定の方法に限定されるものではなく、任意の方法を採用することができる。例えば、提示部１３は、コンテンツが画像データの場合、画像またはサムネイル画像をディスプレイに表示することにより、ユーザにサンプルを提示する。また、提示部１３は、コンテンツが楽曲データの場合、スピーカなどから実際に音声を出力したり、楽曲のタイトル、演奏者名などをディスプレイに表示したりすることにより、ユーザにサンプルを提示する。提示部１３は、提示したサンプルに関する情報を正解ラベル取得部１４に供給する。

ステップＳ３において、正解ラベル取得部１４は、正解ラベルを取得する。例えば、ユーザは、提示部１３により提示されたサンプルに対して付与する正解ラベルを、図示せぬ入力手段を介して入力する。正解ラベル取得部１４は、ユーザにより入力された正解ラベルを取得する。

また、正解ラベル取得部１４は、正解ラベルを付与するときのユーザの行動に関するユーザ行動情報を取得する。例えば、正解ラベル取得部１４は、各サンプルに付与する正解ラベルを確定するまでの所要時間、および、ラベルの修正回数などをユーザ行動情報として取得する。正解ラベル取得部１４は、取得した正解ラベルおよびユーザ行動情報を、対応するコンテンツ（サンプル）との対応関係が分かるようにラベル情報保持部１５に保持させる。なお、ラベルを付与するユーザの人数は、１人でもよいし、複数でもよい。

なお、以下、図４に示されるように、１人のユーザにより、コンテンツＣ１およびコンテンツＣ２に対して、それぞれ値が１、０の正解ラベルが付与されたものとする。

ステップＳ４において、ユーザ確信度設定部１６は、ユーザ確信度を設定する。具体的には、ユーザ確信度設定部１６は、ステップＳ３の処理において、新たに正解ラベルが付与されたサンプルに対する正解ラベルおよびユーザ行動情報をラベル情報保持部１５から取得する。そして、ユーザ確信度設定部１６は、例えば、ユーザが１人の場合、各サンプルの正解ラベルに対して、正解ラベルを確定するまでの所要時間が短いほど、ユーザ確信度を高く設定し、所要時間が長いほど、ユーザ確信度を低く設定する。なお、ユーザが複数の場合、例えば、所要時間の平均または合計に基づいて、ユーザ確信度を設定するようにすればよい。

あるいは、ユーザ確信度設定部１６は、例えば、ユーザが１人の場合、各サンプルの正解ラベルに対して、正解ラベルを確定するまでの修正回数が少ないほど、ユーザ確信度を高く設定し、修正回数が多いほど、ユーザ確信度を低く設定する。なお、ユーザが複数の場合、例えば、修正回数の平均または合計に基づいて、ユーザ確信度を設定するようにすればよい。

あるいは、ユーザ確信度設定部１６は、例えば、ユーザが複数の場合、各サンプルの正解ラベルに対して、ユーザ間の正解ラベルのバラツキ（例えば、分散）が小さいほど、ユーザ確信度を高く設定し、バラツキが大きいほど、ユーザ確信度を低く設定する。

そして、ユーザ確信度設定部１６は、設定したユーザ確信度を、対応するコンテンツ（サンプル）との対応関係が分かるようにラベル情報保持部１５に保持させる。

なお、上述したように所要時間、修正回数、または、正解ラベルのバラツキを指標にしてユーザ確信度を設定する場合、例えば、その指標が小さくなるほどユーザ確信度が大きくなるような関数（例えば、指標の逆数）を用いて、ユーザ確信度を計算するようにすればよい。

また、以上に挙げた例は、ユーザ確信度の計算方法の一例であり、上記以外の指標を用いて計算するようにしてもよい。

さらに、複数の指標を組み合わせて（例えば、所要時間と修正回数）、ユーザ確信度を設定するようにしてもよい。

また、ユーザ確信度設定部１６がユーザ確信度の計算を行わずに、ユーザが直接ユーザ確信度を付与するようにしてもよい。例えば、ユーザは、サンプルに付与したラベルに対するユーザ確信度を、１（確信度低）から５（確信度高）までの５段階で評価し、図示せぬ入力手段を介して、決定したユーザ確信度を入力する。そして、ユーザ確信度設定部１６は、ユーザにより入力されたユーザ確信度を取得し、対応するコンテンツ（サンプル）との対応関係が分かるようにラベル情報保持部１５に保持させる。

このようにして、各コンテンツ（サンプル）の正解ラベルに対して、その正解ラベルがどの程度確かなものであるか、換言すれば、その正解ラベルがどの程度信頼できるものであるかを示すユーザ確信度が設定される。

なお、以下、図４に示されるように、コンテンツＣ１およびコンテンツＣ２の正解ラベルに対するユーザ確信度が、それぞれ０．２、０．８に設定されたものとする。

ステップＳ５において、ラベル予測学習部１７は、ラベル予測学習を行う。具体的には、ラベル予測学習部１７は、各評価済コンテンツの特徴量をコンテンツ情報保持部１１から取得し、各評価済コンテンツの正解ラベルをラベル情報保持部１５から取得する。なお、このとき対象となる評価済コンテンツには、今回のステップＳ３の処理で新たに正解ラベルが付与されたサンプルも含まれる。そして、ラベル予測学習部１７は、各評価済コンテンツの特徴量および正解ラベルに基づいて、所定の手法を用いて、各コンテンツのラベルを予測するための学習を行う。ラベル予測学習部１７は、ラベル予測の学習結果をラベル予測・確信度計算部１８に供給する。

なお、ラベル予測学習に用いる手法は、特定の手法に限定されるものではなく、例えば、一般的な機械学習の手法を採用することが可能である。例えば、コンテンツが属するジャンルなど、学習対象となるラベルが離散的または名義属性的な性質を有する場合、SVM（Support Vector Machine）やロジスティック回帰（Logistic Regression）などの分類学習の手法を採用することができる。また、コンテンツの面白さの度合いを１から５までの５段階で示すラベルなど、学習対象となるラベルが連続的または順序尺度的な性質を有する場合、例えば、線形回帰やRVR（Relevance Vector Regression）などの手法を採用することができる。

なお、SVMの詳細については、例えば、「Thorsten Joachims, “Text Categorization with Support Vector Machines: Learning with Many Relevant Features”, Machine Learning: ECML-98, Springer Berlin / Heidelberg, 1998, Volume 1398/1998, p.137-142」（以下、非特許文献２と称する）などに記載されている。また、RVRの詳細については、例えば、「Michael E. Tipping, “The Relevance Vector Machine”, NIPS, 2000」（以下、非特許文献３と称する）などに記載されている。

ステップＳ６において、ラベル予測・確信度計算部１８は、コンテンツのラベルを予測し、予測したラベルの確信度を計算する。具体的には、ラベル予測・確信度計算部１８は、正解ラベルが付与されていない未評価コンテンツの特徴量をコンテンツ情報保持部１１から取得する。ラベル予測・確信度計算部１８は、ラベル予測学習部１７によるラベル予測の学習結果、および、各未評価コンテンツの特徴量に基づいて、各未評価コンテンツのラベルを予測する。

また、ラベル予測・確信度計算部１８は、予測した各未評価コンテンツのラベルに対するラベル確信度を計算する。例えば、ラベル予測に用いる手法によっては、予測したラベルに対する確信度に相当する値が計算される場合がある。この場合、ラベル予測・確信度計算部１８は、その値をラベル確信度に設定する。例えば、線形回帰やRVRの場合、予測したラベルに対して計算される事後確率をラベル確信度に設定することが可能である。また、SVMの場合、各ラベルの分離面からの距離をラベル確信度に設定することが可能である。

このようにして、各コンテンツのラベルが予測され、予測したラベルがどの程度確かなものであるか、換言すれば、予測したラベルがどの程度信頼できるものであるかを示すラベル確信度が計算される。

ラベル予測・確信度計算部１８は、各未評価コンテンツの予測ラベルを、対応するコンテンツとの対応関係が分かるようにラベル情報保持部１５に保持させる。また、ラベル予測・確信度計算部１８は、各未評価コンテンツの予測ラベルおよびラベル確信度を終了判定部２０に供給する。さらに、ラベル予測・確信度計算部１８は、各未評価コンテンツのラベル確信度をサンプル選択部２１に供給する。

なお、以下、図５に示されるように、未評価コンテンツであるコンテンツＣ３乃至Ｃ６のラベルが、それぞれ１、１、０、０と予測され、ラベル確信度が、それぞれ０．２、０．８、０．９、０．１５と算出されたものとする。

ステップＳ７において、ユーザ確信度予測部１９は、ユーザ確信度予測学習を行う。具体的には、ユーザ確信度予測部１９は、各評価済コンテンツの特徴量をコンテンツ情報保持部１１から取得し、各評価済コンテンツのユーザ確信度をラベル情報保持部１５から取得する。なお、このとき対象となる評価済コンテンツには、今回のステップＳ３の処理において新たに正解ラベルが付与されたサンプルも含まれる。そして、ユーザ確信度予測部１９は、各評価済コンテンツのユーザ確信度および特徴量に基づいて、ラベル予測学習で用いられるのと同様の一般的な機械学習の手法を用いて、ユーザ確信度を予測するための学習を行う。

ステップＳ８において、ユーザ確信度予測部１９は、ユーザ確信度を予測する。具体的には、ユーザ確信度予測部１９は、各未評価コンテンツの特徴量をコンテンツ情報保持部１１から取得する。ユーザ確信度予測部１９は、ユーザ確信度予測の学習結果、および、各未評価コンテンツの特徴量に基づいて、各未評価コンテンツの予測ラベルに対するユーザ確信度を予測する。ユーザ確信度予測部１９は、各未評価コンテンツの予測ユーザ確信度をサンプル選択部２１に供給する。

なお、以下、図５に示されるように、コンテンツＣ３乃至Ｃ６に対する予測ユーザ確信度が、それぞれ０．１、０．５、０．７５、０．８と予測されたものとする。

なお、ステップＳ５およびステップＳ６の処理と、ステップＳ７およびステップＳ８の処理とは、どちらを先に実行するようにしてもよいし、あるいは、並列に実行するようにしてもよい。

ステップＳ９において、終了判定部２０は、終了条件を満たしているか否かを判定する。例えば、終了判定部２０は、全てのコンテンツに対してユーザにより正解ラベルが付与されている場合、終了条件を満たしていると判定する。

一方、正解ラベルが付与されていないコンテンツが存在する場合、例えば、終了判定部２０は、全ての未評価コンテンツのラベル確信度が所定の閾値以上であるとき、終了条件を満たしていると判定し、ラベル確信度が所定の閾値未満の未評価コンテンツが存在するとき、終了条件を満たしていないと判定する。あるいは、例えば、終了判定部２０は、各未評価コンテンツの予測ラベルをもとにした交差検定（Cross Validation）を行う。そして、終了判定部２０は、交差検定により得られた精度が所定の閾値以上であるとき、終了条件を満たしていると判定し、得られた精度が所定の閾値未満であるとき、終了条件を満たしていないと判定する。

そして、終了判定部２０は、まだ終了条件を満たしていないと判定した場合、判定結果をサンプル選択部２１に通知し、その後、処理はステップＳ１０に進む。

ステップＳ１０において、サンプル選択部２１は、サンプルを選択する。例えば、サンプル選択のための指標としては、予測精度を最も改善するものやパラメータの変化量が最も多いものなどが考えられるが、ここでは、ラベル確信度および予測ユーザ確信度を用いる場合を説明する。

ラベル予測学習において、ラベル確信度が低いコンテンツに対する正解ラベルの方が、ラベル確信度が高いコンテンツに対する正解ラベルより価値が高い。なぜなら、例えば、ラベル予測学習に分類学習を用いる場合、ラベル確信度が低いコンテンツほど分離面に近く、分離面に近いコンテンツの正解ラベルが得られれば、より正確に分離面を作成することができるからである。従って、ラベル予測学習を行う上では、よりラベル確信度が低いコンテンツがサンプルに選択されることが望ましい。

一方、ユーザにとっては、より予測ユーザ確信度が高いコンテンツがサンプルに選択されることが望ましい。なぜなら、予測ユーザ確信度が高いコンテンツほど、ユーザが、より短時間で、より正確にラベルを付与できる確率が高く、ユーザの精神的および時間的負担を軽減できるからである。

そこで、サンプル選択部２１は、予測ユーザ確信度に対しては単調増加し、ラベル確信度に対しては単調減少するような関数を用いて、各未評価コンテンツに対して、サンプル選択の判定基準となるサンプル選択用スコアを計算する。そして、例えば、サンプル選択部２１は、サンプル選択用スコアが高い方から所定の個数の未評価コンテンツをサンプルに選択する。あるいは、例えば、サンプル選択部２１は、サンプル選択用スコアが所定の閾値以上の未評価コンテンツをサンプルに選択する。これにより、予測ラベルに対するラベル確信度がより低く、予測ユーザ確信度がより高いコンテンツが優先してサンプルに選択される。

なお、ラベル確信度が高いコンテンツに対する正解ラベルは、ラベル予測学習においてそれほど有用ではないため、ラベル確信度が所定の閾値以上の未評価コンテンツを、サンプルの選択候補から除外するようにしてもよい。

そして、サンプル選択部２１は、選択したサンプルに関する情報を、コンテンツ情報保持部１１から取得し、提示部１３に供給する。

図５は、サンプル選択用スコア＝予測ユーザ確信度÷ラベル確信度とした場合の、サンプル選択用スコアの例を示している。具体的には、コンテンツＣ３乃至Ｃ６のサンプル選択用スコアは、それぞれ０．５、０．６２５、０．８３３、５．３３３である。例えば、コンテンツＣ３乃至Ｃ６の中からサンプルを１つ選択する場合、コンテンツＣ４およびコンテンツＣ５は、ラベル確信度がそれぞれ０．８、０．９と高いので、サンプルの候補から除外される。そして、残りのコンテンツＣ３とコンテンツＣ６とを比べると、コンテンツＣ６の方がサンプル選択用スコアが高いので、コンテンツＣ６がサンプルに選択される。

その後、処理はステップＳ２に戻り、ステップＳ９において、終了条件を満たしていると判定されるまで、ステップＳ２乃至Ｓ１０の処理が繰返し実行される。これにより、コンテンツのラベル予測に対する能動学習が行われ、各コンテンツのラベルが予測される。

一方、ステップＳ９において、終了条件を満たしていると判定された場合、ラベル予測処理は終了する。

このようにして、コンテンツのラベルを予測するための能動学習をより高速に収束させることができるとともに、学習精度が向上する。その結果、各コンテンツに対するラベルの予測精度が向上する。また、正解ラベルを付与する際のユーザの精神的および時間的負担を軽減することができる。

＜２．第２の実施の形態＞
次に、図６および図７を参照して、本発明の第２の実施の形態について説明する。なお、第２の実施の形態は、例えば、ユーザに各種のコンテンツを提供し、ユーザが、提供されたコンテンツを利用（例えば、視聴）し、それに応じてコンテンツにラベルを付与するようなコンテンツ配信サービスに本発明を適用することを想定したものである。

なお、以下、ユーザ毎の嗜好を表す評価情報をラベルとしてコンテンツに付与し、付与された評価情報に基づいて他のコンテンツの評価を予測し、予測した評価に基づいて、ユーザにコンテンツを推薦する例について説明する。なお、この評価情報は、例えば、好きもしくは嫌いの二者択一、または、好き嫌いの程度に基づく５段階評価などにより与えられる。

［情報処理装置の構成例］
図６は、本発明を適用した情報処理装置１０１の構成例を示すブロック図である。情報処理装置１０１は、コンテンツ情報保持部１１１、初期サンプル選択部１１２、提示部１１３、評価情報取得部１１４、評価情報保持部１１５、ユーザ確信度設定部１１６、評価予測学習部１１７、評価予測・確信度計算部１１８、ユーザ確信度予測部１１９、終了判定部１２０、サンプル選択部１２１、および、推薦アイテム選択部１２２を含むように構成される。なお、図１と対応する部分には下２桁が同じ符合を付してあり、処理が同じ部分については、その説明は、繰返しになるので省略する。

初期サンプル選択部１１２は、コンテンツ情報保持部１１１に情報が保持されているコンテンツの中から、初期サンプルを選択する。また、初期サンプル選択部１１２は、選択した初期サンプルに関する情報を、コンテンツ情報保持部１１１から取得し、提示部１１３に供給する。

提示部１１３は、初期サンプル選択部１１２により選択された初期サンプルに関する情報、サンプル選択部１２１により選択されたサンプルに関する情報、および、推薦アイテム選択部１２２により選択された推薦アイテムに関する情報をユーザに提示する。また、提示部１１３は、ユーザに提示したコンテンツ（サンプルおよび推薦アイテム）に関する情報を評価情報取得部１１４に供給する。

評価情報取得部１１４は、図示せぬ入力手段を介して、提示部１１３により提示された推薦アイテムおよびサンプルに対してユーザが付与する評価情報を取得する。また、評価情報取得部１１４は、各推薦アイテムおよび各サンプルに評価情報を付与するときのユーザの行動に関するユーザ行動情報を取得する。評価情報取得部１１４は、取得した評価情報およびユーザ行動情報を、対応するコンテンツ（推薦アイテムおよびサンプル）との対応関係が分かるように評価情報保持部１１５に保持させる。

ユーザ確信度設定部１１６は、評価情報が付与された推薦アイテムおよびサンプルの評価情報およびユーザ行動情報を評価情報保持部１１５から取得する。そして、ユーザ確信度設定部１１６は、各推薦アイテムおよび各サンプルの評価情報に対するユーザ確信度を設定する。ユーザ確信度設定部１１６は、設定したユーザ確信度を、対応するコンテンツ（推薦アイテムおよびサンプル）との対応関係が分かるように評価情報保持部１１５に保持させる。

評価予測学習部１１７は、既に評価情報が付与されている評価済コンテンツの特徴量をコンテンツ情報保持部１１１から取得し、評価済コンテンツの評価情報を評価情報保持部１１５から取得する。そして、評価予測学習部１１７は、評価済コンテンツの特徴量および評価情報に基づいて、所定の手法を用いて各コンテンツの評価を予測するための学習を行う。評価予測学習部１１７は、評価予測の学習結果を評価予測・確信度計算部１１８に供給する。

評価予測・確信度計算部１１８は、評価情報が付与されていない未評価コンテンツの特徴量をコンテンツ情報保持部１１１から取得する。そして、評価予測・確信度計算部１１８は、評価予測学習部１１７による評価予測の学習結果、および、各未評価コンテンツの特徴量に基づいて、各未評価コンテンツの評価を予測する。また、評価予測・確信度計算部１１８は、予測した各未評価コンテンツの評価（以下、予測評価値と称する）の確からしさを示す評価確信度を計算する。評価予測・確信度計算部１１８は、各未評価コンテンツの予測評価値を、対応するコンテンツとの対応関係が分かるように評価情報保持部１１５に保持させる。また、評価予測・確信度計算部１１８は、各未評価コンテンツの予測評価値および評価確信度を終了判定部１２０に供給する。さらに、評価予測・確信度計算部１１８は、各未評価コンテンツの評価確信度をサンプル選択部１２１に供給する。また、評価予測・確信度計算部１１８は、各未評価コンテンツの予測評価値を推薦アイテム選択部１２２に供給する。

ユーザ確信度予測部１１９は、各評価済コンテンツの特徴量をコンテンツ情報保持部１１１から取得し、各評価済コンテンツのユーザ確信度を評価情報保持部１１５から取得する。そして、ユーザ確信度予測部１１９は、各評価済コンテンツのユーザ確信度および特徴量に基づいて、所定の手法を用いて、ユーザ確信度を予測するための学習を行う。また、ユーザ確信度予測部１１９は、各未評価コンテンツの特徴量をコンテンツ情報保持部１１１から取得する。そして、ユーザ確信度予測部１１９は、ユーザ確信度予測の学習結果、および、各未評価コンテンツの特徴量に基づいて、各未評価コンテンツのユーザ確信度を予測する。ユーザ確信度予測部１１９は、予測した各未評価コンテンツのユーザ確信度（予測ユーザ確信度）をサンプル選択部１２１に供給する。

終了判定部１２０は、評価予測処理の終了条件を満たしているか否かを判定し、判定結果をサンプル選択部１２１に通知する。

サンプル選択部１２１は、評価確信度および予測ユーザ確信度に基づいて、未評価コンテンツの中からサンプルを選択する。サンプル選択部１２１は、選択したサンプルに関する情報を、コンテンツ情報保持部１１１から取得し、提示部１１３に供給する。

推薦アイテム選択部１２２は、所定の推薦アルゴリズムを用いて、ユーザに推薦するコンテンツである推薦アイテムを選択する。推薦アイテム選択部１２２は、選択した推薦アイテムに関する情報を、コンテンツ情報保持部１１１から取得し、提示部１１３に供給する。

［評価予測処理］
次に、図７のフローチャートを参照して、情報処理装置１０１により実行される評価予測処理について説明する。

ステップＳ１０１において、初期サンプル選択部１１２は、図２のステップＳ１と同様の処理により、初期サンプルを選択する。初期サンプル選択部１１２は、選択した初期サンプルに関する情報を、コンテンツ情報保持部１１１から取得し、提示部１１３に供給する。

ステップＳ１０２において、推薦アイテム選択部１２２は、所定の推薦アルゴリズムを用いて、推薦アイテムを選択する。なお、推薦アイテム選択部１２２が用いる推薦アルゴリズムは、特定のアルゴリズムに限定されるものではなく、任意のものを採用することができる。例えば、推薦アイテム選択部１２２は、対象となるユーザのコンテンツの評価履歴が存在しない場合（例えば、本処理の最初のループ）、他のユーザの平均評価値が高いコンテンツを推薦アイテムに選択する。また、例えば、推薦アイテム選択部１２２は、対象となるユーザのコンテンツの評価履歴が存在する場合、後述する評価予測などにより得られる予測評価値が高いコンテンツを推薦アイテムに選択する。

ステップＳ１０３において、提示部１１３は、ユーザに対して、推薦アイテムおよびサンプルを提示する。なお、推薦アイテムおよびサンプルを提示する方法は、図２のステップＳ２の処理と同様に、特定の方法に限定されるものではなく、任意の方法を採用することができる。

ただし、評価予測学習の効率化を目的とするサンプルと、予測評価値が高い推薦アイテムとが必ずしも重なるとは限らない。そして、例えば、推薦アイテムを一覧にした推薦リストとは別にサンプルを提示すると、ユーザがサンプルに対して評価情報を付与する可能性が低くなることが予想される。従って、例えば、推薦リストの最下位に１つだけサンプルを混入するなどして、サンプルに対して自然に評価情報が付与されるように、推薦アイテムおよびサンプルを提示するようにすることが望ましい。

そして、提示部１３は、提示した推薦アイテムおよびサンプルに関する情報を評価情報取得部１１４に供給する。

ステップＳ１０４において、評価情報取得部１１４は、評価情報を取得する。例えば、ユーザは、提示部１１３により提示された推薦アイテムおよびサンプルに対して付与する評価情報を、図示せぬ入力手段を介して入力する。評価情報取得部１１４は、ユーザにより入力された評価情報を取得する。

また、評価情報取得部１１４は、各推薦アイテムおよび各サンプルに評価情報を付与するときのユーザの行動に関するユーザ行動情報を取得する。例えば、評価情報取得部１１４は、各推薦アイテムおよび各サンプルに付与する評価を確定するまでの所要時間、および、評価の修正回数などをユーザ行動情報として取得する。評価情報取得部１１４は、取得した評価情報およびユーザ行動情報を、対応するコンテンツ（推薦アイテムおよびサンプル）との対応関係が分かるように評価情報保持部１１５に保持させる。

なお、このとき、第１の実施の形態と異なり、提示した推薦アイテムおよびサンプルに対して必ずしも評価情報が付与されるとは限らない。

ステップＳ１０５において、ユーザ確信度設定部１１６は、図２のステップＳ４と同様の処理により、推薦アイテムおよびサンプルに付与された評価情報に対するユーザ確信度を設定する。そして、ユーザ確信度設定部１６は、設定したユーザ確信度を、対応するコンテンツ（推薦アイテムおよびサンプル）との対応関係が分かるように評価情報保持部１１５に保持させる。

ステップＳ１０６において、評価予測学習部１１７は、評価予測学習を行う。具体的には、評価予測学習部１１７は、各評価済コンテンツの特徴量をコンテンツ情報保持部１１１から取得し、各評価済コンテンツの評価情報を評価情報保持部１１５から取得する。なお、このとき対象となる評価済コンテンツには、今回のステップＳ１０４の処理において新たに評価情報が付与された推薦アイテムおよびサンプルも含まれる。そして、評価予測学習部１１７は、各評価済コンテンツの特徴量および評価情報に基づいて、所定の手法を用いて、各コンテンツの評価を予測するための学習を行う。評価予測学習部１１７は、評価予測の学習結果を評価予測・確信度計算部１１８に供給する。

なお、評価予測の学習に用いる手法は、特定の手法に限定されるものではなく、例えば、第１の実施の形態のラベル予測学習と同様に、特徴量とラベルの対応関係を学習する一般的な機械学習の手法、あるいは、協調フィルタリングなどの手法を採用することができる。

なお、協調フィルタリングの詳細については、例えば、「Robert M. Bell他, “Scalable Collaborative Filtering with Jointly Derived Neighborhood Interpolation Weights”, Proceedings of the 2007 Seventh IEEE International Conference on Data Mining, ICDM, 2007, p.43-52」（以下、非特許文献４と称する）、「P. Resnick他, “GroupLens: An Open Architecture for Collaborative Filtering of Netnews”, Proceedings of the 1994 ACM conference on Computer supported cooperative work table of contents, Computer Supported Cooperative Work, 1994, p.175-186」（以下、非特許文献５と称する）などに記載されている。

ステップＳ１０７において、評価予測・確信度計算部１１８は、コンテンツの評価を予測し、予測した評価の確信度を計算する。具体的には、評価予測・確信度計算部１１８は、未評価コンテンツの特徴量をコンテンツ情報保持部１１１から取得する。評価予測・確信度計算部１１８は、評価予測学習部１１７による評価予測の学習結果、および、各未評価コンテンツの特徴量に基づいて、各未評価コンテンツに対する評価を予測する。

また、評価予測・確信度計算部１１８は、予測した各未評価コンテンツへの評価に対する評価確信度を計算する。例えば、評価予測に用いる手法が、第１の実施形態のラベル予測に用いる手法と同様である場合、図２のステップＳ６の処理と同様にして、評価確信度を計算することができる。

また、評価予測に協調フィルタリングが用いられる場合、例えば、上述した非特許文献４では、ユーザuのアイテムiに対する予測評価値rp_uiは、次式（１）を用いて、ユーザ間の類似度s_uvに応じた加重平均を用いて算出される。

なお、ra_uはユーザuの平均評価値

この場合、評価確信度に相当する値は明らかには求まらない。しかし、式（１）の右辺の分子のs_uv(r_vi-ra_v)または(r_vi-ra_v)がばらついている（分散が大きい）と、評価予測が難しいと考えられるため、例えば、それらの分散の逆数などを評価確信度に設定することが可能である。

評価予測・確信度計算部１１８は、各未評価コンテンツの予測評価値を、対応するコンテンツとの対応関係が分かるように評価情報保持部１１５に保持させる。また、評価予測・確信度計算部１１８は、各未評価コンテンツの予測評価値および評価確信度を終了判定部１２０に供給する。さらに、評価予測・確信度計算部１１８は、各未評価コンテンツの評価確信度をサンプル選択部１２１に供給する。また、評価予測・確信度計算部１１８は、各未評価コンテンツの予測評価値を推薦アイテム選択部１２２に供給する。

ステップＳ１０８において、ユーザ確信度予測部１１９は、ユーザ確信度予測学習を行う。具体的には、ユーザ確信度予測部１１９は、各評価済コンテンツの特徴量をコンテンツ情報保持部１１１から取得し、各評価済コンテンツのユーザ確信度を評価情報保持部１１５から取得する。なお、このとき対象となる評価済コンテンツには、今回のステップＳ１０４の処理において新たに評価情報が付与された推薦アイテムおよびサンプルも含まれる。そして、ユーザ確信度予測部１１９は、各評価済コンテンツのユーザ確信度および特徴量に基づいて、評価予測学習で用いられるのと同様の手法を用いて、ユーザ確信度を予測するための学習を行う。

ステップＳ１０９において、ユーザ確信度予測部１１９は、図２のステップＳ８の処理と同様にして、各未評価コンテンツの予測評価値に対するユーザ確信度を予測する。ユーザ確信度予測部１１９は、各未評価コンテンツの予測ユーザ確信度を、終了判定部１２０およびサンプル選択部１２１に供給する。

ステップＳ１１０において、終了判定部１２０は、図２のステップＳ９の処理と同様にして、終了条件を満たしているか否かを判定する。終了条件を満たしていないと判定された場合、処理はステップＳ１１１に進む。

ステップＳ１１１において、サンプル選択部１２１は、未評価コンテンツの中から、サンプルを選択する。ここで、例えば、図２のステップＳ１０の処理と同様に、より評価確信度が低く、より予測ユーザ確信度が高いコンテンツを優先してサンプルに選択するようにしてもよい。

また、例えば、コンテンツ推薦を行う上では、よりユーザの嗜好に合うコンテンツ、すなわち予測評価値が高いコンテンツをサンプルとして選択し、提示することが望ましい。従って、上記の条件に加えて、より予測評価値が高いコンテンツを優先して選択するようにしてもよい。例えば、予測ユーザ確信度×予測評価値÷評価確信度により算出されるスコアの高い順にサンプルを選択するようにしてもよい。

さらに、例えば、ユーザがコンテンツを利用した履歴（例えば、視聴履歴など）が記録されている場合、上記の条件に加えて、ユーザが過去に利用したコンテンツを優先してサンプルに選択するようにしてもよい。例えば、ユーザが利用したことがない未知のサンプルに対しては、サンプルを実際に利用したり、サンプルの付加情報などを参照したりしないと、評価情報を付与できないため、ユーザにとって手間や時間がかかる。そのため、サンプルに評価情報が付与される可能性が低くなり、得られる評価情報が減少することが予想される。一方、ユーザが利用したことがある既知のサンプルに対しては、改めてサンプルを利用したり、サンプルの付加情報などを参照したりしなくても、ユーザは速やかに評価情報を付与することができる。そのため、サンプルに評価情報が付与される可能性が高くなり、得られる評価情報が増加することが予想される。従って、ユーザがすでに利用したコンテンツを優先してサンプルに選択することにより、効率よく評価情報を収集できるともに、評価予測学習の精度が向上する。

その後、処理はステップＳ１０２に戻り、ステップＳ１１０において、終了条件を満たしていると判定されるまで、ステップＳ１０２乃至Ｓ１１１の処理が繰返し実行される。これにより、コンテンツの評価予測に対する能動学習が行われ、各コンテンツの評価が予測され、その結果に基づいて、ユーザにコンテンツが推薦される。

一方、ステップＳ１１０において、終了条件を満たしていると判定された場合、評価予測処理は終了する。なお、評価予測処理は終了するが、コンテンツの推薦処理は継続され、引き続き、推薦アイテムが選択され、ユーザに提示される。

このようにして、コンテンツの評価を予測するための能動学習をより高速に収束させることができるとともに、学習精度が向上する。その結果、各コンテンツに対する評価の予測精度が向上し、よりユーザの嗜好に合ったコンテンツを推薦することができ、サービスに対するユーザの満足度が向上する。

なお、推薦アイテム選択部１２２において推薦アイテムを選択するために用いる予測評価値を計算するアルゴリムと、評価予測・確信度計算部１１８において予測評価値を計算するアルゴリズムとは異なっていてもよい。

上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

図８は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータにおいて、CPU（Central Processing Unit）３０１，ROM（Read Only Memory）３０２，RAM（Random Access Memory）３０３は、バス３０４により相互に接続されている。

バス３０４には、さらに、入出力インタフェース３０５が接続されている。入出力インタフェース３０５には、入力部３０６、出力部３０７、記憶部３０８、通信部３０９、及びドライブ３１０が接続されている。

入力部３０６は、キーボード、マウス、マイクロフォンなどよりなる。出力部３０７は、ディスプレイ、スピーカなどよりなる。記憶部３０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部３０９は、ネットワークインタフェースなどよりなる。ドライブ３１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア３１１を駆動する。

以上のように構成されるコンピュータでは、CPU３０１が、例えば、記憶部３０８に記憶されているプログラムを、入出力インタフェース３０５及びバス３０４を介して、RAM３０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU３０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア３１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア３１１をドライブ３１０に装着することにより、入出力インタフェース３０５を介して、記憶部３０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部３０９で受信し、記憶部３０８にインストールすることができる。その他、プログラムは、ROM３０２や記憶部３０８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

なお、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。

本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

１情報処理装置，１２初期サンプル選択部，１３提示部，１４正解ラベル取得部，１６ユーザ確信度設定部，１７ラベル予測学習部，１８ラベル予測・確信度計算部，１９ユーザ確信度予測部，２１サンプル選択部，１０１情報処理装置，１１２初期サンプル選択部，１１３提示部，１１４評価情報取得部，１１６ユーザ確信度設定部，１１７評価予測学習部，１１８評価予測・確信度計算部，１１９ユーザ確信度予測部，１２１サンプル選択部，１２２推薦アイテム選択部

Claims

複数のコンテンツの中から選択されたコンテンツに対してユーザが付与したラベルを取得するラベル取得手段と、
前記ユーザが付与した前記ラベルの確からしさを示すユーザ確信度を設定するユーザ確信度設定手段と、
前記ラベルが付与されたコンテンツの特徴量および前記ラベルに基づいて、前記ラベルを予測するためのラベル予測学習を行うラベル予測学習手段と、
前記ラベルが付与されていないコンテンツに対して、前記ラベル予測学習の結果および当該コンテンツの前記特徴量に基づいて前記ラベルを予測し、予測した前記ラベルの確からしさを示すラベル確信度を計算するラベル予測手段と、
前記ラベルが付与されたコンテンツの前記特徴量および前記ユーザ確信度に基づいて、前記ユーザ確信度を予測するためのユーザ確信度予測学習を行い、前記ラベルが付与されていないコンテンツに対して、前記ユーザ確信度予測学習の結果および当該コンテンツの前記特徴量に基づいて、予測された前記ラベルに対する前記ユーザ確信度を予測するユーザ確信度予測手段と、
前記ラベルが付与されていないコンテンツの中から、次に前記ラベルを付与するコンテンツを選択する選択手段と
を含む情報処理装置。
前記ユーザ確信度設定手段は、前記ユーザがコンテンツに付与する前記ラベルを確定するまでの所要時間または修正回数のうち少なくとも一方に基づいて、前記ユーザ確信度を設定する
請求項１に記載の情報処理装置。
前記ユーザ確信度設定手段は、複数の前記ユーザが付与した前記ラベルのバラツキに基づいて、前記ユーザ確信度を設定する
請求項１に記載の情報処理装置。
前記選択手段は、予測された前記ラベルに対する前記ラベル確信度がより低く、前記ユーザ確信度がより高いコンテンツを優先して次に前記ラベルを付与するコンテンツに選択する
請求項１に記載の情報処理装置。
前記選択手段は、前記ラベルがコンテンツに対する評価である場合、さらに、予測された前記ラベルとしての予測評価値がより高いコンテンツを優先して次に前記ラベルを付与するコンテンツに選択する
請求項４に記載の情報処理装置。
前記選択手段は、さらに、前記ユーザが過去に利用したコンテンツを優先して次に前記ラベルを付与するコンテンツに選択する
請求項５に記載の情報処理装置。
情報処理装置が、
複数のコンテンツの中から選択されたコンテンツに対してユーザが付与したラベルを取得し、
前記ユーザが付与した前記ラベルの確からしさを示すユーザ確信度を設定し、
前記ラベルが付与されたコンテンツの特徴量および前記ラベルに基づいて、前記ラベルを予測するためのラベル予測学習を行い、
前記ラベルが付与されていないコンテンツに対して、前記ラベル予測学習の結果および当該コンテンツの前記特徴量に基づいて前記ラベルを予測し、予測した前記ラベルの確からしさを示すラベル確信度を計算し、
前記ラベルが付与されたコンテンツの前記特徴量および前記ユーザ確信度に基づいて、前記ユーザ確信度を予測するためのユーザ確信度予測学習を行い、
前記ラベルが付与されていないコンテンツに対して、前記ユーザ確信度予測学習の結果および当該コンテンツの前記特徴量に基づいて、予測された前記ラベルに対する前記ユーザ確信度を予測し、
前記ラベルが付与されていないコンテンツの中から、次に前記ラベルを付与するコンテンツを選択する
ステップを含む情報処理方法。
複数のコンテンツの中から選択されたコンテンツに対してユーザが付与したラベルを取得し、
前記ユーザが付与した前記ラベルの確からしさを示すユーザ確信度を設定し、
前記ラベルが付与されたコンテンツの特徴量および前記ラベルに基づいて、前記ラベルを予測するためのラベル予測学習を行い、
前記ラベルが付与されていないコンテンツに対して、前記ラベル予測学習の結果および当該コンテンツの前記特徴量に基づいて前記ラベルを予測し、予測した前記ラベルの確からしさを示すラベル確信度を計算し、
前記ラベルが付与されたコンテンツの前記特徴量および前記ユーザ確信度に基づいて、前記ユーザ確信度を予測するためのユーザ確信度予測学習を行い、
前記ラベルが付与されていないコンテンツに対して、前記ユーザ確信度予測学習の結果および当該コンテンツの前記特徴量に基づいて、予測された前記ラベルに対する前記ユーザ確信度を予測し、
前記ラベルが付与されていないコンテンツの中から、次に前記ラベルを付与するコンテンツを選択する
ステップを含む処理をコンピュータに実行させるためのプログラム。