CN101568014B - 评估设备和方法 - Google Patents
评估设备和方法 Download PDFInfo
- Publication number
- CN101568014B CN101568014B CN2009101336907A CN200910133690A CN101568014B CN 101568014 B CN101568014 B CN 101568014B CN 2009101336907 A CN2009101336907 A CN 2009101336907A CN 200910133690 A CN200910133690 A CN 200910133690A CN 101568014 B CN101568014 B CN 101568014B
- Authority
- CN
- China
- Prior art keywords
- evaluation
- assessment
- expression formula
- user
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0278—Product appraisal
Abstract
一种评估设备,包括:预测计算单元,被配置为基于由表示多个使用者中的每一个对于多个评价目标中的每一个的评价的评价值构成的评价矩阵和评估表达式来评估未由使用者进行过评价的评价目标的评价值,并且获得作为评估的评价值的预测评价值,评估表达式用于通过应用评价矩阵的计算来评估评价值;以及线性组合单元,被配置为通过应用线性组合系数对通过应用多个评估表达式获得的多个预测评价进行线性组合,由此获得对于未由使用者进行过评价的评价目标的评价的最终评估结果,其中,利用至少一个临时预测矩阵和所述线性组合系数来计算每个使用者对于每个内容的最终的预测评价值,所述至少一个临时预测矩阵是通过所述多个评估表达式中的至少一个按照至少一种评估方法生成的。
Description
技术领域
本发明涉及一种评估设备和方法以及程序,并且具体地,涉及适合应用于向使用者推荐内容的情况下的评估设备和方法以及程序。
背景技术
迄今为止,根据现有技术,存在通过协同过滤算法来评估使用者对于预定内容的评价的技术。
具体地,对于应用这种协同过滤算法的信息处理设备,存在一种信息处理设备,该信息处理设备通过应用查看和听取与感兴趣的使用者类似的其他使用者的历史内容来执行协同过滤处理,以评估对于感兴趣的使用者的每个内容的评价(例如,见日本未审查专利申请公开No.2005-167628)。通过这种信息处理设备,在多个内容中,具有最高评估的评价的内容被作为感兴趣的使用者所喜欢的事物推荐给该使用者。
发明内容
然而,通过上述技术,难以精确地评估使用者对于内容的评价。
例如,对于应用协同过滤算法的信息处理设备,只是应用查看和听取与感兴趣的使用者类似的使用者的历史来评估对于感兴趣的使用者的内容的评价。因此,关于对于内容的评价的评估,其中反映不出对于该内容的普遍评价,即全部使用者的评价,并且因此,通过评估所获得的评价可能与感兴趣的使用者的真实评价相去甚远。
已经认识到需要使得使用者对于内容的评价能够被精确评估。
根据本发明的实施例,一种评估设备包括:预测计算单元,被配置为基于由表示多个使用者中的每一个对于多个评价目标中的每一个的评价的评价值构成的评价矩阵和评估表达式来评估未由使用者进行过评价的评价目标的评价值,并且获得作为评估的评价值的预测评价值,评估表达式用于通过应用评价矩阵的计算来评估评价值;以及线性组合单元,被配置为通过应用线性组合系数对通过应用多个评估表达式所获得的多个预测评价进行线性组合,由此获得对于未由使用者进行过评价的评价目标的评价的最终评估结果,其中,利用至少一个临时预测矩阵和所述线性组合系数来计算每个使用者对于每个内容的最终的预测评价值,所述至少一个临时预测矩阵是通过所述多个评估表达式中的至少一个按照至少一种评估方法生成的。
评估表达式可以由多个算子构成,所述算子包括执行协同过滤计算的算子。
评估设备还可以包括:评估表达式候选生成单元,被配置为将多个评估表达式作为评估表达式候选,评估表达式候选是最新应用于计算最终评估结果的多个评估表达式的候选,并且该评估表达式候选生成单元生成任意新的评估表达式和通过修改多个评估表达式中的一些评估表达式的一部分获得的新的评估表达式来作为评估表达式候选;评估结果生成单元,被配置为,针对每个评估表达式候选,基于评估表达式候选和评价矩阵,计算评价矩阵中的每个使用者对于多个评价目标中的每一个的预测评价值,来生成由通过计算而获得的预测评价值构成的评价结果;线性组合系数计算单元,被配置为将多个评估结果中的一些作为使用的评估结果,并且在应用使用的评估表达式候选作为评估表达式的情况下通过应用使用的评估结果和评价矩阵来获得线性组合系数,使用的评估表达式候选是用于生成使用的评价结果的评估表达式候选;评价单元,被配置为计算作为对于使用的评估表达式候选和线性组合系数的评价的信息量基准,根据所述信息量基准,如果评估表达式候选和线性组合系数候选越适合于生成所述预测评价矩阵,则对该评估表达式候选和线性组合系数候选的评价越高;以及选择单元,被配置为根据信息量基准选择使用的评估表达式候选和线性组合系数中具有最高评价的使用的评估表达式候选作为新应用于最终评估结果计算的多个评估表达式和线性组合系数。
线性组合系数计算单元,在属于多个组中的一个组的多个使用者中,可以应用属于与所述组相同的组的使用者的评价值和预测评价值来获得每个组的线性组合系数,其中根据所述评价矩阵将所述多个所述使用者分成所述多个组。
根据本发明的实施例,一种评估方法或程序包括以下步骤:基于由表示多个使用者中的每一个对于多个评价目标中的每一个的评价的评价值构成的评价矩阵和评估表达式来评估未由使用者进行过评价的评价目标的评价值,并且获得作为评估的评价值的预测评价值,评估表达式用于通过应用评价矩阵的计算来评估评价值;以及通过应用线性组合系数对通过应用多个评估表达式获得的多个预测评价值进行线性组合,由此获得对于未由使用者进行过评价的评价目标的评价的最终评估结果,其中,利用至少一个临时预测矩阵和所述线性组合系数来计算每个使用者对于每个内容的最终的预测评价值,所述至少一个临时预测矩阵是通过所述多个评估表达式中的至少一个按照至少一种评估方法生成的。
通过上述实施例,基于由表示多个使用者中的每一个对于多个评价目标中的每一个的评价的评价值构成的评价矩阵和评估表达式来评价未由使用者进行过评价的评价目标的评价值,评估表达式用于通过应用评价矩阵的计算来评估评价值的,并且获得作为评估的评价值的预测评价值,并且通过应用线性组合系数对通过应用多个评估表达式获得的多个预测评价值进行线性组合,由此获得对于未由使用者进行过评价的评价目标的评价的最终评估结果。
根据本发明的实施例,使用者对于内容的评价可以被更精确地评估。
附图说明
图1是说明应用本发明的实施例的内容推荐系统的概况的图示;
图2是说明应用本发明的实施例的内容推荐系统的概况的图示;
图3是示出了内容推荐系统的配置示例的框图;
图4是示出了预测评价值计算单元的更详细的配置示例的框图;
图5是示出了学习单元的更详细的配置示例的框图;
图6是说明使用者评价矩阵的更新处理的流程图;
图7是示出了评估表达式的示例的图示;
图8是示出了算子的示例的图示;
图9A至9C是示出了评估表达式的示例的图示;
图10是说明推荐处理的流程图;
图11是说明算子的计算的具体示例的图示;
图12是说明算子的计算的具体示例的图示;
图13是说明算子的计算的具体示例的图示;
图14是说明算子的计算的具体示例的图示;
图15是说明算子的计算的具体示例的图示;
图16是说明算子的计算的具体示例的图示;
图17是说明临时预测矩阵的生成的图示;
图18是说明使用者预测矩阵的生成的图示;
图19是说明学习处理的流程图;
图20是说明对使用者的分组的图示;
图21是说明评估候选生成处理的流程图;
图22A至22F是说明突变处理的示例的图示;
图23是说明交叉处理的示例的图示;
图24是说明评估处理的流程图;
图25是说明评估表达式候选的计算的图示;
图26是说明评估结果的生成的图示;
图27是说明评估表达式选择处理的流程图;以及
图28是示出了计算机的配置示例的框图。
具体实施方式
应用本发明的实施例将在以下参照附图进行说明。首先,将参照图1和图2说明应用了本发明的实施例的内容推荐系统的概况。
对于这种内容推荐系统,例如图1所示,预先注册了多个使用者和内容。注意,在图1中,水平方向上的C1至CM表示内容,并且竖直方向上的U1至UN表示使用者。也就是说,对于内容推荐系统,M个内容C1至CM和N个使用者U1至UN被预先注册。每个使用者将表示对内容的评价的评价值输入到一些已注册的内容。例如,我们说内容的评价被划分为五个阶段,即厌恶、不喜欢、无所谓、喜欢和最喜欢,并且表示每个评价的数值1-5被作为评价值输入。这里,我们说评价值越大,使用者对于内容的评价就越高。
例如,在图1中,使用者U4对于内容C1和C5进行了评价,并且输入“5”作为内容C5的评价值。也就是说,可以发现使用者U4对于内容C5的评价很高。注意,作为使用者的评价目标的内容可以是任何类型的目标,例如运动图像或书籍等,只要该目标是基于使用者的喜好评价的评价目标。
这样,在由每个使用者输入对于内容的评价值后,获得表示对于每个使用者对内容的评价值的信息。由此获得的表示每个使用者对于内容的评价值的信息被保持在内容推荐系统作为使用者评价矩阵。
当获得使用者评价矩阵时,内容推荐系统基于使用者评价矩阵中之前输入的评价值来预测(评估)还没有输入的内容的评价值,并且生成由通过预测获得的预测评价值和之前输入的评价值构成的预测评价矩阵。
这里,之前输入的评价值是指是由使用者输入的评价值。例如,在图1中,“1”被作为使用者U1对于内容C1的评价值而输入,并且该评价值“1”作为之前输入的评价值。同样,对于以下说明,未通过使用者输入的评价值,即图1中为空白栏的值将被称为未输入的评价值。例如,使用者U2对于内容C1的评价值实际上并未输入,因此不存在,但是使用者U2对于内容C1的未被输入的评价值将被称为未输入的评价值。
这样,内容推荐系统预测使用者评价矩阵内的未输入的评价值,并且在获得作为其预测结果的预测评价值后,由此获得由预测评价值和之前输入的评价值构成的预测评价矩阵。因此,例如,图2中所示的预测评价矩阵从图1中所示的使用者评价矩阵中获得。注意,在图2中,阴影栏内的评价值表示预测评价值。例如,对于图2中的预测评价矩阵,对于使用者U2的内容C1的评价值被设置为通过预测获得的预测评价值“2”。
当获得关于使用者评价矩阵的每个空白栏的值的预测评价值,即未输入的评价值,并且获得预测评价矩阵时,内容推荐系统向预定的使用者提供表示被评估为使用者最喜欢的内容的信息,以推荐该内容。
例如,在向使用者U2推荐内容的情况下,内容推荐系统将已注册内容中具有最大预测评价值的内容推荐给使用者U2。也就是说,在内容C1至CM中,使用者U2的预测评价值为最大值“5”的内容C5被评估为使用者最喜欢的内容,并且被推荐给使用者U2。
因此,例如图3中所示,配置用于从使用者评价矩阵获得预测评价矩阵以将内容推荐给使用者的推荐系统。在图3中,内容推荐系统被配置为接口处理设备11和推荐设备12,并且接口处理设备11和推荐设备12相互连接。
接口处理设备11由使用者操作,并且执行关于使用者的接口处理。例如,接口处理设备11将由使用者输入的评价值提供到推荐设备12,或者显示从推荐设备12提供的表示推荐给使用者的内容的信息。
推荐设备12基于从接口处理设备11提供的评价值而生成使用者评价矩阵,并且基于使用者评价矩阵生成预测评价矩阵,并且将内容推荐给使用者。推荐设备12包括输入接受单元21、使用者评价矩阵保持单元22、学习单元23、评估表达式保持单元24、预测评价值计算单元25、预测评价矩阵保持单元26和推荐单元27。
输入接受单元21接受使用者的评价值的输入。也就是说,输入接受单元21将从接口处理设备11提供的评价值提供到使用者评价矩阵保持单元22。使用者评价矩阵保持单元22基于从输入接受单元21提供的评价值而生成使用者评价矩阵并保持该矩阵。更具体地,每次从输入接受单元21提供评价值时,使用者评价矩阵保持单元22应用提供的评价值来更新被保持的使用者评价矩阵。同样,使用者评价矩阵保持单元22将被保持的使用者评价矩阵提供到学习单元23和预测评价值计算单元25。
学习单元23应用从使用者评价矩阵保持单元22提供的使用者评价矩阵来生成在从使用者评价矩阵生成预测评价矩阵时应用的评估表达式和线性组合系数,并且将这些评估表达式和线性组合系数提供到评估表达式保持单元24。对于学习单元23,生成一个或多个评估表达式和针对每个使用者的线性组合系数。评估表达式保持单元24保持从学习单元23提供的评估表达式和线性组合系数,并且将被保持的评估表达式和线性组合系数提供到预测评价值计算单元25。
预测评价值计算单元25应用来自使用者评价矩阵保持单元22的使用者评价矩阵以及来自评估表达式保持单元24的评估表达式和线性组合系数来计算对于使用者评价矩阵中的未输入的评价值的预测评价值,并且将该预测评价值提供到预测评价矩阵保持单元26。
预测评价矩阵保持单元26基于来自预测评价值计算单元25的预测评价值而生成预测评价矩阵,并保持该预测评价矩阵,并且将被保持的预测评价矩阵提供到推荐单元27。推荐单元27基于从预测评价矩阵保持单元26提供的预测评价矩阵来搜索要推荐给预定使用者的内容,并且将表示由搜索结果获得的内容的推荐信息提供到接口处理设备11。
图4是示出了图3中的预测评价值计算单元25的详细的配置示例的框图。预测评价值计算单元25包括临时预测单元51和预测单元52,并且使用者评价矩阵和评估表达式被从使用者评价矩阵保持单元22和评估表达式保持单元24提供到临时预测单元51,并且线性组合系数被从评估表达式保持单元24提供到预测单元52。
这里,评估表达式是用于(例如,通过协同过滤算法)执行用以获得未输入的评价值的预测评价值的计算的运算表达式,。换句话说,用于通过应用协同过滤算法的预定的评估方法获得预测评价值的运算表达式被作为评估表达式。同样,对应于评估表达式的针对每个使用者的线性组合系数是在对根据多个评估表达式的预测结果进行线性组合时应用的系数。
临时预测单元51应用提供的使用者评价矩阵和评估表达式来计算使用者评价矩阵中未输入的评价值的临时预测评价值,并且将该临时预测评价值提供到预测单元52。更具体地,临时预测单元51将与使用者评价矩阵相同的矩阵(信息)作为临时预测矩阵,并且应用评估表达式来执行对于临时预测矩阵的计算。随后,临时预测单元51将由对于临时预测矩阵的一个使用者的每个内容的评价值构成的信息作为临时使用者预测矩阵。
因此,临时使用者预测矩阵由对于一个使用者的内容的之前输入的评价值和临时预测评价值构成,并且临时预测矩阵由每个使用者的临时使用者预测矩阵构成。
例如,如果我们说提供图1中的使用者评价矩阵,则临时预测单元51对于使用者U1的未输入的评价值,即对于内容C3和内容C5-CM,应用一个评估表达式Fk来获得使用者U1的临时预测评价值。随后,临时预测单元51将由内容C1、C2和C4的之前输入的评价值以及内容C3和C5-CM的临时预测评价值构成的信息提供到预测单元52作为对于评估表达式Fk的使用者U1的临时使用者预测矩阵。
因此,例如,在将K个评估表达式F1至Fk提供到临时预测单元51的情况下,关于使用者U1至UN中的每一个所获得的每个评估表达式Fk(其中1≤k≤K)的临时使用者预测矩阵Tnk(其中1≤k≤K,1≤n≤N)从临时预测单元51提供到预测单元52。也就是说,总共N×K个临时使用者预测矩阵Tnk被提供到预测单元52。
预测单元52应用来自临时预测单元51的临时预测评价值和从评估表达式保持单元24提供的线性组合系数来获得最终的预测评价值,并且将该最终的预测评价值提供到预测评价矩阵保持单元26。更具体地,预测单元52通过对每个使用者应用线性组合系数而对每个使用者的临时使用者预测矩阵进行线性组合,并且将作为由此获得的结果的使用者预测矩阵提供到预测评价矩阵保持单元26。
例如,关于使用者Un(其中1≤n≤N)获得的K个临时使用者预测矩阵Tn1至Tnk通过使用者Un的线性组合系数进行线性组合,由此提供使用者Un的使用者预测矩阵An。随后,关于N个使用者获得的总共N个使用者预测矩阵A1至AN被提供到预测评价矩阵保持单元26,并且生成由这些使用者预测矩阵构成的预测评价矩阵。
其次,图5是示出了图3中的学习单元23的更详细的配置示例的框图。学习单元23通过遗传编程生成用于生成预测评价矩阵的更适合的评估表达式和线性组合系数。换句话说,学习单元23通过遗传编程应用协同过滤算法而使评估表达式和线性组合系数最优化,由此建立推荐算法,用于以节省劳力的方式将被评估为使用者最喜欢的内容推荐给该使用者。
学习单元23包括候选生成单元91、评估结果计算单元92、组生成单元93和评估表达式选择单元94,并且来自使用者评价矩阵保持单元22的使用者评价矩阵通过评估表达式选择单元94提供到评估结果计算单元92。
候选生成单元91应用从评估表达式选择单元94提供的K个评估表达式F1至Fk以生成评估表达式候选J1至JS(其中k≤S),该J1至JS是新的评估表达式候选,并且将这些新的评估表达式候选提供到评估结果计算单元92。也就是说,候选生成单元91应用遗传编程从前一代的评估表达式生成作为下一代的评估表达式候选的S个评估表达式候选。候选生成单元91包括突变处理单元111、交叉处理单元112和随机处理单元113。
突变处理单元111通过应用从评估表达式选择单元94提供的评估表达式来执行突变处理,由此生成评估表达式候选。这里,突变处理意为通过修改一个评估表达式的一部分来生成一个新的评估表达式的处理。
交叉处理单元112应用从评估表达式选择单元94提供的评估表达式来执行交叉处理,由此生成评估表达式候选。这里,交叉处理意为通过将一个评估表达式的一部分改变为另一个评估表达式的一部分来生成一个新的评估表达式的处理。也就是说,对于交叉处理,一个评估表达式的一部分被替换为另一个评估表达式的一部分。
随机处理单元113执行随机处理,由此生成评估表达式候选。这里,随机处理意为通过组合随机选择的算子来生成一个新的评估表达式的处理。也就是说,根据随机处理,在没有应用前一代的评估表达式的情况下生成任意新的评估表达式候选。
候选生成单元91将从评估表达式选择单元94提供的前一代的评估表达式,以及由突变处理、交叉处理和随机处理生成的新的评估表达式的总共S个提供给评估结果计算单元92作为评估表达式候选。
评估结果计算单元92应用从使用者评价矩阵保持单元22提供的使用者评价矩阵和从候选生成单元91提供的评估表达式候选来为每个评估表达式候选Js(其中1≤s≤S)执行使用者评价矩阵的评价值的评估,并且将其评估结果Hs(其中1≤s≤S)提供到评估表达式选择单元94。
也就是说,评估结果计算单元92将与使用者评价矩阵相同的矩阵(信息)作为对于一个评估表达式候选的(矩阵的)评估结果,并且应用该评估表达式候选来评估对于评估结果(使用者评价矩阵)中的每个使用者的每个内容的评价值。随后,评估结果计算单元92将通过评估获得每个评价值的评估结果作为对于所应用的评估表达式候选的最终评估结果。因此,数量为评估表达式候选的数量的评估结果从评估结果计算单元92提供到评估表达式选择单元94。
组生成单元93应用从使用者评价矩阵保持单元22提供的使用者评价矩阵来执行关于预先注册的使用者U1至UN的分组,并且将表示每个使用者组和属于该使用者组的使用者的组信息提供到评估表达式选择单元94。
例如,使用者简介在适当的情况下被提供到组生成单元93,所述使用者简介是表示每个使用者的年龄、性别、地址、最喜欢的类型等等的信息。组生成单元93适当地应用所提供的使用者简介来执行分组,使得使用者U1至UN中的每一个都属于预定的使用者组G1至GQ中的一个使用者组。
评估表达式选择单元94应用来自使用者评价矩阵保持单元22的使用者评价矩阵、来自评估结果计算单元92的评估结果Hs以及来自组生成单元93的使用者组信息来生成下一代的评估表达式和线性组合系数,并且将这些下一代的评估表达式和线性组合系数提供到候选生成单元91和评估表达式保持单元24。
评估表达式选择单元94包括组合系数计算单元114、评价单元115和选择单元116。
组合系数计算单元114假设选择S个评估结果中的一些,并且用于获得每个所选择的评估结果的评估表达式候选中的每个组合被应用作为评估表达式。随后,在评估表达式候选的组合被作为评估表达式的情况下,组合系数计算单元114应用所提供的使用者评价矩阵、评估结果和使用者组信息来获得每个使用者组的线性组合系数作为是线性组合系数候选的线性组合系数。
评价单元115关于由组合系数计算单元114获得的评估表达式候选的组合和线性组合系数候选而获得对于评估表达式候选和线性组合系数候选的评价。也就是说,这些评估表达式候选和线性组合系数候选越适合于生成预测评价矩阵,则对该评估表达式候选和线性组合系数候选的评价越高。例如,计算信息量基准作为对于评估表达式候选和线性组合系数候选的评价指标。
选择单元116在评估表达式候选的组合和线性组合系数候选中选择具有最高评价的评估表达式候选的组合和线性组合系数候选,并且将这些应用作为下一代的评估表达式和线性组合系数。
评估表达式选择单元94将由选择单元116选择的下一代的评估表达式和线性组合系数提供到候选生成单元91和评估表达式保持单元24。这里,下一代的评估表达式的数量K不必为特定的固定数量,并且因此,每一代的数量K可以在1至上限Kmax之间波动。
此外,当预先在内容推荐系统中注册的使用者Un(其中1≤n≤N)操作接口处理设备11以输入对于预定内容Cm(其中1≤m≤M)的评价值时,输入的评价值从接口处理设备11提供到输入接受单元21。之后,通过推荐设备12启动用于更新使用者评价矩阵的使用者评价矩阵更新处理。以下将参照图6中的流程图对通过推荐设备12进行的使用者评价矩阵更新处理进行说明。
在步骤S11中,输入接受单元21获得由使用者输入的评价值。随后,输入接受单元21将所获得的评价值提供到使用者评价矩阵保持单元22。
在步骤S12中,使用者评价矩阵保持单元22基于从输入接受单元21提供的评价值来更新所保持的使用者评价矩阵,并且使用者评价矩阵更新处理结束。例如,在使用者评价矩阵保持单元22保持图1中所示的使用者评价矩阵,并且对于使用者U1的内容C3的评价值从输入接受单元21提供的情况下,使用者评价矩阵保持单元22将所提供的评价值写入由所保持的使用者评价矩阵中的使用者U1和内容C3确定的栏中,来更新使用者评价矩阵。
这样,推荐设备12更新所保持的使用者评价矩阵。因而,每次由使用者输入评价值时,使用者评价矩阵都被更新,由此可以获得更可靠的预测评价矩阵。
对于预测评价值计算单元25,通过应用由此在适当的情况下被更新的使用者评价矩阵,和来自评估表达式保持单元24的评估表达式以及线性组合系数来执行预测评价值的计算。
此外,例如图7所示的用于计算预测评价值的评估表达式被配置为具有通过基本算法执行计算的算子,即用于评估对于使用者的内容的评价的算子的组合。同样,在评估表达式中包括用于执行协同过滤的计算(即根据协同过滤算法的计算)的至少一个算子。
图7中所示的评估表达式的每个部分W11至W14包括一个算子,并且评估表达式被配置为这些算子的组合。例如,部分W11包括处理轴参数“U#”以及算子“Normalize Avg”。
这里,处理轴参数意为用于确定使用者评价矩阵(临时预测矩阵)的评价值(之前输入的评价值和未输入的评价值中的至少任何一个评价值)中的待处理的评价值的信息。也就是说,处理轴参数“U#”表示相同使用者的评价值被作为处理目标。例如,对于使用者U1的内容C1至CM的评价值变为处理目标。同样,算子“Normalize Avg”表示使用者评价矩阵中的评价值以评价值的平均值被归一化。
评估表达式的部分W12包括处理轴参数“C#”和算子“FillAvg”,其中处理轴参数“C#”表示相同内容的评价值被作为处理目标,算子“FillAvg”表示使用者评价矩阵(临时预测矩阵)的空白栏,即未输入的评价值的栏被填入评价值的平均值。
同样,评估表达式的部分W13包括处理轴参数“U;C#”和算子合“CF-Pearson(8)”,其中处理轴参数“U;C#”表示在将相同使用者的评价值作为处理目标之后,进一步将对于相同内容的评价值作为处理目标,算子“CF-Pearson(8)”用于通过以皮尔逊相关性(Pearson correlation)的降序排列的八个使用者的评价值来计算预测评价值。应用由这种算子执行的皮尔逊相关性的计算是协同过滤算法的典型示例。
注意,算子“CF-Pearson(8)”中的数字“8”表示用于表示通过算子进行的运算处理中的变量的值的参数。也就是说,这里,参数“8”表示应用了八个使用者的评价值。
此外,评估表达式的部分W14包括算子“Sqrt”,该算子“Sqrt”表示获得每个评价值的平方根。
因而,对于由多个算子构成的评估表达式,以附图中从左侧算子到右边算子的顺序执行计算。也就是说,根据图7中所示的评估表达式,首先,使用者评价矩阵(临时预测矩阵)的之前输入的评价值对于每个用户被归一化,并且每个内容的评价值的平均值被作为该内容的未输入的评价值。随后,获得使用者之间的皮尔逊相关性,并且对于每个使用者,从该使用者的评价值和具有高皮尔逊相关性的八个使用者,获得该使用者的未输入的评价值,并且最终,获得每个评价值的平方根,并且将所获得的值作为最终的之前输入的评价值或预测评价值。
因而,在一些情况下,根据包括在评估表达式中的算子通过该算子的运算处理对使用者评价矩阵(临时预测矩阵)中之前输入的评价值进行处理。
同样,例如,对于包括在评估表达式中的算子,可以构思图8中所示的算子。在图8中,算子显示在左侧的算子名称栏中,并且由左侧栏的算子表示的计算的处理内容显示在右侧的处理内容栏中。
具体地,算子“NormalizeMaxMin”是用于以最大值和最小值对评估值进行归一化的算子,而算子“NormalizeAvg”是用于利用评价值的平均值对评价值进行归一化的算子。
同样,算子“FillMax”是用于以评价值的最大值填入使用者评价矩阵的空白栏的算子,而算子“FillMin”是用于以评价值的最小值填入使用者评价矩阵的空白栏的算子。此外,算子“FillMedian”是用于以评价值的中值填入使用者评价矩阵的空白栏的算子,而算子“FillAvg”是用于以评价值的平均值填入使用者评价矩阵的空白栏的算子。
此外,算子“CF-Correl(num)”是根据余弦距离从最高相关性中提取num个评价值的平均值作为预测评价值的算子,而算子“CF-Pearson(num)”是从最高皮尔逊相关性中提取num个评价值的平均值作为预测评价值的算子。此外,同样地,算子“CF-Euclid(num)”是从最近的欧几里得距离中提取num个评价值的平均值作为预测评价值的算子。这里,算子“CF-Correl(num)”、“CF-Pearson(num)”和“CF-Euclid ian(num)”中的“num”表示参数。
同样地,存在用于执行关于指数函数的计算的算子,例如用于计算对数的算子“log”,用于计算指数函数的算子“Exp”,用于计算平方根的算子“Sqrt”等等。此外,还存在用于执行三角函数的计算的算子,例如用于计算正弦函数的算子“Sin”,用于计算余弦函数的算子“Cos”,用于计算正切函数的算子“Tan”等等。
我们说,对于用于填入使用者评价矩阵(临时预测矩阵Tk或评估结果Hs)的空白栏的算子的计算,即对于用于获得未输入的评价值的预测评价值的算子的计算,待计算的栏的评价值不被应用来获得该栏的预测评价值的计算。
作为可以通过这种算子的组合获得的评估表达式的另一个示例,例如,存在如图9A至9C中所示的评估表达式。
对于图9A中所示的评估表达式,首先,在使用者评价矩阵(临时预测矩阵)的评价值对于每个用户被归一化为0至1的值后,对每个评价值进行正弦函数的计算,由此获得各使用者之间的余弦距离。随后,在评价内容Cm的使用者中,与待处理的使用者根据余弦距离具有最高相关性的一个使用者对于内容Cm的评价值被作为对于该待处理的使用者的内容Cm的预测评价值。
同样,对于图9B中所示的评估表达式,在使用者已经评价的内容中,选择了与待处理的内容根据欧几里得距离具有最高相关性的三个内容,并且将对于所选择内容的使用者的评价值的平均值作为待处理的内容的预测评价值。
此外,对于图9C中所示的评估表达式,对使用者评价矩阵(临时预测矩阵)的每个评价值进行对数函数的计算,对于每个内容,获得对于该内容的每个使用者的评价值的平均值,并且所获得的平均值被作为该内容的预测评价值。
推荐设备12应用上述评估表达式和线性组合系数来获得使用者评价矩阵中的未输入的评价值的预测评价值,由此推荐设备12可以向每个使用者推荐内容。
例如,推荐设备12周期性地或者根据来自接口处理设备11的指令执行推荐处理以生成表示要被推荐给使用者的内容的推荐信息。由推荐设备12进行的推荐处理将在以下参照图10中的流程图进行说明。
在步骤S41中,预测评价值计算单元25将评估表达式参数k设置为1,该评估表达式参数k用于确定从评估表达式保持单元24提供的评估表达式Fk(其中1≤k≤K)。也就是说,当评估的参数k被设置为1时,通过评估表达式参数k=1确定评估表达式F1,并且该评估表达式F1被用于处理。
在步骤S42中,临时预测单元51用从使用者评价矩阵保持单元22提供的使用者评价矩阵的评价值替换表示使用者U1至UN对于内容的评价值的临时预测矩阵Tk。也就是说,与使用者评价矩阵相同的信息(矩阵)被用作对于评估表达式Fk的临时预测矩阵Tk(其中1≤k≤K)。例如,在评估表达式参数k=1的情况下,与使用者评价矩阵相同的信息被用作对于评估表达式F1的临时预测矩阵T1。
在步骤S43中,临时预测单元51选择构成评估表达式Fk的一个算子,该评估表达式Fk被选择作为用于处理的评估表达式。例如,在图7中所示的评估表达式被提供作为评估表达式Fk的情况下,在图7中,算子被从左侧的算子至右侧的算子顺序地选择。因此,例如,对于图7中的评估表达式,算子“NormalizeAvg”第一个被选择。
在步骤S44中,临时预测单元51对临时预测矩阵Tk进行由所选择的算子表示的运算处理。
在步骤S45中,临时预测单元51确定关于用于处理的评估表达式Fk,即由评估表达式参数k确定的评估表达式Fk是否执行由构成评估表达式Fk的所有算子执行的运算处理。
在步骤S45中确定没有执行由所有算子进行的运算处理的情况下,即在没有选择所有算子的情况下,处理返回到步骤S43,并且重复上述处理。具体地,选择构成评估表达式Fk的下一个算子,并且执行通过该算子进行的运算处理。
另一方面,在步骤S45中确定执行了由所有算子进行的运算处理的情况下,对于临时预测矩阵Tk的计算通过应用用于处理的评估表达式Fk来执行,由此临时预测单元51通过应用评估表达式Fk向预测单元52提供进行过运算处理的临时预测矩阵Tk。随后,处理进行到步骤S46。
具体地,例如,如果我们说选择了图7中的评估表达式Fk,则这意味着包括在评估表达式Fk中的四个算子被顺序选择来执行对于临时预测矩阵Tk的计算。
更具体地,如果我们说提供了图1中的使用者评价矩阵,并且选择了图7中所示的评估表达式Fk,如图11中左侧所示,与图1中的使用者评价矩阵相同的信息被作为临时预测矩阵Tk。随后,临时预测矩阵Tk通过图7中包括在部分W11中的算子进行计算,对于每个使用者,评价值被归一化,使得关于每个使用者,对于该使用者的每个内容的评价值的平均值变为1。因而,获得如图11的右侧中所示的临时预测矩阵Tk。
例如,当在归一化之前关注临时预测矩阵Tk中的使用者U1时,使用者U1对于内容C1、C2和C4分别输入评价值“1”、“2”和“4”。之后,临时预测单元51将内容C1、C2和C4的评价值归一化使得对于这些内容的评价值的平均值变为1。
因而,例如图11中右侧所示,在通过算子进行计算后,获得评价值“0.43”)作为使用者U1对于内容C1的评价值。
因而,当执行了包括在图7中的评估表达式Fk的部分W11中的算子的计算时,之后,选择包括在部分W12中的算子,并且如图12所示,临时预测矩阵Tk通过该算子进行计算。
也就是说,如图12中左侧所示,在评价被归一化的临时预测矩阵Tk中的空白栏填入相应内容的评价值的平均值,由此获得在所述附图的右侧中所示的临时预测矩阵Tk。例如,注意归一化临时预测矩阵Tk中的内容C1,通过使用者U1、U4和U6执行评价,并且其评价值为“0.43”、“0.89”和“0.57”。
因此,临时预测单元51获得这些评价值的平均值,并且将对于临时预测矩阵Tk的内容C1的评价值中未输入的评价值的预测评价值设置为所获得的平均值“0.63”因而,如附图的右侧中所示,除使用者U1、U4和U6以外的所有其他使用者的内容C1的评价栏被填入预测评价值“0.63”。注意,对于图12的右侧中所示的临时预测矩阵Tk,阴影的栏表示填有对于未输入的评价值的预测评价值的栏。
当执行部分W12的计算时,进一步选择包括在部分W13中的算子,并且临时预测矩阵Tk通过所选择的算子进行计算。也就是说,首先,关于每个内容,计算执行了对于内容的评价的使用者之间的皮尔逊相关性。
例如,我们说作为填写了临时预测矩阵的空白栏的结果,获得图13中所示的临时预测矩阵。注意,在图13中,阴影的栏表示填有对于未输入的评价值的预测评价值的栏。我们说临时预测单元51对临时预测矩阵内使用者U2对于内容C1的评价(预测评价值)感兴趣,并且获得使用者U2和执行了对于内容C1的评价的另一个使用者之间的皮尔逊相关性。
在这种情况下,将评价值输入到内容C1的使用者是使用者U1、U4和U6,因此获得这些使用者和使用者U2之间的皮尔逊相关性。例如,在获得使用者U1和使用者U2之间的皮尔逊相关性的情况下,使用者U1对于内容C2至CM的评价值(之前输入的评价值或预测评价值)和使用者U2对于内容C2至CM的评价值被应用来获得皮尔逊相关性。
在图13中,如在该附图的右侧中所示,获得分别表示使用者U2和U1之间、使用者U2和U4之间以及使用者U2和U6之间的皮尔逊相关性程度的相关值“0.593014”、“0.83773”和“0.761491”。
对于每个使用者,关于该使用者没有执行评价的内容,当获得在该使用者和执行了对于所述内容的评价的其他使用者之间的皮尔逊相关性时,临时预测单元51基于所获得的相关值执行评价值的排序。具体地,对于每个使用者,关于该使用者没有执行评价的内容,临时预测单元51以相关值的降序对其他使用者的评价值进行排序。
例如,在使用者U2对内容C1的评价感兴趣的情况下,如图14所示,各个使用者的评价值以与使用者U2的皮尔逊相关性的降序进行排序。在图14中,与使用者U2的皮尔逊相关性的相关值显示在该附图的右侧。当以该相关值的降序对其他使用者的评价值进行排序时,临时预测单元51选择以与感兴趣的使用者的相关性的降序排列的八个使用者,并且获得对于被选择的八个使用者所关注的内容的评价值的平均值。随后,临时预测单元51将所获得的平均值作为对于感兴趣的使用者所关注的内容的预测评价值。
因此,例如,对于图14中的示例,选择了与使用者U2具有较高相关性的八个使用者U124、U987、U25、U539、U235、U169、U206和U83。随后,获得了对于这些所选择的使用者的内容C1的评价值“0.55”、“0.83”、“0.9”、“1.21”、“0.41”、“0.88”、“0.52”和“0.46”的平均值。此外,临时预测单元51将所获得的平均值“0.72”(0.72=(0.55+0.83+0.9+1.21+0.41+0.88+0.52+0.46)/8)作为使用者U2对于内容C1的预测评价值。
因而,当进行图7中的评估表达式Fk的部分W13的计算以及关于每个使用者获得对于未评价内容的预测评价值时,获得图15中所示的临时预测矩阵Tk。注意,在图15中,阴影的栏表示填有对于未输入的评价值的预测评价值的栏。
对于图15中的临时预测矩阵Tk,使用者U2对于内容C1的评价栏被填入具有较高相关性的前八位使用者的评价值的平均值“0.72”,该平均值通过图7中评估表达式Fk的部分W13的计算而获得。同样,未评价的内容栏被填入通过应用关于每个使用者的皮尔逊相关性而获得的预测评价值。
当临时预测矩阵Tk进行了图7中的评估表达式Fk的部分W13的计算时,临时预测单元51进一步对临时预测矩阵Tk进行图7中的评估表达式Fk的部分W14中所示的算子的计算。因而,如图16所示,获得该附图左侧上的临时预测矩阵Tk的每一栏的评价值的平方根,并且因此,获得该附图右侧中所示的临时预测矩阵Tk。注意,在图16中,阴影的栏表示填有对于未输入的评价值的预测评价值的栏。
例如,如果我们看临时预测矩阵Tk内使用者U1对于内容C1的评价栏,则获得在该附图的左侧中所示的临时预测矩阵Tk中的评价值“0.43”的平方根,并且在该附图的右侧中所示的临时预测矩阵Tk中的相应栏填入所获得的平方根值“0.66”
说明将返回到图10中的流程图。当如上所述执行构成评估表达式Fk的所有算子的计算时,在步骤S45中,确定执行了由所有算子进行的运算处理,并且处理进行到步骤S46。
在步骤S46中,临时预测单元51确定是否关于所有提供的评估表达式Fk获得临时预测矩阵Tk,即是否关于所有临时预测矩阵Tk1执行了应用对应的评估表达式Fk的计算。例如,在由临时预测单元51保持的评估表达式参数的数量是所提供的评估表达式的数量K的情况下,确定已经关于所有评估表达式Fk获得了临时预测矩阵Tk。
在步骤S46中确定没有关于所有评估表达式Fk获得临时预测矩阵Tk的情况下,临时预测单元51增加所保持的评估表达式参数k,并且之后处理返回到步骤S42。当增加评估表达式参数时,选择通过评估表达式参数确定的新的评估表达式Fk,并且通过应用所选择的评估表达式Fk来执行对于临时预测矩阵Tk的处理。
另一方面,在步骤S46中确定已经关于所有评估表达式Fk获得临时预测矩阵Tk的情况下,处理进行到步骤S47。在已经关于所有评估表达式Fk获得临时预测矩阵Tk的情况下,例如图17中所示,对于所提供的K个评估表达式F1至FK分别生成相应的K个临时预测矩阵T1至TK。
因此,根据K个评估方法分别生成总共K个临时预测矩阵。
在步骤S47中,预测单元52应用来自临时预测单元51的临时预测矩阵Tk和来自评估表达式保持单元24的线性组合系数来计算使用者Un(其中1≤n≤N)对于每个内容的最终的预测评价值。
也就是说,预测单元52选择预先注册的使用者U1至UN中的一个使用者Un。例如,使用者U1至UN被顺序地选择。随后,预测单元52提取由对于临时预测矩阵Tk内所选择的使用者Un的每个内容的评价值构成的信息作为临时使用者预测矩阵Tnk,其中临时预测矩阵Tk从临时预测单元51提供。因而,使用者Un的总共K个临时使用者预测矩阵Tnk分别从K个临时预测矩阵Tk获得。
此外,如图18所示,预测单元52对所获得的K个临时使用者预测矩阵Tn1至Tnk通过应用来自评估表达式保持单元24的使用者Un的线性组合系数bnk(其中0≤k≤K)进行线性组合。从而,获得由最终的预测评价值和之前输入的评价值(通过计算处理的之前输入的评价值)构成的使用者Un的使用者预测矩阵An。
更具体地,预测单元52通过计算以下表达式(1)获得使用者Un的使用者预测矩阵An。
注意,在表达式(1)中,(∑bnk×Tnk)表示通过将线性组合系数bnk和临时使用者预测矩阵Tnk的变量k从1变化到K获得临时使用者预测矩阵Tnk与线性组合系数bnk的乘积的和。同样,线性组合系数bn1至bnK是对应于临时使用者预测矩阵Tn1至TnK的线性组合系数,并且线性组合系数bn0是被加入到临时使用者预测矩阵Tnk的线性总和的系数。
因此,通过将线性组合系数bn0加到临时使用者预测矩阵Tnk与线性组合系数bnk的乘积的和中来获得使用者Un的使用者预测矩阵An。例如,通过给对于每个临时使用者预测矩阵Tnk内的使用者Un的内容Cm的每个预测评价值乘以每个线性组合系数bnk来获得乘以线性组合系数bnk的预测评价值的和,并且进一步将线性组合系数bn0加到上述和中,从而获得使用者Un对于内容Cm的最终的预测评价值。
当获得了使用者预测矩阵An,预测单元52将所获得的使用者预测矩阵An提供到预测评价值矩阵保持单元26。
在步骤S48中,预测单元52确定是否已经关于所有使用者获得使用者预测矩阵An。在步骤S48中确定没有关于所有使用者获得使用者预测矩阵An的情况下,处理返回到步骤S47,在步骤S47中选择还没有被选择的使用者Un,并且获得该使用者Un的使用者预测矩阵An。
另一方面,在步骤S48中确定关于所有使用者获得使用者预测矩阵An的情况下,处理进行到步骤S49。当从预测单元52向预测评价矩阵保持单元26提供关于所有使用者U1至UN的使用者预测矩阵A1至AN时,预测评价矩阵保持单元26生成由所提供的N个使用者预测矩阵A1至AN构成的一个预测评价矩阵A。随后,预测评价矩阵保持单元26保持所生成的预测评价矩阵A,并且将该预测评价矩阵A提供到推荐单元27。
在步骤S49中,推荐单元27基于从预测评价矩阵保持单元26提供的预测评价矩阵向使用者推荐内容,并且推荐处理结束。例如,推荐单元27生成推荐信息,该推荐信息表示关于每个使用者Un推荐的内容,其中具有使用者Un的最高预测评价值的内容作为推荐给该使用者Un的内容。随后,推荐单元27将生成的推荐信息提供到接口处理设备11以显示该推荐信息。这样,使用者观看到被显示的推荐信息,由此使用者可以寻找可能令使用者感兴趣的新的内容。
如上所述,推荐设备12应用多个评估表达式来生成对应于这些评估表达式的临时预测矩阵,并且通过线性组合系数对临时预测矩阵进行线性组合,由此生成最终的预测矩阵。
因此,对于多个评估表达式的多个临时预测矩阵通过线性组合系数进行线性组合,从而在考虑通过多个算法获得的每个推荐结果时,使得能够以较高精确度检测被评估为使用者最喜欢的内容。
例如,关于预定的使用者Un,我们说在期望检测到被评估为使用者Un最喜欢的内容的情况下,存在用于提取被全体使用者高度评价的内容的评估表达式F1,和用于提取被与使用者Un具有高度相关性的使用者高度评价的内容的评估表达式F2。在这种情况下,当通过单独应用评估表达式F1检测到要推荐给使用者Un的内容时,即使全体使用者给出的评价很高,但通过检测获得的内容也不一定是使用者Un最喜欢的。
相反地,当通过单独应用评估表达式F2检测到要推荐给使用者Un的内容时,执行内容的检测,其中不考虑全体使用者的喜好而是考虑部分使用者的喜好,因此通过检测获得的内容不一定是使用者Un最喜欢的。
另一方面,推荐设备12应用由学习单元23最优化的多个评估表达式通过对这些评估表达式的评估结果进行线性组合来获得最终的评估结果。因此,在考虑例如全体使用者、与使用者Un具有高相关性的使用者等多个评估方法的情况下获得最终的评估结果(预测评价矩阵),由此可以以更高的精确度获得被评估为使用者Un的最喜欢的内容。
此外,通过学习单元23执行应用前一代的评估表达式的学习处理,顺序生成用于生成预测评价矩阵的每一代的评估表达式和线性组合系数。由学习单元23进行的学习处理将在以下参照图19中的流程图进行说明。
在步骤S81中,候选生成单元91应用从评估表达式选择单元94提供的前一代的K个评估表达式来执行评估表达式候选生成处理,由此生成S个评估表达式候选Js,该S个评估表达式候选Js是下一代的评估表达式的候选。随后,候选生成单元91将生成的评估表达式候选Js提供到评估结果计算单元92。
在步骤S82中,评估结果计算单元92通过应用来自候选生成单元91的评估表达式候选Js和来自使用者评价矩阵保持单元22的使用者评价矩阵执行评估处理来评估使用者评价矩阵中的相应的评价值,由此计算每个评估表达式候选的评估结果Hs。评估结果计算单元92将计算的评估结果Hs和评估表达式候选Js提供到评估表达式选择单元94。
注意,后面将说明关于评估表达式候选生成处理和评估处理的细节。
在步骤S83中,组生成单元93基于从使用者评价矩阵保持单元22提供的使用者评价矩阵来执行使用者的聚类(clustering)。具体地,组生成单元93应用在适当的情况下提供的使用者简介来将已注册的使用者U1至UN中的每一个分类到预定的Q个使用者组G1至GQ中的任意一组。
例如,组生成单元93基于在所提供的使用者评价矩阵中的每个使用者对于内容的评价值、通过K均值(K-means)法执行聚类,来执行使用者U1至UN的分组。因而,如图20所示,每个使用者被分类到使用者组G1至GQ中的任意使用者组之一中。例如,在图20中,执行分组使得使用者U1、U3、U10和U152属于使用者组G1。
说明将返回到图19中的流程图。在执行使用者的分组时,组生成单元93将表示其分组结果的使用者组信息提供到评估表达式选择单元94。
在步骤S84中,评估表达式选择单元94应用来自使用者评价矩阵保持单元22的使用者评价矩阵、来自评估结果计算单元92的评估结果Hs和评估表达式候选Js、以及来自组生成单元93的使用者组信息来执行评估表达式选择处理,由此生成下一代的评估表达式和线性组合系数。随后,评估表达式选择单元94将生成的评估表达式和线性组合系数提供到候选生成单元91和评估表达式保持单元24。评估表达式保持单元24保持来自评估表达式选择单元94的评估表达式和线性组合系数。注意,评估表达式选择处理的细节将在后面进行说明。
在步骤S85中,学习单元23确定是否结束用于生成下一代的评估表达式和线性组合系数的处理。例如,在指示了中止内容推荐系统的操作的情况下,确定结束处理。
在步骤S85中确定在不结束处理的情况下,处理返回到生成下一代的评估表达式和线性组合系数的步骤S81。另一方面,在步骤S85中确定结束处理的情况下,学习单元23中的每个单元停止被执行的处理,并且学习处理结束。
这样,学习单元23通过应用前一代的评估表达式的遗传编程来生成下一代的评估表达式和线性组合系数。因而,下一代的评估表达式和线性组合系数通过遗传编程而生成,由此使得能够获得使用者对于每个内容的更恰当的预测评价值。
此外,对于学习单元23,可以在没有推荐设备12的管理员等的指令的情况下建立用于更容易并且更迅速地向使用者推荐内容的推荐算法。也就是说,可以获得能够更精确地评估预测评价值的评估表达式,并且可以获得更适合的评估表达式的组合和线性组合系数。
之后,将参照图21中的流程图关于对应于图19中的步骤S81中的处理的评估表达式候选生成处理进行说明。
在步骤S121中,候选生成单元91确定这种学习是否是第一次学习。具体地,当执行学习时,生成评估表达式和线性组合系数,并且将评估表达式从评估表达式选择单元94提供到候选生成单元91。另一方面,在这种学习完全是第一次学习的情况下,既没有生成过评估表达式也没有生成过线性组合系数,因此没有评估表达式被提供到候选生成单元91。因此,在没有从评估表达式选择单元94提供评估表达式的情况下,候选生成单元91确定这种学习是第一次学习。
在步骤S121中确定这种学习是第一次学习的情况下,在步骤S122中,候选生成单元91将选择数量设置为NumSlct=0,将突变数量设置为NumMts=0,将交叉数量设置为NumCrs=0,并且将随机生成数量设置为NumRnd=S。
这里,选择数量NumSlct表示在前一代的评估表达式中被选择作为下一代的评估表达式Js的评估表达式的数量。同样,突变数量NumMts、交叉数量NumCrs和随机生成数量NumRnd分别表示在突变处理、交叉处理和随机处理中生成的评估的候选Js的数量。
在第一次学习时不存在前一代的评估表达式,因此随机生成数量被设置为S,并且所有S个评估表达式候选在随机处理中生成。当确定了选择数量、突变数量、交叉数量和随机生成数量之后,处理进行到步骤S124。
另一方面,在步骤S121中确定这种学习不是第一次学习的情况下,在步骤S123中,候选生成单元91设置选择数量NumSlct=K,突变数量NumMts=(S-K)/3,交叉数量NumCrs=(S-K)/3,并且随机生成数量NumRnd=S-(2×(S-K)/3)-K。
也就是说,从评估表达式选择单元94提供的前一代的K个评估表达式,即前一代的所有评估表达式被设置为下一代的评估表达式候选。同时,根据突变处理、交叉处理和随机处理,评估表达式候选Js生成的数量为占通过从相应的评估表达式候选的总和S中减去K获得的数量的1/3。当确定了选择数量、突变数量、交叉数量和随机生成数量之后,处理进行到步骤S124。
当在步骤S122或S123中确定了选择数量、突变数量、交叉数量和随机生成数量时,在步骤S124中,候选生成单元91从由评估表达式选择单元94提供的前一代的评估表达式中选择评估表达式候选,其中选择的数量为由选择的数量NumSlct表示的数量。例如,在选择数量NumSlct=K的情况下,所有提供的K个前一代的评估表达式F1至FK被作为评估表达式候选J1至JK。
在步骤S125中,突变处理单元111应用从评估表达式选择单元94提供的评估表达式来执行突变处理,由此生成数量为由突变数量NumMts表示的数量的评估表达式候选Js。
也就是说,突变处理单元111从前一代的评估表达式F1至FK中任意地选择一个评估表达式。随后,突变处理单元111对所选择的评估表达式进行算子的插入、算子的去除、处理轴参数的修改、算子内的参数的修改、算子的顺序的变换等,由此生成一个评估表达式候选。
例如,我们说从前一代的评估表达式选择了图22A中示出的评估表达式。图22A中所示的评估表达式由三个部分W31至W33构成,并且部分W31至W33分别包括算子“NormalizeMaxMin”、“Sin”和“CF-Correl(1)”。
例如,当在图22A中的评估表达式中的部分W32和W33之间通过突变处理增加新的处理轴参数和算子时,生成图22B中所示的评估表达式候选。对于图22B中所示的评估表达式候选,新的处理轴参数“C#”和算子“FillAvg”被增加到图22A中的评估表达式中的部分W32和W33之间。
同样,例如,当通过突变处理去除图22A中的评估表达式的部分时,生成图22C中所示的评估表达式候选。对于图22C中所示的评估表达式候选,图22A中的评估表达式的部分W31被去除。
此外,当图22A中评估表达式中的部分W31的处理轴参数被修改时,生成图22D中所示的评估表达式候选。对于图22D中所示的评估表达式候选,图22A中评估表达式的部分W31的处理轴参数“U#”被改变为“C#”。
此外,在通过突变处理使得图22A中的评估表达式改变为图22D中的状态之后,进一步当评估表达式中的算子“CF-Correl(1)”内的参数被修改时,例如生成图22E中所示的评估表达式候选。对于图22E中所示的评估表达式候选,图22D中的评估表达式中的右端算子“CF-Correl(1)”的参数被改变为“CF-Correl(5)”。
此外,同样地,在通过突变处理使得图22A中的评估表达式改变为图22E中的状态之后,进一步在算子的顺序被变换时,例如生成图22F中所示的评估表达式候选。对于图22F中所示的评估表达式候选,图22E中的评估表达式的算子“Sin”和算子“CF-Correl(5)”之间的顺序被变换为“U;C#CF-Correl(5),Sin”。
因此这样,通过突变处理使得评估表达式的一部分改变为新的评估表达式候选。注意,在使用者评价矩阵通过应用生成的评估表达式候选进行计算的情况下,当生成使用者评价矩阵的空白栏未填写的评估表达式候选时,即当生成没有获得未输入的评价值的预测评价值的评估表达式候选时,不应用该评估表达式候选并且重新生成评估表达式候选。
说明将返回到图21中的流程图。当通过突变处理生成评估表达式候选时,在步骤S126中,交叉处理单元112应用从评估表达式选择单元94提供的评估表达式来执行交叉处理,由此生成评估表达式候选Js,该评估表达式候选Js的数量为由交叉数量NumCrs表示的数量。
也就是说,交叉处理单元112从前一代的评估表达式F1至FK中任意选择两个评估表达式。随后,交叉处理单元112转换所选择的两个评估表达式的一部分,由此生成一个新的评估表达式候选。
例如,如图23所示,我们说选择了由部分W51和W52构成的评估表达式和由部分W53和W54构成的评估表达式。这里,部分W52包括两个算子“Sin”和“CF-Correl(1)”,并且部分W53包括一个算子“CF-Correl(3)”。随后,当由部分W51和W52构成的评估表达式的部分W51被转换(改变)为另一个评估表达式的部分W53时,生成显示在附图的下侧所示的新的评估表达式候选“C;U#CF-Pearson(3),Sin,U;C#CF-Correl(1)”。
这样,评估表达式的一部分通过交叉处理转换为另一个评估表达式的一部分,并且被作为新的评估表达式。注意,在使用者评价矩阵通过应用生成的评估表达式候选进行计算的情况下,当生成使用者评价矩阵的空白栏未填写的评估表达式候选时,不应用该评估表达式候选,并且重新生成评估表达式候选。
说明将返回到图21中的流程图。当由交叉处理生成评估表达式候选时,在步骤S127中,随机处理单元113执行随机处理,由此生成评估表达式候选Js,该评估表达式候选Js的数量为由随机生成数量NumRnd表示的数量。
也就是说,随机处理单元113随机地将任意处理轴参数与任意参数的算子相结合,来生成评估表达式候选。在这种情况下,还随机地确定算子的数量和顺序。注意,在使用者评价矩阵通过应用生成的评估表达式候选进行计算的情况下,当生成使用者评价矩阵的空白栏未填写的评估表达式候选时,不应用该评估表达式候选,并且重新生成评估表达式候选。
当通过选择数量、突变数量、交叉数量和随机生成数量生成评估表达式候选时,该生成的评估表达式候选J1至JS从候选生成单元91被提供到评估结果计算单元92,并且评估表达式候选生成处理结束,并且处理进行到图19中的步骤S82。
这样,候选生成单元91通过应用前一代的评估表达式生成下一代的评估表达式候选。因而,下一代的评估表达式候选从前一代的评估表达式生成,由此在评价了评估表达式候选的几种组合和评估了使用者对于内容的评价的情况下,可以获得更适合的评估表达式。
下面,将参照图24中的流程图对对应于图19的步骤S82中的处理的评估处理进行说明。
在步骤S151中,评估结果计算单元92选择从候选生成单元91提供的S个评估表达式候选J1至JS中的一个作为应用于处理的评估表达式候选。例如,应用于处理的评估表达式候选Js(其中1≤s≤S)顺序地从评估表达式候选J1至JS中选择。
在步骤S152中,评估结果计算单元92将与从使用者评价矩阵保持单元22提供的使用者评价矩阵相同的矩阵(信息)作为对于所选择的评估表达式候选Js的评估结果Hs,并且用使用者评价矩阵的每一栏的评价值替换评估结果Hs的每一栏。也就是说,与使用者评价矩阵相同的信息被作为评估结果Hs。
在步骤S153中,评估结果计算单元92选择用于处理的评估表达式候选Js的一个算子。例如,在图25中所示的评估表达式候选被作为评估表达式候选Js的情况下,在图25中,以向右的方向从左侧算子至右侧算子顺序地选择。在图25中,评估表达式候选Js包括以下面这种顺序选择的四个算子“CF-Pearson(3)”、“Sin”、“CF-Correl(1)”和“Cos”。
在步骤S154中,评估结果计算单元92确定所选择的算子是否是要填入评估结果Hs的空白栏的最后的算子。
例如,图25中所示的评估表达式候选Js包括四个算子。在这些算子中,算子“CF-Pearson(3)”和“CF-Correl(1)”是分别通过应用皮尔逊相关性和根据余弦距离的相关性填入评估结果Hs的空白栏的算子,即是用于获得未输入的评价值的预测评价值的算子。另一方面,算子“Sin”和“Cos”是用于获得评价值的正弦和余弦的算子,并且不是填入评估结果Hs的空白栏的算子。
同样,对于评估表达式候选Js,算子“CF-Pearson(3)”、“Sin”、“CF-Correl(1)”和“Cos”以以上这种顺序被选择并且用于处理。因此,对于评估表达式候选Js,填写评估结果Hs的空白栏的最后的算子是算子“CF-Correl(1)”,并且在选择该算子的情况下,在步骤S154中确定该算子是最后的算子。
在步骤S154中确定所选择的算子不是最后的算子的情况下,在步骤S155中,评估结果计算单元92对评估结果Hs进行由所选择的算子表示的计算。
这里,在所选择的算子是将评估结果Hs的所有栏的评价值作为目标的算子的情况下,例如用于计算每一栏的评价值的正弦的算子“Sin”,评估结果计算单元92对评估结果Hs的每一栏的评价值进行由所选择的算子表示的计算。同样,在所选择的算子是填写评估结果Hs的空白栏的算子的情况下,评估结果计算单元92应用评估结果Hs的每一栏的评价值,即之前输入的评价值和未输入的评价值来获得未输入的评价值的预测评价值。
在执行所选择的算子的计算后,处理从步骤S155进行到步骤S157。
另一方面,在步骤S154中确定所选择的算子是最后的算子的情况下,在步骤S156中,评估结果计算单元92对评估结果Hs的所有评价值进行由所选择的算子表示的计算。
具体地,评估结果计算单元92在通过最后的算子进行计算以填写空白栏时,在评估结果Hs的每一栏的评价值中,不仅获得未输入的评价值,而且获得之前输入的评价值的预测评价值。注意,在这种情况下,对于用于填写评估结果Hs的空白栏的算子的计算,要被计算的栏的评价值不用于获得该栏的预测评价值的计算。
因此,在通过最后的算子填写空白栏的计算时还关于被输入了之前输入的评价值的栏获得预测评价值,由此可以通过应用关于该栏获得的预测评价值和使用者评价矩阵中相应栏的之前输入的评价值来评价评估表达式候选的预测(评估)的精确度。当在步骤S156中执行所选择的算子的计算后,随后,处理进行到步骤S157。
在步骤S157中,评估结果计算单元92确定评估表达式候选Js的所选择的算子是否是包括在评估表达式候选Js中的最后的算子。例如,在选择了图25中所示的评估表达式候选Js的情况下,当评估表达式候选Js的所选择的算子是最后执行的计算的算子“Cos”时,所选择的算子被确定为最后的算子。
在步骤S157中确定所选择的算子不是最后的算子的情况下,处理返回到步骤S153,在此选择下一个算子,并且执行对于评估结果Hs的计算。
另一方面,在步骤S157中确定所选择的算子是最后的算子的情况下,在步骤S158中,评估结果计算单元92确定是否关于所有提供的评估表达式候选Js获得评估结果Hs。
例如,在确定关于所有提供的评估表达式候选Js获得评估结果Hs的情况下,如图26所示,对于所提供的S个评估表达式候选J1至JS,分别获得对应的S个评估结果H1至HS。也就是说,根据S个评估方法,分别生成总共S个评估结果。
在步骤S158中确定没有关于所有评估表达式候选Js获得评估结果Hs的情况下,处理返回到步骤S151,此处重复上述处理。具体地,选择下一个评估表达式候选Js,并且生成对应于该评估表达式候选Js的评估结果Hs。
另一方面,在步骤S158中确定关于所有评估表达式候选Js获得了评估结果Hs的情况下,评估结果计算单元92将所获得的S个评估结果H1至HS和评估表达式候选J1至JS提供到评估表达式选择单元94。随后,当从评估结果计算单元92向评估表达式选择单元94提供评估表达式候选和评估结果后,评估处理结束,并且处理进行到图19中的步骤S83。
这样,评估结果计算单元92分别应用S个评估表达式候选来生成对应的评估结果。因而,应用评估表达式候选来生成对应的评估结果,由此在评价了评估表达式候选的组合和评估了使用者对于内容的评价的情况下,可以获得评估表达式的更适合的组合。
下面,将参照图27中的流程图对对应于图19的步骤S84中的处理的评估表达式选择处理进行说明。
在步骤S191中,组合系数计算单元114初始化变量Z,该变量Z表示从评估结果计算单元92提供的每个评估结果Hs的使用情况。
也就是说,对于评估表达式选择单元94,假设选择了S个评估表达式候选中的一些,并且所选择的评估表达式候选Js被用作下一代的评估表达式。随后,对于所选择的评估表达式候选Js被用于获得每个使用者的预测评价值的情况下,评价该预测评价值,即评估结果Hs的预测的精确度。
变量Z由表示对应于每个评估表达式候选Js的评估结果Hs的使用情况的信息构成,并且该使用情况表示对应于评估结果的评估表达式候选是否被临时用作下一代的评估表达式。也就是说,对于变量Z,对应于使用情况被设置为“已使用”的评估结果的评估表达式候选是被临时用作下一代的评估表达式的评估表达式候选。同样,对于变量Z,对应于使用情况被设置为“未使用”的评估结果的评估表达式候选是不被临时用作下一代的评估表达式的评估表达式候选。
组合系数计算单元114通过将变量Z的每个评估结果的使用情况设置为“未使用”来初始化变量Z。
在步骤S192中,组合系数计算单元114选择从评估结果计算单元92提供的评估表达式候选Js(其中1≤s≤S)中的一个。例如,评估表达式候选Js被从评估表达式候选J1至评估表达式候选JS中顺序地选择。
在步骤S193中,组合系数计算单元114反转对应于所选择的评估表达式候选Js的评估结果Hs的使用情况,并且将使用情况已反转的变量Z作为变量Zs’(其中1≤s≤S)。例如,在变量Z在对应于所选择的评估表达式候选Js的评估结果Hs的使用情况是“未使用”的情况下,使用情况被反转为“已使用”,并且相反地,在使用情况为“已使用”的情况下,使用情况被反转为“未使用”。
在步骤S194中,组合系数计算单元114确定使用情况为“已使用”的数量,即对应于使用情况为“已使用”的评估结果的评估表达式候选的数量是否等于或低于预定的评估表达式的数量K的上限数量Kmax。
在步骤S194中确定使用情况为“已使用”的数量等于或低于上限数量Kmax的情况下,在步骤S195中,组合系数计算单元114参考从组生成单元93提供的使用者组信息来选择一个使用者组Gq。例如,使用者组Gq(其中1≤q≤Q)从使用者组G1至使用者组GQ中顺序地选择。
在步骤S196中,组合系数计算单元114在从评估结果计算单元92提供的评估结果Hs中选择变量Zs’的使用情况为“已使用”的评估结果Hs,并且将所选择的评估结果Hs重新作为评估结果Hv’。注意,在存在多个新的评估结果Hv’的情况下,附加这些评估结果Hv’中的变量v以便成为连续的数。
例如,我们说,对于变量Zs’,评估结果H1至HV(其中1≤V≤S)的使用情况为“已使用”,并且其他评估结果H(V+1)至HS的使用情况为“未使用”。在这种情况下,组合系数计算单元114将评估结果H1至HV重新作为评估结果H1’至HV’,并且将对应于评估结果H1’至HV’的评估表达式候选Js重新作为评估表达式候选J1’至JV’。
在步骤S197中,组合系数计算单元114应用评估结果Hv’、来自使用者评价矩阵保持单元22的使用者评价矩阵和来自组生成单元93的使用者组信息来获得关于所选择的使用者组Gq的线性组合系数候选Bsq。
这里,关于所选择的使用者组Gq的线性组合系数候选Bsq是属于使用者组Gq的使用者Un的线性组合系数候选,并且该线性组合系数候选Bsq由对应于线性组合系数bnk的(V+1)个线性组合系数bsq0至bsqV构成。也就是说,在评估表达式候选J1’至JV’被用作下一代的新的评估表达式的情况下,线性组合系数候选Bsq是线性组合系数。
注意,在每个线性组合系数bsqv(其中0≤v≤V)中的变量s、q和v分别对应于变量Zs’中的s、使用者组Gq中的q和评估结果Hv’中的v。同样,线性组合系数bsq0是对应于线性组合系数bn0的系数。
例如,组合系数计算单元114应用线性回归来获得线性组合系数候选Bsq,其中由以下表达式(2)中的预定元素构成的误差矩阵Eq变为最小值,即为线性组合系数bsqv的组合。
在表达式(2)中,矩阵Rq是具有使用者对于内容之前输入的评价值作为元素的矩阵(矢量),其中使用者属于使用者评价矩阵中的使用者组Gq。
同样地,表达式(2)中的矩阵Hqv’是以评估结果Hv’的预测评价值中、对应于使用者对于内容之前输入的评价值的预测评价值作为元素的矩阵(矢量),其中使用者属于使用者评价矩阵中的使用者组Gq。也就是说,矩阵Rq的预定元素rq是预定使用者Un对于预定内容Cm的真实评价值,对应于该元素rq的矩阵Hqv’的元素hqv是通过应用评估表达式候选Jv’评估的使用者Un对于内容Cm的评价的预测评价值。
此外,在表达式(2)中,(∑bsqv×Hqv’)表示线性组合系数bsqv和矩阵Hqv’的变量v从1改变至V,由此获得矩阵Hqv’与线性组合系数bsqv的乘积的和。
根据表达式(2),线性组合系数bsq0和误差矩阵Eq的元素eq被加入到与矩阵Rq的元素rq相对应的矩阵Hq1’至HqV’的元素hq1至hqV分别与线性组合系数bsq1至bsqV的乘积的总和中,并且因此,所获得的结果等于元素rq。也就是说,元素eq表示元素rq的评估值和真实元素rq之间的误差,其中元素rq的评估值通过将线性组合系数bsq0加入到元素hqv与线性组合系数bsqv的乘积的总和中而获得。
因此,元素eq越小,则通过应用此时的线性组合系数bsqv的组合和对应于评估结果Hv’的评估表达式候选Jv’,使用者对于内容的评价可以以更高的精确度来评估。因此,组合系数计算单元114获得使得表达式(2)的关系成立并且相应的元素eq变为最小的线性组合系数bsqv的组合,并且将其组合作为线性组合系数候选Bsq。
当获得关于变量Zs’的使用者组Gq的线性组合系数候选Bsq之后,处理从步骤S197进行到步骤S198。
在步骤S198中,组合系数计算单元114确定是否关于整个使用者组Gq获得线性组合系数候选Bsq。
在步骤S198中确定没有关于整个使用者组Gq获得线性组合系数候选Bsq的情况下,处理返回到步骤S195,在此重复上述处理。具体地,选择下一个使用者组Gq,并且获得关于变量Zs’的新选择的使用者组Gq的线性组合系数候选Bsq。
另一方面,在步骤S198中确定关于整个使用者组Gq获得线性组合系数Bsq的情况下,处理进行到步骤S199。例如,在确定关于整个使用者组获得线性组合系数候选的情况下,分别关于变量Zs’获得对于使用者组G1至GQ的线性组合系数候选Bs1至BsQ。
在步骤S199中,评价单元115基于使用者评价矩阵和评估结果Hv’来计算关于变量Zs’的AIC(Akaike Information Criteria,Akaike信息准则),其中评估结果Hv’即通过表达式(2)的线性组合系数的计算结果。也就是说,评价单元115计算以下表达式(3),由此计算关于变量Zs’的AIC作为信息量基准,该信息量基准是用于评估使用者对于内容的评价的评估表达式候选Jv和线性组合系数候选Bsq的评价指标。
AIC=W×{log(2×PI)+1+log||E||2/W}+2×Q×(v+1)(3)
在表达式(3)中,W表示在使用者评价矩阵中之前输入的评价值的数量,而PI表示π。同时,在表达式(3)中,||E||表示由误差矩阵E1至EQ的元素构成的矩阵E的范数,即矩阵E的各个元素的平方和。此外,在表达式(3)中,Q和V分别表示使用者组Gq的数量和评估结果Hv的数量。
矩阵E的元素变得越小,则在表达式(3)中所示的AIC就变得越小。也就是说,关于评估表达式候选Jv’和线性组合系数候选Bsq的变量Zs’越是可以精确地评估使用者对于内容的评价,则变量Zs’的AIC变得越小。
同样,评估表达式候选Jv’的数量(自由参数的数量)越多,则表达式(3)中所示的变量Zs’的AIC变得越大。在推荐设备12生成预测评价矩阵的情况下,评估表达式候选Fk的数量越多,用于获得预测评价矩阵的计算量变得越大,因此评估表达式候选Fk的数量越少,即评估表达式候选Jv’的数量越少越好。也就是说,从计算量的角度看,变量Zs’的AIC越小,变量Zs’的评估表达式候选Jv’和线性组合系数候选Bsq就越适合评估使用者对于内容的评价。
因此,变量Zs’的AIC越小,关于该变量Zs’获得的对于评估表达式候选Jv’和线性组合系数候选Bsq的评价就越高,该更高的评价适合作为评估表达式和线性组合系数。
在步骤S199中,当计算变量Zs’的AIC之后,处理进行到步骤S200。
同时,在步骤S194中确定对于变量Zs’,使用情况为“已使用”的数量不等于且不低于K个评估表达式的上限数量Kmax的情况下,则步骤S195至S199中的处理被跳过,并且处理进行到步骤S200。
也就是说,在对于变量Zs’,使用情况为“已使用”的数量高于上限数量Kmax的情况下,当通过应用使用情况为“已使用”的评估结果而生成评估表达式时,生成的评估表达式的数量超过评估表达式的上限数量Kmax。因此,在使用情况为“已使用”的数量高于上限数量Kmax的情况下,步骤S195至S199中的处理被跳过。
当在步骤S199中计算AIC或者当确定使用情况为“已使用”的数量高于上限数量Kmax时,在步骤S200中,组合系数计算单元114确定是否选择了所有评估表达式候选Js。具体地,在步骤S192中的处理选择了所有S个评估表达式候选Js的情况下,作出已经选择所有评估表达式候选的判断。
在步骤S200中确定还没有选择所有S个评估表达式候选Js的情况下,处理返回到步骤S192,此处重复上述处理。具体地,选择下一个评估表达式候选Js,并且对于目前为止的变量Zs’,对应于新选择的评估表达式候选Js的评估结果Hs的使用情况被反转,其作为新的变量Zs’。随后,关于对应于所选择的评估表达式候选Js的变量Zs’,获得每个使用者组Gq的线性组合系数候选Bsq,并且计算变量Zs’的AIC。
另一方面,在步骤S200中确定选择了所有评估表达式候选Js的情况下,处理进行到步骤S201。当选择了所有评估表达式候选J1至JS后,这意味着获得了对应于变量Z1’至ZS’中的每一个的AIC,其中变量Z1’至ZS’对应于这些评估表达式候选。注意,更具体地,对于变量Zs’,当使用情况为“已使用”的数量超过上限数量Kmax时,不获得线性组合候选和AIC。
在步骤S201中,选择单元116在相应的变量Z1’至ZS’中选择获得的AIC是最小值的变量Zs’。这里,在关于变量Z1’至ZS’获得的评估表达式候选和线性组合系数候选中,所选择的变量Zs’的评估表达式候选Jv’和线性组合系数候选Bsq是最适合的评估表达式和线性组合系数。
在步骤S202中,选择单元116确定所选择的变量Zs’的AIC是否小于目前为止已执行的处理中的AIC的最小值。例如,选择单元116保持目前为止已执行的处理中的AIC为最小值的变量Zs’、关于该变量Zs’的AIC、评估表达式候选Jv’和线性组合系数候选Bsq。随后,选择单元116将此时的AIC的最小值,即在步骤S201中选择的变量Zs’的AIC与所保持的AIC进行比较。
在步骤S202中确定所选择的变量Zs’的AIC小于目前为止已执行的处理中的AIC的最小值的情况下,在步骤S203中,组合系数计算单元114将所选择的变量Zs’作为新的变量Z。随后,当将所选择的变量Zs’被作为新的变量Z后,处理返回到步骤S192,在此处重复上述处理。
具体地,在所选择的变量Zs’的AIC小于以前的AIC的情况下,与以前的评估表达式候选和线性组合系数候选相比,此时获得的变量Zs’的评估表达式候选Jv’和线性组合系数候选Bsq是更适合的评估表达式和线性组合系数。因此,存在一种可能,即通过修改部分变量Zs’的使用情况所获得的新的变量Zs’的AIC变得远小于此时选择的变量Zs’的AIC,并且获得更适合作为评估表达式和线性组合系数的评估表达式候选Jv’和线性组合系数候选Bsq。
因此,评估表达式选择单元94重复上述处理直到AIC不再随着此时被选择作为新的变量Z的变量Zs’而改进,即直到确定所选择的变量Zs’的AIC等于或大于以前的AIC的最小值。
另一方面,在步骤S202中确定所选择的变量Zs’的AIC等于或大于以前的AIC的最小值的情况下,对于作为新的变量Z的所选择的变量Zs’,即使获得了评估表达式候选和线性组合系数候选,AIC被改进的可能性也较小,因此处理进行到步骤S204。
在步骤S204中,选择单元116输出其中在目前为止已执行的处理中AIC已经成为最小值的变量Zs’的评估表达式候选Jv’和线性组合系数候选Bsq作为下一代的评估表达式和线性组合系数。
具体地,选择单元116将对于AIC为最小值的变量Zs’的V个评估表达式候选J1’至JV’作为下一代的评估表达式,并且将所获得的对于变量Zs’的线性组合系数候选Bsq作为下一代的线性组合系数。此时,使用者Un(其中1≤n≤N)所属于的使用者组Gq(其中1≤q≤Q)的线性组合系数候选Bsq,即线性组合系数bsq0至bsqV被作为使用者Un的下一代的线性组合系数。
这样获得的下一代的评估表达式被从评估表达式选择单元94提供到候选生成单元91和评估表达式保持单元24,并且每个使用者的下一代的线性组合系数被从评估表达式选择单元94提供到评估表达式保持单元24。
当输出了下一代的评估表达式和线性组合系数之后,评估表达式选择处理结束,并且处理进行到图19中的步骤S85。
这样,学习单元23生成评估表达式候选,并且假设一些评估表达式候选被用作下一代的评估表达式。随后,学习单元23执行这些评估表达式候选和对应于该评估表达式候选的线性组合系数候选之间的评价,并且选择用于评估使用者对于内容的评价的更适合的评估表达式候选和线性组合系数候选作为下一代的评估表达式和线性组合系数。
这样,通过重复地执行评估表达式候选的生成以及执行评估表达式候选和线性组合系数候选的评价来选择更适合的评估表达式候选和线性组合系数候选,由此可以获得评估表达式和线性组合系数,这可以在每次执行评估表达式选择处理时更精确地评估使用者对于内容的评价。
具体地,为了评估使用者对于内容的评价,可以容易地建立更适合的协同过滤算法,即评估表达式,并且可以容易地改善评价的评估精确度。执行评估表达式候选的组合和线性组合系数候选的评价,选择更适合的评估表达式候选和线性组合系数候选作为下一代的评估表达式和线性组合系数,由此可以进一步改善使用者对于内容的评价的评估精确度。因此,可以建立一种推荐算法,其中以更高的精确度、更容易且迅速地评估对于使用者的评价。
同时,根据学习单元23,在建立推荐算法时,即在生成评估表达式和线性组合系数时,使用者(管理员)不必执行操作。特别地,在推荐算法的一部分需要修改的情况下,例如,即使在使用者重新评价了内容的情况下以及在新的内容被添加为评价目标情况下等,根据通过学习单元23的学习处理,在没有人力的情况下获得适合的评估表达式和线性组合系数。也就是说,管理员不需要重新建立推荐算法。
注意,在目前为止进行的说明中,评估表达式的数量K等于或低于上限数量Kmax。因此,在评估表达式的数量K为1的情况下,生成对于临时使用者预测矩阵Tn1要相乘的线性组合系数bn1,乘以了线性组合系数的临时预测矩阵,即预测评价值相加的线性组合系数bn0。同时,在评估表达式的数量K为1的情况下,线性组合系数bn0可以被恒定地设置为0。
此外,在评估表达式的数量K为1的情况下,可以通过不应用线性组合系数而是单独应用评估表达式F1来获得预测评价矩阵。在这种情况下,以使用者评价矩阵和评估结果Hs来执行评估表达式候选的评价,并且在多个评估表达式候选中,以评估表达式候选获得的预测评价值和实际的之前输入的评价值之间的误差越小,则其评价越高。
同时,上述一系列处理不仅可以通过硬件执行还可以通过软件执行。在通过软件执行一系列处理的情况下,构成该软件的程序从程序记录介质安装到嵌入专用硬件中的计算机,或安装到能够通过所安装的多种类型的程序执行多种类型的功能的通用个人计算机等。
图28是示出了计算机的配置示例的框图,在该计算机中上述一系列处理通过程序执行。对于计算机,通过总线204使CPU(中央处理单元)201、ROM(只读存储器)202和RAM(随机存取存储器)203相互连接。
输入/输出接口205进一步连接到总线204。输入/输出接口205连接有由键盘、鼠标、麦克风等构成的输入单元206、由显示器、扬声器等构成的输出单元207、由硬盘、非易失性存储器等构成的记录单元208、由网络接口等构成的通信单元209和用于驱动例如磁盘、光盘、磁性光盘、半导体存储器等可移动介质211的驱动器210。
对于这样配置的计算机,执行上述一系列处理,例如,由CPU 201通过输入/输出接口205和总线204将存储在记录单元208中的程序加载到RAM 203中并且执行该程序。
由计算机(CPU 201)执行的程序可以通过记录在可移动介质211中来提供,其中可移动介质211是由磁盘(包括软盘)、光盘(CD-ROM(光盘只读存储器)、DVD(数字化视频光盘)等)、磁光盘、半导体存储器等构成的封装介质,或者是通过例如局域网、因特网或数字卫星广播的有线或无线传输介质来提供。
随后,可移动的介质211被安装到驱动器210上,由此程序可以通过输入/输出接口205安装在记录单元208中。同时,程序可以通过有线或无线传输介质在通信单元209处接收,并且安装在记录单元208中。可替换地,程序可以被预先安装在ROM 202中或记录单元208中。
注意,由计算机执行的程序可以是其中按本说明书中说明的顺序以时序执行处理的程序,或者可以是并行地或在适当的时刻如在执行调用时,执行处理的程序。同时要注意的是,本发明的实施例不限于上述实施例,并且在不背离本发明的实质和范围的情况下可以进行多种修改。
本申请包含关于在2008年4月22日提交到日本专利局的日本优先权专利申请JP 2008-111119中公开的主题,该专利申请的全部内容通过引用结合于此。
本领域技术人员应该理解根据设计要求和其他因素可以在所附权利要求或其等同方案的范围内进行多种修改、组合、子组合和改变。
Claims (5)
1.一种评估设备,包括:
预测计算装置,被配置为基于由表示多个使用者中的每一个对于多个评价目标中的每一个的评价的评价值构成的评价矩阵和评估表达式来评估未由所述使用者进行过评价的所述评价目标的所述评价值,并且获得作为评估的所述评价值的预测评价值,所述评估表达式用于通过应用所述评价矩阵的计算来评估所述评价值;以及
线性组合装置,被配置为通过应用线性组合系数对通过应用多个所述评估表达式所获得的多个所述预测评价进行线性组合,由此获得对于未由所述使用者进行过所述评价的所述评价目标的评价的最终评估结果,其中,利用至少一个临时预测矩阵和所述线性组合系数来计算每个使用者对于每个内容的最终的预测评价值,所述至少一个临时预测矩阵是通过所述多个评估表达式中的至少一个按照至少一种评估方法生成的。
2.根据权利要求1所述的评估设备,其中所述评估表达式由多个算子构成,所述算子包括执行协同过滤计算的算子。
3.根据权利要求2所述的评估设备,还包括:
评估表达式候选生成装置,被配置为将所述多个所述评估表达式作为评估表达式候选,所述评估表达式候选是最新应用于计算所述最终评估结果的多个所述评估表达式的候选,并且该评估表达式候选生成装置被配置为生成任意新的评估表达式和通过修改所述多个所述评估表达式中的一些评估表达式的一部分获得的新的评估表达式来作为所述评估表达式候选;
评估结果生成装置,被配置为,针对每个所述评估表达式候选,基于所述评估表达式候选和所述评价矩阵,计算所述评价矩阵中的每个所述使用者对于所述多个所述评价目标中的每一个的所述预测评价值,来生成由通过计算而获得的所述预测评价值构成的评估结果;
线性组合系数计算装置,被配置为将多个所述评估结果中的一些作为使用的评估结果,并且在应用使用的评估表达式候选作为所述评估表达式的情况下通过应用所述使用的评估结果和所述评价矩阵来获得所述线性组合系数,所述使用的评估表达式候选是用于生成所述使用的评估结果的所述评估表达式候选;
评价装置,被配置为计算作为对于所述使用的评估表达式候选和所述线性组合系数的评价的信息量基准,根据所述信息量基准,如果评估表达式候选和线性组合系数候选越适合于生成预测评价矩阵,则对该评估表达式候选和线性组合系数候选的评价越高,其中,所述预测评价矩阵是由所述表示多个使用者中的每一个对于多个评价目标中的每一个的评价的评价值以及所述最终的预测评价值构成的;以及
选择装置,被配置为根据所述信息量基准选择所述使用的评估表达式候选和所述线性组合系数中具有最高评价的所述使用的评估表达式候选作为新应用于所述最终评估结果计算的所述多个所述评估表达式和所述线性组合系数。
4.根据权利要求3所述的评估设备,其中,所述线性组合系数计算装置,在属于多个组中的一个组的所述多个所述使用者中,应用属于与所述组相同的组的所述使用者的所述评价值和所述预测评价值来获得每个所述组的所述线性组合系数,其中根据所述评价矩阵将所述多个所述使用者分成所述多个组。
5.一种用于评估设备的评估方法,该方法包括:
预测计算手段,被配置为基于由表示多个使用者中的每一个对于多个评价目标中的每一个的评价的评价值构成的评价矩阵和评估表达式来评估未由所述使用者进行过评价的所述评价目标的所述评价值,并且获得作为评估的所述评价值的预测评价值,所述评估表达式用于通过应用所述评价矩阵的计算来评估所述评价值;
线性组合手段,被配置为通过应用线性组合系数对通过应用多个所述评估表达式所获得的多个所述预测评价值进行线性组合,由此获得对于未由所述使用者进行过所述评价的所述评价目标的评价的最终评估结果;
所述预测计算手段基于所述评估表达式和所述评价矩阵而获得对于所述多个所述评估表达式的所述预测评价值;以及
所述线性组合手段使针对每个所述评估表达式获得的每个所述预测评价值通过应用所述线性组合系数而进行线性组合,以获得所述使用者对于所述评价目标的评价的所述最终评估结果,其中,利用至少一个临时预测矩阵和所述线性组合系数来计算每个使用者对于每个内容的最终的预测评价值,所述至少一个临时预测矩阵是通过所述多个评估表达式中的至少一个按照至少一种评估方法生成的。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008-111119 | 2008-04-22 | ||
JP2008111119A JP4591793B2 (ja) | 2008-04-22 | 2008-04-22 | 推定装置および方法、並びにプログラム |
JP2008111119 | 2008-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101568014A CN101568014A (zh) | 2009-10-28 |
CN101568014B true CN101568014B (zh) | 2013-03-27 |
Family
ID=41201949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101336907A Expired - Fee Related CN101568014B (zh) | 2008-04-22 | 2009-04-22 | 评估设备和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8160987B2 (zh) |
JP (1) | JP4591793B2 (zh) |
CN (1) | CN101568014B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5442547B2 (ja) * | 2010-07-08 | 2014-03-12 | 株式会社Nttドコモ | コンテンツ推薦装置及び方法 |
JP2012058972A (ja) * | 2010-09-08 | 2012-03-22 | Sony Corp | 評価予測装置、評価予測方法、及びプログラム |
GB201520398D0 (en) * | 2015-11-19 | 2016-01-06 | Realeyes Oü | Method and apparatus for immediate prediction of performance of media content |
CN105809285A (zh) * | 2016-03-08 | 2016-07-27 | 中国水利水电科学研究院 | 一种基于水资源的产业结构诊断方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005167628A (ja) * | 2003-12-02 | 2005-06-23 | Sony Corp | 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム |
JP2007121457A (ja) * | 2005-10-25 | 2007-05-17 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
JP2007317068A (ja) * | 2006-05-29 | 2007-12-06 | Osaka Prefecture Univ | リコメンド装置およびリコメンドシステム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9706174D0 (en) * | 1997-03-25 | 1997-11-19 | Secr Defence | Recognition system |
US7178080B2 (en) * | 2002-08-15 | 2007-02-13 | Texas Instruments Incorporated | Hardware-efficient low density parity check code for digital communications |
US7324902B2 (en) * | 2003-02-18 | 2008-01-29 | General Motors Corporation | Method and apparatus for generalized recursive least-squares process for battery state of charge and state of health |
DE502004007902D1 (de) * | 2004-09-16 | 2008-10-02 | Siemens Ag | Automatisierungssystem mit affektiver Steuerung |
-
2008
- 2008-04-22 JP JP2008111119A patent/JP4591793B2/ja not_active Expired - Fee Related
-
2009
- 2009-04-20 US US12/426,659 patent/US8160987B2/en not_active Expired - Fee Related
- 2009-04-22 CN CN2009101336907A patent/CN101568014B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005167628A (ja) * | 2003-12-02 | 2005-06-23 | Sony Corp | 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム |
JP2007121457A (ja) * | 2005-10-25 | 2007-05-17 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
JP2007317068A (ja) * | 2006-05-29 | 2007-12-06 | Osaka Prefecture Univ | リコメンド装置およびリコメンドシステム |
Non-Patent Citations (1)
Title |
---|
Toshihiro Kamishima.Algorithms for Recommender Systems (2).《Artificial intelligence studies bulletin, Japan》.Artificail intelligence society,2008,第23卷(第1期),89-103. * |
Also Published As
Publication number | Publication date |
---|---|
US8160987B2 (en) | 2012-04-17 |
JP2009265729A (ja) | 2009-11-12 |
JP4591793B2 (ja) | 2010-12-01 |
CN101568014A (zh) | 2009-10-28 |
US20090265294A1 (en) | 2009-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101568013B (zh) | 信息处理设备及方法 | |
CN109657805B (zh) | 超参数确定方法、装置、电子设备及计算机可读介质 | |
KR102044205B1 (ko) | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 | |
Li et al. | Analysis of attribute weighting heuristics for analogy-based software effort estimation method AQUA+ | |
CN111291895B (zh) | 组合特征评估模型的样本生成和训练方法及装置 | |
CN103443809B (zh) | 判别模型学习设备、方法和程序 | |
CN101568014B (zh) | 评估设备和方法 | |
CN108681742B (zh) | 用于分析司机驾驶行为对车辆能耗敏感性的分析方法 | |
CN112070615A (zh) | 基于知识图谱的理财产品推荐方法及装置 | |
Long et al. | A new approach for construction of geodemographic segmentation model and prediction analysis | |
Simmons et al. | Beware greedy algorithms | |
CN112598405B (zh) | 一种基于大数据的商业项目数据管理方法及系统 | |
Bickel | A predictive approach to measuring the strength of statistical evidence for single and multiple comparisons | |
US20220004959A1 (en) | Method and system for prefiltering in ride-hailing platforms | |
US20210350260A1 (en) | Decision list learning device, decision list learning method, and decision list learning program | |
Gelper et al. | Least angle regression for time series forecasting with many predictors | |
JP2005222445A (ja) | データマイニングにおける情報処理方法及び解析装置 | |
CN114861989A (zh) | 一种加保业务的预测方法及装置 | |
US20230214668A1 (en) | Hyperparameter adjustment device, non-transitory recording medium in which hyperparameter adjustment program is recorded, and hyperparameter adjustment program | |
CN113537731A (zh) | 基于强化学习的设计资源能力评估方法 | |
Boyko et al. | Methodology for Estimating the Cost of Construction Equipment Based on the Analysis of Important Characteristics Using Machine Learning Methods | |
US20210319259A1 (en) | Method and apparatus for extracting a pattern of time series data | |
WO2022244625A1 (ja) | 修理内容予測方法、修理内容予測装置、プログラム、及び、修理内容予測モデルの作成方法 | |
US20220300518A1 (en) | Indexing based on feature importance | |
Kohli | Identification of important SNPs using penalized models and Bayesian Deep Learning on whole-genome Arabidopsis thaliana data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130327 Termination date: 20150422 |
|
EXPY | Termination of patent right or utility model |