CN101625698A - 信息处理设备、信息处理方法和程序 - Google Patents

信息处理设备、信息处理方法和程序 Download PDF

Info

Publication number
CN101625698A
CN101625698A CN200910158842A CN200910158842A CN101625698A CN 101625698 A CN101625698 A CN 101625698A CN 200910158842 A CN200910158842 A CN 200910158842A CN 200910158842 A CN200910158842 A CN 200910158842A CN 101625698 A CN101625698 A CN 101625698A
Authority
CN
China
Prior art keywords
estimator
metadata
unit
melody
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910158842A
Other languages
English (en)
Inventor
小林由幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101625698A publication Critical patent/CN101625698A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/085Mood, i.e. generation, detection or selection of a particular emotional content or atmosphere in a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了信息处理设备、信息处理方法和程序。一种信息处理设备,包括第一学习单元、第一误差建模单元、第一误差生成单元和第一估计单元。第一学习单元学习第一估计式,该第一估计式用于基于内容的特征量来估计内容的第一目标变量。第一误差建模单元确定在基于第一学习单元所学习的第一估计式来估计第一目标变量时所生成的误差的第一模型。第一误差生成单元利用随机数来生成根据第一误差建模单元所确定的第一模型的误差。第一估计单元利用第一学习单元所学习的第一估计式和第一误差生成单元所生成的随机数来估计内容的第一目标变量。

Description

信息处理设备、信息处理方法和程序
技术领域
本发明涉及信息处理设备、信息处理方法和程序,具体涉及能够为估计结果提供适当的随机性的信息处理设备、信息处理方法和程序。
背景技术
本申请人过去已提出了基于已知内容项的元数据来估计另一内容项的未知的元数据的技术(参见例如日本专利申请公开2007-122186)。该对元数据的估计被用于例如向用户推荐最适合的内容的推荐处理。
例如,在内容是音乐的例子中,执行用于基于乐曲的特征量来创建元数据估计式的机器学习,并将预定的乐曲的特征量输入到通过机器学习而创建的元数据估计式。由此可以估计该乐曲的未知的元数据。在这里,乐曲的特征量指的是通过借助于预定的特征量计算式计算乐曲的数据(信号)而获得的值。此外,乐曲的元数据指的是表示与用户对乐曲的感受相对应的乐曲的特征的值,所述用户对乐曲的感受例如是欢快、苦乐参半、悲伤和快节奏等。
因此,例如,如果所估计的元数据包括表示乐曲的欢快程度的“欢快”,并且如果用户搜索“欢快的”乐曲,则搜索装置可以针对由用户存储的各个内容项而基于元数据估计式来计算(估计)元数据“欢快”的程度,并且可以向用户呈现以该程度的降序而排序的乐曲。
然而,在这种类型的元数据估计中,只基于乐曲的特征量来估计乐曲的元数据。因此自然难以100%的精确度来估计元数据。也就是说,估计结果通常包括误差。在上述的用户搜索“欢快的”乐曲的情况下,所呈现的“欢快的”乐曲的呈现顺序包括误差。因此,难以确保呈现顺序真实地反映“欢快的”乐曲的顺序。
发明内容
此外,在根据相关技术的元数据估计中,当用户搜索“欢快的”乐曲时,由搜索装置计算出的各个内容项的元数据“欢快”的程度每次都由相同的值表示,除非通过机器学习而创建的元数据估计式被改变。因此,搜索装置每次以相同的排序顺序向用户呈现内容项。该呈现造成了用户对所呈现的内容变得厌烦的问题。
为了解决上述问题,已提出了以下方法:该方法在一定程度上保持元数据“欢快”的原始顺序的同时随机地重新排列内容项。然而,这种重新排列并无依据。因此,这种重新排列会导致不适当的搜索结果(呈现)。也就是说,由于重新排列,在一些情况下“欢快”程度低的乐曲被呈现在“欢快”程度高的乐曲上方。
当利用诸如欢快、苦乐参半、悲伤和快节奏之类的因素作为乐曲的特征量并利用诸如“喜欢”和“不喜欢”之类的标签作为元数据来估计和推荐(呈现)用户偏好的乐曲时,也发生类似的问题。
已经鉴于上述情况而作出了本发明。期望为估计结果提供适当的随机性。
根据本发明的实施例的信息处理设备包括第一学习装置、第一误差建模装置、第一误差生成装置和第一估计装置。第一学习装置学习第一估计式,该第一估计式用于基于内容的特征量来估计内容的第一目标变量。第一误差建模装置确定在基于第一学习装置所学习的第一估计式来估计第一目标变量时所生成的误差的第一模型。第一误差生成装置利用随机数来生成根据第一误差建模装置所确定的第一模型的误差。第一估计装置利用第一学习装置所学习的第一估计式和第一误差生成装置所生成的随机数来估计内容的第一目标变量。
根据本发明的实施例的信息处理设备还可包括搜索装置,该搜索装置用于利用第一估计装置所估计的内容的第一目标变量来搜索内容。
根据本发明的实施例的信息处理设备还可包括第二学习装置、第二误差建模装置、第二误差生成装置和第二估计装置。第二学习装置利用通过仅使用第一学习装置所学习的第一估计式而获得的第一目标变量来学习用于估计第二目标变量的第二估计式。第二误差建模装置确定在基于第二学习装置所学习的第二估计式来估计第二目标变量时所生成的误差的第二模型。第二误差生成装置利用随机数来生成根据第二误差建模装置所确定的第二模型的误差。第二估计装置利用第二学习装置所学习的第二估计式和第二误差生成装置所生成的随机数来估计内容的第二目标变量。
根据本发明的实施例的信息处理设备还可包括推荐装置,该推荐装置用于利用第二估计装置所估计的内容的第二目标变量来推荐内容。
根据本发明的实施例的信息处理方法包括以下步骤:学习第一估计式,该第一估计式用于基于内容的特征量来估计内容的第一目标变量;确定在基于所学习的第一估计式来估计第一目标变量时所生成的误差的第一模型;利用随机数来生成根据所确定的第一模型的误差;以及利用所学习的第一估计式和所生成的随机数来估计内容的第一目标变量。
根据本发明的实施例的程序使得计算机执行包括以下步骤的处理:学习第一估计式,该第一估计式用于基于内容的特征量来估计内容的第一目标变量;确定在基于所学习的第一估计式来估计第一目标变量时所生成的误差的第一模型;利用随机数来生成根据所确定的第一模型的误差;以及利用所学习的第一估计式和所生成的随机数来估计内容的第一目标变量。
在本发明的实施例中,学习用于基于内容的特征量来估计内容的第一目标变量的第一估计式,并确定在基于所学习的第一估计式来估计第一目标变量时所生成的误差的第一模型。此外,利用随机数来生成根据所确定的第一模型的误差,并利用所学习的第一估计式和所生成的随机数来估计内容的第一目标变量。
根据本发明的实施例,可以为估计结果提供适当的随机性。
附图说明
图1是示出了本发明的实施例所应用于的信息处理设备的配置示例的框图;
图2是示出了存储在元数据标签数据库(DB)中的数据的示例的图;
图3是示出了存储在偏好标签DB中的数据的示例的图;
图4是示出了由元数据估计式学习单元生成的数据的示例的图;
图5是示出了从音乐DB获取的乐曲的特征量的示例的图;
图6是示出了乐曲的偏好标签和估计的元数据标签的示例的图;
图7是示出了乐曲的估计的元数据标签的示例的图;
图8是示出了搜索处理中的估计的元数据标签和估计的偏好标签的示例的图;
图9是示出了在搜索处理中以估计的元数据标签的降序执行的乐曲排序的结果的图;
图10是示出了在搜索处理中以估计的偏好标签的降序执行的乐曲排序的结果的图;
图11是示出了推荐处理中的估计的偏好标签的示例的图;
图12是示出了在推荐处理中以估计的偏好标签的降序执行的排序的结果的图;
图13是用于说明元数据估计式学习处理的流程图;
图14是用于说明元数据标签估计处理的流程图;
图15是用于说明偏好估计式学习处理的流程图;
图16是用于说明偏好标签估计处理的流程图;
图17是用于说明搜索请求接收处理或推荐请求接收处理的流程图;
图18是用于说明搜索处理的流程图;
图19是用于说明推荐处理的流程图;
图20是示出了估计功能的功能框图;以及
图21是示出了本发明的实施例所应用于的计算机的配置示例的框图。
具体实施方式
图1示出了本发明的实施例所应用于的信息处理设备的配置示例。
图1的信息处理设备1执行内容搜索处理和内容推荐处理。下面将描述信息处理设备1的配置和操作,其中将音乐作为内容的示例。下面描述的内容搜索处理和内容推荐处理也可应用于诸如图像等的除了音乐之外的内容。
信息处理设备1被配置为至少包括音乐DB(数据库)11、元数据标签输入单元12、元数据标签DB 13、元数据估计式学习单元14、元数据估计式DB 15、元数据标签估计单元16、偏好标签输入单元17、偏好标签DB 18、偏好估计式学习单元19、偏好估计式DB 20、偏好标签估计单元21、搜索请求或推荐请求输入单元22、搜索单元23、推荐单元24和搜索结果或推荐结果呈现单元25。
音乐DB 11将从未示出的音乐输入单元输入的诸多乐曲的数据(音乐数据)与该乐曲的特征量存储在一起。在此,乐曲的特征量指的是通过借助于预定的特征量计算式计算乐曲的数据(信号)而获得的值。特征量可以随音乐数据一起被输入。替代性地,可以只输入音乐数据,并且可以使用输入的音乐数据而利用预定的特征量计算式来计算特征量。在本实施例中,假定音乐DB 11存储n首乐曲(n>0)且针对每首乐曲存储m种类型的特征量(m>0)。
元数据标签输入单元12接收用户输入的、存储在音乐DB 11中的乐曲的元数据标签,并将该元数据标签提供给元数据标签DB 13。
元数据标签指的是表示乐曲的元数据的程度的值。元数据包括欢快、苦乐参半、悲伤和快节奏等,其均为与用户对乐曲的感受相对应的乐曲特征。在此,元数据被划分成p种类型(p>0)。此外,元数据标签的可能的值为1至5。当元数据(例如“欢快”)完全不适用于乐曲时用户输入值“1”,当元数据不适用于乐曲时用户输入值“2”,当难以确定元数据是否适用于乐曲时用户输入值“3”,当元数据适用于乐曲时用户输入值“4”,以及当元数据非常适用于乐曲时用户输入值“5”。因此,乐曲的元数据标签指的是表示乐曲的欢快、苦乐参半、悲伤和快节奏等的程度的值。
元数据标签DB 13存储由元数据标签输入单元12提供的乐曲的元数据标签。不必为存储在音乐DB 11中的每个乐曲都分配元数据标签。
元数据估计式学习单元14使用存储在元数据标签DB 13中的乐曲的元数据标签和m种类型的特征量来执行线性回归,以由此导出用于估计元数据的元数据估计式。也就是说,元数据估计式学习单元14从元数据标签DB 13获取存储在音乐DB 11中的乐曲的元数据标签,并从音乐DB11获取该乐曲的m种类型的特征量。然后,元数据估计式学习单元14通过线性回归而导出用于估计元数据的元数据估计式。
元数据估计式学习单元14针对p种类型的元数据中的每种类型的元数据而导出元数据估计式,并将该元数据估计式提供给元数据估计式DB15。元数据估计式DB 15存储由元数据估计式学习单元14提供的元数据估计式。存储元数据估计式意味着存储用于标识元数据估计式的参数。这也适用于稍后描述的偏好估计式。
元数据标签估计单元16借助于存储在元数据估计式DB 15中的元数据估计式来计算(估计)存储在音乐DB 11中的乐曲的未知的元数据。更具体地,元数据标签估计单元16从音乐DB 11获得要计算其元数据的各个乐曲的特征量,并将该特征量代入使用乐曲的特征量作为变量的元数据估计式中,以由此计算未知的元数据。所计算出的乐曲的元数据在适当时被提供给偏好估计式学习单元19、偏好标签估计单元21、或搜索单元23。
偏好标签输入单元17接收用户输入的、存储在音乐DB 11中的乐曲的偏好标签,并将该偏好标签提供给偏好标签DB 18。偏好标签DB 18存储由偏好标签输入单元17提供的乐曲的偏好标签。同样不必为存储在音乐DB 11中的每个乐曲都分配偏好标签。
偏好标签指的是表示对乐曲的偏好程度的值。当用户憎恶输入的乐曲时用户输入值“1”,当用户不喜欢乐曲时用户输入值“2”,当难以确定用户是否喜欢乐曲时用户输入值“3”,当用户喜欢乐曲时用户输入值“4”,以及当用户热爱乐曲时用户输入值“5”。
偏好估计式学习单元19使用存储在偏好标签DB 18中的乐曲的偏好标签来执行线性回归,以由此导出用于估计偏好标签的偏好估计式。具体地,偏好估计式学习单元19使用存储在偏好标签DB 18中的乐曲的偏好标签以及由元数据标签估计单元16提供的p种类型的元数据标签来执行线性回归,以由此导出用于估计偏好标签的偏好估计式。由元数据标签估计单元16提供的元数据标签是基于元数据估计式学习单元14所导出的元数据估计式来估计的(在下文中称为估计的元数据标签)。所导出的偏好估计式被提供给偏好估计式DB 20,并被存储在偏好估计式DB 20中。
偏好标签估计单元21借助于存储在偏好估计式DB 20中的偏好估计式来估计预定的乐曲的偏好标签。在通过搜索单元23进行乐曲搜索时和通过推荐单元24进行乐曲推荐时使用所估计的乐曲的偏好标签(在下文中称为估计的偏好标签)。因此,偏好标签估计单元21在适当时估计多个乐曲的偏好标签,并将所估计的偏好标签提供给搜索单元23或推荐单元24。
搜索请求或推荐请求输入单元22接收来自用户的对音乐搜索或音乐推荐的请求,并将该搜索请求或推荐请求提供给搜索单元23或推荐单元24。例如,如果搜索请求或推荐请求输入单元22接收到用户输入(指定)的、对欢快的和快节奏的乐曲的搜索请求,则搜索请求或推荐请求输入单元22将该搜索请求随搜索的条件一起输出至搜索单元23。此外,例如,如果搜索请求或推荐请求输入单元22接收到用户输入(指定)的、对喜爱的乐曲的推荐请求,则搜索请求或推荐请求输入单元22将该推荐请求输出至推荐单元24。
搜索单元23将从存储在音乐DB 11中的乐曲中选择的、满足由搜索请求或推荐请求输入单元22提供的搜索条件的乐曲的列表作为搜索结果而提供给搜索结果或推荐结果呈现单元25。更详细地,搜索单元23从元数据标签估计单元16获得存储在音乐DB 11中的乐曲的估计的元数据标签,并从偏好标签估计单元21获得该乐曲的估计的偏好标签。然后,搜索单元23基于所获得的估计的元数据标签和估计的偏好标签来搜索满足搜索条件的乐曲。搜索单元23在适当时可以使得元数据标签估计单元16计算乐曲的估计的元数据标签,并使得偏好标签估计单元21计算乐曲的估计的偏好标签。
推荐单元24在接收到由搜索请求或推荐请求输入单元22提供的推荐请求时,将存储在音乐DB 11中的乐曲的推荐结果提供给搜索结果或推荐结果呈现单元25。更详细地,推荐单元24从偏好标签估计单元21获得存储在音乐DB 11中的乐曲的估计的偏好标签,并将以估计的偏好标签的降序而排序的乐曲列表作为推荐结果而提供给搜索结果或推荐结果呈现单元25。与搜索单元23相类似地,推荐单元24也可以在适当时使得偏好标签估计单元21计算乐曲的估计的偏好标签。
搜索结果或推荐结果呈现单元25将由搜索单元23提供的搜索结果或由推荐单元24提供的推荐结果呈现给用户。具体地,搜索结果或推荐结果呈现单元25将作为搜索结果或推荐结果的乐曲列表显示在屏幕上,或者以作为搜索结果或推荐结果的乐曲列表的顺序来再现乐曲。
在上述配置的信息处理设备1中,可以基于所输入的、存储在音乐DB 11中的一些乐曲的元数据标签和偏好标签来创建元数据估计式和偏好估计式。此外,可以借助于元数据估计式和偏好估计式来估计存储在音乐DB 11中的全部乐曲的元数据和偏好标签。此外,可以基于乐曲的元数据和偏好标签而将音乐搜索结果和音乐推荐结果呈现给用户。
在信息处理设备1所产生的音乐搜索结果和音乐推荐结果的呈现中,元数据估计式和偏好估计式中的误差被包括在搜索处理和推荐处理的计算中。因此,可以为音乐搜索结果或音乐推荐结果提供适当的随机性,并且可以将多种搜索结果和推荐结果呈现给用户。
将参照图2至12来描述由信息处理设备1的各个块执行的详细处理。
图2示出了存储在元数据标签DB 13中的数据的示例。
元数据标签DB 13存储由用户输入到元数据标签输入单元12中的乐曲的元数据标签。元数据被划分为包括“欢快”、“快节奏”、“苦乐参半”、“平静”、“悲伤”等的p种类型。
如上文所述,不必为存储在音乐DB 11中的每个乐曲都分配元数据标签。此外,不必为乐曲的每种元数据类型都分配元数据标签。因此,例如,在音乐1中仅为元数据“欢快”分配表示该元数据“完全不适用于该乐曲”的值“1”。此外,例如,在音乐4和音乐5中,不为任一种元数据类型分配元数据标签。
图3示出了存储在偏好标签DB 18中的数据的示例。
偏好标签DB 18存储由用户输入到偏好标签输入单元17中的乐曲的偏好标签。在图3的示例中,针对音乐3而存储表示“难以确定用户是否喜欢该乐曲”的值“3”,针对音乐4而存储表示“用户热爱该乐曲”的值“5”。如上文所述,同样不必为存储在音乐DB 11中的每个乐曲都分配偏好标签。因此,仅为一些乐曲分配偏好标签。
随后将描述元数据估计式学习单元14的处理。
元数据估计式学习单元14将其元数据估计式尚未被导出的元数据类型之一确定为其元数据估计式要被导出的元数据(在下文中称为对象元数据)。元数据估计式学习单元14针对p种类型的元数据中的每种类型的元数据而执行导出元数据估计式的处理。也就是说,所有的p种类型的元数据被顺序地设为对象元数据。
元数据估计式学习单元14从元数据标签DB 13获得每个被分配有对象元数据的标签(元数据标签)的乐曲的元数据标签Mj。此外,元数据估计式学习单元14从音乐DB 11获得每个其元数据标签Mj已被从元数据标签DB 13获取的乐曲的m种类型的特征量X1至Xm。然后,元数据估计式学习单元14针对所获取的每个乐曲而将元数据标签Mj与特征量X1至Xm相关联。
图4示出了数据的示例,其中对象元数据是元数据“欢快”,并且从元数据标签DB 13获取的每个预定的乐曲的元数据标签Mj被与从音乐DB 11获取的该乐曲的特征量X1至Xm相关联。可以基于乐曲标题、登记顺序、用于标识乐曲的索引编号等来标识存储在音乐DB 11中的乐曲(的特征量)与存储在元数据标签DB 13中的乐曲(的元数据标签)之间的关联。
然后,元数据估计式学习单元14使用每个乐曲的特征量X1至Xm来执行线性回归,以由此导出用于估计对象元数据的元数据标签Mj′的回归式。
具体地,当将线性组合系数表示为bj0和bj1至bjm并将已知为真值的元数据标签Mj与根据这种情况下的回归式而估计的估计值Mj′之间的误差表示为ej时,可以使用特征量X1至Xm而用下式(1)来表示元数据标签Mj
式1
M j = Σ i = 1 m b ji X i + b j 0 + e j . . . ( 1 )
元数据估计式学习单元14将图4列出的每个乐曲的元数据标签Mj和特征量X1至Xm代入式(1)中。结果,针对已被分配了元数据“欢快”的元数据标签的每个乐曲而创建其中已代入了元数据标签Mj和特征量X1至Xm的式(1)。然后,元数据估计式学习单元14针对已被分配了元数据“欢快”的元数据标签的每个乐曲而对已代入了元数据标签Mj和特征量X1至Xm的式(1)进行求解。由此计算出线性组合系数bj0和bj1至bjm。也就是说,元数据估计式学习单元14计算用于最小化误差ej(平方误差ej 2)的线性组合系数bj0和bj1至bjm
在已计算出线性组合系数bj0和bj1至bjm后,将所计算出的线性组合系数bj0和bj1至bjm以及每个乐曲的元数据标签Mj和特征量X1至Xm代入式(1)中。由此可以获得针对每个乐曲的元数据标签Mj的误差ej。元数据估计式学习单元14借助于作为样本的每个乐曲中的实际误差ej而利用正态分布(高斯分布)对在使用估计的元数据标签Mj′的回归式时产生的估计误差进行建模。这里计算出的估计的元数据标签Mj′的估计误差的分布被假定为平均值为μj且方差为σj 2的正态分布。
根据以上描述,可以用下式(2)来表示估计的元数据标签Mj′,该估计的元数据标签Mj′表示作为对象元数据的第j种元数据类型的标签的估计值。
式2
M j ′ Σ j = 1 m b ji X i + b j 0 + NRN ( μ j , σ j 2 ) . . . ( 2 )
在此NRN(μj,σj 2)表示平均值为μj且方差为σj 2的正态随机数生成函数。
可以用下式(3)来表示针对n个乐曲中的第k个乐曲(即,音乐k)而概括后的式(2)。
式3
M jk ′ = Σ i = 1 m b ji X ki + b j 0 + NRN ( μ j , σ j 2 ) . . . ( 3 )
在式(3)中,Mjk′表示音乐k的第j个估计的元数据标签,而Xki代表音乐k的第i个特征量。
已如上文所述地由元数据估计式学习单元14计算出的、用于计算估计的元数据标签Mj′的线性组合系数bj0和bj1至bjm以及用于标识估计误差分布的平均值μj和方差σj 2作为用于计算估计的元数据标签Mj′的参数而被提供给元数据估计式DB 15,并被存储在元数据估计式DB 15中。
随后将描述元数据标签估计单元16的处理。
元数据标签估计单元16从音乐DB 11获取要估计其元数据标签的每个乐曲的特征量。例如,为了估计音乐k的第j个元数据标签,元数据标签估计单元16从音乐DB 11获取音乐k的特征量Xk1至Xkm。图5示出了从音乐DB 11获取的音乐2的特征量X1至Xm(即,特征量X21至X2m)的示例。
此外,元数据标签估计单元16从元数据估计式DB 15获取用于计算估计的元数据标签Mj′的参数。也就是说,元数据标签估计单元16从元数据估计式DB 15获取用于计算估计的元数据标签Mj′的线性组合系数bj0和bj1至bjm以及用于标识估计误差分布的平均值μj和方差σj 2。然后,元数据标签估计单元16基于上述的式(3)来计算音乐k的第j个元数据标签的估计值(估计的元数据标签)Mjk′。
元数据标签估计单元16可以针对搜索处理或推荐处理所必需的预定数量的乐曲或元数据类型而计算估计的元数据标签Mjk′。换言之,元数据标签估计单元16可以根据来自搜索单元23或偏好标签估计单元21的请求而计算针对必要数量的乐曲或元数据类型的、估计的元数据标签Mjk′。
随后将描述偏好估计式学习单元19的处理。
偏好估计式学习单元19获取存储在偏好标签DB 18中的所有偏好标签。此外,偏好估计式学习单元19从元数据标签估计单元16获取其偏好标签已被从偏好标签DB 18获取的每个乐曲的估计的元数据标签M1″至Mp″。
在此,由偏好估计式学习单元19从元数据标签估计单元16获取的音乐k的第j个估计的元数据标签Mjk″是基于下式(4)来计算的。
式4
M jk ′ ′ = Σ i = 1 m b ji X ki + b j 0 . . . ( 4 )
也就是说,偏好估计式学习单元19从元数据标签估计单元16获取(使元数据标签估计单元16计算)的乐曲的估计的元数据标签M1″至Mp″的值不包括根据正态随机数生成函数的估计误差。
图6示出了分别从偏好标签DB 18和元数据标签估计单元16获取的乐曲的偏好标签和估计的元数据标签M1″至Mp″的示例。
与元数据估计式学习单元14的情况相类似地,也可以基于乐曲标题、登记顺序、用于识别乐曲的索引编号等来识别存储在偏好标签DB 18中的每个乐曲的偏好标签与从元数据标签估计单元16获取的估计的元数据标签M1″至Mp ″之间的关联。
然后,偏好估计式学习单元19使用估计的元数据标签M1″至Mp″来执行线性回归,以由此导出用于估计每个乐曲的偏好标签的回归式。
具体地,当将线性组合系数表示为b0和b1至bp并将已知为真值的偏好标签Y与根据这种情况下的回归式而估计的估计值Y′之间的误差表示为e时,可以使用估计的元数据标签M1″至Mp″而用下式(5)来表示偏好标签Y。
式5
Y = Σ i = 1 p b i M i ′ ′ + b 0 + e . . . ( 5 )
然后,与元数据估计式学习单元14的情况相类似地,偏好估计式学习单元19针对图6中列出的每个乐曲,通过将乐曲的偏好标签Y和估计的元数据标签M1″至Mp″代入式(5)中来创建公式,以由此计算用于最小化误差e(平方误差e2)的线性组合系数b0和b1至bp
在已经计算出线性组合系数b0和b1至bp之后,将所计算出的线性组合系数b0和b1至bp以及每个乐曲的偏好标签Y和估计的元数据标签M1″至Mp″代入式(5)中。由此可以针对每个乐曲的偏好标签Y而获得误差e。偏好估计式学习单元19借助于作为样本的每个乐曲中的实际误差e而使用正态分布(高斯分布)对在使用估计的偏好标签Y′的回归式时产生的估计误差进行建模。这里计算出的估计的偏好标签Y′的估计误差的分布被假定为具有平均值μ和方差σ2
根据以上描述,用下式(6)来表示估计的偏好标签Y′,该估计的偏好标签Y′表示乐曲的偏好标签的估计值。
式6
Y ′ = Σ i = 1 p b i M i ′ ′ + b 0 + NRN ( μ , σ 2 ) . . . ( 6 )
在此,NRN(μ,σ2)表示平均值为μ且方差为σ2的正态随机数生成函数。
可以用下式(7)来表示针对n首乐曲中的第k首乐曲(即,音乐k)而概括后的式(6)。
式7
Y k ′ = Σ i = 1 p b i M ki ′ ′ + b 0 + NRN ( μ , σ 2 ) . . . ( 7 )
在式(7)中,Yk′表示音乐k的估计的偏好标签,而Mki表示音乐k的第i个估计的元数据标签。
已如上文所述地由偏好估计式学习单元19计算出的、用于计算每个乐曲的估计的偏好标签的线性组合系数b0和b1至bp以及用于标识估计误差分布的正态分布的平均值μ和方差σ2作为用于计算估计的偏好标签Y′的参数而被提供给偏好估计式DB 20,并被存储在偏好估计式DB 20中。
随后将描述偏好标签估计单元21的处理。
偏好标签估计单元21从元数据标签估计单元16获取要估计其偏好标签的每个乐曲的估计的元数据标签M1″至Mp″。例如,为了估计音乐k的偏好标签,偏好标签估计单元21从元数据标签估计单元16获取估计的元数据标签Mk1″至Mkp″。图7示出了从元数据标签估计单元16获取的音乐2的估计的元数据标签M1″至Mp″(即,估计的元数据标签M21″至M2p″)的示例。
此外,偏好标签估计单元21从偏好估计式DB 20获取用于计算估计的偏好标签Yk′的参数。也就是说,偏好标签估计单元21从偏好估计式DB 20获取用于计算每个乐曲的估计的偏好标签的线性组合系数b0和b1至bp以及用于标识估计误差分布的正态分布的平均值μ和方差σ2。然后,偏好标签估计单元21基于上述的式(7)来计算音乐k的估计的偏好标签Yk′。
偏好标签估计单元21可以针对搜索处理或推荐处理所必需的预定数量的乐曲来计算估计的偏好标签Yk′。换言之,偏好标签估计单元21可以根据来自搜索单元23或推荐单元24的请求而计算必要数量的乐曲的估计的偏好标签Yk′。
随后将描述使用如上文所述地计算出的估计的元数据标签Mjk′和估计的偏好标签Yk′的搜索和推荐。
首先将描述以下的示例:在该示例中,搜索请求或推荐请求输入单元22接收到来自用户的对“欢快的”乐曲的搜索请求。
搜索单元23针对音乐1至音乐n从元数据标签估计单元16获取元数据“欢快”的估计的元数据标签Mj1′至Mjn′(在此j表示与元数据“欢快”相对应的值),并从偏好标签估计单元21获取该乐曲的估计的偏好标签Y1′至Yn′。
图8示出了音乐1至音乐n的元数据“欢快”的估计的元数据标签Mj1′至Mjn′以及估计的偏好标签Y1′至Yn′的数据的示例。
搜索单元23以估计的元数据标签或估计的偏好标签的降序来对音乐1至音乐n进行排序,并将排序后获得的音乐列表作为搜索结果而提供给搜索结果或推荐结果呈现单元25。
图9示出了以估计的元数据标签(即,元数据“欢快”的估计的元数据标签Mj1′至Mjn′)的降序来进行排序的结果。
此外,例如,存在作为搜索条件而将元数据标签指定在范围之内的情况。在这种情况下,搜索单元23可以向搜索结果或推荐结果呈现单元25提供如下的乐曲的音乐列表作为搜索结果:该乐曲的估计的元数据标签落入指定的范围之内,并且该乐曲被以估计的偏好标签的降序而进行排序。
图10示出了当用户输入元数据“欢快”的元数据标签是“3或更小”这一条件时所获得的搜索结果的示例。
在图10中,仅提取元数据“欢快”的估计的元数据标签是3或更小的乐曲,并且进一步以估计的偏好标签的降序对所提取的乐曲进行排序。
随后将描述从搜索请求或推荐请求输入单元22提供推荐请求的示例。
推荐单元24从偏好标签估计单元21获取音乐1至音乐n的估计的偏好标签Y1′至Yn′。
图11示出了所获取的估计的偏好标签Y1′至Yn′的数据的示例。
然后,如图12所示,推荐单元24以估计的偏好标签的降序来对音乐1至音乐n进行排序,并将排序后获得的音乐列表作为推荐结果而提供给搜索结果或推荐结果呈现单元25。
随后将参照图13至19的流程图来进一步描述分别由元数据估计式学习单元14、元数据标签估计单元16、偏好估计式学习单元19、偏好标签估计单元21、搜索单元23、推荐单元24和搜索结果或推荐结果呈现单元25所执行的处理。
假定在下面描述的处理之前将必要的数据存储在音乐DB 11、元数据标签DB 13和偏好标签DB 18的每个之中。
图13示出了由元数据估计式学习单元14执行的元数据估计式学习处理的流程图。
首先,在步骤S1中,元数据估计式学习单元14确定要导出其元数据估计式的元数据(在下文中称为对象元数据)。也就是说,元数据估计式学习单元14将对象元数据确定为其元数据估计式尚未被导出的元数据类型之一。
在步骤S2中,元数据估计式学习单元14从元数据标签DB 13获取对象元数据的元数据标签Mj。此外,元数据估计式学习单元14从音乐DB 11获取乐曲的特征量X1至Xm。这里获取的特征量X1至Xm是其元数据标签Mj已被获取的乐曲的特征量。然后,元数据估计式学习单元14存储每个获取的乐曲的元数据标签Mj和特征量X1至Xm,使得元数据标签Mj与特征量X1至Xm相互关联。
在步骤S3中,元数据估计式学习单元14使用每个乐曲的特征量X1至Xm来执行线性回归,以由此导出用于估计对象元数据的元数据标签Mj′的回归式。也就是说,元数据估计式学习单元14通过将每个乐曲的元数据标签Mj和特征量X1至Xm代入式(1)中来创建公式。然后,元数据估计式学习单元14基于所创建的公式来计算用于最小化误差ej(平方误差ej 2)的线性组合系数bj0和bj1至bjm
在步骤S4中,元数据估计式学习单元14利用正态分布(高斯分布)来对在使用估计的元数据标签Mj′的回归式时产生的估计误差进行建模。也就是说,元数据估计式学习单元14利用将每个乐曲中的实际误差ej作为样本来计算正态分布的平均值μj和方差σj 2,所述每个乐曲中的实际误差ej是通过将所计算出的线性组合系数bj0和bj1至bjm以及被分配有对象元数据的元数据标签的每个乐曲的元数据标签Mj和特征量X1至Xm代入式(1)中而获得的。
在步骤S5中,元数据估计式学习单元14将用于计算估计的元数据标签Mj′的参数提供给元数据估计式DB 15,以使该参数被存储在元数据估计式DB 15中。也就是说,元数据估计式学习单元14向元数据估计式DB15提供用于计算估计的元数据标签Mj′的元数据估计式的线性组合系数bj0和bj1至bjm、以及用于标识估计误差的分布的正态分布的平均值μj和方差σj 2,以使该线性组合系数bj0和bj1至bjm、平均值μj以及方差σj 2被存储在元数据估计式DB 15中。
在步骤S6中,元数据估计式学习单元14确定是否已针对所有的元数据类型而导出了元数据估计式。如果在步骤S6中确定尚未针对所有的元数据类型而导出元数据估计式,则处理返回到步骤S1,以将对象元数据确定为其元数据估计式尚未被导出的另一元数据类型。然后执行步骤S2至S6的处理。
另一方面,如果在步骤S6中确定已针对所有的元数据类型而导出了元数据估计式,则处理结束。
随后将参照图14的流程图来描述被执行用于估计音乐k的预定的元数据标签的元数据标签估计处理。
首先,在步骤S21中,元数据标签估计单元16从音乐DB 11获取音乐k的特征量Xk1至Xkm
在步骤S22中,元数据标签估计单元16从元数据估计式DB 15获取用于计算估计的元数据标签的参数。例如,为了计算音乐k的第j个元数据标签(估计的元数据标签Mjk′),元数据标签估计单元16从元数据估计式DB 15获取元数据估计式的线性组合系数bj0和bj1至bjm以及用于标识估计误差分布的正态分布的平均值μj和方差σj 2
在步骤S23中,元数据标签估计单元16计算估计的元数据标签。例如,为了计算音乐k的第j个元数据标签的估计值,元数据标签估计单元16基于上述的式(3)来计算元数据标签的估计值Mjk′。
在步骤S24中,元数据标签估计单元16确定是否已针对所有的其估计的元数据标签是必要的的乐曲和元数据而计算出了估计的元数据标签。
如果在步骤S24中确定尚未针对所有的其估计的元数据标签是必要的的乐曲和元数据而计算出估计的元数据标签,则处理返回到步骤S21以执行该步骤和后续步骤中的处理。也就是说,执行针对下一种元数据类型或下一个乐曲而计算估计的元数据标签的处理。
另一方面,如果在步骤S24中确定已针对所有的其估计的元数据标签是必要的的乐曲和元数据而计算出了估计的元数据标签,则处理结束。
随后将参照图15的流程图来描述由偏好估计式学习单元19进行的偏好估计式学习处理。
在步骤S41中,偏好估计式学习单元19从偏好标签DB 18获取存储在偏好标签DB 18中的所有乐曲的偏好标签。此外,在步骤S41中,偏好估计式学习单元19从元数据标签估计单元16获取其偏好标签已被从偏好标签DB 18获取的每个乐曲的估计的元数据标签M1″至Mp″,即,不包括根据正态随机数生成函数的估计误差的估计的元数据标签M1″至Mp ″。
在步骤S42中,偏好估计式学习单元19基于估计的元数据标签M1″至Mp″来执行线性回归,以由此导出用于估计每个乐曲的偏好标签的回归式。也就是说,偏好估计式学习单元19通过将每个乐曲的偏好标签Y和估计的元数据标签M1″至Mp ″代入式(5)中来创建公式。然后,偏好估计式学习单元19基于所创建的公式来计算用于最小化误差e(平方误差e2)的线性组合系数b0和b1至bp
在步骤S43中,偏好估计式学习单元19利用正态分布(高斯分布)来对在使用估计的偏好标签Y′的回归式时产生的估计误差进行建模。也就是说,偏好估计式学习单元19通过使用每个乐曲的实际误差e作为样本来计算正态分布的平均值μ和方差σ2,所述每个乐曲的实际误差e是通过将所计算出的线性组合系数b0和b1至bp以及每个乐曲的偏好标签Y和估计的元数据标签M1″至Mp″代入式(5)中而获得的。
在步骤S44中,偏好估计式学习单元19将用于计算估计的偏好标签Y′的参数提供给偏好估计式DB 20,以使该参数被存储在偏好估计式DB20中,然后处理结束。也就是说,偏好估计式学习单元19将用于计算乐曲的估计的偏好标签的线性组合系数b0和b1至bp以及用于标识估计误差分布的正态分布的平均值μ和方差σ2提供给偏好估计式DB 20,以使该线性组合系数b0和b1至bp、平均值μ和方差σ2被存储在偏好估计式DB20中,然后处理结束。
随后将参照图16的流程图来描述由偏好标签估计单元21进行的偏好标签估计处理。
首先,在步骤S61中,偏好标签估计单元21设定用于标识要估计其偏好标签的乐曲的变量k。
在步骤S62中,偏好标签估计单元21从元数据标签估计单元16获取音乐k的估计的元数据标签Mk1″至Mkp″。
在步骤S63中,偏好标签估计单元21从偏好估计式DB 20获取用于计算音乐k的估计的偏好标签Yk′的参数。具体地,偏好标签估计单元21从偏好估计式DB 20获取偏好估计式的线性组合系数b0和b1至bp以及用于标识估计误差的正态分布的平均值μ和方差σ2
在步骤S64中,偏好标签估计单元21基于上述的式(7)来计算音乐k的估计的偏好标签Yk′。
在步骤S65中,偏好标签估计单元21确定是否已针对所有的其估计的偏好标签是必要的的乐曲而计算出了估计的偏好标签。
如果在步骤S65中确定尚未针对所有的其估计的偏好标签是必要的的乐曲而计算出估计的偏好标签,则处理返回到步骤S61,以执行该步骤和后续步骤中的处理。也就是说,执行针对下个乐曲而计算估计的偏好标签的处理。
另一方面,如果在步骤S65中确定已针对所有的其估计的偏好标签是必要的的乐曲而计算出了估计的偏好标签,则处理结束。
随后将参照图17的流程图来描述接收来自用户的音乐搜索或音乐推荐请求并使搜索单元23或推荐单元24执行搜索处理或推荐处理的搜索请求或推荐请求接收处理。
首先,在步骤S81中,搜索请求或推荐请求输入单元22接收来自用户的音乐搜索或音乐推荐请求。
在步骤S82中,搜索请求或推荐请求输入单元22确定用户输入的请求是搜索请求还是推荐请求。
如果在步骤S82中确定用户输入的请求是搜索请求,则处理进行至步骤S83。然后,搜索请求或推荐请求输入单元22将搜索请求随用户输入的搜索条件一起输出至搜索单元23,然后处理结束。
另一方面,如果在步骤S82中确定用户输入的请求是推荐请求,则处理进行至步骤S84。然后,搜索请求或推荐请求输入单元22将推荐请求输出至推荐单元24,然后处理结束。
图18示出了根据在上述的图17的步骤S83处输出的搜索请求而执行的搜索处理的流程图。
当从搜索请求或推荐请求输入单元22将搜索请求以及用户输入的搜索条件提供给搜索单元23时,搜索单元23在步骤S101中从元数据标签估计单元16获取存储在音乐DB 11中且满足用户输入的搜索条件的每个乐曲的估计的元数据标签。例如,如果用户输入的搜索条件是“欢快的”乐曲,则从元数据标签估计单元16获取元数据“欢快”的估计的元数据标签。
在步骤S102中,搜索单元23从偏好标签估计单元21获取存储在音乐DB 11中的所有乐曲的估计的偏好标签。
在步骤S103中,搜索单元23将基于所获取的估计的元数据标签和估计的偏好标签的搜索结果输出至搜索结果或推荐结果呈现单元25。也就是说,搜索单元23以估计的元数据标签的降序或估计的偏好标签的降序而对音乐1至音乐n进行排序,并将排序后获得的音乐列表作为搜索结果而提供给搜索结果或推荐结果呈现单元25。
在步骤S104中,搜索结果或推荐结果呈现单元25将搜索单元23所通过的搜索结果呈现给用户。例如,搜索结果或推荐结果呈现单元25将作为搜索结果的音乐列表显示在屏幕上,或者以作为搜索结果的音乐列表的顺序来再现乐曲。在结束向用户呈现搜索结果时,搜索处理结束。
图19示出了根据在上述的图17的步骤S84处输出的推荐请求而执行的推荐处理的流程图。
当从搜索请求或推荐请求输入单元22将用户输入的推荐请求提供给推荐单元24时,推荐单元24在步骤S111中从偏好标签估计单元21获取存储在音乐DB 11中的所有乐曲的估计的偏好标签。
在步骤S112中,推荐单元24将基于所获取的估计的偏好标签的推荐结果输出至搜索结果或推荐结果呈现单元25。也就是说,推荐单元24将以估计的偏好标签的降序而排序的乐曲列表作为推荐结果而提供给搜索结果或推荐结果呈现单元25。
在步骤S113中,搜索结果或推荐结果呈现单元25将推荐单元24所提供的推荐结果呈现给用户。例如,搜索结果或推荐结果呈现单元25将作为推荐结果的音乐列表显示在屏幕上,或者以作为推荐结果的音乐列表的顺序来再现乐曲。在结束向用户呈现推荐结果时,推荐处理结束。
如上文所述,搜索单元23基于元数据标签估计单元16所估计的估计的元数据标签以及偏好标签估计单元21所估计的估计的偏好标签而输出搜索结果。另外,推荐单元24基于偏好标签估计单元21所估计的估计的偏好标签而输出推荐结果。
元数据标签估计单元16所估计的估计的元数据标签和偏好标签估计单元21所估计的估计的偏好标签包括正态随机数生成函数。因此,即使存储在元数据标签DB 13中的乐曲的元数据标签和存储在偏好标签DB 18中的乐曲的偏好标签没有变化,每次呈现给用户的搜索结果和推荐结果也是不同的。相应地,可以防止用户对所呈现的内容变得厌烦。
正态随机数生成函数的平均值和方差基于利用回归式对实际误差进行的建模,并具有有依据的随机性。也就是说,可以根据实际数据而为搜索结果或推荐结果提供适当的随机性。
当偏好估计式学习单元19导出偏好估计式时,偏好估计式学习单元19获取不包括根据正态随机数生成函数的估计误差的估计的元数据标签M1″至Mp ″的值。因此可以导出精确的偏好估计式。
图20是对信息处理设备1的估计功能进行总结的功能框图。
信息处理设备1的估计功能可被划分为目标变量估计块51A和高级目标变量估计块51B。
目标变量估计块51A和高级目标变量估计块51B具有相同的配置,该相同的配置包括:目标变量DB 71,估计式学习单元72,误差建模单元73,估计式DB 74,以及包括随机数生成单元75的估计单元76。也就是说,目标变量估计块51A包括目标变量DB 71A、估计式学习单元72A、误差建模单元73A、估计式DB 74A、随机数生成单元75A和估计单元76A。另一方面,高级目标变量估计块51B包括目标变量DB 71B、估计式学习单元72B、误差建模单元73B、估计式DB 74B、随机数生成单元75B和估计单元76B。
目标变量估计块51A估计预定的目标变量(第一目标变量)。高级目标变量估计块51B利用目标变量估计块51A所估计的目标变量来估计比第一目标变量更高级的目标变量(第二目标变量)。在上述的示例中,目标变量估计块51A所估计的目标变量是乐曲的元数据标签,而高级目标变量估计块51B所估计的目标变量是乐曲的偏好标签。
因此,目标变量DB 71A对应于元数据标签DB 13,估计式学习单元72A和误差建模单元73A对应于元数据估计式学习单元14。此外,估计式DB 74A对应于元数据估计式DB 15,随机数生成单元75A和估计单元76A对应于元数据标签估计单元16。
此外,目标变量DB 71B对应于偏好标签DB 18,并且估计式学习单元72B和误差建模单元73B对应于偏好估计式学习单元19。此外,估计式DB 74B对应于偏好估计式DB 20,并且随机数生成单元75B和估计单元76B对应于偏好标签估计单元21。
在估计用于搜索处理的元数据标签时,目标变量估计块51A的估计单元76A输出估计的元数据标签Mj′,该估计的元数据标签Mj′包括由随机数生成单元75A根据存储在估计式DB 74A中的正态分布的平均值μj和方差σj 2而生成的随机数。另一方面,不包括根据正态分布的平均值μj和方差σj 2的随机数的、估计的元数据标签Mj ″被作为由高级目标变量估计块51B用于导出估计式的估计的元数据标签而输出。
相应地,当高级目标变量估计块51B的估计式学习单元72B导出估计式时,可以计算更精确的线性组合系数b0和b1至bp。另一方面,在由高级目标变量估计块51B的估计单元76B估计用于搜索处理和推荐处理的偏好标签时,包括由随机数生成单元75B根据存储在估计式DB 74B中的正态分布的平均值μ和方差σ2而生成的随机数的、估计的偏好标签被输出。
如上文所述,信息处理设备1在呈现搜索结果和推荐结果时可以输出具有适当的随机性的估计结果,并且可以导出精确的估计式。
上述的一系列处理既可由硬件执行,也可由软件执行。为了使这一系列处理由软件来执行,形成该软件的程序被从程序记录介质安装在例如通过在其上安装各种程序而可以执行各种功能的、并入专用硬件中的计算机或通用个人计算机上。
图21是示出了基于程序来执行上述的一系列处理的计算机的硬件的配置示例的框图。
在计算机中,CPU(中央处理单元)101、ROM(只读存储器)102、RAM(随机存取存储器)103通过总线104而相互连接。
总线104还连接到输入输出接口105。输入输出接口105连接到:由键盘、鼠标器、麦克风等形成的输入单元106,由显示器、扬声器等形成的输出单元107,由硬盘、非易失性存储器等形成的存储单元108,由网络接口等形成的通信单元109,以及用于驱动诸如磁盘、光盘、磁光盘和半导体存储器之类的可拆卸介质111的驱动器110。
例如,元数据标签输入单元12、偏好标签输入单元17以及搜索请求或推荐请求输入单元22对应于输入单元106和输出单元107。此外,音乐DB 11、元数据标签DB 13、元数据估计式DB 15、偏好标签DB 18和偏好估计式DB 20对应于RAM 103或存储单元108。搜索结果或推荐结果呈现单元25对应于输出单元107。此外,元数据估计式学习单元14、元数据标签估计单元16、偏好估计式学习单元19、偏好标签估计单元21、搜索单元23和推荐单元24对应于CPU 101和RAM 103。
在如上文所述地配置的计算机中,CPU 101将例如存储在存储单元108中的程序经由输入输出接口105和总线104而加载到RAM 103中,并执行该程序。由此执行上述的一系列处理。
由计算机(CPU 101)执行的程序被提供为被记录在可拆卸介质111上,该可拆卸介质111是诸如磁盘(包括软盘)、光盘(例如CD-ROM、或压缩盘只读存储器和DVD、或数字多功能盘)、磁光盘和半导体存储器之类的封装介质。替代性地,该程序是经由诸如局域网、因特网和数字卫星广播之类的有线传输介质或无线传输介质而提供的。
由计算机执行的程序可以是按照本说明书中描述的顺序而以时间顺序执行的程序,也可以是并行地或在必要的时刻(例如在调用程序时)执行的程序。
在本说明书中,在各个流程图中描述的步骤不仅包括按照描述的顺序而以时间顺序执行的处理,而且包括不一定以时间顺序执行的、而是并行地或个别地执行的处理。
图13至19中的相应的处理可以被作为根据由用户输入的音乐搜索或音乐推荐请求的一系列处理而执行,或者可以在预定的时刻(例如在更新包括音乐DB 11、元数据标签DB 13和偏好标签DB 18的DB中的数据时,以及在经过预定时间之后)被独立地执行。也就是说,执行各个处理的时刻并不被特别地限定于预定的时刻。
本发明的实施例不限于上述实施例。因此,在不背离本发明的主旨的范围之内,可以以各种方式对本发明进行变型。
本发明包含与于2008年7月8日在日本专利局递交的日本在先专利申请JP 2008-177847中公开的主题相关的主题,该日本在先专利申请的全部内容通过引用包含于此。
本领域的技术人员应当理解,可以取决于设计需求和其它因素而进行各种变型、组合、子组合和替换,只要所述变型、组合、子组合和替换在所附权利要求或其等效内容的范围之内即可。

Claims (8)

1.一种信息处理设备,包括:
第一学习装置,用于学习第一估计式,所述第一估计式用于基于内容的特征量来估计内容的第一目标变量;
第一误差建模装置,用于确定在基于所述第一学习装置所学习的所述第一估计式来估计所述第一目标变量时所生成的误差的第一模型;
第一误差生成装置,用于利用随机数来生成根据所述第一误差建模装置所确定的所述第一模型的误差;以及
第一估计装置,用于利用所述第一学习装置所学习的第一估计式和所述第一误差生成装置所生成的随机数来估计所述内容的所述第一目标变量。
2.根据权利要求1所述的信息处理设备,
其中所述第一模型是通过利用正态分布对在估计所述第一目标变量时生成的误差的分布进行建模而获得的。
3.根据权利要求2所述的信息处理设备,还包括:
搜索装置,用于利用所述第一估计装置所估计的内容的第一目标变量来搜索内容。
4.根据权利要求3所述的信息处理设备,
其中,每当所述搜索装置搜索内容时,所述第一估计装置就估计所述内容的第一目标变量。
5.根据权利要求2所述的信息处理设备,还包括:
第二学习装置,用于利用通过仅使用所述第一学习装置所学习的第一估计式而获得的第一目标变量来学习用于估计第二目标变量的第二估计式;
第二误差建模装置,用于确定在基于所述第二学习装置所学习的所述第二估计式来估计所述第二目标变量时所生成的误差的第二模型;
第二误差生成装置,用于利用随机数来生成根据所述第二误差建模装置所确定的所述第二模型的误差;以及
第二估计装置,用于利用所述第二学习装置所学习的第二估计式和所述第二误差生成装置所生成的随机数来估计所述内容的第二目标变量。
6.根据权利要求5所述的信息处理设备,还包括:
推荐装置,用于利用所述第二估计装置所估计的所述内容的第二目标变量来推荐内容。
7.一种信息处理方法,包括以下步骤:
学习第一估计式,所述第一估计式用于基于内容的特征量来估计所述内容的第一目标变量;
确定在基于所学习的所述第一估计式来估计所述第一目标变量时所生成的误差的第一模型;
利用随机数来生成根据所确定的所述第一模型的误差;以及
利用所学习的第一估计式和所生成的随机数来估计所述内容的第一目标变量。
8.一种程序,所述程序使得计算机执行包括以下步骤的处理:
学习第一估计式,所述第一估计式用于基于内容的特征量来估计所述内容的第一目标变量;
确定在基于所学习的所述第一估计式来估计所述第一目标变量时所生成的误差的第一模型;
利用随机数来生成根据所确定的所述第一模型的误差;以及
利用所学习的第一估计式和所生成的随机数来估计所述内容的第一目标变量。
CN200910158842A 2008-07-08 2009-07-08 信息处理设备、信息处理方法和程序 Pending CN101625698A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008177847A JP4737564B2 (ja) 2008-07-08 2008-07-08 情報処理装置、情報処理方法、およびプログラム
JP2008177847 2008-07-08

Publications (1)

Publication Number Publication Date
CN101625698A true CN101625698A (zh) 2010-01-13

Family

ID=41506027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910158842A Pending CN101625698A (zh) 2008-07-08 2009-07-08 信息处理设备、信息处理方法和程序

Country Status (3)

Country Link
US (1) US8407161B2 (zh)
JP (1) JP4737564B2 (zh)
CN (1) CN101625698A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177177A (zh) * 2011-09-08 2013-06-26 索尼公司 信息处理设备、估计器生成方法和程序
CN106156270A (zh) * 2016-06-17 2016-11-23 北京小米移动软件有限公司 多媒体数据推送方法及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306977B1 (en) * 2011-10-31 2012-11-06 Google Inc. Method and system for tagging of content
US10480602B2 (en) * 2013-03-11 2019-11-19 Haldex Brake Products Ab Disc brake, brake actuation mechanism for such a disc brake and method for brake adjustment
US10116563B1 (en) * 2014-10-30 2018-10-30 Pearson Education, Inc. System and method for automatically updating data packet metadata
US10110486B1 (en) 2014-10-30 2018-10-23 Pearson Education, Inc. Automatic determination of initial content difficulty
US10735402B1 (en) 2014-10-30 2020-08-04 Pearson Education, Inc. Systems and method for automated data packet selection and delivery
US10333857B1 (en) 2014-10-30 2019-06-25 Pearson Education, Inc. Systems and methods for data packet metadata stabilization

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4360980B2 (ja) * 2004-06-14 2009-11-11 中国電力株式会社 気象に関わるリスク交換における受け払い条件設定システム及び方法
JP2006243916A (ja) * 2005-03-01 2006-09-14 Nec Corp 情報提供システムおよび方法
JP4526080B2 (ja) * 2005-05-20 2010-08-18 日本電信電話株式会社 方法説明検索装置およびプログラム
JP2007122186A (ja) * 2005-10-25 2007-05-17 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US8146120B2 (en) * 2007-10-08 2012-03-27 Jaman.Com, Inc. Multi-criteria rating and searching system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177177A (zh) * 2011-09-08 2013-06-26 索尼公司 信息处理设备、估计器生成方法和程序
CN103177177B (zh) * 2011-09-08 2017-09-12 索尼公司 信息处理设备和估计器生成方法
CN106156270A (zh) * 2016-06-17 2016-11-23 北京小米移动软件有限公司 多媒体数据推送方法及装置

Also Published As

Publication number Publication date
JP4737564B2 (ja) 2011-08-03
US20100010942A1 (en) 2010-01-14
JP2010020388A (ja) 2010-01-28
US8407161B2 (en) 2013-03-26

Similar Documents

Publication Publication Date Title
Chaney et al. How algorithmic confounding in recommendation systems increases homogeneity and decreases utility
CN101625698A (zh) 信息处理设备、信息处理方法和程序
US20040054572A1 (en) Collaborative filtering
CN101124575A (zh) 用于生成推荐的方法和系统
US20110295762A1 (en) Predictive performance of collaborative filtering model
Chalyi et al. Method of constructing explanations for recommender systems based on the temporal dynamics of user preferences
KR101639656B1 (ko) 광고 제공 방법 및 서버 장치
CN117892011B (zh) 基于大数据的智能信息推送方法及系统
Anagnostopoulos et al. The importance of being expert: Efficient max-finding in crowdsourcing
CN111259267B (zh) 一种基于稀疏性感知的分布式混合协同智能推荐方法
CN115187345A (zh) 智能家居建材推荐方法、装置、设备及存储介质
CN111127074A (zh) 一种数据推荐方法
Kompan et al. Personalized recommendation for individual users based on the group recommendation principles
US20140039983A1 (en) Location evaluation
CN114817741A (zh) 一种理财产品精准推荐方法及装置
Najjar et al. Evaluating group recommendation strategies in memory-based collaborative filtering
TW201248434A (en) Method and system for personalizedly sorting searched information
CN112732891A (zh) 办公课程推荐方法、装置、电子设备及介质
Zhu Group assessment of web source/information quality based on WebQM and fuzzy logic
CN102799593B (zh) 个人化搜寻排序方法以及系统
Kalamati et al. Application of Beta Random Variables to Category-based Collaborative Filtering
Hidalgo et al. Using Collaborative Filtering Algorithm to Estimate the Predictive Power of a Functional Requirement
Orzechowski et al. Profiled Search Methods for e-Learning Systems.
Klump Developing a generator for synthetic data about the customer support domain and analysing a Graph Learning based Recommender System during different scenarios
Sun Constructing learning models from data: The dynamic catalog mailing problem

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100113