CN101996232A - 信息处理装置、用于处理信息的方法及程序 - Google Patents

信息处理装置、用于处理信息的方法及程序 Download PDF

Info

Publication number
CN101996232A
CN101996232A CN2010102503609A CN201010250360A CN101996232A CN 101996232 A CN101996232 A CN 101996232A CN 2010102503609 A CN2010102503609 A CN 2010102503609A CN 201010250360 A CN201010250360 A CN 201010250360A CN 101996232 A CN101996232 A CN 101996232A
Authority
CN
China
Prior art keywords
evaluation
pascal
concrete
estimate
eigenwert
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102503609A
Other languages
English (en)
Other versions
CN101996232B (zh
Inventor
馆野启
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101996232A publication Critical patent/CN101996232A/zh
Application granted granted Critical
Publication of CN101996232B publication Critical patent/CN101996232B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

提供了一种信息处理装置、用于处理信息的方法及程序,该信息处理装置包括具体评价信息获取单元,获取对预定内容项目的评价作为具体评价,所述评价是由用户根据顺序量表输入的;语言评价信息提取单元,根据关于评价句子的语言信息来获取语言评价,其中用语言表达对预定内容项目的评价,所述评价句子是由用户输入的;以及推荐单元,根据具体评价是正面评价还是负面评价以及语言评价是正面评价还是负面评价来推荐匹配于用户偏好的内容项目。

Description

信息处理装置、用于处理信息的方法及程序
技术领域
本发明涉及信息处理装置、用于处理信息的方法及程序。更具体地,本发明涉及使得可以推荐以更高的准确度符合用户偏好的内容项目的信息处理装置、用于处理信息的方法及程序。
背景技术
用于评价内容项目的一般方法包括使用两级顺序量表(诸如“喜欢”和“不喜欢”)的方法以及使用五级顺序量表(ordinal scale)(诸如五星系统)的方法。
然而,这些评价方法没有使得可以识别用户对内容项目的哪个方面做出正面评价。而且,该评价方法没有使得可以识别对内容项目的方面做出的评价。该评价的示例是“我喜欢内容项目的这个方面,但是我不喜欢内容项目的那个方面”。
另一方面,最近设计了用于分析以自然语言写下的句子的内容的技术(例如,参见N.Kobayashi,“Opinion Mining from Web Documents:Extraction and Structurization(根据网页文献的意见挖掘:提取和结构化)”日本人工智能协会会刊,2007年,22卷,No.2,227-238页)。因此,如果使用该技术,可根据用户输入的句子来识别内容项目的评价。
例如,可根据用户输入的句子“我喜欢曲调A的旋律”识别出用户对内容项目“曲调A”的方面“旋律”做出较高评价“喜欢”。
发明内容
然而,没有充分地发展该技术。而且,以自然语言写下的句子可能具有语言特有的模糊性并且语言特有的某些信息可能从这些句子中被忽略。因此,该技术可能常常具有关于准确性的问题。因此,不可能通过仅使用由该技术识别为用户偏好的评价来推荐以较高准确性匹配于用户偏好的内容项目。
期望可以推荐以更高的准确性匹配于用户偏好的内容项目。
根据本发明实施例的信息处理装置是以下信息处理装置,该信息处理装置包括:具体评价信息获取装置,用于获取对预定内容项目的评价作为具体评价,所述评价是由用户根据顺序量表输入的;语言评价信息提取装置,用于根据关于评价句子的语言信息来获取语言评价,其中用语言表达对所述预定内容项目的评价,所述评价句子是由用户输入的;以及推荐装置,用于根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来推荐匹配于用户偏好的内容项目。
根据本发明实施例的用于处理信息的方法和程序对应于根据本发明实施例的信息处理装置。
根据本发明的实施例,获取对预定内容项目的评价作为具体评价,所述评价是由用户根据顺序量表输入的;根据关于评价句子的语言信息获取语言评价,其中用语言表达对所述预定内容项目的评价,所述评价句子是由用户输入的;以及根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来推荐匹配于用户偏好的内容项目。
如上所述,根据本发明实施例,可以推荐以更高准确性匹配于用户偏好的内容项目。
附图说明
图1是根据本发明第一实施例的信息处理装置的示例结构的框图;
图2是示出内容项目的特征值和内容项目的最终评价值的示例的图;
图3是示出由图1所示的信息处理装置执行的学习处理的流程图;
图4是示出由图1所示的信息处理装置执行的推荐内容呈现处理的流程图;
图5是根据本发明第二实施例的信息处理装置的示例结构的框图;
图6是属性和特征值对应关系信息的示例的图;
图7是输入屏幕的示例的图;
图8是示出由图5所示的信息处理装置执行的相似内容呈现处理的流程图;
图9是根据本发明第三实施例的信息处理装置的示例结构的框图;
图10是示出由图9所示的信息处理装置执行的学习处理的流程图;以及
图11是计算机的硬件结构的示例的框图。
具体实施方式
第一实施例
图1是根据本发明第一实施例的信息处理装置的示例结构的框图。
图1所示的信息处理装置10包括具体评价信息获取单元11、评价句子获取单元12、语言评价信息提取单元13、具体评价和语言评价比较单元14、主评价信息确定单元15、评价校正单元16、偏好学习单元17、内容特征值存储单元18以及推荐和呈现单元19。
具体评价信息获取单元11接收对内容项目的评价,该评价是根据五级顺序量表(诸如五星系统)由用户输入的。更具体地,具体评价信息获取单元11接收由用户输入的评价值,这是表示“一星”评价的评价值“1”,表示“二星”评价的评价值“2”,表示“三星”评价的评价值“3”,表示“四星”评价的评价值“4”,或表示“五星”评价的评价值“5”。在此,越高数目的星表示越高的评价。
该评价值是用户通过操作键盘或鼠标(二者均未示出)输入的。评价值可以被规范化以使得评价值的平均值是0并且评价值的方差是1。
而且,具体评价信息获取单元11将输入和接收的评价值视为具体评价的评价值。具体评价信息获取单元11根据具体评价的评价值来确定由用户输入的具体评价是正面评价还是负面评价。
例如,当评价值大于三时,具体评价信息获取单元11确定具体评价是正面评价。当评价值小于或等于三时,具体评价信息获取单元11确定具体评价是负面评价。具体评价信息获取单元11将确定结果作为具体评价提供给具体评价和语言评价比较单元14。
评价句子获取单元12获取关于评价句子的语言信息,其中对内容项目的评价是以语言表达的,用户使用麦克风或键盘(二者均未示出)输入评价句子。更具体地,评价句子获取单元12使用预定的语音识别技术通过转换从麦克风获取的评价句子的语音来获取语言信息。而且,评价句子获取单元12获取关于在由用户管理的博客、由用户指定的个人管理的博客等中描述的评价句子的语言信息。评价句子获取单元12将与获取的评价句子有关的语言信息提供给语言评价信息提取单元13。
语言评价信息提取单元13从与评价句子获取单元12所提供的评价句子有关的语言信息提取作为关于评价的信息的评价信息。例如,语言评价信息提取单元13从与评价句子“我非常喜欢曲调A的旋律”有关的语言信息提取内容项目“曲调A”的名称和评价“喜欢”作为评价信息。
而且,语言评价信息提取单元13根据提取的评价信息来确定评价句子的评价是正面还是负面评价,并将确定结果作为语言评价提供给具体评价和语言评价比较单元14。
在此,语言评价信息提取单元13在评价句子涉及当前正播放或内容正被查看的内容项目(此后称为主题内容项目)的前提下执行处理。注意当可通过评价句子指定要被评价的内容项目时,可以检查内容项目是否匹配于主题内容项目。在这种情况下,当通过评价句子指定的内容项目不同于主题内容项目时,阻止执行下游处理。
而且,当从评价句子获取单元12提供的评价句子不包括表示正面评价的任何单词或表示负面评价的任何单词时,语言评价信息提取单元13确定语言评价既不是正面也不是负面评价。语言评价信息提取单元13什么都不向具体评价和语言评价比较单元14提供,并且不进行下游处理。
具体评价和语言评价比较单元14识别从具体评价信息获取单元11提供的具体评价和从语言评价信息提取单元13提供的语言评价之间的关系。例如,当具体评价和语言评价都是正面评价时,具体评价和语言评价比较单元14识别出具体评价匹配于语言评价作为具体评价和语言评价之间的关系。另一方面,当具体评价是负面评价而语言评价是正面评价或当具体评价是正面评价而语言评价是负面评价时,具体评价和语言评价比较单元14识别出具体评价不匹配于语言评价作为具体评价和语言评价之间的关系。具体评价和语言评价比较单元14将具体评价和语言评价之间的关系提供给评价校正单元16。
主评价信息确定单元15确定具体评价和语言评价中的一个是假设反应了用户的真实评价的主评价。在第一实施例中,具体评价被预定为是主评价。主评价信息确定单元15将具体评价指定为评价校正单元16中的主评价。
评价校正单元16根据从具体评价和语言评价比较单元14提供的具体评价和语言评价之间的关系,校正从具体评价信息获取单元11提供的具体评价的评价值。评价校正单元16将具体评价的校正的评价值作为最终评价值提供给偏好学习单元17。
偏好学习单元17使用从评价校正单元16提供的最终评价值和存储在内容特征值存储单元18中的主题内容项目的特征值进行偏好学习。
作为偏好学习的第一方法,存在如下方法:通过进行线性回归来学习表示特征值和最终评价值之间的关系的关系表达作为偏好信息,在线性回归中内容项目的特征值被视为独立变量且最终评价值被视为从属变量。在此,当内容项目是曲调时,内容项目的特征值包括音乐或声音特征,或属性值诸如风格、关键字和心情。
而且,作为偏好学习的第二方法,存在如下方法:学习与表示正面评价的最终评价值相对应的内容组的平均向量(以下称平均向量为偏好向量)作为偏好信息,在第二方法中每个内容项目的特征值表示为向量。在日本待审专利申请公开No.2001-160955中具体描述了该第二方法。
在此,当偏好学习单元17使用第二方法进行偏好学习时,偏好学习单元17可与表示正面评价的最终评价值相似地,产生与表示负面评价的最终评价值相对应的内容组的平均向量(此后称平均向量为负面偏好向量)作为负面偏好信息。
偏好学习单元17将所产生的偏好信息提供给推荐和呈现单元19。内容特征值存储单元18存储内容项目的特征值。
当推荐和呈现单元19从偏好学习单元17接收关系表达作为偏好信息时,推荐和呈现单元19根据关系表达和存储在内容特征值存储单元18中的内容项目的特征值,对用户还没有评价的每个内容项目(以下称为未评价的内容项目)计算未评价的内容项目的预计的评价值。而且,当推荐和呈现单元19从偏好学习单元17接收偏好向量作为偏好信息时,推荐和呈现单元19计算偏好向量和表示未评价的内容项目的特征值的向量之间的相似程度或距离。
然后,推荐和呈现单元19针对每个未评价的内容项目将未评价的内容项目的名称等视为关于内容项目的信息项目(以下称为“关于内容的信息项目”),且使显示单元(未示出)按照预计的评价值或相似程度的降序或距离的升序来显示与未评价的内容项目有关的“关于内容的信息项目”作为与推荐的内容项目有关的“关于内容的信息项目”。也就是说,推荐和呈现单元19推荐匹配于用户偏好的内容项目并且使得显示与内容项目有关的“关于内容的信息项目”。
在此,在信息处理装置10中,主评价不一定被预先确定,但可根据由偏好学习单元17进行的偏好学习导致的预计误差的幅度来确定。
在这种情况下,具体评价信息获取单元11还将被允许输入的评价值提供给主评价信息确定单元15。而且,当评价句子的评价是正面评价时,语言评价信息提取单元13将四和五之间或等于四或五的评价值提供给主评价信息确定单元15。与之对照,当评价句子的评价是负面评价时,语言评价信息提取单元13将一和三之间或等于一或三的评价值提供给主评价信息确定单元15。
在此,当语言评价信息提取单元13可以从评价句子获取单元12提供的评价句子中识别语言评价的等级(下文称为语言评价水平)时,语言评价信息提取单元13保存语言评价水平并根据语言评价水平将评价值设为上述范围内的值。例如,语言评价信息提取单元13从评价句子“我非常喜欢曲调A的旋律”中的“非常”识别出评价句子的语言评价水平为高。例如,在语言评价水平是0-1范围内的值的情况下,语言评价信息提取单元13将语言评价值设为0.8且将评价值设为4.8(=4+0.8×(5-4))。
而且,偏好学习单元17不仅使用具体评价进行偏好学习,还使用语言评价进行偏好学习,并且计算具体评价的评价值的预计值以及与主题内容项目有关的语言评价的评价值的预计值。
主评价信息确定单元15根据从偏好学习单元17提供的主题内容项目的具体评价的评价值的预计值和从具体评价信息获取单元11提供的评价值来计算预计误差。而且,主评价信息确定单元15根据从偏好学习单元17提供的主题内容项目的语言评价的评价值的预计值和从语言评价信息提取单元13提供的评价值来计算预计误差。然后,主评价信息确定单元15确定主评价是具体评价和语言评价中具有较小预计误差的一个。
由具体评价信息获取单元11接收的顺序量表可具有任何数目的等级。例如,当顺序量表具有两个等级诸如“喜欢”和“不喜欢”时,具体评价信息获取单元11接收用户输入的表示评价“喜欢”的评价值“1”,或用户输入的表示评价“不喜欢”的评价值“-1”。当评价值是“1”时,具体评价信息获取单元11确定具体评价是正面评价。当评价值是“-1”时,具体评价信息获取单元11确定具体评价是负面评价。
在此,以下将描述偏好学习单元17使用第二方法进行偏好学习并且推荐和呈现单元19根据偏好信息来计算与未评价的内容项目有关的相似程度的情况。
图2是示出内容项目的特征值和内容项目的最终评价值的示例的图。
如图2所示,当内容项目是曲调时,内容特征值存储单元18存储例如速度、欢快性和声密度作为内容项目的特征值。
在图2所示的示例中,曲调A的速度是35,曲调A的欢快性是50,曲调A的声密度是84。曲调B的速度是70,曲调B的欢快性是58,曲调B的声密度是37。曲调C的速度是88,曲调C的欢快性是80,曲调C的声密度是20。曲调D的速度是50,曲调D的欢快性是60,曲调D的声密度是65。
曲调E的速度是60,曲调E的欢快性是75,曲调E的声密度是55。曲调F的速度是66,曲调F的欢快性是55,曲调F的声密度是40。曲调G的速度是38,曲调G的欢快性是20,曲调G的声密度是63。曲调H的速度是25,曲调H的欢快性是37,曲调H的声密度是42。曲调I的速度是73,曲调I的欢快性是59,曲调I的声密度是76。
用户已评价了曲调A、B、C、D和E。曲调A的最终评价值是2.0,曲调B的最终评价值是3.5,曲调C的最终评价值是5.5,曲调D的最终评价值是1.5,曲调E的最终评价值是4.0。
在这种情况下,例如,当偏好学习单元17确定大于三的最终评价值是正面的最终评价值时,曲调B、C和E的平均向量(72.7,71,37.3)是偏好向量。
推荐和呈现单元19计算表示未评价的曲调F的特征值的向量和偏好向量之间的欧几里得距离的倒数0.057;表示未评价的曲调G的特征值的向量和偏好向量之间的欧几里得距离的倒数0.014;表示未评价的曲调H的特征值的向量和偏好向量之间的欧几里得距离的倒数0.017;以及表示未评价的曲调I的特征值的向量和偏好向量之间的欧几里得距离的倒数0.025。推荐和呈现单元19将关于曲调F的相似程度设为0.057,将关于曲调G的相似程度设为0.014,将关于曲调H的相似程度设为0.017,且将关于曲调I的相似程度设为0.025。结果,以相似程度的降序,即以曲调F、曲调I、曲调H和曲调G的顺序向用户呈现关于曲调F至I的“关于内容的信息项目”。
在此,当偏好学习单元17产生负面偏好信息时,可能不允许推荐和呈现单元19呈现关于未评价的曲调F至I中的到负面偏好信息的欧几里得距离较短的曲调的“关于内容的信息项目”。
图3是示出图1所示的信息处理装置10进行的学习处理的流程图。在例如用户输入五级顺序量表中的一级以及关于主题内容项目的评价句子时开始该学习处理。
在步骤S11中,具体评价信息获取单元11接收评价,该评价是由用户输入的五级顺序量表中的一级。在步骤S12中,具体评价信息获取单元11将步骤S11接收的评价值视为具体评价的评价值,并根据具体评价的评价值来确定用户输入的具体评价是正面评价还是负面评价。然后,具体评价信息获取单元11将确定结果作为具体评价提供给具体评价和语言评价比较单元14。
在步骤S13中,评价句子获取单元12获取关于由用户输入的评价句子的语言信息。在步骤S14中,语言评价信息提取单元13从由评价句子获取单元12提供的关于评价句子的语言信息提取评价信息。
在步骤S15中,语言评价信息提取单元13根据在步骤S14中提取的评价信息来确定评价句子的评价是正面评价还是负面评价。
如果语言评价信息提取单元13在步骤S15中确定评价句子的评价既不是正面评价也不是负面评价,则处理结束。
与之对照,如果语言评价信息提取单元13在步骤S15中确定评价句子的评价是正面评价或负面评价,则语言评价信息提取单元13将指示评价句子的评价是正面或负面评价的确定结果作为语言评价提供给具体评价和语言评价比较单元14。
在步骤S16中,具体评价和语言评价比较单元14识别从具体评价信息获取单元11提供的具体评价和从语言评价信息提取单元13提供的语言评价之间的关系。具体评价和语言评价比较单元14将具体评价和语言评价之间的关系提供给评价校正单元16。
在步骤S17中,主评价信息确定单元15确定主评价将是具体评价,并将具体评价指定为评价校正单元16中的主评价。在步骤S18中,评价校正单元16根据从具体评价和语言评价比较单元14提供的具体评价和语言评价之间的关系来确定具体评价是否匹配于语言评价。
在步骤S18中,如果评价校正单元16确定出具体评价匹配于语言评价,即,具体评价和语言评价是正面评价或负面评价,则过程进行到步骤S19。
在步骤S19中,评价校正单元16校正从具体评价信息获取单元11提供的具体评价的评价值,使得作为主评价的具体评价被赋予更大的权重。
更具体地,例如,当具体评价和语言评价都是正面评价时,假定很有可能用户对主题内容项目给予正面评价。结果,评价校正单元16通过对例如从具体评价信息获取单元11提供的具体评价的评价值(该评价值为4)加0.5将评价值改为4.5。
在此,评价校正单元16可将具体评价的评价值改变成其常数倍数。而且,当语言评价信息提取单元13识别语言评价水平时,评价校正单元16可根据与语言评价水平相对应的程度来设置校正幅度。在这种情况下,例如,当评价句子包括“非常”时,评价校正单元16将校正幅度设为0.8,这大于评价句子不包括“非常”时使用的添加值0.5。
然后,评价校正单元16将经校正的评价值作为最终评价值提供给偏好学习单元17。然后,过程进行到步骤S21。
与之对照,如果评价校正单元16在步骤S18中确定具体评价不匹配于语言评价,也就是说,具体评价和语言评价中的一个是正面评价且另一个是负面评价,则过程进行到步骤S20。
在步骤S20中,评价校正单元16校正具体评价使得作为主评价的具体评价被赋予较小的权重,也就是说使具体评价更接近中间评价。
更具体地,例如,当具体评价是负面评价且语言评价是正面评价时,假定尽管在具体评价方面用户给予主题内容项目相当低的评价,但存在用户给予较高评价的方面。因此,例如,评价校正单元16以0.5将从具体评价信息获取单元11提供的具体评价的评价值(该特定值为2)改变为2.5,该值更靠近评价值范围的中间值3。
在此,评价校正单元16可通过具体评价的评价值和评价值范围的中间值之差的常数倍数来将具体评价的评价值改为更靠近中间值的值。在这种情况下,校正后具体评价的评价值是通过将中间值加到以下值的常数倍数而获得的值:该值是通过从校正前具体评价的评价值中减去中间值获得的。例如,当校正前具体评价的评价值是2且常数是0.5时,校正后具体评价的评价值是2.5(=3+(2-3)×0.5)。此处使用的常数可以是预设的,或可根据与语言评价水平相对应的程度来设置。当根据语言评价水平来设置常数时,根据与语言评价水平相对应的程度来赋予具体评价较小的权重。
评价校正单元16将经校正的评价值作为最终评价值提供给偏好学习单元17。然后过程进行到步骤S21。
在步骤S21中,偏好学习单元17使用经评价的内容项目的最终评价值(包括从评价校正单元16提供的主题内容项目的最终评价值)和经评价的内容项目的特征值(包含存储在内容特征值存储单元18中的主题内容项目的经评价的内容项目的特征值)进行偏好学习。然后,过程结束。
图4是示出由信息处理装置10执行的推荐内容呈现处理的流程图。当例如用户命令进行推荐的内容项目的呈现时,开始该推荐内容呈现处理。
在步骤S31中,对于存储在内容特征值存储单元18中的每个未评价的内容项目,推荐和呈现单元19计算由偏好学习单元17产生的偏好向量和表示未评价的内容项目的特征值的向量之间的相似程度。
在步骤S32中,推荐和呈现单元19使显示单元(未示出)以相似程度的降序显示与未评价的内容项目有关的“关于内容的信息项目”作为与推荐的内容项目有关的“关于内容的信息项目”。然后,过程结束。
如上所述,信息处理装置10根据具体评价和语言评价之间的关系来推荐和呈现内容项目。因此,与根据具体评价和语言评价中的一个来推荐内容项目的情况相比,信息处理装置10能够以更高的准确性推荐和呈现匹配于用户偏好的内容项目。
第二实施例
图5是根据本发明第二实施例的信息处理装置的示例结构的框图。
在图5所示的结构中,通过相同的附图标记表示与图1所示的结构中表示的组件相同的组件。在需要时省略多余的说明。
图5所示的信息处理装置30的结构和图1所示的结构的不同之处在于:替代语言评价信息提取单元13、具体评价和语言评价比较单元14、偏好学习单元17以及推荐和呈现单元19,信息处理装置30包括语言评价信息提取单元31、具体评价和语言评价比较单元32、偏好学习单元36以及推荐和呈现单元35。图5所示的信息处理装置30的结构和图1所示的结构的不同之处还在于:信息处理装置30不包括主评价信息确定单元15或评价校正单元16,但包括属性和特征值对应关系存储单元33和语言评价特征值确定单元34。
信息处理装置30根据具体评价、语言评价以及与语言评价的评价属性相对应的内容项目的特征值从主题内容项目的特征值中确定用户偏好的特征值。然后,信息处理装置30向用户呈现与内容项目(该内容项目的特征值与确定的特征值相似)有关的“关于内容的信息项目”,作为与相似内容项目有关的“关于内容的信息项目”。
在此,评价属性表示内容项目的方面,并且是适于表示内容项目的特征值的词。例如,当主题内容项目是曲调时,评价属性是旋律、声质量、节奏等。当主题内容项目是电影时,评价属性是故事、环境、背景音乐(BGM)等。
信息处理装置30的语言评价信息提取单元31从与评价句子获取单元12所提供的评价句子有关的语言信息中提取包括评价属性的评价信息,并保持评价信息。例如,语言评价信息提取单元31从与评价句子“我非常喜欢曲调A的旋律”有关的语言信息中提取内容项目名称“曲调A”、评价“喜欢”和评价属性“旋律”,作为评价信息。
在此,当没有从评价句子中提取任何评价属性时,例如,当评价句子是“我喜欢曲调A”并且不包括评价属性时,语言评价信息提取单元31使显示单元(未示出)显示允许用户输入特征值的输入屏幕(将参考图7描述)。然后,语言评价信息提取单元31根据用户通过输入屏幕输入的信息获取特征值,并保持特征值。该特征值通过语言评价特征值确定单元34作为语言特征值被提供给推荐和呈现单元35。
而且,与图1所示的语言评价信息提取单元13相似,语言评价信息提取单元31根据所提取的评价信息来确定评价句子的评价是正面评价还是负面评价。语言评价信息提取单元31将确定结果作为语言评价提供给具体评价和语言评价比较单元32。
而且,与语言评价信息提取单元13相似,当从评价句子获取单元12提供的评价句子不是正面评价也不是负面评价时,语言评价信息提取单元31什么都不提供给具体评价和语言评价比较单元32,且不进行下游处理。
与图1所示的具体评价和语言评价比较单元14相似,具体评价和语言评价比较单元32识别从具体评价信息获取单元11提供的具体评价和从语言评价信息提取单元31提供的语言评价之间的关系。具体评价和语言评价比较单元32将具体评价和语言评价之间的关系提供给偏好学习单元36。而且,具体评价和语言评价比较单元32将具体评价和语言评价提供给推荐和呈现单元35。
属性和特征值对应关系存储单元33存储下述的表作为与属性和特征值之间的对应关系有关的信息(以下称为属性和特征值对应关系信息):在该表中预定的评价属性与内容项目的特征值相关。
语言评价特征值确定单元34确定:语言评价特征值会是与在属性和特征值对应关系存储单元33中存储的属性和特征值对应关系信息中包括的评价属性中的一个评价属性(该评价属性是与语言评价信息提取单元31提取的评价属性相似的单词)相对应的特征值。在此,利用词库等进行关于相似度的确定。而且,语言评价特征值确定单元34将语言评价特征值提供给推荐和呈现单元35。
推荐和呈现单元35使显示单元(未示出)显示与相似内容项目或推荐内容项目有关的“关于内容的信息项目”。
更具体地,推荐和呈现单元35根据从具体评价和语言评价比较单元32提供的具体评价和语言评价以及从语言评价特征值确定单元34提供的语言评价特征值,确定一个或更多个特征值(以下称为主题特征值),所述特征值要被用来针对每个推荐候选内容项目来计算主题内容项目和推荐候选内容项目之间的相似程度或距离。推荐和呈现单元35根据主题内容项目的主题特征值以及存储在内容特征值存储单元18中的推荐候选内容项目的主题特征值,来计算主题内容项目和推荐候选内容项目之间的相似程度或距离。推荐和呈现单元35使显示单元(未示出)按照相似程度的降序或距离的升序来显示与推荐候选内容项目有关的“关于内容的信息项目”,作为与相似内容项目有关的“关于内容的信息项目”。也就是说,将匹配于用户偏好的内容项目作为相似内容项目推荐给用户。
在此,当推荐和呈现单元35使得显示与相似内容项目有关的“关于内容的信息项目”时,除了关于内容的信息项目之外,推荐和呈现单元35还使得显示除了主题特征值之外的特征值。在这种情况下,例如,当主题内容项目的名称是“曲调I”并且除了主题特征值之外的特征值是“声密度”时,显示诸如“在除了声密度之外的特征值方面与曲调I相似的内容项目是XX”的消息。在此,“XX”是相似内容项目的名称。
而且,与图1所示的推荐和呈现单元19相似,针对每个未评价的内容项目,推荐和呈现单元35计算从偏好学习单元36作为偏好信息提供的偏好向量和表示未评价的内容项目的特征值的向量之间的相似程度。然后,推荐和呈现单元35使显示单元(未示出)按照相似程度的降序来显示与未评价的内容项目有关的“关于内容的信息项目”,作为与推荐的内容项目有关的“关于内容的信息项目”。因此,与匹配于用户偏好的内容项目有关的“关于内容的信息项目”被作为与推荐的内容项目有关的“关于内容的信息项目”而呈现给用户。
偏好学习单元36执行与由图1所示的主评价信息确定单元15、评价校正单元16和偏好学习单元17所执行的处理相似的处理。
在此,信息处理装置30不一定包括偏好学习单元36。在这种情况下,推荐和呈现单元35仅具有用于显示与相似内容项目有关的“关于内容的信息项目”的功能。
以下将描述推荐和呈现单元35计算相似程度的情况。
图6是属性和特征值对应关系信息的示例的图。
如图6所示,属性和特征值对应关系信息具有表格式,其中评价属性与特征值相关。
在图6所示的属性和特征值对应关系信息中,评价属性(诸如“拍子”、“快速”和“速度”)与特征值“速度”相关。而且,评价属性(诸如“欢快”和“喜庆”)与特征值“欢快性”相关。此外,评价属性(诸如“非常深沉”)与特征值“声密度”相关。
在这种情况下,例如,当语言评价信息提取单元31提取评价属性“拍子”时,语言评价特征值确定单元34确定语言评价特征值将是特征值“速度”,在属性和特征值对应关系信息中评价属性“拍子”与特征值“速度”相关。
图7是输入屏幕的示例的图。
在图7所示的输入屏幕上,显示消息“你喜欢曲调A的哪方面?”,特征值列表以及确认按钮。而且,对于列表中的每个特征值,在特征值的左边显示复选框。当选择了特征值时,在对应的复选框中置入勾号。
作为显示在输入屏幕上的特征值列表,从登记在属性和特征值对应关系存储单元33中的特征值中显示与主题内容项目的类型(例如曲调、视频等)相对应的特征值。而且,还显示代表所有显示的特征值的“所有”和代表没有登记在属性和特征值对应关系存储单元33中的特征值的“其他”。
在图7所示的示例中,图6所示的属性和特征值对应关系信息被存储在属性和特征值对应关系存储单元33中。在特征值列表中,显示了特征值“速度”、“欢快性”和“声密度”以及“所有”和“其他”。
当显示图7所示的输入屏幕时,用户操作键盘或鼠标(未示出)并在与特征值相对应的复选框中置入核对符号,该特征值作为曲调A的显示在特征值列表中的特征值“速度”、“欢快性”、“声密度”、“所有”和“其他”中用户喜欢的一个方面。在此,曲调A是主题内容项目。然后,用户操作“确认”按钮。结果,语言评价信息提取单元31获取特征值。在此,用户可在多个复选框中置入核对符号。
而且,当没有从评价句子提取出任何评价属性时,可代替图7所示的输入屏幕,显示允许用户任意输入评价属性的文本区域。在这种情况下,语言评价信息提取单元31获取用户在文本区域中输入的评价属性并将评价属性提供给语言评价特征值确定单元34。语言评价特征值确定单元34以与语言评价特征值确定单元34对待从评价句子中提取的评价属性的方式相似的方式对待该评价属性。
图8是示出由图5所示的信息处理装置30执行的相似内容呈现处理的流程图。在例如指示相似内容项目的呈现时开始该相似内容呈现处理。
步骤S51-S53的处理与图3所示的步骤S11-S13中的处理相似。因而,省略其描述。
在步骤S54中,语言评价信息提取单元31从与评价句子获取单元12提供的评价句子有关的语言信息中提取包括评价属性的评价信息。
在步骤S55中,语言评价信息提取单元31根据在步骤S54中提取的评价信息来确定评价句子的评价是正面评价还是负面评价。
如果语言评价信息提取单元31在步骤S55中确定出评价句子的评价既不是正面评价也不是负面评价,则过程结束。
与之对照,如果语言评价信息提取单元31在步骤S55中确定出评价句子的评价是正面评价或负面评价,则语言评价信息提取单元31将指示评价句子的评价是正面评价或负面评价的确定结果作为语言评价提供给具体评价和语言评价比较单元32。
在步骤S56中,具体评价和语言评价比较单元32识别从具体评价信息获取单元11提供的具体评价和从语言评价信息提取单元31提供的语言评价之间的关系。然后,具体评价和语言评价比较单元32将具体评价和语言评价之间的关系提供给偏好学习单元36。而且,具体评价和语言评价比较单元32将具体评价和语言评价提供给推荐和呈现单元35。
在步骤S57中,偏好学习单元36通过执行与图3所示的步骤S17-S21中的处理相似的处理来进行偏好学习。
在步骤S58中,语言评价特征值确定单元34确定语言评价特征值将是对应于以下评价属性的特征值:该评价属性是与由语言评价信息提取单元31从存储于属性和特征值对应关系存储单元33中的属性和特征值对应关系信息中的评价属性中提取的评价属性中的一个评价属性相似的单词。然后,语言评价特征值确定单元34将语言评价特征值提供给推荐和呈现单元35。
在步骤S59中,推荐和呈现单元35根据从具体评价和语言评价比较单元32提供的具体评价和语言评价来确定具体评价是否为正面评价并且语言评价是否为负面评价。
如果推荐和呈现单元35在步骤S59中确定出具体评价是正面评价并且语言评价是负面评价,则过程进行到步骤S60。
在步骤S60中,推荐和呈现单元35选择语言评价特征值之外的特征值作为主题特征值,并且针对每个推荐候选内容项目计算主题内容项目和推荐候选内容项目之间的相似程度。
更具体地,当具体评价是正面评价并且语言评价是负面评价时,就假定用户在除语言评价特征值之外的特征值方面具有对主题内容项目的正面印象。因此,推荐和呈现单元35确定主题特征值将是除语言评价特征值之外的特征值,并且针对每个推荐候选内容项目计算主题内容项目和推荐候选内容项目之间的相似程度。
例如,当主题内容项目是图2所示的曲调I并且语言评价特征值是“声密度”时,推荐和呈现单元35计算在表示除曲调I的声密度之外的曲调I的特征值的向量和表示除曲调F的声密度之外的曲调F的特征值的向量之间的欧几里得距离的倒数,在表示除曲调I的声密度之外的曲调I的特征值的向量和表示除曲调G的声密度之外的曲调G的特征值的向量之间的欧几里得距离的倒数,以及在表示除曲调I的声密度之外的曲调I的特征值的向量和表示除曲调H的声密度之外的曲调H的特征值的向量之间的欧几里得距离的倒数,作为相似程度,其中曲调F-H用作推荐候选内容项目。结果,关于曲调F的相似程度是0.12,关于曲调G的相似程度是0.017,关于曲调H的相似程度是0.019。
在此,代替不使用语言评价特征值来计算相似程度,推荐和呈现单元35可校正主题内容项目的语言评价特征值并且利用经校正的评价特征值来计算相似程度。
在这种情况下,例如,当所有内容项目的声密度的平均值是50时,推荐和呈现单元35将曲调I的声密度(该声密度为76)校正到24,这是与声密度的原始值相对于平均值对称的值。然后,对于每个推荐候选内容项目,推荐和呈现单元35计算表示校正后曲调I的特征值的向量(73,59,24)和表示推荐候选内容项目的特征值的向量之间的欧几里得距离的倒数作为相似程度。
在此,推荐和呈现单元35可使用偏好向量来校正语言评价特征值。在这种情况下,例如,当偏好向量是(72.7,71,37.3)时,推荐和呈现单元35将曲调I的声密度校正到由偏好向量表示的值为37.3的声密度。然后,针对每个推荐候选内容项目,推荐和呈现单元35计算在表示校正后曲调I的特征值的向量(73,59,37.3)和表示推荐候选内容项目的特征值的向量之间的欧几里得距离的倒数,作为相似程度。
与之对照,如果推荐和呈现单元35在步骤S59中确定出具体评价不是正面评价或语言评价不是负面评价,则过程进行到步骤S61。在步骤S61中,推荐和呈现单元35根据从具体评价和语言评价比较单元32提供的具体评价和语言评价,来确定具体评价是否是负面评价并且语言评价是否是正面评价。
如果推荐和呈现单元35在步骤S61中确定出具体评价是负面评价并且语言评价是正面评价,则过程进行到步骤S62。在步骤S62中,推荐和呈现单元35选择语言评价特征值作为主题特征值,并针对每个推荐候选内容项目计算主题内容项目和推荐候选内容项目之间的相似程度。
更具体地,当具体评价是负面评价并且语言评价是正面评价时,就假定用户仅在语言评价特征值方面具有对主题内容项目的正面印象。因此,推荐和呈现单元35仅确定语言评价特征值是主题特征值,并且针对每个推荐候选内容项目计算主题内容项目和推荐候选内容项目之间的相似程度。
例如,当主题内容项目是图2所示的曲调G并且语言评价特征值是“声密度”时,推荐和呈现单元35计算在表示曲调G的声密度的向量和表示曲调F的声密度的向量之间的欧几里得距离的倒数,在表示曲调G的声密度的向量和表示曲调H的声密度的向量之间的欧几里得距离的倒数,以及在表示曲调G的声密度的向量和表示曲调I的声密度的向量之间的欧几里得距离的倒数,作为相似程度,其中曲调F、H和I用作推荐候选内容项目。作为结果,关于曲调F的相似程度是0.043,关于曲调H的相似程度是0.048,关于曲调I的相似程度是0.077。
在此,代替仅使用语言评价特征值来计算相似程度,与具体评价是正面评价并且语言评价是负面评价的情况相似,推荐和呈现单元35可校正除主题内容项目的语言评价特征值之外的主题内容项目的特征值,并利用经校正的特征值来计算相似程度。
在进行了步骤S60或S62中的处理之后,在步骤S63中,推荐和呈现单元35使得按照步骤S60或S62中计算的相似程度的降序来显示与推荐候选内容项目有关的“关于内容的信息项目”,作为关于相似内容项目的“关于内容的信息项目”。然后,过程结束。
而且,如果推荐和呈现单元35在步骤S61中确定具体评价不是负面评价或语言评价不是正面评价,即当具体评价和语言评价都是正面评价或都是负面评价时,过程结束。
在此,当用户输入的评价值大于三时,具体评价信息获取单元11可确定出具体评价是正面评价。当用户输入的评价值是三时,具体评价信息获取单元11可确定出具体评价既不是正面评价也不是负面评价。当用户输入的评价值小于三时,具体评价信息获取单元11可确定出具体评价是负面评价。在这种情况下,当具体评价既不是正面评价也不是负面评价时,执行与具体评价是正面评价时执行的处理相似的处理。也就是说,当语言评价是负面评价时,使用除了语言评价特征值之外的特征值作为主题特征值来计算相似程度,并且当语言评价既不是正面评价也不是负面评价时,不计算相似程度。
如上所述,信息处理装置30根据语言评价特征值、具体评价和语言评价来确定主题特征值,并根据主题内容项目和每个推荐候选内容项目之间的与主题特征值有关的相似程度来推荐推荐候选内容项目作为相似内容项目。因此,与根据具体评价和语言评价中的一个来推荐内容项目的情况相比,信息处理装置30能够以更高准确性推荐匹配于用户偏好的内容项目。
第三实施例
图9是根据本发明第三实施例的信息处理装置的示例结构的框图。
在图9所示的结构中,用相同的附图标记表示与图1或图5所示的结构中表示的组件相同的组件。在需要时将省略冗余的描述。
图9所示的信息处理装置50的结构和图5所示的结构之间的不同之处在于:信息处理装置50包括推荐和呈现单元19以及偏好学习单元51,而不是推荐和呈现单元35和偏好学习单元36。
信息处理装置50根据具体评价、语言评价和与语言评价的评价属性相对应的内容项目的特征值来确定学习方法,并通过学习方法进行偏好学习。然后,信息处理装置50根据由偏好学习产生的偏好信息将推荐的内容项目呈现给用户。
更具体地,与图1所示的主评价信息确定单元15相似,偏好学习单元51确定主评价是具体评价和语言评价中的具体评价。而且,与图1所示的评价校正单元16相似,偏好学习单元51根据由具体评价和语言评价比较单元32识别的具体评价和语言评价之间的关系,来校正从具体评价信息获取单元11提供的具体评价的评价值,并将经校正的具体评价视为最终评价值。
而且,偏好学习单元51根据从具体评价和语言评价比较单元32输出的具体评价和语言评价以及由语言评价特征值确定单元34确定的语言评价特征值,来确定偏好学习方法。在此,由偏好学习单元51执行的偏好学习方法是基于上述第二方法的方法。
偏好学习单元51根据最终评价值和存储在内容特征值存储单元18中的主题内容项目的特征值,通过所确定的偏好学习方法来执行偏好学习。偏好学习单元51将通过执行偏好学习产生的偏好向量作为偏好信息提供给推荐和呈现单元19。
图10是示出由图9所示的信息处理装置50进行的学习处理的流程图。在例如用户输入五级顺序量表中的一级和关于主题内容项目的评价句子时开始该学习处理。
图10所示的步骤S71-S76中的处理与图3所示的步骤S11-S16中的处理相似。因此,省略对其的描述。
在进行了步骤S76中的处理之后,在步骤S77中,语言评价特征值确定单元34确定语言评价特征值是对应于以下评价属性的特征值,该评价属性是与由语言评价信息提取单元31从存储在属性和特征值对应关系存储单元33中的属性和特征值对应关系信息中的评价属性中提取的一个评价属性相似的词。然后,语言评价特征值确定单元34将语言评价特征值提供给偏好学习单元51。
在步骤S78中,偏好学习单元51根据从具体评价和语言评价比较单元32提供的具体评价和语言评价来确定具体评价是否为正面评价。如果在步骤S78中偏好学习单元51确定具体评价是正面评价,则在步骤S79中,偏好学习单元51根据从具体评价和语言评价比较单元32提供的具体评价和语言评价来确定语言评价是否为正面评价。
如果偏好学习单元51在步骤S79中确定语言评价是正面评价,也就是说,当具体评价和语言评价是正面评价时,过程进行到步骤S80。在步骤S80中,偏好学习单元51确定偏好学习方法是语言评价特征值加权方法,其中通过对主题内容项目的语言评价特征值加权来更新偏好向量。
以下将描述语言评价特征值加权方法。
当学习前的偏好向量是m=(m1,m2,…,mM)(注意M表示特征值类型的数目)时,用来产生偏好向量的内容组中的内容项目的数目是Np,且主题内容项目j的特征值是fj=(fj1,fj2,…,fjM),在第二方法中根据以下给出的等式(1)来更新偏好向量。
m′i=(Npmi+fji)/(Np+1)    等式(1)
在此,在等式(1)中,m′i表示作为学习的结果而获得的偏好向量m′的每个元素。
而且,通过以下给出的等式(2)来表示用来产生偏好向量m′的内容组中的内容项目的数目Np′。
Np′=Np+1    等式(2)
与之对照,在语言评价特征值加权方法中,根据以下给出的等式(3)来更新语言评价特征值mk,且根据以上给出的等式(1)来更新除语言评价特征值mk之外的特征值mi
m′k=(Npmk+βfjk)/(Np+β)    等式(3)
在此,在等式(3)中,常数β是大于一的值。根据等式(3),学习后偏好向量m′的语言评价特征值m′k变得更接近主题内容项目j的语言评价特征值fjk。因此,在语言评价特征值加权方法中,通过为偏好向量的语言评价特征值赋予更大的权重来进行学习。在进行了步骤S80的处理之后,过程进行到步骤S84。
与之对照,如果在步骤S79中偏好学习单元51确定语言评价不是正面评价,也就是说当具体评价是正面评价且语言评价是负面评价时,过程进行到步骤S81。在步骤S81中,偏好学习单元51确定偏好学习方法是除语言评价特征值之外更新方法,其中根据等式(1)更新除偏好向量的语言评价特征值之外的偏好向量的特征值。在该除语言评价特征值之外更新方法中,除偏好向量m′的语言评价特征值m′k之外的偏好向量m′的特征值m′i变得更接近主题内容项目j的特征值fji。在进行了步骤S81的处理之后,过程进行到步骤S84。
而且,如果在步骤S78中偏好学习单元51确定具体评价不是正面评价,也就是说,当具体评价是负面评价时,过程进行到步骤S82。在步骤S82中,偏好学习单元51确定语言评价是否为正面评价。
如果在步骤S82中偏好学习单元51确定语言评价是正面评价,也就是说,当具体评价是负面评价且语言评价是正面评价时,过程进行到步骤S83。
在步骤S83中,偏好学习单元51确定偏好学习方法是仅语言评价特征值更新方法,其中根据等式(1)仅更新语言评价特征值。在该仅语言评价特征值更新方法中,仅偏好向量m′的语言评价特征值m′k变得更接近主题内容项目j的特征值fjk。在进行了步骤S83中的处理后,过程进行到步骤S84。
在步骤S84中,偏好学习单元51根据在步骤S80-S83中的一个步骤中确定的偏好学习方法中的一个进行偏好学习,且过程结束。
与之对照,如果在步骤S82中偏好学习单元51确定语言评价不是正面评价,也就是说,具体评价和语言评价都是负面评价,则过程结束。
在此,在偏好学习单元51还学习负偏好向量的情况下,当具体评价和语言评价都是负面评价时,偏好学习单元51根据与等式(3)相似的等式来更新负偏好向量的语言评价特征值,并根据与等式(1)相似的等式来更新除语言评价特征值之外的特征值。结果,通过为负偏好向量的语言评价特征值赋予更大的权重来进行学习。
由信息处理装置50进行的推荐内容呈现处理与图4所示的推荐内容呈现处理相似。因此,省略对其的描述。
如上所述,信息处理装置50根据语言评价特征值、具体评价和语言评价来确定偏好学习方法,并根据由偏好学习方法进行的偏好学习产生的偏好信息来推荐内容项目。因此,与根据具体评价和语言评价中的一个来推荐内容项目的情况相比,信息处理装置50能够以更高的准确性推荐匹配于用户偏好的内容项目。
在此,在上述描述中,在信息处理装置30和50中,偏好学习中使用的评价值是主评价的经校正的评价值,该校正是根据具体评价和语言评价之间的关系进行的。然而,偏好学习中使用的评价值可以是具体评价的评价值或语言评价的评价值本身。
而且,根据本发明的实施例还可以应用到记录推荐的内容项目或类似内容项目的记录装置以及呈现与推荐的内容项目或类似内容项目有关的“关于内容的信息项目”的装置。
上述一系列处理过程可通过硬件或软件来执行。当通过软件执行一系列处理过程时,构成该软件的程序被安装在计算机上。在此,计算机的示例包括嵌入专用硬件中的计算机,能够通过安装的各种程序来执行各种功能的通用个人计算机等。
图11是使用程序执行上述系列处理过程的计算机的硬件结构的示例的框图。
在计算机中,中央处理单元(CPU)201、只读存储器(ROM)202和随机存取存储器(RAM)203经由总线204彼此连接。
此外,输入/输出接口205连接到总线204。输入单元206、输出单元207、存储单元208、通信单元209和驱动器210连接到输入/输出接口205。
输入单元206包括键盘、鼠标和麦克风。输出单元207包括显示器和扬声器。存储单元208包括硬盘和非易失性存储器。通信单元209包括网络接口。驱动器210驱动可移除介质211,诸如磁盘、光盘、磁光盘或半导体存储器。
在具有上述结构的计算机中,当例如CPU 201通过输入/输出接口205和总线204将存储在存储单元208中的程序加载到RAM 203中并执行该程序时执行上述系列处理过程。
可通过例如可移除介质211来提供由计算机(CPU 201)执行的程序,该可移除介质211是上面记录有程序的封装介质等。而且,可通过有线或无线传输介质诸如局域网、因特网或数字卫星广播提供程序。
在计算机中,可通过将可移除介质211插入驱动器210中经由输入/输出接口205将程序安装在存储单元208上。而且,程序可经由有线或无线传输介质通过通信单元209接收并可被安装在存储单元208上。可替代地,可将程序预安装在ROM 202或存储单元208上。
在本说明书中,在程序记录介质上记录的程序中所描述的步骤当然可根据遵循上述顺序的时间序列来执行。所述步骤不一定根据遵循所述顺序的时间序列执行,并且可并行地或单独地执行。
本申请包含的主题涉及2009年8月12日提交到日本专利局的日本优先权专利申请JP 2009-187046中的公开的主题,其全部内容通过引用结合于此。
本领域技术人员应该理解,根据设计需求和其他因素可在所附权利要求或其等效内容的范围内进行各种修改、组合、子组合和变化。

Claims (12)

1.一种信息处理装置,包括:
具体评价信息获取装置,用于获取对预定内容项目的评价作为具体评价,所述评价是由用户根据顺序量表输入的;
语言评价信息提取装置,用于根据关于评价句子的语言信息来获取语言评价,在所述评价句子中用语言表达对所述预定内容项目的评价,所述评价句子是由用户输入的;以及
推荐装置,用于根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来推荐与用户偏好匹配的内容项目。
2.根据权利要求1所述的信息处理装置,还包括:
评价校正装置,用于根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来校正主评价,所述主评价是所述具体评价或所述语言评价;以及
偏好学习装置,用于使用由所述评价校正装置校正后的所述主评价来学习用户偏好,
其中所述推荐装置根据表示用户偏好的偏好信息来推荐与用户偏好匹配的内容项目,所述偏好信息是通过由所述偏好学习装置进行的学习产生的。
3.根据权利要求2所述的信息处理装置,
其中所述评价校正装置校正所述主评价,使得在所述具体评价和所述语言评价都是正面评价或负面评价的情况下赋予所述主评价更大的权重,并且所述评价校正装置校正所述主评价使得在所述具体评价和所述语言评价中的一个是正面评价而另一个是负面评价的情况下赋予所述主评价较小的权重。
4.根据权利要求3所述的信息处理装置,
其中所述语言评价信息提取装置还根据关于所述评价句子的所述语言信息来获取所述语言评价的等级,以及
其中所述评价校正装置校正所述主评价使得在所述具体评价和所述语言评价都是正面评价或都是负面评价的情况下,根据与所述语言评价的等级相对应的程度来赋予所述主评价更大的权重,并且所述评价校正装置校正所述主评价使得在所述具体评价和所述语言评价中的一个是正面评价而另一个是负面评价的情况下,根据与所述语言评价的等级相对应的程度来赋予所述主评价较小的权重。
5.根据权利要求2所述的信息处理装置,还包括:
确定装置,用于确定所述具体评价和所述语言评价中的哪个要成为所述主评价,
其中,所述偏好学习装置使用所述具体评价来学习用户偏好,并且还使用所述语言评价来学习用户偏好,以及
其中,所述确定装置根据以下内容来确定所述主评价:所述预定内容项目的第一预计评价和所述具体评价之间的预计误差,以及所述预定内容项目的第二预计评价和所述语言评价之间的预计误差,所述第一预计评价是根据通过使用所述具体评价进行的学习产生的所述偏好信息获得的,所述第二预计评价是根据通过使用所述语言评价进行的学习产生的所述偏好信息获得的。
6.根据权利要求1所述的信息处理装置,
其中所述语言评价信息提取装置还根据关于所述评价句子的所述语言信息来获取所述语言评价的属性,以及
其中所述推荐装置根据对应于所述属性的内容特征值并且根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价,来确定要被用来计算所述预定内容项目和推荐候选内容项目之间的相似度或距离的内容特征值,并根据在使用所确定的内容特征值时所述预定内容项目和所述推荐候选内容项目之间的相似度或距离来推荐所述推荐候选内容项目作为匹配于用户偏好的内容项目。
7.根据权利要求6所述的信息处理装置,
其中,在所述具体评价是正面评价并且所述语言评价是负面评价的情况下,所述推荐装置确定除了对应于所述属性的所述内容特征值之外的特征值作为要被用来计算相似度或距离的所述内容特征值,以及在所述具体评价是负面评价并且所述语言评价是正面评价的情况下,所述推荐装置确定对应于所述属性的所述内容特征值作为要被用来计算相似度或距离的所述内容特征值。
8.根据权利要求1所述的信息处理装置,还包括:
偏好学习装置,用于使用所述语言评价或所述具体评价以及所述预定内容项目的特征值来学习用户偏好,
其中所述语言评价信息提取装置还根据关于所述评价句子的所述语言信息来获取所述语言评价的属性,以及
其中所述偏好学习装置根据对应于所述属性的内容特征值并且根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来确定学习方法,并根据所述学习方法来学习用户偏好。
9.根据权利要求8所述的信息处理装置,
其中,在所述具体评价和所述语言评价是正面评价的情况下,所述偏好学习装置确定所述学习方法是通过对所述预定内容项目的特征值加权来学习用户偏好的方法,所述特征值对应于所述属性;在所述具体评价是正面评价并且所述语言评价是负面评价的情况下,所述偏好学习装置确定所述学习方法是仅使用所述预定内容项目的特征值来学习用户偏好的方法,所述特征值是除了对应于所述属性的特征值之外的特征值;以及在所述具体评价是负面评价并且所述语言评价是正面评价的情况下,所述偏好学习装置确定所述学习方法是仅使用所述预定内容项目的特征值来学习用户偏好的方法,所述特征值对应于所述属性。
10.一种由信息处理装置执行的用于处理信息的方法,所述方法包括以下步骤:
获取对预定内容项目的评价作为具体评价,所述评价是由用户根据顺序量表输入的;
根据关于评价句子的语言信息获取语言评价,在所述评价句子中用语言表达对所述预定内容项目的评价,所述评价句子是由用户输入的;以及
根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来推荐匹配于用户偏好的内容项目。
11.一种程序,用于使计算机执行包括以下步骤的处理:
获取对预定内容项目的评价作为具体评价,所述评价是由用户根据顺序量表输入的;
根据关于评价句子的语言信息来获取语言评价,在所述评价句子中用语言表达对所述预定内容项目的评价,所述评价句子是由用户输入的;以及
根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来推荐匹配于用户偏好的内容项目。
12.一种信息处理装置,包括:
具体评价信息获取单元,获取对预定内容项目的评价作为具体评价,所述评价是由用户根据顺序量表输入的;
语言评价信息提取单元,根据关于评价句子的语言信息来获取语言评价,在所述评价句子中用语言表达对所述预定内容项目的评价,所述评价句子是由用户输入的;以及
推荐单元,根据所述具体评价是正面评价还是负面评价以及所述语言评价是正面评价还是负面评价来推荐匹配于用户偏好的内容项目。
CN2010102503609A 2009-08-12 2010-08-05 信息处理装置和用于处理信息的方法 Expired - Fee Related CN101996232B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-187046 2009-08-12
JP2009187046A JP5464412B2 (ja) 2009-08-12 2009-08-12 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
CN101996232A true CN101996232A (zh) 2011-03-30
CN101996232B CN101996232B (zh) 2013-03-27

Family

ID=43242782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102503609A Expired - Fee Related CN101996232B (zh) 2009-08-12 2010-08-05 信息处理装置和用于处理信息的方法

Country Status (4)

Country Link
US (2) US20110040790A1 (zh)
EP (1) EP2287794A1 (zh)
JP (1) JP5464412B2 (zh)
CN (1) CN101996232B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113765959A (zh) * 2020-06-30 2021-12-07 北京沃东天骏信息技术有限公司 信息推送方法、装置、设备及计算机可读存储介质

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5166949B2 (ja) * 2008-04-10 2013-03-21 株式会社エヌ・ティ・ティ・ドコモ レコメンド情報生成装置およびレコメンド情報生成方法
JP5578040B2 (ja) * 2010-11-15 2014-08-27 ソニー株式会社 情報処理装置および方法、情報処理システム、並びに、プログラム
JP5843104B2 (ja) * 2012-05-11 2016-01-13 ソニー株式会社 情報処理装置、情報処理方法、及び、プログラム
JP5999425B2 (ja) * 2012-09-26 2016-09-28 ソニー株式会社 情報処理装置及び情報処理方法
JP6101477B2 (ja) * 2012-12-10 2017-03-22 日本放送協会 コンテンツ推薦装置、及びプログラム
US9342846B2 (en) * 2013-04-12 2016-05-17 Ebay Inc. Reconciling detailed transaction feedback
US9367628B2 (en) * 2014-01-03 2016-06-14 Facebook, Inc. Object recommendation based upon similarity distances
US9952571B2 (en) * 2014-03-24 2018-04-24 Xiaomi Inc. Method and terminal device for controlling smart home appliance
JP5925935B1 (ja) * 2015-04-22 2016-05-25 株式会社アクアティカ 管理装置及び嗜好性特定方法
JP2017182275A (ja) * 2016-03-29 2017-10-05 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
KR101920116B1 (ko) * 2016-09-09 2018-11-19 가톨릭대학교 산학협력단 음식갈망 억제를 위한 콘텐츠 추천 방법 및 장치
US10373618B2 (en) * 2017-08-07 2019-08-06 Soundhound, Inc. Natural language recommendation feedback
JP6943149B2 (ja) * 2017-11-13 2021-09-29 株式会社アイシン 視覚シミュレーション装置、視覚シミュレーション方法、及び視覚シミュレーション装置のためのプログラム
US11270071B2 (en) * 2017-12-28 2022-03-08 Comcast Cable Communications, Llc Language-based content recommendations using closed captions
JP7009256B2 (ja) * 2018-02-26 2022-01-25 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
CN108681919A (zh) * 2018-05-10 2018-10-19 苏州跃盟信息科技有限公司 一种内容推送方法及装置
CN108899012B (zh) * 2018-07-27 2021-04-20 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 语音交互设备评测方法、系统、计算机设备和存储介质
KR102596841B1 (ko) * 2018-08-08 2023-11-01 삼성전자주식회사 사용자의 발화에 응답하여 하나 이상의 아이템을 제공하기 위한 전자 장치 및 방법
JP7387970B2 (ja) * 2019-01-17 2023-11-29 Lineヤフー株式会社 算出装置、算出方法、算出プログラム
CN110047508A (zh) * 2019-03-12 2019-07-23 平安科技(深圳)有限公司 语音记录方法、装置、计算机设备及存储介质
JP7464240B2 (ja) * 2019-04-26 2024-04-09 Necソリューションイノベータ株式会社 予測モデル生成装置、旅行適合度予測装置、予測モデル生産方法、旅行適合度予測方法、プログラム及び記録媒体
CN111190958A (zh) * 2019-12-02 2020-05-22 泰康保险集团股份有限公司 用户信息匹配处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050273360A1 (en) * 2004-05-19 2005-12-08 Mednet Connect Medical bill analysis and review
CN1849818A (zh) * 2003-09-11 2006-10-18 松下电器产业株式会社 内容选择方法和内容选择设备
CN101166102A (zh) * 2006-09-21 2008-04-23 索尼株式会社 信息处理设备及方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4032529B2 (ja) * 1998-10-15 2008-01-16 株式会社日立製作所 要求者からの要求と提供者の提供するコンテンツのマッチングを行なう計算機
JP4828679B2 (ja) 1999-12-01 2011-11-30 ソニー株式会社 受信装置、コンテンツ選択方法、及び放送システム
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
EP1540550A4 (en) * 2002-08-19 2006-09-27 Choicestream PERSONALIZED STATISTICAL RECOMMENDATION SYSTEM
JP2005309907A (ja) * 2004-04-23 2005-11-04 Hewlett-Packard Development Co Lp ユーザコメントダイジェストの生成方法・装置・プログラム
US7885863B2 (en) * 2006-08-31 2011-02-08 Yahoo! Inc. Methods and computer readable media for enhancing product reviews
JP4730619B2 (ja) * 2007-03-02 2011-07-20 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4389973B2 (ja) * 2007-06-26 2009-12-24 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7720870B2 (en) * 2007-12-18 2010-05-18 Yahoo! Inc. Method and system for quantifying the quality of search results based on cohesion
JP4784613B2 (ja) 2008-02-01 2011-10-05 ダイキン工業株式会社 情報処理装置及び方法、プログラム並びに記録媒体
US8117207B2 (en) * 2008-04-18 2012-02-14 Biz360 Inc. System and methods for evaluating feature opinions for products, services, and entities
US8316393B2 (en) * 2008-10-01 2012-11-20 At&T Intellectual Property I, L.P. System and method for a communication exchange with an avatar in a media communication system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1849818A (zh) * 2003-09-11 2006-10-18 松下电器产业株式会社 内容选择方法和内容选择设备
US20050273360A1 (en) * 2004-05-19 2005-12-08 Mednet Connect Medical bill analysis and review
CN101166102A (zh) * 2006-09-21 2008-04-23 索尼株式会社 信息处理设备及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《Proceedings of the 6th international conference on music information retrieval》 20050930 xiao hu,J.Stephen Downie Mining Music Reviews:Promising Preliminary Results 536-539 1-4、10 , *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113765959A (zh) * 2020-06-30 2021-12-07 北京沃东天骏信息技术有限公司 信息推送方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
JP2011039811A (ja) 2011-02-24
US20150058008A1 (en) 2015-02-26
EP2287794A1 (en) 2011-02-23
US9704480B2 (en) 2017-07-11
CN101996232B (zh) 2013-03-27
US20110040790A1 (en) 2011-02-17
JP5464412B2 (ja) 2014-04-09

Similar Documents

Publication Publication Date Title
CN101996232B (zh) 信息处理装置和用于处理信息的方法
CN108334891B (zh) 一种任务型意图分类方法及装置
JPWO2008004666A1 (ja) 音声認識装置、音声認識方法、および音声認識用プログラム
CN107239547B (zh) 用于语音点歌的语音纠错方法、终端及存储介质
JP2015075706A (ja) 誤り修正モデル学習装置、及びプログラム
JP2012198277A (ja) 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム
CN103678271B (zh) 一种文本校正方法及用户设备
CN108804526A (zh) 兴趣确定系统、兴趣确定方法及存储介质
CN111831911A (zh) 查询信息的处理方法、装置、存储介质和电子装置
JP5638503B2 (ja) テキスト要約装置、方法及びプログラム
CN111737961B (zh) 一种故事生成的方法、装置、计算机设备和介质
JP2015215626A (ja) 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム
JP5437204B2 (ja) 言語モデル処理装置および音声認識装置、ならびにプログラム
CN114138969A (zh) 文本处理方法及装置
CN114328899A (zh) 一种文本纪要生成方法、装置、设备及存储介质
JP5623369B2 (ja) テキスト要約装置、方法及びプログラム
CN108959268B (zh) 一种文本情感分析方法及装置
CN113539234B (zh) 语音合成方法、装置、系统及存储介质
CN114330321A (zh) 用户先验知识增强的文本风格迁移方法、装置及电子设备
JP4735958B2 (ja) テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム
JP2015225416A (ja) モデル学習装置、ランキング装置、方法、及びプログラム
JP5959598B2 (ja) モデル学習装置、ランキング装置、方法、及びプログラム
KR102540178B1 (ko) 음성 인식 결과를 편집하는 방법
JP5305971B2 (ja) 略語推定装置および方法
JP7375096B2 (ja) 分散表現生成システム、分散表現生成方法及び分散表現生成プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130327