CN101116073A - 信息处理设备、信息处理方法及程序 - Google Patents

信息处理设备、信息处理方法及程序 Download PDF

Info

Publication number
CN101116073A
CN101116073A CNA2006800040286A CN200680004028A CN101116073A CN 101116073 A CN101116073 A CN 101116073A CN A2006800040286 A CNA2006800040286 A CN A2006800040286A CN 200680004028 A CN200680004028 A CN 200680004028A CN 101116073 A CN101116073 A CN 101116073A
Authority
CN
China
Prior art keywords
content
information
feature quantity
probability distribution
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800040286A
Other languages
English (en)
Inventor
馆野启
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101116073A publication Critical patent/CN101116073A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • G10H1/0041Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/085Mood, i.e. generation, detection or selection of a particular emotional content or atmosphere in a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了能够把最适宜的关键词授予给内容的信息处理设备、方法和程序。内容特征量抽取部分(52)抽取关于内容的内容特征量。标签信息抽取部分(54)抽取指示关于内容的特征的标签信息。相应信息计算部分(56)分别计算指示为内容特征量和标签信息共用的潜在变量zK的概率分布的参数、内容特征量和标签信息。内容特征量-潜在空间相应信息积聚部分(57)或标签信息-潜在空间相应信息积聚部分(58)积聚所计算的潜在变量zK,以便最适宜的关键词可以被授予给内容。

Description

信息处理设备、信息处理方法及程序
技术领域
本发明涉及信息处理设备、信息处理方法和信息处理程序。更具体地,本发明涉及能把最适宜的关键词分配给内容的信息处理设备、信息处理方法和信息处理程序。
背景技术
在过去引入了一种作为用于搜索音频或视频内容并通过给每个内容提供关键词来对音频和视频内容进行分类的技术。这种关键词通常被称作元数据。为了给每个内容分配关键词,需要相当大数量的人力劳动,正如例如,CDDB(CD数据库)的情况,该CDDB用于提供诸如记录在作为容器的每张CD(紧密盘)上的音乐内容的名字和与音乐内容相关的艺术家的名字的信息。在这种情况下,每当引入新内容时,都进行了人力劳动来为每个内容登记关键词。
另外,曾经特别地发展了一种用数值来表示每个单独的音乐内容的特征的技术,作为被提供给音乐内容等的技术,还存在一种从这种数值推断诸如关键词等元数据的技术。
为了具体地表述它,还存在一种信息处理设备(诸如在专利文档1中描述的设备),其中,根据多元技术的量化类型III,诸如提供给单独内容的关键词的离散量被存放在连续量的空间中,在连续量空间和特征量空间中进行规范的相关性分析,以便得到关联连续量空间和特征量空间的关系。然后,通过利用关联关系,从新内容的特征量中推断出关键词。
另外,还曾经提出了用于聚合(cluster)内容的技术、聚合关键词的技术(诸如专利文档2中描述的技术)、同时聚合内容和关键词的技术(诸如非专利文档1中描述的技术)以及推荐匹配用户喜好或匹配环境的内容的技术(诸如专利文档3中描述的技术)。
上面提到的参考文献被罗列如下:
[专利文档1]
日本专利申请公开No.Hei 11-96165
[专利文档2]
日本专利申请公开No.2002-41573
[专利文档3]
日本专利申请公开No.2001-175676
[非专利文档1]
Hiroya Takamura和Yuji Matsumoto,“对于原文分类的联合聚合”,日本信息处理会社杂志,44卷,02期,2003年2月出版。(Hiroya Takamura and YujiMatsumoto,“Co-clustering for Text Categorization”,magazine of the InformationProcessing Society of Japan,Vol.44,No.02,an issue of February 2003.)
发明内容
[本发明要解决的问题]
然而,每当新引入了附加内容时,都进行了非常大量的人力劳动来给内容提供关键词,这出现了永远地遭受耗费的问题。
另外,如果采用给内容提供关键词的传统技术,给内容提供关键词的处理就不能说是为内容提供适合于内容的关键词的处理。
例如,在日本专利申请公开No.Hei 11-96165中公开的设备通过采用量化类型III来推断关键词。然而,由于量化类型III只能被应用于定性数据,因此这种多元技术不能被用于向例如在评论音乐内容的文本中多次出现的单词分配权重作为指示在这种文本中多次出现的单词被视作重要单词的权重。
另外,例如,在日本专利申请公开No.2002-41573和非专利文档1中公开的技术每个都是用于聚合内容和关键词的技术。然而,这些技术不能被用于通过使用代表内容特征和代表每个都被分配给内容的关键词的特征量来进行聚合和建模处理。
另外,在日本专利申请公开No.2001-175676中公开的技术是用于推荐匹配用户喜好或匹配环境的内容的技术。然而,该技术采用一种用于推荐具有与从高增值内容的积聚的元数据中创建的用户概述(profile)的小偏差的内容的方法。因此,由于没有考虑关于喜好的的信息分布,该技术不能说是用于推荐最适宜内容的技术。
对于上述问题,本发明使给内容分配最适宜的关键词成为可能。
[解决问题的手段]
依照本发明的第一方面,提供一种信息处理设备,包括:
第一计算装置,用于计算代表对于为与内容有关的特征量和显示内容的属性的属性信息共用的第一潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的第一参数;和
存储装置,用于存储所计算的第一参数。
信息处理设备可以具有配置,还包括:第一抽取装置,用于抽取特征量;和第二抽取装置,用于抽取属性信息。其中第一计算装置从所抽取的特征量和所抽取的属性信息中计算第一参数。
信息处理设备可以具有配置,其中第二抽取装置把以自然语言书写的句子划分为单词或者每个都由单词组成的短语。
信息处理设备可以具有配置,还包括:第二计算装置,用于基于由第一计算装置计算的第一参数来计算显示短语和特征量之间的关系程度的特性特征(feature charasteristic);和显示控制装置,用于基于所抽取的特性特征来控制显示短语的处理。
信息处理设备可以具有配置,其中:第一计算装置计算代表对于特征量的概率分布性质、对于属性信息的概率分布性质和为特征量、属性信息和被用户用作关于利用内容的信息的利用信息共用的第二潜在变量的概率分布性质的第二参数;和存储装置被用于存储由第一计算装置计算的第二参数。
信息处理设备可以具有配置,还包括:抽取装置,用于抽取利用信息,其中第一计算装置从特征量、属性信息或所抽取的利用信息中计算第二参数。
信息处理设备可以具有配置,其中:第一计算装置计算代表对于特征量的概率分布性质、对于属性信息的概率分布性质和为特征量、属性信息和被用作关于作为用户喜好的内容的信息的喜好信息共用的第三潜在变量的概率分布性质的第三参数;以及存储装置被用于存储所计算的第三参数。
信息处理设备可以具有配置,还包括:抽取装置,用于抽取喜好信息,其中第一计算装置从特征量、属性信息或所抽取的喜好信息中计算第三参数。
依照本发明的第一方面,提供一种信息处理方法,包括:计算步骤,用于计算代表与内容有关的特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数;和存储步骤,用于存储所计算的参数。
依照本发明的第一方面,提供一种由计算机执行的程序以进行:计算步骤,用于计算代表为与内容有关的特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数;和存储步骤,用于存储所计算的参数。
依照本发明的第一方面,第一参数被计算作为代表对于为与内容有关的特征量和显示内容的属性的属性信息共用的第一潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数;以及所计算的第一参数被存储。
依照本发明的第二方面,提供一种信息处理设备,包括:抽取装置,用于抽取与内容有关的特征量;转换装置,用于基于代表对于与特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,来进行转换处理以把所抽取的特征量放置于潜在空间中;计算装置,用于计算作为转换处理结果被放置于潜在空间中的特征量和通过潜在变量与特征量潜在地关联的属性信息之间的偏差;和选择装置,用于基于所计算的偏差来选择对于内容的属性。
信息处理设备可以具有配置,其中,作为对于内容的所选属性,选择装置在所有属性中选择所计算的偏差不高于门限值的属性,或者选择具有最小偏差的预定数目的属性。
依照本发明的第二方面,提供一种信息处理方法,包括:抽取步骤,用于抽取与内容有关的特征量;转换步骤,用于基于代表对于与特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,来进行转换处理以把所抽取的特征量放置于潜在空间中;计算步骤,用于计算作为转换处理结果被放置于潜在空间中的特征量和通过潜在变量与特征量潜在地关联的属性信息之间的偏差;和选择步骤,用于根据在计算步骤所计算的偏差来选择对于内容的属性。
依照本发明的第二方面,提供一种由计算机执行的程序以进行:抽取步骤,用于抽取与内容有关的特征量;转换步骤,用于基于代表对于与特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,来进行转换处理以把所抽取的特征量放置于潜在空间中;计算步骤,用于计算作为转换处理结果被放置于潜在空间中的特征量和通过潜在变量与特征量潜在地关联的属性信息之间的偏差;和选择步骤,用于基于所计算的偏差来选择对于内容的属性。
依照本发明的第二方面:抽取了与内容有关的特征量;基于代表对于与特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,进行了转换处理以把所抽取的特征量放置于潜在空间中;作为转换处理结果被放置于潜在空间中的特征量和通过潜在变量与特征量潜在地关联的属性信息之间的偏差被计算;以及基于所计算的偏差来选择对于内容的属性。
依照本发明的第三方面,提供一种信息处理设备,包括:转换装置,用于基于代表对于为与内容有关的特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,来进行转换处理以把属性信息放置于潜在空间中;计算装置,用于计算作为转换处理结果被放置于潜在空间中的特征量和通过潜在变量与特征量潜在地关联的属性信息之间的偏差;和选择装置,用于基于所计算的偏差选择对于属性信息的内容。
信息处理设备可以具有配置,其中:作为对于属性的所选内容,选择装置在所有内容中选择所计算的偏差不高于门限值的内容,或者选择具有最小偏差的预定数目的内容。
依照本发明的第三方面,提供一种信息处理方法,包括:转换步骤,用于基于代表对于为与内容有关的特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,来进行转换处理以把属性信息放置于潜在空间中;计算步骤,用于计算作为转换处理结果被放置于潜在空间中的属性信息和通过潜在变量与特征量潜在地关联的属性信息之间的偏差;和选择步骤,用于基于所计算的偏差选择对于属性信息的内容。
依照本发明的第三方面,提供一种由计算机执行程序以进行:转换步骤,用于基于代表对于为与内容有关的特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,来进行转换处理以把属性信息放置于潜在空间中;计算步骤,用于计算作为转换处理结果被放置于潜在空间中的属性信息和通过潜在变量与特征量潜在地关联的属性信息之间的偏差;和选择步骤,用于基于所计算的偏差选择对于属性信息的内容。
依照本发明的第三个方面:基于代表对于为与内容有关的特征量和显示内容的属性的属性信息共用的潜在变量的概率分布性质、对于特征量的概率分布性质和对于属性信息的概率分布性质的参数,进行了转换处理以把属性信息放置于潜在空间中;作为转换处理结果被放置于潜在空间中的属性信息和通过潜在变量与特征量潜在地关联的属性信息之间的偏差被计算;以及基于所计算的偏差选择关于内容的内容。
如上所述,依照本发明的第一方面,最适宜的关键词可以被分配给每个内容。
此外,依照本发明的第二方面,最适宜的关键词可以被分配给每个内容。
另外,依照本发明的第三方面,可能以较高的可靠性搜索对应于关键词内容。
附图说明
图1是显示内容提供设备中使用的硬件的典型配置的说明方框图。
图2是显示内容提供设备的典型功能配置的功能方框图。
图3显示由图2所示的内容提供设备所执行的学习处理的说明所参考的流程图。
图4是显示音乐内容的典型特征量的图表。
图5是显示音乐内容的典型标签信息的图表。
图6显示计算关联信息的处理的细节的说明所参考的流程图。
图7是显示在潜在变量是与内容特征量的混合正态分布(GMM)和标签信息的PLSA共用的变量的情况下的典型图形模型的图表。
图8是显示基于潜在空间的作为内容的典型表述的表述的图表。
图9是显示基于潜在空间的作为对于标签信息的典型表述的表述的图表。
图10是显示对于潜在变量zk的典型先验概率的图表。
图11是显示对于潜在变量z1的典型方差-协方差矩阵S1的图表。
图12是显示对于潜在变量z2的典型方差-协方差矩阵S2的图表。
图13是显示由关联信息计算单元计算的典型均值向量μ1和μ2的图表。
图14显示由内容提供设备所进行的给特定内容分配标签的处理的说明所参考的流程图。
图15是显示由潜在空间偏差计算单元计算的作为内容和标签之间的典型偏差的偏差的图表。
图16显示由内容提供设备所进行的搜索内容的处理的说明所参考的流程图。
图17是显示由潜在空间偏差计算单元计算的作为内容和标签之间的典型偏差的典型偏差的图表。
图18是显示内容提供设备的另一典型功能配置的功能方框图。
图19显示由图18所示的内容提供设备所进行的学习处理的说明所参考的流程图。
图20是显示对于音乐内容的典型环境信息的图表。
图21是显示基于潜在空间的作为环境信息的典型表述的表述的图表。
图22是显示内容提供设备的再一典型功能配置的功能方框图。
图23显示图22所示的内容提供设备所进行的学习处理的说明所参考的流程图。
图24是显示作为用户喜好的音乐内容的典型喜好信息的图表。
图25是显示基于潜在空间的作为喜好信息的典型表述的表述的图表。
图26是显示环境的典型特性特征的图表。
图27是显示内容提供设备的再一典型功能配置的功能方框图。
图28显示由图27所示的内容提供设备所进行的学习处理的说明所参考的流程图。
图29显示计算标签信息的处理的细节的说明所参考的流程图。
图30是显示词素的典型分析的图表。
图31是显示内容提供设备的再一典型功能配置的功能方框图。
图32显示由图31所示的内容提供设备所进行的学习处理的说明所参考的流程图。
图33是显示基于潜在空间的作为标签的典型表述的表述的图表。
图34是显示每个短语的典型特性特征的图表。
图35是显示展示诸如评论音乐内容的句子的句子的典型显示的显示单元的图表。
图36是显示用于在学习阶段进行处理的内容提供设备的典型功能配置的功能方框图。
图37是显示用于在操作阶段进行处理的客户终端设备的典型功能配置的功能方框图。
[参考数字说明]
1:内容提供设备
11:CPU
12:ROM
13:RAM
16:输入单元
17:输出单元
18:记录单元
19:通信单元
20:驱动器
21:可移动介质
51:内容存储单元
52:内容特征量抽取单元
53:内容特征量存储单元
54:标签信息抽取单元
55:标签信息存储单元
56:关联信息计算单元
57:内容特征量-潜在空间关联信息存储单元
58:标签信息-潜在空间关联信息存储单元
59:内容特征量-潜在空间转换单元
60:标签信息-潜在空间转换单元
61:潜在空间偏差计算单元
62:标签选择单元
63:内容选择单元
111:环境信息抽取单元
112:环境信息存储单元
113:环境信息-潜在空间关联信息存储单元
151:喜好信息抽取单元
152:喜好信息存储单元
153:喜好信息-潜在空间关联信息存储单元
171:文本存储单元
181:特性-特征计算单元
182:特征-短语选择单元
183:短语显示控制单元
184:显示单元
201:客户终端设备
具体实施方式
通过参考如下图表来说明本发明的实施例。
图1是显示内容提供设备中使用的硬件的典型配置的说明方框图。
在图1所示的内容提供设备1中,CPU(中央处理单元)11通过执行每个都存储于ROM(只读存储器)12中的程序或者每个都从记录单元18中载入RAM(随机存取存储器)13的程序来进行各种处理。RAM 13还用于适当地存储各种信息,诸如在处理的执行中CPU 11所需的数据。
CPU 11、ROM 12和RAM 13通过总线14相互连接。总线14还被连接于输入/输出接口15。
输入/输出接口15还被连接于输入单元16、输出单元17、上面引用的记录单元18和通信单元19。输入单元16包括键盘和鼠标,而输出单元17包括诸如LCD(液晶显示器)单元的显示单元和扬声器。记录单元18具有典型包括硬盘的配置。通信单元19是用于通过诸如因特网的网络来控制与其他设备之间的通信处理的单元。
如果必要,输入/输出接口15还被连接于在其上安装了可移动记录介质21的驱动器20。可移动记录介质21可以是磁盘、光盘、磁光盘或者半导体存储器。当可移动记录介质21被安装在驱动器20上时,如果必需,驱动器20从可移动记录介质21读出计算机程序并把该程序安装在记录单元18中。
要注意,内容提供设备1中使用的硬件的配置决不局限于图1所示的那样。也就是说,内容提供设备1可以被提供有任何硬件配置,只要该硬件包括至少如稍后将参考图2所描述的一个功能配置即可。
图2是显示内容提供设备1的典型功能配置的功能方框图。
内容提供设备1是进行诸如典型地从所记录的内容中抽取特征量的处理和把所抽取的特征量(或者稍后将描述的内容特征量)与关键词(或者稍后将描述的标签信息)相关联的处理的预定处理的设备。内容提供设备1是由本发明提供的典型的信息处理设备。
内容提供设备1包括内容存储单元51、内容特征量抽取单元52、内容特征量存储单元53、标签信息抽取单元54、标签信息存储单元55、关联信息计算单元56、内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58、内容特征量-潜在空间转换单元59、标签信息-潜在空间转换单元60、潜在空间偏差计算单元61、标签选择单元62和内容选择单元63。
内容特征量抽取单元52从存储(或保存)于内容存储单元51中的内容中抽取内容特征量。内容特征量抽取单元52把所抽取的内容特征量存储于内容特征量存储单元53中。
在这种情况下,所存储的内容一般仅仅指的是内容。内容的示例是各种信息、书籍、句子和数据库。作为内容所使用的信息包括电视节目、电影、照片和音乐作品(运动图片、静态图片、声音或它们的组合)。要注意,在下面描述的实施例中,音乐内容,即用作内容的一段音乐,被视为典型内容。
内容特征量是表述内容的特征的数值。例如,在音乐内容的情况下,每个都由数值表述的特征作为一段音乐的特征,包括这段音乐的速度(节奏)、欢快度和声压。例如,音乐内容的欢快度是用于指示一段大调音乐是一段欢快的音乐而一段小调音乐是一段忧郁的音乐。声压是当相比于无声音存在的状态而有声音存在时所应用的压力。
标签信息抽取单元54抽取关于存储(或保存)于内容存储单元51中的内容的标签信息。标签信息抽取单元54把所抽取的标签信息存储(或保存)于标签信息存储单元55中。
关于内容的标签信息是显示内容的属性的信息。更具体地,关于内容的标签信息是显示内容特有的属性的信息。关于内容的标签信息可以被用于识别被包括在例如评论内容的句子、内容的歌词、内容标题或作为内容的运动图片的断续器(ticker)中的单词、符号或标记。关于内容的标签信息还可以被用于给内容分配诸如权重的量。
关联信息计算单元56计算关联存储于内容特征量存储单元53中的内容特征量和存储于标签信息存储单元55中的标签信息的信息。关联信息计算单元56把所计算的对于内容特征量的关联信息存储于内容特征量-潜在空间关联信息存储单元57并把所计算的对于标签信息的关联信息存储于标签信息-潜在空间关联信息存储单元58。
如稍后将详细描述的,关联信息被定义为用于关联内容与标签信息的信息。关联信息通过利用将稍后描述的潜在变量zk来关联内容与标签信息。
基于存储于内容特征量-潜在空间关联信息存储单元57中的关联信息,内容特征量-潜在空间转换单元59进行转换处理以把所抽取的内容特征量放置于潜在空间中。内容特征量-潜在空间转换单元59把转换处理的结果供应给潜在空间偏差计算单元61。
基于存储于标签信息-潜在空间关联信息存储单元58中的关联信息和从内容特征量-潜在空间转换单元59中接收的作为由内容特征量-潜在空间转换单元59进行的以把所抽取的内容特征量放置于潜在空间中的转换处理的结果的转换处理结果,潜在空间偏差计算单元61计算内容与每个标签之间的偏差。潜在空间偏差计算单元61把所计算的偏差供应给标签选择单元62。
标签选择单元62基于从潜在空间偏差计算单元61中接收的所计算的偏差来选择标签。
基于存储于标签信息-潜在空间关联信息存储单元58中的关联信息,标签信息-潜在空间转换单元60进行转换处理以把所处理的标签放置于潜在空间中。标签信息-潜在空间转换单元60把转换处理的结果供应给潜在空间偏差计算单元61。
基于存储于内容特征量-潜在空间关联信息存储单元57中的关联信息和从标签信息-潜在空间转换单元60中接收的作为由标签信息-潜在空间转换单元60进行的以把所处理的标签放置于潜在空间中的转换处理的结果的转换处理结果,潜在空间偏差计算单元61计算每个内容与标签之间的偏差。潜在空间偏差计算单元61把计算的偏差提供给内容选择单元63。
内容选择单元63基于从潜在空间偏差计算单元61中接收的所计算的偏差来选择内容。
在上述实施例中,内容特征量-潜在空间关联信息存储单元57和标签信息-潜在空间关联信息存储单元58是彼此分离的。然而,要注意,这两个单元还可以被集成为单一单元。在这种情况下,作为集成内容特征量-潜在空间关联信息存储单元57和标签信息-潜在空间关联信息存储单元58的结果所得到的单一单元被用于存储对于内容特征量的关联信息和对于标签信息的关联信息。
顺带提及,由内容提供设备1进行的处理可以被分为两大类。第一类是关联内容特征量与标签信息的学习处理。在下面的描述中,学习处理还被称为学习阶段。第二类是用于进行实际操作的操作处理。在下面的描述中,操作处理还被称为操作阶段。在典型的操作处理中,通过利用在学习阶段彼此关联的内容特征量和标签信息之间的关系来将标签贴在另一内容上。在另一种典型的操作处理中,内容被搜索。在本说明书中,首先,学习阶段通过参考图3至13来说明。然后,操作阶段通过参考图14至16来描述。
首先,由图2所示的内容提供设备1进行的学习处理通过下面参考图3所示的流程图来说明。
在步骤S11,内容特征量抽取单元52从内容中抽取内容特征量并把所抽取的内容特征量存储(或保存)于内容特征量存储单元53中。例如,在步骤S11,内容特征量抽取单元52从存储于内容存储单元51中的内容中抽取诸如每个音乐内容的速度、欢快度和声压的内容特征量,并且把所抽取的内容特征量存储于内容特征量存储单元53中。
具体地,让我们假设例如内容1至10已经被存储于内容存储单元51中作为音乐内容。在这种情况下,内容特征量抽取单元52抽取如图4所示的那些的内容特征量。
图4是显示音乐内容的典型特征量的图表。
在图4所示的典型表格中,第一列和第一行各自显示项目。第一列上显示的项目每个都是存储于内容存储单元51中的音乐内容的名字。另一方面,第一行所示的项目每个都是对于第一列上显示的音乐内容的内容特征量的名字。在这种情况下,典型地,对于每个音乐内容的内容特征量是对于音乐内容的速度、欢快度和声压。
第一行所示的作为从左侧起第二个项目的项目是被称为音乐内容的速度的内容特征量。该速度是表述所抽取的内容特征量的数值。典型地,速度的数值指示,数值越接近于0,音乐内容的速度越低(或音乐内容的节奏越慢),而数值越接近于100,音乐内容的速度越高(或音乐内容的节奏越快)。
用相同的方式,第一行所示的作为从左侧起第三个项目的项目是被称为音乐内容的欢快度的内容特征量。典型地,欢快度的数值指示,数值越接近于0,对于音乐内容的感觉越忧郁(或音乐内容越接近于小调音乐),而数值越接近于100,对于音乐内容的感觉越欢快(或音乐内容越接近于大调音乐)。以同样的方式,第一行所示的作为从左侧起第四个项目的项目是被称为音乐内容的声压的内容特征量。典型地,声压的数值指示,数值越接近于0,声压越低,数值越接近于100,声压越高。
也就是说,如图4所示,内容特征量抽取单元52从第二行所示的内容1中抽取典型速度数值71、典型欢快度数值52和典型声压数值58,作为内容特征量。用相同的方式,内容特征量抽取单元52从第三行所示的内容2中抽取典型速度数值53、典型欢快度数值65和典型声压数值67,作为内容特征量。以同样的方式,内容特征量抽取单元52从第四行所示的内容3中抽取典型速度数值47、典型欢快度数值75和典型声压数值51,作为内容特征量。同样地,内容特征量抽取单元52从第五行所示的内容4中抽取典型速度数值59、典型欢快度数值55和典型声压数值48,作为内容特征量。
类似地,内容特征量抽取单元52从第六行所示的内容5中抽取典型速度数值57、典型欢快度数值52和典型声压数值59,作为内容特征量。用相同的方式,内容特征量抽取单元52从第七行所示的内容6中抽取典型速度数值39、典型欢快度数值39和典型声压数值31,作为内容特征量。以同样的方式,内容特征量抽取单元52从第八行所示的内容7中抽取典型速度数值45、典型欢快度数值55和典型声压数值40,作为内容特征量。
同样地,内容特征量抽取单元52从第九行所示的内容8中抽取典型速度数值34、典型欢快度数值34和典型声压数值34,作为内容特征量。类似地,内容特征量抽取单元52从第十行所示的内容9中抽取典型速度数值39、典型欢快度数值27和典型声压数值45,作为内容特征量。用相同的方式,内容特征量抽取单元52从第十一行所示的内容10中抽取典型速度数值36、典型欢快度数值45和典型声压数值46,作为内容特征量。
然后,内容特征量抽取单元52把图4所示的每个内容特征量存储于内容特征量存储单元53中作为从内容1到10中抽取的内容特征量。
换句话说,内容特征量抽取单元52可以说是从存储于内容存储单元51中的作为使得其上贴了标签信息的内容的每个音乐内容中抽取内容特征量,并把所抽取的内容特征量存储于内容特征量存储单元53中作为对于音乐内容的向量。
在上述实施例中,从音乐内容中抽取的典型内容特征量是内容的速度、欢快度和声压。然而,要注意,本发明的实现决不局限于本实施例。例如,从所处理的音乐内容中抽取的内容特征量还可以是关于音乐内容的另一特征量。关于音乐内容的其它特征量的例子有音乐内容的码(code)、码进程和声源类型。
让我们返回参考图3所示的流程图。在步骤S12,标签信息抽取单元54抽取标签信息,并把所抽取的标签信息存储(或保存)于标签信息存储单元55中。例如,在步骤S12,标签信息抽取单元54从评论存储于内容存储单元51中的内容的文本中抽取标签信息,并且把所抽取的标签信息存储于标签信息存储单元55中。关于作为对于音乐内容的标签信息的单词的所抽取的标签信息的例子是在评论该内容的文本中该单词被使用的次数。
具体地,让我们假设例如内容1至10已经被存储于内容存储单元51中。在这种情况下,对于评论内容1至10的文本,标签信息抽取单元54进行词素分析以把评论内容的每个文本划分为单词,并抽取如图5所示的那些的标签信息。如图所示,标签信息是从词素分析中得到的词在评论内容1到10的文本中被使用的次数。
图5是显示音乐内容的典型标签信息的图表。
在图5所示的典型表格中,第一列和第一行各自显示项目。第一列上所示的项目是存储于内容存储单元51中的每个音乐内容的名字。另一方面,第一行上所示的项目是关于第一列上所示的音乐内容的每个标签信息。在该典型表格中,标签信息的名字是用于评论音乐内容的每个文本中的单词“舒适的”、“愉快的”、“疯狂的”、“沉重的”和“轻快的”。
第一行所示的作为从左侧起第二个项目的项目是用作关于每个音乐内容的标签信息的单词“舒适的”。用作关于每个音乐内容的标签信息的单词“舒适的”代表在评论一个音乐内容的每个文本中单词“舒适的”出现的次数。用相同的方式,第一行所示的作为从左侧起第三个项目的项目是用作关于每个音乐内容的标签信息的单词“愉快的”。用作关于每个音乐内容的标签信息的单词“愉快的”代表在评论一个音乐内容的每个文本中单词“愉快的”出现的次数。以同样的方式,第一行所示的作为从左侧起第四、五、六个项目的其余项目是用作关于每个音乐内容的标签信息的单词“疯狂的”、“沉重的”和“轻快的”。用作关于每个音乐内容的标签信息的单词“疯狂的”、“沉重的”和“轻快的”各自代表在评论一个音乐内容的每个文本中单词“疯狂的”、“沉重的”和“轻快的”分别出现的次数。
也就是说,标签信息抽取单元54从评论第二行所示的内容1的文本中抽取标签信息,作为指示如图5所示的在文本中单词“疯狂的”使用的次数典型地为2而在文本中单词“轻快的”使用的次数典型地为2的信息。用相同的方式,由标签信息抽取单元54从评论第三行所示的内容2的文本中抽取的标签信息指示,如图所示,在文本中单词“愉快的”使用的次数典型地为1,在文本中单词“疯狂的”使用的次数典型地为1,在文本中单词“轻快的”使用的次数典型地为1。以同样的方式,由标签信息抽取单元54从评论第四行所示的内容3的文本中抽取的标签信息指示,如图所示,在文本中单词“愉快的”使用的次数典型地为2,在文本中单词“疯狂的”使用的次数典型地为2。同样地,由标签信息抽取单元54从评论第五行所示的内容4的文本中抽取的标签信息指示,如图所示,在文本中单词“疯狂的”使用的次数典型地为1,在文本中单词“轻快的”使用的次数典型地为1。
类似地,由标签信息抽取单元54从评论第六行所示的内容5的文本中抽取的标签信息指示,如图所示,在文本中单词“疯狂的”使用的次数典型地为1,在文本中单词“轻快的”使用的次数典型地为1。用相同的方式,由标签信息抽取单元54从评论第七行所示的内容6的文本中抽取的标签信息指示,如图所示,在文本中单词“舒适的”使用的次数典型地为1,在文本中单词“沉重的”使用的次数典型地为1。以同样的方式,由标签信息抽取单元54从评论第八行所示的内容7的文本中抽取的标签信息指示,如图所示,在文本中单词“疯狂的”使用的次数典型地为1。
同样地,由标签信息抽取单元54从评论第九行所示的内容8的文本中抽取的标签信息指示,如图所示,在文本中单词“舒适的”使用的次数典型地为1,而在文本中单词“沉重的”使用的次数典型地为2。类似地,由标签信息抽取单元54从评论第十行所示的内容9的文本中抽取的标签信息指示,如图所示,在文本中单词“舒适的”使用的次数典型地为1。用相同的方式,由标签信息抽取单元54从评论第十一行的内容10的文本中抽取的标签信息指示,如图所示,在文本中单词“舒适的”使用的次数典型地为2。
标签信息抽取单元54把如图5所示的每条信息存储于标签信息存储单元55中作为从内容1到10中抽取的标签信息。
在上述实施例中,单词“舒适的”、“愉快的”、“疯狂的”、“沉重的”和“轻快的”都被作为标签信息的例子。然而,要注意,本发明的实现决不局限于本实施例。例如,单词“快速的”、“放松的”和“缓慢的”也可以作为标签信息。也就是说,任何单词都可以作为对于音乐内容的标签信息,只要该单词被用在评论内容的文本中。
让我们返回参考图3所示的流程图。在步骤S13,关联信息计算单元56进行寻找对于内容特征量的关联信息和对于标签信息的关联信息的处理。然后,关联信息计算单元56把对于内容特征量的关联信息和对于标签信息的关联信息分别存储于内容特征量-潜在空间关联信息存储单元57和标签信息-潜在空间关联信息存储单元58中作为处理结果。然后,学习处理最终结束。
下面参考图6所示的流程图来说明在步骤S13由关联信息计算单元56进行的寻找关联内容特征量与标签信息的信息的处理的细节。
在步骤S21,关联信息计算单元56计算关联存储于内容特征量存储单元53中的内容特征量和存储于标签信息存储单元55的标签信息的信息。
下面说明关联内容特征量与标签信息的信息的细节。通常,内容特征量的分布不同于通过关联信息而被关联于内容特征量的标签信息的分布。因此,必须把内容特征量的分布与标签信息的分布组合起来。具体地,连续量和离散量不能在相同空间被处理。因此,存在问题即如何把具有彼此不同分布的两个空间组合起来。例如,如果在连续内容特征量的情况下,诸如主成分分析、因素分析和混合正态分布(GMM(高斯混合模型))的技术在过去已经被用于对内容特征量的分布来建模。
在混合正态分布(GMM)中,观测点的出现被视作从多个潜在正态分布的出现。在本实施例中,观测点是用内容特征量表述的单独的音乐内容。通常,其潜在分布参数基于似然性推断的。EM(期望最大)算法是基于似然性来推断潜在分布参数的典型的有代表性的一种方法。基于似然性来推断潜在分布参数的其它方法包括利用贝叶斯推论概念的变值贝叶斯方法。
另一方面,音乐内容的潜在信息的建模法典型地包括PLSA(概率潜在语义分析)。如上所述,音乐内容的潜在信息包括在评论音乐内容的文本中单词使用的次数。在PLSA中,作为潜在变量的条件概率,文本和单词的同时出现被表述以便基于似然性推断它们的条件概率。
这些算法的共同点是以下事实:在每个算法中,分布参数通过利用潜在变量来确定。因此,通过使潜在变量成为共用变量,可能得到以反映分布性质为形式的潜在概念空间。在这种情况下,成为共同变量的潜在变量是用于表述内容特征量分布的潜在变量和用于表述标签信息分布的潜在变量。
因此,作为示例,下面的描述通过采用本实施例中的EM算法作为通过使潜在变量成为共同变量而发展的算法来说明参数的推论。在这种情况下,成为共同变量的潜在变量是用于内容特征量分布的混合正态分布(GMM)的潜在变量和用于标签信息分布的PLSA的潜在变量。
图7是显示在潜在变量是与内容特征量的混合正态分布(GMM)和标签信息的PLSA共用的变量的情况下的典型图形模型的图表。
在图7所示的典型图形模型中,符号zk(={z1,z2,z3,zk})表示潜在变量。符号k表示独立的潜在变量z1、z2、z3、zk的个数。通常,独立的潜在变量z1、z2、z3、zk此后共同地仅仅被称为潜在变量zk。符号sn表示内容,此后被称为内容sn。符号wi表示标签,此后被称为标签wi。符号p(sn|zk)表示内容sn出现的条件概率。用相同的方式,符号p(wi|zk)表示标签wi出现的条件概率。由先验概率p(zk)确定的潜在变量zk是对于条件概率p(sn|zk)和p(wi|zk)来说共用的潜在变量。
也就是说,潜在变量zk关联内容sn与标签wi
这里,让我们假设例如标签wi的出现是通过利用条件概率p(wi|zk)从潜在变量zk中确定的。另一方面,内容特征量的分布是通过利用对于潜在变量zk的均值向量和方差-协方差矩阵(诸如显示变量方差和对于所有变量组合的协方差的矩阵)确定的。在这种情况下,内容sn和标签wi同时出现的概率通过如下给出的式(1)来表述。
[式1]
P ( w i , s n ) = Σ k p ( w i | z k ) p ( s n | z k ) p ( z k )
= Σ k p ( w i | z k ) α k N ( f n ; μ k , s k ) - - - ( 1 )
在式1中,先验概率p(zk)等于αk(即,p(zk)=αk),并且等式p(sn|zk)通过如下给出的式(2)来表述:
[式2]
p ( s n | z k ) = N ( f n ; μ k , s k )
= 1 ( 2 Π ) F / 2 | S k | 1 / 2 exp ( - 1 2 ( f n - μ k ) T S k - 1 ( f n - μ k ) ) - - - ( 2 )
在式(2)中,符号fn表示第n个内容的内容特征量。符号μk表示对于潜在变量zk的均值向量。在下面的描述中,对于潜在变量zk的均值向量被称为均值向量μk。符号Sk表示对于潜在变量zk的方差-协方差矩阵。在下面的描述中,对于潜在变量zk的方差-协方差矩阵被称为方差-协方差矩阵Sk。符号F表示内容特征量的维数。
在这种情况下,EM算法的Q函数通过如下给出的式(3)来表述:
[式3]
Q ( θ | θ ( t ) ) = Σ n Σ i c ( w i , s n ) Σ k p ( z k | w i , s n ; θ ( t ) ) log p ( w i , s n , z k ; θ ) - - - ( 3 )
要注意,符号c(wi,sn)表示标签wi出现在内容sn中的次数或权值。符号θ(t)表示在第t次重复中的参数。
因此,从式(3),E-步骤(期望步骤)通过如下给出的式(4)来表述:
[式4]
p ( z k | w i , s n ; θ ( t + 1 ) ) = p ( w i | z k ) ( t ) α k ( t ) N ( f n ; μ k ( t ) , s k ( t ) ) Σ j p ( w i | z j ) ( t ) α j ( t ) N ( f n ; μ j ( t ) , s j ( t ) ) - - - ( 4 )
另一方面,M-步骤(最大值化步骤)通过如下给出的式(5)、(6)、(7)和(8)来表述:
[式5]
μ k ( t + 1 ) = Σ n Σ i c ( w i , s n ) p ( z k | w i , s n ; θ ( t ) ) f n Σ n Σ i c ( w i , s n ) p ( z k | w i , s n ; θ ( t ) ) - - - ( 5 )
[式6]
S k ( t + 1 ) = Σ n Σ i c ( w i , s n ) p ( z k | w i , s n ; θ ( t ) ) ( f n - μ k ) ( f n - μ k ) T Σ n Σ i c ( w i , s n ) p ( z k | w i , s n ; θ ( t ) ) - - - ( 6 )
[式7]
α k ( t + 1 ) = Σ n Σ i c ( w i , s n ) p ( z k | w i , s n ; θ ( t ) ) Σ n Σ i c ( w i , s n ) - - - ( 7 )
[式8]
p ( w i | z k ) ( t + 1 ) = Σ n c ( w i , s n ) p ( z k | w i , s n ; θ ( t ) ) Σ n Σ i c ( w i , s n ) p ( z k | w i , s n ; θ ( t ) ) - - - ( 8 )
也就是说,即为关联信息的均值向量μk、方差-协方差矩阵Sk、αk和p(wi|zk),分别依照式(5)、(6)、(7)和(8)来计算。
例如,在步骤S21,基于存储于内容特征量存储单元53中的对于内容1到10这10个音乐内容的每个的内容特征量和存储于标签信息存储单元55中的对于10个音乐内容的每个的标签信息,在其中使用了两个潜在变量z1和z2(或者使用二维潜在变量)的情况下,关联信息计算单元56依照式(1)至(8)计算μk、Sk、αk和p(wi|zk)作为关联信息。如图4所示,对于每个音乐内容的内容特征量是音乐内容的速度、欢快度和声压。另一方面,每个音乐内容的标签信息涉及如图5所示的单词“舒适的”、“愉快的”、“疯狂的”、“沉重的”和“轻快的”。
参考图8至13,下面的描述更具体地说明了由关联信息计算单元56计算的关联信息。首先,参考图8至10描述潜在空间中的内容和标签的典型位置。
图8是显示基于潜在空间的作为对于内容的典型表述的表述的图表。更具体地,图8显示了音乐内容的潜在空间表述作为根据条件概率p(zk|sn)的典型值。
在图8所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目每个都是存储于内容存储单元51中的音乐内容的名字。另一方面,第一行所示的项目是对于第一列所示的每个音乐内容的两个潜在变量。这两个潜在变量是潜在变量z1和z2
如图8所示,作为潜在变量z1的值,关联信息计算单元56产生对于第二行所示的内容1的典型的计算结果0.9,对于第三行所示的内容2的典型的计算结果0.7,对于第四行所示的内容3的典型的计算结果0.6,对于第五行所示的内容4的典型的计算结果0.65,对于第六行所示的内容5的典型的计算结果0.6,对于第七行所示的内容6的典型的计算结果0.2,对于第八行所示的内容7的典型的计算结果0.4,对于第九行所示的内容8的典型的计算结果0.1,对于第十行所示的内容9的典型的计算结果0.3和对于第十一行所示的内容10的典型的计算结果0.4。
也就是说,内容1至10中的每个都通过潜在变量z1与标签关联。
用相同的方式,如图8所示,作为潜在变量z2的值,关联信息计算单元56产生对于第二行所示的内容1的典型的计算结果0.1,对于第三行所示的内容2的典型的计算结果0.3,对于第四行所示的内容3的典型的计算结果0.4,对于第五行所示的内容4的典型的计算结果0.35,对于第六行所示的内容5的典型的计算结果0.4,对于第七行所示的内容6的典型的计算结果0.8,对于第八行所示的内容7的典型的计算结果0.6,对于第九行所示的内容8的典型的计算结果0.8,对于第十行所示的内容9的典型的计算结果0.7和对于第十一行所示的内容10的典型的计算结果0.6。
也就是说,内容1至10中的每个都通过潜在变量z2与标签关联。
图9是显示基于潜在空间的作为对于标签信息的典型表述的表述的图表。具体地,图9显示了作为标签被包含在评论音乐内容的句子中的单词的作为条件概率p(zk|wi)的典型值的潜在空间表述。
在图9所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目每个都是用于评论存储于内容存储单元51中的音乐内容的句子的标签。另一方面,第一行所示的项目是对于第一列所示的每个标签的两个潜在变量。这两个潜在变量是潜在变量z1和z2
如图9所示,作为对于潜在变量z1的值,关联信息计算单元56产生对于第二行所示的单词“舒适的”的典型的计算结果0.1,对于第三行所示的单词“愉快的”的典型的计算结果0.7,对于第四行所示的单词“疯狂的”的典型的计算结果0.7,对于第五行所示的单词“沉重的”的典型的计算结果0.2,对于第六行所示的单词“轻快的”的典型的计算结果0.9。
也就是说,每个都作为标签使用的每个单词“舒适的”、“愉快的”、“疯狂的”、“沉重的”和“轻快的”通过潜在变量z1与音乐内容关联。
用相同的方式,如图9所示,作为对于潜在变量z2的值,关联信息计算单元56产生对于第二行所示的单词“舒适的”的典型的计算结果0.9,对于第三行所示的单词“愉快的”的典型的计算结果0.3,对于第四行所示的单词“疯狂的”的典型的计算结果0.3,对于第五行所示的单词“沉重的”的典型的计算结果0.8,对于第六行所示的单词“轻快的”的典型的计算结果0.1。
也就是说,每个都作为标签使用的每个单词“舒适的”、“愉快的”、“疯狂的”、“沉重的”和“轻快的”通过潜在变量z2与音乐内容关联。
图10是显示对于潜在变量zk的典型先验概率的图表。具体地,图10显示了先验概率p(zk)=αk的典型值。
如图10给出的表格中的第二行所示,先验概率p(zk)=αk对于用作两个潜在变量zk之一的潜在变量z1,典型值为0.48,对于用作另一个潜在变量的潜在变量z2,典型值为0.52。
以这种方式,使用作为两个潜在变量zk的潜在变量z1和z2,关联信息计算单元56通过利用式(1)至(8)把音乐内容(即内容1至10)和标签(即,单词“舒适的”、“愉快的”、“疯狂的”、“沉重的”和“轻快的”)放置于潜在空间中。
此外,如上所述,关联信息计算单元56计算均值向量μk和方差-协方差矩阵Sk作为关联信息。通过参考图11至13,下面的描述说明均值向量μk和方差-协方差矩阵Sk的具体例子。
首先,通过参考图11至12,下面的描述说明通过关联信息计算单元56输出的作为对于潜在变量zk的矩阵的方差-协方差矩阵Sk
图11是显示对于潜在变量z1的典型方差-协方差矩阵S1的图表。
在图11所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目是存储于内容存储单元51中的音乐内容的内容特征量的每个(名字)。另一方面,第一行所示的项目是存储于内容存储单元51中的音乐内容的内容特征量的每个(名字)。
如图11给出的表格中的第二行所示,作为方差-协方差矩阵S1的元素,关联信息计算单元56产生对于速度列和速度行的典型的计算结果80,对于速度列和欢快度行的典型的计算结果-30,对于速度列和声压行的典型的计算结果5。
此外,用相同的方式,如图11给出的表格中的第三行所示,作为方差-协方差矩阵S1的元素,关联信息计算单元56产生对于欢快度列和速度行的典型的计算结果-30,对于欢快度列和欢快度行的典型的计算结果100,对于欢快度列和声压行的典型的计算结果-10。计算结果-30与第二行和第三列交叉处的元素相同。
此外,用相同的方式,如图11给出的表格中的第四行所示,作为方差-协方差矩阵S1的元素,关联信息计算单元56产生对于声压列和速度行的典型的计算结果5,对于声压列和欢快度行的典型的计算结果-10,对于声压列和声压行的典型的计算结果50。计算结果5与第二行和第四列的交叉处的元素相同,而计算结果-10与第三行和第四列的交叉处的元素相同。
图12是显示对于潜在变量z2的典型方差-协方差矩阵S2的图表。
在图12所示的典型表格中,第一列和第一行各自显示与图11所示的表格相同的项目。因此,省略项目的说明。
如图12给出的表格中的第二行所示,作为方差-协方差矩阵S2的元素,关联信息计算单元56产生对于速度列和速度行的典型的计算结果30,对于速度列和欢快度行的典型的计算结果30,对于速度列和声压行的典型的计算结果10。
此外,用相同的方式,如图12给出的表格中的第三行所示,作为方差-协方差矩阵S2的元素,关联信息计算单元56产生对于欢快度列和速度行的典型的计算结果30,对于欢快度列和欢快度行的典型的计算结果90,对于欢快度列和声压行的典型的计算结果0。计算结果30与第二行和第三列的交叉处的元素相同。
此外,用相同的方式,如图12给出的表格中的第四行所示,作为方差-协方差矩阵S2的元素,关联信息计算单元56产生对于声压列和速度行的典型的计算结果10,对于声压列和欢快度行的典型的计算结果0,对于声压列和声压行的典型的计算结果50。计算结果10与第二行和第四列和交叉处的元素相同,而计算结果0与第三行和第四列的交叉处的元素相同。
通过参考图13,下面的描述说明由关联信息计算单元56计算的均值向量μk作为对于潜在变量zk的均值向量。更具体地,图13是显示对于潜在变量z1的典型均值向量μ1和对于潜在变量z2的典型均值向量μ2的图表。
如图13给出的表格中的第二列所示,作为对于潜在变量z1的均值向量μl的值,关联信息计算单元56产生对于第二行的速度的典型的计算结果58,对于第三行的欢快度的典型的计算结果63,对于第四行的声压的典型的计算结果59。
此外,用相同的方式,如图13给出的表格中的第三列所示,作为对于潜在变量z2的均值向量μ2的值,关联信息计算单元56产生对于第二行的速度的典型的计算结果42,对于第三行的欢快度的典型的计算结果39,对于第四行的声压的典型的计算结果40。
如上所述,关联信息计算单元56计算对于潜在变量z1的方差-协方差矩阵S1和均值向量μ1以及对于潜在变量z2的方差-协方差矩阵S2和均值向量μ2。
在上述实施例中,由关联信息计算单元56进行的计算关联信息的处理被解释为混合正态分布(GMM)和PLSA的典型组合。然而,要注意,内容特征量的分布并不总是正态分布。例如,SAM(语义聚合模型)或者另一参数分布都可以用作内容特征量的分布。此外,用于推断参数的模型也决不局限于上述EM算法。也就是说,用于推断参数的模型可以采用另一技术。
让我们返回参考图6所示的流程图。在步骤S22,关联信息计算单元56把关联内容特征量与潜在空间的所计算的信息存储于内容特征量-潜在空间关联信息存储单元57中。
例如,关联信息计算单元56把先验概率值αk、方差-协方差矩阵Sk和均值向量μk存储于内容特征量-潜在空间关联信息存储单元57中作为对于潜在变量zk所建立的关联信息。具体地,在上述典型的关联信息的情况下,关联信息计算单元56把如图10所示的先验概率值α1和α2、如图11所示的方差-协方差矩阵S1、如图12所示的方差-协方差矩阵S2以及如图13所示的均值向量μ1和μ2存储于内容特征量-潜在空间关联信息存储单元57中。
然后,在接着的步骤S23,关联信息计算单元56把关联标签信息与潜在空间的所计算的信息存储于标签信息-潜在空间关联信息存储单元58中。然后,关联信息计算单元56最终结束计算关联信息的处理。
例如,在步骤S23,作为关联信息,关联信息计算单元56把对于潜在变量zk和标签wi的所有组合的条件概率p(wi|zk)和先验概率值αk=p(zk)存储于标签信息-潜在空间关联信息存储单元58中。具体地,在上述典型的关联信息的情况下,关联信息计算单元56存储如图9所示作为潜在变量z1和z2和标签单词“舒适的”、“愉快的”、“疯狂的”、“沉重的”和“轻快的”的条件概率p(wi|zk)的条件概率p(wi|zk)、以及如图10所示的先验概率值αk=p(zk)。
要注意,潜在空间中的内容的表述是条件概率p(zk|sn),而潜在空间中的标签的表述是条件概率p(zk|wi),其中k=1,2,k。
如上所述,通过进行学习处理,内容提供设备1把对于内容特征量的关联信息存储于内容特征量-潜在空间关联信息存储单元57中,而把对于标签信息的关联信息存储于标签信息-潜在空间关联信息存储单元58中。
换句话说,通过进行学习处理,内容提供设备1通过利用潜在变量zk,把具有分布的内容特征量和具有不同于内容特征量分布的分布的标签信息组合在一个潜在空间中。结果,内容提供设备1关联内容与标签。
以这种方式,在学习阶段,内容提供设备1通过利用潜在空间(或潜在变量zk)把具有分布的内容特征量和具有不同于内容特征量分布的分布的标签信息组合起来。
接着,参考前面提到的图14至16来说明操作阶段。操作阶段的描述开始于给内容(音乐内容)分配标签的处理的说明。然后,接着通过搜索匹配所给的关键词(标签)的内容(音乐内容)的处理的描述,进行给内容分配标签的处理的说明。
首先,参考图14所示的流程图说明由内容提供设备1进行的给音乐内容分配标签的处理。该处理典型地开始于用户添加新的音乐内容时。
在步骤S31,内容特征量抽取单元52从内容中抽取内容特征量并且把所抽取的内容特征量存储(保存)于内容特征量存储单元53中。
例如,在步骤S31,内容特征量抽取单元52从新添加的音乐内容SNEW中抽取内容特征量fNEW=(速度,欢快度和声压)=(55,65,45),并且把所抽取的内容特征量fNEW存储于内容特征量存储单元53中。
换句话说,由内容特征量抽取单元52进行的从新添加的音乐内容SNEW中抽取内容特征量的处理可以被称为把对于新添加的音乐内容SNEW的向量存储于内容特征量存储单元53中的处理。
然后,在步骤S32,基于存储于内容特征量-潜在空间关联信息存储单元57中的关联信息,内容特征量-潜在空间转换单元59进行转换处理以把所抽取的内容特征量放置于潜在空间中,并把转换处理的结果供应给潜在空间偏差计算单元61。
例如,在步骤S32,内容特征量-潜在空间转换单元59利用方差-协方差矩阵Sk和均值向量μk进行把所抽取的内容特征量fNEW=(55,65,45)放置于潜在空间中的转换处理(或映射处理)。方差-协方差矩阵Sk和均值向量μk是存储于内容特征量-潜在空间关联信息存储单元57中的关联信息。方差-协方差矩阵的例子是图11所示的方差-协方差矩阵S1和图12所示的方差-协方差矩阵S2,而均值向量μk的例子是图13所示的均值向量μ1和μ2
具体地,从内容特征量转换到潜在空间的处理是依照如下给出的式(9)利用从之前通过参考图3所示的流程图说明的学习处理得到的分布参数的计算处理。
[式9]
p ( z k | s n ) = p ( s n | z k ) p ( z k ) p ( s n )
∝ p ( s n | z k ) p ( z k ) - - - ( 9 )
= α k N ( f n ; μ k , S k )
也就是说,每个条件概率p(z1|SNEW)和p(z2|SNEW)都依照式(9)计算。
p(z1|SNEW)=p(z1)N(fNEW,μ1,S1)=0.48×1.48×10-5=7.09×10-6
p(z2|SNEW)=p(z2)N(fNEW,μ2,S2)=0.52×2.98×10-6=1.43×10-6
然后,作为上面计算的结果得到的条件概率p(z1|SNEW)5=7.09×10-6和p(z2|SNEW)=1.43×10-6被归一化,以给出条件概率p(z|SNEW)=(0.83,0.17)。
要注意,由于音乐内容的先验概率p(sn)通常不清晰,所以它们全部被作为等概率来处理。然而,所述条件概率可以通过使用所有观测值的分布来计算。
在接下来的步骤S33,基于作为把内容特征量放置于潜在空间中的转换处理结果的从内容特征量-潜在空间转换单元59中接收的转换处理结果和存储于标签信息-潜在空间关联信息存储单元58中的关联信息,潜在空间偏差计算单元61计算在内容和每个标签之间的偏差并把所计算的偏差供应给标签选择单元62。
具体地,依照如下给出的式(10),在内容和标签之间的偏差被典型地作为标签的条件概率来计算。
[式10]
p ( w i | s n ) = Σ k p ( w i | z k ) p ( z k | s n )
∝ Σ k p ( w i | z k ) α k N ( f n ; μ k , S k ) - - - ( 10 )
在内容和标签之间的偏差的计算决不局限于根据上面给出的式(10)的计算。例如在内容和标签之间的偏差也可以如Kullback-Leibler偏差或者此后简称为JS偏差的Jensen-Shannon偏差来计算。Kullback-Leibler偏差和JS偏差是代表潜在空间中的内容的表述的条件概率p(zk|sn)和代表潜在空间中的标签的表述的条件概率p(zk|wi)之间的偏差。
例如,Kullback-Leibler偏差依照如下给出的式(11)来计算。
[式11]
KL ( p ( z | s n ) | p ( z | w i ) ) = Σ k p ( z k | s n ) log p ( z k | s n ) p ( z k | w i ) - - - ( 11 )
另一方面,JS偏差典型地依照如下给出的式(12)来计算。
[式12]
JS ( p ( z | s n ) | p ( z | w i ) ) = KL ( p ( z | s n ) | 1 2 p ( z | s n ) + 1 2 p ( z | w i ) ) - - - ( 12 )
要注意,实际上,即使潜在空间不是欧几里得空间,为了简化计算处理,在内容和标签之间的偏差还可能例如作为欧几里得偏差或对应于K的差异之和来计算,其中K是潜在变量的个数。
也就是说,基于从内容特征量-潜在空间转换单元59中接收的被存储于标签信息-潜在空间关联信息存储单元58中的条件概率p(z|SNEW)=(0.83,0.17)和条件概率p(wi|zk)和先验概率αk=p(zk),潜在空间偏差计算单元61通过利用式(12)来计算存在于潜在空间中的内容和每个标签之间的偏差(或者,严格地说,JS偏差)。
图15是显示每个都由潜在空间偏差计算单元61计算的作为内容和标签之间的典型偏差的偏差的图表。
在图15所示的典型表格中,例如,第一列显示存储于标签信息-潜在空间关联信息存储单元58中的标签(或单词)而第二列显示由潜在空间偏差计算单元61计算的作为内容和第一行所示的标签之间偏差的偏差。要注意,图15显示依照式(12)计算的典型偏差作为内容和标签之一之间的JS偏差。
如图15所示,潜在空间偏差计算单元61给出第二行所示的典型JS偏差0.3000作为音乐内容SNEW和标签单词“舒适的”之间的偏差,第三行所示的典型JS偏差0.0119作为音乐内容SNEW和标签单词“愉快的”之间的偏差和第四行所示的典型JS偏差0.0119作为音乐内容SNEW和标签单词“疯狂的”之间的偏差。
用相同的方式,如图15所示,潜在空间偏差计算单元61给出第五行所示的典型JS偏差0.2150作为音乐内容SNEW和标签单词“沉重的”之间的偏差,第六行所示的典型JS偏差0.0053作为音乐内容SNEW和标签单词“轻快的”之间的偏差。
以这种方式,例如,潜在空间偏差计算单元61产生图15所示的所计算的偏差作为内容和标签之间的偏差,并把偏差供应给标签选择单元62。
让我们返回参考图14所示的流程图。在步骤S34,基于从潜在空间偏差计算单元61中接收的结果偏差,标签选择单元62来选择标签。然后,给内容分配标签的处理最终结束。
让我们假设例如从潜在空间偏差计算单元61中接收的结果偏差是图15所示的作为内容和标签之间的偏差的偏差。在这种情况下,在步骤S34,标签选择单元62选择具有典型JS偏差0.0053的标签单词“轻快的”、具有典型JS偏差0.0119的标签单词“愉快的”,作为每个都具有微小JS偏差的两个标签,把所选标签分配给新添加的音乐内容SNEW
要注意,分配给新添加的音乐内容SNEW的标签数量决不局限于上述两个。例如,任何数量的标签都可以被选为内容和标签之间的偏差,只要标签每个都具有小于门限值的偏差。作为替换,可以在所有标签中选择N个标签作为具有最小偏差的标签,其中N为整数。
此外,由标签选择单元62选择的标签作为分配给内容的标签可以典型地被显示在输出单元17的屏幕上,以便允许用户直接看到标签。作为替换,标签可以被保存为元数据以便例如在应用于搜索标签所分配给的内容的处理中使用。
以这种方式,内容提供设备1给内容分配更适宜的标签。
如上所述,依靠反映内容特征量分布性质和标签信息分布性质的潜在空间(或潜在变量),内容提供设备1能够甚至给没有标签的内容分配更适宜的标签。结果,由于减少了大量给内容分配关键词(或标签)的人力劳动,因此也降低了成本。
参考图16所示的流程图,下面的描述说明由内容提供设备1进行的搜索内容的处理。要注意,本处理开始于例如用户通过操作用户界面来输入命令以搜索匹配预定标签的内容时。
在步骤S41,标签信息-潜在空间转换单元60基于存储于标签信息-潜在空间关联信息存储单元58中的关联信息来进行转换处理,以把所处理的标签放置于潜在空间中,并且把转换处理的结果供应给潜在空间偏差计算单元61。
让我们假设例如用户输入标签单词“愉快的”作为命令。在这种情况下,在步骤S41,基于对于潜在变量zk和标签wi的每个组合而存储于标签信息-潜在空间关联信息存储单元58中的条件概率p(wi|zk)和先验概率αk=p(zk),标签信息-潜在空间转换单元60进行转换(映射)处理以把标签单词“愉快的”放置于潜在空间中,并且把条件概率p(zk|wi)供应给潜在空间偏差计算单元61作为转换处理的结果。
具体地,转换(映射)处理依照如下给出的式(13)进行。
[式13]
p ( z k | w i ) = p ( w i | z k ) p ( z k ) p ( w i ) - - - ( 13 )
∝ p ( w i | z k ) p ( z k )
要注意,由于先验概率p(wi)通常不清晰,所以它们全部作为等概率处理。然而,计算可以通过使用所有观测值的分布来进行。
在步骤S42,基于从标签信息-潜在空间转换单元60中接收的作为把标签信息放置于潜在空间中的转换处理的结果的转换处理结果和存储于内容特征量-潜在空间关联信息存储单元57中的关联信息,潜在空间偏差计算单元61计算标签和内容之间的偏差并把所计算的偏差供应给内容选择单元63。
让我们假设例如从标签信息-潜在空间转换单元60中接收的转换处理结果是条件概率p(zk|wi),而存储于内容特征量-潜在空间关联信息存储单元57中的关联信息是对于每个潜 在变量zk的先验概率αk、方差-协方差矩阵Sk,和均值向量μk。在这种情况下,在步骤S42,潜在空间偏差计算单元61依照式(12),基于条件概率p(zk|wi)以及先验概率αk、方差-协方差矩阵Sk,和均值向量μk,来计算存在于潜在空间中的内容和标签之间的偏差。
要注意,计算内容和标签之间的偏差的方法决不局限于如图14所示的步骤S33进行的处理的依照式(12)计算JS偏差的方法。也就是说,内容和标签之间的偏差也可以作为依照式(10)的标签的条件概率、依照式(11)的Kullback-Leibler偏差、欧几里得偏差或者其它偏差被计算。
图17是当用户输入单词“愉快的”作为标签时显示由潜在空间偏差计算单元计算的作为内容和标签之间的典型偏差的典型偏差的图表。
潜在空间偏差计算单元61给出图17所示的表格的第二行的典型JS偏差0.3100作为内容1和作为标签输入的单词“愉快的”之间的偏差。用相同的方式,潜在空间偏差计算单元61给出图17所示的表格的第三行的典型JS偏差0.0051作为内容2和作为标签输入的单词“愉快的”之间的偏差。以同样的方式,潜在空间偏差计算单元61给出图17所示的表格中的第四行的典型JS偏差0.0022作为内容3和作为标签输入的单词“愉快的”之间的偏差。同样,潜在空间偏差计算单元61给出图17所示的表格的第五行的典型JS偏差0.1114作为内容4和作为标签输入的单词“愉快的”之间的偏差。类似地,潜在空间偏差计算单元61给出图17所示的表格的第六行的典型JS偏差0.2547作为内容5和作为标签输入的单词“愉快的”之间的偏差。
类似地,潜在空间偏差计算单元61给出图17所示的表格的第七行的典型JS偏差0.0947作为内容6和作为标签输入的单词“愉快的”之间的偏差。用相同的方式,潜在空间偏差计算单元61给出图17所示的表格的第八行的典型JS偏差0.1473作为内容7和作为标签输入的单词“愉快的”之间的偏差。以同样的方式,潜在空间偏差计算单元61给出图1 7所示的表格的第九行的典型JS偏差0.4123作为内容8和作为标签输入的单词“愉快的”之间的偏差。类似地,潜在空间偏差计算单元61给出图17所示的表格的第十行的典型JS偏差0.1119作为内容9和作为标签输入的单词“愉快的”之间的偏差。类似地,潜在空间偏差计算单元61给出图17所示的表格的第十一行的典型JS偏差0.3451作为内容10和作为标签输入的单词“愉快的”之间的偏差。
类似地,潜在空间偏差计算单元61给出图17所示的表格的第十二行的典型JS偏差0.0049作为内容11和作为标签输入的单词“愉快的”之间的偏差。内容11是在图14所示的流程图所表示的处理中已经被分配了作为标签的单词“轻快的”和“愉快的”的新添加的音乐内容SNEW
如上所述,潜在空间偏差计算单元61产生如图17所示的标签和内容之间的偏差的典型偏差,并把偏差供应给内容选择单元63。
让我们返回参考图16所示的流程图。在步骤S43,基于从潜在空间偏差计算单元61中接收的作为偏差计算结果的偏差,内容选择单元63选择内容。然后,搜索内容的处理最终结束。
让我们假设由内容选择单元63从潜在空间偏差计算单元61中接收的作为偏差计算结果的偏差是图17所示的作为标签和内容间偏差的JS偏差。在这种情况下,在步骤S43,内容选择单元63选择三个内容,即具有0.0022的典型JS偏差的内容3、具有0.0049的典型JS偏差的内容11、具有0.005 1的典型JS偏差的内容2,典型地在输出单元17的屏幕上显示关于所选内容的信息。
要注意,所选内容的数量决不局限于三个。例如,任何数量的内容都可以被选择,只要内容每个都具有小于门限值的偏差作为内容和标签之间的偏差。作为替换,可以在所有内容中选择N个内容作为具有最小偏差的内容,其中N为整数。
此外,如上所述,将被选择的内容也不局限于在学习阶段使用的内容。也就是说,稍后在处理阶段新加入的内容也可以作为将被选择的内容的候选者。稍后在操作阶段新加入的内容的例子是音乐内容SNEW
此外,能够提供配置,其中,通过利用其它数据预先构造模型作为包括大量标签的辅助模型。如果标签是单词,则其它数据可以是总的文集和/或其内容所属的范围内的文本。在这种情况下,如果标签信息-潜在空间关联信息存储单元58中不存在由用户指定的标签,包括在辅助模型中的已知标签作为最接近所指定的未知标签的标签可以被用于给用户的询问中作为对于指定标签的替代。已知标签是在学习处理中所知的标签。
以这种方式,内容提供设备1搜索对于特定标签的内容。
如上所述,依靠反映内容特征量的分布性质和标签信息的分布性质的潜在空间(或潜在变量),内容提供设备1能够搜索对于特定标签的内容。
顺带提及,在上述实施例中,内容特征量被关联于标签。然而,本发明的实现决不局限于本实施例。例如,标签信息和/或内容特征量可以与稍后描述的环境信息相关联。作为替换,标签信息和/或内容特征量可以与同样稍后描述的喜好信息相关联。
首先,参考图18至21描述标签信息和/或内容特征量与环境信息的关联。
图18是显示内容提供设备的另一典型功能配置的功能方框图。
要注意,不再说明在图18所示的配置中与图2所示的其对应部分的相同位置上放置的并且以相同标号作为对应部分表示的对应部分的配置元件,以避免重复说明。图18所示的内容提供设备1通过向方框图图2所示的配置上添加环境信息抽取单元111、环境信息存储单元112和环境信息-潜在空间关联信息存储单元113得到。
环境信息抽取单元111抽取环境信息,即涉及存储于内容存储单元51中的内容的信息。环境信息抽取单元111把所抽取的环境信息存储(或保存)于环境信息存储单元112中。
涉及内容的环境信息被定义为当用户利用内容时得到的作为除了关于内容本身的信息以外的信息。环境信息的例子是关于内容利用的场合出现的时间、季节、地点、天气、感觉和人的信息。
关联信息计算单元56计算关联存储于内容特征量存储单元53中的内容特征量与存储于标签信息存储单元55中的标签信息的信息。关联信息计算单元56把对于内容特征量所计算的关联信息存储(或保存)于内容特征量-潜在空间关联信息存储单元57中,并把对于标签信息所计算的关联信息存储(或保存)于标签信息-潜在空间关联信息存储单元58中。
此外,关联信息计算单元56计算关联存储于环境信息存储单元112中的环境信息与存储于标签信息存储单元55中的标签信息的信息。关联信息计算单元56把对于标签信息所计算的关联信息存储(或保存)于标签信息-潜在空间关联信息存储单元58中,并把对于环境信息所计算的关联信息存储(或保存)于环境信息-潜在空间关联信息存储单元113中。
另外,关联信息计算单元56计算关联存储于内容特征量存储单元53中的内容特征量与存储于环境信息存储单元112中的环境信息的信息。关联信息计算单元56把对于内容特征量所计算的关联信息存储(或保存)于内容特征量-潜在空间关联信息存储单元57中,并把对于环境信息所计算的关联信息存储(或保存)于环境信息-潜在空间关联信息存储单元113中。
要注意,在这种情况下,关联信息彼此关联内容、标签和环境。也就是说,关联信息通过利用潜在变量zk彼此链接内容、标签和环境。
在上述实施例中,内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58和环境信息-潜在空间关联信息存储单元113彼此分离。然而,要注意,内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58和环境信息-潜在空间关联信息存储单元113还可以集成为单一的单元。在这种情况下,作为集成内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58和环境信息-潜在空间关联信息存储单元113的结果所得到的单一单元被用于存储所有的关联信息。
接着,如下参考图19所示的流程图来说明由图18所示的内容提供设备1进行的学习处理。
在步骤S51和步骤S52进行的处理分别与在图3所示的步骤S11和步骤S12进行的处理相同。因此,省略步骤S51和S52的说明。
在步骤S53,环境信息抽取单元111抽取关于存储于内容存储单元51中的内容的环境信息,并把所抽取的环境信息存储(或保存)于环境信息存储单元112中。例如,由环境信息抽取单元111在步骤S53抽取的作为关于存储于内容存储单元51中的音乐内容的环境信息,是音乐内容被收听的时间段或音乐内容被收听的地点。环境信息抽取单元111把所抽取的关于时间段的信息或所抽取的关于地点的信息存储于环境信息存储单元112中作为环境信息。
具体地,让我们假设例如存储于内容存储单元51中的音乐内容是内容1至10。在这种情况下,环境信息抽取单元111抽取如图20所示的典型的环境信息。
图20是显示对于音乐内容的典型环境信息的图表。
在图20所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目每个都是存储于内容存储单元51中的音乐内容的名字。另一方面,第一行所示的项目每个都是关于第一列所示的每个音乐内容的环境信息的名字。该环境信息的名字是早晨、白天、夜晚、家中、户外和通勤中。早晨、白天和夜晚的环境信息是关于音乐内容被收听的时间段的信息。另一方面,家中、户外和通勤中的信息是关于音乐内容被收听的地点的信息。
如图20的第二行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容1在早晨、白天和夜晚时间段分别被收听三次、四次和两次,而在家中、户外和通勤中的音乐收听地域分别被收听两次、三次和四次。用相同的方式,如图20的第三行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容2在早晨、白天和夜晚时间段分别被收听五次、四次和两次,而在家中、户外和通勤中的音乐接听地域分别被收听三次、两次和三次。以同样的方式,如图20的第四行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容3在早晨、白天和夜晚时间段分别被收听三次、三次和一次,而在家中、户外和通勤中的音乐接听地域分别被收听三次、三次和五次。类似地,如图20的第五行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容4在早晨、白天和夜晚时间段分别被收听四次、三次和两次,而在家中、户外和通勤中的音乐接听地域分别被收听两次、三次和三次。
用相同的方式,如图20的第六行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容5在早晨、白天和夜晚时间段分别被收听四次、两次和三次,而在家中、户外和通勤中的音乐接听地域分别被收听两次、两次和四次。以同样的方式,如图20的第七行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容6在早晨、白天和夜晚时间段分别被收听两次、三次和四次,而在家中、户外和通勤中的音乐接听地域分别被收听三次、三次和两次。类似地,如图20的第八行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容7在早晨、白天和夜晚时间段分别被收听三次、一次和三次,而在家中、户外和通勤中的音乐接听地域分别被收听三次、三次和两次。
用相同的方式,如图20的第九行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容8在早晨、白天和夜晚时间段分别被收听一次、两次和五次,而在家中、户外和通勤中的音乐接听地域分别被收听四次、三次和三次。以同样的方式,如图20的第十行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容9在早晨、白天和夜晚时间段分别被收听两次、两次和四次,而在家中、户外和通勤中的音乐接听地域分别被收听五次、两次和两次。类似地,如图20的第十一行所示,环境信息抽取单元111抽取典型的环境信息,其指示内容10在早晨、白天和夜晚时间段分别被收听一次、两次和三次,而在家中、户外和通勤中的音乐接听地域分别被收听四次、三次和三次。
让我们返回参考图19所示的流程图。在步骤S54,基于存储于内容特征量存储单元53中的内容特征量、存储于标签信息存储单元55中的标签信息或者存储于环境信息存储单元112中的环境信息,关联信息计算单元56进行寻找对于内容特征量、标签信息和环境信息的关联信息的处理。关联信息计算单元56把从寻找对于内容特征量的关联信息、对于标签信息的关联信息和对于环境信息的关联信息的处理得到的结果分别存储于内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58和环境信息-潜在空间关联信息存储单元113中作为处理结果。然后,学习处理最终结束。
在这种情况下,可以以如内容特征量和标签信息之间的关系一样的上述关系的相同方式,通过利用对于具有共用的潜在变量zk并且采用与前述方法相同的方法、即与如图3所示的步骤S13进行的处理相同的方法的内容特征量和标签信息的各自的分布关系,来计算对于内容特征量、标签信息或环境信息的潜在空间表述。
也就是说,关联信息计算单元56以与如图3所示的S13进行的处理相同的方式,计算对于内容特征量、标签和环境的关联信息。
具体地,环境信息被预先存储(或保存),作为指示每个音乐内容在早晨、白天和夜晚时间段被收听了多少次,以及在正如图20所示的典型环境信息的家中、户外和通勤中的音乐接听地域被收听了多少次的信息。然后,关联信息计算单元56基于图4所示的内容特征量、如图5所示的标签信息和如图20所示的环境信息来计算关联信息。
图21是显示基于潜在空间的作为对于环境信息的表述的典型表述的图表。
在图21所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目每个都是环境。另一方面,第一行所示的项目是两个潜在变量,即对于第一列所示的每个环境的潜在变量z1和z2。
如图21给出的表格的第二列所示,关联信息计算单元56给出(对于潜在变量z1的)典型的条件概率值0.8作为对于第二行的早晨时间段的计算结果,(对于潜在变量z1的)典型的条件概率值0.7作为对于第三行的白天时间段的计算结果,(对于潜在变量z1的)典型的条件概率值0.23作为对于第四行的夜晚时间段的计算结果,(对于潜在变量z1的)典型的条件概率值0.3作为对于第五行的家中内容收听地域的计算结果,(对于潜在变量z1的)典型的条件概率值0.45作为对于第六行的户外内容收听地域的计算结果,以及(对于潜在变量z1的)典型的条件概率值0.9作为对于第七行的工作地内容收听地域的计算结果。
也就是说,早晨、白天和夜晚、家中、户外和通勤中环境的每一个都通过利用潜在变量z1的值与内容或标签关联。
用相同的方式,如图21给出的表格的第三列所示,关联信息计算单元56给出(对于潜在变量z2的)典型的条件概率值0.2作为对于第二行的早晨时间段的计算结果,(对于潜在变量z2的)典型的条件概率值0.3作为对于第三行的白天时间段的计算结果,(对于潜在变量z2的)典型的条件概率值0.77作为对于第四行的夜晚时间段的计算结果,(对于潜在变量z2的)典型的条件概率值0.7作为对于第五行的家中内容收听地域的计算结果,(对于潜在变量z2的)典型的条件概率值0.55作为对于第六行的户外内容收听地域的计算结果,以及(对于潜在变量z2的)典型的条件概率值0.2作为对于第七行的工作地内容收听地域的计算结果。
也就是说,早晨、白天和夜晚、家中、户外和通勤中环境的每一个都通过利用潜在变量z2的值与内容或标签关联。
以这种方式,依照本发明,对于诸如内容1至10的每个音乐内容,关于内容在早晨、白天和夜晚时间段以及在家中、户外和工作地的内容接听地域被收听的次数的信息被预先存储作为环境信息,以便,如上所述,环境信息可以与内容特征量和/或标签信息组合。然后,通过组合环境信息、内容特征量和标签信息,就可能生成反映环境信息、内容特征量和标签信息的分布趋势的潜在空间,并且如图21所示环境被映射到潜在空间上。
这样,在操作阶段,以与图16所示的流程图相同的方式,例如,当用户输入命令为“早晨在家中收听的音乐内容”时,内容提供设备1选择接近早晨环境和家中环境的音乐内容。
要注意,可以与图16所示的步骤S42相同的方式来进行计算环境和内容之间的偏差的处理以及计算环境和标签之间的偏差的处理。
此外,依赖于用户,对于内容的环境信息可以是关于用户的环境信息或关于多个用户的环境信息。
参考图22至25,下面的描述说明了带有标签信息的喜好信息和内容特征量的关联。
图22是显示内容提供设备的再一典型功能配置的功能方框图。
要注意,不再说明在图22所示的配置中与图2所示的其对应部分的相同位置上放置的、并且以相同标号作为对应部分表示的对应部分的配置元件,以避免重复说明。图22所示的内容提供设备1通过向方框图图2所示的配置上添加喜好信息抽取单元151、喜好信息存储单元152和喜好信息-潜在空间关联信息存储单元153得到。
喜好信息抽取单元151抽取喜好信息,即关于存储于内容存储单元51中的喜好内容的信息。喜好信息抽取单元151把所抽取的喜好信息存储(或保存)于喜好信息存储单元152中。
内容的喜好信息被定义为关于用作用户的喜好的内容的信息。内容的喜好信息的例子是显示用户给内容的评价的信息。也就是说,在这种情况下内容的喜好信息是一种评价内容的评价信息。
关联信息计算单元56计算关联存储于内容特征量存储单元53中的内容特征量与存储于标签信息存储单元55中的标签信息的信息。关联信息计算单56把对于内容特征量计算的关联信息存储(或保存)于内容特征量-潜在空间关联信息存储单元57中,并把对于标签信息计算的关联信息存储(或保存)于标签信息-潜在空间关联信息存储单元58中。
此外,关联信息计算单元56计算关联存储于喜好信息存储单元152中的喜好信息与存储于标签信息存储单元55中的标签信息的信息。关联信息计算单元56把对于标签信息计算的关联信息存储(或保存)于标签信息-潜在空间关联信息存储单元58中,并把对于喜好信息计算的关联信息存储(或保存)于喜好信息-潜在空间关联信息存储单元153中。
另外,关联信息计算单元56计算关联存储于内容特征量存储单元53中的内容特征量与存储于喜好信息存储单元152中的喜好信息的信息。关联信息计算单56把对于内容特征量计算的关联信息存储(或保存)于内容特征量-潜在空间关联信息存储单元57中,并把对于喜好信息计算的关联信息存储(或保存)于喜好信息-潜在空间关联信息存储单元153中。
要注意,在这种情况下,关联信息彼此关联内容、标签和喜好内容。也就是说,关联信息通过利用潜在变量zk彼此链接内容、标签和喜好内容。
在上述实施例中,内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58和喜好信息-潜在空间关联信息存储单元153彼此分离。然而,要注意,这些单元还可以集成为单一单元。在这种情况下,作为集成内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58和喜好信息-潜在空间关联信息存储单元153的结果得到的单一单元被用来存储所有的关联信息。
接下来,如下参考图23所示的流程图来说明由图22所示的内容提供设备1进行的学习处理。
在步骤S61和S62进行的处理分别与图3所示的在步骤S11和S12进行的处理相同。因此,省略步骤S61和S62的说明。
在步骤S63,喜好信息抽取单元151抽取关于存储于内容存储单元51中的内容的喜好信息,并将所抽取的喜好信息存储(或保存)于喜好信息存储单元152中。例如,由喜好信息抽取单元151在步骤S63抽取的喜好信息作为关于存储于内容存储单元51中的音乐内容的喜好信息,是显示诸如用户1、2、3、4和5用户对音乐内容给出的评价的上述的评价信息。喜好信息抽取单元151将所抽取的评价信息存储于喜好信息存储单元152中作为喜好信息。
具体地,让我们假设例如存储于内容存储单元51中的音乐内容是内容1至10。在这种情况下,喜好信息抽取单元151抽取如图24所示的典型的喜好信息。
图24是显示对于音乐内容的典型喜好信息的图表。
在图24所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目每个都是存储于内容存储单元51中的音乐内容的名字。另一方面,第一行所示的项目每个都是用户对第一列所示的音乐内容给出的评价。在本典型喜好信息中,用户是对音乐内容给出五级评价作为喜好信息的用户1、用户2、用户3、用户4和用户5。例如,在图24所示的表格中,给音乐内容的评价等级1指示该音乐内容是令人厌烦的。另一方面,给音乐内容的评价等级5指示所述音乐内容是令人愉快的。
如图24的第二行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级3、4、2、2和4的喜好信息作为给内容1的典型评价。用同样的方式,如图24的第三行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级5、4、2、3和3的喜好信息作为给内容2的典型评价。用相同的方式,如图24的第四行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级3、3、1、3和5的喜好信息作为给内容3的典型评价。类似地,如图24的第五行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级4、3、2、2和3的喜好信息作为给内容4的典型评价。
类似地,如图24的第六行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级4、2、3、2和4的喜好信息作为给内容5的典型评价。用相同的方式,如图24的第七行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级2、3、4、3和2的喜好信息作为给内容6的典型评价。以同样的方式,如图24的第八行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级3、1、3、3和2的喜好信息作为给内容7的典型评价。
类似地,如图24的第九行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级1、2、5、4和3的喜好信息作为给内容8的典型评价。用相同的方式,如图24的第十行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级2、2、4、5和2的喜好信息作为给内容9的典型评价。以同样的方式,如图24的第十一行所示,喜好信息抽取单元151抽取指示用户1、用户2、用户3、用户4和用户5分别给出评价等级1、2、3、4和3的喜好信息作为给内容10的典型评价。
让我们返回参考图23所示的流程图。在步骤S64,基于存储于内容特征量存储单元53中的内容特征量、存储于标签信息存储单元55中的标签信息或者存储于喜好信息存储单元152中的喜好信息的,关联信息计算单元56进行寻找对于内容特征量、标签信息和喜好信息的关联信息的处理。关联信息计算单元56把寻找对于内容特征量的关联信息、对于标签信息的关联信息和对于喜好信息的关联信息的处理得到的结果分别存储于内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58和喜好信息-潜在空间关联信息存储单元153中作为处理结果。然后,学习处理最终结束。
在这种情况下,可以以如内容特征量和标签信息之间的关系一样的上述关系的相同方式,通过利用对于具有共用的潜在变量zk并且采用与前述方法相同的方法、即与如图3所示的步骤S13进行的处理相同的方法的内容特征量和标签信息的各自的分布关系,来计算对于内容特征量、标签信息或喜好信息的潜在空间表述。
也就是说,关联信息计算单元56以与如图3所示的S13进行的处理相同的方式,来计算对于内容特征量、标签和喜好的关联信息。
具体地,喜好信息被预先存储(或保存)作为指示用户给每个音乐内容的评价的信息,正如图24所示的典型喜好信息。然后,关联信息计算单元56基于图4所示的内容特征量、如图5所示的标签信息和如图24所示的喜好信息计算关联信息。
图25是显示基于潜在空间的对于喜好信息的典型表述的图表。
在图25所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目每个都是喜好信息的名字(即给音乐内容评价的用户的名字)。另一方面,第一行所示的项目都是对于作为给内容评价的第一列所示的每个用户的两个潜在变量(即潜在变量z1和z2)。
如图25给出的表格的第二列所示,关联信息计算单元56给出(对于潜在变量z1的)典型的条件概率值0.8作为对于第二行的用户1的计算结果,(对于潜在变量z1的)典型的条件概率值0.7作为对于第三行的用户2的计算结果,(对于潜在变量z1的)典型的条件概率值0.3作为对于第四行的用户3的计算结果,(对于潜在变量z1的)典型的条件概率值0.45作为对于第五行的用户4的计算结果,(对于潜在变量z1的)典型的条件概率值0.9作为对于第六行的用户5的计算结果。
也就是说,每个都作为喜好信息的名字使用的用户1、用户2、用户3、用户4和用户5通过利用潜在变量z1的值来与内容或标签关联。
用相同的方式,如图25给出的表格的第三列所示,关联信息计算单元56给出(对于潜在变量z2的)典型的条件概率值0.2作为对于第二行的用户1的计算结果,(对于潜在变量z2的)典型的条件概率值0.3作为对于第三行的用户2的计算结果,(对于潜在变量z2的)典型的条件概率值0.7作为对于第四行的用户3的计算结果,(对于潜在变量z2的)典型的条件概率值0.55作为对于第五行的用户4的计算结果,(对于潜在变量z2的)典型的条件概率值0.2作为对于第六行的用户5的计算结果。
也就是说,作为喜好信息的名字使用的用户1、用户2、用户3、用户4和用户5通过利用潜在变量z2的值与内容或标签关联。
如上所述,依照本发明,如图24的典型喜好信息所示,五个用户对诸如内容1至10的音乐内容给出五级评价。在这种情况下,通过组合如图24所示的作为对于音乐内容的信息的喜好信息、如图4所示的作为对于音乐内容的量的内容特征量,就可能生成最适宜的潜在变量(即,潜在变量zk),同时让用户的喜好趋势和内容特征量的趋势相互影响,并且把如图25所示的喜好信息放置于潜在空间中作为用户的喜好信息。
此外,依照本发明,例如,通过推断具有与内容特征量和标签信息共用的潜在变量zk的其它分布的参数,可能得到反映内容的客观趋势、它们的特征和标签同时也反映用户的喜好趋势的潜在空间。内容的特征的例子是包括在由权威人士作为评论内容的文本书写的文本中的单词。
因此,在操作阶段,例如,通过利用作为对于用户的喜好信息和内容的表述的基于潜在空间的表述,可能如用关于所有用户的喜好的信息所喜好的聚合一样来进行用户的聚合、内容的聚合,此外,用户和内容的同时聚合。
以这种方式,依照本发明,可能向用户推荐可以用作用户喜好的内容。
在上述实施例中,评价信息由五个用户给出。然而,要注意,给出评价的用户数目决不局限于五个。也就是说,可以有任意数目的用户给出评价。例如,可能提供配置,其中,通过考虑由一个用户给出的作为一维空间的评价信息来计算潜在空间(潜在变量zk)。
顺带提及,在本发明的情况下,还可能在处理的信息中定义特性特征作为允许把信息映射到前述的潜在空间上的特征。处理的信息可能是内容特征量、标签信息、环境信息或喜好信息。具体地通过利用式(14)来定义作为潜在空间中的概率分布表述的特性特征如何能够随着其熵值单调减少,例如,可以计算特性特征。
[式14]
c ( w i ) = 1 - H ( w i )
= 1 + Σ k p ( z k | w i ) log p ( z k | w i ) - - - ( 14 )
也就是说,例如,关联信息计算单元56通过利用式(14)定义如图20所示的环境信息作为关于音乐内容的环境信息,以便得到如图26所示的特性特征作为环境的特性特征。
图26是显示环境的典型特性特征的图表。
图26给出的典型表格的第一列显示环境,而第二列显示环境的特性特征值。
如图26所示,作为计算结果,关联信息计算单元56产生对于第二行的早晨环境项目的典型的特性特征值0.500,对于第三行的白天环境项目的典型的特性特征值0.389,对于第四行的夜晚环境项目的典型的特性特征值0.461,对于第五行的家中环境项目的典型的特性特征值0.389,对于第六行的户外环境项目的典型的特性特征值0.311,以及对于第七行的工作地环境项目的典型的特性特征值0.675。
也就是说,正如从图26所示的六个典型特性特征值明显看出的,具有特性特征值0.675的通勤环境项目,具有特性特征值0.500的早晨环境项目,是图20所示的典型环境信息所示的六个环境项目的特性特征作为对于音乐内容的环境信息。在环境信息的情况下,特性特征是在所有环境项目中具有最大特性特征值的环境项目。这些对于音乐内容的特性特征指示户外环境项目对收听音乐内容的方式没有影响。因此,当用户出现在户外位置时,对于另一个音乐内容的元数据或环境信息可能被推荐给该用户。作为替换,由于通勤环境项目具有大的特性特征值,因此忽略其它环境项目,并且可能推荐具有仅接近作为在潜在空间中的环境信息的通勤环境项目的偏差的音乐内容。
特性特征的概念还同样可以用于标签信息。在标签信息的情况下,特性特征是在所有标签中具有最大特性特征值的标签。具有最大特性特征值的标签可以被称为具有与音乐内容的内容特征量或特征标签最深关系的标签。因此,例如,这种标签可以被选择并且在诸如评价音乐内容的文本的句子中以高亮标签信息显示,以便帮助读取句子的用户更好地理解音乐内容。
首先,通过参考图27至30来说明关联标签与内容的处理。本处理也可以被称为学习处理。通过参考图31至35的操作阶段的描述接着进行学习处理的说明。操作阶段是通过利用标签信息与和标签信息关联的内容特征量之间的关系来选择具有大内容特征值的标签信息并显示所选标签作为高亮标签信息。
图27是显示内容提供设备的再一典型功能配置的功能方框图。
要注意,不再说明在图27所示的配置中与图2所示的其对应部分的相同位置上放置的、并且以相同标号作为对应部分表示的对应部分的配置元件,以避免重复说明。在图27所示的内容提供设备1的配置中,文本存储单元171被连接于标签信息抽取单元54,而从本配置中省略在方框图2中显示的内容特征量存储单元53、标签信息存储单元55、内容特征量-潜在空间转换单元59、标签信息-潜在空间转换单元60、潜在空间偏差计算单元61、标签选择单元62和内容选择单元63。
文本存储单元171是用于存储(或保存)原文信息的单元。存储于文本存储单元171的原文信息是根据以自然语言书写的句子表述的信息。原文信息是关于存储于内容存储单元51中的内容的文本。原文信息的例子是评价这种内容的文本和描述关于内容的印象的文本。在由标签信息抽取单元54进行请求时,文本存储单元171向标签信息抽取单元54供应原文信息。
标签信息抽取单元54通过进行词素分析等等把信息划分为用作向用户揭示含义的单元的单词或短语,来分解从文本存储单元171接收的原文信息。标签信息抽取单元54把作为词素分析的结果得到的信息供应给关联信息计算单元56作为标签信息。作为词素分析的结果得到的信息是词素。
要注意,作为向用户揭示含义的单元被处理的短语是单词或一串单词。
此外,正如稍后将详细描述的,词素分析是一种通过利用计算机等等进行的所谓自然语言处理的基本技术。词素分析是通过把句子划分为一串词素来彼此区分用在以自然语言书写的句子中的单词种类的工作,这些词素,简单地说,每个都是揭示语言含义的最小单元。要注意,通常,通过利用包括诸如用于把以日语书写的句子分解为词素的“ChaSen”的词素分析仪和诸如用于识别词素作为一串有意义的单词的“YamCha”的所谓的分块仪(chunker)的设备来进行词素分析。“ChaSen”是由奈良高级科学和技术研究大学的松本实验室开发的分析仪。在英语句子等等的情况下,进行被称为归类(lemmatization)的处理以取得用在句子中的每个单词的基本形式。在归类处理中,从单词中丢弃在每个单词尾部观察到的变化,仅留下单词的基本结构。在每个单词尾部看到的变化是在其它中指示名词的复数或单数或指示事件发生的过去时或现在时的变化。
关联信息计算单元56计算关联由内容特征量抽取单元52供应的内容特征量与由标签信息抽取单元54供应的标签信息的信息。关联信息计算单元56把对于内容特征量计算的关联信息存储于内容特征量-潜在空间关联信息存储单元57,并把对于标签信息计算的关联信息存储于标签信息-潜在空间关联信息存储单元58。
要注意,由内容特征量抽取单元52抽取的内容特征量可以预先被存储于内容特征量存储单元53中,而由标签信息抽取单元54抽取的标签信息以与前述实施例相同的方式预先被存储于标签信息存储单元55中。在这种情况下,计算关联信息的关联信息计算单元56从内容特征量存储单元53中读取内容特征量,并从标签信息存储单元55中读取标签信息。然而,为了简化说明,在图27中没有明示利用内容特征量存储单元53和标签信息存储单元55的操作。
如下参考图28所示的流程图来说明图27所示的内容提供设备1进行的学习处理。
在S71进行的处理与在图3所示的步骤S11进行的处理相同。因此,省略步骤S71的说明。
在步骤S72,标签信息抽取单元54进行标签信息抽取处理,以从存储于文本存储单元171中的文本信息中抽取标签信息。
如下参考图29所示的流程图来说明由标签信息抽取单元54在步骤S72进行的标签信息抽取处理的细节。
在步骤S81,标签信息抽取单元54从文本存储单元171中读出文本信息。
在步骤S82,标签信息抽取单元54对从文本存储单元171中读出的文本信息进行词素分析。
图30是显示由标签信息抽取单元54进行的典型词素分析的图表。
在如图30所示的典型词素分析中,图上方部分所示的文本信息“hitasuraakarui norinori no kyoku ga”已经存储于文本存储单元171中。在这种情况下,标签信息抽取单元54对文本信息“hitasura akarui norinori no kyoku ga”进行词素分析,并得到图下方部分所示的词素分析结果。
图30下方部分所示的词素分析结果被划分为六列。左侧起第一列显示一串字符,而第二列显示该字符串的发音。第三列显示该字符串的基本形式,而第四列显示该字符串的词类名称。第五列显示该字符串的利用类型,而第六列显示该字符串的利用形式。
也就是说,作为由标签信息抽取单元54进行的词素分析的结果,在图30上方部分显示的文本信息“hitasura akarui norinori no kyoku ga”的例子中,如图下方部分所示,对于字符串“hitasura”,发音为“hitasura”,基本形式为“hitasura”并且词类名称为副词-一般的。对于字符串“akarui”,发音为“akarui”,基本形式为“akarui”,词类名称为形容词--独立的,利用类型为形容词-元音阶段,利用形式为基本形式。对于字符串“norinori”,发音为“norinori”,基本形式为“norinori”,词类名称为名词-形容词/动词根。
用相同的方式,在图30上方部分所示的文本信息“hitasura akarui norinorino kyoku ga”的例子中,如图下方部分所示,对于字符串“no”,发音为“no”,基本形式为“no”并且词类名称为助词-修饰名词的从句。对于字符串“kyoku”,发音为“kyoku”,基本形式为“kyoku”,词类名称为名词-一般的。
对于字符串“ga”,发音为“ga”,基本形式为“ga”,词类名称为助词-格助词-一般的。
要注意,标签信息抽取单元54还可以依照预先定义的列表来从文本信息中删除无关紧要的单词。该无关紧要的单词是被认为是对词素分析明显不重要的单词的单词。无关紧要的单词的例子有被显示于图30的下方部分并且预先包含在该列表中的字符串“no”和字符串“ga”。
让我们返回参考图29所示的流程图。在步骤S83,标签信息抽取单元54把从词素分析得到的词素供应给关联信息计算单元56作为标签信息。然后,标签信息抽取单元54最终结束抽取标签信息的处理。处理的流程返回如图28所示的步骤S72以便从步骤S73继续学习处理。
具体地,标签信息抽取单元54把每个字符串的基本形式作为词素。在图30下方部分所示的典型词素分析结果的例子中,每个字符串的基本形式被显示于左侧起第三列中。在这个典型词素分析结果的例子中,字符串是字符串“hitasura”、“akarui”、“norinori”、“kyoku”等等。字符串的基本形式是在串的普通使用之前的原始形式。然后,标签信息抽取单元54把词素“hitasura”、“akarui”、“norinori”和“kyoku”供应给关联信息计算单元56。
在步骤S73,在图3所示的步骤S11进行的处理非常相似,关联信息计算单元56进行寻找对于内容特征量的关联信息和对于标签信息的关联信息的处理。关联信息计算单元56分别把对于内容特征量寻找的关联信息存储于内容特征量-潜在空间关联信息存储单元57并把对于标签信息寻找的关联信息存储于标签信息-潜在空间关联信息存储单元58作为处理结果。然后,学习处理最终结束。
例如,基于内容特征量和标签信息,关联信息计算单元56计算均值向量μk、方差-协方差矩阵Sk、先验概率值αk和条件概率p(wi|zk)作为对于潜在变量zk的关联信息。然后,关联信息计算单元56典型地把均值向量μk、方差-协方差矩阵Sk和先验概率值存储于内容特征量-潜在空间关联信息存储单元57中αk作为对于潜在变量zk的关联信息,并且典型地把条件概率p(wi|zk)和先验概率值αk存储于标签信息-潜在空间关联信息存储单元58作为对于潜在变量zk和标签wi的组合的关联信息。
如上所述,通过进行学习处理,内容提供设备1把对于内容特征量寻找的关联信息存储于内容特征量-潜在空间关联信息存储单元57中,并把对于标签信息寻找的关联信息存储于标签信息-潜在空间关联信息存储单元58中。
以这种方式,通过利用包含在以自然语言书写的文本中的短语作为文本信息,用户通过仅仅描述句子而不用识别内容的特征,就能够把属性(或短语)赋给内容。此外,由于内容特征量和短语之间的关系被计算,它们之间的关系可用来降低给内容分配元数据的成本。
参考图31至35,下面的描述说明通过利用内容特征量和标签信息之间的关系来选择特定标签信息以及以高亮显示项目显示所选标签信息的处理。如上所述,内容特征量和标签信息在学习处理中被彼此关联。特定标签信息是具有良好的代表了短语与内容特征量之间的关系程度的特性特征的标签信息。
图31是显示内容提供设备1的再一典型功能配置的功能方框图。
要注意,不再说明在图31所示的配置中与图2所示的其对应部分的相同位置上放置的、用于作为对应部分进行相同处理、并且以相同标号作为对应部分表示的配置元件,以避免重复说明。图31所示的内容提供设备1的配置通过向方框图27所示的配置添加特性-特征计算单元181、特征-短语选择单元182、短语显示控制单元183和显示单元184来得到。
特性-特征计算单元181获得对于作为分解来自内容特征量-潜在空间关联信息存储单元57和标签信息-潜在空间关联信息存储单元58的文本信息处理的结果得到的短语的关联信息。
基于所得到的对于短语的关联信息,然后特性-特征计算单元181依照式(14)计算代表了短语与内容特征量之间的关系程度的特性特征。然后,特性-特征计算单元181把所计算的特性特征和与特性特征相关联的短语供应给特征-短语选择单元182。特性-特征计算单元181还把作为分解文本信息处理的结果得到的短语供应给短语显示控制单元183。
基于从特性-特征计算单元181接收的特性特征的值,特征-短语选择单元182从与特性特征相关联的短语中选择特征短语。特征短语是具有相对大的特性特征值的短语。然后,特征-短语选择单元182把所选特征短语供应给短语显示控制单元183。
要注意,依照由特征-短语选择单元182采用的选择特征短语的方法,每个都具有大于预定门限值的特性特征值的短语每个都被选择作为特征短语。依照由特征-短语选择单元182采用的选择特征短语的另一个方法,存储从特性-特征计算单元181接收的短语以便降低特性特征值,并且然后选择了前10%的短语。
短语显示控制单元183比较从特征-短语选择单元182接收的所选特征短语与从特性-特征计算单元181接收到的短语作为分解文本信息的处理结果得到的短语。然后,短语显示控制单元183仅把从特性-特征计算单元181接收到的短语作为每个都匹配一个特征短语的短语显示在显示单元184上作为高亮显示项目。
显示单元184对应于图1所示的输出单元17。显示单元184依照由短语显示控制单元183执行的控制典型地显示用作文本信息的句子。
通过参考图32所示的流程图,下面的描述说明由如下图31所示的内容提供设备1进行的处理作为显示短语的处理。
在步骤S91,基于对于从文本信息中切割出来的短语的关联信息,特性-特征计算单元181依照式(14)来计算对于短语的特性特征。
要注意,在下面的描述中,用作概率分布参数(或关联信息)的条件概率p(z=z1|z1)和p(z=z1|z1)已经分别对于图33的表格所示的每个短语和每个潜在变量z1和z2而计算。在表格中,短语是从图30上方部分所示的文本信息“hitasura akarui norinori no kyoku ga”中切割出来的除了每个都是助词的标签单词wi“no”和“ga”以外的标签单词wi“hitasura”、“akarui”、“norinori”和“kyoku”。所计算的条件概率p(z=z1|wi)和p(z=z2|wi)已经被存储于标签信息-潜在空间关联信息存储单元58中。
图33是显示基于潜在空间的作为短语(或标签wi)的典型表述的表述的图表。也就是说,该图显示了作为对于短语的典型表述的潜在空间,即,条件概率p(z=zk|wi)的典型值。
在图33所示的典型表格中,第一列和第一行各自显示项目。第一列所示的项目每个都是从诸如评价内容的文本的原文信息中切割出来的短语。原文信息是由标签信息抽取单元54抽取的信息。另一方面,第一行所示的项目是两个潜在变量,即潜在变量z1和z2。
如图33给出的表格的第二列所示,在标签信息-潜在空间关联信息存储单元58中,存储了(对于潜在变量z1的)典型的条件概率值0.4作为对于第二行的标签单词“hitasura”的计算结果,(对于潜在变量z1的)典型的条件概率值0.8作为对于第三行的标签单词“akarui”的计算结果,(对于潜在变量z1的)典型的条件概率值0.7作为对于第四行的标签单词“norinori”的计算结果,(对于潜在变量z1的)典型的条件概率值0.5作为对于第五行的标签单词“kyoku”的计算结果,等等。
也就是说,短语“hitasura”、“akarui”、“norinori”、“kyoku”等等的每一个都通过利用潜在变量z1的值与音乐内容关联。
用相同的方式,如图33所示,在标签信息-潜在空间关联信息存储单元58中,存储了(对于潜在变量z2的)典型的条件概率值0.6作为对于第二行的标签单词“hitasura”的计算结果,(对于潜在变量z2的)典型的条件概率值0.2作为对于第三行的标签单词“akarui”的计算结果,(对于潜在变量z2的)典型的条件概率值0.3作为对于第四行的标签单词“norinori”的计算结果,(对于潜在变量z2的)典型的条件概率值0.5作为对于第五行的标签单词“kyoku”的计算结果,等等。
也就是说,短语“hitasura”、“akarui”、“norinori”、“kyoku”等等的每一个都通过利用潜在变量z2的值与音乐内容关联。
此外,如图33所示,例如,每个都具有与音乐内容数据的密切联系的短语“akarui”和“norinori”具有对于潜在变量z1和z2的大的条件概率p(z=zk|wi)值。
也就是说,基于图33所示作为对于短语的关联信息的关联信息,特性-特征计算单元181依照式(14)计算如图34所示的特性特征。
图34是显示每个短语(或每个标签wi)的典型特性特征的图表。
在图34所示的典型表格中,第一列显示短语,而第二列显示特性特征。
如图34所示,作为计算的结果,特性-特征计算单元181产生对于第二行的短语“hitasura”的特性特征值0.708,对于第三行的短语“akarui”的特性特征值0.859,对于第四行的短语“norinori”的特性特征值0.816,对于第五行的短语“kyoku”的特性特征值0.699。
让我们返回参考图32所示的流程图。在步骤S92,特征-短语选择单元182从原文信息切割出来的短语中选择特征短语。
例如,特征-短语选择单元182从如图34所示的短语“hitasura”、“akarui”、“norinori”、“kyoku”等等中选择每个都具有大于0.8的特性特征值的特征短语“akarui”和“norinori”。
换句话说,由特征-短语选择单元182进行的以选择每个都具有较多不成比例的概率分布参数(用作关联信息)的特征短语“akarui”和“norinori”的操作也可以被称为选择每个都具有与音乐内容数据紧密联系的短语的操作。也就是说,在图34所示的典型特性特征值的例子中,如果以递增的特性特征值的顺序排列短语,具有特性特征值0.699的短语“kyoku”后面依次跟着具有特性特征值0.708的短语“hitasura”、具有特性特征值0.816的短语“norinori”和具有特性特征值0.859的短语“akarui”。在这种情况下,例如,每个都具有比其它短语更加不成比例的概率分布参数(用作关联信息)的特征短语“akarui”和“norinori”是与其它短语相比每个都具有大的特性特征值的短语。
在上述实施例中,特征-短语选择单元182选择每个都具有大于0.8的特性特征值的短语作为特征短语。然而,要注意,选择特征短语的方法决不局限于上述技术。例如,每个都具有大于预先确定的门限值的特性特征值的短语每个都可以被选作特征短语,或者,作为替换,在所接收的以递减的特性特征值的顺序排列的短语中,选择前N%的短语,其中,N为满足关系0≤N≤100的数字。
让我们返回参考图32所示的流程图。在步骤S93,短语显示控制单元183把从原文信息中切割处理的一些短语作为匹配所选特征短语的短语显示在显示单元184上作为高亮显示项目。然后,显示短语的处理最终结束。
例如,短语显示控制单元183把从诸如评价音乐内容的文本的原文信息中切割出来的一些短语作为匹配由特征-短语选择单元182选择的所选特征短语“akarui”和“norinori”的短语显示在显示单元184上作为高亮显示项目。
图35是显示每个都由显示单元184输出的、作为诸如评论音乐内容的句子的句子的显示的典型显示的图表。
如图35的上方部分所示,由显示单元184输出的显示示出了句子“hitasura akarui norinori no kyoku ga”。句子包括每个都具有大特性特征值的特征短语“akarui”和“norinori”。特征短语每个都被显示作为带有每个都具有大于用在其它短语中的字符尺寸的的尺寸的字符的短语。
如图35的下方部分所示,由显示单元184输出的显示示出了句子“hitasura akarui norinori no kyoku ga”。句子包括每个都具有大特性特征值的特征短语“akarui”和“norinori”。特征短语每个都被显示作为带有不同于其它短语的背景模式的背景模式的短语。
以这种方式,具有与内容的特征量的紧密联系的短语被显示作为高亮显示项目。因此,当用户读取诸如评价内容的文本的句子时,用户显然注意到作为高亮显示项目显示的短语。
在上述实施例中,特征短语被显示作为带有每个都具有大于用在其它短语中的字符尺寸的尺寸的字符的短语,或者被显示作为带有不同于其它短语的背景模式的背景模式的短语。然而,要注意,本发明的实现决不仅限于本实施例。例如,特征短语还可以被显示作为带有不同于其它短语的颜色的颜色的短语。重点是特征短语可以以任何方式被显示,只要该方式不同于显示其它短语的方式即可。
另外,依照本发明,例如,内容和/或标签还可以被聚合。例如,聚合被映射到潜在空间上的内容(和/或标签)的处理可以通过采用任何聚合算法来进行。在这种情况下,由于内容(和/或标签)典型地以相同的潜在空间来表述,聚合内容和标签的处理不一定必须单独地进行。相反,内容和标签可以同时聚合,以便得到其中内容与标签混和的组(cluster)。
因此,在早期通过参考图16所示的流程图说明的内容搜索处理中,例如,不以分开的搜索处理来搜索内容和标签,包含在相同组中的内容和标签可以被看作搜索内容和标签的处理结果。结果,用户能够快速得到想要的内容。
此外,在上述实施例中,内容提供装置1在学习和操作阶段都进行处理。然而,也可能提供配置,其中可以由不同于在操作阶段进行处理的设备的设备来进行学习阶段的处理。通过参考图36至37,下面的描述说明用于在学习阶段进行处理的内容提供设备1和用于在操作阶段进行处理作为不同于内容提供设备1的设备的另一设备的配置。
图36是显示用于在学习阶段进行处理的内容提供设备1的典型功能配置的功能方框图。
不再说明在图36所示的配置中与图2所示的其对应部分的相同位置上放置的并且以相同标号作为对应部分表示的配置元件,以避免重复说明。图36所示的内容提供设备1的配置包括用于在学习阶段进行处理的单元的内容存储单元51、内容特征量抽取单元52、内容特征量存储单元53、标签信息抽取单元54、标签信息存储单元55、关联信息计算单元56、内容特征量-潜在空间关联信息存储单元57、标签信息-潜在空间关联信息存储单元58。
例如,通过进行图3所示的学习处理,图36所示的内容提供设备1计算关联存储于内容存储单元51中的内容的内容特征量和该内容的标签信息的信息,把对于内容特征量的关联信息存储于内容特征量-潜在空间关联信息存储单元57中,并把对于标签信息的关联信息存储于标签信息-潜在空间关联信息存储单元58中。
也就是说,图36所示的内容提供设备1把存储于它本身内的数据供应给在操作阶段进行处理的设备。在操作阶段进行处理的设备的例子是如下参考图37描述的客户终端设备201。
图37是显示用于在操作阶段进行处理的客户终端设备201的典型功能配置的功能方框图。
不再说明在图37所示的配置中与图2所示的其对应部分的相同位置上放置的并且以相同标号作为对应部分表示的对应部分的配置元件,以避免重复说明。图37所示的客户终端设备201的配置包括用于在学习阶段进行处理的单元的内容特征量抽取单元52、内容特征量-潜在空间转换单元59、标签信息-潜在空间转换单元60、潜在空间偏差计算单元61、标签选择单元62和内容选择单元63。客户终端设备201是依照本发明的典型的信息处理设备。
通过进行图14所示的标签分配处理,客户终端设备201给新添加的内容分配标签。客户终端设备201通过典型地从图36所示的内容提供设备1中获得标签分配处理所需的数据,来进行标签分配处理。
此外,通过进行图16所示的内容搜索处理,客户终端设备201获得存储于图36所示的内容提供设备1中的内容。客户终端设备201通过典型地从图36所示的内容提供设备1中获得内容搜索处理所需的数据,来进行内容搜索处理。
以这种方式,依照本发明,由不同于用于在操作阶段进行处理的操作阶段设备的学习阶段设备来进行在学习阶段的处理。
建议读者紧记,可能提供配置,其中客户终端设备201仅进行图14所示的标签分配处理或仅进行图16所示的内容搜索处理作为在操作阶段的处理。
此外,还可能提供配置,其中,图36所示的内容提供设备1进行通过前面参考图27至30说明的处理作为在学习阶段的处理,而图37所示的客户终端设备201进行通过前面参考图31至35说明的处理作为在操作阶段的处理。由内容提供设备1在学习阶段进行的处理和由客户终端设备201在操作阶段进行的处理组成了通过前面参考图27至35说明的处理。
如上所述,依照本发明,适合于内容的关键词可以被分配给该内容。
此外,依照本发明,依靠反映内容特征量和标签信息的分布特征的潜在空间,标签可以被分配给甚至没有标签的内容或者分配给内容的标签可被用于搜索内容。
另外,依照本发明,依靠集成了除内容特征量和标签信息之外的展示彼此不同的分布的多种信息的潜在空间,现在可以发明现存的方法未发现的关系作为这种信息之间的相互关系。因此,本发明也可以用于,例如,向用户推荐内容的系统。展示不同分布的信息的例子是依赖于用户的经验的环境信息和喜好信息。
要注意,在上述实施例中,关联信息是关联内容与标签的信息。关联信息的例子是均值向量μk、方差-协方差矩阵Sk、先验概率值αk和条件概率p(wi|zk)。均值向量μk、方差-协方差矩阵Sk、先验概率值αk和条件概率p(wi|zk)也可以被称为代表内容特征量、标签信息和潜在变量的概率分布性质的参数(或者,严格地说,概率分布参数)。也就是说,关联信息计算单元56计算这些参数作为关联信息。
此外,在上述实施例中,内容特征量抽取单元52、标签信息抽取单元54、环境信息抽取单元111和喜好信息抽取单元151分别抽取内容特征量、标签信息、环境信息和喜好信息。代替利用内容提供设备1抽取内容特征量、标签信息、环境信息和喜好信息,它们还可以由不同于内容提供设备1或由用户给出的外部设备来抽取。
此外,在上述实施例中,为了简化说明音乐内容的数目是10。然而,实际上,想要处理几千个音乐内容。然而,可以以相同的方式在具有更大量的音乐内容的应用中进行处理。
可以由硬件和/或软件的执行来进行前述的处理序列。如果,由软件的执行来进行上述处理序列,组成软件的程序可以典型地从记录介质安装到嵌入专用硬件的计算机、通用个人计算机等等中。在这种情况下,计算机或个人计算机用作前述的内容提供设备1和/或客户终端设备201。通用个人计算机是能够通过在个人计算机上安装各种程序使之进行各种功能的个人计算机。
用于记录将被安装在计算机或通用个人计算机中作为将由计算机或通用个人计算机执行的程序的程序的记录介质,是如图1所示的可移动记录介质21,作为从提供程序给用户的计算机或通用个人计算机中独立地被提供给用户的记录介质。还被称为便携介质的可移动记录介质21的例子包括诸如软盘的磁盘、诸如CD-ROM(压缩盘-只读存储器)或DVD(数字化通用盘)的光盘,诸如MD(MINI DISC,注册商标)的磁-光盘以及半导体存储器。代替安装来自可移动记录介质21的程序,程序也可以预先被存储在被包括在被提供给用户的计算机或通用个人计算机的主要单元中的嵌入式记录介质中。嵌入式记录介质的例子是被包括在如图1所示的记录部分18和ROM 12中的硬盘。
被存储于硬盘中的作为将由计算机或通用个人计算机执行以进行上述处理序列的程序的程序还可以是,如果需要,通过用作典型地具有路由器或调制解调器的接口,通过利用基于无线和/或有线通信的通信介质,从源下载程序到计算机或通用个人计算机,来从外部源安装的程序。基于无线或有线通信的通信介质的例子是局域网、因特网和数字广播卫星。
要注意,在本说明书中,上述流程步骤不仅可以以沿时间轴的预先指定的顺序进行,还可以同时或独立地进行。
还不值得一提,本说明书中使用的技术术语“系统”指的是包括多个设备的集合的配置。
还要注意,本发明的实现决不仅局限于上述实施例。也就是说,可能对实施例进行各种改变,只要该改变在不偏离本发明实质的范围内。

Claims (18)

1.一种信息处理设备,包括:
第一计算装置,用于计算代表对于为与内容有关的特征量和显示所述内容的属性的属性信息共用的第一潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的第一参数;和
存储装置,用于存储所计算的第一参数。
2.如权利要求1所述的信息处理设备进一步包括:
第一抽取装置,用于抽取所述特征量;和
第二抽取装置,用于抽取所述属性信息,
其中所述第一计算装置从所抽取的特征量和所抽取的属性信息计算所述第一参数。
3.如权利要求2所述的信息处理设备,其中,其中所述第二抽取装置把以自然语言书写的句子划分为单词或者每个都由所述单词组成的短语。
4.如权利要求3所述的信息处理设备,进一步包括:
第二计算装置,用于基于由所述第一计算装置计算的所述第一参数来计算显示所述短语和所述特征量之间的关系程度的特性特征;和
显示控制装置,用于基于所抽取的特性特征来控制显示所述短语的处理。
5.如权利要求1所述的信息处理设备,其中:
所述第一计算装置计算代表对于所述特征量的概率分布性质、对于所述属性信息的概率分布性质和为所述特征量、所述属性信息和被用户用作关于利用所述内容的信息的利用信息共用的第二潜在变量的概率分布性质的第二参数;以及
所述存储装置被用于存储由所述第一计算装置计算的所述第二参数。
6.如权利要求5所述的信息处理设备,进一步包括:
抽取装置,用于抽取所述利用信息,其中
所述第一计算装置从所述特征量、所述属性信息或由所述抽取装置抽取的利用信息计算所述第二参数。
7.如权利要求1所述的信息处理设备,其中:
所述第一计算装置计算代表对于所述特征量的概率分布性质、对于所述属性信息的概率分布性质和为所述特征量、所述属性信息和被用作关于每个作为用户喜好的内容的信息的喜好信息共用的第三潜在变量的概率分布性质的第三参数;以及
所述存储装置被用于存储所计算的第三参数。
8.如权利要求7所述的信息处理设备,进一步包括:
抽取装置,用于抽取所述喜好信息,其中
所述第一计算装置从所述特征量、所述属性信息或所抽取的喜好信息中计算所述第三参数。
9.一种信息处理方法,包括:
计算步骤,用于计算代表对于为与内容有关的特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数;和
存储步骤,用于存储所计算的参数。
10.一种由计算机执行的程序,以进行:
计算步骤,用于计算代表对于为与内容有关的特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数;和
存储步骤,用于存储所计算的参数。
11.一种信息处理设备,包括:
抽取装置,用于抽取与内容有关的特征量;
转换装置,用于基于代表对于为所述特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数,来进行转换处理以把所抽取的特征量放置于潜在空间中;
计算装置,用于计算作为所述转换处理结果被放置于所述潜在空间中的所述特征量和通过所述潜在变量与所述特征量潜在地关联的所述属性信息之间的偏差;和
选择装置,用于基于所计算的偏差来选择对于所述内容的属性。
12.如权利要求11所述的信息处理设备,其中,作为对于所述内容的所选属性,所述选择装置在所有属性中选择所计算的偏差不高于门限值的属性,或者选择具有最小偏差的预定数目的属性。
13.一种信息处理方法,包括:
抽取步骤,用于抽取与内容有关的特征量;
转换步骤,用于基于代表对于为所述特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数,来进行转换处理以把所抽取的特征量放置于潜在空间中;
计算步骤,用于计算作为所述转换处理结果被放置于所述潜在空间中的所述特征量和通过所述潜在变量与所述特征量潜在地关联的所述属性信息之间的偏差;和
选择步骤,用于基于所计算的偏差来选择对于所述内容的属性。
14.一种由计算机执行的程序,以进行:
抽取步骤,用于抽取与内容有关的特征量;
转换步骤,用于基于代表对于为所述特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数,来进行转换处理以把所抽取的特征量放置于潜在空间中;
计算步骤,用于计算作为所述转换处理结果被放置于所述潜在空间中的所述特征量和通过所述潜在变量与所述特征量潜在地关联的所述属性信息之间的偏差;和
选择步骤,用于基于所计算的偏差来选择对于所述内容的属性。
15.一种信息处理设备,包括:
转换装置,用于基于代表对于为与内容有关的特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数,来进行转换处理以把所述属性信息放置于潜在空间中;
计算装置,用于计算作为所述转换处理结果被放置于所述潜在空间中的所述特征量和通过所述潜在变量与所述特征量潜在地关联的所述属性信息之间的偏差;和
选择装置,用于基于所计算的偏差选择对于所述属性信息的内容。
16.如权利要求15所述的信息处理设备,其中,作为对于所述属性的所选内容,所述选择装置在所有内容中选择所计算的偏差不高于门限值的内容,或者选择具有最小偏差的预定数目的内容。
17.一种信息处理方法,包括:
转换步骤,用于基于代表对于为与内容有关的特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数,来进行转换处理以把所述属性信息放置于潜在空间中;
计算步骤,用于计算作为所述转换处理结果被放置于所述潜在空间中的所述特征量和通过所述潜在变量与所述特征量潜在地关联的所述属性信息之间的偏差;和
选择步骤,用于基于所计算的偏差选择对于所述属性信息的内容。
18.一种由计算机执行的程序,以进行:
转换步骤,用于基于代表对于为与内容有关的特征量和显示所述内容的属性的属性信息共用的潜在变量的概率分布性质、对于所述特征量的概率分布性质和对于所述属性信息的概率分布性质的参数,来进行转换处理以把所述属性信息放置于潜在空间中;
计算步骤,用于计算作为所述转换处理结果被放置于所述潜在空间中的所述特征量和通过所述潜在变量与所述特征量潜在地关联的所述属性信息之间的偏差;和
选择步骤,用于基于所计算的偏差选择对于所述属性信息的内容。
CNA2006800040286A 2005-12-05 2006-12-04 信息处理设备、信息处理方法及程序 Pending CN101116073A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP350824/2005 2005-12-05
JP2005350824 2005-12-05

Publications (1)

Publication Number Publication Date
CN101116073A true CN101116073A (zh) 2008-01-30

Family

ID=38122753

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800040286A Pending CN101116073A (zh) 2005-12-05 2006-12-04 信息处理设备、信息处理方法及程序

Country Status (4)

Country Link
US (1) US8478781B2 (zh)
EP (1) EP1959358A4 (zh)
CN (1) CN101116073A (zh)
WO (1) WO2007066607A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020019A (zh) * 2011-09-26 2013-04-03 株式会社东芝 标记辅助设备、方法和程序

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101316259B (zh) * 2007-05-30 2012-03-21 华为技术有限公司 内容过滤的方法、装置及系统
EP2083416A1 (en) * 2008-01-23 2009-07-29 Sony Corporation Method for deriving animation parameters and animation display device
JP5359534B2 (ja) 2009-05-01 2013-12-04 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP5533880B2 (ja) * 2009-10-26 2014-06-25 日本電気株式会社 コンテンツ推薦システム、推薦方法及び推薦プログラム
JP5463873B2 (ja) * 2009-11-20 2014-04-09 株式会社デンソーアイティーラボラトリ マルチメディア分類システム及びマルチメディア検索システム
JP5440394B2 (ja) * 2010-05-31 2014-03-12 ソニー株式会社 評価予測装置、評価予測方法、及びプログラム
JP5625792B2 (ja) * 2010-11-17 2014-11-19 ソニー株式会社 情報処理装置、潜在特徴量算出方法、及びプログラム
CN102262659B (zh) * 2011-07-15 2013-08-21 北京航空航天大学 一种基于内容计算的音频标签传播方法
JP6590477B2 (ja) * 2014-11-28 2019-10-16 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
TWI640877B (zh) * 2017-06-14 2018-11-11 財團法人資訊工業策進會 語意分析裝置、方法及其電腦程式產品
CN112052882B (zh) * 2020-08-14 2023-08-22 北京师范大学 磁共振脑结构影像的分类模型构建、分类与可视化方法
US20220383877A1 (en) * 2021-05-25 2022-12-01 Samsung Electronics Co., Ltd. Electronic device and operation method thereof

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3530996B2 (ja) 1997-09-22 2004-05-24 ミノルタ株式会社 情報処理装置
JP3674430B2 (ja) 1999-12-20 2005-07-20 日本ビクター株式会社 情報提供サーバ及び情報提供方法
JP3654850B2 (ja) 2000-05-17 2005-06-02 松下電器産業株式会社 情報検索システム
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
JP2006048286A (ja) * 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
JP2006048289A (ja) 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
JP2006048288A (ja) 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム
JP2006048287A (ja) 2004-08-03 2006-02-16 Sony Corp 情報処理装置および方法、並びにプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020019A (zh) * 2011-09-26 2013-04-03 株式会社东芝 标记辅助设备、方法和程序
US8965769B2 (en) 2011-09-26 2015-02-24 Kabushiki Kaisha Toshiba Markup assistance apparatus, method and program
US9626338B2 (en) 2011-09-26 2017-04-18 Kabushiki Kaisha Toshiba Markup assistance apparatus, method and program

Also Published As

Publication number Publication date
EP1959358A4 (en) 2010-04-07
WO2007066607A1 (ja) 2007-06-14
US8478781B2 (en) 2013-07-02
EP1959358A1 (en) 2008-08-20
US20090106195A1 (en) 2009-04-23

Similar Documents

Publication Publication Date Title
CN101116073A (zh) 信息处理设备、信息处理方法及程序
US11720572B2 (en) Method and system for content recommendation
US11048882B2 (en) Automatic semantic rating and abstraction of literature
US7953735B2 (en) Information processing apparatus, method and program
Kaminskas et al. Contextual music information retrieval and recommendation: State of the art and challenges
Cornelis et al. Access to ethnic music: Advances and perspectives in content-based music information retrieval
US7778988B2 (en) Information processing device, method, and program for determining relativity between contents
US20080319973A1 (en) Recommending content using discriminatively trained document similarity
US20100125539A1 (en) Hybrid audio-visual categorization system and method
JP2006251866A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
Tanveer et al. Awe the audience: How the narrative trajectories affect audience perception in public speaking
JP7512903B2 (ja) 感性算出装置、感性算出方法、およびプログラム
Pérez-Sancho et al. Genre classification using chords and stochastic language models
Egger Topic modelling: Modelling hidden semantic structures in textual data
Kalender et al. Videolization: knowledge graph based automated video generation from web content
Hyung et al. Utilizing context-relevant keywords extracted from a large collection of user-generated documents for music discovery
US20120239382A1 (en) Recommendation method and recommender computer system using dynamic language model
JP7283718B2 (ja) 音響信号検索装置、音響信号検索方法、データ検索装置、データ検索方法、プログラム
JP2007183927A (ja) 情報処理装置および方法、並びにプログラム
US20200293574A1 (en) Audio Search User Interface
Di Fabbrizio et al. Summarizing opinion-related Information for mobile devices
US20060161587A1 (en) Psycho-analytical system and method for audio and visual indexing, searching and retrieval
Kim et al. Occupational representativeness in twitter
Deshmukh et al. Music and movie recommendation system
Kanters Automatic mood classification for music

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080130