CN101578600A - 用于将一个用户的分类标签与由另一个用户定义的分类标签相关联的系统和方法 - Google Patents

用于将一个用户的分类标签与由另一个用户定义的分类标签相关联的系统和方法 Download PDF

Info

Publication number
CN101578600A
CN101578600A CNA200780015816XA CN200780015816A CN101578600A CN 101578600 A CN101578600 A CN 101578600A CN A200780015816X A CNA200780015816X A CN A200780015816XA CN 200780015816 A CN200780015816 A CN 200780015816A CN 101578600 A CN101578600 A CN 101578600A
Authority
CN
China
Prior art keywords
tag along
along sort
content item
message
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200780015816XA
Other languages
English (en)
Inventor
J·斯科罗尼克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN101578600A publication Critical patent/CN101578600A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种处理来自系统(1-4)用户的消息的方法,该系统用于存储表示内容项目(12)的第一集合(11)的数据组,每个内容项目包括至少一个可感知的内容元素的记录,该方法包括获取表示分类标签对第一集合(11)中的内容项目(12)的第一指定的信息(13;19),其中所述消息包括在第一指定中使用的分类标签的指示。该方法进一步包括:获取表示分类标签对内容项目(12)的第二指定的信息(14),该内容项目包括至少一个可感知内容元素的记录;以及通过确定指定了在第一指定的消息中指示的分类标签的内容项目(12)与指定了第二指定中的分类标签的内容项目(12)之间的相似度,将在所述消息中指示的分类标签与在第二指定中使用的至少一个分类标签的指示进行匹配。

Description

用于将一个用户的分类标签与由另一个用户定义的分类标签相关联的系统和方法
技术领域
本发明涉及一种处理来自系统用户的消息的方法,该系统用于存储表示内容项目的第一集合的数据组。本发明还涉及一种被配置以实施这种方法的系统,以及涉及一种计算机程序。
背景技术
US5918223中已知这种方法、系统和计算机程序的实例。该公布描述了一种基于数据文件内容来执行音频数据文件的分析与比较的系统。该音频数据分析产生一组数值(特征向量),其可以用于将典型地存储在多媒体数据库中或在万维网上的各个音频文件之间的相似性分类和分级。基于对一组隶属于用户定义的分类的音频文件的分析,该分析还方便了对用户定义的音频文件分类的描述。因此,所述已知的系统提供了一种用于发现听起来与预定义分类的声音相似的音频数据文件的装置。
所述已知系统的问题是,对于基于用户定义的分类的每个查询,都要重新执行用于分类和分级的分析,并返回各个独立的文件。例如,当所述已知的方法应用于存储在第二用户的便携式媒体播放器中的第二用户的音乐集合时,这个问题可能出现。
发明内容
本发明的目的是提供一种在起始段定义的方法、系统和计算机程序,其提供了在涉及内容项目的通信中使用内容项目的用户分类的一种更有效的方式。
这个目的可通过根据本发明的方法来实现,该方法包括步骤:获取表示分类标签对内容项目的第二指定的信息,该内容项目包括至少一个可察觉内容元素的记录,和
通过确定被指定了在第一指定的所述消息中指示的分类标签的内容项目和被指定了第二指定中的分类标签的内容项目之间的相似度,
将在所述消息中指示的分类标签与在所述第二指定中使用的至少一个分类标签的指示进行匹配。
因为所述消息包括在第一指定中使用的分类标签的指示,它适合于连同由用户制定的分类标签的第一指定进行使用,该用户也可以生成所述消息。因为获得了在第二指定中使用的至少一个分类标签的指示,所述方法适合用于第一指定中使用的分类标签与由另一个用户执行的第二指定中使用的分类标签之间变换。它比在另一个集合中的各个独立内容项目的检索更高效,因为通过匹配获得的分类标签实现了对被指定了第二指定中的标签的内容项目的更快检索。可以通过返回的分类标签来检索内容项目,用该分类标签注解了它的记录。由于通过确定被指定了第一指定的消息中指示的分类标签的内容项目与被指定了第二指定中的分类标签的内容项目之间的相似度而进行内容标签的匹配,所述变换应该能在数据处理系统上执行。因为每个内容项目包括至少一个可察觉内容元素的记录,由这种处理系统所确定的相似性可能对应于由用户制造的分类。
注意到US2003/0037036公开了一种生成用于分类系统的规则的方法。实施第一水平的专家分类,从而专家对数据库中的一组训练歌曲进行分类。在人工分类处理之前、之后或同时,来自数据库的歌曲根据数字信号处理(DSP)技术而被分类。然后,对于比如歌曲的一段给定媒体的所述定量的机器分类和定量的人工分类被置于所谓分类链中。机器学习分类模块结合人工完成的分类和机器完成的分类,并且特别地,当趋势满足某种标准时创建一规则。该技术将预定义的参数空间映射到由音乐专家定义的心理声学感知空间。为了一致地应用分类技术,人们被训练成为或被鉴定为“音乐专家”。因此,这个已知的方法既不涉及分类标签的第二指定,也不涉及确定被指定了第一指定的所述消息中指示的分类标签的内容项目和被指定了第二指定中的分类标签的内容项目之间的相似度。主要由于这些原因,新用户必须被训练成为音乐专家,即正确应用通用的分类。
实施例包括,通过比较来源于包括在被指定了第一指定的消息中指示的分类标签的各个内容项目中的可感知内容元素的至少一个记录的至少部分的表示的数据与来源于包括在被指定了第二指定中的分类标签的各个内容项目的可感知内容元素的至少一个记录的至少部分的表示的数据,来确定相似度。
效果是对于与分类标签的第二指定相同的内容项目集合,不需要进行分类标签的第一指定。
在实施例中,所述被比较的数据包括来源于可感知内容元素的至少一个记录的至少部分的参数表示的数据,通过将至少一个预定义的分析算法应用于至少所述部分可获得每个参数表示。
效果是所述比较可以更高效地实施,并因此更快。
实施例包括获取识别由组成所述参数表示的可能范围的参数定义的特征空间内的第一子空间的数据,所述识别第一子空间的数据表示由可感知内容元素的至少一个记录的至少部分的参数表示跨越的一部分空间,该可感知内容元素包含在被指定了第一指定的消息中指示的分类标签的内容项目中,和
确定特征空间中带有点的第一子空间或其他子空间的距离或重叠度,其表示由至少一个可感知内容元素的所述记录的至少部分的参数表示,该可感知内容元素包含在被指定了第二指定中的分类标签的内容项目中。
这实现了相对高效和准确地决定第一指定中使用的分类标签和第二指定中使用的分类标签之间的对应关系。子空间基于被指定了相同分类标签的几个内容项目。相对于对可感知内容项目的各个记录的几个独立参数表示进行比较,对子空间进行比较是相对高效的。
在实施例中,经过网络链路由系统获得用于识别第一子空间的数据,以用于根据存储了表示内容项目的第一集合的数据组的所述系统来确定所述距离或重叠度。
这种在分布式系统(例如基于互联网的推荐系统)中的实施,其特征在于系统之间相对高效的通信,因为内容项目的整个记录不需要都通过该网络链路传输。
在一实施例中,分类标签的指示作为字符串包含在消息主体中,该实例包括
至少返回带有字符串的消息主体,所述字符串被对第二指定中使用的至少一个分类标签的返回指示进行编码的字符串取代或链接到所述对第二指定中使用的至少一个分类标签的返回指示进行编码的字符串。
这个实施例相对适合使用在用于讨论媒体项目(例如电影,歌曲等)的网络论坛中。由一个用户使用的描述所述媒体项目的分类被(直接地或基于链路的激活来)自动转换为由论坛中的其他参与者使用的分类。
实施例进一步包括使用至少一个分类标签,其指示被返回以制定用于搜索表示内容项目的第二集合的数据组的数据库的查询,每个内容项目包括至少一个可感知内容元素的记录,至少一些数据组与对应于在第二指定中指定的分类标签的分类标签相关联地被存储。
这是采用由第一用户使用的分类指示搜索数据库的相对高效的方法,其中另一个实体已经注释了基于他或她自己的分类标签组的第二集合。
根据本发明的另一方面,提供了用于处理来自系统用户的消息的系统,该系统用于存储表示内容项目的第一集合的数据组,每个内容项目包括至少一个可感知内容元素的记录,其被配置以执行根据本发明的方法。
该系统可以实施在媒体播放器中,例如便携式媒体播放器。本发明也可以用服务器实现,该服务器用于提供将由一个用户定义的分类变换为由其他用户定义的另一个分类的服务。该服务器可以配置用于与不同用户的个人设备进行通信,该设备存储着指定了用户定义的分类或注释的媒体内容项目。
根据本发明的另一方面,提供一种包括一组指令的计算机程序,,当该程序集成到机读介质时,所述指令能够使得具有信息处理能力的系统执行本发明的方法。
附图说明
参照附图,本发明将被进一步详细地说明,其中:
图1以示意性的方式示出了部分用于实现处理来自用户的包括分类标签指示的消息的各种方法的分布式计算环境;
图2以示意性的方式示出了包括可感知内容元素的记录的文件集合;
图3是说明用户资料生成的流程图;和
图4是说明由用于主持网络论坛的服务器执行的方法的流程图。
具体实施方式
图1以这种示意性方式示出了第一个人计算机1、第二个人计算机2、第一媒体播放器3和第二媒体播放器4如何连接到网络5。该网络5可以是局域网、广域网或例如互联网的大型广域网。服务器6同样连接到网络5。第一和第二个人计算机1、2与第一和第二媒体播放器3、4中的每一个都包括处理器和用于存储由处理器执行的指令的存储器(未详细示出)。第一和第二个人计算机1、2分别包括第一和第二输入设备7、8,以及第一和第二输出设备9,10。第一和第二输出设备9、10中的每一个包括至少一个视频显示单元(VDU)。
第一和第二个人计算机1、2与第一和第二媒体播放器3、4中的每一个进一步包括各自的用于存储媒体文件的存储设备(未示出)。下面,由所述媒体文件表示的内容项目将被假定为音轨。在其他实施例中,媒体文件另外将包括与至少一个音轨同步的视频片段。在另外的实施例中,媒体文件由图像或文档以特殊种类的标记语言组成。在所有情况下,表示内容项目的文件包括至少一个可感知内容元素的记录。该记录适合于被合适的设备呈现以使得其被感知。所述内容元素可以是诸如图像或图像序列的可见的内容元素,可听的内容元素,或它们的组合。
图2示出音频文件12a-12i的集合11。每个音频文件12包括以被编码和可选地被压缩的形式的音轨的记录。此外,每个音频文件12可以包括注释,比如关于音轨的信息,例如表演艺术家的名字,音轨标题等。在一个变形中(未示出),每个音频文件12包括表示一个或多个分类标签的信息。在图2示出的变形中,与第一用户相关的第一表13和与第二用户相关的第二表14,包括将分类标签与音频文件12a-12i中所选择的音频文件相关联的信息。第一表13包括表示分类标签对音频文件12的第一指定的信息。第二表14包括表示分类标签对音频文件12的第二指定的信息。
在一个变形中,所述分类标签由用户从一组预定义的分类标签中选择并由用户指派给音频文件12a-12i中的那些他认为落入了所标分类中的音频文件。在另一个变形中,用户确定分类标签。可以理解,在两种情况下,由于包含在音频文件12a-12i中的音轨的不同评价,第一表13不同于第二表14。进一步注意到,一个音频文件12可以被指定多个分类标签。
注意到,在第一和第二个人计算机1、2与第一和第二媒体播放器3、4中的每一个中将存在音频文件的不同集合。在其他实施例中,在所述设备中只有一个诸如第一和第二列表13、14的列表。如果多个用户分享用于呈现所述可感知内容元素的所述设备,那么这一个列表不需要与特定用户相关联。
在操作中,第一和第二个人计算机1、2与第一和第二媒体播放器3、4中的每一个执行如图3所示的方法。根据所述变形,有条件地或定期地实现这个方法。它运行于第一和第二列表13、14中的一个上,即使用分类标签对音频文件12的一个指定。这里,假定使用第一列表13。
在第一步骤15中,从第一列表13中检索分类标签。接下来(步骤16),在集合11中识别指定了那个分类标签的音频文件12。接着(步骤17),对于每个被识别的音频文件12检索特征向量。
特征向量是包含在相关音频文件12内的至少一部分音轨的参数表示。通过将至少一个预定义的分析算法应用到所述部分,可以得到每个参数表示。所述特征向量包括多个元素,每个元素构成了量化多维特征空间的尺度的参数值。所述多维特征空间感性地描述了音轨的重要属性。通过将预定义的分析算法应用于表示至少一部分特定音轨的信号,来获得与该特定音轨关联的特征向量中的每个值。在某个实施例中,分析多个信号(每个信号基于音轨的不同部分)。在这种情况下,特征向量中不同的值可能与不同的部分有关。
使用基于预定的分析算法的计算方法确保所述特征向量是至少一部分所述相关音轨的可感知属性的客观表征。与将所述相关音轨的全部进行编码的表示方法相比,它更加紧凑。
根据所述实施方法,所述分析算法可以采用PCM(脉冲编码调制)值、DCT(离散余弦变换)系数或编码音频信号的任意其他方便的形式作为输入。像这样的用于可感知地量化音轨的重要属性的合适分析算法是公知的。因此,在这里没有非常详细地描述它们。在Klapuri等人的“Analysis of the Meter of Acoustic Musical Signals”,IEEETrans.Speech and Audio Proc.中描述了一个实例。该文章描述了一种在触觉、触感和测量水平上分析声学音乐信号的计量的方法,所述信号对应于不同的时间尺度。例如该结果可以用于识别音乐流派(古典、爵士等等)。另一个可以用于获得表征一部分音轨的参数的算法的实例,出现在Sheirer,E.D.在1998年1月的“Tempo and beatanalysis of acoustic usical signals”,J.Acoust.Soc.Am.,103(1)中。进一步的可能性是使用如在语音识别算法中也被采用的Mel频率倒谱系数来建模音轨或部分音轨。
在读取所述特征向量的步骤17之后,确定识别所述多维特征空间内的子空间的一组数据(步骤18)。该子空间表示由处理步骤17中所读取的特征向量贯穿的所述多维特征空间的一部分。在图示的实施例中,该步骤18包括针对在前面的步骤17中读取的特征向量的集合中的特征向量的每个元素,计算其均值和标准偏差。在可替代的实施例中,确定最大和最小值。
在随后的步骤20中,将步骤18中导出的数据输入表19。表19将在第一列表13中定义的每个分类标签链接到识别所述特征空间内的子空间的一组数据。为了完成表19,接下来的步骤21包括在第一列表搜索新的分类标签。如果发现,则重复步骤15-18、20、21。否则,终止图3所示的流程。
表19可用于将第一列表13中的分类标签变换为第二列表14中的分类标签。为了实施这个转换,获得基于第二列表14的第二版本的表19。表19中存在的分类标签作为消息中的输入(“搜索分类”)而被接收。从表19中读取定义与分类标签相关的子空间的数据。然后,确定基于第二列表14的在所述表中定义的每个子空间的重叠度,从而识别第二列表14中对应于搜索分类的分类标签。在一个可替代方案中,返回与具有最大重叠度的子空间相关联的分类标签。在另一个实施例中,返回第二列表14中的、与具有高于预定义的最小重叠度的各个子空间相关联的所有分类标签。在又一个实施例中,使用距离测量,从而甚至第二列表14中的、与这样的子空间相关联的分类标签可以作为输出而被返回,所述这样的子空间不和与所述搜索分类相关联的子空间重叠。这些可替代方案的组合也是可以想象的,其中如果另一个没有结果,则只进行一个或多个比较。例如,如果在子空间之间没有重叠,可以使用所述距离量度。在一个可替代方案中,相似度的类型取决于用户输入。例如,在用户想要为特定的音乐分类拓宽他的喜好的情况下,所述距离量度可以用于取代重叠度的确定。
在可替代的粗略的变换中,为第二列表14中的每个分类标签读取一个特征向量。然后,决定哪个特征向量位于对应于所述搜索分类标签的子空间内和/或哪个特征向量最接近于根据预定义的距离度量的子空间。
两个涉及使用定义特征空间中子空间的数据来进行的分类标签之间的转换的应用将被描述。在第一应用中,基于第一列表13而生成的表19用于在存储于另一个设备的集合中搜寻音频文件。在第二应用中,链接到特定用户的这种表19用于将记录中的文本串转换为网络论坛或布告栏。
例如对于第一应用,第二媒体播放器4可以实施来确定到与所述搜索分类相关联的子空间的距离,或与所述子空间的重叠度。为此目的,将表示表19的数据从第一媒体播放器3传输到第二媒体播放器4。包括所述搜索分类标签的消息,经由第二媒体播放器4上的控制直接地或者作为从第一媒体播放器3到第二媒体播放器4的消息,被输入到第二媒体播放器4。第二媒体播放器4返回一个或多个指定给存储在第二媒体播放器4中的音频文件12的分类标签。所述返回的分类标签可以用于例如制定用来搜索音频文件数据库的查询,每一个音频文件与分类标签相关联地存储,而所述分类标签对应于由第二媒体播放器4的用户指定的分类标签。因此,分类标签的转换可以用于执行对于将要被从第二媒体播放器4传输到第一媒体播放器3的音频文件的相对较快的搜寻。
图4示出了第二应用。在该情况下,服务器6实施由不同用户使用的分类标签之间的转换。服务器6被配置以执行用于提供网络论坛工具的软件。在该实例中,网络论坛涉及音频文件。如果网络论坛涉及其他类型的内容项目(例如视频或图像文件),则应用相同的原则。
诸如图3示出的表19的表与所述工具的每个注册用户相关联。它包括由相关联用户使用的分类标签。在可感知特征空间中定义子空间的一组数据与每个分类标签一起存储。通过将图3的方法应用于用户已经向其指定了分类标签的音频文件的集合来确定该组数据。
当用户登录到所述网络论坛时,例如通过用户名识别他或她(步骤22)。如果该用户是新用户,与该用户相关联的表19被上传到服务器(步骤23)。如果该用户是已知的,从与服务器6相关联的存储设备检索表19(步骤24)。
服务器6从第一用户接收命令来观看由其他用户发布的特定消息(步骤25)。确定其他用户的身份(步骤26)以检索与所述其他用户相关联的表19(步骤27)。也读取所述发布的消息(步骤28)。它包括消息主体,该消息主体包括编码的字符串。对应于在与所述其他用户相关联的表19中存在的分类标签的字符串被确定并被转换为与第一用户相关联的表19中的分类标签(步骤29)。该步骤29包括使用上述方法之一来确定相似度。然后,表示由消息发布者使用的分类标签的字符串被表示由第一用户使用的分类标签的字符串取代,或者被链接到所述表示由第一用户使用的分类标签的字符串。然后,已转换的消息或设有链接的消息作为消息被传输到第一用户以用于在第一和第二输出设备9、10之一上显示。
如果提供了链接,将元数据附加到对由消息发布者使用的分类标签进行编码的字符串。该元数据将所述字符串变成了活动元素,从而当第一用户提供选择所述活动元素的命令时,显示表示由第一用户使用的分类标签的字符串。如现有技术中已知的,该命令可以通过将光标置于所述活动元素之上来提供。
上面描述的应用具有共同之处:使用客观上可推导的特征向量空间,将由一个用户指定的分类标签转换为由另一个用户指定的分类标签。因此,方便了用户之间的通信,并且防止了由于误解而产生的不必要的通信。
应该注意,上述实施例用于说明而非限制本发明,并且本领域技术人员应该能够设计许多不脱离所附权利要求的范围的可替代实施例。在权利要求中,位于括号中的任何附图标记不应被解释来限制所述权利要求。元件之前的词语“一”不排除多个这种元件的存在。在相互不同的从属权利要求中叙述的某些方法,事实上不表示这些方法的组合不能有利地被使用。
例如,在相同的或基本相同的内容项目集合上已经实施了分类标签的第一指定和分类标签的第二指定。指定了第一指定的消息中的分类标签的内容项目与指定了第二指定中的分类标签的内容项目之间的相似度可以是内容项目的特性和/或该内容项目的注释,比如标题、表演艺术家等。在分布式系统中,将指定的分类标签与内容项目相关联的数据可以被存储,并且所述内容项目本身可以存储在不同的设备上。在实施例中,可以通过例如光学或无线数据链路的个人区域网络链路在第一和第二媒体播放器3、4之间传输数据。

Claims (9)

1.处理来自系统(1-4)用户的消息的方法,该系统用于存储表示内容项目(12)的第一集合(11)的数据组,每个内容项目(12)包括至少一个可感知内容元素的记录,该方法包括
获取表示分类标签对第一集合(11)中内容项目(12)的第一指定的信息(13;19),
其中所述消息包括在第一指定中使用的分类标签的指示,
获取表示分类标签对内容项目(12)的第二指定的信息(14),该内容项目(12)包括至少一个可感知内容元素的记录,和
通过确定指定了在第一指定的消息中指示的分类标签的内容项目(12)与指定了在第二指定中的分类标签的内容项目(12)之间的相似度,
将在所述消息中指示的分类标签与在所述第二指定中使用的至少一个分类标签的指示进行匹配。
2.根据权利要求1的方法,包括通过比较由包含在指定了在第一指定的消息中指示的分类标签的各个内容项目(12)中的可感知内容元素的至少一个记录的至少部分的表示所导出的数据与由包含在指定了第二指定中的分类标签的各个内容项目中的可感知内容元素的至少一个记录的至少部分的表示所导出的数据,来确定相似度。
3.根据权利要求2的方法,其中被比较的数据包括由可感知内容元素的至少一个记录的至少部分的参数表示所导出的数据,每个参数表示可通过将至少一个预定的分析算法应用到至少所述部分来获得。
4.根据权利要求3的方法,包括获取用于识别由构成所述参数表示的可能范围的参数定义的特征空间内的第一子空间的数据,所述用于识别第一子空间的数据表示由包含在指定了在第一指定的消息中指示的分类标签的内容项目中的可感知内容元素的至少一个记录的至少部分的参数表示贯穿的一部分空间,以及
确定特征空间中具有点的第一子空间或其他子空间的距离或重叠度,其表示了包含在指定了第二指定中的分类标签的内容项目中的至少一个可感知内容元素的至少部分记录的参数表示。
5.根据权利要求4的方法,其中用于识别所述第一子空间的数据通过网络链路(5)由系统(1-4,6)获得,以用于根据存储了表示内容项目(12)的第一集合的数据组的所述系统(1-4)来确定所述距离或重叠度。
6.根据权利要求1-5中任意一个的方法,其中分类标签的指示作为字符串包含在消息主体中,该方法包括
至少返回带有字符串的消息主体,所述字符串由对第二指定中使用的至少一个分类标签的返回指示进行编码的字符串取代,或者所述字符串链接到所述对第二指定中使用的至少一个分类标签的返回指示进行编码的字符串。
7.根据权利要求1-6中任意一个的方法,进一步包括使用至少一个所述分类标签,返回所述分类标签的指示以制定用于搜寻表示内容项目(12)的第二集合的数据组的数据库的查询,每个内容项目(12)包括至少一个可感知内容元素的记录,至少一些数据组与对应于在第二指定中指定的分类标签的分类标签相关联地存储。
8.用于处理来自系统(1-4)用户的消息的系统,该系统用于存储表示内容项目(12)的第一集合的数据组,每个内容项目(12)包括至少一个可感知内容元素的记录,其被配置以执行根据权利要求1-7中任意一个的方法。
9.包括一组指令的计算机程序,当该计算机程序集成到机读介质时,该指令能够使得具有信息处理能力的系统执行根据权利要求1-7中任意一个的方法。
CNA200780015816XA 2006-05-02 2007-04-20 用于将一个用户的分类标签与由另一个用户定义的分类标签相关联的系统和方法 Pending CN101578600A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP06113346.8 2006-05-02
EP06113346 2006-05-02

Publications (1)

Publication Number Publication Date
CN101578600A true CN101578600A (zh) 2009-11-11

Family

ID=38655893

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200780015816XA Pending CN101578600A (zh) 2006-05-02 2007-04-20 用于将一个用户的分类标签与由另一个用户定义的分类标签相关联的系统和方法

Country Status (5)

Country Link
US (1) US20090132508A1 (zh)
EP (1) EP2035967A2 (zh)
JP (1) JP2009535671A (zh)
CN (1) CN101578600A (zh)
WO (1) WO2007125467A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103080924A (zh) * 2010-09-14 2013-05-01 国际商业机器公司 用于处理数据集的方法和布置、数据处理程序和计算机程序产品
CN102693273B (zh) * 2011-03-18 2016-12-21 微软技术许可有限责任公司 无监督消息聚类
CN111931041A (zh) * 2020-07-03 2020-11-13 武汉卓尔数字传媒科技有限公司 一种标签推荐方法、装置、电子设备及存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408964B (zh) * 2008-11-25 2016-03-30 阿里巴巴集团控股有限公司 电子商务网站的前台类目调整方法及装置
US10685006B2 (en) 2016-10-21 2020-06-16 Open Text Sa Ulc Content management system and method for synchronizing content translations
US11372910B2 (en) 2017-06-20 2022-06-28 Google Llc Methods, systems, and media for generating a group of media content items
CN113239229A (zh) * 2021-06-17 2021-08-10 张鹏涛 一种智能筛选数据处理方法、系统及云平台

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5918223A (en) 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US6606624B1 (en) * 1999-08-13 2003-08-12 The Regents Of The University Of California Apparatus and method for recommending to an individual selective information contained within a computer network
US20020049760A1 (en) * 2000-06-16 2002-04-25 Flycode, Inc. Technique for accessing information in a peer-to-peer network
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
US6987221B2 (en) * 2002-05-30 2006-01-17 Microsoft Corporation Auto playlist generation with multiple seed songs
EP1540550A4 (en) * 2002-08-19 2006-09-27 Choicestream PERSONALIZED STATISTICAL RECOMMENDATION SYSTEM
US7774409B2 (en) * 2002-08-27 2010-08-10 International Business Machines Corporation Providing common contact discovery and management to electronic mail users
JP2005234994A (ja) * 2004-02-20 2005-09-02 Fujitsu Ltd 類似度判定プログラム、マルチメディアデータ検索プログラム、類似度判定方法、および類似度判定装置
JP4557987B2 (ja) * 2004-12-17 2010-10-06 パナソニック株式会社 コンテンツ推薦装置
US7788296B2 (en) * 2005-12-29 2010-08-31 Guidewire Software, Inc. Method and apparatus for managing a computer-based address book for incident-related work

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103080924A (zh) * 2010-09-14 2013-05-01 国际商业机器公司 用于处理数据集的方法和布置、数据处理程序和计算机程序产品
CN103080924B (zh) * 2010-09-14 2016-09-07 国际商业机器公司 用于处理数据集的方法和装置
CN102693273B (zh) * 2011-03-18 2016-12-21 微软技术许可有限责任公司 无监督消息聚类
CN111931041A (zh) * 2020-07-03 2020-11-13 武汉卓尔数字传媒科技有限公司 一种标签推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
EP2035967A2 (en) 2009-03-18
WO2007125467A2 (en) 2007-11-08
WO2007125467A3 (en) 2009-01-29
US20090132508A1 (en) 2009-05-21
JP2009535671A (ja) 2009-10-01

Similar Documents

Publication Publication Date Title
US8041734B2 (en) System and method for storing and retrieving non-text-based information
US7544881B2 (en) Music-piece classifying apparatus and method, and related computer program
Typke et al. A survey of music information retrieval systems
Kaminskas et al. Location-aware music recommendation using auto-tagging and hybrid matching
Levy et al. Music information retrieval using social tags and audio
CN102023995B (zh) 语音检索设备和语音检索方法
TWI396105B (zh) 用於模擬個體差異之個人化資訊檢索之數位資料處理方法及其電腦裝置可讀式資訊儲存媒體與資訊檢索系統
CN101578600A (zh) 用于将一个用户的分类标签与由另一个用户定义的分类标签相关联的系统和方法
CN101770507A (zh) 数据处理设备、数据处理方法和程序
CN111192601A (zh) 音乐标注方法、装置、电子设备及介质
KR100695149B1 (ko) 지식기반 음악검색 방법 및 장치와 그 장치의 음악파일관리 방법 및 장치
Hyung et al. Utilizing context-relevant keywords extracted from a large collection of user-generated documents for music discovery
CN106997340B (zh) 词库的生成以及利用词库的文档分类方法及装置
CN106294563B (zh) 一种多媒体数据的处理方法和装置
Wang et al. Query by multi-tags with multi-level preferences for content-based music retrieval
CN102982072B (zh) 一种可视化概念检测器及构造语义场的方法
Liu Effective results ranking for mobile query by singing/humming using a hybrid recommendation mechanism
Karydis et al. Comparing content and context based similarity for musical data
Martínez et al. Extending the folksonomies of freesound. org using content-based audio analysis
Porcaro et al. Recognizing musical entities in user-generated content
Orio et al. MusiClef: multimodal music tagging task
KR101738771B1 (ko) 멜로디에 기반한 음악 분류 방법 및 음악 데이터베이스를 이용하여 멜로디 라인을 추천하는 방법
EP4336381A1 (en) System and method for music entity matching
Hachmeier et al. Music Version Retrieval from YouTube: How to Formulate Effective Search Queries?
Doh et al. Musical Word Embedding for Music Tagging and Retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091111