CN113127676B - 信息匹配方法、系统、装置、存储介质及电子设备 - Google Patents

信息匹配方法、系统、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN113127676B
CN113127676B CN202110534990.7A CN202110534990A CN113127676B CN 113127676 B CN113127676 B CN 113127676B CN 202110534990 A CN202110534990 A CN 202110534990A CN 113127676 B CN113127676 B CN 113127676B
Authority
CN
China
Prior art keywords
performer
matching
initial
matched
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110534990.7A
Other languages
English (en)
Other versions
CN113127676A (zh
Inventor
吴敬达
廖祥俐
周斯航
蔡辉
曹偲
邵东风
张伟龙
谭瑶
骆德腾
邹曜
王紫琦
周翔
林磊磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Cloud Music Technology Co Ltd
Original Assignee
Hangzhou Netease Cloud Music Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Netease Cloud Music Technology Co Ltd filed Critical Hangzhou Netease Cloud Music Technology Co Ltd
Priority to CN202110534990.7A priority Critical patent/CN113127676B/zh
Publication of CN113127676A publication Critical patent/CN113127676A/zh
Application granted granted Critical
Publication of CN113127676B publication Critical patent/CN113127676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施方式提供了一种信息匹配方法、系统、装置、介质及电子设备,涉及计算机技术领域。该方法包括:获取待匹配音频集合以及待匹配音频集合的基本信息;根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及基本信息;确定待匹配音频集合与初始音频集合之间的音色匹配度;根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者。本公开可以有效提高待匹配音频集合与目标表演者之间的匹配度。

Description

信息匹配方法、系统、装置、存储介质及电子设备
技术领域
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及信息匹配方法、信息匹配系统、信息匹配装置、计算机可读存储介质及电子设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
音乐专辑(Music Album),简称专辑,是指将一定数量以上的歌曲或乐曲集结在一起,并对外发行的一种媒体。专辑入库可以是版权方将专辑歌曲物料传输到文件传输协议(File Transfer Protocol,FTP)服务器,再将物料录入音乐数据库的过程。专辑入库可以被分为物料扫描、物料上传、物料解析、匹配服务四个步骤。
以某一音乐应用程序为例,专辑入库的相关数据统计为平均每天2万张专辑,17万首歌曲,其中,专辑、歌曲均需要进行所属艺人的匹配勾选服务。在进行专辑入库时,可以根据艺人名字进行文本搜索,如果文本搜索结果只有一个则直接进行自动勾选,如果文本搜索结果有多个则需要人工介入确认选择一个艺人进行勾选关联。
发明内容
然而,现有的专辑入库所属艺人的匹配勾选服务仅通过一次文本搜索得到的结果不够准确,甚至会出现实际不相关的结果。
为此,本公开提出一种改进的信息匹配方法,以提高待入库的待匹配音频集合与音乐数据库中的表演者之间的匹配正确率,以及目标表演者的默认关联准确率,并减少人力投入成本。
在本上下文中,本公开的实施方式期望提供一种信息匹配方法、信息匹配系统、信息匹配装置、计算机可读存储介质及电子设备。
在本公开实施方式的第一方面中,提供了一种信息匹配方法,包括:获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;确定待匹配音频集合与初始音频集合之间的音色匹配度;根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。
在本公开的一个实施例中,在根据作品表演者信息确定与作品表演者对应的初始匹配表演者之前,上述方法还包括:基于待匹配音频集合的基本信息确定待匹配音频集合对应的待匹配公司信息;根据作品表演者信息与待匹配公司信息生成搜索字符串;根据搜索字符串并基于音乐数据库进行搜索处理,若搜索得到匹配的表演者,则将该匹配的表演者确定为与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理;否则,根据作品表演者信息确定与作品表演者对应的初始匹配表演者。
在本公开的一个实施例中,对待匹配音频集合与目标表演者进行关联处理,包括:获取目标表演者的目标表演者标识;基于目标表演者标识生成待匹配音频集合与目标表演者之间的音频匹配关系;根据目标表演者标识将音频匹配关系存储至音乐数据库。
在本公开的一个实施例中,根据作品表演者信息确定与作品表演者对应的初始匹配表演者,包括:基于作品表演者信息确定待匹配音频集合对应的作品表演者名称;作品表演者名称包括原始名称和扩展名称;根据原始名称进行文本搜索处理,以得到第一匹配表演者;根据扩展名称进行文本搜索处理,以得到第二匹配表演者;根据第一匹配表演者与第二匹配表演者确定初始匹配表演者。
在本公开的一个实施例中,初始匹配表演者的数量为多个,根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度,包括:根据待匹配音频集合的基本信息与初始音频集合的基本信息确定待匹配音频集合的作品表演者与各初始匹配表演者之间的地区匹配度与公司匹配度;获取音色匹配度,并根据音色匹配度、地区匹配度与公司匹配度确定关联匹配度。
在本公开的一个实施例中,根据待匹配音频集合的基本信息与初始音频集合的基本信息确定待匹配音频集合的作品表演者与各初始匹配表演者之间的地区匹配度与公司匹配度,包括:基于待匹配音频集合的基本信息确定作品表演者对应的待匹配地区信息与待匹配公司信息;基于初始音频集合的基本信息确定初始匹配表演者对应的初始地区信息与初始公司信息;将待匹配地区信息与初始地区信息之间的匹配度确定为地区匹配度;将待匹配公司信息与初始公司信息之间的匹配度确定为公司匹配度。
在本公开的一个实施例中,初始公司信息的数量为多个,将待匹配公司信息与初始公司信息之间的匹配度确定为公司匹配度,包括:确定待匹配公司信息中是否包含原始公司名称;原始公司名称包括待匹配音频集合对应的发行公司名称,和/或创作公司名称;如果待匹配公司信息中包含原始公司名称,则分别根据各初始公司信息确定多个初始公司名称;初始公司名称包括初始音频集合中仅包含单个表演者的初始音频集合对应的发行公司名称,和/或创作公司名称;将原始公司名称分别与多个初始公司名称进行逐个对比,以确定公司匹配度。
在本公开的一个实施例中,确定待匹配音频集合与初始音频集合之间的音色匹配度,包括:从待匹配音频集合中确定待匹配音频;待匹配音频所对应的表演者数量为一个;从初始音频集合中确定初始音频;初始音频所对应的表演者数量为一个;对待匹配音频与初始音频进行匹配度计算,根据待匹配音频与初始音频之间的匹配度确定音色匹配度。
在本公开的一个实施例中,根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,包括:将关联匹配度大于匹配度阈值的初始匹配表演者确定为初始候选表演者;根据关联匹配度从初始候选表演者中确定候选匹配表演者,并确定候选匹配表演者对应的候选表演者数量;候选匹配表演者是具有最大关联匹配度的初始候选表演者;如果候选表演者数量为一个,则将候选匹配表演者确定为目标表演者;如果候选表演者数量为多个,则确定多个候选匹配表演者对应的表演者热度;将具有最大表演者热度的候选匹配表演者确定为目标表演者。
在本公开的一个实施例中,上述方法还包括:如果关联匹配度均不大于匹配度阈值,则确定初始匹配表演者是否基于扩展名称得到,且初始匹配表演者是否属于黑名单表演者集合;如果初始匹配表演者不是基于扩展名称得到,且初始匹配表演者不属于黑名单表演者集合,则生成待匹配音频集合对应的作品表演者的作品表演者标识;根据待匹配音频集合、作品表演者信息与待匹配公司信息生成音频匹配关系;将作品表演者标识与音频匹配关系对应存储至音乐数据库。
在本公开实施方式的第二方面中,提供了一种信息匹配系统,包括:信息获取端、匹配平台;信息获取端,用于获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;匹配平台,用于确定与待匹配音频集合匹配的目标表演者;匹配平台包括初始匹配子平台、音视频处理子平台与关联匹配子平台;初始匹配子平台,用于根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;音视频处理平台,用于确定待匹配音频集合与初始音频集合之间的音色匹配度;关联匹配子平台,用于根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度,以根据关联匹配度从初始匹配表演者中确定目标表演者。
在本公开实施方式的第三方面中,提供了一种信息匹配装置,包括:信息获取模块,用于获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;信息确定模块,用于根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;音色匹配模块,用于确定待匹配音频集合与初始音频集合之间的音色匹配度;关联匹配模块,用于根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;目标表演者确定模块,用于根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。
在本公开的一个实施例中,信息匹配装置还包括信息匹配模块,用于基于待匹配音频集合的基本信息确定待匹配音频集合对应的待匹配公司信息;根据作品表演者信息与待匹配公司信息生成搜索字符串;根据搜索字符串并基于音乐数据库进行搜索处理,若搜索得到匹配的表演者,则将该匹配的表演者确定为与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理;否则,根据作品表演者信息确定与作品表演者对应的初始匹配表演者。
在本公开的一个实施例中,信息匹配装置还包括第一关联模块,用于获取目标表演者的目标表演者标识;基于目标表演者标识生成待匹配音频集合与目标表演者之间的音频匹配关系;根据目标表演者标识将音频匹配关系存储至音乐数据库。
在本公开的一个实施例中,信息确定模块包括初始表演者确定单元,用于基于作品表演者信息确定待匹配音频集合对应的作品表演者名称;作品表演者名称包括原始名称和扩展名称;根据原始名称进行文本搜索处理,以得到第一匹配表演者;根据扩展名称进行文本搜索处理,以得到第二匹配表演者;根据第一匹配表演者与第二匹配表演者确定初始匹配表演者。
在本公开的一个实施例中,关联匹配模块包括关联匹配单元,用于根据待匹配音频集合的基本信息与初始音频集合的基本信息确定待匹配音频集合的作品表演者与各初始匹配表演者之间的地区匹配度与公司匹配度;获取音色匹配度,并根据音色匹配度、地区匹配度与公司匹配度确定关联匹配度。
在本公开的一个实施例中,关联匹配模块包括待匹配信息确定单元,用于基于待匹配音频集合的基本信息确定作品表演者对应的待匹配地区信息与待匹配公司信息;初始信息确定单元,用于基于初始音频集合的基本信息确定初始匹配表演者对应的初始地区信息与初始公司信息;地区匹配度确定单元,用于将待匹配地区信息与初始地区信息之间的匹配度确定为地区匹配度;公司匹配度确定单元,用于将待匹配公司信息与初始公司信息之间的匹配度确定为公司匹配度。
在本公开的一个实施例中,公司匹配度确定单元被配置为:确定待匹配公司信息中是否包含原始公司名称;原始公司名称包括待匹配音频集合对应的发行公司名称,和/或创作公司名称;如果待匹配公司信息中包含原始公司名称,则分别根据各初始公司信息确定多个初始公司名称;初始公司名称包括初始音频集合中仅包含单个表演者的初始音频集合对应的发行公司名称,和/或创作公司名称;将原始公司名称分别与多个初始公司名称进行逐个对比,以确定公司匹配度。
在本公开的一个实施例中,音色匹配模块被配置为:从待匹配音频集合中确定待匹配音频;待匹配音频所对应的表演者数量为一个;从初始音频集合中确定初始音频;初始音频所对应的表演者数量为一个;对待匹配音频与初始音频进行匹配度计算,根据待匹配音频与初始音频之间的匹配度确定音色匹配度。
在本公开的一个实施例中,目标表演者确定模块被配置为:将关联匹配度大于匹配度阈值的初始匹配表演者确定为初始候选表演者;根据关联匹配度从初始候选表演者中确定候选匹配表演者,并确定候选匹配表演者对应的候选表演者数量;候选匹配表演者是具有最大关联匹配度的初始候选表演者;如果候选表演者数量为一个,则将候选匹配表演者确定为目标表演者;如果候选表演者数量为多个,则确定多个候选匹配表演者对应的表演者热度;将具有最大表演者热度的候选匹配表演者确定为目标表演者。
在本公开的一个实施例中,信息匹配装置还包括第二关联模块,用于如果关联匹配度均不大于匹配度阈值,则确定初始匹配表演者是否基于扩展名称得到,且初始匹配表演者是否属于黑名单表演者集合;如果初始匹配表演者不是基于扩展名称得到,且初始匹配表演者不属于黑名单表演者集合,则生成待匹配音频集合对应的作品表演者的作品表演者标识;根据待匹配音频集合、作品表演者信息与待匹配公司信息生成音频匹配关系;将作品表演者标识与音频匹配关系对应存储至音乐数据库。
在本公开实施方式的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的信息匹配方法。
在本公开实施方式的第五方面中,提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述所述的信息匹配方法。
根据本公开实施方式的技术方案,可以有效提高待匹配音频集合与目标表演者之间的匹配正确率,以及目标表演者的默认关联准确率,并减少人力投入成本。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性地示出了根据本公开的一些实施例的示例性应用场景的系统架构的示意框图;
图2示意性地示出了根据本公开的一些实施例的信息匹配方法的流程示意图;
图3示意性地示出了根据本公开的一些实施例的厂牌艺人关联表的示意图;
图4示意性地示出了根据本公开的一些实施例的待匹配音频集合进行入库匹配的示意图;
图5示意性地示出了根据本公开的一些实施例的根据作品表演者名称进行文本搜索处理的流程示意图;
图6示意性地示出了根据本公开的一些实施例的确定关联匹配度的流程示意图;
图7示意性地示出了根据本公开的一些实施例的目标表演者匹配的整体流程示意图;
图8示意性地示出了根据本公开的一些实施例的信息匹配系统的示意图;
图9示意性地示出了根据本公开的一些实施例的信息匹配装置的示意框图;
图10示意性地示出了根据本公开的示例实施例的存储介质的示意图;以及
图11示意性地示出了根据发明的示例实施例的电子设备的方框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本公开的实施方式,提出了一种信息匹配方法、信息匹配系统、信息匹配装置、介质和电子设备。
在本文中,需要理解的是,所涉及的术语,比如,作品表演者,又称艺人,可以是某一歌曲音频的创作者、演唱者等。表演者名称,也称文本艺人,可以是指版权方将专辑歌曲的元信息文件和歌曲的原始音频文件传输至音乐应用程序时,艺人信息仅仅只有与艺人的名字对应的文本信息。表演者关联操作,又称艺人勾选,可以是在进行专辑入库时,根据文本艺人选择音乐应用程序的音乐数据库中确定了艺人标识的艺人进行关联绑定,即在音乐程序交互页面上可以通过专辑艺人后面的艺人名点击跳转艺人详情页。匹配服务可以是通过匹配模块进行专辑、艺人的匹配服务,用以确定入库专辑在音乐数据库是否有相似的专辑以及确定专辑的所属艺人并将入库专辑与音乐数据库已有艺人进行关联。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
发明概述
在某一音乐应用程序中,专辑入库的相关数据统计为平均每天2万张专辑,17万首歌曲,其中,专辑、歌曲均需要进行所属艺人的匹配勾选服务。在进行专辑入库时,可以根据艺人名字进行文本搜索,如果文本搜索结果只有一个则直接进行自动勾选,如果文本搜索结果有多个则需要人工介入确认选择一个艺人进行勾选关联。
相关的艺人匹配流程如下:a)根据艺人名文本同步调用搜索引擎,分别进行艺人名搜索和艺人别名搜索,获取文本搜索结果列表;b)截取搜索结果的前10条,如果结果为0条,则直接以入库文本创建该艺人;c)选择搜索结果中艺人地区和专辑地区一样的艺人;d)筛选后的艺人根据艺人热度从高到低排序;e)选择排序后第一位的艺人进行默认勾选。
然而,采用上述艺人匹配方式可能存在下述问题:(1)仅通过一次文本搜索得到的结果不够准确,甚至会出现实际不相关的结果;(2)文本搜索结果存在一些同名艺人,有可能会勾选错误的艺人,且对运营审核造成一定的困扰;(3)机器自动勾选比例较低,导致在人工审核勾选艺人的过程中耗费大量人力。
基于上述内容,本公开的基本思想在于,获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;确定待匹配音频集合与初始音频集合之间的音色匹配度;根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。通过本公开的信息匹配方法,可以提高待匹配音频集合与目标表演者之间的匹配正确率,以及目标表演者的默认关联准确率,并减少人力投入成本。
在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
应用场景总览
首先参考图1,图1示出了可以应用本公开实施例的一种信息匹配方法及装置的示例性应用场景的系统架构的示意框图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的信息匹配方法一般由服务器105执行,相应地,信息匹配装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的信息匹配方法也可以由终端设备101、102、103执行,相应的,信息匹配装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,可以是工作人员通过终端设备101、102、103将获取到的待匹配音频集合上传至服务器105,服务器通过本公开实施例所提供的信息匹配方法根据待匹配音频集合的对应的表演者信息从音频数据库中匹配与该表演者信息匹配的目标表演者,对待匹配音频集合与目标表演者之间建立关联关系,并将关联关系存储至数据库中。
应该理解的是,图1所示的应用场景仅是本公开的实施例可以在其中得以实现的一个示例。本公开实施例的适用范围不受到该应用场景任何方面的限制。
示例性方法
下面结合图1的应用场景,参考图2来描述根据本公开示例性实施方式的信息匹配方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
本公开首先提供了一种信息匹配方法,该方法执行主体可以是终端设备,也可以是服务器,本公开对此不做特殊限定,本示例实施例中以服务器执行该方法为例进行说明。
参照图2所示,该信息匹配方法可以包括以下步骤S210至步骤S250:
步骤S210,获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息。
在一些示例实施例中,待匹配音频集合可以是待入库的音乐专辑,可以是由一定数量以上的歌曲或乐曲组成的音频集合,待匹配音频集合在入库之前,需要与现有专辑库中的作品表演者进行匹配。待匹配音频集合的基本信息可以是待匹配音频集合中所包含的音频的相关信息,例如,待匹配音频集合的基本信息可以包括待匹配音频集合本身的信息以及对应的作品表演者信息;其中,待匹配音频集合本身的信息可以包括待匹配音频集合的数量,每个待匹配音频的名称、音乐类型等信息。作品表演者信息可以是待匹配音频集合对应的作品表演者的表演者名称、表演者年龄、表演者的演艺经历等个人基本情况的相关信息。
在对音乐专辑对应的专辑歌曲物料录入至音乐数据库时,可以对待入库音乐专辑进行物料扫描、物料上传和物料解析等操作。获取经过物料解析后的待匹配音频集合,并获取待匹配音频集合的基本信息,其中,待匹配音频集合的基本信息包括待匹配音频集合对应的作品表演者信息。
步骤S220,根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息。
在一些示例实施例中,作品表演者可以是创作、演唱或表演待匹配音频的工作者。初始匹配表演者可以是根据待匹配音频集合包含的作品表演者信息在音乐数据库中匹配到的作品表演者。初始音频集合可以是初始匹配表演者对应的音频集合,可以是初始匹配表演者创作、演唱或表演的音频集合。初始音频集合的基本信息可以是初始音频集合中所包含的音频的相关信息,例如,初始音频集合的基本信息可以包括初始音频集合本身的信息以及对应的作品表演者信息;其中,初始音频集合本身的信息可以包括初始音频集合的数量,每个初始音频的名称、音乐类型等信息。初始匹配表演者信息可以是初始音频集合对应的初始匹配表演者的名称、表演者年龄、表演者的演艺经历等个人基本情况的相关信息。
在获取到待匹配音频集合的作品表演者信息之后,可以根据作品表演者信息并基于音乐数据库进行搜索,以匹配与作品表演者对应的初始匹配表演者。例如,获取待匹配音频集合的作品表演者名称,根据作品表演者名称从音乐数据库中匹配对应的初始匹配表演者。在确定出初始匹配表演者之后,可以获取初始匹配表演者对应的初始音频集合以及初始音频集合的基本信息。由于一个初始匹配表演者可以创作、演唱或表演多个初始音频集合,因此,一个初始匹配表演者可以对应多个初始音频集合,每个初始音频集合均具有对应的基本信息。
步骤S230,确定待匹配音频集合与初始音频集合之间的音色匹配度。
在一些示例实施例中,音色匹配度可以是将待匹配音频集合中待匹配音频与初始音频集合中初始音频进行对比后计算得出的匹配度。
由于待入库的音频集合通常是仅由一个作品表演者单独创作或表演大多数音频,某些音频可能是由作品表演者与其他表演者共同完成,待匹配音频集合中每个音频均包含作品表演者,因此,可以将待匹配音频集合的作品表演者确定为每个待匹配音频均包含的那个表演者。同样的,初始音频集合中用于进行音色匹配度计算的初始音频也是仅由同一作品表演者单独创作或表演的音频,因此,在从待匹配音频集合中选择出作品表演者单独创作或演唱的音频作为待匹配音频;可以再从初始音频集合中获取一定数量的初始音频,这些初始音频均是由匹配到的初始匹配表演者单独创作或表演的音频,将一个或多个初始音频与待匹配音频进行对比,确定待匹配音频集合与初始音频集合之间的音色匹配度。
步骤S240,根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度。
在一些示例实施例中,关联匹配度可以是待匹配音频集合的作品表演者与初始匹配表演者之间关联程度的匹配度。
在获取到待匹配音频集合的基本信息与初始音频集合的基本信息后,可以将待匹配音频集合的基本信息与初始音频集合的基本信息所包含的多项子信息进行逐项对比,确定出两者之间的信息匹配度。根据两种基本信息之间的匹配度以及确定出的音色匹配度,可以确定出待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度。举例而言,在对比两种基本信息时,可以计算出每项子信息之间的信息匹配度得分,每项子信息之间的信息匹配度得分与音色匹配度得分进行相加处理,即可得到关联匹配度。
步骤S250,根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。
在一些示例实施例中,目标表演者可以是从音乐数据库中确定出与待匹配音频集合对应的表演者。关联处理可以是建立目标表演者与待匹配音频集合之间的关联关系。
在确定出待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度后,可以根据确定出的超过预定阈值的关联匹配度将初始匹配表演者中关联匹配度最高的表演者作为目标表演者。对待匹配音频集合与目标表演者之间进行关联处理,建立两者之间的关联关系,以便音乐应用程序的使用用户可以通过目标表演者获取到相关音频和相关表演者详情页。
在本示例实施方式所提供的信息匹配方法,获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;确定待匹配音频集合与初始音频集合之间的音色匹配度;根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。通过本公开的信息匹配方法,可以提高待匹配音频集合与目标表演者之间的匹配正确率,以及目标表演者的默认关联准确率,并减少人力投入成本。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在本公开的一个实施例中,基于待匹配音频集合的基本信息确定待匹配音频集合对应的待匹配公司信息;根据作品表演者信息与待匹配公司信息生成搜索字符串;根据搜索字符串并基于音乐数据库进行搜索处理,若搜索得到匹配的表演者,则将该匹配的表演者确定为与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理;否则,根据作品表演者信息确定与作品表演者对应的初始匹配表演者。
其中,待匹配公司信息可以是待匹配音频集合对应的厂牌信息;其中,厂牌一般常指公司或工厂的品牌标识,在本公开中,待匹配公司信息可以是待匹配音频集合对应的版权公司的公司信息或者发行公司的公司信息等。搜索字符串可以是根据作品表演者信息与待匹配公司信息生成的字符串,例如,可以将作品表演者的名称与待匹配公司名称进行字符串连接处理,生成搜索字符串。音乐数据库可以是用于存储海量歌曲、音频的数据库。
在获取到待匹配音频集合的基本信息后,可以从待匹配音频集合的基本信息中确定待匹配音频集合对应的待匹配公司信息。例如,从待匹配音频集合1的基本信息中确定待匹配音频集合1对应的作品表演者信息与待匹配公司信息,作品表演者信息为“Naides”,待匹配公司信息为“Create Music”。对确定出的作品表演者信息与待匹配公司信息进行字符串连接处理,生成搜索字符串,在进行字符串连接处理所采用的连接字符可以为“-”、“_”“、”“,”等,如采用连接字符“-”生成的搜索字符串为“Create Music-Naides”。
根据生成的搜索字符串在音乐数据库中进行搜索处理,参考图3,图3示意性地示出了根据本公开的一些实施例的厂牌艺人关联表的示意图。在图3的输入框中输入公司名称(即厂牌名)和艺人名称(即作品表演者名称),在采用“Create Music-Naides”进行搜索处理时,由于音乐数据库中存在数据记录“29,Create Music,Naides,47168969,Naides,2021-03-1716:16,Admin1,2021-03-17 16:16”,因此,可以通过音乐数据库搜索到与搜索字符串匹配的表演者,可以将匹配搭配表演者确定为与待匹配音频集合匹配的目标表演者,并将待匹配音频集合与目标表演者进行关联处理,即直接将待匹配音频集合默认勾选目标表演者。
如果根据搜索字符串无法搜索得到匹配的表演者,则可以执行根据作品表演者信息确定与作品表演者对应的初始匹配表演者的步骤,以进一步进行后续匹配步骤。例如,待匹配音频集合2对应的搜索字符串为“Eason-滚石”,采用该搜索字符串在音乐数据库中进行搜索处理后,未找到匹配的表演者,则执行根据作品表演者信息确定与作品表演者对应的初始匹配表演者的匹配步骤。参考图4,图4示意性地示出了根据本公开的一些实施例的待匹配音频集合进行入库匹配的示意图。根据作品表演者名称与待匹配音频调用匹配平台410定制的入库匹配服务420。
具体的,匹配平台410可以在原有的文本搜索引擎基础上进行调用的封装,并引入音视频算法,提供了针对入库特有的作品表演者匹配服务,内部实现了先同步调用文本搜索引擎获取作品表演者结果列表,再异步根据入库专辑的音频和初始匹配表演者的已入库音频进行作品表演者的音色相似度匹配,得到文本匹配精度和音色识别精度,并将结果一同返回至入库匹配服务420。
在本公开的一个实施例中,获取目标表演者的目标表演者标识;基于目标表演者标识生成待匹配音频集合与目标表演者之间的音频匹配关系;根据目标表演者标识将音频匹配关系存储至音乐数据库。
其中,目标表演者标识可以是唯一标识目标表演者所采用的标识,每个表演者均对应一个表演者标识。音频匹配关系可以是待匹配音频集合与目标表演者之间的匹配关系,将音频匹配关系存储至音乐数据库中可以通过搜索字符串匹配到表演者。
在对待匹配音频集合与目标表演者进行关联处理时,可以先从音乐数据库中获取目标表演者对应的目标表演者标识,例如,待匹配音频集合1对应的目标表演者为“Naides”,“Naides”的目标表演者标识为“47168969”,基于该目标表演者标识“47168969”可以生成待匹配音频集合1与“Naides”之间的音频匹配关系;在生成音频匹配关系后,根据目标表演者标识将音频匹配关系存储至音乐数据库。将两者之间的音频匹配关系存储至音乐数据库后,后续在音乐应用程序的使用过程中,用户可以通过搜索目标表演者,查找到与该目标表演者对应的所有音频集合。用户通过点击某一音频集合,可以获取到与该音频集合对应的目标表演者的相关信息详情页。
在本公开的一个实施例中,基于作品表演者信息确定待匹配音频集合对应的作品表演者名称;作品表演者名称包括原始名称和扩展名称;根据原始名称进行文本搜索处理,以得到第一匹配表演者;根据扩展名称进行文本搜索处理,以得到第二匹配表演者;根据第一匹配表演者与第二匹配表演者确定初始匹配表演者。
其中,作品表演者名称,又称艺人名,可以是作品表演者的姓名、昵称等。原始名称可以是作品表演者原始姓名,例如,作品表演者1的原始名称为“周杰伦”,作品表演者2的原始名称为“陈奕迅”,作品表演者3的原始名称为“Katy Perry”。扩展名称可以是作品表演者的昵称、别名等其他种类的名称。例如,作品表演者1的扩展名称可以为“Jay Chou”、“Jay”等,作品表演者2的扩展名称可以为“Eason Chan”、“Eason”等,作品表演者3的扩展名称可以为“凯蒂·佩里”、“水果姐”等。第一匹配表演者可以是根据原始名称进行文本搜索处理匹配得到的表演者。第二匹配表演者可以是根据扩展名称进行文本搜索处理匹配得到的表演者。初始匹配表演者可以是由第一匹配表演者和第二匹配表演者组成的表演者集合。
在根据作品表演者信息确定出待匹配音频集合对应的作品表演者名称之后,由于作品表演者名称可以包括作品表演者的原始名称和扩展名称,可以分别根据原始名称和扩展名称和进行文本搜索处理。参考图5,图5示意性地示出了根据本公开的一些实施例的根据作品表演者名称进行文本搜索处理的流程示意图。在步骤S510中,先采用作品表演者的原始名称进行数据库精确搜索,确定出对应匹配的表演者。如果采用数据库搜索未得到搜索结果,则调用搜索引擎进行文本搜索处理,在步骤S520中,采用作品表演者的原始名称进行搜索引擎精确搜索,确定出对应匹配的表演者。在步骤S530中,采用作品表演者的扩展名称进行搜索引擎精确搜索,确定出对应匹配的表演者。在步骤S540中,采用作品表演者的原始名称和扩展名称进行搜索引擎模糊搜索,以进一步确定出对应匹配的表演者。在步骤S510~步骤S540中,根据原始名称确定出的作品表演者为第一匹配表演者,根据扩展名称确定出的作品表演者为第二匹配表演者,第一匹配表演者和第二匹配表演者共同组成初始匹配表演者。在确定出初始匹配表演者后,在步骤S550中,可以获取待匹配音频集合,采用音色识别算法确定待匹配音频集合与初始匹配表演者对应的初始音频集合之间的音色匹配度。
在本公开的一个实施例中,根据待匹配音频集合的基本信息与初始音频集合的基本信息确定待匹配音频集合的作品表演者与各初始匹配表演者之间的地区匹配度与公司匹配度;获取音色匹配度,并根据音色匹配度、地区匹配度与公司匹配度确定关联匹配度。
其中,地区匹配度可以是作品表演者所处地区与初始匹配表演者所处地区的匹配度。公司匹配度可以是作品表演者所属公司与初始匹配表演者所述公司之间的匹配度,待匹配音频集合的发行公司与初始音频集合的发行公司以及待匹配音频集合的版权公司与初始音频集合的版权公司之间的匹配度。
参考图6,图6示意性地示出了根据本公开的一些实施例的确定关联匹配度的流程示意图。在步骤S610中,确定待匹配音频集合与初始音频集合之间的音色匹配度结果。例如,匹配平台从初始匹配表演者中截取一定数量的初始匹配表演者,并获取这些初始匹配表演者已发布的音频作为初始音频集合,采用音色识别算法对待匹配音频集合和初始音频集合确定音色匹配度。在步骤S620中,从待匹配音频集合的基本信息与初始音频集合的基本信息中分别确定待匹配音频集合对应的公司信息以及初始音频集合对应的公司信息,在获取到公司信息后,可以确定两个公司信息之间的匹配度。在步骤S630中,与获取公司信息相同,从待匹配音频集合的基本信息与初始音频集合的基本信息中分别确定作品表演者所属的地区信息以及初始匹配表演者所属的地区信息,并计算两个地区之间的匹配度作为地区匹配度。在步骤S640中,根据确定出的音色匹配度、地区匹配度与公司匹配度计算关联匹配度。
本领域技术人员容易理解的是,确定音色匹配度、地区匹配度与公司匹配度的三个确定过程的顺序还可以采用其他顺序,本公开对此不作任何特殊限定。
在本公开的一个实施例中,基于待匹配音频集合的基本信息确定作品表演者对应的待匹配地区信息与待匹配公司信息;基于初始音频集合的基本信息确定初始匹配表演者对应的初始地区信息与初始公司信息;将待匹配地区信息与初始地区信息之间的匹配度确定为地区匹配度;将待匹配公司信息与初始公司信息之间的匹配度确定为公司匹配度。
其中,待匹配地区信息可以是待匹配音频集合对应的作品表演者所属地区的相关信息。例如,待匹配地区信息可以是待匹配地区的名称、地区类别等。待匹配公司信息可以是待匹配音频集合对应公司的相关信息,如公司名称等。初始地区信息可以是初始音频集合对应的作品表演者所属地区的相关信息。例如,初始地区信息可以是初始地区的名称、地区类别等。初始公司信息可以是初始音频集合对应公司的相关信息,如公司名称等。
基于待匹配音频集合的基本信息分别确定作品表演者对应的待匹配地区信息与待匹配公司信息。例如,待匹配音频集合1的基本信息中所包含的待匹配地区信息为“华语地区”,待匹配公司信息为“滚石唱片”;基于初始音频集合的基本信息确定初始匹配表演者对应的初始地区信息与初始公司信息;例如,初始音频集合1的基本信息中所包含的初始地区信息为“华语地区”,初始公司信息为“滚石唱片”;初始音频集合2的基本信息中所包含的初始地区信息为“华语地区”,初始公司信息为“海蝶音乐”;初始音频集合1的基本信息中所包含的初始地区信息为“华语地区”,初始公司信息为“英皇娱乐”等。
根据确定出的地区信息和公司信息进行信息对比,将待匹配地区信息与初始地区信息之间的匹配度确定为地区匹配度;将待匹配公司信息与初始公司信息之间的匹配度确定为公司匹配度。例如,当两个地区信息相匹配时,地区匹配度的匹配得分可以为5分,否则为0分;当两个公司信息相匹配时,公司匹配度的匹配得分可以为4分,否则为0分。
在本公开的一个实施例中,确定待匹配公司信息中是否包含原始公司名称;原始公司名称包括待匹配音频集合对应的发行公司名称,和/或创作公司名称;如果待匹配公司信息中包含原始公司名称,则分别根据各初始公司信息确定多个初始公司名称;初始公司名称包括初始音频集合中仅包含单个表演者的初始音频集合对应的发行公司名称,和/或创作公司名称;将原始公司名称分别与多个初始公司名称进行逐个对比,以确定公司匹配度。
其中,原始公司名称可以是待匹配音频集合中的待匹配音频所属公司的公司名称。原始公司名称可以包括待匹配音频集合对应的发行公司名称和/或创作公司名称。发行公司可以是与作品表演者合作并推销歌曲专辑的公司。创作公司可以是创作歌曲专辑的公司,例如,为歌曲撰写歌词和旋律的公司等。初始公司名称可以是初始音频集合中的初始音频所属公司的公司名称。初始公司名称可以包括初始音频集合对应的发行公司名称和/或创作公司名称。
获取待匹配公司信息,并确定待匹配公司信息中是否包含原始公司名称,在进行匹配度计算时,所选用的待匹配音频均为作品表演者单独创作或表演的音频。例如,在待匹配音频集合中包含作品表演者单独创作的7个音频,以及3个与他人合作完成的合唱音频。在进行关联匹配度计算时,均选用作品表演者单独创作的音频进行匹配计算。当待匹配公司信息中包含原始公司名称时,则在根据初始公司信息确定多个初始公司名称。例如,获取待匹配音频集合对应的发行公司名称和/或创作公司名称,以及初始音频集合对应的发行公司名称和/或创作公司名称。举例而言,根据待匹配公司信息确定出的原始公司名称中,发行公司名称可以为“索尼公司”,创作公司可以是“新索音乐”。
当确定出原始公司名称后,可以获取初始音频集合对应的初始公司名称,例如,可以从音乐数据库中获取预设数量的初始音频集合用于与待匹配音频集合进行匹配对比,如,可以将预设数量确定为3。当预设数量为3时,可以从音乐数据库中获取与初始匹配表演者最新发布的三个初始音频集合,并确定这三个初始音频集合分别对应的初始公司名称。例如,三个初始音频集合分别对应的初始公司名称均为“索尼公司”,则认为原始公司名称与初始公司名称匹配,并将公司匹配度的得分记为5分。如果原始公司名称与初始公司名称不匹配,则将公司匹配度的得分记为0分。
在本公开的一个实施例中,从待匹配音频集合中确定待匹配音频;待匹配音频所对应的表演者数量为一个;从初始音频集合中确定初始音频;初始音频所对应的表演者数量为一个;对待匹配音频与初始音频进行匹配度计算,根据待匹配音频与初始音频之间的匹配度确定音色匹配度。
其中,待匹配音频可以是从待匹配音频集合中确定的仅有一个作品表演者表演或创作的音频,即待匹配音频对应的表演者数量为一个。初始音频可以是从初始音频集合中确定的仅有一个作品表演者表演或创作的音频,即初始音频对应的表演者数量为一个。
从待匹配音频集合中随机选择一个由作品表演者单独创作或表演的音频作为待匹配音频。另外,在确定出初始匹配表演者后,匹配平台可以获取这些初始匹配表演者对应的初始音频集合,并从初始音频集合中获取仅包含一个表演者的初始音频。将待匹配音频与确定出的多个初始音频均发送至音视频处理平台,采用音色识别算法对待匹配音频与初始音频进行音色匹配处理,将待匹配音频与初始音频之间的匹配度确定为音色匹配度。例如,当待匹配音频与初始音频之间的音色匹配度大于音色相似阈值(如0.7)时,将音色匹配度的得分确定为6分,否则确定为0分。
具体的,确定待匹配音频与初始音频之间的音色匹配度可以通过下述步骤进行:确定待匹配音频对应的待匹配声波曲线图,并确定初始音频对应的初始声波曲线图;根据待匹配声波曲线图与初始声波曲线图之间的匹配度确定音色匹配度。例如,将待匹配音频与初始音频发送至音视频处理平台后,音视频处理平台中的模数转换器可以将待匹配音频转换为对应的待匹配声波曲线图,并将初始音频转换为对应的初始声波曲线图。根据待匹配声波曲线图和预先存储的标准音色函数图确定出待匹配表演者对应的音色表达式,该步骤的目的是为了将待匹配声波曲线图转化成数学表达式,以实现对待匹配表演者音色的量化。采用同样的方式,确定与初始匹配表演者对应的音色表达式。通过计算两个音色表达式之间的距离,以确定音色匹配度。
在本公开的一个实施例中,将关联匹配度大于匹配度阈值的初始匹配表演者确定为初始候选表演者;根据关联匹配度从初始候选表演者中确定候选匹配表演者,并确定候选匹配表演者对应的候选表演者数量;候选匹配表演者是具有最大关联匹配度的初始候选表演者;如果候选表演者数量为一个,则将候选匹配表演者确定为目标表演者;如果候选表演者数量为多个,则确定多个候选匹配表演者对应的表演者热度;将具有最大表演者热度的候选匹配表演者确定为目标表演者。
其中,匹配度阈值可以是预先设定的用于与关联匹配度进行对比的数值,例如,匹配度阈值可以是设定为7。初始候选表演者可以是从初始匹配表演者中确定出的与作品表演者之间的关联匹配度大于匹配度阈值的表演者。候选匹配表演者可以是根据初始候选表演者的排序结果中确定出的具有最大关联匹配度的初始候选表演者。候选表演者数量可以是候选匹配表演者的数量,候选表演者数量可以为一个或多个。表演者热度可以是音乐应用程序的用户对某一作品表演者的关注程度。
在计算出多个初始匹配表演者与待匹配音频集合的作品表演者之间的关联匹配度后,可以将关联匹配度大于匹配度阈值的初始匹配表演者确定为初始候选表演者。在确定匹配度阈值时,根据匹配度阈值确定出的初始候选表演者需要满足音色匹配度、公司匹配度以及地区匹配度三个条件中的至少两个条件。在进行关联匹配度计算时,音色匹配度的重要程度高于地区匹配度,地区匹配度的重要程度高于公司匹配度。例如,当将音色匹配度的分值设置为6分,将地区匹配度的分值设置为5分,将公司匹配度的分值设置为4分时,可以将匹配度阈值设定为7分、8分、9分等。
在确定出关联匹配度之后,可以将关联匹配度大于匹配度阈值的初始匹配表演者确定为初始候选表演者,并从初始候选表演者中确定具有最大关联匹配度的候选匹配表演者以及候选表演者数量。如果候选表演者数量为一个,则将确定出的候选匹配表演者确定为目标表演者。如果候选表演者数量为多个,则分别获取多个候选匹配表演者各自对应的表演者热度,将具有最大表演者热度的候选匹配表演者确定为目标表演者。例如,确定出的候选表演者数量为3个,候选匹配表演者1的表演者热度为546789,候选匹配表演者2的表演者热度为156789,则将候选匹配表演者1作为目标表演者。
在本公开的一个实施例中,如果关联匹配度均不大于匹配度阈值,则确定初始匹配表演者是否基于扩展名称得到,且初始匹配表演者是否属于黑名单表演者集合;如果初始匹配表演者不是基于扩展名称得到,且初始匹配表演者不属于黑名单表演者集合,则生成待匹配音频集合对应的作品表演者的作品表演者标识;根据待匹配音频集合、作品表演者信息与待匹配公司信息生成音频匹配关系;将作品表演者标识与音频匹配关系对应存储至音乐数据库。
其中,黑名单表演者可以是不进行公开展示的表演者,黑名单表演者集合可以是由黑名单表演者组成的集合。作品表演者标识可以是唯一标识作品表演者的标识。
如果确定出的关联匹配度均不大于匹配度阈值,则说明音乐数据库中可能不存在待匹配音频集合的作品表演者相匹配的目标表演者。此时,可以进行后续的判断步骤,判断初始匹配表演者是否是基于扩展名称搜索的得到,以及初始匹配表演者是否属于黑名单表演者集合。如果初始匹配表演者不是基于扩展名称得到,且初始匹配表演者不属于黑名单表演者集合,则在音乐数据中生成待匹配音频集合对应的作品表演者的作品表演者标识(Identity document,ID),在音乐数据库中创建该作品表演者对应的作品表演者标识和作品表演者信息。在生成作品表演者标识后,可以根据待匹配音频集合、作品表演者信息与待匹配公司信息生成音频匹配关系,并将作品表演者标识与音频匹配关系按照图3的数据格式对应存储至音乐数据库。
参考图7,图7示意性地示出了根据本公开的一些实施例的目标表演者匹配的整体流程示意图。获取待匹配音频集合的基本信息,从待匹配音频集合的基本信息中确定作品表演者的表演者信息以及待匹配公司信息;其中,表演者信息包括表演者名称710。在步骤S701中,基于根据表演者名称710进行表演者关系搜索。在步骤S702中,可以根据表演者名称710和待匹配公司信息生成搜索字符串,判断表演者名称710与待匹配公司名称组成的搜索字符串是否命中。如果搜索字符串命中,在步骤S703中,则直接构建搜索结果,并指定默认勾选,即建立待匹配音频集合与目标表演者之间的关联关系,并在步骤S716中,将表演者标识设置为默认勾选标识,通过步骤S717,将待匹配音频集合与目标表演者的匹配结果更新至音乐数据库中。
如果搜索字符串未命中,在步骤S704中,根据表演者的表演者名称进行表演者搜索。具体的,可以根据作品表演者的原始名称和扩展名称进行精确搜索和模糊搜索。在步骤S705中,判断匹配到的表演者的类型,包括有匹配类型和无匹配类型。在该步骤中,当所有表演者均无匹配或匹配到的表演者均为未发布时,则确定表演者为无匹配类型。在步骤S706中,如果匹配到的表演者类型为有匹配类型,则确定初始匹配表演者的关联匹配度,关联匹配度的具体分值可以根据音色匹配度、地区匹配度与公司匹配度计算得到。
在步骤S707中,在计算得到多个关联匹配度后,可以将得到的多规格关联匹配度进行排序处理,得到表演者匹配排序列表。在步骤S708中,判断表演者匹配排序列表中的一个或多个关联匹配度是否大于匹配度阈值。在步骤S709中,判断匹配到的表演者是否是根据表演者的原始名称匹配得到。如果匹配到的表演者是根据表演者的原始名称匹配得到,则在步骤S714中,选择第一个表演者进行默认勾选。如果匹配到的表演者不是根据表演者名称匹配得到,则在步骤S710中,判断匹配到的表演者是否是根据表演者的扩展名称匹配得到的,如果匹配到的表演者是根据扩展名称匹配得到的,则在步骤S711中,对于通过扩展名称匹配得到的表演者不进行默认勾选。如果匹配到的表演者不是根据扩展名称匹配得到的,则在步骤S712中,判断匹配到的表演者是否为黑名单表演者,如果匹配到的表演者不是黑名单表演者,则在步骤S713中,在音乐数据库中创建待匹配音频集合对应的待匹配作品表演者对应的表演者标识以及表演者信息,在表演者标识与表演者信息创建完成之后,可以创建待匹配音频集合与匹配到的表演者之间的匹配关系,在步骤S714中,进行选择第一个表演者进行默认勾选的操作。在步骤S715中,将表演者标识设置为默认勾选标识。在步骤S716中,更新匹配结果至音乐数据库中。通过上述处理过程确定待匹配音频集合对应的目标表演者,还可以减少同名表演者匹配错误的情况。
示例性系统
在介绍了本公开示例性实施方式的方法之后,接下来,参考图8对本公开示例性实施例的信息匹配系统进行说明。
在图8中,信息匹配系统800可以包括信息获取端810、匹配平台820;信息获取端810,用于获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;匹配平台,用于确定与待匹配音频集合匹配的目标表演者;匹配平台820包括初始匹配子平台821、音视频处理子平台822与关联匹配子平台823;初始匹配子平台821,用于根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;音视频处理平台822,用于确定待匹配音频集合与初始音频集合之间的音色匹配度;关联匹配子平台823,用于根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度,以根据关联匹配度从初始匹配表演者中确定目标表演者。
示例性装置
在介绍了本公开示例性实施方式的方法之后,接下来,参考图9对本公开示例性实施例的信息匹配装置进行说明。
在图9中,信息匹配装置900可以包括信息获取模块910、信息确定模块920、音色匹配模块930、关联匹配模块940以及目标表演者确定模块950。其中:信息获取模块910,用于获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;信息确定模块920,用于根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;音色匹配模块930,用于确定待匹配音频集合与初始音频集合之间的音色匹配度;关联匹配模块940,用于根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;目标表演者确定模块950,用于根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。
在本公开的一个实施例中,信息匹配装置还包括信息匹配模块,用于基于待匹配音频集合的基本信息确定待匹配音频集合对应的待匹配公司信息;根据作品表演者信息与待匹配公司信息生成搜索字符串;根据搜索字符串并基于音乐数据库进行搜索处理,若搜索得到匹配的表演者,则将该匹配的表演者确定为与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理;否则,根据作品表演者信息确定与作品表演者对应的初始匹配表演者。
在本公开的一个实施例中,信息匹配装置还包括第一关联模块,用于获取目标表演者的目标表演者标识;基于目标表演者标识生成待匹配音频集合与目标表演者之间的音频匹配关系;根据目标表演者标识将音频匹配关系存储至音乐数据库。
在本公开的一个实施例中,信息确定模块包括初始表演者确定单元,用于基于作品表演者信息确定待匹配音频集合对应的作品表演者名称;作品表演者名称包括原始名称和扩展名称;根据原始名称进行文本搜索处理,以得到第一匹配表演者;根据扩展名称进行文本搜索处理,以得到第二匹配表演者;根据第一匹配表演者与第二匹配表演者确定初始匹配表演者。
在本公开的一个实施例中,关联匹配模块包括关联匹配单元,用于根据待匹配音频集合的基本信息与初始音频集合的基本信息确定待匹配音频集合的作品表演者与各初始匹配表演者之间的地区匹配度与公司匹配度;获取音色匹配度,并根据音色匹配度、地区匹配度与公司匹配度确定关联匹配度。
在本公开的一个实施例中,关联匹配模块包括待匹配信息确定单元,用于基于待匹配音频集合的基本信息确定作品表演者对应的待匹配地区信息与待匹配公司信息;初始信息确定单元,用于基于初始音频集合的基本信息确定初始匹配表演者对应的初始地区信息与初始公司信息;地区匹配度确定单元,用于将待匹配地区信息与初始地区信息之间的匹配度确定为地区匹配度;公司匹配度确定单元,用于将待匹配公司信息与初始公司信息之间的匹配度确定为公司匹配度。
在本公开的一个实施例中,公司匹配度确定单元被配置为:确定待匹配公司信息中是否包含原始公司名称;原始公司名称包括待匹配音频集合对应的发行公司名称,和/或创作公司名称;如果待匹配公司信息中包含原始公司名称,则分别根据各初始公司信息确定多个初始公司名称;初始公司名称包括初始音频集合中仅包含单个表演者的初始音频集合对应的发行公司名称,和/或创作公司名称;将原始公司名称分别与多个初始公司名称进行逐个对比,以确定公司匹配度。
在本公开的一个实施例中,音色匹配模块被配置为:从待匹配音频集合中确定待匹配音频;待匹配音频所对应的表演者数量为一个;从初始音频集合中确定初始音频;初始音频所对应的表演者数量为一个;对待匹配音频与初始音频进行匹配度计算,根据待匹配音频与初始音频之间的匹配度确定音色匹配度。
在本公开的一个实施例中,目标表演者确定模块被配置为:将关联匹配度大于匹配度阈值的初始匹配表演者确定为初始候选表演者;根据关联匹配度从初始候选表演者中确定候选匹配表演者,并确定候选匹配表演者对应的候选表演者数量;候选匹配表演者是具有最大关联匹配度的初始候选表演者;如果候选表演者数量为一个,则将候选匹配表演者确定为目标表演者;如果候选表演者数量为多个,则确定多个候选匹配表演者对应的表演者热度;将具有最大表演者热度的候选匹配表演者确定为目标表演者。
在本公开的一个实施例中,信息匹配装置还包括第二关联模块,用于如果关联匹配度均不大于匹配度阈值,则确定初始匹配表演者是否基于扩展名称得到,且初始匹配表演者是否属于黑名单表演者集合;如果初始匹配表演者不是基于扩展名称得到,且初始匹配表演者不属于黑名单表演者集合,则生成待匹配音频集合对应的作品表演者的作品表演者标识;根据待匹配音频集合、作品表演者信息与待匹配公司信息生成音频匹配关系;将作品表演者标识与音频匹配关系对应存储至音乐数据库。
由于本公开的示例实施例的信息匹配装置的各个功能模块与上述信息匹配方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的信息匹配方法的实施例,此处不再赘述。
应当注意,尽管在上文详细描述中提及了信息匹配装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开实施例的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的信息匹配方法。
示例性介质
在介绍了本公开示例性实施方式的装置之后,接下来,参考图10对本公开示例性实施例的存储介质进行说明。
在一些实施例中,本公开的各个方面还可以实现为一种介质,其上存储有程序代码,当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的信息匹配方法中的步骤。
例如,所述设备的处理器执行所述程序代码时可以实现如图2中所述的步骤S210,获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;步骤S220,根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;步骤S230,确定待匹配音频集合与初始音频集合之间的音色匹配度;步骤S240,根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;步骤S250,根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。
参考图10所示,描述了根据本公开的实施例的用于实现上述信息匹配方法或者实现上述信息匹配方法的程序产品1000,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备。
示例性计算设备
在介绍了本公开示例性实施方式的信息匹配方法、信息匹配系统、信息匹配装置以及存储介质之后,接下来,参考图11对本公开示例性实施方式的电子设备进行说明。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施例中,根据本公开的电子设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的信息匹配方法中的步骤。例如,所述处理单元可以执行如图2中所示的步骤S210,获取待匹配音频集合以及待匹配音频集合的基本信息;基本信息包括作品表演者信息;步骤S220,根据作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,初始音频集合的基本信息包括初始匹配表演者信息;步骤S230,确定待匹配音频集合与初始音频集合之间的音色匹配度;步骤S240,根据待匹配音频集合的基本信息与初始音频集合的基本信息的匹配度以及音色匹配度,确定待匹配音频集合的作品表演者与每个初始匹配表演者之间的关联匹配度;步骤S250,根据关联匹配度从初始匹配表演者中确定与待匹配音频集合匹配的目标表演者,以对待匹配音频集合与目标表演者进行关联处理。
下面参照图11来描述根据本公开的示例实施例的电子设备1100。图11所示的电子设备1100仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,电子设备1100以通用计算设备的形式表现。电子设备1100的组件可以包括但不限于:上述至少一个处理单元1101、上述至少一个存储单元1102、连接不同系统组件(包括存储单元1102和处理单元1101)的总线1103、显示单元1107。
总线1103表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元1102可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1121和/或高速缓存存储器1122,还可以进一步包括只读存储器(ROM)1123。
存储单元1102还可以包括具有一组(至少一个)程序模块1124的程序/实用工具1125,这样的程序模块1124包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备1100也可以与一个或多个外部设备1104(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与电子设备1100交互的设备通信,和/或与使得电子设备1100能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1105进行。并且,电子设备1100还可以通过网络适配器1106与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1106通过总线1103与电子设备1100的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了信息匹配装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (21)

1.一种信息匹配方法,其特征在于,包括:
获取待匹配音频集合以及所述待匹配音频集合的基本信息;所述基本信息包括作品表演者信息;
根据所述作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取所述初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,所述初始音频集合的基本信息包括初始匹配表演者信息;
确定所述待匹配音频集合与所述初始音频集合之间的音色匹配度;
根据所述待匹配音频集合的基本信息与所述初始音频集合的基本信息的匹配度以及所述音色匹配度,确定所述待匹配音频集合的作品表演者与每个所述初始匹配表演者之间的关联匹配度;
根据所述关联匹配度从所述初始匹配表演者中确定与所述待匹配音频集合匹配的目标表演者,以对所述待匹配音频集合与所述目标表演者进行关联处理;
所述初始匹配表演者的数量为多个,所述根据所述待匹配音频集合的基本信息与所述初始音频集合的基本信息的匹配度以及所述音色匹配度,确定所述待匹配音频集合的作品表演者与每个所述初始匹配表演者之间的关联匹配度,包括:
根据待匹配音频集合的基本信息与所述初始音频集合的基本信息确定待匹配音频集合的作品表演者与各所述初始匹配表演者之间的地区匹配度与公司匹配度;
获取所述音色匹配度,并根据所述音色匹配度、所述地区匹配度与所述公司匹配度确定所述关联匹配度。
2.根据权利要求1所述的方法,其特征在于,在根据所述作品表演者信息确定与作品表演者对应的初始匹配表演者之前,所述方法还包括:
基于所述待匹配音频集合的基本信息确定所述待匹配音频集合对应的待匹配公司信息;
根据所述作品表演者信息与所述待匹配公司信息生成搜索字符串;
根据所述搜索字符串并基于音乐数据库进行搜索处理,若搜索得到匹配的表演者,则将该匹配的表演者确定为与所述待匹配音频集合匹配的目标表演者,以对所述待匹配音频集合与所述目标表演者进行关联处理;
否则,根据所述作品表演者信息确定与所述作品表演者对应的初始匹配表演者。
3.根据权利要求2所述的方法,其特征在于,所述对所述待匹配音频集合与所述目标表演者进行关联处理,包括:
获取所述目标表演者的目标表演者标识;
基于所述目标表演者标识生成所述待匹配音频集合与所述目标表演者之间的音频匹配关系;
根据所述目标表演者标识将所述音频匹配关系存储至音乐数据库。
4.根据权利要求1所述的方法,其特征在于,所述根据所述作品表演者信息确定与作品表演者对应的初始匹配表演者,包括:
基于所述作品表演者信息确定所述待匹配音频集合对应的作品表演者名称;所述作品表演者名称包括原始名称和扩展名称;
根据所述原始名称进行文本搜索处理,以得到第一匹配表演者;
根据所述扩展名称进行文本搜索处理,以得到第二匹配表演者;
根据所述第一匹配表演者与所述第二匹配表演者确定所述初始匹配表演者。
5.根据权利要求1所述的方法,其特征在于,所述根据待匹配音频集合的基本信息与所述初始音频集合的基本信息确定待匹配音频集合的作品表演者与各所述初始匹配表演者之间的地区匹配度与公司匹配度,包括:
基于待匹配音频集合的基本信息确定所述作品表演者对应的待匹配地区信息与待匹配公司信息;
基于所述初始音频集合的基本信息确定所述初始匹配表演者对应的初始地区信息与初始公司信息;
将所述待匹配地区信息与所述初始地区信息之间的匹配度确定为所述地区匹配度;
将所述待匹配公司信息与所述初始公司信息之间的匹配度确定为所述公司匹配度。
6.根据权利要求5所述的方法,其特征在于,所述初始公司信息的数量为多个,所述将所述待匹配公司信息与所述初始公司信息之间的匹配度确定为所述公司匹配度,包括:
确定所述待匹配公司信息中是否包含原始公司名称;所述原始公司名称包括所述待匹配音频集合对应的发行公司名称,和/或创作公司名称;
如果所述待匹配公司信息中包含所述原始公司名称,则分别根据各所述初始公司信息确定多个初始公司名称;所述初始公司名称包括所述初始音频集合中仅包含单个表演者的所述初始音频集合对应的发行公司名称,和/或创作公司名称;
将所述原始公司名称分别与多个所述初始公司名称进行逐个对比,以确定所述公司匹配度。
7.根据权利要求1所述的方法,其特征在于,所述确定所述待匹配音频集合与所述初始音频集合之间的音色匹配度,包括:
从所述待匹配音频集合中确定待匹配音频;所述待匹配音频所对应的表演者数量为一个;
从所述初始音频集合中确定初始音频;所述初始音频所对应的表演者数量为一个;
对所述待匹配音频与所述初始音频进行匹配度计算,根据所述待匹配音频与所述初始音频之间的匹配度确定所述音色匹配度。
8.根据权利要求1所述的方法,其特征在于,所述根据所述关联匹配度从所述初始匹配表演者中确定与所述待匹配音频集合匹配的目标表演者,包括:
将所述关联匹配度大于匹配度阈值的所述初始匹配表演者确定为初始候选表演者;
根据所述关联匹配度从所述初始候选表演者中确定候选匹配表演者,并确定所述候选匹配表演者对应的候选表演者数量;所述候选匹配表演者是具有最大关联匹配度的初始候选表演者;
如果所述候选表演者数量为一个,则将所述候选匹配表演者确定为所述目标表演者;
如果所述候选表演者数量为多个,则确定多个所述候选匹配表演者对应的表演者热度;
将具有最大表演者热度的所述候选匹配表演者确定为所述目标表演者。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
如果所述关联匹配度均不大于所述匹配度阈值,则确定所述初始匹配表演者是否基于扩展名称得到,且所述初始匹配表演者是否属于黑名单表演者集合;
如果所述初始匹配表演者不是基于扩展名称得到,且所述初始匹配表演者不属于黑名单表演者集合,则生成所述待匹配音频集合对应的作品表演者的作品表演者标识;
根据所述待匹配音频集合、所述作品表演者信息与待匹配公司信息生成音频匹配关系;
将所述作品表演者标识与所述音频匹配关系对应存储至音乐数据库。
10.一种信息匹配系统,其特征在于,包括:信息获取端、匹配平台;
信息获取端,用于获取待匹配音频集合以及所述待匹配音频集合的基本信息;所述基本信息包括作品表演者信息;
匹配平台,用于确定与所述待匹配音频集合匹配的目标表演者;
所述匹配平台包括初始匹配子平台、音视频处理子平台与关联匹配子平台;
所述初始匹配子平台,用于根据所述作品表演者信息确定与所述作品表演者对应的初始匹配表演者,并获取所述初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,所述初始音频集合的基本信息包括初始匹配表演者信息;
所述音视频处理平台,用于确定待匹配音频集合与初始音频集合之间的音色匹配度;
所述关联匹配子平台,用于根据所述待匹配音频集合的基本信息与所述初始音频集合的基本信息的匹配度以及所述音色匹配度,确定所述待匹配音频集合的作品表演者与每个所述初始匹配表演者之间的关联匹配度,以根据所述关联匹配度从所述初始匹配表演者中确定所述目标表演者。
11.一种信息匹配装置,其特征在于,包括:
信息获取模块,用于获取待匹配音频集合以及所述待匹配音频集合的基本信息;所述基本信息包括作品表演者信息;
信息确定模块,用于根据所述作品表演者信息确定与作品表演者对应的初始匹配表演者,并获取所述初始匹配表演者对应的初始音频集合及初始音频集合的基本信息,所述初始音频集合的基本信息包括初始匹配表演者信息;
音色匹配模块,用于确定待匹配音频集合与初始音频集合之间的音色匹配度;
关联匹配模块,用于根据所述待匹配音频集合的基本信息与所述初始音频集合的基本信息的匹配度以及所述音色匹配度,确定所述待匹配音频集合的作品表演者与每个所述初始匹配表演者之间的关联匹配度;所述初始匹配表演者的数量为多个;
目标表演者确定模块,用于根据所述关联匹配度从所述初始匹配表演者中确定与所述待匹配音频集合匹配的目标表演者,以对所述待匹配音频集合与所述目标表演者进行关联处理;
所述关联匹配模块包括关联匹配单元,用于根据待匹配音频集合的基本信息与所述初始音频集合的基本信息确定待匹配音频集合的作品表演者与各所述初始匹配表演者之间的地区匹配度与公司匹配度;获取所述音色匹配度,并根据所述音色匹配度、所述地区匹配度与所述公司匹配度确定所述关联匹配度。
12.根据权利要求11所述的装置,其特征在于,所述信息匹配装置还包括信息匹配模块,用于基于所述待匹配音频集合的基本信息确定所述待匹配音频集合对应的待匹配公司信息;
根据所述作品表演者信息与所述待匹配公司信息生成搜索字符串;
根据所述搜索字符串并基于音乐数据库进行搜索处理,若搜索得到匹配的表演者,则将该匹配的表演者确定为与所述待匹配音频集合匹配的目标表演者,以对所述待匹配音频集合与所述目标表演者进行关联处理;
否则,根据所述作品表演者信息确定与所述作品表演者对应的初始匹配表演者。
13.根据权利要求12所述的装置,其特征在于,所述信息匹配装置还包括第一关联模块,用于获取所述目标表演者的目标表演者标识;
基于所述目标表演者标识生成所述待匹配音频集合与所述目标表演者之间的音频匹配关系;
根据所述目标表演者标识将所述音频匹配关系存储至音乐数据库。
14.根据权利要求11所述的装置,其特征在于,所述信息确定模块包括初始表演者确定单元,用于基于所述作品表演者信息确定所述待匹配音频集合对应的作品表演者名称;所述作品表演者名称包括原始名称和扩展名称;
根据所述原始名称进行文本搜索处理,以得到第一匹配表演者;
根据所述扩展名称进行文本搜索处理,以得到第二匹配表演者;
根据所述第一匹配表演者与所述第二匹配表演者确定所述初始匹配表演者。
15.根据权利要求11所述的装置,其特征在于,所述关联匹配模块包括待匹配信息确定单元,用于基于待匹配音频集合的基本信息确定所述作品表演者对应的待匹配地区信息与待匹配公司信息;
基于所述初始音频集合的基本信息确定所述初始匹配表演者对应的初始地区信息与初始公司信息;
将所述待匹配地区信息与所述初始地区信息之间的匹配度确定为所述地区匹配度;
将所述待匹配公司信息与所述初始公司信息之间的匹配度确定为所述公司匹配度。
16.根据权利要求15所述的装置,其特征在于,公司匹配度确定单元被配置为:确定所述待匹配公司信息中是否包含原始公司名称;所述原始公司名称包括所述待匹配音频集合对应的发行公司名称,和/或创作公司名称;
如果所述待匹配公司信息中包含所述原始公司名称,则分别根据各所述初始公司信息确定多个初始公司名称;所述初始公司名称包括所述初始音频集合中仅包含单个表演者的所述初始音频集合对应的发行公司名称,和/或创作公司名称;
将所述原始公司名称分别与多个所述初始公司名称进行逐个对比,以确定所述公司匹配度。
17.根据权利要求11所述的装置,其特征在于,所述音色匹配模块被配置为:从所述待匹配音频集合中确定待匹配音频;所述待匹配音频所对应的表演者数量为一个;
从所述初始音频集合中确定初始音频;所述初始音频所对应的表演者数量为一个;
对所述待匹配音频与所述初始音频进行匹配度计算,根据所述待匹配音频与所述初始音频之间的匹配度确定所述音色匹配度。
18.根据权利要求11所述的装置,其特征在于,所述目标表演者确定模块被配置为:将所述关联匹配度大于匹配度阈值的所述初始匹配表演者确定为初始候选表演者;
根据所述关联匹配度从所述初始候选表演者中确定候选匹配表演者,并确定所述候选匹配表演者对应的候选表演者数量;所述候选匹配表演者是具有最大关联匹配度的初始候选表演者;
如果所述候选表演者数量为一个,则将所述候选匹配表演者确定为所述目标表演者;
如果所述候选表演者数量为多个,则确定多个所述候选匹配表演者对应的表演者热度;
将具有最大表演者热度的所述候选匹配表演者确定为所述目标表演者。
19.根据权利要求18所述的装置,其特征在于,所述信息匹配装置还包括第二关联模块,用于如果所述关联匹配度均不大于所述匹配度阈值,则确定所述初始匹配表演者是否基于扩展名称得到,且所述初始匹配表演者是否属于黑名单表演者集合;
如果所述初始匹配表演者不是基于扩展名称得到,且所述初始匹配表演者不属于黑名单表演者集合,则生成所述待匹配音频集合对应的作品表演者的作品表演者标识;
根据所述待匹配音频集合、所述作品表演者信息与待匹配公司信息生成音频匹配关系;
将所述作品表演者标识与所述音频匹配关系对应存储至音乐数据库。
20.一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至9中任意一项所述的信息匹配方法。
21.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9中任意一项所述的信息匹配方法。
CN202110534990.7A 2021-05-17 2021-05-17 信息匹配方法、系统、装置、存储介质及电子设备 Active CN113127676B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110534990.7A CN113127676B (zh) 2021-05-17 2021-05-17 信息匹配方法、系统、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110534990.7A CN113127676B (zh) 2021-05-17 2021-05-17 信息匹配方法、系统、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN113127676A CN113127676A (zh) 2021-07-16
CN113127676B true CN113127676B (zh) 2022-07-01

Family

ID=76782100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110534990.7A Active CN113127676B (zh) 2021-05-17 2021-05-17 信息匹配方法、系统、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113127676B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103383694B (zh) * 2012-12-14 2016-07-06 李博文 一种组织、管理、标识音乐文件的系统和方法
CN105893463B (zh) * 2016-03-23 2019-11-05 广州酷狗计算机科技有限公司 专辑录入方法及装置
CN110503961A (zh) * 2019-09-03 2019-11-26 北京字节跳动网络技术有限公司 音频识别方法、装置、存储介质及电子设备
KR20200008230A (ko) * 2018-07-16 2020-01-28 박대업 온라인 콘텐츠 플랫폼 기반 보이스 매칭 시스템
CN110889010A (zh) * 2018-09-10 2020-03-17 杭州网易云音乐科技有限公司 音频匹配方法、装置、介质和电子设备
CN106250400B (zh) * 2016-07-19 2021-03-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置以及系统
CN108255840B (zh) * 2016-12-28 2021-04-02 北京酷我科技有限公司 一种歌曲的推荐方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103383694B (zh) * 2012-12-14 2016-07-06 李博文 一种组织、管理、标识音乐文件的系统和方法
CN105893463B (zh) * 2016-03-23 2019-11-05 广州酷狗计算机科技有限公司 专辑录入方法及装置
CN106250400B (zh) * 2016-07-19 2021-03-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置以及系统
CN108255840B (zh) * 2016-12-28 2021-04-02 北京酷我科技有限公司 一种歌曲的推荐方法和系统
KR20200008230A (ko) * 2018-07-16 2020-01-28 박대업 온라인 콘텐츠 플랫폼 기반 보이스 매칭 시스템
CN110889010A (zh) * 2018-09-10 2020-03-17 杭州网易云音乐科技有限公司 音频匹配方法、装置、介质和电子设备
CN110503961A (zh) * 2019-09-03 2019-11-26 北京字节跳动网络技术有限公司 音频识别方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN113127676A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
US7613736B2 (en) Sharing music essence in a recommendation system
JP4945877B2 (ja) 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法
US7949649B2 (en) Automatically acquiring acoustic and cultural information about music
US10885107B2 (en) Music recommendation method and apparatus
US8751494B2 (en) Constructing album data using discrete track data from multiple sources
JP2005526340A (ja) プレイリストの生成、配信およびナビゲーション
WO2008004181A2 (en) Methods and devices for managing a play-list of digital content
CN104598502A (zh) 获取播放视频中背景音乐信息的方法、装置及系统
US9069771B2 (en) Music recognition method and system based on socialized music server
JP2010257466A (ja) デジタル・オーディオ・トラック・セット認識システム
CN106021398A (zh) 一种发布信息的方法和装置
CN101772766A (zh) 以用户为中心的信息搜索的方法和系统
CN102567447A (zh) 信息处理装置和方法、信息处理系统及程序
KR20060122679A (ko) 정보 처리 장치 및 정보 처리 방법과 컴퓨터 프로그램
JP2012118918A (ja) 情報検索システム、情報検索方法、情報検索プログラム
CN111753126A (zh) 用于视频配乐的方法和装置
CN114661939A (zh) 歌曲匹配方法、介质、装置和计算设备
WO2009054611A1 (en) System and method for managing information map
KR100916310B1 (ko) 오디오 신호처리 기반의 음악 및 동영상간의 교차 추천 시스템 및 방법
CN110287338B (zh) 行业热点确定方法、装置、设备和介质
CN113127676B (zh) 信息匹配方法、系统、装置、存储介质及电子设备
JP4824055B2 (ja) 類似プレイリスト検索方法、プログラム及び装置
CN113672758B (zh) 歌单生成方法、装置、介质和计算设备
US20040182225A1 (en) Portable custom media server
EP4250134A1 (en) System and method for automated music pitching

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant