CN109740623A - 一种演员筛选的方法及装置 - Google Patents
一种演员筛选的方法及装置 Download PDFInfo
- Publication number
- CN109740623A CN109740623A CN201811388994.3A CN201811388994A CN109740623A CN 109740623 A CN109740623 A CN 109740623A CN 201811388994 A CN201811388994 A CN 201811388994A CN 109740623 A CN109740623 A CN 109740623A
- Authority
- CN
- China
- Prior art keywords
- performer
- role
- label
- probability
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种演员筛选的方法及装置,涉及信息检索技术领域,用以更加准确地选择符合角色设定的演员。本申请实施例的方案包括:接收用户输入的角色描述信息和目标标签,目标标签为符合目标角色的演员标签,然后确定角色描述信息和各演员的角色小传之间的第一相似度,并确定目标标签与各演员的标签之间的第二相似度,进而通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与目标角色的匹配度。
Description
技术领域
本发明涉及信息检索技术领域,特别是涉及一种演员筛选的方法及装置。
背景技术
目前,为了方便用户(导演或者制片人)为电视剧或者电影选择角色,出现了智能选角系统。智能选角系统中包括大量的演员信息,可以人工为这些演员添加标签,例如针对演员的气质、风格等为演员添加标签。用户可以在智能选角系统中输入角色设定,然后智能选角系统可将角色设定与演员的标签进行匹配,从而筛选出符合角色设定的演员。
然而,随着演员的不断成长,演员的相关信息也会出现变化,例如演员前期的角色的风格都是比较清新甜美的,而后期风格变为了霸道高冷,但是智能选角系统中为该演员添加的标签未必能够实时更新,所以人工为演员添加的标签不能及时地反应演员的当前状态,基于人工为演员添加的标签选取的角色可能不符合角色设定。
发明内容
本发明实施例的目的在于提供一种演员筛选的方法及装置,以更加准确地选择符合角色设定的演员。具体技术方案如下:
第一方面,本申请实施例提供一种演员筛选的方法,包括:
接收用户输入的角色描述信息和目标标签,所述目标标签为符合目标角色的演员标签;
确定所述角色描述信息和各演员的角色小传之间的第一相似度,所述角色小传包括演员的基本信息以及演艺经历信息;
确定所述目标标签与各演员的标签之间的第二相似度;
通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与所述目标角色的匹配度。
在一种可能的实现方式中,所述确定角色描述信息和各演员的角色小传之间的第一相似度,包括:
确定翻译概率、第一出现概率、第二出现概率以及全局概率;
根据所述翻译概率、所述第一出现概率、所述第二出现概率以及所述全局概率确定所述角色描述信息和各演员的角色小传之间的第一相似度;
其中,所述翻译概率为角色小传中的各个词翻译为所述角色描述信息中的词的概率;
所述第一出现概率为角色小传中的各个词出现在同一角色小传中的概率;
所述第二出现概率为所述角色描述信息中的各个词出现在每个角色小传中的概率;
所述全局概率为所述角色描述信息中的各个词出现在选角系统中的全部角色小传中的概率。
在一种可能的实现方式中,所述目标标签包括目标气质标签和目标特长标签;所述确定所述目标标签与各演员的标签之间的第二相似度,包括:
确定所述目标气质标签与各演员气质标签之间的第一匹配参数,所述第一匹配参数为所述目标气质标签对应词向量的平均值,与演员气质标签对应的词向量的平均值之间的余弦相似度;
确定所述目标气质标签与各演员气质标签之间的第二匹配参数,所述第二匹配参数为所述目标气质标签与演员气质标签的重复率;
确定所述目标特长标签与各演员特长标签之间的第三匹配参数,所述第三匹配参数为所述目标特长标签在各演员特长标签中出现的次数;
确定所述目标气质标签与各演员气质标签之间的第四匹配参数,所述第四匹配参数为所述目标气质标签中的各标签与演员的各气质标签之间的两两余弦相似度之和;
分别根据各演员对应的第一匹配参数、第二匹配参数、第三匹配参数和第四匹配参数确定所述目标演员标签与各演员标签之间的第二相似度。
在一种可能的实现方式中,所述方法还包括:
获取各演员的角色小传;
分别对各演员的角色小传进行分词操作;
将各演员的角色小传中的词输入神经网络模型,生成演员的角色小传中各个词对应的词向量。
在一种可能的实现方式中,在所述确定翻译概率、第一出现概率、第二出现概率以及全局概率之前,所述方法还包括:
获取各演员的角色小传中的各个词对应的词向量,以及所述角色描述信息中的词对应的词向量;
所述翻译概率为所述角色小传中的各个词对应的词向量与所述角色描述信息中的词对应的词向量之间的余弦相似度。
第二方面,本申请实施例提供一种演员筛选的装置,包括:
接收模块,用于接收用户输入的角色描述信息和目标标签,所述目标标签为符合目标角色的演员标签;
确定模块,用于确定所述角色描述信息和各演员的角色小传之间的第一相似度,所述角色小传包括演员的基本信息以及演艺经历信息;确定所述目标标签与各演员的标签之间的第二相似度;通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与所述目标角色的匹配度。
在一种可能的实现方式中,所述确定模块,具体用于:
确定翻译概率、第一出现概率、第二出现概率以及全局概率;
根据所述翻译概率、所述第一出现概率、所述第二出现概率以及所述全局概率确定所述角色描述信息和各演员的角色小传之间的第一相似度;
其中,所述翻译概率为角色小传中的各个词翻译为所述角色描述信息中的词的概率;
所述第一出现概率为角色小传中的各个词出现在同一角色小传中的概率;
所述第二出现概率为所述角色描述信息中的各个词出现在每个角色小传中的概率;
所述全局概率为所述角色描述信息中的各个词出现在选角系统中的全部角色小传中的概率。
在一种可能的实现方式中,所述目标标签包括目标气质标签和目标特长标签;所述确定模块,具体用于:
确定所述目标气质标签与各演员气质标签之间的第一匹配参数,所述第一匹配参数为所述目标气质标签对应词向量的平均值,与演员气质标签对应的词向量的平均值之间的余弦相似度;
确定所述目标气质标签与各演员气质标签之间的第二匹配参数,所述第二匹配参数为所述目标气质标签与演员气质标签的重复率;
确定所述目标特长标签与各演员特长标签之间的第三匹配参数,所述第三匹配参数为所述目标特长标签在各演员特长标签中出现的次数;
确定所述目标气质标签与各演员气质标签之间的第四匹配参数,所述第四匹配参数为所述目标气质标签中的各标签与演员的各气质标签之间的两两余弦相似度之和;
分别根据各演员对应的第一匹配参数、第二匹配参数、第三匹配参数和第四匹配参数确定所述目标演员标签与各演员标签之间的第二相似度。
在一种可能的实现方式中,所述装置还包括:
获取模块,用于获取各演员的角色小传;
分词模块,用于分别对各演员的角色小传进行分词操作;
生成模块,用于将各演员的角色小传中的词输入神经网络模型,生成演员的角色小传中各个词对应的词向量。
在一种可能的实现方式中,所述获取模块,还用于获取各演员的角色小传中的各个词对应的词向量,以及所述角色描述信息中的词对应的词向量;所述翻译概率为所述角色小传中的各个词对应的词向量与所述角色描述信息中的词对应的词向量之间的余弦相似度。
第三方面,本申请实施例提供一种电子设备,该电子设备包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现第一方面中所述的演员筛选的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中所述的演员筛选的方法。
第五方面,本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面中所述的演员筛选的方法。
采用本申请实施例提供的演员筛选的方法,选角系统可确定角色描述信息和各演员的角色小传之间的第一相似度,以及目标标签与各演员的标签之间的第二相似度,进而根据第一相似度和第二相似度确定各演员与目标角色的匹配度,即本申请实施例不仅依赖于演员的标签来选择角色,而是将演员的角色小传和演员标签结合来确定各演员与目标角色的相似度,由于角色小传包括演员参演过的作品信息,可以更加全面的反映演员适合的角色,所以本申请实施例综合考虑演员的角色小传和演员标签,可以更加准确地确定演员与目标角色的相似度,从而帮助用户准确地选择合适的演员。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种演员筛选的方法的流程图;
图2为本申请实施例提供的一种基于翻译的语言模型的示例性示意图;
图3为本申请实施例提供的一种演员筛选的装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
为了使得用户可以准确地通过选角系统选择符合角色设定的演员,本申请实施例提供了一种演员筛选的方法,选角系统可接收用户输入的角色描述信息和目标标签,然后确定角色描述信息和各演员的角色小传之间的第一相似度,确定目标标签与各演员标签之间的第二相似度,进而通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与目标角色的匹配度。即本申请实施例不仅依赖于演员的标签来选择角色,而是将演员的角色小传和演员标签结合来确定各演员与目标角色的相似度,由于角色小传包括演员参演过的作品信息,可以更加全面的反映演员适合的角色,所以本申请实施例综合考虑演员的角色小传和演员标签,可以更加准确地确定演员与目标角色的相似度,从而帮助用户准确地选择合适的演员。
如图1所示,本申请实施例提供了一种演员筛选的方法,该方法由终端执行,具体可以由终端中的选角系统执行,该方法包括:
S101、接收用户输入的角色描述信息和目标标签,目标标签为符合目标角色的演员标签。
其中,目标标签包括至少一个目标气质标签和至少一个目标特长标签,例如,目标气质标签可以是甜美、可爱,目标特长标签可以为音乐、舞蹈。
S102、确定角色描述信息和各演员的角色小传之间的第一相似度。
其中,选角系统中包括演员知识库,演员知识库中存储了各演员的角色小传,角色小传包括演员的基本信息以及演艺经历信息。
具体地,可确定翻译概率、第一出现概率、第二出现概率以及全局概率,然后根据翻译概率、第一出现概率、第二出现概率以及全局概率确定角色描述信息和各演员的角色小传之间的第一相似度。
其中,翻译概率为角色描述信息中的各个词翻译为角色小传中的词的概率。
可将角色描述信息表示为q,角色描述信息中的词表示为t,角色小传表示为D,角色小传中的词表示为w。
翻译概率可以为P(t|w),即为w翻译为t的概率。例如,若一个演员的角色小传中包含的词有校花、甜美,角色描述信息中包含的词有女神、美丽,则可计算校花翻译为女神的概率、校花翻译为美丽的概率、甜美翻译为女神的概率和美丽翻译为女神的概率。
P(t|w)可通过w和t的词向量之间的关联关系来确定,在本申请实施例中,可以预先获取各演员的角色小传,然后对各演员的角色小传进行分词操作,之后将各演员的角色小传中的词输入神经网络模型,从而生成演员的角色小传中各个词对应的词向量。
具体地,可从百度百科中获取各演员的角色小传,然后对这些角色小传进行分词,将每个词作为一行输入Word2vec工具,Word2vec工具可执行skip-gram模型,进而生成每个词对应的词向量,例如可为每个词生成一个200维的词向量。进而,在确定翻译概率之前,可获取各演员的角色小传中的各个词对应的词向量,以及角色描述信息中的词对应的词向量。翻译概率为角色小传中的各个词对应的词向量与角色描述信息中的词对应的词向量之间的余弦相似度。可选地,本申请实施例中P(t|w)可以为w对应的词向量和t对应的词向量的余弦相似度。
第一出现概率为角色小传中的各个词出现在同一角色小传中的概率。
第一出现概率可以表示为P(w|D),例如,演员A的角色小传中中包括词“甜美”,该角色小传中“甜美”这个词出现了5次,该角色小传中共有100各词,则可确定“甜美”一词在演员A的角色小传中出现的概率为5%。可以理解的是,对于一个角色小传,本申请实施例需计算该角色小传中的每个词的第一出现概率。
第二出现概率为角色描述信息中的各个词出现在每个角色小传中的概率。
第二出现概率可以表示为P(t|D),例如,若角色描述信息中包含的词有“男神”、“帅气”,则需分别计算“男神”一词在各角色小传中出现的概率,并分别计算“帅气”一词在各角色小传中出现的概率。
全局概率为角色描述信息中的各个词出现在选角系统中的全部角色小传中的概率。全局概率可以表示为P(t|C)。
本申请实施例可对各演员的角色小传进行分词,生成一维语言模型,并基于上述skip-gram模型输出的词向量之间的关联关系构建翻译模型,由语言模型和翻译模型组成基于翻译的语言模型,进而可通过该模型来计算第一相似度。
示例性地,该模型如图2所示,图2中的角色小传为包含演员的演艺经历的文档,w1、w2、w3、w4、w5均为其中一个角色小传(例如角色小传1)中的词,根据该模型可以确定上述每个词在角色小传1中出现的概率,分别为P(w1|D)、P(w2|D)、P(w3|D)、P(w4|D)、P(w5|D)。另外还能确定各个词之间的翻译概率,例如图2中校草翻译为男神的概率为0.9,校草翻译为帅气的概率为0.8。
具体的,通过图2可确定上述翻译概率P(t|w)、第一出现概率P(w|D)、第二出现概率P(t|D)和全局概率P(t|C),进而根据这些信息可计算出角色描述信息和各演员的角色小传之间的第一相似度为:
其中,α和β均为权重参数,通过公式中α和β的设置,可以使得经求和得到的第一相似度处于0和1之间。示例性地,α可以为0.0001,β可以为0.4。
S103、确定目标标签与各演员的标签之间的第二相似度。
确定第二相似度的方法可包括以下步骤:
步骤一、确定目标气质标签与各演员气质标签之间的第一匹配参数,第一匹配参数为目标气质标签对应词向量的平均值,与演员气质标签对应的词向量的平均值之间的余弦相似度。
示例性地,若目标气质标签为美丽、甜美、女神,则可计算这三个词对应的词向量的平均值1,若演员A的气质标签为御姐、校花、女神,则计算这三个侧对应的词向量的平均值2,然后计算平均值1和平均值2的余弦相似度,该余弦相似度为第一匹配参数,可通过该方法计算目标气质标签与每个演员的气质标签的第一匹配参数,第一匹配参数可表示为tTagSim。
步骤二、确定目标气质标签与各演员气质标签之间的第二匹配参数,第二匹配参数为目标气质标签与演员气质标签的重复率。
示例性地,若目标气质标签为美丽、甜美、女神,演员A的气质标签为御姐、校花、女神,则可确定重复率为1/3,该重复率即为第二匹配参数。可通过这种方法确定目标气质标签与每个演员的气质标签之间的第二匹配参数,第二匹配参数可表示为tTagRatio。
步骤三、确定目标特长标签与各演员特长标签之间的第三匹配参数,第三匹配参数为目标特长标签在各演员特长标签中出现的次数。第三匹配参数可表示为sTagCnt。
步骤四、确定目标气质标签与各演员气质标签之间的第四匹配参数,第四匹配参数为目标气质标签中的各标签与演员的各气质标签之间的两两余弦相似度之和。
示例性地,若目标气质标签为美丽、甜美,演员A的气质标签为御姐、校花,则可计算美丽对应的词向量与御姐对应的词向量的余弦相似度a、美丽对应的词向量与校花对应的词向量的余弦相似度b、甜美对应的词向量与御姐对应的词向量的余弦相似度c、甜美对应的词向量与校花对应的词向量的余弦相似度d。将余弦相似度a、余弦相似度b、余弦相似度c和余弦相似度d相加得到的和作为第四匹配参数,可按照上述方法分别确定目标气质标签与每个演员的气质标签之间的第四匹配参数,第四匹配参数可表示为tTagTotalSim。
步骤五、分别根据各演员对应的第一匹配参数、第二匹配参数、第三匹配参数和第四匹配参数确定目标演员标签与各演员标签之间的第二相似度。
其中,第二相似度可以为:
tag_sim(q,D)=γ·(α·tTagSim+(1-α)·tTagRatio)+μ·sTagCnt+δ·tTagTotalSim
其中,γ、μ、δ均为预设的权重参数,示例性地,该式中的γ为5,α为0.2,μ和δ均为1。
S104、通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与目标角色的匹配度。
该匹配度可以表示为:
sim(q,D)=λ·Tag_sim(q,D)+(1-λ)·Trlm_sim(q,D)
其中,λ为预设权重系数,示例性地,λ可以为0.5。
可以理解的是,在确定各演员与目标角色的相似度后,还可按照相似度从高到低的顺序对各演员进行排序,以便于用户选择相似度较高的演员扮演目标角色。
采用本申请实施例提供的演员筛选的方法,选角系统可确定角色描述信息和各演员的角色小传之间的第一相似度,以及目标标签与各演员的标签之间的第二相似度,进而根据第一相似度和第二相似度确定各演员与目标角色的匹配度,即本申请实施例不仅依赖于演员的标签来选择角色,而是将演员的角色小传和演员标签结合来确定各演员与目标角色的相似度,由于角色小传包括演员参演过的作品信息,可以更加全面的反映演员适合的角色,所以本申请实施例综合考虑演员的角色小传和演员标签,可以更加准确地确定演员与目标角色的相似度,从而帮助用户准确地选择合适的演员。
对应于上述方法实施例,本申请实施例还提供一种演员筛选的装置,如图3所示,该方法包括:接收模块301和确定模块302。
接收模块301,用于接收用户输入的角色描述信息和目标标签,目标标签为符合目标角色的演员标签。
确定模块302,用于确定角色描述信息和各演员的角色小传之间的第一相似度,角色小传包括演员的基本信息以及演艺经历信息;确定目标标签与各演员的标签之间的第二相似度;通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与目标角色的匹配度。
可选地,确定模块302,具体用于:
确定翻译概率、第一出现概率、第二出现概率以及全局概率;
根据翻译概率、第一出现概率、第二出现概率以及全局概率确定角色描述信息和各演员的角色小传之间的第一相似度;
其中,翻译概率为角色小传中的各个词翻译为角色描述信息中的词的概率;
第一出现概率为角色小传中的各个词出现在同一角色小传中的概率;
第二出现概率为角色描述信息中的各个词出现在每个角色小传中的概率;
全局概率为角色描述信息中的各个词出现在选角系统中的全部角色小传中的概率。
可选地,目标标签包括目标气质标签和目标特长标签;
确定模块302,具体用于:确定目标气质标签与各演员气质标签之间的第一匹配参数,第一匹配参数为目标气质标签对应词向量的平均值,与演员气质标签对应的词向量的平均值之间的余弦相似度;
确定目标气质标签与各演员气质标签之间的第二匹配参数,第二匹配参数为目标气质标签与演员气质标签的重复率;
确定目标特长标签与各演员特长标签之间的第三匹配参数,第三匹配参数为目标特长标签在各演员特长标签中出现的次数;
确定目标气质标签与各演员气质标签之间的第四匹配参数,第四匹配参数为目标气质标签中的各标签与演员的各气质标签之间的两两余弦相似度之和;
分别根据各演员对应的第一匹配参数、第二匹配参数、第三匹配参数和第四匹配参数确定目标演员标签与各演员标签之间的第二相似度。
可选地,该装置还包括:
获取模块,用于获取各演员的角色小传;
分词模块,用于分别对各演员的角色小传进行分词操作;
生成模块,用于将各演员的角色小传中的词输入神经网络模型,生成演员的角色小传中各个词对应的词向量。
可选地,获取模块,还用于获取各演员的角色小传中的各个词对应的词向量,以及角色描述信息中的词对应的词向量;翻译概率为角色小传中的各个词对应的词向量与角色描述信息中的词对应的词向量之间的余弦相似度。
本申请实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:上述方法实施例中由终端执行的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一演员筛选的方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一演员筛选的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (12)
1.一种演员筛选的方法,其特征在于,包括:
接收用户输入的角色描述信息和目标标签,所述目标标签为符合目标角色的演员标签;
确定所述角色描述信息和各演员的角色小传之间的第一相似度,所述角色小传包括演员的基本信息以及演艺经历信息;
确定所述目标标签与各演员的标签之间的第二相似度;
通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与所述目标角色的匹配度。
2.根据权利要求1所述的方法,其特征在于,所述确定角色描述信息和各演员的角色小传之间的第一相似度,包括:
确定翻译概率、第一出现概率、第二出现概率以及全局概率;
根据所述翻译概率、所述第一出现概率、所述第二出现概率以及所述全局概率确定所述角色描述信息和各演员的角色小传之间的第一相似度;
其中,所述翻译概率为角色小传中的各个词翻译为所述角色描述信息中的词的概率;
所述第一出现概率为角色小传中的各个词出现在同一角色小传中的概率;
所述第二出现概率为所述角色描述信息中的各个词出现在每个角色小传中的概率;
所述全局概率为所述角色描述信息中的各个词出现在选角系统中的全部角色小传中的概率。
3.根据权利要求2所述的方法,其特征在于,所述目标标签包括目标气质标签和目标特长标签;所述确定所述目标标签与各演员的标签之间的第二相似度,包括:
确定所述目标气质标签与各演员气质标签之间的第一匹配参数,所述第一匹配参数为所述目标气质标签对应词向量的平均值,与演员气质标签对应的词向量的平均值之间的余弦相似度;
确定所述目标气质标签与各演员气质标签之间的第二匹配参数,所述第二匹配参数为所述目标气质标签与演员气质标签的重复率;
确定所述目标特长标签与各演员特长标签之间的第三匹配参数,所述第三匹配参数为所述目标特长标签在各演员特长标签中出现的次数;
确定所述目标气质标签与各演员气质标签之间的第四匹配参数,所述第四匹配参数为所述目标气质标签中的各标签与演员的各气质标签之间的两两余弦相似度之和;
分别根据各演员对应的第一匹配参数、第二匹配参数、第三匹配参数和第四匹配参数确定所述目标演员标签与各演员标签之间的第二相似度。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
获取各演员的角色小传;
分别对各演员的角色小传进行分词操作;
将各演员的角色小传中的词输入神经网络模型,生成演员的角色小传中各个词对应的词向量。
5.根据权利要求4所述的方法,其特征在于,在所述确定翻译概率、第一出现概率、第二出现概率以及全局概率之前,所述方法还包括:
获取各演员的角色小传中的各个词对应的词向量,以及所述角色描述信息中的词对应的词向量;
所述翻译概率为所述角色小传中的各个词对应的词向量与所述角色描述信息中的词对应的词向量之间的余弦相似度。
6.一种演员筛选的装置,其特征在于,包括:
接收模块,用于接收用户输入的角色描述信息和目标标签,所述目标标签为符合目标角色的演员标签;
确定模块,用于确定所述角色描述信息和各演员的角色小传之间的第一相似度,所述角色小传包括演员的基本信息以及演艺经历信息;确定所述目标标签与各演员的标签之间的第二相似度;通过预设权重系数分别对各演员对应的第一相似度和第二相似度进行线性加权求和,确定各演员与所述目标角色的匹配度。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,具体用于:
确定翻译概率、第一出现概率、第二出现概率以及全局概率;
根据所述翻译概率、所述第一出现概率、所述第二出现概率以及所述全局概率确定所述角色描述信息和各演员的角色小传之间的第一相似度;
其中,所述翻译概率为角色小传中的各个词翻译为所述角色描述信息中的词的概率;
所述第一出现概率为角色小传中的各个词出现在同一角色小传中的概率;
所述第二出现概率为所述角色描述信息中的各个词出现在每个角色小传中的概率;
所述全局概率为所述角色描述信息中的各个词出现在选角系统中的全部角色小传中的概率。
8.根据权利要求7所述的装置,其特征在于,所述目标标签包括目标气质标签和目标特长标签;所述确定模块,具体用于:
确定所述目标气质标签与各演员气质标签之间的第一匹配参数,所述第一匹配参数为所述目标气质标签对应词向量的平均值,与演员气质标签对应的词向量的平均值之间的余弦相似度;
确定所述目标气质标签与各演员气质标签之间的第二匹配参数,所述第二匹配参数为所述目标气质标签与演员气质标签的重复率;
确定所述目标特长标签与各演员特长标签之间的第三匹配参数,所述第三匹配参数为所述目标特长标签在各演员特长标签中出现的次数;
确定所述目标气质标签与各演员气质标签之间的第四匹配参数,所述第四匹配参数为所述目标气质标签中的各标签与演员的各气质标签之间的两两余弦相似度之和;
分别根据各演员对应的第一匹配参数、第二匹配参数、第三匹配参数和第四匹配参数确定所述目标演员标签与各演员标签之间的第二相似度。
9.根据权利要求7或8所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取各演员的角色小传;
分词模块,用于分别对各演员的角色小传进行分词操作;
生成模块,用于将各演员的角色小传中的词输入神经网络模型,生成演员的角色小传中各个词对应的词向量。
10.根据权利要求9所述的装置,其特征在于,
所述获取模块,还用于获取各演员的角色小传中的各个词对应的词向量,以及所述角色描述信息中的词对应的词向量;所述翻译概率为所述角色小传中的各个词对应的词向量与所述角色描述信息中的词对应的词向量之间的余弦相似度。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811388994.3A CN109740623B (zh) | 2018-11-21 | 2018-11-21 | 一种演员筛选的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811388994.3A CN109740623B (zh) | 2018-11-21 | 2018-11-21 | 一种演员筛选的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109740623A true CN109740623A (zh) | 2019-05-10 |
CN109740623B CN109740623B (zh) | 2020-12-04 |
Family
ID=66356957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811388994.3A Active CN109740623B (zh) | 2018-11-21 | 2018-11-21 | 一种演员筛选的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109740623B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035703A (zh) * | 2020-08-31 | 2020-12-04 | 西安君悦网络科技有限公司 | 一种用于短视频中寻找演员的方法及系统 |
CN113792547A (zh) * | 2021-07-28 | 2021-12-14 | 中国科学院自动化研究所 | 影视作品选角方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101883230A (zh) * | 2010-05-31 | 2010-11-10 | 中山大学 | 一种数字电视演员检索方法及系统 |
CN102708583A (zh) * | 2012-05-02 | 2012-10-03 | 厦门大学 | 二维动画角色的自动匹配方法 |
US20130326483A1 (en) * | 2012-05-31 | 2013-12-05 | Vmware, Inc. | Unit test of multi-threaded object-oriented applications using mocks |
CN103984738A (zh) * | 2014-05-22 | 2014-08-13 | 中国科学院自动化研究所 | 一种基于搜索匹配的角色标注方法 |
CN105787087A (zh) * | 2016-03-14 | 2016-07-20 | 腾讯科技(深圳)有限公司 | 合演视频中搭档的匹配方法和装置 |
CN107562870A (zh) * | 2017-08-30 | 2018-01-09 | 国信优易数据有限公司 | 一种用户推荐方法和装置 |
CN108763189A (zh) * | 2018-04-12 | 2018-11-06 | 武汉斗鱼网络科技有限公司 | 一种直播间内容标签权重计算方法、装置及电子设备 |
-
2018
- 2018-11-21 CN CN201811388994.3A patent/CN109740623B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101883230A (zh) * | 2010-05-31 | 2010-11-10 | 中山大学 | 一种数字电视演员检索方法及系统 |
CN102708583A (zh) * | 2012-05-02 | 2012-10-03 | 厦门大学 | 二维动画角色的自动匹配方法 |
US20130326483A1 (en) * | 2012-05-31 | 2013-12-05 | Vmware, Inc. | Unit test of multi-threaded object-oriented applications using mocks |
CN103984738A (zh) * | 2014-05-22 | 2014-08-13 | 中国科学院自动化研究所 | 一种基于搜索匹配的角色标注方法 |
CN105787087A (zh) * | 2016-03-14 | 2016-07-20 | 腾讯科技(深圳)有限公司 | 合演视频中搭档的匹配方法和装置 |
CN107562870A (zh) * | 2017-08-30 | 2018-01-09 | 国信优易数据有限公司 | 一种用户推荐方法和装置 |
CN108763189A (zh) * | 2018-04-12 | 2018-11-06 | 武汉斗鱼网络科技有限公司 | 一种直播间内容标签权重计算方法、装置及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035703A (zh) * | 2020-08-31 | 2020-12-04 | 西安君悦网络科技有限公司 | 一种用于短视频中寻找演员的方法及系统 |
CN113792547A (zh) * | 2021-07-28 | 2021-12-14 | 中国科学院自动化研究所 | 影视作品选角方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109740623B (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555050B (zh) | 一种基于元路径的异构网络节点表示学习方法 | |
CN109783582A (zh) | 一种知识库对齐方法、装置、计算机设备及存储介质 | |
US20120233210A1 (en) | Storage of Arbitrary Points in N-Space and Retrieval of Subset thereof Based on Criteria Including Maximum Distance to an Arbitrary Reference Point | |
CN110428046A (zh) | 神经网络结构的获取方法及装置、存储介质 | |
CN105718566B (zh) | 一种智能音乐推荐系统 | |
CN109783727A (zh) | 检索推荐方法、装置、计算机可读存储介质及电子设备 | |
CN112100489A (zh) | 对象推荐的方法、装置和计算机存储介质 | |
CN116601626A (zh) | 个人知识图谱构建方法、装置及相关设备 | |
CN109740623A (zh) | 一种演员筛选的方法及装置 | |
CN105245924A (zh) | 视频信息的推送和显示方法及应用该方法的视频播放器 | |
CN106227881A (zh) | 一种信息处理方法及服务器 | |
CN108197203A (zh) | 一种门脸头图挑选方法、装置、服务器和存储介质 | |
Wang et al. | Latency-aware adaptive video summarization for mobile edge clouds | |
CN109348260B (zh) | 一种直播间推荐方法、装置、设备及介质 | |
CN114492152A (zh) | 更新网络模型的方法、图像分类的方法、语言建模的方法 | |
CN112686381A (zh) | 神经网络模型、方法、电子设备及可读介质 | |
CN108133036A (zh) | 一种用户兴趣点的权重值确定方法、装置及电子设备 | |
WO2014008387A2 (en) | Three-dimensional object compression | |
CN109361929A (zh) | 一种确定直播间标签的方法以及相关设备 | |
CN112100459A (zh) | 搜索空间的生成方法及装置、电子设备及存储介质 | |
CN116150429A (zh) | 异常对象识别方法、装置、计算设备以及存储介质 | |
CN112100468A (zh) | 搜索空间的生成方法及装置、电子设备及存储介质 | |
CN113763080A (zh) | 推荐物品的确定方法、装置、电子设备和存储介质 | |
CN111178925A (zh) | 用户画像的属性预测方法、装置、服务器和计算机可读介质 | |
CN112954051B (zh) | 一种用于食材加工的远程控制方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |