CN117390216A - 音乐数据处理方法、装置 - Google Patents
音乐数据处理方法、装置 Download PDFInfo
- Publication number
- CN117390216A CN117390216A CN202311318000.1A CN202311318000A CN117390216A CN 117390216 A CN117390216 A CN 117390216A CN 202311318000 A CN202311318000 A CN 202311318000A CN 117390216 A CN117390216 A CN 117390216A
- Authority
- CN
- China
- Prior art keywords
- classification
- emotion
- target music
- music
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 230000008451 emotion Effects 0.000 claims abstract description 174
- 239000013598 vector Substances 0.000 claims abstract description 79
- 238000013145 classification model Methods 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 10
- 238000010606 normalization Methods 0.000 claims description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims 1
- 150000001875 compounds Chemical class 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/65—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/686—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
- H04N21/8113—Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Child & Adolescent Psychology (AREA)
- Library & Information Science (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及音乐音频处理领域,具体涉及一种音乐数据处理方法、装置,方法包括预先构建若干个目标音乐的情绪标签;然后构建每一种情绪标签对应的二分类模型,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,当目标音乐获得多个情绪标签的数量超过第一阈值,则提取目标音乐的每一个情绪标签的分类概率分布,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集;以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类。
Description
技术领域
本发明属于音乐音频处理领域,具体涉及一种音乐数据处理方法、装置。
背景技术
在为媒体内容添加背景音乐技术之中,为便于为媒体内容添加背景音乐,内容平台会提供带有情绪标签的音乐库,通过情绪标签来标识音乐可能让用户感受到情绪,为媒体内容进行背景音乐添加时,一般通过参考音乐的情绪标签从音乐库中确定与该媒体内容对应的背景音乐,因为相关现有技术为音乐分配的情绪标签并不准确,为此相关现有技术,比如专利文献CN202111107521.3即公开了一种背景音乐添加方法,该技术提出通过多分类模型识别目标音乐在多个情绪标签下的概率分布,然后确定包括基于人类情绪确定的1个情绪标签和基于目标内容平台中内容所涉及主题确定的1个情绪标签,共计两个情绪标签,然后根据目标音乐的2个情绪标签,确定目标媒体内容对应的背景音乐。
这种现有技术核心在于通过多分类模型识别目标音乐的情绪标签并具体在分类上,比如其通常采用二分类方法,对于每一种情绪类型设置一种对应的情绪二分类模块,比如采用具体的神经网络激活函数采用softmax函数实现分类,这种分类最终能够获得每一种音乐的情绪标签下目标音乐拥有该情绪标签的概率分布参数,比如能够确定,对高兴这种音乐的情绪标签,目标音乐拥有高兴标签的概率为x,目标音乐不拥有高兴标签的概率为1-x,显然这种二分类方法只能确定目标音乐属于某一个特定情绪的概率,这样可能出现某一种目标音乐获得多种音乐标签的情况,也即比如目标音乐经过若干情绪二分类模块处理之后可能出现目标音乐同时拥有多个标签的概率均大于0.5,这种情况下目标音乐就很难具有确定的标签分类,一般的超过2个分类标签对于整个目标音乐的分类就非常困难,所以现有技术中基于多个情绪标签对目标音乐的情绪标签分类判断还不够精准。
发明内容
本发明目的在于提供一种音乐数据处理方法、装置,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:
一种音乐数据处理方法包括步骤,
S1预先构建若干个目标音乐的情绪标签;
S2然后构建每一种情绪标签对应的二分类模型,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,当目标音乐获得多个情绪标签的数量超过第一阈值,则提取目标音乐的每一个情绪标签的分类概率分布,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集;
S3循环步骤S2若干次,每一次循环之前更换不同的目标音乐,每一次循环均获得对应的多维度分类向量对应的空间坐标位置,实现对空间数据集的更新;
S4以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类。
进一步,构建每一种情绪标签对应的二分类模型具体采用基于卷积神经网络构建的分类模型。
进一步,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,具体包括在特定情绪标签对应的二分类模型之中输入目标音乐对应数据输出目标音乐对应情绪标签的分类概率分布。
进一步,提取目标音乐的每一个情绪标签的分类概率分布,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,提取情绪标签的分类概率分布,即包括,提取目标音乐拥有该类情绪的概率。
进一步,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,对情绪标签的分类概率分布归一化处理,即包括,对目标音乐拥有若干个情绪标签的概率归一化处理,形成多维度分类向量具体指,多维度分类向量的每一个分量均由一个情绪标签的概率归一化获取。
进一步,空间数据集包括多个多维度分类向量对应的空间坐标位置,每一个空间坐标位置即对应一个多维度分类向量,空间坐标位置与对应多维度分类向量的数学表征形式一致,空间数据集之中存储的空间坐标定义为标准空间坐标,每一个标准空间坐标拥有一个复合情绪标签。
进一步,以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类,具体指,在对目标音乐进行分类之前首先基于每一种情绪标签对应的二分类模型对目标音乐进行分类,然后,提取目标音乐的每一个情绪标签的分类概率分布,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,并且将该多维度分类向量作为待测向量,然后计算待测向量与空间数据集之中每一个标准空间坐标的距离,确定距离最近的一个标准空间坐标并且提取该距离最近标准空间坐标的复合情绪标签,然后给目标音乐附加该复合情绪标签作为唯一性分类标签对目标音乐进行分类。
本申请还公开了音乐数据处理装置,包括神经网络单元、控制单元、循环控制单元;
神经网络单元,用于构建每一种情绪标签对应的二分类模型,基于每一种情绪标签对应的二分类模型对目标音乐进行分类;
控制单元,用于当目标音乐获得多个情绪标签的数量超过第一阈值,则提取目标音乐的每一个情绪标签的分类概率分布,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集;
循环控制单元,用于循环控制,每一次循环之前更换不同的目标音乐,每一次循环均获得对应的多维度分类向量对应的空间坐标位置,实现对空间数据集的更新;
控制单元,还用于以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类。
音乐数据处理装置功能通过程序代码实现,相应的程序代码存储在机器可读介质。
有益效果
本申请实现了基于多个情绪标签对目标音乐的情绪标签分类的唯一化,分类更加的精准,具体的在数据处理上首先即通过单独的空间坐标位置对音乐分类并且能够实现基于多个情绪标签对目标音乐的情绪标签分类唯一化,实际上每一个分类本质又是多个情绪分量的复合,所以这种分类不仅仅实现了唯一化,又巧妙保留了多情绪的多元化,在分类之中即通过单独的空间坐标位置对音乐分类并且能够实现基于多个情绪标签对目标音乐的情绪标签分类唯一化。
附图说明
图1为本申请一种音乐数据处理方法的流程图。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中基于多个情绪标签对目标音乐的情绪标签分类判断还不够精准的问题,本申请公开了一种音乐数据处理方法,参考图1,包括步骤:
S1预先构建若干个目标音乐的情绪标签;比如有,喜、怒、乐等等10个情绪标签。
S2构建每一种情绪标签对应的二分类模型,构建每一种情绪标签对应的二分类模型具体可以采用基于卷积神经网络构建的分类模型,卷积神经网络是近年发展起来,20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(ConvolutionalNeuralNetworks-简称CNN)。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域广泛的应用。K.Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后,更多的科研工作者对该网络进行了改进。基于卷积神经网络构建分类模型具体为现有技术不再赘述。基于每一种情绪标签对应的二分类模型对目标音乐进行分类,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,具体包括在特定情绪标签对应的二分类模型之中输入目标音乐对应数据输出目标音乐对应情绪标签的分类概率分布,比如特定情绪标签为A类情绪标签,则具体包括在A类情绪标签对应的二分类模型之中输入目标音乐对应数据,输出目标音乐拥有A类情绪标签的分类概率分布,拥有A类情绪标签的分类概率分布包括目标音乐拥有A类情绪的概率X,还包括目标音乐不拥有A类情绪的概率1-X,当目标音乐获得多个情绪标签的数量超过第一阈值,比如第一阈值为2个,则提取目标音乐的每一个情绪标签的分类概率分布,提取目标音乐的每一个情绪标签的分类概率分布,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,提取情绪标签的分类概率分布,即包括,提取目标音乐拥有该类情绪的概率,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,对情绪标签的分类概率分布归一化处理,即包括,对目标音乐拥有若干个情绪标签的概率归一化处理,形成多维度分类向量具体指,多维度分类向量的每一个分量均由一个情绪标签的概率归一化获取,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集,空间数据集包括多个多维度分类向量对应的空间坐标位置,每一个空间坐标位置即对应一个多维度分类向量,空间坐标位置与对应多维度分类向量的数学表征形式一致,空间数据集之中存储的空间坐标定义为标准空间坐标,每一个标准空间坐标拥有一个复合情绪标签,给标准空间坐标附加复合情绪标签也可以通过人工标注。
S3循环步骤S2若干次,每一次循环之前更换不同的目标音乐,每一次循环均获得对应的多维度分类向量对应的空间坐标位置,实现对空间数据集的更新,实际上可以理解的,经过若干次循环空间数据集的存储数据增加,每一个增加的空间坐标位置即对应一个音乐的分类,可见本申请在数据处理上首先即通过单独的空间坐标位置对音乐分类并且能够实现基于多个情绪标签对目标音乐的情绪标签分类唯一化,实际上每一个分类本质又是多个情绪分量的复合,所以这种分类不仅仅实现了唯一化,又巧妙保留了多情绪的多元化。
S4以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类;以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类,具体指,在对目标音乐进行分类之前首先基于每一种情绪标签对应的二分类模型对目标音乐进行分类,然后,提取目标音乐的每一个情绪标签的分类概率分布,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,并且将该多维度分类向量作为待测向量,然后计算待测向量与空间数据集之中每一个标准空间坐标的距离,这里计算的距离包括曼哈顿距离、欧式距离等,确定距离最近的一个标准空间坐标并且提取该距离最近标准空间坐标的复合情绪标签,然后给目标音乐附加该复合情绪标签作为唯一性分类标签对目标音乐进行分类,可以理解的,可见本申请在分类之中即通过单独的空间坐标位置对音乐分类并且能够实现基于多个情绪标签对目标音乐的情绪标签分类唯一化。
本申请需要保护的实施例包括:
一种音乐数据处理方法,如图1,包括步骤,
S1预先构建若干个目标音乐的情绪标签;
S2然后构建每一种情绪标签对应的二分类模型,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,当目标音乐获得多个情绪标签的数量超过第一阈值,则提取目标音乐的每一个情绪标签的分类概率分布,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集;
S3循环步骤S2若干次,每一次循环之前更换不同的目标音乐,每一次循环均获得对应的多维度分类向量对应的空间坐标位置,实现对空间数据集的更新;
S4以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类。
优选地,构建每一种情绪标签对应的二分类模型具体采用基于卷积神经网络构建的分类模型。
优选地,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,具体包括在特定情绪标签对应的二分类模型之中输入目标音乐对应数据输出目标音乐对应情绪标签的分类概率分布。
优选地,提取目标音乐的每一个情绪标签的分类概率分布,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,提取情绪标签的分类概率分布,即包括,提取目标音乐拥有该类情绪的概率。
优选地,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,对情绪标签的分类概率分布归一化处理,即包括,对目标音乐拥有若干个情绪标签的概率归一化处理,形成多维度分类向量具体指,多维度分类向量的每一个分量均由一个情绪标签的概率归一化获取。
优选地,空间数据集包括多个多维度分类向量对应的空间坐标位置,每一个空间坐标位置即对应一个多维度分类向量,空间坐标位置与对应多维度分类向量的数学表征形式一致,空间数据集之中存储的空间坐标定义为标准空间坐标,每一个标准空间坐标拥有一个复合情绪标签。
优选地,以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类,具体指,在对目标音乐进行分类之前首先基于每一种情绪标签对应的二分类模型对目标音乐进行分类,然后,提取目标音乐的每一个情绪标签的分类概率分布,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,并且将该多维度分类向量作为待测向量,然后计算待测向量与空间数据集之中每一个标准空间坐标的距离,确定距离最近的一个标准空间坐标并且提取该距离最近标准空间坐标的复合情绪标签,然后给目标音乐附加该复合情绪标签作为唯一性分类标签对目标音乐进行分类。
可以理解的,本申请这里的音乐数据处理方法功能实现需要对应的音乐数据处理装置,音乐数据处理装置包括神经网络单元,用于构建每一种情绪标签对应的二分类模型,基于每一种情绪标签对应的二分类模型对目标音乐进行分类;
控制单元,用于当目标音乐获得多个情绪标签的数量超过第一阈值,则提取目标音乐的每一个情绪标签的分类概率分布,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集;
循环控制单元,用于循环控制,每一次循环之前更换不同的目标音乐,每一次循环均获得对应的多维度分类向量对应的空间坐标位置,实现对空间数据集的更新;
控制单元,还用于以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类。
可以理解的,本申请这里的音乐数据处理装置功能也可以通过程序代码实现,相应的程序代码存储在机器可读介质,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。为了提供与用户的交互,可以在计算机上实施此处描述的音乐数据处理装置单元功能,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
以上所述实施例仅表达了本发明的部分实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
Claims (9)
1.一种音乐数据处理方法,其特征在于,包括步骤:
S1预先构建若干个目标音乐的情绪标签;
S2然后构建每一种情绪标签对应的二分类模型,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,当目标音乐获得多个情绪标签的数量超过第一阈值,则提取目标音乐的每一个情绪标签的分类概率分布,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集;
S3循环步骤S2若干次,每一次循环之前更换不同的目标音乐,每一次循环均获得对应的多维度分类向量对应的空间坐标位置,实现对空间数据集的更新;
S4以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类。
2.根据权利要求1所述的一种音乐数据处理方法,其特征在于,构建每一种情绪标签对应的二分类模型具体采用基于卷积神经网络构建的分类模型。
3.根据权利要求1所述的一种音乐数据处理方法,其特征在于,基于每一种情绪标签对应的二分类模型对目标音乐进行分类,具体包括在特定情绪标签对应的二分类模型之中输入目标音乐对应数据输出目标音乐对应情绪标签的分类概率分布。
4.根据权利要求1所述的一种音乐数据处理方法,其特征在于,提取目标音乐的每一个情绪标签的分类概率分布,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,提取情绪标签的分类概率分布,即包括,提取目标音乐拥有该类情绪的概率。
5.根据权利要求1所述的一种音乐数据处理方法,其特征在于,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,这里的每一个情绪标签,均指,被目标音乐拥有该类情绪的概率大于0.5的情绪标签,对情绪标签的分类概率分布归一化处理,即包括,对目标音乐拥有若干个情绪标签的概率归一化处理,形成多维度分类向量具体指,多维度分类向量的每一个分量均由一个情绪标签的概率归一化获取。
6.根据权利要求1所述的一种音乐数据处理方法,其特征在于,空间数据集包括多个多维度分类向量对应的空间坐标位置,每一个空间坐标位置即对应一个多维度分类向量,空间坐标位置与对应多维度分类向量的数学表征形式一致,空间数据集之中存储的空间坐标定义为标准空间坐标,每一个标准空间坐标拥有一个复合情绪标签。
7.根据权利要求1所述的一种音乐数据处理方法,其特征在于,以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类,具体指,在对目标音乐进行分类之前首先基于每一种情绪标签对应的二分类模型对目标音乐进行分类,然后,提取目标音乐的每一个情绪标签的分类概率分布,对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,并且将该多维度分类向量作为待测向量,然后计算待测向量与空间数据集之中每一个标准空间坐标的距离,确定距离最近的一个标准空间坐标并且提取该距离最近标准空间坐标的复合情绪标签,然后给目标音乐附加该复合情绪标签作为唯一性分类标签对目标音乐进行分类。
8.一种用于执行权利要求1所述方法的音乐数据处理装置,其特征在于,包括神经网络单元、控制单元、循环控制单元;
神经网络单元,用于构建每一种情绪标签对应的二分类模型,基于每一种情绪标签对应的二分类模型对目标音乐进行分类;
控制单元,用于当目标音乐获得多个情绪标签的数量超过第一阈值,则提取目标音乐的每一个情绪标签的分类概率分布,并且对目标音乐的每一个情绪标签的分类概率分布归一化处理形成多维度分类向量,给多维度分类向量分配对应的空间坐标位置并存储多维度分类向量对应的空间坐标位置形成空间数据集;
循环控制单元,用于循环控制,每一次循环之前更换不同的目标音乐,每一次循环均获得对应的多维度分类向量对应的空间坐标位置,实现对空间数据集的更新;
控制单元,还用于以多维度分类向量对应的空间坐标位置作为唯一性分类标签对目标音乐进行分类。
9.一种用于执行权利要求1所述方法的音乐数据处理装置,其特征在于,音乐数据处理装置功能通过程序代码实现,相应程序代码存储在机器可读介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311318000.1A CN117390216B (zh) | 2023-10-12 | 2023-10-12 | 音乐数据处理方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311318000.1A CN117390216B (zh) | 2023-10-12 | 2023-10-12 | 音乐数据处理方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117390216A true CN117390216A (zh) | 2024-01-12 |
CN117390216B CN117390216B (zh) | 2024-06-04 |
Family
ID=89438349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311318000.1A Active CN117390216B (zh) | 2023-10-12 | 2023-10-12 | 音乐数据处理方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117390216B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019144926A1 (zh) * | 2018-01-26 | 2019-08-01 | 上海智臻智能网络科技股份有限公司 | 智能交互方法、装置、计算机设备和计算机可读存储介质 |
CN115866327A (zh) * | 2021-09-22 | 2023-03-28 | 腾讯科技(深圳)有限公司 | 一种背景音乐添加方法和相关装置 |
CN116740691A (zh) * | 2023-05-31 | 2023-09-12 | 清华大学 | 基于图像的情绪识别方法、装置、设备和存储介质 |
-
2023
- 2023-10-12 CN CN202311318000.1A patent/CN117390216B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019144926A1 (zh) * | 2018-01-26 | 2019-08-01 | 上海智臻智能网络科技股份有限公司 | 智能交互方法、装置、计算机设备和计算机可读存储介质 |
CN115866327A (zh) * | 2021-09-22 | 2023-03-28 | 腾讯科技(深圳)有限公司 | 一种背景音乐添加方法和相关装置 |
CN116740691A (zh) * | 2023-05-31 | 2023-09-12 | 清华大学 | 基于图像的情绪识别方法、装置、设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
陈逸灵 等: "PAD三维情感空间中的语音情感识别", 哈尔滨工业大学学报, vol. 50, no. 11, 30 November 2018 (2018-11-30), pages 160 - 166 * |
Also Published As
Publication number | Publication date |
---|---|
CN117390216B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111755078B (zh) | 药物分子属性确定方法、装置及存储介质 | |
CN108804530B (zh) | 对图像的区域加字幕 | |
JP2020135852A (ja) | 画像に基づくデータ処理方法、装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラム | |
CN112183101A (zh) | 文本意图识别方法、装置、电子设备及存储介质 | |
JP7403605B2 (ja) | マルチターゲット画像テキストマッチングモデルのトレーニング方法、画像テキスト検索方法と装置 | |
CN111738001B (zh) | 同义词识别模型的训练方法、同义词确定方法及设备 | |
CN112560985B (zh) | 神经网络的搜索方法、装置及电子设备 | |
US20210166058A1 (en) | Image generation method and computing device | |
CN110795913A (zh) | 一种文本编码方法、装置、存储介质及终端 | |
CN113869352A (zh) | 模型训练方法、服装检索方法及相关装置 | |
CA3153550A1 (en) | Core recommendation method, device and system | |
CN108986151B (zh) | 一种多目标跟踪处理方法及设备 | |
CN117390216B (zh) | 音乐数据处理方法、装置 | |
CN112560480A (zh) | 任务社区发现方法、装置、设备和存储介质 | |
US11481389B2 (en) | Generating an executable code based on a document | |
US20230186613A1 (en) | Sample Classification Method and Apparatus, Electronic Device and Storage Medium | |
US11481419B2 (en) | Method and apparatus for evaluating matching degree based on artificial intelligence, device and storage medium | |
CN112949672A (zh) | 商品识别方法、装置、设备以及计算机可读存储介质 | |
CN114329016B (zh) | 图片标签生成方法和文字配图方法 | |
WO2023273334A1 (zh) | 行为识别方法、装置、电子设备、计算机可读存储介质、计算机程序及计算机程序产品 | |
CN113887422B (zh) | 基于人工智能的表格图片内容提取方法、装置及设备 | |
CN115116080A (zh) | 表格解析方法、装置、电子设备和存储介质 | |
CN115620749A (zh) | 基于人工智能的预训练优化方法、装置、设备及介质 | |
CN113496119B (zh) | 抽取表格中的元组数据的方法、电子设备和计算机可读介质 | |
CN109165097B (zh) | 一种数据处理方法以及数据处理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |