CN111488485A - 基于卷积神经网络的音乐推荐方法、存储介质和电子装置 - Google Patents

基于卷积神经网络的音乐推荐方法、存储介质和电子装置 Download PDF

Info

Publication number
CN111488485A
CN111488485A CN202010302141.4A CN202010302141A CN111488485A CN 111488485 A CN111488485 A CN 111488485A CN 202010302141 A CN202010302141 A CN 202010302141A CN 111488485 A CN111488485 A CN 111488485A
Authority
CN
China
Prior art keywords
songs
category
recommended
convolutional neural
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010302141.4A
Other languages
English (en)
Other versions
CN111488485B (zh
Inventor
沈建荣
周兆鑫
袁阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Thunderstone Technology Co ltd
Original Assignee
Beijing Thunderstone Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Thunderstone Technology Co ltd filed Critical Beijing Thunderstone Technology Co ltd
Priority to CN202010302141.4A priority Critical patent/CN111488485B/zh
Publication of CN111488485A publication Critical patent/CN111488485A/zh
Application granted granted Critical
Publication of CN111488485B publication Critical patent/CN111488485B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • G06F16/636Filtering based on additional data, e.g. user or group profiles by using biological or physiological data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于卷积神经网络的音乐推荐方法、存储介质和电子装置,通过训练好的性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络对用户录音进行特征识别,以获得用户的性别、音色和音调,并基于用户的性别、音色和音调三个参数类别及其权重向用户推荐音乐。本发明基于用户录音的声音特质,而不是用户所录的内容,因此不直接使用录音数据进行音乐推荐,大大减少了后期计算量。同时,通过单独训练三个卷积神经网络识别用户声音的三个参数类别,并根据各类别权重向用户推荐音乐,提高了推荐全面性的同时也提高了推荐准确率。

Description

基于卷积神经网络的音乐推荐方法、存储介质和电子装置
技术领域
本发明涉及机器视觉识别技术,具体涉及一种基于卷积神经网络的音乐推荐方法、存储介质和电子装置。
背景技术
在智能设备上收听音乐已经成为音乐爱好者的日常习惯。当用户使用音乐app点播音乐时,app可以向用户推荐歌曲。现有的音乐推荐方式一般有根据语音特性进行推荐和根据神经网络进行推荐两种。但是这两种方式都存在一定弊端。首先,现有的根据语音特性进行音乐推荐的方式,其语音特性是根据语音和经验公式提取的特定语音特性,没有直接使用整个语音,忽略了声音的其他未知属性;其次,现有的根据神经网络进行推荐的方式,神经网络单一,计算量大。
发明内容
本发明要解决的技术问题是,提供一种基于卷积神经网络的音乐推荐方法、存储介质和电子装置,以解决现有的根据语音特性进行音乐推荐的方式,没有直接使用整个语音,忽略了声音的其他未知属性,以及现有的根据神经网络进行推荐的方式,神经网络单一,计算量大的问题。
本发明是通过如下技术方案实现的:
一种基于卷积神经网络的音乐推荐方法,包括:
步骤1:接收用户的录音;
步骤2:通过训练好的性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络分别对所述用户的录音进行特征识别,以获得所述用户的性别类别、音色类别和音调类别;
步骤3:根据所述用户的性别类别、音色类别和音调类别以及预设的每一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例,从曲库中筛选歌曲;
步骤4:判断筛选出的歌曲数量是否达到所需的推荐歌曲数量,如否,则跳转至步骤5,如是,则跳转至步骤6;
步骤5:根据每一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例,计算出要使筛选出的歌曲数量达到所需的推荐歌曲数量各类别还需筛选出的歌曲数量,并据此从曲库中补充筛选歌曲;
步骤6:将筛选出的所有歌曲推送到用户客户端进行展示。
进一步地,所述音乐推荐方法还包括:
步骤7:统计用户在所述客户端对各类别对应的推荐歌曲的播放次数,并计算每一类别对应的推荐歌曲的播放次数占所有推荐歌曲的总播放次数的比例;
步骤8:将所述步骤3中的比例,以每一类别对应的推荐歌曲的播放次数占所有推荐歌曲的总播放次数的比例与原来根据同一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例的平均值迭代,并返回步骤3。
进一步地,当迭代过程中某一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例趋近于0,则在进行音乐推荐时不再参考该类别因素,并剔除该类别识别对应的卷积神经网络不再使用。
进一步地,所述性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络的训练方法包括:
从数据库中选取用户打分超过设定值的录音作为录音样本;
生成所述录音样本的声波图;
离散密集型地从所述声波图上选择声音点,生成稀疏的声音矩阵模型;
利用所述声音矩阵模型分别进行性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络的训练,直到收敛。
进一步地,所述声音矩阵模型中,在声波曲线上的声音点的值为1,其余位置的声音点的值为0。
进一步地,在生成所述录音样本的声波图之前,还包括:
随机生成噪声脉冲信号,并将所述噪声脉冲信号加入选取的录音中,生成新的录音,并将所述新的录音也作为录音样本。
一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的音乐推荐方法。
一种电子装置,包括存储器、处理器及存储在所述存储器中并可在所述处理器中运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的音乐推荐方法。
本发明提供的基于卷积神经网络的音乐推荐方法、存储介质和电子装置,通过训练好的性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络对用户录音进行特征识别,以获得用户的性别、音色和音调,并基于用户的性别、音色和音调三个参数类别及其权重向用户推荐音乐。本发明基于用户录音的声音特质,而不是用户所录的内容,因此不直接使用录音数据进行音乐推荐,大大减少了后期计算量。同时,通过单独训练三个卷积神经网络识别用户声音的三个参数类别,并根据各类别权重向用户推荐音乐,提高了推荐全面性的同时也提高了推荐准确率。
附图说明
图1为本发明实施例基于卷积神经网络的音乐推荐方法的流程示意图;
图2为音乐推荐方法的流程中各卷积神经网络的训练方法流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步详细说明。
如图1所示,本发明实施例提供的基于卷积神经网络的音乐推荐方法能够应用在手机App等应用程序中,能够根据用户的声音特点为用户推荐音乐。该音乐推荐方法包括如下步骤。
步骤1:接收用户的录音。可以在手机、平板电脑等智能终端中安装用于实现本发明的音乐推荐方法的应用程序,应用程序调用智能终端的Mic采集用户的声音,以完成对用户录音的接收。
步骤2:通过训练好的性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络分别对用户的录音进行特征识别,以获得用户的性别类别、音色类别和音调类别。用户录音特征至少可以反映出用户的性别、音色和音调等特征,用户的性别、音色或音调特征决定了用户适合演唱何种类型的歌曲。因此,可以通过对用户的录音进行这三方面的特征识别,以获得户的性别类别、音色类别和音调类别,进而据此进行歌曲推荐。为此,本发明通过性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络分别对用户的录音进行特征识别,来确定用户的性别、音色和音调类别。通过单独的三个卷积神经网络识别用户声音的三个参数类别,并根据各类别权重向用户推荐音乐,可以提高推荐全面性,同时也提高推荐准确率。
步骤3:根据用户的性别类别、音色类别和音调类别以及预设的每一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例,从曲库中筛选歌曲。性别、音色和音调这三个参数类别在向用户推荐歌曲时的重要性可能不同,即这三个参数类别各自所占权重可能不同,可以先预设这三个类别各自占有一定百分比的权重(三个类别的权重不同),当然也可以简单地预设为三个类别各自占有的权重相同,各占三分之一。后续可以在迭代过程中根据推荐效果不断调整三个参数类别各自所占权重(即前述的比例)。
步骤4:判断筛选出的歌曲数量是否达到所需的推荐歌曲数量,如否,则跳转至步骤5,如是,则跳转至步骤6。
步骤5:根据每一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例,计算出要使筛选出的歌曲数量达到所需的推荐歌曲数量各类别还需筛选出的歌曲数量,并据此从曲库中补充筛选歌曲。从而使筛选出的歌曲数量达到需要推荐的歌曲总数。
步骤6:将筛选出的所有歌曲推送到用户客户端进行展示。如果筛选出的歌曲数量超过需要推荐的歌曲总数,可以只向用户展示需要推荐的数量歌曲。
可在前述方法步骤基础上加入正反馈机制,以不断调整三个卷积神经网络的推荐占比,提高音乐推荐准确性。具体来说该音乐推荐方法还可以包括如下步骤。正反馈机制即体现在如下步骤中。
步骤7:统计用户在客户端对各类别对应的推荐歌曲的播放次数,并计算每一类别对应的推荐歌曲的播放次数占所有推荐歌曲的总播放次数的比例。某类别对应的推荐歌曲的播放次数占所有推荐歌曲的总播放次数的比例越高,说明根据该类别推荐的歌曲的准确性越高,反之越低。
步骤8:将步骤3中的比例,以每一类别对应的推荐歌曲的播放次数占所有推荐歌曲的总播放次数的比例与原来根据同一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例的平均值迭代,并返回步骤3。通过不断迭代,调整各类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例,提高能够获得更高准确率的类别的推荐歌曲占比,能够有效提高最终的推荐准确率。当迭代过程中某一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例趋近于0,说明基于该类别推荐的歌曲对于用户而言准确率趋近于0,没有参考意义,则在进行音乐推荐时不再参考该类别因素,并剔除该类别识别对应的卷积神经网络不再使用。
在本实施例中,如图2所示,音乐推荐方法,性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络的训练方法包括如下步骤。
从数据库中选取用户打分超过设定值的录音作为录音样本;
生成录音样本的声波图;
离散密集型地从声波图上选择声音点,生成稀疏的声音矩阵模型;
利用声音矩阵模型分别进行性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络的训练,直到收敛。
在训练过程中,对于数据库中录音的选取,可以选择用户打分超过80的录音。声音矩阵模型中,在声波曲线上的声音点的值为1,其余位置的声音点的值为0。通过这种方式能够最大程度上保留声波的特性,同时样本矩阵稀疏性和大范围的0值,大大减少了计算的量级,减少了后续卷积神经网络的训练量。同时,可以引入基于残差网络添加更多的网络层数。
在生成录音样本的声波图之前,还包括:
随机生成噪声脉冲信号,并将噪声脉冲信号加入选取的录音中,生成新的录音,并将新的录音也作为录音样本。通过这种方式能够增加录音样本数量,提高了其鲁棒性。
本发明的音乐推荐方法不再基于用户历史和爱好,而是基于用户声音的全部特性借助卷积神经网络,推荐最适合用户的歌曲,不仅大大减少了后期计算量,同时通过单独三个卷积神经网络识别用户声音的三个参数类别,并根据各类别权重向用户推荐音乐,还可以提高推荐全面性,同时也提高推荐准确率。
基于上述音乐推荐方法,本发明实施例还提供了一种计算机存储介质。该计算机存储介质上存储有计算机程序,计算机程序被处理器执行时,实现如上的音乐推荐方法。
基于上述音乐推荐方法,本发明实施例还提供了一种电子装置。该电子装置包括存储器、处理器及存储在存储器中并可在处理器中运行的计算机程序,处理器执行计算机程序时,实现如上的音乐推荐方法。
上述实施例仅为优选实施例,并不用以限制本发明的保护范围。在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于卷积神经网络的音乐推荐方法,其特征在于,包括:
步骤1:接收用户的录音;
步骤2:通过训练好的性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络分别对所述用户的录音进行特征识别,以获得所述用户的性别类别、音色类别和音调类别;
步骤3:根据所述用户的性别类别、音色类别和音调类别以及预设的每一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例,从曲库中筛选歌曲;
步骤4:判断筛选出的歌曲数量是否达到所需的推荐歌曲数量,如否,则跳转至步骤5,如是,则跳转至步骤6;
步骤5:根据每一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例,计算出要使筛选出的歌曲数量达到所需的推荐歌曲数量各类别还需筛选出的歌曲数量,并据此从曲库中补充筛选歌曲;
步骤6:将筛选出的所有歌曲推送到用户客户端进行展示。
2.如权利要求1所述的音乐推荐方法,其特征在于,还包括:
步骤7:统计用户在所述客户端对各类别对应的推荐歌曲的播放次数,并计算每一类别对应的推荐歌曲的播放次数占所有推荐歌曲的总播放次数的比例;
步骤8:将所述步骤3中的比例,以每一类别对应的推荐歌曲的播放次数占所有推荐歌曲的总播放次数的比例与原来根据同一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例的平均值迭代,并返回步骤3。
3.如权利要求2所述的音乐推荐方法,其特征在于,当迭代过程中某一类别需要推荐的歌曲数量所占需要推荐的歌曲总数的比例趋近于0,则在进行音乐推荐时不再参考该类别因素,并剔除该类别识别对应的卷积神经网络不再使用。
4.如权利要求1所述的音乐推荐方法,其特征在于,所述性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络的训练方法包括:
从数据库中选取用户打分超过设定值的录音作为录音样本;
生成所述录音样本的声波图;
离散密集型地从所述声波图上选择声音点,生成稀疏的声音矩阵模型;
利用所述声音矩阵模型分别进行性别识别卷积神经网络、音色识别卷积神经网络和音调识别卷积神经网络的训练,直到收敛。
5.如权利要求4所述的音乐推荐方法,其特征在于,所述声音矩阵模型中,在声波曲线上的声音点的值为1,其余位置的声音点的值为0。
6.如权利要求4所述的音乐推荐方法,其特征在于,在生成所述录音样本的声波图之前,还包括:
随机生成噪声脉冲信号,并将所述噪声脉冲信号加入选取的录音中,生成新的录音,并将所述新的录音也作为录音样本。
7.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至6中任一所述的音乐推荐方法。
8.一种电子装置,其特征在于,包括存储器、处理器及存储在所述存储器中并可在所述处理器中运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至6中任一所述的音乐推荐方法。
CN202010302141.4A 2020-04-16 2020-04-16 基于卷积神经网络的音乐推荐方法、存储介质和电子装置 Active CN111488485B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010302141.4A CN111488485B (zh) 2020-04-16 2020-04-16 基于卷积神经网络的音乐推荐方法、存储介质和电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010302141.4A CN111488485B (zh) 2020-04-16 2020-04-16 基于卷积神经网络的音乐推荐方法、存储介质和电子装置

Publications (2)

Publication Number Publication Date
CN111488485A true CN111488485A (zh) 2020-08-04
CN111488485B CN111488485B (zh) 2023-11-17

Family

ID=71795113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010302141.4A Active CN111488485B (zh) 2020-04-16 2020-04-16 基于卷积神经网络的音乐推荐方法、存储介质和电子装置

Country Status (1)

Country Link
CN (1) CN111488485B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115312074A (zh) * 2022-10-10 2022-11-08 江苏米笛声学科技有限公司 一种基于音频处理的云端服务器

Citations (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030045953A1 (en) * 2001-08-21 2003-03-06 Microsoft Corporation System and methods for providing automatic classification of media entities according to sonic properties
JP2011033879A (ja) * 2009-08-03 2011-02-17 Tze Fen Li サンプルを用いずあらゆる言語を識別可能な識別方法
CN104731954A (zh) * 2015-04-01 2015-06-24 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与系统
CN105679317A (zh) * 2014-12-08 2016-06-15 三星电子株式会社 用于训练语言模型并识别语音的方法和设备
CN106991163A (zh) * 2017-03-31 2017-07-28 福州大学 一种基于演唱者声音特质的歌曲推荐方法
CN106997765A (zh) * 2017-03-31 2017-08-01 福州大学 人声音色的定量表征方法
CN108417228A (zh) * 2018-02-02 2018-08-17 福州大学 乐器音色迁移下的人声音色相似性度量方法
CN108509534A (zh) * 2018-03-15 2018-09-07 华南理工大学 基于深度学习的个性化音乐推荐系统及其实现方法
US20180276540A1 (en) * 2017-03-22 2018-09-27 NextEv USA, Inc. Modeling of the latent embedding of music using deep neural network
CN108595550A (zh) * 2018-04-10 2018-09-28 南京邮电大学 一种基于卷积神经网络的音乐推荐系统及推荐方法
CN108717699A (zh) * 2018-05-15 2018-10-30 广东温氏食品集团股份有限公司 一种基于连续最小割的超声波图像分割方法
CN109074822A (zh) * 2017-10-24 2018-12-21 深圳和而泰智能控制股份有限公司 特定声音识别方法、设备和存储介质
CN109271550A (zh) * 2018-07-27 2019-01-25 华南理工大学 一种基于深度学习的音乐个性化分类推荐方法
US20190042647A1 (en) * 2014-12-31 2019-02-07 Pcms Holdings, Inc. Systems and methods for creation of a listening log and music library
CN109582822A (zh) * 2018-10-19 2019-04-05 百度在线网络技术(北京)有限公司 一种基于用户语音的音乐推荐方法及装置
CN109726310A (zh) * 2018-11-15 2019-05-07 量子云未来(北京)信息科技有限公司 一种推荐音乐曲目的确定方法、装置和存储介质
CN109785859A (zh) * 2019-01-31 2019-05-21 平安科技(深圳)有限公司 基于语音分析的管理音乐的方法、装置和计算机设备
CN109949783A (zh) * 2019-01-18 2019-06-28 苏州思必驰信息科技有限公司 歌曲合成方法及系统
CN110070859A (zh) * 2018-01-23 2019-07-30 阿里巴巴集团控股有限公司 一种语音识别方法及装置
US20190236207A1 (en) * 2018-02-01 2019-08-01 Nano Shield Technology Co., Ltd. Music sharing method and system
CN110096611A (zh) * 2019-04-24 2019-08-06 努比亚技术有限公司 一种歌曲推荐方法、移动终端及计算机可读存储介质
CN110111773A (zh) * 2019-04-01 2019-08-09 华南理工大学 基于卷积神经网络的音乐信号多乐器识别方法
CN110175245A (zh) * 2019-06-05 2019-08-27 腾讯科技(深圳)有限公司 多媒体推荐方法、装置、设备及存储介质
CN110209869A (zh) * 2018-08-13 2019-09-06 腾讯科技(深圳)有限公司 一种音频文件推荐方法、装置和存储介质
CN110491407A (zh) * 2019-08-15 2019-11-22 广州华多网络科技有限公司 语音降噪的方法、装置、电子设备及存储介质
CN110516104A (zh) * 2019-08-27 2019-11-29 腾讯音乐娱乐科技(深圳)有限公司 歌曲推荐方法、装置及计算机存储介质
CN110647651A (zh) * 2019-09-19 2020-01-03 曹玲 基于卷积神经网络的表情识别音乐推荐系统
WO2020024556A1 (zh) * 2018-08-02 2020-02-06 平安科技(深圳)有限公司 音乐质量评价方法、装置、计算机设备及存储介质
CN110839173A (zh) * 2019-11-18 2020-02-25 上海极链网络科技有限公司 一种音乐匹配方法、装置、终端及存储介质
CN110853618A (zh) * 2019-11-19 2020-02-28 腾讯科技(深圳)有限公司 一种语种识别的方法、模型训练的方法、装置及设备
KR102093233B1 (ko) * 2018-09-27 2020-03-26 동국대학교 산학협력단 신경망 기반의 음악 자동 생성 장치 및 그 방법
CA3067776A1 (en) * 2018-09-28 2020-03-28 Sonos, Inc. Systems and methods for selective wake word detection using neural network models

Patent Citations (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030045953A1 (en) * 2001-08-21 2003-03-06 Microsoft Corporation System and methods for providing automatic classification of media entities according to sonic properties
JP2011033879A (ja) * 2009-08-03 2011-02-17 Tze Fen Li サンプルを用いずあらゆる言語を識別可能な識別方法
CN105679317A (zh) * 2014-12-08 2016-06-15 三星电子株式会社 用于训练语言模型并识别语音的方法和设备
US20190042647A1 (en) * 2014-12-31 2019-02-07 Pcms Holdings, Inc. Systems and methods for creation of a listening log and music library
CN104731954A (zh) * 2015-04-01 2015-06-24 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与系统
US20180276540A1 (en) * 2017-03-22 2018-09-27 NextEv USA, Inc. Modeling of the latent embedding of music using deep neural network
CN106991163A (zh) * 2017-03-31 2017-07-28 福州大学 一种基于演唱者声音特质的歌曲推荐方法
CN106997765A (zh) * 2017-03-31 2017-08-01 福州大学 人声音色的定量表征方法
CN109074822A (zh) * 2017-10-24 2018-12-21 深圳和而泰智能控制股份有限公司 特定声音识别方法、设备和存储介质
CN110070859A (zh) * 2018-01-23 2019-07-30 阿里巴巴集团控股有限公司 一种语音识别方法及装置
US20190236207A1 (en) * 2018-02-01 2019-08-01 Nano Shield Technology Co., Ltd. Music sharing method and system
CN108417228A (zh) * 2018-02-02 2018-08-17 福州大学 乐器音色迁移下的人声音色相似性度量方法
CN108509534A (zh) * 2018-03-15 2018-09-07 华南理工大学 基于深度学习的个性化音乐推荐系统及其实现方法
CN108595550A (zh) * 2018-04-10 2018-09-28 南京邮电大学 一种基于卷积神经网络的音乐推荐系统及推荐方法
CN108717699A (zh) * 2018-05-15 2018-10-30 广东温氏食品集团股份有限公司 一种基于连续最小割的超声波图像分割方法
CN109271550A (zh) * 2018-07-27 2019-01-25 华南理工大学 一种基于深度学习的音乐个性化分类推荐方法
WO2020024556A1 (zh) * 2018-08-02 2020-02-06 平安科技(深圳)有限公司 音乐质量评价方法、装置、计算机设备及存储介质
CN110209869A (zh) * 2018-08-13 2019-09-06 腾讯科技(深圳)有限公司 一种音频文件推荐方法、装置和存储介质
KR102093233B1 (ko) * 2018-09-27 2020-03-26 동국대학교 산학협력단 신경망 기반의 음악 자동 생성 장치 및 그 방법
CA3067776A1 (en) * 2018-09-28 2020-03-28 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
CN109582822A (zh) * 2018-10-19 2019-04-05 百度在线网络技术(北京)有限公司 一种基于用户语音的音乐推荐方法及装置
CN109726310A (zh) * 2018-11-15 2019-05-07 量子云未来(北京)信息科技有限公司 一种推荐音乐曲目的确定方法、装置和存储介质
CN109949783A (zh) * 2019-01-18 2019-06-28 苏州思必驰信息科技有限公司 歌曲合成方法及系统
CN109785859A (zh) * 2019-01-31 2019-05-21 平安科技(深圳)有限公司 基于语音分析的管理音乐的方法、装置和计算机设备
CN110111773A (zh) * 2019-04-01 2019-08-09 华南理工大学 基于卷积神经网络的音乐信号多乐器识别方法
CN110096611A (zh) * 2019-04-24 2019-08-06 努比亚技术有限公司 一种歌曲推荐方法、移动终端及计算机可读存储介质
CN110175245A (zh) * 2019-06-05 2019-08-27 腾讯科技(深圳)有限公司 多媒体推荐方法、装置、设备及存储介质
CN110491407A (zh) * 2019-08-15 2019-11-22 广州华多网络科技有限公司 语音降噪的方法、装置、电子设备及存储介质
CN110516104A (zh) * 2019-08-27 2019-11-29 腾讯音乐娱乐科技(深圳)有限公司 歌曲推荐方法、装置及计算机存储介质
CN110647651A (zh) * 2019-09-19 2020-01-03 曹玲 基于卷积神经网络的表情识别音乐推荐系统
CN110839173A (zh) * 2019-11-18 2020-02-25 上海极链网络科技有限公司 一种音乐匹配方法、装置、终端及存储介质
CN110853618A (zh) * 2019-11-19 2020-02-28 腾讯科技(深圳)有限公司 一种语种识别的方法、模型训练的方法、装置及设备

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
SHUN-HAO CHANG等: "A personalized music recommendation system using convolutional neural networks approach", 《2018 IEEE INTERNATIONAL CONFERENCE ON APPLIED SYSTEM INVENTION(ICASI)》 *
李增: "基于听觉特性卷积神经网络的音乐分类方法研究", 《中国 优秀硕士学位论文全文数据库 信息科技辑》, no. 01 *
李晓霜: "基于声音特征和卷积神经网络的琵琶板材分级研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 01 *
石从红;: "混响环境下语音信号优化识别仿真研究", 计算机仿真, no. 02 *
贾宁,郑纯军: "基于注意力LSTM的音乐主题推荐模型", 《计算机科学》, no. 2 *
陆欢;: "基于卷积神经网络的音乐流派分类", no. 21 *
陈雅茜;: "音乐推荐系统及相关技术研究", no. 18 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115312074A (zh) * 2022-10-10 2022-11-08 江苏米笛声学科技有限公司 一种基于音频处理的云端服务器

Also Published As

Publication number Publication date
CN111488485B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN109147807B (zh) 一种基于深度学习的音域平衡方法、装置及系统
JP6101196B2 (ja) 音声識別方法および装置
CN110265040A (zh) 声纹模型的训练方法、装置、存储介质及电子设备
JP2014142627A (ja) 音声識別方法および装置
CN106250400A (zh) 一种音频数据处理方法、装置以及系统
CN111785288B (zh) 语音增强方法、装置、设备及存储介质
CN108322317A (zh) 一种账号识别关联方法及服务器
WO2019233361A1 (zh) 对音乐进行音量调节的方法及设备
CN114242044A (zh) 语音质量评估方法、语音质量评估模型训练方法及装置
CN111488485B (zh) 基于卷积神经网络的音乐推荐方法、存储介质和电子装置
CN112735466B (zh) 一种音频检测方法及装置
CN113344647B (zh) 一种信息推荐的方法及装置
CN110458599A (zh) 测试方法、测试装置及相关产品
CN113793600B (zh) 语音识别方法、装置、设备及存储介质
CN111477248B (zh) 一种音频噪声检测方法及装置
CN114678038A (zh) 音频噪声检测方法、计算机设备和计算机程序产品
CN113113048A (zh) 语音情绪识别方法、装置、计算机设备及介质
CN113297398A (zh) 一种用户召回方法、装置、计算机设备和存储介质
CN109119089B (zh) 对音乐进行通透处理的方法及设备
CN103493126A (zh) 音频数据分析系统和方法
CN112201277B (zh) 语音应答的方法、装置、及设备及计算机可读存储介质
CN111488484B (zh) 基于类指数分布和tf-idf特征的歌曲推荐方法、介质和装置
CN116708670A (zh) 用户服务方法、装置、设备、存储介质和程序产品
CN114400022B (zh) 音质比对的方法、设备和存储介质
CN107330025A (zh) 一种推荐歌曲的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant