CN110889008B - 一种音乐推荐方法、装置、计算装置和存储介质 - Google Patents

一种音乐推荐方法、装置、计算装置和存储介质 Download PDF

Info

Publication number
CN110889008B
CN110889008B CN201811051761.4A CN201811051761A CN110889008B CN 110889008 B CN110889008 B CN 110889008B CN 201811051761 A CN201811051761 A CN 201811051761A CN 110889008 B CN110889008 B CN 110889008B
Authority
CN
China
Prior art keywords
user
voice
mood
sound
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811051761.4A
Other languages
English (en)
Other versions
CN110889008A (zh
Inventor
廖海霖
张新
毛跃辉
廖湖锋
王慧君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201811051761.4A priority Critical patent/CN110889008B/zh
Priority to PCT/CN2018/121507 priority patent/WO2020052135A1/zh
Publication of CN110889008A publication Critical patent/CN110889008A/zh
Application granted granted Critical
Publication of CN110889008B publication Critical patent/CN110889008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Child & Adolescent Psychology (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Psychiatry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种音乐推荐方法、装置、计算装置和存储介质,涉及人工智能技术领域,用以解决现有技术中使用复杂的操作完成音乐推荐并耗费时间长的问题。本申请中,通过在大数据下自学习的方法,用户向移动终端发出声音,可以得到当前用户的心情,根据用户的心情,得到适合用户心情类型的音乐。

Description

一种音乐推荐方法、装置、计算装置和存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种音乐推荐方法、装置、计算装置和存储介质。
背景技术
现在智能终端行业发展迅速,各种智能终端越来越智能化。当前的移动终端大都具有音乐播放功能,而且使用率很高。如何能够根据用户的心情来判断播放音乐的类型变得越来越重要。
现有技术中,大部分都是通过用户的心跳、脉搏、呼吸、心率等参数来为用户推荐音乐。而在实际情况中,如果只使用移动终端很难获取到这些参数,必须采用外部的设备,例如采用智能手表测量用户的脉搏,所以,该方法实用性低。此外,对于智能终端来说,还需要额外的应用来获取相应的参数。以测量心率为例,首先需要打开测量心率的应用,然后按照应用的指示将手指放置到测量心率的相应位置并保持一段时间才能得到测量结果,所以,现有技术的方案还存在操作复杂,时间长等的问题。
发明内容
本申请实施例提供一种音乐推荐的方法、装置、计算装置和存储介质,可以通过语音输入判断用户的情绪,并根据用户的情绪推荐合适的音乐,在更短的时间内找到适合用户心情的音乐,同时操作简单,只需向移动终端发出语音即可得到结果。
第一方面,本申请实施例提供一种音乐推荐的方法,所述方法包括:
获取用户的声音;
根据所述用户的声音得到心情关键词;其中,所述心情关键词用于表示用户当前心情;
为该用户推荐与所述心情关键词对应类型的音乐。
第二方面,本申请还提供一种音乐推荐装置,所述装置包括:
获取模块,用于获取用户的声音;
训练分析模块,用于根据所述用户的声音得到心情关键词;其中,所述心情关键词用于表示用户当前心情;
推荐模块,用于为该用户推荐与所述心情关键词对应类型的音乐。
第三方面,本申请另一实施例还提供了一种计算装置,包括至少一个处理器;以及;
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的一种音乐推荐的方法。
第四方面,本申请另一实施例还提供了一种移动终端存储介质,其中,所述移动终端存储介质存储有移动终端可执行指令,所述移动终端可执行指令用于使移动终端执行本申请实施例中的一种音乐推荐的方法。
本申请实施例提供的音乐推荐方法、装置、计算装置和存储介质,本申请中,通过在大数据下自学习的方法,用户向移动终端发出声音,可以得到当前用户的心情,根据用户的心情,得到适合用户心情类型的音乐。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中音乐推荐方法的流程示意图;
图2为本申请实施例中音乐推荐结构示意图;
图3为根据本申请实施方式的计算装置的结构示意图。
具体实施方式
为了可以根据用户心情判断播放音乐类型的操作更简单、更迅速,本申请实施例中提供一种音乐推荐方法及装置。为了更好的理解本申请实施例提供的技术方案,这里对该方案的基本原理做一下简单说明:
为实现通过简单的方式来为用户准确的推荐音乐,发明人经过研究提出了本申请实施例的技术方案。具体的,由于语音功能是每个移动终端都具有的基本功能,所以,可以根据每个人的语音来推荐音乐。进一步的,每个人的声音是不同的,每个人在不同心境下需要收听的音乐也是不同的。所以本申请的发明人提出了根据用户的语音来确定用户的情绪的方案,根据用户的情绪来进一步推荐音乐。这样,推荐的音乐是满足用户当前心境下的需求的,所以能够达到通过简单的语音方式为用户准确的推荐音乐。
具体的,该方案中首先采集不同用户的声音,采集的声音可以是按照要求输入的(例如模拟不同情绪下的声音输入),也可以不需要用户去刻意的向移动终端输入,而是用户日常向移动终端发出的声音。然后,提取这些声音的声音,通过在大数据下自学习,得到不同情绪下的声音特征。
当移动终端接收到用户发出的声音时,会提取声音的特征,进而得到该声音对应的情绪,然后根据情绪推荐音乐。
进一步的,本申请实施例中,在接收到用户发出的声音之后,可以先对此声音进行语义解析,判断该条语音是否含有唤醒词,并且判断该语音所含内容。若含有唤醒词,则对该语音进行特征提取,得到声音特征值。
下面结合参照附图对本申请实施例提供的一种音乐推荐的方法作进一步说明。图1为音乐推荐方法的流程示意图,包括以下步骤:
步骤101:获取用户的声音。
步骤102:根据所述用户的声音得到心情关键词;其中,所述心情关键词用于表示用户当前心情。
步骤103:为该用户推荐与所述心情关键词对应类型的音乐。
在本申请实施例中,为了能够准确的识别不同声音对应的情绪,在步骤101之前,可以通过在大数据下自学习的方法找到声音与关键词之间的对应关系,具体可包括以下步骤:
步骤A1:采集多个用户发出的声音。
其中,采集的声音并不需要用户去刻意的向移动终端录入,而是用户日常向移动终端发出的声音,如:打电话语音、第三方应用的通话语音及通过即时通信工具的语音交互功能发出的语音消息等。
当然,如前所述,也可以邀请用户输入不同情绪下的声音以供学习。
步骤A2:针对采集的每个声音提取其声纹并将声纹作为该声音的样本。
其中,声纹包括音色、音调和响度,通过音色可以识别用户身份,并且根据音调和响度的不同,判断该用户的心情。即,具体学习时,可以针对不同用户得到不同情绪下的声音特征以学习其不同情绪下的声音。
步骤A3:通过在大数据下自学习的方法,采用该样本对声音情绪模型进行训练,使得所述声音情绪模型可以通过用户的声音得到与该声音对应的心情关键词。
进一步的,有了通过大数据学习得到的声音情绪模型之后,前述的根据所述用户的声音得到心情关键词,可具体实施为:采用所述声音情绪模型对所述用户的声音进行分析,得到心情关键词。
这样,通过在大数据下自学习的方法,可以将提取到的声纹通过声音情绪模型得到与声纹对应的心情关键词。通过在大数据下自学习,可以使获得的心情关键词更加符合用户的心情,也即建立的声音情绪模型能够准确的识别出不同用户的情绪,进而,推荐的音乐也就更符合用户当前的心情。
进一步的,为了从声音中提取出声纹可以先将获得的语音信号转化成声谱图,并从声谱图中提取出声纹,并对声纹做进一步提取,得到声音特征值,具体包括以下步骤:
步骤B1:将采集到的声音信号转换成声谱图和频谱图。
步骤B2:从声谱图和频谱图中提取声纹。
步骤B3:基于梅尔频率倒谱系数,从提取的声纹中得到声音特征值,并将声音特征值作为该声音的样本。
其中,通过梅尔频率倒谱系数提取声音特征值,大致包括以下步骤:
获取语音—>预加重、分帧和加窗—>FFT(Fast Fourier transform,快速傅里叶变换)—>取绝对值或平方值—>Mel滤波(梅尔滤波)—>取对数—>DCT(Discrete consinetransform,离散余弦变换)—>动态特征(Delta MFCC,梅尔频率倒谱系数)—>输出声音特征值。
这样,通过提取声音特征值,可以进一步得到声纹的具体数据,也即可以进一步得到准确的心情关键词。
进一步的,声音情绪模型负责根据声音特征值找到对应的心情特征值,具体实施时训练好的声音情绪模型可以通过key值-value值表的形式来体现;其中,该key值表示声音特征值,value值表示该声音特征值对应的心情关键词;根据所述用户的声音得到心情关键词,有key值-value值表之后,可以通过以下步骤得到用户的心情关键词:
步骤C1:将采集到的声音信号转换成声谱图和频谱图。
步骤C2:从声谱图和频谱图中提取声纹。
步骤C3:基于梅尔频率倒谱系数,从提取的声纹中得到声音特征值。
步骤C4:根据key值-value值表,得到所述声音特征值对应的心情关键词。
其中,具体实施时,key值-value值表如表1所示,需要说明的是,该表1只是为了说明key值与value值的大致对应关系,关于key值与value值的具体对应关系,还需要通过采集数据进行更正。
表1 key值-value值表
key value
0~10 高兴
10~30 愉悦
30~50 悲伤
50~60 正常
。。。 。。。
这样,通过key值-value值表,可以将声音特征值与心情关键词大致对应起来,通过简单的查表方式,即可确定心情关键词。
进一步的,在本申请实施例中,在步骤101之后,可以对获取的声音进行解释,进一步根据解释的内容作为搜索音乐类型的条件,具体可实施为:
对所述用户的声音进行语义解析;根据语义解析结果,确定所述用户请求的音乐的检索范围。
在检索范围的基础上,在为该用户推荐与所述心情关键词对应类型的音乐时可实施为:在用户请求的音乐的检索范围内,为该用户推荐与所述心情关键词对应类型的音乐。
其中,上述语义解析为对该声音进行解释,了解这句话的意思。例如:“放一首张学友的歌”,即这句话表明想听张学友的歌曲。因此用户请求的音乐的检索范围就变成了歌手是张学友,就需要在张学友的歌曲中进行检索。
上述根据音乐的检索范围与心情关键词,找到合适的音乐。例如:“放一首张学友的歌”,根据语音对应的心情关键词,若确定用户说这句话的时候是高兴的,就会检索张学友的欢快的歌曲。这样,根据音乐的检索范围与心情关键词,可以为用户提供准确想要的音乐类型。
进一步的,根据获取到的心情关键词得到推荐的歌曲,需要先找到符合心情关键词的音乐标签,并根据音乐标签搜索合适的音乐,具体可实施为:
根据心情关键词与音乐标签的预设对应关系,得到适合所述用户的心情关键词的音乐标签;
在用户请求的音乐的检索范围内,根据得到的音乐标签,为该用户推荐音乐。
其中,心情关键词与音乐标签的预设对应关系如:心情关键词为“高兴”,对应的音乐标签可以是“欢快的”,然后根据互联网搜索“欢快的”类型的音乐,并推荐给用户。
这样,通过心情关键词与音乐标签的预设对应关系,可以根据心情关键词找到合适的音乐标签,为用户推荐更准确的音乐。
进一步的,在本申请实施例中,若一直获取用户的声音并进行后续的处理,会不断消耗终端的处理资源和电量。有鉴于此,本申请实施例中,在步骤101之后,需要对获取的声音进行搜索,搜索到含有唤醒词的语句,执行根据该声音得到心情关键词的操作,具体可实施为:
对所述用户的声音进行语义解析;
若根据语义解析结果,确定该声音中含有唤醒词,则执行根据所述用户的声音得到心情关键词的操作。
其中,上述语义解析为对该声音进行检索,查找该声音中是否含有唤醒词,如果含有唤醒词,即执行根据该声音得到心情关键词的操作。唤醒词可以是拟声词“嘿”、“哈”,也可以是“歌曲”。当然,具体实施时,用于也可以通过设置自定义自己的唤醒词。
这样,通过唤醒词进入到根据声音推荐音乐的操作,可以减少误触发的几率。此外,有唤醒词才进行后续的处理,能够达到节约处理资源和电量的目的。
基于相同的发明构思,本申请实施例还提供一种音乐推荐装置,如图2所示,为该装置的结构示意图,包括:
获取模块201,用于获取用户的声音;
训练分析模块202,用于根据所述用户的声音得到心情关键词;其中,所述心情关键词用于表示用户当前心情;
推荐模块203,用于为该用户推荐与所述心情关键词对应类型的音乐。
进一步的,该装置还包括:
采集模块,用于采集多个用户发出的声音;
声纹提取模块,用于针对采集的每个声音提取其声纹并将声纹作为该声音的样本;
训练模块,用于通过在大数据下自学习的方法,采用该样本对声音情绪模型进行训练,使得所述声音情绪模型可以通过用户的声音得到与该声音对应的心情关键词;
训练分析模块202,具体用于采用所述声音情绪模型对所述用户的声音进行分析,得到心情关键词。
进一步的,声纹提取模块,具体包括:
第一转换单元,用于将采集到的声音信号转换成声谱图和频谱图;
第一声纹提取单元,用于从声谱图和频谱图中提取声纹;
第一声音特征值提取单元,用于基于梅尔频率倒谱系数,从提取的声纹中得到声音特征值,并将声音特征值作为该声音的样本。
进一步的,训练好的声音情绪模型包括key值-value值表;其中,该key值表示声音特征值,value值表示该声音特征值对应的心情关键词;
训练分析模块202,具体包括:
第二转换单元,用于将采集到的声音信号转换成声谱图和频谱图;
第二声纹提取单元,用于从声谱图和频谱图中提取声纹;
第二声音特征值提取单元,用于基于梅尔频率倒谱系数,从提取的声纹中得到声音特征值。
查找单元,用于根据key值-value值表,得到所述声音特征值对应的心情关键词。
进一步的,该装置还包括:
第一语义解析模块,用于对所述用户的声音进行语义解析;
确定范围模块,用于根据语义解析结果,确定所述用户请求的音乐的检索范围;
推荐模块203,具体包括:
推荐单元,用于在用户请求的音乐的检索范围内,为该用户推荐与所述心情关键词对应类型的音乐。
进一步的,推荐单元,具体包括:
音乐标签对应子单元,用于根据心情关键词与音乐标签的预设对应关系,得到适合所述用户的心情关键词的音乐标签;
确定推荐子单元,用于在用户请求的音乐的检索范围内,根据得到的音乐标签,为该用户推荐音乐。
进一步的,该装置还包括:
第二语义解析模块,用于对所述用户的声音进行语义解析;
搜索模块,用于若根据语义解析结果,确定该声音中含有唤醒词,则执行根据所述用户的声音得到心情关键词的操作。
在介绍了本申请示例性实施方式的音乐推荐的方法及装置之后,接下来,介绍根据本申请的另一示例性实施方式的计算装置。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本申请的实施例,计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的音乐推荐方法中的步骤101-103。
下面参照图3来描述根据本申请的这种实施方式的计算装置30。图3显示的计算装置30仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。该计算装置例如可以是手机、平板电脑等。
如图3所示,计算装置30以通用计算装置的形式表现。计算装置30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器32可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置30也可以与一个或多个外部设备34(例如指向设备等)通信,还可与一个或者多个使得用户能与计算装置30交互的设备通信,和/或与使得该计算装置30能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,计算装置30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与用于计算装置30的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的音乐推荐方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的音乐推荐的方法中的步骤,执行如图1中所示的步骤101-103。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请实施方式的音乐推荐方法可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (6)

1.一种音乐推荐的方法,其特征在于,所述方法包括:
获取用户的声音;
根据所述用户的声音得到心情关键词;其中,所述心情关键词用于表示用户当前心情;
为该用户推荐与所述心情关键词对应类型的音乐;
所述获取用户的声音之前,所述方法还包括:
采集多个用户发出的声音;
针对采集的每个声音提取其声纹并将声纹作为该声音的样本;
通过在大数据下自学习的方法,采用该样本对声音情绪模型进行训练,使得所述声音情绪模型可以通过用户的声音得到与该声音对应的心情关键词;
根据所述用户的声音得到心情关键词,具体包括:
采用所述声音情绪模型对所述用户的声音进行分析,得到心情关键词;
所述针对采集的每个声音提取其声纹并将声纹作为该声音的样本,具体包括:
将采集到的声音信号转换成声谱图和频谱图;
从声谱图和频谱图中提取声纹;
基于梅尔频率倒谱系数,从提取的声纹中得到声音特征值,并将声音特征值作为该声音的样本;
所述获取用户的声音之后,所述方法还包括:
对所述用户的声音进行语义解析;
根据语义解析结果,确定所述用户请求的音乐的检索范围;
为该用户推荐与所述心情关键词对应类型的音乐,具体包括:
在用户请求的音乐的检索范围内,为该用户推荐与所述心情关键词对应类型的音乐;
获取用户的声音之后,所述方法还包括:
对所述用户的声音进行语义解析;
若根据语义解析结果,确定该声音中含有唤醒词,则执行根据所述用户的声音得到心情关键词的操作。
2.如权利要求1所述的方法,其特征在于,训练好的声音情绪模型包括key值-value值表;其中,该key值表示声音特征值,value值表示该声音特征值对应的心情关键词;
根据所述用户的声音得到心情关键词,具体包括:
将采集到的声音信号转换成声谱图和频谱图;
从声谱图和频谱图中提取声纹;
基于梅尔频率倒谱系数,从提取的声纹中得到声音特征值
根据key值-value值表,得到所述声音特征值对应的心情关键词。
3.如权利要求1所述的方法,其特征在于,所述在用户请求的音乐的检索范围内,为该用户推荐与所述心情关键词对应类型的音乐,具体包括:
根据心情关键词与音乐标签的预设对应关系,得到适合所述用户的心情关键词的音乐标签;
在用户请求的音乐的检索范围内,根据得到的音乐标签,为该用户推荐音乐。
4.一种音乐推荐装置,其特征在于,所述装置包括:
获取模块,用于获取用户的声音;
训练分析模块,用于根据所述用户的声音得到心情关键词;其中,所述心情关键词用于表示用户当前心情;
推荐模块,用于为该用户推荐与所述心情关键词对应类型的音乐;
所述获取模块,在所述获取用户的声音之前,还用于采集多个用户发出的声音;
针对采集的每个声音提取其声纹并将声纹作为该声音的样本;
通过在大数据下自学习的方法,采用该样本对声音情绪模型进行训练,使得所述声音情绪模型可以通过用户的声音得到与该声音对应的心情关键词;
所述训练分析模块,还用于采用所述声音情绪模型对所述用户的声音进行分析,得到心情关键词;
所述获取模块,在所述针对采集的每个声音提取其声纹并将声纹作为该声音的样本时,具体用于:
将采集到的声音信号转换成声谱图和频谱图;
从声谱图和频谱图中提取声纹;
基于梅尔频率倒谱系数,从提取的声纹中得到声音特征值,并将声音特征值作为该声音的样本;
所述获取模块,在所述获取用户的声音之后,还用于:
对所述用户的声音进行语义解析;
根据语义解析结果,确定所述用户请求的音乐的检索范围;
为该用户推荐与所述心情关键词对应类型的音乐,具体包括:
在用户请求的音乐的检索范围内,为该用户推荐与所述心情关键词对应类型的音乐;
所述获取模块,在获取用户的声音之后,还用于:
对所述用户的声音进行语义解析;
若根据语义解析结果,确定该声音中含有唤醒词,则执行根据所述用户的声音得到心情关键词的操作。
5.一种音乐推荐可读介质,存储有移动终端可执行指令,其特征在于,所述移动终端可执行指令用于执行如权利要求1-3中任一权利要求所述的方法。
6.一种计算装置,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-3中任一权利要求所述的方法。
CN201811051761.4A 2018-09-10 2018-09-10 一种音乐推荐方法、装置、计算装置和存储介质 Active CN110889008B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811051761.4A CN110889008B (zh) 2018-09-10 2018-09-10 一种音乐推荐方法、装置、计算装置和存储介质
PCT/CN2018/121507 WO2020052135A1 (zh) 2018-09-10 2018-12-17 音乐推荐的方法、装置、计算装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811051761.4A CN110889008B (zh) 2018-09-10 2018-09-10 一种音乐推荐方法、装置、计算装置和存储介质

Publications (2)

Publication Number Publication Date
CN110889008A CN110889008A (zh) 2020-03-17
CN110889008B true CN110889008B (zh) 2021-11-09

Family

ID=69745082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811051761.4A Active CN110889008B (zh) 2018-09-10 2018-09-10 一种音乐推荐方法、装置、计算装置和存储介质

Country Status (2)

Country Link
CN (1) CN110889008B (zh)
WO (1) WO2020052135A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737414A (zh) * 2020-06-04 2020-10-02 腾讯音乐娱乐科技(深圳)有限公司 一种歌曲推荐方法及装置、服务器、存储介质
CN113643700B (zh) * 2021-07-27 2024-02-27 广州市威士丹利智能科技有限公司 一种智能语音开关的控制方法及系统
CN115331781B (zh) * 2022-01-06 2023-11-10 中国科学院心理研究所 一种基于心电信号和音乐的抑郁症治疗系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616664B (zh) * 2015-02-02 2017-08-25 合肥工业大学 一种基于声谱图显著性检测的音频识别方法
CN105095406A (zh) * 2015-07-09 2015-11-25 百度在线网络技术(北京)有限公司 一种基于用户特征的语音搜索方法及装置
CN106128467A (zh) * 2016-06-06 2016-11-16 北京云知声信息技术有限公司 语音处理方法及装置
CN106128465A (zh) * 2016-06-23 2016-11-16 成都启英泰伦科技有限公司 一种声纹识别系统及方法
CN106302987A (zh) * 2016-07-28 2017-01-04 乐视控股(北京)有限公司 一种音频推荐方法及设备
US10158758B2 (en) * 2016-11-02 2018-12-18 International Business Machines Corporation System and method for monitoring and visualizing emotions in call center dialogs at call centers
CN108091340B (zh) * 2016-11-22 2020-11-03 北京京东尚科信息技术有限公司 声纹识别方法、声纹识别系统和计算机可读存储介质
CN107562850A (zh) * 2017-08-28 2018-01-09 百度在线网络技术(北京)有限公司 音乐推荐方法、装置、设备及存储介质
CN108153810A (zh) * 2017-11-24 2018-06-12 广东小天才科技有限公司 一种音乐推荐方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110889008A (zh) 2020-03-17
WO2020052135A1 (zh) 2020-03-19

Similar Documents

Publication Publication Date Title
US10977299B2 (en) Systems and methods for consolidating recorded content
CN107767869B (zh) 用于提供语音服务的方法和装置
CN110148427B (zh) 音频处理方法、装置、系统、存储介质、终端及服务器
US11475897B2 (en) Method and apparatus for response using voice matching user category
US20200126566A1 (en) Method and apparatus for voice interaction
WO2019109787A1 (zh) 音频分类方法、装置、智能设备和存储介质
CN111933129A (zh) 音频处理方法、语言模型的训练方法、装置及计算机设备
CN109785859B (zh) 基于语音分析的管理音乐的方法、装置和计算机设备
CN109686383B (zh) 一种语音分析方法、装置及存储介质
CN110473546B (zh) 一种媒体文件推荐方法及装置
CN110889008B (zh) 一种音乐推荐方法、装置、计算装置和存储介质
WO2022178969A1 (zh) 语音对话数据处理方法、装置、计算机设备及存储介质
CN112530408A (zh) 用于识别语音的方法、装置、电子设备和介质
CN111444382B (zh) 一种音频处理方法、装置、计算机设备以及存储介质
CN111798833A (zh) 一种语音测试方法、装置、设备和存储介质
WO2023222088A1 (zh) 语音识别与分类方法和装置
CN108877779B (zh) 用于检测语音尾点的方法和装置
CN110851650B (zh) 一种评论输出方法、装置、以及计算机存储介质
CN113314119A (zh) 语音识别智能家居控制方法及装置
CN107680584B (zh) 用于切分音频的方法和装置
CN111949778A (zh) 一种基于用户情绪的智能语音对话方法、装置及电子设备
CN110070891B (zh) 一种歌曲识别方法、装置以及存储介质
CN115512698B (zh) 一种语音语义分析方法
CN109213466B (zh) 庭审信息的显示方法及装置
CN110858234A (zh) 一种根据人物情感进行信息推送的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant