CN105956014A - 一种基于深度学习的音乐播放方法 - Google Patents

一种基于深度学习的音乐播放方法 Download PDF

Info

Publication number
CN105956014A
CN105956014A CN201610253698.7A CN201610253698A CN105956014A CN 105956014 A CN105956014 A CN 105956014A CN 201610253698 A CN201610253698 A CN 201610253698A CN 105956014 A CN105956014 A CN 105956014A
Authority
CN
China
Prior art keywords
music
retrieval
voice
user
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610253698.7A
Other languages
English (en)
Inventor
汤影
杨林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Tuya Technology Co Ltd
Original Assignee
Chengdu Tuya Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Tuya Technology Co Ltd filed Critical Chengdu Tuya Technology Co Ltd
Priority to CN201610253698.7A priority Critical patent/CN105956014A/zh
Publication of CN105956014A publication Critical patent/CN105956014A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度学习的音乐播放方法,包括以下步骤:S1.用户输入检索语音;S2.将输入的检索语音转换为文本内容,提取和记录检索语音的音乐旋律;S3.利用文本内容在音乐库中检索对应的歌曲;S4.判断检索得到的歌曲是否唯一;S5.将检索到的歌曲和检索语音的音乐旋律进行匹配,根据匹配程度的高低生成歌曲列表,用户选择目标音乐来进行播放;S6.根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习。本发明将检索语音转换为文本来进行歌曲检索,通过音乐旋律来判断检索到的歌曲匹配程度,提高检索的准确度,方便用户对音乐的选择;根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习,进一步提高了检索的准确性。

Description

一种基于深度学习的音乐播放方法
技术领域
本发明涉及一种基于深度学习的音乐播放方法。
背景技术
音乐是人情感的一种直接表现,在当今环境下,音乐已经成为人们生活必不可缺的一部分,音乐的获取和播放也越来越受到人们的重视。
现有技术中,大多数时候通过文字输入进行音乐搜索的播放,但是很多时候,这种音乐搜索和播放的方式并不方便,例如,开车时手动进行文字输入会影响安全;针对情况,基于语音识别进行音乐搜索的播放的技术也渐渐被研发出来,“听音识曲”成为了一种重要的音乐搜索方式,但现有的语音识别技术仅仅是将语音转换为文本进行搜索,并不涉及音乐旋律的检测,同时不同用户的语音习惯不同,也造成搜索不准确。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于深度学习的音乐播放方法,将检索语音转换为文本内容来进行歌曲检索,通过音乐旋律来判断检索到的歌曲匹配程度,能够显著提高检索的准确度,方便用户对音乐的选择;同时根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习,进一步提高了检索的准确性。
本发明的目的是通过以下技术方案来实现的:一种基于深度学习的音乐播放方法,包括以下步骤:
S1.用户输入检索语音;
S2.将输入的检索语音转换为文本内容,提取和记录检索语音的音乐旋律;
S3.利用文本内容在音乐库中检索对应的歌曲;
S4.判断检索得到的歌曲是否唯一;
(1)如果检索得到的音乐唯一,播放对应音乐;
(2)如果检索得到的音乐不唯一,跳转至步骤S5;
S5.将检索到的歌曲和检索语音的音乐旋律进行匹配,根据匹配程度的高低生成歌曲列表,用户选择目标音乐来进行播放;
S6.根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习。
步骤S1中,用户通过哼唱的方式输入检索语音。
所述的检索语音的持续输入时间不小于5秒。
所述的步骤S2包括以下子步骤:
S21.利用语音端点检测技术对检索语音进行分段,得到分段的检索语音;
S22.根据将分段的检索语音转换为文本内容;
S23.利用音乐旋律提取算法得到并记录检索语音的音乐旋律。
所述的步骤S5包括以下步骤:
S51.基于音乐旋律匹配算法,将检索到的每一首歌曲分别与检索语音进行音乐旋律匹配;
S52.将检索到的歌曲按照匹配程度从高到低的顺序排列,生成歌曲列表;
S53.用户选择目标音乐来进行播放。
所述的步骤S6包括以下子步骤:
S61.提取用户选择的目标音乐歌词中与检索语音对应的目标文本;
S63.将检索语音与目标文本进行匹配,得到用户对目标文本中每个文字发音习惯,并进行深度学习。
本发明的有益效果是:将检索语音转换为文本内容来进行歌曲检索,通过音乐旋律来判断检索到的歌曲匹配程度,能够显著提高检索的准确度,方便用户对音乐的选择;同时根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习,进一步提高了检索的准确性。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种基于深度学习的音乐播放方法,其特征在于:
S1.用户输入检索语音;
S2.将输入的检索语音转换为文本内容,提取和记录检索语音的音乐旋律;
S3.利用文本内容在音乐库中检索对应的歌曲;
S4.判断检索得到的歌曲是否唯一;
(1)如果检索得到的音乐唯一,播放对应音乐;
(2)如果检索得到的音乐不唯一,跳转至步骤S5;
S5.将检索到的歌曲和检索语音的音乐旋律进行匹配,根据匹配程度的高低生成歌曲列表,用户选择目标音乐来进行播放;
S6.根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习。
步骤S1中用户通过哼唱的方式输入检索语音。
所述的检索语音的持续输入时间不小于5秒。
所述的步骤S2包括以下子步骤:
S21.利用语音端点检测技术对检索语音进行分段,得到分段的检索语音;
S22.根据将分段的检索语音转换为文本内容;
S23.利用音乐旋律提取算法得到并记录检索语音的音乐旋律。
所述的步骤S5包括以下步骤:
S51.基于音乐旋律匹配算法,将检索到的每一首歌曲分别与检索语音进行音乐旋律匹配;
S52.将检索到的歌曲按照匹配程度从高到低的顺序排列,生成歌曲列表;
S53.用户选择目标音乐来进行播放。
所述的步骤S6包括以下子步骤:
S61.提取用户选择的目标音乐歌词中与检索语音对应的目标文本;
S63.将检索语音与目标文本进行匹配,得到用户对目标文本中每个文字发音习惯,并进行深度学习。
实施例一,本实施例是通过安装于手机上的客户端来实现的,客户端通过无线网络连接到音乐库(音乐库中所有歌曲均具有歌词);首先,用户进行检索语音输入时,客户端通过调用手机的拾音器件获得检索语音;将检索语音转换为文本内容,并利用音乐旋律提取算法得到并记录检索语音的音乐旋律,
进一步地,如果检索语音不进行分段,转换为的文本内容是一系列的文字,并没有分隔符号,故需要在转换为文本前利用语音端点检测技术对检索语音进行分段,分段后在进行文本转换。
在将检索语音转换为文本后,客户端在音乐库中检索:歌词带有相应文本的歌曲,如果得到的结果唯一,直接自动播放;如果得到的结果不唯一,则客户端通过音乐旋律匹配算法,将检索到的歌曲和检索语音的音乐旋律进行匹配,根据匹配程度的高低生成歌曲列表,用户选择目标音乐来进行播放。
由于不同的用户具有不同的发音习惯,如果按照标准发音进行文本转换,则并不能够很好给出用户需要的音乐,因此,需要对用户自身的发音习惯进行学习,例如,“四”、“十”、“是”这些文字不容易被分辨,在第一次出现时,客户端智能检索出所有可能供用户选择,并根据用户选择来确定用户实际上检索的是包含哪个文字的歌曲,得到用户对相应文字的习惯性发音,并进行深度学习;因此,本发明的方法使用时间越长,检索结果越准确。

Claims (6)

1.一种基于深度学习的音乐播放方法,其特征在于:包括以下步骤:
S1.用户输入检索语音;
S2.将输入的检索语音转换为文本内容,提取和记录检索语音的音乐旋律;
S3.利用文本内容在音乐库中检索对应的歌曲;
S4.判断检索得到的歌曲是否唯一;
(1)如果检索得到的音乐唯一,播放对应音乐;
(2)如果检索得到的音乐不唯一,跳转至步骤S5;
S5.将检索到的歌曲和检索语音的音乐旋律进行匹配,根据匹配程度的高低生成歌曲列表,用户选择目标音乐来进行播放;
S6.根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习。
2.根据权利要求1所述的一种基于深度学习的音乐播放方法,其特征在于:步骤S1中,用户通过哼唱的方式输入检索语音。
3.根据权利要求2所述的一种基于深度学习的音乐播放方法,其特征在于:所述的检索语音的持续输入时间不小于5秒。
4.根据权利要求1所述的一种基于深度学习的音乐播放方法,其特征在于:所述的步骤S2包括以下子步骤:
S21.利用语音端点检测技术对检索语音进行分段,得到分段的检索语音;
S22.根据将分段的检索语音转换为文本内容;
S23.利用音乐旋律提取算法得到并记录检索语音的音乐旋律。
5.根据权利要求1所述的一种基于深度学习的音乐播放方法,其特征在于:所述的步骤S5包括以下步骤:
S51.基于音乐旋律匹配算法,将检索到的每一首歌曲分别与检索语音进行音乐旋律匹配;
S52.将检索到的歌曲按照匹配程度从高到低的顺序排列,生成歌曲列表;
S53.用户选择目标音乐来进行播放。
6.根据权利要求1所述的一种基于深度学习的音乐播放方法,其特征在于:所述的步骤S6包括以下子步骤:
S61.提取用户选择的目标音乐歌词中与检索语音对应的目标文本;
S63.将检索语音与目标文本进行匹配,得到用户对目标文本中每个文字发音习惯,并进行深度学习。
CN201610253698.7A 2016-04-22 2016-04-22 一种基于深度学习的音乐播放方法 Pending CN105956014A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610253698.7A CN105956014A (zh) 2016-04-22 2016-04-22 一种基于深度学习的音乐播放方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610253698.7A CN105956014A (zh) 2016-04-22 2016-04-22 一种基于深度学习的音乐播放方法

Publications (1)

Publication Number Publication Date
CN105956014A true CN105956014A (zh) 2016-09-21

Family

ID=56914692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610253698.7A Pending CN105956014A (zh) 2016-04-22 2016-04-22 一种基于深度学习的音乐播放方法

Country Status (1)

Country Link
CN (1) CN105956014A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776872A (zh) * 2016-11-29 2017-05-31 暴风集团股份有限公司 根据语音定义语意进行语音搜索的方法及系统
CN108172241A (zh) * 2017-12-27 2018-06-15 上海传英信息技术有限公司 一种基于智能终端的音乐推荐方法及音乐推荐系统
CN109189975A (zh) * 2018-09-06 2019-01-11 深圳市三宝创新智能有限公司 一种音乐播放方法、装置、计算机设备及可读存储介质
CN110347865A (zh) * 2019-07-11 2019-10-18 Oppo广东移动通信有限公司 歌词提示方法、装置、存储介质及增强现实设备
CN111312220A (zh) * 2019-12-02 2020-06-19 西安冉科信息技术有限公司 一种基于学习机对话交流的学习方法
CN115129924A (zh) * 2021-03-26 2022-09-30 北京达佳互联信息技术有限公司 基于语音的内容搜索方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102970427A (zh) * 2012-11-16 2013-03-13 广东欧珀移动通信有限公司 一种手机播放歌曲的方法
CN103514879A (zh) * 2013-09-18 2014-01-15 广东欧珀移动通信有限公司 一种基于bp神经网络的本地语音识别方法
CN103631802A (zh) * 2012-08-24 2014-03-12 腾讯科技(深圳)有限公司 歌曲信息检索方法、装置及相应的服务器
CN104978962A (zh) * 2014-04-14 2015-10-14 安徽科大讯飞信息科技股份有限公司 哼唱检索方法及系统
CN105096962A (zh) * 2015-05-22 2015-11-25 努比亚技术有限公司 一种信息处理方法及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631802A (zh) * 2012-08-24 2014-03-12 腾讯科技(深圳)有限公司 歌曲信息检索方法、装置及相应的服务器
CN102970427A (zh) * 2012-11-16 2013-03-13 广东欧珀移动通信有限公司 一种手机播放歌曲的方法
CN103514879A (zh) * 2013-09-18 2014-01-15 广东欧珀移动通信有限公司 一种基于bp神经网络的本地语音识别方法
CN104978962A (zh) * 2014-04-14 2015-10-14 安徽科大讯飞信息科技股份有限公司 哼唱检索方法及系统
CN105096962A (zh) * 2015-05-22 2015-11-25 努比亚技术有限公司 一种信息处理方法及终端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SUZUKI M.ETC: "Music Information Retrieval from a Singing Voice Using Lyrics and Melody Information", 《EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING》 *
TAO WANG.ETC: "Music Information Retrieval System using Lyrics and Melody Information", 《CONFERENCE ON INFORMATION PROCESSING》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776872A (zh) * 2016-11-29 2017-05-31 暴风集团股份有限公司 根据语音定义语意进行语音搜索的方法及系统
CN108172241A (zh) * 2017-12-27 2018-06-15 上海传英信息技术有限公司 一种基于智能终端的音乐推荐方法及音乐推荐系统
CN108172241B (zh) * 2017-12-27 2020-11-17 上海传英信息技术有限公司 一种基于智能终端的音乐推荐方法及音乐推荐系统
CN109189975A (zh) * 2018-09-06 2019-01-11 深圳市三宝创新智能有限公司 一种音乐播放方法、装置、计算机设备及可读存储介质
CN109189975B (zh) * 2018-09-06 2021-12-24 深圳市三宝创新智能有限公司 一种音乐播放方法、装置、计算机设备及可读存储介质
CN110347865A (zh) * 2019-07-11 2019-10-18 Oppo广东移动通信有限公司 歌词提示方法、装置、存储介质及增强现实设备
CN111312220A (zh) * 2019-12-02 2020-06-19 西安冉科信息技术有限公司 一种基于学习机对话交流的学习方法
CN115129924A (zh) * 2021-03-26 2022-09-30 北京达佳互联信息技术有限公司 基于语音的内容搜索方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN105956014A (zh) 一种基于深度学习的音乐播放方法
CN106663424B (zh) 意图理解装置以及方法
EP1895505A1 (en) Method and device for musical mood detection
JP2016206660A (ja) 話者識別方法及び話者識別装置
US8892565B2 (en) Method and apparatus for accessing an audio file from a collection of audio files using tonal matching
US9886947B2 (en) Speech recognition device and method, and semiconductor integrated circuit device
KR101971513B1 (ko) 전자 장치 및 이의 음성 인식 오류 수정 방법
CN101415259A (zh) 嵌入式设备上基于双语语音查询的信息检索系统及方法
CN102568478A (zh) 一种基于语音识别的视频播放控制方法和系统
CN110782875B (zh) 一种基于人工智能的语音韵律处理方法及装置
CN110741430B (zh) 歌唱合成方法及歌唱合成系统
CN110930969B (zh) 背景音乐的确定方法及相关设备
US9012755B2 (en) Method and apparatus for storing/searching for music
JP2008287210A (ja) 音声チャットシステム、情報処理装置、音声認識方法およびプログラム
JP2019003000A (ja) 歌唱音声の出力方法及び音声応答システム
US20160034247A1 (en) Extending Content Sources
CN107679196A (zh) 一种多媒体识别方法、电子设备及存储介质
Dumpala et al. Analysis of constraints on segmental DTW for the task of query-by-example spoken term detection
KR20140129443A (ko) 적응형 음원 추천 시스템 및 방법
KR101945190B1 (ko) 음성인식 작동 시스템 및 방법
CN113539235B (zh) 文本分析与语音合成方法、装置、系统及存储介质
JP5696638B2 (ja) 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム
KR100358006B1 (ko) 음악 데이타 베이스에서의 곡목 검색 장치 및 방법
JP2006276560A (ja) 音楽再生装置および音楽再生方法
JP2019036246A (ja) 情報処理装置、情報取得機器、トランスクライバーシステム、表示方法、生成方法およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160921