CN106372246A - 音频播放方法及其装置 - Google Patents

音频播放方法及其装置 Download PDF

Info

Publication number
CN106372246A
CN106372246A CN201610836462.6A CN201610836462A CN106372246A CN 106372246 A CN106372246 A CN 106372246A CN 201610836462 A CN201610836462 A CN 201610836462A CN 106372246 A CN106372246 A CN 106372246A
Authority
CN
China
Prior art keywords
audio
audio file
playback terminal
recognition result
server end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610836462.6A
Other languages
English (en)
Inventor
龙丁奋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN TONGXINGZHE TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN TONGXINGZHE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN TONGXINGZHE TECHNOLOGY Co Ltd filed Critical SHENZHEN TONGXINGZHE TECHNOLOGY Co Ltd
Priority to CN201610836462.6A priority Critical patent/CN106372246A/zh
Publication of CN106372246A publication Critical patent/CN106372246A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种音频播放方法,播放终端开启或者插入存储卡时,对本地存储的音频文件进行扫描并且根据扫描到的音频文件建立音频列表;所述播放终端采集到用户发出的播放语音时,对所述播放语音进行识别,并且将识别结果与所述音频列表内音频文件进行匹配,在匹配成功后,所述播放终端播放对应的音频文件;本发明还公开了一种音频播放装置,通过本发明能够直接根据用户的语音进行播放,简化了用户的操作流程,提高了用户体验。

Description

音频播放方法及其装置
技术领域
本发明属于音频播放技术领域,具体涉及一种音频播放方法及其装置。
背景技术
现有的播放方式比较的单一,通过播放器进行播放列表的随机播放或者列表循环般方法,而且控制也大多通过按键等,无法实现语音的控制和播放。
发明内容
有鉴于此,本发明的主要目的在于提供一种音频播放方法及其装置。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供一种音频播放方法,该方法为:播放终端开启或者插入存储卡时,对本地存储的音频文件进行扫描并且根据扫描到的音频文件建立音频列表;所述播放终端采集到用户发出的播放语音时,对所述播放语音进行识别,并且将识别结果与所述音频列表内音频文件进行匹配,在匹配成功后,所述播放终端播放对应的音频文件。
上述方案中,该方法还包括:所述播放终端通过蓝牙与移动终端连接成功后,所述播放终端通过蓝牙协议获取移动终端上正在播放的音频信息,所述播放终端将采集到用户发出的控制指令通过蓝牙协议发送至移动终端,所述移动终端根据接收到的控制指令进行播放控制。
上述方案中,该方法还包括:当识别结果与所述音频列表内音频文件匹配失败后,所述播放终端将所述识别结果发送至服务器端,所述服务器端在网络资源中对接收到的识别结果进行查找,查找到后,所述服务器端将该音频文件推送至所述播放终端,所述播放终端对其进行播放。
上述方案中,该方法还包括:所述播放终端将采集到用户发出的语音信息上传至服务器端,所述服务器端对语音信息进行语音识别和语义解析获得语音文本、声纹特征、语义特征、消息列队。
本发明实施例还提供一种音频播放装置,该装置包括扫描单元、采集和识别单元、播放单元;
所述扫描单元,用于在开启或者插入存储卡时,对本地存储的音频文件进行扫描并且根据扫描到的音频文件建立音频列表;
所述采集和识别单元,用于在采集到用户发出的播放语音时,对所述播放语音进行识别,并且将识别结果与所述音频列表内音频文件进行匹配,在匹配成功后,将对应的音频文件发送到播放单元;
所述播放单元,用于播放所述采集和识别单元发送的音频文件。
上述方案中,该装置还包括蓝牙单元,用于与移动终端连接成功后,获取移动终端上正在播放的音频信息,将采集到用户发出的控制指令发送至移动终端。
上述方案中,该装置还包括上传单元,用于当识别结果与所述音频列表内音频文件匹配失败后,将所述识别结果发送至服务器端,接收所述服务器端推送的在网络资源中对识别结果查找到的音频文件;还用与将该音频文件发送到播放单元。
与现有技术相比,本发明的有益效果:
本发明提供了更为便捷的播放方式和控制方式,能够直接根据用户的语音进行播放,简化了用户的操作流程,提高了用户体验。
附图说明
图1为本发明实施例提供一种音频播放方法的流程图;
图2为本发明实施例提供一种音频播放装置的连接框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种音频播放方法,如图1所示,该方法通过以下步骤实现:
步骤101:播放终端开启或者插入存储卡时,对本地存储的音频文件进行扫描并且根据扫描到的音频文件建立音频列表;
具体地,所述播放终端每次扫描不只是对外插存储卡,对设备自带的存储卡也会扫描,在扫描过程中能够正确辨别音频文件、视频文件、文本等,避免将非音频文件扫描进来,并且能够识别各项音频格式。
同时扫描到音频文件后,对音频文件做了时长、大小、比特率等判断,从而把系统录音文件、时长极小的程序音频等干扰因素从播放列表中剔除,让播放列表是用户想听的音频,从而提高了用户体验。
步骤102:所述播放终端采集到用户发出的播放语音时,对所述播放语音进行识别,并且将识别结果与所述音频列表内音频文件进行匹配,在匹配成功后,所述播放终端播放对应的音频文件。
具体地,如果匹配失败,所述播放终端通过云端服务器查找并且下载匹配的音频文件。
当用户发出语音时,播放终端会先判断用户的语音意思是不是用于控制播放器的控制行为,例如:播放、暂停、下一首、上一首、循环播放等。如果是用于控制播放器,则播放器会做相应的操作。如果语音不是用于控制播放器,则进入音频搜索环节。
在搜索音频时,如果本地存在搜索的音频,则优先播放本地。否则,搜索在线资源;在后台搜索的时候,会依据声音的拼音、声调、文字等特征来寻找最匹配的音频文件。对于找到的结果,后台通过打分策略,找到分数最高的若干个结果返回给播放终端供用户选择。
具体地,所述播放语音为某一音频文件的名称、或者某一词组等。
该方法还包括:所述播放终端通过蓝牙与移动终端连接成功后,所述播放终端通过蓝牙协议获取移动终端上正在播放的音频信息,所述播放终端将采集到用户发出的控制指令通过蓝牙协议发送至移动终端,所述移动终端根据接收到的控制指令进行播放控制,所述控制指令为播放下一首、播放、暂停、断开蓝牙等。
该方法还包括:当识别结果与所述音频列表内音频文件匹配失败后,所述播放终端将所述识别结果发送至服务器端,所述服务器端在网络资源中对接收到的识别结果进行查找,查找到后,所述服务器端将该音频文件推送至所述播放终端,所述播放终端对其进行播放。
该方法还包括:所述播放终端将采集到用户发出的语音信息上传至服务器端,所述服务器端对语音信息进行语音识别和语义解析获得语音文本、声纹特征、语义特征、消息列队。
所述语音文本指通过语音识别将用户的声音翻译成汉字;所述声纹特征指从用户声音的波形中经过模型处理,提炼出用户的年龄、性别和情绪等信息;所述语义特征指用户说法包含的蕴意,经过特殊搭建的收听场景的语义模型,能够准确的判断出用户说法的用意,从而给用户期望的处理结果;
语义模型:与目前市面上主流的音乐平台、电台平台、广播平台达成战略合作,将他们的歌曲、音频、歌手、艺术家、播放次数、收听时段、收听人群等关键性信息同步到后台当中,依据搜索算法,并构建好评价打分规则。至此,当用户说要收听一个音频,后台测算最符合用户预期的结果,并将结果返回给用户选择。
所述消息队列指用户的某些说法当中能够被当中控制指令,用于操作应用执行。
本发明实施例还提供一种音频播放装置,如图2所示,该装置包括扫描单元、采集和识别单元、播放单元;
所述扫描单元,用于在开启或者插入存储卡时,对本地存储的音频文件进行扫描并且根据扫描到的音频文件建立音频列表;
所述采集和识别单元,用于在采集到用户发出的播放语音时,对所述播放语音进行识别,并且将识别结果与所述音频列表内音频文件进行匹配,在匹配成功后,将对应的音频文件发送到播放单元;
所述播放单元,用于播放所述采集和识别单元发送的音频文件。
该装置还包括蓝牙单元,用于与移动终端连接成功后,获取移动终端上正在播放的音频信息,将采集到用户发出的控制指令发送至移动终端。
该装置还包括上传单元,用于当识别结果与所述音频列表内音频文件匹配失败后,将所述识别结果发送至服务器端,接收所述服务器端推送的在网络资源中对识别结果查找到的音频文件;还用与将该音频文件发送到播放单元。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (6)

1.一种音频播放方法,其特征在于,该方法为:播放终端开启或者插入存储卡时,对本地存储的音频文件进行扫描并且根据扫描到的音频文件建立音频列表;所述播放终端采集到用户发出的播放语音时,对所述播放语音进行识别,并且将识别结果与所述音频列表内音频文件进行匹配,在匹配成功后,所述播放终端播放对应的音频文件;
所述播放终端通过蓝牙与移动终端连接成功后,播放终端通过蓝牙协议获取移动终端上正在播放的音频信息,所述播放终端将采集到的用户发出的控制指令通过蓝牙协议发送至移动终端,所述移动终端根据接收到的控制指令进行播放控制。
2.根据权利要求1所述的音频播放方法,其特征在于,该方法还包括:当识别结果与所述音频列表内音频文件匹配失败后,所述播放终端将所述识别结果发送至服务器端,所述服务器端在网络资源中对接收到的识别结果进行查找,查找到后,所述服务器端将该音频文件推送至所述播放终端,所述播放终端对其进行播放。
3.根据权利要求1所述的音频播放方法,其特征在于,该方法还包括:所述播放终端将采集到用户发出的语音信息上传至服务器端,所述服务器端对语音信息进行语音识别和语义解析获得语音文本、声纹特征、语义特征、消息列队。
4.一种音频播放装置,其特征在于,该装置包括扫描单元、采集和识别单元、播放单元;
所述扫描单元,用于在开启或者插入存储卡时,对本地存储的音频文件进行扫描并且根据扫描到的音频文件建立音频列表;
所述采集和识别单元,用于在采集到用户发出的播放语音时,对所述播放语音进行识别,并且将识别结果与所述音频列表内音频文件进行匹配,在匹配成功后,将对应的音频文件发送到播放单元;
所述播放单元,用于播放所述采集和识别单元发送的音频文件。
5.根据权利要求4所述的音频播放装置,其特征在于,该装置还包括蓝牙单元,用于与移动终端连接成功后,获取移动终端上正在播放的音频信息,将采集到用户发出的控制指令发送至移动终端。
6.根据权利要求4所述的音频播放装置,其特征在于,该装置还包括上传单元,用于当识别结果与所述音频列表内音频文件匹配失败后,将所述识别结果发送至服务器端,接收所述服务器端推送的在网络资源中对识别结果查找到的音频文件;还用与将该音频文件发送到播放单元。
CN201610836462.6A 2016-09-20 2016-09-20 音频播放方法及其装置 Pending CN106372246A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610836462.6A CN106372246A (zh) 2016-09-20 2016-09-20 音频播放方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610836462.6A CN106372246A (zh) 2016-09-20 2016-09-20 音频播放方法及其装置

Publications (1)

Publication Number Publication Date
CN106372246A true CN106372246A (zh) 2017-02-01

Family

ID=57898607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610836462.6A Pending CN106372246A (zh) 2016-09-20 2016-09-20 音频播放方法及其装置

Country Status (1)

Country Link
CN (1) CN106372246A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107146608A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种播放控制方法、装置及智能设备
CN107609034A (zh) * 2017-08-09 2018-01-19 深圳市汉普电子技术开发有限公司 一种智能音箱的音频播放方法、音频播放装置及存储介质
WO2018224032A1 (zh) * 2017-06-08 2018-12-13 中兴通讯股份有限公司 多媒体管理方法和装置
CN110349599A (zh) * 2019-06-27 2019-10-18 北京小米移动软件有限公司 音频播放方法及装置
CN110392281A (zh) * 2018-04-20 2019-10-29 腾讯科技(深圳)有限公司 视频合成方法、装置、计算机设备及存储介质
CN110971744A (zh) * 2018-09-28 2020-04-07 深圳市冠旭电子股份有限公司 一种蓝牙音箱语音播放控制的方法及装置
CN113190647A (zh) * 2021-04-15 2021-07-30 北京小米移动软件有限公司 媒体文件播放方法、媒体文件播放装置及存储介质
CN115203466A (zh) * 2021-04-12 2022-10-18 博泰车联网科技(上海)股份有限公司 确定音频的方法、计算机存储介质和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020082057A1 (en) * 2000-12-21 2002-06-27 Lg Electronics Inc. System and method for utilizing mobile conmunication terminal as wireless headset
CN104601202A (zh) * 2014-12-23 2015-05-06 惠州Tcl移动通信有限公司 基于蓝牙技术实现文件搜索的方法、终端及蓝牙设备
CN105007053A (zh) * 2015-06-03 2015-10-28 维融集团有限公司 一种音频播放方法及设备
CN205004033U (zh) * 2015-09-10 2016-01-27 微鲸科技有限公司 云智能语音识别音响装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020082057A1 (en) * 2000-12-21 2002-06-27 Lg Electronics Inc. System and method for utilizing mobile conmunication terminal as wireless headset
CN104601202A (zh) * 2014-12-23 2015-05-06 惠州Tcl移动通信有限公司 基于蓝牙技术实现文件搜索的方法、终端及蓝牙设备
CN105007053A (zh) * 2015-06-03 2015-10-28 维融集团有限公司 一种音频播放方法及设备
CN205004033U (zh) * 2015-09-10 2016-01-27 微鲸科技有限公司 云智能语音识别音响装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘丕娥: "《大学计算机基础》", 31 August 2010, 哈尔滨工业大学出版社 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107146608A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种播放控制方法、装置及智能设备
WO2018224032A1 (zh) * 2017-06-08 2018-12-13 中兴通讯股份有限公司 多媒体管理方法和装置
CN109033099A (zh) * 2017-06-08 2018-12-18 中兴通讯股份有限公司 一种多媒体管理方法和装置
CN107609034A (zh) * 2017-08-09 2018-01-19 深圳市汉普电子技术开发有限公司 一种智能音箱的音频播放方法、音频播放装置及存储介质
CN110392281A (zh) * 2018-04-20 2019-10-29 腾讯科技(深圳)有限公司 视频合成方法、装置、计算机设备及存储介质
CN110392281B (zh) * 2018-04-20 2022-03-18 腾讯科技(深圳)有限公司 视频合成方法、装置、计算机设备及存储介质
CN110971744A (zh) * 2018-09-28 2020-04-07 深圳市冠旭电子股份有限公司 一种蓝牙音箱语音播放控制的方法及装置
CN110349599A (zh) * 2019-06-27 2019-10-18 北京小米移动软件有限公司 音频播放方法及装置
CN110349599B (zh) * 2019-06-27 2021-06-08 北京小米移动软件有限公司 音频播放方法及装置
CN115203466A (zh) * 2021-04-12 2022-10-18 博泰车联网科技(上海)股份有限公司 确定音频的方法、计算机存储介质和电子设备
CN113190647A (zh) * 2021-04-15 2021-07-30 北京小米移动软件有限公司 媒体文件播放方法、媒体文件播放装置及存储介质

Similar Documents

Publication Publication Date Title
CN106372246A (zh) 音频播放方法及其装置
US20230402029A1 (en) Systems and methods for providing notifications within a media asset without breaking immersion
US20160286264A1 (en) Media playback method, client and system
CN108347646B (zh) 多媒体内容播放方法和装置
CN105120304B (zh) 信息显示方法、装置及系统
CN111182347B (zh) 视频片段剪切方法、装置、计算机设备和存储介质
CN106373598B (zh) 音频重播的控制方法和装置
US20150317699A1 (en) Method, apparatus, device and system for inserting audio advertisement
CN107609034A (zh) 一种智能音箱的音频播放方法、音频播放装置及存储介质
CN102917119B (zh) 一种移动终端基于语音识别处理音乐的方法及系统
CN110502661A (zh) 一种视频搜索方法、系统及存储介质
US20180332357A1 (en) Information processing apparatus, information processing method, and program
CN107360507A (zh) 一种播放参数自动调节方法、智能音箱及存储介质
CN105704504A (zh) 视频直播中插入推送信息的方法和装置
CN104023250A (zh) 基于流媒体的实时互动方法和系统
CN102881309B (zh) 歌词文件生成方法及装置
CN110083738A (zh) 一种基于声纹和情境感知的音乐推荐方法和终端设备
CN109237740A (zh) 一种电器的控制方法、装置、存储介质及电器
CN110164448A (zh) 语音处理方法及装置、存储介质、语音处理系统
CN109684288A (zh) 不同终端的音乐同步方法、终端设备及汽车
CN114501402A (zh) 一种智能座舱蓝牙音乐播放方法
CN107193922B (zh) 一种信息处理的方法及装置
CN107333185A (zh) 一种播放方法及装置
CN107977849A (zh) 一种基于音频流实时智能植入信息的方法及系统
WO2014180197A1 (zh) 自动发送多媒体文件的方法及装置、移动终端、存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170201