CN115203466A - 确定音频的方法、计算机存储介质和电子设备 - Google Patents

确定音频的方法、计算机存储介质和电子设备 Download PDF

Info

Publication number
CN115203466A
CN115203466A CN202110388439.6A CN202110388439A CN115203466A CN 115203466 A CN115203466 A CN 115203466A CN 202110388439 A CN202110388439 A CN 202110388439A CN 115203466 A CN115203466 A CN 115203466A
Authority
CN
China
Prior art keywords
audio
determining
letters
audio information
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110388439.6A
Other languages
English (en)
Inventor
李佳霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pateo Connect and Technology Shanghai Corp
Original Assignee
Pateo Connect and Technology Shanghai Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pateo Connect and Technology Shanghai Corp filed Critical Pateo Connect and Technology Shanghai Corp
Priority to CN202110388439.6A priority Critical patent/CN115203466A/zh
Publication of CN115203466A publication Critical patent/CN115203466A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

一种确定音频的方法、计算机存储介质和电子设备,其中,确定音频的方法包括以下步骤:获取播放列表,所述播放列表包括与若干音频对应的音频信息,所述音频信息包括音频名称、歌手姓名和专辑名称中的至少一者;获取确定音频的语音指令;识别所述语音指令中的对象关键词,所述对象关键词用于确定所述音频信息;将所述对象关键词解析为相应的对象关键词字母;根据对象关键词字母对所述音频信息进行检索,获取检索结果;在所述若干音频中,根据所述检索结果确定相应的音频。通过所述确定音频的方法,能够提高用户体验。

Description

确定音频的方法、计算机存储介质和电子设备
技术领域
本发明涉及智能技术领域,尤其涉及一种确定音频的方法、计算机存储介质和电子设备。
背景技术
随着生活水平的提高和科技的发展,通过语音指令指示智能终端播放音频的功能,在智能终端中越来越普遍。
在将语音指令与播放列表的内容匹配,以指定播放音频的过程中,通常,将语音指令解析为中文信息后,将解析得到的中文信息与播放列表进行比对。
然而,一方面,在将语音指令解析为中文的过程中,由于需要较大的数据库,以对各种非常用中文的汉字字符也进行存储,因此,需要存储的数据量大,导致大量占用了终端的存储资源。现有技术中提出了一种方法以解决上述问题,该方法通过将该数据库单独存储在云端或者专用服务器上,同时,通过终端与所述云端或专用服务器之间的通信,使终端发送语音指令,并自云端或专用服务器获取到解析后的中文信息,然而,所述方法仅通过终端本地无法实现语音指令在播放列表中指定音频,因此,当终端处于信号较差的位置时,难以流畅的发送语音指令和接收中文信息,导致不能将中文信息与播放列表进行匹配、或是匹配不流畅,造成了用户的使用体验差。另一方面,由于在将语音指令解析为中文的过程中,对语音指令中的发音要求较高,导致语音指令中的语调、发音与标准语调和发音有区别时容易解析错误,使得与播放列表间容易出现无法匹配的情况,也造成了用户的使用体验差。
发明内容
本发明解决的技术问题是提供一种确定音频的方法、计算机存储介质和电子设备,以在存储较少数据的同时,实现终端在本地通过语音指令确定播放列表中的音频的功能,并且,实现确定音频的过程中降低语音指令与音频无法匹配的风险,使得用户体验得到提高。
为解决上述技术问题,本发明的技术方案提供一种确定音频的方法,包括以下步骤:获取播放列表,所述播放列表包括与若干音频对应的音频信息,所述音频信息包括音频名称、歌手姓名和专辑名称中的至少一者;获取确定音频的语音指令;识别所述语音指令中的对象关键词,所述对象关键词用于确定所述音频信息;将所述对象关键词解析为相应的对象关键词字母;根据对象关键词字母对所述音频信息进行检索,获取检索结果;在所述若干音频中,根据所述检索结果确定相应的音频。
相应的,本发明的技术方案还提供一种计算机存储介质,存储有包括程序指令的计算机程序,所述程序指令被处理器执行时,执行如上所述的确定音频的方法的步骤。
相应的,本发明的技术方案还提供一种电子设备,包括处理器、存储器、通信接口、一个或多个程序,所述通信接口用于获取如上所述的播放列表,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如上所述的方法中的步骤的指令。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明的技术方案提供的确定音频的方法中,由于将语音指令中的对象关键词解析为相应的对象关键词字母,因此,用于解析对象关键词的数据库中无需存储中文,从而,用于解析对象关键词的数据库需要存储的数据较少、所述数据库对存储资源占用少。在此基础上,由于在获取播放列表后,根据对象关键词字母对所述音频信息进行检索,获取检索结果。因此,一方面,能够实现终端在本地通过语音指令确定播放列表中的音频的功能,从而,通过语音指令确定音频的过程不受终端通信信号影响、流畅度高,进而提高了用户体验;另一方面,相比于根据中文的对象关键词进行检索和匹配的方式,通过对象关键词字母进行的检索扩大了检索结果的范围,从而,降低了确定音频的过程中,由于发音问题导致的无法匹配的风险,进而提高了用户体验。综上,所述确定音频的方法,不仅在存储较少数据的同时,实现终端在本地通过语音指令确定播放列表中的音频的功能,并且,还降低了确定音频的过程中,语音指令与音频无法匹配的风险,从而,提高了用户体验。
附图说明
图1是本发明一实施例的确定音频的方法的流程示意图;
图2为图1中步骤S100的流程示意图;
图3为图1中步骤S500的流程示意图;
图4为图3中步骤S510的流程示意图;
图5为图1中步骤S600的流程示意图;
图6为图5中步骤S610的流程示意图。
具体实施方式
如背景技术所述,一方面,在将语音指令解析为中文的过程中,由于需要较大的数据库,以对各种非常用中文的汉字字符也进行存储,因此,需要存储的数据量大,导致大量占用了终端的存储资源。现有技术中提出了一种方法以解决上述问题,该方法通过将该数据库单独存储在云端或者专用服务器上,同时,通过终端与所述云端或专用服务器之间的通信,使终端发送语音指令,并自云端或专用服务器获取到解析后的中文信息,然而,所述方法仅通过终端本地无法实现语音指令在播放列表中指定音频,因此,当终端处于信号较差的位置时,难以流畅的发送语音指令和接收中文信息,导致不能将中文信息与播放列表进行匹配、或是匹配不流畅,造成了用户的使用体验差。另一方面,由于在将语音指令解析为中文的过程中,对语音指令中的发音要求较高,导致语音指令中的语调、发音与标准语调和发音有区别时容易解析错误,使得与播放列表间容易出现无法匹配的情况,也造成了用户的使用体验差。
为了解决所述技术问题,本发明实施例提供一种确定音频的方法、计算机存储介质和电子设备,其中,由于在所述确定音频的方法中,将语音指令中的对象关键词直接解析为相应的对象关键词字母,根据对象关键词字母对所述音频信息进行检索,获取检索结果,并且,根据所述检索结果确定相应的音频。因此,不仅需要存储的数据更少,同时,在确定音频的过程中降低了语音指令与音频无法匹配的风险,从而,用户体验得到提高。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明一实施例的确定音频的方法的流程示意图。
请参考图1,所述确定音频的方法包括:
步骤S100,获取播放列表,所述播放列表包括与若干音频对应的音频信息,所述音频信息包括音频名称、歌手姓名和专辑名称中的至少一者;
步骤S200,获取确定音频的语音指令;
步骤S300,识别所述语音指令中的对象关键词,所述对象关键词用于确定所述音频信息;
步骤S400,将所述对象关键词解析为相应的对象关键词字母;
步骤S500,根据对象关键词字母对所述音频信息进行检索,获取检索结果;
步骤S600,在所述若干音频中,根据所述检索结果确定相应的音频。
由于将语音指令中的对象关键词解析为相应的对象关键词字母,因此,用于解析对象关键词的数据库中无需存储中文,从而,用于解析对象关键词的数据库需要存储的数据较少、所述数据库对存储资源占用少。
在此基础上,由于在获取播放列表后,根据对象关键词字母对所述音频信息进行检索,获取检索结果。因此,一方面,能够实现终端在本地通过语音指令确定播放列表中的音频的功能,从而,通过语音指令确定音频的过程不受终端通信信号影响、流畅度高,进而提高了用户体验。另一方面,相比于根据包含中文的对象关键词进行检索和匹配的方式,通过对象关键词字母进行的检索扩大了检索结果的范围,从而,降低了确定音频的过程中,由于发音问题导致的无法匹配的风险,进而提高了用户体验。
综上,所述确定音频的方法,不仅在存储较少数据的同时,实现终端在本地通过语音指令确定播放列表中的音频的功能,并且,还降低了确定音频的过程中,语音指令与音频无法匹配的风险,从而,提高了用户体验。
在本实施例中,所述获取确定音频的语音指令之后,所述确定音频的方法还包括:获取所述语音指令中的动作关键词。所述动作关键词用于确定相应的音频时的方式。例如,当获取动作关键词“听”时,则对所述相应的音频进行播放。当获取动作关键词“显示”时,则对相应的音频所对应的音频信息显示。
具体而言,在获取所述语音指令后,对所述语音指令进行语义识别,识别出语音指令中的对象关键词和动作关键词。
在另一个实施例中,不获取语音指令中的动作关键词。因此,降低了语义识别的难度,减少了用于进行语义识别的数据库所需要存储的数据,进一步减少了对存储资源的占用。在该实施例中,确定相应的音频时的方式是预设的,例如,直接对步骤S600中所确定的相应的音频进行播放。
在本实施例中,将所述对象关键词解析为对象关键词字母是指:将语音的对象关键词中的英语单词或字母解析为字母,将语音的对象关键词中的中文解析为与该中文的拼音对应的字母。
在一个场景下,语音指令为“我要听王力宏的歌”,其中,“王力宏”为对象关键词,解析获得的对象关键词字母为“wanglihong”。
在另一个场景下,语音指令为“我要听love story”,其中,“love story”为对象关键词,解析获得的对象关键词字母为“lovestory”。
在又一个场景下,语音指令为“我要听李AB的歌”,其中,“李AB”为对象关键词,解析获得的对象关键词字母为“liab”。
请参考图2,图2为图1中步骤S100的流程示意图,所述获取播放列表的步骤包括:
步骤S110,与外部终端或外部U盘中的至少一者建立连接,其中,与外部U盘建立的连接为有线连接,与外部终端建立的连接包括有线连接或无线连接中的至少一种;
步骤S120,当建立有线连接时,读取所述外部终端或外部U盘中的播放列表;
步骤S130,当建立无线连接时,确认是否支持读取外部终端、外部终端的音频播放应用中的播放列表;
步骤S140,在确认支持读取后,获取来自外部终端的播放列表。
所述外部终端包括手机、平板电脑、电脑等电子设备。
在一个场景中,外部终端为外部U盘,用户使车载终端与外部U盘建立有线连接,此时,车载终端遍历整个外部U盘的盘符,获取外部U盘中的播放列表。
在另一个场景中,外部终端为手机,用户使车载终端与手机基于AVRCP(AudioVideo Remote Cortrol Profile)协议建立蓝牙连接。用户使车载终端与手机的蓝牙连接,此时,根据手机反馈的信息(supports browsing),确认手机是否支持车载终端的读取。当手机支持车载终端的读取时,通过用户在手机上打开音频播放应用,直接调用获得支持功能(get Supported Feature)接口,以确认音频播放应用是否支持车载终端的读取。当音频播放应用支持车载终端的读取时,确认支持车载终端对音频播放应用的播放列表的读取,接着,车载终端获取来自手机的播放列表。
请参考图3,图3为图1中步骤S500的流程示意图,所述根据对象关键词字母对所述音频信息进行检索,获取检索结果的步骤包括:
步骤S510,根据所述音频信息获取音频信息字母;
步骤S520,比较所述音频信息字母和所述对象关键词字母,获取检索结果,其中,所述检索结果为包含了所述对象关键词字母的音频信息字母所对应的音频信息。
请参考图4,图4为图3中步骤S510的流程示意图,所述根据所述音频信息获取音频信息字母的步骤包括:
步骤S511,当所述音频信息为字母时,所述音频信息字母等于所述音频信息;
步骤S512,当所述音频信息包括中文时,将所述中文解析为拼音,获取所述音频信息对应的音频信息字母。
具体而言,音频信息为音频名称“ab”时,相应的,音频信息字母为“ab”。音频信息为音频名称“三千里”时,则将“三千里”解析为拼音,获取与该音频名称对应的音频信息字母“sanqianli”。音频信息为专辑名称“花duo”时,则将“花”解析为拼音,获取与该专辑名称对应的音频信息字母“huaduo”。
在一个场景中,车机与手机建立无线连接,并获取播放列表A。当所述车机获取播放列表A后,向用户语音提示已获取播放列表A。接着,用户向所述车机下达语音指令“我要听王力的歌”。在该场景中,语音指令中的对象关键词为“王力”。相应的,对象关键词字母为“wangli”。播放列表A包括歌手姓名“王力”、歌手姓名“汪林”、歌手姓名“王li”、音频名称“wangli”、专辑名称“谁是亡灵”、歌手姓名“周杰伦”等音频信息。相应的,与“王力”对应的音频信息字母为“wangli”,与“汪林”对应的音频信息字母为“wanglin”,与“王li”对应的音频信息字母为“wangli”,与“wangli”对应的音频信息字母为“wangli”,为“谁是亡灵”对应的音频信息字母为“sheishiwangling”,与“周杰伦”对应的音频信息字母为“zhoujielun”。其中,歌手姓名“王力”、歌手姓名“汪林”、歌手姓名“王li”、音频名称“wangli”、专辑名称“谁是亡灵”各自所对应的对象关键词字母均包含所述对象关键词字母“wangli”,因此,通过将对象关键词字母“wangli”,与播放列表A中的音频信息对应的各音频信息字母进行比较后,所获取的检索结果包括:歌手姓名“王力”、歌手姓名“汪林”、歌手姓名“王li”、音频名称“wangli”、专辑名称“谁是亡灵”。
在另一个场景中,车载终端与U盘建立有线连接,并显示获取的整个播放列表B。接着,用户向所述车载终端下达语音指令“显示歌名是尘埃的歌”。相应的,识别出的对象关键词为“尘埃”,解析获得的对象关键词字母为“chenai”。在该场景中,播放列表B包括音频名称“再见尘埃”、音频名称“尘埃的最后”、音频名称“chenai”、音频名称“陈gai”、歌手姓名“陈爱”、歌手姓名“蔡徐坤”等音频信息。相应的,“再见尘埃”对应的音频信息字母为“zaijianchenai”、“尘埃的最后”对应的音频信息字母为“chenaidezuihou”,“chenai”对应的音频信息字母为“chenai”,“陈gai”对应的音频信息字母为“chengai”,“陈爱”对应的音频信息字母为“chenai”、“蔡徐坤”对应的音频信息字母为“caixukun”。
在该场景中,根据语义识别的内容还能够确定对象关键词对应的音频信息类型。相应的,在该场景中比较所述音频信息字母和所述对象关键词字母,获取检索结果的方法为:根据对象关键词对应的音频信息类型,比较对象关键词字母和音频信息字母,获取检索结果。从而,提高了检索结果的准确性。
具体的,在该场景中,对语音指令“显示歌名是尘埃的歌”进行语义识别后,识别出对象关键词“尘埃”是一首“歌”,从而,根据识别出的“歌”,确定对象关键词“尘埃”对应的音频信息类型为音频名称。由此,将对象关键词字母“chenai”分别与音频名称“再见尘埃”所对应的音频信息字母“zaijianchenai”、音频名称“尘埃的最后”所对应的音频信息字母“chenaidezuihou”、音频名称“chenai”对应的音频信息字母“chenai”、音频名称“陈gai”对应的音频信息字母“chengai”进行比较,获取检索结果。其中,音频信息字母“zaijianchenai”、音频信息字母“chenaidezuihou”、音频信息字母“chenai”包含了对象关键词字母“chenai”。因此,获取的检索结果包括音频名称“再见尘埃”、音频名称“尘埃的最后”和音频名称“chenai”。
在另一个实施例中,步骤S520,比较所述音频信息字母和所述对象关键词字母,获取检索结果,其中,所述检索结果为包含了所述对象关键词字母的音频信息字母所对应的音频信息,且对象关键词字母位于该音频信息字母的起始。从而,降低了实现步骤S520中,音频信息字母和对象关键词字母的比较程序的复杂度和难度。在一个场景中,对象关键词为“一”,相应的,对象关键词字母为“yi”。播放列表中包括音频名称“一二”和音频名称“而已”,相应的,音频名称“一二”所对应的音频信息字母为“yier”,音频名称“而已”所对应的音频信息字母为“eryi”。在该场景中,将对象关键词字母为“yi”分别与音频信息字母为“yier”、音频信息字母为“eryi”比较,获取检索结果,所述检索结果为音频名称“一二”。
在一个其他实施例中,所述在所述若干音频中,根据所述检索结果确定相应的音频的方法包括:显示所述检索结果。
在一个场景中,检索结果包括:音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”,相应的,车载终端显示:音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”。
进一步的,显示所述检索结果的方法包括:显示检索结果中的音频信息、以及与检索结果中的音频信息相关联的音频信息。其中,与检索结果中的音频信息相关联的音频信息为:与检索结果中的音频信息对应了至少部分相同音频的音频信息。
在一个场景中,对象关键词为“龙”。播放列表包括:音频名称“龙一”、音频名称“龙的传人”、专辑名称“龙龙龙”、歌手姓名“龙”、歌手姓名“王一”和音频名称“三三”等音频信息。其中,专辑名称“龙龙龙”对应的音频包括了音频名称“三三”所对应的音频,音频名称“龙一”与歌手姓名“王一”对应同样的音频。在该场景中,检索结果包括:音频名称“龙一”、音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”。此时,音频名称“三三”是与专辑名称“龙龙龙”关联的音频信息,歌手姓名“王一”是与音频名称“龙一”关联的音频信息。相应的,显示检索结果的方法为:显示音频名称“龙一”、音频名称“龙的传人”、专辑名称“龙龙龙”、歌手“龙”、音频名称“三三”和歌手姓名“王一”。
在另一个其他实施例中,所述在所述若干音频中,根据所述检索结果确定相应的音频的方法包括:播放所述检索结果对应的音频。
在一个场景中,检索结果包括:音频名称“龙的传人”、专辑名称“龙龙龙”和歌手“龙”,相应的,车机播放音频名称“龙的传人”对应的音频、专辑名称“龙龙龙”对应的音频、歌手“龙”对应的音频。
请参考图5,图5为图1中步骤S600的流程示意图,所述在所述若干音频中,根据所述检索结果确定相应的音频的步骤包括:
步骤S610,根据所述对象关键词字母,在所述检索结果中获取匹配结果;
步骤S620,突出显示所述匹配结果。
通过突出显示所述匹配结果,使用户更易看到匹配结果,提升了用户的使用体验。
具体而言,可以通过高亮、放大字体等方式实现对匹配结果的突出显示。
在其他实施例中,在获取匹配结果后,还可以单独显示匹配结果。
请参考图6,图6为图5中步骤S610的流程示意图,所述根据对象关键词字母,在所述检索结果中获取匹配结果的步骤包括:
步骤S611,将所述对象关键词字母和检索结果中的每个音频名称、歌手姓名和专辑名称,转换为预设字符编码对应的对象关键词数据、音频名称数据、歌手姓名数据和专辑名称数据;
步骤S612,根据所述预设字符编码中对于中文和字母的区分规则,将对象关键词数据分别与每个音频名称数据、每个歌手姓名数据和每个专辑名称数据逐字比对,获取所述匹配结果。
为了便于理解,以下以预设字符编码为UTF-8字符集,比较对象关键词数据和1个歌手姓名数据的情况为例进行说明。
在一个实施例中,所述预设字符编码为UTF-8字符集。首先,将对象关键词字母转换为UTF-8字符集对应的对象关键词数据A1,将1个音频名称转换为UTF-8字符集对应的歌手姓名数据B1,并且,将对象关键词数据A1和歌手姓名数据B1统一转换为大写或小写,获取相应的对象关键词数据A2和歌手姓名数据B2。
接着,对象关键词数据A2和歌手姓名数据B2进行若干次循环比较流程,直至完成对象关键词数据A2中最后一位字节的数据的比较。
第n次所述循环比较流程包括:比较对象关键词数据A2的第一个字节和歌手姓名数据B2的第一个字节的数据;根据UTF-8字符集的规则,当歌手姓名数据B2的第一个字节的数据与对象关键词数据A2的第一个字节的数据相同时,歌手姓名数据B2的第一个字节的数据代表字母,此时,将歌手姓名数据B2的第一个字节的数据转换为字母并存储;当第n次循环比较流程中存储的是字母时,自对象关键词数据A2的第一个字节起去除一个字节的数据,形成第n+1次循环比较流程中的对象关键词数据A2,并且,自歌手姓名数据B2的第一个字节起去除一个字节的数据,形成第n+1次循环比较流程中的歌手姓名数据B2;根据UTF-8字符集的规则,当歌手姓名数据B2的第一个字节的数据与对象关键词数据A2的第一个字节的数据不同时,歌手姓名数据B2的前三个字节的数据代表中文,此时,将歌手姓名数据B2的前三个字节的数据转换为中文并存储;当第n次所述循环比较流程中存储的是中文时,自对象关键词数据A2的第一个字节起去除三个字节的数据,形成第n+1次循环比较流程中的对象关键词数据A2,并且,自歌手姓名数据B2的第一个字节起去除三个字节的数据,形成第n+1次循环比较流程中的歌手姓名数据B2。所述n为大于1的自然数。
在一个场景中,对象关键词是“王力”,对象关键词字母是“wangli”,检索结果包括:歌手姓名“王力宏”。此时,所述循环比较流程的次数为2次。第1次循环比较流程存储中文“王”,第二次循环比较流程存储中文“力”。接着,通过所述中文“王”和“力”,在歌手姓名“王力宏”中,获取匹配结果“王力”。
在本实施例中,所述匹配结果包括精确匹配结果和模糊匹配结果中的至少一者,所述精确匹配结果转换的精确匹配结果字母等于所述对象关键词字母,所述模糊匹配结果转换的模糊匹配结果字母包含了所述对象关键词字母。
在一个场景中,对象关键词是“王力”,对象关键词字母是“wangli”,检索结果包括:歌手姓名“王力宏”、歌手姓名“王li宏”、歌手姓名“汪林林”、音频名称“wangling”。此时,匹配结果包括:歌手姓名“王力宏”中的“王力”、歌手姓名“王li宏”中的“王li”、歌手姓名“汪林林”中的“汪林”、音频名称“wanglin”中的“wangli”。其中,歌手姓名“王力宏”中的“王力”、歌手姓名“王li宏”中的“王li”、音频名称“wangling”中的“wangli”为精确匹配结果,相应的,“王力”、“王li”、“wangli”转换的精确匹配结果字母均为“wangli”,该精确匹配结果字母“wangli”等于对象关键词字母“wangli”。同时,歌手姓名“汪林林”中的“汪林”为模糊匹配结果,相应的,“汪林”转换的模糊匹配结果字母为“wanglin”,该模糊匹配结果字母“wanglin”包含了对象关键词字母“wangli”。
相应的,本发明一实施例还提供一种计算机存储介质,存储有包括程序指令的计算机程序,所述程序指令被处理器执行时,执行如上所述的确定音频的方法的步骤。
相应的,本发明一实施例还提供一种电子设备,包括处理器、存储器、通信接口、一个或多个程序,所述通信接口用于获取如上所述的播放列表,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如上所述的方法中的步骤的指令。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (13)

1.一种确定音频的方法,其特征在于,包括以下步骤:
获取播放列表,所述播放列表包括与若干音频对应的音频信息,所述音频信息包括音频名称、歌手姓名和专辑名称中的至少一者;
获取确定音频的语音指令;
识别所述语音指令中的对象关键词,所述对象关键词用于确定所述音频信息;
将所述对象关键词解析为相应的对象关键词字母;
根据对象关键词字母对所述音频信息进行检索,获取检索结果;
在所述若干音频中,根据所述检索结果确定相应的音频。
2.如权利要求1所述的确定音频的方法,所述获取确定音频的语音指令之后,还包括:获取所述语音指令中的动作关键词。
3.如权利要求1所述的确定音频的方法,所述根据对象关键词字母对所述音频信息进行检索,获取检索结果的步骤包括:根据所述音频信息获取音频信息字母;比较所述音频信息字母和所述对象关键词字母,获取检索结果,其中,所述检索结果为包含了所述对象关键词字母的音频信息字母所对应的音频信息。
4.如权利要求3所述的确定音频的方法,所述在所述若干音频中,根据所述检索结果确定相应的音频的方法包括:显示所述检索结果。
5.如权利要求3所述的确定音频的方法,所述在所述若干音频中,根据所述检索结果确定相应的音频的方法包括:播放所述检索结果对应的音频。
6.如权利要求3所述的确定音频的方法,所述根据所述音频信息获取音频信息字母的步骤包括:当所述音频信息为字母时,所述音频信息字母等于所述音频信息;当所述音频信息包括中文时,将所述中文解析为拼音,获取所述音频信息对应的音频信息字母。
7.如权利要求3所述的确定音频的方法,所述在所述若干音频中,根据所述检索结果确定相应的音频的步骤包括:根据所述对象关键词字母,在所述检索结果中获取匹配结果。
8.如权利要求7所述的确定音频的方法,所述匹配结果包括精确匹配结果和模糊匹配结果中的至少一者,所述精确匹配结果转换的精确匹配结果字母等于所述对象关键词字母,所述模糊匹配结果转换的模糊匹配结果字母包含了所述对象关键词字母。
9.如权利要求8所述的确定音频的方法,还包括:突出显示所述匹配结果。
10.如权利要求7至9中的任一项所述的确定音频的方法,所述根据对象关键词字母,在所述检索结果中获取匹配结果的步骤包括:将所述对象关键词字母和检索结果中的每个音频名称、歌手姓名和专辑名称,转换为预设字符编码对应的对象关键词数据、音频名称数据、歌手姓名数据和专辑名称数据;根据所述预设字符编码中对于中文和字母的区分规则,将对象关键词数据分别与每个音频名称数据、每个歌手姓名数据和每个专辑名称数据逐字比对,获取所述匹配结果。
11.如权利要求1所述的确定音频的方法,所述获取播放列表的步骤包括:与外部终端或外部U盘中的至少一者建立连接,其中,与外部U盘建立的连接为有线连接,与外部终端建立的连接包括有线连接或无线连接中的至少一种;当建立有线连接时,读取所述外部终端或外部U盘中的播放列表;当建立无线连接时,确认是否支持读取外部终端、外部终端的音频播放应用中的播放列表;在确认支持读取后,获取来自外部终端的播放列表。
12.一种计算机存储介质,存储有包括程序指令的计算机程序,所述程序指令被处理器执行时,执行如权利要求1至11中任一项所述的确定音频的方法的步骤。
13.一种电子设备,其特征在于,包括处理器、存储器、通信接口、一个或多个程序,所述通信接口用于获取如权利要求1至11中任一项所述的播放列表,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1至11中任一项所述的方法中的步骤的指令。
CN202110388439.6A 2021-04-12 2021-04-12 确定音频的方法、计算机存储介质和电子设备 Pending CN115203466A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110388439.6A CN115203466A (zh) 2021-04-12 2021-04-12 确定音频的方法、计算机存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110388439.6A CN115203466A (zh) 2021-04-12 2021-04-12 确定音频的方法、计算机存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN115203466A true CN115203466A (zh) 2022-10-18

Family

ID=83570772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110388439.6A Pending CN115203466A (zh) 2021-04-12 2021-04-12 确定音频的方法、计算机存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN115203466A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070156410A1 (en) * 2006-01-05 2007-07-05 Luis Stohr Digital audio file search method and apparatus using text-to-speech processing
CN105206274A (zh) * 2015-10-30 2015-12-30 北京奇艺世纪科技有限公司 一种语音识别的后处理方法及装置和语音识别系统
CN106372246A (zh) * 2016-09-20 2017-02-01 深圳市同行者科技有限公司 音频播放方法及其装置
CN107221323A (zh) * 2017-06-05 2017-09-29 北京智能管家科技有限公司 语音点歌方法、终端及存储介质
CN110188171A (zh) * 2019-05-30 2019-08-30 上海联影医疗科技有限公司 一种语音搜索方法、装置、电子设备及存储介质
CN111009240A (zh) * 2019-12-06 2020-04-14 广州易来特自动驾驶科技有限公司 一种语音关键词筛选方法、装置、出行终端、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070156410A1 (en) * 2006-01-05 2007-07-05 Luis Stohr Digital audio file search method and apparatus using text-to-speech processing
CN105206274A (zh) * 2015-10-30 2015-12-30 北京奇艺世纪科技有限公司 一种语音识别的后处理方法及装置和语音识别系统
CN106372246A (zh) * 2016-09-20 2017-02-01 深圳市同行者科技有限公司 音频播放方法及其装置
CN107221323A (zh) * 2017-06-05 2017-09-29 北京智能管家科技有限公司 语音点歌方法、终端及存储介质
CN110188171A (zh) * 2019-05-30 2019-08-30 上海联影医疗科技有限公司 一种语音搜索方法、装置、电子设备及存储介质
CN111009240A (zh) * 2019-12-06 2020-04-14 广州易来特自动驾驶科技有限公司 一种语音关键词筛选方法、装置、出行终端、设备及介质

Similar Documents

Publication Publication Date Title
US20200219483A1 (en) Method and device for performing voice recognition using grammar model
KR101909807B1 (ko) 메시지 입력 방법 및 장치
US20180232203A1 (en) Method for user training of information dialogue system
JP6603754B2 (ja) 情報処理装置
TWI437449B (zh) 多重模式輸入方法及輸入方法編輯器系統
US20090144051A1 (en) Method of providing personal dictionary
CN101467142A (zh) 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法
US20160055763A1 (en) Electronic apparatus, pronunciation learning support method, and program storage medium
CN110910903B (zh) 语音情绪识别方法、装置、设备及计算机可读存储介质
US20170372695A1 (en) Information providing system
CN107832035B (zh) 一种智能终端的语音输入方法
CN109326284A (zh) 语音搜索的方法、装置和存储介质
US20240079002A1 (en) Minutes of meeting processing method and apparatus, device, and medium
CN112004145A (zh) 节目广告跳过处理方法、装置、电视及系统
US8352278B2 (en) Methods and systems for resolving the incompatibility of media items playable from a vehicle
JP2012168349A (ja) 音声認識システムおよびこれを用いた検索システム
WO2012144525A1 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN115203466A (zh) 确定音频的方法、计算机存储介质和电子设备
US20240096347A1 (en) Method and apparatus for determining speech similarity, and program product
KR102492008B1 (ko) 회의록 관리 방법 및 장치
CN110428668B (zh) 一种数据提取方法、装置、计算机系统及可读存储介质
CN113761865A (zh) 声文重对齐及信息呈现方法、装置、电子设备和存储介质
CN112905838A (zh) 信息检索方法和装置、存储介质和电子设备
EP3940695A1 (en) Editing support program, editing support method, and editing support device
DE102019007797B4 (de) Abgleichen von Stimmbefehlen während des Testens von stimmunterstützten App-Prototypen für Sprachen mit nichtphonetischen Alphabeten

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination