CN107452408A - 一种音频播放方法及装置 - Google Patents

一种音频播放方法及装置 Download PDF

Info

Publication number
CN107452408A
CN107452408A CN201710623584.1A CN201710623584A CN107452408A CN 107452408 A CN107452408 A CN 107452408A CN 201710623584 A CN201710623584 A CN 201710623584A CN 107452408 A CN107452408 A CN 107452408A
Authority
CN
China
Prior art keywords
audio
target
mark
sub
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710623584.1A
Other languages
English (en)
Other versions
CN107452408B (zh
Inventor
王文斌
曾令江
包振毅
李承敏
叶巧莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu sound play Culture Communication Co.,Ltd.
Original Assignee
Shanghai Yude Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yude Technology Co Ltd filed Critical Shanghai Yude Technology Co Ltd
Priority to CN201710623584.1A priority Critical patent/CN107452408B/zh
Publication of CN107452408A publication Critical patent/CN107452408A/zh
Application granted granted Critical
Publication of CN107452408B publication Critical patent/CN107452408B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种音频播放方法及装置。其中方法包括:获取预设音频文件中的至少一个声纹特征信息;根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识;根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。本发明实施例解决了音频文件不可检索的问题,实现了对音频文件的快速标记和检索,便于用户根据播放节点标识选择播放内容。

Description

一种音频播放方法及装置
技术领域
本发明实施例涉及声纹识别技术,尤其涉及一种音频播放方法及装置。
背景技术
随着智能终端设备的不断发展,越来越多的智能终端设备具备录音功能,也使得越来越多的用户在不同的场所使用录音功能,收录想要反复倾听的语音内容。
但是音频文件不同于文档或者视频文件,不能显示文字或图像,仅是随时间变化的波形频谱,不能通过人眼识别的方式选择播放节点,也无法根据用户需求自动筛选播放节点,只能通过按照时间依次倾听的方式或者猜测时间点的形式尝试寻找用户想要重复倾听的内容。录制的音频文件时不能根据用户喜好或需求,有目的性的收录,导致音频文件中包含了大量的不必要的内容,反复倾听时会浪费大量的时间。
发明内容
本发明提供一种音频播放方法及装置,以实现根据用户需求自动确定音频播放节点。
第一方面,本发明实施例提供了一种音频播放方法,其中该方法包括:
获取预设音频文件中的至少一个声纹特征信息;
根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识;
根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。
进一步的,不同的声纹特征信息对应不同的播放节点标。
进一步的,根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识,包括:
于所述预设音频文件中识别与所述声纹特征信息匹配的音频脉冲;
根据相邻音频脉冲的间隔时间设置所述播放节点标识。
进一步的,根据相邻音频脉冲的间隔时间设置所述播放节点标识,包括:
根据所述音频脉冲的时间信息依次确定相邻音频脉冲的间隔时间;
若间隔时间小于预设阈值,则确定所述相邻音频脉冲属于同一子音频;
于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识。
进一步的,根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,包括:
获取所述播放指令对应的目标音频位置;
将与所述目标音频位置相邻的播放起始标识确定为目标播放起始标识,所述目标播放起始标识对应的时间点小于所述目标音频位置对应的时间点;
将与所述目标音频位置相邻的播放终止标识确定为目标播放终止标识,所述目标播放终止标识对应的时间点大于所述目标音频位置对应的时间点。
进一步的,在于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识之后,还包括:
记录各所述播放起始标识和各所述播放终止标识对应的时间信息;
形成所述声纹特征信息匹配的时间文件。
进一步的,根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,包括:
于所述时间文件中确定所述目标音频位置所在子音频的起始时间和终止时间;
将所述起始时间和终止时间对应的播放节点标识确定为目标播放节点标识。
进一步的,在根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识之后,还包括:
根据所述播放节点标识,筛选与所述声纹特征信息匹配的至少一个子音频;
将至少一个子音频根据时间信息进行拼接,形成目标子音频文件。
第二方面,本发明实施例还提供了一种音频播放装置,该装置包括:
声纹信息获取模块,用于获取预设音频文件中的至少一个声纹特征信息;
标识设置模块,用于根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识;
音频播放模块,用于根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。
进一步的,不同的声纹特征信息对应不同的播放节点标。
进一步的,所述标识设置模块包括:
音频脉冲识别单元,用以于所述预设音频文件中识别与所述声纹特征信息匹配的音频脉冲;
标识设置单元,用于根据相邻音频脉冲的间隔时间设置所述播放节点标识。
进一步的,所述标识设置单元包括:
间隔时间确定子单元,用于根据所述音频脉冲的时间信息依次确定相邻音频脉冲的间隔时间;
子音频确定子单元,用于若间隔时间小于预设阈值,则确定所述相邻音频脉冲属于同一子音频;
标识设置子单元,用以于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识。
进一步的,所述音频播放模块具体用于:
获取所述播放指令对应的目标音频位置;
将与所述目标音频位置相邻的播放起始标识确定为目标播放起始标识,所述目标播放起始标识对应的时间点小于所述目标音频位置对应的时间点;
将与所述目标音频位置相邻的播放终止标识确定为目标播放终止标识,所述目标播放终止标识对应的时间点大于所述目标音频位置对应的时间点。
进一步的,所述标识设置单元还包括:
时间信息记录子单元,用以在于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识之后,记录各所述播放起始标识和各所述播放终止标识对应的时间信息;
时间文件形成子单元,用于形成所述声纹特征信息匹配的时间文件。
进一步的,所述音频播放模块包括:
时间信息读取单元,用以于所述时间文件中确定所述目标音频位置所在子音频的起始时间和终止时间;
播放节点标识确定单元,用于将所述起始时间和终止时间对应的播放节点标识确定为目标播放节点标识。
进一步的,所述装置还包括:
子音频筛选模块,用于在根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识之后,根据所述播放节点标识,筛选与所述声纹特征信息匹配的至少一个子音频;
子音频文件形成模块,用于将至少一个子音频根据时间信息进行拼接,形成目标子音频文件。
本发明实施例通过识别预设音频文件中的声纹特征信息,并在预设音频文件中对与声纹特征信息相匹配的子音频进行标识,设置播放节点标识,解决了音频文件不可检索的问题,实现了对音频文件的快速标记和检索,便于用户根据播放节点标识选择播放内容。
附图说明
图1是本发明实施例一提供的一种音频播放方法的流程图;
图2为本发明实施例一提供的音频播放示意图;
图3是本发明实施例二提供的一种音频播放方法的流程图;
图4是本发明实施例三提供的一种音频播放装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种音频播放方法的流程图,本实施例可适用于根据用户需求自动确定音频播放节点的情况,该方法可以由本发明实施例提供一种音频播放装置来执行,该装置了采用软件和/或硬件的方式实现。参见图1,该方法具体包括:
S110、获取预设音频文件中的至少一个声纹特征信息。
其中,声纹特征信息是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。
示例性的,可以是通过遍历预设音频文件,识别预设音频文件中包含的至少一个声纹特征信息,还可以是通过预设音频信息确定声纹特征信息。可选的,对每一个声纹特征信息设置对应的身份标识。
S120、根据至少一个声纹特征信息于预设音频文件中设置播放节点标识。
本实施例中,在预设音频文件中进行声纹特征信息匹配,遍历预设音频文件读取与声纹特征信息相匹配的子音频,其中,同一子音频中的语音信息对应同一声纹特征信息。对各子音频设置播放节点标识,用于区分子音频对应的不同声纹特征信息。可选的,不同的声纹特征信息对应不同的播放节点标识。其中,播放节点标识可以是与音频发声者的身份标识匹配。可选的,在预设音频文件中将不同声纹特征信息对应的子音频区别显示。示例性的,参见图2,图2为本发明实施例一提供的音频播放示意图。图2中音频文件中包含两个不同的声纹特征信息,对音频文件进行声纹特征信息匹配,确定四个子音频,其中,第一子音频和第三子音频对应身份标识A,第二子音频和第三子音频对应身份标识B,且对各子音频设置播放节点标识,便于根据播放指令选择对应的子音频进行播放。
本实施例中,通过根据声纹特征信息对预设音频文件进行匹配,并设置播放节点标识,实现了将对应不同声纹特征信息的子音频进行标记和检索,便于用户确定子音频对应的发声者,并根据发声者的身份信息选择子音频进行播放,达到了选择目标人物的语音信息的效果。
S130、根据播放指令确定目标音频位置,确定与目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。
其中,播放指令可以是通过用户触控点选的方式生成,也可以是接收用户语音信息或者输入文字信息的方式生成。
本实施例中,可以是根据目标音频位置确定对应的子音频,将该子音频对应的播放节点标识确定为目标播放节点标识,并对该子音频进行播放。
本实施例中,可选的,设置第一播放模式和第二播放模式。其中,第一播放模式用于将目标音频位置对应的音频时间点为播放起点,进行音频播放。第二播放模式用于根据目标音频位置确定对应的子音频,播放该子音频对应的音频内容。
本实施例的技术方案,通过识别预设音频文件中的声纹特征信息,并在预设音频文件中对与声纹特征信息相匹配的子音频进行标识,设置播放节点标识,解决了音频文件不可检索的问题,实现了对音频文件的快速标记和检索,便于用户根据播放节点标识选择播放内容。
在上述实施例的基础上,步骤S120之后还包括:
根据播放节点标识,筛选与声纹特征信息匹配的至少一个子音频;
将至少一个子音频根据时间信息进行拼接,形成目标子音频文件。
本实施例中,播放节点标识与身份标识匹配,即将具有相同身份标识的至少一个子音频进行时序拼接,形成与身份标识匹配的目标子音频文件。其中目标子音频文件可以是一个或多个。
本实施例中,将具有相同声纹特征信息的子音频组合拼接,实现了根据身份信息对音频文件进行筛选,达到了“只听一人声音”的效果。
示例性的,音频文件包括但不限于授课音频、会议音频和讲座音频等。目标子音频文件可以是会议授课老师或者主讲人的子音频的合集,提高了用户播放音频内容的针对性,减少了播放非相关内容的时间浪费。
实施例二
图3是本发明实施例二提供的一种音频播放方法的流程图,在上述实施例的基础上,进一步的提供了根据至少一个声纹特征信息于预设音频文件中设置播放节点标识的方法。相应的,该方法具体包括:
S210、获取预设音频文件中的至少一个声纹特征信息。
S220、于预设音频文件中识别与声纹特征信息匹配的音频脉冲。
其中,音频脉冲为预设数量的连续的音频波形。
S230、根据相邻音频脉冲的间隔时间设置播放节点标识。
本实施例中,相邻音频脉冲指的是根据声纹特征信息匹配,筛选出的多个具有相同声纹特征信息的位置相邻音频脉冲。若相邻音频脉冲的间隔时间满足预设条件,则设置相同的同一播放节点标识;若相邻音频脉冲的间隔时间不满足预设条件,则设置相同的不同的播放节点标识。
可选的,步骤S230包括:根据音频脉冲的时间信息依次确定相邻音频脉冲的间隔时间;若间隔时间小于预设阈值,则确定相邻音频脉冲属于同一子音频;于子音频的起始时间点设置播放起始标识,于子音频的终止时间点设置播放终止标识。
本实施例中,播放节点标识包括播放起始标识和播放终止标识。其中,播放起始标识和播放终止标识可以是相同或不同。播放起始标识用于表征子音频的播放起始时间点,播放终止标识用于表征子音频的播放终止时间点。
本实施例中,预设阈值可根据用户需求设置,例如可以是3s。
S240、根据播放指令确定目标音频位置,确定与目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。
可选的,步骤S240包括:
获取播放指令对应的目标音频位置;
将与目标音频位置相邻的播放起始标识确定为目标播放起始标识,目标播放起始标识对应的时间点小于目标音频位置对应的时间点;
将与目标音频位置相邻的播放终止标识确定为目标播放终止标识,目标播放终止标识对应的时间点大于目标音频位置对应的时间点。
本实施例中,获取目标音频位置的时间点,筛选与该时间点前后相邻的两个播放节点标识,并将小于目标音频位置对应的时间点的播放节点标识确定为目标播放起始标识,将大于目标音频位置对应的时间点的播放节点标识确定为目标播放终止标识。
可选的,确定目标音频位置的时间点对应的子音频,将该子音频的播放起始标识确定为目标播放起始标识,将该子音频的播放终止标识确定为目标播放终止标识。
本实施例中,播放与目标播放节点标识相对应的音频信息指的是播放目标播放起始标识和目标播放终止标识对应时间范围内的音频信息。
可选的,在步骤S230之后,及步骤S240之前,包括:记录各播放起始标识和各播放终止标识对应的时间信息;形成声纹特征信息匹配的时间文件。
本实施例中,记录并存储与声纹特征信息相匹配的多个子音频的起始时间信息和终止时间信息,以及各子音频的播放时间范围,形成时间文件,实现了对各声纹特征信息相匹配的多个子音频的时间标记及快速读取。
相应的,步骤S240包括:于时间文件中确定目标音频位置所在子音频的起始时间和终止时间;将起始时间和终止时间对应的播放节点标识确定为目标播放节点标识。
本实施例中,当获取播放指令时,调用时间文件并读取目标音频位置对应的时间点,在时间文件中对该时间点进行匹配,确定该时间点所在的播放时间范围对应的子音频,识别该子音频对应的目标播放节点标识,读取该子音频的起始时间和终止时间,播放该子音频对应的音频内容。
本实施例中,通过设置预设音频文件的各子音频的时间文件,并根据播放指令快速确定音频播放节点,实现了对音频文件的标记和检索,达到了根据用户需求播放目标音频的效果。
本实施例的技术方案,通过识别预设音频文件中的声纹特征信息,并在预设音频文件中对与声纹特征信息相匹配的子音频进行标识,对具有相同声纹特征信息的子音频进行筛选,并设置播放节点标识,解决了音频文件不可检索的问题,实现了对音频文件的快速标记和检索,便于用户根据播放节点标识选择播放内容。
实施例三
图4是本发明实施例三提供的一种音频播放装置的结构示意图,该装置具体包括:
声纹信息获取模块310,用于获取预设音频文件中的至少一个声纹特征信息;
标识设置模块320,用于根据至少一个声纹特征信息于预设音频文件中设置播放节点标识;
音频播放模块330,用于根据播放指令确定目标音频位置,确定与目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。
可选的,不同的声纹特征信息对应不同的播放节点标。
可选的,标识设置模块320包括:
音频脉冲识别单元,用以于预设音频文件中识别与声纹特征信息匹配的音频脉冲;
标识设置单元,用于根据相邻音频脉冲的间隔时间设置播放节点标识。
可选的,标识设置单元包括:
间隔时间确定子单元,用于根据音频脉冲的时间信息依次确定相邻音频脉冲的间隔时间;
子音频确定子单元,用于若间隔时间小于预设阈值,则确定相邻音频脉冲属于同一子音频;
标识设置子单元,用以于子音频的起始时间点设置播放起始标识,于子音频的终止时间点设置播放终止标识。
可选的,音频播放模块330具体用于:
获取播放指令对应的目标音频位置;
将与目标音频位置相邻的播放起始标识确定为目标播放起始标识,目标播放起始标识对应的时间点小于目标音频位置对应的时间点;
将与目标音频位置相邻的播放终止标识确定为目标播放终止标识,目标播放终止标识对应的时间点大于目标音频位置对应的时间点。
可选的,标识设置单元还包括:
时间信息记录子单元,用以在于子音频的起始时间点设置播放起始标识,于子音频的终止时间点设置播放终止标识之后,记录各播放起始标识和各播放终止标识对应的时间信息;
时间文件形成子单元,用于形成声纹特征信息匹配的时间文件。
可选的,音频播放模块330包括:
时间信息读取单元,用以于时间文件中确定目标音频位置所在子音频的起始时间和终止时间;
播放节点标识确定单元,用于将起始时间和终止时间对应的播放节点标识确定为目标播放节点标识。
可选的,装置还包括:
子音频筛选模块,用于在根据至少一个声纹特征信息于预设音频文件中设置播放节点标识之后,根据播放节点标识,筛选与声纹特征信息匹配的至少一个子音频;
子音频文件形成模块,用于将至少一个子音频根据时间信息进行拼接,形成目标子音频文件。
本发明实施例提供的音频播放装置可执行本发明任意实施例所提供的音频播放方法,具备执行音频播放方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种音频播放方法,其特征在于,包括:
获取预设音频文件中的至少一个声纹特征信息;
根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识;
根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。
2.根据权利要求1所述的方法,其特征在于,不同的声纹特征信息对应不同的播放节点标。
3.根据权利要求2所述的方法,其特征在于,根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识,包括:
于所述预设音频文件中识别与所述声纹特征信息匹配的音频脉冲;
根据相邻音频脉冲的间隔时间设置所述播放节点标识。
4.根据权利要求3所述的方法,其特征在于,根据相邻音频脉冲的间隔时间设置所述播放节点标识,包括:
根据所述音频脉冲的时间信息依次确定相邻音频脉冲的间隔时间;
若间隔时间小于预设阈值,则确定所述相邻音频脉冲属于同一子音频;
于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识。
5.根据权利要求4所述的方法,其特征在于,根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,包括:
获取所述播放指令对应的目标音频位置;
将与所述目标音频位置相邻的播放起始标识确定为目标播放起始标识,所述目标播放起始标识对应的时间点小于所述目标音频位置对应的时间点;
将与所述目标音频位置相邻的播放终止标识确定为目标播放终止标识,所述目标播放终止标识对应的时间点大于所述目标音频位置对应的时间点。
6.根据权利要求4所述的方法,其特征在于,在于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识之后,还包括:
记录各所述播放起始标识和各所述播放终止标识对应的时间信息;
形成所述声纹特征信息匹配的时间文件。
7.根据权利要求6所述的方法,其特征在于,根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,包括:
于所述时间文件中确定所述目标音频位置所在子音频的起始时间和终止时间;
将所述起始时间和终止时间对应的播放节点标识确定为目标播放节点标识。
8.根据权利要求1-4任一所述的方法,其特征在于,在根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识之后,还包括:
根据所述播放节点标识,筛选与所述声纹特征信息匹配的至少一个子音频;
将至少一个子音频根据时间信息进行拼接,形成目标子音频文件。
9.一种音频播放装置,其特征在于,包括:
声纹信息获取模块,用于获取预设音频文件中的至少一个声纹特征信息;
标识设置模块,用于根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识;
音频播放模块,用于根据播放指令确定目标音频位置,确定与所述目标音频位置相匹配的目标播放节点标识,并播放相应音频信息。
10.根据权利要求9所述的装置,其特征在于,不同的声纹特征信息对应不同的播放节点标。
11.根据权利要求10所述的装置,其特征在于,所述标识设置模块包括:
音频脉冲识别单元,用以于所述预设音频文件中识别与所述声纹特征信息匹配的音频脉冲;
标识设置单元,用于根据相邻音频脉冲的间隔时间设置所述播放节点标识。
12.根据权利要求11所述的装置,其特征在于,所述标识设置单元包括:
间隔时间确定子单元,用于根据所述音频脉冲的时间信息依次确定相邻音频脉冲的间隔时间;
子音频确定子单元,用于若间隔时间小于预设阈值,则确定所述相邻音频脉冲属于同一子音频;
标识设置子单元,用以于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识。
13.根据权利要求12所述的装置,其特征在于,所述音频播放模块具体用于:
获取所述播放指令对应的目标音频位置;
将与所述目标音频位置相邻的播放起始标识确定为目标播放起始标识,所述目标播放起始标识对应的时间点小于所述目标音频位置对应的时间点;
将与所述目标音频位置相邻的播放终止标识确定为目标播放终止标识,所述目标播放终止标识对应的时间点大于所述目标音频位置对应的时间点。
14.根据权利要求12所述的装置,其特征在于,所述标识设置单元还包括:
时间信息记录子单元,用以在于所述子音频的起始时间点设置播放起始标识,于所述子音频的终止时间点设置播放终止标识之后,记录各所述播放起始标识和各所述播放终止标识对应的时间信息;
时间文件形成子单元,用于形成所述声纹特征信息匹配的时间文件。
15.根据权利要求14所述的装置,其特征在于,所述音频播放模块包括:
时间信息读取单元,用以于所述时间文件中确定所述目标音频位置所在子音频的起始时间和终止时间;
播放节点标识确定单元,用于将所述起始时间和终止时间对应的播放节点标识确定为目标播放节点标识。
16.根据权利要求9-12任一所述的装置,其特征在于,所述装置还包括:
子音频筛选模块,用于在根据所述至少一个声纹特征信息于所述预设音频文件中设置播放节点标识之后,根据所述播放节点标识,筛选与所述声纹特征信息匹配的至少一个子音频;
子音频文件形成模块,用于将至少一个子音频根据时间信息进行拼接,形成目标子音频文件。
CN201710623584.1A 2017-07-27 2017-07-27 一种音频播放方法及装置 Active CN107452408B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710623584.1A CN107452408B (zh) 2017-07-27 2017-07-27 一种音频播放方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710623584.1A CN107452408B (zh) 2017-07-27 2017-07-27 一种音频播放方法及装置

Publications (2)

Publication Number Publication Date
CN107452408A true CN107452408A (zh) 2017-12-08
CN107452408B CN107452408B (zh) 2020-09-25

Family

ID=60489599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710623584.1A Active CN107452408B (zh) 2017-07-27 2017-07-27 一种音频播放方法及装置

Country Status (1)

Country Link
CN (1) CN107452408B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036377A (zh) * 2018-07-26 2018-12-18 中国银联股份有限公司 一种语音合成方法及装置
WO2020098816A3 (en) * 2019-11-29 2020-10-15 Alipay (Hangzhou) Information Technology Co., Ltd. Methods and devices for storing and managing audio data on blockchain

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103035247A (zh) * 2012-12-05 2013-04-10 北京三星通信技术研究有限公司 基于声纹信息对音频/视频文件进行操作的方法及装置
CN103165131A (zh) * 2011-12-17 2013-06-19 富泰华工业(深圳)有限公司 语音处理系统及语音处理方法
CN106297843A (zh) * 2016-08-04 2017-01-04 周奇 一种录音标记显示方法及装置
CN106448683A (zh) * 2016-09-30 2017-02-22 珠海市魅族科技有限公司 查看多媒体文件中录音的方法及装置
CN106548793A (zh) * 2015-09-16 2017-03-29 中兴通讯股份有限公司 存储和播放音频文件的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103165131A (zh) * 2011-12-17 2013-06-19 富泰华工业(深圳)有限公司 语音处理系统及语音处理方法
CN103035247A (zh) * 2012-12-05 2013-04-10 北京三星通信技术研究有限公司 基于声纹信息对音频/视频文件进行操作的方法及装置
CN106548793A (zh) * 2015-09-16 2017-03-29 中兴通讯股份有限公司 存储和播放音频文件的方法和装置
CN106297843A (zh) * 2016-08-04 2017-01-04 周奇 一种录音标记显示方法及装置
CN106448683A (zh) * 2016-09-30 2017-02-22 珠海市魅族科技有限公司 查看多媒体文件中录音的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109036377A (zh) * 2018-07-26 2018-12-18 中国银联股份有限公司 一种语音合成方法及装置
WO2020098816A3 (en) * 2019-11-29 2020-10-15 Alipay (Hangzhou) Information Technology Co., Ltd. Methods and devices for storing and managing audio data on blockchain
US11120075B2 (en) 2019-11-29 2021-09-14 Alipay (Hangzhou) Information Technology Co., Ltd. Methods and devices for storing and managing audio data on blockchain
US11392638B2 (en) 2019-11-29 2022-07-19 Alipay (Hangzhou) Information Technology Co., Ltd. Methods and devices for storing and managing audio data on blockchain

Also Published As

Publication number Publication date
CN107452408B (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
US10964298B2 (en) Network musical instrument
US20100298959A1 (en) Speech reproducing method, speech reproducing device, and computer program
US10971125B2 (en) Music synthesis method, system, terminal and computer-readable storage medium
CN108242238B (zh) 一种音频文件生成方法及装置、终端设备
CN108810446A (zh) 一种视频会议的标签生成方法、装置、设备和介质
CN104123115A (zh) 一种音频信息处理方法及电子设备
US20120164617A1 (en) Adaptable audio instruction system and method
CN108847215A (zh) 基于用户音色进行语音合成的方法及装置
CN104867494B (zh) 一种录音文件的命名分类方法及系统
CN110070847B (zh) 乐音测评方法及相关产品
CN107481735A (zh) 一种转换音频发声的方法、服务器及计算机可读存储介质
JP2003177784A (ja) 音響変節点抽出装置及びその方法、音響再生装置及びその方法、音響再生システム、音響配信システム、情報提供装置、音響信号編集装置、音響変節点抽出方法プログラム記録媒体、音響再生方法プログラム記録媒体、音響信号編集方法プログラム記録媒体、音響変節点抽出方法プログラム、音響再生方法プログラム、音響信号編集方法プログラム
CN107452408A (zh) 一种音频播放方法及装置
CN109584859A (zh) 语音合成方法及装置
CN110797001B (zh) 电子书语音音频的生成方法、装置及可读存储介质
CN106327949A (zh) 一种音乐节奏训练方法与装置
CN110956870A (zh) 一种视唱练耳教学方法及装置
CN102142271B (zh) 同步显示波形的手持式多媒体播放器与复读方法
JP2006178334A (ja) 語学学習システム
CN109688430A (zh) 一种法院庭审文件回放方法、系统及存储介质
CN112908302B (zh) 一种音频处理方法、装置、设备及可读存储介质
Reyes To know beyond listening: Monitoring digital music
CN108777804A (zh) 媒体播放方法及装置
Zinser Sound, Syntax, and Space in Studio-Produced Popular Music
CN111429878A (zh) 一种自适应语音合成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200515

Address after: 750021 No.2 Shuangyong street, Xixia District, Yinchuan City, Ningxia Hui Autonomous Region

Applicant after: Zhao Chengzhi

Address before: 200233, Shanghai, Jinshan District Jinshan Industrial Zone, Ting Wei highway 65584, room 1309

Applicant before: SHANGHAI WIND SCIENCE AND TECHNOLOGIES Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200810

Address after: No.5, 9 / F, building 4, No.51, South Section 4, 2nd Ring Road, Wuhou District, Chengdu, Sichuan 610000

Applicant after: Chengdu sound play Culture Communication Co.,Ltd.

Address before: 750021 No.2 Shuangyong street, Xixia District, Yinchuan City, Ningxia Hui Autonomous Region

Applicant before: Zhao Chengzhi

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: No. 2110, Unit 2, Building 1, No. 219 Jiaozi Avenue, High tech Zone, Chengdu, Sichuan Province, 610000

Patentee after: Chengdu sound play Culture Communication Co.,Ltd.

Address before: No.5, floor 9, building 4, No.51, South 4th section of 2nd Ring Road, Wuhou District, Chengdu, Sichuan 610000

Patentee before: Chengdu sound play Culture Communication Co.,Ltd.

CP02 Change in the address of a patent holder