CN110134819B - 一种语音音频筛选系统 - Google Patents

一种语音音频筛选系统 Download PDF

Info

Publication number
CN110134819B
CN110134819B CN201910339618.3A CN201910339618A CN110134819B CN 110134819 B CN110134819 B CN 110134819B CN 201910339618 A CN201910339618 A CN 201910339618A CN 110134819 B CN110134819 B CN 110134819B
Authority
CN
China
Prior art keywords
audio
voice
voice audio
playing
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910339618.3A
Other languages
English (en)
Other versions
CN110134819A (zh
Inventor
王健
苏战
王鑫
刘卫平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zib Artificial Intelligence Technology Co ltd
Original Assignee
Guangzhou Zib Artificial Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Zib Artificial Intelligence Technology Co ltd filed Critical Guangzhou Zib Artificial Intelligence Technology Co ltd
Priority to CN201910339618.3A priority Critical patent/CN110134819B/zh
Publication of CN110134819A publication Critical patent/CN110134819A/zh
Application granted granted Critical
Publication of CN110134819B publication Critical patent/CN110134819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种语音音频筛选系统,包括:分析模块,用于对目标语音音频的语音特征进行分析,获得目标语音音频的语音特征;获取模块,用于获取第一语音音频,并分析第一语音音频的语音特征;对比模块,用于比对第一语音音频的语音特征与目标语音音频的语音特征,当二者的比对结果满足预设条件时确定第一语音音频为可选语音音频;本语音音频筛选系统能根据用户选择的目标语音音频筛选出符合要求的第一语音音频,便于用户筛选出符合某一部分听众喜好的第一语音音频。

Description

一种语音音频筛选系统
技术领域
本发明涉及筛选音频技术领域,特别涉及一种语音音频筛选系统。
背景技术
音频筛选系统是从若干输入的音频中选择符合用户需求的音频,输入的音频可以是人们发出的语音,输入的音频可以是和用户预先设置的参数进行对比,也可以是用户预先选择一目标音频,使得输入的音频与该目标音频进行对比,从而根据预设条件判断输入的音频是否符合用户的需求,最终筛选出符合用户需求的音频。
发明内容
本发明提供一种语音音频筛选系统,用以根据用户选择的目标语音音频筛选出符合要求的第一语音音频,便于用户筛选出符合某一部分听众喜好的第一语音音频。
为解决上述技术问题,本发明提出了一种语音音频筛选系统,包括:
分析模块,用于对用户喜欢的目标语音音频的音频特征进行分析,获得所述目标语音音频的音频特征;
获取模块,用于获取第一语音音频,并分析所述第一语音音频的音频特征;
对比模块,用于比对所述第一语音音频的音频特征与所述目标语音音频的音频特征,当二者的比对结果满足预设条件时确定所述第一语音音频为可选语音音频。
进一步,比对所述第一语音音频的音频特征与所述目标语音音频的音频特征,当二者的比对结果满足预设条件时确定所述第一语音音频为可选语音音频,具体步骤包括;
确定所述第一语音音频对应的第一语音音频特征矩阵,通过以下公式(1),对第一语音音频进行综合打分:
Figure BDA0002040305720000021
其中F为第一语音音频的综合得分,(Y1 Y2 … Yn)为第一语音音频特征矩阵,其中Yi为第一语音音频的第i个特征的值,(y1 y2 … yn)为目标语音音频的音频特征矩阵,yi为目标语音音频的第i个特征的值,i=1、2、3,…..n,且相同的i所对应的特征为同一类别的特征,
Figure BDA0002040305720000022
为需求解的用户操作矩阵C;
在求解用户操作矩阵C时,首先构建一个用户数据库,该用户数据库中有j条记录,每条记录中都包含有所述n个特征对应的值,形成特征矩阵B,特征矩阵B为j行n列的一个矩阵,每一行代表一条记录,每一列代表一类特征,然后利用公式(2)对矩阵B中的每一个元素进行标准化;
Figure BDA0002040305720000023
利用公式(2),可以避免矩阵B中出现某个值过大或者过小,导致的计算结果出现误差,同时避免出现矩阵B中单位对结果可能带来的差异;
其中bst为矩阵B中的第s行第t列的值,其中s=1、2、3……j,t=1、2、3……n,
Figure BDA0002040305720000024
为bst标准化后的值,
Figure BDA0002040305720000025
为第t列的均值,σt为第t列的方差,对于每一个bst都会通过标准化得到相应的
Figure BDA0002040305720000026
从而可以得到一个新的矩阵B*,为了得到矩阵B*每一列之间的相关性,需要求解矩阵B*中每一列的协方差,形成新的矩阵Cov
Figure BDA0002040305720000031
其中
Figure BDA0002040305720000032
为矩阵B*的第i列和第x列之间的协方差,i=1、2、3……n,x=1、2、3……n;对协方差进行求解,可以很明确的得到任意两个指标之间的相关性,在后面求解的时候去除信息的冗余;
然后利用公式(3)求解协方差矩阵Cov的特征值和特征向量:
|Cov-λE|=0
(3)
其中Cov为协方差矩阵,E为单位矩阵,所求解出来的λ则为所需的特征向量的值,将所求解的最大特征值λ0带入特征方程式,得出相应的基础解系,则该基础解系的值就为求解的用户操作矩阵C,
Figure BDA0002040305720000033
对矩阵进行特征值的求解能够保证矩阵是正交的,在计算时不会出现无解的情况,同时也不会出现冗余信息;通过公式(3)所求解的用户操作矩阵为计算机根据数据库中数据所求解出来,可以使用户操作矩阵的比直接用户直接定义更有说服力;
通过算式(1)可以看出求解的用户操作矩阵C和语音特征均会影响到打分的数值,将前述利用公式(1)得到的对第一语音音频的综合打分代入如下公式(4):
min(|F-F1|,|F-F2|,|F-F3|,…,|F-Fm|)
(4)
其中,Fi为语音数据库中,所述用户针对第i个预设语音音频的综合打分,所述i=1、2、3……m;所述语音数据库中还存储了所述用户对所述第i个预设语音音频是否为用户所喜欢的语音音频进行了标注;
然后,根据上述公式(4)所得的值所对应的Ft;
在所述语音数据库中,查找所述Ft所述对应的第t个预设语音音频是否为是用户喜欢的语音音频;如果是,则确定所述第一语音音频为可选语音音频;否则,确定所述第一语音音频不是可选语音音频。
在一个实施例中,所述音频特征包括以下参数中的一项或者多项:
停顿时长均值;预设单位时间内的总停顿时长;短时沉默的平均时长;预设单位时间内短时沉默的总时长;平声片段时长均值;预设单位时间内平声片段的总时长;升调片段时长均值;预设单位时间内升调片段的总时长;降调片段时长均值;预设单位时间内降调片段的总时长;平声片段振幅偏移均值;升调片段振幅偏移均值;降调片段振幅偏移均值;预设单位时间内的音调差异和范围;预设单位时间内的音调斜率;音频信号的时频形状和频谱包络样式;以及平声;升调和降调趋势的时间顺序样式。
在一个实施例中,所述分析模块还用于获取目标音频,所述分析模块获取目标音频的方法包括:
所述分析模块接收用户输入的排序规则及所述排序规则对应的第一标识,并存储所述第一标识和排序规则的第一对应关系,其中,所述排序规则用于对第二语音音频进行排序;
所述分析模块接收用户输入的第二语音音频以及所述第二语音音频对应的第二标识,且所述第二标识与第一标识间存在第二对应关系,根据所述第二对应关系查询与所述第二标识匹配的第一标识,根据所述第一对应关系查询与所述第一标识匹配的排序规则,依据查询到排序规则对所述第二语音音频进行排序,生成第一排序列表,所述第一排序列表中包括所述第二语音音频的序列号,所述序列号从1开始;
确定序列号为1的第二语音音频为目标音频。
在一个实施例中,所述分析模块还用于接收用户输入的修改请求,所述修改请求中包括第一标识,用于修改所述排序规则,查询所述修改请求中的第一标识对应的排序规则,依据用户输入的排序规则,对已存储的排序规则进行更新;
存储所述第一标识和排序规则的第一对应关系包括:根据所述排序规则生成排序规则文件,存储所述第一标识和排序规则文件的第一对应关系;
查询与所述第一标识匹配的排序规则包括:查询与所述第一标识匹配的排序规则文件,从所述排序规则文件中读取排序规则。
在一个实施例中,所述分析模块获取目标音频的方法包括:
确定所述分析模块至少存储有一个第二语音音频;
对各所述第二语音音频分别执行:确定所述第二语音音频播放的标准时长、在当前统计周期内的播放总数及在当前统计周期内每一次播放时对应的实际时长;
按照所述至少一个所述第二语音音频分别对应的标准时长、播放总数及每一次播放时对应的实际时长,生成所述第二语音音频的第二排序列表;
所述根据所述至少一个第二语音音频分别对应的标准时长、播放总数及每一次播放时对应的实际时长,生成所述第二语音音频的第二排序列表包括;
针对任意一第二语音音频分别执行:根据所述任意一第二语音音频的播放总数和每一次播放对应的实际时长,确定所述任意一第二语音音频的平均时长;
根据所述平均时长和标准时长,确定所述任意一第二语音音频的播放进度平均值;基于所述至少一个第二语音音频的播放进度平均值,生成所述第二语音音频的第二排序列表;或者,
针对任意一第二语音音频分别执行:在每一次播放时对应的播放时长中,确定实际播放时长与标准时长的差值未达到预设值的播放时长的个数;
根据所述播放时长与标准时长的差值未达到预设值的播放时长的个数与播放总数确定所述任意一第二语音音频的预设进度播放率;根据所述至少一个第二语音音频的预设进度播放率,生成所述第二语音音频的第二排序列表;
所述第二排序列表包括所述第二语音音频的序列号,所述序列号从1开始;
确定序列号为1的第二语音音频为目标音频。
在一个实施例中,所述获取模块中的所述第一语音音频通过加密传输方法传输至所述对比模块,所述加密传输方法包括:
(1)所述获取模块利用一加密算法对第一语音音频进行加密;
(2)所述获取模块对加密后的第一语音音频生成校验码;
(3)所述获取模块将所述加密后的第一语音音频和所述校验码相结合后的信息划分成a个字节;
(4)所述获取模块将所述a个字节转换成所述对比模块根据加密协议能识别的a个字节;
(5)所述获取模块在所述转换后的a个字节的信息之前添加符合加密协议的b个字节的识别信息,便于所述对比模块能区分接收到的信息是否来自所述获取模块;
(6)所述获取模块在所述b个字节的识别信息之前添加p个字节的相关信息,所述p个字节的相关信息包括1个控制键字节和1个保留字节;
(7)所述获取模块将所述符合加密协议的a个字节和所述b个字节的识别信息以及p个字节的相关信息封装成一个完整的符合加密协议的数据包,并发送给所述对比模块;
(8)所述对比模块接收到步骤(7)发出的所述数据包;
(9)所述对比模块根据所述识别信息判断所述数据包是否为所述获取模块发送;
(10)若是所述获取模块发送的,则所述对比模块将接收到的所述数据包的后a个字节进行解码获得一加密后的信息和校验码;
(11)所述对比模块利用所述校验码对所述加密后的信息进行校验;
(12)若校验成功,则所述对比模块对所述加密后的信息进行解密,获得第一语音音频。
在一个实施例中,所述步骤(1)中,所述获取模块对所述第一语音音频的加密方法包括:
所述获取模块获取第一语音音频;
定义所述第一语音音频的数据长度为第一数据长度;
所述语音音频筛选系统还包括一数据库,所述数据库按照预设周期定时更新,从所述数据库中查找数据长度为第二数据长度的密钥信息,且所述第二数据长度大于或等于所述第一数据长度;
将所述第一语音音频划分成K个音频数据块;
将所述密钥信息划分成K个密钥信息数据块;
采用算法确定每个所述音频数据块对应的密钥信息数据块;所述音频数据块与所述密钥信息数据块的数据长度相同;所述算法用于使得所述密钥信息数据块与所述音频数据块之间的对应关系具有不唯一性;
采用所述密钥信息数据块对所述音频数据块进行加密,得到加密后的第一语音音频。
在一个实施例中,所述将所述密钥信息划分成K个密钥信息数据块,具体包括:
当所述密钥信息的第二数据长度大于所述第一数据长度时,从所述密钥信息中截取所述第一数据长度的密钥信息数据段;
获取所述音频数据块的数据长度;
按照所述数据长度,将所述密钥信息数据段划分成K个密钥信息数据块。
在一个实施例中,所述确定每个所述音频数据块对应的密钥信息数据块,具体包括:
采用预设算法确定每个所述音频数据块对应的密钥信息数据块,并且定期变更所述预设算法。
在一个实施例中,所述数据库定时更新方法包括:
根据接收到的预设指令设置批处理文件;以及存储所述批处理文件;
从所述批处理文件中解析出一个或多个批处理文件对象,生成一批处理文件对象列表,其中,所述批处理文件对象中包括批处理文件版本、项目标识组合和批处理文件内容;
遍历所述批处理文件对象列表,从所述批处理文件对象列表的一个或多个批处理文件对象中提取出与所述数据库对应的一个或多个所述批处理文件内容,得到批处理文件执行列表;
根据所述批处理文件执行列表更新所述数据库。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例语音音频筛选系统的框体;
图2为本发明实施例中加密传输方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种语音音频筛选系统,包括:
分析模块,用于对用户喜爱的目标语音音频的音频特征进行分析,获得目标语音音频的音频特征;
获取模块,用于获取第一语音音频,并分析第一语音音频的音频特征;
对比模块,用于比对第一语音音频的音频特征与目标语音音频的音频特征,当二者的比对结果满足预设条件时确定第一语音音频为可选语音音频。
上述技术方案的工作原理:如图1所示,本实施例提出的语音音频筛选系统包括分析模块、获取模块和对比模块,分析模块对目标语音音频进行分析以获得目标语音音频的音频特征,在此目标语音音频为用户选择的优质语音音频,且欲以该优质语音音频为标准选择语音音频;获取模块可以对获取的第一语音音频进行分析,获得第一语音音频的音频特征;对比模块将第一语音音频的音频特征与目标语音音频的音频特征进行对比,且筛选出符合预设条件的第一语音音频,在此符合预设条件的第一语音音频为可选语音音频,即为本语音音频筛选系统筛选出的语音音频。
上述技术方案的有益效果:本语音音频筛选系统能根据用户选择的目标语音音频筛选出符合要求的第一语音音频,便于用户筛选出符合某一部分听众喜好的第一语音音频。
在一个实施例中,音频特征包括以下参数中的一项或者多项:
停顿时长均值;预设单位时间内的总停顿时长;短时沉默的平均时长;预设单位时间内短时沉默的总时长;平声片段时长均值;预设单位时间内平声片段的总时长;升调片段时长均值;预设单位时间内升调片段的总时长;降调片段时长均值;预设单位时间内降调片段的总时长;平声片段振幅偏移均值;升调片段振幅偏移均值;降调片段振幅偏移均值;预设单位时间内的音调差异和范围;预设单位时间内的音调斜率;音频信号的时频形状和频谱包络样式;以及平声;升调和降调趋势的时间顺序样式。
上述技术方案的有益效果:在本实施例中音频特征的参数越多样,则目标语音音频和第一语音音频的分析就更加透彻,更能筛选出满足预设条件的第一语音音频。
在一个实施例中,分析模块还用于获取目标音频,分析模块获取目标音频的方法包括:
分析模块接收用户输入的排序规则及排序规则对应的第一标识,并存储第一标识和排序规则的第一对应关系,其中,排序规则用于对第二语音音频进行排序;
分析模块接收用户输入的第二语音音频以及第二语音音频对应的第二标识,且第二标识与第一标识间存在第二对应关系,根据第二对应关系查询与第二标识匹配的第一标识,根据第一对应关系查询与第一标识匹配的排序规则,依据查询到排序规则对第二语音音频进行排序,生成第一排序列表,第一排序列表中包括第二语音音频的序列号,序列号从1开始;
确定序列号为1的第二语音音频为目标音频。
上述技术方案的工作原理:在本实施例中分析模块能根据用户设置的排序规则对第二语音音频进行排序,分析模块储存有第二语音音频及其对应的第二标识,第二标识与排序规则对应的第一标识具有第二对应关系,第一标识与排序规则之间存在第一对应关系;分析模块根据接收到的第二语音音频及其对应的对应的第二标识通过第二对应关系能匹配到第一标识,该第一标识再通过第一对应关系匹配到排序规则,则第二语音音频根据与该第一标识匹配的排序规则排序生成第一排序列表,该第一排序列表包括各第二语音音频的序列号,该序列号从1开始递增设置,在此选择序列号为1的第二语音音频为目标音频。
上述技术方案的有益效果:本技术方案能根据用户预先设置的排序规则对第二语音音频进行排序,使得第二语音音频按照用户的实际需求准确排序。
在一个实施例中,分析模块还用于接收用户输入的修改请求,修改请求中包括第一标识,用于修改排序规则,查询修改请求中的第一标识对应的排序规则,依据用户输入的排序规则,对已存储的排序规则进行更新;
存储第一标识和排序规则的第一对应关系包括:根据排序规则生成排序规则文件,存储第一标识和排序规则文件的第一对应关系;
查询与第一标识匹配的排序规则包括:查询与第一标识匹配的排序规则文件,从排序规则文件中读取排序规则。
上述技术方案的有益效果:本实施例分析模块接收用户的修改请求后能对排序规则进行修改,使得本系统的排序规则更加多样化,最重要的是排序规则能根据用户的修改请求进行修改,使得最终生成的第一排序列表更加满足用户的需求。
在一个实施例中,分析模块获取目标音频的方法包括:
确定分析模块至少存储有一个第二语音音频;
对各第二语音音频分别执行:确定第二语音音频播放的标准时长、在当前统计周期内的播放总数及在当前统计周期内每一次播放时对应的实际时长;
按照至少一个第二语音音频分别对应的标准时长、播放总数及每一次播放时对应的实际时长,生成第二语音音频的第二排序列表;
根据至少一个第二语音音频分别对应的标准时长、播放总数及每一次播放时对应的实际时长,生成第二语音音频的第二排序列表包括:
针对任意一第二语音音频分别执行:根据任意一第二语音音频的播放总数和每一次播放对应的实际时长,确定任意一第二语音音频的平均时长;
根据平均时长和标准时长,确定任意一第二语音音频的播放进度平均值;
基于至少一个第二语音音频的播放进度平均值,生成第二语音音频的第二排序列表;或者,
针对任意一第二语音音频分别执行:在每一次播放时对应的播放时长中,确定实际播放时长与标准时长的差值未达到预设值的播放时长的个数;
根据播放时长与标准时长的差值未达到预设值的播放时长的个数与播放总数确定任意一第二语音音频的预设进度播放率;根据至少一个第二语音音频的预设进度播放率,生成第二语音音频的第二排序列表;
第二排序列表包括第二语音音频的序列号,序列号从1开始;
确定序列号为1的第二语音音频为目标音频。
上述技术方案的工作原理:在本实施例中通过对多个第二语音音频进行排序生成一第二排序列表,从该第二排序列表中选择序列号为1的第二语音音频为目标音频,在排序时需要各第二语音音频的多种参数:第二语音音频播放的标准时长、在当前统计周期内的播放总数及在当前统计周期内每一次播放时对应的实际时长,在此第二语音音频播放的标准时长为该第二语音音频正常播放完毕所需时长,在当前统计周期内播放总数为在当前统计周期内该第二语音音频播放次数的总数,在当前统计周期内每一次播放时对应的实际时长为在当前统计周期内第二语音音频每次播放的实际播放时长;第一种排序方式:首先根据各第二语音音频在统计周期内的播放总数和每次播放对应的实际时长,确定各第二语音音频的平均时长;其次根据该平均时长和标准时长的差值确定各第二语音音频的播放进度平均值;最终根据各第二语音音频的播放进度平均值生成第二语音音频的第二排序列表;第二种排序方式:首先确定在统计周期内各第二语音音频的实际播放时长与标准时长的差值未达到预设值的个数,在此预设值为用户预设的第二语音音频的实际播放时长和标准时长之间的差值;其次根据该差值与播放总数确定第二语音音频的的预设进度播放率;最后根据各第二语音音频的预设进度播放率对各第二语音音频进行排序,最终生成第二语音音频的第二排序列表;在该第二排序列表中各第二语音音频均有序列号,且序列号从1开始递增设置,在该第二排序列表中选择序列号为1的第二语音音频即为目标音频。
上述技术方案的有益效果:本实施例通过各第二语音音频的各参数进行排序,进而生成的第二排序列表更加具有说服力,更加准确。
在一个实施例中,获取模块中的第一语音音频通过加密传输方法传输至对比模块,加密传输方法包括:
(1)获取模块利用一加密算法对第一语音音频进行加密;
(2)获取模块对加密后的第一语音音频生成校验码;
(3)获取模块将加密后的第一语音音频和校验码相结合后的信息划分成a个字节;
(4)获取模块将a个字节转换成对比模块根据加密协议能识别的a个字节;
(5)获取模块在转换后的a个字节的信息之前添加符合加密协议的b个字节的识别信息,便于对比模块能区分接收到的信息是否来自获取模块;
(6)获取模块在b个字节的识别信息之前添加p个字节的相关信息,p个字节的相关信息包括1个控制键字节和1个保留字节;
(7)获取模块将符合加密协议的a个字节和b个字节的识别信息以及p个字节的相关信息封装成一个完整的符合加密协议的数据包,并发送给对比模块;
(8)对比模块接收到步骤(7)发出的数据包;
(9)对比模块根据识别信息判断数据包是否为获取模块发送;
(10)若是获取模块发送的,则对比模块将接收到的数据包的后a个字节进行解码获得一加密后的信息和校验码;
(11)对比模块利用校验码对加密后的信息进行校验;
(12)若校验成功,则对比模块对加密后的信息进行解密,获得第一语音音频。
上述技术方案的有益效果:如图2所示,在本实施例中,第一语音音频通过加密传输方法从获取模块传输至对比模块,充分保证了第一语音音频在传输过程中的安全性。
在一个实施例中,步骤(1)中,获取模块对第一语音音频的加密方法包括:
获取模块获取第一语音音频;
定义第一语音音频的数据长度为第一数据长度;
语音音频筛选系统还包括一数据库,数据库按照预设周期定时更新,从数据库中查找数据长度为第二数据长度的密钥信息,且第二数据长度大于或等于第一数据长度;
将第一语音音频划分成K个音频数据块;
将密钥信息划分成K个密钥信息数据块;
采用算法确定每个音频数据块对应的密钥信息数据块;音频数据块与密钥信息数据块的数据长度相同;算法用于使得密钥信息数据块与音频数据块之间的对应关系具有不唯一性;
采用密钥信息数据块对音频数据块进行加密,得到加密后的第一语音音频。
上述技术方案的工作原理:本发明实施例中获取模块对第一语音音频的加密方法通过将第一语音音频划分成K个音频数据块;将密钥信息划分成K个密钥信息数据块;确定每个音频数据块对应的密钥信息数据块;采用密钥信息数据块对音频数据块进行加密;可以对第一语音音频中的每个数据块,分别采用不同的密钥进行加密,从而实现一次一密的加密方式。
上述技术方案的有益效果:上述技术方案能增强获取模块获取第一语音音频的安全性。
在一个实施例中,将密钥信息划分成K个密钥信息数据块,具体包括:
当密钥信息的第二数据长度大于第一数据长度时,从密钥信息中截取第一数据长度的密钥信息数据段;
获取音频数据块的数据长度;
按照数据长度,将密钥信息数据段划分成K个密钥信息数据块。
在一个实施例中,确定每个音频数据块对应的密钥信息数据块,具体包括:
采用预设算法确定每个音频数据块对应的密钥信息数据块,并且定期变更预设算法。
上述技术方案的工作原理:在本实施例中对于密钥信息的划分方式与第一语音音频的划分方式相关,当第一语音音频被平均划分成K个音频数据块时,则可以将密钥信息按照同样的数据长度划分成K个密钥信息数据块。
当第一语音音频被非平均地划分成K个音频数据块时,则需要对于各个音频数据块分别确定音频数据块的数据块长度,从密钥信息中截取数据块长度的密钥信息数据块,使得每个音频数据块都有与该音频数据块相对应的数据长度相同的密钥信息数据块。
上述技术方案的有益效果:当每个音频数据块和每个密钥信息数据块的数据长度均相同,所以任意一个密钥信息数据块都可以对音频数据块进行加密,能够进一步提高加密的安全性。
在一个实施例中,数据库定时更新方法包括:
根据接收到的预设指令设置批处理文件;以及存储批处理文件;
从批处理文件中解析出一个或多个批处理文件对象,生成一批处理文件对象列表,其中,批处理文件对象中包括批处理文件版本、项目标识组合和批处理文件内容;
遍历批处理文件对象列表,从批处理文件对象列表的一个或多个批处理文件对象中提取出与数据库对应的一个或多个批处理文件内容,得到批处理文件执行列表;
根据批处理文件执行列表更新数据库。
上述技术方案的工作原理:在本实施例中数据库储存根据预设指令设置的批处理文件,该批处理文件能进一步解析出一个或多个批处理文件对象,生成批处理文件对象列表;从该批处理文件对象列表中提取出与数据库对应的批处理文件内容,进而得到批处理文件执行列表;最后根据批处理文件执行列表对数据库进行更新;项目标识组合包括至少一个项目标识,当项目标识组合中包括当前数据库的项目标识时,即说明项目标识组合对应的脚本内容适用于当前的数据库。
上述技术方案的有益效果:通过本技术方案可以自动解析脚本文件,自动升级多个项目的多个数据库,极大的降低了数据库升级实施的复杂程度以及系统部署和升级的成本。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (5)

1.一种语音音频筛选系统,其特征在于,包括:
分析模块,用于对用户喜欢的目标语音音频的音频特征进行分析,获得所述目标语音音频的音频特征;
获取模块,用于获取第一语音音频,并分析所述第一语音音频的音频特征;
对比模块,用于比对所述第一语音音频的音频特征与所述目标语音音频的音频特征,当二者的比对结果满足预设条件时确定所述第一语音音频为可选语音音频,其过程具体步骤包括;
确定所述第一语音音频对应的第一语音音频特征矩阵,通过以下公式(1),对第一语音音频进行综合打分:
Figure FDA0002903683950000011
其中F为第一语音音频的综合得分,(Y1 Y2…Yn)为第一语音音频特征矩阵,其中Yi为第一语音音频的第i个特征的值,(y1 y2…yn)为目标语音音频的音频特征矩阵,yi为目标语音音频的第i个特征的值,i=1、2、3,…..n,且相同的i所对应的特征为同一类别的特征,
Figure FDA0002903683950000012
为需求解的用户操作矩阵C;
在求解用户操作矩阵C时,首先构建一个用户数据库,该用户数据库中有j条记录,每条记录中都包含有所述n个特征对应的值,形成特征矩阵B,特征矩阵B为j行n列的一个矩阵,每一行代表一条记录,每一列代表一类特征,然后利用公式(2)对矩阵B中的每一个元素进行标准化;
Figure FDA0002903683950000021
其中bst为矩阵B中的第s行第t列的值,其中s=1、2、3……j,t=1、2、3……n,
Figure FDA0002903683950000022
为bst标准化后的值,
Figure FDA0002903683950000023
为第t列的均值,σt为第t列的方差,对于每一个bst都会通过标准化得到相应的
Figure FDA0002903683950000024
从而可以得到一个新的矩阵B*,为了得到矩阵B*每一列之间的相关性,需要求解矩阵B*中每一列的协方差,形成新的矩阵Cov
Figure FDA0002903683950000025
其中
Figure FDA0002903683950000026
为矩阵B*的第i列和第x列之间的协方差,i=1、2、3……n,x=1、2、3……n;然后利用公式(3)求解协方差矩阵Cov的特征值和特征向量:
|Cov-λE|=0
(3)
其中Cov为协方差矩阵,E为单位矩阵,所求解出来的λ则为所需的特征向量的值,将所求解的最大特征值λ0带入特征方程式,得出相应的基础解系,则该基础解系的值就为求解的用户操作矩阵
Figure FDA0002903683950000027
通过算式(1)可以看出求解的用户操作矩阵C和语音特征均会影响到打分的数值,将前述利用公式(1)得到的对第一语音音频的综合打分代入如下公式(4):
min(|F-F1|,|F-F2|,|F-F3|,…,|F-Fm|)
(4)
其中,Fi为语音数据库中,所述用户针对第i个预设语音音频的综合打分,所述i=1、2、3……m;所述语音数据库中还存储了所述用户对所述第i个预设语音音频是否为用户所喜欢的语音音频进行了标注;
然后,根据上述公式(4)所得的值所对应的Ft;
在所述语音数据库中,查找所述Ft所述对应的第t个预设语音音频是否为是用户喜欢的语音音频;如果是,则确定所述第一语音音频为可选语音音频;否则,确定所述第一语音音频不是可选语音音频。
2.根据权利要求1所述的一种语音音频筛选系统,其特征在于,
所述音频特征包括以下参数中的一项或者多项:
停顿时长均值;预设单位时间内的总停顿时长;短时沉默的平均时长;预设单位时间内短时沉默的总时长;平声片段时长均值;预设单位时间内平声片段的总时长;升调片段时长均值;预设单位时间内升调片段的总时长;降调片段时长均值;预设单位时间内降调片段的总时长;平声片段振幅偏移均值;升调片段振幅偏移均值;降调片段振幅偏移均值;预设单位时间内的音调差异和范围;预设单位时间内的音调斜率;音频信号的时频形状和频谱包络样式;以及平声;升调和降调趋势的时间顺序样式。
3.根据权利要求1所述的一种语音音频筛选系统,其特征在于,
所述分析模块还用于获取目标音频,所述分析模块获取目标音频的方法包括:
所述分析模块接收用户输入的排序规则及所述排序规则对应的第一标识,并存储所述第一标识和排序规则的第一对应关系,其中,所述排序规则用于对第二语音音频进行排序;
所述分析模块接收用户输入的第二语音音频以及所述第二语音音频对应的第二标识,且所述第二标识与第一标识间存在第二对应关系,根据所述第二对应关系查询与所述第二标识匹配的第一标识,根据所述第一对应关系查询与所述第一标识匹配的排序规则,依据查询到排序规则对所述第二语音音频进行排序,生成第一排序列表,所述第一排序列表中包括所述第二语音音频的序列号,所述序列号从1开始;
确定序列号为1的第二语音音频为目标音频。
4.根据权利要求3所述的一种语音音频筛选系统,其特征在于,
所述分析模块还用于接收用户输入的修改请求,所述修改请求中包括第一标识,用于修改所述排序规则,查询所述修改请求中的第一标识对应的排序规则,依据用户输入的排序规则,对已存储的排序规则进行更新;
存储所述第一标识和排序规则的第一对应关系包括:根据所述排序规则生成排序规则文件,存储所述第一标识和排序规则文件的第一对应关系;
查询与所述第一标识匹配的排序规则包括:查询与所述第一标识匹配的排序规则文件,从所述排序规则文件中读取排序规则。
5.根据权利要求1所述的一种语音音频筛选系统,其特征在于,
所述分析模块获取目标音频的方法包括:
确定所述分析模块至少存储有一个第二语音音频;
对各所述第二语音音频分别执行:确定所述第二语音音频播放的标准时长、在当前统计周期内的播放总数及在当前统计周期内每一次播放时对应的实际时长;
按照所述至少一个所述第二语音音频分别对应的标准时长、播放总数及每一次播放时对应的实际时长,生成所述第二语音音频的第二排序列表;
所述根据所述至少一个第二语音音频分别对应的标准时长、播放总数及每一次播放时对应的实际时长,生成所述第二语音音频的第二排序列表包括:
针对任意一第二语音音频分别执行:根据所述任意一第二语音音频的播放总数和每一次播放对应的实际时长,确定所述任意一第二语音音频的平均时长;
根据所述平均时长和标准时长,确定所述任意一第二语音音频的播放进度平均值;基于所述至少一个第二语音音频的播放进度平均值,生成所述第二语音音频的第二排序列表;或者,
针对任意一第二语音音频分别执行:在每一次播放时对应的播放时长中,确定实际播放时长与标准时长的差值未达到预设值的播放时长的个数;
根据所述播放时长与标准时长的差值未达到预设值的播放时长的个数与播放总数确定所述任意一第二语音音频的预设进度播放率;根据所述至少一个第二语音音频的预设进度播放率,生成所述第二语音音频的第二排序列表;
所述第二排序列表包括所述第二语音音频的序列号,所述序列号从1开始;
确定序列号为1的第二语音音频为目标音频。
CN201910339618.3A 2019-04-25 2019-04-25 一种语音音频筛选系统 Active CN110134819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910339618.3A CN110134819B (zh) 2019-04-25 2019-04-25 一种语音音频筛选系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910339618.3A CN110134819B (zh) 2019-04-25 2019-04-25 一种语音音频筛选系统

Publications (2)

Publication Number Publication Date
CN110134819A CN110134819A (zh) 2019-08-16
CN110134819B true CN110134819B (zh) 2021-04-23

Family

ID=67571109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910339618.3A Active CN110134819B (zh) 2019-04-25 2019-04-25 一种语音音频筛选系统

Country Status (1)

Country Link
CN (1) CN110134819B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258536A (zh) * 2013-03-08 2013-08-21 北京理工大学 一种大规模说话人辨认方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8965766B1 (en) * 2012-03-15 2015-02-24 Google Inc. Systems and methods for identifying music in a noisy environment
CN103730129A (zh) * 2013-11-18 2014-04-16 长江大学 一种用于数据库信息查询的语音查询系统
CN104915403B (zh) * 2015-06-01 2018-07-27 腾讯科技(北京)有限公司 一种信息处理方法及服务器
CN106935248B (zh) * 2017-02-14 2021-02-05 广州孩教圈信息科技股份有限公司 一种语音相似度检测方法及装置
CN107274911A (zh) * 2017-05-03 2017-10-20 昆明理工大学 一种基于声音特征的相似度分析方法
CN109471953A (zh) * 2018-10-11 2019-03-15 平安科技(深圳)有限公司 一种语音数据检索方法及终端设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258536A (zh) * 2013-03-08 2013-08-21 北京理工大学 一种大规模说话人辨认方法

Also Published As

Publication number Publication date
CN110134819A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN109408665B (zh) 一种信息推荐方法及装置、存储介质
US10025841B2 (en) Play list generation method and apparatus
US20100023328A1 (en) Audio Recognition System
US7206775B2 (en) System and methods for the automatic transmission of new, high affinity media
CN106934254B (zh) 一种开源许可证的分析方法及装置
WO2019196302A1 (zh) 基于声纹识别的身份验证方法、服务器及存储介质
US20080120079A1 (en) Computer-Implemented Method and Computer-Based System for Validating Dna Sequencing Data
US7653534B2 (en) Apparatus and method for determining a type of chord underlying a test signal
JP2018026085A (ja) 音楽推薦方法及びその装置
US20080148375A1 (en) Authentication system, authentication device, and authentication method
US20160019671A1 (en) Identifying multimedia objects based on multimedia fingerprint
EP2273384A1 (en) A method and a system for identifying similar audio tracks
NL2012222C2 (en) A method of storing/reconstructing a multitude of sequences in/from a data storage structure.
US8223043B2 (en) Method and apparatus for compressing nucleotide sequence data
JP2005517211A (ja) 指紋の効率的格納
KR20040019009A (ko) 개인 인증 처리 장치, 및 개인 인증 처리 방법, 및 컴퓨터프로그램
CN111901538B (zh) 一种字幕生成方法、装置、设备及存储介质
CN110224833B (zh) 票据数据处理方法和系统
US20190279649A1 (en) Methods and apparatus for audio signature generation and matching
US20190213279A1 (en) Apparatus and method of analyzing and identifying song
CN111428078B (zh) 音频指纹编码方法、装置、计算机设备及存储介质
CN110134819B (zh) 一种语音音频筛选系统
JP2002014964A (ja) 情報提供システム及び情報提供方法
CN107563148B (zh) 一种基于离子索引的整体蛋白质鉴定方法与系统
US20040193649A1 (en) Method and apparatus for searching recommended music in the internet, and a computer-readable medium encoded with a plurality of processor-executable instruction sequences for searching recommended music in the internet

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 510000 unit on the fourth floor, the first, second and third floor, west side, 1383-5, Guangzhou Avenue South, Guangzhou City, Guangdong Province (office only)

Applicant after: GUANGZHOU ZIB ARTIFICIAL INTELLIGENCE TECHNOLOGY Co.,Ltd.

Address before: Room a, unit 1902, 374-2, Beijing Road, Yuexiu District, Guangzhou, Guangdong 510000

Applicant before: GUANGZHOU ZIB ARTIFICIAL INTELLIGENCE TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 510000 unit on the fourth floor, 1st, 2nd, 3rd floor, west side, 1383-5, Guangzhou Avenue South, Haizhu District, Guangzhou City, Guangdong Province (office only)

Applicant after: GUANGZHOU ZIB ARTIFICIAL INTELLIGENCE TECHNOLOGY Co.,Ltd.

Address before: 510000 unit on the fourth floor, the first, second and third floor, west side, 1383-5, Guangzhou Avenue South, Guangzhou City, Guangdong Province (office only)

Applicant before: GUANGZHOU ZIB ARTIFICIAL INTELLIGENCE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant