WO2013167023A2

WO2013167023A2 - 一种内置搜索语音短信功能的移动终端及其搜索方法

Info

Publication number: WO2013167023A2
Application number: PCT/CN2013/079091
Authority: WO
Inventors: 党正
Original assignee: 中兴通讯股份有限公司
Priority date: 2012-12-04
Filing date: 2013-07-09
Publication date: 2013-11-14
Also published as: CN103856600B; EP2919429A2; WO2013167023A3; US20150319286A1; US9992321B2; EP2919429A4; CN103856600A

Abstract

本发明公开了一种内置搜索语音短信功能的移动终端，该移动终端包括语音录入模块，配置为录入用户的语音搜索信号，并将该语音搜索信号发送至预处理模块进行预处理；预处理模块，配置为对语音搜索信号进行预处理，将预处理后的预处理信号发送至匹配模块进行信号匹配；匹配模块，配置为对预处理信号进行特征参数提取，计算所提取特征参数与所存语音短信特征参数的相似度，将相似度大于等于阈值的语音短信发送至结果输出模块；结果输出模块，配置为将相似度大于等于阈值的语音短信以列表形式显示于移动终端屏幕上；本发明还同时公开了一种内置搜索语音短信功能的移动终端搜发方法，采用本发明，能快捷地对移动终端内部存储的语音短信进行搜索。

Description

一种内置搜索语音短信功能的移动终端及其搜索方法技术领域

本发明涉及移动终端技术中的信息搜索领域，尤其涉及一种内置搜索语音短信功能的移动终端及其搜索方法。背景技术

语音短信业务是指用户把想说的话语通过手机等移动终端进行录音，发给一个或多个好友用户进行收听，同时，用户还可以根据手机等移动终端的提示音，进行语音短信的接收、转发、查询、回复和语音短信点播等操作。语音短信弥补了传统的文字短信难以传递声音和信息输入不便的缺憾，解决了那些因为不熟悉拼音使用，长时间徘徊在短信之外的人们发送短信的难题。

但是，由于用户收到的语音短信是发件人发送的音频文件，用户无法对语音短信进行直观的查看。当手机等移动终端本地存储语音短信过多时，用户希望查看特定的语音短信就变的极难查找，需要一个一个的打开语音短信进行收听，如此，语音短信的搜索就变的非常不便，极大的降低了用户的体验度。发明内容

有鉴于此，本发明实施例的主要目的在于提供一种内置搜索语音短信功能的移动终端及其搜索方法，能快捷地对移动终端内部存储的语音短信进行搜索。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供了一种内置搜索语音短信功能的移动终端，该移动终端包括：语音录入模块、预处理模块、匹配模块、结果输出模块；其中，所述语音录入模块，配置为录入用户的语音搜索信号，并将该语音搜索信号发送至预处理模块进行预处理；

所述预处理模块，配置为对语音搜索信号进行预处理，将预处理后的预处理信号发送至匹配模块进行信号匹配；

所述匹配模块，配置为对预处理信号进行特征参数提取，计算所提取特征参数与所存语音短信特征参数的相似度，将相似度大于等于阈值的语音短信发送至结果输出模块；

所述结果输出模块，配置为将相似度大于等于阔值的语音短信以列表形式显示于移动终端屏幕上。

上述方案中，所述结果输出模块，还配置为在相似度大于等于阔值的语音短信大于一条的情况下，在移动终端屏幕上提示用户是否进行再次搜索。

上述方案中，所述预处理模块包括：信号归一化模块、信号降釆样模块、反混叠滤波模块、信号放大模块、端点检测模块、噪声滤波模块；其中，

所述信号归一化模块，配置为将语音搜索信号的振幅、频率、相位分别归一为统一的振幅、频率、相位，将归一后的信号发送至信号降釆样模块；

所述信号降釆样模块，配置为对归一后的信号进行低频釆样，将釆样后的信号发送至反混叠滤波模块；

所述反混叠滤波模块，配置为滤除降釆样信号中的混叠频率分量，将滤除混叠频率分量后的信号发送至信号放大模块；

所述信号放大模块，配置为对滤除混叠频率分量后的信号进行放大处理，将放大处理后的信号发送至端点检测模块；所述端点检测模块，配置为确定放大信号中有效语音的起始点和终止点，将有效语音信号发送至噪声滤波模块；

所述噪声滤波模块，配置为滤除有效语音信号中的噪声信号，将滤除噪声后的信号发送至匹配模块进行信号匹配。

上述方案中，所述统一的振幅、频率、相位分别为，人耳听觉范围的设定的振幅、频率、相位；

所述低频釆样中的低频大于被釆样信号最高频率的两倍。

上述方案中，所述匹配模块包括：特征提取模块、相似性测量模块、语音短信库模块；其中，

所述特征提取模块，配置为提取预处理信号的特征参数，并将提取出来的特征参数发送至相似性测量模块；

所述相似性测量模块，配置为计算所提取特征参数与语音短信库模块发送的语音短信特征参数的相似度，将相似度大于等于阈值的语音短信发送至结果输出模块；

所述语音短信库模块，配置为存储语音短信的特征参数，并将每条语音短信的特征参数依次发送至相似性测量模块进行相似度计算。

上述方案中，所述特征参数包括：线性预测系数、线性预测倒谱系数、美尔频率倒谱系数；

所述相似度计算方法包括：欧式距离相似度方法、余弦相似度方法、曼哈顿距离方法、灰关联度方法。

本发明实施例提供了一种内置搜索语音短信功能的移动终端搜索方法，该方法包括步骤：

录入用户的语音搜索信号，并对该语音搜索信号进行预处理；对预处理信号进行特征参数提取，计算提取出来的特征参数与所存语音短信的特征参数的相似度；将相似度大于等于阔值的语音短信以列表形式显示于移动终端屏幕上。

上述方案中，所述对该语音搜索信号进行预处理包括步骤：

将该语音信号的振幅、频率、相位分别归一为统一的振幅、频率、相位；对归一后的信号进行低频釆样；滤除低频釆样信号中的混叠频率分量并进行放大；确定放大信号中有效语音的起始点和终止点；滤除有效语音信号中的噪声信号。

上述方案中，在相似度大于等于阔值的语音短信大于一条的情况下，该方法还包括：移动终端提示用户是否进行再次搜索。

釆用本发明实施例提供的一种内置搜索语音短信功能的移动终端及其搜索方法，由语音录入模块录入语音搜索信号，由预处理模块对该语音搜索信号进行预处理，并通过匹配模块计算所述语音搜索信号与所存语音短信的相似度，结果输出模块将相似度大于等于阔值的语音短信以列表形式显示于移动终端屏幕上；如此，可以通过录入语音搜索信号，对移动终端内部的语音短信进行搜索，不再需要用户一个一个的打开语音短信进行收听，使语音短信的搜索非常方便，提高了用户的体验度。

优选地，当相似度大于等于阔值的语音短信大于一条时，结果输出模块提示用户是否进行再次搜索，如此，可以通过再次录入语音搜索信号，对上次搜索出来的语音短信进行再次搜索。附图说明

图 1 为本发明实施例内置搜索语音短信功能的移动终端的组成结构示意图；

图 2为本发明实施例语音短信库模块的组成结构示意图；

图 3 为本发明实施例内置搜索语音短信功能的移动终端实现其搜索方法的流程示意图。具体实施方式

为了能够更加详尽地了解本发明实施例的特点与技术内容，下面结合附图对本发明实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本发明实施例。

图 1 为本发明实施例内置搜索语音短信功能的移动终端的组成结构示意图，如图 1所示，该移动终端包括：语音录入模块 11、预处理模块 12、匹配模块 13、结果输出模块 14; 其中，

所述语音录入模块 11 , 配置为录入用户的语音搜索信号，并将该语音搜索信号发送至预处理模块 12进行预处理；

所述预处理模块 12,配置为接收语音录入模块 11发送的语音搜索信号，对该语音搜索信号进行预处理，将预处理后的预处理信号发送至匹配模块 13进行信号匹配；

所述匹配模块 13 , 配置为接收预处理模块 12发送的预处理信号，对该预处理信号进行特征参数提取，计算提取出来的特征参数与所存语音短信的特征参数的相似度，将相似度大于等于阔值的语音短信发送至结果输出模块 14;

所述结果输出模块 14,配置为接收匹配模块 13发送的相似度大于等于阔值的语音短信，将该语音短信以列表形式显示于移动终端屏幕上；

这里，所述列表包括至少一条语音短信表项，且语音短信表项纵向排列于移动终端屏幕上；所述语音短信表项包括：语音短信连接标识，还可以进一步包括：语音短信创建时间、语音短信时长、语音短信大小中的一项或多项，且语音短信连接标识、语音短信创建时间、语音短信时长、语音短信大小横向排列于移动终端屏幕上。

这里，所述阔值为设定的相似度门限值，当相似度大于等于阔值时，表示该语音短信含有语音搜索信号；当相似度小于阔值时，表示该语音短信不含有语音搜索信号。

上述方案中，所述语音搜索信号可以是语音短信的关键词、关键句；所述语音短信是移动终端所存储的至少一条语音信息。

优选地，所述结果输出模块 14, 还配置为在相似度大于等于阔值的语音短信大于一条的情况下，在移动终端屏幕上提示用户是否进行再次搜索；相应的，进行再次搜索时，所述语音录入模块 11 , 录入的语音搜索信号为第二关键词或第二关键句；所述匹配模块 13 , 计算第二关键词或第二关键句与上次搜索出的相似度大于等于阔值的语音短信的相似度；其中，第二关键词或第二关键句是不同于上次搜索时的关键词或关键句。

优选地，所述预处理模块 12包括：信号归一化模块 121、信号降釆样模块 122、反混叠滤波模块 123、信号放大模块 124、端点检测模块 125、噪声滤波模块 126; 其中，

所述信号归一化模块 121 , 配置为接收语音录入模块 11发送的语音搜索信号，将该语音搜索信号的振幅、频率、相位分别归一为统一的振幅、频率、相位；将归一后的信号发送至信号降釆样模块 122;

所述信号降釆样模块 122,配置为接收信号归一化模块 121发送的信号，对该信号进行低频釆样；将釆样后的信号发送至反混叠滤波模块 123;

所述反混叠滤波模块 123 ,配置为接收信号降釆样模块 122发送的信号，滤除该信号中的混叠频率分量；将滤除混叠频率分量后的信号发送至信号放大模块 124;

所述信号放大模块 124, 配置为接收反混叠滤波模块 123发送的信号，对该信号进行放大处理；将放大处理后的信号发送至端点检测模块 125; 所述端点检测模块 125 , 配置为接收信号放大模块 124发送的信号，确定该信号中有效语音的起始点和终止点；将有效语音信号发送至噪声滤波模块 126; 所述噪声滤波模块 126,配置为接收端点检测模块 125发送的有效语音信号，滤除有效语音信号中的噪声信号；将滤除噪声后的信号发送至匹配模块 13进行信号匹配。

上述方案中，所述统一的振幅、频率、相位分别为，人耳听觉范围的某一设定的振幅、频率、相位。

所述低频釆样中的低频大于被釆样信号最高频率的两倍，以保证其足够高。

优选地，所述匹配模块 13包括特征提取模块 131、相似性测量模块 132、语音短信库模块 133 ; 其中，

所述特征提取模块 131 ,配置为接收预处理模块 12发送的预处理信号，提取该预处理信号的特征参数，并将提取出来的特征参数发送至相似性测量模块 132;

所述相似性测量模块 132 ,配置为接收特征提取模块 131发送的特征参数，计算该特征参数与语音短信库模块 133发送的语音短信特征参数的相似度，将相似度大于等于阔值的语音短信发送至结果输出模块 14;

所述语音短信库模块 133 , 配置为存储语音短信的特征参数，并将每条语音短信的特征参数依次发送至相似性测量模块 132进行相似度计算。

上述方案中，所述特征参数包括：线性预测系数、线性预测倒谱系数、美尔频率倒谱系数等。

以美尔频率倒谱系数为例，所述提取该特征参数具体为：

对预处理信号进行分帧、加窗，然后作离散傅里叶变换，获得频谱分布信息；再求频谱幅度的平方，得到能量语；将能量谱通过一组美尔尺度的三角形滤波器组，经离散余弦变换得到美尔频率到谱系数；对美尔频率到谱系数进行矢量量化。

这里，对美尔频率到谱系数等特征参数进行矢量量化可以通过以下方法实现：主成分分析（ Principal Component Analysis, PCA )方法、支持向量机 ( Support Vector Machine , SVM )方法、或小波变换 ( Wavelet Transform, WT )方法。

上述方案中，所述相似度计算的方法可以是：欧式距离相似度方法、余弦相似度方法、曼哈顿距离方法、或灰关联度方法等。

以欧式距离相似度方法为例，所述相似度计算具体为： ά₂ (Χ, Υ) = ∑(_Χί - _γί )

其中， Xi为信号的特征参数矢量， ¼为一条语音信息的特征参数矢量， d₂(X,Y)为欧式距离相似度；

为求和符号， i取 1、 2、 3...... K; 所述欧式距离相似度表征所述信号与所述语音信息的相似程度，欧式距离相似度值越大表示相似度越小，欧式距离测量度值越小表示相似度越大。

图 2为本发明实施例语音短信库模块的组成结构示意图，如图 2所示，该模块包括：语音短信单元 133a、预处理单元 133b、特征提取单元 133c; 其中，

所述语音短信单元 133a, 配置为存储录入的语音短信，并将该语音短信发送至预处理单元 133b进行预处理；

所述预处理单元 133b,配置为接收语音短信单元 133a发送的语音短信，对该语音短信进行预处理，将预处理后的预处理信号发送至特征提取单元 133c;

所述特征提取单元 133c,配置为接收预处理单元 133b发送的预处理信号，对该预处理信号进行特征参数提取。

上述方案中，对语音短信进行预处理具体为：将该语音信号的振幅、频率、相位分别归一为统一的振幅、频率、相位；对归一后的信号进行低频釆样；滤除低频釆样信号中的混叠频率分量；之后，将信号进行放大；确定放大信号中有效语音的起始点和终止点；最后，滤除有效语音信号中的噪声信号。

以美尔频率倒谱系数为例，所述提取该特征参数具体为：

对信号进行分帧、加窗，然后作离散傅里叶变换，获得频谱分布信息；再求频谱幅度的平方，得到能量谱；将能量谱通过一组美尔尺度的三角形滤波器组；经离散余弦变换得到美尔频率到谱系数；对美尔频率到谱系数进行矢量量化。

这里，对美尔频率到谱系数等特征参数进行矢量量化可以通过以下方法实现： PCA方法、 SVM方法、或 WT方法。

上述方案中，所述对语音短信进行预处理、对预处理信号进行特征参数提取，可以在移动终端后台进行操作。

图 3 为本发明实施例内置搜索语音短信功能的移动终端实现其搜索方法的流程示意图，如图 3所示，该方法包括步骤：

步骤 301 : 移动终端录入用户的语音搜索信号。

所述语音搜索信号可以是语音短信的关键词或关键句。

步骤 302: 移动终端对该语音搜索信号进行预处理。

本步骤具体包括：将该语音信号的振幅、频率、相位分别归一为统一的振幅、频率、相位；对归一后的信号进行低频釆样；滤除低频釆样信号中的混叠频率分量；之后，将信号进行放大；确定放大信号中有效语音的起始点和终止点；最后，滤除有效语音信号中的噪声信号。

这里，所述低频釆样中的低频大于该信号最高频率的两倍。

步骤 303: 移动终端对预处理信号进行特征参数提取，计算提取出来的特征参数与所存语音短信的特征参数的相似度。

优选地，从语音短信中有效语音的起始点开始，计算所提取特征参数与该起始点处语音特征参数的相似度；逐次推后一个字的音节，如 "好" 字音节，计算所提取特征参数与此处语音特征参数的相似度，直到语音短信中有效语音的终止点为止停止计算；将所计算出的最大相似度作为本条语音短信的相似度。

所述特征参数包括：线性预测系数、线性预测倒谱系数、美尔频率倒谱系数等。

以美尔频率倒谱系数为例，所述提取该特征参数具体为：

所述相似度计算的方法可以是：欧式距离相似度方法、余弦相似度方法、曼哈顿距离方法、或灰关联度方法等。

其中， Xi为信号特征参数矢量， Yi为一条语音信息特征参数矢量， d₂(X,Y) 为欧式距离相似度；

为求和符号， i取 1、 2、 3...... K; 所述欧式距离测量度表征所述信号与所述语音信息的相似程度，欧式距离测量度值越大表示相似度越小，欧式距离测量度值越小表示相似度越大。步骤 304:移动终端将相似度大于等于阔值的语音短信以列表的形式显示于移动终端屏幕上。

在相似度大于等于阔值的语音短信大于一条的情况下，本步骤还包括，移动终端提示用户是否进行再次搜索。

相应的，在用户确定再次搜索之后，重复步骤 301〜步骤 304; 这里，再次录入的语音搜索信号为第二关键词或第二关键句；再次计算的相似度为第二关键词或第二关键句与上次搜索出的相似度大于等于阔值的语音短信的相似度；其中，第二关键词或第二关键句是不同于上次搜索时的关键词或关键句。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

权利要求书

1、一种内置搜索语音短信功能的移动终端，所述移动终端包括：语音录入模块、预处理模块、匹配模块、结果输出模块；其中，

所述语音录入模块，配置为录入用户的语音搜索信号，并将该语音搜索信号发送至预处理模块进行预处理；

2、根据权利要求 1所述的移动终端，其中，所述结果输出模块，还配置为在相似度大于等于阔值的语音短信大于一条的情况下，在移动终端屏幕上提示用户是否进行再次搜索。

3、根据权利要求 1所述的移动终端，其中，所述预处理模块包括：信号归一化模块、信号降釆样模块、反混叠滤波模块、信号放大模块、端点检测模块、噪声滤波模块；其中，

所述反混叠滤波模块，配置为滤除降釆样信号中的混叠频率分量，将滤除混叠频率分量后的信号发送至信号放大模块；所述信号放大模块，配置为对滤除混叠频率分量后的信号进行放大处理，将放大处理后的信号发送至端点检测模块；

所述端点检测模块，配置为确定放大信号中有效语音的起始点和终止点，将有效语音信号发送至噪声滤波模块；

4、根据权利要求 3所述的移动终端，其中，

所述统一的振幅、频率、相位分别为，人耳听觉范围的设定的振幅、频率、相位；

所述低频釆样中的低频大于被釆样信号最高频率的两倍。

5、根据权利要求 1至 4任一项所述的移动终端，其中，所述匹配模块包括：特征提取模块、相似性测量模块、语音短信库模块；其中，

6、根据权利要求 5所述的移动终端，其中，

所述特征参数包括：线性预测系数、线性预测倒谱系数、美尔频率倒谱系数；

7、一种内置搜索语音短信功能的移动终端搜索方法，所述方法包括步骤：

录入用户的语音搜索信号，并对该语音搜索信号进行预处理；对预处理信号进行特征参数提取，计算提取出来的特征参数与所存语音短信的特征参数的相似度；

将相似度大于等于阔值的语音短信以列表形式显示于移动终端屏幕上。

8、根据权利要求 7所述的方法，其中，所述对该语音搜索信号进行预处理包括步骤：

9、根据权利要求 7或 8所述的方法，其中，在相似度大于等于阔值的语音短信大于一条的情况下，该方法还包括：移动终端提示用户是否进行再次搜索。