CN103856600B - 一种内置搜索语音短信功能的移动终端及其搜索方法 - Google Patents

一种内置搜索语音短信功能的移动终端及其搜索方法 Download PDF

Info

Publication number
CN103856600B
CN103856600B CN201210512740.4A CN201210512740A CN103856600B CN 103856600 B CN103856600 B CN 103856600B CN 201210512740 A CN201210512740 A CN 201210512740A CN 103856600 B CN103856600 B CN 103856600B
Authority
CN
China
Prior art keywords
signal
module
voice
similarity
voice sms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210512740.4A
Other languages
English (en)
Other versions
CN103856600A (zh
Inventor
党正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210512740.4A priority Critical patent/CN103856600B/zh
Priority to US14/649,658 priority patent/US9992321B2/en
Priority to EP13788386.4A priority patent/EP2919429A4/en
Priority to PCT/CN2013/079091 priority patent/WO2013167023A2/zh
Publication of CN103856600A publication Critical patent/CN103856600A/zh
Application granted granted Critical
Publication of CN103856600B publication Critical patent/CN103856600B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/58Message adaptation for wireless communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/04Error control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices

Abstract

本发明公开了一种内置搜索语音短信功能的移动终端,该移动终端包括语音录入模块,用于录入用户的语音搜索信号,并将该语音搜索信号发送至预处理模块进行预处理;预处理模块,用于对语音搜索信号进行预处理,将预处理后的预处理信号发送至匹配模块进行信号匹配;匹配模块,用于对预处理信号进行特征参数提取,计算所提取特征参数与所存语音短信特征参数的相似度,将相似度大于等于阈值的语音短信发送至结果输出模块;结果输出模块,用于将相似度大于等于阈值的语音短信以列表形式显示于移动终端屏幕上;本发明还同时公开了一种内置搜索语音短信功能的移动终端搜发方法,采用本发明,能快捷地对移动终端内部存储的语音短信进行搜索。

Description

一种内置搜索语音短信功能的移动终端及其搜索方法
技术领域
本发明涉及移动终端技术中的信息搜索领域,尤其涉及一种内置搜索语音短信功能的移动终端及其搜索方法。
背景技术
语音短信业务是指用户把想说的话语通过手机等移动终端进行录音,发给一个或多个好友用户进行收听,同时,用户还可以根据手机等移动终端的提示音,进行语音短信的接收、转发、查询、回复和语音短信点播等操作。语音短信弥补了传统的文字短信难以传递声音和信息输入不便的缺憾,解决了那些因为不熟悉拼音使用,长时间徘徊在短信之外的人们发送短信的难题。
但是,由于用户收到的语音短信是发件人发送的音频文件,用户无法对语音短信进行直观的查看。当手机等移动终端本地存储语音短信过多时,用户希望查看特定的语音短信就变的极难查找,需要一个一个的打开语音短信进行收听,如此,语音短信的搜索就变的非常不便,极大的降低了用户的体验度。
发明内容
有鉴于此,本发明的主要目的在于提供一种内置搜索语音短信功能的移动终端及其搜索方法,能快捷地对移动终端内部存储的语音短信进行搜索。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种内置搜索语音短信功能的移动终端,该移动终端包括:语音录入模块、预处理模块、匹配模块、结果输出模块;其中,
所述语音录入模块,用于录入用户的语音搜索信号,并将该语音搜索信号发送至预处理模块进行预处理;
所述预处理模块,用于对语音搜索信号进行预处理,将预处理后的预处理信号发送至匹配模块进行信号匹配;
所述匹配模块,用于对预处理信号进行特征参数提取,计算所提取特征参数与所存语音短信特征参数的相似度,将相似度大于等于阈值的语音短信发送至结果输出模块;
所述结果输出模块,用于将相似度大于等于阈值的语音短信以列表形式显示于移动终端屏幕上。
上述方案中,所述结果输出模块,还用于在相似度大于等于阈值的语音短信大于一条的情况下,在移动终端屏幕上提示用户是否进行再次搜索。
上述方案中,所述预处理模块包括:信号归一化模块、信号降采样模块、反混叠滤波模块、信号放大模块、端点检测模块、噪声滤波模块;其中,
所述信号归一化模块,用于将语音搜索信号的振幅、频率、相位分别归一为统一的振幅、频率、相位,将归一后的信号发送至信号降采样模块;
所述信号降采样模块,用于对归一后的信号进行低频采样,将采样后的信号发送至反混叠滤波模块;
所述反混叠滤波模块,用于滤除降采样信号中的混叠频率分量,将滤除混叠频率分量后的信号发送至信号放大模块;
所述信号放大模块,用于对滤除混叠频率分量后的信号进行放大处理,将放大处理后的信号发送至端点检测模块;
所述端点检测模块,用于确定放大信号中有效语音的起始点和终止点,将有效语音信号发送至噪声滤波模块;
所述噪声滤波模块,用于滤除有效语音信号中的噪声信号,将滤除噪声后的信号发送至匹配模块进行信号匹配。
上述方案中,所述统一的振幅、频率、相位分别为,人耳听觉范围的设定的振幅、频率、相位;
所述低频采样中的低频大于被采样信号最高频率的两倍。
上述方案中,所述匹配模块包括:特征提取模块、相似性测量模块、语音短信库模块;其中,
所述特征提取模块,用于提取预处理信号的特征参数,并将提取出来的特征参数发送至相似性测量模块;
所述相似性测量模块,用于计算所提取特征参数与语音短信库模块发送的语音短信特征参数的相似度,将相似度大于等于阈值的语音短信发送至结果输出模块;
所述语音短信库模块,用于存储语音短信的特征参数,并将每条语音短信的特征参数依次发送至相似性测量模块进行相似度计算。
上述方案中,所述特征参数包括:线性预测系数、线性预测倒谱系数、美尔频率倒谱系数;
所述相似度计算方法包括:欧式距离相似度方法、余弦相似度方法、曼哈顿距离方法、灰关联度方法。
本发明提供了一种内置搜索语音短信功能的移动终端搜索方法,该方法包括步骤:
录入用户的语音搜索信号,并对该语音搜索信号进行预处理;
对预处理信号进行特征参数提取,计算提取出来的特征参数与所存语音短信的特征参数的相似度;
将相似度大于等于阈值的语音短信以列表形式显示于移动终端屏幕上。
上述方案中,所述对该语音搜索信号进行预处理包括步骤:
将该语音信号的振幅、频率、相位分别归一为统一的振幅、频率、相位;对归一后的信号进行低频采样;滤除低频采样信号中的混叠频率分量并进行放大;确定放大信号中有效语音的起始点和终止点;滤除有效语音信号中的噪声信号。
上述方案中,在相似度大于等于阈值的语音短信大于一条的情况下,该方法还包括:移动终端提示用户是否进行再次搜索。
采用本发明提供的一种内置搜索语音短信功能的移动终端及其搜索方法,由语音录入模块录入语音搜索信号,由预处理模块对该语音搜索信号进行预处理,并通过匹配模块计算所述语音搜索信号与所存语音短信的相似度,结果输出模块将相似度大于等于阈值的语音短信以列表形式显示于移动终端屏幕上;如此,可以通过录入语音搜索信号,对移动终端内部的语音短信进行搜索,不再需要用户一个一个的打开语音短信进行收听,使语音短信的搜索非常方便,提高了用户的体验度。
进一步的,当相似度大于等于阈值的语音短信大于一条时,结果输出模块提示用户是否进行再次搜索,如此,可以通过再次录入语音搜索信号,对上次搜索出来的语音短信进行再次搜索。
附图说明
图1为本发明内置搜索语音短信功能的移动终端的组成结构示意图;
图2为本发明语音短信库模块的组成结构示意图;
图3为本发明内置搜索语音短信功能的移动终端实现其搜索方法的流程示意图。
具体实施方式
为了能够更加详尽地了解本发明的特点与技术内容,下面结合附图对本发明的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明。
图1为本发明内置搜索语音短信功能的移动终端的组成结构示意图,如图1所示,该移动终端包括:语音录入模块11、预处理模块12、匹配模块13、结果输出模块14;其中,
所述语音录入模块11,用于录入用户的语音搜索信号,并将该语音搜索信号发送至预处理模块12进行预处理;
所述预处理模块12,用于接收语音录入模块11发送的语音搜索信号,对该语音搜索信号进行预处理,将预处理后的预处理信号发送至匹配模块13进行信号匹配;
所述匹配模块13,用于接收预处理模块12发送的预处理信号,对该预处理信号进行特征参数提取,计算提取出来的特征参数与所存语音短信的特征参数的相似度,将相似度大于等于阈值的语音短信发送至结果输出模块14;
所述结果输出模块14,用于接收匹配模块13发送的相似度大于等于阈值的语音短信,将该语音短信以列表形式显示于移动终端屏幕上;
这里,所述列表包括至少一条语音短信表项,且语音短信表项纵向排列于移动终端屏幕上;所述语音短信表项包括:语音短信连接标识,还可以进一步包括:语音短信创建时间、语音短信时长、语音短信大小中的一项或多项,且语音短信连接标识、语音短信创建时间、语音短信时长、语音短信大小横向排列于移动终端屏幕上;
这里,所述阈值为设定的相似度门限值,当相似度大于等于阈值时,表示该语音短信含有语音搜索信号;当相似度小于阈值时,表示该语音短信不含有语音搜索信号;
上述方案中,所述语音搜索信号可以是语音短信的关键词、关键句;所述语音短信是移动终端所存储的至少一条语音信息;
进一步的,所述结果输出模块14,还用于在相似度大于等于阈值的语音短信大于一条的情况下,在移动终端屏幕上提示用户是否进行再次搜索;相应的,进行再次搜索时,所述语音录入模块11,录入的语音搜索信号为第二关键词或第二关键句;所述匹配模块13,计算第二关键词或第二关键句与上次搜索出的相似度大于等于阈值的语音短信的相似度;其中,第二关键词或第二关键句是不同于上次搜索时的关键词或关键句。
进一步的,所述预处理模块12包括:信号归一化模块121、信号降采样模块122、反混叠滤波模块123、信号放大模块124、端点检测模块125、噪声滤波模块126;其中,
所述信号归一化模块121,用于接收语音录入模块11发送的语音搜索信号,将该语音搜索信号的振幅、频率、相位分别归一为统一的振幅、频率、相位;将归一后的信号发送至信号降采样模块122;
所述信号降采样模块122,用于接收信号归一化模块121发送的信号,对该信号进行低频采样;将采样后的信号发送至反混叠滤波模块123;
所述反混叠滤波模块123,用于接收信号降采样模块122发送的信号,滤除该信号中的混叠频率分量;将滤除混叠频率分量后的信号发送至信号放大模块124;
所述信号放大模块124,用于接收反混叠滤波模块123发送的信号,对该信号进行放大处理;将放大处理后的信号发送至端点检测模块125;
所述端点检测模块125,用于接收信号放大模块124发送的信号,确定该信号中有效语音的起始点和终止点;将有效语音信号发送至噪声滤波模块126;
所述噪声滤波模块126,用于接收端点检测模块125发送的有效语音信号,滤除有效语音信号中的噪声信号;将滤除噪声后的信号发送至匹配模块13进行信号匹配。
上述方案中,所述统一的振幅、频率、相位分别为,人耳听觉范围的某一设定的振幅、频率、相位;
所述低频采样中的低频大于被采样信号最高频率的两倍,以保证其足够高。
进一步的,所述匹配模块13包括特征提取模块131、相似性测量模块132、语音短信库模块133;其中,
所述特征提取模块131,用于接收预处理模块12发送的预处理信号,提取该预处理信号的特征参数,并将提取出来的特征参数发送至相似性测量模块132;
所述相似性测量模块132,用于接收特征提取模块131发送的特征参数,计算该特征参数与语音短信库模块133发送的语音短信特征参数的相似度,将相似度大于等于阈值的语音短信发送至结果输出模块14;
所述语音短信库模块133,用于存储语音短信的特征参数,并将每条语音短信的特征参数依次发送至相似性测量模块132进行相似度计算。
上述方案中,所述特征参数包括:线性预测系数、线性预测倒谱系数、美尔频率倒谱系数等;
以美尔频率倒谱系数为例,所述提取该特征参数具体为:
对预处理信号进行分帧、加窗,然后作离散傅里叶变换,获得频谱分布信息;再求频谱幅度的平方,得到能量谱;将能量谱通过一组美尔尺度的三角形滤波器组,经离散余弦变换得到美尔频率到谱系数;对美尔频率到谱系数进行矢量量化;
这里,对美尔频率到谱系数等特征参数进行矢量量化可以通过以下方法实现:主成分分析(Principal Component Analysis,PCA)方法、支持向量机(SupportVector Machine,SVM)方法、或小波变换(Wavelet Transform,WT)方法;
上述方案中,所述相似度计算的方法可以是:欧式距离相似度方法、余弦相似度方法、曼哈顿距离方法、或灰关联度方法等;
以欧式距离相似度方法为例,所述相似度计算具体为:
d 2 ( X , Y ) = 1 K Σ i = 1 K ( x i - y i ) 2
Xi={xi1,xi2,......,xik}
Yi={Yj1,Yj2,......,Yjk}
其中,Xi为信号的特征参数矢量,Yi为一条语音信息的特征参数矢量,d2(X,Y)为欧式距离相似度;所述欧式距离相似度表征所述信号与所述语音信息的相似程度,欧式距离相似度值越大表示相似度越小,欧式距离测量度值越小表示相似度越大。
图2为本发明语音短信库模块的组成结构示意图,如图2所示,该模块包括:语音短信单元133a、预处理单元133b、特征提取单元133c;其中,
所述语音短信单元133a,用于存储录入的语音短信,并将该语音短信发送至预处理单元133b进行预处理;
所述预处理单元133b,用于接收语音短信单元133a发送的语音短信,对该语音短信进行预处理,将预处理后的预处理信号发送至特征提取单元133c;
所述特征提取单元133c,用于接收预处理单元133b发送的预处理信号,对该预处理信号进行特征参数提取;
上述方案中,对语音短信进行预处理具体为:将该语音信号的振幅、频率、相位分别归一为统一的振幅、频率、相位;对归一后的信号进行低频采样;滤除低频采样信号中的混叠频率分量;之后,将信号进行放大;确定放大信号中有效语音的起始点和终止点;最后,滤除有效语音信号中的噪声信号;
上述方案中,所述特征参数包括:线性预测系数、线性预测倒谱系数、美尔频率倒谱系数等;
以美尔频率倒谱系数为例,所述提取该特征参数具体为:
对信号进行分帧、加窗,然后作离散傅里叶变换,获得频谱分布信息;再求频谱幅度的平方,得到能量谱;将能量谱通过一组美尔尺度的三角形滤波器组;经离散余弦变换得到美尔频率到谱系数;对美尔频率到谱系数进行矢量量化;
这里,对美尔频率到谱系数等特征参数进行矢量量化可以通过以下方法实现:PCA方法、SVM方法、或WT方法;
上述方案中,所述对语音短信进行预处理、对预处理信号进行特征参数提取,可以在移动终端后台进行操作。
图3为本发明内置搜索语音短信功能的移动终端实现其搜索方法的流程示意图,如图3所示,该方法包括步骤:
步骤301:移动终端录入用户的语音搜索信号;
所述语音搜索信号可以是语音短信的关键词或关键句。
步骤302:移动终端对该语音搜索信号进行预处理;
本步骤具体包括:将该语音信号的振幅、频率、相位分别归一为统一的振幅、频率、相位;对归一后的信号进行低频采样;滤除低频采样信号中的混叠频率分量;之后,将信号进行放大;确定放大信号中有效语音的起始点和终止点;最后,滤除有效语音信号中的噪声信号;
这里,所述低频采样中的低频大于该信号最高频率的两倍。
步骤303:移动终端对预处理信号进行特征参数提取,计算提取出来的特征参数与所存语音短信的特征参数的相似度;
进一步的,从语音短信中有效语音的起始点开始,计算所提取特征参数与该起始点处语音特征参数的相似度;逐次推后一个字的音节,如“好”字音节,计算所提取特征参数与此处语音特征参数的相似度,直到语音短信中有效语音的终止点为止停止计算;将所计算出的最大相似度作为本条语音短信的相似度;
所述特征参数包括:线性预测系数、线性预测倒谱系数、美尔频率倒谱系数等;
以美尔频率倒谱系数为例,所述提取该特征参数具体为:
对信号进行分帧、加窗,然后作离散傅里叶变换,获得频谱分布信息;再求频谱幅度的平方,得到能量谱;将能量谱通过一组美尔尺度的三角形滤波器组;经离散余弦变换得到美尔频率到谱系数;对美尔频率到谱系数进行矢量量化;
这里,对美尔频率到谱系数等特征参数进行矢量量化可以通过以下方法实现:PCA方法、SVM方法、或WT方法;
所述相似度计算的方法可以是:欧式距离相似度方法、余弦相似度方法、曼哈顿距离方法、或灰关联度方法等;
以欧式距离相似度方法为例,所述相似度计算具体为:
d 2 ( X , Y ) = 1 K Σ i = 1 K ( x i - y i ) 2
Xi={xi1,xi2,......,xik}
Yi={Yj1,Yj2,......,Yjk}
其中,Xi为信号特征参数矢量,Yi为一条语音信息特征参数矢量,d2(X,Y)为欧式距离相似度;所述欧式距离测量度表征所述信号与所述语音信息的相似程度,欧式距离测量度值越大表示相似度越小,欧式距离测量度值越小表示相似度越大。
步骤304:移动终端将相似度大于等于阈值的语音短信以列表的形式显示于移动终端屏幕上;
这里,所述列表包括至少一条语音短信表项,且语音短信表项纵向排列于移动终端屏幕上;所述语音短信表项包括:语音短信连接标识,还可以进一步包括:语音短信创建时间、语音短信时长、语音短信大小中的一项或多项,且语音短信连接标识、语音短信创建时间、语音短信时长、语音短信大小横向排列于移动终端屏幕上;
这里,所述阈值为设定的相似度门限值,当相似度大于等于阈值时,表示该语音短信含有语音搜索信号;当相似度小于阈值时,表示该语音短信不含有语音搜索信号;
在相似度大于等于阈值的语音短信大于一条的情况下,本步骤还包括,移动终端提示用户是否进行再次搜索;
相应的,在用户确定再次搜索之后,重复步骤301~步骤304;这里,再次录入的语音搜索信号为第二关键词或第二关键句;再次计算的相似度为第二关键词或第二关键句与上次搜索出的相似度大于等于阈值的语音短信的相似度;其中,第二关键词或第二关键句是不同于上次搜索时的关键词或关键句。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (7)

1.一种内置搜索语音短信功能的移动终端,其特征在于,该移动终端包括:语音录入模块、预处理模块、匹配模块、结果输出模块;其中,
所述语音录入模块,用于录入用户的语音搜索信号,并将该语音搜索信号发送至预处理模块进行预处理;
所述预处理模块,用于对语音搜索信号进行预处理,将预处理后的预处理信号发送至匹配模块进行信号匹配;
所述匹配模块,用于对预处理信号进行特征参数提取,计算所提取特征参数与所存语音短信特征参数的相似度,将相似度大于等于阈值的语音短信发送至结果输出模块;
所述结果输出模块,用于将相似度大于等于阈值的语音短信以列表形式显示于移动终端屏幕上;
所述预处理模块包括:信号归一化模块、信号降采样模块、反混叠滤波模块、信号放大模块、端点检测模块、噪声滤波模块;其中,
所述信号归一化模块,用于将语音搜索信号的振幅、频率、相位分别归一为统一的振幅、频率、相位,将归一后的信号发送至信号降采样模块;
所述信号降采样模块,用于对归一后的信号进行低频采样,将采样后的信号发送至反混叠滤波模块;
所述反混叠滤波模块,用于滤除降采样信号中的混叠频率分量,将滤除混叠频率分量后的信号发送至信号放大模块;
所述信号放大模块,用于对滤除混叠频率分量后的信号进行放大处理,将放大处理后的信号发送至端点检测模块;
所述端点检测模块,用于确定放大信号中有效语音的起始点和终止点,将有效语音信号发送至噪声滤波模块;
所述噪声滤波模块,用于滤除有效语音信号中的噪声信号,将滤除噪声后的信号发送至匹配模块进行信号匹配。
2.根据权利要求1所述的移动终端,其特征在于,所述结果输出模块,还用于在相似度大于等于阈值的语音短信大于一条的情况下,在移动终端屏幕上提示用户是否进行再次搜索。
3.根据权利要求1所述的移动终端,其特征在于,
所述统一的振幅、频率、相位分别为,人耳听觉范围的设定的振幅、频率、相位;
所述低频采样中的低频大于被采样信号最高频率的两倍。
4.根据权利要求1至3任意一项所述的移动终端,其特征在于,所述匹配模块包括:特征提取模块、相似性测量模块、语音短信库模块;其中,
所述特征提取模块,用于提取预处理信号的特征参数,并将提取出来的特征参数发送至相似性测量模块;
所述相似性测量模块,用于计算所提取特征参数与语音短信库模块发送的语音短信特征参数的相似度,将相似度大于等于阈值的语音短信发送至结果输出模块;
所述语音短信库模块,用于存储语音短信的特征参数,并将每条语音短信的特征参数依次发送至相似性测量模块进行相似度计算。
5.根据权利要求4所述的移动终端,其特征在于,
所述特征参数包括:线性预测系数、线性预测倒谱系数、美尔频率倒谱系数;
所述相似度计算方法包括:欧式距离相似度方法、余弦相似度方法、曼哈顿距离方法、灰关联度方法。
6.一种内置搜索语音短信功能的移动终端搜索方法,其特征在于,该方法包括步骤:
录入用户的语音搜索信号,并对该语音搜索信号进行预处理;
对预处理信号进行特征参数提取,计算提取出来的特征参数与所存语音短信的特征参数的相似度;
将相似度大于等于阈值的语音短信以列表形式显示于移动终端屏幕上;
所述对该语音搜索信号进行预处理包括步骤:
将该语音信号的振幅、频率、相位分别归一为统一的振幅、频率、相位;对归一后的信号进行低频采样;滤除低频采样信号中的混叠频率分量并进行放大;确定放大信号中有效语音的起始点和终止点;滤除有效语音信号中的噪声信号。
7.根据权利要求6所述的方法,其特征在于,在相似度大于等于阈值的语音短信大于一条的情况下,该方法还包括:移动终端提示用户是否进行再次搜索。
CN201210512740.4A 2012-12-04 2012-12-04 一种内置搜索语音短信功能的移动终端及其搜索方法 Expired - Fee Related CN103856600B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210512740.4A CN103856600B (zh) 2012-12-04 2012-12-04 一种内置搜索语音短信功能的移动终端及其搜索方法
US14/649,658 US9992321B2 (en) 2012-12-04 2013-07-09 Mobile terminal with a built-in voice message searching function and corresponding searching method
EP13788386.4A EP2919429A4 (en) 2012-12-04 2013-07-09 MOBILE TERMINAL INCORPORATING SHORT MESSAGE SEARCHING FUNCTION AND ASSOCIATED SEARCH METHOD
PCT/CN2013/079091 WO2013167023A2 (zh) 2012-12-04 2013-07-09 一种内置搜索语音短信功能的移动终端及其搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210512740.4A CN103856600B (zh) 2012-12-04 2012-12-04 一种内置搜索语音短信功能的移动终端及其搜索方法

Publications (2)

Publication Number Publication Date
CN103856600A CN103856600A (zh) 2014-06-11
CN103856600B true CN103856600B (zh) 2016-09-28

Family

ID=49551349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210512740.4A Expired - Fee Related CN103856600B (zh) 2012-12-04 2012-12-04 一种内置搜索语音短信功能的移动终端及其搜索方法

Country Status (4)

Country Link
US (1) US9992321B2 (zh)
EP (1) EP2919429A4 (zh)
CN (1) CN103856600B (zh)
WO (1) WO2013167023A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105513588B (zh) * 2014-09-22 2019-06-25 联想(北京)有限公司 一种信息处理方法及电子设备
CN109220773B (zh) * 2018-09-06 2021-11-02 东北农业大学 一种耐抽薹甘蓝品种的培育方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414412A (zh) * 2007-10-19 2009-04-22 陈修志 互动式声控儿童教育学习装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8911461D0 (en) * 1989-05-18 1989-07-05 Smiths Industries Plc Temperature adaptors
EP1315098A1 (en) * 2001-11-27 2003-05-28 Telefonaktiebolaget L M Ericsson (Publ) Searching for voice messages
CN1180597C (zh) 2002-03-14 2004-12-15 四川长城软件科技有限公司 通信中的语音短信息系统
JP2004286834A (ja) * 2003-03-19 2004-10-14 Mamiya Op Co Ltd 語学学習機
US8150683B2 (en) 2003-11-04 2012-04-03 Stmicroelectronics Asia Pacific Pte., Ltd. Apparatus, method, and computer program for comparing audio signals
KR100800873B1 (ko) * 2005-10-28 2008-02-04 삼성전자주식회사 음성 신호 검출 시스템 및 방법
JP2009282690A (ja) * 2008-05-21 2009-12-03 Toshiba Corp 情報検索方法および情報処理装置
US8359205B2 (en) * 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
KR20100067174A (ko) 2008-12-11 2010-06-21 한국전자통신연구원 음성 인식을 이용한 메타데이터 검색기, 검색 방법, iptv 수신 장치
US20100305948A1 (en) * 2009-06-01 2010-12-02 Adam Simone Phoneme Model for Speech Recognition
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
CN102523349A (zh) 2011-12-22 2012-06-27 苏州巴米特信息科技有限公司 一种特色的手机语音搜索的方法
US9286904B2 (en) * 2012-03-06 2016-03-15 Ati Technologies Ulc Adjusting a data rate of a digital audio stream based on dynamically determined audio playback system capabilities
US8681950B2 (en) * 2012-03-28 2014-03-25 Interactive Intelligence, Inc. System and method for fingerprinting datasets
WO2013184520A1 (en) * 2012-06-04 2013-12-12 Stone Troy Christopher Methods and systems for identifying content types
US9251406B2 (en) * 2012-06-20 2016-02-02 Yahoo! Inc. Method and system for detecting users' emotions when experiencing a media program
US9263059B2 (en) * 2012-09-28 2016-02-16 International Business Machines Corporation Deep tagging background noises

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414412A (zh) * 2007-10-19 2009-04-22 陈修志 互动式声控儿童教育学习装置

Also Published As

Publication number Publication date
EP2919429A2 (en) 2015-09-16
CN103856600A (zh) 2014-06-11
EP2919429A4 (en) 2015-12-09
WO2013167023A3 (zh) 2013-12-27
WO2013167023A2 (zh) 2013-11-14
US9992321B2 (en) 2018-06-05
US20150319286A1 (en) 2015-11-05

Similar Documents

Publication Publication Date Title
CN102111314B (zh) 一种基于蓝牙传输的智能家居语音控制系统及方法
CN103095911B (zh) 一种通过语音唤醒寻找手机的方法及系统
CN104679729B (zh) 录音留言有效性处理方法及系统
CN104168353B (zh) 蓝牙耳机及其语音交互控制方法
US9552815B2 (en) Speech understanding method and system
CN111210021B (zh) 一种音频信号处理方法、模型训练方法以及相关装置
CN103366745B (zh) 基于语音识别保护终端设备的方法及其终端设备
CN104811559B (zh) 降噪方法、通信方法及移动终端
CN101576901B (zh) 搜索请求的产生方法
CN107122807B (zh) 一种家庭监控方法、服务端及计算机可读存储介质
CN101404160A (zh) 一种基于音频识别的语音降噪方法
CN105489221A (zh) 一种语音识别方法及装置
CN106210239A (zh) 恶意来电者声纹的自动识别方法、装置和移动终端
CN102984666B (zh) 一种通话过程中的通讯录语音信息处理方法及系统
CN104202455A (zh) 智能语音拨号的方法及装置
CN106341539A (zh) 恶意来电者声纹的自动取证方法、装置和移动终端
CN103888606A (zh) 移动终端及其解锁方法
WO2019075829A1 (zh) 语音翻译方法、装置和翻译设备
CN103856600B (zh) 一种内置搜索语音短信功能的移动终端及其搜索方法
CN101656069A (zh) 一种中文语音信息通讯系统及其通讯方法
CN108600559B (zh) 静音模式的控制方法、装置、存储介质及电子设备
JP6549009B2 (ja) 通信端末及び音声認識システム
CN110600045A (zh) 声音转换方法及相关产品
CN108537019A (zh) 一种解锁方法及装置、存储介质
CN107888745A (zh) 一种通讯录中失效号码的删除方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160928

Termination date: 20201204