CN107123418B - 一种语音消息的处理方法及移动终端 - Google Patents
一种语音消息的处理方法及移动终端 Download PDFInfo
- Publication number
- CN107123418B CN107123418B CN201710321766.3A CN201710321766A CN107123418B CN 107123418 B CN107123418 B CN 107123418B CN 201710321766 A CN201710321766 A CN 201710321766A CN 107123418 B CN107123418 B CN 107123418B
- Authority
- CN
- China
- Prior art keywords
- voice
- message
- preset
- key information
- voice message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000001914 filtration Methods 0.000 claims description 17
- 230000011218 segmentation Effects 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000008719 thickening Effects 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明涉及移动终端技术领域,公开一种语音消息的处理方法及移动终端,其中,该方法包括:检测移动终端是否接收到语音消息;如果所述移动终端接收到语音消息,提取所述语音消息中的关键信息;按照预设方式将所述关键信息以文字的形式进行显示。实施本发明实施例,能够自动提取语音消息中的关键信息,使用户在不方便收听语音消息的环境下快速理解语音消息的内容。
Description
技术领域
本发明涉及移动终端技术领域,尤其涉及一种语音消息的处理方法及移动终端。
背景技术
目前,智能手机、平板电脑等移动终端上不仅设置有基本的打电话功能,而且还具备即时聊天功能,通常,在移动终端上安装即时聊天应用软件来发送和接收文字和/或语音消息。当用户处于会议室、教室、图书馆等安静环境中,移动终端的即时聊天应用软件接收到语音消息时,在未携带耳机的情况下,如果通过放外音去收听语音消息,将会打扰到他人;如果不去收听语音消息,将可能错过一些重要信息。因此,在不方便收听语音消息的环境下,如何使用户快速理解语音消息的内容是亟需解决的问题。
发明内容
本发明实施例公开了一种语音消息的处理方法及移动终端,能够自动提取语音消息中的关键信息,使用户在不方便收听语音消息的环境下快速理解语音消息的内容。
本发明实施例第一方面公开一种语音消息的处理方法,包括:
检测移动终端是否接收到语音消息;
如果所述移动终端接收到语音消息,提取所述语音消息中的关键信息;
按照预设方式将所述关键信息以文字的形式进行显示。
作为一种可选的实施方式,在本发明实施例第一方面中,在检测移动终端是否接收到语音消息之前,所述方法还包括:
检测所述移动终端当前是否处于预设操作模式,所述预设操作模式用于触发所述移动终端在接收到语音消息时提取关键信息;
如果所述移动终端处于所述预设操作模式,则执行所述的检测移动终端是否接收到语音消息的步骤。
作为一种可选的实施方式,在本发明实施例第一方面中,所述提取所述语音消息中的关键信息之前,所述方法还包括:
对所述语音消息进行预处理,以获得预处理后的语音消息;
将所述预处理后的语音消息进行语音分割,以得到至少一段语音子消息;
其中,所述提取所述语音消息中的关键信息,包括:
识别所述至少一段语音子消息,并滤除无效信息;
从滤除后的至少一段语音子消息中提取关键信息,并将提取的关键信息进行组合。
作为一种可选的实施方式,在本发明实施例第一方面中,所述识别所述至少一段语音子消息,并滤除无效信息,包括:
将所述至少一段语音子消息与第一预设语音模型进行匹配,识别出所述至少一段语音子消息包含的内容;
将所述至少一段语音子消息与第二预设语音模型进行匹配,删除与所述第二预设语音模型相匹配的无效信息;
所述从滤除后的至少一段语音子消息中提取关键信息,并将提取的关键信息进行组合,包括:
将滤除后的至少一段语音子消息与第三预设语音模型进行匹配,从中提取与所述第三预设语音模型相匹配的关键信息,并将提取的关键信息进行组合。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
当所述至少一段语音子消息中存在内容与所述第一预设语音模型进行匹配的匹配率低于预设值时,将该内容增加标注;
其中,所述按照预设方式将所述关键信息以文字的形式进行显示,包括:
当所述关键信息中包含带有标注的内容时,按照预设方式显示未带有标注的关键信息和带有标注的关键信息。
本发明实施例第二方面公开一种移动终端,包括:
第一检测单元,用于检测移动终端是否接收到语音消息;
提取单元,用于在所述第一检测单元检测出所述移动终端接收到语音消息时,提取所述语音消息中的关键信息;
显示单元,用于按照预设方式将所述关键信息以文字的形式进行显示。
作为一种可选的实施方式,在本发明实施例第二方面中,所述移动终端还包括:
第二检测单元,用于在所述第一检测单元检测移动终端是否接收到语音消息之前,检测所述移动终端当前是否处于预设操作模式,所述预设操作模式用于触发所述移动终端在接收到语音消息时提取关键信息;
所述第一检测单元具体用于在所述第二检测单元检测出所述移动终端处于所述预设操作模式时,检测移动终端是否接收到语音消息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述移动终端还包括:
预处理单元,用于对所述语音消息进行预处理,以获得预处理后的语音消息;
语音分割单元,用于将所述预处理后的语音消息进行语音分割,以得到至少一段语音子消息;
所述提取单元包括:
语音识别子单元,用于识别所述至少一段语音子消息,并滤除无效信息;
信息提取子单元,用于从滤除后的至少一段语音子消息中提取关键信息,并将提取的关键信息进行组合。
作为一种可选的实施方式,在本发明实施例第二方面中,所述语音识别子单元具体用于将所述至少一段语音子消息与第一预设语音模型进行匹配,识别出所述至少一段语音子消息包含的内容,以及将所述至少一段语音子消息与第二预设语音模型进行匹配,删除与所述第二预设语音模型相匹配的无效信息;
所述信息提取子单元具体用于将滤除后的至少一段语音子消息与第三预设语音模型进行匹配,从中提取与所述第三预设语音模型相匹配的关键信息,并将提取的关键信息进行组合。
作为一种可选的实施方式,在本发明实施例第二方面中,所述提取单元还包括:
标注子单元,用于当所述语音识别子单元识别出所述至少一段语音子消息中存在内容与所述第一预设语音模型进行匹配的匹配率低于预设值时,将该内容增加标注;
所述显示单元具体用于当所述关键信息中包含带有标注的内容时,按照预设方式显示未带有标注的关键信息和带有标注的关键信息。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,移动终端在接收到语音消息后,可以提取出语音消息中的关键信息,并按照预设方式将该关键信息以文字的形式显示在移动终端上。可见,实施本发明实施例,当移动终端处于会议室、教室、图书馆等安静环境下接收到语音消息而不方便收听时,可以自动提取出语音消息中的关键信息并显示出来,从而使得用户在不方便收听语音消息的环境下能够快速理解语音消息的内容,以免错过重要信息,进而有效改善用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种语音消息的处理方法的流程示意图;
图2是本发明实施例公开的另一种语音消息的处理方法的流程示意图;
图3是本发明实施例公开的一种移动终端的结构示意图;
图4是本发明实施例公开的另一种移动终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种语音消息的处理方法及移动终端,能够自动提取语音消息中的关键信息,使用户在不方便收听语音消息的环境下快速理解语音消息的内容,以免错过重要信息,进而有效改善用户体验。以下将结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种语音消息的处理方法的流程示意图。其中,该语音消息的处理方法应用于移动终端中。如图1所示,该语音消息的处理方法可以包括以下步骤。
101、检测移动终端是否接收到语音消息,如果是,则执行步骤102;如果否,则结束本流程。
本发明实施例中,移动终端可以包括但不限于移动手机、移动平板、个人数字助理(Personal Digital Assistant,PDA)、移动互联网设备(Mobile Internet Device,MID)、智能穿戴设备(如智能手表、智能手环等)等各种设备。其中,移动终端可以支持包括但不限于以下网络技术:全球移动通信系统(Global System for Mobile Communications,GSM)、通用分组无线业务(General Packet Radio Service,GPRS)、码分多址(Code DivisionMultiple Access,CDMA),宽带码分多址(W-CDMA)、CDMA2000、IMT单载波(IMT SingleCarrier)、增强型数据速率GSM演进(Enhanced Data Rates for GSM Evolution,EDGE)、长期演进技术(Long-Term Evolution,LTE)、高级长期演进技术、时分长期演进技术(Time-Division LTE,TD-LTE)、高性能无线电局域网(HighPerformance Radio Local AreaNetwork,HiperLAN)、高性能无线电广域网(HiperWAN)、本地多点派发业务(LocalMultipoint Distribution Service,LMDS)、全微波存取全球互通(WiMAX)、紫蜂协议(ZigBee)、蓝牙、正交频分复用技术(OFDM)、大容量空分多路存取(HC-SDMA)、通用移动电信系统(UMTS)、通用移动电信系统时分双工(UMTS-TDD)、演进式高速分组接入(HSPA+)、时分同步码分多址(TD-SCDMA)、演进数据最优化(EV-DO)、数字增强无绳通信(DECT)及其他。
本发明实施例中,移动终端中可以安装有即时聊天应用软件,该即时聊天应用软件可以是移动终端自带的,也可以是下载的第三方应用软件。即时聊天应用软件中可以设置不同的通信模式,如文字消息聊天模式、语音消息聊天模式和/或视频聊天模式等等,以实现与他人进行通信。当进入即时聊天应用软件中后,用户可以选择通信的模式,当用户选择文字消息聊天模式时,通过输入和发送文字消息实现与他人的通信;当用户选择语音消息聊天模式时,通过录制和发送语音消息实现与他人的通信;当用户选择视频聊天模式时,通过发起视频实现与他人的通信。其中,即时聊天应用软件中可以通过设置不同的按钮、语音或手势,以实现对不同通信模式的切换。移动终端可以发送文字消息、语音消息或视频等与他人进行交互,同时也可以接收他人发送过来的文字消息、语音消息或视频等。
本发明实施例中,可以实时检测移动终端是否接收到语音消息,也可以每隔特定时间检测移动终端是否接收到语音消息,本发明实施例不作限定。
作为一种可选的实施方式,在执行步骤101之前,图1所描述的方法还可以包括以下步骤:
11)检测移动终端当前是否处于预设操作模式,如果移动终端当前处于预设操作模式,则触发移动终端执行步骤101。
在该实施方式中,预设操作模式可以用于触发移动终端在接收到语音消息时提取出其中包含的关键信息。预设操作模式可以是用户根据自身需求自行设置的,可以包括但不限于静音模式、振动模式、会议模式等安静环境下的操作模式。移动终端可以实时或每隔一定时间检测自身当前是否处于预设操作模式。当移动终端处于预设操作模式下时,才在接收到语音消息时提取出其中的关键信息,否则,对接收到的语音消息不进行关键信息的提取。当然,预设操作模式可以根据用户的设置进行变更,如增加某些操作模式或删除某个操作模式等。预设操作模式也可以包括标准模式,即可以在非安静环境的操作模式(如响铃模式)下进行语音消息中的关键信息的提取,该实施方式对此不作限定。
可以理解的是,步骤11)可以先于步骤101执行,即先检测是否处于预设操作模式后再检测是否接收到语音消息;也可以后于步骤101执行,即先检测是否接收到语音消息再检测是否处于预设操作模式;还可以与步骤101同步或交叉执行,本发明实施例不作限定。
102、提取语音消息中的关键信息。
本发明实施例中,当检测出移动终端接收到语音消息后,可以对该语音消息进行识别,并提取出该语音消息中的关键信息。其中,语音消息中的关键信息可以包括但不限于姓名、人称代词、时间、地点、事件等等。例如,提取的关键信息为“张三上午10点开会”。
本发明实施例中,移动终端中可以预先设置若干个语音模型,将语音消息中的内容逐一与这些语音模型进行匹配,以识别中语音消息中的关键信息。此外,也可以将语音消息一一与预设的多个语音模型进行匹配,以将该语音消息识别成对应的文字信息,再将得到的文字信息与移动终端中预设的多个文字模型进行对比,以提取出其中的关键信息。
103、按照预设方式将该关键信息以文字的形式进行显示。
本发明实施例中,在从语音消息中提取出关键信息后,移动终端可以将该关键信息以文字的形式进行输出显示。具体的,可以将该关键信息以文字的形式显示在聊天窗口中该语音消息的旁边,此时用户无需点击收听语音消息即可快速理解语音消息中的主要内容;或者,可以将该关键信息以文字的形式显示在移动终端的下拉菜单通知栏中,此时无需点击进入即时聊天应用软件即可快速了解语音消息中的主要内容。
作为一种可选的实施方式,步骤103按照预设方式将该关键信息以文字的形式进行显示的具体实施方式可以包括以下步骤:
12)按照预设字体大小将该关键信息以文字的形式进行显示;和/或
13)按照预设字体颜色将该关键信息以文字的形式进行显示。
在该实施方式中,可以将关键信息以预设字体大小和/或预设字体颜色进行显示,还可以将关键信息加粗、倾斜、增加下划线、增加背景颜色和/或增加外框等方式进行显示,该实施方式不作限定。例如,将关键信息显示时设置为宋体五号字、加粗、文字标红等等。通过实施该实施方式,按照预设方式来显示关键信息可以方便用户区分关键信息与其他接收到的文字消息。
可见,实施图1所描述的方法,移动终端在接收到语音消息后自动提取出语音消息中的关键信息并显示出来,可以使得用户快速获取到语音消息中的内容,尤其当移动终端处于会议室、教室、图书馆等安静环境下接收到语音消息而不方便收听时,能够使用户快速理解语音消息的内容,以免错过重要信息,进而有效改善用户体验。
实施例二
请参阅图2,图2是本发明实施例公开的另一种语音消息的处理方法的流程示意图。其中,该语音消息的处理方法应用于移动终端中。如图2所示,该语音消息的处理方法可以包括以下步骤。
201、检测移动终端是否接收到语音消息,如果是,则执行步骤202;如果否,则结束本流程。
202、对语音消息进行预处理,以获得预处理后的语音消息。
本发明实施例中,当移动终端接收到语音消息后,可以对语音消息进行预处理,以得到预处理后的语音消息。其中,对语音消息进行预处理的具体实施方式可以包括但不限于:按照预设好的降噪值对语音消息进行去噪滤波处理,根据预设的音频分贝值对语音消息再次进行滤波处理(例如将语音消息中的分贝值低于预设的音频分贝值的内容进行删除),以去除语音消息中的各种噪声,避免呼吸声、杂音异响等干扰,从而提升语音消息识别成文本的精度。
203、将预处理后的语音消息进行语音分割,以得到至少一段语音子消息。
本发明实施例中,移动终端可以将经过预处理后的语音消息分割为一段段独立的语音子消息,通过分析各语音子消息的特点,从而可以简化语音识别的操作过程。
作为一种可选的实施方式,步骤203将预处理后的语音消息进行语音分割,以得到至少一段语音子消息的具体实施方式可以包括但不限于以下步骤:
21)将预处理后的语音消息按照预设时长进行语音分割,以得到至少一段语音子消息;或者,
22)将预处理后的语音消息按照预设语音段数进行语音分割,以得到至少一段语音子消息;或者,
23)获取预处理后的语音消息中所有的停顿位置,并根据获取的停顿位置将预处理后的语音消息进行语音分割,以得到至少一段语音子消息。
在该实施方式中,可以将语音消息按照预设时长进行分割,例如,一段语音消息总时长为20秒,预设时长为5秒,则将该语音消息分割为4段,每段的时长为5秒。可以理解的是,当语音消息的总时长不是预设时长的整数倍时,则分割后的最后一段将不足预设时长,其他每段均为预设时长。也可以将语音消息按照预设语音段数进行平均分割处理,例如,一段语音消息总时长为20秒,预设语音段数为5段,则将该语音消息均分为5段,每段的时长为4秒。此外,还可以获取语音消息中的停顿位置,并将语音消息按照停顿位置的分布进行分割,其中,停顿位置的获取可以根据每两个字节之间的停顿时长是否超过指定时长来判断,如果超过,则为一次停顿,否则,不是停顿位置。例如,获取到一段语音消息中存在两个停顿位置,则将该语音消息在每一停顿位置处进行分割,共分割为3段。通过实施该实施方式,对语音消息进行分割,可以同步对分割后的语音子消息进行识别处理,从而提高了语音识别的处理效率。
204、识别上述至少一段语音子消息,并滤除无效信息。
本发明实施例中,当将接收到的语音消息进行预处理并分割为至少一段语音子消息后,可以分别对各段语音子消息进行识别,以识别出各段语音子消息中包含的内容,并从中滤除无效信息。其中,无效信息可以是一些常见的语气用词(如嗯、啊、哦、吧、呢等等)和口头禅(如然后、所以等等)。
作为一种可选的实施方式,步骤204识别上述至少一段语音子消息,并滤除无效信息的具体实施方式可以包括以下步骤:
24)将上述至少一段语音子消息与第一预设语音模型进行匹配,识别出上述至少一段语音子消息包含的内容;
25)将上述至少一段语音子消息与第二预设语音模型进行匹配,删除与第二预设语音模型相匹配的无效信息。
在该实施方式中,对于每段语音子消息,可以分别提取出其中的语音特征信息,并与事先存储的第一预设语音模型进行匹配,从而将匹配率最高的语音模型作为识别结果。第一预设语音模型中包括多个语音字词的训练模型,可以采用孤立词语音识别、隐马尔可夫模型(Hidden Markov Model,HMM)、动态时间规整(Dynamic Time Warping,DTW)等方法来完成语音识别过程。
在该实施方式中,当识别出各段语音子消息中包含的内容后,可以进一步与第二预设语音模型进行匹配,从中将匹配率最高的语音字词作为无效信息。其中,第一预设语音模型可以包含有第二预设语音模型。第二预设语音模型中包含多个无效语音字词的训练模型,如常用语气词和/或口头禅的语音模型。通过实施该实施方式,通过分析各段语音子消息的特征,删除掉与常用语气词和/或口头禅等字词,从而可以简化语音消息,减少对不必要字词的处理。
作为一种可选的实施方式,在执行步骤204之后,图2所描述的方法还可以包括以下步骤:
26)当识别出相邻的多段语音子消息的内容相同时,从中保留一段语音子消息,并删除其余相同的语音子消息。
在该实施方式中,可以删除语音消息中连续重复的语音段,例如,连续出现几个好的、是的、可以、不行等字词,则仅保留一个,删除其余相同的,从而可以进一步简化语音消息,避免对重复字词的处理。
205、从滤除后的至少一段语音子消息中提取关键信息,并将提取的关键信息进行组合。
本发明实施例中,在识别出各段语音子消息,并滤除掉无效信息和/或重复信息时,可以从滤除后的语音子消息中提取出关键信息,并将提取的关键信息进行组合处理,可以按照时间的先后顺序组合成一段文字。其中,关键信息可以包括但不限于姓名、人称代词、时间、地点、事件等信息。
具体的,步骤205从滤除后的至少一段语音子消息中提取关键信息,并将提取的关键信息进行组合的具体实施方式可以包括以下步骤:
27)将滤除后的至少一段语音子消息与第三预设语音模型进行匹配,从中提取与第三预设语音模型相匹配的关键信息,并将提取的关键信息进行组合。
其中,第一预设语音模型可以包含有第三预设语音模型。
206、按照预设方式将关键信息以文字的形式进行显示。
本发明实施例中,可以将组合后的关键信息以文字的形式按照预设方式显示在聊天窗口中对应语音消息的旁边,也可以显示在移动终端的下拉菜单通知栏中,在此不作限定。如果关键信息不能较为清楚的表达出含义时,用户可以进一步操作查看到语音消息对应的详细文字信息,例如,可以在语音消息旁设置一个按钮,点击即可显示出对应的文字信息;或者双击或长按语音消息即可显示出对应的文字信息等。
作为一种可选的实施方式,当执行步骤24)识别出上述至少一段语音子消息中存在内容与第一预设语音模型进行匹配的匹配率低于预设值时,图2所描述的方法还可以包括以下步骤:
28)将该内容增加标注;
相应地,当最后获取的关键信息中包含带有标注的内容时,步骤206按照预设方式将关键信息以文字的形式进行显示的具体实施方式可以为:
按照预设方式显示未带有标注的关键信息和带有标注的关键信息。
在该实施方式中,当语音消息中存在内容与第一预设语音模型进行匹配时,所有的匹配率均低于预设值,或者语音消息中存在内容与第一预设语音模型中的多个语音模型的匹配率相当(相同或差距低于临界值)时,说明语音音质差或发音不太标准,这些语音识别准确率低,为避免误导用户,将这些语音识别出的文字加标注进行区分。其中,加标注的方式可以包括但不限于用括号括起来、字体与其他文字不同、文字倾斜、加粗等处理。当提取的关键信息中存在加标注的文字时,则仍然以加标注的形式进行显示。
作为一种可选的实施方式,在步骤201检测移动终端是否接收到语音消息之前,或者在步骤201检测出移动终端接收到语音消息之后,可以检测移动终端当前是否处于预设操作模式下,当处于预设操作模式下时,则触发移动终端在接收到语音消息时提取关键信息。
举例来说,当移动终端开启静音、震动或会议模式时,将自动打开关键信息语音识别功能,在即时聊天应用软件中接收到语音消息时会自动识别出语音中的关键信息并显示在聊天窗口中,供用户查看。通过这个功能,用户在开会、培训或其他安静的环境中也可以正常处理语音消息,避免错过重要信息。
可见,实施图2所描述的方法,移动终端在接收到语音消息后自动提取出语音消息中的关键信息并显示出来,可以使得用户快速获取到语音消息中的内容,尤其当移动终端处于会议室、教室、图书馆等安静环境下接收到语音消息而不方便收听时,能够使用户快速理解语音消息的内容,以免错过重要信息,进而有效改善用户体验。
实施例三
请参阅图3,图3是本发明实施例公开的一种移动终端的结构示意图,可以用于执行上述公开的语音消息的处理方法。如图3所示,该移动终端可以包括:
第一检测单元301,用于检测移动终端是否接收到语音消息;
提取单元302,用于在第一检测单元301检测出移动终端接收到语音消息时,提取语音消息中的关键信息;
显示单元303,用于按照预设方式将该关键信息以文字的形式进行显示。
本发明实施例中,第一检测单元301可以实时或每隔特定时间检测移动终端是否接收到语音消息,当检测出接收到语音消息时,可以利用提取单元302自动提取出语音消息中的关键信息,并通过显示单元303以文字形式按照预设方式来显示该关键信息。其中,提取的关键信息可以包括但不限于姓名、人称代词、时间、地点、事件等等。
作为一种可选的实施方式,显示单元303可以将关键信息以文字的形式显示在聊天窗口中该语音消息的旁边;或者,显示单元303可以将关键信息以文字的形式显示在移动终端的下拉菜单通知栏中。具体的,显示单元303可以按照预设字体大小将关键信息以文字的形式进行显示;和/或,显示单元303可以按照预设字体颜色将关键信息以文字的形式进行显示。此外,显示单元303还可以将关键信息加粗、倾斜、增加下划线、增加背景颜色和/或增加外框等方式进行显示,在此不作限定。
其中,实施图3所描述的移动终端,在接收到语音消息后自动提取出语音消息中的关键信息并显示出来,可以使得用户快速获取到语音消息中的内容,尤其当移动终端处于会议室、教室、图书馆等安静环境下接收到语音消息而不方便收听时,能够使用户快速理解语音消息的内容,以免错过重要信息,进而有效改善用户体验。
实施例四
请参阅图4,图4是本发明实施例公开的另一种移动终端的结构示意图,可以用于执行上述公开的语音消息的处理方法。其中,图4所示的移动终端是由图3所示的移动终端进行优化得到的。与图3所示的移动终端相比较,图4所示的移动终端还可以包括:
第二检测单元304,用于在第一检测单元301检测移动终端是否接收到语音消息之前,检测移动终端当前是否处于预设操作模式,该预设操作模式用于触发移动终端在接收到语音消息时提取关键信息;
相应地,第一检测单元301具体用于在第二检测单元304检测出移动终端处于预设操作模式时,检测移动终端是否接收到语音消息。
作为一种可选的实施方式,图4所示的移动终端还可以包括:
预处理单元305,用于在第一检测单元301检测出移动终端接收到语音消息时,对接收到的语音消息进行预处理,以获得预处理后的语音消息;
语音分割单元306,用于将预处理后的语音消息进行语音分割,以得到至少一段语音子消息;
相应地,提取单元302可以进一步包括:
语音识别子单元3021,用于在语音分割单元306分割语音得到至少一段语音子消息后,识别上述至少一段语音子消息,并滤除无效信息;
信息提取子单元3022,用于从滤除后的至少一段语音子消息中提取关键信息,并将提取的关键信息进行组合,以使得显示单元303显示组合后的关键信息。
作为一种可选的实施方式,语音识别子单元3021具体可以用于将上述至少一段语音子消息与第一预设语音模型进行匹配,识别出上述至少一段语音子消息包含的内容,以及将上述至少一段语音子消息与第二预设语音模型进行匹配,删除与第二预设语音模型相匹配的无效信息;
信息提取子单元3022具体可以用于将滤除后的至少一段语音子消息与第三预设语音模型进行匹配,从中提取与第三预设语音模型相匹配的关键信息,并将提取的关键信息进行组合。
作为一种可选的实施方式,在图4所示的移动终端中,提取单元302还可以包括:
标注子单元3023,用于当语音识别子单元3021识别出上述至少一段语音子消息中存在内容与第一预设语音模型进行匹配的匹配率低于预设值时,将该内容增加标注;
相应地,显示单元303具体可以用于当信息提取子单元3022提取的关键信息中包含带有标注的内容时,按照预设方式显示未带有标注的关键信息和带有标注的关键信息。
其中,实施图4所描述的移动终端,在接收到语音消息后自动提取出语音消息中的关键信息并显示出来,可以使得用户快速获取到语音消息中的内容,尤其当移动终端处于会议室、教室、图书馆等安静环境下接收到语音消息而不方便收听时,能够使用户快速理解语音消息的内容,以免错过重要信息,进而有效改善用户体验。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例移动终端中的单元或子单元可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种语音消息的处理方法及移动终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (6)
1.一种语音消息的处理方法,其特征在于,包括:
检测移动终端是否接收到语音消息;
如果所述移动终端接收到语音消息,提取所述语音消息中的关键信息;
按照预设方式将所述关键信息以文字的形式进行显示;
所述提取所述语音消息中的关键信息之前,所述方法还包括:
对所述语音消息进行预处理,以获得预处理后的语音消息;
将所述预处理后的语音消息进行语音分割,以得到至少一段语音子消息;
其中,对所述语音消息进行预处理,以获得预处理后的语音消息包括:按照预设好的降噪值对所述语音消息进行去噪滤波处理,根据预设的音频分贝值对去噪滤波处理后的语音消息再次进行滤波处理;
所述提取所述语音消息中的关键信息,包括:
将所述至少一段语音子消息与第一预设语音模型进行匹配,识别出所述至少一段语音子消息包含的内容;
将所述至少一段语音子消息与第二预设语音模型进行匹配,删除与所述第二预设语音模型相匹配的无效信息;
当识别出相邻的多段语音子消息的内容相同时,从中保留一段语音子消息,并删除其余相同的语音子消息;
将滤除后的至少一段语音子消息与第三预设语音模型进行匹配,从中提取与所述第三预设语音模型相匹配的关键信息,并将提取的关键信息进行组合。
2.根据权利要求1所述的方法,其特征在于,在检测移动终端是否接收到语音消息之前,所述方法还包括:
检测所述移动终端当前是否处于预设操作模式,所述预设操作模式用于触发所述移动终端在接收到语音消息时提取关键信息;
如果所述移动终端处于所述预设操作模式,则执行所述的检测移动终端是否接收到语音消息的步骤。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述至少一段语音子消息中存在内容与所述第一预设语音模型进行匹配的匹配率低于预设值时,将该内容增加标注;
其中,所述按照预设方式将所述关键信息以文字的形式进行显示,包括:
当所述关键信息中包含带有标注的内容时,按照预设方式显示未带有标注的关键信息和带有标注的关键信息。
4.一种移动终端,其特征在于,包括:
第一检测单元,用于检测移动终端是否接收到语音消息;
提取单元,用于在所述第一检测单元检测出所述移动终端接收到语音消息时,提取所述语音消息中的关键信息;
显示单元,用于按照预设方式将所述关键信息以文字的形式进行显示;
预处理单元,用于在所述提取单元提取所述语音消息中的关键信息之前,对所述语音消息进行预处理,以获得预处理后的语音消息;
语音分割单元,用于将所述预处理后的语音消息进行语音分割,以得到至少一段语音子消息;
其中,对所述语音消息进行预处理,以获得预处理后的语音消息包括:按照预设好的降噪值对所述语音消息进行去噪滤波处理,根据预设的音频分贝值对去噪滤波处理后的语音消息再次进行滤波处理;
所述提取所述语音消息中的关键信息,包括:
将所述至少一段语音子消息与第一预设语音模型进行匹配,识别出所述至少一段语音子消息包含的内容;
将所述至少一段语音子消息与第二预设语音模型进行匹配,删除与所述第二预设语音模型相匹配的无效信息;
当识别出相邻的多段语音子消息的内容相同时,从中保留一段语音子消息,并删除其余相同的语音子消息;
将滤除后的至少一段语音子消息与第三预设语音模型进行匹配,从中提取与所述第三预设语音模型相匹配的关键信息,并将提取的关键信息进行组合。
5.根据权利要求4所述的移动终端,其特征在于,还包括:
第二检测单元,用于在所述第一检测单元检测移动终端是否接收到语音消息之前,检测所述移动终端当前是否处于预设操作模式,所述预设操作模式用于触发所述移动终端在接收到语音消息时提取关键信息;
所述第一检测单元具体用于在所述第二检测单元检测出所述移动终端处于所述预设操作模式时,检测移动终端是否接收到语音消息。
6.根据权利要求4所述的移动终端,其特征在于,所述提取单元还包括:
标注子单元,用于当所述语音识别子单元识别出所述至少一段语音子消息中存在内容与所述第一预设语音模型进行匹配的匹配率低于预设值时,将该内容增加标注;
所述显示单元具体用于当所述关键信息中包含带有标注的内容时,按照预设方式显示未带有标注的关键信息和带有标注的关键信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710321766.3A CN107123418B (zh) | 2017-05-09 | 2017-05-09 | 一种语音消息的处理方法及移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710321766.3A CN107123418B (zh) | 2017-05-09 | 2017-05-09 | 一种语音消息的处理方法及移动终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107123418A CN107123418A (zh) | 2017-09-01 |
CN107123418B true CN107123418B (zh) | 2020-12-25 |
Family
ID=59726758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710321766.3A Active CN107123418B (zh) | 2017-05-09 | 2017-05-09 | 一种语音消息的处理方法及移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107123418B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107835117A (zh) * | 2017-10-19 | 2018-03-23 | 上海爱优威软件开发有限公司 | 一种即时通信方法及系统 |
CN108281145B (zh) * | 2018-01-29 | 2021-07-02 | 南京地平线机器人技术有限公司 | 语音处理方法、语音处理装置和电子设备 |
CN108039175B (zh) * | 2018-01-29 | 2021-03-26 | 北京百度网讯科技有限公司 | 语音识别方法、装置及服务器 |
CN109062404B (zh) * | 2018-07-20 | 2020-03-24 | 东北大学 | 一种应用于智能儿童早教机的交互系统及方法 |
CN109446533B (zh) * | 2018-09-17 | 2020-12-22 | 深圳市沃特沃德股份有限公司 | 蓝牙翻译机、蓝牙翻译的交互方式及其装置 |
CN113852714A (zh) * | 2020-06-09 | 2021-12-28 | 华为技术有限公司 | 一种用于电子设备的交互方法和电子设备 |
CN111798835A (zh) * | 2020-07-25 | 2020-10-20 | 深圳市维度统计咨询股份有限公司 | 一种语音识别转化系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101527138A (zh) * | 2008-03-05 | 2009-09-09 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
CN102136273A (zh) * | 2010-01-21 | 2011-07-27 | 比亚迪股份有限公司 | 一种电子设备的音频处理装置及方法 |
EP2821992A1 (en) * | 2012-07-09 | 2015-01-07 | Huawei Device Co., Ltd. | Method for updating voiceprint feature model and terminal |
CN104678170A (zh) * | 2013-12-03 | 2015-06-03 | 国家电网公司 | 一种基于谐波分析仪的电力谐波分析方法和谐波分析仪 |
CN105849804A (zh) * | 2013-12-23 | 2016-08-10 | 美国亚德诺半导体公司 | 过滤噪声的计算高效方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006240826A (ja) * | 2005-03-03 | 2006-09-14 | Mitsubishi Electric Corp | エレベータかご内表示装置 |
CN101931701A (zh) * | 2010-08-25 | 2010-12-29 | 宇龙计算机通信科技(深圳)有限公司 | 一种通话过程中联系人信息的提示方法、系统及移动终端 |
CN102447774A (zh) * | 2010-09-30 | 2012-05-09 | 联想(北京)有限公司 | 一种接听来电的方法及通信终端 |
JP5799621B2 (ja) * | 2011-07-11 | 2015-10-28 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN103379460A (zh) * | 2012-04-20 | 2013-10-30 | 华为终端有限公司 | 一种语音消息处理方法及终端 |
CN103577144B (zh) * | 2012-07-23 | 2018-11-27 | 上海博泰悦臻电子设备制造有限公司 | 车载设备的语音输入方法及其语音输入系统 |
CN104900226A (zh) * | 2014-03-03 | 2015-09-09 | 联想(北京)有限公司 | 一种信息处理方法和装置 |
CN104517607A (zh) * | 2014-12-16 | 2015-04-15 | 佛山市顺德区美的电热电器制造有限公司 | 滤除语音控制电器中的噪声的方法及语音控制电器 |
CN106558311B (zh) * | 2015-09-30 | 2020-11-27 | 北京奇虎科技有限公司 | 语音内容提示方法和装置 |
US20170116180A1 (en) * | 2015-10-23 | 2017-04-27 | J. Edward Varallo | Document analysis system |
CN105654945B (zh) * | 2015-10-29 | 2020-03-06 | 乐融致新电子科技(天津)有限公司 | 一种语言模型的训练方法及装置、设备 |
CN105681564A (zh) * | 2016-01-25 | 2016-06-15 | 宇龙计算机通信科技(深圳)有限公司 | 一种消息提醒方法及装置 |
CN106504746B (zh) * | 2016-10-28 | 2020-02-11 | 普强信息技术(北京)有限公司 | 一种从语音数据中提取结构化交通路况信息的方法 |
-
2017
- 2017-05-09 CN CN201710321766.3A patent/CN107123418B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101527138A (zh) * | 2008-03-05 | 2009-09-09 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
CN102136273A (zh) * | 2010-01-21 | 2011-07-27 | 比亚迪股份有限公司 | 一种电子设备的音频处理装置及方法 |
EP2821992A1 (en) * | 2012-07-09 | 2015-01-07 | Huawei Device Co., Ltd. | Method for updating voiceprint feature model and terminal |
CN104678170A (zh) * | 2013-12-03 | 2015-06-03 | 国家电网公司 | 一种基于谐波分析仪的电力谐波分析方法和谐波分析仪 |
CN105849804A (zh) * | 2013-12-23 | 2016-08-10 | 美国亚德诺半导体公司 | 过滤噪声的计算高效方法 |
Non-Patent Citations (2)
Title |
---|
"Text Formating From speech";RonHoory;《Researchgate》;20051231;全文 * |
"基于ZigBee节点的智能家居子系统语音控制设计";赵奎兵;《现代电子技术》;20121231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107123418A (zh) | 2017-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107123418B (zh) | 一种语音消息的处理方法及移动终端 | |
CN111817943B (zh) | 一种基于即时通讯应用的数据处理方法和装置 | |
CN106024009B (zh) | 音频处理方法及装置 | |
CN103888581B (zh) | 一种通信终端及其记录通话信息的方法 | |
CN107172256B (zh) | 耳机通话自适应调整方法、装置、移动终端及存储介质 | |
CN103577965B (zh) | 一种事务提醒方法和装置 | |
CN106302933B (zh) | 通话语音信息处理方法及终端 | |
CN105224601B (zh) | 一种提取时间信息的方法和装置 | |
KR101944416B1 (ko) | 영상 통화 분석 서비스를 제공하기 위한 방법 및 그 전자 장치 | |
CN108874904A (zh) | 语音消息搜索方法、装置、计算机设备及存储介质 | |
CN109151148B (zh) | 通话内容的记录方法、装置、终端及计算机可读存储介质 | |
CN110111778B (zh) | 一种语音处理方法、装置、存储介质及电子设备 | |
CN109002184A (zh) | 一种输入法候选词的联想方法和装置 | |
CN106484134A (zh) | 基于安卓系统的语音输入标点符号的方法及装置 | |
CN103442119A (zh) | 在通话过程中自动提取信息的系统及方法 | |
CN106953962B (zh) | 一种通话录音方法及装置 | |
EP2913822B1 (en) | Speaker recognition | |
US9093075B2 (en) | Recognizing repeated speech in a mobile computing device | |
CN109887492B (zh) | 一种数据处理方法、装置和电子设备 | |
US9894193B2 (en) | Electronic device and voice controlling method | |
CN111970295A (zh) | 基于多终端的通话事务管理方法及装置 | |
CN114038487A (zh) | 一种音频提取方法、装置、设备和可读存储介质 | |
CN104318923B (zh) | 一种语音处理方法、装置及终端 | |
CN110827815A (zh) | 一种语音识别方法、终端、系统以及计算机存储介质 | |
CN111582708A (zh) | 医疗信息的检测方法、系统、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |