CN105427864A - 通过语音添加联系人的方法及终端 - Google Patents
通过语音添加联系人的方法及终端 Download PDFInfo
- Publication number
- CN105427864A CN105427864A CN201510730698.7A CN201510730698A CN105427864A CN 105427864 A CN105427864 A CN 105427864A CN 201510730698 A CN201510730698 A CN 201510730698A CN 105427864 A CN105427864 A CN 105427864A
- Authority
- CN
- China
- Prior art keywords
- voice
- terminal
- contact person
- module
- added
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000008569 process Effects 0.000 claims description 14
- 230000009467 reduction Effects 0.000 claims description 10
- 238000002203 pretreatment Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012958 reprocessing Methods 0.000 claims description 4
- 230000008676 import Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 abstract 2
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了通过语音添加联系人的方法及终端,该方法包含以下步骤:开启步骤,开启终端语音录入联系人信息程序;语音录入步骤,收集、提取终端硬件传入的音频数据;语音预处理步骤,对原始的语音数据进行再加工;语音识别步骤,对预处理后的语音数据进行识别,并生成识别结果;联系人创建步骤,判断识别结果,创建联系人信息,并保存在终端。本发明通过语音的录入,对语音进行智能识别,能够快速、准确的实现终端的联系人信息添加功能,大大提高了用户体验。
Description
技术领域
本发明涉及移动终端技术领域,尤其涉及通过语音添加联系人的方法及终端。
背景技术
当前,手机录入联系人常用方法是通过手工输入法实现,即在新建联系人功能的页面,逐项输入联系人的姓名、号码和其他信息,然后保存到手机电话本里。这种传统的输入方法操作较为复杂,耗费时间,且对于打字不熟练的用户而言不够简便快捷。
发明内容
本发明的实施例提供通过语音添加联系人的方法及终端,有效解决了用户在需要创建联系人项时,手工输入方法操作较为复杂的缺陷。
本发明解决其技术问题所采用的技术方案,包含以下步骤:
开启步骤,开启终端语音录入联系人信息程序。
语音录入步骤,收集、提取终端硬件传入的音频数据。
语音预处理步骤,对原始的语音数据进行再加工。
优选的,语音预处理步骤包含语音去静音步骤,降噪步骤和自增益过程步骤。
语音识别步骤,对预处理后的语音数据进行识别,并生成识别结果。
优选的,语音识别步骤中,其识别结果可以以文字窗口形式展示,也可以以语音窗口形式展示。
联系人创建步骤,判断识别结果,创建联系人信息,并保存在终端。
优选的,所述联系人创建步骤中,判断识别结果包含语音识别准确性的判断和联系人信息是否冲突的判断。
优选的,所述联系人信息是否冲突的判断是指新录入的联系人信息是否已经录入联系人数据库。
本发明另一目的在于提供通过语音添加联系人的终端,所述终端包括以下模块。
开启模块,用于开启终端语音录入联系人信息程序。
语音录入模块,用于收集、提取终端硬件传入的音频数据。
语音预处理模块,用于对对原始的语音数据进行再加工,增强语音数据的某些特征值特性。
优选的,所述语音预处理模块包含去静音模块、降噪模块和自增益过程模块。
语音识别模块,用于对预处理后的语音数据进行识别,并生成识别结果;
联系人创建模块,判断识别结果,创建联系人信息,并保存在终端。
优选的,所述联系人创建模块中,判断识别结果包含语音识别准确性的判断模块和联系人信息是否冲突的判断模块。
优选的,所述终端具体为智能手机和具有通话功能的平板电脑。
采用上述技术方案,本发明具有以下优点:
本发明提供了一种通过语音添加联系人的方法及终端。通过开启终端语音录入联系人信息程序,收集、提取终端硬件传入的音频数据,同时还对原始的语音数据进行再加工步骤,对预处理后的语音数据进行识别,并生成识别结果供用户确认,用户根据判断识别结果来创建联系人信息,并保存在终端。本发明不仅对年龄稍微大点的人,或者拼音输入的功能较弱者,在需要添加联系人的时候,只需要点击该语音图标,说出想输入的姓名和号码,即可完成添加联系人信息的功能。还提高了语音识别的准确性,减少了重复录入几率。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单的介绍,显而易见的,下面描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1为本发明通过语音添加联系人的方法一实施例的流程图。
图2为本发明通过语音添加联系人的方法又一实施例的流程图。
图3为本发明通过语音添加联系人的终端的功能模块图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。本发明移动终端以手机为例,所述手机包含语音识别功能。
参阅图1,在本发明通过语音添加联系人的方法实施例中,该方法包括但不限于以下步骤。
S101,开启步骤,开启终端语音录入联系人信息程序。
其中,所述语音录入用于指示创建联系人项。例如,在添加联系人界面,增加一个语音图标,当需要添加联系人的时候,点击该语音图标,进行语音输入,语音图标调用专门为添加联系人开发的语音插件,而不是调用公共的语音。
S102,语音录入步骤,收集、提取终端硬件传入的音频数据。
具体的,点击手机联系人添加中的语音录入图标后,后台即执行语音录入程序,对语音信息进行收集及提取工作。如果手机是Android平台,则Android自带的库函数即可完成录音功能,所录的音频数据设计为WAV格式,此格式的数据为标准音频文件,方便处理。
S103,语音预处理步骤,对原始的语音数据进行再加工。
具体的,所述语音预处理步骤指在进行语音识别之前或是发送到后台给语音识别解码器之前,对原始的语音数据进行再加工,其目的在于增强语音数据的某些特征值特性(如噪声幅度、正音频振幅等)或者是方便后台处理,从而简化语音识别的实现过程,也提高语音识别解码器的识别准确率。本实施例中,预处理步骤主要包含语音去静音步骤,降噪步骤和自增益过程步骤。
其中,语音去静音步骤中,先取一段语音信号的前几顿进行估计背景音的能量,然后将剩余下的每一桢语音信号同以估测出的背景音的能量作以比较,识别超出背景音能量某一定值的语音信号就认为这一顿是语音信号(即人类的声音),否则认为其是背景音。检测出语音的开始位置后,算法自动往前回退若干语音数据帧作为语音的开始端点,算法在这一判断的过程中会自动更新背景音的能量基值。算法识别语音结束端点的判断是根据连续若千个语音信号帧均为背景音,则当前检测认为是语音信号(即人类的声音)已经结束。
降噪步骤和自增益过程步骤中,采用开源的libspeexdsp库,首先,根据frequencySet,选择合适的采样频率和帧大小进行预处理的初始化;然后从Short数组去除静音Array中取语音,并将处理后的语音保存到另一个Short数组降噪自增益过程Array中。当voiceEnd值为true时,该模块将降噪及自增益过程结束信号降噪自增益过程End置为true,随后结束该步骤。
S104,语音识别步骤,对预处理后的语音数据进行识别,并生成识别结果。
具体的,对预处理后的语音数据进行识别,是指将识别的结果或是错误信息等以标准的JSON格式字符串的形式返回给手机数据接收程序,该程序完全接收所返回的信息,对其进行解析、处理,将最后的可识别、易识别的信息返回给前端的使用者。
语音识别结果生成后,其展示方式可以以文字窗口形式展示,也可以以语音窗口形式展示,通过手机屏幕展示。
S105,联系人创建步骤,判断识别结果,创建联系人信息,并保存在终端。
在用户根据手机屏幕上展示的识别结果,判断其准确性,显示的结果确认正确后则手机将识别结果,例如姓名和号码存储,建立联系人信息。
请参阅图2,为根据本发明的通过语音添加联系人的方法又一实施例的流程图。如图2所示,该第二实施例提供的通过语音添加联系人的方法与第一实施例相似,区别仅在于增设了信息判断步骤。
首先,在步骤S201中,开启终端语音录入联系人信息程序。该步骤与第一实施例中步骤S101相同。
随后,在步骤S202中,语音录入步骤,收集、提取终端硬件传入的音频数据。该步骤与第一实施例中步骤S102相同。
随后,在步骤S203中,语音预处理步骤,对原始的语音数据进行再加工。该步骤与第一实施例中步骤S103相同。
随后,在步骤S204中,语音识别步骤,对预处理后的语音数据进行识别,并生成识别结果。该步骤与第一实施例中步骤S104相同。
随后,在步骤S205中,判断识别结果,是指判断语音识别是否准确。若准确,则执行步骤S206,若不准确,则返回执行步骤S202,即再次执行语音录入步骤,重新进行一次联系人信息语音录入程序。
具体的,所述联系人创建步骤中,判断识别结果中的语音识别准确性包含判断系人信息包括联系人姓名、电话号码、公司名称、邮箱、和备注等是否正确。在接收到用户确认信息正确,输入的该项信息的保存指令时,开启联系人创建步骤对该项信息进行保存,即执行步骤S206;否则发送信号给语音录入步骤继续进行语音录入,即返回执行步骤S202。例如,用户可以在手机屏幕上看到识别后的语音信息后,或者听到手机播放的识别后的语音信息后,选择“保存”或者按下“确认”功能键来输入保存指令从而对该联系人信息进行保存。用户也可以选择“不保存”或者按下“取消”功能键输入不保存指令以重新采集语音。
随后,在步骤S206中,继续判断联系人是否已经录入。如果联系人信息没有录入,则执行步骤S207,如果联系人信息已经录入,则结束本次语音录入程序,则执行步骤S208。
本发明还公开的通过语音添加联系人的终端,终端主要包含以下模块,如图3所示。
开启模块,用于开启终端语音录入联系人信息程序。
语音录入模块,用于收集、提取终端硬件传入的音频数据。
语音预处理模块,用于对对原始的语音数据进行再加工,增强语音数据的某些特征值特性。
优选的,所述语音预处理模块包含去静音模块、降噪模块和自增益过程模块。
语音识别模块,用于对预处理后的语音数据进行识别,并生成识别结果;
联系人创建模块,判断识别结果,创建联系人信息,并保存在终端。
优选的,所述联系人创建模块中,判断识别结果包含语音识别准确性的判断模块和联系人信息是否冲突的判断模块。
优选的,所述终端具体为智能手机和具有通话功能的平板电脑。
以上所述仅为举例性,而非为限制性。本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (9)
1.通过语音添加联系人的方法,其特征在于,该方法包含以下步骤:
开启步骤,开启终端语音录入联系人信息程序;
语音录入步骤,收集、提取终端硬件传入的音频数据;
语音预处理步骤,对原始的语音数据进行再加工;
语音识别步骤,对预处理后的语音数据进行识别,并生成识别结果;
联系人创建步骤,判断识别结果,创建联系人信息,并保存在终端。
2.如权利要求1所述的通过语音添加联系人的方法,其特征在于,所述语音预处理步骤包含语音去静音步骤,降噪步骤和自增益过程步骤。
3.如权利要求1所述的通过语音添加联系人的方法,其特征在于,所述语音识别步骤中,其识别结果可以以文字窗口形式展示,也可以以语音窗口形式展示。
4.如权利要求1所述的通过语音添加联系人的方法,其特征在于,所述联系人创建步骤中,判断识别结果包含语音识别准确性的判断和联系人信息是否冲突的判断。
5.如权利要求4所述的通过语音添加联系人的方法,其特征在于,所述联系人信息是否冲突的判断是指新录入的联系人信息是否已经录入联系人数据库。
6.通过语音添加联系人的终端,其特征在于,包括以下模块:
开启模块,用于开启终端语音录入联系人信息程序;
语音录入模块,用于收集、提取终端硬件传入的音频数据;
语音预处理模块,用于对对原始的语音数据进行再加工,增强语音数据的某些特征值特性;
语音识别模块,用于对预处理后的语音数据进行识别,并生成识别结果;
联系人创建模块,判断识别结果,创建联系人信息,并保存在终端。
7.如权利要求6所述的通过语音添加联系人的终端,其特征在于,所述语音预处理模块包含去静音模块、降噪模块和自增益过程模块。
8.如权利要求6所述的通过语音添加联系人的终端,其特征在于,所述联系人创建模块中,判断识别结果包含语音识别准确性的判断模块和联系人信息是否冲突的判断模块。
9.根据权利要求6所述的通过语音添加联系人的终端,其特征在于,所述终端具体为智能手机和具有通话功能的平板电脑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510730698.7A CN105427864A (zh) | 2015-10-30 | 2015-10-30 | 通过语音添加联系人的方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510730698.7A CN105427864A (zh) | 2015-10-30 | 2015-10-30 | 通过语音添加联系人的方法及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105427864A true CN105427864A (zh) | 2016-03-23 |
Family
ID=55506019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510730698.7A Pending CN105427864A (zh) | 2015-10-30 | 2015-10-30 | 通过语音添加联系人的方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105427864A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105897993A (zh) * | 2016-03-30 | 2016-08-24 | 广东欧珀移动通信有限公司 | 一种通讯录储存方法及用户设备 |
WO2018049606A1 (zh) * | 2016-09-14 | 2018-03-22 | 深圳市大疆创新科技有限公司 | 控制方法、控制装置及电子装置 |
CN109451135A (zh) * | 2018-12-07 | 2019-03-08 | 北京小米移动软件有限公司 | 联系人创建方法及装置 |
-
2015
- 2015-10-30 CN CN201510730698.7A patent/CN105427864A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105897993A (zh) * | 2016-03-30 | 2016-08-24 | 广东欧珀移动通信有限公司 | 一种通讯录储存方法及用户设备 |
WO2018049606A1 (zh) * | 2016-09-14 | 2018-03-22 | 深圳市大疆创新科技有限公司 | 控制方法、控制装置及电子装置 |
CN109451135A (zh) * | 2018-12-07 | 2019-03-08 | 北京小米移动软件有限公司 | 联系人创建方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10943582B2 (en) | Method and apparatus of training acoustic feature extracting model, device and computer storage medium | |
US10515627B2 (en) | Method and apparatus of building acoustic feature extracting model, and acoustic feature extracting method and apparatus | |
CN110349564B (zh) | 一种跨语言语音识别方法和装置 | |
CN103137129B (zh) | 语音识别方法及电子装置 | |
CN103888581B (zh) | 一种通信终端及其记录通话信息的方法 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
WO2015090215A1 (zh) | 区分地域性口音的语音数据识别方法、装置和服务器 | |
CN106302933B (zh) | 通话语音信息处理方法及终端 | |
EP3182260A1 (en) | Character editing method and device for screen display device | |
CN101931701A (zh) | 一种通话过程中联系人信息的提示方法、系统及移动终端 | |
CN109326305B (zh) | 一种批量测试语音识别和文本合成的方法和测试系统 | |
CN103873654A (zh) | 通话内容分析及提取系统及方法 | |
CN103916513A (zh) | 在通信终端记录通话信息的方法和设备 | |
CN103000175A (zh) | 一种语音识别的方法及移动终端 | |
CN107123418B (zh) | 一种语音消息的处理方法及移动终端 | |
CN104135577A (zh) | 一种基于自定义语音实现快速查找联系人的方法和装置 | |
US11133009B2 (en) | Method, apparatus, and terminal device for audio processing based on a matching of a proportion of sound units in an input message with corresponding sound units in a database | |
CN104301522A (zh) | 通讯中的信息输入方法及通讯终端 | |
CN105427864A (zh) | 通过语音添加联系人的方法及终端 | |
CN104702759A (zh) | 通讯录的设置方法及装置 | |
CN113380238A (zh) | 处理音频信号的方法、模型训练方法、装置、设备和介质 | |
CN114155854A (zh) | 语音数据的处理方法及装置 | |
CN107888745A (zh) | 一种通讯录中失效号码的删除方法及装置 | |
CN111798836A (zh) | 一种自动切换语种方法、装置、系统、设备和存储介质 | |
CN109509474A (zh) | 通过语音识别选择电话客服中服务项的方法及其设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160323 |
|
WD01 | Invention patent application deemed withdrawn after publication |