CN102984666A - 一种通话过程中的通讯录语音信息处理方法及系统 - Google Patents
一种通话过程中的通讯录语音信息处理方法及系统 Download PDFInfo
- Publication number
- CN102984666A CN102984666A CN2012104718568A CN201210471856A CN102984666A CN 102984666 A CN102984666 A CN 102984666A CN 2012104718568 A CN2012104718568 A CN 2012104718568A CN 201210471856 A CN201210471856 A CN 201210471856A CN 102984666 A CN102984666 A CN 102984666A
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- communication terminal
- mode
- address book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 84
- 230000010365 information processing Effects 0.000 title abstract description 10
- 238000003672 processing method Methods 0.000 title abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 104
- 238000000034 method Methods 0.000 claims abstract description 77
- 230000005540 biological transmission Effects 0.000 claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000003811 finger Anatomy 0.000 description 2
- 210000005224 forefinger Anatomy 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种通话过程中的通讯录语音信息处理方法及系统,其中的方法包括:根据预置触发信号启动通讯终端的通讯录语音处理模块;根据启动通讯录语音处理模块的预置触发信号或者接收的语音信息判断通讯录语音处理模式,语音处理模式包括接收存储模式和匹配传输模式,其中,在接收存储模式时,将所接收的语音信息转换为文本信息存储于通讯终端的通讯录中;在匹配传输模式时,根据所接收的语音信息从通讯终端的通讯录中匹配所述语音信息对应的文本信息,然后以语音形式发送所述文本信息。本发明能够避免用户在通话过程中查询或者输入通讯录时的复杂手动操作,有效的降低误操作率以及避免由于短时间记忆问题导致的信息录入错误。
Description
技术领域
本发明涉及移动通信领域技术领域,更为具体地,涉及一种通话过程中的通讯录语音信息处理方法及系统。
背景技术
随着移动通讯技术的发展,手机得到了广泛的应用,日常生活中人们越来越依赖于手机这样的通讯设备进行沟通。手机沟通的建立需要通过拨打目标用户终端的唯一标识(电话号码)来实现,当用户需要沟通的其他用户的数量逐渐增加时,电话号码及相关通讯信息的记录和管理就变得越来越重要。
为了解决这个问题,目前几乎所有的手机设备都提供了通讯录管理的功能,用户可以编辑存储通讯录信息(姓名,电话号码等信息)。当用户需要联系特定目标用户时,只需要根据目标用户的姓名就可以查找或者直接拨打其电话号码。该方法大大简化了用户拨打电话的过程,用户只需要输入特定用户的姓名(或姓名的拼音首字母)而不需要输入较长的数字号码就可以完成通话的建立。
但是在实际应用中,该方法依赖于通讯录信息的建立在用户手动建立一条通讯记录时,需要输入电话号码、用户姓名以及其他相关信息,这些输入的步骤都需要大量的用户手动操作。特别是当用户正在进行通话时,如果需要新增或查询一条通讯记录时,这样的输入操作会大大增加用户的操作复杂度,甚至会由于误操作等原因导致通话的中断以及通讯信息的丢失。这种场景在日常生活中非常常见,例如,用户A向用户B拨打电话,并询问用户B关于用户C的电话号码时,由于用户A非常着急需要用户B能够立刻提供用户C的号码,用户B这时需要在保持通话不断的情况下进行通讯录的查询,并把查找到的通讯号码说给用户A来听,而此时用户A需要根据用户B的提示,在保持通话的情况下操作手机向通讯录中新增用户C的电话号码,整个通话过程中可能存在着以下操作问题:
(1)用户B在查找过程中,由于要手动操作手机界面进行查找,需要暂时把手机从耳旁移动到眼前,此时用户B无法再清晰的获得用户A的语音信息,也无法根据用户A的语音做出回应,这会导致用户A认为用户B通话连接有问题而挂断电话;
(2)用户B为了持续获取用户A的语音信息,可以采用免提的方式来解决部分问题,但是免提功能在一些场景并不一定适合,例如嘈杂环境或者语音信息不希望周边其他人获取;
(3)用户B在查找号码过程中,需要输入用户C的查询信息,该操作步骤也比较多,用户B存在误操作的可能,会导致通话的挂断进而导致无法及时的把信息返回给用户A;
(4)当用户B查找到目标用户C的号码时,需要根据通讯录记录的号码,通过手机麦克读出该号码让用户A记录,这时用户B还需要及时获得用户A的及时反馈以确定用户A是否开始记录以及记录是否准确。但是用户B获取用户A的语音回馈以及根据手机屏幕读取号码的过程中,在不使用免提的情况下存在着矛盾,用户读取号码需要把手机从耳旁移开到眼前,这样就无法持续获得用户A的语音回馈。
(5)用户A在记录用户B读取的号码时存在着更大的问题,因为此时用户A需要持续获得用户B的语音信息并需要能持续的进行手机屏幕的操作,这在不使用免提或者不借助于其他第三方记录工具(另一部手机或者笔纸)时几乎是不可能完成的。记录的号码可能会存在着不准确性,甚至由于误操作导致通话断开而无法完成号码的记录。
图1示出了日常生活中的上述操作的场景。如图1所示,目前的通讯录记录方案可能会导致用户在通话过程中需要进行复杂的操作才能够记录电话号码信息,由于接受语音信息与手机屏幕操作的矛盾使得用户的操控非常困难,严重影响用户的体验以及信息录入的准确度。
针对上述问题,目前还有一种常用的解决方案,就是暂时结束通话,利用短信等形式在结束通话后把信息发送给对方。这一方案也同样存在着复杂的操作性(复制号码粘贴号码等等),同时由于需要结束通话另外发送信息,这也增加了信息的延时性以及不确定性,同时也额外增加了短信费用支出。
发明内容
鉴于上述问题,本发明的目的是提供一种能够在用户通话过程中自动记录或发送通讯录信息的方法,以减少用户操作复杂度、缩短通话时间从而降低通讯费用,以及保证通讯信息记录的准确性。
根据本发明的一个方面,提供了一种通话过程中的通讯录语音信息处理方法,包括:
根据预置触发信号启动通讯终端的通讯录语音处理模块;
根据启动通讯录语音处理模块的预置触发信号或者接收的语音信息判断通讯录语音处理模式,所述语音处理模式包括接收存储模式和匹配传输模式;
根据所判断的语音处理模式对所述通讯终端接收的语音信息进行处理,其中,
在所述语音处理模式为接收存储模式时,所述通讯终端接收语音信息并将所接收的语音信息转换为文本信息存储于所述通讯终端的通讯录中;
在所述语音处理模式为匹配传输模式时,所述通讯终端接收语音信息并根据所接收的语音信息从所述通讯终端的通讯录中匹配所述语音信息对应的文本信息,然后以语音形式发送所述文本信息。
另一方面,本发明还提供一种通话过程中的通讯录语音信息处理系统,包括语音处理触发单元和通讯录语音处理单元,其中,
所述语音处理触发单元用于根据预置触发信号启动通讯终端的通讯录语音处理单元;
所述通讯录语音处理单元包括模式判断单元、接收存储单元和匹配传输单元,其中,
所述模式判断单元根据启动通讯录语音处理单元的预置触发信号或者接收的语音信息判断所述通讯录语音处理单元的语音处理模式,所述语音处理模式包括接收存储模式和匹配传输模式,其中,
当所述语音处理模式为接收存储模式时,由所述接收存储单元将所述通讯终端接收的语音信息转换为文本信息存储于所述通讯终端的通讯录中;
当所述语音处理模式为匹配传输模式时,由所述匹配传输单元根据所述通讯终端接收的语音信息从所述通讯终端的通讯录中匹配所述语音信息对应的文本信息,然后以语音形式发送所述文本信息。
通过上述通话过程中的通讯录语音信息处理方法及系统,用户在通话过程中发送或记录电话号码信息时,都不要需移动手机位置,手机可以一直保持在耳旁,并持续接受对方的语音信息;同时还能够有效避免用户在通话过程中的复杂手动操作,降低误操作率以及由于短时间记忆问题导致的信息录入错误,在保证通讯信息记录的准确性的基础上缩短通话时间,进而降低通讯费用。
另外,为了保证在接受通讯信息中语音识别在特定环境(例如噪音较大,方言口音的影响)的准确度,通讯录中对应语音信息音频链接的设置为用户提供了号码复查的功能,用户通过记录的号码与录制音频的人工比对大大提高了信息的准确度,确保信息完整无误;通过这两种方法的有效结合,也可以大大提高语音识别的准确度,由于发送的通讯录语音信息默认为标准普通话,从而能够达到大大提高准确率,降低方言的影响。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为现有的日常通话过程中传输通讯录的方法流程示意图;
图2为根据本发明实施例的通话过程中的通讯录语音信息处理方法流程示意图;
图3为根据本发明实施例的在通话过程中记录通讯录语音信息的流程示意图;
图4为根据本发明实施例的在通话过程中语音发送通讯录信息的流程示意图;
图5为根据本发明实施例的通话过程中的通讯录语音信息处理系统结构框图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。
另外,本发明中所述的通讯终端,主要是指以手机为主的移动通讯终端,当然,也不排除将本发明应用到其它具有数据存储、处理能力的通讯终端上的可能。为了表述的方便,在下面的具体实时方式描述中,以“手机”作为通讯终端的应用实施例。
以下将结合附图对本发明的具体实施例进行详细描述。
图2示出了根据本发明实施例的通话过程中的通讯录语音信息处理方法流程。
如图2所示,通话过程中的通讯录语音信息处理方法包括如下步骤:
S210:根据预置触发信号启动通讯终端的通讯录语音处理模块;
S220:根据启动通讯录语音处理模块的预置触发信号或者接收的语音信息判断通讯录语音处理模式,其中的语音处理模式包括接收存储模式和匹配传输模式;
S230:根据所判断的语音处理模式对通讯终端接收的语音信息进行处理,其中,在语音处理模式为接收存储模式时,通讯终端接收语音信息并将所接收的语音信息转换为文本信息存储于通讯终端的通讯录中;在语音处理模式为匹配传输模式时,通讯终端接收语音信息并根据所接收的语音信息从通讯终端的通讯录中匹配该语音信息对应的文本信息,然后以语音形式发送该文本信息。
其中,启动通讯录语音处理模块的预置触发信号可以是用户对通讯终端上特定按键的按压或者触摸操作,也可以是用户在通讯终端触摸屏上的特定手势,或者用户通过蓝牙对通讯终端的特定遥控操作等。
一般而言,用户对通讯录的处理不外乎电话号码或者其他联系方式(如电子信箱、QQ号等)的录入和查询,因此,在本发明的一个优选实施方式中,在根据预置触发信号启动通讯终端的通讯录语音处理模块之后,可以接收的语音信息判断通讯录语音处理模式。如果所接收的语音信息为数字信息,说明需要记录该数字信息所代表的电话号码(或者QQ号码),则语音处理模式为接收存储模式;如果所接收的语音信息为非数字信息,说明需要查找该语音信息代表的联系人的电话号码,则语音处理模式为匹配传输模式。
另外,目前也有在通讯终端的通讯录中记录邮箱地址的操作,此时通讯录中的文本信息也可以是字母信息或者字母、字符的组合信息。
此外,由于在手机A跟手机B建立了通讯连接的前提下,手机A在接受存储模式下接受的语音信息是来自于手机B,手机A在匹配传输模式下接受的语音信息是来自于手机A本身的麦克,所以两者的信号来源并不相同。因此,还可以通过语音信息的来源(手机持有方本身还是通话的对方)来判断通讯录语音处理模式,如果语音信息的来源是手机持有方,则可以视为是需要查找该语音信息代表的联系人的电话号码或者其他联系方式,则语音处理模式为匹配传输模式;如果语音信息的来源是通话的对方,则可以视为是需要记录该数字信息所代表的话号码或者其他联系方式,则语音处理模式为接收存储模式。
判断语音信息是否为数字信息的难度较大、准确度偏低,并且由于要根据一段时间的语音片段来进行,不可避免地会存在判断延时问题。而上述通过语音信息的来源来判断通过判断通讯录语音处理模式的方法,能够克服克服上述缺陷,提高通讯录语音处理模式的判断效率和准确率。
根据图2所示的通话过程中的通讯录语音信息处理流程可以看出,本发明提供的通话过程中的通讯录语音信息处理方法包括两个方面:在通话过程中记录通讯录语音信息以及语音发送通讯录信息。下面将从这两个方面分别对本发明的技术方案进行详细地说明。
图3示出了根据本发明实施例的在通话过程中记录通讯录语音信息的流程。如图3所示,当用户在通话过程中需要记录通话方将要告知的电话号码、QQ号等通讯信息时,首先通过按键启动通讯录语音信息接收功能(步骤S301),其具体操作是用户在通话过程中无需把手机从耳旁移开,可直接使用手指进行操作的按键,例如按键在大拇指或食指握手机的位置上;在启动通讯录语音信息接收功能后,手机接收语音通讯录信息并存储(步骤S302),其具体步骤是,手机自动接受对方传输过来的语音信号并将该语音信息以文件的形式存储于手机本地,
在步骤S303中,手机将该语音信息自动转换为数字信息,主要利用信号处理技术以及机器学习技术(例如语音特征值提取,隐马尔可夫模型)对连续数字语音能够进行识别,目前对于连续数字的语音识别由于缩小了样本集的范围,所以准确度要远远超过全文语音识别技术。
将语音信息转换为数字信息的具体实现步骤分为模型学习过程以及模型识别过程两个部分。其中模型学习过程的具体步骤为:首先采用一定的特征提取方法(例如美尔频标倒谱系数MFCC方法)处理所有的音频信号数据,提取出一系列的特征值表达参数,从而达到数据压缩以及计算复杂度降低的效果;然后,建立隐马尔可夫模型HMM(Hidden Markov Model),HMM利用双重随机过程有效的解决怎样辨识具有不同参数(特征值)的音频信号的问题,HMM模型的建立主要是其模型中参数的确定(或学习),利用学习样本来训练模型。在本发明的一个具体实施方式中,学习样本为数字0~9的中文普通话发音,然后这些发音的特征值表达参数以及其所代表的数字作为输入,利用学习方法(例如Baum-Welch算法)来确定HMM模型中的参数,当模型确立之后,就可以进入到模型识别过程。
模型识别的具体步骤为:对于连续语音识别,首先需要对音频进行分割,使分割后的每一个音频信号代表一个数字。音频的分割方法可以采用语音能量的方式:
其中,S为语音信号,N为分析帧长。在语音录制过程中,当N帧的能量都低于阀值的时候,就认为是一段播报信息的结束,而此时语音所处的位置就是最佳的语音分割位置。分割后的每段音频信息在利用同样的特征值提取方法后得到的参数就可以输入到已经学习好的HMM模型,作为HMM的输出就是该段音频最可能的数字含义。当重复该步骤对每段分割后的音频进行识别并将HMM的输出结果组合起来之后,就可以实现连续语音识别的功能。
在步骤S304中,创建通讯录临时信息并存储号码,其具体过程为:利用手机已有通讯录的API(Application Programming Interface,应用程序编程接口),创建临时通讯录信息,其姓名栏信息可填写为临时+时间的格式,电话号码栏里填写识别出的数字信息。
最后,在通话结束后,用户可以通过编辑该号码所属人的姓名及其他信息(步骤S205)来完善通讯录。具体地,作为示例,通话结束后,用户可以继续编辑该号码所属人的姓名及其他信息,以完善通讯录信息。其具体步骤为:用户更改姓名栏信息为真实用户姓名或昵称,用户在电话号码栏里可以点击收听在“接受语音通讯录信息并存储”步骤中记录的录音信息以便核对语音识别号码的准确度并可根据情况作进一步的修改。例如在存储的号码旁边设置一个喇叭的图标,该图标为一个音频链接,点击即可收听接受存储的语音信息,并进行人工语音复查,以便核实存储的号码。也就是说,通讯终端可以在接收语音信息后在通讯终端的通讯录中建立该语音信息的音频链接,该音频链接和语音信息转换的文本信息关联存储。
图4示出了根据本发明实施例的在通话过程中语音发送通讯录信息的流程。如图4所示,当用户在通话过程中需要查找手机通讯录中的电话号码等信息提供给通话的对方时,需要执行以下的语音发送通讯录信息的步骤:
用户通过按键启动通讯录语音信息发送功能(步骤S401),其具体操作是用户在通话过程中无需把手机从耳旁移开,可直接使用手指进行操作的按键,例如按键在大拇指或食指握手机的位置上,并要求在发送过程中,按键始终处于按压状态,当用户松开按键后可取消整个流程。
用户说出通讯录中存储的目标人物名称(步骤S402),其具体操作需要用户对着手机的麦克话筒说出目标人物的语音名称。当按键处于按压状态下,用户所发出的语音信息并不会被通话对方所听到,类似处于静音状态。
判断语音是否能够匹配通讯录存储的名称语音样本(步骤S403),主要依据信号处理以及语音匹配技术,对当前语音与语音样本进行疲惫查找,其中语音样本需要用户在通话前对已有通讯录中的每条信息进行语音录制,从而使系统能够适应不同用户的口音方言等等。
语音匹配的具体实现步骤与前述语音信息转换为数字信息中表述的技术解决方案非常类似:首先所有的音频信号数据都会采用一定的特征提取方法(例如美尔频标倒谱系数MFCC方法)提取出一系列的特征值表达参数,从而达到数据压缩以及计算复杂度降低的效果,然后建立隐马尔可夫模型HMM,HMM利用双重随机过程有效的解决怎样辨识具有不同参数(特征值)的音频信号的问题,HMM模型的建立主要是其模型中参数的确定(或学习),利用学习样本来训练模型。在本场景下,学习样本用户为通讯录中每条信息录制的不同音频文件,然后这些发音的特征值表达参数以及其所代表的通讯录信息作为输入,利用学习方法(例如Baum-Welch算法)来确定HMM模型中的参数,当模型确立之后,就可以进入到模型识别过程,由于用户的每段录音分别匹配一条通讯录信息,所以这里并不需要语音分割,当用户需要查找某条通讯信息所录制的音频信息在利用同样的特征值提取方法后获得参数后,这些参数就可以输入到已经学习好的HMM,作为HMM的输出就是该段音频最可能匹配的通讯信息;如果能匹配,手机自动读取数字号码并传送给对方(步骤S404),否则提示无该用户信息(步骤S405)。
通过以上实施例的表述可以看出,本发明提供的通话过程中的通讯录语音信息处理方法,能够使得用户在通话过程中无需移动手机位置而发送或记录电话号码等通讯录信息时,整个发送或记录通讯录信息的过程中,手机都可以一直保持在耳旁,并持续接受对方的语音信息。这种方法能够有效避免用户在通话过程中的复杂手动操作,避免由于短时间记忆问题导致的信息录入错误以及降低误操作率。
与上述通话过程中的通讯录语音信息处理方法相对应,本发明还提供一种通话过程中的通讯录语音信息处理系统。
图5示出了根据本发明实施例的通话过程中的通讯录语音信息处理系统结构框图。如图5所示,本发明提供的通话过程中的通讯录语音信息处理系统包括语音处理触发单元510和通讯录语音处理单元520,其中,
语音处理触发单元510用于根据预置触发信号启动通讯终端的通讯录语音处理单元;
通讯录语音处理单元520包括模式判断单元521、接收存储单元522和匹配传输单元523,其中,
模式判断单元521根据启动通讯录语音处理单元520的预置触发信号或者接收的语音信息判断通讯录语音处理单元520的语音处理模式,其中的语音处理模式包括接收存储模式和匹配传输模式,其中,
当语音处理模式为接收存储模式时,由接收存储单元522将通讯终端接收的语音信息转换为文本信息存储于通讯终端的通讯录中;
当语音处理模式为匹配传输模式时,由匹配传输单元523根据通讯终端接收的语音信息从通讯终端的通讯录中匹配该语音信息对应的文本信息,然后以语音形式发送该对应的文本信息。
如上参照附图以示例的方式描述根据本发明的通话过程中的通讯录语音信息处理方法及系统。但是,本领域技术人员应当理解,对于上述本发明所提出的通话过程中的通讯录语音信息处理方法及系统,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。
Claims (13)
1.一种通话过程中的通讯录语音信息处理方法,包括:
根据预置触发信号启动通讯终端的通讯录语音处理模块;
根据启动通讯录语音处理模块的预置触发信号或者接收的语音信息判断通讯录语音处理模式,所述语音处理模式包括接收存储模式和匹配传输模式;
根据所判断的语音处理模式对所述通讯终端接收的语音信息进行处理,其中,
在所述语音处理模式为接收存储模式时,所述通讯终端接收语音信息并将所接收的语音信息转换为文本信息存储于所述通讯终端的通讯录中;
在所述语音处理模式为匹配传输模式时,所述通讯终端接收语音信息并根据所接收的语音信息从所述通讯终端的通讯录中匹配所述语音信息对应的文本信息,然后以语音形式发送所述文本信息。
2.如权利要求1所述的通话过程中的通讯录语音信息处理方法,其中,所述启动通讯录语音处理模块的预置触发信号为用户对所述通讯终端上特定按键的按压或者触摸操作。
3.如权利要求1所述的通话过程中的通讯录语音信息处理方法,其中,
在根据启动通讯录语音处理模块的预置触发信号判断通讯录语音处理模式的过程中,根据用户对所述通讯终端不同按键的按压或者触摸操作确定对应的语音处理模式;
在根据接收的语音信息判断通讯录语音处理模式的过程中,如果所接收的语音信息为数字信息,则所述语音处理模式为接收存储模式;如果所接收的语音信息为非数字信息,则所述语音处理模式为匹配传输模式;或者,
如果所接收的语音信息的来源为所述通讯终端的通话对方,则所述语音处理模式为接收存储模式;如果所接收的语音信息的来源为所述通讯终端方,则所述语音处理模式为匹配传输模式。
4.如权利要求1所述的通话过程中的通讯录语音信息处理方法,其中,所述通讯终端接收语音信息并将所接收的语音信息转换为文本信息的过程包括:
接收语音信息;将所述接收的语音信息以文件的形式存储于所述通讯终端本地;
将所述接收的语音信息转换为文本信息。
5.如权利要求4所述的通话过程中的通讯录语音信息处理方法,其中,所述文本信息为数字信息和/或字母信息。
6.如权利要求5所述的通话过程中的通讯录语音信息处理方法,其中,将所述接收的语音信息转换为文本信息的过程包括:
采用语音能量的方式对所述接收的语音信息进行音频分割,使分割后的每一个音频信号代表一个数字或者字母,
其中S为语音信号,N为分析帧长;
当N帧的能量都低于预置阀值时,视为是一段播报信息的结束,此时语音所处的位置就为语音分割位置;
提取音频分割后的每段音频信息的特征值;
根据所述特征值和预先建立的语音识别模型确定每段音频对应的数字或者字母。
7.如权利要求1所述的通话过程中的通讯录语音信息处理方法,其中,将转换的文本信息存储于所述通讯终端的通讯录中的过程包括:
利用所述通讯终端的通讯录的API创建临时通讯录信息;
将所述转换的文本信息写入所述临时通讯录信息。
8.如权利要求1所述的通话过程中的通讯录语音信息处理方法,其中,在所述语音处理模式为匹配传输模式时,所述通讯终端接收语音信息的过程中,所述通讯终端被设置为与所述通讯终端的通话方屏蔽。
9.如权利要求8所述的通话过程中的通讯录语音信息处理方法,其中,根据所接收的语音信息从所述通讯终端的通讯录中匹配所述语音信息对应的文本信息的过程包括:
对所接收的语音信息和所述通讯终端中预置的语音样本进行匹配查找,以确定对应的文本信息。
10.如权利要求9所述的通话过程中的通讯录语音信息处理方法,其中,以语音形式发送所述文本信息的过程包括:
根据所述文本信息和所述通讯终端中预先建立的语音识别模型确定所述文本信息的对应的音频;
将所述对应的音频发送给所述通讯终端的通话方。
11.如权利要求6或10所述的通话过程中的通讯录语音信息处理方法,其中,所述预先建立的语音识别模型为隐马尔可夫模型。
12.如权利要求1所述的通话过程中的通讯录语音信息处理方法,其中,在所述语音处理模式为接收存储模式时,所述通讯终端接收语音信息并在所述通讯终端的通讯录中建立所述语音信息的音频链接,所述音频链接和所述语音信息转换的文本信息关联存储。
13.一种通话过程中的通讯录语音信息处理系统,包括语音处理触发单元和通讯录语音处理单元,其中,
所述语音处理触发单元用于根据预置触发信号启动通讯终端的通讯录语音处理单元;
所述通讯录语音处理单元包括模式判断单元、接收存储单元和匹配传输单元,其中,
所述模式判断单元根据启动通讯录语音处理单元的预置触发信号或者接收的语音信息判断所述通讯录语音处理单元的语音处理模式,所述语音处理模式包括接收存储模式和匹配传输模式,其中,
当所述语音处理模式为接收存储模式时,由所述接收存储单元将所述通讯终端接收的语音信息转换为文本信息存储于所述通讯终端的通讯录中;
当所述语音处理模式为匹配传输模式时,由所述匹配传输单元根据所述通讯终端接收的语音信息从所述通讯终端的通讯录中匹配所述语音信息对应的文本信息,然后以语音形式发送所述文本信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210471856.8A CN102984666B (zh) | 2012-11-19 | 2012-11-19 | 一种通话过程中的通讯录语音信息处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210471856.8A CN102984666B (zh) | 2012-11-19 | 2012-11-19 | 一种通话过程中的通讯录语音信息处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102984666A true CN102984666A (zh) | 2013-03-20 |
CN102984666B CN102984666B (zh) | 2016-03-09 |
Family
ID=47858318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210471856.8A Active CN102984666B (zh) | 2012-11-19 | 2012-11-19 | 一种通话过程中的通讯录语音信息处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102984666B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103491257A (zh) * | 2013-09-29 | 2014-01-01 | 惠州Tcl移动通信有限公司 | 一种在通话过程中发送联系人信息的方法及系统 |
CN103561149A (zh) * | 2013-10-30 | 2014-02-05 | 西安乾易企业管理咨询有限公司 | 一种语音合成并传输信息的方法 |
CN104125551A (zh) * | 2014-06-27 | 2014-10-29 | 小米科技有限责任公司 | 来电转接方法及装置 |
CN104318150A (zh) * | 2014-11-21 | 2015-01-28 | 长江大学 | 基于语音查询的数据库访问认证装置 |
CN104702759A (zh) * | 2013-12-06 | 2015-06-10 | 中兴通讯股份有限公司 | 通讯录的设置方法及装置 |
CN105049436A (zh) * | 2015-07-23 | 2015-11-11 | 小米科技有限责任公司 | 语音通讯方法、装置及系统 |
CN105592226A (zh) * | 2016-01-20 | 2016-05-18 | 广东欧珀移动通信有限公司 | 一种通话过程中数据的处理方法及装置 |
CN106598621A (zh) * | 2016-12-22 | 2017-04-26 | 维沃移动通信有限公司 | 一种应用程序的工作方法及移动终端 |
CN108184028A (zh) * | 2018-02-11 | 2018-06-19 | 维沃移动通信有限公司 | 一种语音通话的方法和装置 |
CN108874797A (zh) * | 2017-05-08 | 2018-11-23 | 北京锤子数码科技有限公司 | 语音处理方法和装置 |
CN112102842A (zh) * | 2020-09-15 | 2020-12-18 | 珠海格力电器股份有限公司 | 通讯信息的记录方法及记录装置、电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101931701A (zh) * | 2010-08-25 | 2010-12-29 | 宇龙计算机通信科技(深圳)有限公司 | 一种通话过程中联系人信息的提示方法、系统及移动终端 |
CN102394976A (zh) * | 2011-11-01 | 2012-03-28 | 宇龙计算机通信科技(深圳)有限公司 | 基于联系人启动通讯应用的方法及移动终端 |
CN102662704A (zh) * | 2012-03-31 | 2012-09-12 | 上海量明科技发展有限公司 | 一种启动即时通信交互界面的方法、终端和系统 |
CN102780819A (zh) * | 2012-07-27 | 2012-11-14 | 广东欧珀移动通信有限公司 | 一种移动终端的语音识别联系人的方法 |
CN102780653A (zh) * | 2012-08-09 | 2012-11-14 | 上海量明科技发展有限公司 | 即时通信中快捷通信的方法、客户端及系统 |
-
2012
- 2012-11-19 CN CN201210471856.8A patent/CN102984666B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101931701A (zh) * | 2010-08-25 | 2010-12-29 | 宇龙计算机通信科技(深圳)有限公司 | 一种通话过程中联系人信息的提示方法、系统及移动终端 |
CN102394976A (zh) * | 2011-11-01 | 2012-03-28 | 宇龙计算机通信科技(深圳)有限公司 | 基于联系人启动通讯应用的方法及移动终端 |
CN102662704A (zh) * | 2012-03-31 | 2012-09-12 | 上海量明科技发展有限公司 | 一种启动即时通信交互界面的方法、终端和系统 |
CN102780819A (zh) * | 2012-07-27 | 2012-11-14 | 广东欧珀移动通信有限公司 | 一种移动终端的语音识别联系人的方法 |
CN102780653A (zh) * | 2012-08-09 | 2012-11-14 | 上海量明科技发展有限公司 | 即时通信中快捷通信的方法、客户端及系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9497617B2 (en) | 2013-09-29 | 2016-11-15 | Huizhou Tcl Mobile Communication Co., Ltd. | Method and system for transmitting contact information during call |
CN103491257B (zh) * | 2013-09-29 | 2015-09-23 | 惠州Tcl移动通信有限公司 | 一种在通话过程中发送联系人信息的方法及系统 |
CN103491257A (zh) * | 2013-09-29 | 2014-01-01 | 惠州Tcl移动通信有限公司 | 一种在通话过程中发送联系人信息的方法及系统 |
CN103561149A (zh) * | 2013-10-30 | 2014-02-05 | 西安乾易企业管理咨询有限公司 | 一种语音合成并传输信息的方法 |
CN104702759A (zh) * | 2013-12-06 | 2015-06-10 | 中兴通讯股份有限公司 | 通讯录的设置方法及装置 |
CN104125551A (zh) * | 2014-06-27 | 2014-10-29 | 小米科技有限责任公司 | 来电转接方法及装置 |
CN104318150A (zh) * | 2014-11-21 | 2015-01-28 | 长江大学 | 基于语音查询的数据库访问认证装置 |
CN105049436A (zh) * | 2015-07-23 | 2015-11-11 | 小米科技有限责任公司 | 语音通讯方法、装置及系统 |
CN105592226A (zh) * | 2016-01-20 | 2016-05-18 | 广东欧珀移动通信有限公司 | 一种通话过程中数据的处理方法及装置 |
CN105592226B (zh) * | 2016-01-20 | 2020-04-10 | Oppo广东移动通信有限公司 | 一种通话过程中数据的处理方法及装置 |
CN106598621A (zh) * | 2016-12-22 | 2017-04-26 | 维沃移动通信有限公司 | 一种应用程序的工作方法及移动终端 |
CN108874797A (zh) * | 2017-05-08 | 2018-11-23 | 北京锤子数码科技有限公司 | 语音处理方法和装置 |
CN108184028A (zh) * | 2018-02-11 | 2018-06-19 | 维沃移动通信有限公司 | 一种语音通话的方法和装置 |
CN112102842A (zh) * | 2020-09-15 | 2020-12-18 | 珠海格力电器股份有限公司 | 通讯信息的记录方法及记录装置、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102984666B (zh) | 2016-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102984666B (zh) | 一种通话过程中的通讯录语音信息处理方法及系统 | |
JP5701916B2 (ja) | 電話での会話をテキストに書き起こすための方法及びシステム | |
CN103888581B (zh) | 一种通信终端及其记录通话信息的方法 | |
KR101149135B1 (ko) | 음성 대화형 메시징을 위한 방법 및 장치 | |
US20070112571A1 (en) | Speech recognition at a mobile terminal | |
CN111325039B (zh) | 基于实时通话的语言翻译方法、系统、程序和手持终端 | |
CN105120048A (zh) | 通话语音的记录方法和系统 | |
CN102111483B (zh) | 一种在通话过程中查询信息的方法、装置及移动终端 | |
CN103841272B (zh) | 一种发送语音消息的方法及装置 | |
CN103024117A (zh) | 一种利用语音识别录入联系人的系统、方法和移动终端 | |
KR101771013B1 (ko) | 정보 제공 방법 및 이를 구현하는 이동통신단말기 | |
CN109151148B (zh) | 通话内容的记录方法、装置、终端及计算机可读存储介质 | |
CN105550235A (zh) | 信息获取方法及装置 | |
CN105355195A (zh) | 音频识别方法及装置 | |
CN104301522A (zh) | 通讯中的信息输入方法及通讯终端 | |
US20080188204A1 (en) | System and method for processing a voicemail message | |
CN106791210A (zh) | 一种手机来电接听装置及来电接听方法 | |
CN105072243A (zh) | 来电提示方法和装置 | |
CN110445934A (zh) | 通话信息处理方法、系统、终端及可读存储介质 | |
CN111274828B (zh) | 基于留言的语言翻译方法、系统、计算机程序和手持终端 | |
CN113470631B (zh) | 语音信号处理方法及装置、电子设备及存储介质 | |
CN113726952B (zh) | 通话过程中的同声传译方法及装置、电子设备、存储介质 | |
JP2005348240A (ja) | 電話装置 | |
CN106534520B (zh) | 一种基于语音识别的信息发送方法及系统 | |
CN116614574B (zh) | 一种通话录音控制方法及移动通信终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |