CN101645961A - 实现来电情绪辨识的手机及方法 - Google Patents

实现来电情绪辨识的手机及方法 Download PDF

Info

Publication number
CN101645961A
CN101645961A CN 200810303557 CN200810303557A CN101645961A CN 101645961 A CN101645961 A CN 101645961A CN 200810303557 CN200810303557 CN 200810303557 CN 200810303557 A CN200810303557 A CN 200810303557A CN 101645961 A CN101645961 A CN 101645961A
Authority
CN
Grant status
Application
Patent type
Prior art keywords
data
emotion
emotional
phone
signal
Prior art date
Application number
CN 200810303557
Other languages
English (en)
Inventor
张唐瑜
Original Assignee
深圳富泰宏精密工业有限公司;奇美通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

一种实现来电情绪辨识的手机包括:语音录制单元,用于将来电语音录制为模拟语音信号;A/D转换器,用于将模拟语音信号转换为数字语音信号;特征撷取单元,用于切割数字语音信号中的有声语音数据,并从有声语音中撷取不同的特征参数;情绪分类器,用于根据不同的特征参数读取有声语音信号对应的情绪特征数据,并对情绪特征数据进行分类统计以产生情绪特征的分类统计数据;情绪输出单元,用于根据分类统计数据产生来电对方的情绪分析报告。本发明还提供一种手机来电情绪辨识的方法。实施本发明,能够在手机通话过程中辨识出对方的情绪状态。

Description

实现来电情绪辨识的手机及方法

技术领域

本发明涉及语音辨识技术,特别是关于一种实现来电情绪辨识的手机及方法。背景技术

根据研究,人类总共具有五种基本的情绪反应,包含生气(Anger)、厌倦(bored)、快乐(happy)、平常(neutral)及悲伤(sadness)。目前,忙碌的现代人与亲人、朋友、同事之间,常以电话作为沟通与连络感情的媒介,因为电话通信的非面对面性,所以时常不知对方在当前通话时的情绪状态,有时更会因为未能正确理解对方的说话含义而误解对方的情绪,从而说错话引起双方发生口角,造成不必要的误会。当今手机,如果能够在这方面提供使用者更进一步的感应数据,从而辨识出对方说话时的情绪,这样对于人与人之间感情交流的提升可以产生很好效果。

发明内容

鉴于以上内容,有必要提供一种实现来电情绪辨识的手机,能够在手机通话过程中辨识出对方的情绪状态。

此外,还有必要提供一种手机来电情绪辨识的方法,能够在手机通话过程中辨识出对方的情绪状态。

一种实现来电情绪辨识的手机,该手机包括:语音录制单元,用于将对方的来电语音录制为模拟语音信号;A/D转换器,用于将模拟语音信号转换为数字语音信号;特征撷取单元,用于通过端点侦测原理切割数字语音信号中的有声语音数据和无声语音数据,并根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数;情绪分类器,用于根据有不同的特征参数读取有声语音信号对应的情绪特征数据,并对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据;情绪输出单元,用于根据情绪分类器产生的分类统计数据产生来电对方的情绪分析报告。

一种手机来电情绪辨识的方法,该方法包括步骤:将对方的来电语音录制为模拟语音信号;将模拟语音信号转换为数字语音信号;通过端点侦测原理将数字语音信号中的有声语音数据与无声语音数据切割开来;根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数;根据不同的特征参数读取有声语音信号对应的情绪特征数据;对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据;根据所述的分类统计数据产生来电对方的情绪分析报告。

所述的实现来电情绪辨识的手机及方法,能够在手机通话过程中辨识出对方的情绪状态,从而提升通话双方之间的通话质量。附图说明

图l是本发明实现来电情绪辨识的手机较佳实施例的结构图。

图2是图1中的特征撷取单元利用端点侦测原理切割有声语音与无声语音的示意图。

图3是本发明实现手机来电情绪辨识的方法较佳实施例的流程图。

具体实施方式

参阅图1所示,是本发明实现来电情绪辨识的手机10较佳实施例的结构图。在本实施例中,所述的手机10包括语音录制单元1、数模(A/D)转换器2、特征撷取单元3、存储器4、情绪分类器5、情绪输出单元6以及显示屏幕7。

所述的语音录制单元l用于将对方的来电语音录制为模拟语音信号,并将该模拟语音信号传送给A/D转换器2。

所述的A/D转换器2用于将模拟语音信号转换为数字语音信号。

所述的特征撷取单元3用于通过端点侦测原理将数字语音信号中的有声语音数据和无声语音数据切割开来,以便从数字语音信号中获取有声语音信号,并根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数。如何利用端点侦测原理将数字语音信号中的有声语音数据和无声语音数据进行切割将在下图2中进行详细描述。所述的特征参数是用于描述语音特征的声学参数,例如倒谱系数(Mel-Frequency C印strum Coefficients, MFCC)等。

所述的存储器4用于存储不同特征参数所对应的情绪特征数据。例如: 一个特征参数A与一个情绪特征数据(例如:生气"angry")相对应。所述的情绪特征数据是手机制造商预先定义的,在本实施例中,该情绪特征数据直接存储在手机10的存储器4中。在其他实施例中,所述的情绪特征数据可以存储在手机运营商的网络数据库中。

所述的情绪分类器5用于根据不同的特征参数从存储器4中读取有声语音信号对应的情绪特征数据,并对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据。情绪分类器5利用相近数据具有同类特征的原理对读取的情绪特征数据进行分类统计的,例如,若两个有声语音信号的MFCC值相差不大于一个预设值a,则该两个有声语音信号是相近的有声语音信号,且与同一个情绪特征(例如:生气"angry")相对应。在本实施例中,情绪分类器5根据情绪特征的分类统计数据中统计值最高的情绪特征来判断对方当前情绪的,例如

5(sadness) =4,生气程度(angry) =2,快乐程 度(happy) =1,中性程度(neutral) =1以及厌倦程度(bored) =0,则情绪分类器5判定该 情绪类别就是"悲伤(sadness)"。

所述的情绪输出单元6用于根据情绪特征的分类统计数据产生来电对方的情绪分析报告 ,并将该情绪分析报告输出并显示在手机10的显示屏幕7上。所述的情绪分析报告包括生气 程度、厌倦程度、快乐程度、平常程度及悲伤程度,从而让使用者了解对方通话时的情绪状 态。

参阅图2所示,是图1中的特征撷取单元3利用端点侦测原理切割有声语音与无声语音的 示意图。本实施例中,端点侦测主要目的是在切割出语音信号中的有声数据与无声数据,其 依据某一个时间内语音信号中的能量和越零率。如图2所示,"Enl"表示一个能量保守值, 若语音信号的能量小于等于该能量保守值"Enl",则特征撷取单元3判定该语音信号为无声 语音;若语音信号的能量大于该能量保守值"Enl",则特征撷取单元3判定该语音信号为有 声语音。"En2"表示一个比"Enl"大的开始能量值,若某一时刻"tl"的语音信号能量大 于能量值"En2",则该时刻"tl"即为该语音有声信号的开始。"EnEnd"表示一个比" Enl"小的终点能量值,若某一时刻"t2"的语音信号能量小于能量值"EnEnd",则该时刻 "t2"即为该语音有声信号的结束。特征撷取单元3将时刻"tl"到时刻"t2"之间的按能 量值的大小从语音信号中切割出声语音数据与无声语音数据。在图2中,同样可以采用越零 率"ZCR"来切割出语音信号中的有声数据与无声数据,其判断依据与语音信号能量的判断 原理相同,因此本实施例不再做详细地阐述。

参阅图3所示,是本发明手机来电情绪辨识的方法较佳实施例的流程图。语音录制单元 l将对方的来电语音录制为模拟语音信号,并将该模拟语音信号传送给A/D转换器2 (步骤 S31) 。 A/D转换器2将模拟语音信号转换为数字语音信号(步骤S32)。

特征撷取单元3通过端点侦测原理将数字语音信号中的有声语音数据和无声语音数据切 割开来,以便从数字语音信号中获取有声语音信号(步骤S33)。特征撷取单元3根据有声语 音信号的频率大小从有声语音信号中撷取不同的特征参数(步骤S34),如何利用端点侦测 原理切割数字语音信号中的有声语音数据和无声语音数据如图2描述。

情绪分类器5根据不同的特征参数从存储器4中读取有声语音信号对应的情绪特征数据( 步骤S35)。情绪分类器5对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数 据(步骤S36)。情绪分类器5利用相近数据具有同类特征的原理对读取的情绪特征数据进行 分类统计的。例如,特征撷取单元3撷取有声语音的MFCC参数,情绪分类器5将MFCC值进行相邻距离计算,取K个值距离最短的情绪数据定义语音的情绪特征,如果取1(=5,悲伤程度( sadness) =4,生气程度(angry) =2,快乐程度(happy) =1,中性程度(neutral) =1以及 厌倦程度(bored) =0,则情绪分类器5判定该情绪类别就是"悲伤(sadness)"。

情绪输出单元6根据情绪分类器5产生的分类统计数据产生来电对方的情绪分析报告。所 述的情绪分析报告描述了对方通话时的情绪状态,其包括生气程度、厌倦程度、快乐程度、 平常程度以及悲伤程度(步骤S37)。最后,情绪输出单元6将该情绪分析报告输出并显示在 手机10的显示屏幕7上,以供使用者了解对方通话时的情绪状态(步骤S38)。

以上实施例仅用以说明本发明的技术方案而非限制,尽管参照以上较佳实施例对本发明 进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等 同替换都不应脱离本发明技术方案的精神和范围。

Claims (10)

1.一种实现来电情绪辨识的手机,其特征在于,该手机包括: 语音录制单元,用于将来电语音录制为模拟语音信号; A/D转换器,用于将模拟语音信号转换为数字语音信号; 特征撷取单元,用于通过端点侦测原理切割数字语音信号中的有声语音数据和无声语音数据,并根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数; 情绪分类器,用于根据不同的特征参数读取有声语音信号对应的情绪特征数据,并对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据;及 情绪输出单元,用于根据情绪分类器产生的分类统计数据生成来电对方的情绪分析报告。
2 如权利要求l所述的实现来电情绪辨识的手机,其特征在于,所述 的情绪特征数据存储在手机的存储器中,或者存储在手机运营商的网络数据库中。
3 如权利要求l所述的实现来电情绪辨识的手机,其特征在于,所述 的情绪分类器根据相近数据具有同类特征的原理对读取的情绪特征数据进行分类统计。
4 如权利要求l所述的实现来电情绪辨识的手机,其特征在于,所述 的情绪输出单元还用于将所述的情绪分析报告输出并显示在手机的显示屏幕上。
5 如权利要求4所述的实现来电情绪辨识的手机,其特征在于,所述 的情绪分析报告描述了对方通话时的情绪状态,包括生气程度、厌倦程度、快乐程度、平常 程度以及悲伤程度。
6 一种手机来电情绪辨识的方法,其特征在于,该方法包括步骤: 将来电语音录制为模拟语音信号; 将模拟语音信号转换为数字语音信号;通过端点侦测原理将数字语音信号中的有声语音数据与无声语音数据切割开来;根据有声语音信号的频率大小从有声语音信号中撷取不同的特征参数;根据不同的特征参数读取有声语音信号对应的情绪特征数据;对读取的情绪特征数据进行分类统计以产生情绪特征的分类统计数据; 根据所述的分类统计数据产生来电对方的情绪分析报告。
7 如权利要求6所述的手机来电情绪辨识的方法,其特征在于,所述 的情绪特征数据存储在手机的存储器中,或者存储在手机运营商的网络数据库中。
8 如权利要求6所述的手机来电情绪辨识的方法,其特征在于,所述 的端点侦测原理依据语音信号中的能量和越零率来切割出语音信号中的有声数据与无声数据
9 如权利要求6所述的手机来电情绪辨识的方法,其特征在于,该方 法还包括如下步骤:将所述的情绪分析报告输出并显示在手机的显示屏幕上。
10 如权利要求9所述的手机来电情绪辨识的方法,其特征在于,所 述的情绪分析报告描述了对方通话时的情绪状态,包括生气程度、厌倦程度、快乐程度、平 常程度以及悲伤程度。
CN 200810303557 2008-08-06 2008-08-06 实现来电情绪辨识的手机及方法 CN101645961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200810303557 CN101645961A (zh) 2008-08-06 2008-08-06 实现来电情绪辨识的手机及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810303557 CN101645961A (zh) 2008-08-06 2008-08-06 实现来电情绪辨识的手机及方法

Publications (1)

Publication Number Publication Date
CN101645961A true true CN101645961A (zh) 2010-02-10

Family

ID=41657675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810303557 CN101645961A (zh) 2008-08-06 2008-08-06 实现来电情绪辨识的手机及方法

Country Status (1)

Country Link
CN (1) CN101645961A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366760A (zh) * 2012-03-26 2013-10-23 联想(北京)有限公司 一种数据处理方法、装置及系统
CN103634472A (zh) * 2013-12-06 2014-03-12 惠州Tcl移动通信有限公司 根据通话语音判断用户心情及性格的方法、系统及手机
CN104113634A (zh) * 2013-04-22 2014-10-22 三星电子(中国)研发中心 一种对语音进行处理的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366760A (zh) * 2012-03-26 2013-10-23 联想(北京)有限公司 一种数据处理方法、装置及系统
CN104113634A (zh) * 2013-04-22 2014-10-22 三星电子(中国)研发中心 一种对语音进行处理的方法
CN103634472A (zh) * 2013-12-06 2014-03-12 惠州Tcl移动通信有限公司 根据通话语音判断用户心情及性格的方法、系统及手机

Similar Documents

Publication Publication Date Title
Li et al. Robust endpoint detection and energy normalization for real-time speech and speaker recognition
US7933226B2 (en) System and method for providing communication channels that each comprise at least one property dynamically changeable during social interactions
US6651042B1 (en) System and method for automatic voice message processing
US6775651B1 (en) Method of transcribing text from computer voice mail
US6563911B2 (en) Speech enabled, automatic telephone dialer using names, including seamless interface with computer-based address book programs
US20090198497A1 (en) Method and apparatus for speech synthesis of text message
US20080188204A1 (en) System and method for processing a voicemail message
US20070057798A1 (en) Vocalife line: a voice-operated device and system for saving lives in medical emergency
US20140012586A1 (en) Determining hotword suitability
US7706510B2 (en) System and method for personalized text-to-voice synthesis
US8219404B2 (en) Method and apparatus for recognizing a speaker in lawful interception systems
US20080300871A1 (en) Method and apparatus for identifying acoustic background environments to enhance automatic speech recognition
US20060221935A1 (en) Method and apparatus for representing communication attributes
US20110004473A1 (en) Apparatus and method for enhanced speech recognition
US20090292541A1 (en) Methods and apparatus for enhancing speech analytics
US20110111805A1 (en) Synthesized audio message over communication links
US20110082874A1 (en) Multi-party conversation analyzer & logger
US20020082007A1 (en) Method and system for expressing affective state in communication by telephone
US20120330660A1 (en) Detecting and Communicating Biometrics of Recorded Voice During Transcription Process
US20090094029A1 (en) Managing Audio in a Multi-Source Audio Environment
US20040085259A1 (en) Avatar control using a communication device
US20070249406A1 (en) Method and system for retrieving information
US20060280295A1 (en) Voice activated phone mute reminder method and apparatus
US20120078397A1 (en) System and method of smart audio logging for mobile devices
US20140247926A1 (en) Multi-party conversation analyzer & logger

Legal Events

Date Code Title Description
C06 Publication
C10 Request of examination as to substance
C12 Rejection of an application for a patent