CN117393003B - 一种基于语义理解的情绪识别方法及系统 - Google Patents
一种基于语义理解的情绪识别方法及系统 Download PDFInfo
- Publication number
- CN117393003B CN117393003B CN202311707433.6A CN202311707433A CN117393003B CN 117393003 B CN117393003 B CN 117393003B CN 202311707433 A CN202311707433 A CN 202311707433A CN 117393003 B CN117393003 B CN 117393003B
- Authority
- CN
- China
- Prior art keywords
- emotion
- keywords
- keyword
- grade
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008909 emotion recognition Effects 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000008451 emotion Effects 0.000 claims abstract description 384
- 230000007935 neutral effect Effects 0.000 claims description 17
- 230000001186 cumulative effect Effects 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 206010063659 Aversion Diseases 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Child & Adolescent Psychology (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于语义理解的情绪识别方法及系统,其中方法包括:获取语音信息;根据语音信息,得到对应语音信息中的关键词;根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;获取对应关键词的位置以及数量信息;根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;获取对应关键词的声音特征以及对应特征值;根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级。本发明通过语义和声音的特征进行结合,提高了情绪识别的准确性。
Description
技术领域
本发明涉及情绪识别技术领域,更具体的,涉及一种基于语义理解的情绪识别方法及系统。
背景技术
情绪包括愤怒、快乐、中性等类型,可以影响一个人的判断、理解、人际交往等,对个人的影响以及人与人之间的影响都发挥着至关重要的作用。当前,情绪识别被用于的范围越来越广,比如病人的治疗、智能客服等,发挥着越来越重要的作用。
发明内容
鉴于上述问题,本发明的目的是提供一种基于语义理解的情绪识别方法及系统,能够提高情绪识别的准确性。
本发明第一方面提供了一种基于语义理解的情绪识别方法,包括:
获取语音信息;
根据语音信息,得到对应语音信息中的关键词;
根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;
获取对应关键词的位置以及数量信息;
根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;
获取对应关键词的声音特征以及对应特征值;
根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级。
本方案中,所述根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值的步骤,具体包括:
根据关键词的位置信息,得到对应关键词的位置占比;
根据关键词的数量信息,得到对应关键词的数量占比;
将所述关键词的位置占比乘以预设第一权重系数,得到关键词的第一情绪等级的第一概率值;
将所述关键词的数量占比乘以预设第二权重系数,得到关键词的第一情绪等级的第二概率值;
将所述关键词的第一概率值和第二概率值进行累加,得到关键词对应的第一情绪等级的概率值。
本方案中,所述根据关键词的位置信息,得到对应关键词的位置占比的步骤,具体包括:
获取关键词在语音信息中出现的时间,并根据出现的时间先后顺序对关键词进行排序,得到对应关键词序号和语音信息中的关键词总序号;
当关键词存在多个序号时,取关键词最后出现的时间对应的关键词序号;
将关键词序号除以语音信息中的关键词总序号,得到对应关键词的位置占比。
本方案中,所述根据关键词的数量信息,得到对应关键词的数量占比的步骤,具体包括:
获取语音信息中的关键词总数量;
将对应关键词的数量除以语音信息中的关键词总数量,得到对应关键词的数量占比。
本方案中,所述根据对应关键词的声音特征值,得到关键词对应的第二情绪等级的步骤,具体包括:
将关键词的声音特征值乘以对应特征的预设权重系数,得到对应特征分值;
将关键词的声音的不同特征分值进行累加,得到对应关键词的特征总分值;
根据对应关键词的特征总分值落入的预设特征分值范围,得到对应关键词的特征等级;
根据对应关键词的特征等级,匹配关键词对应的第二情绪等级。
本方案中,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级的步骤,具体包括:
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级;
将关键词的最终情绪等级乘以对应关键词的位置占比,得到情绪对比值;
将相同的最终情绪等级对应的情绪对比值进行累加,得到对应最终情绪等级的情绪对比累计值;
判断所述最终情绪等级的情绪对比累计值是否大于预设第一阈值,若是,将对应最终情绪等级设为该语音信息中存在的情绪等级;若否,将对应语音信息中的情绪设为中性。
本方案中,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级的步骤,具体包括:
当关键词对应的第一情绪等级和第二情绪等级相同时,将关键词对应的第一情绪等级或第二情绪等级设为对应关键词的最终情绪等级;
当关键词对应的第一情绪等级和第二情绪等级不相同时,判断所述第一情绪等级的概率值是否大于预设第一概率阈值,若是,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
若否,将关键词对应的第一情绪等级乘以对应概率值,得到第一对比值;将关键词对应的第二情绪等级乘以预设对比系数,得到第二对比值;
当第一对比值大于第二对比值时,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
当第二对比值大于第一对比值时,将关键词对应的第二情绪等级设为对应关键词的最终情绪等级;
当第一对比值等于第二对比值时,将对应关键词的最终情绪设为中性,对应关键词的最终情绪等级和预设中性等级相同。
本发明第二方面提供了一种基于语义理解的情绪识别系统,包括存储器和处理器,所述存储器中存储有一种基于语义理解的情绪识别方法程序,所述一种基于语义理解的情绪识别方法程序被所述处理器执行时实现如下步骤:
获取语音信息;
根据语音信息,得到对应语音信息中的关键词;
根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;
获取对应关键词的位置以及数量信息;
根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;
获取对应关键词的声音特征以及对应特征值;
根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级。
本方案中,所述根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值的步骤,具体包括:
根据关键词的位置信息,得到对应关键词的位置占比;
根据关键词的数量信息,得到对应关键词的数量占比;
将所述关键词的位置占比乘以预设第一权重系数,得到关键词的第一情绪等级的第一概率值;
将所述关键词的数量占比乘以预设第二权重系数,得到关键词的第一情绪等级的第二概率值;
将所述关键词的第一概率值和第二概率值进行累加,得到关键词对应的第一情绪等级的概率值。
本方案中,所述根据关键词的位置信息,得到对应关键词的位置占比的步骤,具体包括:
获取关键词在语音信息中出现的时间,并根据出现的时间先后顺序对关键词进行排序,得到对应关键词序号和语音信息中的关键词总序号;
当关键词存在多个序号时,取关键词最后出现的时间对应的关键词序号;
将关键词序号除以语音信息中的关键词总序号,得到对应关键词的位置占比。
本方案中,所述根据关键词的数量信息,得到对应关键词的数量占比的步骤,具体包括:
获取语音信息中的关键词总数量;
将对应关键词的数量除以语音信息中的关键词总数量,得到对应关键词的数量占比。
本方案中,所述根据对应关键词的声音特征值,得到关键词对应的第二情绪等级的步骤,具体包括:
将关键词的声音特征值乘以对应特征的预设权重系数,得到对应特征分值;
将关键词的声音的不同特征分值进行累加,得到对应关键词的特征总分值;
根据对应关键词的特征总分值落入的预设特征分值范围,得到对应关键词的特征等级;
根据对应关键词的特征等级,匹配关键词对应的第二情绪等级。
本方案中,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级的步骤,具体包括:
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级;
将关键词的最终情绪等级乘以对应关键词的位置占比,得到情绪对比值;
将相同的最终情绪等级对应的情绪对比值进行累加,得到对应最终情绪等级的情绪对比累计值;
判断所述最终情绪等级的情绪对比累计值是否大于预设第一阈值,若是,将对应最终情绪等级设为该语音信息中存在的情绪等级;若否,将对应语音信息中的情绪设为中性。
本方案中,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级的步骤,具体包括:
当关键词对应的第一情绪等级和第二情绪等级相同时,将关键词对应的第一情绪等级或第二情绪等级设为对应关键词的最终情绪等级;
当关键词对应的第一情绪等级和第二情绪等级不相同时,判断所述第一情绪等级的概率值是否大于预设第一概率阈值,若是,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
若否,将关键词对应的第一情绪等级乘以对应概率值,得到第一对比值;将关键词对应的第二情绪等级乘以预设对比系数,得到第二对比值;
当第一对比值大于第二对比值时,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
当第二对比值大于第一对比值时,将关键词对应的第二情绪等级设为对应关键词的最终情绪等级;
当第一对比值等于第二对比值时,将对应关键词的最终情绪设为中性,对应关键词的最终情绪等级和预设中性等级相同。
本发明公开了一种基于语义理解的情绪识别方法及系统,通过语义和声音的特征进行结合,提高了情绪识别的准确性。
附图说明
图1示出了本发明一种基于语义理解的情绪识别方法的流程图;
图2示出了本发明一种基于语义理解的情绪识别系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于语义理解的情绪识别方法的流程图。
如图1所示,本发明公开了一种基于语义理解的情绪识别方法,包括:
S101,获取语音信息;
S102,根据语音信息,得到对应语音信息中的关键词;
S103,根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;
S104,获取对应关键词的位置以及数量信息;
S105,根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;
S106,获取对应关键词的声音特征以及对应特征值;
S107,根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;
S108,根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级。
根据本发明实施例,所述预设情绪等级表中存储有大量的关键词以及关键词对应的第一情绪等级,将情绪进行分类并等级化,所述情绪包括厌恶、伤心、生气、中性、开心等,例如将厌恶设为情绪等级一,伤心设为情绪等级一、生气设为情绪等级三等,每种情绪均设立一个情绪等级,每个情绪等级可以存在多种情绪,根据关键词找到对应的第一情绪等级,所述关键词可能在对应语音信息中存在多次,所述对应关键词的语音特征包括语音信息中对应关键词的音量、音频等,比如音量特征对应的是音量大小,其中音量越大,对应的特征值越大。
根据本发明实施例,所述根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值的步骤,具体包括:
根据关键词的位置信息,得到对应关键词的位置占比;
根据关键词的数量信息,得到对应关键词的数量占比;
将所述关键词的位置占比乘以预设第一权重系数,得到关键词的第一情绪等级的第一概率值;
将所述关键词的数量占比乘以预设第二权重系数,得到关键词的第一情绪等级的第二概率值;
将所述关键词的第一概率值和第二概率值进行累加,得到关键词对应的第一情绪等级的概率值。
需要说明的是,所述关键词的位置以及数量对关键词的第一情绪等级的确认概率成正比例影响,其中关键词的位置越在语音的结尾,关键词的第一情绪等级的概率值越大,关键词的数量越多,关键词对应的第一情绪等级的概率值越大,所述关键词对应的第一情绪等级和第二情绪等级为对应关键词的初步确认的情绪等级。
根据本发明实施例,所述根据关键词的位置信息,得到对应关键词的位置占比的步骤,具体包括:
获取关键词在语音信息中出现的时间,并根据出现的时间先后顺序对关键词进行排序,得到对应关键词序号和语音信息中的关键词总序号;
当关键词存在多个序号时,取关键词最后出现的时间对应的关键词序号;
将关键词序号除以语音信息中的关键词总序号,得到对应关键词的位置占比。
需要说明的是,比如语音信息中的关键词总序号为10,其中一个关键词在该语音信息中出现了2次,其中一次的序号为3,另一次的序号为5,则对应关键词的位置占比为。
根据本发明实施例,所述根据关键词的数量信息,得到对应关键词的数量占比的步骤,具体包括:
获取语音信息中的关键词总数量;
将对应关键词的数量除以语音信息中的关键词总数量,得到对应关键词的数量占比。
需要说明的是,若对应关键词在语音信息中出现了2次,则对应关键词的数量为2,若对应语音信息中的关键词总数量为8,则对应关键词的数量占比为。
根据本发明实施例,所述根据对应关键词的声音特征值,得到关键词对应的第二情绪等级的步骤,具体包括:
将关键词的声音特征值乘以对应特征的预设权重系数,得到对应特征分值;
将关键词的声音的不同特征分值进行累加,得到对应关键词的特征总分值;
根据对应关键词的特征总分值落入的预设特征分值范围,得到对应关键词的特征等级;
根据对应关键词的特征等级,匹配关键词对应的第二情绪等级。
需要说明的是,所述关键词的声音特征值包括音量大小、音频大小等,所述关键词的声音的不同特征分值包括音量特征分值、音频特征分值等,所述预设特征分值范围根据预设的特征分值基数进行划分,比如预设的特征分值为10,则以10为基数,比如将预设特征分值范围分为、/>、/>…并以此类推,每个预设特征分值范围对应一个关键词的特征等级,每个关键词的特征等级可以对应多个预设特征分值范围,比如将预设特征分值范围/>设为对应关键词的第一特征等级,所述关键词的特征等级和关键词对应的第二情绪等级进行关联,每个关键词的特征等级对应一个关键词对应的第二情绪等级,每个关键词对应的第二情绪等级可以多个关键词的特征等级。
根据本发明实施例,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级的步骤,具体包括:
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级;
将关键词的最终情绪等级乘以对应关键词的位置占比,得到情绪对比值;
将相同的最终情绪等级对应的情绪对比值进行累加,得到对应最终情绪等级的情绪对比累计值;
判断所述最终情绪等级的情绪对比累计值是否大于预设第一阈值,若是,将对应最终情绪等级设为该语音信息中存在的情绪等级;若否,将对应语音信息中的情绪设为中性。
需要说明的是,所述情绪为中性表示无法识别语音信息中存在其他情绪或者语音信息中不存在情绪,当语音信息中存在多个关键词对应的最终情绪等级相同时,将对应相同的最终情绪等级对应的情绪对比值进行累加,得到对应相同的最终情绪等级的情绪对比累计值;当存在多个最终情绪等级的情绪对比累计值大于预设第一阈值时,说明当前语音信息中存在多种情绪等级,表示对应语音信息中的用户存在多种情绪转变,当最终情绪等级的情绪对比累计值都小于或等于预设第一阈值时,说明当前语音信息中不存在情绪。
根据本发明实施例,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级的步骤,具体包括:
当关键词对应的第一情绪等级和第二情绪等级相同时,将关键词对应的第一情绪等级或第二情绪等级设为对应关键词的最终情绪等级;
当关键词对应的第一情绪等级和第二情绪等级不相同时,判断所述第一情绪等级的概率值是否大于预设第一概率阈值,若是,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
若否,将关键词对应的第一情绪等级乘以对应概率值,得到第一对比值;将关键词对应的第二情绪等级乘以预设对比系数,得到第二对比值;
当第一对比值大于第二对比值时,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
当第二对比值大于第一对比值时,将关键词对应的第二情绪等级设为对应关键词的最终情绪等级;
当第一对比值等于第二对比值时,将对应关键词的最终情绪设为中性,对应关键词的最终情绪等级和预设中性等级相同。
需要说明的是,通过关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级进行比较分析,确定关键词对应的最终情绪等级。
图2示出了本发明一种基于语义理解的情绪识别系统的框图。
如图2所示,本发明第二方面提供了一种基于语义理解的情绪识别系统2,包括存储器21和处理器22,所述存储器中存储有一种基于语义理解的情绪识别方法程序,所述一种基于语义理解的情绪识别方法程序被所述处理器执行时实现如下步骤:
获取语音信息;
根据语音信息,得到对应语音信息中的关键词;
根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;
获取对应关键词的位置以及数量信息;
根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;
获取对应关键词的声音特征以及对应特征值;
根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级。
根据本发明实施例,所述预设情绪等级表中存储有大量的关键词以及关键词对应的第一情绪等级,将情绪进行分类并等级化,所述情绪包括厌恶、伤心、生气、中性、开心等,例如将厌恶设为情绪等级一,伤心设为情绪等级一、生气设为情绪等级三等,每种情绪均设立一个情绪等级,每个情绪等级可以存在多种情绪,根据关键词找到对应的第一情绪等级,所述关键词可能在对应语音信息中存在多次,所述对应关键词的语音特征包括语音信息中对应关键词的音量、音频等,比如音量特征对应的是音量大小,其中音量越大,对应的特征值越大。
根据本发明实施例,所述根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值的步骤,具体包括:
根据关键词的位置信息,得到对应关键词的位置占比;
根据关键词的数量信息,得到对应关键词的数量占比;
将所述关键词的位置占比乘以预设第一权重系数,得到关键词的第一情绪等级的第一概率值;
将所述关键词的数量占比乘以预设第二权重系数,得到关键词的第一情绪等级的第二概率值;
将所述关键词的第一概率值和第二概率值进行累加,得到关键词对应的第一情绪等级的概率值。
需要说明的是,所述关键词的位置以及数量对关键词的第一情绪等级的确认概率成正比例影响,其中关键词的位置越在语音的结尾,关键词的第一情绪等级的概率值越大,关键词的数量越多,关键词对应的第一情绪等级的概率值越大,所述关键词对应的第一情绪等级和第二情绪等级为对应关键词的初步确认的情绪等级。
根据本发明实施例,所述根据关键词的位置信息,得到对应关键词的位置占比的步骤,具体包括:
获取关键词在语音信息中出现的时间,并根据出现的时间先后顺序对关键词进行排序,得到对应关键词序号和语音信息中的关键词总序号;
当关键词存在多个序号时,取关键词最后出现的时间对应的关键词序号;
将关键词序号除以语音信息中的关键词总序号,得到对应关键词的位置占比。
需要说明的是,比如语音信息中的关键词总序号为10,其中一个关键词在该语音信息中出现了2次,其中一次的序号为3,另一次的序号为5,则对应关键词的位置占比为。
根据本发明实施例,所述根据关键词的数量信息,得到对应关键词的数量占比的步骤,具体包括:
获取语音信息中的关键词总数量;
将对应关键词的数量除以语音信息中的关键词总数量,得到对应关键词的数量占比。
需要说明的是,若对应关键词在语音信息中出现了2次,则对应关键词的数量为2,若对应语音信息中的关键词总数量为8,则对应关键词的数量占比为。
根据本发明实施例,所述根据对应关键词的声音特征值,得到关键词对应的第二情绪等级的步骤,具体包括:
将关键词的声音特征值乘以对应特征的预设权重系数,得到对应特征分值;
将关键词的声音的不同特征分值进行累加,得到对应关键词的特征总分值;
根据对应关键词的特征总分值落入的预设特征分值范围,得到对应关键词的特征等级;
根据对应关键词的特征等级,匹配关键词对应的第二情绪等级。
需要说明的是,所述关键词的声音特征值包括音量大小、音频大小等,所述关键词的声音的不同特征分值包括音量特征分值、音频特征分值等,所述预设特征分值范围根据预设的特征分值基数进行划分,比如预设的特征分值为10,则以10为基数,比如将预设特征分值范围分为、/>、/>…并以此类推,每个预设特征分值范围对应一个关键词的特征等级,每个关键词的特征等级可以对应多个预设特征分值范围,比如将预设特征分值范围/>设为对应关键词的第一特征等级,所述关键词的特征等级和关键词对应的第二情绪等级进行关联,每个关键词的特征等级对应一个关键词对应的第二情绪等级,每个关键词对应的第二情绪等级可以多个关键词的特征等级。
根据本发明实施例,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级的步骤,具体包括:
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级;
将关键词的最终情绪等级乘以对应关键词的位置占比,得到情绪对比值;
将相同的最终情绪等级对应的情绪对比值进行累加,得到对应最终情绪等级的情绪对比累计值;
判断所述最终情绪等级的情绪对比累计值是否大于预设第一阈值,若是,将对应最终情绪等级设为该语音信息中存在的情绪等级;若否,将对应语音信息中的情绪设为中性。
需要说明的是,所述情绪为中性表示无法识别语音信息中存在其他情绪或者语音信息中不存在情绪,当语音信息中存在多个关键词对应的最终情绪等级相同时,将对应相同的最终情绪等级对应的情绪对比值进行累加,得到对应相同的最终情绪等级的情绪对比累计值;当存在多个最终情绪等级的情绪对比累计值大于预设第一阈值时,说明当前语音信息中存在多种情绪等级,表示对应语音信息中的用户存在多种情绪转变,当最终情绪等级的情绪对比累计值都小于或等于预设第一阈值时,说明当前语音信息中不存在情绪。
根据本发明实施例,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级的步骤,具体包括:
当关键词对应的第一情绪等级和第二情绪等级相同时,将关键词对应的第一情绪等级或第二情绪等级设为对应关键词的最终情绪等级;
当关键词对应的第一情绪等级和第二情绪等级不相同时,判断所述第一情绪等级的概率值是否大于预设第一概率阈值,若是,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
若否,将关键词对应的第一情绪等级乘以对应概率值,得到第一对比值;将关键词对应的第二情绪等级乘以预设对比系数,得到第二对比值;
当第一对比值大于第二对比值时,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
当第二对比值大于第一对比值时,将关键词对应的第二情绪等级设为对应关键词的最终情绪等级;
当第一对比值等于第二对比值时,将对应关键词的最终情绪设为中性,对应关键词的最终情绪等级和预设中性等级相同。
需要说明的是,通过关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级进行比较分析,确定关键词对应的最终情绪等级。
本发明公开了一种基于语义理解的情绪识别方法及系统,其中方法包括:获取语音信息;根据语音信息,得到对应语音信息中的关键词;根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;获取对应关键词的位置以及数量信息;根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;获取对应关键词的声音特征以及对应特征值;根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级。本发明通过语义和声音的特征进行结合,提高了情绪识别的准确性。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (6)
1.一种基于语义理解的情绪识别方法,其特征在于,包括:
获取语音信息;
根据语音信息,得到对应语音信息中的关键词;
根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;
获取对应关键词的位置以及数量信息;
根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;
获取对应关键词的声音特征以及对应特征值;
根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级;
所述根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值的步骤,具体包括:
根据关键词的位置信息,得到对应关键词的位置占比;
根据关键词的数量信息,得到对应关键词的数量占比;
将所述关键词的位置占比乘以预设第一权重系数,得到关键词的第一情绪等级的第一概率值;
将所述关键词的数量占比乘以预设第二权重系数,得到关键词的第一情绪等级的第二概率值;
将所述关键词的第一概率值和第二概率值进行累加,得到关键词对应的第一情绪等级的概率值;
所述根据关键词的位置信息,得到对应关键词的位置占比的步骤,具体包括:
获取关键词在语音信息中出现的时间,并根据出现的时间先后顺序对关键词进行排序,得到对应关键词序号和语音信息中的关键词总序号;
当关键词存在多个序号时,取关键词最后出现的时间对应的关键词序号;
将关键词序号除以语音信息中的关键词总序号,得到对应关键词的位置占比。
2.根据权利要求1所述的一种基于语义理解的情绪识别方法,其特征在于,所述根据关键词的数量信息,得到对应关键词的数量占比的步骤,具体包括:
获取语音信息中的关键词总数量;
将对应关键词的数量除以语音信息中的关键词总数量,得到对应关键词的数量占比。
3.根据权利要求1所述的一种基于语义理解的情绪识别方法,其特征在于,所述根据对应关键词的声音特征值,得到关键词对应的第二情绪等级的步骤,具体包括:
将关键词的声音特征值乘以对应特征的预设权重系数,得到对应特征分值;
将关键词的声音的不同特征分值进行累加,得到对应关键词的特征总分值;
根据对应关键词的特征总分值落入的预设特征分值范围,得到对应关键词的特征等级;
根据对应关键词的特征等级,匹配关键词对应的第二情绪等级。
4.根据权利要求1所述的一种基于语义理解的情绪识别方法,其特征在于,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级的步骤,具体包括:
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级;
将关键词的最终情绪等级乘以对应关键词的位置占比,得到情绪对比值;
将相同的最终情绪等级对应的情绪对比值进行累加,得到对应最终情绪等级的情绪对比累计值;
判断所述最终情绪等级的情绪对比累计值是否大于预设第一阈值,若是,将对应最终情绪等级设为该语音信息中存在的情绪等级;若否,将对应语音信息中的情绪设为中性。
5.根据权利要求4所述的一种基于语义理解的情绪识别方法,其特征在于,所述根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应关键词的最终情绪等级的步骤,具体包括:
当关键词对应的第一情绪等级和第二情绪等级相同时,将关键词对应的第一情绪等级或第二情绪等级设为对应关键词的最终情绪等级;
当关键词对应的第一情绪等级和第二情绪等级不相同时,判断所述第一情绪等级的概率值是否大于预设第一概率阈值,若是,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
若否,将关键词对应的第一情绪等级乘以对应概率值,得到第一对比值;将关键词对应的第二情绪等级乘以预设对比系数,得到第二对比值;
当第一对比值大于第二对比值时,将关键词对应的第一情绪等级设为对应关键词的最终情绪等级;
当第二对比值大于第一对比值时,将关键词对应的第二情绪等级设为对应关键词的最终情绪等级;
当第一对比值等于第二对比值时,将对应关键词的最终情绪设为中性,对应关键词的最终情绪等级和预设中性等级相同。
6.一种基于语义理解的情绪识别系统,其特征在于,包括存储器和处理器,所述存储器中存储有一种基于语义理解的情绪识别方法程序,所述一种基于语义理解的情绪识别方法程序被所述处理器执行时实现如下步骤:
获取语音信息;
根据语音信息,得到对应语音信息中的关键词;
根据所述关键词在预设情绪等级表中查询,得到关键词对应的第一情绪等级;
获取对应关键词的位置以及数量信息;
根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值;
获取对应关键词的声音特征以及对应特征值;
根据对应关键词的声音特征值,得到关键词对应的第二情绪等级;
根据关键词对应的第一情绪等级、第一情绪等级的概率值和第二情绪等级,得到对应语音的情绪等级;
所述根据关键词的位置以及数量信息,得到关键词对应的第一情绪等级的概率值的步骤,具体包括:
根据关键词的位置信息,得到对应关键词的位置占比;
根据关键词的数量信息,得到对应关键词的数量占比;
将所述关键词的位置占比乘以预设第一权重系数,得到关键词的第一情绪等级的第一概率值;
将所述关键词的数量占比乘以预设第二权重系数,得到关键词的第一情绪等级的第二概率值;
将所述关键词的第一概率值和第二概率值进行累加,得到关键词对应的第一情绪等级的概率值;
所述根据关键词的位置信息,得到对应关键词的位置占比的步骤,具体包括:
获取关键词在语音信息中出现的时间,并根据出现的时间先后顺序对关键词进行排序,得到对应关键词序号和语音信息中的关键词总序号;
当关键词存在多个序号时,取关键词最后出现的时间对应的关键词序号;
将关键词序号除以语音信息中的关键词总序号,得到对应关键词的位置占比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311707433.6A CN117393003B (zh) | 2023-12-13 | 2023-12-13 | 一种基于语义理解的情绪识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311707433.6A CN117393003B (zh) | 2023-12-13 | 2023-12-13 | 一种基于语义理解的情绪识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117393003A CN117393003A (zh) | 2024-01-12 |
CN117393003B true CN117393003B (zh) | 2024-03-15 |
Family
ID=89436006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311707433.6A Active CN117393003B (zh) | 2023-12-13 | 2023-12-13 | 一种基于语义理解的情绪识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117393003B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678278A (zh) * | 2013-12-16 | 2014-03-26 | 中国科学院计算机网络信息中心 | 一种中文文本情感识别方法 |
WO2015005662A1 (en) * | 2013-07-12 | 2015-01-15 | Mezzomedia Co., Ltd. | Method for analyzing emotional index of text and computer-readable recording medium |
CN111695033A (zh) * | 2020-04-29 | 2020-09-22 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
CN111881291A (zh) * | 2020-06-19 | 2020-11-03 | 山东师范大学 | 一种文本情感分类方法及系统 |
CN114120978A (zh) * | 2021-11-29 | 2022-03-01 | 中国平安人寿保险股份有限公司 | 情绪识别模型训练、语音交互方法、装置、设备及介质 |
CA3182191A1 (en) * | 2021-11-17 | 2023-05-17 | 10353744 Canada Ltd. | Voice quality inspection method and device, computer equipment and storage medium |
CN116560513A (zh) * | 2023-07-08 | 2023-08-08 | 世优(北京)科技有限公司 | 基于情绪识别的ai数字人交互方法、装置及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210024B (zh) * | 2019-05-28 | 2024-04-02 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置及存储介质 |
-
2023
- 2023-12-13 CN CN202311707433.6A patent/CN117393003B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015005662A1 (en) * | 2013-07-12 | 2015-01-15 | Mezzomedia Co., Ltd. | Method for analyzing emotional index of text and computer-readable recording medium |
CN103678278A (zh) * | 2013-12-16 | 2014-03-26 | 中国科学院计算机网络信息中心 | 一种中文文本情感识别方法 |
CN111695033A (zh) * | 2020-04-29 | 2020-09-22 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
CN111881291A (zh) * | 2020-06-19 | 2020-11-03 | 山东师范大学 | 一种文本情感分类方法及系统 |
CA3182191A1 (en) * | 2021-11-17 | 2023-05-17 | 10353744 Canada Ltd. | Voice quality inspection method and device, computer equipment and storage medium |
CN114120978A (zh) * | 2021-11-29 | 2022-03-01 | 中国平安人寿保险股份有限公司 | 情绪识别模型训练、语音交互方法、装置、设备及介质 |
CN116560513A (zh) * | 2023-07-08 | 2023-08-08 | 世优(北京)科技有限公司 | 基于情绪识别的ai数字人交互方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117393003A (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190088262A1 (en) | Method and apparatus for pushing information | |
US20170270921A1 (en) | Dialog management system | |
US8364493B2 (en) | Spoken dialogue speech recognition using estimated number of retrieved data as cost | |
US20200388281A1 (en) | Information processing system, and information processing method | |
JPH08272826A (ja) | 文書加工方法および装置 | |
CN114120516B (zh) | 一种营业厅叫号顺序优化方法 | |
CN110457454A (zh) | 一种对话方法、服务器、对话系统及存储介质 | |
CN115017289A (zh) | 一种基于知识库的对客服务方法及装置 | |
CN117393003B (zh) | 一种基于语义理解的情绪识别方法及系统 | |
JP2005275601A (ja) | 音声による情報検索システム | |
CN109948718B (zh) | 一种基于多算法融合的系统及方法 | |
CN111640450A (zh) | 多人声音频处理方法、装置、设备及可读存储介质 | |
CN111627453A (zh) | 公安语音信息管理方法、装置、设备及计算机存储介质 | |
CN113177061B (zh) | 一种搜索方法、装置和电子设备 | |
CN110858234A (zh) | 一种根据人物情感进行信息推送的方法及装置 | |
CN112735395B (zh) | 语音识别方法及电子设备、存储装置 | |
JP2011142381A (ja) | オペレータ選定装置及びオペレータ選定プログラム | |
CN111951070B (zh) | 基于车联网的智能推荐方法、装置、服务器及存储介质 | |
CN111970311B (zh) | 会话切分方法、电子设备及计算机可读介质 | |
CN109213937B (zh) | 智能搜索方法及装置 | |
CN110880081A (zh) | 基于语音识别的员工管理方法、装置、计算机设备和介质 | |
CN111429920B (zh) | 用户区分方法、用户行为库确定方法、装置及设备 | |
CN114049875A (zh) | 一种tts播报方法、装置、设备以及存储介质 | |
CN117312612B (zh) | 一种基于多模态的远程会议数据记录方法、系统和介质 | |
CN111160989B (zh) | 一种信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |