CN111694938B - 基于情绪识别的答复方法、装置、计算机设备及存储介质 - Google Patents

基于情绪识别的答复方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111694938B
CN111694938B CN202010345920.2A CN202010345920A CN111694938B CN 111694938 B CN111694938 B CN 111694938B CN 202010345920 A CN202010345920 A CN 202010345920A CN 111694938 B CN111694938 B CN 111694938B
Authority
CN
China
Prior art keywords
information
identified
emotion
text
corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010345920.2A
Other languages
English (en)
Other versions
CN111694938A (zh
Inventor
叶怡周
胡宏伟
马骏
王少军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010345920.2A priority Critical patent/CN111694938B/zh
Priority to PCT/CN2020/092977 priority patent/WO2021217769A1/zh
Publication of CN111694938A publication Critical patent/CN111694938A/zh
Application granted granted Critical
Publication of CN111694938B publication Critical patent/CN111694938B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Human Computer Interaction (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于人工智能技术领域,公开了基于情绪识别的答复方法、装置、计算机设备及存储介质。方法包括:获取来自用户终端的待识别信息对应的目标文字信息,根据文字处理规则获取与目标文字信息对应的文字特征向量,并根据情绪识别模型获取与文字特征向量对应的情绪等级,获取语料信息库中与情绪等级及目标文字信息相匹配的语料信息作为答复语料信息反馈至用户终端,以完成答复。本发明基于情绪识别技术,可接收来自用户终端的待识别信息并获取与待识别信息相匹配的情绪等级,根据情绪等级及与待识别信息对应的目标文字信息获取答复语料信息,可实现根据待识别信息中的情绪等级灵活调整答复语料信息,提高了对提问信息进行答复的灵活性。

Description

基于情绪识别的答复方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能技术领域,属于智慧城市智能语音客服交互相关应用场景,尤其涉及一种基于情绪识别的答复方法、装置、计算机设备及存储介质。
背景技术
客户在办理业务的过程中可能会遇到各种问题,此时客户即可通过电话联系客服人员以获取相应的解决办法,或通过互联网发送所需解答的提问信息至客服人员以获取相应的解决办法,上述方式均是基于人工客服实现的。随着人工智能的兴起和发展,越来越多的企业采用智能语音客服替代人工客服以为客户提供服务,采用智能语音客服可显著降低企业的人力成本,然而现有的智能语音客服仅能基于客户所提出的提问信息获取对应的答复信息,而无法从客户所提出的提问信息中获取其它有用信息,导致目前的智能语音客服的灵活性不足,例如无法针对提问信息中的情绪灵活调整答复信息。因而,现有技术方法中的智能语音客服在对客户的提问信息进行答复时存在灵活性不足的问题。
发明内容
本发明实施例提供了一种基于情绪识别的答复方法、装置、计算机设备及存储介质,旨在解决现有的技术方法中的智能语音客服在对提问信息进行答复时所存在的灵活性不足的问题。
第一方面,本发明实施例提供了一种基于情绪识别的答复方法,其包括:
若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息;
若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息;
若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息;
根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量;
将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级;
根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端。
第二方面,本发明实施例提供了一种基于情绪识别的答复装置,其包括:
待识别信息判断单元,用于若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息;
待识别信息识别单元,用于若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息;
目标文字信息获取单元,用于若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息;
文字特征向量获取单元,用于根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量;
情绪等级获取单元,用于将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级;
答复语料信息获取单元,用于根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于情绪识别的答复方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于情绪识别的答复方法。
本发明实施例提供了一种基于情绪识别的答复方法、装置、计算机设备。获取来自用户终端的待识别信息对应的目标文字信息,根据文字处理规则获取与目标文字信息对应的文字特征向量,并根据情绪识别模型获取与文字特征向量对应的情绪等级,获取语料信息库中与情绪等级及目标文字信息相匹配的语料信息作为答复语料信息反馈至用户终端,以完成答复。通过上述方法,可获取与待识别信息相匹配的情绪等级,并根据情绪等级及与待识别信息对应的目标文字信息获取答复语料信息,可实现根据待识别信息中的情绪等级灵活调整答复语料信息,提高了对提问信息进行答复的灵活性。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于情绪识别的答复方法的流程示意图;
图2为本发明实施例提供的基于情绪识别的答复方法的应用场景示意图;
图3为本发明实施例提供的基于情绪识别的答复方法的子流程示意图;
图4为本发明实施例提供的基于情绪识别的答复方法的另一子流程示意图;
图5为本发明实施例提供的基于情绪识别的答复方法的另一子流程示意图;
图6为本发明实施例提供的基于情绪识别的答复方法的另一子流程示意图;
图7为本发明实施例提供的基于情绪识别的答复方法的另一子流程示意图;
图8为本发明实施例提供的基于情绪识别的答复方法的另一流程示意图;
图9为本发明实施例提供的基于情绪识别的答复装置的示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的基于情绪识别的答复方法的流程示意图,图2为本发明实施例提供的基于情绪识别的答复方法的应用场景示意图。该基于情绪识别的答复方法应用于管理服务器10中,该方法通过安装于管理服务器10中的应用软件进行执行,管理服务器10通过与用户终端20建立网络连接以与用户终端20进行通信,用户终端20的使用者可通过用户终端20发送待识别信息至管理服务器10,待识别信息可以是该使用者所发送的需进行解答的提问信息,待识别信息可作为表征该使用者的真实意图的基础,也即是基于待识别信息可获取该使用者的真实意图,管理服务器10执行基于情绪识别的答复方法以对获取与待识别信息对应的答复语料信息并反馈至相应的用户终端20以完成答复,其中,管理服务器10即是用于执行基于情绪识别的答复方法的企业终端,用户终端20即是用于发送待识别信息并接收答复语料信息的终端设备,用户终端20可以是台式电脑、笔记本电脑、平板电脑或手机等。图2中仅仅示意出一台用户终端20与管理服务器10进行数据信息传输,在实际应用中,管理服务器10也可与多台用户终端20同时进行数据信息传输。
如图1所示,该方法包括步骤S110~S160。
S110、若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息。
若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,其中,所述信息类型包括文字信息和语音信息。具体的,待识别信息中包含对应的格式标识信息,格式标识信息即是用于对待识别信息的格式进行标识的信息,通过待识别信息的格式标识信息即可判断待识别信息是否为文字信息。其中,待识别信息可以由用户终端的使用者通过用户终端发送至管理服务器,待识别信息可以是文字、语音或短视频,需从待识别信息中获取对应的目标文字信息,并基于目标文字信息获取使用者的真实意图。
例如,若格式标识信息为txt、string,则对应的待识别信息为文字信息;若格式标识信息为wav、mp3、wma,则该对应的待识别信息为音频信息;若格式标识信息为avi、flv、rmvb,则对应的待识别信息为视频信息。
例如,用户终端的使用者在终端页面的问题框中输入文字并点击确认按钮,则用户终端将该文字作为待识别信息发送至管理服务器;使用者点击终端页面的语音录入按钮,说出自己的问题并点击确认按钮,则用户终端将所录得的语音作为待识别信息发送至管理服务器;使用者点击终端页面的视频录入按钮,正对用户终端的视频采集设备说出自己的问题并点击确认按钮,则用户终端将所录得的短视频作为待识别信息发送至管理服务器。
S120、若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息。
若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息。若待识别信息不为文字信息,则该待识别信息可以是音频信息或视频信息,音频信息或视频信息中均包含语音信息。语音识别模型即是音频信息或视频信息中所包含的语音信息进行识别及转换的模型,其中,所述语音识别模型包括噪音判断规则及文字信息获取模型。噪音判断规则即为对语音信息中是否包含噪音进行判断的规则,文字信息获取模型即为从语音信息中获取对应文字信息的模型,若语音信息中包含噪音,则会影响所获取到的目标文字信息的精确度,因此在从语音信息中获取对应的目标文字信息之前,可通过噪音判断规则对语音信息中是否包含噪音进行判断,以确保从无噪音的语音信息中获取更加准确的目标文字信息。
在一实施例中,如图3所示,步骤S120包括子步骤S121、S122和S123。
S121、根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断。
根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断。具体的,由于人类说话时发出声音的频率处于一个固定频率区间(85Hz~1100Hz),可基于语音信息中声纹信号的频率,从语音信息中获取处于上述固定频率区间的声纹信号的平均信号强度作为目标声音信号强度,从语音信息中获取未处于上述固定频率区间的其他声纹信号的平均强度作为背景噪声信号强度,判断背景噪声信号强度与目标声音信号强度之间的比值是否大于噪音判断规则中所预设的阈值,若比值大于阈值则判断该待识别信息中的语音信息包含噪音;若比值不大于阈值则判断该待识别信息中的语音信息不包含噪音。
例如,从待识别信息的语音信息中获取到目标声音信号强度为65分贝(decibel,dB),背景噪声信号强度为50分贝,预设的阈值为0.8,则背景噪声信号强度与目标声音信号强度之间的比值不大于该预设的阈值,判断该待识别信息中的语音信息不包含噪音。
S122、若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息。
若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息。若待识别信息中的语音信息不包含噪音,则可根据文字信息获取模型对语音信息进行识别以获取对应的目标文字信息,具体的,文字信息获取模型包括声学模型、语音特征词典及语义解析模型。
在一实施例中,如图4所示,步骤S122包括子步骤S1221、S1222和S1223。
S1221、根据所述文字信息获取模型中的声学模型对所述待识别信息进行切分以得到所述待识别信息中所包含的多个音素。
根据所述文字信息获取模型中的声学模型对所述待识别信息进行切分以得到所述待识别信息中所包含的多个音素。具体的,音频信息或视频信息中所包含的语音信息由多个字符发音的音素而组成,一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素,通过将语音信息与声学模型中所有的音素进行匹配,即可对语音信息中单个字符的音素进行切分,通过切分最终得到待识别信息中所包含的多个音素。
S1222、根据所述文字信息获取模型中的语音特征词典对所述音素进行匹配以将所述音素转换为拼音信息。
根据所述文字信息获取模型中的语音特征词典对所述音素进行匹配以将所述音素转换为拼音信息。语音特征词典中包含所有字符拼音对应的音素信息,通过将所得到的音素与字符拼音对应的音素信息进行匹配,即可将单个字符的音素转换为语音特征词典中与该音素相匹配的字符拼音,以实现将语音信息中所包含的所有音素转换为拼音信息。
S1223、根据所述文字信息获取模型中的语义解析模型对所述拼音信息进行语义解析以得到与所述待识别信息对应的目标文字信息。
根据所述文字信息获取模型中的语义解析模型对所述拼音信息进行语义解析以得到与所述待识别信息对应的目标文字信息。语义解析模型中包含拼音信息与文字信息之间所对应的映射关系,通过语义解析模型中所包含的映射关系即可对所得到的拼音信息进行语义解析以将拼音信息转换为对应的目标文字信息。
例如,拼音“tóng,yì”在语义解析模型中所对应的文字信息为“同意”。
S123、若所述待识别信息中的语音信息包含噪音,反馈重新输入的提示信息以提示所述用户终端的使用者在低噪音环境下再次输入所述待识别信息。
若待识别信息中的语音信息包含噪音,则会影响所获取到的目标文字信息的精确度,此时需向该用户终端反馈重新输入的提示信息,以提示用户终端的使用者移步至低噪音环境下重新输入待识别信息。
S130、若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息。
若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息。若待识别信息为文字信息,则无需对该待识别信息进行处理,可将待识别信息直接作为目标文字信息进行后续处理。
S140、根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量。
根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量。文字处理规则即为对所获取到的目标文字进行转换处理以得到对应文字特征向量的规则信息,通过文字处理规则即可将目标文字信息转换为对应的特征向量,其中,文字处理规则中包括字符筛选规则、字符长度信息及字符向量表,字符筛选规则即为对目标文字信息中无意义的字符进行筛除的规则信息,字符长度信息即为对筛除处理后的目标文字信息所包含的字符数进行统一的数量信息,字符向量表即为对每一字符的向量信息进行记录的数据表。例如,无意义的字符可以是目标文字信息中的语气词(啊、哎)及结构助词(得、地)等。
在一实施例中,如图5所示,步骤S140包括子步骤S141、S142和S143。
S141、根据所述字符筛选规则对所述目标文字信息进行筛选以得到筛选文字信息。
根据所述字符筛选规则对所述目标文字信息进行筛选以得到筛选文字信息。字符筛选规则即是用于对目标文字信息进行筛选的规则信息,具体的,字符筛选规则可将目标文字信息中意义不大的字符筛除,得到的筛选文字信息中包含的字符均为具有实际意义的字符。
S142、根据所述字符长度信息对所述筛选文字信息进行标准化处理以得到对应的待转换文字信息。
根据所述字符长度信息对所述筛选文字信息进行标准化处理以得到对应的待转换文字信息。筛选文字信息中所包含的字符数量并不相等,为方便对筛选文字信息进行后续处理,需根据字符长度信息对所得到的筛选文字信息进行处理,以得到字符数量与字符长度信息相等的待转换文字信息。具体的,字符长度信息可记为N,若筛选文字信息中所包含的字符数量超过字符长度信息N,则截取筛选文字信息中前N个字符作为待转换文字信息;若筛选文字信息中所包含的字符数量少于字符长度信息N,则使用空字符(使用□进行表示)将筛选文字信息的字符进行补齐以得到包含N个字符的待转换文字信息;若筛选文字信息中所包含的字符数量等于字符长度信息N,则直接将该筛选文字信息作为待转换文字信息。
S143、根据所述文字处理规则中的字符向量表获取与所述待转换文字信息对应的文字特征向量。
根据所述文字处理规则中的字符向量表获取与所述待转换文字信息对应的文字特征向量。具体的,字符向量表中包含每一字符对应的一个1×M维的向量,该1×M维的向量可用于对字符的特征进行量化。根据待转换文字信息即可从字符向量信息表中获取该待转换文字信息中每一字符对应的一个1×M维向量,将该待转换文字信息中包含的N个字符所对应的1×M维向量进行组合,即可得到一个N×M的向量作为文字特征向量,也即是将待转换文字信息转换为对应的文字特征向量。
例如,若M=8,字符向量表中所包含的部分信息如表1所示。
字符 1×M维的向量
{a1,a2,a3,a4,a5,a6,a7,a8}
{b1,b2,b3,b4,b5,b6,b7,b8}
{c1,c2,c3,c4,c5,c6,c7,c8}
{d1,d2,d3,d4,d5,d6,d7,d8}
□(空字符) {0,0,0,0,0,0,0,0}
表1
某一段文字为“如何办理”,即可对应得到一个与该文字信息对应的4×8维的特征向量:
S150、将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级。
将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级。情绪识别模型即是用于获取与文字特征向量对应情绪等级的模型,也即是用于从待识别信息中对使用者的情绪等级进行识别的模型,情绪识别模型包括长短期记忆网络(LongShort-TermMemory,LSTM)、权重层及神经网络。
在一实施例中,如图6所示,步骤S150包括子步骤S151和S152。
S151、将所述文字特征向量输入所述长短期记忆网络以将对应的记忆网络输出信息。
将所述文字特征向量输入所述长短期记忆网络以将对应的记忆网络输出信息。具体的,获取文字特征向量的记忆网络输出信息的步骤分为五步,①计算遗忘门输出信息:f(t)=σ(Wf×h(t_1)+Uf×X(t)+bf),其中f(t)为遗忘门参数值,0≤f(t)≤1;σ为激活函数计算符号,σ可具体表示为f(x)=(1+e^(-x))-1,则将Wf×h(t_1)+Uf×X(t)+bf的计算结果作为x输入激活函数σ即可计算得到f(t);Wf、Uf及bf均为本细胞中公式的参数值;h(t_1)为上一细胞的输出门信息;X(t)为文字特征向量中第一个字符对应的向量,也即是输入当前细胞的1×M维的向量,若当前细胞为长短期记忆网络中的第一个细胞,则h(t_1)为零。②计算输入门信息:i(t)=σ(Wi×h(t_1)+Ui×X(t)+bi);a(t)=tanh(Wa×h(t-1)+Ua×X(t)+ba),其中i(t)为输入门参数值,0≤i(t)≤1;Wi、Ui、bi、Wa、Ua及ba均为本细胞中公式的参数值,a(t)为所计算得到的输入门向量值,a(t)为一个1×M维的向量。③更新细胞记忆信息:C(t)=C(t_1)⊙f(t)+i(t)⊙a(t),C为每一次计算过程所累计的细胞记忆信息,C(t)为当前细胞所输出的细胞记忆信息,C(t_1)为上一细胞所输出的细胞记忆信息,⊙为向量运算符,C(t_1)⊙f(t)的计算过程为将向量C(t_1)中每一维度值分别与f(t)相乘,所计算的得到的向量维度与向量C(t_1)中的维度相同。④计算输出门信息:o(t)=σ(Wo×h(t_1)+Uo×X(t)+bo);h(t)=o(t)⊙tanh(C(t)),o(t)为输出门参数值,0≤o(t)≤1;Wo、Uo及bo均为本细胞中公式的参数值,h(t)为本细胞的输出门信息,h(t)为一个1×M维的向量。⑤计算当前细胞的输出信息:y(t)=σ(V×h(t)+c),V及c均为本细胞中公式的参数值。每一个细胞经过一轮计算后均可计算得到一个输出信息,综合N个细胞的输出信息即可得到一个文字特征向量的记忆网络输出信息,一个文字特征向量的记忆网络输出信息为一个1×N维的向量。
S152、根据所述权重层及所述神经网络对所述记忆网络输出信息进行计算以获取对应的情绪等级。
根据所述权重层及所述神经网络对所述记忆网络输出信息进行计算以获取对应的情绪等级。权重层中所包含权重值的数量与字符数量信息,也即是权重值的数量为N,将所计算得到的记忆网络输出信息与权重层进行相乘,也即是记忆网络输出信息中的第n个维度值与权重层中的第n个权重值相乘(0≤n≤N),即可得到附加权重值的记忆网络输出信息。将附加权重值的记忆网络输出信息输入神经网络,其中,神经网络中包含N个输入节点,每一输入节点均与附加权重值的记忆网络输出信息中向量的一个维度值对应,输入节点与输出节点之间包含全连接层,输入节点与全连接层之间设置有第一公式组,输出节点与全连接层之间设置有第二公式组。其中,第一公式组包含所有输入节点至所有特征单元的公式,第一公式组中的公式均以输入节点值作为输入值、特征单元值作为输出值,第二公式组包含所有输出节点至所有特征单元的公式,第二公式组中的公式均以特征单元值作为输入值、输出节点值作为输出值,神经网络中所包含的每一公式中均拥有对应的参数值。每一输出节点均对应一个情绪类别,输出节点值也即是该待识别信息所属情绪类别的概率值,获取该待识别信息的概率值最高的情绪类别作为神经网络所输出的情绪等级,也即是获取得到与文字特征向量对应的情绪等级。
例如,神经网络中包含正面情绪、中性情绪和负面情绪三个情绪类别,神经网络所输出的与正面情绪对应的概率值为65%,与中性情绪对应的概率值为24%,与负面情绪对应的概率值为33%,则将得到与文字特征向量对应的情绪等级为正面情绪。
S160、根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端。
根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端。语料信息库中包含对所有可能提出的问题进行答复的多条语料信息,语料信息可以是文字信息、音频信息、视频信息,还可以是文字信息与音频信息或的结合或文字信息与视频信息的结合,语料信息库中针对同一问题可包含多条语料信息,对同一问题的多条语料信息可适用于各种情绪等级。从语料信息库中获取与目标文字信息及情绪等级对应的答复语料信息,即可针对使用者的情绪等级针对性地回答其所提出的问题。具体的,语料信息可以是对用户终端的使用者所提出的问题进行解答,例如,对使用者所提出的业务名词进行详细解释;还可以是根据使用者的问题反馈对应的引导信息以对其进行引导,以引导用户终端的使用者进行业务办理的相关操作。
在一实施例中,如图7所示,步骤S160包括子步骤S161和S162。
S161、从语料信息库中获取与所述目标文字信息对应的目标语料信息。
从语料信息库中获取与所述目标文字信息对应的目标语料信息。具体的,语料信息库中的语料信息均对应一个或多个语料关键字,针对同一问题的多条语料信息所包含的语料关键字相同,可对目标文字信息与语料信息中所包含的语料关键字进行匹配,以获取目标文字信息中与语料关键字相匹配的字符数,计算该字符数与对应语料关键字的字符数之间的比值,得到目标文字信息与该语料信息之间的匹配度,获取目标文字信息与每一语料信息之间的匹配度后,将语料信息匹配度最高的一条或多条语料信息作为目标语料信息。
例如,针对某一问题的多条语料信息所包含的语料关键字为“理赔、额度、赔偿款、支付”,某一目标文字信息为“产品A的理赔额度是多少,如何支付”,则与该目标文字信息相匹配的语料关键字为“理赔、额度、支付”,得到目标文字信息与上述多个语料信息之间的匹配度P=6/9=66.7%。
S162、从所述目标语料信息中选择与所述情绪等级对应的语料信息作为答复语料信息并反馈至所述用户终端。
从所述目标语料信息中选择与所述情绪等级对应的语料信息作为答复语料信息并反馈至所述用户终端。所获取到的目标语料信息包含多条语料信息,每一语料信息对应不同的情绪等级,则可从目标语料信息中获取与情绪等级对应的语料信息作为答复语料信息。具体的,目标语料信息中至少包含一条与情绪等级对应的语料信息,若目标语料信息中与情绪等级对应的语料信息仅由一条,则将该语料信息确定为答复语料信息;若目标语料信息中与情绪等级对应的语料信息包含多条,则从多条语料信息中随机选择一条作为答复语料信息。
在一实施例中,如图8所示,步骤S160之后还包括步骤S170和S180。
S170、对所述情绪等级是否为负面情绪进行判断。
S180、若所述情绪等级为负面情绪,将所述待识别信息发送至人工客服端。
判断情绪等级是否为负面情绪,若为负面情绪,则需将待识别信息发送至人工客服端以人工方式对待识别信息进行处理,人工客服端即为企业中人工客服所使用的用户终端,人工客服可使用人工客服端获取待识别信息并采用人工方式输入答复信息至人工客服端,人工客服端可发送该答复信息至用户终端;若不为负面情绪,则可返回执行所述若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型的步骤,以再次接收来自用户终端的待识别信息并进行处理。
此外,步骤S170和步骤S180还可在步骤S150之后执行,若步骤S170和步骤S180在S150之后执行,则先执行步骤S170判断情绪等级是否为负面情绪;若情绪等级为负面情绪,则执行步骤S180;若情绪等级不为负面情绪,则执行步骤S160;也即是当情绪等级不为负面情绪时,执行所述根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端的步骤。
在本发明实施例所提供的基于情绪识别的答复方法中,获取来自用户终端的待识别信息对应的目标文字信息,根据文字处理规则获取与目标文字信息对应的文字特征向量,并根据情绪识别模型获取与文字特征向量对应的情绪等级,获取语料信息库中与情绪等级及目标文字信息相匹配的语料信息作为答复语料信息反馈至用户终端,以完成答复。通过上述方法,可获取与待识别信息相匹配的情绪等级,并根据情绪等级及与待识别信息对应的目标文字信息获取答复语料信息,可实现根据待识别信息中的情绪等级灵活调整答复语料信息,提高了对提问信息进行答复的灵活性。
需要强调的是,为进一步保证上述文字处理规则、语料信息库信息等的私密和安全性,上述文字处理规则、语料信息库信息等信息还可以存储于一区块链的节点中。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本发明实施例还提供一种基于情绪识别的答复装置,该基于情绪识别的答复装置用于执行前述基于情绪识别的答复方法的任一实施例。具体地,请参阅图9,图9是本发明实施例提供的基于情绪识别的答复装置的示意性框图。该基于情绪识别的答复装置可以配置于管理服务器10中。
如图9所示,基于情绪识别的答复装置100包括待识别信息判断单元110、待识别信息识别单元120、目标文字信息获取单元130、文字特征向量获取单元140、情绪等级获取单元150和答复语料信息获取单元160。
待识别信息判断单元110,用于若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息。
待识别信息识别单元120,用于若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息。
其他发明实施例中,所述待识别信息识别单元120包括子单元:噪音判断单元、语音信息识别单元和提示信息反馈单元。
噪音判断单元,用于根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断;语音信息识别单元,用于若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息;提示信息反馈单元,用于若所述待识别信息中的语音信息包含噪音,反馈重新输入的提示信息以提示所述用户终端的使用者在低噪音环境下再次输入所述待识别信息。
其他发明实施例中,所述语音信息识别单元包括子单元:音素获取单元、拼音信息获取单元和语义解析单元。
音素获取单元,用于根据所述文字信息获取模型中的声学模型对所述待识别信息进行切分以得到所述待识别信息中所包含的多个音素;拼音信息获取单元,用于根据所述文字信息获取模型中的语音特征词典对所述音素进行匹配以将所述音素转换为拼音信息;语义解析单元,用于根据所述文字信息获取模型中的语义解析模型对所述拼音信息进行语义解析以得到与所述待识别信息对应的目标文字信息。
目标文字信息获取单元130,用于若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息。
文字特征向量获取单元140,用于根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量。
其他发明实施例中,所述文字特征向量获取单元140包括子单元:筛选文字信息获取单元、标准化处理单元和文字信息转换单元。
筛选文字信息获取单元,用于根据所述字符筛选规则对所述目标文字信息进行筛选以得到筛选文字信息;标准化处理单元,用于根据所述字符长度信息对所述筛选文字信息进行标准化处理以得到对应的待转换文字信息;文字信息转换单元,用于根据所述文字处理规则中的字符向量表获取与所述待转换文字信息对应的文字特征向量。
情绪等级获取单元150,用于将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级。
其他发明实施例中,所述情绪等级获取单元150包括子单元:筛选文字信息获取单元和计算单元。
记忆网络输出信息获取单元,用于将所述文字特征向量输入所述长短期记忆网络以将对应的记忆网络输出信息;计算单元,用于根据所述权重层及所述神经网络对所述记忆网络输出信息进行计算以获取对应的情绪等级。
答复语料信息获取单元160,用于根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端。
其他发明实施例中,所述答复语料信息获取单元160包括子单元:目标语料信息获取单元和答复语料信息选择单元。
目标语料信息获取单元,用于从语料信息库中获取与所述目标文字信息对应的目标语料信息;答复语料信息选择单元,用于从所述目标语料信息中选择与所述情绪等级对应的语料信息作为答复语料信息并反馈至所述用户终端。
其他发明实施例中,所述基于情绪识别的答复装置100还包括子单元:情绪等级判断单元和待识别信息发送单元。
情绪等级判断单元,用于对所述情绪等级是否为负面情绪进行判断;待识别信息发送单元,用于若所述情绪等级为负面情绪,将所述待识别信息发送至人工客服端。
在本发明实施例所提供的基于情绪识别的答复装置应用上述基于情绪识别的答复方法,获取来自用户终端的待识别信息对应的目标文字信息,根据文字处理规则获取与目标文字信息对应的文字特征向量,并根据情绪识别模型获取与文字特征向量对应的情绪等级,获取语料信息库中与情绪等级及目标文字信息相匹配的语料信息作为答复语料信息反馈至用户终端,以完成答复。通过上述方法,可获取与待识别信息相匹配的情绪等级,并根据情绪等级及与待识别信息对应的目标文字信息获取答复语料信息,可实现根据待识别信息中的情绪等级灵活调整答复语料信息,提高了对提问信息进行答复的灵活性。
上述基于情绪识别的答复装置可以实现为计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本发明实施例提供的计算机设备的示意性框图。该计算机设备500可以实现为上述用于执行基于情绪识别的答复方法的管理服务器10。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于情绪识别的答复方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于情绪识别的答复方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。管理服务器10可基于该网络接口505通过互联网与用户终端20建立网络连接,以实现与用户终端20进行通信。本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息;若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息;若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息;根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量;将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级;根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端。
在一实施例中,处理器502在执行若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息的步骤时,执行如下操作:根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断;若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息;若所述待识别信息中的语音信息包含噪音,反馈重新输入的提示信息以提示所述用户终端的使用者在低噪音环境下再次输入所述待识别信息。
在一实施例中,处理器502在执行若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息的步骤时,执行如下操作:根据所述文字信息获取模型中的声学模型对所述待识别信息进行切分以得到所述待识别信息中所包含的多个音素;根据所述文字信息获取模型中的语音特征词典对所述音素进行匹配以将所述音素转换为拼音信息;根据所述文字信息获取模型中的语义解析模型对所述拼音信息进行语义解析以得到与所述待识别信息对应的目标文字信息。
在一实施例中,处理器502在执行根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量的步骤时,执行如下操作:根据所述字符筛选规则对所述目标文字信息进行筛选以得到筛选文字信息;根据所述字符长度信息对所述筛选文字信息进行标准化处理以得到对应的待转换文字信息;根据所述文字处理规则中的字符向量表获取与所述待转换文字信息对应的文字特征向量。
在一实施例中,处理器502在执行将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级的步骤时,执行如下操作:所述文字特征向量输入所述长短期记忆网络以将对应的记忆网络输出信息;根据所述权重层及所述神经网络对所述记忆网络输出信息进行计算以获取对应的情绪等级。
在一实施例中,处理器502在执行根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端的步骤时,执行如下操作:从语料信息库中获取与所述目标文字信息对应的目标语料信息;从所述目标语料信息中选择与所述情绪等级对应的语料信息作为答复语料信息并反馈至所述用户终端。
在一实施例中,处理器502还执行如下操作:对所述情绪等级是否为负面情绪进行判断;若所述情绪等级为负面情绪,将所述待识别信息发送至人工客服端。
本领域技术人员可以理解,图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图10所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息;若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息;若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息;根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量;将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级;根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端。
在一实施例中,所述若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息的步骤,包括:根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断;若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息;若所述待识别信息中的语音信息包含噪音,反馈重新输入的提示信息以提示所述用户终端的使用者在低噪音环境下再次输入所述待识别信息。
在一实施例中,所述若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息的步骤,包括:根据所述文字信息获取模型中的声学模型对所述待识别信息进行切分以得到所述待识别信息中所包含的多个音素;根据所述文字信息获取模型中的语音特征词典对所述音素进行匹配以将所述音素转换为拼音信息;根据所述文字信息获取模型中的语义解析模型对所述拼音信息进行语义解析以得到与所述待识别信息对应的目标文字信息。
在一实施例中,所述根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量的步骤,包括:根据所述字符筛选规则对所述目标文字信息进行筛选以得到筛选文字信息;根据所述字符长度信息对所述筛选文字信息进行标准化处理以得到对应的待转换文字信息;根据所述文字处理规则中的字符向量表获取与所述待转换文字信息对应的文字特征向量。
在一实施例中,所述将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级的步骤,包括:所述文字特征向量输入所述长短期记忆网络以将对应的记忆网络输出信息;根据所述权重层及所述神经网络对所述记忆网络输出信息进行计算以获取对应的情绪等级。
在一实施例中,所述根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端的步骤,包括:从语料信息库中获取与所述目标文字信息对应的目标语料信息;从所述目标语料信息中选择与所述情绪等级对应的语料信息作为答复语料信息并反馈至所述用户终端。
在一实施例中,还包括:对所述情绪等级是否为负面情绪进行判断;若所述情绪等级为负面情绪,将所述待识别信息发送至人工客服端。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
所述计算机可读存储介质为实体的、非瞬时性的存储介质,所述计算机可读存储介质可以是前述设备的内部存储单元,例如设备的硬盘或内存等实体存储介质。所述存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等实体存储介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种基于情绪识别的答复方法,应用于管理服务器,所述管理服务器与至少一台用户终端进行通信,其特征在于,所述方法包括:
若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息;
若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息;
若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息;
根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量;
将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级;
根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端;
所述预存的文字处理规则中包括字符筛选规则、字符长度信息及字符向量表,所述根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量,包括:
根据所述字符筛选规则对所述目标文字信息进行筛选以得到筛选文字信息;
根据所述字符长度信息对所述筛选文字信息进行标准化处理以得到对应的待转换文字信息;所述待转换文字信息中的字符数量与所述字符长度信息相等;
根据所述文字处理规则中的字符向量表获取与所述待转换文字信息对应的文字特征向量;
所述预存的语音识别模型包括噪音判断规则及文字信息获取模型,所述根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息,包括:
根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断,包括:从所述语音信息中获取处于固定频率区间的声纹信号的平均信号强度作为目标声音信号强度,从所述语音信息中获取未处于所述固定频率区间的其他声纹信号的平均强度作为背景噪声信号强度,判断背景噪声信号强度与目标声音信号强度之间的比值是否大于噪音判断规则中所预设的阈值,以判断得到所述语音信息是否包含噪音;
若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息;
若所述待识别信息中的语音信息包含噪音,反馈重新输入的提示信息以提示所述用户终端的使用者在低噪音环境下再次输入所述待识别信息。
2.根据权利要求1所述的基于情绪识别的答复方法,其特征在于,所述文字信息获取模型包括声学模型、语音特征词典及语义解析模型,所述根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息,包括:
根据所述文字信息获取模型中的声学模型对所述待识别信息进行切分以得到所述待识别信息中所包含的多个音素;
根据所述文字信息获取模型中的语音特征词典对所述音素进行匹配以将所述音素转换为拼音信息;
根据所述文字信息获取模型中的语义解析模型对所述拼音信息进行语义解析以得到与所述待识别信息对应的目标文字信息。
3.根据权利要求1所述的基于情绪识别的答复方法,其特征在于,所述情绪识别模型包括长短期记忆网络、权重层及神经网络,所述将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级,包括:
将所述文字特征向量输入所述长短期记忆网络以将对应的记忆网络输出信息;
根据所述权重层及所述神经网络对所述记忆网络输出信息进行计算以获取对应的情绪等级。
4.根据权利要求1所述的基于情绪识别的答复方法,其特征在于,所述根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端,包括:
从语料信息库中获取与所述目标文字信息对应的目标语料信息;
从所述目标语料信息中选择与所述情绪等级对应的语料信息作为答复语料信息并反馈至所述用户终端。
5.根据权利要求1所述的基于情绪识别的答复方法,其特征在于,还包括:
对所述情绪等级是否为负面情绪进行判断;
若所述情绪等级为负面情绪,将所述待识别信息发送至人工客服端。
6.一种基于情绪识别的答复装置,其特征在于,包括:
待识别信息判断单元,用于若接收到来自用户终端的待识别信息,判断所述待识别信息的信息类型,所述信息类型包括文字信息和语音信息;
待识别信息识别单元,用于若所述待识别信息为语音信息,根据预存的语音识别模型对所述语音信息进行识别以得到与所述待识别信息对应的目标文字信息;
目标文字信息获取单元,用于若所述待识别信息为文字信息,将所述待识别信息作为目标文字信息;
文字特征向量获取单元,用于根据预存的文字处理规则获取与所述目标文字信息对应的文字特征向量;
情绪等级获取单元,用于将所述文字特征向量输入预存的情绪识别模型以获取与所述文字特征向量对应的情绪等级;
答复语料信息获取单元,用于根据所述情绪等级及所述目标文字信息从预存的语料信息库中获取相匹配的语料信息作为答复语料信息并反馈至所述用户终端;
所述预存的文字处理规则中包括字符筛选规则、字符长度信息及字符向量表;
所述文字特征向量获取单元包括子单元:筛选文字信息获取单元,用于根据所述字符筛选规则对所述目标文字信息进行筛选以得到筛选文字信息;
标准化处理单元,用于根据所述字符长度信息对所述筛选文字信息进行标准化处理以得到对应的待转换文字信息;所述待转换文字信息中的字符数量与所述字符长度信息相等;
文字信息转换单元,用于根据所述文字处理规则中的字符向量表获取与所述待转换文字信息对应的文字特征向量;
所述预存的语音识别模型包括噪音判断规则及文字信息获取模型,所述待识别信息识别单元包括子单元:噪音判断单元,用于根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断;语音信息识别单元,用于若所述待识别信息中的语音信息不包含噪音,根据所述文字信息获取模型对所述待识别信息中的语音信息进行识别以得到与所述待识别信息对应的目标文字信息;提示信息反馈单元,用于若所述待识别信息中的语音信息包含噪音,反馈重新输入的提示信息以提示所述用户终端的使用者在低噪音环境下再次输入所述待识别信息;
所述根据所述噪音判断规则对所述待识别信息中的语音信息是否包含噪音进行判断,包括:从所述语音信息中获取处于固定频率区间的声纹信号的平均信号强度作为目标声音信号强度,从所述语音信息中获取未处于所述固定频率区间的其他声纹信号的平均强度作为背景噪声信号强度,判断背景噪声信号强度与目标声音信号强度之间的比值是否大于噪音判断规则中所预设的阈值,以判断得到所述语音信息是否包含噪音。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的基于情绪识别的答复方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5中任一项所述的基于情绪识别的答复方法。
CN202010345920.2A 2020-04-27 2020-04-27 基于情绪识别的答复方法、装置、计算机设备及存储介质 Active CN111694938B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010345920.2A CN111694938B (zh) 2020-04-27 2020-04-27 基于情绪识别的答复方法、装置、计算机设备及存储介质
PCT/CN2020/092977 WO2021217769A1 (zh) 2020-04-27 2020-05-28 基于情绪识别的答复方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010345920.2A CN111694938B (zh) 2020-04-27 2020-04-27 基于情绪识别的答复方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111694938A CN111694938A (zh) 2020-09-22
CN111694938B true CN111694938B (zh) 2024-05-14

Family

ID=72476636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010345920.2A Active CN111694938B (zh) 2020-04-27 2020-04-27 基于情绪识别的答复方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN111694938B (zh)
WO (1) WO2021217769A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112383593B (zh) * 2020-10-30 2023-06-02 中国平安人寿保险股份有限公司 基于线下陪访的智能内容推送方法、装置及计算机设备
CN112951429A (zh) * 2021-03-25 2021-06-11 浙江连信科技有限公司 用于中小学生心理危机筛查的信息处理方法及装置
CN113569031A (zh) * 2021-07-30 2021-10-29 北京达佳互联信息技术有限公司 一种信息交互方法、装置、电子设备及存储介质
CN113761206A (zh) * 2021-09-10 2021-12-07 平安科技(深圳)有限公司 基于意图识别的信息智能查询方法、装置、设备及介质
CN114999024B (zh) * 2022-05-31 2023-12-19 合众新能源汽车股份有限公司 一种车辆用户反馈信息的收集方法及装置
CN116233540B (zh) * 2023-03-10 2024-04-02 北京富通亚讯网络信息技术有限公司 基于视频图像识别的并行信号处理方法及系统
CN116434733B (zh) * 2023-04-25 2024-06-07 深圳市中诺智联科技有限公司 一种关于智能安全帽的ai语音交互处理方法
CN116741143B (zh) * 2023-08-14 2023-10-31 深圳市加推科技有限公司 基于数字分身的个性化ai名片的交互方法及相关组件

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019037382A1 (zh) * 2017-08-24 2019-02-28 平安科技(深圳)有限公司 基于情绪识别的语音质检方法、装置、设备及存储介质
CN109582780A (zh) * 2018-12-20 2019-04-05 广东小天才科技有限公司 一种基于用户情绪的智能问答方法及装置
CN109767765A (zh) * 2019-01-17 2019-05-17 平安科技(深圳)有限公司 话术匹配方法及装置、存储介质、计算机设备
CN110459210A (zh) * 2019-07-30 2019-11-15 平安科技(深圳)有限公司 基于语音分析的问答方法、装置、设备及存储介质
CN110570879A (zh) * 2019-09-11 2019-12-13 深圳壹账通智能科技有限公司 基于情绪识别的智能会话方法、装置及计算机设备
CN110597952A (zh) * 2019-08-20 2019-12-20 深圳壹账通智能科技有限公司 信息处理方法、服务器及计算机存储介质
CN110751943A (zh) * 2019-11-07 2020-02-04 浙江同花顺智能科技有限公司 一种语音情绪识别方法、装置以及相关设备
CN110910901A (zh) * 2019-10-08 2020-03-24 平安科技(深圳)有限公司 一种情绪识别方法及装置、电子设备和可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6884947B2 (ja) * 2017-03-16 2021-06-09 国立研究開発法人情報通信研究機構 対話システム及びそのためのコンピュータプログラム
CN108009297B (zh) * 2017-12-27 2020-09-04 云润大数据服务有限公司 基于自然语言处理的文本情感分析方法与系统
CN109949071A (zh) * 2019-01-31 2019-06-28 平安科技(深圳)有限公司 基于语音情绪分析的产品推荐方法、装置、设备和介质
CN110149450A (zh) * 2019-05-22 2019-08-20 欧冶云商股份有限公司 智能客服应答方法及系统
CN110379445A (zh) * 2019-06-20 2019-10-25 深圳壹账通智能科技有限公司 基于情绪分析的业务处理方法、装置、设备及存储介质
CN110890088B (zh) * 2019-10-12 2022-07-15 中国平安财产保险股份有限公司 语音信息反馈方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019037382A1 (zh) * 2017-08-24 2019-02-28 平安科技(深圳)有限公司 基于情绪识别的语音质检方法、装置、设备及存储介质
CN109582780A (zh) * 2018-12-20 2019-04-05 广东小天才科技有限公司 一种基于用户情绪的智能问答方法及装置
CN109767765A (zh) * 2019-01-17 2019-05-17 平安科技(深圳)有限公司 话术匹配方法及装置、存储介质、计算机设备
CN110459210A (zh) * 2019-07-30 2019-11-15 平安科技(深圳)有限公司 基于语音分析的问答方法、装置、设备及存储介质
CN110597952A (zh) * 2019-08-20 2019-12-20 深圳壹账通智能科技有限公司 信息处理方法、服务器及计算机存储介质
CN110570879A (zh) * 2019-09-11 2019-12-13 深圳壹账通智能科技有限公司 基于情绪识别的智能会话方法、装置及计算机设备
CN110910901A (zh) * 2019-10-08 2020-03-24 平安科技(深圳)有限公司 一种情绪识别方法及装置、电子设备和可读存储介质
CN110751943A (zh) * 2019-11-07 2020-02-04 浙江同花顺智能科技有限公司 一种语音情绪识别方法、装置以及相关设备

Also Published As

Publication number Publication date
CN111694938A (zh) 2020-09-22
WO2021217769A1 (zh) 2021-11-04

Similar Documents

Publication Publication Date Title
CN111694938B (zh) 基于情绪识别的答复方法、装置、计算机设备及存储介质
CN108737667B (zh) 语音质检方法、装置、计算机设备及存储介质
KR102151681B1 (ko) 언어 모델용 대화 상태들 결정
US9361891B1 (en) Method for converting speech to text, performing natural language processing on the text output, extracting data values and matching to an electronic ticket form
JP6099556B2 (ja) 音声識別方法および装置
CN107818798A (zh) 客服服务质量评价方法、装置、设备及存储介质
CN111680142A (zh) 基于文本识别的自动答复方法、装置、计算机设备
CN109462482B (zh) 声纹识别方法、装置、电子设备及计算机可读存储介质
CN110704618B (zh) 确定对话数据对应的标准问题的方法及装置
CN113240510A (zh) 异常用户预测方法、装置、设备及存储介质
CN112992147A (zh) 语音处理方法、装置、计算机设备和存储介质
CN111128160B (zh) 基于语音识别的单据修改方法、装置、计算机设备
JP7329393B2 (ja) 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、学習装置、学習方法及び学習プログラム
Wu et al. Harpervalleybank: A domain-specific spoken dialog corpus
US10446138B2 (en) System and method for assessing audio files for transcription services
JP4143541B2 (ja) 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム
CN112116165B (zh) 一种业务绩效确定方法和装置
CN112131369B (zh) 一种业务类别确定方法和装置
KR102583434B1 (ko) 음성 상담의 품질 평가 방법 및 시스템
CN110895938B (zh) 语音校正系统及语音校正方法
БЄЛОЗЬОРОВА et al. Features of the implementation of the speaker identification software system
Ceaparu et al. Multifactor voice-based authentication system
US20240161123A1 (en) Auditing user feedback data
EP4315320A1 (en) Systems and methods for training natural language processing models in a contact center
CN118051582A (zh) 基于电话语音分析的潜客识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant