CN116665676B - 一种用于智能语音外呼系统的语义识别方法 - Google Patents

一种用于智能语音外呼系统的语义识别方法 Download PDF

Info

Publication number
CN116665676B
CN116665676B CN202310942971.7A CN202310942971A CN116665676B CN 116665676 B CN116665676 B CN 116665676B CN 202310942971 A CN202310942971 A CN 202310942971A CN 116665676 B CN116665676 B CN 116665676B
Authority
CN
China
Prior art keywords
text
intention
intention labels
voice signal
semantic recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310942971.7A
Other languages
English (en)
Other versions
CN116665676A (zh
Inventor
齐越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zaozhuang Fuyuan Network Technology Co ltd
Original Assignee
Zaozhuang Fuyuan Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zaozhuang Fuyuan Network Technology Co ltd filed Critical Zaozhuang Fuyuan Network Technology Co ltd
Priority to CN202310942971.7A priority Critical patent/CN116665676B/zh
Publication of CN116665676A publication Critical patent/CN116665676A/zh
Application granted granted Critical
Publication of CN116665676B publication Critical patent/CN116665676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Artificial Intelligence (AREA)
  • Child & Adolescent Psychology (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用于智能语音外呼系统的语义识别方法,属于语义识别技术领域,具体包括以下步骤:接收客户输入的语音信号,对所述语音信号进行预处理,将预处理后的语音信号转换为文本格式;对所述文本进行文字过滤,并对过滤后的文本进行语义分析,根据语义识别结果确定文本中各单词的含义;根据含义将单词归纳为标准的意图标签,对文本中的所有意图标签进行统计分析,确定客户想要咨询的业务领域,并提取对应业务领域的数据库内容,生成相应的回复内容;本发明对客户意图进行分类并添加意图标签,将意图标签与对应的业务领域进行匹配,生成相应的回复内容,可以根据不同业务领域的需求提供个性化的服务。

Description

一种用于智能语音外呼系统的语义识别方法
技术领域
本发明涉及语义识别技术领域,具体涉及一种用于智能语音外呼系统的语义识别方法。
背景技术
语音识别技术是一种将人类语音转换为可读文本的技术,已经在各种领域得到广泛应用。随着人工智能和自然语言处理技术的不断发展,语音识别的准确性和智能化程度不断提高,成为人们日常生活中不可或缺的一部分。
在智能语音外呼系统中,语音识别技术用于将客户输入的语音信号转换为文本格式,以便后续进行语义分析、意图分类等操作。然而,由于语音信号的特殊性质(如噪声、口音、语速等),以及不同领域的专业术语和表达方式的差异性,导致传统的语音识别技术在实际应用中存在一定的局限性和误差率。
为了解决这些问题,研究人员提出了多种改进方法,包括使用深度学习模型、引入上下文信息、使用预训练模型等。这些方法可以提高语音识别的准确性和鲁棒性,但仍然存在一些问题,如对特定领域的适应性不足、对复杂语句的理解能力有限等,并且无法针对不同客户的特定需求进行针对性回复。
发明内容
本发明的目的在于提供一种用于智能语音外呼系统的语义识别方法,解决以下技术问题:
现有语义识别技术对特定领域的适应性不足、对复杂语句的理解能力有限等,并且无法针对不同客户的特定需求进行针对性回复。
本发明的目的可以通过以下技术方案实现:
一种用于智能语音外呼系统的语义识别方法,包括以下步骤:
接收客户输入的语音信号,对所述语音信号进行预处理,将预处理后的语音信号转换为文本格式;
对所述文本进行文字过滤,并对过滤后的文本进行语义分析,根据语义识别结果确定文本中各单词的含义;
根据含义将单词归纳为标准的意图标签,对文本中的所有意图标签进行统计分析,确定客户想要咨询的业务领域,并提取对应业务领域的数据库内容,生成相应的回复内容;
对所述意图标签进行统计分析的过程为:
建立数据库,所述数据库内存储有已标注业务领域的意图标签,所述意图标签同时与若干个业务领域相关,生成所述意图标签与不同业务领域相关度p,将文本中所有单词归纳为对应的意图标签,统计任一业务领域对应涉及的意图标签的相关度p1,p2,…,pn,筛选所述相关度p1,p2,…,pn中超过预设阈值a的意图标签,分别统计各个业务领域中相关度超过a的意图标签占所有意图标签的比例b,若存在业务领域的a*b≥0.7,则判定对应的业务领域为客户所咨询的业务领域,若不存在a*b≥0.7,则继续识别客户语音信号;
单词意图标签与业务领域的相关度的评价过程为:
从所述文本中提取出文本特征,所述文本特征包括文本长度、命名实体、词频和情感信息,使用深度学习模型建立相关度打分模型,并使用已标注的数据库对相关度打分模型进行验证和优化;将所述文本特征输入到优化后的相关度打分模型中,输出文本中单词对应意图标签的相关度评级分数。
作为本发明进一步的方案:所述预处理的过程为:
设置分贝阈值去除语音信号中的低音部分,并对其余部分进行分帧和加窗,通过IIR滤波器和FIR滤波器分别消除高频噪声和低频噪声,并对降噪后的语音信号进行谱压缩增强处理。
作为本发明进一步的方案:所述文字过滤的过程为:
通过正则表达式去除所述文本中的特殊字符,并将所述特殊字符替换为空白字符串,所述特殊字符包括标点符号、网址和电话号码;使用预定义的停用词列表去除所述文本中的停用词,所述停用词包括“的”、“是”和“了”。
作为本发明进一步的方案:所述语义分析还包括情感识别:
步骤一:使用自然语言处理技术从已标注的文本中提取出与情感相关的特征,包括词性、句法结构、词汇频率;
步骤二:使用机器学习算法对提取的特征进行训练,建立情感分类模型;
步骤三:将客户文本输入到已经训练好的情感分类模型中,根据模型的预测结果判断客户文本的情感极性是正面、负面还是中性。
作为本发明进一步的方案:记录下来访客户号码,将来访客户的意图标签和对应内容存储在数据库中,待号码对应客户后续呼叫时进行调用。
本发明的有益效果:
(1)本发明将所述文本进行文字过滤,对过滤后的文本进行语义分析,根据语义分析结果识别客户意图,可以更准确地理解客户的需求和意图;
(2)本发明对客户意图进行分类并添加意图标签,将意图标签与对应的业务领域进行匹配,生成相应的回复内容,可以根据不同业务领域的需求提供个性化的服务;
(3)本发明在语义分析的过程中,包括情感识别和意图分类的过程,可以更全面地了解客户的情感状态和需求,通过建立数据库存储已标注业务领域和相关程度的预设标签以及客户号码等信息,可以提高系统的效率和准确性。
附图说明
下面结合附图对本发明作进一步的说明。
图1是本发明一种用于智能语音外呼系统的语义识别方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种用于智能语音外呼系统的语义识别方法,包括以下步骤:
接收客户输入的语音信号,对所述语音信号进行预处理,将预处理后的语音信号转换为文本格式;
对所述文本进行文字过滤,并对过滤后的文本进行语义分析,根据语义识别结果确定文本中各单词的含义;
根据含义将单词归纳为标准的意图标签,对文本中的所有意图标签进行统计分析,确定客户想要咨询的业务领域,并提取对应业务领域的数据库内容,生成相应的回复内容。
具体进一步的过程为:
语音信号输入:智能语音外呼系统通过麦克风采集客户的语音信号;
预处理:将采集到的语音信号进行预处理,包括降噪、分帧、加窗等操作,以提高语音识别的准确性和稳定性;
文本转换:使用基于BERT、BiLSTM和CRF的混合模型对预处理后的语音信号进行文本转换,得到对应的文本内容;
意图分类:根据客户输入的文本内容,使用自然语言处理技术对文本进行语义分析,识别出客户的意图,匹配对应的业务标签,并将其归纳为不同的业务领域;
回复生成:根据客户的意图和业务领域,系统可以自动生成相应的回复内容,包括文字、语音等多种形式;
存储与调用:将已联系客户的意图标签和响应内容存储在数据库中,待对应客户后续呼叫时进行调用;同时,可以将该系统部署在云服务器上,实现远程调用和管理。
在本发明的一种优选的实施例中,所述预处理的过程为:
设置分贝阈值去除语音信号中的低音部分,并对其余部分进行分帧和加窗,通过IIR滤波器和FIR滤波器分别消除高频噪声和低频噪声,并对降噪后的语音信号进行谱压缩增强处理。
在本发明的另一种优选的实施例中,所述文字过滤的过程为:
通过正则表达式去除所述文本中的特殊字符,并将所述特殊字符替换为空白字符串,所述特殊字符包括标点符号、网址和电话号码;使用预定义的停用词列表去除所述文本中的停用词,所述停用词包括“的”、“是”和“了”。
在本发明的另一种优选的实施例中,对所述意图标签进行统计分析的过程为:
建立数据库,所述数据库内存储有已标注业务领域的意图标签,所述意图标签同时与若干个业务领域相关,生成所述意图标签与不同业务领域相关度p,将文本中所有单词归纳为对应的意图标签,统计任一业务领域对应涉及的意图标签的相关度p1,p2,…,pn,筛选所述相关度p1,p2,…,pn中超过预设阈值a的意图标签,分别统计各个业务领域中相关度超过a的意图标签占所有意图标签的比例b,若存在业务领域的a*b≥0.7,则判定对应的业务领域为客户所咨询的业务领域,若不存在a*b≥0.7,则继续识别客户语音信号。
在本实施例的一种优选的情况中,单词意图标签与业务领域的相关度的评价过程为:
从所述文本中提取出文本特征,所述文本特征包括文本长度、命名实体、词频和情感信息,使用深度学习模型建立相关度打分模型,并使用已标注的数据库对相关度打分模型进行验证和优化;将所述文本特征输入到优化后的相关度打分模型中,输出文本中单词对应意图标签的相关度评级分数。
在本发明的另一种优选的实施例中,所述语义分析还包括情感识别:
步骤一:使用自然语言处理技术从已标注的文本中提取出与情感相关的特征,包括词性、句法结构、词汇频率;
步骤二:使用机器学习算法对提取的特征进行训练,建立情感分类模型;
步骤三:将客户文本输入到已经训练好的情感分类模型中,根据模型的预测结果判断客户文本的情感极性是正面、负面还是中性。
在本发明的另一种优选的实施例中,记录下来访客户号码,将来访客户的意图标签和对应内容存储在数据库中,待号码对应客户后续呼叫时进行调用。
以上对本发明的一个实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。

Claims (5)

1.一种用于智能语音外呼系统的语义识别方法,其特征在于,包括以下步骤:
接收客户输入的语音信号,对所述语音信号进行预处理,将预处理后的语音信号转换为文本格式;
对所述文本进行文字过滤,并对过滤后的文本进行语义分析,根据语义识别结果确定文本中各单词的含义;
根据含义将单词归纳为标准的意图标签,对文本中的所有意图标签进行统计分析,确定客户想要咨询的业务领域,并提取对应业务领域的数据库内容,生成相应的回复内容;
对所述意图标签进行统计分析的过程为:
建立数据库,所述数据库内存储有已标注业务领域的意图标签,所述意图标签同时与若干个业务领域相关,生成所述意图标签与不同业务领域相关度p,将文本中所有单词归纳为对应的意图标签,统计任一业务领域对应涉及的意图标签的相关度p1,p2,…,pn,筛选所述相关度p1,p2,…,pn中超过预设阈值a的意图标签,分别统计各个业务领域中相关度超过a的意图标签占所有意图标签的比例b,若存在业务领域的a*b≥0.7,则判定对应的业务领域为客户所咨询的业务领域,若不存在a*b≥0.7,则继续识别客户语音信号;
意图标签与业务领域的相关度的评价过程为:
从所述文本中提取出文本特征,所述文本特征包括文本长度、命名实体、词频和情感信息,使用深度学习模型建立相关度打分模型,并使用已标注的数据库对相关度打分模型进行验证和优化;将所述文本特征输入到优化后的相关度打分模型中,输出文本中单词对应意图标签的相关度评级分数。
2.根据权利要求1所述的一种用于智能语音外呼系统的语义识别方法,其特征在于,所述预处理的过程为:
设置分贝阈值去除语音信号中的低音部分,并对其余部分进行分帧和加窗,通过IIR滤波器和FIR滤波器分别消除高频噪声和低频噪声,并对降噪后的语音信号进行谱压缩增强处理。
3.根据权利要求1所述的一种用于智能语音外呼系统的语义识别方法,其特征在于,所述文字过滤的过程为:
通过正则表达式去除所述文本中的特殊字符,并将所述特殊字符替换为空白字符串,所述特殊字符包括标点符号、网址和电话号码;使用预定义的停用词列表去除所述文本中的停用词,所述停用词包括“的”、“是”和“了”。
4.根据权利要求1所述的一种用于智能语音外呼系统的语义识别方法,其特征在于,所述语义分析还包括情感识别:
步骤一:使用自然语言处理技术从已标注的文本中提取出与情感相关的特征,包括词性、句法结构、词汇频率;
步骤二:使用机器学习算法对提取的特征进行训练,建立情感分类模型;
步骤三:将客户文本输入到已经训练好的情感分类模型中,根据模型的预测结果判断客户文本的情感极性是正面、负面还是中性。
5.根据权利要求1所述的一种用于智能语音外呼系统的语义识别方法,其特征在于,记录下来访客户号码,将来访客户的意图标签和对应内容存储在数据库中,待号码对应客户后续呼叫时进行调用。
CN202310942971.7A 2023-07-31 2023-07-31 一种用于智能语音外呼系统的语义识别方法 Active CN116665676B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310942971.7A CN116665676B (zh) 2023-07-31 2023-07-31 一种用于智能语音外呼系统的语义识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310942971.7A CN116665676B (zh) 2023-07-31 2023-07-31 一种用于智能语音外呼系统的语义识别方法

Publications (2)

Publication Number Publication Date
CN116665676A CN116665676A (zh) 2023-08-29
CN116665676B true CN116665676B (zh) 2023-09-22

Family

ID=87712154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310942971.7A Active CN116665676B (zh) 2023-07-31 2023-07-31 一种用于智能语音外呼系统的语义识别方法

Country Status (1)

Country Link
CN (1) CN116665676B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116959435B (zh) * 2023-09-20 2023-12-08 深圳大道云科技有限公司 呼叫通话的语义识别方法、设备及存储介质
CN116978384B (zh) * 2023-09-25 2024-01-02 成都市青羊大数据有限责任公司 一种公安一体化大数据管理系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462600A (zh) * 2014-12-31 2015-03-25 科大讯飞股份有限公司 实现来电原因自动分类的方法及装置
CN107316643A (zh) * 2017-07-04 2017-11-03 科大讯飞股份有限公司 语音交互方法及装置
CN113761291A (zh) * 2021-04-27 2021-12-07 腾讯科技(深圳)有限公司 标签分类的处理方法和装置
CN114416931A (zh) * 2020-10-28 2022-04-29 华为云计算技术有限公司 标签生成方法、装置及相关设备
WO2023035524A1 (zh) * 2021-09-10 2023-03-16 平安科技(深圳)有限公司 基于意图识别的流程节点跳转方法、装置、设备及介质
CN115858781A (zh) * 2022-11-29 2023-03-28 重庆长安汽车股份有限公司 一种文本标签提取方法、装置、设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102501714B1 (ko) * 2016-11-16 2023-02-21 삼성전자주식회사 사용자의 음성 입력에 대한 답변 메시지를 제공하는 디바이스 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462600A (zh) * 2014-12-31 2015-03-25 科大讯飞股份有限公司 实现来电原因自动分类的方法及装置
CN107316643A (zh) * 2017-07-04 2017-11-03 科大讯飞股份有限公司 语音交互方法及装置
CN114416931A (zh) * 2020-10-28 2022-04-29 华为云计算技术有限公司 标签生成方法、装置及相关设备
CN113761291A (zh) * 2021-04-27 2021-12-07 腾讯科技(深圳)有限公司 标签分类的处理方法和装置
WO2023035524A1 (zh) * 2021-09-10 2023-03-16 平安科技(深圳)有限公司 基于意图识别的流程节点跳转方法、装置、设备及介质
CN115858781A (zh) * 2022-11-29 2023-03-28 重庆长安汽车股份有限公司 一种文本标签提取方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Application of Artificial Intelligence in Customer Service Field;Xingping Wu et al.;2021 3rd International Conference on Applied Machine Learning (ICAML);全文 *
基于语义的标签关联算法;刘海旭;郑岩;;软件(第12期);全文 *

Also Published As

Publication number Publication date
CN116665676A (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
CN112804400B (zh) 客服呼叫语音质检方法、装置、电子设备及存储介质
CN116665676B (zh) 一种用于智能语音外呼系统的语义识别方法
CN109256150B (zh) 基于机器学习的语音情感识别系统及方法
US7587308B2 (en) Word recognition using ontologies
CN108536654B (zh) 识别文本展示方法及装置
CN112735383A (zh) 语音信号的处理方法、装置、设备及存储介质
CN111489765A (zh) 一种基于智能语音技术的话务服务质检方法
CN112581964B (zh) 一种面向多领域的智能语音交互方法
US11450306B2 (en) Systems and methods for generating synthesized speech responses to voice inputs by training a neural network model based on the voice input prosodic metrics and training voice inputs
CN111489743A (zh) 一种基于智能语音技术的运营管理分析系统
CN114818649A (zh) 基于智能语音交互技术的业务咨询处理方法及装置
CN110059161A (zh) 一种基于文本分类技术的电话语音机器人系统
CN111091809B (zh) 一种深度特征融合的地域性口音识别方法及装置
CN114328867A (zh) 一种人机对话中智能打断的方法及装置
CN112231440A (zh) 一种基于人工智能的语音搜索方法
CN115022471B (zh) 一种智能机器人语音交互系统和方法
CN118013390B (zh) 一种基于大数据分析的智慧工作台控制方法及系统
CN113345419B (zh) 基于方言口音的语音转译方法、系统和可读存储介质
CN112131343B (zh) 一种中文小说对话人物识别方法
KR102278190B1 (ko) 공방 운영 플랫폼 서비스 방법 및 시스템
CN114420086B (zh) 语音合成方法和装置
CN113269305B (zh) 一种加强记忆的反馈语音强化方法
CN114927129A (zh) 一种基于机器学习的单声道角色识别方法和系统
CN117877531A (zh) 基于用户语音信息的情绪分析方法
CN116597837A (zh) 一种电网调度语音助手的实现方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant