CN114708047B - 一种基于知识图谱的外呼策略运营方法与系统 - Google Patents
一种基于知识图谱的外呼策略运营方法与系统 Download PDFInfo
- Publication number
- CN114708047B CN114708047B CN202210626910.5A CN202210626910A CN114708047B CN 114708047 B CN114708047 B CN 114708047B CN 202210626910 A CN202210626910 A CN 202210626910A CN 114708047 B CN114708047 B CN 114708047B
- Authority
- CN
- China
- Prior art keywords
- data
- outbound
- strategy
- scene
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000012545 processing Methods 0.000 claims abstract description 39
- 230000008569 process Effects 0.000 claims abstract description 36
- 230000010365 information processing Effects 0.000 claims abstract description 19
- 238000010276 construction Methods 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 38
- 239000013598 vector Substances 0.000 claims description 36
- 238000004458 analytical method Methods 0.000 claims description 24
- 238000007635 classification algorithm Methods 0.000 claims description 22
- 238000004140 cleaning Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 10
- 238000002474 experimental method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000011017 operating method Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241001122315 Polites Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Animal Behavior & Ethology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于知识图谱的外呼策略运营方法与系统,方法包含以下步骤:获取语料信息并进行处理得到语义节点,其中,所述语义节点涉及多场景多业务;获取业务办理流程信息并进行处理得到话术节点,其中,所述话术节点涉及多场景多业务;根据所述语义节点与所述话术节点构建基于知识图谱的外呼策略数据;获取对话数据并处理得到用户意图数据;根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼;系统包含语料信息处理模块、业务办理流程信息处理模块、外呼策略构建模块、外呼模块。
Description
技术领域
本发明涉及基于知识图谱的外呼策略运营方法与系统领域,具体涉及一种基于知识图谱的外呼策略运营方法与系统。
背景技术
为了提高电话营销的效率,降低营销的成本,机器人智能外呼逐渐代替传统的人工外呼营销方式。智能外呼机器人一般通过问答的方式来实现营销的目的,其中机器人在外呼时会设计好当前外呼的业务,问答流程为事前预设好的场景流程,业务场景具有一定的封闭性且机器人问答流程为瀑布式不可回退;
然而,在多业务共同营销时,在当前场景经过几轮的问答后,用户可能会对当前的机器人业务不感兴趣,转而咨询其他业务,此时,单业务流程已不能满足线上多业务营销;
除此之外,现有的外呼方式通过提取业务场景的对话流程,不同的业务流程的对话内容是不同的,不同的业务流程对话场景又包含了一些通用的话术,例如开头问好语、礼貌挂断话术等,对于这样的对话流程在业务场景中需要重复构建话术,扩展场景效率低下;CN110175240A提供了一种构建多业务对话主题的方法,该方法需先提取通用对话模块,再确定通用模块和其他模块之间的关系,该方式的缺陷在于,每新增一个业务类型,需要重新确定通用模块是否都适用于新增的业务类型,如发现不合适,修改后的通用模块将影响到其他业务,则需要重新整理通用模块,该方式对运营人员够不友好,知识图谱的便捷性优势没有得到有效利用;
最后,瀑布式流程不利于外呼策略的构建,用户与机器人的多轮对话在瀑布式流程中容易丢失部分有效信息,例如用户行为以及情绪,在当前营销市场竞争激烈的背景下,营销策略的运用显得至关重要,而目前的瀑布式流程,流程控制粗犷,无法利营销心理构建更加具有针对性和科学性的外呼策略。
发明内容
本发明要解决的技术问题是提供一种基于知识图谱的外呼策略运营方法,本发明还提供一种基于知识图谱的外呼策略运营系统,能够解决外呼业务场景单调,多业务场景构建困难,知识点复用率低,外呼策略单一的问题,本技术方案能够实现构建新场景操作简单,减少人力重复劳动并且降低业务流程构建的出错率,智能外呼知识图谱的构建及完善,方便了运营人员管理业务知识及策略,用以解决现有技术导致的缺陷。
为解决上述技术问题本发明提供以下的技术方案:
第一方面,一种基于知识图谱的外呼策略运营方法,其中,包含以下步骤:
获取语料信息并进行处理得到语义节点,其中,所述语义节点涉及多场景多业务;所述语料信息为用户问题的文本信息;所述语义节点为用户提出的某一类相似的问题的归类,即用户提出的某一类相似的问题归类为一个语义节点。
获取业务办理流程信息并进行处理得到话术节点,其中,所述话术节点涉及多场景多业务;
根据所述语义节点与所述话术节点构建基于知识图谱的外呼策略数据;
获取对话数据并处理得到用户意图数据,所述对话数据为人工外呼的对话信息,即对话数据为当前机器人与用户之间的对话内容数据;所述用户意图数据为用户的话术意图分析数据,例如获取生产上人工外呼的双通道录音为对话数据,将坐席一侧的语音转写为文本,该文本为用户意图数据;
根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼。
上述的一种基于知识图谱的外呼策略运营方法,其中,所述语料信息进行数据清洗、高频问题分析、特征向量生成、聚类算法处理得到所述语义节点,所述语料信息为用户问题的文本信息,不区分场景并去除问题的标点、重复项保留唯一值,不做拼写类的矫正或缩写和改写,不限制停用词的使用,文本信息保持生产的真实问答和ASR转写情况;
获取用户文本信息的语料中最大的文本长度max_length,选取合适的长度阈值m,使90%的用户文本信息的语料长度小于最大的文本长度,超过max_length的预料,仅保留最后出现的m个字符,去除开头超出长度的字符数;
根据获取的所述业务办理流程信息中业务办理流程图的业务场景外呼任务进行处理得到所述话术节点,包含多个业务场景的机器人话术,一组机器人话术组合成为某个业务场景的实体属性,实体属性包含不同的场景类型属性、话术属性、策略属性等,不同场景的实体属性可重复,话术属性值可按照业务的不同而更换;
所述外呼策略数据包含依据知识图谱的场景实体创建的外呼场景、依据知识图谱的语义实体类创建用户话术、依据知识图谱的策略实体创建的外呼策略、创建的相似问实体类、创建的话术实体类;
场景实体中有场景ID属性、语义ID属性;
语义节点中有话术ID属性、语义节点属性、意图属性;
相似问实体类拥有相似问ID属性、相似问;
策略实体中拥有策略ID属性、策略名称属性、策略配置属性、话术ID属性;
话术实体类中包含话术实体中拥有场景ID属性、场景名称属性、语义ID属性;
根据所述用户意图数据中当前的场景节点与用户语义节点来确定策略节点,依据所述策略节点从所述外呼策略数据中得到相应的外呼策略,进行外呼;所述场景节点为一个业务类型,例如账单分期业务为账单分期场景节点。
语义节点用来区分用户意图,策略节点用来确定机器人下一句播报话术。
上述的一种基于知识图谱的外呼策略运营方法,其中,所述数据清洗的过程为对所述语料信息通过ASR(Automatic sound recognition,自动声音识别)转义后去除标点、分词后形成词组文本信息;
所述高频问题分析的过程为所述词组文本信息进行高频关键词提取得到高频问题数据;
所述特征向量生成的过程为依据bert算法中文向量模型对所述词组文本信息进行特征向量的提取并生成词向量;Bert(Bidirectional Encoder Representations fromTransformers)算法,顾名思义,是基于Transformer算法的双向编码表征算法,2019 年 10月 25 日,Google 宣布 BERT 算法更新上线,可以以更接近人的方式去理解 Query(用户搜索词)的含义,从而提升搜索体验,预计影响 10% 的英文搜索。
所述聚类算法处理的过程为将所述词向量输入至聚类算法Kmeans中并反复实验得到轮廓系数数据,选取所述轮廓系数数据中最大值对应的K值作为聚类中心个数,总结K个所述聚类中心的话术,得出用户的所述语义节点。
上述的一种基于知识图谱的外呼策略运营方法,其中,还包含依据分类算法模型获取所述对话数据的所述用户意图数据;
当所述用户意图数据从所述外呼策略数据中未得到相应的外呼策略,则获取所述用户意图数据中的对话场景属性,当所述对话场景属性满足在当前的对话场景中,则所述分类算法模型获取所述用户意图数据并更换外呼场景数据;
根据更换后的所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼。
上述的一种基于知识图谱的外呼策略运营方法,其中,所述分类算法模型获取所述用户意图数据并更换外呼场景数据的方法包含以下步骤:
将所述词组文本信息中的语料按业务分类并贴上业务标签构建数据集;
利用bert算法中文预训练模型将所述用户意图数据转换为特征矩阵;
对所述bert算法中文预训练模型上做fine-tune算法微调,进行分类算法得到外呼场景数据并进行更换。fine-tune算法,fine-tune中文译为“微调”,深度学习中需要在深层网络中不断进行训练更新模型的参数(权重)拟合能实现预期结果的模型。
第二方面,一种基于知识图谱的外呼策略运营系统,其中,包含语料信息处理模块、业务办理流程信息处理模块、外呼策略构建模块、外呼模块;
所述语料信息处理模块用于获取语料信息并进行处理得到语义节点,其中,所述语义节点涉及多场景多业务;所述语料信息为用户问题的文本信息;所述语义节点为用户提出的某一类相似的问题的归类;
所述业务办理流程信息处理模块用于获取业务办理流程信息并进行处理得到话术节点,其中,所述话术节点涉及多场景多业务;针对不同的语义节点设置不同的话术节点;
所述外呼策略构建模块获取所述语义节点与所述话术节点并构建基于知识图谱的外呼策略数据;
所述外呼模块用于获取对话数据并处理得到用户意图数据,并根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼,所述对话数据为人工外呼的对话信息;所述用户意图数据为用户的话术意图分析数据。
上述的一种基于知识图谱的外呼策略运营系统,其中,所述语料信息处理模块内置有数据清洗模块、高频问题分析模块、特征向量生成模块、聚类算法处理模块;
所述数据清洗模块用于对所述语料信息通过ASR转义后去除标点、分词后形成词组文本信息;
所述高频问题分析模块用于对所述词组文本信息进行高频关键词提取得到高频问题数据;
所述特征向量生成模块用于依据bert算法中文向量模型对所述词组文本信息进行特征向量的提取并生成词向量;
所述聚类算法处理模块用于将所述词向量输入至聚类算法Kmeans中并反复实验得到轮廓系数数据,选取所述轮廓系数数据中最大值对应的K值作为聚类中心个数,总结K个所述聚类中心的话术,得出用户的所述语义节点。
上述的一种基于知识图谱的外呼策略运营系统,其中,所述外呼策略数据包含依据知识图谱的场景实体创建的外呼场景、依据知识图谱的语义实体类创建用户话术、依据知识图谱的策略实体创建的外呼策略、创建的相似问实体类、创建的话术实体类。
上述的一种基于知识图谱的外呼策略运营系统,其中,还包含依据分类算法模型模块,所述分类算法模型模块用于获取所述对话数据的所述用户意图数据;
所述外呼模块处理时从所述外呼策略数据中未得到所述用户意图数据相应的外呼策略时则获取所述用户意图数据中的对话场景属性,当所述对话场景属性满足在当前的对话场景中,则生成传输至所述分类算法模型模块的反馈数据;
所述分类算法模型模块依据所述反馈数据获取所述用户意图数据并更换外呼场景数据;
根据更换后的所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼。
第三方面,一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述方法的步骤。
依据上述本发明一种基于知识图谱的外呼策略运营方法与系统提供的技术方案具有以下技术效果:
本发明一种基于知识图谱的外呼策略运营方法与系统能够解决外呼业务场景单调,多业务场景构建困难,知识点复用率低,外呼策略单一的问题,本技术方案能够实现构建新场景操作简单,减少人力重复劳动并且降低业务流程构建的出错率,智能外呼知识图谱的构建及完善,方便了运营人员管理业务知识及策略。
附图说明
图1为一种基于知识图谱的外呼策略运营方法的流程图;
图2为图数据库的结构示意图;
图3为智能运营过程流程图;
图4为业务上线流程图;
图5为一种基于知识图谱的外呼策略运营系统的结构示意图。
其中,附图标记如下:
语料信息处理模块101、业务办理流程信息处理模块102、外呼策略构建模块103、外呼模块104。
具体实施方式
为了使发明实现的技术手段、创造特征、达成目的和功效易于明白了解,下结合具体图示,进一步阐述本发明。
本发明的第一实施例是提供一种基于知识图谱的外呼策略运营方法,目的是能够解决外呼业务场景单调,多业务场景构建困难,知识点复用率低,外呼策略单一的问题,本技术方案能够实现构建新场景操作简单,减少人力重复劳动并且降低业务流程构建的出错率,智能外呼知识图谱的构建及完善,方便了运营人员管理业务知识及策略。
如图1所示,第一方面,第一实施例,一种基于知识图谱的外呼策略运营方法,其中,包含以下步骤:
获取语料信息并进行处理得到语义节点,其中,语义节点涉及多场景多业务,语义节点为用户提出的某一类相似的问题归类为一个语义节点;
获取业务办理流程信息并进行处理得到话术节点,其中,话术节点涉及多场景多业务,话术节点为针对不同的语义节点设置不同的话术节点;
根据语义节点与话术节点构建基于知识图谱的外呼策略数据;
获取对话数据并处理得到用户意图数据,对话数据指的是人工外呼的对话信息,用户意图数据为用户的话术意图分析数据,例如获取生产上人工外呼的双通道录音为对话数据,将坐席一侧的语音转写为文本,该文本为用户意图数据;
根据用户意图数据从外呼策略数据中得到相应的外呼策略,进行外呼。
知识图谱是将应用领域中的知识进行抽取,将各类关联的实体、概念、节点和边的形式整合在一起,以图的形式构建实体关系网络,方便从图视角来分析和解决问题,构建智能外呼策略知识图谱,是将智能外呼场景中的话术、策略等关系借助知识图谱的实体属性和关系来进行描述,方便运营人员的操作。
根据本体设计,将生产上真实的外呼信息处理成半结构化数据,其中,半结构化数据包含了外呼场景、用户语义、外呼策略、外呼话术这些实体,将半结构化数据通过dataPaser处理成知识图谱需要的节点和边关系,然后将数据存入图数据库,图数据库的结构如图2所示。
上述的一种基于知识图谱的外呼策略运营方法,其中,语料信息进行数据清洗、高频问题分析、特征向量生成、聚类算法处理得到语义节点,语料信息为用户问题的文本信息,不区分场景并去除问题的标点、重复项保留唯一值,不做拼写类的矫正或缩写和改写,不限制停用词的使用,文本信息保持生产的真实问答和ASR转写情况;
获取用户文本信息的语料中最大的文本长度max_length,选取合适的长度阈值m,使90%的用户文本信息的语料长度小于最大的文本长度,超过max_length的预料,仅保留最后出现的m个字符,去除开头超出长度的字符数;
根据获取的业务办理流程信息中业务办理流程图的业务场景外呼任务进行处理得到话术节点,包含多个业务场景的机器人话术,一组机器人话术组合成为某个业务场景的实体属性,实体属性包含不同的场景类型属性、话术属性、策略属性等,不同场景的实体属性可重复,话术属性值可按照业务的不同而更换;
外呼策略数据包含依据知识图谱的场景实体创建的外呼场景、依据知识图谱的语义实体类创建用户话术、依据知识图谱的策略实体创建的外呼策略、创建的相似问(FAQ)实体类、创建的话术实体类;
场景实体中有场景ID属性、语义ID属性;
语义节点中有话术ID属性、语义节点属性、意图属性;
相似问实体类拥有相似问ID属性、相似问;
策略实体中拥有策略ID属性、策略名称属性、策略配置属性、话术ID属性;
话术实体类中包含话术实体中拥有场景ID属性、场景名称属性、语义ID属性;
根据用户意图数据中当前的场景节点与用户语义确定策略节点(语义节点用来区分用户意图,策略节点用来确定机器人下一句播报话术),依据策略节点从外呼策略数据中得到相应的外呼策略,进行外呼,多个用户语义节点可对应一个策略节点中的意图属性,可通过业务系统判定该用户经过的意图节点次数和外呼通次信息得出下一轮的话术策略;
场景节点为一个业务类型,例如账单分期业务为账单分期场景节点。
获取营销的话术,确定机器人话术节点,关于业务营销话术文件的一个示例,可参考表1所示,表1中展示的营销话术可以组合成一套外呼流程,也可成为独立问答,其中话术节点有节点名称和话术为知识图谱中s节点的属性。
表1
上述的一种基于知识图谱的外呼策略运营方法,其中,数据清洗的过程为对语料信息通过ASR转义后去除标点、分词后形成词组文本信息,ASR(Automatic soundrecognition)语音识别技术;
高频问题分析的过程为词组文本信息进行高频关键词提取得到高频问题数据;
特征向量生成的过程为依据bert中文向量模型对词组文本信息进行特征向量的提取并生成词向量,bert(Bidirectional Encoder Representation from Transformers)一个预训练的语言表征模型;
聚类算法处理的过程为将词向量输入至聚类算法Kmeans中并反复实验得到轮廓系数数据,选取轮廓系数数据中最大值对应的K值作为聚类中心个数,总结K个聚类中心的话术,得出用户的语义节点,该过程为用户语义归类,为了确定用户的语义信息,具体为采用无监督聚类的方式对特征集划分若干不相干的子集,选取K-means聚类算法,聚类中心K的取数范围为2-100,在每个K值上重复聚类5次,计算当前K值的平均轮廓系数;选取平均轮廓系数最大值时的K值作为聚类中心,将每个聚类中心的语料总结为语义节点并命名,为了确认没有遗漏语义节点,可增加聚类算法的K值,将聚类后的语料与语义节点相比较,新增合理语义节点,表2中展示的语义节点可做为业务营销类语义节点的一个案例,将语义节点按照场景打上标签,可以公用的语义节点不可以作为更换场景的判断标。
表2
上述的一种基于知识图谱的外呼策略运营方法,其中,还包含依据分类算法模型获取对话数据的用户意图数据;
当用户意图数据从外呼策略数据中未得到相应的外呼策略,则获取用户意图数据中的对话场景属性,当对话场景属性满足在当前的对话场景中,则分类算法模型获取用户意图数据并更换外呼场景数据,实现场景之间的跳转,若对话场景属性不满足在当前的对话场景中,则不进行更换,播报兜底话术;
根据更换后的用户意图数据从外呼策略数据中得到相应的外呼策略,进行外呼。
不同的外呼场景有不同的外呼策略,例如:新老客户的用户习惯不同,在外呼营销时可以针对新用户设计忒别的外呼策略,当用户多次表达同一个意思时,可以设计不同的话术,入表3所示。
表3
上述的一种基于知识图谱的外呼策略运营方法,其中,分类算法模型获取用户意图数据并更换外呼场景数据的方法包含以下步骤:
将词组文本信息中的语料按业务分类并贴上业务标签构建数据集;
利用bert中文预训练模型将用户意图数据转换为特征矩阵;
对bert中文预训练模型上做fine-tune微调,进行分类算法得到外呼场景数据并进行更换。
运营人员可对知识图谱进行智能运营,知识图谱不需要编写复杂的查询语句,可通过模式匹配图数据库中的节点和关系来实现对数据库的查询、修改、更新或者删除等操作,为智能运营提供了数据修正、分析和扩展的基础。
本步骤致力于简化运营人员的操作,建立智能个性化运营方式,用户通过与系统对话的方式操作知识图谱数据库,知识图谱不需要编写复杂的查询语句即可通过模式匹配图数据库中的节点和关系来实现对数据库的查询、修改、更新或者删除等操作,为智能运营提供了数据修正、分析和扩展的基础,除此之外,知识图谱可提供机器人智能外呼业务上线支持,由图谱引擎通过应用层将策略加载到服务器内存中,用于生产外呼使用;
总结运营人员常用的操作,主要分为表4这几种;
表4
将常用的运营操作归类为表5几种类型,每种类型对应一个知识图谱操作。
表5
本知识图谱是基于Neo4j构建存储的,对知识进行查询时需要使用Cypher来检索查询、识别、提取用户问句中关键实体名称是智能运营的关键,传统的知识查询通常是在搜索框中输入关键字,在数据库中通过关键字进行匹配来查询结果,这种方式简单高效,但缺乏准确性,容易导致检索时间过长,系统反应超时和检索结果过多偏离用户查询意图等问题,为了解决这个问题,本发明采用先对文本进行处理,再进行语义分析的方式,提高用户意图识别的准确率;
其中,文本处理的主要工作为:对用户操作语句进行分词,标记词性并查询同义词,确定用户运营操作的所属类别和对应的Cypher操作语句模板,语义分析主要工作为:采用Lattice-LSTM来提取实体类和属性,识别用户操作语句中的实体以及属性,对Cypher模板中的字段进行填充和替换;
匹配问题的模板如表,通过文本预处理和语义分析,将原始问句转化为系统可以识别的Cypher查询语言,见表6。
表6
如图3所示,本技术方案公开了一种基于知识图谱的智能外呼策略运营方法,该方法包含:业务场景的知识及话术处理方式、用户语义理解方法、智能外呼拨打策略;本发明利用知识图谱存储业务知识及机器人话术,展示了用户语义节点和话术节点之间的关系,通过判断用户的外呼通次和语义节点形成一套智能外呼拨打策略;其中,用户语义来源于业务平台,采用预训练模型和聚类算法分析用户语义节点,采用多模型分类算法解决业务场景之间的跳转问题,根据业务场景的多样性,可以不断补充话术节点和语义节点,扩大知识图谱智能外呼的业务范围,在实现机器人的话术多样性和服务灵活性的同时,该方式实现了运营智能化,构建场景操作简单,减少人力重复劳动并且有效降低了业务流程制作的出错率。
如图4所示,运营人员可以发起业务上线请求,应用层从知识图谱中抽取相关信息发送到机器人训练平台和外呼策略平台,实现业务的一键上线,减少运营人员的操作。
如图5所示,第二方面,第二实施例,一种基于知识图谱的外呼策略运营系统,其中,包含语料信息处理模块101、业务办理流程信息处理模块102、外呼策略构建模块103、外呼模块104;
语料信息处理模块101用于获取语料信息并进行处理得到语义节点,其中,语义节点涉及多场景多业务;语料信息为用户问题的文本信息;语义节点为用户提出的某一类相似的问题的归类;
业务办理流程信息处理模块102用于获取业务办理流程信息并进行处理得到话术节点,其中,话术节点涉及多场景多业务;针对不同的语义节点设置不同的话术节点;
外呼策略构建模块103获取语义节点与话术节点并构建基于知识图谱的外呼策略数据;
外呼模块104用于获取对话数据并处理得到用户意图数据,并根据用户意图数据从外呼策略数据中得到相应的外呼策略,进行外呼,对话数据为人工外呼的对话信息;用户意图数据为用户的话术意图分析数据。
上述的一种基于知识图谱的外呼策略运营系统,其中,语料信息处理模块101内置有数据清洗模块、高频问题分析模块、特征向量生成模块、聚类算法处理模块;
数据清洗模块用于对语料信息通过ASR转义后去除标点、分词后形成词组文本信息;
高频问题分析模块用于对词组文本信息进行高频关键词提取得到高频问题数据;
特征向量生成模块用于依据bert中文向量模型对词组文本信息进行特征向量的提取并生成词向量;
聚类算法处理模块用于将词向量输入至聚类算法Kmeans中并反复实验得到轮廓系数数据,选取轮廓系数数据中最大值对应的K值作为聚类中心个数,总结K个聚类中心的话术,得出用户的语义节点。
上述的一种基于知识图谱的外呼策略运营系统,其中,外呼策略数据包含依据知识图谱的场景实体创建的外呼场景、依据知识图谱的语义实体类创建用户话术、依据知识图谱的策略实体创建的外呼策略、创建的相似问实体类、创建的话术实体类。
上述的一种基于知识图谱的外呼策略运营系统,其中,还包含依据分类算法模型模块,分类算法模型模块用于获取对话数据的用户意图数据;
外呼模块104处理时从外呼策略数据中未得到用户意图数据相应的外呼策略时则获取用户意图数据中的对话场景属性,当对话场景属性满足在当前的对话场景中,则生成传输至分类算法模型模块的反馈数据;
分类算法模型模块依据反馈数据获取用户意图数据并更换外呼场景数据;
根据更换后的用户意图数据从外呼策略数据中得到相应的外呼策略,进行外呼。
第三方面,第三实施例,一种计算机可读存储介质,其中,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现第一方面方法的步骤。
综上,本发明的一种基于知识图谱的外呼策略运营方法与系统,能够解决外呼业务场景单调,多业务场景构建困难,知识点复用率低,外呼策略单一的问题,本技术方案能够实现构建新场景操作简单,减少人力重复劳动并且降低业务流程构建的出错率,智能外呼知识图谱的构建及完善,方便了运营人员管理业务知识及策略。
以上对发明的具体实施例进行了描述。需要理解的是,发明并不局限于上述特定实施方式,其中未尽详细描述的设备和结构应该理解为用本领域中的普通方式予以实施;本领域技术人员可以在权利要求的范围内做出各种变形或修改做出若干简单推演、变形或替换,这并不影响发明的实质内容。
Claims (5)
1.一种基于知识图谱的外呼策略运营方法,其特征在于,包含以下步骤:
获取语料信息并进行处理得到语义节点,其中,所述语义节点涉及多场景多业务;所述语料信息为用户问题的文本信息;所述语义节点为用户提出的某一类相似的问题的归类;所述语料信息进行数据清洗、高频问题分析、特征向量生成、聚类算法处理得到所述语义节点;所述高频问题分析的过程为对所述数据清洗后形成的词组文本信息进行高频关键词提取得到高频问题数据;
获取业务办理流程信息并进行处理得到话术节点,其中,所述话术节点涉及多场景多业务;针对不同的语义节点设置不同的话术节点;根据获取的所述业务办理流程信息中业务办理流程图的业务场景外呼任务进行处理得到所述话术节点;
根据所述语义节点与所述话术节点构建基于知识图谱的外呼策略数据;所述外呼策略数据包含依据知识图谱的场景实体创建的外呼场景、依据知识图谱的语义实体类创建用户话术、依据知识图谱的策略实体创建的外呼策略、创建的相似问实体类、创建的话术实体类;
获取对话数据并处理得到用户意图数据;所述对话数据为人工外呼的对话信息;所述用户意图数据为用户的话术意图分析数据;
根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼;根据所述用户意图数据中当前的场景节点与用户语义节点来确定策略节点,依据所述策略节点从所述外呼策略数据中得到相应的外呼策略,进行外呼;所述场景节点为一个业务类型;
所述根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼,还包含以下步骤:当所述用户意图数据从所述外呼策略数据中未得到相应的外呼策略时,则获取所述用户意图数据中的对话场景属性,当所述对话场景属性满足在当前的对话场景中,则依据分类算法模型将所述用户意图数据进行外呼场景数据更换;
根据更换后的所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼;
所述分类算法模型获取所述用户意图数据并更换外呼场景数据的方法包含以下步骤:
将所述词组文本信息中的语料按业务分类并贴上业务标签构建数据集;
利用bert算法中文预训练模型将所述用户意图数据转换为特征矩阵;
对所述bert算法中文预训练模型上做fine-tune算法微调,进行分类算法得到外呼场景数据并进行更换。
2.如权利要求1所述的一种基于知识图谱的外呼策略运营方法,其特征在于,所述数据清洗的过程为对所述语料信息通过ASR转义后去除标点、分词后形成词组文本信息;
所述特征向量生成的过程为依据bert算法中文向量模型对所述词组文本信息进行特征向量的提取并生成词向量;
所述聚类算法处理的过程为将所述词向量输入至聚类算法Kmeans中并反复实验得到轮廓系数数据,选取所述轮廓系数数据中最大值对应的K值作为聚类中心个数,总结K个所述聚类中心的话术,得出用户的所述语义节点。
3.一种基于知识图谱的外呼策略运营系统,其特征在于,包含语料信息处理模块、业务办理流程信息处理模块、外呼策略构建模块、外呼模块;
所述语料信息处理模块用于获取语料信息并进行处理得到语义节点,其中,所述语义节点涉及多场景多业务;所述语料信息为用户问题的文本信息;所述语义节点为用户提出的某一类相似的问题的归类;所述语料信息处理模块内置有数据清洗模块、高频问题分析模块、特征向量生成模块、聚类算法处理模块;所述高频问题分析模块用于对所述数据清洗模块形成的词组文本信息进行高频关键词提取得到高频问题数据;
所述业务办理流程信息处理模块用于获取业务办理流程信息并进行处理得到话术节点,其中,所述话术节点涉及多场景多业务;针对不同的语义节点设置不同的话术节点;根据获取的所述业务办理流程信息中业务办理流程图的业务场景外呼任务进行处理得到所述话术节点;
所述外呼策略构建模块获取所述语义节点与所述话术节点并构建基于知识图谱的外呼策略数据;所述外呼策略数据包含依据知识图谱的场景实体创建的外呼场景、依据知识图谱的语义实体类创建用户话术、依据知识图谱的策略实体创建的外呼策略、创建的相似问实体类、创建的话术实体类;
所述外呼模块用于获取对话数据并处理得到用户意图数据,并根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼,所述对话数据为人工外呼的对话信息;所述用户意图数据为用户的话术意图分析数据;根据所述用户意图数据中当前的场景节点与用户语义节点来确定策略节点,依据所述策略节点从所述外呼策略数据中得到相应的外呼策略,进行外呼;所述场景节点为一个业务类型;
该系统还包含分类算法模型模块;
所述外呼模块处理时从所述外呼策略数据中未得到所述用户意图数据相应的外呼策略时则获取所述用户意图数据中的对话场景属性,当所述对话场景属性满足在当前的对话场景中,则生成传输至所述分类算法模型模块的反馈数据;
所述分类算法模型模块依据所述反馈数据获取所述用户意图数据并更换外呼场景数据;
根据更换后的所述用户意图数据从所述外呼策略数据中得到相应的外呼策略,进行外呼;
所述分类算法模型模块依据所述反馈数据获取所述用户意图数据并更换外呼场景数据的方法包含以下步骤:
将所述词组文本信息中的语料按业务分类并贴上业务标签构建数据集;
利用bert算法中文预训练模型将所述用户意图数据转换为特征矩阵;
对所述bert算法中文预训练模型上做fine-tune算法微调,进行分类算法得到外呼场景数据并进行更换。
4.如权利要求3所述的一种基于知识图谱的外呼策略运营系统,其特征在于,
所述数据清洗模块用于对所述语料信息通过ASR转义后去除标点、分词后形成词组文本信息;
所述特征向量生成模块用于依据bert算法中文向量模型对所述词组文本信息进行特征向量的提取并生成词向量;
所述聚类算法处理模块用于将所述词向量输入至聚类算法Kmeans中并反复实验得到轮廓系数数据,选取所述轮廓系数数据中最大值对应的K值作为聚类中心个数,总结K个所述聚类中心的话术,得出用户的所述语义节点。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-2任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210626910.5A CN114708047B (zh) | 2022-06-06 | 2022-06-06 | 一种基于知识图谱的外呼策略运营方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210626910.5A CN114708047B (zh) | 2022-06-06 | 2022-06-06 | 一种基于知识图谱的外呼策略运营方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114708047A CN114708047A (zh) | 2022-07-05 |
CN114708047B true CN114708047B (zh) | 2022-09-09 |
Family
ID=82177655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210626910.5A Active CN114708047B (zh) | 2022-06-06 | 2022-06-06 | 一种基于知识图谱的外呼策略运营方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114708047B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112131358A (zh) * | 2020-08-24 | 2020-12-25 | 维知科技张家口有限责任公司 | 场景流程结构及所应用的智能客服系统 |
CN113051405A (zh) * | 2019-04-30 | 2021-06-29 | 五竹科技(北京)有限公司 | 基于对话场景的智能外呼知识图谱构建方法及装置 |
CN113779217A (zh) * | 2021-09-03 | 2021-12-10 | 科大国创云网科技有限公司 | 一种基于人机交互的智能语音外呼业务方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107688614B (zh) * | 2017-08-04 | 2018-08-10 | 平安科技(深圳)有限公司 | 意图获取方法、电子装置及计算机可读存储介质 |
CN109635117B (zh) * | 2018-12-26 | 2021-05-14 | 零犀(北京)科技有限公司 | 一种基于知识图谱识别用户意图方法及装置 |
CN110175240B (zh) * | 2019-05-16 | 2022-12-09 | 五竹科技(北京)有限公司 | 与虚拟机器人外呼流程相关的知识图谱的构建方法及装置 |
CN111653262B (zh) * | 2020-08-06 | 2020-11-17 | 上海荣数信息技术有限公司 | 一种智能语音交互系统及方法 |
CN112202978A (zh) * | 2020-08-24 | 2021-01-08 | 维知科技张家口有限责任公司 | 智能外呼系统、方法、计算机系统及存储介质 |
CN112131359A (zh) * | 2020-09-04 | 2020-12-25 | 交通银行股份有限公司太平洋信用卡中心 | 一种基于图形化编排智能策略的意图识别方法及电子设备 |
-
2022
- 2022-06-06 CN CN202210626910.5A patent/CN114708047B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051405A (zh) * | 2019-04-30 | 2021-06-29 | 五竹科技(北京)有限公司 | 基于对话场景的智能外呼知识图谱构建方法及装置 |
CN112131358A (zh) * | 2020-08-24 | 2020-12-25 | 维知科技张家口有限责任公司 | 场景流程结构及所应用的智能客服系统 |
CN113779217A (zh) * | 2021-09-03 | 2021-12-10 | 科大国创云网科技有限公司 | 一种基于人机交互的智能语音外呼业务方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114708047A (zh) | 2022-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109146610B (zh) | 一种智能保险推荐方法、装置及智能保险机器人设备 | |
WO2021017612A1 (zh) | 基于语音分析的问答方法、装置、设备及存储介质 | |
US6839671B2 (en) | Learning of dialogue states and language model of spoken information system | |
Gorin et al. | How may I help you? | |
US6501833B2 (en) | Method and apparatus for dynamic adaptation of a large vocabulary speech recognition system and for use of constraints from a database in a large vocabulary speech recognition system | |
CN112069298A (zh) | 基于语义网和意图识别的人机交互方法、设备及介质 | |
US20090037175A1 (en) | Confidence measure generation for speech related searching | |
US20070043562A1 (en) | Email capture system for a voice recognition speech application | |
CN108538294B (zh) | 一种语音交互方法及装置 | |
US9697246B1 (en) | Themes surfacing for communication data analysis | |
TWI734085B (zh) | 使用意圖偵測集成學習之對話系統及其方法 | |
CN109977204A (zh) | 一种基于知识库的智能问答系统和方法 | |
CN112131359A (zh) | 一种基于图形化编排智能策略的意图识别方法及电子设备 | |
CN111899140A (zh) | 基于话术水平提升的客服培训方法及系统 | |
CN113821605A (zh) | 一种事件抽取方法 | |
Arai et al. | Grammar fragment acquisition using syntactic and semantic clustering | |
CN117763119A (zh) | 智能语音客服对话方法、装置、电子设备及存储介质 | |
JP6208794B2 (ja) | 会話分析装置、方法及びコンピュータプログラム | |
CN115292461A (zh) | 基于语音识别的人机交互学习方法及系统 | |
CN114818649A (zh) | 基于智能语音交互技术的业务咨询处理方法及装置 | |
CN116028608A (zh) | 问答交互方法、装置、计算机设备及可读存储介质 | |
CN116246632A (zh) | 外呼话术指导方法及装置 | |
CN112800206B (zh) | 一种基于生成式多轮对话意图识别的骚扰电话屏蔽方法 | |
CN117952081A (zh) | 用户意见分析方法、装置及介质 | |
CN117634471A (zh) | 一种nlp质检方法及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |