CN109582771B - 面向电力领域基于移动应用的智能客户交互方法 - Google Patents
面向电力领域基于移动应用的智能客户交互方法 Download PDFInfo
- Publication number
- CN109582771B CN109582771B CN201811418743.5A CN201811418743A CN109582771B CN 109582771 B CN109582771 B CN 109582771B CN 201811418743 A CN201811418743 A CN 201811418743A CN 109582771 B CN109582771 B CN 109582771B
- Authority
- CN
- China
- Prior art keywords
- word
- user
- chinese
- word vector
- power field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种面向电力领域基于移动应用的智能客户交互方法,其步骤为:步骤S1:面向电力领域进行中文分词,用来实现基于马尔科夫链和条件随机场理论的中文分词技术。步骤S2:面向电力领域中文分词进行向量分析,用来实现基于共生概率矩阵和主成分分析的词向量技术;步骤S3:基于语义相似度的相似问题进行检索;步骤S4:基于循环神经网络的序列到序列方法,完成客户交互。本发明具有原理简单、能够提高交互效果等优点。
Description
技术领域
本发明主要涉及到基于互联网的客户交互技术领域,特指一种面向电力领域基于移动应用的智能客户交互方法。
背景技术
互联网技术及基于互联网的交互方式已经在各个领域中不断深入,成为人们生活中已经习惯的常规方式。
以业务服务类为例,基于互联网技术的服务型交互方式已经成为一种常规方式。以国网电力公司为例,随着国网电力的业务深化,服务范围和服务项目的扩展,业务短信的提交数量也随之出现了激增。以湖南省为例,2016年全年业务系统和短信平台用户累计提交短信3.4亿条,按70字拆分,最终计费短信5.2亿条,总共支付给三大运营商2300多万元;2017年短信平台接收到提交短信5.1亿条,运营商按70字拆分最终计费10.3亿条,总费用3100多万元。
提交数量已经如此大的短信发送数量,一方面验证了公司业务服务质量的提升,另一方面也存在着继续改进的空间。在互联网+的时代背景下,如何利用大数据分析,结合移动终端的新技术,实现精准的业务短信推送,提升客户交互体验并降低短信的发送成本,成为了新的技术发展研究方向。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种原理简单、能够提高交互效果的面向电力领域基于移动应用的智能客户交互方法。
为解决上述技术问题,本发明采用以下技术方案:
一种面向电力领域基于移动应用的智能客户交互方法,其步骤为:
步骤S1:面向电力领域进行中文分词,用来实现基于马尔科夫链和条件随机场理论的中文分词技术。
步骤S2:面向电力领域中文分词进行向量分析,用来实现基于共生概率矩阵和主成分分析的词向量技术;
步骤S3:基于语义相似度的相似问题进行检索;用来实现基于中文分词和词向量技术,将不同的问题描述转化成词向量序列,通过采用词向量技术计算词向量序列间的距离,采用TFIDF技术计算词的权值,度量词与词之间的相似度,根据该相似度对相似问题进行检索,实现相似问题的归并和回答;
步骤S4:基于循环神经网络的序列到序列方法,完成客户交互。
作为本发明的进一步改进:所述步骤S1中,对用电服务语料库中的词语进行词注标记,通过构建上下文词注以及不同上下文词语和词注的状态转移矩阵实现离线训练过程,并基于训练结果实现电力领域长短句的中文分词。
作为本发明的进一步改进:所述步骤S2中,针对基于中文分词技术从用电服务中获取的词语,构建词语间共生概率矩阵,描述词语间距离,形成词向量,同时采用主成分分析技术对词向量降维的同时不失精度,实现词语间相关性度量和分布式表示。
作为本发明的进一步改进:所述步骤S4中,实现基于中文分词和词向量技术,将用户的输入转化成词向量序列,构建输入层、词向量层、隐含层、词向量层、输出层的循环神经网络模型,根据当前时刻的词向量以及上一时刻循环神经网络输出的词向量,实现上下文记忆,为用户提供准确、人性化的智能问答服务。
与现有技术相比,本发明的优点在于:本发明的面向电力领域基于移动应用的智能客户交互方法,原理简单、效果好,通过深度学习等人工智能技术,实现对于客户自然语义反馈的分析与处理,构建自动化的智能客户交互,并推动用户数据的及时更新,保证客户服务的准确性和有效性。
附图说明
图1是本发明方法的流程示意图。
图2是本发明在具体应用实例中步骤S1的详细流程示意图。
图3是本发明在具体应用实例中步骤S2的详细流程示意图。
图4是本发明在具体应用实例中步骤S3的详细流程示意图。
图5是本发明在具体应用实例中步骤S4的详细流程示意图。
具体实施方式
以下将结合说明书附图和具体实施例对本发明做进一步详细说明。
本发明的面向电力领域基于移动应用的智能客户交互方法,通过深度学习等人工智能技术,实现对于客户自然语义反馈的分析与处理,构建自动化的智能客户交互,对客户一端进行自动回复,并将分析结果分类反馈到公司营销或客服部门,更新对应用户数据,推动闭环的处理机制,最终实现优质服务的提升。
如图1所示,本发明的面向电力领域基于移动应用的智能客户交互方法,其步骤为:
步骤S1:面向电力领域进行中文分词;
实现基于马尔科夫链和条件随机场理论的中文分词技术。
中文与西文不同,西文词与词之间采用空格分开,但汉语文章表现形式上词与词之间不留空白,在这种情况下,需要利用计算机把汉语的文字中的单词逐一分割出来,才有进一步分析的可能,中文分词是汉语信息处理的基础和前提。
对用电服务语料库中的词语进行词注标记,通过构建上下文词注以及不同上下文词语和词注的状态转移矩阵实现离线训练过程,并基于训练结果实现电力领域长短句的中文分词,参见图2,具体而言可以限不限于包括以下步骤:
步骤S101:采用用电服务语料库进行输入;
步骤S102:对语料进行预处理,第一遍扫描处理特殊符号,第二遍扫描处理汉语单字,第三遍扫描处理汉语前置字,第四遍扫描处理汉语后置字;
步骤S103:对于预处理结果,分别采用马尔科夫链和条件随机场理论进行上下文词注、不同上下文词语和词注状态转移矩阵的构建;
步骤S104:对比不同方法的结果,进行歧义处理和新词处理,反复循环完成离线训练过程;
步骤S105:整合结果,生成电力领域的用电服务长短句中文分词的词库。
步骤S2:面向电力领域中文分词进行向量分析;
实现基于共生概率矩阵和主成分分析的词向量技术。
针对基于中文分词技术从用电服务中获取的词语,构建词语间共生概率矩阵,描述词语间距离,形成词向量,同时采用主成分分析技术对词向量降维的同时不失精度,实现词语间相关性度量和分布式表示。参见图3,具体而言可以限不限于包括以下步骤:
步骤S201:采用用电服务中文分词词库作为输入;
步骤S202:对词库进行预处理;
步骤S203:对于预处理结果,计算词语间距离,更新词向量,构建共生概率矩阵,;
步骤S204:对与共生概率矩阵,采用主成分分析,将词向量降低维度,保证精度;
步骤S205:生成相关性度量和分布式表示矩阵。
步骤S3:基于语义相似度的相似问题进行检索;
实现基于中文分词和词向量技术,将不同的问题描述转化成词向量序列,通过采用词向量技术计算词向量序列间的距离,采用TFIDF技术计算词的权值,度量词与词之间的相似度,根据该相似度对相似问题进行检索,实现相似问题的归并和回答。参见图4,具体而言可以限不限于包括以下步骤:
步骤S301:采用用户提问作为输入;
步骤S302:将用户提问通过步骤S2转化为词向量序列;
步骤S303:采用TFIDF技术计算次的权值,获取相似度;
步骤S304:根据相似度检索,反馈给用户对应回答;
步骤S305:检测用户反馈,若为积极,归并相似问题,新增神经网络训练样本;
步骤S206:若为消极,转向步骤S4,其中消极的判定为用户不满意、用户不理解、新的疑问等非问题终结型反馈。
步骤S4:基于循环神经网络的序列到序列方法,完成客户交互;
实现基于中文分词和词向量技术,将用户的输入转化成词向量序列,构建输入层、词向量层、隐含层、输出层的循环神经网络模型,根据当前时刻的词向量以及上一时刻循环神经网络输出的词向量,实现上下文记忆,为用户提供准确、人性化的智能问答服务。参见图5,具体而言可以限不限于包括以下步骤:
步骤S401:采用步骤S3消极反馈的用户所有输入作为输入;
步骤S402:构建输入层、词向量层、隐含层、输出层的循环神经网络模型;
步骤S403:循环上一时刻神经网络,进行上下文记忆分析;
步骤S404:进行意图识别,构建用户回复;
步骤S405:输出给用户对应回回复;
步骤S406:检测用户反馈,若为积极,转向步骤S3问题归并;
步骤S407:若为消极,转向人工处理,更新对应词向量库,新增神经网络训练样本。
由上可知,在本发明中,步骤S1是后续智能客户交互的基础,分析了海量的用电服务语料库,并需要不断更新内容,以扩充客户回复的词向量矩阵,步骤S2是步骤S1和用户输入的后续处理,以便于相似度匹配,步骤S3通过TFIDF技术进行相似度匹配,获取问题答案,当不能完成用户交互时,转向步骤S4,通过循环神经网络进行计算机人工智能的客户交互,在达到一定阈值不能解答时,引入人工干预,扩充训练样本,不断提升该方法的智能程度,以期满足最终的智能客户交互。
在一个具体应用实例中,详细过程如下:通过步骤S1分析用电资料服务资料的分词,并进行了记录,用户输入“我要交电费”和“我电费多少”通过步骤S2分别分词为:“我/S、要/S、交/B/电/M/费/E”和“我/S、电/B费/E、多/B少/E”。进行相似度分析后,通过词向量距离判断,获取步骤S1中相似“电费”和“交电费”分词的回复。如:“电费”回复用户电量,“交电费”回复缴费访式,如通过电E宝缴费。前者用户回复终结,归并如“我家这个月电多少钱”之类的问题;后者用户可能没有终结问题,对交电费有更多疑问,比如“电E宝怎么用”等,转向步骤S4进行循环神经网络处理,更新问题库,特殊情况如“我是老人,不会使用。”在循环神经网络多处处理扔得不到解决的情况下,转向人工介入,回复后同时新增神经网络训练样本,更新问题库,标记用户信息,不断完善智能客户交互。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (8)
1.一种面向电力领域基于移动应用的智能客户交互方法,其特征在于,步骤为:
步骤S1:面向电力领域进行中文分词,用来实现基于马尔科夫链和条件随机场理论的中文分词技术;
步骤S2:面向电力领域中文分词进行向量分析,用来实现基于共生概率矩阵和主成分分析的词向量技术;
步骤S3:基于语义相似度的相似问题进行检索;用来实现基于中文分词和词向量技术,将不同的问题描述转化成词向量序列,通过采用词向量技术计算词向量序列间的距离,采用TFIDF技术计算词的权值,度量词与词之间的相似度,根据该相似度对相似问题进行检索,实现相似问题的归并和回答;
步骤S4:基于循环神经网络的序列到序列方法,完成客户交互。
2.根据权利要求1所述的面向电力领域基于移动应用的智能客户交互方法,其特征在于,所述步骤S1中,对用电服务语料库中的词语进行词注标记,通过构建上下文词注以及不同上下文词语和词注的状态转移矩阵实现离线训练过程,并基于训练结果实现电力领域长短句的中文分词。
3.根据权利要求1所述的面向电力领域基于移动应用的智能客户交互方法,其特征在于,所述步骤S2中,针对基于中文分词技术从用电服务中获取的词语,构建词语间共生概率矩阵,描述词语间距离,形成词向量,同时采用主成分分析技术对词向量降维的同时不失精度,实现词语间相关性度量和分布式表示。
4.根据权利要求1所述的面向电力领域基于移动应用的智能客户交互方法,其特征在于,所述步骤S4中,实现基于中文分词和词向量技术,将用户的输入转化成词向量序列,构建输入层、词向量层、隐含层、词向量层、输出层的循环神经网络模型,根据当前时刻的词向量以及上一时刻循环神经网络输出的词向量,实现上下文记忆,为用户提供准确、人性化的智能问答服务。
5.根据权利要求1-4中任一项所述的面向电力领域基于移动应用的智能客户交互方法,其特征在于,所述步骤S1包括:
步骤S101:采用用电服务语料库进行输入;
步骤S102:对语料进行预处理,第一遍扫描处理特殊符号,第二遍扫描处理汉语单字,第三遍扫描处理汉语前置字,第四遍扫描处理汉语后置字;
步骤S103:对于预处理结果,分别采用马尔科夫链和条件随机场理论进行上下文词注、不同上下文词语和词注状态转移矩阵的构建;
步骤S104:对比不同方法的结果,进行歧义处理和新词处理,反复循环完成离线训练过程;
步骤S105:整合结果,生成电力领域的用电服务长短句中文分词的词库。
6.根据权利要求1-4中任一项所述的面向电力领域基于移动应用的智能客户交互方法,其特征在于,所述步骤S2包括:
步骤S201:采用用电服务中文分词词库作为输入;
步骤S202:对词库进行预处理;
步骤S203:对于预处理结果,计算词语间距离,更新词向量,构建共生概率矩阵;
步骤S204:对与共生概率矩阵,采用主成分分析,将词向量降低维度,保证精度;
步骤S205:生成相关性度量和分布式表示矩阵。
7.根据权利要求1-4中任一项所述的面向电力领域基于移动应用的智能客户交互方法,其特征在于,所述步骤S3包括:
步骤S301:采用用户提问作为输入;
步骤S302:将用户提问通过步骤S2转化为词向量序列;
步骤S303:采用TFIDF技术计算次的权值,获取相似度;
步骤S304:根据相似度检索,反馈给用户对应回答;
步骤S305:检测用户反馈,若为积极,归并相似问题,新增神经网络训练样本;
步骤S206:若为消极,转向步骤S4,其中消极的判定为用户不满意、用户不理解、新的疑问等非问题终结型反馈。
8.根据权利要求1-4中任一项所述的面向电力领域基于移动应用的智能客户交互方法,其特征在于,所述步骤S4包括:
步骤S401:采用步骤S3消极反馈的用户所有输入作为输入;
步骤S402:构建输入层、词向量层、隐含层、输出层的循环神经网络模型;
步骤S403:循环上一时刻神经网络,进行上下文记忆分析;
步骤S404:进行意图识别,构建用户回复;
步骤S405:输出给用户对应回复;
步骤S406:检测用户反馈,若为积极,转向步骤S3问题归并;
步骤S407:若为消极,转向人工处理,更新对应词向量库,新增神经网络训练样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811418743.5A CN109582771B (zh) | 2018-11-26 | 2018-11-26 | 面向电力领域基于移动应用的智能客户交互方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811418743.5A CN109582771B (zh) | 2018-11-26 | 2018-11-26 | 面向电力领域基于移动应用的智能客户交互方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109582771A CN109582771A (zh) | 2019-04-05 |
CN109582771B true CN109582771B (zh) | 2022-11-25 |
Family
ID=65924632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811418743.5A Active CN109582771B (zh) | 2018-11-26 | 2018-11-26 | 面向电力领域基于移动应用的智能客户交互方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109582771B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113222560A (zh) * | 2021-06-01 | 2021-08-06 | 无锡星凝互动科技有限公司 | 一种基于ai咨询的企业服务系统及其搭建方法 |
CN113704451B (zh) * | 2021-08-30 | 2023-01-13 | 广东电网有限责任公司 | 一种电力用户诉求筛选方法、系统、电子设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631009A (zh) * | 2015-12-25 | 2016-06-01 | 广州视源电子科技股份有限公司 | 基于词向量相似度的检索方法和系统 |
CN107193797B (zh) * | 2017-04-26 | 2020-08-18 | 天津大学 | 中文微博的热点话题检测及趋势预测方法 |
CN107608953B (zh) * | 2017-07-25 | 2020-08-14 | 同济大学 | 一种基于不定长上下文的词向量生成方法 |
-
2018
- 2018-11-26 CN CN201811418743.5A patent/CN109582771B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109582771A (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN107341145A (zh) | 一种基于深度学习的用户情感分析方法 | |
CN107291914A (zh) | 一种生成搜索引擎查询扩展词的方法及系统 | |
CN112819023A (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
CN110134958B (zh) | 一种基于语义词网络的短文本主题挖掘方法 | |
GB2558718A (en) | Search engine | |
CN110516057B (zh) | 一种信访问题答复方法及装置 | |
Meraz | Hashtag wars and networked framing: The private/public networked protest repertoires of occupy on twitter | |
CN113157886B (zh) | 一种自动问答生成方法、系统、终端及可读存储介质 | |
CN110287329A (zh) | 一种基于商品文本分类的电商类目属性挖掘方法 | |
CN109582771B (zh) | 面向电力领域基于移动应用的智能客户交互方法 | |
CN115840808B (zh) | 科技项目咨询方法、装置、服务器及计算机可读存储介质 | |
CN111723295A (zh) | 一种内容分发方法、装置和存储介质 | |
CN112446210A (zh) | 用户性别预测方法、装置及电子设备 | |
CN112434533A (zh) | 实体消歧方法、装置、电子设备及计算机可读存储介质 | |
CN114372475A (zh) | 一种基于RoBERTa模型的网络舆情情感分析方法及系统 | |
CN111666400A (zh) | 消息获取方法、装置、计算机设备及存储介质 | |
Rahane et al. | Artificial intelligence based solarbot | |
CN110874408B (zh) | 模型训练方法、文本识别方法、装置及计算设备 | |
CN111538817A (zh) | 人机交互方法和装置 | |
CN117312641A (zh) | 智能获取信息的方法、装置、设备及存储介质 | |
CN116186220A (zh) | 信息检索方法、问答处理方法、信息检索装置及系统 | |
CN115545960A (zh) | 一种电子信息数据交互系统及方法 | |
Gupta et al. | Real-time sentiment analysis of tweets: A case study of Punjab elections | |
CN108710650B (zh) | 一种针对论坛文本的主题挖掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |