CN109543182B - 一种基于solr引擎的电力企业多轮交互语义分析方法 - Google Patents

一种基于solr引擎的电力企业多轮交互语义分析方法 Download PDF

Info

Publication number
CN109543182B
CN109543182B CN201811356577.0A CN201811356577A CN109543182B CN 109543182 B CN109543182 B CN 109543182B CN 201811356577 A CN201811356577 A CN 201811356577A CN 109543182 B CN109543182 B CN 109543182B
Authority
CN
China
Prior art keywords
user
word segmentation
word
electric power
information input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811356577.0A
Other languages
English (en)
Other versions
CN109543182A (zh
Inventor
梁哲恒
尚艳伟
林细君
黄晓波
郑杰生
黄杰韬
张金波
曾纪钧
蒋道环
沈桂泉
陈晓江
艾解清
沈伍强
吴勤勤
段福亮
朱功峰
黄载瑜
陈哲瀚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Center of Guangdong Power Grid Co Ltd
Tongfang Technology of Yunnan Power Grid Co Ltd
Original Assignee
Information Center of Guangdong Power Grid Co Ltd
Tongfang Technology of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Center of Guangdong Power Grid Co Ltd, Tongfang Technology of Yunnan Power Grid Co Ltd filed Critical Information Center of Guangdong Power Grid Co Ltd
Priority to CN201811356577.0A priority Critical patent/CN109543182B/zh
Publication of CN109543182A publication Critical patent/CN109543182A/zh
Application granted granted Critical
Publication of CN109543182B publication Critical patent/CN109543182B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Abstract

本发明公开了一种基于solr引擎的电力企业多轮交互语义分析方法,包括步骤:1、接受用户的文字信息输入,根据文字信息输入对用户情绪做初步分析;2、初步分析结果与设定的阈值进行比较,判断是否为狂躁状态;3、初步分析结果结合电力常用词库对用户的文字信息输入进行分词;4、分词后结合用户词库对分词片段进行二次分词;5、二次分词后对分新的分词片段进行语义理解,本发明的方法可以提高语义分析结果的准确度,让用户咨询模块获得更好的用户体验。

Description

一种基于solr引擎的电力企业多轮交互语义分析方法
技术领域
本发明属于汉语自然语言处理、知识管理、自动问答技术领域,特别是涉及一种基于solr引擎的电力企业多轮交互语义分析方法。
背景技术
用户为王的当下,用户体验是不少企业的安身立命之根本。提升用户体验的关键点之一就是即时、随时解决用户的问题,为此,越来越多的企业在服务软件中增加了“在线客服”等模块来随时响应客户需求。另一方面,企业必须在提高客户体验和控制企业人力成本之间找到平衡点。自动应答系统能实现零成本、二十四小时值守,被大部分企业有限采用。
自动应答系统要回答用户提问,首先需要理解用户的问题,即实现自然语言理解,这是智能问答中的重要功能和巨大难题。例如,在电力行业中,对于“怎么又停电了”的用户咨询,其标准答复是首先安抚用户情绪,接下来引导询问或查询用户所在片区是否有停电计划,用户账户是否欠费,待用户回应后,再根据用户不同的情况,进一步引导询问用户的其他资料,当前的业界所采用的技术,主要依赖分词后,用关键词提取的方式猜测用户当下问题中所提到的最核心关键字,并查询原本的问答资料库,将最具有关联性的数种可能提供给用户选择,这种方式存在的核心问题是猜测信息单一、猜中概率低,用户体验差,例如:中国专利申请号为201610790692.3的专利中,公开了一种多轮交互语义理解方法和装置,包括“接收语音数据;对所述语音数据进行切分,得到语音数据片断,以及,对所述语音数据片断进行语音识别,得到当前切分文本数据;根据用户交互的历史数据对当前切分文本数据进行语义理解,得到语义理解结果。”,其中简单的对语音数据进行切分,然后对切分的语音片段进行语义理解,会导致猜测信息单一、猜中概率低的问题。
因此,如何解决上述问题成为本领域人员研究的重点。
发明内容
本发明的目的就是提供一种基于solr引擎的电力企业多轮交互语义分析方法,能有效解决上述核心问题是猜测信息单一、猜中概率低,用户体验差的不足之处。
本发明的目的通过下述技术方案来实现:
一种基于solr引擎的电力企业多轮交互语义分析方法,包括步骤:1)接受用户的文字信息输入,根据文字信息输入对用户情绪做初步分析,初步分析是以词典为依据的基于规则的中文情绪分析方法;
2)初步分析结果与设定的阈值进行比较,判断是否为狂躁状态;
3)初步分析结果结合电力常用词库对用户的文字信息输入进行分词;
4)分词后结合用户词库对分词片段进行二次分词;
5)二次分词后对分新的分词片段进行语义理解。
作为优选,所述初步分析的时候根据客户的情绪情况,结合情绪安抚库对用户输出安抚语。
作为优选,判断用户处于狂躁状态的时候,将个性化浓的部分增加到用户词库中。
作为优选,所述初步分析结果结合电力常用词库对用户的文字信息输入进行分词,此次分词是基于理解的分词方法进行分词,过让计算机模拟人对句子的理解,达到识别词的效果。
作为优选,所述二次分词是基于统计的分词方法,在大量的分词片段的前提下,利用统计机器学习模型学习词语切分的规律,从而实现对未知文本的切分。
作为优选,所述语义理解之后,将符合语义理解最匹配的分词方式获得的新词汇补充到用户词库。
作为优选,用户的文字信息输入为文本交流方式获取。
作为优选,用户的文字信息输入为语音采集、语音识别后得到的文本内容。
与现有技术相比,本发明的有益效果在于:
本发明提出一种基于solr引擎的适合电力行业软件的多轮交互语义分析方法,该方法可以提高语义分析结果的准确度,让用户咨询模块获得更好的用户体验;提出一种基于Solr引擎的多轮交互语义分析装置,实现适合电力行业软件的多轮交互语义分析方法;利用多轮交互语义分析方法,同时输出用户情绪维度的分析结果。
附图说明
图1是多轮交互语义分析方法原理框图;
图2是情绪维度的分析和处理框图;
图3是基于Solr引擎的多轮交互语义分析装置原理框图。
附图标记说明:1-语音采集模块,2-语音识别模块,3-文本上传模块,4-语义分析模块。
具体实施方式
下面结合具体实施例和附图对本发明作进一步的说明。
实施例一
如图1至图3所示,一种基于solr引擎的电力企业多轮交互语义分析方法,包括步骤:1)接受用户的文字信息输入,根据文字信息输入对用户情绪做初步分析;
2)初步分析结果与设定的阈值进行比较,判断是否为狂躁状态,初步分析结果超过设定的阈值则判断为狂躁状态;
3)初步分析结果结合电力常用词库对用户的文字信息输入进行分词,电力常用词库能够弥补常用分词插件专业性方面的不足,电力常用词库如下表;
权重
1.业扩 5
2.户表 4
3.表计 3
4.计量点 2
5.表箱 4
6.电子化移交 2
7.主网 4
8.配网 3
9.电网 2
10.线损 1
11.购售电 5
12网间交易 3
13增容 2
…… ……
4)分词后结合用户词库对分词片段进行二次分词,用户词库根据每个人说话习惯不同,偏向口语化,用户词库如下表;
权重
没来电 5
好多钱 4
…… ……
5)二次分词后对分新的分词片段进行语义理解。
本实施例中,该方法可以提高语义分析结果的准确度,让用户咨询模块获得更好的用户体验,用多轮交互语义分析方法,同时输出用户情绪维度的分析结果。
实施例二
如图1至图3所示,一种基于solr引擎的电力企业多轮交互语义分析方法,包括步骤:1)接受用户的文字信息输入,根据文字信息输入对用户情绪做初步分析,初步分析是以词典为依据的基于规则的中文情绪分析方法,同时在初步分析的时候根据客户的情绪情况,结合情绪安抚库对用户输出安抚语;
2)初步分析结果与设定的阈值进行比较,判断是否为狂躁状态,初步分析结果超过设定的阈值则判断为狂躁状态,判断用户处于狂躁状态的时候,将个性化浓的部分增加到用户词库中;
3)初步分析结果结合电力常用词库对用户的文字信息输入进行分词,初步分析结果结合电力常用词库对用户的文字信息输入进行分词,此次分词是基于理解的分词方法进行分词,过让计算机模拟人对句子的理解,达到识别词的效果,基于理解的分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息,电力常用词库能够弥补常用分词插件专业性方面的不足,电力常用词库如下表;
权重
1.业扩 5
2.户表 4
3.表计 3
4.计量点 2
5.表箱 4
6.电子化移交 2
7.主网 4
8.配网 3
9.电网 2
10.线损 1
11.购售电 5
12网间交易 3
13增容 2
…… ……
4)分词后结合用户词库对分词片段进行二次分词,二次分词是基于统计的分词方法,在大量的分词片段的前提下,利用统计机器学习模型学习词语切分的规律,从而实现对未知文本的切分,用户词库根据每个人说话习惯不同,偏向口语化,用户词库如下表;
权重
没来电 5
好多钱 4
…… ……
5)二次分词后对分新的分词片段进行语义理解,语义理解之后,将符合语义理解最匹配的分词方式获得的新词汇补充到用户词库。
本实施例中,分析用户情绪的同时通过情绪安抚库的安抚词对用户进行安抚,能够使客户的情绪稳定,有助于解决客户的问题,使客户的体验性更好。
实施例三
如图1至图3所示,一种基于solr引擎的电力企业多轮交互语义分析方法,包括步骤:1)接受用户的文字信息输入,根据文字信息输入对用户情绪做初步分析,用户的文字信息输入为文本交流方式获取或者文字信息输入为语音采集、语音识别后得到的文本内容;
2)初步分析结果与设定的阈值进行比较,判断是否为狂躁状态,初步分析结果超过设定的阈值则判断为狂躁状态;
3)初步分析结果结合电力常用词库对用户的文字信息输入进行分词,电力常用词库能够弥补常用分词插件专业性方面的不足,电力常用词库如下表;
Figure BDA0001866239160000071
Figure BDA0001866239160000081
4)分词后结合用户词库对分词片段进行二次分词,用户词库根据每个人说话习惯不同,偏向口语化,用户词库如下表;
权重
没来电 5
好多钱 4
…… ……
5)二次分词后对分新的分词片段进行语义理解。
本实施例中,提出基于Solr引擎的多轮交互语义分析装置,实现适合电力行业软件的多轮交互语义分析方法,使猜测信息的范围更广,猜对的概率更高。
实施例四
如图1至图3所示,一种基于solr引擎的电力企业多轮交互语义分析方法及分析装置,分析方法包括步骤:1)接受用户的文字信息输入,根据文字信息输入对用户情绪做初步分析;
2)初步分析结果与设定的阈值进行比较,判断是否为狂躁状态,初步分析结果超过设定的阈值则判断为狂躁状态;
3)初步分析结果结合电力常用词库对用户的文字信息输入进行分词,电力常用词库能够弥补常用分词插件专业性方面的不足,电力常用词库如下表;
权重
1.业扩 5
2.户表 4
3.表计 3
4.计量点 2
5.表箱 4
6.电子化移交 2
7.主网 4
8.配网 3
9.电网 2
10.线损 1
11.购售电 5
12网间交易 3
13增容 2
…… ……
4)分词后结合用户词库对分词片段进行二次分词,用户词库根据每个人说话习惯不同,偏向口语化,用户词库如下表;
权重
没来电 5
好多钱 4
…… ……
5)二次分词后对分新的分词片段进行语义理解。
分析装置包括语音采集模块1、语音识别模块2、文本上传模块3、语义分析模块4,其中语音采集模块1连接语音识别模块2,语音识别模块2和文本上传模块3连接语音分析模块4,整个分析装置基于Solr引擎设计,语义分析模4块是适合电力行业软件的多轮交互语义分析方法的具体实现,本模块的运行依赖用户表达出的信息。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:包括步骤:1)接受用户的文字信息输入,根据文字信息输入对用户情绪做初步分析,初步分析是以词典为依据的基于规则的中文情绪分析方法;
2)初步分析结果与设定的阈值进行比较,判断是否为狂躁状态;
3)初步分析结果结合电力常用词库对用户的文字信息输入进行分词;
4)分词后结合用户词库对分词片段进行二次分词;
5)二次分词后对分新的分词片段进行语义理解。
2.根据权利要求1所述的一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:所述初步分析的时候根据客户的情绪情况,结合情绪安抚库对用户输出安抚语。
3.根据权利要求1所述的一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:判断用户处于狂躁状态的时候,将个性化浓的部分增加到用户词库中。
4.根据权利要求1所述的一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:所述初步分析结果结合电力常用词库对用户的文字信息输入进行分词,此次分词是基于理解的分词方法进行分词,过让计算机模拟人对句子的理解,达到识别词的效果。
5.根据权利要求1所述的一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:所述二次分词是基于统计的分词方法,在大量的分词片段的前提下,利用统计机器学习模型学习词语切分的规律,从而实现对未知文本的切分。
6.根据权利要求1所述的一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:所述语义理解之后,将符合语义理解最匹配的分词方式获得的新词汇补充到用户词库。
7.根据权利要求1所述的一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:用户的文字信息输入为文本交流方式获取。
8.根据权利要求1所述的一种基于solr引擎的电力企业多轮交互语义分析方法,其特征在于:用户的文字信息输入为语音采集、语音识别后得到的文本内容。
CN201811356577.0A 2018-11-15 2018-11-15 一种基于solr引擎的电力企业多轮交互语义分析方法 Active CN109543182B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811356577.0A CN109543182B (zh) 2018-11-15 2018-11-15 一种基于solr引擎的电力企业多轮交互语义分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811356577.0A CN109543182B (zh) 2018-11-15 2018-11-15 一种基于solr引擎的电力企业多轮交互语义分析方法

Publications (2)

Publication Number Publication Date
CN109543182A CN109543182A (zh) 2019-03-29
CN109543182B true CN109543182B (zh) 2023-04-07

Family

ID=65847505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811356577.0A Active CN109543182B (zh) 2018-11-15 2018-11-15 一种基于solr引擎的电力企业多轮交互语义分析方法

Country Status (1)

Country Link
CN (1) CN109543182B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347808A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个电子商务网站智能机器人客服构建方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229612A (zh) * 2017-05-24 2017-10-03 重庆誉存大数据科技有限公司 一种网络信息语义倾向分析方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354708A (zh) * 2015-07-13 2017-01-25 中国电力科学研究院 一种基于用电信息采集系统的客户互动信息搜索引擎系统
CN105893344A (zh) * 2016-03-28 2016-08-24 北京京东尚科信息技术有限公司 基于用户语义情感分析的应答方法和装置
CN106528522A (zh) * 2016-08-26 2017-03-22 南京威卡尔软件有限公司 场景化的语义理解与对话生成方法及系统
CN109429522A (zh) * 2016-12-06 2019-03-05 吉蒂机器人私人有限公司 语音交互方法、装置及系统
CN107015969A (zh) * 2017-05-19 2017-08-04 四川长虹电器股份有限公司 可自我更新的语义理解系统与方法
CN108255956B (zh) * 2017-12-21 2020-04-03 北京声智科技有限公司 基于历史数据及机器学习自适应获取词库领域的方法及系统
CN108197115B (zh) * 2018-01-26 2022-04-22 上海智臻智能网络科技股份有限公司 智能交互方法、装置、计算机设备和计算机可读存储介质
CN108427722A (zh) * 2018-02-09 2018-08-21 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229612A (zh) * 2017-05-24 2017-10-03 重庆誉存大数据科技有限公司 一种网络信息语义倾向分析方法及系统

Also Published As

Publication number Publication date
CN109543182A (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
CN108304372B (zh) 实体提取方法和装置、计算机设备和存储介质
CN111125334B (zh) 一种基于预训练的搜索问答系统
CN113704451B (zh) 一种电力用户诉求筛选方法、系统、电子设备和存储介质
CN110717018A (zh) 一种基于知识图谱的工业设备故障维修问答系统
CN111325029B (zh) 一种基于深度学习集成模型的文本相似度计算方法
CN106354835A (zh) 基于上下文语义理解的人工对话辅助系统
US20230394247A1 (en) Human-machine collaborative conversation interaction system and method
CN115858758A (zh) 一种多非结构化数据识别的智慧客服知识图谱系统
CN111414746A (zh) 一种匹配语句确定方法、装置、设备及存储介质
CN111079384B (zh) 一种用于智能质检服务禁语的识别方法及系统
CN115759119A (zh) 一种金融文本情感分析方法、系统、介质和设备
CN114969297A (zh) 一种电力客户诉求相关度分析方法
CN113486174B (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN111368540A (zh) 一种基于语义角色分析的关键词信息抽取方法
CN109543182B (zh) 一种基于solr引擎的电力企业多轮交互语义分析方法
CN104750676A (zh) 机器翻译处理方法及装置
CN111783424B (zh) 一种文本分句方法和装置
WO2023207566A1 (zh) 语音房质量评估方法及其装置、设备、介质、产品
TWI734085B (zh) 使用意圖偵測集成學習之對話系統及其方法
CN115310429B (zh) 一种多轮倾听对话模型中的数据压缩与高性能计算方法
CN112926340B (zh) 一种用于知识点定位的语义匹配模型
CN116186259A (zh) 一种会话线索评分方法、装置、设备及存储介质
CN110728131A (zh) 一种分析文本属性的方法和装置
CN114064873A (zh) 保险领域faq知识库构建方法、装置及电子设备
CN111460106A (zh) 一种信息交互方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant