CN117435716A - 电网人机交互终端的数据处理方法及系统 - Google Patents

电网人机交互终端的数据处理方法及系统 Download PDF

Info

Publication number
CN117435716A
CN117435716A CN202311758316.2A CN202311758316A CN117435716A CN 117435716 A CN117435716 A CN 117435716A CN 202311758316 A CN202311758316 A CN 202311758316A CN 117435716 A CN117435716 A CN 117435716A
Authority
CN
China
Prior art keywords
information
context information
intention
user
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311758316.2A
Other languages
English (en)
Inventor
章杜锡
杨平
豆书亮
张锋
张霁明
周洋
周飞
管金胜
杨跃平
焦旭明
郑建梓
盛海静
彭昊杰
陈超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yongyao Science And Technology Branch Of Ningbo Transmission And Transfer Construction Co ltd
Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Yongyao Science And Technology Branch Of Ningbo Transmission And Transfer Construction Co ltd
Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yongyao Science And Technology Branch Of Ningbo Transmission And Transfer Construction Co ltd, Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical Yongyao Science And Technology Branch Of Ningbo Transmission And Transfer Construction Co ltd
Priority to CN202311758316.2A priority Critical patent/CN117435716A/zh
Publication of CN117435716A publication Critical patent/CN117435716A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明提供一种电网人机交互终端的数据处理方法及系统,涉及数据处理技术领域,包括:通过语音识别引擎将用户的语音信息转换为转录文本,将转录文本通过自然语言处理技术进行分析,得到依存关系图,通过预设的递归神经网络编辑对话历史,根据对话历史确定对话上下文信息;通过意图识别模型识别将对话上下文信息转换为嵌入向量,通过意图识别模型的位置编码层和自注意力层对对话上下文信息进行分析,结合意图识别损失函数,得到用户意图;将用户意图和对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据匹配信息生成回应文本。

Description

电网人机交互终端的数据处理方法及系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种电网人机交互终端的数据处理方法及系统。
背景技术
电网人机交互终端的数据分析对电网发展至关重要,随着电力系统规模的不断扩大和智能化水平的提升,需要实时监控、智能调度和高效管理电网运行。
现有技术中,例如CN112346945A公开了一种人机交互数据分析方法及装置,所述方法包括:获取人机交互数据;获取各设备数据的一种或多种数据值域区间组合,每个数据值域区间的组合对应一种行为或行为特征,对各行为或行为特征分别设置对应的行为编码;将人机交互数据按照各数据值域区间的组合转换为包含时间戳以及对应的行为编码的一级行为数组;将一级行为数组中时间戳连续且行为编码相同的数组合并,得到二级行为数组;统计每种行为编码在二级行为数组中出现的频次、最小持续时间、最大持续时间、平均持续时间和总持续时间中的一种或多种,以分析评价人机交互行为的特点。
综上,现有技术虽然能够实现对人机交互终端进行数据分析,但仅限于从系统中获得交互数据,无法直接获取用户需求,分析用户意图,因此需要一种方案解决现有技术中存在的不足。
发明内容
本发明实施例提供一种电网人机交互终端的数据处理方法及系统,用于根据用户需求对人机交互系统进行数据分析和人机交互服务优化。
本发明实施例的第一方面,提供一种电网人机交互终端的数据处理方法,包括:
通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图,通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息;
通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图;
将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本。
在一种可选的实施方式中,
所述通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图包括:
获取用户的语音信息,通过语音识别引擎将所述语音信息转换为转录文本;
通过自然语言处理技术对所述转录文本进行分词操作,将所述转录文本分割为单词和标记,并为每个单词和标记分配词性,识别单词中的命名实体;
根据所述单词,单词对应的词性和所述命名实体,通过句法分析模型分析所述转录文本中词汇间的依赖关系,生成依存关系图。
在一种可选的实施方式中,
所述根据所述单词,单词对应的词性和所述命名实体,通过句法分析模型分析所述转录文本中词汇间的依赖关系,生成依存关系图包括:
初始化队列,语法栈和初始依存关系图,获取所述转录文本中的全部单词并加入输入队列;
根据当前状态和语法规则,在移动,左依存关系和右依存关系中进行选择;
若选择移动,则将所述输入队列中第一个单词添加至所述语法栈中,若选择左依存关系,则建立左依存关系,出栈所述语法栈的栈顶单词,若选择右依存关系,则建立右依存关系,出栈所述语法栈的栈底单词;
每执行一次左依存关系或右依存关系后,更新初始依存关系图并将建立的依存弧添加至所述初始依存关系图中,其中,在所述依存关系图中,节点代表单词,边代表依存关系;
重复选择并执行操作,直至所述输入队列为空且所述语法栈内只剩一个单词,得到依存关系图。
在一种可选的实施方式中,
所述通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息包括:
获取转录文本,通过编码器对所述转录文本进行编码,生成初始输入序列;
在每个时间步,所述递归神经网络接收当前时间步的输入和上一时间步的隐藏状态,通过激活函数生成当前时间步的隐藏状态;
在每个时间步重复操作,生成输出序列,即对话历史,其中最后一个时间步的隐藏状态即为所述对话上下文信息。
在一种可选的实施方式中,
所述通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图包括:
获取所述对话上下文信息,随机生成训练文本,在所述意图识别模型的输入层后添加嵌入层,将所述对话上下文信息中的文本信息转换为密集的嵌入向量,所述位置编码层通过创建位置嵌入矩阵生成位置嵌入,将所述位置编码层的位置编码与嵌入向量相加,得到包含位置信息的输入信息;
所述意图识别模型的自注意力层根据所述输入信息确定自注意力机制中多头注意力的数量,根据所述多头注意力将所述对话上下文信息分割成多个子表示,对于每个子表示,创建对应的注意力机制,对于每个注意力头的输出进行加权求和,获得多头注意力输出;
根据所述多头注意力输出以及所述对话上下文信息,将用户意图和对话上下文信息作为损失函数的目标,生成损失函数,并根据所述损失函数,计算得到所述用户意图。
在一种可选的实施方式中,
所述根据所述多头注意力输出以及所述对话上下文信息,将用户意图和对话上下文信息作为损失函数的目标,生成损失函数,并根据所述损失函数,计算得到所述用户意图如下公式所示:
其中,L m表示损失函数,α表示意图权重系数,C表示意图类别的数量,y i表示真实标签中类别c的标签,y i0表示模型的预测概率,β表示上下文权重,T表示文本长度,y to表示模型在t时刻的生成概率。
在一种可选的实施方式中,
所述将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本包括:
确定所述电网知识图谱的知识范围,根据所述知识范围收集数据并进行数据清理,通过自然语言处理技术对收集到的文本信息进行处理,提取电网信息实体并抽取所述电网信息实体间的关系,根据所述电网信息实体和电网实体间的关系生成三元组,根据所述三元组生成对应的电网指示图谱;
将所述用户意图和所述对话上下文信息转换为特征序列,根据所述特征序列通过所述双向搜索算法确定搜索的起始节点,将所述起始节点添加至搜索栈中,从搜索栈中弹出当前节点并确定是否与所述用户意图匹配,若匹配则记录信息并继续搜索所述当前节点的相邻节点,若所述相邻节点是与所述当前节点有关系的节点,则将所述相邻节点添加至所述搜索栈中,继续搜索,直至所述搜索栈为空;
汇总匹配结果,根据所述匹配结果生成对应的回应文本并将所述回应文本返回至用户。
本发明实施例的第二方面,提供一种电网人机交互终端的数据处理系统,包括:
第一单元,用于通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图,通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息;
第二单元,用于通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图;
第三单元,用于将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明通过语音识别引擎实现语音到文本的转换,使得用户可以通过语音与系统进行交互,提高了交互的灵活性,满足用户多样化的输入方式,通过递归神经网络对对话历史进行编辑,确定对话上下文信息,有助于建模对话历史中的长期依赖关系,提高了对话上下文的连贯性,通过双向搜索算法对电网知识图谱进行检索,系统能够根据用户意图和对话上下文信息在知识图谱中精准地找到匹配信息,提高了系统在复杂领域中的问题解决能力,通过预先构建的电网知识图谱,系统能够实时检索并获取与用户查询相关的电网信息,提高了系统对实时数据的处理和响应能力,综上,本发明充分利用了自然语言处理、神经网络和知识图谱检索等技术手段,从而提供更智能、精准的服务,为用户提供更好的交互体验。
附图说明
图1为本发明实施例电网人机交互终端的数据处理方法的流程示意图;
图2为本发明实施例电网人机交互终端的数据处理系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例电网人机交互终端的数据处理方法的流程示意图,如图1所示,所述方法包括:
S1.通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图,通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息;
所述语音识别引擎是一种计算机程序或系统,能够将语音信号转换为文本形式,所述转录文本是通过语音识别引擎从语音信号中生成的文本表示,提供了语音数据的可操作形式,为自然语言处理和其他文本分析任务提供输入,所述自然语言处理技术是一门计算机科学领域,关注计算机如何理解、分析和生成人类语言,包括文本分析、语义理解、机器翻译、情感分析等任务,使计算机能够处理和理解自然语言,所述递归神经网络是一种深度学习模型,专门用于处理序列数据,具有递归结构,能够捕捉序列数据中的依赖关系,对上下文信息进行建模。
在一种可选的实施方式中,
所述通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图包括:
获取用户的语音信息,通过语音识别引擎将所述语音信息转换为转录文本;
通过自然语言处理技术对所述转录文本进行分词操作,将所述转录文本分割为单词和标记,并为每个单词和标记分配词性,识别单词中的命名实体;
根据所述单词,单词对应的词性和所述命名实体,通过句法分析模型分析所述转录文本中词汇间的依赖关系,生成依存关系图。
所述分词操作是将一段连续的文本切分成单独的词语或词汇单元的过程,所述命名实体是文本中具有特定语义类别的词汇单元,通常表示人名、地名、组织名等命名的实体,所述依存关系图表示句子中词与词之间的语法关系,即一个词如何与句子中的其他词相互关联,其中节点表示词语,边表示词语之间的依存关系,依存关系包括主谓关系、动宾关系、定中关系等,描述了句子中各个成分之间的语法关系。
用户通过语音输入设备(如麦克风)提供语音信息,使用语音识别引擎将用户的语音信息转换为文本形式,即转录文本;
对转录文本进行分词操作,将文本切分为单词和标点符号,为每个单词和标点符号分配词性标记,例如名词、动词、形容词等,进行命名实体识别,识别和标记文本中的命名实体,如人名、地名、组织名等;
利用句法分析模型对转录文本进行分析,建立词汇之间的依赖关系,生成依存关系图,其中节点表示单词,边表示依存关系,如主谓关系、动宾关系等,利用依存关系图和命名实体信息进行语义关系分析,根据句法结构和词汇之间的关系,推断得到语义关系。
本实施例中,通过语音识别引擎,准确地将用户的语音信息转换为文本,降低了由于语音输入引起的错误,利用自然语言处理技术,分词和词性标注有助于更准确地理解用户输入的意图,命名实体识别能够识别关键信息,如电网设备、地点等,结合语义关系分析和电网设备信息,可以实现对电网状态的故障诊断,综上,本实施例能够提供更智能、灵活和高效的交互方式,使得终端更好地满足用户需求,提高系统的智能化水平。
在一种可选的实施方式中,
所述根据所述单词,单词对应的词性和所述命名实体,通过句法分析模型分析所述转录文本中词汇间的依赖关系,生成依存关系图包括:
初始化队列,语法栈和初始依存关系图,获取所述转录文本中的全部单词并加入输入队列;
根据当前状态和语法规则,在移动,左依存关系和右依存关系中进行选择;
若选择移动,则将所述输入队列中第一个单词添加至所述语法栈中,若选择左依存关系,则建立左依存关系,出栈所述语法栈的栈顶单词,若选择右依存关系,则建立右依存关系,出栈所述语法栈的栈底单词;
每执行一次左依存关系或右依存关系后,更新初始依存关系图并将建立的依存弧添加至所述初始依存关系图中,其中,在所述依存关系图中,节点代表单词,边代表依存关系;
重复选择并执行操作,直至所述输入队列为空且所述语法栈内只剩一个单词,得到依存关系图。
所述语法栈是一个用于存储句子中各个单词的数据结构,它按照一定的规则进行操作,以生成句法结构,所述左依存关系表示一个词与其左侧的另一个词存在依存关系,即当前词是其左侧词的依存成分,所述右依存关系表示一个词与其右侧的另一个词存在依存关系,即当前词是其右侧词的依存成分,所述栈顶单词是指语法栈中位于栈顶的单词,即最后压入栈中的单词,所述栈底单词是指语法栈中位于栈底的特殊标记或单词,表示栈的底部,所述依存弧是句法分析中用于表示词语之间依存关系的概念,依存弧是一种有向边,连接着句子中的两个词,表示一个词是另一个词的修饰语或从属成分。
初始化语法栈为空,初始化初始依存关系图为空,从转录文本中提取全部单词,并加入输入队列;
当输入队列不为空时,根据当前状态和语法规则,选择移动、左依存关系或右依存关系的操作;
如果选择移动,将输入队列中第一个单词添加至语法栈,从输入队列中移除该单词,如果选择左依存关系,在语法栈的栈顶和栈底单词之间建立左依存关系,出栈语法栈的栈顶单词,更新依存关系图,将左依存关系添加至图中,如果选择右依存关系,在语法栈的栈底和栈顶单词之间建立右依存关系,出栈语法栈的栈底单词,更新依存关系图,将右依存关系添加至图中;
将由于更新依存关系产生的依存弧添加至所述初始依存关系图中,终止条件为输入队列为空且语法栈内只剩一个单词,得到最终的依存关系图,其中节点代表单词,边代表依存关系。
本实施例中,通过初始化队列、语法栈和初始依存关系图,以及执行移动、左依存关系和右依存关系的操作,系统能够更全面地理解用户输入的文本的结构和含义,有助于准确地分析用户的问题或指令,从而提高系统对用户意图的理解能力,依存关系图提供了更形象、更直观的方式来表示句子中单词之间的关系,有助于更深入地理解语法和语义结构,在每次执行左依存关系或右依存关系后,系统会更新初始依存关系图,将新建立的依存弧添加至图中,在每次执行左依存关系或右依存关系后,系统会更新初始依存关系图,将新建立的依存弧添加至图中,综上,本实施例有助于提高系统对用户输入的理解能力,为电网人机交互终端提供更智能、更高效的数据处理和交互体验。
在一种可选的实施方式中,
所述通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息包括:
获取转录文本,通过编码器对所述转录文本进行编码,生成初始输入序列;
在每个时间步,所述递归神经网络接收当前时间步的输入和上一时间步的隐藏状态,通过激活函数生成当前时间步的隐藏状态;
在每个时间步重复操作,生成输出序列,即对话历史,其中最后一个时间步的隐藏状态即为所述对话上下文信息。
获取预先得到的转录文本,使用训练好的编码器对转录文本进行编码,将文本序列转换为向量形式,形成初始输入序列;
对于每个时间步(词语或字符),将当前时间步的输入和上一时间步的隐藏状态输入到递归神经网络中,使用激活函数生成当前时间步的隐藏状态,重复操作直至处理完整个输入序列;
在每个时间步,记录递归神经网络的隐藏状态,形成输出序列,也即对话历史,其中,最后一个时间步的隐藏状态即为对话上下文信息,包含了整个对话历史的编码信息。
本实施例中,通过使用递归神经网络对转录文本进行编码,系统能够有效地捕捉对话历史中的语法结构和语义信息,通过生成输出序列,尤其是提取最后一个时间步的隐藏状态,系统得到了对话上下文信息,为后续的语义理解和任务执行提供了有力的基础,通过对转录文本进行编码,系统可以学习和适应电网领域的特定语境和术语,有助于提高系统对电网人机交互中特定问题和任务的处理能力,使得数据分析更具有针对性,综上,本实施例有助于提高系统的理解能力和任务执行效果,使得交互更加智能、灵活和用户友好。
S2.通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图;
所述嵌入向量是将离散的词汇表达为实数向量的方式,通过嵌入层进行学习,所述位置编码层是指在自注意力模型中,为了处理输入序列的顺序信息,引入位置编码,以在词嵌入中添加位置信息的层,所述自注意力层通常用于在处理输入序列时分配不同的注意力权重给序列中的不同位置,使得模型能够关注到重要的部分,所述意图识别损失函数通常用于衡量模型对于预测用户意图的准确性,所述意图识别模型是一种用于从文本中识别用户意图的深度学习模型。
在一种可选的实施方式中,
所述通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图包括:
获取所述对话上下文信息,随机生成训练文本,在所述意图识别模型的输入层后添加嵌入层,将所述对话上下文信息中的文本信息转换为密集的嵌入向量,所述位置编码层通过创建位置嵌入矩阵生成位置嵌入,将所述位置编码层的位置编码与嵌入向量相加,得到包含位置信息的输入信息;
所述意图识别模型的自注意力层根据所述输入信息确定自注意力机制中多头注意力的数量,根据所述多头注意力将所述对话上下文信息分割成多个子表示,对于每个子表示,创建对应的注意力机制,对于每个注意力头的输出进行加权求和,获得多头注意力输出;
根据所述多头注意力输出以及所述对话上下文信息,将用户意图和对话上下文信息作为损失函数的目标,生成损失函数,并根据所述损失函数,计算得到所述用户意图。
所述多头注意力是一种注意力机制的变体,通过使用多个并行的注意力头来学习不同方面的表示,每个头都学到了输入的不同子空间,所述位置嵌入矩阵用于为输入序列中的每个位置提供位置信息,所述嵌入向量是将离散的词汇或位置表示为实数向量的形式。通过嵌入层进行学习,所述自注意力机制是一种用于处理序列数据的机制,允许输入序列的每个元素都能够关注其他元素的信息,并赋予不同元素不同的注意力权重。
从交互中获取对话上下文信息,包括用户的先前输入和系统的响应,针对意图识别的训练,生成包含随机意图标签的训练文本,将对话上下文信息中的文本信息送入嵌入层,嵌入层将文本中的单词映射为密集的嵌入向量,创建位置嵌入矩阵,其中每一行对应一个位置的位置嵌入,根据对话上下文信息中文本的长度,为每个位置生成对应的位置嵌入,将嵌入向量和位置嵌入相加,得到包含位置信息的输入信息;
通过模型超参数或自动调整方法确定多头注意力的数量,将对话上下文信息(已经包含位置信息的嵌入向量)分割成多个子表示,每个子表示用于一个注意力头的处理,为每个子表示创建独立的注意力机制,包括查询、键和值的线性映射,对于每个注意力头,将查询、键和值传入注意力机制,计算注意力分数,然后将注意力权重应用于值,得到每个头的输出,将多个注意力头的输出进行连接或拼接,形成多头注意力的最终输出,记为多头注意力输出;
将多头注意力输出输入到意图分类层,生成用户意图的预测,使用真实的意图标签与预测的意图标签之间的差异计算损失函数,使用反向传播算法和优化器,通过最小化损失函数来更新模型参数,以提高模型性能,最终得到用户意图。
本实施例中,通过嵌入层将对话上下文信息中的文本信息转换为密集的嵌入向量,有助于将原始文本数据表示为模型能够理解的连续向量形式,捕捉文本信息的语义和语境,通过位置编码层引入了位置嵌入矩阵,解决了自注意力模型无法处理序列顺序信息的问题,能够更好地理解对话上下文中不同位置的单词之间的关系,通过多头注意力机制,对对话上下文信息进行了多方面的建模,分别捕捉了不同方面的信息,利用多头注意力的输出,以及对话上下文信息,构建了损失函数,将用户意图和对话上下文信息作为目标,通过优化损失函数,意图识别模型可以学习更好地将输入映射到正确的用户意图,综上,本实施例提高了对话上下文的建模能力,增强了模型对复杂电网人机交互场景的理解和处理能力。
在一种可选的实施方式中,
所述根据所述多头注意力输出以及所述对话上下文信息,将用户意图和对话上下文信息作为损失函数的目标,生成损失函数,并根据所述损失函数,计算得到所述用户意图如下公式所示:
其中,L m表示损失函数,α表示意图权重系数,C表示意图类别的数量,y i表示真实标签中类别c的标签,y i0表示模型的预测概率,β表示上下文权重,T表示文本长度,y to表示模型在t时刻的生成概率。
本函数中,通过比较模型的预测概率和真实标签的概率分布,对模型的意图分类性能进行了衡量,模型能够学习准确地分类用户意图,使得在电网人体交互终端中,系统能够更好地理解和响应用户的指令,通过计算模型在每个时刻生成文本的概率的负对数似然,得到文本生成任务的损失,在生成对话上下文时更加准确,捕捉上下文中的语义信息,使得系统生成的回复更自然、合理,综上,本函数在综合考虑多个任务的情况下,有助于提高电网人体交互终端的数据分析方法中模型的性能,使得模型更适应于处理多样性的用户输入和任务要求。
S3.将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本。
所述特征序列是指在电网人机交互终端中提取的与任务相关的一系列特征值,这些特征值可以表示用户的输入、对话历史或其他与任务有关的信息,所述双向搜索算法是一种搜索策略,同时从起始状态和目标状态开始搜索,以期望在搜索空间中更高效地找到解决方案,所述电网知识图谱是一个包含电网领域相关知识的图形结构,其中节点表示不同的实体(例如设备、操作、状态等),边表示它们之间的关系。
在一种可选的实施方式中,
所述将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本包括:
确定所述电网知识图谱的知识范围,根据所述知识范围收集数据并进行数据清理,通过自然语言处理技术对收集到的文本信息进行处理,提取电网信息实体并抽取所述电网信息实体间的关系,根据所述电网信息实体和电网实体间的关系生成三元组,根据所述三元组生成对应的电网指示图谱;
将所述用户意图和所述对话上下文信息转换为特征序列,根据所述特征序列通过所述双向搜索算法确定搜索的起始节点,将所述起始节点添加至搜索栈中,从搜索栈中弹出当前节点并确定是否与所述用户意图匹配,若匹配则记录信息并继续搜索所述当前节点的相邻节点,若所述相邻节点是与所述当前节点有关系的节点,则将所述相邻节点添加至所述搜索栈中,继续搜索,直至所述搜索栈为空;
汇总匹配结果,根据所述匹配结果生成对应的回应文本并将所述回应文本返回至用户。
定义电网知识图谱所要涵盖的领域,包括电网设备、操作规程、状态信息,从各种数据源中收集与电网领域相关的数据,包括文档、报告、数据库、实时监测数据,进行数据清理,包括去除重复数据、处理缺失值、纠正错误数据等,以确保数据的质量和一致性,利用自然语言处理技术对文本信息进行处理,包括分词、词性标注、实体识别,通过实体识别技术,提取文本中的电网相关实体,例如电网设备(变压器、开关)、操作指令、电网状态,利用关系抽取技术,分析文本中描述的实体间关系,例如设备之间的连接关系、操作指令和设备的关联关系,根据提取的电网信息实体和关系,构建三元组表示实体之间的关系,将生成的三元组用于构建电网指示图谱,其中节点表示电网信息实体,边表示它们之间的关系,将构建好的电网知识图谱存储在相应的数据库中,并提供查询接口;
将用户意图和对话上下文信息编码为特征序列,包括将文本信息转换为词嵌入向量、提取关键词、整合上下文历史,使用双向搜索算法,确定起始节点,其中起始节点是与用户意图相关的实体,关键词或对话上下文中的特定状态或节点,初始化搜索栈,并将起始节点添加至搜索栈中,从搜索栈中弹出当前节点,检查当前节点是否与用户意图匹配,若匹配则记录相关信息,获取当前节点的相邻节点,可能是与当前节点有关系的节点,对相邻节点进行匹配和记录,将匹配的相邻节点添加至搜索栈中,若搜索栈为空,终止搜索过程;
将在搜索过程中记录的匹配结果进行汇总,包括找到的关键节点、关系、路径等信息,根据匹配结果的类型,确定系统应该生成的回应类型,根据匹配结果中的信息,构建回应文本的内容,包括从知识图谱中提取的信息、系统的解释或建议,考虑个性化的因素,例如用户的偏好、历史对话记录,生成更贴近用户期望的回应,将生成的回应文本返回至用户,作为对用户查询的响应。
本实施例中,通过确定电网知识图谱的知识范围,数据的收集和清理确保了知识图谱中的信息精准和全面,自然语言处理技术的应用使得从文本中提取电网信息实体和关系更为准确,双向搜索算法的使用增加了系统在知识图谱中搜索的灵活性,能够根据用户意图和对话上下文信息确定起始节点,并通过搜索栈的迭代过程高效地找到相关信息,有助于提高系统响应速度和搜索效率,将用户意图和对话上下文信息转换为特征序列,并通过搜索算法匹配知识图谱中的节点,使得匹配结果更为准确,系统通过多样化的回应文本生成,提升了用户体验,使得系统回应更富有表现力和适应性,综上,本实施例提高了系统对用户查询的理解和响应能力,从而提升了整体的技术效果。
图2为本发明实施例电网人机交互终端的数据处理系统的结构示意图,如图2所示,所述方法包括:
第一单元,用于通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图,通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息;
第二单元,用于通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图;
第三单元,用于将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本。
本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.电网人机交互终端的数据处理方法,其特征在于,包括:
通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图,通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息;
通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图;
将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本。
2.根据权利要求1所述的方法,其特征在于,所述通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图包括:
获取用户的语音信息,通过语音识别引擎将所述语音信息转换为转录文本;
通过自然语言处理技术对所述转录文本进行分词操作,将所述转录文本分割为单词和标记,并为每个单词和标记分配词性,识别单词中的命名实体;
根据所述单词,单词对应的词性和所述命名实体,通过句法分析模型分析所述转录文本中词汇间的依赖关系,生成依存关系图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述单词,单词对应的词性和所述命名实体,通过句法分析模型分析所述转录文本中词汇间的依赖关系,生成依存关系图包括:
初始化队列,语法栈和初始依存关系图,获取所述转录文本中的全部单词并加入输入队列;
根据当前状态和语法规则,在移动、左依存关系和右依存关系中进行选择;
若选择移动,则将所述输入队列中第一个单词添加至所述语法栈中,若选择左依存关系,则建立左依存关系,出栈所述语法栈的栈顶单词,若选择右依存关系,则建立右依存关系,出栈所述语法栈的栈底单词;
每执行一次左依存关系或右依存关系后,更新初始依存关系图并将建立的依存弧添加至所述初始依存关系图中,其中,在所述依存关系图中,节点代表单词,边代表依存关系;
重复选择并执行操作,直至所述输入队列为空且所述语法栈内只剩一个单词,得到依存关系图。
4.根据权利要求1所述的方法,其特征在于,所述通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息包括:
获取所述转录文本,通过编码器对所述转录文本进行编码,生成初始输入序列;
在每个时间步,所述递归神经网络接收当前时间步的输入和上一时间步的隐藏状态,通过激活函数生成当前时间步的隐藏状态;
在每个时间步重复操作,生成输出序列,即对话历史,其中最后一个时间步的隐藏状态即为所述对话上下文信息。
5.根据权利要求1所述的方法,其特征在于,所述通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图包括:
获取所述对话上下文信息,随机生成训练文本,在所述意图识别模型的输入层后添加嵌入层,将所述对话上下文信息中的文本信息转换为密集的嵌入向量,所述位置编码层通过创建位置嵌入矩阵生成位置嵌入,将所述位置编码层的位置编码与嵌入向量相加,得到包含位置信息的输入信息;
所述意图识别模型的自注意力层根据所述输入信息确定自注意力机制中多头注意力的数量,根据所述多头注意力将所述对话上下文信息分割成多个子表示,对于每个子表示,创建对应的注意力机制,对于每个注意力头的输出进行加权求和,获得多头注意力输出;
根据所述多头注意力输出以及所述对话上下文信息,将用户意图和对话上下文信息作为损失函数的目标,生成损失函数,并根据所述损失函数,计算得到所述用户意图。
6.根据权利要求5所述的方法,其特征在于,所述根据所述多头注意力输出以及所述对话上下文信息,将用户意图和对话上下文信息作为损失函数的目标,生成损失函数,并根据所述损失函数,计算得到所述用户意图如下公式所示:
其中,L m表示损失函数,α表示意图权重系数,C表示意图类别的数量,y i表示真实标签中类别c的标签,y i0表示模型的预测概率,β表示上下文权重,T表示文本长度,y to表示模型在t时刻的生成概率。
7.根据权利要求1所述的方法,其特征在于,所述将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本包括:
确定所述电网知识图谱的知识范围,根据所述知识范围收集数据并进行数据清理,通过自然语言处理技术对收集到的文本信息进行处理,提取电网信息实体并抽取所述电网信息实体间的关系,根据所述电网信息实体和电网实体间的关系生成三元组,根据所述三元组生成对应的电网指示图谱;
将所述用户意图和所述对话上下文信息转换为特征序列,根据所述特征序列通过所述双向搜索算法确定搜索的起始节点,将所述起始节点添加至搜索栈中,从搜索栈中弹出当前节点并确定是否与所述用户意图匹配,若匹配则记录信息并继续搜索所述当前节点的相邻节点,若所述相邻节点是与所述当前节点有关系的节点,则将所述相邻节点添加至所述搜索栈中,继续搜索,直至所述搜索栈为空;
汇总匹配结果,根据所述匹配结果生成对应的回应文本并将所述回应文本返回至用户。
8.电网人机交互终端的数据处理系统,其特征在于,包括:
第一单元,用于通过语音识别引擎将用户的语音信息转换为转录文本,将所述转录文本通过自然语言处理技术进行分析,得到依存关系图,通过预设的递归神经网络编辑对话历史,根据所述对话历史确定对话上下文信息;
第二单元,用于通过意图识别模型识别将所述对话上下文信息转换为嵌入向量,通过所述意图识别模型的位置编码层和自注意力层对所述对话上下文信息进行分析,结合意图识别损失函数,得到用户意图;
第三单元,用于将所述用户意图和所述对话上下文信息转换为特征序列,通过双向搜索算法对预先构建的电网知识图谱进行检索,得到匹配信息,根据所述匹配信息生成回应文本。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至7中任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。
CN202311758316.2A 2023-12-20 2023-12-20 电网人机交互终端的数据处理方法及系统 Pending CN117435716A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311758316.2A CN117435716A (zh) 2023-12-20 2023-12-20 电网人机交互终端的数据处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311758316.2A CN117435716A (zh) 2023-12-20 2023-12-20 电网人机交互终端的数据处理方法及系统

Publications (1)

Publication Number Publication Date
CN117435716A true CN117435716A (zh) 2024-01-23

Family

ID=89553887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311758316.2A Pending CN117435716A (zh) 2023-12-20 2023-12-20 电网人机交互终端的数据处理方法及系统

Country Status (1)

Country Link
CN (1) CN117435716A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200090651A1 (en) * 2018-09-17 2020-03-19 Adobe Inc. Generating dialogue responses in end-to-end dialogue systems utilizing a context-dependent additive recurrent neural network
CN112182373A (zh) * 2020-09-25 2021-01-05 中国人民大学 一种基于上下文表示学习的性化搜索方法
CN112328808A (zh) * 2020-11-03 2021-02-05 四川长虹电器股份有限公司 基于知识图谱的问答方法、装置、电子设备及存储介质
CN113205817A (zh) * 2021-07-06 2021-08-03 明品云(北京)数据科技有限公司 语音语义识别方法、系统、设备及介质
CN113948079A (zh) * 2021-09-30 2022-01-18 国网福建省电力有限公司 基于人工智能语音识别的配电网调度人机交互方法
WO2022198750A1 (zh) * 2021-03-26 2022-09-29 南京邮电大学 语义识别方法
CN115858788A (zh) * 2022-12-19 2023-03-28 福州大学 基于双重图卷积神经网络的视角级文本情感分类系统
WO2023068953A1 (en) * 2021-10-19 2023-04-27 Huawei Technologies Co., Ltd Attention-based method for deep point cloud compression

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200090651A1 (en) * 2018-09-17 2020-03-19 Adobe Inc. Generating dialogue responses in end-to-end dialogue systems utilizing a context-dependent additive recurrent neural network
CN112182373A (zh) * 2020-09-25 2021-01-05 中国人民大学 一种基于上下文表示学习的性化搜索方法
CN112328808A (zh) * 2020-11-03 2021-02-05 四川长虹电器股份有限公司 基于知识图谱的问答方法、装置、电子设备及存储介质
WO2022198750A1 (zh) * 2021-03-26 2022-09-29 南京邮电大学 语义识别方法
CN113205817A (zh) * 2021-07-06 2021-08-03 明品云(北京)数据科技有限公司 语音语义识别方法、系统、设备及介质
CN113948079A (zh) * 2021-09-30 2022-01-18 国网福建省电力有限公司 基于人工智能语音识别的配电网调度人机交互方法
WO2023068953A1 (en) * 2021-10-19 2023-04-27 Huawei Technologies Co., Ltd Attention-based method for deep point cloud compression
CN115858788A (zh) * 2022-12-19 2023-03-28 福州大学 基于双重图卷积神经网络的视角级文本情感分类系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZIXU HAO 等: "Attention -Based GRU for Driver Intention Recognition and Vehicle Trajectory Prediction", 《2020 4TH CAA INTERNATIONAL CONFERENCE ON VEHICULAR CONTROL AND INTELLIGENCE (CVCI)》, 20 December 2020 (2020-12-20), pages 86 - 91 *
王堃 等: "端到端对话系统意图语义槽联合识别研究综述", 《计算机工程与应用》, vol. 56, no. 14, 31 July 2020 (2020-07-31), pages 14 - 25 *

Similar Documents

Publication Publication Date Title
CN108304372B (zh) 实体提取方法和装置、计算机设备和存储介质
CN102176310B (zh) 具有巨大词汇量的语音识别系统
WO2019046463A1 (en) SYSTEM AND METHOD FOR THE DEFINITION OF DIALOGUE INTENTIONS AND THE CONSTRUCTION OF INTENTION RECOGNITION MODELS WITHOUT PRIOR KNOWLEDGE
CN113836277A (zh) 用于数字助理的机器学习系统
CN112100354B (zh) 人机对话方法、装置、设备及存储介质
CN110795913B (zh) 一种文本编码方法、装置、存储介质及终端
WO2022048194A1 (zh) 事件主体识别模型优化方法、装置、设备及可读存储介质
CN116719520B (zh) 代码生成方法及装置
CN112632252B (zh) 对话应答方法、装置、计算机设备和存储介质
CN115470338B (zh) 一种基于多路召回的多场景智能问答方法和系统
CN112069801A (zh) 基于依存句法的句子主干抽取方法、设备和可读存储介质
CN111666764A (zh) 一种基于XLNet的自动摘要方法与装置
CN116662582A (zh) 基于自然语言的特定领域业务知识检索方法及检索装置
CN115497465A (zh) 语音交互方法、装置、电子设备和存储介质
CN113392265A (zh) 多媒体处理方法、装置及设备
CN112417132A (zh) 一种利用谓宾信息筛选负样本的新意图识别方法
Williams Zero Shot Intent Classification Using Long-Short Term Memory Networks.
JP6772394B1 (ja) 情報学習装置、情報処理装置、情報学習方法、情報処理方法及びプログラム
TW202034207A (zh) 使用意圖偵測集成學習之對話系統及其方法
CN115203206A (zh) 数据内容搜索方法、装置、计算机设备及可读存储介质
CN115238705A (zh) 语义解析结果重排序方法及系统
CN114239555A (zh) 一种关键词提取模型的训练方法及相关装置
CN117435716A (zh) 电网人机交互终端的数据处理方法及系统
CN114490974A (zh) 信息自动回复方法、装置、系统、电子设备及可读介质
Dinarelli Spoken language understanding: from spoken utterances to semantic structures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination