CN113920992A - 一种基于人工智能的配网调度语音交互方法 - Google Patents

一种基于人工智能的配网调度语音交互方法 Download PDF

Info

Publication number
CN113920992A
CN113920992A CN202111196130.3A CN202111196130A CN113920992A CN 113920992 A CN113920992 A CN 113920992A CN 202111196130 A CN202111196130 A CN 202111196130A CN 113920992 A CN113920992 A CN 113920992A
Authority
CN
China
Prior art keywords
voice
data
training
recognition
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111196130.3A
Other languages
English (en)
Inventor
蒋献伟
杨国健
黄晨宏
陈辰
刘超
赵路路
张冠花
左雪纯
李林锐
董青
徐友刚
郑真
蒋晨
马晔晖
肖远兵
陈娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qizhi Technology Co ltd
State Grid Shanghai Electric Power Co Ltd
Original Assignee
Shanghai Qizhi Technology Co ltd
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qizhi Technology Co ltd, State Grid Shanghai Electric Power Co Ltd filed Critical Shanghai Qizhi Technology Co ltd
Priority to CN202111196130.3A priority Critical patent/CN113920992A/zh
Publication of CN113920992A publication Critical patent/CN113920992A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明公开了一种基于人工智能的配网调度语音交互方法,包括语音训练步骤和语音识别,语音训练包括步骤1.1,数据采集和预处理和步骤1.2,语言模型和声学模型训练;语音识别包括如下步骤,步骤2.1语音调图,步骤2.2实现设备语音定位,步骤2.3通过语音调取目标系统功能接口执行相应的业务功能。本发明利用智能语音交互技术,实现语音调图、设备语音定位、供电路径查询、潮流信息查询等语音交互场景,大幅减轻人工工作压力,提高调控相关工作的执行效率。

Description

一种基于人工智能的配网调度语音交互方法
技术领域
本发明涉及一种用于电力调度业务领域的基于人工智能的配网调度语音交互方法。
背景技术
随着电网规模扩大及信息化建设进程的不断推进,电网运行数据复杂多变,发输变配调各环节信息和数据量也在不断增长,对电力调度业务的数据处理及响应能力形成了新的挑战,现有的配网调度系统人机交互模式仍主要依靠键鼠完成,同时业务系统存在诸多缺陷,难以适应现阶段的配网调度运行管理需求,有必要通过技术创新,解决现有业务系统存在的操作繁琐、响应慢等问题。
当前人工智能技术在人机交互模式方面极具先进性,在电力系统中的应用也做过不少尝试,通过关键技术的创新和延伸应用,实现传统业务的智能化改造。目前,人工智能技术在电力系统中的应用主要集中在理论研究方面,在交互方面的落地应用较少。
发明内容
本发明的目的是为了克服现有技术的不足,提供一种基于人工智能的配网调度语音交互方法,开发适用于配网电力调度的人机交互技术,并利用智能语音交互技术,实现语音调图、设备语音定位、供电路径查询、潮流信息查询等语音交互场景,实现了语音交互技术在电力系统的应用实践。
实现上述目的的一种技术方案是:一种基于人工智能的配网调度语音交互方法,包括语音训练步骤和语音识别:
语音训练如下步骤:
步骤1.1,数据采集和预处理,通过采集文本数据和音频数据进行关键字数据收集以构建训练样本库,然后针对文本和音频数据进行数据筛选和关联匹配,将文本数据和音频数据一一对应,并且依据数据类型打上相应的序列标签,得到准确的拼音序列和音素序列;
步骤1.2,语言模型和声学模型训练,对于音频数据,根据每帧音频将语音文件解读成为各小段,通过对每一小段的语音中存在的音素进行识别,结合音调分析,自动辨识归类多音素组成的音素集;经过声学模型的构建,在文字给定后,将单词组合转换成音素集,计算发生对应音频的概率,并在不断的识别训练中,经过统计规律计算,将常见、应用广泛的单词、短语等存储至数据库中,提升识别效率;
语音识别包括如下步骤:
步骤2.1,通过解析语音指令,通过设计多轮对话流程,通过对电压等级、目标地区的精确识别定位目标D5000系统厂站图,自动调取目标SVG图形并进行展示,实现语音调图;
步骤2.2,基于D5000系统厂站图接口,通过解析语音指令快速识别目标设备,自动跳转到目标设备厂站图位置,进而实现设备语音定位;
步骤2.3,多轮对话查询模块通过语音问答的形式采集调控人员的语音数据并数据解析,根据意图识别结果生成相应的查询模型,调取目标系统功能接口执行相应的业务功能。
本发明的一种基于人工智能的配网调度语音交互方法,通过构建电力领域的专业语料库,训练适用调度的语音识别、意图识别模型,通过多轮对话技术搭建人机交互引擎,支撑调度业务语音交互的实现,对语音指令进行识别与解析,基于交互接口对现有相关业务系统执行交互控制。基于语音交互技术能够实现调控中心现有交互模式的智能化升级,通过构建调控专业语料库和语音识别、意图识别模型,基于多轮对话技术的运用,实现智能人机交互。通过与其他系统建立交互接口的方式,形成联合控制通道,最终实现语音调图、设备语音定位、供电路径查询、潮流信息查询等功能,大幅减轻人工工作压力,提高调控相关工作的执行效率。
附图说明
图1为本发明的一种基于人工智能的配网调度语音交互方法的架构示意图。
具体实施方式
为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例进行详细地说明:
请参阅图1,本发明的一种基于人工智能的配网调度语音交互方法,包括语音训练步骤和语音识别:
语音训练如下步骤:
步骤1.1,数据采集和预处理。通过采集文本数据和音频数据进行关键字数据收集以构建训练样本库,然后针对文本和音频数据进行数据筛选和关联匹配,将文本数据和音频数据一一对应,并且依据数据类型打上相应的序列标签,得到准确的拼音序列和音素序列。
步骤1.2,语言模型和声学模型训练。语音模型的构建需要满足大词汇量、独立于说话人的识别要求,可以支持海量语法规模的词汇量,并能适应不同人群、不同地域、不同部门、不同信道、不同终端和不同噪声环境的应用环境。对于音频数据,通过分析说话人的声音,根据每帧音频将语音文件解读成为各小段,通过对每一小段的语音中存在的音素进行识别,并结合声调分析,自动辨识归类多音素组成的音素集;经过声学模型的构建,在文字给定后,结合词典的标准音,将单词组合转换成音素集,计算发生这段音频的概率,并在不断的识别训练中,经过相应的语言统计规律计算后,将常见、应用广泛的单词、短语等存储至数据库中,提升识别效率。
语音识别包括如下步骤:
步骤2.1,通过解析语音指令,通过设计多轮对话流程,通过对电压等级、目标地区的精确识别定位目标D5000系统厂站图,自动调取目标SVG图形并进行展示,实现语音调图;
步骤2.2,基于D5000系统厂站图接口,通过解析语音指令快速识别目标设备,自动跳转到目标设备厂站图位置,进而实现设备语音定位;
步骤2.3,多轮对话查询模块通过语音问答的形式采集调控人员的语音数据并数据解析,根据意图识别结果生成相应的查询模型,调取目标系统功能接口执行相应的业务功能。如,实现供电路径查询、潮流信息查询等功能。
本发明基于语音识别与交互技术对配网调控中心现有的业务系统及交互模式进行升级。数据采集和预处理步骤中,数据采集主要是保障采集数据的安全性和数据访问安全性,保障数据存储的高可用性,数据预处理主要是针对文本和音频数据进行数据筛选及关联匹配。语言模型和声学模型训练步骤中,语音识别中需要分析声音特征,进行语言训练,声学模型训练是给语音识别提供帧和状态所对应的概率。
本发明进行端点检测。在进行在对说话人语音进行识别前,首先要将语音中未包含任何音频的部分进行删减,并识别出噪音频段进行删除,构建有效及无效两类音频信号,在删除无效音频信号之后,得到精确、完善的可用语音。
本发明进行语音识别。通过已经构建的声学模型,识别语音的未知内容,通过对语音时序的拆解、分析,基于语言模型和声学模型的构建,通过端点监测后,生成相应的语音转换文件。文本语料制作。对文本语料分类和去重,统计文本中声母和韵母的覆盖率。
本发明进行语音录制。根据所需录音者的分类将文本语料精准分,并在其录制完毕后收集各人的音频,打上相应标签。
本发明进行意图识别。通过文本编辑距离计算、TextCNN模型算法,实现电力领域的交互用户真正意图获取。
本发明进行多轮对话自定义配置,主要包括多轮对话配置模块、意图识别模块、实体识别模块以及多轮对话存储模块,供在一次对话过程中支持多意图切换的能力,保障人机交互的顺畅性。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。

Claims (1)

1.一种基于人工智能的配网调度语音交互方法,其特征在于,包括语音训练步骤和语音识别:
语音训练包括如下步骤:
步骤1.1,数据采集和预处理,通过采集文本数据和音频数据进行关键字数据收集以构建训练样本库,然后针对文本和音频数据进行数据筛选和关联匹配,将文本数据和音频数据一一对应,并且依据数据类型打上相应的序列标签,得到准确的拼音序列和音素序列;
步骤1.2,语言模型和声学模型训练,对于音频数据,根据每帧音频将语音文件解读成为各小段,通过对每一小段的语音中存在的音素进行识别,结合音调分析,自动辨识归类多音素组成的音素集;经过声学模型的构建,在文字给定后,将单词组合转换成音素集,计算发生对应音频的概率,并在不断的识别训练中,经过统计规律计算,将常见、应用广泛的单词、短语等存储至数据库中,提升识别效率;
语音识别包括如下步骤:
步骤2.1,通过解析语音指令,通过设计多轮对话流程,通过对电压等级、目标地区的精确识别定位目标D5000系统厂站图,自动调取目标SVG图形并进行展示,实现语音调图;
步骤2.2,基于D5000系统厂站图接口,通过解析语音指令快速识别目标设备,自动跳转到目标设备厂站图位置,进而实现设备语音定位;
步骤2.3,多轮对话查询模块通过语音问答的形式采集调控人员的语音数据并数据解析,根据意图识别结果生成相应的查询模型,调取目标系统功能接口执行相应的业务功能。
CN202111196130.3A 2021-10-14 2021-10-14 一种基于人工智能的配网调度语音交互方法 Pending CN113920992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111196130.3A CN113920992A (zh) 2021-10-14 2021-10-14 一种基于人工智能的配网调度语音交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111196130.3A CN113920992A (zh) 2021-10-14 2021-10-14 一种基于人工智能的配网调度语音交互方法

Publications (1)

Publication Number Publication Date
CN113920992A true CN113920992A (zh) 2022-01-11

Family

ID=79240486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111196130.3A Pending CN113920992A (zh) 2021-10-14 2021-10-14 一种基于人工智能的配网调度语音交互方法

Country Status (1)

Country Link
CN (1) CN113920992A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095532A (zh) * 2023-01-31 2023-05-09 上海智臻智能网络科技股份有限公司 主站与厂站远动数据智能调试的装置及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095532A (zh) * 2023-01-31 2023-05-09 上海智臻智能网络科技股份有限公司 主站与厂站远动数据智能调试的装置及方法
CN116095532B (zh) * 2023-01-31 2023-11-10 国家电网有限公司华中分部 主站与厂站远动数据智能调试的装置及方法

Similar Documents

Publication Publication Date Title
CN108428446B (zh) 语音识别方法和装置
CN111489748A (zh) 一种调度智能语音辅助系统
CN111883110B (zh) 语音识别的声学模型训练方法、系统、设备及介质
CN109410914B (zh) 一种赣方言语音和方言点识别方法
CN106409289B (zh) 语音识别的环境自适应方法、语音识别装置和家用电器
CN101751922B (zh) 基于隐马尔可夫模型状态映射的文本无关语音转换系统
CN110717018A (zh) 一种基于知识图谱的工业设备故障维修问答系统
CN110335609A (zh) 一种基于语音识别的地空通话数据分析方法及系统
CN113066499B (zh) 一种陆空通话说话人身份识别方法及装置
CN111105785B (zh) 一种文本韵律边界识别的方法及装置
CN112397054B (zh) 一种电力调度语音识别方法
CN111429915A (zh) 一种基于语音识别的调度系统及调度方法
CN108763338A (zh) 一种基于电力行业的新闻采编系统
CN115292461B (zh) 基于语音识别的人机交互学习方法及系统
CN112256854A (zh) 一种基于ai自然语言理解的智能ai会话方法及装置
CN111489743A (zh) 一种基于智能语音技术的运营管理分析系统
CN114818649A (zh) 基于智能语音交互技术的业务咨询处理方法及装置
CN115910066A (zh) 用于区域配电网的智能调度指挥与运营系统
CN112530434A (zh) 电站自动化智能机器人值守调度系统
CN113920992A (zh) 一种基于人工智能的配网调度语音交互方法
Iosifov et al. Natural Language Technology to Ensure the Safety of Speech Information
CN113609264B (zh) 电力系统节点的数据查询方法、装置
CN117149977A (zh) 一种基于机器人流程自动化的智能催收机器人
Wang et al. A research on HMM based speech recognition in spoken English
CN113555133A (zh) 一种医疗问诊数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination