CN112270922A - 一种调度日志自动化填写方法及装置 - Google Patents

一种调度日志自动化填写方法及装置 Download PDF

Info

Publication number
CN112270922A
CN112270922A CN202011123758.6A CN202011123758A CN112270922A CN 112270922 A CN112270922 A CN 112270922A CN 202011123758 A CN202011123758 A CN 202011123758A CN 112270922 A CN112270922 A CN 112270922A
Authority
CN
China
Prior art keywords
scheduling
log
sequence
voice
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011123758.6A
Other languages
English (en)
Other versions
CN112270922B (zh
Inventor
罗文杰
钱峰
朱红艳
和菊香
黄永康
和云花
刘小猛
格桑拉姆
杨玉莲
刘聪
和晓凤
虎继华
卓格拉姆
张学华
鲁茸次里
丁正兰
冯友
徐进东
刘伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Diqing Power Supply Bureau of Yunnan Power Grid Co Ltd
Original Assignee
Diqing Power Supply Bureau of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Diqing Power Supply Bureau of Yunnan Power Grid Co Ltd filed Critical Diqing Power Supply Bureau of Yunnan Power Grid Co Ltd
Priority to CN202011123758.6A priority Critical patent/CN112270922B/zh
Publication of CN112270922A publication Critical patent/CN112270922A/zh
Application granted granted Critical
Publication of CN112270922B publication Critical patent/CN112270922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Abstract

本申请实施例公开了一种调度日志自动化填写方法及装置,首先,获取电力系统调度信息的录音文件,接着,获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,对所述调度文本数据进行预处理,生成调度日志,然后,获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,获取流程自动化任务,最后,根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。本申请解决了现有依靠人工手段进行调度日志分类及填报时效率低下及容易出错等方面的不足,全面提升调度日志记录及分类的自动化水平。

Description

一种调度日志自动化填写方法及装置
技术领域
本申请涉及电力信息系统技术领域,尤其涉及一种调度日志自动化填写方法及装置。
背景技术
在调度工作中,调度人员通常采用电话形式获取电力系统的运行状态、检修计划以及各类事件处理进度的调度信息,并在通讯过程中保存该调度信息,生成调度录音文件。通话结束后,调度人员将调度录音文件中的关键信息以人工记录的形式整理出来,生成调度日志,并按照对应的日志类别将调度日志填写至配网调度工作台。调度日志是为了实现对调度工作的整体概况和各类事件进行追踪,各级管理人员可通过调度日志了解电力系统的运行情况、检修计划以及各类事件处理进度等信息。
目前,调度日志的记录及分类完全依赖人工手段实现,工作量较大且工作效率低下。
发明内容
为了解决由于调度日志的记录及分类完全依赖人工手段实现,工作量较大且工作效率低下的问题,本申请通过以下各个实施例公开了一种调度日志自动化填写方法及装置。
本申请第一方面公开了一种调度日志自动化填写方法,可选的,所述方法包括:
获取电力系统调度信息的录音文件,所述调度信息包括所述电力系统的运行状态、检修计划以及事件处理进度的信息;
获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,所述调度语音识别模型包括调度语音语料字典、声学模型及语言模型;
对所述调度文本数据进行预处理,生成调度日志;
获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,所述获取自然语言处理模型包括调度日志分类特征词字典;
获取流程自动化任务,所述流程自动化任务包括所述调度日志自动填写顺序的任务序列;
根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
可选的,所述获取电力系统调度信息的录音文件,包括:
获取电力系统的调度信息,并根据所述调度信息生成初始调度录音文件;
对所述初始调度录音文件进行预处理,生成调度信息的录音文件,所述预处理包括预加重、分帧及加窗。
可选的,所述获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,包括:
根据所述调度信息的录音文件获取调度语音语料字典,所述调度语音语料字典包括调度专业术语、专有名词、特殊读音及习惯表达方式;
对所述调度信息的录音文件中部分录音信息进行语音音素标注及文本标注,获取相互对应的语音序列及词语序列;
根据所述语音序列及所述词语序列,获取声学模型及语言模型;
根据所述调度语音语料字典、声学模型及语言模型,对所述调度信息的录音文件中剩余部分录音信息进行语音音素标注及文本标注,获取初步语音序列及初步词语序列;
根据维特比算法,从所述初步语音序列及所述初步词语序列中提取最优语音序列及最优词语序列;
根据所述调度语音语料字典,从所述最优语音序列及所述最优词语序列中提取目标语音序列及目标词语序列;
根据所述目标语音序列及所述目标词语序列,获取所述调度文本数据并存储。
可选的,所述对所述调度文本数据进行预处理,生成调度日志,包括:
获取所述调度文本数据中的特征数据,所述特征数据包括计划时间、运行设备、运行方式、设备缺陷/故障部位及设备运行定值的数据;
定义调度日志文本格式;
根据所述特征数据及所述调度日志文本格式,生成所述调度日志。
可选的,所述获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,包括:
对所述调度日志进行分词处理,获取调度日志分类特征词字典;
对所述调度日志分类特征词字典进行加权,获取所述调度日志分类特征词字典中权重最大的分类特征词;
将所述权重最大的分类特征词转换成空间向量模型的特征向量;
根据半监督学习方法及所述特征向量,实现调度日志自动分类。
本申请第二方面公开了一种调度日志自动化填写装置,可选的,所述装置应用于本申请第一方面所述的一种调度日志自动化填写方法,所述装置包括:
录音文件获取模块,用于获取电力系统调度信息的录音文件,所述调度信息包括所述电力系统的运行状态、检修计划以及事件处理进度的信息;
调度文本数据获取模块,用于获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,所述调度语音识别模型包括调度语音语料字典、声学模型及语言模型;
调度日志获取模块,用于对所述调度文本数据进行预处理,生成调度日志;
调度日志分类模块,用于获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,所述获取自然语言处理模型包括调度日志分类特征词字典;
自动化任务获取模块,用于获取流程自动化任务,所述流程自动化任务包括所述调度日志自动填写顺序的任务序列;
调度工作台自动填写模块,用于根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
可选的,所述录音文件获取模块,包括:
初始调度录音文件获取单元,用于获取电力系统的调度信息,并根据所述调度信息生成初始调度录音文件;
初始调度录音文件预处理单元,用于对所述初始调度录音文件进行预处理,生成调度信息的录音文件,所述预处理包括预加重、分帧及加窗。
可选的,所述调度文本数据获取模块,包括:
调度语音语料字典获取单元,用于根据所述调度信息的录音文件获取调度语音语料字典,所述调度语音语料字典包括调度专业术语、专有名词、特殊读音及习惯表达方式;
语音序列及词语序列获取单元,用于对所述调度信息的录音文件中部分录音信息进行语音音素标注及文本标注,获取相互对应的语音序列及词语序列;
声学模型及语言模型获取单元,用于根据所述语音序列及所述词语序列,获取声学模型及语言模型;
初步语音序列及初步词语序列单元,用于根据所述调度语音语料字典、声学模型及语言模型,对所述调度信息的录音文件中剩余部分录音信息进行语音音素标注及文本标注,获取初步语音序列及初步词语序列;
最优语音序列及最优词语序列获取单元,用于根据维特比算法,从所述初步语音序列及所述初步词语序列中提取最优语音序列及最优词语序列;
目标语音序列及目标词语序列提取单元,用于根据所述调度语音语料字典,从所述最优语音序列及所述最优词语序列中提取目标语音序列及目标词语序列;
调度文本数据获取单元,用于根据所述目标语音序列及所述目标词语序列,获取所述调度文本数据并存储。
可选的,所述调度日志获取模块,包括:
特征数据获取单元,用于获取所述调度文本数据中的特征数据,所述特征数据包括计划时间、运行设备、运行方式、设备缺陷/故障部位及设备运行定值的数据;
调度日志文本格式定义单元,用于定义调度日志文本格式;
调度日志生成单元,用于根据所述特征数据及所述调度日志文本格式,生成所述调度日志。
可选的,所述调度日志分类模块,包括:
分类特征词字典获取单元,用于对所述调度日志进行分词处理,获取调度日志分类特征词字典;
权重最大的分类特征词获取单元,用于对所述调度日志分类特征词字典进行加权,获取所述调度日志分类特征词字典中权重最大的分类特征词;
特征向量转换单元,用于将所述权重最大的分类特征词转换成空间向量模型的特征向量;
调度日志自动分类单元,用于根据半监督学习方法及所述特征向量,实现调度日志自动分类。
本申请实施例公开了一种调度日志自动化填写方法及装置,首先,获取电力系统调度信息的录音文件,然后,获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,接着,对所述调度文本数据进行预处理,生成调度日志,继续获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,还要获取流程自动化任务,最后,根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
本申请解决了现有依靠人工手段进行调度日志分类及填报时效率低下及容易出错等方面的不足,全面提升调度日志记录及分类的自动化水平。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种调度日志自动化填写方法及装置的工作流程示意图;
图2为本申请实施例公开的一种调度日志自动化填写方法及装置的结构示意图。
具体实施方式
为了解决由于调度日志的记录及分类完全依赖人工手段实现,工作量较大且工作效率低下的问题,本申请通过以下各个实施例公开了一种调度日志自动化填写方法及装置。
本申请第一实施例公开了一种调度日志自动化填写方法,进一步的,参见图1所示的工作流程示意图,所述方法包括:
步骤S1、获取电力系统调度信息的录音文件,所述调度信息包括所述电力系统的运行状态、检修计划以及事件处理进度的信息。
其中,从相关系统中获取调度录音文件,对初始调度录音文件进行预加重、分帧及加窗预处理,获得的语音信号更加均匀、平滑,以提升后续语音处理质量;利用梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数提取方法对调度语音数据进行处理,生成表征语音信号中携带的说话人信息的特征参数,保证调度语音识别的准确率。
步骤S2、获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,所述调度语音识别模型包括调度语音语料字典、声学模型及语言模型。
在本实施例中,鉴于调度用语与日常用语存在发音差异,一方面电力调度领域涉及大量的专有名词及专业术语,如:调度设备、线路名称、调度指令等,另一方面电力调度语音中数字或语音的读音与日常发音不同,一些计量符号也需要进行特殊处理,例如,“1580”在调度中读作“幺五八洞”,将时间“8:30”读作“洞八点三洞分”,因此需要构建包含电力调度专业术语、专有名词、特殊读音、习惯表达方式等语音语料词典;
再对调度信息的录音文件中部分录音信息进行语音音素标注及文本标注,将步骤S1提取的梅尔频率倒谱系数作为语音向量,记t时刻的语音向量序列为Ot={O1,O2,...,Ot},其对应的词语序列记为W={w1,w2,...,wn},将语音序列及词语序列进行标注,建立一一对应关系,获取声学模型及语言模型并对其进行训练。以下通过简单示例对上述实施例公开的内容进行解释,若调度语音对应的发音序列及音素序列对应如下:
调度语音:洞八点三洞分垣中益厂二号机由备用转运行
发音序列:dong4 ba1dian3 san1 dong4 fen1 yuan2 zhong1 yi4 chang3 er4hao4 ji1 you2 bei4 yong4 zhuan3 yun4 xing2
音素系列:d ong4 b a1 d ian3 s an1 d ong4 fen1 vv van2 zh ong1 ii i4ch ang3 ee er4 h ao4 j i1 ii iu2 b ei4 ii iong4 zh uan3 vv vn4 x ing2 d ong4
最后,结合电力调度专业语音语料词典,利用训练好的声学模型及语言模型对未标注的语音帧序列进行识别,基于Viterbi算法寻找最优的语音音素序列,并查找词语词典,获得匹配的词语组合,最终将调度语音转化为文本形式进行结构化存储。鉴于调度用于与日常用语存在发音差异,一方面电力调度领域涉及大量的专有名词及专业术语,如:调度设备、线路名称、调度指令等,另一方面电力调度语音中数字或语音的读音与日常发音不同,一些计量符号也需要进行特殊处理,例如,“1580”在调度中读作“幺五八洞”,将时间“8:30”读作“洞八点三洞分”,因此需要构建包含电力调度专业术语、专有名词、特殊读音、习惯表达方式等语音语料词典;
再对调度语音语料进行语音音素标注及文本标注,将步骤101提取的梅尔频率倒谱系数作为语音向量,记t时刻的语音向量序列为Ot={O1,O2,...,Ot},其对应的词语序列记为W={w1,w2,...,wn},将语音序列及词语序列进行标注,建立一一对应关系,训练声学模型及语言模型。调度语音对应的发音序列及音素序列对应如下:
调度语音:洞八点三洞分垣中益厂二号机由备用转运行
发音序列:dong4 ba1dian3 san1 dong4 fen1 yuan2 zhong1 yi4 chang3 er4hao4 ji1 you2 bei4 yong4 zhuan3 yun4 xing2
音素系列:d ong4 b a1 d ian3 s an1 d ong4 fen1 vv van2 zh ong1 ii i4ch ang3 ee er4 h ao4 j i1 ii iu2 b ei4 ii iong4 zh uan3 vv vn4 x ing2 d ong4
最后,结合电力调度专业语音语料词典,利用训练好的声学模型及语言模型对未标注的语音帧序列进行识别,基于维特比(Viterbi)算法寻找最优的语音音素序列,并查找词语词典,获得匹配的词语组合,最终将调度语音转化为文本形式进行结构化存储。
步骤S3、对所述调度文本数据进行预处理,生成调度日志。
在本实施例中,利用自然语言处理技术提取出调度文本中的计划时间、运行设备、运行方式、设备缺陷/故障部位、设备运行定值等特征数据,定义日志文本格式,剔除原始调度文本中的冗余信息及非规范性表达,生成标准的调度日志。
步骤S4、获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,所述获取自然语言处理模型包括调度日志分类特征词字典。
在本实施例中,对调度日志进行分词处理,提取日志分类特征词字典,利用FTF-IDF(term frequency–inverse document frequency)加权技术进行加权,将调度日志转换成向量空间模型的特征向量表示,最后利用半监督学习方法实现调度日志自动分类。
步骤S5、获取流程自动化任务,所述流程自动化任务包括所述调度日志自动填写顺序的任务序列。
在本实施例中,通过配置自动执行的任务序列,按照调度日志的分类标签将调度日志自动填写至配网调度工作台。
步骤S6、根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
进一步的,所述获取电力系统调度信息的录音文件,包括:
获取电力系统的调度信息,并根据所述调度信息生成初始调度录音文件。
对所述初始调度录音文件进行预处理,生成调度信息的录音文件,所述预处理包括预加重、分帧及加窗。
进一步的,所述获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,包括:
根据所述调度信息的录音文件获取调度语音语料字典,所述调度语音语料字典包括调度专业术语、专有名词、特殊读音及习惯表达方式。
对所述调度信息的录音文件中部分录音信息进行语音音素标注及文本标注,获取相互对应的语音序列及词语序列。
根据所述语音序列及所述词语序列,获取声学模型及语言模型。
根据所述调度语音语料字典、声学模型及语言模型,对所述调度信息的录音文件中剩余部分录音信息进行语音音素标注及文本标注,获取初步语音序列及初步词语序列。
根据维特比算法,从所述初步语音序列及所述初步词语序列中提取最优语音序列及最优词语序列。
根据所述调度语音语料字典,从所述最优语音序列及所述最优词语序列中提取目标语音序列及目标词语序列。
根据所述目标语音序列及所述目标词语序列,获取所述调度文本数据并存储。
进一步的,所述对所述调度文本数据进行预处理,生成调度日志,包括:
获取所述调度文本数据中的特征数据,所述特征数据包括计划时间、运行设备、运行方式、设备缺陷/故障部位及设备运行定值的数据。
定义调度日志文本格式。
根据所述特征数据及所述调度日志文本格式,生成所述调度日志。
进一步的,所述获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,包括:
对所述调度日志进行分词处理,获取调度日志分类特征词字典。
对所述调度日志分类特征词字典进行加权,获取所述调度日志分类特征词字典中权重最大的分类特征词。
将所述权重最大的分类特征词转换成向量空间模型(VSM:Vector Space Model)的特征向量。
根据半监督学习方法及所述特征向量,实现调度日志自动分类。
其中,所述调度日志分类特征词字典可以包括故障日志记录、停电检修执行、转供电执行、重合闸投退、其他二次操作、错峰限电、重过载记录、新设备投运、线路改名、线路退运、带电作业、异常信号处理及其他特征词,利用FTF-IDF(term frequency–inversedocument frequency)加权技术对所述调度日志分类特征词字典进行加权,获取所述调度日志分类特征词字典中权重最大的分类特征词,并将所述权重最大的分类特征词转换成向量空间模型(VSM:Vector Space Model)的特征向量,所述向量空间模型(VSM:VectorSpace Model)把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,直观易懂,最后,根据半监督学习方法及所述特征向量,实现调度日志自动分类。
下述为本申请公开的装置实施例,用于执行上述方法实施例。针对装置实施例中未披露的细节,请参照方法实施例。
本申请第二实施例公开了一种调度日志自动化填写装置,进一步的,所述装置应用于本申请第一实施例所述的一种调度日志自动化填写方法,参见图2所示的结构示意图,所述装置包括:
录音文件获取模块10,用于获取电力系统调度信息的录音文件,所述调度信息包括所述电力系统的运行状态、检修计划以及事件处理进度的信息。
调度文本数据获取模块20,用于获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,所述调度语音识别模型包括调度语音语料字典、声学模型及语言模型。
调度日志获取模块30,用于对所述调度文本数据进行预处理,生成调度日志。
调度日志分类模块40,用于获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,所述获取自然语言处理模型包括调度日志分类特征词字典。
自动化任务获取模块50,用于获取流程自动化任务,所述流程自动化任务包括所述调度日志自动填写顺序的任务序列。
调度工作台自动填写模块60,用于根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
本申请实施例公开了一种调度日志自动化填写方法及装置,首先,获取电力系统调度信息的录音文件,然后,获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,接着,对所述调度文本数据进行预处理,生成调度日志,继续获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,还要获取流程自动化任务,最后,根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
本申请解决了现有依靠人工手段进行调度日志分类及填报时效率低下及容易出错等实施例的不足,全面提升调度日志记录及分类的自动化水平。
进一步的,所述录音文件获取模块10,包括:
初始调度录音文件获取单元101,用于获取电力系统的调度信息,并根据所述调度信息生成初始调度录音文件。
初始调度录音文件预处理单元102,用于对所述初始调度录音文件进行预处理,生成调度信息的录音文件,所述预处理包括预加重、分帧及加窗。
进一步的,所述调度文本数据获取模块20,包括:
调度语音语料字典获取单元201,用于根据所述调度信息的录音文件获取调度语音语料字典,所述调度语音语料字典包括调度专业术语、专有名词、特殊读音及习惯表达方式。
语音序列及词语序列获取单元202,用于对所述调度信息的录音文件中部分录音信息进行语音音素标注及文本标注,获取相互对应的语音序列及词语序列。
声学模型及语言模型获取单元203,用于根据所述语音序列及所述词语序列,获取声学模型及语言模型。
初步语音序列及初步词语序列单元204,用于根据所述调度语音语料字典、声学模型及语言模型,对所述调度信息的录音文件中剩余部分录音信息进行语音音素标注及文本标注,获取初步语音序列及初步词语序列。
最优语音序列及最优词语序列获取单元205,用于根据维特比算法,从所述初步语音序列及所述初步词语序列中提取最优语音序列及最优词语序列。
目标语音序列及目标词语序列提取单元206,用于根据所述调度语音语料字典,从所述最优语音序列及所述最优词语序列中提取目标语音序列及目标词语序列。
调度文本数据获取单元207,用于根据所述目标语音序列及所述目标词语序列,获取所述调度文本数据并存储。
进一步的,所述调度日志获取模块30,包括:
特征数据获取单元301,用于获取所述调度文本数据中的特征数据,所述特征数据包括计划时间、运行设备、运行方式、设备缺陷/故障部位及设备运行定值的数据。
调度日志文本格式定义单元302,用于定义调度日志文本格式。
调度日志生成单元303,用于根据所述特征数据及所述调度日志文本格式,生成所述调度日志。
进一步的,所述调度日志分类模块40,包括:
分类特征词字典获取单元401,用于对所述调度日志进行分词处理,获取调度日志分类特征词字典。
权重最大的分类特征词获取单元402,用于对所述调度日志分类特征词字典进行加权,获取所述调度日志分类特征词字典中权重最大的分类特征词。
特征向量转换单元403,用于将所述权重最大的分类特征词转换成空间向量模型的特征向量。
调度日志自动分类单元404,用于根据半监督学习方法及所述特征向量,实现调度日志自动分类。
本申请实施例公开了一种调度日志自动化填写方法及装置,首先,获取电力系统调度信息的录音文件,然后,获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,接着,对所述调度文本数据进行预处理,生成调度日志,继续获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,还要获取流程自动化任务,最后,根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
本申请解决了现有依靠人工手段进行调度日志分类及填报时效率低下及容易出错等实施例的不足,全面提升调度日志记录及分类的自动化水平。
以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。

Claims (10)

1.一种调度日志自动化填写方法,其特征在于,所述方法包括:
获取电力系统调度信息的录音文件,所述调度信息包括所述电力系统的运行状态、检修计划以及事件处理进度的信息;
获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,所述调度语音识别模型包括调度语音语料字典、声学模型及语言模型;
对所述调度文本数据进行预处理,生成调度日志;
获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,所述获取自然语言处理模型包括调度日志分类特征词字典;
获取流程自动化任务,所述流程自动化任务包括所述调度日志自动填写顺序的任务序列;
根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
2.根据权利要求1所述的一种调度日志自动化填写方法,其特征在于,所述获取电力系统调度信息的录音文件,包括:
获取电力系统的调度信息,并根据所述调度信息生成初始调度录音文件;
对所述初始调度录音文件进行预处理,生成调度信息的录音文件,所述预处理包括预加重、分帧及加窗。
3.根据权利要求2所述的一种调度日志自动化填写方法,其特征在于,所述获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,包括:
根据所述调度信息的录音文件获取调度语音语料字典,所述调度语音语料字典包括调度专业术语、专有名词、特殊读音及习惯表达方式;
对所述调度信息的录音文件中部分录音信息进行语音音素标注及文本标注,获取相互对应的语音序列及词语序列;
根据所述语音序列及所述词语序列,获取声学模型及语言模型;
根据所述调度语音语料字典、声学模型及语言模型,对所述调度信息的录音文件中剩余部分录音信息进行语音音素标注及文本标注,获取初步语音序列及初步词语序列;
根据维特比算法,从所述初步语音序列及所述初步词语序列中提取最优语音序列及最优词语序列;
根据所述调度语音语料字典,从所述最优语音序列及所述最优词语序列中提取目标语音序列及目标词语序列;
根据所述目标语音序列及所述目标词语序列,获取所述调度文本数据并存储。
4.根据权利要求1所述的一种调度日志自动化填写方法,其特征在于,所述对所述调度文本数据进行预处理,生成调度日志,包括:
获取所述调度文本数据中的特征数据,所述特征数据包括计划时间、运行设备、运行方式、设备缺陷/故障部位及设备运行定值的数据;
定义调度日志文本格式;
根据所述特征数据及所述调度日志文本格式,生成所述调度日志。
5.根据权利要求1所述的一种调度日志自动化填写方法,其特征在于,所述获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,包括:
对所述调度日志进行分词处理,获取调度日志分类特征词字典;
对所述调度日志分类特征词字典进行加权,获取所述调度日志分类特征词字典中权重最大的分类特征词;
将所述权重最大的分类特征词转换成空间向量模型的特征向量;
根据半监督学习方法及所述特征向量,实现调度日志自动分类。
6.一种调度日志自动化填写装置,其特征在于,所述装置应用于权利要求1-5任一项所述的一种调度日志自动化填写方法,所述装置包括:
录音文件获取模块,用于获取电力系统调度信息的录音文件,所述调度信息包括所述电力系统的运行状态、检修计划以及事件处理进度的信息;
调度文本数据获取模块,用于获取调度语音识别模型,并根据所述调度语音识别模型将所述调度信息的录音文件转化为调度文本数据,所述调度语音识别模型包括调度语音语料字典、声学模型及语言模型;
调度日志获取模块,用于对所述调度文本数据进行预处理,生成调度日志;
调度日志分类模块,用于获取自然语言处理模型,并根据所述自然语言处理模型对所述调度日志进行分类,所述获取自然语言处理模型包括调度日志分类特征词字典;
自动化任务获取模块,用于获取流程自动化任务,所述流程自动化任务包括所述调度日志自动填写顺序的任务序列;
调度工作台自动填写模块,用于根据调度日志分类特征词及所述任务序列,将已分类的调度日志自动填写至配网调度工作台。
7.根据权利要求6所述的一种调度日志自动化填写装置,其特征在于,所述录音文件获取模块,包括:
初始调度录音文件获取单元,用于获取电力系统的调度信息,并根据所述调度信息生成初始调度录音文件;
初始调度录音文件预处理单元,用于对所述初始调度录音文件进行预处理,生成调度信息的录音文件,所述预处理包括预加重、分帧及加窗。
8.根据权利要求7所述的一种调度日志自动化填写装置,其特征在于,所述调度文本数据获取模块,包括:
调度语音语料字典获取单元,用于根据所述调度信息的录音文件获取调度语音语料字典,所述调度语音语料字典包括调度专业术语、专有名词、特殊读音及习惯表达方式;
语音序列及词语序列获取单元,用于对所述调度信息的录音文件中部分录音信息进行语音音素标注及文本标注,获取相互对应的语音序列及词语序列;
声学模型及语言模型获取单元,用于根据所述语音序列及所述词语序列,获取声学模型及语言模型;
初步语音序列及初步词语序列单元,用于根据所述调度语音语料字典、声学模型及语言模型,对所述调度信息的录音文件中剩余部分录音信息进行语音音素标注及文本标注,获取初步语音序列及初步词语序列;
最优语音序列及最优词语序列获取单元,用于根据维特比算法,从所述初步语音序列及所述初步词语序列中提取最优语音序列及最优词语序列;
目标语音序列及目标词语序列提取单元,用于根据所述调度语音语料字典,从所述最优语音序列及所述最优词语序列中提取目标语音序列及目标词语序列;
调度文本数据获取单元,用于根据所述目标语音序列及所述目标词语序列,获取所述调度文本数据并存储。
9.根据权利要求6所述的一种调度日志自动化填写装置,其特征在于,所述调度日志获取模块,包括:
特征数据获取单元,用于获取所述调度文本数据中的特征数据,所述特征数据包括计划时间、运行设备、运行方式、设备缺陷/故障部位及设备运行定值的数据;
调度日志文本格式定义单元,用于定义调度日志文本格式;
调度日志生成单元,用于根据所述特征数据及所述调度日志文本格式,生成所述调度日志。
10.根据权利要求6所述的一种调度日志自动化填写装置,其特征在于,所述调度日志分类模块,包括:
分类特征词字典获取单元,用于对所述调度日志进行分词处理,获取调度日志分类特征词字典;
权重最大的分类特征词获取单元,用于对所述调度日志分类特征词字典进行加权,获取所述调度日志分类特征词字典中权重最大的分类特征词;
特征向量转换单元,用于将所述权重最大的分类特征词转换成空间向量模型的特征向量;
调度日志自动分类单元,用于根据半监督学习方法及所述特征向量,实现调度日志自动分类。
CN202011123758.6A 2020-10-20 2020-10-20 一种调度日志自动化填写方法及装置 Active CN112270922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011123758.6A CN112270922B (zh) 2020-10-20 2020-10-20 一种调度日志自动化填写方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011123758.6A CN112270922B (zh) 2020-10-20 2020-10-20 一种调度日志自动化填写方法及装置

Publications (2)

Publication Number Publication Date
CN112270922A true CN112270922A (zh) 2021-01-26
CN112270922B CN112270922B (zh) 2022-08-02

Family

ID=74338885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011123758.6A Active CN112270922B (zh) 2020-10-20 2020-10-20 一种调度日志自动化填写方法及装置

Country Status (1)

Country Link
CN (1) CN112270922B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763949A (zh) * 2021-07-22 2021-12-07 南方电网深圳数字电网研究院有限公司 语音识别修正方法、电子设备及计算机可读存储介质
CN113763949B (zh) * 2021-07-22 2024-05-14 南方电网数字平台科技(广东)有限公司 语音识别修正方法、电子设备及计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105161104A (zh) * 2015-07-31 2015-12-16 北京云知声信息技术有限公司 一种语音处理方法及装置
CN106649238A (zh) * 2016-12-20 2017-05-10 北京云知声信息技术有限公司 语音转写方法及装置
WO2017143672A1 (zh) * 2016-02-23 2017-08-31 北京云知声信息技术有限公司 一种基于语音输入的信息处理方法及装置
CN108417209A (zh) * 2018-03-02 2018-08-17 国家电网公司华中分部 一种基于自然语言处理技术的电力调度语素抽取方法
CN109840318A (zh) * 2019-01-04 2019-06-04 上海上湖信息技术有限公司 一种表单项的填写方法及系统
CN110225210A (zh) * 2019-06-18 2019-09-10 北京智合大方科技有限公司 基于通话摘要自动填写工单方法及系统
CN111105787A (zh) * 2019-12-31 2020-05-05 苏州思必驰信息科技有限公司 一种文本匹配方法、设备及计算机可读存储介质
CN111414453A (zh) * 2020-03-05 2020-07-14 北京声智科技有限公司 结构化文本生成方法、装置、电子设备及计算机可读存储介质
CN111489748A (zh) * 2019-10-18 2020-08-04 广西电网有限责任公司 一种调度智能语音辅助系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105161104A (zh) * 2015-07-31 2015-12-16 北京云知声信息技术有限公司 一种语音处理方法及装置
WO2017143672A1 (zh) * 2016-02-23 2017-08-31 北京云知声信息技术有限公司 一种基于语音输入的信息处理方法及装置
CN106649238A (zh) * 2016-12-20 2017-05-10 北京云知声信息技术有限公司 语音转写方法及装置
CN108417209A (zh) * 2018-03-02 2018-08-17 国家电网公司华中分部 一种基于自然语言处理技术的电力调度语素抽取方法
CN109840318A (zh) * 2019-01-04 2019-06-04 上海上湖信息技术有限公司 一种表单项的填写方法及系统
CN110225210A (zh) * 2019-06-18 2019-09-10 北京智合大方科技有限公司 基于通话摘要自动填写工单方法及系统
CN111489748A (zh) * 2019-10-18 2020-08-04 广西电网有限责任公司 一种调度智能语音辅助系统
CN111105787A (zh) * 2019-12-31 2020-05-05 苏州思必驰信息科技有限公司 一种文本匹配方法、设备及计算机可读存储介质
CN111414453A (zh) * 2020-03-05 2020-07-14 北京声智科技有限公司 结构化文本生成方法、装置、电子设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763949A (zh) * 2021-07-22 2021-12-07 南方电网深圳数字电网研究院有限公司 语音识别修正方法、电子设备及计算机可读存储介质
CN113763949B (zh) * 2021-07-22 2024-05-14 南方电网数字平台科技(广东)有限公司 语音识别修正方法、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112270922B (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN111489748A (zh) 一种调度智能语音辅助系统
CN111261162B (zh) 语音识别方法、语音识别装置及存储介质
JP2020525817A (ja) 声紋認識方法、装置、端末機器および記憶媒体
CN111755001A (zh) 一种基于人工智能的电网快速调度指挥系统及方法
CN111128126A (zh) 多语种智能语音对话的方法及系统
CN111477216A (zh) 一种用于对话机器人的音意理解模型的训练方法及系统
CN111508501B (zh) 一种电话机器人中带口音的语音识别方法及系统
CN1924994B (zh) 一种嵌入式语音合成方法及系统
CN110807574B (zh) 电力智能调度方法、装置及系统
CN114818649A (zh) 基于智能语音交互技术的业务咨询处理方法及装置
CN112800743A (zh) 一种基于特定领域的语音打分模型构建系统及方法
CN115910066A (zh) 用于区域配电网的智能调度指挥与运营系统
CN1714390B (zh) 语音识别设备和方法
CN111009244A (zh) 语音识别方法及系统
CN106710587A (zh) 一种语音识别数据预处理方法
Ananthi et al. Speech recognition system and isolated word recognition based on Hidden Markov model (HMM) for Hearing Impaired
CN112270922B (zh) 一种调度日志自动化填写方法及装置
CN113140219A (zh) 调控指令生成方法、装置、电子设备及存储介质
CN116911869A (zh) 一种基于人工智能的智能客服系统及其方法
CN117149977A (zh) 一种基于机器人流程自动化的智能催收机器人
US7853451B1 (en) System and method of exploiting human-human data for spoken language understanding systems
CN111402887A (zh) 一种语音转义文字的方法及装置
CN115022471A (zh) 一种智能机器人语音交互系统和方法
CN114328867A (zh) 一种人机对话中智能打断的方法及装置
JPH10173769A (ja) 音声メッセージ検索装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant