CN112395404A - 一种应用于电力调度的语音关键信息提取方法 - Google Patents

一种应用于电力调度的语音关键信息提取方法 Download PDF

Info

Publication number
CN112395404A
CN112395404A CN202011417668.8A CN202011417668A CN112395404A CN 112395404 A CN112395404 A CN 112395404A CN 202011417668 A CN202011417668 A CN 202011417668A CN 112395404 A CN112395404 A CN 112395404A
Authority
CN
China
Prior art keywords
voice
word
power
character string
key information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011417668.8A
Other languages
English (en)
Other versions
CN112395404B (zh
Inventor
胡飞飞
曾时博
洪丹轲
黄昱
张思拓
王巍
梁寿愚
方文崇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202011417668.8A priority Critical patent/CN112395404B/zh
Publication of CN112395404A publication Critical patent/CN112395404A/zh
Application granted granted Critical
Publication of CN112395404B publication Critical patent/CN112395404B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及人工智能客服的智能调度语音理解技术领域,具体为一种应用于电力调度的语音关键信息提取方法,其不同之处在于,包括以下步骤:步骤一、语音信息采集以及预处理;步骤二、前端处理;步骤三、邻接熵值计算;步骤四、邻接熵值条件判断;步骤五、互信息值计算;步骤六、互信息值条件判断;步骤七、重设处理字符串;步骤八、关键信息提取。本发明可有效提升应用于电力调度的关键信息识别的准确率。

Description

一种应用于电力调度的语音关键信息提取方法
技术领域
本发明涉及人工智能客服的智能调度语音理解技术领域,具体为一种应用于电力调度的语音关键信息提取方法。
背景技术
南方电网作为电力服务平台,拥有整体覆盖全网的智能语音引擎开放平台,满足在电力调度领域开展人工智能客服及智能语音分析两个方面的智能化管理工作需要。用户规模不断增长,作为服务全网的话务压力将急剧增加,同时随着通信业务不断发展,通信服务业务范围也将越来越广。每天都会有大量用户找客服帮忙解决电力调度问题。传统客服系统过度依赖人力模式,存在用户操作繁琐、问题解决周期长、成本开销大等缺点。
鉴于此,为了克服现有技术缺点,提供一种应用于电力调度的语音关键信息提取方法成为本领域亟待解决的问题。
发明内容
本发明目的在于克服现有技术的缺点,提供一种应用于电力调度的语音关键信息提取方法,可有效提升应用于电力调度的关键信息识别的准确率。
为解决以上技术问题,本发明提供了一种应用于电力调度的语音关键信息提取方法,其不同之处在于,包括以下步骤:
步骤一、语音信息采集以及预处理:采集语音匹配内容形成语音信号,并对所述语音信号进行预处理,得到电力调度语音文本字符串;
步骤二、前端处理:从初始位置开始读入预定长度的电力调度语音文本字符串;
步骤三、邻接熵值计算:计算当前电力调度语音文本字符串的左、右邻接熵;
步骤四、邻接熵值条件判断:若左或右邻接熵小于指定阈值X,则字符串向左或右扩展一个字符长度,其中运行中有标点和结束则停止,回到步骤三;
步骤五、互信息值计算:若左和右邻接熵均大于指定阈值X,则计算当前电力调度语音文本字符串中各字符的互信息;
步骤六、互信息值条件判断:若互信息大于指定阈值Y,则将当前字符串作为独立完整词汇召回;
步骤七、重设处理字符串:若互信息小于指定阈值Y,则所述初始位置右移一个字符长度,若电力调度语音文本字符串由初始位置起的剩余长度大于拟读入字符串的预定长度,则回到步骤二;
步骤八、关键信息提取:确定所有被召回的词汇权重,并按权重排序,取出权重较大的词汇作为当前电力调度语音文本的关键词。
按以上技术方案,所述步骤一中,所述语音匹配内容具有对应的电力调度语音文本内容。
按以上技术方案,所述步骤三中,记电力调度语音文本字符串S左邻接字符分布集为αl,右邻接字符分布集为αr,计算电力调度语音文本字符串S左、右邻接熵模型如下:
Figure BDA0002819107060000021
Figure BDA0002819107060000022
其中,p(αS)表示字符串aS出现的概率,p(Sα)表示字符串Sa出现的概率。
按以上技术方案,所述p(αS)和p(Sα)的近似如下:
Figure BDA0002819107060000031
Figure BDA0002819107060000032
其中,f(αiS)表示字符串αiS=αit1t2…tn在样本中出现的次数,f(Sai)表示字符串Sai在样本中出现的次数,p(αS)表示字符串aS出现的概率,p(Sα)表示字符串Sa出现的概率。
按以上技术方案,所述步骤四中,对于给定阈值X,若左邻接熵Hl(S)<X即认为字符t1为电力调度语音文本字符串S的左边界,若右邻接熵Hr(S)>X即认为字符tn为电力调度语音文本字符串S的右边界。
按以上技术方案,所述步骤五中,互信息的计算模型如下:
Figure BDA0002819107060000033
其中,f(S)和f(ti)分别表示字符串S=t1t2…tn和字符ti在样本中出现的次数;互信息MI(S)越大,则S=t1t2…tn越有可能是一个完整词。
按以上技术方案,所述步骤六中,电力调度语音文本字符串S对于给定邻接熵阈值X和互信息阈值Y,若左邻接熵Hl(S)<X,且右邻接熵Hr(S)<X,且互信息MI(S)>Y,则将电力调度语音文本字符串S=t1t2…tn作为独立词汇召回。
按以上技术方案,所述步骤八中,选取词频、词长、词位置、词跨度四种统计特征,并通过权重配置实现归一化。
按以上技术方案,词频因子计算模型如下:
Figure BDA0002819107060000034
其中,f(S)表示电力调度语音文本字符串S在语料中出现的频次;该计算模型使用非线性函数,它使词频因子随词频的增加而逐渐上升,并向1收敛;
词长因子计算模型如下:
Figure BDA0002819107060000041
其中,l(S)表示电力调度语音文本字符串S的词长,MAXl(S)表示电力调度语料中所有被召回词汇的最大长度;该电力调度词长因子计算模型随词长的增加逐渐上升,并向1收敛;
词位置因子计算模型如下:
Figure BDA0002819107060000042
其中,p=(p1,p2,p3,p4)表示电力调度语音文本字符串S在语料中标题、首段、段首句、其他位置出现的频率,a=(a1,a2,a3,a4)表示在每一个位置上的权重;该词位置因子计算模型中,词汇在不同的位置上对反映语料主题的重要性是不一致的,权重以标题、首段、段首句、其他位置依次递减,即a1>a2>a3>a4;同样的,add(S)也向1收敛;
词跨度因子计算模型如下:
Figure BDA0002819107060000043
其中,first(S)和last(S)分别表示电力调度语音文本字符串S在语料中第一次和最后一次出现的位置,f(S)表示电力调度语音文本字符串S在语料中出现的频次;该词跨度因子计算模型中,词汇在语料中的分布越广泛、词跨度越大,就越能反映语料的主题;同样的,dis(S)也向1收敛。
按以上技术方案,为所述词频、词长、词位置、词跨度四种统计特征配置权重w:
w=(w1,w2,w3,w4)
所述电力调度语音文本字符串S作为语料主题的影响因子weight(S):
weight(S)=w1×freq(S)+w2×len(S)+w3×add(S)+w4×dis(S)。
与现有技术相比,本发明提供的应用于电力调度的语音关键信息提取方法,本发明可有效准确地提取出语音输入信息的关键信息,改善了传统电力调度方法,提高了电力调度的效率。
附图说明
图1为本发明实施例的整体流程示意图;
图2为本发明实施例中关键信息提取的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1和图2,本发明公开了一种应用于电力调度的语音关键信息提取方法,其不同之处在于,包括以下步骤:
步骤一,确定语音语义匹配库需要的语音匹配内容,所述语音匹配内容具有对应的电力调度语音文本内容;采集所述语音匹配内容形成语音信号,并对所述语音信号进行预处理,得到电力调度语音文本字符串S;
步骤二:从初始位置开始读入预定长度的电力调度语音文本字符串S,设样本电力调度语音文本字符串S=t1t2…tn,则称t1为t2的左邻接字符,t2为t1的右邻接字符。根据信息熵的方法,M是离散随机变量,变量M的熵为
Figure BDA0002819107060000051
其中,M是离散随机变量,其值域记为Sm,对Sm中状态值m∈Sm,其概率分布函数为pm(x)。
如果一个电力调度语音字符串是一个词汇,那么其左右邻接字符应具有较大的不确定性,即该电力调度语音字符串独立于左右邻接字符,而邻接字符的分布是较为分散的。
举例来说,“去五电站巡逻”、“到五电站值班”、“回五电站取文件”、“上五电站交接”等字符串中,子字符串“电站”的左邻接字符只有唯一确定的一个“五”,而“五电站”的左邻接字符却有“去”、“到”、“回”、“上”四种,不确定性较大,同样的,子字符串“五电”的右邻接字符只有唯一确定的一个“站”,而“五电站”的右邻接字符却有“巡”、“值”、“取”、“交”四种,不确定性较大。
步骤三:计算当前电力调度语音文本字符串的左右邻接熵;记字符串S左邻接字符分布集为αl,右邻接字符分布集为αr,计算字符串S左右邻接熵模型如下:
Figure BDA0002819107060000061
Figure BDA0002819107060000062
其中,p(αS)表示字符串aS出现的概率,p(Sα)表示字符串Sa出现的概率。
通过样本统计数据给出p(αS)和p(Sα)的近似如下:
Figure BDA0002819107060000063
Figure BDA0002819107060000064
其中,f(αiS)表示字符串αiS=αit1t2…tn在样本中出现的次数,f(Sai)表示字符串Sai在样本中出现的次数,p(αS)表示字符串aS出现的概率,p(Sα)表示字符串Sa出现的概率。
步骤四:若电力调度语音文本字符串S的左或右邻接熵小于指定阈值X,则字符串向左或右扩展一个字符长度,其中运行中有标点和结束则停止,回到步骤三;对于给定阈值X,若Hl(S)<X即认为字符t1为字符串S的左边界,若Hr(S)>X即认为字符tn为字符串S的右边界。
步骤五:若电力调度语音文本字符串S左和右邻接熵均大于指定阈值X,则计算当前电力调度语音文本字符串中个字符的互信息;获得了字符串S的左右边界,在此基础上,根据信息熵的方法,如果一个字符串是一个完整词汇,那么其内部各字符间的相互关联应较为紧密,即该字符串内部各子字符串具有较高的互信息值。
举例来说,“中国南方电网公司”这一字符串在词边界识别的过程中,可能被识别成“中国”、“南方”、“电网”、“公司”四个词汇,而事实上,当“中国”、“南方”、“电网”、“公司”四个词汇连续出现时,更倾向将其作为一个完整词汇。
互信息MI(S)有多种计算表达式,同样通过样本统计数据给出互信息计算表达式:
Figure BDA0002819107060000071
其中f(S)和f(ti)分别表示字符串S=t1t2…tn和字符ti在样本中出现的次数。互信息MI(S)越大,则S=t1t2…tn越有可能是一个完整词。
步骤六:若互信息MI(S)大于指定阈值Y,则将当前字符串作为独立完整词汇召回;即电力调度语音文本字符串S对于给定邻接熵阈值X和互信息阈值Y,若Hl(S)<X,且Hr(S)<X,且MI(S)>Y,则将电力调度语音文本字符串S=t1t2…tn作为独立词汇召回。
步骤七:初始位置右移一个字符长度,若电力调度语音文本字符串由初始位置起的剩余长度大于拟读入字符串的预定长度,则回到步骤二;
步骤八:计算所有被召回的词汇权重,并按权重排序,取出权重较大的词汇作为当前电力调度语音文本字符串S的关键词。
选取词频、词长、词位置、词跨度四种统计特征,并通过权重配置实现归一化。
词频因子计算模型如下:
Figure BDA0002819107060000081
其中f(S)表示电力调度语音文本字符串S在语料中出现的频次。该计算模型使用非线性函数,它使词频因子随词频的增加而逐渐上升,并向1收敛。
词长因子计算模型如下:
Figure BDA0002819107060000082
其中l(S)表示电力调度语音文本字符串S的词长,MAXl(S)表示电力调度语料中所有被召回词汇的最大长度。该电力调度词长因子计算模型随词长的增加逐渐上升,并向1收敛。
词位置因子计算模型如下:
Figure BDA0002819107060000083
其中p=(p1,p2,p3,p4)表示电力调度语音文本字符串S在语料中标题、首段、段首句、其他位置出现的频率,a=(a1,a2,a3,a4)表示在每一个位置上的权重。该词位置因子计算模型认为,词汇在不同的位置上对反映语料主题的重要性是不一致的,权重以标题、首段、段首句、其他位置依次递减,即a1>a2>a3>a4。同样的,add(S)也向1收敛。
词跨度因子计算模型如下:
Figure BDA0002819107060000084
其中first(S)和last(S)分别表示字符串S在语料中第一次和最后一次出现的位置,f(S)表示字符串S在语料中出现的频次。该词跨度因子计算模型认为,词汇在语料中的分布越广泛、词跨度越大,就越能反映语料的主题。同样的,dis(S)也向1收敛。
为词频、词长、词位置、词跨度四种统计特征配置权重w:
w=(w1,w2,w3,w4)
电力调度语音文本字符串S作为语料主题的影响因子weight(S):
weight(S)=w1×freq(S)+w2×len(S)+w3×add(S)+w4×dis(S)
举例:
配置邻接熵阈值X=1.2,互信息阈值Y=0.08,配置词位置权重a=(0.41,0.33,0.27,0.09)、配置词频、词长、词位置、词跨度权重w=(0.39,0.21,0.18,0.22)。以《南方电网“十三五”智能电网发展规划研究报告》为例,实验结果表明,算法能识别“两精两优”、“智能电网架构体系”等新词和术语,能识别“全面贯通的通信网络”、“高效互动的调度及控制体系”、“集成共享的信息平台”、“全面覆盖的技术保障体系”等复合词,能将“智慧能源”、“能源互联网”等具有重复字符的词汇作为两个独立词汇召回,关键词提取效果令人满意。
本发明中,构建应用于电力调度的语音关键信息提取方法和人工在线客服系统的智能客服系统,大大提高了客服人效和用户体验。同时这种语音关键信息提取方法也可适用在电网其他业务方面,比如运维检修、项目管理等,不仅适用于电网内部项目和人员的信息管理调取的智能服务系统,还适用客户与电网之间的信息咨询、业务办理导向等方向的智能客服系统,有助于提高业务效率,使客服系统智能化效率化。
需要说明的是,在本文中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种应用于电力调度的语音关键信息提取方法,其特征在于,包括以下步骤:
步骤一、语音信息采集以及预处理:采集语音匹配内容形成语音信号,并对所述语音信号进行预处理,得到电力调度语音文本字符串;
步骤二、前端处理:从初始位置开始读入预定长度的电力调度语音文本字符串;
步骤三、邻接熵值计算:计算当前电力调度语音文本字符串的左、右邻接熵;
步骤四、邻接熵值条件判断:若左或右邻接熵小于指定阈值X,则字符串向左或右扩展一个字符长度,其中运行中有标点和结束则停止,回到步骤三;
步骤五、互信息值计算:若左和右邻接熵均大于指定阈值X,则计算当前电力调度语音文本字符串中各字符的互信息;
步骤六、互信息值条件判断:若互信息大于指定阈值Y,则将当前字符串作为独立完整词汇召回;
步骤七、重设处理字符串:若互信息小于指定阈值Y,则所述初始位置右移一个字符长度,若电力调度语音文本字符串由初始位置起的剩余长度大于拟读入字符串的预定长度,则回到步骤二;
步骤八、关键信息提取:确定所有被召回的词汇权重,并按权重排序,取出权重较大的词汇作为当前电力调度语音文本的关键词。
2.根据权利要求1所述的应用于电力调度的语音关键信息提取方法,其特征在于:所述步骤一中,所述语音匹配内容具有对应的电力调度语音文本内容。
3.根据权利要求1所述的应用于电力调度的语音关键信息提取方法,其特征在于:所述步骤三中,记电力调度语音文本字符串S左邻接字符分布集为αl,右邻接字符分布集为αr,计算电力调度语音文本字符串S左、右邻接熵模型如下:
Figure FDA0002819107050000021
Figure FDA0002819107050000022
其中,p(αS)表示字符串aS出现的概率,p(Sα)表示字符串Sa出现的概率。
4.根据权利要求3所述的应用于电力调度的语音关键信息提取方法,其特征在于:所述p(αS)和p(Sα)的近似如下:
Figure FDA0002819107050000023
Figure FDA0002819107050000024
其中,f(αiS)表示字符串αiS=αit1t2...tn在样本中出现的次数,f(Sai)表示字符串Sai在样本中出现的次数,p(αS)表示字符串aS出现的概率,p(Sα)表示字符串Sa出现的概率。
5.根据权利要求1所述的应用于电力调度的语音关键信息提取方法,其特征在于:所述步骤四中,对于给定阈值X,若左邻接熵Hl(S)<X即认为字符t1为电力调度语音文本字符串S的左边界,若右邻接熵Hr(S)>X即认为字符tn为电力调度语音文本字符串S的右边界。
6.根据权利要求1所述的应用于电力调度的语音关键信息提取方法,其特征在于:所述步骤五中,互信息的计算模型如下:
Figure FDA0002819107050000025
其中,f(S)和f(ti)分别表示字符串S=t1t2...tn和字符ti在样本中出现的次数;互信息MI(S)越大,则S=t1t2...tn越有可能是一个完整词。
7.根据权利要求1所述的应用于电力调度的语音关键信息提取方法,其特征在于:所述步骤六中,电力调度语音文本字符串S对于给定邻接熵阈值X和互信息阈值Y,若左邻接熵Hl(S)<X,且右邻接熵Hr(S)<X,且互信息MI(S)>Y,则将电力调度语音文本字符串S=t1t2...tn作为独立词汇召回。
8.根据权利要求1所述的应用于电力调度的语音关键信息提取方法,其特征在于:所述步骤八中,选取词频、词长、词位置、词跨度四种统计特征,并通过权重配置实现归一化。
9.根据权利要求8所述的应用于电力调度的语音关键信息提取方法,其特征在于:词频因子计算模型如下:
Figure FDA0002819107050000031
其中,f(S)表示电力调度语音文本字符串S在语料中出现的频次;该计算模型使用非线性函数,它使词频因子随词频的增加而逐渐上升,并向1收敛;
词长因子计算模型如下:
Figure FDA0002819107050000032
其中,l(S)表示电力调度语音文本字符串S的词长,MAXl(S)表示电力调度语料中所有被召回词汇的最大长度;该电力调度词长因子计算模型随词长的增加逐渐上升,并向1收敛;
词位置因子计算模型如下:
Figure FDA0002819107050000033
其中,p=(p1,p2,p3,p4)表示电力调度语音文本字符串S在语料中标题、首段、段首句、其他位置出现的频率,a=(a1,a2,a3,a4)表示在每一个位置上的权重;该词位置因子计算模型中,词汇在不同的位置上对反映语料主题的重要性是不一致的,权重以标题、首段、段首句、其他位置依次递减,即a1>a2>a3>a4;同样的,add(S)也向1收敛;
词跨度因子计算模型如下:
Figure FDA0002819107050000034
其中,first(S)和last(S)分别表示电力调度语音文本字符串S在语料中第一次和最后一次出现的位置,f(S)表示电力调度语音文本字符串S在语料中出现的频次;该词跨度因子计算模型中,词汇在语料中的分布越广泛、词跨度越大,就越能反映语料的主题;同样的,dis(S)也向1收敛。
10.根据权利要求9所述的应用于电力调度的语音关键信息提取方法,其特征在于:为所述词频、词长、词位置、词跨度四种统计特征配置权重w:
w=(w1,w2,w3,w4)
所述电力调度语音文本字符串S作为语料主题的影响因子weight(S):
weight(S)=w1×freq(S)+w2×len(S)+w3×add(S)+w4×dis(S)。
CN202011417668.8A 2020-12-05 2020-12-05 一种应用于电力调度的语音关键信息提取方法 Active CN112395404B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011417668.8A CN112395404B (zh) 2020-12-05 2020-12-05 一种应用于电力调度的语音关键信息提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011417668.8A CN112395404B (zh) 2020-12-05 2020-12-05 一种应用于电力调度的语音关键信息提取方法

Publications (2)

Publication Number Publication Date
CN112395404A true CN112395404A (zh) 2021-02-23
CN112395404B CN112395404B (zh) 2023-01-24

Family

ID=74605140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011417668.8A Active CN112395404B (zh) 2020-12-05 2020-12-05 一种应用于电力调度的语音关键信息提取方法

Country Status (1)

Country Link
CN (1) CN112395404B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116737871A (zh) * 2022-09-20 2023-09-12 荣耀终端有限公司 一种字符串的识别方法及系统
CN117648062A (zh) * 2024-01-29 2024-03-05 珠海芯烨电子科技有限公司 一种语音管理方法以及打印机
CN117725187A (zh) * 2024-02-08 2024-03-19 人和数智科技有限公司 一种适用于社会救助的问答系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62231994A (ja) * 1986-03-27 1987-10-12 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 事象列の尤度評価方法とそれを利用する音声認識装置
JP2007017630A (ja) * 2005-07-06 2007-01-25 Asahi Kasei Corp 音声認識候補文字列選択装置
CN109086332A (zh) * 2018-07-04 2018-12-25 深圳供电局有限公司 一种电力调度日志查询方法及系统
WO2020038253A1 (zh) * 2018-08-20 2020-02-27 深圳追一科技有限公司 关键词的提取方法、系统和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62231994A (ja) * 1986-03-27 1987-10-12 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 事象列の尤度評価方法とそれを利用する音声認識装置
JP2007017630A (ja) * 2005-07-06 2007-01-25 Asahi Kasei Corp 音声認識候補文字列選択装置
CN109086332A (zh) * 2018-07-04 2018-12-25 深圳供电局有限公司 一种电力调度日志查询方法及系统
WO2020038253A1 (zh) * 2018-08-20 2020-02-27 深圳追一科技有限公司 关键词的提取方法、系统和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116737871A (zh) * 2022-09-20 2023-09-12 荣耀终端有限公司 一种字符串的识别方法及系统
CN116737871B (zh) * 2022-09-20 2024-05-07 荣耀终端有限公司 一种字符串的识别方法及系统
CN117648062A (zh) * 2024-01-29 2024-03-05 珠海芯烨电子科技有限公司 一种语音管理方法以及打印机
CN117648062B (zh) * 2024-01-29 2024-05-03 珠海芯烨电子科技有限公司 一种语音管理方法以及打印机
CN117725187A (zh) * 2024-02-08 2024-03-19 人和数智科技有限公司 一种适用于社会救助的问答系统
CN117725187B (zh) * 2024-02-08 2024-04-30 人和数智科技有限公司 一种适用于社会救助的问答系统

Also Published As

Publication number Publication date
CN112395404B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
CN112395404B (zh) 一种应用于电力调度的语音关键信息提取方法
CN109325116B (zh) 一种基于深度学习的城市事件自动分类派发方法及装置
CN110619506B (zh) 一种岗位画像生成方法、岗位画像生成装置及电子设备
CN106991085B (zh) 一种实体的简称生成方法及装置
CN108304372A (zh) 实体提取方法和装置、计算机设备和存储介质
CN112419096B (zh) 基于nlp信息萃取与少样本自学习的用户用电诉求工单自动流转方法
CN110516057B (zh) 一种信访问题答复方法及装置
CN110727778A (zh) 一种面向税务的智能问答系统
CN111680512B (zh) 命名实体识别模型、电话总机转接分机方法及系统
CN110222192A (zh) 语料库建立方法及装置
CN108228808A (zh) 确定热点事件的方法、装置和存储介质以及电子设备
CN111061837A (zh) 话题识别方法、装置、设备及介质
CN116991875B (zh) 一种基于大模型的sql语句生成、别名映射方法及设备
CN112667777A (zh) 一种用于客户来电诉求的分类方法
CN115935245A (zh) 一种政务热线案件自动分类分拨方法
CN113486174B (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN112541351B (zh) 一种住建领域政务热线工单派发方法及系统
CN112488736A (zh) 一种住建领域政务热线工单数据分析方法及系统
CN113836898A (zh) 一种电力系统自动派单方法
CN112860893A (zh) 短文本分类方法及终端设备
CN115544235A (zh) 一种基于文本解析的电网规划智能问答系统
CN112002306B (zh) 语音类别的识别方法、装置、电子设备及可读存储介质
CN116316548A (zh) 基于人口流动数据和双阶段注意力机制的负荷预测方法和系统
CN115691503A (zh) 语音识别方法、装置、电子设备和存储介质
CN114417010A (zh) 面向实时工作流的知识图谱构建方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant