CN110490428A - 空中交通管制工作质量评估方法及相关装置 - Google Patents

空中交通管制工作质量评估方法及相关装置 Download PDF

Info

Publication number
CN110490428A
CN110490428A CN201910683661.1A CN201910683661A CN110490428A CN 110490428 A CN110490428 A CN 110490428A CN 201910683661 A CN201910683661 A CN 201910683661A CN 110490428 A CN110490428 A CN 110490428A
Authority
CN
China
Prior art keywords
segment
keyword voice
voice
zero initial
pronunciation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910683661.1A
Other languages
English (en)
Inventor
宫博
黄磊
闫文斌
方四安
徐承
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEFEI XUNFEI DIGITAL TECHNOLOGY Co Ltd
Original Assignee
HEFEI XUNFEI DIGITAL TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HEFEI XUNFEI DIGITAL TECHNOLOGY Co Ltd filed Critical HEFEI XUNFEI DIGITAL TECHNOLOGY Co Ltd
Priority to CN201910683661.1A priority Critical patent/CN110490428A/zh
Publication of CN110490428A publication Critical patent/CN110490428A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Operations Research (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例公开了一种空中交通管制工作质量评估方法及相关装置,方法包括:获取预设时间内的历史陆空通话记录;提取历史陆空通话记录的管制员的关键词语音;确定关键词语音的预设指标的评析结果,预设指标包括以下至少一种:发音混淆度、语速和音量;根据评析结果确定管制员的交通管制工作质量评估结果。本申请实施例有利于实现对空中交通管制工作的质量监控,提高管制工作质量。

Description

空中交通管制工作质量评估方法及相关装置
技术领域
本申请涉及电子设备技术领域,具体涉及一种空中交通管制工作质量评估方法及相关装置。
背景技术
我国空中交通运输量持续快速增长,各个空中交通管制区管制任务量也随着快速增长,空管运行保障压力不断增加,这给管制员的管制指挥工作带来了更大的工作负荷,因此对空中交通管制服务能力进行全面、准确的评估,有利于管制工作质量的改善提高。目前仅通过管制运行安全指标、航班延误指标、管制业务量等方面指标来评估空中交通管制的综合运行品质。但不能具体到考察每个管制过程工作质量,忽略了管制过程中空管员的发音是否规范,忽视了由于发音错、漏、忘可能导致的安全隐患和效率降低,难以分析出管制工作效率瓶颈和质量低下的原因,因此通过陆空通话检测管制过程中管制员存在的工作质量是亟待解决的问题。
发明内容
本申请实施例提供了一种空中交通管制工作质量评估方法及相关装置,以期实现对空中交通管制工作的质量监控,提高管制工作质量。
第一方面,本申请实施例提供一种空中交通管制工作质量评估方法,包括:
获取预设时间内的历史陆空通话记录;
提取所述历史陆空通话记录的管制员的关键词语音;
确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;
根据所述评析结果确定所述管制员的交通管制工作质量评估结果。
第二方面,本申请实施例提供一种空中交通管制工作质量评估装置,包括处理单元和通信单元,其中,
所述处理单元,用于通过所述通信单元获取预设时间内的历史陆空通话记录;以及提取所述历史陆空通话记录的管制员的关键词语音;以及确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;以及根据所述评析结果确定所述管制员的空中交通管制工作质量评估结果。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中,电子设备通过获取预设时间内的历史通话记录,并根据提取管制员的关键词语音,然后确定关键词语音的预设指标的评析结果,从而得到管制员的关键词语音的发音混淆度、语速和音量的评析结果,最后根据评析结果确定管制员的空中交通管制工作质量评估结果,如此可以实现通过语音评测对管制员的发音是否清晰标准,语速是否适中,是否存在口误等自动进行评价,并同时给出改进建议,有利于实现对空中交通管制工作的质量监控,提高管制工作质量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种空中交通管制工作质量评估设备的示意图;
图2是本申请实施例提供的一种空中交通管制工作质量评估方法的流程示意图;
图3a是本申请实施例提供的一种候选词解码网络的示意图;
图3b是本申请实施例提供的另一种候选词解码网络的示意图;
图4本申请实施例提供的一种电子设备的结构示意图;
图5本申请实施例提供的一种空中交通管制工作质量评估装置的功能单元组成框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,图1为一个空中交通管制工作质量评估设备100的示意图,该电子设备100包括数据获取装置110、数据处理装置120,所述数据获取装置110连接所述数据处理装置120,数据获取装置110用于获取预设时间内的历史陆空通话记录数据并发给数据处理装置120进行处理,数据处理装置120用于提取所述历史陆空通话记录的管制员的关键词语音;确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;根据所述评析结果确定所述管制员的交通管制工作质量评估结果。本申请实施例所涉及到的空中交通管制工作质量评估设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminal device)等等。
目前对空中交通管制工作质量进行客观定量评估分析仅通过管制运行安全指标、航班延误指标、管制业务量等方面指标来评估空中交通管制的综合运行品质。其评估方法没有具体到考察空中管制陆空通话的过程,忽略了管制过程中空管员和飞行员的发音是否规范,难以评估每名管制员的具体工作质量,以及分析出管制工作效率瓶颈和质量低下的人为原因。
基于此,本申请实施例提出一种空中交通管制工作质量评估方法以解决上述问题,下面对本申请实施例进行详细介绍。
请参阅图2,图2是本申请实施例提供了一种空中交通管制工作质量评估方法的流程示意图,应用于如图1所示的电子设备,如图所示,本空中交通管制工作质量评估方法包括:
S201,电子设备获取预设时间内的历史陆空通话记录;
其中,所述历史陆空通话记录包括考察期内管制员的无线电通话数字信号历史数据。
S202,所述电子设备提取所述历史陆空通话记录的管制员的关键词语音;
其中,在所述历史陆空通话记录中根据管制员的语音信号频域特征提取管制员的语音,再提取关键词语音,所述语音信号频域特征可以是梅尔域倒谱系数(MFCC)或者滤波器组特征(FBank)。
S203,所述电子设备确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;
其中,所述预设指标包括但不限于发音混淆度、语速和音量。其中包含预设陆空通话发音混淆度阈值、语音能量评估阈值、非零声母音段音素时长阈值和零声母音段音素时长阈值。其中预设陆空通话发音混淆度阈值可以是根据大量语音数据人工测听并计算可得到,所述语音能量评估阈值可以根据大量语音数据人工测听确定,以及根据大量语音数据人工测听并计算可得到正常陆空通话语速下,非零声母音段音素时长T1阈值范围为T1min<T1<T1max,零声母音段音素时长T2阈值范围为T2min<T2<T2max。
S204,所述电子设备根据所述评析结果确定所述管制员的交通管制工作质量评估结果。
其中,综合发音混淆度评估结果、语速评估结果和音量评估结果,输出管制员的交通管制工作质量评估结果,所述评估结果包括但不限于考察时间,考察对象,得分评价,以及得分原因,改善建议、措施等。
具体实现中,所述预设指标包括发音混淆度、语速和音量,所述根据所述评估结果确定所述管制员的交通管制工作质量评估结果,包括将所述发音混淆度、语速和音量的评析结果进行加权平均,得到所述管制员的交通管制工作质量评估结果。
可以看出,本申请实施例中,电子设备通过获取预设时间内的历史通话记录,并根据提取管制员的关键词语音,然后确定关键词语音的预设指标的评析结果,从而得到管制员的关键词语音的发音混淆度、语速和音量的评析结果,最后根据评析结果确定管制员的空中交通管制工作质量评估结果,如此可以实现通过语音评测对管制员的发音是否清晰标准,语速是否适中,是否存在口误等自动进行评价,并同时给出改进建议,有利于实现对空中交通管制工作的质量监控,提高管制工作质量。
在一个可能的示例中,所述预设指标为发音混淆度时,所述确定所述关键词语音的预设指标的评析结果;包括:获取预设航空呼号指令混淆对和实时飞行计划信息并构建候选词网络,所述候选词解码网络包含每个关键词语音对应的至少一个候选词,所述候选词为与所述关键词语音存在相似度的词;根据所述候选词网络,确定所述关键词语音的发音混淆度。
其中,所述实时飞行计划信息通过电子进程单历史数据库中进场、飞跃、离场进程单历史表抽取得到,用于获取管制语音对应时间段的所有进场、飞越、离场航班的航班号、跑道号用于生成混淆度评估解码网络。所述航空呼号指令混淆对通过航空管制指令中发音较为相似、容易在陆空通话过程中引起发音混淆且可能产生严重后果的指令词语构成,主要用于生成混淆度评估解码网络。举例来说,所述航空呼号指令混淆对包括1、左-右,2、高-低,3、温度-高度,4、洞两-两洞等等。
具体实现中,基于实时飞行计划信息和航空呼号指令混淆对生成候选词解码网络。将所述实时飞行计划信息中管制指令发生时所有的所有进场、飞越、离场航班的航班号、跑道号抽取出并分别建立起独立的候选词解码网络,用于后续计算管制指令中的航班号、跑道号与候选词的发音混淆度。如图3a所示,图3a为一种候选词解码网络的示意图,图3a将实施飞行计划信息中管制指令发生时的航班号抽取出来,并建立航班号的多组候选词解码网络;如图3b所示,图3b是本申请提供的另一种候选词解码网络的示意图,其将实施飞行计划信息中管制指令中的飞行高度抽取出来,建立高度的候选词解码网络。
可见,电子设备能够基于预设航空呼号指令混淆对和实时飞行计划信息并构建候选词网络确定所述关键词语音的发音混淆度,实现了对管制员的工作质量的具体评估,能够有效检测出管制员存在的发音混淆的问题。
在一个可能的示例中,所述根据所述候选词网络,确定所述关键词语音的发音混淆度,包括:根据所述候选词解码网络计算所述关键词语音的声学似然度;通过发音混淆度算法对所述声学似然度进行计算得到所述关键词语音的发音混淆度;将所述发音混淆度与预设陆空通话发音混淆度阈值进行比较,确定所述关键词语音的发音混淆度。
其中,所述将所述发音混淆度与预设陆空通话发音混淆度阈值进行比较,确定所述关键词语音的发音混淆度,包括:当所述发音混淆度小于陆空通话发音混淆度阈值时,确定所述第一关键词音段发音混淆度高;或,当所述发音混淆度大于陆空通话发音混淆度阈值时,确定所述第一关键词音段发音混淆度低。其中,基于所述候选词解码网络对各关键词音段计算关键词的声学似然度,所述声学似然度关联所述候选词解码网络中每条解码路径。
具体实现中,假设某个关键词和与其相似度最高的候选词的声学似然度分别为S0,S1,则该关键词和其候选词的发音混淆度为H=|S0-S1|,例如关键词为“跑道02”,和“跑道02”发音相似度最高的候选词为“跑道06”,其声学似然度分别为和1987和245,则关键词“跑道02”和与其最相似的候选词的发音混淆度为|1987-245|=1742。所述关键词语音中每个关键词和其最相似的候选词之间的发音混淆度分别为H1,H2,......,Hn,其中,n表示所有关键词的个数,则管制员发音混淆度为:H=(H1+H2+…+Hn)/n。然后根据所述发音混淆度和预设陆空通话发音混淆度阈值即正常发音混淆度阈值进行比较判断管制员发音混淆程度,当所述发音混淆度小于预设陆空通话发音混淆度阈值时,判断为该管制员发音混淆度较高,需提高发音区分性;当所述发音混淆度大于预设陆空通话发音混淆度阈值时,则判断为该管制员发音混淆度较低,发音区分性较高。
可见,本示例中,电子设备基于所述候选词解码网络计算所述关键词语音的声学似然度计算得到所述关键词的发音混淆度,实现了对管制员的发音混淆度的具体评估,能够有效检测出管制员存在的发音混淆的问题。
在一个可能的示例中,所述预设指标为语速时,所述确定所述关键词语音的预设指标的评析结果,包括:获取所述关键词语音的时间信息和文本信息;根据所述文本信息获取所述关键词语音的零声母音段和非零声母音段,仅包含零声母音节的一段语音,所述零声母音节是指不包含声母音素,仅由韵母音素独立构成的音节,所述非零声母音段是指仅包含非零声母音节的一段语音,所述非零声母音节是指由声母音素和韵母音素共同组成的音节;根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速。
其中,所述时间信息包括所述关键词语音的每个发音单元的起始时间和终止时间,所述发音单元可以是音素、音节或者词汇。例如字“东”,其发音单元为音素,音素包括“d”,“ol”,“ng”,“d”的起始时间为“10.023”,终止时间为“10.096”;“ol”的起始时间为“10.101”,终止时间为“10.189”;“ng”的起始时间为“10.190”,终止时间为“10.268”。所述文本信息包括所述关键词语音的音节信息,可以根据所述音节信息是否包括声母将所述关键词语音分为零声母音段和非零声母音段,所述零声母音段为仅包含零声母音节的一段语音,所述非零声母音段是指仅包含非零声母音节的一段语音,例如“一”、“五”等数字以及“安”、“欧”、“澳”、“伊”、“武”、“夷”、“无”、“义”、“乌”、“宜”、“阿”等汉字发音。
具体实现中,结合所述时间信息和所述关键词语音包含的零声母音段和非零声母音段进行所述关键词语音的语速计算。
可见,本示例中,电子设备能够基于所述关键词语音的语音信息和文本信息确定所述关键词语音的语速,实现了对管制员管制工作中关键词语音语速的检测,有利于规范管制员的发音。
在一个可能的示例中,所述根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速并进行判断,包括:根据所述时间信息、零声母音段和非零声母音段计算所述零声母音段平均音素时长和非零声母音段平均音素时长;将所述零声母音段平均音素时长与零声母音段音素时长阈值进行比较,确定所述零声母音段的语速是否存在异常;将所述非零声母音段平均音素时长与非零声母音段音素时长阈值进行比较,确定所述非零声母音段的语速是否存在异常;根据所述零声母音段的语速和所述非零声母音段的语速确定所述关键词语音的语速是否存在异常。
其中,根据关键词语音的零声母音段和非零声母音段中各个音素的时长分别计算平均音素时长,例如,所述关键词语音中零声母音段中各个音素的时长分别为t1,t2,t3,...,tn,其中,n为包含的音素数量,则所述关键词零声母音段的平均音素时长为:T′2=(t1+t2+t3+…+tn)/n;相似的,所述关键词非零声母音段各个音素的时长分别为t′1,t′2,t′3,...,t′m,其中m为包含的音素数量,则所述关键词语音的非零声母音段的平均音素时长为:T′1=(t′1+t′2+t′3+…+t′m)/m。
其中,所述将所述零声母音段平均音素时长与零声母音段音素时长阈值进行比较,确定所述零声母音段的语速是否存在异常,包括所述将所述零声母音段平均音素时长T′2与零声母音段音素时长阈值进行比较;当小于最小阈值T2min时,判断所述零声母音段语速过慢;当大于最大阈值T2max时,判断所述零声母音段语速过快;在阈值之间时,判断所述零声母音段语速正常。所述将所述非零声母音段平均音素时长与非零声母音段音素时长阈值进行比较,确定所述非零声母音段的语速是否存在异常,包括将所述非零声母音段平均音素时长T′1与非零声母音段音素时长阈值进行比较;当小于最小阈值T1min时,判断所述非零声母音段语速过慢;当大于最大阈值T1max时,判断所述非零声母音段语速过快;在阈值之间时,判断所述非零声母音段语速正常。当所述零声母音段的语速和所述非零声母音段的语速都为语速正常时,判断所述关键词语音为语速正常;当所述零声母音段的语速和所述非零声母音段的语速不全都为语速正常时,判断所述关键词语音为语速异常。
可见,本示例中,电子设备基于关键词语音的文本信息和时间信息确定零声母音段平均音素时长和非零声母音段平均音素时长,进而确定关键词语音的语速,实现了对管制员管制工作中关键词语音语速的检测,有利于规范管制员的发音。
在一个可能的示例中,所述预设指标为音量时,所述确定所述关键词语音的预设指标的评析结果,包括:对所述关键词语音进行分帧处理;获取所述关键词语音的每帧的能量值;通过关键词语音平均帧能量算法计算所述关键词语音的平均帧能量;提取所述平均帧能量作为所述关键词语音的能量特征并根据所述能量特征评估所述关键词语音的音量是否存在异常。
其中,将所述关键词语音分为多帧,获取所述关键词语音每帧的能量值并计算平均帧能量,所述平均帧能量为其中,x(m)表示关键词音段数据中第m个采样点的采样值,N为关键词音段中采样点个数,n为一帧数据中包含的采样点个数。
其中,所述根据所述能量特征评估所述第一关键词音段的音量,包括:将所述能量特征与第一音量阈值进行比较;当所述能量特征小于第一音量阈值时,判断所述第一关键词音段的音量过小;当所述能量特征大于第一音量阈值时,将所述能量特征与第二音量阈值进行比较;当所述能量特征小于第二音量阈值时,判断所述第一关键词音段的音量正常;当所述能量特征大于第二音量阈值时,判断所述第一关键词音段的音量过大。
可见,本示例中,电子设备能够基于对所述关键词语音每帧的能量值计算确定所述关键词语音的音量,能够有效检测出管制过程中管制员存在的发音问题,有利于分析工作效率和质量低下的原因,提高管制工作质量。
在一个可能的示例中,所述提取所述历史陆空通话记录的管制员的关键词语音,包括:获取所述历史陆空通话记录的管制员语音数据、飞行电子进程单数据库管制指令历史表和预设标准发音模型;根据所述飞行电子进程单数据库管制指令历史表确定电子进程单指令文本,并根据所述电子进程单指令文本确定关键词文本;根据所述标准发音模型对所述管制员语音进行音段切分,得到音段切分结果,所述音段切分结果包含所述管制员语音中每个发音单元的起始时间、终止时间和发音单元名称;根据所述发音单元和所述关键词文本确定所述管制员语音中的关键词语音。
其中,所述根据所述飞行电子进程单数据库管制指令历史表确定电子进程单指令文本,并根据所述电子进程单指令文本确定关键词文本,包括:根据所述飞行电子进程单数据库管制指令历史表获取电子进程单指令文本,根据所述电子进程单指令文本进行分词,得到分词结果;标记所述分词结果的属性信息;根据所述属性信息解析关键词,得到关键词文本。所述根据所述发音单元和所述关键词文本确定所述管制员语音中的关键词语音可以是根据所述发音单元和关键词文本确定所述发音单元对应的词汇的属性;根据所述发音单元的属性确定关键词语音音段;还可以是将所述发音单元和所述关键词文本通过预设发音词典对应,得到关键词发音单元,进而确定所述关键词语音音段,所述预设发音词典包含所述管制员语音的所有发音单元和对应文本信息。其中,获取所述关键词的处理过程和音段切分的处理过程没有先后顺序,也可以同时进行。
举例来说,所述电子进程单指令文本为“东方5172,白云塔台,晚上好,地面风040,跑道02左,可以起飞,再见。”,首先对所述电子进程单指令文本进行文本分词,所述文本分词是指将所述电子进程单指令文本以词汇组合的形式分割开,然后对每个词汇进行属性标注,最后根据词汇的属性提取关键词文本。其分词过程如下表格1所示:
表格1
根据获取的标准发音模型对所述管制员语音进行音段切分,得到音段切分结果,所述音段切分结果包括每个发音单元的起始时间和终止时间,所述发音单元可以是音素,也可以是扩大到音节,也可以是扩大到词。例如,所述音段切分结果如下表格2所示:
表格2
其中,所述音段切分结果包括关键词和非关键词的音段切分结果。根据所述音段切分结果和所述关键词文本确定所述管制员语音中的关键词语音音段。
可见,本示例中,电子设备能够根据音段切分、关键词解析获取关键词语音音段,能够实现根据关键词语音评估发音混淆度、语速和音量,减少语音的运算量,提高了管制员语音评估的速度和质量。
下面结合一些示例对本申请进行详细说明。
与上述图2所示的实施例一致的,请参阅图4,图4是本申请实施例提供的一种电子设备400的结构示意图,如图所示,所述电子设备400包括应用处理器410、存储器420、通信接口430以及一个或多个程序421,其中,所述一个或多个程序421被存储在上述存储器420中,并且被配置由上述应用处理器410执行,所述一个或多个程序421包括用于执行以下步骤的指令;
获取预设时间内的历史陆空通话记录;
提取所述历史陆空通话记录的管制员的关键词语音;
确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;
根据所述评析结果确定所述管制员的交通管制工作质量评估结果。
可以看出,本申请实施例中,电子设备通过获取预设时间内的历史通话记录,并根据提取管制员的关键词语音,然后确定关键词语音的预设指标的评析结果,从而得到管制员的关键词语音的发音混淆度、语速和音量的评析结果,最后根据评析结果确定管制员的空中交通管制工作质量评估结果,如此可以实现通过语音评测对管制员的发音是否清晰标准,语速是否适中,是否存在口误等自动进行评价,并同时给出改进建议,有利于实现对空中交通管制工作的质量监控,提高管制工作质量。
在一个可能的示例中,所述预设指标为发音混淆度时,在所述确定所述关键词语音的预设指标的评析结果方面,所述程序中的指令具体用于执行以下操作:获取预设航空呼号指令混淆对和实时飞行计划信息并构建候选词网络,所述候选词解码网络包含每个关键词语音对应的至少一个候选词,所述候选词为与所述关键词语音存在相似度的词;根据所述候选词网络,确定所述关键词语音的发音混淆度。
在一个可能的示例中,在所述根据所述候选词网络,确定所述关键词语音的发音混淆度方面,所述程序中的指令具体用于执行以下操作:根据所述候选词解码网络计算所述关键词语音的声学似然度;通过发音混淆度算法对所述声学似然度进行计算得到所述关键词语音的发音混淆度;将所述发音混淆度与预设陆空通话发音混淆度阈值进行比较,确定所述关键词语音的发音混淆度。
在一个可能的示例中,所述预设指标为语速时,在所述确定所述关键词语音的预设指标的评析结果方面,所述程序中的指令具体用于执行以下操作:获取所述关键词语音的时间信息和文本信息;根据所述文本信息获取所述关键词语音的零声母音段和非零声母音段,所述零声母音段是指仅包含零声母音节的一段语音,所述零声母音节是指不包含声母音素,仅由韵母音素独立构成的音节,所述非零声母音段是指仅包含非零声母音节的一段语音,所述非零声母音节是指由声母音素和韵母音素共同组成的音节;根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速。
在一个可能的示例中,在所述根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速并进行判断方面,所述程序还包括用于执行以下操作的指令:根据所述时间信息、零声母音段和非零声母音段计算所述零声母音段平均音素时长和非零声母音段平均音素时长;将所述零声母音段平均音素时长与零声母音段音素时长阈值进行比较,确定所述零声母音段的语速是否存在异常;将所述非零声母音段平均音素时长与非零声母音段音素时长阈值进行比较,确定所述非零声母音段的语速是否存在异常;根据所述零声母音段的语速和所述非零声母音段的语速确定所述关键词语音的语速是否存在异常。
在一个可能的示例中,所述预设指标为音量时,在所述确定所述关键词语音的预设指标的评析结果方面,所述程序中的指令具体用于执行以下操作:对所述关键词语音进行分帧处理;获取所述关键词语音的每帧的能量值;通过关键词语音平均帧能量算法计算所述关键词语音的平均帧能量;提取所述平均帧能量作为所述关键词语音的能量特征并根据所述能量特征评估所述关键词语音的音量是否存在异常。
在一个可能的示例中,在所述提取所述历史陆空通话记录的管制员的关键词语音方面,所述程序中的指令具体用于执行以下操作:获取所述历史陆空通话记录的管制员语音数据、飞行电子进程单数据库管制指令历史表和预设标准发音模型;根据所述飞行电子进程单数据库管制指令历史表确定电子进程单指令文本,并根据所述电子进程单指令文本确定关键词文本;根据所述标准发音模型对所述管制员语音进行音段切分,得到音段切分结果,所述音段切分结果包含所述管制员语音中每个发音单元的起始时间、终止时间和发音单元名称;根据所述发音单元和所述关键词文本确定所述管制员语音中的关键词语音。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图5是本申请实施例中所涉及的语音评测装置500的功能单元组成框图。该语音评测装置500应用于电子设备,所述电子设备包括处理单元501和通信单元502,其中,
所述处理单元501,用于通过所述通信单元502获取预设时间内的历史陆空通话记录;以及提取所述历史陆空通话记录的管制员的关键词语音;以及确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;以及根据所述评析结果确定所述管制员的交通管制工作质量评估结果。
其中,所述语音评测装置500还可以包括存储单元503,用于存储电子设备的程序代码和数据。所述处理单元501可以是处理器,所述通信单元502可以是内部通信接口,存储单元503可以是存储器。
可以看出,本申请实施例中,电子设备通过获取预设时间内的历史通话记录,并根据提取管制员的关键词语音,然后确定关键词语音的预设指标的评析结果,从而得到管制员的关键词语音的发音混淆度、语速和音量的评析结果,最后根据评析结果确定管制员的空中交通管制工作质量评估结果,如此可以实现通过语音评测对管制员的发音是否清晰标准,语速是否适中,是否存在口误等自动进行评价,并同时给出改进建议,有利于实现对空中交通管制工作的质量监控,提高管制工作质量。
在一个可能的示例中,所述预设指标为发音混淆度时,在所述确定所述关键词语音的预设指标的评析结果方面,所述处理单元501具体用于:获取预设航空呼号指令混淆对和实时飞行计划信息并构建候选词网络,所述候选词解码网络包含每个关键词语音对应的至少一个候选词,所述候选词为与所述关键词语音存在相似度的词;根据所述候选词网络,确定所述关键词语音的发音混淆度。
在一个可能的示例中,在所述根据所述候选词网络,确定所述关键词语音的发音混淆度方面,所述处理单元501具体用于:根据所述候选词解码网络计算所述关键词语音的声学似然度;通过发音混淆度算法对所述声学似然度进行计算得到所述关键词语音的发音混淆度;将所述发音混淆度与预设陆空通话发音混淆度阈值进行比较,确定所述关键词语音的发音混淆度。
在一个可能的示例中,所述预设指标为语速时,在所述确定所述关键词语音的预设指标的评析结果方面,所述处理单元501具体用于:获取所述关键词语音的时间信息和文本信息;根据所述文本信息获取所述关键词语音的零声母音段和非零声母音段,所述零声母音段是指仅包含零声母音节的一段语音,所述零声母音节是指不包含声母音素,仅由韵母音素独立构成的音节,所述非零声母音段是指仅包含非零声母音节的一段语音,所述非零声母音节是指由声母音素和韵母音素共同组成的音节;根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速。
在一个可能的示例中,在所述根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速并进行判断方面,所述处理单元501具体用于:根据所述时间信息、零声母音段和非零声母音段计算所述零声母音段平均音素时长和非零声母音段平均音素时长;将所述零声母音段平均音素时长与零声母音段音素时长阈值进行比较,确定所述零声母音段的语速是否存在异常;将所述非零声母音段平均音素时长与非零声母音段音素时长阈值进行比较,确定所述非零声母音段的语速是否存在异常;根据所述零声母音段的语速和所述非零声母音段的语速确定所述关键词语音的语速是否存在异常。
在一个可能的示例中,所述预设指标为音量时,在所述确定所述关键词语音的预设指标的评析结果方面,所述处理单元501具体用于:对所述关键词语音进行分帧处理;获取所述关键词语音的每帧的能量值;通过关键词语音平均帧能量算法计算所述关键词语音的平均帧能量;提取所述平均帧能量作为所述关键词语音的能量特征并根据所述能量特征评估所述关键词语音的音量是否存在异常。
在一个可能的示例中,在所述提取所述历史陆空通话记录的管制员的关键词语音方面,所述处理单元501具体用于:获取所述历史陆空通话记录的管制员语音数据、飞行电子进程单数据库管制指令历史表和预设标准发音模型;根据所述飞行电子进程单数据库管制指令历史表确定电子进程单指令文本,并根据所述电子进程单指令文本确定关键词文本;根据所述标准发音模型对所述管制员语音进行音段切分,得到音段切分结果,所述音段切分结果包含所述管制员语音中每个发音单元的起始时间、终止时间和发音单元名称;根据所述发音单元和所述关键词文本确定所述管制员语音中的关键词语音。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种空中交通管制工作质量评估方法,其特征在于,包括:
获取预设时间内的历史陆空通话记录;
提取所述历史陆空通话记录的管制员的关键词语音;
确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;
根据所述评析结果确定所述管制员的交通管制工作质量评估结果。
2.根据权利要求1所述的方法,其特征在于,所述预设指标为发音混淆度时,所述确定所述关键词语音的预设指标的评析结果;包括:
获取预设航空呼号指令混淆对和实时飞行计划信息并构建候选词网络,所述候选词解码网络包含每个关键词语音对应的至少一个候选词,所述候选词为与所述关键词语音存在相似度的词;
根据所述候选词网络,确定所述关键词语音的发音混淆度。
3.根据权利要求2所述的方法,其特征在于,所述根据所述候选词网络,确定所述关键词语音的发音混淆度,包括:
根据所述候选词解码网络计算所述关键词语音的声学似然度;
通过发音混淆度算法对所述声学似然度进行计算得到所述关键词语音的发音混淆度;
将所述发音混淆度与预设陆空通话发音混淆度阈值进行比较,确定所述关键词语音的发音混淆度。
4.根据权利要求1所述的方法,其特征在于,所述预设指标为语速时,所述确定所述关键词语音的预设指标的评析结果,包括:
获取所述关键词语音的时间信息和文本信息;
根据所述文本信息获取所述关键词语音的零声母音段和非零声母音段,所述零声母音段是指仅包含零声母音节的一段语音,所述零声母音节是指不包含声母音素,仅由韵母音素独立构成的音节,所述非零声母音段是指仅包含非零声母音节的一段语音,所述非零声母音节是指由声母音素和韵母音素共同组成的音节;
根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速。
5.根据权利要求4所述的方法,其特征在于,所述根据所述时间信息、零声母音段和非零声母音段计算所述关键词语音的语速并进行判断,包括:
根据所述时间信息、零声母音段和非零声母音段计算所述零声母音段平均音素时长和非零声母音段平均音素时长;
将所述零声母音段平均音素时长与零声母音段音素时长阈值进行比较,确定所述零声母音段的语速是否存在异常;
将所述非零声母音段平均音素时长与非零声母音段音素时长阈值进行比较,确定所述非零声母音段的语速是否存在异常;
根据所述零声母音段的语速和所述非零声母音段的语速确定所述关键词语音的语速是否存在异常。
6.根据权利要求1所述的方法,其特征在于,所述预设指标为音量时,所述确定所述关键词语音的预设指标的评析结果,包括:
对所述关键词语音进行分帧处理;
获取所述关键词语音的每帧的能量值;
通过关键词语音平均帧能量算法计算所述关键词语音的平均帧能量;
提取所述平均帧能量作为所述关键词语音的能量特征并根据所述能量特征评估所述关键词语音的音量是否存在异常。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述提取所述历史陆空通话记录的管制员的关键词语音,包括:
获取所述历史陆空通话记录的管制员语音数据、飞行电子进程单数据库管制指令历史表和预设标准发音模型;
根据所述飞行电子进程单数据库管制指令历史表确定电子进程单指令文本,并根据所述电子进程单指令文本确定关键词文本;
根据所述标准发音模型对所述管制员语音进行音段切分,得到音段切分结果,所述音段切分结果包含所述管制员语音中每个发音单元的起始时间、终止时间和发音单元名称;
根据所述发音单元和所述关键词文本确定所述管制员语音中的关键词语音。
8.一种交通管制工作质量评估装置,其特征在于,包括处理单元和通信单元,其中,
所述处理单元,用于通过所述通信单元获取预设时间内的历史陆空通话记录;以及提取所述历史陆空通话记录的管制员的关键词语音;以及确定所述关键词语音的预设指标的评析结果,所述预设指标包括以下至少一种:发音混淆度、语速和音量;以及根据所述评析结果确定所述管制员的交通管制工作质量评估结果。
9.一种电子设备,其特征在于,包括处理器、存储器,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
CN201910683661.1A 2019-07-26 2019-07-26 空中交通管制工作质量评估方法及相关装置 Pending CN110490428A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910683661.1A CN110490428A (zh) 2019-07-26 2019-07-26 空中交通管制工作质量评估方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910683661.1A CN110490428A (zh) 2019-07-26 2019-07-26 空中交通管制工作质量评估方法及相关装置

Publications (1)

Publication Number Publication Date
CN110490428A true CN110490428A (zh) 2019-11-22

Family

ID=68547591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910683661.1A Pending CN110490428A (zh) 2019-07-26 2019-07-26 空中交通管制工作质量评估方法及相关装置

Country Status (1)

Country Link
CN (1) CN110490428A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516997A (zh) * 2021-04-26 2021-10-19 常州分音塔科技有限公司 一种语音事件识别装置和方法
CN113627798A (zh) * 2021-08-12 2021-11-09 中国民航大学 一种用于高空航路飞行的管制效能量化测评方法
CN114187893A (zh) * 2021-12-15 2022-03-15 首都机场集团有限公司 空管语音智能监控方法和系统
CN115547299A (zh) * 2022-11-22 2022-12-30 中国民用航空飞行学院 一种面向管制语音品质划分的量化评价及分类方法和装置
CN115938347A (zh) * 2023-03-13 2023-04-07 中国民用航空飞行学院 基于语音识别的飞行学员通话规范性评分方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887725A (zh) * 2010-04-30 2010-11-17 中国科学院声学研究所 一种基于音素混淆网络的音素后验概率计算方法
CN104933530A (zh) * 2015-06-29 2015-09-23 中国民用航空厦门空中交通管理站 空管实时管制效能评价系统
CN105261362A (zh) * 2015-09-07 2016-01-20 科大讯飞股份有限公司 一种通话语音监测方法及系统
JP2016076788A (ja) * 2014-10-03 2016-05-12 みずほ情報総研株式会社 通話評価システム、通話評価方法及び通話評価プログラム
CN109256152A (zh) * 2018-11-08 2019-01-22 上海起作业信息科技有限公司 语音评分方法及装置、电子设备、存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887725A (zh) * 2010-04-30 2010-11-17 中国科学院声学研究所 一种基于音素混淆网络的音素后验概率计算方法
JP2016076788A (ja) * 2014-10-03 2016-05-12 みずほ情報総研株式会社 通話評価システム、通話評価方法及び通話評価プログラム
CN104933530A (zh) * 2015-06-29 2015-09-23 中国民用航空厦门空中交通管理站 空管实时管制效能评价系统
CN105261362A (zh) * 2015-09-07 2016-01-20 科大讯飞股份有限公司 一种通话语音监测方法及系统
CN109256152A (zh) * 2018-11-08 2019-01-22 上海起作业信息科技有限公司 语音评分方法及装置、电子设备、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄孝建: "多媒体技术", vol. 2, 北京邮电大学出版社, pages: 221 - 222 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516997A (zh) * 2021-04-26 2021-10-19 常州分音塔科技有限公司 一种语音事件识别装置和方法
CN113627798A (zh) * 2021-08-12 2021-11-09 中国民航大学 一种用于高空航路飞行的管制效能量化测评方法
CN113627798B (zh) * 2021-08-12 2023-07-18 中国民航大学 一种用于高空航路飞行的管制效能量化测评方法
CN114187893A (zh) * 2021-12-15 2022-03-15 首都机场集团有限公司 空管语音智能监控方法和系统
CN114187893B (zh) * 2021-12-15 2024-07-02 首都机场集团有限公司 空管语音智能监控方法和系统
CN115547299A (zh) * 2022-11-22 2022-12-30 中国民用航空飞行学院 一种面向管制语音品质划分的量化评价及分类方法和装置
CN115938347A (zh) * 2023-03-13 2023-04-07 中国民用航空飞行学院 基于语音识别的飞行学员通话规范性评分方法及系统
CN115938347B (zh) * 2023-03-13 2023-05-23 中国民用航空飞行学院 基于语音识别的飞行学员通话规范性评分方法及系统

Similar Documents

Publication Publication Date Title
CN110490428A (zh) 空中交通管制工作质量评估方法及相关装置
CN107818798B (zh) 客服服务质量评价方法、装置、设备及存储介质
CN108962255B (zh) 语音会话的情绪识别方法、装置、服务器和存储介质
CN105096940B (zh) 用于进行语音识别的方法和装置
CN107680601B (zh) 一种基于语谱图和音素检索的身份同一性检验方法及装置
US9070369B2 (en) Real time generation of audio content summaries
CN108428446A (zh) 语音识别方法和装置
CN105336342B (zh) 语音识别结果评价方法及系统
US20160240215A1 (en) System and Method for Text-to-Speech Performance Evaluation
CN107492382A (zh) 基于神经网络的声纹信息提取方法及装置
CN109545197B (zh) 语音指令的识别方法、装置和智能终端
CN106503646A (zh) 多模态情感辨识系统及方法
CN106297826A (zh) 语音情感辨识系统及方法
CN106297773A (zh) 一种神经网络声学模型训练方法
CN108766417B (zh) 一种基于音素自动检索的身份同一性检验方法及装置
CN108833722A (zh) 语音识别方法、装置、计算机设备及存储介质
CN110148399A (zh) 一种智能设备的控制方法、装置、设备及介质
CN104575519B (zh) 特征提取方法、装置及重音检测的方法、装置
CN110600014B (zh) 一种模型训练方法、装置、存储介质及电子设备
CN105374352A (zh) 一种语音激活方法及系统
CN109326162A (zh) 一种口语练习自动评测方法及装置
CN104347071B (zh) 生成口语考试参考答案的方法及系统
CN106297765B (zh) 语音合成方法及系统
CN106782517A (zh) 一种语音音频关键词过滤方法及装置
CN107863098A (zh) 一种语音识别控制方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination