CN117037768A - 一种语义的测试方法、装置及计算机可读存储介质 - Google Patents

一种语义的测试方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN117037768A
CN117037768A CN202311101274.5A CN202311101274A CN117037768A CN 117037768 A CN117037768 A CN 117037768A CN 202311101274 A CN202311101274 A CN 202311101274A CN 117037768 A CN117037768 A CN 117037768A
Authority
CN
China
Prior art keywords
target
voices
test
preset
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311101274.5A
Other languages
English (en)
Inventor
于红超
徐开庭
刘群
张正萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thalys Automobile Co ltd
Original Assignee
Thalys Automobile Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thalys Automobile Co ltd filed Critical Thalys Automobile Co ltd
Priority to CN202311101274.5A priority Critical patent/CN117037768A/zh
Publication of CN117037768A publication Critical patent/CN117037768A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例涉及测试技术领域,公开了一种语义的测试方法、装置及计算机可读存储介质,方法包括:根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式;若为目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据多条模拟语音生成模拟音频;其中,模拟音频包括模拟语音之间预设间隔时长的多条模拟语音;根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果。本申请实施例无需人工输入测试语音,便能自动快速生成模拟语音,以提高语义测试效率。并通过在模拟语音之间预设间隔时长,以模拟出真实话语之间的语气停顿时长,便于断句处理,从而提高语义识别的准确性。

Description

一种语义的测试方法、装置及计算机可读存储介质
技术领域
本申请实施例涉及测试技术领域,具体涉及一种语义的测试方法、装置及计算机可读存储介质。
背景技术
现有语音功能测试人员,通常时对着麦克风说出语音指令,然后测试自己开发的功能。在针对成千上万条语音进行批量测试时,测试人员需利用人工嘴等设备才能完成自动化测试。测试过程中,多个测试人员对着各自麦克风进行语音输入,在相邻测试人员输出各自语音的同时,会出现相互干扰的情况,并且通过人工输入语音,以进行语义测试的测试效率较低。
发明内容
鉴于上述问题,本申请实施例提供了一种语义的测试方法、装置及计算机可读存储介质,以自动生成多条模拟语音,提高语义测试效率。
根据本申请实施例的一个方面,提供了一种语义的测试方法,所述测试方法包括:根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式;若为所述目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据所述多条模拟语音生成模拟音频;其中,所述模拟音频包括模拟语音之间预设间隔时长的多条模拟语音;根据所述模拟音频识别得到语义信息,并根据所述语义信息确定出测试结果。
在一种可选的方式中,所述根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式,进一步包括:响应接收到的用户触发的测试指令,读取所述测试指令指定的应用配置信息;检测读取到的应用配置信息是否为目标应用配置信息,并根据检测结果确定语音数据的采集方式是否为目标采集方式;若所述检测结果表征读取到的应用配置信息为所述目标应用配置信息,则确定所述语音数据的采集方式为所述目标采集方式。
在一种可选的方式中,在所述将预设文本列表中的多条预设文本转化为多条模拟语音之前,所述测试方法还包括:将所述多条预设文本写入初始文本列表中,并在每条预设文本之间设置预设长度的空白文本,以得到所述预设文本列表。
在一种可选的方式中,所述根据所述多条模拟语音生成模拟音频,进一步包括:获取每条预设文本之间的所述预设长度的空白文本,并将所述预设长度的空白文本转化为所述预设间隔时长的空白语音;在每两条模拟语音之间设置所述预设间隔时长的空白语音,以生成模拟音频。
在一种可选的方式中,所述根据所述模拟音频识别得到语义信息,并根据所述语义信息确定出测试结果,进一步包括:遍历所述模拟音频中的模拟语音,并将遍历到的模拟语音作为目标模拟语音;根据所述目标模拟语音识别得到目标语义信息,并根据所述目标语义信息确定出所述目标模拟语音的测试结果,以得到所有模拟语音对应的测试结果。
在一种可选的方式中,所述根据所述目标语义信息确定出所述目标模拟语音的测试结果,进一步包括:执行所述目标语义信息对应的目标动作,并根据所述目标动作对应的目标执行结果确定出所述目标模拟语音的测试结果;若所述目标执行结果表征所述目标动作执行成功,则确定出表征所述目标模拟语音测试成功的测试结果;若所述目标执行结果表征所述目标动作执行失败,则确定出表征所述目标模拟语音测试失败的测试结果。
在一种可选的方式中,所述测试方法还包括:获取执行所述目标语义信息的起始时刻,以及获取确定出所述目标模拟语音的测试结果时对应的结尾时刻;将所述起始时刻,结尾时刻和所述目标模拟语音的测试结果存储至系统日志。
根据本申请实施例的另一方面,提供了一种语义的测试装置,所述测试装置包括:确定模块,用于根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式;转化模块,用于若为所述目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据所述多条模拟语音生成模拟音频;其中,所述模拟音频包括模拟语音之间存在预设间隔时长的多条模拟语音;测试模块,用于根据所述模拟音频识别得到语义信息,并根据所述语义信息确定出测试结果。
根据本申请实施例的一个方面,提供了一种电子设备,包括:控制器;存储器,用于存储一个或多个程序,当一个或多个程序被所述控制器执行时,以执行上述的测试方法。
根据本申请实施例的一个方面,还提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行上述的测试方法。
根据本申请实施例的一个方面,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的测试方法。
本申请实施例根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式,以灵活选取语音数据的采集方式;若为目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据多条模拟语音生成模拟音频;其中,模拟音频包括模拟语音之间预设间隔时长的多条模拟语音;本申请实施例通过在模拟语音之间预设间隔时长,以模拟出真实话语之间的语气停顿时长,便于断句处理,从而提高语义识别的准确性;根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果。本申请实施例能自动生成模拟语音,以提高语义测试效率。
上述说明仅是本申请实施例技术方案的概述,为了能够更清楚了解本申请实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本申请实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一示例性实施例示出的一种语义的测试方法的流程示意图。
图2是本申请一示例性实施例示出的语音数据采集接口的结构示意图。
图3是基于图1所示示例性实施例示出的另一种语义的测试方法的流程示意图。
图4是本申请语义的测试方法的应用场景的示意图。
图5是本申请一示例性实施例示出的确定语义测试场景的流程示意图。
图6是本申请一示例性实施例示出的语义的测试装置的结构示意图。
图7是本申请的一示例性实施例示出的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
针对成千上万条语音的语义测试,通常需要多个测试人员共同开发,各个测试人员对着各自麦克风输入语音,一方面会影响工位其他测试人员的工作效率,另一方面相邻测试人员在输出各自语音的同时,会出现相互干扰的情况,并且通过人工输入语音,以进行语义测试的测试效率较低。
为此,本申请的一方面提供了一种语义的测试方法,无需测试人员通过麦克风输入语音,就能自动生成多条模拟语音,避免语义测试过程出现干扰情况的同时提高了语义测试效率。具体请参阅图1,图1是本申请一示例性实施例示出的一种语义的测试方法的流程示意图。该测试方法至少包括S110至S130,详细介绍如下:
S110:根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式。
本实施例语音数据的采集方式包括两种方式,其一为常见采集测试人员实时输入的语音数据,其二为本实施例生成模拟音频的方式。请参阅图2,图2是本申请一示例性实施例示出的语音数据采集接口的结构示意图。其中,语音数据采集接口为Record接口,Record接口连接物理设备录音器和TTS录音器;物理设备录音器包括Android录音系统;TTS录音器包括TTS实例和文本读取模块;物理设备录音器用于录制实际环境中的声音;TTS录音器用于语义测试场景。不同采集方式采集到的语音数据皆可赋值给Record对象,即不同采集方式采集得到的语音数据共用同一接口,并且遵循了里氏代换原则,使得语音数据的采集方式可以无缝切换。特别是在暂停、恢复等高频率使用接口时,无需植入代码,并且初始化的时候也是同样的参数列表,极大降低了采集方式切换过程中出问题的概率。
S120:若为目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据多条模拟语音生成模拟音频;其中,模拟音频包括模拟语音之间预设间隔时长的多条模拟语音。
本实施例中的目标采集方式为上述第二种采集方式,通过设置如图2所示的TTS(Text To Speech,文本转化为语音)录音器,图2是本申请一示例性实施例示出的TTS录音器的结构示意图。其中,TTS录音器包括TTS实例和文本读取模块;其中,TTS实例将预设文本列表中的多条预设文本转化为多条模拟语音,以生成模拟音频;文本读取模块可读取多种格式的文本,以生成预设文本列表中的多条预设文本,例如从txt文本,excel文本中读取出多条预设文本。
其中,预设文本列表中的每一行文本对应生成一条模拟语音,并且每条模拟语音之间存在预设间隔时长,例如3-5秒,即当前模拟语音播放结束后需停顿3-5秒播放下一条模拟语音,以模拟出真实话语之间的语气停顿,方便断句的同时提高了识别出每条模拟语音的语义的准确性。
本申请中的模拟语音和模拟音频皆可为静音形式,即可将它们进行静音形式的播放、测试过程等,从而避免在测试过程中产生声音干扰。
S130:根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果。
一示例性地,逐一识别模拟音频中的每一条模拟语音的语义信息,并逐一执行每个语义信息对应的动作指令,以得出每个语义信息的测试结果,并汇总得到结果测试表。
另一示例性地,同时执行每个语义信息对应的动作指令,以根据每个语义信息对应的执行结果确定出响应的测试结果,并汇总得到结果测试表。
本实施例根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式,以灵活选取语音数据的采集方式;若为目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据多条模拟语音生成模拟音频;其中,模拟音频包括模拟语音之间预设间隔时长的多条模拟语音;本实施例通过在模拟语音之间预设间隔时长,以模拟出真实话语之间的语气停顿时长,便于断句处理,从而提高语义识别的准确性;根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果。本实施例能自动生成模拟语音,无需多个测试人员参与测试,在节省人力成本的同时提高了语义测试效率。
在本申请另一示例性实施例中,详细介绍了如何根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式,具体请参阅图3,图3是基于图1所示示例性实施例示出的另一种语义的测试方法的流程示意图。该测试方法在如图1所示的S110中进一步包括S310至S330,详细介绍如下:
S310:响应接收到的用户触发的测试指令,读取测试指令指定的应用配置信息。
用户可根据实际需求选取相应的语音数据采集方式,用户触发测试指令至本实施例的执行端,执行端为响应该测试指令,读取该测试指令中指定的应用配置信息,从而根据读取到的应用配置信息确定出相应的语音数据采集方式。
示例性地,执行端为响应接收到的用户触发的测试指令,读取测试指令中指定的应用配置信息的编号,根据该编号确定出相应的应用配置信息,例如,编号1对应第一应用配置信息,编号2对应第二应用配置信息。
S320:检测读取到的应用配置信息是否为目标应用配置信息,并根据检测结果确定语音数据的采集方式是否为目标采集方式。
示例性地,编号1对应第一应用配置信息,编号2对应第二应用配置信息(即本实施例的目标应用配置信息),若测试指令中指定的应用配置信息的编号为2,则确定当前读取到的应用配置信息为第二应用配置信息(目标应用配置信息),语音数据的采集方式为目标采集方式。
S330:若检测结果表征读取到的应用配置信息为目标应用配置信息,则确定语音数据的采集方式为目标采集方式。
若检测结果表征读取到的应用配置信息并非目标应用配置信息,则确定语音数据的采集方式并非目标采集方式。
本实施例提供了一种语音数据的目标采集方式的确定方式,通过读取用户触发的测试指令指定的应用配置信息,通过将该应用配置信息与目标采集方式对应的目标应用配置信息进行匹配,若匹配成功,则可快速确定语音数据的采集方式为目标采集方式。
在本申请另一示例性实施例中,详细介绍了如何构建预设文本列表,具体步骤为:将多条预设文本写入初始文本列表中,并在每条预设文本之间设置预设长度的空白文本,以得到预设文本列表。
初始文本列表可以理解为空白的文本列表,即初始文本列表中无相关预设文本。预设文本列表是包括至少一条预设文本的列表,并且其中每条预设文本之间存在预设长度的空白文本。
示例性地,预设文本列表具体内容为“A预设文本00000B预设文本00000C预设文本”;其中,“00000”表征预设长度的空白文本。
另一示例性地,构建表1所示的预设文本列表,表1是示例性预设文本列表。其中,“00000”表征预设长度的空白文本。
第一预设文本 打开蓝牙播放器00000
第二预设文本 开启车窗00000
第三预设文本 打开收音机00000
…… ……
表1
本实施例通过在每条预设文本之间存在预设长度的空白文本,以使根据预设文本生成包括多条模拟语音的模拟音频后,每条模拟语音之间存在预设间隔时长空白语音,以模拟出真实话语之间的语气停顿时长,便于断句处理,从而提高语义识别的准确性。
进一步地,介绍了如何根据多条模拟语音生成模拟音频,即上述S120进一步包括S1201至S1202,详细介绍如下:
S1201:获取每条预设文本之间的预设长度的空白文本,并将预设长度的空白文本转化为预设间隔时长的空白语音。
空白文本能转化为空白语音,空白语音的时长与空白文本的长度呈正相关。
S1202:在每两条模拟语音之间设置预设间隔时长的空白语音,以生成模拟音频。
示例性地,获取表1中的第一预设文本至第三预设文本,以及“00000”的空白文本,将该空白文本转化为3秒的空白语音,按照预设文本的原有顺序进行排列,以生成模拟音频。若播放该模拟音频,则在“打开蓝牙播放器”之后3秒再播放“开启车窗”,随后再间隔3秒播放“打开收音机”。在生成模拟音频的过程中,预设文本也可随意排序或按照其它顺序排序,本实施例并不对此进行限定。
在某些实施例中,可以以一个预设文本和一个空白文本生成一个模拟音频,从而根据多个模拟音频进行语义测试,即每生成一个模拟音频就行进一次语义测试。
本实施例提供了一种生成模拟音频的方式,通过在每两条模拟语音之间设置预设间隔时长的空白语音,以使得生成的模拟音频更符合真是场景下的人声音频,更好地模拟出真实话语之间的语气停顿时长,便于断句处理,从而提高语义识别的准确性。
在本申请另一示例性实施例中,详细介绍了如何根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果,即上述S130进一步包括S1301至S1302,详细介绍如下:
S1301:遍历模拟音频中的模拟语音,并将遍历到的模拟语音作为目标模拟语音。
本实施例通过遍历的方式,以保证无遗漏地对模拟音频中的每条模拟语音进行语义测试,以得到模拟音频中所有模拟语音对应的测试结果。
S1302:根据目标模拟语音识别得到目标语义信息,并根据目标语义信息确定出目标模拟语音的测试结果,以得到所有模拟语音对应的测试结果。
示例性地,遍历到第二模拟语音,则对第二模拟语音进行识别操作,以得到第二模拟语音对应的语义信息,即当前的目标语义信息,根据目标语义信息进行相关比较分析,以确定出第二模拟语音的测试结果,依次类推,得到模拟音频中所有模拟语音对应的测试结果。
本实施例提供了一种确定出模拟音频中所有模拟语音对应的测试结果的方式,通过遍历模拟音频中的每条模拟语音,并识别得到遍历到的模拟语音的语义信息,从而确定出遍历到的模拟语音的测试结果,从而无遗漏地对模拟音频中的每条模拟语音进行语义测试,以准确得到模拟音频中所有模拟语音对应的测试结果。
在本申请另一示例性实施例中,详细介绍了如何根据目标语义信息确定出目标模拟语音的测试结果,即上述S1302进一步包括S13021至S13023,详细介绍如下:
S13021:执行目标语义信息对应的目标动作,并根据目标动作对应的目标执行结果确定出目标模拟语音的测试结果。
S13022:若目标执行结果表征目标动作执行成功,则确定出表征目标模拟语音测试成功的测试结果。
S13023:若目标执行结果表征目标动作执行失败,则确定出表征目标模拟语音测试失败的测试结果。
示例性地,目标语义信息对应的目标动作为“播放A歌手的歌曲”,若执行的动作为“播放了A歌手的XX歌曲”,则表征成功执行了目标动作,进而目标模拟语音的测试结果表征目标模拟语音测试成功;若执行动作为“播放了B歌手的歌曲”或者“打开收音机”,则表征执行目标动作失败,进而目标模拟语音的测试结果表征目标模拟语音测试失败。
在某些实施例中可以将所有测试结果汇总于测试结果列表,该测试结果列表中不仅包括各条模拟语音及其对应的测试结果,还可包括各条模拟语音对应的原始预设文本,和执行相应动作前后的测试页面的截图等,还可包括执行相应动作前后的时间戳。将上述测试结果列表保存至gradle脚本文件中配置的结果文件路径,如果定义的是Excel则用excel文件保存,也支持doc等其他图文并茂的格式。测试人员可以在测试完成后通过查看表格结果以及对应的日志进行测试分析。
本实施例提供了一种目标模拟语音的测试结果的确定方式,通过执行目标语义信息对应的目标动作,根据执行结果间接确定出目标模拟语音的测试结果,将目标动作的执行结果与目标模拟语音的测试结果建立正向关系,以方便快速确定出目标模拟语音的测试结果。
在某些实施例中,还会记录执行目标语义信息对应的目标动作的前后时间戳,以方便测试人员通过系统日志获取相应时间戳,以优化测试过程。具体地,测试方法还包括:获取执行目标语义信息的起始时刻,以及获取确定出目标模拟语音的测试结果时对应的结尾时刻;将起始时刻,结尾时刻和目标模拟语音的测试结果存储至系统日志。
示例性地,执行目标语义信息的起始时刻为10:00,确定出目标模拟语音的测试结果时对应的结尾时刻为10:01,即执行完目标语义信息的结尾时刻为10:01,则可将上述两个时间戳和目标语音的测试结果记录至测试结果列表中,将其保存到相应文件中,进而存储至系统日志,方便测试人员获取相关信息,以分析优化测试过程。另外,可将系统日志进行压缩保存,以防止相关数据被覆盖。
在某些实施例中,还可根据起始时刻和结尾时刻计算得到目标动作的执行时长,并将执行时长存储至系统日志中,以方便测试人员查询目标动作的执行时长。
在本申请另一示例性实施例中对上述多个测试方法的应用场景进行了示例性说明,具体请参阅图4,图4是本申请语义的测试方法的应用场景的示意图。其中,包括服务器100,服务器100可控制TTS101,录音模块102,语音识别引擎模块103,语义执行模块104,测试结果模块105和指令集合106,它们之间可通过无线通信或有线的方式连接,本申请并不限制它们之间的连接方式。
服务器100作为执行端控制相应模块,以执行上述任一示例性实施例示出的测试方法,示例性地,服务器100根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式;若为目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据多条模拟语音生成模拟音频;其中,模拟音频包括模拟语音之间预设间隔时长的多条模拟语音;服务器100根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果。
为了更清楚的阐述各个模块的功能,以及各个模块之间的逻辑关系,下面对各个模块进行详细说明:
录音模块102中定义了一个Record对象,如图2所示Record接口与TTS录音器(TTS101)和物理设备录音器连接,录音模块102判断当前场景处于自动化语义测试场景,则会初始化TTS101,TTS101中的文本读取模块则会从指令集合106中读取相应的预设指令文本,并将其实例后的对象幅值给Record对象中。由于两个实现类都采用了同样的接口,并且遵循了里氏代换原则,录音模块102可以在切换物理设备录音器和TTS录音器的时候便可以无缝的进行切换,在暂停恢复等高频率使用的接口时完全不需要做什么代码植入,并且初始化的时候也是同样的参数列表,极大降低了软件出问题的概率。其中,录音数据皆采用pcm格式,即录音模块102可将物理设备录音器传入的数据格式转换为pcm格式,TTS101生成并传入录音模块102的数据格式也为pcm格式。另外,测试结果模块105输出的数据格式也为pcm格式,输出的数据用于播报测试结果。
语音识别引擎模块103的识别速度有限,例如16Khz采样率,16Bit的单声道格式,意味着录音模块102每秒钟要生成16000*2Byte的pcm数据,如果不限制其生成速度将会使得语音识别引擎模块103卡滞,但是如果录音模块102生成pcm数据过慢,语音识别引擎模块103识别出来的音频数据会出现卡顿的情况,并不能模拟通过真实物理录音设备进行语义测试的场景。
语义执行模块104接收到语音识别引擎模块103发送的语义信息,执行语义信息对应的动作,并将执行结果发送至测试结果模块105。测试结果模块105根据接收到的执行结果确定出对应的测试结果,生成携带有测试结果的pcm格式语音数据,并发送至播放终端,以播放测试结果。
指令集合106中存在着多条测试指令对应的预设文本,即每条测试指令对应有相应的预设文本,以使TTS101中的文本读取模块从中读取相应的测试指令对应的预设文本。
服务器100可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,其中多个服务器可组成一区块链,而服务器为区块链上的节点,服务器100还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,本处也不对此进行限制。
结合上述应用场景,进一步说明如何判断当前语义测试场景为自动化语义测试场景,自动化语义测试场景即采用TTS101生成模拟音频进行语义测试的场景,详细介绍如下:
自动化语义测试场景的脚本文件中配置有两个路径,一个是测试指令集文件路径,一个测试结果文件路径。在录音模块102中通过BuildConfig即可读取到这两个文件路径,再结合文件系统的接口判断测试指令集文件是否存在此文件中,如果存在则将认定为当前测试场景为自动化语义测试场景。具体请参阅图5,图5是本申请一示例性实施例示出的确定语义测试场景的流程示意图。
首先,在gradle文件中定义两个字符串类型的变量:测试指令集文件路径和测试结果文件路径,并配置定义变量,以使得在代码层面可使用BuildConfig读取到定义的变量值;
然后,根据读取到的定义的变量值,检测测试指令集文件定义的地址是否为空,且是否为有效地址;若地址非空,且是有效地址,则确定当前语义测试场景为自动化语义测试场景;
最后,通过TTS101中的文本读取模块读取指令集合106中的excel文件中的测试指令对应的预设文本,TTS101中的TTS实例根据读取到的预设文本生成pcm格式的模拟音频传入录音模块102。
本申请的另一方面还提供了一种语义的测试装置,如图6所示,图6是本申请一示例性实施例示出的语义的测试装置的结构示意图。测试装置600包括:
确定模块610,用于根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式。
转化模块630,用于若为目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据多条模拟语音生成模拟音频;其中,模拟音频包括模拟语音之间存在预设间隔时长的多条模拟语音。
测试模块650,用于根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果。
在一种可选的方式中,确定模块610进一步包括:
响应单元,用于响应接收到的用户触发的测试指令,读取测试指令指定的应用配置信息。
检测单元,用于检测读取到的应用配置信息是否为目标应用配置信息,并根据检测结果确定语音数据的采集方式是否为目标采集方式。
采集方式确定单元,用于若检测结果表征读取到的应用配置信息为目标应用配置信息,则确定语音数据的采集方式为目标采集方式。
在一种可选的方式中,测试装置600还包括:
预设文本列表生成模块,用于将多条预设文本写入初始文本列表中,并在每条预设文本之间设置预设长度的空白文本,以得到预设文本列表。
在一种可选的方式中,转化模块630进一步包括:
获取单元,用于获取每条预设文本之间的预设长度的空白文本,并将预设长度的空白文本转化为预设间隔时长的空白语音。
设置单元,用于在每两条模拟语音之间设置预设间隔时长的空白语音,以生成模拟音频。
在一种可选的方式中,测试模块650进一步包括:
遍历单元,用于遍历模拟音频中的模拟语音,并将遍历到的模拟语音作为目标模拟语音。
测试单元,用于根据目标模拟语音识别得到目标语义信息,并根据目标语义信息确定出目标模拟语音的测试结果,以得到所有模拟语音对应的测试结果。
在一种可选的方式中,测试模块650进一步包括:
执行单元,用于执行目标语义信息对应的目标动作,并根据目标动作对应的目标执行结果确定出目标模拟语音的测试结果。
执行成功单元,用于若目标执行结果表征目标动作执行成功,则确定出表征目标模拟语音测试成功的测试结果。
执行失败单元,用于若目标执行结果表征目标动作执行失败,则确定出表征目标模拟语音测试失败的测试结果。
在一种可选的方式中,测试装置600还包括:
时刻获取模块,用于获取执行目标语义信息的起始时刻,以及获取确定出目标模拟语音的测试结果时对应的结尾时刻。
存储模块,用于将起始时刻,结尾时刻和目标模拟语音的测试结果存储至系统日志。
本申请测试装置根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式,以灵活选取语音数据的采集方式;若为目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据多条模拟语音生成模拟音频;其中,模拟音频包括模拟语音之间预设间隔时长的多条模拟语音;本申请测试装置通过在模拟语音之间预设间隔时长,以模拟出真实话语之间的语气停顿时长,便于断句处理,从而提高语义识别的准确性;根据模拟音频识别得到语义信息,并根据语义信息确定出测试结果。本申请测试装置能自动生成模拟语音,以提高语义测试效率。
需要说明的是,上述实施例所提供的测试装置与前述实施例所提供的测试方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,这里不再赘述。
本申请的另一方面还提供了一种电子设备,包括:控制器;存储器,用于存储一个或多个程序,当一个或多个程序被控制器执行时,以执行上述的测试方法。
请参阅图7,图7是本申请的一示例性实施例示出的电子设备的计算机系统的结构示意图,其示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图7示出的电子设备的计算机系统700仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(Central Processing Unit,CPU)701,其可以根据存储在只读存储器(Read-Only Memory,ROM)702中的程序或者从存储部分708加载到随机访问存储器(Random Access Memory,RAM)703中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 703中,还存储有系统操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(Input/Output,I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不相同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前的测试方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的测试方法。
根据本申请实施例的一个方面,还提供了一种计算机系统,包括中央处理单元(Central Processing Unit,CPU),其可以根据存储在只读存储器(Read-Only Memory,ROM)中的程序或者从存储部分加载到随机访问存储器(Random Access Memory,RAM)中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM中,还存储有系统操作所需的各种程序和数据。CPU、ROM以及RAM通过总线彼此相连。输入/输出(Input/Output,I/O)接口也连接至总线。
以下部件连接至I/O接口:包括键盘、鼠标等的输入部分;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术人员根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。

Claims (10)

1.一种语义的测试方法,其特征在于,所述测试方法包括:
根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式;
若为所述目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据所述多条模拟语音生成模拟音频;其中,所述模拟音频包括模拟语音之间预设间隔时长的多条模拟语音;
根据所述模拟音频识别得到语义信息,并根据所述语义信息确定出测试结果。
2.根据权利要求1所述的测试方法,其特征在于,所述根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式,进一步包括:
响应接收到的用户触发的测试指令,读取所述测试指令指定的应用配置信息;
检测读取到的应用配置信息是否为目标应用配置信息,并根据检测结果确定语音数据的采集方式是否为目标采集方式;
若所述检测结果表征读取到的应用配置信息为所述目标应用配置信息,则确定所述语音数据的采集方式为所述目标采集方式。
3.根据权利要求1所述的测试方法,其特征在于,在所述将预设文本列表中的多条预设文本转化为多条模拟语音之前,所述测试方法还包括:
将所述多条预设文本写入初始文本列表中,并在每条预设文本之间设置预设长度的空白文本,以得到所述预设文本列表。
4.根据权利要求3所述的测试方法,其特征在于,所述根据所述多条模拟语音生成模拟音频,进一步包括:
获取每条预设文本之间的所述预设长度的空白文本,并将所述预设长度的空白文本转化为所述预设间隔时长的空白语音;
在每两条模拟语音之间设置所述预设间隔时长的空白语音,以生成模拟音频。
5.根据权利要求1所述的测试方法,其特征在于,所述根据所述模拟音频识别得到语义信息,并根据所述语义信息确定出测试结果,进一步包括:
遍历所述模拟音频中的模拟语音,并将遍历到的模拟语音作为目标模拟语音;
根据所述目标模拟语音识别得到目标语义信息,并根据所述目标语义信息确定出所述目标模拟语音的测试结果,以得到所有模拟语音对应的测试结果。
6.根据权利要求5所述的测试方法,其特征在于,所述根据所述目标语义信息确定出所述目标模拟语音的测试结果,进一步包括:
执行所述目标语义信息对应的目标动作,并根据所述目标动作对应的目标执行结果确定出所述目标模拟语音的测试结果;
若所述目标执行结果表征所述目标动作执行成功,则确定出表征所述目标模拟语音测试成功的测试结果;
若所述目标执行结果表征所述目标动作执行失败,则确定出表征所述目标模拟语音测试失败的测试结果。
7.根据权利要求6所述的测试方法,其特征在于,所述测试方法还包括:
获取执行所述目标语义信息的起始时刻,以及获取确定出所述目标模拟语音的测试结果时对应的结尾时刻;
将所述起始时刻,结尾时刻和所述目标模拟语音的测试结果存储至系统日志。
8.一种语义的测试装置,其特征在于,所述测试装置包括:
确定模块,用于根据读取到的应用配置信息确定语音数据的采集方式是否为目标采集方式;
转化模块,用于若为所述目标采集方式,则将预设文本列表中的多条预设文本转化为多条模拟语音,并根据所述多条模拟语音生成模拟音频;其中,所述模拟音频包括模拟语音之间存在预设间隔时长的多条模拟语音;
测试模块,用于根据所述模拟音频识别得到语义信息,并根据所述语义信息确定出测试结果。
9.一种电子设备,其特征在于,包括:
控制器;
存储器,用于存储一个或多个程序,当一个或多个程序被控制器执行时,使得控制器实现权利要求1至7中任一项所述的测试方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1至7中任一项所述的测试方法。
CN202311101274.5A 2023-08-30 2023-08-30 一种语义的测试方法、装置及计算机可读存储介质 Pending CN117037768A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311101274.5A CN117037768A (zh) 2023-08-30 2023-08-30 一种语义的测试方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311101274.5A CN117037768A (zh) 2023-08-30 2023-08-30 一种语义的测试方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117037768A true CN117037768A (zh) 2023-11-10

Family

ID=88633553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311101274.5A Pending CN117037768A (zh) 2023-08-30 2023-08-30 一种语义的测试方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117037768A (zh)

Similar Documents

Publication Publication Date Title
CN107516510B (zh) 一种智能设备自动化语音测试方法及装置
CN111798833B (zh) 一种语音测试方法、装置、设备和存储介质
CN108564966B (zh) 语音测试的方法及其设备、具有存储功能的装置
US10997965B2 (en) Automated voice processing testing system and method
CN111933108B (zh) 一种智能网联终端智能语音交互系统自动化测试方法
CN109871326A (zh) 一种脚本录制的方法和装置
CN109326305B (zh) 一种批量测试语音识别和文本合成的方法和测试系统
CN110379410A (zh) 语音响应速度自动分析方法及系统
US20200098351A1 (en) Techniques for model training for voice features
CN111724781B (zh) 音频数据的存储方法、装置、终端及存储介质
CN112988601A (zh) 测试脚本开发方法及装置
CN110503960A (zh) 语音识别结果的实时上载方法、装置、设备及存储介质
CN113127312B (zh) 用于数据库性能测试的方法、装置、电子设备及存储介质
CN110503982A (zh) 一种语音质量检测的方法以及相关装置
CN113672748A (zh) 多媒体信息播放方法及装置
CN111724769A (zh) 一种智能家居语音识别模型的生产方法
CN108899011B (zh) 一种空调的语音功能测试方法、装置和系统
CN110322587B (zh) 驾驶过程中的评价记录方法、装置、设备及存储介质
CN113674769A (zh) 语音系统测试方法、装置、设备、介质及程序产品
CN113707128B (zh) 用于全双工语音交互系统的测试方法及系统
CN117037768A (zh) 一种语义的测试方法、装置及计算机可读存储介质
CN113297095B (zh) 一种子程序调用路径分支的确定方法及装置
CN114999457A (zh) 语音系统的测试方法、装置、存储介质及电子设备
CN114840421A (zh) 日志数据处理方法及装置
WO2022000141A1 (zh) 基于机器人流程自动化rpa的疫情排查方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination