CN113436611A - 车载语音设备的测试方法、装置、电子设备和存储介质 - Google Patents
车载语音设备的测试方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113436611A CN113436611A CN202110654584.4A CN202110654584A CN113436611A CN 113436611 A CN113436611 A CN 113436611A CN 202110654584 A CN202110654584 A CN 202110654584A CN 113436611 A CN113436611 A CN 113436611A
- Authority
- CN
- China
- Prior art keywords
- data
- vehicle
- voice
- test
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010998 test method Methods 0.000 title claims description 12
- 238000012360 testing method Methods 0.000 claims abstract description 245
- 238000000034 method Methods 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 14
- 238000013473 artificial intelligence Methods 0.000 abstract description 8
- 238000003058 natural language processing Methods 0.000 abstract description 6
- 238000004891 communication Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000004378 air conditioning Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002618 waking effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000009411 base construction Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003924 mental process Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Mechanical Engineering (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Navigation (AREA)
Abstract
本申请公开了车载语音设备的测试方法、装置、电子设备和存储介质,涉及计算机领域,尤其涉及语音技术、自然语言处理等人工智能领域。实现方案为:获取测试语料及测试语料对应的数据标签;根据测试语料对应的数据标签,对测试语料进行解析,以获取测试语料中包含的各个声道对应的音频数据;基于测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与测试语料对应的音频数据;获取车载语音设备的识别结果;根据识别结果及数据标签,确定车载语音设备的性能。由此,通过利用多声道的特性,将多个场景要求放到不同的声道,从而利用声道动态切换测试场景,提高了测试效率,节省了人力成本,安全性高。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及语音技术、自然语言处理等人工智能领域,具体涉及车载语音设备的测试方法、装置、电子设备和存储介质。
背景技术
随着科技的发展,语音识别功能在车辆上得到了广泛应用。在车辆投入市场前,需要对车载语音识别设备进行测试。在对车载语音设备的测试程中,通常有多种测试场景。
因此,如何提高车载语音设备的测试效率是亟待解决的问题。
发明内容
本申请提供了一种车载语音设备的测试方法、装置、电子设备和存储介质。
根据本申请的一方面,提供了一种车载语音设备的测试方法,包括:
获取测试语料及所述测试语料对应的数据标签;
根据所述测试语料对应的数据标签,对所述测试语料进行解析,以获取所述测试语料中包含的各个声道对应的音频数据;
基于所述测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与所述测试语料对应的音频数据;
获取所述车载语音设备的识别结果;
根据所述识别结果及所述数据标签,确定所述车载语音设备的性能。
根据本申请的另一方面,提供了一种车载语音设备的测试装置,包括:
第一获取模块,用于获取测试语料及所述测试语料对应的数据标签;
解析模块,用于根据所述测试语料对应的数据标签,对所述测试语料进行解析,以获取所述测试语料中包含的各个声道对应的音频数据;
调整模块,用于基于所述测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与所述测试语料对应的音频数据;
第二获取模块,用于获取所述车载语音设备的识别结果;
确定模块,用于根据所述识别结果及所述数据标签,确定所述车载语音设备的性能。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例所述的方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述实施例所述的方法。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述实施例所述的方法。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的一种车载语音设备的测试方法的流程示意图;
图2为本申请实施例提供的另一种车载语音设备的测试方法的流程示意图;
图3为本申请实施例提供的一种车载语音设备的测试方法的流程示意图;
图4为本申请实施例提供的一种车载语音设备的测试方法的流程示意图;
图5为本申请实施例提供的一种车载语音设备的测试过程示意图;
图6为本申请实施例提供的一种车载语音设备的测试装置的结构示意图;
图7是用来实现本申请实施例的车载语音设备的测试方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本申请实施例的车载语音设备的测试方法、装置、电子设备和存储介质。
人工智能是研究使用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术领域也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术包括计算机视觉技术、语音识别技术、自然语言处理技术以及深度学习、大数据处理技术、知识图谱技术等几大方向。
NLP(Natural Language Processing,自然语言处理)是计算机科学领域与人工智能领域中的一个重要方向,NLP研究的内容包括但不限于如下分支领域:文本分类、信息抽取、自动摘要、智能问答、话题推荐、机器翻译、主题词识别、知识库构建、深度文本表示、命名实体识别、文本生成、文本分析(词法、句法、语法等)、语音识别与合成等。
语音技术是指在计算机领域中的关键技术有自动语音识别技术和语音合成技术。
图1为本申请实施例提供的一种车载语音设备的测试方法的流程示意图。
本申请实施例的车载语音设备的测试方法,可由本申请实施例提供的车载语音设备的测试装置执行,通过利用多声道的特性,将多个场景要求放到不同的声道,从而利用声道动态切换测试场景,提高了测试效率。
如图1所示,该车载语音设备的测试方法包括:
步骤101,获取测试语料及测试语料对应的数据标签。
本申请中,可以根据多种待测试场景,预先录制好相应的测试语料,该测试语料可以包含多个声道的音频数据。
比如,在播放一定音量音乐的同时,录制唤醒语音,从而生成测试语料,该测试语料中包括唤醒语音数据和音乐的音频数据。又如,在播放一定音量的音乐、空调在某风量档位下的噪声和某车速下的噪声的同时,录制唤醒语音,从而生成测试语料。
本申请中,可以将多个测试语料放在一个音频文件中,在测试时,可以依次获取每个测试语料和测试语料对应的数据标签。该音频文件可以是wav格式的数字音频文件,也可以是其他格式的音频文件,本申请对此不作限定。
其中,数据标签可以用于指示测试语料的类型、测试语料包含的音频数据的类型等。这里测试语料的类型可以是唤醒语料、控制车载设备的语料等;测试语料包含的音频数据的类型,比如可以是人声、音乐声、空调声、车行驶时的噪声等。
比如,数据标签对应的字节数,可与包含的音频数据的数量相同,可以规定每个字节对应的数据类型,比如有4个字节,依次对应人声、音乐声、空调声、车行驶的噪。另外,每个字节不同的取值,可对应不同的含义不同。比如,车行驶的噪声对应的字节取值为0时,可以认为测试语料中不包含车行驶时的噪声;如果取值为1,可以认为噪声为时速为20kM/h时的噪声;如果取值为2,可以认为时速为40kM/h时的噪声等。
步骤102,根据测试语料对应的数据标签,对测试语料进行解析,以获取测试语料中包含的各个声道对应的音频数据。
在获取测试语料和测试语料对应的数据标签后,可根据测试语料对应的数据标签,对测试语料进行解析,获取测试语料中包含的每个声道对应的音频数据。由此,通过对测试语料进行解析,可以获取各个单独声道对应的音频数据。
比如,对某测试语料进行解交织,可以获取该测量语料包含的4个声道分别对应的音频数据,如0声道是测试语音的音频数据、1声道是音乐的音频数据、2声道是空调的音频数据、3声道是某车速下车行驶时的噪声。
步骤103,基于测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与测试语料对应的音频数据。
本申请中,可基于测试语料中包含的各个声道对应的音频数据,对音频播放设备中各个播放声道的工作模式进行调整,比如,播放测试语音数据的声道,根据测试语音调整工作模式,以播放测试语音数据,播放音乐的音频数据的声道,通过调整音量播放音乐等,以使语音播放设备播放与测试语料对应的音频数据。
也就是说,语音播放设备可以通过每个播放声道播放相应声道的音频数据,从而使得测试场景更加接近真实的测试场景。
在语音播放设备播放各个声道对应的音频数据时,车载语音设备可以采集音频数据,并对该音频数据进行识别,并根据识别结果执行相应的控制指令。
步骤104,获取车载语音设备的识别结果。
本申请中,可以从车载语音设备的输出端车载语音设备的日志文件,对日志文件进行解析,获取当前时间段内车载语音设备的识别结果。
比如,测试语料中的测试语音数据为“今天天气如何”,从车载语音设备的日志文件中解析出,车载语音设备的识别结果为“今天天气如果”。
步骤105,根据识别结果及数据标签,确定车载语音设备的性能。
本申请中,数据标签可以指示测试语料的类型、指示执行的控制操作等,在获取车载语音设备的识别结果后,可以根据识别结果与数据标签之间的匹配度,确定车载语音设备的性能。
比如,数据标签指示测试语料为唤醒语料,车载语音设备的识别结果是识别失败未唤醒,可见识别结果与数据标签的匹配度较低,此次测试下车载语音设备的性能未满足要求。
又如,数据标签指示测试语料为控制车载播放设备播放音乐A,如果识别结果为车载播放设备播放音乐A,说明车载语音设备的识别结果与数据标签匹配,此次测试场景下车载语音设备的性能满足要求。
本申请中,可以利用多个测试语料依次对车载语音设备进行测试,直至最后一个测试语料测试完成,并根据每次的测试结果,可以确定车载语音设备的识别率,从而可以确定车载语音设备的性能。
本申请实施例中,通过获取测试语料及测试语料对应的数据标签,并根据测试语料对应的数据标签,对测试语料进行解析,以获取测试语料中包含的各个声道对应的音频数据,基于测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与测试语料对应的音频数据,获取车载语音设备的识别结果,并根据识别结果及数据标签,确定车载语音设备的性能。由此,通过利用多声道的特性,将多个场景要求放到不同的声道,从而利用声道动态切换测试场景,不仅提高了测试效率,而且无需人在不同车速下进行测试,节省了人力成本,安全性高。
在测试语料为控制车载空调的语料时,也可以根据测试语料中对车载设备的控制指令是否被执行,获取车载语音设备的识别结果。比如,测试语料中的测试语音数据为“将空调风量调到2挡”,若空调实际调整到2挡,可以确定车载语音设备的识别结果为识别正确。在本申请的一个实施例中,测试语料对应的数据标签可以指示测试语料为控制车载空调的语料,可根据空调带来的噪声和参考噪声间的匹配度,确定车载语音设备的识别结果。下面结合图2进行说明,图2为本申请实施例提供的一种车载语音设备的测试方法的流程示意图。
如图2所示,该车载语音设备的测试方法,包括:
步骤201,获取测试语料及测试语料对应的数据标签,其中,数据标签指示测试语料为控制车载空调的语料。
步骤202,根据测试语料对应的数据标签,对测试语料进行解析,以获取测试语料中包含的各个声道对应的音频数据。
步骤203,基于测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与测试语料对应的音频数据。
本申请中,步骤201-步骤203与上述步骤101-步骤103类似,故在此不再赘述。
步骤204,根据数据标签,确定参考噪声数据。
本申请中,由于数据标签指示测试语料为控制车载空调的语料,那么可以根据数据标签,确定参考噪声数据。这里的参考噪声数据,可以理解为空调执行相应操作下的噪声数据,相应操作是指测试语料中包含的控制车载空调执行的操作。
比如,测试语料中的测试语音数据为“将空调风量调整到中风”,可以根据数据标签,确定空调风量在中风时的噪声数据,即参考噪声数据。
步骤205,采集车内的第一语音数据。
本申请中,车载语音设备可以采集语音播放设备播放的测试语料对应的音频数据,并根据采集的音频数据进行识别。比如,测试语料中包括控制空调的测语音数据、音乐声等,可以通过麦克风等收音设备采集车内的第一语音数据,这时车内的第一语音数据包括音乐声和空调的噪声。
步骤206,基于数据标签,从第一语音数据中提取噪声数据。
本申请中,可以基于数据标签,确定第一语音数据中包含的音频数据类型,根据音频数据类型从第一语音数据中提取噪声数据。
比如,测试语料中包括控制空调的测语音数据和音乐声等,那么可对第一语音数据进行解析,从第一语音数据中提取噪声数据。
在实际应用中,空调类型不同,产生的噪声频率可能不同,空调工作在不同模式下,产生噪声的频率也可能不同。基于此,也可以根据数据标签,确定车载空调的工作模式,之后根据车载空调的类型和工作模式,待采集的噪声数据的目标频率范围,之后从第一语音数据中,采集目标频率范围内的噪声数据。由此,根据空调的类型和工作模式,提取噪声数据,提高了准确性。
比如,数据标签指示控制空调处于睡眠模式,那么可以根据空调的类型和睡眠模式,确定待采集的噪声数据的目标频率范围,基于该目标频率范围从第一语音数据中提取空调对应的噪声数据。
步骤207,根据噪声数据与参考噪声数据之间的匹配度,确定车载语音设备的识别结果。
本申请中,可以根据噪声数据与参考噪声数据之间的匹配度,确定车载语音设备的识别结果。比如,测试语料中的测试语音数据为“将空调风量调整到中风”,如果提取的噪声数据与空调风量在中风时的噪声数据匹配,说明空调的风量调整到了中风,即测试语料中的测试语音数据被正确识别以及识别出的控制指令被执行;如果提取的噪声数据与空调风量在中风时的噪声数据之间的匹配度小于对应的阈值,可以确定车载语音设备识别错误。
步骤208,根据识别结果及数据标签,确定车载语音设备的性能。
本申请中,步骤208与上述步骤105类似,故在此不再赘述。
本申请实施例中,若数据标签指示测试语料为控制车载空调的语料,在获取车载语音设备的设备结果时,可以通过根据数据标签,确定参考噪声数据,采集车内的第一语音数据,并基于数据标签,从第一语音数据中提取噪声数据,根据噪声数据与参考噪声数据之间的匹配度,确定车载语音设备的识别结果,在获取识别结果后,可以根据识别结果与数据标签,确定车载语音设备的性能。由此,在测试语料为控制车载空调的语料时,可以根据采集的空调的噪声数据与参考噪声数据之间的匹配度,确定车载语音设备的识别结果,实现了测试的自动化,提高了测试效率。
在测试语料为控制车载播放设备的语料时,也可以根据测试语料中对车载播放设备的控制指令是否被执行,获取车载语音设备的识别结果。比如,测试语料中的测试语音数据为“播放音乐B”,若实际播放音乐B,可以确定车载语音设备的识别结果为识别正确。在本申请的一个实施例中,测试语料对应的数据标签可以指示测试语料为控制车载播放设备的语料,可根据音乐对应的音频数据和参考音频数据间的匹配度,确定车载语音设备的识别结果。下面结合图3进行说明,图3为本申请实施例提供的一种车载语音设备的测试方法的流程示意图。
如图3所示,该车载语音设备的测试方法包括:
步骤301,获取测试语料及测试语料对应的数据标签。
步骤302,根据测试语料对应的数据标签,对测试语料进行解析,以获取测试语料中包含的各个声道对应的音频数据。
步骤303,基于测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与测试语料对应的音频数据。
本实施例中,步骤301-步骤303与上述步骤101-步骤103类似,故在此不再赘述。
步骤304,根据数据标签,确定参考音频数据。
本申请中,由于数据标签指示测试语料为控制车载播放设备的语料,可以根据数据标签,确定参考音频数据。
比如,数据标签指示测试语料为控制车载播放设备调整到某音量,那么可以根据数据标签,确定该音量对应的音频数据,即参考音频数据。
又如,数据标签指示测试语料为控制车载播放设备播放某音乐,那么可以根据数据标签,确定该音乐对应的音频数据,即参考音频数据。
在实际应用中,有频繁输入语音指令的情况,比如,输入语音数据“播放音乐A”,间隔几分钟后,又输入语音数据“播放相声M”,这时可以将两个语音数据分别放入不同的测试语料进行测试,且两个测试语料依次进行测试,可以使测试语料中包含一个控制指令,从而可以根据数据标签,确定参考音频数据。
步骤305,采集车内的第二语音数据。
本申请中,车载语音设备可以采集语音播放设备播放的测试语料对应的音频数据,并根据采集的音频数据进行识别。比如,测试语料中包括控制播放设备的测语音数据、音乐声、空调声等,可以通过麦克风等收音设备采集车内的第二语音数据,这时车内的第二语音数据可能包括音乐声和空调的噪声。
步骤306,从第二语音数据中提取车载播放设备对应的音频数据。
由于数据标签指示测试语料为控制播放设备的语料,还可以指示测试语料包含的音频数据的类型,那么根据数据标签可以确定第二语音数据可能包含的音频数据的类型,基于此可以从第二语音数据中提取车载播放设备对应的音频数据。
步骤307,根据车载播放设备对应的音频数据与参考音频数据之间的匹配度,确定车载语音设备的识别结果。
本申请中,可以根据车载播放设备对应的音频数据与参考音频数据之间的匹配度,确定车载语音设备的识别结果。比如,测试语料中的测试语音数据为“播放音乐A”,如果车载播放设备对应的音频数据与音乐A的音频数据匹配,说明车载播放设备正在播放音乐A,即测试语料中的测试语音数据被正确识别以及识别出的控制指令被执行;如果车载播放设备对应的音频数据与音乐A的音频数据匹配之间的匹配度小于对应的阈值,可以确定车载语音设备识别错误。
步骤308,根据识别结果及数据标签,确定车载语音设备的性能。
本申请中,步骤308与上述步骤105类似,故在此不再赘述。
本申请实施例中,若数据标签指示测试语料为控制车载播放设备的语料,在获取车载语音设备的识别结果时,可以通过根据数据标签,确定参考音频数据,采集车内的第二语音数据,并从第二语音数据中提取车载播放设备对应的音频数据,根据车载播放设备对应的音频数据与参考音频数据之间的匹配度,确定车载语音设备的识别结果,在获取识别结果后,可以根据识别结果与数据标签,确定车载语音设备的性能。由此,在测试语料为控制车载播放设备的语料时,可以根据提取的车载播放设备对应的音频数据与参考音频数据之间的匹配度,确定车载语音设备的识别结果,实现了测试的自动化,提高了测试效率。
在实际应用中,测试语料可以是唤醒语料,在本申请的一个实施例中,若数据标签指示测试语料为唤醒语料时,可以根据采集的语音数据与唤醒答复语音数据之间匹配度,确定车载语音设备的识别结果。下面结合图4进行说明,图4为本申请实施例提供的一种车载语音设备的测试方法的流程示意图。
如图4所示,该车载语音设备的测试方法包括:
步骤401,获取测试语料及测试语料对应的数据标签。
步骤402,根据测试语料对应的数据标签,对测试语料进行解析,以获取测试语料中包含的各个声道对应的音频数据。
步骤403,基于测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与测试语料对应的音频数据。
本实施例中,步骤401-步骤403与上述步骤101-步骤103类似,故在此不再赘述。
步骤404,采集车内的第三语音数据。
本申请中,车载语音设备可以采集语音播放设备播放的测试语料对应的音频数据,并根据采集的音频数据进行识别。比如,测试语料中包括唤醒车载语音设备的测语音数据、音乐声、空调声等,可以通过麦克风等收音设备采集车内的第三语音数据,这时车内的第三语音数据可能包括车载语音设备的输出的语音、音乐声和空调的噪声。
步骤405,根据第三语音数据与预设的唤醒答复语音数据之间的匹配度,确定车载语音设备的识别结果。
本申请中,可以根据第三语音数据与预设的唤醒答复语音数据之间的匹配度,确定车载语音设备的识别结果。比如,测试语料中测试语音数据为“小度小度”,如果第三语音数据中包含预设的唤醒答复语音数据“在”,可以认为车载语音设备被唤醒,即车载语音设备识别正确。
步骤406,根据识别结果及数据标签,确定车载语音设备的性能。
本申请中,步骤406与上述步骤105类似,故在此不再赘述。
本申请实施例中,若测试语料为唤醒语料,在获取车载语音设备的识别结果时,可以通过采集车内的第三语音数据,并根据第三语音数据与预设的唤醒答复语音数据之间的匹配度,确定车载语音设备的识别结果,在获取识别结果后,可以根据识别结果与数据标签,确定车载语音设备的性能。由此,在测试语料为唤醒语料时,可以根据采集的车内的第三语音数据与预设的唤醒答复语音数据之间的匹配度,确定车载语音设备的识别结果,实现了测试的自动化,提高了测试效率。
在进行测试时,如果测试语料中包含人声、音乐声、空调声、车行驶时的噪声等,也可以根据测试语料中音乐声的大小控制车载播放设备,根据空调声对应的档位,对车载空调进行控制,并采集车内的音频数据,将采集的音频数据、测试语料中测试语音数据及车行驶时的噪声进行叠加,将混合后的音频数据输入至车载语音设备,以使车载语音设备对混合音频数据进行识别。下面结合图5进行说明,图5为本申请实施例提供的一种车载语音设备的测试过程示意图。
如图5所示,测试语料对应的wav格式的文件中可包含多个声道ch0、ch1、ch2等,对wav文件进行文件解交织拆成单声道,比如环境(如音乐、空调等)控制对应的单声道、底噪对应的单声道等。其中,wav文件的文件头包含声道数量的信息;底噪是指车行驶时的噪声。
基于解析出的音乐的音频数据比如声音大小对车载播放设备进行控制,基于解析出的空调对应的音频数据,对空调进行控制后,可将采集的车内音频数据、测试语音数据及底噪输入至车机音频系统叠加,将混合后的音频输入至车载语音设备进行识别,之后进行测试结果统计。
需要说明的是,音乐和空调对应不同的声道。
在实际测试时,可以直接测试语音数据、底噪等输入至车机音频系统进行叠加,也可以通过两个非车机的播放装置播放测试语音数据和底噪。比如,可以用人工嘴播放测试语音数据。
为了实现上述实施例,本申请实施例还提出一种车载语音设备的测试装置。图6为本申请实施例提供的一种车载语音设备的测试装置的结构示意图。
如图6所示,该车载语音设备的测试装置600包括:
第一获取模块610,用于获取测试语料及所述测试语料对应的数据标签;
解析模块620,用于根据所述测试语料对应的数据标签,对所述测试语料进行解析,以获取所述测试语料中包含的各个声道对应的音频数据;
调整模块630,用于基于所述测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与所述测试语料对应的音频数据;
第二获取模块640,用于获取所述车载语音设备的识别结果;
确定模块650,用于根据所述识别结果及所述数据标签,确定所述车载语音设备的性能。
在本申请实施例一种可能的实现方式中,所述数据标签指示所述测试语料为控制车载空调的语料,所述第二获取模块640,包括:
第一确定单元,用于根据所述数据标签,确定参考噪声数据;
采集单元,用于采集车内的第一语音数据;
提取单元,用于基于所述数据标签,从所述第一语音数据中提取噪声数据;
第二确定单元,用于根据所述噪声数据与所述参考噪声数据之间的匹配度,确定所述车载语音设备的识别结果。
在本申请实施例一种可能的实现方式中,所述提取单元,用于:
根据所述数据标签,确定所述车载空调的工作模式;
根据所述车载空调的类型及工作模式,确定待采集的噪声数据的目标频率范围;
从所述第一语音数据中,采集所述目标频率范围内的噪声数据。
在本申请实施例一种可能的实现方式中,所述数据标签指示所述测试语料为控制车载播放设备的语料,所述第二获取模块640,用于:
根据所述数据标签,确定参考音频数据;
采集车内的第二语音数据;
从所述第二语音数据中提取所述车载播放设备对应的音频数据;
根据所述车载播放设备对应的音频数据与所述参考音频数据之间的匹配度,确定所述车载语音设备的识别结果。
在本申请实施例一种可能的实现方式中,所述数据标签指示所述测试语料为唤醒语料,所述第二获取模块640,用于:
采集车内的第三语音数据;
根据所述第三语音数据与预设的唤醒答复语音数据之间的匹配度,确定所述车载语音设备的识别结果。
需要说明的是,前述车载语音设备的测试方法实施例的解释说明,也适用于该实施例的车载语音设备的测试装置,故在此不再赘述。
本申请实施例中,通过获取测试语料及测试语料对应的数据标签,并根据测试语料对应的数据标签,对测试语料进行解析,以获取测试语料中包含的各个声道对应的音频数据,基于测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与测试语料对应的音频数据,获取车载语音设备的识别结果,并根据识别结果及数据标签,确定车载语音设备的性能。由此,通过利用多声道的特性,将多个场景要求放到不同的声道,从而利用声道动态切换测试场景,不仅提高了测试效率,而且无需人在不同车速下进行测试,节省了人力成本,安全性高。
根据本申请的实施例,本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本申请的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在ROM(Read-OnlyMemory,只读存储器)702中的计算机程序或者从存储单元708加载到RAM(Random AccessMemory,随机访问/存取存储器)703中的计算机程序,来执行各种适当的动作和处理。在RAM703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。I/O(Input/Output,输入/输出)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于CPU(Central Processing Unit,中央处理单元)、GPU(Graphic Processing Units,图形处理单元)、各种专用的AI(Artificial Intelligence,人工智能)计算芯片、各种运行机器学习模型算法的计算单元、DSP(Digital SignalProcessor,数字信号处理器)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如车载语音设备的测试方法。例如,在一些实施例中,车载语音设备的测试方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的车载语音设备的测试方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行车载语音设备的测试方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、FPGA(Field Programmable Gate Array,现场可编程门阵列)、ASIC(Application-Specific Integrated Circuit,专用集成电路)、ASSP(Application Specific StandardProduct,专用标准产品)、SOC(System On Chip,芯片上系统的系统)、CPLD(ComplexProgrammable Logic Device,复杂可编程逻辑设备)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、RAM、ROM、EPROM(Electrically Programmable Read-Only-Memory,可擦除可编程只读存储器)或快闪存储器、光纤、CD-ROM(Compact Disc Read-Only Memory,便捷式紧凑盘只读存储器)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode-Ray Tube,阴极射线管)或者LCD(Liquid Crystal Display,液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:LAN(LocalArea Network,局域网)、WAN(Wide Area Network,广域网)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(VirtualPrivate Server,虚拟专用服务器)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
根据本申请的实施例,本申请还提供了一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行本申请上述实施例提出的车载语音设备的测试方法。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (13)
1.一种车载语音设备的测试方法,包括:
获取测试语料及所述测试语料对应的数据标签;
根据所述测试语料对应的数据标签,对所述测试语料进行解析,以获取所述测试语料中包含的各个声道对应的音频数据;
基于所述测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与所述测试语料对应的音频数据;
获取所述车载语音设备的识别结果;
根据所述识别结果及所述数据标签,确定所述车载语音设备的性能。
2.如权利要求1所述的方法,其中,所述数据标签指示所述测试语料为控制车载空调的语料,所述获取所述车载语音设备的识别结果,包括:
根据所述数据标签,确定参考噪声数据;
采集车内的第一语音数据;
基于所述数据标签,从所述第一语音数据中提取噪声数据;
根据所述噪声数据与所述参考噪声数据之间的匹配度,确定所述车载语音设备的识别结果。
3.如权利要求2所述的方法,其中,所述基于所述数据标签,从所述第一语音数据中提取噪声数据,包括:
根据所述数据标签,确定所述车载空调的工作模式;
根据所述车载空调的类型及工作模式,确定待采集的噪声数据的目标频率范围;
从所述第一语音数据中,采集所述目标频率范围内的噪声数据。
4.如权利要求1所述的方法,其中,所述数据标签指示所述测试语料为控制车载播放设备的语料,所述获取所述车载语音设备的识别结果,包括:
根据所述数据标签,确定参考音频数据;
采集车内的第二语音数据;
从所述第二语音数据中提取所述车载播放设备对应的音频数据;
根据所述车载播放设备对应的音频数据与所述参考音频数据之间的匹配度,确定所述车载语音设备的识别结果。
5.如权利要求1所述的方法,其中,所述数据标签指示所述测试语料为唤醒语料,所述获取所述车载语音设备的识别结果,包括:
采集车内的第三语音数据;
根据所述第三语音数据与预设的唤醒答复语音数据之间的匹配度,确定所述车载语音设备的识别结果。
6.一种车载语音设备的测试装置,包括:
第一获取模块,用于获取测试语料及所述测试语料对应的数据标签;
解析模块,用于根据所述测试语料对应的数据标签,对所述测试语料进行解析,以获取所述测试语料中包含的各个声道对应的音频数据;
调整模块,用于基于所述测试语料中包含的各个声道对应的音频数据,对语音播放设备中各个播放声道的工作模式进行调整,以播放与所述测试语料对应的音频数据;
第二获取模块,用于获取所述车载语音设备的识别结果;
确定模块,用于根据所述识别结果及所述数据标签,确定所述车载语音设备的性能。
7.如权利要求6所述的装置,其中,所述数据标签指示所述测试语料为控制车载空调的语料,所述第二获取模块,包括:
第一确定单元,用于根据所述数据标签,确定参考噪声数据;
采集单元,用于采集车内的第一语音数据;
提取单元,用于基于所述数据标签,从所述第一语音数据中提取噪声数据;
第二确定单元,用于根据所述噪声数据与所述参考噪声数据之间的匹配度,确定所述车载语音设备的识别结果。
8.如权利要求7所述的装置,其中,所述提取单元,用于:
根据所述数据标签,确定所述车载空调的工作模式;
根据所述车载空调的类型及工作模式,确定待采集的噪声数据的目标频率范围;
从所述第一语音数据中,采集所述目标频率范围内的噪声数据。
9.如权利要求6所述的装置,其中,所述数据标签指示所述测试语料为控制车载播放设备的语料,所述第二获取模块,用于:
根据所述数据标签,确定参考音频数据;
采集车内的第二语音数据;
从所述第二语音数据中提取所述车载播放设备对应的音频数据;
根据所述车载播放设备对应的音频数据与所述参考音频数据之间的匹配度,确定所述车载语音设备的识别结果。
10.如权利要求6所述的装置,其中,所述数据标签指示所述测试语料为唤醒语料,所述第二获取模块,用于:
采集车内的第三语音数据;
根据所述第三语音数据与预设的唤醒答复语音数据之间的匹配度,确定所述车载语音设备的识别结果。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述的方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654584.4A CN113436611B (zh) | 2021-06-11 | 2021-06-11 | 车载语音设备的测试方法、装置、电子设备和存储介质 |
KR1020220035078A KR20220044446A (ko) | 2021-06-11 | 2022-03-22 | 차량용 음성기기의 테스트 방법, 장치, 전자기기 및 저장매체 |
JP2022091743A JP7308335B2 (ja) | 2021-06-11 | 2022-06-06 | 車載音声機器のテスト方法、装置、電子機器及び記憶媒体 |
US17/836,738 US20220301546A1 (en) | 2021-06-11 | 2022-06-09 | Method for testing vehicle-mounted voice device, electronic device and storage medium |
EP22177991.1A EP4033483B1 (en) | 2021-06-11 | 2022-06-09 | Method and apparatus for testing vehicle-mounted voice device, electronic device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654584.4A CN113436611B (zh) | 2021-06-11 | 2021-06-11 | 车载语音设备的测试方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113436611A true CN113436611A (zh) | 2021-09-24 |
CN113436611B CN113436611B (zh) | 2022-10-14 |
Family
ID=77755797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110654584.4A Active CN113436611B (zh) | 2021-06-11 | 2021-06-11 | 车载语音设备的测试方法、装置、电子设备和存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220301546A1 (zh) |
EP (1) | EP4033483B1 (zh) |
JP (1) | JP7308335B2 (zh) |
KR (1) | KR20220044446A (zh) |
CN (1) | CN113436611B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114071318A (zh) * | 2021-11-12 | 2022-02-18 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、终端设备及车辆 |
CN114220447A (zh) * | 2021-12-13 | 2022-03-22 | 北京百度网讯科技有限公司 | 音频信号处理方法、装置、电子设备以及存储介质 |
CN115237815A (zh) * | 2022-09-21 | 2022-10-25 | 江苏际弘芯片科技有限公司 | 一种用于车载多媒体音频的测试系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080004875A1 (en) * | 2006-06-29 | 2008-01-03 | General Motors Corporation | Automated speech recognition using normalized in-vehicle speech |
CN103745731A (zh) * | 2013-12-31 | 2014-04-23 | 安徽科大讯飞信息科技股份有限公司 | 一种语音识别效果自动化测试系统及测试方法 |
CN111326174A (zh) * | 2019-12-31 | 2020-06-23 | 四川长虹电器股份有限公司 | 一种远场语音干扰场景测试语料自动化合成的方法 |
CN111724782A (zh) * | 2020-06-18 | 2020-09-29 | 中汽院智能网联科技有限公司 | 一种车载语音交互系统的响应时间测试系统、方法及设备 |
CN111798852A (zh) * | 2019-06-27 | 2020-10-20 | 深圳市豪恩声学股份有限公司 | 语音唤醒识别性能测试方法、装置、系统及终端设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004029215A (ja) * | 2002-06-24 | 2004-01-29 | Auto Network Gijutsu Kenkyusho:Kk | 音声認識装置の音声認識精度評価方法 |
JP2012163692A (ja) * | 2011-02-04 | 2012-08-30 | Nec Corp | 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム |
KR101605848B1 (ko) * | 2014-11-24 | 2016-04-01 | 하동경 | 음성인식 성능 평가 방법 및 그 장치 |
CN110675857A (zh) * | 2019-09-23 | 2020-01-10 | 湖北亿咖通科技有限公司 | 一种语音识别自动化测试系统及方法 |
CN110808029A (zh) * | 2019-11-20 | 2020-02-18 | 斑马网络技术有限公司 | 车机语音测试系统及方法 |
CN111402875A (zh) * | 2020-03-06 | 2020-07-10 | 斑马网络技术有限公司 | 用于车机的语音测试用音频的合成方法、装置及电子设备 |
CN112712821A (zh) * | 2020-12-24 | 2021-04-27 | 北京百度网讯科技有限公司 | 基于仿真的语音测试方法、装置、电子设备及存储介质 |
-
2021
- 2021-06-11 CN CN202110654584.4A patent/CN113436611B/zh active Active
-
2022
- 2022-03-22 KR KR1020220035078A patent/KR20220044446A/ko unknown
- 2022-06-06 JP JP2022091743A patent/JP7308335B2/ja active Active
- 2022-06-09 EP EP22177991.1A patent/EP4033483B1/en active Active
- 2022-06-09 US US17/836,738 patent/US20220301546A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080004875A1 (en) * | 2006-06-29 | 2008-01-03 | General Motors Corporation | Automated speech recognition using normalized in-vehicle speech |
CN103745731A (zh) * | 2013-12-31 | 2014-04-23 | 安徽科大讯飞信息科技股份有限公司 | 一种语音识别效果自动化测试系统及测试方法 |
CN111798852A (zh) * | 2019-06-27 | 2020-10-20 | 深圳市豪恩声学股份有限公司 | 语音唤醒识别性能测试方法、装置、系统及终端设备 |
CN111326174A (zh) * | 2019-12-31 | 2020-06-23 | 四川长虹电器股份有限公司 | 一种远场语音干扰场景测试语料自动化合成的方法 |
CN111724782A (zh) * | 2020-06-18 | 2020-09-29 | 中汽院智能网联科技有限公司 | 一种车载语音交互系统的响应时间测试系统、方法及设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114071318A (zh) * | 2021-11-12 | 2022-02-18 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、终端设备及车辆 |
CN114071318B (zh) * | 2021-11-12 | 2023-11-14 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、终端设备及车辆 |
CN114220447A (zh) * | 2021-12-13 | 2022-03-22 | 北京百度网讯科技有限公司 | 音频信号处理方法、装置、电子设备以及存储介质 |
CN115237815A (zh) * | 2022-09-21 | 2022-10-25 | 江苏际弘芯片科技有限公司 | 一种用于车载多媒体音频的测试系统 |
Also Published As
Publication number | Publication date |
---|---|
US20220301546A1 (en) | 2022-09-22 |
JP2022116320A (ja) | 2022-08-09 |
EP4033483A2 (en) | 2022-07-27 |
JP7308335B2 (ja) | 2023-07-13 |
EP4033483A3 (en) | 2022-11-30 |
EP4033483B1 (en) | 2023-10-18 |
CN113436611B (zh) | 2022-10-14 |
KR20220044446A (ko) | 2022-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113436611B (zh) | 车载语音设备的测试方法、装置、电子设备和存储介质 | |
CN108520743B (zh) | 智能设备的语音控制方法、智能设备及计算机可读介质 | |
US10777192B2 (en) | Method and apparatus of recognizing field of semantic parsing information, device and readable medium | |
CN107808670B (zh) | 语音数据处理方法、装置、设备及存储介质 | |
CN107103903B (zh) | 基于人工智能的声学模型训练方法、装置及存储介质 | |
CN107657950B (zh) | 基于云端和多命令词的汽车语音控制方法、系统及装置 | |
CN111091813B (zh) | 语音唤醒模型更新及唤醒方法、系统、装置、设备及介质 | |
CN112908297B (zh) | 车载设备的响应速度测试方法、装置、设备及存储介质 | |
CN112509585A (zh) | 车载设备的语音处理方法、装置、设备及存储介质 | |
CN103971681A (zh) | 一种语音识别方法及系统 | |
CN112382285A (zh) | 语音控制方法、装置、电子设备和存储介质 | |
CN112466289A (zh) | 语音指令的识别方法、装置、语音设备和存储介质 | |
CN113470618A (zh) | 唤醒测试的方法、装置、电子设备和可读存储介质 | |
CN108922522A (zh) | 设备的控制方法、装置、存储介质及电子装置 | |
CN109597996B (zh) | 一种语义解析方法、装置、设备和介质 | |
CN114267342A (zh) | 识别模型的训练方法、识别方法、电子设备及存储介质 | |
CN112767935B (zh) | 唤醒指标监测方法、装置及电子设备 | |
CN113658586A (zh) | 语音识别模型的训练方法、语音交互方法及装置 | |
CN113221990B (zh) | 信息录入方法、装置及相关设备 | |
CN112509567A (zh) | 语音数据处理的方法、装置、设备、存储介质及程序产品 | |
CN114399992A (zh) | 语音指令响应方法、装置及存储介质 | |
CN114141236A (zh) | 语言模型更新方法、装置、电子设备及存储介质 | |
CN113554062A (zh) | 多分类模型的训练方法、设备和存储介质 | |
CN113593528B (zh) | 语音切分模型的训练方法、装置、电子设备及存储介质 | |
CN113903334B (zh) | 声源定位模型的训练与声源定位方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |