KR20210098397A - 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체 - Google Patents

차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체 Download PDF

Info

Publication number
KR20210098397A
KR20210098397A KR1020210086256A KR20210086256A KR20210098397A KR 20210098397 A KR20210098397 A KR 20210098397A KR 1020210086256 A KR1020210086256 A KR 1020210086256A KR 20210086256 A KR20210086256 A KR 20210086256A KR 20210098397 A KR20210098397 A KR 20210098397A
Authority
KR
South Korea
Prior art keywords
image
voice
preset
time
command
Prior art date
Application number
KR1020210086256A
Other languages
English (en)
Inventor
쩐쩐 리우
슈칭 송
Original Assignee
아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디. filed Critical 아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디.
Publication of KR20210098397A publication Critical patent/KR20210098397A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/489Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • G06K9/62
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • G10L15/05Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

본 출원은 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체를 개시하며, 인공 지능 분야 중의 자율 주행 분야, 차량 인터넷 분야에 관한 것이다. 구체적인 구현 방안은, 멀티 미디어 정보를 획득하되, 멀티 미디어 정보는 기설정된 음성 명령, 및 차량용 기기의 기설정된 음성 명령에 대한 응답 정보를 포함하고; 멀티 미디어 정보에 대해 해석하여, 기설정된 음성 명령의 종료 시간 및 응답 정보에 대응되는 시간을 확정하고; 기설정된 음성 명령의 종료 시간 및 응답 정보에 대응되는 시간을 기초로, 차량용 기기의 응답 속도를 확정한다. 해당 방법은 응답 속도의 테스트 결과의 정확성을 향상시킨다.

Description

차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체{RESPONSE SPEED TEST METHOD, APPARATUS, DEVICE AND STORAGE MEDIUM OF VEHICLE DEVICE}
본 출원의 실시예는 인공 지능 기술에 관한 것으로, 특히 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체에 관한 것이며, 자율 주행 분야, 차량 인터넷 분야에 적용될 수 있다.
차량 인터넷 및 스마트 차량의 등장으로 스마트 차량용 기기의 보급율이 높아지고 있으며, 사용자가 차량용 기기의 음성 기능을 직접 사용하여 차량의 다양한 기능을 사용하는 것이 점차적으로 주류가 되었다.
이러한 음성 시나리오에서 음성 명령에 대한 차량용 기기의 응답 속도가 너무 느리면 음성 기능에 대한 체험이 저하될 수 있으므로, 차량용 기기를 테스트할 때 이의 기능에 대해 테스트를 수행해야 할 뿐만 아니라, 차량용 기기의 음성 명령에 대한 응답 속도도 테스트해야 하며, 이로부터 음성 기능에 대해 지속적으로 반복 최적화를 수행한다.
응답 속도 테스트 시 음성 명령에 대한 차량용 기기의 응답 속도는 일반적으로 로그 관리를 통해 확정하지만, 로그 관리에 의해 기록되는 시간과 차량용 기기의 실제 응답 효과는 차이가 있으므로 테스트 결과가 정확하지 않다.
본 출원은 정확성을 향상시킬 수 있는 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체를 제공한다.
본 출원의 일 측면에 따르면, 차량용 기기의 응답 속도 테스트 방법을 제공하는 바,
멀티 미디어 정보를 획득하되, 상기 멀티 미디어 정보는 기설정된 음성 명령, 및 차량용 기기의 상기 기설정된 음성 명령에 대한 응답 정보를 포함하는 단계;
상기 멀티 미디어 정보에 대해 해석하여, 상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 확정하는 단계;
상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 단계를 포함한다.
본 출원의 다른 측면에 따르면, 차량용 기기의 응답 속도 테스트 장치를 제공하는 바,
멀티 미디어 정보를 획득하되, 상기 멀티 미디어 정보는 기설정된 음성 명령, 및 차량용 기기의 상기 기설정된 음성 명령에 대한 응답 정보를 포함하는 획득모듈;
상기 멀티 미디어 정보에 대해 해석하여, 상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 확정하는 해석모듈;
상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 확정모듈을 포함한다.
본 출원의 또 다른 측면에서, 전자기기를 제공하는 바,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결되는 메모리;를 포함하되,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 상술한 차량용 기기의 응답 속도 테스트 방법을 수행할 수 있도록 한다.
본 출원의 또 다른 측면에 따르면, 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장매체를 제공하는 바, 상기 컴퓨터 명령은 컴퓨터가 상술한 차량용 기기의 응답 속도 테스트 방법을 수행하도록 하기 위한 것이다
본 출원의 또 다른 측면에 따르면, 프로그램 제품을 제공하는 바, 컴퓨터 프로그램을 포함하고, 해당 컴퓨터 프로그램이 프로세서에 의해 실행될 때, 상술한 차량용 기기의 응답 속도 테스트 방법을 구현한다.
본 출원의 기술방안에 따르면, 기설정된 음성 명령 및 차량용 기기의 기설정된 음성 명령에 대한 응답 정보의 멀티 미디어 정보를 분석하여, 차량용 기기의 응답 속도의 테스트 결과의 정확성을 향상시킨다.
본 부분에서 설명된 내용은 본 출원의 실시예의 핵심 또는 중요한 특징을 식별하기 위한 것이 아니며, 본 출원의 범위를 제한하려는 의도가 아님을 이해해야 한다. 본 출원의 다른 특징은 다음 설명에 의해 쉽게 이해 될 것이다.
첨부된 도면은 본 방안을 더 잘 이해할 수 있도록 하기 위한 것으로서, 본 출원에 대한 한정은 아니다.
도 1은 본 출원의 실시예에 따른 차량용 기기의 음성 기능을 나타내는 도면이다.
도 2는 본 출원의 실시예에 따른 차량용 기기의 응답 속도 테스트 방법의 흐름도이다.
도 3은 본 출원의 실시예에 따른 차량용 기기의 응답 속도 테스트 장치의 구조도이다.
도 4는 본 출원의 실시예의 차량용 기기의 응답 속도 테스트 방법을 구현하기 위한 전자기기를 나타내는 블록도이다.
아래에서는 첨부 도면과 결합하여 본 출원의 예시적인 실시예에 대해 설명하며, 이해를 돕기 위하여 본 출원의 실시예의 다양한 세부 사항을 포함하며, 이들을 단지 예시적인 것으로만 간주되어야 한다. 따라서, 본 분야의 통상적인 지식을 가진 자라면, 여기에 설명된 실시예에 대하여 다양한 변경과 수정을 가할 수 있으며, 이는 본 출원의 범위와 정신을 벗어나지 않음을 이해해야 한다. 마찬가지로, 명확성과 간결성을 위하여, 아래의 설명에서 공지 기능과 구조에 대한 설명을 생략한다.
도 1은 본 출원의 실시예에 따른 차량용 기기의 음성 기능을 나타내는 도면이다. 도 1에 도시된 바와 같이, 사용자가 웨이크업 명령, 예를 들면 “소X소X”를 말하면, 차량용 기기의 인터페이스에 웨이크업 이미지가 표시되고, 동시에 차량용 기기는 웨이크업 응답을 음성 보도할 수도 있으며; 그 다음 사용자가 검색 명령, 예를 들면 “오늘의 날씨는 어떻습니까”를 말하면, 차량용 기기의 인터페이스에 우선 사용자의 검색 명령 “오늘의 날씨는 어떻습니까”를 표시한 후 검색 처리를 수행하고, 인터페이스에 검색 결과인 “온도는 25도”가 표시되며, 이외에, 차량용 기기는 검색 결과 “온도는 25도”를 음성 보도할 수도 있다.
상술한 예시와 같이, 차량용 기기는 인터페이스로 표시 및/또는 음성 보도의 방법으로 사용자 음성에 대해 응답할 수 있다. 사용자가 음성 기능을 사용할 때, 차량용 기기와 적어도 1회의 인터랙션을 수행하고, 각각의 인터랙션 단계에서, 차량용 기기가 인터페이스에 표시 및/또는 음성 보도하는 응답 속도가 너무 늦으면, 사용자의 체험이 좋지 않을 것이며, 따라서, 차량용 기기의 음성 기능을 테스트할 때, 응답 속도에 대해 테스트해야 하며, 이로부터 지속적으로 응답 최적화를 수행한다.
한가지 예시에서, 음성 응답 속도를 테스트할 때, 일반적으로 로그 관리의 방법으로 차량용 기기의 음성 명령에 대한 응답 시간을 기록하지만, 로그 관리하여 기록한 시간과 차량용 기기의 실제 응답 효과는 차이가 있으므로, 테스트 결과가 정확하지 않다.
다른 예시에서, 동영상을 녹화하는 방법으로, 사용자의 음성과 차량용 기기의 응답을 기록하고, 인공으로 동영상을 관찰하여 차량용 기기의 응답 속도를 기록하지만, 이러한 인공 기록 방법은 비효율적이고 정확성도 낮다.
상술한 문제를 해결하기 위하여, 본 출원은 차량용 기기의 응답 속도 테스트 방법을 제공하는 바, 인공 지능 분야 중의 자율 주행 분야, 차량 인터넷 분야 등에 응용될 수 있다. 해당 방법은 사용자가 말한 음성 명령 및 차량용 기기의 응답을 기록하여, 대응되는 동영상 또는 오디오를 획득하고, 해당 동영상 또는 오디오에 대해 해석하여, 사용자가 말한 음성 명령에 대응되는 시간과 차량용 기기가 응답한 시간을 추출함으로써 차량용 기기의 응답 속도의 정확한 테스트 결과를 획득한다.
아래에는, 구체적인 실시예를 통해 본 출원에 따른 차량용 기기의 응답 속도 테스트 방법에 대해 상세하게 설명한다. 이해할 수 있는 것은, 아래의 몇개 구체적인 실시예는 서로 결합할 수 있으며, 동일하거나 유사한 개념 또는 과정에 대해 일부 실시예에서 더 이상 중복 설명하지 않는다.
도 2는 본 출원의 실시예에 따른 차량용 기기의 응답 속도 테스트 방법의 흐름도이다. 도 2에 도시된 바와 같이, 해당 방법은 아래의 단계를 포함한다.
S201, 멀티 미디어 정보를 획득한다.
멀티 미디어 정보는 기설정된 음성 명령, 및 차량용 기기의 기설정된 음성 명령에 대한 응답 정보를 포함한다.
기설정된 음성 명령은 사용자가 차량용 기기의 음성 기능을 사용할 때 말할 수 있는 음성 명령이고, 기설정된 음성 명령은 적어도 하나의 음성 명령일 수 있으며, 응답 정보에는 해당 적어도 하나의 명령에 대한 응답이 포함된다. 멀티 미디어 정보는 해당 기설정된 음성 명령 및 차량용 기기의 상응하는 응답을 기록하여 획득된 동영상 또는 오디오이다. 예를 들면, 단지 차량용 기기의 음성 응답 보도 속도에 대해 테스트해야 하면, 오디오만 획득하면 되고; 차량용 기기의 인터페이스 표시 응답 속도에 대해 테스트해야 하면, 동영상을 획득하야 한다.
테스트를 수행 시, 기설정된 음성 명령은 테스트 작업자가 말할 수 있거나, 또는 전자기기에 의해 재생될 수도 있으며, 차량용 기기는 기설정된 음성 명령에 대해 상응한 응답을 한다. 상술한 테스트 과정에서, 기설정된 음성 명령, 차량용 기기의 디스플레이 인터페이스 응답 및/또는 음성 보도 응답을 모두 녹화할 수 있으며, 예를 들면 기설정된 음성 명령과 차량용 기기의 음성 보도 응답은 오디오로 녹화되고, 또는, 기설정된 음성 명령, 차량용 기기의 디스플레이 인터페이스 응답 및 음성 보도 응답을 동영상으로 녹화한다.
S202, 멀티 미디어 정보에 대해 해석하여, 기설정된 음성 명령의 종료 시간 및 응답 정보에 대응되는 시간을 확정한다.
멀티 미디어 정보에 대한 해석은 멀티 미디어 정보 중의 오디오 및/또는 멀티 미디어 정보 중의 동영상에 대한 해석일 수 있다. 예를 들면, 멀티 미디어 정보 중의 오디오를 추출하여, 기설정된 음성 명령에 대응되는 시간, 및 음성 보도의 응답 정보에 대응되는 시간을 확정할 수 있다. 또 예를 들면, 멀티 미디어 정보 중의 동영상에 대해 해석하여, 차량용 기기의 인터페이스로 표시한 응답 정보에 대응되는 시간을 확정할 수도 있다.
S203, 기설정된 음성 명령의 종료 시간 및 응답 정보에 대응되는 시간을 기초로, 차량용 기기의 응답 속도를 확정한다.
기설정된 음성 명령의 종료 시간과 상응하는 응답 정보에 대응되는 시간을 획득한 후에, 응답 정보에 대응되는 시간과 기설정된 음성 명령의 종료 시간의 차이 값을 기초로, 차량용 기기의 응답 속도를 확정할 수 있다. 응답 정보에 대응되는 시간과 기설정된 음성 명령의 종료 시간의 차이 값이 작을 수록 차량용 기기의 응답 속도가 더욱 빠른 것을 나타내며, 응답 정보에 대응되는 시간과 예측 음성 명령의 종료 시간의 차이 값이 클 수록, 차량용 기기의 응답 속도가 더욱 늦은 것을 나타낸다.
본 실시예에 따른 차량용 기기의 응답 속도 테스트 방법은, 사용자가 말한 음성 명령과 차량용 기기의 응답을 기록하여, 대응되는 동영상 또는 오디오를 획득하고, 해당 동영상 또는 오디오에 대해 해석하여, 사용자가 말한 음성 명령에 대응되는 시간과 차량용 기기가 응답하는 시간을 정확하게 추출하여, 차량용 기기의 응답 속도 테스트 결과를 획득하고, 테스트 결과의 정확성을 확보한다.
상술한 실시예의 기초상에서, S202에서 기설정된 음성 명령의 종료 시간을 확정하는 방법에 대해 설명하고, 이 기초상에서 대응되게 S203에서 차량용 기기의 응답 속도를 확정하는 방법에 대해 설명한다.
멀티 미디어 정보에서 오디오 문서를 추출하고; 오디오 문서 중의 오디오의 데시벨이 기설정된 데시벨 이상인 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 확정하고; 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 적어도 하나의 음성 세그먼트에서, 기설정된 음성 명령의 종료 시간을 확정한다.
우선 설명이 필요한 것은, 단지 차량용 기기의 음성 응답 보도 속도에 대해 테스트해야 하면, 획득된 멀티 미디어 정보는 오디오일 수 있고, 이런 경우에 다시 멀티 미디어 정보로부터 오디오 문서를 추출할 필요가 없으며, 직접 멀티 미디어 정보를 오디오 문서로 하여 처리한다.
기설정된 데시벨은 미리 설정된 최저 침묵 데시벨이고, 오디오 문서의 오디오의 데시벨이 기설정된 데시벨보다 작은 시각은, 침묵 상태 있는 시각으로 간주할 수 있으며, 다시 말하면 기설정된 음성 명령을 발송하지 않고, 차량용 기기도 음성 보도를 하지 않은 시각이다. 하지만 오디오 문서 중의 오디오의 데시벨이 기설정된 데시벨보다 큰 시간대는, 기설정된 음성 명령을 발송한 시간대 또는 차량용 기기가 음성 보도를 진행한 시간대로 간주할 수 있다. 오디오 문서에 대해 트레버스하고, 데시벨에 따라 음성 세그먼트를 확정하여, 추출된 음성 명령 또는 응답 정보의 시간의 정확성을 확보한다.
구체적으로, 오디오 문서를 트레버스하고, 오디오 문서의 제1 시각의 오디오의 데시벨이 기설정된 데시벨 이상이면, 제1 시각을 제1 음성 세그먼트의 시작 시간으로 확정하고, 제1 시각 이후에, 오디오 문서의 제2 시각의 오디오의 데시벨이 기설정된 데시벨 이하이고, 제2 시각 이후의 기설정된 시간 내의 오디오의 데시벨이 기설정된 데시벨 이하이면, 제2 시각을 제1 음성 세그먼트의 종료 시간으로 확정한다.
예시적으로, 오디오 문서의 시작 시각으로부터 시작하여 트레버스하고, t1시각에 오디오의 데시벨이 기설정된 데시벨 이상이면, 해당 t1시각을 제1 음성 세그먼트의 시작 시간으로 기록하고, 계속 트레버스하며, t2시각에 오디오의 데시벨이 기설정된 데시벨 이하이고, t2시각 이후의 기설정된 시간 내의 오디오의 데시벨이 모두 기설정된 데시벨 이하이면, t2시각을 제1 음성 세그먼트의 종료 시간으로 기록하고; 그 후 계속 오디오 문서를 트레버스하여 상술한 과정을 중복하며, 최종적으로 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 확정한다. 각각의 음성 세그먼트는 하나의 기설정된 음성 명령을 발송한 시간 또는 차량용 음성 응답을 보도하는 시간에 대응된다. 오디오 문서에 대해 트레버스하고, 시작 시간과 종료 시간의 데시벨을 비교하여, 추출된 음성 명령 또는 응답 정보의 시간의 정확성을 확보한다.
기설정된 음성 명령에 포함된 명령은 이미 알고 있는 것이기에, 차량용 기기의 응답 정보에 음성 정보가 포함되면, 차량용 기기가 각각의 기설정된 음성 명령에 대해 음성 응답이 있는지 여부도 알 수 있는 것이기에, 상술한 획득된 적어도 하나의 음성 세그먼트에 대해, 기설정된 음성 명령의 순서와 차량용 기기의 음성 응답 순서에 따라, 각각의 음성 세그먼트에 대응되는 것이 어느 기설정된 음성 명령, 또는 어느 기설정된 음성 명령에 대응되는 음성 응답인지 확정할 수 있다. 따라서, 해당 적어도 하나의 음성 세그먼트 중의 각각의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 적어도 하나의 음성 세그먼트에서 기설정된 음성 명령의 시작 시간과 종료 시간을 확정할 수 있다. 기설정된 음성 명령의 종료 시간을 확정한 후에, 차량용 기기의 응답 정보에 대응되는 시간을 확정해야 하며, 나아가 차량용 기기의 응답 속도를 확정한다. 아래 시나리오를 나누어 설명한다.
시나리오 1
차량용 기기의 응답 정보에 음성 정보가 포함되는 경우, 즉 차량용 기기가 음성 보도를 통해 기설정된 음성 명령을 응답한다. 이런 경우에, 상술한 실시예의 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 적어도 하나의 음성 세그먼트에서 차량용 기기가 음성 응답하는 음성 정보의 시작 시간과 종료 시간도 확정할 수 있다. 따라서, 기설정된 음성 명령의 종료 시간과 음성 정보의 시작 시간을 기초로, 차량용 기기의 기설정된 음성 명령에 대한 응답 음성의 보도 속도를 확정할 수 있다.
도 1의 음성 명령을 예로 들면, 상술한 방법으로 오디오 문서에서 기설정된 음성 명령 “오늘의 날씨는 어떻습니까”의 종료 시간, 및 차량용 기기가 검색 결과 “온도는 25도”를 음성 보도하는 시작 시간을 확정하고, 차량용 기기가 검색 결과 “온도는 25도”를 음성 보도하는 시작 시간에서 기설정된 음성 명령 “오늘의 날씨는 어떻습니까”의 종료 시간을 감하면, 차량용 기기의 기설정된 음성 명령 “오늘의 날씨는 어떻습니까”에 대한 응답 음성의 보도 속도를 확정할 수 있다.
본 시나리오에서 응답 정보가 음성 정보인 경우에 대해 설명하였으며, 오디오 문서에 대해 해석하여, 기설정된 음성 명령과 응답의 음성 정보에 대응되는 시간을 정확하게 획득할 수 있으며, 이로부터 차량용 기기의 응답 음성에 대한 보도 속도 테스트의 정확성을 확보한다.
차량용 기기의 응답 정보는 음성 정보 외에 이미지 정보일 수도 있고, 또는 음성 정보와 이미지 정보를 동시에 포함할 수도 있다. 이미지 정보는 차량용 기기가 인터페이스에 기설정된 음성 명령에 대해 표시한 응답이고, 응답 정보에 이미지 정보가 포함될 경우, 이전의 단계에서 획득된 멀티 미디어 문서는 동영상이어야 한다. 이런 시나리오에서, 상술한 실시예의 방법에 따라 기설정된 음성 명령의 종료 시간을 확정하는 것 외에, 또한 차량용 기기가 인터페이스에 표시한 응답 정보, 즉 이미지 정보에 대응되는 시간을 확정해야 하며, 이로부터 응답 속도를 확정한다. 구체적으로 멀티 미디어 정보 중의 복수의 이미지의 유사도 매칭 결과 및/또는 문자 인식 결과를 기초로, 이미지 정보에 대응되는 시간을 확정할 수 있으며, 영상 인식 등 방법으로 영상 유사도 또는 문자 매칭을 수행하여, 테스트 결과의 정확성을 향상시키며, 아래에 설명한다.
시나리오 2
기설정된 음성 명령은 웨이크업 명령을 포함하고, 응답 정보는 웨이크업 응답 이미지를 포함한다.
웨이크업 명령은 차량용 기기의 음성 기능을 웨이크업 하기 위한 것이며, 예를 들면, 웨이크업 명령이 “소X소X”이면, 차량용 기기의 웨이크업 응답 이미지는 디스플레이 인터페이스에 표시된 기설정된 웨이크업 이미지일 수 있다. 멀티 미디어 정보는 차량용 기기의 디스플레이 인터페이스에 표시된 동영상을 포함하고, 따라서 동영상 중의 여러 프레임의 이미지에 대해 매칭을 수행하여, 웨이크업 응답 이미지를 확정함으로써, 웨이크업 응답 이미지에 대응되는 시간을 확정할 수 있다.
멀티 미디어 정보 중의 여러 프레임의 이미지 중의 첫 번째 이미지와 기설정된 웨이크업 이미지와의 유사도 매칭을 수행하고, 유사도가 기설정 값보다 작으면, 제1 이미지와 웨이크업 이미지의 유사도가 기설정 값 이상일 때가지 계속 다음 이미지와 웨이크업 이미지의 유사도 매칭을 수행하고, 제1 이미지에 대응되는 시간을 웨이크업 응답 이미지에 대응되는 시간으로 확정한다.
첫 번째 이미지부터 시작하여 하나씩 유사도 매칭을 수행하고, 제1 이미지는 웨이크업 이미지와의 유사도가 기설정 값 이상인 첫 번째 이미지이고, 제1 이미지에 대응되는 시간이 바로 웨이크업 응답 이미지에 대응되는 시간이다.
대응되게, 웨이크업 응답 이미지에 대응되는 시간과 웨이크업 명령의 종료 시간을 기초로, 차량용 기기의 웨이크업 속도를 확정할 수 있다. 구체적으로, 웨이크업 응답 이미지에 대응되는 시간에서 웨이크업 명령의 종료 시간을 감하면, 차량용 기기의 웨이크업 속도를 획득할 수 있다. 매 프레임의 이미지마다 매칭하는 방법을 통해 웨이크업 응답 이미지에 대응되는 시간을 확정함으로써, 차량용 기기의 웨이크업 속도의 테스트 결과가 더욱 정확하도록 할 수 있다.
시나리오 3
기설정된 음성 명령은 음성 검색 명령을 포함하고, 응답 정보는 검색 명령 표시 이미지를 포함한다.
예시적으로, 음성 검색 명령이 “오늘의 날씨는 어떻습니까”이고, 차량용 기기가 음성 검색 명령을 획득한 후에, 먼저 인터페이스에 검색 명령을 표시하고, 문자로 “오늘의 날씨는 어떻습니까”를 표시한다. 여기서 차량용 기기가 검색 명령을 표시하는 이미지를 검색 명령 표시 이미지라고 한다.
멀티 미디어 정보 중의 여러 프레임의 이미지 중의 제2 이미지에 대해 문자 인식을 수행하고, 제2 이미지에서 인식된 문자와 음성 검색 명령에 대응되는 문자가 매칭되지 않으면, 제3 이미지에서 인식된 문자와 음성 검색 명령에 대응되는 문자가 매칭될 때까지 계속 제2 이미지의 다음 이미지에 대해 문자 인식을 수행하고, 제3 이미지에 대응되는 시간을 검색 명령 표시 이미지에 대응되는 시간으로 확정한다.
우선 상술한 제2 이미지에 대해 설명한다. 한가지 경우에서, 테스트를 수행할 때, 웨이크업 과정과 그 후의 검색 과정에 대해 모두 테스트를 수행해야 하며, 기설정된 음성 명령에는 웨이크업 명령과 복수의 음성 검색 명령이 포함되고, 웨이크업 명령은 상술한 시나리오 2에 예시된 명령이며, 이런 경우에, 제2 이미지는 상술한 예시 중의 제1 이미지 이후의 이미지이고, 즉, 웨이크업 응답 이미지 이후의 이미지이다. 다른 경우에, 웨이크업 과정에 대해 테스트할 필요가 없으면, 음성 검색 명령에 대한 응답만을 테스트하고, 전술한 단계에서 녹화한 멀티 미디어 정보에는 웨이크업 과정의 동영상을 포함하지 않고, 음성 검색 명령 및 그 후의 응답 동영상만 포함할 수 있으며, 이런 경우에, 제2 이미지는 멀티 미디어 정보의 여러 프레임의 이미지 중의 첫 번째 이미지일 수 있다.
제2 이미지로부터 시작하여 매 프레임에 대해 문자 인식을 수행하여, 이미지에 표시된 문자가 음성 검색 명령에 대응되는 문자와 매칭되는지 여부를 확정하고, 음성 검색 명령이 “오늘의 날씨는 어떻습니까”를 예로 들어, 제3 이미지에서 인식된 문자가 “오늘의 날씨는 어떻습니까”이면, 제3 이미지에 이미 음성 검색 명령이 표시된 것을 의미하며, 따라서 제3 이미지에 대응되는 시간을 검색 명령 표시 이미지에 대응되는 시간으로 확정한다.
대응되게, 검색 명령 표시 이미지에 대응되는 시간과 음성 검색 명령에 대응되는 종료 시간을 기초로, 차량용 기기의 음성 검색 명령에 대응되는 문자에 대한 표시 속도를 확정한다. 구체적으로, 검색 명령 표시 이미지에 대응되는 시간에서 음성 검색 명령의 종료 시간을 감하면, 바로 차량용 기기의 음성 검색 명령에 대응되는 문자에 대한 표시 속도를 획득할 수 있으며, 스크린 진입 속도라고 불리울 수도 있다. 매 프레임의 이미지에 대해 매칭하는 방법을 통해 문자 표시 속도를 정확하게 획득하여, 차량용 기기의 응답 속도 테스트 결과가 더욱 정확하도록 할 수 있다.
시나리오 4
기설정된 음성 명령은 음성 검색 명령을 포함하고, 응답 정보는 검색 명령 표시 이미지, 및 검색 결과 표시 이미지를 포함한다.
상술한 시나리오 3의 예시를 참조하고, 음성 검색 명령이 “오늘의 날씨는 어떻습니까”이고, 차량용 기기의 응답 정보는 검색 명령 표시 이미지를 포함하면, 인터페이스에 “오늘의 날씨는 어떻습니까”를 표시하고, 그 후에, 인터페이스에 검색 결과를 더 표시하고, 예를 들어 인터페이스에 “온도는 25도”를 표시한다.
따라서, 상술한 시나리오 3의 방법에 따라 문자 표시 속도를 확정하는 것 외에, 그 후의 검색 결과의 표시 속도를 더 확정해야 한다. 시나리오 3의 방법에 따라 제3 이미지를 확정하고, 즉 검색 명령 표시 이미지를 검색한 후에, 제3 이미지의 다음 이미지와 제3 이미지의 유사도 매칭을 수행하고, 유사도가 기설정 값 이상이면, 제4 이미지와 제3 이미지의 유사도가 기설정 값보다 작을 때가지 계속 다음 이미지와 제3 이미지의 유사도를 계산하고, 제4 이미지를 기준 이미지로 설정한다.
해당 과정에서, 제3 이미지 후의 이미지와 제3 이미지의 유사도를 비교하여, 제3 이미지와 차이가 보다 큰 제4 이미지를 확정하고, 차량용 기기가 제4 이미지를 표시한 것은 차량용 기기의 디스플레이 인터페이스가 점프된것을 의미하며, 즉 차량용 기기가 음성 검색 명령 “오늘의 날씨는 어떻습니까”를 표시하는 것에서 점프를 개시하여 검색 결과를 표시하지만 제4 이미지는 반드시 완벽하게 검색 결과를 표시한 것은 아닐 수 있고, 인터페이스는 계속 변화할 수 있으며, 따라서, 추가적으로 매칭을 수행하여 확정해야 하며, 이후의 이미지에 더 이상 변화가 없으면 검색 결과가 완벽하게 표시된 것으로 확정할 수 있다.
기준 이미지 이후의 첫 번째 이미지로부터 시작하여 순차적으로 기준 이미지와의 유사도 매칭을 수행하고, 기준 이미지 이후의 제5 이미지와 기준 이미지의 유사도가 기설정 값보다 작으면, 기준 이미지 이후의 기설정된 수량의 이미지와 기준 이미지의 유사도가 모두 기설정 값 이상일 때까지 제5 이미지를 새로운 기준 이미지로 설정하고, 본 단계를 중복 실행하고, 기준 이미지에 대응되는 시간을 검색 결과 표시 이미지에 대응되는 시간으로 확정한다.
기준 이미지 이후의 이미지와 기준 이미지의 유사도 매칭을 수행 할 때, 유사도가 기설정 값보다 작으면, 차량용 기기의 디스플레이 인터페이스가 여전히 변화하고 있음을 의미하며, 즉 응답 결과가 아직 완전하게 표시되지 않았고, 따라서 새로운 기준 이미지를 설정하고, 새로운 기준 이미지를 기초로 계속 유사도 매칭을 수행한다. 기준 이미지 이후의 이미지와 기준 이미지의 유사도가 기설정 값 이상이면, 차량용 기기의 디스플레이 인터페이스는 변화하지 않았을 수 있으며, 이때 계속 이후의 여러 이미지에 대해 유사도 매칭을 수행해야 한다. 구체적으로 기준 이미지의 다음 이미지와 기준 이미지의 유사도가 기설정 값 이상이면, 하나의 빈 후보 어레이를 설치하고, 기준 이미지의 다음 이미지의 번호를 어레이에 추가하고, 후보 어레이의 길이가 기설정된 수량에 도달하지 못하면, 계속 그 다음 이미지와 기준 이미지의 유사도 매칭을 수행하고, 유사도가 기설정 값 이상이면, 해당 이미지도 후보 데이터에 추가하고 계속 다음 이미지의 매칭을 수행하고, 유사도가 기설정 값보다 작으면, 해당 이미지를 새로운 기준 이미지로 설정하고, 후보 데이터를 삭제하고, 다시 새로운 기준 이미지를 기초로 유사도 매칭을 수행한다. 후보 어레이의 길이가 기설정된 수량에 도달할 때까지 상술한 매칭 과정에 따라 수행하고, 이때 기준 이미지 이후의 기설정된 수량의 이미지와 기준 이미지의 유사도가 모두 기설정 값 이상임을 의미하며, 즉 기준 이미지 이후의 기설정된 수량의 이미지가 더 이상 변화하지 않기에, 기준 이미지가 바로 이미 검색 결과를 완벽하게 표시한 검색 결과 표시 이미지인 것으로 확정할 수 있다.
대응되게, 검색 결과 표시 이미지에 대응되는 시간과 음성 검색 명령의 종료 시간을 기초로, 차량용 기기의 검색 결과의 표시 속도를 확정한다. 구체적으로, 검색 결과 표시 이미지에 대응되는 시간에서 음성 검색 명령의 종료 시간을 감하면, 차량용 기기의 검색 결과의 표시 속도를 획득할 수 있다. 매 프레임의 이미지를 매칭하는 방법을 통해 검색 결과를 완벽하게 표시한 검색 결과 표시 이미지의 시간을 정확하게 획득함으로써, 차량용 기기의 응답 속도의 테스트 결과가 더욱 정확하도록 할 수 있다.
도 3은 본 출원의 실시예에 따른 차량용 기기의 응답 속도 테스트 장치의 구조도이다. 도 3에 도시된 바와 같이, 응답 속도 테스트 장치(300)는,
멀티 미디어 정보를 획득하되, 멀티 미디어 정보는 기설정된 음성 명령, 및 차량용 기기의 기설정된 음성 명령에 대한 응답 정보를 포함하는 획득모듈(301);
멀티 미디어 정보에 대해 해석하여, 기설정된 음성 명령의 종료 시간 및 응답 정보에 대응되는 시간을 확정하는 해석모듈(302);
기설정된 음성 명령의 종료 시간 및 응답 정보에 대응되는 시간을 기초로, 차량용 기기의 응답 속도를 확정하는 확정모듈(303)를 포함한다.
가능한 구현 방식에서, 해석모듈(302)은,
멀티 미디어 정보에서 오디오 문서를 추출하는 추출유닛;
오디오 문서에서 오디오의 데시벨이 기설정된 데시벨 이상인 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 확정하는 제1 확정유닛;
적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 적어도 하나의 음성 세그먼트에서, 기설정된 음성 명령의 종료 시간을 확정하는 제2 확정유닛을 포함한다.
가능한 구현 방식에서, 응답 정보는 음성 정보를 포함하고; 해석모듈(302)은,
적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 적어도 하나의 음성 세그먼트에서, 음성 정보의 시작 시간을 확정하는 제3 확정유닛을 포함하고;
확정모듈(303)은,
기설정된 음성 명령의 종료 시간과 음성 정보의 시작 시간을 기초로, 차량용 기기의 기설정된 음성 명령에 대한 응답 음성의 보도 속도를 확정하는 제4 확정유닛을 포함한다.
가능한 구현 방식에서, 제1 확정유닛은,
오디오 문서를 트레버스하고, 오디오 문서의 제1 시각의 오디오의 데시벨이 기설정된 데시벨 이상이면, 제1 시각을 제1 음성 세그먼트의 시작 시간으로 확정하고, 제1 시각 이후에, 오디오 문서의 제2 시각의 오디오의 데시벨이 기설정된 데시벨 이하이고, 제2 시각 이후의 기설정된 시간 내의 오디오의 데시벨이 기설정된 데시벨 이하이면, 제2 시각을 제1 음성 세그먼트의 종료 시간으로 확정한다.
가능한 구현 방식에서, 응답 정보는 이미지 정보를 포함하고; 해석모듈(302)은,
멀티 미디어 정보 중의 여러 프레임의 이미지의 유사도 매칭 결과 및/또는 문자 인식 결과를 기초로, 이미지 정보에 대응되는 시간을 확정하는 제5 확정유닛을 포함한다.
가능한 구현 방식에서, 기설정된 음성 명령은 웨이크업 명령을 포함하고; 응답 정보는 웨이크업 응답 이미지를 포함하며; 제5 확정유닛은,
멀티 미디어 정보중의 여러 프레임의 이미지 중의 첫 번째 이미지와 기설정된 웨이크업 이미지의 유사도 매칭을 수행하고, 유사도가 기설정 값보다 작으면, 제1 이미지와 웨이크업 이미지의 유사도가 기설정 값 이상일 때까지 계속 다음 이미지와 웨이크업 이미지의 유사도 매칭을 수행하고, 제1 이미지에 대응되는 시간을 웨이크업 응답 이미지에 대응되는 시간으로 확정하는 제1 확정 서브유닛을 포함하고;
확정모듈(303)은,
웨이크업 응답 이미지에 대응되는 시간과 웨이크업 명령의 종료 시간을 기초로, 차량용 기기의 웨이크업 속도를 확정하는 제6 확정유닛을 포함한다.
가능한 구현 방식에서, 기설정된 음성 명령은 음성 검색 명령을 포함하고; 응답 정보는 검색 명령 표시 이미지를 포함하며;
제5 확정유닛은,
멀티 미디어 정보 중의 여러 프레임의 이미지 중의 제2 이미지에 대해 문자 인식을 수행하고, 제2 이미지에서 인식된 문자와 음성 검색 명령에 대응되는 문자가 매칭되지 않으면, 제3 이미지에서 인식된 문자와 음성 검색 명령에 대응되는 문자가 매칭될 때까지 계속 제2 이미지의 다음 이미지에 대해 문자 인식을 수행하고, 제3 이미지에 대응되는 시간을 검색 명령 표시 이미지에 대응되는 시간으로 확정하는 제2 확정 서브유닛을 포함하고;
확정모듈(303)은,
검색 명령 표시 이미지에 대응되는 시간과 음성 검색 명령에 대응되는 종료 시간을 기초로, 차량용 기기가 음성 검색 명령에 대응되는 문자에 대한 표시 속도를 확정하는 제7 확정유닛을 포함한다.
가능한 구현 방식에서, 응답 정보는 검색 결과 표시 이미지를 포함하고;
제5 확정유닛은,
제3 이미지의 다음 이미지와 제3 이미지의 유사도 매칭을 수행하고, 유사도가 기설정 값 이상이면, 제4 이미지와 제3 이미지의 유사도가 기설정 값보다 작을 때까지 계속 다음 이미지와 제3 이미지의 유사도를 계산하고, 제4 이미지를 기준 이미지로 설정하는 제3 확정 서브유닛;
기준 이미지 이후의 첫 번째 이미지부터 시작하여 순차적으로 기준 이미지와의 유사도 매칭을 수행하고, 기준 이미지 이후의 제5 이미지와 기준 이미지의 유사도가 기설정 값보다 작으면, 제5 이미지를 새로운 기준 이미지로 설정하고, 기준 이미지 이후의 기설정된 수량의 이미지와 기준 이미지의 유사도가 모두 기설정 값 이상일 때까지 본 단계를 중복 실행하고, 기준 이미지에 대응되는 시간을 검색 결과 표시 이미지에 대응되는 시간으로 확정하는 제4 확정 서브유닛을 포함하고;
확정모듈(303)은,
검색 결과 표시 이미지에 대응되는 시간과 음성 검색 명령의 종료 시간을 기초로, 차량용 기기의 검색 결과의 표시 속도를 확정하는 제8 확정유닛을 포함한다.
본 출원의 실시예에 따른 차량용 기기의 응답 속도 테스트 장치는, 상술한 임의의 실시예의 차량용 기기의 응답 속도 테스트 방법의 기술방안을 실행할 수 있고, 그 구현 원리와 유익한 효과는 차량용 기기의 응답 속도 테스트 방법의 구현 원리와 유익한 효과와 유사하기에, 차량용 기기의 응답 속도 테스트 방법의 구현 원리와 유익한 효과를 참조할 수 있으며, 여기서 더 이상 중복 설명하지 않는다.
본 출원의 실시예에 따르면, 본 출원은 전자기기와 판독 가능 저장매체를 더 제공한다.
본 출원의실시예에 따르면, 본 출원은 컴퓨터 판독 가능 저장매체에 저장된 컴퓨터 프로그램을 더 제공하는 바, 상기 컴퓨터 프로그램은 컴퓨터 코드를 포함하고, 상기 컴퓨터 프로그램이 프로세서에 의해 실행될 때, 상술한 임의의 실시예에 따른 방안을 실행하도록 한다.
본 출원의 실시예에 따르면, 본 출원은 컴퓨터 프로그램 제품을 더 제공하는 바, 프로그램 제품은 컴퓨터 프로그램을 포함하고, 컴퓨터 프로그램은 판독 가능 저장매체에 저장되고, 전자기기의 적어도 하나의 프로세서는 판독 가능 저장매체로부터 컴퓨터 프로그램을 판독하여, 적어도 하나의 프로세서가 컴퓨터 프로그램을 실행함으로써 전자기기가 상술한 임의의 실시예에 따른 방안을 실행하도록 한다.
도 4는 본 출원의 실시예의 차량용 기기의 응답 속도 테스트 방법을 구현하기 위한 전자기기를 나타내는 블록도이다. 전자기기는 다양한 형태의 디지털 컴퓨터, 예컨대, 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크스테이션, 개인 정보 단말, 서버, 블레이드 서버, 대형 컴퓨터, 및 기타 적합한 컴퓨터를 나타내기 위한 것이다. 전자기기는 다양한 형태의 이동장치, 예컨대, 개인 정보 단말, 셀폰, 스마트 폰, 웨어러블 기기 및 기타 유사한 컴퓨팅 장치를 더 나타낼 수 있다. 본문에 개시된 부재, 이들의 연결 및 관계, 및 이들의 기능은 단지 예시적인 것이며, 본문에 개시된 것 및/또는 요구하는 본 출원의 구현을 한정하려는 의도가 아니다.
도 8에 도시된 바와 같이, 전자기기(400)는, 판독 전용 메모리(ROM, 402)에 저장된 컴퓨터 프로그램 또는 저장유닛(408)으로부터 랜덤 액세스 메모리(RAM, 403)에 로딩된 컴퓨터 프로그램에 따라, 다양한 적합한 동작과 처리를 실행하는 컴퓨팅 유닛(401)을 포함한다. RAM(403)에는, 기기(400)의 동작에 필요한 다양한 프로그램과 데이터가 저장될 수도 있다. 컴퓨팅 유닛(401), ROM(402) 및 RAM(403)은 버스(404)를 통해 서로 연결된다. 입출력(I/O) 인터페이스(405)도 버스(404)에 연결된다.
기기(400)의 여러 부재는 I/O 인터페이스(405)에 연결되는 바, 예를 들면 키보드, 마우스 등 입력유닛(406); 예를 들면 다양한 유형의 디스플레이, 스피커 등 출력유닛(407); 예를 들면 마그네트 디스크, 광 디스크 등 저장유닛(408); 및 예를 들면 네트워크 카드, 모뎀, 무선통신 송수신기 등 통신유닛(409)을 포함한다. 통신유닛(409)은 기기(400)가 인터넷과 같은 컴퓨터 네트워크 및/또는 다양한 전신 네트워크를 통해 기타 기기와 정보/데이터를 교환한다.
컴퓨팅 유닛(401)은 처리와 컴퓨팅 능력을 구비한 다양한 통용 및/또는 전용 처리 모듈일 수 있다. 컴퓨팅 유닛(401)의 일부 예시는 중앙 처리유닛(CPU), 그래픽 처리유닛(GPU), 다양한 전용 인공 지능(AI) 컴퓨팅 칩, 다양한 머신 러닝 모델 알고리즘을 실행하는 컴퓨팅 유닛, 디지털 신호 프로세서(DSP) 및 임의의 적합한 프로세서, 컨트롤러, 마이크로 컨트롤러 등을 포함하지만 이에 한정되지 않는다. 컴퓨팅 유닛(401)은 예컨대, 차량용 기기의 응답 속도 테스트 방법과 같은 상기 설명된 각 방법과 처리를 실행하기 위한 것이다. 예를 들면, 일부 실시예에서, 차량용 기기의 응답 속도 테스트 방법은 유형적으로 머신 판독 가능 매체, 예를 들면 저장유닛(408)에 포함되는 컴퓨터 소프트웨어 프로그램으로 구현될 수 있다. 일부 실시예에서, 컴퓨터 프로그램의 부분 또는 전부는ROM(402) 및/또는 통신유닛(409)을 거쳐 기기(400)에 로딩 및/또는 장착될 수 있다. 컴퓨터 프로그램이 RAM(403)에 로딩되어 컴퓨팅 유닛(401)에 의해 실행될 때, 상기 설명된 차량용 기기의 응답 속도 테스트 방법의 하나 또는 복수의 단계를 실행할 수 있다. 선택적으로, 기타 실시예에서, 컴퓨팅 유닛(401)은 기타 임의의 적합한 방식으로(예를 들면, 펌웨어를 통해) 차량용 기기의 응답 속도 테스트 방법을 실행하도록 구성될 수 있다.
본 문에서 이상 설명된 시스템과 기술의 다양한 구현 방식은 디지털 전자 회로 시스템, 집적 회로 시스템, 필드 프로그램 가능 게이트 어레이(FPGA), 전용 집적회로(ASIC), 전용 표준 제품(ASSP), 시스템 온 칩의 시스템(SOC), 콤플렉스 프로그램 가능 로직 기기(CPLD), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에서 구현될 수 있다. 이러한 다양한 구현 방식은, 하나 또는 복수의 컴퓨터 프로그램에 구현하는 것을 포함할 수 있으며, 해당 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능 프로세서를 포함하는 시스템에서 실행 및/또는 해석될 수 있고, 해당 프로그램 가능 프로세서는 전용 또는 통용 프로그램 가능 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 또한, 데이터 및 명령을 해당 저장 시스템, 해당 적어도 하나의 입력 장치 및 해당 적어도 하나의 출력 장치에 전송할 수 있다.
본 출원의 방법을 구현하기 위한 프로그램 코드는 하나 또는 복수의 프로그램 언어 중 임의의 조합을 사용하여 작성될 수 있다. 이러한 프로그램 코드는 통용 컴퓨터, 전용 컴퓨터 또는 기타 프로그램 가능 데이터 처리 장치의 프로세서 또는 제어기에 제공되어, 프로그램 코드가 프로세서 또는 제어기에 의해 실행될 때 흐름도 및/또는 블록도에 규정된 기능/동작이 실시되도록 할 수 있다. 프로그램 코드는 완전하게 머신에서 실행될 수 있고, 부분적으로 머신에서 실행될 수도 있으며, 독립된 소프트웨어 패키지로서 부분적으로 머신에서 실행되고 부분적으로 원격 머신에서 실행되거나, 또는 완전하게 원격 머신 또는 서버에서 실행될 수 있다.
본 출원의 상하문에서 머신 판독 가능 매체는 명령 실행 시스템, 장치 또는 기기에 사용되거나, 또는 명령 실행 시스템, 장치 또는 기기와 결합적으로 사용되는 프로그램을 포함하거나 저장할 수 있는 유형인 매체일 수 있다. 머신 판독 가능 매체는 머신 판독 가능 신호 매체 또는 머신 판독 가능 저장매체일 수 있다. 머신 판독 가능 매체는 전자, 마그네트, 광학, 적외선 또는 반도체 시스템, 장치 또는 기기, 또는 상술한 내용의 임의의 적합한 결합을 포함하지만 이에 한정되지 않는다. 머신 판독 가능 저장매체의 더욱 구체적인 예시는 하나 또는 복수의 와이어 기반 전기 연결, 휴대용 컴퓨터 디스크, 하드 디스크, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 삭제 가능 프로그램 가능 롬(EPROM 또는 플래시 메모리), 광케이블, 휴대용 콤팩트 디스크 롬(CD-ROM), 광학 저장기기, 자기 저장 기기 또는 상술한 내용의 임의의 적합한 조합을 포함할 수 있다.
사용자와의 인터랙션을 제공하기 위하여, 컴퓨터 상에서 여기에 설명되는 시스템 및 기술을 실시할 수 있으며, 해당 컴퓨터는 사용자에게 정보를 표시하기 위한 표시장치(예를 들어, CRT(캐소드레이 튜브) 또는 LCD(액정 디스플레이) 모니터); 및 키보드와 지향 장치(예를 들어, 마우스 또는 트랙볼)를 구비하고, 사용자는 해당 키보드와 해당 지향장치를 통해 입력을 컴퓨터로 제공할 수 있다. 기타 종류의 장치는 또한 사용자와의 인터랙션을 제공할 수도 있다. 예를 들어, 사용자에게 제공되는 피드백은 임의의 형태의 센싱 피드백(예를 들어, 시각적 피드백, 청각적 피드백, 또는 촉각적 피드백)일 수 있고; 임의의 형태(사운드 입력, 음성 입력 또는 촉각 입력)을 통해 사용자로부터의 입력을 수신할 수 있다.
여기에 설명되는 시스템과 기술은 백그라운드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버로서), 또는 중간부재를 포함하는 컴퓨팅 시스템(예를 들어, 응용 서버), 또는 프론트 엔드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 유저 인터페이스 또는 인터넷 브라우저를 구비하는 사용자 컴퓨터, 사용자는 해당 그래픽 유저 인터페이스 또는 해당 인터넷 브라우저를 통해 여기에 설명되는 시스템 및 기술의 실시방식과 인터랙션할 수 있다), 또는 이러한 배그라운드 부재, 중간 부재, 또는 프론트 엔드 부재를 포함하는 임의의 컴퓨팅 시스템에서 실시될 수 있다. 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신망)을 통해 시스템의 부재를 서로 연결시킬 수 있다. 통신망의 예시로서, 랜(LAN), 광역 통신망(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있으며 통상적으로 통신망을 통해 인터랙션한다. 상응한 컴퓨터 상에서 실행되며 서로 클라이언트-서버 관계를 가지는 컴퓨터 프로그램을 통해 클라이언트와 서버의 관계를 생성한다. 서버는 클라우드 서버일 수 있고, 클라우드 컴퓨팅 서버 또는 클라우드 호스트라고 불리우며, 클라우드 컴퓨팅 서버 시스템 중의 하나의 호스트 제품으로서, 종래의 물리적인 호스트와 VPS 서버(“Virtual Private Server”, 또는 “VPS”로 약칭)에서 관리 난이도가 크고, 서비스 확장성이 약한 결함을 해결한다. 서버는 분포식 시스템 서버일 수 있고, 또는 블록 체인을 결합한 서버일 수 있다.
상술한 다양한 형태의 프로세스를 사용하여 단계를 재배열, 추가 또는 삭제할 수 있음을 이해해야 한다. 예를 들어, 본 출원에 기재된 각 단계는 병열로 수행될 수 있고 순차적으로 수행될 수도 있고 서로 다른 순서로 수행될 수도 있으며, 본 출원에 개시된 기술 솔루션이 원하는 결과를 얻을 수만 있다면, 본문에서는 여기서 한정하지 않는다.
상술한 구체적인 실시형태는, 본 출원의 보호범위에 대한 한정이 아니다. 본 분야의 통상의 지식을 가진 자라면, 설계 수요와 기타 요소를 기초로, 다양한 수정, 조합, 서브 조합 및 대체를 가할 수 있음을 이해할 수 있을 것이다. 본 출원의 정신과 원칙 내에서 이루어진 모든 수정, 동등한 대체와 개진 등은 모두 본 출원의 보호 범위 내에 속한다.

Claims (19)

  1. 멀티 미디어 정보를 획득하되, 상기 멀티 미디어 정보는 기설정된 음성 명령, 및 차량용 기기의 상기 기설정된 음성 명령에 대한 응답 정보를 포함하는 단계;
    상기 멀티 미디어 정보에 대해 해석하여, 상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 확정하는 단계;
    상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 단계를 포함하는 차량용 기기의 응답 속도 테스트 방법.
  2. 제1항에 있어서, 상기 멀티 미디어 정보에 대해 해석하여, 상기 기설정된 음성 명령의 종료 시간을 확정하는 상기 단계는,
    상기 멀티 미디어 정보로부터 오디오 문서를 추출하는 단계;
    상기 오디오 문서에서 오디오의 데시벨이 기설정된 데시벨 이상인 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 확정하는 단계;
    상기 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 상기 적어도 하나의 음성 세그먼트로부터 상기 기설정된 음성 명령의 종료 시간을 확정하는 단계를 포함하는 방법.
  3. 제2항에 있어서, 상기 응답 정보는 음성 정보를 포함하고; 상기 응답 정보에 대응되는 시간을 확정하는 단계는,
    상기 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 상기 적어도 하나의 음성 세그먼트로부터 상기 음성 정보의 시작 시간을 확정하는 단계를 포함하고;
    상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 상기 단계는,
    상기 기설정된 음성 명령의 종료 시간과 상기 음성 정보의 시작 시간을 기초로 , 상기 차량용 기기의 상기 기설정된 음성 명령에 대한 응답 음성의 보도 속도를 확정하는 단계를 포함하는 방법.
  4. 제2항에 있어서, 상기 오디오 문서에서 오디오의 데시벨이 기설정된 데시벨 이상인 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 확정하는 상기 단계는,
    상기 오디오 문서를 트레버스하고, 상기 오디오 문서의 제1 시각의 오디오의 데시벨이 기설정된 데시벨 이상이면, 상기 제1 시각을 제1 음성 세그먼트의 시작 시간으로 확정하고, 상기 제1 시각 이후에, 상기 오디오 문서의 제2 시각의 오디오의 데시벨이 기설정된 데시벨 이하이고, 제2 시각 이후의 기설정된 시간 내의 오디오의 데시벨이 기설정된 데시벨 이하이면, 상기 제2 시각을 상기 제1 음성 세그먼트의 종료 시간으로 확정하는 단계를 포함하는 방법.
  5. 제1항에 있어서, 상기 응답 정보는 이미지 정보를 포함하고; 상기 응답 정보에 대응되는 시간을 확정하는 단계는,
    상기 멀티 미디어 정보 중의 여러 프레임의 이미지의 유사도 매칭 결과 및/또는 문자 인식 결과를 기초로, 상기 이미지 정보에 대응되는 시간을 확정하는 단계를 포함하는 방법.
  6. 제5항에 있어서, 상기 기설정된 음성 명령은 웨이크업 명령을 포함하고; 상기 응답 정보는 웨이크업 응답 이미지를 포함하며;
    상기 멀티 미디어 정보 중의 여러 프레임의 이미지의 유사도 매칭 결과 및/또는 문자 인식 결과를 기초로, 상기 이미지 정보에 대응되는 시간을 확정하는 상기 단계는,
    상기 멀티 미디어 정보 중의 복수의 프레임의 이미지 중의 첫 번째 이미지와 기설정된 웨이크업 이미지에 대해 유사도 매칭을 수행하고, 유사도가 기설정 값보다 작으면, 제1 이미지와 상기 웨이크업 이미지의 유사도가 기설정 값 이상일 때까지 계속 다음 이미지와 상기 웨이크업 이미지에 대해 유사도 매칭을 수행하고, 상기 제1 이미지에 대응되는 시간을 상기 웨이크업 응답 이미지에 대응되는 시간으로 확정하는 단계를 포함하고;
    상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 상기 단계는,
    상기 웨이크업 응답 이미지에 대응되는 시간과 상기 웨이크업 명령의 종료 시간을 기초로, 상기 차량용 기기의 웨이크업 속도를 확정하는 단계를 포함하는 방법.
  7. 제5항에 있어서, 상기 기설정된 음성 명령은 음성 검색 명령을 포함하고; 상기 응답 정보는 검색 명령 표시 이미지를 포함하며;
    상기 멀티 미디어 정보 중의 여러 프레임의 이미지의 유사도 매칭 결과 및/또는 문자 인식 결과를 기초로, 상기 이미지 정보에 대응되는 시간을 확정하는 상기 단계는,
    상기 멀티 미디어 정보 중의 여러 프레임의 이미지 중의 제2 이미지에 대해 문자 인식을 수행하고, 상기 제2 이미지에서 인식된 문자와 상기 음성 검색 명령에 대응되는 문자가 매칭되지 않으면, 제3 이미지에서 인식된 문자와 상기 음성 검색 명령에 대응되는 문자가 매칭될 때까지 계속 상기 제2 이미지의 다음 이미지에 대해 문자 인식을 수행하고, 상기 제3 이미지에 대응되는 시간을 상기 검색 명령 표시 이미지에 대응되는 시간으로 확정하는 단계를 포함하고;
    상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 상기 단계는,
    상기 검색 명령 표시 이미지에 대응되는 시간과 상기 음성 검색 명령에 대응되는 종료 시간을 기초로, 상기 차량용 기기가 상기 음성 검색 명령에 대응되는 문자에 대한 표시 속도를 확정하는 단계. 포함하는 방법.
  8. 제7항에 있어서, 상기 응답 정보는 검색 결과 표시 이미지를 포함하고;
    상기 멀티 미디어 정보 중의 여러 프레임의 이미지의 유사도 매칭 결과 및/또는 문자 인식 결과를 기초로, 상기 이미지 정보에 대응되는 시간을 확정하는 상기 단계는,
    상기 제3 이미지의 다음 이미지와 상기 제3 이미지에 대해 유사도 매칭을 수행하고, 유사도가 기설정 값 이상이면, 제4 이미지와 상기 제3 이미지의 유사도가 기설정 값보다 작을 때까지 계속 다음 이미지와 상기 제3 이미지의 유사도를 계산하고, 상기 제4 이미지를 기준 이미지로 설정하는 단계;
    상기 기준 이미지 다음의 첫 번째 이미지부터 순차적으로 상기 기준 이미지와 유사도 매칭을 수행하고, 상기 기준 이미지 다음의 제5 이미지와 상기 기준 이미지의 유사도가 기설정 값보다 작으면, 상기 기준 이미지 다음의 기설정된 수량의 이미지와 상기 기준 이미지의 유사도가 모두 기설정 값 이상일 때까지 상기 제5 이미지를 새로운 기준 이미지로 설정하고, 본 단계를 중복 실행하고, 상기 기준 이미지에 대응되는 시간을 상기 검색 결과 표시 이미지에 대응되는 시간으로 확정하는 단계를 포함하고;
    상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 상기 단계는,
    상기 검색 결과 표시 이미지에 대응되는 시간과 상기 음성 검색 명령의 종료 시간을 기초로, 상기 차량용 기기의 검색 결과의 표시 속도를 확정하는 단계를 포함하는 방법.
  9. 멀티 미디어 정보를 획득하되, 상기 멀티 미디어 정보는 기설정된 음성 명령, 및 차량용 기기의 상기 기설정된 음성 명령에 대한 응답 정보를 포함하는 획득모듈;
    상기 멀티 미디어 정보에 대해 해석하여, 상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 확정하는 해석모듈;
    상기 기설정된 음성 명령의 종료 시간 및 상기 응답 정보에 대응되는 시간을 기초로, 상기 차량용 기기의 응답 속도를 확정하는 확정모듈을 포함하는 차량용 기기의 응답 속도 테스트 장치.
  10. 제9항에 있어서, 상기 해석모듈은,
    상기 멀티 미디어 정보로부터 오디오 문서를 추출하는 추출유닛;
    상기 오디오 문서에서 오디오의 데시벨이 기설정된 데시벨 이상인 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 확정하는 제1 확정유닛;
    상기 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 상기 적어도 하나의 음성 세그먼트로부터 상기 기설정된 음성 명령의 종료 시간을 확정하는 제2 확정유닛을 포함하는 장치.
  11. 제10항에 있어서, 상기 응답 정보는 음성 정보를 포함하고; 상기 해석모듈은,
    상기 적어도 하나의 음성 세그먼트의 시작 시간과 종료 시간을 기초로, 상기 적어도 하나의 음성 세그먼트로부터 상기 음성 정보의 시작 시간을 확정하는 제3 확정유닛을 포함하고;
    상기 확정모듈은,
    상기 기설정된 음성 명령의 종료 시간과 상기 음성 정보의 시작 시간을 기초로, 상기 차량용 기기의 상기 기설정된 음성 명령에 대한 응답 음성의 보도 속도를 확정하는 제4 확정유닛을 포함하는 장치.
  12. 제10항에 있어서, 상기 제1 확정유닛은,
    상기 오디오 문서를 트레버스하고, 상기 오디오 문서의 제1 시각의 오디오의 데시벨이 기설정된 데시벨 이상이면, 상기 제1 시각을 제1 음성 세그먼트의 시작 시간으로 확정하고, 상기 제1 시각 이후에, 상기 오디오 문서의 제2 시각의 오디오의 데시벨이 기설정된 데시벨 이하이면, 제2 시각 이후의 기설정된 시간 내의 오디오의 데시벨이 기설정된 데시벨 이하이면, 상기 제2 시각을 상기 제1 음성 세그먼트의 종료 시간으로 확정하는 장치.
  13. 제9항 내지 제12항 중 임의의 한 항에 있어서, 상기 응답 정보는 이미지 정보를 포함하고; 상기 해석모듈은,
    상기 멀티 미디어 정보 중의 여러 프레임의 이미지의 유사도 매칭 결과 및/또는 문자 인식 결과를 기초로, 상기 이미지 정보에 대응되는 시간을 확정하는 제5 확정유닛를 포함하는 장치.
  14. 제13항에 있어서, 상기 기설정된 음성 명령은 웨이크업 명령을 포함하고; 상기 응답 정보는 웨이크업 응답 이미지를 포함하며; 상기 제5 확정유닛은,
    상기 멀티 미디어 정보 중의 복수의 프레임의 이미지 중의 첫 번째 이미지와 기설정된 웨이크업 이미지에 대해 유사도 매칭을 수행하고, 유사도가 기설정 값보다 작으면, 계속 다음 이미지와 상기 웨이크업 이미지에 대해 유사도 매칭을 수행하여, 제1 이미지와 상기 웨이크업 이미지의 유사도가 기설정 값 이상일 때까지, 상기 제1 이미지에 대응되는 시간을 상기 웨이크업 응답 이미지에 대응되는 시간으로 확정하는 제1 확정 서브유닛을 포함하고;
    상기 확정모듈은,
    상기 웨이크업 응답 이미지에 대응되는 시간과 상기 웨이크업 명령의 종료 시간을 기초로, 상기 차량용 기기의 웨이크업 속도를 확정하는 제6 확정유닛을 포함하는 장치.
  15. 제13항에 있어서, 상기 기설정된 음성 명령은 음성 검색 명령을 포함하고; 상기 응답 정보는 검색 명령 표시 이미지를 포함하며;
    상기 제5 확정유닛은,
    상기 멀티 미디어 정보 중의 여러 프레임의 이미지 중의 제2 이미지에 대해 문자 인식을 수행하고, 상기 제2 이미지에서 인식된 문자와 상기 음성 검색 명령에 대응되는 문자가 매칭되지 않으면, 계속 상기 제2 이미지의 다음 이미지에 대해 문자 인식을 수행하고, 제3 이미지에서 인식된 문자와 상기 음성 검색 명령에 대응되는 문자가 매칭될 때까지, 상기 제3 이미지에 대응되는 시간을 상기 검색 명령 표시 이미지에 대응되는 시간으로 확정하는 제2 확정 서브유닛을 포함하고;
    상기 확정모듈은,
    상기 검색 명령 표시 이미지에 대응되는 시간과 상기 음성 검색 명령에 대응되는 종료 시간을 기초로, 상기 차량용 기기가 상기 음성 검색 명령에 대응되는 문자에 대한 표시 속도를 확정하는 제7 확정유닛을 포함하는 장치.
  16. 제15항에 있어서, 상기 응답 정보는 검색 결과 표시 이미지를 포함하고;
    상기 제5 확정유닛은,
    상기 제3 이미지의 다음 이미지와 상기 제3 이미지에 대해 유사도 매칭을 수행하고, 유사도가 기설정 값 이상이면, 계속 다음 이미지와 상기 제3 이미지의 유사도를 계산하고, 제4 이미지와 상기 제3 이미지의 유사도가 기설정 값보다 작을 때까지, 상기 제4 이미지를 기준 이미지로 설정하는 제3 확정 서브유닛;
    상기 기준 이미지 다음의 첫 번째 이미지부터 순차적으로 상기 기준 이미지와 유사도 매칭을 수행하고, 상기 기준 이미지 다음의 제5 이미지와 상기 기준 이미지의 유사도가 기설정 값보다 작으면, 상기 제5 이미지를 새로운 기준 이미지로 설정하고, 본 단계를 중복 실행하고, 상기 기준 이미지 다음의 기설정된 수량의 이미지와 상기 기준 이미지의 유사도가 모두 기설정 값 이상일 때까지, 상기 기준 이미지에 대응되는 시간을 상기 검색 결과 표시 이미지에 대응되는 시간으로 확정하는 제4 확정 서브유닛을 포함하고;
    상기 확정모듈은,
    상기 검색 결과 표시 이미지에 대응되는 시간과 상기 음성 검색 명령의 종료 시간을 기초로, 상기 차량용 기기의 검색 결과의 표시 속도를 확정하는 제8 확정유닛을 포함하는 장치.
  17. 적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신 연결되는 메모리;를 포함하고, 여기서,
    상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행될 수 있는 명령이 저장되고, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제1항 내지 제8항 중 임의의 한 항에 따른 방법을 수행할 수 있도록 하는 전자기기.
  18. 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장매체에 있어서, 상기 컴퓨터 명령은 컴퓨터가 제1항 내지 제8항 중 임의의 한 항에 따른 방법을 수행하도록 하는 비일시적 컴퓨터 판독 가능 저장매체.
  19. 컴퓨터 판독 가능 저장매체에 저장된 컴퓨터 프로그램에 있어서, 상기 컴퓨터 프로그램 중의 명령이 프로세서에 의해 실행될 때 제1항 내지 제8항 중 임의의 한 항에 따른 방법을 구현하는 프로그램 제품.
KR1020210086256A 2020-12-22 2021-07-01 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체 KR20210098397A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011530702.2 2020-12-22
CN202011530702.2A CN112908297B (zh) 2020-12-22 2020-12-22 车载设备的响应速度测试方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
KR20210098397A true KR20210098397A (ko) 2021-08-10

Family

ID=76111550

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210086256A KR20210098397A (ko) 2020-12-22 2021-07-01 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체

Country Status (5)

Country Link
US (1) US20210327427A1 (ko)
EP (1) EP3865996A3 (ko)
JP (1) JP7346496B2 (ko)
KR (1) KR20210098397A (ko)
CN (1) CN112908297B (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113380229B (zh) * 2021-06-08 2023-04-28 阿波罗智联(北京)科技有限公司 语音响应速度确定方法、相关装置及计算机程序产品
CN113721582B (zh) * 2021-08-03 2023-05-16 安徽江淮汽车集团股份有限公司 座舱系统响应效率测试方法、设备、存储介质及装置
CN113643704A (zh) * 2021-08-18 2021-11-12 中国第一汽车股份有限公司 车机语音系统的测试方法、上位机、系统和存储介质
CN114360530A (zh) * 2021-11-30 2022-04-15 北京罗克维尔斯科技有限公司 语音测试方法、装置、计算机设备和存储介质
CN114639373A (zh) * 2022-03-16 2022-06-17 北京德风运科技有限公司 一种智能语音测评方法、系统及存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001356936A (ja) 2000-04-11 2001-12-26 Fujitsu Ltd Gui系プログラムのテスト支援装置および支援方法
JP2006091912A (ja) 2005-11-10 2006-04-06 Seiko Epson Corp 音声認識方法及び音声認識装置並びに音声認識処理プログラムを記録した記録媒体
US8363161B2 (en) * 2006-05-26 2013-01-29 Broadcom Corporation Systems, methods, and apparatus for synchronization of audio and video signals
US8078688B2 (en) * 2006-12-29 2011-12-13 Prodea Systems, Inc. File sharing through multi-services gateway device at user premises
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
JP2012128440A (ja) 2012-02-06 2012-07-05 Denso Corp 音声対話装置
JP6111802B2 (ja) 2013-03-29 2017-04-12 富士通株式会社 音声対話装置及び対話制御方法
US9817634B2 (en) * 2014-07-21 2017-11-14 Intel Corporation Distinguishing speech from multiple users in a computer interaction
US20200118456A1 (en) * 2014-08-22 2020-04-16 Intelligent Technologies International, Inc. Secure Testing Device With Combiner
EP3291080A4 (en) * 2015-04-28 2019-01-02 Clarion Co., Ltd. Information processing device and information processing method
CN108604179A (zh) 2016-05-10 2018-09-28 谷歌有限责任公司 设备上语音助理的实现
CN112585674A (zh) * 2018-08-31 2021-03-30 三菱电机株式会社 信息处理装置、信息处理方法和程序
JP7225770B2 (ja) * 2018-12-19 2023-02-21 トヨタ自動車株式会社 車載機器操作システム
JP7069076B2 (ja) 2019-03-28 2022-05-17 メタウォーター株式会社 情報処理装置、情報処理システム、及びプログラム
CN111242455A (zh) * 2020-01-07 2020-06-05 北京百度网讯科技有限公司 电子地图语音功能的评测方法、装置、电子设备及存储介质
CN111724782B (zh) * 2020-06-18 2022-09-13 中汽院智能网联科技有限公司 一种车载语音交互系统的响应时间测试系统、方法及设备
CN111785268A (zh) * 2020-06-30 2020-10-16 北京声智科技有限公司 语音交互响应速度的测试方法、装置及电子设备
CN111986706A (zh) * 2020-07-31 2020-11-24 广州市凯泽利科技有限公司 一种基于音频分析的语音响应时间测试方法

Also Published As

Publication number Publication date
US20210327427A1 (en) 2021-10-21
EP3865996A3 (en) 2022-01-12
JP2022003388A (ja) 2022-01-11
CN112908297B (zh) 2022-07-08
EP3865996A2 (en) 2021-08-18
JP7346496B2 (ja) 2023-09-19
CN112908297A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
KR20210098397A (ko) 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체
CN109002510B (zh) 一种对话处理方法、装置、设备和介质
US20230010160A1 (en) Multimodal data processing
US20230069197A1 (en) Method, apparatus, device and storage medium for training video recognition model
JP7394809B2 (ja) ビデオを処理するための方法、装置、電子機器、媒体及びコンピュータプログラム
KR20200109239A (ko) 이미지를 처리하는 방법, 장치, 서버 및 저장 매체
CN114861889B (zh) 深度学习模型的训练方法、目标对象检测方法和装置
CN116521841B (zh) 用于生成回复信息的方法、装置、设备及介质
US20230066021A1 (en) Object detection
CN113810765B (zh) 视频处理方法、装置、设备和介质
CN111241043A (zh) 一种多媒体文件的分享方法、终端及存储介质
CN116028868B (zh) 设备故障分类方法、装置、电子设备及可读存储介质
US11741713B2 (en) Method of detecting action, electronic device, and storage medium
KR20230133808A (ko) Roi 검출 모델 훈련 방법, 검출 방법, 장치, 설비 및 매체
CN112802495A (zh) 一种机器人语音测试方法、装置、存储介质及终端设备
US20220004801A1 (en) Image processing and training for a neural network
CN114141236A (zh) 语言模型更新方法、装置、电子设备及存储介质
CN112163078A (zh) 智能应答方法、装置、服务器及存储介质
CN114501112B (zh) 用于生成视频笔记的方法、装置、设备、介质和产品
CN113836291B (zh) 数据处理方法、装置、设备和存储介质
CN116257611B (zh) 问答模型的训练方法、问答处理方法、装置及存储介质
CN114861658B (zh) 地址信息解析方法及装置、设备和介质
WO2022062619A1 (en) Real-time vs non-real time audio streaming
US20230145853A1 (en) Method of generating pre-training model, electronic device, and storage medium
CN110647519B (zh) 对测试样本中的缺失属性值进行预测的方法及装置