KR102066451B1 - 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치 - Google Patents

차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치 Download PDF

Info

Publication number
KR102066451B1
KR102066451B1 KR1020180013489A KR20180013489A KR102066451B1 KR 102066451 B1 KR102066451 B1 KR 102066451B1 KR 1020180013489 A KR1020180013489 A KR 1020180013489A KR 20180013489 A KR20180013489 A KR 20180013489A KR 102066451 B1 KR102066451 B1 KR 102066451B1
Authority
KR
South Korea
Prior art keywords
data
skill
candidate
command
voice
Prior art date
Application number
KR1020180013489A
Other languages
English (en)
Other versions
KR20190098868A (ko
Inventor
조기현
이정석
Original Assignee
주식회사 오비고
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 오비고 filed Critical 주식회사 오비고
Priority to KR1020180013489A priority Critical patent/KR102066451B1/ko
Priority to US15/903,397 priority patent/US10741178B2/en
Publication of KR20190098868A publication Critical patent/KR20190098868A/ko
Application granted granted Critical
Publication of KR102066451B1 publication Critical patent/KR102066451B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/12Simultaneous equations, e.g. systems of linear equations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mechanical Engineering (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)

Abstract

본 발명은, 차량용 AI 서비스를 제공하는 방법에 있어서, (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보(상기 스킬 후보는 서비스 카테고리를 포함함) 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및 (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 방법 및 이를 이용한 장치를 개시한다. 본 발명에 따르면, AI 서버에 의한 1차적인 음성 분석 데이터, 다른 사용자들의 음성을 분석한 실시간 트렌드 데이터, 사용자가 과거에 발화했던 음성을 분석한 사용자 히스토리 데이터, 및 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터 등을 분석함으로써 사용자의 의도를 정확하게 파악할 수 있고, 각각의 데이터에 포함된 복수의 의도 분석 결과 후보 및 결과 후보 각각의 적합도를 의미하는 매칭 점수를 소정의 알고리즘에 의해 분석함으로써 사용자가 요청한 요구 사항을 보다 정확하게 파악할 수 있다.

Description

차량용 AI 서비스를 제공하는 방법 및 이를 이용한 장치{METHOD FOR PROVIDING VEHICLE AI SERVICE AND DEVICE USING THE SAME}
본 발명은 차량용 AI 서비스를 제공하는 방법 및 이를 이용한 장치에 관한 것으로, 보다 상세하게는 (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보(상기 스킬 후보는 서비스 카테고리를 포함함) 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계 및 (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 방법 및 이를 이용한 장치에 관한 것이다.
종래의 차량에서 사용되는 AI(인공지능) 서비스는 사용자가 발화한 음성을 분석함으로써 사용자의 의도를 파악하고, 분석 결과에 따라 사용자의 요청 사항인 것으로 도출된 서비스를 제공한다. 여기서, 사용자의 음성이 명확한 경우에는 문제가 없지만, 사용자의 음성에 중복되는 의미가 존재하거나 사용자의 발음이 부정확한 경우에는 사용자의 요청 사항을 정확하게 파악하기 어려운 실정이다.
예를 들어, 사용자가 "OOO"라는 단어를 발화한 경우, 해당 단어와 매칭되는 장소도 존재하고 이와는 별개의 노래 곡명도 존재한다면, 실제 사용자가 요청한 것과는 다른 결과가 도출될 가능성이 있다. 다른 예로서, 사용자가 "가격 싼 주유소 찾기"라고 요청을 한 경우, 현재 사용자가 이용 중인 차량은 경유차인데, 휘발유 가격이 저렴한 주유소를 찾아주는 상황이 발생할 수 있다.
따라서, 본 발명자는 차량용 AI 서비스를 제공함에 있어서 사용자가 요청한 요구 사항을 보다 정확하게 파악하기 위하여 이와 같은 방법 및 장치를 개발하기에 이르렀다.
따라서, 본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.
또한, 본 발명은 AI 서버에 의한 1차적인 음성 분석 데이터, 다른 사용자들의 음성을 분석한 실시간 트렌드 데이터, 사용자가 과거에 발화했던 음성을 분석한 사용자 히스토리 데이터, 및 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터 등을 분석함으로써 사용자의 의도를 정확하게 파악하는 것을 다른 목적으로 한다.
또한, 본 발명은 각각의 데이터에 포함된 복수의 의도 분석 결과 및 결과 각각의 적합도를 의미하는 매칭 점수를 소정의 알고리즘에 의해 분석함으로써 사용자가 요청한 요구 사항을 보다 정확하게 파악하는 것을 또 다른 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.
본 발명의 일 태양에 따르면, 차량용 AI 서비스를 제공하는 방법에 있어서, (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및 (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 방법이 제공된다.
본 발명의 다른 태양에 따르면, 차량용 AI 서비스를 제공하는 장치에 있어서, 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 장치가 제공된다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 장치, 장치 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
본 발명에 따르면, AI 서버에 의한 1차적인 음성 분석 데이터, 다른 사용자들의 음성을 분석한 실시간 트렌드 데이터, 사용자가 과거에 발화했던 음성을 분석한 사용자 히스토리 데이터, 및 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터 등을 분석함으로써 사용자의 의도를 정확하게 파악할 수 있다.
또한, 각각의 데이터에 포함된 복수의 의도 분석 결과 후보 및 결과 후보 각각의 적합도를 의미하는 매칭 점수를 소정의 알고리즘에 의해 분석함으로써 사용자가 요청한 요구 사항을 보다 정확하게 파악할 수 있다.
도 1은 본 발명의 일 실시예에 따른 차량용 AI 서비스를 제공하는 시스템의 구성도,
도 2는 본 발명의 일 실시예에 따른 데이터 각각의 가중치와, 스킬 후보 및 명령어 후보 각각의 매칭 점수에 따라 사용자의 의도를 분석하는 방법을 설명하기 위한 예시도,
도 3a 및 도 3b는 본 발명의 일 실시예에 따라 매칭도를 산출하는 방법을 설명하기 위한 예시도.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다.
또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 차량용 AI 서비스를 제공하는 시스템(1000)의 구성도를 도시하고 있다.
도 1을 참조하면, 본 발명에 따른 시스템(1000)은 AI 서비스 제공 장치(100), AI 서버(200) 및 트렌드 분석 서버(300) 등을 포함할 수 있다. 여기서, 도 1에는 AI 서비스 제공 장치(100)가 차량의 AVN System에 포함되어 외부의 AI 서버(200) 및 트렌드 분석 서버(300) 등과 신호를 주고받는 것으로 도시되었으나, 이는 이해를 돕기 위한 하나의 예시일 뿐, AI 서버(200) 및 트렌드 분석 서버(300)가 AI 서비스 제공 장치(100)에 포함되는 형태이거나, AI 서비스 제공 장치(100)가 AVN System에 포함되지 않고 태블릿이나 스마트폰 등의 독립적인 형태로서 차량에 연결되어 AI 서비스를 제공하도록 구현될 수도 있을 것이다.
먼저, AI 서비스 제공 장치(100)는 프로세서(10) 및 통신부(20)를 포함할 수 있다. 여기서, AI 서비스 제공 장치(100)는 AI 서버 I/F(30), 음성 분석 데이터 수신부(40), 실시간 트렌드 데이터 수신부(50), 사용자 히스토리 데이터(60), 상황 인지부(70), 의도 분석 결정부(80), 서비스 제어부(90) 등을 더 포함할 수 있으나 필수적인 것은 아니며, 이들은 프로세서(10) 및 통신부(20)에 포함되는 형태이거나, 프로세서(10) 및 통신부(20)와 신호를 주고 받으며 프로세서(10)의 관장에 의해 장치를 제어하는 형태일 수도 있을 것이다.
구체적으로, AI 서비스 제공 장치(100)는, 차량 또는 장치(100)에 연결된 소정의 음성 입력부(미도시)를 통해 사용자의 음성이 입력되면, 통신부(20)를 통해 입력된 음성을 AI 서버(200)로 전송하고, AI 서버(200)에 의해 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 생성된 음성 분석 데이터를 전송받을 수 있을 것이다. 여기서, AI 서비스 제공 장치(100) 및 AI 서버(200) 간의 통신은 통신부(20)를 통해 이루어질 수 있으며 AI 서버 I/F(30) 및 음성 분석 데이터 수신부(40)와 연동될 수도 있을 것이다.
한편, AI 서버(200)는 음성 인식(STT; Speech-to-Text), 자연어 처리(NLP; Natural Language Processing), 음성 합성(TTS; Text-to- Speech) 등의 기능을 수행할 수 있다. 이를 통해 AI 서버(200)는 사용자의 음성 언어를 해석하여 문자 데이터로 전환하고, 형태소 분석, 구문 분석, 화행 분석 및 대화 처리 등을 통해 사용자가 음성을 발화한 의도 및 음성의 의미를 1차적으로 분석하며, 분석된 결과를 토대로 복수의 스킬 후보 및 명령어 후보를 추출하여 AI 서비스 제공 장치(100)로 전송할 수 있을 것이다.
즉, 종래의 AI 서비스에서는 AI 서버(200)가 최종 의도 분석이 완료된 결과 1개만을 차량 또는 차량에 연결된 장치로 전송하는 것과 대비하여, 본 발명에 따른 일 실시예에서는, AI 서버(200)에 의해 1차적으로 브로드하게 해석된 음성 분석 데이터(복수의 스킬 후보 및 명령어 후보를 포함함)를 전송받아, 이를 바탕으로 AI 서비스 제공 장치(100)가 조금 더 정밀하게 2차 의도 분석을 수행할 수 있다.
여기서, AI 서버(200)에 의해 추출되는 스킬 후보는 차량 또는 장치(100)에서 실행 가능한 도메인이나 앱, 컨텐츠 등의 서비스 카테고리를 포함할 수 있는데, 예시적으로, 날씨, 음악, 시간, 뉴스, 라디오, 내비게이션, 장소, 주식, 인물, 전화 등이 스킬 후보로 추출될 수 있으나, 이에 한정되는 것은 아니다.
또한, 명령어 후보는 차량 또는 장치(100)에서 수행 가능한 커맨드 등을 포함할 수 있는데, 가령, 스킬 후보들을 실행시킬 수 있는 "들려줘", "찾아줘(검색)" 및 "재생"과 같은 다양한 방법에 대한 커맨드나, "잠금"과 같은 제어 방법에 대한 커맨드가 명령어 후보로 추출될 수 있을 것이나, 이 또한 한정되는 것은 아니다.
다음으로, AI 서비스 제공 장치(100)의 프로세서(10)는, AI 서버(200)로부터 전송받은 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 사용자가 음성을 발화한 의도를 파악하고, 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정할 수 있을 것이다.
여기서, 제1 데이터(음성 분석 데이터), 제2 데이터(실시간 트렌드 데이터), 제3 데이터(사용자 히스토리 데이터) 및 제4 데이터(상황 데이터)는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함할 수 있는데, 구체적인 스킬 후보 및 명령어 후보에 대한 설명은 음성 분석 데이터와 관련하여 전술한 내용과 중복되므로 설명을 생략한다.
한편, 제2 데이터(실시간 트렌드 데이터)는 트렌드 분석 서버(300)에 의해 최근에 다른 사용자들이 많이 사용하는 것으로 분석된 AI 서비스 문구, 스킬 후보 및 명령어 후보 등을 포함할 수 있는데, 예시적으로, 최근 관심이 집중되고 있는 뉴스 주제, 스포츠 경기, 사건 사고 및 자연 재해 등과 같은 최근 이슈에 대한 키워드가 반영될 수 있을 것이다.
또한, 나이, 성별, 직업 등 사용자의 인적 정보와 유사한 인적 정보를 가진 타 사용자들의 실시간 트렌드 데이터를 파악함으로써, 프로세서(10)는 사용자가 음성을 발화한 의도를 더욱 정확하게 파악할 수 있을 것이다. 여기서, 트렌드 분석 서버(300) 및 프로세서(10) 간의 통신은 실시간 트렌드 데이터 수신부(50) 또는 통신부(20)를 통해 이루어질 수 있을 것이다.
다음으로, 제3 데이터(사용자 히스토리 데이터)(60)는 현재 시간을 포함하는 소정 범위 내의 시간대, 현재 위치를 포함하는 소정 범위 내의 장소, 현재 같이 있는 인물, 현재 바라보고 있는 사물 등 현재와 유사한 조건 하에서 과거에 사용자에 의해 발화되었던 음성을 분석함으로써 생성된 정보를 포함할 수 있는데, 사용자가 발화한 음성 및 의도를 분석한 기록이 데이터베이스 형태로 누적되어 관리될 수 있을 것이다.
이와 같은 제3 데이터(사용자 히스토리 데이터)를 이용함으로써, 가령, 동 시간대에 사용자가 라디오의 특정 주파수 실행을 많이 요청한 것으로 분석되는 경우, 프로세서(10)는 사용자가 "라디오"라는 단어만 발화하여도 라디오의 특정 주파수를 실행시키도록 제어할 수 있을 것이다.
다른 예로서, 사용자가 "아메리카노"라는 단어를 발화한 경우, 사용자의 음악 재생 리스트에 "아메리카노"라는 곡 명이 존재하더라도, 동 시간대에 사용자가 현재 위치 주변의 POI(Point of Interest)로 분석되는 특정 카페를 자주 방문한 것으로 분석된다면, 프로세서(10)는 해당 카페를 목적지로 설정하여 내비게이션이 실행되도록 제어할 수 있을 것이다.
다음으로, 제4 데이터(상황 데이터)는 (i) 차량의 모델명 및 엔진 타입(가령, 휘발유, 경유, LPG, 전기를 이용하는 지에 대한 정보) 중 적어도 하나에 대한 정보를 포함하는 차량 정보, (ii) 차량의 속도, 기어 모드 및 주차 상태 중 적어도 하나에 대한 정보를 포함하는 운전 상태 정보, (iii) 차량이 주행 중인 위치, 방향 및 도로명 중 적어도 하나에 대한 정보를 포함하는 위치 정보, (iv) 현재의 시각 및 날씨 중 적어도 하나에 대한 정보를 포함하는 상황 정보, 및 (v) 차량에 구비되거나 연결된 장치에서 현재 실행되고 있는 적어도 하나의 애플리케이션에 대한 앱 정보 중 적어도 하나를 포함할 수 있다.
이와 같은 제4 데이터(상황 데이터)를 이용함으로써, 가령, 사용자가 "가격 싼 주유소 찾기"라고 요청을 했을 때, 현재 사용자가 이용 중인 차량이 LPG 차인 경우, 프로세서(10)는 현재 위치 주변에서 가장 저렴한 LPG 충전소를 목적지로 설정하여 내비게이션이 실행되도록 제어할 수 있을 것이다.
여기서, 상황 인지부(70) 또는 프로세서(10)가 차량 또는 장치(100)의 OS(400)를 기반으로 현재 차량의 운전 상태, 현재 사용자가 취하고 있는 동작 등에 대한 다양한 정보들을 취합하여 제4 데이터(상황 데이터)를 생성 및 관리할 수 있을 것이다.
이처럼, 제1 데이터(음성 분석 데이터), 제2 데이터(실시간 트렌드 데이터), 제3 데이터(사용자 히스토리 데이터) 및 제4 데이터(상황 데이터)의 분석을 통해, 프로세서(10) 또는 의도 분석 결정부(80)가 사용자의 의도를 파악하고, 복수의 스킬 후보 및 복수의 명령어 후보 중에서 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하여, 서비스 제어부(90)로 하여금 차량 또는 장치(100)의 Service Apps(600)을 제어하도록 지원함으로써, Content Provider(700)를 통해 사용자의 요청 Contents가 제공될 수 있을 것이다.
다음으로, 도 2, 도 3a 및 도 3b를 참조로 하여 본 발명의 일 실시예에 따른 데이터 각각의 가중치와, 스킬 후보 및 명령어 후보 각각의 매칭 점수에 따라 사용자의 의도를 분석하는 방법 및 매칭도를 산출하는 방법을 설명하도록 한다.
여기서, 가중치는, 사용자가 음성을 발화한 의도를 분석함에 있어서 각각의 데이터가 갖는 비중을 의미하며, 각각의 가중치 값은 최초에는 실험을 통해 결정될 수 있지만, 의도 분석에 대한 경험치가 쌓일 수록 분석 결과의 정확도를 높이기 위한 방향으로 조정될 수 있을 것이다.
먼저, 제1 데이터(음성 분석 데이터), 제2 데이터(실시간 트렌드 데이터), 제3 데이터(사용자 히스토리 데이터) 및 제4 데이터(상황 데이터) 중 적어도 일부를 제m 데이터(210)라고 하고, 제m 데이터에 포함되는 스킬 후보를 제m-k 스킬 후보(240), 제m 데이터에 포함되는 명령어 후보를 제m-n 명령어 후보(240)라고 상정할 때, 제m 데이터(210)는, 각각의 제m-k 스킬 후보(240)마다 사용자가 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수(260)에 대한 정보, 각각의 제m-n 명령어 후보(240)마다 사용자가 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수(260)에 대한 정보를 더 포함할 수 있다. 여기서, k, n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화될 수 있는 자연수를 의미한다.
예시적으로, 도 2를 참조하면, 제1 데이터(음성 분석 데이터)의 스킬 후보(240)는 제1-1 스킬 후보(날씨) 및 제1-2 스킬 후보(음악)며, 이들의 스킬 점수(260) 값은 각각 0.80, 0.10으로 관리되고 있다.
본 발명에 따른 일 실시예로서, 제1 데이터(음성 분석 데이터)에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우, 프로세서(10)는, 특정 명령어 후보를 최종 명령어로 결정하고, 특정 명령어 후보에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정할 수 있을 것이다.
즉, 도 2를 참조로 하면, 제1-1 스킬 후보(날씨)의 점수 값 0.80, 제1-2 스킬 후보(음악)의 점수 값 0.10, 제1-1 명령어 후보(들려줘)의 점수 값 0.90 및 제1-2 명령어 후보(틀어줘)의 점수 값 0.05 중에서, 가장 높은 수치에 대응되는 후보가 제1-1 명령어 후보(들려줘)인 경우 프로세서(10)는 "들려줘"를 최종 명령어로 결정할 수 있다.
여기서, 도 3a를 참조하면, 최종 명령어로 결정된 특정 명령어 후보에 대응되는 명령을 실행 가능한 특정 스킬 후보(310a)를 제a 특정 스킬 후보(a는 1부터 특정 스킬 후보의 개수까지 변화되는 자연수임)라고 상정할 때, 프로세서(10)는, 각각의 제m 데이터에 대한 가중치인 제m 가중치(220)를 참조로 하여, 제a 특정 스킬 후보(310a) 각각에 대하여, 사용자가 음성을 발화한 의도에 매칭되는 제a 매칭도(330a)를 산출할 수 있을 것이다.
구체적으로, 제a 매칭도(330a)는, 제m 가중치(220) 및 제a 특정 스킬 후보(310a)에 대응되는 제m 데이터 각각의 스킬 점수(260)의 곱의 합계로 이루어지며, 프로세서(10)는 각각의 제a 매칭도(330a) 중에서 가장 높은 수치에 대응되는 특정 스킬 후보를 최종 스킬로 결정할 수 있다.
즉, 도 3a를 참조하면, 최종 명령어가 "들려줘"이고 "들려줘"에 대응되는 명령을 실행 가능한 특정 스킬 후보(310a)가 제1 특정 스킬 후보(날씨), 제2 특정 스킬 후보(음악) 및 제3 특정 스킬 후보(뉴스)일 경우, 각각의 특정 스킬 후보(310a)에 대하여 매칭도 값(350a)을 산출할 수 있다.
제1 특정 스킬 후보(날씨)의 경우, 도 2를 참조하면, "날씨"가 제1 데이터 및 제3 데이터의 스킬 후보로서 존재하는 것을 확인할 수 있다. 여기서, 제1 데이터의 가중치 5 및 제1-1 스킬 후보의 점수 0.80의 곱인 4.00과, 제3 데이터의 가중치 2 및 제3-1 스킬 후보의 점수 0.20의 곱인 0.40의 합계로 제1 매칭도 값이 결정된다.
이와 같은 방식으로 제2 특정 스킬 후보(음악) 및 제3 특정 스킬 후보(뉴스) 각각의 매칭도 값을 산출하면, 제2 매칭도의 값은 0.80, 제3 매칭도의 값은 0.50이 되며, 제1 매칭도, 제2 매칭도 및 제3 매칭도 중 가장 큰 값인 4.40에 대응되는 제1 특정 스킬 후보(날씨)가 최종 스킬로 결정될 수 있다.
한편, 제1 데이터(음성 분석 데이터)에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우, 프로세서(10)는, 특정 스킬 후보를 최종 스킬로 결정하고, 특정 스킬 후보에 대응되는 스킬을 수행 가능한 명령어 후보 중에서 최종 명령어를 결정할 수 있을 것이다.
여기서, 도 3b를 참조하면, 특정 스킬 후보에 대응되는 스킬을 수행 가능한 특정 명령어 후보(310b)를 제a 특정 명령어 후보(a는 1부터 특정 명령어 후보의 개수까지 변화되는 자연수임)라고 상정할 때, 프로세서(10)는, 각각의 제m 데이터(210)에 대한 가중치인 제m 가중치(220)를 참조로 하여, 제a 특정 명령어 후보(310b) 각각에 대하여, 사용자가 음성을 발화한 의도에 매칭되는 제a 매칭도(330b)를 산출하되, 제a 매칭도 값(350b)은, 제m 가중치(220) 및 제a 특정 명령어 후보(310b)에 대응되는 제m 데이터 각각의 명령어 점수(260)의 곱의 합계로 이루어지며, 각각의 제a 매칭도 값(350b) 중에서 가장 높은 수치에 대응되는 특정 명령어 후보를 최종 명령어로 결정할 수 있을 것이다.
한편, 본 발명의 다른 일 실시예로서, 각각의 제m-k 스킬 점수 및 제m 가중치의 곱(270), 각각의 제m-n 명령어 점수 및 제m 가중치의 곱(270) 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우, 프로세서(10)는, 특정 명령어 후보를 최종 명령어로 결정하고, 특정 명령어 후보에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정할 수 있을 것이다.
또한, 각각의 제m-k 스킬 점수 및 제m 가중치의 곱(270), 각각의 제m-n 명령어 점수 및 제m 가중치의 곱(270) 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우, 프로세서(10)는, 특정 스킬 후보를 최종 스킬로 결정하고, 특정 스킬 후보에 대응되는 스킬을 수행 가능한 명령어 후보 중에서 최종 명령어를 결정할 수 있을 것이다.
예시적으로, 도 2를 참조하면, 가중치x점수(270) 값 중에서 제1 데이터의 명령어 후보인 제1-1 명령어 후보(들려줘)의 가중치x점수 값이 가장 큰 것을 확인할 수 있다. 이 경우, "들려줘"를 최종 명령어로 결정하고, "들려줘"에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정할 수 있을 것이다.
본 발명의 또 다른 일 실시예로서, 프로세서(10)는, 각각의 제m-k 스킬 점수(260) 및 제m-n 명령어 점수(260) 중에서 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우, 특정 명령어 후보를 최종 명령어로 결정하고 특정 명령어 후보에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정하며, 각각의 제m-k 스킬 점수(260 및 제m-n 명령어 점수(260) 중에서 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우, 특정 스킬 후보를 최종 스킬로 결정하고 특정 스킬 후보에 대응되는 스킬을 수행 가능한 명령어 후보 중에서 최종 명령어를 결정하는 경우를 상정할 수 있을 것이다.
예시적으로, 도 2를 참조하면, 제m-k 스킬 점수(260) 및 제m-n 명령어 점수(260) 중에서 제4 데이터의 제4-2 스킬 후보(내비게이션)의 점수가 0.95로 가장 높은 것을 확인할 수 있으며, 이 때, 프로세서(10)는 "내비게이션"을 최종 스킬로 결정할 수 있을 것이다.
여기서, 도 3b를 참조하면, "내비게이션"이라는 스킬을 수행 가능한 명령어 후보(310b)가 제1 특정 명령어 후보(틀어줘) 및 제2 특정 명령어 후보(안내)일 경우, 각각의 특정 명령어 후보(310b)에 대하여 매칭도 값(350b)을 산출할 수 있다.
제1 특정 명령어 후보(틀어줘)의 경우, 도 2를 참조하면, "틀어줘"가 제1 데이터 및 제4 데이터의 명령어 후보로서 존재하는 것을 확인할 수 있다. 여기서, 제1 데이터의 가중치 5 및 제1-2 명령어 후보의 점수 0.05의 곱인 0.25와, 제4 데이터의 가중치 2 및 제4-2 명령어 후보의 점수 0.40의 곱인 0.80의 합계로 제1 매칭도 값이 결정된다.
이와 같은 방식으로, 제2 특정 명령어 후보(안내)의 매칭도 값을 산출하면, 제2 매칭도의 값은 1.30으로, 제1 매칭도의 값인 1.05보다 큰 수치를 가지므로, 제2 특정 명령어 후보(안내)가 최종 명령어로 결정될 수 있을 것이다.
한편, 본 발명의 일 실시예에 따른 차량용 AI 서비스를 제공하는 시스템(1000)은, PnP 모듈(500)을 더 포함할 수 있는데, PnP 모듈(500)은 플러그앤 플레이 방식으로 현재 시스템(1000)에 연결된 하드웨어 및 소프트웨어의 가용 여부를 전달하는 기능을 수행할 수 있다. 이를 통해 하드웨어뿐만 아니라 해당 하드웨어에서 제공하는 서비스와 소프트웨어 프레임워크에서 전달하는 어플리케이션의 서비스도 등록할 수 있다.
구체적으로, AI 서비스 제공 장치(100)나 이에 연결된 차량 또는 소정의 장치에 새로운 앱이 설치되면, PnP 모듈(500)을 통해 새로운 앱이 제공하는 AI 서비스가 퍼블리시되고, 해당 AI 서비스와 관련된 스킬 및 명령어가 등록될 수 있을 것이다.
여기서, 현재 AI 서비스 제공 장치(100)에 새로운 앱이 제공하는 스킬 및 명령어에 대한 정보가 존재하지 않으면, PnP 모듈(500) 또는 프로세서(10)가 해당 스킬 및 명령어에 대한 정보를 외부의 서버로부터 다운로드 받을 수 있을 것이다.
즉, 종래의 AI 서비스 기술은 앱 기반이 아니라 AI 서비스를 제공하는 플랫폼이 허용하는 범위 내에서 한정적으로 수행되는 서비스 기반의 방식이지만, 본 발명에 따르면, PnP 모듈(500)이 앱의 추가/삭제 및 업데이트에 따라 AI 서비스의 추가/삭제가 동적으로 이루어질 수 있도록 지원함으로써, AI 서비스의 확장 및 서비스 간의 매쉬업(mash-up)이 가능하다.
이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.
1000 : 시스템 100 : AI 서비스 제공 장치
200 : AI 서버 300 : 트렌드 분석 서버
400 : OS 500 : PnP 모듈
600 : Service Apps 700 : Content Provider
10 : 프로세서 20 : 통신부
30 : AI 서버 I/F 40 : 음성 분석 데이터 수신부
50 : 실시간 트렌드 데이터 수신부 60 : 사용자 히스토리 데이터
70 : 상황 인지부 80 : 의도 분석 결정부
90 : 서비스 제어부

Claims (20)

  1. 차량용 AI 서비스를 제공하는 방법에 있어서,
    (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
    (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    상기 (b) 단계에서,
    상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
    상기 AI 서비스 제공 장치는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하고,
    상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 특정 스킬 후보를 제a 특정 스킬 후보(a는 1부터 상기 특정 스킬 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
    상기 AI 서비스 제공 장치는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 스킬 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하되,
    상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 스킬 후보에 대응되는 상기 제m 데이터 각각의 스킬 점수의 곱의 합계로 이루어지며,
    각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 스킬 후보를 상기 최종 스킬로 결정하는 것을 특징으로 하는 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 차량용 AI 서비스를 제공하는 방법에 있어서,
    (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
    (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    상기 (b) 단계에서,
    상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
    상기 AI 서비스 제공 장치는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하고,
    상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 특정 명령어 후보를 제a 특정 명령어 후보(a는 1부터 상기 특정 명령어 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
    상기 AI 서비스 제공 장치는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 명령어 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하되,
    상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 명령어 후보에 대응되는 상기 제m 데이터 각각의 명령어 점수의 곱의 합계로 이루어지며,
    각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 명령어 후보를 상기 최종 명령어로 결정하는 것을 특징으로 하는 방법.
  7. 차량용 AI 서비스를 제공하는 방법에 있어서,
    (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
    (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    상기 (b) 단계에서,
    각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
    각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
    상기 AI 서비스 제공 장치는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하는 것을 특징으로 하는 방법.
  8. 차량용 AI 서비스를 제공하는 방법에 있어서,
    (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
    (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    상기 (b) 단계에서,
    각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
    각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
    상기 AI 서비스 제공 장치는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하는 것을 특징으로 하는 방법.
  9. 제1항에 있어서,
    상기 제3 데이터는,
    현재 시간을 포함하는 소정 범위 내의 시간대 또는 현재 위치를 포함하는 소정 범위 내의 장소에서 과거에 상기 사용자에 의해 발화되었던 음성을 분석함으로써 생성된 정보를 포함하는 것을 특징으로 하는 방법.
  10. 제1항에 있어서,
    상기 제4 데이터는,
    차량의 모델명 및 엔진 타입 중 적어도 하나에 대한 정보를 포함하는 차량 정보; 상기 차량의 속도, 기어 모드 및 주차 상태 중 적어도 하나에 대한 정보를 포함하는 운전 상태 정보; 상기 차량이 주행 중인 위치, 방향 및 도로명 중 적어도 하나에 대한 정보를 포함하는 위치 정보; 현재의 시각 및 날씨 중 적어도 하나에 대한 정보를 포함하는 상황 정보; 및 상기 차량에 구비되거나 연결된 장치에서 현재 실행되고 있는 적어도 하나의 애플리케이션에 대한 앱 정보; 중 적어도 하나를 포함하는 것을 특징으로 하는 방법.
  11. 차량용 AI 서비스를 제공하는 장치에 있어서,
    음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
    상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
    상기 프로세서는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하는 프로세스를 수행하고,
    상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 특정 스킬 후보를 제a 특정 스킬 후보(a는 1부터 상기 특정 스킬 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
    상기 프로세서는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 스킬 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하는 프로세스를 수행하되,
    상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 스킬 후보에 대응되는 상기 제m 데이터 각각의 스킬 점수의 곱의 합계로 이루어지며,
    각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 스킬 후보를 상기 최종 스킬로 결정하는 것을 특징으로 하는 장치.
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 차량용 AI 서비스를 제공하는 장치에 있어서,
    음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
    상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
    상기 프로세서는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하는 프로세스를 수행하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하는 프로세스를 수행하고,
    상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 특정 명령어 후보를 제a 특정 명령어 후보(a는 1부터 상기 특정 명령어 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
    상기 프로세서는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 명령어 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하는 프로세스를 수행하되,
    상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 명령어 후보에 대응되는 상기 제m 데이터 각각의 명령어 점수의 곱의 합계로 이루어지며,
    각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 명령어 후보를 상기 최종 명령어로 결정하는 것을 특징으로 하는 장치.
  17. 차량용 AI 서비스를 제공하는 장치에 있어서,
    음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
    상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
    각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
    상기 프로세서는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하는 프로세스를 수행하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하는 프로세스를 수행하는 것을 특징으로 하는 장치.
  18. 차량용 AI 서비스를 제공하는 장치에 있어서,
    음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
    상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
    를 포함하되,
    상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
    제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
    상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
    각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
    각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
    상기 프로세서는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하는 프로세스를 수행하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하는 프로세스를 수행하는 것을 특징으로 하는 장치.
  19. 제11항에 있어서,
    상기 제3 데이터는,
    현재 시간을 포함하는 소정 범위 내의 시간대 또는 현재 위치를 포함하는 소정 범위 내의 장소에서 과거에 상기 사용자에 의해 발화되었던 음성을 분석함으로써 생성된 정보를 포함하는 것을 특징으로 하는 장치.
  20. 제11항에 있어서,
    상기 제4 데이터는,
    차량의 모델명 및 엔진 타입 중 적어도 하나에 대한 정보를 포함하는 차량 정보; 상기 차량의 속도, 기어 모드 및 주차 상태 중 적어도 하나에 대한 정보를 포함하는 운전 상태 정보; 상기 차량이 주행 중인 위치, 방향 및 도로명 중 적어도 하나에 대한 정보를 포함하는 위치 정보; 현재의 시각 및 날씨 중 적어도 하나에 대한 정보를 포함하는 상황 정보; 및 상기 차량에 구비되거나 연결된 장치에서 현재 실행되고 있는 적어도 하나의 애플리케이션에 대한 앱 정보; 중 적어도 하나를 포함하는 것을 특징으로 하는 장치.
KR1020180013489A 2018-02-02 2018-02-02 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치 KR102066451B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180013489A KR102066451B1 (ko) 2018-02-02 2018-02-02 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치
US15/903,397 US10741178B2 (en) 2018-02-02 2018-02-23 Method for providing vehicle AI service and device using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180013489A KR102066451B1 (ko) 2018-02-02 2018-02-02 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치

Publications (2)

Publication Number Publication Date
KR20190098868A KR20190098868A (ko) 2019-08-23
KR102066451B1 true KR102066451B1 (ko) 2020-01-15

Family

ID=67476096

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180013489A KR102066451B1 (ko) 2018-02-02 2018-02-02 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치

Country Status (2)

Country Link
US (1) US10741178B2 (ko)
KR (1) KR102066451B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110784384B (zh) * 2019-10-16 2021-11-02 杭州九阳小家电有限公司 一种家电语音技能的生成方法及智能家电
KR102389179B1 (ko) * 2020-04-14 2022-04-22 주식회사 오비고 차량 AVN 시스템의 상태 정보를 이용한 차량앱 제어 방법 및 이를 이용한 AI Service Agent
US11705111B2 (en) 2020-11-12 2023-07-18 Samsung Electronics Co., Ltd. Methods and systems for predicting non-default actions against unstructured utterances
US11798549B2 (en) * 2021-03-19 2023-10-24 Mitel Networks Corporation Generating action items during a conferencing session
CN113409785A (zh) * 2021-06-30 2021-09-17 中国第一汽车股份有限公司 基于车辆的语音交互方法、装置、车辆和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8423362B2 (en) * 2007-12-21 2013-04-16 General Motors Llc In-vehicle circumstantial speech recognition
MX2012011426A (es) * 2011-09-30 2013-04-01 Apple Inc Utilizar informacion de contexto para facilitar el procesamiento de comandos en un asistente virtual.
US9818400B2 (en) * 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests

Also Published As

Publication number Publication date
KR20190098868A (ko) 2019-08-23
US20190244607A1 (en) 2019-08-08
US10741178B2 (en) 2020-08-11

Similar Documents

Publication Publication Date Title
KR102066451B1 (ko) 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치
US11594215B2 (en) Contextual voice user interface
US11830485B2 (en) Multiple speech processing system with synthesized speech styles
US10917758B1 (en) Voice-based messaging
US20180182394A1 (en) Identification of taste attributes from an audio signal
US11538478B2 (en) Multiple virtual assistants
JP3955880B2 (ja) 音声認識装置
US11211058B1 (en) Disambiguation in automatic speech processing
US10224030B1 (en) Dynamic gazetteers for personalized entity recognition
KR20160010961A (ko) 컨텍스트 정보를 이용하는 음성 인식 방법 및 장치
US20230115420A1 (en) Multiple skills processing
US11579841B1 (en) Task resumption in a natural understanding system
US11715472B2 (en) Speech-processing system
US20240087562A1 (en) Interactive content output
US20240071385A1 (en) Speech-processing system
CN116368353A (zh) 内容感知导航指令
US11783824B1 (en) Cross-assistant command processing
JP6322125B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム
US11763809B1 (en) Access to multiple virtual assistants
US11735178B1 (en) Speech-processing system
US11626106B1 (en) Error attribution in natural language processing systems
KR20200095636A (ko) 대화 시스템이 구비된 차량 및 그 제어 방법
US11922938B1 (en) Access to multiple virtual assistants
US20240105171A1 (en) Data processing in a multi-assistant system
US11908463B1 (en) Multi-session context

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant