KR102066451B1

KR102066451B1 - 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치

Info

Publication number: KR102066451B1
Application number: KR1020180013489A
Authority: KR
Inventors: 조기현; 이정석
Original assignee: 주식회사 오비고
Priority date: 2018-02-02
Filing date: 2018-02-02
Publication date: 2020-01-15
Also published as: KR20190098868A; US20190244607A1; US10741178B2

Abstract

본 발명은, 차량용 AI 서비스를 제공하는 방법에 있어서, (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보(상기 스킬 후보는 서비스 카테고리를 포함함) 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및 (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 방법 및 이를 이용한 장치를 개시한다. 본 발명에 따르면, AI 서버에 의한 1차적인 음성 분석 데이터, 다른 사용자들의 음성을 분석한 실시간 트렌드 데이터, 사용자가 과거에 발화했던 음성을 분석한 사용자 히스토리 데이터, 및 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터 등을 분석함으로써 사용자의 의도를 정확하게 파악할 수 있고, 각각의 데이터에 포함된 복수의 의도 분석 결과 후보 및 결과 후보 각각의 적합도를 의미하는 매칭 점수를 소정의 알고리즘에 의해 분석함으로써 사용자가 요청한 요구 사항을 보다 정확하게 파악할 수 있다.

Description

차량용 AI 서비스를 제공하는 방법 및 이를 이용한 장치{METHOD FOR PROVIDING VEHICLE AI SERVICE AND DEVICE USING THE SAME}

본 발명은 차량용 AI 서비스를 제공하는 방법 및 이를 이용한 장치에 관한 것으로, 보다 상세하게는 (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보(상기 스킬 후보는 서비스 카테고리를 포함함) 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계 및 (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 방법 및 이를 이용한 장치에 관한 것이다.

종래의 차량에서 사용되는 AI(인공지능) 서비스는 사용자가 발화한 음성을 분석함으로써 사용자의 의도를 파악하고, 분석 결과에 따라 사용자의 요청 사항인 것으로 도출된 서비스를 제공한다. 여기서, 사용자의 음성이 명확한 경우에는 문제가 없지만, 사용자의 음성에 중복되는 의미가 존재하거나 사용자의 발음이 부정확한 경우에는 사용자의 요청 사항을 정확하게 파악하기 어려운 실정이다.

예를 들어, 사용자가 "OOO"라는 단어를 발화한 경우, 해당 단어와 매칭되는 장소도 존재하고 이와는 별개의 노래 곡명도 존재한다면, 실제 사용자가 요청한 것과는 다른 결과가 도출될 가능성이 있다. 다른 예로서, 사용자가 "가격 싼 주유소 찾기"라고 요청을 한 경우, 현재 사용자가 이용 중인 차량은 경유차인데, 휘발유 가격이 저렴한 주유소를 찾아주는 상황이 발생할 수 있다.

따라서, 본 발명자는 차량용 AI 서비스를 제공함에 있어서 사용자가 요청한 요구 사항을 보다 정확하게 파악하기 위하여 이와 같은 방법 및 장치를 개발하기에 이르렀다.

따라서, 본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.

또한, 본 발명은 AI 서버에 의한 1차적인 음성 분석 데이터, 다른 사용자들의 음성을 분석한 실시간 트렌드 데이터, 사용자가 과거에 발화했던 음성을 분석한 사용자 히스토리 데이터, 및 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터 등을 분석함으로써 사용자의 의도를 정확하게 파악하는 것을 다른 목적으로 한다.

또한, 본 발명은 각각의 데이터에 포함된 복수의 의도 분석 결과 및 결과 각각의 적합도를 의미하는 매칭 점수를 소정의 알고리즘에 의해 분석함으로써 사용자가 요청한 요구 사항을 보다 정확하게 파악하는 것을 또 다른 목적으로 한다.

상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.

본 발명의 일 태양에 따르면, 차량용 AI 서비스를 제공하는 방법에 있어서, (a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및 (b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 방법이 제공된다.

본 발명의 다른 태양에 따르면, 차량용 AI 서비스를 제공하는 장치에 있어서, 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;를 포함하되, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하는 것을 특징으로 하는 장치가 제공된다.

이 외에도, 본 발명을 구현하기 위한 다른 방법, 장치, 장치 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.

본 발명에 따르면, AI 서버에 의한 1차적인 음성 분석 데이터, 다른 사용자들의 음성을 분석한 실시간 트렌드 데이터, 사용자가 과거에 발화했던 음성을 분석한 사용자 히스토리 데이터, 및 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터 등을 분석함으로써 사용자의 의도를 정확하게 파악할 수 있다.

또한, 각각의 데이터에 포함된 복수의 의도 분석 결과 후보 및 결과 후보 각각의 적합도를 의미하는 매칭 점수를 소정의 알고리즘에 의해 분석함으로써 사용자가 요청한 요구 사항을 보다 정확하게 파악할 수 있다.

도 1은 본 발명의 일 실시예에 따른 차량용 AI 서비스를 제공하는 시스템의 구성도,
도 2는 본 발명의 일 실시예에 따른 데이터 각각의 가중치와, 스킬 후보 및 명령어 후보 각각의 매칭 점수에 따라 사용자의 의도를 분석하는 방법을 설명하기 위한 예시도,
도 3a 및 도 3b는 본 발명의 일 실시예에 따라 매칭도를 산출하는 방법을 설명하기 위한 예시도.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다.

또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.

이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 차량용 AI 서비스를 제공하는 시스템(1000)의 구성도를 도시하고 있다.

도 1을 참조하면, 본 발명에 따른 시스템(1000)은 AI 서비스 제공 장치(100), AI 서버(200) 및 트렌드 분석 서버(300) 등을 포함할 수 있다. 여기서, 도 1에는 AI 서비스 제공 장치(100)가 차량의 AVN System에 포함되어 외부의 AI 서버(200) 및 트렌드 분석 서버(300) 등과 신호를 주고받는 것으로 도시되었으나, 이는 이해를 돕기 위한 하나의 예시일 뿐, AI 서버(200) 및 트렌드 분석 서버(300)가 AI 서비스 제공 장치(100)에 포함되는 형태이거나, AI 서비스 제공 장치(100)가 AVN System에 포함되지 않고 태블릿이나 스마트폰 등의 독립적인 형태로서 차량에 연결되어 AI 서비스를 제공하도록 구현될 수도 있을 것이다.

먼저, AI 서비스 제공 장치(100)는 프로세서(10) 및 통신부(20)를 포함할 수 있다. 여기서, AI 서비스 제공 장치(100)는 AI 서버 I/F(30), 음성 분석 데이터 수신부(40), 실시간 트렌드 데이터 수신부(50), 사용자 히스토리 데이터(60), 상황 인지부(70), 의도 분석 결정부(80), 서비스 제어부(90) 등을 더 포함할 수 있으나 필수적인 것은 아니며, 이들은 프로세서(10) 및 통신부(20)에 포함되는 형태이거나, 프로세서(10) 및 통신부(20)와 신호를 주고 받으며 프로세서(10)의 관장에 의해 장치를 제어하는 형태일 수도 있을 것이다.

구체적으로, AI 서비스 제공 장치(100)는, 차량 또는 장치(100)에 연결된 소정의 음성 입력부(미도시)를 통해 사용자의 음성이 입력되면, 통신부(20)를 통해 입력된 음성을 AI 서버(200)로 전송하고, AI 서버(200)에 의해 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 생성된 음성 분석 데이터를 전송받을 수 있을 것이다. 여기서, AI 서비스 제공 장치(100) 및 AI 서버(200) 간의 통신은 통신부(20)를 통해 이루어질 수 있으며 AI 서버 I/F(30) 및 음성 분석 데이터 수신부(40)와 연동될 수도 있을 것이다.

한편, AI 서버(200)는 음성 인식(STT; Speech-to-Text), 자연어 처리(NLP; Natural Language Processing), 음성 합성(TTS; Text-to- Speech) 등의 기능을 수행할 수 있다. 이를 통해 AI 서버(200)는 사용자의 음성 언어를 해석하여 문자 데이터로 전환하고, 형태소 분석, 구문 분석, 화행 분석 및 대화 처리 등을 통해 사용자가 음성을 발화한 의도 및 음성의 의미를 1차적으로 분석하며, 분석된 결과를 토대로 복수의 스킬 후보 및 명령어 후보를 추출하여 AI 서비스 제공 장치(100)로 전송할 수 있을 것이다.

즉, 종래의 AI 서비스에서는 AI 서버(200)가 최종 의도 분석이 완료된 결과 1개만을 차량 또는 차량에 연결된 장치로 전송하는 것과 대비하여, 본 발명에 따른 일 실시예에서는, AI 서버(200)에 의해 1차적으로 브로드하게 해석된 음성 분석 데이터(복수의 스킬 후보 및 명령어 후보를 포함함)를 전송받아, 이를 바탕으로 AI 서비스 제공 장치(100)가 조금 더 정밀하게 2차 의도 분석을 수행할 수 있다.

여기서, AI 서버(200)에 의해 추출되는 스킬 후보는 차량 또는 장치(100)에서 실행 가능한 도메인이나 앱, 컨텐츠 등의 서비스 카테고리를 포함할 수 있는데, 예시적으로, 날씨, 음악, 시간, 뉴스, 라디오, 내비게이션, 장소, 주식, 인물, 전화 등이 스킬 후보로 추출될 수 있으나, 이에 한정되는 것은 아니다.

또한, 명령어 후보는 차량 또는 장치(100)에서 수행 가능한 커맨드 등을 포함할 수 있는데, 가령, 스킬 후보들을 실행시킬 수 있는 "들려줘", "찾아줘(검색)" 및 "재생"과 같은 다양한 방법에 대한 커맨드나, "잠금"과 같은 제어 방법에 대한 커맨드가 명령어 후보로 추출될 수 있을 것이나, 이 또한 한정되는 것은 아니다.

다음으로, AI 서비스 제공 장치(100)의 프로세서(10)는, AI 서버(200)로부터 전송받은 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 사용자가 음성을 발화한 의도를 파악하고, 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정할 수 있을 것이다.

여기서, 제1 데이터(음성 분석 데이터), 제2 데이터(실시간 트렌드 데이터), 제3 데이터(사용자 히스토리 데이터) 및 제4 데이터(상황 데이터)는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함할 수 있는데, 구체적인 스킬 후보 및 명령어 후보에 대한 설명은 음성 분석 데이터와 관련하여 전술한 내용과 중복되므로 설명을 생략한다.

한편, 제2 데이터(실시간 트렌드 데이터)는 트렌드 분석 서버(300)에 의해 최근에 다른 사용자들이 많이 사용하는 것으로 분석된 AI 서비스 문구, 스킬 후보 및 명령어 후보 등을 포함할 수 있는데, 예시적으로, 최근 관심이 집중되고 있는 뉴스 주제, 스포츠 경기, 사건 사고 및 자연 재해 등과 같은 최근 이슈에 대한 키워드가 반영될 수 있을 것이다.

또한, 나이, 성별, 직업 등 사용자의 인적 정보와 유사한 인적 정보를 가진 타 사용자들의 실시간 트렌드 데이터를 파악함으로써, 프로세서(10)는 사용자가 음성을 발화한 의도를 더욱 정확하게 파악할 수 있을 것이다. 여기서, 트렌드 분석 서버(300) 및 프로세서(10) 간의 통신은 실시간 트렌드 데이터 수신부(50) 또는 통신부(20)를 통해 이루어질 수 있을 것이다.

다음으로, 제3 데이터(사용자 히스토리 데이터)(60)는 현재 시간을 포함하는 소정 범위 내의 시간대, 현재 위치를 포함하는 소정 범위 내의 장소, 현재 같이 있는 인물, 현재 바라보고 있는 사물 등 현재와 유사한 조건 하에서 과거에 사용자에 의해 발화되었던 음성을 분석함으로써 생성된 정보를 포함할 수 있는데, 사용자가 발화한 음성 및 의도를 분석한 기록이 데이터베이스 형태로 누적되어 관리될 수 있을 것이다.

이와 같은 제3 데이터(사용자 히스토리 데이터)를 이용함으로써, 가령, 동 시간대에 사용자가 라디오의 특정 주파수 실행을 많이 요청한 것으로 분석되는 경우, 프로세서(10)는 사용자가 "라디오"라는 단어만 발화하여도 라디오의 특정 주파수를 실행시키도록 제어할 수 있을 것이다.

다른 예로서, 사용자가 "아메리카노"라는 단어를 발화한 경우, 사용자의 음악 재생 리스트에 "아메리카노"라는 곡 명이 존재하더라도, 동 시간대에 사용자가 현재 위치 주변의 POI(Point of Interest)로 분석되는 특정 카페를 자주 방문한 것으로 분석된다면, 프로세서(10)는 해당 카페를 목적지로 설정하여 내비게이션이 실행되도록 제어할 수 있을 것이다.

다음으로, 제4 데이터(상황 데이터)는 (i) 차량의 모델명 및 엔진 타입(가령, 휘발유, 경유, LPG, 전기를 이용하는 지에 대한 정보) 중 적어도 하나에 대한 정보를 포함하는 차량 정보, (ii) 차량의 속도, 기어 모드 및 주차 상태 중 적어도 하나에 대한 정보를 포함하는 운전 상태 정보, (iii) 차량이 주행 중인 위치, 방향 및 도로명 중 적어도 하나에 대한 정보를 포함하는 위치 정보, (iv) 현재의 시각 및 날씨 중 적어도 하나에 대한 정보를 포함하는 상황 정보, 및 (v) 차량에 구비되거나 연결된 장치에서 현재 실행되고 있는 적어도 하나의 애플리케이션에 대한 앱 정보 중 적어도 하나를 포함할 수 있다.

이와 같은 제4 데이터(상황 데이터)를 이용함으로써, 가령, 사용자가 "가격 싼 주유소 찾기"라고 요청을 했을 때, 현재 사용자가 이용 중인 차량이 LPG 차인 경우, 프로세서(10)는 현재 위치 주변에서 가장 저렴한 LPG 충전소를 목적지로 설정하여 내비게이션이 실행되도록 제어할 수 있을 것이다.

여기서, 상황 인지부(70) 또는 프로세서(10)가 차량 또는 장치(100)의 OS(400)를 기반으로 현재 차량의 운전 상태, 현재 사용자가 취하고 있는 동작 등에 대한 다양한 정보들을 취합하여 제4 데이터(상황 데이터)를 생성 및 관리할 수 있을 것이다.

이처럼, 제1 데이터(음성 분석 데이터), 제2 데이터(실시간 트렌드 데이터), 제3 데이터(사용자 히스토리 데이터) 및 제4 데이터(상황 데이터)의 분석을 통해, 프로세서(10) 또는 의도 분석 결정부(80)가 사용자의 의도를 파악하고, 복수의 스킬 후보 및 복수의 명령어 후보 중에서 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하여, 서비스 제어부(90)로 하여금 차량 또는 장치(100)의 Service Apps(600)을 제어하도록 지원함으로써, Content Provider(700)를 통해 사용자의 요청 Contents가 제공될 수 있을 것이다.

다음으로, 도 2, 도 3a 및 도 3b를 참조로 하여 본 발명의 일 실시예에 따른 데이터 각각의 가중치와, 스킬 후보 및 명령어 후보 각각의 매칭 점수에 따라 사용자의 의도를 분석하는 방법 및 매칭도를 산출하는 방법을 설명하도록 한다.

여기서, 가중치는, 사용자가 음성을 발화한 의도를 분석함에 있어서 각각의 데이터가 갖는 비중을 의미하며, 각각의 가중치 값은 최초에는 실험을 통해 결정될 수 있지만, 의도 분석에 대한 경험치가 쌓일 수록 분석 결과의 정확도를 높이기 위한 방향으로 조정될 수 있을 것이다.

먼저, 제1 데이터(음성 분석 데이터), 제2 데이터(실시간 트렌드 데이터), 제3 데이터(사용자 히스토리 데이터) 및 제4 데이터(상황 데이터) 중 적어도 일부를 제m 데이터(210)라고 하고, 제m 데이터에 포함되는 스킬 후보를 제m-k 스킬 후보(240), 제m 데이터에 포함되는 명령어 후보를 제m-n 명령어 후보(240)라고 상정할 때, 제m 데이터(210)는, 각각의 제m-k 스킬 후보(240)마다 사용자가 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수(260)에 대한 정보, 각각의 제m-n 명령어 후보(240)마다 사용자가 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수(260)에 대한 정보를 더 포함할 수 있다. 여기서, k, n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화될 수 있는 자연수를 의미한다.

예시적으로, 도 2를 참조하면, 제1 데이터(음성 분석 데이터)의 스킬 후보(240)는 제1-1 스킬 후보(날씨) 및 제1-2 스킬 후보(음악)며, 이들의 스킬 점수(260) 값은 각각 0.80, 0.10으로 관리되고 있다.

본 발명에 따른 일 실시예로서, 제1 데이터(음성 분석 데이터)에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우, 프로세서(10)는, 특정 명령어 후보를 최종 명령어로 결정하고, 특정 명령어 후보에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정할 수 있을 것이다.

즉, 도 2를 참조로 하면, 제1-1 스킬 후보(날씨)의 점수 값 0.80, 제1-2 스킬 후보(음악)의 점수 값 0.10, 제1-1 명령어 후보(들려줘)의 점수 값 0.90 및 제1-2 명령어 후보(틀어줘)의 점수 값 0.05 중에서, 가장 높은 수치에 대응되는 후보가 제1-1 명령어 후보(들려줘)인 경우 프로세서(10)는 "들려줘"를 최종 명령어로 결정할 수 있다.

여기서, 도 3a를 참조하면, 최종 명령어로 결정된 특정 명령어 후보에 대응되는 명령을 실행 가능한 특정 스킬 후보(310a)를 제a 특정 스킬 후보(a는 1부터 특정 스킬 후보의 개수까지 변화되는 자연수임)라고 상정할 때, 프로세서(10)는, 각각의 제m 데이터에 대한 가중치인 제m 가중치(220)를 참조로 하여, 제a 특정 스킬 후보(310a) 각각에 대하여, 사용자가 음성을 발화한 의도에 매칭되는 제a 매칭도(330a)를 산출할 수 있을 것이다.

구체적으로, 제a 매칭도(330a)는, 제m 가중치(220) 및 제a 특정 스킬 후보(310a)에 대응되는 제m 데이터 각각의 스킬 점수(260)의 곱의 합계로 이루어지며, 프로세서(10)는 각각의 제a 매칭도(330a) 중에서 가장 높은 수치에 대응되는 특정 스킬 후보를 최종 스킬로 결정할 수 있다.

즉, 도 3a를 참조하면, 최종 명령어가 "들려줘"이고 "들려줘"에 대응되는 명령을 실행 가능한 특정 스킬 후보(310a)가 제1 특정 스킬 후보(날씨), 제2 특정 스킬 후보(음악) 및 제3 특정 스킬 후보(뉴스)일 경우, 각각의 특정 스킬 후보(310a)에 대하여 매칭도 값(350a)을 산출할 수 있다.

제1 특정 스킬 후보(날씨)의 경우, 도 2를 참조하면, "날씨"가 제1 데이터 및 제3 데이터의 스킬 후보로서 존재하는 것을 확인할 수 있다. 여기서, 제1 데이터의 가중치 5 및 제1-1 스킬 후보의 점수 0.80의 곱인 4.00과, 제3 데이터의 가중치 2 및 제3-1 스킬 후보의 점수 0.20의 곱인 0.40의 합계로 제1 매칭도 값이 결정된다.

이와 같은 방식으로 제2 특정 스킬 후보(음악) 및 제3 특정 스킬 후보(뉴스) 각각의 매칭도 값을 산출하면, 제2 매칭도의 값은 0.80, 제3 매칭도의 값은 0.50이 되며, 제1 매칭도, 제2 매칭도 및 제3 매칭도 중 가장 큰 값인 4.40에 대응되는 제1 특정 스킬 후보(날씨)가 최종 스킬로 결정될 수 있다.

한편, 제1 데이터(음성 분석 데이터)에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우, 프로세서(10)는, 특정 스킬 후보를 최종 스킬로 결정하고, 특정 스킬 후보에 대응되는 스킬을 수행 가능한 명령어 후보 중에서 최종 명령어를 결정할 수 있을 것이다.

여기서, 도 3b를 참조하면, 특정 스킬 후보에 대응되는 스킬을 수행 가능한 특정 명령어 후보(310b)를 제a 특정 명령어 후보(a는 1부터 특정 명령어 후보의 개수까지 변화되는 자연수임)라고 상정할 때, 프로세서(10)는, 각각의 제m 데이터(210)에 대한 가중치인 제m 가중치(220)를 참조로 하여, 제a 특정 명령어 후보(310b) 각각에 대하여, 사용자가 음성을 발화한 의도에 매칭되는 제a 매칭도(330b)를 산출하되, 제a 매칭도 값(350b)은, 제m 가중치(220) 및 제a 특정 명령어 후보(310b)에 대응되는 제m 데이터 각각의 명령어 점수(260)의 곱의 합계로 이루어지며, 각각의 제a 매칭도 값(350b) 중에서 가장 높은 수치에 대응되는 특정 명령어 후보를 최종 명령어로 결정할 수 있을 것이다.

한편, 본 발명의 다른 일 실시예로서, 각각의 제m-k 스킬 점수 및 제m 가중치의 곱(270), 각각의 제m-n 명령어 점수 및 제m 가중치의 곱(270) 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우, 프로세서(10)는, 특정 명령어 후보를 최종 명령어로 결정하고, 특정 명령어 후보에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정할 수 있을 것이다.

또한, 각각의 제m-k 스킬 점수 및 제m 가중치의 곱(270), 각각의 제m-n 명령어 점수 및 제m 가중치의 곱(270) 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우, 프로세서(10)는, 특정 스킬 후보를 최종 스킬로 결정하고, 특정 스킬 후보에 대응되는 스킬을 수행 가능한 명령어 후보 중에서 최종 명령어를 결정할 수 있을 것이다.

예시적으로, 도 2를 참조하면, 가중치x점수(270) 값 중에서 제1 데이터의 명령어 후보인 제1-1 명령어 후보(들려줘)의 가중치x점수 값이 가장 큰 것을 확인할 수 있다. 이 경우, "들려줘"를 최종 명령어로 결정하고, "들려줘"에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정할 수 있을 것이다.

본 발명의 또 다른 일 실시예로서, 프로세서(10)는, 각각의 제m-k 스킬 점수(260) 및 제m-n 명령어 점수(260) 중에서 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우, 특정 명령어 후보를 최종 명령어로 결정하고 특정 명령어 후보에 대응되는 명령을 실행 가능한 스킬 후보 중에서 최종 스킬을 결정하며, 각각의 제m-k 스킬 점수(260 및 제m-n 명령어 점수(260) 중에서 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우, 특정 스킬 후보를 최종 스킬로 결정하고 특정 스킬 후보에 대응되는 스킬을 수행 가능한 명령어 후보 중에서 최종 명령어를 결정하는 경우를 상정할 수 있을 것이다.

예시적으로, 도 2를 참조하면, 제m-k 스킬 점수(260) 및 제m-n 명령어 점수(260) 중에서 제4 데이터의 제4-2 스킬 후보(내비게이션)의 점수가 0.95로 가장 높은 것을 확인할 수 있으며, 이 때, 프로세서(10)는 "내비게이션"을 최종 스킬로 결정할 수 있을 것이다.

여기서, 도 3b를 참조하면, "내비게이션"이라는 스킬을 수행 가능한 명령어 후보(310b)가 제1 특정 명령어 후보(틀어줘) 및 제2 특정 명령어 후보(안내)일 경우, 각각의 특정 명령어 후보(310b)에 대하여 매칭도 값(350b)을 산출할 수 있다.

제1 특정 명령어 후보(틀어줘)의 경우, 도 2를 참조하면, "틀어줘"가 제1 데이터 및 제4 데이터의 명령어 후보로서 존재하는 것을 확인할 수 있다. 여기서, 제1 데이터의 가중치 5 및 제1-2 명령어 후보의 점수 0.05의 곱인 0.25와, 제4 데이터의 가중치 2 및 제4-2 명령어 후보의 점수 0.40의 곱인 0.80의 합계로 제1 매칭도 값이 결정된다.

이와 같은 방식으로, 제2 특정 명령어 후보(안내)의 매칭도 값을 산출하면, 제2 매칭도의 값은 1.30으로, 제1 매칭도의 값인 1.05보다 큰 수치를 가지므로, 제2 특정 명령어 후보(안내)가 최종 명령어로 결정될 수 있을 것이다.

한편, 본 발명의 일 실시예에 따른 차량용 AI 서비스를 제공하는 시스템(1000)은, PnP 모듈(500)을 더 포함할 수 있는데, PnP 모듈(500)은 플러그앤 플레이 방식으로 현재 시스템(1000)에 연결된 하드웨어 및 소프트웨어의 가용 여부를 전달하는 기능을 수행할 수 있다. 이를 통해 하드웨어뿐만 아니라 해당 하드웨어에서 제공하는 서비스와 소프트웨어 프레임워크에서 전달하는 어플리케이션의 서비스도 등록할 수 있다.

구체적으로, AI 서비스 제공 장치(100)나 이에 연결된 차량 또는 소정의 장치에 새로운 앱이 설치되면, PnP 모듈(500)을 통해 새로운 앱이 제공하는 AI 서비스가 퍼블리시되고, 해당 AI 서비스와 관련된 스킬 및 명령어가 등록될 수 있을 것이다.

여기서, 현재 AI 서비스 제공 장치(100)에 새로운 앱이 제공하는 스킬 및 명령어에 대한 정보가 존재하지 않으면, PnP 모듈(500) 또는 프로세서(10)가 해당 스킬 및 명령어에 대한 정보를 외부의 서버로부터 다운로드 받을 수 있을 것이다.

즉, 종래의 AI 서비스 기술은 앱 기반이 아니라 AI 서비스를 제공하는 플랫폼이 허용하는 범위 내에서 한정적으로 수행되는 서비스 기반의 방식이지만, 본 발명에 따르면, PnP 모듈(500)이 앱의 추가/삭제 및 업데이트에 따라 AI 서비스의 추가/삭제가 동적으로 이루어질 수 있도록 지원함으로써, AI 서비스의 확장 및 서비스 간의 매쉬업(mash-up)이 가능하다.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

1000 : 시스템 100 : AI 서비스 제공 장치
200 : AI 서버 300 : 트렌드 분석 서버
400 : OS 500 : PnP 모듈
600 : Service Apps 700 : Content Provider
10 : 프로세서 20 : 통신부
30 : AI 서버 I/F 40 : 음성 분석 데이터 수신부
50 : 실시간 트렌드 데이터 수신부 60 : 사용자 히스토리 데이터
70 : 상황 인지부 80 : 의도 분석 결정부
90 : 서비스 제어부

Claims

차량용 AI 서비스를 제공하는 방법에 있어서,
(a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
(b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
상기 (b) 단계에서,
상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
상기 AI 서비스 제공 장치는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하고,
상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 특정 스킬 후보를 제a 특정 스킬 후보(a는 1부터 상기 특정 스킬 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
상기 AI 서비스 제공 장치는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 스킬 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하되,
상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 스킬 후보에 대응되는 상기 제m 데이터 각각의 스킬 점수의 곱의 합계로 이루어지며,
각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 스킬 후보를 상기 최종 스킬로 결정하는 것을 특징으로 하는 방법.
삭제
삭제
삭제
삭제
차량용 AI 서비스를 제공하는 방법에 있어서,
(a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
(b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
상기 (b) 단계에서,
상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
상기 AI 서비스 제공 장치는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하고,
상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 특정 명령어 후보를 제a 특정 명령어 후보(a는 1부터 상기 특정 명령어 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
상기 AI 서비스 제공 장치는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 명령어 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하되,
상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 명령어 후보에 대응되는 상기 제m 데이터 각각의 명령어 점수의 곱의 합계로 이루어지며,
각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 명령어 후보를 상기 최종 명령어로 결정하는 것을 특징으로 하는 방법.
차량용 AI 서비스를 제공하는 방법에 있어서,
(a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
(b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
상기 (b) 단계에서,
각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
상기 AI 서비스 제공 장치는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하는 것을 특징으로 하는 방법.
차량용 AI 서비스를 제공하는 방법에 있어서,
(a) 음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, AI 서비스 제공 장치는, AI 서버로 하여금 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보를 추출하여 음성 분석 데이터를 생성하도록 지원하고, 상기 생성된 음성 분석 데이터를 수신하는 단계; 및
(b) 상기 AI 서비스 제공 장치가, 상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 (a) 단계에서 상기 사용자가 상기 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 단계;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
상기 (b) 단계에서,
각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
상기 AI 서비스 제공 장치는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 제3 데이터는,
현재 시간을 포함하는 소정 범위 내의 시간대 또는 현재 위치를 포함하는 소정 범위 내의 장소에서 과거에 상기 사용자에 의해 발화되었던 음성을 분석함으로써 생성된 정보를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 제4 데이터는,
차량의 모델명 및 엔진 타입 중 적어도 하나에 대한 정보를 포함하는 차량 정보; 상기 차량의 속도, 기어 모드 및 주차 상태 중 적어도 하나에 대한 정보를 포함하는 운전 상태 정보; 상기 차량이 주행 중인 위치, 방향 및 도로명 중 적어도 하나에 대한 정보를 포함하는 위치 정보; 현재의 시각 및 날씨 중 적어도 하나에 대한 정보를 포함하는 상황 정보; 및 상기 차량에 구비되거나 연결된 장치에서 현재 실행되고 있는 적어도 하나의 애플리케이션에 대한 앱 정보; 중 적어도 하나를 포함하는 것을 특징으로 하는 방법.
차량용 AI 서비스를 제공하는 장치에 있어서,
음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
상기 프로세서는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하는 프로세스를 수행하고,
상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 특정 스킬 후보를 제a 특정 스킬 후보(a는 1부터 상기 특정 스킬 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
상기 프로세서는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 스킬 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하는 프로세스를 수행하되,
상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 스킬 후보에 대응되는 상기 제m 데이터 각각의 스킬 점수의 곱의 합계로 이루어지며,
각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 스킬 후보를 상기 최종 스킬로 결정하는 것을 특징으로 하는 장치.
삭제
삭제
삭제
삭제
차량용 AI 서비스를 제공하는 장치에 있어서,
음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
상기 제1 데이터에 포함된 각각의 제1-k 스킬 점수 및 각각의 제1-n 명령어 점수 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
상기 프로세서는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하는 프로세스를 수행하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하는 프로세스를 수행하고,
상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 특정 명령어 후보를 제a 특정 명령어 후보(a는 1부터 상기 특정 명령어 후보의 개수까지 변화되는 자연수임)라고 상정할 때,
상기 프로세서는, 각각의 상기 제m 데이터에 대한 가중치인 제m 가중치를 참조로 하여, 상기 제a 특정 명령어 후보 각각에 대하여, 상기 사용자가 상기 음성을 발화한 의도에 매칭되는 제a 매칭도를 산출하는 프로세스를 수행하되,
상기 제a 매칭도는, 상기 제m 가중치 및 상기 제a 특정 명령어 후보에 대응되는 상기 제m 데이터 각각의 명령어 점수의 곱의 합계로 이루어지며,
각각의 상기 제a 매칭도 중에서 가장 높은 수치에 대응되는 특정 명령어 후보를 상기 최종 명령어로 결정하는 것을 특징으로 하는 장치.
차량용 AI 서비스를 제공하는 장치에 있어서,
음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 명령어 후보인 경우,
상기 프로세서는, 상기 특정 명령어 후보를 상기 최종 명령어로 결정하는 프로세스를 수행하고, 상기 특정 명령어 후보에 대응되는 명령을 실행 가능한 상기 스킬 후보 중에서 상기 최종 스킬을 결정하는 프로세스를 수행하는 것을 특징으로 하는 장치.
차량용 AI 서비스를 제공하는 장치에 있어서,
음성 입력부를 통해 사용자에 의해 발화된 음성이 입력되면, 상기 입력된 음성을 AI 서버로 전송하고, 상기 AI 서버에 의해 상기 입력된 음성으로부터 적어도 하나 이상의 스킬 후보 - 상기 스킬 후보는 서비스 카테고리를 포함함 - 및 적어도 하나 이상의 명령어 후보가 추출되어 음성 분석 데이터가 생성되면, 상기 생성된 음성 분석 데이터를 전송받는 통신부; 및
상기 AI 서버로부터 전송받은 상기 음성 분석 데이터인 제1 데이터, 다른 사용자들에 의해 소정 기간 내에 발화되었던 음성을 분석함으로써 생성된 실시간 트렌드 데이터인 제2 데이터, 상기 사용자에 의해 과거에 발화되었던 음성을 분석함으로써 생성된 사용자 히스토리 데이터인 제3 데이터, 및 현재 상기 사용자의 주변 상황에 대한 정보를 포함하는 상황 데이터인 제4 데이터 중 적어도 하나 이상의 데이터를 분석함으로써, 상기 사용자가 상기 입력된 음성을 발화한 의도를 파악하고, 상기 의도에 매칭되는 최종 스킬 및 최종 명령어를 결정하는 프로세서;
를 포함하되,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터는 각각 적어도 하나 이상의 스킬 후보 및 적어도 하나 이상의 명령어 후보에 대한 정보를 포함하고,
제m 데이터 - 상기 제m 데이터는, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 및 상기 제4 데이터 중 적어도 일부임 - 에 포함되는 상기 스킬 후보를 제m-k 스킬 후보, 상기 제m 데이터에 포함되는 상기 명령어 후보를 제m-n 명령어 후보라고 상정할 때 - 상기 k, 상기 n 은, 각각 1부터 스킬 후보의 개수, 명령어 후보의 개수까지 변화되는 자연수임 -,
상기 제m 데이터는, 각각의 상기 제m-k 스킬 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-k 스킬 점수에 대한 정보, 각각의 상기 제m-n 명령어 후보마다 상기 사용자가 상기 음성을 발화한 의도로 분석되는 정도를 의미하는 점수인 제m-n 명령어 점수에 대한 정보를 더 포함하고,
각각의 상기 제m 데이터에 대한 가중치를 제m 가중치라고 할 때,
각각의 상기 제m-k 스킬 점수 및 상기 제m 가중치의 곱, 각각의 상기 제m-n 명령어 점수 및 상기 제m 가중치의 곱 중에서, 가장 높은 수치에 대응되는 후보가 특정 스킬 후보인 경우,
상기 프로세서는, 상기 특정 스킬 후보를 상기 최종 스킬로 결정하는 프로세스를 수행하고, 상기 특정 스킬 후보에 대응되는 스킬을 수행 가능한 상기 명령어 후보 중에서 상기 최종 명령어를 결정하는 프로세스를 수행하는 것을 특징으로 하는 장치.
제11항에 있어서,
상기 제3 데이터는,
현재 시간을 포함하는 소정 범위 내의 시간대 또는 현재 위치를 포함하는 소정 범위 내의 장소에서 과거에 상기 사용자에 의해 발화되었던 음성을 분석함으로써 생성된 정보를 포함하는 것을 특징으로 하는 장치.
제11항에 있어서,
상기 제4 데이터는,
차량의 모델명 및 엔진 타입 중 적어도 하나에 대한 정보를 포함하는 차량 정보; 상기 차량의 속도, 기어 모드 및 주차 상태 중 적어도 하나에 대한 정보를 포함하는 운전 상태 정보; 상기 차량이 주행 중인 위치, 방향 및 도로명 중 적어도 하나에 대한 정보를 포함하는 위치 정보; 현재의 시각 및 날씨 중 적어도 하나에 대한 정보를 포함하는 상황 정보; 및 상기 차량에 구비되거나 연결된 장치에서 현재 실행되고 있는 적어도 하나의 애플리케이션에 대한 앱 정보; 중 적어도 하나를 포함하는 것을 특징으로 하는 장치.