KR101963915B1

KR101963915B1 - 강화된 대화 이해 아키텍처

Info

Publication number: KR101963915B1
Application number: KR1020137025586A
Authority: KR
Inventors: 래리 폴 헤크; 마두수단 친사쿤타; 데이비드 미트비; 리자 스티펠만
Original assignee: 마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority date: 2011-03-31
Filing date: 2012-03-27
Publication date: 2019-03-29
Also published as: WO2012135783A2; CN102737101A; JP6305588B2; WO2012135229A2; WO2012135157A2; JP6087899B2; WO2012135210A3; WO2012135226A1; EP2691949A4; WO2012135210A2; WO2012135791A3; KR20140025362A; EP2691870A2; EP2691885A4; WO2012135218A3; CN102737104A; CN102750270A; EP2691875A2; KR101922744B1; CN102737104B

Abstract

강화된 대화 이해 아키텍처가 주어진다. 사용자로부터 자연어 구절을 수신하면, 상기 구절은 검색 구절(search phrase)로 번역될 수 있고 그러한 검색 구절에 기초하여 검색 동작이 수행될 수 있다.

Description

강화된 대화 이해 아키텍처{AUGMENTED CONVERSATIONAL UNDERSTANDING ARCHITECTURE}

강화된 대화 이해 아키텍처는 사용자 쿼리 및 대화에 대한 자연어 이해를 용이하게하는 메카니즘을 제공한다.

특정 경우에 있어서, 개인 보조 프로그램들 및/또는 검색 엔진들은 특별한 포매팅(formatting) 및 신택스(syntax)를 종종 요구한다. 예를 들어, "나는 대략 7시에 'Inception'을 보러가길 원한다"라는 사용자 쿼리는 대화 시스템에 주어졌을 경우 상기 사용자의 참 의도를 이해하는데 있어서 효과적이지 않을 수 있다. 그러한 시스템들은 일반적으로 상기 사용자가 영화를 조회하고 대략 7시에 그 영화를 상영하는 지역 영화관들을 알려주는 결과를 원한다는 맥락을 도출하지 못할 수 있다.

본 요약은 아래 상세한 설명에서 더 설명되는 개념들 중 선택된 것을 단순화된 형태로 소개하기 위해 제공된다. 본 요약은 청구된 내용의 중요한 특징들 또는 본질적인 특징들을 식별하기 위해 의도된 것이 아니다. 그것은 청구된 내용의 범위를 제한하기 위해 이용되도록 의도되어 있지도 않다.

전술한 일반적인 설명 및 다음의 상세한 설명은 예시들을 제공하고 단지 설명적인 것이다. 따라서, 전술한 일반적인 설명 및 다음의 상세한 설명은 제한적인 것으로 간주되어서는 안된다. 또한, 여기에 설명된 것들에 더하여 특징들 또는 변형들이 제공될 수 있다. 예컨대, 실시예들은 상세한 설명에서 설명된 다양한 특징 조합들 및 서브 조합들에 관련될 수 있다.

본 명세서에 포함되고 그 일부를 구성하는 첨부 도면들은 본 발명의 다양한 실시예들을 예시한다.
도 1은 동작 환경의 블록도이다.
도 2(a) 내지 2(b)는 강화된 대화 이해 아키텍처를 제공하는 인터페이스를 도시하는 블록도이다.
도 3은 강화된 대화 이해 아키텍처의 피드백을 제공하는 인터페이스를 도시하는 불록도이다.
도 4는 강화된 대화 이해 아키텍처를 제공하는 방법에 관한 플로우차트이다.
도 5는 컴퓨팅 장치를 포함하는 시스템의 블록도이다.

다음의 상세한 설명은 첨부 도면들을 참고한다. 가능한 한, 도면들 및 다음의 설명에서 동일한 참조 번호들은 동일 또는 유사한 엘리먼트들을 지시하기 위해 사용된다. 본 발명의 실시예들이 설명될 수 있지만, 변형들, 수정들 및 다른 구현들이 가능하다. 예를 들어, 도면들에 예시된 엘리먼트들에 대해 대체, 추가 또는 변경이 이루어질 수 있고, 여기에 설명된 방법들은 개시된 방법들에 대해 단계들을 대체하거나, 순서를 변경(reordering)하거나 또는 추가하는 것에 의해 변경될 수 있다. 따라서, 다음의 상세한 설명은 본 발명을 제한하지 않는다. 대신에, 본 발명의 적당한 범위는 첨부된 청구항들에 의해 규정된다.

강화된 대화 이해 아키텍처가 사용자 쿼리들 및 대화들의 자연어 이해를 용이하게끔 할 수 있다. 이러한 아키텍처는 쿼리의 맥락을 결정하고 사용자 의도를 추론하는 것을 참작할 수 있다. 이러한 아키텍처는 자연어 쿼리의 단어들을 사용하여 대화의 맥락을 결정하고, 사용자 의도를 추정하며, 접적한 검색 에이전트(search agent)를 이용하여 적절한 추가 쿼리를 형성할 수 있다.

구어 대화 시스템(spoken dialog systems; SDS)은 사람들로 하여금 그들의 음성을 통해 컴퓨터와 상호작용할 수 있게 한다. 이러한 SDS를 작동시키는 주요 컴포넌트는 사용자와의 다이얼로그 기반 대화를 관리하는 다이얼로그 매너저를 포함할 수 있다. 이러한 다이얼로그 매니저는 음성 인식, 자연어 이해 컴포넌트 출력(natural language understanding component outputs), 이전 다이얼로그 순번으로부터의 컨텍스트, 사용자 컨텍스트 및/또는 지식 베이스(예컨대, 검색 엔진)로부터의 결과들과 같은 다수의 입력 소스들의 조합을 통해 사용자 의도를 결정할 수 있다. 의도를 결정한 뒤, 상기 다이얼로그 매니저는 최종 결과물을 사용자에게 디스플레이하거나 및/또는 그들의 의도를 만족시키기 위해 사용자와 대화를 계속하는 것과 같은 동작을 취할 수 있다.

도 1은 서버(105)를 포함하는 동작 환경(100)에 대한 블록도이다. 서버(105)는 다이얼로그 매니저(111)를 포함하는 SDS(110), 개인 보조 프로그램(112), 컨텍스트 데이터베이스(116) 및/또는 검색 에이전트(118)와 같은 각종 소프트웨어 모듈들 및/또는 컴퓨팅 자원들을 포함할 수 있다. SDS(110)는 네트워크(120)를 통해 사용자들로부터 쿼리 및/또는 동작 요청을 수신할 수 있다. 이러한 쿼리는 예컨대 컴퓨터 및/또는 휴대폰과 같은 사용자 장치(130)로부터 전송될 수 있다. 네트워크(120)는 예를 들어 개인 네트워크, 셀룰러 이동 데이터 통신 네트워크(cellular data network) 및/또는 인터넷과 같은 공중망(public network)을 포함할 수 있다.

도 2(a)는 강화된 대화 이해 아키텍처를 제공하는 인터페이스(200)를 도시하는 블록도이다. 인터페이스(200)는 사용자 입력 패널(210) 및 개인 보조 패널(220)을 포함할 수 있다. 사용자 입력 패널(210)은 사용자 문장(230)과 같은 번역된 사용자 쿼리 및/또는 동작 요청을 디스플레이할 수 있다. 사용자 문장(230)은 예를 들어, 사용자 장치(130)의 사용자로부터 수신된 음성-텍스트 변환의 결과물을 포함할 수 있다. 이후에, 동작 제안들(320(A) 및 (B))을 이용하여 갱신될 수 있다. 개인 보조 패널(220)은 사용자 문장(230) 및 사용자와 연관된 컨텍스트 상태로부터 도출되는 복수의 동작 제안들(240(A) 내지 (C))을 포함할 수 있다.

도 2(b)는 사용자가 복수의 동작 제안들 중 하나(240(A))를 선택한 후에 갱신되는 디스플레이를 포함하는 인터페이스(200)를 더 도시한다. 예컨대, 복수의 동작 제안들(240(A) 내지 (C))이 "오늘 밤 외출(go out tonight)"의 사용자 표현 의도에 응답하는 제안된 활동들을 포함할 수 있다. 동작 제안(240(A))이 선택되면, 이번 예에서 외식을 하고자하는 사용자 의도를 표시하고, 개인 보조 패널(220)은 사용자 의도를 더 규정하는 것과 관련하여 제2의 복수의 동작 제안들(250(A) 내지 (C))로 갱신될 수 있다. 예를 들어, 제2의 복수의 동작 제안들(250(A) 내지 (C))은 사용자가 먹기를 원하는 다양한 제안 요리들을 포함할 수 있다. 본 발명의 실시예들과 일관되게, 사용자와 관련되는 컨텍스트 상태(context state)가 제2의 복수의 동작 제안들(250(A) 내지 (C))을 제공하거나 및/또는 주문하기 위해 이용될 수 있다. 예컨대, 이러한 컨텍스트 상태는 사용자가 방문했었던 및/또는 좋아하는 이전 레스토랑 이력을 포함할 수 있고 이러한 선호에 따라 요리의 유형이 주문되어 질 수 있다.

도 3은 강화된 대화 이해 아키텍처에 대한 피드백의 준비(provision)를 도시하는 인터페이스(200)의 블록도이다. 사용자는 사용자 문장(230)의 일부 및/또는 전부를 수정된 사용자 문장(310)으로 변경할 수 있다. 예를 들어, 사용자는 마우스, 스타일러스(stylus), 키보드, 보이스 커맨드(voice command) 및/또는 다른 입력 메카니즘을 이용하여 이전에 번역된 단어 "out"를 선택하고 "outside"로 변경할 수 있다. 이후에, 개인 보조 패널(220)은 변경된 사용자 문장(310)에 따라 갱신된 복수의 동작 제안(320(A) 및 (B))을 이용하여 갱신될 수 있다.

도 4는 강화된 대화 이해 아키텍처를 제공하는 본 발명의 실시예에 관한 방법(400)의 일반적인 단계를 보여주는 플로우차트이다. 방법(400)은 도 4와 관련하여 이하에서 더 상세히 설명되는 바와 같이 컴퓨팅 장치(500)를 사용하여 구현될 수 있다. 방법(400)의 단계들을 구현하는 방식은 이하에서 더 상세히 다루어질 것이다. 방법(400)은 시작 블록(405)에서 시작하여 컴퓨팅 장치(500)가 동작 요청을 수신하는 단계(410)로 나아갈 수 있다. 예컨대, SDS(110)는 사용자 장치(130)로부터 사용자 구어 쿼리(user's spoken query)인 "외식할 장소를 찾음(find a place to eat)"을 포함하는 요청을 수신할 수 있다.

방법(400)은 컴퓨팅 장치(500)가 사용자와 연관되는 컨텍스트 상태를 수집하는 단계(415)로 이어진다. 이러한 컨텍스트 상태는 예를 들어 사용자와 연관된 역할, 적어도 하나의 이전 사용자 목적, 적어도 하나의 이전 사용자 동작 요청, 사용자 위치, 시간, 날짜, 사용자로부터의 제1 동작 요청에 대한 데이터 유형, 및/또는 이전 사용자 동작 요청들에 대한 데이터 카테고리 등을 포함할 수 있다. 이러한 정보는 SDS(110)의 컨텍스트 데이터베이스(116)에 저장될 수 있다.

방법(400)은 컴퓨팅 장치(500)가 상기 컨텍스트 상태에 따라 복수의 목적을 생성하는 단계(420)로 이어진다. 예를 들어, SDS는 쿼리 "외식할 장소를 찾음(find a place to eat)"와 연관되는 범위로 "식당(dining)"을 식별할 수 있다. 그 결과, 사용자의 위치에 따라 근처 레스토랑을 찾는 것 및/또는 대화에 연관된 사용자들의 수에 따라 예약을 하는 것과 같은 목적이 생성될 수 있다.

방법(400)은 컴퓨팅 장치(500)가 상기 컨텍스트 상태에 따라 요청된 동작을 수행하는 단계(425)로 이어진다. 예컨대, 사용자 쿼리 "외식할 장소를 찾음(find a place to eat)"에 응답하여 번역기 모듈(114)은 검색 에이전트(118)가 사용자에 대한 근처 레스토랑을 검색하도록 명령할 수 있다. 이러한 검색 결과는 개인 보조 프로그램(112)에 의해 사용자 장치(130)로 전송될 수 있고 예컨대 인터페이스(220)의 개인 보조 패널(220)에 디스플레이될 수 있다.

방법(400)은 컴퓨팅 장치(500)가 상기 컨텍스트 상태를 갱신하는 단계(430)로 이어진다. 예를 들어, 복수의 동작 제안(240(a) 내지 (c))을 포함하는 선택들 중 현재 선택은 사용자 컨텍스트 상태에서 예측되는 확률에 연관된다. 사용자의 다음 동작은 이후의 쿼리의 적용을 위한 예측된 확률을 조정하기 위해 이용될 수 있다.

방법(400)은 컴퓨팅 장치(500)가 다음 요청된 동작이 현재 목적을 달성하는데 관련있는지를 판정하는 단계(435)로 이어진다. 예컨대, SDS(110)는 사용자 컨텍스트 상태를 현재 목적과 연관된 복수의 사용자 컨텍스트 상태와 비교할 수 있다. 동일한 동작/쿼리를 등록했던 이전 사용자들은 유사한 다음 동작을 취했을 수 있으나 이번 단계에서 사용자의 다른 동작은 잘못된 목적이 예측되었었음을 나타낼 수도 있다. 만약 사용자의 다음 동작이 예측했던 목적과 맞지 않은 경우, 방법(400)은 새로운 목적들의 집합을 생성하는 단계(420)로 돌아갈 수 있다.

이와 달리, 방법(400)은 컴퓨팅 장치(500)가 예측된 목적이 완수되는지를 판정하는 단계로 이어질 수 있다. 예를 들어, SDS(110)가 요청되는 동작을 수신하여 식당 예약 및 택시 배정을 완수하는 경우, 식사 계획의 목적은 완수되었다고 판정될 수 있고 방법(400)이 단계(442)로 이어져 종료될 수 있다. 만약 동작이 예약할 레스토랑의 선택은 포함하고 시간 선택은 포함하지 않는 경우, 예측된 목적이 완료되지 않은 것으로 판정될 수 있다.

만약 단계(440)에서, 예측된 목적이 완수되지 않은 경우, 방법(400)은 컴퓨팅 장치(500)가 다음 제안되는 동작을 제공하는 단계(445)로 이어질 수 있다. 예컨대, 레스토랑은 선택되고 시간은 선택되지 않은 경우, 개인 보조 프로그램(112)은 사용자로부터 예약 시간을 요청할 수 있다.

방법(400)은 컴퓨팅 장치(500)가 사용자로부터 다음 동작을 수신하는 단계(450)로 이어질 수 있다. 예를 들어, 사용자는 예약 시간에 대해 7시의 선택을 입력하고 이를 SDS(110)로 전달할 수 있다. 그 후, 방법(400)은 단계(425)로 돌아갈 수 있고, 앞서 기술된 다음 요청 동작을 수행할 수 있다.

본 발명에 따르는 실시예는 컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템을 포함할 수 있다. 상기 시스템은 메모리 저장소 및 상기 메모리 저장소와 연결된 프로세싱 유닛을 포함할 수 있다. 상기 프로세싱 유닛은 사용자로부터 자연어 구절을 수신하고, 이러한 자연어 구절을 검색 구절로 번역하고, 검색 구절에 따라 검색 동작을 수행하도록 동작할 수 있다. 상기 자연어 구절은, 예컨대, 복수의 텍스트 단어 및/또는 오디오 스트림으로서 수신될 수 있다. 상기 검색 구절은 상기 자연어 구절에는 포함되어 있지 않은 적어도 하나 이상의 문맥적 의미 개념(contextual semantic concept)을 포함할 수 있다. 상기 프로세싱 유닛은 상기 검색 동작에 따라 복수의 검색 결과를 수신하고 이러한 복수의 검색 결과를 사용자에게 제공하도록 더 동작할 수 있다. 상기 프로세싱 유닛은 상기 복수의 결과를 복수의 사용자들에게 제공하도록 더 동작할 수 있다. 상기 자연어 구절은, 예컨대, 복수의 사용자들 사이의 대화로부터 도출될 수 있다. 상기 프로세싱 유닛은 복수의 API(application programming interfaces)를 분석하고 상기 복수의 API 각각에 대한 적어도 하나 이상의 요청 파라미터를 식별하도록 동작할 수 있다. 상기 복수의 API는 웹 사이트 검색 기능과 각각 연관될 수 있다. 자연어 구절을 검색 구절로 번역하는 동작은 상기 프로세싱 유닛이 상기 자연어 구절과 관련된 컨텍스트를 식별하고, 복수의 API 중 적어도 하나가 상기 식별된 컨텍스트와 연관되는지 판정하며, 그러한 경우, 자연어 구절의 적어도 하나 이상의 단어를 상기 복수의 API 중 적어도 하나와 연관되는 요청 파라미터로 번역하는 동작을 포함할 수 있다. 검색 동작을 수행하는 것은 상기 프로세싱 유닛이 상기 적어도 하나의 요청 파라미터로 상기 적어도 하나의 API를 호출하는 것을 포함할 수 있다.

본 발명에 따르는 또 다른 실시예는 컨텍스트 인식 환경을 제공하기 위한 시스템을 포함할 수 있다. 상기 시스템은 메모리 저장소 및 상기 메모리 저장소와 연결된 프로세싱 유닛을 포함할 수 있다. 상기 프로세싱 유닛은 사용자로부터 자연어 구절을 수신하고, 상기 자연어 구절과 연관된 컨텍스트 상태를 생성하고, 상기 자연어 구절을 실행가능한 동작으로 번역하며, 식별된 컨텍스트에 따라서 실행가능한 동작과 연관되는 영역(domain)을 식별하고, 식별된 영역 내에서 실행가능한 동작을 수행하도록 동작할 수 있다. 상기 실행가능한 동작은, 예컨대, 검색 동작, 데이터 생성 동작, 데이터 수정 동작 및 통신 동작을 포함할 수 있다. 상기 프로세싱 유닛은 하나 이상의 제안된 다음 동작을 사용자에게 제공하도록 더 동작할 수 있다. 상기 프로세싱 유닛은 제2 자연어 구절을 사용자로부터 수신하고, 상기 제2 자연어 구절이 상기 하나 이상의 제안된 다음 동작과 연관되는지 판정하고, 그러한 경우, 상기 하나 이상의 제안된 다음 동작을 수행하도록 동작할 수 있다. 상기 제2 자연어 구절이 상기 하나 이상의 제안된 다음 동작과 연관되지 않는다고 판정되는 것에 응답하여 상기 프로세싱 유닛은 하나 이상의 제2 제안된 다음 동작을 사용자에게 제공하도록 동작할 수 있다. 상기 프로세싱 유닛은 상기 제2 자연어 구절에 따라서 상기 컨텍스트 상태를 갱신하도록 더 동작할 수 있다.

본 발명에 따르는 또 다른 실시예는 컨텍스트 인식 환경을 제공하기 위한 시스템을 포함할 수 있다. 상기 시스템은 메모리 저장소 및 상기 메모리 저장소와 연결된 프로세싱 유닛을 포함할 수 있다. 상기 프로세싱 유닛은 복수의 목적을 생성하고, 사용자와 연관된 컨텍스트 상태를 수집하며, 상기 컨텍스트 상태에 따라서 상기 복수의 목적들 중 적어도 하나와 연관되는 제안된 동작을 제공하고, 사용자로부터 동작 요청을 수신하며, 상기 컨텍스트 상태에 따라 요청된 동작을 실행하고, 동작이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관되는지를 판정하도록 동작할 수 있다. 상기 동작이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관된다고 판정하는 것에 응답하여, 상기 프로세싱 유닛은 컨텍스트 상태를 갱신하고, 제안된 동작과 연관되는 확률을 갱신하며, 상기 컨텍스트 상태가 상기 복수의 목적 중 완수된 목적을 포함하는지 판정하도록 동작할 수 있다. 상기 컨텍스트 상태가 완수된 목적을 포함하지 않는다고 판정되는 것에 응답하여, 상기 프로세싱 유닛은 적어도 하나 이상의 제2 제안 동작을 제공하도록 동작할 수 있다.

컨텍스트 상태는, 예컨대, 사용자와 관련된 역할, 적어도 하나 이상의 이전 사용자 목적, 적어도 하나 이상의 이전 사용자 동작 요청, 사용자의 위치, 시간, 날짜, 사용자로부터의 제1 동작 요청과 관련된 카테고리, 사용자로부터의 제1 동작 요청과 연관된 데이터 유형, 및 이전 사용자 동작 요청들과 연관된 데이터 카테고리를 포함할 수 있다. 컨텍스트 상태가 하나 이상의 예측된 목적을 성취하는 것과 관련있는지를 판정하는 동작은 프로세싱 유닛이 컨텍스트 상태를 복수의 목적들 중 적어도 하나와 각각 연관되는 복수의 사용자 컨텍스트 상태들과 비교하는 동작을 포함할 수 있다.

도 5는 컴퓨팅 장치(500)를 포함하는 시스템의 블록도이다. 본 발명의 실시예들에 따라, 전술한 메모리 저장소 및 처리 장치는 도 5의 컴퓨팅 장치(500)와 같은 컴퓨팅 장치에 구현될 수 있다. 메모리 저장소 및 처리 장치를 구현하기 위해 하드웨어, 소프트웨어, 또는 펌웨어의 임의의 적합한 조합이 이용될 수 있다. 예를 들면, 메모리 저장소 및 처리 장치는 컴퓨팅 장치(500)로 또는 다른 컴퓨팅 장치들(518) 중 임의의 것을 컴퓨팅 장치(500)와 조합하여 구현될 수 있다. 전술한 시스템, 장치, 및 프로세서들은 예시들이고 다른 시스템들, 장치들, 및 프로세서들이 본 발명의 실시예들에 따른 전술한 메모리 저장소 및 처리 장치를 포함할 수 있다. 또한, 컴퓨팅 장치(500)는 위에 설명된 시스템(100)을 위한 운영 환경을 포함할 수 있다. 시스템(100)은 다른 환경들에서 동작할 수 있고 컴퓨팅 장치(500)에 제한되지 않는다.

도 5에 관련하여, 본 발명의 실시예에 따른 시스템은 컴퓨팅 장치(500)와 같은 컴퓨팅 장치를 포함할 수 있다. 기본 구성으로, 컴퓨팅 장치(500)는 적어도 하나의 처리 장치(502) 및 시스템 메모리(504)를 포함할 수 있다. 컴퓨팅 장치의 구성 및 유형에 따라서, 시스템 메모리(504)는 휘발성(예를 들면, RAM(random access memory)), 비휘발성(예를 들면, ROM(read-only memory)), 플래시 메모리, 또는 임의의 조합을 포함할 수 있지만, 이에 제한되는 것은 아니다. 시스템 메모리(504)는 운영 체제(505), 하나 이상의 프로그래밍 모듈들(506), 및 개인 보조 프로그램(112)을 포함할 수 있다. 운영 체제(505)는, 예를 들면, 컴퓨팅 장치(500)의 동작을 제어하기에 적합할 수 있다. 또한, 본 발명의 실시예들은 그래픽 라이브러리, 기타 운영 체제들, 또는 임의의 다른 애플리케이션 프로그램과 함께 실시될 수 있고 임의의 특정한 애플리케이션 또는 시스템에 제한되지 않는다. 이 기본 구성은 도 5에서 대시 선(508) 내의 컴포넌트들에 의해 예시되어 있다.

컴퓨팅 장치(500)는 추가적인 특징들 또는 기능을 가질 수 있다. 예를 들면, 컴퓨팅 장치(500)는 또한, 예를 들면, 자기 디스크, 광 디스크, 또는 테이프와 같은 추가적인 데이터 저장 장치들(이동식 및/또는 비이동식)을 포함할 수 있다. 그러한 추가적인 저장소는 도 5에서 이동식 저장소(509) 및 비이동식 저장소(510)에 의해 예시되어 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위해 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성, 이동식 및 비이동식 매체를 포함할 수 있다. 시스템 메모리(504), 이동식 저장소(509), 및 비이동식 저장소(510)는 모두 컴퓨터 저장 매체 예들(즉, 메모리 저장소)이다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM(electrically erasable read-only memory), 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital versatile disk) 또는 기타 광 저장소, 자기 카세트, 자기 테이프, 자기 디스크 저장소 또는 기타 자기 저장 장치, 또는 컴퓨팅 장치(500)에 의해 액세스될 수 있고 정보를 저장하는 데 이용될 수 있는 임의의 다른 매체를 포함할 수 있지만 이에 제한되는 것은 아니다. 임의의 그러한 컴퓨터 저장 매체는 장치(500)의 일부일 수 있다. 컴퓨팅 장치(500)는 또한 키보드, 마우스, 펜, 사운드 입력 장치, 터치 입력 장치 등과 같은 입력 장치(들)(512)를 가질 수 있다. 디스플레이, 스피커, 프린터 등과 같은 출력 장치(들)(514)도 포함될 수 있다. 전술한 장치들은 예시들이고 다른 것들이 사용될 수 있다.

컴퓨팅 장치(500)는 또한 장치(500)가 분산 컴퓨팅 환경의 네트워크, 예를 들면, 인트라넷 또는 인터넷을 통하여 다른 컴퓨팅 장치(518)와 통신하게 할 수 있는 통신 커넥션(516)을 포함할 수 있다. 통신 커넥션(516)은 통신 매체의 일례이다. 통신 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 변조된 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 기타 데이터에 의해 구현될 수 있고, 임의의 정보 전달 매체를 포함한다. "변조된 데이터 신호"라는 용어는, 신호 내에 정보를 암호화하도록 그 신호의 하나 이상의 특성을 설정 또는 변경시킨 신호를 묘사할 수 있다. 예로서, 통신 매체는 유선 네트워크 또는 다이렉트 유선 연결과 같은 유선 매체, 및 음향, RF(radio frequency), 적외선, 및 기타 무선 매체와 같은 무선 매체를 포함할 수 있다. 여기에 사용된 컴퓨터 판독가능 매체는 저장 매체 및 통신 매체 둘 다를 포함할 수 있다.

전술한 바와 같이, 운영 체제(505)를 포함하여, 다수의 프로그램 모듈들 및 데이터 파일들이 시스템 메모리(504)에 저장될 수 있다. 처리 장치(502)에서 실행하는 동안, 프로그램 모듈들(506)(예를 들면, 개인 보조 프로그램(112))은, 예를 들면, 위에 설명된 방법(400)의 단계들 중 하나 이상의 단계들을 포함하는 프로세스들을 수행할 수 있다. 전술한 프로세스는 예시이고, 처리 장치(502)는 다른 프로세스들을 수행할 수 있다. 본 발명의 실시예들에 따라 사용될 수 있는 다른 프로그램 모듈들은 전자 메일 및 콘택트 애플리케이션, 워드 프로세싱 애플리케이션, 스프레드시트 애플리케이션, 데이터베이스 애플리케이션, 슬라이드 프리젠테이션 애플리케이션, 그림 또는 컴퓨터 지원(computer-aided) 애플리케이션 프로그램 등을 포함할 수 있다.

일반적으로, 본 발명의 실시예들에 따라, 프로그램 모듈들은 특정 태스크를 수행할 수 있는 또는 특정 추상 데이터 유형을 구현할 수 있는 루틴, 프로그램, 컴포넌트, 데이터 구조, 및 다른 구조 유형들을 포함할 수 있다. 또한, 본 발명의 실시예들은 핸드헬드 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 또는 프로그램 가능한 소비자 전자 장치, 미니컴퓨터, 메인프레임 컴퓨터 등을 포함하는 다른 컴퓨터 시스템 구성들과 함께 실시될 수 있다. 본 발명의 실시예들은 또한 통신 네트워크를 통해 링크된 원격 처리 장치들에 의해 태스크가 수행되는 분산 컴퓨팅 환경에서 실행될 수도 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 메모리 저장 장치 및 원격 메모리 저장 장치 둘 다에 위치할 수 있다.

또한, 본 발명의 실시예들은 개별 전자 엘리먼트들, 논리 게이트들을 포함하는 패키징된 또는 집적된 전자 칩, 마이크로프로세서를 이용하는 회로에서, 또는 전자 엘리먼트들 또는 마이크로프로세서들을 포함하는 단일 칩에서 실시될 수 있다. 본 발명의 실시예들은 또한, 기계, 광학, 유체 공학, 및 양자 기술들을 포함하되 이에 제한되지 않는, 예를 들면, AND, OR, 및 NOT과 같은 논리 연산들을 수행할 수 있는 다른 기술들을 사용하여 실시될 수 있다. 또한, 본 발명의 실시예들은 범용 컴퓨터 내에서 또는 임의의 다른 회로들 또는 시스템들에서 실시될 수 있다.

본 발명의 실시예들은, 예를 들면, 컴퓨터 프로세스(방법), 컴퓨팅 시스템으로서, 또는 컴퓨터 프로그램 제품 또는 컴퓨터 판독가능 매체와 같은 제조물로서 구현될 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 시스템에 의해 판독가능하고 컴퓨터 프로세스를 실행하기 위한 명령어들의 컴퓨터 프로그램을 인코딩하는 컴퓨터 저장 매체일 수 있다. 컴퓨터 프로그램 제품은 또한 컴퓨팅 시스템에 의해 판독가능하고 컴퓨터 프로세스를 실행하기 위한 명령어들의 컴퓨터 프로그램을 인코딩하는 반송파 상의 전파 신호일 수 있다. 따라서, 본 발명은 하드웨어로 및/또는 (펌웨어, 상주 소프트웨어, 마이크로코드 등을 포함하는) 소프트웨어로 구현될 수 있다. 즉, 본 발명의 실시예들은 명령 실행 시스템에 의해 또는 그와 관련하여 사용하기 위한 컴퓨터 사용가능 또는 컴퓨터 판독가능 프로그램 코드가 구현되어 있는 컴퓨터 사용가능 또는 컴퓨터 판독가능 저장 매체 상의 컴퓨터 프로그램 제품의 형태를 취할 수 있다. 컴퓨터 사용가능 또는 컴퓨터 판독가능 매체는 명령 실행 시스템, 장치, 또는 디바이스에 의해 또는 그와 관련하여 사용하기 위한 프로그램을 포함하고, 저장하고, 통신하고, 전파하고, 또는 전송할 수 있는 임의의 매체일 수 있다.

컴퓨터 사용가능 또는 컴퓨터 판독가능 매체는, 예를 들면, 전자, 자기, 광학, 전자기, 적외선, 또는 반도체 시스템, 장치, 디바이스, 또는 전파 매체일 수 있지만 이에 제한되는 것은 아니다. 더 구체적인 컴퓨터 판독가능 매체 예시들(총망라하지 않은 목록)로서, 컴퓨터 판독가능 매체는 하나 이상의 와어어를 갖는 전기 연결, RAM(random access memory), ROM(read-only memory), EPROM(erasable programmable read-only memory) 또는 플래시 메모리, 광섬유, 및 휴대용 CD-ROM(compact disc read-only memory)을 포함할 수 있다. 컴퓨터 사용가능 또는 판독가능 매체는 프로그램이 인쇄되어 있는 종이 또는 다른 적합한 매체일 수도 있는데, 이는 프로그램은, 예를 들면, 그 종이 또는 다른 매체의 광학 스캐닝을 통해 전자적으로 캡처될 수 있고, 그 후, 필요하다면, 적합한 방식으로 컴파일되거나, 인터프리트되거나, 또는 다른 식으로 처리되고, 그 후 컴퓨터 메모리에 저장될 수 있기 때문이다.

본 발명의 실시예들은, 예를 들면, 본 발명의 실시예들에 따른 방법들, 시스템들, 및 컴퓨터 프로그램 제품들의 블록도들 및/또는 동작 예시들에 관련하여 위에 설명되어 있다. 블록들에 기재된 기능들/동작들은 임의의 순서도에서 나타내어진 순서와 다르게 행해질 수 있다. 예를 들면, 연속하여 나타내어진 2개의 블록들은 사실 실질적으로 동시에 실행될 수도 있고 또는 그 블록들은, 수반된 기능/동작들에 따라서, 때때로 역순으로 실행될 수도 있다.

본 발명의 특정한 실시예들이 설명되었지만, 다른 실시예들이 존재할 수 있다. 또한, 본 발명의 실시예들은 메모리 및 기타 저장 매체들에 저장된 데이터와 관련되는 것으로 설명되었지만, 데이터는 또한 하드 디스크, 플로피 디스크, 또는 CD-ROM과 같은 보조 저장 장치들, 인터넷으로부터의 반송파, 또는 RAM 또는 ROM의 다른 형태들과 같은, 다른 유형의 컴퓨터 판독가능 매체 상에 저장되거나 그로부터 판독될 수도 있다. 또한, 개시된 방법들의 단계들은, 본 발명에서 벗어나지 않고, 단계들을 재정리하는 것 및/또는 단계들을 삽입하거나 삭제하는 것을 포함하여, 임의의 방식으로 수정될 수 있다.

본 명세서는 예시들을 포함하지만, 본 발명의 범위는 다음의 청구항들에 의해 지시된다. 또한, 본 명세서는 구조적 특징들 및/또는 방법적 동작들에 특정한 언어로 설명되었지만, 청구항들은 위에 설명된 특징들 또는 동작들에 제한되지 않는다. 오히려, 위에 설명된 그 특정한 특징들 및 동작들은 본 발명의 실시예들에 대한 예시들로서 개시된다.

Claims

강화된 대화 이해 아키텍처(augmented conversational understanding architecture)를 제공하기 위한 컴퓨터-구현 방법으로서,
사용자로부터 동작 요청(action request)을 포함하는 자연어 구절(natural language phrase)을 수신하는 단계;
상기 동작 요청에 기초하여 상기 사용자와 연관된 컨텍스트 상태(context state)를 판정하는 단계 - 상기 컨텍스트 상태는 동적으로 판정된 상기 사용자의 현재 위치와 상기 사용자와 연관된 역할 중 적어도 하나를 포함함 - ;
상기 컨텍스트 상태에 기초하여 하나 이상의 목적들을 판정하는 단계;
상기 하나 이상의 목적들에 기초하여 복수의 선택가능한 제안된 동작들을 도출하는 단계 - 상기 복수의 선택가능한 제안된 동작들은 상기 동작 요청에 관련된 복수의 사용자 활동을 포함함 - ; 및
상기 복수의 선택가능한 동작들을 상기 사용자에게 디스플레이하는 단계를 포함하는
컴퓨터-구현 방법.
제1항에 있어서,
상기 방법은
상기 자연어 구절을 검색 구절로 번역하는 단계를 더 포함하고,
상기 검색 구절은 하나 이상의 의미 개념(semantic concept)을 포함하는,
컴퓨터-구현 방법.
제2항에 있어서,
상기 하나 이상의 의미 개념은 상기 자연어 구절에 포함되어 있지 않은 단어를 포함하는,
컴퓨터-구현 방법.
제1항에 있어서,
상기 자연어 구절을 검색 구절로 번역하는 단계;
상기 검색 구절에 따라 검색 동작을 수행하는 단계 - 상기 검색 구절에 따라 검색 동작을 수행하는 단계는 상기 자연어 구절을 온톨로지(ontology)의 적어도 하나의 노드로 매핑하는 것을 포함하며, 상기 온톨로지는 복수의 검색 엔진 결과와 연관된 데이터를 포함함 - ;
상기 검색 동작에 따라 복수의 검색 결과를 수신하는 단계;
상기 복수의 검색 결과를 상기 사용자에게 제공하는 단계; 및
상기 복수의 검색 결과를 복수의 사용자들에게 제공하는 단계 - 상기 자연어 구절은 상기 복수의 사용자들 사이의 대화(conversation)로부터 도출됨 -
를 더 포함하는,
컴퓨터-구현 방법.
제1항에 있어서,
복수의 API(application programming interfaces)들을 분석하는 단계 - 상기 복수의 API 각각은 웹 사이트 검색 기능과 연관됨 -; 및
상기 복수의 API 각각에 대한 하나 이상의 요청 파라미터(required parameter)를 식별하는 단계
를 더 포함하는,
컴퓨터-구현 방법.
실행될 때 시스템의 프로세싱 유닛으로 하여금 강화된 대화 이해 아키텍처를 제공하기 위한 방법을 수행하게 하는 명령어들의 집합을 저장하는 컴퓨터 판독가능한 저장 매체로서,
상기 방법은
사용자로부터 동작 요청을 포함하는 자연어 구절을 수신하는 단계;
상기 동작 요청에 기초하여 상기 자연어 구절과 연관된 컨텍스트 상태(context state)를 생성하는 단계 - 상기 컨텍스트 상태는 동적으로 판정된 상기 사용자의 현재 위치, 이전에 식별된 사용자 목적, 상기 사용자와 연관된 역할 중 적어도 하나를 포함함 - ;
상기 컨텍스트 상태에 기초하여 하나 이상의 현재 목적들을 판정하는 단계;
상기 자연어 구절을 실행가능한 동작으로 번역하는 단계;
상기 컨텍스트 상태에 따라 상기 실행가능한 동작과 연관된 영역(domain)을 식별하는 단계;
상기 하나 이상의 현재 목적들에 기초하여 복수의 제안된 다음 동작들을 제공하는 단계 - 상기 복수의 제안된 다음 동작들은 선택가능하며 상기 컨텍스트 상태 및 상기 동작 요청에 기초하는 복수의 사용자 행동을 포함함 - ; 및
상기 식별된 영역 내에서 상기 실행가능한 동작을 수행하는 단계
를 포함하는,
컴퓨터 판독가능한 저장 매체.
제6항에 있어서,
상기 방법은
상기 사용자로부터 제2 자연어 구절을 수신하는 단계;
상기 제2 자연어 구절이 상기 복수의 제안된 다음 동작들 중 적어도 하나와 연관되는지를 판정하는 단계; 및
상기 제2 자연어 구절이 상기 복수의 제안된 다음 동작들 중 적어도 하나와 연관된다고 판정되는 것에 응답하여, 상기 복수의 제안된 다음 동작들 중 적어도 하나를 수행하는 단계
를 더 포함하는,
컴퓨터 판독가능한 저장 매체.
제7항에 있어서,
상기 방법은
상기 제2 자연어 구절이 상기 복수의 제안된 다음 동작들과 연관되지 않는다고 판정되는 것에 응답하여, 하나 이상의 제2의 제안된 다음 동작을 상기 사용자에게 제공하는 단계를 더 포함하는,
컴퓨터 판독가능한 저장 매체.
제8항에 있어서,
상기 방법은
상기 제2 자연어 구절에 따라 상기 컨텍스트 상태를 갱신하는 단계를 더 포함하는,
컴퓨터 판독가능한 저장 매체.
컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템에 있어서,
상기 시스템은
메모리 저장소; 및
상기 메모리 저장소와 연결된 프로세싱 유닛을 포함하고,
상기 프로세싱 유닛은
사용자로부터 동작 요청을 수신하는 단계,
상기 사용자와 연관된 컨텍스트 상태를 수집하는 단계 - 상기 컨텍스트 상태는 상기 사용자와 관련된 역할, 적어도 하나 이상의 이전 사용자 목적, 적어도 하나 이상의 이전 사용자 동작 요청, 상기 사용자의 위치, 시간, 날짜, 상기 사용자로부터의 제1 동작 요청과 관련된 카테고리, 상기 사용자로부터의 제1 동작 요청과 연관된 데이터 유형, 및 이전 사용자 동작 요청들과 연관된 데이터 카테고리 중 적어도 하나 이상을 포함함 -,
상기 컨텍스트 상태에 따라 복수의 목적들을 생성하는 단계;
상기 컨텍스트 상태에 따라 상기 요청된 동작을 수행하는 단계;
상기 요청된 동작이 상기 복수의 목적들 중 적어도 하나를 성취하는 것과 연관되는지를 판정하는 단계 - 상기 요청된 동작이 상기 복수의 목적들 중 적어도 하나를 성취하는 것과 연관되는지를 판정하는 것은 상기 컨텍스트 상태를 상기 복수의 목적들 중 상기 적어도 하나와 각각 연관되는 복수의 사용자 컨텍스트 상태와 비교하는 것을 포함함 -;
상기 요청된 동작이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관있다고 판정하는 것에 응답하여, 상기 컨텍스트 상태를 갱신하는 단계;
상기 컨텍스트 상태가 상기 복수의 목적들 중 완수된 목적을 포함하는지를 판정하는 단계; 및
상기 컨텍스트 상태가 상기 완수된 목적을 포함하지 않는다는 판정에 응답하여 제안된 다음 동작을 제공하는 단계
를 수행하도록 동작하는,
컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템.
컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템에 있어서,
상기 시스템은
메모리 저장소; 및
상기 메모리 저장소와 연결된 프로세싱 유닛을 포함하고,
상기 프로세싱 유닛은
사용자로부터 동작 요청을 수신하는 단계;
상기 사용자와 연관된 컨텍스트 상태를 수집하는 단계 - 상기 컨텍스트 상태는 상기 동작 요청, 동적으로 판정된 상기 사용자의 위치 및 이전 사용자들과 연관된 데이터에 적어도 부분적으로 기초함 -;
상기 컨텍스트 상태에 따라 복수의 목적들을 생성하는 단계 - 상기 복수의 목적들은 상기 사용자로부터의 상기 동작 요청 내의 복수의 용어(terms)에 기초한 복수의 사용자 활동들을 포함함 -;
상기 컨텍스트 상태에 따라 상기 동작 요청을 수행하는 단계;
상기 동작 요청이 상기 복수의 목적들 중 적어도 하나를 성취하는 것과 연관되는지를 판정하도록, 상기 컨텍스트 상태를 각각이 복수의 목적들과 연관되는 복수의 사용자 컨텍스트 상태들과 비교하는 단계;
상기 동작 요청이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관있다고 판정하는 것에 응답하여, 상기 컨텍스트 상태를 갱신하는 단계;
상기 컨텍스트 상태가 상기 복수의 목적들 중 완수된 목적을 포함하는지를 판정하는 단계; 및
상기 컨텍스트 상태가 상기 완수된 목적을 포함하지 않는다는 판정에 응답하여 제안된 다음 동작을 제공하는 단계
를 수행하도록 동작하는,
컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템.