KR101963915B1 - 강화된 대화 이해 아키텍처 - Google Patents

강화된 대화 이해 아키텍처 Download PDF

Info

Publication number
KR101963915B1
KR101963915B1 KR1020137025586A KR20137025586A KR101963915B1 KR 101963915 B1 KR101963915 B1 KR 101963915B1 KR 1020137025586 A KR1020137025586 A KR 1020137025586A KR 20137025586 A KR20137025586 A KR 20137025586A KR 101963915 B1 KR101963915 B1 KR 101963915B1
Authority
KR
South Korea
Prior art keywords
user
context state
natural language
context
search
Prior art date
Application number
KR1020137025586A
Other languages
English (en)
Other versions
KR20140025362A (ko
Inventor
래리 폴 헤크
마두수단 친사쿤타
데이비드 미트비
리자 스티펠만
Original Assignee
마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/077,396 external-priority patent/US9842168B2/en
Priority claimed from US13/077,455 external-priority patent/US9244984B2/en
Priority claimed from US13/076,862 external-priority patent/US9760566B2/en
Priority claimed from US13/077,368 external-priority patent/US9298287B2/en
Priority claimed from US13/077,303 external-priority patent/US9858343B2/en
Priority claimed from US13/077,233 external-priority patent/US20120253789A1/en
Priority claimed from US13/077,431 external-priority patent/US10642934B2/en
Application filed by 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 filed Critical 마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Publication of KR20140025362A publication Critical patent/KR20140025362A/ko
Application granted granted Critical
Publication of KR101963915B1 publication Critical patent/KR101963915B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

강화된 대화 이해 아키텍처가 주어진다. 사용자로부터 자연어 구절을 수신하면, 상기 구절은 검색 구절(search phrase)로 번역될 수 있고 그러한 검색 구절에 기초하여 검색 동작이 수행될 수 있다.

Description

강화된 대화 이해 아키텍처{AUGMENTED CONVERSATIONAL UNDERSTANDING ARCHITECTURE}
강화된 대화 이해 아키텍처는 사용자 쿼리 및 대화에 대한 자연어 이해를 용이하게하는 메카니즘을 제공한다.
특정 경우에 있어서, 개인 보조 프로그램들 및/또는 검색 엔진들은 특별한 포매팅(formatting) 및 신택스(syntax)를 종종 요구한다. 예를 들어, "나는 대략 7시에 'Inception'을 보러가길 원한다"라는 사용자 쿼리는 대화 시스템에 주어졌을 경우 상기 사용자의 참 의도를 이해하는데 있어서 효과적이지 않을 수 있다. 그러한 시스템들은 일반적으로 상기 사용자가 영화를 조회하고 대략 7시에 그 영화를 상영하는 지역 영화관들을 알려주는 결과를 원한다는 맥락을 도출하지 못할 수 있다.
본 요약은 아래 상세한 설명에서 더 설명되는 개념들 중 선택된 것을 단순화된 형태로 소개하기 위해 제공된다. 본 요약은 청구된 내용의 중요한 특징들 또는 본질적인 특징들을 식별하기 위해 의도된 것이 아니다. 그것은 청구된 내용의 범위를 제한하기 위해 이용되도록 의도되어 있지도 않다.
강화된 대화 이해 아키텍처가 주어진다. 사용자로부터 자연어 구절을 수신하면, 상기 구절은 검색 구절(search phrase)로 번역될 수 있고 그러한 검색 구절에 기초하여 검색 동작이 수행될 수 있다.
전술한 일반적인 설명 및 다음의 상세한 설명은 예시들을 제공하고 단지 설명적인 것이다. 따라서, 전술한 일반적인 설명 및 다음의 상세한 설명은 제한적인 것으로 간주되어서는 안된다. 또한, 여기에 설명된 것들에 더하여 특징들 또는 변형들이 제공될 수 있다. 예컨대, 실시예들은 상세한 설명에서 설명된 다양한 특징 조합들 및 서브 조합들에 관련될 수 있다.
본 명세서에 포함되고 그 일부를 구성하는 첨부 도면들은 본 발명의 다양한 실시예들을 예시한다.
도 1은 동작 환경의 블록도이다.
도 2(a) 내지 2(b)는 강화된 대화 이해 아키텍처를 제공하는 인터페이스를 도시하는 블록도이다.
도 3은 강화된 대화 이해 아키텍처의 피드백을 제공하는 인터페이스를 도시하는 불록도이다.
도 4는 강화된 대화 이해 아키텍처를 제공하는 방법에 관한 플로우차트이다.
도 5는 컴퓨팅 장치를 포함하는 시스템의 블록도이다.
다음의 상세한 설명은 첨부 도면들을 참고한다. 가능한 한, 도면들 및 다음의 설명에서 동일한 참조 번호들은 동일 또는 유사한 엘리먼트들을 지시하기 위해 사용된다. 본 발명의 실시예들이 설명될 수 있지만, 변형들, 수정들 및 다른 구현들이 가능하다. 예를 들어, 도면들에 예시된 엘리먼트들에 대해 대체, 추가 또는 변경이 이루어질 수 있고, 여기에 설명된 방법들은 개시된 방법들에 대해 단계들을 대체하거나, 순서를 변경(reordering)하거나 또는 추가하는 것에 의해 변경될 수 있다. 따라서, 다음의 상세한 설명은 본 발명을 제한하지 않는다. 대신에, 본 발명의 적당한 범위는 첨부된 청구항들에 의해 규정된다.
강화된 대화 이해 아키텍처가 사용자 쿼리들 및 대화들의 자연어 이해를 용이하게끔 할 수 있다. 이러한 아키텍처는 쿼리의 맥락을 결정하고 사용자 의도를 추론하는 것을 참작할 수 있다. 이러한 아키텍처는 자연어 쿼리의 단어들을 사용하여 대화의 맥락을 결정하고, 사용자 의도를 추정하며, 접적한 검색 에이전트(search agent)를 이용하여 적절한 추가 쿼리를 형성할 수 있다.
구어 대화 시스템(spoken dialog systems; SDS)은 사람들로 하여금 그들의 음성을 통해 컴퓨터와 상호작용할 수 있게 한다. 이러한 SDS를 작동시키는 주요 컴포넌트는 사용자와의 다이얼로그 기반 대화를 관리하는 다이얼로그 매너저를 포함할 수 있다. 이러한 다이얼로그 매니저는 음성 인식, 자연어 이해 컴포넌트 출력(natural language understanding component outputs), 이전 다이얼로그 순번으로부터의 컨텍스트, 사용자 컨텍스트 및/또는 지식 베이스(예컨대, 검색 엔진)로부터의 결과들과 같은 다수의 입력 소스들의 조합을 통해 사용자 의도를 결정할 수 있다. 의도를 결정한 뒤, 상기 다이얼로그 매니저는 최종 결과물을 사용자에게 디스플레이하거나 및/또는 그들의 의도를 만족시키기 위해 사용자와 대화를 계속하는 것과 같은 동작을 취할 수 있다.
도 1은 서버(105)를 포함하는 동작 환경(100)에 대한 블록도이다. 서버(105)는 다이얼로그 매니저(111)를 포함하는 SDS(110), 개인 보조 프로그램(112), 컨텍스트 데이터베이스(116) 및/또는 검색 에이전트(118)와 같은 각종 소프트웨어 모듈들 및/또는 컴퓨팅 자원들을 포함할 수 있다. SDS(110)는 네트워크(120)를 통해 사용자들로부터 쿼리 및/또는 동작 요청을 수신할 수 있다. 이러한 쿼리는 예컨대 컴퓨터 및/또는 휴대폰과 같은 사용자 장치(130)로부터 전송될 수 있다. 네트워크(120)는 예를 들어 개인 네트워크, 셀룰러 이동 데이터 통신 네트워크(cellular data network) 및/또는 인터넷과 같은 공중망(public network)을 포함할 수 있다.
도 2(a)는 강화된 대화 이해 아키텍처를 제공하는 인터페이스(200)를 도시하는 블록도이다. 인터페이스(200)는 사용자 입력 패널(210) 및 개인 보조 패널(220)을 포함할 수 있다. 사용자 입력 패널(210)은 사용자 문장(230)과 같은 번역된 사용자 쿼리 및/또는 동작 요청을 디스플레이할 수 있다. 사용자 문장(230)은 예를 들어, 사용자 장치(130)의 사용자로부터 수신된 음성-텍스트 변환의 결과물을 포함할 수 있다. 이후에, 동작 제안들(320(A) 및 (B))을 이용하여 갱신될 수 있다. 개인 보조 패널(220)은 사용자 문장(230) 및 사용자와 연관된 컨텍스트 상태로부터 도출되는 복수의 동작 제안들(240(A) 내지 (C))을 포함할 수 있다.
도 2(b)는 사용자가 복수의 동작 제안들 중 하나(240(A))를 선택한 후에 갱신되는 디스플레이를 포함하는 인터페이스(200)를 더 도시한다. 예컨대, 복수의 동작 제안들(240(A) 내지 (C))이 "오늘 밤 외출(go out tonight)"의 사용자 표현 의도에 응답하는 제안된 활동들을 포함할 수 있다. 동작 제안(240(A))이 선택되면, 이번 예에서 외식을 하고자하는 사용자 의도를 표시하고, 개인 보조 패널(220)은 사용자 의도를 더 규정하는 것과 관련하여 제2의 복수의 동작 제안들(250(A) 내지 (C))로 갱신될 수 있다. 예를 들어, 제2의 복수의 동작 제안들(250(A) 내지 (C))은 사용자가 먹기를 원하는 다양한 제안 요리들을 포함할 수 있다. 본 발명의 실시예들과 일관되게, 사용자와 관련되는 컨텍스트 상태(context state)가 제2의 복수의 동작 제안들(250(A) 내지 (C))을 제공하거나 및/또는 주문하기 위해 이용될 수 있다. 예컨대, 이러한 컨텍스트 상태는 사용자가 방문했었던 및/또는 좋아하는 이전 레스토랑 이력을 포함할 수 있고 이러한 선호에 따라 요리의 유형이 주문되어 질 수 있다.
도 3은 강화된 대화 이해 아키텍처에 대한 피드백의 준비(provision)를 도시하는 인터페이스(200)의 블록도이다. 사용자는 사용자 문장(230)의 일부 및/또는 전부를 수정된 사용자 문장(310)으로 변경할 수 있다. 예를 들어, 사용자는 마우스, 스타일러스(stylus), 키보드, 보이스 커맨드(voice command) 및/또는 다른 입력 메카니즘을 이용하여 이전에 번역된 단어 "out"를 선택하고 "outside"로 변경할 수 있다. 이후에, 개인 보조 패널(220)은 변경된 사용자 문장(310)에 따라 갱신된 복수의 동작 제안(320(A) 및 (B))을 이용하여 갱신될 수 있다.
도 4는 강화된 대화 이해 아키텍처를 제공하는 본 발명의 실시예에 관한 방법(400)의 일반적인 단계를 보여주는 플로우차트이다. 방법(400)은 도 4와 관련하여 이하에서 더 상세히 설명되는 바와 같이 컴퓨팅 장치(500)를 사용하여 구현될 수 있다. 방법(400)의 단계들을 구현하는 방식은 이하에서 더 상세히 다루어질 것이다. 방법(400)은 시작 블록(405)에서 시작하여 컴퓨팅 장치(500)가 동작 요청을 수신하는 단계(410)로 나아갈 수 있다. 예컨대, SDS(110)는 사용자 장치(130)로부터 사용자 구어 쿼리(user's spoken query)인 "외식할 장소를 찾음(find a place to eat)"을 포함하는 요청을 수신할 수 있다.
방법(400)은 컴퓨팅 장치(500)가 사용자와 연관되는 컨텍스트 상태를 수집하는 단계(415)로 이어진다. 이러한 컨텍스트 상태는 예를 들어 사용자와 연관된 역할, 적어도 하나의 이전 사용자 목적, 적어도 하나의 이전 사용자 동작 요청, 사용자 위치, 시간, 날짜, 사용자로부터의 제1 동작 요청에 대한 데이터 유형, 및/또는 이전 사용자 동작 요청들에 대한 데이터 카테고리 등을 포함할 수 있다. 이러한 정보는 SDS(110)의 컨텍스트 데이터베이스(116)에 저장될 수 있다.
방법(400)은 컴퓨팅 장치(500)가 상기 컨텍스트 상태에 따라 복수의 목적을 생성하는 단계(420)로 이어진다. 예를 들어, SDS는 쿼리 "외식할 장소를 찾음(find a place to eat)"와 연관되는 범위로 "식당(dining)"을 식별할 수 있다. 그 결과, 사용자의 위치에 따라 근처 레스토랑을 찾는 것 및/또는 대화에 연관된 사용자들의 수에 따라 예약을 하는 것과 같은 목적이 생성될 수 있다.
방법(400)은 컴퓨팅 장치(500)가 상기 컨텍스트 상태에 따라 요청된 동작을 수행하는 단계(425)로 이어진다. 예컨대, 사용자 쿼리 "외식할 장소를 찾음(find a place to eat)"에 응답하여 번역기 모듈(114)은 검색 에이전트(118)가 사용자에 대한 근처 레스토랑을 검색하도록 명령할 수 있다. 이러한 검색 결과는 개인 보조 프로그램(112)에 의해 사용자 장치(130)로 전송될 수 있고 예컨대 인터페이스(220)의 개인 보조 패널(220)에 디스플레이될 수 있다.
방법(400)은 컴퓨팅 장치(500)가 상기 컨텍스트 상태를 갱신하는 단계(430)로 이어진다. 예를 들어, 복수의 동작 제안(240(a) 내지 (c))을 포함하는 선택들 중 현재 선택은 사용자 컨텍스트 상태에서 예측되는 확률에 연관된다. 사용자의 다음 동작은 이후의 쿼리의 적용을 위한 예측된 확률을 조정하기 위해 이용될 수 있다.
방법(400)은 컴퓨팅 장치(500)가 다음 요청된 동작이 현재 목적을 달성하는데 관련있는지를 판정하는 단계(435)로 이어진다. 예컨대, SDS(110)는 사용자 컨텍스트 상태를 현재 목적과 연관된 복수의 사용자 컨텍스트 상태와 비교할 수 있다. 동일한 동작/쿼리를 등록했던 이전 사용자들은 유사한 다음 동작을 취했을 수 있으나 이번 단계에서 사용자의 다른 동작은 잘못된 목적이 예측되었었음을 나타낼 수도 있다. 만약 사용자의 다음 동작이 예측했던 목적과 맞지 않은 경우, 방법(400)은 새로운 목적들의 집합을 생성하는 단계(420)로 돌아갈 수 있다.
이와 달리, 방법(400)은 컴퓨팅 장치(500)가 예측된 목적이 완수되는지를 판정하는 단계로 이어질 수 있다. 예를 들어, SDS(110)가 요청되는 동작을 수신하여 식당 예약 및 택시 배정을 완수하는 경우, 식사 계획의 목적은 완수되었다고 판정될 수 있고 방법(400)이 단계(442)로 이어져 종료될 수 있다. 만약 동작이 예약할 레스토랑의 선택은 포함하고 시간 선택은 포함하지 않는 경우, 예측된 목적이 완료되지 않은 것으로 판정될 수 있다.
만약 단계(440)에서, 예측된 목적이 완수되지 않은 경우, 방법(400)은 컴퓨팅 장치(500)가 다음 제안되는 동작을 제공하는 단계(445)로 이어질 수 있다. 예컨대, 레스토랑은 선택되고 시간은 선택되지 않은 경우, 개인 보조 프로그램(112)은 사용자로부터 예약 시간을 요청할 수 있다.
방법(400)은 컴퓨팅 장치(500)가 사용자로부터 다음 동작을 수신하는 단계(450)로 이어질 수 있다. 예를 들어, 사용자는 예약 시간에 대해 7시의 선택을 입력하고 이를 SDS(110)로 전달할 수 있다. 그 후, 방법(400)은 단계(425)로 돌아갈 수 있고, 앞서 기술된 다음 요청 동작을 수행할 수 있다.
본 발명에 따르는 실시예는 컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템을 포함할 수 있다. 상기 시스템은 메모리 저장소 및 상기 메모리 저장소와 연결된 프로세싱 유닛을 포함할 수 있다. 상기 프로세싱 유닛은 사용자로부터 자연어 구절을 수신하고, 이러한 자연어 구절을 검색 구절로 번역하고, 검색 구절에 따라 검색 동작을 수행하도록 동작할 수 있다. 상기 자연어 구절은, 예컨대, 복수의 텍스트 단어 및/또는 오디오 스트림으로서 수신될 수 있다. 상기 검색 구절은 상기 자연어 구절에는 포함되어 있지 않은 적어도 하나 이상의 문맥적 의미 개념(contextual semantic concept)을 포함할 수 있다. 상기 프로세싱 유닛은 상기 검색 동작에 따라 복수의 검색 결과를 수신하고 이러한 복수의 검색 결과를 사용자에게 제공하도록 더 동작할 수 있다. 상기 프로세싱 유닛은 상기 복수의 결과를 복수의 사용자들에게 제공하도록 더 동작할 수 있다. 상기 자연어 구절은, 예컨대, 복수의 사용자들 사이의 대화로부터 도출될 수 있다. 상기 프로세싱 유닛은 복수의 API(application programming interfaces)를 분석하고 상기 복수의 API 각각에 대한 적어도 하나 이상의 요청 파라미터를 식별하도록 동작할 수 있다. 상기 복수의 API는 웹 사이트 검색 기능과 각각 연관될 수 있다. 자연어 구절을 검색 구절로 번역하는 동작은 상기 프로세싱 유닛이 상기 자연어 구절과 관련된 컨텍스트를 식별하고, 복수의 API 중 적어도 하나가 상기 식별된 컨텍스트와 연관되는지 판정하며, 그러한 경우, 자연어 구절의 적어도 하나 이상의 단어를 상기 복수의 API 중 적어도 하나와 연관되는 요청 파라미터로 번역하는 동작을 포함할 수 있다. 검색 동작을 수행하는 것은 상기 프로세싱 유닛이 상기 적어도 하나의 요청 파라미터로 상기 적어도 하나의 API를 호출하는 것을 포함할 수 있다.
본 발명에 따르는 또 다른 실시예는 컨텍스트 인식 환경을 제공하기 위한 시스템을 포함할 수 있다. 상기 시스템은 메모리 저장소 및 상기 메모리 저장소와 연결된 프로세싱 유닛을 포함할 수 있다. 상기 프로세싱 유닛은 사용자로부터 자연어 구절을 수신하고, 상기 자연어 구절과 연관된 컨텍스트 상태를 생성하고, 상기 자연어 구절을 실행가능한 동작으로 번역하며, 식별된 컨텍스트에 따라서 실행가능한 동작과 연관되는 영역(domain)을 식별하고, 식별된 영역 내에서 실행가능한 동작을 수행하도록 동작할 수 있다. 상기 실행가능한 동작은, 예컨대, 검색 동작, 데이터 생성 동작, 데이터 수정 동작 및 통신 동작을 포함할 수 있다. 상기 프로세싱 유닛은 하나 이상의 제안된 다음 동작을 사용자에게 제공하도록 더 동작할 수 있다. 상기 프로세싱 유닛은 제2 자연어 구절을 사용자로부터 수신하고, 상기 제2 자연어 구절이 상기 하나 이상의 제안된 다음 동작과 연관되는지 판정하고, 그러한 경우, 상기 하나 이상의 제안된 다음 동작을 수행하도록 동작할 수 있다. 상기 제2 자연어 구절이 상기 하나 이상의 제안된 다음 동작과 연관되지 않는다고 판정되는 것에 응답하여 상기 프로세싱 유닛은 하나 이상의 제2 제안된 다음 동작을 사용자에게 제공하도록 동작할 수 있다. 상기 프로세싱 유닛은 상기 제2 자연어 구절에 따라서 상기 컨텍스트 상태를 갱신하도록 더 동작할 수 있다.
본 발명에 따르는 또 다른 실시예는 컨텍스트 인식 환경을 제공하기 위한 시스템을 포함할 수 있다. 상기 시스템은 메모리 저장소 및 상기 메모리 저장소와 연결된 프로세싱 유닛을 포함할 수 있다. 상기 프로세싱 유닛은 복수의 목적을 생성하고, 사용자와 연관된 컨텍스트 상태를 수집하며, 상기 컨텍스트 상태에 따라서 상기 복수의 목적들 중 적어도 하나와 연관되는 제안된 동작을 제공하고, 사용자로부터 동작 요청을 수신하며, 상기 컨텍스트 상태에 따라 요청된 동작을 실행하고, 동작이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관되는지를 판정하도록 동작할 수 있다. 상기 동작이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관된다고 판정하는 것에 응답하여, 상기 프로세싱 유닛은 컨텍스트 상태를 갱신하고, 제안된 동작과 연관되는 확률을 갱신하며, 상기 컨텍스트 상태가 상기 복수의 목적 중 완수된 목적을 포함하는지 판정하도록 동작할 수 있다. 상기 컨텍스트 상태가 완수된 목적을 포함하지 않는다고 판정되는 것에 응답하여, 상기 프로세싱 유닛은 적어도 하나 이상의 제2 제안 동작을 제공하도록 동작할 수 있다.
컨텍스트 상태는, 예컨대, 사용자와 관련된 역할, 적어도 하나 이상의 이전 사용자 목적, 적어도 하나 이상의 이전 사용자 동작 요청, 사용자의 위치, 시간, 날짜, 사용자로부터의 제1 동작 요청과 관련된 카테고리, 사용자로부터의 제1 동작 요청과 연관된 데이터 유형, 및 이전 사용자 동작 요청들과 연관된 데이터 카테고리를 포함할 수 있다. 컨텍스트 상태가 하나 이상의 예측된 목적을 성취하는 것과 관련있는지를 판정하는 동작은 프로세싱 유닛이 컨텍스트 상태를 복수의 목적들 중 적어도 하나와 각각 연관되는 복수의 사용자 컨텍스트 상태들과 비교하는 동작을 포함할 수 있다.
도 5는 컴퓨팅 장치(500)를 포함하는 시스템의 블록도이다. 본 발명의 실시예들에 따라, 전술한 메모리 저장소 및 처리 장치는 도 5의 컴퓨팅 장치(500)와 같은 컴퓨팅 장치에 구현될 수 있다. 메모리 저장소 및 처리 장치를 구현하기 위해 하드웨어, 소프트웨어, 또는 펌웨어의 임의의 적합한 조합이 이용될 수 있다. 예를 들면, 메모리 저장소 및 처리 장치는 컴퓨팅 장치(500)로 또는 다른 컴퓨팅 장치들(518) 중 임의의 것을 컴퓨팅 장치(500)와 조합하여 구현될 수 있다. 전술한 시스템, 장치, 및 프로세서들은 예시들이고 다른 시스템들, 장치들, 및 프로세서들이 본 발명의 실시예들에 따른 전술한 메모리 저장소 및 처리 장치를 포함할 수 있다. 또한, 컴퓨팅 장치(500)는 위에 설명된 시스템(100)을 위한 운영 환경을 포함할 수 있다. 시스템(100)은 다른 환경들에서 동작할 수 있고 컴퓨팅 장치(500)에 제한되지 않는다.
도 5에 관련하여, 본 발명의 실시예에 따른 시스템은 컴퓨팅 장치(500)와 같은 컴퓨팅 장치를 포함할 수 있다. 기본 구성으로, 컴퓨팅 장치(500)는 적어도 하나의 처리 장치(502) 및 시스템 메모리(504)를 포함할 수 있다. 컴퓨팅 장치의 구성 및 유형에 따라서, 시스템 메모리(504)는 휘발성(예를 들면, RAM(random access memory)), 비휘발성(예를 들면, ROM(read-only memory)), 플래시 메모리, 또는 임의의 조합을 포함할 수 있지만, 이에 제한되는 것은 아니다. 시스템 메모리(504)는 운영 체제(505), 하나 이상의 프로그래밍 모듈들(506), 및 개인 보조 프로그램(112)을 포함할 수 있다. 운영 체제(505)는, 예를 들면, 컴퓨팅 장치(500)의 동작을 제어하기에 적합할 수 있다. 또한, 본 발명의 실시예들은 그래픽 라이브러리, 기타 운영 체제들, 또는 임의의 다른 애플리케이션 프로그램과 함께 실시될 수 있고 임의의 특정한 애플리케이션 또는 시스템에 제한되지 않는다. 이 기본 구성은 도 5에서 대시 선(508) 내의 컴포넌트들에 의해 예시되어 있다.
컴퓨팅 장치(500)는 추가적인 특징들 또는 기능을 가질 수 있다. 예를 들면, 컴퓨팅 장치(500)는 또한, 예를 들면, 자기 디스크, 광 디스크, 또는 테이프와 같은 추가적인 데이터 저장 장치들(이동식 및/또는 비이동식)을 포함할 수 있다. 그러한 추가적인 저장소는 도 5에서 이동식 저장소(509) 및 비이동식 저장소(510)에 의해 예시되어 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위해 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성, 이동식 및 비이동식 매체를 포함할 수 있다. 시스템 메모리(504), 이동식 저장소(509), 및 비이동식 저장소(510)는 모두 컴퓨터 저장 매체 예들(즉, 메모리 저장소)이다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM(electrically erasable read-only memory), 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital versatile disk) 또는 기타 광 저장소, 자기 카세트, 자기 테이프, 자기 디스크 저장소 또는 기타 자기 저장 장치, 또는 컴퓨팅 장치(500)에 의해 액세스될 수 있고 정보를 저장하는 데 이용될 수 있는 임의의 다른 매체를 포함할 수 있지만 이에 제한되는 것은 아니다. 임의의 그러한 컴퓨터 저장 매체는 장치(500)의 일부일 수 있다. 컴퓨팅 장치(500)는 또한 키보드, 마우스, 펜, 사운드 입력 장치, 터치 입력 장치 등과 같은 입력 장치(들)(512)를 가질 수 있다. 디스플레이, 스피커, 프린터 등과 같은 출력 장치(들)(514)도 포함될 수 있다. 전술한 장치들은 예시들이고 다른 것들이 사용될 수 있다.
컴퓨팅 장치(500)는 또한 장치(500)가 분산 컴퓨팅 환경의 네트워크, 예를 들면, 인트라넷 또는 인터넷을 통하여 다른 컴퓨팅 장치(518)와 통신하게 할 수 있는 통신 커넥션(516)을 포함할 수 있다. 통신 커넥션(516)은 통신 매체의 일례이다. 통신 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 변조된 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 기타 데이터에 의해 구현될 수 있고, 임의의 정보 전달 매체를 포함한다. "변조된 데이터 신호"라는 용어는, 신호 내에 정보를 암호화하도록 그 신호의 하나 이상의 특성을 설정 또는 변경시킨 신호를 묘사할 수 있다. 예로서, 통신 매체는 유선 네트워크 또는 다이렉트 유선 연결과 같은 유선 매체, 및 음향, RF(radio frequency), 적외선, 및 기타 무선 매체와 같은 무선 매체를 포함할 수 있다. 여기에 사용된 컴퓨터 판독가능 매체는 저장 매체 및 통신 매체 둘 다를 포함할 수 있다.
전술한 바와 같이, 운영 체제(505)를 포함하여, 다수의 프로그램 모듈들 및 데이터 파일들이 시스템 메모리(504)에 저장될 수 있다. 처리 장치(502)에서 실행하는 동안, 프로그램 모듈들(506)(예를 들면, 개인 보조 프로그램(112))은, 예를 들면, 위에 설명된 방법(400)의 단계들 중 하나 이상의 단계들을 포함하는 프로세스들을 수행할 수 있다. 전술한 프로세스는 예시이고, 처리 장치(502)는 다른 프로세스들을 수행할 수 있다. 본 발명의 실시예들에 따라 사용될 수 있는 다른 프로그램 모듈들은 전자 메일 및 콘택트 애플리케이션, 워드 프로세싱 애플리케이션, 스프레드시트 애플리케이션, 데이터베이스 애플리케이션, 슬라이드 프리젠테이션 애플리케이션, 그림 또는 컴퓨터 지원(computer-aided) 애플리케이션 프로그램 등을 포함할 수 있다.
일반적으로, 본 발명의 실시예들에 따라, 프로그램 모듈들은 특정 태스크를 수행할 수 있는 또는 특정 추상 데이터 유형을 구현할 수 있는 루틴, 프로그램, 컴포넌트, 데이터 구조, 및 다른 구조 유형들을 포함할 수 있다. 또한, 본 발명의 실시예들은 핸드헬드 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 또는 프로그램 가능한 소비자 전자 장치, 미니컴퓨터, 메인프레임 컴퓨터 등을 포함하는 다른 컴퓨터 시스템 구성들과 함께 실시될 수 있다. 본 발명의 실시예들은 또한 통신 네트워크를 통해 링크된 원격 처리 장치들에 의해 태스크가 수행되는 분산 컴퓨팅 환경에서 실행될 수도 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 메모리 저장 장치 및 원격 메모리 저장 장치 둘 다에 위치할 수 있다.
또한, 본 발명의 실시예들은 개별 전자 엘리먼트들, 논리 게이트들을 포함하는 패키징된 또는 집적된 전자 칩, 마이크로프로세서를 이용하는 회로에서, 또는 전자 엘리먼트들 또는 마이크로프로세서들을 포함하는 단일 칩에서 실시될 수 있다. 본 발명의 실시예들은 또한, 기계, 광학, 유체 공학, 및 양자 기술들을 포함하되 이에 제한되지 않는, 예를 들면, AND, OR, 및 NOT과 같은 논리 연산들을 수행할 수 있는 다른 기술들을 사용하여 실시될 수 있다. 또한, 본 발명의 실시예들은 범용 컴퓨터 내에서 또는 임의의 다른 회로들 또는 시스템들에서 실시될 수 있다.
본 발명의 실시예들은, 예를 들면, 컴퓨터 프로세스(방법), 컴퓨팅 시스템으로서, 또는 컴퓨터 프로그램 제품 또는 컴퓨터 판독가능 매체와 같은 제조물로서 구현될 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 시스템에 의해 판독가능하고 컴퓨터 프로세스를 실행하기 위한 명령어들의 컴퓨터 프로그램을 인코딩하는 컴퓨터 저장 매체일 수 있다. 컴퓨터 프로그램 제품은 또한 컴퓨팅 시스템에 의해 판독가능하고 컴퓨터 프로세스를 실행하기 위한 명령어들의 컴퓨터 프로그램을 인코딩하는 반송파 상의 전파 신호일 수 있다. 따라서, 본 발명은 하드웨어로 및/또는 (펌웨어, 상주 소프트웨어, 마이크로코드 등을 포함하는) 소프트웨어로 구현될 수 있다. 즉, 본 발명의 실시예들은 명령 실행 시스템에 의해 또는 그와 관련하여 사용하기 위한 컴퓨터 사용가능 또는 컴퓨터 판독가능 프로그램 코드가 구현되어 있는 컴퓨터 사용가능 또는 컴퓨터 판독가능 저장 매체 상의 컴퓨터 프로그램 제품의 형태를 취할 수 있다. 컴퓨터 사용가능 또는 컴퓨터 판독가능 매체는 명령 실행 시스템, 장치, 또는 디바이스에 의해 또는 그와 관련하여 사용하기 위한 프로그램을 포함하고, 저장하고, 통신하고, 전파하고, 또는 전송할 수 있는 임의의 매체일 수 있다.
컴퓨터 사용가능 또는 컴퓨터 판독가능 매체는, 예를 들면, 전자, 자기, 광학, 전자기, 적외선, 또는 반도체 시스템, 장치, 디바이스, 또는 전파 매체일 수 있지만 이에 제한되는 것은 아니다. 더 구체적인 컴퓨터 판독가능 매체 예시들(총망라하지 않은 목록)로서, 컴퓨터 판독가능 매체는 하나 이상의 와어어를 갖는 전기 연결, RAM(random access memory), ROM(read-only memory), EPROM(erasable programmable read-only memory) 또는 플래시 메모리, 광섬유, 및 휴대용 CD-ROM(compact disc read-only memory)을 포함할 수 있다. 컴퓨터 사용가능 또는 판독가능 매체는 프로그램이 인쇄되어 있는 종이 또는 다른 적합한 매체일 수도 있는데, 이는 프로그램은, 예를 들면, 그 종이 또는 다른 매체의 광학 스캐닝을 통해 전자적으로 캡처될 수 있고, 그 후, 필요하다면, 적합한 방식으로 컴파일되거나, 인터프리트되거나, 또는 다른 식으로 처리되고, 그 후 컴퓨터 메모리에 저장될 수 있기 때문이다.
본 발명의 실시예들은, 예를 들면, 본 발명의 실시예들에 따른 방법들, 시스템들, 및 컴퓨터 프로그램 제품들의 블록도들 및/또는 동작 예시들에 관련하여 위에 설명되어 있다. 블록들에 기재된 기능들/동작들은 임의의 순서도에서 나타내어진 순서와 다르게 행해질 수 있다. 예를 들면, 연속하여 나타내어진 2개의 블록들은 사실 실질적으로 동시에 실행될 수도 있고 또는 그 블록들은, 수반된 기능/동작들에 따라서, 때때로 역순으로 실행될 수도 있다.
본 발명의 특정한 실시예들이 설명되었지만, 다른 실시예들이 존재할 수 있다. 또한, 본 발명의 실시예들은 메모리 및 기타 저장 매체들에 저장된 데이터와 관련되는 것으로 설명되었지만, 데이터는 또한 하드 디스크, 플로피 디스크, 또는 CD-ROM과 같은 보조 저장 장치들, 인터넷으로부터의 반송파, 또는 RAM 또는 ROM의 다른 형태들과 같은, 다른 유형의 컴퓨터 판독가능 매체 상에 저장되거나 그로부터 판독될 수도 있다. 또한, 개시된 방법들의 단계들은, 본 발명에서 벗어나지 않고, 단계들을 재정리하는 것 및/또는 단계들을 삽입하거나 삭제하는 것을 포함하여, 임의의 방식으로 수정될 수 있다.
여기에 포함된 코드 내의 저작권을 포함한 모든 권리들은 출원인에 귀속되고 출원인의 재산이다. 출원인은 여기에 포함된 코드 내의 모든 권리들을 보유 및 유보하고, 허여된 특허의 복제와 관련해서만 자료를 복제하는 허가를 부여하고 이외의 어떤 다른 목적에 대해서도 허가를 부여하지 않는다.
본 명세서는 예시들을 포함하지만, 본 발명의 범위는 다음의 청구항들에 의해 지시된다. 또한, 본 명세서는 구조적 특징들 및/또는 방법적 동작들에 특정한 언어로 설명되었지만, 청구항들은 위에 설명된 특징들 또는 동작들에 제한되지 않는다. 오히려, 위에 설명된 그 특정한 특징들 및 동작들은 본 발명의 실시예들에 대한 예시들로서 개시된다.

Claims (11)

  1. 강화된 대화 이해 아키텍처(augmented conversational understanding architecture)를 제공하기 위한 컴퓨터-구현 방법으로서,
    사용자로부터 동작 요청(action request)을 포함하는 자연어 구절(natural language phrase)을 수신하는 단계;
    상기 동작 요청에 기초하여 상기 사용자와 연관된 컨텍스트 상태(context state)를 판정하는 단계 - 상기 컨텍스트 상태는 동적으로 판정된 상기 사용자의 현재 위치와 상기 사용자와 연관된 역할 중 적어도 하나를 포함함 - ;
    상기 컨텍스트 상태에 기초하여 하나 이상의 목적들을 판정하는 단계;
    상기 하나 이상의 목적들에 기초하여 복수의 선택가능한 제안된 동작들을 도출하는 단계 - 상기 복수의 선택가능한 제안된 동작들은 상기 동작 요청에 관련된 복수의 사용자 활동을 포함함 - ; 및
    상기 복수의 선택가능한 동작들을 상기 사용자에게 디스플레이하는 단계를 포함하는
    컴퓨터-구현 방법.
  2. 제1항에 있어서,
    상기 방법은
    상기 자연어 구절을 검색 구절로 번역하는 단계를 더 포함하고,
    상기 검색 구절은 하나 이상의 의미 개념(semantic concept)을 포함하는,
    컴퓨터-구현 방법.
  3. 제2항에 있어서,
    상기 하나 이상의 의미 개념은 상기 자연어 구절에 포함되어 있지 않은 단어를 포함하는,
    컴퓨터-구현 방법.
  4. 제1항에 있어서,
    상기 자연어 구절을 검색 구절로 번역하는 단계;
    상기 검색 구절에 따라 검색 동작을 수행하는 단계 - 상기 검색 구절에 따라 검색 동작을 수행하는 단계는 상기 자연어 구절을 온톨로지(ontology)의 적어도 하나의 노드로 매핑하는 것을 포함하며, 상기 온톨로지는 복수의 검색 엔진 결과와 연관된 데이터를 포함함 - ;
    상기 검색 동작에 따라 복수의 검색 결과를 수신하는 단계;
    상기 복수의 검색 결과를 상기 사용자에게 제공하는 단계; 및
    상기 복수의 검색 결과를 복수의 사용자들에게 제공하는 단계 - 상기 자연어 구절은 상기 복수의 사용자들 사이의 대화(conversation)로부터 도출됨 -
    를 더 포함하는,
    컴퓨터-구현 방법.
  5. 제1항에 있어서,
    복수의 API(application programming interfaces)들을 분석하는 단계 - 상기 복수의 API 각각은 웹 사이트 검색 기능과 연관됨 -; 및
    상기 복수의 API 각각에 대한 하나 이상의 요청 파라미터(required parameter)를 식별하는 단계
    를 더 포함하는,
    컴퓨터-구현 방법.
  6. 실행될 때 시스템의 프로세싱 유닛으로 하여금 강화된 대화 이해 아키텍처를 제공하기 위한 방법을 수행하게 하는 명령어들의 집합을 저장하는 컴퓨터 판독가능한 저장 매체로서,
    상기 방법은
    사용자로부터 동작 요청을 포함하는 자연어 구절을 수신하는 단계;
    상기 동작 요청에 기초하여 상기 자연어 구절과 연관된 컨텍스트 상태(context state)를 생성하는 단계 - 상기 컨텍스트 상태는 동적으로 판정된 상기 사용자의 현재 위치, 이전에 식별된 사용자 목적, 상기 사용자와 연관된 역할 중 적어도 하나를 포함함 - ;
    상기 컨텍스트 상태에 기초하여 하나 이상의 현재 목적들을 판정하는 단계;
    상기 자연어 구절을 실행가능한 동작으로 번역하는 단계;
    상기 컨텍스트 상태에 따라 상기 실행가능한 동작과 연관된 영역(domain)을 식별하는 단계;
    상기 하나 이상의 현재 목적들에 기초하여 복수의 제안된 다음 동작들을 제공하는 단계 - 상기 복수의 제안된 다음 동작들은 선택가능하며 상기 컨텍스트 상태 및 상기 동작 요청에 기초하는 복수의 사용자 행동을 포함함 - ; 및
    상기 식별된 영역 내에서 상기 실행가능한 동작을 수행하는 단계
    를 포함하는,
    컴퓨터 판독가능한 저장 매체.
  7. 제6항에 있어서,
    상기 방법은
    상기 사용자로부터 제2 자연어 구절을 수신하는 단계;
    상기 제2 자연어 구절이 상기 복수의 제안된 다음 동작들 중 적어도 하나와 연관되는지를 판정하는 단계; 및
    상기 제2 자연어 구절이 상기 복수의 제안된 다음 동작들 중 적어도 하나와 연관된다고 판정되는 것에 응답하여, 상기 복수의 제안된 다음 동작들 중 적어도 하나를 수행하는 단계
    를 더 포함하는,
    컴퓨터 판독가능한 저장 매체.

  8. 제7항에 있어서,
    상기 방법은
    상기 제2 자연어 구절이 상기 복수의 제안된 다음 동작들과 연관되지 않는다고 판정되는 것에 응답하여, 하나 이상의 제2의 제안된 다음 동작을 상기 사용자에게 제공하는 단계를 더 포함하는,
    컴퓨터 판독가능한 저장 매체.
  9. 제8항에 있어서,
    상기 방법은
    상기 제2 자연어 구절에 따라 상기 컨텍스트 상태를 갱신하는 단계를 더 포함하는,
    컴퓨터 판독가능한 저장 매체.
  10. 컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템에 있어서,
    상기 시스템은
    메모리 저장소; 및
    상기 메모리 저장소와 연결된 프로세싱 유닛을 포함하고,
    상기 프로세싱 유닛은
    사용자로부터 동작 요청을 수신하는 단계,
    상기 사용자와 연관된 컨텍스트 상태를 수집하는 단계 - 상기 컨텍스트 상태는 상기 사용자와 관련된 역할, 적어도 하나 이상의 이전 사용자 목적, 적어도 하나 이상의 이전 사용자 동작 요청, 상기 사용자의 위치, 시간, 날짜, 상기 사용자로부터의 제1 동작 요청과 관련된 카테고리, 상기 사용자로부터의 제1 동작 요청과 연관된 데이터 유형, 및 이전 사용자 동작 요청들과 연관된 데이터 카테고리 중 적어도 하나 이상을 포함함 -,
    상기 컨텍스트 상태에 따라 복수의 목적들을 생성하는 단계;
    상기 컨텍스트 상태에 따라 상기 요청된 동작을 수행하는 단계;
    상기 요청된 동작이 상기 복수의 목적들 중 적어도 하나를 성취하는 것과 연관되는지를 판정하는 단계 - 상기 요청된 동작이 상기 복수의 목적들 중 적어도 하나를 성취하는 것과 연관되는지를 판정하는 것은 상기 컨텍스트 상태를 상기 복수의 목적들 중 상기 적어도 하나와 각각 연관되는 복수의 사용자 컨텍스트 상태와 비교하는 것을 포함함 -;
    상기 요청된 동작이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관있다고 판정하는 것에 응답하여, 상기 컨텍스트 상태를 갱신하는 단계;
    상기 컨텍스트 상태가 상기 복수의 목적들 중 완수된 목적을 포함하는지를 판정하는 단계; 및
    상기 컨텍스트 상태가 상기 완수된 목적을 포함하지 않는다는 판정에 응답하여 제안된 다음 동작을 제공하는 단계
    를 수행하도록 동작하는,
    컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템.
  11. 컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템에 있어서,
    상기 시스템은
    메모리 저장소; 및
    상기 메모리 저장소와 연결된 프로세싱 유닛을 포함하고,
    상기 프로세싱 유닛은
    사용자로부터 동작 요청을 수신하는 단계;
    상기 사용자와 연관된 컨텍스트 상태를 수집하는 단계 - 상기 컨텍스트 상태는 상기 동작 요청, 동적으로 판정된 상기 사용자의 위치 및 이전 사용자들과 연관된 데이터에 적어도 부분적으로 기초함 -;
    상기 컨텍스트 상태에 따라 복수의 목적들을 생성하는 단계 - 상기 복수의 목적들은 상기 사용자로부터의 상기 동작 요청 내의 복수의 용어(terms)에 기초한 복수의 사용자 활동들을 포함함 -;
    상기 컨텍스트 상태에 따라 상기 동작 요청을 수행하는 단계;
    상기 동작 요청이 상기 복수의 목적들 중 적어도 하나를 성취하는 것과 연관되는지를 판정하도록, 상기 컨텍스트 상태를 각각이 복수의 목적들과 연관되는 복수의 사용자 컨텍스트 상태들과 비교하는 단계;
    상기 동작 요청이 상기 복수의 목적들 중 상기 적어도 하나를 성취하는 것과 연관있다고 판정하는 것에 응답하여, 상기 컨텍스트 상태를 갱신하는 단계;
    상기 컨텍스트 상태가 상기 복수의 목적들 중 완수된 목적을 포함하는지를 판정하는 단계; 및
    상기 컨텍스트 상태가 상기 완수된 목적을 포함하지 않는다는 판정에 응답하여 제안된 다음 동작을 제공하는 단계
    를 수행하도록 동작하는,
    컨텍스트 인식 환경(context-aware environment)을 제공하기 위한 시스템.
KR1020137025586A 2011-03-31 2012-03-27 강화된 대화 이해 아키텍처 KR101963915B1 (ko)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US13/076,862 2011-03-31
US13/077,431 2011-03-31
US13/077,455 2011-03-31
US13/077,396 US9842168B2 (en) 2011-03-31 2011-03-31 Task driven user intents
US13/077,455 US9244984B2 (en) 2011-03-31 2011-03-31 Location based conversational understanding
US13/076,862 US9760566B2 (en) 2011-03-31 2011-03-31 Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US13/077,396 2011-03-31
US13/077,303 2011-03-31
US13/077,368 US9298287B2 (en) 2011-03-31 2011-03-31 Combined activation for natural user interface systems
US13/077,368 2011-03-31
US13/077,303 US9858343B2 (en) 2011-03-31 2011-03-31 Personalization of queries, conversations, and searches
US13/077,233 US20120253789A1 (en) 2011-03-31 2011-03-31 Conversational Dialog Learning and Correction
US13/077,431 US10642934B2 (en) 2011-03-31 2011-03-31 Augmented conversational understanding architecture
US13/077,233 2011-03-31
PCT/US2012/030751 WO2012135226A1 (en) 2011-03-31 2012-03-27 Augmented conversational understanding architecture

Publications (2)

Publication Number Publication Date
KR20140025362A KR20140025362A (ko) 2014-03-04
KR101963915B1 true KR101963915B1 (ko) 2019-03-29

Family

ID=46931884

Family Applications (3)

Application Number Title Priority Date Filing Date
KR20137025578A KR20140014200A (ko) 2011-03-31 2012-03-27 구어체 대화 학습 및 정정
KR1020137025586A KR101963915B1 (ko) 2011-03-31 2012-03-27 강화된 대화 이해 아키텍처
KR1020137025540A KR101922744B1 (ko) 2011-03-31 2012-03-27 위치-기반 대화 해석 기법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR20137025578A KR20140014200A (ko) 2011-03-31 2012-03-27 구어체 대화 학습 및 정정

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020137025540A KR101922744B1 (ko) 2011-03-31 2012-03-27 위치-기반 대화 해석 기법

Country Status (5)

Country Link
EP (6) EP2691885A4 (ko)
JP (4) JP6105552B2 (ko)
KR (3) KR20140014200A (ko)
CN (8) CN106383866B (ko)
WO (7) WO2012135229A2 (ko)

Families Citing this family (205)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10032127B2 (en) 2011-02-18 2018-07-24 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2014025990A1 (en) 2012-08-10 2014-02-13 Nuance Communications, Inc. Virtual agent communication for electronic devices
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
EP2946322A1 (en) * 2013-03-01 2015-11-25 Nuance Communications, Inc. Methods and apparatus for determining a clinician's intent to order an item
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9436287B2 (en) * 2013-03-15 2016-09-06 Qualcomm Incorporated Systems and methods for switching processing modes using gestures
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9728184B2 (en) 2013-06-18 2017-08-08 Microsoft Technology Licensing, Llc Restructuring deep neural network acoustic models
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9589565B2 (en) * 2013-06-21 2017-03-07 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US20150170053A1 (en) * 2013-12-13 2015-06-18 Microsoft Corporation Personalized machine learning models
CN104714954A (zh) * 2013-12-13 2015-06-17 中国电信股份有限公司 基于上下文理解的信息搜索方法和系统
US10534623B2 (en) 2013-12-16 2020-01-14 Nuance Communications, Inc. Systems and methods for providing a virtual assistant
US10015770B2 (en) 2014-03-24 2018-07-03 International Business Machines Corporation Social proximity networks for mobile phones
US9529794B2 (en) 2014-03-27 2016-12-27 Microsoft Technology Licensing, Llc Flexible schema for language model customization
US20150278370A1 (en) * 2014-04-01 2015-10-01 Microsoft Corporation Task completion for natural language input
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9355640B2 (en) * 2014-06-04 2016-05-31 Google Inc. Invoking action responsive to co-presence determination
US9717006B2 (en) 2014-06-23 2017-07-25 Microsoft Technology Licensing, Llc Device quarantine in a wireless network
JP6275569B2 (ja) * 2014-06-27 2018-02-07 株式会社東芝 対話装置、方法およびプログラム
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9582482B1 (en) 2014-07-11 2017-02-28 Google Inc. Providing an annotation linking related entities in onscreen content
US10146409B2 (en) * 2014-08-29 2018-12-04 Microsoft Technology Licensing, Llc Computerized dynamic splitting of interaction across multiple content
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
KR102188268B1 (ko) * 2014-10-08 2020-12-08 엘지전자 주식회사 이동단말기 및 그 제어방법
CN107003723A (zh) 2014-10-21 2017-08-01 罗伯特·博世有限公司 用于会话系统中的响应选择和组成的自动化的方法和系统
KR102329333B1 (ko) * 2014-11-12 2021-11-23 삼성전자주식회사 질의를 처리하는 장치 및 방법
US9836452B2 (en) 2014-12-30 2017-12-05 Microsoft Technology Licensing, Llc Discriminating ambiguous expressions to enhance user experience
WO2016112005A1 (en) 2015-01-05 2016-07-14 Google Inc. Multimodal state circulation
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
WO2016129767A1 (ko) * 2015-02-13 2016-08-18 주식회사 팔락성 온라인 사이트 링크방법
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) * 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US9792281B2 (en) * 2015-06-15 2017-10-17 Microsoft Technology Licensing, Llc Contextual language generation by leveraging language understanding
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10249297B2 (en) 2015-07-13 2019-04-02 Microsoft Technology Licensing, Llc Propagating conversational alternatives using delayed hypothesis binding
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
KR20170033722A (ko) * 2015-09-17 2017-03-27 삼성전자주식회사 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
US10262654B2 (en) * 2015-09-24 2019-04-16 Microsoft Technology Licensing, Llc Detecting actionable items in a conversation among participants
US10970646B2 (en) * 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
KR102393928B1 (ko) * 2015-11-10 2022-05-04 삼성전자주식회사 응답 메시지를 추천하는 사용자 단말 장치 및 그 방법
CN108351890B (zh) * 2015-11-24 2022-04-12 三星电子株式会社 电子装置及其操作方法
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
KR102502569B1 (ko) 2015-12-02 2023-02-23 삼성전자주식회사 시스템 리소스 관리를 위한 방법 및 장치
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US9905248B2 (en) 2016-02-29 2018-02-27 International Business Machines Corporation Inferring user intentions based on user conversation data and spatio-temporal data
US9978396B2 (en) 2016-03-16 2018-05-22 International Business Machines Corporation Graphical display of phone conversations
US10587708B2 (en) 2016-03-28 2020-03-10 Microsoft Technology Licensing, Llc Multi-modal conversational intercom
US11487512B2 (en) 2016-03-29 2022-11-01 Microsoft Technology Licensing, Llc Generating a services application
US10158593B2 (en) * 2016-04-08 2018-12-18 Microsoft Technology Licensing, Llc Proactive intelligent personal assistant
US10945129B2 (en) * 2016-04-29 2021-03-09 Microsoft Technology Licensing, Llc Facilitating interaction among digital personal assistants
US10409876B2 (en) * 2016-05-26 2019-09-10 Microsoft Technology Licensing, Llc. Intelligent capture, storage, and retrieval of information for task completion
US10242667B2 (en) * 2016-06-03 2019-03-26 Maluuba Inc. Natural language generation in a spoken dialogue system
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10282218B2 (en) * 2016-06-07 2019-05-07 Google Llc Nondeterministic task initiation by a personal assistant module
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) * 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10216269B2 (en) * 2016-06-21 2019-02-26 GM Global Technology Operations LLC Apparatus and method for determining intent of user based on gaze information
AU2017316661B2 (en) * 2016-08-23 2022-09-08 Illumina, Inc. Semantic distance systems and methods for determining related ontological data
US10446137B2 (en) 2016-09-07 2019-10-15 Microsoft Technology Licensing, Llc Ambiguity resolving conversational understanding system
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10503767B2 (en) * 2016-09-13 2019-12-10 Microsoft Technology Licensing, Llc Computerized natural language query intent dispatching
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US9940390B1 (en) 2016-09-27 2018-04-10 Microsoft Technology Licensing, Llc Control system using scoped search and conversational interface
CN107885744B (zh) 2016-09-29 2023-01-03 微软技术许可有限责任公司 对话式的数据分析
US10535005B1 (en) 2016-10-26 2020-01-14 Google Llc Providing contextual actions for mobile onscreen content
JP6697373B2 (ja) 2016-12-06 2020-05-20 カシオ計算機株式会社 文生成装置、文生成方法及びプログラム
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
EP3552114A4 (en) * 2017-02-08 2020-05-20 Semantic Machines, Inc. NATURAL LANGUAGE CONTENT GENERATOR
US10643601B2 (en) * 2017-02-09 2020-05-05 Semantic Machines, Inc. Detection mechanism for automated dialog systems
EP3563375B1 (en) * 2017-02-23 2022-03-02 Microsoft Technology Licensing, LLC Expandable dialogue system
US10586530B2 (en) 2017-02-23 2020-03-10 Semantic Machines, Inc. Expandable dialogue system
US10798027B2 (en) * 2017-03-05 2020-10-06 Microsoft Technology Licensing, Llc Personalized communications using semantic memory
US10237209B2 (en) * 2017-05-08 2019-03-19 Google Llc Initializing a conversation with an automated agent via selectable graphical element
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10664533B2 (en) * 2017-05-24 2020-05-26 Lenovo (Singapore) Pte. Ltd. Systems and methods to determine response cue for digital assistant based on context
US10679192B2 (en) * 2017-05-25 2020-06-09 Microsoft Technology Licensing, Llc Assigning tasks and monitoring task performance based on context extracted from a shared contextual graph
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10742435B2 (en) * 2017-06-29 2020-08-11 Google Llc Proactive provision of new content to group chat participants
US11132499B2 (en) 2017-08-28 2021-09-28 Microsoft Technology Licensing, Llc Robust expandable dialogue system
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10546023B2 (en) * 2017-10-03 2020-01-28 Google Llc Providing command bundle suggestions for an automated assistant
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US11341422B2 (en) 2017-12-15 2022-05-24 SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system
CN110019718B (zh) * 2017-12-15 2021-04-09 上海智臻智能网络科技股份有限公司 修改多轮问答系统的方法、终端设备以及存储介质
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10839160B2 (en) * 2018-01-19 2020-11-17 International Business Machines Corporation Ontology-based automatic bootstrapping of state-based dialog systems
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
KR102635811B1 (ko) * 2018-03-19 2024-02-13 삼성전자 주식회사 사운드 데이터를 처리하는 시스템 및 시스템의 제어 방법
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10685075B2 (en) * 2018-04-11 2020-06-16 Motorola Solutions, Inc. System and method for tailoring an electronic digital assistant query as a function of captured multi-party voice dialog and an electronically stored multi-party voice-interaction template
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
CN112567621A (zh) 2018-08-29 2021-03-26 松下知识产权经营株式会社 电力转换系统和电力存储系统
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN111428721A (zh) * 2019-01-10 2020-07-17 北京字节跳动网络技术有限公司 词语释义的确定方法、装置、设备及存储介质
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11783827B2 (en) 2020-11-06 2023-10-10 Apple Inc. Determining suggested subsequent user actions during digital assistant interaction
EP4174848A1 (en) * 2021-10-29 2023-05-03 Televic Rail NV Improved speech to text method and system
CN116644810B (zh) * 2023-05-06 2024-04-05 国网冀北电力有限公司信息通信分公司 一种基于知识图谱实现的电网故障风险处置方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003115951A (ja) * 2001-10-09 2003-04-18 Casio Comput Co Ltd 話題情報提供システムおよび話題情報提供方法
US20060173868A1 (en) 2005-01-31 2006-08-03 Ontoprise Gmbh Mapping web services to ontologies
US20070038436A1 (en) 2005-08-10 2007-02-15 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US20080172359A1 (en) * 2007-01-11 2008-07-17 Motorola, Inc. Method and apparatus for providing contextual support to a monitored communication
US20100205180A1 (en) * 2006-08-14 2010-08-12 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US20100274796A1 (en) * 2009-04-27 2010-10-28 Avaya, Inc. Intelligent conference call information agents
US20120253789A1 (en) 2011-03-31 2012-10-04 Microsoft Corporation Conversational Dialog Learning and Correction

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265014A (en) * 1990-04-10 1993-11-23 Hewlett-Packard Company Multi-modal user interface
US5748974A (en) * 1994-12-13 1998-05-05 International Business Machines Corporation Multimodal natural language interface for cross-application tasks
US5970446A (en) * 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition
WO2000011571A1 (en) * 1998-08-24 2000-03-02 Bcl Computers, Inc. Adaptive natural language interface
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6332120B1 (en) * 1999-04-20 2001-12-18 Solana Technology Development Corporation Broadcast speech recognition system for keyword monitoring
JP3530109B2 (ja) * 1999-05-31 2004-05-24 日本電信電話株式会社 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体
WO2000073900A1 (en) * 1999-06-01 2000-12-07 Jacquez Geoffrey M Help system for a computer related application
US6598039B1 (en) * 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
JP3765202B2 (ja) * 1999-07-09 2006-04-12 日産自動車株式会社 対話型情報検索装置、コンピュータを用いた対話型情報検索方法及び対話型情報検索処理を行うプログラムを記録したコンピュータ読取り可能な媒体
JP2001125896A (ja) * 1999-10-26 2001-05-11 Victor Co Of Japan Ltd 自然言語対話システム
US7050977B1 (en) * 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
JP2002024285A (ja) * 2000-06-30 2002-01-25 Sanyo Electric Co Ltd ユーザ支援方法およびユーザ支援装置
JP2002082748A (ja) * 2000-09-06 2002-03-22 Sanyo Electric Co Ltd ユーザ支援装置
US7197120B2 (en) * 2000-12-22 2007-03-27 Openwave Systems Inc. Method and system for facilitating mediated communication
GB2372864B (en) * 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US7224981B2 (en) * 2002-06-20 2007-05-29 Intel Corporation Speech recognition of mobile devices
US7693720B2 (en) * 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
EP1411443A1 (en) * 2002-10-18 2004-04-21 Hewlett Packard Company, a Delaware Corporation Context filter
JP2004212641A (ja) * 2002-12-27 2004-07-29 Toshiba Corp 音声入力システム及び音声入力システムを備えた端末装置
JP2004328181A (ja) * 2003-04-23 2004-11-18 Sharp Corp 電話機及び電話網システム
JP4441782B2 (ja) * 2003-05-14 2010-03-31 日本電信電話株式会社 情報提示方法及び情報提示装置
JP2005043461A (ja) * 2003-07-23 2005-02-17 Canon Inc 音声認識方法及び音声認識装置
KR20050032649A (ko) * 2003-10-02 2005-04-08 (주)이즈메이커 인공생명을 학습시키는 방법 및 시스템
US7720674B2 (en) * 2004-06-29 2010-05-18 Sap Ag Systems and methods for processing natural language queries
JP4434972B2 (ja) * 2005-01-21 2010-03-17 日本電気株式会社 情報提供システム、情報提供方法及びそのプログラム
GB0502259D0 (en) * 2005-02-03 2005-03-09 British Telecomm Document searching tool and method
CN101120341A (zh) * 2005-02-06 2008-02-06 凌圭特股份有限公司 以自然语言进行移动式信息访问的方法和设备
US7409344B2 (en) * 2005-03-08 2008-08-05 Sap Aktiengesellschaft XML based architecture for controlling user interfaces with contextual voice commands
US20060206333A1 (en) * 2005-03-08 2006-09-14 Microsoft Corporation Speaker-dependent dialog adaptation
US7734557B2 (en) * 2005-04-05 2010-06-08 The Board Of Trustees Of Leland Stanford Junior University Methods, software, and systems for knowledge base coordination
US7991607B2 (en) * 2005-06-27 2011-08-02 Microsoft Corporation Translation and capture architecture for output of conversational utterances
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7822699B2 (en) * 2005-11-30 2010-10-26 Microsoft Corporation Adaptive semantic reasoning engine
US7627466B2 (en) * 2005-11-09 2009-12-01 Microsoft Corporation Natural language interface for driving adaptive scenarios
US20070136222A1 (en) 2005-12-09 2007-06-14 Microsoft Corporation Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content
US20070143410A1 (en) * 2005-12-16 2007-06-21 International Business Machines Corporation System and method for defining and translating chat abbreviations
CN100373313C (zh) * 2006-01-12 2008-03-05 广东威创视讯科技股份有限公司 一种用于交互式输入设备的智能识别编码方法
US8209407B2 (en) * 2006-02-10 2012-06-26 The United States Of America, As Represented By The Secretary Of The Navy System and method for web service discovery and access
EP2035915A4 (en) * 2006-06-13 2012-04-25 Microsoft Corp DASHBOARD FOR SEARCH ENGINE
US20080005068A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Context-based search, retrieval, and awareness
CN1963752A (zh) * 2006-11-28 2007-05-16 李博航 基于自然语言的电子设备人机交互操作界面技术
WO2008067676A1 (en) * 2006-12-08 2008-06-12 Medhat Moussa Architecture, system and method for artificial neural network implementation
US20080172659A1 (en) 2007-01-17 2008-07-17 Microsoft Corporation Harmonizing a test file and test configuration in a revision control system
US20080201434A1 (en) 2007-02-16 2008-08-21 Microsoft Corporation Context-Sensitive Searches and Functionality for Instant Messaging Applications
US20090076917A1 (en) * 2007-08-22 2009-03-19 Victor Roditis Jablokov Facilitating presentation of ads relating to words of a message
US7720856B2 (en) * 2007-04-09 2010-05-18 Sap Ag Cross-language searching
US8762143B2 (en) * 2007-05-29 2014-06-24 At&T Intellectual Property Ii, L.P. Method and apparatus for identifying acoustic background environments based on time and speed to enhance automatic speech recognition
US7788276B2 (en) * 2007-08-22 2010-08-31 Yahoo! Inc. Predictive stemming for web search with statistical machine translation models
JP5501967B2 (ja) * 2007-08-31 2014-05-28 マイクロソフト コーポレーション 間接話法内の意味論的関係の識別
US8165886B1 (en) * 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8504621B2 (en) * 2007-10-26 2013-08-06 Microsoft Corporation Facilitating a decision-making process
JP2009116733A (ja) * 2007-11-08 2009-05-28 Nec Corp アプリケーション検索システム、アプリケーション検索方法、モニタ端末、検索サーバおよびプログラム
JP5158635B2 (ja) * 2008-02-28 2013-03-06 インターナショナル・ビジネス・マシーンズ・コーポレーション パーソナル・サービス支援のための方法、システム、および装置
US20090234655A1 (en) * 2008-03-13 2009-09-17 Jason Kwon Mobile electronic device with active speech recognition
WO2009129315A1 (en) * 2008-04-15 2009-10-22 Mobile Technologies, Llc System and methods for maintaining speech-to-speech translation in the field
CN101499277B (zh) * 2008-07-25 2011-05-04 中国科学院计算技术研究所 一种服务智能导航方法和系统
US8874443B2 (en) * 2008-08-27 2014-10-28 Robert Bosch Gmbh System and method for generating natural language phrases from user utterances in dialog systems
JP2010128665A (ja) * 2008-11-26 2010-06-10 Kyocera Corp 情報端末及び会話補助プログラム
JP2010145262A (ja) * 2008-12-19 2010-07-01 Pioneer Electronic Corp ナビゲーション装置
US8326637B2 (en) * 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
JP2010230918A (ja) * 2009-03-26 2010-10-14 Fujitsu Ten Ltd 検索装置
US20100281435A1 (en) * 2009-04-30 2010-11-04 At&T Intellectual Property I, L.P. System and method for multimodal interaction using robust gesture processing
KR101622111B1 (ko) * 2009-12-11 2016-05-18 삼성전자 주식회사 대화 시스템 및 그의 대화 방법
KR101007336B1 (ko) * 2010-06-25 2011-01-13 한국과학기술정보연구원 온톨로지 기반 개인화 서비스 시스템 및 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003115951A (ja) * 2001-10-09 2003-04-18 Casio Comput Co Ltd 話題情報提供システムおよび話題情報提供方法
US20060173868A1 (en) 2005-01-31 2006-08-03 Ontoprise Gmbh Mapping web services to ontologies
US20070038436A1 (en) 2005-08-10 2007-02-15 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US20100205180A1 (en) * 2006-08-14 2010-08-12 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US20080172359A1 (en) * 2007-01-11 2008-07-17 Motorola, Inc. Method and apparatus for providing contextual support to a monitored communication
US20100274796A1 (en) * 2009-04-27 2010-10-28 Avaya, Inc. Intelligent conference call information agents
US20120253789A1 (en) 2011-03-31 2012-10-04 Microsoft Corporation Conversational Dialog Learning and Correction

Also Published As

Publication number Publication date
WO2012135783A2 (en) 2012-10-04
CN102737101A (zh) 2012-10-17
JP6305588B2 (ja) 2018-04-04
WO2012135229A2 (en) 2012-10-04
WO2012135157A2 (en) 2012-10-04
JP6087899B2 (ja) 2017-03-01
WO2012135210A3 (en) 2012-12-27
WO2012135226A1 (en) 2012-10-04
EP2691949A4 (en) 2015-06-10
WO2012135210A2 (en) 2012-10-04
WO2012135791A3 (en) 2013-01-10
KR20140025362A (ko) 2014-03-04
EP2691870A2 (en) 2014-02-05
EP2691885A4 (en) 2015-09-30
WO2012135218A3 (en) 2013-01-03
CN102737104A (zh) 2012-10-17
CN102750270A (zh) 2012-10-24
EP2691875A2 (en) 2014-02-05
KR101922744B1 (ko) 2018-11-27
CN102737104B (zh) 2017-05-24
EP2691949A2 (en) 2014-02-05
CN102737096B (zh) 2017-08-25
CN102737099B (zh) 2017-12-19
KR20140025361A (ko) 2014-03-04
CN102750270B (zh) 2017-06-09
EP2691877A2 (en) 2014-02-05
WO2012135791A2 (en) 2012-10-04
CN102750311B (zh) 2018-07-20
EP2691877A4 (en) 2015-06-24
JP2014515853A (ja) 2014-07-03
EP2691885A1 (en) 2014-02-05
WO2012135783A3 (en) 2012-12-27
JP2014512046A (ja) 2014-05-19
CN102750271B (zh) 2017-10-17
CN106383866B (zh) 2020-05-05
EP2691876A4 (en) 2015-06-10
WO2012135229A3 (en) 2012-12-27
WO2012135218A2 (en) 2012-10-04
KR20140014200A (ko) 2014-02-05
CN102737099A (zh) 2012-10-17
CN102737101B (zh) 2018-09-04
JP2014509757A (ja) 2014-04-21
JP2017123187A (ja) 2017-07-13
EP2691870A4 (en) 2015-05-20
CN102750271A (zh) 2012-10-24
WO2012135157A3 (en) 2013-01-10
EP2691875A4 (en) 2015-06-10
CN102750311A (zh) 2012-10-24
EP2691876A2 (en) 2014-02-05
JP6105552B2 (ja) 2017-03-29
CN106383866A (zh) 2017-02-08
CN102737096A (zh) 2012-10-17

Similar Documents

Publication Publication Date Title
KR101963915B1 (ko) 강화된 대화 이해 아키텍처
US10642934B2 (en) Augmented conversational understanding architecture
US10733983B2 (en) Parameter collection and automatic dialog generation in dialog systems
US10585957B2 (en) Task driven user intents
US11720635B2 (en) Providing command bundle suggestions for an automated assistant
US10296587B2 (en) Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9858343B2 (en) Personalization of queries, conversations, and searches
JP2019503526A5 (ko)
US20120253789A1 (en) Conversational Dialog Learning and Correction
US20190042185A1 (en) Flexible voice-based information retrieval system for virtual assistant

Legal Events

Date Code Title Description
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant