KR20150086313A

KR20150086313A - 분산된 nlu/nlp

Info

Publication number: KR20150086313A
Application number: KR1020157015792A
Authority: KR
Inventors: 매티유 헤버트; 진-필립 로비차우드; 크리스토퍼 엠. 파리지엔
Original assignee: 뉘앙스 커뮤니케이션즈, 인코포레이티드
Priority date: 2012-11-12
Filing date: 2013-11-07
Publication date: 2015-07-27
Also published as: WO2014074698A3; CN104919522A; EP2917907A2; US9171066B2; CN104919522B; EP2917907A4; WO2014074698A2; US20140136183A1; KR101689818B1

Abstract

분산된 자연 언어 처리를 위한 방식 및 방법이 기술된다. 모바일 장치 상에 1세트의 로컬 데이터 소스가 저장된다. 하나 이상의 로컬 해석 후보자들을 결정하기 위하여, 모바일 장치 상의 로컬 NLU 매치 모듈이 로컬 데이터 소스들과 관련하여 자연 언어 입력의 자연 언어 처리를 수행한다. 상기 모바일 장치 상의 로컬 NLU 랭킹 모듈은 상기 자연 언어 입력에 따라 최종 출력 해석을 결정하기 위하여 로컬 해석 후보자들 및 원격 NLU 서버의 하나 이상의 원격 해석 후보자들을 처리한다.

Description

분산된 NLU/NLP {Distributed NLU/NLP}

이 출원은 2012. 11. 12 자로 출원된 미국 특허 출원 제13/674,191호를 우선권 주장하여 출원하며, 그 전체가 이하 참조된다.

본 발명은 자연언어 (natural language) 처리를 위한 분산(distribute) 클라이언트-서버 방식에 관한 것이다.

자연 언어 처리(NLP, Natural Language Processing) 및 자연 언어 이해(NLU, Natural Language Understanding)는 인간의 말과 문장과 같은 자연 언어 입력들로부터의 의미있는 정보들을 추출하기 위해 컴퓨터 처리를 사용한다. 이와 관련한 최근 기술 중 하나는, 스마트폰과 같은 모바일 기기 내의 말(speech) 및/또는 문장(text) 쿼리들(queries)을 처리하는 것이다.

도 1은 이러한 모바일 기기 어플리케이션 중 하나이며, 말 쿼리(speech query) 입력을 처리하고, 다양한 최상의(top) 웹사이트들과 컨텐츠 소스들로부터 동시(simultaneous) 검색 결과를 획득하는 드래곤 고!(Dragon Go!) 의 스크린샷을 나타낸다. 상기 어플리케이션은 입력 쿼리들로부터 의미론적 의미(semantic meaning)를 추출하기 위하여 존재하는 웹 검색 알고리즘에 자연언어 이해 요소의 추가를 필요로한다. 이것은 의미론적(semantic) 템플릿(template) 구조를 발견하기 위하여 근사치인 문자열 매칭(string matching)을 사용하는 것을 수반(involve)할 수 있다. 하나 이상의 의미론적 의미는 각 의미론적 템플릿에 할당될 수 있다. 파싱(Parsing) 규칙(rule) 및 분류사(classifier) 훈련(training) 샘플들은 쿼리 통역(때때로, 쿼리 호출(query intents)로서 참조되는)을 결정하는 NLU 모델들을 훈련하기 위하여 생성되고 사용될 수 있다.

드래곤 고!와 같은 모바일 장치를 위한 복잡한 NLU 어플리케이션들은 NLU 프로세싱이 원격 서버상에서 단독으로 완료되는 곳에서 클라이언트-서버 아키텍쳐를 사용하여 실행된다. 그러나, NLU 결과를 최적화 하기 위하여 원격 NLU 프로세서로 업로드되어야 하는 로컬 모바일 장치 상에 저장된 상당량의 연관된 데이터, 예를 들어, 미팅 리스트(제목, 내용, 참석자), 연락처, 음악 리스트, 등이 존재할 수 있다.

서버 측 NLU에 의하여 영향을 받을(leveraged) 수 있는 이 데이터의 전송은, 비밀 관심사들(confidentiality concerns) 과, 업로드 후 싱크를 유지해야 하는 대량(sheer amount)의 데이터를 포함하는 다양한 이유들을 포함하는 문제가 있을 수 있다.

본 발명의 바람직한 실시예는 분산된 자연 언어 처리를 위한 방식 및 관련된 방법에 관한 것이다.

1 세트(a set of)의 로컬 데이터 소스가 모바일 장치에 저장된다. 모바일 장치의 로컬(local) 자연 언어 이해(NLU, Natural Language Understanding) 매치 모듈(match module)은 하나 이상의 로컬 해석(interpretation) 후보자들(candidates)을 결정하기 위하여 로컬 데이터 소스들에 대한 자연 언어 입력(input)의 자연 언어 처리를 수행한다. 모바일 장치 상의 로컬 NLU 랭킹 모듈은 자연 언어 입력과 관련한 최종 출력(output) 해석을 결정하기 위하여 로컬 해석 후보자들과 원격 NLU 서버의 하나 이상의 원격 해석 후보자들 을 처리한다.

상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 및/또는 N-베스트 리스트(N-Best list) 내의 해석 후보자들을 랭크하기(rank) 위하여 퍼지 매치 알고리즘(fuzzy match algorithm)을 사용할 수 있다. 상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 전에 상기 로컬 데이터 소스 내에 보여진 정보들과 관련하여 확인된 원격 해석 후보자들을 더 처리할 수 있다. 예를 들어, 상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 로컬 데이터 소스들의 데이터들과 함께 원격 NLU 서버의 추가적인 부가(supplemental) 원격 해석 데이터를 더 사용할 수 있다.

상기 모바일 장치는 원격 해석 후보자들을 개발하기(developing) 위하여 상기 NLU 매치 모듈의 자연 언어 처리 결과를 상기 원격 NLU 서버로 전달(forward)할 수 있다. 그리고, 상기 로컬 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 원격 NLU 서버로부터 랭킹 데이터를 더 고려(consider)할 수 있다.

도 1은 모바일 장치를 위한 자연 언어 쿼리 어플리케이션의 몇몇 실시예들을 나타내는 스크린샷이다.
도 2는 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 방식을 나타낸다.
도 3은 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 내의 다양한 기능적 단계들을 나타내는 플로우차트이다.

본 발명의 실시예들은 사용가능한 데이터 및 리소스들을 사용하여, 장치의(on-device) 데이터를, 일부(some) 처리들을 모바일 장치 상에서 로컬적으로(locally) 수행하고, 일부 처리들을 서버 상에서 원격으로 (remotely) 수행하도록 하는 NLU 처리의 분산된 클라이언트-서버 방식에 관한 것이다.

도 2는 분산된 자연 언어 처리 방식의 일 실시예를 나타내고, 도 3은 본 발명의 일 실시예에 따른 분산된 자연 언어 처리의 다양한 기능적 단계들을 나타내는 플로우차트이다. 이하, 일 실시예의 쿼리로서 기술되는 “콜 밥(call bob)”은 최근 상영되고 있는 영화 제목 “콜 밥”을 지칭하기 위한 목적으로서 사용된다.

모바일 장치(200)는 사용자로부터 자연 언어 입력(201)을 받는다(단계 301). 상기 모바일 장치(200)는 사용 가능한 원격 데이터 리소스(205)들을 사용하여 하나 이상의 원격 해석 후보자들을 결정하기 위한 상기 입력의 NLU 처리를 수행하는 원격 NLU 서버(204)로 상기 자연 언어 입력(201)을 전달 한다(단계 302). 또한, 모바일 장치의 상대적으로 가벼운(lightweight) 자연 언어 이해(NLU) 매치 모듈(202)은, 하나 이상의 로컬 해석 후보자들, 예를 들어, 퍼지 매치 알고리즘(fuzzy match algorithm)을 결정하기 위하여 로컬 데이터 소스들(203)에 대한 입력(input)의 로컬 NLU 처리를 수행한다(단계 303). 상기 로컬 데이터 소스(203)들은 일반적으로, 상기 장치 내의(all local to the device), 제한 없는 음악 리스트, 이메일 내용들, 미팅 내용들, 연락처 리스트, 등을 포함할 수 있다. 몇몇 실시예에서, 상기 NLU 매치 모듈(202)에 의한 상기 로컬 NLU 처리의 몇몇 또는 모든 결과(예를 들어, 말 검출 결과(mention detection results), 의미 부가 추출(semantic attachment extraction), 쿼리 호출(intents), 및/또는 의미 분류(classification) 결과)는 그 해석들을 늘리기(augment) 위한 정보들을 사용하는 상기 원격 NLU 서버(204)로 전달 될 수 있다.

상기 모바일 장치(200) 상의 로컬 NLU 랭킹 모듈(206)은 상기 원격 NLU 서버(204)로부터 원격 해석 후보자 들을 수신하고(단계 304), 조합된 해석 후보자들을 조합된 N-베스트 리스트로 다시-랭크하도록(re-rank) 상기 NLU 매치 모듈(202)로부터 로컬 해석 후보자들과 함께 처리하며(단계 305), 상기 자연 언어 입력(201)에 대하여 최종 출력 해석(207)을 결정한다. 몇몇 실시예에서, 상기 원격 NLU 서버(204)는 일부 또는 모든 후보자 랭킹을 스스로 실시하고, 랭킹 결과를 상기 원격 해석 후보자들과 함께 상기 모바일 장치(200)으로 회신할 수 있다.

이 방식에서, 상기 모바일 장치(200) 의 로컬 데이터(203) 중 일부에 억세스(access) 했다면, 생존해 있을 수 있는 해석 후보자들을 상기 서버 NLU(204)가 버리지(prune) 않도록 하는 데 유용할 수 있다. 즉, 원격 해석 후보자들의 상기 N-베스트 리스트는 상기 상황(circumstances) 에서 버려지지 않아야 될 필요가 있다. 상기 서버 NLU(204)는 최상의 결과를 획득하기 위하여 상기 서버 NLU(204)를 통하여 각 샘플 쿼리로 나아가는(running), 일 실시에의 쿼리(example queries)와 관련한 음악, 미팅, 연락처 정보, 등을 위한 NLU 트레이닝 데이터에 기반하여 훈련될 수 있다. 이후, 상기 서버 NLU(204)의 훈련은 로컬 모바일 장치(200) 상에 존재할 수 있는 음악, 미팅, 연락처 정보, 등의 데이터를 제외한(minus) 동일한 트레이닝 데이터 상에서 반복될 수 있다. 그리고, 각 쿼리는 상기 서버 NLU(204)를 통하여 재-구동(re-run)되고 최상의 결과를 획득한다. 이것은 NLU 출력과 함께 트레이닝 데이터를 생성한다. (추상적인(abstract) 특성들은 상기 NLU 출력으로부터 구축될 수 있다). 그리고, 각각의 트레이닝 쿼리 샘플을 위하여, 만일 상기 서버 NLU(204)의 최상의 NLU 결과가 수도(pseudo)-로컬 데이터의 존재와 함께 변경된다면, 만일 로컬 모바일 장치(200) 의 로컬 데이터(203)가 사용가능하면 상기 쿼리가 변경되는 것을 허용한다면 트레이닝된 서버 NLU(204)는 서버측 상에서 각 쿼리에 대하여 확인할 수 있다. 런-타임 오퍼레이션(run-time operation)중, 만일 상기 서버 NLU(204)가 주어진 해석 후보자가

로컬 데이터(203)에 의하여 영향을 받는 것을 허용한다면, 이후의 상기 모바일 장치(200) 상의 로컬 처리를 위하여 NLU 랭커(206)으로 전송(사용 가능한 다른 유용한 로컬 처리 정보와 함께)될 때 상기 해석 후보자는 플래그된다(flagged). 이러한 방식의 한가지 효과는 상기 서버 NLU(204)로부터 상기 로컬 NLU 랭커(206)로의 원격 해석 후보자들의 긴 N-베스트 리스트 이고, 민감하거나 또는 대역폭을 소모하는 정보가 상기 모바일 장치(200)으로부터 상기 서버 NLU(204)로 전송되지 않는다는 것이다.

실시예의 쿼리 “콜 밥”으로 돌아가서, 상기 모바일 장치(200)는 이 자연 언어 입력(201)을 하나 이상의 원격 해석 후보자들을 생성하기 위하여 NLU 처리하는 상기 서버 NLU(204)로 전송한다.

그리고, 이 쿼리가 상기 모바일 장치(200) 상에서 더 처리되고 재 랭크(re-rank)되어야 한다는 것을 확인한다.

상기 서버 NLU(204)로부터의 원격 해석 후보자들은

1. “[영화] 콜 밥 [/영화]”: 영화(“[Movie] call bob [/Movie]”: Movie )

2.“콜[사람] 밥[/사람]”: 콜-연락처(“call [Person] bob [/Person]”: Call-Contact)

가 되어야 한다.

이것들은 상기 모바일 장치(200)으로 전송된다(가능하면 다른 유용한 정보들과 함께). 상기 NLU 모듈(202)은 상기 로컬 데이터(203) 내에 주어진 영화 및 연락처 DB 상에서 퍼지 매치를 수행한다. 만일, 영화 “콜 밥”이 상기 로컬 데이터(203)에 존재한다면, 상기 해석 후보자들은 재-오더(re-ordered)되지 않는다. 상기 영화가 최근 나온 것으로 추정된다면면 그것은 이 가상의 시나리오 내에 존재하지 않을 것이다. 만일, “밥 스미스(Bob Smith)” 라는 연락처가 존재한다면, 상기 NLU 랭커(ranker)(206)는 전화-연락(Call-Contact now)이 상단에 출력 해석(207)으로서 존재하는 해석 후보들을 재-정렬(re-sort)한다.

본 발명의 실시예는 현존하는 컴퓨터 프로그래밍 언어인, VHDL, SystemC, Verilog, ASM, 등에 전체 또는 부분으로 적용될 수 있다. 본 발명의 다른 실시예는 사전 프로그래밍된 하드웨어 요소, 다른 관련된 요소, 또는 하드웨어와 소프트웨어 요소의 조합으로서 적용될 수 있다.

실시예는 컴퓨터 시스템의 사용을 위한 컴퓨터 프로그램 상품으로서 전체 또는 부분으로 적용될 수 있다. 이러한 실시(implementation)는 컴퓨터 읽기가능 수단(예를 들어, 디스켓, CD-ROM, ROM, 또는 고정된 디스크)와 같은 유형 매체(tangible medium)에 고정되거나(fixed), 또는, 매체를 넘어 네트워크와 연결된 통신 어댑터와 같은, 모뎀 또는 다른 인터페이스 장치를 통하여, 컴퓨터 시스템으로 전송가능한 일련의 컴퓨터 명령(computer instruction)을 포함할 수 있다. 상기 매체는 유형 매체(예를 들어, 광학 또는 아날로그 통신 라인) 또는 무선 기술과 함께 실시된 매체(예를 들어, 마이크로웨이브, 적외선 또는 다른 전송 기술)일 수 있다. 상기 일련의 컴퓨터 명령들은 기능적으로 상기 시스템과 관련하여 상술한 기능의 전체 또는 부분을 포함한다. 당업자들은 이러한 컴퓨터 명령들이 많은 컴퓨터 아키텍쳐들 또는 오퍼레이팅 시스템(OS)들과 함께 사용하기 위하여 다수의 프로그래밍 언어들로 작성될 수 있다는 것을 이해해야 한다. 더 나아가, 이러한 명령들은 예를 들어, 반도체, 자성, 광학 또는 다른 메모리 장치들과 같은 메모리 장치에 저장될 수 있다. 그리고, 예를 들어, 광학, 적외선, 마이크로웨이브, 또는 다른 전송 기술들과 같은 통신 기술을 이용하여 전송될 수 있다. 이러한 컴퓨터 프로그램 상품은, 인쇄 문서 또는 전자 문서(예를 들어, 개별 포장 소프트웨어(shrink wrapped software)), 컴퓨터 시스템에 사전로딩된 매체(예를 들어, 온 시스템 롬(on system ROM) 또는 고정 디스크), 또는, 네트워크 상의 서버로부터 분산되거나, 또는 전자 게시판(bulletin board) 매체(예를 들어, 인터넷 또는 월드 와이드 웹(WWW))와 함께 제거가능한 매체로서 배포될 수 있을 것으로 기대된다. 물론, 본 발명의 몇몇 실시예들은 소프트웨어(예를 들어, 컴퓨터 프로그램 상품)와 하드웨어의 조합으로서 실시될 수 있다. 본 발명의 또 다른 실시예는 완전한 하드웨어 또는 완전한 소프트웨어(예를 들어, 컴퓨터 프로그램 상품)으로서 실시될 수 있다.

비록, 발명의 다양한 실시예들이 기술되었다 하더라도, 발명의 기술 사상을 벗어나지 않는 한 발명의 장점들을 달성할 수 있는 다양한 변경 또는 수정이 이루어질 수 있다는 것은 당업자에게 자명한 것으로 이해되어야 한다.

Claims

분산된 자연 언어 처리 방식에 있어서,
모바일 장치에 저장된 1세트(a set)의 로컬 데이터 소스;
하나 이상의 로컬 해석 후보자들을 결정하기 위하여 상기 로컬 데이터 소스에 대한 자연 언어 입력을 자연 언어 처리하기 위한 상기 모바일 장치 상의 자연 언어 이해(NLU) 매치 모듈; 및
상기 자연 언어 입력에 따라 최종 출력 해석을 결정하기 위하여 상기 로컬 해석 후보자들 및 원격 NLU 서버의 하나 이상의 원격 해석 후보자들을 처리하기 위한 상기 모바일 장치 상의 로컬 NLU랭킹 모듈;
을 포함하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
제 1항에 있어서,
상기NLU 랭킹 모듈은 상기 최종 출력 해석을 결정하기 위하여 퍼지 매치 알고리즘을 사용하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
제 1항에 있어서,
상기 NLU 랭킹 모듈은,
상기 해석 후보자들을 N-베스트 리스트(N-Best list) 내에 랭크시키는(rank) 것을 특징으로 하는 분산된 자연 언어 처리 방식.
제 1항에 있어서,
상기 NLU 랭킹 모듈은,
최종 출력 해석을 결정하기 전에 상기 로컬 데이터 소스들 내에 나타난 정보들과 관련하여 확인된 원격 해석 후보자들을 더 처리하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
제 4항에 있어서,
상기 로컬 NLU 랭킹 모듈은,
상기 최종 출력 해석을 결정하기 위하여, 상기 원격 NLU 서버의 부가적인 추가 원격 해석 데이터를 상기 로컬 데이터 소스들의 데이터와 함께 더 사용하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
제 1항에 있어서,
상기 모바일 장치는,
상기 원격 해석 후보자들을 개발하기(developing)위하여 상기 NLU 매치 모듈의 자연 언어 처리 결과들을 상기 원격 NLU 서버로 전달하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
제 1항에 있어서,
상기 로컬 NLU 랭킹 모듈은,
상기 최종 출력 해석을 결정하기 위하여 상기 원격 NLU 서버의 랭킹 데이터를 더 고려하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
분산된 자연 언어를 처리하는 방법에있어서,
하나 이상의 로컬 해석 후보자들을 결정하기 위하여, 상기 모바일 장치 상에 저장된 로컬 데이터 소스들에 대한 모바일 장치 상의 자연 언어 입력을 처리하는 단계; 및
로컬 해석 후보자들, 및 원격 NLU 서버로부터의 하나 이상의 원격 해석 후보자들을 모바일 장치에서 처리하는 것에 의한 자연 언어 입력에 따라 최종 출력 해석을 결정하는 단계;
을 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
제 8항에 있어서,
최종 출력 해석은 퍼지 매치 알고리즘에 의하여 결정되는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
제 8항에 있어서,
상기 해석 후보자들을 처리하는 단계는,
상기 해석 후보자들을 N-베스트 리스트 내에 랭크하는 것을 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
제 8항에 있어서,
상기 최종 출력 해석을 결정하기 이전에,
상기 모바일 장치는,
상기 로컬 데이터 소스들 내에 나타내어진 정보와 관련하여 확인된 원격 해석 후보자들을 더 처리하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
제 11항에 있어서,
상기 모바일 장치는,
상기 최종 출력 해석을 결정하기 위하여, 상기 원격 NLU 서버의 부가적인 추가 원격 해석 데이터를 상기 로컬 데이터 소스들의 데이터와 함께 더 사용하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
제 8항에 있어서,
상기 모바일 장치 상의 자연 언어 입력을 처리하는 단계는,
상기 원격 NLU 서버가 원격 해석 후보자들을 개발하기 위하여, 자연 언어 처리 결과를 상기 원격 NLU 서버로 전달하는 단계를 더 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
제 8항에 있어서,
상기 최종 출력 해석을 결정하는 단계는,
상기 최종 출력 해석을 결정하기 위하여 상기 원격 NLU 서버의 랭킹 데이터를 처리하는 단계를 더 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.