KR20150086313A - 분산된 nlu/nlp - Google Patents

분산된 nlu/nlp Download PDF

Info

Publication number
KR20150086313A
KR20150086313A KR1020157015792A KR20157015792A KR20150086313A KR 20150086313 A KR20150086313 A KR 20150086313A KR 1020157015792 A KR1020157015792 A KR 1020157015792A KR 20157015792 A KR20157015792 A KR 20157015792A KR 20150086313 A KR20150086313 A KR 20150086313A
Authority
KR
South Korea
Prior art keywords
nlu
interpretation
remote
natural language
local
Prior art date
Application number
KR1020157015792A
Other languages
English (en)
Other versions
KR101689818B1 (ko
Inventor
매티유 헤버트
진-필립 로비차우드
크리스토퍼 엠. 파리지엔
Original Assignee
뉘앙스 커뮤니케이션즈, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 뉘앙스 커뮤니케이션즈, 인코포레이티드 filed Critical 뉘앙스 커뮤니케이션즈, 인코포레이티드
Publication of KR20150086313A publication Critical patent/KR20150086313A/ko
Application granted granted Critical
Publication of KR101689818B1 publication Critical patent/KR101689818B1/ko

Links

Images

Classifications

    • G06F17/30654
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/085Methods for reducing search complexity, pruning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

분산된 자연 언어 처리를 위한 방식 및 방법이 기술된다. 모바일 장치 상에 1세트의 로컬 데이터 소스가 저장된다. 하나 이상의 로컬 해석 후보자들을 결정하기 위하여, 모바일 장치 상의 로컬 NLU 매치 모듈이 로컬 데이터 소스들과 관련하여 자연 언어 입력의 자연 언어 처리를 수행한다. 상기 모바일 장치 상의 로컬 NLU 랭킹 모듈은 상기 자연 언어 입력에 따라 최종 출력 해석을 결정하기 위하여 로컬 해석 후보자들 및 원격 NLU 서버의 하나 이상의 원격 해석 후보자들을 처리한다.

Description

분산된 NLU/NLP {Distributed NLU/NLP}
이 출원은 2012. 11. 12 자로 출원된 미국 특허 출원 제13/674,191호를 우선권 주장하여 출원하며, 그 전체가 이하 참조된다.
본 발명은 자연언어 (natural language) 처리를 위한 분산(distribute) 클라이언트-서버 방식에 관한 것이다.
자연 언어 처리(NLP, Natural Language Processing) 및 자연 언어 이해(NLU, Natural Language Understanding)는 인간의 말과 문장과 같은 자연 언어 입력들로부터의 의미있는 정보들을 추출하기 위해 컴퓨터 처리를 사용한다. 이와 관련한 최근 기술 중 하나는, 스마트폰과 같은 모바일 기기 내의 말(speech) 및/또는 문장(text) 쿼리들(queries)을 처리하는 것이다.
도 1은 이러한 모바일 기기 어플리케이션 중 하나이며, 말 쿼리(speech query) 입력을 처리하고, 다양한 최상의(top) 웹사이트들과 컨텐츠 소스들로부터 동시(simultaneous) 검색 결과를 획득하는 드래곤 고!(Dragon Go!) 의 스크린샷을 나타낸다. 상기 어플리케이션은 입력 쿼리들로부터 의미론적 의미(semantic meaning)를 추출하기 위하여 존재하는 웹 검색 알고리즘에 자연언어 이해 요소의 추가를 필요로한다. 이것은 의미론적(semantic) 템플릿(template) 구조를 발견하기 위하여 근사치인 문자열 매칭(string matching)을 사용하는 것을 수반(involve)할 수 있다. 하나 이상의 의미론적 의미는 각 의미론적 템플릿에 할당될 수 있다. 파싱(Parsing) 규칙(rule) 및 분류사(classifier) 훈련(training) 샘플들은 쿼리 통역(때때로, 쿼리 호출(query intents)로서 참조되는)을 결정하는 NLU 모델들을 훈련하기 위하여 생성되고 사용될 수 있다.
드래곤 고!와 같은 모바일 장치를 위한 복잡한 NLU 어플리케이션들은 NLU 프로세싱이 원격 서버상에서 단독으로 완료되는 곳에서 클라이언트-서버 아키텍쳐를 사용하여 실행된다. 그러나, NLU 결과를 최적화 하기 위하여 원격 NLU 프로세서로 업로드되어야 하는 로컬 모바일 장치 상에 저장된 상당량의 연관된 데이터, 예를 들어, 미팅 리스트(제목, 내용, 참석자), 연락처, 음악 리스트, 등이 존재할 수 있다.
서버 측 NLU에 의하여 영향을 받을(leveraged) 수 있는 이 데이터의 전송은, 비밀 관심사들(confidentiality concerns) 과, 업로드 후 싱크를 유지해야 하는 대량(sheer amount)의 데이터를 포함하는 다양한 이유들을 포함하는 문제가 있을 수 있다.
본 발명의 바람직한 실시예는 분산된 자연 언어 처리를 위한 방식 및 관련된 방법에 관한 것이다.
1 세트(a set of)의 로컬 데이터 소스가 모바일 장치에 저장된다. 모바일 장치의 로컬(local) 자연 언어 이해(NLU, Natural Language Understanding) 매치 모듈(match module)은 하나 이상의 로컬 해석(interpretation) 후보자들(candidates)을 결정하기 위하여 로컬 데이터 소스들에 대한 자연 언어 입력(input)의 자연 언어 처리를 수행한다. 모바일 장치 상의 로컬 NLU 랭킹 모듈은 자연 언어 입력과 관련한 최종 출력(output) 해석을 결정하기 위하여 로컬 해석 후보자들과 원격 NLU 서버의 하나 이상의 원격 해석 후보자들 을 처리한다.
상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 및/또는 N-베스트 리스트(N-Best list) 내의 해석 후보자들을 랭크하기(rank) 위하여 퍼지 매치 알고리즘(fuzzy match algorithm)을 사용할 수 있다. 상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 전에 상기 로컬 데이터 소스 내에 보여진 정보들과 관련하여 확인된 원격 해석 후보자들을 더 처리할 수 있다. 예를 들어, 상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 로컬 데이터 소스들의 데이터들과 함께 원격 NLU 서버의 추가적인 부가(supplemental) 원격 해석 데이터를 더 사용할 수 있다.
상기 모바일 장치는 원격 해석 후보자들을 개발하기(developing) 위하여 상기 NLU 매치 모듈의 자연 언어 처리 결과를 상기 원격 NLU 서버로 전달(forward)할 수 있다. 그리고, 상기 로컬 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 원격 NLU 서버로부터 랭킹 데이터를 더 고려(consider)할 수 있다.
도 1은 모바일 장치를 위한 자연 언어 쿼리 어플리케이션의 몇몇 실시예들을 나타내는 스크린샷이다.
도 2는 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 방식을 나타낸다.
도 3은 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 내의 다양한 기능적 단계들을 나타내는 플로우차트이다.
본 발명의 실시예들은 사용가능한 데이터 및 리소스들을 사용하여, 장치의(on-device) 데이터를, 일부(some) 처리들을 모바일 장치 상에서 로컬적으로(locally) 수행하고, 일부 처리들을 서버 상에서 원격으로 (remotely) 수행하도록 하는 NLU 처리의 분산된 클라이언트-서버 방식에 관한 것이다.
도 2는 분산된 자연 언어 처리 방식의 일 실시예를 나타내고, 도 3은 본 발명의 일 실시예에 따른 분산된 자연 언어 처리의 다양한 기능적 단계들을 나타내는 플로우차트이다. 이하, 일 실시예의 쿼리로서 기술되는 “콜 밥(call bob)”은 최근 상영되고 있는 영화 제목 “콜 밥”을 지칭하기 위한 목적으로서 사용된다.
모바일 장치(200)는 사용자로부터 자연 언어 입력(201)을 받는다(단계 301). 상기 모바일 장치(200)는 사용 가능한 원격 데이터 리소스(205)들을 사용하여 하나 이상의 원격 해석 후보자들을 결정하기 위한 상기 입력의 NLU 처리를 수행하는 원격 NLU 서버(204)로 상기 자연 언어 입력(201)을 전달 한다(단계 302). 또한, 모바일 장치의 상대적으로 가벼운(lightweight) 자연 언어 이해(NLU) 매치 모듈(202)은, 하나 이상의 로컬 해석 후보자들, 예를 들어, 퍼지 매치 알고리즘(fuzzy match algorithm)을 결정하기 위하여 로컬 데이터 소스들(203)에 대한 입력(input)의 로컬 NLU 처리를 수행한다(단계 303). 상기 로컬 데이터 소스(203)들은 일반적으로, 상기 장치 내의(all local to the device), 제한 없는 음악 리스트, 이메일 내용들, 미팅 내용들, 연락처 리스트, 등을 포함할 수 있다. 몇몇 실시예에서, 상기 NLU 매치 모듈(202)에 의한 상기 로컬 NLU 처리의 몇몇 또는 모든 결과(예를 들어, 말 검출 결과(mention detection results), 의미 부가 추출(semantic attachment extraction), 쿼리 호출(intents), 및/또는 의미 분류(classification) 결과)는 그 해석들을 늘리기(augment) 위한 정보들을 사용하는 상기 원격 NLU 서버(204)로 전달 될 수 있다.
상기 모바일 장치(200) 상의 로컬 NLU 랭킹 모듈(206)은 상기 원격 NLU 서버(204)로부터 원격 해석 후보자 들을 수신하고(단계 304), 조합된 해석 후보자들을 조합된 N-베스트 리스트로 다시-랭크하도록(re-rank) 상기 NLU 매치 모듈(202)로부터 로컬 해석 후보자들과 함께 처리하며(단계 305), 상기 자연 언어 입력(201)에 대하여 최종 출력 해석(207)을 결정한다. 몇몇 실시예에서, 상기 원격 NLU 서버(204)는 일부 또는 모든 후보자 랭킹을 스스로 실시하고, 랭킹 결과를 상기 원격 해석 후보자들과 함께 상기 모바일 장치(200)으로 회신할 수 있다.
이 방식에서, 상기 모바일 장치(200) 의 로컬 데이터(203) 중 일부에 억세스(access) 했다면, 생존해 있을 수 있는 해석 후보자들을 상기 서버 NLU(204)가 버리지(prune) 않도록 하는 데 유용할 수 있다. 즉, 원격 해석 후보자들의 상기 N-베스트 리스트는 상기 상황(circumstances) 에서 버려지지 않아야 될 필요가 있다. 상기 서버 NLU(204)는 최상의 결과를 획득하기 위하여 상기 서버 NLU(204)를 통하여 각 샘플 쿼리로 나아가는(running), 일 실시에의 쿼리(example queries)와 관련한 음악, 미팅, 연락처 정보, 등을 위한 NLU 트레이닝 데이터에 기반하여 훈련될 수 있다. 이후, 상기 서버 NLU(204)의 훈련은 로컬 모바일 장치(200) 상에 존재할 수 있는 음악, 미팅, 연락처 정보, 등의 데이터를 제외한(minus) 동일한 트레이닝 데이터 상에서 반복될 수 있다. 그리고, 각 쿼리는 상기 서버 NLU(204)를 통하여 재-구동(re-run)되고 최상의 결과를 획득한다. 이것은 NLU 출력과 함께 트레이닝 데이터를 생성한다. (추상적인(abstract) 특성들은 상기 NLU 출력으로부터 구축될 수 있다). 그리고, 각각의 트레이닝 쿼리 샘플을 위하여, 만일 상기 서버 NLU(204)의 최상의 NLU 결과가 수도(pseudo)-로컬 데이터의 존재와 함께 변경된다면, 만일 로컬 모바일 장치(200) 의 로컬 데이터(203)가 사용가능하면 상기 쿼리가 변경되는 것을 허용한다면 트레이닝된 서버 NLU(204)는 서버측 상에서 각 쿼리에 대하여 확인할 수 있다. 런-타임 오퍼레이션(run-time operation)중, 만일 상기 서버 NLU(204)가 주어진 해석 후보자가
로컬 데이터(203)에 의하여 영향을 받는 것을 허용한다면, 이후의 상기 모바일 장치(200) 상의 로컬 처리를 위하여 NLU 랭커(206)으로 전송(사용 가능한 다른 유용한 로컬 처리 정보와 함께)될 때 상기 해석 후보자는 플래그된다(flagged). 이러한 방식의 한가지 효과는 상기 서버 NLU(204)로부터 상기 로컬 NLU 랭커(206)로의 원격 해석 후보자들의 긴 N-베스트 리스트 이고, 민감하거나 또는 대역폭을 소모하는 정보가 상기 모바일 장치(200)으로부터 상기 서버 NLU(204)로 전송되지 않는다는 것이다.
실시예의 쿼리 “콜 밥”으로 돌아가서, 상기 모바일 장치(200)는 이 자연 언어 입력(201)을 하나 이상의 원격 해석 후보자들을 생성하기 위하여 NLU 처리하는 상기 서버 NLU(204)로 전송한다.
그리고, 이 쿼리가 상기 모바일 장치(200) 상에서 더 처리되고 재 랭크(re-rank)되어야 한다는 것을 확인한다.
상기 서버 NLU(204)로부터의 원격 해석 후보자들은
1. “[영화] 콜 밥 [/영화]”: 영화(“[Movie] call bob [/Movie]”: Movie )
2.“콜[사람] 밥[/사람]”: 콜-연락처(“call [Person] bob [/Person]”: Call-Contact)
가 되어야 한다.
이것들은 상기 모바일 장치(200)으로 전송된다(가능하면 다른 유용한 정보들과 함께). 상기 NLU 모듈(202)은 상기 로컬 데이터(203) 내에 주어진 영화 및 연락처 DB 상에서 퍼지 매치를 수행한다. 만일, 영화 “콜 밥”이 상기 로컬 데이터(203)에 존재한다면, 상기 해석 후보자들은 재-오더(re-ordered)되지 않는다. 상기 영화가 최근 나온 것으로 추정된다면면 그것은 이 가상의 시나리오 내에 존재하지 않을 것이다. 만일, “밥 스미스(Bob Smith)” 라는 연락처가 존재한다면, 상기 NLU 랭커(ranker)(206)는 전화-연락(Call-Contact now)이 상단에 출력 해석(207)으로서 존재하는 해석 후보들을 재-정렬(re-sort)한다.
본 발명의 실시예는 현존하는 컴퓨터 프로그래밍 언어인, VHDL, SystemC, Verilog, ASM, 등에 전체 또는 부분으로 적용될 수 있다. 본 발명의 다른 실시예는 사전 프로그래밍된 하드웨어 요소, 다른 관련된 요소, 또는 하드웨어와 소프트웨어 요소의 조합으로서 적용될 수 있다.
실시예는 컴퓨터 시스템의 사용을 위한 컴퓨터 프로그램 상품으로서 전체 또는 부분으로 적용될 수 있다. 이러한 실시(implementation)는 컴퓨터 읽기가능 수단(예를 들어, 디스켓, CD-ROM, ROM, 또는 고정된 디스크)와 같은 유형 매체(tangible medium)에 고정되거나(fixed), 또는, 매체를 넘어 네트워크와 연결된 통신 어댑터와 같은, 모뎀 또는 다른 인터페이스 장치를 통하여, 컴퓨터 시스템으로 전송가능한 일련의 컴퓨터 명령(computer instruction)을 포함할 수 있다. 상기 매체는 유형 매체(예를 들어, 광학 또는 아날로그 통신 라인) 또는 무선 기술과 함께 실시된 매체(예를 들어, 마이크로웨이브, 적외선 또는 다른 전송 기술)일 수 있다. 상기 일련의 컴퓨터 명령들은 기능적으로 상기 시스템과 관련하여 상술한 기능의 전체 또는 부분을 포함한다. 당업자들은 이러한 컴퓨터 명령들이 많은 컴퓨터 아키텍쳐들 또는 오퍼레이팅 시스템(OS)들과 함께 사용하기 위하여 다수의 프로그래밍 언어들로 작성될 수 있다는 것을 이해해야 한다. 더 나아가, 이러한 명령들은 예를 들어, 반도체, 자성, 광학 또는 다른 메모리 장치들과 같은 메모리 장치에 저장될 수 있다. 그리고, 예를 들어, 광학, 적외선, 마이크로웨이브, 또는 다른 전송 기술들과 같은 통신 기술을 이용하여 전송될 수 있다. 이러한 컴퓨터 프로그램 상품은, 인쇄 문서 또는 전자 문서(예를 들어, 개별 포장 소프트웨어(shrink wrapped software)), 컴퓨터 시스템에 사전로딩된 매체(예를 들어, 온 시스템 롬(on system ROM) 또는 고정 디스크), 또는, 네트워크 상의 서버로부터 분산되거나, 또는 전자 게시판(bulletin board) 매체(예를 들어, 인터넷 또는 월드 와이드 웹(WWW))와 함께 제거가능한 매체로서 배포될 수 있을 것으로 기대된다. 물론, 본 발명의 몇몇 실시예들은 소프트웨어(예를 들어, 컴퓨터 프로그램 상품)와 하드웨어의 조합으로서 실시될 수 있다. 본 발명의 또 다른 실시예는 완전한 하드웨어 또는 완전한 소프트웨어(예를 들어, 컴퓨터 프로그램 상품)으로서 실시될 수 있다.
비록, 발명의 다양한 실시예들이 기술되었다 하더라도, 발명의 기술 사상을 벗어나지 않는 한 발명의 장점들을 달성할 수 있는 다양한 변경 또는 수정이 이루어질 수 있다는 것은 당업자에게 자명한 것으로 이해되어야 한다.

Claims (14)

  1. 분산된 자연 언어 처리 방식에 있어서,
    모바일 장치에 저장된 1세트(a set)의 로컬 데이터 소스;
    하나 이상의 로컬 해석 후보자들을 결정하기 위하여 상기 로컬 데이터 소스에 대한 자연 언어 입력을 자연 언어 처리하기 위한 상기 모바일 장치 상의 자연 언어 이해(NLU) 매치 모듈; 및
    상기 자연 언어 입력에 따라 최종 출력 해석을 결정하기 위하여 상기 로컬 해석 후보자들 및 원격 NLU 서버의 하나 이상의 원격 해석 후보자들을 처리하기 위한 상기 모바일 장치 상의 로컬 NLU랭킹 모듈;
    을 포함하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
  2. 제 1항에 있어서,
    상기NLU 랭킹 모듈은 상기 최종 출력 해석을 결정하기 위하여 퍼지 매치 알고리즘을 사용하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
  3. 제 1항에 있어서,
    상기 NLU 랭킹 모듈은,
    상기 해석 후보자들을 N-베스트 리스트(N-Best list) 내에 랭크시키는(rank) 것을 특징으로 하는 분산된 자연 언어 처리 방식.
  4. 제 1항에 있어서,
    상기 NLU 랭킹 모듈은,
    최종 출력 해석을 결정하기 전에 상기 로컬 데이터 소스들 내에 나타난 정보들과 관련하여 확인된 원격 해석 후보자들을 더 처리하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
  5. 제 4항에 있어서,
    상기 로컬 NLU 랭킹 모듈은,
    상기 최종 출력 해석을 결정하기 위하여, 상기 원격 NLU 서버의 부가적인 추가 원격 해석 데이터를 상기 로컬 데이터 소스들의 데이터와 함께 더 사용하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
  6. 제 1항에 있어서,
    상기 모바일 장치는,
    상기 원격 해석 후보자들을 개발하기(developing)위하여 상기 NLU 매치 모듈의 자연 언어 처리 결과들을 상기 원격 NLU 서버로 전달하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
  7. 제 1항에 있어서,
    상기 로컬 NLU 랭킹 모듈은,
    상기 최종 출력 해석을 결정하기 위하여 상기 원격 NLU 서버의 랭킹 데이터를 더 고려하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
  8. 분산된 자연 언어를 처리하는 방법에있어서,
    하나 이상의 로컬 해석 후보자들을 결정하기 위하여, 상기 모바일 장치 상에 저장된 로컬 데이터 소스들에 대한 모바일 장치 상의 자연 언어 입력을 처리하는 단계; 및
    로컬 해석 후보자들, 및 원격 NLU 서버로부터의 하나 이상의 원격 해석 후보자들을 모바일 장치에서 처리하는 것에 의한 자연 언어 입력에 따라 최종 출력 해석을 결정하는 단계;
    을 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
  9. 제 8항에 있어서,
    최종 출력 해석은 퍼지 매치 알고리즘에 의하여 결정되는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
  10. 제 8항에 있어서,
    상기 해석 후보자들을 처리하는 단계는,
    상기 해석 후보자들을 N-베스트 리스트 내에 랭크하는 것을 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
  11. 제 8항에 있어서,
    상기 최종 출력 해석을 결정하기 이전에,
    상기 모바일 장치는,
    상기 로컬 데이터 소스들 내에 나타내어진 정보와 관련하여 확인된 원격 해석 후보자들을 더 처리하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
  12. 제 11항에 있어서,
    상기 모바일 장치는,
    상기 최종 출력 해석을 결정하기 위하여, 상기 원격 NLU 서버의 부가적인 추가 원격 해석 데이터를 상기 로컬 데이터 소스들의 데이터와 함께 더 사용하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
  13. 제 8항에 있어서,
    상기 모바일 장치 상의 자연 언어 입력을 처리하는 단계는,
    상기 원격 NLU 서버가 원격 해석 후보자들을 개발하기 위하여, 자연 언어 처리 결과를 상기 원격 NLU 서버로 전달하는 단계를 더 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
  14. 제 8항에 있어서,
    상기 최종 출력 해석을 결정하는 단계는,
    상기 최종 출력 해석을 결정하기 위하여 상기 원격 NLU 서버의 랭킹 데이터를 처리하는 단계를 더 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
KR1020157015792A 2012-11-12 2013-11-07 분산된 nlu/nlp KR101689818B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/674,191 2012-11-12
US13/674,191 US9171066B2 (en) 2012-11-12 2012-11-12 Distributed natural language understanding and processing using local data sources
PCT/US2013/068921 WO2014074698A2 (en) 2012-11-12 2013-11-07 Distributed nlu/nlp

Publications (2)

Publication Number Publication Date
KR20150086313A true KR20150086313A (ko) 2015-07-27
KR101689818B1 KR101689818B1 (ko) 2016-12-26

Family

ID=50682557

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157015792A KR101689818B1 (ko) 2012-11-12 2013-11-07 분산된 nlu/nlp

Country Status (5)

Country Link
US (1) US9171066B2 (ko)
EP (1) EP2917907A4 (ko)
KR (1) KR101689818B1 (ko)
CN (1) CN104919522B (ko)
WO (1) WO2014074698A2 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9431008B2 (en) 2013-05-29 2016-08-30 Nuance Communications, Inc. Multiple parallel dialogs in smart phone applications
EP2980733A1 (en) * 2014-07-31 2016-02-03 Samsung Electronics Co., Ltd Message service providing device and method of providing content via the same
KR101646754B1 (ko) * 2015-03-18 2016-08-12 연세대학교 산학협력단 모바일 시멘틱 검색 장치 및 그 방법
DE102015212650B4 (de) * 2015-07-07 2020-02-13 Volkswagen Aktiengesellschaft Verfahren und System zum rechnergestützten Verarbeiten einer Spracheingabe
US9715498B2 (en) 2015-08-31 2017-07-25 Microsoft Technology Licensing, Llc Distributed server system for language understanding
US11250218B2 (en) 2015-12-11 2022-02-15 Microsoft Technology Licensing, Llc Personalizing natural language understanding systems
US10229687B2 (en) 2016-03-10 2019-03-12 Microsoft Technology Licensing, Llc Scalable endpoint-dependent natural language understanding
US10169336B2 (en) * 2017-01-23 2019-01-01 International Business Machines Corporation Translating structured languages to natural language using domain-specific ontology
KR102464120B1 (ko) * 2017-04-30 2022-11-08 삼성전자주식회사 사용자 발화를 처리하는 전자 장치
CN109102802B (zh) 2017-06-21 2023-10-17 三星电子株式会社 用于处理用户话语的系统
US10453454B2 (en) * 2017-10-26 2019-10-22 Hitachi, Ltd. Dialog system with self-learning natural language understanding
US10713007B2 (en) * 2017-12-12 2020-07-14 Amazon Technologies, Inc. Architecture for a hub configured to control a second device while a connection to a remote system is unavailable
KR102574593B1 (ko) 2018-03-29 2023-09-05 삼성전자주식회사 챗봇을 이용한 서비스 제공 방법 및 그 장치
US11094326B2 (en) * 2018-08-06 2021-08-17 Cisco Technology, Inc. Ensemble modeling of automatic speech recognition output
US10885912B2 (en) * 2018-11-13 2021-01-05 Motorola Solutions, Inc. Methods and systems for providing a corrected voice command
KR20220008401A (ko) * 2019-06-07 2022-01-21 엘지전자 주식회사 엣지 컴퓨팅 디바이스에서 음성 인식 방법
CN113506568B (zh) * 2020-04-28 2024-04-16 海信集团有限公司 中控及智能设备控制方法
CN111695689B (zh) * 2020-06-15 2023-06-20 中国人民解放军国防科技大学 一种自然语言处理方法、装置、设备及可读存储介质
CN111564156B (zh) * 2020-07-03 2021-01-26 杭州摸象大数据科技有限公司 外呼系统部署方法、装置、计算机设备及存储介质
US11900921B1 (en) * 2020-10-26 2024-02-13 Amazon Technologies, Inc. Multi-device speech processing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100057450A1 (en) * 2008-08-29 2010-03-04 Detlef Koll Hybrid Speech Recognition
US20110015928A1 (en) * 2009-07-15 2011-01-20 Microsoft Corporation Combination and federation of local and remote speech recognition
US20110060587A1 (en) * 2007-03-07 2011-03-10 Phillips Michael S Command and control utilizing ancillary information in a mobile voice-to-speech application
US20120179471A1 (en) * 2011-01-07 2012-07-12 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030182113A1 (en) * 1999-11-22 2003-09-25 Xuedong Huang Distributed speech recognition for mobile communication devices
US7613719B2 (en) 2004-03-18 2009-11-03 Microsoft Corporation Rendering tables with natural language commands
US8589156B2 (en) 2004-07-12 2013-11-19 Hewlett-Packard Development Company, L.P. Allocation of speech recognition tasks and combination of results thereof
US20060235684A1 (en) * 2005-04-14 2006-10-19 Sbc Knowledge Ventures, Lp Wireless device to access network-based voice-activated services using distributed speech recognition
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
WO2008114708A1 (ja) * 2007-03-14 2008-09-25 Nec Corporation 音声認識システム、音声認識方法、および音声認識処理プログラム
US20110184740A1 (en) * 2010-01-26 2011-07-28 Google Inc. Integration of Embedded and Network Speech Recognizers
US9183560B2 (en) * 2010-05-28 2015-11-10 Daniel H. Abelow Reality alternate
US20120215531A1 (en) * 2011-02-18 2012-08-23 Nuance Communications, Inc. Increased User Interface Responsiveness for System with Multi-Modal Input and High Response Latencies
US8660847B2 (en) * 2011-09-02 2014-02-25 Microsoft Corporation Integrated local and cloud based speech recognition
US9721563B2 (en) * 2012-06-08 2017-08-01 Apple Inc. Name recognition system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110060587A1 (en) * 2007-03-07 2011-03-10 Phillips Michael S Command and control utilizing ancillary information in a mobile voice-to-speech application
US20100057450A1 (en) * 2008-08-29 2010-03-04 Detlef Koll Hybrid Speech Recognition
US20110015928A1 (en) * 2009-07-15 2011-01-20 Microsoft Corporation Combination and federation of local and remote speech recognition
US20120179471A1 (en) * 2011-01-07 2012-07-12 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers

Also Published As

Publication number Publication date
WO2014074698A3 (en) 2014-08-21
CN104919522A (zh) 2015-09-16
EP2917907A2 (en) 2015-09-16
US9171066B2 (en) 2015-10-27
CN104919522B (zh) 2018-04-27
EP2917907A4 (en) 2016-06-22
WO2014074698A2 (en) 2014-05-15
US20140136183A1 (en) 2014-05-15
KR101689818B1 (ko) 2016-12-26

Similar Documents

Publication Publication Date Title
KR101689818B1 (ko) 분산된 nlu/nlp
US9619459B2 (en) Situation aware NLU/NLP
US10719507B2 (en) System and method for natural language processing
US20230237328A1 (en) Information processing method and terminal, and computer storage medium
US10282419B2 (en) Multi-domain natural language processing architecture
US10672391B2 (en) Improving automatic speech recognition of multilingual named entities
US10630798B2 (en) Artificial intelligence based method and apparatus for pushing news
CN110807332A (zh) 语义理解模型的训练方法、语义处理方法、装置及存储介质
US8903837B2 (en) Incorporating geographical locations in a search process
US11164562B2 (en) Entity-level clarification in conversation services
CN107209757B (zh) 自然语言理解缓存器
CN110795552A (zh) 一种训练样本生成方法、装置、电子设备及存储介质
MXPA04001729A (es) Metodos y sistemas para traduccion de idiomas.
JP2020030408A (ja) オーディオにおける重要語句を認識するための方法、装置、機器及び媒体
JP6849723B2 (ja) 情報を生成するための方法及び装置
JP2019008783A (ja) ソーシャルネットワークコンテンツを基盤に単語ベクトル化技法を利用して日常言語に拡張するための方法およびシステム
CN109710732B (zh) 信息查询方法、装置、存储介质和电子设备
CN110874528B (zh) 文本相似度的获取方法及装置
CN112507706A (zh) 知识预训练模型的训练方法、装置和电子设备
KR20210002619A (ko) 네트워크 시스템에서 도메인-특정 모델의 생성
CN111008309A (zh) 查询方法及装置
CN108268443B (zh) 确定话题点转移以及获取回复文本的方法、装置
US11289071B2 (en) Information processing system, information processing device, computer program, and method for updating dictionary database
EP3635572B1 (en) Subquery generation from a query
CN116913278B (zh) 语音处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
GRNT Written decision to grant