KR20150086313A - 분산된 nlu/nlp - Google Patents
분산된 nlu/nlp Download PDFInfo
- Publication number
- KR20150086313A KR20150086313A KR1020157015792A KR20157015792A KR20150086313A KR 20150086313 A KR20150086313 A KR 20150086313A KR 1020157015792 A KR1020157015792 A KR 1020157015792A KR 20157015792 A KR20157015792 A KR 20157015792A KR 20150086313 A KR20150086313 A KR 20150086313A
- Authority
- KR
- South Korea
- Prior art keywords
- nlu
- interpretation
- remote
- natural language
- local
- Prior art date
Links
Images
Classifications
-
- G06F17/30654—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/085—Methods for reducing search complexity, pruning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Abstract
분산된 자연 언어 처리를 위한 방식 및 방법이 기술된다. 모바일 장치 상에 1세트의 로컬 데이터 소스가 저장된다. 하나 이상의 로컬 해석 후보자들을 결정하기 위하여, 모바일 장치 상의 로컬 NLU 매치 모듈이 로컬 데이터 소스들과 관련하여 자연 언어 입력의 자연 언어 처리를 수행한다. 상기 모바일 장치 상의 로컬 NLU 랭킹 모듈은 상기 자연 언어 입력에 따라 최종 출력 해석을 결정하기 위하여 로컬 해석 후보자들 및 원격 NLU 서버의 하나 이상의 원격 해석 후보자들을 처리한다.
Description
이 출원은 2012. 11. 12 자로 출원된 미국 특허 출원 제13/674,191호를 우선권 주장하여 출원하며, 그 전체가 이하 참조된다.
본 발명은 자연언어 (natural language) 처리를 위한 분산(distribute) 클라이언트-서버 방식에 관한 것이다.
자연 언어 처리(NLP, Natural Language Processing) 및 자연 언어 이해(NLU, Natural Language Understanding)는 인간의 말과 문장과 같은 자연 언어 입력들로부터의 의미있는 정보들을 추출하기 위해 컴퓨터 처리를 사용한다. 이와 관련한 최근 기술 중 하나는, 스마트폰과 같은 모바일 기기 내의 말(speech) 및/또는 문장(text) 쿼리들(queries)을 처리하는 것이다.
도 1은 이러한 모바일 기기 어플리케이션 중 하나이며, 말 쿼리(speech query) 입력을 처리하고, 다양한 최상의(top) 웹사이트들과 컨텐츠 소스들로부터 동시(simultaneous) 검색 결과를 획득하는 드래곤 고!(Dragon Go!) 의 스크린샷을 나타낸다. 상기 어플리케이션은 입력 쿼리들로부터 의미론적 의미(semantic meaning)를 추출하기 위하여 존재하는 웹 검색 알고리즘에 자연언어 이해 요소의 추가를 필요로한다. 이것은 의미론적(semantic) 템플릿(template) 구조를 발견하기 위하여 근사치인 문자열 매칭(string matching)을 사용하는 것을 수반(involve)할 수 있다. 하나 이상의 의미론적 의미는 각 의미론적 템플릿에 할당될 수 있다. 파싱(Parsing) 규칙(rule) 및 분류사(classifier) 훈련(training) 샘플들은 쿼리 통역(때때로, 쿼리 호출(query intents)로서 참조되는)을 결정하는 NLU 모델들을 훈련하기 위하여 생성되고 사용될 수 있다.
드래곤 고!와 같은 모바일 장치를 위한 복잡한 NLU 어플리케이션들은 NLU 프로세싱이 원격 서버상에서 단독으로 완료되는 곳에서 클라이언트-서버 아키텍쳐를 사용하여 실행된다. 그러나, NLU 결과를 최적화 하기 위하여 원격 NLU 프로세서로 업로드되어야 하는 로컬 모바일 장치 상에 저장된 상당량의 연관된 데이터, 예를 들어, 미팅 리스트(제목, 내용, 참석자), 연락처, 음악 리스트, 등이 존재할 수 있다.
서버 측 NLU에 의하여 영향을 받을(leveraged) 수 있는 이 데이터의 전송은, 비밀 관심사들(confidentiality concerns) 과, 업로드 후 싱크를 유지해야 하는 대량(sheer amount)의 데이터를 포함하는 다양한 이유들을 포함하는 문제가 있을 수 있다.
본 발명의 바람직한 실시예는 분산된 자연 언어 처리를 위한 방식 및 관련된 방법에 관한 것이다.
1 세트(a set of)의 로컬 데이터 소스가 모바일 장치에 저장된다. 모바일 장치의 로컬(local) 자연 언어 이해(NLU, Natural Language Understanding) 매치 모듈(match module)은 하나 이상의 로컬 해석(interpretation) 후보자들(candidates)을 결정하기 위하여 로컬 데이터 소스들에 대한 자연 언어 입력(input)의 자연 언어 처리를 수행한다. 모바일 장치 상의 로컬 NLU 랭킹 모듈은 자연 언어 입력과 관련한 최종 출력(output) 해석을 결정하기 위하여 로컬 해석 후보자들과 원격 NLU 서버의 하나 이상의 원격 해석 후보자들 을 처리한다.
상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 및/또는 N-베스트 리스트(N-Best list) 내의 해석 후보자들을 랭크하기(rank) 위하여 퍼지 매치 알고리즘(fuzzy match algorithm)을 사용할 수 있다. 상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 전에 상기 로컬 데이터 소스 내에 보여진 정보들과 관련하여 확인된 원격 해석 후보자들을 더 처리할 수 있다. 예를 들어, 상기 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 로컬 데이터 소스들의 데이터들과 함께 원격 NLU 서버의 추가적인 부가(supplemental) 원격 해석 데이터를 더 사용할 수 있다.
상기 모바일 장치는 원격 해석 후보자들을 개발하기(developing) 위하여 상기 NLU 매치 모듈의 자연 언어 처리 결과를 상기 원격 NLU 서버로 전달(forward)할 수 있다. 그리고, 상기 로컬 NLU 랭킹 모듈은 최종 출력 해석을 결정하기 위하여 원격 NLU 서버로부터 랭킹 데이터를 더 고려(consider)할 수 있다.
도 1은 모바일 장치를 위한 자연 언어 쿼리 어플리케이션의 몇몇 실시예들을 나타내는 스크린샷이다.
도 2는 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 방식을 나타낸다.
도 3은 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 내의 다양한 기능적 단계들을 나타내는 플로우차트이다.
도 2는 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 방식을 나타낸다.
도 3은 본 발명의 일 실시예에 따른 분산된 자연 언어 처리 내의 다양한 기능적 단계들을 나타내는 플로우차트이다.
본 발명의 실시예들은 사용가능한 데이터 및 리소스들을 사용하여, 장치의(on-device) 데이터를, 일부(some) 처리들을 모바일 장치 상에서 로컬적으로(locally) 수행하고, 일부 처리들을 서버 상에서 원격으로 (remotely) 수행하도록 하는 NLU 처리의 분산된 클라이언트-서버 방식에 관한 것이다.
도 2는 분산된 자연 언어 처리 방식의 일 실시예를 나타내고, 도 3은 본 발명의 일 실시예에 따른 분산된 자연 언어 처리의 다양한 기능적 단계들을 나타내는 플로우차트이다. 이하, 일 실시예의 쿼리로서 기술되는 “콜 밥(call bob)”은 최근 상영되고 있는 영화 제목 “콜 밥”을 지칭하기 위한 목적으로서 사용된다.
모바일 장치(200)는 사용자로부터 자연 언어 입력(201)을 받는다(단계 301). 상기 모바일 장치(200)는 사용 가능한 원격 데이터 리소스(205)들을 사용하여 하나 이상의 원격 해석 후보자들을 결정하기 위한 상기 입력의 NLU 처리를 수행하는 원격 NLU 서버(204)로 상기 자연 언어 입력(201)을 전달 한다(단계 302). 또한, 모바일 장치의 상대적으로 가벼운(lightweight) 자연 언어 이해(NLU) 매치 모듈(202)은, 하나 이상의 로컬 해석 후보자들, 예를 들어, 퍼지 매치 알고리즘(fuzzy match algorithm)을 결정하기 위하여 로컬 데이터 소스들(203)에 대한 입력(input)의 로컬 NLU 처리를 수행한다(단계 303). 상기 로컬 데이터 소스(203)들은 일반적으로, 상기 장치 내의(all local to the device), 제한 없는 음악 리스트, 이메일 내용들, 미팅 내용들, 연락처 리스트, 등을 포함할 수 있다. 몇몇 실시예에서, 상기 NLU 매치 모듈(202)에 의한 상기 로컬 NLU 처리의 몇몇 또는 모든 결과(예를 들어, 말 검출 결과(mention detection results), 의미 부가 추출(semantic attachment extraction), 쿼리 호출(intents), 및/또는 의미 분류(classification) 결과)는 그 해석들을 늘리기(augment) 위한 정보들을 사용하는 상기 원격 NLU 서버(204)로 전달 될 수 있다.
상기 모바일 장치(200) 상의 로컬 NLU 랭킹 모듈(206)은 상기 원격 NLU 서버(204)로부터 원격 해석 후보자 들을 수신하고(단계 304), 조합된 해석 후보자들을 조합된 N-베스트 리스트로 다시-랭크하도록(re-rank) 상기 NLU 매치 모듈(202)로부터 로컬 해석 후보자들과 함께 처리하며(단계 305), 상기 자연 언어 입력(201)에 대하여 최종 출력 해석(207)을 결정한다. 몇몇 실시예에서, 상기 원격 NLU 서버(204)는 일부 또는 모든 후보자 랭킹을 스스로 실시하고, 랭킹 결과를 상기 원격 해석 후보자들과 함께 상기 모바일 장치(200)으로 회신할 수 있다.
이 방식에서, 상기 모바일 장치(200) 의 로컬 데이터(203) 중 일부에 억세스(access) 했다면, 생존해 있을 수 있는 해석 후보자들을 상기 서버 NLU(204)가 버리지(prune) 않도록 하는 데 유용할 수 있다. 즉, 원격 해석 후보자들의 상기 N-베스트 리스트는 상기 상황(circumstances) 에서 버려지지 않아야 될 필요가 있다. 상기 서버 NLU(204)는 최상의 결과를 획득하기 위하여 상기 서버 NLU(204)를 통하여 각 샘플 쿼리로 나아가는(running), 일 실시에의 쿼리(example queries)와 관련한 음악, 미팅, 연락처 정보, 등을 위한 NLU 트레이닝 데이터에 기반하여 훈련될 수 있다. 이후, 상기 서버 NLU(204)의 훈련은 로컬 모바일 장치(200) 상에 존재할 수 있는 음악, 미팅, 연락처 정보, 등의 데이터를 제외한(minus) 동일한 트레이닝 데이터 상에서 반복될 수 있다. 그리고, 각 쿼리는 상기 서버 NLU(204)를 통하여 재-구동(re-run)되고 최상의 결과를 획득한다. 이것은 NLU 출력과 함께 트레이닝 데이터를 생성한다. (추상적인(abstract) 특성들은 상기 NLU 출력으로부터 구축될 수 있다). 그리고, 각각의 트레이닝 쿼리 샘플을 위하여, 만일 상기 서버 NLU(204)의 최상의 NLU 결과가 수도(pseudo)-로컬 데이터의 존재와 함께 변경된다면, 만일 로컬 모바일 장치(200) 의 로컬 데이터(203)가 사용가능하면 상기 쿼리가 변경되는 것을 허용한다면 트레이닝된 서버 NLU(204)는 서버측 상에서 각 쿼리에 대하여 확인할 수 있다. 런-타임 오퍼레이션(run-time operation)중, 만일 상기 서버 NLU(204)가 주어진 해석 후보자가
로컬 데이터(203)에 의하여 영향을 받는 것을 허용한다면, 이후의 상기 모바일 장치(200) 상의 로컬 처리를 위하여 NLU 랭커(206)으로 전송(사용 가능한 다른 유용한 로컬 처리 정보와 함께)될 때 상기 해석 후보자는 플래그된다(flagged). 이러한 방식의 한가지 효과는 상기 서버 NLU(204)로부터 상기 로컬 NLU 랭커(206)로의 원격 해석 후보자들의 긴 N-베스트 리스트 이고, 민감하거나 또는 대역폭을 소모하는 정보가 상기 모바일 장치(200)으로부터 상기 서버 NLU(204)로 전송되지 않는다는 것이다.
실시예의 쿼리 “콜 밥”으로 돌아가서, 상기 모바일 장치(200)는 이 자연 언어 입력(201)을 하나 이상의 원격 해석 후보자들을 생성하기 위하여 NLU 처리하는 상기 서버 NLU(204)로 전송한다.
그리고, 이 쿼리가 상기 모바일 장치(200) 상에서 더 처리되고 재 랭크(re-rank)되어야 한다는 것을 확인한다.
상기 서버 NLU(204)로부터의 원격 해석 후보자들은
1. “[영화] 콜 밥 [/영화]”: 영화(“[Movie] call bob [/Movie]”: Movie )
2.“콜[사람] 밥[/사람]”: 콜-연락처(“call [Person] bob [/Person]”: Call-Contact)
가 되어야 한다.
이것들은 상기 모바일 장치(200)으로 전송된다(가능하면 다른 유용한 정보들과 함께). 상기 NLU 모듈(202)은 상기 로컬 데이터(203) 내에 주어진 영화 및 연락처 DB 상에서 퍼지 매치를 수행한다. 만일, 영화 “콜 밥”이 상기 로컬 데이터(203)에 존재한다면, 상기 해석 후보자들은 재-오더(re-ordered)되지 않는다. 상기 영화가 최근 나온 것으로 추정된다면면 그것은 이 가상의 시나리오 내에 존재하지 않을 것이다. 만일, “밥 스미스(Bob Smith)” 라는 연락처가 존재한다면, 상기 NLU 랭커(ranker)(206)는 전화-연락(Call-Contact now)이 상단에 출력 해석(207)으로서 존재하는 해석 후보들을 재-정렬(re-sort)한다.
본 발명의 실시예는 현존하는 컴퓨터 프로그래밍 언어인, VHDL, SystemC, Verilog, ASM, 등에 전체 또는 부분으로 적용될 수 있다. 본 발명의 다른 실시예는 사전 프로그래밍된 하드웨어 요소, 다른 관련된 요소, 또는 하드웨어와 소프트웨어 요소의 조합으로서 적용될 수 있다.
실시예는 컴퓨터 시스템의 사용을 위한 컴퓨터 프로그램 상품으로서 전체 또는 부분으로 적용될 수 있다. 이러한 실시(implementation)는 컴퓨터 읽기가능 수단(예를 들어, 디스켓, CD-ROM, ROM, 또는 고정된 디스크)와 같은 유형 매체(tangible medium)에 고정되거나(fixed), 또는, 매체를 넘어 네트워크와 연결된 통신 어댑터와 같은, 모뎀 또는 다른 인터페이스 장치를 통하여, 컴퓨터 시스템으로 전송가능한 일련의 컴퓨터 명령(computer instruction)을 포함할 수 있다. 상기 매체는 유형 매체(예를 들어, 광학 또는 아날로그 통신 라인) 또는 무선 기술과 함께 실시된 매체(예를 들어, 마이크로웨이브, 적외선 또는 다른 전송 기술)일 수 있다. 상기 일련의 컴퓨터 명령들은 기능적으로 상기 시스템과 관련하여 상술한 기능의 전체 또는 부분을 포함한다. 당업자들은 이러한 컴퓨터 명령들이 많은 컴퓨터 아키텍쳐들 또는 오퍼레이팅 시스템(OS)들과 함께 사용하기 위하여 다수의 프로그래밍 언어들로 작성될 수 있다는 것을 이해해야 한다. 더 나아가, 이러한 명령들은 예를 들어, 반도체, 자성, 광학 또는 다른 메모리 장치들과 같은 메모리 장치에 저장될 수 있다. 그리고, 예를 들어, 광학, 적외선, 마이크로웨이브, 또는 다른 전송 기술들과 같은 통신 기술을 이용하여 전송될 수 있다. 이러한 컴퓨터 프로그램 상품은, 인쇄 문서 또는 전자 문서(예를 들어, 개별 포장 소프트웨어(shrink wrapped software)), 컴퓨터 시스템에 사전로딩된 매체(예를 들어, 온 시스템 롬(on system ROM) 또는 고정 디스크), 또는, 네트워크 상의 서버로부터 분산되거나, 또는 전자 게시판(bulletin board) 매체(예를 들어, 인터넷 또는 월드 와이드 웹(WWW))와 함께 제거가능한 매체로서 배포될 수 있을 것으로 기대된다. 물론, 본 발명의 몇몇 실시예들은 소프트웨어(예를 들어, 컴퓨터 프로그램 상품)와 하드웨어의 조합으로서 실시될 수 있다. 본 발명의 또 다른 실시예는 완전한 하드웨어 또는 완전한 소프트웨어(예를 들어, 컴퓨터 프로그램 상품)으로서 실시될 수 있다.
비록, 발명의 다양한 실시예들이 기술되었다 하더라도, 발명의 기술 사상을 벗어나지 않는 한 발명의 장점들을 달성할 수 있는 다양한 변경 또는 수정이 이루어질 수 있다는 것은 당업자에게 자명한 것으로 이해되어야 한다.
Claims (14)
- 분산된 자연 언어 처리 방식에 있어서,
모바일 장치에 저장된 1세트(a set)의 로컬 데이터 소스;
하나 이상의 로컬 해석 후보자들을 결정하기 위하여 상기 로컬 데이터 소스에 대한 자연 언어 입력을 자연 언어 처리하기 위한 상기 모바일 장치 상의 자연 언어 이해(NLU) 매치 모듈; 및
상기 자연 언어 입력에 따라 최종 출력 해석을 결정하기 위하여 상기 로컬 해석 후보자들 및 원격 NLU 서버의 하나 이상의 원격 해석 후보자들을 처리하기 위한 상기 모바일 장치 상의 로컬 NLU랭킹 모듈;
을 포함하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
- 제 1항에 있어서,
상기NLU 랭킹 모듈은 상기 최종 출력 해석을 결정하기 위하여 퍼지 매치 알고리즘을 사용하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
- 제 1항에 있어서,
상기 NLU 랭킹 모듈은,
상기 해석 후보자들을 N-베스트 리스트(N-Best list) 내에 랭크시키는(rank) 것을 특징으로 하는 분산된 자연 언어 처리 방식.
- 제 1항에 있어서,
상기 NLU 랭킹 모듈은,
최종 출력 해석을 결정하기 전에 상기 로컬 데이터 소스들 내에 나타난 정보들과 관련하여 확인된 원격 해석 후보자들을 더 처리하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
- 제 4항에 있어서,
상기 로컬 NLU 랭킹 모듈은,
상기 최종 출력 해석을 결정하기 위하여, 상기 원격 NLU 서버의 부가적인 추가 원격 해석 데이터를 상기 로컬 데이터 소스들의 데이터와 함께 더 사용하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
- 제 1항에 있어서,
상기 모바일 장치는,
상기 원격 해석 후보자들을 개발하기(developing)위하여 상기 NLU 매치 모듈의 자연 언어 처리 결과들을 상기 원격 NLU 서버로 전달하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
- 제 1항에 있어서,
상기 로컬 NLU 랭킹 모듈은,
상기 최종 출력 해석을 결정하기 위하여 상기 원격 NLU 서버의 랭킹 데이터를 더 고려하는 것을 특징으로 하는 분산된 자연 언어 처리 방식.
- 분산된 자연 언어를 처리하는 방법에있어서,
하나 이상의 로컬 해석 후보자들을 결정하기 위하여, 상기 모바일 장치 상에 저장된 로컬 데이터 소스들에 대한 모바일 장치 상의 자연 언어 입력을 처리하는 단계; 및
로컬 해석 후보자들, 및 원격 NLU 서버로부터의 하나 이상의 원격 해석 후보자들을 모바일 장치에서 처리하는 것에 의한 자연 언어 입력에 따라 최종 출력 해석을 결정하는 단계;
을 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
- 제 8항에 있어서,
최종 출력 해석은 퍼지 매치 알고리즘에 의하여 결정되는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
- 제 8항에 있어서,
상기 해석 후보자들을 처리하는 단계는,
상기 해석 후보자들을 N-베스트 리스트 내에 랭크하는 것을 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
- 제 8항에 있어서,
상기 최종 출력 해석을 결정하기 이전에,
상기 모바일 장치는,
상기 로컬 데이터 소스들 내에 나타내어진 정보와 관련하여 확인된 원격 해석 후보자들을 더 처리하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
- 제 11항에 있어서,
상기 모바일 장치는,
상기 최종 출력 해석을 결정하기 위하여, 상기 원격 NLU 서버의 부가적인 추가 원격 해석 데이터를 상기 로컬 데이터 소스들의 데이터와 함께 더 사용하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
- 제 8항에 있어서,
상기 모바일 장치 상의 자연 언어 입력을 처리하는 단계는,
상기 원격 NLU 서버가 원격 해석 후보자들을 개발하기 위하여, 자연 언어 처리 결과를 상기 원격 NLU 서버로 전달하는 단계를 더 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
- 제 8항에 있어서,
상기 최종 출력 해석을 결정하는 단계는,
상기 최종 출력 해석을 결정하기 위하여 상기 원격 NLU 서버의 랭킹 데이터를 처리하는 단계를 더 포함하는 것을 특징으로 하는 분산된 자연 언어를 처리하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/674,191 | 2012-11-12 | ||
US13/674,191 US9171066B2 (en) | 2012-11-12 | 2012-11-12 | Distributed natural language understanding and processing using local data sources |
PCT/US2013/068921 WO2014074698A2 (en) | 2012-11-12 | 2013-11-07 | Distributed nlu/nlp |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150086313A true KR20150086313A (ko) | 2015-07-27 |
KR101689818B1 KR101689818B1 (ko) | 2016-12-26 |
Family
ID=50682557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157015792A KR101689818B1 (ko) | 2012-11-12 | 2013-11-07 | 분산된 nlu/nlp |
Country Status (5)
Country | Link |
---|---|
US (1) | US9171066B2 (ko) |
EP (1) | EP2917907A4 (ko) |
KR (1) | KR101689818B1 (ko) |
CN (1) | CN104919522B (ko) |
WO (1) | WO2014074698A2 (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9431008B2 (en) | 2013-05-29 | 2016-08-30 | Nuance Communications, Inc. | Multiple parallel dialogs in smart phone applications |
EP2980733A1 (en) * | 2014-07-31 | 2016-02-03 | Samsung Electronics Co., Ltd | Message service providing device and method of providing content via the same |
KR101646754B1 (ko) * | 2015-03-18 | 2016-08-12 | 연세대학교 산학협력단 | 모바일 시멘틱 검색 장치 및 그 방법 |
DE102015212650B4 (de) * | 2015-07-07 | 2020-02-13 | Volkswagen Aktiengesellschaft | Verfahren und System zum rechnergestützten Verarbeiten einer Spracheingabe |
US9715498B2 (en) | 2015-08-31 | 2017-07-25 | Microsoft Technology Licensing, Llc | Distributed server system for language understanding |
US11250218B2 (en) | 2015-12-11 | 2022-02-15 | Microsoft Technology Licensing, Llc | Personalizing natural language understanding systems |
US10229687B2 (en) | 2016-03-10 | 2019-03-12 | Microsoft Technology Licensing, Llc | Scalable endpoint-dependent natural language understanding |
US10169336B2 (en) * | 2017-01-23 | 2019-01-01 | International Business Machines Corporation | Translating structured languages to natural language using domain-specific ontology |
KR102464120B1 (ko) * | 2017-04-30 | 2022-11-08 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 |
CN109102802B (zh) | 2017-06-21 | 2023-10-17 | 三星电子株式会社 | 用于处理用户话语的系统 |
US10453454B2 (en) * | 2017-10-26 | 2019-10-22 | Hitachi, Ltd. | Dialog system with self-learning natural language understanding |
US10713007B2 (en) * | 2017-12-12 | 2020-07-14 | Amazon Technologies, Inc. | Architecture for a hub configured to control a second device while a connection to a remote system is unavailable |
KR102574593B1 (ko) | 2018-03-29 | 2023-09-05 | 삼성전자주식회사 | 챗봇을 이용한 서비스 제공 방법 및 그 장치 |
US11094326B2 (en) * | 2018-08-06 | 2021-08-17 | Cisco Technology, Inc. | Ensemble modeling of automatic speech recognition output |
US10885912B2 (en) * | 2018-11-13 | 2021-01-05 | Motorola Solutions, Inc. | Methods and systems for providing a corrected voice command |
KR20220008401A (ko) * | 2019-06-07 | 2022-01-21 | 엘지전자 주식회사 | 엣지 컴퓨팅 디바이스에서 음성 인식 방법 |
CN113506568B (zh) * | 2020-04-28 | 2024-04-16 | 海信集团有限公司 | 中控及智能设备控制方法 |
CN111695689B (zh) * | 2020-06-15 | 2023-06-20 | 中国人民解放军国防科技大学 | 一种自然语言处理方法、装置、设备及可读存储介质 |
CN111564156B (zh) * | 2020-07-03 | 2021-01-26 | 杭州摸象大数据科技有限公司 | 外呼系统部署方法、装置、计算机设备及存储介质 |
US11900921B1 (en) * | 2020-10-26 | 2024-02-13 | Amazon Technologies, Inc. | Multi-device speech processing |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100057450A1 (en) * | 2008-08-29 | 2010-03-04 | Detlef Koll | Hybrid Speech Recognition |
US20110015928A1 (en) * | 2009-07-15 | 2011-01-20 | Microsoft Corporation | Combination and federation of local and remote speech recognition |
US20110060587A1 (en) * | 2007-03-07 | 2011-03-10 | Phillips Michael S | Command and control utilizing ancillary information in a mobile voice-to-speech application |
US20120179471A1 (en) * | 2011-01-07 | 2012-07-12 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030182113A1 (en) * | 1999-11-22 | 2003-09-25 | Xuedong Huang | Distributed speech recognition for mobile communication devices |
US7613719B2 (en) | 2004-03-18 | 2009-11-03 | Microsoft Corporation | Rendering tables with natural language commands |
US8589156B2 (en) | 2004-07-12 | 2013-11-19 | Hewlett-Packard Development Company, L.P. | Allocation of speech recognition tasks and combination of results thereof |
US20060235684A1 (en) * | 2005-04-14 | 2006-10-19 | Sbc Knowledge Ventures, Lp | Wireless device to access network-based voice-activated services using distributed speech recognition |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
WO2008114708A1 (ja) * | 2007-03-14 | 2008-09-25 | Nec Corporation | 音声認識システム、音声認識方法、および音声認識処理プログラム |
US20110184740A1 (en) * | 2010-01-26 | 2011-07-28 | Google Inc. | Integration of Embedded and Network Speech Recognizers |
US9183560B2 (en) * | 2010-05-28 | 2015-11-10 | Daniel H. Abelow | Reality alternate |
US20120215531A1 (en) * | 2011-02-18 | 2012-08-23 | Nuance Communications, Inc. | Increased User Interface Responsiveness for System with Multi-Modal Input and High Response Latencies |
US8660847B2 (en) * | 2011-09-02 | 2014-02-25 | Microsoft Corporation | Integrated local and cloud based speech recognition |
US9721563B2 (en) * | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
-
2012
- 2012-11-12 US US13/674,191 patent/US9171066B2/en not_active Expired - Fee Related
-
2013
- 2013-11-07 CN CN201380069684.4A patent/CN104919522B/zh active Active
- 2013-11-07 KR KR1020157015792A patent/KR101689818B1/ko active IP Right Grant
- 2013-11-07 WO PCT/US2013/068921 patent/WO2014074698A2/en active Application Filing
- 2013-11-07 EP EP13852800.5A patent/EP2917907A4/en not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110060587A1 (en) * | 2007-03-07 | 2011-03-10 | Phillips Michael S | Command and control utilizing ancillary information in a mobile voice-to-speech application |
US20100057450A1 (en) * | 2008-08-29 | 2010-03-04 | Detlef Koll | Hybrid Speech Recognition |
US20110015928A1 (en) * | 2009-07-15 | 2011-01-20 | Microsoft Corporation | Combination and federation of local and remote speech recognition |
US20120179471A1 (en) * | 2011-01-07 | 2012-07-12 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
Also Published As
Publication number | Publication date |
---|---|
WO2014074698A3 (en) | 2014-08-21 |
CN104919522A (zh) | 2015-09-16 |
EP2917907A2 (en) | 2015-09-16 |
US9171066B2 (en) | 2015-10-27 |
CN104919522B (zh) | 2018-04-27 |
EP2917907A4 (en) | 2016-06-22 |
WO2014074698A2 (en) | 2014-05-15 |
US20140136183A1 (en) | 2014-05-15 |
KR101689818B1 (ko) | 2016-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101689818B1 (ko) | 분산된 nlu/nlp | |
US9619459B2 (en) | Situation aware NLU/NLP | |
US10719507B2 (en) | System and method for natural language processing | |
US20230237328A1 (en) | Information processing method and terminal, and computer storage medium | |
US10282419B2 (en) | Multi-domain natural language processing architecture | |
US10672391B2 (en) | Improving automatic speech recognition of multilingual named entities | |
US10630798B2 (en) | Artificial intelligence based method and apparatus for pushing news | |
CN110807332A (zh) | 语义理解模型的训练方法、语义处理方法、装置及存储介质 | |
US8903837B2 (en) | Incorporating geographical locations in a search process | |
US11164562B2 (en) | Entity-level clarification in conversation services | |
CN107209757B (zh) | 自然语言理解缓存器 | |
CN110795552A (zh) | 一种训练样本生成方法、装置、电子设备及存储介质 | |
MXPA04001729A (es) | Metodos y sistemas para traduccion de idiomas. | |
JP2020030408A (ja) | オーディオにおける重要語句を認識するための方法、装置、機器及び媒体 | |
JP6849723B2 (ja) | 情報を生成するための方法及び装置 | |
JP2019008783A (ja) | ソーシャルネットワークコンテンツを基盤に単語ベクトル化技法を利用して日常言語に拡張するための方法およびシステム | |
CN109710732B (zh) | 信息查询方法、装置、存储介质和电子设备 | |
CN110874528B (zh) | 文本相似度的获取方法及装置 | |
CN112507706A (zh) | 知识预训练模型的训练方法、装置和电子设备 | |
KR20210002619A (ko) | 네트워크 시스템에서 도메인-특정 모델의 생성 | |
CN111008309A (zh) | 查询方法及装置 | |
CN108268443B (zh) | 确定话题点转移以及获取回复文本的方法、装置 | |
US11289071B2 (en) | Information processing system, information processing device, computer program, and method for updating dictionary database | |
EP3635572B1 (en) | Subquery generation from a query | |
CN116913278B (zh) | 语音处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
GRNT | Written decision to grant |