KR20070043625A - 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동생성 방법 및 머신 판독 가능 저장 장치 - Google Patents

혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동생성 방법 및 머신 판독 가능 저장 장치 Download PDF

Info

Publication number
KR20070043625A
KR20070043625A KR1020060101554A KR20060101554A KR20070043625A KR 20070043625 A KR20070043625 A KR 20070043625A KR 1020060101554 A KR1020060101554 A KR 1020060101554A KR 20060101554 A KR20060101554 A KR 20060101554A KR 20070043625 A KR20070043625 A KR 20070043625A
Authority
KR
South Korea
Prior art keywords
grammar
mixed
user
grammars
discourse
Prior art date
Application number
KR1020060101554A
Other languages
English (en)
Inventor
순톤 아티바니차야퐁
데이비드 자라밀로
제랄드 매튜 맥콥
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20070043625A publication Critical patent/KR20070043625A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models

Abstract

혼합 주도형 문법(mixed-initiative grammar)을 구성하는 방법은 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법(directed dialog grammars)을 식별하는 단계와, 선택된 문법 생성 기법에 따라서 혼합 주도형 문법을 자동적으로 생성하는 단계를 포함하는 것에 의해, 혼합 주도형 문법은 복수의 지시적 담화 문법을 상술하게 된다.

Description

혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동 생성 방법 및 머신 판독 가능 저장 장치{CREATING A MIXED-INITIATIVE GRAMMAR FROM DIRECTED DIALOG GRAMMARS}
도 1은 본 발명의 일 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI(graphical user interface)를 나타내는 도식적인 도면.
도 2는 본 발명의 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI를 나타내는 도식적인 도면.
도 3은 본 명세서에 개시된 본 발명의 장치에 따라서 생성될 수 있는 하나의 다양한 혼합 주도형 문법을 나타내는 예시적인 코드.
도 4는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 다른 다양한 혼합 주도형 문법을 나타내는 예시적인 코드.
도 5는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 또 다른 다양한 혼합 주도형 문법을 나타내는 예시적인 코드.
도 6은 사용자가 혼합 주도형 문법 내에 포함될 수 있는 지시적 담화 문법을 선택 및/또는 식별할 수 있게 하는 하나의 방식을 나타내는 예시적인 코드.
도 7은 본 발명의 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 방법을 도시하는 흐름도.
도면의 주요 부분에 대한 부호의 설명
100, 200 : GUI 105, 110, 115 : 필드
저작권 보호 자료에서 저작권의 유보 사항
본 특허 문헌의 개시 내용의 일부분은 저작권이 보호된 자료를 포함한다. 저작권 소유자는 특허 및 상표 관리국의 특허 파일 또는 기록에 보관된 특허 문헌 또는 특허 명세서가 누군가에 의해 팩스로 복제되는 것에는 이의를 갖지 않으나 그 이외의 경우에는 어떤 경우든지 모든 저작권을 행사할 수 있도록 유보한다.
기술 분야
본 발명은 혼합 주도형 화법 기반 시스템(mixed-initiative speech-based systems)에 관한 것으로서, 보다 구체적으로는 이러한 시스템에서 사용되는 문법(grammars)의 생성에 관한 것이다.
종래 기술
여러 견고한 음성 적용 분야는 혼합 주도형 대화(mixed-initiative interaction)로 지칭되는 소정 형태의 인간-컴퓨터 대화를 이용한다. 혼합 주도형 대화는 사용자와 컴퓨터 시스템 사이에서 임의의 시점에 각자가 대화의 흐름을 안내하거나 변경할 차례를 가질 수 있게 하는 유연한 대화 기법이다. 혼합 주도형 시스템은 보다 자연적이고 일반적으로 선호되는 사용자와 컴퓨터 시스템 사이의 대화 방법을 제공한다.
혼합 주도형 화법 시스템 내에서, 사용자는 먼저 각각의 개별 정보 항목을 프롬프트(prompt)하지 않으면서도 다양한 순서로 정보의 서로 다른 부분을 제공할 수 있다. 컴퓨터 시스템은 사용자가 발음한 발화 내용(user spoken utterance)으로부터 필수적인 정보 항목을 추출할 수 있고, 그 정보 항목을 이용하여 예를 들면 전자 형태의 적절한 필드 내에 채워 넣을 수 있다. 예로서, 사용자는 "나는 6월 23일날 보스톤으로부터 뉴욕의 라가디아(La Guardia) 공항으로 비행하고 싶다."라고 말할 수 있다. 혼합 주도형 시스템은 그 하나의 발음된 발화 내용으로부터 출발 도시, 도착 공항 및 비행 일자 등과 같은 필수 정보 항목을 추출할 수 있다. 그에 대한 비교로서, 지시적 담화 시스템(directed dialog system)은 사용자가 한 번에 하나씩 각 정보의 개별 부분을 프롬프트하고, 특정한 순서로 데이터 수집을 실행한다. 이러한 방식으로, 지시적 담화 시스템은 사용자가 지정된 흐름에서 벗어날 어떠한 기회도 제공하지 않으면서 대화 또는 담화의 흐름을 실질적으로 "지시"한다.
혼합 주도형 시스템의 개발의 일 측면은 사용자가 발음한 발화 내용을 처리하는 데 이용되는 혼합 주도형 문법을 개발하는 것이다. VoiceXML(Voice Extensible Markup Language) 등과 같은 현대적 기법은 혼합 주도형 담화를 지원하 기는 하지만, VoiceXML 내에서 혼합 주도형 문법을 생성하는 것은 여전히 복잡한 작업이다. 전형적으로, 혼합 주도형 문법을 개발 및 유지하는 것은 지시적 담화 문법을 개발 및 유지하는 것보다 더 어렵고 복잡하다. 이것은 혼합 주도형 문법이 전형적으로 지시적 담화 문법을 그 성분으로 하여 설계되기 때문이다. 혼합 주도형 문법의 개발을 더 복잡하게 하는 것은 이러한 문법들이 사용자에 의해 수동으로 개발된다는 점이다. 그 때문에 혼합 주도형 문법의 생성은 시간 소모적이고 에러가 발생하기 쉬운 프로세스일 수 있다.
상술된 문제점을 극복하면서 보다 효과적인 혼합 주도형 문법 생성 기법을 제공하는 것이 유용할 것이다.
본 발명은 혼합 주도형 문법을 구성하는 방법 및 장치를 제공하고, 지시적 담화 문법의 재사용을 가능하게 한다. 본 발명의 일 실시예는 혼합 주도형 문법을 설계하는 방법을 포함할 수 있다. 이러한 방법은 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 단계와, 선택된 문법 생성 기법에 따라서 혼합 주도형 문법을 자동으로 생성하는 단계를 포함할 수 있으므로, 혼합 주도형 문법은 복수의 지시적 담화 문법을 상술한다.
본 발명의 다른 실시예는 복수의 지시적 담화 문법으로부터 혼합 주도형 문법을 자동적으로 구성하는 방법을 포함할 수 있다. 이 방법은 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 단계와, 사용자 프롬프트에 응 답하여 선택된 문법 생성 기법을 기술하는 사용자 입력을 수신하는 단계를 포함할 수 있다. 이러한 방법은 복수의 직접 담화 문법을 기술하는 혼합 주도형 문법을 자동적으로 생성하는 단계를 더 포함할 수 있다. 복수의 지시적 담화 문법은 적어도 부분적으로 선택된 문법 생성 기법에 따라서 결정된 사용자가 발음한 발화 내용을 처리하기 위해 서로에 대해 순차화된 관계를 가질 수 있다.
본 발명의 다른 실시예는 머신에 의해 실행되어 머신이 본 명세서에 개시된 여러 단계 및 방법을 실행하게 하는 복수의 코드 섹션을 갖는 컴퓨터 프로그램을 저장하고 있는 머신 판독 가능 저장 장치를 포함할 수 있다.
도면 내에는 현재 바람직한 실시예가 도시되어있으나, 본 발명은 도시된 바로 그 장치 및 수단으로 한정되지 않는다는 것을 이해할 것이다.
본 명세서는 새로운 것으로서 간주되는 본 발명의 특징을 정의하는 청구항으로 결론을 내리고 있으나, 본 발명은 도면을 참조하여 이하의 설명을 고려함으로써 더욱 잘 이해될 수 있을 것으로 생각된다. 필요한 것으로 간주되는 본 발명의 상세한 실시예를 본 명세서에 개시하였으나, 이러한 개시된 실시예는 여러 형태로 구현될 수 있는 본 발명의 예시에 불과하다는 것을 이해할 것이다. 그러므로, 본 명세서에 개시된 특정한 구조 및 기능적 세부 사항은 한정하는 것으로 해석되는 것이 아니라 당업자들이 본 발명을 사실상 임의의 적절한 세부 구조로 다양하게 사용할 수 있도록 알리는 청구항의 기초 및 대표물의 기초로서 제시된 것이다. 또한, 본 명세서에서 사용된 용어 및 문구는 한정하는 것으로 의도된 것이 아니라 본 발명의 이해 가능한 설명을 제공하기 위한 것이다.
본 발명은 혼합 주도형 컴퓨터 시스템에서 사용하기 위한 문법을 개발하기 위한 해결책을 제공하는 것이다. 본 명세서에 개시된 본 발명의 구성에 따르면, 지시적 담화 문법을 사용 및/또는 재사용하여 혼합 주도형 시스템을 생성할 수 있다. 본 발명은 사용자 또는 소프트웨어 개발자로부터 혼합 주도형 문법을 생성하는 데 필요한 서로 다른 정보 항목을 도출할 수 있다. 예를 들면 일실시예에서, 여러 연접 문구(conjoin phrases)뿐만 아니라 하나 이상의 지시적 담화 문법을 식별할 수 있다. 연접 문구는 지시적 담화 문법 중 선택된 것을 연결하는 데 이용될 수 있다. 복수의 서로 다른 문법 생성 기법 중 하나를 이용하면, 혼합 주도형 문법이 사용자 지정 정보로부터 자동적으로 생성될 수 있고, 그것에 의해 전형적으로 혼합 주도형 문법의 수동 생성과 연관되었던 여러 복잡성을 감소 및/또는 제거할 수 있게 된다.
일 실시예에서, 본 명세서에 개시된 본 발명의 구성은 소프트웨어 기반의 개발 시스템 내에서 또는 그 일부분으로서 구현될 수 있다. 예를 들면, 본 명세서에 개시된 여러 실시예는 WebSphere
Figure 112006075292500-PAT00001
보이스 툴키트(Voice Tookit) V6.0(이하에서는 "보이스 툴키트"로 지칭함) 등과 같은 소프트웨어 개발 시스템의 일부분으로서 구현될 수 있다. 보이스 툴키트는 음성 작동 적용 분야(voice-enabled application)의 개발을 위한 토대를 제공하는 뉴욕주 아몬크에 소재한 인터내셔널 비지네스 머신즈 코포레이션(IBM)으로부터 입수 가능한 소프트웨어 개발 플랫폼이다. 보이스 툴키 트는 화법 인식을 위한 문법 파일의 시각적 조합을 위한 그래픽 문법 제작기와, 재사용 가능 담화 성분을 지원하는 통신 흐름 제작기와, VoiceXML(Voice Extensible Markup Language)에 대한 기반 및/또는 다른 기능을 제공한다.
본 명세서에 개시된 실시예는 보이스 툴키트의 일부분으로서 구현될 수 있으나, 이것은 하나의 실시예에 불과하다는 것을 이해할 것이다. 본 명세서에 개시된 실시예는 임의의 적합한 소프트웨어 개발 시스템 및/또는 환경의 일부분으로서 제공될 수 있으므로, 본 발명은 사용된 특정한 주요 적용 분야에 의해 한정되도록 의도되지 않았다. 또한, 본 명세서에 개시된 실시예는 독립형 소프트웨어 개발 시스템 또는 적용 분야로서 구현될 수 있다는 것을 이해할 것이다.
도 1은 본 발명의 일 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI(graphical user interface)(100)를 나타내는 도식적인 도면이다. GUI(100)는 복수의 서로 다른 필드 타입(105, 110, 115)을 포함할 수 있다. 필드(105, 115)는 여러 연접 문구를 명시하는 사용자 입력을 수신할 수 있다. 도시된 바와 같이 접두사 타입의 문구는 필드(105) 내에서 수신 또는 명시될 수 있는 한편, 접미사 타입의 문구는 필드(115) 내에서 명시될 수 있다. 특정한 지시적 담화 문법은 필드(110) 내에서 명시될 수 있다. 본 명세서에 이용된 바와 같이, 지시적 담화 문법은 하나 이상의 사용자가 발음한 발화 내용으로부터 추출 또는 인식되는 데이터에 기초하여 기입될 전자 형태의 특정 필드에 대한 허용 가능 입력인 하나 이상의 단어 또는 문구를 명시할 수 있다.
도 1은 혼합 주도형 문법이 음성 작동형 항공 예약 시스템에서 개발되는 경 우를 나타낸다. 그러나, 본 명세서에 개시된 본 발명의 구성은 임의의 다양한 서로 다른 음성 작동형 시스템에 적용될 수 있고, 도 1에서 특정 산업을 이용한 것은 오로지 예시를 목적으로 제시된 것임을 이해할 것이다. 따라서, 도 1은 본 발명을 제한하도록 의도된 것이 아니고, 본 발명의 여러 측면을 설명하는 기반으로서 제공된 것이다.
다시 필드(105, 115)를 참조하면, 어떠한 경우에도 연접 문구는 사용되는 특정한 지시적 담화 문법을 나타내는 대기 행렬(queue)로서 기능을 하거나, 이와 다르게 2개 이상의 지시적 담화 문법을 연결하는 기능을 할 수 있다. 연접 문구는 경우에 따라서 하나 이상의 단어, 기호 또는 문자 성분을 포함할 수 있다. 따라서, 사용자가 발음한 발화 내용 내에서 인식될 때 연접 문구는 특정한 지시적 담화 문법을 사용하여 주어진 단어 또는 사용자가 발음한 발화 내용의 부분을 처리한다는 것을 나타낸다. 언급된 바와 같이, 연접 문구는 또한 2개 이상의 지시적 담화 문법 사이에서 실질적으로 연결하거나 연관 또는 관계를 형성하는 기능을 할 수 있다. 따라서, 연접 문구는 연접 문구를 이용하여 연결되는 지시적 담화 문법 사이의 순서를 형성할 수 있다.
GUI(100)는 연접 문구 "depart from"(여기에서 "depart"는 선택 사항으로서 표시됨)가 "departGrammar"로 지칭된 지시적 담화 문법과 연관된 것을 나타낸다. 이 문법은 출발 도시의 목록을 명시할 수 있다. 마찬가지로, 연접 문구 "depart on"(여기에서도 "depart"는 선택 사항으로서 표시됨)는 "departDate"로 지칭된 지시적 담화 문법과 연관된다. 이 문법은 날짜의 목록을 명시할 수 있다. 따라서, 예를 들어 사용자가 "수요일에 웨스트 팜 비치에서 출발한다"라고 말하면, 연접 문구 "depart from"는 "departGrammar"로 지칭되는 지시적 담화 문법이 발화 내용으로부터 다음의 여러 단어(들), 즉 "웨스트 팜 비치"를 인식하는데 이용되는 것을 나타낸다. 연접 문구 "on"이 인식될 때, 음성 작동형 시스템은 "departDate" 문법이 발화 내용으로부터 다음의 여러 단어, 즉 "수요일"을 인식하는 데 이용될 수 있다는 것을 판단할 수 있다.
이러한 예에서, 2개의 연접 문구는 모두 접두사 문구로서 분류된다. 접두사 연접 문구는 사용자가 발음한 발화 내용 내의 연접 문구 이후에 뒤따르는 단어들이 특정한 지시적 담화 문법을 이용하여 처리된다는 것을 나타낸다. 따라서, "수요일"이라는 단어는 "departGrammar"를 이용하여 인식된다. 접미사 연접 문구는 사용자가 발음한 발화 내용 내의 연접 문구 앞에 선행하는 단어들이 특정한 지시적 담화 문법을 이용하여 처리된다는 것을 나타낸다. GUI(100)에 도시된 바와 같이, 지시적 담화 문법은 접두사 문구, 접미사 문구, 접두사와 접미사 문구 또는 그 외의 타입의 연접 문구와 연관될 수 있다.
일 실시예에서, 지시적 담화 문법은 문법의 명칭을 GUI(100)의 필드(110) 내에 타이핑하는 것에 의해 명시될 수 있다. 다른 실시예에서, 드래그 앤드 드롭 기능(drag and drop functionality)을 이용하여 코드의 부분 또는 지시적 담화 문법 파일이 임의의 필드(110)로 선택 및 입력(dropped)되게 할 수 있다. 또 다른 실시예에서, 파일 선택 네비게이션 윈도우(file selection navigation window)를 열어 사용자가 지시적 담화 문법(들)을 선택하게 할 수 있다. 이러한 기법은 연접 문구 를 명시하는 데에도 이용될 수 있다.
도 2는 본 발명의 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 데 이용되는 GUI(200)를 나타내는 도식적인 도면이다. GUI(200)는 사용자가 혼합 주도형 문법을 생성하는 데 이용할 수 있는 복수의 이용 가능한 문법 생성 기법을 선택할 수 있게 한다. 이러한 경우에, 상자(205) 내에 도시된 3개의 이용 가능 문법 생성 기법이 존재한다. 이러한 기법은 고정된 순서, 넓은 범위의 조합(wide combination) 및 좁은 범위의 조합(narrow combination)이다.
GUI(200)는 개발된 혼합 주도형 시스템의 최종 사용자에게 정보를 요청하기 위해 이용될 초기 프롬프트(initial prompt)를 명시하는 사용자 제공 입력을 수신할 수 있는 필드(220)도 포함할 수 있다. 초기 프롬프트는 생성된 혼합 주도형 문법을 이용하여 처리되는 최종 사용자가 발언한 발화 내용을 요청하는 데 이용될 것이다. VoiceXML을 이용한 본 발명의 실시예에서, 예를 들면 프롬프트는 "초기" 태그를 가지고 이용될 수 있다. "초기" 태그는 VoiceXML 혼합 주도형 담화 내에 이용되어 사용자가 형태 방식 정보(form-wide information)를 기입할 수 있게 한다. "초기" 태그는 사용자가 하나의 발화가 있는 복수의 필드 프롬프트를 건너뛰는 것을 가능하게 한다. 일반적으로, 혼합 주도형 담화 내의 제 1 프롬프트는 사용자에게 모든 정보를 질의한다. 전형적으로, 필드는 모든 필드 변수가 기입되지 않았다고 판정된 이후에만 실행된다. "초기" 성분은 그 자체의 어떠한 문법 또는 기입된 사건을 포함하는 것이 아니라, 각각의 개별 필드의 문법 및 기입된 성분에 의존한다.
고정 순서의 문법 생성 기법은 GUI(200)의 시야(210)에 도시되어 있다. 고정 순서를 이용하면, 사용자는 연접 문구를 설정하는 특정한 순서를 지정할 수 있고, GUI(100)에서 명시 또는 생성된 연관되는 지시적 담화 문법은 생성된 혼합 주도형 문법 내에서 순차화된다. 사용자는 특정한 연접 문구-지시적 담화 문법의 세트를 선택하고, 화살표(215)를 이용하여 이 세트를 그 순위 내에서 위 또는 아래로 이동시킬 수 있다. 이러한 기법을 이용하면, 혼합 주도형 문법은 균일한 성분의 지시적 담화 문법 목록 내에 생성될 수 있다.
도 3은 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 하나의 다양한 혼합 주도형 문법을 도시하는 예시적인 코드이다. 보다 구체적으로, 도 3은 도 2를 참조하여 도시된 바와 같이 선택되는 선택 사항에 기초하여 문법 생성 도구에 의해 생성 가능한 다양한 혼합 주도형 문법을 도시한다.
도 4는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 다른 다양한 혼합 주도형 문법을 도시하는 예시적인 코드이다. 보다 구체적으로, 도 4는 넓은 범위의 조합 선택 사항이 문법 생성 기법으로서 선택될 때 문법 생성 도구에 의해 생성 가능한 다양한 혼합 주도형 문법을 도시한다. 넓은 범위의 조합 문법 생성 기법은 사용자가 하나 이상의 또는 모든 지시적 담화 문법을 임의의 순서로 말할 수 있게 한다.
넓은 범위의 조합 문법 생성 기법은 경우에 따라서 "비의도적 단어" 또는 "비의도적 문구"로 지칭될 수 있는 성분이 존재할 수 있게 한다. 도 4에서 확인되는 바와 같이 혼합 주도형 문법의 종료 부분에 "*" 신택스(syntax)가 이용되어 있 다. "*"는 JSGF(Java Application Programming Interface Speech Grammar Format), SRGS(W3C Speech Recognition Grammar Specification), ABNF(Augmented Backus-Naur form) 등과 같은 여러 타입의 문법 내에서 문법의 확장이 0회 이상으로 발언될 수 있다는 것을 나타내는 표준 표기 형태이다. 본 명세서에서 이용된 "문구"라는 용어는 하나 이상의 단어, 기호, 문자 성분 등을 포함할 수 있다.
예에서, 도 4에 도시된 문법은 사용자가 다음의 문구, "보스톤으로부터 마이애미로 5월 1일에" 및 "5월 1일에 보스톤으로부터 마이애미로"라고 발언할 수 있게 한다. 문법은 또한 사용자가 "보스톤으로부터 마이애미로 5월 1일에, 올란도로부터"라는 문구를 발언할 수 있게 한다. 이 마지막 사용자 발언 발화 내용은 출발 도시의 2가지의 예시, 즉 "보스톤으로부터" 및 "올란도로부터"를 포함한다. 도 4의 문법은 이러한 발화 내용을 허용한다. 출발 도시의 중복은 비의도적 문구로서 지칭되고, 이것은 문법의 확장이 0회 이상 발언될 수 있도록 허용하기 때문에 가능해진다.
도 5는 본 명세서에 개시된 본 발명의 구성에 따라서 생성될 수 있는 또 다른 다양한 혼합 주도형 문법을 도시하는 예시적인 코드이다. 특히, 도 5는 문법 생성 기법으로서 좁은 범위의 조합 선택 사항이 선택될 때 문법 생성 도구에 의해 생성 가능한 다양한 혼합 주도형 문법을 도시한다. 좁은 범위의 조합 선택 사항은 사용자가 하나 이상 또는 모든 지시적 문법을 임의의 순서로 발언할 수 있게 할 뿐만 아니라 넓은 범위의 조합 기법을 이용할 때 허용되었던 비의도적 문구의 목록을 제거하는 혼합 주도형 문법을 생성할 것이다.
예를 들어, 혼합 주도형 문법이 형성되고, 연접 문구 및 지시적 담화 문법(A, B, C)이 식별되었다고 가정하면, 결과적인 혼합 주도형 문법은 다음의 지시적 담화 순차화, 즉 A, B, C, AB, CA, BC, ABC, BAC, CAB 등을 가능하게 할 것이다. 그러나, AABC, AA, BCC 등과 같은 순차화는 허용 불가능하다. 이러한 예에서 A는 전체 문장"([depart] from) <departGrammar>"를 나타내고, B는 문장"(to | arrive at) <arrivalGrammar>"를 나타내고, C는 "([depart] on) <departDate>"를 나타낸다. 비의도적 문구가 허용 불가능하기 때문에, 비부합(noncompliant) 또는 비의도적 문구(들)를 무시하고 나머지 발화 부분을 처리한다면, 전체 발화 내용은 거부될 수 있다. 특히, 개발자 기호에 따라 처리하기 위해서 임의의 반복된 문구의 특정한 예시 중 어느 하나를 선택할 수 있다.
도 6은 사용자가 생성되는 혼합 주도형 문법 내에 포함될 수 있는 지시적 담화 문법과, 각각의 지시적 담화 문법과 연관된 필드를 선택 및/또는 식별할 수 있게 하는 하나의 방식을 나타내는 예시적인 코드를 도시한다. 도 6에 도시된 바와 같은 코드는 예를 들면 파일 선택 대화창을 통해, 또는 이러한 코드를 포함하는 텍스트 파일을 GUI의 지정된 영역 또는 아이콘으로 드래그 앤드 드롭(dragging and dropping)하는 것에 의해 문법 생성 도구로 도입될 수 있다. 다른 실시예에서, 사용자는 혼합 주도형 문법 내에 포함될 각각의 개별 지시적 담화 문법을 도구 내에 드래그 앤드 드롭할 수 있다. 어떠한 경우에도, 지시적 담화 문법이 명시 또는 식별되는 특정한 방식은 본 발명을 한정하는 것으로 의도되어서는 안 된다.
도 7은 본 발명의 또 다른 실시예에 따라서 혼합 주도형 문법을 생성하는 방 법(700)을 도시하는 흐름도이다. 방법(700)은 단계(705)에서 시작될 수 있는데, 이 단계에서 사용자는 혼합 주도형 화법 기반 시스템에서 사용되는 혼합 주도형 문법을 생성하는 데 이용될 하나 이상의 지시적 담화 문법을 선택적으로 생성할 수 있다.
단계(710)에서, 사용자는 혼합 주도형 문법을 생성하는 데 이용될 하나 이상의 지시적 담화 문법을 선택할 수 있다. 단계(705)는 본질적으로 선택 사항이므로, 단계(710)에서 식별된 지시적 담화 문법은 사용자에 의해 생성될 필요가 없고, 다른 개발자에 의해 생성될 수 있다. 따라서, 단계(710)에서, 사용자는 사용자가 지시적 담화 문법을 생성했는지 여부에 무관하게 존재하고 있는 하나 이상의 지시적 담화 문법을 선택할 수 있다.
단계(715)에서, 사용자는 하나 이상의 연접 문구를 프롬프트할 수 있다. 단계(720)에서, 하나 이상의 연접 문구를 명시하는 사용자 입력을 수신할 수 있다. 사용자 입력은 하나 이상의 연접 문구를 명시하는 방식뿐만 아니라 연접 문구를 사용자가 지정한 지시적 담화 문법, 즉 단계(710)에서 식별된 것 중에서 선택된 지시적 담화 문법과 연관되게 하는 방식으로 제공될 수 있다는 것을 이해할 것이다. 어떠한 경우에도, 연접 문구가 선택된 특정한 문법 생성 기법에 기초하여 혼합 주도형 문법으로부터 배제될 수 있기 때문에 기본적으로 단계(715) 및 단계(720)는 선택 사항일 수 있다.
단계(725)에서, 문법 생성 도구는 사용자에게 특정한 문법 생성 기법에 대해 프롬프트할 수 있다. 단계(730)에서, 사용자가 지정한 문법 생성 기법은 사용자로 부터의 입력으로서 수신될 수 있다. 단계(735)에서, 문법 생성 도구는 최종 사용자로부터 정보를 요청하기 위해 이용될 초기 프롬프트를 사용자에게 프롬프트할 수 있다. 단계(740)에서, 사용자가 지정한 초기 프롬프트를 사용자로부터 획득 또는 수신할 수 있다. 단계(745)에서, 문법 생성 도구는 사용자에 의해 제공된 입력 및/또는 선택에 기초하여 혼합 주도형 문법을 생성할 수 있다. 언급된 바와 같이, 혼합 주도형 문법에 의해 지정된 지시적 담화 문법의 순차화에 의해 결정되어 있는 바와 같이 사용자가 특정 문구를 발언하도록 허용되는 순서는 사용자에 의해 선택된 문법 생성 기법에 따라서 결정될 수 있다.
본 명세서에 개시된 여러 GUI, 흐름도 및 예시적인 코드 부분은 오로지 예시를 목적으로 제공되었고, 이들은 어떠한 방식으로도 본 발명의 범주를 한정하도록 의도되지 않았다는 것을 이해할 것이다. 예를 들면, GUI에 있어서, 도시 및/또는 설명된 것에 대체하여 다른 제어, 시각적 표시자 등을 이용할 수 있다. 마찬가지로, 흐름도에 있어서 본 발명의 사상을 벗어나지 않으면서 여러 단계를 생략하거나 설명된 것과는 상이한 순서로 실행할 수 있다.
본 발명은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 본 발명은 하나의 컴퓨터 시스템 내에서 집중된 방식으로 구현되거나 서로 다른 구성 요소가 여러 상호 접속된 컴퓨터 시스템에 걸쳐 분산된 분산형 방식으로 구현될 수 있다. 본 발명에 개시된 방법을 실행할 수 있는 어떠한 종류의 컴퓨터 시스템 또는 다른 장치도 적합하게 적용 가능하다. 하드웨어와 소프트웨어의 전형적인 조합은, 로딩되고 실행될 때 본 명세서에 개시된 방법을 실행하도 록 컴퓨터 시스템을 제어하는 컴퓨터 프로그램을 구비한 범용 컴퓨터 시스템일 수 있다. 본 발명은 또한 본 명세서에 개시된 방법의 구현을 가능하게 하는 모든 피처를 포함하고, 컴퓨터 시스템 내에 로딩될 때 이러한 방법을 실행할 수 있는 컴퓨터 프로그램 제품으로 구현될 수 있다.
본 발명과 관련하여 "컴퓨터 프로그램", "소프트웨어", "적용 분야"라는 용어와, 그 변경 및/또는 조합은 임의의 언어, 코드 또는 표기법으로 된 임의의 표현을 의미하는데, 이 임의의 표현은 정보 처리 능력을 갖는 시스템이 직접적으로, 또는 a) 다른 언어, 코드 또는 표기법으로의 변환 및 b) 다른 자료 형태로의 재생산 중 어느 하나 또는 모두를 수행한 후에, 특정한 기능을 수행하도록 의도된 인스트럭션의 세트에 대한 표현일 수 있다. 예를 들면, 컴퓨터 시스템은 서브루틴, 함수, 절차, 대상 방법, 대상 구현, 실행 가능 적용 분야, 애플릿(applet), 서블릿(servlet), 소스 코드, 객체 코드, 공유 라이브러리/동적 로드 라이브러리 및/또는 다른 컴퓨터 시스템 상에서 실행되도록 설계된 인스트럭션의 다른 시퀀스를 포함할 수 있지만 이것으로 한정되지는 않는다.
본 명세서에 이용된 단수로 표현된 용어는 하나 이상을 의미하는 것으로 정의된다. 본 명세서에 이용된 "복수의"라는 용어는 적어도 2개 이상으로서 정의된다. 본 명세서에 이용된 "포함한다" 및/또는 "가진다"라는 용어는 포괄적인 것(즉, 개방적 의미의 언어)으로서 정의된다. 본 명세서에 이용된 "결합된다"라는 용어는 반드시 직접적이어야 하거나 반드시 기계적이어야 한다는 것이 아니라 단지 접속된 것, 즉 통신 채널 또는 경로를 통해 통신 가능하게 연결된 것으로서 정의된 다.
본 발명은 본 발명의 정신 및 기본적인 속성을 벗어나지 않으면서 다른 형태로 구현될 수 있다. 따라서, 상기 명세서가 아니라 본 발명의 범주를 나타내는 이하의 청구항을 참조하여야 한다.
본 발명에 따르면, 혼합 주도형 컴퓨터 시스템 내에서 사용될 문법을 개발하는 데 있어서 혼합 주도형 문법의 수동 생성과 연관되었던 여러 복잡성을 감소 및/또는 제거하는 해결책을 제공한다.

Claims (20)

  1. 혼합 주도형 문법(mixed-initiative grammar)을 생성하는 방법으로서,
    상기 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법(directed dialog grammars)을 식별하는 단계와,
    상기 혼합 주도형 문법이 상기 복수의 지시적 담화 문법을 명시하도록, 선택된 문법 생성 기법에 따라서 상기 혼합 주도형 문법을 자동으로 생성하는 단계를 포함하는
    혼합 주도형 문법의 생성 방법.
  2. 제 1 항에 있어서,
    적어도 하나의 연접 문구(conjoin phrase)를 수신하는 단계를 더 포함하되,
    상기 각 연접 문구는 상기 복수의 지시적 담화 문법 중 선택된 지시적 담화 문법과 연관되고,
    상기 연접 문구는, 사용자가 발언한 발화 내용(user spoken utterance) 내에서 인식될 때, 상기 사용자가 발언한 발화 내용의 특정 부분을 처리하기 위해 상기 연관된 지시적 담화 문법이 사용된다는 것을 나타내는
    혼합 주도형 문법의 생성 방법.
  3. 제 2 항에 있어서,
    상기 생성 단계는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 단계를 더 포함하되,
    상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고, 상기 선택된 문법 생성 기법은 사용자가 발언한 발화 내용을 해석하기 위해 상기 혼합 주도형 문법의 세트가 고정된 순서로 사용된다는 것을 명시하는
    혼합 주도형 문법의 생성 방법.
  4. 제 2 항에 있어서,
    상기 생성 단계는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 단계를 더 포함하고,
    상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고,
    상기 선택된 문법 생성 기법은 사용자가 발언한 발화 내용을 해석하기 위해 상기 혼합 주도형 문법의 세트가 임의의 순서로 사용된다는 것을 명시하며,
    상기 선택된 문법 생성 기법은 비의도적 문구(unintentional phrases)를 허용하는
    혼합 주도형 문법의 생성 방법.
  5. 제 1 항에 있어서,
    상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법에 의해 명시된 상기 복수의 지시적 담화 문법이 비의도적 문구가 무시되도록, 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용 가능하다는 것을 나타내는
    혼합 주도형 문법의 생성 방법.
  6. 제 2 항에 있어서,
    상기 수신 단계는 적어도 하나의 사용자 지정형 연접 문구를 수신하기 위한 입력 영역을 갖는 그래픽 사용자 인터페이스(graphical user interface)를 제시함으로써 사용자에게 먼저 프롬프트(prompting)하는 단계를 더 포함하는
    혼합 주도형 문법의 생성 방법.
  7. 제 6 항에 있어서,
    상기 그래픽 사용자 인터페이스는 적어도 하나의 접두사 연접 문구를 수신하기 위한 입력 영역과 적어도 하나의 접미사 연접 문구를 수신하기 위한 입력 영역을 포함하는
    혼합 주도형 문법의 생성 방법.
  8. 복수의 지시적 담화 문법으로부터 혼합 주도형 문법을 자동으로 생성하는 방법으로서,
    상기 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 단계와,
    사용자 프롬프트에 응답하여, 선택된 문법 생성 기법을 명시하는 사용자 입력을 수신하는 단계와,
    상기 복수의 지시적 담화 문법을 명시하는 상기 혼합 주도형 문법을 자동으로 생성하는 단계를 포함하되,
    상기 복수의 지시적 담화 문법은 적어도 부분적으로 상기 선택된 문법 생성 기법에 따라서 결정되는 사용자가 발언한 발화 내용을 처리하기 위해 서로에 대해 순차화된 관계를 갖는
    혼합 주도형 문법의 자동 생성 방법.
  9. 제 8 항에 있어서,
    사용자 프롬프트에 응답하여, 상기 사용자가 발언한 발화 내용 중 선택된 부분을 처리하는 데 이용되는 상기 복수의 지시적 담화 문법 중 적어도 하나를 식별하는 적어도 하나의 연접 문구를 명시하는 사용자 입력을 수신하는 단계를 더 포함하되,
    상기 적어도 하나의 연접 문구는 상기 혼합 주도형 문법에 의해 명시되는
    혼합 주도형 문법의 자동 생성 방법.
  10. 제 9 항에 있어서,
    상기 혼합 주도형 문법은 복수의 세트 - 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시함- 로 구성되고,
    상기 선택된 문법 생성 기법은 상기 세트가 사용자가 발언한 발화 내용을 해석하기 위해 고정된 순서로 사용 가능하다는 것을 나타내는
    혼합 주도형 문법의 자동 생성 방법.
  11. 제 9 항에 있어서,
    상기 혼합 주도형 문법은 복수의 세트 - 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시함- 로 구성되고,
    상기 선택된 문법 생성 기법은 상기 세트가 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용 가능하다는 것을 나타내며,
    상기 선택된 문법 생성 기법은 비의도적 문구를 허용하는
    혼합 주도형 문법의 자동 생성 방법.
  12. 제 8 항에 있어서,
    상기 혼합 주도형 문법은 상기 혼합 주도형 문법을 생성하기 위해 이용되는 상기 지시적 담화 문법이 비의도적 문구에 무관하게 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용 가능하다는 것을 나타내는
    혼합 주도형 문법의 자동 생성 방법.
  13. 제 8 항에 있어서,
    프롬프트에 응답하여, 혼합 주도형 시스템에 의해 실행될 초기 프롬프트를 지정하는 사용자 입력을 수신하는 단계를 더 포함하되,
    상기 초기 프롬프트는 상기 생성 단계에서 생성된 상기 혼합 주도형 문법을 이용하여 처리되는 사용자가 발언한 발화 내용을 도출하기 위해 이용되는
    혼합 주도형 문법의 자동 생성 방법.
  14. 복수의 코드 섹션을 갖는 컴퓨터 프로그램을 저장하는 머신 판독 가능 저장 장치로서,
    상기 혼합 주도형 문법 내에 포함되는 복수의 지시적 담화 문법을 식별하는 식별 코드와,
    상기 혼합 주도형 문법이 상기 복수의 지시적 담화 문법을 명시하도록, 선택된 문법 생성 기법에 따라서 상기 혼합 주도형 문법을 자동으로 생성하는 생성 코드를 포함하는
    머신 판독 가능 저장 장치.
  15. 제 14 항에 있어서,
    적어도 하나의 연접 문구를 수신하는 수신 코드를 더 포함하되,
    상기 각 연접 문구는 상기 복수의 지시적 담화 문법 중 선택된 지시적 담화 문법과 연관되고,
    상기 연접 문구는 사용자가 발언한 발화 내용 내에서 인식될 때, 상기 연관된 지시적 담화 문법이 상기 사용자가 발언한 발화 내용의 특정 부분을 처리하기 위해 이용된다는 것을 나타내는
    머신 판독 가능 저장 장치.
  16. 제 15 항에 있어서,
    상기 생성 코드는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 코드를 더 포함하되,
    상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고,
    상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법의 세트가 사용자가 발언한 발화 내용을 해석하기 위해 고정된 순서로 사용된다는 것을 명시하는
    머신 판독 가능 저장 장치.
  17. 제 15 항에 있어서,
    상기 생성 코드는 상기 혼합 주도형 문법 내에 복수의 세트를 포함하는 코드를 더 포함하되,
    상기 각 세트는 연접 문구 및 연관된 지시적 담화 문법을 명시하고,
    상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법의 세트가 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 사용된다는 것을 명시하며,
    상기 선택된 문법 생성 기법은 비의도적 문구를 허용하는
    머신 판독 가능 저장 장치.
  18. 제 14 항에 있어서,
    상기 선택된 문법 생성 기법은 상기 혼합 주도형 문법에 의해 명시된 상기 복수의 지시적 담화 문법이 비의도적 문구가 무시되도록, 사용자가 발언한 발화 내용을 해석하기 위해 임의의 순서로 이용 가능하다는 것을 나타내는
    머신 판독 가능 저장 장치.
  19. 제 15 항에 있어서,
    상기 수신 코드는 적어도 하나의 사용자가 지정한 연접 문구를 수신하기 위한 입력 영역을 갖는 그래픽 사용자 인터페이스를 제시함으로써 사용자를 먼저 프롬프트하는 코드를 더 포함하는
    머신 판독 가능 저장 장치.
  20. 제 19 항에 있어서,
    상기 그래픽 사용자 인터페이스는 적어도 하나의 접두사 연접 문구를 수신하기 위한 입력 영역과 적어도 하나의 접미사 연접 문구를 수신하기 위한 입력 영역을 포함하는
    머신 판독 가능 저장 장치.
KR1020060101554A 2005-10-21 2006-10-18 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동생성 방법 및 머신 판독 가능 저장 장치 KR20070043625A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/163,522 2005-10-21
US11/163,522 US8229745B2 (en) 2005-10-21 2005-10-21 Creating a mixed-initiative grammar from directed dialog grammars

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020080096701A Division KR100923180B1 (ko) 2005-10-21 2008-10-01 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동 생성 방법 및 머신 판독 가능 저장 장치

Publications (1)

Publication Number Publication Date
KR20070043625A true KR20070043625A (ko) 2007-04-25

Family

ID=37986371

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020060101554A KR20070043625A (ko) 2005-10-21 2006-10-18 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동생성 방법 및 머신 판독 가능 저장 장치
KR1020080096701A KR100923180B1 (ko) 2005-10-21 2008-10-01 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동 생성 방법 및 머신 판독 가능 저장 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020080096701A KR100923180B1 (ko) 2005-10-21 2008-10-01 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동 생성 방법 및 머신 판독 가능 저장 장치

Country Status (3)

Country Link
US (1) US8229745B2 (ko)
KR (2) KR20070043625A (ko)
CN (1) CN1952926B (ko)

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
CN101286094A (zh) 2007-04-10 2008-10-15 谷歌股份有限公司 多模式输入法编辑器
WO2009048434A1 (en) * 2007-10-11 2009-04-16 Agency For Science, Technology And Research A dialogue system and a method for executing a fully mixed initiative dialogue (fmid) interaction between a human and a machine
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120310642A1 (en) 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP2016508007A (ja) 2013-02-07 2016-03-10 アップル インコーポレイテッド デジタルアシスタントのためのボイストリガ
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
JP6163266B2 (ja) 2013-08-06 2017-07-12 アップル インコーポレイテッド リモート機器からの作動に基づくスマート応答の自動作動
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10199041B2 (en) * 2014-12-30 2019-02-05 Honeywell International Inc. Speech recognition systems and methods for maintenance repair and overhaul
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US9824691B1 (en) * 2017-06-02 2017-11-21 Sorenson Ip Holdings, Llc Automated population of electronic records

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6311157B1 (en) 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
JP3397372B2 (ja) * 1993-06-16 2003-04-14 キヤノン株式会社 音声認識方法及び装置
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6587822B2 (en) * 1998-10-06 2003-07-01 Lucent Technologies Inc. Web-based platform for interactive voice response (IVR)
US6631346B1 (en) * 1999-04-07 2003-10-07 Matsushita Electric Industrial Co., Ltd. Method and apparatus for natural language parsing using multiple passes and tags
US20020032564A1 (en) 2000-04-19 2002-03-14 Farzad Ehsani Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface
US6684183B1 (en) * 1999-12-06 2004-01-27 Comverse Ltd. Generic natural language service creation environment
US6999932B1 (en) * 2000-10-10 2006-02-14 Intel Corporation Language independent voice-based search system
US20040085162A1 (en) 2000-11-29 2004-05-06 Rajeev Agarwal Method and apparatus for providing a mixed-initiative dialog between a user and a machine
US6973429B2 (en) * 2000-12-04 2005-12-06 A9.Com, Inc. Grammar generation for voice-based searches
US7487440B2 (en) 2000-12-04 2009-02-03 International Business Machines Corporation Reusable voiceXML dialog components, subdialogs and beans
KR100885033B1 (ko) * 2001-02-28 2009-02-20 보이스 인사이트 정보 시스템 억세스를 위한 자연어 질의 시스템
US20020139707A1 (en) * 2001-04-02 2002-10-03 Jorgen Hakansson Earplug dispenser
EP1255190A1 (en) 2001-05-04 2002-11-06 Microsoft Corporation Interface control
US20030061029A1 (en) * 2001-08-29 2003-03-27 Efraim Shaket Device for conducting expectation based mixed initiative natural language dialogs
US7711570B2 (en) * 2001-10-21 2010-05-04 Microsoft Corporation Application abstraction with dialog purpose
ITTO20011035A1 (it) 2001-10-30 2003-04-30 Loquendo Spa Metodo per la gestione di dialoghi persona-macchina ad iniziativa mista basato sull'interazione vocale.
US20030090513A1 (en) 2001-11-09 2003-05-15 Narendran Ramakrishnan Information personalization by partial evaluation
US20030171926A1 (en) * 2002-03-07 2003-09-11 Narasimha Suresh System for information storage, retrieval and voice based content search and methods thereof
US7546382B2 (en) 2002-05-28 2009-06-09 International Business Machines Corporation Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
AU2002950336A0 (en) * 2002-07-24 2002-09-12 Telstra New Wave Pty Ltd System and process for developing a voice application
US7386449B2 (en) 2002-12-11 2008-06-10 Voice Enabling Systems Technology Inc. Knowledge-based flexible natural speech dialogue system
US7328147B2 (en) * 2003-04-03 2008-02-05 Microsoft Corporation Automatic resolution of segmentation ambiguities in grammar authoring
US20040230637A1 (en) * 2003-04-29 2004-11-18 Microsoft Corporation Application controls for speech enabled recognition
US20040217986A1 (en) 2003-05-02 2004-11-04 Myra Hambleton Enhanced graphical development environment for controlling mixed initiative applications
US7386440B2 (en) 2003-10-01 2008-06-10 International Business Machines Corporation Method, system, and apparatus for natural language mixed-initiative dialogue processing
US7552055B2 (en) * 2004-01-10 2009-06-23 Microsoft Corporation Dialog component re-use in recognition systems
CN1238834C (zh) * 2004-03-09 2006-01-25 北京沃克斯科技有限责任公司 一种口语识别理解的识别分析方法
FR2868588A1 (fr) 2004-04-02 2005-10-07 France Telecom Systeme d'application vocale
GB0411377D0 (en) * 2004-05-21 2004-06-23 Univ Belfast Dialogue manager
US20060069563A1 (en) * 2004-09-10 2006-03-30 Microsoft Corporation Constrained mixed-initiative in a voice-activated command system
US7599837B2 (en) * 2004-09-15 2009-10-06 Microsoft Corporation Creating a speech recognition grammar for alphanumeric concepts
US7529657B2 (en) * 2004-09-24 2009-05-05 Microsoft Corporation Configurable parameters for grammar authoring for speech recognition and natural language understanding
US20060287846A1 (en) * 2005-06-21 2006-12-21 Microsoft Corporation Generating grammar rules from prompt text

Also Published As

Publication number Publication date
CN1952926A (zh) 2007-04-25
CN1952926B (zh) 2012-05-30
KR100923180B1 (ko) 2009-10-22
US8229745B2 (en) 2012-07-24
KR20080092327A (ko) 2008-10-15
US20070094026A1 (en) 2007-04-26

Similar Documents

Publication Publication Date Title
KR100923180B1 (ko) 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동 생성 방법 및 머신 판독 가능 저장 장치
EP1779376B1 (en) Method, system and computer program for collecting multiple pieces of information during a user dialog
US7389235B2 (en) Method and system for unified speech and graphic user interfaces
US6173266B1 (en) System and method for developing interactive speech applications
US8812323B2 (en) Dialogue system and a method for executing a fully mixed initiative dialogue (FMID) interaction between a human and a machine
US20090292530A1 (en) Method and system for grammar relaxation
US20070233495A1 (en) Partially automated technology for converting a graphical interface to a speech-enabled interface
KR20080015935A (ko) 합성 생성된 음성 객체의 발음 정정
US20080010069A1 (en) Authoring and running speech related applications
JP2009300573A (ja) 多言語対応音声認識装置、システム、音声の切り替え方法およびプログラム
US20030088415A1 (en) Method and apparatus for word pronunciation composition
JP7108213B2 (ja) 検索結果表示装置、検索結果表示方法、及びプログラム
US7103533B2 (en) Method for preserving contextual accuracy in an extendible speech recognition language model
JP2007033478A (ja) マルチモーダル対話システム及びマルチモーダルアプリケーション生成ウィザード
US7853451B1 (en) System and method of exploiting human-human data for spoken language understanding systems
JP4304959B2 (ja) 音声対話制御方法、音声対話制御装置および音声対話制御プログラム
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
US7054813B2 (en) Automatic generation of efficient grammar for heading selection
Baggia THE IMPACT OF STANDARDS ON TODAY’S SPEECH APPLICATIONS
Ondas et al. Design and development of the Slovak multimodal dialogue system with the BML Realizer Elckerlyc
Ferreiros et al. Increasing robustness, reliability and ergonomics in speech interfaces for aerial control systems
JP2003228393A (ja) 音声対話装置及び方法、音声対話プログラム並びにその記録媒体
Matsu'ura et al. A multimodal, keyword-based spoken dialogue system-MultiksDial
JP2004157748A (ja) 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法
Bernsen et al. Building Usable Spoken Dialogue Systems. Some Approaches

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
WITB Written withdrawal of application
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20080901

Effective date: 20081103