KR20010073105A - 통상의 계층 오브젝트를 사용한 효과적인 음성네비게이션용 뼈대 구조 시스템 - Google Patents
통상의 계층 오브젝트를 사용한 효과적인 음성네비게이션용 뼈대 구조 시스템 Download PDFInfo
- Publication number
- KR20010073105A KR20010073105A KR1020017002798A KR20017002798A KR20010073105A KR 20010073105 A KR20010073105 A KR 20010073105A KR 1020017002798 A KR1020017002798 A KR 1020017002798A KR 20017002798 A KR20017002798 A KR 20017002798A KR 20010073105 A KR20010073105 A KR 20010073105A
- Authority
- KR
- South Korea
- Prior art keywords
- dialog
- interactive
- user
- hierarchical document
- interactive navigation
- Prior art date
Links
- 230000002452 interceptive effect Effects 0.000 claims abstract description 95
- 238000000034 method Methods 0.000 claims abstract description 35
- 230000003213 activating effect Effects 0.000 claims description 8
- 239000002131 composite material Substances 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims 5
- 230000006870 function Effects 0.000 abstract description 9
- 238000012545 processing Methods 0.000 abstract description 5
- 239000012141 concentrate Substances 0.000 abstract description 2
- 230000036316 preload Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 241000239290 Araneae Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012769 display material Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002000 scavenging effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/285—Memory allocation or algorithm optimisation to reduce hardware requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72445—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting Internet browser applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/35—Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
- H04M2203/355—Interactive dialogue design tools, features or methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42204—Arrangements at the exchange for service or number selection by voice
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/44—Additional connecting arrangements for providing access to frequently-wanted subscribers, e.g. abbreviated dialling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Input From Keyboards Or The Like (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Navigation (AREA)
- Geophysics And Detection Of Objects (AREA)
- Machine Translation (AREA)
- Saccharide Compounds (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
본 발명은 다이얼로그(대화형) 시스템이 지원하는 기능과 서비스를 전부 기술하는 계층 구조(뼈대 구조)을 통해 고속이며 효과적인 다이얼로그 네비게이션을 제공하는 시스템 및 방법에 관한 것이다. 본 발명의 한 측면에 있어서, 대화형 시스템 및 방법은 다중 또는 복합 모드, 컨덴츠 또는 애플리케이션을 처리하기 위해 프리로드 다이얼로그 메뉴 및 관련 다이얼로그 관리 프로시저로의 타깃 어드레스에 제공된다. 예를 들어, 클라이언트(100)가 서버(106)에 접속할 경우 컨덴츠 제공자(웹 사이트)(106)는 자신(106)이 지원하는 컨덴츠(페이지)(107) 또는 서비스를 기술하는 뼈대 구조 또는 트리 구조(109)를 다운로드시킬 수 있다. 뼈대 구조는 사용자에게 숨겨져 있지만(보이지 않지만), 사용자는 뼈대 구조 내에 포함된 정보를 사용하여 적합하게 작용하는(사용자의 커맨드에 따라) 대화형 시스템이 인식하는 음성 커맨드를 사용함으로써, 흥미로운 페이지 또는 특정 다이얼로그 서비스에 접근할 수 있다. 뼈대 구조(109)는 사용자로 하여금 요망 서비스 또는 대화형 트랜잭션으로 유도하는 온갖 페이지 또는 폼들을 수행하여 집중할 필요없이 흥미로운 정보를 발견하도록 다수 페이지, 다이얼로그 컴포넌트 또는 NLU 다이얼로그 폼을 통해 고속으로 검색할 수 있도록 필요한 정보를 제공한다.
Description
최근에, 다이얼로그 관리와 함께 NLU(Natural Language Understanding) 및 NLG(Natural Language Gerneration) 등의 대화형 시스템은 인간/기계 인터페이스의 필수적 구성 요소가 되기 위해 준비 중이다. 상기 대화형 시스템을 더 기능적이게 하기 위해서, 상기 시스템은 사용자가 일반적인 대화를 하는 것처럼 자연스럽게 질의(query)를 표시할 수 있게 해야 한다. 실제로, 상기 시스템은 복합 계층 메뉴를 단축시키기 위한 질의를 사용할 수 있는 특성 뿐만 아니라, 사용자가 시스템의 작용에 기초하여 자신의 질의를 완성시키고, 교정하며, 수정하거나 명확하게 할 수있도록 복합 혹은 직접 이니셔티브(initiative)를 제공할 수 있다.
그러나, 자연스런 대화형 시스템에 대해 통상의 예들은 사용자가 자신의 질의를 구성하는 시퀀스 또는 요소에서 비교적 편협한 로직을 따르는 방식으로 설계되었다. 그 예로는 FSF(Finite State Grammar) 또는 순 통계적인 NLU 시스템이 있다. 실제로, NLU는 주어진 문맥(context), 애플리케이션 또는 질의 모드용 입력을 이해하는 것에 관계된다.
게다가, 대화형 시스템 사용시, 음성 출력이 유일한 출력으로서 이용된다면, 복합 서비스(예컨대, 웹 페이지, 계층적 DTMF 메뉴, 다중 옵션과 폼(forms) 기반의 구현(forms-based implement)으로 이루어진 NLU/NLG 시스템)를 사용자에게 제공하는 것은 어렵다. 통상적으로, 사용자는 흥미로운 정보를 찾기 위해 다중 웹 페이지 또는 DTMF 메뉴를 통해 네비게이션해야 한다. 따라서, 요망 서비스 또는 트랜잭션으로 유도하는 온갖 페이지 또는 메뉴를 수행하여 집중할 필요없이, 사이트 또는 유용한 다이얼로그 서비스를 통해 사용자가 고속으로 검색할 수 있도록 필요한 정보를 제공하는 시스템 및 방법이 매우 바람직하다.
본 발명은 전반적으로 대화형 시스템에 관한 것으로서, 특히, 고속이며 효과적인 대화형 네비게이션 즉, 사용자가 서비스 제공자 또는 주어진 서비스에 관련된 복합 다이얼로그에 접속할 경우, 사이트를 기술하는 뼈대(skeletons)나 트리 구조를 사용하는 특정 사이트(예컨대, 웹 사이트)의 대화형 서비스의 CML(Conversational Markup Language) 페이지를 제공해 주는 시스템 및 방법에 관한 것이다.
도 1은 본 발명의 실시예에 따라 대화형 뼈대 구조를 사용하여 대화형 네비게이션을 제공하는 시스템의 블록도.
도 2는 본 발명의 한 측면에 따라 대화형 뼈대 구조를 사용하여 대화형 네비게이션을 제공해 주는 방법의 흐름도.
본 발명은 다이얼로그(대화형) 시스템이 지원하는 기능 및 서비스를 전부 기술하는 계층 구조(뼈대 구조)를 통해 고속이고 효과적인 대화형 네비게이션을 제공하는 시스템 및 방법에 관한 것이다.
본 발명의 한 측면에 있어서, 대화형 시스템 및 방법은 다중 또는 복합 모드, 문맥 또는 애플리케이션을 처리하기 위해 프로시저(procedure)를 관리하는 관련 다이얼로그 메뉴 및 타깃 어드레스를 프리로드(pre-load)하도록 제공된다. 예를 들어, 컨덴츠 서버(웹 사이트)는 사용자가 서버에 처음으로 접속할 경우 서버가 제공하는 컨덴츠(페이지) 또는 서비스를 기술하는 뼈대 또는 트리 구조를 다운로드시킬 수 있다. 뼈대 구조는 사용자에게 숨겨져 있지만(보이지 않지만), 사용자는 뼈대 구조 내에 포함된 정보를 사용하여 적합하게 작용하는(사용자의 커맨드에 따라) 대화형 시스템이 인식하는 구두(spoken) 커맨드를 사용함으로써, 흥미로운 페이지 또는 특정의 다이얼로그 서비스에 접근할 수 있다.
본 발명은 특히 흥미로운 페이지를 찾기 위해 다수 페이지, 다이얼로그 컴포넌트 또는 NLU 다이얼로그 폼으로써 대화형 네비게이션을 단축시켜 주므로, 유일한 입력 양식으로서 스피치를 갖는 시스템에 특히 유용하다. 뼈대 구조는 요망 서비스 또는 트랜잭션으로 유도하는 온갖 페이지를 수행하여 집중하지 않고 사용자가 사이트나 유용한 서비스를 고속으로 탐색할 수 있도록 필요한 정보를 제공한다.
본 발명의 상기 측면 및 기타 측면과, 특징 및 장점은 첨부 도면을 참조하여 이하에서 설명될, 양호한 실시예에 대한 다음의 상세한 설명으로부터 분명해진다.
본 발명은 하드웨어, 소프트웨어, 펌웨어, 특수 목적의 프로세서 또는 그 조합으로 구성된 다양한 폼으로 실시될 수 있다. 바람직하게는, 본 발명은 프로그램 기억 장치(예, 자기 플로피 디스크, RAM, CD ROM, ROM 및 플래시 메모리)에 유형적으로(tangibly) 내장되어 있으며, 적합한 아키텍처로 구성된 소정의 디바이스(내장형 또는 기타) 또는 머신에 의해 실행가능한 프로그램 명령으로 이루어진 애플리케이션으로 구현된다. 또한 첨부 도면에 도시된 소정의 구성적 시스템 컴포넌트와 방법의 단계는 소프트웨어로 구현되면 바람직하므로, 시스템 구성 요소(또는 프로세스 단계) 사이들 간의 실질적인 접속은 본 발명이 프로그램되는 방식에 따라 상이하다. 본 명세서에서 주어진 지침에 따라, 당업자는 이들 및 본 발명과 유사한 실시와 구성을 구상할 수 있을 것이다.
또한, 본 발명은 소정의 대화형/다이얼로그 기반의 시스템, 예컨대 흥미로운 정보 또는 서비스에 도달하기 전에, 사용자가 대량의 페이지, 메뉴 또는 대화형 컴포넌트에 집중해야 하는 시스템에서 구현될 수 있다. 본 발명은 대화형 브라우저 및 "Conversational Browser and Conversational Systems"이라는 제목의 특허 출원 IBM Docket No. YO998-392P, "Conversational Computing Via Conversational Virtual Machine"이라는 제목의 특허 출원 IBM Docket No. YO999-111P에 설명된 CVM(Conversational Virtual Machine)와 관련하여 설명되며, 상기 문서들은 동시에 출원되어 공동으로 양도되었으며 순수하게 참조로써 본 명세서에 수록되었다.
상기 수록된 출원 IBM Docket No. YO998-392P은 CML(Conversational Markup Lanuage)으로 작성된 상호링크 페이지 세트를 사용하여 대화형 시스템을 구축하기위해 대화형 브라우저 및 CML 채용을 설명하였다. 이러한 참신한 발상은 HTML(Hypertext Markup langauge)로 작성된 상호링크 페이지 세트를 이용하여 대화형 GUI 브라우저 애플리케이션을 구축하는 것과 유사하다. 게다가, HTML이 GUI 작용(action)을 다른 페이지 접속 또는 서버와의 통신 등의 애플리케이션 작용으로 번역하는 것처럼, 대화형 브라우저 및 CML은 구두(spoken) 입력을 유사 애플리케이션 작용으로 번역하는데 이용된다.
특히, CML 페이지는 대화형 브라우저를 통해 사용자에게 해석되고 제공될 대화형 UI를 기술한다. 일실시예에서, CML 페이지는 현행 XML(eXtensible Markup Language) 규격에 기초한 태그에 의해 정의된다. 주요 요소에는 <page>, <body>, <menu> 및 <form>이 있다. page 요소는 다른 CML 요소를 분류하고, CML 문서용 상위 레벨 요소로서 역할한다. body 요소는 브라우저가 구두로 출력하는 출력을 명시한다. menu 요소는 각 선택 사항에 관련된 선택 리스트와, 사용자가 선택 사항을 선택했을 경우 접속할 CML 요소를 식별하는 타깃 어드레스(예, URL, 소켓 어드레스)를 제공한다. 폼 요소들은 사용자에게 1 피스 이상의 정보를 제공하게 하고, 각 정보 피스의 컨텐츠는 예컨대, 문법에 의해 기술된다. 또한, 다이얼로그 오브젝트(애플릿 등)는 페이지 내에 로드될 수 있다. 게다가, NL 다이얼로그에 대한 다수의 동시(simultaneous) 폼은 CML 페이지내에 옵션으로 로드될 수 있다. 이 예에서 컨덴츠는 언어 모델을 사용하며, 문법 대신에 혹은 문법과 함께 인자(argument)를 붙쳐 분석하여 기술될 수 있다. 폼 요소는 또한 사용자가 그 폼을 완성하였을 경우 접속할 수 있게 타깃 어드레스를 명시한다.
상기 수록된 참조에 더 상세하게 설명되어 있는 바와 같이, 대화형 브라우저를 사용하는 순수 대화형 시스템에 있어서, 스피치 및 오디오는 사용자에게 제공되는 유일한 출력이다. 그러므로, 사용자가 원할 경우, CML 페이지는 서비스 제공자에게서 다운로드될 수 있다. 이어서, CML 페이지에서 TTSML(Text-to Speech Markup Language) 정보를 사용함으로써, 대화형 브라우저는 링크를 추적하고 폼을 완성하거나 브라우저를 커맨드하기 위해, 사용자에게 그 페이지를 다시 읽어 주고, 스피치 인식기에 의해(CML 페이지의 스피치 인식 부분의 단서를 이용하여) 디코드될 사용자의 커맨드를 듣는다.
상기 대화형 인터페이스에 있어서, 사용자는 종종 흥미로운 정보에 도달하기 전에, CML 페이지의 여러 부분들에 집중하거나 대형 세트의 CML 페이지를 계층적으로 네비게이션해야만 한다. 상기 수록된 IBM Docket No. YO998-392P에서 논의한 바와 같이, 대화형 브라우저를 사용한 네비게이션에 대한 접근 방식에 있어서, "당신이 듣는 것이 당신이 말할 수 있는 것이다(what you hear is what you can say)"라는 접근 방식이 있다. 따라서 사용자는 자신이 이미 들었던 페이지와 링크를 참조함으로써 검색을 단축시킬 수 있다. 또한, 네비게이션의 또 따른 폼은 사용자가 이런 링크를 아직 듣지 못했을지라도 로드된 페이지 상에서 모든 링크를 활성화시키는 것이다. 그러나, 이러한 각 접근들에서 첫번째 페이지상에 링크되지 않은 페이지에 도달하기 위해서 사용자는 연속적인 페이지를 통해 검색해야 한다. 선택적 접근은 이제 도시된 실시예를 참조하여 이하에서 설명될 것이다.
이제 도 1을 참조하면, 본 발명의 실시예에 따라 효과적인 대화형 네비게이션을 제공해 주는 시스템에 대한 블록도가 도시된다. 이 시스템은 예컨대, 퍼스널 컴퓨터, 스마트폰, PDA(Personal Digital Assistant) 또는 소정의 스피치가능 보급형 계산기(PvC)와 같은 클라이언트 디바이스(100)를 포함한다. 클라이언트 디바이스(100)는 오디오/스피치 입력을 처리하고, 대화형 브라우저(103)가 생성하는 오디오/스피치를 출력하는 음향 프론트엔드(front end)/마이크로폰/스피커(101)을 포함한다. 클라이언트 디바이스(100)는 또한 음향 프론트엔드(101)가 생성 및/또는 캡쳐(capture)하는 음향 특성 및/또는 파형을 처리하고, 대화형 브라우저(103)가 요청 및 관리하는 음성 출력을 생성하는 1 이상의 국부적인 대화형 엔진(102)을 포함한다. 국부적인 대화형 엔진(102)은 예컨대, 내장된 스피치 인식 엔진, 스피커 인식 엔진, TTS(Text-To-Speech) 엔진, NLU(Natural Language Understanding) 엔진 및/또는 NLG(Natural Language Generation) 엔진을 포함할 수 있다. 대화형 브라우저(103)는 음성 출력을 상기 애플리케이션에 관계한 사용자에게 제공해 주기 위해서 1 이상의 스피치가능 국부적 애플리케이션(104)과 상호작용한다.
예를 들어 도 1에 도시된 바와 같이, 클라이언트 디바이스(100)는 네트워크(105)를 통한 1 이상의 "사이트" 예컨대, CML 페이지(107)를 포함하는 원격 서버(106)에 접속된 네트워크이다. 본 명세서에서 언급하는 "사이트"란 용어는 특정 CML 페이지에 대한 관련 CML 파일(또는 페이지) 수집을 의미한다. 또한, 도 1에는 단지 하나의 서버(106)만 도시되었지만, 특정 "사이트"는 상이한 위치의 네트워크(105)에 접속된 다수의 추가 서버(도시 생략)를 통해 유포될 수 있다. 그러므로, 설명을 위해, 특정 "사이트"에 관련된 모든 페이지는 동일한 서버(106)에 존재할 것으로 가정한다.
또한, 대화형 엔진(102)은 네트워크(105)를 통해 분산될 수 있으며(도 1에서 이 엔진은 클라이언트 디바이스(100)에 대해 국부적으로 도시되어 있지만), 본 명세서에 참조로써 수록된, "System and Method for Providing Network Coordinated Conversational Services"란 제목으로 동시 출원되어 공동으로 양도된 IBM Docket No. YO999-113P에 개시된 기술을 사용하여 액세스할 수 있다. 이 발상은 예컨대, 대화형 서비스 서버(111)로써 도 1에 도시되었으며, 서비스 서버는 어떤 폼의 대화형 서비스도 제공할 수 있다. 비록 하나의 서버(111)만 도시되었지만, 대화형 서비스 서버(111)는 1 이상의 서버를 나타낼 수 있다. 게다가, 대화형 브라우저(103)는 네트워크를 통해 배치될 수 있으며 클라이언트 디바이스(100)에 의해 액세스될 수 있다.
본 발명에 따른 컨덴츠 서버(106)는 클라이언트(100)(대화형 브라우저(103)를 통해)에 의해 액세스되기 전에 또는 되자마자 그래프 트리 또는 뼈대 구조(106)를 동적으로 생성하는 스파이더 스크립터(108)(공지되어 있음)를 포함한다. 이에 대해 뼈대 구조(109)는 사용자가 처음으로 서버(106)에 접속할 경우 다운로드되는 요청 "사이트" 또는 "사이트" 일부를 기술하는 계층 구조의 문서(파일)일 수 있다. 특히, 클라이언트(100)가 컨덴츠 서버(106)로 네트워크 접속을 최초로 수립할 경우, 서버(106)는 정보(예컨대, 타이틀로부터 저자 또는 자동 토픽 추출에 의해 제공되는 메타 정보)를 추출하여 관련된 추출 메타 정보에 그 페이지를 매핑시키는 그래픽 트리 구조(109)에 정보를 저장하기 위해, 요청된 CML 페이지의 각 링크를통해 "크롤(crawl)"하는 스파이더 스크립터(108)(예컨대, "크롤러(crawler)", "로봇(robot)" 또는 "봇(bot)"으로서 공지된 애플리케이션)를 실행시킬 것이다. 대안적으로, 서버(106)는 서버 내부에 배치된 각각의 특정 페이지(107)에 대해 저자가 미리 구축한 뼈대 구조(110)를 제공할 수 있다. 스파이더링이 미리 수행되면, 스타이더링이 수행되기를 대기함으로 초래되는 지연없이, 서버에 접속하자 마자 뼈대 구조가 전송될 수 있다.
상기 스파이더링 기능은 통상의 스파이더링과 다른 기법을 사용하여 구현될 수 있다. 예컨대, 통상의 방법에 관한 한 대안은 웹 서버에 접속하고 서버가 제공하는 맵으로부터 정보를 얻는 대화형 브라우저(또는 기본 플랫폼, 예컨대, CVM)를 갖추기 위해 프로토콜 호출을 종료한다. 대안적으로, YO999-113P에 기재된 바와 같이 네트워크를 통한 적절한 호출 라우팅 및 트래픽/로드 평형(balancing)을 제공하기 위해 네트워크 이외에 저장된 다른 캐싱/기억 기능으로부터 상기 정보를 얻을 수 있다.
스파이더링은 컨덴츠 제공자(106), 대화형 서비스 서버(111) 또는 대화형 브라우저(103)에 의해 수행될 수 있다. 가급적, 스파이더링은 미리 수행되면 바람직하다. 실제로, 클라이언트(100) 또는 서버(106, 111)는 사이트에 접속하자 마자 스파이더링을 발생시킬 수 있음에도, 지연될 수 있는 뼈대 구조(그러므로 대화 시작)에 액세스할 때, 이것은 스파이더링을 미리 수행하는 것보다 실제적이지 않다. 따라서, 서버(106)는 주기적으로 사이트를 스파이더하며, 접속시 클라이언트(100)에게 전달될 수 있도록 결과적 뼈대 구조를 저장할 수 있다. 전화통신(telephony) 브라우저(원격 서버에 배치되어 있는 대화형 브라우저)에 있어서, 통상적으로 서버의 대화형 브라우저(또는 브라우저 플랫폼, 예컨대, CVM)에 의해 액세스될 수 있는 사이트가 제한적이므로, 브라우저는 서버(106) 대신에 스파이링을 수행할 수 있다.
도 1의 예시적 실시예는 애플리케이션에 따라, 서버(106)가 클라이언트(100)에 접속된 네트워크이라는 것을 나타내지만, 서버 기능은 국부적인 리소스로부터 애플리케이션 또는 다이얼로그를 실행하거나 생성하면서 캡슐화될 수 있고, 클라이언트(100) 및 서버(106)는 동일한 머신이 될 수 있다. 또한, 사이트는 실제적인 사이트, 다이얼로그 또는 애플리케이션(국부 또는 원격)이 될 수 있다. 뼈대 구조(109)는 클라이언트(100), 서버(106), 게이트웨이 또는 라우터 등과 같은 네트워크(100)의 소정의 머신에 저장될 수 있다(액세스될 수 있다).
도시된 실시예에 있어서, 뼈대 구조(109 또는 110)는 CML 파일 폼으로 제공된다(선언(declarative) 폼(예컨대, XML, CML)과 반대되어 뼈대 구조는 절차상의 입력으로서 제공될 수도 있다). 구현(즉, CML, 기타 선언적 메커니즘, 절차적 등)과 관계없이 정보를 전달하기 위해 뼈대 구조에 의해 수행되는 일반적인 기능들은 동일하게 유지된다. 상기 정보는 애플리케이션 또는 사이트 관련 다이얼로그의 상이한 컴포넌트의 계층적 메뉴와, 각 다이얼로그 메뉴의 레벨 옵션 및/또는 각 메뉴를 구성하는 다이얼로그 컴포넌트를 포함한다(그 각각은 이하에 설명됨).
뼈대 구조의 각각의 요소들(109, 110)은 대화형 브라우저(103)에 의해 그 요소들이 사용자에게 드러나지 않도록 숨은 태그로 표시된다. 예컨대, CML 문서의 뼈대 구조의 일부는 <seleton></skeleton> 태그 또는 소정의 동류를 사용하여 표시될수 있다. 뼈대 구조 페이지는 사이트 디렉토리 구조를 통해 종래의 경로 폼(전위(prefix), 중위(infix)) 등으로 제공된다.
다음은 CML 파일 포맷의 뼈대 구조에 대한 한 예이다.
<skeleton>
<Hidden>
<Menu>
<a target="target address 1">politics</a><Menu>
<a target="target address 2">International</a><Menu>
<a target="target address 3">Europe</a><Menu>
<a target="target address 4">Belgium</a>
<a target="target address 5">France</a>
</Menu>
<a target="target address 6">Africa</a>
</Menu>
<a target="target address 7">US</a>
</Menu>
<a target="target address x">business</a>
<a target="target address y">weather</a>
<a target="target address z"sport</a><Menu>
<a target="target address z2">International</a><Menu>
<a target="target address z3">Europe</a><Menu>
<a target="target address z4">Belgium</a>
<a target="target address z5">France</a>
</Menu>
<a target="target address z6">Africa</a>
</Menu>
<a target="target address z7">US</a>
</Menu>
</Menu>
</Hidden>
</skeleton>
용이하게 볼 수 있는 바와 같이, 이상의 뼈대 구조는 관련 질의 실행 방법을 위한 각 노드에서 타깃으로 이루어진 계층 트리 구조를 표시한다. 예컨대, "target" 애트리뷰트로 조합된 앵커 태그(<a>...</a>)는 당업계에서 이해되는 "링크"를 생성한다. 각 "target address"는 URL 또는 소켓 어드레스가 될 수 있으며, 에컨대, 다이얼로그 또는 다이얼로그의 일부/인자가 달성될 수 있는 소정의 기타 어드레스이다. 예컨대, target address는 HTTP 프로토콜 및 대화형 브라우저 애플리케이션의 경우에 URL이 될 수 있다. 상기 예에 기초하여, CNN 사이트에 액세스할 수 있는 사용자는 뉴스, 국제, 유럽, 벨기에 등의 페이지를 고통스럽게 거치는 대신에 "벨기에(Belgium)"에 대한 "국제(international)" 뉴스에 즉시 액세스할 수있거나 또는 현재의 환율에서 소정을 서비스를 요청할 수 있다.
상기 모델에 있어서, 다음을 액세스하기 위해 소정의 타깃은 어드레스를 참조할 수 있다.
1. 대화형 브라우저에 대한 CML 페이지(예컨대, URL).
2. 사용자 질의(도 1에 도시된 네트워크(105)를 통한 대화형 서비스(111) 등)를 완성시키기 위해 특정의 모드/서비스(예컨대, 애플릿 또는 cgi, 스크립터, 액티브X 컴포넌트)의 다이얼로그 운용 프로시저 또는 정규 프로시저. 예컨대, 이러한 서비스에는 상기 수록된 YO999-113P에서 설명된 바와 같은 서버 사이드 상의 해당 요소 뿐만 아니라 오디오 캡쳐용 국부적 플러그인(plug-in), CODEC 압축과 통신 프로토콜 및 분산 처리용 인프라구조가 포함된다. 또한, 프로시저는 CML 페이지에 의존하는 대신에 다이얼로그를 수행하여 다이얼로그를 구현한다. 이것은 다이얼로그를 구축하기 위해 상이한 대화형 엔진에 직접 말하는 소정의 프로그램이 될 수 있거나 혹은 기본 플랫폼(예컨대, CVM)이 제공하는 서비스뿐만 아니라 다이얼로그 컴포넌트와 기본 클래스 오브젝트와의 조합(상기 수록된 IBM Docket No. YO999-111P에서 논의)이 될 수 있다. 실제로, 질의를 적합하게 하는데 필요한 모든 인자를 기입하기 위해, 프로시저는 사용자(사용자는 자신의 질의를 구축해야만 한다), 시스템(시스템은 질문후 질문해야 한다) 또는 복합(사용자 및 시스템은 명확한 질의를 완성하기 위해 상호작용한다)으로 이니셔티브되어 운용되는 NLU/NLG, FSG가 될 수 있다. 더욱 상세하게 설명하면, 복합 이니셔티브시, 사용자 및 시스템 모두는 다이얼로그를 운용한다. 사용자는 머신의 재촉없이 무엇이 활성되는지에 대한질의를 시작할 수 있다. 게다가, 사용자는 머신에 의해 질문된 것보다 더 많은 대답 또는 다른 대답을 제공한다. 만약 다이얼로그가 사용자의 입력 도메인을 지원하여 사용자의 질의가 요청하는 기능(예컨대, 해당 폼을 구비)을 활성화시킨다면, 다이얼로그는 질의를 완성시키고, 정정하거나 모호성을 제거하기 위해 전환할 것이다. 머신 직접 다이얼로그시, 머신은 다이얼로그를 운용하며, 즉 사용자는 특정 프롬프트에 대해 대답해야 한다. 본 발명에 따라, 사용자는 또다른 프롬프트로 점프하기 위해 뼈대 구조를 활성화시킬 수 있으며 그 프로프트로부터 다이얼로그 운용을 계속할 수 있다. 사용자 직접 다이얼로그시, 사용자는 완성적이고 명확한 질의를 작성할 때까지 다이얼로그를 운용하고, 이어서 머신은 그 질의를 실행시킨다(이것은 HTML에 삽입하는 폼과 유사하므로, 사용자는 자신이 만족할 때 폼을 기입하며 제출한다)
3. 주어진 노드가 나타내는 서비스를 위해 NLU/NLG 기반의 폼을 통해 완성하도록 사용자에게 표시될 수 있는 폼 세트.
4. 상기 수록된 출원 IBM Docket NO. YO999-113P에 개재되어 있는 바와 같이 처리를 위해 스피치(파형, 특징)가 전달되는 위치.
참조로써 본 명세서에 수록되는, Kishore 등이 1999년 9월 헝가리 부다페스트에서 Proc. Eurospeech 1999에서 발표한 "Free-Flow Dialog Management Using Forms"과, Davies 등이 1999년 9월 헝가리 부다페스트에서 열린 1999 Proc. Eurospeech에서 발표한 "The IBM Conversational Telephony System For Financial Applications"에 폼들이 설명되어 있다.
그러므로, 이상에서 설명한 바와 같이, 뼈대 구조는 뼈대 구조 특정 다이얼로그(숨겨지든 그렇치 않든)를 시작할 수 있다. 따라서, 폼 또는 다이얼로그 컴포넌트(대화형 오브젝트)는 사용자가 뼈대 구조 기능을 장점(CML 숨은 컴포넌트로써라기 보다는)으로 취하도록 하기 위해 로드될 수 있다는 것을 의미한다. 뼈대 구조는 새로운 폼, CML 페이지 또는 절차적 다이얼로그를 언급한다. 또한, 뼈대 구조는 CML, 엑스트라 폼 또는 절차적 다이얼로그 컴포넌트로서 제공될 수 있다.
게다가, 이상에서 나타낸 바와 같이, 본 발명은 사이트에서부터 맵까기의 뼈대 구조의 자동 추출시 트랜잭션의 로직 또는 특정 사이트의 컨텐츠를 제공한다. 게다가, 뼈대 구조는 사이트 개발자/비지니스 로직 오너(owner) 또는 컨덴츠 제공자에 의해 개발되거나 작성될 수 있다. 뼈대 구조가 작성/개발될 경우, 다이얼로그의 로직 뿐만 아니라 애플리케이션 로직은 캡쳐되어야 한다(다이얼로그의 캡쳐는 GUI 및 스피치 컴포넌트(동기형) 또는 기타 양식을 포함할 수 있다는 점에서 멀티양식이 될 수 있으며, 또한 스피치나 GUI에만 한정되지 않는다). 다이얼로그 캡쳐는 CML 스피치에 한정되지 않는다. 실제로, 대화형 브라우저나 기타 소정의 대화형 애플리케이션이 CVM 상단에 작성될 경우(상기 수록된 IBM Docket Nos. YO998-392P 및 YO999-111P에서 설명된 바와 같이), 다이얼로그 컴포넌트 배후에서 애플리케이션의 완전 비지니스 로직 또는 더 짧은 범위의 로직이 된다면, 다이얼로그의 숨은 부분은 여전히 캡쳐되어야 한다.
따라서, 절차적인 경우에, 본 명세서에서 설명된 예시적인 XML 뼈대 구조와 유사한 컨텐츠를 포함하는 오브젝트 구조를 교환함으로써, 애플리케이션은 비지니스 로직 정보를 교환할 수 있다(통상적으로 필드의 양과 성질을 정의하는 헤더를 사용하여). 오브젝트의 이러한 절차적인(예컨대, RPC(Remote Procedural calls)) 교환은 더 많은 정보를 운반할 수 있다. 실제로, 이러한 오브젝트는 전체의 다이얼로그 매니저, 다이얼로그 로직 및 다이얼로그 모듈(예컨대, 다이얼로그 부분) 컨덴츠를 포함할 수 있다. 따라서 모든 엔진 호출 및 UI 컴포넌트를 사용하여, 다이얼로그의 완전 확대(full-blown)를 구현할 수 있다. 예컨대, 전화 번호 수집을 위한 전 문법 기반의 또는 NL 기반의 다이얼로그일 수 있다. 기본적 다이얼로그 컴포넌트를 구현하는 대화형 기능 클래스 세트를 제공하는 또다른 옵션도 있다. 이러한 대화형 기능 클래스 및 오브젝트는 상기 수록된 IBM Docket No. YO999-111P에 기재되어 있다.
복합 다이얼로그는 상기 기능 클래스를 순차적으로 또는 병렬적으로 조합함으로써 구축될 수 있다. 순차적 조합은 로직 연산을 수행할 뿐만 아니라 엑스트라 UI, 행동(behavior) 및 다이얼로그를 구현하는 코드로써 순차적으로 인터리브된 컴포넌트를 이용한다. 상기 클래스의 병렬 조합은 동시 애플리케이션과 같이 상이한 다이얼로그 관리를 활성화시킨다. CVM이 제공하는 기본 다이얼로그 매니저는 활성 다이얼로그를 결정하다. CVM은 기초 클래스의 라이브러리를 제공한다. 그러므로, 다운로드 중에, 이러한 클래스는 전송되는 것이 아니라 브라우저 또는 CVM 플랫폼상에 링크된다.
게다가, 대화형 브라우저의 경우, 애플릿, 플러그인 및 기타 다이얼로그 모듈 뿐만 아니라 동시 스코프를 포함하는 폼(상기 수록된 IBM Docket No. YO998-392에 기재)은 다이얼로그의 완성 로직을 노출시키는 뼈대 구조의 예로서 고려될 수 있다.
따라서, 뼈대 구조는 XML(혹은, 기타 선언적 기술) 또는 프로시저(또는 그 조합)에 기초하여, 사용자가 다이얼로그를 통한 네비게이션으로 다이얼로그 부분들을 활성화시킬 때까지, 다이얼로그 로직 또는 비지니스 로직에 의해 다른 방법으로 숨겨지는 다이얼로그 부분을 캡쳐 및 활성화시키는 소정의 구조가 될 수 있다. 다이얼로그를 운용하는 뼈대 구조는 분명한 플랫폼(예컨대, 통상의 브라우저) 또는 절차적 플랫폼(예컨대, 다이얼로그 컴포넌트 등)를 통해 애플리케이션 다이얼로그로서 활성화될 수 있다. 이 애플리케이션 다이얼로그는 그자체가 절차적 또는 분명한 기반 또는 그것의 소정 조합이 될 수 있다.
그러므로, 뼈대 구조는 CML 실시예와 상이하게 구현될 수 있다: 그 기능(뼈대 구조를 통해 제공해야할 정보)은 교환된 오브젝트와 같은 다른 수단을 통해 구현될 수 있다. 게다가, 상기 정보의 이용은 상이하게 예컨대, 다이얼로그의 절차적 정의 또는 다이얼로그의 선언적 정의에 대한 기타 폼으로 구현될 수 있다.
다음의 예(IBM Docket No. YO998-392P)는 복합 다이얼로그의 전체 로직을 활성화시키도록 폼 및 절차의 조합을 나타낸다.
<menu name=main1 scope=global>
<form name=skeleton_form scope=multiple context=maintain></form>
<form name=form1 load=procedure1 scope=multiple context=maintain>
</form>
<form name=form2 load=form2 scope=multiple context=reset></form>
<form name=form3 load=procedure3 scope=deactivated context=reset>
</form>
<form name=form4 load=procedure4 scope=multiple context=reset>
</form>
…
</menu>
상기 예는 이러한 접근에 따라 다이얼로그에 로드될 수 있는 뼈대 구조 폼을 나타낸다.
그러므로, 본 발명에 따라 구조화된 뼈대 구조는 뼈대 구조 XML 정보나 뼈대 구조 오브젝트를 교환하거나 다이얼로그 컴포넌트를 미리 로드하여 활성화시킴으로써, 다이얼로그의 로직 또는 사이트나 애플리케이션의 비니지스 로직을 캡쳐할 수 있다. 이러한 다이얼로그 컴포넌트는 XML 페이지를 미리 로드하거나, 대화형(절차적) 오브젝트 또는 그 조합을 미리 로드함으로써 제공될 수 있다. 동시 스코프 폼의 메커니즘은 이것이 대화형 브라우저와의 조합으로써 어떻게 달성될 수 있는지의 한 예이다.
다이얼로그 컴포넌트를 미리 로드하여 활성화시킴으로써, 주어진 서비스 또는 트랜잭션의 일부로의 액세스는 서비스 제공자가 최초로 제공하는 일련의 요구, 재생 또는 메뉴를 따를 필요가 없을 것으로 예상될 수 있다. 이것은 오퍼레이터가 처음에 달성하려고 시도한 정보를 교환하는데 흥미없는 사용자가 주어진 서비스로즉시 이동하여 특정 질의를 수행하는데 필요한 최소 정보를 제공하거나 이전에 존재하던 트랜잭션을 수행하기 위해 이전 트랜잭션으로 즉시 리턴하기 위한 오퍼레이터와의 다이얼로그와 사실상 등가적이다. 전체 다이얼로그를 활성화시킴으로써, 시스템은 예컨대, 충분한 정보가 제공되었다면 그 질의와 관련된 폼을 작성하여 처리하여, 그 질의를 완성할 수 있다. 질의가 불완전하다면, 다이얼로그 시스템은 단지 그 폼을 완성시키는데 필요한 엑스트라 정보를 수집하려고 시도할 것이다.
이제, 도 2를 참조하면, 본 발명의 한 측면을 따른 효과적인 대화형 네비게이션을 제공하는 방법에 대한 흐름도가 도시된다. 설명을 위해, 본 명세서에 기술된 방법은 CML을 채용한 시스템과 대화형 브라우저를 기반으로 한다. 처음에, 클라이언트 디바이스는 특정 CML 페이지(사이트)에 액세스하기 위해 서비스 제공자 서버에 접속할 것이다(대화형 브라우저를 통해). 요청된 사이트에 대해 미리 구축된 뼈대 구조가 있다면(단계 201의 긍정 결과), 미리 구축된 뼈대 구조는 클라이언트에게 다운로드된다(단계 203).
한편, 미리 구축된 뼈대 구조가 존재하지 않는다면(단계 201의 부정 결과), 사이트의 뼈대 구조는 자동적으로 생성되어(단계 202) 클라이언트에게로 다운로드된다(단계 203). 뼈대 구조는 전체 사이트 또는 사이트의 일부를 표시할 것이다. 또한, 뼈대 구조는 전체 다이얼로그(예컨대, 전체 다이얼로그를 구현하는 프로시저) 또는 다이얼로그의 부분(예컨대, 신용 카드, 전화 번호 또는 이메일 클라이언트로의 액세스를 기술하는데 필요한 전체 컴포넌트 및 티켓 주문 및 스케줄 확인 등을 위해, 칼렌더(calendar) 입력을 처리하는데 필요한 전체 다이얼로그 컴포넌트) 또는 그 조합을 표시할 수 있다. 그러므로, 사용자는 신용 카드 또는 어드레스 기입(filing) 다이얼로그의 중앙으로 직접 점프할 수 있다. 또한, 사용자는 뱅킹 트랜잭션 또는 이메일 작성과 같은 또다른 다이얼로그를 수행하면서, 칼렌더 검사 다이얼로그로 점프할 수 있다. 따라서, 다른 애플리케이션(사이트 정보도 포함)를 캡쳐하여 활성화시킴으로써, 시스템은 주어진 태스크(task)/다이얼로그를 수행하면서, 사용자가 다른 애플리케이션 또는 그 애플리케이션의 일부를 액세스할 수 있게 할 수 있다. 이것은 CML 구현으로 이루어질 수 있으므로, 각각의 다이얼로그 부분은 특정의 CML 페이지 또는 상기 페이지에 로드된 프로시저를 통해 구현될 수 있다. 또한, 사이트 뼈대 구조는 저자에 의해 미리 구축될 수 있으며(단계 201에서), 미리 스파이더된 사이트를 구비함으로써 미리 구축될 수 있다(이상에서 나타낸 바와 같이).
뼈대 구조가 다운로드되면(단계 203), 대화형 브라우저는 빼대 조직에 포함된 모든 페이지(링크)를 활성화시킨다(단계 (204)). 처음에, 페이지 링크가 활성화될지라도, 뼈대 구조는 사용자에게 드러나지 않는다(예컨대, 보이지 않는다. 그러나, 사용자 자신이 생각하는 처음에 다운로드된 링크에 관련된 특정 페이지로 액세스하기 위해 특정 페이지를 활성화시키는 구두 커맨드를 사용자가 시행하게 되면(단계 205의 긍정 결과), 대화형 브라우저는 인식된 사용자 커맨드에 해당하는 뼈대 구조의 링크(활성 문서)를 찾기 위해 뼈대 구조를 분석한다(단계 206). 활성화된 링크가 발견되어 사용자 커맨드에 해당한다면(단계 207의 긍적 결과), 사이트는 다운로드되고(단계 208), 프로세스는 반복된다(단계 208로 리턴). 이러한 특징은 유일한 입력/출력 양식으로서 스피치를 갖는 시스템에 특히 효과적이다(멀티양식 시스템에도 효과적이다). 특정 사이트(및 그와 관련된 사이트)에 인숙한 사용자는 요망 페이지, 서비스 또는 트랜잭션을 유도하는 모든 가능 페이지를 따르거나 집중할 필요없이 일련의 공지된 CML 페이지를 통해 고속으로 네비게이션할 수 있다.
대안적으로, 사용자는 대화형 브라우저에게 뼈대 구조내의 요망 토픽 또는 서비스로의 특정 링크가 사용자 질의와 매칭하지의 여부를 나타내는지 또는 그렇치 않다면 뼈대 구조에서 정보를 다시 읽는 브라우저를 구비함으로써 뼈대 구조를 네비게이션하는지를 문의할 수 있다(단계 209의 긍정 결과). 주어진 토픽을 위해 또는 기본적인 페이지를 듣기 위해 사용자의 질의에 따라, 브라우저는 뼈대 구조를 탐색하며 정보를 다시 읽거나 질의 매칭을 확인한다(단계 210). 브라우저가 요청된 정보를 제공한다면, 사용자는 요망 링크를 선택하여(뼈대 구조에서)(단계 211), 요망 사이트 또는 서비스에 액세스할 수 있다(단계 208). 본 발명의 이러한 측면에 있어서, 뼈대 구조는 다이얼로그 정보뿐만 아니라 사용자가 그 다이얼로그에 익숙하지 못하거나 복합 이니셔티브 다이얼러그가 적합한 지름질 또는 로드를 위한 컴포넌트를 찾는데 필요한 복합 애플리케이션 또는 사이트인지에 대한 정보를 직접 탐색하거나 추적하기 위한 사용자용 다이얼로그를 포함한다는 점에서 특히 유용하다.
또한, "사이트" 뼈대 구조는 비주얼(GUI) 브라우저에서의 프레임과 동등한 오디오를 포함하기 위해 확장될 수 있다. 특히, 사용자가 네비게이션할 있거나 문의할 수 있는 추가의 숨은 정보는 페이지 저자에 의해 동의되어, 저자에 의해 손수구축되어, 프레임(예컨대, 메인 CML 페이지에 로드된 개별적 페이지)으로서 추가될 수 있다. HTML에서, 프레임은 사용자에게 페이지를 인라인으로 상이한 서브 페이지 또는 상이한 HTML 페이지에 초점을 맞춘 타깃으로 나누어지게 한다. 동일한 방식으로, CML 페이지 사용시, 프레임은 사용자에게 메뉴 또는 뼈대 구조를 제공하도록 소개될 수 있다. 예컨대, 저자는 다음의 예와 같이, 그 사이트 페이지를 제시할 수 있다.
<CML>
<frameset interface="hidden,play"><!This means that the first frame is hidden, the second is played to the user>
<frame 1>
<skeleton target=url1>
</skeleton>
<frame 2>
…[Main CML content page at this stage of the dialog. It can also be pointed to with a target tag]
</frame 2>
</frameset>
</CML>
이것은 다이얼로그 활성화의 또다른 예이다. 이전의 예는 병렬적으로 활성된 다중 폼을 사용하여 나타냈지만, 이 예는 병렬 활성화에 대한 상이한 구문(syntax)을 나타낸다.
명백하다시피, 본 발명은 다양한 기능에 대해 채용될 수 있다. 상기 수록된 특허 출원 Y099-111P 및 YO998-392P에서, 각각의 개념이 소개되었다: "SpokenAge"란 애플리케이션 개발 환경 및, 통상의 표시 재료(material)를 대화형 재료로 변형(예컨대, 통상의 HTML 페이지를 CML 페이지로)할 수 있는 메커니즘인 대화형 트랜스코딩(transcoding)을 의미한다. 상기 수록된 출원서에서 논의는 기능적인 트랜스코딩의 개념과- 표시(presentaion) 정보를 CML 정보로의 전환(즉, 주어진 HTML 페이지를 CML 페이지로의 전환)-, "논리적 트랜스코딩"의 개념이다. 상기 수록된 출원, YO999-111P 및 YO998-392P에서 논의한 바와 같이, 논리적 트랜스코딩은 사이트 배후의 비지니스 로직에 기초한 다이얼로그 구축을 수반하다. 통상적으로, 트랜스코더(transcoder)가 다이얼로그의 "다음 단계" 또는 트랜잭션 비지니스 로직의 다음 단계에 관한 정보로 액세스할 수 없기 때문에, 이 프로세스는 매우 어렵다.
뼈대 구조가 비지니스 로직(멀티양식, 오직 스피치 또는 오직 GUI)을 캡쳐할 수 있기 때문에 뼈대 구조 사용은 논리적 트랜스코딩 사용에 특히 효과적이다. 물론, 이경우에 뼈대 구조는 예컨대, CML 사이트 대신에 HTML 사이트이지만, 그 뼈대 구조에 대한 기본 원리는 변하지 않는다. 따라서, 뼈대 구조 개념은 음성 다이얼로그에 한정되지 않지만, 예컨대, GUI 기반의 다이얼로그일지라도 어떤 다이얼로그로도 확장될 수 있다. 그러므로, 논리적 트랜스코딩 기법은 다이얼로그/트랜잭션 또는 사이트의 뼈대 구조를 액세스하여 애플리케이션 개발자(사이트 맵 또는 다이얼로그 맵) 또는 자동 트랜스코더에 그것을 제시하도록 펼쳐져서(unfolding) 제공된다. 따라서, 트랜스코드 CML 다이얼로그는 즉시 이용가능한 모든 비지니스 로직 정보를 포함하도록 최적화될 수 있다.
또한, 본 발명은 멀티양식의 대화형 브라우저와 관련된 사용에 효과적이다. 실제로, 멀티양식의 경우에, GUI 컨덴츠가 통상의 GUI 브라우저로서 설계된다는 것은 더이상 확실하지 않다. 실제로, 멀티양식 페이지를 억지로 강제하여 스피치로써 순수하게 제공하기에 어려울 소정의 정보를 사용자에게 제공하기 위해 GUI 페이지를 사용할 것이다. 이것은 사이트를 통해 다이얼로그 네비게이션을 향상시키도록 뼈대 구조를 프리로드할 것을 요구할 것이다.
본 발명의 또다른 예시적 실시예에 있어서, 구좌 관리를 수반하는 NLU/NLG 온라인 뱅킹 서비스와, 온라인 납부 및 투자 관리가 고려될 수 있다. 예컨대, 이러한 시스템은 사용자가 수행할 수 있는 모든 작용에 해당하는 여러 폼을 사용하여 구축될 수 있다. NLU 분석 및 번역은 그 폼들의 모든 입력 필드의 인자를 제공하도록 구현될 수 있으며, 그 폼들은 인자 및 문맥과 모순이 없다. 질의는 이전 것이 완료되기 전에 새로운 폼(예, 질의) 경향을 활성화시킴으로써 삽입될 수 있다. 삽입된 질의가 완료될 때, 이전 문맥은 여전히 불완전한 이전 폼을 검사함으로써 재활성화될 수 있다.
제공될 수 있는 가능한 타입의 질의 수가 증가한다면, 병렬 폼 기입(filling)은 어렵게 된다. 통상적으로, 사용자는 자신의 의도를 나타내기 위해 계층적인 폼을 기입해야 한다(NLU 질의 및 복합 이니셔디브를 통해). 효과적으로, 고 레벨 메뉴를 표시하기 위해 뼈대 구조를 사용하는 본 발명은 주어진 레벨 계층에서 기입하도록 각 세트의 폼에 대해 추가되는 엑스트라 폼으로서 표시될 수 있다. 결과적으로, 시스템의 강력한 사용자는 바람직한 노드의 뼈대 구조를 활성화시킴으로써, 즉시 순차적 폼 기입을 스킵할 수 있으며, 자신의 질의 범위를 즉시 좁힐 수 있다.
본 발명은 효과적인 대화형 네비게이션을 제공하기 위해 기타 다양한 애플리케이션으로 구현될 수 있다. 이러한 시스템의 예는 다음과 같다:
- 대화형 브라우저가 메인 UI 프로시저인 PVA(Personal Vehicle Assistant),
- NLU/NLG 다이얼로그가 폼, FSG 또는 프로시저에 의해 운용되는 VA(Virtual assistant)
- 대화형 브라우저를 구비하는 PDA 및 스마트폰
- IVR(Interactive Voice Respose) 스크립터가 CML과 대화형 브라우저 아키텍처로 대체되고, 그 양쪽은 상기 수록된 출원 IBM Docket No. YO998-392P에 기재되어 있는 전화 통신 애플리케이션과 더불어 오락 소프트웨어 솔루션 및 e-비지니스
- 폼기반의 툴킷(toolkit)이 적용될 수 있는 전화 통신/키오스크(kiosk)
도시된 실시예가 첨부 도면을 참조하여 본 명세서에서 설명되었지만, 본 발명과 시스템은 특정의 실시예에 한정되지 않으며, 기타 다양한 변화 및 개선이 본 발명의 성질과 범위에서 벗어나지 않고 당업자에 의해 취해질 것이다. 이러한 모든 변화 및 수정은 첨부 청구범위에 의해 규정되는 본 발명의 사상 내에 포함되어야 한다.
Claims (26)
- 대화형 네비게이션을 제공하는 시스템으로서,적어도 하나의 계층 구조적인 문서를 생성하는 수단들을 포함하는 서버와 -상기 계층 구조적인 문서는 상기 서버의 컨덴츠 매핑과 상기 서버가 제공하는 다이얼로그 서비스 로직 매핑 중의 하나를 포함-;클라이언트의 사용자로 하여금 상기 적어도 하나의 계층 구조적인 문서의 매핑으로써 기술되는 컨덴츠 및 다이얼로그 서비스 중 바람직한 것에 대해 네비게이션하도록 상기 적어도 하나의 계층 구조적인 문서를 활성화시키는 적어도 하나의 계층 구조적인 문서 및 수단을 액세스하는 수단을 포함하는 클라이언트를 포함하는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 해당 노드가 지정하는 정보로의 URL(Uniform Resource Locator) 및 소켓 어드레스 중 하나를 포함하는 타깃 어드레스를 구비하는 각 노드로 된 복수의 노드를 구비한 트리를 포함하는 뼈대 구조인 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 각 노드는 상기 노드에 관련된 CML(Conversational Markup Language)의 URL(Uniform Resource Locator)으로의 타깃 어드레스를 포함하는 대화형 네비게이션 제공 시스템.
- 제3항에 있어서, 상기 적어도 하나의 계층 구조적인 문서는 CML 페이지의 프레임으로서 표시되는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 다이얼로그 서비스의 로직 매핑은 기본 애플리케이션의 상기 로직 매핑 및 상기 다이얼로그 서비스의 각 다이얼로그를 포함하는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 적어도 하나의 계층 구조적인 문서는 상기 클라이언트상에서의 상기 다이얼로그 서비스 실행을 위해 상기 클라이언트에게 상기 다이얼로그 서비스를 제공하도록 절차적 교환 및 다이얼로그 오브젝트 교환을 허용하는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 각 노드는 상기 노드와 관련된 다이얼로그 서비스 제공에 책임있는 다이얼로그 매니저로의 타깃 어드레스를 포함하는 대화형 네비게이션 제공 시스템.
- 제7항에 있어서, 상기 다이얼로그 매니저는 폼 기입 기반의(form filling based) NLU(Natural Language Understanding)를 제공하는 대화형 네비게이션 제공 시스템.
- 제7항에 있어서, 상기 다이얼로그 매니저는 전용 프로시저를 제공하는 대화형 네비게이션 제공 시스템.
- 제7항에 있어서, 상기 다이얼로그 매니저는 FSG(Finite State Grammars)를 제공하는 대화형 네비게이션 제공 시스템.
- 제7항에 있어서, 상기 다이얼로그 매니저는 복합 이니셔티브를 채용하는 대화형 네비게이션 제공 시스템.
- 제7항에 있어서, 상기 다이얼로그 매니저는 머신 직접 다이얼로그를 채용하는 대화형 네비게이션 제공 시스템.
- 제7항에 있어서,상기 다이얼로그 매니저는 사용자 직접 다이얼로그를 채용하는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 적어도 하나의 계층 구조적인 문서를 생성하는 수단은 스파이더링 애플리케이션인 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 미리 구축되어 있는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 클라이언트의 사용자에게 숨겨져 있는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 상기 계층 구조적인 문서가 활성화될 때 사용자에 의해 문의될 수 있는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 다이얼로그 개시때 사용자에 의해 문의될 수 있는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 클라이언트는 트랜스코더이고, 상기 계층 구조적인 문서는 HTML(Hypertext Markup Language) 페이지와 CML 페이지 중 하나를 생성하도록 상기 트랜스코더에 의해 논리적 트랜스코딩을 수행하는데 이용되는 대화형 네비게이션 제공 시스템.
- 제19항에 있어서, 상기 계층 구조적인 문서는 HTML 사이트의 구조를 표시하는 대화형 네비게이션 제공 시스템.
- 제19항에 있어서, 상기 계층 구조적인 문서는 멀티양식, 오직 스피치 및 오직 GUI(Graphical User Interface) 중의 하나인 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 다이얼로그 컴포넌트인 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 각 노드는 적어도 하나의 오브젝트로의 타깃 어드레스를 포함하는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 절차적으로 또는 선언적으로 구현되는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 클라이언트와 상기 서버 모두는 동일한 머신을 실행시키는 대화형 네비게이션 제공 시스템.
- 제1항에 있어서, 상기 계층 구조적인 문서는 상기 서버, 상기 클라이언트, 게이트웨이 및 라우터 중의 하나에 저장되는 대화형 네비게이션 제공 시스템.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10295798P | 1998-10-02 | 1998-10-02 | |
US60/102,957 | 1998-10-02 | ||
US11759599P | 1999-01-27 | 1999-01-27 | |
US60/117,595 | 1999-01-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010073105A true KR20010073105A (ko) | 2001-07-31 |
KR100431972B1 KR100431972B1 (ko) | 2004-05-22 |
Family
ID=26799924
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2001-7004207A KR100430953B1 (ko) | 1998-10-02 | 1999-10-01 | 네트워크 협동 대화 서비스를 제공하기 위한 시스템 및 방법 |
KR10-2001-7002798A KR100431972B1 (ko) | 1998-10-02 | 1999-10-01 | 통상의 계층 오브젝트를 사용한 효과적인 음성네비게이션용 뼈대 구조 시스템 |
KR10-2001-7004228A KR100459299B1 (ko) | 1998-10-02 | 1999-10-01 | 대화식 브라우저 및 대화식 시스템 |
KR1020017004223A KR100620826B1 (ko) | 1998-10-02 | 1999-10-01 | 대화형 컴퓨팅 시스템 및 방법, 대화형 가상 머신, 프로그램 저장 장치 및 트랜잭션 수행 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2001-7004207A KR100430953B1 (ko) | 1998-10-02 | 1999-10-01 | 네트워크 협동 대화 서비스를 제공하기 위한 시스템 및 방법 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2001-7004228A KR100459299B1 (ko) | 1998-10-02 | 1999-10-01 | 대화식 브라우저 및 대화식 시스템 |
KR1020017004223A KR100620826B1 (ko) | 1998-10-02 | 1999-10-01 | 대화형 컴퓨팅 시스템 및 방법, 대화형 가상 머신, 프로그램 저장 장치 및 트랜잭션 수행 방법 |
Country Status (10)
Country | Link |
---|---|
US (4) | US7137126B1 (ko) |
EP (4) | EP1133734A4 (ko) |
JP (4) | JP3703082B2 (ko) |
KR (4) | KR100430953B1 (ko) |
CN (4) | CN1151488C (ko) |
AT (1) | ATE383640T1 (ko) |
CA (4) | CA2345665C (ko) |
DE (1) | DE69937962T2 (ko) |
IL (5) | IL140805A0 (ko) |
WO (4) | WO2000021075A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100815731B1 (ko) * | 2005-06-30 | 2008-03-20 | 캐논 가부시끼가이샤 | 음성 인식 방법 및 음성 인식 장치 |
Families Citing this family (698)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1151488C (zh) * | 1998-10-02 | 2004-05-26 | 国际商业机器公司 | 通过一般分层对象进行有效语音导航的结构框架 |
US7003463B1 (en) | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US6163794A (en) * | 1998-10-23 | 2000-12-19 | General Magic | Network system extensible by users |
US6886047B2 (en) * | 1998-11-13 | 2005-04-26 | Jp Morgan Chase Bank | System and method for managing information retrievals for integrated digital and analog archives on a global basis |
FR2787902B1 (fr) * | 1998-12-23 | 2004-07-30 | France Telecom | Modele et procede d'implementation d'un agent rationnel dialoguant, serveur et systeme multi-agent pour la mise en oeuvre |
AU6630800A (en) | 1999-08-13 | 2001-03-13 | Pixo, Inc. | Methods and apparatuses for display and traversing of links in page character array |
US7330815B1 (en) * | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
US6633846B1 (en) | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US6665640B1 (en) | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
EP1107522B1 (en) * | 1999-12-06 | 2010-06-16 | Telefonaktiebolaget LM Ericsson (publ) | Intelligent piconet forming |
JP2001188784A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 会話処理装置および方法、並びに記録媒体 |
US20010043234A1 (en) * | 2000-01-03 | 2001-11-22 | Mallik Kotamarti | Incorporating non-native user interface mechanisms into a user interface |
WO2001059999A1 (en) * | 2000-02-11 | 2001-08-16 | Convergent Networks, Inc. | Service level executable environment for integrated pstn and ip networks and call processing language therefor |
WO2003050799A1 (en) * | 2001-12-12 | 2003-06-19 | International Business Machines Corporation | Method and system for non-intrusive speaker verification using behavior models |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
AU2001256902A1 (en) * | 2000-05-05 | 2001-11-20 | James Ewing | A method and a system relating to protocol communications within a pre-existing www server framework |
US6769010B1 (en) * | 2000-05-11 | 2004-07-27 | Howzone.Com Inc. | Apparatus for distributing information over a network-based environment, method of distributing information to users, and method for associating content objects with a database wherein the content objects are accessible over a network communication medium by a user |
FR2809204B1 (fr) * | 2000-05-17 | 2003-09-19 | Bull Sa | Interface applicative multiprosseur, ne necessitant pas l'utilisation d'un systeme d'exploitation multiprocesseur |
US7039951B1 (en) | 2000-06-06 | 2006-05-02 | International Business Machines Corporation | System and method for confidence based incremental access authentication |
US7047196B2 (en) | 2000-06-08 | 2006-05-16 | Agiletv Corporation | System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery |
CA2349021C (en) * | 2000-06-16 | 2010-03-30 | Bayer Corporation | System, method and biosensor apparatus for data communications with a personal data assistant |
US6654722B1 (en) * | 2000-06-19 | 2003-11-25 | International Business Machines Corporation | Voice over IP protocol based speech system |
US6788667B1 (en) * | 2000-06-20 | 2004-09-07 | Nokia Corporation | Wireless access to wired network audio services using mobile voice call |
WO2002005153A2 (en) * | 2000-07-07 | 2002-01-17 | 2020Me Holdings Ltd. | System, method and medium for facilitating transactions over a network |
US7139709B2 (en) | 2000-07-20 | 2006-11-21 | Microsoft Corporation | Middleware layer between speech related applications and engines |
EP1376418B1 (en) * | 2000-08-31 | 2006-12-27 | Hitachi, Ltd. | Service mediating apparatus |
US6785651B1 (en) * | 2000-09-14 | 2004-08-31 | Microsoft Corporation | Method and apparatus for performing plan-based dialog |
EP1332605A4 (en) * | 2000-10-16 | 2004-10-06 | Eliza Corp | METHOD AND SYSTEM FOR PROVIDING ADAPTIVE RESPONDENT TRAINING IN A VOICE RECOGNITION APPLICATION |
US7072982B2 (en) | 2000-11-22 | 2006-07-04 | Microsoft Corporation | Universal naming scheme for peer to peer resources |
US7594030B2 (en) | 2000-11-22 | 2009-09-22 | Microsoft Corporation | Locator and tracking service for peer to peer resources |
DE50011222D1 (de) * | 2000-12-04 | 2005-10-27 | Siemens Ag | Verfahren zum Nutzen einer Datenverarbeitungsanlage abhängig von einer Berechtigung, zugehörige Datenverarbeitungsanlage und zugehöriges Programm |
US7016847B1 (en) | 2000-12-08 | 2006-03-21 | Ben Franklin Patent Holdings L.L.C. | Open architecture for a voice user interface |
GB0030958D0 (en) * | 2000-12-19 | 2001-01-31 | Smart Card Solutions Ltd | Compartmentalized micro-controller operating system architecture |
DE10064661A1 (de) * | 2000-12-22 | 2002-07-11 | Siemens Ag | Kommunikationsanordnung und Verfahren für Kommunikationssysteme mit interaktiver Sprachfunktion |
JP3322262B2 (ja) | 2000-12-22 | 2002-09-09 | 日本電気株式会社 | 無線携帯端末通信システム |
FI20002860A (fi) * | 2000-12-27 | 2002-06-28 | Nokia Corp | Laiteroolit ja pikoverkkoyhteydet |
US6925645B2 (en) * | 2000-12-29 | 2005-08-02 | Webex Communications, Inc. | Fault tolerant server architecture for collaborative computing |
US6964023B2 (en) | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
US7461148B1 (en) * | 2001-02-16 | 2008-12-02 | Swsoft Holdings, Ltd. | Virtual private server with isolation of system components |
EP1233590A1 (en) | 2001-02-19 | 2002-08-21 | Sun Microsystems, Inc. | Content provider for a computer system |
US7606909B1 (en) * | 2001-02-20 | 2009-10-20 | Michael Ely | Method and apparatus for a business contact center |
GB2372864B (en) * | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
ATE345526T1 (de) | 2001-03-22 | 2006-12-15 | Canon Kk | Informationsverarbeitungsvorrichtung und - verfahren und programmprodukt |
US7174514B2 (en) * | 2001-03-28 | 2007-02-06 | Siebel Systems, Inc. | Engine to present a user interface based on a logical structure, such as one for a customer relationship management system, across a web site |
FR2822994B1 (fr) * | 2001-03-30 | 2004-05-21 | Bouygues Telecom Sa | Assistance au conducteur d'un vehicule automobile |
US6996531B2 (en) * | 2001-03-30 | 2006-02-07 | Comverse Ltd. | Automated database assistance using a telephone for a speech based or text based multimedia communication mode |
CA2344904A1 (en) * | 2001-04-23 | 2002-10-23 | Bruno Richard Preiss | Interactive voice response system and method |
US7437295B2 (en) * | 2001-04-27 | 2008-10-14 | Accenture Llp | Natural language processing for a location-based services system |
US7698228B2 (en) | 2001-04-27 | 2010-04-13 | Accenture Llp | Tracking purchases in a location-based services system |
US7610547B2 (en) | 2001-05-04 | 2009-10-27 | Microsoft Corporation | Markup language extensions for web enabled recognition |
US7020841B2 (en) | 2001-06-07 | 2006-03-28 | International Business Machines Corporation | System and method for generating and presenting multi-modal applications from intent-based markup scripts |
US7366673B2 (en) * | 2001-06-15 | 2008-04-29 | International Business Machines Corporation | Selective enablement of speech recognition grammars |
US7647597B2 (en) * | 2001-06-28 | 2010-01-12 | Microsoft Corporation | Transparent and sub-classable proxies |
US7606712B1 (en) * | 2001-06-28 | 2009-10-20 | At&T Intellectual Property Ii, L.P. | Speech recognition interface for voice actuation of legacy systems |
US6839896B2 (en) * | 2001-06-29 | 2005-01-04 | International Business Machines Corporation | System and method for providing dialog management and arbitration in a multi-modal environment |
JP3997459B2 (ja) * | 2001-10-02 | 2007-10-24 | 株式会社日立製作所 | 音声入力システムおよび音声ポータルサーバおよび音声入力端末 |
CA2749432C (en) * | 2001-10-03 | 2012-07-10 | Accenture Global Services Gmbh | Multi-modal messaging and callback with service authorizer and virtual customer database |
US7441016B2 (en) | 2001-10-03 | 2008-10-21 | Accenture Global Services Gmbh | Service authorizer |
US7472091B2 (en) | 2001-10-03 | 2008-12-30 | Accenture Global Services Gmbh | Virtual customer database |
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
US7233655B2 (en) | 2001-10-03 | 2007-06-19 | Accenture Global Services Gmbh | Multi-modal callback |
EP1708470B1 (en) * | 2001-10-03 | 2012-05-16 | Accenture Global Services Limited | Multi-modal callback system |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US7222073B2 (en) | 2001-10-24 | 2007-05-22 | Agiletv Corporation | System and method for speech activated navigation |
US7133830B1 (en) | 2001-11-13 | 2006-11-07 | Sr2, Inc. | System and method for supporting platform independent speech applications |
US8498871B2 (en) * | 2001-11-27 | 2013-07-30 | Advanced Voice Recognition Systems, Inc. | Dynamic speech recognition and transcription among users having heterogeneous protocols |
US20030101054A1 (en) * | 2001-11-27 | 2003-05-29 | Ncc, Llc | Integrated system and method for electronic speech recognition and transcription |
US7302394B1 (en) * | 2001-12-20 | 2007-11-27 | Ianywhere Solutions, Inc. | Front-end device independence for natural interaction platform |
GB2388209C (en) | 2001-12-20 | 2005-08-23 | Canon Kk | Control apparatus |
WO2003063137A1 (en) * | 2002-01-22 | 2003-07-31 | V-Enable, Inc. | Multi-modal information delivery system |
US6990639B2 (en) | 2002-02-07 | 2006-01-24 | Microsoft Corporation | System and process for controlling electronic components in a ubiquitous computing environment using multimodal integration |
US6704396B2 (en) | 2002-02-27 | 2004-03-09 | Sbc Technology Resources, Inc. | Multi-modal communications method |
US20030187944A1 (en) * | 2002-02-27 | 2003-10-02 | Greg Johnson | System and method for concurrent multimodal communication using concurrent multimodal tags |
US6807529B2 (en) * | 2002-02-27 | 2004-10-19 | Motorola, Inc. | System and method for concurrent multimodal communication |
GB0204768D0 (en) * | 2002-02-28 | 2002-04-17 | Mitel Knowledge Corp | Bimodal feature access for web applications |
FR2840484B1 (fr) * | 2002-05-28 | 2004-09-03 | France Telecom | Protocole de communication entre un module d'application vocale et une plate-forme vocale dans un serveur vocal |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7822609B2 (en) | 2002-06-14 | 2010-10-26 | Nuance Communications, Inc. | Voice browser with integrated TCAP and ISUP interfaces |
KR20040002031A (ko) * | 2002-06-29 | 2004-01-07 | 주식회사 케이티 | 다수의 응용프로그램들간의 음성인식엔진 공유 방법 |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
WO2004008434A1 (en) * | 2002-07-17 | 2004-01-22 | Nokia Corporation | Mobile device having voice user interface, and a methode for testing the compatibility of an application with the mobile device |
US20040054757A1 (en) * | 2002-09-14 | 2004-03-18 | Akinobu Ueda | System for remote control of computer resources from embedded handheld devices |
US7519534B2 (en) | 2002-10-31 | 2009-04-14 | Agiletv Corporation | Speech controlled access to content on a presentation medium |
US8793127B2 (en) | 2002-10-31 | 2014-07-29 | Promptu Systems Corporation | Method and apparatus for automatically determining speaker characteristics for speech-directed advertising or other enhancement of speech-controlled devices or services |
US7987091B2 (en) * | 2002-12-02 | 2011-07-26 | Sony Corporation | Dialog control device and method, and robot device |
KR20040051285A (ko) * | 2002-12-12 | 2004-06-18 | 삼성전자주식회사 | 애플릿이 링크된 마크업 문서의 디스플레이 방법 및 그시스템 |
US7822612B1 (en) * | 2003-01-03 | 2010-10-26 | Verizon Laboratories Inc. | Methods of processing a voice command from a caller |
US7673304B2 (en) * | 2003-02-18 | 2010-03-02 | Microsoft Corporation | Multithreaded kernel for graphics processing unit |
US7669134B1 (en) | 2003-05-02 | 2010-02-23 | Apple Inc. | Method and apparatus for displaying information during an instant messaging session |
US7249025B2 (en) * | 2003-05-09 | 2007-07-24 | Matsushita Electric Industrial Co., Ltd. | Portable device for enhanced security and accessibility |
EP1631899A4 (en) * | 2003-06-06 | 2007-07-18 | Univ Columbia | SYSTEM AND METHOD FOR LANGUAGE ACTIVATION OF WEB SITES |
EP1654806A4 (en) | 2003-06-26 | 2007-01-17 | Agile Tv Corp | NULL SEARCH, NULL MEMORY VECTOR QUANTIZATION |
US7313528B1 (en) * | 2003-07-31 | 2007-12-25 | Sprint Communications Company L.P. | Distributed network based message processing system for text-to-speech streaming data |
US7383302B2 (en) * | 2003-09-15 | 2008-06-03 | International Business Machines Corporation | Method and system for providing a common collaboration framework accessible from within multiple applications |
US7428273B2 (en) | 2003-09-18 | 2008-09-23 | Promptu Systems Corporation | Method and apparatus for efficient preamble detection in digital data receivers |
US7249348B2 (en) * | 2003-10-21 | 2007-07-24 | Hewlett-Packard Development Company, L.P. | Non-interfering status inquiry for user threads |
US7199802B2 (en) * | 2003-10-24 | 2007-04-03 | Microsoft Corporation | Multiple-mode window presentation system and process |
US7856632B2 (en) * | 2004-01-29 | 2010-12-21 | Klingman Edwin E | iMEM ASCII architecture for executing system operators and processing data operators |
US20050229185A1 (en) * | 2004-02-20 | 2005-10-13 | Stoops Daniel S | Method and system for navigating applications |
WO2005094098A1 (en) * | 2004-02-25 | 2005-10-06 | Sk Telecom Co., Ltd. | Method and mobile terminal for implementing vector animation interactive service on mobile phone browser |
US7925510B2 (en) * | 2004-04-28 | 2011-04-12 | Nuance Communications, Inc. | Componentized voice server with selectable internal and external speech detectors |
US7596788B1 (en) * | 2004-05-11 | 2009-09-29 | Platform Computing Corporation | Support of non-trivial scheduling policies along with topological properties |
US7703073B2 (en) * | 2004-06-08 | 2010-04-20 | Covia Labs, Inc. | Device interoperability format rule set and method for assembling interoperability application package |
US7814502B2 (en) * | 2004-06-14 | 2010-10-12 | Nokia Corporation | Shared landmark user interfaces |
KR100627228B1 (ko) * | 2004-07-01 | 2006-09-25 | 에스케이 텔레콤주식회사 | 기업용 무선 어플리케이션 서비스를 위한 전용 브라우저시스템 및 그 운영방법 |
US7483968B1 (en) * | 2004-07-29 | 2009-01-27 | Emc Corporation | System and method for configuring resource groups |
FI20041075A0 (fi) * | 2004-08-12 | 2004-08-12 | Nokia Corp | Tiedon lähettäminen ryhmälle vastaanottolaitteita |
US8744852B1 (en) * | 2004-10-01 | 2014-06-03 | Apple Inc. | Spoken interfaces |
US7693719B2 (en) * | 2004-10-29 | 2010-04-06 | Microsoft Corporation | Providing personalized voice font for text-to-speech applications |
US8706501B2 (en) * | 2004-12-09 | 2014-04-22 | Nuance Communications, Inc. | Method and system for sharing speech processing resources over a communication network |
US7640162B2 (en) * | 2004-12-14 | 2009-12-29 | Microsoft Corporation | Semantic canvas |
KR100654447B1 (ko) * | 2004-12-15 | 2006-12-06 | 삼성전자주식회사 | 지역별로 존재하는 컨텐츠를 글로벌로 공유하고 거래하는방법 및 시스템 |
US7987244B1 (en) * | 2004-12-30 | 2011-07-26 | At&T Intellectual Property Ii, L.P. | Network repository for voice fonts |
KR100725719B1 (ko) * | 2005-02-04 | 2007-06-08 | 주식회사 유진로봇 | 음성과 태스크 오브젝트 기반의 대화시스템 |
US7490042B2 (en) * | 2005-03-29 | 2009-02-10 | International Business Machines Corporation | Methods and apparatus for adapting output speech in accordance with context of communication |
US9111253B2 (en) * | 2005-04-22 | 2015-08-18 | Sap Se | Groupware time tracking |
US20060271520A1 (en) * | 2005-05-27 | 2006-11-30 | Ragan Gene Z | Content-based implicit search query |
WO2006133547A1 (en) | 2005-06-13 | 2006-12-21 | E-Lane Systems Inc. | Vehicle immersive communication system |
US8090084B2 (en) * | 2005-06-30 | 2012-01-03 | At&T Intellectual Property Ii, L.P. | Automated call router for business directory using the world wide web |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) * | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
EP1934971A4 (en) | 2005-08-31 | 2010-10-27 | Voicebox Technologies Inc | DYNAMIC LANGUAGE SCRIPTURE |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US8073700B2 (en) | 2005-09-12 | 2011-12-06 | Nuance Communications, Inc. | Retrieval and presentation of network service results for mobile device using a multimodal browser |
US9009046B1 (en) * | 2005-09-27 | 2015-04-14 | At&T Intellectual Property Ii, L.P. | System and method for disambiguating multiple intents in a natural language dialog system |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US7708196B2 (en) * | 2005-10-05 | 2010-05-04 | Dun And Bradstreet Corporation | Modular web-based ASP application for multiple products |
US8041800B2 (en) * | 2005-11-08 | 2011-10-18 | International Business Machines Corporation | Automatic orchestration of dynamic multiple party, multiple media communications |
US20070124142A1 (en) * | 2005-11-25 | 2007-05-31 | Mukherjee Santosh K | Voice enabled knowledge system |
US9215748B2 (en) | 2005-11-28 | 2015-12-15 | Canon Kabushiki Kaisha | Communication apparatus, control method for communication apparatus, and communication system |
JP4829600B2 (ja) * | 2005-11-28 | 2011-12-07 | キヤノン株式会社 | 通信装置及び通信装置の制御方法 |
JP2007164732A (ja) * | 2005-12-16 | 2007-06-28 | Crescent:Kk | コンピュータ実行可能なプログラム、および情報処理装置 |
DE102005061365A1 (de) * | 2005-12-21 | 2007-06-28 | Siemens Ag | Verfahren zur Ansteuerung zumindest einer ersten und zweiten Hintergrundapplikation über ein universelles Sprachdialogsystem |
CN100382083C (zh) * | 2005-12-23 | 2008-04-16 | 威盛电子股份有限公司 | 网络会话管理方法及系统 |
US7840964B2 (en) * | 2005-12-30 | 2010-11-23 | Intel Corporation | Mechanism to transition control between components in a virtual machine environment |
KR101204408B1 (ko) * | 2006-01-19 | 2012-11-27 | 삼성전자주식회사 | 유니폼 객체 모델을 이용한 유비쿼터스 서비스/디바이스테스트 방법 및 장치 |
US20070180365A1 (en) * | 2006-01-27 | 2007-08-02 | Ashok Mitter Khosla | Automated process and system for converting a flowchart into a speech mark-up language |
US8078990B2 (en) | 2006-02-01 | 2011-12-13 | Research In Motion Limited | Secure device sharing |
US20070225983A1 (en) * | 2006-03-23 | 2007-09-27 | Theodore Maringo | Worldwide time device |
KR101264318B1 (ko) * | 2006-07-07 | 2013-05-22 | 삼성전자주식회사 | 네트워크 환경에서의 서비스 메뉴 및 서비스 제공방법 및그 서비스 제공장치 |
KR100807307B1 (ko) * | 2006-07-10 | 2008-02-28 | 한국전자통신연구원 | 대화형 음성 인터페이스 시스템 및 그 응답 방법 |
US9976865B2 (en) | 2006-07-28 | 2018-05-22 | Ridetones, Inc. | Vehicle communication system with navigation |
US20100030557A1 (en) | 2006-07-31 | 2010-02-04 | Stephen Molloy | Voice and text communication system, method and apparatus |
US8589869B2 (en) | 2006-09-07 | 2013-11-19 | Wolfram Alpha Llc | Methods and systems for determining a formula |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US7957976B2 (en) | 2006-09-12 | 2011-06-07 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of a multimodal application |
KR100832534B1 (ko) * | 2006-09-28 | 2008-05-27 | 한국전자통신연구원 | 음성 인식을 통한 컨텐츠 정보 서비스 제공 장치 및 그방법 |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US11256386B2 (en) | 2006-11-22 | 2022-02-22 | Qualtrics, Llc | Media management system supporting a plurality of mobile devices |
US8700014B2 (en) | 2006-11-22 | 2014-04-15 | Bindu Rama Rao | Audio guided system for providing guidance to user of mobile device on multi-step activities |
US8478250B2 (en) | 2007-07-30 | 2013-07-02 | Bindu Rama Rao | Interactive media management server |
US10803474B2 (en) | 2006-11-22 | 2020-10-13 | Qualtrics, Llc | System for creating and distributing interactive advertisements to mobile devices |
US7827033B2 (en) * | 2006-12-06 | 2010-11-02 | Nuance Communications, Inc. | Enabling grammars in web page frames |
US20080140390A1 (en) * | 2006-12-11 | 2008-06-12 | Motorola, Inc. | Solution for sharing speech processing resources in a multitasking environment |
CA2572116A1 (en) * | 2006-12-27 | 2008-06-27 | Ibm Canada Limited - Ibm Canada Limitee | System and method for processing multi-modal communication within a workgroup |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8843376B2 (en) | 2007-03-13 | 2014-09-23 | Nuance Communications, Inc. | Speech-enabled web content searching using a multimodal browser |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8788620B2 (en) * | 2007-04-04 | 2014-07-22 | International Business Machines Corporation | Web service support for a multimodal client processing a multimodal application |
AU2012244080B2 (en) * | 2007-05-24 | 2014-04-17 | Microsoft Technology Licensing, Llc | Personality-based Device |
US8131549B2 (en) * | 2007-05-24 | 2012-03-06 | Microsoft Corporation | Personality-based device |
US9794348B2 (en) | 2007-06-04 | 2017-10-17 | Todd R. Smith | Using voice commands from a mobile device to remotely access and control a computer |
US8612972B2 (en) * | 2007-06-27 | 2013-12-17 | Microsoft Corporation | Running add-on components in virtual environments |
US20090018818A1 (en) * | 2007-07-10 | 2009-01-15 | Aibelive Co., Ltd. | Operating device for natural language input |
US9264483B2 (en) | 2007-07-18 | 2016-02-16 | Hammond Development International, Inc. | Method and system for enabling a communication device to remotely execute an application |
ITFI20070177A1 (it) | 2007-07-26 | 2009-01-27 | Riccardo Vieri | Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento. |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8595642B1 (en) | 2007-10-04 | 2013-11-26 | Great Northern Research, LLC | Multiple shell multi faceted graphical user interface |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8364694B2 (en) | 2007-10-26 | 2013-01-29 | Apple Inc. | Search assistant for digital media assets |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US8472934B2 (en) * | 2007-11-28 | 2013-06-25 | Nokia Corporation | Portable apparatus, method and user interface |
JP2010020273A (ja) * | 2007-12-07 | 2010-01-28 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9703784B2 (en) * | 2007-12-24 | 2017-07-11 | Sandisk Il Ltd. | Mobile device and method for concurrently processing content according to multiple playlists |
US8219407B1 (en) | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8327272B2 (en) | 2008-01-06 | 2012-12-04 | Apple Inc. | Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars |
US8086455B2 (en) * | 2008-01-09 | 2011-12-27 | Microsoft Corporation | Model development authoring, generation and execution based on data and processor dependencies |
US20090198496A1 (en) * | 2008-01-31 | 2009-08-06 | Matthias Denecke | Aspect oriented programmable dialogue manager and apparatus operated thereby |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8289283B2 (en) | 2008-03-04 | 2012-10-16 | Apple Inc. | Language input interface on a device |
AU2009227944B2 (en) * | 2008-03-25 | 2014-09-11 | E-Lane Systems Inc. | Multi-participant, mixed-initiative voice interaction system |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) * | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8296357B2 (en) * | 2008-05-19 | 2012-10-23 | Citrix Systems, Inc. | Systems and methods for remoting multimedia plugin calls |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
EP2286356A4 (en) * | 2008-06-03 | 2013-03-06 | Whirlpool Co | EQUIPMENT DEVELOPMENT TOOLKIT |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US8838075B2 (en) | 2008-06-19 | 2014-09-16 | Intelligent Mechatronic Systems Inc. | Communication system with voice mail access and call by spelling functionality |
US20090328062A1 (en) * | 2008-06-25 | 2009-12-31 | Microsoft Corporation | Scalable and extensible communication framework |
CN101621480B (zh) * | 2008-06-30 | 2012-03-28 | 国际商业机器公司 | 呈现服务器和在其中使用的xsl文件处理方法 |
US9652023B2 (en) | 2008-07-24 | 2017-05-16 | Intelligent Mechatronic Systems Inc. | Power management system |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8463053B1 (en) | 2008-08-08 | 2013-06-11 | The Research Foundation Of State University Of New York | Enhanced max margin learning on multimodal data mining in a multimedia database |
US8959053B2 (en) * | 2008-08-13 | 2015-02-17 | Alcatel Lucent | Configuration file framework to support high availability schema based upon asynchronous checkpointing |
JP5897240B2 (ja) * | 2008-08-20 | 2016-03-30 | 株式会社ユニバーサルエンターテインメント | 顧客対応システム、並びに会話サーバ |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8355919B2 (en) | 2008-09-29 | 2013-01-15 | Apple Inc. | Systems and methods for text normalization for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8396714B2 (en) | 2008-09-29 | 2013-03-12 | Apple Inc. | Systems and methods for concatenation of words in text to speech synthesis |
US8352268B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8352272B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8121842B2 (en) | 2008-12-12 | 2012-02-21 | Microsoft Corporation | Audio output of a document from mobile device |
US8914417B2 (en) | 2009-01-07 | 2014-12-16 | International Business Machines Corporation | Apparatus, system, and method for maintaining a context stack |
TW201027378A (en) * | 2009-01-08 | 2010-07-16 | Realtek Semiconductor Corp | Virtual platform and related simulation method |
US8954328B2 (en) * | 2009-01-15 | 2015-02-10 | K-Nfb Reading Technology, Inc. | Systems and methods for document narration with multiple characters having multiple moods |
WO2010084497A1 (en) * | 2009-01-26 | 2010-07-29 | Tomer London | System and method for providing visual content and services to wireless terminal devices in response to a received voice call |
US9529573B2 (en) * | 2009-01-28 | 2016-12-27 | Microsoft Technology Licensing, Llc | Graphical user interface generation through use of a binary file |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
CN101533409B (zh) * | 2009-04-23 | 2011-03-02 | 何海群 | 一种网络浏览器系统和控制方法 |
US9213768B1 (en) | 2009-05-15 | 2015-12-15 | Wolfram Alpha Llc | Assumption mechanism for queries |
US8601015B1 (en) | 2009-05-15 | 2013-12-03 | Wolfram Alpha Llc | Dynamic example generation for queries |
US8577543B2 (en) * | 2009-05-28 | 2013-11-05 | Intelligent Mechatronic Systems Inc. | Communication system with personal information management and remote vehicle monitoring and control features |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9002713B2 (en) | 2009-06-09 | 2015-04-07 | At&T Intellectual Property I, L.P. | System and method for speech personalization by need |
US8442189B2 (en) * | 2009-06-22 | 2013-05-14 | Avaya Inc. | Unified communications appliance |
US9055151B2 (en) * | 2009-06-22 | 2015-06-09 | Avaya Inc. | Method to set the flag as replied or forwarded to all replied or forwarded voice messages |
WO2010148518A1 (en) | 2009-06-27 | 2010-12-29 | Intelligent Mechatronic Systems | Vehicle internet radio interface |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
US9171541B2 (en) * | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US20110110534A1 (en) * | 2009-11-12 | 2011-05-12 | Apple Inc. | Adjustable voice output based on device status |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US20110125733A1 (en) * | 2009-11-25 | 2011-05-26 | Fish Nathan J | Quick access utility |
US9978272B2 (en) | 2009-11-25 | 2018-05-22 | Ridetones, Inc | Vehicle to vehicle chatting and communication system |
US20110144976A1 (en) * | 2009-12-10 | 2011-06-16 | Arun Jain | Application user interface system and method |
US8868427B2 (en) * | 2009-12-11 | 2014-10-21 | General Motors Llc | System and method for updating information in electronic calendars |
GB0922608D0 (en) * | 2009-12-23 | 2010-02-10 | Vratskides Alexios | Message optimization |
EP2339576B1 (en) * | 2009-12-23 | 2019-08-07 | Google LLC | Multi-modal input on an electronic device |
JP2011139303A (ja) * | 2009-12-28 | 2011-07-14 | Nec Corp | 通信システム、制御装置、通信制御方法、およびプログラム |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US9665620B2 (en) * | 2010-01-15 | 2017-05-30 | Ab Initio Technology Llc | Managing data queries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8645914B2 (en) | 2010-01-22 | 2014-02-04 | AgentSheets, Inc. | Conversational programming |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8433828B2 (en) | 2010-02-26 | 2013-04-30 | Apple Inc. | Accessory protocol for touch screen device accessibility |
US8554948B2 (en) * | 2010-03-03 | 2013-10-08 | At&T Intellectual Property I, L.P. | Methods, systems and computer program products for identifying traffic on the internet using communities of interest |
JP5560814B2 (ja) * | 2010-03-24 | 2014-07-30 | 日本電気株式会社 | 負荷分散システム、負荷分散サーバおよび負荷分散方法 |
US8612932B2 (en) * | 2010-04-18 | 2013-12-17 | Voxeo Corporation | Unified framework and method for call control and media control |
US8776091B2 (en) * | 2010-04-30 | 2014-07-08 | Microsoft Corporation | Reducing feedback latency |
US8484015B1 (en) | 2010-05-14 | 2013-07-09 | Wolfram Alpha Llc | Entity pages |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US8352908B2 (en) | 2010-06-28 | 2013-01-08 | International Business Machines Corporation | Multi-modal conversion tool for form-type applications |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US9246914B2 (en) * | 2010-07-16 | 2016-01-26 | Nokia Technologies Oy | Method and apparatus for processing biometric information using distributed computation |
US9104670B2 (en) | 2010-07-21 | 2015-08-11 | Apple Inc. | Customized search or acquisition of digital media assets |
US8812298B1 (en) | 2010-07-28 | 2014-08-19 | Wolfram Alpha Llc | Macro replacement of natural language input |
US8775618B2 (en) * | 2010-08-02 | 2014-07-08 | Ebay Inc. | Application platform with flexible permissioning |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8688435B2 (en) * | 2010-09-22 | 2014-04-01 | Voice On The Go Inc. | Systems and methods for normalizing input media |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US20120173242A1 (en) * | 2010-12-30 | 2012-07-05 | Samsung Electronics Co., Ltd. | System and method for exchange of scribble data between gsm devices along with voice |
US9183843B2 (en) | 2011-01-07 | 2015-11-10 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
US8930194B2 (en) | 2011-01-07 | 2015-01-06 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9542657B2 (en) * | 2011-02-23 | 2017-01-10 | Avaya Inc. | Method and system for optimizing contact center performance |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US9202465B2 (en) * | 2011-03-25 | 2015-12-01 | General Motors Llc | Speech recognition dependent on text message content |
US8171137B1 (en) | 2011-05-09 | 2012-05-01 | Google Inc. | Transferring application state across devices |
WO2012158572A2 (en) * | 2011-05-13 | 2012-11-22 | Microsoft Corporation | Exploiting query click logs for domain detection in spoken language understanding |
US20120317492A1 (en) * | 2011-05-27 | 2012-12-13 | Telefon Projekt LLC | Providing Interactive and Personalized Multimedia Content from Remote Servers |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US9069814B2 (en) | 2011-07-27 | 2015-06-30 | Wolfram Alpha Llc | Method and system for using natural language to generate widgets |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8645978B2 (en) * | 2011-09-02 | 2014-02-04 | Compuverde Ab | Method for data maintenance |
US9734252B2 (en) | 2011-09-08 | 2017-08-15 | Wolfram Alpha Llc | Method and system for analyzing data using a query answering system |
US8645532B2 (en) * | 2011-09-13 | 2014-02-04 | BlueStripe Software, Inc. | Methods and computer program products for monitoring the contents of network traffic in a network device |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US9851950B2 (en) | 2011-11-15 | 2017-12-26 | Wolfram Alpha Llc | Programming in a precise syntax using natural language |
US8595016B2 (en) * | 2011-12-23 | 2013-11-26 | Angle, Llc | Accessing content using a source-specific content-adaptable dialogue |
KR101962126B1 (ko) * | 2012-02-24 | 2019-03-26 | 엘지전자 주식회사 | 음성 인식 결과에 따라 데이터베이스에 액세스하는 멀티미디어 디바이스 및 그 제어 방법 |
CN103295575B (zh) * | 2012-02-27 | 2019-01-25 | 北京三星通信技术研究有限公司 | 一种语音识别方法和客户端 |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US20240046928A1 (en) * | 2012-04-13 | 2024-02-08 | View, Inc. | Controlling optically-switchable devices |
US9552130B2 (en) * | 2012-05-07 | 2017-01-24 | Citrix Systems, Inc. | Speech recognition support for remote applications and desktops |
US20130304536A1 (en) * | 2012-05-10 | 2013-11-14 | Ebay, Inc. | Harvest Customer Tracking Information |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10395270B2 (en) | 2012-05-17 | 2019-08-27 | Persado Intellectual Property Limited | System and method for recommending a grammar for a message campaign used by a message optimization system |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9502029B1 (en) * | 2012-06-25 | 2016-11-22 | Amazon Technologies, Inc. | Context-aware speech processing |
US9495129B2 (en) * | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US20140006318A1 (en) * | 2012-06-29 | 2014-01-02 | Poe XING | Collecting, discovering, and/or sharing media objects |
US8554559B1 (en) * | 2012-07-13 | 2013-10-08 | Google Inc. | Localized speech recognition with offload |
US9710475B1 (en) | 2012-07-16 | 2017-07-18 | Tintri Inc. | Synchronization of data |
CN108629041A (zh) * | 2012-07-19 | 2018-10-09 | 格兰斯电讯网络有限公司 | 协同浏览与其他形式的信息共享的集成 |
US8577671B1 (en) * | 2012-07-20 | 2013-11-05 | Veveo, Inc. | Method of and system for using conversation state information in a conversational interaction system |
CN103577444B (zh) * | 2012-07-30 | 2017-04-05 | 腾讯科技(深圳)有限公司 | 一种操控浏览器的方法及系统 |
US9485330B2 (en) | 2012-07-30 | 2016-11-01 | Tencent Technology (Shenzhen) Company Limited | Web browser operation method and system |
US9465833B2 (en) | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
US9378073B2 (en) | 2012-08-14 | 2016-06-28 | International Business Machines Corporation | Remote procedure call for a distributed system |
US9384736B2 (en) * | 2012-08-21 | 2016-07-05 | Nuance Communications, Inc. | Method to provide incremental UI response based on multiple asynchronous evidence about user input |
US9405424B2 (en) | 2012-08-29 | 2016-08-02 | Wolfram Alpha, Llc | Method and system for distributing and displaying graphical items |
CN102831229A (zh) * | 2012-08-30 | 2012-12-19 | 浙大网新科技股份有限公司 | 适合盲人使用的网页浏览方法 |
KR102150289B1 (ko) * | 2012-08-30 | 2020-09-01 | 삼성전자주식회사 | 사용자 단말에서 사용자 인터페이스 장치 및 이를 지원하는 방법 |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US8700396B1 (en) * | 2012-09-11 | 2014-04-15 | Google Inc. | Generating speech data collection prompts |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
US10276157B2 (en) * | 2012-10-01 | 2019-04-30 | Nuance Communications, Inc. | Systems and methods for providing a voice agent user interface |
CN104769668B (zh) | 2012-10-04 | 2018-10-30 | 纽昂斯通讯公司 | 改进的用于asr的混合控制器 |
US9035884B2 (en) * | 2012-10-17 | 2015-05-19 | Nuance Communications, Inc. | Subscription updates in multiple device language models |
US20150278194A1 (en) * | 2012-11-07 | 2015-10-01 | Nec Corporation | Information processing device, information processing method and medium |
KR101980834B1 (ko) * | 2012-11-28 | 2019-05-21 | 한국전자통신연구원 | 컨텍스트 정보 기반 응용프로그램 관리방법 및 그 장치 |
US9003039B2 (en) | 2012-11-29 | 2015-04-07 | Thales Canada Inc. | Method and apparatus of resource allocation or resource release |
KR101940719B1 (ko) * | 2012-12-14 | 2019-01-23 | 한국전자통신연구원 | 태스크 그래프 기반 대화 처리 시스템의 태스크 그래프 구축 장치 및 방법 |
CN103117058B (zh) * | 2012-12-20 | 2015-12-09 | 四川长虹电器股份有限公司 | 基于智能电视平台的多语音引擎切换系统及方法 |
CN103020278A (zh) * | 2012-12-28 | 2013-04-03 | 深圳创维数字技术股份有限公司 | 一种网页的控制方法及浏览器 |
US9430420B2 (en) | 2013-01-07 | 2016-08-30 | Telenav, Inc. | Computing system with multimodal interaction mechanism and method of operation thereof |
US9922639B1 (en) | 2013-01-11 | 2018-03-20 | Amazon Technologies, Inc. | User feedback for speech interactions |
CN103971687B (zh) * | 2013-02-01 | 2016-06-29 | 腾讯科技(深圳)有限公司 | 一种语音识别系统中的负载均衡实现方法和装置 |
KR20150104615A (ko) | 2013-02-07 | 2015-09-15 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9817835B2 (en) | 2013-03-12 | 2017-11-14 | Tintri Inc. | Efficient data synchronization for storage containers |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US9218052B2 (en) | 2013-03-14 | 2015-12-22 | Samsung Electronics Co., Ltd. | Framework for voice controlling applications |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US9348555B2 (en) * | 2013-03-15 | 2016-05-24 | Volkswagen Ag | In-vehicle access of mobile device functions |
CN110096712B (zh) | 2013-03-15 | 2023-06-20 | 苹果公司 | 通过智能数字助理的用户培训 |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
CN105144133B (zh) | 2013-03-15 | 2020-11-20 | 苹果公司 | 对中断进行上下文相关处理 |
US9526120B2 (en) | 2013-03-15 | 2016-12-20 | Google Inc. | Techniques for context-based application invocation for short-range wireless communication interactions |
CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
US9875494B2 (en) * | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9946757B2 (en) | 2013-05-10 | 2018-04-17 | Veveo, Inc. | Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system |
US9431008B2 (en) | 2013-05-29 | 2016-08-30 | Nuance Communications, Inc. | Multiple parallel dialogs in smart phone applications |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
EP3005348B1 (en) * | 2013-06-07 | 2020-03-11 | Nuance Communications, Inc. | Speech-based search using descriptive features of surrounding objects |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
US9311298B2 (en) * | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
KR102053820B1 (ko) | 2013-07-02 | 2019-12-09 | 삼성전자주식회사 | 서버 및 그 제어방법과, 영상처리장치 및 그 제어방법 |
US10776375B2 (en) * | 2013-07-15 | 2020-09-15 | Microsoft Technology Licensing, Llc | Retrieval of attribute values based upon identified entities |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US10109273B1 (en) | 2013-08-29 | 2018-10-23 | Amazon Technologies, Inc. | Efficient generation of personalized spoken language understanding models |
US9361289B1 (en) * | 2013-08-30 | 2016-06-07 | Amazon Technologies, Inc. | Retrieval and management of spoken language understanding personalization data |
US10628378B2 (en) | 2013-09-03 | 2020-04-21 | Tintri By Ddn, Inc. | Replication of snapshots and clones |
US9495965B2 (en) * | 2013-09-20 | 2016-11-15 | American Institutes For Research | Synthesis and display of speech commands method and system |
CN103474065A (zh) * | 2013-09-24 | 2013-12-25 | 贵阳世纪恒通科技有限公司 | 基于自动分类技术的语音意图判定识别方法 |
WO2015050543A1 (en) * | 2013-10-02 | 2015-04-09 | Empire Technology Development, Llc | Identification of distributed user interface (dui) elements |
CN104598257B (zh) * | 2013-10-30 | 2019-01-18 | 华为技术有限公司 | 远程应用程序运行的方法和装置 |
KR101740332B1 (ko) * | 2013-11-05 | 2017-06-08 | 한국전자통신연구원 | 자동 번역 장치 및 방법 |
US9754591B1 (en) | 2013-11-18 | 2017-09-05 | Amazon Technologies, Inc. | Dialog management context sharing |
US9690854B2 (en) * | 2013-11-27 | 2017-06-27 | Nuance Communications, Inc. | Voice-enabled dialog interaction with web pages |
US9558176B2 (en) | 2013-12-06 | 2017-01-31 | Microsoft Technology Licensing, Llc | Discriminating between natural language and keyword language items |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
KR101489826B1 (ko) * | 2013-12-30 | 2015-02-04 | 유승우 | 더미 터미널 및 본체 |
KR20160122236A (ko) | 2014-02-13 | 2016-10-21 | 닛본 덴끼 가부시끼가이샤 | 통신 시스템, 통신 장치, 통신 방법 및 프로그램을 저장한 비일시적인 컴퓨터 판독가능 매체 |
WO2015148725A2 (en) * | 2014-03-25 | 2015-10-01 | Mark Stephen Meadows | Systems and methods for executing cryptographically secure transactions using voice and natural language processing |
US20150278853A1 (en) * | 2014-04-01 | 2015-10-01 | DoubleVerify, Inc. | System And Method For Identifying Hidden Content |
JP2015207819A (ja) * | 2014-04-17 | 2015-11-19 | 株式会社リコー | 情報処理装置、情報処理システム、通信制御方法およびプログラム |
US9514376B2 (en) * | 2014-04-29 | 2016-12-06 | Google Inc. | Techniques for distributed optical character recognition and distributed machine language translation |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9990433B2 (en) | 2014-05-23 | 2018-06-05 | Samsung Electronics Co., Ltd. | Method for searching and device thereof |
US11314826B2 (en) | 2014-05-23 | 2022-04-26 | Samsung Electronics Co., Ltd. | Method for searching and device thereof |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
JP2016024212A (ja) * | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
EP3195307B1 (en) * | 2014-09-14 | 2020-01-29 | Google LLC | Platform for creating customizable dialog system engines |
EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
CN112217905B (zh) * | 2014-09-19 | 2024-03-29 | 康维达无线有限责任公司 | 服务层会话迁移和共享 |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9813505B2 (en) | 2014-10-15 | 2017-11-07 | Ayla Networks, Inc. | Devices in a flexible registration framework |
US9648055B2 (en) * | 2014-10-15 | 2017-05-09 | Ayla Networks, Inc. | Applications in a flexible registration framework |
US9800619B2 (en) * | 2014-10-15 | 2017-10-24 | Ayla Networks, Inc. | Registration framework for connected consumer devices |
CN107077326B (zh) * | 2014-10-15 | 2020-10-13 | 艾拉物联网络(深圳)有限公司 | 用于所连接的消费者设备的注册框架 |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
CN107003723A (zh) * | 2014-10-21 | 2017-08-01 | 罗伯特·博世有限公司 | 用于会话系统中的响应选择和组成的自动化的方法和系统 |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9965464B2 (en) * | 2014-12-05 | 2018-05-08 | Microsoft Technology Licensing, Llc | Automatic process guidance |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US10154041B2 (en) * | 2015-01-13 | 2018-12-11 | Microsoft Technology Licensing, Llc | Website access control |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
US10180985B2 (en) * | 2015-02-19 | 2019-01-15 | At&T Intellectual Property I, L.P. | Apparatus and method for automatically redirecting a search |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9672829B2 (en) * | 2015-03-23 | 2017-06-06 | International Business Machines Corporation | Extracting and displaying key points of a video conference |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US20160321025A1 (en) * | 2015-04-30 | 2016-11-03 | Kabushiki Kaisha Toshiba | Electronic apparatus and method |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
CN106302089B (zh) * | 2015-05-21 | 2019-06-11 | 阿里巴巴集团控股有限公司 | 会话处理方法和系统 |
US9721569B2 (en) * | 2015-05-27 | 2017-08-01 | Intel Corporation | Gaussian mixture model accelerator with direct memory access engines corresponding to individual data streams |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
CN107851217A (zh) * | 2015-05-27 | 2018-03-27 | 奥瑞恩实验室 | 可穿戴个人通信节点的智能代理特征 |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10110743B2 (en) | 2015-06-01 | 2018-10-23 | AffectLayer, Inc. | Automatic pattern recognition in conversations |
US10367940B2 (en) | 2015-06-01 | 2019-07-30 | AffectLayer, Inc. | Analyzing conversations to automatically identify product feature requests |
US10324979B2 (en) | 2015-06-01 | 2019-06-18 | AffectLayer, Inc. | Automatic generation of playlists from conversations |
US10679013B2 (en) | 2015-06-01 | 2020-06-09 | AffectLayer, Inc. | IoT-based call assistant device |
US10181326B2 (en) | 2015-06-01 | 2019-01-15 | AffectLayer, Inc. | Analyzing conversations to automatically identify action items |
US10387573B2 (en) | 2015-06-01 | 2019-08-20 | AffectLayer, Inc. | Analyzing conversations to automatically identify customer pain points |
US10360911B2 (en) | 2015-06-01 | 2019-07-23 | AffectLayer, Inc. | Analyzing conversations to automatically identify product features that resonate with customers |
US10133999B2 (en) | 2015-06-01 | 2018-11-20 | AffectLayer, Inc. | Analyzing conversations to automatically identify deals at risk |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10504137B1 (en) | 2015-10-08 | 2019-12-10 | Persado Intellectual Property Limited | System, method, and computer program product for monitoring and responding to the performance of an ad |
US9688225B2 (en) * | 2015-10-09 | 2017-06-27 | Livio, Inc. | Methods and systems for a mobile device to emulate a vehicle human-machine interface |
WO2017065770A1 (en) * | 2015-10-15 | 2017-04-20 | Interactive Intelligence Group, Inc. | System and method for multi-language communication sequencing |
DE112016004863T5 (de) * | 2015-10-21 | 2018-07-19 | Google Llc | Parametersammlung und automatische Dialogerzeugung in Dialogsystemen |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US11018888B2 (en) * | 2015-12-03 | 2021-05-25 | Whirlpool Corporation | Methods of remote control of appliances |
US10832283B1 (en) | 2015-12-09 | 2020-11-10 | Persado Intellectual Property Limited | System, method, and computer program for providing an instance of a promotional message to a user based on a predicted emotional response corresponding to user characteristics |
CN105551488A (zh) * | 2015-12-15 | 2016-05-04 | 深圳Tcl数字技术有限公司 | 语音控制方法及系统 |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10732783B2 (en) | 2015-12-28 | 2020-08-04 | Microsoft Technology Licensing, Llc | Identifying image comments from similar images |
US10417346B2 (en) * | 2016-01-23 | 2019-09-17 | Microsoft Technology Licensing, Llc | Tool for facilitating the development of new language understanding scenarios |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10224026B2 (en) * | 2016-03-15 | 2019-03-05 | Sony Corporation | Electronic device, system, method and computer program |
CN107409149B (zh) * | 2016-03-17 | 2021-02-26 | 谷歌有限责任公司 | 混合的客户端-服务器数据提供的方法 |
US9996531B1 (en) * | 2016-03-29 | 2018-06-12 | Facebook, Inc. | Conversational understanding |
US10319371B2 (en) * | 2016-05-04 | 2019-06-11 | GM Global Technology Operations LLC | Disambiguation of vehicle speech commands |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
CN106095593B (zh) | 2016-05-31 | 2019-04-16 | Oppo广东移动通信有限公司 | 一种前、后景应用程序行为同步方法及装置 |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
KR101995540B1 (ko) * | 2016-06-03 | 2019-07-15 | 주식회사 허브케이 | 판독/입력 오류 단어 정정 장치 및 방법 |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US11200891B2 (en) * | 2016-06-21 | 2021-12-14 | Hewlett-Packard Development Company, L.P. | Communications utilizing multiple virtual assistant services |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
KR101827773B1 (ko) | 2016-08-02 | 2018-02-09 | 주식회사 하이퍼커넥트 | 통역 장치 및 방법 |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
KR102481881B1 (ko) * | 2016-09-07 | 2022-12-27 | 삼성전자주식회사 | 외부 디바이스를 제어하는 서버 및 그 방법 |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
CN106847272A (zh) * | 2016-12-12 | 2017-06-13 | 北京光年无限科技有限公司 | 与运行应用关联的智能机器人的数据交互方法 |
CN106844453B (zh) * | 2016-12-20 | 2020-09-08 | 江苏瀚远科技股份有限公司 | 一种电子文件格式转换方法 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
KR102643501B1 (ko) * | 2016-12-26 | 2024-03-06 | 현대자동차주식회사 | 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법 |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10971157B2 (en) | 2017-01-11 | 2021-04-06 | Nuance Communications, Inc. | Methods and apparatus for hybrid speech recognition processing |
US20180247644A1 (en) * | 2017-02-27 | 2018-08-30 | Intel Corporation | Queueing spoken dialogue output |
EP3392884A1 (en) * | 2017-04-21 | 2018-10-24 | audEERING GmbH | A method for automatic affective state inference and an automated affective state inference system |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10127227B1 (en) * | 2017-05-15 | 2018-11-13 | Google Llc | Providing access to user-controlled resources by automated assistants |
US11436417B2 (en) | 2017-05-15 | 2022-09-06 | Google Llc | Providing access to user-controlled resources by automated assistants |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US11048995B2 (en) | 2017-05-16 | 2021-06-29 | Google Llc | Delayed responses by computational assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
CN107319857A (zh) * | 2017-06-30 | 2017-11-07 | 广东工业大学 | 一种交互镜子及具有该交互镜子的智能家电系统 |
JP6777887B2 (ja) * | 2017-06-30 | 2020-10-28 | 京セラドキュメントソリューションズ株式会社 | リモート通信制御システム、セッション管理システムおよびセッション管理プログラム |
US10503467B2 (en) * | 2017-07-13 | 2019-12-10 | International Business Machines Corporation | User interface sound emanation activity classification |
US20190018545A1 (en) * | 2017-07-13 | 2019-01-17 | International Business Machines Corporation | System and method for rapid financial app prototyping |
KR102419374B1 (ko) * | 2017-07-21 | 2022-07-11 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법 |
TWI646529B (zh) * | 2017-07-25 | 2019-01-01 | 雲拓科技有限公司 | 主動聊天裝置 |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
CN109426530B (zh) * | 2017-08-17 | 2022-04-05 | 阿里巴巴集团控股有限公司 | 页面确定方法、装置、服务器和存储介质 |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10600419B1 (en) * | 2017-09-22 | 2020-03-24 | Amazon Technologies, Inc. | System command processing |
US10957313B1 (en) | 2017-09-22 | 2021-03-23 | Amazon Technologies, Inc. | System command processing |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
CN107479906A (zh) * | 2017-09-28 | 2017-12-15 | 电子科技大学 | 基于Cordova的跨平台在线教育移动终端 |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10453454B2 (en) * | 2017-10-26 | 2019-10-22 | Hitachi, Ltd. | Dialog system with self-learning natural language understanding |
CN107767856B (zh) * | 2017-11-07 | 2021-11-19 | 中国银行股份有限公司 | 一种语音处理方法、装置及服务器 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
EP3529802A1 (en) * | 2017-12-08 | 2019-08-28 | Google LLC | System for securing a personal digital assistant with stacked data structures |
US20190180753A1 (en) * | 2017-12-12 | 2019-06-13 | Ca, Inc. | Analysis of collaborative dialog data structures from speech processing computer system |
CN108008728B (zh) * | 2017-12-12 | 2020-01-17 | 深圳市银星智能科技股份有限公司 | 清洁机器人以及基于清洁机器人的最短路径规划方法 |
WO2019125486A1 (en) * | 2017-12-22 | 2019-06-27 | Soundhound, Inc. | Natural language grammars adapted for interactive experiences |
US11443646B2 (en) | 2017-12-22 | 2022-09-13 | Fathom Technologies, LLC | E-Reader interface system with audio and highlighting synchronization for digital books |
US10671251B2 (en) | 2017-12-22 | 2020-06-02 | Arbordale Publishing, LLC | Interactive eReader interface generation based on synchronization of textual and audial descriptors |
US11900928B2 (en) | 2017-12-23 | 2024-02-13 | Soundhound Ai Ip, Llc | System and method for adapted interactive experiences |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
CN108256066B (zh) * | 2018-01-16 | 2022-01-11 | 智言科技(深圳)有限公司 | 端到端层次解码任务型对话系统 |
CN108269205A (zh) * | 2018-01-24 | 2018-07-10 | 成都安信思远信息技术有限公司 | 一种利用云平台的电子数据鉴定系统 |
CN108319912A (zh) * | 2018-01-30 | 2018-07-24 | 歌尔科技有限公司 | 一种唇语识别方法、装置、系统和智能眼镜 |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US20190236137A1 (en) * | 2018-01-31 | 2019-08-01 | Microsoft Technology Licensing, Llc | Generating conversational representations of web content |
CN108520748B (zh) * | 2018-02-01 | 2020-03-03 | 百度在线网络技术(北京)有限公司 | 一种智能设备功能引导方法及系统 |
US10891430B2 (en) * | 2018-02-02 | 2021-01-12 | Fuji Xerox Co., Ltd. | Semi-automated methods for translating structured document content to chat-based interaction |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
KR102507249B1 (ko) * | 2018-03-08 | 2023-03-07 | 삼성전자주식회사 | 성능 모드 제어 방법 및 이를 지원하는 전자 장치 |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11056107B2 (en) * | 2018-03-30 | 2021-07-06 | International Business Machines Corporation | Conversational framework |
CN112136124B (zh) * | 2018-04-19 | 2024-02-20 | 谷歌有限责任公司 | 用于与计算机实现的自动助理进行人机对话会话的依赖图谈话建模 |
CN108614773A (zh) * | 2018-04-24 | 2018-10-02 | 广州链创信息科技有限公司 | 一种手机小程序用展示发布体验系统 |
US11094316B2 (en) * | 2018-05-04 | 2021-08-17 | Qualcomm Incorporated | Audio analytics for natural language processing |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
EP3570189B1 (de) * | 2018-05-14 | 2023-08-09 | Siemens Aktiengesellschaft | Computerimplementiertes verfahren zum bereitstellen eines adaptiven dialogsystems und ein adaptives dialogsystem |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10776582B2 (en) * | 2018-06-06 | 2020-09-15 | International Business Machines Corporation | Supporting combinations of intents in a conversation |
US10811009B2 (en) | 2018-06-27 | 2020-10-20 | International Business Machines Corporation | Automatic skill routing in conversational computing frameworks |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
CN112262381B (zh) | 2018-08-07 | 2024-04-09 | 谷歌有限责任公司 | 汇编和评估对隐私问题的自动助理响应 |
US11436215B2 (en) | 2018-08-20 | 2022-09-06 | Samsung Electronics Co., Ltd. | Server and control method thereof |
KR20230145521A (ko) * | 2018-08-23 | 2023-10-17 | 구글 엘엘씨 | 멀티-어시스턴트 환경의 특성에 따른 어시스턴트 응답성 규정하기 |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10762893B2 (en) * | 2018-09-28 | 2020-09-01 | Comcast Cable Communications, Llc | Monitoring of one or more audio/video collection devices |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US10594837B1 (en) | 2018-11-02 | 2020-03-17 | International Business Machines Corporation | Predictive service scaling for conversational computing |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US10770072B2 (en) | 2018-12-10 | 2020-09-08 | International Business Machines Corporation | Cognitive triggering of human interaction strategies to facilitate collaboration, productivity, and learning |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
CN110021291B (zh) * | 2018-12-26 | 2021-01-29 | 创新先进技术有限公司 | 一种语音合成文件的调用方法及装置 |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
EP3703342B1 (en) * | 2019-03-01 | 2023-07-26 | ABB Schweiz AG | Dynamic load balancing in network centric process control systems |
WO2020185880A1 (en) * | 2019-03-12 | 2020-09-17 | Beguided, Inc. | Conversational artificial intelligence for automated self-service account management |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN111800537B (zh) * | 2019-04-09 | 2021-07-20 | Oppo广东移动通信有限公司 | 终端使用状态的评估方法、装置、存储介质及电子设备 |
CN111857219B (zh) * | 2019-04-25 | 2023-06-30 | 益逻触控系统公司 | 具有三层系统架构的自助服务装置 |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11640504B2 (en) | 2019-05-17 | 2023-05-02 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11526780B2 (en) * | 2019-08-05 | 2022-12-13 | Microsoft Technology Licensing, Llc | Converting nonnative skills for conversational computing interfaces |
US10915227B1 (en) | 2019-08-07 | 2021-02-09 | Bank Of America Corporation | System for adjustment of resource allocation based on multi-channel inputs |
CN110647736A (zh) * | 2019-08-13 | 2020-01-03 | 平安科技(深圳)有限公司 | 插件式坐席系统登录方法、装置、计算机设备及存储介质 |
CN110400564A (zh) * | 2019-08-21 | 2019-11-01 | 科大国创软件股份有限公司 | 一种基于栈的聊天机器人对话管理方法 |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
CN110647305B (zh) * | 2019-09-29 | 2023-10-31 | 阿波罗智联(北京)科技有限公司 | 应用程序的语音交互方法、装置、设备和介质 |
US11062270B2 (en) * | 2019-10-01 | 2021-07-13 | Microsoft Technology Licensing, Llc | Generating enriched action items |
US12020696B2 (en) | 2019-10-21 | 2024-06-25 | Soundhound Ai Ip, Llc | Automatic synchronization for an offline virtual assistant |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
JP7029434B2 (ja) * | 2019-10-23 | 2022-03-03 | サウンドハウンド,インコーポレイテッド | コンピュータによって実行される方法、サーバ装置、情報処理システム、プログラム、およびクライアント端末 |
WO2021096382A2 (ru) * | 2019-11-15 | 2021-05-20 | Федеральное Государственное Автономное Образовательное Учреждение Высшего Образования "Московский Физико-Технический Институт" (Национальный Исследовательский Университет) (Мфти) | Способ и система управления диалоговым агентом в канале взаимодействия с пользователем |
CN111105289B (zh) * | 2019-11-22 | 2023-05-05 | 北京云杉信息技术有限公司 | 一种基于aop方式的客户端订单取消判断方法及装置 |
US11664044B2 (en) | 2019-11-25 | 2023-05-30 | Qualcomm Incorporated | Sound event detection learning |
EP3836043A1 (en) | 2019-12-11 | 2021-06-16 | Carrier Corporation | A method and an equipment for configuring a service |
JP6746826B1 (ja) * | 2019-12-13 | 2020-08-26 | 株式会社日立産機システム | 通信モジュール、通信システム及び通信方法 |
CN111223485A (zh) * | 2019-12-19 | 2020-06-02 | 深圳壹账通智能科技有限公司 | 智能交互方法、装置、电子设备及存储介质 |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
CN113035226B (zh) * | 2019-12-24 | 2024-04-23 | 中兴通讯股份有限公司 | 语音通话方法、通信终端和计算机可读介质 |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11209573B2 (en) | 2020-01-07 | 2021-12-28 | Northrop Grumman Systems Corporation | Radio occultation aircraft navigation aid system |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11561775B2 (en) | 2020-03-30 | 2023-01-24 | Nuance Communications, Inc. | Development system and method |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
CN114095487B (zh) * | 2020-07-30 | 2024-03-19 | 中移(苏州)软件技术有限公司 | 一种远程任务执行方法、装置及存储介质 |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11514799B2 (en) | 2020-11-11 | 2022-11-29 | Northrop Grumman Systems Corporation | Systems and methods for maneuvering an aerial vehicle during adverse weather conditions |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11410677B2 (en) | 2020-11-24 | 2022-08-09 | Qualcomm Incorporated | Adaptive sound event classification |
CN112527435B (zh) * | 2020-12-08 | 2024-02-13 | 建信金融科技有限责任公司 | 浏览器操作方法及系统 |
US11329933B1 (en) | 2020-12-28 | 2022-05-10 | Drift.com, Inc. | Persisting an AI-supported conversation across multiple channels |
US20220415311A1 (en) * | 2021-06-24 | 2022-12-29 | Amazon Technologies, Inc. | Early invocation for contextual data processing |
US20230197072A1 (en) * | 2021-12-17 | 2023-06-22 | Google Llc | Warm word arbitration between automated assistant devices |
US20230273943A1 (en) * | 2022-02-28 | 2023-08-31 | International Business Machines Corporation | Synchronizing a sensor network and an ontology |
CN115064168B (zh) * | 2022-08-17 | 2022-12-13 | 广州小鹏汽车科技有限公司 | 语音交互方法、服务器和存储介质 |
CN116719649A (zh) * | 2022-09-01 | 2023-09-08 | 荣耀终端有限公司 | 会话通知的提示方法、电子设备及可读存储介质 |
CN116450383A (zh) * | 2023-06-19 | 2023-07-18 | 合肥景云软件工程有限责任公司 | 一种通过网页调用操作系统的方法 |
Family Cites Families (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4787031A (en) * | 1985-01-04 | 1988-11-22 | Digital Equipment Corporation | Computer with virtual machine mode and multiple protection rings |
JPH0673135B2 (ja) * | 1988-03-01 | 1994-09-14 | 工業技術院長 | 自然言語対話処理装置 |
US5282265A (en) * | 1988-10-04 | 1994-01-25 | Canon Kabushiki Kaisha | Knowledge information processing system |
JPH0384652A (ja) * | 1989-08-29 | 1991-04-10 | Personal Joho Kankyo Kyokai | ヒューマンインタフェースのアーキテクチャモデル |
US5333237A (en) * | 1989-10-10 | 1994-07-26 | Hughes Aircraft Company | Hypermedia structured knowledge base system |
JP3235728B2 (ja) * | 1990-02-09 | 2001-12-04 | 沖ソフトウェア株式会社 | 会話制御方式 |
JPH05304567A (ja) * | 1990-04-05 | 1993-11-16 | Texas Instr Inc <Ti> | 遠隔通信システムならびにその遠隔通信サービスプレゼンテーションインターフェース及び遠隔通信ネットワーク |
JPH0410153A (ja) * | 1990-04-27 | 1992-01-14 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索システム |
US5133004A (en) * | 1990-05-07 | 1992-07-21 | Unisys Corporation | Digital computer platform for supporting telephone network applications |
US5255305A (en) | 1990-11-01 | 1993-10-19 | Voiceplex Corporation | Integrated voice processing system |
US5274695A (en) * | 1991-01-11 | 1993-12-28 | U.S. Sprint Communications Company Limited Partnership | System for verifying the identity of a caller in a telecommunications network |
JPH0792801B2 (ja) * | 1991-08-02 | 1995-10-09 | 工業技術院長 | 非単調推論方法 |
US5283888A (en) | 1991-08-27 | 1994-02-01 | International Business Machines Corporation | Voice processing interface unit employing virtual screen communications for accessing a plurality of primed applications |
US6400996B1 (en) * | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
JP3213056B2 (ja) * | 1992-06-19 | 2001-09-25 | 株式会社日立製作所 | マルチメディア処理装置 |
US5384890A (en) * | 1992-09-30 | 1995-01-24 | Apple Computer, Inc. | Method and apparatus for providing multiple clients simultaneous access to a sound data stream |
FR2696574B1 (fr) * | 1992-10-06 | 1994-11-18 | Sextant Avionique | Procédé et dispositif d'analyse d'un message fourni par des moyens d'interaction à un système de dialogue homme-machine. |
JPH06131437A (ja) * | 1992-10-20 | 1994-05-13 | Hitachi Ltd | 複合形態による操作指示方法 |
JPH06149534A (ja) * | 1992-11-13 | 1994-05-27 | Toshiba Corp | 音声画面操作装置 |
US6029188A (en) * | 1993-01-18 | 2000-02-22 | Institute For Personalized Information Environment | Information processing system for an architecture model capable of interfacing with humans and capable of being modified |
US5544228A (en) * | 1993-09-27 | 1996-08-06 | The Walt Disney Company | Method and apparatus for transmission of full frequency digital audio |
US5509060A (en) * | 1993-11-19 | 1996-04-16 | At&T Corp. | Network-accessible intelligent telephone service |
US5748841A (en) * | 1994-02-25 | 1998-05-05 | Morin; Philippe | Supervised contextual language acquisition system |
US5644686A (en) * | 1994-04-29 | 1997-07-01 | International Business Machines Corporation | Expert system and method employing hierarchical knowledge base, and interactive multimedia/hypermedia applications |
JP3408332B2 (ja) * | 1994-09-12 | 2003-05-19 | 富士通株式会社 | ハイパーテキスト読上装置 |
US5682539A (en) * | 1994-09-29 | 1997-10-28 | Conrad; Donovan | Anticipated meaning natural language interface |
US5594789A (en) * | 1994-10-13 | 1997-01-14 | Bell Atlantic Network Services, Inc. | Transaction implementation in video dial tone network |
EP0792493B1 (en) * | 1994-11-08 | 1999-08-11 | Vermeer Technologies, Inc. | An online service development tool with fee setting capabilities |
JPH08137697A (ja) * | 1994-11-15 | 1996-05-31 | Kobe Steel Ltd | 自律分散型システム |
US6029195A (en) * | 1994-11-29 | 2000-02-22 | Herz; Frederick S. M. | System for customized electronic identification of desirable objects |
US5748974A (en) * | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
JP2746218B2 (ja) * | 1995-02-23 | 1998-05-06 | 富士ゼロックス株式会社 | 資源管理装置および資源管理方法 |
US5890123A (en) * | 1995-06-05 | 1999-03-30 | Lucent Technologies, Inc. | System and method for voice controlled video screen display |
US5742845A (en) * | 1995-06-22 | 1998-04-21 | Datascape, Inc. | System for extending present open network communication protocols to communicate with non-standard I/O devices directly coupled to an open network |
JP3729918B2 (ja) * | 1995-07-19 | 2005-12-21 | 株式会社東芝 | マルチモーダル対話装置及び対話方法 |
US5794205A (en) | 1995-10-19 | 1998-08-11 | Voice It Worldwide, Inc. | Voice recognition interface apparatus and method for interacting with a programmable timekeeping device |
JPH10124378A (ja) | 1995-12-01 | 1998-05-15 | Zakuson R & D:Kk | インターネットおよびイントラネット上におけるホームページ上の文書録画支援装置および文書録画支援システム |
US6240448B1 (en) * | 1995-12-22 | 2001-05-29 | Rutgers, The State University Of New Jersey | Method and system for audio access to information in a wide area computer network |
US6101528A (en) * | 1996-03-27 | 2000-08-08 | Intel Corporation | Method and apparatus for discovering server applications by a client application in a network of computer systems |
US5884262A (en) * | 1996-03-28 | 1999-03-16 | Bell Atlantic Network Services, Inc. | Computer network audio access and conversion system |
WO1997040611A1 (en) * | 1996-04-22 | 1997-10-30 | At & T Corp. | Method and apparatus for information retrieval using audio interface |
US5956507A (en) * | 1996-05-14 | 1999-09-21 | Shearer, Jr.; Bennie L. | Dynamic alteration of operating system kernel resource tables |
JPH09319760A (ja) * | 1996-05-30 | 1997-12-12 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索運行システム |
EP1571815A3 (en) * | 1996-06-03 | 2006-10-04 | WorldVoice Licensing, Inc. | Telephonic voice message store and forward method having network address and voice authentication |
JPH1078952A (ja) * | 1996-07-29 | 1998-03-24 | Internatl Business Mach Corp <Ibm> | 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置 |
US5799063A (en) * | 1996-08-15 | 1998-08-25 | Talk Web Inc. | Communication system and method of providing access to pre-recorded audio messages via the Internet |
JPH10124293A (ja) * | 1996-08-23 | 1998-05-15 | Osaka Gas Co Ltd | 音声指令可能なコンピュータとそれ用の媒体 |
US5850629A (en) * | 1996-09-09 | 1998-12-15 | Matsushita Electric Industrial Co., Ltd. | User interface controller for text-to-speech synthesizer |
WO1998013771A1 (fr) * | 1996-09-26 | 1998-04-02 | Mitsubishi Denki Kabushiki Kaisha | Processeur interactif |
US5721827A (en) * | 1996-10-02 | 1998-02-24 | James Logan | System for electrically distributing personalized information |
US5915001A (en) * | 1996-11-14 | 1999-06-22 | Vois Corporation | System and method for providing and using universally accessible voice and speech data files |
US5774857A (en) * | 1996-11-15 | 1998-06-30 | Motorola, Inc. | Conversion of communicated speech to text for tranmission as RF modulated base band video |
JP3826239B2 (ja) * | 1996-11-22 | 2006-09-27 | 日本電信電話株式会社 | ハイパーテキスト中継方法及び装置 |
US6282511B1 (en) * | 1996-12-04 | 2001-08-28 | At&T | Voiced interface with hyperlinked information |
US5960399A (en) | 1996-12-24 | 1999-09-28 | Gte Internetworking Incorporated | Client/server speech processor/recognizer |
US6456974B1 (en) * | 1997-01-06 | 2002-09-24 | Texas Instruments Incorporated | System and method for adding speech recognition capabilities to java |
JP2907174B2 (ja) * | 1997-02-04 | 1999-06-21 | 日本電気株式会社 | 監視制御システムのユーザインタフェースシステム |
JPH10222342A (ja) * | 1997-02-06 | 1998-08-21 | Nippon Telegr & Teleph Corp <Ntt> | ハイパーテキスト音声制御方法及び装置 |
JPH10222525A (ja) | 1997-02-07 | 1998-08-21 | Hitachi Ltd | ナビゲーション方法 |
JPH10243048A (ja) * | 1997-02-27 | 1998-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 情報伝送方法及びシステム |
US5987102A (en) * | 1997-03-14 | 1999-11-16 | Efusion, Inc. | Method and apparatus for bridging a voice call including selective provision of information in non-audio to the caller |
US5884266A (en) * | 1997-04-02 | 1999-03-16 | Motorola, Inc. | Audio interface for document based information resource navigation and method therefor |
JP3646471B2 (ja) * | 1997-05-14 | 2005-05-11 | 日本電信電話株式会社 | 情報提供方法及び個人適応情報提供サーバ及び情報提供プログラムを格納した記憶媒体 |
US5897616A (en) * | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
US6044347A (en) * | 1997-08-05 | 2000-03-28 | Lucent Technologies Inc. | Methods and apparatus object-oriented rule-based dialogue management |
US6353824B1 (en) * | 1997-11-18 | 2002-03-05 | Apple Computer, Inc. | Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments |
US6157705A (en) * | 1997-12-05 | 2000-12-05 | E*Trade Group, Inc. | Voice control of a server |
US6230197B1 (en) * | 1998-09-11 | 2001-05-08 | Genesys Telecommunications Laboratories, Inc. | Method and apparatus for rules-based storage and retrieval of multimedia interactions within a communication center |
US6370508B2 (en) * | 1998-09-11 | 2002-04-09 | Genesys Telecommunications Laboratories, Inc. | Interface engine for managing business processes within a multimedia communication-center |
EP1073957B1 (en) * | 1998-03-23 | 2003-05-21 | Microsoft Corporation | Application program interfaces in an operating system |
US6018711A (en) * | 1998-04-21 | 2000-01-25 | Nortel Networks Corporation | Communication system user interface with animated representation of time remaining for input to recognizer |
US6859451B1 (en) * | 1998-04-21 | 2005-02-22 | Nortel Networks Limited | Server for handling multimodal information |
US6012030A (en) * | 1998-04-21 | 2000-01-04 | Nortel Networks Corporation | Management of speech and audio prompts in multimodal interfaces |
US6438523B1 (en) * | 1998-05-20 | 2002-08-20 | John A. Oberteuffer | Processing handwritten and hand-drawn input and speech input |
US6397259B1 (en) * | 1998-05-29 | 2002-05-28 | Palm, Inc. | Method, system and apparatus for packet minimized communications |
US6253326B1 (en) * | 1998-05-29 | 2001-06-26 | Palm, Inc. | Method and system for secure communications |
US6269366B1 (en) * | 1998-06-24 | 2001-07-31 | Eastman Kodak Company | Method for randomly combining images with annotations |
US6269336B1 (en) | 1998-07-24 | 2001-07-31 | Motorola, Inc. | Voice browser for interactive services and methods thereof |
US6119147A (en) * | 1998-07-28 | 2000-09-12 | Fuji Xerox Co., Ltd. | Method and system for computer-mediated, multi-modal, asynchronous meetings in a virtual space |
US6779060B1 (en) * | 1998-08-05 | 2004-08-17 | British Telecommunications Public Limited Company | Multimodal user interface |
US6195696B1 (en) * | 1998-10-01 | 2001-02-27 | International Business Machines Corporation | Systems, methods and computer program products for assigning, generating and delivering content to intranet users |
CN1151488C (zh) * | 1998-10-02 | 2004-05-26 | 国际商业机器公司 | 通过一般分层对象进行有效语音导航的结构框架 |
US7003463B1 (en) * | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US6493671B1 (en) | 1998-10-02 | 2002-12-10 | Motorola, Inc. | Markup language for interactive services to notify a user of an event and methods thereof |
US6615240B1 (en) * | 1998-12-18 | 2003-09-02 | Motive Communications, Inc. | Technical support chain automation with guided self-help capability and option to escalate to live help |
US6851115B1 (en) * | 1999-01-05 | 2005-02-01 | Sri International | Software-based architecture for communication and cooperation among distributed electronic agents |
US6523061B1 (en) * | 1999-01-05 | 2003-02-18 | Sri International, Inc. | System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system |
US7216351B1 (en) * | 1999-04-07 | 2007-05-08 | International Business Machines Corporation | Systems and methods for synchronizing multi-modal interactions |
US6519617B1 (en) * | 1999-04-08 | 2003-02-11 | International Business Machines Corporation | Automated creation of an XML dialect and dynamic generation of a corresponding DTD |
US6636831B1 (en) * | 1999-04-09 | 2003-10-21 | Inroad, Inc. | System and process for voice-controlled information retrieval |
US6529889B1 (en) * | 1999-07-27 | 2003-03-04 | Acappella Software, Inc. | System and method of knowledge architecture |
US6377913B1 (en) * | 1999-08-13 | 2002-04-23 | International Business Machines Corporation | Method and system for multi-client access to a dialog system |
US7069220B2 (en) * | 1999-08-13 | 2006-06-27 | International Business Machines Corporation | Method for determining and maintaining dialog focus in a conversational speech system |
US6799169B1 (en) * | 1999-08-13 | 2004-09-28 | International Business Machines Corporation | Method and system for modeless operation of a multi-modal user interface through implementation of independent decision networks |
US6738803B1 (en) * | 1999-09-03 | 2004-05-18 | Cisco Technology, Inc. | Proxy browser providing voice enabled web application audio control for telephony devices |
US6615172B1 (en) * | 1999-11-12 | 2003-09-02 | Phoenix Solutions, Inc. | Intelligent query engine for processing voice based queries |
US6829603B1 (en) * | 2000-02-02 | 2004-12-07 | International Business Machines Corp. | System, method and program product for interactive natural dialog |
US7415537B1 (en) * | 2000-04-07 | 2008-08-19 | International Business Machines Corporation | Conversational portal for providing conversational browsing and multimedia broadcast on demand |
US6934756B2 (en) * | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US6970935B1 (en) * | 2000-11-01 | 2005-11-29 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US6801604B2 (en) * | 2001-06-25 | 2004-10-05 | International Business Machines Corporation | Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources |
US6839896B2 (en) * | 2001-06-29 | 2005-01-04 | International Business Machines Corporation | System and method for providing dialog management and arbitration in a multi-modal environment |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7349845B2 (en) * | 2003-09-03 | 2008-03-25 | International Business Machines Corporation | Method and apparatus for dynamic modification of command weights in a natural language understanding system |
-
1999
- 1999-10-01 CN CNB998116173A patent/CN1151488C/zh not_active Expired - Lifetime
- 1999-10-01 EP EP99950131A patent/EP1133734A4/en not_active Withdrawn
- 1999-10-01 IL IL14080599A patent/IL140805A0/xx unknown
- 1999-10-01 WO PCT/US1999/022925 patent/WO2000021075A1/en active IP Right Grant
- 1999-10-01 EP EP99951722A patent/EP1125279B1/en not_active Expired - Lifetime
- 1999-10-01 AT AT99951722T patent/ATE383640T1/de not_active IP Right Cessation
- 1999-10-01 CA CA2345665A patent/CA2345665C/en not_active Expired - Lifetime
- 1999-10-01 IL IL14236399A patent/IL142363A0/xx unknown
- 1999-10-01 JP JP2000575021A patent/JP3703082B2/ja not_active Expired - Lifetime
- 1999-10-01 IL IL14236699A patent/IL142366A0/xx active IP Right Grant
- 1999-10-01 CN CNB998116165A patent/CN1160700C/zh not_active Expired - Lifetime
- 1999-10-01 JP JP2000575119A patent/JP4171585B2/ja not_active Expired - Fee Related
- 1999-10-01 WO PCT/US1999/022915 patent/WO2000021073A1/en active IP Right Grant
- 1999-10-01 US US09/806,565 patent/US7137126B1/en not_active Expired - Lifetime
- 1999-10-01 IL IL14236499A patent/IL142364A0/xx unknown
- 1999-10-01 WO PCT/US1999/022927 patent/WO2000020962A2/en active IP Right Grant
- 1999-10-01 WO PCT/US1999/023008 patent/WO2000021232A2/en not_active Application Discontinuation
- 1999-10-01 CA CA002345660A patent/CA2345660C/en not_active Expired - Lifetime
- 1999-10-01 KR KR10-2001-7004207A patent/KR100430953B1/ko not_active IP Right Cessation
- 1999-10-01 DE DE69937962T patent/DE69937962T2/de not_active Expired - Lifetime
- 1999-10-01 EP EP99950114A patent/EP1163576A4/en not_active Withdrawn
- 1999-10-01 CA CA002345662A patent/CA2345662A1/en not_active Abandoned
- 1999-10-01 JP JP2000575117A patent/JP2003525477A/ja active Pending
- 1999-10-01 EP EP99951713A patent/EP1125277A4/en not_active Withdrawn
- 1999-10-01 CN CNB998116076A patent/CN100472500C/zh not_active Expired - Lifetime
- 1999-10-01 JP JP2000575249A patent/JP2002527800A/ja active Pending
- 1999-10-01 KR KR10-2001-7002798A patent/KR100431972B1/ko not_active IP Right Cessation
- 1999-10-01 KR KR10-2001-7004228A patent/KR100459299B1/ko not_active IP Right Cessation
- 1999-10-01 CN CNB998116181A patent/CN1171200C/zh not_active Expired - Fee Related
- 1999-10-01 KR KR1020017004223A patent/KR100620826B1/ko active IP Right Grant
- 1999-10-01 CA CA002345661A patent/CA2345661A1/en not_active Abandoned
- 1999-10-01 US US09/806,549 patent/US7418382B1/en not_active Expired - Fee Related
-
2001
- 2001-04-02 IL IL142366A patent/IL142366A/en not_active IP Right Cessation
-
2006
- 2006-10-23 US US11/551,901 patent/US7729916B2/en not_active Expired - Fee Related
-
2009
- 2009-08-20 US US12/544,473 patent/US8082153B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100815731B1 (ko) * | 2005-06-30 | 2008-03-20 | 캐논 가부시끼가이샤 | 음성 인식 방법 및 음성 인식 장치 |
US7668719B2 (en) | 2005-06-30 | 2010-02-23 | Canon Kabushiki Kaisha | Speech recognition method and speech recognition apparatus |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100431972B1 (ko) | 통상의 계층 오브젝트를 사용한 효과적인 음성네비게이션용 뼈대 구조 시스템 | |
US6604075B1 (en) | Web-based voice dialog interface | |
CA2280331C (en) | Web-based platform for interactive voice response (ivr) | |
US6965864B1 (en) | Voice activated hypermedia systems using grammatical metadata | |
US20050091057A1 (en) | Voice application development methodology | |
US8160886B2 (en) | Open architecture for a voice user interface | |
US7020841B2 (en) | System and method for generating and presenting multi-modal applications from intent-based markup scripts | |
KR100567126B1 (ko) | 음성 xml 파일을 자동적으로 생성하기 위한 방법 및시스템 | |
US20050028085A1 (en) | Dynamic generation of voice application information from a web server | |
EP0854418A2 (en) | Speech recognition interface | |
JP2003015860A (ja) | 音声対応プログラムにおける音声主導型データ選択 | |
GB2372864A (en) | Spoken language interface | |
JP2009520224A (ja) | 音声アプリケーションを処理する方法、サーバー、クライアント装置、コンピュータ読み取り可能な記録媒体(マークアップを介する音声アプリケーションの処理の共有) | |
US7395206B1 (en) | Systems and methods for managing and building directed dialogue portal applications | |
Pargellis et al. | An automatic dialogue generation platform for personalized dialogue applications | |
Demesticha et al. | Aspects of design and implementation of a multi-channel and multi-modal information system | |
Pargellis et al. | A language for creating speech applications. | |
EP1564659A1 (en) | Method and system of bookmarking and retrieving electronic documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |