TWI601128B - 用於上下文切換的語音辨識之電腦實施方法及系統 - Google Patents

用於上下文切換的語音辨識之電腦實施方法及系統 Download PDF

Info

Publication number
TWI601128B
TWI601128B TW101133009A TW101133009A TWI601128B TW I601128 B TWI601128 B TW I601128B TW 101133009 A TW101133009 A TW 101133009A TW 101133009 A TW101133009 A TW 101133009A TW I601128 B TWI601128 B TW I601128B
Authority
TW
Taiwan
Prior art keywords
context
application
game
user
options
Prior art date
Application number
TW101133009A
Other languages
English (en)
Other versions
TW201320057A (zh
Inventor
摩森馬塞羅J
捷思威廉P
格瑞那瓦特丹尼爾J
Original Assignee
微軟技術授權有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 微軟技術授權有限責任公司 filed Critical 微軟技術授權有限責任公司
Publication of TW201320057A publication Critical patent/TW201320057A/zh
Application granted granted Critical
Publication of TWI601128B publication Critical patent/TWI601128B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • A63F13/10
    • A63F13/12
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/30Interconnection arrangements between game servers and game devices; Interconnection arrangements between game devices; Interconnection arrangements between game servers
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/45Controlling the progress of the video game
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/60Methods for processing data by generating or executing the game program
    • A63F2300/6045Methods for processing data by generating or executing the game program for mapping control signals received from the input arrangement into game commands
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/60Methods for processing data by generating or executing the game program
    • A63F2300/6063Methods for processing data by generating or executing the game program for sound processing
    • A63F2300/6072Methods for processing data by generating or executing the game program for sound processing of an input signal, e.g. pitch and rhythm extraction, voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Description

用於上下文切換的語音辨識之電腦實施方法及系統
本案係關於用於上下文切換的語音辨識。
許多電腦應用程式提供了各種不同的上下文(context)以及使用者可以經由其與該等應用程式互動的圖形化使用者介面。例如,視訊遊戲通常包括允許使用者存取各種由視訊遊戲所提供的功能的不同的使用者介面。一些使用者介面可允許使用者定製遊戲的某些部分,例如玩遊戲的遊戲競技場、用於玩遊戲的車輛等。其他使用者介面可允許使用者參與各種類型的玩遊戲,例如單人玩遊戲、多人玩遊戲等等。儘管,該等不同的使用者介面可以提供更加有趣且不同的遊戲體驗,但當前在各種使用者介面之間的導覽方式卻是麻煩的。
提供本發明內容以便以簡化形式介紹將在以下具體實施方式中進一步描述的一些概念。本發明內容並非意欲識別所主張的標的的關鍵特徵或必要特徵,亦不意欲用於幫助決定所主張的標的的範圍。
各種實施例提供了用於實施用於上下文切換的語音辨識的技術。在至少一些實施例中,該等技術可以允許使用者經由語音命令在應用程式的不同的上下文及/或使用者 介面之間進行切換。例如,遊戲應用程式可以包括提供不同的互動上下文和功能的各種不同的使用者介面。一些使用者介面可以提供玩遊戲的功能,而其他使用者介面可以提供遊戲定製的功能。在此述及之技術可以允許使用者藉由發出語音命令在該各種使用者介面間導覽。
在至少一些實施例中,提供列出應用程式的可以經由語音命令來導覽的可用上下文的上下文選項單。例如,使用者可以在應用程式的特定上下文的使用者介面正被顯示的同時說出觸發詞。觸發詞的辨識可以使得上下文選項單被作為使用者介面的一部分而顯示。上下文選項單可包括可以經由語音命令所導覽到的其他上下文。在實施中,在上下文選項單中呈現的其他上下文包括基於多種上下文過濾準則被過濾的較大上下文集合的子集。使用者可以說出在上下文選項單中呈現的上下文中的一個以導致到與不同的上下文相關聯的使用者介面的導覽。
概覽
各種實施例提供了用於實施用於上下文切換的語音辨識的技術。在至少一些實施例中,該等技術可以允許使用者經由語音命令在應用程式的不同的上下文及/或使用者介面之間進行切換。例如,遊戲應用程式可以包括提供不同的互動上下文和功能的各種不同的使用者介面。一些使用者介面可以提供玩遊戲的功能,而其他使用者介面可以 提供遊戲定製的功能。在此述及之技術可以允許使用者藉由發出語音命令在該各種使用者介面間導覽。
在至少一些實施例中,提供列出一個應用程式的可以經由語音命令來導覽到的可用上下文的上下文選項單。例如,使用者可以在應用程式的特定上下文的使用者介面正被顯示的同時說出觸發詞。觸發詞的辨識可以使得上下文選項單被作為使用者介面的一部分而顯示。上下文選項單可包括可以經由語音命令所導覽到的其他上下文。在實施中,在上下文選項單中呈現的其他上下文包括基於多種上下文過濾準則被過濾的較大上下文集合的子集。使用者可以說出在上下文選項單中呈現的上下文中的一個以導致到與不同的上下文相關聯的使用者介面的導覽。
在以下論述中,提供了題為「操作環境」的章節,該章節描述其中可採用一或多個實施例的一個環境。之後,標題為「示例性上下文切換場景」的章節描述了根據一或多個實施例的示例性上下文切換場景。接著,標題為「示例性方法」的章節描述根據一或多個實施例的示例性方法。最後,標題為「示例性系統和設備」的章節描述了可用於實施一或多個實施例的示例性系統和示例性設備。
操作環境
圖1在100處概括地圖示根據一或多個實施例的操作環境。操作環境100包括計算設備102,該計算設備可用各種方式來配置。例如,計算設備102可被具體化為任何合適的計算設備,舉例而言(但並非限制),遊戲控制台、 桌上型電腦、可攜式電腦、諸如個人數位助理(PDA)、蜂巢式電話等掌上型電腦,等等。計算設備102的一個示例性配置以下在圖7中圖示並描述。
一或多個應用程式104作為計算設備102的部分而被包括,該等應用程式是允許經由計算設備102執行各種各樣的任務的功能的表示。例如,可以由計算設備102執行應用程式104來提供諸如視訊遊戲、文書處理、電子郵件、試算表、媒體內容消費等的功能。
輸入/輸出模組106亦作為計算設備102的部分而被包括,該輸入/輸出模組表示了用於發送和接收資訊的功能。例如,輸入/輸出模組106可被配置為接收由諸如鍵盤、滑鼠、觸控板、遊戲控制器、光學掃瞄器等輸入設備產生的輸入。輸入/輸出模組106亦可被配置為接收及/或解釋經由諸如語音辨識、基於姿勢的輸入、物件掃瞄等的非接觸機制所接收的輸入。亦是該等實施例,計算設備102包括自然使用者介面(NUI)設備108,自然使用者介面設備被配置為例如經由人類姿勢可視辨識、物件掃瞄、語音輸入、顏色輸入等來接收各種非接觸輸入。
語音辨識模組110作為輸入/輸出模組106的部分而被包括,該語音辨識模組是辨識(例如來自NUI設備108的)語音輸入並將該語音輸入轉換成其他實體可用於執行任務的形式的功能的表示。
對於在此論述的技術進一步來說,應用程式104包括一或多個上下文模組112,該上下文模組是允許應用程式在 與應用程式相關聯的各種上下文及/或使用者介面之間切換的功能的表示。在至少一些實施例中,上下文模組112被配置為從輸入/輸出模組106及/或語音辨識模組110接收輸入以實施在此所論述的技術。
操作環境100進一步包括與計算設備102相耦合的顯示設備114。在至少一些實施例中,顯示設備114被配置為從計算設備102接收並顯示輸出,例如由應用程式104產生並經由輸入/輸出模組106提供給顯示設備114的使用者介面。在實施中,輸入/輸出模組106可以從NUI設備108接收輸入(例如語音輸入),並且可以利用輸入以允許使用者與上下文模組112互動以在由應用程式104提供的各種上下文及/或使用者介面之間導覽。下文描述操作環境100的更多實施。
一般而言,此處描述的任何功能可使用軟體、韌體、硬體(例如,固定邏輯電路),或該等實施的組合來實施。本文使用的術語「模組」、「功能」和「邏輯」一般表示軟體、韌體、硬體或其組合。在軟體實施的情況下,模組、功能或邏輯表示當在處理器(例如,一或多個CPU)上執行時執行指定任務的程式碼。程式碼可被儲存在一或多個電腦可讀取記憶體設備中。下文所描述的技術的特徵是平臺無關的,意味著該等技術可以在具有各種處理器的各種商業計算平臺上實施。
例如,計算設備102亦可包括使得計算設備102的硬體執行操作的實體(例如軟體),例如處理器、功能方塊, 等。例如,計算設備102可包括電腦可讀取媒體,其被配置用於維護使得計算設備,尤其是計算設備102的硬體執行操作的指令。因此,指令用於配置硬體來執行操作,並以此方式致使硬體變換以執行功能。可由電腦可讀取媒體經由各種不同配置將指令提供給計算設備102。
一種此種電腦可讀取媒體配置是信號承載媒體,並因此被配置來將指令(例如,作為載波),例如經由網路,傳送到計算設備的硬體。電腦可讀取媒體亦可被配置為電腦可讀取儲存媒體,因此不是信號承載媒體。電腦可讀取儲存媒體的實例包括,隨機存取記憶體(RAM)、唯讀記憶體(ROM)、光碟、快閃記憶體、硬碟記憶體,和其他可使用磁性、光學以及用於儲存指令和其他資料的其他技術的記憶體設備。
示例性上下文切換場景
本章節描述了可以由在此論述的技術賦能的示例性上下文切換場景。在至少一些實施例中,可以經由如上所論述的操作環境100及/或如下所論述的示例性系統600的各態樣來實施示例性上下文切換場景。因此,將參考操作環境100及/或示例性系統600的特徵來論述示例性上下文切換場景的某些態樣。如此僅是出於示例性的目的,並且在不背離所主張的實施例的精神和範疇的情況下,示例性上下文切換場景的各態樣可以在各種不同的操作環境和系統中實施。
圖2在200處概括圖示示例性上下文切換場景。在上下 文切換場景200的上半部分中,顯示設備114顯示與遊戲應用程式相關聯的定製介面202。在實施中,定製介面202允許使用者例如藉由切換遊戲車輛的部件、改變車輛的顏色等等來定製遊戲應用程式的各個態樣。如此,定製介面202與一特定功能集相關聯,該功能集使得與遊戲應用程式相關聯的各種任務能夠被執行。
在上下文切換場景的上半部分中進一步圖示給NUI設備108的語音輸入204。語音輸入204表示可以由使用者說出並由NUI設備108的一或多個音訊感測工具來感測的詞及/或其他發音。觸發詞206作為語音輸入204的部分而被包括,該觸發詞表示可被說出以啟用在此論述的語音辨識功能的詞。
繼續上下文切換場景200的下半部分,語音輸入204(例如觸發詞206)的辨識使得上下文選項單208被呈現在定製介面202中。上下文選項單208包括可以被選擇以導覽到與遊戲應用程式相關聯的其他上下文的上下文選項。例如,可以說出上下文選項以選擇特定的上下文選項並使得導覽到與該特定上下文選項相關聯的圖形化使用者介面。在上下文選項單208中呈現的上下文選項可以包括基於一或多個過濾準則來過濾的經過濾上下文選項。過濾上下文選項的示例性方式在以下論述。
圖3在300處概括圖示示例性上下文切換場景。在實施中,上下文切換場景300表示如上所論述的上下文切換場景200的繼續。在上下文切換場景300的上半部分中,將 定製介面202與上下文選項單208一起顯示。在NUI設備108處接收包括上下文詞304的語音輸入302。在該實例中,上下文詞304表示從上下文選項單208中選擇一個上下文選項。
繼續到上下文切換場景300的下半部分,語音輸入302的辨識使得比賽介面306被顯示在顯示設備114上。比賽介面306允許使用者參與與遊戲應用程式相關聯的一或多個比賽。如此,比賽介面306可以與一特定的功能集相關聯,該功能集使得與玩遊戲相關的動作能夠被執行。在實施中,由比賽介面306所表示的功能與由如上所論述的定製介面202所表示的功能不同。如此,在此述及之技術可以允許經由語音輸入在不同的功能集之間切換。
儘管,參考正被呈現的上下文選項單如上論述了上下文切換場景,但至少一些實施例可以在不需要上下文選項單呈現的情況下允許上下文切換。例如,使用者可以在上下文詞之後說出觸發詞,此舉可獨立於上下文選項單的呈現引起從一個上下文到另一個上下文的切換。如此,上下文詞可以表示可以說出以引動特定上下文、使用者介面及/或功能集的詞。
已經描述了示例性上下文切換場景,現在考慮對根據一或多個實施例的示例性方法的論述。
示例性方法
下文論述了可被實施用於執行在此論述的技術的許多方法。可以使用硬體、韌體、軟體或其組合來實施各方法 的各態樣。方法被示為一組方塊,其指定由一或多個設備執行的操作,不一定僅限於所示出的用於由相應的方塊執行操作的順序。而且,根據一或多個實施,相對於特定方法示出的操作可以與不同的方法的操作相組合及/或互換。可經由參考如上所論述的環境100以及參考下文論述的系統600來經由在各種實體之間的互動實施該等方法的各態樣。
圖4是描述根據一或多個實施例的方法中的各步驟的流程圖。步驟400顯示與第一上下文相關聯的圖形化使用者介面。例如,可以顯示與特定功能集相關聯的遊戲圖形化使用者介面。步驟402辨識指示到不同的上下文的潛在導覽的說出的觸發詞。可以實施各種各樣的不同的觸發詞以指示潛在的導覽。
步驟404表示包括可以被導覽到的一或多個不同的上下文的上下文選項單。藉由基於各種不同的過濾準則來過濾一組上下文,可以決定該一或多個不同的上下文。下文論述了此種過濾準則的實例。在實施中,可以將上下文選項單作為與第一上下文相關聯的圖形化使用者介面的部分來顯示。
步驟406決定在辨識觸發詞之後的特定的時間間隔中是否辨識了上下文詞的語音輸入。例如,在偵測到說出的觸發詞及/或呈現了上下文選項單之後,計時器可以開始流逝。若在特定的時間間隔中沒有辨識出上下文詞的語音輸入(「否」),則程序返回步驟400。例如,可以從顯示中移 除上下文選項單,並且將與第一上下文相關聯的圖形化使用者介面帶入聚焦。
若在特定的時間間隔中接收了上下文詞的語音輸入(「是」),則步驟408導覽到與第二上下文相關聯的圖形化使用者介面。與第二上下文相關聯的圖形化使用者介面可以與一功能集相關聯,該功能集是與和第一上下文相關聯的使用者介面不同的功能集。在實施中,可以回應於語音命令(例如觸發詞及/或上下文詞)並獨立於來自使用者的附加輸入,導覽到並顯示與第二上下文相關聯的圖形化使用者介面。
儘管,在此相對於觸發詞和上下文詞的組合來描述了各實施,但此舉並不是意欲進行限制。例如,一些實施可以使用單個詞及/或短語的語音辨識來從與第一上下文相關聯的使用者介面導覽到與第二上下文相關聯的使用者介面。
圖5是描述根據一或多個實施例的方法中的各步驟的流程圖。在實施中,方法可以表示如上所論述的步驟404的更加詳細的實施。在至少一些實施例中,可以至少部分地由一或多個上下文模組112來實施該方法。
步驟500過濾應用程式的一組上下文選項。例如,可以基於一或多個上下文專用準則(例如應用程式的屬性、在其上執行應用程式的設備,或設備的使用者)來過濾該組上下文選項。在實施中,不同的上下文選項組可用於不同的應用程式版本。例如,應用程式的高級版本可以具有比 應用程式的標準版本更多的上下文選項。例如,高級版本可以具有比該應用程式的標準版本對更多類型的玩遊戲、更多定製選項、更多多人選項等的存取。
而且,應用程式的狀態亦可以被用於過濾上下文選項。例如,若遊戲應用程式不具有保存的遊戲,則與保存的遊戲相關聯的上下文選項(例如查看先前遊戲的重放)可能不可用。
設備的屬性亦可以影響可用的上下文選項。例如,若一個設備沒有被連接到網路(例如網際網路)或該設備的網路連接在特定閾值頻寬之下,則某些與網路有關的上下文選項可能不可用。此種與網路有關的上下文選項可以包括多人網路玩遊戲、從網路資源可獲得的內容(例如車輛、遊戲角色、競技場等)、利用網路資源的訊息傳遞服務,等等。
而且,設備的特定能力亦可以影響可用的上下文選項。例如,需要閾值資料及/或圖形處理能力的某些玩遊戲選項在不滿足閾值處理能力的設備上可能不可用。
使用者的屬性亦可以影響可用的上下文選項。例如,應用程式可以與不同的帳戶會員等級相關聯,使用者可以訂閱該帳戶會員等級以存取不同的資源及/或功能。與標準會員等級相比,高級會員等級可以給予使用者擴展的存取權,例如擴展的多人遊戲時間、更多的競技場選項、更多的車輛選項、更多的玩遊戲角色選項等等。
使用者的屬性亦可考慮與使用者帳戶相關聯的安全控 制。例如,可以阻止較年輕的使用者存取某些對較年長的使用者可用的遊戲內容及/或功能。如此,可以基於使用者的年齡及/或與使用者相關聯的許可來過濾上下文選項。當過濾上下文選項時,亦可以考慮各種其他考慮事項。
步驟502產生應用程式的一組可用的上下文選項。例如,可用的上下文選項可以對應於沒有被如上所論述從該組上下文選項過濾掉的上下文選項的子集。步驟504允許經由語音命令能選擇可用的上下文選項以導覽到不同上下文。例如,可以將可用的上下文選項的一或多個作為上下文選項單的部分來顯示,如上所述。另外地或替代地,可用的上下文選項中的一或多個可以是獨立於被顯示而經由語音命令可選擇的。
在描述了根據一或多個實施例的方法之後,現在考慮可被用來實施一或多個實施例的示例性系統和示例性設備。
示例性系統和設備
圖6圖示了圖示在其中多個設備經由中央計算設備互聯的環境中被實施的計算設備102的示例性系統600。中央計算設備可以是多個設備本端的,或者可以位於多個設備的遠端。在一個實施例中,中央計算設備是「雲端」伺服器場,其包括經由網路或網際網路或其他手段連接到該多個設備的一或多個伺服器電腦。
在一個實施例中,該互連架構使得跨多個設備來遞送功能以向該多個設備的使用者提供共用且無瑕疵的體驗。多個設備的每一個可具有不同的實體要求和能力,且中央計 算設備使用一平臺來使得為設備特製且又對所有設備共用的體驗能被遞送到設備。在一個實施例中,建立目標設備「類」,且使得體驗適應於通用設備類。設備類可由設備的實體特徵或用途或其他共用特性來定義。例如,如上所述,計算設備102用各種不同方式來配置,諸如用於行動設備604、電腦602和電視機606用途。該等配置中的每一個具有一般對應的螢幕大小,且因此計算設備102可被配置為本示例性系統600中的該等設備類中的一個。例如,計算設備102可採取行動設備604設備類,該設備類包括行動電話、音樂播放機、遊戲裝置等等。
計算設備102亦可採取電腦602設備類,該設備類包括個人電腦、膝上型電腦、小筆電等等。電視機606配置包括涉及休閒環境中的顯示的設備配置,如電視機、機上盒、遊戲控制台等等。由此,此處所描述的技術可由計算設備102的該等各種配置來支援,且不限於在以下各節中所描述的具體實例。
雲端608被示為包括用於網路服務612的平臺610。平臺610抽象出雲端608的硬體(例如,伺服器)和軟體資源的底層功能,且因此可充當「雲端作業系統」。例如,平臺610可以抽象資源來將計算設備102與其他計算設備相連接。平臺610亦可用於抽象資源的縮放來向對經由平臺610實施的網路服務612的所遇到的需求提供對應的縮放級別。亦構想了各種其他實例,如伺服器場中的伺服器的負載平衡、針對惡意方(例如,垃圾郵件、病毒和其他 惡意軟體)的防範等等。
由此,把雲端608作為與經由網際網路或其他網路對計算設備102可用的軟體和硬體資源有關的策略的一部分包括在內。例如,用於在此述及之上下文切換的語音辨識的技術可以作為計算設備102的部分並經由支援網路服務612的平臺610來實施。
在實施中,到計算設備102的輸入可使用行動配置604中的觸控式螢幕功能、電腦602配置的追蹤墊功能來偵測,作為不涉及與特定輸入設備的接觸的自然使用者介面(NUI)的支援的一部分由照相機來偵測,等等。此外,實施在此論述的技術的操作的執行可分佈在系統600上,如由計算設備102來執行及/或由雲端608的平臺610支援的網路服務612來執行。
圖7圖示可被實施為如參考圖1和6來描述的任何類型的可攜式及/或電腦設備以實施此處描述的用於上下文切換的語音辨識的技術的各實施例的示例性設備700的各種元件。設備700包括允許設備資料704(例如,接收到的資料、正被接收的資料、排程用於廣播的資料、資料的資料封包等)的有線及/或無線通訊的通訊設備702。設備資料704或其他設備內容可以包括設備的配置設置、儲存在設備上的媒體內容及/或與設備的使用者相關聯的資訊。儲存在設備700上的媒體內容可以包括任何類型的音訊、視訊及/或影像資料。設備700包括一或多個資料輸入706,經由資料輸入可接收任何類型的資料、媒體內容,及/或輸 入,諸如使用者可選輸入、訊息、音樂、電視媒體內容、記錄的視訊內容,以及從任何內容源及/或資料來源接收的任何其他類型的音訊、視訊及/或影像資料。
設備700亦包括通訊介面708,其可被實施為串列及/或平行介面、無線介面、任何類型的網路介面、數據機,以及任何其他類型的通訊介面中的任何一或多個。通訊介面708提供設備700和通訊網路之間的連接及/或通訊鏈路,其他電子、計算和通訊設備經由該連接及/或通訊鏈路來與設備700傳遞資料。
設備700包括一或多個處理器710(例如,微處理器、控制器等中的任一個),處理器處理各種電腦可執行或可讀取指令來控制設備700的操作並實施上述上下文切換的實施例的語音辨識。替代地或另外地,設備700可被實施為具有與在712處概括標識的處理和控制電路有關地實施的硬體、韌體,或固定邏輯電路中的任何一個或組合。儘管未圖示,但是設備700可包括耦合設備內的各種元件的系統匯流排或資料傳送系統。系統匯流排可包括不同匯流排結構中的任一個或組合,諸如記憶體匯流排或記憶體控制器、周邊匯流排、通用串列匯流排,及/或利用各種匯流排架構中的任一種的處理器或區域匯流排。
設備700亦包括電腦可讀取媒體714,諸如一或多個記憶體元件,記憶體元件的實例包括隨機存取記憶體(RAM)、非揮發性記憶體(例如,唯讀記憶體(ROM)、快閃記憶體、EPROM、EEPROM等中的任一或多個),以 及磁碟儲存設備。磁碟儲存設備可被實施為任何類型的磁性或光學儲存設備,如硬碟機、可記錄及/或可重寫壓縮光碟(CD)、任何類型的數位多功能光碟(DVD)等等。設備700亦可包括大量儲存媒體設備716。
電腦可讀取媒體714提供資料儲存機制以儲存設備資料704,以及各種設備應用程式718和與設備700的各操作態樣相關的任何其他類型的資訊及/或資料。例如,作業系統720可用電腦可讀取媒體714作為電腦應用程式來維護並且在處理器710上執行。設備應用程式718可以包括設備管理員(例如控制應用程式、軟體應用程式、信號處理和控制模組、原屬於特定設備的代碼、特定設備的硬體抽象層等等),以及其他應用程式,該等其他應用程式可包括網頁瀏覽器、影像處理應用程式、通訊應用程式(諸如即時訊息傳遞應用程式)、文書處理應用程式和各種其他不同的應用程式。設備應用程式718亦包括用於實施在此描述的上下文切換的語音辨識的技術的各實施例的系統元件或模組。
在本實例中,設備應用程式718包括被示為軟體模組及/或電腦應用程式的介面應用程式722和姿勢擷取驅動器724。姿勢擷取驅動器724代表用於提供與被配置成擷取姿勢的設備(如觸控式螢幕、追蹤墊、照相機等)的介面連接的軟體。替代地或另外地,介面應用程式722和姿勢擷取驅動器724可被實施為硬體、軟體、韌體或其任意組合。
設備700亦包括向音訊系統728提供音訊資料及/或向顯示系統730提供視訊資料的音訊及/或視訊輸入-輸出系統726。音訊系統728及/或顯示系統730可包括處理、顯示,及/或以其他方式呈現音訊、視訊和影像資料的任何設備。視訊訊號和音訊信號可以經由RF(射頻)鏈路、S-video(S-視訊)鏈路、複合視訊鏈路、分量視訊鏈路、DVI(數位視訊介面)、類比音訊連接,或其他類似的通訊鏈路,從設備700傳遞到音訊設備及/或顯示設備。在一實施例中,音訊系統728及/或顯示系統730被實施為設備700的外部元件。或者,音訊系統728及/或顯示系統730被實施為示例性設備700的積體元件。
結論
各種實施例提供了用於實現上下文切換的語音辨識的技術。儘管用結構特徵及/或方法動作專用的語言描述了本標的,但可以理解,所附申請專利範圍中定義的標的不必限於上述特定特徵或動作。更確切而言,上述特定特徵和動作是作為實施請求項的示例性形式揭示的。
100‧‧‧操作環境
102‧‧‧計算設備
104‧‧‧應用程式
106‧‧‧輸入/輸出模組
108‧‧‧自然使用者介面(NUI)設備
110‧‧‧語音辨識模組
112‧‧‧上下文模組
114‧‧‧顯示設備
200‧‧‧上下文切換場景
202‧‧‧定製介面
204‧‧‧語音輸入
208‧‧‧上下文選項單
300‧‧‧上下文切換場景
302‧‧‧語音輸入
306‧‧‧比賽介面
400‧‧‧步驟
402‧‧‧步驟
404‧‧‧步驟
406‧‧‧步驟
408‧‧‧步驟
500‧‧‧步驟
502‧‧‧步驟
504‧‧‧步驟
600‧‧‧系統
602‧‧‧電腦
604‧‧‧行動設備
606‧‧‧電視機
608‧‧‧雲端
610‧‧‧平臺
612‧‧‧網路服務
700‧‧‧設備
702‧‧‧通訊設備
704‧‧‧設備資料
706‧‧‧資料輸入
708‧‧‧通訊介面
710‧‧‧處理器
712‧‧‧處理和控制電路
714‧‧‧電腦可讀取媒體
716‧‧‧大量儲存媒體設備
718‧‧‧設備應用程式
720‧‧‧作業系統
722‧‧‧介面應用程式
724‧‧‧姿勢擷取驅動器
726‧‧‧音訊及/或視訊輸入-輸出系統
728‧‧‧音訊系統
730‧‧‧顯示系統
參考附圖來描述詳細描述。在附圖中,元件符號最左邊的數位辨識該元件符號首次出現的附圖。在說明書和附圖的不同實例中使用相同的元件符號可指示相似或相同的項目。
圖1是根據一或多個實施例的可操作採用在此描述的技 術的示例性操作環境的圖示。
圖2是根據一或多個實施例的示例性上下文切換場景的圖示。
圖3是根據一或多個實施例的示例性上下文切換場景的圖示。
圖4是描述根據一或多個實施例的方法中的各步驟的流程圖。
圖5是描述根據一或多個實施例的方法中的各步驟的流程圖。
圖6圖示根據一或多個實施例的包括參考圖1和7描述的計算設備的示例性系統。
圖7圖示可用於實施此處描述的各實施例的示例性計算設備。
100‧‧‧操作環境
102‧‧‧計算設備
104‧‧‧應用程式
106‧‧‧輸入/輸出模組
108‧‧‧自然使用者介面(NUI)設備
110‧‧‧語音辨識模組
112‧‧‧上下文模組
114‧‧‧顯示設備

Claims (21)

  1. 一種用於上下文切換的語音辨識之電腦實施方法,包括以下步驟:回應於一說出的觸發詞的一辨識,在與一應用程式的一應用程式上下文相關聯的一使用者介面中呈現一上下文選項單;基於在其上可執行該應用程式的一設備的一或多個屬性來過濾該應用程式的一組應用程式上下文,以辨識至少一個其它的應用程式上下文,該一或多個屬性包含該設備的一處理能力;呈現該至少一個其他的應用程式上下文以作為該上下文選項單的部分,使得可經由一語音輸入命令而導覽到該至少一個其他的應用程式上下文;在該說出的觸發詞的該辨識之後的一特定的時間間隔內,辨識與該至少一個其他的應用程式上下文相關聯的一上下文詞的一語音輸入;及回應於該特定的時間間隔內之該上下文詞的該語音輸入的該辨識,從與該第一應用程式上下文相關聯的該使用者介面導覽到與該至少一個其他的應用程式上下文相關聯的一使用者介面。
  2. 如請求項1所述之方法,其中該應用程式包括一遊戲應用程式,並且其中與該第一應用程式上下文相關聯的該 使用者介面包括一遊戲功能集,該遊戲功能集係不同於與該至少一個其他的應用程式上下文相關聯的該使用者介面。
  3. 如請求項1所述之方法,其中該設備的該一或多個屬性為一組上下文專用的準則之部分,該組上下文專用的準則係用來決定該至少一個其他的應用程式上下文。
  4. 如請求項3所述之方法,其中該上下文專用的準則進一步包括該應用程式的一或多個屬性或該設備之一使用者的一或多個屬性。
  5. 如請求項4所述之方法,其中該應用程式的該等屬性包含該應用程式的一版本。
  6. 如請求項1所述之方法,其中該設備的該一或多個屬性進一步包含該設備的一網路連接狀態。
  7. 如請求項4所述之方法,其中該使用者的該等屬性包含與該使用者相關聯之用於該應用程式的一帳戶會員等級、與該使用者相關聯的存取許可或該使用者的一年齡中的一或多個。
  8. 如請求項1所述之方法,其中該導覽之步驟是回應於 該辨識並獨立於來自一使用者的附加輸入而發生的。
  9. 一種用於上下文切換的語音辨識之電腦實施方法,包括以下步驟:基於可在其上執行應用程式的一設備的屬性及該設備的一使用者的屬性來過濾一應用程式的一組上下文選項,該設備的該等屬性包含一現有網路連接的一頻寬及該設備的一閾值處理能力,該設備的該等屬性及該使用者的該等屬性表示一組上下文專用的準則,該組上下文專用的準則係用來決定用於該應用程式之不同的應用程式上下文;基於該過濾之步驟來產生一組用於該應用程式之可用的上下文選項,該組可用的上下文選項包含該組上下文選項的一子集;及使該組可用的上下文選項的一或多個可用的上下文選項能被選擇;及回應於經由來自該組可用的上下文選項之一可用的上下文選項的一語音命令的一使用者選擇,而從與該應用程式的一第一上下文相關聯的一使用者介面導覽到與該應用程式的一第二上下文相關聯的一使用者介面;該第一上下文不同於該第二上下文。
  10. 如請求項9所述之方法,其中該過濾之步驟是回應於與該應用程式相關聯的一觸發詞的一語音辨識而發生的。
  11. 如請求項9所述之方法,其中使該組可用的上下文選項的一或多個可用的上下文選項能被選擇之該步驟包含以下步驟:使得一上下文選項單得以顯示,該上下文選項單包括該組可用的上下文選項的該一或多個可用的上下文選項。
  12. 如請求項11所述之方法,其中該使得之步驟包括以下步驟:使得該上下文選項單被作為與該第一上下文相關聯的該使用者介面的部分來顯示。
  13. 如請求項9所述之方法,其中使該組可用的上下文選項的一或多個可用的上下文選項能被選擇之該步驟包括以下步驟:可獨立於被顯示的該一或多個可用的上下文選項來選擇該一或多個可用的上下文選項。
  14. 如請求項9所述之方法,其中該應用程式包括一遊戲應用程式,並且其中與該第一上下文相關聯的該使用者介面與一遊戲功能集相關聯,該遊戲功能集係不同於與該第二上下文相關聯的該使用者介面。
  15. 如請求項9所述之方法,其中該設備的該使用者的該等屬性包含該使用者的一帳戶會員等級、與該使用者相關聯的一存取許可或該使用者的一年齡中的一或多個。
  16. 如請求項9所述之方法,其中該第一上下文或該第二上下文中的一者與遊戲定製功能相關聯,並且其中該第一上下文或該第二上下文中的另一者與玩遊戲功能相關聯。
  17. 一種用於上下文切換的語音辨識之系統,包含:一或多個處理器;及一或多個電腦可讀取儲存媒體,該一或多個電腦可讀取儲存媒體儲存一遊戲應用程式,可由該一或多個處理器執行該遊戲應用程式以使該系統執行操作,該等操作包含以下操作:在一計算設備上顯示與該遊戲應用程式的一第一遊戲上下文相關聯的一使用者介面的同時,接收一觸發詞的一語音輸入的一指示;使用用於該遊戲應用程式的一或多個過濾準則來過濾一組遊戲上下文,以產生一組一或多個可用的遊戲上下文,該一或多個過濾準則包含該計算設備的一或多個屬性,該計算設備的該一或多個屬性包含該計算設備的一處理能力;使得該組一或多個可用的遊戲上下文被作為與該第一遊戲上下文相關聯的該使用者介面的一部分來顯示;及回應於在該觸發詞的該語音輸入之後的一特定的時間間隔內之一或多個可用的遊戲上下文的一語音選擇的一指示來導覽到與該遊戲應用程式的一第二遊戲 上下文相關聯的一使用者介面。
  18. 如請求項17所述之系統,其中該第一遊戲上下文或該第二遊戲上下文中的一者與遊戲定製功能相關聯,並且其中該第一遊戲上下文或該第二遊戲上下文中的另一者與玩遊戲功能相關聯。
  19. 如請求項17所述之系統,其中該過濾準則進一步包含該計算設備的一使用者的一或多個屬性。
  20. 如請求項17所述之系統,其中該過濾準則進一步包括該計算設備之一活動網路連接的一頻寬。
  21. 如請求項17所述之系統,其中該過濾準則進一步包括與一使用者相關聯的用於該遊戲應用程式的一帳戶會員等級、與該使用者相關聯的存取許可或該使用者的一年齡中的一或多者。
TW101133009A 2011-10-10 2012-09-10 用於上下文切換的語音辨識之電腦實施方法及系統 TWI601128B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US13/270,018 US9256396B2 (en) 2011-10-10 2011-10-10 Speech recognition for context switching

Publications (2)

Publication Number Publication Date
TW201320057A TW201320057A (zh) 2013-05-16
TWI601128B true TWI601128B (zh) 2017-10-01

Family

ID=47968193

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101133009A TWI601128B (zh) 2011-10-10 2012-09-10 用於上下文切換的語音辨識之電腦實施方法及系統

Country Status (7)

Country Link
US (1) US9256396B2 (zh)
EP (1) EP2766791B1 (zh)
JP (1) JP2015501441A (zh)
KR (1) KR102078889B1 (zh)
CN (1) CN103019535B (zh)
TW (1) TWI601128B (zh)
WO (1) WO2013055709A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8719714B2 (en) 2009-07-08 2014-05-06 Steelseries Aps Apparatus and method for managing operations of accessories
US9737796B2 (en) 2009-07-08 2017-08-22 Steelseries Aps Apparatus and method for managing operations of accessories in multi-dimensions
US9687730B2 (en) 2013-03-15 2017-06-27 Steelseries Aps Gaming device with independent gesture-sensitive areas
US9423874B2 (en) 2013-03-15 2016-08-23 Steelseries Aps Gaming accessory with sensory feedback device
US9604147B2 (en) 2013-03-15 2017-03-28 Steelseries Aps Method and apparatus for managing use of an accessory
JP6229287B2 (ja) * 2013-04-03 2017-11-15 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
US9530410B1 (en) * 2013-04-09 2016-12-27 Google Inc. Multi-mode guard for voice commands
US20140329589A1 (en) * 2013-05-03 2014-11-06 Steelseries Aps Method and apparatus for configuring a gaming environment
CN105122181B (zh) * 2013-05-16 2018-12-18 英特尔公司 用于基于情景的自然用户接口输入的技术
US9384013B2 (en) * 2013-06-03 2016-07-05 Microsoft Technology Licensing, Llc Launch surface control
US9747899B2 (en) * 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
CN103442138A (zh) * 2013-08-26 2013-12-11 华为终端有限公司 语音控制方法、装置及终端
US9720567B2 (en) * 2014-02-17 2017-08-01 Microsoft Technology Licensing, Llc Multitasking and full screen menu contexts
US9082407B1 (en) * 2014-04-15 2015-07-14 Google Inc. Systems and methods for providing prompts for voice commands
ES2703338T3 (es) * 2014-04-17 2019-03-08 Softbank Robotics Europe Ejecución de aplicaciones de software en un robot
CN104225916A (zh) * 2014-09-25 2014-12-24 苏州乐聚一堂电子科技有限公司 尖锐声音感应游戏系统
JP6259530B2 (ja) * 2014-10-24 2018-01-10 株式会社ソニー・インタラクティブエンタテインメント 制御装置、制御方法、プログラム及び情報記憶媒体
WO2016063621A1 (ja) 2014-10-24 2016-04-28 株式会社ソニー・コンピュータエンタテインメント 制御装置、制御方法、プログラム及び情報記憶媒体
US10293260B1 (en) * 2015-06-05 2019-05-21 Amazon Technologies, Inc. Player audio analysis in online gaming environments
US10019992B2 (en) * 2015-06-29 2018-07-10 Disney Enterprises, Inc. Speech-controlled actions based on keywords and context thereof
US10049666B2 (en) 2016-01-06 2018-08-14 Google Llc Voice recognition system
US20170315849A1 (en) * 2016-04-29 2017-11-02 Microsoft Technology Licensing, Llc Application target event synthesis
US11416212B2 (en) * 2016-05-17 2022-08-16 Microsoft Technology Licensing, Llc Context-based user agent
CN106205612B (zh) * 2016-07-08 2019-12-24 北京光年无限科技有限公司 面向智能机器人的信息处理方法及系统
US10845956B2 (en) 2017-05-31 2020-11-24 Snap Inc. Methods and systems for voice driven dynamic menus
US10547708B2 (en) 2017-10-25 2020-01-28 International Business Machines Corporation Adding conversation context from detected audio to contact records
CN111627436B (zh) * 2018-05-14 2023-07-04 北京字节跳动网络技术有限公司 一种语音控制的方法及装置
US11134308B2 (en) * 2018-08-06 2021-09-28 Sony Corporation Adapting interactions with a television user
KR102563314B1 (ko) * 2018-08-30 2023-08-04 삼성전자주식회사 전자 장치 및 단축 명령어의 바로가기 생성 방법
CN109788360A (zh) * 2018-12-12 2019-05-21 百度在线网络技术(北京)有限公司 基于语音的电视控制方法和装置
CN109847348B (zh) * 2018-12-27 2022-09-27 努比亚技术有限公司 一种操作界面的操控方法及移动终端、存储介质
US11604830B2 (en) * 2020-01-07 2023-03-14 Rovi Guides, Inc. Systems and methods for performing a search based on selection of on-screen entities and real-world entities
US11367444B2 (en) 2020-01-07 2022-06-21 Rovi Guides, Inc. Systems and methods for using conjunctions in a voice input to cause a search application to wait for additional inputs
CN112397069A (zh) * 2021-01-19 2021-02-23 成都启英泰伦科技有限公司 一种语音遥控方法及装置
CN114121013A (zh) * 2021-12-07 2022-03-01 杭州逗酷软件科技有限公司 语音控制方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
US6282269B1 (en) * 1996-03-05 2001-08-28 International Business Machines Corp. Voice mail on the internet
US20060069561A1 (en) * 2004-09-10 2006-03-30 Beattie Valerie L Intelligent tutoring feedback
US20060190270A1 (en) * 2001-05-14 2006-08-24 Sony Computer Entertainment America Inc. Menu-driven voice control of characters in a game environment
CN1864204A (zh) * 2002-09-06 2006-11-15 语音信号技术有限公司 用来完成语音识别的方法、系统和程序

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6021403A (en) 1996-07-19 2000-02-01 Microsoft Corporation Intelligent user assistance facility
US7085710B1 (en) * 1998-01-07 2006-08-01 Microsoft Corporation Vehicle computer system audio entertainment system
JP2000076085A (ja) * 1998-08-28 2000-03-14 Nec Software Kobe Ltd 情報処理装置とリソース不足通知方法および記録媒体
TW495710B (en) * 1998-10-15 2002-07-21 Primax Electronics Ltd Voice control module for control of game controller
JP2000148177A (ja) * 1998-11-06 2000-05-26 Harness Syst Tech Res Ltd 車載用操作入力装置および入力方法
JP2000181676A (ja) * 1998-12-11 2000-06-30 Nintendo Co Ltd 画像処理装置
US6937984B1 (en) * 1998-12-17 2005-08-30 International Business Machines Corporation Speech command input recognition system for interactive computer display with speech controlled display of recognized commands
US6862347B1 (en) * 1999-01-28 2005-03-01 Siemens Communications, Inc. Method and apparatus for extending a telephone's capabilities
JP4292646B2 (ja) * 1999-09-16 2009-07-08 株式会社デンソー ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
US6554707B1 (en) 1999-09-24 2003-04-29 Nokia Corporation Interactive voice, wireless game system using predictive command input
JP3343099B2 (ja) * 2000-03-08 2002-11-11 株式会社コナミコンピュータエンタテインメント大阪 キャラクタ育成制御プログラムを記録したコンピュータ読み取り可能な記録媒体
US6785653B1 (en) 2000-05-01 2004-08-31 Nuance Communications Distributed voice web architecture and associated components and methods
US20020023265A1 (en) 2000-08-08 2002-02-21 Metcalf Darrell J. Wireless controller with publicly-accessible communications link for controlling the content seen on large-screen systems
US7162426B1 (en) * 2000-10-02 2007-01-09 Xybernaut Corporation Computer motherboard architecture with integrated DSP for continuous and command and control speech processing
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US20030182394A1 (en) 2001-06-07 2003-09-25 Oren Ryngler Method and system for providing context awareness
US7369997B2 (en) * 2001-08-01 2008-05-06 Microsoft Corporation Controlling speech recognition functionality in a computing device
US7720683B1 (en) * 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
JP2005080385A (ja) * 2003-08-29 2005-03-24 Toshiba Corp 情報処理装置及び情報処理装置のバッテリ残容量表示方法
US20060041926A1 (en) 2004-04-30 2006-02-23 Vulcan Inc. Voice control of multimedia content
US7408886B2 (en) * 2004-09-20 2008-08-05 Sony Ericsson Mobile Communication Ab Method for providing mobile phone user with accurate capability indicator
US8825482B2 (en) * 2005-09-15 2014-09-02 Sony Computer Entertainment Inc. Audio, video, simulation, and user interface paradigms
US20070288890A1 (en) 2006-05-17 2007-12-13 Ipreo Holdings, Inc. System, method and apparatus to allow for a design, administration, and presentation of computer software applications
US8751672B2 (en) * 2006-06-21 2014-06-10 Verizon Data Services Llc Personal video channels
WO2008084575A1 (ja) * 2006-12-28 2008-07-17 Mitsubishi Electric Corporation 車載用音声認識装置
US7822608B2 (en) 2007-02-27 2010-10-26 Nuance Communications, Inc. Disambiguating a speech recognition grammar in a multimodal application
US8538757B2 (en) 2007-05-17 2013-09-17 Redstart Systems, Inc. System and method of a list commands utility for a speech recognition command system
US20090013275A1 (en) 2007-07-05 2009-01-08 Darrell May System and method for quick view of application data on a home screen interface triggered by a scroll/focus action
US8825468B2 (en) * 2007-07-31 2014-09-02 Kopin Corporation Mobile wireless display providing speech to speech translation and avatar simulating human attributes
KR100884765B1 (ko) * 2007-12-06 2009-02-23 주식회사 드리머 서비스 제공 환경 분석 기반 메뉴 디스플레이 방법과 이를실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한기록 매체
US8140335B2 (en) * 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US8117551B2 (en) 2007-12-18 2012-02-14 International Business Machines Corporation Computer system and method of using presence visualizations of avatars as persistable virtual contact objects
US8358302B2 (en) 2008-04-22 2013-01-22 International Business Machines Corporation Dynamic creation of virtual regions
US8224653B2 (en) * 2008-12-19 2012-07-17 Honeywell International Inc. Method and system for operating a vehicular electronic system with categorized voice commands
US8196174B2 (en) * 2008-12-23 2012-06-05 At&T Intellectual Property I, L.P. Navigation method and system to provide a navigation interface
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
KR101612788B1 (ko) 2009-11-05 2016-04-18 엘지전자 주식회사 이동 단말기 및 그 제어 방법
US8676581B2 (en) * 2010-01-22 2014-03-18 Microsoft Corporation Speech recognition analysis via identification information
US8700594B2 (en) * 2011-05-27 2014-04-15 Microsoft Corporation Enabling multidimensional search on non-PC devices
US8657680B2 (en) * 2011-05-31 2014-02-25 United Video Properties, Inc. Systems and methods for transmitting media associated with a measure of quality based on level of game play in an interactive video gaming environment
US8972409B2 (en) * 2011-07-27 2015-03-03 Google Inc. Enabling search for conversations with two messages each having a query team

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
US6282269B1 (en) * 1996-03-05 2001-08-28 International Business Machines Corp. Voice mail on the internet
US20060190270A1 (en) * 2001-05-14 2006-08-24 Sony Computer Entertainment America Inc. Menu-driven voice control of characters in a game environment
CN1864204A (zh) * 2002-09-06 2006-11-15 语音信号技术有限公司 用来完成语音识别的方法、系统和程序
US20060069561A1 (en) * 2004-09-10 2006-03-30 Beattie Valerie L Intelligent tutoring feedback

Also Published As

Publication number Publication date
KR20140082790A (ko) 2014-07-02
WO2013055709A1 (en) 2013-04-18
TW201320057A (zh) 2013-05-16
US9256396B2 (en) 2016-02-09
KR102078889B1 (ko) 2020-04-02
US20130090930A1 (en) 2013-04-11
CN103019535A (zh) 2013-04-03
CN103019535B (zh) 2016-12-21
EP2766791A1 (en) 2014-08-20
EP2766791A4 (en) 2015-03-18
JP2015501441A (ja) 2015-01-15
EP2766791B1 (en) 2017-05-31

Similar Documents

Publication Publication Date Title
TWI601128B (zh) 用於上下文切換的語音辨識之電腦實施方法及系統
CN109196464B (zh) 基于上下文的用户代理
US10191633B2 (en) Closing applications
JP6151242B2 (ja) イマーシブアプリケーションとしてのデスクトップ
US10417018B2 (en) Navigation of immersive and desktop shells
US9720567B2 (en) Multitasking and full screen menu contexts
US20130014053A1 (en) Menu Gestures
CN103649902B (zh) 沉浸式和桌面外壳的显示
JP2017523515A (ja) アイコンサイズ変更
JP2013528304A (ja) ジャンプ、チェックマーク、および取消し線のジェスチャー
US20110304649A1 (en) Character selection
KR20170042338A (ko) 혼합 뷰에의 제스처 기반 액세스
RU2600544C2 (ru) Навигационный пользовательский интерфейс с поддержкой сосредоточенного на странице восприятия просмотра на основе распознавания прикосновений или жестов
KR20140109926A (ko) 입력 포인터 지연 기법
US8769169B2 (en) Assistive buffer usage techniques
KR20160144445A (ko) 확장가능한 애플리케이션 표시, 마일스톤, 및 스토리라인
KR102692416B1 (ko) 자기주도 학습 방법, 전자 장치 및 컴퓨터 판독 가능 저장 매체
TW201346644A (zh) 控制項展示

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees