TWI296793B - Speech recognition assisted autocompletion of composite characters - Google Patents

Speech recognition assisted autocompletion of composite characters Download PDF

Info

Publication number
TWI296793B
TWI296793B TW095114967A TW95114967A TWI296793B TW I296793 B TWI296793 B TW I296793B TW 095114967 A TW095114967 A TW 095114967A TW 95114967 A TW95114967 A TW 95114967A TW I296793 B TWI296793 B TW I296793B
Authority
TW
Taiwan
Prior art keywords
character
user
list
characters
input
Prior art date
Application number
TW095114967A
Other languages
English (en)
Other versions
TW200707404A (en
Inventor
Colin Blair
Kevin Chan
Christopher R Gentle
Neil Hepworth
Andrew W Lang
Original Assignee
Avaya Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Avaya Technology Corp filed Critical Avaya Technology Corp
Publication of TW200707404A publication Critical patent/TW200707404A/zh
Application granted granted Critical
Publication of TWI296793B publication Critical patent/TWI296793B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/038Indexing scheme relating to G06F3/038
    • G06F2203/0381Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

1296793 (1) 九、發明說明 【發明所屬之技術領域】 本發明係關於合成字元的登錄,特別地本發明藉由手 動使用者輸入和語音辨識之組合以精細地刪減待選單字或 字元之表列,而有助於將單字或字元登錄至通訊或計算裝 置中。 【先前技術】 現在市售的行動通訊和計算裝置能夠進行各種廣泛的 功能,逐漸增加地此功能需要文字的登錄或受惠於其中。 例如:用於連接行動電話的文字訊息服務目前正廣泛地使 用。如另一實例,使用可攜帶式裝置連接電子郵件的應用 正在增加中。然而,在可攜帶裝置上鍵盤可用的空間受到 極大的限制,所以將文字登錄進入此類裝置可能很困難。 此外,某些語言所使用的符號也很難輸入,即使是連接至 較大的桌上型通訊或計算裝置也不容易。 爲了有助於單字或字元的登錄,特別是使用一可攜帶 電話或其他裝置的小型鍵盤,可以適用自動完成的特性。 此特性能夠將一表列的待選單字或字元呈現於使用者,以 回應接收到來自一使用者的一啓始組輸入。這些輸入可以 包括指定一單字的前幾個字母或一字兀的則幾筆劃’比如 中文字。然而,因爲呈現的表列可能會非常冗長’對於使 用者想要快速地找到所欲的單字或字元會很困難° 爲了解決具有一冗長表列的自動完成待選字之問題, -5- (2) 1296793 能夠提供一表列的待選單字或字元是根據其使用頻率來排 序的系統已經問市。將這些待選字根據其出現頻率來排序 可以降低使用者轉動整個表列待選字的需要。然而,要以 敏感的方式排列一表列的待選單字或字元就可能很困難。 此外,當使用者找尋一罕見的單字或字元時,想必無法節 省時間或只節省一點點而已。 由使用者手動輸入爲一解決方式時,聲音或語音辨識 φ 系統可以適用於輸入文字或啓動指令。然而,此類系統的 精確度常常與所希望的結果有所差距,即使經過使用者訓 練和校正之後。還有,一套功能完整的語音辨識系統通常 會需要行動通訊或計算裝置,例如··行動電話上比較無法 提供的處理和記憶資源。結果,適用於連接行動裝置的語 音辨識功能常是基本型,並且只是啓動以辨識一種語言中 少量次級的口語單字。此外,行動裝置上的語音辨識通常 受限於啓動清單指令,比如存取地址簿以及外撥一選取的 φ 號碼。 【發明內容】 本發明有關於解決習知技術中上述和其他方面的缺點 。根據本發明之實施例,語音辨識是用於過濾或縮減待選 合成字元之表列,比如單字(例如:關於英文字)或字元 (例如:關於中文字)。特別地,接著在使用者手動輸入 一個字母、一筆劃,或被輸入單字或字元的字形之後,該 使用者可以說出該字元。然後,語音辨識軟體就嘗試從該 -6- (3) 1296793 待選表列中消除與說出的單字或字元發音不同的單字或字 元。據此,即使一個相當基本的語音辨識應用也能夠有效 地至少從該待選表列中消除一些單字或字元。再者’藉由 先提供一個字母、一個單字或字元的一筆劃或其他部分’ 經由選擇或輸入該部份,適用或待選的單字或字元之範圍 係被界定完成較爲狹隘,其能夠降低語音辨識應用所需要 的精確度,以進一步地減小範圍,(即縮減該待選表列) 或正確地識別該使用者所欲輸入的單字或字元。 【實施方式】 根據本發明之實施例,一個單字或字元可以包括在一 表列的單字或字元(在此統合稱爲 > 字元〃)內,準備好 供使用者選擇以回應使用者輸入顯示包括在一所欲字元內 之一單字或字元的一特定部分,比如一字母(例如:是英 文字的情況),或一筆劃或字形(例如:是中文字的情況 φ )。此外,該表列的字元可以對應於從使用者輸入的語音 而縮減。特別地,爲回應從使用者輸入語音的接收可以用 於識別相關(或無關)於所接收語音之該待選表列中的字 元,而改變該待選表列的內容。尤其’提供一較短的表列 待選單字或字元,或者識別一確實的字元,經由利用使用 者輸入該所欲字元的一部分與接收使用者發聲該所欲字元 輸入的語音辨識之組合,有助於字元的登錄。 現在參考圖1,以方塊圖形式繪製根據本發明之實施 例中一通訊或記算裝置1 00的組件。該組件包括一處理器 (4) 1296793 1 04,能夠執行程式指令。尤其該處理器1 04可以包括任 何一般目的的可程式化處理器或控制器,用於執行應用程 式。或者該處理器1 04可以包括一特別架構的應用特定積 體電路(ASIC )。該處理器104通常具有執行程式碼的 功能,以執行該通訊或計算裝置1 00要進行的各種功能, 包括如上所述的單字或字元選擇操作。 一通訊或計算裝置1 00可以額外包括記憶體1 08,用 φ 於與該處理器1 04執行的程式連接以及用於暫時或長期儲 存資料或程式指令。該記憶體1 08可以包括固態記憶體位 置、可移除的或在遠端的性質,比如DRAM和SDRAM。 而該處理器104包括一控制器的情況,該記憶體108可以 整合至該處理器104。 此外,該通訊或計算裝置1 00包括一或多個使用者輸 入112和一或多個使用者輸出116。使用者輸入112的實 例包括鍵盤、小型鍵盤、觸控螢幕輸入、以及麥克風,使 φ 用者輸出Π 6的實例包括喇叭、顯示螢幕(包含觸控螢幕 顯示器)、以及指示燈。還有,本技術領域中的技術人員 應該理解到,使用者輸入1 1 2可以與一項使用者輸出1 1 6 組合或連結操作。此一整合的使用者輸入1 1 2與使用者輸 出1 1 6之實例爲一觸控螢幕顯示器,能夠同時將視覺資訊 呈現於一使用者,並且接收來自一使用者的輸入選擇。 一通訊或計算裝置100也可以包括資料儲存器120, 用於儲存應用程式和/或資料。此外,作業系統軟體1 24 可以儲存在該資料儲存器120內。該資料儲存器120可以 -8- (5) 1296793 包括例如··一磁性儲存裝置、一固態儲存裝置、一光學儲 存裝置、一邏輯電路、或此裝置的任何組合。應該進一步 理解到,能夠保持在該資料儲存器1 20內的程式和資料可 以包括軟體、軔體、或硬體/邏輯,隨該資料儲存器1 20的 特殊執行而定。 可以儲存在該資料儲存器1 20內的應用之實例包括語 音辨識應用128與單字或字元選擇應用132。此外,該資 φ 料儲存器120可以包含一表格或一資料庫的待選單字或字 元134。如上所述,一語音辨識應用128、字元選擇應用 132、和/或表格的待選單字或字元134,可以彼此互相 整合和/或彼此共同操作。該資料儲存器1 2 0也可以包含 用於連接該通訊或計算裝置1 00的其他功能品質之應用程 式和資料。舉例而言,關於通訊或計算裝置丨〇〇 (比如行 動電話),該資料儲存器可以包括通訊應用軟體。另一實 例,一通訊或計算裝置1 0 0,比如一個人數位助理(p D A φ )或一般功能的電腦可以包括一文字處理應用和資料儲存 器12 0。此外,根據本發明之實施例,一語音辨識應用 128和/或字元選擇應用132可以與通訊應用軟體、文字 處理軟體、或能夠接收由使用者鍵入或選擇的單字或字元 當做輸入之其他應用共同操作。 一通訊或計算裝置1 00也可以包括一或多個通訊網路 介面1 3 6。通訊網路介面的實例包括行動電話無線電收發 器、一網路介面卡、一數據交換機、一行動電話埠、一串 聯或並聯的資料埠 '或其他有線或無線的通訊網路介面。 •9- (6) 1296793 現在參考圖2,繪製的是一通訊或計算裝置loo包括 一 丫了動電話200。該行動電話200 —般包括一使用者輸入 1 12,含有一數字的小型鍵盤204 '游標控制鈕208、輸入 鈕212、以及麥克風214。此外,該行動電話200包括使 用者輸出含有視覺顯示器2 1 6,比如一彩色或單色的液晶 顯示器(LCD)和喇叭220。 於文字輸入或選擇模組時,根據本發明之實施例,使 0 用者能夠致使包含一或多個單字或字元的一部分或完整表 列呈現在該顯示器螢幕216上,以回應包含使用者經由該 小型鍵盤204輸入的特定字母、筆劃、或字形之輸入。如 本技術領域中技術人員可以理解到,包括在該小型鍵盤內 的每一個按鍵可以關聯數個字母或字元形狀以及其他符號 。例如:圖2中的小型鍵盤204是以按鍵2至9與三個( 有時是四個)字母2 2 4產生關聯。此外,圖2實例中的小 型鍵盤204是以按鍵2至9與三個(在一情況是四個)中 φ 文字根目錄2 2 8產生關聯。如本技術領域中的一般人員理 解到,此類字根可以從連接到包含完整中文字的確定形狀 中選擇出來,例如:利用五筆字型形狀爲主的方法繼續完 成中文字。此外,選擇該些字根之一可以使相關的字根備 用以容許該使用者選定具有特性的一所欲字形。尤其,使 用者可以藉由按下或輕敲與所欲字母或字形相關的按鍵多 次,以選擇包括在該小型鍵盤204內與一特定按鍵關聯的 一個字母或字形。 接著,由視覺顯不器2 1 6上顯示至少部分由選擇字母 -10- (7) 1296793 或字形結果所產生的表列之待選字元。假如該表 而不能便利地完全呈現於該顯示器2 1 6上,該游 或某個其他輸入1 1 2可以用於捲動該完整的表列 鈕208或其他輸入112也可以用來連接選擇一所 ,例如:利用游標鈕208或其他輸入1 1 2以強調 表列中該所欲的字元,然後例如:以按下輸入鈕 擇該字元。此外,如所敘述該表列的待選字元能 φ 用者經由麥克風214提供至該裝置100的語音, 置1 〇〇例如:經過語音辨識應用1 2 8處理後而縮 ,該語音辨識應用1 2 8的功能在於與字元選擇應 合,如此該語音辨識應用1 2 8嘗試識別包括在該 應用132於回應手動或其他使用者輸入指定的該 之一部分所產生的表列中字元,而不是嘗試識別 語音辨識應用1 28字彙內的所有單字。 參考圖3,呈現根據本發明之實施例中提供 φ 輔助完成字元,比如英文單字或中文字的一通訊 置100之操作方面。首先步驟300中,使用者輸 一文字登錄模組,例如:其中該裝置1 00包括一 200、一文字登錄模組可以包括啓始一文字訊息 組。步驟3 04中,要決定是否使用者輸入以手動 字或字元的一部分(例如:一字母、筆劃、或字 收。一般來說,本發明之實施例是與接收如此來 輸入連接而操作,以產生該啓始表列的待選字元 所選擇一字元的一部分之後,即產生含有該選擇 列足夠長 標鈕2 1 8 。該游標 欲的字元 所顯示的 212來選 夠根據使 再以該裝 減。還有 用1 3 2組 字元選擇 所欲字元 包括在該 語首辨識 或計算裝 入或選擇 行動電話 應用或模 選擇一單 形)被接 自使用者 。接收到 部分的一 -11 - (8) 1296793 表列待選字元(步驟3 Ο 8 )。然後,至少該表列的待選字 元之一部分顯示給使用者(步驟3 1 2 )。如本技術領域中 一般技術人員能夠理解到,該表列的待選字元可能十分長 ’特別是僅指定一單一部分的情況。因此該顯示器,比如 一行動電話200的液晶顯示器2 1 6,就只能夠顯示該表列 待選字元的一小部分。於任何一個時刻只能顯示該表列待 選字元的一部分時,使用者會捲動其表列來找尋所欲的字 •元° 然後,使用者可以選擇藉由提供語音輸入來縮減該待 選表列’因此要決定是否接收來自使用者的語音輸入並且 辨識當做代表或與一待選字元的發音相關(步驟3 20 )。 特別地,例如:經由一麥克風2 1 4接收到的語音可以由語 音辨識應用1 2 8分析,以決定是否吻合一待選字元。假如 是吻合的,就產生一修改的待選字元表列(步驟3 24 )。 如本技術領域中一般技術人員所理解,即使一基本的語音 • 辨識應用1 28能夠肯定地從該表列中識別一單一字元,特 別當該表列是受限於所接收到包括在該使用者想要輸入的 字元之一或多個部分。也如本技術領域中一般技術人員所 理解,一語音辨識應用1 28能夠降低一表列的待選字元之 長度,即使並不能從該表列中識別一特定的字元。例如: 當語音辨識應用1 28能夠將一使用者的語音輸入關聯該表 列的待選字元之次集合,該修改的表列可以包括字元的次 集合。因此,一語音辨識應用1 2 8的功能在於從一表列中 消除那些口語發音不同於該所欲單字或字元的口語發音之 -12- Ϊ296793 Ο) 胃字或字元。所以,一使用者必須(至少在此時)搜尋而 能找到一所欲單字或字元的數目就降低了。然後,至少一 部分之該修改的表列顯示呈現給該使用者(步驟3 2 8 )。 @如修改的表列包含太多待選的字元要同時顯示於一使用 者輸出1 1 6,比如一液晶顯示器2 1 6,使用者可以再次捲 動該表列。 步驟3 3 2中,可以再次決定是否該使用者已經選擇該 φ 待選字元中之一。此決定可以在該使用者決定還沒有提供 語音以能夠產生該表列的待選字元之後,或者在步驟3 2 8 中產生一修改的表列待選字元之後。假如該使用者已經選 擇一表列的字元,此過程即結束。然後該使用者可以離開 文字模組,或開始選擇下一個字元的步驟。 假如該使用者還沒有選擇一表列的字元,該過程可以 回到步驟3 04,於此點上該使用者可以輸入一額外的部分 ,比如一額外的字母、筆劃、或字形,然後在步驟3 0 8產 φ 生的該表列字元包括一修改的表列字元,以反映由該使用 者目前所指定的額外部分。例如:一使用者已經指定兩個 字母或字形,而這些字母或字形就被要求在每一個表列的 字元內。然後,將完成的表列呈現出來,至少是部分(步 驟3 1 2 )。步驟3 1 2將該修改的表列顯示給使用者之後, 該使用者可以嘗試提供語音輸入爲能進一步降低表列中待 選字元的數目(步驟3 20 )。因此,在步驟3 3 2假如該使 用者沒有選擇一個表列的字元,該使用者就可以決定不要 提供步驟3 1 2中以該所欲合成字元的一額外部分爲形式之 -13- (10) 1296793 額外輸入,而以進行步驟320取代,藉由提供語音輸入進 行另一嘗試減縮該表列的待選字元。假如提供額外的語音 輸入,該輸入就可以用於產生一修改的表列待選字元(步 驟3 24 ),並且修改的表列能夠至少有部分顯示給該使用 者(步驟3 2 8 )。因此,應該理解到能夠進行多次重複指 定一單字或字元的部分,和/或提供語音以識別一所欲的 單字或字元,或是至少降低該表列的待選字元之長度。 φ 現在參考圖4A至4C,繪製根據本發明之實施例中以 連接可以提供至一使用者的視覺輸出之操作。特別地,繪 製一裝置100的顯示螢幕216包括一行動電話200,於一 中文文字登錄模組。如圖4A所示,該使用者可以選擇一 所欲字元的一或多個筆劃404。選擇筆劃404可以輕壓包 括在該鍵盤內與形成該使用者想要指定的字元中第一筆劃 相關之按鍵進行。 因爲中文字是由八種基本筆劃形成’也因爲使用的中 φ 文字有好幾千個,指定一個所欲字元的兩筆劃通常會致使 產生一個長長表列的待選字元。圖4B呈現本實例中所指 定以筆劃404開始的表列406a之一部分待選字元408a至 4 0 8 d。第一個字元4 0 8 a的發音約是 ''年〃,第二個字元 40 8b的發音約是、、和〃,第三個字408c的發音約是、我 ",以及第四個字4 0 8 d的發音約是 ''生〃。從此表列中 ,該使用者想要的是第三個字元40 8 c。根據本發明之實 施例,該使用者可以經由發聲唸出該所欲的字元從該表列 的待選字元中選出。因此,該使用者可以發音讀出第三個 -14- 1296793 (11) 字408c,致使該表列修改得到只包含字元408c,如圖4C 所示。然後,該使用者可以確認該語音辨識應用1 28的執 行或與該行動電話200的關聯,已經正確地縮減該表列至 該字元,再輕敲輸入鈕212或是輸入選擇該字元。所以應 該理解到,根據本發明之實施例中手動登錄一字元的一部 分與語音辨識步驟之組合,有助於一使用者選擇由許多筆 劃組成的字元。此外,只需要簡單地輸入這些筆劃中至少 φ 之一,以及然後發聲唸出該所欲字元就能夠完成。此組合 的優點在於即使該語音辨識應用1 28並不夠精準足以從該 字元的讀音中單獨辨別出所欲的字元,但也能夠分辨看似 相同而發音卻很不一樣的字元。 此外,即使該語音辨識軟體1 28不能從其口語發聲並 參考因回應一或多個手動輸入筆劃所產生的該表列待選字 元,而辨別該所欲字元,也應該能夠縮減該表列的待選字 元。例如:當圖4B顯示的該表列待選字元運作時,該語 Φ 音辨識軟體1 28無法根據該使用者的語音輸入分辨該第二 4 08b ( 和〃)與該第三408c ( '、我〃)字元的差別。 然而,語音輸入應該容許該語音辨識軟體1 2 8得以消除該 第一 408a ( ''年〃)與該第四408 d (、生〃)待選字元 。因此,經由本發明之實施例中手動輸入與語音辨識的組 合,該表列的待選字元就可以縮減至該第二408b和第三 408c字元,如圖4D中表列406b所示。然後,該使用者 可以從該縮減的表列406b藉由例如:使用該游標控制鈕 208強調該字元並壓下該輸入鈕212,以選擇所欲的字元 -15- 1296793 (12) 雖然在此所敘述本發明之實施例中,某些實例是討論 藉手動輸入經由一所欲單字或字元的一或多個部分之一小 型鍵盤內按鍵’和/或選擇一所欲的單字或字元之方式, 但本發明之實施例並不受限於此。例如:手動登錄可以在 一觸控螢幕顯示器選擇,或在觸控螢幕顯示器的一書寫區 域寫下一所欲的部分來進行。如進一步的實例,該啓始( φ 或後續)的選擇一單字或字元中一或多個部分,不需要經 由手動登錄進行。比方一使用者可以發唸出該所欲部分的 名稱,以產生一表列的單字或字元,然後再發聲唸出該所 欲的單字或字元以縮減該表列。此外,本發明之實施例具 有的應用可以連接至選擇和/或登錄任何語言的文字,其 中具有 ''字母順序〃或單字或符號的組成部分是超過正常 通訊或計算裝置鍵盤所能夠簡易代表的。 本發明先前的討論是以呈現和敘述爲目的。此外,這 φ 些敘述的用意不在於將本發明限制在已揭示的形式內。因 此,上述內容的各種變化和修改,對於相關技術領域的技 術或知識內爲等同份量,且都在本發明的範圍之內。以上 所敘述實施例的用意進一步地解釋實施本發明所知的最佳 模式,使得本技術領域中其他技術人員能夠利用本發明於 此或其他實施例,並以其特殊應用或使用本發明所需要的 各種修改。所附專利申請項的建構用意在於包括各種實施 例至習知技術容許的範圍內。 •16- 1296793 (13) 【圖式簡單說明】 圖1是根據本發明之實施例中一通訊或計算裝置的組 件之一方塊圖; 圖2根據本發明之實施例繪製一通訊裝置; 圖3根據本發明之實施例中操作一語音辨識輔助的自 動完成處理之繪製流程圖;以及 圖4A至4D根據本發明之實施例繪製一範例的顯示 【主要元件符號說明】 1〇〇 ’ 2 00 :通訊或計算裝置(行動電話) 104 :處理器 1〇8 :記憶體 1 '1 2 :使用者輸入 Π 6 :使用者輸出 120 :資料儲存器 124 :作業系統軟體 128 :語音辨識應用 132:單字或字元選擇應用 134:待選單字或字元表 1 3 6 :通訊網路介面 2 0 4 :(數字)小型鍵盤 208 :游標控制鈕 2 1 2 :輸入鈕 -17- (14) 1296793 214 : 216 : 2 20 : 麥克風 顯示器(螢幕) 喇叭
-18-

Claims (1)

  1. (1) (1),1296793 十、申請專利範圍 1· 一種用於指定一書寫字元的方法,包括: 接收至少一第一字元部分的選擇; 產生含有該第一選擇部分之一第一表列的待選字元; 接收來自一使用者的第一語音輸入;以及 利用來自一使用者的該第一語音輸入,修改該第一表 列的待選字元,其中產生一第二表列的待選字元。 2.如申請專利範圍第1項之方法,其中該第一語音 輸入包括對應於一所欲字元的發音之語音。 3 .如申請專利範圍第2項之方法’其中對該第一表 列之該修改包括移除不對應於該所欲字元的該發音之字元 〇 4. 如申請專利範圍第1項之方法,進一步包括: 接收來自一使用者的一第二語音輸入’其中修改該第 二表列,而且其中產生一第三表列的待選字元。 5. 如申請專利範圍第1項之方法,進一步包括: 接收一第二字元部分的選擇; 利用該第二選擇部分,修改該第二表列的待選字元, 其中產生一第三表列的待選字元。 6. 如申請專利範圍第1項之方法’進一步包括: 接收來自該第二表列的該些字元中之一的選擇。 7 ·如申請專利範圍第1項之方法,其中該第一字元 部分包括一英文單字的一第一個字母與一中文字元的一第 筆劃其中之一。 -19- (2) 1296793 8 ·如申請專利範圍第7項之方法’進一步包括·· 接收一中文字元之一第二筆劃的選擇,其中該產生一 第一表列包括產生含有該些選擇的第一和第二筆劃之一第 一表列的中文字元。 9. 一種用於選擇一字元的裝置,包括: 用於接收來自一使用者之輸入的機制; 用於儲存複數個字元之與一或多個字元部分的關聯之 機制, 用於針對包括在該複數個字元內的數個字元儲存一字 元與該字元之發音之間的關聯之機制; 用於回應包括至少一第一字元部分的使用者輸入而產 生選擇自該複數個字元之一第一表列的待選字元之機制; 用於回應包括一所欲字元的發音之使用者輸入而修改 該第一表列的待選字元以形成一第二表列的待選字元之機 制。 10·如申請專利範圍第9項之裝置,其中用於接收來 自一使用者之輸入的該機制包括用於接收來自一使用者的 手動輸入之機制。 11. 如申請專利範圍第9項之裝置,其中用於接收來 自一使用者之輸入的該機制包括用於接收來自一使用者的 語音輸入之機制。 12. 如申請專利範圍第9項之裝置,進一步包括: 用於提供視覺輸出至一使用者的機制,其中顯示該第 一表列的待選字元之至少一部分。 -20-
TW095114967A 2005-06-28 2006-04-26 Speech recognition assisted autocompletion of composite characters TWI296793B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/170,302 US20060293890A1 (en) 2005-06-28 2005-06-28 Speech recognition assisted autocompletion of composite characters

Publications (2)

Publication Number Publication Date
TW200707404A TW200707404A (en) 2007-02-16
TWI296793B true TWI296793B (en) 2008-05-11

Family

ID=37568664

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095114967A TWI296793B (en) 2005-06-28 2006-04-26 Speech recognition assisted autocompletion of composite characters

Country Status (6)

Country Link
US (1) US20060293890A1 (zh)
JP (1) JP2007011358A (zh)
KR (1) KR100790700B1 (zh)
CN (1) CN1892817A (zh)
SG (1) SG128545A1 (zh)
TW (1) TWI296793B (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060143007A1 (en) * 2000-07-24 2006-06-29 Koh V E User interaction with voice information services
US8413069B2 (en) * 2005-06-28 2013-04-02 Avaya Inc. Method and apparatus for the automatic completion of composite characters
US8249873B2 (en) 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
KR100654183B1 (ko) * 2005-11-07 2006-12-08 한국전자통신연구원 음성 인식을 이용한 문자 입력 시스템 및 그 방법
US7991613B2 (en) * 2006-09-29 2011-08-02 Verint Americas Inc. Analyzing audio components and generating text with integrated additional session information
US8457946B2 (en) * 2007-04-26 2013-06-04 Microsoft Corporation Recognition architecture for generating Asian characters
US8504349B2 (en) * 2007-06-18 2013-08-06 Microsoft Corporation Text prediction with partial selection in a variety of domains
US20090287626A1 (en) * 2008-05-14 2009-11-19 Microsoft Corporation Multi-modal query generation
US20090287064A1 (en) * 2008-05-15 2009-11-19 Medical Interactive Education, Llc Computer implemented cognitive self test
US9542438B2 (en) * 2008-06-17 2017-01-10 Microsoft Technology Licensing, Llc Term complete
US8356041B2 (en) * 2008-06-17 2013-01-15 Microsoft Corporation Phrase builder
JP4645708B2 (ja) * 2008-09-10 2011-03-09 株式会社デンソー コード認識装置および経路探索装置
US8316296B2 (en) 2008-10-01 2012-11-20 Microsoft Corporation Phrase generation using part(s) of a suggested phrase
US20100149190A1 (en) * 2008-12-11 2010-06-17 Nokia Corporation Method, apparatus and computer program product for providing an input order independent character input mechanism
JP5033843B2 (ja) * 2009-06-30 2012-09-26 クラリオン株式会社 名称検索装置
US8494852B2 (en) 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US20110184736A1 (en) * 2010-01-26 2011-07-28 Benjamin Slotznick Automated method of recognizing inputted information items and selecting information items
US8831940B2 (en) * 2010-03-30 2014-09-09 Nvoq Incorporated Hierarchical quick note to allow dictated code phrases to be transcribed to standard clauses
JP5587119B2 (ja) * 2010-09-30 2014-09-10 キヤノン株式会社 文字入力装置、その制御方法、及びプログラム
EP2581816A1 (en) * 2011-10-12 2013-04-17 Research In Motion Limited Apparatus and associated method for modifying media data entered pursuant to a media function
KR101400073B1 (ko) * 2012-07-20 2014-05-28 주식회사 제이엠산업 후보 단어 또는 후보 한자가 제시되는 터치스크린을 이용한 중국어 입력 방법
CN103903618B (zh) * 2012-12-28 2017-08-29 联想(北京)有限公司 一种语音输入方法及电子设备
CN104346052A (zh) * 2013-07-25 2015-02-11 诺基亚公司 用于输入汉字的方法和装置
KR20160056548A (ko) 2014-11-12 2016-05-20 삼성전자주식회사 질의 응답을 위한 디스플레이 장치 및 방법
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
EP3089159B1 (en) 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
CN104850335B (zh) * 2015-05-28 2018-01-23 瞬联软件科技(北京)有限公司 基于语音输入的表情曲线生成方法
CN104834750B (zh) 2015-05-28 2018-03-02 瞬联软件科技(北京)有限公司 一种文字曲线生成方法
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US9886433B2 (en) * 2015-10-13 2018-02-06 Lenovo (Singapore) Pte. Ltd. Detecting logograms using multiple inputs
US10049655B1 (en) 2016-01-05 2018-08-14 Google Llc Biasing voice correction suggestions
US9971758B1 (en) * 2016-01-06 2018-05-15 Google Llc Allowing spelling of arbitrary words
AU2017234428B2 (en) * 2016-03-14 2020-04-09 Apple Inc. Identification of voice inputs providing credentials
US10446143B2 (en) * 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN106873798B (zh) * 2017-02-16 2021-03-19 北京百度网讯科技有限公司 用于输出信息的方法和装置
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN113383340A (zh) 2018-08-29 2021-09-10 艾伊派托利 专利文献撰写装置、方法、计算机程序、计算机可读记录介质、服务器及系统
US11810578B2 (en) 2020-05-11 2023-11-07 Apple Inc. Device arbitration for digital assistant-based intercom systems

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5589198A (en) * 1985-07-31 1996-12-31 943038 Ontario, Inc. Treatment of iodine deficiency diseases
US5258909A (en) * 1989-08-31 1993-11-02 International Business Machines Corporation Method and apparatus for "wrong word" spelling error detection and correction
US5224040A (en) * 1991-03-12 1993-06-29 Tou Julius T Method for translating chinese sentences
DE69326431T2 (de) * 1992-12-28 2000-02-03 Toshiba Kawasaki Kk Spracherkennungs-Schnittstellensystem, das als Fenstersystem und Sprach-Postsystem verwendbar ist
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
US5586198A (en) * 1993-08-24 1996-12-17 Lakritz; David Method and apparatus for identifying characters in ideographic alphabet
JPH0793328A (ja) * 1993-09-24 1995-04-07 Matsushita Electric Ind Co Ltd 綴り不適切訂正装置
JPH0883092A (ja) * 1994-09-14 1996-03-26 Nippon Telegr & Teleph Corp <Ntt> 情報入力装置及び情報入力方法
US5602960A (en) * 1994-09-30 1997-02-11 Apple Computer, Inc. Continuous mandarin chinese speech recognition system having an integrated tone classifier
WO1997036273A2 (en) * 1996-03-27 1997-10-02 Michael Hersh Application of multi-media technology to psychological and educational assessment tools
JPH1083195A (ja) * 1996-09-09 1998-03-31 Oki Electric Ind Co Ltd 入力言語認識装置及び入力言語認識方法
US5911129A (en) * 1996-12-13 1999-06-08 Intel Corporation Audio font used for capture and rendering
US6148024A (en) * 1997-03-04 2000-11-14 At&T Corporation FFT-based multitone DPSK modem
US6005498A (en) * 1997-10-29 1999-12-21 Motorola, Inc. Reduced keypad entry apparatus and method
US5995932A (en) * 1997-12-31 1999-11-30 Scientific Learning Corporation Feedback modification for accent reduction
JP3884851B2 (ja) * 1998-01-28 2007-02-21 ユニデン株式会社 通信システムおよびこれに用いられる無線通信端末装置
US7257528B1 (en) * 1998-02-13 2007-08-14 Zi Corporation Of Canada, Inc. Method and apparatus for Chinese character text input
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
US6188983B1 (en) * 1998-09-02 2001-02-13 International Business Machines Corp. Method for dynamically altering text-to-speech (TTS) attributes of a TTS engine not inherently capable of dynamic attribute alteration
US6260015B1 (en) * 1998-09-03 2001-07-10 International Business Machines Corp. Method and interface for correcting speech recognition errors for character languages
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
US6801659B1 (en) * 1999-01-04 2004-10-05 Zi Technology Corporation Ltd. Text input system for ideographic and nonideographic languages
JP2000305582A (ja) * 1999-04-23 2000-11-02 Oki Electric Ind Co Ltd 音声合成装置
US20020069058A1 (en) * 1999-07-06 2002-06-06 Guo Jin Multimodal data input device
KR20010019786A (ko) * 1999-08-30 2001-03-15 윤종용 이동통신 시스템에서 음성인식 및 문자표시 장치 및 방법
US6697457B2 (en) * 1999-08-31 2004-02-24 Accenture Llp Voice messaging system that organizes voice messages based on detected emotion
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US6553342B1 (en) * 2000-02-02 2003-04-22 Motorola, Inc. Tone based speech recognition
DE10018134A1 (de) * 2000-04-12 2001-10-18 Siemens Ag Verfahren und Vorrichtung zum Bestimmen prosodischer Markierungen
US6564213B1 (en) * 2000-04-18 2003-05-13 Amazon.Com, Inc. Search query autocompletion
US6963841B2 (en) * 2000-04-21 2005-11-08 Lessac Technology, Inc. Speech training method with alternative proper pronunciation database
US7280964B2 (en) * 2000-04-21 2007-10-09 Lessac Technologies, Inc. Method of recognizing spoken language with recognition of language color
US6775651B1 (en) * 2000-05-26 2004-08-10 International Business Machines Corporation Method of transcribing text from computer voice mail
US7149970B1 (en) * 2000-06-23 2006-12-12 Microsoft Corporation Method and system for filtering and selecting from a candidate list generated by a stochastic input method
US6598021B1 (en) * 2000-07-13 2003-07-22 Craig R. Shambaugh Method of modifying speech to provide a user selectable dialect
TW521266B (en) * 2000-07-13 2003-02-21 Verbaltek Inc Perceptual phonetic feature speech recognition system and method
US6424935B1 (en) * 2000-07-31 2002-07-23 Micron Technology, Inc. Two-way speech recognition and dialect system
US7181391B1 (en) * 2000-09-30 2007-02-20 Intel Corporation Method, apparatus, and system for bottom-up tone integration to Chinese continuous speech recognition system
JP4089148B2 (ja) * 2000-10-17 2008-05-28 株式会社日立製作所 通訳サービス方法および通訳サービス装置
US7478047B2 (en) * 2000-11-03 2009-01-13 Zoesis, Inc. Interactive character system
JP2002189490A (ja) * 2000-12-01 2002-07-05 Leadtek Research Inc ピンイン音声入力の方法
CN1121004C (zh) * 2000-12-21 2003-09-10 国际商业机器公司 用于小键盘的汉字输入方法
US7010490B2 (en) * 2001-01-26 2006-03-07 International Business Machines Corporation Method, system, and apparatus for limiting available selections in a speech recognition system
US7062437B2 (en) * 2001-02-13 2006-06-13 International Business Machines Corporation Audio renderings for expressing non-audio nuances
JP2002244688A (ja) * 2001-02-15 2002-08-30 Sony Computer Entertainment Inc 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム
US20020133523A1 (en) * 2001-03-16 2002-09-19 Anthony Ambler Multilingual graphic user interface system and method
US6850934B2 (en) * 2001-03-26 2005-02-01 International Business Machines Corporation Adaptive search engine query
US20020152075A1 (en) * 2001-04-16 2002-10-17 Shao-Tsu Kung Composite input method
US20030023426A1 (en) * 2001-06-22 2003-01-30 Zi Technology Corporation Ltd. Japanese language entry mechanism for small keypads
US20030054830A1 (en) * 2001-09-04 2003-03-20 Zi Corporation Navigation system for mobile communication devices
US7075520B2 (en) * 2001-12-12 2006-07-11 Zi Technology Corporation Ltd Key press disambiguation using a keypad of multidirectional keys
US7949513B2 (en) * 2002-01-22 2011-05-24 Zi Corporation Of Canada, Inc. Language module and method for use with text processing devices
JP3762327B2 (ja) * 2002-04-24 2006-04-05 株式会社東芝 音声認識方法および音声認識装置および音声認識プログラム
US7380203B2 (en) * 2002-05-14 2008-05-27 Microsoft Corporation Natural input recognition tool
US7353173B2 (en) * 2002-07-11 2008-04-01 Sony Corporation System and method for Mandarin Chinese speech recognition using an optimized phone set
US7124082B2 (en) * 2002-10-11 2006-10-17 Twisted Innovations Phonetic speech-to-text-to-speech system and method
US7533023B2 (en) * 2003-02-12 2009-05-12 Panasonic Corporation Intermediary speech processor in network environments transforming customized speech parameters
KR20050118733A (ko) * 2003-04-14 2005-12-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 시청각 스트림상에 자동 더빙을 수행하는 시스템 및 방법
TWI229844B (en) * 2003-05-08 2005-03-21 Acer Inc Recognition method to integrate speech input and handwritten input, and system thereof
KR100547858B1 (ko) 2003-07-07 2006-01-31 삼성전자주식회사 음성인식 기능을 이용하여 문자 입력이 가능한 이동통신단말기 및 방법
US8826137B2 (en) * 2003-08-14 2014-09-02 Freedom Scientific, Inc. Screen reader having concurrent communication of non-textual information
US7088861B2 (en) * 2003-09-16 2006-08-08 America Online, Inc. System and method for chinese input using a joystick
US7398215B2 (en) * 2003-12-24 2008-07-08 Inter-Tel, Inc. Prompt language translation for a telecommunications system
US7363224B2 (en) * 2003-12-30 2008-04-22 Microsoft Corporation Method for entering text
US20050144010A1 (en) * 2003-12-31 2005-06-30 Peng Wen F. Interactive language learning method capable of speech recognition
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
US7549119B2 (en) * 2004-11-18 2009-06-16 Neopets, Inc. Method and system for filtering website content
US20060122840A1 (en) * 2004-12-07 2006-06-08 David Anderson Tailoring communication from interactive speech enabled and multimodal services
US7466859B2 (en) * 2004-12-30 2008-12-16 Motorola, Inc. Candidate list enhancement for predictive text input in electronic devices
US20060256139A1 (en) * 2005-05-11 2006-11-16 Gikandi David C Predictive text computer simplified keyboard with word and phrase auto-completion (plus text-to-speech and a foreign language translation option)
US8413069B2 (en) * 2005-06-28 2013-04-02 Avaya Inc. Method and apparatus for the automatic completion of composite characters
US20070005363A1 (en) * 2005-06-29 2007-01-04 Microsoft Corporation Location aware multi-modal multi-lingual device
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20070050188A1 (en) * 2005-08-26 2007-03-01 Avaya Technology Corp. Tone contour transformation of speech

Also Published As

Publication number Publication date
KR100790700B1 (ko) 2008-01-02
KR20070001020A (ko) 2007-01-03
US20060293890A1 (en) 2006-12-28
TW200707404A (en) 2007-02-16
CN1892817A (zh) 2007-01-10
SG128545A1 (en) 2007-01-30
JP2007011358A (ja) 2007-01-18

Similar Documents

Publication Publication Date Title
TWI296793B (en) Speech recognition assisted autocompletion of composite characters
JP5048174B2 (ja) ユーザの発話を認識するための方法及び装置
US20070100619A1 (en) Key usage and text marking in the context of a combined predictive text and speech recognition system
US7363224B2 (en) Method for entering text
TWI293455B (en) System and method for disambiguating phonetic input
RU2379767C2 (ru) Коррекция ошибок для систем распознавания речи
US8413069B2 (en) Method and apparatus for the automatic completion of composite characters
US20090326938A1 (en) Multiword text correction
US20140035823A1 (en) Dynamic Context-Based Language Determination
JP2006031092A (ja) 音声文字入力プログラム及び携帯端末装置
JP2011254553A (ja) 小型キーパッド用日本語入力メカニズム
US10528320B2 (en) System and method for speech-based navigation and interaction with a device&#39;s visible screen elements using a corresponding view hierarchy
JP4872323B2 (ja) Htmlメール生成システム、通信装置、htmlメール生成方法、及び記録媒体
US20090313571A1 (en) Method for customizing data entry for individual text fields
US20070038456A1 (en) Text inputting device and method employing combination of associated character input method and automatic speech recognition method
JP2002116793A (ja) データ入力システム及びその方法
US20090276219A1 (en) Voice input system and voice input method
KR100919227B1 (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
JP2002297577A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及びプログラム
KR100834279B1 (ko) 모바일 단말기의 문자 입력 처리방법 및 이를 수행하기위한 모바일 단말기
JP7036483B1 (ja) プログラム、情報処理装置及び情報処理方法
JP5336831B2 (ja) 文章入力を支援するための方法、並びにそのプログラム及び電子機器
KR20040053998A (ko) 이동 통신 단말기의 데이터 검색 방법

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees