TWI485578B - 電腦輸入系統及其輸入方法 - Google Patents

電腦輸入系統及其輸入方法 Download PDF

Info

Publication number
TWI485578B
TWI485578B TW098137931A TW98137931A TWI485578B TW I485578 B TWI485578 B TW I485578B TW 098137931 A TW098137931 A TW 098137931A TW 98137931 A TW98137931 A TW 98137931A TW I485578 B TWI485578 B TW I485578B
Authority
TW
Taiwan
Prior art keywords
phonetic
symbol
representative
value
input
Prior art date
Application number
TW098137931A
Other languages
English (en)
Other versions
TW201117054A (en
Inventor
Yong Der Lee
Fong Chi Chan
Original Assignee
Asustek Comp Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asustek Comp Inc filed Critical Asustek Comp Inc
Priority to TW098137931A priority Critical patent/TWI485578B/zh
Priority to US12/938,385 priority patent/US8482529B2/en
Publication of TW201117054A publication Critical patent/TW201117054A/zh
Application granted granted Critical
Publication of TWI485578B publication Critical patent/TWI485578B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

電腦輸入系統及其輸入方法
本發明是有關於一種電腦輸入系統,且特別是有關於一種根據漢字之注音拼讀來進行編碼的電腦輸入系統與其輸入方法。
為了讓電腦或手機等電子裝置能接收並識別漢字的輸入,適用於中文系統的編碼方式也隨之應運而生。其中,大五碼(Big-5)與標準萬國碼(Unicode)是目前在中文系統中最為常見的編碼方式。而在繁體中文系統的字符集中,又多半是以大五碼為基準。
就使用者的角度而言,則需要透過輸入法來輸入漢字。一般來說,漢字輸入法包括以讀音為基礎的輸入法和以字型為基礎的輸入法。其中,以讀音為基礎的輸入法並不需要額外記憶漢字的組字字根,也不需費時練習拆字,因此廣為現代人所喜愛。
由於漢字是由聲母、介母、韻母以及聲調排列組合而成,因此在以注音輸入法輸入漢字的步驟中,必需在確定使用者完成輸入後,將輸入的注音符號與中文資料庫的內容逐一進行比對,進而找出候選漢字以供使用者選擇。但由於採用大五碼或標準萬國碼為基準的漢字無法被有效排序,因此在比對資料庫時勢必得耗費大量的時間。不難想見,上述比對過程將大幅降低輸入漢字的效率,進而讓使用者在操作時感到諸多不便。
本發明提供一種電腦輸入系統,用以根據注音將漢字編碼為對應的數值,以建立有助於快速查找的漢字讀音資料庫。
本發明提供一種輸入方法,能快速地透過查表方式自讀音資料庫找到使用者輸入的漢字讀音,進而提供適當的輸入候選字。
本發明提出一種電腦輸入系統,包括儲存單元、代表值取得模組,以及耦接至儲存單元與代表值取得模組的編碼模組。其中,儲存單元記錄預定義的符號排列順序以及四個進位基數。上述四個進位基數一對一相關於注音符號的聲母總數、介母總數、韻母總數以及聲調總數。代表值取得模組依據一漢字的注音對應取得四個符號代表值,而編碼模組則根據符號排列順序、四個進位基數與四個符號代表值產生漢字的編碼值。
在本發明之一實施例中,其中四個進位基數分別是聲母總數加1、介母總數加1、韻母總數加1,以及聲調總數。
在本發明之一實施例中,其中注音符號的二十一個聲母一對一對應二十一個聲母代表值,而代表值取得模組在漢字的注音包括二十一個聲母其中之一時,以對應的二十一個聲母代表值其中之一作為四個符號代表值其中之一。但若漢字的注音不包括任何聲母,則以一預設代表值作為四個符號代表值其中之一。
在本發明之一實施例中,其中注音符號的三個介母一對一對應三個介母代表值,而代表值取得模組在漢字的注音包括三個介母其中之一時,以對應的三個介母代表值其中之一作為四個符號代表值其中之一。若漢字的注音不包括介母,則以一預設代表值作為四個符號代表值其中之一。
在本發明之一實施例中,其中注音符號的十三個韻母一對一對應十三個韻母代表值,而代表值取得模組當漢字的注音包括十三個韻母其中之一時,以對應的十三個韻母代表值其中之一作為四個符號代表值其中之一。若漢字的注音不包括韻母,則以一預設代表值作為四個符號代表值其中之一。
在本發明之一實施例中,其中注音符號的五個聲調一對一對應五個聲調代表值,而代表值取得模組在五個聲調中取得漢字的注音所包括之聲調,並且在五個聲調代表值中以所取得之聲調對應的聲調代表值作為四個符號代表值其中之一。
在本發明之一實施例中,其中編碼模組根據符號排列順序排列四個符號代表值。接著,根據符號排列順序,以及四個進位基數與聲母總數、介母總數、韻母總數與聲調總數的相關關係,定義出四個進位基數的進位順序。再依照四個進位基數與進位順序將所排列之四個符號代表值轉換為一十進位數值,並以上述十進位數值作為漢字的編碼值。其中,符號排列順序由左至右可依序是聲母、介母、韻母以及聲調。
在本發明之一實施例中,其中儲存單元更包括一讀音資料庫。而編碼模組將漢字的注音定義為一漢字讀音,並將漢字讀音與編碼值的對應關係記錄於讀音資料庫。
本發明另提出一種輸入方法,適用於具有儲存單元的電腦輸入系統,此儲存單元記錄一符號排列順序、四個進位基數以及一讀音資料庫。在讀音資料庫中,記錄有多個漢字讀音與各漢字讀音所對應的編碼值。其中,各編碼值係由表示對應之漢字讀音的四個符號代表值、符號排列順序,以及四個進位基數所產生,上述四個進位基數一對一相關於注音符號的聲母總數、介母總數、韻母總數以及聲調總數,且漢字讀音係依照對應之編碼值依序儲存於讀音資料庫。此方法在接收至少一注音的輸入時,取得表示上述注音的四個輸入符號代表值。接著根據四個進位基數、符號排列順序與四個輸入符號代表值計算一數值。若在讀音資料庫中存在與數值相符的編碼值,則取得相符編碼值所對應之漢字讀音對應的至少一漢字以作為候選漢字。最後根據選取指令自候選漢字擇一作為輸入字。
在本發明之一實施例中,其中取得表示注音之四個輸入符號代表值的步驟是在注音包括二十一個聲母其中之一時,以所包括之二十一個聲母其中之一對應的聲母代表值作為四個輸入符號代表值其中之一。而在注音不包括聲母時,則以一預設代表值作為四個輸入符號代表值其中之一。另外,若注音包括三個介母其中之一,則以所包括之三個介母其中之一對應的介母代表值作為四個輸入符號代表值其中之一,然而若注音不包括介母,則以預設代表值作為四個輸入符號代表值其中之一。而當注音包括十三個韻母其中之一時,則以所包括之十三個韻母其中之一對應的韻母代表值作為四個輸入符號代表值其中之一,並且在注音不包括韻母時,以預設代表值作為四個輸入符號代表值其中之一。若注音包括五個聲調其中之一,則以所包括之五個聲調其中之一對應的聲調代表值作為四個輸入符號代表值其中之一,若注音不包括聲調,則以一預設代表值作為四個輸入符號代表值其中之一。
在本發明之一實施例中,其中根據四個進位基數、符號排列順序與四個輸入符號代表值計算數值的步驟包括根據符號排列順序排列四個輸入符號代表值,並根據符號排列順序,以及四個進位基數與聲母總數、介母總數、韻母總數與聲調總數的相關關係,定義出四個進位基數的進位順序。在依照四個進位基數與進位順序將所排列之四個輸入符號代表值轉換為十進位數值後,以十進位數值作為該數值。
在本發明之一實施例中,其中符號排列順序由左至右可以是聲母、介母、韻母以及聲調。
基於上述,本發明是根據漢字的注音將漢字編碼為特定的編碼值。據此在依據編碼值排序所有漢字讀音以建立資料庫後,每當使用者利用注音輸入法進行輸入時,便可透過查表的方式在資料庫中快速地找到對應的讀音,進而顯示可能的候選漢字以供使用者選擇。如此一來可以大幅降低以注音輸入漢字時進行比對所需要的時間,從而提升輸入的效率。
為讓本發明之上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖1A是依照本發明之一實施例所繪示之電腦輸入系統的方塊圖。如圖1A所示,電腦輸入系統10包括儲存單元11、代表值取得模組13,以及耦接至儲存單元11與代表值取得模組13的編碼模組15。在本實施例中,電腦輸入系統10可以是桌上型電腦、筆記型電腦、伺服器,或其他電子裝置之輸入系統。
儲存單元11例如是記憶體、硬碟,或任何儲存媒體,在此並不加以限制。代表值取得模組13與編碼模組15則可以是具備運算處理能力的硬體、軟體元件,或硬體及軟體元件的組合。在本實施例中,透過儲存單元11所提供的資訊以及代表值取得模組13與編碼模組15的運作,電腦輸入系統10能根據構成漢字的注音對漢字進行編碼。
為了更進一步地說明電腦輸入系統10在編碼漢字時的運作流程,以下特舉另一實施例來進行說明。圖1B是依照本發明之一實施例所繪示之基於注音拼讀的漢字編碼方法的流程圖。首先如步驟110所示,在儲存單元11中定義有四個進位基數,此四個進位基數一對一相關於注音符號的聲母總數、介母總數、韻母總數以及聲調總數。詳細地說,漢字的注音共包括二十一個聲母、三個介母、十三個韻母,以及五種聲調,而本實施例中的四個進位基數分別是聲母總數加1(即22)、介母總數加1(即4)、韻母總數加1(即14),以及聲調總數(即5)。
接著在步驟120中,代表值取得模組13依據所要編碼之漢字的注音對應取得四個符號代表值。在本實施例中,注音符號的二十一個聲母一對一對應二十一個聲母代表值(例如1至21),三個介母一對一對應三個介母代表值(例如1至3),十三個韻母一對一對應十三個韻母代表值(例如1至13),且五個聲調一對一對應五個聲調代表值(例如0至4)。因此,當需被編碼之漢字的注音包括二十一個聲母其中之一時,代表值取得模組13便以所包括之聲母對應的聲母代表值作為四個符號代表值其中之一。然而若漢字的注音不包括任何聲母,代表值取得模組13則以一預設代表值(例如0)作為四個符號代表值其中之一。同樣地,在漢字的注音包括三個介母其中之一時,代表值取得模組13以此漢字注音所包括之介母對應的介母代表值作為四個符號代表值其中之一。但在漢字的注音不包括介母時,代表值取得模組13則以預設代表值(例如0)作為四個符號代表值其中之一。而當漢字的注音包括十三個韻母其中之一時,代表值取得模組13以所包括之韻母對應的韻母代表值作為四個符號代表值其中之一。但若漢字的注音不包括韻母,代表值取得模組13則以預設代表值(例如0)作為四個符號代表值其中之一。除此之外,代表值取得模組13會在注音的五個聲調中取得欲編碼之漢字的聲調,並且在對應的五個聲調代表值中,以對應的聲調代表值作為四個符號代表值其中之一。
圖2繪示的是注音符號中各個聲母、介母,以及韻母分別與其代表值的對應關係。而在以下的實施例中,注音之一聲、二聲、三聲、四聲、輕聲這五種聲調的聲調代表值則依序是0、1、2、3、4。因此,倘若要編碼的漢字為「聲」,由於其注音為「ㄕㄥ」,因此所取得的四個符號代表值分別是17、0、12、0。而倘若要編碼的漢字為「國」,由於其注音為「ㄑㄑㄨㄛˊ」,因此所取得的四個符號代表值分別是9、2、2、1。但必須說明的是,上述注音符號與聲調和其代表值的對應關係僅是為了說明而舉出的範例,並不用以限制本發明的範圍。換言之,只要二十一個聲母與二十一個聲母代表值係一對一的相互對應,三個介母與三個介母代表值係一對一相互對應,十三個韻母與十三個韻母代表值係一對一相互對應,且五個聲調與五個聲調代表值係一對一相互對應,則均屬於本發明的範疇。
在根據漢字的注音對應取得四個符號代表值後,最後如步驟130所示,編碼模組15根據記錄在儲存單元11中的符號排列順序與四個進位基數,以及由代表值取得模組13所取得的四個符號代表值來產生漢字的編碼值。詳細地說,編碼模組15首先根據符號排列順序排列四個符號代表值。接著根據符號排列順序,以及四個進位基數分別與聲母總數、介母總數、韻母總數與聲調總數的相關關係,定義出這四個進位基數的進位順序。最後,編碼模組15依照四個進位基數與其進位順序,將重新排列過的四個符號代表值轉換為一十進位數值,並以轉換而成的十進位數值作為漢字的編碼值。
假設依照符號排列順序而重新排列過的四個符號代表值由左至右依序為W、X、Y、Z,且四個進位基數依照進位順序由左至右排列的結果是r1、r2、r3、r4。在本實施例中,編碼模組15會將重排後的四個符號代表值視為一個四位數,由於每個位數分別對應不同的進位基數,因此編碼模組15在將其轉換為十進位數值(即編碼值)時,例如是以下列算式來計算之:
編碼值=W×(r2×r3×r4)+X×(r3×r4)+Y×(r4)+Z
舉例來說,倘若要編碼的漢字為「辜」。那麼在符號排列順序由左至右依序為介母、聲調、韻母以及聲母的情況下,其四個符號代表值的順序由左至右為2、0、0、9,且四個進位基數由左至右排列為4、5、14、22,因此其編碼值應是3089(即2×(5×14×22)+0×(14×22)+0×(22)+9)。
在另一實施例中,倘若要編碼的漢字為「聲」。那麼在符號排列順序由左至右依序為聲母、介母、韻母以及聲調這樣貼近一般人利用注音來輸入漢字之符號順序的情況下,其四個符號代表值的順序由左至右為17、0、12、0,且四個進位基數由左至右應排列為22、4、14、5,因此其編碼值應是4820(即17×(4×14×5)+0×(14×5)+12×(5)+0)。
反覆透過圖1所示之各步驟,便能依據各漢字的注音對應產生其編碼值。換句話說,讀音相同的漢字便具有同樣的編碼值,而編碼模組15會將漢字的注音定義為一漢字讀音,並將漢字讀音與編碼值的對應關係記錄於儲存單元11中的讀音資料庫17。而在建立讀音資料庫17時,也只需使用到6160(即22×4×14×5)個陣列空間。
以下的實施例是說明在利用圖1所示之方法計算所有漢字的編碼值,進而在儲存單元11建立完整的讀音資料庫17後,如何在電腦輸入系統10的使用者以注音輸入法輸入漢字時,加速從輸入注音到選取正確輸入字的詳細步驟。
圖3是依照本發明之一實施例所繪示之輸入方法的流程圖。首先如步驟310所示,提供儲存在儲存單元11中的讀音資料庫17,此讀音資料庫17記錄了所有漢字讀音與各漢字讀音所對應的編碼值。在本實施例中,儲存單元11亦記錄一符號排列順序與四個進位基數。而各漢字讀音所對應的編碼值係由表示對應之漢字讀音的四個符號代表值、符號排列順序,以及四個進位基數所產生,且漢字讀音係依照對應之編碼值依序儲存於讀音資料庫17。由於如何產生漢字讀音的編碼值已在上一實施例作出說明,故在此不再贅述。
接著在步驟320中,接收至少一注音的輸入,並如步驟330所示,取得表示輸入之注音的四個輸入符號代表值。在本實施例中,注音符號的二十一個聲母一對一對應二十一個聲母代表值,三個介母一對一對應三個介母代表值,十三個韻母一對一對應十三個韻母代表值,且五個聲調一對一對應五個聲調代表值,且聲母、介母、韻母、聲調分別與其代表值的對應關係和建立讀音資料庫17時所參照的對應關係相同。倘若輸入之注音包括二十一個聲母其中之一時,以所包括之二十一個聲母其中之一對應的聲母代表值作為四個輸入符號代表值其中之一;而在輸入之注音不包括聲母時,則以一預設代表值(需與建立讀音資料庫17時使用的預設代表值相同,例如0)作為四個輸入符號代表值其中之一。另外,若輸入之注音包括三個介母其中之一,則以所包括之三個介母其中之一對應的介母代表值作為四個輸入符號代表值其中之一,然而若注音不包括介母,則以預設代表值作為四個輸入符號代表值其中之一。而當輸入之注音包括十三個韻母其中之一時,則以所包括之十三個韻母其中之一對應的韻母代表值作為四個輸入符號代表值其中之一,並且在注音不包括韻母時,以預設代表值作為四個輸入符號代表值其中之一。若注音包括五個聲調其中之一,則以所包括之五個聲調其中之一對應的聲調代表值作為四個輸入符號代表值其中之一,若注音不包括聲調,則以預設代表值作為四個輸入符號代表值其中之一。
接下來如步驟340所示,根據四個進位基數、符號排列順序(例如由左至右為聲母、介母、韻母以及聲調)與四個輸入符號代表值計算對應於輸入之注音的數值。其中,符號排列順序以及四個進位基數必須與建立讀音資料庫17時所採用的順序與數值相同。由於計算此數值的方式與先前實施例計算編碼值的方式相同或相似,故在此不再贅述。
計算出數值後,接著在步驟350中判斷在讀音資料庫17中是否存在與數值相符的編碼值。此一步驟可以採用查表(table lookup)的方式來快速取得判斷結果。若在讀音資料庫17中不具有與數值相符的編碼值,表示使用者輸入的不是有效的漢字讀音,因此如步驟360所示,判定使用者輸入錯誤。然而倘若可在讀音資料庫17中找到對應的編碼值,接著如步驟370所示,取得相符編碼值所對應之漢字讀音對應的所有漢字以作為候選漢字。最後在步驟380中,根據使用者所發出的選取指令,自候選漢字中擇一作為輸入字。
如上所述,此輸入方法在計算表示輸入之注音的數值後,便會以查表的方式直接判斷能否取得對應的編碼值,並顯示對應的候選漢字,而不再需要對注音符號進行比對,據此可以大幅加快從輸入注音到選擇正確輸入字的速度。
在另一實施例中,使用者在輸入注音時可以不用按照預設的符號排列順序來進行輸入,但此輸入方法在利用資料庫查找是否存在對應的讀音之前,則會自動將使用者輸入的注音轉換為預設的符號排列順序,進而計算其數值以便於查表動作。
在又一實施例中,即便使用者尚未完成一個漢字的注音符號輸入,此輸入方法也可以根據目前所接收到的注音計算出對應的數值,並且自讀音資料庫中找到適當的多個漢字讀音,並對應顯示所有對應的漢字以作為候選漢字來供使用者選擇。如此一來,使用者很有機會在不需完整輸入注音的情況下,便能自候選漢字選出需要輸入的字元。圖4是依照本發明之一實施例所繪示之部分讀音資料庫的示意圖,假設目前取得使用者輸入的注音為「ㄈㄨ」,那麼此輸入方法將自讀音資料庫中取得所有包括「ㄈㄨ」的漢字讀音,亦即「ㄈㄨ」、「ㄈㄨˊ」、「ㄈㄨˇ」、「ㄈㄨˋ」、「ㄈㄨㄥˋ」,並顯示上述漢字讀音所對應的漢字來作為候選漢字以供使用者選擇。
上述實施例說明的是電腦輸入系統10以變動進位制為基礎來對漢字進行編碼,並利用此編碼方式建立讀音資料庫以應用在注音輸入法中。而以下實施例中,電腦輸入系統10在基於注音拼讀對漢字進行編碼時,是採用固定進位制來作為編碼依據。圖5是依照本發明之另一實施例所繪示之基於注音拼讀的漢字編碼方法的流程圖。首先如步驟510所示,在儲存單元11中定義有一進位基數,以下假設進位基數為2。
接著如步驟520所示,代表值取得模組13依據欲編碼之漢字的注音,對應取得四個符號代表值。在本實施例中,注音符號的二十一個聲母一對一對應二十一個聲母代表值(例如1至21),三個介母一對一對應三個介母代表值(例如1至3),十三個韻母一對一對應十三個韻母代表值(例如1至13),且五個聲調一對一對應五個聲調代表值(例如0至4)。據此,倘若漢字的注音包括二十一個聲母其中之一,代表值取得模組13則以對應的聲母代表值作為四個符號代表值中的第一代表值,但若漢字的注音不包括聲母,代表值取得模組13則以一預設代表值(例如0)作為第一代表值。若漢字的注音包括三個介母其中之一,代表值取得模組13則以對應的介母代表值作為四個符號代表值中的第二代表值,但若漢字的注音不包括介母,代表值取得模組13則以預設代表值作為第二代表值。若漢字的注音包括十三個韻母其中之一,代表值取得模組13則以對應的韻母代表值作為四個符號代表值中的第三代表值,但若漢字的注音不包括韻母,代表值取得模組13則以預設代表值作為第三代表值。且代表值取得模組13在注音包括的五個聲調中,取得此漢字的注音所包括之聲調,並在對應的五個聲調代表值中,以對應的聲調代表值作為四個符號代表值中的第四代表值。
在進位基數定義為2的情況下,由於每個漢字是由二十一個聲母、三個介母、十三個韻母,以及五個聲調排列組合而成,而某些漢字的注音可能不包括聲母、介母或韻母,因此共需五個二進位的聲母位元來表示二十一個聲母以及不出現聲母的情況。同樣地,只需二個二進位的介母位元便可表示三個介母以及不出現介母的情況。而四個二進位的韻母位元則足以表示十三個韻母與不出現韻母的情況。另外,五個聲調符號則需要三個二進位的聲調位元來表示之。接下來如步驟530所示,編碼模組15以五個聲母位元、二個介母位元、四個韻母位元以及三個聲調位元分別表示四個符號代表值。具體來說,編碼模組15是以五個聲母位元表示第一代表值的二進位值,並以二個介母位元表示第二代表值的二進位值,以及以四個韻母位元表示第三代表值的二進位值,再以三個聲調位元表示第四代表值的二進位值。
最後在步驟540中,編碼模組15依據進位基數與一符號排列順序,將以五個聲母位元、二個介母位元、四個韻母位元以及三個聲調位元所表示的四個符號代表值轉換為漢字的編碼值。在本實施例中,編碼模組15首先依據符號排列順序排列分別代表四個符號代表值的五個聲母位元、二個介母位元、四個韻母位元以及三個聲調位元。接著,將所排列之五個聲母位元、二個介母位元、四個韻母位元以及三個聲調位元轉換為十進位數值,最後再以此十進位數值作為漢字的編碼值。
舉例來說,假設本實施例中各注音符號與其代表值的對應關係如圖2所示,而注音之一聲、二聲、三聲、四聲、輕聲這五種聲調的聲調代表值依序是0、1、2、3、4。假設欲編碼的漢字為「國」,那麼代表值取得模組13所取得的第一、第二、第三與第四代表值分別是9、2、2,1。而編碼模組15以五個聲母位元、二個介母位元、四個韻母位元以及三個聲調位元分別表示這四個符號代表值的結果是“01001”、“10”、“0010”與“001”。假設符號排列順序由左至右依序為介母、聲調、韻母以及聲母。那麼在步驟540中,代表各符號代表值的五個聲母位元、二個介母位元、四個韻母位元以及三個聲調位元將被編碼模組15重新排列為“10001001001001”,且這1四個二進位位元可被轉換為十進位數值9289以作為編碼值。
透過圖5所示之各步驟便可將漢字的各種讀音進行編碼,進而在儲存單元11中建立一讀音資料庫17,以記錄各漢字讀音與其所對應的編碼值。以下的實施例則是說明將此讀音資料庫17應用在注音輸入法時的詳細步驟。圖6是依照本發明之另一實施例所繪示之輸入方法的流程圖。如圖6之步驟610所示,首先提供一讀音資料庫17,記錄多個漢字讀音與各漢字讀音所對應的編碼值,其中漢字讀音係依照對應的編碼值依序儲存於讀音資料庫17。由於讀音資料庫17中各漢字讀音的編碼值是由圖5所示之漢字編碼方法所產生,故在此不再贅述。
接著在步驟620中,接收至少一個注音的輸入。並如步驟630所示,取得表示輸入之注音的四個輸入符號代表值。接下來在步驟640中,依據進位基數與符號排列順序,將以五個聲母位元、二個介母位元、四個韻母位元以及三個聲調位元所表示的四個輸入符號代表值轉換為十進位的數值。必須特別說明的是,在取得輸入符號代表值時所參照的注音符號與代表值之對應關係,必須和建立讀音資料庫17時所參照的對應關係一致。而計算數值時所依據的進位基數與符號排列順序也須與建立讀音資料庫17時所採用的基數和順序相同。由於取得輸入符號代表值與計算數值的方式與對漢字進行編碼時所執行的步驟相同或相似,故在此不再贅述。
在計算用以表示輸入之注音的數值後,接著如步驟650所示,判斷在讀音資料庫17中是否存在與數值相符的編碼值。若不存在相符的編碼值,表示使用者輸入的注音無法構成有意義的漢字讀音,因此如步驟660所示,判定使用者輸入錯誤。若在讀音資料庫17中可找到相符的編碼值,則如步驟670所示,取得相符編碼值所對應之漢字讀音對應的所有漢字以作為候選漢字。在顯示候選漢字後,如步驟680所示,根據使用者所下達的選取指令,選擇其中一個候選漢字作為正確的輸入字。
在本實施例中,是利用查表的方式來判斷在讀音資料庫17中是否具有與數值與相符的編碼值,進而顯示所有可能的候選漢字。在不需要逐一比對注音符號的情況下,勢必能加快顯示候選漢字的速度。據此,使用者也能更快速地選取需要輸入的字元。而在其他實施例中,即便使用者目前輸入的注音未能完整地構成其所欲輸入的漢字,此輸入方法也能藉由資料庫所記錄的編碼值資訊,找出所有可能的候選漢字以供使用者選擇,藉以簡化使用者輸入的注音符號數量,以加速輸入漢字的過程。
綜上所述,本發明所述之基於注音拼讀的漢字編碼方法是依據漢字的注音將其編碼為一數字,據此可建立便於排序及搜尋的漢字讀音資料庫。而在將漢字讀音資料庫應用於輸入方法時,可透過查表的方式快速確認讀音並提供對應的候選漢字,進而降低自輸入注音到選取正確輸入字的時間,以使注音輸入漢字更為便捷快速。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,故本發明之保護範圍當視後附之申請專利範圍所界定者為準。
10‧‧‧電腦輸入系統
11‧‧‧儲存單元
13‧‧‧代表值取得模組
15‧‧‧編碼模組
17‧‧‧讀音資料庫
110~130‧‧‧本發明之一實施例所述之基於注音拼讀的漢字編碼方法的各步驟
310~380‧‧‧本發明之一實施例所述之輸入方法的各步驟
510~540‧‧‧本發明之另一實施例所述之基於注音拼讀的漢字編碼方法的各步驟
610~680‧‧‧本發明之另一實施例所述之輸入方法的各步驟
圖1A是依照本發明之一實施例所繪示之電腦輸入系統的方塊圖。
圖1B是依照本發明之一實施例所繪示之基於注音拼讀的漢字編碼方法的流程圖。
圖2是依照本發明之一實施例所繪示之注音符號與其代表值的對應關係。
圖3是依照本發明之一實施例所繪示之輸入方法的流程圖。
圖4是依照本發明之一實施例所繪示之部分儲存單元的示意圖。
圖5是依照本發明之另一實施例所繪示之基於注音拼讀的漢字編碼方法的流程圖。
圖6是依照本發明之另一實施例所繪示之輸入方法的流程圖。
110~130...本發明之一實施例所述之基於注音拼讀的漢字編碼方法的各步驟

Claims (16)

  1. 一種電腦輸入系統,包括:一儲存單元,記錄預定義的一符號排列順序與四個進位基數,該四個進位基數一對一相關於注音符號的一聲母總數、一介母總數、一韻母總數以及一聲調總數;一代表值取得模組,依據一漢字的注音對應取得四個符號代表值;以及一編碼模組,耦接至該儲存單元與該代表值取得模組,根據該符號排列順序、該四個進位基數與該四個符號代表值計算該漢字的一編碼值。
  2. 如申請專利範圍第1項所述之電腦輸入系統,其中該四個進位基數分別是該聲母總數加1、該介母總數加1、該韻母總數加1,以及該聲調總數。
  3. 如申請專利範圍第1項所述之電腦輸入系統,其中注音符號的二十一個聲母一對一對應二十一個聲母代表值,而該代表值取得模組在該漢字的注音包括該二十一個聲母其中之一時,以對應的該二十一個聲母代表值其中之一作為該四個符號代表值其中之一,且該代表值取得模組在該漢字的注音不包括該二十一個聲母時,以一預設代表值作為該四個符號代表值其中之一。
  4. 如申請專利範圍第1項所述之電腦輸入系統,其中注音符號的三個介母一對一對應三個介母代表值,而該代表值取得模組在該漢字的注音包括該三個介母其中之一時,以對應的該三個介母代表值其中之一作為該四個符號代表值其中之一,且該代表值取得模組在該漢字的注音不包括該三個介母時,以一預設代表值作為該四個符號代表值其中之一。
  5. 如申請專利範圍第1項所述之電腦輸入系統,其中注音符號的十三個韻母一對一對應十三個韻母代表值,而該代表值取得模組在該漢字的注音包括該十三個韻母其中之一時,以對應的該十三個韻母代表值其中之一作為該四個符號代表值其中之一,且該代表值取得模組在該漢字的注音不包括該十三個韻母時,以一預設代表值作為該四個符號代表值其中之一。
  6. 如申請專利範圍第1項所述之電腦輸入系統,其中注音符號的五個聲調一對一對應五個聲調代表值,而該代表值取得模組在該五個聲調中,取得該漢字的注音所包括之聲調,並在該五個聲調代表值中,以所取得之聲調對應的聲調代表值作為該四個符號代表值其中之一。
  7. 如申請專利範圍第1項所述之電腦輸入系統,其中該編碼模組根據該符號排列順序排列該四個符號代表值,並根據該符號排列順序,以及該四個進位基數與該聲母總數、該介母總數、該韻母總數與該聲調總數的相關關係,定義出該四個進位基數的一進位順序,該編碼模組依照該四個進位基數與該進位順序轉換所排列之該四個符號代表值為一十進位數值,並以該十進位數值作為該漢字的該編碼值。
  8. 如申請專利範圍第7項所述之電腦輸入系統,其中該符號排列順序由左至右為聲母、介母、韻母以及聲調。
  9. 如申請專利範圍第1項所述之電腦輸入系統,其中該儲存單元更包括:一讀音資料庫;其中該編碼模組定義該漢字的注音為一漢字讀音,並記錄該漢字讀音與該編碼值的對應關係於該讀音資料庫。
  10. 一種輸入方法,用於具有一儲存單元的一電腦輸入系統,該儲存單元記錄一符號排列順序、四個進位基數,以及一讀音資料庫,該讀音資料庫記錄多個漢字讀音與各該些漢字讀音所對應的一編碼值,其中各該編碼值係由表示對應之該漢字讀音的四個符號代表值、該符號排列順序,以及該四個進位基數所產生,該四個進位基數一對一相關於注音符號的一聲母總數、一介母總數、一韻母總數以及一聲調總數,且該些漢字讀音係依照對應之該編碼值依序儲存於該讀音資料庫,該方法包括:接收至少一注音的輸入;取得表示該至少一注音的四個輸入符號代表值;根據該四個進位基數、該符號排列順序與該四個輸入符號代表值計算一數值;取得與該數值相符之該編碼值所對應之該漢字讀音對應的至少一漢字以作為至少一候選漢字;以及根據一選取指令選擇該至少一候選漢字其中之一作為一輸入字。
  11. 如申請專利範圍第10項所述之輸入方法,其中取得表示該至少一注音之該四個輸入符號代表值的步驟包括:若該至少一注音包括二十一個聲母其中之一,則以所包括之該二十一個聲母其中之一對應的一聲母代表值作為該四個輸入符號代表值其中之一;以及若該至少一注音不包括該二十一個聲母,則以一預設代表值作為該四個輸入符號代表值其中之一。
  12. 如申請專利範圍第11項所述之輸入方法,其中取得表示該至少一注音之該四個輸入符號代表值的步驟包括:若該至少一注音包括三個介母其中之一,則以所包括之該三個介母其中之一對應的一介母代表值作為該四個輸入符號代表值其中之一;以及若該至少一注音不包括該三個介母,則以該預設代表值作為該四個輸入符號代表值其中之一。
  13. 如申請專利範圍第12項所述之輸入方法,其中取得表示該至少一注音之該四個輸入符號代表值的步驟包括:若該至少一注音包括十三個韻母其中之一,則以所包括之該十三個韻母其中之一對應的一韻母代表值作為該四個輸入符號代表值其中之一;以及若該至少一注音不包括該十三個韻母,則以該預設代表值作為該四個輸入符號代表值其中之一。
  14. 如申請專利範圍第10項所述之輸入方法,其中取得表示該至少一注音之該四個輸入符號代表值的步驟包括:若該至少一注音包括五個聲調其中之一,則以該至少一注音所包括之該五個聲調其中之一對應的一聲調代表值作為該四個輸入符號代表值其中之一;以及若該至少一注音不包括該五個聲調,則以該預設代表值作為該四個輸入符號代表值其中之一。
  15. 如申請專利範圍第10項所述之輸入方法,其中根據該四個進位基數、該符號排列順序與該四個輸入符號代表值計算該數值的步驟包括:根據該符號排列順序排列該四個輸入符號代表值;根據該符號排列順序,以及該四個進位基數與該聲母總數、該介母總數、該韻母總數與該聲調總數的相關關係,定義出該四個進位基數的一進位順序;依照該四個進位基數與該進位順序轉換所排列之該四個輸入符號代表值為一十進位數值;以及以該十進位數值作為該數值。
  16. 如申請專利範圍第10項所述之輸入方法,其中該符號排列順序由左至右為聲母、介母、韻母以及聲調。
TW098137931A 2009-11-09 2009-11-09 電腦輸入系統及其輸入方法 TWI485578B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW098137931A TWI485578B (zh) 2009-11-09 2009-11-09 電腦輸入系統及其輸入方法
US12/938,385 US8482529B2 (en) 2009-11-09 2010-11-03 Computer input system and input method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW098137931A TWI485578B (zh) 2009-11-09 2009-11-09 電腦輸入系統及其輸入方法

Publications (2)

Publication Number Publication Date
TW201117054A TW201117054A (en) 2011-05-16
TWI485578B true TWI485578B (zh) 2015-05-21

Family

ID=43973801

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098137931A TWI485578B (zh) 2009-11-09 2009-11-09 電腦輸入系統及其輸入方法

Country Status (2)

Country Link
US (1) US8482529B2 (zh)
TW (1) TWI485578B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019402A (zh) * 2011-09-28 2013-04-03 索尼爱立信移动通讯有限公司 一种汉字输入方法、键盘及包含该键盘的电子设备
CN104808807A (zh) * 2014-01-29 2015-07-29 国际商业机器公司 用于汉字拼音输入的方法和装置
CN112083816B (zh) * 2020-10-19 2022-09-06 逯振进 音义及音型码汉字输入法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW550479B (en) * 2000-09-30 2003-09-01 Tzung-Guo Tzeng Four-unit sequential phonetic notation input method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5952942A (en) * 1996-11-21 1999-09-14 Motorola, Inc. Method and device for input of text messages from a keypad
US8564541B2 (en) * 2009-03-16 2013-10-22 Apple Inc. Zhuyin input interface on a device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW550479B (en) * 2000-09-30 2003-09-01 Tzung-Guo Tzeng Four-unit sequential phonetic notation input method

Also Published As

Publication number Publication date
US8482529B2 (en) 2013-07-09
TW201117054A (en) 2011-05-16
US20110109559A1 (en) 2011-05-12

Similar Documents

Publication Publication Date Title
WO2020186778A1 (zh) 错词纠正方法、装置、计算机装置及存储介质
US10515155B2 (en) Conversational agent
CN107704102B (zh) 一种文本输入方法及装置
CN102016837B (zh) 中文型文字及文字偏旁的分类及检索的系统与方法
JP5513898B2 (ja) 共有された言語モデル
WO2021218329A1 (zh) 平行语料生成方法、装置、设备及存储介质
US5892470A (en) Method and system for mnemonic encoding of numbers
JP2002532782A (ja) 改良マルチタップテキスト入力のための方法と機器
TWI485578B (zh) 電腦輸入系統及其輸入方法
JP2010520532A (ja) 画数の入力
TWI352970B (en) Voice input system and voice input method
CN110516125A (zh) 识别异常字符串的方法、装置、设备及可读存储介质
CN110262674A (zh) 一种基于拼音输入的汉字输入方法、装置及电子设备
CN101539433A (zh) 导航系统中拼音首字母加声调检索的方法及装置
KR100542757B1 (ko) 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치
CN103325376A (zh) 编码装置、编码方法、解码装置及解码方法
CN109740142A (zh) 一种字符串纠错方法及装置
CN103176616A (zh) 古琴减字谱字符的输入方法和装置
TWI220727B (en) Character element input correcting device and method
CN113160793A (zh) 基于低资源语言的语音合成方法、装置、设备及存储介质
CN113920971A (zh) 一种基于音乐语义的音乐色彩可视化方法
CN115525728A (zh) 汉字排序、汉字检索和汉字插入的方法和装置
JP2009199434A (ja) アルファベット文字列日本語読み変換装置及びアルファベット文字列日本語読み変換プログラム
CN113222154B (zh) 一种量子态的振幅的确定方法及装置
CN100378725C (zh) 一种产生用于提供与文本对应的语音的信号的方法