TWI710976B - 文字輸入方法及其電腦程式產品 - Google Patents

文字輸入方法及其電腦程式產品 Download PDF

Info

Publication number
TWI710976B
TWI710976B TW108132152A TW108132152A TWI710976B TW I710976 B TWI710976 B TW I710976B TW 108132152 A TW108132152 A TW 108132152A TW 108132152 A TW108132152 A TW 108132152A TW I710976 B TWI710976 B TW I710976B
Authority
TW
Taiwan
Prior art keywords
string
text
substring
sub
character
Prior art date
Application number
TW108132152A
Other languages
English (en)
Other versions
TW202111615A (zh
Inventor
陳良其
Original Assignee
宏碁股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 宏碁股份有限公司 filed Critical 宏碁股份有限公司
Priority to TW108132152A priority Critical patent/TWI710976B/zh
Application granted granted Critical
Publication of TWI710976B publication Critical patent/TWI710976B/zh
Publication of TW202111615A publication Critical patent/TW202111615A/zh

Links

Images

Abstract

一種文字輸入的方法,適用於一電子裝置,該電子裝置透過一輸入裝置接收一數字字串,用以將該數字字串轉換為對應的一文字字串;該方法包括:將注音符號區分為複數注音群組,每一注音群組分別相關聯於不同的阿拉伯數字;從該數字字串的首位阿拉伯數字開始,將該數字字串依序分拆為一至多段子字串;將對應於每一子字串所包括阿拉伯數字的該/該等注音群組進行組合,用以取得對應於每一子字串的拼音集合;參照字典,從對應於每一子字串的拼音集合中進行篩選,用以取得每一子字串的可能文字集合;利用一字向量預測模型執行一文字預測程序。

Description

文字輸入方法及其電腦程式產品
本發明係有關於一種文字輸入方法,特別是有關於一種將數字字串轉換為對應的文字字串的文字輸入方法及電腦程式產品。
隨著數位機上盒愈來愈普遍,線上找片看片已成為很多人的日常。但除了幾種事先篩選過的影像,如最新、最熱門、最推薦等等,使用者要找一部自己想看卻不在幾個預篩選的名單裡,就需要用到搜尋功能。然而,現在的機上盒的遙控器並不適合用來做文字輸入,常需要外接鍵盤或滑鼠,或慢慢地用遙控器的方向按鈕,選取畫面上的虛擬鍵盤來做輸入。
對使用者來說,利用內建的虛擬輸入鍵盤,亦即用遙控器上的滑鼠模式且用遙控器的方向鍵做選擇,或是外接滑鼠直接點選,在使用上是既繁瑣而且不方便。
依據本發明一實施例之文字輸入的方法,適用於一電子裝置,該電子裝置透過一輸入裝置接收一數字字串,用以將該數字字串轉換為對應的一文字字串;該數字字串包括一至多個阿拉伯數字;該方法包括:將注音符號區分為複數注音群組,每一注音群組分別相關聯於不同的阿拉伯數字,並且每一注音群組中的注音符號僅具有聲母音或韻母音;從該數字字串的首位阿拉伯數字開始,將該數字字串依序分拆為一至多段子字串,其中,每一子字串包括一至三個阿拉伯數字,每一子字串的末位阿拉伯數字對應於僅具有韻母音的該等注音群組,並且該子字串的段數為該文字字串的字數;將對應於每一子字串所包括阿拉伯數字的該/該等注音群組進行組合,用以取得對應於每一子字串的拼音集合;參照字典,從對應於每一子字串的拼音集合中進行篩選,用以取得每一子字串的可能文字集合;利用一字向量預測模型執行一文字預測程序。該文字預測程序包括:將首段子字串的可能文字集合中的一文字輸入至該字向量預測模型,用以預測依序在該首段子字串之後的次段子字串的一預測文字;當該次段子字串的該預測文字有出現在該次段子字串的可能文字集合中時,將該次段子字串的該預測文字輸入至該字向量預測模型,用以預測依序在該次段子字串之後的第三段子字串的該預測文字;當每一子字串的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將該首段子字串的可能文字集合中的該文字與每一子字串的該預測文字依序組合,用以得到對應於該數字字串的該文字字串;當每一子字串的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將該首段子字串的可能文字集合中的該文字與每一子字串的該預測文字依序組合,用以得到對應於該數字字串的該文字字串。其中,每當將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,都重複執行該文字預測程序,直到將首段子字串的可能文字集合中的所有文字都輸入至該字向量預測模型為止。
如上述之文字輸入的方法,更包括:將所取得的該文字字串顯示於該電子裝置的顯示幕中,以供使用者選擇。
如上述之文字輸入的方法,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,則中斷該文字預測程序。
如上述之文字輸入的方法,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,並重複執行該文字預測程序。
依據本發明一實施例之電腦程式產品,用以將所接收一數字字串轉換為一文字字串,該數字字串包括一至多個阿拉伯數字;該電腦程式產品經由電腦載入該程式以執行:一數字注音關聯指令,使該電腦的一處理器將注音符號區分為複數注音群組,每一注音群組分別相關聯於不同的阿拉伯數字,並且每一注音群組中的注音符號僅具有聲母音或韻母音;一子字串產生指令,使該處理器從該數字字串的首位阿拉伯數字開始,將該數字字串依序分拆為一至多段子字串;其中,每一子字串包括一至三個阿拉伯數字,每一子字串的末位阿拉伯數字對應於僅具有韻母音的該等注音群組,並且該子字串的段數為該文字字串的字數;一拼音組合指令,使該處理器將對應於每一子字串所包括阿拉伯數字的該/該等注音群組進行組合,用以取得對應於每一子字串的拼音集合;一文字轉換指令,使該處理器參照字典,從對應於每一子字串的拼音集合中進行篩選,用以取得每一子字串的可能文字集合;一文字預測程序,使該處理器利用一字向量預測模型執行包括:將首段子字串的可能文字集合中的一文字輸入至該字向量預測模型,用以預測依序在該首段子字串之後的次段子字串的一預測文字;當該次段子字串的該預測文字有出現在該次段子字串的可能文字集合中時,將該次段子字串的該預測文字輸入至該字向量預測模型,用以預測依序在該次段子字串之後的第三段子字串的該預測文字;當每一子字串的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將該首段子字串的可能文字集合中的該文字與每一子字串的該預測文字依序組合,用以得到對應於該數字字串的該文字字串。其中,每當將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,都重複執行該文字預測程序,直到將首段子字串的可能文字集合中的所有文字都輸入至該字向量預測模型為止。
如上述之電腦程式產品,更包括一文字顯示指令,使該處理器將所取得的該文字字串顯示於該電腦的顯示幕中,以供使用者選擇。
如上述之電腦程式產品,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,則中斷該文字預測程序。
如上述之電腦程式產品,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,並重複執行該文字預測程序。
本發明所揭露的一文字輸入方法,係適用於一電子裝置。該電子裝置透過一輸入裝置接收一數字字串,用以將該數字字串轉換為對應的一文字字串。在本實施例中,該輸入裝置為一遙控器,但本發明不限於此。該遙控器上具有標示0到9阿拉伯數字的數字按鍵,用以將對應每一阿拉伯數字輸入至該電子裝置中。該電子裝置從該輸入裝置所接收的該數字字串可包括一至多個阿拉伯數字。舉例來說,使用者透過按壓該遙控器上的對應數字按鍵,該電子裝置可接收“5”、“12”、“456”、“7893”、…等數字字串,但不限於此。在本實施例中,標示0的數字按鍵為輸入終止鍵,當使用者按壓該遙控器上標示0的數字按鍵時,該電子裝置的顯示幕則會離開該文字輸入的使用者介面。
注音符號可分為21個聲母音 (ㄅ、ㄆ、ㄇ、ㄈ、ㄉ、ㄊ、ㄋ、ㄌ、ㄍ、ㄎ、ㄏ、ㄐ、ㄑ、ㄒ、ㄓ、ㄔ、ㄕ、ㄖ、ㄗ、ㄘ、ㄙ)、3個介音 (ㄧ、ㄨ、ㄩ),以及13個聲母音(ㄚ、ㄛ、ㄜ、ㄝ、ㄞ、ㄟ、ㄠ、ㄡ、ㄢ、ㄣ、ㄤ、ㄥ、ㄦ)。由於上述3個介音可單獨作為韻母音、或與其他韻母音組合,因此本發明的文字輸入方法係將上述3個介音(ㄧ、ㄨ、ㄩ)歸類為韻母音。
第1A、1B圖為本揭露實施例之文字輸入方法的流程圖。在步驟S100中,本發明的文字輸入方法首先將注音符號區分為複數注音群組,每一注音群組分別相關聯於不同的阿拉伯數字,並且每一注音群組中的注音符號僅具有聲母音或韻母音。第2圖為本揭露實施例之阿拉伯數字與注音符號關係圖。如第2圖所示,舉例來說,本發明的文字輸入方法將注音符號區分為9組注音群組,並將阿拉伯數字1~9各別分配給每一注音群組作為每一注音群組的指示符。阿拉伯數字1~5係關聯於聲母音,阿拉伯數字6~9係關聯於韻母音,其中,阿拉伯數字3關聯於注音符號(ㄍ、ㄎ、ㄏ、ㄐ)、阿拉伯數字6關聯於注音符號(ㄧ、ㄨ、ㄩ、ㄚ)。
接著,在步驟S200中,本發明的文字輸入方法從該數字字串的首位阿拉伯數字開始,將該數字字串依序分拆為一至多段子字串。其中,每一子字串包括一至三個阿拉伯數字,每一子字串的末位阿拉伯數字對應於僅具有韻母音的該等注音群組,亦即阿拉伯數字6~9的注音群組,並且該子字串的段數為該文字字串的字數。在中文字的拼音規則中,一中文字需由一聲母音以及至少一韻母音組合而成、兩韻母音組合而成,或單獨一韻母音成字。依據上述拼音規則,每一子字串的末位阿拉伯數字僅為阿拉伯數字6~9(韻母音)。舉例來說,當該電子裝置接收到數字字串“162716”,本發明的文字輸入方法依據該數字字串中對應於韻母音的阿拉伯數字,而將該數字字串分拆為3個子字串“16”、“27”、“16”。在本實施例中,每一子字串(例如,“16”、“27”、“16”)皆包括兩個阿伯數字,但不限於此。
在另一實施例中,當該電子裝置接收到數字字串“468”,由於阿拉伯數字6、8皆對應於僅具有韻母音的注音群組,本發明的文字輸入方法將該數字字串分拆為2個子字串“46”、“8”,或單獨一子字串“468”。由於每一子字串內的阿拉伯數字組合可對應於一文字的發音,因此上述2個子字串“46”、“8”可對應於2個文字,並且單獨一子字串“468”可對應於一文字。總而言之,子字串的段數為該文字字串的字數。
在步驟S300中,本發明的文字輸入方法將對應於每一子字串所包括阿拉伯數字的該/該等注音群組進行組合,用以取得對應於每一子字串的拼音集合。舉例來說,當該電子裝置接收到數字字串“468”, 本發明的文字輸入方法將該數字字串分拆為2個子字串“46”、“8”,或單獨一子字串“468”。子字串“46”表示注音符號(ㄑ、ㄒ、ㄓ、ㄔ)與注音符號(ㄧ、ㄨ、ㄩ、ㄚ),再加上一至四聲、輕聲的所有拼音集合,亦即總共4*4*5 = 80種拼音集合。同理,子字串“468”表示注音符號(ㄑ、ㄒ、ㄓ、ㄔ)、注音符號(ㄧ、ㄨ、ㄩ、ㄚ),與注音符號(ㄟ、ㄠ、ㄡ、ㄢ),再加上一至四聲、輕聲的所有拼音集合,亦即總共4*4*4*5 = 320種拼音集合。雖然子字串“46”可得到80種的拼音集合,以及子字串“468”可得到320種拼音集合,但並非拼音集合中的所有拼音都會出現在字典中,例如子字串“46”的拼音集合中的拼音(ㄓㄩ)及子字串“468”的拼音集合中的拼音(ㄑㄨㄟ)就沒有出現在字典中。因此,本發明的文字輸入方法需接著執行步驟S400,來將沒出現在字典中的拼音濾除。
在步驟S400中,本發明的文字輸入方法參照字典(例如:教育部國語辭典、康熙字典),從對應於每一子字串的拼音集合中進行篩選,用以取得每一子字串的可能文字集合。例如,當該電子裝置接收到數字字串“468”,本發明的文字輸入方法將該數字字串分拆為2個子字串“46”、“8”,則參照字典中的拼音及其對應文字,子字串“46”的可能文字集合可包括:七、其、起、器、去、希、序、朱、處、觸…等文字,但不限於此。同理,子字串“8”的可能文字集合可包括:凹、奧、拗、歐、嘔、安、暗…等文字,但不限於此。在另一實施例中,本發明的文字輸入方法將數字字串“468”設定為單一子字串“468”,因此子字串“468”的可能文字集合可包括:秋、球、糗、蕭、先、專、追、船、串…等文字,但不限於此。
在步驟S500中,本發明的文字輸入方法利用一字向量預測模型(例如:word2vec),執行一文字預測程序。在本實施例中,該字向量預測模型是透過詞向量訓練方法訓練而成。簡單來說,該詞向量訓練方法會使得意思相似的詞、慣用詞、專有名詞內的每一字在向量空間上比較靠近彼此,用以將詞義(字與字之間)上的關聯可以用詞向量在空間中的關係來表現。當本發明的文字輸入方法輸入一文字至該字向量預測模型,經過該字向量預測模型的運算,使得該字向量預測模型可輸出與所接收文字最相關的一輸出文字,用以根據上述輸入的文字預測下一個可能的字。
在本實施例中,該文字預測程序包括將首段子字串的可能文字集合中的一文字輸入至該字向量預測模型,用以預測依序在該首段子字串之後的次段子字串的一預測文字(步驟S510);當該次段子字串的該預測文字有出現在該次段子字串的可能文字集合中時,將該次段子字串的該預測文字輸入至該字向量預測模型,用以預測依序在該次段子字串之後的第三段子字串的該預測文字(步驟S520);以及當每一子字串的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將該首段子字串的可能文字集合中的該文字與每一子字串的該預測文字依序組合,用以得到對應於該數字字串的該文字字串(步驟S530)。
舉例來說,使用者為了要搜尋電影『鐵達尼號』,而依據第2圖的阿拉伯數字與注音符號關係圖,利用遙控器輸入一數字字串“267262638”至該電子裝置。當該電子裝置接收到該數字字串“267262638”, 本發明的文字輸入方法將該數字字串分拆為4個子字串“267”、“26”、“26”、“38”,並且各自取得子字串“267”、“26”、及“38”的可能文字集合。例如,子字串“267”的可能文字集合包括: 、帖、多、奪、朵、墮、爹、跌、羅、落…等文字。子字串“26”的可能文字集合包括:低、第、 、讀、踢、兔、 、努、那、盧…等文字。子字串“38”的可能文字集合包括:高、夠、乾、看、 、韓…等文字。
在步驟S510中,本發明的文字輸入方法將首段子字串的可能文字集合中的一文字,例如上述子字串“267”的可能文字集合的第一字『鐵』輸入至該字向量預測模型中,使得該字向量預測模型依據所輸入的文字『鐵』,產生第1組子字串“26”的一預測文字。在步驟S520中,當該第1組子字串的該預測文字有出現在該第1組子字串“26”的可能文字集合中時,將該第1組子字串“26”的該預測文字輸入至該字向量預測模型,用以預測第2組子字串“26”的該預測文字。舉例來說,當該第1組子字串“26”的該預測文字可包括:鏟、達、兔、尼、器、血、幕…等字,由於該第1組子字串“26”有出現在第1組子字串“26”的可能文字集合中(例如:達、兔、尼…等字),因此本發明的文字輸入方法再將第1組子字串“26”的該預測文字(例如:達、兔、尼…等文字)輸入至該字向量預測模型中。例如,本發明的文字輸入方法將第1組子字串“26”的該預測文字『達』輸入至該字向量預測模型中,使得該字向量模型輸出第2組子字串“26”的該預測文字 (例如:陣、尼、令…等字)。
由於該第2組子字串“26”的該預測文字有出現在第2組子字串“26”的可能文字集合中(例如:尼),則本發明的文字輸入方法再將第2組子字串“26”的該預測文字『尼』輸入至該字向量預測模型中,使得該字向量模型輸出子字串“38”的該預測文字(例如:號、僧、龍…等字)。由於該子字串“38”的該預測文字有出現在該子字串“38”的可能文字集合中(例如,號),則本發明的文字輸入方法完成了步驟S500中的該文字預測程序,進入步驟S530,當每一子字串(例如:子字串“267”、“26”、“26”、“38”)的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將該首段子字串的可能文字集合中的該文字(例如:鐵)與每一子字串的該預測文字(例如:達、尼、號)依序組合,用以得到對應於該數字字串的該文字字串,而輸出『鐵達尼號』於該電子裝置的顯示幕上,供使用者選擇。
在步驟S600中,每當將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,都重複執行該文字預測程序,直到將首段子字串的可能文字集合中的所有文字都輸入至該字向量預測模型為止。舉例來說,當將子字串“267”的可能文字集合的第一字『鐵』輸入至該字向量預測模型中,依據該文字預測程序(即步驟S510、S520、S530)而得到該文字字串為『鐵達尼號』後,本發明的文字輸入方法接著將子字串“267”的可能文字集合的第二字『帖』輸入至該字向量預測模型中,並重複執行該文字預測程序(即步驟S510、S520、S530),用以得到另一對應的該文字字串,直到將子字串“267”的可能文字集合中的所有文字都輸入至該字向量預測模型為止,用以得到所有對應的該文字字串。
然而,在執行該文字預測程序的過程中,並非子字串“267”的可能文字集合中的所有文字輸入至該字向量預測模型後,最後都能找到對應的該文字字串。舉例來說,當該次段子字串(例如:第1組子字串“26”)的該預測文字(例如:鏟、器、血…等文字)沒有出現在該次段子字串(例如:第1組子字串“26”)的可能文字集合(例如:低、第、 、讀、踢、兔、 、努、那、盧…等文字)中時,則中斷該文字預測程序。此時,本發明的文字輸入方法將首段子字串(例如:子字串“267”)的可能文字集合中的另一文字(例如:帖、多、奪、朵、墮、爹…等文字)輸入至該字向量預測模型,並重複執行該文字預測程序(即步驟S510、S520、S530)。
在一些實施例中,當該電子裝置接收到數字字串“162716”,本發明的文字輸入方法將該數字字串分拆為3個子字串“16”、“27”、“16”,並執行以下程式碼: While { K=0; For i=0, i>length(tensor[i]); { Pred_tensor[k] = tensor [0][i]; For j=0; j>char_num-1 Pred_tensor[k][j+1] = ai_predict(Pred_tensor[k][j]) If Pred_tensor[k][j] not in tensor[j+1] then { k=k-1; Break; } K=K+1; } }
程式碼中的tensor[i]為各個子字串中的可能文字集合。
程式碼中的length(tensor[i])為全部子字串的段數,即為該文字字串的字數。
程式碼中的char_num =3,以子字串“16”、“27”、“16”為例。
程式碼中的Pred_tensor[K] = tensor [0][i],取出第1組子字串“16”的可能文字集合中的一文字。
程式碼中的Pred_tensor[K][j+1] = ai_predict(Pred_tensor[K][j]),將第1組子字串“16”的可能文字集合中的該文字輸入至該字向量預測模型(ai_predict),用以預測依序在第1組子字串“16”之後的子字串“27”的一預測文字。
程式碼中的If Pred_tensor[k][j] not in tensor[j+1] then…k=k-1… Break,當該子字串“27”的該預測文字沒有出現在子字串“27”的可能文字集合中時,則k先退一位(k=k-1),即回到第1組子字串“16”的可能文字集合中準備選取另一字,並且中斷該文字預測程序。
程式碼中的If Pred_tensor[k][j] in tensor[j+1] then…K=K+1,當j迴圈完整走完,即當每一子字串的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將第1組子字串“16”的可能文字集合中的該文字與每一子字串(子字串“27”、第2組子字串“16”)的該預測文字依序組合,用以得到對應於該數字字串的該文字字串,並且將第1組子字串“16”的可能文字集合中的另一文字輸入至該字向量預測模型(K=K+1),並重複執行該文字預測程序。其中,該文字預測程序所得到的該文字字串的總個數即相等於k-1。K、i、j、k為大於等於0的整數。
本發明更揭露一種電腦程式產品,用以將所接收一數字字串轉換為一文字字串,該數字字串包括一至多個阿拉伯數字;該電腦程式產品經由電腦載入該程式以執行:一數字注音關聯指令、一子字串產生指令、一拼音組合指令、一文字轉換指令,以及一文字預測程序。該數字注音關聯指令使得該電腦的一處理器執行第1A圖的步驟S100。該子字串產生指令使得該處理器執行第1A圖的步驟S200。該拼音組合指令使得該處理器執行第1A圖的步驟S300。該文字轉換指令使得該處理器執行第1A圖的步驟S400。該文字預測程序使得該處理器執行第1A圖的步驟S500及步驟S600。其中,在該處理器執行步驟S500的過程中,包括執行第1B圖的步驟S510、步驟S520,以及步驟530。當本發明的電腦程式產品在執行該文字預測程序(步驟S500)時,若步驟S520中的該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時(亦即不滿足步驟S520的條件時),則該處理器中斷該文字預測程序,並且該處理器將步驟S510中的該首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,並重複執行該文字預測程序。
本發明的電腦程式產品,經由該電腦載入程式以執行更包括:一文字顯示指令,使得該電腦的該處理器將所取得的該文字字串顯示於該電腦的顯示幕中,以供使用者選擇。本發明的電腦程式產品所執行的步驟或動作係可直接對應本發明所揭露的文字輸入方法,本發明所揭露的文字輸入方法已於本案說明書第[0013]~[0034]段做詳細描述,故不再贅述。
本發明所揭露的文字輸入方法及電腦程式產品,利用了一字向量預測模型,使得使用者可以快速取得欲輸入的詞彙。此外,使用者只需輸入該詞彙的聲母音及韻母音所對應的阿拉伯數字,即可找到欲輸入的文字詞彙。本發明所揭露的文字輸入方法及電腦程式產品,主要特徵在於(Ⅰ)將所有注音符號分成聲母音及韻母音;(Ⅱ)利用AI詞向量技術訓練一個以文字找下一文字的字向量預測模型;(Ⅲ)經過本發明的文字輸入方法及電腦程式產品找出對應於所輸入數字字串的可能的詞彙,供使用者做最後選擇。
雖然本發明的實施例如上述所描述,我們應該明白上述所呈現的只是範例,而不是限制。依據本實施例上述示範實施例的許多改變是可以在沒有違反發明精神及範圍下被執行。因此,本發明的廣度及範圍不該被上述所描述的實施例所限制。更確切地說,本發明的範圍應該要以以下的申請專利範圍及其相等物來定義。
S100、S200、S300:步驟 S400、S500、S600:步驟 S510、S520、S530:步驟
第1A圖為本揭露實施例之文字輸入方法的流程圖。 第1B圖為本揭露實施例之文字輸入方法的流程圖。 第2圖為本揭露實施例之阿拉伯數字與注音符號關係圖。
S510、S520、S530、S600:步驟

Claims (8)

  1. 一種文字輸入的方法,適用於一電子裝置,該電子裝置透過一輸入裝置接收一數字字串,用以將該數字字串轉換為對應的一文字字串;該數字字串包括一至多個阿拉伯數字;該方法包括: 將注音符號區分為複數注音群組,每一注音群組分別相關聯於不同的阿拉伯數字,並且每一注音群組中的注音符號僅具有聲母音或韻母音; 從該數字字串的首位阿拉伯數字開始,將該數字字串依序分拆為一至多段子字串;其中,每一子字串包括一至三個阿拉伯數字,每一子字串的末位阿拉伯數字對應於僅具有韻母音的該等注音群組,並且該子字串的段數為該文字字串的字數; 將對應於每一子字串所包括阿拉伯數字的該/該等注音群組進行組合,用以取得對應於每一子字串的拼音集合; 參照字典,從對應於每一子字串的拼音集合中進行篩選,用以取得每一子字串的可能文字集合; 利用一字向量預測模型執行一文字預測程序,該文字預測程序包括: 將首段子字串的可能文字集合中的一文字輸入至該字向量預測模型,用以預測依序在該首段子字串之後的次段子字串的一預測文字; 當該次段子字串的該預測文字有出現在該次段子字串的可能文字集合中時,將該次段子字串的該預測文字輸入至該字向量預測模型,用以預測依序在該次段子字串之後的第三段子字串的該預測文字; 當每一子字串的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將該首段子字串的可能文字集合中的該文字與每一子字串的該預測文字依序組合,用以得到對應於該數字字串的該文字字串; 其中,每當將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,都重複執行該文字預測程序,直到將首段子字串的可能文字集合中的所有文字都輸入至該字向量預測模型為止。
  2. 如申請專利範圍第1項所述之文字輸入的方法,更包括:將所取得的該文字字串顯示於該電子裝置的顯示幕中,以供使用者選擇。
  3. 如申請專利範圍第1項所述之文字輸入的方法,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,則中斷該文字預測程序。
  4. 如申請專利範圍第3項所述之文字輸入的方法,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,並重複執行該文字預測程序。
  5. 一種電腦程式產品,用以將所接收一數字字串轉換為一文字字串,該數字字串包括一至多個阿拉伯數字;該電腦程式產品經由電腦載入該程式以執行: 一數字注音關聯指令,使該電腦的一處理器將注音符號區分為複數注音群組,每一注音群組分別相關聯於不同的阿拉伯數字,並且每一注音群組中的注音符號僅具有聲母音或韻母音; 一子字串產生指令,使該處理器從該數字字串的首位阿拉伯數字開始,將該數字字串依序分拆為一至多段子字串;其中,每一子字串包括一至三個阿拉伯數字,每一子字串的末位阿拉伯數字對應於僅具有韻母音的該等注音群組,並且該子字串的段數為該文字字串的字數; 一拼音組合指令,使該處理器將對應於每一子字串所包括阿拉伯數字的該/該等注音群組進行組合,用以取得對應於每一子字串的拼音集合; 一文字轉換指令,使該處理器參照字典,從對應於每一子字串的拼音集合中進行篩選,用以取得每一子字串的可能文字集合; 一文字預測程序,使該處理器利用一字向量預測模型執行包括: 將首段子字串的可能文字集合中的一文字輸入至該字向量預測模型,用以預測依序在該首段子字串之後的次段子字串的一預測文字; 當該次段子字串的該預測文字有出現在該次段子字串的可能文字集合中時,將該次段子字串的該預測文字輸入至該字向量預測模型,用以預測依序在該次段子字串之後的第三段子字串的該預測文字; 當每一子字串的該預測文字皆有分別出現在對應的每一子字串的可能文字集合中,則將該首段子字串的可能文字集合中的該文字與每一子字串的該預測文字依序組合,用以得到對應於該數字字串的該文字字串; 其中,每當將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,都重複執行該文字預測程序,直到將首段子字串的可能文字集合中的所有文字都輸入至該字向量預測模型為止。
  6. 如申請專利範圍第5項所述之電腦程式產品,更包括一文字顯示指令,使該處理器將所取得的該文字字串顯示於該電腦的顯示幕中,以供使用者選擇。
  7. 如申請專利範圍第5項所述之電腦程式產品,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,則中斷該文字預測程序。
  8. 如申請專利範圍第7項所述之電腦程式產品,其中,該文字預測程序更包括:當該次段子字串的該預測文字沒有出現在該次段子字串的可能文字集合中時,將首段子字串的可能文字集合中的另一文字輸入至該字向量預測模型,並重複執行該文字預測程序。
TW108132152A 2019-09-06 2019-09-06 文字輸入方法及其電腦程式產品 TWI710976B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW108132152A TWI710976B (zh) 2019-09-06 2019-09-06 文字輸入方法及其電腦程式產品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108132152A TWI710976B (zh) 2019-09-06 2019-09-06 文字輸入方法及其電腦程式產品

Publications (2)

Publication Number Publication Date
TWI710976B true TWI710976B (zh) 2020-11-21
TW202111615A TW202111615A (zh) 2021-03-16

Family

ID=74202449

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108132152A TWI710976B (zh) 2019-09-06 2019-09-06 文字輸入方法及其電腦程式產品

Country Status (1)

Country Link
TW (1) TWI710976B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200530866A (en) * 2004-03-12 2005-09-16 Silkroadtaiwan Inc System and method for symbolic character query word on reduce keyboard
CN102866782A (zh) * 2011-07-06 2013-01-09 哈尔滨工业大学 一种提高整句生成效率的输入法和输入法系统
US10268685B2 (en) * 2015-08-25 2019-04-23 Alibaba Group Holding Limited Statistics-based machine translation method, apparatus and electronic device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200530866A (en) * 2004-03-12 2005-09-16 Silkroadtaiwan Inc System and method for symbolic character query word on reduce keyboard
CN102866782A (zh) * 2011-07-06 2013-01-09 哈尔滨工业大学 一种提高整句生成效率的输入法和输入法系统
US10268685B2 (en) * 2015-08-25 2019-04-23 Alibaba Group Holding Limited Statistics-based machine translation method, apparatus and electronic device

Also Published As

Publication number Publication date
TW202111615A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
JP5513898B2 (ja) 共有された言語モデル
JP7194150B2 (ja) ドキュメントのベクトル化表現方法、ドキュメントのベクトル化表現装置及びコンピュータ機器
KR100891358B1 (ko) 사용자의 다음 문자열 입력을 예측하는 글자 입력 시스템및 그 글자 입력 방법
JP2010520531A (ja) 統合ピンイン及び画入力
JPH06138815A (ja) 手話/単語変換システム
WO2019208070A1 (ja) 質問応答装置、質問応答方法及びプログラム
JP2008243221A (ja) 文章入力装置及び方法
WO2020170912A1 (ja) 生成装置、学習装置、生成方法及びプログラム
WO2020000764A1 (zh) 一种面向印地语的多语言混合输入方法及装置
CN102915122A (zh) 基于语言模型的智能移动平台拼音输入法
RU2712101C2 (ru) Предсказание вероятности появления строки с использованием последовательности векторов
JPH07114558A (ja) 漢字変換訂正処理方式
TWI710976B (zh) 文字輸入方法及其電腦程式產品
CN101661334A (zh) 一种双拼输入法
Sharma et al. Word prediction system for text entry in Hindi
Ding et al. Simplified abugidas
WO2022131740A1 (en) Methods and systems for generating abbreviations for a target word
JP4207089B2 (ja) 文章入力装置及び方法
JP3664383B2 (ja) 日本語入力システム、日本語入力方法、および、記録媒体
JP4007400B2 (ja) 文章入力装置及び方法
CN111090720A (zh) 一种热词的添加方法和装置
WO2006094454A1 (fr) Traitement de mots ambigus et procede interactif de saisie de langue par lettres sur un pave numerique
TW201606527A (zh) 一種文字輸入的方法和裝置
TWI689829B (zh) 濃縮式快捷拼音輸入方法及其系統
Bonino et al. Exploring the history of American philosophy in a computer-assisted framework