TWI406139B - 具有聲調的拼音翻譯與拼音查詢系統及其方法 - Google Patents

具有聲調的拼音翻譯與拼音查詢系統及其方法 Download PDF

Info

Publication number
TWI406139B
TWI406139B TW99131993A TW99131993A TWI406139B TW I406139 B TWI406139 B TW I406139B TW 99131993 A TW99131993 A TW 99131993A TW 99131993 A TW99131993 A TW 99131993A TW I406139 B TWI406139 B TW I406139B
Authority
TW
Taiwan
Prior art keywords
chinese
pinyin
word
letter
index value
Prior art date
Application number
TW99131993A
Other languages
English (en)
Other versions
TW201214159A (en
Inventor
Chaucer Chiu
Cui Wu
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to TW99131993A priority Critical patent/TWI406139B/zh
Publication of TW201214159A publication Critical patent/TW201214159A/zh
Application granted granted Critical
Publication of TWI406139B publication Critical patent/TWI406139B/zh

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

具有聲調的拼音翻譯與拼音查詢系統及其方法
一種拼音翻譯與拼音查詢系統及其方法,尤其是指一種將漢語字詞翻譯轉換為具有聲調的拼音字母,以及將拼音字母查詢轉換為漢語字詞的拼音翻譯與拼音查詢系統及其方法。
對於現在多元化的社會,語言上的交流以及溝通越來越重要,由此發展出不同語言之間的翻譯系統,方便使用者查詢不同語言之間的翻譯解釋。
現有的翻譯系統,一般係為使用者輸入待查詢的字詞,在翻譯系統所設定的翻譯詞庫進行比對,當比對出待查詢字詞時,獲得不同語言之間的翻譯解釋並顯示給使用者,藉此獲得待查詢字詞之翻譯解釋,同時翻譯解釋還可一併顯示待查詢字詞的發音,以歐美語系來說,發音顯示的方式是顯示“KK音標”,藉以提供使用者瞭解待查詢字詞的發音;而對於漢語語系來說,發音顯示的方式會依據不同地區提供不同的顯示方式,以大陸地區而言,發音顯示的方式是顯示“拼音字母”,而以台灣地區而言,發音顯示的方式是顯示“注音符號”,藉以提供使用者瞭解待查詢字詞的發音。
但是,漢語的發音的聲調有五種不同的發音聲調,即一聲、二聲、三聲、四聲以及輕聲這五種,當採用“注音符號”方式來顯示發音,相對應的聲調都會具有相對應的顯示符號,此時並不會產生出問題,而當採用“拼音字母”方式來顯示發音時,由於拼音字母並不具有顯示聲調的顯示,因此會產生出待查詢字詞的發音不明確的問題。
綜上所述,可知先前技術中長期以來一直存在以拼音字母顯示漢語字詞的發音造成發音不明確的問題,因此有必要提出改進的技術手段,來解決此一問題。
有鑒於先前技術存在以拼音字母顯示漢語字詞的發音造成發音不明確的問題,本發明遂揭露一種具有聲調的拼音翻譯與拼音查詢系統及其方法,其中:本發明所揭露的具有聲調的拼音翻譯與拼音查詢系統,該翻譯與查詢系統包含:字母轉換資料表、漢語轉換資料表、接收模組、轉換模組、查詢模組、驗證模組、驗證資料表以及顯示模組。
其中,字母轉換資料表儲存有多筆字母轉換資料,每一筆字母轉換資料包含索引值、英文字母集合與拼音字母,其中拼音字母包含輔音以及與聲調結合的元音;漢語轉換資料表儲存有多筆漢語轉換資料,每一筆漢語轉換資料包含索引值組合與漢語單字,其中索引值組合包含兩個以上的索引值;接收模組是用以接收漢語字詞,或接收至少一拼音字母組合;當接收模組接收到漢語字詞,轉換模組依據漢語轉換資料表將漢語字詞的每一個單字轉換為對應的索引值組合;當接收模組接收到至少一拼音字母組合,轉換模組依據字母轉換資料表將每一個拼音字母組合轉換為至少一索引值組合;當轉換模組將漢語字詞的每一個單字轉換為對應的索引值組合,查詢模組依據索引值組合中的每一個索引值自字母轉換資料表查詢出對應的拼音字母;當轉換模組將每一個拼音字母組合轉換為至少一索引值組合,查詢模組依據至少一索引值組合自漢語轉換資料表查詢出對應的至少一漢語單字;驗證模組是當查詢模組查詢出對應的至少一漢語單字,依據拼音字母組合的順序將對應的至少一漢語單字組合為至少一漢語驗證字詞,並驗證至少一漢語驗證字詞是否為漢語的字詞;顯示模組是當查詢模組查詢出對應的拼音字母,依據索引值組合分別顯示拼音字母,其中每一個索引值組合之間以空白分隔拼音字母的顯示;當查詢模組查詢出對應的至少一漢語單字,且當驗證模組驗證至少一漢語驗證字詞為漢語的字詞,顯示被驗證的至少一漢語驗證字詞。
本發明所揭露的具有聲調的拼音翻譯與拼音查詢方法,該翻譯與查詢方法包含下列步驟:首先,預先建立字母轉換資料表,字母轉換資料表儲存有多筆字母轉換資料,每一筆字母轉換資料包含索引值、英文字母集合與拼音字母,其中拼音字母包含輔音以及與聲調結合的元音;接著,預先建立一漢語轉換資料表,漢語轉換資料表儲存有多筆漢語轉換資料,每一筆漢語轉換資料包含索引值組合與漢語單字,其中索引值組合包含兩個以上的索引值;最後,接收漢語字詞,或接收至少一拼音字母組合,其中:當接收到漢語字詞,依據漢語轉換資料表將漢語字詞的每一個單字轉換為對應的索引值組合;當接收到至少一拼音字母組合,依據字母轉換資料表將每一個拼音字母組合轉換為至少一索引值組合;當將漢語字詞的每一個單字轉換為對應的索引值組合,依據索引值組合中的每一個索引值自字母轉換資料表查詢出對應的拼音字母;當將每一個拼音字母組合轉換為至少一索引值組合,依據索引值組合自漢語轉換資料表查詢出對應的至少一漢語單字,並依據拼音字母組合的順序將對應的至少一漢語單字組合為至少一漢語驗證字詞,以驗證至少一漢語驗證字詞是否為漢語的字詞;當查詢出對應的拼音字母,依據索引值組合分別顯示拼音字母,其中每一個索引值組合之間以空白分隔拼音字母的顯示;以及當查詢出對應的至少一漢語單字,且驗證至少一漢語驗證字詞為漢語的字詞,顯示被驗證的至少一漢語驗證字詞。
本發明所揭露的系統與方法如上,與先前技術之間的差異在於本發明透過預先建立的字母轉換資料表以及漢語轉換資料表對使用者所輸入的漢語字詞或拼音字母組合進行轉換,當接收到漢語字詞,依據漢語轉換資料表將漢語字詞的每一個單字轉換為對應的索引值組合,再依據索引值組合中的每一個索引值自字母轉換資料表查詢出對應的拼音字母,即可依據索引值組合分別顯示拼音字母,其中每一個索引值組合之間以空白分隔拼音字母的顯示,藉以達到將漢語字詞翻譯轉換為拼音注音;而當接收到至少一拼音字母組合,依據字母轉換資料表將每一個拼音字母組合轉換為至少一索引值組合,再依據索引值組合自漢語轉換資料表查詢出對應的至少一漢語單字,並依據拼音字母組合的順序將對應的至少一漢語單字組合為至少一漢語驗證字詞,以驗證至少一漢語驗證字詞是否為漢語的字詞,即可顯示被驗證的至少一漢語驗證字詞,由此達成以拼音字母進行查詢漢語字詞的效果。
透過上述的技術手段,本發明可以達成以拼音注音顯示漢語字詞的發音,並提供使用者以拼音字母查詢漢語字詞的技術功效。
以下將配合圖式及實施例來詳細說明本發明的實施方式,藉此對本發明如何應用技術手段來解決技術問題並達成技術功效的實現過程能充分理解並據以實施。
以下首先要說明本發明所揭露的具有聲調的拼音翻譯與拼音查詢系統,並請參考「第1圖」所示,「第1圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢系統的系統方塊圖。
本發明所揭露的具有聲調的拼音翻譯與拼音查詢系統,該拼音翻譯與拼音查詢系統包含:字母轉換資料表11、漢語轉換資料表12、接收模組13、轉換模組14、查詢模組15、驗證模組16、驗證資料表17以及顯示模組18。
字母轉換資料表11是預先建立的,字母轉換資料表11中儲存有多筆字母轉換資料,請參考「第2A圖」,「第2A圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢的字母轉換資料表示意圖;每一筆字母轉換資料包含索引值111、英文字母集合112與拼音字母113,值得注意的是,拼音字母113包含輔音1131以及與聲調結合的元音1132,其中,拼音字母113的元音1132與英文字母集合112是多對一的對應關係,拼音字母113的輔音1131與英文字母集合112是一對一的對應關係。
具體而言,拼音字母113的輔音1131為“b”,拼音字母113的輔音1131“b”的索引值111為“0”,拼音字母113的輔音1131“b”的英文字母集合112為“b”,即字母轉換資料為索引值111為“0”、英文字母集合112為“b”以及拼音字母113為“b”。
而至於拼音字母113與聲調結合的元音1132為“a”,拼音字母113與聲調結合的元音1132“a”的索引值111分別為“23”、“24”、“25”、“26”以及“27”,拼音字母113與聲調結合的元音1132“a”的英文字母集合112皆為“a”,即字母轉換資料分為索引值111為“23”、英文字母集合112為“a”以及拼音字母113為輕聲“a”;索引值111為“24”、英文字母集合112為“a”以及拼音字母113為一聲“”;索引值111為“25”、英文字母集合112為“a”以及拼音字母113為二聲“”;索引值111為“26”、英文字母集合112為“a”以及拼音字母113為三聲“”;與索引值111為“27”、英文字母集合112為“a”以及拼音字母113為四聲“”。
漢語轉換資料表12亦為預先建立的,漢語轉換資料表12中儲存有多筆漢語轉換資料,請參考「第2B圖」所示,「第2B圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢的漢語轉換資料表示意圖,每一筆漢語轉換資料包含索引值組合121與漢語單字122,其中索引值組合121包含兩個以上的索引值111,漢語轉換資料表12中索引值組合121的索引值即為字母轉換資料表11中的索引值111,由於漢語單字122是為拼音字母113的輔音以及與聲調結合的元音所組合而成,且每一個拼音字母113會對應一個索引值111,藉此,每一個漢語單字122即會由兩個以上的索引值111所組成。
具體而言,以漢語單字122為“這”來說,漢語單字122為“這”的拼音字母113即分別為輔音1131“zh”以及與聲調結合的元音1132“”所組成,而輔音1131為“zh”所對應的索引值111為“14”,以及與聲調結合的元音1132為“”所對應的索引值111為“37”,藉此,漢語轉換資料即為索引值組合121為“[14,37]”以及漢語單字122為“這”;以漢語單字122為“是”來說,漢語單字122為“是”的拼音字母113即分別為輔音1131“sh”以及與聲調結合的元音1132“”所組成,而輔音1131為“sh”所對應的索引值111為“16”,以及與聲調結合的元音1132為“i”所對應的索引值111為“32”,藉此,漢語轉換資料即為索引值組合121為“[16,32]”以及漢語單字122為“是”。
接收模組13用以接收到使用者所輸入的漢語字詞,當接收到輸入的漢語字詞時,轉換模組14即會依據漢語轉換資料表12將漢語字詞的每一個單字轉換為對應的索引值組合121。
具體而言,假設使用者所輸入的漢語字詞為“這是”,接收模組13即會接收到漢語字詞“這是”,漢語字詞“這是”中的漢語單字122為“這”在漢語轉換資料表12中的漢語轉換資料為索引值組合121為“[14,37]”以及漢語單字122為“這”,並且漢語字詞“這是”中的漢語單字122為“是”在漢語轉換資料表12中的漢語轉換資料為索引值組合121為“[16,32]”以及漢語單字122為“是”,轉換模組14即會將漢語字詞“這是”的每一個單字(“這”以及“是”)轉換為對應的索引值組合121,其轉換結果為“[14,37]、[16,32]”。
當轉換模組14將接收模組13所接收漢語字詞的每一個單字轉換為對應的索引值組合121之後,查詢模組15會依據轉換模組14所轉換的索引值組合121中的每一個索引值111自字母轉換資料表11查詢出對應的拼音字母113。
承上述舉例說明,轉換模組14將接收模組13所接收的漢語字詞“這是”轉換為對應的索引值組合121為“[14,37]、[16,32]”,接著,查詢模組15即依照字母轉換資料表11查詢出“[14,37]、[16,32]”的每一個索引值111對應的拼音字母113。即查詢模組15會依據索引值111為“14”自字母轉換資料表11查詢出對應的拼音字母113為輔音1131“zh”;查詢模組15會依據索引值111為“37”自字母轉換資料表11查詢出對應的拼音字母113為與聲調結合的元音1132“”;查詢模組15會依據索引值111為“16”自字母轉換資料表11查詢出對應的拼音字母113為輔音1131“sh”,以及查詢模組15會依據索引值111為“32”自字母轉換資料表11查詢出對應的拼音字母113為與聲調結合的元音1132“”。
在查詢模組15依據索引值組合121的每一個索引值111查詢出對應的拼音字母113之後,顯示模組18即可依據索引值組合121分別顯示拼音字母113,其中每一個索引值組合121之間以空白分隔拼音字母113的顯示,藉此,以達成將漢語字詞翻譯轉換為拼音注音。
再次承上述舉例說明,當查詢模組15依據索引值組合121為“[14,37]、[16,32]”的每一個索引值111查詢出對應的拼音字母113分別為“zh”、“”、“zh”以及“”,顯示模組18會依據索引值組合121為“[14,37]”顯示“zh”,並且顯示模組18會依據索引值組合121為“[16,32]”顯示“sh”,並且“zh”與“sh”之間會以空白做為區隔,藉此,達成將漢語字詞翻譯轉換為拼音注音。
本發明還可以實現以拼音字母進行漢語字詞查詢,即當接收模組13接收到使用者所輸入的至少一拼音字母組合時,並且由於拼音字母是假借英文字母作為示意,因此,轉換模組14即會依據字母轉換資料表11將每一個拼音字母組合轉換為至少一索引值組合121。
具體而言,假設使用者所輸入的至少一拼音字母組合分別為“da”以及“ge”,接收模組13即會接收到拼音字母組合分別為“da”以及“ge”,拼音字母組合“da”中所假借的英文字母“d”在字母轉換資料表11(請參考「第2A圖」所示)中的字母轉換資料為索引值111為“4”、英文字母集合112為“d”以及拼音字母113為輔音1131“d”;拼音字母組合“da”中所假借的英文字母“a”在字母轉換資料表11中的字母轉換資料分別為索引值111為“23”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“a”;索引值111為“24”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“25”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“26”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”;與索引值111為“27”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”。
轉換模組14即會將拼音字母組合“da”轉換為對應的索引值組合121分別為“[4,23]”、“[4,24]”、“[4,25]”、“[4,26]”以及“[4,27]”。
拼音字母組合“ge”中所假借的英文字母“g”在字母轉換資料表11中的字母轉換資料為索引值111為“8”、英文字母集合112為“g”以及拼音字母113為輔音1131“g”;拼音字母組合“ge”中所假借的英文字母“e”在字母轉換資料表11中的字母轉換資料分別為索引值111為“33”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“e”;索引值111為“34”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“35”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“36”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”;與索引值111為“37”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”。
轉換模組14即會將拼音字母組合“ge”轉換為對應的索引值組合121分別為“[8,33]”、“[8,34]”、“[8,35]”、“[8,36]”以及“[8,37]”。
當轉換模組14將接收模組13所接收的每一個拼音字母組合轉換為對應的至少一索引值組合121之後,查詢模組15即會依據轉換模組14所轉換的至少一索引值組合121自漢語轉換資料表12查詢出對應的至少一漢語單字122。
承上述舉例說明,轉換模組14將接收模組13所接收的拼音字母組合“da”以及“ge”轉換為對應的索引值組合121為“[4,23]”、“[4,24]”、“[4,25]”、“[4,26]”以及“[4,27];[8,33]”、“[8,34]”、“[8,35]”、‘‘[8,36]”以及“[8,37]”,接著,查詢模組15即會依據轉換模組14所轉換的每一個索引值組合121自漢語轉換資料表12查詢出對應的至少一漢語單字122。
即查詢模組15會依據索引值組合121為“[4,23]”自漢語轉換資料表12查詢出對應的漢語單字122為“瘩”、依據索引值組合121為“[4,24]”查詢出對應的漢語單字122分為“搭”、“撘”…、依據索引值組合121為“[4,25]”查詢出對應的漢語單字122分為“答”、“達”、“妲”…、依據索引值組合121為“[4,26]”查詢出對應的漢語單字122為“打”以及依據索引值組合121為“[4,27]”查詢出對應的漢語單字122分為“大”、“亣”以及“詚”…。
查詢模組15會依據索引值組合121為“[8,33]”自漢語轉換資料表12查詢出對應的漢語單字122分為“個”以及“哥”、依據索引值組合121為“[8,34]”查詢出對應的漢語單字122分為“哥”、“歌”、“割”…、依據索引值組合121為“[8,35]”查詢出對應的漢語單字122分為“隔”、“革”…、依據索引值組合121為“[8,36]”查詢出對應的漢語單字122分為“葛”、“合”…以及依據索引值組合121為“[8,37]”查詢出對應的漢語單字122分為“各”、“個”、“鉻”…。
在查詢模組15依據每一個索引值組合121查詢出對應的漢語單字122之後,即會再藉由驗證模組16依據拼音字母組合的順序將對應的漢語單字122組合為至少一漢語驗證字詞,並將每一個被組合的漢語驗證字詞與驗證資料表17中的多個漢語的字詞進行比對,驗證資料表17是預先被建立並儲存有多筆驗證資料,每一筆驗證資料包含漢語的字詞,當至少一漢語驗證字詞與該驗證資料表中的多個漢語的字詞比對相符,則該至少一漢語驗證字詞即驗證為漢語的字詞。
承上述舉例說明,查詢模組15將每一個索引值組合121查詢出對應的漢語單字122,即會再藉由驗證模組16依據拼音字母組合的順序(即第一順序為“da”以及第二順序為“ge”)將對應的漢語單字122組合為至少一漢語驗證字詞,所組合的漢語驗證字詞分別為“答哥”、“達隔”、“大哥”、“達哥”…等,接著,將每一個被組合的漢語驗證字詞“答哥”、“達隔”、“大哥”、“達哥”…與驗證資料表17中漢語的字詞“大哥”、“達哥”、“朋友”、“義氣”…進行比對。
即可以比對出漢語驗證字詞“大哥”以及“達哥”與驗證資料表17中漢語的字詞“大哥”以及“達哥”比對相符,則漢語驗證字詞“大哥”以及“達哥”即驗證為漢語的字詞;而漢語驗證字詞“答哥”以及“達隔”與驗證資料表17中漢語的字詞“大哥”、“達哥”、“朋友”、“義氣”…比對不相符,則漢語驗證字詞“答哥”以及“達隔”即不會被驗證為漢語的字詞。此僅為舉例說明,事實上依據拼音字母組合的順序組合驗證字詞,並不以此侷限本發明的應用範疇。
當驗證模組16驗證每一個漢語驗證字詞是否為漢語的字詞之後,即可藉由顯示模組18顯示經驗證的漢語驗證字詞,再次承上述舉例說明,當驗證模組16驗證漢語驗證字詞“大哥”以及“達哥”為漢語的字詞,即可藉由顯示模組18顯示漢語驗證字詞“大哥”以及“達哥”。由此達成以拼音字母進行查詢漢語字詞的效果。
接著,以下將以一個實施例來解說本發明的運作方式及流程,並請同時參考「第1圖」、「第2A圖」、「第2B圖」以及「第3圖」所示,「第3圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢方法的方法流程圖。
字母轉換資料表11是被預先建立的,字母轉換資料表11中儲存有多筆字母轉換資料,而每一筆字母轉換資料包含索引值111、英文字母集合112與拼音字母113(步驟100),至於字母轉換資料表11的內容示意可以參考「第2A圖」所示,在此不再進行贅述。
漢語轉換資料表12亦被預先被建立的,漢語轉換資料表12中儲存有多筆漢語轉換資料,而每一筆漢語轉換資料包含索引值組合121與漢語單字122,其中索引值組合121包含兩個以上的索引值111(步驟200),漢語轉換資料表12的內容示意可以參考「第2B圖」所示,在此不再進行贅述。
接著,請同時參考「第1圖」、「第3圖」以及「第4A圖」所示,「第4A圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢的第一實施態樣介面示意圖。
當使用者於使用者介面20中的輸入區域21中輸入漢語字詞“這是”,即可透過接收模組13接收使用者於輸入區域21中所輸入的漢語字詞“這是”(步驟110)。
接著,轉換模組14會先將漢語字詞“這是”中的漢語單字122為“這”依據漢語轉換資料表12(請參考「第2B圖」所示)中的漢語轉換資料中索引值組合121為“[14,37]”以及漢語單字122為“這”,轉換模組14即可將漢語單字122為“這”轉換為對應的索引值組合121為“[14,37]”;轉換模組14再將漢語字詞“這是”中的漢語單字122為“是”依據漢語轉換資料表12中的漢語轉換資料中索引值組合121為“[16,32]”以及漢語單字122為“是”,轉換模組14即可將漢語單字122為“是”轉換為對應的索引值組合121為“[16,32]”,即轉換模組14會依據漢語轉換資料表12將漢語字詞的每一個單字轉換為對應的索引值組合121(步驟120)。
在轉換模組14將漢語字詞“這是”轉換為對應的索引值組合121為“[14,37]、[16,32]”之後,接著,查詢模組15即會依據轉換模組14所轉換索引值組合121為“[14,37]、[16,32]”的每一個索引值111即索引值111為“14”、索引值111為“37”、索引值111為“16”以及索引值111為“32”自字母轉換資料表11(請參考「第2A圖」所示)查詢出對應的拼音字母113(步驟130)。
即查詢模組15會依據索引值111為“14”自字母轉換資料表11查詢出對應的拼音字母113為輔音1131“zh”;查詢模組15會依據索引值111為“37”自字母轉換資料表11查詢出對應的拼音字母113為與聲調結合的元音1132“”;查詢模組15會依據索引值111為“16”自字母轉換資料表11查詢出對應的拼音字母113為輔音1131“sh”,以及查詢模組15會依據索引值111為“32”自字母轉換資料表11查詢出對應的拼音字母113為與聲調結合的元音1132“”。
接著,當查詢模組15依據索引值組合121為“[14,37]、[16,32]”的每一個索引值111查詢出對應的拼音字母113分別為“zh”、“”、“sh”以及“”,顯示模組18會依據索引值組合121為“[14,37]”將“zh”顯示於使用者介面20的顯示區域22中,並且顯示模組18會依據索引值組合121為“[16,32]”將“sh”顯示於使用者介面20的顯示區域22中,並且“zh”與“sh”之間會以空白做為區隔(步驟140),其顯示結果的示意請參考「第4B圖」所示,「第4B圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢的第一實施態樣顯示結果示意圖。
透過上述過程,即可以將使用者於使用者介面20中輸入區域21所輸入的漢語字詞“這是”翻譯轉換為拼音注音為“zhsh”。
接著,本發明還可以實現以拼音字母進行漢語字詞查詢,請同時參考「第1圖」、「第5圖」以及「第6A圖」所示,「第5圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢方法的方法流程圖;「第6A圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢的第二實施態樣介面示意圖。
當使用者於使用者介面20中的輸入區域21中輸入拼音字母組合分別為“da”以及“ge”,即可透過接收模組13接收使用者於輸入區域21中所輸入的拼音字母組合為“da”以及“ge”(步驟210)。
接著,由於拼音字母是假借英文字母作為示意,因此,轉換模組14會先將拼音字母組合“da”中所假借的英文字母“d”依據字母轉換資料表11(請參考「第2A圖」所示)中的字母轉換資料中索引值111為“4”、英文字母集合112為“d”以及拼音字母113為輔音1131“d”。
並且轉換模組14再將拼音字母組合“da”中所假借的英文字母“a”依據字母轉換資料表11中的字母轉換資料分別為索引值111為“23”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“a”;索引值111為“24”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“25”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“26”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”;與索引值111為“27”、英文字母集合112為“a”以及拼音字母113為與聲調結合的元音1132“”。
轉換模組14即可將拼音字母組合“da”轉換為對應的索引值組合121分別為“[4,23]”、“[4,24]”、“[4,25]”、“[4,26]”以及“[4,27]”(步驟220)。
轉換模組14接著會將拼音字母組合“ge”中所假借的英文字母“g”依據字母轉換資料表11中的字母轉換資料為索引值111為“8”、英文字母集合112為“g”以及拼音字母113為輔音1131“g”。
並且轉換模組14再將拼音字母組合“ge”中所假借的英文字母“e”依據字母轉換資料表11中的字母轉換資料分別為索引值111為“33”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“e”;索引值111為“34”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“35”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”;索引值111為“36”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”;與索引值111為“37”、英文字母集合112為“e”以及拼音字母113為與聲調結合的元音1132“”。
轉換模組14即可將拼音字母組合“ge”轉換為對應的索引值組合121分別為“[8,33]”、“[8,34]”、“[8,35]”、“[8,36]”以及“[8,37]”(步驟220)。
接著,查詢模組15即會依據轉換模組14所轉換的每一個索引值組合121自漢語轉換資料表12查詢出對應的至少一漢語單字122。
即查詢模組15會依據索引值組合121為“[4,23]”自漢語轉換資料表12查詢出對應的漢語單字122為“瘩”、依據索引值組合121為“[4,24]”查詢出對應的漢語單字122分為“搭”、“撘”…、依據索引值組合121為“[4,25]”查詢出對應的漢語單字122分為“答”、“達”、“妲”…、依據索引值組合121為“[4,26]”查詢出對應的漢語單字122為“打”以及依據索引值組合121為“[4,27]”查詢出對應的漢語單字122分為“大”、“亣”以及“詚”…。
查詢模組15會依據索引值組合121為“[8,33]”自漢語轉換資料表12查詢出對應的漢語單字122分為“個”以及“哥”、依據索引值組合121為“[8,34]”查詢出對應的漢語單字122分為“哥”、“歌”、“割”…、依據索引值組合121為“[8,35]”查詢出對應的漢語單字122分為“隔”、“革”…、依據索引值組合121為“[8,36]”查詢出對應的漢語單字122分為“葛”、“合”…以及依據索引值組合121為“[8,37]”查詢出對應的漢語單字122分為“各”、“個”、“鉻”…。
接著,再藉由驗證模組16依據拼音字母組合的順序(即第一順序為“da”以及第二順序為“ge”)將對應的漢語單字122組合為至少一漢語驗證字詞,所組合的漢語驗證字詞分別為“答哥”、“達隔”、“大哥”、“達哥”…等,接著,將每一個被組合的漢語驗證字詞“答哥”、“達隔”、“大哥”、“達哥”…與驗證資料表17中漢語的字詞“大哥”、“達哥”、“朋友”、“義氣”…進行比對。
即可以比對出漢語驗證字詞“大哥”以及“達哥”與驗證資料表17中漢語的字詞“大哥”以及“達哥”比對相符,則漢語驗證字詞“大哥”以及“達哥”即驗證為漢語的字詞(步驟230);而漢語驗證字詞“答哥”以及“達隔”與驗證資料表17中漢語的字詞“大哥”、“達哥”、“朋友”、“義氣”…比對不相符,則漢語驗證字詞“答哥”以及“達隔”即不會被驗證為漢語的字詞。
顯示模組18即會將被驗證模組16所驗證的漢語驗證字詞“大哥”以及“達哥”顯示於使用者介面20的顯示區域22中(步驟240),其顯示結果的示意請參考「第6B圖」所示,「第6B圖」繪示為本發明具有聲調的拼音翻譯與拼音查詢的第二實施態樣顯示結果示意圖。
透過上述過程,即可以將使用者於使用者介面20中輸入區域21所輸入的拼音字母組合“da”以及“ge”查詢出對應的漢語字詞為“大哥”,由此達成以拼音字母進行查詢漢語字詞的效果。
綜上所述,可知本發明與先前技術之間的差異在於本發明透過預先建立的字母轉換資料表以及漢語轉換資料表對使用者所輸入的漢語字詞或拼音字母組合進行轉換,當接收到漢語字詞,依據漢語轉換資料表將漢語字詞的每一個單字轉換為對應的索引值組合,再依據索引值組合中的每一個索引值自字母轉換資料表查詢出對應的拼音字母,即可依據索引值組合分別顯示拼音字母,其中每一個索引值組合之間以空白分隔拼音字母的顯示,藉以達成將漢語字詞翻譯轉換為拼音注音;而當接收到至少一拼音字母組合,依據字母轉換資料表將每一個拼音字母組合轉換為至少一索引值組合,再依據索引值組合自漢語轉換資料表查詢出對應的至少一漢語單字,並依據拼音字母組合的順序將對應的至少一漢語單字組合為至少一漢語驗證字詞,以驗證至少一漢語驗證字詞是否為漢語的字詞,即可顯示被驗證的至少一漢語驗證字詞,由此達成以拼音字母進行查詢漢語字詞的效果。
藉由此一技術手段可以來解決先前技術所存在以拼音字母顯示漢語字詞發音造成發音不明確的問題,進而達成以拼音注音顯示漢語字詞的發音,並提供使用者以拼音字母查詢漢語字詞的技術功效。
雖然本發明所揭露的實施方式如上,惟所述的內容並非用以直接限定本發明的專利保護範圍。任何本發明所屬技術領域中具有通常知識者,在不脫離本發明所揭露的精神和範圍的前提下,可以在實施的形式上及細節上作些許的更動。本發明的專利保護範圍,仍須以所附的申請專利範圍所界定者為準。
11...字母轉換資料表
111...索引值
112...英文字母集合
113...拼音字母
1131...輔音
1132...元音
12...漢語轉換資料表
121...索引值組合
122...漢語單字
13...接收模組
14...轉換模組
15...查詢模組
16...驗證模組
17...驗證資料表
18...顯示模組
20...使用者介面
21...輸入區域
22...顯示區域
步驟100 預先建立字母轉換資料表,字母轉換資料表儲存有多筆字母轉換資料,每一筆字母轉換資料包含索引值、英文字母集合與拼音字母,其中拼音字母包含輔音以及與聲調結合的元音
步驟200 預先建立一漢語轉換資料表,漢語轉換資料表儲存有多筆漢語轉換資料,每一筆漢語轉換資料包含索引值組合與漢語單字,其中索引值組合包含兩個以上的索引值
步驟110 接收漢語字詞
步驟120 當接收到漢語字詞,依據漢語轉換資料表將漢語字詞的每一個單字轉換為對應的索引值組合
步驟130 當將漢語字詞的每一個單字轉換為對應的索引值組合,依據索引值組合中的每一個索引值自字母轉換資料表查詢出對應的拼音字母
步驟140 當查詢出對應的拼音字母,依據索引值組合分別顯示拼音字母,其中每一個索引值組合之間以空白分隔拼音字母的顯示
步驟210 接收至少一拼音字母組合
步驟220 當接收到至少一拼音字母組合,依據字母轉換資料表將每一個拼音字母組合轉換為至少一索引值組合
步驟230 當將每一個拼音字母組合轉換為至少一索引值組合,依據索引值組合自漢語轉換資料表查詢出對應的至少一漢語單字,並依據拼音字母組合的順序將 對應的至少一漢語單字組合為至少一漢語驗證字詞,以驗證至少一漢語驗證字詞是否為漢語的字詞
步驟240 當查詢出對應的至少一漢語單字,且驗證至少一漢語驗證字詞為漢語的字詞,顯示被驗證的至少一漢語驗證字詞
第1圖繪示為本發明具有聲調的拼音翻譯與拼音查詢系統的系統方塊圖。
第2A圖繪示為本發明具有聲調的拼音翻譯與拼音查詢的字母轉換資料表示意圖。
第2B圖繪示為本發明具有聲調的拼音翻譯與拼音查詢的漢語轉換資料表示意圖。
第3圖繪示為本發明具有聲調的拼音翻譯與拼音查詢方法的方法流程圖。
第4A圖繪示為本發明具有聲調的拼音翻譯與拼音查詢的第一實施態樣介面示意圖。
第4B圖繪示為本發明具有聲調的拼音翻譯與拼音查詢的第一實施態樣顯示結果示意圖。
第5圖繪示為本發明具有聲調的拼音翻譯與拼音查詢方法的方法流程圖。
第6A圖繪示為本發明具有聲調的拼音翻譯與拼音查詢的第二實施態樣介面示意圖。
第6B圖繪示為本發明具有聲調的拼音翻譯與拼音查詢的第二實施態樣顯示結果示意圖。
11...字母轉換資料表
12...漢語轉換資料表
13...接收模組
14...轉換模組
15...查詢模組
16...驗證模組
17...驗證資料表
18...顯示模組

Claims (6)

  1. 一種具有聲調的拼音翻譯與拼音查詢系統,該翻譯與查詢系統包含:一字母轉換資料表,該字母轉換資料表儲存有多筆字母轉換資料,每一筆字母轉換資料包含一索引值、一英文字母集合與一拼音字母,其中該拼音字母包含輔音以及與聲調結合的元音;一漢語轉換資料表,該漢語轉換資料表儲存有多筆漢語轉換資料,每一筆漢語轉換資料包含一索引值組合與一漢語單字,其中該索引值組合包含兩個以上的該索引值;一接收模組,用以接收一漢語字詞,或接收至少一拼音字母組合;一轉換模組,當該接收模組接收到該漢語字詞,該轉換模組依據該漢語轉換資料表將該漢語字詞的每一個單字轉換為對應的該索引值組合;當該接收模組接收到該至少一拼音字母組合,該轉換模組依據該字母轉換資料表將每一個拼音字母組合轉換為至少一該索引值組合;一查詢模組,當該轉換模組將該漢語字詞的每一個單字轉換為對應的該索引值組合,該查詢模組依據該索引值組合中的每一個索引值自該字母轉換資料表查詢出對應的該拼音字母;當該轉換模組將每一個拼音字母組合轉換為至少一該索引值組合,該查詢模組依據至少一該索引值組合自該漢語轉換資料表查詢出對應的至少一該漢語單字;一驗證模組,當該查詢模組查詢出對應的至少一該漢語單字,依據該拼音字母組合的順序將對應的該至少一該漢語單字組合為至少一漢語驗證字詞,並驗證該至少一漢語驗證字詞是否為漢語的字詞;及一顯示模組,當該查詢模組查詢出對應的該拼音字母,依據該索引值組合分別顯示該拼音字母,其中每一個索引值組合之間以空白分隔該拼音字母的顯示;當該查詢模組查詢出對應的該至少一該漢語單字,且當該驗證模組驗證該至少一漢語驗證字詞為漢語的字詞,顯示被驗證的該至少一漢語驗證字詞。
  2. 如申請專利範圍第1項所述的具有聲調的拼音翻譯與拼音查詢系統,其中該驗證模組是將該至少一漢語驗證字詞與一驗證資料表中的多個漢語的字詞進行比對,當該至少一漢語驗證字詞與該驗證資料表中的多個漢語的字詞比對相符,則該至少一漢語驗證字詞即驗證為漢語的字詞。
  3. 如申請專利範圍第2項所述的具有聲調的拼音翻譯與拼音查詢系統,其中該驗證資料表儲存有多筆驗證資料,每一筆驗證資料包含漢語的字詞。
  4. 一種具有聲調的拼音翻譯與拼音查詢方法,該翻譯與查詢方法包含下列步驟:預先建立一字母轉換資料表,該字母轉換資料表儲存有多筆字母轉換資料,每一筆字母轉換資料包含一索引值、一英文字母集合與一拼音字母,其中該拼音字母包含輔音以及與聲調結合的元音;預先建立一漢語轉換資料表,該漢語轉換資料表儲存有多筆漢語轉換資料,每一筆漢語轉換資料包含一索引值組合與一漢語單字,其中該索引值組合包含兩個以上的該索引值;及接收一漢語字詞,或接收至少一拼音字母組合,其中:當接收到該漢語字詞,依據該漢語轉換資料表將該漢語字詞的每一個單字轉換為對應的該索引值組合;當接收到該至少一拼音字母組合,依據該字母轉換資料表將每一個拼音字母組合轉換為至少一該索引值組合;當將該漢語字詞的每一個單字轉換為對應的該索引值組合,依據該索引值組合中的每一個索引值自該字母轉換資料表查詢出對應的該拼音字母;當將每一個拼音字母組合轉換為至少一該索引值組合,依據至少一該索引值組合自該漢語轉換資料表查詢出對應的至少一該漢語單字,並依據該拼音字母組合的順序將對應的該至少一該漢語單字組合為至少一漢語驗證字詞,以驗證該至少一漢語驗證字詞是否為漢語的字詞;當查詢出對應的該拼音字母,依據該索引值組合分別顯示該拼音字母,其中每一個索引值組合之間以空白分隔該拼音字母的顯示;及當查詢出對應的該至少一該漢語單字,且驗證該至少一漢語驗證字詞為漢語的字詞,顯示被驗證的該至少一漢語驗證字詞。
  5. 如申請專利範圍第4項所述的具有聲調的拼音翻譯與拼音查詢方法,其中當將每一個拼音字母組合轉換為該索引值組合,依據該索引值組合自該漢語轉換資料表查詢出對應的至少一該漢語單字,並依據該拼音字母組合的順序將該至少一該漢語單字組合為至少一漢語驗證字詞,以驗證該至少一漢語驗證字詞是否為漢語的字詞的步驟是將該至少一漢語驗證字詞與一驗證資料表中的多個漢語的字詞進行比對,當該至少一漢語驗證字詞與該驗證資料表中的多個漢語的字詞比對相符,則該至少一漢語驗證字詞即驗證為漢語的字詞。
  6. 如申請專利範圍第5項所述的具有聲調的拼音翻譯與拼音查詢方法,其中該驗證資料表儲存有多筆驗證資料,每一筆驗證資料包含漢語的字詞。
TW99131993A 2010-09-21 2010-09-21 具有聲調的拼音翻譯與拼音查詢系統及其方法 TWI406139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW99131993A TWI406139B (zh) 2010-09-21 2010-09-21 具有聲調的拼音翻譯與拼音查詢系統及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW99131993A TWI406139B (zh) 2010-09-21 2010-09-21 具有聲調的拼音翻譯與拼音查詢系統及其方法

Publications (2)

Publication Number Publication Date
TW201214159A TW201214159A (en) 2012-04-01
TWI406139B true TWI406139B (zh) 2013-08-21

Family

ID=46786419

Family Applications (1)

Application Number Title Priority Date Filing Date
TW99131993A TWI406139B (zh) 2010-09-21 2010-09-21 具有聲調的拼音翻譯與拼音查詢系統及其方法

Country Status (1)

Country Link
TW (1) TWI406139B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980390A (zh) * 2016-01-18 2017-07-25 富士通株式会社 辅助翻译输入方法和辅助翻译输入设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050209844A1 (en) * 2004-03-16 2005-09-22 Google Inc., A Delaware Corporation Systems and methods for translating chinese pinyin to chinese characters
TW200923720A (en) * 2007-11-22 2009-06-01 Inventec Besta Co Ltd Chinese characters searching system with selecting its phonic symbols and method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050209844A1 (en) * 2004-03-16 2005-09-22 Google Inc., A Delaware Corporation Systems and methods for translating chinese pinyin to chinese characters
TW200923720A (en) * 2007-11-22 2009-06-01 Inventec Besta Co Ltd Chinese characters searching system with selecting its phonic symbols and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980390A (zh) * 2016-01-18 2017-07-25 富士通株式会社 辅助翻译输入方法和辅助翻译输入设备

Also Published As

Publication number Publication date
TW201214159A (en) 2012-04-01

Similar Documents

Publication Publication Date Title
US20180144747A1 (en) Real-time caption correction by moderator
TWI293455B (en) System and method for disambiguating phonetic input
US20180143956A1 (en) Real-time caption correction by audience
US8290775B2 (en) Pronunciation correction of text-to-speech systems between different spoken languages
CN1191514C (zh) 处理中文文本的系统和方法
US20070100619A1 (en) Key usage and text marking in the context of a combined predictive text and speech recognition system
US20070288240A1 (en) User interface for text-to-phone conversion and method for correcting the same
US20120296647A1 (en) Information processing apparatus
WO2010069132A1 (zh) 一种用于交互式公式排版软件的公式输入方法及系统
JPWO2008114453A1 (ja) 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム
CA2496872C (en) Phonetic and stroke input methods of chinese characters and phrases
JP2011076384A (ja) 情報出力装置及び情報出力プログラム
WO2018198807A1 (ja) 翻訳装置
WO2008018274A1 (fr) dispositif de conversion de caractère et procédé de commande de dispositif de conversion de caractère
US20110022378A1 (en) Translation system using phonetic symbol input and method and interface thereof
TWI406139B (zh) 具有聲調的拼音翻譯與拼音查詢系統及其方法
CN102609410A (zh) 规范文档辅助写作系统及规范文档生成方法
CN101533311A (zh) 笔画类汉字输入法
CN100561469C (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
JP2006235916A (ja) テキスト解析装置およびテキスト解析方法ならびに音声合成装置
JP2010073177A (ja) 国際対応型日本語入力システム
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
JP2015060038A (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
KR20090000858A (ko) 멀티모달 기반의 정보 검색 장치 및 방법

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees