TWI281111B - System and method for identifying corresponding translation - Google Patents

System and method for identifying corresponding translation Download PDF

Info

Publication number
TWI281111B
TWI281111B TW93138040A TW93138040A TWI281111B TW I281111 B TWI281111 B TW I281111B TW 93138040 A TW93138040 A TW 93138040A TW 93138040 A TW93138040 A TW 93138040A TW I281111 B TWI281111 B TW I281111B
Authority
TW
Taiwan
Prior art keywords
sentence
translation
natural
original
vocabulary
Prior art date
Application number
TW93138040A
Other languages
English (en)
Other versions
TW200530856A (en
Inventor
Jacobson Yoko
Original Assignee
Lab For Language Technology In
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lab For Language Technology In filed Critical Lab For Language Technology In
Publication of TW200530856A publication Critical patent/TW200530856A/zh
Application granted granted Critical
Publication of TWI281111B publication Critical patent/TWI281111B/zh

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

1281111 九、發明說明: 【發明所屬之技術領域】 本發明係有關用於識別一種相對應的翻譯之系 統、褽置與程式’特別是有關一原始語言寫的一原始 句子中,至少識別一翻譯字彙之翻譯之翻譯識別系 統,與用以識別應用於一翻譯識別系統之一翻譯之裝 置,以及用以允許一電腦具備上述翻譯識別系統之功 能之程式。 【先前技術】 預期能夠了解一機器翻譯系統將敘述於某一自 然語言(natural language)中之一句子(一原始句子 original sentence)翻譯成為敘述於另一語言中(一對 象語言:an object language)之一句子(翻譯的句子)已 有很長的時間,並且提過很多有關機器翻譯改進之技 術。 例如,曰本專利申請公告卜比加 Application Laid-Open : JP-A)^ 11-328178 # ^ij ^ 屋口技術其中一片语所表示的一組表現型式 (expression forms)係儲存於一硬體裝置所安裝之一英 語_日語片語辭典之中,以及在語法分析過程之英文 原文中檢索輕合協調連接(co〇rciinating c〇njunetiQn) 之包含字彙的表現型式,並且當檢索表示表格儲存於 央語-日語片語辭典時,或當識別一包含檢索表現型 式之字彙的字首(prefix)或字尾(suffix)時,檢索表現 1281111 型式視為一詞素(morpheme)以分析一句子結構,並且 不需分開字彙。 此外,曰本專利申請公告_公開(Jp_A)第 06 314294就專利揭露一技術,其中事先儲存每個多 意(mUltivocal)字彙之特性表格㈣⑽咖仏仏t齡)相 關涵義(meanings)與特性,以及產生第一語言寫於輸 入的原始句子中之一特性紀錄,並且基於產生的特性 表私與儲存的特性表格相比較之原始句子所處理之 特性而撿選與顯示一多意字彙之涵義。 【發明内容】 、、將敘述於一原始語言中之一原始句子,翻譯成為 敘述於一對象語言(object language)中之一翻譯句子 作,係透過—翻譯過程來完成,其中敘述於原始 言 :言中之原#句子之字彙轉㉟成為_象語言中之字 彙’並^基於了解句子通常包含字彙和文法以及依據 對象語言之文法規則,重新排列所轉換的字彙。翻譯 過程係採取利電腦來執行翻譯之機H翻譯,並且相 對應的翻譯之系統係按照字彙單s (word unit)登錄於 辭典’而字彙係順序從原始句子中棟選,並且重複檢 ,所揀選字彙之相對應的翻譯,以將原始句子按照字 彙單元置換成為相對應的翻譯,並且識別一部分古詞 (speech)之每個字彙以分析句子結構,基於經常^ 之句子結構之分析結果以及根據對象語言之文法規 則,按照字彙單it $新排列相對應的翻譯,以得到慣 1281111 用(generaUy used)之翻譯句子(相對應的翻譯)。 在機器翻譯中’即使原始句子u板片語 (ste酬yped phrase)可以應用敘述於日本專利 號專利之技術,並且具有得到上述片語之 可月b的合適翻譯,即使存在於原始句子中之一多立字 彙,也可以運用敘述於日本專利申請第Q6_3i4294^ =利之技術可能得到上述多意字彙之特定翻譯(敘述 二t專利申請第〇6_314294號專利之技術需要複雜 作,例如分析撿選多意字彙與含意以及撿選多意 子菜之特性,以事先準備特性表格)。然而,在機哭 Ϊ科,因騎使㈣_料有文法錯誤以及按;I 字菜單元翻譯也沒有錯誤,仍然常發生非自:、 (咖加叫發現翻譯的句子作為一對象語言之句子’、,、、 即使運用敘述於,例如日本專利第u_328i78號 =3⑽4號專利之技術’實際情況係機器翻敎技 術仍U能得到實際使用之適合的翻譯精確性。 譯過:事貫情況之起因係採用機器翻譯之翻 一::門用他們的母語(native language)說或寫 _ "〗月』不同於創造-個句子之過程。也就是 :兄’虽人們用他們的母語說或寫一句子時,過程中他 門運用文法規則而㈣未使料的字彙,但是 上,基於取決於上下文的宏美 ' 的背景知識之後Ϊ累;'於果一之㈣及㈣本身片語 一ks)之數目(含意之/、1別二之龐大詞塊 、里·子果、片浯、刻板措辭 1281111 (St⑽typed expressi〇ns)、排歹卜句子結構,以及句 t)中’連接其所檢索(根據情況而撿選)之合適的字 彙、片語以及句子來創造句子。 — 了解取决於上下文之相關字彙之前與相關 宜"語本身的背景知識以及當人們用其母 -兄或寫日r同時用相同的方法以 ,說或寫時之檢索的單位(也可以稱為詞塊母 ;^ # m ^# ^ ^ ^ ^ ^ 塊尋W : 之句子。然而,真實情況係按照詞 哭翻1系! 譯之翻譯句子之創造,而未能於機 係因為上述翻譯句子之創造不容 產丄也:八3有關片语本身的背景知識,並且詞塊之 產生也會含糊不清。 相對===量建立本發明,在於得到 程式。 別糸統、相對應的翻譯識別方法以及 第二ΐ::二本發明相關之申請專利範圍 轫#4別糸統包含儲存裝置,用以 ==含複數個字囊之複數個自然句子,上: 從儲存於二:象語言中之翻譯相關聯;檢素裝置用以 語之自秋句子.“、士口°口5之原始句子中包含翻譯片 穿置愈7:相對應的翻譯識別裝置根據上述檢索 衣置與上述原始句子檢索而撿選之自然句子之= 1281111 以決定-致之程度,並且識別包含至少在基於決定一 致之私度而4擇之自然句子之相對應的翻譯中之上 T翻譯片語,以作為至少上述原始句子中之上述翻譯 片語。 根據本發明之中請專利範圍第Μ,原始語言中 ::複數個子茱之自然句子係儲存於自然句子與對 統之辭典巾,样明^ Γ 統機器翻譯系 m 月相關之自然句子係至少為未經編 =理,例如按照字彙單元相除與多意字彙之撿選 =、?、片語、刻板措辭以及慣用語(一— 中之任-種,並且在按照儲存自然句子之字 :象:吾言中之翻譯相關之句子之辭典中登; (/Λ除:多意字囊提供很多相對應的翻譯之必要性 ::了莱係有關很多翻譯,因為必須選出適合的翻 確的選擇)以及可以將相對應 工自然句子之翻譯轉換成為對象語言中之 可以:夕二1彙細的自然句子本身相對應的翻譯 』乂儲存於本發明之儲存裝置。 根據本發明之申請專利範圍第丨 存震置之原始語言中之複數子^存於儲 置檢索包含敘述於原始語言(㈣n中=索裝 =辭’以及慣用語中之任一種)中之原始::之:; 然;特別在原始句 片°°彳以疋一子菜或包含複數個字彙。舉例 1281111 而a ’當使用者(翻譯者)使用本發明相關之翻譯識別 系統作為用於翻譯工作之電子辭典時,翻譯者可以明 確說明翻譯片語。此外,例如當使用本發明相關之翻 澤識別系統作為一部分之機器翻譯系統或自動解釋 系、、充(automatic interpretation system)時,使用本發明 相關之翻譯識別系統識別之相對應的翻譯執行機器 翻澤之機為翻譯系統或自動解釋系統可以明確說明 翻澤片語。另外,也可以由使用者(翻譯者等)明確說 明包含翻譯片語之原始句子,或自動明確說明(例 如,λ自動識別一句子或包含翻譯片語之-子句以作為 原始句子)。由於檢索裝置檢索包含一翻譯片語之一 自二句子,檢索結果係包含於相對應的翻譯中之翻譯 片語之翻譯的一自然句子之撿選。 ΰ * /I據申明專利範圍第1項之第-翻譯識別裝置, 之程度,並且識別至二自:句子:間決定-致 铁句子之相斟_夕在基於一致之程度而選擇之自 至少朴、;“ 澤片語之翻譯,以作為 原d子中翻譯片語之翻譯。因此,在 衣置之檢帝所i人、阳> ^ 4 $欢家 杈索所私廷之高可能之 具有相同意義之一白妙a 7 如,使用 音丰a、 自然句子以作為於原始句子中多 ☆、子果)之間’自然句子盘 Ί子中夕 X 一 a /、你知句子相似以作Λ且古 问一致之程度之自麸、工、, 忭馮具有 譯片語以作為原始句1且至2別翻譯中之翻 語之翻譯除了識別 翻澤广(理所當然’片 〜相對翻#中之翻譯片語之外,並且 10 1281111 依據與原始句子一致之程度以作為原始句子中片語 之翻譯)。 因此,根據本發明之申請專利範圍第丨項,考量 原始句子中識別詞塊之標點符號(punctuati〇n)之最大 技術困難,係儲存相對應於原始語言中的翻譯之原始 語言中之複數個自然句子,並且從儲存的自然句子中 揀選與原始語言中之原始句子具有高一致之程度之 自然句子,以及識別相對應於所撿選之自然之 然翻譯中之翻譯,以作為至少原始語言中之翻譯片· 语。因此,本發明使得到之自然翻譯能夠等於相對應 於按照詞塊經常執行之原始句子之翻譯,以作為不需 要識別原始句子中詞塊之標點符號之一結果,並且使 能夠得到之原始句子中翻譯片語之合適翻譯(從原始 句子中得到之高可能之翻譯,以作為對象語言中之 子)。 根據本發明之申請專利範圍第1項,可以了解儲 存於自然句子與儲存裝置中之本身相對應的句子,不· ^執行複雜的編輯與程序,例如將自然句子除以字 臬單元才双選多忍字彙以及當儲存自然句子與本身相 對應的翻譯於’至少,儲存裝置時,列舉多意字彙之 翻譯盡可能與每個相關的字彙一樣多。此外,根據本 =明之申請專利範圍第!項’在檢索裝置之檢索所撿 選=自然句子與原始句子之間決定一致之程度,基於 決定-致之程度而檢選之一自然句子可以得到合適 11 要執行複雜的程序,例如在傳統機 之分析:、::;部分之言詞(S,ch)與句子結構 又刀析,亚且可以簡化程序。 *根據本發明之申請專利範園第!項 2存自"子與本身相對應的、 完全與儲存於儲存裝置中之自…、:子;可此 點,如同上述,例如申請專利 =句子一致。考量此 澤硪別裝置從儲存於儲在壯 隹的翻 上、、、句子中’也檢索與原始句子完全一致之自 並且當撿選與檢索裝置 …、 致之白妙m — 私索之原始句子完全- 完全-二广’弟一翻譯識別裝置識別與原始句子 致之“然句子之翻譯。因此’當與原始句子完 始句子之翻譯。卩㈣耗置時,可以得到原 根據本發明之申諳|女 選之自然句子&朴勺〇二圍第1項’在檢索所撿 下列的方法也=子;:得到-致之程度’例如 第3頊呈右一牲 根據本發明之申請專利範圍 〜、一特性,根據本發明之申請專利範 項,在㈣I置之檢索所撿選之自^子^== 之間,第一識別裝置言十管盘 "" 勹子 目而評估-致之程度,使:口;子一致之子彙之數 時,與原始句子一致之:;::致的字囊之數目增加 與原始句子之間,表示-致之程度之一致二子 目,係一重要的指標。藉、果之數 稭由°平估—致之程度,使得當 12 1281111 一致的字彙之數目增加時,與原始句子一致之程度也 隨之提高,並且基於-致之程度之高準確性而撿選與 原始句子相近之一自然句子。 根據本發明之申請專利範圍第3項,雖然可能直 接使用一致的字彙之計算數目作為一致之程度,如上 所=例如申請專利範圍第4項,較佳的係使用一致 的字彙之計算數目除以包含翻譯片語之字彙之數 目,以作為一致之程度。因此,由此項程序,基於包 含番片語之字彙之數目卩以標準化(n〇rmalizing) 一· 致字彙之數目之數值(value)得到關於本發明之一致 之私度,用以撿選與具有使用一致之程度之高度準確 性^始句子相近之自然σ勺子,並且與包含翻譯片語 之子彙之數目不相關。為了計算一致之字彙,可以分 辨包含翻譯片語的字彙之數目(評估一致的字彙之數 目之數值)以及其他字彙,除了藉由不同的權重 (weights)(權重設定(weights set)使得權重包含片語之 字彙係較高(heavier))之外,並且使用包含翻譯片語之 字茱之數目乘以一致的字彙之字彙之數目,而需要加 總數值所得到之數值以作為一致的字彙之數目。 根據本發明之申請專利範圍第3項,允許第一翻 厚識別系統在檢索裝置之檢索而撿選之自然句子與 原始句子之間’計算未一致(mismatched)的字彙之數 目,並且評估與原始句子一致之程度,使得當計算的 字彙之數目減少時,與原始句子一致之程度也隨之提 13 1281111 :’如申請專利範圍第5項所敘述。因 估-致之程度之自然句子與 -在坪 估-致之程度之準確性,使得4子:1’更增進評
、、士,士 文仔田未一致的字彙之赵B 的二j致之耘度也隨之提高,使用上述之未一致 ::菜之數目’另外如根據申請專利範圍第: 述之一致字彙之數目。 ”教 藉由此方法,如根據申請專利範圍第3項 發明中儲存於儲存裝置 〇 φ ^ '在本 原始語言之原始句子中句::只要經常出現於 之子菜,例如識別英文句子 之一⑷」、「這(the)」、「以⑽」以及「之中 作為相對應的字彙,當原始句 目士 ^卞匕3很夕經常出現的 :果守’具有一可能性’其中可以檢選實際上與原始 :子不相近之一自然句子,以作為因為經常出現的字 f而具有高—致之程度之自'然句子。考慮這個問題, 之指標(index)。 較佳的從計算一致的字彙之數目之前的計算之字彙 中:如上所述例如申請專利範圍第6項,第一翻譯識 別凌置將預先定義(Predefined)經常出現的字彙排除 士=。因此,因為可以排除經常出現的字彙在一致的 f囊上之影響’彳以使用一至夂的字彙之數目以作為在 6然句子與原始句子之間更精確地反應一致之程度 根據本發明之申請專利範圍第3項或第5項,較 佳的如上所述例如申請專利範圍第7項,當計算一致 或未一致的字彙時考量因為單數/複數 14 1281111 (smgular/plural)或時態(tense)以作為—致之字彙而具 有曲折形式(inflection)之字彙,筮._ ^ ,叫^ 外 7于果弟一翻譯識別裝置計 异^彙以作為-致的字彙。在表格中事先登錄相關 之子茱,亚且研究是否只在表格中顯示登錄之未一致 之字尾,也可以發現因為單數/複數或時態而具有曲 折形式之字彙。因此,基本地(fundamentally)考量, 將因為單數/複數或時態而具有曲折形式之字彙之影 ,除在外,在一致或未一致的字彙之數目上,也二 能使用一致或未一致的字彙之數目以作為在自然句鲁 T與原始句子之間更精確地反應一致之程度之指 標三另外,較佳的也考慮使用寫在上文或下文之信件 的英文句子中之字彙等,以作為一致的字彙。 根據本發明之申請專利範圍第3項,較佳的如上 7述例如申請專利範圍第8項,當計算一致的字彙 第一翻譯識別裝置不重複計算使用兩次或多次的 子梟。因此,在一致的字彙上可以排除使用兩次或多 次一致的字彙之影響,並且可以使用一致的字彙之數 目以作為在自然句子與原始句子之間更精確地反應 一致之程度之指標。如上所述取代避免重複計算,可 以限制计异使用兩次或多次預先定義的數目n(n ^ 2)之一致的字彙之數目的最大數目之次數。 根據本發明之申請專利範圍第3項或第5項,較 仏的如上所述例如申請專利範圍第9項,第一翻譯識 別裝置在檢索裝置之檢索而撿選之自然句子與原始 15 1281111 ί : = 字彙之排列順序之相似度,並且評估與 度提高時,1::二使彙之排列順序之相似 句子包含相度也隨之提高。即使 列順序而會有不同:咅二句)子:時依據字囊之排 彙之排列順序評J二狀由字 …t自=卿_高度 + # ☆ ㈢您句子並且評估一致 :二St:字高彙之排列順序, 根^本發明之申請專利範圍第3項或第5項 :土的’如上所述例如申請專利範圍第1〇 、車 譯識別裝置在與檢索裝置' 飞 :r字彙中’計算未-致的字 未-致的字囊之數目減少時,與原始句子―::二中 隨之提高。因此,增進一致之程度之準確= :選擇與具有高度準確性之原始句子相近之自然: 因此,根據本發明之申請專利範圍第ι項 只广致之程度’難以識別(選擇)與原始句子相、: 之自然句子,例如撿選具有相同的一致之、 雖然’上述之識別係視儲二 置之自然句子(翻譯)之種類而定。考慮上述之問1衣 根據本發明之申請專利範圍第1項’較佳的如上所述 16 Κδΐΐΐ! 例如申請專利笳圖Μ 裝置之檢索所撿 二子搜:以搜尋檢選 翻譯片語與經常出規1 農置係用於 出現於另外提供之原始語t之π 現的字彙,參— 搜尋有關包;每11二原片始句子,第一翻譯識別裳置 語之自然句子中的翻m特定經常出現的片 在檢索裝置之檢索所":之、:常出現的翻譯’如同 翻譯片語之翻譯的自:二句子之間包含每個 別穿置1^句子之翻澤,而且第一翻譯識 片語之:譯^出現的翻譯以作為原始句子中翻譯 為Γ用1Γ澤片Π°與特定經常出現片語經常出現(稱 且=乂於原始句子中之原始語言之相同句子時, 二月姓:月-b的翻澤片語之翻譯與包含每個翻譯片語 翻1之:二吊出現的片語之自然句子申之相對應的 叮]^翻譯片語之翻譯一致。然而,雖然翻譯片語很 ^識別成為自然句子之㈣應的翻譯中之翻譯片 σ適翻澤,上述自然句子包含每個特定經常出現 的片語、’而具有翻譯片語之不合適的翻譯之自然句子 也可能混合在儲存於儲存裝置之上述自然句子中。基 =上述:根據本發明之申請專利範圍第u項,當搜 哥具^高度相關之經常出現的片語,在了解經常出現 勺片/以及包含每個翻譯片語之自然句子之翻譯之 考原始句子中特定經常出現的片語,而發現用 17 1281111 ::::語以及包含每個特定經常出現的片語之自 片、:之經常出現的翻譯。因此,基於經常出現的 (從::可:得到始句子中翻譯片語之合適的翻譯 …°子中得到自然翻譯之相對應的翻譯具有高 =性’㈣為對象語言中之句子),即使只基於一 欠之程度也很難識別(選擇)一合適的自然句子。 ::依,況有很多選擇’難以識別將原文㈣ 之::乂之子菜列入考慮之合適的翻譯。根據本發明
申,:利=圍第U項(以及根據本發明其後敘述之 口月專利辄心14項)’由同時集中於相同文 片語而識別一翻譯片語之相對應的翻 ^芩,以片語與翻譯片語同時出現之一自麸句子 之相對應的翻譯句子,因此’沒有必要將原文ϋ與後 句子列入考慮。結果’考慮原文前與後之原始 句子可以粗略得到多意字彙之合適的翻譯。
登錄表格中之經常出現於原始語言之相同原文 中之片語並且參照表格,以搜尋上述經常出現的片 語。根據本發明之申請專利範圍帛η項,基 裝置之檢索所撿選之自然句子發現經常出現的;f 有兩個優點’其中可以節省準備上述表格的時間盘人 力,並且也可以節省所需要儲存表格之儲存容量、。 根據本發明之申請專利範圍第1項,較佳的用以 識別-選擇性片語(altemative ph⑽)之識別 以取代存在於原始句子中之標的片語(—a 18 1281111 强=)’但是不包含另外提供的檢索裝置之檢索所檢 二:始句子中之自然句子,並且第-翻譯識別裝置 識別裳置所識別的選擇性片語之翻譯,以及至 個::ΐ ΐ驶置之檢索所撿選之自然句子之間之每 _ ° °°之—自然句子之相對應的翻譯句子中之 翻澤片語,以竹立$ ,, 為至ν原始句子中翻譯片語之翻譯, 如申請專利範圍帛12項所敘述。 士根據本發明之申請專利範圍第1項,-自缺句子 2由檢索農置之檢索而撿選,而於自然句子中,原 二::特定片語取代另一個片語。在此,如果原始 :/句子之含意相似’考慮特定的片語具有其 f #使,例如與檢索裝置之檢索所撿 二自然句子具有相同的一致程度之複數個自然句 ;:用於原始句子之一特定片語的一自然句子取代 性片"1:中特定片語之具有可取代之其他片語(選擇 :汐,因為自然句子與原始句子很可能具有相 同的3思,李父佳的用以選擇自然句子。 另一方面,根據本發明之申請專利範圍第項, 選擇性片語由識別裝置所識別’而選擇性片語係取代 檢索裝置之檢索所撿選之標的片語,並且不包含存在 2句子中之自然句子之中’而第一翻譯識別裝置識 別由硪別裝置所識別的選擇性片語之翻譯,以及至少 包含檢索裝置之檢索所撿選之自然句子之間之每個 翻潭片語之一自然句子之相對應的翻譯句子中之翻 19 1281111 澤片語,以作為至少斤# 此,即使只基於-致片語之翻譯。因 ^ 基於—選擇性片語的存在或不存在 二子、始句:中之—翻譯片語之-合適的翻譯(從 翻譯得到高可能爾^ 本發明相關之申請專利範圍第12 執行一選擇性片語之識別可以由表格中互相具; :自句子而執行識別,從儲存於儲存裝置 同的檢索與檢索所檢選之自然句子具有相 二::Γ自然句子以及取代檢索所撿選之 句子中之識別的片語,以作 ,第項所救述。並且,在此可以^ 述表格的時間與人力,並且 丰備上 格之儲存容量。 Μ以即爾要儲存表 旦^於片語本身大量的(immeaSU_e _。猶)之背 二知識根據片語之存在㈣有很㈣性, 加以分類。根據:; 圍第12項與第13項,識別相同句子 :籌中之可取代之一片語以作為相同種類之一片 二於有關片語本身之背景知識可以粗略得到合適 勺翻澤,而不需要得到依照種類而加以分類之全部片 20 1281111 語之背景知識。 1於本發明之申請專利範㈣14項之翻譯識別 儲衫置,用以儲存在原始語言中包含複 令:予菜,複數個自然句子,而自然句子係與原始語 二之翻譯相關聯;—檢索襄置用以從儲存於上述儲 ,置中之複數個自然句子中,檢索包含原始語言之 原始句子中之翻譯片語;一搜尋裝置用以搜尋用於上 述翻譯片語之上述檢素裝置之檢索所撿選之自然句 與經常出現於原始語言中之相同句子之經常出現 」片浯,以及第二翻譯識別裝置用以搜尋上述翻譯片 ,與包含每個特定經常出現的片語之自然句子之翻 泽句子中之翻譯片語之經常出現的翻譯,並且用以 別所發現經常出現的片語以作為上述原始語言中: 少上述翻譯片語之翻譯,而第二翻譯識別裝置係來日召 上述搜尋裝置所發現與存在於上述原始句子之特定、 經常出現的片語,以及參照包含每個上述檢索裝置之 檢索所撿選的自然句子之間之上述翻譯片語^自然 句子之相對應的翻譯句子,與在自然句子之翻譯句= 中之翻譯片語之經常出現的翻譯。 根據本發明之申請專利範圍第14項,_儲存聲 置以及所提供之類似本發明之申請專利範圍第1項之 一檢索裝置。搜尋装置搜尋用於翻譯片語之檢索裝置 之檢索所撿選之自然句子,以及經常出現在原始:士 之相同句子中之經常出現的片語。第二翻譯識別^ 21 1281111 用以搜尋翻澤片語與包含每個特殊經常出現 之自然句子之翻譯句子中之翻譯片語之經 ^
翻澤’並且識別所找到之經常出現的片語以作: 原始π 口中翻澤片語之翻譯,而第二翻譯識別枣 參照上述搜尋裝置所發現與存在於上述原始^糸 特定經常出現的片語,以及參照包含每個上述= 置之檢索所撿選的自然句子之間之上述翻譯片★五、 自然句子之相對應的翻譯句子,與在自然句子之= 句子中之翻譯片語之經常出現的翻 ° 請專利範圍第η項之相同的方法,即使儲存 裝置之自然句子中混合具有翻譯片語之不合適的翻 澤之自然句子,並且包含每個翻譯片語與特定經常出 現的片語,不需要受到此問題的影響,就可以得到原 始句子中翻譯片語之合適的翻譯(從原始句子中得到 咼可能的自然翻譯之一翻譯,以作為原始句子^ 一 句子)。
根據本發明之申請專利範圍第1項或第14項, 雖然翻譯片語可以包含複數個字彙,當字彙之數目包 含之翻譯片語增加時,即使檢索裝置執行檢索之後, 自然句子仍具有包含而不能撿選所有的翻譯片語之 I忐性。考量此問題,如上所述,例如申請專利範圍 第15項’當翻譯片語係包含複數個字彙,較佳的從 儲存於儲存裝置之原始語言中複數個自然句子之 中,檢索裝置檢索包含至少包含翻譯片語之複數個字 22 1281111 茱中之一個之自然句子(也就是說,檢索包含全部翻 譯片語之自然句子,與包含一部分翻譯片語之自然句 子)。因此,明確說明片語包含很多的字彙以作為翻 譯片語,即使包含全部翻譯片語之自然句子不儲存於 儲存裝置,可以至少從翻譯片語之相對應的翻譯中檢 索裝置之檢索而得到自然句子(相對應的翻譯句子)。 關於根據本發明之申請專利範圍第16項之翻譯 識另j方法包含第一步驟,從包含儲存於儲存裝置之 複數個字茱之自然句子中,用以檢索原始語言之原始 句子中包含翻譯片語之自然句子,而自然句子 象語言之翻譯相關聯;以及第二步驟,在上述第一牛 驟中,用以決定檢索所撿選之自然句子與上述原“ :之間之-致之程度,並且用以識別至少在基於:述 而選擇之自然句子之相對應的翻 1 中之上逃翻#片s吾之翻譯,以作為原始句子中 翻譯片語之翻譯。因此’根據本發明之申請 第1項之相同的方法’可以得到 ' 之合適的翻譯(從原始句子中得到 能的翻譯,以作為對象語言中之—句子)、。°问 關於根據本發明之申請專利 識別方法,包含第一步驟,從包 翻譯 複數個字彙之原始語言之自 h儲存裳置之 語今之肩妒勹;由4人 、、、子中’用以檢索原始 。之原士口句子中包含翻譯片語之 子係與對象語言之翻譯相關聯 、二 然句 木一步驟,用以搜尋 23 1281111 在上述用於翻譯片語,以及原始語言之 同句子之經常出現的片語之第一步驟中=於相 檢索所撿選之自然句子.m /中&索寰置之 、习于,以及弟二步驟用以搜尋卜、+、 翻譯片語與用於包含於每個 “ 士五夕A妙A 7 J又、、、工吊出現的片 ^之自;、、、、句子之相對應的翻譯句子中之 經常出現的翻譯,並且螂別所菸 。月-之 現經常出現的翻譯, 〃作為原始句子中上述翻譯片語之翻譯,而第 係芩照上述第二步驟中發現 ν磾 盘存在於上m本 常出現的片語
/、存在於上述弟一步驟中之檢索所撿選之自然 =之=原始句子中,並且參照每個包含上述” ”句子之相對應的翻譯。因此,根據申 ::圍弟14項之相同的方法,可以得到原始句“ 翻潭2語之合適的翻譯(從原始句子中得到一 譯之高可能的翻譯,以作為對象語言中之一句子‘')、; 、關於根據本發明之申請專利範圍帛18項之r
式’允許-電腦連㈣—驗儲存包含複數個字囊: ?始語言中自然句子之儲存裝置’從儲存於上述儲存 裝置之=語言之複數個自然句子中,用以儲存包含 複數個字彙之原始語言中之複數個自然句子,上— 彙具有對象語言中相對應的翻譯,例如用以檢索包: 於原始語言之原始句子中翻譯片語之自然句子之: 檢索裝置之功能,並且第一翻譯識別裝置用以決2 檢索裝置之檢索所撿選之自然句子與上述原始句子 之間之-致之程度,以及用以識別至少在基於決定之 24 1281111 致程度而選擇之自然句子之翻譯申的上述翻 :。之翻譯,以作為至少上述原始句子:片 語之翻譯。 4#片 關於根據本發明之申請專利範圍第以項 連接到用於儲一 4==之一儲存裝置之一程式,上述字彙係 第-=二Γ應Γ譯,例如上述檢索裝置與 曰衣置之功旎。因此,當上述電腦執杆關
t本發明之根據申請專利範圍第18項之程式時,雷 有申請專利範圍第1項之翻譯識別裝置之 1匕 根據本發明之申請專利範圍第1項,可 子中得到一自"適的翻譯(從原始句 言:::! 口自然翻澤之向可能的翻譯,以作為對象語 口 之句子)。
關於根據本發明之申請專利範圍第19項 -電腦連接到一用於儲存包含複數個字彙之‘ 置:二二!ί句子之儲存裝置,從儲存於上述儲存裝 數個複數個自然句子中’用以儲存包含複 2子菜之原始語言中之複數個自然句子,上述字彙 原語言中相對應的翻譯,例如用以檢索包含於 索始句子中翻譯片語之自然句子之一檢 翻;"以及一搜尋裝置用以搜尋由用於上述 與經常出現在原始語言之相同句子中之經 吊現的片,吾之上述檢索褒置之檢索所檢選之自然 25 1281111 =用第二翻譯識別裝置用以搜尋上述翻譯片 二=包含上述經常出現的片語之自然句子 之相對應的翻譯句子φ系 ^ 0 翻澤片語之經常出現的翻 述 識別所找到之經常出現的翻譯以作為上 妒置;:t中上述翻譯片語之翻譯,而第二翻譯識別 置之檢索所撿選之自上述檢索裝 特定經常出現的片語,並且失原始句子之 含五之白# a 7 卫且 >-母個包含上述翻譯片 π之自然句子之相對應的翻譯。 關於根據本發明之Φ & * — 式,伟一^^«β 申5月專利範圍第19項之程 電月匈連接到—用於儲存 個字囊之自然句子之_儲存“原二了 灵數 有對象語言中相對庫的:二鞋式’上述字彙具 腦,或透(建立具備儲存裝置之電 檢索”=接線連接到另一電腦),例如上述 ::置、搜号襄置以及第二翻譯識別裝置之功能。 二述電腦執行關於根據本發明之申請專利範 私式時,電腦具有例如根據本發明之申 :=圍第14項之翻譯識別裝置之功能。因:中 =發明之申請專利範圍第14項之相同方 二==子中翻譯片語之合適的翻譯(從原始句 言中:」句=。翻譯之高可能的翻譯’以作為對象語 之福L上所述’本發明從儲存於儲存裝置之原始語今 之硬數個自然句子中,檢索原始語言之原始句子中; 26
I2811H 含翻譯片語之自妙 與原始句子之n ;、、、句子,決定檢索所撿選的自然句子 決 s之—致之程度,並且至少識別基於所 f私度而選擇之自然句子之翻譯中翻譯片 ,_ 為至^、原始語言中翻譯片語之翻譯。 .,,★明有—特別的效用(excellent effect),复中 :靖得到自然翻譯句子的情況,從原始語言:中 譯。 了以侍到原始句子中翻譯片語之合適的翻 匕卜本發明搜尋在每個包含特定經常出現 :以及經常出現的翻譯之自然句子之相對應的翻二· 中之翻#片語’並且從儲存於儲存裝置之原始語古中 之複數個自然句子之中’檢索原始語言之原始句子中 包3翻厚片浯之自然句子而識別所發現的經常出現 的翻,,以作為原始句子中上述翻譯片語之翻譯,以 及搜哥用於翻譯片語以及經常出現於原始語言之相 同句子中經常出現的片語之檢索所撿選之自然句 子,並且參照每個包含特定經常出現的片語以及原始· 句子中翻譯片語之自然句子之相對應的翻譯。 因此,本發明具有一很好的效用(exaHeM effect),其中在很可能得到自然翻譯句子的情況下, 從原始語言之原始句子中可以得到原始句^中翻譯 片語之合適的翻譯。 ° 【實施方式】 參考圖示詳細敘述本發明之一最佳實施例。首 27 1281111 先’敛述一裝置運用本發明於一電子辭典系統,當使 用者翻譯指定片語時提供使用者具有翻譯一指定片 語之翻譯。 圖一顯示一個人電腦(PC)10能夠具有上述電子 辭典之功能。個人電腦10包含中央處理機(central processing unit : CPU)10A、唯讀記憶體(Read-〇nly memory · ROM) 1 OB、(1边機存取 $己憶體(rand〇m_access memory·· RAM)10C以及輸入/輸出埠(p〇rt)1〇D,並且 透過匯流排(bus)lOE互相連結以裝配一個人電腦,其籲 匯流排包含資料(data)匯流排、位址(address)匯流排 以及控制(control)匯流排等。 顯示器(display)包含陰極射線管(Cath〇de Ray
Tube · CRT)與液晶顯示器(Liquid Crystal Display : LCD)等’透過使用者輸入資料到鍵盤(keyboard)14 等,滑鼠(m〇use)i6、硬碟裝置(hard disk drive : HDD) 1 8、CD唯讀記憶體(CD_R〇M)24讀取資料之cD 唯碩圮憶體裝置(CD-ROM drive)20以及能夠讀取文鲁 件資料之掃描器22連結到輸入/輸出琿10D,例如很 多輸入/輸出裝置。 一翻譯識別程式(相對應於敘述於申請專利範圍 18與19中之程式)使個人電腦1〇具有裝配於個人電 月® 10之硬體I置之電子辭典系統之功能。儲存上述 翻譯識別程式之資料之一相對應的翻譯資料庫 (corresponding translation database)用來識別儲存於 28 1281111 別中之合適翻譯。有數個安裝(轉移)翻譯識 人電腦10的裝置。例如,事先紀 ,式與CD唯讀記憶體24中之設定程式 衣翻澤識別程式。將CD唯讀記憶體24插入 “ 吕己憶體裴置20之中,並且命人φ止♦田 ▼ °貝 上料… 央處理器10A執行 上:巧 精記憶…順序讀取 取翻譯識別程式。 吓項 相對應的翻譯資料庫可以儲存在硬體裝置u 例如事s紀錄在CD隨機存取記憶體24中 f翻譯倾庫’並且當安|翻譯_程式時,更改訊 ::序二便同時在硬體裝置18中書寫相對 ; 字囊組成之自然句子與用原始語言敘述 r用=中文貝科(句子、子句、片語、刻板措辭以及 述之::二:種,其未經編輯或處理,如其後所敘 的例子’例如字彙相除、多意字彙之 :=ΓΓ中所敘述之相對應原文資料之翻譯(這 ,亦未經編輯或處理之自然句子,例如字囊相 多意字彙之撿選等如其後所敘述之特定的例子, :)係登錄於相對應的翻譯資料庫。在此最佳實施例 ’硬碟裝置18儲存相對應於有關本發明之儲存裝 置之相對應的翻譯資料庫。 在紀錄媒體(recordina m.、 翻譯資料庫用以使用;::之::錄相對應的
r ST應的翻#貧料庫,例如CD 29 1281111 唯讀記憶體24與DVD唯讀記憶體(DVD_R〇M),並 且從紀錄媒體中直接讀取相對應的翻譯資料庫。因此 在此敢it μ把例中,媒體儲存相對應的翻譯資料庫之 功能,例如關於本發明之儲存裝置。此外,原始語言 與對象語言中本身相對應的翻譯之中的字彙係登錄 於有關此最佳實施例之相對應的翻譯資料庫。增加自 然句子以及本身的翻譯可以創造有關此最佳實施例 之相對應的翻譯資料庫,例如需要存在於辭典内容之 ^中’舉例而言在原始語言中的字彙與本身相對應的翻# Ν〜从用。牡一頁狍例中,當 二;/、始5吾5之原始句子中發現之敘述於對象語 :中的翻。f之-片語存在時(翻譯片語可以是字囊, 或原始句子中包含複數個連續排列的字彙之, 2者透過個人電⑩1G執行料的操作用以控°制原 學片-之翻澤之輸出。可以於個人電腦1〇 二=文,例如原文資料(例如使用者透過鍵盤Μ :=二使用字囊處理軟體創造之原文,透過網 ?路於網頁上劉覽之原文、掃描器由紀錚字元 (character)資料庫而得到之 (Optical Ch,, 汉尤予子凡辨識 資料、 咖打ReC〇gnition : OCR)系統等)處 貝枓),以作為原始句子。 ;处理之 :佳實施例的操作’例如正確選擇一 』不之内容選單,相對地(咖吻)顯示翻譯片= 30 1281111 後,選擇在此情況中的翻譯片語而使用選擇一相對應 的項目「相對應的翻譯輸出(corresponding translation P )」之知作,例如原始句子係顯示於顯示器12 之上。也可以勃;^ — ‘ , 轨仃一刼作以明確說明(specify)翻譯片 語之翻譯之給Φ & • 例如選擇顯示於所需要的圖像 )、,舉例而δ,如上所述之使用内容選單内之工 ΐ二,:上述的操作用以明確說明翻譯片語之翻 石宇4燕丨』出,個人雷日怒τ
10之中央處理機1〇A執行翻 識別程式,以執行翻 仃剌# 仃翻澤4別程序,如圖2Λ與2B所 顯不。翻澤識为丨@ + 序係處理關於申請專利範圍第16 二 J、所提供敘述之翻譯識別方法。執行此程 ,固人電腦10具有一電子辭 利範圍第1項盥第14馆从+ τ π刀Μ (甲印專 翻 /、弟4員敘述之翻譯識別系統)。 翻σ睪識別程岸φ,> 中匕3特疋的翻譯片語之一單一 原始句子中之原文資料(處 100中係為首要,需要用"’原始句子)於步驟
的翻譯片绎之資料卢硪別處理所需原始句子中 之貝科。處理過 翻譯片語,或包含—子句、1子了以疋一包含 一句冬如# ρ β b、一刻板措辭,岑 包3翻#片語的㈣tf 次 子句、一片4五 禋之句子。當假定一
片、—刻板措辭,或—包含翻嘩Μ1AA 用語中任一種為-處理過的原始句^翻吾的慣 透過翻譯識別程序自動決定, 使用者或 步驟102中,從登錄於相對應的翻譯資 辭,:慣用語作為明確說明處理過:原始:子刻板措 31 1281111 庫之自然句^中’使用步驟100中所需處理過的原始 句子之原文貢料’檢索一完全與處理過的原始句子— 致之自然句子以作為—關鍵(key),並且從登錄於相 應的翻譯資料庫之自然句子中,使用步驟100中所· 處理過的原始句子之原文資料以作為-關鍵(key),ΐ 且檢索一包含翻譯片語之自然句子(包含部分與原始 句子一致之自然〇勺子,因為至少包含翻譯片語)。去 翻譯片語係包含複數個字彙時,自然句子包含至少; 時檢索包含翻譯片語之複數個字彙中任一種。步驴 102相—當於申請專利範圍第】項、第14項、第18項: ::及第19項所敘述之檢索裝置,也相當於申請專 辄圍第16項與第17項所敘述之第-步驟。步驟1〇4 與其後的步驟,相當於申請專利範圍第"員與第以 項敘述之第一翻譯識別裴置。 步騄104中,詢問是否自然句子與步驟102之檢 索之相對應的翻譯資料庫中所撿選之翻譯的原始: 子完全-纟。如果答案是肯定(positive),帛式移i步# 驟106,以讀取與處理過的原始語言一致之自然句子 相關聯之對象語言中之相對應的翻譯,並且登錄於相 對應的翻譯資料庫,以及在顯示器12上顯示相對應 的翻譯以結束此程序。當顯示這些相對應的翻譯時, 讀取翻譯係搜尋翻譯片語之翻譯,並且使得發現之翻 譯片語之翻譯顯得重要(highlighted)。在此例子中, 使用者可以了解特定的翻譯片語之合適的翻譯(從原 32
I2811H 始句子中得到一自然翻譯丄 作為對象語t中之一 一有鬲可能性之翻譯,以 的翻譯片語I處理過㈣且可:了解包含特定 的翻譯句子,以作為J二二“的翻譯(自然 之第-翻譯識:;於如申請專利範圍一 (例子一) 的程序係更使用真實的例子來敘述。假設-原始浯吕係英文,以及一五士 一 _ _、κ ^ 耵豕扣a係日文,當包含在 處理過的原始句子中之「為了你的安全(F〇r卿 ,ty)」明確說明「為了你的安全,不要倉促衝進火 車 your safety,don,trushint〇thetrain)」以作為 翻譯片語’因為原始語言以及相對應的翻譯係由一浐 翻譯程序中之字彙來登錄字彙,對照(against)包含2 述翻譯片語之「安全(Safety)」而選擇翻譯「」。 然而,在關於本實施例之翻譯識別程序之中,因為原 始語言中自然句子以及對象語言中相對應的翻譯係 登錄於相對應的翻譯資料庫,完全與上述原始句子二 致之自然句子係具有登錄於相對應的翻譯資料庫之 可能性。當自然句子與上述原始句子完全一致時,登 錄於與自然句子有關之相對應的翻譯資料庫之翻譯 係隨重要的翻譯片語之翻譯而顯示,如下列所顯示: 「Kiken desu kara,kakekomi-josha wa oyame kudasai」o 33 1281111 、在一般翻譯程序中,很難去選擇「kiken」以作 為safety」子彙之相對應的翻譯,並且只可以得到 一不自然的翻譯’例如「Anata nG anzen nG t繼,S咖 =sSha m kakek〇manaide kudasai」。另—方面本發明 提供如母語(native language)之自然翻譯。 當步驟106中顯示翻譯時,除了與處理過的原始 =完全一致之自然句子之外,還可以顯示與步驟 中之檢索所撿選之處理過的原始句子部分一致之 ^:子。與處理過的原始句子部份—致之複數個自 句子-般係由檢索而撿選。當顯示這些,為了顯示 在顯示器12上—致之程度之遞減的(deS_dlng)次序 自然句子之翻譯’較佳的用於與處理過的原始 =二致之個別的自然句子,在下列敘述中計算 另一方面,當在相對應的翻譯資料庫中步驟102 之檢索中未發現與處理過的原始句子完全一致之自 3=在步驟1〇4中問題之答案係為否定。然後, :二/驟1〇8 ’在自然句子之字棄之間用以計算 子之字彙中任-種-致之字彙之數目(一致 子菜之數目),㈣於步驟1G2中之 刪所撿選的自然句子,並且基於計算— = 數目之結果而計算與原始句子一致之程度。 在本實施例中,當裝配翻譯識別 現於原始語言中原始句子中之字囊(例如,在= 34 1281111 文句子中之「-⑷」、「這(the)」、「以(t〇)」,以及「之 中⑽」)於經常出現的字彙表格中,亦儲存於硬碟裝 置18步V 1〇8计异一致之數目同時參照經常出現的 字彙表格,以排除登錄於所計算之—致的字彙之數目 中之經常出現的字彙表格中之字彙。因此,可以避免 在一致的字彙之數目上經常出現的字囊之影響。步驟 ⑽中之上述的程序,相#於申請專利範圍第6項所 敘述之第一翻譯識別裝置。
在此最佳實施例中,當裝配翻譯識別程式時,因 士!錄之単數/複數或時態之差異而具有不同字尾之 字彙之一曲折形式的字彙表格亦儲存於硬碟裝置 18。當一致的字彙之數目 數目於力鉢108中計算並且出現 ,、具頁不一致的字屋之京鲞主 丁…口 複數之差…;二:是否詢問單數/ a t 不致的子尾之理由或是時態之差 因為單數/複數或時態之差異而具有不 门子尾之子菜以作為一致的字彙。代替此差显
不規則曲折形式之系統係登錄於曲折形式表格以、 規則曲折形式中,自動假μ ^ °及 ㈣叮、、 又―致之字彙為可接受的。 ’可以避免在一致的字囊 口口 數或日矣能少i 口為單數/複 二:-(應該根本地了解字彙,以作為 之字彙)而具有不同字 卜马致 之口心产J子尾之子菜之影響。步-驟108中 #…主序’相當於申請專利範圍第7項所敘辻 第一翻譯識別裝置。 肖所敘述之 在此最佳實施例中,即使字囊再次出現於自然句 35 1281111 子,在步驟108中計算—致字彙之數目的期間,-旦 些原始句子中之字彙一致之字彙之理由而 ^异子莱以作為一致的字彙,為了避免重複計算出現 二次或多次之一致的字棄,不會計算兩次。因此即使 自然句子之很多地方有相同一致的字彙,也可以避免 在致的字彙之數目上受到一致的字彙之影響。步驟 ⑽中之上述的程序’相當於申請專利範圍第8項所 敘述之第一翻譯識別裝置。 定義用以計算一致之程度之一公式,使得當一致鲁 的字彙增加,一致之程度也隨之增加。例如,基於包 含翻譯片語的字彙之數目,而可以使用將一致的字彙 ^數目標準化(n〇rmaHzing)之計算公式(一致之程度 等於一致的字彙之數目除以包含翻譯片語的字彙之 數目)。步驟108中之上述的程序,相當於申請專利 轭圍第3項所敘述之第一翻譯識別裝置(更具體而言 如申請專利範圍第4項所敘述)。 下-個步驟11 〇中,對照每個自然公式中計算一籲 致之程度以詢問是否存在具有最大一致之程度之複 數個自然句子。如果答案為否定,程式移至步驟丨12, 用以讀取登錄於相對應的翻譯資料庫之相對應的翻 譯句子,上述翻譯資料庫係具有最大的一致之程度之 一相對應的自然句子,以及用以搜尋用於翻譯片語之 翻#之項取的翻譯句子,並且用以將顯示器12上讀 取的翻譯句子與發現重要的(highlighted)翻譯片語之 36 1281111 翻譯一起顯示,並且結束此程序。在此例子中,使用 者可以了解特定翻譯片語之—合適的翻譯(從原始句 子中得到-自然翻譯之高可能之翻譯’以作為對象語 a中之^一句子 步驟112中,除了具有在步驟1〇2中之檢索所檢 選之自然句子之間之最大一致之程度之自然句子(在 一致之程度之遞減的次序中一某自然句子之數目,或 是-致之程度係高於特定的數值之全部的自然句子) 之外,也從在一致之程度之遞減的次序之相對應的翻· 澤貧料庫中讀取,並且同時於顯示器12上顯示。如 果存在具有相同的-致之程度之複數個自然句子,卄 算與每個自然句子中之原始句子不一致的字囊之數 目,相對應於具有相同一致的程度之自然句子之翻譯 句子’係依照相對應的自然句子中不一致的字囊之數 目之遞減的(從較小的)次序而顯示,以同時顯 句子。 (例子2) · 上述的知序更使用一真實的例子來敛述。假設原 始語言係英文’並且對象語言係日文,當包含一處理 過的原始句子中之—字彙「操作(operation)」,具體說 月系、、充大然進入操作(The system⑽硫叫“me int〇 operation)」’並且圖三中所顯示之自然句子⑴到⑻ 係與翻譯句子⑴到⑻相關聯,並且登錄於相對應的 翻譯貢料庫以作為包含翻譯片語「操作(。㈣如㈣」 37 1281111 之自然句子除了圖二中所顯示之自然句子(3)具有與 具備1」之原始句子之_致字彙之數目之一致 之程度(亦計算自然句子中之「操作(opemion)」以作 為如上述之一致的字彙),並且自然句子(3)具有與具 備「4之原始句子之—致字囊之數目(從計算一致的字 茱而撿選之子茱「這(the)」以作為經常出現的字 彙)400〇/〇之^-致之程度。因此,翻譯句子⑺與自然句
子(3)相關並且登錄於相對應的翻譯資料庫係與重要 的翻譯片語一起顯示’如下列所敘述: 「SiSUtemUgakadoshihajimeta」。 (例子3)
假設-原始語言係英文,並且一對象語言係£ 文,當包含一處理過的原始句子中之一字彙「實方 (operation)」,具體說明「一小生意係免除新法之實方 (A small business ls exempt from the operation 〇f'th _ law)」,並且圖三中所顯示之自然句子⑴ 與相對應賴料子⑴到⑻—起提供,並且 力 相對應的翻譯資料庫以作為包含翻譯片往Γ奋'方 (叩⑽t观)」之自然句子,除了圖三中所顯示之^ 句子⑺具有與具備之原始句子之—致字囊之凄 目100%之-致之程度(亦計算自然句子中之「伊个 (—mi—」以作為如上述之—致的字彙),' 句子(3)具有與具備「4」之原始句子之—致畫 目(從計算-致的字彙而撿選之字彙「這(㈣」則 38 1281111 為經常出現的字彙)4〇〇%之一致之程度。因此,翻譯 句子(2)與自然句子(2)相關聯並且登錄於相對應的翻 譯資料庫中係與重要的翻譯片語一起顯示,如下列所 敘述: ^ 在英文句子中之字彙「實施(—。11)」,係用於 難以識別合適的翻譯之一多意字囊。當從上述的例子 2和例子3中之容易的了解,在相對應的翻譯資料座 中登陸與自然句子相關之翻譯句子中,可以得到在相 同含意中使用多-的字囊之-合適的自然句子 句子)以作為原始句子,並且基於-致之程度二擇 一自然句子(翻譯句子)。 X向、擇 (例子4) Τ文句子之例子中,因為沒有足夠 五+ =㈣大量之含意’常常難以識別應該得到 解決彳明之翻譯識別程序中,為了 子中,檢 語係包含㈣財彙時同Λ1Λ:(當翻譯片 譯片語之複數個字彙中二:’、二含至少包括翻 顯示具有與全部的原始句子二=子),並且 子(包括自然句子之翻譯句子。,除声:之翻譯句 度之自然句子)。因 /、 /、有向一致之程 以及本身合適的’使用者可以了解從原始句子 翏照顯示的翻譯句子應該同 39
I2811H 時得到翻譯中之單位(unit)。 例如萄中文之一原始句子「發展中的國家(発 展中国家)」作為-原始語言時,係翻譯成為日文以 作為一對象語言,如果具體說明「發(発)」、「發展(発 展)」、發展中(発展中)」、「發展中國(発展中国)」, f「發展中國家(発展中国家)」中之任-種以作為翻 潭片扣’基於下列次序中一致之程度而排列下列自然 句子之翻譯句子。(當具體說明「發展中國家(発展中 国家)」以作為一翻譯片語時,一致之程度也同時顯鲁 不於下列,然而,理所當然依據具體說明片語個別之 一致程度有所不同以作為翻譯片語): L「發展中國家(発展中国家)」=「発展途上国 (hatten tojokoku)、(developing country)」 (一致之字彙之數目「5」,並且一致之程度 100%) 〇 2·發展中國(発展中国)」=「中国蚤発展$甘 (Chugoku wo hattensaseru) > (to develop China) j (-致之子彙之數目「4」,並且一致之程度8〇%)。 3.「發展中(発展中)」:=「発展中①(hatten-chu no)、(developing)」 (一致之字彙之數目「3」,並且一致之程度60%)。 4·「發展(発展)」=「発展寸3、発展$姑3 (hattensuru ^ hattensaseru) > (develop) j (一致之字彙之數目「2」,並且一致之程度4〇%)。 40 1281111 発才 δ、出才(hassuru、dasu) 5·「發(発)」= (start、put out)」 (一致之字彙之數目「1」,並且-致之程度20%)。 中,:此J吏:者可以了解從原始句子(在本例子 二二發展中國家(発展中国家)」)以及本身合適的 照上述所排列的翻譯句子應該 個上句子與—翻譯片語兩者係「發(発)」,每 的自然句子具有-致之字囊之數目…,並且 目不Π100%。然而,當彼此不-致的字彙之數 早φ同日寸原、始句子係排列於下列中不同於原始句 之,子發展中國家(発展中国家)」之次序: 务(死)」(不一致的字彙之數目「〇」) 2.「务展(発展)」(不一致的字彙之數目「丨」) •「兔展中(発展中)」(不一致的字彙之數目「2」) 「3 4、「發展中國(発展中国)」(不一致的字囊之數目 」)5「發展中國家(発展中国家)」(不一致的字彙 <要文目「4」) ,類似的方法中,當一原始句子與一翻譯片語兩 的二a ι展(発展)」時,基於一致之程度以及不一致 例:菜’原始句子也排列於下列不同於原始句子中之 序f發展中國家(発展中国家)」或「發(発)」之次 41 1281111 1 ·發展(発展)」(一致的字彙之數目「2」,一致 之程度100%,並且不一致的字彙之數目「0」)。 2·「發展中(発展中)」(一致的字彙之數目「2」, 一致之程度100%,並且不一致的字彙之數目Γι」)。 3·「發展中國(発展中囯)」(一致的字彙之數目 「2」,一致之程度} 〇〇%,並且不一致的字彙之數目 「2」)。 4·「發展中國家(発展中国家)」(一致的字彙之數
目2」,一致之程度1〇〇%,並且不一致的字彙之數 目「3」)。 )· |發(発)」(一致的 度5〇%,並且不一致的字彙之數目「〇」)。 即使:翻澤片§吾係與此相同時,翻譯句子係根據 如上述顯示如果與原始句子不相同之自然句子,依照 -合適的次序㈣列。因此,使用者可时照翻譯句 子之排列結果,而了解—相對於原始句子之—合適的 翻譯。 當具有最大一致之程度之複數個m 時,步驟110中之答案為肯定。 114 ’以執行-用以基於翻譯片語以及移至步驟 始語言中之相同的句子(具有與::出:於: 及第17項所教述之經常出現的片、 項’以 與⑽中選擇自㉟句子之關聯性分^而於步驟U4 42 1281111 原二3說,步驟114中,翻譯片語與經常出現於 二。二之相同的句子是否包含於處理過的原始 :人翻#片語具有—高相關有 ;而:究:否::原始句”翻譯 :之夕的每個子茱係包含步驟1〇2中所檢索之翻 檢選每個自然句子。在此程序 識別 =τ原始句子中翻譯片語之外的每個字囊 定見於每個自然句子之次數之數目,大於特 疋數目之次數的字彙(—k 、— 翻譯片語具有—高相關性—;v或多次j以作為與 於如申請專利範圍第u項果述步驟114相當 an 貝弟14項,以及第19頊 所敘叟哥I置’並且也如申請專利範圍第17項 所敘述之弟二步驟。 之字匕ΓΓΓ中’詢問與翻譯片語具有高相關性 <于茱疋否由步驟〗φ + k 土 定0士 , ^ 114中之檢索而發現。當答案為肯 二二=:至步驟118 ’從步驟102中檢索之相對 =2料庫所撿選之每個自然句子之間,用以參 所卜之翻譯句子’以及每個包含步驟114中與 二:的翻譯片語具有高相關性之字彙 = 字—子,並且用以識別上述 心翻澤片5吾之經常出現的翻譯。翻譯片語 —Γ 的翻譯’具體而言’當撿選翻譯片語以及 相二自::子作為一包含每個與翻譯片語具有高 〖之子菜之一自然句子時,識別自然句子中翻譯 43 1281111 片语之翻譯以作為締舍山 卞马、、二吊出現的翻譯。當撿選 然句子作為上述白妒+ 田似&稷數個自 語之翻譯之最經當屮钼々』φ j卞τ翻#片 譯。 *出現之翻譯以作為經常出現的翻 的原:t:提’Λ包含翻譯片語以及包含識別處理過 .1' ° °之字彙之自然句子作為與存在翻譯片語 而相關性之字彙時,自然句子可能使 : :子以作為具有相同含意之句子,例如原始句子::
上述的自然句子中。另方】二可能混合於 J卞甲另方面,在步驟118參昭包合 母個翻譯片語以及與翻譯片語具有高相關性之字囊 之自然句子之翻譯句子,識別上述的自然句子中翻譯 片語之經常出現的翻譯。因此,可以得到處理過的原 始句子中翻澤片語之合適的翻譯。
步驟119中,從包含每個翻譯片語以及與翻譯片 語高相關之字彙之自然句子之翻譯句子中,讀取登記 於與自然句子相關之相對應的翻譯資料庫之對象言五 言中之翻譯句子,在自然句子中翻譯片語係與步驟 118〃中所發現經常出現的翻譯相關,並且讀取翻譯句 子係與翻澤片語之翻譯以及在讀取翻譯句子上強碉 與翻譯片語具有高相關性之字彙一起顯示於顯示器 12上’以結束此程序。在本例子中,使用者也可以了 解特定翻譯片語之合適的翻譯(從原始句子中得到一 自然翻譯之高可能之翻譯,以作為對象語言中之—勹 44 Κδΐΐπ :)圍第上f〗步§驟116到119’重複相對應於如申請專利 圍弟11工員所敘述之第一翻譯識別I置, ,園第1“員與第19項所敘述之第二翻物:裝 以及如申凊專利範圍第17項所敘述之第三步驟。 步驟119中’也另外包含每個翻譯片語以及與翻 澤片語南相關之字彙之自然句子’並且上述翻譯片語 f y驟102中所撿選之自然句子之間係與經常出現的 片語相關聯’從一致之程度之遞減的次序之相對應的 翻譯資料庫中讀取複數個自然句子之翻譯(—致之程 度之遞減的次序中之某一自然句子之數目,或全部且 有兩於-致的程度之特定數值之句子),並且同時根 據一致之程度或不-致的字彙之次序而排列於顯示 器12上。 (例子5) 上述的程序係更敘述使用一真實的例子。假設一 原始語言係英文’並且一對象語言係日文,當包含一 處理過的原始句子中之一字彙「手術(ο—)」係 具體說明「我接受移除直腸癌之手術(i had如 operation to remove a rectal咖⑽)」,並且圖三中所 顯示之自然句子⑴到⑻與其他自然句子係登錄於相 對應的翻譯資料庫,以料包含翻譯片語「手術 (operate)」之自然句子,因為自然句子⑹到⑻兩者 皆具有一致字彙之數目「2」,所以只從一致之程度難 以選擇一最合適的自然句子(翻譯句子)。當從自然句 45 1281111 子(1)到(8)中檢索除了處理過的原始句子(例如,「移 除(remove)」、「直腸的(rectal)」,或「癌症(⑶此“)」) 中翻譯片語「手術(operation)」之一關鍵字,因為自 然句子(6)到(8)包含「癌症(cancer)」,所以檢索「癌 症(cancer)」以作為在處理過的原始句子中與翻譯^ 語「癌症(cancer)」高相關之字彙。 包含翻譯片語「手術(operation)」以及具有高相 關之字彙「癌症(cancer)」之自然句子,可能使用相 同含意中之翻譯片語「手術(〇perati〇n)」之句子。然 而,翻譯片語之翻譯不同於翻譯片語中之自然句子,' 也具有混合在登記於相對應的翻譯資料庫中之自然 句子,並且符合上述的情況之可能性。在本例子中1 自然句印)相當於本例子。_自然句子(8)包含翻 譯片語「手術(operation)」以及具有高相關性之字彙 癌症(cancer)」,但是因為翻譯片語「手術 (opem·)」之翻譯係「_」,所以自然句子⑻不同 於處理過的原始句子。 由於这些自然句子影響,為了防止不正確的識別 翻譯片語之翻譯,參照包含翻譯片語「手術 (operation)」,以及具有高相關性之字彙「痒症 (讓㈣」。翻譯片語「手術(Gp咖叫」以及高㈣ 之子果「癌症(ean㈣」’除了自然句子⑹之外,係包 含於自然句子中,並且上述中之一自然句子之翻譯片 语「手術(〇Peratlon)」與自然句子中登記於相對應的 46 1281111 翻譯片語中之翻譯「shujutsu」相關聯。因此,決定 包含翻譯片語「手術(operation)」以及高相關之字彙 「癌症(cancer)」之自然句子中之翻譯片語「手術 (operation)」之經常出現的翻譯為「shujutsu」,包含 翻譯片語「手術(operation)」,與具有高相關性之字彙 「癌症(cancer)」之自然句子(6),選擇上述自然句子 中翻譯片語與所決定之經常出現相對應的翻譯,以及 與翻譯句子(6)相關之自然句子,並且登記於相對應的 翻譯資料庫強調與翻譯片語之翻譯高相關之字彙一籲 起顯示,如下列顯示。
Jon-san no shujutsu-go ^ kare no gan wa naotta」〇 因此’在本例子中,也選擇使用相同含意中之翻 澤片語「手術(operati〇n)」之一合適的自然句子(翻譯 句子),以作為原始句子。 參考圖二’雖然包含「手術(operation)」之自然 _ 句子之數目係登錄以簡化敘述,但是實際上登錄更多 自:、、丨句子。當處理過的原始句子,舉例而言,係撿選 而使用翻澤片語「手術(〇pemi〇n)」,例如「傷害 (injury)」或「醫院(h〇spital)」之字彙之一句子根據 ,理過的原始句子之内容,以作為具有高相關性之字 〜1厂處理過的原始句子係,舉例而言,撿選而使用 字^立kad〇」,例如「系統㈣㈣」或「電腦(h〇Spi⑽」 一〜中之翻澤片語「手術(operation)」之一句子, 47 1281111 根據,理過的原始句子之内容以作為具有高相關性 之字彙。當處理過的原始句子,舉例而言,撿選而使 用字彙「㈣。」,例如「法律(law)」之 譯片語「手術(〇卿,」之一句子,根據處理過白 原始句子之内容’以作為具有高相關性之字彙。 士另-方面,當不檢索與翻譯片語高相關 日',步驟116中問題之答案係否定。因此,程式移至 步驟120 ’步驟120到步驟 理過的原始句子中之翻,片= :=(相?應於如申請專利範圍㈣項所= 广f性擇之自然句子來執行計書分析 (scheme analysis)。 -刀竹 也就是說’識财在於㈣m(標的 處理過的原始句子之字囊, 索之相對應的翻譯資料庫 ^在於步驟12 0檢 之字彙。步贤122φ、4庫所和遠的母個自然句子中 二二 從登錄於相對應的翻譯資料庫 標的:彙Π票:字彙之-自然句子。當存在複數個 >半中之檢余係為了每個字彙而執 :。步㈣”識別用以檢索每個 予果而士 然句子,以作為包含^相问句子結構之自 選之自然句子」)的=自然句子之檢索所撿 不同於步驟m之月况’上述自然句子識別只 登錄於基於識=:主所撿選之每個自然句子,以從 ' 双索U況之相對應的翻譯資料庫之 48 1281111 自然句子中來檢索自然句子。 在下一步驟126,詢問步驟124之檢索是否撿選 -致的自然句子。當存在於只有標的字彙取代豆他字 彙之相對應的翻譯資料庫中之每個相同的翻譯句 子,上述其他的字彙可能可以用來取代標的字彙之一 選擇性片語。因此,當答案係為肯定時,程式移至步 驟丄28’ 了解字彙取代檢索所撿選之自然句子中之標 的字彙以作為料標的字彙之選擇性字彙。上述步驟
120到130’相當於如申請專利範圍f 12項所敛述之 識別裝置(如中請專利範圍第13項中之更具體的說 明)〇 、步驟130中,詢問一自然句子中之標的字彙是否 取代存在於具有最大—致程度之複數個自然句子之 3性字彙(由超過特定數值之—致的程度來取代)。 田自然句子中之標的字彙取代存在於具有最大一 致程度之複數個自然句子之選擇性字彙時,決定有關 自然句子可能在相同含意中使用翻譯片語之一句子 以作為處理過的原始句子。因此,如果答宰為肯定, 程式移至步驟132用以讀取登錄於具有最大、„:致月的程 度之自然句子相關之相對應的翻譯資料庫中之原始 ^吕之翻譯句子(由超過特定數值之-致的程度來取 j) ’並且包含取代標的字彙之選擇性字彙;用以搜 哥用於翻譯片語之翻譯以及選擇性字彙之翻譯之讀 取翻譯句子;讀取翻譯句子與認定重要的翻譯片語以 49 I281U1 及所#不之選擇性字臺 卜, 子果之翻澤一起顯示在顯示器12 上也用以作為一選擇性的仝a 、, 在本例子中,使用者也、菜’亚且結束此程序。 的㈣"Λ 了解特定翻譯片語之合適 == 句子中得到-自然翻譯之具有高可能 陡2和以作為對象語言中之句子)。 以及步驟132中,相告於*由心*… 田;σ申5月專利範圍第13項所 敘述之弟一翻譯識別裝置。 因此步驟U2中’另外具有最大—致的程度之自 然句子以及包含取代步驟1〇2中檢索所撿選之自秋句 子之間之標的字彙之選擇性字囊’依照一致的程度之 遞減的次序來讀取複數個自然句子之翻譯句子卜致 之程度之遞減的次序中之某一自然句子之數目,或全 部具有高於一致的程度之特定數值之句子),並且同 時根據-致之程度與不一至字彙之數目,依照次序排 列於顯示器12之上。 (例子6) 上述的程序係更敘述使用一真實的例子。假設一 原始語言係英文,並且一對象語言係日文,當具體說 明一字彙「吃(have)」以作為處理過的原始包 含「吃午餐(have lunch)」之翻譯片語時,—包含「吃 早餐(have breakfast)」之自然句子(在相同含意中使= 翻譯片語「吃(have)」之自然句子以作為處理過的原 始句子)係登錄於相對應的翻譯資料庫中,沒有登錄 一包含「吃午餐(have hrnch)」之翻譯片語,即使基於 50 1281111 或相關性分析之調查也不能識別—適當 蝴子」處理過的原始句子中之翻譯片語「吃 」或每個除了決定用以與翻譯片語具有高相關 性之外的字臺r ^ ^ 、, 如’午餐(lunch)」),係假設為標的 予果’亚且檢索包含每個標的字彙之自然句子。因 此才欢索以作為標的字彙「午餐(lunch)」,自然句子 包含例如「吃午餐(eat lunch)」或「吃晚午餐⑽e a _ lunch)」° 於是’從上述檢索所撿選的每個自然句子中,檢 索只有在每個自然句子差異中標的字彙之自然句 子。接著’當用於所檢索撿選的自然句子以作為一自 然句子的内容時,例如標的字彙「午餐(lunch)」,自 然句子的内容’例如,撿選「吃早餐(eat breakfast)」 或「吃早午餐(take a late breakfast)」以作為只有標的 字彙差異之自然句子。因此,當決定一字彙「早餐 (breakfast)」以作為具有取代標的字彙「午餐(lunch)」 之高可能性之一選擇性字彙,在第一檢索所撿選之自 然句子(包含翻譯片語「吃(have)」之自然句子之檢索) 之間可能取代標的字彙「午餐(lunch)」之選擇性字彙 之翻譯句子(包含「吃早餐(have breakfast)」之翻譯句 子)取代標的字彙「早餐(breakfast)」,並且登錄於相 對應的翻譯資料庫係顯示與強調的翻譯片語「吃 (have) < taberu >」以及標示的選擇性字彙「早餐 1281111 (breakfast) < breakfast〉」之翻譯。因此,在此例子 中選擇一合適的自然句子(翻譯句子)使用相同含意中 之翻譯片語「吃(have)」以作為處理過的原始句子。 當也具體說明包含「有猶(have cats)」之處理過 的原始句子中「有(have)」以作為翻譯片語時,包含 「有狗(have dogs)」之自然句子係登錄於相對應的翻 譯資料庫,沒有登錄包含「有猶(have _)」之自缺 句即使基於—致的程度或相似方法巾㈣性分^ · 之調查,也不能識別一適當的翻譯句子,在第一檢索 所撿選之自然句子(包含翻譯片語「有(have)」之自然 句子之檢索)之間,假設字彙,例如「猶(cats)」為^ 的字彙’並且決定字彙「狗(dogs)」為具有用上述之 相同方法取代標的字彙「|苗(cats)」之高可能之選擇 性子彙,標的字彙「貓(cats)」取代選擇性字彙「狗 (dogs)」之自然句子(包含「有狗(haved〇gs)」之自然 句子)相關之登錄於相對應的翻譯資料庫中之翻譯$ · 子,與強調的翻譯片語「有(have)」之翻譯「ka^」, :及所標示的選擇性字彙「狗(d〇gs)」之翻譯「酿」 一起顯示。因此,在例子中也選擇使用相同含意中之 翻譯片語「有(have)」之—合適的自然句子(翻譯句 子)’以作為處理過的原始句子。 (例子7) 假设原始語言係日文,並且原始語言係英文,當 52 1281111 具體說明處理過的句子「〇-yu wo kakeru」中之 「kakeru」作為翻譯片語時,一自然句子「mizu wo kakeru」(使用相同含意中之翻譯片語「kakeru」之自 然句子,以作為處理過的原始句子)係登錄於相對應 的翻譯資料庫,但是沒有登錄「o-yu wo kakeru」,並 且即使基於一致的程度或相關性分析之調查也不能 識別一適合的翻譯句子,因為登錄其他自然句子,例 如「denwa wo kakeru」,會假設處理過的原始句子中 之「o-yu」為標的字彙,並且檢索包含標的字彙之自 ® 然句子。因此,撿選自然句子,例如「o_yu ni tsukeru」、 「o-yu wo wakasu」、「o-yu wo nagasu」、「o-yu de arau」、「o-yu kara hikiageru」,以及 r o-yu de atatameru」o
於是,從每個上述所撿選的自然句子中,檢索只 有在每個自然句子差異之標的字彙中之自然句子。檢 索之結果可以得到下列的字彙取代標的字彙「o-yu」 「〜ni tsukeru」:「sosu」、「shoyu」、「mizu」、 r sutsukesu」,以及「ude」 「〜wakasu」:無(None) 「〜wo nagasu」:「denki」、「mizu」、「bangumi」, 以及「uwasa」 「〜de arau」:「shampu」、r suponji」、「shiomizu」、 「mizu」,以及「sekken」 「〜kara hikiageru」:「mizu」、「kaitei」、「kaigi」, 53 1281111 以及「零(zero)」 「〜de atatameni」:「denshi-renji」,以及「y〇netsu」 在上述的字彙之間’此字彙r mizu」經常出現並 且自然句子「mizu wo kakeru」存在。因此,決定字 彙「mizu」以作為具有取代處理過的原始句子「〇_yu wo kakeru」中之標的字彙「〇-yu」之可能之選擇性字 彙。因此,在第一檢索(包含翻譯片語之自然句子 「kakeru」之檢索)所撿選之自然句子之間有關標的字 彙「〇_yU」取代選擇性字彙「mizu」之自然句子「mizu wo kakeru」之翻譯,並且登錄於相對應的翻譯資料 庫’係與強调的翻澤片語「kakeru」之翻譯「倒 (Pour)」’以及才示示的%擇性片語「kakeru」之翻譯「水 (water)」一起顯示,如下列所顯示。 「倒『水』進入〜(p〇ur*water*int〇〜)」 在上述翻譯句子中,「『···』」(「*···*」)表示「···」 係一選擇性字彙。因此,在本例子中,亦選擇使用處 理過的原始句子之相同含意中之翻譯片語「kakeru」 之一合適的自然句子(翻譯句子)。 在相似的方法中,當具體說明處理過的原始句子 「3w〇kakeru」中之「kakeru」時,於相對應的°翻 資料庫中登錄一自然句子「4 w〇 kakeru」(使用相同 含意中之翻譯片語「kakeru」之自然句子,以作為声 理過的原始句子),但是沒有登錄「3w〇kakeru」'',、、= 且即使基於一致的程度或相似方法甲一相關性分析 1281111 之调查’也不能識別一適當的翻譯句子,翻譯與標的 字彙「3」取代為「4」之自然句子「4 wo kakeru」相 關並且登錄於在第一檢索所撿選之自然句子(包含翻 譯片語「kakeru」之自然句子之檢索)之間之相對應的 翻岸賓料庫’係與重要的翻譯片語r kakeru」之翻譯 (「乘(multiply)」)以及藉由假設字彙,例如「3」為 標的字彙而標示之選擇性字彙「4」之翻譯「f〇ur」一
起顯示,並且決定字彙「4」以作為具有取代標的字 茱 3」之南可能之一選擇性字彙。 「乘(multiply)以 4(*f〇ur*)」 因此,在本例子中,亦選擇使用處理過的原始句 子之相同含意中之翻譯片語rkakeru」之一合適的自 然句子(翻譯句子)。 f沒*有撿選符合的自然句子(當步驟126中答案痛 定)時,或當標的字彙取代選擇性字
存在於具有最大-致程度之複數個自Μ子、 130中答幸俏丕令、卩士 ^ ^〆 π L 係否疋)日守,難以識別一合適的翻譯句^ 因此’程式移至步驟j,用以# — ^ ^ ^ ^ 用以靖取母個步驟120 2索所&選之全部的m子 之遞減的次戽夕溆、、级的私 (一致之程户夕、廣決以 丁祁關之翻澤句 又之4減的次序中之某一自然句子 目或全部具有高於—致的程之 子),並且a,Mi 々厌之特疋數值之 …相對應的翻譯資料庫,用以搜尋 55 1281111 個用於翻譯片語之翻譯之讀取翻譯句子,依照一致的 程度之次序以及每個具有與發現強調的翻譯片語之 :譯之最大一致程度之自然句子一致程度之遞;的 人序之不致字彙之數目,於顯示器12上排列個別 的翻譯句子,並且結束此程序。在本例子中,使用者 可以了解一些特定翻譯片語之候選的合適翻譯。
在上述例子中,雖然敘述只使用一致的字彙之數 二來:;算-致的程度之模式’但是模式並不限定於此 貫鉍例。可以識別計算一致程度之公式,當一致之字 =目增加時,使得—致之程度也隨之提高,以作 為自句子與原始句子之間因為基於一致的字彙之 +致予果之數目之計算與評估一致之程 之一致字囊之數目。此模式相當於本發明之 申靖專利範圍第5項。也可以只基 目而首先計算一致之藉许)于果<数 $ 一…r 當即使執行一相關性分析
析,也難以選擇一單一的自然句子時用以 二者致的數目,並且用以選擇具有最小不一致字 果之數目之自然句子(翻譯句子)。 評估一致之程度時’通常也可以使用一自 二之排列次序之相似度之程度,或二與 原始句子相關之字彙之自 數目,在自然句子與原始…加中二:一致子茱之 之間,另外上述一致字囊之切:f之程度 用以評估-致之程度,使得」Γ不—致予果之數目 吏传萄予茱之排列次序之相似 56 1281111 度增加時,與原始句子一致之程度也隨之提高,也使 得§存在一致的字彙間之不一致字彙之數目減少 日守’與原始句子一致之程度也隨之提高。在一自然句 子與一原始句子之間使用字彙之排列次序之相似度 之模式,相當於根據本發明之申請專利範圍第9項, 並且使用存在於一致的字彙中之不一致字彙之數 目三相當於根據本發明之申請專利範圍第丨〇項。可 以藉由,例如,下列之程序,具體了解考量自然句子 與原始句子以及存在與原始句子相關之字彙中之不 一致字彙之數目之間,字彙之排列順序之相似度之一 致之程度之評估: 江 就疋"兒,根據原始句子中翻譯片語之差異( :之數目),每個原始句子中之字彙提供第—估計 assessment value)。定義第一估計數值 除了原始句子中之=
計數值減少以作為原始句:子=之弟一 ΛΑ ^ ^ / T之番羽5睪片否吾增力口;生 ▲差(以作為增加存在字彙中間之 吕,當原始句子包含九個 牛例 B、C、D、E、F、G、h、果A至"(原始句子4 子中之第四個字彙D以:J: ’具,兄明原始 每個字彙A到J描供π ’、、、翻澤片語叶’原始句子 果到Jk供下列第-估計數值: A= 1.0、By 〇、c = 2.〇、G=1〇、h==〇5 〇、D=1〇0、Em.0、 Ο·5’ 以及 J=0.2。 57 1281111 接著,每個包含步驟102之檢索,從相對應的翻 譯資料庫中所撿選的翻譯片語之自然句子係用以搜 尋自然句子中之每個字彙之間之原始句子中與任何 予茱之一致之一致的字彙,並且用以計算已提供給每 個發現的一致的字彙之第一估計數值之總合。第一估 計數值之總合假設為一致之程度(第一估計數值之總 合),並且依照每個相關的自然句子之一致之程度之 遞減的次序,顯示檢索所撿選之每個自然句子之翻譯 句子。例如,當具有由檢索而撿選之下列字彙排列之參 自然句子1到5(其中字彙X係一任意的(arbhrary)字 彙): 自然句子 1 = (D、X、X、e、F、G) 自然句子 2 = (D、X、e、F、G) 自然句子3 = (D、E、F、G) 自然句子 4 = (A、B、X、C、X、D) 自然句子 5 = (D、E、F、G、Η、J) 每個自然句子之第一估計數值之總合係: β 自然句子1 : 10.0(字彙D)+ 〇(字彙χ)+ 〇(字彙 Χ)+5·〇(字彙 Ε)+2·0(字彙 F)+ i 〇(字彙 G)= 18 〇 自然句子2 ·· 10.0(字彙D)+ 〇(字彙χ)+ 5 〇(字彙 Ε)+2·〇(字彙 F)+1〇(字彙 〇)=18 〇 庄自然句子3 : 10·0(字彙D)+5.〇(字彙Ε)+2·〇(字 彙F)+ 1·〇(字彙⑺=18 〇 自然句子4 : 1·〇 (字彙α)+2·0(字彙Β)+〇(字彙 58 1281111 Χ)+5·0(字彙 C)+G(字彙 χ)+1() Q(字彙 d)=is力 自然句子5 ·· 10·0(字彙D)+5 〇(字彙E) + 2 〇(字 彙 F)+1.0j字彙 G)+〇.5(字彙 Η)+〇·2(字彙 了)叫8·7 其中第一估計數值之總合(一致之程度)之自然 子5係最大。 定義第一估計數值,使得當原始句子中翻譯片語 以及除了原始句子中翻譯片語外之每個字彙減少 時,數值也隨之增加。因此,如上所述,基於第—估 计數值之總合,並且評估每個包含翻譯片語之自然句籲 子,上述自然句子包含靠近於原始句子中翻譯片語之 位置之很多字彙’換言之評估自然句子具有包含很多 包括原始句子中之翻譯片語之片語,以及包括靠近翻 譯片語之字彙之高可能性,以作為具有較高一致程度 之自然句子。 在上述貫施例中,自然句子1到4具有相同一致 之私度之數值(第一估計數值之總合)。當複數個自然 句子基於存在於第一估計數值上而具有相同一致之· 程度之數值時,一致的字彙與基於第一估計數值提供 之第一估計數值之具有相同一致之程度之數值之每 個予果之間之原始句子中之任何字彙一致,第二估計 數值係根據每個自然句子上之翻譯片語中之差異(字 臬之數目)而提供。也定義第二估計數值,使得當每 個原始句子中之翻譯片語增加造成差異時,用於每個 原始句子中之翻譯片語之第二估計數值為最大(以作 59 為增加存在字彙中間之數目)。因此,基於第一估計 數值’計算提供每個具有相同一致之程度之數值之自 j句子中之每個一致的字彙之第二估計數值之總 σ ’並且基於第一估計數值,依照每個相關的自然句 子之第二估計數值之總合之遞減的次序(也包括關於 本啦明之一致之程度)’而顯示每個具有相同一致之 程度之數值之自然句子之翻譯。 例如,在上述自然句子1到4中每個一致的字彙 提供第二估計數值,用以得到第二估計數值之總合,_ 如下列所示。在下列實施例中,假設翻譯片語之第二 估计數值為10.0,定義第二估計數值,使得當翻譯片 语之間字彙之數目增加,例如0、1、2、3、4、…時, 假設其他一致的字彙之第二估計數值也隨之減少,例 如 5·〇、2.0、ΐ·〇、〇·5、0 2,…。 自然句子1 : 10·0(字彙D)+0(字彙Χ)+0(字彙 Χ)+ 1·0(字彙 Ε)+ 〇·5(字彙 F) + 0.2(字彙 G)二 11.7 ^ 自然句子2: 10.0(字彙D)+0(字彙X)+2.0(字彙 E)+1〇(字彙 F)+0.5(字彙 G)= 13.5 自然句子3 : 10.0(字彙D)+ 5·0(字彙Ε)+ 2·0(字 彙 F)+ 1·〇(字彙 G)= 18 〇 自然句子4 : 0·2(字彙Α)+ 0·5(字彙Β)+ 〇(字彙 x)+ 2·〇(字彙 C)+ 0(字彙 X)+ 10.0(字彙 D)= 12.7 因此,依照第二估計數值之總合之遞減的次序而 顯示自然句子1到4(翻譯句子),也就是依照自然句 60 1281111 子之次序3、2、4、1。 定義第二估計數值,當每個自然句子中之字彙以 及每個自然句子中之翻譯片語之間之原始句子中之 任何子果致之一致之子果之間之差異減少時,使得 數值也隨之增加。因此,自然句子包含與原始句子一 致之較大字彙數目,並且在於一致的字彙之間盡可能 不包含不一致的字彙,也就是說,基於第二評估數值 之總合’藉由評估每個包含翻譯片語之自然句子,自 然句子具有評估包含原始句子中翻譯片語之自然句參 子’以及片語可能包含接近翻譯片語之字彙,以作為 具有較高一致之程度之自然句子。 例如藉由下列的程序,可以了解在自然句子與原 始句子中予菜之排列次序之相似度之評估,以及考量 存在於原始句子與一致的字彙之間之自然句子中不 致子茱之數目之一致之程度·· 攸存在於原始句子中翻譯片語之上邊(Upstreani ^ e)中之箣面的字彙群(upstream word group)中, 撿遥與翻譯片語(此處,一前面的字彙鄰近一翻譯片 )^、有最短子距(cjistance)之一前面的字彙,並且從 存在於原始句子中翻譯片語之下邊(d〇wnstream side) 中之後面的字彙群(downstream word group)中,撿 翻澤片語具有最短字距之一後面的字彙。接著, 翻=片浯存在之位置,假設為檢索所撿選之包含翻譯 片^口之每個自然句子中之參考位置(當翻譯片語存在 61 1281111 子中报多複數個地方時,存 语之位置假設為參考位置),從參考位置到用二片 檢選前面的字囊之上邊,用以搜尋具有特定字囊: =到用於已經檢選後面的字囊之下邊,;尋: :特定字㈣^
,4供上述搜尋所發現之前㈣字彙與後面的字囊 之自然句子’用於定義第三估計數值伽崎d assessment value),使得當參考位置與前面的字 間以及參考字茱與後面的字彙之間之字距減少時,數 值也隨之增加。 於是,逛沒有從前面的字彙中撿選以及在原始句 子中+,撿選具有與前面的字彙群具有之最短的字距 (此時,在前面的字彙與翻譯片語之間存在一單一字 果(上述檢索中使用之前面的字彙並且還沒有從後 面的字彙群中撿選,以及在原始句子中撿選具有與後 面的子果群具有之最短的字距(此時,在後面的字彙 與翻譯片語之間存在一單一字彙(上述檢索中使用之 後面的子彙))。從先前之檢索發現之前面的字彙之位 置,到先前檢索發現之前面的字彙與後面的字彙之每 個自然句子中之上邊之具有特定字彙之數目之區域 (例如具有三個字彙)中,搜尋先前檢索之前面的字 彙’並且從先前之檢索發現之後面的字彙之位置到先 前檢索發現之前面的字彙與後面的字彙之每個自然 62 1281111 2子中之下邊,具有特定字彙之數目之區域搜尋先前 檢索之後面的字彙。提供這次的搜尋發現至少前面的 字彙與後面的字彙之自然句子,用以定義第三估計數 使得當先前的搜尋發現之前面的字彙與後面的字 彙之位置,以及這次的搜尋發現之前面的字彙與後面 的字彙之位置之間之字距減少時,數值也隨之增加。 可以使用只根據先前的搜尋發現之前面的字彙 .、後面的子果之位置,以及這次的搜尋發現之前面的 子彙與後面的字彙之位置之間之字距,同等定義之一 估計數值,如前所述。然而,考量原始句子中翻譯片 語以及所搜尋之前面的字彙或後面的字彙之間之字 距,可以定義第三估計數值,使得當原始句子中所搜 哥之别面的字彙或後面的字彙,以及翻譯片語之間之 減少時,第三估計數值上之前面的字彙或後面的 字彙之影響也隨之更增加。取代定義第三估計數值, 使得當先前的搜尋發現之前面的字彙與後面的字彙 之位置,以及這次的搜尋發現之前面的字彙與後面的 子果之位置之間之字距減少時,數值也隨之增加,如 前所述,可以定義第三估計數值,使得當上述參考位 置以及這次發現之前面的字彙與後面的字彙之位置 之間之字距減少時,第三估計數值也隨之增加。 從原始句子中依照翻譯片語到重複上述程序之 遞減的次序之距離,撿選前面的字彙與後面的字彙, 直到從原始句子中不再有任何可以檢選之前面的字 63 1281111 彙與後面的字彙。接著,計算第三估計數值之總合提 供給母個自然句子以及假設一致之程度,並且依照每 個相對應的自然句子之一致之程度之遞減的次序(第 二估计數值之總合),而顯示檢索所撿選之每個自然 句子之翻譯。 舉例而口,g原始句子包含五個字彙A到e(原 始句子一(A、B、C、D、E)),並且具體說明原始句 子中之第二個字彙C以作為翻譯片語,從原始句子中 檢選第一字彙B與D以分別作為一上邊的字彙與一 下邊的字囊’以從前面的字彙之翻譯片語到上邊/中搜 尋具有特定數目之字彙之區域(例如具有三個字囊), 亚且從檢索相對應的翻譯資料庫中撿選之每個包含 翻譯片語之自然句子中之後面的字彙之翻譯片語到 下邊’用以搜哥具有特定字彙之數目之區域(例如且 有三個字彙)以提供第三估計數值給自然句子中發現 前面的字彙與後面的字彙。於是,從原始句子中㈣ 第一字彙AM以分別作為—上邊的字彙與一下= 的字,^前面的字彙A之翻譯片語到上邊以搜尋具 有特定字彙之數目之區域(例如具有三個字幻,並 攸自然句子中所發現前面的字彙B與後面的字彙D 之後面的字彙E之後面的字彙D到下邊,用以搜尋 具有特定字彙之數目之區域(例如具有三個字幻,以 提供第三估計數值給m子發現
與後面的字彙E。 』两町子果A 64 1281111 提供上述的程序給下列十個自然句子(a)到(k), 並且依照弟三估計數值之總合之遞減的次序來排列 句子,如下列所示,其中字彙X與「/」分別代表一 任意的字彙以及標點符號。 1 ·自然句子(a) = (A、B、C、D、E) 2·自然句子(b)= (A、B、C、D、/、B、c、D、 E) 3·自然句子(c)= (B、C、D) 4·自然句子(d) = (A、B、C、X、D、E) φ 5·自然句子(e)= (A、B、C、X、D) 6·自然句子(f)=(A、B、C、/、c、D、E) 7·自然句子(g)=(A、x、b、c、X、D) 8·自然句子(h)= (B、C、/、C、D) 9·自然句子⑴=(B、X、C、/、C、x、D) 10·自然句子(k)=(B、X、x、c、/、c、x、χ、
叮数值給母個 二口’亚且基於第三估計數值之總合而評, 自:、、、:句子與原始句子字奢 产m —/ 排列次序具有高, :h 致子菜之數目盡可能不存在於與原夺
+果之間,也就是說,可以評估包含盡可 不包括不一致字囊之自 J 白妙' h工 果之自然句子之情況之原始句子 然:子’以作為具有較高-致之程度之自然二 以了%在自然句子與原始句子之間评估考 65 1281111 子茱之排列次序之相似 之字彙之間之自然句子 列的程序: 度,以及存在與原始句子一 中不-致字彙之數目,例: 欵 下 前面的字彙鄰近翻譯片 ^片語(此^ 檢選與翻譯片語具有最短轉中, 設存在於自然句子之轉以之是偏 相對應的翻譯資料庫中所撿 =匕3攸檢索 妙6 2 . 遊之翻澤片語之每個ώ
:句子之茶考位置(當存在於自然句 :自 地方中,翻譯片語時,假設存在於任—翻譯片=個 位置為芩考位置),從參考位置到上、蠢 之 特定數目之區域,搜尋^ 一有字彙之 序由字距計算:彙= ^ , Τπ子果之數目(更具體,由字距計算第— =之數目以及由字距計算第二字彙之數目),並且 二里上述檢索中發現的前面的字彙之自然句子中參
,位置與前面的字彙之間之字距’而根據每個測量的 距離以由字距決定第一字彙之數目。 ,退沒有從前面的字彙中撿選以及從前面的字彙 =中,撿述與翻澤片語具有最短的字距(在前面的字 彙:翻譯片語之間存在一單一字彙(上述檢索中使用 之=面的字彙)),從先前之搜尋中發現所撿選之前面 的子彙之位置到先前搜尋中發現之前面的字彙之每 個自然句子中之上邊之具有特定字彙之數目之區域 (例如具有三個字彙)中,搜尋先前檢選之前面的字 66 1281111 並且測量在先前搜尋中發現之前 發現之前面的字囊之間位置之字距,以及在;二: 搜哥中發現之前面的字囊與參考位置之間 上所測量的字距,得到在e _ 口 彙盥夂老付罢々,日在人技哥中發現的前面的字 > 之間之字距,並且根據 離:由字距決定第一字囊之數目。丨= 重複上述程序,直到子序:…的字囊’並且 前面的字彙。句子中不再有任何可撿選的
=例而5 ’當—原始句子包含五個字彙 :二(八^、0,),以及具體說明原二 二=片語’首先從原始句子 相對應的翻譯資料庫中 :…索 子中,從翻譯片語到上邊之片,之自然句 域搜哥兩面的字彙,由所發現 之[
字距來、、灰中势^达 果L之自然句子中之 子=决“一子棄之數目。由此 一子=數目之結果的例子,如下列表格一所i;弟 之數t格—、在檢索字囊c之時期的字距,計算二; 之數目之結果的例子。 τ ^子果 ~7~ -——_
^-Ί 2 -—一 3 0 ^^- 0 1 ^- 67 1281111 a //_:從原始句子中檢選字彙B作為前面的字 二中所發現前面的字囊c之自然句子 :,=的,菜〇到上邊之具有特定字彙之數目(例 口一固予果)之區域,搜尋前面的字, *面的字棄B之自然句子中之字距以決定第=囊: :二此處之字距以計算第一字彙之數目 例子’如下列表格二所顯示·· 表格二、在檢索字彙B之時期的字距 之數目之結果的例子。 于果
"bxYcYxd 一更;V一步,從原 子莱,在先前的搜尋中所發現前面的字彙 子中’從前面的字彙B到上邊之具有特定字彙之數°目 (例如’三個字彙)之區域搜尋前面的字冑A,由 前面的字彙A之自然句子中之字距以決定第a 之數目。由此處之字距以計算第一字彙之數目之結: 的例子,如下列表格三所顯示: ' " 表格三、在檢索字彙A之時期的字距,計算字囊 68 1281111 之數目之結果的例子。
不同於前述之第^ 然句子之 例子 ABCD AXBCD AXXBCD ABXCD AXBXCD — AXXBXCD _ ABXXCD ~ AXBXXCD _ ~~AXXBXXCD— ABCXD AXBCXD AXXBCXD ABXCXD AXBXCXD AXXBXCXD ABXXCXD AXBXXCXD AXXBXXCXD ABCXXD AXBCXXD AXXBCXXD ABXCXXD AXBXCXXD 一 AXXBXCXXD^ ABXXCXXlT" axbxxcxxd" AXXBXXCXXg 索,在包含相對應的翻譯資料庫 、丨丁 /早甲所撿每之翻譯 之母個自然句子中測量字彙之 間之予距,由力她 距以作為由字距之第二字彙 由加總之 原始句子中前面的字彙群之間,勿略::體而厂 心各鄰近翻譯片語. 1281111
前面的字彙之存在的情況下(把包含字彙c之每個自 然句子視為一任意的字彙x之不一致),與原始句子 中之前面的字彙群所撿選之翻譯片語具有最短之字 距之前面的字彙,以及假設存在自然句子中之翻譯片 5吾之位置,為包含檢索相對應的翻譯資料庫中所撿選 ,翻譯片語之每個自然句子之參考位置,以搜尋 選之前面的字彙中,從參考位置到上邊之具有特定數 目(例如,二個子彙)之區域。在先前的搜尋中所發現 =面的字彙之自,然句子中,測量參考位置與前㈣ 之字距(更具體而言,存在於參考位置與前面的 字彙之間不一致字彙之數目),並且假設由「1」加到 所測量的字距得到之字距為參考位置之字距,根據每 個芩=位置之字距由字彙以決定第二字彙之數目。
,還沒有從前面的字彙中撿選,以及從前面的字彙 T中撿選與翻譯片語具有最短的字距,並且從先前搜 哥中發現之前面的字彙之位置中之具有特定字彙之 數目之區域,搜尋先前搜尋中發現之前面的字彙之位 置中之每個自然句子中之先前所檢選之前面的字 f ’在這次搜尋中發現前面的字彙之自然句子中,測 量在,前搜尋中發現前面的字彙以及這次發現前面 勺子桌之間之位置的子距,將先前搜尋中發現之前面 的字彙與參考位置之間之字距加到所測量的字距,以 得到在這次搜尋發現之前面的字彙與參考位置之間 之子距’亚且根據所得到的字距,由字距以決定第二 70 1281111 字彙之數目。依昭眉私A 7丄 的次序檢選前面:字片語咖^ 句子中+ ^彳 且錢上述料直到原始 中不再有任何可撿選的前面的字彙。 始句=(而二當:原始句子包含五個字彙Α到以原 ,前面的字彙群之門勿澤片語,首先在原始句子 彙C之1在二:=近翻譯片語之前面的字 字彙Α依序、、列旦>彳原始句子中檢選之字彙B與 果A依序測里母個自然句子 - 得到^之結果,如下列表格四所顯示··置之字距以 之結果二子由子距量測關於第二字囊之數目之字距 間的字 距 (A 與 B 之 B與D之 間的字距 (實際字 距 間的字距 (BD + AB) —-----
基於上述測量結果,由 ^__J 个 田子距決宏笛一 ^ 目,以得到由字距計算第- 一茱之數 格五所顯示。 数目之、…果,如表 表格五由字距計算笫— 子。 弟—予菜之數目之結果的例
71 1281111 ABCD —---- __ 0 AXBCD ---〜 0 axxbcdI 0 ABXCD 0 0 2 0 1 0 1 0 0
一口叫ντ υ 〜甘Ί回目然句子
中,完成有關原始句子中前面的字彙群之由字距 第一字彙之數目以及由字距計算第二字彙之數 時,在每個自然句子中,比較由字距計算第之 數目:及由字距計算第二字彙之數目之計算結果,並 且計异的結果顯示從由字距選擇第一字彙之數目中 較小之字彙以及由字距選擇第二字棄之數目之間之 子距之結果,以作為—最後的評估。更具體來說,例 如一自’然句子(A、b、c、d)具有0之字距以及由字 :之第-字彙之數目中字彙之數目3,同時自然句子 在字距0時具有字彙之數目〇,在字距i時呈有字彙 =目0,在字距2時具有字彙之數目2,如表格五 所顯示。因此,在字距W具有最大的字囊之數 目之字距之第一字彙之數目以作為自然句子(A、B、 =、D)之前面的字彙群之最後的評估。上述的實施例 應用於本例子,字彙之數目在由字距之第一字囊之數 =以及由字距之第二字彙之數目係為不相同的。當在 予距0日寸字彙之數目〇彼此相同時’在字距卜2、… :寺:!?之字彙之數目依序比較,並且從由字距選擇 弟-子菜之數目以及由字距選擇第二字彙之數目,在 字距具有較大數目之字囊之數目以作為最後的 72
I2811H
由予距計算第二字彙之數目之目的,在於正確評 估與原始句子之字彙之排列次序之相似度,並且也從 原始句子中改變自然句子中之字彙之部分之次序。例 自然句子((^、八、6、]〇)當在第一字彙之數目之 子距中’在0之字距時字彙之數目為〇,在1之字距 犄字茱之數目為〇,在2之字距時字彙之數目為1的 ,,,同時第二字彙之數目之字距中,在〇之字距時 字彙之數目為0,在1之字距時字彙之數目為2,在2 之字距時字彙之數目為〇。因此,在上述自然句子中 由子距k擇弟一字彙之數目以作為前面的字彙群之 最後的評估。在上述例子中,當將自然句子(c、八、 B、D)視為(c、X、χ、D)而評估由字距計算第一字彙 之數目之結果的時候,同時將自然句子(C、A、B、 視為(X、a、b(移除掉字彙c)、D)而評估由字距計 t第—予彙之數目之結果。因此,評估上述自然句子
之包含於較高完整性(integrity)之情況中之原始句 子。 當執行上述用於包含檢索相對應的翻譯資料庫 中所撿遥之翻澤片語之每個自然句子的程序,以決定 最後的評估時,使用存在於每個上述的自然句子之原 始句子中之翻譯片語之下邊中之後面的字彙群,執行 相,,程序(由字距計算第一字彙之數目以及由字距 计异第二字彙之數目,並且關於後面的字彙群之最後 的評估之決定)。 73 1281111 於是,計算每個自然句子得到前面的字彙群之最 ㈣評估以及後面的字彙群之最後的評估(由相同的 字距,假設每個最後的評估中由字距計算之字彙之數 目),以得到每個自然句子之一廣泛的評估。基於每 個自然句子之廣泛的評估,依照字彙之間之字距之遞 減的次序所表示來顯示每個自然句子之翻譯句子。
更具體而言,例如在字距0時依照字彙之數目之 ,減之次序重複每個自然句子之排列,並且在字距i ¥依照字彙之數目之遞減的次序的時候,在字距〇時 -、有相同子彙之數目之自然句子之其後的排列,同時 在字距1時增加相當於所比較字彙之數目之字距,由 f泛的評估所表示之依照字彙之間之字距之遞減的 -人序來排列每個句子,並且顯示相當於每個自然句子 之翻譯句子。 根據此點’基於廣泛的評估而處理下列顯示之九 個自然句子⑷到(j),作為上述所提及以排列自然句 子’下列的次序中之結果: 1 ·自然句子(a) = (A、B、C、D、E) 2·自然句子(b) =(A、B、C、D、/、b、c、D、 E) 3 ·自然句子(c) = (A、B、C、X、D) 4·自然句子(d)= (B、C、D) 5·自然句子(e)= (A、X、B、C、X、d) 6·自然句子(f)= (B、C、X、D) 74 X1281111 7·自然句子(g) = (B、c、/、〔、 、X、0) 、c、x 8·自然句子(h)= (B、x、〔、/、) 9·自然句子⑴二(B、X、χ、广 D) 八、l、 上述的程序中,由字彙計算之第 不需要的。當不需要從原始句子中—一字彙之數目係 分排列之字彙時,可以省略由字距自然句子中部 數目,並且使用由字距計算之 之第二字彙之 最後的評估。 字菜之數目以作為 照例,基於上述第一估 ^ 第三估計數⑽四估計數值,二估計數值/ 自然句子之選擇或排列’通常可:一 -計畫分析而使用自然句子之 ⑷刀析或 檢索用以參考之翻譯句子作為具有:全擇當 語時,基於“二 ::子致本例子,評估自 等,在原始句子與自然句子之間, _ 子果之數目用以評估一致之程度。舉例而 檢索模式,例如-片語檢索模式,另 _退;*檢索模式,並^基於第-估計數值以及第 、估冲數值或第二估計數值,執行-致之程度之評估 二及當片語檢索模式時選擇自然句子之選擇或重新 排列。 75 1281111 雖然一例子,其中一致之程度首先計算以選擇一 自然句子(識別相對應的翻譯)’當不能只基於一致之 程度而限制合適的自然句子時,由一相關性分析 (correlation analysis)選擇一自然句子(識別相對應的 翻譯),並且當即使基於上述相關性分析也不能限制 合適的自然句子時,由一計畫分析(scheme anaiysis) 選擇一自然句子,本應用並不限制於此。可以計算個 別包含檢索裝置之檢索所撿選之翻譯片語之自然句 子之一致之程度,執行相關性分析以及計畫分析可以 。平估個別自然句子’並且根據優先的次序選擇一自然 句子,例如下列表格六中顯示之基於評估結果。 —的例子 致之 相關性分析 程度 f存在高相關性字 彙)
再者,計算 计晝分析 (存在選擇性字 彙) 否 個相關性分析以及叶*八柄、,0私度Μ執行每 啊^及口十旦刀析,亚且可以選擇具有 廣泛的評估分數(seGre)之自然句子。 廣泛的評估分數=a x(一致产 評估分數h 1致之私度)+bx(相關性 刀數)+C X(計晝評估分數) 中基於相關性分析之結果相關性評估分數係 76 1281111 子之—評估分數 析之結果計晝評估分數係提供給個別自:=:刀 評估分數,祐日, W刃目然句子之一 各〜二a、b以及C係預先定義的係數。 月I、述之翻譯識別程係中 (圖从與2B),使得詢問自 么式表- :!:::翻譯資料庫所撿選之處理過的原始句 致(步驟⑽),並且如果答案係為肯定4 取及頒不與處理過的原始句子完、 子之翻譯句子。麸而⑴虚致之自然句 上述的步二::=不限定於此。可以忽略 然句子是否與步:中::1且不管關於任何自 無條件執行步驟108中之程序以及 中’當步驟㈣檢索而檢選複數個自;句 二自執然句子中’自然句子之-致之程度係 =: 二:果:步…及步驟106時可以得到相同的 根據自然句子之I日 ^ ^ 數目以及登记於相對應的翻譯 子’選擇本發明中-翻譯之正確性’ 翻譯之-確性也隨:二因Γ目增加時’選擇一 明之翻譯識別系統令之;^譯的朴可=取關於本發 工"口止 夺々原士口句子以及翻譯句 ’亚虽本身執行選擇相對應的翻释資料庫之前或 77 1281111 之後N,自動同時登錄讀取自然句子以及翻譯句子。 根據本發明,只需自動登錄相對應的翻譯資料庫中之 自然句子以及翻譯句子,並且不f要執行編輯或處 ^例如自然字彙除以字彙單位。因此,相對應的翻 #貝料庫中很容易地自動並且同時登錄資料(自然句 子以及翻譯句子)。 …、 雖然前面敘述之強調翻譯片語之翻譯之模式的 例子,,當顯示-翻譯句子時,此模式並不限制於此。 理所當然,模式不強調翻譯片語之翻譯也包含於本發 明之適當的之分數。 一本七明中遥擇一翻譯之正確性,也根據登錄於相 ,應:翻澤貧料庫中之自然句子以及翻譯句子之容 =之贅^](redundancy)。#強調登錄於相對應的翻譯 1料ρ庫中之自然句子以及翻譯句子之容量之贅詞 守込擇翻澤之正確性與登錄於相對應的翻譯資料 庫(相對應的翻譯資料庫之容量)中之自然句子,以及 翻譯句子之數目成比例降低。因此,當登錄於相對應 的翻厚二料庫中之每個自然句子以及翻譯句子,搜尋 具有内容之高相似度之自然句子以及翻譯句子,並且 ^現内合之向相似度之自然句子以及翻譯句子,可以 提权仉相對應的翻譯資料庫中移除一組自然句子以 及翻#句子之功能。 、,、隹别面敘述選擇使用一單一相對應的翻譯資 料庫之翻澤的例子,但是運用並不限定於此。當處 78 1281111 理過的原始句子限制於一特定領域時,例如翻譯— =領域之主選單而使用此程式,可以將相對應的翻譯 貝料庫除以自然句子之領域。因此’可以避免個別相 對應的翻譯資料庫之容量增加,並且得至,卜例如節省 檢索自然句子之時間以及增進選擇一翻譯之正 性,之效用。 雖然個人電腦1〇根據特定操作如上述使用者透 過上述之個人電腦1〇,用以執行命令而顯示翻譯片語 之翻譯之翻譯識別程序之模式的例子,但是本發明並 不限定於此。本發明可以運用一電腦系統38力1以裝 配(configure),並且上述之電腦系統%中之終端機 32與一伺服裔μ兩者都連接到一網路%,例如網产 網路(Internet)或區域網路(L〇cal斛⑶Netw_^ LAN),並且包含一硬體裝置之儲存媒體%等,連接 到伺服為34以儲存相對應的翻譯資料庫,使得當一 使用者透過終端機32在線上⑽nne)詢$時,飼服器 34識別亚且提供線上合適的翻譯,如圖四中所顯示。 芩考圖四中表示之電腦系統38,為了使一使用者 _翻譯上做詢問(參考圖四中之⑴),而具體說明 一原始句子之原文,例如,藉由使用者透過終端機U 傳达原始浯έ之原文資料到伺服器34之操作,或使 用者連接包合原始語言中之原文到伺服器網頁 (page)之致性資源位置(uniform resource locator· URL)。在此例子中可以安裝此系統,使得當 79 1281111 伺服器34執行翻譯識別程序 (—g)儲存於儲存媒 :’靡’问時存取 庫以識別特定的原文(圖四中之 且將是別的翻譯(句子翻澤(句子),並 問(失者a i 到終端機32以回答此气 问(芩考圖四中之(3))。ra盔、-從, ^ 用者可以八古a」為14樣的安裝允許複數個使 靡…/ 心34之翻譯識別的功能(以及相對 應的翻澤資料庫),特別者 子 &曰 竹乃j田相對應的翻譯資料庫需要 谷I大時可以有效減少成本。 而要
:然前面敘述本發明運用至一電子辭典系統之 杈式的例子,但是應用並不限定於此。理所當然,本 發明也應㈣-機器翻譯(自動翻雅統、—自 釋系統(用聽覺解釋了解一聽覺上(ac〇usticaiiy)輸入 的原始句子之系統,朗所了解的原始句子之翻譯句 子二並且傳輸聽覺上所識別的翻譯句子)以及一語言 孚4系、、先荨,圖五,係顯示本發明所提供之一機器翻 睪糸、、先40之女I之示意圖。參考圖五,一原始句子 輸入部分42將一翻譯的原始句子輸入(原文資料)用 以k擇翻澤片語44以及一翻譯句子集合(assernbly) 部分46之兩者的部分。當選擇一翻譯片語44之部分 重複地選擇已輸入翻譯的原始句子中之特定片語,以 作為一翻譯片語的時候,同時在翻譯的原始句子中選 擇一個別的片語,並且詢問一翻譯識別部分48以檢 索所選擇的翻譯片語之一翻譯。翻譯識別部分48係 一部分相當於關於本發明之翻譯識別系統,並且執行 80
I2811H 翻澤識別程序,同時存取儲存於 對應的翻譯資料庫以識別所詢 =:50中之相 譯,並且將識別的翻# ° 1澤片語之翻 基於用於選擇翻譯;;]:澤二子集合部分 語,翻譯句子集合部分4。之^分傳送翻譯片 送之_如果需要,改變識別部分48傳 言中翻譯句子,、人序)以集合原始語 子J于,翻澤4別部分48 始句子輸入部分42傳送之翻譯片、:相及原 集合於翻譯句子集合部八 ^ 原始句子。將 2认ϊ '、口 ^刀Μ之翻譯句子傳穿$丨丨逢·π β 句子輸出部分52’用以執行翻譯句子輸出=翻澤 顯示於一顯示器上,々你^ ^千輸出耘序,例如 &屮耸^ L 錄到—儲存媒體以及一_覺的 輸出專。在上述所提及之安 炎 I、見的 翻譯>{古五之如$ 口為本發明應用到 :#片°°之翻#之識別,從原始句子中得到… 自然翻譯句子作為原始句子中:料有仔到 之翻譯,並且從翻譯句子、P之网可月b性 句子成為-自然翻譯句子以52中傳送之翻譯 子。再者,田也 #為原始句子中之—句 之嘈止戈八狀:、、不需要複雜的程序,例如識別一部分 之4。或刀析依據子結構,刀 例,參考圖五,透過此裎床7才序了以被間化。照 譯句子,已經說明例如識別線上傳送所得到的翻 句子之線上U PI 〇B以及集合翻譯以回答翻譯 千之線上珣問’如圖四所顯示。 -對::Γΐ;Γ相對應的翻譯資_ 對相關句子(不同語言敘述一對句子)之一、 其他部分分別稱為—自勺子)之-句,以及 Η…、句子與一翻譯句子,第一語 81 1281111 S到第二語言中,可以使用翻譯 相對應的㈣資料庫以作為上述之 語言中之翻譯(翻譯句子之識別)之資料庫1^ °到第 雖然前面敘述英文、日文以及中文之例子,以作 二言或-對象語言之-例子,但是並不限定 理所當然,可以應用到,例如,法文、 :二t利文、西班牙文以及葡萄牙文等,以作為 原始b S或對象語言。 明以較佳實施例說明如上,然其並非用以限 二主張之專利權利範圍。其專利保護範圍當 請專利範圍及其等同領域而定。凡熟悉此 項域之技藝者’在殘離本專利精神或範圍内,所作 潤飾,均屬於本發明所揭示精神下所完成之 夕改交或设計,且應包含在下述之申請專利範圍 内0 【圖式簡單說明】 圖一係顯示-關於最佳實施例之個人電腦配置 之方格示意圖。 圖"—A 命 一 /么 θτ* — 〃 一h係顯示翻譯識別程序之内容的流 程圖。 圖三係顯示自然句子之例子與相對應翻譯之表 格’其包含登錄於—翻譯資料庫中之一字彙「操作」 (operation) ° 圖四係敘述應用本發明之一電腦系統之模 82 1281111 式,且透過網路連結一終端機與一伺服器之方格示意 圖0 圖五係顯示應用本發明之一機器翻譯系統之配 置的方格示意圖。 【主要元件符號說明】
個人電腦10 中央處理機10A 唯讀記憶體10B 隨機存取記憶體10C
輸入/輸出埠10D 匯流排10E 顯示器12 鍵盤14 滑鼠16 硬碟裝置18 CD唯讀記憶體裝置20 掃描器22 CD唯讀記憶體24 網路30 終端機32 伺服器34 儲存媒體36 電腦糸統3 8 機器翻譯系統40 83 1281111 原始句子輸入部分42 翻譯片語44 翻譯句子集合部分46 翻譯識別部分48 儲存媒體50 翻譯句子輸出部分52 步驟 100、102、104、106、108、110、112、114 步驟 116、118、119、120、122、124、126、128、 130 、 132 、 134
84

Claims (1)

1281111 十、申請專利範圍·· 1· 種用於識別一相斟虛^ A . 乂健存包含於一原始語言中之複數個字 ::複數個自然句子,該自然句子 句子相關聯; ^索衣E用以從儲存於該儲存裝置之該原始語言中 =個!然句子中檢索自然句子,在該自然句子包含 二口 5吾έ之原始句子中之翻譯片語·以及 :之3==用_該檢索裝置之檢索所楝 之.剛子中翻譯該=翻亚且識:J少該自然句子 〒/月。口之翻澤,以作為該翻譯片語之 πχ然句子係基於一致的程度之評估而選擇。 2. nr範圍第1項之用於識別-相對應翻譯之系 =裝置係從該儲存於該健存裝置 =個自然句子中’檢索與該原始句子完:中 然句子;以及 主文之自 當::與該原始句子一致之自然句子與 翻譯識別裝 子完全—致之自D子之該翻譯句子,以料句 子之翻譯句子。 马"亥原始句 、如申請專利制第1項之用於識別―相對應翻譯之系 85 1281111 統,其中該翻譯識別裝置計算該檢索裝置之檢索所楝選 之自然句子,與該原始句子一致之字彙之數值,並且評 估與該原始句子一致之程度,使得當該計算一致的字彙 之數目增加時,與該原始句子一致之該程度隨之提高。 4·如_4專利關第3項之詩朗—相對應翻譯之系 統’其中該第一翻譯識別裝置將該計算一致的字彙之數 值,除以該計算包含該翻譯片語之字彙之數值,以計曾 該一致之程度。 1斤 項之用於識別一相對應翻譯之系 5·如申請專利範圍第 統, 其中該翻譯識別裝置亦計算 ^ ^ 1 V田4松索策置之檢索所楝 &之自然句子,鱼該丁 曰m 、亥原始句子不-致之字彙之數值,並 且坪估與該原始句子一致 字彙之致之私度,使得當該計算一致的 =之數值減少時,與該原始句子不—致之該程度隨之 從向 0 6·如申請專利範圍第3項 絲甘山丄 、之用於硪別一相對應翻譯之系 統’其中當計算該—私空a ^ a 宁 裝晋π七人^ μ欠子果之數值時,該第一翻譯識別 攸计异之字彙中預 常出現的字彙。 頂先疋義(predefmed)之經 86 1 ·如申請專利範圍第3項或第 、/ 員之用於識別一相對應翻 1281111 譯之系統,其中當計算該—致的字彙之數目或該不一致 的字彙之數目時,藉由將該字彙視為—致的字彙 翻譯識別裝置用以計算由於單數/複數或時態 有不同字尾之字彙。 〃 8. 如申請專利範圍第3項之用於識別—相對應翻譯之系 統’其中當計算該一致 ’、 別裝置不需重覆計算Γ現欠二時’該第一翻譯識 見一-人或多次之一致的字彙。 9. == 圍第3項或第5項之用於識別-相對應翻 ^糸u該第-崎識別裝置評估該檢索裝置之 才双索所撿選之自铁&早金# …、一忒原始句子之間之字彙排列 =相,’並且評估與該原始句子一致之該程度, ^田該子菜排列順序之相似度提高時,與該原始句子 一致之該程度隨之提高。 1 〇·如申請專利範圍第3 園弟3項或弟5項之用於識別一相對應翻 ^糸統,其中該第—翻譯識別裝置在與該檢索裝置之 =所撿選之自然句子一致之字彙中,計算該不一致的 :::數目’亚且評估與該原始句子一致之該程度,使 子在於該計算-致的字彙中不—致的字彙之數目 減夕打,與該原始句子一致之該程度隨之提高。 u.如申4專利範㈣!項之用於識別—相對應翻譯之系 87 1281111 統’更包含一搜尋裝署, ^ Φ w ^ , 用以搜尋用於該翻譯片語之該 索所撿選之自然句子,與經常出現 始语:之相同句子中之經常出現的字彙; 2 "亥第翻#識別裝置參照該搜尋裝置發現與存在 广原始句子中之特定經常出現的片語,以及參,昭包含 :個該翻譯片語的自“子之翻譯句子,該翻譯片語在 尋包含每個該翻譯片語之檢索裝置之檢索所 k奴自'然句子,以及用於經常出現的翻譯片語之翻譯 :特义經常出現片語之間用以識別發現經常出現的翻 °,以作為該原始句子中該翻譯片語之翻譯。 12.如申請專利範圍第1項之用於識別-相㈣翻譯之系 統,更包含-識別裝置,用以識別在該原始句子中之選 ,性片語,並且取代不包含該檢索裝置之檢索所檢選之 自然句子中之標的片語, 其中該第-翻譯識別裝置識別至少自然句子之翻譯句 子:之該翻譯片語之翻譯,該自然句子之翻譯句子係包 ^每個該識別裝置所識別<選擇性片冑,以纟在該檢索 裴置之檢索所撿選之自然句子中之該翻譯片語,以作為 该原始句子中至少該翻譯片語之翻譯。 13·如申請專利範圍第12項之用於識別一相對應翻譯之系 統,其中該識別裝置搜尋儲存於包含該標的字彙之自然 句子之該儲存裝置之複數個自然句子,與搜尋儲存於該 88 1281111 :有:子結構的自然句子之儲存裝置中之自然句 所撿選之選之自然句子,並且識別該檢索 選擇性片語取代標的片語之片語,以作為該 一::硪別—相對應翻譯之系統,該系統包含: 彙之:螯置,用以儲存包含於一原始語言中之複數個字 是數個自然句子’該自然句子與 句子相關聯,· 〜_洋 tf裝置’用以從儲存於該儲存裝置之該原始語言中 之複數個自^<白I Φ A 、、、子中铋索自然句子,該自然句子包含一 原T語言之原始句子之翻譯片語; 认f尋衣置用以搜尋用於該翻譯片語之該檢索教置之 ίΓ斤撿ϊ之自然句子,與出現於該原始語言之相同句 子中之經常出現的翻譯;以及 -第二翻譯識別裝置,用以搜尋包含每個該翻譯片語 自然句子之翻譯句子,與搜尋用於經f出現的翻譯片°語 之特疋經系出現的片語,該翻譯片語係參照該搜 所發現與存在於該原始句子中之該特定經常出3 语,以及残包含於該檢索裝置之檢索所撿選之自 子之間之每個該翻譯片語之自然句子之翻譯句子,並 用於識別發現經常出現的翻譯,以作為該原中 譯片語之翻譯。 89 1281111 15.如申明專利範圍g i項或第ι4項之用於識別一相對應 翻譯之系統’其中當該翻譯片語包含複數個字彙時,^ h索V置從儲存於該儲存裝置中之該原始語言之複數 個自然句子之中,檢索包含至少一個包括翻譯該片語之 複數個字彙之自然句子。 16.-種用於識別―相對應翻譯之方法,該方法包含: 第步驟’於該第一步驟中,檢索包含儲存於一儲存 ,置中之複數個字彙之原始語言之每個自然、句子,該自 2句子與一對象語言之翻譯句子相關聯;以及μ = 驟中’評估在該第-步驟檢索 …、勺子η该原始句子之間之_致之程 之一致的程度之評估而選擇之自然句; 中至少翻’:::譯該片語之翻譯,以作為該原始句子 土夕瑚#该片語之翻譯。 17 .一種用於識別-相對應翻譯之方法,該方法. 於該第一步驟中’檢索包含儲存二. 句子與==之原始語言之每個自然句子,該自然 h 、對象语5之翻譯句子相關聯; 之二:該第二步驟中,該第一步驟檢索所撿選 始語:之:二::尋該翻譯片語與經常出現於-原 ^ 之相问句子中之經常出現的字彙;以及 -第三步驟’於該第三步驟中,包含每個該翻譯片語與 90 1281111 =常出現的片語之自然句子之翻譯句子,係用以搜 ::1經常出現的翻譯片語之翻譯與發現經常出現的 澤^注以作為該原始句子中之該翻譯片語之翻譯,該翻 °浯之翻譯係參照該原始句子與該第二步驟#現之 :::常出現的片語,並且於該第-步驟檢索所檢= 譯了句子中’茶照包含每個該翻譯片語的自然句子之翻 連接到一儲存裝置之系統侧 :於,存裝置中之該原始語言之複數個自然句子 儲存包合與—對象語言中之翻譯相關之複數個字囊 語言中之複數個自然句子,該系統具 置的功能以檢索包含於該原始語言之原始句 澤片語之自然句子;以及 》 譯識職置,用以評㈣檢索裝置之檢索 以〜以小I 間的一致之程度,並且用 oa v自然句子之翻譯句子中之該翻譯片語之1 別翻譯,以作為該原始句子中該翻譯片語之翻譯,而; 自Λ、、:句子係基於该評估一致之程度而選擇。 19.-種使電腦連接到—儲存裝置之“,從 儲存於該儲存裝置之該原始語言之複數個心; 中,储存包含與-對象語言中之翻譯一致之複數個 之-原始語言中之複數個自然句子,以具有檢索裝置的 91 1281111 :::亥檢索襄置的功能係用以檢索包 之原:句子中翻譯片語之自然句子; 秦 尋該翻譯片語之檢索襄置之檢索所 =:=r該原始語言之相同句子中之 :一翻譯識職置,用以搜尋包含每個該翻譯片語之 ,、、、'句子之翻譯句子,以及搜尋用於經常出現的翻譯片 語之特定經常出現的片語,並且用以識別發現經常出現 ,翻譯’以作為該原始句子中該翻譯片語之翻譯,該特 疋、、’二$出現的片語係芩照利用該搜尋裝置發現與存在 於該原始句子中之特定經常出現的片語,以及參照每個 包含翻譯該片語的自然句子之翻譯。 92 1281111 targeted words are replaced with the alternative words in the original sentence are displayed. 七、 指定代表圖: (一) 本案指定代表圖為:第(一)圖。 (二) 本代表圖之元件符號簡單說明: 個人電腦10 中央處理機10A 唯讀記憶體10B 隨機存取記憶體10C 輸入/輸出埠10D 匯流排10E 顯示器12 鍵盤14 滑鼠16 硬碟裝置18 CD唯讀記憶體裝置20 掃描器22 八、 本案若有化學式時,請揭示最能顯示發明 特徵的化學式: 4
TW93138040A 2003-12-15 2004-12-08 System and method for identifying corresponding translation TWI281111B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003416778 2003-12-15
JP2004301302A JP4401269B2 (ja) 2003-12-15 2004-10-15 対訳判断装置及びプログラム

Publications (2)

Publication Number Publication Date
TW200530856A TW200530856A (en) 2005-09-16
TWI281111B true TWI281111B (en) 2007-05-11

Family

ID=34829141

Family Applications (1)

Application Number Title Priority Date Filing Date
TW93138040A TWI281111B (en) 2003-12-15 2004-12-08 System and method for identifying corresponding translation

Country Status (3)

Country Link
JP (1) JP4401269B2 (zh)
MY (1) MY137235A (zh)
TW (1) TWI281111B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI456415B (zh) * 2010-12-16 2014-10-11 Inventec Corp 翻譯查詢與翻譯轉換系統及其方法
TWI492072B (zh) * 2013-12-19 2015-07-11 英業達股份有限公司 輸入系統及其方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4688629B2 (ja) * 2005-10-25 2011-05-25 株式会社ジャストシステム 電子メッセージ分類装置および電子メッセージ分類方法
US7853555B2 (en) * 2006-04-19 2010-12-14 Raytheon Company Enhancing multilingual data querying
JP5032453B2 (ja) * 2008-12-15 2012-09-26 株式会社東芝 機械翻訳装置及び機械翻訳プログラム
JP6252204B2 (ja) * 2014-01-28 2017-12-27 富士通株式会社 情報処理装置、意図解析方法、およびプログラム
JP7439429B2 (ja) 2019-09-24 2024-02-28 カシオ計算機株式会社 検索装置、検索方法、検索プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI456415B (zh) * 2010-12-16 2014-10-11 Inventec Corp 翻譯查詢與翻譯轉換系統及其方法
TWI492072B (zh) * 2013-12-19 2015-07-11 英業達股份有限公司 輸入系統及其方法

Also Published As

Publication number Publication date
TW200530856A (en) 2005-09-16
JP2005202924A (ja) 2005-07-28
MY137235A (en) 2009-01-30
JP4401269B2 (ja) 2010-01-20

Similar Documents

Publication Publication Date Title
Gliwa et al. SAMSum corpus: A human-annotated dialogue dataset for abstractive summarization
Mave et al. Language identification and analysis of code-switched social media text
JP4654745B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US20070112553A1 (en) System, method, and program for identifying the corresponding translation
Donato et al. Investigating redundancy in emoji use: Study on a twitter based corpus
KR20160026892A (ko) 논팩토이드형 질의 응답 시스템 및 방법
Lind et al. Norwegian Words: A lexical database for clinicians and researchers
Dawdy-Hesterberg et al. Learnability and generalisation of Arabic broken plural nouns
JP2005532605A (ja) 内容変換の方法および装置
WO2020199600A1 (zh) 情感极性分析方法及相关装置
JP4600045B2 (ja) 意見抽出用学習装置及び意見抽出用分類装置
Delaere Do translations walk the line?: visually exploring translated and non-translated texts in search of norm conformity
Krause et al. Gradient effects of animacy on differential object marking in Turkish
Hubers et al. The effect of prescriptivism on comparative markers in spoken Dutch
Azmi et al. Universal web accessibility and the challenge to integrate informal Arabic users: a case study
Larner A preliminary investigation into the use of fixed formulaic sequences as a marker of authorship
TWI281111B (en) System and method for identifying corresponding translation
Liebeskind et al. Semiautomatic construction of cross-period thesaurus
JP6409071B2 (ja) 文の並び替え方法および計算機
JP6942759B2 (ja) 情報処理装置、プログラム及び情報処理方法
Melero et al. The Spanish language in the digital age
KR101379935B1 (ko) 메시지 정보 추출 시스템 및 그 방법
JP5254888B2 (ja) 言語資源情報生成装置、方法、プログラム、および記録媒体
JP5441173B2 (ja) 関係情報抽出装置、その方法及びプログラム
Pei-Chi et al. On learning psycholinguistics tools for english-based creole languages using social media data

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees