TW501030B - Machine translation system and translation server and client thereof - Google Patents

Machine translation system and translation server and client thereof Download PDF

Info

Publication number
TW501030B
TW501030B TW090101727A TW90101727A TW501030B TW 501030 B TW501030 B TW 501030B TW 090101727 A TW090101727 A TW 090101727A TW 90101727 A TW90101727 A TW 90101727A TW 501030 B TW501030 B TW 501030B
Authority
TW
Taiwan
Prior art keywords
translation
analysis
language
original
text
Prior art date
Application number
TW090101727A
Other languages
English (en)
Inventor
Hiroyasu Kikuchi
Original Assignee
Joyport Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Joyport Inc filed Critical Joyport Inc
Application granted granted Critical
Publication of TW501030B publication Critical patent/TW501030B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Description

501030 五、發明說明(1) 【發明所屬技術領域】 本發明係有關於一種按照利用網際網路 散之翻譯程式皆將原文譯成別國語言之機嘩::: 翻譯伺服器、客戶機及儲存有該程式之記錄:二糸統與其 【習知 翻 理解表 過程構 械翻譯 言之表 機 轉移方 中間言吾 之情況 在 言之意 據例句 式、將 機 術,在 分析等 第三之 在 技術】 譯係以 達之内 成。用 ,採用 達置換 械翻譯 式,經 言方式, 轉移方 轉移方 義後組 之翻譯 以上混 械翻譯 轉移方 語言分 譯語選 語言分 別的語言重 容和重新以 所謂的電腦 使用語言間 為所要之語 t方式大致 由第三語言 。實用#, 式成為主流 式有按照單 Α之意義分 方式、連常 合之混合型 係、在電腦處 式,由第一 析、第二之 擇、形態素 析技術,分 新表達某語言所表達之内容,由 所要之語言表達所理解之内容之 嚴密的實現此過程係困難,在機 之文法或意義之對應關係將原語 言之表達。 上分為在2語言間進行該置換之 之世界語言變換為康要—之語言之 因中間語言方式費時,灰Up分 〇 字階層置換之直譯方式、分析語 析翻譯方式、使用對譯全集之依 識都使用之依據知識之翻譯方 翻譯方式等,執行翻譯。 理中代表自然語言處理之應用技 之形態素分析、語法分析、意義 語法變換、詞彙變換等變換以及 調整等產生之三種過程構成。 析精度有大幅度的提高,但是文
五、發明說明(2) 章長時,藉著完整配備收錄了大 典’正展望意義分析技術。A里之格…之意義辭 在變換技術,正嘗試即使橫跨多個用言之 交換之廣域變換技術。又,在產 表達也—起 :字)之產生等係問題,但是在別的技術上、疋有:、 省:補充技術、在系統内將原文自動置換為易文翻 *或子茱之知識之技術等。 又 在翻譯知識上,需要語言知識、狀況知識、專業知識 =各式各樣之知識,也需要將這些知識變換成法則和機二 辭典之形式。最近,在重視翻譯之即時性之應用上, 電子郵件翻譯之服務。 ’、 在此’在習知技術上,在特開平1 0-31 2382號公報上 公開類似例句翻譯系統。 若依據該公報,記載具備了( 1 )輸入裝置,輸入應翻 譯之原文章;(2 ) —句分割裝置,將所輸入之原文章分割 成句子單位後輸出原文;(3 )資料庫部,由辭典資料庫及 成對記憶例句和對譯句之例句資料庫構成;(4 )完全一致 句子翻譯裝置,檢索例句資料庫後輸出和原文完全一致之 例句之對譯句;(5 )類似例句翻譯裝置,藉著檢索例句資 料庫後抽出和原文部分不一致之例句,按照原文變更該對 譯句而翻譯;(6 )句子分割裝置,在檢索例句資料庫後無 法發現既定比例以上和原文一致之例句之情況,按照既定 之規則分割原文;(7 )分割句完全一致句翻譯裝置,檢索
第6頁 501030 五、發明說明(3) 例 貝料庫後輸出和分割原文完全一致之例句之對 (8)为割句類似例句翻譯裝置,藉著檢索例句資考句; 出和原文部分不一致之例句,按照分割原文變更該^抽 而翻譯;(9)新句子翻譯裝置,在檢索例句資"'澤句 發現既定比例以上和分割原文一致之例句之情^ 典資料庫後翻譯·,(10)分割翻譯文組立裝置,組立辭 文各自之翻譯文後,輸出原文之翻譯文。 刀°彳原 此外,在該公報上記載了,為了經由網際網路利 似例句翻譯系統,預先在一處設置機械翻譯伺服器,使^ 自終端機經由網際網路存取後可翻譯。終端機只要具有2 網際網路存取之功能,自任何終端機由任何地方 ^ 二 機械翻譯。 j用 於是,若依據該公報,因檢索例句資料庫自完全一致 之例句求對譯或利用類似例句翻譯,用簡單之構造可高速 的翻譯;因使用以前所翻譯之句子,可省略重複之翻譯; 因翻譯文可統一,在後編輯之情況也參照例句資料庫修正 翻譯文,可簡化編輯作業;因經由網際網路可進行翻譯處 理’利用者只要有小型之終端機,自任何地方都可利用機 械翻譯。 可是,網路在習知之機械翻譯之功用如在特開平 1〇-3 1 2 382號公報上之記載所示,只是活用對於連接輸出 入裝置部和翻譯處理部之使用者介面之路徑資源,機械翻 譯處理本身並無分散處理之創意。因此,希望有效活用具 有和網路連接之等於無限之資源之伺服器。尤其,藉著在
五、發明說明(4) 網黡網路等
大之資料庫分韻:ϋ置後活 這是以前就期望的。 理系碗構成 $ ’夕墩集 Τ械翻譯系統,將龐 一處之翻譯業務, 入 -π悄哼合國間傳 ::j,和以原文顯示於寄信目的::件之情況,經由網 ,成S地#言後顯示,在簡化且客戶機相比,若翻 業務上也受到期望。 逮進行電子郵件之處理 【發明要解決之課題】 t發明之課題在於··對於係 移方式,藉著在用以分散處理之锇翻澤之一種方法之轉 分散至客戶機侧,將變換部、產生,,網路,將分折部 輕在處理集中之伺服器之處理,使二f,至伺服器側,減 機之大量之翻譯處理。 f了兩速進行來自客戶 又,其課題在於,自既定之组t鐵 也和客戶機不相依,藉著在飼服別的多種語言 加用以變換/產生為別的語言之資源,之換部和產生部追 對應之機械翻譯伺服器下去。、/ 構名和別的語言 【解決課題之方式】 本發明為了解決上述之課題,在利用 、 別國語言之機械翻譯系統使用之翻譯伺服哭將原文譯成 部,接收將該原文分析成旱字單位之原又’具有變換 該原文分析資料依照適譯辭典及/或和原文刀同斤資料後,自 發明說明(5)
字辭典、譯語辭典變換為各單字 ^^ B :析資料;及產生,,自該變換〇言之多國穿+ ‘:枓依照翻譯規則及譯語辭典產工J換之該別國語言; δ成文後輸出。 讀原文和該翻譯文ί 又,在利用網路分析原文後, ί委託代辦處,在翻譯伺服器自該分二拚結果作為分析檔 =換為別國語言分析資料 檔案依照辭 :、 f生翻譯文後向寄信目的地之客::之別國語言分析ΐ :使二之傳送側客戶機,具備通訊處出之機械翻譯系 :;5入部’輪入該原&;分析部,將;ρ ’可和該網路通 早位後分析;以及輸㈣,將在該分:f原文分割成單字 料作為電子郵件向該通訊處理部輸出才斤^所分析《分析資 國語言對各空白間將該單斤f分析部按照各 單字。 刀析,或按照記號抽出 又,本發明在利用網路將原文 譯系統’由客戶機、翻譯飼服器、寄作目的機械翻 析之分析資料作為雷子 將在該刀析部所分 伺服二有變換部,接收將該原文分析成單 澤 :3: ί,自該原文分析資料依照適譯辭典及/或和、: 文同之單字辭典、譯語辭典變換為各單字之該別原國
立 發明說明(6) °二之夕國語言分析資料丨 之該別國語古八欠 1目°亥變換部所轡拖 國語言之文;依;;及譯語辭典產生係別 文和該翻譯文之合成文後輸:。產生可成對顯示該原 媒體又係存有程式之電腦可讀取之記錄 械翻譯系统使d用網路將原文譯成別國語言之機 子矛、、、死使用之翻譯伺服/ 言買取之記錄媒體,其特徵在於:*裝之翻#^之電腦可 典分依照和再安裝之語言同-語言之單字辭 字之第一八把t侧客戶機將該原文分析成最小單位之各單 第二八;^ 1μ ^料,依照所安裝之譯語辭典對該分析後之 料,:昭:安:換為譯語資料,對於該變換後之譯語資 岑之翻譯規則及譯語辭典產生翻譯文後,向 寄。目的地之客戶機送出所產生之該翻譯文。 【發明之實施例】 [實施例1 ] (1)構造之說明 圖1表示本發明之機械翻譯系統之概略構造圖。在圖 1,在自英語系國之客戶機1〇〇向日語系國之客戶機傳送電 子郵件之情況,客戶機100在郵件本文上製作「This is an app 1 e」,在追加了利用分析辭典分析了該本文之已完 成刀析之中間檔案之分析檔案上,向翻譯伺服器2 〇 〇經由 網路網送出。翻譯伺服器20 0 一般配置於日語系國,依照 五、發明說明(7) 分析辭典自p 6 士、、^ 昭、翻譯2 間稽案變換為對象語言後,依 廣告資訊也可。日银;國。那時,翻譯文包含 認是否有電子郵俾:二:2客戶機3 00向翻譯伺服器20 0確 之電子接收來自英語系國之客戶機100 之電子郵件。在該電子郵件—起 an apple」、所穿成 丨忭个人in is is 如由企章所ϋ成翻澤在這裡有蘋果。」以及例 如田止菓所委託之企業廣告。 在此,網路網包含公丘_ , « , LAN、WAN、WLL(Wirel3esAs=路、/世界性之網際網路、 A. ^ ^ ^ . S Ucal Ε〇〇ρ)等,那些網路也包 3串接或並接之網路網亦 之翻譯程式,使得咳客戶戶機女裝翻澤伺服器用 德_拖日$ 4/客戶機在7刀析寄件人之客戶機之原文 後隻換且產生该分析資料。 圖2表不本發明之機械翻譯系統之流程之構造圖。依 據圖1說明概略之機械翻譯系統之構造及動 圖2,更詳細說明之。 疋,…、 在圖2,首先,先將既定之翻譯程式分散至網際網路 上之伺服器及客戶機安裝,利用各伺服器及客戶機之 性、特殊之翻言學、特徵。首先,自具有既定之資源之客; 機100在本文產生部製作本文,而且在分析部12分析被送 出之本文後,對於分析結果,在代辦處之分析檔案部22自 該分析結果製作分析檔案,向具有發行了翻譯程式之既定 之資源之URL(Unif〇rm Res〇urce L〇cat〇r,共通資源指 標)以網際網路上之資源利用形態送出其結果,在具有該 既定之資源之飼服器2 〇 〇向變換部2 3輸出分析檔案,在變 501030 五、發明說明(8) 為既定之語言後’在產生部Μ將該既定之語言 3^之Λ的既/之語言而完成,產生在輸出侧之客戶機 戶機m 32可顯示之翻譯文顯示資料,在該客 尸機30 0之顯示器顯示輸出翻譯文。 不,將ΐ文看成翠字之㈣,而看成具有某種 表;之集:出其構造後’以圖形或數學式之記號中間 分析2:其活用為主要之輔助手段邊產生翻譯文,在 等手本文tr態素分析、語法分析、意義分析 又2手法,係任一为析都依據最小單位之單字分析。 單位i;!,,有語法變換、詞彙變換等…對最小 產生ίί早r使用譯語辭典等變換為別國語言等。又,在 .,αρ ,有澤浯選擇、形態素調整等手法,按昭單字之 排列等之翻譯規則產生翻譯文。 ”、、子之 又:學習功能產生部25因將在客戶機1〇〇、伺服器2〇〇 機辭典更新為最新之辭典,自製作本文之客戶 =作為學習資,,又將自伺服器心=二將该 元成之翻譯文和本文之比較結果作 Κ戶機30二 ,,具有將各種辭典更新為最新之辭血:二52,:加 予習功能,尤其適合翻譯為多種外國語之情況%利用该 又,在伺服器200之產生部24,因以合成 為了可在客戶機_侧之顯示器並列 U 6輪出, 生部24所製作之翻譯文,用Page ScrJ等=14:在產 之議等之碼產生。結果,在輸出側之客專戶
第12頁 501030 五、發明說明(9) 較本文和翻譯文,對於具有某種程 使用者,在碟認本文和翻譯文之相異點之機之 軟體後將分析•變換•產生之各程式儲存於記^ ^裳 可,或在客戶機上作為分析程式、在翻 的也 產生程式、個別的作為套裝軟體在作=變換· ,先包含各種辭典,只要在分析程式添;原=;;之? 子辭典、在變換•產生程式添加原文之語言之單字辭典早 澤語辭典、翻譯規則以及適譯辭典即可。但,那些辭^ :反映學f功㉟,也裝載隨時更新之程式。又,在儲^ ,程式之記錄媒體上使用硬碟或軟碟、CD_R〇M、dvd、肋 等。又,在翻譯程式之配送上,利用網際網路等網路作為 傳送媒體因節省儲存於套裝軟體之人力時間而較好。 —在圖3,對於和圖2之符號相同的具有同一功能,表示 客戶機100之具備了在分析部12附加變換功能之變換部13 之2子。在該變換部1 3,例如在將本文記載成翻譯文較好 之〖月況,在为析部分析為最小單位之單字之情況,對於某 單字不要翻譯時進行變換處理,可減輕翻譯伺服器之負 擔。 在圖4表示對於機械翻譯之分散處理之說明圖。圖 4 (A)係在習知之獨立型之翻譯系統之情況進行轉移方式翻 譯時’在分析部51分析本文後,對於所分析之分析資料, 在變換部52將最小單位之各單字變換為別國語言,在產生 部5 3將所變換之別國語言之資料產生為文章之翻譯文後輸
第13頁
501U3U
1 ,如上述所示,在客戶拖1ΛΛ v 後,在伺服器20 0之變換部23變換分析結果機100 =本文 生翻譯文,經由網際網路果H生部產 式之多數’或是廣投形式之大多數都可係:二:=形 ί戶之情況,”信目的地之客 吕,或疋各自不同之語言圈都可,益 馎竹丨J種口口 理’顯著減輕伺服器之負栌,可高心j :利用該分散處 之翻譯委託。 ㈣理來自很多客戶機 在圖5表示本實施例之機械翻譯系統之整體之方 圖。對於圖2追加了明示資料庫之各種辭典之點。 在圖5,在傳送侧客戶機100,包括本文製作部丨丨,輸 入係來自輸入裝置之原文之本文;分析部12,輸入本文 後,依照語言和本文相同之單字辭典之和客戶^原文同一 語言之單字辭典14分析成最小單位之單字單位;以及#案 收發代辦處1 5,向網際網路輸出在分析部丨2所分析之^ ^ 分析資料和本文。 又,伺服器20 0包括檔案收發代辦處16,自檔案收發 代辦處15經由網際網路接收;變換部23,輸入來胃自^檔案"收 發代辦處1 6之本文分析資料和本文後,按照單字單=^本 文分析資料變換為接收侧客戶機之別國語言;產生部24, 對於別國语§ ,按照翻澤規則或適譯辭典產生翻譯文;才奋 案收發代辦處1 7,輸入該翻譯文和本文後向網際網路輸
501030
出,和伺服器原文同一語言 變換上使用;翻譯規則及譯 譯文時使用;以及學習功能 連接之客戶機或翻譯伺服器 典27〜29更新為最新辭典。 之單字辭典2 9,在變換部23之 語辭典28,在產生部24產生翻 裝置2 7 ’按照來自和網際網路 等之各種翻譯用資料將各種辭 在此,適譯辭典也通稱為適譯規則, 單字有多種譯語之情況,係判別選擇那一 存於記錄媒體,將該適譯規則作為資料庫 儲存的,一樣的表達適譯辭典和適譯規則 例如在對於一個 種譯語之規則儲 ’和辭典一樣的 又,接收侧客戶機3 〇 〇句;^ is μ去-a u _ 例1 υυ匕祜圖上未不之檔案收發代辦 處,和檔案收發代辦處1 7對應;及於φ骷里 处耵應,及輸出裝置之顯示部,接 收二自圖々未示之檔案收發代辦處之本文和翻譯文後顯示 =。此外,客戶機1()〇、300彼此之收發關係相反也當然 動作。 (2 )動作說明 其次’在^表示本機械翻譯系統之整體之概略流程 圖。·Τ先,在傳送側客戶機m,在本文製作部n製作本 文後,作冑電子郵件之本文向別國委託翻譯之處理開始 (S11)。首先,將電子郵件作為原檔案儲存於檔案,自檔 案抽出該本文之原文(S1 2)。接著,邊參照和客戶機原文 同一語言之單字辭典14邊分析原文。例如在英文之情況 以空白為基準,在曰文之情況以2字為基準,參照單字辭 典上疋否有後,为解•分析成最小單位之各單字(S13)。
在原文之分析判斷:古i 之箪丰,盤诗店有“、、未登記之單字(S14),若有未登記 q^原文整體賊與未登記之旗標後,照原文採用 ? 迗侧客戶機丨〇〇或檔案收發代辦處15產生作為 吕己憶手段之分;I:斤拎垒r p、 ,F ^ 網路向翻譯飼H 2) °權案收發代辦處15經由網際 服器20 0之位址“傳播案和分析播案翻譯伺 止1f马傳送目的地位址傳送(S17) 〇 ,翻澤伺服器2G(),在檔案收發代辦處Μ接收原播案 案後古/變換部23判斷在分析_ 二)右有未處理旗標,邊參照和伺服器具備之原
同:語言之單字辭典29邊執行未處理部分之再分備析原文 L 。其次,判斷在分析檔案有無未登記之單字(S20), 右有未登記之單字,照分析檔案之原文採用(S2i)。 # I ΐ i >,自分析檔案對最小單位之各單字按照譯語辭典 k換成#語(S22)。變換成譯語後之變換檔案在產生 按照翻譯規則及適譯規則之適譯辭典進行單字之 / 或組合,在適當處插入「。」、「,」、「、 j 儲f有很多文章或句子段落之事例之例句辭典翻譯產生: 垂或格言等,產生翻譯文章(S23)。
其次’若文章製作完成’槽案收發代辦處17向指定之 帅L(Umf0rm Resource L0cator)傳送該本文和譯文之翻 澤文。在指定之URL在該本文和翻譯文附加廣告收入兩 之企業廣告,經由網際網路向寄信目的地之客戶機榦出而。 寄信目的地之客戶機以電子郵件接收該本文和翻^以 企業廣告後’肖顯示器等輸出裝置輸出。在顯示於顯示器
五、發明說明(13) 之情況,並列顯示本文和翻 料,向客戶機或伺服器 ° ,而且顯示企業廣告資 到廣:^且可滿足=系統運用者得 -,,;;.::":^ "---— (s川後,為了分 目储存有原文之檔案抽出原文 按照係配置於單字 等 析成單字單位。例如,在英文:在記號或空白之處理分 之前後之空白或記號之「 「月況 ί解’而在日文之情況按照記號;]「 專抽出單字(S3 2)。其次,白a ‘」 。」、厂·」 戶機原文同一語古之覃念魏/ i子之前頭開始邊參照和客 著判斷有無未登t:之單字 時辭有檢無索r登5)記。之其單次字:以未-未之”之❹ Λ 憶裝置,或直接移至下一步驟 ;丄:二:將分析資料和原文一起產生為分析檔案 後,在檔案收發代辦處15向既定之URL傳送(s39)。 既定之肌係該翻譯系統之運用纟,計數該分析資料之傳 送數,而且在此階段按照希望國際上之企業廣告之廣告供 給者之要求在分析資料附加企業廣告。 其次’邊參照圖8之流程圖邊說明翻譯伺服器2 〇 〇之變 換部23之動作。首先,自檔案收發代辦處16所接收之原文 第17頁 J^l〇3〇
和分=料判斷在分析資料内是否有未處理旗 右有未處理旗標,邊參照和翻 下), ϋ言之/Λ辭典29邊檢索未處理之未登^Λ同 八、和無未登記之旗標之情況同 登記之單字⑽),若有未登記之單字,ΠΐΠΐ未 二言之/Λ辭典29邊改變檢索之文字數後再檢索 σ —人,判斷有無未登記之單字(S45),若有未八“ 之皁字,如旗標般賦與不正確之通知後,昭原文向二= 出/ Ϊ此情況,在回授上向學習功能部25送出原文:
二:::*,如照原文單字分析般向和客戶機原文同 一语έ之早字辭典14反映。 J 起祜ΪΪ,自和無未登記之單字之電子郵件之分析資料-# 不正確之通知之分析資料邊檢索譯語辭典27邊對 次位之各單字進行譯語變換(S47)。接著,判斷譯語 Ά ;:有無譯語辭典上不存在之未登記之單字(S48),若 未^記之單字,照該原文之單字採用(S49)後結束,向 生4 24輸出’另一方面向別的語言之譯語辭典之學習· 維修處理輸出其結果。 立 又’邊參照圖9之流程圖邊說明翻譯伺服器2 0 0之產生 部24之動作。首先,接受在變換部23之譯語資料後,產生 5法操作所需之對象表,例如為了使得主語、述語、賓 f、補語、連接詞等之配置明確,將原文之主語、述語、 賓居、補語、連接詞等和譯語之主語、述語、賓語、補 语、連接詞等製成對象表(S51)。其次,參照翻譯規則及
501030 五、發明說明(15) 譯語辭典28(S52),對譯語資料應用翻譯規則(s53),接著 判斷有無未登記之規則(S54 ),若有未登記之規則,參照 例句辭典,按照自其分析資料所製作之對象表自成語或俗 語等之例句辭典檢索譯語(S 5 5 )。在此情況,和一般之例 句辭典一樣,也可不僅對各單字,而且在文章上查詢例句 辭典上是否有。其次,判斷有無未登記之例句(S56 ),若 有未登記之例句,接著自圖上未示之近似例句辭典抽出近 和無未登記之例句之情況同時邊參 似例句(S 5 7 ) ,,一 ~ «巧//ϋ n 上^ mi 乐 規貝及澤5吾辭典邊結合譯語後,作為電子郵件之翻譯文 (S58)。而,在步驟S57使用了近似例句之情況,作為例句 右二I功能之一,將該近似例句儲存於例句辭典,可 有助ί ΐ下次查詢例句辭典之情況使用。 之错Λ該譯語之結合,製作翻譯文,和原文—起向既定 的地之\卢撒賦於與企業廣告等後’經由網際網路向寄信目 的地之客戶機輸出。 又,本機械翻譯系統之運用者 析用和變換•產生耆配送之翻澤耘式刀成刀 之分析用^ ί 藉者分別將在圖7所說明之流程圖 程式裝= 機9:;:=程圖之變換·產生用 •,器”般進行分散翻譯飼服器’可如客戶機 起並列顯示:機】,郵件等將企業廣告和本文、翻譯文一 又,譯系統之運用者也可得到廣告收入。 並列記載本文‘翻X之:J收侧f戶機之顯*,表示了 U子’但是在無本文而只有翻譯
501030 題之情況,只顯 伺服器,也忽略 ,有在翻譯處理
五、發明說明(16) 文對於接收侧 可。在此情況 資料變換後產 高速之效果。 客戶機也無問 ,因對於翻譯 生翻譯文即町 示翻譯文也 本文而自分析 上變得簡單· 自曰文譯成英文為例說明利 (3 )機械翻譯之實例 圖1 0以自韓文譯成英文 用本機械翻譯系統之翻譯例。 圖10(A)係在自韓文譯成英文之情況,在(a)分析部之 處理,表示將原文分割•分析成以「籲」劃分之單字,在 (b)變換部之處理,表示進〆步依據翻譯伺服器内之和原 文同一語言之單字辭典分析後,用「籲」劃分原文,然後 抽出對應之譯語之結果。然後,在(c)產生部之處理’表 示產生了翻譯文之結果。 一樣的,圖10(B)係在自曰文譯成英文之情況,在(a) 分析部之處理,表示自原文之2個字關始分析,在3個字或 4個字上和和原文同一語言之單字辭與之對照之結果,將 原文分割•分析成以「春」劃分之單字。其次,在(b)變 換部之處理,表示進一步依據翻譯伺服器内之和原文同一 語έ之單字辭典分析後,將原文分割成最小單位之各單字 並用「春」劃分,然後自譯語辭典抽出對應之譯語。然 後’在(c )產生部之處理,表示按照英文之翻譯規則及譯 語辭典,例如按照最初之文字大寫、在各單字間設置空 白、在疑問句附加「?」等規則產生了翻譯文之結果。 此外’韓國語和日語因主語、賓語、動詞等之語順一
第20頁 501030
此 但是係 部之程 可按照 器具備 又 國之電 限需要 子郵件 然也可 系統也 言等。 外,在上述 支點(P i v 〇 t 式劃分每一 例句翻譯, 變換部,可 ,在上述實 子郵件之例 即時進行翻 ,使得翻譯 利用本發明 可應用於日 實施例 )方式 句後在 只要在 和轉移 施例, 子,但 譯處理 該附件 〇又, 本國内 现明了轉移方式之分 ,也藉著在客戶機侧用-伺服器侧用例句辭典等 客戶機具備分析部、在 方式一樣的輸出翻譯文 主要說明了往使用別的 是在翻譯為別的語言之 之電子郵件,係附加了 也可’在一般之文件之 不僅各國語言之間,本 之例如標準語、大阪腔 散方式, 一句分析 變換,因 翻譯伺服 〇 呑吾言之外 情況,不 附件之電 翻譯,當 機械翻譯 、薩摩方 又,在所謂的網際網路電路之利用網際網路之電話, 藉著將原來之聲音當作本文解讀後,利用本發明之機械翻 譯系統,分析該本文,用Provider或Bridge/Rooter等中 間處理伺服器等進行變換/產生處理,變換為既定之聲 音,使得運用即時之網際網路電路系統也可。 【產業上利用性】 若依據上述之本發明,在經由網際網路在傳送側客戶 機和翻譯伺服器自原文製作翻譯文之情況,因替代全部在 伺服器内翻譯之情況,在客戶機執行轉移方式之分析部
第21頁 501030 五、發明說明(18) 分,在翻譯伺服器分散處理變換•產生部分,減輕翻譯伺 服器之負擔,尤其因使用按照各國語言之翻譯伺服器,可 使用位於翻譯伺服器之本國語之辭典,可用日常使用之語 言表達翻譯文,和在文言上之拘泥式表達相比,能以只有 網際網路才有之表達表示。
第22頁 501030 圖式簡單說明 圖1係本發明之概念上之翻譯的物理構造圖。 圖2係本發明之機械翻譯系統之構造圖。 圖3係本發明之機械翻譯系統之構造圖。 圖4係本發明和習知例之概念上之翻譯的物理構造 圖。 圖5係本發明之機械翻譯系統之方塊圖。 圖6係本發明之機械翻譯系統之整體之概略流程圖。 圖7係本發明之機械翻譯系統之分析部之流程圖。 圖8係本發明之機械翻譯系統之變換部之流程圖。
圖9係本發明之機械翻譯系統之產生部之流程圖。 圖1 0係本發明之機械翻譯系統之實際之翻譯例之說明 圖0
第23頁

Claims (1)

  1. 501030 六、申請專利範圍 1 · 一種翻譯伺服器,使用於利用網路將原文譯成別國 語言之機械翻譯系統,其特徵在於具有: /變換部,接收將該原文分析成單字單位之原文分析資 料後’自該原文分析資料依照適譯辭典及/或和原文同一、 語言之單字辭典、譯語辭典變換為各單字之該別國語言之 多國語言分析資料;及 ° 產生部’自該變換部所變換之該別國語言分析資料依 照翻譯規則及譯語辭典產生係別國語言之文章之翻譯文; 在該產生部產生可成對顯示該原文和該翻譯文之合成 文後輪出。 2 ·如申明專利範圍第1項之翻譯伺服器,其中,對於 5亥原文分析貝料所含之分析未處理之單字,依照該和原文 同一語言之單字辭典,有照原文輸出之情況。 把社3里:?客戶機,係關於在利用網路分析原文後,將分 π ΐ @二11私案委託代辦處,在翻譯祠服器自該分析 才备,依照,典資料庫變換為別國語言分析資料,自各單字 之別國语吕分析資料產生翻釋德 $屮 > ^ Γ f文後向寄信目的地之客戶機 t出之機械翻澤糸統使用之傳送侧 其特徵在於: 機, 具備·通吼處理部,可和該網路· 綠©立·公k irr 、A,輸入部,輸入 口系原文,刀析部,將該原分 輪出部,將A 4 \, 刀^風早予早位後分析;以及 翰出—將在該分析部所分析之分析資粗Μ A番三獻& & 該通訊處理部輸出;且 貝枓作為電子郵件向 在該分析部按照各國語對 口 了合工白間將該單字分離·
    501030 六、申請專利範圍 分析,或按照記號抽出該單字。 4· 一種機械翻譯系統,係關於利用網路眉 國語δ之機械翻譯系統,其特徵在於·· " 另】 由客戶機、翻譯伺服器、寄信目的地之客 以仲介之代辦處構成; 用 該客戶機具備通訊處理部,可和該網路通訊·輸入 部,輸入該原文;分析部,將該原文分割成單^單: 析;以及輸出部,將在該分析部所分析之分析資料作為^ 子郵件向該通訊處理部輸出; … οο該翻譯伺服器具有變換部,接收將該原文分析成單字 2/位二原文分析資料後’自該原文分析資料依照適譯辭典 j/或和原文同一語言之單字辭典、譯語辭典變換為各單、 该別國語言之多國語言分析資料;及產生冑, :產=之該別國語言分析資料依照翻譯規則及譯語辭 對ίΐίΓΓ言之文章之翻譯文;☆該產生部產生可成 對顽不该原文和該翻譯文之合成文後輸出。 對申請專利範圍第4項之機械翻譯系統,其中,和 亥寄“的地之客戶機之翻譯文之顯示並存的刊登廣 用網6路蔣ΪΓΪ有程式之電腦可讀取之記錄媒體,藉由利 譯匈服器而…=成別國語言之機械翻譯系統中所使用之翻 1服盗而女裝之翻譯程式,其特徵在於·· 典分器依照和再安裝之語言同-語言之單字辭 送側客戶機將該原文分析成最小單位之各單 第25頁 501030 六、申請專利範圍 字之第一分析資料,依照所安裝之譯語辭典對該分析後之 第二分析資料變換為譯語資料,對於該變換後之譯語資 料,依照所安裝之翻譯規則及譯語辭典產生翻譯文後,向 寄信目的地之客戶機送出所產生之該翻譯文。
    第26頁
TW090101727A 2000-01-25 2001-01-29 Machine translation system and translation server and client thereof TW501030B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000015340A JP2001209643A (ja) 2000-01-25 2000-01-25 機械翻訳システムとその翻訳サーバ及びそのクライアント

Publications (1)

Publication Number Publication Date
TW501030B true TW501030B (en) 2002-09-01

Family

ID=18542660

Family Applications (1)

Application Number Title Priority Date Filing Date
TW090101727A TW501030B (en) 2000-01-25 2001-01-29 Machine translation system and translation server and client thereof

Country Status (4)

Country Link
JP (1) JP2001209643A (zh)
AU (1) AU2707301A (zh)
TW (1) TW501030B (zh)
WO (1) WO2001055901A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI385538B (zh) * 2008-07-18 2013-02-11 Inventec Corp 單詞擷取翻譯系統及其方法
TWI634435B (zh) * 2017-07-31 2018-09-01 全家便利商店股份有限公司 雲端翻譯及列印系統及方法
CN110598222A (zh) * 2019-09-12 2019-12-20 北京金山数字娱乐科技有限公司 语言处理方法及装置、语言处理系统的训练方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100530154B1 (ko) 2002-06-07 2005-11-21 인터내셔널 비지네스 머신즈 코포레이션 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
KR101498456B1 (ko) * 2010-07-06 2015-03-06 에스케이플래닛 주식회사 백과사전을 이용한 번역 서비스 장치 및 그 방법
CN105740239A (zh) * 2016-02-01 2016-07-06 中译语通科技(北京)有限公司 一种网页上文字的翻译方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6347877A (ja) * 1986-08-18 1988-02-29 Canon Inc 翻訳装置
JPH02202143A (ja) * 1989-01-31 1990-08-10 Toshiba Corp 電子メールシステム
JPH1185753A (ja) * 1997-09-11 1999-03-30 Technical Aatsu:Kk 誤訳のない多言語翻訳方法
JP4142193B2 (ja) * 1998-02-05 2008-08-27 日本コンピュータ・エイディッド・テクノロジ株式会社 ネットワーク通信方式
JPH11250066A (ja) * 1998-03-04 1999-09-17 Casio Comput Co Ltd 電子メール装置及び電子メール処理プログラムを記録した記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI385538B (zh) * 2008-07-18 2013-02-11 Inventec Corp 單詞擷取翻譯系統及其方法
TWI634435B (zh) * 2017-07-31 2018-09-01 全家便利商店股份有限公司 雲端翻譯及列印系統及方法
CN110598222A (zh) * 2019-09-12 2019-12-20 北京金山数字娱乐科技有限公司 语言处理方法及装置、语言处理系统的训练方法及装置
CN110598222B (zh) * 2019-09-12 2023-05-30 北京金山数字娱乐科技有限公司 语言处理方法及装置、语言处理系统的训练方法及装置

Also Published As

Publication number Publication date
AU2707301A (en) 2001-08-07
JP2001209643A (ja) 2001-08-03
WO2001055901A1 (fr) 2001-08-02

Similar Documents

Publication Publication Date Title
US5497319A (en) Machine translation and telecommunications system
EP0519049B1 (en) Machine translation and telecommunications system
KR101099196B1 (ko) 적응형 기계 번역
US20040260532A1 (en) Adaptive machine translation service
CN1983271A (zh) 用于定义和翻译聊天缩略语的系统和方法
JP2004334791A (ja) 機械翻訳装置、データ処理方法及びプログラム
JP6518981B1 (ja) 翻訳装置、翻訳装置の制御プログラム、および翻訳装置を用いた翻訳方法
TW501030B (en) Machine translation system and translation server and client thereof
JPWO2008108061A1 (ja) 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体
CN115455981B (zh) 一种多语种语句的语义理解方法、装置、设备及存储介质
KR102126342B1 (ko) 접근성 태그를 이용하여 표와 서식이 포함된 전자문서를 점자로 변환하는 점자 변환방법
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
TW202011227A (zh) 智能學習語詞編修與多國語言互譯的系統與方法
Soomro et al. Google translation services issue: religious text perspective
Šostaka et al. The Semi-Algorithmic Approach to Formation of Latvian Information and Communication Technology Terms.
Hutchins Twenty years of translating and the computer
Anusha et al. iKan—A Kannada Transliteration Tool for Assisted Linguistic Learning
Chaware et al. Information retrieval in multilingual environment
KR100553538B1 (ko) 인터넷서류번역시스템 및 이를 이용한 서류번역방법
KR20240055302A (ko) 문장 템플릿을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
Braga et al. A set of data bases to support intelligent agents in Internet Infrastructure routing domains
JP4033622B2 (ja) 機械翻訳システム
KR20240055290A (ko) 자연어 생성 모델을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
KR20210156177A (ko) 텍스트의 일부분인 문장 1개를 '인터넷 문장'으로 변환시키는 방법
CN117521679A (zh) 一种基于非译预处理的翻译方法