TW315437B - Machine translation method and device - Google Patents

Machine translation method and device Download PDF

Info

Publication number
TW315437B
TW315437B TW085116090A TW85116090A TW315437B TW 315437 B TW315437 B TW 315437B TW 085116090 A TW085116090 A TW 085116090A TW 85116090 A TW85116090 A TW 85116090A TW 315437 B TW315437 B TW 315437B
Authority
TW
Taiwan
Prior art keywords
translation
url
steps
environment
file
Prior art date
Application number
TW085116090A
Other languages
English (en)
Inventor
Kenmoriki Kobayakawa
Eiichi Tasoe
Jun Ishikura
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Application granted granted Critical
Publication of TW315437B publication Critical patent/TW315437B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Computer And Data Communications (AREA)
  • Document Processing Apparatus (AREA)

Description

經濟部中央標準局員工消費合作社印裝 315437 A7 B7 五、發明説明(1 ) 技術範圍 習知技術 本發明關於用以將如英文等之外文文書翻譯成日文(或 韓文、中文等)之本國文文書之機械翻譯方I艮寇i,特 別有關於備有複數翻譯環境之機械翻譯方法及裝置。更詳 細而言,本發明關於用以將網際網路上之WWW伺服器所 提供之www^頁中之外文文書翻譯成本國文文書之機械翻 譯方法,特別是關於能夠自動選擇適合於處理的外文文書 之翻譯環滅,然後進行翻譯處理之機械翻譯方法及裝置。 此處所謂之「翻譯環境」係指翻譯處理所運用之辭典資料 庫或文法處理演算法(例如:設定文節、設定助動詞譯 意、或指定文體)等。 網際網路: 自習知技術起,利用大眾線路等通信電路以連接遠隔兩 地之電腦之「遠距離電腦通信(telecomputing)系統」之研究 開發已進行至今。例如,在日本國内1985年由電氣通信事 業法之實施爲開端,個人電腦通信變得極爲盛行。 最近遠距離電腦通信之主要動向可舉網際網路的運用爲 例。此處所謂網際網路係指在1970年代,由美國的全美科 技財團(NSF)所出資而設立之網路"NSF net"爲基礎,而彼此 連接之世界上網路的總稱。網際網路初期係以學術研究之 資訊交換爲目的,連接世界上54個國家的大學或研究機關 用之國際性網路,但由於設置於各大學、研究機關之伺服 器(主要是UNIX工作站)反複而自主地互相連接的結果,成 本紙張尺度適用中國國家標準(CMS ) A4規格(210X 297公釐) ---:-------批衣------11------ (請先閱讀背面之注意事項再填寫本頁) 315437 A7 B7 五、發明説明(2 ) 爲網羅全世界的巨大網路(目前的網際網路係由分散於全 世界之超過數十萬的伺服器所構成)。遠隔之各種伺服機 器依照名爲"TCP/IP (Transmission Control Protocol/Internet Protocol)的通信協定"互相連接,在各機器間可作資料傳 送,或在BBS (電子揭示板:Bulletin Board System)上可做 通信。 習知的(即原始的)網際網潞給人的印象係以UNIX爲基礎 的電腦間之連接。但及於1994年,提供網際網路連接服務 之供應者出現爲止,其普及化加速地遍及於一般企業或個 人》例如日本之主要個人電腦通信服務("POVAN",或 "Nifty Serve"等)亦提供網際網路連接服務。 經濟部中央標準局員工消費合作衽印製 (請先閲讀背面之注意事項再填寫本頁) 網際網路係一種運作基礎或政策互異的網路之集合,即 使存在統合各網路的單位,但並不存在管理網際網路全體 的單位。換而言之,分散於世界各地之伺服器(例如:資 料庫伺服器或檔案伺服器)只是由網路内之用户做局部性 管理而已。因此,網際網路的各用户透過連接於網際網路 的伺服器,而使得任一用户皆可變爲資訊提供者,亦可對 網際網路上的任何資訊做鉅細靡遺的存取。這一點與只有 特定的主機電腦(即資訊供應者)才可存取的個人電腦通信 服務大異其趣。另外,爲了與連接特定企業間的網路,而 擴及於大範圍的Internetworking區別開來,英文中一般已將 "The Internet"專有名詞化。 全球資訊網(WWW : World Wide Web): 今曰網際網路能加速普及的原因係由於使用「全球資訊 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 經濟部中央標準局員工消費合作社印装 A7 B7 五、發明说明(.3 ) 網」之説法並不過份。所謂w_ww即在網路(尤其在網際網 路)上建構超文件(Hyper text)/*/ ’以能夠對所有資訊進行麵 細靡遺的存取爲目的之廣域資訊Μ統(網際網路運用程式) 的意思。最早係在年由歐洲的基本粒子物理學研究所 (CERN)所開發出來。依照WWW,使用者(即WWW用户)對 於畫面上強調顯示的字體、詞句、影像等,藉由使用滑鼠 做click,可使得由伺服器往伺服器(或從資料庫向資料 庫),而到達目的地的資訊。 如同「分佈於世界各地的蜘蛛巢」,目前有了非常多數 的WWW伺服器存在於網際網路上。各WWW伺服器的該區 碟片裡,累積許多以HTML (Hypertext markup Language)語言 記述的檔案所構成之WWW頁。 HTML檔案除了文書檔案之外,還有影像、聲音、視頻 等各種形式的檔案。HTML係根據SGML (Standard Generalized Markup Language)而制定規範,目前的版.本一農 WWW之標準化團體"W3 Consortium"於1996年所公開發表的 "HTML-3.X"。根據HTML的檔案基本上是由文書形式的檔案 所構成’使用以記號”<"和">"區隔的「保留字(Tag) J記載 文書的整理、影像檔案、聲音檔案所在位置、link的目的 .地等。 WWW用户可根據名爲 HTTP (Hypertext Transfer Protocol)的 通信協定讀取WWW伺服器之WWW頁所存放的檔案(HTTP 相當於TCP/IP的上位協定)^所謂「WWW瀏覽器」,其解 讀HTML檔案之内容,然後將其顯示在用户機器的畫面 本紙张尺度適用中國國豕標牟(CMS〉A4規格(2〗〇χ 297公逢〉 —--------^-------玎-------名 (請先閱讀背面之注意事項再填寫本頁) A7 B7 ^15437 五、發明説明(4 ) 上。亦即作爲網際網路旅遊響導之用的電腦程式。WWW 瀏覽器的代表例有美國IBM公司的"Web Explorer"(爲"Web Explorer"美國 IBM公司的商標)、美國 Netscape Communication 公司的"Netscape Navigator",或美國 Microsoft公司的"Interne』 Explorer” 等。 HTML檔案中指定的影像-檔案所在位置可爲保存HTML檔 案本身的WWW伺服器,抑滅別的WWW周服器。WWW伺 服器除了能解釋HTML檔案之外,亦可讀取影像檔案等, 將文書中埋藏有影像等之複合文書顯示•於WWW用户機器 的畫面上。又HTML檔案中有「此文書(或影像)寸藉由滑; 鼠加以click,而讀取哪一個叼服器的哪一個檔案」這樣的 指令,用户只要對顯示在畫面上的文書,或畫面的一部 份,利用滑鼠來做click,即可讀取別的HTML檔案。由於 click操作而新讀取之HTML檔案可爲同於原來HTML檔案之 WWW伺服器,或爲別的WWW伺服器。 在HTML檔案中將指示讀取下一個HTML樓案之指令埋藏 起來者,業界名爲「架設link」。link目的地之指定通常使 用名爲 URL (Uniform Resource Locator)之表示法。URL是用於 識別網際網路上的資訊資源(-即網際網路上之伺服器所累 積的檔案)的定址技術,由IETF (Internet Engineering Task Force)/**/所歸納的固定格式文書群RFC (Request for Comments)中之一的RFC-1738规定其規格。 URL·係..由記述:用以存取資訊資源之協定名稱(scheme名 稱)、存放資訊資源之伺服器名稱、及伺服器内的檔案名 本紙掁尺度適用中國國家標準(CNS ) A4規格(210X297公釐) ----------^------1T------,Λ (诗先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(5 ) 稱,等三要素的文字列所構成。可指定的協定,除了 HTTP (http)之外,尚有 NNTP (news) ' FTP (ftp:file transfer protocol)、Telnet (telnet)、對該地片之存取檔.案等。又主 要的伺服器名稱有:"www_ibm.com"或"www.yahoo.com"等。 例如:名爲"www.yahoo.com"之词服器的www服務所提供之 樓案"Arts” 的 URL係以"http://www.yahoo.com/Arts/"來表示 ° URL之各構成要素間通常以來區隔。換言之,URL爲 WWW頁的位址。(此處所謂Γ WWW頁」指WWW伺服器所 提供之畫面總稱,亦名爲Γ首頁」)。’ 構成URL的文字列當中,以"/"區隔之各文字列以下名爲 「部份URL文字列」。 用於WWW頁的翻譯程式: 如前所述,藉由WWW,網際網路的用户在家中即可對 世界各地的WWW過服器進行存取,並且在瀏覽器畫面上 可看到取得的WWW頁。 經濟部中央標準局員工消費合作社印製 (請先閱讀背面之注意事項再填寫本頁) WWW頁中的多數文書係以英文寫成,對英文圈子以外 .(例如:曰文、中文、韓文等)之網際網路用户(或是不精 通英文的用户)而言解讀不便,因此無法充分活用好不容 易獲得的廣域資訊系統。因而,近年來機械翻譯軟體(或 支援翻譯软體)之開發普及再度如火如荼的進行。這些機 械翻譯軟體當中,有專爲網際網路上之文書,亦即WWW 頁之翻譯而設計的產品。例如:經由網際網路而取得的資 料’利吊WWW伺服器的代理(proxy)功能/***/機械舞譯軟體 得以中繼,翻譯文章再度交給WWW瀏覽器而顯示於瀏覽 本紙狀度適用中國國家標準(CNS )从驗(2ι〇χ29^麓) 經濟部中夬標隼局員工消費合作社印製 Α7 Β7 五、發明説明(6 ) 器畫面上。此種重視與網際網路之融和性的機械翻譯軟體 之一例爲日本IBM公司所出售的「網際網路翻譯之王,Ver 1·χ」〇 所謂機械翻譯,要旨在於活用電腦系統的處理能力,例 如英文等的外文文書翻澤成爲日文等文書(或者相反的方 向翻譯)的技術。將人類所擁有(或者是推測擁有)之關於 邊言的龐大知識加以模式化而構築成資身庫,翻譯機器參 照資料庫而進行翻譯。 但是’以機械翻譯的方式’在忠實反映原文文書的意義 的同時,又保持高精度並非易事。此主要由於自然語言所 具有之含糊不明確的特性,而此種含糊不明確的要因之— 就是一個字有兩種以上的意思存在’而且經常出現在原文 文書上。每次多種意義的文字出現時,翻譯機器就需要做 翻譯字的選擇y,而且翻譯字的選擇發生某種程度的誤差在 所難免。除了含糊不清之外,文法變形的問題。例如:在 英文時,依主詞、動詞、受詞的順序,有SV〇、sv〇〇、 svoc等幾種基本句子結構,對於省略關係代名詞、 which、why等)之情況的句型與文法的掌握較爲困難。 在機械翻譯時,爲了改善翻·譯精度,從以往即採用複數 翻譯環境的方式^此處所謂「翻譯環境」者指的是在翻譯 處理時’被利用之辭典資料庫或文法處理演算法(例如: 文節之設定、助動詞譯意之設定、文章指定)等。原文文 書内容所屬的種類、領域、用途等,和翻譯環境之間互相 關係存在疋眾所知者。例如:藝術、運動、敎育、科 適用中關—297公9们 ----------^------11------Λ (請先閲讀背面之注意事項再填寫本頁) 437 A7 B7 五、發明説明( 翅濟部中央操率局貝工消費合作社印製 寺,依照各領域較常發生的單字,單字意義上的獨特用诖 都不盡相同。依照網際網路辭典、藝術辭典、運動辭典等 種類區隔的專用翻譯環境之利用已成爲可能β換言之,原 文文書内容使用最適當的翻譯環境,減輕對機械翻譯時之 不必要解析處理,而改善翻譯精度。 爲從多數翻譯環境當中,選擇最適宜之方法,最簡單而 且原始的方法係由用户從原,文文書内容當中做判斷而選二擇 操作手册。此種情況下,用户在進行機械翻譯之前,必須 先制以書内容有某㈣度㈣解,然而,對於非本國 又的原又又書,並揉法在短時間内立即‘解,需要花費很 久時間別無他法。結果,翻譯系統的存在,就失去意義。 尤其’網際網路的用户中大多數係爲了從龐大的www頁 裡’-眼就自|將有意義的資訊做出選擇取用或放棄,而借 關械翻譯之助’若尚須細讀原文文書,則機械翻譯本身 即失去意義。 關於此問題,習知技術中有將翻譯環境的選擇委由機械 翻譯系統者。例如:特開平7_191999號公報、特開平6_ 332946號公報、特開平6·318229號公報、特開平6_6〇ιΐ7號 a報及特開昭61-173G60號碼电,均揭示自動選擇翻譯環境 的翻譯系統。藉由上述翻譯系統,用户不需自己選擇翻譯 環境,工作效率應可獲得改善。然而,這些習知技術中, 大半均爲了選擇適合原文文書的翻譯環境,而由翻譯系統 |預先解析原文文書的内容β包含原文文書的解析之預先處 理即表示處理時需花費相當的時間,且加重翻譯系統的負 ____ -10- ( CI^Ta4^ ( 210X297^^ )----- I - . —1- -- I t II1 (請先閱讀背面之注意事項再填寫本莧) !-1 I - I- — 1*_ · -裝· 訂 ▲ 經濟部中央標準局員工消費合作社印製 A7 B7 五'發明説明(8 ) 擔。換"T之’此等習知技術在建構與活用兩方面係巨大的 系統。 «註釋》 * :超文件--將文字、繪圖、表等當作物件處理,再定出 這些物件間的關係,使能存取的软體。 : IETF--進行網際網路上技術、服務的話題、提案等之 機關。 , :代理(proxy)功能―以代理的方式接受來自網際網路拉 通t貝料,而對热法直接對外部做存取的主機電腦進行中 繼。 [發明之效果] 如上所述,本發明提供一種優良的機械翻譯方法及裝 置’其使用具有多數翻譯環境的翻譯系統,可將外文文書 (例如英文文書)翻譯成本國文文書(例如曰文、韓文或中 文等)。 此外,本發明提供一種優良的機械翻譯方法及裝置,其 當外文文書翻譯爲本國文文書時,選擇適合於處理對象之 外文文書之翻譯環境,然後進行翻譯處理。 此外’本發明提供一種優知的機械翻譯方法及裝置,其 使用具備多數翻譯環境的翻譯系統,可將由網際網路上之 WWW伺服器所提供之WWW頁中之外文文書適當地翻譯 成本國文文書。 本發明之目的在於提供一種機械翻譯方法及裝置,其使 用備有多數翻譯環境的翻譯系統,將外文文書(例如英文 __ -11- 本紙張尺度適用中國國家標隼(CNS ) A4規格(210X 297公董) —.-------^------1T------^ (請先閲讀背面之注意事項再填寫本頁) A7 、發明説明(9 文曰)澤成本國文文書(例如:日文、韓文、中文等)。 發月之另_目的在於提供_種機械翻譯.方-法及裝置, 卜文文書翻譯成本國文書時,自動選擇適合於處理對 象的外文文書之翻譯環境,而進行翻譯處理β 本發明之又一目的在於提供一種機械翻譯方法及笔置, 其使用備有多數翻譯環境的翻譯系統,將網際網路上之 WWW词服器所提供之WW,W頁中的外文文書適當地翻譯 成爲本國文文書。 [發明概要] , 、本發明係參酌上述課題,其第一實施例爲一種機械翻_ ^ ’其使用具有多數翻譯環境的翻譯系統,用以翻譯用 尸所扎疋的資訊資源内所存放的檔案中的文書,其特徵在 於包含以下步驟: ^ 己乘對於資訊資源的存取機構與資訊資源名稱的文 字列做解釋的步驟; ’’、、解釋結果,選擇前述多數翻譯環境中之一個的步驟;=使用Μ選定之翻譯環境,對前述文字列所表示的資 5源中存放的標案中的文書如以翻譯的步骤。 用且:少本發明的第二實抱例爲—種機械翻譯方法’其使 内=數翻譯環境的翻譯㈣,對用户所 =存放的擋案中之文書進行翻譯,其特徵在於包含以下 ⑷用尸輪入記述對於資訊資源的存取機構與資訊資源名 丈纸張^ ----------^-- f請先閲讀背面之注意事項再填寫本頁) 1T------i---------- . I--
I ϊ I I
-I II 、發明説明(10 稱的文字列之步骤; (二依前述文字列所指定的存取機構,對前述文字列押 a疋的資矾資源内所存放的檔案進行下栽的步驟; (c)解釋前述文字列的步驟; ⑷依解釋結果,由前述多數翻譯環境當中選擇其一的 步驟; 、 · (1)使用前述選定祕譯料,料述下載之㈣中的文 曰進行翻譯的步驟。 2發明的第三實施例爲—種機械翻譯方法,其使用具備 4翻譯環境的翻譯系統,用以翻譯用户所指定的資訊資 源所存放的檔案中之文書,其特徵在於包含以下7個步 螺: . ⑷用户輸人記述對於資訊資㈣存取機構與資訊資源名 稱的文字列之步驟; ⑻依照前述文字列所指定的存取機構,將前述文字列 所指定之資訊資源所存放的樓案下載的步驟; 經濟部中央橾準局員工消費合作杜印製 (c) 將下載之檔案與㈣中之原 <文書同時顯示於顯示器 上的步驟; (d) 解釋前述文字列的步驟;_ (e) 依照解釋結果,由前述多數翻譯環境中選擇其一的步 驟; (0使用前述選定的翻譯環境,將前述原文文書做翻譯的 步驟; (g)將翻隻龙之譯文文書與前述原文文書同時顯示於 —___________ - 13 _ 本紙張尺度適用中料(⑽)297公 經濟部中央樣準局員工消費合作社印製 A7 B7 、發明説明(„) 不器上的步驟。 本發明之第四實施例爲—種機械翻譯方法,其使用具有 多數翻譯環境的翻譯系統,用以因應於記述文字資訊資源 的存取機構和資訊資源名稱的文字列之輸入,對指定的資 訊資源内所存教之檔案做下載,且翻譯播案中之文書,其 特徵在於具備下列三個步躁: (a) 將關於資訊資源之文字列與翻譯環境間之组合作爲資 料庫而記錄之步骤; (b) 在前述資料庫中,對新輸入之文字列檢索最類似的 文字列之步驟; (c) 使用對應於前述檢索得的文字列之翻譯環境,對由資 訊資源下載之檔案中的文書進行翻譯的步驟。 本發明的第五實施例爲—種機械翻譯方法,其使用具有 多數翻譯環境的翻譯系統,因應於記述對資訊資源的存取 機構與資訊資源名稱的文字列之輸入,而將指定的資訊資 源内存放之擋案下載,且翻譯檔案中的文書,其特徵痒於 具備下列四個步骤: (a) 將關於資訊資源之文字列與翻譯環境間之組合作爲資 料庫而記錄之步驟; _ (b) 在前述資料庫中,對新輸入之文字列檢索最類似的 文字列之步驟; (c) 使用對應於前述檢索得的文字列之翻譯遽—境,對由資 訊資源下載之襠案中的文書進行翻譯的步驟; (d) 若翻譯的結果並不適切時,採用其他翻譯環境次 本纸痪尺度適用中國國家標準(CNS ) A4规格(2丨〇;<297公釐) ----------抽衣I- (請先閱讀背面之注意事項再填寫本頁) • 1^1 i^K In ^ij n I 1 對前述文書進行翻譯的步驟。 此外,本發明的第六實施例爲一種機械翻譯方法,其使 用具有多數翻譯環境的翻譯系统·,因應於記述對資訊貧源 的存取機構與資訊資源名稱的文字列之輸入,而將指定的 資訊資源内存放之檔聿工載,且翻譯檔案中的文書,其特 徵在於具備下列五個步驟: (a) 將關於資訊資源之文字列與翻譯環境間之組合作爲資 料庫而記錄之步驟; (b) 在前述資料庫中,對新輸入之文学列檢索最類似的 文字列之步驟; (c) 使用對應於前述檢索得的文字列之翻譯環境,對由資 訊資源下载之檔案中的文書進行翻譯的步驟; (d) 右翻譯的結果並不適切時,採用其他翻譯環境再次 對前述文書進行翻譯的步驟; (e) 若翻譯結果令·人滿意,將新的文字列與翻譯環境間冬 關係追加記錄於前述資料庫内的步驟。 本發明的第七實施例爲一種機械翻譯方法,其因應於 經濟部中央標準局貝工消費合作社印製 由:對資訊資源做存取用之協定名稱、存放資訊資源之伺 服器名稱(及词服器内的檔I名稱)之組合所構成的口虹 (Uniform Res〇urce L〇cat〇r)文字列的輸入,將指定的伺服器 内之播案,依據指定之協定經由網際網路 JF載,使用多數 翻譯環境對下載之檔案中的文書進行翻譯,其特徵在於具 備下列三個步驟: ’、' (a)解釋輸入之URL文字列的步驟; _____ - 15 - 本纸張尺度適财 (CNS) A4^ (21GX297公釐)'~~' — ----- A7 B7 經濟部中央標準局員工消費合作社印製 五、發明説明(I3 ) (b)依%釋結果’由前述多數譯環境選擇其一的步 驟; 、 (C)使用前述選定的翻譯環境,對下載之檔案中的文書進 行翻譯的步驟。 本發明的第八實施例爲一種機械翻譯方法,其因應於 由··對資訊資源做存取用之協定名稱、存放資訊資源之伺 服器名稱(及伺服器内的樓,案名稱)之組合所構成的 (Uniform Resource L〇cat〇r)文字列的輸入,將指定的词服器 内之檔案,依據指定之協定經由網際網路下載,使用多數 翻譯環境對下氣之.檔案中的文書進行翻譯,其特徵在於具 備下列五個步驟: (a) 解釋輸入之URL文字列的步驟; (b) 依解釋結果,由前述多數翻譯環境選擇其一的步 骤; (c) 使用贫述選定的翻譯環境’對下載之檔案中的文書進 行翻譯的步驟; (d) 使用前述選定的翻譯環境對前述原文文書進行翻譯 的步驟; (e) 將翻譯後的譯文文書與前述原文文書同時顯示於顯示 器上的步驟。 本發明的第九實施例爲一種機械翻譯方法,其因應於 由:對資訊資源做存取用之協定名稱、存放資訊資源之词 服器名稱(及伺服器内的標案名稱)之組合所構成的Url (Uniform Resource Locator)文字列的輸入,將指定的飼服器 -16· 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐)'----- ---r-------裝------訂------^旅 (請先閔讀背面之注意事項再填寫本頁) 315437 A7
f I— f合作社I 翻依據指定之協定經由網際網路下氣,使用多數 =兄對下载之構案中的文書進行翻譯,其特徵在於具 備下列三個步驟: (a)將URL文字列靼翻譯瓊琦乏4^ 的步驟; 與翻作馬資料庫而記錄 ⑻前述之資料庫中,對新輸人的職文字列中最先的 URL文字列做檢索的步躁;, ⑷使精應於前述檢索得的URL文字収翻譯環境, 對下毯」之檔案中的文書進行翻譯的步驟; 本發明的第十實施例爲一種機械翻譯方法,其因應於 由:對資訊資源做存取用之協定名稱、存放資訊資源之词 服器名稱(及词服器内的檔案名稱)之組合所構成的慨 (Urnform Resource L〇cat〇r)文字列的輸入,將指定的词服器 内之樓案,依據指定之協定經由網際網路下載,使用 翻譯環境對下載之檔案中的文書進行翻譯,其特徵在二丑 備下列四個步驟: 〃 ⑷將URL文字列與翻譯環境之組合作爲資料庫而記 的步驟; ⑻前述之資料庫中’對新輸入㈣RL文字列中最先 URL文字列做檢索的步驟; (c)使用對應於前述檢索得的URL文字列之翻 對下載之檔案中的文書進行翻譯的步驟; &兄’ ⑷若翻譯的結果並不合適時,使用其他的翻譯環 前述文書再次進行翻譯的步骤。 • 17- 本纸張尺度適用中國國家標孪(CNS ) A4规格(210^^^· Γ^-- (請先閲讀背面之注意事項再填寫本頁) 1T1 养.__________
經濟部中央裙準局員工消費合作社印製 本發明的第十-實施例爲—種機械翻譯方法,其因應於 由:對資訊資源做存取用之協定名稱、存放資訊資源之飼 服器名稱(及飼服器内的檀案名稱)之组合所構成的爾 (Umf0rm Resource L〇c迦)文字列的輸入,將指定的伺服莽 内之檔-案’依據指定之協定經由網際網農^載,使用多數 翻譯環境對下載之檔案中的文書進行翻譯,其特徵在於具 備下列五個步驟: , 八 (a) 將URL文字列與翻譯環境之组合作爲資料庫而記錄 的步驟; . ° (b) 前述之資料庫中,對新輸入的url文字列中最先的 URL·文字列做檢索的步驟; (c) 使用對應於前述檢索得的URL文字列之翻譯環境, 對下載冬檔案中的文書進行翻譯的步驟; (d) 若翻譯的結果並不合適時,使用其他的翻譯環境對 前述文書再次進行翻譯的步驟; (e) 若翻譯結果合適時’把新url文字列與翻譯環境間 之關係追加記錄於前述資料庫内之步驟。 本發明的第十二實施例爲一種機械翻譯裝置’其使用多 數翻譯環境,用以對透過網際網路由WWW伺服器下載的 標案中之文書進行翻譯,其特徵在於具備下列七種機構: 0)將記述URL文字列與翻譯環境之組合的資料庫記錄 起來的第一機構; (b) 使用者用以輸入URL的第二機構; (c) 將輸入的URL所指定的WWW伺服器之檔案下載的第 -18 - 冬...氏承尺度適用中國國家榇率(CNs ) A4規格(2iOX297公釐 裝 i I 訂 ------^旅 — _* n n (請先閱讀背面之注意事項再填寫本頁) A7 B7 315437 五、發明説明(16 三機構; (d) 用以由前述第一機構中檢索最類似於輸入的url文 字列之URL文字列的第四機構;· (e) 將檢索得的URL文字列相關的翻譯環境作爲最合適 者而加以選擇的第五機構; (f) 使用前述選定的翻譯環境,對下載之www伺服器的 檔案中之文書進行翻譯的第,六機構; (g) 將翻澤結果顯示於畫面上的第七機構。 此處所謂之「翻譯環境」指在翻譯處理時,被利用之辭 典的資料庫或文法處理演算法(例如文節之設定,或助動 詞之設定,文體的指定等)等。 請注意本發明主要係針對www頁的機械翻譯而設計, WWW頁位址之URL係由記述:協定名稱、飼服器名稱、 檔案名稱等各要素的文字列(亦即「部份URL文字列」)之 組合所構成。 關於本發明之機械翻譯方法及裝置可被安免減電腦程序 的形f,例如由WWW词服器接S www S,錢顯示於 經濟部中央樣準局員工消費合作社印製 瀏覽器畫面上之一連串瀏覽動作可連續執行。 童前述π腦程序除了備有用以Γ將外文文書翻譯成本國文文 書(或相反方向的翻譯處理)的翻譯機器外,尚有翻譯環境 Α (網際網路辭典)、翻譯環境Β (藝術辭典)、翻譯環境 C i運動體育辭典)等多數翻譯環境。又本發明相關之機械 翻譯方法預先错存有關於URL文字列的資料庫。這種 庫女7下列矣 1 k __ 所7JT ’可將比較頻繁存取的www頁相關 ______ - 19- ^^5437 a? B7 五、發明説明(I7 ) URL文字列與翻譯環境之對應關係表列出來的形態。該表 中與各URL文字列連上關係的翻譯環境可視爲根據過去的 翻譯處理結果之最適合的環境。 在表 1 裡對於 URL 名稱"www.ibm.com"及"www.yahoo.com" 而言爲翻譯環境 A (網際網路辭典),對於 "www.yahoo.com/Arts/"而言爲翻譯環境B (藝術辭典),對 "www.yahoo/com/Arts /Recreation /Sports/"而言爲翻譯環境 C (運動辭典),各別被記錄爲最合適的翻譯環境。該資料庫 可爲系統設計者根據用户的一般傾向Θ預先作成者。此 外,亦可學習各用户的存取狀況,再進一步累積資料庫。 經濟部中央標準局員工消費合作社印製 (請先閱讀背面之注意事項再填寫本瓦) WWW瀏覽器畫面上,若用户輸入URL文字列時,WWW 瀏覽器(或WWW瀏覽器代理)會透過網際網路而由URL文 字列所指定的WWW頁下載檔案。另一方面,本發明相關 的電腦程序解釋輸入之URL文字列。此處所謂的URL文字 列之解釋係指在資料庫上檢索最類似於輸入的URL文字列 之URL文字列。更具體而言,將URL文字列以部份URL 文字列的組合來掌握,從資料庫中尋找部份URL文字列的 組合最一致的URL文字列。例如:若URL輸入爲資料庫中 既存的"www.ibm.com/",則相對於此的翻譯環境A (網際網 路辭典)自動地被選定。又URL輸入爲資料庫内尚未登錄 的"www.yahoo/com/Arts/Architecture",貝丨J 部份 URL 文字列之 一致度最高的"www.yahoo.com/Arts/”之相對的翻譯環_境 B (藝術辭典)自動地被選定。而且,本發明相關的電腦程 序可在WWW頁的下載作業完成之後,或者平行於下載作 -20- 本紙浪尺度適用中國國家標準(CMS ) A4規格(210X 297公釐) 經濟部中央標準局貞工消費合作社印製 A7 -----------B7 五 '發^^ 18) —~ -—- 業而進行URL文字列的解釋。或者,本發明相關之電腦程 序亦可設計爲包含WWW㈣器之代理功能,而代理進行 WWW頁的下載作業。 其次,翻譯機器根據選定的翻譯環境,將下載之檔案中 的外文文書翻譯成本國文文書《翻譯結果的本國文文書, 舉例而言,可交給WWW割覽器而顯示在劉覽器畫面:。 此種情況下,原來的外文文書所構成的原文視窗與本國文 文書所構成的翻譯文視窗可同時顯示(顯示對譯結果)於同 —畫面上。 , 當翻譯的結果^示於瀏覽器的畫面上,用户判斷翻譯 得不妥當的情形下,可切換爲別的翻譯環境,然後再度做 機械翻譯作業。此外,有關在資料庫内尚未登錄的URL文 子列,备找出最恰當的翻譯環境,亦可追加登錄於資料庫 内0 -要約而言,本發明爲一種機械翻譯方法及装置,其對網 際網%上之WWW伺服器所提供之WWW頁進行機械翻譯 時’根據WWW頁位址的URL文字列而自動地切換翻譯環 境。由於根據本發明會選擇最合適的翻譯環境,故翻譯精 度得到改善。此外,翻譯環境之切換、資料庫之登錄處理 等僅根據所謂的..URL文字列之比較少量的資料來進行,因 此處理作單,且系統之建構亦易。 當機械翻譯時,首先必須由多數翻譯環境中,選擇適合 於原文^書的翻譯環境方式。這種技術本身在申請前已存 在(參考前述公開特許公報),但這些習知技術幾乎全部並 -21 - 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) n n I I I n n n I - I I -..4. f請先閲讀背面之注意事項再填M-本耳j 經濟部中央標準局員工消費合作社印裝 3l^437 A7 ___________B7 五 '發明説明(I9 ) 非參照URL文字列,而係參照對原文書内容解析的結果, 然後再選擇翻譯環境。換言之,這些習知技術包括了解析 ’、,文書々處理,因此在建構與活用兩方面均爲龐大的系 統與本發明之本質完全不同。又這些習知技術原本並非 專爲WWW頁〈翻譯而設計。以另—種看法,本發明可與 建構方式相異的前述習知技術共存。 本發明的其他目@、特徵喊優點,可由後面所述之本發 明的實施例或所添附之圖式,進行更詳細的説明。 [圖式之簡單說明] · 圖1表示可用以實施本發明之典型電腦系統10的硬體構 造; 圖2表示由本發明所提供之機械翻譯系統之系統構造; 圖J表示翻譯環境切換部130之構造; 圖4表示將URL資料庫133顯示於WWW瀏覽器畫面上 的結果 圖5表示將URL資料庫133顯示於WWW瀏覽器畫面上 的結(圖4畫面的繼續); 圖6表示URL對照部134所進行翻譯環境的選擇處理過 程的流程圖; _ 圖7例示安裝有本實施例相關之機械翻譯系統10〇的 WWW词服器150的畫面; 圖8爲URL資料庫133之追加登錄手續過程的流程圖。 較佳實施例之詳細説明 下列,一方面參照圖式,一方面詳細解釋本發明的實施 -22- 本紙張尺度適用中國國家標準(CNS ) M規格(21〇>< 297公釐) 裝 訂^------J- (請先閲讀背面之注意事唄再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(2〇 ) 例 A.硬體環境 圖1, 適於實現本發明的電腦系統10之硬體結構,下 列説明各部份細節。 主控制器的CPU11在操作系統(OS)控制下,可執行各種 程式。CPU11可採用例如美國Intel公司製造之"Pentium/lxx MHz"。又OS可採用例如美,國.IBM公司的"OS/2”( 'OS/2”爲 美國 IBM公司之商標)或美國 Microsoft公司的 'WindowsgS,、 ’ CPU11透過直接連接於本身的外部銷之處理機匯流排 12 、作爲本地匯流排的.PCI (Peripheral Component
Interconnect)匯流排 16 、及作爲輸出入匯流排的 ISA (Industry Standard Architecture)匯流排18等三階層匯流排而 與各硬體區义(Block)互相連接。 處理機匯流排12與PCI匯滹排16利用橋電路(主機-PCI 橋)13而互相連絡。本實施例的橋電路1 3包含:用以控制 對主記憶體1 4作存取動作之記憶體控制器,或用以吸收 兩匯流排12、16間之速度差的資料緩衝器。 主記憶體14作爲執行程式的讀取領域,或者是執行程式 的作業領域來使用,通常由多數DRAM晶片所構成。又L2 快取記憶體15用以暫時存放頻繁被存取的電碼/資料,係 用以吸收CPU11對主記憶體14之存取時間而設的高速記 憶體,一般採用SRAM晶片。又ROM17係用以永久性地存 放當電源加上時的測試程式(POST),或用以操作系統10内 -23- 本纸掁尺度適用中國國家標準(CNS ) A4規格(2〖0X297公釐) ' -----^----1¾衣------1T------J. (請先閱讀背面之注意事項#填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(21 ) 之各硬體的電碼群的一種不揮發性記憶體。 PCI匯流排16係一種可以較高速傳送資料的匯流排(匯流 排寬度爲32位元,操作頻率33MHz,最大資料傳送速度 爲132K位元組/秒),連接於影像控制器20或卡匯流排控 制器(未示於圖中)之以較高速操作的週邊設備類。 影像控制器20係用以處理來自CPU11的畫圖命令之專 門控制器,一旦將處理過,的畫圖資訊寫入畫面緩衝器 (VRAM) 21 ,由VRAM21讀取畫圖資訊而在顯示器22上變 爲影像輸出。 ^ PCI匯流排16與ISA匯流排18係利用橋電路(PCI-ISA橋) 19而互相連接。本實施例之橋電路19包含:DMA控制器 或可程式化岔斷控制器(PIC)及可程式化間隔計時器(PIT)。 又本實施例的橋電路1 9備有用以連接根據IDE (Integrated Drive Electronics)基準的外部記憶裝置之ID£接頭。IDE接 頭連接於IDE硬碟驅動器出01))23,或10£€0-1101^驅動 器24。 此外,上述兩橋電路13及19係根據依PCI所製作的規 格,通常以單一晶片組的形態被提供。晶片組之一例子可 參考美國的Int社公司所出售之“Triton”。 流排18相較於PCI匯流排之資料傳送速度較慢, (匯流排寬度1 6位元,最大資料傳送速度爲4M位元組/ 秒),用於連接鍵盤/滑鼠控制器(KMC) 25或I/O控制器 25、聲音控制器34等較低速驅動的週邊設備。 KMC25係用以將來自鍵盤26的輸入碼或來自滑鼠27的 -24- 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -------------种衣------ΐτ-----線 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 _____B7 五、發明説明(22 ) 指示座標値當作電腦資料置於匯流排18上的專用控制 器。 I/O控制器28透過軟式磁碟驅動器(FDD) 29的驅動,或平 行埠30或序列埠32,而以並行方式,或串列方式的資料 傳送動作做控制用之專用控制器。通常,平行埠30與序 列埠32分別連接有印表機31與調變解調器(Modem) 33。 調變解調器33爲用以透過一般的類比線路50而進行資 料交換之機器,其具備將電腦系統10内的數位信號調變 爲類比信號而傳送到線路50上,或相反•地經由線路50將 接受的類比信號解調變成數位信號,然後將其安置於電腦 系統10内的功能。本實施例的電腦系統1〇經由公用線路 50可撥號連接上伺服機器60 (更精確而言,伺服機器60的 調變解調器(未示於圖中))。在此所言之「伺服機器」係 指提供網際網路連接服務的「提供服務者」所具有之伺服 機器之一種(例如:最靠近系統1〇的用户之伺服機器)。伺 服機器60 —般裝於網際網路70内,將在本身所撥號的電 腦系統10〇5_連接於網際網路70。提供服務者之例有日本 IBM公司的Γ IBM網際網路連接服務」,或美國的 BEKKOAME網際網路公司的· Γ BEKKOAME/網際網路」 等。 1 聲音控制器3_4爲用以進行聲音信號輸出入處理之專用# 制器,從麥克風35輸入之聲音信號作爲電腦資料而被取 入,或將聲音資料作DA變換’使其從揚聲器36輸出。 此外’目前市面上所銷售之個人電腦可以裝配成圖1所 -25· 本纸張尺度適用 filil家網1 ( CNS ) ( 21GX297公瘦) "^ __ (請先閱讀背面之注意事項再填寫本頁) -裝
、1T 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(23 ) 示的電腦系統1〇之構造,而充份發揮其功能。爲構成電 腦系統10,除了圖1所示者之外,尚需包含其他電路,但 是這些其他電路對此技術領域者而言爲眾所周知,且無關 於本發明的要旨,因此在詳細説明中加以省略。 B.機械翻譯系統 圖2表示根據本發明之機械翻譯系統100的系統構成。 此機械翻譯系統實際上可由,如圖1所示的電腦系統10上執 行的應用程式之一種形態來實現。 此機械翻譯系統100由翻譯代理110、_譯機器、翻 譯環境切換部130等部份所構成。此等部份與WWW瀏覽 器150間之彼此配合,使得機械翻譯過程可以順利地實 施。 WWW瀏覽器150係作爲網際網路旅行指南用之電腦程 式,除了爲電腦系統10的用户,提供用以輸入UJ狂 (Uniform Resource Locator) ·,亦即希望的WWW頁之位址的 -用户介面之外,同時解釋存放於WWW頁的HTML檔案之 内容,顯示於顯示器22上。本實施例之WWW瀏覽器150 爲備有代理之功能型,即WWW瀏覽器150對於WWW頁上 之檔案的下載作業係由翻譯代理110來負責,且翻譯後_主 書檔案亦係由翻譯代理110來接受,與影像檔案(例如GIF 檔案等)同時顯示於顯示器22上。支援WWW瀏覽器150的 各種顯示形態,例如「僅顯示原文」,「僅顯示譯文」, 「顯示對譯結果」等。可在瀏覽器畫面上進行切換,且瀏 覽器畫面亦可爲多視窗中之一視窗。(後面會有所敘述) -26- 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) ----------神衣-------ΪΤ------\ ^ (請先閔讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 ----------------------B7 五、發明説明(24 ) " " 翻譯代理110,依來自www瀏覽器15〇的要求,而由 URL所扣足的WWW頁將檔案經由網際網路7〇下載之外, 同時將下載的檔案中之文書交由翻譯機器丨2〇,然後再將 由翻#機器120送回之經過翻譯處理的譯文文書交给 瀏覽器150。所謂的「委託代理」係指無法由外部直接存 取的王機足代理,接受來自網際網路之通信資料等中繼功 能的總稱。 , 翻譯機器120係機械翻譯處理,即由原文(例如英文等外 文)翻爲譯文(例如日文等)的主要部份;其—邊利用本身 所具有的翻譯環境對由翻譯代理丨1〇所接受之原文文堂進 行翻譯處理,一邊將處理結果的譯文文書交給翻譯代理 110。本實施例之翻譯機器12〇備有翻譯環境A、翻譯環 境B 、翻譯環境C…等多數翻譯環境。此處所謂的「翻譯 環境」指在翻譯處理時所利用之辭典資料庫,或文法處理 演算法(例如段落之辑:一定、助動-詞之設定、文體的指定) 等。原文文書之内容所屬之種類、領域、用|等與翻譯環 境之間互有關係的事實已爲一般所認知。在本實施例中, 依類別’而有各種辭典資料庫,例如:網祭網路辭典、 商業辭典、政治辭典、娛樂辭典·、藝術辭典、運動辭典等 .等。 翻譯環境切換部130用以視而切換翻譯機器12〇應 使用之翻譯環境。本實施例相關的翻譯環境切換部13〇之 設計係著眼於作爲WWW頁之位址的URL係由記述協定名 稱、伺服器名稱、檔案名稱等各部份的文字列(即「部份 -27- 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) " . 裝------、1T-------Λ (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(25 ) URL文字列」)之组舍所構成,對於WWW瀏覽器150,根 據被輸入之URL文字列而自動選擇最合適的翻譯環境。 圖3表示翻譯環境切換部130之構造。如該圖中所示, 本實施例的翻譯環境切換部130可細分爲:URL輸入部 131、翻譯環境輸出部132、URL資料庫133、URL對照部 ·'— -- 134、基本操作部135等。 URL資料庫丄33係記述較噸繁存取之WWW頁的URL文 字列與對於各自文字列而言被認爲最適合的翻譯環境之間 的對應關係。 圖4及圖5表示URL資料庫133顯示於WWW瀏覽器畫 面上的_禮_#> (圖5畫面爲圖4畫面的下一畫面)。如兩圖所 示,較頻繁存取之各WWW伺服器/ WWW頁之URL文字列 各自與最合適的翻譯環境連上關係,然後登錄於資料庫 133 上面。例如·· "www.ibm.com/"或1'wvAv.yahoo.com/”與「網 際網路一般類」連上關係,而''cnn.com/"與「商業」連上關 係,分別登錄爲最合Jt的翻譯環境。本實施例之URL資料 庫133^中,各URL文字列係成不規則記述(即僅依據登錄 順序而並不按興羅馬字母或部份URL之陣列,或個數等任 一種順序)。 - 作爲URL文字列與最合適翻譯環境之互相對應關係的特 徵之一爲,URL文字列所表示之WWW伺服器名稱即使相 同,只要指定之檔案相異,則最適合的翻譯環境不同的情 形亦經常發生。例如,如圖 4 及圖 5 所示, “www.yahoo.com/”以「網際網路一般類」登錄爲最適合的 _-28-_ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) — --.--^------扣衣------1T------ (請先閱讀背面之注意事項再填寫本頁) 五、發明説明(26 ) 環境,另一方面,在同一 WWW伺服器内的之樣^ "www.yahoo.com/Govemment/"、"www.yahoo.com /Recreation/Sports" 或"www.yahoo.com/Arts/"等分別登錄爲「政治」及「運動」 當作最適宜環境。更進一步依照本案發明者之經驗,即使 是同一 WWW伺服器内之喝奉,「部份URL_文字列」(即 構成URL的文字列當中,以“ / ”來區隔的各種文字列)的组 合最爲類似的檔案彼此之埒一般而言共有最適宜環境。例 如,名爲 “www.yahoo.com/Arts/Archite..pt_ure” 的 URL 文字列所 指定的檔案相較於 “www.yaho6.com/” , 其與 “www.yahoo.com/Arts/”間之部份URL文字列的一致度較高, 同樣以「藝術」作爲最合適的環$登錄。 登錄於URL資料庫133的URL文字列,可由例如機械翻 譯系統1 0 0之設計者預先進行。亦可由系統100的用户透 過基本操作部135而進行追加登錄(參照後述説明)。 經濟部中央標準局員工消費合作社印製 (請先閱讀背面之注意事項再填,寫本頁) URL輸入部131經由翻譯代理110而接受在WWW瀏覽 器畫面輸入之URL文字列,然後交給URL對照部134。此 外,URL對照部134將輸入之URL文字列在URL資料庫 133上做對照,找出最合適的翻譯環境,然後經由翻譯環 境輸出部132而通知翻譯機器-120。 C.翻譯環境的撰楛虛理 URL對照部134所進行的處理,概要而言是在URL資料 庫133—内檢索最類似於輸入之url文字列的文字列, 將找出之URL文字列所對應之翻譯環境輸出於翻譯機器 120。圖6以流程圖表示URLJ^·照部134所進行翻譯環境 — -29- 本紙張尺度適用中國國家榡準(CNS ) A4規格(2丨0X297公釐) 經濟部中央標準局員工消費合作社印製 315437 at B7 五、發明説明(27) 的選擇處理過程。在該處理的過程,i爲WWW瀏覽器上 輸入之URL文字3,j爲URL資料庫133上之索引,m-爲檢索過程中,到目前爲止最爲類似的URL文字列之索 引。例如陣列S(i)表示URL資料庫133上登錄於第i個錄 (record)的URL文字列。又資料庫檢索之最終結果爲m=M 的情況,表示URL資料庫133上的第Μ個URL文字列 S ( Μ)所對應之翻譯環境爲最適當。又陣列E(m)表示URL 資料庫133上登錄於第m個錄上之URL文字列的翻譯環 境。 , 該處理過程中,首先對各索引代入初期値(步骤S10) » 索引i之初期値表示URL資料庫之先頭記錄1 ,索引m的 初期値爲0 (blank),即類似的URL文字列尚未被發現。 其次,步驟S20時,判斷現有的索引i是否超過URL資 料庫133的最後一個錄。 •判斷方塊S20的結果倘若呈現否定,亦即未對照的錄尚 留於URL資料庫133内,則在下一步驟S30上,判斷現有 輸入中之URL文字列S是否包含相關於第i個錄的URL 文字列S(i)作爲其部份URL文字列(步驟S30)。 判斷方塊S30的結果若爲否定,亦即URL文字列S(U被 判塹爲沒有類似於現在所輸入中之URL文字列S,則跳到 步驟S70。步驟S70之時,URL資料庫133應與下一個錄 比較,將i增加1,然後回到步驟S20。 一方面,若判斷方塊S30的結果爲肯定,亦即判斷URL 文字列S(i)爲類似於現在所輸入中之URL文字列S時,可 -30- 本纸張尺度適用中國國家標準(CNS ) A4说格(210X297公釐) 批衣--------1T-------T.4- (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(28 ) 前進至下一步驟S 4 0,判斷是否m= 0,即類似的URL文 字列尚未被尋獲。此種情況下(m= 0),應暫時將被對照的 URL文字列存起來,而將i代入m中。 若在判斷方塊S40,m非爲0的情況,即類似的URL文 字?1已爲暫時儲存的狀態,則前進至下一步驟S50。此種 情況下比較被對照的URL文字列S(i)與已被記憶之URL文 字列S(m)其中之一是否類似於現在輸入中的URL文字列 S 。該比較係根據比較文字列S(i)和S(m)何者包含較多的 連續部份URL文字列來進行。例如:"Www.yahoo.com/n* "www.yahoo.com/Arts/"的時候,前者由一個,後者由兩個部 份URL文字列所構成,故後者佔優勢。此外,「較多的連 續部份URL文字列」指的是,即使較多的部份URL文字列 一致,但部份URL文字列的排列不一致的情況,即表示 URL對照上的類似性低。例如:假設現在輸入中的URL文 字列爲"www.yahoo.com/Recreation/Sports/",且 URL 資料庫 133 已登錄的 URL 文字列有"www.yahoo.com/Sports/"及 "www.yahoo.com/Recreation/”兩.個,後者有兩個連續的部份 URL文字列一致,但是前者僅一個部份URL文字列一致 ("Sports"雖存在於输入URL文字列中,由於排列並不一 致,故不列入計算)。因此後者的URL文字列佔優勢。 判斷方塊S50上,若判斷新被對照的URL文字列S(i)佔 優勢的情況,則前進至下一步驟S60,將最類似的URL文 字列置換,將i代入m。然後前進至步驟S70。若在判斷 方塊S50判斷已儲存的URL文字列S(m)較爲優勢時,應該 -31 - (請先閲讀背面之注意事項再填寫本頁) -裝. 訂 洗---- 本纸張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) 經濟部中央標準局員工消費合作社印製 A7 j---一__ _ B7 五、發明説明(29) 維持目前的m値,跳過下一步驟S6〇,而進入步驟S7〇。 在步驟S70對照URL資料庫Π3的下一個錄,將i增加 1 ’然後回到步驟S20。然後在步驟S20,若未對照的錄 尚留在URL資料庫133内時,則重複上述步騍S30〜S70。 另一方面,在步驟S20若判斷目前的索引i超過]JRL資料 庫133最後的錄時,可進入分歧"Yes",而進入步驟S8〇。 在步驟S80時,首先調查,m是否爲〇,若m爲〇,則表 示在上述回圈S20〜S70,完全無法從URL資料庫133中找 出類似於現在輸入中之URL文字列S的URL文字列。此種 情況下’把系統設定的翻譯環境輸出至翻譯機器12〇 (步 骤S90),結束翻譯環境的選擇處理過程。 另一方面,若m不等於〇 ,將上述回圈S2〇〜S70中判斷 爲最類似的URL文字列相關之翻譯環境E(m)輸出至翻譯機 器120 (步驟S100) ’而結束翻譯環境的選擇處理過程。翻 譯機器120使用所選擇之翻譯環境E(m)而將下載的檔案做 翻譯處理。 g.URL資料庫之尹薪 前面已敘述URL資料庫133的内容透過基本操作部135 而被追加登錄。本項中簡單謀明URL資料庫133的追加登 綠手續。 圖8爲以流程圖表示url資料庫133的追加登錄手續的 過程°首先,在WWW瀏覽器畫面上顯示譯文文書,然後 由用户在觀察此内容後,判斷是否滿足翻譯内容,亦即最 合適的翻譯環境是否已選擇出來(步驟S200)。 __ ·32- 紙張尺度適用中國國$準(CNS) 2lGx 297公董)---- ^.IT------^ (請先閱讀背面之注意事項再填寫本頁〕 A7 B7 經 濟 部 t 央 標 準 局 貝 工 消 費 合 作 社 印 製 五、發明説明(30 ) 判斷方塊S200結果若爲否定,則無追加登錄之必要,故 跳開全部的後續步驟’結束處理過程。 另一方面,若判斷方塊S200的結果爲肯定時,則由用户 來判斷新輸入的URL文字列S與最合適的翻譯環境E(m) 間之關係是否需要追加登錄於URL資料庫133内(步碟 S210)。在此處用户根據新輸入的URL文字列S之未來的 使用頻率,判斷是否進行登,錄。 判斷方塊S210的結果若爲肯定,則在URL資料庫133進 行新的登攀(步驟S220)而結束處理的邁程。又判斷方塊 S210的結束爲否疋時,則跳開下一步驟S220,結束處理的 過程。 E.劉覽器畫面 圖7中例示安裝有本實施例相關之機械翻譯系統1〇〇的 WWW伺服器15〇的畫面。該圖式之畫面中,緊接於原文 文書的下方之行標示有「對譯顯示」模式,但在WWw瀏 覽器畫面上可切換成「僅顯示原文j 、 「僅顯示譯文」等 其他顯示模式。又WWW瀏覽器畫面上亦可使用顯示器22 上之多視窗中之一視窗。 在WWW瀏覽器畫面,由最上段開始分別設有「標題選 擇清單J 、「操作選擇清單」、「工具選擇清單」。標題 選擇清單爲顯示起動畫面的應用程式名的區域。標題選擇 清單係一覽顯示可選擇的處理指令之區域(眾所周知)。又 工具選擇清單係將爲了迅速起動頻繁使用之功能的按叙排 成—列之操作選擇清單之一種,亦名爲「smartclon」(眾 (請先閔讀背面之注意事項再填寫本頁·} -裝.
、1T an !1 - n[ -33- ’ 經濟部中央標準局員工消費合作社印裝 A7 B7 五、發明説明(31 ) 所周知)。 工具選擇清單的正下方設有URL輸入部,用户藉由將 URL文字列輸入至URL輸入部,而指定希望之存取位置的 WWW頁。該圖中,URL名稱以”www.yahoo.com/"輸入。 輸入之URL文字列交給翻譯代理110,翻譯代理110代 理WWW瀏覽器150,由指定的WWW頁下載檔案,同時 把檔案中的原文文書暫時交,給翻譯機器120。又被輸入之 URL文字列經由翻譯代理110而交給翻譯環境切換部 130。翻譯環境切換部130解釋接受的tJRL文字列,而選 擇最適宜的翻譯環境,然後通知翻譯機器120。翻譯機器 120利用所選擇之翻譯環境將原文文書做好翻譯處理,然 後將原文文書與譯文文書經由翻譯代理11 〇而轉交給 WWW瀏覽器150。這種一連串處理係在desktop的背景進 行。 • URL輸入部下方,佔瀏覽器畫面之大部份的矩形領域即 WWW瀏覽器畫面之本體,下載之WWW頁内容顯示於其 上。該圖中,由URL名稱所指定的"www.yahoo.com/"頁之 畫面顯示於其上。 WWW瀏覽器畫面本體的最-上段設有現在之顯示模式, 或用以顯示所選擇的翻譯環境之指示部。該圖中強調了作 爲顯示模式而被設定之「對譯」模式,因此,瀏覽器畫面 内,緊接於原文文書的下方行標示有譯文文書。如圖4所 示般,由於在URL資料庫133上"www.yahoo.com/"的最適當 環境登錄爲「網際網路一般類」,在指示部顯示其要旨。 -34- 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) —--------批衣------,1T---^----1Λ (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 五、發明説明(32 ) 此外,用户可使用滑鼠27對指示部dlek,而動態地切换 顯示模式或使用之翻譯環境。 g.追補事項 综上所述,-方面參考特定實施例,—方面詳細解説本 發明全文。然而,在不脱離本發明的主旨之下,本技術領 域之人士可對該實施例做修正或代用。例如:機械翻 統不-定必須制wwwM器的代理(pr〇xy)功能,www 劉覽器畫面上之原文亦可經由剪貼板轉交而來 譯處理。換而言之,本發明雖以例示 ‘、、' 灸翻 α形態進行説明,但 並不限於此。本發明之要旨應參酌以 卜 < 申請專利範圍s • 35- 木纸張尺度適用中國國家標準(CNS〉A4規格(210X297公釐) 裝------訂---------^*11------- (请先閱诘背面之注意事項再填寫本頁) 3ί 5437 A7 B7 經濟部中央標準局員工消費合作社印製 五、發明説明(33 ) 符號之説明 10 : 電腦系統 31 : 印表機 11 : CPU 32 : 序列埠 12 : 處理機匿流排 33 : 調變解調器 13及 19 :橋電路 34 : 聲音控制器 14 : 主記憶體 35 : 麥克風 15 : L2快取記憶體 > 36 : 揚聲器 16 : PCI匯流排 50 : 公用線路 17 : ROM 60 : 伺服機器 18 : ISA匯流排 70 : 網際網路 20 : 影像控制器 100 :機械翻譯系統 21 : VRAM 110 :翻譯代理(Proxy) 22 : 顯示器 120 :翻譯機器 23 : HDD 130 :翻譯環境切換部 ' 24 : CD-ROM驅動器 131 :URL輸入部 25 : 鍵盤/滑鼠控制器 132 :翻譯環境輸出部 26 : 鍵盤 133 :URL資料庫 27 : 滑鼠 134 :URL對照部 28 : I/O控制器 -135 :基本操作部 29 : FDD 150 :WWW瀏覽器 30 : 平行埠 -36- 訂 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ 297公釐) 請 先 讀 背 ιέ 意 事 項 再 填 %裝 本衣 頁 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(34 ) 表1 URL文字列 翻譯環境 www.ibm.com/ 翻譯環境A (網際網路辭典) www.yahoo.com/ 翻譯環境A (網際網路辭典) www.yahoo.com/Arts/ 翻譯環境B (藝術辭典) www.yahoo.com/Arts/Recreation/ 翻譯環境C (運動辭典) Sport/ ' I Γ I ------ (請先駕讀背面之注意事項再填寫本頁) -37-本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公釐)

Claims (1)

  1. 315437 A8 B8 C8 D8 申請專利範圍 經濟部中央標準局員工消費合作社印袋 1. 一種機械翻譯方法,僅ffl 便用具有多數翻譯環境的翻課系 統,用以翻譯用户妍户令u , 、 所扎疋的資訊資源内所存放的檔案 中的又書,其特徵在於包含以下步驟: ⑷對記述對於資訊資源的存取機構與資訊資源名稱 的文字列做解釋的步驟; (b)依照解釋結果,選擇該多數翻譯環境中之一個 步驟; (C)使用該選定之翻譯環境,對該文字列所 訊資源中存放的槽案中的文書加以翻譯的步驟。 2. -種機械翻譯方法,使用具備多數翻譯環境的翻譯 統,對用户所指定的資訊資源内存放的樓案中之文 進行翻譯,其特徵在於包含以下步驟: ⑷用户輸入記述對於資邙咨 貧讯貪源的存取機構與資訊 源名稱的文字列之步驟; (b) 依該文字列所指定的存 于取珉構,對孩文字列所指 定的資訊資源内所存放的檔案進行下栽的步驟; (c) 解釋該文字列的步驟; (d) 依解釋結果,由該多數翻譯環境當中選擇其— 步驟; ' (e) 使用該選定的翻譯環境,對兮 耵涿下栽〈檔案中的 書進行翻譯的步驟。 3. —種機械翻譯方法,使用具備多數翻譯環境的翻 統,用以翻譯用户所指定的資訊資源所存放的檔 之文書,其特徵在於包含以下七個步 " 的 資 系 書 資 的 文 譯系 案中
    I I n n Ί .I (請先閲請背面之注意事項再填寫本頁)
    申請專利範圍 4. 經濟部中央標準局員工消f合作衽印製 訊 存 後 (a) 用户輸入記述對於資訊資源 神名盐沾… 見原的存取機構與資訊資 你石稱的又字列之步驟; (b) 依照該文字列所指定的存取機構,將該文字列所 指定之資訊資源所存放的檔案下載的步驟; (c) 將下載之檔案與檔案中之 不又又書同時顯示於顯 不器上的步驟; (d) 解釋該文字列的步輝; (e) 依照解釋結果,由該多數翻譯環境中選擇的 步驟; I (f) 使用該選定的翻譯環境,將該原文文書做翻譯的 步驟; (g) 將翻譯後之譯文文書與該原文文書同時顯示於顯 示器上的步驟。 一種機械翻譯方法,使用具有多數翻譯環境的 統’用以因應於記述文字資訊資源的存取機構和資 資源名稱的文字列之輸入,對指定的資訊資源内所 放之檔案做下載,且翻譯檔案中之文書,其特徵在 具備下列三個步驟: (a) 將關於資訊資源之文字列與翻譯環境間之組合性 爲資料庫而記綠之步骤; (b) 在該資料庫中,對新輸入之文字列檢索最類似的 文字列之步驟; (c) 使用對應於該檢索得的文字列之翻譯環境,對由 資訊資源下載之檔案中的文書進行翻譯的步驟。 本紙張尺度適用中國國家標準(CNS ) A4说格(210X297公釐) .I I I 裝 I —訂 (請先閣球背面之注意事項再填寫本頁) A8 B8 C8 D8 申請專利範圍 5.—種機械翻譯方 % , κ 使用具有多數翻譯環境的翻譯表. 所*,因應於i己述盤咨# $ μ 的存取機構㈣H源名 案下恭 輪入,而將指定·的資訊資源内存放之檔 載,且翻譯檔案中的文書,其特徵在於具備下列 四個步驟: '升?s「/』 (a)將關於資却咨、、s ' 、、 a、 讯!源ι又字列與翻譯環境間之組合作 馬貝料庫而記錄之步驟; 、(b)在孩j料庫中,對新輸入之文字列檢索最類似的 又罕列之步驟; (c) 使用對應於該檢索得的文字列之翻譯環境,對由 資訊資源下載之檔案中的文書進行翻譯的步驟; (d) 右翻澤的結果並不適切時,採用其他翻譯環境再 次對該文書進行翻譯的步驟。 '種機械翻譯方法’使用具有多㈣譯環境的翻譯系 統,因應於記述對資訊資源的存取機構與資訊資源名 %的又字列之輸入,而將指定的資訊資源内存放之檔 案下載,且翻譯檔案中的文書,其特徵在於具備下列 五個步驟: (匀將關於資訊資源之文f列與翻譯環境間之組合作 爲資料庫而記錄之步驟; (b) 在該資料庫中,對新輸入之文字列檢索最類似的 文字列之步驟; (c) 使用斜應於該檢索得的文字列之翻譯環境,對由 資訊資源下載之檔案中的文書進行翻譯的步驟; ^-- (請先閲讀背面之注意事項再填寫本買) j 訂-------11------ - I In H.. •40- 本紙張尺度適用中國國家標準( CNS )八视格(2丨Οχ)97公着) A8 B8 C8 D8 、申請專利範圍 ⑷若翻譯的結果並不適切時,採用其他翻譯環境再 次對該文書進行翻譯的步驟; 7. 〇)右翻u 7人滿意’將.新的文字列與翻譯環境 間之關係追加記錄於該資料庫内的步驟。 -種機械翻譯方法,因應於由:料訊資源做存取用 之協定名稱、存放資訊資源之伺服器名稱(及飼服器内 的樓案名稱)之組合所構A W URL文字列的輸入,將 指定的伺服器内之標案,依據指定之協定經由網際網 路下載,使用多數翻譯環境對下載之擋案中的文書進 行翻譯,其特徵在於具備下列三個步驟: (a) 解釋輸入之URL文字列的步驟; (b) 依解桎結果,由該多數翻譯環境選擇其一的步 驟; (C)使用該選定的翻譯環境,#下載之㈣中的文書 進行翻譯的步驟。 經濟部中央標準局員工消費合作社印裝 8· -種機械翻譯方法,因應於由:對資訊資源做存取用 之協定名稱、存放資訊資源之伺服器名稱(及词服器内 的檔案名稱)之組合所構成的URL文字列的輸入,將 扣疋的伺服器内之檔案,枣據指定之協定經由網際網 路下載,使用多數翻譯環境對下載之檔案中的文書進 行翻譯,其特徵在於具備下列五個步驟: (a) 解釋輸入之url文字列的步凝; (b) 依解釋結果,由該多數翻譯環境選擇其一的步 驟; .經濟部中央標準局貝工消費合作社印製 ⑷使用該選定的翻譯環境,對下載之檔案中的文書 進行翻譯的步驟; ⑷使用該選定的翻譯環境對.該原文文書進行翻譯的 步驟; ⑷將翻譯後的譯文文書與該原文龙書同時顯示於顯 示器上的步驟。 9· -種機械翻譯方法,因磚於由:對資訊資源做存取用 之協足名稱、存放資訊資源之伺服器名稱(及伺服器内 的檔案名稱)之組合所構成的URL文字列的輸入,將 指定的词服器内之檔案’依據指定之協定經由網際網 路下載,使用多數翻譯環境對下載之橋案中的文書進 行翻譯,其特徵在於具備下列三個步碟: ⑷將URL文字列與翻譯環境之组合作爲資料庫而記 錄的步驟; (b) 該資料庫中,對新輸人的URL文字列中最先的 URL文字列做檢索的步驟; (c) 使用對應於該檢索得的URL文字列之翻譯環境, 對下載之檔案中的文書進行翻譯的步驟。 10.—種機械翻譯方法,因應吃由:對資訊資源做存取用 之協定名稱、存放資訊資源之伺服器名稱(及伺服器内 的檔案名稱)之組合所構成的URL文字列的輸入,將 才EI疋的伺服器内之樓案,依據指定之協定經由網際網 路下載,使用多數翻譯環境對下載之檔案中的文書進 行翻譯*其特徵在於具備下列四個步驟: ( 210x297公 ft
    申請專利範圍 A8 B8 C8 D8 經濟部中央標率局員工消費合作衽印製 ()將URL文+列與翻譯環—境之组合作爲資料庫而記 錄的步驟; (b) 孩資料庫中,對新輸^的url文字列中最先的 URL文字列做檢索的步驟; (c) 使用對應於該檢索得的URL文字列之翻譯環境, 對下載之檔案中的文書進行翻譯的步驟; (d) 若翻澤的結果並不貪適時,使用其他的翻譯環境 對前述文書再次進行翻譯的步驟。 11· 一種機械翻譯方法,因應於由:對資訊資源做存取用 之協定名稱、存放資訊資源之伺服器名稱(及伺服器内 的檔案名稱)之組合所構成的URL文字列的輸入,將 才曰足的词服器内之檔案’依據指定之協定經由網際網 路下載’使用多數翻譯環境對下載之檔案中的文書 行翻# ’其特徵在於具備下列五個步驟: (a) 將URL文字列與翻譯環境之組合作爲資料庫而 綠的步驟; (b) 該資料庫中’對新輸入的url文字列中最先 URL文字列做檢索的步驟; (c) 使用對應於該檢索得p URL文字列之翻譯環境, 對下載之檔案中的文書進行翻譯的步驟; (d) 若翻譯的結果並不合適時,使用其他的翻譯環境 對前述文書再次進行翻譯的步驟; (e) 若翻譯結果合適時,把新URL文字劲_與翻..譯..環境 間之關係追加記錄於該資料庫内之步驟。 進 記 的 ---------裝------訂-------\Λ (请先閱读背面之注意事項#填寫本萸) -43 本·我張尺度適用中國®家標準(CNS )八4祕(210X297公瘦) A8 B8 C8 D8 ^15437 六、申請專利範圍 12. —種機械翻譯裝置,使用多數翻譯環境,用以對透過 網際網路由WWW伺服器下載的檔案中之文書進贫翻 譯,其特徵在於具備下列七種機構: (a) 將記述URL文字列與翻譯環境之組合的資料庫記 錄起來的第一機構; (b) 使用者用以輸入URL的第二機構; / (c)知輸入的URL所指定的'w/'ww伺服琴之檀案下載 的第三機構; (d) 用以由該第一機構中檢索最類似淤輸入的URL文 字列之URL文字列的第四機構: (e) 將檢索得的URL文字列相關的翻譯環境作爲最合 適者而加以選擇的第五機構; (f) 使用該選定的翻譯環境,對下載之www伺服器 的檔案中之文書進行翻譯的第六機構; (g) 將翻譯結果顯示於畫面上的第七機構。 一種電腦可讀記憶媒體,用以存放可對透過網際網路 而由WWW伺服器下載之檔案中的文書進行翻譯的電 腦程式,其特徵在於該電腦程式具有: (a) 多數翻譯環境·, (b) 資料庫,將記述URL文字列與翻譯環境間之组合 的資料庫記綠起來; (c) 第一電腦可讀取程式碼機構,用以將用户所輸入 之URL所指定的WWW伺服器檀案下載; (d) 第二電腦可讀取程式碼機構,由該資料庫中檢 --- --------- 44 - 本纸張尺度相中@目家標準(CNS)〜祕(21GX297公幻 -蘇------訂----- --- 經濟部中央標準局員工消費合作社印聚 A8 Βδ C8 D8 六、申請專利範圍 最類似於輸入的URL文字列的URL文字列; (e) 第三電腦可讀取程式碼機構,將檢索得之URL文 字列相關之翻譯環境作爲最合適者來加以選擇; (f) 第四電腦可讀取程式碼機構,使用該選定之翻譯 環境對下載之WWW伺服器檔案中文書進行翻譯; (g) 第五電腦可讀取程式碼機構,用以將翻譯結果顯 示於畫面。 --------II------、訂------' ^ (請先閲請背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 •45- 本紙張尺度逋用中國國家標隼(CNS ) A4規格(210X297公釐)
TW085116090A 1996-10-15 1996-12-26 Machine translation method and device TW315437B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08272755A JP3121548B2 (ja) 1996-10-15 1996-10-15 機械翻訳方法及び装置

Publications (1)

Publication Number Publication Date
TW315437B true TW315437B (en) 1997-09-11

Family

ID=17518307

Family Applications (1)

Application Number Title Priority Date Filing Date
TW085116090A TW315437B (en) 1996-10-15 1996-12-26 Machine translation method and device

Country Status (7)

Country Link
US (1) US6119078A (zh)
JP (1) JP3121548B2 (zh)
KR (1) KR100265548B1 (zh)
CN (1) CN1148685C (zh)
GB (1) GB2320773A (zh)
SG (1) SG54551A1 (zh)
TW (1) TW315437B (zh)

Families Citing this family (158)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6044205A (en) * 1996-02-29 2000-03-28 Intermind Corporation Communications system for transferring information between memories according to processes transferred with the information
US6122666A (en) * 1998-02-23 2000-09-19 International Business Machines Corporation Method for collaborative transformation and caching of web objects in a proxy network
US8489980B2 (en) * 1998-02-23 2013-07-16 Transperfect Global, Inc. Translation management system
US10541974B2 (en) * 1998-02-23 2020-01-21 Transperfect Global, Inc. Intercepting web server requests and localizing content
US6272531B1 (en) * 1998-03-31 2001-08-07 International Business Machines Corporation Method and system for recognizing and acting upon dynamic data on the internet
GB2337611A (en) 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
US7191393B1 (en) * 1998-09-25 2007-03-13 International Business Machines Corporation Interface for providing different-language versions of markup-language resources
US6738827B1 (en) 1998-09-29 2004-05-18 Eli Abir Method and system for alternate internet resource identifiers and addresses
US6374247B1 (en) * 1998-11-09 2002-04-16 Unisys Corporation Cool ice service templates
US6370532B1 (en) * 1998-11-09 2002-04-09 Unisys Corporation Cool ICE batch interface
US6490550B1 (en) * 1998-11-30 2002-12-03 Ericsson Inc. System and method for IP-based communication transmitting speech and speech-generated text
US6347316B1 (en) * 1998-12-14 2002-02-12 International Business Machines Corporation National language proxy file save and incremental cache translation option for world wide web documents
US6363337B1 (en) * 1999-01-19 2002-03-26 Universal Ad Ltd. Translation of data according to a template
JP2000276431A (ja) * 1999-03-25 2000-10-06 Nec Corp 翻訳機能付きプロキシキャッシュサーバ及びそれを有する翻訳機能付きブラウジング・システム
US6654741B1 (en) * 1999-05-03 2003-11-25 Microsoft Corporation URL mapping methods and systems
US7607085B1 (en) * 1999-05-11 2009-10-20 Microsoft Corporation Client side localizations on the world wide web
JP3664917B2 (ja) * 1999-08-06 2005-06-29 シャープ株式会社 ネットワーク情報の表示方法およびその方法をプログラムとして格納した記憶媒体ならびにそのプログラムを実行するコンピュータ
US6993476B1 (en) * 1999-08-26 2006-01-31 International Business Machines Corporation System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework
US6957247B1 (en) * 1999-09-22 2005-10-18 Ates Gorkem I Internet system
US6950881B1 (en) * 1999-11-02 2005-09-27 Mshift, Inc. System for converting wireless communications for a mobile device
EP1228455A1 (en) * 1999-11-02 2002-08-07 E-Clarity, Inc. Verbal classification system for the efficient sending and receiving of information
US7039722B1 (en) * 1999-11-12 2006-05-02 Fuisz Richard C Method and apparatus for translating web addresses and using numerically entered web addresses
US7107325B1 (en) 1999-11-15 2006-09-12 Insweb Corporation System and method for optimizing and processing electronic pages in multiple languages
AUPQ539700A0 (en) * 2000-02-02 2000-02-24 Worldlingo.Com Pty Ltd Translation ordering system
US7225181B2 (en) * 2000-02-04 2007-05-29 Fujitsu Limited Document searching apparatus, method thereof, and record medium thereof
KR20010085157A (ko) * 2000-02-29 2001-09-07 박종득 인터넷에서 단어,철자를 조합하여 일기,편지등의문장,글을 한글로 쓰면 외국어로 실시간 번역을 하고,외국어를 한글로 혹은 외국어를 다른 외국어로 실시간통,번역해주는 시스템
US7216072B2 (en) * 2000-02-29 2007-05-08 Fujitsu Limited Relay device, server device, terminal device, and translation server system utilizing these devices
US9614934B2 (en) 2000-02-29 2017-04-04 Paypal, Inc. Methods and systems for harvesting comments regarding users on a network-based facility
US6415249B1 (en) * 2000-03-01 2002-07-02 International Business Machines Corporation Method and system for using machine translation with content language specification
KR20000036408A (ko) * 2000-03-07 2000-07-05 손상범 일대일 대응 방식을 이용한 인터넷 브라우저상의자국어/기준어 도메인 문자 전환 알고리즘.
AU2001245481A1 (en) * 2000-03-07 2001-09-17 Hotlens.Com Inc. Server-side web browsing and multiple lens system, method and apparatus
AU2001247591A1 (en) * 2000-03-20 2001-10-03 Hotlens.Com Inc. Transparent user and session management for web applications
AU2001249777A1 (en) * 2000-03-31 2001-10-15 Amikai, Inc. Method and apparatus for providing multilingual translation over a network
US6604101B1 (en) 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US20040006560A1 (en) * 2000-05-01 2004-01-08 Ning-Ping Chan Method and system for translingual translation of query and search and retrieval of multilingual information on the web
AU2001261636A1 (en) * 2000-05-16 2001-11-26 Mshift, Inc. System for providing network content to wireless devices
US7013340B1 (en) 2000-05-18 2006-03-14 Microsoft Corporation Postback input handling by server-side control objects
KR100373899B1 (ko) * 2000-05-23 2003-02-26 주식회사 시스메타 암호화된 데이터 처리 방법 및 시스템
AU2001274991A1 (en) * 2000-05-26 2001-12-11 Theone.Com System and method for providing interactive translation of information in a communication network
US20010054011A1 (en) * 2000-06-15 2001-12-20 Nec Corporation Contents conversion fee charging system, contents conversion fee charging method and storage medium storing program for controlling same
JP3982736B2 (ja) * 2000-06-30 2007-09-26 沖電気工業株式会社 翻訳システム
US6704776B1 (en) * 2000-06-30 2004-03-09 Webtv Networks, Inc. Selecting attribute based content for server applications
AU2000255730A1 (en) * 2000-07-04 2002-01-14 Aai Inc. Commerce method and device, system, and recorded medium
US7389221B1 (en) 2000-07-17 2008-06-17 Globalenglish Corporation System and method for interactive translation
US7266512B2 (en) 2000-07-18 2007-09-04 Cnet Networks, Inc. System and method for establishing business to business connections via the internet
JP2002041432A (ja) * 2000-07-25 2002-02-08 Oki Electric Ind Co Ltd チャットシステム,端末装置,サーバ装置及び媒体
US7571217B1 (en) 2000-08-16 2009-08-04 Parallel Networks, Llc Method and system for uniform resource locator transformation
US20020049831A1 (en) * 2000-09-01 2002-04-25 Lifefiles.Com,Inc. System for generating a web document
US8806326B1 (en) * 2000-09-25 2014-08-12 Nokia Inc. User preference based content linking
US20020161928A1 (en) * 2000-10-10 2002-10-31 Awele Ndili Smart agent for providing network content to wireless devices
US20020062396A1 (en) * 2000-10-31 2002-05-23 Mishou Co., Ltd. Server devices for displaying web pages
US20020087302A1 (en) * 2000-11-10 2002-07-04 Miyuki Tomaru Processing system, processing method and recording medium
US20020078152A1 (en) 2000-12-19 2002-06-20 Barry Boone Method and apparatus for providing predefined feedback
US20030115040A1 (en) * 2001-02-09 2003-06-19 Yue Xing International (multiple language/non-english) domain name and email user account ID services system
US20020123879A1 (en) * 2001-03-01 2002-09-05 Donald Spector Translation system & method
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US7380250B2 (en) 2001-03-16 2008-05-27 Microsoft Corporation Method and system for interacting with devices having different capabilities
US8298160B2 (en) * 2001-03-16 2012-10-30 Ev3 Inc. Wire convertible from over-the-wire length to rapid exchange length
US20060288212A1 (en) * 2001-03-20 2006-12-21 Gutenberg Printing Llc Transparent user and session management for web applications
US6993474B2 (en) 2001-05-17 2006-01-31 Curry David G Interactive conversational speech communicator method and system
US20020174150A1 (en) * 2001-05-18 2002-11-21 Xerox Corporation Systems and methods for dynamic national language service
US7493397B1 (en) 2001-06-06 2009-02-17 Microsoft Corporation Providing remote processing services over a distributed communications network
US6915454B1 (en) 2001-06-12 2005-07-05 Microsoft Corporation Web controls validation
US20030036976A1 (en) * 2001-08-14 2003-02-20 Kurt De Ruwe System and method for providing business transaction information in multiple languages
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
JP2003091344A (ja) * 2001-09-19 2003-03-28 Sony Corp 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
JP4283466B2 (ja) * 2001-10-12 2009-06-24 富士通株式会社 リンク関係に基づく文書整理方法
US20030084143A1 (en) * 2001-10-31 2003-05-01 Herbert Knoesel Resource locator management system and method
US7428725B2 (en) 2001-11-20 2008-09-23 Microsoft Corporation Inserting devices specific content
US6915341B2 (en) * 2002-01-08 2005-07-05 International Business Machines Corporation System for sending messages to all users in a web hosting environment
US20030144912A1 (en) * 2002-01-29 2003-07-31 Mcgee Todd Multilingual messaging system and method for e-commerce
US7987421B1 (en) * 2002-01-30 2011-07-26 Boyd H Timothy Method and apparatus to dynamically provide web content resources in a portal
US7890639B1 (en) 2002-01-30 2011-02-15 Novell, Inc. Method and apparatus for controlling access to portal content from outside the portal
JP3809863B2 (ja) * 2002-02-28 2006-08-16 インターナショナル・ビジネス・マシーンズ・コーポレーション サーバ
US7548847B2 (en) * 2002-05-10 2009-06-16 Microsoft Corporation System for automatically annotating training data for a natural language understanding system
US7490167B2 (en) * 2002-05-22 2009-02-10 Sony Corporation System and method for platform and language-independent development and delivery of page-based content
US20040003022A1 (en) * 2002-06-27 2004-01-01 International Business Machines Corporation Method and system for using modulo arithmetic to distribute processing over multiple processors
US7113960B2 (en) * 2002-08-22 2006-09-26 International Business Machines Corporation Search on and search for functions in applications with varying data types
US20040049374A1 (en) * 2002-09-05 2004-03-11 International Business Machines Corporation Translation aid for multilingual Web sites
US7236977B1 (en) 2002-09-20 2007-06-26 Novell, Inc. Method for dynamically distributing items for changes based on group membership
US7574653B2 (en) * 2002-10-11 2009-08-11 Microsoft Corporation Adaptive image formatting control
GB2395029A (en) * 2002-11-06 2004-05-12 Alan Wilkinson Translation of electronically transmitted messages
US7660843B1 (en) 2003-01-21 2010-02-09 Novell, Inc. Method and apparatus for dynamically delivering a gadget
FR2850473A1 (fr) * 2003-01-28 2004-07-30 France Telecom Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web
US7627817B2 (en) 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
CN1553584A (zh) * 2003-03-08 2004-12-08 多功能通讯装置
CN104683513A (zh) * 2003-03-08 2015-06-03 任文林 多功能通讯装置
US8170863B2 (en) * 2003-04-01 2012-05-01 International Business Machines Corporation System, method and program product for portlet-based translation of web content
US7313587B1 (en) 2003-07-14 2007-12-25 Microsoft Corporation Method and apparatus for localizing Web applications
US7346487B2 (en) * 2003-07-23 2008-03-18 Microsoft Corporation Method and apparatus for identifying translations
US7496497B2 (en) * 2003-12-18 2009-02-24 Taiwan Semiconductor Manufacturing Co., Ltd. Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item
US7543270B1 (en) * 2004-01-23 2009-06-02 The Math Works, Inc. Tracing output descriptions generated from corresponding input descriptions
US20050198573A1 (en) * 2004-02-24 2005-09-08 Ncr Corporation System and method for translating web pages into selected languages
US7890604B2 (en) 2004-05-07 2011-02-15 Microsoft Corproation Client-side callbacks to server events
US9026578B2 (en) 2004-05-14 2015-05-05 Microsoft Corporation Systems and methods for persisting data between web pages
US7464386B2 (en) 2004-05-17 2008-12-09 Microsoft Corporation Data controls architecture
US7562008B2 (en) * 2004-06-23 2009-07-14 Ning-Ping Chan Machine translation method and system that decomposes complex sentences into two or more sentences
US7853473B2 (en) 2004-08-31 2010-12-14 Revionics, Inc. Market-based price optimization system
US7509318B2 (en) * 2005-01-28 2009-03-24 Microsoft Corporation Automatic resource translation
US20060206797A1 (en) * 2005-03-08 2006-09-14 Microsoft Corporation Authorizing implementing application localization rules
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
WO2006098019A1 (ja) * 2005-03-16 2006-09-21 Visionarts, Inc. メニューバープログラム
US8249854B2 (en) * 2005-05-26 2012-08-21 Microsoft Corporation Integrated native language translation
US7543189B2 (en) * 2005-06-29 2009-06-02 International Business Machines Corporation Automated multilingual software testing method and apparatus
US20070088732A1 (en) * 2005-10-13 2007-04-19 Yen-Fu Chen Dynamic string length checking for off-line processing using client-side caching of database catalog
US7603365B2 (en) * 2005-10-13 2009-10-13 International Business Machines Corporation System and method for capture and processing of overflow characters from user input
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US7822596B2 (en) * 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
WO2007124109A2 (en) * 2006-04-21 2007-11-01 Scomm, Inc. Interactive conversational speech communicator method and system
US7801721B2 (en) 2006-10-02 2010-09-21 Google Inc. Displaying original text in a user interface with translated text
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US20080178081A1 (en) * 2007-01-22 2008-07-24 Eran Reshef System and method for guiding non-technical people in using web services
US20090287514A1 (en) * 2007-03-16 2009-11-19 Alliance Of Professionals & Consultants, Inc. Rapid candidate opt-in confirmation system
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US20090013268A1 (en) * 2007-07-02 2009-01-08 Universal Ad Ltd. Creation Of Visual Composition Of Product Images
US9201870B2 (en) * 2008-01-25 2015-12-01 First Data Corporation Method and system for providing translated dynamic web page content
US7698688B2 (en) * 2008-03-28 2010-04-13 International Business Machines Corporation Method for automating an internationalization test in a multilingual web application
CN101615181B (zh) * 2008-06-27 2012-05-16 国际商业机器公司 创建国际化网络应用的系统和方法
EP2150008B1 (en) 2008-08-01 2012-02-01 Research In Motion Limited Electronic mail system providing message character set formatting features and related methods
CN101661480B (zh) * 2008-08-29 2012-08-08 国际商业机器公司 确定组织在不同语言中的名称的方法和系统
KR101579978B1 (ko) * 2009-03-10 2015-12-24 엘지전자 주식회사 웹페이지 표시방법 및 이를 적용한 이동 통신 단말기
WO2010105383A1 (en) * 2009-03-18 2010-09-23 Google Inc. Web translation with display replacement
US10671698B2 (en) 2009-05-26 2020-06-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US9405745B2 (en) * 2009-06-01 2016-08-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
RU2009144948A (ru) * 2009-12-03 2011-06-10 Виталий Евгеньевич Пилкин (RU) Система улучшения автоматизированного перевода информации
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8280954B2 (en) 2010-03-25 2012-10-02 Scomm, Inc. Method and system for providing live real-time communication via text between mobile user devices
US9356991B2 (en) 2010-05-10 2016-05-31 Litera Technology Llc Systems and methods for a bidirectional multi-function communication module
US8635205B1 (en) * 2010-06-18 2014-01-21 Google Inc. Displaying local site name information with search results
US9465782B2 (en) 2010-07-13 2016-10-11 Motionpoint Corporation Dynamic language translation of web site content
US20120072831A1 (en) * 2010-09-16 2012-03-22 Gemtek Technology Co., Ltd Method for creating a multi-lingual web page
JP5908213B2 (ja) * 2011-02-28 2016-04-26 ブラザー工業株式会社 通信装置
US8843360B1 (en) * 2011-03-04 2014-09-23 Amazon Technologies, Inc. Client-side localization of network pages
CN102722479B (zh) * 2011-03-30 2015-11-04 腾讯科技(深圳)有限公司 一种实现语言翻译的方法及装置
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
JP5875675B2 (ja) 2011-05-05 2016-03-02 オルツボ, インコーポレイテッド 近接するモバイルデバイス間の言語間通信
CN102811140B (zh) 2011-05-31 2015-04-08 国际商业机器公司 测试基于浏览器的应用的方法和系统
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
WO2013086666A1 (en) * 2011-12-12 2013-06-20 Google Inc. Techniques for assisting a human translator in translating a document including at least one tag
US8942973B2 (en) * 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
CN102662935A (zh) * 2012-04-08 2012-09-12 北京语智云帆科技有限公司 一种交互式的机器翻译方法和机器翻译系统
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
JP2014059766A (ja) * 2012-09-18 2014-04-03 Sharp Corp 画像処理装置、画像形成装置、プログラム、記録媒体
JP5708608B2 (ja) * 2012-10-04 2015-04-30 コニカミノルタ株式会社 ブラウザプログラム
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9342503B1 (en) * 2013-03-12 2016-05-17 Amazon Technologies, Inc. Correlation across languages
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9639526B2 (en) * 2014-01-10 2017-05-02 Microsoft Technology Licensing, Llc Mobile language translation of web content
US20160004697A1 (en) * 2014-07-05 2016-01-07 Maurice H.P.M. van Putten Bilingual Search Engine for Mobile Devices
WO2016018004A1 (en) * 2014-07-31 2016-02-04 Samsung Electronics Co., Ltd. Method, apparatus, and system for providing translated content
US10380656B2 (en) 2015-02-27 2019-08-13 Ebay Inc. Dynamic predefined product reviews
CN105760542B (zh) * 2016-03-15 2022-07-29 腾讯科技(深圳)有限公司 一种显示控制方法、终端及服务器
SG11201808470QA (en) * 2016-04-04 2018-10-30 Wovn Technologies Inc Translation system
CN108345589A (zh) * 2017-11-22 2018-07-31 语联网(武汉)信息技术有限公司 一种全原文参考的在线翻译方法
CN107943797A (zh) * 2017-11-22 2018-04-20 语联网(武汉)信息技术有限公司 一种全原文参考的在线翻译系统
US11258872B1 (en) * 2020-12-10 2022-02-22 Amazon Technologie, Inc. Techniques for accelerating page rendering

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03268062A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd 機械翻訳電子メール装置における私用単語の登録装置
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
JPH0668144A (ja) * 1992-08-14 1994-03-11 Fujitsu Ltd 電子ニュース翻訳配送装置
US5568383A (en) * 1992-11-30 1996-10-22 International Business Machines Corporation Natural language translation system and document transmission network with translation loss information and restrictions
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置
US5715466A (en) * 1995-02-14 1998-02-03 Compuserve Incorporated System for parallel foreign language communication over a computer network
JPH0981569A (ja) * 1995-09-12 1997-03-28 Hitachi Ltd 多カ国対応サービス提供システム
US5764906A (en) * 1995-11-07 1998-06-09 Netword Llc Universal electronic resource denotation, request and delivery system
US5987401A (en) * 1995-12-08 1999-11-16 Apple Computer, Inc. Language translation for real-time text-based conversations
US5944790A (en) * 1996-07-19 1999-08-31 Lucent Technologies Inc. Method and apparatus for providing a web site having a home page that automatically adapts to user language and customs
US5884246A (en) * 1996-12-04 1999-03-16 Transgate Intellectual Properties Ltd. System and method for transparent translation of electronically transmitted messages

Also Published As

Publication number Publication date
JP3121548B2 (ja) 2001-01-09
US6119078A (en) 2000-09-12
SG54551A1 (en) 1998-11-16
CN1148685C (zh) 2004-05-05
KR19980032309A (ko) 1998-07-25
KR100265548B1 (ko) 2000-09-15
GB9721481D0 (en) 1997-12-10
GB2320773A (en) 1998-07-01
CN1179576A (zh) 1998-04-22
JPH10134052A (ja) 1998-05-22

Similar Documents

Publication Publication Date Title
TW315437B (en) Machine translation method and device
US7016977B1 (en) Method and system for multilingual web server
TW552527B (en) Method and system for the international support of Internet web pages
US7685135B2 (en) Database facility for XML server pages language
US6393462B1 (en) Method and apparatus for automatic downloading of URLs and internet addresses
KR100702550B1 (ko) 밀집된 하이퍼링크를 갖는 영역을 리포맷하는 방법
US20170147560A1 (en) Interactive translation tool
US20050137873A1 (en) Method and system for multi-language web homepage selection process
US20090287471A1 (en) Support for international search terms - translate as you search
KR20040068105A (ko) 네트워크에서 동적 정보를 전달하기 위한 방법 및 시스템
CN101106577B (zh) 用于在异构环境中管理基于服务器转译消息的方法和系统
JP2001290812A (ja) Webページの配信方法、Webサーバーシステム、並びに、記録媒体
JP2006127531A (ja) ネットワークの情報を高速で取得する方法、及びそのシステム
JP2002091963A (ja) 機械翻訳システム
Cavalier Perspectives on machine translation of patent information
KR20000049891A (ko) 구조화된 데이터를 이용한 전자 출판 시스템 및 서비스 방법
Aumack Computers for Non-Writers.
Sérasset A generic collaborative platform for multilingual lexical database development
KR20020045596A (ko) 웹 브라우저 또는 기타 응용프로그램에 삽입되어 실행되는멀티검색 도구 및 그것을 활용한 인터넷 비즈니스 방법
KR20010113145A (ko) 매뉴얼 제공 서버 시스템 및 그 매뉴얼 제공 방법
Freire Using wrappers for device independent web access: Opportunities, challenges and limitations
Cheng et al. Development of a Web-based Translator
KR100563959B1 (ko) 전자원문 관련정보 제공 시스템 및 방법
Marson et al. Translation websites
KR20010088527A (ko) 번역 소프트웨어의 인터넷 웹 문서 쌍방향 번역 처리방법및 이 번역 소프트웨어를 탑재한 기록매체

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees