TW201426343A - 翻譯系統及其翻譯方法 - Google Patents

翻譯系統及其翻譯方法 Download PDF

Info

Publication number
TW201426343A
TW201426343A TW101150021A TW101150021A TW201426343A TW 201426343 A TW201426343 A TW 201426343A TW 101150021 A TW101150021 A TW 101150021A TW 101150021 A TW101150021 A TW 101150021A TW 201426343 A TW201426343 A TW 201426343A
Authority
TW
Taiwan
Prior art keywords
translation
image
unit
results
data
Prior art date
Application number
TW101150021A
Other languages
English (en)
Inventor
Chun-Yuan Sun
Chi-Wen Chen
Original Assignee
Foxlink Image Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foxlink Image Tech Co Ltd filed Critical Foxlink Image Tech Co Ltd
Priority to TW101150021A priority Critical patent/TW201426343A/zh
Publication of TW201426343A publication Critical patent/TW201426343A/zh

Links

Landscapes

  • Machine Translation (AREA)

Abstract

一種翻譯系統及其方法,翻譯系統連接至少兩個翻譯服務提供者,包含:一影像擷取單元用以擷取原稿文件的影像資料,一影像辨識單元接收原稿文件的影像資料並轉換為文字資料,文字資料分別傳遞到至少兩個翻譯服務提供者進行翻譯,以及一比對單元接收翻譯服務提供者產生的翻譯結果,並選出最佳的翻譯結果。藉此,使用者無需自行將文件輸入亦可進行全文翻譯,且藉著自動比對以及同步顯示各個翻譯結果,能讓使用者能夠以最短的時間了解最佳翻譯的結果。

Description

翻譯系統及其翻譯方法
  本發明涉及一種使用機器進行翻譯的系統,尤指一種利用雲端伺服器進行全文翻譯的系統及其方法。
  在國際化的趨勢下,全世界的資料交流日趨頻繁。因此在現今的社會環境下常需接觸各種國外文件,但對於許多外語能力較差的使用者而言,閱讀國外文件之前需要花費相當多的時間進行查詢及翻譯以了解文件的內容。
  為了提升使用者查詢及翻譯的速度,市面上已有多種輔助工具可供使用者利用。例如掃描式翻譯筆便可對文件加以掃描,並利用翻譯筆內建的光學文字辨識模組以及字典資料庫來提供逐字翻譯功能。而在智慧型手機逐漸普及後也有利用智慧型手機拍攝要翻譯的文件頁面並進行光學文字辨識後,接著上傳到雲端伺服器查詢單字翻譯者。
  透過上述掃描或攝影的手段自動擷取文件內容,可以有效提升使用者翻譯文件的速度。但手持式的裝置受限於其資料儲存量或是運算效能等因素;因此所能提供的翻譯語言有限,且普遍缺乏全文翻譯功能,使用上仍有諸多不便。
  另外,許多網路服務提供者都有提供線上的翻譯服務,不但可以進行全文翻譯,更可以根據輸入的文字自行判斷該以何種語言進行翻譯。但是使用者就必須自行輸入要翻譯的內容,當使用者對該份國外文件所使用的語言不熟悉時將花費相當多的時間進行輸入。且機器進行全文翻譯的準確度仍有加強空間,因此在機器翻譯之後使用者仍需花費許多時間反覆校閱才能了解文件的內容。
  有鑑於上述缺點,既有的翻譯裝置實有必要加以改良。
  本發明之目的是提供一種快速令使用者了解最佳翻譯結果的翻譯系統及其翻譯方法。
  爲了達成上述目的,本發明之翻譯系統連接至少兩個位於雲端的翻譯服務提供者,其包含一影像擷取單元,擷取一原稿文件的影像資料;一資料傳輸單元,與翻譯服務提供者之間傳遞或接收資料;一比對單元,比對由多個翻譯服務提供者產生的翻譯結果並選出最佳的翻譯結果;及一顯示單元,顯示原稿文件的影像資料,各個翻譯結果以及最佳翻譯。
  翻譯系統還包括一影像接合單元,拼合由影像擷取單元逐步取得的影像內容以成一完整的圖檔影像。
  在一可行實施例中,翻譯系統還包括一影像辨識單元,設置於雲端的伺服器中以接收影像資料並轉換為文字資料。
  在另一可行實施例中,翻譯系統還包括一影像辨識單元,設置於用戶端的個人運算裝置中以接收影像資料並轉換為文字資料。
  在又一可行實施例中,所述影像擷取單元為掃描裝置、攝影裝置或滑鼠其中之一。
  爲了達成上述目的,本發明之翻譯方法包含以下步驟:使用影像擷取單元擷取原稿文件的影像資料;將原稿文件的影像資料傳遞至影像辨識單元,使影像資料轉換為文字資料;將轉換後的文字資料分別傳遞至多個翻譯服務提供者進行翻譯;比對多個翻譯服務提供者產生的翻譯結果,並選出最佳的翻譯結果。
  翻譯方法還包含;將文件原文、各個翻譯結果以及最佳翻譯同時顯示在顯示單元。
  決定最佳翻譯的方法包含以下步驟:將各個翻譯結果以標點符號為依據分成數個句子,並依照句子出現在翻譯結果中的順序加以編號;接著將不同翻譯結果中編號相同的句子互相比對,並統計相同字詞出現在不同翻譯結果之間的次數;將具有較多關鍵字重複出現次數的翻譯結果定為最佳翻譯。
  顯示翻譯結果的方式是將各個翻譯結果以並列的方式共同顯示於顯示單元的中央區段,而文件原文以及最佳翻譯則分別顯示在顯示單元的上方區段以及下方區段。
  本發明的特點在於以掃描或攝影等方式擷取原稿文件的影像資料並進行光學文字辨識(OCR)後,上傳至多個不同的全文翻譯服務提供者的網路伺服器進行全文翻譯,以節省使用者輸入及查詢單字的時間。而且在接收各組翻譯資料後予以互相比對,以從中選擇出最佳翻譯。並將各個翻譯結果以水平並列的方式共同顯示於螢幕中央區段,方便使用者相互比對。而文件原文以及較佳翻譯則分別顯示在螢幕的上方區段及下方區段,讓使用者能夠以最短的時間了解最佳翻譯的結果。
  為詳細說明本發明之技術內容、構造特徵、所達成目的及功效,以下茲舉例並配合圖式詳予說明。
  請參閱第一圖與第二圖,係本發明翻譯系統的第一實施例,其包含影像擷取單元10、影像接合單元60、影像識別單元20、資料傳輸單元30及多個翻譯服務提供者40。影像擷取單元10設為具掃描功能的滑鼠11。在該滑鼠11底部設有接近式影像掃描模組(圖未示)以及一啟動開關12,當使用者觸動啟動開關12後,該接近式影像掃描裝置便開始擷取影像。此時使用者可移動滑鼠11通過原稿文件90表面,並逐步取得原稿文件90的影像內容。
  由滑鼠11掃描取得的影像內容將被傳送到影像接合單元60之中以拼合成完整的圖檔影像,接著再利用影像識別單元20進行光學文字識別(OCR),將圖檔影像轉換為文字資料。在本實施例中,影像接合單元60及影像識別單元20皆設置於一個人電腦內,且滑鼠11以有線或無線的方式連接個人電腦,以傳送掃描取得的影像內容。
  待整份原稿文件完成轉換後,再透過內建於個人電腦中的資料傳輸單元30將掃描取得的文字資料上傳至位在雲端的多個翻譯服務提供者40以進行全文翻譯。透過翻譯服務提供者辨識原稿文件中的語言類型並加以翻譯,而翻譯完成的翻譯結果再通過通訊網路回傳至個人電腦,並顯示於個人電腦的顯示單元50(螢幕)上。
  然而,本發明中的影像擷取單元10並不限制為滑鼠11或掃描裝置,且影像辨識單元20亦不以設置於個人電腦等用戶端的個人運算裝置內為限。如第三圖所示,在第二實施例中,上述影像擷取單元10為一攝影模組。該攝影模組裝設於一手持電子裝置70上,並能夠將原稿文件拍攝為圖檔影像。由於手持電子裝置可能受限於運算能力不足而不便於進行光學文字識別,因此將圖檔影像透過手持電子裝置70內建的資料傳輸單元30上傳至一具有影像辨識單元20的伺服器,透過該伺服器將圖檔影像轉換為文字資料,接著再將文字資料分別傳送至不同翻譯服務提供者40進行全文翻譯。以取得不同的翻譯結果。
  請參閱第四圖,本發明的翻譯方法包含以下步驟:
  首先,使用影像擷取單元10擷取原稿文件的影像資料。接著將原稿文件的影像資料傳遞至影像辨識單元20進行辨識,透過影像辨識單元20將圖檔格式的影像資料轉換為文字資料。接著將文字資料分別傳遞至多個翻譯服務提供者40,所述各翻譯服務提供者40分別具有不同的翻譯資料庫,因此將取得不同的翻譯結果。待取得各個翻譯服務提供者40的翻譯結果之後,最後再比對多個翻譯服務提供者產生的翻譯結果,並推選出最佳翻譯。並將原稿影像,各種不同的翻譯結果以及最佳翻譯結果一併顯示在顯示單元50上供使用者確認。藉此,使用者能夠簡單而快速的將一份文件全文翻譯為熟悉的語言。
  請參閱第五圖,在上述翻譯方法中,將所有翻譯結果相互比對並推選出最佳翻譯的一可行步驟如下:在接收到各個翻譯服務提供者40的翻譯結果之後,首先以標點符號91為依據,將各個翻譯結果的整篇文章斷成複數個句子,並對句子編號排序。在本實施例中利用標點符號91進行斷句後,產生一第一句子92以及一第二句子93。
  接著將不同翻譯結果中編號相同的句子互相比對,並統計相同字詞出現在不同翻譯結果之間的次數。則具有最多相同字詞出現次數的翻譯結果便是較佳翻譯。最後,把文件原文,不同的翻譯結果以及最佳翻譯一併顯示以供使用者確認。
  請參閱第六圖,在顯示翻譯結果時,為了方便使用者比對不同的翻譯結果,回傳至個人電腦的各個翻譯結果以水平並列的方式共同顯示於顯示單元50的中央區段52,以方便使用者相互比對。而文件原文則顯示在顯示單元的上方區段51,並把較佳翻譯顯示在顯示單元的下方區段53,讓使用者能夠以最短的時間了解翻譯的結果。
  綜上所述,本發明特點在於以掃描或攝影等方式擷取原稿文件的影像資料並進行光學文字辨識(OCR)後,上傳至多個不同的全文翻譯服務提供者40的網路伺服器進行全文翻譯,以節省使用者輸入單字及查詢單字的時間。而且在接收各組翻譯資料後予以互相比對,以從中選擇出較佳翻譯。並將各個翻譯結果以水平並列的方式共同顯示於顯示單元50的中央區段52,方便使用者相互比對。而文件原文以及較佳翻譯則分別顯示在顯示單元的上方區段51以及下方區段53,讓使用者能夠以最短的時間了解最佳翻譯的結果。
10...影像擷取單元
11...滑鼠
12...啟動開關
20...影像辨識單元
30...資料傳輸單元
40...翻譯服務提供者
50...顯示單元
51...上方區段
52...中央區段
53...下方區段
60...影像接合單元
70...手持電子裝置
90...原稿文件
91...標點符號
92...第一句子
93...第二句子
第一圖係本發明之步驟流程圖。
第二圖係本發明一實施例之元件示意圖。
第三圖係以本發明擷取原稿文件影像之示意圖。
第四圖係本發明另一實施例之元件方塊圖。
第五圖係將翻譯結果分段為句子之示意圖。
第六圖係本發明顯示翻譯結果之介面示意圖。
10...影像擷取單元
11...滑鼠
12...啟動開關
20...影像辨識單元
30...資料傳輸單元
40...翻譯服務提供
50...顯示單元
60...影像接合單元

Claims (9)

  1. 一種翻譯方法,包含下列步驟:
      使用影像擷取單元擷取原稿文件的影像資料;
      將原稿文件的影像資料傳遞至影像辨識單元,使影像資料轉換為文字資料;
      將轉換後的文字資料分別傳遞至多個翻譯服務提供者進行翻譯;及
      比對多個翻譯服務提供者產生的翻譯結果,並選出最佳翻譯。
  2. 如申請專利範圍第1項所述之翻譯方法,還包括將文件原文、各個翻譯結果以及最佳翻譯同時顯示在顯示單元。
  3. 如申請專利範圍第2項所述之翻譯方法,其中,決定最佳翻譯的方法包含以下步驟:
      將各個翻譯結果以標點符號為依據分成數個句子,並依照句子出現在翻譯結果中的順序加以編號;
      接著將不同翻譯結果中編號相同的句子互相比對,並統計相同字詞出現在不同翻譯結果之間的次數;及
      將具有較多關鍵字重複出現次數的翻譯結果定為最佳翻譯。
  4. 如申請專利範圍第2項所述之翻譯方法,其中,顯示翻譯結果的方式是將各個翻譯結果以並列的方式共同顯示於顯示單元的中央區段,而文件原文以及較佳翻譯則分別顯示在顯示單元的上方區段以及下方區段。
  5. 一種翻譯系統,連接至少兩個位於雲端的翻譯服務提供者,包含:
      一影像擷取單元,擷取一原稿文件的影像資料;
      一資料傳輸單元,與翻譯服務提供者之間傳遞或接收資料;
      一比對單元,比對由多個翻譯服務提供者產生的翻譯結果並選出最佳的翻譯結果;及
      一顯示單元,顯示原稿文件的影像資料,各個翻譯結果以及最佳翻譯。
  6. 如申請專利範圍第5項所述之翻譯系統,其中還包括一影像接合單元,拼合由影像擷取單元逐步取得的影像內容以形成一完整的圖檔影像。
  7. 如申請專利範圍第5項所述之翻譯系統,其中還包括一影像辨識單元,設置於一雲端的伺服器中以接收影像資料並轉換為文字資料。
  8. 如申請專利範圍第5項所述之翻譯系統,其中還包括一影像辨識單元,設置於一用戶端的個人運算裝置中以接收影像資料並轉換為文字資料。
  9. 如申請專利範圍第5項所述之翻譯系統,其中所述影像擷取單設為一掃描裝置或一攝影裝置或一滑鼠。
TW101150021A 2012-12-26 2012-12-26 翻譯系統及其翻譯方法 TW201426343A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW101150021A TW201426343A (zh) 2012-12-26 2012-12-26 翻譯系統及其翻譯方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW101150021A TW201426343A (zh) 2012-12-26 2012-12-26 翻譯系統及其翻譯方法

Publications (1)

Publication Number Publication Date
TW201426343A true TW201426343A (zh) 2014-07-01

Family

ID=51725506

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101150021A TW201426343A (zh) 2012-12-26 2012-12-26 翻譯系統及其翻譯方法

Country Status (1)

Country Link
TW (1) TW201426343A (zh)

Similar Documents

Publication Publication Date Title
JP6674942B2 (ja) インタラクションを用いたメッセンジャー検索方法、ならびに、これを実現したサーバおよびアプリケーション
WO2013004036A1 (zh) 结合文字识别和图像匹配的名片识别方法
JP2008192055A (ja) コンテンツ検索方法、およびコンテンツ検索装置
CN104537339A (zh) 信息识别方法和信息识别系统
JP2009070240A (ja) 文書管理サーバーから文書データを取得するためのシステムおよび方法
JP6287373B2 (ja) 画像保存検索システム
TW200910875A (en) Method and system for instantly translating text within an image
CN106326332A (zh) 检索装置以及检索方法
WO2019056489A1 (zh) 图片展示方法、装置、终端和存储介质
US20140249798A1 (en) Translation system and translation method thereof
JP6253354B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
TW201629802A (zh) 資訊搜索系統及方法
JP5484113B2 (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP2004038840A (ja) メモ画像管理装置、メモ画像管理システムおよびメモ画像管理方法
JP2008191936A (ja) コンテンツ登録・検索システムの構築支援方法、およびコンテンツ登録・検索システムの構築支援装置
JP2014137654A (ja) 翻訳システム及びその翻訳方法
US20150039643A1 (en) System for storing and searching image files, and cloud server
JP2010176387A (ja) 電子スクラップシステム、電子スクラップ方法、電子スクラップサーバ、および利用者端末
US11010978B2 (en) Method and system for generating augmented reality interactive content
TW201426343A (zh) 翻譯系統及其翻譯方法
CN103914446A (zh) 翻译方法及翻译系统
KR20100124952A (ko) 문자인식을 이용한 휴대형 단말기의 증강현실 기반 실시간 ar컨텐츠 제공시스템 및 그 방법
JP2009217742A (ja) メタデータ付与方法及び装置、並びにメタデータ付与プログラム
KR101659886B1 (ko) 명함 주문 시스템 및 방법
JP6902764B1 (ja) メタデータ抽出プログラム