TWI595368B - Server device, server device control method, program, and recording medium - Google Patents

Server device, server device control method, program, and recording medium Download PDF

Info

Publication number
TWI595368B
TWI595368B TW101115283A TW101115283A TWI595368B TW I595368 B TWI595368 B TW I595368B TW 101115283 A TW101115283 A TW 101115283A TW 101115283 A TW101115283 A TW 101115283A TW I595368 B TWI595368 B TW I595368B
Authority
TW
Taiwan
Prior art keywords
image
area
specified
image processing
information
Prior art date
Application number
TW101115283A
Other languages
English (en)
Other versions
TW201250499A (en
Inventor
Soh Masuko
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Publication of TW201250499A publication Critical patent/TW201250499A/zh
Application granted granted Critical
Publication of TWI595368B publication Critical patent/TWI595368B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Character Discrimination (AREA)

Description

伺服器裝置、伺服器裝置之控制方法、程式、及記錄媒體
本發明係關於伺服器裝置、伺服器裝置之控制方法、程式、及記錄媒體,尤其係關於圖像內之文字行之翻譯者。
自先前以來,已知有各種翻譯工具,存在使用該等翻譯工具,要求包含含有文字之圖像之WEB頁面之翻譯之情形。為翻譯圖像中所含之文字,首先需要對圖像中所含之文字進行文字辨識。然後,藉由文字辨識特定文字後,將該文字向目的語言翻譯。但文字辨識處理需要某程度之時間,因此有即時翻譯較困難之問題。為對應如此問題,提出有各種方法。例如專利文獻1中揭示有使包含文字之圖像與翻譯用文字行對應記憶,翻譯含文字之圖像時,提示該文字行之翻譯結果之機械翻譯系統。
先前技術文獻 專利文獻
專利文獻1:日本專利4658236號公報
另一方面,亦期望不準備翻譯用文字行,盡可能直接翻譯圖像內之文字。
本發明係解決如上問題者,其目的係提供一種適合即時翻譯WEB頁面內之圖像之文字之伺服器裝置、伺服器裝置之控制方法、程式及記錄媒體。
本發明之第1觀點之伺服器裝置之特徵在於具備:請求接收部,其從終端機接收指定有圖像之識別資訊與對於圖像處理之參數之請求;圖像處理部,其基於前述接收之請求中所指定之識別資訊獲取圖像,使用前述接收之請求中所指定之參數對前述獲取之圖像套用前述圖像處理,藉此輸出從該圖像內擷取之擷取資訊;及應答發送部,其將指定有由前述圖像處理部輸出之擷取資訊之應答向前述終端機發送;且當擷取前述擷取資訊時,前述圖像處理部與相對於該擷取資訊之圖像之識別資訊及參數對應而快取該擷取之擷取資訊,已快取與前述接收之請求中所指定之識別資訊及參數對應之擷取資訊之情形時,前述圖像處理部取代前述圖像之獲取及前述圖像處理之套用,獲得前述已快取之擷取資訊,並輸出該獲得之擷取資訊。
上述觀點之伺服器裝置之特徵在於:前述請求中所指定之參數包含指定區域,利用前述圖像處理部之圖像處理中,包含對前述圖像內之前述參數所含之指定區域進行文字辨識,藉此輸出從該圖像內之該指定區域所辨識之辨識完文字行之擷取處理,當擷取前述辨識完文字行時,前述圖像處理部與相對於該辨識完文字行之圖像之識別資訊及指定區域對應而快取 該辨識完文字行,已快取與前述接收之請求中所指定之識別資訊及參數所含之指定區域對應之辨識完文字行之情形時,前述圖像處理部取代前述文字辨識,獲得前述已快取之辨識完文字行,並輸出該獲得之辨識完文字行;前述擷取資訊包含前述辨識完文字行。
又,上述觀點之伺服器裝置之特徵在於:當在快取前述辨識完文字行時對應之識別資訊與前述接收之請求中所指定之識別資訊一致,且快取前述辨識完文字行時對應之指定區域與前述接收之請求中所指定之參數所含之指定區域重複之情形時,前述圖像處理部判定已快取與前述接收之請求中所指定之識別資訊及參數所含之指定區域對應之擷取資訊。
又,上述觀點之伺服器裝置之特徵在於:當擷取前述辨識完文字行時,前述圖像處理部將前述指定區域修正成在前述指定區域內辨識該辨識完文字行之辨識區域後,快取該辨識完文字行。
又,上述觀點之伺服器裝置之特徵在於:前述請求中所指定之參數包含辨識用語言,利用前述圖像處理部之文字辨識係藉由辨識用語言進行。
又,上述觀點之伺服器裝置之特徵在於:前述請求中所指定之參數包含轉換資訊,利用前述圖像處理部之圖像處理中,包含對前述輸出之 辨識完文字行使用前述接收之請求中所包含之參數所含之轉換資訊進行轉換處理,藉此輸出從該辨識完文字行轉換後之轉換完文字行之轉換處理;前述擷取資訊包含前述轉換完文字行。
又,上述觀點之伺服器裝置之特徵在於:當擷取前述轉換完文字行時,前述圖像處理部與相對於前述轉換完文字行之圖像之識別資訊、指定區域、辨識用語言、辨識完文字行、以及轉換資訊對應,而快取該轉換完文字行,已快取與前述接收之請求中所指定之識別資訊、指定區域、辨識用語言、以及對於轉換資訊之轉換完文字行之情形時,前述圖像處理部取代前述轉換處理,獲得前述已快取之轉換完文字行,並輸出該獲得之轉換完文字行。
又,上述觀點之伺服器裝置之特徵在於:前述轉換處理係藉由將前述辨識完文字行翻譯成前述轉換資訊所指定之翻譯後語言,而獲得前述轉換完文字行。
又,上述觀點之伺服器裝置之特徵在於進而具備:詢問接收部,其從前述終端機接收指定有圖像之識別資訊之詢問;及回答發送部,其在未快取與前述接收之詢問中所指定之識別資訊對應之擷取資訊之情形時,將指定有促使發送指定有圖像之識別資訊與圖像處理之參數的請求之訊息之回答向前述終端機發送,而在已快取與前述接收之詢問中所 指定之識別資訊對應之擷取資訊之情形時,將指定有該擷取資訊之回答向前述終端機發送。
又,上述觀點之伺服器裝置之特徵在於進而具備:詢問接收部,其從前述終端機接收指定有圖像之識別資訊與該圖像內之位置之詢問;及回答發送部,其在由前述圖像處理部已快取與前述接收之詢問中所指定之識別資訊,及包含前述接收之詢問中所指定之位置之指定區域對應之辨識完文字行之情形時,將指定有前述已快取之辨識完文字行之回答向前述終端機發送。
又,上述觀點之伺服器裝置之特徵在於其進而具備:詢問接收部,其從前述終端機接收指定有圖像之識別資訊、該圖像內之位置、轉換資訊之詢問;回答發送部,其在由前述圖像處理部已快取與前述接收之詢問中所指定之識別資訊、轉換資訊、及包含前述接收之詢問中所指定之位置之指定區域對應之轉換完文字行之情形時,將前述回答中指定有該已快取之轉換完文字行之回答向前述終端機發送。
本發明之第2觀點之程式之特徵在於:其係供具備將由識別資訊識別之圖像顯示於畫面上之顯示部、且可與如上述觀點之伺服器裝置通信之電腦執行者,該程式使該電腦作為以下機構而發揮功能:位置檢測部,其檢測顯示於前述畫面上之圖像內之位置之選擇; 詢問發送部,其於檢測前述位置之選擇時,將指定有前述識別資訊、該經選擇之位置之詢問向前述伺服器裝置發送;及回答接收部,其從前述伺服器裝置接收回答;且該程式使該電腦以使前述顯示部於前述畫面上進而顯示前述接收之回答中所指定之擷取資訊之方式發揮功能;且該程式使該電腦作為以下機構而發揮功能:區域檢測部,其檢測顯示於前述畫面上之圖像內之區域之選擇;設定部,其促使圖像處理用參數之設定;請求發送部,其於檢測前述區域之選擇時,將指定有前述識別資訊、前述設定之參數、該選擇之區域之請求向前述伺服器裝置發送;及應答接收部,其從前述伺服器裝置接收應答;且該程式使該電腦以使前述顯示部於前述畫面上進而顯示前述接收之應答中所指定之擷取資訊之方式發揮功能。
本發明之第3觀點之伺服器裝置之控制方法之特徵在於具備:請求接收步驟,其從終端機接收指定有圖像之識別資訊及對於圖像處理之參數之請求;圖像處理步驟,其基於前述接收之請求中所指定之識別資訊獲取圖像,使用前述接收之請求中所指定之參數對前述獲取之圖像套用前述圖像處理,藉此輸出從該圖像內擷取之擷取資訊;及 應答發送步驟,其將指定前述輸出之擷取資訊之應答向前述終端機發送;且前述圖像處理步驟中,當擷取前述擷取資訊時,與相對於該擷取資訊之圖像之識別資訊及參數對應而快取該擷取之擷取資訊,已快取與前述接收之請求中所指定之識別資訊及參數對應之擷取資訊之情形時,取代前述圖像之獲取及前述圖像處理之套用,獲得前述快取之擷取資訊,並輸出該獲得之擷取資訊。
本發明之第4觀點之程式之特徵在於:使電腦作為以下機構而發揮功能:請求接收部,其從終端機接收指定有圖像之識別資訊與對於圖像處理之參數之請求;圖像處理部,其基於前述接收之請求中所指定之識別資訊獲取圖像,使用前述接收之請求中所指定之參數對前述獲取之圖像套用前述圖像處理,藉此輸出從該圖像內擷取之擷取資訊;及應答發送部,其將指定由前述圖像處理部輸出之擷取資訊之應答向前述終端機發送;且當擷取前述擷取資訊時,前述圖像處理部與相對於該擷取資訊之圖像之識別資訊及參數對應而快取該擷取之擷取資訊,已快取與前述接收之請求中所指定之識別資訊及參數對應之擷取資訊之情形時,前述圖像處理部係取代前述圖像 之獲取及前述圖像處理之套用,獲得前述已快取之擷取資訊,並輸出該獲得之擷取資訊。
本發明之第5觀點之電腦可讀取之記錄媒體之特徵在於:其記錄程式,該程式使電腦作為以下機構而發揮功能:請求接收部,其從終端機接收指定有圖像之識別資訊與對於圖像處理之參數之請求;圖像處理部,其基於前述接收之請求中所指定之識別資訊獲取圖像,使用前述接收之請求中所指定之參數對前述獲取之圖像套用前述圖像處理,藉此輸出從該圖像內擷取之擷取資訊;應答發送部,其將指定由前述圖像處理部輸出之擷取資訊之應答向前述終端機發送;且當擷取前述擷取資訊時,前述圖像處理部與相對於該擷取資訊之圖像之識別資訊及參數對應而快取該擷取之擷取資訊,已快取與前述接收之請求中所指定之識別資訊及參數對應之擷取資訊之情形時,前述圖像處理部係取代前述圖像之獲取及前述圖像處理之套用,獲得前述已快取之擷取資訊,並輸出該獲得之擷取資訊。
上述程式與執行程式之電腦可獨立,經由電腦通信網分發.出售。又,上述記錄媒體可與電腦獨立分發.出售。
此處,所謂非暫時性(non-transitory)記錄媒體,係指有形(tangible)記錄媒體。非暫時性記錄媒體例如為光碟、軟 碟、硬碟、光磁碟、DVD光碟、磁帶、半導體記憶體等。又,所謂暫時性(transitory)記錄媒體,係表示傳送媒體(傳播信號)其本身。暫時性記錄媒體例如為電信號、光信號、電磁波等。另,所謂暫時性(temporary)記憶區域,係用以暫時記憶資料或程式之區域,例如係RAM(Random Access Memory:隨機存取記憶體)等揮發性記憶體。
根據本發明,可提供適合即時翻譯WEB頁面內之圖像之文字之伺服器裝置、伺服器裝置之控制方法、程式、及記錄媒體。
如圖1所示,本發明之實施形態之伺服器裝置100與網路300連接。網路300上連接有使用者操作之複數個終端機裝置211、212~21n(以下將該等總稱為「終端機裝置200」),與WEB伺服器裝置400。WEB伺服器裝置400係根據自終端機裝置200之請求將特定之WEB頁面提供於終端機裝置200者。然後,伺服器裝置100係根據終端機裝置200之請求進行WEB頁面之翻譯,將翻譯結果提供於終端機裝置200者。另,以下所示之實施形態中,伺服器裝置100與WEB伺服器裝置400如圖1所示經由網路300而連接,但不限於該例。例如伺服器裝置100與WEB伺服器裝置400亦可藉由相同裝置實現。或伺服器裝置100與WEB伺服器裝置400亦可直接連接。
以下,針對實現本發明之實施形態之伺服器裝置100或 終端機裝置200之典型資訊處理裝置500(如圖2所示)進行說明。
(1.資訊處理裝置之概要構成)
如圖2所示,資訊處理裝置500具備:CPU(Central Processing Unit:中央處理單元)501、ROM(Read only Memory:唯讀記憶體)502、RAM503、NIC(Network Interface Card:網路介面卡)504、圖像處理部505、聲音處理部506、DVD-ROM(Digital Versatile Disc ROM:數位影音光碟ROM)驅動器507、介面508、外部記憶體509、控制器510、監視器511、揚聲器512。
CPU501控制資訊處理裝置500全體之動作,與各構成要件連接,交換控制信號或資料。
於ROM502記錄電源投入後立即執行之IPL(Initial Program Loader:初始程式載入器),藉由執行其而將特定之程式讀取至RAM503,藉由CPU501開始該程式之執行。又,於ROM502記錄資訊處理裝置500全體之動作控制所需之操作系統之程式或各種資料。
RAM503係暫時記憶資料或程式者,保持從DVD-ROM讀出之程式或資料,此外通信所需要之資料等。
NIC504係用以將資訊處理裝置500連接於網路300等電腦通信網者,係由遵照構成LAN(Local Area Network:局域網)時使用之10BASE-T/100BASE-T規格者,或用以使用電話線連接於網路之類比數據機、ISDN(Integrated Services Digital Network:整合服務數位網路)數據機、ADSL(Asymmetric Digital Subscriber Line:非對稱數位用戶端 迴路)數據機、用以使用有線電視線連接於網路之電纜數據機等,進行該等與CPU501之中介之介面(未圖示)構成。
圖像處理部505藉由CPU501或圖像處理部505所具備之圖像運算處理器(未圖示)將從DVD-ROM等讀出之資料進行加工處理後,將其記錄於圖像處理部505所具備之圖框記憶體(未圖示)。記錄於圖框記憶體之圖像資訊以特定之同步時序轉換成視頻信號,向監視器511輸出。藉此可顯示各種頁面。
聲音處理部506將從DVD-ROM等讀出之聲音資料轉換成類比聲音信號,從連接於其之揚聲器512輸出。又,於CPU501之控制下,生成資訊處理裝置500進行處理之進行中應產生之聲音,從揚聲器512輸出對應其之聲音。
在安裝於DVD-ROM驅動器507之DVD-ROM上,記錄例如用以實現實施形態之伺服器裝置100之程式。藉由CPU501之控制,DVD-ROM驅動器507進行相對於安裝於其之DVD-ROM之讀出處理,讀出需要之程式或資料,該等暫時記憶於RAM503等。
於介面508上可裝拆地連接外部記憶體509、控制器510、監視器511及揚聲器512。
於外部記憶體509可重寫地儲存有關於使用者之個人資訊之資料等。
控制器510接收資訊處理裝置500之各種設定時等進行之操作輸入。資訊處理裝置500之使用者經由控制器510進行指示輸入,藉此可將該等資料適當記錄於外部記憶體 509。
監視器511將由圖像處理部505輸出之資料向資訊處理裝置500之使用者提示。
揚聲器512將由聲音處理部506輸出之聲音資料向資訊處理裝置500之使用者提示。
此外,資訊處理裝置500亦可使用硬碟等大容量外部記憶裝置,以發揮與ROM502、RAM503、外部記憶體509、安裝於DVD-ROM驅動器507之DVD-ROM等相同功能之方式構成。
以下,針對上述資訊處理裝置500中實現之實施形態之伺服器裝置100或終端機裝置200,參照圖1至28進行說明。藉由投入資訊處理裝置500之電源,而執行作為實施形態之伺服器裝置100或終端機裝置200發揮功能之程式,實現實施形態之伺服器裝置100或終端機裝置200。
以下實施形態中,於圖3顯示藉由WEB伺服器裝置400提供於終端機裝置200之WEB頁面之例。WEB頁面600由圖像601、602、603、文字604、605、606構成。圖像601、603係包含文字之圖像,圖像602係不包含文字之圖像。又,令圖像601、602、603之圖像URL為「http://xxx.601.jpg」、「http://xxx.602.jpg」、「http://xxx.603.jpg」。
(2.實施形態1之伺服器裝置之概要構成)
實施形態1之伺服器裝置100係在翻譯圖像內所含文字行時,對該圖像已進行文字辨識之處理之情形中,可省略圖像之獲取及文字辨識處理者。
如圖4所示,本實施形態之伺服器裝置100由請求接收部101、圖像處理部102、應答發送部103構成。
請求接收部101從終端機裝置200接收指定有圖像之識別資訊與對於圖像處理之參數之請求。
所謂圖像識別資訊,例如係圖像URL。又,所謂圖像處理,例如係用以辨識圖像內之文字之文字辨識處理。然後,所謂對於圖像處理之參數,例如係顯示圖像內之文字為哪一語言之辨識用語言。圖像內之文字作為所指定之辨識用語言進行文字辨識。
以下,以使用者對WEB頁面600之圖像601,於伺服器裝置100求取翻譯之情形為例進行說明。例如若使用者使游標與終端機裝置200上顯示之圖像601重疊(若滑鼠移至),則如圖5(a)所示,顯示求取辨識用語言之指定之彈出視窗801。如圖5(b)所示,若使用者以游標701點擊按鈕802,則顯示下拉選單。使用者從選單中選擇圖像601內之文字行之語言(辨識用語言)。然後如圖5(c)所示,若指定辨識用語言「英語」,則指定有圖像601之圖像URL「http://xxx.601.jpg」與辨識用語言「英語」之請求向伺服器裝置100發送。伺服器裝置100之請求接收部101接收該請求。
本實施形態中,CPU501及NIC504協動,作為請求接收部101發揮功能。另,以下實施形態2至6中亦相同。
圖像處理部102基於接收之請求中所指定之識別資訊獲取圖像,對所獲取之圖像使用接收之請求中所指定之參數 套用圖像處理,藉此輸出從該圖像內擷取之擷取資訊。
此處,所謂擷取資訊,例如係文字辨識結果、所得圖像內之文字行(以下稱為「辨識完文字行」)。例如若接收指定有圖像URL「http://xxx.601.jpg」及辨識用語言「英語」之請求,則圖像處理部102首先基於該圖像URL從WEB伺服器裝置400獲得圖像601。然後,圖像處理部102中,所獲得之圖像601內所含之文字作為英語進行文字辨識。文字辨識結果,若圖像601內之文字判斷為「Sale Water Best bang for the buck」,則圖像處理部102將該等文字行作為從圖像601內擷取之辨識完文字行輸出。
又,若圖像處理部102擷取擷取資訊,則與相對於該擷取資訊之圖像之識別資訊及參數對應,快取該擷取之擷取資訊。
例如於RAM503儲存如圖6所示之擷取資訊表101a。擷取資訊表101上,對應登錄有圖像之識別資訊(圖像URL)101a1、參數(辨識用語言)101a2、及擷取資訊(辨識完文字行)101a3。若圖像處理部102藉由文字辨識獲得辨識完文字行「Sale Water Best bang for the buck」,則使該辨識完文字行、圖像601之圖像URL「http://xxx.601.jpg」、辨識用語言「英語」對應,登錄於擷取資訊表101a。
本實施形態中,CPU501及圖像處理部505協動,作為圖像處理部102發揮功能。另,以下實施形態2至6亦相同。
應答發送部103將指定由圖像處理部102輸出之擷取資訊之應答向終端機裝置200發送。
例如應答發送部103將指定有辨識完文字行「Sale Water Best bang for the buck」之應答向終端機裝置200發送。此處,該應答例如係顯示於終端機裝置200之WEB頁面內之文字辨識結束之圖像中,亦包含追加用以重疊顯示任意圖形之標籤之命令者。例如若終端機裝置200接收該應答,則如圖7所示,於文字辨識結束之圖像601上,重疊顯示半透明矩形901。
本實施形態中,CPU501及NIC504協動,作為應答發送部103發揮功能。另,以下實施形態2至6亦相同。
然後,圖像處理部102在快取與接收之請求中所指定之識別資訊及參數對應之擷取資訊之情形中,取代圖像之獲取及圖像處理之套用,獲得快取之擷取資訊,輸出該獲得之擷取資訊。
例如,若請求接收部101接收指定有圖像601之圖像URL與辨識用語言「英語」之請求,則圖像處理部102參照圖6之擷取資訊表101a。由於登錄有與圖像601之識別資訊及辨識用語言「英語」對應之辨識完文字行「Sale Water Best bang for the buck」,因此圖像處理部102省略圖像601之獲取及文字辨識處理,將該辨識完文字行向應答發送部103輸出。
(3.實施形態1之伺服器裝置之動作)
接著,針對本實施形態之伺服器裝置100之各部分進行之動作,使用圖8之流程圖進行說明。若對伺服器裝置100投入電源,則CPU501開始圖8之流程圖所示之控制處理。
請求接收部101從終端機裝置200接收指定有圖像之識別資訊(圖像URL)與對於圖像處理之參數(辨識用語言)之請求(步驟S101)。例如若使用者使游標701與圖像601重疊,以圖5(a)~(c)所示之順序指定辨識用語言「英語」,則請求接收部101接收指定有圖像URL「http://xxx.601.jpg」與辨識用語言「英語」之請求。
圖像處理部102判斷是否快取與接收之請求中所指定之識別資訊及辨識用語言對應之擷取資訊(辨識完文字行)(步驟S102)。
圖像處理部102判斷快取該辨識完文字行之情形中(步驟S102;Yes),輸出快取之辨識完文字行(步驟S103)。例如圖6所示之擷取資訊表101a儲存於RAM503之情形中,圖像處理部102將與圖像URL「http://xxx.601.jpg」及辨識用語言「英語」對應之辨識完文字行「Sale Water Best bang for the buck」向應答發送部103輸出。
另一方面,圖像處理部102判斷未快取該辨識完文字行之情形中(步驟S102;No),獲得接收之請求中所指定之圖像URL之圖像(步驟S105)。例如與圖像URL「http://xxx.601.jpg」及辨識用語言「英語」對應之辨識完文字行之資訊未登錄於擷取資訊表101a之情形中,圖像處理部102對WEB伺服器裝置400進行存取,獲得與圖像URL「http://xxx.601.jpg」對應之圖像601。
圖像處理部102若獲得圖像,則接著使用請求中所指定之辨識用語言進行文字辨識。從圖像內擷取文字行(辨識 完文字行)(步驟S106)。例如圖像處理部102,以圖像601內之文字為「英語」對圖像601進行文字辨識,獲得「Sale Water Best bang for the buck」之辨識完文字行。
圖像處理部102使圖像識別資訊、辨識用語言、辨識完文字行對應快取(步驟S107)。例如如圖6所示,圖像處理部102使圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、辨識完文字行「Sale Water Best bang for the buck」對應,登錄於擷取資訊表101a。
然後,圖像處理部102輸出所擷取之辨識完文字行(步驟S108)。例如圖像處理部102將作為文字辨識結果之辨識完文字行「Sale Water Best bang for the buck」向應答發送部103輸出。
應答發送部103將指定有步驟S103或步驟S108中輸出之辨識完文字行之應答向終端機裝置200發送(步驟S104)。例如應答發送部103將指定有辨識完文字行「Sale Water Best bang for the buck」之應答向終端機裝置200發送。
根據本實施形態,對於圖像已獲得文字辨識結果之情形中,可省略圖像之獲取及文字辨識處理。然後,藉由對文字辨識結果所得之文字行進行翻譯,而可縮短圖像內之文字行之翻譯所需要之時間。
(4.實施形態2之伺服器裝置之概要構成)。
實施形態2之伺服器裝置100在翻譯圖像內所含文字行時,對該圖像內之指定區域已進行文字辨識處理之情形中,可省略圖像之獲取及文字辨識處理。
本實施形態之伺服器裝置100與實施形態1相同,由請求接收部101、圖像處理部102、應答發送部103構成(圖4),但各部分之功能或處理資訊與實施形態1不同。以下詳細說明。
請求接收部101從終端機裝置200接收指定有圖像之識別資訊與該圖像內之指定區域之請求。
此處,所謂指定區域,例如係藉由操作終端機裝置200之使用者所指定之WEB頁面之圖像內之區域。例如指定區域由長方形規定,由長方形左上角及右下角之座標指定。
例如如圖9(a)所示,使用者在終端機裝置200上拖曳游標701,選擇圖像601內之區域902。此處,設定圖像601左上角911之座標(「(縱座標、橫座標)」為「(0、0)」,右下角912之座標為(200、300)。又,區域902左上角之座標為(5、100),右下角之座標為(48、200)。若由使用者指定區域902,則終端機裝置200將指定有圖像601之圖像URL「http://xxx.601.jpg」與指定區域「(5、100):(48、200)」之請求向伺服器裝置100發送。伺服器裝置100之請求接收部101接收該請求。
另,指定區域之指定方法不限於上述。例如如圖9(b)所示,亦可為使游標701與圖像內重疊時,以游標701為中心顯示特定大小之長方形903,而將長方形903之區域作為指定區域。又,指定區域不限於長方形,亦可為圓形等。
圖像處理部102基於接收之請求中所指定之識別資訊獲得圖像,對所獲得之圖像內之指定區域進行文字辨識,藉 此輸出從該圖像內之該指定區域辨識之辨識完文字行。
圖像處理部102例如若接收到指定有圖像URL「http://xxx.601.jpg」及指定區域「(5、100):(48、200)」之請求時,則圖像處理部102首先基於該圖像URL從WEB伺服器裝置400獲得圖像601。接著,圖像處理部102推測用以文字辨識之辨識用語言。例如WEB頁面600之URL中包含表示國家之網域代碼之情形中,由該網域代碼推測圖像內所含文字之語言。例如若網域代碼中包含「.UK」,則將辨識用語言推測為「英語」。或判斷html內是否存在指定語言之標籤,若存在之情形時將該語言作為辨識用語言。例如html內存在<html lang=「en」>」標籤之情形,令辨識用語言為「英語」。本實施形態中,推測辨識用語言為「英語」。圖像處理部102將所獲得之圖像601之指定區域「(5、100):(48、200)」中所含之文字視為「英語」,而進行文字辨識。文字辨識之結果,若判斷該指定區域內之文字為「Sale」,則圖像處理部102將該文字行作為辨識完文字行輸出。
圖像處理部102若擷取辨識完文字行,則與相對於該辨識完文字行之圖像之識別資訊及指定區域對應而快取該辨識完文字行。
例如如圖10所示,圖像處理部102使圖像601之圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、指定區域「(5、100):(48、200)」及辨識完文字行「Sale」對應,登錄於擷取資訊表101a。
此處,圖像處理部102亦可在擷取辨識完文字行時,將指定區域修正成指定區域內經辨識該辨識完文字行之辨識區域後,快取該辨識完文字行。
所謂辨識區域,例如係包含辨識完文字行之長方形,成藉由使長方形之縱向及橫向之長度為最小之長方形所特定之區域。例如「Sale」之辨識區域(圖11之區域921)係「(8、110):(45、170)」,「Water」之辨識區域(圖11之區域922)係「(60、120):(90、180)」,「Best bang for the buck」之辨識區域(圖11之區域923)係「(110、25):(190、270)」。
例如如圖9(a)所示,指定區域902作為指定區域,接收指定為指定區域「(5、100):(48、200)」之請求。此時,圖像處理部102對該指定區域進行文字辨識,擷取「Sale」之文字行後,求得該文字行所含之辨識區域。然後如圖12所示,圖像處理部102使圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、指定區域(辨識區域)「(8、110):(45、170)」、辨識完文字行「Sale」對應,登錄於擷取資訊表101a。
又,例如如圖9(c)所示,指定超出圖像601之區域904作為指定區域,接收指定為指定區域「(52、-20):(98、320)」之請求。此時,如圖12所示,圖像處理部102使圖像601之圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、指定區域(辨識區域)「(60、120):(90、180)」、辨識完文字行「Water」對應,登錄於擷取資訊表101a。
又,例如如圖9(d)所示,指定如橫穿圖像601內之文字行之區域905作為指定區域,接收指定為指定區域「(85、15):(210、285)」之請求。此時,如圖12所示,圖像處理部102使圖像601之圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、指定區域(辨識區域)「(110、25):(190、270)」、辨識完文字行「Best bang for the buck」對應,登錄於擷取資訊表101a。
應答發送部103將指定有由圖像處理部102輸出之辨識完文字行之應答向終端機裝置200發送。
例如若終端機裝置200接收指定有辨識完文字行「Sale」之應答,則如圖13(a)所示,半透明矩形931與文字辨識結束之辨識完文字行「Sale」之辨識區域重疊顯示。同樣,如圖13(b)至圖13(d)所示,半透明矩形932、933與辨識區域重疊顯示。
然後,圖像處理部102在快取與接收之請求中所指定之識別資訊及參數所含之指定區域對應之辨識完文字行之情形中,圖像處理部102係取代圖像之獲取及文字辨識,獲得快取之辨識完文字行,輸出該獲得之辨識完文字行。
此處,圖像處理部102在快取辨識完文字行時對應之識別資訊與接收之請求中所指定之識別資訊一致,且快取辨識完文字行時對應之指定區域與接收之請求中所指定之指定區域重複之情形中,判定為快取與接收之請求中所指定之識別資訊及參數所含之指定區域對應之擷取資訊。
例如如圖13(a)所示,使用者若指定區域906,則請求接 收部101接收指定有圖像601之圖像URL,與指定區域「(5、35)「(52、200)」之請求。若接收該請求,則圖像處理部102參照圖12之擷取資訊表101a。於擷取資訊表101a中,圖像601之圖像URL一致,登錄有請求中所指定之指定區域「(5、35)「(52、200)」與快取之指定區域「(8、110):(45、170)」重複之辨識完文字行。因此圖像處理部102省略圖像之獲取及文字辨識處理,將辨識完文字行「Sale」向應答發送部103輸出。
另,判斷請求中所指定之指定區域與快取之指定區域是否重複,可適當設定。
例如如圖13(a)及圖13(b)所示,請求中所指定之指定區域(區域906、907)包含快取之指定區域(辨識區域、矩形931、932)之全部之情形中判斷為重複。另一方面,如圖13(c)所示,請求中所指定之指定區域(區域908)與快取之指定區域(辨識區域、矩形933)僅一部分重疊之情形中,亦可判斷為不重複。或辨識區域與請求中所指定之指定區域僅辨識區域之面積之特定比例重疊之情形中,亦可判斷為重複。又或如圖13(d)所示,游標701與辨識區域(矩形933)重疊之情形中,亦可判斷為重複。
(5.實施形態2之伺服器裝置之動作)
接著,針對本實施形態之伺服器裝置100之各部分進行之動作,使用圖14之流程圖說明。若對伺服器裝置100投入電源,則CPU501開始圖14之流程圖所示之控制處理。
請求接收部101從終端機裝置200接收指定有圖像之識別 資訊與指定區域之請求(步驟S201)。例如使用者若指定圖9(a)之區域902,則請求接收部101接收指定有圖像URL「http://xxx.601.jpg」與指定區域「(5、100):(48、200)」之請求。
圖像處理部102判斷是否快取與接收之請求中所指定之識別資訊(圖像URL)及指定區域對應之擷取資訊(辨識完文字行)(步驟S202)。
圖像處理部102判斷快取該辨識完文字行之情形中(步驟S202;Yes),輸出快取之辨識完文字行(步驟S203)。例如圖像處理部102參照圖12所示之擷取資訊表101a,判斷圖像URL一致,且請求中所指定之指定區域「(5、100):(48、200)」與快取之指定區域(辨識區域)「(8、110):(45、170)」重複。此時,圖像處理部102將與圖像URL及辨識區域對應之辨識完文字行「Sale」向應答發送部103輸出。
另一方面,圖像處理部102判斷未快取該辨識完文字行之情形中(步驟S202;No),獲得接收之請求中所指定之圖像URL之圖像(步驟S205)。例如圖像URL「http://xxx.601.jpg」不一致之情形中,或請求中所指定之指定區域與快取之指定區域不重複之情形中,圖像處理部102對WEB伺服器裝置400進行存取,獲得與圖像URL「http://xxx.601.jpg」對應之圖像601。
圖像處理部102若獲得圖像,則接著推測辨識用語言,使用該辨識用語言進行文字辨識,從圖像內擷取辨識完文 字行(步驟S206)。例如圖像處理部102,係以圖像601之指定區域(區域902)之文字為英語,對區域902進行文字辨識,獲得「Sale」之辨識完文字行。
圖像獲取部102使圖像之識別資訊、辨識用語言、指定區域、辨識完文字行對應快取(步驟S207)。例如如圖10所示,圖像處理部102使圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、指定區域「(5、100):(48、200)」、辨識完文字行「Sale」對應,登錄於擷取資訊表101a。另,亦可登錄前將該指定區域修正成辨識區域「(8、110):(45、170)」,如圖12所示登錄。
然後,圖像處理部102輸出所擷取之辨識完文字行(步驟S208)。例如圖像處理部102將作為文字辨識結果之辨識完文字行「Sale」向應答發送部103輸出。
應答發送部103將指定有步驟S203或步驟S208中輸出之辨識完文字行之應答向終端機裝置200發送(步驟S204)。例如應答發送部103將指定有辨識完文字行「Sale」之應答向終端機裝置200發送。
根據本實施形態,對於使用者指定之圖像內之區域獲得已文字辨識結果之情形中,可省略圖像之獲取及文字辨識處理。然後,藉由對文字辨識結果所得之文字行進行翻譯,而可縮短圖像內之文字行之翻譯所需要之時間。
(6.實施形態3之伺服器裝置之概要構成)
實施形態3之伺服器裝置100在翻譯圖像內所含文字行時,對該圖像內之指定區域已進行文字辨識及翻譯處理之 情形中,可省略圖像之獲取、文字辨識及翻譯處理。
本實施形態之伺服器裝置100與實施形態2相同,由請求接收部101、圖像處理部102、應答發送部103構成(圖4),但各部分之功能及處理資訊與實施形態2不同。以下詳細說明。
請求接收部101從終端機裝置200接收指定有圖像之識別資訊、辨識用語言、指定區域、轉換資訊之請求。
所謂轉換資訊,例如係圖像所含文字行之翻譯後之語言(以下稱作「翻譯後語言」)。使用辨識用語言從圖像內擷取之辨識完文字行翻譯成翻譯後語言。
以下,以使用者對WEB頁面600之圖像601內之指定區域(區域909、座標為「(100、20):(200、280)」),對伺服器裝置100求取翻譯之情形為例進行說明。例如若使用者在終端機裝置200拖曳游標701,選擇圖像601內之區域909,則如圖15(a)所示,顯示求取辨識用語言及翻譯後語言之指定之彈出視窗803。如圖15(b)所示,若使用者以游標701點擊按鈕804,則顯示下拉選單。使用者從選單中選擇區域909內之文字行之語言(辨識用語言)。同樣,對於翻譯後語言點擊按鈕805,從選單中選擇將區域909內之文字行翻譯成何種語言(翻譯後語言)。如圖15(c)所示,若指定辨識用語言「英語」及翻譯後語言「日語」,則指定有圖像601之圖像URL「http://xxx.601.jpg」、指定區域「(100、20):(200、280)」、辨識用語言「英語」、翻譯後語言「日語」之請求向伺服器裝置100發送。伺服器裝置100之請求接收 部101接收該請求。
圖像處理部102基於接收之請求中所指定之識別資訊獲取圖像,對獲取圖像內之指定區域進行文字辨識,藉此輸出從該圖像內之該指定區域辨識之辨識完文字行。然後,圖像處理部102對輸出之辨識完文字行使用接收之請求中所指定之轉換資訊(翻譯後語言)進行轉換處理,藉此輸出從該辨識完文字行轉換後之轉換完文字行。
例如圖像處理部102從WEB伺服器裝置400獲取與請求中所指定之圖像URL「http://xxx.601.jpg」對應之圖像601。接著,圖像處理部102對指定區域「(100、20):(200、280)」使用辨識用語言「英語」擷取辨識完文字行「Best bang for the buck」。然後,圖像處理部102將該辨識完文字行轉換成翻譯後語言「日語」,將轉換完文字行「得」向應答發送部103輸出。
圖像處理部102若擷取轉換完文字行,則與相對於該轉換完文字行之圖像之識別資訊、指定區域、辨識用語言、辨識完文字行以及轉換資訊對應,快取該轉換完文字行。另,本實施形態中,快取之指定區域成為辨識區域。
例如如圖16所示,圖像處理部102使圖像601之圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、指定區域「(110、25):(190、270)」、翻譯後語言「日語」、辨識完文字行「Best bang for the buck」、轉換完文字行「得」對應,登錄於擷取資訊表101a。另,登錄之資訊不限於該等組合,例如亦可不登錄翻譯後語言及轉換完文字 行。
然後,圖像處理部102在快取與接收之請求中所指定之識別資訊(圖像URL)、指定區域、辨識用語言以及轉換資訊(翻譯後語言)對應之轉換完文字行之情形中,圖像處理部102係取代轉換處理,獲得快取之轉換完文字行,輸出該獲得之轉換完文字行。
例如使用者如圖17(a)所示,指定區域910(使座標為「(90、0):(200、290)」),彈出視窗806下選擇辨識用語言「英語」與翻譯後語言「日語」。此時,請求接收部101接收指定有圖像601之圖像URL、指定區域「(90、0):(200、290)」、辨識用語言「英語」、翻譯後語言「日語」之請求。圖像處理部102參照圖16之擷取資訊表101a,判斷該請求中所指定之圖像URL、辨識用語言及翻譯後語言與快取之該等資訊一致,且請求中所指定之指定區域「(90、0):(200、290)」與快取之指定區域「(110、25):(190、270)」重複。因此,圖像處理部102省略圖像之獲取、文字辨識及轉換處理之處理,將轉換完文字行「得」向應答發送部103輸出。
另,圖像URL及辨識用語言一致,且請求所指定之指定區域與快取之指定區域重複之情形中,圖像處理部102亦可僅省略圖像之獲取及文字辨識處理,使用登錄於擷取資訊表101a之辨識完文字行,轉換成翻譯後語言,獲得轉換完文字行。例如請求接收部101接收指定有圖像601之圖像URL、指定區域「(90、0):(200、290)」、辨識用語言「英 語」、翻譯後語言「德語」之請求。此時,圖16之擷取資訊表101a上未登錄對應之轉換完文字行,因此進行將辨識完文字行「Best bang for the buck」翻譯成德語之轉換處理,輸出轉換完文字行。
應答發送部103將指定有藉由圖像處理部102輸出之轉換完文字行之應答向終端機裝置200發送。
例如若終端機裝置200接收指定有轉換完文字行「得」之應答,則如圖17(c)所示,書寫有轉換完文字行「得」之彈出視窗807顯示於WEB頁面600內。或如圖17(d)所示,亦可重疊顯示辨識區域內書寫有轉換完文字行之矩形941。
(7.實施形態3之伺服器裝置之動作)
接著,針對本實施形態之伺服器裝置100之各部分進行之動作,使用圖18之流程圖說明。若對伺服器裝置100投入電源,則CPU501開始圖18之流程圖所示之控制處理。
請求接收部101從終端機裝置200接收指定有圖像之識別資訊(圖像URL)、指定區域、辨識用語言、轉換資訊(翻譯後語言)之請求(步驟S301)。例如使用者指定圖15(a)之區域909,如圖15(a)所示以彈出視窗803指定辨識用語言及翻譯後語言時,請求接收部101接收指定有圖像URL「http://xxx.601.jpg」、指定區域「(100、20):(200、280)」、辨識用語言「英語」、翻譯後語言「日語」之請求。
圖像處理部102判斷是否快取與接收之請求中所指定之識別資訊、指定區域、辨識用語言、翻譯後語言對應之轉 換完文字行(步驟S302)。
圖像處理部102判斷快取該轉換完文字行之情形中(步驟S302;Yes),輸出快取之轉換完文字行(步驟S303)。例如圖像處理部102參照圖16所示之擷取資訊表101a,判斷圖像URL、辨識用語言及翻譯後語言一致,且請求中所指定之指定區域「(100、20):(200、280)」與快取之指定區域(辨識區域)「(110、25):(190、270)」重複。此時,圖像處理部102將與圖像URL、指定區域、辨識用語言及翻譯後語言對應之轉換完文字行「得」向應答發送部103輸出。
另一方面,圖像處理部102判斷未快取該轉換完文字行之情形中(步驟S302;No),判斷是否快取與圖像URL、指定區域、辨識用語言對應之辨識完文字行(步驟S305)。
圖像處理部102判斷快取該辨識完文字行之情形中(步驟S305;Yes),將快取之辨識完文字行轉換成翻譯後語言,獲得轉換完文字行(步驟S306)。例如圖16之擷取資訊表101a中,未登錄翻譯後語言「日語」及轉換完文字行「得」之情形中,圖像處理部102將辨識完文字行「Best bang for the buck」轉換成翻譯後語言「日語」,獲得轉換完文字行「得」。
另一方面,圖像處理部102判斷未快取該辨識完文字行之情形中(步驟S305;No),獲得接收之請求中所指定之圖像URL之圖像(步驟S309)。然後,圖像處理部102對該圖像 內之指定區域進行文字辨識,擷取辨識完文字行(步驟S310)。例如圖像URL「http://xxx.601.jpg」不一致之情形中,或請求中所指定之指定區域與快取之指定區域不重複之情形中,圖像處理部102對WEB伺服器裝置400進行存取,獲得與圖像URL「http://xxx.601.jpg」對應之圖像601。然後,使用請求中所指定之辨識用語言「英語」對指定區域進行文字辨識,擷取辨識完文字行「Best bang for the buck」。
步驟S310中,若擷取辨識完文字行,則圖像處理部102對該辨識完文字行進行轉換處理(步驟S306)。
圖像處理部102使圖像之識別資訊、辨識用語言、翻譯後語言、指定區域、辨識完文字行、轉換完文字行對應快取(步驟S307)。然後,將獲得之轉換完文字行向應答發送部103輸出(步驟S308)。例如如圖16所示,圖像處理部102使圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、翻譯後語言「日語」、指定區域(辨識區域)「(110、25):(190、270)」、辨識完文字行「Best bang for the buck」、轉換完文字行「得」對應,登錄於擷取資訊表101a。然後,將轉換完文字行「得」向應答發送部103輸出。
然後,圖像處理部102將指定有步驟S303或步驟S308中輸出之轉換完文字行之應答向終端機裝置200發送(步驟S304)。例如應答發送部103將指定有轉換完文字行「得」之應答向終端機裝置200發送。
根據本實施形態,對於使用者所指定之圖像內之區域已獲得轉換處理結果(翻譯結果)之情形中,可省略圖像之獲取、文字辨識處理及轉換處理。藉此可縮短圖像內之文字行之翻譯所需要之時間。
(8.實施形態4之伺服器裝置之概要構成)
實施形態4之伺服器裝置100係對使用者提示針對圖像之文字辨識處理是否結束者。
如圖19所示,本實施形態之伺服器裝置100由請求接收部101、圖像處理部102、應答發送部103、詢問接收部104、回答發送部105構成。本實施形態之請求接收部101、圖像處理部102及應答發送部103具有與實施形態1相同之功能。以下針對具有不同功能之詢問接收部104及回答發送部105進行說明。
詢問接受部104從終端機裝置200接收指定有圖像之識別資訊之詢問。
例如如圖20(a)所示,若使用者使游標701與圖像601內重疊(若滑鼠移至),則終端機裝置200將指定有圖像601之圖像URL之詢問向伺服器裝置100發送。伺服器裝置100之詢問接收部104接收該詢問。
本實施形態中,CPU501及NIC504協動,作為詢問接收部104發揮功能。另,以下實施形態5及6亦相同。
回答發送部105在未快取與接收之詢問中所指定之識別資訊對應之擷取資訊之情形中,將指定有訊息之回答向終端機裝置200發送,該訊息係促使指定有圖像之識別資訊 與圖像處理參數之請求之發送者;在快取與接收之詢問中所指定之識別資訊對應之擷取資訊之情形中,將指定有該擷取資訊之回答向終端機裝置200發送。
此處,所謂圖像處理之參數,係用以文字辨識之辨識用語言,所謂擷取資訊,係辨識完文字行。伺服器裝置100上儲存有圖6所示之擷取資訊表101a。該擷取資訊表101a上登錄有與請求中所指定之圖像601之圖像URL「http://xxx.601.jpg」對應之辨識完文字行「Sale Water Best bang for the buck」。因此,回答發送部105將指定有辨識完文字行之回答向終端機裝置200發送。若終端機裝置200接收該回答,則如圖20(a)所示,在顯示於終端機裝置200之WEB頁面上顯示含辨識完文字行之彈出視窗809。
另,快取辨識完文字行之情形中發送之回答上,亦可指定獲得辨識完文字行之主旨之訊息。若終端機裝置200接收該回答,則如圖20(b)所示,顯示含獲得辨識完文字行主旨之訊息之彈出視窗810。
另一方面,伺服器裝置100上,未快取與圖像601之圖像URL對應之辨識完文字行之情形中,回答發送部105將指定有為促使發送指定有圖像601之圖像URL及辨識用語言之請求之訊息之回答向終端機裝置200發送。若終端機裝置200接收該回答,則如圖5(a)所示,在顯示於終端機裝置200之WEB頁面上顯示求取辨識用語言之輸入之彈出視窗801。
本實施形態中,CPU501及NIC504協動,作為回答發送 部105發揮功能。另,以下實施形態5及6亦相同。
(9.實施形態4之伺服器裝置之動作)
接著,針對本實施形態之伺服器裝置100之各部分進行之動作,使用圖21之流程圖進行說明。若對伺服器裝置100投入電源,則CPU501開始圖21之流程圖所示之控制處理。
詢問接收部104從終端機裝置200接收指定有圖像之識別資訊之詢問(步驟S401)。例如接收指定有圖像601之圖像URL之詢問。
回答發送部105判斷是否快取與該詢問所指定之識別資訊對應之辨識完文字行(步驟S402)。
若回答發送部105判斷快取該辨識完文字行(步驟S402;Yes),則將指定有快取之辨識完文字行之回答向終端機裝置200發送(步驟S403)。例如與圖像601之圖像URL對應之辨識完文字行「Sale Water Best bang for the buck」登錄於儲存於伺服器裝置100之擷取資訊表101a之情形中(圖6),回答發送部104對終端機裝置200發送指定有該辨識完文字行之回答。
另一方面,若回答發送部105判斷未快取該辨識完文字行(步驟S402;No),則將指定有促使辨識用語言之指定之訊息之回答向終端機裝置200發送(步驟S404)。例如與圖像601之圖像URL對應之辨識完文字行未登錄於儲存於伺服器裝置100之擷取資訊表101a之情形中,回答發送部104將指定有為促使發送指定有圖像601之圖像URL及辨識用 語言之請求之訊息之回答向終端機裝置200發送。
其後,若從終端機裝置200接收指定有圖像601之圖像URL及辨識用語言之請求,則伺服器裝置100例如開始圖8之流程圖所示之控制處理。
根據本實施形態,僅藉由滑鼠移至圖像上等,即可讓使用者獲知針對圖像之文字辨識處理是否結束。
(10.實施形態5之伺服器裝置之概要構成)
實施形態5之伺服器裝置100係對使用者提示針對圖像內之區域之文字辨識處理是否結束者。
如圖19所示,本實施形態之伺服器裝置100由請求接收部101、圖像處理部102、應答發送部103、詢問接收部104、回答發送部105構成。本實施形態之請求接收部101、圖像處理部102及應答發送部103具有與實施形態2相同之功能。以下針對具有不同功能之詢問接收部104及回答發送部105進行說明。
詢問接收部104從終端機裝置200接收指定有圖像之識別資訊與該圖像內之位置之詢問。
例如如圖22(a)所示,若使用者使游標701與圖像601內重疊(若滑鼠移至),則終端機裝置200將指定有圖像601之圖像URL與該游標701位置之游標(「(75:175)」)之詢問向伺服器裝置100發送。伺服器裝置100之詢問接收部104接收該詢問。
回答發送部105在藉由圖像處理部102快取與接收之詢問中所指定之識別資訊及包含接收之詢問中所指定之位置之 指定區域對應之辨識完文字行之情形中,將指定有該快取之辨識完文字行之回答向終端機裝置200發送。
例如於伺服器裝置100上儲存圖12所示之擷取資訊表101a。如圖22(a)所示,請求所指定之位置座標「(75:175)」包含於辨識區域922中。於該擷取資訊表101a上登錄有與請求中所指定之圖像601之圖像URL「http://xxx.601.jpg」,及含請求中所指定之位置座標之指定區域(辨識區域922)對應之辨識完文字行「Water」。因此回答發送部105將指定有該辨識完文字行之回答向終端機裝置200發送。若終端機裝置200接收該回答,則如圖22(a)所示,在顯示於終端機裝置200之WEB頁面上顯示含辨識完文字行「Water」之彈出視窗811。
另,快取辨識完文字行之情形中發送之回答上,亦可指定促使指定有翻譯後語言之請求的發送之訊息。若終端機裝置200接收該回答,則如圖22(b)所示,顯示求取翻譯後語言之指定之彈出視窗812。
另一方面,伺服器裝置100上,未快取與圖像601之圖像URL及包含指定位置之指定區域對應之辨識完文字行之情形中,回答發送部105將指定有為促使發送對於該指定區域指定有圖像601之圖像URL、圖像內之位置及辨識用語言之請求之訊息之回答向終端機裝置200發送。若終端機裝置200接收該回答,則在顯示於終端機裝置200之WEB頁面上,例如如圖22(c)所示,顯示求取辨識用語言之輸入之彈出視窗813。
(11.實施形態5之伺服器裝置之動作)
接著,針對本實施形態之伺服器裝置100之各部分進行之動作,使用圖23之流程圖進行說明。若對伺服器裝置100投入電源,則CPU501開始圖23之流程圖所示之控制處理。
詢問接收部104從終端機裝置200接收指定有圖像之識別資訊與該圖像內之位置之詢問(步驟S501)。例如接收指定有圖像601之圖像URL及位置「(75:175)」之詢問。
回答發送部105判斷是否快取與該詢問所指定之識別資訊及包含位置之指定區域對應之辨識完文字行(步驟S502)。
若回答發送部105判斷已快取該辨識完文字行(步驟S502;Yes),則將指定有已快取之辨識完文字行之回答向終端機裝置200發送(步驟S503)。例如與圖像601之圖像URL及包含指定位置「(75:175)」之指定區域對應之辨識完文字行「Water」已登錄於儲存於伺服器裝置100之擷取資訊表101a之情形時(圖12),回答發送部104對終端機裝置200發送指定有該辨識完文字行之回答。
另一方面,若回答發送部105判斷未快取該辨識完文字行(步驟S502;No),則將指定有促使對該圖像之指定區域指定辨識用語言的訊息之回答向終端機裝置200發送(步驟S504)。例如與圖像601之圖像URL及包含指定位置之指定區域對應之辨識完文字行未登錄於儲存於伺服器裝置100之擷取資訊表101a之情形時,回答發送部104將指定有促 使發送指定有圖像601之圖像URL、該指定區域及辨識用語言之請求之訊息之回答向終端機裝置200發送。
根據本實施形態,僅藉由滑鼠移至圖像內之區域等,即可讓使用者獲知針對該區域之文字辨識處理是否結束。
(12.實施形態6之伺服器裝置之概要構成)
實施形態6之伺服器裝置100係對使用者提示針對圖像內之區域之轉換處理是否結束者。
如圖19所示,本實施形態之伺服器裝置100由請求接收部101、圖像處理部102、應答發送部103、詢問接收部104、回答發送部105構成。本實施形態之請求接收部101、圖像處理部102及應答發送部103具有與實施形態3相同之功能。以下,針對具有不同功能之詢問接收部104及回答發送部105進行說明。
詢問接收部104從終端機裝置200接收指定有圖像之識別資訊、該圖像內之位置、轉換資訊之詢問。
例如如圖22(a)所示,若使用者使游標701與圖像601內重疊,則如圖22(b)所示,顯示求取翻譯後語言(轉換資訊)之指定之彈出視窗812。然後,使用者若選擇任意之翻譯後語言(例如「西班牙語」),則終端機裝置200將指定有圖像601之圖像URL、該游標701位置之座標「(75:175)」、翻譯後語言「西班牙語」之詢問向伺服器裝置100發送。伺服器裝置100之詢問接收部104接收該詢問。
回答發送部105在藉由前述圖像處理部快取與接收之詢問中所指定之識別資訊、轉換資訊及含前述接收之詢問中 所指定之位置之指定區域對應之轉換完文字行之情形中,發送前述回答中指定有該快取之轉換完文字行之回答。
例如於伺服器裝置100上儲存圖24所示之擷取資訊表101a。於該擷取資訊表101a上登錄請求中所指定之圖像601之圖像URL「http://xxx.601.jpg」、含請求中所指定之位置之座標之指定區域(辨識區域922)、與翻譯後語言「西班牙語」對應之轉換完文字行「Agua」。因此,回答發送部105將指定有該轉換完文字行之回答向終端機裝置200發送。若終端機裝置200接收該回答,則如圖25(a)所示,在顯示於終端機裝置200之WEB頁面上顯示含轉換完文字行「Agua」之彈出視窗814。
另一方面,伺服器裝置100上未登錄與圖像601之圖像URL、含指定位置之指定區域及翻譯後語言對應之轉換完文字行之情形中,回答發送部105將指定有未快取該轉換完文字行主旨之訊息之回答向終端機裝置200發送。若終端機裝置200接收該回答,則例如如圖25(b)所示,在顯示於終端機裝置200之WEB頁面上,顯示含未快取轉換完文字行主旨之訊息之彈出視窗815。
(13.實施形態6之伺服器裝置之動作)
接著,針對本實施形態之伺服器裝置100之各部分進行之動作,使用圖26之流程圖進行說明。若對伺服器裝置100投入電源,則CPU501開始圖26之流程圖所示之控制處理。
詢問接收部104從終端機裝置200接收指定有圖像之識別 資訊、該圖像內之位置、轉換資訊之詢問(步驟S601)。例如接收指定有圖像601之圖像URL、位置「(75:175)」及翻譯後語言「西班牙語」之詢問。
回答發送部105判斷是否快取與該詢問所指定之識別資訊、包含位置之指定區域、及翻譯後語言對應之轉換完文字行(步驟S602)。
若回答發送部105判斷快取該轉換完文字行(步驟S602;Yes),則將指定有快取之轉換完文字行之回答向終端機裝置200發送(步驟S603)。例如與圖像601之圖像URL、含指定位置「(75:175)」之指定區域、及翻譯後語言「西班牙語」對應之轉換完文字行「Agua」登錄於儲存於伺服器裝置100之擷取資訊表101a之情形中(圖24),回答發送部104對終端機裝置200發送指定有該轉換完文字行之回答。
另一方面,若回答發送部105判斷未快取該轉換完文字行(步驟S602;No),則將指定有未快取該轉換完文字行主旨之訊息之回答向終端機裝置200發送(步驟S604)。例如與圖像601之圖像URL、含指定位置之指定區域、及翻譯後語言「西班牙語」對應之轉換完文字行未登錄於儲存於伺服器裝置100之擷取資訊表101a之情形中,回答發送部104將指定有未快取該轉換完文字行主旨之訊息之回答向終端機裝置200發送。
另,本實施形態中,亦可詢問接收部104接收指定有圖像URL及位置之詢問,回答發送部105發送指定有與該圖 像URL及包含該位置之指定區域對應之轉換完文字行之回答。
例如接收指定有圖像601之圖像URL及指定位置「(75:175)」之詢問之情形中,回答發送部105參照圖24之擷取資訊表101a,獲得與該圖像URL及含該位置之指定區域對應之轉換完文字行「水」、「Agua」、「L'eau」。然後,回答發送部105將指定有該等所有轉換完文字行之回答向終端機裝置200發送。若終端機裝置200接收該回答,則終端機裝置200中,例如顯示如圖25(c)所示之彈出視窗816。或回答發送部105亦可選擇與目前為止請求中指定頻率最高之翻譯後語言對應之轉換完文字行,發送指定有該轉換完文字行之回答。又或回答發送部105亦可從登錄於擷取資訊表101a之轉換完文字行中隨機選擇,發送指定有該轉換完文字行之回答。
根據本實施形態,僅藉由滑鼠移至圖像內之區域上等,即可讓使用者獲知針對該區域之轉換處理(翻譯處理)是否結束。
(14.實施形態7之終端機裝置之概要構成)
實施形態7之程式係以在可與伺服器裝置通信之終端機裝置上,顯示以伺服器裝置所進行之文字辨識或轉換處理結果之方式發揮功能者。
如圖27所示,本實施形態之程式動作之終端機裝置200由顯示部201、位置檢測部202、詢問發送部203、回答接收部204、區域檢測部205、設定部206、請求接收部207、 應答接收部208構成。
顯示部201將藉由識別資訊識別之圖像顯示於畫面上。
例如如圖22(a)所示,顯示部201顯示指定為圖像URL「http://xxx.601.jpg」之圖像601
本實施形態中,CPU501及圖像處理部505協動,作為顯示部201發揮功能。
位置檢測部202檢測顯示於畫面之圖像內之位置之選擇。
例如如圖22(a)所示,若游標701與圖像內重疊,則位置檢測部202檢測該游標701之位置座標。
本實施形態中,CPU501及圖像處理部505協動,作為位置檢測部202發揮功能。
若檢測位置之選擇,則詢問發送部203將指定有識別資訊與該選擇位置之詢問向伺服器裝置100發送。
例如圖22(a)之情形中,詢問發送部203將指定有圖像601之圖像URL與位置座標「(75:175)」之詢問向伺服器裝置100發送。
本實施形態中,CPU501及NIC504協動,作為詢問發送部203發揮功能。
回答接收部204從伺服器裝置100接收回答。然後,顯示部201於畫面上進而顯示接收之回答所指定之擷取資訊。
例如回答接收部204接收指定有辨識完文字行「Water」之回答。此時,如圖22(a)所示,顯示部201顯示含該辨識完文字行之彈出視窗811。
本實施形態中,CPU501及NIC504協動,作為回答接收部204發揮功能。
區域檢測部205檢測顯示於畫面之圖像內之區域選擇。
例如如圖9(a)所示,若在圖像內拖曳游標701,則區域檢測部205檢測拖曳到之區域(區域902)之座標。
本實施形態中,CPU501及圖像處理部505協動,作為區域檢測部205發揮功能。
設定部206促使圖像處理用參數之設定。
例如設定部206促使文字辨識所使用之辨識用語言之設定。
本實施形態中,CPU501作為設定部206發揮功能。
請求接收部207係檢測區域之選擇時,將指定有識別資訊、所設定之參數、該選擇之區域之請求向伺服器裝置100發送。
例如若如圖9(a)所示指定區域,檢測該區域之座標時,則請求發送部207將指定有圖像URL「http://xxx.601.jpg」、辨識用語言「英語」、所選擇區域之座標「(5、100):(48、200)」之請求向伺服器裝置100發送。
本實施形態中,CPU501及NIC504協動,作為請求發送部207發揮功能。
應答接收部208從伺服器裝置100接收應答。然後,顯示部201於畫面進而顯示接收之應答中所指定之擷取資訊。
例如應答接收部208接收指定有辨識完文字行「Sale」之應答。此時,例如如圖13(a)所示,顯示部201使半透明 矩形931與辨識完文字行「Sale」重疊顯示。
本實施形態中,CPU501及NIC504協動,作為應答接收部208發揮功能。
(15.實施形態7之終端機裝置之動作)
接著,針對本實施形態之終端機裝置200之各部分進行之動作,使用圖28之流程圖進行說明。若對終端機裝置200投入電源,則CPU501開始圖28之流程圖所示之控制處理。
顯示部201將藉由識別資訊識別之圖像顯示於畫面上(步驟S701)。位置檢測部202判斷是否檢測顯示於該畫面之圖像內之位置之選擇(步驟S702)。
例如顯示部201顯示指定為圖像URL「http://xxx.601.jpg」之圖像601,若使游標701與圖像601重疊,則位置檢測部202檢測游標701之位置座標「(75:175)」(圖22(a))。
若藉由位置檢測部202判斷已檢測位置之選擇(步驟S702;Yes),則詢問發送部203將指定有識別資訊與該選擇位置之詢問向伺服器裝置100發送(步驟S703)。然後,回答接收部204從伺服器裝置100接收相對於應答之回答(步驟S704)。顯示部201於畫面上進而顯示接收之回答所指定之擷取資訊(步驟S705)。
例如詢問發送部203將指定有圖像601之圖像URL與位置座標「(75:175)」之詢問向伺服器裝置100發送。然後,回答接收部204接收在含該位置座標之區域上,指定有由文字辨識所得之辨識完文字行「Water」之回答。若接收該 回答,則如圖22(a)所示,顯示部201顯示含該辨識完文字行之彈出視窗811。
另一方面,藉由位置檢測部202未判斷出檢測位置之選擇之情形中(步驟S702;No),區域檢測部205判斷是否檢測顯示於畫面之圖像內區域之選擇(步驟S706)。
例如如圖9(a)所示,若藉由使用者在圖像內拖曳游標701,則區域檢測部205檢測拖曳到的區域(區域902)之座標「(5、100):(48、200)」
若藉由區域檢測部205判斷檢測區域之選擇(步驟S706;Yes),則設定部206促使圖像處理用參數之設定(步驟S707)。請求發送部207將指定有識別資訊、設定參數、該選擇區域之請求向伺服器裝置100發送(步驟S708)。然後,應答接收部208從伺服器裝置100接收對應於該請求之應答(步驟S709)。顯示部201於畫面上進而顯示接收之應答所指定之擷取資訊(步驟S710)。
例如設定部206促使文字辨識所使用之辨識用語言之設定,若設定辨識用語言「英語」,則請求發送部207將指定有圖像601之圖像URL、辨識用語言「英語」、區域座標「(5、100):(48、200)」之請求向伺服器裝置100發送。然後,應答接收部208接收在與該區域重複之區域上,指定有由文字辨識所得之辨識完文字行「Sale」之應答。若接收該應答,則例如如圖13(a)所示,顯示部201使半透明矩形931與辨識完文字行「Sale」重疊顯示。
另一方面,藉由區域檢測部205未判斷出檢測區域之選 擇之情形中(步驟S706;No),或若步驟S705、S710之處理結束,則返回至步驟S701。
另,本實施形態中,回答接收部204所接收之回答中,亦可進而指定顯示擷取資訊從圖像之哪一區域擷取之區域資訊。然後,本實施形態之程式亦可使圖像之識別資訊、擷取資訊、區域資訊對應,在終端機裝置200快取。此時,若使用者對於識別資訊與該圖像相同之圖像,將滑鼠移至在快取之區域資訊所含之區域,則顯示部201將對應於該區域資訊之擷取資訊顯示於畫面上。
又,應答接收部208所接收之應答中,亦可進而指定顯示擷取資訊從圖像之哪一區域擷取之區域資訊。然後,本實施形態之程式亦可使圖像之識別資訊、擷取資訊、區域資訊對應,在終端機裝置200快取。此時,若使用者對識別資訊與該圖像相同之圖像,以與快取之區域資訊所示區域重複之方式選擇區域,則顯示部201將對應於該區域資訊之擷取資訊顯示於畫面上。區域重複與否之判斷例如可與實施形態2之情形相同地進行。
又,本實施形態之程式藉由瀏覽器執行之各種腳本語言等記述。
根據本實施形態,可在可與伺服器裝置通信之終端機裝置上顯示伺服器裝置所進行之文字辨識或轉換處理結果,可在終端機裝置上即時顯示WEB頁面內之圖像之文字。
另,上述實施形態係用以說明者,並非限制本申請發明之範圍。又,本申請發明不限於向如上述實施形態所示之 特定技術規格之套用。因此若係相關領域技術人員則可採用將本申請之各要件或所有要件置換成與其均等者之實施形態,但該等實施形態亦包含在本發明範圍內。
本發明基於2011年4月28日申請之日本專利申請2011-101534號,本說明書中將日本專利申請2011-101534號說明書、專利申請範圍、附圖全體作為參考引用。
[產業上之可利用性]
根據本發明,可提供適合即時翻譯WEB頁面內之圖像之文字之伺服器裝置、伺服器裝置之控制方法、程式、及記錄媒體。
100‧‧‧伺服器裝置
101‧‧‧請求接收部
102‧‧‧圖像處理部
103‧‧‧應答發送部
104‧‧‧詢問接收部
105‧‧‧回答發送部
200‧‧‧終端機裝置
201‧‧‧顯示部
202‧‧‧位置檢測部
203‧‧‧詢問發送部
204‧‧‧回答接收部
205‧‧‧區域檢測部
206‧‧‧設定部
207‧‧‧請求發送部
208‧‧‧應答接收部
211‧‧‧終端機裝置
212~21n‧‧‧終端機裝置
300‧‧‧網路
400‧‧‧WEB伺服器裝置
500‧‧‧資訊處理裝置
501‧‧‧CPU
502‧‧‧ROM
503‧‧‧RAM
504‧‧‧NIC
505‧‧‧圖像處理部
506‧‧‧聲音處理部
507‧‧‧DVD-ROM驅動器
508‧‧‧介面
509‧‧‧外部記憶體
510‧‧‧控制器
511‧‧‧監視器
512‧‧‧揚聲器
600‧‧‧WEB頁面
601‧‧‧圖像
602‧‧‧圖像
603‧‧‧圖像
604‧‧‧文字
605‧‧‧文字
606‧‧‧文字
701‧‧‧游標
801‧‧‧彈出視窗
802‧‧‧按鈕
803‧‧‧彈出視窗
804‧‧‧按鈕
805‧‧‧按鈕
806‧‧‧彈出視窗
807‧‧‧彈出視窗
809‧‧‧彈出視窗
810‧‧‧彈出視窗
811‧‧‧彈出視窗
812‧‧‧彈出視窗
813‧‧‧彈出視窗
814‧‧‧彈出視窗
815‧‧‧彈出視窗
816‧‧‧彈出視窗
901‧‧‧矩形
902‧‧‧區域
903‧‧‧區域
904‧‧‧區域
905‧‧‧區域
906‧‧‧區域
907‧‧‧區域
908‧‧‧區域
909‧‧‧區域
910‧‧‧區域
911‧‧‧角
912‧‧‧角
921‧‧‧辨識區域
922‧‧‧辨識區域
923‧‧‧辨識區域
931‧‧‧矩形
932‧‧‧矩形
933‧‧‧矩形
941‧‧‧矩形
圖1係顯示本發明之實施形態之伺服器裝置、WEB伺服器裝置、及終端機裝置之關係圖。
圖2係顯示實現本發明之實施形態之伺服器裝置或終端機裝置之典型資訊處理裝置之概要構成之圖。
圖3係用以說明終端機裝置顯示之WEB頁面之例之圖。
圖4係用以說明實施形態1之伺服器裝置之概要構成之圖。
圖5(a)-(c)係用以說明WEB頁面內之圖像之例之圖。
圖6係用以說明擷取資訊表之圖。
圖7係用以說明WEB頁面內之圖像之例之圖。
圖8係用以說明實施形態1之伺服器裝置之各部分進行之控制處理之流程圖。
圖9(a)-(d)係用以說明指定區域之圖。
圖10係用以說明擷取資訊表之圖。
圖11係用以說明辨識區域之圖。
圖12係用以說明擷取資訊表之圖。
圖13(a)-(d)係用以說明指定區域之重複之圖。
圖14係用以說明實施形態2之伺服器裝置之各部分進行之控制處理之流程圖。
圖15(a)-(c)係用以說明WEB頁面內之圖像之例之圖。
圖16係用以說明擷取資訊表之圖。
圖17(a)-(d)係用以說明WEB頁面內之圖像之例之圖。
圖18係用以說明實施形態3之伺服器裝置之各部分進行之控制處理之流程圖。
圖19係用以說明實施形態4之伺服器裝置之概要構成之圖。
圖20(a)、(b)係用以說明WEB頁面內之圖像之例之圖。
圖21係用以說明實施形態4之伺服器裝置之各部分進行之控制處理之流程圖。
圖22(a)-(c)係用以說明WEB頁面內之圖像之例之圖。
圖23係用以說明實施形態5之伺服器裝置之各部分進行之控制處理之流程圖。
圖24係用以說明擷取資訊表之圖。
圖25(a)-(c)係用以說明WEB頁面內之圖像之例之圖。
圖26係用以說明實施形態6之伺服器裝置之各部分進行之控制處理之流程圖。
圖27係用以說明實施形態7之程式動作之終端機裝置之 概要構成之圖。
圖28係用以說明實施形態7之終端機裝置之各部分進行之控制處理之流程圖。
100‧‧‧伺服器裝置
101‧‧‧請求接收部
102‧‧‧圖像處理部
103‧‧‧應答發送部
200‧‧‧終端機裝置
400‧‧‧WEB伺服器裝置
503‧‧‧RAM

Claims (8)

  1. 一種伺服器裝置,其特徵在於具備:請求接收部,其從終端機接收指定有圖像之識別資訊與指定該圖像內之區域之指定區域之轉換請求;圖像處理部,其基於前述接收之轉換請求中所指定之識別資訊獲取圖像,並輸出表示對由前述獲取之圖像內之前述指定區域所特定之區域套用文字辨識處理而得到之辨識完文字行之擷取資訊;及應答發送部,其將在由前述圖像處理部輸出之擷取資訊所表示之辨識完文字行套用轉換處理而得到之轉換完文字行向前述終端機發送;且當輸出前述擷取資訊時,前述圖像處理部與相對於該擷取資訊之圖像之識別資訊及基於前述指定區域所設定之區域對應而快取該輸出之擷取資訊;判定由前述請求接收部接收之轉換請求中所指定之識別資訊及指定區域與已快取之識別資訊及區域是否對應,於判定為對應之情形時,前述圖像處理部取代前述圖像之獲取及前述文字辨識處理之套用,利用前述已快取之擷取資訊;前述圖像處理部將前述指定區域修正成在前述指定區域內該辨識完文字行經辨識之辨識區域,將前述辨識區域作為基於前述指定區域所設定之區域而與前述擷取資訊加以對應並進行快取;前述辨識區域係藉由長方形而特定之區域,且該長方 形係:包含前述辨識完文字行,且使長方形之縱方向及橫方向之長度為最小之長方形。
  2. 如請求項1之伺服器裝置,其中當在快取前述辨識完文字行時對應之識別資訊與前述接收之轉換請求中所指定之識別資訊一致,且快取前述辨識完文字行時對應之區域與前述接收之轉換請求中所指定之指定區域重複之情形時,前述圖像處理部判定前述接收之轉換請求中所指定之識別資訊及指定區域與已快取之識別資訊及區域為對應。
  3. 如請求項1或2之伺服器裝置,其中前述轉換請求中更指定辨識用語言,利用前述圖像處理部之文字辨識處理係藉由前述辨識用語言進行。
  4. 如請求項1或2之伺服器裝置,其中前述轉換請求中更指定翻譯後語言,前述圖像處理部對前述得到之辨識完文字行使用前述接收之轉換請求中所指定之翻譯後語言進行轉換處理,藉此得到前述轉換完文字行。
  5. 如請求項1或2之伺服器裝置,其中進而具備:詢問接收部,其從前述終端機接收指定有圖像之識別資訊與該圖像內之位置之詢問;及回答發送部,其在由前述圖像處理部已快取與前述接收之詢問中所指定之識別資訊、及包含前述接收之詢問中所指定之位置之指定區域對應之辨識完文字行之情形 時,將指定有該已快取之辨識完文字行之回答向前述終端機發送。
  6. 一種程式,其係供具備將由識別資訊識別之圖像顯示於畫面上之顯示部、且可與如請求項5之伺服器裝置通信之電腦執行者,該程式使該電腦作為以下機構而發揮功能:位置檢測部,其檢測顯示於前述畫面上之圖像內之位置之選擇;詢問發送部,其於檢測前述位置之選擇時,將指定有前述識別資訊、該經選擇之位置之詢問向前述伺服器裝置發送;及回答接收部,其從前述伺服器裝置接收回答;且該程式使該電腦以使前述顯示部於前述畫面上進而顯示前述接收之回答中所指定之擷取資訊之方式發揮功能;且該程式使該電腦作為以下機構而發揮功能:區域檢測部,其檢測顯示於前述畫面上之圖像內之區域之選擇;設定部,其促使圖像處理用參數之設定;請求發送部,其於檢測前述區域之選擇時,將指定有前述識別資訊、前述設定之參數、該選擇之區域之請求向前述伺服器裝置發送;及應答接收部,其從前述伺服器裝置接收應答;且該程式使該電腦以使前述顯示部於前述畫面上進而顯 示前述接收之應答中所指定之擷取資訊之方式發揮功能。
  7. 一種伺服器裝置之控制方法,該伺服器裝置包含請求接收部、圖像處理部及應答發送部,該控制方法係由該伺服器裝置所執行,該方法之特徵在於具備:請求接收步驟,前述請求接收部從終端機接收指定有圖像之識別資訊及對於指定該圖像內之區域之指定區域之轉換請求;圖像處理步驟,前述圖像處理部基於前述接收之轉換請求中所指定之識別資訊獲取圖像,並輸出表示對由前述獲取之圖像內之前述指定區域所特定之區域套用文字辨識處理而得到之辨識完文字行之擷取資訊;及應答發送步驟,前述應答發送部將在由前述圖像處理部輸出之擷取資訊所表示之辨識完文字行套用轉換處理而得到之轉換完文字行向前述終端機發送;且前述圖像處理步驟中,當輸出前述擷取資訊時,前述圖像處理部與相對於該擷取資訊之圖像之識別資訊及基於前述指定區域所設定之區域對應而快取該輸出之擷取資訊;判定由前述請求接收部接收之轉換請求中所指定之識別資訊及指定區域與已快取之識別資訊及區域是否對應,於判定為對應之情形時,前述圖像處理部取代前述圖像之獲取及前述文字辨識處理之套用,利用前述已快取之擷取資訊; 前述圖像處理部將前述指定區域修正成在前述指定區域內該辨識完文字行經辨識之辨識區域,將前述辨識區域作為基於前述指定區域所設定之區域而與前述擷取資訊加以對應並進行快取;前述辨識區域係藉由長方形而特定之區域,且該長方形係:包含前述辨識完文字行,且使長方形之縱方向及橫方向之長度為最小之長方形。
  8. 一種程式,其特徵在於使電腦作為以下機構而發揮功能:請求接收部,其從終端機接收指定有圖像之識別資訊與指定該圖像內之區域之指定區域之轉換請求;圖像處理部,其基於前述接收之轉換請求中所指定之識別資訊獲取圖像,並輸出表示對由前述獲取之圖像內之前述指定區域所特定之區域套用文字辨識處理而得到之辨識完文字行之擷取資訊;及應答發送部,其將於由前述圖像處理部輸出之擷取資訊所表示之辨識完文字行套用轉換處理而得到之轉換完文字行向前述終端機發送;且當輸出前述擷取資訊時,前述圖像處理部與相對於該擷取資訊之圖像之識別資訊及基於前述指定區域所設定之區域對應而快取該輸出之擷取資訊;判定由前述請求接收部接收之轉換請求中所指定之識別資訊及指定區域與已快取之識別資訊及區域是否對應,於判定為對應之情形時,前述圖像處理部取代前述 圖像之獲取及前述文字辨識處理之套用,利用前述快取之擷取資訊;前述圖像處理部將前述指定區域修正成在前述指定區域內該辨識完文字行經辨識之辨識區域,將前述辨識區域作為基於前述指定區域所設定之區域而與前述擷取資訊加以對應並進行快取;前述辨識區域係藉由長方形而特定之區域,且該長方形係:包含前述辨識完文字行,且使長方形之縱方向及橫方向之長度為最小之長方形。
TW101115283A 2011-04-28 2012-04-27 Server device, server device control method, program, and recording medium TWI595368B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011101534A JP5606385B2 (ja) 2011-04-28 2011-04-28 サーバ装置、サーバ装置の制御方法、及び、プログラム

Publications (2)

Publication Number Publication Date
TW201250499A TW201250499A (en) 2012-12-16
TWI595368B true TWI595368B (zh) 2017-08-11

Family

ID=47072354

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101115283A TWI595368B (zh) 2011-04-28 2012-04-27 Server device, server device control method, program, and recording medium

Country Status (7)

Country Link
US (1) US9396392B2 (zh)
EP (1) EP2704014B1 (zh)
JP (1) JP5606385B2 (zh)
CN (1) CN103502962B (zh)
ES (1) ES2725556T3 (zh)
TW (1) TWI595368B (zh)
WO (1) WO2012147839A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5606385B2 (ja) * 2011-04-28 2014-10-15 楽天株式会社 サーバ装置、サーバ装置の制御方法、及び、プログラム
JP5339316B1 (ja) * 2012-05-31 2013-11-13 楽天株式会社 識別情報管理システム、識別情報管理システムの制御方法、情報処理装置、及びプログラム
WO2014155742A1 (ja) 2013-03-29 2014-10-02 楽天株式会社 情報処理システム、情報処理システムの制御方法、情報処理装置、情報処理装置の制御方法、情報記憶媒体、及びプログラム
JP5786106B2 (ja) 2013-03-29 2015-09-30 楽天株式会社 情報処理システム、情報処理方法、データ、情報処理装置、表示装置、表示方法、プログラムおよび情報記憶媒体
US9189622B2 (en) * 2013-04-30 2015-11-17 Vmware, Inc. Static redirection for objective C
KR102135358B1 (ko) * 2013-11-05 2020-07-17 엘지전자 주식회사 이동 단말기 및 이의 제어방법
JP6920996B2 (ja) * 2015-10-08 2021-08-18 株式会社ナイトレイ 外国人観光客の行動情報を生成するための装置、方法、及びプログラム
CN107665087B (zh) * 2016-07-28 2021-03-16 夏普株式会社 图像显示装置、图像显示方法以及图像显示系统
JP6862952B2 (ja) 2017-03-16 2021-04-21 株式会社リコー 情報処理システム、情報処理装置、情報処理プログラム及び情報処理方法
CN107729897B (zh) * 2017-11-03 2020-09-15 北京字节跳动网络技术有限公司 一种文本操作方法、装置及终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080119236A1 (en) * 2006-11-22 2008-05-22 Industrial Technology Research Institute Method and system of using mobile communication apparatus for translating image text
TW200825855A (en) * 2006-12-06 2008-06-16 Ind Tech Res Inst A method and system for converting text image into character code are provided for mobile communication device

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761655A (en) 1990-06-06 1998-06-02 Alphatronix, Inc. Image file storage and retrieval system
JPH10312381A (ja) * 1997-05-12 1998-11-24 Nippon Hoso Kyokai <Nhk> 翻訳方法および装置
JP4065473B2 (ja) * 1999-05-14 2008-03-26 キヤノン株式会社 画像処理装置及び方法及び記憶媒体及びシステム
JP2000330992A (ja) * 1999-05-17 2000-11-30 Nec Software Shikoku Ltd 多国言語対応wwwサーバシステム及びその処理方法
US7216072B2 (en) 2000-02-29 2007-05-08 Fujitsu Limited Relay device, server device, terminal device, and translation server system utilizing these devices
JP4073635B2 (ja) * 2000-02-29 2008-04-09 富士通株式会社 中継装置、サーバ装置、端末装置、及びこれを利用した翻訳サーバシステム
JP2003122751A (ja) * 2001-10-12 2003-04-25 Alps Electric Co Ltd 翻訳装置
US7447624B2 (en) 2001-11-27 2008-11-04 Sun Microsystems, Inc. Generation of localized software applications
JP2003178067A (ja) 2001-12-10 2003-06-27 Mitsubishi Electric Corp 携帯端末型画像処理システム、携帯端末およびサーバ
JP3737779B2 (ja) * 2002-05-29 2006-01-25 富士通株式会社 翻訳サーバ、翻訳方法及びプログラム
US20060135137A1 (en) * 2002-11-29 2006-06-22 Chung Eun Young System and method for providing integrated communication id
US7496230B2 (en) 2003-06-05 2009-02-24 International Business Machines Corporation System and method for automatic natural language translation of embedded text regions in images during information transfer
JP2007079978A (ja) * 2005-09-14 2007-03-29 Fuji Xerox Co Ltd 翻訳システムおよび翻訳方法
US7698344B2 (en) 2007-04-02 2010-04-13 Microsoft Corporation Search macro suggestions relevant to search queries
CN101833648B (zh) * 2009-03-13 2012-05-02 汉王科技股份有限公司 文本图像的校正方法
JP2010277168A (ja) * 2009-05-26 2010-12-09 Fuji Xerox Co Ltd データ入力システム、データ入力受付装置及びプログラム
CN101881999B (zh) * 2010-06-21 2012-11-21 安阳师范学院 甲骨文视频输入系统及实现方法
WO2011161825A1 (ja) 2010-06-25 2011-12-29 楽天株式会社 機械翻訳システム及び機械翻訳方法
US9250834B2 (en) * 2010-12-01 2016-02-02 Xerox Corporation Method and apparatus for reading and replacing control and/or identification data in a print image to support document tracking, flow control, and security
JP5606385B2 (ja) * 2011-04-28 2014-10-15 楽天株式会社 サーバ装置、サーバ装置の制御方法、及び、プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080119236A1 (en) * 2006-11-22 2008-05-22 Industrial Technology Research Institute Method and system of using mobile communication apparatus for translating image text
TW200825855A (en) * 2006-12-06 2008-06-16 Ind Tech Res Inst A method and system for converting text image into character code are provided for mobile communication device

Also Published As

Publication number Publication date
CN103502962A (zh) 2014-01-08
US20140056525A1 (en) 2014-02-27
JP2012234287A (ja) 2012-11-29
ES2725556T3 (es) 2019-09-24
US9396392B2 (en) 2016-07-19
WO2012147839A1 (ja) 2012-11-01
EP2704014A4 (en) 2015-03-11
EP2704014A1 (en) 2014-03-05
JP5606385B2 (ja) 2014-10-15
TW201250499A (en) 2012-12-16
EP2704014B1 (en) 2019-03-27
CN103502962B (zh) 2016-06-22

Similar Documents

Publication Publication Date Title
TWI595368B (zh) Server device, server device control method, program, and recording medium
EP2703980B1 (en) Text recognition apparatus and method for a terminal
KR102238809B1 (ko) 터치스크린 상에 표시되는 조치 가능한 콘텐츠
KR102001218B1 (ko) 객체와 관련된 정보 제공 방법 및 이를 위한 디바이스
CN105279152B (zh) 一种取词翻译的方法和装置
JP5080432B2 (ja) 画像処理装置及び方法、並びにプログラム
CN109918685A (zh) 计算机辅助翻译方法、装置、计算机设备及存储介质
CN104078038B (zh) 一种页面内容朗读方法和装置
CN106527945A (zh) 文本信息提取方法及装置
CN109782997B (zh) 一种数据处理方法、装置及存储介质
US20160080298A1 (en) Method for generating emoticon and electronic device supporting the same
JP2012234287A5 (zh)
US9614984B2 (en) Electronic document generation system and recording medium
CN103402131A (zh) 一种二维码识别方法、机顶盒及系统
JP2012194879A (ja) 情報処理装置、情報処理方法及びプログラム
JP2017004483A (ja) 多国語ウェブトゥーンの製作システム及びその方法
JP5459046B2 (ja) 情報処理装置、情報処理方法、およびプログラム、並びに情報処理システム
US11853685B2 (en) Transformation of resource files using mapped keys for tracking content location
JP5991323B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP6822261B2 (ja) 情報処理装置、プログラムおよび情報処理方法
WO2023273667A1 (zh) 数据处理方法、装置、服务器、客户端、介质和产品
JP2007172168A (ja) 情報提示装置
JP2007282100A (ja) 画像処理システムおよび画像処理方法
CN114138871A (zh) 对象的收藏方法、装置、电子设备以及存储介质
JP2012108749A (ja) 文書画像表示制御装置および携帯型端末装置ならびにそれらの動作制御方法およびその動作制御プログラム