TW202030627A - 資料擷取方法及其系統 - Google Patents

資料擷取方法及其系統 Download PDF

Info

Publication number
TW202030627A
TW202030627A TW108107713A TW108107713A TW202030627A TW 202030627 A TW202030627 A TW 202030627A TW 108107713 A TW108107713 A TW 108107713A TW 108107713 A TW108107713 A TW 108107713A TW 202030627 A TW202030627 A TW 202030627A
Authority
TW
Taiwan
Prior art keywords
character
image
data
pixels
data image
Prior art date
Application number
TW108107713A
Other languages
English (en)
Other versions
TWI697795B (zh
Inventor
吳根開
Original Assignee
緯創資通股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 緯創資通股份有限公司 filed Critical 緯創資通股份有限公司
Application granted granted Critical
Publication of TWI697795B publication Critical patent/TWI697795B/zh
Publication of TW202030627A publication Critical patent/TW202030627A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本發明之實施例提供一種資料擷取方法,其根據目標軟體視窗的控制代碼取得目標軟體視窗的當前圖像,並根據至少一目標擷取區從當前圖像中擷取出至少一資料圖像,以根據至少一資料圖像從字符圖像資料庫中取出對應的至少一字符圖像與對應的至少一代表字符,並輸出對應至少一資料圖像的至少一代表字符,使得目標軟體視窗之資料擷取不因其他軟體視窗之遮擋而受到影響,進而提升了資料擷取之效率。

Description

資料擷取方法及其系統
本發明之一實施例係關於資料擷取技術,特別是一種資料擷取方法及其系統。
隨著工業4.0的發展,設備運行的資料,如軟體視窗中的狀態和參數皆需要被實時擷取並上傳至遠端伺服器。然而,仍有諸多設備並不支援且亦無預留軟體介面或硬體介面以供資料擷取之進行。
為了進行資料擷取,一般是直接對設備之顯示器的整個桌面進行截圖,以取得截屏圖像後,再利用光學字元辨識軟體對此截屏圖像進行解析,以擷取出所需的資料。然而,此種資料擷取之方式卻時常受到軟體視窗未最大化或不在桌面之最前端的影響而出現擷取錯誤等問題,使得資料擷取與其他軟體視窗之操作無法同步進行,致使設備運行效率低下。
本發明之一實施例提供一種資料擷取方法,包含:根據目標軟體視窗的控制代碼取得目標軟體視窗的當前圖像;根據至少一目標擷取區從當前圖像中擷取出至少一資料圖像;根據至少一資料圖像從字符圖像資料庫中取出對應的至少一字符圖像與對應的至少一代表字符;及輸出對應至少一資料圖像之至少一代表字符。
本發明之一實施例更提供一種資料擷取系統,包含字符圖像資料庫、處理器以及通訊裝置。字符圖像資料庫用以儲存複數字符圖像。處理器用以根據目標軟體視窗的控制代碼取得目標軟體視窗的當前圖像。並且,處理器根據至少一目標擷取區從當前圖像中擷取出至少一資料圖像,且根據至少一資料圖像從字符圖像資料庫中取出對應的至少一字符圖像與對應的至少一代表字符。通訊裝置用以輸出對應至少一資料圖像的至少一代表字符。
為使本發明之實施例之上述目的、特徵和優點能更明顯易懂,下文配合所附圖式,作詳細說明如下。
第1圖為資料擷取系統之一實施例的方塊圖,且第2圖為複數軟體視窗顯示於顯示器桌面上之一實施例的概要示意圖。請參閱第1圖與第2圖,資料擷取系統100可實時從目標軟體視窗Wt中擷取出所需的資料,並將擷取到的資料傳輸至與其通訊耦接的伺服器200,以利資料的後續使用。
在一實施例中,資料擷取系統100可包含字符圖像資料庫110、處理器120以及通訊裝置130。並且,處理器120耦接於字符圖像資料庫110與通訊裝置130。此外,資料擷取系統100可更包含顯示器140,且顯示器140耦接於處理器120。
字符圖像資料庫110用以儲存複數字符圖像I1-In,其中n為大於1之正整數。各字符圖像I1-In中包含單一個字符圖案,且各字符圖像I1~In具有對應的一代表字符以供機器讀取。於此,字符圖案可為數字、英文字母、或其他適用的字元或符號之圖案。
在一些實施態樣中,各字符圖像I1-In為一種圖形檔案,如PNG檔、JPG檔或其他任何合適的圖檔格式。此外,代表字符可依據資料擷取系統100所運用的字符編碼方式而具有相應的編碼值。在一些實施態樣中,字符編碼方式可為ASCII、Unicode、UTF-8或其他合適的編碼方式。
通訊裝置130用以協助處理器120和伺服器200進行通訊。在一些實施態樣中,通訊裝置130可利用有線通訊方式來協助處理器120與伺服器200進行通訊。因此,通訊裝置130可為有線網路(例如:乙太網(Ethernet)、光纖網路、或非對稱數位式用戶線路(Asymmetric Digital Subscriber Line,ADSL)等)。而在另一些實施態樣中,通訊裝置130亦可利用無線通訊方式(例如無線保真技術、或其他電信網路技術)來協助處理器120與伺服器200進行通訊。因此,通訊裝置130可為如藍牙(Bluetooth)、WiFi、無線網路等。
顯示器140用以進行畫面顯示。於此,在顯示器140之桌面上可顯示出一或多個軟體視窗W1-Wm。各軟體視窗W1-Wm可以最大化之顯示格式顯示於桌面,或以最小化之顯示格式縮於桌面的工作列,或者以任意大小之顯示格式顯示於桌面。在一些實施態樣中,顯示器140可為發光二極體顯示器、液晶顯示器或其他合適用以顯示的顯示器。
處理器120可根據本發明任一實施例之資料擷取方法對目標軟體視窗Wt進行資料擷取。在一些實施態樣中,處理器120可例如為系統單晶片(SoC)、中央處理器(CPU)、微控制器(MCU)、特殊應用積體電路(ASIC)、應用處理器(Application Processor,AP)、或數位訊號處理器(Digital Signal Processor,DSP)等,其可包括各式電路邏輯,用以提供數據處理及運算之功能、控制通訊裝置130的運作以提供網路連線、以及從儲存器150讀取或儲存資料。特別是,處理器120係用以協調控制通訊裝置130、儲存器150、以及字符圖像資料庫110之運作,以執行本申請的資料擷取方法。
第3圖為資料擷取方法之一實施例的流程圖。請參閱第1圖至第5圖,在資料擷取方法之一實施例中,處理器120可根據選定視窗標題Tt從複數軟體視窗W1-Wm中篩選出具有此選定視窗標題Tt的目標軟體視窗Wt(步驟S10)。之後,處理器120便可根據目標軟體視窗Wt的控制代碼(handle)Ht去取得此目標軟體視窗Wt的當前圖像F1(步驟S30)。接續,處理器120可根據至少一目標擷取區相應地從當前圖像F1中擷取出至少一資料圖像(步驟S50),並且根據各資料圖像從字符圖像資料庫110中取出對應的至少一字符圖像與對應的至少一代表字符(步驟S70)。之後,處理器120便可透過通訊裝置130輸出對應於至少一資料圖像的至少一代表字符(步驟S90)。例如,透過通訊裝置130將各資料圖像對應到的各代表字符上傳至伺服器200,以利資料的後續使用。
在步驟S10之一實施例中,處理器120可透過第一提取函數取得當前運作中的所有軟體視窗W1-Wm。於此,各軟體視窗W1-Wm具有相應的控制代碼H1-Hm,因此,處理器120於取得所有軟體視窗W1-Wm之時,更可得到此些軟體視窗W1-Wm的控制代碼H1-Hm。此外,處理器120可透過第二提取函數取得此些軟體視窗W1-Wm的視窗標題T1-Tm,並且,處理器120可將取得的控制代碼H1-Hm以及視窗標題T1-Tm依據其對應的軟體視窗W1-Wm為何而鏈結在一起。之後,處理器120即可利用使用者所選定的選定視窗標題Tt於此些軟體視窗W1-Wm中進行篩選,以找出具有此選定視窗標題Tt的目標軟體視窗Wt,並且可相應地找出此目標軟體視窗Wt的控制代碼Ht。
在一些實施例中,第一提取函數與第二提取函數可為作業系統所支援之動態連接程式庫(Dynamic Link Library,DLL)中的函數。舉例而言,作業系統為微軟作業系統時,第一提取函數與第二提取函數分別可為User32.dll(動態連接程式庫)中的GetWindow函數以及GetWindowText函數,但本案並非以此為限。
在一些實施例中,資料擷取系統100可更包含儲存器150,且儲存器150耦接於處理器120。此外,處理器120可將視窗標題T1-Tm以及控制代碼H1-Hm以表格型式儲存於儲存器150中,並且處理器120可根據選定視窗標題Tt以查表方式得到目標軟體視窗Wt的控制代碼Ht。舉例而言,請參閱第4圖,假設選定視窗標題Tt為「VXS nitro 4500 (Typ) Project NO. RS-0378」時,處理器120可以查表方式從表中得到目標軟體視窗Wt所對應的控制代碼Ht為「131768」。在一些實施態樣中,儲存器150可由一或多個儲存元件實現,並且各儲存元件可為但不限於非揮發記憶體,例如唯讀記憶體(ROM)、硬碟(hard disk)或快閃記憶體(flash memory)等或揮發性記憶體,例如隨機存取記憶體(RAM)。
在一些實施例中,選定視窗標題Tt可由使用者預先設定於一設定檔P1中,以致使處理器120可藉由讀取此設定檔P1來得到選定視窗標題Tt。此外,設定檔P1可儲存於儲存器150中,但本發明並非以此為限。
在步驟S30之一實施例中,處理器120可利用第三提取函數來根據控制代碼Ht取得目標軟體視窗Wt的當前圖像F1。其中,當前圖像F1可涵蓋完整的目標軟體視窗Wt,如第5圖所示。於此,無論目標軟體視窗Wt於顯示器140之桌面上是否顯示在最上層,第三提取函數仍可取得目標軟體視窗Wt的當前圖像F1,且所得到的當前圖像F1可只包含目標軟體視窗Wt。如此一來,即可使得目標軟體視窗Wt之資料擷取的執行不再因其他軟體視窗之遮擋(即目標軟體視窗Wt並非顯示於桌面的最上層)而受到影響。
在一些實施態樣中,當作業系統為微軟作業系統時,第三提取函數可為User32.dll中的PrintWindow函數,但本案並非以此為限。
在步驟S50之一實施例中,目標擷取區可預先設定於設定檔P1中,且處理器120可藉由讀取設定檔P1來根據目標擷取區從當前圖像F1中相應地擷取出資料圖像。以下,以三個目標擷取區A1-A3,且處理器120相應地從當前圖像F1中擷取出三個資料圖像D1-D3為例來進行說明,但其數量並非用以限定本發明。
在一些實施例中,使用者可預先藉由在目標軟體視窗Wt上分別框選出目標擷取區A1-A3的範圍之方式來設定目標擷取區A1-A3。此外,於框選完後,各目標擷取區A1-A3可以其在目標軟體視窗Wt上的對應座標之方式儲存於設定檔P1中,但本發明並非僅限於此。在另一些實施例中,使用者亦可直接鍵入各目標擷取區A1-A3之四角在目標軟體視窗Wt上的對應座標之方式來設定於設定檔P1中。
在一些實施例中,於步驟S50中所擷取出的各資料圖像D1-D3中可分別包含至少一待測字符,且此些待測字符是以單行排列,如第6圖所示。換言之,各目標擷取區A1-A3之範圍亦僅能涵蓋單行的字符,如第5圖所示。以下,以包含三個待測字符X1-X3的資料圖像D1為例來行說明,但其數量並非用以限定本發明。此外,以下為簡潔說明,故僅以資料圖像D1來進行解說,但其餘資料圖像D2、D3之處理可參照資料圖像D1之處理方式來進行。
第7圖為資料擷取方法之另一實施例的流程圖。請參閱第1圖至第7圖,在資料擷取方法之一實施例中,於步驟S70之執行前,處理器120更可先對各資料圖像D1-D3進行圖像處理(步驟S60),以利步驟S70中解析處理的進行。
第8圖為第7圖中步驟S60之一實施例的流程圖。請參閱第1圖至第8圖,在步驟S60之一實施例中,資料圖像D1可包含以矩陣型式排列的複數像素,且處理器120可對資料圖像D1的複數像素進行顏色識別,以識別出各像素所顯示的顏色(步驟S61)。並且,處理器120可對各顏色所涵蓋的像素數量進行統計,且將顏色相同且於資料圖像D1之所有像素中所佔比例超過一預設比例的複數像素判定成複數底色像素(步驟S62)。接續,處理器120可將資料圖像D1中非為底色像素的像素(以下稱為非底色像素)之顏色替換成第一色,且將資料圖像D1中為底色像素的顏色替換成第二色(步驟S63)。於此,完成顏色替換後之此些非底色像素即是用以顯示待測字符X1-X3的像素。之後,處理器120便可根據各待測字符X1-X3的非底色像素調整於行方向C1上相鄰的此些底色像素之列數(步驟S64),以使得後續之解析處理(即步驟S70)可更順利進行。於此,是以橫向為行(row),並以直向為列(column),且所述的列數為像素於行方向C1上排列的個數。
在步驟S61之一實施例中,處理器120可利用介面函數,如GetPixel函數來識別資料圖像D1中各像素的顏色。
在步驟S62之一實施例中,預設比例可為但不限於50%。此時,處理器120可將顏色相同且於資料圖像D1中所佔比例超過50%的此些像素判定成是用以顯示底色的複數底色像素。並且,處理器120可將資料圖像D1中其餘像素判定成是用以顯示待測字符X1-X3的非底色像素。
在步驟S63之一實施例中,第一色可為黑色,且第二色可為白色,因此,在步驟S63之執行後,資料圖像D1可變成以白底黑字之型式來呈現出待測字符X1-X3,如第9圖所示。但本發明並非僅限於此,第一色與第二色可為不同的任兩個顏色。在一些實施例中,第一色與第二色之選定可視字符圖像資料庫110中各字符圖像I1-In是以何種顏色型式來呈現出字符而定。
在步驟S64之一實施例中,處理器120可對各待測字符X1-X3進行寬度標準化,以使得各待測字符X1-X3的非底色像素與在行方向C1上相鄰的此些底色像素之總列數V1-V3可等於第一預設列數。
在一些實施例中,處理器120可先利用介面函數,如GetPixel函數來識別資料圖像D1中各像素的顏色,以找出此些顏色為第一色的非底色像素之所在位置。之後,利用一般字符之所佔位置是獨立且不相互穿插的特性,處理器120再透過確認同一直列中的各非底色像素與其右側直列中且相鄰的Y個像素是否皆為底色像素來找出各待測字符X1-X3的結束分界線L11、L21、L31。其中,此Y個像素是位在同一直列中,且Y為大於2之正整數。舉例而言,如第10圖所示,假設某一直列中共包含三個非底色像素Z1-Z3,此時處理器120可先確認位於非底色像素Z1之右側直列中且相鄰的三個像素Z4-Z6(假設Y等於3)是否皆為底色像素。當處理器120判定像素Z4-Z6皆為底色像素時,再接續確認位於非底色像素Z2之右側直列中且相鄰的三個像素Z5-Z7是否亦皆為底色像素。並且,於判定像素Z5-Z7亦為底色像素時,處理器120再接續確認位於非底色像素Z3之右側直列中且相鄰的三個像素Z6-Z8是否亦皆為底色像素。當處理器120判定像素Z6-Z8亦為底色像素時,表示非底色像素Z1-Z3為待測字符的結束位置,且結束分界線L1即位在非底色像素Z1-Z3和像素Z4-Z8之間。
因此,於找出各待測字符X1-X3的結束分界線L11、L21、L31之後,處理器120可分別以各結束分界線L11、L21、L31為界,根據先前利用介面函數,如GetPixel函數所得之結果來計算出各待測字符X1-X3之此些非底色像素所佔的列數。在一實施例中,請參閱第11圖,處理器120可藉由找出各待測字符X1-X3的起始分界線L12、L22、L32來計算出各待測字符X1-X3之此些非底色像素所佔的列數。舉例而言,處理器120可透過確認同一直列中的各非底色像素與其左側直列中且相鄰的Y個像素是否皆為底色像素來找出各待測字符X1-X3的起始分界線L12、L22、L32。之後,處理器120便可根據位在結束分界線L11和起始分界線L12間的像素列數得到待測字符X1所佔的列數V11,根據位在結束分界線L21和起始分界線L22間的像素列數得到待測字符X2所佔的列數V21,並根據位在結束分界線L31和起始分界線L32間的像素列數得到待測字符X3所佔的列數V31。
最後,處理器120便可以各待測字符X1-X3為基準,以填充或刪除之方式來調整相鄰於各待測字符X1-X3之結束分界線L11、L21、L31的此些底色像素的列數以及相鄰於各待測字符X1-X3之起始分界線L12、L22、L32的此些底色像素的列數。舉例而言,假設待測字符X1所佔的列數V11為8且第一預設列數為20時,處理器120可將相鄰於結束分界線L11之一側的此些底色像素的列數V12以及相鄰於起始分界線L12之一側的此些底色像素的列數V13分別調成6,以使待測字符X1的此些非底色像素可大致上位於相鄰之此些底色像素的中央。再舉例而言,當待測字符X1所佔的列數V11為9且第一預設列數為20時,此時處理器120可將相鄰於結束分界線L11之一側的此些底色像素的列數V12以及相鄰於起始分界線L12之一側的此些底色像素的列數V13分別調成5與6,或調成6與5,以使待測字符X1的此些非底色像素可大致上位於相鄰之此些底色像素的中央,但本案並非以此為限。
在一些實施例中,待測字符X1之非底色像素的列數V11和相鄰於其結束分界線L11之一側之底色像素的列數V12以及相鄰於其起始分界線L12之一側之底色像素的列數V13的總列數V1等於第一預設列數,待測字符X2之非底色像素的列數V21和相鄰於其結束分界線L21之一側之底色像素的列數V22以及相鄰於其起始分界線L22之一側之底色像素的列數V23的總列數V2等於第一預設列數,待測字符X3之非底色像素的列數V31和相鄰於其結束分界線L31之一側之底色像素的列數V32以及相鄰於其起始分界線L32之一側之底色像素的列數V33的總列數V3等於第一預設列數,且資料圖像D1的總列數VT可等於待測字符X1-X3之個數與第一預設列數的乘積值,如第11圖所示。舉例而言,當第一預設列數為20時,此時資料圖像D1的總列數VT可為60(即20*3)。但本案並非以此為限,第一預設列數之數值可根據各待測字符的實際大小自由設計。
在步驟S64之另一實施例中,處理器120可對各待測字符X1-X3進行間距標準化,以使得各待測字符X1-X3的非底色像素與相鄰之另一待測文字的非底色像素於行方向C1上相隔第二預設列數V4的底色像素。在一些實施例中,處理器120可先判斷出各待測字符X1-X3的結束分界線L11、L21、L31與起始分界線L12、L22、L32。之後,處理器120再根據各待測字符X1-X3的結束分界線L11、L21、L31與相鄰之待測字符的起始分界線去調整位於此之間的底色像素之列數。舉例而言,處理器120可根據待測字符X1的結束分界線L11和待測字符X2的起始分界L22將位於此之間的底色像素之列數調整至第二預設列數V4,並且根據待測字符X2的結束分界線L21和待測字符X3的起始分界L32將位於此之間的底色像素之列數調整至第二預設列數V4,如第12圖所示。在一些實施態樣中,第二預設列數V4可為10,但本發明並非僅限於此,第二預設列數V4可視所需自由設計。
第13圖為步驟S70之一實施例的流程示意圖。請參閱第1圖至第13圖,在步驟S70之一實施例中,處理器120可將資料圖像D1裁切成至少一子資料圖像(步驟S71)。接續,處理器120再根據各子資料圖像分別從字符圖像資料庫110中取出複數個候選字符圖像(步驟S72),並將各子資料圖像分別與其對應的複數候選字符圖像進行匹配(步驟S73)。之後,處理器120可以複數候選字符圖像中與此子資料圖像之匹配率高於預設匹配率的候選字符圖像作為對應於此子資料圖像的字符圖像(步驟S74),並且取出對應於此子資料圖像之字符圖像的代表字符(步驟S75)。
在步驟S71之一實施例中,處理器120可將資料圖像D1按照預定寬度進行裁切,以得到至少一子資料圖像,且各子資料圖像中包含一個待測字符。於此,因資料圖像D1中涵蓋三個待測字符X1-X3,故處理器120可將資料圖像D1裁切成三個子資料圖像D11-D13,如第14圖所示。在一些實施例中,預定寬度可相等於第一預設列數,但本發明並非以此為限。
以下為簡潔說明,僅以子資料圖像D11為例來進行說明,但其餘子資料圖像D12、D13之處理可參照子資料圖像D11之處理方式來進行。
在步驟S72之一實施例中,處理器120可先藉由統計子資料圖像D11中顏色為第一色之此些非底色像素的數量,以得到第一像素數量。於此,字符圖像資料庫110的各字符圖像I1~In依據其顯示的字符圖案而分別具有對應之第二像素數量的非底色像素。因此,處理器120可將子資料圖像D11的第一像素數量和各字符圖像I1-In的第二像素數量進行比對,以初步篩選出與子資料圖像D11相近的多個候選字符圖像。並且,處理器120可以第一像素數量與第二像素數量之間的一差異比例落於一範圍內的字符圖像來作為此子資料圖像D11的候選字符圖像。在一些實施例中,處理器120可分別計算出第一像素數量和各字符圖像I1-In之第二像素數量的差異值,之後,處理器120再將所得的各差異值分別除以相應的第二像素數量,以得到子資料圖像D11和各字符圖像I1-In之間的差異比例。但本案並非以此為限,在另一些實施例中,處理器120亦可將所得的各差異值分別除以相應之字符圖像的總像素數量,以得到子資料圖像D11和各字符圖像I1-In之間的差異比例。在又一些實施例中,處理器120更可分別計算出子資料圖像D11之總像素數量和各字符圖像I1-In之總像素數的總差值,並且將所得的各差異值分別除以相應的總差值,以得到子資料圖像D11和各字符圖像I1-In之間的差異比例。在一些實施態樣中,差異比例可以百分比之形式來表示,並且此範圍可為
Figure 02_image001
%,但本案並非以此為限。
在步驟S73之一實施例中,處理器120可將子資料圖像D11的各個像素和從步驟S72中篩選出來之各候選字符圖像的各個像素依據其位置對應關係進行顏色比對之匹配,以確認在相同位置的像素顏色是否相同。於此,處理器120可將匹配結果以百分率來進行表示。
在步驟S74之一實施例中,處理器120可以匹配率高於預設匹配率(例如98.5%)的候選字符圖像作為對應於此子資料圖像D11的字符圖像,但預設匹配率之數值並非以此為限。
在步驟S70之一實施例中,處理器120於取出各個子資料圖像D11-D13所對應的字符圖像以及代表字符後,處理器120可依據各子資料圖像D11-D13於資料圖像D1中的順序將其對應的代表字符依次串接成代表字符串,而此代表字符串即為資料圖像D1中的資料。並且,在後續步驟S90之執行時,處理器120透過通訊裝置130所輸出的是串接完成後的代表字符串。
在資料擷取方法之一實施例中,處理器120更響應於無法從字符圖像資料庫110中取出任一個資料圖像所對應的字符圖像時,直接返回至步驟S30,以根據新的當前圖像來重新進行解析。但本發明並非以此為限。在另一實施例中,處理器120雖然無法從字符圖像資料庫110中取出某一個資料圖像所對應的字符圖像,例如處理器120無法取得資料圖像D1所對應的字符圖像,但可取得資料圖像D2、D3所對應的字符圖像時,處理器120仍可將資料圖像D2、D3所對應的代表字符上傳至伺服器200,並返回至步驟S30,以根據新的當前圖像來重新進行解析。
在資料擷取方法之一實施例中,處理器120響應於無法取得某一個子資料圖像所對應的字符圖像時,例如處理器120於步驟S72中無法取出相近於子資料圖像D13的任一字符圖像,或於步驟S74中無法找出匹配率高於預設匹配率的字符圖像時,處理器120更可將此子資料圖像D13儲存下來,例如儲存於儲存器150,以待後續使用者可自行以人眼辨識方式進行識別。並且,使用者更可自行將此子資料圖像D13作為新的字符圖像而加進字符圖像資料庫110中,以擴建字符圖像資料庫110。
在一些實施例中,字符圖像資料庫110可為本地資料庫,而和處理器120位於同一裝置中,但本發明並非僅限於此,在另一些實施例中,字符圖像資料庫110亦可為透過遠端連線至連接於處理器120的雲端資料庫,而和處理器120位於不同裝置中。
綜上所述,本發明之實施例提供一種資料擷取系統及資料擷取方法,其透過目標軟體視窗的控制代碼所取得之目標軟體視窗的當前圖像,故可不因其他軟體視窗遮擋於前而受到影響,使得資料擷取與其他軟體視窗之操作可同步運行,提高了運行效率。此外,本發明之實施例係透過子資料圖像與字符圖像資料庫中之字符圖像的匹配比對來得到對應的代表字符,而非採用費用較為昂貴且占用軟體資源較多的光學字元辨識軟體,故可更加降低資料擷取的所需耗費成本與軟體資源。
本發明之實施例揭露如上,然其並非用以限定本發明的範圍,任何所屬技術領域中具有通常知識者,在不脫離本發明實施例之精神和範圍內,當可做些許的更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100:資料擷取系統 110:字符圖像資料庫 120:處理器 130:通訊裝置 140:顯示器 150:儲存器 200:伺服器 C1:行方向 F1:當前圖像 Tt:選定視窗標題 V4:第二預設列數 Wt:目標軟體視窗 P1:設定檔 A1、A2、A3:目標擷取區 D1、D2、D3:資料圖像 H1…Ht…Hm:控制代碼 T1…Tm:視窗標題 X1、X2、X3:待測字符 Z1、Z2、Z3:非底色像素 D11、D12、D13:子資料圖像 L1、L11、L21、L31:結束分界線 L12、L22、L32:起始分界線 V1、V2、V3、VT:總列數 V11、V12、V13:列數 V21、V22、V23:列數 V31、V32、V33:列數 W1、W2、W3…Wm:軟體視窗 I1、I2、I3…In:字符圖像 Z4、Z5、Z6、Z7、Z8:像素 S10、S30、S50、S60、S70、S90:步驟 S61、S62、S63、S64:步驟 S71、S72、S73、S74、S75:步驟
第1圖為資料擷取系統之一實施例的方塊圖。 第2圖為複數軟體視窗顯示於顯示器桌面上之一實施例的概要示意圖。 第3圖為資料擷取方法之一實施例的流程圖。 第4圖為軟體視窗之視窗標題與控制代碼之一實施的關係示意圖。 第5圖為當前圖像之一實施例的概要示意圖。 第6圖為從第5圖之當前圖像中所擷取出之資料圖像之一實施例的概要示意圖。 第7圖為資料擷取方法之另一實施例的流程圖。 第8圖為第7圖中步驟S60之一實施例的流程圖。 第9圖為第6圖中資料圖像於完成顏色替換後之一實施例的概要示意圖。 第10圖為確認結束分界線之一實施例的概要示意圖。 第11圖為圖像處理後之資料圖像之一實施例的概要示意圖。 第12圖為圖像處理後之資料圖像之另一實施例的概要示意圖。 第13圖為步驟S70之一實施例的流程示意圖。 第14圖為資料圖像裁切成至少一子資料圖像之一實施例的概要示意圖。
S10、S30、S50、S70、S90:步驟

Claims (18)

  1. 一種資料擷取方法,包含: 根據一目標軟體視窗的一控制代碼取得該目標軟體視窗的一當前圖像; 根據至少一目標擷取區從該當前圖像中擷取出至少一資料圖像; 根據該至少一資料圖像從一字符圖像資料庫中取出對應的至少一字符圖像與對應的至少一代表字符;及 輸出對應該至少一資料圖像之該至少一代表字符。
  2. 如申請專利範圍第1項所述之資料擷取方法,其中該至少一資料圖像包含至少一待測字符,且該至少一待測字符係以單行排列。
  3. 如申請專利範圍第1項所述之資料擷取方法,其中根據該至少一資料圖像從該字符圖像資料庫中取出對應的該至少一字符圖像與對應的該至少一代表字符之步驟包含: 將該至少一資料圖像裁切成至少一子資料圖像; 根據該至少一子資料圖像從該字符圖像資料庫中取出複數候選字符圖像; 將該至少一子資料圖像與對應之該些候選字符圖像進行匹配; 以該些候選字符圖像中與該至少一子資料圖像之匹配率高於一預設匹配率的該候選字符圖像作為對應於該至少一子資料圖像的該至少一字符圖像;及 取出對應於該至少一子資料圖像之該至少一字符圖像的該至少一代表字符。
  4. 如申請專利範圍第3項所述之資料擷取方法,其中根據該至少一子資料圖像從該字符圖像資料庫中取出該些候選字符圖像之步驟包含: 計算出該至少一子資料圖像中顏色為第一色的一第一像素數量; 將該第一像素數量與該字符圖像資料庫中的各該字符圖像的一第二像素數量進行比對,其中該第二像素數量係為該字符圖像中顏色為該第一色的像素數量;及 以該第一像素數量與該第二像素數量之間的一差異比例位於一範圍內的該些字符圖像作為該些候選字符圖像。
  5. 如申請專利範圍第3項所述之資料擷取方法,其中將該至少一子資料圖像與對應之該些候選字符圖像進行匹配之步驟係將該至少一子資料圖像中各像素與各該候選字符圖像中位於相應位置之像素進行顏色匹配。
  6. 如申請專利範圍第1項所述之資料擷取方法,更包含: 響應於無法從該字符圖像資料庫中取出對應於該至少一資料圖像之該至少一字符圖像時,返回執行根據該目標軟體視窗的該控制代碼取得該目標軟體視窗的該當前圖像之步驟。
  7. 如申請專利範圍第1項所述之資料擷取方法,其中該至少一資料圖像包含至少一待測字符,且於根據該至少一資料圖像從該字符圖像資料庫中取出對應的該至少一字符圖像與對應的該至少一代表字符之步驟前更包含: 識別該至少一資料圖像中複數像素的顏色; 將顏色相同且於該至少一資料圖像中所佔比例超過一預設比例的該些像素判定成複數底色像素; 將該些像素中非為該些底色像素之複數非底色像素的顏色替換成第一色,且將該些底色像素的顏色替換成第二色,其中該些非底色像素用以顯示該至少一待測字符;及 根據該至少一待測字符的該些非底色像素調整於一行方向上相鄰的該些底色像素之列數。
  8. 如申請專利範圍第7項所述之資料擷取方法,其中於根據該至少一待測字符的該些非底色像素調整於該行方向上相鄰的該些底色像素之該列數之步驟執行後,各該待測字符的該些非底色像素與相鄰的該些底色像素之總列數為一第一預設列數。
  9. 如申請專利範圍第7項所述之資料擷取方法,其中於根據該至少一待測字符的該些非底色像素調整於該行方向上相鄰的該些底色像素之該列數之步驟後,各該待測字符的該些非底色像素與相鄰之另一該待測字符的該些非底色像素於該行方向上相隔一第二預設列數的該些底色像素。
  10. 一種資料擷取系統,包含: 一字符圖像資料庫,用以儲存複數字符圖像; 一處理器,用以根據一目標軟體視窗的一控制代碼取得該目標軟體視窗的一當前圖像,該處理器根據至少一目標擷取區從該當前圖像中擷取出至少一資料圖像,並根據該至少一資料圖像從該字符圖像資料庫中取出對應的至少一該字符圖像與對應的至少一代表字符;及 一通訊裝置,用以輸出對應該至少一資料圖像之該至少一代表字符。
  11. 如申請專利範圍第10項所述之資料擷取系統,其中該至少一資料圖像包含至少一待測字符,且該至少一待測字符係以單行排列。
  12. 如申請專利範圍第10項所述之資料擷取系統,其中該處理器係將該至少一資料圖像裁切成至少一子資料圖像,根據該至少一子資料圖像從該字符圖像資料庫中取出複數候選字符圖像,將該至少一子資料圖像與對應之該些候選字符圖像進行匹配,以該些候選字符圖像中與該至少一子資料圖像之匹配率高於一預設匹配率的該候選字符圖像作為對應於該至少一子資料圖像的該至少一字符圖像,並且取出對應於該至少一子資料圖像之該至少一字符圖像的該至少一代表字符。
  13. 如申請專利範圍第12項所述之資料擷取系統,其中該處理器係計算出該至少一子資料圖像中顏色為第一色的一第一像素數量,將該第一像素數量與該字符圖像資料庫中的各該字符圖像的一第二像素數量進行比對,且以該第一像素數量與該第二像素數量之間的一差異比例位於一範圍內的該些字符圖像作為該些候選字符圖像,其中該第二像素數量係為該字符圖像中顏色為該第一色的像素數量。
  14. 如申請專利範圍第13項所述之資料擷取系統,其中該處理器係將該至少一子資料圖像中各像素與各該候選字符圖像中位於相應位置之像素進行顏色匹配。
  15. 如申請專利範圍第10項所述之資料擷取系統,其中該處理器響應於無法從該字符圖像資料庫中取出對應於該至少一資料圖像之至少一該字符圖像時,重新根據該目標軟體視窗的該控制代碼取得該目標軟體視窗的該當前圖像。
  16. 如申請專利範圍第10項所述之資料擷取系統,其中該至少一資料圖像包含至少一待測字符,該處理器更識別該至少一資料圖像中複數像素的顏色,將顏色相同且於該至少一資料圖像中所佔比例超過一預設比例的該些像素判定成複數底色像素,將該些像素中非為該些底色像素之複數非底色像素的顏色替換成第一色,且將該些底色像素的顏色替換成第二色,其中該些非底色像素用以顯示該至少一待測字符,並且該處理器更根據該至少一待測字符的該些非底色像素調整於一行方向上相鄰的該些底色像素之列數。
  17. 如申請專利範圍第16項所述之資料擷取系統,其中該處理器於根據該至少一待測字符的該些非底色像素調整於該行方向上相鄰的該些底色像素之該列數後,各該待測字符的該些非底色像素與相鄰的該些底色像素之總列數為一第一預設列數。
  18. 如申請專利範圍第16項所述之資料擷取系統,其中該處理器於根據該至少一待測字符的該些非底色像素調整於該行方向上相鄰的該些底色像素之該列數後,各該待測字符的該些非底色像素與相鄰之另一該待測字符的該些非底色像素於該行方向上相隔一第二預設列數的該些底色像素。
TW108107713A 2019-02-12 2019-03-08 資料擷取方法及其系統 TWI697795B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910111060.3 2019-02-12
CN201910111060.3A CN111553340A (zh) 2019-02-12 2019-02-12 数据撷取方法及其系统

Publications (2)

Publication Number Publication Date
TWI697795B TWI697795B (zh) 2020-07-01
TW202030627A true TW202030627A (zh) 2020-08-16

Family

ID=71946171

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108107713A TWI697795B (zh) 2019-02-12 2019-03-08 資料擷取方法及其系統

Country Status (3)

Country Link
US (1) US11062171B2 (zh)
CN (1) CN111553340A (zh)
TW (1) TWI697795B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113923396B (zh) * 2021-08-20 2023-09-26 福建升腾资讯有限公司 基于视频会议场景下的远程桌面控制方法、装置和介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4189506B2 (ja) * 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
US20060008148A1 (en) * 2004-07-06 2006-01-12 Fuji Photo Film Co., Ltd. Character recognition device and method
TWI450178B (zh) * 2008-04-25 2014-08-21 Wistron Corp 驅動電子裝置顯示頁面捲動之方法與裝置
CN102385707A (zh) * 2010-08-30 2012-03-21 阿里巴巴集团控股有限公司 一种数字图像识别的方法、装置及爬虫服务器
US9514357B2 (en) * 2012-01-12 2016-12-06 Kofax, Inc. Systems and methods for mobile image capture and processing
CN103530608A (zh) * 2013-10-10 2014-01-22 智博锐视(北京)科技有限公司 车辆类型判断方法和装置
TWI667557B (zh) * 2017-01-19 2019-08-01 由田新技股份有限公司 影像分析儀表資訊之裝置、系統、方法及電腦可讀取記錄媒體
CN108596180A (zh) * 2018-04-09 2018-09-28 深圳市腾讯网络信息技术有限公司 图像中的参数识别、参数识别模型的训练方法及装置
CN109255387A (zh) * 2018-09-20 2019-01-22 珠海市君天电子科技有限公司 一种图像匹配方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US20200257924A1 (en) 2020-08-13
CN111553340A (zh) 2020-08-18
US11062171B2 (en) 2021-07-13
TWI697795B (zh) 2020-07-01

Similar Documents

Publication Publication Date Title
CN110381369B (zh) 推荐信息植入位置的确定方法、装置、设备及存储介质
US9454836B2 (en) Object display device and object display method
US9491366B2 (en) Electronic device and image composition method thereof
CN109753953B (zh) 图像中定位文本的方法、装置、电子设备和存储介质
KR20050094330A (ko) 화상 처리 장치, 화상 처리 방법, 및 그 프로그램 제품
CN109447086A (zh) 一种图片文字颜色的提取方法及装置
CN110909640A (zh) 水位线的确定方法及装置、存储介质、电子装置
US9679386B2 (en) Image processing device capable of segmenting an image into plural areas
US9064314B2 (en) Robust automatic determination and location of MacBeth color checker charts
US20210209776A1 (en) Method and device for depth image fusion and computer-readable storage medium
CN112102929A (zh) 医学图像标注方法、装置、存储介质及电子设备
TWI697795B (zh) 資料擷取方法及其系統
CN106204693B (zh) 基于图片检测的动画生成方法和装置
US11017254B2 (en) Image data retrieving method and image data retrieving device
CN114066823A (zh) 检测色块的方法及其相关产品
JP2013210793A (ja) Ar表示最適化のためのシステム、方法、およびプログラム
CN111277724A (zh) 异常运行应用的检测方法、装置、电子设备及存储介质
CN106055229B (zh) 一种基于读屏的显示界面调整方法及显示界面调整模块
CN113345038B (zh) 刺绣图像的处理方法、装置、电子设备及存储介质
CN109919164A (zh) 用户界面对象的识别方法及装置
CN112988096A (zh) 显示单元定位方法、装置、设备、存储介质和显示装置
CN114494887A (zh) 遥感图像分类方法、装置、计算机设备和可读存储介质
CN113760686B (zh) 用户界面的测试方法、装置、终端和存储介质
CN115965848B (zh) 一种图像处理方法和相关装置
CN115829889A (zh) 图像处理方法和装置、存储介质及电子设备