TW202207007A - 物件辨識裝置與物件辨識方法 - Google Patents

物件辨識裝置與物件辨識方法 Download PDF

Info

Publication number
TW202207007A
TW202207007A TW109127736A TW109127736A TW202207007A TW 202207007 A TW202207007 A TW 202207007A TW 109127736 A TW109127736 A TW 109127736A TW 109127736 A TW109127736 A TW 109127736A TW 202207007 A TW202207007 A TW 202207007A
Authority
TW
Taiwan
Prior art keywords
objects
data
information
file information
generate
Prior art date
Application number
TW109127736A
Other languages
English (en)
Inventor
李信穎
陳守賢
張瑩珠
謝周熾
孫美君
Original Assignee
新穎數位文創股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 新穎數位文創股份有限公司 filed Critical 新穎數位文創股份有限公司
Priority to TW109127736A priority Critical patent/TW202207007A/zh
Priority to CN202011060764.1A priority patent/CN112307163A/zh
Publication of TW202207007A publication Critical patent/TW202207007A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明提出一種物件辨識裝置,其包括記憶體與處理器。記憶體用以儲存多個指令;處理器連接記憶體,並用以載入並執行多個指令以:對第一檔案資訊中之複數物件進行物件辨識,以產生多個物件資料;依據多個物件資料產生多個物件資料彼此間相關的物件相關資訊;依據物件相關資訊產生第二檔案資訊,其中第二檔案資訊包含供選擇操作之多個物件;以及當接收多個物件中之第一物件對應的第一選擇操作指令時,依據物件相關資訊產生與第一物件相關之第一物件資料。

Description

物件辨識裝置與物件辨識方法
本發明是有關於一種物件辨識裝置與方法。
一般而言,在圖形檔案格式的檔案中,往往無法在圖形頁面中針對特定的文字或圖式進行搜尋。舉例而言,論文、專利或書籍的檔案常常屬於圖形檔案格式。由於檔案中整個頁面的內容為圖形的格式,這將造成無法透過文字或圖式搜尋方式查看文章內容,以致於閱讀上有許多不便(例如,當閱讀到頁面上的文字提到有關圖式或表格時,必須要翻閱文章內容以使用肉眼搜尋)。
此外,圖形檔案格式的檔案中也常常未明確標示文章段落。因此,當要閱讀特定章節段落時,必須要自行捲頁並用肉眼查察,這也導致文件不容易閱讀及搜尋的問題。有鑑於此,要如何解決圖形檔案格式的檔案的閱讀與搜尋的困難是本領域技術人員急欲解決的問題。
本發明提供一種物件辨識裝置,包括記憶體與處理器。記憶體用以儲存多個指令;處理器連接記憶體,並用以載入並執行多個指令以:對第一檔案資訊中之複數物件進行物件辨識,以產生多個物件資料;依據多個物件資料產生多個物件資料彼此間相關的物件相關資訊;依據物件相關資訊產生第二檔案資訊,其中第二檔案資訊包含供選擇操作之多個物件;以及當接收多個物件中之第一物件對應的第一選擇操作指令時,依據物件相關資訊產生與第一物件相關之第一物件資料。
本發明提供一種物件辨識方法,包括:對第一檔案資訊中之複數物件進行物件辨識,以產生多個物件資料;依據多個物件資料產生多個物件資料彼此間相關的物件樹資訊;依據物件相關資訊產生第二檔案資訊,其中第二檔案資訊包含供選擇操作之多個物件;以及當接收多個物件中之第一物件對應的第一選擇操作指令時,依據物件樹資訊搜尋第二檔案資訊,以產生與第一物件相關之第一物件資料。
基於上述,本發明提出的物件辨識裝置可結合物件辨識與物件相關資訊的辨識的方法從圖形檔案格式的檔案產生一個包含可供選擇的物件的檔案,其中各物件之間可存在連結關係。如此一來,可讓使用者點選或搜尋檔案中的物件,並響應於使用者點選了一個特定物件,產生所有相關於此特定物件的物件,以供使用者觀看。
第1圖是根據本發明一些示範性實施例的物件辨識裝置的方塊圖。參照第1圖,本實施例的物件辨識裝置100包括記憶體110與處理器120。記憶體110可儲存多個指令。處理器120可通訊連接記憶體110,並用以載入並執行上述的多個指令。針對上述通訊連接的方法,處理器120可以有線或無線的方式連接資料儲存裝置110(1)~110(M)與資料伺服器120(1)~120(N)。
對於有線方式而言,處理伺服器130(1)~130(S)可以是通用序列匯流排(universal serial bus,USB)、RS232、通用非同步接收器/傳送器(universal asynchronous receiver/transmitter,UART)、內部整合電路(I2C)、序列周邊介面(serial peripheral interface,SPI)、顯示埠(display port)、雷電埠(thunderbolt)或區域網路(local area network,LAN)介面進行有線通訊連接,並沒有特別的限制。對於無線方式而言,處理伺服器130(1)~130(S)可以是利用無線保真(wireless fidelity,Wi-Fi)模組、無線射頻識別(radio frequency identification,RFID)模組、藍芽模組、紅外線模組、近場通訊(near-field communication,NFC)模組或裝置對裝置(device-to-device,D2D)模組進行無線通訊連接,亦沒有特別的限制。
在一些實施例中,記憶體110例如是任何型態的固定式或可移動式的隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)、硬碟(hard disk drive,HDD)、固態硬碟(solid state drive,SSD)或類似元件或上述元件的組合。
在一些實施例中,處理器120例如是中央處理單元(central processing unit,CPU),或是其他可程式化之一般用途或特殊用途的微控制單元(micro control unit,MCU)、微處理器(microprocessor)、數位信號處理器(digital signal processor,DSP)、可程式化控制器、特殊應用積體電路(application specific integrated circuit,ASIC)、圖形處理器(graphics processing unit,GPU)、算數邏輯單元(arithmetic logic unit,ALU)、複雜可程式邏輯裝置(complex programmable logic device,CPLD)、現場可程式化邏輯閘陣列(field programmable gate array,FPGA)或其他類似元件或上述元件的組合。
在一些實施例中,物件辨識裝置100更可包括顯示器130,其中顯示器130例如是陰極射線管(cathode ray tube)顯示器、電漿(plasma)顯示器、電致發光(electroluminescence,EL)顯示器、液晶(liquid crystal,LC)顯示器、觸控(touch panel)顯示器、擴增實境(augmented reality,AR)顯示器或虛擬實境(virtual reality,VR)顯示器等各種供觀看或查閱檔案資訊或圖像資訊的顯示器。
第2圖是根據本發明一些示範性實施例的物件辨識方法的流程圖。同時參照第1圖與第2圖,本實施例的方法適用於第1圖的物件辨識裝置100,以下即搭配物件辨識裝置100中各裝置之間的作動關係來說明本發明實施例之物件辨識方法的詳細步驟。
首先,於步驟S201中,處理器120可對第一檔案資訊中之複數物件進行物件辨識(object detection),以產生多個物件資料。換言之,處理器120可對第一檔案資訊進行物件辨識,並辨識出多個物件,以依據這些物件產生多個物件資料。
在一些實施例中,上述物件例如是屬於表單(tables)、圖式(images)(包括2D平面圖、3D立體圖)、圖表目錄(list of illustrations)、章節目錄(table of contents,TOC)、章節段落標題(headings)、文字(text)或其他內容的物件等。
在一些實施例中,第一檔案資訊例如是由外部裝置(未繪示)預先儲存或產生的圖形檔案格式的檔案資訊(例如,由外部攝影裝置拍攝的論文、專利或書籍文件等所產生的影像檔案資訊,或者由影像伺服器儲存的論文、專利或書籍文件等的影像檔案資訊)。在另一些實施例中,第一檔案資訊例如是預先儲存於記憶體110中的圖形檔案格式的檔案資訊。
在一些實施例中,第一檔案資訊例如是點陣圖(bitmap,BMP)、聯合圖像專家組(joint photographic experts group JPG)、標籤圖檔格式(tagged image file format,TIFF)、可攜式文件格式(portable document format,PDF)等圖形檔案格式的檔案資訊。
在一些實施例中,處理器120可依據多個文件資訊以利用機器學習(machine learning)方法產生多個辨識模型,並利用多個辨識模型對第一檔案資訊中之多個物件進行物件辨識,以產生多個物件資料,其中機器學習演算法例如是可以透過卷積神經網路(convolutional neural networks,CNN)、遞歸神經網路(recurrent neural network,RNN)、深度學習(deep learning)或規則式系統(rule-based systems)等方式來執行。
在進一步的實施例中,處理器120可依據不同類型文件的文件資訊(例如,各種論文、專利或書籍文件)以利用機器學習方法建立適用之多個辨識模型,其中辨識模型例如是可進行表格物件識別、2D平面圖式物件識別、3D立體圖式物件識別、目錄物件識別、章節段落物件識別、文字識別以及其他可定義的類型的辨識(例如,文章中是否出現人物之辨識、數值之辨識、化學式之辨識、化合物之辨識、物品之類型辨識等)等的模型。
換言之,處理器120可依據不同類型文件的文件資訊預先訓練針對各種不同類型的物件的辨識模型,以利用這些訓練好的模型對第一檔案資訊中的物件進行辨識,並產生物件資料。
在進一步的實施例中,處理器120可利用上述多個辨識模型與影像處理技術辨識各物件之位置資訊及各物件之大小區塊資訊(即,各物件在第一檔案資訊中的位置座標與尺寸)。舉例而言,處理器120可預先訓練針對各種物件的位置與大小的辨識模型,並對第一檔案資訊中的圖形頁面進行分析,以辨識並產生包括各物件之像素的座標資訊及各物件之像素的大小區塊資訊。
在進一步的實施例中,處理器120可利用上述多個辨識模型判斷多個物件的意義。詳細而言,處理器120可利用個辨識模型對物件進行語意辨識與圖式辨識,並藉此判斷出多個物件的意義。處理器120更可依據多個物件的意義產生多個物件類型(即,處理器120可判斷出哪些物件是屬於相同物件類型的物件(例如,判斷出多個物件屬於表單的物件))與物件種類(即,處理器120可判斷出哪些物件是屬於相同物件(例如,若判斷出多個物件皆為「element member」,可將這些物件判斷屬於相同的物件)),其中物件類型例如是表單、圖式、圖表目錄、章節目錄、章節段落標題等。
藉此,處理器120可為屬於相同物件的物件配置相同的辨識符(detection identification)。進一步而言,處理器120可為各物件設定特定的標示符,並將這些標示符指示為多個物件資料。
再者,於步驟S203中,處理器120可依據多個物件資料產生多個物件資料彼此間相關的物件相關資訊。換言之,處理器120可依據多個物件資料判斷多個物件資料彼此間的多個關聯性,以依據這些關聯性產生物件相關資訊。
在一些實施例中,處理器120可依據多個物件的意義產生多個物件資料彼此間的多個連結關係資料。藉此,處理器120可利用這些連結關係資料產生物件相關資訊。
舉例而言,第3A圖是根據本發明一些示範性實施例的第一檔案資訊中的其中一個圖形頁面的示意圖,且第3B圖是根據本發明另一些示範性實施例的第一檔案資訊中的其中一個圖形頁面的示意圖。同時參照第3A圖與第3B圖,若辨識出物件301為「22」、物件302為「element member」、物件303為「22」以及物件303為物件302後的物件,則可利用機器學習方法判斷出物件302的意義為「元件構件」,且物件301的意義與物件303的意義皆為「元件構件的標號」。藉此,可產生指示物件301的辨識符與物件302與物件303的辨識符具有相關性的連結關係資料,並以相同的方法,可產生指示所有物件的辨識符彼此之間的多個連結關係資料,並利用這些連結關係資料產生物件相關資訊。
在一些實施例中,參照回第1圖與第2圖,處理器120可從第一檔案資訊辨識至少一圖表目錄的物件,並依據至少一圖表目錄的物件與第一檔案資訊中的多個物件產生至少一圖表目錄的物件對應的多個圖式的物件與多個表單的物件,進而據此產生至少一圖表目錄的物件與對應的多個圖式的物件、多個表單的物件之間的多個連結關係資料。此外,若處理器120從第一檔案資訊無法辨識出至少一圖表目錄的物件,處理器120可從第一檔案資訊中辨識多個圖式的物件與多個表單的物件,並產生多個圖式的物件與多個表單的物件對應的至少一圖表目錄的物件,進而產生多個圖式的物件、多個表單的物件以及至少一圖表目錄的物件之間的多個連結關係資料。
在一些實施例中,處理器120可從第一檔案資訊辨識多個章節段落標題的物件與至少一章節目錄的物件,並可辨識至少一章節目錄的物件對應的章節段落標題的物件,進而據此產生多個章節段落標題的物件與至少一章節目錄的物件之間的多個連結關係資料。若處理器120從第一檔案資訊無法辨識至少一章節目錄的物件的物件,處理器120可依據多個章節段落標題的物件產生對應的至少一章節目錄的物件,並據此產生多個章節段落標題的物件與至少一章節目錄的物件之間的多個連結關係資料。
接著,於步驟S205中,處理器120可依據物件相關資訊產生第二檔案資訊,其中第二檔案資訊包含供選擇操作之多個物件。換言之,處理器120所產生的第二檔案資訊可包含供選擇操作之多個物件,其中第二檔案資訊可以是任意格式的包含供選擇操作之多個物件的檔案,並沒有特別的限制。
在一些實施例中,物件相關資訊可以是一個物件樹(object tree)資訊。在進一步的實施例中,物件樹資訊可包括各物件的物件資料、各物件的位置資訊、各物件的大小區塊資訊以及各物件的連結關係資料。舉例而言,第4圖是根據本發明一些示範性實施例的物件樹資訊的示意圖。參照第4圖,當判斷出第一檔案資訊中的多個物件的意義時,可產生第一檔案資訊的根結點,並依據多個物件的意義判斷出多個物件對應的多個物件類型。藉此,可以多個物件類型作為第一層節點(例如,物件類型1的節點)。
此外,在形成第一層節點後,可以多個物件類型對應的多個物件資料作為第二層節點(例如,物件資料1的節點),並將各物件類型的節點與其對應的所有物件資料的節點相連接(例如,將物件類型1的節點連接物件資料1的節點與其他屬於物件類型1的物件資料的節點)。如此一來,便可將多個物件資料對應的多個位置資訊、多個大小區塊資訊以及多個連結關係資料作為第三層節點(例如,位置資訊1、大小區塊資訊1以及連結關係資料1的節點),並將各物件資料的節點與其對應的位置資訊、大小區塊資訊以及連結關係資料的節點相連接(例如,將物件資料1的節點連接位置資訊1、大小區塊資訊1以及連結關係資料1的節點)。
在進一步的實施例中,參照回第1圖與第2圖,處理器120可將物件樹資訊嵌入第二檔案資訊。舉例而言,處理器120可產生一個具有包含供選擇操作之多個物件的屬於PDF檔案格式的第二檔案資訊,並可將上述的物件樹資訊嵌入此屬於PDF檔案格式的第二檔案資訊。
最後,於步驟S207中,當處理器120接收多個物件中之一第一物件對應的第一選擇操作指令時,處理器120可依據物件相關資訊產生與第一物件相關之第一物件資料。換言之,當使用者點選第二檔案資訊中的一個第一物件時,處理器120可依據物件相關資訊從多個物件資料產生與第一物件相關之物件資料。
在一些實施例中,處理器120可在第二檔案資訊嵌入多個物件對應的多個點選物件,其中多個點選物件可以是註釋的標籤或者超連接(hyperlink)。
舉例而言,第5A圖是根據本發明一些示範性實施例的第二檔案資訊的示意圖。為讓本發明能更明顯易懂,在此僅以三個物件對應的點選物件501~503(設置於物件的位置的上方)作為例子。參照第5A圖,針對第二檔案資訊中的所有物件皆可額外設置對應的點選物件,此點選物件可設置於任何鄰近於物件的位置(例如,物件的位置的上方),並沒有對點選物件在第二檔案資訊中的位置有特別的限制。進一步而言,「element member」、「22」以及「FIG. 6」為辨識出的物件,且在物件「element member」、物件「22」以及物件「FIG. 6」的上方分別設置點選物件501~503以供使用者選擇。此外,也可不設置這些點選物件,並讓使用者直接選擇物件(即,直接點選物件「element member」、物件「22」或物件「FIG. 6」)。藉由上述的選擇操作,便可依據物件相關資訊從多個物件資料產生與第一物件相關之物件資料。
在一些實施例中,參照回第1圖與第2圖,第二檔案資訊可包括物件目錄表,且處理器120可利用上述多個辨識模型判斷多個物件的意義,並依據多個物件的意義從多個物件產生物件目錄表,其中物件目錄表包括多個物件種類。藉此,當接收物件目錄表中的多個物件種類中之一第一物件種類對應的第二選擇操作指令時,依據物件相關資訊產生與第一物件種類相關之第二物件資料。舉例而言,以下表一示出了物件目錄表的例子。 表一
物件種類 物件類型 物件的意義
element member 文字 元件構件
22 文字 元件構件的標號
. . . . . . . . .
當使用者點選表一中的物件種類「element member」時,處理器120可立即依據物件相關資訊產生與物件種類「element member」相關之第二物件資料(例如,產生物件「22」的辨識符或物件「element member」對應的圖式與表格等)。
在一些實施例中,處理器120可透過顯示器130可顯示上述的與第一物件相關之第一物件資料對應的第一相關物件,或者是顯示與第一物件種類相關之第二物件資料對應的第二相關物件。
舉例而言,第5B圖是根據本發明一些示範性實施例的顯示器顯示第一相關物件的示意圖。為讓本發明能更明顯易懂,在此僅以一個物件「FIG. 6」對應的點選物件503(設置於物件的位置的上方)作為例子。參照第5B圖,當使用者點選第二檔案資訊中的物件503時,可直接浮現出點選物件503對應的第一相關物件(即,物件「FIG. 6」對應的圖式的物件)。此外,第6圖是根據本發明另一些示範性實施例的顯示第一相關物件的示意圖。為讓本發明能更明顯易懂,在此僅以第一相關物件「element member」作為例子。同時參照第3B圖與第6圖,當使用者點選第二檔案資訊中的物件303時,可立即標註出所有第一相關物件「element member」。值得注意的是,當使用者點選第二檔案資訊中的物件303時,也可直接浮現出物件303相關的圖式或表單。此外,同時參照第3A圖與第6圖,當使用者點選第二檔案資訊中的物件301時,可直接浮現出物件301相關的第一相關物件「22」的意義(即,element member)。
在一些實施例中,參照回第1圖與第2圖,當處理器120辨識出六面圖的物件時,處理器120可將六個投影面組合為一個3D立體圖式的檔案資訊(例如,圖形庫傳輸格式(Graphics Library Transmission Format,gLTF)的檔案格式或已壓縮通用場景描述(universal scene description zipped,USDZ)的檔案格式),並將此檔案資訊嵌入第二檔案資訊。當使用者點選第二檔案資訊中的3D立體圖式的檔案資訊對應的圖式的名稱時,可透過顯示器130浮現3D立體圖式的檔案資訊。
在一些實施例中,第二檔案資訊可包括至少一圖表目錄的物件與至少一章節目錄的物件,其中至少一圖表目錄的物件可包括對應的多個圖式的物件與多個表格的物件,且至少一章節目錄的物件可包括對應的多個章節段落標題的物件。
在進一步的實施例中,當使用者透過處理器120與顯示器130點選第二檔案資訊中的任意圖表目錄的物件中的任意物件或任意章節目錄的物件中的任意物件時,處理器120可透過顯示器130直接標註並顯示上述點選的物件相關的第一物件資料(例如是以第5B圖或第6圖的顯示方法)。
在進一步的實施例中,處理器120可將多個點選物件設置於任何鄰近於至少一圖表目錄的物件中的所有物件的位置以及任何鄰近於至少一章節目錄的物件中的所有物件的位置。
在進一步的實施例中,當使用者透過處理器120與顯示器130點選第二檔案資訊中的任意圖表目錄的物件中的任意點選物件或任意章節目錄的物件中的任意點選物件時,處理器120可透過顯示器130直接標註並顯示上述點選的物件相關的第一物件資料(例如是以第5B圖或第6圖的顯示方法)。
在一些實施例中,使用者可透過處理器120以利用放大、縮小、旋轉操作指令對顯示器130所顯示的圖式進行各種操作。
綜上所述,本發明提出的物件辨識裝置可結合物件辨識與物件相關資訊的辨識的方法從圖形檔案格式的檔案產生一個包含可供選擇的物件的檔案,其中各物件之間可存在連結關係。如此一來,可讓使用者點選或搜尋檔案中的物件,並響應於使用者點選了一個特定物件,產生所有相關於此特定物件的物件,以供使用者觀看。藉此,有利於使用者快速地閱讀與搜尋到想觀看的文字、圖式或段落等。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
100:物件辨識裝置 110:記憶體 120:處理器 130:顯示器 S201~S207:物件辨識方法的步驟 301~303、501~503:物件
第1圖是根據本發明一些示範性實施例的物件辨識裝置的方塊圖。 第2圖是根據本發明一些示範性實施例的物件辨識方法的流程圖。 第3A圖是根據本發明一些示範性實施例的第一檔案資訊中的其中一個圖形頁面的示意圖。 第3B圖是根據本發明另一些示範性實施例的第一檔案資訊中的其中一個圖形頁面的示意圖。 第4圖是根據本發明一些示範性實施例的物件樹資訊的示意圖。 第5A圖是根據本發明一些示範性實施例的第二檔案資訊的示意圖。 第5B圖是根據本發明一些示範性實施例的顯示器顯示第一相關物件的示意圖。 第6圖是根據本發明另一些示範性實施例的顯示第一相關物件的示意圖。
100:物件辨識裝置
110:記憶體
120:處理器
130:顯示器

Claims (10)

  1. 一種物件辨識裝置,包括: 一記憶體,用以儲存多個指令; 一處理器,連接該記憶體,並用以載入並執行該些指令以: 對第一檔案資訊中之複數物件進行物件辨識,以產生多個物件資料; 依據該些物件資料產生該些物件資料彼此間相關的物件相關資訊; 依據該物件相關資訊產生第二檔案資訊,其中該第二檔案資訊包含供選擇操作之該些物件;以及 當接收該些物件中之一第一物件對應的一第一選擇操作指令時,依據該物件相關資訊產生與該第一物件相關之第一物件資料。
  2. 如請求項1所述之物件辨識裝置,其中該處理器更用以: 依據多個文件資訊以利用一機器學習方法產生多個辨識模型,並利用該些辨識模型對該第一檔案資訊中之該些物件進行物件辨識,以產生多個物件資料。
  3. 如請求項2所述之物件辨識裝置,其中該處理器更用以: 利用該些辨識模型判斷該些物件的意義,並依據該些物件的意義從該些物件產生一物件目錄表,並將該物件目錄表嵌入該第二檔案資訊,其中該物件目錄表包括多個物件種類;以及 當接收該物件目錄表中的該些物件種類中之一第一物件種類對應的一第二選擇操作指令時,依據該物件相關資訊產生與該第一物件種類相關之第二物件資料。
  4. 如請求項3所述之物件辨識裝置,更包括: 一顯示器,連接該處理器,並用以顯示該第一物件資料或該第二物件資料。
  5. 如請求項1所述之物件識別裝置,其中該物件相關資訊為物件樹資訊,且該處理器更用以: 判斷該些物件資料彼此間的多個連結關係資料,以依據該些連結關係資料產生該些物件資料的該物件樹資訊,並將該物件樹資訊嵌入該第二檔案資訊。
  6. 一種物件辨識方法,包括: 對第一檔案資訊中之複數物件進行物件辨識,以產生多個物件資料; 依據該些物件資料產生該些物件資料彼此間相關的物件樹資訊; 依據該物件相關資訊產生第二檔案資訊,其中該第二檔案資訊包含供選擇操作之該些物件;以及 當接收該些物件中之一第一物件對應的一第一選擇操作指令時,依據物件樹資訊搜尋該第二檔案資訊,以產生與該第一物件相關之第一物件資料。
  7. 如請求項6所述之物件辨識方法,其中對該第一檔案資訊進行該物件辨識以產生該些物件資料的步驟包括: 依據多個文件資訊以利用一機器學習方法產生多個辨識模型,並利用該些辨識模型對該第一檔案資訊中之該些物件進行物件辨識,以產生多個物件資料。
  8. 如請求項7所述之物件辨識方法,更包括: 利用該些辨識模型判斷該些物件的意義,並依據該些物件的意義從該些物件產生一物件目錄表,並將該物件目錄表嵌入該第二檔案資訊,其中該物件目錄表包括多個物件種類;以及 當接收該物件目錄表中的該些物件種類中之一第一物件種類對應的一第二選擇操作指令時,依據該物件相關資訊產生與該第一物件種類相關之第二物件資料。
  9. 如請求項8所述之物件辨識方法,更包括: 透過一顯示器顯示該第一物件資料或該第二物件資料。
  10. 如請求項6所述之物件識別方法,其中依據該些物件資料產生該些物件資料之間的該物件樹資訊的步驟包括: 判斷該些物件資料彼此間的多個連結關係資料,以依據該些連結關係資料產生該些物件資料的該物件樹資訊,並將該物件樹資訊嵌入該第二檔案資訊。
TW109127736A 2020-08-14 2020-08-14 物件辨識裝置與物件辨識方法 TW202207007A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW109127736A TW202207007A (zh) 2020-08-14 2020-08-14 物件辨識裝置與物件辨識方法
CN202011060764.1A CN112307163A (zh) 2020-08-14 2020-09-30 对象识别装置和对象识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109127736A TW202207007A (zh) 2020-08-14 2020-08-14 物件辨識裝置與物件辨識方法

Publications (1)

Publication Number Publication Date
TW202207007A true TW202207007A (zh) 2022-02-16

Family

ID=74489397

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109127736A TW202207007A (zh) 2020-08-14 2020-08-14 物件辨識裝置與物件辨識方法

Country Status (2)

Country Link
CN (1) CN112307163A (zh)
TW (1) TW202207007A (zh)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6766331B2 (en) * 2001-03-29 2004-07-20 The Boeing Company Method, computer program product, and system for creating and viewing an intelligent graphics file including parts information
EP1565796A2 (en) * 2002-05-24 2005-08-24 Dynapix Intelligence Imaging Inc. A method and apparatus for 3d image documentation and navigation
CN104063364A (zh) * 2013-03-19 2014-09-24 福建福昕软件开发股份有限公司北京分公司 一种pdf文档识别方法
US20160026858A1 (en) * 2014-07-28 2016-01-28 Microsoft Corporation Image based search to identify objects in documents
US10482393B2 (en) * 2017-05-10 2019-11-19 The Travelers Indemnity Company Machine-based learning systems, methods, and apparatus for interactively mapping raw data objects to recognized data objects
KR102469717B1 (ko) * 2017-08-01 2022-11-22 삼성전자주식회사 오브젝트에 대한 검색 결과를 제공하기 위한 전자 장치 및 이의 제어 방법
KR102599947B1 (ko) * 2017-10-27 2023-11-09 삼성전자주식회사 관련 이미지를 검색하기 위한 전자 장치 및 이의 제어 방법
CN108038426A (zh) * 2017-11-29 2018-05-15 阿博茨德(北京)科技有限公司 一种提取文件中图表信息的方法及装置
CN111292153B (zh) * 2018-12-10 2024-04-09 北京京东尚科信息技术有限公司 信息推荐方法、装置、系统和存储介质
CN110321470A (zh) * 2019-05-23 2019-10-11 平安科技(深圳)有限公司 文档处理方法、装置、计算机设备和存储介质
CN114495143B (zh) * 2021-12-24 2024-03-22 北京百度网讯科技有限公司 一种文本对象识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112307163A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN108073555B (zh) 用于从电子文档生成虚拟现实环境的方法和系统
US8548211B2 (en) Indicating a correspondence between an image and an object
TW200939049A (en) Method and system for managing digital photos
US11720954B2 (en) Image-based listing using image of multiple items
US10210181B2 (en) Searching and annotating within images
JP2012094138A (ja) 拡張現実ユーザインタフェース提供装置および方法
KR20100114082A (ko) 문서 연결에 기초한 검색
US10592580B2 (en) Web UI builder application
WO2016018683A1 (en) Image based search to identify objects in documents
CN111814885A (zh) 一种管理图像框的方法、系统、设备及介质
US20180285965A1 (en) Multi-dimensional font space mapping and presentation
KR20120042656A (ko) 접속정보를 포함하는 이미지 기반 접속정보 표시 방법 및 장치
US20170124622A1 (en) System and method for intuitive content browsing
JP2017535850A (ja) ウェブページへの画像のサムネイルのリンク付け
JP2006146628A5 (zh)
US8941767B2 (en) Mobile device and method for controlling the same
US8866953B2 (en) Mobile device and method for controlling the same
Khanwalkar et al. Exploration of large image corpuses in virtual reality
WO2016018682A1 (en) Processing image to identify object for insertion into document
KR101768914B1 (ko) 지오 태깅 방법, 지오 태깅 장치 및 이를 수행하는 프로그램을 기록하는 기록매체
TW201523421A (zh) 決定用於擷取的文章之圖像
TW202207007A (zh) 物件辨識裝置與物件辨識方法
CN110313001A (zh) 照片处理方法、装置及计算机设备
US7706577B1 (en) Exporting extracted faces
WO2018153299A1 (zh) 图像处理的方法、装置及存储介质