TW201816721A - 視覺定位裝置、方法及其電腦程式產品 - Google Patents

視覺定位裝置、方法及其電腦程式產品 Download PDF

Info

Publication number
TW201816721A
TW201816721A TW105133702A TW105133702A TW201816721A TW 201816721 A TW201816721 A TW 201816721A TW 105133702 A TW105133702 A TW 105133702A TW 105133702 A TW105133702 A TW 105133702A TW 201816721 A TW201816721 A TW 201816721A
Authority
TW
Taiwan
Prior art keywords
feature points
image
vertices
visual positioning
tag
Prior art date
Application number
TW105133702A
Other languages
English (en)
Other versions
TWI619093B (zh
Inventor
林敬文
翁明昉
Original Assignee
財團法人資訊工業策進會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人資訊工業策進會 filed Critical 財團法人資訊工業策進會
Priority to TW105133702A priority Critical patent/TWI619093B/zh
Priority to CN201610957043.8A priority patent/CN107967699B/zh
Priority to US15/347,356 priority patent/US10043077B2/en
Application granted granted Critical
Publication of TWI619093B publication Critical patent/TWI619093B/zh
Publication of TW201816721A publication Critical patent/TW201816721A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker
    • G06T2207/30208Marker matrix

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

一種視覺定位裝置、方法及其電腦程式產品。視覺定位裝置感測空間中之視覺編碼標籤以取得一影像,且執行以下運作:(a)辨識出影像中之辨識標籤影像,(b)搜尋辨識標籤影像之複數個角點位置,(c)根據角點位置決定辨識標籤影像之標籤結構,而標籤結構具有複數個頂點,(d)根據辨識標籤影像之識別碼,選取頂點之一部分作為複數個第一特徵點,(e)於各第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點,(f)以該等第二特徵點更新標籤結構之頂點,(g)選取更新後之頂點之一部分作為複數個第三特徵點,以及(h)以第三特徵點計算視覺定位裝置於空間之位置。

Description

視覺定位裝置、方法及其電腦程式產品
本發明係關於一種視覺定位裝置、方法及其電腦程式產品。具體而言,本發明係關於一種基於視覺編碼標籤之視覺定位裝置、方法及其電腦程式產品。
隨著科技的快速發展,電腦視覺或/及影像處理技術已逐漸地應用於各種電子產品(例如:各種行動裝置、擴增實境(Augmented Reality)之穿戴設備)之定位,並因此達到依據使用者所在位置提供各式服務(例如:使用者參觀展場時之定位及路徑指引)。
習知的視覺定位技術係結合特殊圖像標記(例如:視覺編碼標籤)與影像偵測技術。具體而言,習知技術係以一具有相機功能之電子產品感測一視覺編碼標籤並取得一影像,電子產品辨識該影像中之一標籤影像,再利用該標籤影像之四個角點位置、該視覺編碼標籤之實際大小及相機校正資訊,以電腦視覺技術計算出電子產品於空間中之位置。然而,電子產品拍攝視覺編碼標籤所獲得之影像可能不夠清晰,導致無法準確地辨識出標籤影像或/及無法準確地偵測出標籤影像之四個角點位置。在此情況下,電子產品便無法被準確地定位。
有鑑於此,如何降低特殊圖像標記之感測影像之誤差,以獲取較為準確之定位結果,乃業界亟需努力之目標。
為解決前述問題,本發明提供了一種視覺定位裝置、視覺定位方法及其電腦程式產品。
本發明所提供之視覺定位裝置包含一影像感測器及一處理器,且該處理器電性連接至該影像感測器。該影像感測器感測一空間中之一視覺編碼標籤以取得一影像。該處理器執行以下運作:(a)辨識出該影像中之一辨識標籤影像,(b)搜尋該辨識標籤影像之複數個角點(corner)位置,(c)根據該等角點位置決定該辨識標籤影像之一標籤結構,該標籤結構具有複數個頂點(vertices),(d)根據該辨識標籤影像之一識別碼,選取該等頂點之一部分作為複數個第一特徵點,(e)於各該第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點,(f)以該等第二特徵點更新該標籤結構之該等頂點,(g)選取更新後之該等頂點之一部分作為複數個第三特徵點,以及(h)以該等第三特徵點計算該視覺定位裝置於該空間之一位置。
本發明所提供之一種視覺定位方法適用於一電子裝置。該視覺定位方法包含下列步驟:(a)感測一空間中之一視覺編碼標籤以取得一影像,(b)搜尋該辨識標籤影像之複數個角點位置,(c)根據該等角點位置決定該辨識標籤影像之一標籤結構,該標籤結構具有複數個頂點,(d)根據該辨識標籤影像之一識別碼,選取該等頂點之一部分作為複數個第一特徵點,(e)於各該第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點,(f)以該等第二特徵點更新該標籤結構之該等頂點,(g)選取更新後之該等頂點之一 部分作為複數個第三特徵點,以及(h)以該等第三特徵點計算該視覺定位裝置於該空間之一位置。
本發明所提供之電腦程式產品經由一電子裝置載入該電腦程式產品後,該電子裝置執行該電腦程式產品所包含之複數個程式指令,以執行一定位方法。該定位方法包含下列步驟:(a)感測一空間中之一視覺編碼標籤以取得一影像,(b)搜尋該辨識標籤影像之複數個角點位置,(c)根據該等角點位置決定該辨識標籤影像之一標籤結構,該標籤結構具有複數個頂點,(d)根據該辨識標籤影像之一識別碼,選取該等頂點之一部分作為複數個第一特徵點,(e)於各該第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點,(f)以該等第二特徵點更新該標籤結構之該等頂點,(g)選取更新後之該等頂點之一部分作為複數個第三特徵點,以及(h)以該等第三特徵點計算該視覺定位裝置於該空間之一位置。
由上述說明可知,本發明所提供之視覺定位技術在搜尋出該辨識標籤影像之複數個角點位置後,會依據該等角點位置決定一標籤結構,依據該標籤結構決定複數個第一特徵點,於各該第一特徵點附近個別地搜尋出一第二特徵點,以該等第二特徵點更新該標籤結構,再根據更新後之標籤結構決定複數個第三特徵點。藉由數次決定特徵點能使最後所決定之該等第三特徵點之位置更為接近該辨識標籤影像之實際特徵點位置,因而能更為精確地定位該視覺定位裝置於該空間之位置。
以下結合圖式闡述本發明之詳細技術及實施方式,俾使本發明所屬技術領域中具有通常知識者能理解所請求保護之發明之特徵。
1‧‧‧視覺定位裝置
11‧‧‧影像感測器
13‧‧‧處理器
15‧‧‧儲存器
10‧‧‧視覺編碼標籤
12‧‧‧網狀結構
14‧‧‧影像
16‧‧‧辨識標籤影像
16a、16b、16c、16d‧‧‧角點位置
18a、18b‧‧‧標籤結構
100a、100b、100c、100d‧‧‧第二特徵點
S201~S217‧‧‧步驟
第1A圖描繪第一實施方式之視覺定位裝置1之架構示意圖;第1B圖描繪視覺編碼標籤10之示意圖;第1C圖描繪視覺編碼標籤10、預設結構所形成之網狀結構12以及視覺編碼標籤10被定義之十六個特徵點;第1D圖描繪視覺定位裝置1所感測到之影像14及影像14中所包含之辨識標籤影像16;第1E圖係描繪辨識標籤影像16之複數個角點位置16a、16b、16c、16d及標籤結構18a;第1F圖係為複數個第一特徵點之示意圖;第1G圖係為複數個第二特徵點之示意圖;第1H圖係為標籤結構18b之示意圖;第1I圖係為複數個第三特徵點之示意圖;以及第2圖係描繪第二實施方式之視覺定位方法之流程圖。
以下將透過實施方式來解釋本發明所提供之視覺定位裝置、方法及其電腦程式產品。然而,該等實施方式並非用以限制本發明需在如該等實施方式所述之任何環境、應用或方式方能實施。因此,關於實施方式之說明僅為闡釋本發明之目的,而非用以限制本發明之範圍。應理解,在以下實施方式及圖式中,與本發明非直接相關之元件已省略而未繪示。
本發明之第一實施方式為一視覺定位裝置1,其架構示意圖係描繪於第1A圖。視覺定位裝置1包含一影像感測器11、一處理器13及一儲存器15,且處理器13電性連接至影像感測器11及儲存器15。影像感測器11可 為各種感光耦合元件(Charge-Coupled Device;CCD)、互補式金屬氧化物半導體(Complementary Metal-Oxide-Semiconductor;CMOS)感光元件或本發明所屬技術領域中具有通常知識者所知悉之其他可取得影像之影像感測裝置。處理器13可為各種處理單元、中央處理單元(Central Processing Unit;CPU)、微處理器或本發明所屬技術領域中具有通常知識者所知悉之其他計算裝置。儲存器15可為一記憶體、一通用串列匯流排(Universal Serial Bus;USB)碟、一硬碟、一光碟(Compact Disk;CD)、一隨身碟或本發明所屬技術領域中具有通常知識者所知且具有相同功能之任何其他儲存媒體或電路。需說明者,於本發明之其他實施方式中,儲存器15可被設置為外在於視覺定位裝置1。
於本實施方式中,視覺定位裝置1與複數個視覺編碼標籤(例如:擴增實境標籤(augmented real marker),但不限於此)搭配使用,且各視覺編碼標籤係基於一預設結構所設計。茲以一具體範例說明,請參第1B圖所繪示之視覺編碼標籤10。視覺編碼標籤10係由7x7個方塊所組成,其中最外圍一圈為淺色方塊,而中間的5x5個方塊各可為深色或淺色。該預設結構為一個具有複數個頂點(vertices)之網狀結構。基於此預設結構,各視覺編碼標籤被定義了複數個特徵點。於一實施例中,頂點可為中間的5x5個方塊其中之深色方塊的頂點。一視覺編碼標籤之各特徵點為該視覺編碼標籤中較具鑑別度之位置(例如:視覺編碼標籤中亮度值變化較大之位置,其會落於網狀結構之某一頂點)。請參第1C圖,其係描繪視覺編碼標籤10、用於設計視覺編碼標籤10之預設結構所形成之網狀結構12(亦即,該等網格)以及視覺編碼標籤10被定義之十六個特徵點(亦即,十六個黑色圓點所標示 處)。需說明者,第1C圖所繪示之視覺編碼標籤10、網狀結構12及十六個特徵點僅作為例示之用,而非用以限制本發明之範圍。此外,不同視覺編碼標籤被定義之特徵點之數目可不相同。再者,於不同實施方式中,同一視覺編碼標籤被定義之特徵點可不相同。針對各視覺編碼標籤,儲存器15儲存一識別碼、一視覺編碼標籤影像及複數個特徵點位置(亦即,預設結構上之哪些頂點為特徵點)。
於本實施方式中,該等視覺編碼標籤可被放置於一空間(例如:張貼於一空間之牆壁上)。視覺定位裝置1利用影像感測器11感測該空間中之一視覺編碼標籤以取得一影像14,如第1D圖所示。處理器13自影像感測器11接收影像14後,辨識出影像14中具有一辨識標籤影像16(亦即,第1D圖中四個箭號所包圍之區域)。舉例而言,處理器13可比對影像14與儲存器15所儲存之該等視覺編碼標籤影像,藉此辨識出影像14中包含辨識標籤影像16。處理器13辨識出辨識標籤影像16後,即可確認辨識標籤影像16所對應之識別碼(未繪示)。
之後,處理器13搜尋辨識標籤影像16之複數個角點(corner)位置16a、16b、16c、16d(亦即,辨識標籤影像16之四個角落的位置),如第1E圖所示。舉例而言,處理器13可計算影像14之亮度梯度(gradient)值,再依據該等亮度梯度值確認角點位置16a、16b、16c、16d。需說明者,利用何種演算法搜尋出辨識標籤影像16之角點並非本發明之重點;換言之,本發明並不限於利用亮度梯度值來搜尋出該等角點位置。另外,本發明亦未限制處理器13所搜尋出之辨識標籤影像之角點之數目;換言之,前述角點位置之數目為四僅為方便舉例說明而已。
接著,處理器13根據角點位置16a、16b、16c、16d決定辨識標籤影像16之標籤結構18a(亦即,第1E圖中之網格),而此標籤結構18a具有複數個頂點。具體而言,由於視覺定位裝置1所搭配使用之視覺編碼標籤皆是基於一預設結構所設計,故處理器13會利用預設結構之資訊來決定辨識標籤影像16之標籤結構18a。茲先假設預設結構係規範各視覺編碼標籤由7x7個方塊所組成。基於此預設結構,處理器13以角點位置16a、16b、16c、16d為四個角點界定出7x7個網格,而該等7x7個網格所形成之網狀結構即為標籤結構18a。
之後,處理器13根據辨識標籤影像16之識別碼,選取標籤結構18a之該等頂點之一部分作為辨識標籤影像16之複數個第一特徵點。具體而言,處理器13可根據辨識標籤影像16之識別碼,自儲存器15擷取該識別碼所對應之該等特徵點位置,再以標籤結構18a上對應至該等特徵點位置之頂點作為複數個第一特徵點。於本實施方式中,處理器13係根據該識別碼所對應之所有特徵點位置以決定標籤結構18a上之該等第一特徵點。然而,於其他實施方式中,處理器13可根據該識別碼所對應之所有特徵點位置中的一部分(例如:以隨機抽樣一致性演算法(RANdom SAmple Consensus;RANSAC)隨機地挑選所有特徵點位置中的一部分)來決定標籤結構18a上之該等第一特徵點。為便於理解,茲以第1C圖及第1F圖為例說明。於此範例中,儲存器15儲存了預設結構12之十六個特徵點之特徵點位置,處理器13以標籤結構18a上對應至該十六個特徵點位置之頂點作為複數個第一特徵點。第1F圖所示之十六個淺色圓點即為第一特徵點。
由於處理器13係基於標籤結構18a及預設的該等特徵點位置 決定辨識標籤影像16之該等第一特徵點,因此可能有些第一特徵點未能準確地位於辨識標籤影像16中較具鑑別度之位置。為解決前述問題,處理器13於各該第一特徵點之一預設搜尋範圍(例如:以第一特徵點為圓心且以四分之一網格長度為半徑所形成之範圍)個別地搜尋出一第二特徵點,如第1G圖所示。舉例而言,處理器13可於各該第一特徵點之預設搜尋範圍內搜尋亮度值變化最大之位置,並以其作為第二特徵點。相較於第一特徵點,第二特徵點更接近辨識標籤影像16之實際特徵點之位置。
之後,處理器13以該等第二特徵點更新標籤結構18a之該等頂點,亦即,處理器13以該等第二特徵點將標籤結構18a更新為第1H圖所示之標籤結構18b。舉例而言,處理器13可利用一回歸演算法(例如:最小平方法(linear square method))以讓該等第二特徵點更新標籤結構18a之該等頂點。本發明所屬技術領域中具有通常知識者應能理解如何利用一回歸演算法以讓該等第二特徵點更新標籤結構18a,茲不贅述細節。以第1H圖為例,處理器13可利用第二特徵點中之四個第二特徵點100a、100b、100c、100d來計算出新的回歸線(亦即,左邊第一條縱向虛線),此為回歸線為標籤結構18b中之一條網線。類似的,處理器13可利用其他第二特徵點計算出其他新的回歸線以作為標籤結構18b中之其他網線,資不贅言。
接著,處理器13選取更新後之該等頂點(亦即,標籤結構18b所具有之頂點)之一部分作為複數個第三特徵點。類似的,處理器13可根據辨識標籤影像16之識別碼,自儲存器15擷取該識別碼所對應之該等特徵點位置,再以標籤結構18b上對應至該等特徵點位置之頂點作為複數個第三特徵點。於本實施方式中,處理器13係根據該識別碼所對應之所有特徵點位置 以決定標籤結構18b上之該等第三特徵點,如第11圖所示。然而,於其他實施方式中,處理器13可根據該識別碼所對應之所有特徵點位置中的一部分來決定標籤結構18b上之該等第三特徵點。
接著,處理器13以該等第三特徵點計算視覺定位裝置1於該空間之一位置。舉例而言,處理器13可利用有效N點透視參數估測演算法(Efficient Perspective-n-Point Camera Pose Estimation;EPnP),達到以該等第三特徵點計算視覺定位裝置1於該空間之一位置。
需說明者,於某些實施方式中,為了更為精準地計算視覺定位裝置1於該空間之位置,處理器13可重複前述更新標籤結構及決定特徵點之運作。具體而言,處理器13可計算該等第二特徵點及該等第三特徵點間之一位置變化量(亦即,計算各該第二特徵點與相對應之該第三特徵點間之一差值,再加總該等差值作為該位置變化量),再以該等第三特徵點作為前述之第一特徵點。接著,處理器13再次地於第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點,以該等第二特徵點更新標籤結構之該等頂點,選取更新後之該等頂點中之一部分作為複數個第三特徵點,且再次地計算該等第二特徵點及該等第三特徵點間之一位置變化量。處理器13會重複地執行前述運作,直到該位置變化量小於一預設值。待該位置變化量小於該預設值後,處理器13才依據最後一次得到之該等第三特徵點計算視覺定位裝置1於該空間之位置。透過此種方式,處理器13能藉由多次運算而找出較接近辨識標籤影像16之實際特徵點之位置,進而準確地計算出視覺定位裝置1於該空間之位置。
另需說明者,於某些實施方式中,處理器13則可以一預定次 數重複地於第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點,以該等第二特徵點更新標籤結構之該等頂點,選取更新後之該等頂點中之一部分作為複數個第三特徵點。需注意者,處理器13在每次要進行下一輪之運作前,會以該等第三特徵點作為前述第一特徵點。透過此種方式,處理器13不僅能藉由多次運算而找出較接近辨識標籤影像16之實際特徵點之位置,亦能降低當特徵點之誤差過大時,重複地執行前述運作對處理器13所造成之負擔及所需之執行時間。
由上述說明可知,視覺定位裝置1在搜尋出辨識標籤影像16之角點位置16a、16b、16c、16d後,會依據這些角點位置16a、16b、16c、16d決定標籤結構18a,依據標籤結構18a決定複數個第一特徵點,於各該第一特徵點附近個別地搜尋出一第二特徵點,以該等第二特徵點將標籤結構18a更新為標籤結構18b,再根據更新後之標籤結構18b決定複數個第三特徵點。藉由數次決定特徵點能使最後所決定之該等第三特徵點之位置更為接近該辨識標籤影像之實際特徵點位置,因而能更為精確地定位視覺定位裝置1於該空間之位置。
本發明之第二實施方式為一種視覺定位方法,其流程圖係描繪於第2圖。該視覺定位方法適用於一電子裝置,例如第一實施方式所述之視覺定位裝置1。
首先,該電子裝置執行步驟S201以感測一空間中之一視覺編碼標籤以取得一影像。接著,執行步驟S203,由該電子裝置辨識出該影像中之一辨識標籤影像。之後,執行步驟S205,由該電子裝置搜尋該辨識標籤影像之複數個角點位置。接著,執行步驟S207,由該電子裝置根據該等角點 位置決定該辨識標籤影像之一標籤結構,其中該標籤結構具有複數個頂點。之後,執行步驟S209,由該電子裝置根據該辨識標籤影像之一識別碼,選取該等頂點之一部分作為複數個第一特徵點。
接著,執行步驟S211,由該電子裝置於各該第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點。之後,於步驟S213,由該電子裝置以該等第二特徵點更新該標籤結構之該等頂點。需說明者,於某些實施方式中,步驟S213可利用一回歸演算法,以該等第二特徵點更新該標籤結構之該等頂點。接著,執行步驟S215,由該電子裝置選取更新後之該等頂點之一部分作為複數個第三特徵點。之後,執行步驟S217,由該電子裝置以該等第三特徵點計算該電子裝置於該空間之一位置。
需說明者,於某些實施方式中,該視覺定位方法可再由該電子裝置執行一步驟(未繪示)以計算該等第二特徵點及該等第三特徵點間之一位置變化量。若該位置變化量大於一預設值,該視覺定位方法以該等第三特徵點作為該等第一特徵點,重複地執行步驟S211、步驟S213、步驟S215以及計算該等第二特徵點及該等第三特徵點間之一位置變化量。該視覺定位方法會重複地執行前述步驟,直到該位置變化量小於該預設值。另需說明者,於某些實施方式中,該視覺定位方法則是以該等第三特徵點作為該等第一特徵點,重複地執行步驟S211、步驟S213及步驟S215,直到達到一預定次數為止。
除了上述步驟,第二實施方式亦能執行第一實施方式所描述之視覺定位裝置1之所有運作及步驟,具有同樣之功能,且達到同樣之技術效果。本發明所屬技術領域中具有通常知識者可直接瞭解第二實施方式如 何基於上述第一實施方式以執行此等運作及步驟,具有同樣之功能,並達到同樣之技術效果,故不贅述。
第二實施方式所闡述之視覺定位方法可由具有複數個指令之一電腦程式產品實現。各電腦程式產品可為能被於網路上傳輸之檔案,亦可被儲存於一非暫態電腦可讀取儲存媒體中。針對各電腦程式產品,在其所包含之該等指令被載入至一電子裝置(例如:視覺定位裝置1)之後,該電腦程式產品執行第二實施方式所述之視覺定位方法。該非暫態電腦可讀取儲存媒體可為一電子產品,例如:一唯讀記憶體(read only memory;ROM)、一快閃記憶體、一軟碟、一硬碟、一光碟(compact disk;CD)、一隨身碟、一磁帶、一可由網路存取之資料庫或本發明所屬技術領域中具有通常知識者所知且具有相同功能之任何其他儲存媒體。
需說明者,於本發明專利說明書及申請專利範圍中,第一特徵點、第二特徵點及第三特徵點中之「第一」、「第二」及「第三」僅用來表示該等特徵點為不同階段之特徵點而已。
由上述說明可知,本發明所提供之視覺定位技術在搜尋出該辨識標籤影像之複數個角點位置後,會依據該等角點位置決定一標籤結構,依據該標籤結構決定複數個第一特徵點,於各該第一特徵點附近個別地搜尋出一第二特徵點,以該等第二特徵點更新該標籤結構,再根據更新後之標籤結構決定複數個第三特徵點。藉由數次決定特徵點能使最後所決定之該等第三特徵點之位置更為接近該辨識標籤影像之實際特徵點位置,因而能更為精確地定位該視覺定位裝置於該空間之位置。
上述實施方式僅用來例舉本發明之部分實施態樣,以及闡釋 本發明之技術特徵,而非用來限制本發明之保護範疇及範圍。任何本發明所屬技術領域中具有通常知識者可輕易完成之改變或均等性之安排均屬於本發明所主張之範圍,而本發明之權利保護範圍以申請專利範圍為準。

Claims (12)

  1. 一種視覺定位裝置,包含:一影像感測器,感測一空間中之一視覺編碼標籤以取得一影像;以及一處理器,電性連接至該影像感測器,且執行以下運作:(a)辨識出該影像中之一辨識標籤影像,(b)搜尋該辨識標籤影像之複數個角點(corner)位置,(c)根據該等角點位置決定該辨識標籤影像之一標籤結構,該標籤結構具有複數個頂點(vertices),(d)根據該辨識標籤影像之一識別碼,選取該等頂點之一部分作為複數個第一特徵點,(e)於各該第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點,(f)以該等第二特徵點更新該標籤結構之該等頂點,(g)選取更新後之該等頂點之一部分作為複數個第三特徵點,以及(h)以該等第三特徵點計算該視覺定位裝置於該空間之一位置。
  2. 如請求項1所述之視覺定位裝置,其中該處理器係利用一回歸演算法,以該等第二特徵點更新該標籤結構之該等頂點。
  3. 如請求項1所述之視覺定位裝置,其中該處理器更執行以下運作:(i)計算該等第二特徵點及該等第三特徵點間之一位置變化量,其中該處理器更以該等第三特徵點作為該等第一特徵點以重複地執行運作(e)、運作(f)、運作(g)及運作(i),直到該位置變化量小於一預設值。
  4. 如請求項1所述之視覺定位裝置,其中該處理器更以一預定次數重複地執行運作(e)、運作(f)及運作(g)。
  5. 一種視覺定位方法,適用於一電子裝置,該視覺定位方法包含下列步驟:(a)感測一空間中之一視覺編碼標籤以取得一影像; (b)辨識出該影像中之一辨識標籤影像;(c)搜尋該辨識標籤影像之複數個角點(corner)位置;(d)根據該等角點位置決定該辨識標籤影像之一標籤結構,該標籤結構具有複數個頂點(vertices);(e)根據該辨識標籤影像之一識別碼,選取該等頂點之一部分作為複數個第一特徵點;(f)於各該第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點;(g)以該等第二特徵點更新該標籤結構之該等頂點;(h)選取更新後之該等頂點之一部分作為複數個第三特徵點;以及(i)以該等第三特徵點計算該電子裝置於該空間之一位置。
  6. 如請求項5所述之視覺定位方法,其中該步驟(g)係利用一回歸演算法,以該等第二特徵點更新該標籤結構之該等頂點。
  7. 如請求項5所述之視覺定位方法,更包含下列步驟:(j)計算該等第二特徵點及該等第三特徵點間之一位置變化量;其中,該視覺定位方法更以該等第三特徵點作為該等第一特徵點,且重複地執行步驟(f)、步驟(g)、步驟(h)及步驟(j),直到該位置變化量小於一預設值。
  8. 如請求項5所述之視覺定位方法,更包含下列步驟:以該等第三特徵點作為該等第一特徵點,且以一預定次數重複執行步驟(f)、步驟(g)及步驟(h)。
  9. 一種電腦程式產品,經由一電子裝置載入該電腦程式產品後,該電子裝置執行該電腦程式產品所包含之複數個程式指令,以執行一視覺定位方 法,該視覺定位方法包含下列步驟:(a)感測一空間中之一視覺編碼標籤以取得一影像;(b)辨識出該影像中之一辨識標籤影像;(c)搜尋該辨識標籤影像之複數個角點(corner)位置;(d)根據該等角點位置決定該辨識標籤影像之一標籤結構,該標籤結構具有複數個頂點(vertices);(e)根據該辨識標籤影像之一識別碼,選取該等頂點之一部分作為複數個第一特徵點;(f)於各該第一特徵點之一預設搜尋範圍個別地搜尋出一第二特徵點;(g)以該等第二特徵點更新該標籤結構之該等頂點;(h)選取更新後之該等頂點之一部分作為複數個第三特徵點;以及(i)以該等第三特徵點計算該電子裝置於該空間之一位置。
  10. 如請求項9所述之電腦程式產品,其中該步驟(g)係利用一回歸演算法,以該等第二特徵點更新該標籤結構之該等頂點。
  11. 如請求項9所述之電腦程式產品,其中該視覺定位方法更包含下列步驟:(j)計算該等第二特徵點及該等第三特徵點間之一位置變化量;其中,該定位方法更以該等第三特徵點作為該等第一特徵點,且重複地執行步驟(f)、步驟(g)、步驟(h)及步驟(j),直到該位置變化量小於一預設值。
  12. 如請求項9所述之電腦程式產品,其中該視覺定位方法更包含下列步驟:以一預定次數重複執行步驟(f)、步驟(g)及步驟(h)。
TW105133702A 2016-10-19 2016-10-19 視覺定位裝置、方法及其電腦程式產品 TWI619093B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW105133702A TWI619093B (zh) 2016-10-19 2016-10-19 視覺定位裝置、方法及其電腦程式產品
CN201610957043.8A CN107967699B (zh) 2016-10-19 2016-11-03 视觉定位装置及方法
US15/347,356 US10043077B2 (en) 2016-10-19 2016-11-09 Visual positioning apparatus, method, and non-transitory computer readable storage medium thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW105133702A TWI619093B (zh) 2016-10-19 2016-10-19 視覺定位裝置、方法及其電腦程式產品

Publications (2)

Publication Number Publication Date
TWI619093B TWI619093B (zh) 2018-03-21
TW201816721A true TW201816721A (zh) 2018-05-01

Family

ID=61903984

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105133702A TWI619093B (zh) 2016-10-19 2016-10-19 視覺定位裝置、方法及其電腦程式產品

Country Status (3)

Country Link
US (1) US10043077B2 (zh)
CN (1) CN107967699B (zh)
TW (1) TWI619093B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI709062B (zh) * 2019-09-20 2020-11-01 財團法人資訊工業策進會 虛實疊合方法與系統

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006004197A1 (de) * 2006-01-26 2007-08-09 Klett, Rolf, Dr.Dr. Verfahren und Vorrichtung zur Aufzeichnung von Körperbewegungen
CN108710413B (zh) * 2018-05-22 2019-12-27 温岭市志创网络科技有限公司 一种计算机教学专用的便于拆卸的计算机结构
TWI743588B (zh) * 2019-11-08 2021-10-21 緯創資通股份有限公司 電子裝置與生物辨識的特徵獲得方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4729127A (en) * 1981-10-20 1988-03-01 The United States Of America As Represented By The Secretary Of The Army Method and system for compression and reconstruction of cultural data for use in a digital moving map display
EP1182604A1 (en) * 2000-08-22 2002-02-27 Setrix AG Method and apparatus for reading a bar code
AU2003298491A1 (en) * 2002-10-22 2004-05-13 Artoolworks Tracking a surface in a 3-dimensional scene using natural visual features of the surface
JP4537104B2 (ja) * 2004-03-31 2010-09-01 キヤノン株式会社 マーカ検出方法、マーカ検出装置、位置姿勢推定方法、及び複合現実空間提示方法
CA2566260C (en) * 2005-10-31 2013-10-01 National Research Council Of Canada Marker and method for detecting said marker
US7546950B2 (en) * 2006-03-28 2009-06-16 Seiko Epson Corporation Method and apparatus for locating and decoding a two-dimensional machine-readable symbol
KR100914515B1 (ko) * 2006-06-23 2009-09-02 주식회사 칼라짚미디어 색상 기반 이미지 코드의 색상 판별 방법
US7886978B2 (en) * 2007-09-20 2011-02-15 Microsoft Corporation Techniques for decoding images of barcodes
EP2458558B1 (en) * 2009-07-23 2022-09-21 Nec Corporation Marker generation device, marker generation detection system, marker generation detection device, marker, marker generation method, and program therefor
JP5464955B2 (ja) * 2009-09-29 2014-04-09 株式会社ソニー・コンピュータエンタテインメント パノラマ画像表示装置
TWI438699B (zh) * 2009-10-09 2014-05-21 Primax Electronics Ltd 條碼的處理方法與其相關裝置
CN102087743A (zh) * 2009-12-02 2011-06-08 方码科技有限公司 条形码扩充实境系统与方法
TWI419081B (zh) * 2009-12-29 2013-12-11 Univ Nat Taiwan Science Tech 提供擴增實境的標籤追蹤方法、系統與電腦程式產品
US8517253B2 (en) * 2010-10-14 2013-08-27 Georgia Tech Research Corporation Systems and methods for using machine-readable visual markers to provide environmental context for communications
TWI489859B (zh) * 2011-11-01 2015-06-21 Inst Information Industry 影像形變方法及其電腦程式產品
TWI530895B (zh) * 2011-11-22 2016-04-21 Chunghwa Telecom Co Ltd A system and method for collecting preferential information using the R & D technology
TWI559234B (zh) * 2012-06-29 2016-11-21 Patterns to take the range setting structure
US9286898B2 (en) * 2012-11-14 2016-03-15 Qualcomm Incorporated Methods and apparatuses for providing tangible control of sound
CN103150737A (zh) * 2013-01-18 2013-06-12 西北工业大学 一种适用于空间绳系机器人的实时空间目标特征点跟踪方法
US9607387B2 (en) 2013-04-12 2017-03-28 Aselsan Elektronik Sanayi Ve Ticaret Anonim Sirketi System and method for optimizing fiducial marker and camera positions/orientations
CN103390282B (zh) * 2013-07-30 2016-04-13 百度在线网络技术(北京)有限公司 图像标注方法及其装置
US9400930B2 (en) * 2013-09-27 2016-07-26 Qualcomm Incorporated Hybrid photo navigation and mapping
CN104050475A (zh) * 2014-06-19 2014-09-17 樊晓东 基于图像特征匹配的增强现实的系统和方法
KR101635599B1 (ko) * 2015-03-10 2016-07-04 인천대학교 산학협력단 Lbs 기반 오브젝트의 로케이션 업데이트 서비스 제공 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI709062B (zh) * 2019-09-20 2020-11-01 財團法人資訊工業策進會 虛實疊合方法與系統

Also Published As

Publication number Publication date
TWI619093B (zh) 2018-03-21
CN107967699A (zh) 2018-04-27
CN107967699B (zh) 2021-05-04
US10043077B2 (en) 2018-08-07
US20180107875A1 (en) 2018-04-19

Similar Documents

Publication Publication Date Title
TWI619093B (zh) 視覺定位裝置、方法及其電腦程式產品
JP6354589B2 (ja) 物体識別装置、方法及びプログラム
KR101165415B1 (ko) 이미지내 생체 얼굴 인식 방법 및 인식 장치
WO2023010758A1 (zh) 一种动作检测方法、装置、终端设备和存储介质
CN110794955B (zh) 定位跟踪方法、装置、终端设备及计算机可读取存储介质
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
CN110765795B (zh) 二维码识别方法、装置及电子设备
US20180158212A1 (en) Image calibration patient identification
US10298780B2 (en) Long range image calibration
US20180158211A1 (en) Image calibration for skin lesions
Mukhopadhyay et al. PCB inspection in the context of smart manufacturing
CN111695405B (zh) 一种狗脸特征点的检测方法、装置、系统及存储介质
CN110163914B (zh) 基于视觉的定位
CN109035666B (zh) 一种火烟检测方法、装置及终端设备
US10943366B2 (en) Wound characterization of a patient
Hofmann et al. Efficiently annotating object images with absolute size information using mobile devices
WO2017164239A1 (ja) 個体計数装置、個体計数方法、およびコンピュータ読み取り可能な記録媒体
JP2006331214A (ja) 物体識別タグ及びこれを使用した物体識別システム
JP4550768B2 (ja) 画像検出方法および画像検出装置
JPWO2014020820A1 (ja) 符号読取装置および符号読取方法
JP4675055B2 (ja) マーカ処理方法、マーカ処理装置、プログラム、および、記録媒体
Beglov Object information based on marker recognition
D'Haro et al. Automatic labelling of touristic pictures using CNNs and metadata information
Mooser et al. Tricodes: A barcode-like fiducial design for augmented reality media
JP2014232373A (ja) 照合対象抽出システム、照合対象抽出方法、照合対象抽出プログラム