TW201142739A - Graphic processing unit (GPU) with configurable filtering unit and operation method thereof - Google Patents

Graphic processing unit (GPU) with configurable filtering unit and operation method thereof Download PDF

Info

Publication number
TW201142739A
TW201142739A TW99116972A TW99116972A TW201142739A TW 201142739 A TW201142739 A TW 201142739A TW 99116972 A TW99116972 A TW 99116972A TW 99116972 A TW99116972 A TW 99116972A TW 201142739 A TW201142739 A TW 201142739A
Authority
TW
Taiwan
Prior art keywords
value
equation
filter
pixel
storage area
Prior art date
Application number
TW99116972A
Other languages
English (en)
Other versions
TWI408618B (zh
Inventor
Shao-Yi Chien
Chih-Hao Sun
You-Ming Tsao
Ka-Hang Lok
Original Assignee
Univ Nat Taiwan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Taiwan filed Critical Univ Nat Taiwan
Priority to TW99116972A priority Critical patent/TWI408618B/zh
Publication of TW201142739A publication Critical patent/TW201142739A/zh
Application granted granted Critical
Publication of TWI408618B publication Critical patent/TWI408618B/zh

Links

Description

201142739 六、發明說明: 【發明所屬之技術領域】 。本發明有關於一種具有可設定化濾波模組之繪圖處理 器及其運算方法’使用者可選定—適當的濾波方程式及設 定濾波方程式可調整的參數,致使以根據使用者的指示而 決定繪圖處理器的運算方式。 【先前技術】 現今繪圖處理器(Graphics Processing Unit ; GPU)常 使用於3D繪圖上,以透過繪圖處理器的貼圖功能而在一電 腦系統的螢幕上顯示出一 3d影像。 如第1圖所示’為習用繪圖處理器之結構示意圖。如 圖所示’繪圖處理器1〇〇包括有一記憶體模組11、一固定 式濾波模組13 —及可程式化著色模組15。 記憶體模組11儲存有複數張紋理影像m,該紋理影 像111屬於2D座標點(U,V)的紋理空間影像,其最小可定 址單元為紋理像素(texel),固定式濾波模組13包括有一 紋理濾波器(texture filter)131及一快取記憶體133,而 可程式化者色模組15包括有複數個著色器(shaders ),例 如:頂點著色器(vertex shader)、幾何著色器(geometry shader)、像素著色器(pixei shader)。 當繪圖處理器100進行3D繪圖時,可程式化著色模組 15可在一 3D螢幕空間上描繪出一 3D物件151 (如第2 (A) 201142739 圖或第2 (B)圖所示)’並將3D物件151的各座標點p(u,V,D) 傳送至固疋式濾波模組13。固定式濾波模組係從記憶體 模組11中提取至少一紋理影像m,並將紋理影像lu暫 存於快取記憶體133中。接續,固定式濾波模組13之紋理 濾波器131將可程式化著色模組15提供的座標點p對應到 紋理空間上的紋理影像111,並從快取記憶體133中存取該 座標點p周圍相鄰的至少一紋理像素點,紋理濾波器 在對於這些相鄰紋理像素點進行一加權運算,即可取得該 座標點P的像素值。之後,固定式濾波模組13傳送各座標 點P的像素值至可程式化著色模組15,以將各座標點?的 像素值陸續貼在3D物件151表面,而令物件151得以紋理 化。 又,快取記憶體133對於每一紋理影像lu會分別暫 存有不同解析度之圖層紋理影像,每—圖層紋理影像的尺 寸為前一層的一半’假設第〇層(Level 〇)的影像尺寸為
x256 ’則第1層(Level υ的影像尺寸即為mxi28,依此 類推至lx卜而固定式滤波模组13可採用雙線性紋理渡波 技術以使用—張適當解析度(如:最高解析度)的圖科算 出3D物件151上各座標點p的像素值,或者,採用三線性 紋理渡波技術以使用兩張不同解析度的圖層計算出扣物件 151上各座標點p的像素值。 請參閱第2(A)圖’為習用雙線性紋理濾波技術 1-1 一inear texture filtering)之應用示意圖。如第 2 圖所不,雙線性紋理濾波技術使用於單一圖層上,並以& 5 201142739 2(texe 1 s)視窗尺寸1111取樣座標點p周圍相鄰的紋理像 素點(a、b、c、d),藉由四個取樣點(a、b、c、d)來計算 座標點P的像素值。再者,該雙線性紋理濾波技術可利用 有限脈衝響應濾波(FIR Filter)方程式進行計算,如公式 (1)所列: P(U,V,D)= ink) xC(k)}+C offset....... ⑴ k&w {υ ,ν) ............V1 / 其中 U1U馬各紋理像素點(k=a、b、c、d),c(k)為 各紋理像素的權重(k = a、b、c、d),而c〇ffset為濾波方 程式計算所需的偏移量。 又,請參閱第2(B)圖,為習用三線性紋理濾波技術 (Tri-linear texture filtering)之應用示意圖。如第 2 (B)圖所示,三線性紋理濾波技術根據3D物件151的大小 比例選擇兩張不同解析度的圖層紋理影像U1 (例如礼 0、Level 1),並將座標點ρ分別對應至上下兩圖層紋理影 像111中,且以2x2(texels)視窗尺寸1111取樣座標點p 周圍相鄰的紋理像素點(a、b、c、d)(e、f、g、h),藉由 八個取樣點(a、b、c、d)(e、f、g、h)來計算座標點P的 像素值。再者,該三線性紋理濾波技術同樣可利用公式G) 之fir、線性遽;皮方程式進行計算,Λ中,『⑴為各紋理像 素點(k a b、c、d、e、f、g、h),而C(k)為各紋理像素 的權重(k=a、b、c、d、e、f、g、h)。 ,然,現今繪圖處理器100已經可進行較佳的3D繪圖 之運异功能,但,仍存在有許多技術上的問題: 201142739 mΓ會圖處理器100運詩3d繪圖上,因此,固定 二:^3讀―波11131所採㈣濾、波方程式往往 pf,且口::二功能而特別設計’不僅遽波方程式的種類有 ^ n #3D繪圖的相關運算。若,繪圖處理器100 =機:二ί其他影像處理或科學運算上,例 ί』: ···等等’則固定'波模組13無法進 二軍笪卢-’必須透過可程式化著色模組15的協助方能執 灯异处理,致使會加重可程式化著色模組15的運算負 者,固定式濾波模組13的部分功能將處在閒置或關 閉狀也,而令硬體資源使用效率降低。
—2^承上,右繪圖處理器1〇〇使用於其他影像處理上, 固定式濾、波· 13巾所❹的雙線性/三線性紋理遽波技 術’其-次可存取多筆紋理像素的功能將無法繼續執行, 將造成固定式;t波模組13在每―工作時脈巾只能抓取一筆 紋理像素,如此,不僅會影響到繪圖處理器1〇〇的運算效 率,且硬體原本具有的頻寬將無法充分利用。 > 3.使用者只能單方面採用固定式濾波模組13所預定 好的濾波方程式(例如:FIR線性濾波方程式),並且在利 用預定的濾波方程式計算3D物件151之座標點p的像素值 時’使用者無法對於取樣點數目I(k)(例如:固定為4個 取樣點)、取樣的視窗尺寸(例如:固定在2χ2視窗尺寸)、 各取樣點的權重C(k)或偏移量(Coffset)進行彈性的調整。 【發明内容】 201142739 本發明之主要目的,在於提供一種具有可設定化濾波模組 之、,曰圖處理器及其運算方法,可設定化滤波模組提供多種 遽波方程式,使用者可在繪圖處理器進行運作時選定其中 A波方程式進彳了運算處理,並在所選定_波方程式中 設定取樣的視窗尺寸、取樣點數目、各取樣點的權重及/ 或偏移量等等計算所需的參數。 本發明之次要目的,在於提供一種具有可設定化滤波 模組之繪圖處理器及其運算方法,可設定㈣波模組藉由 使用各種類型的遽波方程式,不僅應用於3D繪圖上,且可 進步使用於其他類型的影像處理、生物運算或科學運 等等。 本發明之又一目的,在於提供一種具有可設定化濾、波 模組之_處理ϋ及其運算方法,提供—應用程式介面, ,用者可經由應用程式介面選定一適當的遽波方程式及設 定濾波方程式可調整的參數。 為此,為達成上述目的,本發明提供一種具有可設定 化遽波模組之緣圖處理器,其包括有:一記憶體触°,儲 存有複數張紋理影像;及一可設定化濾波模組,連接記憶 體模組’包括有複數組遽波方程式,選定其中一遽波方程 ^ ’制定至少-視窗尺寸以在紋理影像中取樣出複數個像 素點、’各取樣像素點及各權值代入於選定的渡波方程式中 進行運异程序,以計算出一運算值。 。本,明尚提供-種具有可設定化濾波模組之繪圖處理 器之運算方法’其包括有:儲存至少-紋理影像;包括有 201142739 複數=波方程式,選定其中方程式進行運算;在 =^像巾取樣出複數個像素點;對於各取樣像素點分別 又定權值’及代人各取樣像素點及各權值 方程式中騎運算㈣,以計算出—運算值。 【實施方式】 首先明參考第3圖,為本發明繪圖處理器一較佳實 施例之結構示意圖。如圖所示’繪圖處理器(Graphics processing Unit ; GPU)200包括有一記憶體模組2〇及一可 设定化濾波模組(〇Qnfigurable Filtering _ ;⑽ 22, 該可設定化濾波模組22連接該記憶體模組2〇。 其中,記憶體模組20儲存有複數張紋理影像2〇1,而 可設定化滤波模組22包括有複數輯波方程式,例如:一 f限脈衝響應濾波(FIR Filter)方程式、一取最大值之型 fe滤波(MAX Morphological Filter)方程式及/戋一取最小 值之型態濾波(MIN Morphological Filter)方程式。當繪 圖處理器200欲對於紋理影像201進行資料運算時,二; 者可在這㈣波方程式中選定其中-進行,且制定一視窗 尺寸2011,例如·· 3x3,以利用該視窗尺寸2〇11在紋理影 像201中取樣出複數個像素點i(k),例如:k=a、卜卜/ e、f、g、h、i,如第4圖所示。之後’對於取樣出的像素 點i(k)分別對應設定一權值c(k),各取樣像素點(k)及各 對應的權值C(k)代入於選定的濾波方程式中進行運算矛。 序’即可計算出一運算值。 201142739 如此,使用者可在緣圖處理器2〇〇之可設定化滤波模 組22中選定-適當的濾波方程式,並對於濾波方程式計算 時所需的參數進行調整,致使繪圖處理器⑽將可根據使 用者的指示而決定運算方式。 又,可設定化濾波模組22包括有一快取記憶體23、 -可狀_'波單元25及-應用程式介面27。其中,快 取記憶體23暫存有紋理影像2Q1 ;可設定化·單元烈 包括有各濾波方程式,其連接快取記憶體23,並存取紋理 影像201中的各像素點;而應用程式介面27用以選定其中 一濾波方程式,制定視窗尺寸2〇11大小以決定取樣像素點 loo的位置及數量,以及設定各取樣像素點i(k)所對應的 各權值C(k)。 貝J 了。又疋化慮波單元25根據應用程式介面27所制定 的視窗尺寸2011從快取記憶體23中存取該選定的濾波方 程式計算時所需要的各取樣像素點I(k),選定的濾波方程 式即可利用可設定化濾波單元25存取出的各取樣像素點 I(k)及應用程式介面27所設定的各權值c(k)進行運算程 序’即可計算出該運算值。 再者’同時參閱第3圖及第4圖’本發明繒·圖處理器 200尚包括有一可程式化著色模組28,當繪圖處理器 欲運用在3D繪圖時,可程式化著色模組28可在一 3D螢幕 二間上私繪出一 3d物件281,並將3D物件281的各座標點 P(U’ V’ D)傳送至可設定化濾波模組22。可設定化濾波模組 22將各座標點P對應到2D紋理影像201之空間位置,並以 10 201142739 一 3x3視窗尺寸2G11在紋理影像2()1中取樣出各像素點
Uk),取樣像素點I(k)與設定的權值c(k)進行運算程序, 以產生各運#值。各運算值回傳至可程式化著色模組28, 以作為3D物件281上各座標點p的像素值,而使得犯物 件281得以紋理化。 快取記憶體23對於每一紋理影像2〇1會分別暫存有不 同解析度之圖層紋理影像,如256χ256、128χ128、...、4χ 4、2x2、l>d。在第4圖中,可設定化濾波模組&除採用 雙線性紋理濾、波技術以使用一張適當解析度(如··最高解析 度)的圖層紋理影像計算出3D物件281上各座標點p的像 素值外,或者’採用三線性紋轉波技術以使用兩張不同 解析度的圖層計算出扣物件281上各座標點p的像素值。 又在第4圖中,本發明除使用3x3視窗尺寸2011(同 第5(F)圖)取樣單一圖層紋理影像2〇1上的像素點叫 外,再者’亦可如第5 (A)圖、第5 (〇圖、第5 (D)圖、第 5 (E)圖、第5 (G)圖所示,分別採用2χ2、4χ卜1χ4、1χ8、 8><!^或其他視面尺寸(例如:單一取樣點)對於紋理影像201 之單-圖層進行讀素·點I(k)的取樣,或者,如第5⑻ 圖所不’ 2x2 |其他視窗尺寸對於紋理影像2〇1中之 上下兩張不同解析度圖層進行各像素點1⑴的取樣。 由上所述,本發明可設定化濾波單元25可用以FIR線 性驗方程式、MAX型_'波方程式、腳型祕波方程式 之運鼻程序,各濾波方程式的公式如下所列: £ IR濾波方_ $ ,.(2) 201142739
keW {V .V 關於公式⑵的運算方式,各取樣像素點100與各對應 的權值c(k)進行相乘以求得複數個乘積值,各乘積值在^ 行-加總程序,加總程序完成後,在加上 Coffset ’即可計算出該運算值p。 里 MAX型態濾浊方鞀$ ρ = ,ΜίΙΛΜ㈨ \c[k、}is enabled ................................ 關於公式(3)的運算方式,各取 的權傕(YicV# —4 + 炫像常點I(k)與各對應 的權值C(k)進仃相乘以求得複數 行一比於鞋皮、 忡银数個采積值,各乘積值在進 ..乂序,以比較出一最大值的乘積值,則該最大值 的乘積值即為該運算值P。 值 p 的權⑷:Γ方式’各取樣像素點_各對應 行-比:序==得複數個乘積值,各乘積值在進 的乘積值即為該運算值\。S小值的乘積值’則該最小值 元二:實:::第電6路=,為本發明可設定化_ 化濾波單元%夕發 丁〜、圖。如圖所示,本發明可設定 階層式之運算器單元路^2構包括有複數個乘法器250及一多 12 201142739 各取樣像素點 I (k=a、b、c、d、e、f、g、h、 ?與各對應的權值C(k=a、b、c、d、e小g、h、i)在各 乘法器250中進行乘法運算,以產生複數個乘積值,例如: A、b、C、D、e、f、G、H、I。 、而夕h層式之運算器單元251經由複數個運算器 、、且,為Ρ白層式結構(Hierarchical Structure)電路,例如: 4階層(L^er)。各運算器252分別接收一運算選擇訊號, 以根據運算選擇訊號的指示進行其中一遽波方程式的運 程序,而計算出該運算值p。 —立凊參閱第7圖所#,為本發明運算器一實施例之電路 二意,。如圖所示,本實施例將以乘積值A及乘積值B進 行運算器252的電路解說。運算器252包括有-第一選擇 器2521、一加法器2522、一第二選擇器託”及一正、 號表示器2524。 胃# 其第一選擇器2521接收乘積值A、反向的乘積值 • —A及運算選擇訊號’藉此’第一選擇器2521根據運算選 ,訊號以決定輸出乘積值A或乘積值—A。當運算選擇訊號 指示進行FIR線性渡波方程式時,第—選擇器2521輸出^ 積值A ;當運算選擇訊號指示進行ΜΑχ型態遽、波方程式或 ΜΙΝ型態淚波方程式時,第一選擇器2521輸出乘積值一ρ 加法器2522接收乘積值A、乘積值-a或乘積值Β,乘 積值Β係與乘積值A、乘積值-Α之其中一進行相加,以叶 鼻出一相加值A+B/B-A。 正負付5虎表示器2524接收加法值a+B/B~A,以產生一 13 201142739 旗標訊號,该旗標訊號指示加法值A+b/b_a為正數戈負 第二選擇器2523接收乘積值A、乘積值/加法數值 A+B/B-A、運算選擇訊號及旗標訊號,根據運算選擇訊號及 旗標訊號決定輸出乘積值Λ、乘積值B、加法值Α+β。為 算選擇訊號指示進行FIR線性遽波方程式且旗標訊號:正 數時,第二選擇器2523輸出加法值A+B;當運算選擇訊號 指示進行MAX㈣;慮波方程式時,若旗標訊號為正數 (B-AM)) ’則第二選擇器2523輸出乘積值b,反之,若 標訊號為負數(B-A<〇) ’則第二選擇器卿輸出乘積值 a;當運算選擇訊號指示進行皮方程式時, 標訊號為正數(B-AM)),則第二選擇器卿輸出乘積值A, 右旗標訊號為負數㈣<()),則第二選擇器⑽輸 出乘積值B。 此外,本發明運算器252尚包括有一反向器挪反 向器2525用以反向乘積值A,以產生該乘積值_A。 另’乘積值^^^^其彼此 ^中的運算程序係與上述的乘積值Α、β完全相同,在此 不在重複闡述。 運算?t?A?、C、D、E、F、G、H、_“_ 出端二屮運算處理後,於最後一階層的運算器252的輸 一加總過後之加法值、一最大值的乘積值或一最 J值的乘積值即可為該運算值p。 式=库當可程式化據波單元25用以FIR線性遽波方程 運异私序時,則多階層式之運算器單元⑸之其中-運 201142739 算器252將接收一偏移量’以將偏移量加入於加總的加法 值中。
又,本實施例運算器252仙3x3視窗尺寸為例,當 然亦可使用在其他類型的視窗尺寸,再者,若應用於W、 4x1或2x2單層取樣的視窗尺寸時,運算器252亦可劃分 成上下兩部電路,上半部運算器252處理一視窗尺寸:取 樣出的像素點,以在最後階層的運算器252之輸出端產生 運算值Ρ卜下半部運算旨252處理另一視窗尺寸所取樣出 的像素點,以在最後階層的運算器252之輸出端產生運算 值Ρ2。藉此,平行處理兩個視窗尺寸的取樣像素點,以增 加可程式化濾波單元25的處理效率。 S 進一步,係以第8圖範例進行解說,本實施例係以3χ 3視窗尺寸在紋理影像2()1上進行像素點取樣。在本實施例 中’取樣像素點分別包括有九個點(a、b、c、d、e、f、g、 h、Π ’取樣點的像素值Kk)分別為(ia=4、Ib=3、IC=3、 Id-7、Ie-5' If=2、Ig=3、Ih=6、Ii=3) ’ 而設定的權值 c(k) 分別為(Ca=0. 75、Cb=0. 75、Cc=0. 5 ' Cd=0. 75、Ce=〇. 75、 Cf=0. 5、Cg=〇. 5、Ch=0. 5、Ci=0. 25)。 當可設定化濾波單元25使用FIR線性濾波方程式進行 運算程序時,取樣點的像素值Ι(κ)及C(K)代入於公式(2) 中,且在公式(2)中之偏移量(Coffset)可設定為1,則乘積 值 Α(4χ0·75=3)+乘積值 Β(3χ0· 75=2.25)+乘積值 C(3x 〇. 5=1. 5)+ 乘積值 D(7 x 〇· 75=5. 25)+ 乘積值 Ε(5 χ 0.75=3. 75Η乘積值 F(2x〇 5=1) +乘積值 G(3x〇 5=15) +乘 15 201142739 積值 H(6x0. 5=3)+乘積值 ι(3χ〇. 25=〇. 75)+偏移量(1)=23, 則加總過後之加法值23即為該運算值p。 當可設定化濾波單元25使用MAX型態濾波方程式進行 運算程序時,取樣點的像素值I(K)及C(K)代入於公式(3) 中,乘積值A(3)、乘積值B(2. 25)、乘積值C(l· 5)、乘積 值D(5.25)、乘積值E(3 75)、乘積值F(1)、乘積值g(15)、 乘積值H(3)、乘積值KG.75)進行彼此間最大值比較,以 求得最大的乘積值])(5 25),則乘積值D(5 25)即為該運 算值P。 當可設定化濾波單元25使用MIN型態濾波方程式進行 運算程序時,取樣點的像素值I(K)及C(K)代入於公式(4) 中,各乘積值八(3)、乘積值8(2.25)、乘積值{:(1.5)、乘 積值D(5.25)、乘積值E(3.75)、乘積值F(1)、乘積值 G(L 5)、乘積值h(3)、乘積值l(〇. 75)進行彼此間最小值 比較,以求得最小的乘積值K0. 75),則乘積值l(〇. 75)即 為該運算值P。 4參閱第9圖所示,為本發明調整取樣點數目一實施 例之操作示意圖。本實施例取樣點數目之調整方法係可使 用在MAX/ΜΙΝ型態濾波方程式上。 係以3x3視窗尺寸為例’當使用者欲調整取樣點數目 時,可對於3x3視窗尺寸所取樣出的像素點其對應權值設 定為零。於本實施例之圖示中,使用者可將a、c、g、i像 素點之對應權值設定為零,則使用MAX型態濾波方程式進 行運算程序時,則a、c、g、I像素點之像素值不論多大, 201142739 其像素值與權值零相乘的結果皆為零值,因此,a、c、g、 I像素點將排除為取樣點。 相反的,若使用MIN型態濾波方程式進行運算程序時, 使用者可在至少一像素點之對應權值設定為零,則MIN型 態濾波方程式必定產生一零值之運算值,以供其他後續處 理的使用,例如:係將零值(黑點)貼至3D物件上。 請參閱第10圖所示,為本發明應用程式介面一較佳實 施例之介面示意圖。如圖所示,本發明應用程式介面27包 括有複數個設定框271/273/275/277/279。 本實施例繪圖處理器200若使用於3D繪圖上,可程式 化著色模組28會根據螢幕場景的鏡頭遠近而決定描繪出 3D物件281的大小比例。 當3D物件281為一較小的物件時,可程式化濾波單元 25將從快取記憶體23中讀取至少一較低解析度圖層的紋 理影像201,則使用者在主題TEHURE MIN FLITER項目之 設定框(Set Pixel Windows)271中制定一視窗尺寸,例如: 雙線性紋理濾波技術所採用的單一取樣點、2x2、4>d、1x4、 1x8、3x3、8x1或三線性紋理濾波技術所採用的2x2,以利 用制定的視窗尺寸從較低解析度圖層的紋理影像2〇1中進 行各像素點I(k)的取樣。 當3D物件281為一較大的物件時’可程式化濾波單元 25將從快取記憶體23中讀取至少一較高解析度圖層的紋 理影像201,則使用者在主題TEXTURE MAG FLITER項目之 設定框(Set Pixel Windows)273中制定一視窗尺寸,例如: 17 201142739 雙線性紋理濾波技術所採用的單一取樣點、2x2、4x卜1x4、 1x8、3x3、8x1或三線性紋理濾波技術所採用的2x2,以利 用制定的視窗尺寸從較高解析度圖層的紋理影像201中進 行各像素點I(k)的取樣。 使用者在主題TEXTURE FLITER TYPE項目之設定框(Set Filter Type)275中選定一欲執行運算的濾波方程式,例 如:FIR、MAX或ΜIN滤波方程式。 使用者在主題TEXTURE FLITER C0EF項目之設定框(Set Coefficients)277中設定各取樣像素點I(k)的權重 C(k),其權重C(k)之設定數量同於各取樣像素點I(k)的取 樣數量,且各權重C(k)數值為一浮點數(float)並不限任何 數值。 再者,若使用者在主題TEXTURE FLITER TYPE之設定 框(Set Filter Type)275中選定FIR濾波方程式進行運算 程序,則使用者還必須在應用程式介面27之TEXTURE FLITER C0FFSET 項目之設定框(Set Coffset)279 中設定 一偏移量Cof fset,該偏移量Cof fset為FIR濾波方程式之 其中一計算參數且為一常數值(constant)。 雖然,本發明繪圖處理器200上述圖示主要以3D繪圖 作為解說,但,也可應用在其他影像處理、生物運算或者 科學運算上,例如:影像辨識,DNA檢測、機器學習語言... 等等,藉以擴大繪圖處理器200可運算處理的領域,再者, 可在可設定化濾波模組22中嵌入更多種類的濾波方程式, 以應付各種類型的運算處理,而計算出所需的運算值。 18 201142739 印參閲第11圖所示,為本發明快取記憶體暫存紋理影 像之儲存示意圖。如圖所示,快取記憶體23包括有複數個 儲存區(Banks),例如八個儲存區(B0_B7),每一儲存區在 每一工作時脈中可傳送4個(2x2)像素點(texeis)至可設 定化濾波單元25。 快取記憶體2 3對於紋理影像2 〇 1劃分成複數個紋理片 狀區,母一紋理片狀區包括有八個列的座標位址,各座標 位址分別表示有一像素點,該紋理片狀區的第一列座標位 址及第二列區域位址上的各像素點依序循環儲存於第一儲 存區別、第二儲存區B1、第三儲存區B2及第四儲存區B3 中,5亥紋理片狀區的第三列座標位址及第四列區域位址上 的各像素點依序循環儲存於第五儲存區B4、第六儲存區 B5、第七儲存區β6及第八儲存區β7中,該紋理片狀區的 第五列座;位址及第六列區域位址上的各像素點依序循環 儲存於第三儲存區B2、第四儲存區B3、第一儲存區B0及 第二儲存區B1中,而該紋理片狀區的第七列座標位址及第 八列區域位址上的各像素點依序循環儲存於第七儲存區 B6、第八儲存區B7、第五儲存區B4及第六儲存區肋中。 快取記憶體23如上方式暫存紋理影像2〇1之像素點, 可5又定化濾波單元25根據視窗尺寸對於紋理影像2〇1之像 素,進行取樣時,由於可設定化濾波單元25對於各儲存區 在每一工作時脈中最多只能存取4個像素點,若超過4個 取樣像素點儲存於同一儲存區中,則可設定化濾波單元25 必須使用至少兩個工作時脈進行存取才能將取樣像素點提 201142739 取完畢,而令繪圖處理器2 0 0的效率降低。 請參閱第12圖所示,為本發明繪圖處理器之運算方法 一較佳實施例之流程圖。如圖所示,首先,如步驟S90所 示,繪圖處理器200儲存有至少一紋理影像201。 如步驟S91所示,繪圖處理器200之可設定化濾波模 組22中包括有複數個濾波方程式,例如:有限脈衝響應濾 波(FIR Filter)方程式、一取最大值之型態濾波(MAX Morphological Fi Iter)方程式及/或一取最小值之型態濾、 波(M IN Morphological Filter)方程式。使用者可透過一 應用程式介面27以在這些濾波方程式中選定其中一進行 運算。 如步驟S92所示,使用者透過應用程式介面27制定出 一視窗尺寸,以根據視窗尺寸在紋理影像201中取樣出複 數個像素點。 如步驟S93所示,使用者透過應用程式介面27對於各 取樣像素點I(k)分別設定一權值C(k)。 如步驟S95所示,各取樣像素點I(k)及其對應的各權 值C(k)代入於所選定的濾波方程式中進行運算程序,以計 算出一運算值P。 再者,本發明繪圖處理器之運算方法尚包括有一步驟 S94,當使用者選定FIR濾波方程式進行運算程序,則使用 者尚須設定一偏移量(Coffset),以將偏移量代入於FIR濾 波方程式中,之後,FIR濾波方程式在利用各取樣像素點 I(k)、各權值C(k)及偏移量(Coffset)進行運算程序,以 20 201142739 計算出該運算值P。 以上所述者,僅為本發明之一較佳實施例而已,並非 用來限定本發明實施之範圍,即凡依本發明申請專利範圍 所述之形狀、構造、特徵及精神所為之均等變化與修飾, 均應包括於本發明之申請專利範圍内。 【圖式簡單說明】 第1圖:為習用繪圖處理器之結構示意圖。 第2(A)圖:為習用雙線性紋理濾波技術之應用示意圖。 第2(B)圖:為習用三線性紋理遽波技術之應用示意圖。 第3圖:為本發明繪圖處理器一較佳實施例之結構示意 圖。 ^ 第4圖:為本發明雙線性紋理濾波技術之應用示意圖。 第5圖:為本發明視窗尺寸之種類示意圖。 第6圖:為本發明可設定化濾波單元一較佳實施例之電路 示意圖。 第7圖:為本發明運算器一實施例之電路示意圖。 第8圖:為本發明可設定化濾波模組使用各遽波方程式進 行一運算程序之範例示意圖。 第9圖:為本發明調整取樣點數目—實施例之操作示意 圖。 〜 ^ 10圖:為本發明應用程式介面一較佳實施例之介面示 意圖。 第11圖:為本發明快取記憶體暫存紋理影像之儲存示意 21 201142739 圖。 第12 圖:為本發明繪圖處理 [ 主要元件符號說明】 100 繪圖處理器 111 紋理影像 13 固定式遽波模組 133 快取記憶體 151 3D物件 20 記憶體模組 2011 視窗尺寸 23 快取記憶體 250 乘法器 251 多階層式之運算器單; 252 運算器 2522 加法器 2524 正負符號表示器 27 應用程式介面 273 設定框 277 設定框 28 可程式化著色模組 器之運算方法。 11 記憶體模組 1111 視窗尺寸 131 紋理濾波器 15 可程式化著色模組 200 繪圖處理器 春 201 紋理影像 22 可設定化濾波模組 25 可設定化濾波單元 元 2521 第一選擇器 2523 第二選擇器 2525反向器 ® 271 設定框 275 設定框 279 設定框 281 3D物件 22

Claims (1)

  1. 201142739 七、申請專利範圍: 1 . 一種具有可設定化濾波模組之繪圖處理器,其包括有 一記憶體模組,儲存有至少一紋理影像;及 一可設定化濾波模組,連接該記憶體模組,包括有複 數組濾波方程式,選定其中一濾波方程式,在該紋 理影像中取樣出複數個像素點,對於各取樣像素點
    分別設定一權值,各取樣像素點及各權值代入於該 選定的濾波方程式中進行運算程序,以計算出一運 算值。 2如申凊專利範圍第1項所述之繪圖處理器,其中該可 設定化濾波模組包括有: 一快取記憶體,暫存有該紋理影像; 一可設定化紐單元,包括有職波絲式,連接該 快取記憶體,存取該紋理影像中的各像素點;及 -應用程式介面,用以敎其巾―遽波絲式及制定 至少-視窗尺寸以決定在該紋理影像中取樣出該取 樣像素點的位置及數量,錢定各取樣像素點所對 應的各權值; 其I,該可狀化濾波單元根據該應用程式介面所制 :的。亥視自尺寸仗該快取記憶體中存取該選定的濃 t程式計算所S的錄樣像素點,職選定的遽 即可利用該可設定化據波單元存取出的各 樣像素點及該應用程式介面所設定的各權值進行 23 201142739 兩者間的運算程序,以計算出該運算值。 3 .如申請專利範圍第1項所述之繪圖處理器,尚包括有 -可程式化著色模組,其可在一 3D$幕空間上描繪出 一 3D物件,並將該3D物件之各座標點傳送至該可設 定化濾波模組,則該可設定化濾波模組將各座標點對 應到2 D該紋理影像的空間位置,並制定至少一視窗尺 寸在該紋理影像中取樣出各像素點,以將各取樣像素 點與各權值進行運算而產生各運算值,各運算值回傳 至該可程式化著色模組,以將各運算值作為該汕物件 上各座標點的像素值。 4 ·如申请專利範圍第2項所述之繪圖處理器,其中該濾 波方程式包括有一有限脈衝響應濾波(FIR Fiiter)方 程式、一取最大值之型態濾波(ΜΑχ M〇rph〇1〇gicai Filter)方程式及/或一取最小值之型態濾波(min Morphological Filter)方程式。 5 ·如申清專利範圍第4項所述之繪圖處理器,其中該應 用程式介面尚可對於該有限脈衝響應遽波方程式中之 :偏移量的計算參數進行設定,而各取樣像素點、各 權值及該偏移量代入於該有限脈衝響應滤波方程式中 進行運算程序,以計算出該運算值。 6 .如申請專利範圍第4項所述之繪圖處理器,其中該可 設定化滤波單元包括有: 複數個乘法器,各取樣像素點及其對應的各權值經由 各乘法器的乘法運算,以求得各乘積值; 24 201142739 夕階層式之運算器單元,包括有複數個運算器,各 乘積值輸入於該多階層式之運算器單元中,而該多 階層式之運算ϋ單元之各運算器接收—運算選擇訊 號,以根據該運算選擇訊號的指示進行其中一遽波 方私式的運算程序,而計算出該運算值。 專利範圍第6項所述之綠圖處理器,其 异盎包括有:
    =選擇器,接收其中—該乘積值、其中—反向的 及該運算選擇訊號,根據該運算選擇訊號 值^輪出其中一該乘積值或其中一反向的該乘積 一 接收其中—該乘積值、其中—反向的該乘 一積值或另-該乘積值,以計算出—加法值; 一=負,號表示器’接收該加法值,以產生—旗標訊 8 接收其中一該乘積值、另-該乘積值、 / 、该運异選擇訊號及該旗標訊號,根據該 ,鼻選擇訊號及該旗標訊號決定輸出其中一該= .如值二另一該乘積值或該加法值。 ΐ m=圍第7項所述之繪圖處理器’其中該運 ^ 有—反向器,其用以反向其中一該乘# 值,:X取得其中一反向的該乘積值。 4積 多利範圍第7項所述之緣圖處理器,其中在該 曰式之運算器單元中,其最後階層的該運算器所 25 201142739 輸出的其中-該乘積值、另一該乘積值或加總之該加 法值即為該運算值。 10 11 如申請專利範圍第7項所述之綠圖處理器,當該運算 =訊號指示該多階層式之運算器單讀用該有限脈 .應纽絲歧行運算程料,料㈣輸出該 加,值,並於各階層的運算器中加總該加法值,且於 進行加總程序時進一步加上一偏移量。 請專利範圍第7項所述之输圖:理器,當該運算 ^擇心虎指不該多階層式之運算器單元之 ^該取最讀之㈣方程式進行運算程序時ί 選擇器輸出其中一反向的該乘積值,其中一反向 乘積值與另—該乘積值間進行加法計算而得到該 —值’該正負符號表示器判斷該加法值之正負值, 一負值,則該第二選擇器輸出其中-該 人積值,反之,該加法值為一 12 輪出另一該乘積值。4正值,則该第二選擇器 ·=請專利範圍第7項所述之_處理器,當該運算 =訊號指示該多階層式之運算器單元之各運算号使 第方程式進行運算程序時:該 k擇器輸出其中一反向的該 積值與另-該乘積值間進行加法計算 若卞/正負符號表示器判斷該加法值之正負值, :加法值為一負值,則該第二選 積值,反之,該加法值為-正值,則該第‘;: 26 201142739 出其中一該乘積值。 13如申凊專利範圍第2項所述之繪圖處理器,其中該紋 理影像為複數個圖層所組成,每一圖層分別為具有一 對應的解析度。 W·如申請專利範圍第13項所述之繪圖處理器,其中該可 "又疋化濾波模組根據所制定的該視窗尺寸,以在該紋 理影像之單一圖層中或雙圖層中取樣出各像素點,且 該可設定化濾波模組可利用2χ2、4χ1、1χ4、ΐχ8、3χ 3、8x1或其他視窗尺寸對於該紋理影像之單一圖層進 行各像素點的取樣,或者,該可設定化濾波模組可利 用2x2或其他視窗尺寸對於該紋理影像之雙圖層進行 各像素點的取樣。 15如申凊專利範圍第2項所述之繪圖處理器,其中該快 取δ己憶體包括有複數個儲存區,每一儲存區在每一工 作時脈中儲存有2x2矩陣像素點。 16·如申請專利範圍第15項所述之繪圖處理器,其中該快 取纪憶體包括有八個儲存區,該紋理影像劃分出複數 個紋理片狀區,每一紋理片狀區包括有八個列的座標 位址各座;^位址分別表示有一像素點,該紋理片狀 區的第一列座標位址及第二列區域位址上的各像素點 依序循裱儲存於第一儲存區、第二儲存區、第三儲存 區及第四儲存區中,該紋理片狀區的第三列座標位址 及第四列區域位址上的各像素點依序循環儲存於第五 儲存區、第六儲存區、第七儲存區及第八儲存區中, 27 201142739 。亥紋理片狀區的第五列座標位址及第六列區域位址上 的各像素職序循環儲存於第三儲存區、第四儲存 區、第-儲存區及第二儲存區令,而該紋理片狀區的 第七列座標位址及第八列區域位址上的各像素點依序 循環儲存於第七儲存區、第八儲存區、第五儲存區及 第六儲存區中。 17 . —種具有可設定化濾波模組之繪圖處理器之運 法,其包括有: 儲存至少一紋理影像; 選定複數個濾波方程式其中之一進行運算; 在該紋理影像中取樣出複數個像素點; 對於各取樣像素點分別設定一權值;及 代入各取樣像素點及各權值於該選定的濾波方程式中 進行運算程序,以計算出一運算值。 18 ·如申請專利範圍第17項所述之運算方法,其中該濾波 方程式包括有一有限脈衝響應濾波(FIR Filter)方程 式、一取最大值之型態濾波(MAX M〇rph〇1〇gical Fi Iter)方程式及/或一取最小值之型態濾波(MIN Morphological Filter)方程式。 19 ·如申請專利範圍第18項所述之運算方法,其中該選定 的;慮波方私式為該有限脈衝響應遽波方程式時,尚包 括有一步驟: 設定一偏移量,並代入於該選定的濾波方程式中。 0如申請專利範圍第17項所述之運算方法,藉由制定至 28 201142739 少一視窗尺寸以決定在該紋理影像中取樣出該取樣像 素點的位置及數量。
    29
TW99116972A 2010-05-27 2010-05-27 具有可設定化濾波模組之繪圖處理器及其運算方法 TWI408618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW99116972A TWI408618B (zh) 2010-05-27 2010-05-27 具有可設定化濾波模組之繪圖處理器及其運算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW99116972A TWI408618B (zh) 2010-05-27 2010-05-27 具有可設定化濾波模組之繪圖處理器及其運算方法

Publications (2)

Publication Number Publication Date
TW201142739A true TW201142739A (en) 2011-12-01
TWI408618B TWI408618B (zh) 2013-09-11

Family

ID=46765143

Family Applications (1)

Application Number Title Priority Date Filing Date
TW99116972A TWI408618B (zh) 2010-05-27 2010-05-27 具有可設定化濾波模組之繪圖處理器及其運算方法

Country Status (1)

Country Link
TW (1) TWI408618B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI514314B (zh) * 2013-03-15 2015-12-21 Intel Corp 丟棄過濾器分接點之紋理位址模式

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292221B2 (en) * 2003-03-20 2007-11-06 Lg Electronics Inc. Apparatus and method for controlling inverter pulse width modulation frequency in LCD in portable computer
TWI265640B (en) * 2004-12-10 2006-11-01 Giga Byte Tech Co Ltd Image display device and the method thereof
JP4340640B2 (ja) * 2005-04-20 2009-10-07 シャープ株式会社 増幅型固体撮像装置
US20070067572A1 (en) * 2005-09-19 2007-03-22 Via Technologies, Inc. Buffering missed requests in processor caches

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI514314B (zh) * 2013-03-15 2015-12-21 Intel Corp 丟棄過濾器分接點之紋理位址模式
US10152820B2 (en) 2013-03-15 2018-12-11 Intel Corporation Texture address mode discarding filter taps

Also Published As

Publication number Publication date
TWI408618B (zh) 2013-09-11

Similar Documents

Publication Publication Date Title
Pfister et al. Cube-4-a scalable architecture for real-time volume rendering
Aittala Inverse lighting and photorealistic rendering for augmented reality
TWI494916B (zh) 用於影像處理的裝置和系統
CN107395958B (zh) 一种图像处理方法、装置、电子设备及存储介质
CN109903385A (zh) 三维模型的渲染方法、装置、处理器及终端
US20070008333A1 (en) Texture filter using parallel processing to improve multiple mode filter performance in a computer graphics environment
US20160148420A1 (en) Image processing apparatus and method
US9959600B2 (en) Motion image compensation method and device, display device
US8610737B2 (en) Graphic processing unit (GPU) with configurable filtering module and operation method thereof
WO2005114646A2 (en) Low power programmable processor
US20020015041A1 (en) Graphics system with an improved filtering adder tree
US6452603B1 (en) Circuit and method for trilinear filtering using texels from only one level of detail
CN105389776B (zh) 图像缩放技术
US10008023B2 (en) Method and device for texture filtering
Licciardo et al. Stream processor for real-time inverse Tone Mapping of Full-HD images
Yoon et al. A unified graphics and vision processor with a 0.89/spl mu/W/fps pose estimation engine for augmented reality
Rauhala et al. A novel interface to sensor networks using handheld augmented reality
US6778188B2 (en) Reconfigurable hardware filter for texture mapping and image processing
TW201142739A (en) Graphic processing unit (GPU) with configurable filtering unit and operation method thereof
JP2016020833A (ja) 食材判定装置、方法、プログラム、及びクッキングスケール
Gour et al. Hardware accelerator for real-time image resizing
US9741095B2 (en) Method for electronic zoom with sub-pixel offset
Gholizadehazari et al. An FPGA implementation of a RISC-V based SoC system for image processing applications
McGuire Efficient, high-quality bayer demosaic filtering on gpus
CN112802075A (zh) 纹理生成模型的训练方法、图像处理方法及装置