KR102251444B1 - 그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법 - Google Patents
그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법 Download PDFInfo
- Publication number
- KR102251444B1 KR102251444B1 KR1020140142675A KR20140142675A KR102251444B1 KR 102251444 B1 KR102251444 B1 KR 102251444B1 KR 1020140142675 A KR1020140142675 A KR 1020140142675A KR 20140142675 A KR20140142675 A KR 20140142675A KR 102251444 B1 KR102251444 B1 KR 102251444B1
- Authority
- KR
- South Korea
- Prior art keywords
- processing unit
- primitive
- color data
- aliasing
- fragment
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/50—Lighting effects
- G06T15/503—Blending, e.g. for anti-aliasing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/40—Filling a planar surface by adding surface attributes, e.g. colour or texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/005—General purpose rendering architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/10—Geometric effects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/50—Lighting effects
- G06T15/80—Shading
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Image Generation (AREA)
Abstract
그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법이 제공된다. 상기 그래픽 프로세싱 유닛은, 버텍스(vertex)를 입력받고, 상기 버텍스를 이용하여 프리미티브(primitive)를 생성하는 지오메트리(geometry) 프로세싱 유닛, 및 상기 생성된 프리미티브를 프래그먼트(fragment)로 변환하고, 상기 변환된 프래그먼트에 대해 프래그먼트 쉐이딩(fragment shading)을 수행하고, 상기 프래그먼트 쉐이딩이 수행된 상기 프래그먼트에 대해 안티 에일리어싱(antialiasing)을 수행하는 렌더링(rendering) 프로세싱 유닛을 포함하되, 상기 렌더링 프로세싱 유닛이 상기 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터와 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행한다.
Description
본 발명은 그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법에 관한 것이다.
최근, 컴퓨터 성능이 향상됨에 따라, 그래픽 프로세싱 시스템은 개인용 컴퓨터, 홈 비디오 게임 컴퓨터, 휴대형 장치 등을 이용하여 그래픽 영상을 더욱 사실적으로 표현할 수 있게 되었다. 이와 같은 그래픽 프로세싱 시스템에서는, 시스템의 스크린 상에서 그래픽 프리미티브(primitive)들을 렌더링(rendering)하기 위해 많은 과정을 거치게 된다.
그래픽 프로세싱 유닛(Graphic Processing Unit; GPU)은 그래픽 프로세싱 시스템에서 그래픽 연산을 담당하는 코어(core)를 의미한다. 그래픽스 파이프라인(graphics pipeline)은 3차원의 오브젝트(object)를 입력으로 하고 2차원의 렌더링(rendering) 이미지를 출력하는 그래픽 프로세싱 유닛의 하드웨어 구성을 나타낸다. 최근 그래픽 해상도의 증가는 그래픽 프로세싱 유닛의 연산과 메모리의 대역폭을 급격하게 증가시키는 원인이 되고 있다.
본 발명이 해결하고자 하는 기술적 과제는 컬러 채널별로 중요도가 다른 컬러 포맷의 경우에, 각 컬러 채널에 대해 서로 다른 연산 동작을 수행하여 전체 연산량을 줄일 수 있는 그래픽 프로세싱 유닛을 제공하는 것이다.
본 발명이 해결하고자 하는 다른 기술적 과제는 컬러 채널별로 중요도가 다른 컬러 포맷의 경우에, 각 컬러 채널에 대해 서로 다른 연산 동작을 수행하여 전체 연산량을 줄일 수 있는 그래픽 프로세싱 유닛을 포함하는 그래픽 프로세싱 시스템을 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는 상기 그래픽 프로세싱 유닛을 이용하여 처리 성능이 개선된 안티 에일리어싱 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 과제를 달성하기 위한 본 발명의 일 실시예에 따른 그래픽 프로세싱 유닛은, 버텍스(vertex)를 입력받고, 상기 버텍스를 이용하여 프리미티브(primitive)를 생성하는 지오메트리(geometry) 프로세싱 유닛, 및 상기 생성된 프리미티브를 프래그먼트(fragment)로 변환하고, 상기 변환된 프래그먼트에 대해 프래그먼트 쉐이딩(fragment shading)을 수행하고, 상기 프래그먼트 쉐이딩이 수행된 상기 프래그먼트에 대해 안티 에일리어싱(antialiasing)을 수행하는 렌더링(rendering) 프로세싱 유닛을 포함하되, 상기 렌더링 프로세싱 유닛이 상기 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터와 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행한다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, 상기 안티 에일리어싱을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용할 수 있다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, SSAA(Supersampling Antialiasing) 방식, MSAA(Multisampling Antialiasing) 방식, 또는 MLAA(Morphological Antialiasing) 방식을 이용할 수 있다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, 상기 제1 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하고, 상기 제2 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하지 않을 수 있다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, 상기 프래그먼트 쉐이딩을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행할 수 있다.
본 발명의 몇몇 실시예에서, 상기 지오메트리 프로세싱 유닛은, 상기 버텍스를 입력받고, 상기 입력받은 버텍스를 변환하여 출력하는 버텍스 프로세싱 유닛과, 상기 변환되어 출력된 버텍스로부터 상기 프리미티브와, 상기 프리미티브에 대응하도록 정의된 텍스쳐 패치 정보(texture patch information)를 생성하는 프리미티브 어셈블리 유닛을 포함할 수 있다.
본 발명의 몇몇 실시예에서, 상기 프리미티브는 삼각형(triangle) 타입일 수 있다.
본 발명의 몇몇 실시예에서, 상기 지오메트리 프로세싱 유닛은, 이미지 프레임을 복수의 타일(tile)로 분할하고, 상기 분할된 각 타일에 속한 프리미티브에 대한 프리미티브 리스트를 생성하는 타일링(tiling) 유닛을 더 포함할 수 있다.
본 발명의 몇몇 실시예에서, 상기 프리미티브 리스트는, 상기 분할된 각 타일에 속한 프리미티브에 대한 위치 정보 및 속성 정보를 포함할 수 있다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, 상기 생성된 프리미티브에 대해 래스터화(rasterization)를 수행하여 상기 생성된 프리미티브를 프래그먼트로 변환하는 래스터라이저와, 상기 프래그먼트에 대해 상기 안티 에일리어싱을 수행하는 프래그먼트 프로세싱 유닛을 포함할 수 있다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, 상기 생성된 프리미티브에 대해 가시성(visibility) 테스트를 수행하여 비가시적인(invisible) 상기 프리미티브를 폐기(discard)하는 깊이 테스터(depth tester)를 더 포함하고, 상기 래스터라이저는 상기 깊이 테스터의 출력에 대해 래스터화를 수행할 수 있다.
상기 과제를 달성하기 위한 본 발명의 다른 실시예에 따른 그래픽 프로세싱 유닛은, 버텍스(vertex)를 입력받고, 상기 버텍스를 이용하여 프리미티브(primitive)를 생성하는 프리미티브 어셈블리 유닛, 이미지 프레임을 복수의 타일로 분할하고, 상기 분할된 각 타일에 속한 상기 프리미티브에 대응하는 텍스쳐 패치 정보(texture patch information)를 생성하는 타일링 유닛, 및 상기 프리미티브에 포함된 각 프래그먼트(fragment)에 대해, 상기 생성된 텍스쳐 패치 정보를 이용하여 프래그먼트 쉐이딩을 수행하는 렌더링 프로세싱 유닛을 포함하되, 상기 렌더링 프로세싱 유닛이 상기 프래그먼트 쉐이딩을 수행하는 경우에, 제1 컬러 데이터와 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행한다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, 상기 프래그먼트 쉐이딩을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용할 수 있다.
본 발명의 몇몇 실시예에서, 상기 렌더링 프로세싱 유닛은, 상기 제1 컬러 데이터에 대해 상기 프래그먼트 쉐이딩을 수행하고, 상기 제2 컬러 데이터에 대해 상기 프래그먼트 쉐이딩을 수행하지 않을 수 있다.
상기 과제를 달성하기 위한 본 발명의 일 실시예에 따른 그래픽 프로세싱 시스템은, 제1 컬러 데이터 및 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 안티 에일리어싱을 수행하는 그래픽 프로세싱 유닛, 및 상기 그래픽 프로세싱 유닛이 상기 안티 에일리어싱을 수행하는데 이용하는 외부 메모리를 포함하되, 상기 외부 메모리에는 상기 그래픽 프로세싱 유닛이 상기 안티 에일리어싱을 수행한 결과 데이터가 저장되고, 상기 그래픽 프로세싱 유닛이 상기 안티 에일리어싱을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행한다.
본 발명의 몇몇 실시예에서, 상기 그래픽 프로세싱 유닛은, 상기 안티 에일리어싱을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용할 수 있다.
본 발명의 몇몇 실시예에서, 상기 그래픽 프로세싱 유닛은, SSAA(Supersampling Antialiasing) 방식, MSAA(Multisampling Antialiasing) 방식, 또는 MLAA(Morphological Antialiasing) 방식을 이용하여 상기 안티 에일리어싱을 수행할 수 있다.
본 발명의 몇몇 실시예에서, 상기 그래픽 프로세싱 유닛은, 상기 제1 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하고, 상기 제2 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하지 않을 수 있다.
본 발명의 몇몇 실시예에서, 상기 그래픽 프로세싱 유닛은, 버텍스를 이용하여 프리미티브를 생성하고, 상기 프리미티브를 프래그먼트로 변환하고, 상기 변환된 프래그먼트에 대해 프래그먼트 쉐이딩을 수행할 수 있다.
본 발명의 몇몇 실시예에서, 상기 그래픽 프로세싱 유닛은, 상기 프래그먼트 쉐이딩을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행할 수 있다.
본 발명의 몇몇 실시예에서, 상기 그래픽 프로세싱 유닛은, 상기 제1 컬러 데이터에 대해 상기 프래그먼트 쉐이딩을 수행하고, 상기 제2 컬러 데이터에 대해 상기 프래그먼트 쉐이딩을 수행하지 않을 수 있다.
본 발명의 몇몇 실시예에서, 상기 외부 메모리에 저장된 상기 결과 데이터를 디스플레이하는 디스플레이 유닛을 더 포함할 수 있다.
상기 과제를 달성하기 위한 본 발명의 일 실시예에 따른 안티 에일리어싱 방법은, 버텍스(vertex)를 입력받고, 상기 버텍스를 이용하여 프리미티브(primitive)와, 상기 프리미티브에 대응되는 텍스쳐 패치(texture patch)를 정의하고, 상기 생성된 프리미티브에 대해 래스터화를 수행하여 상기 프리미티브를 프래그먼트(fragment)로 변환하고, 상기 정의된 텍스쳐 패치를 이용하여 상기 프래그먼트에 대해 프래그먼트 쉐이딩(fragment shading)을 수행하고, 상기 프래그먼트 쉐이딩이 수행된 상기 프래그먼트에 대해 안티 에일리어싱(antialiasing)을 수행하는 것을 포함하되, 상기 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터와 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행한다.
본 발명의 몇몇 실시예에서, 상기 안티 에일리어싱을 수행하는 것은, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용할 수 있다.
본 발명의 몇몇 실시예에서, 상기 안티 에일리어싱을 수행하는 것은, SSAA(Supersampling Antialiasing) 방식, MSAA(Multisampling Antialiasing) 방식, 또는 MLAA(Morphological Antialiasing) 방식을 이용할 수 있다.
본 발명의 몇몇 실시예에서, 상기 안티 에일리어싱을 수행하는 것은, 상기 제1 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하고, 상기 제2 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하지 않을 수 있다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
도 1은 본 발명의 일 실시예에 따른 그래픽 프로세싱 시스템을 설명하기 위한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 3 및 도 4는 도 2의 프리미티브 어셈블리 유닛의 동작을 설명하기 위한 도면들이다.
도 5는 도 2의 타일링 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 6은 도 5의 타일링 유닛의 동작을 설명하기 위한 블록도이다.
도 7은 도 5의 프리미티브 리스트 생성부가 생성하는 예시적인 프리미티브 리스트를 도시한 도면이다.
도 8은 도 2의 래스터라이저의 세부 구성을 설명하기 위한 블록도이다.
도 9는 본 발명의 다른 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 10 및 도 11은 도 9의 깊이 테스터의 동작을 설명하기 위한 도면들이다.
도 12는 본 발명의 또 다른 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 13은 본 발명의 일 실시예에 따른 안티 에일리어싱 방법을 순차적으로 나타낸 흐름도이다.
도 14는 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛을 포함하는 무선 통신 디바이스를 도시한 블록도이다.
도 15는 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛을 포함하는 컴퓨팅 시스템을 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 3 및 도 4는 도 2의 프리미티브 어셈블리 유닛의 동작을 설명하기 위한 도면들이다.
도 5는 도 2의 타일링 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 6은 도 5의 타일링 유닛의 동작을 설명하기 위한 블록도이다.
도 7은 도 5의 프리미티브 리스트 생성부가 생성하는 예시적인 프리미티브 리스트를 도시한 도면이다.
도 8은 도 2의 래스터라이저의 세부 구성을 설명하기 위한 블록도이다.
도 9는 본 발명의 다른 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 10 및 도 11은 도 9의 깊이 테스터의 동작을 설명하기 위한 도면들이다.
도 12는 본 발명의 또 다른 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 13은 본 발명의 일 실시예에 따른 안티 에일리어싱 방법을 순차적으로 나타낸 흐름도이다.
도 14는 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛을 포함하는 무선 통신 디바이스를 도시한 블록도이다.
도 15는 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛을 포함하는 컴퓨팅 시스템을 도시한 블록도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
하나의 구성 요소가 다른 구성 요소와 "연결된(connected to)" 또는 "커플링된(coupled to)" 이라고 지칭되는 것은, 다른 구성 요소와 직접 연결 또는 커플링된 경우 또는 중간에 다른 구성 요소를 개재한 경우를 모두 포함한다. 반면, 하나의 구성 요소가 다른 구성 요소와 "직접 연결된(directly connected to)" 또는 "직접 커플링된(directly coupled to)"으로 지칭되는 것은 중간에 다른 구성 요소를 개재하지 않은 것을 나타낸다. "및/또는"은 언급된 아이템들의 각각 및 하나 이상의 모든 조합을 포함한다.
구성 요소가 다른 구성 요소의 "위(on)" 또는 "상(on)"으로 지칭되는 것은 다른 구성 요소의 바로 위뿐만 아니라 중간에 다른 구성 요소를 개재한 경우를 모두 포함한다. 반면, 구성 요소가 다른 구성 요소의 "직접 위(directly on)" 또는 "바로 위"로 지칭되는 것은 중간에 다른 구성 요소를 개재하지 않은 것을 나타낸다.
공간적으로 상대적인 용어인 "아래(below)", "아래(beneath)", "하부(lower)", "위(above)", "상부(upper)" 등은 도면에 도시되어 있는 바와 같이 하나의 구성 요소들과 다른 구성 요소들과의 상관관계를 용이하게 기술하기 위해 사용될 수 있다. 공간적으로 상대적인 용어는 도면에 도시되어 있는 방향에 더하여 사용시 또는 동작시 소자의 서로 다른 방향을 포함하는 용어로 이해되어야 한다. 예를 들면, 도면에 도시되어 있는 소자를 뒤집을 경우, 다른 소자의 "아래(below)" 또는 "아래(beneath)"로 기술된 구성 요소는 다른 구성 요소의 "위(above)"에 놓여질 수 있다. 따라서, 예시적인 용어인 "아래"는 아래와 위의 방향을 모두 포함할 수 있다. 구성 요소는 다른 방향으로도 배향될 수 있고, 이에 따라 공간적으로 상대적인 용어들은 배향에 따라 해석될 수 있다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
비록 제1, 제2 등이 다양한 구성 요소들을 서술하기 위해서 사용되나, 이들 구성 요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성 요소를 다른 구성 요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성 요소는 본 발명의 기술적 사상 내에서 제2 구성 요소 일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
도 1은 본 발명의 일 실시예에 따른 그래픽 프로세싱 시스템을 설명하기 위한 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 그래픽 프로세싱 시스템은 그래픽 프로세싱 유닛(GPU; Graphic Processing Unit, 100)과 외부 메모리(external memory, 200)를 포함한다.
그래픽 프로세싱 유닛(100)은 버텍스(vertex)를 입력받고, 입력받은 버텍스를 이용하여 프리미티브(primitive)를 생성하고, 생성된 프리미티브를 프래그먼트(fragment)로 변환하고, 변환된 프래그먼트에 대해 프래그먼트 쉐이딩(fragment shading)을 수행하도록 동작할 수 있다. 이에 관한 자세한 내용은 후술하기로 한다.
그래픽 프로세싱 유닛(100)은 렌더링(rendering)을 수행하도록 동작할 수 있다. 구체적으로, 본 실시예에 따른 그래픽 프로세싱 유닛(100)은 타일 기반 렌더링(tile-based rendering)을 수행하도록 동작할 수 있다. 이를 위해, 그래픽 프로세싱 유닛(100)은 그래픽스 파이프라인(graphics pipeline) 구성들을 포함할 수 있다.
이러한 그래픽스 파이프라인은 렌더링 파이프라인(rendering pipeline)으로 지칭될 수도 있다. 이러한 그래픽스 파이프라인 구성들은 입력되는 그래픽 데이터들을 병렬 처리할 수 있다. 그리고 이러한 그래픽스 파이프라인 구성들은 소프트웨어(software) 또는 하드웨어(hardware)로 구성될 수 있다.
그래픽 프로세싱 유닛(100)은 렌더링 수행 시에, 안티 에일리어싱(antialiasing)을 수행하도록 동작할 수 있다. 구체적으로, 본 실시예에 따른 그래픽 프로세싱 유닛(100)이 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터(CD_1)와 제2 컬러 데이터(CD_2)에 대해 서로 다른 연산 동작을 수행할 수 있다.
예를 들어, 컬러 채널을 통해 입력받은 컬러 데이터의 컬러 포맷이 YCbCr인 경우에, 루마 성분과 크로마 성분에 대해 서로 다른 연산 동작을 수행할 수 있다. 제1 컬러 데이터(CD_1)에 루마 성분에 대한 정보가 포함되고, 제2 컬러 데이터(CD_2)에 크로마 성분에 대한 정보가 포함된다면, 제1 컬러 데이터(CD_1)와 제2 컬러 데이터(CD_2)에 대해 서로 다른 연산 동작으로 안티 에일리어싱을 수행할 수 있다.
인체의 눈은 크로마 성분 보다는 루마 성분에 더욱 민감하게 반응하기 때문에, 제2 컬러 데이터(CD_2)에 비하여 제1 컬러 데이터(CD_1)의 중요도가 높다고 할 수 있다. 따라서, 그래픽 프로세싱 유닛(100)은 제1 컬러 데이터(CD_1)와 제2 컬러 데이터(CD_2)에 대해 다른 방식으로 안티 에일리어싱을 수행할 수 있다. 예를 들어, 그래픽 프로세싱 유닛(100)은, 제1 컬러 데이터(CD_1)와 제2 컬러 데이터(CD_2)에 대해 서로 다른 샘플링 데이터 수를 이용하여 안티 에일리어싱을 수행할 수 있다.
그래픽 프로세싱 유닛(100)이 MSAA(Multisampling Antialiasing) 방식을 이용하여 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터(CD_1)에 대해 8xMSAA를 적용하여 안티 에일리어싱을 수행하고, 제2 컬러 데이터(CD_2)에 대해 4xMSAA, 2xMSAA, 또는 한 개의 샘플만 이용하는 방식을 적용하여 안티 에일리어싱을 수행할 수 있다.
이러한 경우에, 그래픽 프로세싱 유닛(100)은 전체 연산량을 줄일 수 있으며, 그래픽 프로세싱 유닛(100)의 동작 속도를 향상시킬 수 있다.
그래픽 프로세싱 유닛(100)이 SSAA(Supersampling Antialiasing) 방식 또는 MLAA(Morphological Antialiasing) 방식을 이용하여 안티 에일리어싱을 수행하는 경우에도, 위에서와 마찬가지로, 제1 컬러 데이터(CD_1)와 제2 컬러 데이터(CD_2)에 대해 서로 다른 샘플링 데이터 수를 이용하여 안티 에일리어싱을 수행할 수 있다.
즉, 그래픽 프로세싱 유닛(100)은 중요도가 다른 컬러 데이터를 갖는 컬러 포맷(예를 들어, YC, YCbCr, YPbPr 등)에 대해 안티 에일리어싱을 수행하는 경우에, 서로 다른 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용하여 안티 에일리어싱을 수행할 수 있다.
또한, 그래픽 프로세싱 유닛(100)은 제1 컬러 데이터(CD_1)에 대해 안티 에일리어싱을 수행하고, 제2 컬러 데이터(CD_2)에 대해서는 안티 에일리어싱을 수행하지 않도록 동작할 수 있다. 즉, 그래픽 프로세싱 유닛(100)은 중요도가 다른 컬러 데이터를 갖는 컬러 포맷(예를 들어, YC, YCbCr, YPbPr 등)에 대해 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터(CD_1)에 대해 안티 에일리어싱을 수행하고, 제2 컬러 데이터(CD_2)에 대해서는 안티 에일리어싱을 수행하지 않도록 동작할 수 있다. 여기에서, 제1 컬러 데이터(CD_1)는 루마 성분에 대한 정보를 포함하고, 제2 컬러 데이터(CD_2)는 크로마 성분에 대한 정보를 포함할 수 있다.
외부 메모리(200)는 그래픽 프로세싱 유닛(100)이 렌더링을 수행하는데 이용될 수 있다. 또한, 외부 메모리(200)는 그래픽 프로세싱 유닛(100)이 안티 에일리어싱을 수행하는데 이용될 수 있다. 이러한 외부 메모리(200)는 데이터를 저장하도록 구성될 수 있다. 구체적으로, 외부 메모리(200)는 그래픽 프로세싱 유닛(100)에 의해 처리되는 그래픽 데이터를 저장하거나, 그래픽 프로세싱 유닛(100)에 제공되는 그래픽 데이터를 저장하는데 이용될 수 있다. 외부 메모리(200)에는 그래픽 프로세싱 유닛(100)이 안티 에일리어싱을 수행한 그래픽 데이터가 저장될 수 있다.
한편, 외부 메모리(200)는 그래픽 프로세싱 유닛(100)의 동작 메모리로서 역할을 수행할 수 있다. 외부 메모리(200)는 DDR SDRAM(Double Data Rate Static DRAM), SDR SDRAM(Single Data Rate SDRAM)과 같은 하나 이상의 휘발성 메모리 장치 및/또는 EEPROM(Electrical Erasable Programmable ROM), 플래시 메모리(flash memory)와 같은 하나 이상의 비휘발성 메모리 장치를 포함하도록 구성될 수 있으나, 본 발명이 이에 제한되는 것은 아니다.
도 2는 본 발명의 일 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 2를 참조하면, 그래픽 프로세싱 유닛(100)은 지오메트리 프로세싱 유닛(Geometry Processing Unit, 110)과, 렌더링 프로세싱 유닛(Rendering Processing Unit, 120)을 포함할 수 있다. 본 발명의 몇몇 실시예에서, 지오메트리 프로세싱 유닛(110)과, 렌더링 프로세싱 유닛(120)은 서로 다른 프로세서(processor)를 이용하여 동작할 수 있다. 하지만, 본 발명이 이에 제한되는 것은 아니며, 지오메트리 프로세싱 유닛(110)과, 렌더링 프로세싱 유닛(120)은 하나의 프로세서를 이용하여 동작할 수도 있다.
지오메트리 프로세싱 유닛(110)은 버텍스 프로세싱 유닛(Vertex Processing Unit, 112), 프리미티브 어셈블리 유닛(Primitive Assembly Unit, 114), 및 타일링 유닛(Tiling Uint, 116)을 포함할 수 있다.
버텍스 프로세싱 유닛(110)은 버텍스(vertex)를 입력받고, 입력받은 버텍스를 변환하여 출력할 수 있다. 여기에서, 버텍스는 예를 들어, 센트럴 프로세싱 유닛(CPU)으로부터 제공될 수 있으나, 본 발명이 이에 제한되는 것은 아니다. 버텍스는 예를 들어, 위치(position), 법선 벡터(normal vector), 컬러 값, 텍스처(texture) 좌표 등의 속성들(properties)을 포함할 수 있으나, 본 발명이 이에 제한되는 것은 아니다.
버텍스의 위치 속성은 3차원 스페이스의 좌표로 제공될 수 있다. 예를 들어, 버텍스의 위치 속성은 x 좌표, y 좌표, z 좌표들을 포함할 수 있다. 여기서, x 좌표는 수평 좌표이고, y 좌표는 수직 좌표이고, z 좌표는 깊이 좌표일 수 있다. 버텍스 프로세싱 유닛(110)은 오브젝트 스페이스(object space)의 버텍스를 클립 스페이스(clip space)의 버텍스로 변환할 수 있다.
구체적으로, 버텍스 프로세싱 유닛(110)은 오브젝트 스페이스의 버텍스를 월드 스페이스(world space)의 버텍스로 변환하고, 월드 스페이스의 버텍스를 카메라 스페이스(camera space)의 버텍스로 변환하고, 카메라 스페이스의 버텍스를 클립 스페이스의 버텍스로 변환할 수 있다.
프리미티브 어셈블리 유닛(120)은 클립 스페이스의 버텍스를 입력받고, 프리미티브(primitive)를 생성하여 출력할 수 있다. 프리미티브 어셈블리 유닛(120)은 적어도 하나의 버텍스들로 구성되는 프리미티브를 생성할 수 있다. 예를 들어, 프리미티브 어셈블리 유닛(120)은 3개의 버텍스들로 구성되는 삼각형(triangle) 타입의 프리미티브를 생성할 수 있다. 이하에서는, 본 발명의 실시예들을 설명하면서, 삼각형 타입의 프리미티브를 이용하여 설명하기로 한다. 그러나, 본 발명이 이에 제한되는 것은 아니며, 다른 타입의 프리미티브들, 예를 들어, 점(points), 선(lines), 사각형(quads) 타입들에도 이하에서 설명하는 기술적 사상은 실질적으로 동일하게 적용될 수 있다.
프리미티브는 연결 정보의 속성을 포함할 수 있다. 연결 정보는 프리미티브를 구성하는 버텍스들이 연결되는 순서(예를 들어, 시계 방향 또는 반시계 방향)를 나타낼 수 있다. 연결 정보의 값에 따라, 프리미티브의 앞면(front face)과 뒷면(back face)이 구별될 수 있다.
한편, 본 실시예에서, 프리미티브 어셈블리 유닛(120)이 프리미티브를 생성할 때, 생성된 프리미티브에 대응하는 택스쳐 패치(texture patch)가 정의될 수 있다. 또한, 생성된 프리미티브에 대응하는 택스쳐 패치가 정의될 때, 텍스쳐 패치 정보(texture patch information)가 같이 생성될 수 있다. 이하, 도 3 및 도 4를 참조하여, 이러한 프리미티브 어셈블리 유닛(114)의 동작에 대해 보다 구체적으로 설명하도록 한다.
도 3 및 도 4는 도 2의 프리미티브 어셈블리 유닛의 동작을 설명하기 위한 도면들이다.
먼저, 도 3을 참조하면, 프리미티브 어셈블리 유닛(114)이 제공받은 버텍스로부터 제1 내지 제3 프리미티브(Pa~Pc)를 생성할 때, 제1 내지 제3 프리미티브(Pa~Pc)에 각각 대응되는 제1 내지 제3 텍스쳐 패치(TPa~TPc)가 정의될 수 있다. 여기서, 제1 텍스쳐 패치(TPa)는, 예를 들어, 외부 메모리(200)에 저장된 제1 텍스쳐(Ta) 내에서 제1 프리미티브(Pa)에 대응되는 텍스쳐 풋프린트(texture footprint)일 수 있다. 그리고, 제2 텍스쳐 패치(TPb)는 예를 들어, 외부 메모리(200)에 저장된 제1 텍스쳐(Ta) 내에서 제2 프리미티브(Pb)에 대응되는 텍스쳐 풋프린트일 수 있다. 마지막으로, 제3 텍스쳐 패치(TPc)는 예를 들어, 외부 메모리(200)에 저장된 제1 텍스쳐(Ta) 내에서 제3 프리미티브(Pc)에 대응되는 텍스쳐 풋프린트일 수 있다. 즉, 제1 텍스쳐(Ta)로부터 제1 내지 제3 프리미티브(Pa~Pc) 각각에 대응하는 제1 내지 제3 텍스쳐 패치(TPa~TPc)가 정의될 수 있다.
한편, 본 발명의 몇몇 실시예에서, 외부 메모리(200)에는 복수의 텍스쳐(예를 들어, 제1 내지 제3 텍스쳐(Ta~Tc))가 저장될 수 있다. 이 때, 각 텍스쳐 패치(TPa~TPc)는 도시된 것과 같이 복수의 텍스쳐(Ta~Tc) 각각에 대응될 수 있다. 구체적으로, 제1 텍스쳐 패치(TPa)는 제1 내지 제3 텍스쳐(Ta~Tc) 내에서 제1 프리미티브(Pa)에 대응되는 텍스쳐 풋프린트일 수 있고, 제2 텍스쳐 패치(TPb)는 제1 내지 제3 텍스쳐(Ta~Tc) 내에서 제2 프리미티브(Pb)에 대응되는 텍스쳐 풋프린트일 수 있으며, 제3 텍스쳐 패치(TPc)는 제1 내지 제3 텍스쳐(Ta~Tc) 내에서 제3 프리미티브(Pc)에 대응되는 텍스쳐 풋프린트일 수 있다. 즉, 하나의 텍스처 패치(TPa~TPc)에 대응되는 텍스쳐(Ta~Tc)의 수는 얼마든지 증가될 수 있다.
다음, 도 4를 참조하면, 이와 같이 각 프리미티브(Pa~Pc)에 대응되는 텍스처 패치(TPa~TPc)가 정의될 때, 프리미티브 어셈블리 유닛(114)은 텍스쳐 패치 정보(TPa~TPc)를 같이 생성할 수 있다. 본 발명의 몇몇 실시예에서, 이러한 텍스쳐 패치 정보(TPa~TPc)는 텍스쳐(Ta~Tc) 내에서 텍스쳐 패치(TPa~TPc)가 정의된 영역을 지시하는 텍스쳐 패치 디스크립터(Texture Patch Descriptor)를 포함할 수 있다.
구체적으로, 제1 텍스쳐 패치 디스크립터(TPa Descriptor)는 각 텍스쳐(Ta~Tc) 내에서 제1 텍스쳐 패치(TPa)가 정의된 영역을 지시할 수 있고, 제2 텍스쳐 패치 디스크립터(TPb Descriptor)는 각 텍스쳐(Ta~Tc) 내에서 제2 텍스쳐 패치(TPb)가 정의된 영역을 지시할 수 있으며, 제3 텍스쳐 패치 디스크립터(TPc Descriptor)는 각 텍스쳐(Ta~Tc) 내에서 제3 텍스쳐 패치(TPc)가 정의된 영역을 지시할 수 있다.
이러한 텍스쳐 패치 디스크립터(TPa~TPc Descriptor)는 각 텍스쳐(Ta~Tc) 내에서 대응되는 텍스쳐 패치(TPa~TPc)를 지시하기 위한 예를 들어, 시작 주소 값, 바이트 수, 옵셋 값 등을 포함할 수 있으나, 본 발명이 이에 제한되는 것은 아니다. 본 발명의 몇몇 실시예에서, 이렇게 생성된 텍스쳐 패치 디스크립터(TPa~TPc Descriptor)는 예를 들어, 외부 메모리(200)에 저장될 수 있다.
한편, 이상에서는 각 프리미티브(Pa~Pc)에 대응되는 텍스처 패치(TPa~TPc)가 정의될 때, 프리미티브 어셈블리 유닛(114)이 텍스쳐 패치 정보(TPa~TPc)(예를 들어, 텍스쳐 패치 디스크립터(TPa~TPc Descriptor))를 같이 생성하고 이를 외부 메모리(200)에 저장하는 것을 예시하였으나, 본 발명이 이에 제한되는 것은 아니다. 필요에 따라, 텍스쳐 패치 정보(TPa~TPc)가 생성되는 시점은 이보다 앞당겨질 수도 있고, 이보다 지연될 수도 있다.
다시 도 2를 참조하면, 타일링 유닛(116)은 프리미티브를 입력받고, 프리미티브 리스트(primitive list)를 생성하여 출력할 수 있다. 이하, 도 5 내지 도 7을 참조하여, 본 실시예에 따른 타일링 유닛(116)에 대해 보다 구체적으로 설명하도록 한다.
도 5는 도 2의 타일링 유닛의 세부 구성을 설명하기 위한 블록도이다. 도 6은 도 5의 타일링 유닛의 동작을 설명하기 위한 블록도이다. 도 7은 도 5의 프리미티브 리스트 생성부가 생성하는 예시적인 프리미티브 리스트를 도시한 도면이다.
먼저, 도 5를 참조하면, 타일링 유닛(116)은 바운딩 박스 계산기(Bounding Box Calculator, 116a) 및 프리미티브 리스트 생성기(Primitive List Generator, 116b)를 포함할 수 있다.
타일링 유닛(116)은 렌더링될 이미지 프레임을 복수의 타일(tile)로 분할할 수 있다. 각각의 타일은 이미지 프레임에 포함된 복수의 픽셀(pixel) 또는 프래그먼트(fragment)들로 구성될 수 있다. 또한, 타일링 유닛(116)은 각각의 타일을 그 보다 작은 복수의 서브 타일(sub-tile)로 분할할 수도 있다.
타일링 유닛(116)은 입력받은 프리미티브를 타일 비닝(tile binning)하여, 프리미티브가 어느 타일들을 터치하는지 대략적으로(approximatively) 판단할 수 있다. 프리미티브가 타일을 터치한다는 것은, 프리미티브의 적어도 일부 영역이 해당 타일의 내부에 속하는(belong) 것을 의미할 수 있다. 그리고, 타일링 유닛(116)은 타일을 터치하는 프리미티브를 예를 들어, 도 7에 도시된 것과 같은 해당 타일 별 프리미티브 리스트에 할당할 수 있다. 그래픽스 파이프라인은 각각의 타일에 대해서 렌더링(rendering)을 수행함으로써, 이미지 프레임 전체에 대한 렌더링을 완료할 수 있다.
이를 위해, 바운딩 박스 계산기(116a)는 프리미티브의 경계를 이루는 바운딩 박스(bounding box)를 계산할 수 있다. 예를 들어, 삼각형 타입의 프리미티브의 경우, 바운딩 박스 계산기(116a)는 프리미티브를 구성하는 3개의 버텍스들의 x 좌표와 y 좌표의 최대 값과 최소 값을 이용하여, 바운딩 박스를 계산해낼 수 있다. 한편, 본 발명의 몇몇 실시예에서, 바운딩 박스는 3차원으로 계산될 수도 있다. 이 때, 바운딩 박스 계산기(116a)는 프리미티브의 x 좌표, y 좌표, z 좌표를 이용하여 3차원 바운딩 박스를 계산할 수 있다.
예를 들어, 삼각형 타입의 프리미티브의 경우, 바운딩 박스 계산기(116a)는 프리미티브를 구성하는 3 개의 버텍스들의 x 좌표, y 좌표, z 좌표들의 최대 값과 최소 값을 이용하여, 3차원 바운딩 박스를 계산해낼 수도 있다.
바운딩 박스는 프리미티브의 경계(boundary)를 완전하게 둘러싸는 형태로 계산될 수 있다. 예를 들어, 도 6에 도시된 제1 프리미티브(Pa)에서, 바운딩 박스(Ba)는 프리미티브를 구성하는 3 개의 버텍스들의 x 좌표 최대 값 및 최소 값과, y 좌표 최대 값 및 최소 값에 의해 정의될 수 있다. 이렇게 제1 바운딩 박스(Ba)를 정의하는 x 좌표와 y 좌표들의 최대 값과 최소 값은 제1 프리미티브(Pa)를 타일 비닝하는데 이용될 수 있다.
예를 들어, 도 6의 4x4 타일에서, 타일링 유닛(116)은 제1 바운딩 박스(Ba)의 x 좌표와 y 좌표들을 이용하여 제1 프리미티브(Pa)를 타일 비닝할 수 있다. 도 6은 2차원 스크린에 투영된 프리미티브와 바운딩 박스를 도시한 것이다. 본 발명의 실시예에서는 설명의 편의를 위하여, 2차원 스크린을 4x4 타일로 분할하였으나, 본 발명이 이에 제한되는 것은 아니다.
타일링 유닛(116)은 제1 바운딩 박스(Ba)의 x 좌표와 y 좌표들의 최대 값(xa_max, ya_max)과 최소 값(xa_min, ya_min)을 이용하여, 제1 프리미티브(Pa)가 복수의 타일, 예를 들어 제n 타일(Tn)을 터치하는 것으로 판단하고, 제n 타일(Tn)의 프리미티브 리스트에 제1 프리미티브(Pa)를 할당할 수 있다. 이어서, 동일한 방법으로, 타일링 유닛(116)은 제2 프리미티브(Pb)와 제3 프리미티브(Pc)가 제n 타일(Tn)을 터치하는 것으로 판단할 수 있다. 그리고, 타일링 유닛(116)은 제n 타일(Tn)의 프리미티브 리스트에 제2 프리미티브(Pb) 및 제3 프리미티브(Pc)를 할당할 수 있다.
프리미티브 리스트 생성기(116b)는 타일별 프리미티브 리스트를 생성하여 외부 메모리(200)에 출력할 수 있다. 이렇게 출력되어 외부 메모리(200)에 저장된 프리미티브 리스트는 후술할 래스터라이저(122) 및 텍스쳐 유닛(126) 등에 의해 사용될 수 있다. 이 때, 외부 메모리(200)에 출력되는 프리미티브 리스트는 도 7에 도시된 것과 같이, 분할된 각 타일에 속한 프리미티브에 대한 위치(Position) 정보, 속성(Attribute) 정보, 또는 텍스쳐 패치(Texture Patch) 디스크립터 정보를 포함할 수 있다.
본 발명의 몇몇 실시예에서, 프리미티브 리스트에 포함된 텍스쳐 패치(Texture Patch) 디스크립터 정보는 텍스쳐 패치 디스크립터를 지시하는 인덱스를 포함할 수 있다. 이렇게 프리미티브 리스트 생성기(116b)가 출력하는 프리미티브 리스트에 텍스쳐 패치 디스크립터를 지시하는 인덱스만 포함될 경우, 각 타일에 속하는 텍스쳐 패치를 식별할 수 있으면서 전체 프리미티브 리스트의 크기가 최소화될 수 있다. 즉, 프리미티브 리스트가 예를 들어, 외부 메모리(200)에 저장됨에 있어서, 외부 메모리(200)의 오버헤드가 감소될 수 있다.
한편, 타일링 유닛(116)이 서브 타일 단위로 이미지 프레임을 관리하는 경우, 타일링 유닛(116)은 서브 타일별 프리미티브 리스트를 생성하여 외부 메모리(200)에 출력할 수 있다. 이 때, 외부 메모리(200)에 출력되는 프리미티브 리스트는 분할된 각 서브 타일에 속한 프리미티브에 대한 위치(Position) 정보, 속성(Attribute) 정보, 또는 텍스쳐 패치(Texture Patch) 디스크립터 정보를 포함할 수 있다.
다시 도 2를 참조하면, 랜더링 프로세싱 유닛(120)은 래스터라이저(122), 프래그먼트 프로세싱 유닛(124), 및 텍스쳐 유닛(126)을 포함할 수 있다.
래스터라이저(122)는 각 프리미티브에 대해 래스터화(rasterization)를 수행하여 프리미티브를 프래그먼트(fragment)로 변환할 수 있다. 이하, 도 8을 참조하여, 래스터라이저(122)의 동작에 대해 보다 구체적으로 설명하도록 한다.
도 8은 도 2의 래스터라이저의 세부 구성을 설명하기 위한 블록도이다.
도 8을 참조하면, 래스터라이저(122)는 프리미티브 리스트 리더(Primitive List Reader, 122a), 보간 유닛(Interpolation Unit, 122b), 조기 깊이 테스터(Early Depth Tester, 122c)를 포함할 수 있다.
프리미티브 리스트 리더(122a)는 외부 메모리(200)로부터 타일별 프리미티브 리스트를 리드(read)할 수 있다. 구체적으로, 프리미티브 리스트 리더(122a)는 각 타일에 속하는 프리미티브들을 렌더링 순서에 따라 입력받을 수 있다.
보간 유닛(122b)은 프리미티브 리스트 리더(122a)를 통해 제공받은 프리미티브를 이용하여 프래그먼트(fragment)의 집합(set)을 생성할 수 있다. 프래그먼트는 프리미티브의 내부를 구성하는 3차원의 점(dot)들을 의미할 수 있다. 이러한 각각의 프래그먼트는 이미지 프레임의 각각의 픽셀에 대응될 수 있다. 즉, 프래그먼트의 x 좌표와 y 좌표는 2차원 스크린의 픽셀-그리드(pixel-grid)에 얼라인(align)될 수 있다.
보간 유닛(122b)은 프리미티브를 구성하는 버텍스들의 값을 보간하여 프래그먼트들의 위치, 법선 벡터, 컬러 값 등을 결정할 수 있다. 예를 들어, 프래그먼트들의 위치 속성은, 버텍스들의 위치 속성과 실질적으로 동일하게, x 좌표, y 좌표, z 좌표들을 포함할 수 있다. 이 중 z 좌표는 프래그먼트의 깊이 값을 나타낼 수 있다.
조기 깊이 테스터(122c)는 타일 별로 프래그먼트 레벨의 조기 깊이 테스트를 수행할 수 있다. 조기 깊이 테스트는 해당 타일의 내부에 속하는 프래그먼트들의 가시성(visibility)을 판단하여, 렌더링이 완료된 이미지 프레임에서 표시될 가시적 프래그먼트를 결정하고, 비가시적(invisible) 프래그먼트의 데이터를 폐기(discard)하는 것이다.
조기 깊이 테스터(122c)는 테스트의 결과에 따라, 해당 타일의 내부에 속하는 프래그먼트들의 최대 깊이 값과 최소 깊이 값을 결정할 수 있다. 조기 깊이 테스터(122c)는 타일의 깊이 값과 프래그먼트의 깊이 값을 비교하여 프래그먼트의 가시성을 판단할 수 있다. 래스터화 스테이지에서 타일의 최대 깊이 값 및 최소 깊이 값에는, 타일링 스테이지에서 타일의 최대 깊이 값 및 최소 깊이 값과 달리, 해당 타일의 내부에 속하는 프래그먼트들의 깊이 값 중 각각 최대 깊이 값 및 최소 깊이 값이 할당될 수 있다.
조기 깊이 테스터(122c)는 타일의 최대 깊이 값보다 프래그먼트의 깊이 값이 더 큰 경우, 해당 프래그먼트를 비가시적 프래그먼트로 판단할 수 있다. 한편, 조기 깊이 테스터(122c)는 타일의 최대 깊이 값보다 프래그먼트의 깊이 값이 더 작은 경우, 해당 프래그먼트를 가시적 프래그먼트로 판단할 수 있다. 타일의 최대 깊이 값을 갖는 프래그먼트가, 동일한 x 좌표와 y 좌표를 갖고 타일의 최대 깊이 값보다 작은 깊이 값을 갖는 프래그먼트로 대체되는 경우, 조기 깊이 테스터(122c)는 타일의 최대 깊이 값을 프래그먼트의 깊이 값으로 업데이트할 수 있다.
예를 들어, 도 6에 도시된 예에서, 조기 깊이 테스터(122c)는 제n 타일(Tn)에 대해서 제1 프리미티브(Pa)를 구성하는 프래그먼트들의 가시성을 판단하고, 제n 타일(Tn)의 내부에 속하면서 제1 프리미티브(Pa)를 구성하는 프래그먼트들의 깊이 값 중 최대 깊이 값과 최소 깊이 값을 제n 타일(Tn)의 최대 깊이 값과 최소 깊이 값으로 할당할 수 있다. 이어서, 조기 깊이 테스터(122c)는 제n 타일(Tn)에 대해서 제3 프리미티브(Pc)를 구성하는 프래그먼트들의 가시성을 판단할 수 있다. 제3 프리미티브(Pc)를 구성하는 프래그먼트들의 깊이 값은 제n 타일(Tn)의 최대 깊이 값보다 더 크므로, 조기 깊이 테스터(122c)는 제n 타일(Tn)에 대해서 제3 프리미티브(Pc)를 구성하는 모든 프래그먼트들을 비가시적 프래그먼트로 판단할 수 있다. 한편, 제n 타일(Tn)에 대해서 제3 프리미티브(Pc)를 구성하는 프래그먼트들에 대해서도 가시성을 이와 같이 판단하게 되면, 조기 깊이 테스터(122c)는 제n 타일(Tn)에 대해서 제3 프리미티브(Pc)를 구성하는 모든 프래그먼트들도 비가시적 프래그먼트로 판단할 수 있다. 결국, 래스터라이저(122)로부터 출력되는 프래그먼트들은 제1 프리미티브(Pa)에만 관련되게 된다.
다시 도 2를 참조하면, 프래그먼트 프로세싱 유닛(124)은 프래그먼트들을 입력받고, 입력받은 프래그먼트들에 대하여 은면 제거(hidden surface elimination), 조명(lighting), 표면 셰이딩(surface shading), 텍스쳐링(texturing) 등을 포함하는 프래그먼트 쉐이딩(fragment shading)을 수행할 수 있다. 이 때, 본 실시예에서, 프래그먼트 프로세싱 유닛(124)의 프래그먼트 쉐이딩에는 텍스쳐 유닛(126)이 이용될 수 있다.
프래그먼트 쉐이딩이란, 각각의 프래그먼트에 대해 컬러 값, 텍스쳐 등을 적용하는 것이다. 이 때, 프래그먼트 프로세싱 유닛(124)은, 중요도가 다른 컬러 값을 갖는 컬러 포맷(예를 들어, YC, YCbCr, YPbPr 등)에 대해 프래그먼트 쉐이딩을 수행하는 경우에, 제1 컬러 값(CV_1)에 대해 프래그먼트 쉐이딩을 수행하고, 제2 컬러 값(CV_2)에 대해서는 프래그먼트 쉐이딩을 수행하지 않도록 동작할 수 있다. 여기에서, 제1 컬러 값(CV_1)은 루마 성분을 포함하고, 제2 컬러 값(CV_2)은 크로마 성분을 포함할 수 있다.
또한, 프래그먼트 프로세싱 유닛(124)은 안티 에일리어싱을 수행할 수 있다. 안티 에일리어싱이란, 디지털 이미지의 경계선 주변의 색들은 혼합하여 경계선의 색 차이를 모호하게 만드는 것으로, 계단 현상을 제거하기 위한 것이다. 이 때, 프래그먼트 프로세싱 유닛(124)은, 중요도가 다른 컬러 값을 갖는 컬러 포맷(예를 들어, YC, YCbCr, YPbPr 등)에 대해 안티 에일리어싱을 수행하는 경우에, 서로 다른 컬러 값에 대해 서로 다른 샘플링 데이터 수를 이용하여 안티 에일리어싱을 수행할 수 있다.
예를 들어, 프래그먼트 프로세싱 유닛(124)이 MSAA(Multisampling Antialiasing) 방식을 이용하여 안티 에일리어싱을 수행하는 경우에, 제1 컬러 값(CV_1)에 대해 8xMSAA를 적용하여 안티 에일리어싱을 수행하고, 제2 컬러 값(CV_2)에 대해 4xMSAA, 2xMSAA, 또는 한 개의 샘플만 이용하는 방식을 적용하여 안티 에일리어싱을 수행할 수 있다. 또한, 제1 컬러 값(CV_1)에 대해 안티 에일리어싱을 수행하고, 제2 컬러 값(CV_2)에 대해서는 안티 에일리어싱을 수행하지 않도록 동작할 수 있다. 여기에서, 제1 컬러 값(CV_1)은 루마 성분을 포함하고, 제2 컬러 값(CV_2)은 크로마 성분을 포함할 수 있다.
이와 같은 과정을 통해 모든 프래그먼트들에 대한 프래그먼트 쉐이딩 및 안티 에일리어싱이 수행되면, 프래그먼트 프로세싱 유닛(124)은 랜더링을 완료한 이미지 프레임을 프레임 버퍼(frame buffer) 또는 디스플레이 장치(display)에 출력할 수 있다.
다음, 도 9를 참조하여, 본 발명의 다른 실시예에 따른 그래픽 프로세싱 유닛에 대해 설명하도록 한다. 이하에서는 앞서 설명한 실시예들과 동일한 구성 요소에 대한 설명은 생략하고, 차이점을 위주로 설명하도록 한다.
도 9는 본 발명의 다른 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 9를 참조하면, 그래픽 프로세싱 유닛(300)의 렌더링 프로세싱 유닛(320)은 프리미티브에 대해 가시성(visibility) 테스트를 수행하여 비가시적인(invisible) 프리미티브를 폐기(discard)하는 깊이 테스터(Depth Tester, 328)를 더 포함할 수 있다. 그리고, 래스터라이저(322)는 깊이 테스터(328)의 출력에 대해 래스터화를 수행할 수 있다. 이하 도 10 및 도 11을 참조하여, 깊이 테스터(328)의 동작에 대해 보다 구체적으로 설명하도록 한다.
도 10 및 도 11은 도 9의 깊이 테스터의 동작을 설명하기 위한 도면들이다.
앞서, 도 6의 예에서, 제n 타일(Tn)에는 제1 내지 제3 프리미티브(Pa, Pb, Pc)가 속하였다. 따라서, 깊이 테스터(328)는 외부 메모리(200)로부터 제n 타일(Tn)에 대해 제1 내지 제3 프리미티브(Pa, Pb, Pc)를 제공받고, 제1 내지 제3 프리미티브(Pa, Pb, Pc)에 대해 가시성 테스트를 수행하여 비가시적인(invisible) 프리미티브를 폐기하는 깊이 테스트를 수행할 수 있다.
예를 들어, 도 10을 참조하면, 제n 타일(Tn)에 대한 깊이 테스트에서, 제3 프리미티브(Pc), 제2 프리미티브(Pb), 제1 프리미티브(Pa)의 렌더링 순서(rendering order)로 프리미티브들이 입력된다고 가정하자. 이 경우, 깊이 테스터(328)는 먼저 최근접 프리미티브의 ID를 제3 프리미티브(Pc)의 ID로 할당할 수 있다. 이어서, 제n 타일(Tn)의 최소 깊이 값, 즉 제3 프리미티브(Pc)의 최소 깊이 값 zc_min보다 제2 프리미티브(Pb)의 최소 깊이 값 zb_min이 더 작으므로, 깊이 테스터(328)는 제2 프리미티브(Pb)를 새로운 최근접 프리미티브로 업데이트할 수 있다. 그리고, 제n 타일(Tn)의 최대 깊이 값, 즉 제2 프리미티브(Pb)의 최대 깊이 값 zb_max보다 제3 프리미티브(Pc)의 최소 깊이 값(zc_min)이 더 크므로, 깊이 테스터(328)는 제n 타일(Tn)의 영역에서 제3 프리미티브(Pc)가 제2 프리미티브(Pb)에 의해 가려지는 것으로 판단할 수 있다. 이어서, 제n 타일(Tn)의 최소 깊이 값, 즉 제2 프리미티브(Pb)의 최소 깊이 값 zb_min보다 제1 프리미티브(Pa)의 최소 깊이 값 za_min이 더 작으므로, 깊이 테스터(328)는 제1 프리미티브(Pa)를 다시 새로운 최근접 프리미티브로 업데이트할 수 있다. 그리고, 제n 타일(Tn)의 최대 깊이 값, 즉 제1 프리미티브(Pa)의 최대 깊이 값 za_max보다 제2 프리미티브의 최소 깊이 값(zb_min) 이 더 크므로, 깊이 테스터(328)는 제n 타일(Tn)의 영역에서 제2 프리미티브(Pb)가 제1 프리미티브(Pa)에 의해 가려지는 것으로 판단할 수 있다.
따라서, 도 11에 도시된 것과 같이, 제2 및 제3 프리미티브(Pb, Pc)는 제1 프리미티브(Pa)에 의해 가려져서 가시성이 없으므로, 제2 및 제3 프리미티브(Pb, Pc)는 폐기되게 되며, 제1 프리미티브(Pa)만이 레스터라이저(322)에 제공되게 된다.
이렇게, 제1 프리미티브(Pa)를 제공받은 래스터라이저(322)는 제1 프리미티브(Pa)에 대해서만 래스터화를 수행할 수 있다. 즉, 앞서 설명한 실시예에서는, 레스터라이저(322)가 제1 내지 제3 프리미티브(Pa, Pb, Pc) 모두에 대해 래스터화를 수행하였으나, 본 실시예에서는, 깊이 테스터(328)로부터 출력된 제1 프리미티브(Pa)에 대해서만 래스터화를 수행하게 된다. 그 밖에, 지오메트리 프로세싱 유닛(310)에 포함된 버텍스 프로세싱 유닛(312), 프리미티브 어셈블리 유닛(314), 타일링 유닛(316)과, 렌더링 프로세싱 유닛(320)에 포함된 프래그먼트 프로세싱 유닛(324), 텍스쳐 유닛(326)에 관한 설명은 앞서 설명한 실시예와 중복될 수 있는바 자세한 설명은 생략하도록 한다.
다음, 도 12를 참조하여, 본 발명의 또 다른 실시예에 따른 그래픽 프로세싱 유닛에 대해 설명하도록 한다. 이하에서도 앞서 설명한 실시예들과 동일한 구성 요소에 대한 설명은 생략하고, 차이점을 위주로 설명하도록 한다.
도 12는 본 발명의 또 다른 실시예에 따른 그래픽 프로세싱 유닛의 세부 구성을 설명하기 위한 블록도이다.
도 12를 참조하면, 본 실시예에 따른 그래픽 프로세싱 유닛(400)의 지오메트리 프로세싱 유닛(410)에서는 앞서 설명한 타일링 유닛(도 2의 116, 도 11의 316)이 생략될 수 있다. 즉, 본 실시예에 따른 그래픽 프로세싱 유닛(400)에서는 타일 기반 렌더링(tile-based rendering)이 수행되는 것이 아니라 프리미티브 기반 렌더링(primitive-based rendering)이 수행되는 것이 앞서 설명한 실시예들과의 차이점이다. 따라서, 본 실시예에서, 레스터라이저(422)는 프리미티브 어셈블리 유닛(414)에서 생성한 프리미티브 별로 레스터화를 수행하게된다.
그 밖에, 지오메트리 프로세싱 유닛(410)에 포함된 버텍스 프로세싱 유닛(412)과, 렌더링 프로세싱 유닛(420)에 포함된 프래그먼트 프로세싱 유닛(424), 텍스쳐 유닛(426)에 관한 설명은 앞서 설명한 실시예와 중복될 수 있는바 자세한 설명은 생략하도록 한다.
이하에서는 본 발명의 일 실시예에 따른 안티 에일리어싱 방법에 대해 설명하기로 한다. 앞서 설명한 내용과 중복되는 사항에 관하여는, 상세한 설명은 생략하기로 한다.
도 13은 본 발명의 일 실시예에 따른 안티 에일리어싱 방법을 순차적으로 나타낸 흐름도이다.
도 13을 참조하면, 우선, 예를 들어, 센트럴 프로세싱 유닛(CPU) 등으로부터 버텍스를 입력받고, 입력받은 버텍스를 변환하여 출력한다(S100).
이어서, 각각 적어도 하나의 버텍스들로 구성되는 복수의 프리미티브를 생성한다(S110). 이 때, 생성된 프리미티브에 대응하는 택스쳐 패치(texture patch)가 정의될 수 있다. 또한, 생성된 프리미티브에 대응하는 택스쳐 패치가 정의될 때, 텍스쳐 패치 정보(texture patch information)가 같이 생성될 수 있다.
이어서, 복수의 프리미티브들을 렌더링 순서에 따라 타일링한다(S120). 구체적으로, 이미지 프레임을 복수의 타일(tile)로 분할하고, 복수의 프리미티브들을 렌더링 순서에 따라 타일 비닝하고, 그 결과를 바탕으로 타일별 프리미티브 리스트를 생성한다.
이어서, 타일별로 해당 타일을 터치하는 프리미티브들을 래스터화한다(S130). 그리고, 프래그먼트들에 대하여 프래그먼트 프로세싱을 수행한다(S140). 여기서, 프래그먼트 프로세싱으로는 은면 제거, 조명, 표면 셰이딩, 텍스쳐링 등을 포함하는 프래그먼트 쉐이딩이 예시될 수 있다. 또한, 프래그먼트 프로세싱으로 안티 에일리어싱이 예시될 수 있다. 상기 프래그먼트 쉐이딩이 수행된 프래그먼트에 대해 안티 에일리어싱이 수행될 수 있다. 이 때, 안티 에일리어싱을 수행하는 경우에, 중요도가 다른 컬러 값을 갖는 컬러 포맷(예를 들어, YC, YCbCr, YPbPr 등)에 대해 서로 다른 컬러 값에 대해 서로 다른 샘플링 데이터 수를 이용하여 안티 에일리어싱을 수행할 수 있다.
예를 들어, MSAA(Multisampling Antialiasing) 방식을 이용하여 안티 에일리어싱을 수행하는 경우에, 제1 컬러 값(CV_1)에 대해 8xMSAA를 적용하여 안티 에일리어싱을 수행하고, 제2 컬러 값(CV_2)에 대해 4xMSAA, 2xMSAA, 또는 한 개의 샘플만 이용하는 방식을 적용하여 안티 에일리어싱을 수행할 수 있다. 또한, 제1 컬러 값(CV_1)에 대해 안티 에일리어싱을 수행하고, 제2 컬러 값(CV_2)에 대해서는 안티 에일리어싱을 수행하지 않도록 동작할 수 있다. 여기에서, 제1 컬러 값(CV_1)은 루마 성분을 포함하고, 제2 컬러 값(CV_2)은 크로마 성분을 포함할 수 있다.
도 14는 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛을 포함하는 무선 통신 디바이스를 도시한 블록도이다.
도 14를 참조하면, 디바이스(900)는, 셀룰러 전화기, 스마트폰 단말기, 핸드셋, 개인 휴대 정보 단말기(PDA), 랩탑 컴퓨터, 비디오 게임 유닛 또는 기타 다른 디바이스일 수도 있다. 디바이스(900)는, 코드 분할 다중 액세스(CDMA), 이동 통신을 위한 글로벌시스템(GSM) 과 같은 시분할 다중 액세스(TDMA), 또는 기타 다른 무선 통신 표준을 사용할 수도 있다.
디바이스(900)는 수신 경로 및 송신 경로를 통해 양-방향 통신을 제공할 수 있다. 수신 경로 상에서 하나 이상의 기지국들에 의해 송신된 신호들은 안테나(911)에 의해 수신될 수도 있고 수신기(RCVR, 913)에 제공될 수도 있다. 수신기(913)는 수신 신호를 컨디셔닝 및 디지털화하고, 추가적인 프로세싱을 위해 디지털 섹션(920)에 샘플들을 제공할 수 있다. 송신 경로 상에서, 송신기(TMTR, 915)는 디지털 섹션(920)으로부터 송신된 데이터를 수신하고, 그 데이터를 프로세싱 및 컨디셔닝하고, 변조된 신호를 생성하며, 그 변조된 신호는 안테나(911)를 통해 하나 이상의 기지국들로 송신될 수 있다.
디지털 섹션(920)은 하나 이상의 디지털 신호 프로세서(DSP), 마이크로-프로세서, 감소된 명령 세트 컴퓨터(RISC) 등으로 구현될 수 있다. 또한, 디지털 섹션(920)은 하나 이상의 주문형 집적 회로 (ASIC) 또는 기타 다른 타입의 집적 회로(IC) 상에서 제조될 수도 있다.
디지털 섹션(920)은, 예를 들어, 모뎀 프로세서(934), 비디오 프로세서 (922), 애플리케이션 프로세서(924), 디스플레이 프로세서(928), 제어기/멀티코어 프로세서(926), 센트럴 프로세싱 유닛(930), 및 외부 버스 인터페이스(EBI, 932)와 같은 다양한 프로세싱 및 인터페이스 유닛들을 포함할 수 있다.
비디오 프로세서(922)는 그래픽 애플리케이션들에 대한 프로세싱을 수행할 수 있으며, 앞서 설명한 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛(100, 300, 400)을 채용할 수 있다. 일반적으로, 비디오 프로세서(922)는 임의의 세트의 그래픽 동작들에 대한 임의의 수의 프로세싱 유닛들 또는 모듈들을 포함할 수 있다.
비디오 프로세서(922)의 특정 부분은 펌웨어 및/또는 소프트웨어로 구현될 수도 있다. 예를 들어, 제어 유닛은 앞서 설명한 기능들을 수행하는 펌웨어 및/또는 소프트웨어 모듈들(예를 들어, 절차, 함수 등)로 구현될 수 있다. 펌웨어 및/또는 소프트웨어 코드들은 메모리(예를 들어, 도 1의 외부 메모리(200))에 저장될 수도 있고, 프로세서(예를 들어, 멀티-코어 프로세서(926))에 의해 실행될 수도 있다. 메모리는 프로세서 내에 구현될 수 있거나 프로세서 외부에 구현될 수도 있다.
비디오 프로세서(922)는 오픈 그래픽 라이브러리(OpenGL), Direct3D 등과 같은 소프트웨어 인터페이스를 구현할 수 있다. 센트럴 프로세싱 유닛(930)은 비디오 프로세서(922)와 함께 일련의 그래픽 처리 동작들을 수행할 수 있다. 제어기/멀티코어 프로세서(926)는 적어도 두 개의 코어를 포함하여 제어기/멀티코어 프로세서(926)가 처리해야하는 워크로드에 따라서 두 개의 코어에 워크로드를 배당하여 동시에 해당하는 워크로드를 처리할 수 있다.
도 15는 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛을 포함하는 컴퓨팅 시스템을 도시한 블록도이다.
도 15를 참조하면, 본 발명의 일 실시예에 따른 컴퓨팅 시스템(1000)은 센트럴 프로세싱 유닛(CPU, 1005), 시스템 메모리(system memory, 2000), 서브 그래픽 시스템(3000), 디스플레이 장치(4000)를 포함한다.
센트럴 프로세싱 유닛(1005)은 애플리케이션을 구동하여, 메쉬(mesh)를 생성하도록 구성된다. 메쉬는 오브젝트(object)의 표면을 묘사할 수 있다. 메쉬는 복수의 프리미티브들로 구성될 수 있고, 프리미티브는 적어도 하나의 버텍스들로 구성될 수 있다.
시스템 메모리(2000)는 데이터를 저장하도록 구성된다. 시스템 메모리(2000)는 센트럴 프로세싱 유닛(1005)에 의해 처리되는 데이터를 저장할 수 있다. 시스템 메모리(2000)는 센트럴 프로세싱 유닛(1005)의 동작 메모리로서 역할을 수행할 수 있다. 시스템 메모리(2000)는 DDR SDRAM(Double Data Rate Static DRAM), SDR SDRAM(Single Data Rate SDRAM)과 같은 하나 이상의 휘발성 메모리 장치 및/또는 EEPROM(Electrical Erasable Programmable ROM), 플래시 메모리(flash memory)과 같은 하나 이상의 비휘발성 메모리 장치를 포함할 수 있다.
그래픽 서브 시스템(3000)은 그래픽 프로세싱 유닛(3100; GPU), 그래픽 메모리(3200; graphic memory), 디스플레이 컨트롤러(3300; display controller), 그래픽 인터페이스(3400; graphic interface), 그래픽 메모리 컨트롤러(3500; graphic memory controller)를 포함한다.
그래픽 프로세싱 유닛(3100)은 앞서 설명한 본 발명의 실시예들에 따른 그래픽 프로세싱 유닛(100, 300, 400)과 실질적으로 동일하게 구성될 수 있다. 그래픽 프로세싱 유닛(3100)은 상기 메쉬를 구성하는 복수의 프리미티브들을 이용하여 타일 기반 렌더링을 수행할 수 있다. 그래픽 프로세싱 유닛(3100)은 센트럴 프로세싱 유닛(1005)으로부터 메쉬를 구성하는 버텍스들의 데이터를 입력받을 수 있다. 그래픽 프로세싱 유닛(3100)은 적어도 하나의 버텍스들로 구성되는 프리미티브를 조립하고, 조립된 프리미티브들을 이용하여 렌더링을 수행할 수 있다.
그래픽 메모리(3200)는 그래픽 프로세싱 유닛(3100)에 의해 처리되는 그래픽 데이터를 저장하거나, 그래픽 프로세싱 유닛(3100)에 제공되는 그래픽 데이터를 저장할 수 있다. 또는, 그래픽 메모리(3200)는 그래픽 프로세싱 유닛(3100)의 동작 메모리로서 역할을 수행할 수 있다.
디스플레이 컨트롤러(3300)는 렌더링된 이미지 프레임이 디스플레이될 수 있도록, 디스플레이 장치(4000)를 제어한다.
그래픽 인터페이스(3400)는 센트럴 프로세싱 유닛(1005)과 그래픽 프로세싱 유닛(3100) 사이를 인터페이싱하고, 그래픽 메모리 컨트롤러(3500)는 시스템 메모리(2000)와 그래픽 프로세싱 유닛(3100) 사이에서 메모리 액세스를 제공한다.
도 15에는 명확하게 도시하지 않았으나, 컴퓨팅 시스템(1000)은 버튼, 터치 스크린, 마이크와 같은 하나 이상의 입력 장치, 및/또는 스피커와 같은 하나 이상의 출력 장치를 더 포함할 수 있다. 또한, 컴퓨팅 시스템(1000)은 유선 또는 무선으로 외부 장치와 데이터를 교환하기 위한 인터페이스 장치를 더 포함할 수 있다. 인터페이스 장치는 예를 들어, 안테나 또는 유무선 트랜시버 등을 포함할 수 있다.
실시예에 따라, 컴퓨팅 시스템(1000)은 휴대폰(Mobile Phone), 스마트 폰(Smart Phone), 개인 정보 단말기(Personal Digital Assistant; PDA), 데스크톱(Desktop), 노트북(Notebook), 태블릿(Tablet) 등과 같은 임의의 컴퓨팅 시스템일 수 있다.
본 발명의 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는, 프로세서에 의해 실행되는 하드웨어 모듈, 소프트웨어 모듈, 또는 그 2 개의 결합으로 직접 구현될 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명의 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체에 상주할 수도 있다. 예시적인 기록 매체는 프로세서에 연결되며, 그 프로세서는 기록 매체로부터 정보를 독출할 수 있고 기록 매체에 정보를 기입할 수 있다. 다른 방법으로, 기록 매체는 프로세서와 일체형일 수도 있다. 프로세서 및 기록 매체는 주문형 집적회로(ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 기록 매체는 사용자 단말기 내에 개별 구성 요소로서 상주할 수도 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였으나, 본 발명은 상기 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 제조될 수 있으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
100: 그래픽 프로세싱 유닛 200: 외부 메모리
110: 지오메트리 프로세싱 유닛 120: 렌더링 프로세싱 유닛
110: 지오메트리 프로세싱 유닛 120: 렌더링 프로세싱 유닛
Claims (20)
- 버텍스(vertex)를 입력받고, 상기 버텍스를 이용하여 프리미티브(primitive)를 생성하는 지오메트리(geometry) 프로세싱 유닛; 및
상기 생성된 프리미티브를 프래그먼트(fragment)로 변환하고, 상기 변환된 프래그먼트에 대해 프래그먼트 쉐이딩(fragment shading)을 수행하고, 상기 프래그먼트 쉐이딩이 수행된 상기 프래그먼트에 대해 안티 에일리어싱(antialiasing)을 수행하는 렌더링(rendering) 프로세싱 유닛을 포함하되,
상기 렌더링 프로세싱 유닛이 상기 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터와 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행하는 그래픽 프로세싱 유닛. - 제 1항에 있어서,
상기 렌더링 프로세싱 유닛은,
상기 안티 에일리어싱을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용하는 그래픽 프로세싱 유닛. - 제 2항에 있어서,
상기 렌더링 프로세싱 유닛은,
SSAA(Supersampling Antialiasing) 방식, MSAA(Multisampling Antialiasing) 방식, 또는 MLAA(Morphological Antialiasing) 방식을 이용하는 그래픽 프로세싱 유닛. - 제 1항에 있어서,
상기 렌더링 프로세싱 유닛은,
상기 제1 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하고, 상기 제2 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하지 않는 그래픽 프로세싱 유닛. - 제 1항에 있어서,
상기 렌더링 프로세싱 유닛은,
상기 프래그먼트 쉐이딩을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행하는 그래픽 프로세싱 유닛. - 제 1항에 있어서,
상기 지오메트리 프로세싱 유닛은,
상기 버텍스를 입력받고, 상기 입력받은 버텍스를 변환하여 출력하는 버텍스 프로세싱 유닛과,
상기 변환되어 출력된 버텍스로부터 상기 프리미티브와, 상기 프리미티브에 대응하도록 정의된 텍스쳐 패치 정보(texture patch information)를 생성하는 프리미티브 어셈블리 유닛을 포함하는 그래픽 프로세싱 유닛. - 제 6항에 있어서,
상기 프리미티브는 삼각형(triangle) 타입인 그래픽 프로세싱 유닛. - 제 6항에 있어서,
상기 지오메트리 프로세싱 유닛은,
이미지 프레임을 복수의 타일(tile)로 분할하고, 상기 분할된 각 타일에 속한 프리미티브에 대한 프리미티브 리스트를 생성하는 타일링(tiling) 유닛을 더 포함하는 그래픽 프로세싱 유닛. - 제 8항에 있어서,
상기 프리미티브 리스트는, 상기 분할된 각 타일에 속한 프리미티브에 대한 위치 정보 및 속성 정보를 포함하는 그래픽 프로세싱 유닛. - 제 1항에 있어서,
상기 렌더링 프로세싱 유닛은,
상기 생성된 프리미티브에 대해 래스터화(rasterization)를 수행하여 상기 생성된 프리미티브를 프래그먼트로 변환하는 래스터라이저와,
상기 프래그먼트에 대해 상기 안티 에일리어싱을 수행하는 프래그먼트 프로세싱 유닛을 포함하는 그래픽 프로세싱 유닛. - 제 10항에 있어서,
상기 렌더링 프로세싱 유닛은,
상기 생성된 프리미티브에 대해 가시성(visibility) 테스트를 수행하여 비가시적인(invisible) 상기 프리미티브를 폐기(discard)하는 깊이 테스터(depth tester)를 더 포함하고,
상기 래스터라이저는 상기 깊이 테스터의 출력에 대해 래스터화를 수행하는 그래픽 프로세싱 유닛. - 버텍스(vertex)를 입력받고, 상기 버텍스를 이용하여 프리미티브(primitive)를 생성하는 프리미티브 어셈블리 유닛;
이미지 프레임을 복수의 타일로 분할하고, 상기 분할된 각 타일에 속한 상기 프리미티브에 대응하는 텍스쳐 패치 정보(texture patch information)를 생성하는 타일링 유닛; 및
상기 프리미티브에 포함된 각 프래그먼트(fragment)에 대해, 상기 생성된 텍스쳐 패치 정보를 이용하여 프래그먼트 쉐이딩을 수행하는 렌더링 프로세싱 유닛을 포함하되,
상기 렌더링 프로세싱 유닛이 상기 프래그먼트 쉐이딩을 수행하는 경우에, 제1 컬러 데이터와 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행하는 그래픽 프로세싱 유닛. - 제 12항에 있어서,
상기 렌더링 프로세싱 유닛은,
상기 프래그먼트 쉐이딩을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용하는 그래픽 프로세싱 유닛. - 제1 컬러 데이터 및 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 안티 에일리어싱을 수행하는 그래픽 프로세싱 유닛; 및
상기 그래픽 프로세싱 유닛이 상기 안티 에일리어싱을 수행하는데 이용하는 외부 메모리를 포함하되,
상기 외부 메모리에는 상기 그래픽 프로세싱 유닛이 상기 안티 에일리어싱을 수행한 결과 데이터가 저장되고,
상기 그래픽 프로세싱 유닛이 상기 안티 에일리어싱을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행하는 그래픽 프로세싱 시스템. - 제 14항에 있어서,
상기 그래픽 프로세싱 유닛은,
상기 안티 에일리어싱을 수행하는 경우에, 상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용하는 그래픽 프로세싱 시스템. - 제 14항에 있어서,
상기 그래픽 프로세싱 유닛은,
상기 제1 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하고, 상기 제2 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하지 않는 그래픽 프로세싱 시스템. - 버텍스(vertex)를 입력받고,
상기 버텍스를 이용하여 프리미티브(primitive)를 생성하고,
상기 생성된 프리미티브에 대응되는 텍스쳐 패치(texture patch)를 정의하고,
상기 생성된 프리미티브에 대해 래스터화를 수행하여 상기 프리미티브를 프래그먼트(fragment)로 변환하고,
상기 정의된 텍스쳐 패치를 이용하여 상기 프래그먼트에 대해 프래그먼트 쉐이딩(fragment shading)을 수행하고,
상기 프래그먼트 쉐이딩이 수행된 상기 프래그먼트에 대해 안티 에일리어싱(antialiasing)을 수행하는 것을 포함하되,
상기 안티 에일리어싱을 수행하는 경우에, 제1 컬러 데이터와 상기 제1 컬러 데이터와 다른 제2 컬러 데이터에 대해 서로 다른 연산 동작을 수행하는 안티 에일리어싱 방법. - 제 17항에 있어서,
상기 안티 에일리어싱을 수행하는 것은,
상기 제1 컬러 데이터와 상기 제2 컬러 데이터에 대해 서로 다른 샘플링 데이터 수를 이용하는 안티 에일리어싱 방법. - 제 18항에 있어서,
상기 안티 에일리어싱을 수행하는 것은,
SSAA(Supersampling Antialiasing) 방식, MSAA(Multisampling Antialiasing) 방식, 또는 MLAA(Morphological Antialiasing) 방식을 이용하는 안티 에일리어싱 방법. - 제 17항에 있어서,
상기 안티 에일리어싱을 수행하는 것은,
상기 제1 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하고, 상기 제2 컬러 데이터에 대해 상기 안티 에일리어싱을 수행하지 않는 안티 에일리어싱 방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140142675A KR102251444B1 (ko) | 2014-10-21 | 2014-10-21 | 그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법 |
US14/835,060 US9830740B2 (en) | 2014-10-21 | 2015-08-25 | Graphic processing unit, system and anti-aliasing method to perform rendering based on image information |
DE102015115576.1A DE102015115576B4 (de) | 2014-10-21 | 2015-09-16 | Grafikverarbeitungseinheit, ein Grafikverarbeitungssystem mit derselben, und ein dieselbe verwendendes Anti-Aliasing-Verfahren |
CN201510655107.4A CN105550973B (zh) | 2014-10-21 | 2015-10-12 | 图形处理单元、图形处理系统及抗锯齿处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140142675A KR102251444B1 (ko) | 2014-10-21 | 2014-10-21 | 그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160046574A KR20160046574A (ko) | 2016-04-29 |
KR102251444B1 true KR102251444B1 (ko) | 2021-05-13 |
Family
ID=55638064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140142675A KR102251444B1 (ko) | 2014-10-21 | 2014-10-21 | 그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9830740B2 (ko) |
KR (1) | KR102251444B1 (ko) |
CN (1) | CN105550973B (ko) |
DE (1) | DE102015115576B4 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2526598B (en) * | 2014-05-29 | 2018-11-28 | Imagination Tech Ltd | Allocation of primitives to primitive blocks |
US10460513B2 (en) | 2016-09-22 | 2019-10-29 | Advanced Micro Devices, Inc. | Combined world-space pipeline shader stages |
US10262393B2 (en) * | 2016-12-29 | 2019-04-16 | Intel Corporation | Multi-sample anti-aliasing (MSAA) memory bandwidth reduction for sparse sample per pixel utilization |
GB2603618B (en) * | 2020-12-18 | 2023-04-26 | Imagination Tech Ltd | Graphics processing systems and methods |
US11790479B2 (en) * | 2021-01-29 | 2023-10-17 | Arm Limited | Primitive assembly and vertex shading of vertex attributes in graphics processing systems |
CN112785676B (zh) * | 2021-02-08 | 2024-04-12 | 腾讯科技(深圳)有限公司 | 一种图像渲染方法、装置、设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013137756A (ja) | 2011-12-05 | 2013-07-11 | Arm Ltd | コンピュータグラフィックスを処理する方法およびコンピュータグラフィックスを処理するための装置 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5990904A (en) | 1995-08-04 | 1999-11-23 | Microsoft Corporation | Method and system for merging pixel fragments in a graphics rendering system |
EP1182617A3 (en) * | 2000-08-23 | 2004-01-02 | Nintendo Co., Limited | Graphics system with reconfigurable embedded frame buffer and copy out conversions between embedded frame buffer and main memory |
US20050017969A1 (en) * | 2003-05-27 | 2005-01-27 | Pradeep Sen | Computer graphics rendering using boundary information |
US6967663B1 (en) | 2003-09-08 | 2005-11-22 | Nvidia Corporation | Antialiasing using hybrid supersampling-multisampling |
US7245302B1 (en) * | 2003-10-30 | 2007-07-17 | Nvidia Corporation | Processing high numbers of independent textures in a 3-D graphics pipeline |
JP2005167399A (ja) | 2003-11-28 | 2005-06-23 | Noritsu Koki Co Ltd | 画像ノイズ除去方法 |
US7348996B2 (en) | 2004-09-20 | 2008-03-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Method of and system for pixel sampling |
GB0426170D0 (en) * | 2004-11-29 | 2004-12-29 | Falanx Microsystems As | Processing of computer graphics |
US7525583B2 (en) | 2005-02-11 | 2009-04-28 | Hewlett-Packard Development Company, L.P. | Decreasing aliasing in electronic images |
JP4669334B2 (ja) | 2005-07-06 | 2011-04-13 | 株式会社ディジタルメディアプロフェッショナル | エッジ・マルチサンプリングハイブリッドアンチエイリアス |
GB2431803A (en) * | 2005-10-31 | 2007-05-02 | Sony Uk Ltd | Alias avoidance in image processing |
US8130227B2 (en) | 2006-05-12 | 2012-03-06 | Nvidia Corporation | Distributed antialiasing in a multiprocessor graphics system |
US20090033671A1 (en) * | 2007-08-02 | 2009-02-05 | Ati Technologies Ulc | Multi-sample rendering of 2d vector images |
CN102016916B (zh) | 2008-04-04 | 2014-08-13 | 先进微装置公司 | 用于抗混叠的过滤方法和装置 |
GB0819570D0 (en) | 2008-10-24 | 2008-12-03 | Advanced Risc Mach Ltd | Methods of and apparatus for processing computer graphics |
KR20110029001A (ko) | 2009-09-14 | 2011-03-22 | 삼성전자주식회사 | 베이어 영상에서의 이미지 처리 방법 및 장치 |
US8692848B2 (en) * | 2009-12-17 | 2014-04-08 | Broadcom Corporation | Method and system for tile mode renderer with coordinate shader |
KR101451134B1 (ko) | 2010-02-12 | 2014-10-15 | 삼성테크윈 주식회사 | 폰트 안티 알리아싱 방법 |
WO2012012451A1 (en) | 2010-07-19 | 2012-01-26 | Advanced Micro Devices, Inc. | Split storage of anti-aliased samples |
US8786625B2 (en) | 2010-09-30 | 2014-07-22 | Apple Inc. | System and method for processing image data using an image signal processor having back-end processing logic |
KR20120069134A (ko) | 2010-12-20 | 2012-06-28 | 삼성전자주식회사 | 이차원 평면에서 계단현상 개선 장치 및 방법 |
KR20140142675A (ko) | 2013-06-04 | 2014-12-12 | 닛토덴코 가부시키가이샤 | 열경화형 다이 본딩 필름, 다이싱 시트 부착 다이 본딩 필름, 및 반도체 장치의 제조 방법 |
US9437040B2 (en) * | 2013-11-15 | 2016-09-06 | Nvidia Corporation | System, method, and computer program product for implementing anti-aliasing operations using a programmable sample pattern table |
-
2014
- 2014-10-21 KR KR1020140142675A patent/KR102251444B1/ko active IP Right Grant
-
2015
- 2015-08-25 US US14/835,060 patent/US9830740B2/en active Active
- 2015-09-16 DE DE102015115576.1A patent/DE102015115576B4/de active Active
- 2015-10-12 CN CN201510655107.4A patent/CN105550973B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013137756A (ja) | 2011-12-05 | 2013-07-11 | Arm Ltd | コンピュータグラフィックスを処理する方法およびコンピュータグラフィックスを処理するための装置 |
Also Published As
Publication number | Publication date |
---|---|
DE102015115576B4 (de) | 2024-05-29 |
CN105550973B (zh) | 2020-10-13 |
CN105550973A (zh) | 2016-05-04 |
DE102015115576A1 (de) | 2016-04-21 |
US9830740B2 (en) | 2017-11-28 |
KR20160046574A (ko) | 2016-04-29 |
US20160110914A1 (en) | 2016-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9741158B2 (en) | Graphic processing unit and tile-based rendering method | |
US11748840B2 (en) | Method for efficient re-rendering objects to vary viewports and under varying rendering and rasterization parameters | |
KR102048885B1 (ko) | 그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 렌더링 방법 | |
KR102251444B1 (ko) | 그래픽 프로세싱 유닛, 이를 포함하는 그래픽 프로세싱 시스템, 및 이를 이용한 안티 에일리어싱 방법 | |
JP6504212B2 (ja) | 装置、方法およびシステム | |
US10068311B2 (en) | Varying effective resolution by screen location by changing active color sample count within multiple render targets | |
EP3180773B1 (en) | Bandwidth reduction using texture lookup by adaptive shading | |
US9626795B2 (en) | Reducing shading by merging fragments from the adjacent primitives | |
KR20120096119A (ko) | 그래픽 프로세서 및 조기 가시성 테스트 방법 | |
JP2018163678A (ja) | 選択的ラスタライゼーション | |
KR20160130629A (ko) | 양안 시차 영상에 대한 렌더링 방법 및 장치 | |
US20160125649A1 (en) | Rendering apparatus and rendering method | |
US11037271B2 (en) | Dynamic rendering for foveated rendering | |
US8004522B1 (en) | Using coverage information in computer graphics | |
WO2014185900A1 (en) | Variable rasterization order for motion blur and depth of field | |
CN116563083A (zh) | 渲染图像的方法和相关装置 | |
US20220068004A9 (en) | Varying effective resolution by screen location by changing active color sample count within multiple render targets | |
RU2666300C2 (ru) | Технологии уменьшения пиксельного шейдинга | |
US9390463B2 (en) | Techniques for reducing memory bandwidth for display composition | |
CN118043842A (zh) | 一种渲染格式选择方法及其相关设备 | |
GB2531936A (en) | Graphic processing unit, a graphic processing system including the same, and an anti-aliasing method using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |