KR20220151171A - 그래픽 처리 유닛 렌더 모드 선택 시스템 - Google Patents

그래픽 처리 유닛 렌더 모드 선택 시스템 Download PDF

Info

Publication number
KR20220151171A
KR20220151171A KR1020227031430A KR20227031430A KR20220151171A KR 20220151171 A KR20220151171 A KR 20220151171A KR 1020227031430 A KR1020227031430 A KR 1020227031430A KR 20227031430 A KR20227031430 A KR 20227031430A KR 20220151171 A KR20220151171 A KR 20220151171A
Authority
KR
South Korea
Prior art keywords
render
pass
mode
render pass
gpu
Prior art date
Application number
KR1020227031430A
Other languages
English (en)
Inventor
아니루드 알. 아차랴
루이진 우
영 인 여
미카 투오미
키이아 칼리오
Original Assignee
어드밴스드 마이크로 디바이시즈, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 어드밴스드 마이크로 디바이시즈, 인코포레이티드 filed Critical 어드밴스드 마이크로 디바이시즈, 인코포레이티드
Publication of KR20220151171A publication Critical patent/KR20220151171A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/005General purpose rendering architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/24Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4411Configuring for operating with peripheral devices; Loading of device drivers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Graphics (AREA)
  • Computer Security & Cryptography (AREA)
  • Image Generation (AREA)
  • Image Processing (AREA)

Abstract

프로세서는 렌더 패스의 특성에 기초하여 프레임의 각각의 렌더 패스에 대한 렌더 모드를 동적으로 선택한다. 프로세서의 소프트웨어 드라이버는 프로세서에서 실행되는 애플리케이션으로부터 그래픽 동작을 수신하고, 상기 그래픽 동작을 그래픽 파이프라인에 제공되는 명령 스트림으로 변환한다. 드라이버가 그래픽 동작을 명령 스트림으로 변환함에 따라, 드라이버는 프레임의 각각의 렌더 패스를 분석하여 렌더 패스의 특성을 결정하고, 렌더 패스의 특성에 기초하여 각각의 렌더 패스에 대한 렌더 모드를 선택한다.

Description

그래픽 처리 유닛 렌더 모드 선택 시스템
3차원(3-D) 그래픽을 처리하기 위한 종래의 그래픽 파이프라인은 일련의 프로그래밍 가능한 셰이더(shader) 및 고정 기능 하드웨어 블록으로 형성된다. 소프트웨어 애플리케이션은 그래픽 파이프라인에서 렌더링할 프레임을 생성하고, 그 프레임을 그래픽 파이프라인의 전방 단부에 있는 명령 프로세서에 제공한다. 프레임은 프레임에 의해 표현되는 이미지에서 객체 부분을 나타내는 삼각형 또는 패치와 같은 프리미티브(primitive)로 세분된다. 예를 들어, 프리미티브는 프레임에서 볼 수 있는 객체의 3-D 모델 부분을 나타낼 수 있다. 그래픽 파이프라인은 드로 콜(draw call)에 응답하여 각각의 프리미티브를 처리하고, 프리미티브의 음영을 수행하는 셰이더 하위시스템에 처리된 프리미티브를 제공한다. 그래픽 파이프라인은 또한 프리미티브의 래스터화(rasterization)를 수행하는 래스터라이저 및 프리미티브를 프레임의 상이한 부분과 연관된 빈(bin) 또는 타일로 그룹화하는 비너(binner)를 포함한다. 그 다음, 프리미티브의 빈은 디스플레이 상에 렌더링되기 전에 추가 음영을 위해 셰이더 하위시스템에 제공된다. 그래픽 파이프라인에서 셰이더 또는 고정 기능 하드웨어 블록은 동일한 프레임의 상이한 프리미티브 또는 빈을 동시에 처리할 수 있다. 예를 들어, 그래픽 엔진, 셰이더 하위시스템, 래스터라이저, 및 비너는 프레임의 일부를 나타내는 상이한 프리미티브를 동시에 처리할 수 있다.
첨부 도면을 참조함으로써 본 개시가 더 잘 이해되고, 본 개시의 많은 특징 및 이점이 당업자에게 명백해질 수 있다. 상이한 도면에서의 동일한 도면 부호의 사용은 유사하거나 동일한 아이템을 지시한다.
도 1은, 일부 실시예에 따른, 디스플레이로의 출력을 위해 의도된 시각적 이미지를 생성하기 위해 그래픽 처리 유닛(GPU)에 의해 구현된 그래픽 파이프라인에 대해 렌더 패스 당(per-render-pass) 기준으로 렌더 모드 선택을 구현하는 처리 시스템의 블록도이다.
도 2는, 일부 실시예에 따른, 3차원(3-D) 장면의 래스터화된 이미지를 생성하기 위해 고차 지오메트리 프리미티브를 처리할 수 있는 그래픽 파이프라인을 도시한다.
도 3은, 일부 실시예에 따른, GPU에 의해 구현된 그래픽 파이프라인에 대한 렌더 패스 당 기준으로 렌더 모드 선택을 구현하는 드라이버의 렌더 모드 선택 엔진의 블록도이다.
도 4는, 일부 실시예에 따른, 그래픽 파이프라인에 의해 사용될 처리 시스템의 드라이버에 의해 선택 가능한 4개의 렌더 모드를 도시한다.
도 5는, 일부 실시예에 따른, 렌더 패스 당 기준으로 그래픽 파이프라인에 대한 렌더 모드를 선택하기 위한 방법을 예시하는 흐름도이다.
데이터를 효율적으로 렌더링하고 처리하기 위해, 그래픽 처리 유닛(GPU)은 3D 컴퓨터 그래픽, 이미지, 비디오 등을 처리하고 렌더링하는 데 전용되는 그래픽 파이프라인을 포함한다. 각각의 프레임은 점, 선, 다각형 또는 메시로 구성된 프리미티브의 조합을 포함하는 프리미티브를 사용하는 파이프라인에 의해 렌더링된다. 각각의 프레임 또는 이미지에서의 프리미티브는, 어떤 픽셀이 프리미티브의 에지 내에 속하는지를 결정하고, 이들 픽셀 각각에 대응하는 프리미티브의 속성을 계산함으로써 개별적으로 그려진다. 많은 그래픽 파이프라인은, 각각의 프레임이 다수의 렌더 패스의 과정에서 그래픽 파이프라인에 의해 처리되는, 디퍼드(deferred) 음영을 이용한다. 예를 들어, 일부 실시예에서, 디퍼드 셰이더의 제1 패스에서, 음영 계산에 필요한 데이터만이 수집된다. 각각의 표면에 대한 위치, 법선(normal) 및 재질은 지오메트리 버퍼(G-버퍼)로 렌더링된다. 후속 렌더 패스에서, 픽셀 셰이더는 화면 공간 내의 텍스처 버퍼의 정보를 사용하여 각각의 픽셀에서 직접 및 간접 조명을 계산한다. 그래픽 드라이버는 각각의 렌더 패스에 대한 명령 스트림을 생성하고, 그래픽 파이프라인에서 사용하기 위한 렌더 패스에 특정한 간접 버퍼(IB)(하위 명령 버퍼(SCB)로도 지칭됨)와 같은 GPU 명령 버퍼에 명령 스트림을 저장한다.
그래픽 파이프라인은 거친 빈 렌더링(CBB), 프리미티브 배치 기반 빈 렌더링(PBB), 배치 기반 빈 렌더링을 활용한 거친 비닝(CPBB) 및 즉시 모드 렌더링(IMR)과 같은 다수의 렌더 모드를 지원하며, 여기서 각각의 모드는 상이한 렌더링 동작을 수행하므로, 사용되는 렌더링 모드에 따라 렌더링된 이미지가 달라진다. 통상적으로, GPU는 하드웨어에서 비닝 모드 또는 IMR의 기본 모드를 지원한다. 따라서, 지원되는 기본 모드는 프레임이 그래픽 파이프라인에 의해 처리되기 전에 전체 프레임에 대해 사용되고 프레임의 다수의 렌더 패스 각각에 대해 사용된다. 그러나, 각각의 모드는 장단점이 있으며, 특정 유형의 렌더 패스에 적합하다.
도 1 내지 도 5는 렌더 패스의 특성에 기초하여 프레임의 각각의 렌더 패스 (드로 콜 세트로도 지칭됨)에 대한 렌더 모드를 동적으로 선택하기 위한 기술을 도시한다. 프로세서의 소프트웨어 드라이버는 프로세서에서 실행되는 애플리케이션으로부터 그래픽 동작을 수신하고, 상기 그래픽 동작을 그래픽 파이프라인에 제공되는 명령 스트림으로 변환한다. 드라이버가 그래픽 동작을 명령 스트림으로 변환함에 따라, 드라이버는 프레임의 각각의 렌더 패스를 분석하여 렌더 패스의 특성을 결정하고, 렌더 패스의 특성에 기초하여 각각의 렌더 패스에 대한 렌더 모드를 선택한다. 예를 들어, 프리미티브 배치 비닝을 활용한 거친 비닝(CPBB)은 통상적인 지오메트리 버퍼(G버퍼) 렌더 패스에 적합하다. 거친 빈 렌더링(CBB) 모드는 많은 수의 프리미티브 또는 추가 지오메트리 중질 G버퍼를 갖는 렌더 패스에 매우 적합하다. 프리미티브 배치 기반 빈(PBB) 렌더링 모드는 조명 및 색상 렌더 패스 및 오클루전 쿼리(occlusion query)가 발생하는 렌더 패스에 대해 적합하다. 즉시 모드 렌더링(IMR)은 후처리 렌더 패스에 가장 적합하다. 렌더 패스의 특성에 적합한 렌더 모드를 선택함으로써, 드라이버는 처리 성능 및 효율을 향상시킨다.
일부 실시예에서, 드라이버는 선택된 렌더 모드를 그래픽 파이프라인에 나타내도록 명령 스트림을 수정한다. 예를 들어, 일부 실시예에서, 드라이버는 그래픽 파이프라인이 렌더 패스를 실행하는 데 사용할 렌더 모드를 나타내는 렌더 패스에 대응하는 명령 스트림에 토큰을 삽입함으로써 명령 스트림을 "패치"한다. 일부 실시예에서, 드라이버는 각각의 렌더 패스를 그래픽 파이프라인에서 사용하기 위한 간접 버퍼로 분류하고, IB의 시작 시 렌더 모드를 나타내는 토큰을 삽입한다. 그래픽 파이프라인은 렌더 패스에 대한 명령 스트림을 사용할 때 토큰을 판독하고, 토큰이 나타내는 선택된 렌더 모드로 전환한다. 렌더 패스에 적합한 렌더 모드로 전환함으로써, 그래픽 파이프라인은 이미지 품질 및 효율을 향상시킨다. 미세 입자 제어의 경우, 일부 실시예에서, 드라이버는 IB에서 "비닝 시작"및 "비닝 종료" 명령을 삽입하고 비닝 시작 시 프리앰블 상태에 대한 포인터를 제공한다.
도 1은, 일부 실시예에 따른, 디스플레이(110)의 출력을 위해 의도된 시각적 이미지를 생성하기 위한 그래픽 처리 유닛(GPU)(105)을 포함하는 처리 시스템(100)의 블록도이다. 처리 시스템(100)은 메모리(115)를 포함한다. 메모리(115)의 일부 실시예는 DRAM(dynamic random access memory)으로 구현된다. 그러나, 메모리(115)는 또한 SRAM(static random access memory), 비휘발성 RAM 등을 포함하는 다른 유형의 메모리를 사용하여 구현될 수 있다. 도시된 실시예에서, GPU(105)는 버스(120)를 통해 메모리(115)와 통신한다. 그러나, GPU(105)의 일부 실시예는 직접 연결을 통해 또는 다른 버스, 브리지, 스위치, 라우터 등을 통해 메모리(115)와 통신한다. GPU(105)는 메모리(115)에 저장된 명령어를 실행하고, GPU(105)는 실행된 명령어의 결과와 같은 정보를 메모리(115)에 저장한다. 예를 들어, 메모리(115)는 GPU(105)에 의해 실행될 프로그램 코드로부터 명령어의 사본(125)을 저장할 수 있다. GPU(105)의 일부 실시예는 독립적으로 명령어를 동시에 또는 병렬로 실행하는 다수의 프로세서 코어(명확성을 위해 도시되지 않음)를 포함한다.
처리 시스템(100)은 일반적으로 전자 장치에 대한 특정 작업을 수행하기 위한 애플리케이션(155)과 같은 명령어(예를 들어, 컴퓨터 프로그램)의 세트를 실행하도록 구성된다. 이러한 작업의 예는 전자 장치의 동작의 양태를 제어하는 것, 특정된 사용자 경험을 제공하기 위해 사용자에게 정보를 표시하는 것, 다른 전자 장치와 통신하는 것 등을 포함한다. 따라서, 상이한 실시예에서, 처리 시스템(100)은 데스크톱 컴퓨터, 랩톱 컴퓨터, 서버, 게임 콘솔, 태블릿, 스마트폰 등과 같은 다수의 유형의 전자 장치 중 하나에 사용된다. 처리 시스템(100)은 도 1에 도시된 것보다 더 많거나 더 적은 구성요소를 포함할 수 있음을 이해해야 한다. 예를 들어, 처리 시스템(100)은 하나 이상의 입력 인터페이스, 비휘발성 저장 장치, 하나 이상의 출력 인터페이스, 네트워크 인터페이스, 및 하나 이상의 디스플레이 또는 디스플레이 인터페이스를 추가로 포함할 수 있다.
처리 시스템(100)은 명령어를 실행하기 위한 중앙 처리 유닛(CPU)(130)을 포함한다. CPU(130)의 일부 실시예는 독립적으로 명령어를 동시에 또는 병렬로 실행하는 다수의 프로세서 코어(명확성을 위해 도시되지 않음)를 포함한다. CPU(130)는 또한 버스(120)에 연결되고, 따라서 버스(120)를 통해 GPU(105) 및 메모리(115)와 통신한다. CPU(130)는 메모리(115)에 저장된 프로그램 코드(135)와 같은 명령어를 실행하고, CPU(130)는 실행된 명령어의 결과와 같은 정보를 메모리(115)에 저장한다. CPU(130)는 또한 GPU(105)에 드로 콜을 발행하여 그래픽 처리를 개시할 수 있다. 드로 콜은 CPU(130)에 의해 생성되고 GPU(105)로 전송되어 GPU(105)가 프레임(또는 객체의 일부)에서 객체를 렌더링하도록 지시하는 명령이다. 드로 콜의 일부 실시예는 GPU(105)에 의해 사용되는 텍스처, 상태, 셰이더, 렌더링 객체, 버퍼 등을 정의하는 정보를 포함하여 객체 또는 그 일부를 렌더링한다. GPU(105)는 객체를 렌더링하여 디스플레이(110)에 제공되는 픽셀의 값을 생성하며, 디스플레이는 픽셀 값을 사용하여 렌더링된 객체를 나타내는 이미지를 표시한다.
렌더링되는 각각의 프레임은 다수의 패스에서 GPU(105) 그래픽 파이프라인에 의해 처리된다. 예를 들어, 장면 지오메트리에 관한 제1 패스 동안, 픽셀 당(per-pixel) 조명을 계산하는 데 필요한 속성만이 G-버퍼에 기록된다. 제2 패스 동안, 그래픽 파이프라인은 확산 및 반사 조명 데이터만을 출력한다. 그래픽 파이프라인을 통한 프레임의 제3 패스에서, 그래픽 파이프라인은 다시 조명 데이터를 판독하고, 최종 픽셀 당 음영을 출력한다. 따라서, 다중 패스 렌더링에서, 장면 및 프레임의 연관 객체는 여러 번 렌더링된다. 객체가 그려질 때마다, 그래픽 파이프라인은 객체의 외관의 추가 양태를 계산하고, 추가 양태를 이전 결과와 조합한다. 프레임 또는 프레임의 객체가 그래픽 파이프라인에 의해 렌더링되는 각각의 시간은 렌더 패스로 지칭된다.
입력/출력(I/O) 엔진(140)은 디스플레이(110)와 연관된 입력 또는 출력 동작 뿐만 아니라, 키보드, 마우스, 프린터, 외부 디스크 등과 같은 처리 시스템(100)의 다른 요소를 처리한다. I/O 엔진(140)은, I/O 엔진(140)이 GPU(105), 메모리(115), 또는 CPU(130)와 통신하도록, 버스(120)에 결합된다. 예시된 실시예에서, I/O 엔진(140)은 콤팩트 디스크(CD), 디지털 비디오 디스크(DVD) 등과 같은 외부 저장 매체(145)에 저장된 정보를 판독하도록 구성된다. 외부 저장 매체(145)는 비디오 게임과 같은 애플리케이션을 구현하는 데 사용되는 프로그램 코드를 나타내는 정보를 저장한다. 외부 저장 매체(145)의 프로그램 코드는 메모리(115)에 기록되어 GPU(105) 또는 CPU(130)에 의해 실행될 명령어의 사본(125) 형성할 수 있다.
GPU(105)는, 드로 콜에 응답하여 상이한 프리미티브의 동시 처리를 위해 구성된 다수의 단계를 포함하는 그래픽 파이프라인(명확성을 위해 도 1에 도시되지 않음)을 구현한다. GPU(105)의 그래픽 파이프라인의 단계는 비디오 게임과 같은 애플리케이션에 의해 생성된 상이한 프리미티브를 동시에 처리할 수 있다. 지오메트리가 그래픽 파이프라인에 제출되면, 하드웨어 상태 설정은 그래픽 파이프라인의 상태를 정의하도록 선택된다. 상태의 예는, 장면을 렌더링하는 데 사용되는 래스터라이저 상태, 블렌드 상태, 심도 스텐실 상태, 제출된 지오메트리의 프리미티브 토폴로지 타입, 및 셰이더(예를 들어, 정점 셰이더, 도메인 셰이더, 지오메트리 셰이더, 덮개 셰이더, 픽셀 셰이더 등)를 포함한다. 그래픽 파이프라인 상태에서 구현되는 셰이더는 대응하는 바이트 코드에 의해 표현된다. 일부 경우에서, 그래픽 파이프라인 상태를 나타내는 정보는 그래픽 파이프라인 상태의 보다 효율적인 표현을 제공하도록 해싱 또는 압축된다.
드라이버(150)는, 예컨대 애플리케이션(155)으로부터의 더 높은 레벨의 그래픽 컴퓨팅 프로그램이 GPU(105)와 상호작용할 수 있도록 하는 컴퓨터 프로그램이다. 예를 들어, 드라이버(150)는 애플리케이션(155)으로부터 수신된 표준 코드를 GPU(105)에 의해 이해되는 네이티브 포맷 명령 스트림으로 변환한다. 드라이버(155)는 애플리케이션(155)으로부터 입력이 GPU(105)의 설정을 지시하도록 허용한다. 이러한 설정은 렌더 모드, 안티-에일리어싱 제어, 텍스처 필터 제어, 배치 비닝 제어, 및 디퍼드 픽셀 음영 제어의 선택을 포함한다.
그래픽 파이프라인의 성능은 각각의 렌더 패스에 대한 적절한 렌더 모드를 선택하는 드라이버(150)에 의해 향상된다. 처리 성능 및 효율을 개선하기 위해, 드라이버(150)는, 렌더 패스에 대한 드로 콜 세트를 수신하고, 드로 콜 세트의 특성에 기초하여 렌더 패스에 대한 렌더 모드를 결정하도록 구성된 렌더 모드 선택 엔진(도 1에 도시되지 않음)을 포함한다. 예를 들어, 일부 실시예에서, 그래픽 파이프라인은 거친 빈 렌더링(CBB), 프리미티브 배치 기반 빈 렌더링(PBB), 배치 기반 빈 렌더링을 활용한 거친 비닝(CPBB) 및 즉시 모드 렌더링(IMR)과 같은 다수의 렌더 모드를 지원한다. CBB 렌더 모드의 경우, 그래픽 파이프라인은 화면 전체에 걸쳐 큰 타일을 갖는 드로 콜을 비닝한다. 예를 들어, 1080p 렌더 타깃의 경우, 그래픽 파이프라인은 화면을 다수의 512 x 512 픽셀 빈으로 분할한다. 일부 실시예에서, CBB 렌더 모드는 그래픽 파이프라인의 명령 버퍼에서 드로 콜을 비닝한다.
PBB 렌더 모드의 경우, 그래픽 파이프라인은 화면 전체에 걸쳐 온-칩 메모리의 제한된 드로 콜 및 프리미티브 세트를 비닝한다. 예를 들어, PBB 렌더 모드에서, 그래픽 파이프라인은 화면을 64 x 64 픽셀과 같은 더 작은 빈으로 분할한다. 일부 실시예에서, PBB 렌더 모드는 그래픽 파이프라인 사후 컬링 동작에서 드로 콜을 더 깊게 비닝한다.
CPBB 렌더 모드의 경우, 그래픽 파이프라인은 하이브리드 2-레벨 비닝을 수행한다: 제1 레벨에서, 그래픽 파이프라인은 화면을 512 x 512 픽셀과 같은 대형 빈으로 분할하고, 제2 레벨에서, 그래픽 파이프라인은 큰 빈 내의 제한된 드로 콜 및 프리미티브 세트를 64 x 64 픽셀 빈과 같은 더 작은 빈으로 분할한다.
IMR의 경우, 그래픽 파이프라인은 거친 또는 프리미티브-배치 비닝을 수행하지 않지만, 대신에 드로 콜 및 프리미티브가 애플리케이션(155)으로부터 수신되는 순서로 화면을 렌더링한다.
드라이버(150)가 애플리케이션(155)으로부터 수신된 표준 코드를 GPU(105)가 이해하는 네이티브 포맷 명령 스트림으로 변환함에 따라, 드라이버(150)는 렌더 패스에 포함된 각각의 드로 콜 세트를 분석하고, 그래픽 파이프라인이 렌더 패스를 실행하기 위해 어떤 렌더 모드를 사용할 것인지를 결정한다. 드라이버(150)는 선택된 렌더 모드를 나타내는 토큰을 포함하는 드로 콜 세트에 대한 명령 스트림을 수정함으로써 선택된 렌더 모드를 그래픽 파이프라인에 표시한다. 그래픽 파이프라인이 명령 스트림을 소비함에 따라, 그래픽 파이프라인은 토큰을 판독하고, 표시된 선택된 렌더 모드를 구현한다.
일부 실시예에서, 드라이버(150)는, 선택된 렌더 모드가 렌더 패스에 대해 호환되지 않거나 최적이 아니라고 드라이버(150)가 결정하는 경우의 렌더 모드에 대해 이전에 선택한 렌더 모드를 기각한다. 예를 들어, 드라이버(150)가 렌더 패스에 대해 CBB 또는 CPBB와 같은 비닝 렌더 모드를 선택하고, 렌더 패스의 처리 동안, 사용자가 오클루전 쿼리를 삽입하거나 불규칙 액세스 뷰(UAV)에 기입과 같은 메모리 일관성을 변경하는 셰이더 동작을 사용하는 것과 같이 조건이 변할 경우, 드라이버는 변경된 조건과 호환되는 렌더 모드를 나타내는 토큰을 포함하도록 명령 스트림을 "패치"한다. 일부 실시예에서, 드라이버(150)가 선택된 렌더 모드를 기각하는 경우, 드라이버(150)는 렌더 패스에 대해 기본 렌더 모드로 복귀하도록 그래픽 파이프라인에 신호를 보낸다.
도 2는, 일부 실시예에 따른, 사전 결정된 해상도에서 3차원(3-D) 장면의 래스터화된 이미지를 생성하기 위해 고차 지오메트리 프리미티브를 처리할 수 있는 그래픽 파이프라인(200)을 도시한다. 그래픽 파이프라인(200)은 도 1에 도시된 GPU(105)의 일부 실시예에서 구현된다. 그래픽 파이프라인(200)의 예시된 실시예는 DX11 사양에 따라 구현된다. 그래픽 파이프라인(200)의 다른 실시예는 Vulkan, Metal, DX12 등과 같은 다른 애플리케이션 프로그래밍 인터페이스(API)에 따라 구현된다.
그래픽 파이프라인(200)은 버퍼를 구현하고 정점 데이터, 텍스처 데이터 등을 저장하기 위해 사용되는 하나 이상의 메모리 또는 캐시의 계층구조와 같은 저장 자원(201)에 액세스할 수 있다. 저장 자원(201)은 도 1에 도시된 메모리(115)의 일부 실시예를 사용하여 구현될 수 있다.
입력 어셈블러(202)는 장면의 모델의 부분을 나타내는 객체를 정의하는 데 사용되는 저장 자원(201)으로부터의 정보에 액세스하도록 구성된다. 소프트웨어로 구현될 수 있는 정점 셰이더(203)는 논리적으로 프리미티브의 단일 정점을 입력으로 수신하고 단일 정점을 출력한다. 정점 셰이더(203)와 같은 셰이더의 일부 실시예는 다수의 정점이 동시에 처리되도록 단일-명령어-다중-데이터(SIMD) 처리를 구현한다. 도 2에 도시된 그래픽 파이프라인(200)은, 그래픽 파이프라인(200)에 포함된 모든 셰이더가 공유된 SIMD 계산 유닛 상에 동일한 실행 플랫폼을 갖도록 통합된 셰이더 모델을 구현한다. 따라서, 정점 셰이더(203)를 포함하여, 셰이더는 본원에서 통합된 셰이더 풀(204)로 지칭되는 공통 자원 세트를 사용하여 구현된다. 통합된 셰이더 풀(204)의 일부 실시예는 도 1에 도시된 GPU(105)의 프로세서를 사용하여 구현된다.
덮개 셰이더(205)는 입력 패치를 정의하는 데 사용되는 입력 고차 패치 또는 제어 지점에서 동작한다. 덮개 셰이더(205)는 테셀레이션 인자 및 다른 패치 데이터를 출력한다. 덮개 셰이더(205)에 의해 생성된 프리미티브는 선택적으로 테셀레이터(206)에 제공될 수 있다. 테셀레이터(206)는 덮개 셰이더(205)로부터 객체(예를 들어 패치)을 수신하고, 예를 들어, 덮개 셰이더(205)에 의해 테셀레이터(106)에 제공된 테셀레이션 인자에 기초하여 입력 객체를 테셀레이션함으로써, 입력 객체에 대응하는 프리미티브를 식별하는 정보를 생성한다. 테셀레이션은 패치와 같은 입력 고차 프리미티브를, 예를 들어, 테셀레이션 프로세스에 의해 생성되는 프리미티브의 세분성을 특정하는 테셀레이션 인자에 의해 표시된 바와 같이, 더 미세한 세부 수준을 나타내는 저차 출력 프리미티브 세트로 세분화한다. 따라서, 장면의 모델은 (메모리 또는 대역폭을 절약하기 위해) 더 적은 수의 고차 프리미티브에 의해 표현될 수 있고, 고차 프리미티브를 테셀레이션하여 추가 세부사항을 추가할 수 있다.
도메인 셰이더(207)는 도메인 위치 및 (선택적으로) 다른 패치 데이터를 입력한다. 도메인 셰이더(207)는 제공된 정보 상에서 동작하고, 입력 도메인 위치 및 다른 정보에 기초하여 출력에 대한 단일 정점을 생성한다. 지오메트리 셰이더(208)는 입력 프리미티브를 수신하고, 입력 프리미티브에 기초하여 지오메트리 셰이더(208)에 의해 생성되는 최대 4개의 프리미티브를 출력한다. 하나의 프리미티브 스트림이 래스터라이저(209)에 제공되고, 최대 4개의 프리미티브 스트림이 저장 자원(201)의 버퍼에 연결될 수 있다. 래스터라이저(209)는 음영 동작 및 다른 동작, 예컨대 클리핑, 투시 분할, 시저링, 및 뷰포트 선택 등을 수행한다. 픽셀 셰이더(210)는 픽셀 흐름을 입력하고, 입력 픽셀 흐름에 응답하여 제로 또는 다른 픽셀 흐름을 출력한다. 출력 병합기 블록(211)은 픽셀 셰이더(210)로부터 수신된 픽셀에 대한 블렌드, 심도, 스텐실, 또는 다른 동작을 수행한다.
본원에서 논의되는 바와 같이, 드라이버(150)는 그래픽 파이프라인(200)에 의해 구현될 렌더 모드를 결정하고, 선택된 렌더 모드를 그래픽 파이프라인(200)에 전달한다. 드라이버(150)는 애플리케이션(155)으로부터의 드로 콜 세트를 포함하는 렌더 패스를 수신한다. 드라이버(150)는 렌더 패스를 분석하여 그 특성을 결정한다. 렌더 패스의 특성 및 처리 시스템(100)의 효율성 요건에 기초하여, 드라이버(150)는 렌더 패스에 대한 렌더 모드를 선택한다. 일부 실시예에서, 드라이버(150)는 선택된 렌더 모드를 나타내기 위해 간접 버퍼에서 그래픽 파이프라인(200)으로 입력된 명령 스트림을 수정한다. 예를 들어, 일부 실시예에서, 드라이버(150)는 명령 스트림의 시작 시 토큰을 간접 버퍼에 삽입함으로써 명령 스트림을 "패치"한다.
도 3은, 일부 실시예에 따른, GPU(105)에 의해 구현된 그래픽 파이프라인(200)에 대해 렌더 패스 당 기준으로 렌더 모드 선택을 구현하는 드라이버(150)의 렌더 모드 선택 엔진(302)의 블록도이다. 렌더 모드 선택 엔진(302)은 렌더 패스 분석기(306), 렌더 모드 메뉴(308), 및 선택 기각(310)을 포함하며, 이들 각각은 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 임의의 조합으로 구현될 수 있다. 렌더 모드 선택 엔진(302)은 프레임의 각각의 렌더 패스를 분석하고, 각각의 렌더 패스에 대한 렌더 모드를 선택하고, 렌더 패스에 대응하는 간접 버퍼(320)에 토큰을 삽입하여 선택된 렌더 패스를 그래픽 파이프라인(200)으로 전달하도록 구성된다.
렌더 패스 분석기(306)는 각각의 렌더 패스를 분석하여 렌더 패스의 특성을 결정한다. 일부 실시예에서, 렌더 패스 분석기(306)에 의해 결정된 특성은 프리미티브의 수, 렌더 타깃 경계, 렌더 패스가 오클루전 쿼리를 포함하는지 여부, 및 렌더 패스에 대해 렌더 패스 및 하위 패스 API가 보이는지 여부를 포함한다. 렌더 모드 메뉴(308)는 CBB, PBB, CPBB, 및 IMR와 같은 그래픽 파이프라인(200)의 지원되는 렌더 모드 목록 및 어떤 렌더 모드가 특정 특성을 갖는 렌더 패스에 적합한지를 결정하는 데 적용될 휴리스틱을 포함한다. 예를 들어, 일부 실시예에서, 드라이버(150)가 오클루전 쿼리와 만나는 경우, 드라이버(150)는 렌더 패스(304)에 대해 IMR 렌더 모드를 선택한다. 일부 실시예에서, 드라이버(150)가 하위-패스 API와 만나는 경우, 드라이버(150)는 렌더 패스(304)의 드로 콜의 지오메트리 복잡성에 기초하여 비닝 렌더 모드(예컨대 CPBB, PBB, 또는 CBB) 중 하나를 선택한다. 선택 기각(310)은, 선택된 렌더 모드가 더 이상 렌더 패스에 대한 최적 모드가 아니도록 조건이 변경되는 경우, 선택된 렌더 모드를 기각하고 기본 렌더 모드로 복귀하도록 구성된다. 예를 들어, 프레임의 특성이 업데이트되는 경우, 선택 기각(310)은 선택된 렌더 모드가 더 이상 렌더 패스에 최적이 아니라고 결정할 수 있다.
동작 시, 렌더 모드 선택 엔진(302)은 애플리케이션(155)으로부터 렌더 패스(304)를 수신한다. 렌더 패스 분석기(306)는 렌더 패스(404)를 분석하여 그 특성을 결정한다. 렌더 모드 선택 엔진(302)은 렌더 패스(304)의 특성에 기초하여 렌더 모드 메뉴(308)로부터 렌더 패스(304)에 대한 렌더 모드를 선택한다. 렌더 모드 선택 엔진(302)은 선택된 렌더 모드를 나타내는 토큰(312)을 간접 버퍼(320)에 삽입함으로써 렌더 패스(304)에 대한 명령 스트림을 수정한다. 선택된 렌더 모드가 더 이상 렌더 패스(304)에 대해 최적이 아니도록 변경된 조건의 경우, 선택 기각(310)은 그래픽 파이프라인(200)이 렌더 패스(304)에 대한 기본 렌더 모드로 복귀하는 것을 나타내는 토큰(미도시)을 간접 버퍼(320)에 삽입함으로써 렌더 패스(304)에 대한 명령 스트림을 추가로 수정한다.
도 4는, 일부 실시예에 따른, 그래픽 파이프라인에 의해 사용될 처리 시스템의 드라이버에 의해 선택 가능한 4개의 렌더 모드를 도시한다. 거친 빈 렌더링(CBB) 모드(402)를 사용할 때, 그래픽 파이프라인(200)은 화면 전체에 걸쳐 드로 콜을 큰 타일로 비닝한다. 예를 들어, 1920 x 1080 픽셀인 1080p 화면의 경우, 일부 실시예에서 CBB 모드(402)를 사용하는 그래픽 파이프라인은 렌더 타깃을 다수의 512 x 512 픽셀 빈으로 나눈다. 일부 실시예에서, CBB 모드(402) 비닝은 그래픽 파이프라인(200)의 명령 버퍼에서 수행된다. CBB 모드(402)가 비닝 정보를 저장하기 위해 외부 메모리를 사용하기 때문에, CBB 모드(402)는 큰 수의 프리미티브를 갖는 드로 콜에 적당하며, 이는 버퍼링되고 비닝될 수 있는 드로 콜의 수를 증가시키기 위한 향상된 저장 용량을 제공한다. 따라서, 일부 실시예에서, 렌드 패스에 대한 프리미티브 카운트가 임계치를 초과하는 경우, 드라이버(150)는 렌더 패스에 대한 렌더 모드로서 CBB 모드(402)를 선택한다.
프리미티브 배치 기반 빈(PBB) 렌더링 모드(404)를 사용할 때, 그래픽 파이프라인(200)은 CBB 모드(402) 보다 더 작은 빈을 사용하여 화면 전체에 걸쳐 온-칩 메모리의 제한된 드로 콜 및 프리미티브 세트를 비닝한다. 예를 들어, 일부 실시예에서, PBB 모드(404)는 64 x 64 픽셀 빈을 사용한다. 일부 실시예에서, PBB 모드(404) 비닝은 사후 컬링 동작으로 CBB 모드(402) 보다 그래픽 파이프라인(200)에서 더 깊게 수행된다. PBB 모드(404)는 1의 렌더 타깃 경계와 같은 임계치 렌더 타깃 경계를 갖는 드로 콜, 및 오클루전 쿼리가 발생하는 드로 콜에 적합하다. 디퍼드 음영 파이프라인에서 1의 렌더 타깃 경계는 일반적으로 프리미티브의 수가 낮은 조명 또는 후처리 렌더 패스를 지칭한다. PBB 모드(404)는 메모리 액세스를 피하고 성능 및 효율을 개선하기 위해 온-칩 메모리에 비닝 정보를 저장한다. 따라서, 일부 실시예에서, 렌더 패스에 대한 렌더 타깃 경계가 임계치와 동일한 경우, 또는 드로 콜이 오클루전 쿼리를 호출하는 경우, 드라이버(150)는 렌더 패스에 대한 렌더 모드로서 PBB 모드(404)를 선택한다.
배치 기반 빈 렌더링을 활용한 거친 비닝(CPBB) 모드(406)에서, 그래픽 파이프라인(200)은, 그래픽 파이프라인이 먼저 512 x 512 픽셀과 같은 큰 빈으로 화면을 거칠게 비닝한 다음, 각각의 512 x 512 픽셀 빈에서 제한된 드로 콜 및 프리미티브 세트를 더 작은 64 x 64 픽셀 빈으로 비닝하는 다중 레벨 비닝 프로세스를 사용한다. 높은 렌더 타깃 경계가 지오메트리 버퍼(Gbuffer) 렌더 패스를 나타낼 수 있기 때문에, CPBB 모드(406)는 PBB 모드(404)에 대해 사용되는 임계치를 초과하는 렌더 타깃 경계를 갖는 드로 콜에 적합하다. CPBB 모드(406)는 또한 렌더 패스 및 하위 패스 애플리케이션 프로그래밍 인터페이스(API)가 보일 때 적합하다. 제1 레벨 거친 비닝은 화면을 PBB 모드에서 소비할 수 있는 빈으로 나눈다. 따라서, 화면이 수천 개의 프리미티브(삼각형)를 갖는 경우, 거친 레벨 비닝은 화면을 영역으로 분할하고, 화면의 일부에만 동작한다. 화면의 각각의 영역은 전체 화면보다 더 적은 프리미티브를 가질 수 있고, PBB 모드는 온-칩 메모리에서 화면의 각 영역을 효율적으로 비닝할 수 있다. 따라서, 일부 실시예에서, 렌더 패스에 대한 렌더 타깃 경계가 임계치를 초과하는 경우, 또는 렌더 패스 및 하위 패스 API가 보이면, 드라이버(150)는 렌더 패스에 대한 렌더 모드로서 CPBB 모드(404)를 선택한다.
즉시 모드 렌더링(IMR)(408)에서, 그래픽 파이프라인(200)은 프리미티브가 파이프라인에 의해 수신되었던 순서로 장면에서 각각의 프리미티브를 렌더링하도록 구성된다. 예를 들어, 프리미티브는 프리미티브의 정점에 대응하는 x, y 및 z 좌표, 색상 또는 텍스처 u, v 좌표와 같은 속성 세트를 포함할 수 있다. 그 다음, 장면에서 모든 전방을 향한 프리미티브가 래스터화되고 음영 처리된다(보간, 텍스처링, 조명 및 결합 동작 포함). IMR 모드(408)는 후처리에 사용되는 전체 화면 드로 콜에 적합하다. 따라서, 드라이버(150)는 렌더 패스가 전체 화면 후처리를 포함한다고 결정하는 경우, 드라이버(150)는 렌더 패스를 위한 IMR 모드(408)를 선택한다.
도 5는, 일부 실시예에 따른, 렌더 패스 당 기준으로 그래픽 파이프라인에 대한 렌더 모드를 선택하기 위한 방법(500)을 예시하는 흐름도이다. 502 블록에서, 렌더 모드 선택 엔진(302)은 애플리케이션(155)으로부터 렌더 패스(304)를 수신한다. 504 블록에서, 렌더 패스 분석기(306)는 렌더 패스(304)의 특성을 평가한다. 506 블록에서, 렌더 모드 선택 엔진(302)은 렌더 패스(304) 특성에 기초하여 렌더 모드 메뉴(310)로부터 렌더 패스(304)에 대한 렌더 모드를 선택한다. 508 블록에서, 렌더 모드 선택 엔진(302)은 간접 버퍼(320)에서 렌더 패스(304)에 대한 선택된 렌더 모드를 나타내는 토큰을 삽입한다.
510 블록에서, 선택 기각(312)은 기각 조건이 충족되는지 여부를 결정한다. 일부 실시예에서, 선택된 렌더 모드가 더 이상 렌더 패스에 대해 최적이 아니도록 프레임의 특성이 업데이트되었다면, 기각 조건은 충족된다. 510 블록에서, 선택 기각(312)이 기각 조건이 충족되었다고 결정하는 경우, 방법 흐름은 512 블록으로 계속된다. 512 블록에서, 선택 기각(312)은 렌더 패스(304)에 대한 기본 렌더 모드로 복귀하도록 그래픽 파이프라인(200)에 신호를 보낸다. 예를 들어, 일부 실시예에서, 선택 기각(312)은, 그래픽 파이프라인(200)이 렌더 패스(304)에 대한 기본 렌더 모드로 복귀하는 것을 나타내는 토큰을 간접 버퍼(320)에 삽입함으로써 렌더 패스(304)에 대한 명령 스트림을 추가로 수정한다. 그 다음, 방법 흐름은 502 블록으로 다시 계속된다. 510 블록에서, 선택 기각(312)이 기각 조건이 충족되지 않았다고 결정하는 경우, 방법 흐름은 502 블록으로 다시 계속된다.
본원에 개시된 바와 같이, 일부 실시예에서, 방법은: 프레임에 대한 복수의 렌더 패스의 각각의 렌더 패스에 대해, 렌더 패스의 특성에 기초한 복수의 렌더 모드 중 하나의 렌더 모드를 선택하는 단계; 및 각각의 렌더 패스에 대한 선택된 렌더 모드를 프로세서의 그래픽 처리 유닛(GPU)에 표시하는 단계를 포함한다. 일 양태에서, 표시하는 단계는 렌더 패스에 대한 선택된 렌더 모드를 나타내는 명령을 GPU에 대한 명령 스트림으로 삽입하는 단계를 포함한다. 다른 양태에서, 표시하는 단계는 렌더 패스에 대한 선택된 렌더 모드를 나타내는 시작 비닝 커맨드를 렌더 패스에 대응하는 명령 버퍼에 삽입하고 렌더 패스에 대한 명령 스트림에 후속하는 종료 비닝 명령을 삽입하는 단계를 포함한다.
일 양태에서, 렌더 패스의 특성은: 조명, 색상, 후처리, 오클루전 쿼리, 드로 콜 또는 프리미티브의 수가 임계치를 초과하는지 여부, 불규칙 액세스 뷰의 사용, 및 렌더 타깃 경계의 수가 임계치 이상인지 여부 중 적어도 하나를 포함한다. 다른 양태에서, 선택된 렌더 모드는: 거친 빈 렌더링, 프리미티브 배치 기반 빈 렌더링, 배치 기반 빈 렌더링을 활용한 거친 비닝, 및 즉시 모드 렌더링 중 하나를 포함한다. 또 다른 양태에서, 상기 방법은: 렌더 패스의 업데이트된 특성의 표시를 수신하는 단계; 및 선택된 렌더 모드가 렌더 패스의 업데이트된 특성과 호환되지 않는다는 표시를 수신한 것에 응답하여 프레임을 위한 렌더 패스에 대한 렌더 모드의 선택을 업데이트하는 단계를 포함한다. 또 다른 양태에서, 상기 방법은: 렌더 패스에 대한 선택된 렌더 모드를 사용하여 GPU에서 프레임에 대한 렌더 패스를 수행하는 단계를 포함한다.
일부 실시예에서, 방법은 프레임에 대한 복수의 렌더 패스를 프로세서의 그래픽 처리 유닛(GPU)에 대한 대응하는 명령 버퍼로 분류하는 단계; 각각의 렌더 패스의 특성에 기초하여 각각의 렌더 패스에 대한 복수의 렌더 모드 중 하나의 렌더 모드를 선택하는 단계; 및 렌더 패스에 대응하는 명령 버퍼에서 각각의 렌더 패스에 대한 선택된 렌더 모드를 나타내는 단계를 포함한다. 일 양태에서, 표시하는 단계는 렌더 패스에 대한 선택된 렌더 모드를 나타내는 명령을 GPU에 대한 명령 스트림으로 삽입하는 단계를 포함한다. 다른 양태에서, 렌더 패스의 특성은: 조명, 색상, 후처리, 오클루전 쿼리, 드로 콜 또는 프리미티브의 수가 임계치를 초과하는지 여부, 불규칙 액세스 뷰의 사용, 및 렌더 타깃 경계의 수가 임계치 이상인지 여부 중 적어도 하나를 포함한다. 또 다른 양태에서, 선택된 렌더 모드는: 거친 빈 렌더링, 프리미티브 배치 기반 빈 렌더링, 배치 기반 빈 렌더링을 활용한 거친 비닝, 및 즉시 모드 렌더링 중 하나를 포함한다.
일 양태에서, 표시하는 단계는 렌더 패스에 대한 선택된 렌더 모드를 나타내는 시작 비닝 커맨드를 렌더 패스에 대응하는 명령 버퍼에 삽입하고 렌더 패스에 대한 명령 스트림에 후속하는 종료 비닝 명령을 삽입하는 단계를 포함한다. 다른 양태에서, 상기 방법은: 렌더 패스의 업데이트된 특성의 표시를 수신하는 단계; 및 선택된 렌더 모드가 렌더 패스의 업데이트된 특성과 호환되지 않는다는 표시를 수신한 것에 응답하여 프레임을 위한 렌더 패스에 대한 렌더 모드의 선택을 업데이트하는 단계를 포함한다. 다른 양태에서, 상기 방법은: 렌더 패스에 대한 선택된 렌더 모드를 사용하여 GPU에서 프레임에 대한 렌더 패스를 수행하는 단계를 포함한다.
일부 실시예에서, 비일시적 컴퓨터 판독가능 매체는 실행 가능 명령어 세트를 포함하고, 상기 실행 가능 명령어 세트는 적어도 하나의 프로세서를 조작하여 각각의 렌더 패스의 특성에 기초하여 프레임을 위한 복수의 렌더 패스의 각각의 렌더 패스에 대한 복수의 렌더 모드 중 하나의 렌더 모드를 선택하고; 각각의 렌더 패스에 대한 표시된 선택된 렌더 모드에 기초하여 각각의 렌더 패스를 수행하도록 구성된 그래픽 처리 유닛(GPU)에 각각의 렌더 패스에 대한 선택된 렌더 모드를 표시한다. 일 양태에서, 실행가능한 명령어 세트는 적어도 하나의 프로세서를 조작하여: 렌더 패스에 대해 선택된 렌더 모드를 나타내는 시작 비닝 명령을 렌더 패스에 대응하는 명령 버퍼에 삽입하고 렌더 패스에 대한 명령 스트림에 후속하는 종료 비닝 명령을 삽입하여 선택된 렌드 모드를 나타낸다.
일 양태에서, 실행 가능한 명령어 세트는 적어도 하나의 프로세서를 조작하여: 렌더 패스에 대한 선택된 렌더 모드를 나타내는 명령을 GPU에 대한 명령 스트림에 삽입함으로써 선택된 렌더 모드를 표시한다. 일 양태에서, 렌더 패스의 특성은: 조명, 색상, 후처리, 오클루전 쿼리, 드로 콜 또는 프리미티브의 수가 임계치를 초과하는지 여부, 불규칙 액세스 뷰의 사용, 및 렌더 타깃 경계의 수가 임계치 이상인지 여부 중 적어도 하나를 포함한다. 다른 양태에서, 선택된 렌더 모드는: 거친 빈 렌더링, 프리미티브 배치 기반 빈 렌더링, 배치 기반 빈 렌더링을 활용한 거친 비닝, 및 즉시 모드 렌더링 중 하나를 포함한다. 또 다른 양태에서, 실행가능한 명령어 세트는 적어도 하나의 프로세서를 조작하여: 렌더 패스의 업데이트된 특성의 표시를 수신하고; 선택된 렌더 모드가 렌더 패스의 업데이트된 특성과 호환되지 않는다는 표시를 수신하는 것에 응답하여, 프레임을 위한 렌더 패스에 대한 렌더 모드의 선택을 업데이트한다.
일부 실시예에서, 상술한 장치 및 기술은, 도 1 내지 도 5을 참조하여, 상술된 처리 시스템과 같은, 하나 이상의 집적 회로(IC) 장치(또한 집적 회로 패키지 또는 마이크로칩으로 지칭됨)을 포함하는 시스템에서 구현된다. 전자 설계 자동화(EDA) 및 컴퓨터 지원 설계(CAD) 소프트웨어 툴이 이러한 IC 장치의 설계 및 제조에 사용될 수 있다. 이러한 설계 툴은 통상적으로 하나 이상의 소프트웨어 프로그램으로 표현된다. 하나 이상의 소프트웨어 프로그램은 회로부를 제조하도록 제조 시스템을 설계하거나 조정하기 위한 프로세스의 적어도 일부를 수행하기 위해 하나 이상의 IC 장치의 회로부를 나타내는 코드에 대해 동작하도록 컴퓨터 시스템을 조작하기 위한 컴퓨터 시스템에 의해 실행 가능한 코드를 포함한다. 이러한 코드는 명령어, 데이터, 또는 명령어와 데이터의 조합을 포함할 수 있다. 설계 툴 또는 제조 툴을 표현하는 소프트웨어 명령어는 통상적으로 컴퓨팅 시스템이 액세스 가능한 컴퓨터 판독 가능 저장 매체에 저장된다. 마찬가지로, IC 장치의 설계 또는 제조의 하나 이상의 단계를 나타내는 코드는 동일한 컴퓨터 판독 가능 저장 매체 또는 상이한 컴퓨터 판독 가능 저장 매체에 저장되고 그로부터 액세스될 수 있다.
컴퓨터 판독 가능 저장 매체는 명령어 및/또는 데이터를 컴퓨터 시스템에 제공하기 위해 사용 동안 컴퓨터 시스템에 의해 액세스 가능한 임의의 비일시적 저장 매체, 또는 비일시적 저장 매체의 조합을 포함할 수 있다. 그러한 저장 매체는 광 매체(예를 들어, 콤팩트 디스크(CD), 디지털 다기능 디스크(DVD), 블루레이 디스크), 자기 매체(예를 들어, 플로피 디스크, 자기 테이프, 또는 자기 하드 드라이브), 휘발성 메모리(예를 들어, 랜덤 액세스 메모리(RAM) 또는 캐시), 비휘발성 메모리(예를 들어, 판독 전용 메모리(ROM) 또는 플래시 메모리), 또는 미세전자기계 시스템(MEMS)-기반 저장 매체를 포함할 수 있지만, 이로 제한되지 않는다. 컴퓨터 판독 가능 저장 매체는 컴퓨팅 시스템에 내장(예를 들어, 시스템 RAM 또는 ROM)되거나, 컴퓨팅 시스템에 고정적으로 부착(예를 들어, 자기 하드 드라이브)되거나, 컴퓨팅 시스템에 제거 가능하게 부착(예를 들어, 광 디스크 또는 범용 직렬 버스(USB)-기반 플래시 메모리)되거나, 유선 또는 무선 네트워크를 통해 컴퓨터 시스템에 결합(예를 들어, 네트워크 액세스 가능 저장소(NAS))될 수 있다.
일부 실시예에서, 전술된 기술의 특정 양태는 소프트웨어를 실행하는 처리 시스템의 하나 이상의 프로세서에 의해 구현될 수 있다. 소프트웨어는 비일시적 컴퓨터 판독 가능 저장 매체에 저장되거나 달리 유형적으로 구현된 실행 가능 명령어의 하나 이상의 세트를 포함한다. 소프트웨어는, 하나 이상의 프로세서에 의해 실행될 때, 전술된 기술의 하나 이상의 태양을 수행하도록 하나 이상의 프로세서를 조작하는 명령어 및 특정 데이터를 포함할 수 있다. 비일시적 컴퓨터 판독 가능 저장 매체는, 예를 들어, 자기 또는 광 디스크 저장 장치, 솔리드 스테이트 저장 장치, 예를 들어 플래시 메모리, 캐시, 랜덤 액세스 메모리(RAM) 또는 다른 비휘발성 메모리 장치 또는 장치들 등을 포함할 수 있다. 비일시적 컴퓨터 판독 가능 저장 매체에 저장된 실행 가능 명령어는 하나 이상의 프로세서에 의해 해석되거나 달리 실행 가능한 소스 코드, 어셈블리 언어 코드, 객체 코드, 또는 다른 명령어 포맷일 수 있다.
일반적인 설명에서 전술된 액티비티 또는 요소 모두가 요구되는 것은 아니고, 특정 액티비티 또는 장치의 일부는 요구되지 않을 수 있고, 설명된 것에 더하여, 하나 이상의 추가 액티비티가 수행되거나 하나 이상의 추가 요소가 포함될 수 있다는 점에 유의한다. 또 추가로, 액티비티가 열거된 순서는 반드시 그들이 수행되는 순서는 아니다. 또한, 특정 실시예를 참조하여 개념이 설명되었다. 그러나, 당업자는 하기의 청구범위에 기재된 바와 같은 본 개시의 범위로부터 벗어남이 없이 다양한 변형 및 변경이 이루어질 수 있다는 것을 인식한다. 따라서, 명세서 및 도면은 제한적인 의미보다는 예시적인 의미로 간주되어야 하며, 모든 그러한 변형은 본 개시의 범위 내에 포함되도록 의도된다.
이익, 다른 이점, 및 문제에 대한 해결책이 특정 실시예과 관련하여 위에서 설명되었다. 그러나, 이익, 이점, 문제에 대한 해결책, 그리고 임의의 이익, 이점, 또는 해결책이 발생되게 하거나 더 명확해지게 할 수 있는 임의의 특징부(들)가 임의의 또는 모든 청구항의 중요한, 요구되는, 또는 본질적인 특징부로서 해석되어서는 안 된다. 더욱이, 상기에 개시된 특정 실시예는 단지 예시적인 것인데, 왜냐하면 개시된 주제는 본 명세서에서의 교시 내용의 이익을 갖는 당업자에게 명백한, 상이하지만 동등한 방식으로 수정 및 실시될 수 있기 때문이다. 하기의 청구범위에 기재된 바 이외에, 본 명세서에서 제시된 구성 또는 설계의 상세 사항으로의 제한이 의도되지 않는다. 따라서 상기에 개시된 특정 실시예는 변경되거나 수정될 수 있고 모든 그러한 변형은 개시된 주제의 범위 내에 있는 것으로 고려된다는 것이 명백하다. 따라서, 본 명세서에서 추구되는 보호는 아래의 청구범위에 기재된 바와 같다.

Claims (20)

  1. 방법으로서,
    프레임을 위한 복수의 렌더 패스의 각각의 렌더 패스에 대해, 상기 렌더 패스의 특성에 기초하여 복수의 렌더 모드 중 하나의 렌더 모드를 선택하는 단계; 및
    프로세서의 그래픽 처리 유닛(GPU)에 각각의 렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 나타내는 단계는 렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 명령을 상기 GPU에 대한 명령 스트림에 삽입하는 단계를 포함하는, 방법.
  3. 제1항에 있어서, 나타내는 단계는 렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 시작 비닝 명령을 상기 렌더 패스에 대응하는 명령 버퍼에 삽입하고 상기 렌더 패스에 대한 명령 스트림에 후속하는 종료 비닝 명령을 삽입하는 단계를 포함하는, 방법.
  4. 제1항에 있어서, 상기 렌더 패스의 특성은: 조명, 색상, 후처리, 오클루전 쿼리, 드로 콜 또는 프리미티브의 수가 임계치를 초과하는지 여부, 불규칙 액세스 뷰의 사용, 및 렌더 타깃 경계의 수가 임계치 이상인지 여부 중 적어도 하나를 포함하는, 방법.
  5. 제4항에 있어서, 상기 선택된 렌더 모드는: 거친 빈 렌더링, 프리미티브 배치 기반 빈 렌더링, 배치 기반 빈 렌더링을 활용한 거친 비닝, 및 즉시 모드 렌더링 중 하나를 포함하는, 방법.
  6. 제1항에 있어서,
    상기 렌더 패스의 업데이트된 특성의 표시를 수신하는 단계; 및
    상기 선택된 렌더 모드가 상기 렌더 패스의 업데이트된 특성과 호환되지 않는다는 표시를 수신하는 것에 응답하여 상기 프레임을 위한 렌더 패스에 대한 렌더 모드의 상기 선택을 업데이트하는 단계를 더 포함하는, 방법.
  7. 제1항에 있어서,
    상기 렌더 패스에 대한 상기 선택된 렌더 모드를 사용하여 상기 GPU에서 프레임에 대한 렌더 패스를 수행하는 단계를 더 포함하는, 방법.
  8. 방법으로서,
    프레임에 대한 복수의 렌더 패스를 프로세서의 그래픽 처리 유닛(GPU)에 대한 대응하는 명령 버퍼로 분류하는 단계;
    각각의 렌더 패스의 특성에 기초하여 각각의 렌더 패스에 대한 복수의 렌더 모드 중 하나의 렌더 모드를 선택하는 단계; 및
    상기 렌더 패스에 대응하는 상기 명령 버퍼에서 각각의 렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 단계를 포함하는, 방법.
  9. 제8항에 있어서, 나타내는 단계는 렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 명령을 상기 GPU에 대한 명령 스트림에 삽입하는 단계를 포함하는, 방법.
  10. 제8항에 있어서, 상기 렌더 패스의 특성은: 조명, 색상, 후처리, 오클루전 쿼리, 드로 콜 또는 프리미티브의 수가 임계치를 초과하는지 여부, 불규칙 액세스 뷰의 사용, 및 렌더 타깃 경계의 수가 임계치 이상인지 여부 중 적어도 하나를 포함하는, 방법.
  11. 제10항에 있어서, 상기 선택된 렌더 모드는: 거친 빈 렌더링, 프리미티브 배치 기반 빈 렌더링, 배치 기반 빈 렌더링을 활용한 거친 비닝, 및 즉시 모드 렌더링 중 하나를 포함하는, 방법.
  12. 제8항에 있어서, 나타내는 단계는 렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 시작 비닝 명령을 상기 렌더 패스에 대응하는 명령 버퍼에 삽입하고 상기 렌더 패스에 대한 명령 스트림에 후속하는 종료 비닝 명령을 삽입하는 단계를 포함하는, 방법.
  13. 제8항에 있어서,
    상기 렌더 패스의 업데이트된 특성의 표시를 수신하는 단계; 및
    상기 선택된 렌더 모드가 상기 렌더 패스의 업데이트된 특성과 호환되지 않는다는 표시를 수신하는 것에 응답하여 상기 프레임을 위한 렌더 패스에 대한 렌더 모드의 상기 선택을 업데이트하는 단계를 더 포함하는, 방법.
  14. 제8항에 있어서,
    상기 렌더 패스에 대한 상기 선택된 렌더 모드를 사용하여 상기 GPU에서 프레임에 대한 렌더 패스를 수행하는 단계를 더 포함하는, 방법.
  15. 실행 가능 명령어 세트를 포함하는 비일시적 컴퓨터 판독가능 매체로서, 상기 실행 가능 명령어 세트는 적어도 하나의 프로세서를 조작하여:
    각각의 렌더 패스의 특성에 기초하여 프레임을 위한 복수의 렌더 패스의 각각의 렌더 패스에 대한 복수의 렌더 모드 중 하나의 렌더 모드를 선택하고;
    각각의 렌더 패스에 대한 상기 표시된 선택된 렌더 모드에 기초하여 각각의 렌더 패스를 수행하도록 구성된 그래픽 처리 유닛(GPU)에 각각의 렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는, 비일시적 컴퓨터 판독가능 매체.
  16. 제15항에 있어서, 상기 실행 가능 명령어 세트는 상기 적어도 하나의 프로세서를 조작하여:
    렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 시작 비닝 명령을 상기 렌더 패스에 대응하는 명령 버퍼에 삽입하고 상기 렌더 패스에 대한 명령 스트림에 후속하는 종료 비닝 명령을 삽입하여 상기 선택된 렌더 모드를 나타내는, 컴퓨터 판독가능 매체.
  17. 제15항에 있어서, 상기 실행 가능 명령어 세트는 상기 적어도 하나의 프로세서를 조작하여:
    렌더 패스에 대한 상기 선택된 렌더 모드를 나타내는 명령을 상기 GPU에 대한 명령 스트림에 삽입함으로써 상기 선택된 렌더 모드를 나타내는, 컴퓨터 판독가능 매체.
  18. 제15항에 있어서, 상기 렌더 패스의 특성은: 조명, 색상, 후처리, 오클루전 쿼리, 드로 콜 또는 프리미티브의 수가 임계치를 초과하는지 여부, 불규칙 액세스 뷰의 사용, 및 렌더 타깃 경계의 수가 임계치 이상인지 여부 중 적어도 하나를 포함하는, 컴퓨터 판독가능 매체.
  19. 제18항에 있어서, 상기 선택된 렌더 모드는: 거친 빈 렌더링, 프리미티브 배치 기반 빈 렌더링, 배치 기반 빈 렌더링을 활용한 거친 비닝, 및 즉시 모드 렌더링 중 하나를 포함하는, 컴퓨터 판독가능 매체.
  20. 제15항에 있어서, 상기 실행 가능 명령어 세트는 상기 적어도 하나의 프로세서를 조작하여:
    상기 렌더 패스의 업데이트된 특성의 표시를 수신하고;
    상기 선택된 렌더 모드가 상기 렌더 패스의 업데이트된 특성과 호환되지 않는다는 표시를 수신하는 것에 응답하여 상기 프레임을 위한 렌더 패스에 대한 렌더 모드의 상기 선택을 업데이트하는, 컴퓨터 판독가능 매체.
KR1020227031430A 2020-03-10 2021-03-09 그래픽 처리 유닛 렌더 모드 선택 시스템 KR20220151171A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202062987469P 2020-03-10 2020-03-10
US62/987,469 2020-03-10
US17/008,292 US20210287418A1 (en) 2020-03-10 2020-08-31 Graphics processing unit render mode selection system
US17/008,292 2020-08-31
PCT/US2021/021550 WO2021183545A1 (en) 2020-03-10 2021-03-09 Graphics processing unit render mode selection system

Publications (1)

Publication Number Publication Date
KR20220151171A true KR20220151171A (ko) 2022-11-14

Family

ID=77664817

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227031430A KR20220151171A (ko) 2020-03-10 2021-03-09 그래픽 처리 유닛 렌더 모드 선택 시스템

Country Status (6)

Country Link
US (1) US20210287418A1 (ko)
EP (1) EP4118624A4 (ko)
JP (1) JP2023516934A (ko)
KR (1) KR20220151171A (ko)
CN (1) CN115315727A (ko)
WO (1) WO2021183545A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230377086A1 (en) * 2022-05-18 2023-11-23 Advanced Micro Devices, Inc. Pipeline delay elimination with parallel two level primitive batch binning
CN116703689B (zh) * 2022-09-06 2024-03-29 荣耀终端有限公司 一种着色器程序的生成方法、装置和电子设备
CN116894906A (zh) * 2023-09-11 2023-10-17 瀚博半导体(上海)有限公司 图形渲染方法和处理器硬件架构

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9547930B2 (en) * 2011-11-30 2017-01-17 Qualcomm Incorporated Hardware switching between direct rendering and binning in graphics processing
US9928565B2 (en) * 2014-04-21 2018-03-27 Qualcomm Incorporated Flex rendering based on a render target in graphics processing
US9799088B2 (en) * 2014-08-21 2017-10-24 Qualcomm Incorporated Render target command reordering in graphics processing
US9607352B2 (en) * 2014-12-03 2017-03-28 Intel Corporation Prediction based primitive sorting for tile based rendering
US11416282B2 (en) * 2015-05-26 2022-08-16 Blaize, Inc. Configurable scheduler in a graph streaming processing system
KR102381945B1 (ko) * 2015-11-18 2022-04-01 삼성전자주식회사 그래픽 프로세싱 장치 및 그래픽 프로세싱 장치에서 그래픽스 파이프라인을 수행하는 방법
KR102651126B1 (ko) * 2016-11-28 2024-03-26 삼성전자주식회사 그래픽 프로세싱 장치 및 그래픽스 파이프라인에서 텍스처를 처리하는 방법

Also Published As

Publication number Publication date
CN115315727A (zh) 2022-11-08
JP2023516934A (ja) 2023-04-21
WO2021183545A1 (en) 2021-09-16
EP4118624A1 (en) 2023-01-18
EP4118624A4 (en) 2024-03-20
US20210287418A1 (en) 2021-09-16

Similar Documents

Publication Publication Date Title
US9799088B2 (en) Render target command reordering in graphics processing
JP4450853B2 (ja) 負荷分散
EP2939208B1 (en) Sprite graphics rendering system
KR20220151171A (ko) 그래픽 처리 유닛 렌더 모드 선택 시스템
US10032308B2 (en) Culling objects from a 3-D graphics pipeline using hierarchical Z buffers
EP2780891B1 (en) Tessellation in tile-based rendering
US8659589B2 (en) Leveraging graphics processors to optimize rendering 2-D objects
KR102651126B1 (ko) 그래픽 프로세싱 장치 및 그래픽스 파이프라인에서 텍스처를 처리하는 방법
US11532066B2 (en) Reduced bandwidth tessellation factors
US9530241B2 (en) Clipping of graphics primitives
US11468630B2 (en) Rendering scenes using a combination of raytracing and rasterization
US10198788B2 (en) Method and system of temporally asynchronous shading decoupled from rasterization
US10558499B2 (en) Wave creation control with dynamic resource allocation
US20190295214A1 (en) Method and system of temporally asynchronous shading decoupled from rasterization
US11468633B1 (en) Methods and systems for tile-based graphics processing
US20230401667A1 (en) Graphics processing systems
US20230205698A1 (en) Cache blocking for dispatches
US20230195626A1 (en) Variable dispatch walk for successive cache accesses
JP2023530309A (ja) ビニングハードウェアにおけるきめ細かなリプレイ制御