KR20130038903A - 알고리즘의 고유 병렬화의 정량화 및 분석 방법 - Google Patents
알고리즘의 고유 병렬화의 정량화 및 분석 방법 Download PDFInfo
- Publication number
- KR20130038903A KR20130038903A KR1020137001820A KR20137001820A KR20130038903A KR 20130038903 A KR20130038903 A KR 20130038903A KR 1020137001820 A KR1020137001820 A KR 1020137001820A KR 20137001820 A KR20137001820 A KR 20137001820A KR 20130038903 A KR20130038903 A KR 20130038903A
- Authority
- KR
- South Korea
- Prior art keywords
- parallelism
- algorithm
- computer
- information
- setting
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/45—Exploiting coarse grain parallelism in compilation, i.e. parallelism between groups of instructions
- G06F8/456—Parallelism detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline, look ahead
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
Abstract
알고리즘의 고유 병렬화를 정량화 및 분석하는 방법에 있어서, 상기 방법은 컴퓨터에 의해 실행되도록 적용되고, 다수의 작동 세트 수단에 의해 알고리즘을 표현하도록 상기 컴퓨터를 설정하는 단계; b)상기 작동 세트에 따라 라플라시안 행렬을 얻도록 상기 컴퓨터를 설정하는 단계; c)상기 라플라시안 행렬의 고유값 및 고유벡터를 계산하도록 컴퓨터를 설정하는 단계; 및 상기 라플라시안 행렬의 고유값 및 고유벡터에 따라 알고리즘의 고유 병렬화와 관련된 정보세트를 얻을 수 있도록 상기 컴퓨터를 설정하는 단계;로 구성되는 것을 특징으로 하는 알고리즘의 고유 병렬화를 정량화 및 분석하는 방법
Description
본 발명은 알고리즘의 병렬화를 정량화하고 분석하는 방법에 관한 것이다. 특히, 알고리즘의 고유 병렬화를 정량화하고 분석하는 방법에 관한 것이다.
G. M. Amdahl는 알고리즘의 순차적 부분의 비율에 따른 알고리즘의 한 병렬화 방법을 소개한 바 있다(“대용량 컴퓨팅능력 처리방법에 관한 단일 처리기의 속도(Validity of single-processor approach to achieving large-scale computing capability)” Proc. of AFIPS Conference, 483-485 페이지, 1967년). Amdahl 방법의 단점은 이러한 방법을 사용하여 얻어진 상기 알고리즘의 별렬화의 값(degree of parallelism)이 상기 방법을 수행하는 타겟 플랫폼(target platform)에 의존한다는 것이다. 그리고 상기 알고리즘 그 자체에 반드시 의존하는 것은 아니다. 그러므로, Amdahl 방법을 사용하여 얻어진 병렬화의 값은 상기 알고리즘과는 관련이 없게 되고, 타겟 플랫폼에 의해 편향적이게 된다.
A. Prihozhy 등은 알고리즘의 복잡성과 임계경로길이(critical path length)사이의 비율에 기초하여 알고리즘의 병렬 가능성을 평가하는 한 방법을 제안한 바 있다(“효율적인 멀티미디어 실행을 위한 병렬가능성의 평가: 알고리즘 임계경로의 동적평가(Evaluation of the parallelization potential for efficient multimedia implementations: dynamic evaluation of algorithm critical path,)” IEEE Trans. on Circuits and Systems for Video Technology, 593-608 페이지, Vol. 15, No. 5, 2005년 5월).
본 발명의 목적은 타겟 하드웨어 및/또는 소프트웨어 플랫폼에 치우치지 않는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법을 제공하는 것이다.
알고리즘의 고유 병렬화를 정량화 및 분석하는 본 발명의 방법은 컴퓨터에 의해 실행되고, 다음 단계로 이루어진다:
a) 다수의 작동 세트 수단에 의해 알고리즘을 표현하도록 컴퓨터를 설정하는 단계;
b)상기 작동 세트에 따라 라플라시안 행렬(Laplacian matrix)을 얻도록 컴퓨터를 설정하는 단계;
c)라플라시안 행렬의 고유값 및 고유벡터를 계산하도록 컴퓨터를 설정하는 단계; 및
d)라플라시안 행렬의 고유값 및 고유벡터에 따라 알고리즘의 고유 병렬화와 관련된 정보세트를 얻을 수 있도록 컴퓨터를 설정하는 단계.
본 발명의 다른 특징과 이점은 도면과 관련하여 이하의 바람직한 실시예의 상세한 설명에서 명확히 설명된다.
도 1은 본 발명에 관한 알고리즘의 고유 병렬화를 분석하고 정량화하는 방법의 바람직한 실시예를 나타내는 흐름도이다.
도 2는 대표 알고리즘과 관련한 데이터흐름정보(dataflow information)를 나타내는 계통도(schematic diagram)이다.
도 3은 데이터 흐름 그래프의 대표 세트의 계통도이다.
도 4는 4×4 이산 코사인 변환 알고리즘(discrete cosine transform algorithm)의 작동세트를 나타낸 계통도이다.
도 5는 디펜던시 뎁스(dependency depth)가 6인 것에 상응하여 고유 병렬의 대표 구성을 나타내는 계통도이다.
도 6은 디펜던시 뎁스가 5인 것에 상응하여 고유 병렬의 대표 구성을 나타내는 계통도이다.
도 7은 디펜던시 뎁스가 3인 것에 상응하여 고유 병렬의 대표 구성을 나타내는 계통도이다.
도 1은 본 발명에 관한 알고리즘의 고유 병렬화를 분석하고 정량화하는 방법의 바람직한 실시예를 나타내는 흐름도이다.
도 2는 대표 알고리즘과 관련한 데이터흐름정보(dataflow information)를 나타내는 계통도(schematic diagram)이다.
도 3은 데이터 흐름 그래프의 대표 세트의 계통도이다.
도 4는 4×4 이산 코사인 변환 알고리즘(discrete cosine transform algorithm)의 작동세트를 나타낸 계통도이다.
도 5는 디펜던시 뎁스(dependency depth)가 6인 것에 상응하여 고유 병렬의 대표 구성을 나타내는 계통도이다.
도 6은 디펜던시 뎁스가 5인 것에 상응하여 고유 병렬의 대표 구성을 나타내는 계통도이다.
도 7은 디펜던시 뎁스가 3인 것에 상응하여 고유 병렬의 대표 구성을 나타내는 계통도이다.
알고리즘의 고유 병렬화를 정량화 및 분석하는 본 발명의 방법은 컴퓨터에 의해 실행되고, 다음 단계로 이루어진다:
a) 다수의 작동 세트 수단에 의해 알고리즘을 표현하도록 컴퓨터를 설정하는 단계;
b)상기 작동 세트에 따라 라플라시안 행렬(Laplacian matrix)을 얻도록 컴퓨터를 설정하는 단계;
c)라플라시안 행렬의 고유값 및 고유벡터를 계산하도록 컴퓨터를 설정하는 단계; 및
d)라플라시안 행렬의 고유값 및 고유벡터에 따라 알고리즘의 고유 병렬화와 관련된 정보세트를 얻을 수 있도록 컴퓨터를 설정하는 단계.
도 1과 관련하여, 알고리즘의 고유 병렬화를 평가하기 위한 본 발명에 관한 방법의 바람직한 실시예는 컴퓨터에 의해 실시되는 것이 적합하고, 이하에 따르는 단계를 포함한다. 고유 병렬화의 값은 소프트웨어 및 하드웨어의 설정과 디자인을 고려하지 않고 알고리즘 그 자체의 병렬화의 값을 나타낸다. 즉, 본 발명에 따른 방법은 알고리즘을 분석하는데 사용될 때, 소프트웨어 및 하드웨어에 의해 제한되지 않는다.
단계 11에서, 컴퓨터는 다수의 작동세트 수단에 의해 알고리즘을 나타내도록 설정된다. 각각의 작동세트는 방정식, 프로그램 코드(program code), 흐름도(flow chart), 또는 알고리즘을 표현하는 다른 형태가 될 수 있다. 이하의 예에서, 상기 알고리즘은 3개의 작동세트 O1, O2 및 O3이 아래와 같이 표현된다.
O1=A1+B1+C1+D1,
O2=A2+B2+C2,and
O3=A3+B3+C3.
단계 12는 상기 작동세트에 따라 라플라시안 행렬(Ld)을 얻도록 컴퓨터를 설정하게 되고, 이하의 보조 단계를 포함한다.
보조단계 121에서, 상기 작동세트에 따라, 컴퓨터는 알고리즘과 관련된 데이터흐름정보를 얻도록 설정이 된다. 도 2에 나타나 있는 것처럼, 실시예의 작동세트와 관련된 데이터 흐름정보는 아래와 같이 표현될 수 있다.
Data1=A1+B1
Data2=A2+B2
Data3=A3+B3
Data4=Data1+Data7
Data5=Data2+C2
Data6=Data3+C3
Data7=C1+D1
보조단계 122에서, 컴퓨터는 데이터흐름정보에 따라 데이터흐름 그래프를 얻도록 설정된다. 이 데이터흐름 그래프는 알고리즘의 작동을 나타내는 다수의 정점(vertex), 및 상기 2개의 정점사이에 상호접속과 알고리즘에서 데이터의 소스(source) 및 대상(destination)을 나타내는 다수의 방향간선(directed edge)으로 구성된다. 도 2에 도시된 데이터흐름정보와 관련하여, 작동기호 V1 내지 V7(즉, 정점(vertex))은 추가 작동 대신에 사용되고, 화살표(즉, 방향간선(directed edge) )는 도 3에서 나타나 있는 데이터흐름 그래프를 얻도록 데이터의 소스(source)와 대상(destination)을 나타낸다. 특히, 작동기호 V1은 A1+B1에 관한 추가작동을 나타내고, 작동기호 V2는 A2+B2에 관한 추가작동을 나타내고, 작동기호 V3는 A3+B3에 관한 추가작동을 나타내고, 작동기호 V4는 Data1+Data7에 관한 추가작동을 나타내고, 작동기호 V5는 Data2+C2에 관한 추가작동을 나타내고, 작동기호 V6은 Data3+C3에 관한 추가작동을 나타내고, 작동기호 V7은 D1+C1에 관한 추가작동을 나타낸다.
도 3에 도시된 데이터흐름 그래프에서, 작동기호 V4는 작동기호 V1 및 V7 에 종속하는 것으로 인식될 수 있다. 유사하게 작동기호 V5는 작동기호 V2에 종속되고, 작동기호 V6는 V3에 종속되고, 작동기호 V4, V5 및 V6은 서로 상호간에 독립적이다.
보조단계 123에서, 컴퓨터는 데이터흐름 그래프에 따른 라플라시안 행렬(Ld)을 얻도록 설정된다. 라플라시안 행렬(Ld)에서, i차 대각선 성분은 작동기호 Vi에 연결되는 다수의 작동기호를 나타내고, 비대각 성분은 2개의 작동기호가 연결된 것을 나타낸다. 그러므로, 라플라시안 행렬(Ld)은 명확하게 소형 선형대수식 형태에 의한 데이터흐름 그래프를 표현할 수 있다. 도 3에 도시된 데이터흐름 그래프의 세트는 아래와 같이 표시될 수 있다.
라플라시안 행렬(Ld)은 작동기호 V1 내지 V7 사이의 연결성을 나타내고, 제1열에서 제7열은 각각 작동기호 V1 내지 V7을 나타낸다. 예를 들어, 제1열에서, 작동기호 V1은 작동기호 V4에 연결이 되어, 행렬 요소(1,4)는 -1이 된다.
단계 13에서, 컴퓨터는 라플라시안 행렬(Ld)의 고유값(λ) 및 고유벡터(Xd)를 계산하도록 설정이 된다. 상기 예에서 얻어진 라플라시안 행렬(Ld)과 관련하여, 고유값(λ) 및 고유벡터(Xd)는 아래와 같다.
단계 14에서, 컴퓨터는 라플라시안 행렬(Ld)의 고유값(λ) 및 고유벡터(Xd)에 따라 알고리즘의 고유 병렬화와 관련된 정보세트를 얻도록 설정된다. 고유 병렬화와 관련된 정보세트는 서로 독립적이어서 병렬화를 수행할 수 있는 작동세트의 독립변수를 인식할 수 있도록 엄격한 방식으로 정의된다. 엄밀한 병렬화와 관련된 정보세트는 알고리즘의 작동세트의 다수의 독립변수 및 각각 독립세트와 관련하여 엄밀한 병렬화 구성 세트를 나타내는 엄밀한 병렬화 값을 포함한다.
F. R. K. Chung에 의해 소개된 스펙트럼 그래프이론(spectral graph theory)에 따르면(Regional Conferences Series in Mathematics, No. 92, 1997년), 그래프의 다수의 연결된 요소는 0과 동일한 라플라시안 행렬의 다수의 고유값과 동일하다. 따라서 알고리즘 내에 있는 엄밀한 병렬화의 값은 0과 동일한 다수의 고유값(λ)과 동일하다. 더욱이, 스펙트럼 그래프이론에 따라 엄밀한 병렬화의 구성은 0과 동일한 고유값(λ)과 관련된 고유벡터(Xd)에 따라 식별될 수 있다.
상기 예에서, 데이터흐름 그래프 세트는 3개의 독립 작동세트로 구성되는 것을 알 수 있다. 왜냐하면, 0과 동일한 3개의 라플라시안 고유값이 존재하기 때문이다. 따라서, 전형적인 알고리즘에 나타나는 엄밀한 병렬화의 값은 3에 해당한다. 그 다음에, 고유벡터(Xd)의 제1, 제2, 및 제3 벡터는 0과 동일한 고유값(λ)과 관련된다. 고유벡터의 제1 벡터를 관찰하면, 작동기호 V1, V4 및 V7과 관련된 값은 0이 아닌 것이 명확하다. 즉, 작동기호 V1, V4 및 V7는 종속적이고 데이터흐름 그래프의 연결형태(V1-V4-V7)를 이룬다. 유사하게, 고유벡터(Xd)의 제2 및 제3의 벡터가 0과 동일한 고유값(λ)과 관련이 되는 것에서, 작동기호 V2, V5 및 작동기호 V3, V6은 종속적이고 각각 데이터흐름 그래프의 남아있는 2개의 연결형태(V2-V5 및 V3-V6)를 형성하는 것을 알 수 있다. 그러므로, 3과 동일한 엄밀한 병렬화의 값, 및 그래프의 형태(도 3에 표시), 테이블, 방정식, 또는 프로그램 코드의 형태로 표현될 수 있는 엄밀한 병렬화의 구성을 얻도록 컴퓨터가 설정된다.
단계 15에서, 컴퓨터는 엄밀한 병렬화 및 알고리즘의 다수의 디펜던시 뎁스(dependency depth)에서 적어도 하나와 관련된 정보세트에 따라, 알고리즘의 멀티그레인 병렬화(multigrain parallelism)에 관련된 다수의 정보 세트를 얻도록 설정이 된다. 멀티그레인 병렬화와 관련된 정보세트는 독립 작동세트에 담겨져 있는 모든 가능한 광의의 병렬화와 관련된 정보세트를 포함한다.
알고리즘의 디펜던시 뎁스는 상기 알고리즘의 처리하는데 필수적인 관련된 일련의 단계를 나타내야 하므로, 그 알고리즘의 잠재적 병렬화로 보완을 한다. 따라서, 알고리즘의 다른 고유 병렬화와 관련된 정보는 다른 디펜던시 뎁스에 기초하여 얻을 수 있다. 특히, 엄밀한 병렬화와 관련된 정보는 이 알고리즘의 상기 디펜던시 뎁스의 최대값에 상응하는 알고리즘의 고유 병렬화와 관련된 정보이다. 그리고, 광의의 병렬화와 관련된 정보는 디펜던시 뎁스의 최소값에 상응하는 그 알고리즘의 고유 병렬화와 관련된 정보이다.
예를 들어, 상기 언급된 알고리즘은 2개의 다른 엄밀한 병렬화 구성을 포함한다. 즉, V1-V4-V7 및 V2-V5(V3-V6은 V2-V5와 유사하고, 동일한 구성으로 볼 수 있다)이다. 상기 엄밀한 병렬화(V1-V4-V7)와 관련하여, 작동기호 V1 및 V7은 서로 독립적이다. 즉, 작동기호 V1 및 V7은 병렬적으로 처리될 수 있다. 그러므로, 상기 알고리즘의 광의의 병렬화와 관련된 정보세트는 4와 동일한 광의의 별렬화의 값을 포함하고, 광의의 병렬화의 구성은 엄밀한 병렬화의 구성과 유사하다.
이러한 실시예의 방법에 따라, 상기 언급된 알고리즘의 광의의 별렬화의 값은 4이다. 이러한 알고리즘을 수행하기 위해 처리요소는 7개의 처리사이클을 필요로 한다. 왜냐하면, 이 알고리즘은 7개의 작동기호 V1-V7를 포함하기 때문이다. 엄밀한 병렬화의 값이 3인 경우에는, 알고리즘을 수행하기 위해 3개의 처리성분을 사용하는 것은 3개의 처리 사이클로 처리된다. 광의의 병렬화의 값이 4인 경우에는, 알고리즘을 수행하기 위해 4개의 처리성분을 사용하는 것은 2개의 처리 사이클로 처리된다. 나아가, 적어도 2개의 처리사이클이 더 많은 처리성분에 사용될지라도, 알고리즘을 처리하는데 필요로 하는 것으로 알려져 있다. 그러므로, 알고리즘을 수행하는데 사용되는 처리성분에 대한 적절한 개수는 이러한 실시예의 방법에 따라 얻어질 수 있다.
하나의 예로서, 4x4 이산 코사인 변환(DCT) 실행하는 경우, DCT 알고리즘의 작동세트는 도 4에 나타나 있는 것처럼 데이터흐름 그래프에 의해 표현된다. 4x4 DCT는 해당 기술분야에 널리 알려져 있기 때문에, 이하에서는 상세한 설명은 생략한다. 도 4에서, 4x4 DCT 알고리즘의 디펜던시 뎁스의 최대값이 6인 것을 알 수 있다. 디펜던시 뎁스의 최대값(즉, 6)과 관련하여, 이 알고리즘의 엄밀한 병렬화의 구성은 도 5에 나타나 있는 바와 같이 얻어질 수 있고, 이러한 실시예의 방법에 따라 이 알고리즘의 엄밀한 병렬화의 값은 4이다. 디펜던시 뎁스의 하나가 5인 4x4 DCT 알고리즘의 고유 병렬화를 분석할 때, 이 알고리즘의 고유 병렬화의 구성은 도 6에 나타나 있는 바와 같이 얻을 수 있고, 고유 병렬화의 값은 8과 같다. 나아가, 디펜던시 뎁스의 하나가 3인 4x4 DCT 알고리즘의 고유 병렬화를 분석할 때, 이 알고리즘의 고유 병렬화의 구성은 도 7에 나타나 있는 바와 같이 얻을 수 있고, 고유 병렬화의 값은 16과 같다.
요약하자면, 본 발명에 따른 방법은 알고리즘의 고유 병렬화를 평가하는데 사용될 수 있다. 본 발명이 가장 실질적이고 바람직한 실시예를 고려하여 설명되었다 할지라도 본 발명은 명세서에 개시된 실시예에 한정되지 않고, 모든 변형 및 그에 동등한 내용을 포함하도록 가장 광의의 의미와 범위 내에서 다양한 방식에 적용될 수 있다.
Claims (11)
- 알고리즘의 고유 병렬화를 정량화 및 분석하는 방법에 있어서, 상기 방법은 컴퓨터에 의해 실행되도록 적용되고,
a) 다수의 작동 세트 수단에 의해 알고리즘을 표현하도록 상기 컴퓨터를 설정하는 단계;
b)상기 작동 세트에 따라 라플라시안 행렬을 얻도록 상기 컴퓨터를 설정하는 단계;
c)상기 라플라시안 행렬의 고유값 및 고유벡터를 계산하도록 컴퓨터를 설정하는 단계; 및
d)상기 라플라시안 행렬의 고유값(固有値) 및 고유벡터에 따라 알고리즘의 고유 병렬화와 관련된 정보세트를 얻을 수 있도록 상기 컴퓨터를 설정하는 단계;
로 구성되는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법
- 제1항에 있어서, 상기 단계 b)는,
b1)상기 작동세트에 따라, 상기 알고리즘과 관련하여 데이터흐름정보를 얻도록 상기 컴퓨터를 설정하는 단계;
b2)상기 데이터흐름정보에 따라, 상기 알고리즘에서 작동을 나타내는 다수의 정점 및 상응하는 상기 2개의 상기 정점 사이에 상호연결을 나타내고 상기 알고리즘에서 데이터의 소스 및 대상을 나타내는 다수의 방향간선으로 구성된 데이터흐름 그래프를 얻도록 상기 컴퓨터를 설정하는 단계; 및
b3) 상기 데이터흐름 그래프에 따라 상기 라플라시안 행렬을 얻도록 컴퓨터를 설정하는 단계 ;
의 보조단계를 포함하는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제1항에 있어서, 상기 단계 d)는,
d1)상기 라플라시안 행렬의 상기 고유값과 상기 고유벡터에 따라, 상기 알고리즘의 엄밀한 병렬화와 관련된 정보세트를 얻도록 컴퓨터를 설정하는 단계; 및
d2)상기 알고리즘의 엄밀한 병렬화 및 다수의 디펜던시 뎁스의 적어도 하나와 관련된 정보세트에 따라 상기 알고리즘의 멀티그레인 병렬화와 관련된 정보 세트를 얻도록 컴퓨터를 설정하는 단계;
의 보조단계를 포함하는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제3항에 있어서, 엄밀한 병렬화와 관련된 상기 정보세트는 상기 알고리즘의 상기 작동세트의 다수의 독립세트 및 상기 작동세트와 관련한 엄밀한 병렬화 구성의 세트를 각각 나타내는 엄밀한 병렬화의 값을 포함하는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제3항에 있어서, 보조단계 d2)는,
컴퓨터가 각각 엄밀한 병렬화 및 상기 디펜던시 뎁스와 관련된 상기 정보세트에 따라 상기 알고리즘의 멀티그레인 병렬화와 관련된 다수의 정보세트를 얻도록 설정된 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제5항에 있어서, 멀티그레인 병렬화와 관련된 각각의 상기 정보세트는 멀티그레인 병렬화의 값 및 멀티그레인 병렬화 구성세트를 포함하는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제3항에 있어서, 멀티그레인 병렬화와 관련된 정보세트가 엄밀한 병렬화 및 상기 디펜던시 뎁스의 최소한 하나와 관련된 상기 정보세트에 따라 얻어지는 상기 알고리즘의 광의의 병렬화와 관련된 정보세트를 포함하는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제7항에 있어서, 광의의 병렬화와 관련된 상기 정보세트가 상기 알고리즘의 상기 작동세트의 독립세트 및 광의의 병렬화 구성 세트를 가지고 있는 모든 가능한 병렬화를 특징으로 하는 광의의 병렬화의 값을 포함하는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제3항에 있어서, 보조단계 d1)은,
엄밀한 병렬화의 값이 스펙트럼 그래프이론에 따라 값이 0인 다수의 상기 고유값과 동일한 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제3항에 있어서, 멀티그레인 병렬화와 관련된 상기 정보는 멀티그레인 병렬화의 값 및 멀티그레인 병렬구성세트를 포함하는 것을 특징으로 하는 알고리즘의 고유 병렬화의 정량화 및 분석하는 방법.
- 제1항에 따른 고유 병렬화의 정량화 및 분석하는 방법을 컴퓨터가 수행할 수 있도록, 지시프로그램을 갖고 컴퓨터로 해독가능한 저장매체를 포함하는 컴퓨터 프로그램 제품.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW099122162 | 2010-07-06 | ||
TW099122162A TWI501168B (zh) | 2010-07-06 | 2010-07-06 | 演算法本質平行度之量化及分析方法 |
US12/832,557 US20120011186A1 (en) | 2010-07-08 | 2010-07-08 | Method for quantifying and analyzing intrinsic parallelism of an algorithm |
US12/832,557 | 2010-07-08 | ||
PCT/US2011/042962 WO2012006285A1 (en) | 2010-07-06 | 2011-07-05 | Method for quantifying and analyzing intrinsic parallelism of an algorithm |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130038903A true KR20130038903A (ko) | 2013-04-18 |
Family
ID=45441539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137001820A KR20130038903A (ko) | 2010-07-06 | 2011-07-05 | 알고리즘의 고유 병렬화의 정량화 및 분석 방법 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP2591414A4 (ko) |
JP (1) | JP5925202B2 (ko) |
KR (1) | KR20130038903A (ko) |
WO (1) | WO2012006285A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180120570A (ko) * | 2017-04-27 | 2018-11-06 | 재단법인대구경북과학기술원 | 그래프 생성 방법 및 장치 |
US10593080B2 (en) | 2017-04-27 | 2020-03-17 | Daegu Gyeongbuk Institute Of Science And Technology | Graph generating method and apparatus |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111061150B (zh) * | 2019-10-23 | 2020-11-27 | 南京大学 | 一种拉普拉斯频率响应的硬件实现方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5587922A (en) * | 1993-06-16 | 1996-12-24 | Sandia Corporation | Multidimensional spectral load balancing |
US7418470B2 (en) * | 2000-06-26 | 2008-08-26 | Massively Parallel Technologies, Inc. | Parallel processing systems and method |
US6615211B2 (en) * | 2001-03-19 | 2003-09-02 | International Business Machines Corporation | System and methods for using continuous optimization for ordering categorical data sets |
US7171397B1 (en) * | 2002-08-21 | 2007-01-30 | Ncr Corp. | Method and system for measuring parallelism of a database system execution step |
US7724256B2 (en) * | 2005-03-21 | 2010-05-25 | Siemens Medical Solutions Usa, Inc. | Fast graph cuts: a weak shape assumption provides a fast exact method for graph cuts segmentation |
US8548238B2 (en) * | 2007-05-03 | 2013-10-01 | Carnegie Mellon University | Method for partitioning combinatorial graphs |
US8201171B2 (en) * | 2007-06-27 | 2012-06-12 | Microsoft Corporation | Adjacent data parallel and streaming operator fusion |
US7406200B1 (en) * | 2008-01-08 | 2008-07-29 | International Business Machines Corporation | Method and system for finding structures in multi-dimensional spaces using image-guided clustering |
US8522224B2 (en) | 2010-06-22 | 2013-08-27 | National Cheng Kung University | Method of analyzing intrinsic parallelism of algorithm |
-
2011
- 2011-07-05 EP EP11804255.5A patent/EP2591414A4/en not_active Withdrawn
- 2011-07-05 JP JP2013518789A patent/JP5925202B2/ja active Active
- 2011-07-05 KR KR1020137001820A patent/KR20130038903A/ko not_active Application Discontinuation
- 2011-07-05 WO PCT/US2011/042962 patent/WO2012006285A1/en active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180120570A (ko) * | 2017-04-27 | 2018-11-06 | 재단법인대구경북과학기술원 | 그래프 생성 방법 및 장치 |
US10593080B2 (en) | 2017-04-27 | 2020-03-17 | Daegu Gyeongbuk Institute Of Science And Technology | Graph generating method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
EP2591414A1 (en) | 2013-05-15 |
WO2012006285A1 (en) | 2012-01-12 |
JP5925202B2 (ja) | 2016-05-25 |
EP2591414A4 (en) | 2014-08-06 |
JP2013530477A (ja) | 2013-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Meller et al. | Same, same but different: Recovering neural network quantization error through weight factorization | |
Cintra et al. | Low-complexity 8-point DCT approximations based on integer functions | |
Tanaka et al. | Robust numerical calculation of tangent moduli at finite strains based on complex-step derivative approximation and its application to localization analysis | |
Mimica et al. | Harnack inequalities for subordinate Brownian motions | |
KR101517308B1 (ko) | 알고리즘의 내적 병행성을 분석하는 방법 | |
Jentzen | Pathwise numerical approximations of SPDEs with additive noise under non-global Lipschitz coefficients | |
CN109255438B (zh) | 调整张量数据的方法和装置 | |
Meng et al. | Efficient winograd convolution via integer arithmetic | |
Hosseininia et al. | A wavelet method to solve nonlinear variable-order time fractional 2D Klein–Gordon equation | |
Komori et al. | Strong first order S-ROCK methods for stochastic differential equations | |
Leblond et al. | A priori space–time separated representation for the reduced order modeling of low Reynolds number flows | |
Goslee | Correlation analysis of dissimilarity matrices | |
KR20130038903A (ko) | 알고리즘의 고유 병렬화의 정량화 및 분석 방법 | |
Baldelli et al. | Numerical bifurcation and stability analysis of variational gradient-damage models for phase-field fracture | |
US20150058279A1 (en) | Control data driven modifications and generation of new schema during runtime operations | |
Saccenti et al. | Tracy–Widom statistic for the largest eigenvalue of autoscaled real matrices | |
Sarkar et al. | An efficient use of principal component analysis in workload characterization-A study | |
Zare et al. | Completion of partially known turbulent flow statistics | |
Hoffmann et al. | Selecting spatiotemporal patterns for development of parallel applications | |
US20120011186A1 (en) | Method for quantifying and analyzing intrinsic parallelism of an algorithm | |
Rostami et al. | Compressed sensing with side information on feasible region | |
Torres et al. | Contrasting two transformation-based methods for obtaining absolute extrema | |
Chauveau et al. | Simulation based nearest neighbor entropy estimation for (adaptive) mcmc evaluation | |
Das et al. | AN ALGORITHMIC TECHNIQUE FOR SOLVING NON-LINEAR PROGRAMMING AND QUADRATIC PROGRAMMING PROBLEMS. | |
Schaefer et al. | A new time integration scheme for Cahn-Hilliard equations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal |