KR20160003502A - 병렬화 방법 및 전자 장치 - Google Patents

병렬화 방법 및 전자 장치 Download PDF

Info

Publication number
KR20160003502A
KR20160003502A KR1020140082039A KR20140082039A KR20160003502A KR 20160003502 A KR20160003502 A KR 20160003502A KR 1020140082039 A KR1020140082039 A KR 1020140082039A KR 20140082039 A KR20140082039 A KR 20140082039A KR 20160003502 A KR20160003502 A KR 20160003502A
Authority
KR
South Korea
Prior art keywords
unit
task
cpu
electronic device
heterogeneous
Prior art date
Application number
KR1020140082039A
Other languages
English (en)
Inventor
고재한
아누라드하 오베로이
고팔라 크리쉬나 풀리게다 샤르마
라그하반 벨라판
프리얀크 포파틀랄 팔두
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020140082039A priority Critical patent/KR20160003502A/ko
Priority to US14/789,062 priority patent/US9727382B2/en
Publication of KR20160003502A publication Critical patent/KR20160003502A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Image Processing (AREA)

Abstract

본 발명의 다양한 실시예에 따른 병렬화 방법 및 전자 장치에 있어서, 전자 장치에서 수행하려는 작업의 프로파일링을 통해, 상기 작업의 작업 단계별 프로파일링 정보를 획득하고, 상기 프로파일링 정보에 기반하여, 상기 작업의 복수의 작업 단계들 중 상기 전자 장치의 CPU와 상기 CPU와 이종(異種) 유닛에서 병렬화할 적어도 하나의 작업 단계를 결정하고, 상기 결정된 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU 또는 상기 이종 유닛 중 각 단위 데이터를 처리할 유닛을 결정하고, 상기 결정된 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU 또는 상기 이종 유닛 중 각 태스크를 처리할 유닛을 결정할 수 있다. 이외에도 추가적인 실시 예가 가능하다.

Description

병렬화 방법 및 전자 장치{Parallelization method and electronic device}
본 발명의 다양한 실시 예들은 병렬화 방법 및 전자 장치에 관한 것이다.
최근, 스마트 폰, 태블릿 PC 등의 모바일 전자 장치에서는 고화질의 그래픽 기능이나 높은 사양의 이미지 처리 기능 등을 제공하고 있다. 이에 따라, 모바일 전자 장치에서는 병렬화가 가능한 멀티코어 CPU를 이용하여, 증가된 데이터 연산량을 지원할 수 있다.
전자 장치에서는 CPU의 클럭 주파수를 증가시킴으로써, CPU의 연산 처리 속도를 높여 증가하는 데이터 연산량에 대응할 수 있다. 그러나, 모바일 전자 장치에서는 발열 문제와 제한된 전력량으로 인하여, CPU 클럭 주파수를 높이는 데 제약이 있다. 따라서, 전자 장치에서 높은 성능과 빠른 속도를 지원하면서도, 발열량과 전력 소모를 최소화할 수 있는 방안이 요구된다.
본 발명의 다양한 실시 예들이 이루고자 하는 기술적 과제는 병렬화 방법 및 전자 장치에 관한 것이다. 또한, 상기 병렬화 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 데 있다. 본 발명의 다양한 실시 예들이 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
본 발명의 다양한 실시 예들에 따른 병렬화 방법은 전자 장치에서 수행하려는 작업(job)의 프로파일링(profiling)을 통해, 상기 작업의 작업 단계(job step)별 프로파일링 정보를 획득하는 동작, 상기 프로파일링 정보에 기반하여, 상기 작업의 복수의 작업 단계들 중 상기 전자 장치의 CPU(central processing unit)와 상기 CPU와 이종(異種) 유닛에서 병렬화할 적어도 하나의 작업 단계를 결정하는 동작, 상기 결정된 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU 또는 상기 이종 유닛 중 각 단위 데이터를 처리할 유닛을 결정하는 동작과, 상기 결정된 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU 또는 상기 이종 유닛 중 각 태스크를 처리할 유닛을 결정하는 동작을 포함할 수 있다.
본 발명의 다양한 실시 예들에 따른 전자 장치는 작업 단계(job step)별 프로파일링 정보에 기초하여 결정된 병렬화하는 적어도 하나의 작업 단계 중 CPU(central processing unit)에서 처리하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크를 실행하는 CPU와 상기 병렬화하는 적어도 하나의 작업 단계 중 이종 유닛에서 처리하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크를 실행하는 이종 유닛을 포함하고, 상기 CPU와 상기 이종 유닛 각각에서 실행되는 적어도 일부의 태스크는 상기 결정된 병렬화하는 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여 결정된 것일 수 있다.
본 발명의 다양한 실시 예들에 따른 병렬화 방법 및 전자 장치는 멀티코어 CPU(central processing unit) 상에서 수행되는 코드 일부를 이기종 환경(heterogeneous environment) 하에 있는 이종 유닛에서 동시에 수행하도록 병렬화함으로써, CPU 부하를 줄이고 발열량과 전력 소모를 최소화할 수 있다.
도 1은 본 발명의 다양한 실시 예에 따른 전자 장치를 도시한 블록도이다.
도 2는 본 발명의 다양한 실시 예에 따른 병렬화 방법을 나타낸 흐름도이다.
도 3은 본 발명의 다양한 실시 예에 따라 HDR 이미지를 생성하는 작업에 병렬화 방법을 적용한 일례를 도시한 것이다.
도 4는 본 발명의 다양한 실시 예에 따라 JPEG 디코딩을 수행하는 작업에 병렬화 방법을 적용한 일례를 도시한 것이다.
도 5는 본 발명의 다양한 실시 예에 따라 HDR 이미지를 생성하는 작업에 병렬화 방법을 적용한 후의 성능 향상을 보여주는 그래프이다.
이하, 본 발명의 다양한 실시 예가 첨부된 도면과 연관되어 기재된다. 본 발명의 다양한 실시 예는 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들이 도면에 예시되고 관련된 상세한 설명이 기재되어 있다. 그러나, 이는 본 발명의 다양한 실시 예를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 다양한 실시 예의 사상 및 기술 범위에 포함되는 모든 변경 및/또는 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용되었다.
본 발명의 다양한 실시 예에서 사용될 수 있는“포함한다” 또는 “포함할 수 있다” 등의 표현은 개시(disclosure)된 해당 기능, 동작 또는 구성요소 등의 존재를 가리키며, 추가적인 하나 이상의 기능, 동작 또는 구성요소 등을 제한하지 않는다. 또한, 본 발명의 다양한 실시 예에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 발명의 다양한 실시 예에서 “또는” 또는 “A 또는/및 B 중 적어도 하나” 등의 표현은 함께 나열된 단어들의 어떠한, 그리고 모든 조합을 포함한다. 예를 들어, “A 또는 B” 또는 “A 또는/및 B 중 적어도 하나” 각각은, A를 포함할 수도, B를 포함할 수도, 또는 A 와 B 모두를 포함할 수도 있다.
본 발명의 다양한 실시 예에서 사용된 “제 1,”“제2,”“첫째,”또는“둘째,”등의 표현들은 다양한 실시 예들의 다양한 구성요소들을 수식할 수 있지만, 해당 구성요소들을 한정하지 않는다. 예를 들어, 상기 표현들은 해당 구성요소들의 순서 및/또는 중요도 등을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 수 있다. 예를 들어, 제1 사용자 기기와 제 2 사용자 기기는 모두 사용자 기기이며, 서로 다른 사용자 기기를 나타낸다. 예를 들어, 본 발명의 다양한 실시 예의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재하지 않는 것으로 이해될 수 있어야 할 것이다.
본 발명의 다양한 실시 예에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명의 다양한 실시 예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명의 다양한 실시 예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 다양한 실시 예에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 발명의 다양한 실시 예에 따른 전자 장치는, 통신 기능이 포함된 장치일 수 있다. 예를 들면, 전자 장치는 스마트 폰(smartphone), 태블릿 PC(tablet personal computer), 이동 전화기(mobile phone), 화상전화기, 전자북 리더기(e-book reader), 데스크탑 PC(desktop personal computer), 랩탑 PC(laptop personal computer), 넷북 컴퓨터(netbook computer), PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 모바일 의료기기, 카메라(camera), 또는 웨어러블 장치(wearable device)(예: 전자 안경과 같은 head-mounted-device(HMD), 전자 의복, 전자 팔찌, 전자 목걸이, 전자 앱세서리(appcessory), 전자 문신, 또는 스마트 와치(smart watch))중 적어도 하나를 포함할 수 있다.
어떤 실시 예들에 따르면, 전자 장치는 통신 기능을 갖춘 스마트 가전 제품(smart home appliance)일 수 있다. 스마트 가전 제품은, 예를 들자면, 전자 장치는 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스(set-top box), TV 박스(예를 들면, 삼성 HomeSync™, 애플TV™, 또는 구글 TV™), 게임 콘솔(game consoles), 전자 사전, 전자 키, 캠코더(camcorder), 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
어떤 실시 예들에 따르면, 전자 장치는 각종 의료기기(예: MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 초음파기 등), 네비게이션(navigation) 장치, GPS 수신기(global positioning system receiver), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트(infotainment) 장치, 선박용 전자 장비(예: 선박용 항법 장치 및 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛, 산업용 또는 가정용 로봇, 금융 기관의 ATM(automatic teller machine) 또는 상점의 POS(point of sales) 중 적어도 하나를 포함할 수 있다.
어떤 실시 예들에 따르면, 전자 장치는 통신 기능을 포함한 가구(furniture) 또는 건물/구조물의 일부, 전자 보드(electronic board), 전자 사인 입력장치(electronic signature receiving device), 프로젝터(projector), 또는 각종 계측기기(예: 수도, 전기, 가스, 또는 전파 계측 기기 등) 중 적어도 하나를 포함할 수 있다. 본 발명의 다양한 실시 예에 따른 전자 장치는 전술한 다양한 장치들 중 하나 또는 그 이상의 조합일 수 있다. 또한, 본 발명의 다양한 실시 예에 따른 전자 장치는 플렉서블 장치일 수 있다. 또한, 본 발명의 다양한 실시 예에 따른 전자 장치는 전술한 기기들에 한정되지 않음은 당업자에게 자명하다.
이하, 첨부된 도면을 참조하여 다양한 실시 예에 따른 전자 장치에 대해서 살펴본다. 다양한 실시 예에서 이용되는 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예: 인공지능 전자 장치)를 지칭할 수 있다.
도 1은 본 발명의 다양한 실시 예에 따른 전자 장치를 도시한 블록도이다.
도 1을 참조하면, 상기 전자 장치(100)는 버스(110), CPU(120), 메모리(130), 입출력 인터페이스(140), 디스플레이(150), 통신 인터페이스(160) 및 이종 유닛(170) 중 적어도 하나를 포함할 수 있다.
본 실시 예에 따른 전자 장치(100)는 CPU(central processing unit)(120)와 상기 CPU(120)와 이종(異種) 유닛(170)에서 병렬화하여 작업(job)을 수행할 수 있다. 상기 전자 장치(100)는 상기 작업의 작업 단계(job step)별 프로파일링을 통해, 상기 작업의 작업 단계(job step)별로 병렬화할 수 있다. 상기 전자 장치(100)는 멀티코어 CPU 상에서 수행되는 작업의 코드 일부를 이기종 환경(heterogeneous environment) 하에 있는 이종 유닛에서 동시에 수행하도록 병렬화할 수 있다.
상기 버스(110)는 전술한 구성요소들을 서로 연결하고, 전술한 구성요소들 간의 통신(예: 제어 메시지)을 전달하는 회로일 수 있다. 다양한 실시 예에서, 상기 버스(110)는 전술한 CPU(120)와 이종 유닛(170) 사이, 및/또는 전술한 구성요소들(예: 상기 메모리(130), 상기 입출력 인터페이스(140), 상기 디스플레이(150), 상기 통신 인터페이스(160), 상기 이종 유닛(170)) 사이를 연결하고, 통신을 전달할 수 있다.
상기 CPU(120)는 작업 단계(job step)별 프로파일링 정보에 기초하여 결정된 병렬화하는 적어도 하나의 작업 단계를 실행할 수 있다. 예를 들면, 상기 프로파일링 정보는 상기 작업의 실행 시간과 상기 작업 단계별 실행 시간, 상기 작업 단계별 실행되는 코드 범위, 또는 상기 작업 단계별 실행에 사용되는 메모리량 중 적어도 하나를 포함할 수 있다.
예컨대, 상기 작업이 HDR(high dynamic range) 작업이면, 상기 CPU(120)는 상기 HDR 작업의 복수의 작업 단계들 중에서 이미지 레지스트레이션(image registration)의 작업 단계 또는 HDR 합성(HDR composition)의 작업 단계 중 적어도 하나를 상기 이종 유닛(170)과 병렬로 수행할 수 있다. 또는, 상기 작업이 JPEG 디코딩 작업이면, 상기 CPU(120)는 상기 JPEG 디코딩 작업의 복수의 작업 단계들 중에서 역양자화(dequantization)의 작업 단계 또는 IDCT(inverse discrete cosine transform)의 작업 단계 중 적어도 하나를 상기 이종 유닛(170)과 병렬로 수행할 수 있다.
상기 CPU(120)는 작업 단계(job step)별 프로파일링 정보에 기초하여 결정된 병렬화하는 적어도 하나의 작업 단계 중 CPU(central processing unit)(120)에서 처리하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크를 실행할 수 있다.
일 실시 예에 따르면, 상기 CPU(120)에서 실행되는 적어도 일부의 단위 데이터는 병렬화하는 것으로 결정된 작업 단계 중 복수의 단위 데이터에 대해 반복되는 적어도 하나의 작업 단계에 대하여 결정된 것일 수 있다.
다른 실시 예에 따르면, 상기 CPU(120)에서 실행되는 적어도 일부의 태스크는 병렬화하는 것으로 결정된 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여 결정된 것일 수 있다.
상기 CPU(120)는, 예를 들면, 상기 버스(110)를 통해 전술한 다른 구성요소들(예: 상기 메모리(130), 상기 입출력 인터페이스(140), 상기 디스플레이(150), 상기 통신 인터페이스(160), 상기 이종 유닛(170))로부터 명령을 수신하여, 수신된 명령을 해독하고, 해독된 명령에 따른 연산이나 데이터 처리를 실행할 수 있다.
본 실시 예에 따른 CPU(120)는 적어도 하나 이상의 코어로 구성될 수 있다.
상기 메모리(130)는, 상기 CPU(120) 또는 다른 구성요소들(예: 상기 입출력 인터페이스(140), 상기 디스플레이(150), 상기 통신 인터페이스(160), 상기 이종 유닛(170)로부터 수신되거나 상기 CPU(120) 또는 다른 구성요소들에 의해 생성된 명령 또는 데이터를 저장할 수 있다.
본 발명의 다양한 실시 예에 따르면, 상기 메모리(130)는 작업의 작업 단계(job step)별 프로파일링 정보를 저장할 수 있다. 또한, 상기 메모리(130)는 상기 작업의 복수의 작업 단계들 중 상기 전자 장치의 CPU와 상기 CPU와 이종(異種) 유닛(computing processing unit)에서 병렬화할 적어도 하나의 작업 단계를 저장할 수 있다. 상기 메모리(130)는 상기 병렬화하는 적어도 하나의 작업 단계 중 상기 CPU와 상기 이종 유닛 각각에서 실행되는 적어도 일부의 단위 데이터 또는 적어도 일부의 태스크를 저장할 수 있다.
상기 메모리(130)는 통상적인 저장매체로서, 상기 CPU(120)와 상기 이종 유닛(170) 각각에서 작업의 복수의 작업 단계들을 수행하는데 필요한 데이터 또는 프로그램(예: 소스 코드)을 저장할 수 있다. 또한, 메모리(130)는 상기 CPU(120)와 상기 이종 유닛(170) 각각에서 적어도 일부의 단위 데이터 또는 적어도 일부의 태스크를 실행하는데 필요한 데이터 또는 프로그램을 더 저장할 수 있다.
상기 메모리(130)는 CPU(120)에서 이종 유닛(170), 통신 인터페이스(160) 또는 입출력 인터페이스(140)를 제어하는데 필요한 프로그램 루틴이나 명령어 세트를 저장할 수 있다.
상기 메모리(130)는 전자 장치(100)의 동작에 필요한 데이터 또는 프로그램을 저장할 수 있다. 예를 들어, 메모리(130)는 하드 디스크 드라이브(Hard Disk Drive, HDD), ROM(Read Only Memory), RAM(Random Access Memory), 플래쉬 메모리(Flash Memory), 메모리 카드(Memory Card), NAND 메모리 또는 솔리드스테이트 드라이브(Solid State Drive, SDD)등을 포함할 수 있다.
상기 메모리(130)은, 예를 들면, 커널(131), 미들웨어(132), 어플리케이션 프로그래밍 인터페이스(API: application programming interface)(133), 또는 어플리케이션(134) 등의 프로그래밍 모듈들을 포함할 수 있다. 전술한 각각의 프로그래밍 모듈들은 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 구성될 수 있다. 상기 커널(131)은 나머지 다른 프로그래밍 모듈들, 예를 들면, 상기 미들웨어(132), 상기 API(133), 또는 상기 어플리케이션(134) 등에 구현된 동작 또는 기능을 실행하거나 저장된 데이터를 호출하는데 사용되는 시스템 리소스들(예: 상기 버스(110), 상기 CPU(120), 또는 상기 메모리(130) 등)을 제어 또는 관리할 수 있다. 또한, 상기 커널(131)은 상기 미들웨어(132), 상기 API(133), 또는 상기 어플리케이션(134)에서 상기 전자 장치(100)의 개별 구성요소에 접근하여 제어 또는 관리할 수 있는 인터페이스를 제공할 수 있다.
상기 미들웨어(132)는 상기 API(133), 또는 상기 어플리케이션(134)가 상기 커널(231)과 통신하여 데이터를 주고받을 수 있도록 중개 역할을 수행할 수 있다. 또한, 상기 미들웨어(132)는 상기 어플리케이션(134)로부터 수신된 작업 요청들과 관련하여, 예를 들면, 상기 어플리케이션(134) 중 적어도 하나의 어플리케이션에 상기 전자 장치(100)의 시스템 리소스(예: 상기 버스(110), 상기 CPU(120), 이종 유닛(170) 또는 상기 메모리(130) 등)를 사용할 수 있는 우선 순위를 배정하는 등의 방법을 이용하여 작업 요청에 대한 제어(예: 스케줄링 또는 로드 밸런싱)을 수행할 수 있다.
상기 API(133)은 상기 어플리케이션(134)가 상기 커널(131) 또는 상기 미들웨어(132)에서 제공되는 기능을 제어하기 위한 인터페이스로, 예를 들면, 파일 제어, 창 제어, 화상 처리 또는 문자 제어 등을 위한 적어도 하나의 인터페이스 또는 함수(예: 명령어)를 포함할 수 있다.
다양한 실시 예에 따르면, 상기 어플리케이션(134)은 SMS/MMS 어플리케이션, 이메일 어플리케이션, 달력 어플리케이션, 알람 어플리케이션, 건강 관리(health care) 어플리케이션(예: 운동량 또는 혈당 등을 측정하는 어플리케이션) 또는 환경 정보 어플리케이션(예: 기압, 습도 또는 온도 정보 등을 제공하는 어플리케이션), 카메라 어플리케이션, OCR 어플리케이션, 이미지 편집 어플리케이션, 통화/메시지 어플리케이션, 메모장 어플리케이션, 인터넷 어플리케이션 등을 포함할 수 있다. 추가적으로 또는 대체적으로, 상기 어플리케이션(134)은 상기 전자 장치(100)과 외부 장치(예: 전자 장치(102) 또는 서버(104)) 사이의 정보 교환과 관련된 어플리케이션일 수 있다. 상기 정보 교환과 관련된 어플리케이션은, 예를 들어, 상기 외부 장치에 특정 정보를 전달하기 위한 알림 전달(notification relay) 어플리케이션, 또는 상기 외부 장치를 관리하기 위한 장치 관리(device management) 어플리케이션을 포함할 수 있다.
예를 들면, 상기 알림 전달 어플리케이션은 상기 전자 장치(100)의 다른 어플리케이션(예: SMS/MMS 어플리케이션, 이메일 어플리케이션, 건강 관리 어플리케이션, 또는 환경 정보 어플리케이션 등)에서 발생한 알림 정보를 외부 장치(예: 전자 장치(102) 또는 서버(104))로 전달하는 기능을 포함할 수 있다. 추가적으로 또는 대체적으로, 상기 알림 전달 어플리케이션은, 예를 들면, 외부 장치(예: 전자 장치(102) 또는 서버(104))로부터 알림 정보를 수신하여 사용자에게 제공할 수 있다. 상기 장치 관리 어플리케이션은, 예를 들면, 상기 전자 장치(100)과 통신하는 외부 장치(예: 전자 장치(102) 또는 서버(104))의 적어도 일부에 대한 기능(예: 외부 장치 자체(또는, 일부 구성 부품)의 턴온/턴오프(turn on/turn off) 또는 디스플레이의 밝기(또는, 해상도) 조절), 상기 외부 장치에서 동작하는 어플리케이션 또는 상기 외부 장치에서 제공되는 서비스(예: 통화 서비스 또는 메시지 서비스)를 관리(예: 설치, 삭제 또는 업데이트)할 수 있다.
다양한 실시 예에 따르면, 상기 어플리케이션(134)는 상기 외부 장치(예: 전자 장치(102) 또는 서버(104))의 속성(예: 전자 장치의 종류)에 따라 지정된 어플리케이션을 포함할 수 있다. 예를 들어, 외부 장치가 MP3 플레이어인 경우, 상기 어플리케이션(134)는 음악 재생과 관련된 어플리케이션을 포함할 수 있다. 유사하게, 외부 장치가 모바일 의료기기인 경우, 상기 어플리케이션(134)는 건강 관리와 관련된 어플리케이션을 포함할 수 있다. 한 실시 예에 따르면, 상기 어플리케이션(134)는 전자 장치(100)에 지정된 어플리케이션 또는 외부 장치(예: 전자 장치(102) 또는 서버(104))로부터 수신된 어플리케이션 중 적어도 하나를 포함할 수 있다.
상기 입출력 인터페이스(140)은, 입출력 장치(예: 센서, 키보드 또는 터치 스크린)를 통하여 사용자로부터 입력된 명령 또는 데이터를, 예를 들면, 상기 버스(110)을 통해 상기 CPU(120), 상기 메모리(130), 상기 통신 인터페이스(160), 상기 이종 유닛(170)에 전달할 수 있다. 예를 들면, 상기 입출력 인터페이스(140)은 터치 스크린을 통하여 입력된 사용자의 터치에 대한 데이터를 상기 CPU(120)으로 제공할 수 있다. 또한, 상기 입출력 인터페이스(140)은, 예를 들면, 상기 버스(110)을 통해 상기 CPU(120), 상기 메모리(130), 상기 통신 인터페이스(160), 상기 이종 유닛(170)으로부터 수신된 명령 또는 데이터를 상기 입출력 장치(예: 스피커 또는 디스플레이)를 통하여 출력할 수 있다. 예를 들면, 상기 입출력 인터페이스(140)은 상기 CPU(120)을 통하여 처리된 음성 데이터를 스피커를 통하여 사용자에게 출력할 수 있다.
입출력 인터페이스(140)는 터치 화면, 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 터치 스크린(touch screen) 또는 스피커 등의 출력 장치 및 이들을 구동하기 위한 소프트웨어 모듈을 포함할 수 있다.
상기 디스플레이(150)는 사용자에게 각종 정보(예: 멀티미디어 데이터 또는 텍스트 데이터 등)을 표시할 수 있다.
상기 통신 인터페이스(160)는 상기 전자 장치(100)와 외부 장치(예: 전자 장치(102) 또는 서버(104)) 간의 통신을 연결할 수 있다. 예를 들면, 상기 통신 인터페이스(160)는 무선 통신 또는 유선 통신을 통해서 네트워크(162)에 연결되어 상기 외부 장치와 통신할 수 있다. 상기 무선 통신은, 예를 들어, Wi-Fi(wireless fidelity), BT(Bluetooth), NFC(near field communication), GPS(global positioning system) 또는 셀룰러(cellular) 통신(예: LTE, LTE-A, CDMA, WCDMA, UMTS, WiBro 또는 GSM 등) 중 적어도 하나를 포함할 수 있다. 상기 유선 통신은, 예를 들어, USB(universal serial bus), HDMI(high definition multimedia interface), RS-232(recommended standard 232) 또는 POTS(plain old telephone service) 중 적어도 하나를 포함할 수 있다.
다양한 실시 예에서, 상기 통신 인터페이스(160)는 전자 장치(102) 또는 서버(104)로부터 병렬화하는 것으로 결정된 적어도 하나의 작업 단계에 관한 정보를 수신할 수 있다. 또는, 상기 통신 인터페이스(160)는 전자 장치(102) 또는 서버(104)로부터 병렬화하는 것으로 결정된 작업 단계 중 상기 CPU(120)와 상기 이종 유닛(170) 각각에서 실행하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크에 관한 정보를 수신할 수 있다.
그리고, 상기 통신 인터페이스(160)는 상기 병렬화하는 것으로 결정된 적어도 하나의 작업 단계에 관한 정보를 전자 장치(102) 또는 서버(104)와 같은 외부 장치로 전송할 수 있다. 또는, 상기 통신 인터페이스(160)는 상기 병렬화하는 것으로 결정된 작업 단계 중 상기 CPU(120)와 상기 이종 유닛(170) 각각에서 실행하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크에 관한 정보를 전자 장치(102) 또는 서버(104)와 같은 외부 장치로 전송할 수 있다.
한 실시 예에 따르면, 상기 네트워크(162)는 통신 네트워크(telecommunications network)일 수 있다. 상기 통신 네트워크는 컴퓨터 네트워크(computer network), 인터넷(internet), 사물 인터넷(internet of things, IoT) 또는 전화망(telephone network) 중 적어도 하나를 포함할 수 있다. 한 실시 예에 따르면, 상기 전자 장치(100)와 외부 장치 간의 통신을 위한 프로토콜(예: 전송 계층 규약(transport layer protocol), 데이터 연결 계층 규약(data link layer protocol) 또는 물리 계층 규약(physical layer protocol))은 어플리케이션(134), 어플리케이션 프로그래밍 인터페이스(133), 상기 미들웨어(132), 커널(131), 통신 인터페이스(160), 또는 이종 유닛(170) 중 적어도 하나에서 지원될 수 있다.
이종 유닛(170)는, 상기 CPU(120)와 이종(異種)이고, 상기 CPU(120)와 병렬화할 수 있는 유닛을 나타낸다. 예를 들면, 상기 이종 유닛(170)은 상기 CPU(120)와 다른 아키텍쳐(architecture)를 가지고, 특정 태스크를 수행하도록 설계된 다른 종류의 프로세서들을 포함할 수 있다. 예컨대, 상기 이종 유닛(170)은 연산(computing)을 수행할 수 있는 적어도 하나의 연산처리 유닛(computing processing unit)을 포함할 수 있다. 다양한 실시 예에 따르면, 상기 이종 유닛(170)은, 적어도 하나의 GPU(graphics processing unit), 적어도 하나의 DSP(digital signal processor) 등을 포함할 수 있다. 예컨대, 상기 GPU는 병렬 컴퓨팅 플랫폼(parallel computing platform)을 기반으로 하여, 상기 CPU(120)보다 더 낮은 클럭 주파수로 동일한 성능(ex. 동일한 워크로드(workload) 처리 등)을 낼 수 있다.
상기 이종 유닛(170)은 작업 단계(job step)별 프로파일링 정보에 기초하여 결정된 병렬화하는 적어도 하나의 작업 단계를 실행할 수 있다. 예컨대, 상기 이종 유닛(170)은 작업 단계(job step)별 프로파일링 정보에 기초하여 결정된 병렬화하는 적어도 하나의 작업 단계 중 상기 이종 유닛(170)에서 처리하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크를 실행할 수 있다.
일 실시 예에 따르면, 상기 이종 유닛(170)에서 실행되는 적어도 일부의 단위 데이터는 병렬화하는 것으로 결정된 작업 단계 중 복수의 단위 데이터에 대해 반복되는 적어도 하나의 작업 단계에 대하여 결정된 것일 수 있다.
다른 실시 예에 따르면, 상기 이종 유닛(170)에서 실행되는 적어도 일부의 태스크는 병렬화하는 것으로 결정된 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여 결정된 것일 수 있다.
본 실시 예에 따른 상기 이종 유닛(170)는, CPU(120)는 적어도 하나 이상의 코어로 구성될 수 있다. 예를 들면, GPU는 상기 CPU(120)보다 더 작고 더 효과적인 수천 개의 코어들을 포함할 수 있다.
전자 장치(102)는 전자 장치(100)와 통신을 수행하고, 전자 장치(100)에 데이터를 전송할 수 있다. 예를 들면, 전자 장치(102)는 전자 장치(100)에서 수행하려는 작업(job)의 프로파일링(profiling)을 통해, 상기 작업의 작업 단계(job step)별 프로파일링 정보를 획득할 수 있다. 전자 장치(102)는 상기 프로파일링 정보에 기반하여, 상기 작업의 복수의 작업 단계들 중 상기 전자 장치(100)의 CPU(120)와 상기 이종 유닛(170)에서 병렬화할 적어도 하나의 작업 단계를 결정할 수 있다. 전자 장치(102)는 상기 결정된 작업 단계 중 복수의 단위 데이터에 대해 반복되는 적어도 하나의 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU(120) 또는 상기 이종 유닛(170) 중 각 단위 데이터를 처리할 유닛을 결정할 수 있다. 전자 장치(102)는 상기 결정된 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU(120) 또는 상기 이종 유닛(170) 중 각 태스크를 처리할 유닛을 결정할 수 있다. 예컨대, 전자 장치(102)는 PC(personal computer)이고, 전자 장치(100)는 모바일 장치가 될 수 있다.
일 실시 예에 따르면, 전자 장치(102)는 상기 이종 유닛(170)에서 처리하도록 결정된 적어도 하나의 태스크에 대하여, 상기 태스크를 수행할 상기 이종 유닛(170)의 코어와 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 결정할 수 있다. 예를 들면, 전자 장치(102)는 태스크들 사이의 의존성(dependency)과 함수 실행에 따른 지연(delay) 정도에 따라 상기 태스크를 수행할 상기 이종 유닛(170)의 코어와 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 결정할 수 있다.
다른 실시 예에 따르면, 전자 장치(102)는 상기 결정된 함수들의 처리 순서 또는 함수에 따라 상기 태스크의 소스 코드를 상기 이종 유닛(170)에서 수행되는 커널 함수로 재분배할 수 있다. 예를 들면, 이종 유닛(170)에서 수행되는 커널 함수로의 재분배는 상기 이종 유닛(170)에서 지원하는 표준화된 언어를 통해 구현될 수 있다. 예컨대, 이종 유닛(170)이 GPU(graphics processing unit)에 해당하는 경우, 상기 전자 장치는 OpenCL을 통해, 상기 태스크의 소스 코드를 상기 커널 함수로 재분배할 수 있다.
또 다른 실시 예에 따르면, 전자 장치(102)는 상기 CPU(120)의 소스 코드에 매칭되는 커널(kernel) 함수를 저장하는 테이블에 기반하여, 상기 태스크의 소스 코드를 상기 이종 유닛(170)에서 수행되는 커널 함수로 재분배할 수 있다.
또 다른 실시 예에 따르면, 전자 장치(102)는 상기 작업의 전체 실행 시간 중 해당 작업 단계의 실행 시간이 차지하는 비율이 지정된 비율보다 더 큰 작업 단계를 상기 병렬화할 적어도 하나의 작업 단계로 결정할 수 있다.
또 다른 실시 예에 따르면, 전자 장치(102)는 상기 CPU(120)에서 해당 작업 단계를 실행할 때의 실행 시간과 상기 이종 유닛(170)에서 해당 작업 단계를 실행할 때의 실행 시간의 비교에 기초하여, 상기 CPU(120) 또는 상기 이종 유닛(170) 중 각 단위 데이터를 처리할 유닛을 결정할 수 있다.
또 다른 실시 예에 따르면, 전자 장치(102)는 상기 병렬화를 통해 획득된 상기 작업의 결과와 상기 병렬화 이전에 획득된 상기 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정할 수 있다.
또 다른 실시 예에 따르면, 전자 장치(102)는 상기 이종 유닛(170)으로 제1 이종 유닛을 이용하여 획득된 상기 작업의 결과와 제2 이종 유닛을 이용하여 획득된 상기 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정할 수 있다.
또 다른 실시 예에 따르면, 전자 장치(102)는 상기 전자 장치(100)에서 상기 병렬화를 통해 획득된 상기 작업을 수행하는데 소요된 전체 실행 시간과 전류 소모량에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정할 수 있다.
예를 들어, 외부 장치는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(notebook computer), 디지털방송용 단말기, 디지털 카메라, 휴대게임단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션 또는 태블릿(tablet) PC(Personal Computer) 등의 전자 장치(100)와 통신할 수 있는 모든 전자 장치를 포함할 수 있다.
외부 장치(예: 전자 장치(102) 또는 서버(104))는 전자 장치(100)로부터 병렬화하는 것으로 결정된 적어도 하나의 작업 단계에 관한 정보를 수신할 수 있다. 또는, 외부 장치(예: 전자 장치(102) 또는 서버(104))는 전자 장치(100)로부터 병렬화하는 것으로 결정된 작업 단계 중 상기 CPU(120)와 상기 이종 유닛(170) 각각에서 실행하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크에 관한 정보를 수신할 수 있다. 외부 장치(예: 전자 장치(102) 또는 서버(104))는 수신된 정보에 기초하여 전자 장치(100)의 병렬화를 수행할 수 있다.
반대로, 외부 장치(예: 전자 장치(102) 또는 서버(104))는 전자 장치(100)로 병렬화하는 것으로 결정된 적어도 하나의 작업 단계에 관한 정보를 전송할 수 있다. 또는, 외부 장치(예: 전자 장치(102) 또는 서버(104))는 전자 장치(100)로 병렬화하는 것으로 결정된 작업 단계 중 상기 CPU(120)와 상기 이종 유닛(170) 각각에서 실행하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크에 관한 정보를 전송할 수 있다. 전자 장치(100)는 외부 장치(예: 전자 장치(102) 또는 서버(104))로부터 수신된 정보에 기초하여 병렬화를 수행할 수 있다.
외부 장치(예: 전자 장치(102) 또는 서버(104))는 하드웨어 사양의 제약을 비교적 적게 받으므로, 전자 장치(100)의 프로파일링, 병렬화의 작업 단계의 분석 등의 분석 알고리즘을 더 수행할 수 있다.
도 2는 본 발명의 다양한 실시 예에 따른 병렬화 방법을 나타낸 흐름도이다.
도 2를 참조하면, 도 2에 기재된 병렬화 방법은 도 1에 도시된 전자 장치(100) 또는 외부 장치(전자 장치(102) 또는 서버(104))에서 처리되는 동작들로 구성된다. 따라서, 본 실시예에서 생략된 내용이라 하더라도 도 1에 도시된 전자 장치(100) 또는 외부 장치(전자 장치(102) 또는 서버(104))에 관하여 이상에서 기술된 내용은 도 2에 기재된 방법에도 적용됨을 알 수 있다. 이하에서는 설명의 편의를 위하여, 전자 장치(100)에서 상기 병렬화 방법을 수행하는 것으로 설명한다.
210 동작에서 전자 장치(100)는 작업의 프로파일링(profiling)을 통해, 작업 단계별 프로파일링 정보(profiling information)를 획득할 수 있다. 예를 들면, 프로파일링은 소프트웨어 프로파일링을 포함할 수 있다. 예컨대, 프로파일링은 프로파일러(profiler)를 사용하여 프로그램 소스 코드나 이진 실행 파일을 분석할 수 있다. 프로파일러는 대상 소스 코드의 실행 동안의 정보를 수집함으로써 대상 소스 코드를 분석할 수 있다. 예를 들면, 프로파일러는 소스 코드에서 특정 명령어나 하드웨어 인터럽트의 사용이나 함수 호출의 빈도와 지속 등을 측정하여, 상기 소스 코드를 분석한 프로파일링 정보를 획득할 수 있다. 이를 통해, 전자 장치(100)는 작업(job)을 수행하는데 있어서, 해당 작업 단계에서 실행된 코드 범위, 실행 시간, 함수가 호출된 횟수, 실행된 함수의 개수, 실행된 조건문의 개수, 실행된 분기 결정문의 개수, 실행된 반복문의 개수, 할당된 메모리의 크기 등을 획득할 수 있다. 예컨대, 상기 프로파일링 정보는 상기 작업의 실행 시간과 상기 작업 단계별 실행 시간, 상기 작업 단계별 실행되는 코드 범위, 또는 상기 작업 단계별 실행에 사용되는 메모리량 중 적어도 하나를 포함할 수 있다.
220 동작에서 전자 장치(100)는 복수의 작업 단계들 중 CPU(120)와 이종 유닛(170)에서 병렬화할 작업 단계를 결정할 수 있다. 예를 들면, 전자 장치(100)는 상기 프로파일링 정보에 기반하여, 상기 병렬화할 적어도 하나의 작업 단계를 결정할 수 있다.
일 실시 예에 따르면, 전자 장치(100)는 상기 작업의 전체 실행 시간 중 해당 작업 단계의 실행 시간이 차지하는 비율이 지정된 비율보다 더 큰 작업 단계를 상기 병렬화할 적어도 하나의 작업 단계로 결정할 수 있다.
다른 실시 예에 따르면, 전자 장치(100)는 상기 복수의 작업 단계들 중 지정된 시간보다 더 긴 실행 시간을 갖는 작업 단계를 상기 병렬화할 적어도 하나의 작업 단계로 결정할 수 있다.
이외에도, 전자 장치(100)는 프로파일 정보에 포함된 적어도 하나의 데이터에 기초하여, 상기 병렬화할 적어도 하나의 작업 단계를 결정할 수 있다.
230 동작에서 전자 장치(100)는 상기 결정된 작업 단계 중 복수의 단위 데이터에 대해 반복되는 작업 단계에 대하여, CPU(120) 또는 이종 유닛(170) 중 각 단위 데이터를 처리할 유닛을 결정할 수 있다. 예를 들면, 전자 장치(100)는 상기 프로파일링 정보에 기반하여, 각 단위 데이터를 처리할 유닛을 결정할 수 있다. 예컨대, 전자 장치(100)는 상기 CPU(120)에서 해당 작업 단계를 실행할 때의 실행 시간과 상기 이종 유닛(170)에서 해당 작업 단계를 실행할 때의 실행 시간의 비교에 기초하여, 상기 CPU(120) 또는 상기 이종 유닛(170) 중 각 단위 데이터를 처리할 유닛을 결정할 수 있다.
240 동작에서 전자 장치(100)는 상기 결정된 작업 단계 중 독립적으로 실행 가능한 복수의 태스크를 포함하는 작업 단계에 대하여, CPU(120) 또는 이종 유닛(170) 중 각 태스크를 처리할 유닛을 결정할 수 있다.
전자 장치(100)는 상기 프로파일링 정보에 기반하여 각 태스크를 처리할 유닛을 결정할 수 있다. 예컨대, 전자 장치(100)는 태스크에 포함된 명령어의 종류, 조건문, 분기 결정문, 반복문 등의 코드 범위, 하드웨어 인터럽트의 유무나 함수의 개수, 함수 호출의 빈도와 지속 등에 기초하여, 하나의 작업 단계를 독립적으로 실행 가능한 복수의 태스크로 분할하고, CPU(120) 또는 이종 유닛(170) 중 각 태스크를 처리할 유닛을 결정할 수 있다.
일 실시예에 따르면, 전자 장치(100)는 상기 이종 유닛(170)에서 처리하도록 결정된 적어도 하나의 태스크에 대하여, 상기 태스크를 수행할 상기 이종 유닛(170)의 코어와 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 결정하는 동작을 더 포함할 수 있다.
예를 들면, 전자 장치(100)는 상기 결정된 함수들의 처리 순서 또는 함수에 따라 상기 태스크의 소스 코드를 상기 이종 유닛(170)에서 수행되는 커널 함수로 재분배하는 동작을 포함할 수 있다. 예컨대, 전자 장치(100)는 소프트웨어 파이프라이닝 알고리즘(software pipelining algorithm)을 이용하여, 상기 태스크의 소스 코드를 상기 이종 유닛(170)에서 수행되는 커널 함수로 재분배할 수 있다.
또 다른 예로, 전자 장치(100)는 상기 CPU(120)의 소스 코드에 매칭되는 커널 함수를 저장하는 테이블에 기반하여, 상기 태스크의 소스 코드를 상기 이종 유닛(170)에서 수행되는 커널 함수로 재분배할 수 있다.
다른 실시예에 따르면, 전자 장치(100)는 상기 병렬화를 통해 획득된 상기 작업의 결과와 상기 병렬화 이전에 획득된 상기 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 동작을 포함할 수 있다.
또 다른 실시예에 따르면, 전자 장치(100)는 상기 이종 유닛(170)으로 제1 이종 유닛을 이용하여 획득된 상기 작업의 결과와 제2 이종 유닛을 이용하여 획득된 상기 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 동작을 포함할 수 있다. 이를 통해, 이종 유닛(170)의 종류에 따른 하드웨어 사양의 차이에도 불구하고, 최적화된 성능을 이끌어냄과 동시에, 전력 소비를 최소화할 수 있다.
또 다른 실시예에 따르면, 전자 장치(100)는 상기 전자 장치(100)에서 상기 병렬화를 통해 획득된 상기 작업을 수행하는데 소요된 전체 실행 시간과 전류 소모량에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 동작을 포함할 수 있다.
도 3은 본 발명의 다양한 실시 예에 따라 HDR 이미지를 생성하는 작업에 병렬화 방법을 적용한 일례를 도시한 것이다.
도 3의 (a)는 본 발명의 일 실시 예에 따른 병렬화 방법을 적용하기 전의 HDR(high dynamic range) 이미지를 생성하는 작업을 나타낸다.
HDR 이미지를 생성하는 작업(이하, HDR 작업)은 동일한 장면(scene)을 서로 다른 노출 환경에서 캡쳐한 복수의 이미지를 보정을 통해 하나의 이미지로 합성하여, 하나의 HDR 이미지를 생성하는 작업이다. HDR 작업은 기존의 디지털 영상화 기술(digital imaging techniques) 또는 촬영 방법들(photographic methods)과 비교하여, 이미지에서 가장 밝은 부분과 가장 어두운 부분 사이에 더 큰 다이내믹 범위(dynamic range)를 갖도록 할 수 있다. 이하에서는 설명의 편의를 위해, 자동 노출(auto exposure), 단기 노출(short exposure), 장기 노출(long exposure) 환경에서 각각 촬영된 3장의 이미지를 합성하여, 하나의 HDR 이미지를 생성하는 것을 예로 들어 설명한다.
먼저, 전자 장치(100)는 자동 노출(auto exposure), 단기 노출(short exposure), 장기 노출(long exposure) 환경에서 각각 촬영된 3장의 이미지를 수신하고, 수신된 3장의 이미지 각각에 대한 전처리(preprocessing) 작업 단계를 수행할 수 있다. 예를 들면, 전처리 작업 단계에서 전자 장치(100)는 상기 3장의 이미지에 대하여 각각 이미지 형식 변경(image format conversion) 또는 이미지 분류를 수행할 수 있다. 예컨대, 전자 장치(100)는 다양한 이미지 형식으로 촬영된 이미지들을 이미지 처리 주체(예: processing unit)에 맞는 이미지 형식으로 전환할 수 있다. 예를 들면, 전자 장치(100)는 이미지들을 RGB 형식이나 YUV 형식으로 변환할 수 있다. 또는, 전자 장치(100)는 상기 3장의 이미지의 평균 밝기(average intensity)를 이용하여, 상기 3장의 이미지를 노출 정도에 따라 분류할 수 있다.
다음으로, 전자 장치(100)는 다양한 노출 환경에서 촬영된 3장의 이미지에서 전역적 이동(global shift)으로 야기된 결함(artifact)을 추정하고(estimate), 상기 결함을 픽셀 레벨(pixel level)에서 보정(compensate)하는 이미지 레지스트레이션(image registration)의 작업 단계를 수행할 수 있다. 예를 들면, 상기 이미지 레지스트레이션의 작업 단계에서 상기 전자 장치(100)는 HDR 정렬 보상(HDR align compensation)과 추정(estimation)을 수행할 수 있다. 전자 장치(100)는 모든 이미지들에서 특징들(features)을 추출하고, 추출된 특징들을 매칭할 수 있다. 또한, 전자 장치(100)는 하나의 기준 이미지(reference image)를 선택하고, 상기 기준 이미지에 대해 다른 이미지들의 쉬프트(shift)를 추정(estimate)할 수 있다. 예컨대, 전자 장치(100)는 이미지에서 추출된 특징들을 매칭함으로써, 이미지들의 쉬프트(shift)를 추정할 수 있다.
전자 장치(100)는 이미지 레지스트레이션의 작업 단계에서 보정된 3장의 이미지를 하나의 HDR 이미지로 합성하는 HDR 합성(HDR composition)의 작업 단계를 수행할 수 있다. 예를 들면, 전자 장치(100)는 HDR 합성의 작업 단계에서 모션 맵(motion map)과 가중치 맵(weight map)을 연산(computing)하는 것에 의해 고스팅 효과(ghosting effect)를 줄일 수 있다. 이에 의해, 하나의 HDR 이미지가 생성될 수 있다.
전자 장치(100)는 상기 생성된 HDR 이미지에서 콘트라스트 향상(contrast enhancement)의 작업 단계를 수행할 수 있다. 전자 장치(100)는 메모리(130)에 저장하거나 디스플레이(150)에 표시하기 위하여 HDR 이미지를 LDR(low dynamic range) 이미지로 매핑하는 LDR 매핑(mapping to LDR)의 작업 단계를 수행할 수 있다. 상기 HDR 작업을 수행하는 어플리케이션(application)에 따라, 상기 HDR 이미지는 메모리(130)에 저장하거나 디스플레이(150)에 표시할 수 있다.
마지막으로, 전자 장치(100)는 마스킹(masking) 등을 이용하여 이미지를 선명하게 하는 세부사항 향상(detail enhancement)의 작업 단계를 수행할 수 있다. 예를 들면, HDR 이미지의 세부사항들(details)은 언-샤프 마스킹(un-sharp masking) 방법에 의해 선명해 질 수 있다.
도 3의 (b)는 본 발명의 일 실시 예에 따른 병렬화 방법을 적용한 후의 HDR 이미지를 생성하는 작업을 나타낸다.
전자 장치(100)는 프로파일링을 통해, 상기 HDR 작업의 작업 단계별 프로파일링 정보를 획득할 수 있다. 예를 들면, 전자 장치(100)는 상기 HDR 작업의 복수의 작업 단계들 중 연산하는데 가장 많은 실행 시간이 소요되는 작업 단계를 상기 병렬화할 적어도 하나의 작업 단계로 결정할 수 있다. 또는, 전자 장치(100)는 상기 HDR 작업의 전체 실행 시간 중 해당 작업 단계의 실행 시간이 차지하는 비율이 지정된 비율보다 더 큰 작업 단계를 상기 병렬화할 적어도 하나의 작업 단계로 결정할 수 있다. 예컨대, 전자 장치(100)는 상기 HDR 작업의 작업 단계별 프로파일링 정보에 기반하여, 상기 HDR 작업의 복수의 작업 단계들 중에서 이미지 레지스트레이션과 HDR 합성의 작업 단계를 병렬화하는 것으로 결정할 수 있다.
전자 장치(100)는 상기 이미지 레지스트레이션의 작업 단계 중 복수의 단위 데이터에 대해 반복되는 적어도 하나의 작업 단계에 대하여, CPU(120)와 이종 유닛(170)에서 병렬화하여 동시에 처리하도록 결정할 수 있다. 예를 들면, 상기 이미지 레지스트레이션의 작업 단계는 3장의 이미지 각각에 대하여 수행되므로, 전자 장치(100)는 상기 프로파일링 정보에 기반하여, 3장 중의 적어도 일부는 상기 CPU 또는 상기 이종 유닛 중 어느 하나에서 처리하도록 결정할 수 있다. 전자 장치(100)는 상기 CPU(120)에서 해당 작업 단계를 실행할 때의 실행 시간과 상기 이종 유닛(170)에서 해당 작업 단계를 실행할 때의 실행 시간의 비교에 기초하여, 상기 CPU(120) 또는 상기 이종 유닛(170) 중 각 단위 데이터를 처리할 유닛을 결정할 수 있다. 예컨대, 전자 장치(100)는 CPU(120)에서 3장 모두에 대해 이미지 레지스트레이션을 처리하는 것보다 2장은 CPU(120)에서 처리하고 1장은 이종 유닛(170)에서 처리하도록 결정할 수 있다.
또는, 전자 장치(100)는 상기 이미지 레지스트레이션의 작업 단계 중 상기 독립적으로 실행가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여, CPU(120)와 이종 유닛(170)에서 병렬화하여 동시에 처리하도록 결정할 수 있다. 예를 들면, 상기 이미지 레지스트레이션의 작업 단계 중 적어도 일부의 태스크에 해당하는 에지 히스토그램(edge histogram)과 보상(compensation)을 각각 CPU(120)와 이종 유닛(170)에서 병렬화하여 처리하도록 결정할 수 있다.
전자 장치(100)는 상기 이종 유닛(170)에서 처리하도록 결정된 적어도 하나의 태스크에 대하여, 상기 태스크를 수행할 상기 이종 유닛(170)의 코어와 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 결정할 수 있다. 전자 장치(100)는 상기 결정된 함수들의 처리 순서 또는 함수에 따라 상기 태스크의 소스 코드를 상기 이종 유닛(170)에서 수행되는 커널 함수로 재분배할 수 있다. 전자 장치(100)는 상기 CPU(120)의 소스 코드에 매칭되는 커널 함수를 저장하는 테이블에 기반하여, 상기 태스크의 소스 코드를 상기 이종 유닛(170)에서 수행되는 커널 함수로 재분배할 수 있다.
일 실시 예에 따라, 전자 장치(100)는 상기 병렬화를 통해 획득된 상기 HDR 작업의 결과와 상기 병렬화 이전에 획득된 상기 HDR 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정할 수 있다. 지정된 기준의 성능이 획득될 때까지 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 과정을 반복할 수 있다. 예컨대, 전자 장치(100)는 소스 코드에 포함된 곱하기 연산(*)을 수행 속도가 빠른 시프트 연산(<<)으로 대체할 수 있다.
다른 실시 예에 따라, 전자 장치(100)는 상기 이종 유닛(170)으로 제1 이종 유닛을 이용하여 획득된 상기 작업의 결과와 제2 이종 유닛을 이용하여 획득된 상기 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정할 수 있다. 예를 들면, 이종 유닛(170)의 종류나 하드웨어 사양에 따라 병렬화된 성능이 조금씩 다를 수 있으므로, 각 이종 유닛(170)의 종류나 하드웨어 사양에 맞도록 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정할 수 있다. 이에 따라, 병렬화된 결과가 각 이종 유닛(170)에 최적화될 수 있다. 지정된 기준의 성능이 획득될 때까지 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 과정을 반복할 수 있다.
또 다른 실시 예에 따라, 전자 장치(100)는 상기 전자 장치(100)에서 상기 병렬화를 통해 획득된 상기 작업을 수행하는데 소요된 전체 실행 시간과 전류 소모량에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정할 수 있다. 지정된 기준의 성능이 획득될 때까지 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 과정을 반복할 수 있다.
도 4는 본 발명의 다양한 실시 예에 따라 JPEG 디코딩을 수행하는 작업에 병렬화 방법을 적용한 일례를 도시한 것이다.
도 4의 (a)는 본 발명의 일 실시 예에 따른 병렬화 방법을 적용하기 전의 JPEG 디코딩을 수행하는 작업을 나타낸다.
JPEG 디코딩을 수행하는 작업(이하, JPEG 디코딩 작업)은 하나의 이미지를 몇 개의 단위 블럭으로 나누어 각각의 단위 블록에 대하여, JPEG 디코딩을 수행하는 작업이다.
먼저, 전자 장치(100)는 각각의 단위 블록에 대한 엔트로피 디코딩(entropy decoding)의 작업 단계를 수행할 수 있다. 전자 장치(100)는 각각의 단위 블록에 대한 역양자화(de-quantization)의 작업 단계를 수행할 수 있다. 전자 장치(100)는 각각의 단위 블록에 대한 IDCT(inverse discrete consine transform)의 작업 단계를 수행할 수 있다. 전자 장치(100)는 각각의 단위 블록에 대한 업샘플링(upsampling)의 작업 단계를 수행할 수 있다. 전자 장치(100)는 각각의 단위 블록에 대한 YUV에서 RGB로의 변환(YUV to RGB conversion)의 작업 단계를 수행할 수 있다.
도 4의 (b)는 본 발명의 일 실시 예에 따른 병렬화 방법을 적용한 후의 JPEG 디코딩을 수행하는 작업을 나타낸다.
전자 장치(100)는 프로파일링을 통해, 상기 JPEG 디코딩 작업의 작업 단계별 프로파일링 정보를 획득할 수 있다. 예를 들면, 전자 장치(100)는 상기 JPEG 디코딩 작업의 복수의 작업 단계들 중 연산하는데 가장 많은 실행 시간이 소요되는 작업 단계를 결정할 수 있다. 또는, 전자 장치(100)는 상기 JPEG 디코딩 작업의 전체 실행 시간 중 해당 작업 단계의 실행 시간이 차지하는 비율이 지정된 비율보다 더 큰 작업 단계를 상기 병렬화할 적어도 하나의 작업 단계로 결정할 수 있다. 예컨대, 전자 장치(100)는 상기 JPEG 디코딩 작업의 작업 단계별 프로파일링 정보에 기반하여, 상기 JPEG 디코딩 작업의 복수의 작업 단계들 중에서 역양자화(dequantization)의 작업 단계 또는 IDCT(inverse discrete cosine transform)의 작업 단계를 병렬화하는 것으로 결정할 수 있다.
전자 장치(100)는 하나의 이미지가 분할된 복수의 단위 블록에 대하여 각각의 작업 단계들을 수행할 수 있다. 전자 장치(100)는 복수의 단위 블록에 대해 반복되는 적어도 하나의 작업 단계에 대하여, CPU(120)와 이종 유닛(170)에서 병렬화하여 동시에 처리하도록 결정할 수 있다.
예를 들면, 전자 장치(100)는 상기 프로파일링 정보에 기반하여, 일부의 단위 블록은 CPU(120)에서 수행하고, 일부의 단위 블록은 이종 유닛(170)에서 처리하도록 결정할 수 있다. 전자 장치(100)는 상기 CPU(120)에서 해당 작업 단계를 실행할 때의 실행 시간과 상기 이종 유닛(170)에서 해당 작업 단계를 실행할 때의 실행 시간의 비교에 기초하여, 상기 CPU(120) 또는 상기 이종 유닛(170) 중 각 단위 블록을 처리할 유닛을 결정할 수 있다.
또는, 전자 장치(100)는 상기 독립적으로 실행가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여, CPU(120)와 이종 유닛(170)에서 병렬화하여 동시에 처리하도록 결정할 수 있다.
도 5는 본 발명의 다양한 실시 예에 따라 HDR 이미지를 생성하는 작업에 병렬화 방법을 적용한 후의 성능 향상을 보여주는 그래프이다. 전자 장치(100)는 상기 이미지 레지스트레이션의 작업 단계 중 상기 독립적으로 실행가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여, CPU(120)와 이종 유닛(170)에서 병렬화하여 동시에 처리하도록 결정할 수 있다. 예를 들면, 상기 이미지 레지스트레이션의 작업 단계 중 적어도 일부의 태스크에 해당하는 HDR 정렬 보상(HDR align compensation)과 추정(estimation)을 각각 CPU(120)와 이종 유닛(170)에서 병렬화하여 처리하도록 결정할 수 있다.
상기 그래프는 CPU와 GPU 중 적어도 하나를 이용하여, 이미지 레지스트레이션의 작업 단계 중 적어도 일부의 태스크에 해당하는 HDR 정렬 보상(HDR align compensation)과 추정(estimation)을 수행하는데 소요되는 실행 시간을 도시한 것이다. 도 5의 그래프를 참조하면, CPU만을 사용하여 작업 단계를 수행하는데 소요되는 실행 시간, 기본의 클럭 주파수에서 CPU와 GPU를 병렬화하여 사용하여 작업 단계를 수행하는데 소요되는 실행 시간과 최대의 클럭 주파수에서 CPU와 GPU를 병렬화하여 사용하여 작업 단계를 수행하는데 소요되는 실행 시간을 비교해볼 수 있다. 도 5를 참조하면, 전자 장치(100)가 최대의 클럭 주파수에서 CPU와 GPU를 병렬화하여 사용하는 것으로 최대의 성능 향상을 얻을 수 있다.
표 1은 본 발명의 다양한 실시 예에 따라 HDR 이미지를 생성하는 작업에 병렬화 방법을 적용한 후의 성능 향상을 보여주는 데이터이다.
소요시간(ms) 증감(%) 배터리 소모량(mA) 증감(%)
CPU 버전(기존) 1015 ms 3709 mA
CPU+GPU(normal clock) 837 ms 18%↑ 3707 mA 20%↓
CPU+GPU(maximum clock) 775 ms 24%↑ 3816 mA 23%↓
병렬화 방법의 적용 전후의 실행 시간을 비교해보면, 기존의 CPU 버전에서는 실행 시간이 1015 ms가 소요되었으나, CPU+GPU 버전에서는 기본의 클럭 주파수로 837 ms로 실행 시간이 줄어들었음을 알 수 있다. 또한, 최대 클럭 주파수의 CPU+GPU 버전에서는 775 ms로 실행시간이 줄어들었음을 알 수 있다. 기존 CPU 코드와 비교하여, 실행 시간에 있어서, 기본의 클럭 주파수에서는 18%, 최대 클럭 주파수에서는 24%의 성능 향상이 있음을 알 수 있다.
또한, 병렬화 방법의 적용 전후의 배터리 소모량을 비교해보면, 기존의 CPU 버전에서는 배터리 소모량이 3709 mA가 소모되었으나, CPU+GPU 버전에서는 기본의 클럭 주파수로 3707 mA로 배터리 소모량이 줄어들었음을 알 수 있다. 또한, 최대 클럭 주파수의 CPU+GPU 버전에서는 3816 mA로 배터리 소모량이 줄어들었음을 알 수 있다. 기존 CPU 코드와 비교하여, 배터리 소모량에 있어서, 기본의 클럭 주파수에서는 20%, 최대 클럭 주파수에서는 23%의 성능 향상이 있음을 알 수 있다.
본 발명의 다양한 실시 예에 따른 전자 장치의 전술한 구성요소들 각각은 하나 또는 그 이상의 부품(component)으로 구성될 수 있으며, 해당 구성 요소의 명칭은 전자 장치의 종류에 따라서 달라질 수 있다. 본 발명의 다양한 실시 예에 따른 전자 장치는 전술한 구성요소 중 적어도 하나를 포함하여 구성될 수 있으며, 일부 구성요소가 생략되거나 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 또한, 본 발명의 다양한 실시 예에 따른 전자 장치의 구성 요소들 중 일부가 결합되어 하나의 개체(entity)로 구성됨으로써, 결합되기 이전의 해당 구성 요소들의 기능을 동일하게 수행할 수 있다.
본 개시에 사용된 용어 "모듈"은, 예를 들어, 하드웨어, 소프트웨어 또는 펌웨어(firmware) 중 하나 또는 둘 이상의 조합을 포함하는 단위(unit)를 의미할 수 있다. "모듈"은 예를 들어, 유닛(unit), 로직(logic), 논리 블록(logical block), 부품(component) 또는 회로(circuit) 등의 용어와 바꾸어 사용(interchangeably use)될 수 있다. "모듈"은, 일체로 구성된 부품의 최소 단위 또는 그 일부가 될 수 있다. "모듈"은 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수도 있다. "모듈"은 기계적으로 또는 전자적으로 구현될 수 있다. 예를 들면, 본 개시에 따른 "모듈"은, 알려졌거나 앞으로 개발될, 어떤 동작들을 수행하는 ASIC(Application-Specific Integrated Circuit) 칩, FPGAs(Field-Programmable Gate Arrays) 또는 프로그램 가능 논리 장치(programmable-logic device) 중 적어도 하나를 포함할 수 있다.
다양한 실시 예에 따르면, 본 개시에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는, 예컨대, 프로그래밍 모듈의 형태로 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어는, 하나 이상의 프로세서 (예: 상기 AP 210)에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 읽을 수 있는 저장매체는, 예를 들면, 상기 메모리 230가 될 수 있다. 상기 프로그래밍 모듈의 적어도 일부는, 예를 들면, 상기 AP 210에 의해 구현(implement)(예: 실행)될 수 있다. 상기 프로그래밍 모듈의 적어도 일부는 하나 이상의 기능을 수행하기 위한, 예를 들면, 모듈, 프로그램, 루틴, 명령어 세트 (sets of instructions) 또는 프로세스 등을 포함할 수 있다.
상기 컴퓨터로 판독 가능한 기록 매체에는 하드디스크, 플로피디스크 및 자기 테이프와 같은 마그네틱 매체(Magnetic Media)와, CD-ROM(Compact Disc Read Only Memory), DVD(Digital Versatile Disc)와 같은 광기록 매체(Optical Media)와, 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media)와, 그리고 ROM(Read Only Memory), RAM(Random Access Memory), 플래시 메모리 등과 같은 프로그램 명령(예: 프로그래밍 모듈)을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 개시의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지다.
본 개시에 따른 모듈 또는 프로그래밍 모듈은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 본 개시에 따른 모듈, 프로그래밍 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱(heuristic)한 방법으로 실행될 수 있다. 또한, 일부 동작은 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
그리고 본 명세서와 도면에 개시된 본 개시의 실시 예들은 본 개시의 기술 내용을 쉽게 설명하고 본 개시의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 개시의 범위를 한정하고자 하는 것은 아니다. 따라서 본 개시의 범위는 여기에 개시된 실시 예들 이외에도 본 개시의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 개시의 범위에 포함되는 것으로 해석되어야 한다.
100: 전자 장치
102: 전자 장치
104: 서버
110: 버스
120: CPU (central processing unit)
130: 메모리
131: 커널
132: 미들웨어
133: API
134: 어플리케이션
140: 입출력 인터페이스
150: 디스플레이
160: 통신 인터페이스
162: 네트워크
170: 이종 유닛

Claims (20)

  1. 전자 장치에서 수행하려는 작업(job)의 프로파일링(profiling)을 통해, 상기 작업의 작업 단계(job step)별 프로파일링 정보를 획득하는 동작;
    상기 프로파일링 정보에 기반하여, 상기 작업의 복수의 작업 단계들 중 상기 전자 장치의 CPU(central processing unit)와 상기 CPU와 하나 이상의 이종(異種) 유닛에서 병렬화할 적어도 하나의 작업 단계를 결정하는 동작;
    상기 결정된 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU 또는 상기 이종 유닛 중 각 단위 데이터를 처리할 유닛을 결정하는 동작; 및
    상기 결정된 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여, 상기 프로파일링 정보에 기반하여 상기 CPU 또는 상기 이종 유닛 중 각 태스크를 처리할 유닛을 결정하는 동작을 포함하는 병렬화 방법.
  2. 제1 항에 있어서,
    상기 이종 유닛에서 처리하도록 결정된 적어도 하나의 태스크에 대하여, 상기 태스크를 수행할 상기 이종 유닛의 코어와 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 결정하는 동작을 포함하는 병렬화 방법.
  3. 제2 항에 있어서,
    상기 결정된 함수들의 처리 순서 또는 함수에 따라 상기 태스크의 소스 코드를 상기 이종 유닛에서 수행되는 커널 함수로 재분배하는 동작을 포함하는 병렬화 방법.
  4. 제3 항에 있어서,
    상기 재분배하는 동작은,
    상기 CPU의 소스 코드에 매칭되는 커널 함수를 저장하는 테이블에 기반하여, 상기 태스크의 소스 코드를 상기 이종 유닛에서 수행되는 커널 함수로 재분배하는 병렬화 방법.
  5. 제1 항에 있어서,
    상기 병렬화할 적어도 하나의 작업 단계를 결정하는 동작은,
    상기 작업의 전체 실행 시간 중 해당 작업 단계의 실행 시간이 차지하는 비율이 지정된 비율보다 더 큰 작업 단계를 상기 병렬화할 적어도 하나의 작업 단계로 결정하는 병렬화 방법.
  6. 제1 항에 있어서,
    상기 각 단위 데이터를 처리할 유닛을 결정하는 동작은,
    상기 CPU에서 해당 작업 단계를 실행할 때의 실행 시간과 상기 이종 유닛에서 해당 작업 단계를 실행할 때의 실행 시간의 비교에 기초하여, 상기 CPU 또는 상기 이종 유닛 중 각 단위 데이터를 처리할 유닛을 결정하는 병렬화 방법.
  7. 제1 항에 있어서,
    상기 프로파일링 정보는 상기 작업의 실행 시간과 상기 작업 단계별 실행 시간을 포함하는 병렬화 방법.
  8. 제7 항에 있어서,
    상기 프로파일링 정보는 상기 작업 단계별 실행되는 코드 범위 또는 상기 작업 단계별 실행에 사용되는 메모리량을 포함하는 병렬화 방법.
  9. 제2 항에 있어서,
    상기 병렬화를 통해 획득된 상기 작업의 결과와 상기 병렬화 이전에 획득된 상기 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 동작을 포함하는 병렬화 방법.
  10. 제2 항에 있어서,
    상기 이종 유닛으로 제1 이종 유닛을 이용하여 획득된 상기 작업의 결과와 제2 이종 유닛을 이용하여 획득된 상기 작업의 결과와의 비교에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 동작을 포함하는 병렬화 방법.
  11. 제2 항에 있어서,
    상기 전자 장치에서 상기 병렬화를 통해 획득된 상기 작업을 수행하는데 소요된 전체 실행 시간과 전류 소모량에 기초하여, 상기 태스크에 포함된 함수들의 처리 순서 또는 함수를 조정하는 동작을 포함하는 병렬화 방법.
  12. 제1 항에 있어서,
    상기 작업이 HDR(high dynamic range) 작업이면, 상기 HDR 작업의 작업 단계별 프로파일링 정보에 기반하여, 상기 HDR 작업의 복수의 작업 단계들 중에서 이미지 레지스트레이션(image registration)의 작업 단계 또는 HDR 합성(HDR composition)의 작업 단계 중 적어도 하나를 상기 CPU와 상기 이종 유닛에서 병렬화하는 병렬화 방법.
  13. 제1 항에 있어서,
    상기 작업이 JPEG 디코딩 작업이면, 상기 JPEG 디코딩 작업의 작업 단계별 프로파일링 정보에 기반하여, 상기 JPEG 디코딩 작업의 복수의 작업 단계들 중에서 역양자화(dequantization)의 작업 단계 또는 IDCT(inverse discrete cosine transform)의 작업 단계 중 적어도 하나를 상기 CPU와 상기 이종 유닛에서 병렬화하는 병렬화 방법.
  14. 제1 항에 있어서,
    상기 하나 이상의 이종 유닛 중 적어도 일부는 이종(異種)의 연산처리 유닛(computing processing unit)을 포함하는 병렬화 방법.
  15. 제1 항에 있어서,
    상기 이종 유닛은 적어도 하나의 GPU(graphics processing unit)를 포함하는 병렬화 방법.
  16. 작업 단계(job step)별 프로파일링 정보에 기초하여 결정된 병렬화하는 적어도 하나의 작업 단계 중 CPU(central processing unit)에서 처리하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크를 실행하는 CPU; 및
    상기 병렬화하는 적어도 하나의 작업 단계 중 이종 유닛에서 처리하는 것으로 결정된 적어도 일부의 단위 데이터와 적어도 일부의 태스크를 실행하는 하나 이상의 이종(異種) 유닛;를 포함하고,
    상기 CPU와 상기 이종 유닛 각각에서 실행되는 적어도 일부의 태스크는 상기 결정된 병렬화하는 작업 단계 중 상기 독립적으로 실행 가능한 복수의 태스크를 포함하는 적어도 하나의 작업 단계에 대하여 결정된 것인 전자 장치.
  17. 제16 항에 있어서,
    상기 작업이 HDR(high dynamic range) 작업이면, 상기 CPU와 상기 이종 유닛은 상기 HDR 작업의 복수의 작업 단계들 중에서 이미지 레지스트레이션(image registration)의 작업 단계 또는 HDR 합성(HDR composition)의 작업 단계 중 적어도 하나를 병렬로 수행하는 전자 장치.
  18. 제16 항에 있어서,
    상기 작업이 JPEG 디코딩 작업이면, 상기 CPU와 상기 이종 유닛은 상기 JPEG 디코딩 작업의 복수의 작업 단계들 중에서 역양자화(dequantization)의 작업 단계 또는 IDCT(inverse discrete cosine transform)의 작업 단계 중 적어도 하나를 병렬로 수행하는 전자 장치.
  19. 제16 항에 있어서,
    상기 하나 이상의 이종 유닛 중 적어도 일부는 이종(異種)의 연산처리 유닛(computing processing unit)을 포함하는 전자 장치.
  20. 제16 항에 있어서,
    상기 이종 유닛은 적어도 하나의 GPU(graphics processing unit)를 포함하는 전자 장치.
KR1020140082039A 2014-07-01 2014-07-01 병렬화 방법 및 전자 장치 KR20160003502A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140082039A KR20160003502A (ko) 2014-07-01 2014-07-01 병렬화 방법 및 전자 장치
US14/789,062 US9727382B2 (en) 2014-07-01 2015-07-01 Parallelization method and electronic device based on profiling information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140082039A KR20160003502A (ko) 2014-07-01 2014-07-01 병렬화 방법 및 전자 장치

Publications (1)

Publication Number Publication Date
KR20160003502A true KR20160003502A (ko) 2016-01-11

Family

ID=55017070

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140082039A KR20160003502A (ko) 2014-07-01 2014-07-01 병렬화 방법 및 전자 장치

Country Status (2)

Country Link
US (1) US9727382B2 (ko)
KR (1) KR20160003502A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170116439A (ko) * 2016-04-11 2017-10-19 한국전자통신연구원 태스크 스케줄링 방법 및 장치
KR101879419B1 (ko) * 2017-03-15 2018-08-17 주식회사 클래스액트 병렬처리 알고리즘을 이용한 태스크 분배 방법
KR102221271B1 (ko) * 2019-08-28 2021-02-26 한국해양과학기술원 해색알고리즘 개발지원장치 및 그 동작 방법
KR20220084798A (ko) * 2020-12-14 2022-06-21 현대오토에버 주식회사 멀티 코어 구조의 전자 제어 유닛에서 수행되는 방법, 그리고 이를 구현하기 위한 장치
KR20220128903A (ko) * 2021-03-15 2022-09-22 숙명여자대학교산학협력단 다중 작업 효율화 방법 및 장치

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11513805B2 (en) * 2016-08-19 2022-11-29 Wisconsin Alumni Research Foundation Computer architecture with synergistic heterogeneous processors
DE102016223484B4 (de) * 2016-11-25 2021-04-15 Fujitsu Limited Bestimmen von Ähnlichkeiten in Computersoftwarecodes zur Leistungsanalyse
WO2018190649A1 (en) * 2017-04-12 2018-10-18 Samsung Electronics Co., Ltd. Method and apparatus for generating hdr images
KR102485935B1 (ko) 2018-02-23 2023-01-10 삼성전자주식회사 전자 장치 및 그의 동작 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7299466B2 (en) * 2001-12-20 2007-11-20 Cadence Design Systems, Inc. Mechanism for managing execution environments for aggregated processes
CN101371583B (zh) 2006-01-23 2012-03-21 马普科技促进协会 编码/解码高动态范围图像的方法和设备
US7730119B2 (en) * 2006-07-21 2010-06-01 Sony Computer Entertainment Inc. Sub-task processor distribution scheduling
US8284205B2 (en) * 2007-10-24 2012-10-09 Apple Inc. Methods and apparatuses for load balancing between multiple processing units
TWI468015B (zh) * 2007-10-26 2015-01-01 Ind Tech Res Inst 視訊解碼的平行處理裝置及方法
US8869163B2 (en) * 2011-01-18 2014-10-21 Mindspeed Technologies, Inc. Integrated environment for execution monitoring and profiling of applications running on multi-processor system-on-chip
US8711248B2 (en) * 2011-02-25 2014-04-29 Microsoft Corporation Global alignment for high-dynamic range image generation

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170116439A (ko) * 2016-04-11 2017-10-19 한국전자통신연구원 태스크 스케줄링 방법 및 장치
KR101879419B1 (ko) * 2017-03-15 2018-08-17 주식회사 클래스액트 병렬처리 알고리즘을 이용한 태스크 분배 방법
KR102221271B1 (ko) * 2019-08-28 2021-02-26 한국해양과학기술원 해색알고리즘 개발지원장치 및 그 동작 방법
KR20220084798A (ko) * 2020-12-14 2022-06-21 현대오토에버 주식회사 멀티 코어 구조의 전자 제어 유닛에서 수행되는 방법, 그리고 이를 구현하기 위한 장치
KR20220128903A (ko) * 2021-03-15 2022-09-22 숙명여자대학교산학협력단 다중 작업 효율화 방법 및 장치

Also Published As

Publication number Publication date
US9727382B2 (en) 2017-08-08
US20160004570A1 (en) 2016-01-07

Similar Documents

Publication Publication Date Title
US9727382B2 (en) Parallelization method and electronic device based on profiling information
US10726585B2 (en) Method and electronic device for converting color of image
US10069327B2 (en) Electronic device and method for charging battery based on a plurality of power sources
US10692472B2 (en) Method and device for adjusting resolution of electronic device
US9805438B2 (en) Dynamically rebalancing graphics processor resources
US20160004564A1 (en) Method for task scheduling and electronic device using the same
US9965822B2 (en) Electronic device and method for processing a plurality of image pieces
US20160196286A1 (en) Method and apparatus for managing image metadata
US9767360B2 (en) Image processing method and electronic device implementing the same
US20170208334A1 (en) Method and apparatus for processing image data
US9491402B2 (en) Electronic device and method of processing image in electronic device
US9942467B2 (en) Electronic device and method for adjusting camera exposure
US10326936B2 (en) Method for providing images and electronic device supporting the same
US10067951B2 (en) Method for creating binary code and electronic device thereof
US10182196B2 (en) Method of processing image of electronic device and electronic device thereof
US20170161880A1 (en) Image processing method and electronic device implementing the same
KR20160137258A (ko) 전자 장치 및 그의 화면 표시 방법
US9898799B2 (en) Method for image processing and electronic device supporting thereof
US9959598B2 (en) Method of processing image and electronic device thereof
US20130307860A1 (en) Preempting Fixed Function Media Devices
US20180139335A1 (en) Method for identifying data usage and electronic device implementing the same
KR102269590B1 (ko) 바이너리 생성 방법 및 그 전자 장치
US20130326351A1 (en) Video Post-Processing on Platforms without an Interface to Handle the Video Post-Processing Request from a Video Player
KR20170116533A (ko) 촬영 장치 및 그 제어 방법

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination