KR102205087B1 - 공유형 머신 러닝 데이터 구조 - Google Patents
공유형 머신 러닝 데이터 구조 Download PDFInfo
- Publication number
- KR102205087B1 KR102205087B1 KR1020187031723A KR20187031723A KR102205087B1 KR 102205087 B1 KR102205087 B1 KR 102205087B1 KR 1020187031723 A KR1020187031723 A KR 1020187031723A KR 20187031723 A KR20187031723 A KR 20187031723A KR 102205087 B1 KR102205087 B1 KR 102205087B1
- Authority
- KR
- South Korea
- Prior art keywords
- machine learning
- processing resource
- real
- model
- processing
- Prior art date
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 254
- 238000012545 processing Methods 0.000 claims abstract description 317
- 238000000034 method Methods 0.000 claims description 30
- 230000007704 transition Effects 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000005670 electromagnetic radiation Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000001465 metallisation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3889—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute
- G06F9/3891—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute organised in groups of units sharing resources, e.g. clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1605—Handling requests for interconnection or transfer for access to memory bus based on arbitration
- G06F13/1652—Handling requests for interconnection or transfer for access to memory bus based on arbitration in a multiprocessor architecture
- G06F13/1663—Access to shared memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/084—Multiuser, multiprocessor or multiprocessing cache systems with a shared cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Advance Control (AREA)
- Memory System (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Storing Facsimile Image Data (AREA)
Abstract
Description
도 1b는 본 발명을 이용할 수 있는 일 예의 시스템의 일부 컴포넌트의 블록도이다.
도 2는 본 발명을 이용할 수 있는 일 예의 시스템의 일부 컴포넌트의 블록도이다.
도 3은 일 예의 시스템의 일부 컴포넌트의 블록도이다.
도 4는 일 예의 시스템에 의해 수행될 수 있는 일 예의 동작의 시퀀스를 나타내는 흐름도이다.
도 5는 일 예의 시스템에 의해 수행될 수 있는 일 예의 동작의 시퀀스를 나타내는 흐름도이다.
도 6은 일 예의 시스템에 의해 수행될 수 있는 일 예의 동작의 시퀀스를 나타내는 흐름도이다.
도 7은 일 예의 시스템에 의해 수행될 수 있는 일 예의 동작의 시퀀스를 나타내는 흐름도이다.
도면 전체에 걸쳐서, 동일한 참조 번호는 유사하지만 반드시 동일하지는 않은 요소를 나타낸다. 또한, 도면은 설명과 일치하는 예 및/또는 구현예를 제공하지만, 그 설명은 도면에 제공된 예 및/또는 구현예에 제한되지 않는다.
Claims (16)
- 시스템으로서,
적어도 하나의 머신 러닝 모델을 포함하는 머신 러닝 데이터 구조를 저장하는 비 휘발성 메모리와;
상기 비 휘발성 메모리에 결합되어, 상기 머신 러닝 데이터 구조에 액세스하는 제 1 프로세싱 리소스와;
적어도 하나의 그래픽 프로세싱 코어를 구비한 제 2 프로세싱 리소스와;
프로세싱 엔진
을 포함하되,
상기 제 2 프로세싱 리소스는 상기 비 휘발성 메모리에 결합되어 상기 머신 러닝 데이터 구조에 액세스함으로써, 상기 머신 러닝 데이터 구조는 상기 제 1 프로세싱 리소스 및 상기 제 2 프로세싱 리소스의 공유 메모리 공간이 되고,
상기 프로세싱 엔진은,
상기 제 2 프로세싱 리소스의 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여, 상기 적어도 하나의 머신 러닝 모델의 동작을 실행하는 동안, 상기 제 1 프로세싱 리소스를 이용하여, 상기 적어도 하나의 머신 러닝 모델에 대응하는 명령 및 데이터 중 하나 이상을 인출함으로써 상기 적어도 하나의 머신 러닝 모델의 실행을 조정(coordinate)하는
시스템.
- 삭제
- 제 1 항에 있어서,
상기 제 1 프로세싱 리소스에 결합된 실시간 데이터 입력부를 더 포함하되,
상기 프로세싱 엔진은 또한,
상기 제 1 프로세싱 리소스를 이용하여, 상기 비 휘발성 메모리의 상기 머신 러닝 데이터 구조에 상기 실시간 데이터 입력부로부터 수신된 실시간 데이터 스트림을 저장하고,
상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여, 상기 실시간 데이터 스트림의 서브세트에 대해 상기 적어도 하나의 머신 러닝 모델의 동작을 실행하여, 상기 실시간 데이터 스트림에 대한 모델 결과를 생성하는
시스템.
- 제 3 항에 있어서,
상기 실시간 데이터 스트림은 실시간 비디오 데이터 스트림이고, 상기 실시간 데이터 스트림의 상기 서브세트는 상기 실시간 비디오 데이터 스트림의 타임 슬라이스에 대응하고, 상기 적어도 하나의 머신 러닝 모델은 객체 인식 머신 러닝 모델을 포함하는
시스템.
- 제 1 항에 있어서,
상기 머신 러닝 데이터 구조는 적어도 두 개의 머신 러닝 모델을 구비하고,
상기 프로세싱 엔진은 또한,
상기 제 2 프로세싱 리소스 상에서 상기 적어도 하나의 그래픽 프로세싱 코어를 이용한 상기 적어도 두 개의 머신 러닝 모델의 실행 및 전환을 상기 제 1 프로세싱 리소스를 이용하여 조정하는
시스템.
- 제 1 항에 있어서,
상기 머신 러닝 데이터 구조는 머신 러닝 모델의 세트를 저장하고,
상기 프로세싱 엔진은 또한,
상기 제 1 프로세싱 리소스를 이용하여, 상기 머신 러닝 데이터 구조에 실시간 데이터 스트림을 저장하고;
상기 제 1 프로세싱 리소스를 이용하여 그리고 상기 머신 러닝 모델의 세트로부터, 실시간 데이터와 관련된 데이터의 타입에 적어도 부분적으로 기초하여 실행될 적어도 제 1 머신 러닝 모델 및 제 2 머신 러닝 모델을 결정하고;
상기 실시간 데이터의 각각의 서브세트에 대해, 그리고 상기 머신 러닝 구조에 상기 실시간 데이터를 저장하는 것과 동시에:
제 1 프로세싱 리소스를 이용하여, 상기 실시간 데이터의 각각의 서브세트에 대한 제 1 머신 러닝 모델의 실행을 조정하고,
상기 제 2 프로세싱 리소스의 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여, 상기 실시간 데이터의 각각의 서브세트에 대해 상기 제 1 머신 러닝 모델의 동작을 실행하여, 상기 실시간 데이터의 각각의 서브세트에 대한 각각의 제 1 모델 결과를 생성하며,
상기 제 1 머신 러닝 모델의 실행 후, 상기 제 2 머신 러닝 모델의 실행으로의 전환을 조정하고,
제 2 프로세싱 리소스의 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여, 상기 실시간 데이터의 각각의 서브세트에 대해 상기 제 2 머신 러닝 모델의 동작을 실행하여, 상기 실시간 데이터의 각각의 서브세트에 대한 각각의 제 2 모델 결과를 생성하는
시스템.
- 제 6 항에 있어서,
상기 프로세싱 엔진은 또한,
상기 제 1 프로세싱 리소스를 이용하여, 상기 실시간 데이터의 각각의 서브세트에 대응하는 상기 각각의 제 1 모델 결과 및 상기 제 2 모델 결과를 프로세싱하는
시스템.
- 제 1 항에 있어서,
상기 머신 러닝 데이터 구조는 머신 러닝 데이터 인덱스를 저장하고, 상기 제 1 프로세싱 리소스는 상기 머신 러닝 데이터 인덱스에 적어도 부분적으로 기초하여 상기 머신 러닝 데이터 구조에 액세스하고, 제 2 프로세싱 리소스는 상기 머신 러닝 데이터 인덱스에 적어도 부분적으로 기초하여 상기 머신 러닝 데이터 구조에 액세스하는
시스템.
- 방법으로서,
비 휘발성 메모리에 결합된 제 1 프로세싱 리소스를 이용하여, 상기 비 휘발성 메모리의 공유 메모리 공간에 저장된 머신 러닝 데이터 구조에 액세스하는 것과;
상기 비 휘발성 메모리에 결합된 적어도 하나의 그래픽 프로세싱 코어를 구비한 제 2 프로세싱 리소스를 이용하여, 상기 머신 러닝 데이터 구조에 액세스하는 것과;
상기 제 2 프로세싱 리소스의 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여, 상기 머신 러닝 데이터 구조에 저장된 데이터세트에 대해 상기 머신 러닝 데이터 구조에 저장된 적어도 두 개의 머신 러닝 모델의 동작을 실행하는 동안 상기 머신 러닝 모델에 대응하는 명령 및 데이터 중 하나 이상을 인출하는 것을 포함하는
방법.
- 제 9 항에 있어서,
상기 적어도 두 개의 머신 러닝 모델의 동작을 실행하는 것은,
상기 데이터세트에 대해 제 1 머신 러닝 모델의 동작을 실행하여, 제 1 모델 결과를 생성하는 것과;
상기 제 1 머신 러닝 모델의 동작을 실행한 후, 상기 데이터세트에 대해 제 2 머신 러닝 모델의 동작을 실행하는 것으로 전환하여, 제 2 모델 결과를 생성하는 것을 포함하는
방법.
- 제 10 항에 있어서,
상기 제 1 모델 결과에 적어도 부분적으로 기초하여 상기 제 1 머신 러닝 모델을 업데이트하는 것과;
상기 제 2 모델 결과에 적어도 부분적으로 기초하여 상기 제 2 머신 러닝 모델을 업데이트하는 것과;
상기 제 1 머신 러닝 모델 및 상기 제 2 머신 러닝 모델을 업데이트한 후, 상기 데이터세트에 대해 상기 제 1 머신 러닝 모델 및 상기 제 2 머신 러닝 모델의 동작을 실행하여, 업데이트된 제 1 모델 결과 및 업데이트된 제 2 모델 결과를 생성하는 것을 포함하는
방법.
- 제 9 항에 있어서,
상기 데이터세트는 실시간 데이터 스트림이고, 상기 제 1 프로세싱 리소스를 이용하여 상기 머신 러닝 데이터 구조에 액세스하는 것은 상기 제 1 프로세싱 리소스를 이용하여 상기 실시간 데이터 스트림을 상기 머신 러닝 데이터 구조에 저장하는 것을 포함하고, 상기 실시간 데이터 스트림에 대한 저장된 상기 적어도 두 개의 머신 러닝 모델의 동작은, 상기 제 1 프로세싱 리소스를 이용하여 상기 실시간 데이터 스트림을 상기 머신 러닝 데이터 구조에 저장하는 것과 동시에, 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여 실행되는
방법.
- 제 10 항에 있어서,
상기 머신 러닝 데이터 구조는 머신 러닝 모델의 세트를 저장하고,
상기 방법은,
상기 데이터세트의 데이터 타입에 적어도 부분적으로 기초하여 상기 데이터세트에 대해 실행될 상기 적어도 두 개의 머신 러닝 모델을 결정하는 것을 더 포함하는
방법.
- 시스템으로 하여금 아래의 동작을 수행하게 하기 위해 상기 시스템의 프로세싱 리소스에 의해 실행가능한 명령어를 포함하는 비 일시적 머신 판독가능 저장 매체로서, 상기 동작은,
상기 시스템의 제 1 프로세싱 리소스를 이용하여 상기 시스템의 비 휘발성 메모리의 공유 메모리 공간에 저장된 머신 러닝 데이터 구조에 액세스하는 것과;
상기 제 1 프로세싱 리소스를 이용하여 상기 머신 러닝 데이터 구조에 저장된 데이터세트에 대해 실행될, 상기 머신 러닝 데이터 구조에 저장된 머신 러닝 모델의 세트를 결정하는 것과;
적어도 하나의 그래픽 프로세싱 코어를 구비한 상기 시스템의 제 2 프로세싱 리소스를 이용하여 상기 머신 러닝 데이터 구조에 액세스하는 것과;
상기 제 2 프로세싱 리소스의 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여 상기 데이터세트에 대해 머신 러닝 모델의 세트의 동작을 실행하여, 상기 머신 러닝 모델의 세트의 각각의 머신 러닝 모델에 대한 모델 결과를 생성하는 동안, 상기 제 1 프로세싱 리소스로 상기 머신 러닝 모델의 세트에 대응하는 명령 및 데이터 중 하나 이상을 인출하는 것을 포함하는
비 일시적 머신 판독가능 저장 매체.
- 제 14 항에 있어서,
상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여 상기 데이터세트에 대해 머신 러닝 모델의 세트의 동작을 실행하기 위한 명령어는 상기 시스템으로 하여금,
상기 데이터세트의 각각의 데이터 서브세트에 대해, 그리고 상기 머신 러닝 모델의 세트의 각각의 머신 러닝 모델의 동작을 실행한 후에, 상기 제 2 프로세싱 리소스의 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여 상기 세트의 다음의 각각의 머신 러닝 모델의 동작의 실행으로 전환하게 하는 명령어를 포함하는
비 일시적 머신 판독가능 저장 매체.
- 제 14 항에 있어서,
상기 데이터세트는 실시간 데이터 스트림이고,
상기 머신 판독가능 저장 매체는 상기 시스템으로 하여금,
상기 제 1 프로세싱 리소스를 이용하여 상기 실시간 데이터 스트림을 상기 비 휘발성 메모리의 머신 러닝 데이터 구조에 저장하게 하는 명령어를 더 포함하고,
상기 시스템은 상기 머신 러닝 데이터 구조에 상기 실시간 데이터 스트림의 저장과 동시에, 상기 제 2 프로세싱 리소스의 상기 적어도 하나의 그래픽 프로세싱 코어를 이용하여 상기 실시간 데이터 스트림에 대해 상기 머신 러닝 모델의 세트의 동작을 실행하는 것인
비 일시적 머신 판독가능 저장 매체.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2016/038128 WO2017218009A1 (en) | 2016-06-17 | 2016-06-17 | Shared machine-learning data structure |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180122741A KR20180122741A (ko) | 2018-11-13 |
KR102205087B1 true KR102205087B1 (ko) | 2021-01-20 |
Family
ID=60664580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187031723A KR102205087B1 (ko) | 2016-06-17 | 2016-06-17 | 공유형 머신 러닝 데이터 구조 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11797459B2 (ko) |
EP (1) | EP3436929A4 (ko) |
JP (1) | JP6928616B2 (ko) |
KR (1) | KR102205087B1 (ko) |
CN (1) | CN109416636B (ko) |
BR (1) | BR112018072407A2 (ko) |
WO (1) | WO2017218009A1 (ko) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10803941B2 (en) * | 2014-12-22 | 2020-10-13 | Mohammad A. Mazed | System on chip (SoC) based on neural processor or microprocessor |
US10241921B2 (en) * | 2017-04-17 | 2019-03-26 | Intel Corporation | Avoid cache lookup for cold cache |
US11436524B2 (en) * | 2018-09-28 | 2022-09-06 | Amazon Technologies, Inc. | Hosting machine learning models |
US11562288B2 (en) | 2018-09-28 | 2023-01-24 | Amazon Technologies, Inc. | Pre-warming scheme to load machine learning models |
KR102167643B1 (ko) * | 2019-01-25 | 2020-10-19 | 서울대학교산학협력단 | 머신러닝 기반의 비정상 분기 탐지 장치 및 그 방법 |
US11176493B2 (en) * | 2019-04-29 | 2021-11-16 | Google Llc | Virtualizing external memory as local to a machine learning accelerator |
US11175958B2 (en) * | 2019-05-01 | 2021-11-16 | International Business Machines Corporation | Determine a load balancing mechanism for allocation of shared resources in a storage system using a machine learning module based on number of I/O operations |
US11397694B2 (en) * | 2019-09-17 | 2022-07-26 | Micron Technology, Inc. | Memory chip connecting a system on a chip and an accelerator chip |
US12026626B1 (en) * | 2020-02-18 | 2024-07-02 | Nvidia Corporation | Multi-level and multi-label content classification using unsupervised and ensemble machine learning techniques |
US11371148B2 (en) * | 2020-08-24 | 2022-06-28 | Applied Materials, Inc. | Fabricating a recursive flow gas distribution stack using multiple layers |
WO2023010302A1 (en) * | 2021-08-04 | 2023-02-09 | Qualcomm Incorporated | Machine learning group switching |
CN113722319A (zh) * | 2021-08-05 | 2021-11-30 | 平凯星辰(北京)科技有限公司 | 基于学习索引的数据存储方法 |
US20230083161A1 (en) * | 2021-09-16 | 2023-03-16 | Accenture Global Solutions Limited | Systems and methods for low latency analytics and control of devices via edge nodes and next generation networks |
US12118065B1 (en) * | 2021-12-22 | 2024-10-15 | Wells Fargo Bank, N.A. | Systems and methods for using regime switching to mitigate deterioration in performance of a modeling system |
KR20240024485A (ko) * | 2022-08-17 | 2024-02-26 | 삼성전자주식회사 | 모델들에 의하여 공통으로 이용되는 정보에 기반하여 모델들을 구동하기 위한 전자 장치 및 그 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140198116A1 (en) * | 2011-12-28 | 2014-07-17 | Bryan E. Veal | A method and device to augment volatile memory in a graphics subsystem with non-volatile memory |
WO2016094635A1 (en) * | 2014-12-12 | 2016-06-16 | Behavioral Recognition Systems, Inc. | Perceptual associative memory for a neuro-linguistic behavior recognition system |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5829013A (en) * | 1995-12-26 | 1998-10-27 | Intel Corporation | Memory manager to allow non-volatile memory to be used to supplement main memory |
US7219085B2 (en) | 2003-12-09 | 2007-05-15 | Microsoft Corporation | System and method for accelerating and optimizing the processing of machine learning techniques using a graphics processing unit |
JP4912028B2 (ja) | 2006-05-01 | 2012-04-04 | 日本電信電話株式会社 | 逐次学習式非定常映像検出装置,逐次学習式非定常映像検出方法及びその方法を実装したプログラム |
EP2118864B1 (en) * | 2007-02-08 | 2014-07-30 | Behavioral Recognition Systems, Inc. | Behavioral recognition system |
US8189905B2 (en) * | 2007-07-11 | 2012-05-29 | Behavioral Recognition Systems, Inc. | Cognitive model for a machine-learning engine in a video analysis system |
GB2462860B (en) | 2008-08-22 | 2012-05-16 | Advanced Risc Mach Ltd | Apparatus and method for communicating between a central processing unit and a graphics processing unit |
US8311115B2 (en) | 2009-01-29 | 2012-11-13 | Microsoft Corporation | Video encoding using previously calculated motion information |
US9177486B2 (en) | 2009-09-29 | 2015-11-03 | Advanced Training System Llc | Shifter force detection |
US8538741B2 (en) | 2009-12-15 | 2013-09-17 | Ati Technologies Ulc | Apparatus and method for partitioning a display surface into a plurality of virtual display areas |
US8669990B2 (en) * | 2009-12-31 | 2014-03-11 | Intel Corporation | Sharing resources between a CPU and GPU |
CN102004671B (zh) * | 2010-11-15 | 2013-03-13 | 北京航空航天大学 | 一种云计算环境下数据中心基于统计模型的资源管理方法 |
JP5369079B2 (ja) | 2010-12-03 | 2013-12-18 | 日本電信電話株式会社 | 音響モデル作成方法とその装置とプログラム |
US9171264B2 (en) | 2010-12-15 | 2015-10-27 | Microsoft Technology Licensing, Llc | Parallel processing machine learning decision tree training |
US8762298B1 (en) | 2011-01-05 | 2014-06-24 | Narus, Inc. | Machine learning based botnet detection using real-time connectivity graph based traffic features |
US8364613B1 (en) * | 2011-07-14 | 2013-01-29 | Google Inc. | Hosting predictive models |
WO2013101179A1 (en) * | 2011-12-30 | 2013-07-04 | Intel Corporation | Write mechanism for storage class memory |
US9378572B2 (en) | 2012-08-17 | 2016-06-28 | Intel Corporation | Shared virtual memory |
CA2841472C (en) * | 2013-02-01 | 2022-04-19 | Brokersavant, Inc. | Machine learning data annotation apparatuses, methods and systems |
US9171478B2 (en) * | 2013-03-15 | 2015-10-27 | International Business Machines Corporation | Learning model for dynamic component utilization in a question answering system |
US9626732B2 (en) | 2013-10-10 | 2017-04-18 | Intel Corporation | Supporting atomic operations as post-synchronization operations in graphics processing architectures |
JP6201792B2 (ja) * | 2014-02-06 | 2017-09-27 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN104035751B (zh) | 2014-06-20 | 2016-10-12 | 深圳市腾讯计算机系统有限公司 | 基于多图形处理器的数据并行处理方法及装置 |
CN104036451B (zh) | 2014-06-20 | 2018-12-11 | 深圳市腾讯计算机系统有限公司 | 基于多图形处理器的模型并行处理方法及装置 |
US10102480B2 (en) * | 2014-06-30 | 2018-10-16 | Amazon Technologies, Inc. | Machine learning service |
US10325219B2 (en) | 2014-07-18 | 2019-06-18 | Facebook, Inc. | Parallel retrieval of training data from multiple producers for machine learning systems |
US10387794B2 (en) * | 2015-01-22 | 2019-08-20 | Preferred Networks, Inc. | Machine learning with model filtering and model mixing for edge devices in a heterogeneous environment |
CN105094985A (zh) * | 2015-07-15 | 2015-11-25 | 上海新储集成电路有限公司 | 一种共享内存池的低功耗数据中心及其工作方法 |
CN105227669A (zh) | 2015-10-15 | 2016-01-06 | 浪潮(北京)电子信息产业有限公司 | 一种面向深度学习的cpu与gpu混合的集群架构系统 |
US11087234B2 (en) * | 2016-01-29 | 2021-08-10 | Verizon Media Inc. | Method and system for distributed deep machine learning |
CN105912500B (zh) * | 2016-03-30 | 2017-11-14 | 百度在线网络技术(北京)有限公司 | 机器学习模型生成方法和装置 |
-
2016
- 2016-06-17 KR KR1020187031723A patent/KR102205087B1/ko active IP Right Grant
- 2016-06-17 CN CN201680085228.2A patent/CN109416636B/zh active Active
- 2016-06-17 BR BR112018072407-6A patent/BR112018072407A2/pt not_active Application Discontinuation
- 2016-06-17 EP EP16905662.9A patent/EP3436929A4/en not_active Withdrawn
- 2016-06-17 US US16/096,446 patent/US11797459B2/en active Active
- 2016-06-17 WO PCT/US2016/038128 patent/WO2017218009A1/en active Application Filing
- 2016-06-17 JP JP2018557033A patent/JP6928616B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140198116A1 (en) * | 2011-12-28 | 2014-07-17 | Bryan E. Veal | A method and device to augment volatile memory in a graphics subsystem with non-volatile memory |
WO2016094635A1 (en) * | 2014-12-12 | 2016-06-16 | Behavioral Recognition Systems, Inc. | Perceptual associative memory for a neuro-linguistic behavior recognition system |
Also Published As
Publication number | Publication date |
---|---|
WO2017218009A1 (en) | 2017-12-21 |
CN109416636A (zh) | 2019-03-01 |
US11797459B2 (en) | 2023-10-24 |
CN109416636B (zh) | 2023-05-26 |
KR20180122741A (ko) | 2018-11-13 |
BR112018072407A2 (pt) | 2019-02-19 |
JP2019525277A (ja) | 2019-09-05 |
US20190130300A1 (en) | 2019-05-02 |
EP3436929A4 (en) | 2019-10-16 |
EP3436929A1 (en) | 2019-02-06 |
JP6928616B2 (ja) | 2021-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102205087B1 (ko) | 공유형 머신 러닝 데이터 구조 | |
US10884957B2 (en) | Pipeline circuit architecture to provide in-memory computation functionality | |
KR102625762B1 (ko) | 다중-태스크 순환 신경망 | |
US10379772B2 (en) | Apparatuses and methods for operations using compressed and decompressed data | |
KR102526619B1 (ko) | 지속적인 컴퓨팅을 위한 저 전력 및 저 대기시간 gpu 코프로세서 | |
KR102487616B1 (ko) | 비휘발성 메모리 디바이스의 열화에 대한 동적 보상 | |
US20190057727A1 (en) | Memory device to provide in-memory computation functionality for a pipeline circuit architecture | |
US20200159812A1 (en) | Compression-encoding scheduled inputs for matrix computations | |
EP3938866A1 (en) | Selectively controlling memory power for scheduled computations | |
US20210319821A1 (en) | Integrated Circuit Device with Deep Learning Accelerator and Random Access Memory | |
CN111752530A (zh) | 对块稀疏度的机器学习架构支持 | |
Brousseau et al. | An energy-efficient, fast FPGA hardware architecture for OpenCV-compatible object detection | |
US20220147812A1 (en) | Compiler with an artificial neural network to optimize instructions generated for execution on a deep learning accelerator of artificial neural networks | |
Vokorokos et al. | A multicore architecture focused on accelerating computer vision computations | |
US10997497B2 (en) | Calculation device for and calculation method of performing convolution | |
US12118460B2 (en) | Discovery of hardware characteristics of deep learning accelerators for optimization via compiler | |
WO2022098496A1 (en) | Deep learning accelerators with configurable hardware options optimizable via compiler | |
WO2015199734A1 (en) | Buffer-based update of state data | |
US12094531B2 (en) | Caching techniques for deep learning accelerator | |
US9658976B2 (en) | Data writing system and method for DMA | |
JP7335952B2 (ja) | ベクトル述語要約の生成 | |
Soós et al. | Gpu boosted cnn simulator library for graphical flow-based programmability | |
US11947487B2 (en) | Enabling accelerated processing units to perform dataflow execution | |
US20230069768A1 (en) | Distributed Camera System | |
US20240086257A1 (en) | Direct dataflow compute-in-memory accelerator interface and architecture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20181031 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200303 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20201228 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210114 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210114 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |