KR20150131388A - 데이터 볼륨들을 감소시키기 위한 장치 - Google Patents

데이터 볼륨들을 감소시키기 위한 장치 Download PDF

Info

Publication number
KR20150131388A
KR20150131388A KR1020157030155A KR20157030155A KR20150131388A KR 20150131388 A KR20150131388 A KR 20150131388A KR 1020157030155 A KR1020157030155 A KR 1020157030155A KR 20157030155 A KR20157030155 A KR 20157030155A KR 20150131388 A KR20150131388 A KR 20150131388A
Authority
KR
South Korea
Prior art keywords
data
rti
stage
meta
analyzer
Prior art date
Application number
KR1020157030155A
Other languages
English (en)
Inventor
조지 존 프란고우
Original Assignee
펜터랙트28 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 펜터랙트28 리미티드 filed Critical 펜터랙트28 리미티드
Publication of KR20150131388A publication Critical patent/KR20150131388A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/55Compression Theory, e.g. compression of random number, repeated compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Holo Graphy (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

데이터 볼륨들을 감소시키기 위한 장치가 제공되고, 이 장치는 하기를 포함한다:
a. 퍼지셜(fuzzyfier), 추론, 및 출력 핸들링을 포함하는 퍼지 논리 제어기,
b. 메타-키들(1b)을 출력하는 타입 리듀서(type reducer),
c. 데이터 뉴메리셜(numerifier)(1c), 및
d. 데이터 정규화기(1c)
를 포함하는,
(1) 소스 시스템 데이터 프로파일러 및 추출기 서브시스템;
a. 공분산 행렬 계산기 및 고유값 계산기를 갖는 2-단계 주성분 분석기(PCA:principle component analyser), 및
(ⅰ) 제1 차원 리듀서(dimensional reducer),
(ⅱ) 잔차 분석 분류기(residual analysis classifier),
(ⅲ) 비교기, 및
(ⅳ) 실패 타입 1 분류 모듈(classify failure type 1 module)
을 포함하는,
b. 스테이지 1 충실도 분석기(fidelity analyser)(2b)
를 포함하는,
(2) 스테이지 1 데이터 감소 서브시스템(2);
a. 단체 근사화(simplicial approximation)를 수행하는 립 복체 계산기(rips complex calculator),
b. 호몰로지 및 그룹 계산기(homology and groups calculator),
c. 지속적 호몰로지 컨버터,
(ⅰ) 제2 차원 리듀서,
(ⅱ) 데이터모폴로지(datamorphology),
(ⅲ) 명령 시퀀스,
(ⅳ) 실패 타입 2 분류 모듈, 및
(ⅴ) 제2 비교기
를 포함하는,
d. 스테이지 2 충실도 분석기
를 포함하는,
(3) 스테이지 2 데이터 감소 지속적 호몰로지 머신(3)(PHM:persistent homology machine); 및
a. 데이터모폴로지 및 명령 시퀀스를 포함하는 최적 토폴로지컬 데이터 표현(optimum topological data representation),
b. 자신의 변동성 표면(fluctuating surface)에 최적 토폴로지컬 데이터 표현의 내부 프로젝션(internal projection)을 기록한, 토폴로지컬 경계 표면(TBS:topological boundary surface) 레코더로 불리는 판독 기록(RW:read write) 레코딩 시스템, 및
c. 홀로그램과 메타-키들의 디지털 멀티플렉싱
을 포함하는,
(4) 스테이지 3 데이터 감소 홀로그래픽 생성 수단(4).

Description

데이터 볼륨들을 감소시키기 위한 장치{APPARATUS FOR REDUCING DATA VOLUMES}
본 발명은 데이터 볼륨들을 감소시키기 위한 장치에 관한 것이다.
데이터에 의해 점유되는 볼륨을 감소시킬 필요가 존재한다.
본 발명의 목표는 위의 필요를 감소시키는 것이다.
따라서, 본 발명의 하나의 비-제한적 실시예에서는, 데이터 볼륨들을 감소시키기 위한 장치가 제공되고, 이 장치는 하기를 포함한다:
a. 퍼지셜(fuzzyfier), 추론, 및 출력 핸들링을 포함하는 퍼지 논리 제어기,
b. 메타-키들을 출력하는 타입 리듀서(type reducer),
c. 데이터 뉴메리셜(numerifier), 및
d. 데이터 정규화기
를 포함하는,
(1) 소스 시스템 데이터 프로파일러 및 추출기 서브시스템;
a. 공분산 행렬 계산기 및 고유값 계산기를 갖는 2-단계 주성분 분석기(PCA:principle component analyser), 및
(ⅰ) 제1 차원 리듀서(dimensional reducer),
(ⅱ) 잔차 분석 분류기(residual analysis classifier),
(ⅲ) 비교기, 및
(ⅳ) 실패 타입 1 분류 모듈(classify failure type 1 module)
을 포함하는,
b. 스테이지 1 충실도 분석기(fidelity analyser)
를 포함하는,
(2) 스테이지 1 데이터 감소 서브시스템;
a. 단체 근사화(simplicial approximation)를 수행하는 립 복체 계산기(rips complex calculator),
b. 호몰로지 및 그룹 계산기(homology and groups calculator),
c. 지속적 호몰로지 컨버터,
(ⅰ) 제2 차원 리듀서,
(ⅱ) 데이터모폴로지(datamorphology),
(ⅲ) 명령 시퀀스,
(ⅳ) 실패 타입 2 분류 모듈, 및
(ⅴ) 제2 비교기
를 포함하는,
d. 스테이지 2 충실도 분석기
를 포함하는,
(3) 스테이지 2 데이터 감소 지속적 호몰로지 머신(PHM:persistent homology machine); 및
a. 데이터모폴로지 및 명령 시퀀스를 포함하는 최적 토폴로지컬 데이터 표현(optimum topological data representation),
b. 자신의 변동성 표면(fluctuating surface)에 최적 토폴로지컬 데이터 표현의 내부 프로젝션(internal projection)을 기록한, 토폴로지컬 경계 표면(TBS:topological boundary surface) 레코더로 불리는 판독 기록(RW:read write) 레코딩 시스템, 및
c. 홀로그램과 메타-키들의 디지털 멀티플렉싱
을 포함하는,
(4) 스테이지 3 데이터 감소 홀로그래픽 생성 수단.
이 장치는, 언제까지나 소스 데이터를 재구성할 필요 없이, 홀로그램 및 메타-키들과 상호작용하는 목적지 시스템들을 포함하는 장치일 수 있다.
목적지 시스템들은 하기를 포함할 수 있다:
a. 소스 코덱,
b. 디지털 먹스/디먹스(digital mux/demux),
c. 메타-키 캐시,
d. 명령 시퀀스 캐시,
e. 데이터모폴로지 캐시,
f. 피드백 엘리먼트들,
g. 비교기,
h. 제어기,
i. 애그리게이터(aggregator), 및
j. 작동기.
본 발명의 장치는 정보 밀도 홀로그래피(IDH:information density holography)를 사용한다. IDH는, 높은 레벨의 충실도 및 무결성을 유지하면서, 1,000,000배(fold)를 초과할 수 있는 이론적 제한치로 데이터 볼륨들을 감소시키는 데이터 이동, 액세스 및 스토리지 기술이다. IDH는, 우주선, 자율 운송수단(autonomous vehicle)들 및 제조 플랜트 로보틱스(manufacturing plant robotics)의 사이버네틱 제어(cybernetic control)를 비롯해, 현재는 페타바이트(petabyte)들의 데이터와 상호작용 하는 것 없이는 구현될 수 없는 많은 애플리케이션들에서 본 발명의 장치가 사용되는 것을 가능하게 한다. 본 발명의 장치는 페타바이트의 데이터(1x1015 바이트들)를 기가바이트(1x109)로 감소시킬 수 있다. 페타바이트의 데이터가 예컨대 클라우드에 업로딩될 필요가 있는 극단적인 경우를 취하면, 이는 심지어 데이터 볼륨들의 아마도 50배 감소를 제공하는 최고속의 이용 가능한 압축 및 벌크 전송 프로토콜들을 이용하더라도 비현실적일 것이다. 본 발명의 장치에서 사용되는 바와 같은 IDH는, 단지 9시간 내에 3.125x104 바이트들/초의 현재 이용 가능한 브로드밴드 업로드 속도들을 통해 가장 공산이 있는 원-오프 배치 업로드(one-off batch upload)를 허용한다. 테라바이트를 요구하는 상호작용들이 대략 30초 내에서 달성 가능한 반면에, 1 기가바이트 내지 수백 기가바이트들을 요구하는 상호작용들은 사실상 순간적(비동기 또는 실시간으로 불림)이다.
고도의 병렬 프로세싱 IDH 하드웨어는, 데이터를 홀로그래피컬하게 복제 및 송신하기 위해, 데이터 압축, 고차원 대수 토폴로지컬 표현 및 차원 감소 알고리즘들을 결합한다. 이들 알고리즘들은, 마치 꼭 홀로그램처럼, 이차원 토폴로지컬 표면(구역에 대한 경계)에 임의적인 대형 데이터세트를 인코딩한다. 또한, 알고리즘들은 거대한 데이터 세트들의 숨겨진 특성들 뿐만 아니라 임베딩된 제어 시퀀스들을 찾아 디스플레이할 수 있고, 이는, 현재 방법들을 초과하는 10의 몇 제곱승배(many orders of magnitude)만큼의 놀라운 속도들로, 감소된 볼륨의 데이터가 이동되는 것을 가능하게 한다.
본 발명의 장치에서 사용되는 바와 같은 IDH는, 코스몰로지 및 정보 엔트로피 등가(cosmology and information entropy equivalence)의 홀로그래픽 원리를 데이터에 적용하는 것에 기초한다. 스페이스(space)의 볼륨의 설명은 구역에 대한 경계에 인코딩된 것으로서 생각될 수 있고, 따라서 우리의 3D 유니버스(universe)가 대신에 마치 홀로그램처럼 이차원 표면에 "기록"될 수 있다. 유리하게, 임의적인 대형 데이터세트가 홀로그래픽-토폴로지컬 표면으로서 '구역에 대한 경계'에 인코딩(기록)될 수 있다. 빅 데이터에 대한 홀로그래픽 원리의 적용은 완전히 고유한 통찰력인 것으로 여겨지는데, 그 이유는 홀로그래픽 데이터 복제를 달성하기 위한 차원 감소 기술들의 적용이 본 발명의 장치에 의해 달성 가능한 거대한 데이터 볼륨 감소들을 초래하기 때문이다.
IDH 배후의 토폴로지들의 대수 이론은, 기존의 기술들로 가능한 것보다 더 깊은 통찰력들 및 패턴들이 획득되는 것을 여전히 가능하게 하면서, 데이터의 형상의 콤팩트한 설명(전례가 없는 100-1,000,000배 비트 감소)이 생성될 수 있다는 것이다. 이 대수 이론은 IDH로 불리는데, 그 이유는 데이터 감소 프로세스의 제1 스테이지가, 이 제1 스테이지가 데이터 차원들의 총 수를 감소시키는 동시에, 소스 데이터 지점들 전부가 유지되도록 허용하기 때문이다. 이는 볼륨 감소로 인한 밀도 증가와 전적으로 유사하다.
이제, 본 발명의 실시예들이 오로지 예로서 그리고 첨부된 도면들을 참조하여 설명될 것이다.
도 1(도 1a-도 1c, 이후 도 1)은 방대한 데이터 볼륨들의 통신들을 요구하는 애플리케이션들을 가능하게 하기 위해 사용되는 IDH의 예들을 도시한다.
도 2(도 2a-도 2b, 이후 도 2)는 IDH 소스 장치 서브-시스템들 및 통합 어셈블리를 도시한다.
도 3은 IDH 목적지 장치 시스템 어셈블리를 도시한다.
도 4는 IDH 소스들에 대한 인텔® 제온® 프로세서 고성능 컴퓨팅을 도시한다.
도 5는 IDH 목적지들에 대한 인텔® 제온® 프로세서 고성능 컴퓨팅을 도시한다.
도면들을 참조하면, 도 1은 IDH가 어디에 그리고 어떻게 적용되는지의 예들을 예시한다. 이들 예들은 운송수단 자율 드라이빙(vehicle autonomous driving)(22c), 자동화된 우주선 랑데부(automated spacecraft rendezvous)(22d), 정보, 통신, 및 미디어 애플리케이션들(22b), 그리고 자동화된 제조 플랜트들(22a)을 포함한다. 목적지 시스템들(21)로부터 지리적으로 흩어진 다중-구조화된 데이터 소스들은, 첫째로 그것을 복잡한 수학 토폴로지로서 표현하고, 둘째로 그것을 홀로그램으로서 표현하며, 그리고 셋째로 압축함으로써, 볼륨이 감소된다. 시스템들(1)은 도 2에서 상세히 도시된다. 홀로그램이 데이터의 복제일 뿐만 아니라, 분석도 되도록 하기 위해, 데이터를 홀로그래피컬하게 복제하는 동작은 데이터의 숨겨진 구조들을 드러낸다. 도 1에 도시된 특정 애플리케이션들의 경우, 홀로그램은 또한, 작동기들에 대한 제어 시퀀스들을 포함할 수 있다. 홀로그래픽 포맷으로든 또는 원래 데이터 세트들을 복제함으로써든 데이터와의 상호작용을 가능하게 하는, 고도의 병렬 프로세싱 칩 기술을 갖는 최종-사용자 디바이스들에 의해, 직접적으로 데이터 홀로그램이 액세스될 수 있다. 또한, 데이터 홀로그램은 홀로그램으로서 이동될 수 있고, 그리고 통상적인 디스크 드라이브들 상에 저장될 수 있거나, 또는 스토리지 볼륨들을 홀로그래피컬하게 추가로 감소시키는 상태로 저장될 수 있다.
압축되지 않은 데이터는 입력 소스, 도 2에 도시된 고성능 데이터 인터페이스(1)를 통해 호스트 컴퓨터 시스템들로부터 도 1에 도시된 IDH 장치에 액세스된다. 압축 및 감소되지 않은 데이터가 도 2에 도시된 데이터 프로파일러 및 추출기 서브시스템(2)에 들어간다. 데이터는 판독되고, 샘플링되고, 이후, 퍼지 논리 제어기에서 '퍼지화(fuzzify)'되는데, 이 퍼지 논리 제어기는 퍼지셜, 추론, 및 출력 핸들링을 포함한다(2a). 퍼지 논리 회로의 목적은, 데이터가 매우 높은 정도의 충실도로 복제되는 것을 가능하게 하는 메타-키들(인덱스들)(2b)을 식별하는 것이다. 추론 엔진은 규칙 베이스를 사용하여 이들 메타-키들을 관계들로서 식별하고, 이들을 '퍼지 세트들'로서 타입 리듀서에 출력한다. 타입 리듀서는 메타-키들(2b)을 출력하고, 그리고 데이터가 카테고리들을 텍스트로서 포함할 것이기 때문에, 타입 리듀서는 또한 데이터를 결합된 데이터 뉴메리셜 및 데이터 정규화기(2c)에 출력한다. 이제, 추출 및 프로파일링된 데이터가 감소 프로세스의 제1 스테이지를 위해 준비된다.
스테이지 1 데이터 감소 서브시스템 장치(3)는 근본적으로, 2-단계 주성분 분석기(PCA:principle component analyser)(3a)이다. 장치는 또한, 스테이지 1 충실도 분석기(3b)를 포함한다. 일단 공분산 행렬 계산기 및 고유벡터 계산기 결합(3a)을 사용하여 공분산 행렬 및 고유벡터들이 계산되면, 데이터는 제1 차원 감소를 겪는다. 이는, 데이터 지점들의 수의 감소 없이 총 데이터 볼륨에서의 35배 감소까지 이루어질 수 있다(정보 밀도의 증가에 대응함). 제1 차원 리듀서는 스테이지 1 충실도 분석기(3b)의 일부이고, 이 스테이지 1 충실도 분석기(3b)는 잔차 분석 분류기, 비교기, 및 실패 타입 1 분류 모듈을 포함한다. 잔차 분석기 모듈은 데이터 내의 숨겨진 구조들, 그리고 또한 임베딩된 제어 시퀀스들을 알아낸다. 이들 컴포넌트들은 논리 회로들을 포함하는 테스트 루프를 제공한다. 비교기는 소스에서의 입력 데이터를 PCA 출력과 비교하고, 그 차이를 측정한다. 이는, 오류들을 정정하기 위해 메타-키들(2b)이 사용되는 제1 지점이다. 오류가 임계치 세트를 초과하는 경우, 비교기는 데이터를 실패 타입 1 분류 모듈에 피딩하고, 그리고 데이터 프로파일러 및 추출기 어셈블리(2)에서 역으로 메타-키들(2b)과 대비하여 체크한다. 프로세스는 반복적이며, 목표는 오류를 임계치 값 아래로 감소시키는 것이다. 오류가 셋팅된 임계치 미만일 때, 이제는 감소되었지만 여전히 압축되지 않은 데이터가 스테이지 2 데이터 감소 장치(4)에 출력되고, 이 스테이지 2 데이터 감소 장치(4)는 지속적 호몰로지 머신(4a)(PHM)의 형태로 있다.
PHM은 단체 근사화를 수행하는 립 복체 계산기, 호몰로지 및 그룹 계산기, 및 지속적 호몰로지 컨버터를 포함한다(도 2의 4a를 참조하라). PHM은 또한, 스테이지 2 충실도 분석기(4b)를 포함한다. 이제, 지속적 호몰로지 형태로 출력되는 감소된 데이터는 추가로, 차원 리듀서에서 볼륨 감소를 겪는다. 이 제2 차원 리듀서는 스테이지 2 충실도 분석기(4b) 내에 포함되고, 이 스테이지 2 충실도 분석기(4b)는 또한, 스테이지 1 충실도 분석기(3b)와 유사한 모듈들과 함께, 데이터모폴로지 및 명령 시퀀스 모듈들을 포함한다. 충실도 측정 및 개선 프로세스는 이번에는 메타-키들(2b)을 룩업하는 실패 타입 2 분류 모듈, 및 스테이지 2 충실도 분석기(4b)의 제2 비교기와 유사하다. 이 제2 비교기는 소스 데이터를 출력된 지속적 호몰로지와 비교한다. 이 스테이지는 추가로, 데이터를 소스의 50 내지 1000의 팩터(factor)로 감소시킨다. 오류가 임계치 미만일 경우, 지속적 호몰로지 형태의 데이터는, 홀로그램으로의 변환을 위해, 데이터 감소 스테이지 3 홀로그래픽 표현(5)에 출력된다.
데이터 감소 스테이지 3 홀로그래픽 표현(5)은 최적 토폴로지컬 데이터 표현을 포함하고, 이 최적 토폴로지컬 데이터 표현은 데이터모폴로지 및 명령 시퀀스를 포함하며, 이들은 토폴로지컬 경계 표면(TBS) 레코더로 불리는 판독 기록(RW) 최소화된 레코딩 시스템에 출력된다. TBS 레코더는 자신의 변동성 표면에 최적 토폴로지컬 데이터 표현의 내부 프로젝션을 기록했다. 이는, 원래 데이터 볼륨에 포함된 정보 콘텐트 전부를 표면에 포함시키는 것과 비슷하며, 이는 광학 홀로그램의 생성과 유사하다. 그러나, 차원수는 광학 시스템들을 초과하여 몇 배일 수 있다. 데이터는 추가로, 1,000 내지 100,000의 총 팩터만큼, 소스와 비교하여 이제 감소된다. 최고로 가능한 충실도로 데이터를 복제하기 위해, 데이터 홀로그램은 메타-키들(2b)과 디지털식으로 결합된다.
감소되었지만 여전히 압축되지 않은, 결합된 신호는 데이터 감소 스테이지 3 홀로그래픽 표현(5)의 디지털 멀티플렉서(먹스)를 통해 소스 코딩 압축기(6)에 출력된다. 소스 코딩 압축기(6)의 설계는, 미합중국 NY 14853 이타카 코넬 대학교 전기 및 컴퓨터 공학부의 Martin Burtscher 및 Paruj Ratanaworabhan에 의해 개발된 배정밀도 부동 소수점 데이터 소스 코딩(압축) 시스템의 높은 스루풋 압축에 기초한다. 이 기술을 이용하여 현실적인 1:10 압축이 달성 가능함을 언급하는 것 외에는, 소스 코딩 압축기(6)의 설계는 본원에서 추가로 설명되지 않을 것이다. IDH 플러스 소스 코딩을 이용하여 가능한 총 감소는, 소스 원래의 100-1,000,000배이다. 감소 및 압축된 데이터는 고성능 데이터 인터페이스(7)를 통해 출력된다.
위의 데이터 감소는, 도 4에서 상세히 도시된 바와 같은 인텔® 제온® 프로세서에 기초한 아키텍처를 사용하여 사실상 순간적으로 일어난다. 이 아키텍처는, 성능을 추가로 증가시키기 위한 고도의 병렬 메모리 서브시스템을 특징으로 한다. "즉석에서(on the fly)" 프로그래밍 가능한 FPGA들이 하드웨어-기반의 애플리케이션-특정 수행을 달성하기 위한 방법이다. 예컨대, 특정 IDH 알고리즘들이 최적화되고, 그리고 실행시 FPGA들에 로딩되는 코드로 번역(translating)된다.
도 1은 목적지 시스템들(22)을 도시한다. 목적지 시스템 전자 모듈들은 도 3에서 모듈들(9)로서 도시된다. 목적지 시스템들은, 언제까지나 소스 데이터를 재구성할 필요 없이, 도 2의 소스 기술 및 메타-키들(2b)에 의해 생성되는 홀로그램과 상호작용한다. 소스 데이터를 재구성하기 위해서는, 도 2에 도시된 것과 유사한 전자장치들이 요구된다. 도 2의 데이터 프로파일러 및 추출기(1)로부터의 메타-키들(2b) 및 도 2의 소스 기술에 의해 생성되는 홀로그램을 포함하는 압축된 데이터 입력은 도 3의 고성능 데이터 인터페이스(8)를 통해 액세스되며, 이 고성능 데이터 인터페이스(8)는 목적지 서브시스템 어셈블리(9)에 연결된다. 소스 코덱(9a)의 디코더 모듈이 신호를 압축해제(근본적으로, 신호를 디코딩)하고, 디지털 먹스/디먹스(9b)의 디멀티플렉서 모듈이 신호를 메타-키들(9c), 명령 시퀀스(9d) 및 데이터모폴로지(9e)로 분할한다. 다른 컴포넌트들은 피드백 엘리먼트들(9f), 비교기(9g), 제어기(9i), 애그리게이터(9h) 및 작동기(9j)이다. 작동기(9j)는 라인(9m)을 통해 제어 요구들을 출력한다. 작동기 출력은 도 1에 대한 참조에 의해 도 3에서 일반화된다. 출력에서의 합산(add), 이동(move) 및 변경(change) AND/OR 섭동(perturbation)들은 애그리게이터(9h)에 의해 애그리게이팅되고, 비교기(9g)를 통해 입력 신호와 비교된다. 차동이 피드백 엘리먼트들(9f)에 피딩된다. 차동은 메타-키들(9c), 명령 시퀀스(9d) 및 데이터모폴로지(9e)에 대한 AND/OR 변경들을 포함한다. 이후, 소스 데이터 시스템들을 업데이트하기 위해, 차동이 먹스/디먹스(9b), 소스 코덱(9a) 및 고성능 데이터 인터페이스(8)를 통해 피드백된다(도 1을 참조하라).
소스 IDH 시스템에 대해서와 같이, 목적지 시스템들에 대한 아키텍처는 도 5에 도시된 바와 같은 인텔® 제온® 프로세서에 기초하지만, 더 적은 프로세서들 및 메모리를 요구한다.
첨부된 도면들을 참조하여 위에서 설명된 본 발명의 실시예들이 예로서만 제공되었으며, 수정들이 수행될 수 있음이 인정되어야 한다. 도면들에 도시된 개별 컴포넌트들은 각자의 도면들에서 사용되도록 제한되지 않으며, 이 개별 컴포넌트들은 다른 도면들에서 그리고 본 발명의 모든 양상들에서 사용될 수 있다.

Claims (3)

  1. 데이터 볼륨들을 감소시키기 위한 장치로서,
    상기 장치는,
    a. 퍼지셜(fuzzyfier), 추론, 및 출력 핸들링을 포함하는 퍼지 논리 제어기,
    b. 메타-키들을 출력하는 타입 리듀서(type reducer),
    c. 데이터 뉴메리셜(numerifier), 및
    d. 데이터 정규화기
    를 포함하는,
    (1) 소스 시스템 데이터 프로파일러 및 추출기 서브시스템;
    a. 공분산 행렬 계산기 및 고유값 계산기를 갖는 2-단계 주성분 분석기(PCA:principle component analyser), 및
    (ⅰ) 제1 차원 리듀서(dimensional reducer),
    (ⅱ) 잔차 분석 분류기(residual analysis classifier),
    (ⅲ) 비교기, 및
    (ⅳ) 실패 타입 1 분류 모듈(classify failure type 1 module)
    을 포함하는,
    b. 스테이지 1 충실도 분석기(fidelity analyser)
    를 포함하는,
    (2) 스테이지 1 데이터 감소 서브시스템;
    a. 단체 근사화(simplicial approximation)를 수행하는 립 복체 계산기(rips complex calculator),
    b. 호몰로지 및 그룹 계산기(homology and groups calculator),
    c. 지속적 호몰로지 컨버터,
    (ⅰ) 제2 차원 리듀서,
    (ⅱ) 데이터모폴로지(datamorphology),
    (ⅲ) 명령 시퀀스,
    (ⅳ) 실패 타입 2 분류 모듈, 및
    (ⅴ) 제2 비교기
    를 포함하는,
    d. 스테이지 2 충실도 분석기
    를 포함하는,
    (3) 스테이지 2 데이터 감소 지속적 호몰로지 머신(PHM:persistent homology machine); 및
    a. 상기 데이터모폴로지 및 명령 시퀀스를 포함하는 최적 토폴로지컬 데이터 표현(optimum topological data representation),
    b. 자신의 변동성 표면(fluctuating surface)에 최적 토폴로지컬 데이터 표현의 내부 프로젝션(internal projection)을 기록한, 토폴로지컬 경계 표면(TBS:topological boundary surface) 레코더로 불리는 판독 기록(RW:read write) 레코딩 시스템, 및
    c. 홀로그램과 메타-키들의 디지털 멀티플렉싱
    을 포함하는,
    (4) 스테이지 3 데이터 감소 홀로그래픽 생성 수단
    을 포함하는,
    데이터 볼륨들을 감소시키기 위한 장치.
  2. 제 1 항에 있어서,
    언제까지나 소스 데이터를 재구성할 필요 없이, 상기 홀로그램 및 메타-키들과 상호작용하는 목적지 시스템들을 포함하는,
    데이터 볼륨들을 감소시키기 위한 장치.
  3. 제 2 항에 있어서,
    상기 목적지 시스템들은,
    a. 소스 코덱,
    b. 디지털 먹스/디먹스(digital mux/demux),
    c. 메타-키 캐시,
    d. 명령 시퀀스 캐시,
    e. 데이터모폴로지 캐시,
    f. 피드백 엘리먼트들,
    g. 비교기,
    h. 제어기,
    i. 애그리게이터(aggregator), 및
    j. 작동기
    를 포함하는,
    데이터 볼륨들을 감소시키기 위한 장치.
KR1020157030155A 2013-03-19 2014-03-11 데이터 볼륨들을 감소시키기 위한 장치 KR20150131388A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1305070.3 2013-03-19
GBGB1305070.3A GB201305070D0 (en) 2013-03-19 2013-03-19 Appatatus for reducing data volumes
PCT/GB2014/000089 WO2014147362A1 (en) 2013-03-19 2014-03-11 Apparatus for reducing data volumes

Publications (1)

Publication Number Publication Date
KR20150131388A true KR20150131388A (ko) 2015-11-24

Family

ID=48226708

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157030155A KR20150131388A (ko) 2013-03-19 2014-03-11 데이터 볼륨들을 감소시키기 위한 장치

Country Status (8)

Country Link
US (1) US9496892B2 (ko)
EP (1) EP2976681A1 (ko)
JP (1) JP2016521024A (ko)
KR (1) KR20150131388A (ko)
CN (1) CN105164590A (ko)
GB (1) GB201305070D0 (ko)
IL (1) IL241379A0 (ko)
WO (1) WO2014147362A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102330171B1 (ko) * 2020-12-07 2021-11-23 한국과학기술정보연구원 주성분분석제어장치 및 그 동작 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10554761B2 (en) 2015-12-12 2020-02-04 At&T Intellectual Property I, Lp Methods and apparatus to improve transmission of a field data set to a network access point via parallel communication sessions
US10373019B2 (en) * 2016-01-13 2019-08-06 Ford Global Technologies, Llc Low- and high-fidelity classifiers applied to road-scene images
US10333958B2 (en) 2016-07-19 2019-06-25 Cisco Technology, Inc. Multi-dimensional system anomaly detection
CN110110814B (zh) * 2019-05-21 2021-05-04 浙江大学 基于连续MapReduce的分布并行PCA过程监测建模方法
CN112954977B (zh) * 2021-02-18 2023-04-14 财拓云计算(上海)有限公司 一种基于人工智能实现数据中心节能温控的系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5892503A (en) * 1994-07-29 1999-04-06 Ast Research, Inc. Multimedia console keyboard
DE602004029489D1 (de) * 2003-11-10 2010-11-18 Rose Hulman Inst Of Technology Binärer delta-sigma-modulator
US7903008B2 (en) * 2007-11-08 2011-03-08 National Instruments Corporation Source-measure unit based on digital control loop

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102330171B1 (ko) * 2020-12-07 2021-11-23 한국과학기술정보연구원 주성분분석제어장치 및 그 동작 방법

Also Published As

Publication number Publication date
US9496892B2 (en) 2016-11-15
IL241379A0 (en) 2015-11-30
EP2976681A1 (en) 2016-01-27
CN105164590A (zh) 2015-12-16
US20160043734A1 (en) 2016-02-11
JP2016521024A (ja) 2016-07-14
GB201305070D0 (en) 2013-05-01
WO2014147362A1 (en) 2014-09-25

Similar Documents

Publication Publication Date Title
KR20150131388A (ko) 데이터 볼륨들을 감소시키기 위한 장치
Chakraborty et al. Constructing energy-efficient mixed-precision neural networks through principal component analysis for edge intelligence
CN112162957B (zh) 多块结构网格数据压缩存储方法、解压缩方法及装置
Zhao et al. Virtual chunks: On supporting random accesses to scientific data in compressible storage systems
Zhao et al. Improving the i/o throughput for data-intensive scientific applications with efficient compression mechanisms
Park et al. {DeepSketch}: A new machine {Learning-Based} reference search technique for {Post-Deduplication} delta compression
Guo et al. Boolnet: minimizing the energy consumption of binary neural networks
US20220100718A1 (en) Systems, methods and devices for eliminating duplicates and value redundancy in computer memories
Banerjee et al. Scalable Hybrid Learning Techniques for Scientific Data Compression
Zhao et al. Dynamic virtual chunks: On supporting efficient accesses to compressed scientific data
Ranjitha et al. A novel and efficient de-duplication system for HDFS
KR20220092043A (ko) 파라미터의 민감도에 기초하여 복수의 트랜스포머 인코더 레이어를 양자화하는 방법 및 장치
Sethi et al. Leveraging hadoop framework to develop duplication detector and analysis using Mapreduce, Hive and Pig
Akritidis et al. Evaluating the Effects of Modern Storage Devices on the Efficiency of Parallel Machine Learning Algorithms
Wei et al. Adaptive Updates for Erasure-Coded Storage Systems Based on Data Delta and Logging
Ogata et al. Improvement of Deduplication Efficiency by Two‐Layer Deduplication System
Min et al. Identification of Solder Joint Failure Modes Using Machine Learning
Lautenschlager et al. Big data research at DKRZ—climate model data production workflow
Bicer et al. A compression framework for multidimensional scientific datasets
Banerjee et al. Fast Algorithms for Scientific Data Compression
CN116432742A (zh) 一种模型压缩系统、方法及设备
US20230237278A1 (en) Large-scale text data encoding and compression
Qu et al. Fault-tolerant flexible lossless cluster compression method for monitoring data in smart grid
Guo et al. BoolNet: Streamlining Binary Neural Networks Using Binary Feature Maps
Lofstead et al. Delta: Data reduction for integrated application workflows and data storage

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid