KR20220027966A - 머신 학습 지원 구 디코딩을 위한 디바이스들 및 방법들 - Google Patents

머신 학습 지원 구 디코딩을 위한 디바이스들 및 방법들 Download PDF

Info

Publication number
KR20220027966A
KR20220027966A KR1020227001690A KR20227001690A KR20220027966A KR 20220027966 A KR20220027966 A KR 20220027966A KR 1020227001690 A KR1020227001690 A KR 1020227001690A KR 20227001690 A KR20227001690 A KR 20227001690A KR 20220027966 A KR20220027966 A KR 20220027966A
Authority
KR
South Korea
Prior art keywords
radius
current
grid points
algorithm
function
Prior art date
Application number
KR1020227001690A
Other languages
English (en)
Inventor
가야 레카야
아이망 아스크리
Original Assignee
앵스띠뛰 미네-뗄레콩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 앵스띠뛰 미네-뗄레콩 filed Critical 앵스띠뛰 미네-뗄레콩
Publication of KR20220027966A publication Critical patent/KR20220027966A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L25/03178Arrangements involving sequence estimation techniques
    • H04L25/03203Trellis search techniques
    • H04L25/03242Methods involving sphere decoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • G06N3/0481
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • G06N7/005
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L2025/03433Arrangements for removing intersymbol interference characterised by equaliser structure
    • H04L2025/03439Fixed structures
    • H04L2025/03445Time domain
    • H04L2025/03458Lattice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L2025/03433Arrangements for removing intersymbol interference characterised by equaliser structure
    • H04L2025/03439Fixed structures
    • H04L2025/03445Time domain
    • H04L2025/03464Neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Power Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Radio Transmission System (AREA)
  • Error Detection And Correction (AREA)

Abstract

탐색 구 반경을 사용하여 채널 행렬에 의해 표현된 송신 채널을 통해 수신된 신호를 디코딩하기 위한 디코더. 디코더는 예비 반경으로부터 탐색 구 반경을 결정하기 위한 반경 결정 디바이스 (307) 를 포함한다. 반경 결정 디바이스 (307) 는, i. 수신된 신호, 채널 행렬, 및 예비 반경으로 초기에 설정되는 현재 반경으로부터 도출된 입력 데이터에 머신 학습 알고리즘을 적용하는 것으로서, 이는 현재 반경과 연관된 격자 점들의 현재 예측된 수를 제공하는, 상기 머신 학습 알고리즘을 적용하고; ii. 격자 점들의 현재 예측된 수를 주어진 임계치와 비교하고; iii. 격자 점들의 현재 예측된 수가 주어진 임계치보다 엄격하게 높으면 현재 반경을 업데이트하는 것으로서, 현재 반경은 현재 반경에 선형 함수를 적용함으로써 업데이트되는, 상기 현재 반경을 업데이트하도록 구성되고; 단계 i 내지 단계 iii 은, 현재 예측된 수와 관련되는 종료 조건이 충족될 때까지 반복되고, 반경 결정 디바이스 (307) 는, 종료 조건이 충족되는 것에 응답하여 탐색 구 반경을 현재 반경으로 설정하도록 구성된다.

Description

머신 학습 지원 구 디코딩을 위한 디바이스들 및 방법들
본 발명은 일반적으로 디지털 통신에 관한 것으로, 특히 데이터 신호를 디코딩하기 위한 방법들 및 디바이스들에 관한 것이다.
'스마트 혁명' 은 통신, 비즈니스, 의료 서비스들 및 교육을 포함한 현대 생활의 모든 측면에서 상당한 변화를 가져왔다. 스마트 폰들, 스마트 워치들, 및 스마트 자동차들로부터 스마트 홈들 및 스마트 시티들에 이르기까지, 점점 더 많은 수의 스마트 디바이스들이 대규모로 사용되고 있고 통신 시스템들을 변화시키고 있다.
이러한 웹-가능 및 연결 디바이스들의 등장으로, 더 많은 시스템 용량의 필요성이 증대되어 가고 있다. 이러한 시스템 용량을 증가시키고 더 나은 링크 신뢰도를 제공하기 위해 다중-입력 다중-출력 (MIMO) 기술들이 개발되었다. MIMO 시스템들은 공간 및 시간 차원들을 활용하여, 복수의 시간 슬롯들에 걸쳐, 다수의 송신 및/또는 수신 안테나들을 사용하여 더 많은 데이터 심볼들을 인코딩 및 멀티플렉싱한다. 결과적으로, MIMO 기반 통신 시스템들의 용량, 범위, 및 신뢰도가 향상될 수 있다. MIMO 기술들의 이러한 주요 이점들은 예를 들어 로컬 및 광역 네트워크들에 적용되는 많은 유선, 무선 및 광 통신 시스템들에서 그들을 이상적인 후보들이 되게 한다.
MIMO 시스템들에 대한 하나의 주요 도전과제는 실시간 서비스들 및 애플리케이션들에 대한 데이터 레이트들 면에서 증가하는 요구들에 적응하는 것이다. 다른 도전과제는 트랜시버 디바이스들에서 신호 프로세싱의 복잡성 및 에너지 소비와 관련된다. 특히, 힘든 도전과제는, 낮은 전력 및 낮은 계산 리소스들을 소비하면서 요구되는 서비스 품질을 제공할 수 있는 MIMO 디코더들의 개발에 관한 것이다.
수신기 디바이스에서 구현되는 MIMO 디코더는, 수신된 신호 및 채널 행렬로부터, 원래 전달된 정보 심볼들의 추정을 결정하도록 구성된다. 디코더는 수신된 신호와 송신된 정보 심볼들의 벡터의 가능한 값들 사이의 비교를 수행한다.
여러 디코딩 알고리즘들이 존재하고 그들의 실제 사용은 서비스 품질 (QoS) 사양들에 필요한 성능 및 이용가능한 하드웨어 리소스들, 이를 테면 계산 및 메모리 (저장) 공급들에 따라 상이하다. 동일하게 개연성이 있는 정보 심볼들이 존재할 때, 최적의 디코딩 성능은 최대 우도 (Maximum Likelihood; ML) 디코딩 기준을 적용함으로써 획득된다. ML 디코더는 최적의 성능을 제공한다.
ML 추정 문제는, MIMO 시스템의 2 개의 상이하지만 동등한 표현들: 격자 표현 및 트리 표현을 사용하여 해결될 수 있다.
격자 표현에서, MIMO 시스템은 채널 행렬에 의해 생성된 격자와 연관된다. 이러한 표현에 따르면, 정보 심볼들의 벡터의 각각의 가능한 값은 격자의 점에 의해 표현된다. 수신된 신호는 잡음 벡터에 의해 교란된 격자의 점으로 보여진다. 따라서 ML 솔루션을 해결하는 것은 최근접 벡터 문제를 해결하는 것에 해당한다. ML 솔루션은 이러한 경우에 유클리드 거리의 최소화의 의미에서 수신된 신호에 대한 최근접 격자 점에 대응한다. ML 솔루션을 찾는 계산 복잡성은 최근접 격자 점의 탐색 동안 검사된 격자 점들의 수에 의존한다.
구 트리 탐색 기반 추정 알고리즘들, 이를 테면 구 디코더 및 구형-경계 스택 (Spherical-Bound Stack) 디코더 (SB-Stack) 가 주어진 반경의 구형 영역으로 최근접 격자 점에 대한 탐색 공간을 제한함으로써 탐색 페이즈의 복잡성을 감소시키기 위해 제안되었다. 구 디코더는 "E. Viterbo and J. Boutros, A Universal Lattice Code Decoder for Fading Channels, IEEE Transactions on Information Theory, 45(5), pages 1639-1642, 1999" 에 개시되어 있고, SB-Stack 디코더는 "G. Rekaya Ben-Othman et al., The Spherical Bound Stack Decoder, In Proceedings of the IEEE International Conference on Wireless and Mobile Computing, Networking and Communications, 2008" 에 개시되어 있다.
주어진 반경 (이하에 '초기 구 반경' 또는 '탐색 구 반경' 으로 지칭됨) 에서 출발하여, 구 탐색 기반 추정 알고리즘들은 주어진 반경과 동일한 반경의 구형 영역 내부의 정보 심볼들의 벡터의 가능한 값들 중 하나와 연관된 제 1 격자 점을 탐색한다. 격자 점을 찾으면, 구 반경의 값은 구형 영역에서 발견된 격자 점과 수신된 신호를 나타내는 점 사이의 유클리드 거리의 값으로 업데이트된다. 이 구 제약 탐색 및 반경 업데이트는 격자 점을 포함하고 수신된 신호를 나타내는 점에 중심을 둔 가장 작은 구에 대응하는 ML 솔루션을 찾을 때까지 반복적으로 수행된다.
이러한 탐색 공간 제한은, MIMO 시스템의 트리 표현에 따라, 디코딩 트리에서 방문 노드들의 수의 제한으로 보여진다. 구형 영역의 반경은 디코딩 트리의 각각의 레벨에서 방문 노드들에 대한 경계 한계들을 결정한다. 이들 경계 한계들에 의해 부과된 인터벌들에 속하는 노드들만이 트리 탐색 프로세스 동안 방문된다. 탐색 공간을 제한하면, Stack 디코더와 같은 일부 순차 디코더들과 비교하여 ML 솔루션을 탐색하는 계산 복잡성을 감소시킬 수 있다.
트리 탐색 페이즈의 계산 복잡성은 탐색 구 반경의 선택에 매우 의존한다. 따라서, 이러한 디코더들의 메인 이슈는 격자 점들의 탐색을 개시하도록 초기에 설정된 구 반경의 선택이다. 구체적으로, 구 내부에 적어도 하나의 격자 점을 포함하기 위해서는, 초기 반경이 충분히 커야 한다. 그에 반해서, 너무 큰 반경은 구 내부에 많은 격자 점들의 존재를 조장하므로 기하급수적인 탐색을 회피하기 위해서는 더 작은 초기 반경이 선호될 것이다. 따라서, 적어도 하나의 격자 점이 구 내부에 포함되는 것을 보장하기 위한 충분히 큰 초기 반경과 계산 복잡성을 최적화하고 디코더를 크게 가속화하기 위한 충분히 작은 반경 간의 적절한 트레이드-오프를 찾아야 한다.
탐색 구 반경을 선택하기 위한 여러 방법들이 제안되었다. 하나의 접근법에서, 채널 행렬에 의해 생성된 격자의 커버링 반경이 고려된다. 또 다른 접근법에서, 커버링 반경의 상부 경계는 논문 "A universal decoding algorithm for lattice codes", In 14th colloque GRETSI, 1993, by E. Viterbo and E. Biglieri 에 추가로 개시된 바와 같이 사용된다. 그러나, 커버 반경 또는 상부 경계에 기초한 이러한 선택 방법들은 점점 더 많은 수의 격자 점들이 방문됨에 따라 높은 계산 복잡성을 겪는다.
또 다른 접근법에서, 탐색 구 반경은, "W. Zhao and G.B. Giannakis, Sphere Decoding Algorithms with Improved Radius Search, In Proceedings of IEEE Transactions on Communications, 53(7):1104-1109, July 2005" 에 개시된 ('Sphere Decoder with Improved Radius Search' 의 의미의) SDIRS 로 지칭된 방법에 따라 잡음 전력의 통계적 특성들을 고려하여 선택될 수 있다. 초기 반경 선택을 위한 이 방법의 하나의 주요 단점은 초기 반경의 증가를 초래한다는 것이다. 실제로, 초기 반경이 너무 작아서 초기 반경을 갖는 구 내부의 적어도 하나의 격자 점의 탐색을 성공할 수 없을 때, 적어도 하나의 격자 점이 구 내부에서 발견될 때까지 반경이 증가된다.
또한, 이러한 접근법들의 경우, 반경이 증가함에 따라 구 내부에 포함된 격자 점들의 수가 증가하여 너무 많은 격자 점들이 구 내부에 포함될 수 있으며, 이는 디코더 복잡성을 크게 증가시킨다.
초기 반경을 선택하기 위한 또 다른 솔루션은, US2008/0313252 또는 논문 "B. Hassibi and H. Vikalo, On the Expected Complexity of Sphere Decoding, In Proceedings of Asilomar Conference on Signals, Systems and Computers, vol. 2, pages 1051-1055, November 2001" 에 개시된 바와 같이, 수신된 신호와 제로 포싱 (Zero Forcing; ZF) 추정치 사이의 유클리드 거리를 고려하는 것에 기초한다. 이것은 ZF 추정치 및 적어도 하나의 격자 점이 구 내부에 포함되는 것을 보장한다. 그러나, 이 솔루션은 높은 계산 복잡성을 겪는다.
또한, 이분 탐색 (dichotomic search) 에 기초하여 초기 반경을 선택하기 위한 다른 솔루션이 "M-A. Khsiba and G. Rekaya-Ben Othman, Sphere Decoder with Dichotomic Search, PIMRC, Montreal, CANADA, October 2017" 에 개시되어 있다. 이분 탐색을 사용한 구 디코더는, 구형 영역 내부의 격자 점들의 탐색 동안 수행된 반경 업데이트가 유효한 격자 점이 발견될 때마다 현재 반경을 2 로 나누는 것에 기초하는 이분-방식 반경 업데이트 전략을 구현한다.
이러한 방법들을 사용한 초기 반경의 선택은 복수의 격자 점들이 초기 반경을 갖는 구 내에 포함되는 것을 보장하지만, 초기 반경은 여전히 너무 커서 디코더의 계산 복잡성을 증가시킬 수도 있다.
따라서, 디코딩 수렴이 빠르고 디코딩 복잡성이 감소된 최적의 ML 성능을 달성할 수 있는 구 반경 결정 디바이스들이 필요하다.
이들 및 다른 문제들을 다루기 위해, 탐색 구 반경을 사용하여 채널 행렬에 의해 표현된 송신 채널을 통해 수신된 신호를 디코딩하도록 구성된 디코더가 제공되며, 그 디코더는 예비 반경 (preliminary radius) 으로부터 탐색 구 반경을 결정하기 위한 반경 결정 디바이스를 포함한다. 반경 결정 디바이스는:
i. 수신된 신호, 채널 행렬, 및 예비 반경으로 초기에 설정되는 현재 반경으로부터 도출된 입력 데이터에 머신 학습 알고리즘을 적용하는 것으로서, 이는 현재 반경과 연관된 격자 점들의 현재 예측된 수를 제공하는, 상기 머신 학습 알고리즘을 적용하고;
ii. 격자 점들의 현재 예측된 수를 주어진 임계치와 비교하고;
iii. 격자 점들의 현재 예측된 수가 주어진 임계치보다 엄격하게 높으면 현재 반경을 업데이트하는 것으로서, 현재 반경은 현재 반경에 선형 함수를 적용함으로써 업데이트되는, 상기 현재 반경을 업데이트하도록 구성되고;
단계 i 내지 단계 iii 은, 현재 예측된 수와 관련되는 종료 조건이 충족될 때까지 반복되고, 반경 결정 디바이스는, 종료 조건이 충족되는 것에 응답하여 탐색 구 반경을 현재 반경으로 설정하도록 구성된다.
일부 실시형태들에 따르면, 종료 조건은, 격자 점들의 현재 예측된 수가 주어진 임계치 이하이면 충족될 수도 있다.
일부 실시형태들에 따르면, 선형 함수는 1/2 과 동일한 기울기 파라미터 및 0 과 동일한 인터셉트 (intercept) 파라미터를 가질 수도 있다.
일부 실시형태들에 따르면, 머신 학습 알고리즘은, 서포트 벡터 머신들, 선형 회귀, 로지스틱 회귀, 나이브 베이즈 (naive Bayes), 선형 판별 분석, 결정 트리들, k-최근접 이웃 알고리즘, 뉴럴 네트워크들, 및 유사성 학습을 포함한 그룹에서 선택된 지도 (supervised) 머신 학습 알고리즘일 수도 있다.
일부 실시형태들에 따르면, 지도 머신 학습 알고리즘은, 입력 층, 하나 이상의 은닉 층들, 및 출력 층을 포함하는 다층 딥 뉴럴 네트워크일 수도 있으며, 각각의 층은 복수의 계산 노드들을 포함하고, 다층 딥 뉴럴 네트워크는 모델 파라미터들 및 활성화 함수와 연관되고, 활성화 함수는 하나 이상의 은닉 층들의 복수의 계산 노드들 중 적어도 하나의 계산 노드에서 구현된다.
일부 실시형태들에 따르면, 활성화 함수는, 선형 활성화 함수, 시그모이드 함수, Relu 함수, Tanh, 소프트맥스 함수, 및 CUBE 함수를 포함하는 그룹에서 선택될 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스는 수신된 훈련 데이터로부터 훈련 페이즈 동안 모델 파라미터들을 미리 결정하도록 구성될 수도 있고, 반경 결정 디바이스는 훈련 데이터 및 격자 점들의 예상된 수들로부터 훈련 데이터의 복수의 세트들을 결정하도록 구성되고, 각각의 격자 점들의 예상된 수는 훈련 데이터의 복수의 세트들 중의 훈련 데이터의 세트와 연관되고, 훈련 페이즈는 다음의 단계들:
- 입력으로서 복수의 훈련 데이터 중의 훈련 데이터의 세트를 사용하여 딥 뉴럴 네트워크를 프로세싱하는 단계로서, 이는 훈련 데이터의 세트와 연관된 격자 점들의 중간 수를 제공하는, 상기 딥 뉴럴 네트워크를 프로세싱하는 단계;
- 격자 점들의 예상된 수 및 훈련 데이터의 세트와 연관된 격자 점들의 중간 수로부터 손실 함수를 결정하는 단계, 및
- 손실 함수의 최소화에 따라 최적화 알고리즘을 적용함으로써 업데이트된 모델 파라미터들을 결정하는 단계
의 2 이상의 반복들을 포함한다.
일부 실시형태들에 따르면, 최적화 알고리즘은, Adadelta 최적화 알고리즘, Adagrad 최적화 알고리즘, 적응 모멘트 추정 알고리즘, Nesterov 가속 그레디언트 알고리즘, Nesterov 가속 적응 모멘트 추정 알고리즘, RMSprop 알고리즘, 확률적 그레디언트 최적화 알고리즘들, 및 적응 학습 레이트 최적화 알고리즘들을 포함하는 그룹에서 선택될 수도 있다.
일부 실시형태들에 따르면, 손실 함수는, 평균 제곱 에러 함수 및 지수 로그 우도 함수를 포함하는 그룹에서 선택될 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스는, 리스트 구 디코딩 알고리즘 또는 리스트 구형-경계 스택 디코더를 적용함으로써 탐색 구 반경 및 채널 행렬로부터 격자 점들의 예상된 수들을 미리 결정하도록 구성될 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스는, 잡음 분산, 채널 행렬의 대각선 컴포넌트들, 및 수신된 신호와 추정 벡터 (estimate vector) 사이의 거리를 나타내는 유클리드 거리 중 적어도 하나의 파라미터로부터 예비 반경을 결정하도록 구성될 수도 있고, 추정 벡터는 준최적 추정 알고리즘을 적용함으로써 결정되고, 준최적 추정 알고리즘은, 제로 포싱 결정 피드백 등화기 및 최소 평균 제곱 에러 추정 알고리즘을 포함하는 그룹에서 선택된다.
일부 실시형태들에 따르면, 반경 결정 디바이스는, 신호 대 잡음 비의 선형 함수로서 단계 i 내지 단계 iii 의 반복들의 수를 결정하도록 구성될 수도 있고, 그 신호 대 잡음 비의 선형 함수는 기울기 계수 및 인터셉트 계수에 의해 정의되고, 인터셉트 계수는 송신 전력, 주어진 임계치, 및 채널 행렬의 결정자와 관련된다.
일부 실시형태들에 따르면, 디코더는, 수신된 신호에 의해 반송된 정보 심볼들의 벡터의 적어도 하나의 추정치를, 수신된 신호를 나타내는 점에 중심을 두고 탐색 구 반경에 의해 정의된 구형 영역 내부에서 발견된 격자 점들로부터 정보 심볼들의 벡터의 적어도 하나의 추정치를 결정하는 구 탐색 기반 추정 알고리즘을 적용함으로써 결정하도록 구성된 심볼 추정 유닛을 더 포함할 수도 있다.
일부 실시형태들에 따르면, 구 탐색 기반 추정 알고리즘은, 구 디코더 및 구형-경계 스택 디코더를 포함하는 그룹 중에서 선택될 수도 있다.
또한, 탐색 구 반경을 사용하여 채널 행렬에 의해 표현된 송신 채널을 통해 수신된 신호를 디코딩하기 위한 방법이 제공되며, 그 방법은 예비 반경으로부터 탐색 구 반경을 결정하는 단계, 및:
i. 수신된 신호, 채널 행렬, 및 예비 반경으로 초기에 설정되는 현재 반경으로부터 도출된 입력 데이터에 머신 학습 알고리즘을 적용하는 단계로서, 이는 현재 반경과 연관된 격자 점들의 현재 예측된 수를 제공하는, 상기 머신 학습 알고리즘을 적용하는 단계;
ii. 격자 점들의 현재 예측된 수를 주어진 임계치와 비교하는 단계;
iii. 격자 점들의 현재 예측된 수가 주어진 임계치보다 엄격하게 높으면 현재 반경을 업데이트하는 단계로서, 현재 반경은 현재 반경에 선형 함수를 적용함으로써 업데이트되는, 상기 현재 반경을 업데이트하는 단계를 포함한다.
단계 i 내지 단계 iii 은, 현재 예측된 수와 관련되는 종료 조건이 충족될 때까지 반복될 수도 있으며, 그 방법은, 종료 조건이 충족되는 것에 응답하여 탐색 구 반경을 현재 반경으로 설정하는 단계를 포함한다.
유리하게는, 본 발명의 실시형태들은, 디코딩 에러 성능을 손상시키지 않고 구 탐색 기반 순차 ML 디코더들의 복잡성의 감소를 허용하는 효율적인 구 반경 설계 및 제어 기법들을 제공한다.
유리하게는, 본 발명의 실시형태들은 ML 솔루션의 탐색 동안 방문 격자 점들의 수를 감소시킴으로써 순차 구 탐색 기반 ML 디코더들의 수렴 시간을 가속화할 수 있다. 본 발명의 실시형태들은 많은 수의 송신 및/또는 수신 안테나들을 수반하는 고차원 시스템들에 특히 적합하다.
본 발명의 추가 이점들은 도면들 및 상세한 설명을 검토하면 당업자에게 명백해질 것이다.
본 명세서에 포함되고 그 일부를 구성하는 첨부 도면들은 본 발명의 다양한 실시형태들을 예시한다.
도 1 은 통신 시스템들에서 본 발명의 예시적인 애플리케이션의 개략적 다이어그램이다.
도 2 는 일부 실시형태들에 따른, 무선 단일 사용자 MIMO 시스템에서 공간-시간 디코더의 구현의 개략적 다이어그램이다.
도 3 은 본 발명의 일부 실시형태들에 따른, 공간-시간 디코더를 예시하는 블록 다이어그램이다.
도 4 는 딥 뉴럴 네트워크들을 사용하는 본 발명의 일부 실시형태들에 따른, 머신 학습 알고리즘의 개략적 다이어그램을 예시한다.
도 5 는 본 발명의 일부 실시형태들에 따른, 디코딩 방법을 예시하는 플로우차트이다.
도 6 은 본 발명의 일부 실시형태들에 따른, 반경 결정 방법을 예시하는 플로우차트이다.
도 7 은 본 발명의 일부 실시형태들에 따른, 딥 뉴럴 네트워크를 훈련하기 위한 방법을 예시하는 플로우차트이다.
도 8 은 본 발명의 일부 실시형태들에 따라 획득된 신호 대 잡음 비의 함수로서 비트 에러 레이트 성능을 예시하는 다이어그램이다.
도 9 는 본 발명의 일부 실시형태들에 따른, 8x8 MIMO 시스템들에 대한, MMSE, SDIRS, NN-SD, 및 SSD 디코더들에 대해 획득된 신호 대 잡음 비의 함수로서 평균 프로세싱 시간을 예시하는 다이어그램이다.
도 10 은 본 발명의 일부 실시형태들에 따른, 16x16 MIMO 시스템들에 대한, MMSE, SDIRS, NN-SD, 및 SSD 디코더들에 대해 획득된 신호 대 잡음 비의 함수로서 평균 프로세싱 시간을 예시하는 다이어그램이다.
도 11 은 본 발명의 일부 실시형태들에 따른, 8x8 MIMO 시스템들에 대한 SDIRS 및 NN-SD 에 대해 획득된 신호 대 잡음 비의 함수로서 구형 영역 내부에 속하는 격자 점들의 평균 수를 예시하는 다이어그램이다.
도 12 는 본 발명의 일부 실시형태들에 따른, 16x16 MIMO 시스템들에 대한 SDIRS 및 NN-SD 디코더들에 대해 획득된 신호 대 잡음 비의 함수로서 구형 영역 내부에 속하는 격자 점들의 평균 수를 예시하는 다이어그램이다.
본 발명의 실시형태들은 계산 복잡성이 감소된 통신 시스템에서 송신 채널을 통해 수신된 신호로부터 정보 심볼들의 벡터를 디코딩하기 위한 디바이스들, 방법들, 및 컴퓨터 프로그램들을 제공한다. 특히, 본 발명의 실시형태들은 구 디코더 및 구형-경계 스택 디코더를 포함하는 구 탐색 기반 ML 순차 디코더들에서 사용되는 탐색 구 반경의 효율적인 설계 및 제어를 위한 방법들, 디바이스들 및 컴퓨터 프로그램 제품들을 제공한다. 본 발명의 실시형태들에 따른 탐색 구 반경의 설계 및 제어는 머신 학습 기법들에 의존한다.
본 발명의 일부 실시형태들의 설명의 이해를 용이하게 하기 위해, 일부 정의들 및 표기법들이 뒤따른다.
Figure pct00001
는 유클리드 공간
Figure pct00002
에 걸쳐 구성된 n 차원 격자를 지칭하고 유클리드 공간
Figure pct00003
의 부가 이산 서브그룹을 나타낸다. 격자
Figure pct00004
Figure pct00005
의 n 선형 독립 벡터들
Figure pct00006
에 의해 걸쳐 있고 다음에 따라 정수 선형 조합들의 세트에 의해 주어진다:
Figure pct00007
(1)
격자 생성 행렬 (lattice generator matrix)
Figure pct00008
은 실수 값 컴포넌트들
Figure pct00009
을 포함하는 실수 값 행렬을 지칭한다. 격자
Figure pct00010
에 속하는 격자 점 u 은 n 차원 벡터
Figure pct00011
이며, 이는 다음에 따라 격자 생성 행렬 H 의 함수로서 작성될 수 있다:
Figure pct00012
(2)
Figure pct00013
은 유클리드 공간의 2 개의 점들 사이의 거리로서 유클리드 메트릭 (또한 '유클리드 거리' 로 지칭됨) 을 정의한다.
최근접 벡터 문제는, 유클리드 벡터 공간
Figure pct00014
의 벡터 v 가 주어지면, 벡터 v 에 최근접인 벡터 u 를 격자
Figure pct00015
에서 찾는 것을 목표로 하는 최적화 문제를 지칭하며, 벡터 v 와 벡터 u 사이의 거리는 메트릭 m 에 의해 측정된다. 최근접 벡터 문제는 아직 다음에 의해 주어진 최적화 문제를 해결해야 한다:
Figure pct00016
(3)
Figure pct00017
은 예비 구 반경을 지정한다.
Figure pct00018
은 디코딩 프로세스의 탐색 페이즈 동안 구 탐색 기반 추정 알고리즘들에서 사용되는 탐색 구 반경 (또한 '초기 구 반경' 으로 지칭됨) 을 지정한다.
Figure pct00019
는, 입력 층 및 하나 이상의 은닉 층들을 포함하는
Figure pct00020
층들 및 출력 층, 및 서로에 연결된 인공 뉴런들 (이하에 '노드들' 또는 '계산 노드들' 로 지칭됨) 로 구성된 다층 딥 뉴럴 네트워크를 지칭한다. 층들의 수 K 는 딥 뉴럴 네트워크의 깊이를 나타내고 각각의 층의 노드들의 수는 딥 뉴럴 네트워크의 폭을 나타낸다.
Figure pct00021
은 k 번째 층의 폭을 지정하고 k 번째 층의 계산 노드들의 수에 대응한다.
다층 딥 뉴럴 네트워크는
Figure pct00022
로 표시된 모델 파라미터들 및
Figure pct00023
로 표시된 활성화 함수와 연관된다. 활성화 함수
Figure pct00024
는 다층 딥 뉴럴 네트워크의 은닉 층들의 뉴런의 출력을 정의하는 계산 비선형 함수를 지칭한다. 모델 파라미터들
Figure pct00025
Figure pct00026
에 대한 파라미터들의 세트들
Figure pct00027
을 포함하고, k 번째 세트
Figure pct00028
는 다층 딥 뉴럴 네트워크의 k 번째 층과 연관된 층 파라미터들의 세트를 지정하고, 그 층 파라미터들의 세트는:
- 실수 값 계수들을 포함하는 가중치 행렬을 지정하는,
Figure pct00029
로 표시된, 제 1 층 파라미터로서, 각각의 계수는 k 번째 층에 속하는 노드와 (k-1) 번째 층에 속하는 노드 사이의 연결과 연관된 가중치 값을 나타내는, 상기 제 1 층 파라미터;
- k 번째 층과 연관된 바이어스 값들의 벡터를 지정하는,
Figure pct00030
로 표시된, 제 2 층 파라미터를 포함한다.
L 은 손실 함수를 지정하고 딥 뉴럴 네트워크의 훈련 프로세스 동안 추정된 (또한 '중간' 으로 지칭됨) 및 예상된 값들 사이의 손실 (또한 '에러' 또는 '비용' 으로 지칭됨) 을 추정하는데 사용되는 수학 함수를 지칭한다.
최적화기 (이하에 '최적화 알고리즘' 또는 '그레디언트 하강 최적화 알고리즘' 으로 지칭됨) 는 훈련 페이즈 동안 딥 뉴럴 네트워크의 파라미터들을 업데이트하는데 사용되는 최적화 알고리즘을 지칭한다.
에포크들 (epochs) 은 훈련 데이터가 훈련 페이즈에서 딥 뉴럴 네트워크를 통과한 횟수를 지칭한다.
미니-배치 (mini-batch) 는 훈련 데이터로부터 추출되고 훈련 페이즈의 반복에 사용되는 훈련 데이터의 서브-세트를 지칭한다. 미니-배치 사이즈는 각각의 파티셔닝된 미니-배치의 훈련 데이터 샘플들의 수를 지칭한다.
그레디언트 하강 알고리즘의 학습 레이트 (또한 '스텝 사이즈' 로 지칭됨) 는 그레디언트의 크기를 곱한 스칼라 값을 지칭한다.
본 발명의 실시형태들은, 일반적으로, 복잡성이 감소된 구 탐색 기반 순차 알고리즘들 (또한 '구 탐색 기반 추정 알고리즘들' 로 지칭됨) 을 사용하여 최근접 벡터 문제를 해결할 수 있는 디바이스들, 방법들 및 컴퓨터 프로그램 제품들을 제공한다. 최근접 벡터 문제는, 제한 없이, 컴퓨터 과학, 코딩, 디지털 통신 및 저장, 및 암호 (cryptography) 를 포함한 여러 분야들 및 애플리케이션들에서 발생한다. 본 발명의 실시형태들은 따라서 디지털 형태의 정보를 저장, 프로세싱, 또는 통신하도록 설계된 광범위한 디지털 시스템들에서 구현될 수도 있다. 예시적인 애플리케이션들은, 제한 없이:
디지털 일렉트로닉스;
통신 (예컨대, 격자 구조화된 신호 콘스텔레이션들을 사용한 디지털 데이터 인코딩 및 디코딩);
(예컨대, 컴퓨팅 네트워크들/시스템들, 데이터 센터들에서의) 데이터 프로세싱;
데이터 스토리지 (예컨대, 클라우드 컴퓨팅);
암호 (예컨대, 도청 채널들의 코딩)
등등을 포함한다.
예시적인 디지털 시스템들은, 제한 없이:
- 통신 시스템들 (예컨대, 라디오, 무선, 단일 안테나 통신 시스템들, 다중 안테나 통신 시스템들, 광 섬유 기반 통신 시스템들);
- 통신 디바이스들 (예컨대, 단일 안테나 또는 다중 안테나 디바이스들의 트랜시버들, 기지국들, 신호 콘스텔레이션들에 의해 표현된 디지털 언코딩된 또는 코딩된 신호들을 코딩 및/또는 디코딩하기 위한 중계국들, 모바일 폰 디바이스들, 컴퓨터들, 랩탑들, 태블릿들, 드론들, IoT 디바이스들);
- 격자 기반 암호화 스킴들 (예컨대, GGH 암호화 스킴 및 NTRUEEncrypt), 격자 기반 서명들 (예컨대, GGH 서명 스킴), 및 격자 기반 해시 함수들 (예컨대, SWIFFT 및 LASH) 을 구현하는 통신, 데이터 프로세싱, 또는 저장을 위해 사용되는 암호 시스템들 및 디바이스들;
- (예컨대, 캐리어 위상 GNSS 의 미지정수 결정 (integer ambiguity resolution) 을 위한 GNSS 에서) 포지셔닝 시스템들;
- 등등을 포함한다.
본 발명의 실시형태들은 특히, 하나 이상의 송신기 디바이스들로부터 수신기 디바이스로 전달된 정보 심볼들의 벡터의 추정치를 결정하기 위해 통신 시스템들에서 구현될 수도 있으며, 추정 문제는 송신 채널을 나타내는 채널 행렬에 의해 생성된 격자에서 최근접 벡터 문제를 해결하는 것과 동등하다.
본 발명의 일부 실시형태들의 다음의 설명은 예시의 목적으로만, 주로 통신 시스템들을 참조하여 이루어질 것이다. 그러나, 당업자는 본 발명의 다양한 실시형태들이 신호 프로세싱 시스템들, 암호 시스템들, 및 포지셔닝 시스템들과 같은 다른 타입들의 시스템들에 적용될 수도 있음을 쉽게 이해할 것이다.
도 1 은 일부 실시형태들에 따른, 통신 시스템 (100) 에 대한 예시적인 애플리케이션의 블록 다이어그램이다. 통신 시스템 (100) 은 유선, 무선, 또는 광 (예를 들어, 광 섬유 기반) 일 수도 있다. 통신 시스템 (100) 은 복수의 정보 심볼들을 송신 채널 (13) 을 통해 적어도 하나의 수신기 디바이스 (15) (이하에 "수신기" 로 지칭됨) 에 송신하도록 구성된 적어도 하나의 송신기 디바이스 (11) (이하에 "송신기" 로 지칭됨) 를 포함할 수도 있다. 수신기 (15) 는 하나 이상의 송신기 디바이스들 (11) 에 의해 전송된 정보 심볼들을 디코딩하기 위해 MIMO 디코더 (10) (또한 '디코더' 또는 '공간-시간 디코더' 로 지칭됨) 를 포함할 수도 있다. 송신 채널 (13) 은 임의의 유선 연결, 무선 매체, 또는 광 링크일 수도 있다.
라디오 통신에 대한 본 발명의 애플리케이션에서, 통신 시스템 (100) 은 입력 데이터를 나타내는 정보 심볼들의 플로우를 통신하도록 구성된 무선 송신기 디바이스 (11) 및 송신기 (11) 에 의해 전달된 심볼들을 디코딩하도록 구성된 무선 수신기 디바이스 (15) 를 포함하는 무선 단일 사용자 MIMO 시스템일 수도 있다.
송신기 디바이스 (11) 는 하나 이상의 송신 안테나들을 구비할 수도 있고, 수신기 디바이스 (15) 는 하나 이상의 수신 안테나들을 구비할 수도 있으며, 송신 안테나들의 수 nt 및 수신 안테나들의 수 nr 는 1 이상이다.
라디오 통신에 대한 본 발명의 다른 애플리케이션에서, 통신 시스템 (100) 은 복수의 무선 송신기 디바이스들 (11) 및 수신기 디바이스들 (15) 이 서로 통신하는 무선 다중 사용자 MIMO 시스템일 수도 있다. 이러한 실시형태들에서, 통신 시스템 (100) 은 시간 분할 다중 액세스 (TDMA), 주파수 분할 다중 액세스 (FDMA), 코드 분할 다중 액세스 (CDMA), 및 공간-분할 다중 액세스 (SDMA) 와 같은 임의의 다중 액세스 기법을 단독으로 또는 조합하여 추가로 사용할 수도 있다.
광 통신 (예컨대, 자유 공간 광 통신 및 위성 통신) 에 대한 본 발명의 애플리케이션에서, 통신 시스템 (100) 은 광 섬유 기반 통신 시스템일 수도 있다. 송신기 (11) 및 수신기 (15) 는 따라서 광 섬유 기반 송신 시스템들에서 동작할 수 있는 임의의 광 트랜시버일 수도 있다. 송신 채널 (13) 은 짧은 또는 긴 거리들에 걸쳐 데이터를 반송하도록 설계된 임의의 광 섬유 링크일 수도 있다. 짧은 거리들에 걸쳐 광 섬유 링크들을 사용하는 예시적인 애플리케이션들은 데이터 센터 상호연결들과 같은 고용량 네트워크들을 포함한다. 긴 거리들에 걸쳐 광 섬유 링크들을 사용하는 예시적인 애플리케이션들은 지상 및 도양 (transoceanic) 송신들을 포함한다. 이러한 실시형태들에서, 송신기 (11) 에 의해 전달되는 정보 심볼들은 섬유의 상이한 편광 상태들에 따라 편광된 광 신호들에 의해 반송될 수도 있다. 광 신호들은 수신기 (15) 에 도달할 때까지, 하나 이상의 전파 모드들에 따라, 섬유 기반 송신 채널 (11) 을 따라 전파된다.
광 통신에 대한 본 발명의 다른 애플리케이션에서, 정보 심볼들을 반송하는 광 신호는 단일 파장 레이저들을 사용하여 생성될 수도 있다.
다른 실시형태들에서, 파장 분할 멀티플렉싱 (WDM) 기법들이 송신기 (11) 에서 복수의 독립 파장들을 사용하여 광 신호들을 생성할 수 있게 하는데 사용될 수도 있다.
멀티-모드 및/또는 멀티-코어 섬유들을 사용하는 광 통신 시스템들에 대한 본 발명의 또 다른 애플리케이션에서, 공간 분할 멀티플렉싱 기법들이 다양한 전파 모드들에 따라 정보 심볼들을 멀티플렉싱하는데 사용될 수도 있다.
또한, 파장 분할 다중 액세스 (WDMA) 와 같은 다중 액세스 기법이 광 통신 시스템들에 대한 본 발명의 일부 애플리케이션들에서 사용될 수도 있다.
송신 채널 (13) 은 주파수 선택성, 간섭 및 지연을 완화하기 위해 직교 주파수 분할 멀티플렉싱 (OFDM) 및 필터 뱅크 다중 캐리어 (Filter Bank Multi-Carrier; FBMC) 와 같은 단일 캐리어 또는 다중 캐리어 변조 포맷들을 사용하는 임의의 선형 부가 백색 가우시안 잡음 (Additive White Gaussian Noise; AWGN) 채널 또는 다중경로 채널일 수도 있다.
단지 예시를 위해, 다음의 설명은 nt ≥ 1 송신 안테나들을 구비한 송신기 디바이스 (11) 및 송신기 (11) 에 의해 전송된 정보 심볼들을 디코딩하기 위한 nr ≥ 1 수신 안테나들을 구비한 수신기 디바이스 (15) 를 수용하는 무선 단일 사용자 MIMO 시스템을 참조하여 이루어질 것이다. 그러나, 당업자는 본 발명의 실시형태들이 무선 다중 사용자 MIMO 시스템들 및 광 MIMO 시스템들과 같은 다른 통신 시스템들에 적용된다는 것을 쉽게 이해할 것이다. 더 일반적으로, 본 발명은 수신기 디바이스들에서 채널 출력의 선형 표현 (동등하게 격자 표현) 을 특징으로 하는 임의의 통신 시스템에 적용될 수도 있다. 또한, 이러한 실시형태들에 제한되지 않지만, 본 발명은 2 이상의 송신 안테나들의 수 및/또는 2 이상의 수신 안테나들의 수의 존재 시 특정 이점들을 갖는다.
도 2 를 참조하면, 본 발명의 다양한 실시형태들이 구현될 수도 있는 예시적인 무선 단일 사용자 MIMO 통신 시스템 (200) 이 도시된다. 무선 단일 사용자 MIMO 통신 시스템 (200) 은 시간 및 공간 차원들에 걸쳐 (즉, 송신 안테나들에 걸쳐) 정보 심볼들을 멀티플렉싱하기 위해 공간-시간 블록 코드 (STBC) 를 구현하는 송신기 (20) 를 포함할 수도 있다. 스테이션의 각 송신기 (20) 는 무선 통신 시스템 (200) 에 따라 다른 스테이션의 수신기 (21) 와 데이터를 교환할 수도 있다.
무선 단일 사용자 MIMO 통신 시스템 (200) 은 대칭적 구성을 제시할 수도 있다. 본 명세서에서 사용된 바와 같이, 대칭적 구성은 송신기 (20) 및 수신기 (21) 가 동일한 수의 안테나들 nt = nr 을 구비하는 구성을 지칭한다. 대안적으로, MIMO 구성은 비대칭적일 수도 있으며, 수신 안테나들의 수 nr 는 송신 안테나들의 수 nt 와 상이하다. 특히, 일 실시형태에서, 랭크 결핍 문제를 회피하기 위해, 수신 안테나들의 수 nr 는 송신기에서의 안테나들의 수 nt 보다 클 수도 있다. 예시적인 비대칭 MIMO 구성들은 예를 들어 LTE 표준 및 WiFiTM 표준에서 지원되는 2x4 (nt = 2, nr = 4) 및 4x8 (nt = 4, nr = 8) 을 포함한다.
송신기 (20) 는 채널 행렬 Hc 에 의해 표현되는 잡음 무선 MIMO 채널을 통해 수신기 (21) 에 신호를 전달할 수도 있다. 송신기 (20) 는 무선 환경들에서 동작할 수 있는 상이한 디바이스들 또는 시스템들에서 구현될 수도 있다. 이러한 애플리케이션들에 적합한 예시적인 디바이스들은 모바일 폰들, 드론들, 랩탑들, 태블릿들, 로봇들, IoT (사물 인터넷) 디바이스들, 기지국들 등을 포함한다. 송신기 (20) 는 고정되거나 이동가능할 수도 있다. 예를 들어, 다음을 포함할 수도 있다:
- 선형 블록 코드들, 컨볼루션 코드들, 폴라 코드들, 저 패리티 검사 코드들 (Low Parity Check Code; LDPC) 등과 같은 하나 이상의 포워드 에러 정정 (Forward Error Correction; FEC) 코드들을 구현하는 채널 인코더 (201);
- 변조된 심볼 벡터 sc 를 전달하는 직교 진폭 변조 (QAM) 와 같은 변조 스킴을 구현하는 변조기 (203);
- 코드워드 행렬 X 을 전달하기 위한 공간-시간 인코더 (205);
- nt 송신 안테나들 (207), 각각의 송신 안테나는 OFDM 또는 FBMC 변조기와 같은 단일 캐리어 또는 다중 캐리어 변조기와 연관된다.
송신기 (20) 는 예를 들어 선형 블록 코드, 컨볼루션 코드, 저 밀도 패리티 검사 (LDPC) 코드 또는 폴라 코드를 구현하는 FEC 인코더 (201) 를 사용하여 데이터 입력으로서 정보 비트들의 수신된 플로우를 인코딩하도록 구성될 수도 있다. 그 다음 인코딩된 이진 신호는 변조기 (203) 를 사용하여 심볼 벡터 sc 로 변조될 수도 있다. 2q 심볼들 또는 상태들을 갖는 2q-QAM 또는 2q-PSK 과 같은 상이한 변조 스킴들이 구현될 수도 있다. 변조된 벡터 sc 는 심볼 당 q 비트를 갖는
Figure pct00031
복소수 값 심볼들
Figure pct00032
을 포함하는 복소수 값 벡터일 수도 있다.
정보 심볼 sj 은 평균 전력 Es 을 가지며, 다음과 같은 형태로 작성될 수 있다:
Figure pct00033
(4)
수학식 (4) 에서, i 는 i2 = -1 이 되도록 복소수를 나타내고,
Figure pct00034
Figure pct00035
연산자들은 입력 값의 실수부와 허수부를 각각 출력한다.
2q-QAM 과 같은 변조 포맷들이 사용될 때, 2q 심볼들 또는 상태들은 정수 필드
Figure pct00036
의 서브세트를 나타낸다. 대응하는 콘스텔레이션은 상이한 상태들 또는 심볼들을 나타내는 2q 점들로 구성된다. 또한, 제곱된 변조들의 경우, 정보 심볼들의 실수부와 허수부는 동일한 유한 알파벳
Figure pct00037
에 속한다. 변조 스킴의 최소 거리 dmin 는 콘스텔레이션에서 2 개의 인접한 점들 사이의 유클리드 거리를 나타내며, 이러한 예에서 2 와 동일하다.
공간-시간 인코더 (205) 는 인코딩된 심볼들로부터 코드워드 행렬 X 을 생성하는데 사용될 수도 있다. 공간-시간 인코더 (205) 는 길이 T 의 선형 STBC 를 사용할 수도 있고, 코드북 C 에 속하고 T 시간 슬롯들에 걸쳐 전송되는 차원
Figure pct00038
의 코드워드 행렬 X 을 전달할 수도 있다. 이러한 코드들의 코딩 레이트는 채널 사용 당
Figure pct00039
복소수 심볼들과 동일하며, 여기서
Figure pct00040
는 이 경우 차원
Figure pct00041
의 벡터
Figure pct00042
를 구성하는 인코딩된 복소수 값 심볼들의 수이다. 풀-레이트 코드들이 사용될 때, 공간-시간 인코더 (205) 는
Figure pct00043
복소수 값 심볼들을 인코딩한다. STBC들의 예들은 완전 코드 (Perfect Code) 들이다. 완전 코드들은 복소수 정보 심볼들의 수
Figure pct00044
를 인코딩함으로써 풀 코딩 레이트들을 제공하고 넌-배니싱 (non-vanishing) 결정 특성을 충족한다.
일부 실시형태들에서, 공간-시간 인코더 (205) 는 시간 차원에서 코딩을 수행하지 않고, 상이한 송신 안테나들을 통해 수신된 복소수 값 정보 심볼들을 멀티플렉싱함으로써 V-BLAST 스킴으로 알려진 공간 멀티플렉싱 스킴을 사용할 수도 있다.
이렇게 구성된 코드워드는 예를 들어 OFDM 또는 FBMC 변조기들을 사용하는, 다중캐리어 변조 기법을 사용하여 시간 도메인으로부터 주파수 도메인으로 변환될 수도 있고, 송신 안테나들 (207) 을 통해 확산될 수도 있다. 신호들은 옵션의 필터링, 주파수 전치 및 증폭 후에 송신 안테나들 (207) 로부터 전송될 수도 있다.
수신기 (21) 는 복소수 값 채널 행렬 Hc 에 의해 표현되고 페이딩과 간섭을 받는 송신 채널 (또한 "통신 채널" 로 지칭됨) 을 통해 무선 네트워크에서 송신기 (20) 에 의해 통신된 신호를 수신 및 디코딩하도록 구성될 수도 있다. 또한, 통신 채널은, 예를 들어, 가우시안 잡음에 의해 영향을 받는, 잡음이 있을 수도 있다.
수신기 (21) 는 셀룰러 네트워크 내의 노드-B, 로컬 영역 네트워크 또는 애드-혹 네트워크들 내의 액세스 포인트 또는 무선 환경에서 동작하는 임의의 다른 인터페이싱 디바이스와 같은 기지국에 통합될 수도 있다. 수신기 (21) 는 고정되거나 이동가능할 수도 있다. 일 예시적인 실시형태에서, 수신기 (21) 는 다음을 포함할 수도 있다:
- 채널 행렬 Hc 및 채널 출력 신호 Yc 로부터, 변조된 심볼 벡터 sc 의 추정
Figure pct00045
을 전달하도록 구성된 공간-시간 디코더 (211) (또한 'MIMO 디코더' 로 지칭됨);
- 추정된 심볼 벡터
Figure pct00046
의 복조를 수행함으로써 이진 시퀀스를 생성하도록 구성된 복조기 (213), 및
- 예를 들어, 비터비 알고리즘을 사용하여, 송신된 비트들의 추정인 이진 신호를 출력으로서 전달하도록 구성된 채널 디코더 (215).
수신기 (21) 는 송신기 (20) 에 의해 수행되는 프로세싱의 역 프로세싱을 구현한다. 따라서, 송신기에서 다중 캐리어 변조가 아닌 단일 캐리어 변조가 사용되는 경우, FBMC 복조기들의 nr OFDM 은 대응하는 단일 캐리어 복조기들로 대체될 수도 있다.
도 3 은 무선 레일리 페이딩 다중 안테나 시스템에 대한 애플리케이션에서 일부 실시형태들에 따른 공간-시간 디코더 (300) 의 블록 구조를 나타내며, 디코더 (300) 는 nt 송신 안테나들을 구비한 송신기로부터 전송된 신호를 수신 및 디코딩하도록 구성되고, 디코더 (300) 는 nr 수신 안테나들을 구비한 수신기 디바이스에서 구현된다.
공간-시간 인코딩이 길이 T 인코딩
Figure pct00047
심볼들의 공간-시간 코드를 사용하여 송신기에서 수행된 일부 실시형태들에 따르면, 수신된 복소수 값 신호는 다음의 형태로 작성될 수도 있다:
Figure pct00048
(5)
수학식 (5) 에서, Yc 는 수신된 신호를 나타내는
Figure pct00049
행렬을 지정하고, Xc 는 차원
Figure pct00050
의 복소수 값 코드워드 행렬을 나타낸다.
V-BLAST 공간 멀티플렉싱이 사용되는 일부 실시형태들에 따르면, 수신된 복소수 값 신호는 다음의 형태로 작성될 수도 있다:
Figure pct00051
(6)
수학식 (6) 에서, yc 는 nr 차원 벡터이고, sc 는 차원 nt 의 송신된 정보 심볼들의 복소수 값 벡터를 나타낸다.
복소수 값
Figure pct00052
행렬 Hc 은 페이딩 이득들을 포함하는 채널 행렬을 나타낸다. 레일리 페이딩 채널에서, 채널 행렬 Hc 의 엔트리들은 독립적 동일 분산된 (i.i.d) 복소 가우시안 타입이다. 채널 행렬은 최소 제곱 추정기들과 같은 추정 기법들을 사용하여 수신기에서 코히어런트 송신들에서 추정될 수도 있다. 다중경로 페이딩 효과들에 더하여, 송신 채널은 잡음이 있을 수도 있다. 잡음은 시스템 컴포넌트들의 열 잡음, 사용자간 간섭 및 안테나들에 의한 인터셉트된 간섭 복사로부터 기인할 수도 있다. 전체 잡음은
Figure pct00053
복소수 값 행렬 Wc 및 nr 차원 복소수 값 벡터 wc 에 의해 각각 모델링된 실수 값 차원당 분산
Figure pct00054
의 제로-평균 부가 백색 가우시안 잡음에 의해 모델링될 수도 있다.
디코더는, 복소수 값 채널 행렬 Hc 을 실수 값 등가 채널 행렬 H 로 변환하고, 복소수 값 수신된 신호를 실수 값 신호로 변환하도록 구성된 복소수-대-실수 변환기 (301) 를 포함할 수도 있다.
V-BLAST 공간 멀티플렉싱을 사용하는 일 실시형태에서, 복소수-대-실수 변환기 (301) 는 복소수 값 시스템을 다음으로 변환하도록 구성될 수도 있다:
Figure pct00055
(7)
Figure pct00056
Figure pct00057
연산자들은 기저 벡터 또는 행렬을 구성하는 각각의 엘리먼트의 실수부 및 허수부를 지정한다. 복소수-대-실수 변환은 벡터들의 엘리먼트들의 임의 순서를 고려하여 수행될 수도 있으며, 이 예시적인 변환에 한정되지 않는다.
송신기에서 선형 공간-시간 블록 코딩을 사용하는 다른 실시형태들에서, 복소수-대-실수 변환기 (301) 는 복소수 값 시스템을, 등가 채널 행렬이 다음의 수학식 (8) 에 의해 주어진 실수 값
Figure pct00058
행렬 Heq 인 선형 표현 형태로 작성될 수 있는 실수 값 시스템으로 변환하도록 구성될 수도 있다:
Figure pct00059
(8)
Figure pct00060
행렬 G 은 송신기에서 사용되는 선형 공간-시간 블록 코드의 생성 행렬 또는 코딩 행렬로 알려진 실수 값 행렬을 지정한다. IT 는 차원 T 의 항등 행렬을 나타내고 연산자
Figure pct00061
는 크로네커 행렬 곱이다.
다음의 실시형태들의 이해를 용이하게 하기 위해, 다음의 설명은 예시의 목적으로만, 공간 멀티플렉싱 스킴을 참조하고, 송신기 및 수신기가 동일한 수의 안테나들 nt = nr 을 구비하는 대칭적 MIMO 구성을 수반하여 이루어질 것이다. 따라서, 실수 값 시스템은 다음과 같이 선형 형태로 작성될 수 있다:
Figure pct00062
(9)
수학식 (9) 에서, 벡터들 y, s 및 w 은
Figure pct00063
인 n 차원 벡터들이고, 등가 실수 값 채널 행렬 H 은 정사각형
Figure pct00064
행렬이다. 벡터 s 는 벡터 sc 에 포함된 원래 복소수 값 정보 심볼들의 실수부 및 허수부를 포함한다. 예를 들어 2q-QAM 변조가 사용되는 실시형태들에서, 벡터 s 의 컴포넌트들은 동일한 유한 알파벳
Figure pct00065
에 속한다.
벡터 s 의 정수 특성이 주어지면, 형태
Figure pct00066
의 임의의 신호가 실수 값 채널 행렬 H 인 생성 행렬의 n 차원 격자
Figure pct00067
로부터의 점으로 고려될 수 있다. 따라서, 실수 값 MIMO 시스템은 격자 표현과 연관될 수도 있다. 원래 복소수 값 정보 심볼들의 실수부 및 허수부를 포함하는 벡터 s 의 각각의 가능한 값은 격자
Figure pct00068
의 격자 점에 의해 표현될 수도 있다. 더욱이, 잡음 벡터 w 의 존재로 인해, 실수 값 수신된 신호 y 는 격자 점에 대응하지 않는다. 그것은 잡음 벡터 w 에 의해 교란된 격자
Figure pct00069
의 점으로 보여질 수도 있다.
격자들은 정의상 무한대, 즉 무한대의 격자 점들을 포함한다. QAM 과 같은 변조들이 사용되는 경우, 심볼들의 벡터 s 의 가능한 값들의 세트는 유한하고 유한 알파벳 A 에 의해 결정된다. 이 경우에, 벡터 s 의 가능한 값들에 대한 연관된 격자 점들은 격자
Figure pct00070
의 유한 수의 점들을 구성한다. 이러한 격자 점들은 이하의 설명에서 '유효한 격자 점들' 로 지칭될 것이다.
ML 디코딩 기준에 따르면, 벡터 s 의 최적의 추정치
Figure pct00071
는 다음에 의해 주어진 최적화 문제의 솔루션이다:
Figure pct00072
(10)
MIMO 시스템의 격자 표현을 사용하여, ML 디코딩 문제를 해결하는 것은 격자
Figure pct00073
에서 최근접 벡터 문제를 해결하기 위해 축소된다. ML 솔루션은 이 경우에 유클리드 거리의 최소화의 의미에서 수신된 신호에 대한 최근접 유효한 격자 점에 대응한다.
실제 구현들을 위해, MIMO 시스템의 등가 트리 표현은 QR 분해에 기초하여 사용될 수도 있다. 따라서, 디코더 (300) 는 H = QR 이 되도록 실수 값 채널 행렬에 QR 분해를 적용함으로써 직교 행렬
Figure pct00074
및 상삼각 행렬
Figure pct00075
을 생성하도록 구성된 QR 분해기 (303) 를 포함할 수도 있다. 상삼각 행렬의 컴포넌트들은 Rij 로 표시되며 여기서
Figure pct00076
이다.
디코더 (300) 는 수신된 신호
Figure pct00077
를, 다음의 수학식 (11) 이 되도록 실수 값 채널 행렬의 QR 분해로부터 획득된 직교 행렬 Q 의 전치에 의해 실수 값 신호 y 를 스케일링함으로써 결정하도록 구성된 곱셈 유닛 (305) 을 더 포함할 수도 있다:
Figure pct00078
(11)
수학식 (11) 에서,
Figure pct00079
는 행렬 Q 이 직교임을 고려해 볼 때, 잡음 벡터 w 와 동일한 통계적 특성들 (동일한 공분산 행렬) 을 갖는 스케일링된 잡음 벡터를 지정한다. 등가 격자 표현은 따라서 상삼각 행렬 R 인 생성 행렬의 격자
Figure pct00080
에 의해 정의될 수도 있다. 따라서 ML 디코딩 문제는 다음으로 표현될 수도 있다:
Figure pct00081
(12)
ML 메트릭은 다음에 의해 정의될 수도 있다:
Figure pct00082
(13)
더욱이, 행렬 R 의 상삼각 구조를 고려해 볼 때, 트리 표현은 MIMO 시스템과 연관될 수도 있다. 트리 표현은 디코딩 트리 (이하에 '트리' 또는 '탐색 트리' 로 지칭됨) 에 의해 정의된다. 디코딩 트리는 복수의 노드들, 레벨들, 분기들 및 경로들을 포함하는 그래프 데이터 구조이다. 보다 구체적으로, 디코딩 트리는 각각의 레벨이 최대
Figure pct00083
노드들을 포함하는 n 레벨들을 포함하고, 여기서
Figure pct00084
는 유한 알파벳 A 의 카디널리티를 지정한다.
트리의 노드들은 벡터 s 에 포함된 복소수 값 정보 심볼들의 실수부 및 허수부의 상이한 가능한 값들에 대응한다.
레벨들은, 트리의 제 1 레벨에 위치된 노드들이 심볼들의 벡터 s 의 마지막 컴포넌트에 대응하고, 제 2 레벨이 끝에서 두 번째에 대응하는 등등이 되도록 역 순으로 벡터 s 에서 디코딩된 심볼들의 랭크들에 대응한다. 벡터
Figure pct00085
를 작성함으로써, 트리에서 레벨 k 에 위치된 노드는 심볼
Figure pct00086
의 가능한 값에 대응한다. 트리의 마지막 레벨에 위치된 노드들은 리프 노드들이라 하며 제 1 심볼 s1 의 가능한 값들에 대응한다.
분기들은 '루트 노드' 라는 가상 노드 및 2 개의 연속적인 레벨들에 위치된 링크 노드들에서 출발한다. 루트 노드는 sroot 또는 sn+1 로 표시될 수도 있다.
Figure pct00087
로 표시된 분기는 연속적인 레벨들 n-i 및 n-i+1 에 위치된 2 개의 노드들 si+1 및 si 사이의 연결에 대응한다. 루트 노드를 트리의 제 1 레벨에 위치된 노드 sn 에 연결하는 분기는 관례상
Figure pct00088
로 표시된다.
각각의 분기는 비용 함수 (또한 이하에 '부분 메트릭' 또는 '부분 유클리드 거리' 로 지칭됨) 와 연관된다. 분기
Figure pct00089
와 연관된 비용 함수는 다음에 의해 ML 메트릭을 사용하여 정의될 수도 있다:
Figure pct00090
(14)
Figure pct00091
는 벡터
Figure pct00092
의 i 번째 컴포넌트를 지정하고 Rji 은 i 번째 행 및 j 번째 열에 위치된 상삼각 행렬 R 의 컴포넌트를 나타낸다. 루트 노드에서 시작하는 분기
Figure pct00093
와 연관된 비용 함수는 다음에 의해 주어진다:
Figure pct00094
(15)
트리의 각각의 노드는 메트릭과 연관될 수도 있다. 분기들의 부분 메트릭들의 정의를 사용하면, 트리의 주어진 노드와 연관된 메트릭은 루트 노드로부터 이 주어진 노드까지의 경로를 구성하는 상이한 분기들의 부분 메트릭들의 합계로 보여질 수도 있다. 따라서, 레벨 k 에 위치된 노드 sn-k+1 와 연관된 메트릭은 다음으로 표현될 수도 있다:
Figure pct00095
(16)
루트 노드로부터 리프 노드까지의 경로는 심볼들의 벡터 s 의 가능한 값
Figure pct00096
에 대응한다. 리프 노드에 대한 연관된 메트릭은 등가 수신된 신호
Figure pct00097
와 벡터
Figure pct00098
를 사용하여 획득된 벡터
Figure pct00099
사이의 유클리드 거리에 대응한다.
MIMO 시스템의 트리 표현에 따르면, ML 최적화 문제는 디코딩 트리에서 트리 탐색을 수행함으로써 동등하게 해결될 수도 있다. 따라서, ML 솔루션은 가장 낮은 메트릭을 초래하는 디코딩 트리의 경로에 대응한다.
트리 탐색의 계산 복잡성은 각각의 레벨에서의 노드들의 수 및 디코딩 트리의 레벨들의 총 수에 의존하는 트리 탐색 동안의 방문 노드들의 수에 비례한다.
검사된 노드들의 수를 감소시키고 따라서 디코딩 복잡성을 감소시키기 위해, 본 발명의 실시형태들은 디코딩 트리의 각각의 레벨에 대해 탐색 인터벌들을 부과함으로써 트리 탐색 동안 방문 노드들의 수를 감소시키는 구 탐색 기반 추정 알고리즘들에 기초하는 디코딩 방법들 및 디바이스들을 제공한다. 메트릭이 가장 낮은 경로를 탐구하면서 이들 탐색 인터벌들에 속하는 노드들만이 검사된다. MIMO 시스템의 등가 격자 표현을 사용하면, 방문 노드들의 수의 감소는, 실수 값 수신된 신호
Figure pct00100
를 나타내는 점에 중심을 둔 탐색 구 반경 rs 의 구형 영역
Figure pct00101
내부에 속하는 격자 점들로의 격자 점들 탐색 동안 방문 격자 점들의 수의 감소와 동등하게 보여질 수도 있다. ML 솔루션은 따라서 다음에 의해 주어진 최적화 문제를 해결함으로써 결정된다:
Figure pct00102
(17)
탐색 구 반경 rs 에서 출발하여, 구 탐색 기반 추정 알고리즘들은 구형 영역
Figure pct00103
내부의 정보 심볼들의 벡터의 가능한 값들 중 하나와 연관된 제 1 격자 점을 탐색한다. 유효한 격자 점을 찾으면, 탐색 구 반경의 값은 구형 영역
Figure pct00104
에서 발견된 격자 점과 수신된 신호
Figure pct00105
를 나타내는 점 사이의 유클리드 거리의 값으로 업데이트된다. 이 구 제약 탐색 및 반경 업데이트는 유효한 격자 점을 포함하고 수신된 신호를 나타내는 점에 중심을 둔 가장 작은 구에 대응하는 ML 솔루션을 찾을 때까지 반복적으로 수행된다.
격자 점들 탐색 페이즈의 복잡성은 탐색 구 반경 rs 의 선택에 매우 의존한다. 본 발명의 실시형태들은 최적의 성능을 희생하지 않고 트리 탐색 페이즈의 복잡성을 감소시킬 수 있는 탐색 구 반경 rs 을 결정하기 위한 효율적인 디바이스들 및 방법들을 제공한다.
따라서, 디코더 (300) 는 수신된 신호
Figure pct00106
및 채널 행렬 R 에 의존하는 입력 데이터에 머신 학습 알고리즘을 적용함으로써 예비 반경 r0 으로부터 탐색 구 반경 rs 을 결정하도록 구성된 반경 결정 디바이스 (307) 를 포함할 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 정지 조건 (또한 '종료 조건' 으로 지칭됨) 이 충족될 때까지 다수의 반복들 Niter 동안 현재 반경을 업데이트함으로써 반복 프로세스에 따라 탐색 구 반경 rs 을 결정하도록 구성될 수도 있다. i 번째 반복에 대응하는 현재 반경은
Figure pct00107
에 의해 지정되고, 여기서
Figure pct00108
이다. 따라서, i=1 인 제 1 반복에서, 반경 결정 디바이스 (307) 는
Figure pct00109
이 되도록 현재 반경을 예비 반경 r0 으로 초기에 설정하도록 구성될 수도 있다. 현재 반경의 초기화 후에, 반경 결정 디바이스 (307) 는 Niter 반복들 동안 현재 반경을 반복적으로 업데이트하도록 구성될 수도 있다.
Figure pct00110
인 각각의 i 번째 반복은 다음으로 구성된 단계들을 포함한다:
i. 수신된 신호
Figure pct00111
, 채널 행렬 R 및 현재 반경
Figure pct00112
으로부터 도출된 입력 데이터에 머신 학습 알고리즘을 적용하는 단계, 이는 현재 반경
Figure pct00113
과 연관된 격자 점들의 수의 현재 예측
Figure pct00114
(또한 '격자 점들의 현재 예측된 수' 로 지칭됨) 을 제공함;
ii. 격자 점들의 현재 예측된 수
Figure pct00115
를 Nth 로 표시된 주어진 임계치와 비교하는 단계;
iii. 격자 점들의 수의 현재 예측
Figure pct00116
이 주어진 임계치보다 엄격하게 높으면, 즉
Figure pct00117
이면 현재 반경
Figure pct00118
을 업데이트하는 단계, 반경 결정 디바이스 (370) 는 현재 반경에 선형 함수
Figure pct00119
를 적용함으로써 현재 반경
Figure pct00120
을 업데이트하도록 구성된다. 따라서, 반복의 인덱스는 먼저 i = i + 1 이 되도록 업데이트되고, 그 다음 현재 구 반경은
Figure pct00121
이 되도록 업데이트된다.
종료 조건은 격자 점들의 현재 예측된 수와 관련된다. 보다 구체적으로, 격자 점들의 현재 예측된 수
Figure pct00122
가 주어진 임계치 Nth 이하이면 종료 조건이 충족된다. 일단 정지 조건이 충족되면, 반경 결정 디바이스 (307) 는 탐색 구 반경 rs 을,
Figure pct00123
이 되도록 정지 조건을 충족하는 격자 점들의 현재 예측된 수
Figure pct00124
와 연관되는 마지막 업데이트된 현재 반경
Figure pct00125
으로 설정하도록 구성될 수도 있다. 이것은 반경 결정 디바이스 (307) 가 종료 조건이 충족되는 것에 응답하여 탐색 구 반경을 현재 반경으로 설정하도록 구성될 수도 있음을 의미한다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 1/2 과 동일한 기울기 파라미터 및 0 과 동일한 인터셉트 파라미터를 갖는 선형 함수를 사용하여 현재 반경을 업데이트하도록 구성될 수도 있으며, 이는 아직 현재 반경을 2 로 나누어야 한다, 즉
Figure pct00126
이다.
각각의 반복
Figure pct00127
에서, 반경 결정 디바이스 (307) 는 수신된 신호
Figure pct00128
에 중심을 두고 구 반경 중, 현재 반경
Figure pct00129
을 갖는 구형 영역 내부에 속하는 격자 점들의 예측된 수에 대응하는 격자 점들의 예측된 수
Figure pct00130
를 결정하기 위해 머신 학습 알고리즘을 적용하도록 구성될 수도 있다. 머신 학습 알고리즘은 각각의 반복
Figure pct00131
에서, 수신된 신호
Figure pct00132
의 n 컴포넌트들, 현재 반경
Figure pct00133
, 및 상삼각 채널 행렬 R 의 n2 컴포넌트들을 포함하는
Figure pct00134
로 표시된 입력 벡터를 입력으로서 취한다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 잡음 분산
Figure pct00135
, 채널 행렬 R 의 대각선 컴포넌트들, 및 수신된 신호
Figure pct00136
와 추정 벡터 yest 사이의 거리를 나타내는 유클리드 거리 중 적어도 하나의 파라미터로부터 예비 반경 r0 을 결정하도록 구성될 수도 있고, 추정 벡터는 준최적 추정 알고리즘을 적용함으로써 결정되고, 준최적 추정 알고리즘은, 제로 포싱 결정 피드백 등화기 (ZF-DFE) 및 최소 평균 제곱 에러 추정 (MMSE) 알고리즘을 포함하는 그룹에서 선택된다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 다음의 수학식 (18) 에 따라 채널 부가 잡음의 분산에 기초하여 예비 반경을 결정하도록 구성될 수도 있다:
Figure pct00137
(18)
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 다음의 수학식 (19) 에 따라 송신 채널의 동역학들 및 신호 페이딩에 대한 변화들을 고려하기 위해 채널 행렬 R 의 대각선 컴포넌트들에 의존하여 예비 반경을 결정하도록 구성될 수도 있다:
Figure pct00138
(19)
반경 결정 디바이스 (307) 가
Figure pct00139
에 따라 채널 잡음의 분산의 함수로서 예비 반경을 결정하도록 구성되는 일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는
Figure pct00140
(여기서 Pt 는 송신 전력을 지정함) 로서 데시벨로 표현된 신호 대 잡음 비의 선형 함수로서 단계 i 내지 단계 iii 의 반복들의 수 Niter 를 결정하도록 구성될 수도 있다. 보다 구체적으로, 반경 결정 디바이스 (307) 는 주어진 임계치 Nth 를 격자
Figure pct00141
의 격자 생성 행렬 R 의 결정자와 관련시키는 카운팅 함수를 활용함으로써 신호 대 잡음 비의 선형 함수를 결정하도록 구성될 수도 있으며, 카운팅 함수는 다음에 의해 주어진다:
Figure pct00142
(20)
rth 은 임계치 Nth 와 동일한 격자 점들의 수를 포함하는 구의 반경을 지정하고,
Figure pct00143
는 격자
Figure pct00144
의 생성 행렬의 결정자를 지정하고, Vn 는 실수 벡터 공간
Figure pct00145
에서 단위 반경 구의 부피를 지정한다.
카운팅 함수를 사용하여, 발명자들은, Niter 반복들 동안 예비 반경
Figure pct00146
을 2 로 연속하여 나눔으로써, 반복들의 수 Niter 가 a 로 표시된 기울기 계수 및 b 로 표시된 인터셉트 계수에 의해 정의된 선형 함수
Figure pct00147
에 따라 신호 대 잡음 비
Figure pct00148
의 함수로서 표현될 수도 있고, 기울기 계수는 다음의 수학식 (21) 에 따라 마이너스 10 과 10 을 밑수로 하는 로그 2 의 곱의 역으로 주어진다고 결정하였다:
Figure pct00149
(21)
인터셉트 계수 b 는 다음의 수학식 (22) 에 따라 송신 전력 Pt, 주어진 임계치 Nth, 및 격자
Figure pct00150
의 생성 행렬 R 의 결정자에 의존한다:
Figure pct00151
반복들의 수를 신호 대 잡음 비와 관련시키는 선형 함수를 활용함으로써, 반경 결정 디바이스 (307) 는 머신 학습 프로세싱을 수행하지 않고 탐색 구를
Figure pct00152
와 동일하게 설정하도록 구성될 수도 있다. 이 기법은 '스마트 구 기반 디코딩' 또는 SSD 로 지칭된다.
디코더 (300) 는 ML 최적화 문제를 해결하기 위해 구 탐색 기반 추정 알고리즘을 적용함으로써 정보 심볼들의 벡터 s 의 적어도 하나의 추정치
Figure pct00153
를 결정하도록 구성된 심볼 추정 유닛 (309) 을 더 포함할 수도 있고, 정보 심볼들의 벡터의 적어도 하나의 추정치는 격자 점들 탐색 페이즈 동안 반경 rs 의 구형 영역
Figure pct00154
내부에서 발견된 격자 점들로부터 결정된다.
일부 실시형태들에 따르면, 구 탐색 기반 추정 알고리즘은, 구 디코더 및 SB-Stack 디코더를 포함하는 그룹에서 선택될 수도 있다.
구 디코더가 고려되는 일부 실시형태들에 따르면, 심볼 추정 유닛 (309) 은 정보 심볼들의 벡터
Figure pct00155
에서 각각의 디코딩된 심볼 st 에 대해
Figure pct00156
로 표시된 탐색 인터벌들을 정의하도록 구성될 수도 있고, 탐색 인터벌 It 의 하부 경계
Figure pct00157
및 상부 경계
Figure pct00158
는 탐색 구 반경 rs 의 함수로서 결정된다. 구 제약은 분기 및 경계 접근법에 따라 반경 rs 의 구형 영역
Figure pct00159
에서 점들을 스캔하고 ML 최적화 문제로 표현된 형상화 제약을 충족하는 유효한 격자 점들을 선택함으로써 재귀적으로 발견될 수 있다. 구 디코더는 깊이 우선 트리 탐색 전략에 기초한다. 유효한 격자 점이 구
Figure pct00160
내부에서 발견될 때마다, 탐색 구 반경은 발견된 격자 점과 수신된 신호 사이의 유클리드 거리와 동일한 새로운 값으로 탐색 구 반경을 설정함으로써 업데이트될 수도 있다. 모든 격자 점들이 재귀적으로 탐색되었을 때, 구형 영역 내부에서 발견된 격자 점들로부터 수신된 신호까지 최소 유클리드 거리를 갖는 발견된 격자 점들은 정보 심볼들의 벡터의 적어도 하나의 추정치를 결정하기 위해 선택될 수도 있다.
SB-Stack 이 고려되는 다른 실시형태들에 따르면, 최상 우선 (best-first) 트리 탐색이 디코딩 트리의 노드들을 탐구하기 위해 사용될 수도 있다. 루트 노드에서 시작하여, 자식 노드들의 전부 또는 서브세트가 탐구되고 부분 메트릭이 각각의 탐구된 자식 노드에 대해 계산된다. 구 제약 및 탐색 인터벌들을 충족하는 부분 메트릭을 갖는 노드들만이 스택에서 생성 및 저장된다. 탐색 구 반경의 어떠한 업데이트 없이도, 탐색은 리프 노드를 찾을 때까지 계속되고 ML 솔루션에 대응하는 최적의 경로가 반환된다.
디코더 (300) 는 복소수 값 심볼들 sc 의 원래 벡터의 추정치로서 복소수 값 벡터
Figure pct00161
를 전달하도록 구성된 실수-대-복소수 변환기 (311) 를 더 포함할 수도 있다. 그 후에, 획득된 후보 벡터
Figure pct00162
는 컴포넌트
Figure pct00163
(여기서
Figure pct00164
) 가 다음의 수학식 (23) 에 의해 주어지도록 복소수 값 벡터
Figure pct00165
로 변환될 수도 있다:
Figure pct00166
(23)
Figure pct00167
는 벡터 u 의 j 번째 엘리먼트를 나타낸다.
일부 실시형태들에 따르면, 머신 학습 알고리즘은 라벨링된 입력-출력 쌍들의 세트로 구성되는 라벨링된 훈련 데이터에 기초하여 결정되는 함수를 사용하여 입력 데이터를 예측된 데이터에 맵핑하는 지도 머신 학습 알고리즘일 수도 있다. 예시적인 지도 머신 학습 알고리즘들은, 제한 없이, 서포트 벡터 머신들 (SVM), 선형 회귀, 로지스틱 회귀, 나이브 베이즈, 선형 판별 분석, 결정 트리들, k-최근접 이웃 알고리즘, 뉴럴 네트워크들, 및 유사성 학습을 포함한다.
바람직한 실시형태들에서, 지도 머신 학습 알고리즘은 다층 피드-포워드 인공 뉴럴 네트워크인 다층 퍼셉트론일 수도 있다.
도 4 를 참조하면, 입력 층 및 하나 이상의 은닉 층들 (403) 을 포함하는 적어도 2 층들
Figure pct00168
, 및 출력 층 (405) 으로 구성된 다층 딥 뉴럴 네트워크
Figure pct00169
(400) 가 예시된다. 입력 층 (401), 하나 이상의 은닉 층들 (403), 및 출력 층 (405) 중 각각의 층은 복수의 인공 뉴런들 또는 계산 노드들 (4011) 을 포함한다.
다층 딥 뉴럴 네트워크 (400) 는 완전히 연결된다. 따라서, 일 층의 각각의 계산 노드는 소정의 가중치로 후속 층의 모든 계산 노드에 연결되고, 즉 이전 층으로부터의 연결된 노드들로부터의 입력을 입력 값들을 증폭 또는 감쇠시키는 가중치들의 세트와 결합한다. 각각의 층의 출력은 입력 데이터를 수신하도록 구성되는 입력 층 (401) 에서 시작하여, 동시에 후속 층의 입력이다.
입력 계산 노드들, 즉 입력 층의 계산 노드들 (4011) 을 제외하고, 하나 이상의 은닉 층들에 포함된 각각의 계산 노드 (4011) 는 계산 노드의 가중 입력들을 계산 노드의 출력에 맵핑하는 비선형 활성화 함수
Figure pct00170
를 구현한다.
다층 구조에 따르면, 딥 뉴럴 네트워크는, 각각의 반복
Figure pct00171
에서, 입력 벡터
Figure pct00172
를 K 반복 머신 학습 프로세싱 단계들을 통해
Figure pct00173
로 표시된 출력 벡터에 맵핑하는 맵핑
Figure pct00174
을 정의하며, 딥 뉴럴 네트워크의 K 층들 중 k 번째 층은 k 번째 층에 의해 입력으로 수신된 입력 벡터
Figure pct00175
를 출력 벡터
Figure pct00176
에 맵핑하는
Figure pct00177
로 표시된 맵핑을 반송한다. k 번째 층에서의 맵핑은 이전 층의 출력 벡터에 대응하는 입력 벡터
Figure pct00178
, 및 k 번째 층과 연관된 파라미터들의 세트
Figure pct00179
에 의존한다. (입력 층을 제외한) k 번째 층과 연관된 맵핑
Figure pct00180
은 다음으로 표현될 수 있다:
Figure pct00181
(24)
k 번째 층의 계산 노드들에서 수행된 입력-가중치 곱은 가중치 행렬
Figure pct00182
과 k 번째 층에 의해 입력으로서 프로세싱된 입력 벡터
Figure pct00183
사이의 프로덕트 함수
Figure pct00184
에 의해 표현되고, 이들 입력-가중치 곱은 그 후 합산되고 그 합이 활성화 함수
Figure pct00185
를 통해 전달된다.
일부 실시형태들에 따르면, 활성화 함수는 하나 이상의 은닉 층들 (403) 의 복수의 계산 노드들 중 적어도 하나의 계산 노드 (4011) 에서 구현될 수도 있다.
일부 실시형태들에 따르면, 활성화 함수는 은닉 층들의 각각의 노드에서 구현될 수도 있다.
일부 실시형태들에 따르면, 활성화 함수는, 선형 활성화 함수, 시그모이드 함수, Tanh, 소프트맥스 함수, 정류 선형 단위 (ReLU) 함수, 및 CUBE 함수를 포함하는 그룹에서 선택될 수도 있다.
선형 활성화 함수는 신호가 변하지 않는 항등 함수이다.
시그모이드 함수는 거의 무한 범위의 독립 변수들을 '0' 과 '1' 사이의 단순 확률들로 변환한다. 그것은 입력으로서 값을 취하고 '0' 과 '1' 사이의 다른 값을 출력하는 비선형 함수이다.
tanh 함수는 쌍곡선 사인과 쌍곡선 코사인 사이의 관계
Figure pct00186
를 나타낸다.
소프트맥스 활성화는 로지스틱 회귀를 일반화하고 상호 배타적인 출력 클래스들에 대한 확률 분포를 반환한다. 소프트맥스 활성화 함수는 딥 뉴럴 네트워크의 출력 층에서 구현될 수도 있다.
ReLU 활성화 함수는 뉴런의 입력이 주어진 임계치보다 높으면 뉴런을 활성화한다. 특히, 주어진 임계치는 0 과 동일할 수도 있고, 그 경우 ReLU 활성화 함수는 입력 변수가 음의 값이면 0 값을 출력하고 입력 변수가 양의 값이면 항등 함수에 따라 입력 변수를 출력한다. 수학적으로, ReLU 함수는
Figure pct00187
로 표현될 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 훈련 데이터로부터 훈련 페이즈 동안 다층 딥 뉴럴 네트워크의 모델 파라미터들을 미리 결정 및 업데이트하도록 구성될 수도 있다. 반경 결정 디바이스 (307) 는 탐색 구 반경 rs 을 결정하기 위해 수행된 Niter 반복을 구현하기 전에 훈련 페이즈 오프라인을 수행하도록 구성될 수도 있다. 일단, 결정되면, 모델 파라미터들은 그 후 정지 조건에 도달할 때까지 현재 반경을 업데이트하도록 수행된 각각의 반복
Figure pct00188
에서 사용된다. 훈련 페이즈 (또한 '학습 페이즈' 로 지칭됨) 는 다층 딥 뉴럴 네트워크가 최상의 예측을 제공하는 이상적인 모델 파라미터들에 얼마나 가까운지를 정량화하는 예측 에러를 최소화할 수 있는 방식으로 모델 파라미터들
Figure pct00189
을 조정하도록 수행되는 글로벌 최적화 문제이다. 모델 파라미터들은 예를 들어 랜덤으로 생성될 수도 있는 초기 파라미터들로 초기에 설정될 수도 있다. 초기 파라미터들은 그 후 훈련 페이즈 동안 업데이트되고 뉴럴 네트워크가 최상의 예측들로 수렴할 수 있도록 하는 방식으로 조정된다.
일부 실시형태들에 따르면, 다층 딥 뉴럴 네트워크는 역 전파 지도 학습 기법들을 사용하여 훈련될 수도 있고 훈련 데이터를 사용하여 관측되지 않은 데이터를 예측한다.
역 전파 기법은 다층 딥 뉴럴 네트워크의 상이한 층들에 의한 정보의 포워드 및 백워드 전파들의 반복 프로세스이다.
포워드 전파 페이즈 동안, 뉴럴 네트워크는 훈련 입력 값들 및 그 훈련 입력 값들과 연관된 예상된 값들 (또한 '라벨들' 로 지칭됨) 을 포함하는 훈련 데이터를 수신하고, 그 예상된 값들은 훈련 입력 값들이 입력으로서 사용될 때 뉴럴 네트워크의 예상된 출력에 대응한다. 예상된 값들은 지도 머신 학습 기법들의 애플리케이션에서 반경 결정 디바이스 (307) 에 의해 알려진다. 뉴럴 네트워크는 훈련 입력 값들에 대해 획득된 예측들에 대응하는 추정된 값들 (또한 '중간 값들' 로 지칭됨) 을 결정하기 위해 전체 다층 뉴럴 네트워크를 가로질러 훈련 데이터를 전달한다. 훈련 데이터는, 다층 딥 뉴럴 네트워크의 상이한 층들에 포함된 모든 계산 노드들이 그들의 변환들 또는 계산들을 그들이 이전의 층들의 계산 노드들로부터 수신하는 입력 값들에 적용하고 그들의 출력 값들을 다음 층의 계산 노드들로 전송하는 방식으로 전달된다. 데이터가 모든 층들을 통과하였고 모든 계산 노드들이 그들의 계산들을 수행했다면, 출력 층은 훈련 데이터에 대응하는 추정된 값들을 전달한다.
포워드 전파 페이즈의 마지막 단계는 훈련 데이터가 입력으로서 뉴럴 네트워크를 통해 전달되었을 때 획득된 추정된 값들과 훈련 데이터와 연관된 예상된 값들을 비교하는 것으로 구성된다. 비교는 예상된 값들과 관련하여 추정된 값들이 얼마나 좋은지/나쁜지를 측정할 수 있고 예측 에러 (또한 '추정 에러' 또는 '비용' 으로 지칭됨) 가 0 에 가깝도록 추정된 값들을 예상된 값들에 접근시킬 목적으로 모델 파라미터들을 업데이트하게 한다. 예측 에러는 목적 함수의 그레디언트의 방향으로 모델 파라미터들을 업데이트하는 그레디언트 절차에 기초한 손실 함수를 사용하여 추정될 수도 있다.
포워드 전파 페이즈 다음에 백워드 전파 페이즈가 후속되고, 그 동안 모델 파라미터들, 예를 들어, 계산 노드들 (4011) 의 상호연결들의 가중치들이 양호한 예측들이 획득되고 손실 함수가 최소화될 때까지 최적화 알고리즘을 적용함으로써 역 순으로 점진적으로 조정된다.
먼저, 계산된 예측 에러는 출력 층에서 시작하여 추정된 값들의 계산에 직접 기여하는 하나 이상의 은닉 층들 (403) 의 모든 계산 노드들 (4011) 로 백워드로 전파된다. 각각의 계산 노드는 딥 뉴럴 네트워크의 출력에 대한 그 상대적 기여에 기초하여 전체 예측 에러의 프랙션을 수신한다. 딥 뉴럴 네트워크의 모든 계산 노드들이 전체 예측 에러에 대한 그들의 상대적 기여에 대응하는 예측 에러를 수신할 때까지 프로세스는 층별로 반복된다. 일단 예측 에러가 백워드로 확산되면, 층 파라미터들, 예를 들어, 제 1 층 파라미터들 (즉, 가중치들) 및 제 2 층 파라미터들 (즉, 바이어스들) 은 손실 함수의 최소화에 따라 최적화 알고리즘을 적용함으로써 업데이트될 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 손실 함수를 계산하고 전체 훈련 데이터에 대한 모델 파라미터들을 업데이트함으로써 '배치 그레디언트 하강 접근법' 에 따라 훈련 페이즈 동안 모델 파라미터들을 업데이트하도록 구성될 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 훈련 데이터의 각각의 샘플에 대한 모델 파라미터들을 조정함으로써 온라인 학습에 따라 훈련 페이즈 동안 모델 파라미터들을 업데이트하도록 구성될 수도 있다. 온라인 학습을 사용하여, 훈련 데이터의 각각의 샘플에 대해 손실 함수가 평가된다. 온라인 학습은 또한 '온라인 훈련' 및 '확률적 그레디언트 하강' 으로 지칭된다.
다른 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 데이터의 미니-배치들을 사용하는 미니-배치 학습 (또한 '미니-배치 그레디언트 하강' 으로 지칭됨) 에 따라 훈련 데이터로부터 훈련 페이즈 동안 모델 파라미터들을 업데이트하도록 구성될 수도 있고, 사이즈 sb 의 데이터의 미니-배치는 sb 훈련 샘플들의 서브세트이다. 따라서, 반경 결정 디바이스 (307) 는 사이즈 sb 의 데이터의 2 개 이상의 배치들로 훈련 데이터를 파티셔닝하도록 구성될 수도 있고, 각각의 배치는 입력 데이터의 sb 샘플들을 포함한다. 그 다음 입력 데이터는 배치로 네트워크를 통해 전달된다. 손실 함수는 뉴럴 네트워크를 통해 전달된 데이터의 각각의 미니-배치에 대해 평가되고 모델 파라미터들은 데이터의 각각의 미니-배치에 대해 업데이트된다. 포워드 전파 및 백워드 전파 페이즈들은 따라서 마지막 배치까지 데이터의 각각의 미니-배치에 대해 수행된다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 에포크들로 지칭되는, 복수 회 훈련 프로세스에서 딥 뉴럴 네트워크 (400) 를 통해 모든 훈련 데이터를 전달하도록 구성될 수도 있다. 에포크들의 수는 훈련 데이터의 정확성을 평가하는 정확성 메트릭이 감소하기 시작하거나 또는 계속 증가할 때까지 (예컨대 잠재적 오버피팅이 검출될 때) 증가될 수도 있다.
Figure pct00190
로 표시된 수신된 훈련 데이터는 훈련 수신된 신호
Figure pct00191
의 컴포넌트들, 훈련 상삼각 행렬
Figure pct00192
의 컴포넌트들, 및 훈련 구 반경 값
Figure pct00193
에 의존하는 독립적인 훈련 샘플들을 포함하는
Figure pct00194
로 표시된 Nbs 훈련 샘플들을 포함할 수도 있다.
지도 학습에 기초하여, 훈련 샘플들은 라벨링되고, 즉 훈련 샘플들이 딥 뉴럴 네트워크의 입력들로서 사용될 때 딥 뉴럴 네트워크의 출력들에 대응하는 알려진 예상된 출력 값들 (또한 '타겟들' 또는 '라벨들' 로 지칭됨) 과 연관될 수도 있다. 보다 구체적으로, 각각의 샘플
Figure pct00195
(여기서
Figure pct00196
) 은 반경
Figure pct00197
의 구형 영역 내부에 속하는 격자 점들의 수의 예상된 값
Figure pct00198
과 연관될 수도 있다.
미니-배치 학습이 사용되는 일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 수신된 훈련 데이터로부터 추출된 미니-배치들에서 훈련 페이즈 동안 모델 파라미터들을 결정 (업데이트 또는 조정) 하도록 구성될 수도 있다. 이러한 실시형태들에서, 반경 결정 디바이스 (307) 는 수신된 훈련 데이터를
Figure pct00199
로 표시된 훈련 데이터의 복수 NB 의 세트들로 파티셔닝하도록 구성될 수도 있고, 훈련 데이터의 세트는 훈련 데이터로부터 sb 훈련 예들의 세트를 포함하는 사이즈 sb 의 미니-배치이고, 즉, 각각의 미니-배치
Figure pct00200
는 m 이 1 과 Nbs 사이에서 가변하는 sb 샘플들
Figure pct00201
을 포함한다. 미니-배치
Figure pct00202
는 또한 훈련 샘플들이 Nbs 훈련 샘플들로부터 추출되는 Sl (즉
Figure pct00203
) 에 의해 지정된다.
각각의 미니-배치
Figure pct00204
(여기서
Figure pct00205
) 는 데이터의 미니-배치
Figure pct00206
가 딥 뉴럴 네트워크의 입력으로서 사용될 때 딥 뉴럴 네트워크에 의해 획득될 것으로 예상되는 격자 점들의 예상된 수
Figure pct00207
에 대응하는 타겟 값과 연관될 수도 있다. 훈련 데이터 및 타겟 값들의 세트들은
Figure pct00208
로 표시된 각각의 벡터 쌍이 l 번째 미니-배치의 훈련 예들 및 타겟 값들에 대응하도록 벡터 쌍들로 그룹화될 수도 있다.
훈련 데이터 및 예상된 출력 값들이 주어지면, 반경 결정 디바이스 (307) 는 훈련 프로세스의 포워드 전파 및 백워드 전파 페이즈들을 수행하도록 구성될 수도 있다.
미니-배치 훈련에 기초하여, 훈련 페이즈는 2 이상의 프로세싱 반복들을 포함할 수도 있다. 각각의 프로세싱 반복에서, 반경 결정 디바이스 (307) 는 다음과 같이 행하도록 구성될 수도 있다:
- 입력으로서 복수의 훈련 세트들 중 미니-배치
Figure pct00209
를 사용하여 딥 뉴럴 네트워크를 프로세싱함, 이는 미니-배치
Figure pct00210
와 연관된
Figure pct00211
로 표시된 격자 점들의 중간 수를 제공한다. 격자 점들의 중간 수
Figure pct00212
는 다층 딥 뉴럴 네트워크의 출력 층에서 예측된다;
- 미니-배치
Figure pct00213
와 연관된 격자 점들의 예상된 수
Figure pct00214
및 데이터의 미니-배치
Figure pct00215
를 프로세싱함으로써 결정된 격자 점들의 중간 수
Figure pct00216
로부터 프로세싱된 미니-배치
Figure pct00217
에 대한
Figure pct00218
로 표시된 손실 함수를 계산함;
- 최적화 알고리즘을 적용함으로써 손실 함수
Figure pct00219
의 최소화에 따라 미니-배치
Figure pct00220
를 프로세싱한 후 업데이트된 모델 파라미터들을 결정함. 보다 구체적으로, 반경 결정 디바이스 (307) 는 다층 딥 뉴럴 네트워크
Figure pct00221
의 K 층들의 각각과 연관된 업데이트된 제 1 층 파라미터들
Figure pct00222
및 업데이트된 제 2 층 파라미터들
Figure pct00223
을 결정하도록 구성될 수도 있고, 제 1 층 파라미터들 및 제 2 층 파라미터들은 딥 뉴럴 네트워크의 뉴런들과 바이어스 값들 사이의 연결들과 연관된 가중치들에 각각 대응한다.
제 1 프로세싱 반복에 대해, 반경 결정 디바이스 (307) 는 훈련 프로세스의 제 1 프로세싱 반복의 포워드 전파 페이즈 동안 사용될 초기 모델 파라미터들을 결정하도록 구성될 수도 있다. 보다 구체적으로, 반경 결정 디바이스 (307) 는 다층 딥 뉴럴 네트워크
Figure pct00224
의 K 층들의 각각과 연관된 초기 제 1 층 파라미터들
Figure pct00225
및 초기 제 2 층 파라미터들
Figure pct00226
을 결정하도록 구성될 수도 있다.
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 예를 들어, 표준 정규 분포에 따라, 값들의 랜덤 세트로부터 랜덤으로 딥 뉴럴 네트워크의 상이한 층들과 연관된 초기 제 1 층 파라미터들 및 초기 제 2 층 파라미터들을 결정하도록 구성될 수도 있다.
일부 실시형태들에 따르면, 모델 파라미터들을 조정하고 업데이트된 모델 파라미터들을 결정하는데 사용되는 최적화 알고리즘은, Adadelta 최적화 알고리즘, Adagrad 최적화 알고리즘, 각각의 모델 파라미터에 대한 적응 학습 레이트들을 계산하는 적응 모멘트 추정 알고리즘 (ADAM), Nesterov 가속 그레디언트 (NAG) 알고리즘, Nesterov 가속 적응 모멘트 추정 (Nadam) 알고리즘, RMSprop 알고리즘, 확률적 그레디언트 최적화 알고리즘들, 및 적응 학습 레이트 최적화 알고리즘들을 포함하는 그룹에서 선택될 수도 있다.
일부 실시형태들에 따르면, 예측 에러 또는 손실을 평가하기 위해 고려되는 손실 함수는 선형 회귀에 사용되는 평균 제곱 에러 함수 (MSE), 및 포아송 회귀에 사용되는 지수 로그 우도 (EXPLL) 함수를 포함하는 그룹에서 선택될 수도 있다.
평균 제곱 에러 함수가 사용되는 일부 실시형태들에 따르면, 데이터의 l 번째 미니-배치에 대해 계산된 손실 함수가 다음으로 표현될 수도 있다:
Figure pct00227
(25)
일부 실시형태들에 따르면, 반경 결정 디바이스 (307) 는 리스트 구 디코딩 알고리즘 (LSD) 또는 리스트 구형-경계 스택 디코딩 알고리즘을 적용함으로써 구 반경 r 및 채널 행렬 R 로부터 각각의 미니-배치 Sl (여기서
Figure pct00228
) 와 연관된 격자 점들의 예상된 수들
Figure pct00229
을 미리 결정하도록 구성될 수도 있다. LSD 및 리스트 구형-경계 스택 디코딩 알고리즘들은 최근접 벡터 문제를 해결하는 구 기반 디코딩 알고리즘들이다. 그들은 주어진 반경의 주어진 경계 영역 내부에 있는 코드워드들의 리스트를 출력한다. LSD 구현들에 대한 더 많은 상세들은 "M. El-Khamy et al., Reduced Complexity List Sphere Decoding for MIMO Systems, Digital Signal Processing, Vol. 25, Pages 84-92, 2014" 에 개시되어 있다.
도 5 를 참조하면, 통신 시스템에서 송신 채널을 통해 수신된 신호를 디코딩하기 위한 디코딩 방법이 제공되며, 신호는 정보 심볼들의 벡터
Figure pct00230
를 포함하고 송신 채널은 채널 행렬 R 에 의해 표현된다.
단계 (501) 에서, 수신된 신호
Figure pct00231
, 채널 행렬 R, 예비 반경 r0, 및 주어진 임계치 Nth 를 포함하는 입력들이 수신될 수도 있다.
단계 (503) 에서, 탐색 구 반경 rs 은 수신된 신호
Figure pct00232
및 채널 행렬 R 에 의존하는 입력 데이터에 머신 학습 알고리즘을 적용함으로써 결정될 수도 있다.
단계 (505) 에서, 정보 심볼들의 벡터 s 의 적어도 하나의 추정치
Figure pct00233
는 ML 최적화 문제를 해결하기 위해 구 탐색 기반 추정 알고리즘을 적용함으로써 결정될 수도 있으며, 정보 심볼들의 벡터의 적어도 하나의 추정치는 격자 점들 탐색 페이즈 동안 반경들 rs 의 구형 영역
Figure pct00234
내부에서 발견된 격자 점들로부터 결정된다.
일부 실시형태들에 따르면, 구 탐색 기반 추정 알고리즘은 구 디코더 및 SB-Stack 디코더를 포함하는 그룹에서 선택될 수도 있다.
일부 실시형태들에 따르면, 단계 (501) 는 잡음 분산
Figure pct00235
, 채널 행렬 R 의 대각선 컴포넌트들, 및 수신된 신호
Figure pct00236
와 준최적 추정 알고리즘을 적용함으로써 결정된 추정 벡터 yest 사이의 거리를 측정하는 유클리드 거리 중 하나 이상에 의존하여 예비 반경 r0 을 미리 결정하는 단계를 포함할 수도 있으며, 준최적 추정 알고리즘은, 제로 포싱 결정 피드백 등화기 (ZF-DFE) 및 최소 평균 제곱 에러 추정 (MMSE) 알고리즘을 포함하는 그룹에서 선택된다.
도 6 은 반복 프로세스가 현재 반경을 업데이트하기 위해 다수의 반복들 Niter 동안 수행되는 일부 실시형태들에 따라, 탐색 구 반경 rs 을 결정하기 위해 단계 (502) 에서 수행되는 방법을 예시하는 플로우차트이다. 방법은 예비 반경으로부터 탐색 구 반경 rs 을 결정하는 단계를 포함한다. 보다 구체적으로, 방법은 다음의 단계를 포함한다:
i. 수신된 신호, 채널 행렬, 및 예비 반경으로 초기에 설정되는 현재 반경으로부터 도출된 입력 데이터에 머신 학습 알고리즘을 적용하는 단계, 이는 현재 반경과 연관된 격자 점들의 현재 예측된 수를 제공한다;
ii. 격자 점들의 현재 예측된 수를 주어진 임계치와 비교하는 단계;
iii. 격자 점들의 현재 예측된 수가 주어진 임계치보다 엄격하게 높으면 현재 반경을 업데이트하는 단계, 현재 반경은 현재 반경에 선형 함수
Figure pct00237
를 적용함으로써 업데이트된다.
단계 i 내지 단계 iii 은, 현재 예측된 수와 관련되는 종료 조건이 충족될 때까지 반복될 수도 있다. 방법은, 종료 조건이 충족되는 것에 응답하여 탐색 구 반경을 현재 반경으로 설정하는 단계를 포함한다.
보다 구체적으로, 단계 (601) 에서, 반복 프로세스의 반복들의 인덱스는
Figure pct00238
로 초기화될 수도 있고 현재 반경은 예비 반경으로 초기에 설정될 수도 있다
Figure pct00239
.
단계 603 내지 단계 607 은, 정지 조건 (또한 '종료 조건' 으로 지칭됨) 이 충족될 때까지 다수의 반복들 Niter 동안 반복될 수도 있다.
단계 (603) 에서, 머신 학습 알고리즘은 수신된 신호
Figure pct00240
, 채널 행렬 R 및 현재 반경
Figure pct00241
으로부터 도출된 입력 데이터에 적용될 수도 있으며, 이는 현재 반경
Figure pct00242
과 연관된 격자 점들의 수의 현재 예측
Figure pct00243
(또한 '격자 점들의 현재 예측된 수' 로 지칭됨) 을 제공한다. 격자 점들의 현재 예측된 수
Figure pct00244
는 수신된 신호
Figure pct00245
에 중심을 두고 구 반경 중 현재 반경
Figure pct00246
을 갖는 구형 영역 내부에 속하는 격자 점들의 예측된 수에 대응한다. 머신 학습 알고리즘은 수신된 신호
Figure pct00247
의 n 컴포넌트들, 현재 반경
Figure pct00248
, 및 상삼각 채널 행렬 R 의 n2 컴포넌트들을 포함하는 입력 벡터
Figure pct00249
를 입력으로서 취한다.
단계 (605) 에서, 격자 점들의 현재 예측된 수
Figure pct00250
는 주어진 임계치 Nth 와 비교될 수도 있다.
단계 (605) 에서, 격자 점들의 현재 예측된 수
Figure pct00251
가 주어진 임계치 Nth 이하라고 결정되면, 탐색 구 반경 rs 은 단계 (609) 에서, 단계 (605) 의 정지 조건을 충족하는 격자 점들의 현재 예측된 수
Figure pct00252
와 연관되는 마지막 업데이트된 현재 반경
Figure pct00253
으로 설정될 수도 있다.
단계 (605) 에서, 격자 점들의 수의 현재 예측
Figure pct00254
이 주어진 임계치보다 엄격하게 높다고 결정되면, 즉
Figure pct00255
이면, 현재 반경은 단계 (607) 에서 업데이트될 수도 있다. 따라서, 반복의 인덱스는
Figure pct00256
가 되도록 증분될 수도 있고, 현재 반경은 현재 반경에 선형 함수
Figure pct00257
를 적용함으로써 업데이트될 수도 있고 수행된 반복들의 수는
Figure pct00258
가 되도록 1 씩 증분될 수도 있다.
일부 실시형태들에 따르면, 선형 함수는 1/2 과 동일한 기울기 파라미터 및 0 과 동일한 인터셉트 파라미터를 가질 수도 있으며, 이는
Figure pct00259
가 되도록 현재 반경을 2 로 나눔으로써 현재 반경을 업데이트하는 것에 대응한다.
일부 실시형태들에 따르면, 머신 학습 알고리즘은, 제한 없이, 서포트 벡터 머신들, 선형 회귀, 로지스틱 회귀, 나이브 베이즈, 선형 판별 분석, 결정 트리들, k-최근접 이웃 알고리즘, 뉴럴 네트워크들, 및 유사성 학습을 포함하는 그룹에서 선택된 지도 머신 학습 알고리즘일 수도 있다.
바람직한 실시형태들에서, 지도 머신 학습 알고리즘은, 입력 층 및 하나 이상의 은닉 층들을 포함하는 적어도 2 층들
Figure pct00260
및 출력 층으로 구성되고 모델 파라미터들
Figure pct00261
및 활성화 함수
Figure pct00262
와 연관된 다층 피드-포워드 인공 뉴럴 네트워크
Figure pct00263
인 다층 퍼셉트론일 수도 있으며, 모델 파라미터들
Figure pct00264
은 층 파라미터들의 세트들
Figure pct00265
을 포함하고, 층 파라미터들의 각각의 세트는 제 1 층 파라미터
Figure pct00266
, 및 제 2 층 파라미터
Figure pct00267
를 포함한다.
일부 실시형태들에 따르면, 활성화 함수는, 선형 활성화 함수, 시그모이드 함수, Tanh, 소프트맥스 함수, 정류 선형 단위 함수, 및 CUBE 함수를 포함하는 그룹에서 선택될 수도 있다.
머신 학습 알고리즘이 다층 딥 뉴럴 네트워크인 일부 실시형태들에 따르면, 단계 (603) 는, 디코딩 프로세스 동안 현재 반경의 결정을 위해 뉴럴 네트워크를 프로세싱하기 전에 다층 딥 뉴럴 네트워크를 훈련하도록 훈련 데이터를 사용하는 역 전파 지도 훈련 또는 학습 프로세스에 따라 업데이트된 모델 파라미터들을 결정하기 위해 수행되는 서브-단계를 포함할 수도 있다.
일부 실시형태들에 따르면, 모델 파라미터들은 손실 함수를 계산하고 전체 훈련 데이터에 대한 모델 파라미터들을 업데이트함으로써 '배치 그레디언트 하강 접근법' 에 따라 훈련 프로세스 동안 업데이트될 수도 있다.
일부 실시형태들에 따르면, 모델 파라미터들은 훈련 데이터의 각각의 샘플에 대한 모델 파라미터들을 조정하고 훈련 데이터의 각각의 샘플에 대한 손실을 계산함으로써 온라인 학습에 따라 훈련 프로세스 동안 업데이트될 수도 있다.
다른 실시형태들에 따르면, 모델 파라미터들은 데이터의 미니-배치들을 사용하는 미니-배치 학습에 따라 훈련 데이터로부터 훈련 프로세스 동안 업데이트될 수도 있으며, 사이즈 sb 의 데이터의 미니-배치는 sb 훈련 샘플들의 서브세트이다. 따라서, 훈련 데이터는 사이즈 sb 의 데이터의 2 개 이상의 미니-배치들로 파티셔닝될 수도 있으며, 각각의 배치는 입력 데이터의 sb 샘플들을 포함한다. 입력 데이터는 그 다음 미니-배치로 네트워크를 통해 전달된다. 손실 함수는 데이터의 각각의 미니-배치에 대해 평가되고 모델 파라미터들은 데이터의 각각의 미니-배치에 대해 업데이트된다.
도 7 은 미니-배치 학습을 사용하는 일부 실시형태들에 따른 예측 에러의 최소화 면에서 최상의 예측을 제공하는 모델 파라미터들
Figure pct00268
을 결정하기 위해 다층 딥 뉴럴 네트워크
Figure pct00269
를 훈련하기 위한 방법을 도시하는 플로우차트이다.
단계 (701) 에서, Nbs 훈련 샘플들
Figure pct00270
을 포함하는 훈련 데이터
Figure pct00271
및 격자 점들의 예상된 수들
Figure pct00272
이 수신될 수도 있으며, 각각의 샘플
Figure pct00273
(여기서
Figure pct00274
) 은 반경
Figure pct00275
의 구형 영역 내부에 속하는 격자 점들의 수의 예상된 값
Figure pct00276
과 연관된다.
단계 (703) 에서, 훈련 데이터는 훈련 데이터의 복수 NB 의 세트들
Figure pct00277
로 파티셔닝될 수도 있으며, 각각의 미니-배치
Figure pct00278
(여기서
Figure pct00279
) 는 데이터의 미니-배치
Figure pct00280
가 딥 뉴럴 네트워크의 입력으로서 사용될 때 딥 뉴럴 네트워크에 의해 획득될 것으로 예상되는 격자 점들의 예상된 수
Figure pct00281
에 대응하는 타겟 값과 연관될 수도 있다.
훈련 프로세스는 훈련 조건에 도달할 때까지 반복되는 2 이상의 프로세싱 반복들을 포함할 수도 있다. 훈련 조건은 훈련 데이터의 프로세싱된 미니-배치들의 수 및/또는 업데이트된 모델 파라미터들에서 기인한 예측 에러들의 최소화에 대한 업데이트된 모델 파라미터들의 우수함 (goodness) 과 관련될 수도 있다.
단계 (705) 에서, 제 1 프로세싱 반복이 수행될 수도 있으며, 그 동안 초기 모델 파라미터들은 데이터의 제 1 미니-배치를 프로세싱하는데 사용되도록 결정될 수도 있다. 보다 구체적으로, 다층 딥 뉴럴 네트워크
Figure pct00282
의 K 층들의 각각과 연관된 초기 제 1 층 파라미터들
Figure pct00283
및 초기 제 2 층 파라미터들
Figure pct00284
이 단계 (705) 에서 결정될 수도 있다.
일부 실시형태들에 따르면, 딥 뉴럴 네트워크의 상이한 층들과 연관된 초기 제 1 층 파라미터들 및 초기 제 2 층 파라미터들은 예를 들어, 표준 정규 분포에 따라, 값들의 랜덤 세트로부터 랜덤으로 결정될 수도 있다.
단계 (707) 내지 단계 (713) 는 정지 조건에 도달할 때까지 데이터의 미니-배치들을 프로세싱하기 위해 반복될 수도 있다. 훈련 프로세스의 프로세싱 반복은 단계 (709) 내지 단계 (713) 로 구성되고 복수의 훈련 세트들
Figure pct00285
(여기서
Figure pct00286
) 중 미니-배치
Figure pct00287
의 프로세싱과 관련된다.
단계 (709) 에서, 다층 딥 뉴럴 네트워크는 입력으로서 복수의 훈련 세트들 중 미니-배치
Figure pct00288
를 사용하여 프로세싱될 수도 있으며, 이는 미니-배치
Figure pct00289
와 연관된
Figure pct00290
로 표시된 격자 점들의 중간 수를 제공한다. 격자 점들의 중간 수
Figure pct00291
는 다층 딥 뉴럴 네트워크의 출력 층에서 예측된다.
단계 (711) 에서, 손실 함수
Figure pct00292
는 미니-배치
Figure pct00293
와 연관된 격자 점들의 알려진 예상된 수
Figure pct00294
및 단계 (709) 에서 데이터의 미니-배치
Figure pct00295
를 프로세싱함으로써 결정된 격자 점들의 중간 수
Figure pct00296
로부터 프로세싱된 미니-배치
Figure pct00297
에 대해 계산될 수도 있다.
단계 (713) 에서, 업데이트된 모델 파라미터들은 최적화 알고리즘을 적용함으로써 손실 함수
Figure pct00298
의 최소화에 따라 미니-배치
Figure pct00299
를 프로세싱한 후 결정될 수도 있다. 보다 구체적으로, 다층 딥 뉴럴 네트워크
Figure pct00300
의 K 층들의 각각과 연관된 제 1 층 파라미터들
Figure pct00301
및 제 2 층 파라미터들
Figure pct00302
은 단계 (713) 에서 업데이트될 수도 있고, 제 1 층 파라미터들 및 제 2 층 파라미터들은 딥 뉴럴 네트워크의 뉴런들과 바이어스 값들 사이의 연결들과 연관된 가중치들에 각각 대응한다.
일부 실시형태들에 따르면, 최적화 알고리즘은, Adadelta 최적화 알고리즘, Adagrad 최적화 알고리즘, 적응 모멘트 추정 알고리즘, Nesterov 가속 그레디언트 알고리즘, Nesterov 가속 적응 모멘트 추정 알고리즘, RMSprop 알고리즘, 확률적 그레디언트 최적화 알고리즘들, 및 적응 학습 레이트 최적화 알고리즘들을 포함하는 그룹에서 선택될 수도 있다.
일부 실시형태들에 따르면, 손실 함수는, 평균 제곱 에러 함수 및 지수 로그 우도 함수를 포함하는 그룹에서 선택될 수도 있다.
일부 실시형태들에 따르면, 단계 (701) 는 리스트 구 디코딩 알고리즘 또는 리스트 구형-경계 스택 디코딩 알고리즘을 적용함으로써 구 반경 r 및 채널 행렬 R 로부터 각각의 미니-배치 Sl (여기서
Figure pct00303
) 와 연관된 격자 점들의 예상된 수
Figure pct00304
를 결정하는 단계를 포함할 수도 있다.
송신 채널을 통해 수신된 신호를 디코딩하도록 구성된 디코더에서 탐색 구 반경을 결정하기 위한 컴퓨터 프로그램 제품이 또한 제공되며, 신호는 정보 심볼들의 벡터
Figure pct00305
를 포함하고 송신 채널은 채널 행렬 R 에 의해 표현된다. 컴퓨터 프로그램 제품은, 프로세서에 의해 실행될 경우, 프로세서로 하여금, 종료 조건이 충족될 때까지 현재 반경을 반복적으로 업데이트함으로써 탐색 구 반경 rs 을 결정하게 하는 비일시적 컴퓨터 판독가능 저장 매체를 포함한다. 프로세서는
Figure pct00306
이 되도록 현재 반경
Figure pct00307
을 예비 반경 r0 으로 초기에 설정하고 다수의 반복들 Niter 동안 현재 반경
Figure pct00308
을 반복적으로 업데이트하도록 야기된다. 각각의 i 번째 반복 (여기서
Figure pct00309
) 은 다음으로 구성된 단계들을 포함한다:
- 수신된 신호
Figure pct00310
, 채널 행렬 R 및 현재 반경
Figure pct00311
으로부터 도출된 입력 데이터를 사용하여 머신 학습 알고리즘을 프로세싱하는 단계, 이는 현재 반경
Figure pct00312
과 연관된 격자 점들의 수의 현재 예측
Figure pct00313
(또한 '격자 점들의 현재 예측된 수' 로 지칭됨) 을 제공한다;
- 격자 점들의 수의 현재 예측을
Figure pct00314
로 Nth 로 표시된 주어진 임계치와 비교하는 단계;
- 격자 점들의 수의 현재 예측
Figure pct00315
이 주어진 임계치보다 엄격하게 높으면, 즉
Figure pct00316
이면 현재 반경
Figure pct00317
을 업데이트하는 단계, 현재 반경
Figure pct00318
은 현재 반경에 선형 함수
Figure pct00319
를 적용함으로써 업데이트된다. 따라서, 반복의 인덱스는 먼저
Figure pct00320
가 되도록 업데이트될 수도 있고, 그 후 현재 구 반경은
Figure pct00321
가 되도록 업데이트될 수도 있다. 일부 실시형태들에서, 선형 함수는 1/2 과 동일한 기울기 파라미터 및 0 과 동일한 인터셉트 파라미터를 가질 수도 있다.
격자 점들의 수의 현재 예측
Figure pct00322
이 주어진 임계치 Nth 이하이면 정지 조건이 충족된다. 일단 정지 조건이 충족되면, 탐색 구 반경 rs
Figure pct00323
가 되도록 정지 조건을 충족하는 격자 점들의 현재 예측된 수
Figure pct00324
와 연관되는 마지막 업데이트된 현재 반경
Figure pct00325
으로 설정될 수도 있다.
제공된 구 반경 결정 디바이스들 및 방법들을 사용한 구 디코더의 성능은 비트 에러 레이트, 평균 프로세싱 시간, 및 구형 영역 내부의 격자 점들의 평균 수 면에서 평가되었다. 'NN-SD' 는 탐색 구 반경이 딥 뉴럴 네트워크들을 사용하여 결정되는 구 디코더 구현을 지칭하고, 'SDIRS' 는 탐색 구 반경이 잡음 통계에 기초하여 결정되는 구 디코더 구현을 지칭하고, 'SSD' 는 탐색 구 반경이 머신 학습 알고리즘을 프로세싱하지 않고 신호 대 잡음 비의 선형 함수에 따라 결정되는 구 디코더 구현을 지칭한다. 16-QAM 변조들을 사용하는 8x8 및 16x16 MIMO 시스템들이 고려된다. 하나의 입력 층, 하나의 은닉 층, 및 하나의 출력으로 구성된 다층 딥 뉴럴 네트워크들이 사용된다.
도 8 은 8x8 MIMO 시스템에 대해 획득된 SDIRS, NN-SD, 및 MMSE 디코더들에 대한 신호 대 잡음 비의 함수로서 비트 에러 레이트 (BER) 성능을 평가하는 다이어그램들을 도시한다. 수치 결과들은 NN-SD 가 최적의 ML 성능을 제공함을 보여준다.
도 9 및 도 10 은 각각 8x8 및 16x16 MIMO 시스템들에 대한, MMSE, SDIRS, NN-SD, 및 SSD 디코더들에 대해 획득된 신호 대 잡음 비의 함수로서 평균 프로세싱 시간을 평가하는 다이어그램들을 도시한다. 수치 결과들은 NN-SD 가 기존 SDIRS 와 비교하여 디코딩 시간을 크게 감소시킴을 보여준다. 이 프로세싱 시간 감소는 탐색 페이즈 동안 방문될 격자 점들의 수에 대한 임계치를 예상하는 탐색 구 반경의 선택이 주어지면 제공된다. 프로세싱 시간 및 계산 복잡성의 이득은 MIMO 시스템의 차원이 증가함에 따라 중요하다.
도 11 및 도 12 는 각각 8x8 및 16x16 MIMO 시스템들에 대한, SDIRS 및 NN-SD 디코더들에 대해 획득된 신호 대 잡음 비의 함수로서 구형 영역 내부에 속하는 격자 점들의 평균 수를 평가하는 다이어그램들을 도시한다. 수치 결과들은 격자 점들의 평균 수가 NN-SD 를 사용하는 신호 대 잡음 비의 거의 일정한 함수인 한편, 중간 수준의 신호 대 잡음 비 값들에 대해 SDIRS 디코더를 사용하면 더 높음을 보여준다.
본 발명의 실시형태들은 동일한 수의 송신 및 수신 안테나들을 특징으로 하는 대칭적 MIMO 구성들을 참조하여 주로 설명되었지만, 본 발명은 또한 nt < nr 인 비대칭적 MIMO 구성들에 적용될 수도 있음에 주목해야 한다.
또한, 본 발명의 일부 실시형태들은 무선 단일 사용자 MIMO 시스템과 관련하여 설명되었지만, 본 발명은 이러한 애플리케이션에 제한되지 않음에 주목해야 한다. 본 발명은 채널 출력의 선형 표현을 특징으로 하는 임의의 선형 통신 시스템에서 동작하는 임의의 수신기 디바이스에 통합될 수도 있다. 통신 시스템은 단일 또는 다중 안테나들, 및 단일 또는 다중 캐리어 통신 기법들을 사용하는, 단일 또는 다중 사용자들을 수용하는 유선, 무선 또는 광 섬유 기반일 수도 있다. 예를 들어, 본 발명은 무선 분산 MIMO 시스템에서 구현되는 수신기 디바이스에 통합될 수도 있다. 분산 MIMO 는 예를 들어 3G, 4G, LTE, WiFiTM, 및 향후 5G 표준 등에서 적용되는 셀룰러 통신들에서 사용될 수도 있다. 예를 들어, 애드혹 네트워크들 (무선 센서 네트워크들, 머신-투-머신 통신, 사물 인터넷 (IoT) 등) 에서 적용되는 협력 통신도 분산 MIMO 시스템들의 예들이다. 무선 네트워크들에 더하여, 본 발명은 편광 분할 멀티플렉싱-OFDM (Polarization Division Multiplexing-OFDM; PDM-OFDM) 시스템들과 같은 광 섬유 기반 통신 시스템들에서 구현되는 광 수신기 디바이스들에 통합될 수도 있다.
또한, 본 발명은 통신 디바이스들에 한정되지 않고, 오디오 크로스오버들 및 오디오 마스터링과 같은 오디오 애플리케이션들에서 사용되는 유한 임펄스 응답 (FIR) 의 전자 필터들과 같은 신호 프로세싱 디바이스들에 통합될 수도 있다. 따라서, 일부 실시형태들은, 차수 M 의 FIR 필터의 출력 시퀀스가 주어지면, 입력 시퀀스의 추정치를 결정하는데 사용될 수도 있다.
다른 애플리케이션에서, 본 발명의 일부 실시형태들에 따른 방법들, 디바이스들 및 컴퓨터 프로그램 제품들은 IRNSS, Beidou, GLONASS, Galileo 와 같은 GNSS (Global Navigation Satellite System); 예를 들어 캐리어 위상 측정들을 사용하여 포지셔닝 파라미터들을 추정하기 위한 예를 들어 적어도 GPS 수신기를 포함하는 GPS 에서 구현될 수도 있다.
또한, 본 발명의 일부 실시형태들에 따른 방법들, 디바이스들 및 컴퓨터 프로그램 제품들은 그들의 저장, 프로세싱 또는 통신 동안 데이터 또는 메시지들을 암호화/복호화하기 위한 암호 알고리즘에서 사용되는 개인 비밀 값들에 대한 추정치들을 결정하기 위한 암호 시스템들에서 구현될 수도 있다. 격자 기반 암호 애플리케이션들에서, 데이터/메시지들은 격자 점들의 형태로 암호화된다. 이러한 암호화된 데이터의 복호화는 본 발명의 일부 실시형태들에 따라 유리하게 수행될 수도 있어서, 감소된 복잡성으로 비밀 값들의 성공적인 복구의 높은 확률을 가능하게 한다.
본 명세서에서 설명된 디바이스들, 방법들, 및 컴퓨터 프로그램 제품들은 다양한 수단에 의해 구현될 수도 있다. 예를 들어, 이들 기법들은 하드웨어, 소프트웨어, 또는 이들의 조합에서 구현될 수도 있다. 하드웨어 구현의 경우, 격자 예측 디바이스 (200) 의 프로세싱 엘리먼트들은 예를 들어, 하드웨어 전용 구성 (예를 들어 대응하는 메모리를 갖는 하나 이상의 FPGA, ASIC, 또는 VLSI 집적 회로들에서) 에 따라 또는 VLSI 및 디지털 신호 프로세서 (DSP) 양자 모두를 사용하는 구성에 따라 구현될 수 있다.
또한, 본 명세서에서 설명된 방법은 본 명세서에서 명시된 기능들/액트들을 구현하기 위한 명령들을 실행하는 프로세서를 갖는 머신을 생성하기 위해 임의의 타입의 컴퓨터의 프로세서에 공급되는 컴퓨터 프로그램 명령들에 의해 구현될 수 있다. 이러한 컴퓨터 프로그램 명령들은 또한 컴퓨터가 특정 방식으로 기능하도록 지시할 수 있는 컴퓨터 판독가능 매체에 저장될 수도 있다. 이를 위해, 컴퓨터 프로그램 명령들은 일련의 동작 단계들의 수행을 야기하기 위해 컴퓨터 상에 로딩될 수도 있고, 이에 의해, 실행된 명령들이 본 명세서에서 명시된 기능들을 구현하기 위한 프로세스들을 제공하도록 컴퓨터 구현 프로세스를 생성할 수도 있다.

Claims (15)

  1. 탐색 구 반경을 사용하여 채널 행렬에 의해 표현된 송신 채널을 통해 수신된 신호를 디코딩하도록 구성된 디코더로서,
    상기 디코더는 예비 반경으로부터 상기 탐색 구 반경을 결정하기 위한 반경 결정 디바이스 (307) 를 포함하고, 상기 반경 결정 디바이스 (307) 는,
    i. 수신된 상기 신호, 상기 채널 행렬, 및 상기 예비 반경으로 초기에 설정되는 현재 반경으로부터 도출된 입력 데이터에 머신 학습 알고리즘을 적용하는 것으로서, 이는 상기 현재 반경과 연관된 격자 점들의 현재 예측된 수를 제공하는, 상기 머신 학습 알고리즘을 적용하고;
    ii. 상기 격자 점들의 현재 예측된 수를 주어진 임계치와 비교하고;
    iii. 상기 격자 점들의 현재 예측된 수가 상기 주어진 임계치보다 엄격하게 높으면 상기 현재 반경을 업데이트하는 것으로서, 상기 현재 반경은 상기 현재 반경에 선형 함수를 적용함으로써 업데이트되는, 상기 현재 반경을 업데이트하도록 구성되고;
    단계 i 내지 단계 iii 은, 상기 현재 예측된 수와 관련되는 종료 조건이 충족될 때까지 반복되고, 상기 반경 결정 디바이스 (307) 는, 상기 종료 조건이 충족되는 것에 응답하여 상기 탐색 구 반경을 상기 현재 반경으로 설정하도록 구성되는, 디코더.
  2. 제 1 항에 있어서,
    상기 종료 조건은, 상기 격자 점들의 현재 예측된 수가 상기 주어진 임계치 이하이면 충족되는, 디코더.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 선형 함수는 1/2 과 동일한 기울기 파라미터 및 0 과 동일한 인터셉트 파라미터를 갖는, 디코더.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 머신 학습 알고리즘은, 서포트 벡터 머신들, 선형 회귀, 로지스틱 회귀, 나이브 베이즈, 선형 판별 분석, 결정 트리들, k-최근접 이웃 알고리즘, 뉴럴 네트워크들, 및 유사성 학습을 포함하는 그룹에서 선택된 지도 머신 학습 알고리즘인, 디코더.
  5. 제 4 항에 있어서,
    상기 지도 머신 학습 알고리즘은, 입력 층 (401), 하나 이상의 은닉 층들 (403), 및 출력 층 (405) 을 포함하는 다층 딥 뉴럴 네트워크 (400) 이고, 각각의 층은 복수의 계산 노드들 (4011) 을 포함하고, 상기 다층 딥 뉴럴 네트워크 (400) 는 모델 파라미터들 및 활성화 함수와 연관되고, 상기 활성화 함수는 상기 하나 이상의 은닉 층들의 상기 복수의 계산 노드들 중 적어도 하나의 계산 노드 (4011) 에서 구현되는, 디코더.
  6. 제 5 항에 있어서,
    상기 활성화 함수는, 선형 활성화 함수, 시그모이드 함수, Relu 함수, Tanh, 소프트맥스 함수, 및 CUBE 함수를 포함하는 그룹에서 선택되는, 디코더.
  7. 제 5 항에 있어서,
    상기 반경 결정 디바이스 (307) 는 수신된 훈련 데이터로부터 훈련 페이즈 동안 상기 모델 파라미터들을 미리 결정하도록 구성되고, 상기 반경 결정 디바이스 (307) 는 상기 훈련 데이터 및 격자 점들의 예상된 수들로부터 훈련 데이터의 복수의 세트들을 결정하도록 구성되고, 각각의 격자 점들의 예상된 수는 상기 훈련 데이터의 복수의 세트들 중의 훈련 데이터의 세트와 연관되고, 상기 훈련 페이즈는 다음의 단계들:
    - 입력으로서 복수의 훈련 데이터 중의 훈련 데이터의 세트를 사용하여 상기 딥 뉴럴 네트워크 (400) 를 프로세싱하는 단계로서, 이는 상기 훈련 데이터의 세트와 연관된 격자 점들의 중간 수를 제공하는, 상기 딥 뉴럴 네트워크 (400) 를 프로세싱하는 단계;
    - 상기 격자 점들의 예상된 수 및 상기 훈련 데이터의 세트와 연관된 상기 격자 점들의 중간 수로부터 손실 함수를 결정하는 단계; 및
    - 상기 손실 함수의 최소화에 따라 최적화 알고리즘을 적용함으로써 업데이트된 모델 파라미터들을 결정하는 단계
    의 2 이상의 반복들을 포함하는, 디코더.
  8. 제 7 항에 있어서,
    상기 최적화 알고리즘은, Adadelta 최적화 알고리즘, Adagrad 최적화 알고리즘, 적응 모멘트 추정 알고리즘, Nesterov 가속 그레디언트 알고리즘, Nesterov 가속 적응 모멘트 추정 알고리즘, RMSprop 알고리즘, 통계적 그레디언트 최적화 알고리즘들, 및 적응 학습 레이트 최적화 알고리즘들을 포함하는 그룹에서 선택되는, 디코더.
  9. 제 7 항에 있어서,
    상기 손실 함수는, 평균 제곱 에러 함수 및 지수 로그 우도 함수를 포함하는 그룹에서 선택되는, 디코더.
  10. 제 7 항에 있어서,
    상기 반경 결정 디바이스 (307) 는 리스트 구 디코딩 알고리즘 또는 리스트 구형-경계 (spherical-bound) 스택 디코더를 적용함으로써 상기 탐색 구 반경 및 상기 채널 행렬로부터 상기 격자 점들의 예상된 수들을 미리 결정하도록 구성되는, 디코더.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 반경 결정 디바이스 (307) 는, 잡음 분산, 상기 채널 행렬의 대각선 컴포넌트들, 및 상기 수신된 신호와 추정 벡터 사이의 거리를 나타내는 유클리드 거리 중 적어도 하나의 파라미터로부터 상기 예비 반경을 결정하도록 구성되고, 상기 추정 벡터는 준최적 추정 알고리즘을 적용함으로써 결정되고, 상기 준최적 추정 알고리즘은, 제로 포싱 결정 피드백 등화기 및 최소 평균 제곱 에러 추정 알고리즘을 포함하는 그룹에서 선택되는, 디코더.
  12. 제 3 항에 있어서,
    상기 반경 결정 디바이스 (307) 는 신호 대 잡음 비의 선형 함수로서 단계 i 내지 단계 iii 의 반복들의 수를 결정하도록 구성되고, 상기 신호 대 잡음 비의 상기 선형 함수는 기울기 계수 및 인터셉트 계수에 의해 정의되고, 상기 인터셉트 계수는 송신 전력, 상기 주어진 임계치, 및 상기 채널 행렬의 결정자와 관련되는, 디코더.
  13. 제 1 항 내지 제 12 항 중 어느 한 항에 있어서,
    상기 디코더 (300) 는, 상기 수신된 신호에 의해 반송된 정보 심볼들의 벡터의 적어도 하나의 추정치를, 상기 수신된 신호를 나타내는 점에 중심을 두고 상기 탐색 구 반경에 의해 정의된 구형 영역 내부에서 발견된 격자 점들로부터 상기 정보 심볼들의 벡터의 적어도 하나의 추정치를 결정하는 구 탐색 기반 추정 알고리즘을 적용함으로써 결정하도록 구성된 심볼 추정 유닛 (309) 을 더 포함하는, 디코더.
  14. 제 13 항에 있어서,
    상기 구 탐색 기반 추정 알고리즘은, 구 디코더 및 구형-경계 스택 디코더를 포함하는 그룹 중에서 선택되는, 디코더.
  15. 탐색 구 반경을 사용하여 채널 행렬에 의해 표현된 송신 채널을 통해 수신된 신호를 디코딩하기 위한 방법으로서,
    상기 방법은 예비 반경으로부터 상기 탐색 구 반경을 결정하는 단계를 포함하고, 상기 방법은:
    i. 수신된 상기 신호, 상기 채널 행렬, 및 상기 예비 반경으로 초기에 설정되는 현재 반경으로부터 도출된 입력 데이터에 머신 학습 알고리즘을 적용하는 단계로서, 이는 상기 현재 반경과 연관된 격자 점들의 현재 예측된 수를 제공하는, 상기 머신 학습 알고리즘을 적용하는 단계;
    ii. 상기 격자 점들의 현재 예측된 수를 주어진 임계치와 비교하는 단계;
    iii. 상기 격자 점들의 현재 예측된 수가 상기 주어진 임계치보다 엄격하게 높으면 상기 현재 반경을 업데이트하는 단계로서, 상기 현재 반경은 상기 현재 반경에 선형 함수를 적용함으로써 업데이트되는, 상기 현재 반경을 업데이트하는 단계를 포함하고;
    단계 i 내지 단계 iii 은, 상기 현재 예측된 수와 관련되는 종료 조건이 충족될 때까지 반복되고, 상기 방법은, 상기 종료 조건이 충족되는 것에 응답하여 상기 탐색 구 반경을 상기 현재 반경으로 설정하는 단계를 포함하는, 탐색 구 반경을 사용하여 채널 행렬에 의해 표현된 송신 채널을 통해 수신된 신호를 디코딩하기 위한 방법.
KR1020227001690A 2019-07-01 2020-06-23 머신 학습 지원 구 디코딩을 위한 디바이스들 및 방법들 KR20220027966A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19305886.4 2019-07-01
EP19305886.4A EP3761237A1 (en) 2019-07-01 2019-07-01 Devices and methods for machine learning assisted sphere decoding
PCT/EP2020/067396 WO2021001199A1 (en) 2019-07-01 2020-06-23 Devices and methods for machine learning assisted sphere decoding

Publications (1)

Publication Number Publication Date
KR20220027966A true KR20220027966A (ko) 2022-03-08

Family

ID=67988948

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227001690A KR20220027966A (ko) 2019-07-01 2020-06-23 머신 학습 지원 구 디코딩을 위한 디바이스들 및 방법들

Country Status (6)

Country Link
US (1) US11888655B2 (ko)
EP (1) EP3761237A1 (ko)
JP (1) JP2022537978A (ko)
KR (1) KR20220027966A (ko)
CN (1) CN114097202A (ko)
WO (1) WO2021001199A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11625610B2 (en) * 2019-03-12 2023-04-11 Samsung Electronics Co., Ltd Multiple-input multiple-output (MIMO) detector selection using neural network
US11742901B2 (en) * 2020-07-27 2023-08-29 Electronics And Telecommunications Research Institute Deep learning based beamforming method and apparatus
CN112887237B (zh) * 2021-03-12 2022-02-11 苏州大学 光纤通信系统的复信道均衡器设计方法
CN117157948A (zh) * 2021-03-31 2023-12-01 诺基亚技术有限公司 用于在多输入多输出(mimo)通信系统中的接收机处解码信号的方法和系统
US11769079B2 (en) 2021-04-30 2023-09-26 Samsung Electronics Co., Ltd. Method and device for decoding data
CN117172135B (zh) * 2023-11-02 2024-02-06 山东省科霖检测有限公司 一种智能噪声监测管理方法与系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100804796B1 (ko) 2004-12-21 2008-02-20 한국전자통신연구원 구 복호기 및 그의 복호 방법
US8290096B2 (en) * 2008-04-14 2012-10-16 Qualcomm Incorporated Radius adaptive sphere decoding with probabilistic noise constraint
EP3229428B1 (en) * 2016-04-06 2021-03-10 Institut Mines-Télécom Methods and devices for sequential sphere decoding
US20180357530A1 (en) * 2017-06-13 2018-12-13 Ramot At Tel-Aviv University Ltd. Deep learning decoding of error correcting codes
CN113283571A (zh) * 2017-06-19 2021-08-20 弗吉尼亚科技知识产权有限公司 使用多天线收发器无线传输的信息的编码和解码
WO2020242898A1 (en) * 2019-05-26 2020-12-03 Genghiscomm Holdings, LLC Non-orthogonal multiple access
US10872045B1 (en) * 2019-07-11 2020-12-22 Nokia Technologies Oy Method and apparatus for symbol detection

Also Published As

Publication number Publication date
WO2021001199A1 (en) 2021-01-07
US20220247605A1 (en) 2022-08-04
CN114097202A (zh) 2022-02-25
US11888655B2 (en) 2024-01-30
JP2022537978A (ja) 2022-08-31
EP3761237A1 (en) 2021-01-06

Similar Documents

Publication Publication Date Title
US11888655B2 (en) Devices and methods for machine learning assisted sphere decoding
Wei et al. Low complexity iterative receiver design for sparse code multiple access
US11996915B2 (en) Devices and methods for machine learning assisted precoding
KR101844766B1 (ko) 매개변수화 순차 복호화
CN107094063B (zh) 半穷举迭代块解码方法和设备
Castillo‐Soria et al. Generalized quadrature spatial modulation scheme using antenna grouping
KR101973849B1 (ko) 순차적 스피어 디코딩을 위한 방법 및 장치
CN108234072B (zh) 用于对数据信号进行子块解码的方法和设备
EP3001625B1 (en) Methods and systems for decoding a data signal based on the generation of a decoding tree
Askri et al. DNN assisted sphere decoder
US10284276B2 (en) Weighted sequential decoding
Al-Nahhal et al. On the complexity reduction of uplink sparse code multiple access for spatial modulation
CN108365916B (zh) 子块解码数据信号的方法和设备
KR102037614B1 (ko) 스택 재배열을 이용하는 순차적 디코딩
Zhu et al. Joint transceiver optimization for wireless communication PHY with convolutional neural network
Li et al. Reduced complexity sphere decoding
Castillo‐Soria et al. Quadrature spatial modulation based multiuser MIMO transmission system
Ramasamy et al. Evolutionary gravitational Neocognitron neural network based differential spatial modulation detection scheme for uplink multiple user huge MIMO systems
Kim AI-Enabled Physical Layer
Song et al. LR algorithm based on MED for multi‐input–multi‐output LDs
Kosasih Symbol Detection in 5G and Beyond Networks
Kairouz MIMO communications over multi-mode optical fibers