WO2021235572A1

WO2021235572A1 - 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법

Info

Publication number: WO2021235572A1
Application number: PCT/KR2020/006661
Authority: WO
Inventors: 이종구; 김일환; 정익주
Original assignee: 엘지전자 주식회사
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2021-11-25
Also published as: US20230209368A1; KR20230014725A

Abstract

온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법이 개시된다. 본 명세서의 일 실시예에 따른 방법은, 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 동작, 상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻는 동작, 상기 훈련 데이터를 이용하여 상기 제1 기계 학습 네트워크를 업데이트하는 동작을 포함하며, 실제 통신 환경에 적응적인 무선 통신 서비스를 제공한다. 본 명세서의 적어도 하나의 프로세서를 포함하는 시스템은 인공 지능(Artificial Intelligence) 모듈, 드론(Unmanned Aerial Vehicle, UAV), 로봇, 증강 현실(Augmented Reality, AR) 장치, 가상 현실(virtual reality, VR) 장치, 5G 서비스와 관련된 장치 등과 연계될 수 있다.

Description

온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법

본 명세서는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법에 관한 것이다.

현재 대부분의 통신 시스템은 물리적 채널을 통계적 모델로 근사화하고 이에 기반하여 수학적 송수신 모델을 도출함으로써 설계되고 최적화되고 있다.

이와 같은 접근 방식은 지금까지 비교적 성공적인 결과를 보여주고 있으나, 실제 물리적 채널과 통계적 모델 사이의 불일치, 복잡도 감소를 위해 도입된 여러 가지 가정 및 단순화로 인해 구현된 통신 시스템이 다양한 실제 채널 환경에서 최적의 성능을 보여준다고 보기는 어렵다. 실제 물리적 채널의 특성을 좀 더 잘 반영하고, 실제 채널 환경에서 최적의 성능을 보여줄 수 있도록 채널 모델과 통신 시스템의 통계적, 수학적 모델을 개선할 수는 있으나, 높은 복잡도와 trade-off 관계에 있어 실제 시스템에 적용하기가 쉽지 않다.

점점 더 복잡해지는 통신 시스템은 실제 환경에서 최적의 성능을 제공할 수 있는 통신 시스템의 수학적 모델을 더욱 어렵게 하고 있다.

각 사용자가 처한 채널 환경에서 다양한 서비스가 요구하는 QoS(Quality of Service)에 최적화할 수 있는 유연한 통신 시스템을 실현하기 위해서는 새로운 접근 방식이 필요하다.

본 명세서는 전술한 필요성 및/또는 문제점을 해결하는 것을 목적으로 한다.

또한, 본 명세서는, ML(machine learning) 기반 무선 통신 시스템에서 개발 환경에서의 파라미터를 실사용 환경에서의 최적화시킬 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.

또한, 본 명세서는, 기계 학습 네트워크의 파라미터를 최적화하기 위한 학습 데이터를 수집하기 위하여 학습의 대상이 되는 통신 환경을 선별할 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.

또한, 본 명세서는, 기계 학습 네트워크의 성능의 변동성을 고려하여 기계 학습 네트워크의 성능 변화를 모니터링 할 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.

또한, 본 명세서는, 클라이언트 디바이스 외부의 오프-디바이스 러닝 외에도 온-디바이스 러닝을 활용하여 클라이언트 디바이스 별로 개인화된 통신 서비스를 제공할 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.

본 명세서의 일 실시예에 따른 방법은 다중 송신 안테나와 다중 수신 안테나를 이용하여 MIMO(multi-input-multi-output) 통신 채널을 통해 통신하기 위한 적어도 하나의 기계 학습 네트워크를 훈련하기 위하여 단말의 적어도 하나의 프로세서에 의해 수행되는 방법으로서, 상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 단계, 상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻는 단계, 및 상기 훈련 데이터를 이용하여 상기 제1 기계 학습 네트워크를 업데이트하는 단계를 포함한다.

또한, 상기 학습 리스트를 생성하는 단계는 하나 이상의 기지국 별로 얻은 연결 정보와 기지국 정보 중 적어도 하나로 구성된 하나 이상의 제2 항목을 포함하는 연결 리스트를 생성하는 단계, 상기 연결 리스트의 연결 정보에 기반하여 후보 리스트에 업데이트하는 단계, 상기 후보 리스트에 포함된 하나 이상의 제3 항목 중 어느 하나에 설정된 가중치를 적용하여 하나 이상의 항목을 선정하여 선정 리스트에 업데이트하는 단계, 상기 선정 리스트에 포함된 적어도 하나의 제4 항목에 연관된 상기 단말의 위치 샘플에 기반하여 상기 학습 리스트에 추가될 상기 하나 이상의 제1 항목을 생성하는 단계를 포함할 수 있다.

또한, 상기 학습 리스트는, 상기 제1 항목 별로 구분되는 장소 정보와 기지국 정보를 가질 수 있다.

또한, 상기 장소 정보는, 학습이 완료된 상기 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함할 수 있다.

또한, 상기 이벤트는, 상기 단말이 상기 수집 영역에 진입하거나 위치하는 것이 감지되는 것일 수 있다.

또한, 상기 단말이 상기 적용 영역에 위치하는 것이 감지되면, 상기 위치 샘플의 수집을 중단할 수 있다.

또한, 상기 학습 리스트를 생성하는 단계는 상기 단말이 상기 수집 영역에 진입하면 상기 단말의 위치 샘플을 얻는 단계, 상기 얻은 위치 샘플들의 수가 설정된 수 이상이면, 상기 위치 샘플들을 대상으로 클러스터링 알고리즘을 적용하여 하나 이상의 통신 환경을 결정하는 단계 및 상기 결정된 하나 이상의 통신 환경을 상기 학습 리스트의 각 항목으로 설정하는 단계를 포함할 수 있다.

또한, 상기 적용 영역에 진입하면, 상기 적용 영역에서 적용될 기계 학습 네트워크를 확인하는 단계, 상기 확인된 기계 학습 네트워크에 기초하여, 수신기를 제어하는 단계를 더 포함할 수 있다.

또한, 상기 단말이 2 이상의 적용 영역에 위치하는 경우, 상기 2 이상의 적용 영역에 대응되는 제1 항목들 중 어느 하나를 선택하는 단계, 상기 선택된 제1 항목에서 적용될 기계 학습 네트워크를 확인하는 단계 및 상기 확인된 기계 학습 네트워크에 기초하여 수신기를 제어하는 단계를 더 포함할 수 있다.

또한, 상기 제1 항목들 중 어느 하나를 선택하는 단계는, 상기 2 이상의 적용 영역의 반경을 비교하는 단계, 상기 비교에 기초하여, 상기 2 이상의 제1 항목들 중 어느 하나를 선택하는 단계를 포함할 수 있다.

또한, 상기 기계 학습 네트워크는 심층 신경망(Deep Neural Network, DNN), 컨볼루션 신경망(Convolutional Neural Network, CNN), 또는 파라메트릭 곱셈들, 덧셈들, 및 비 선형성들을 포함하는 순환 신경망(Recurrent Neural Network, RNN) 중 적어도 하나를 포함할 수 있다.

또한, 상기 훈련 데이터는, 수신 관련 파라미터를 나타낼 수 있다.

또한, 상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함할 수 있다.

또한, 상기 기계 학습 네트워크를 업데이트하는 동안 업데이트 전인 제1 네트워크에 의해 측정된 제1 성능 지표와 업데이트 후인 제2 네트워크에 의해 측정된 제2 성능 지표를 비교하는 단계 및 상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계를 더 포함할 수 있다.

또한, 상기 기계 학습 네트워크가 업데이트되면, 업데이트 전인 제1 네트워크를 적용하여 측정되는 제1 성능 지표와 업데이트 후인 제2 네트워크를 적용하여 측정되는 제2 성능 지표를 비교하는 단계 및 상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계를 더 포함할 수 있다.

상기 비교의 신뢰도(reliablity)가 설정된 기준값 미만이면, 상기 제1, 제2 성능 지표를 다시 측정하여 비교하는 단계를 더 포함할 수 있다.

상기 학습 리스트는, 상기 제1 항목 별 상태 정보를 포함하고, 상기 상태 정보는, 획득 상태, 훈련 상태, 검증 상태, 적용 상태, 또는 잠금 상태 중 적어도 하나를 포함하되, 상기 기계 학습 네트워크는 상기 상태 정보에 기초하여 상기 훈련 데이터의 수집, 상기 기계 학습 네트워크의 학습, 검증, 적용, 또는 잠금 중 적어도 하나가 결정될 수 있다.

상기 기계 학습 네트워크의 업데이트의 일반화가 실패하면, 상기 기계 학습 네트워크에 대응되는 실패 횟수를 증가하는 단계, 상기 실패 횟수가 설정된 최대 횟수를 초과하면, (i) 상기 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화하고, (ii) 상기 제1 항목의 상태를 잠금 상태로 전환할 수 있다.

본 명세서의 다른 실시예에 따른 단말은 트랜시버, 적어도 하나의 프로세서, 상기 적어도 하나의 프로세서에 연결되고 명령들(instructions)을 저장하는 적어도 하나의 메모리를 포함하고, 상기 명령들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 다중의 수신 안테나를 이용하여 MIMO 통신 채널을 통해 통신하기 위한 동작들을 지원하고, 상기 동작들은, 상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하고, 상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용되는 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻고, 상기 훈련 데이터를 이용하여 상기 기계 학습 네트워크를 업데이트하는 동작을 포함하는 단말.

본 명세서의 일 실시예에 따른 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법의 효과에 대해 설명하면 다음과 같다.

본 명세서는 ML(machine learning) 기반 무선 통신 시스템에서 개발 환경에서의 파라미터를 실사용 환경에서의 최적화할 수 있다.

또한, 본 명세서는 기계 학습 네트워크의 성능의 변동성을 고려하여 기계 학습 네트워크의 성능 변화를 모니터링할 수 있다.

또한, 본 명세서는 클라이언트 디바이스 외부의 오프-디바이스 러닝 외에도 온-디바이스 러닝을 활용하여 클라이언트 디바이스 별로 개인화된 통신 서비스를 제공할 수 있다.

본 명세서에서 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 명세서가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 명세서에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부 도면은 본 명세서에 대한 실시예를 제공하고, 상세한 설명과 함께 본 명세서의 기술적 특징을 설명한다.

도 1은 본 명세서에서 제안하는 방법들이 적용될 수 있는 무선 통신 시스템의 블록 구성도를 예시한다.

도 2는 무선 통신 시스템에서 신호 송/수신 방법의 일례를 나타낸 도이다.

도 3은 5G 통신 시스템에서 사용자 단말과 5G 네트워크의 기본동작의 일 예를 나타낸다.

도 4는 본 명세서의 일 실시예에 따른 AI 장치의 블록도이다.

도 5는 SSB와 CSI-RS를 이용한 빔포밍의 일례를 나타낸다.

도 6은 SSB를 이용한 DL BM 절차의 일례를 나타낸 흐름도이다.

도 7은 CSI-RS를 이용한 DL BM 절차의 일례를 나타낸다.

도 8은 단말의 수신 빔 결정 과정의 일례를 나타낸 흐름도이다.

도 9는 기지국의 전송 빔 결정 과정의 일례를 나타낸 흐름도이다.

도 10은 도 7의 동작과 관련된 시간 및 주파수 영역에서의 자원 할당의 일례를 나타낸다.

도 11은 SRS를 이용한 UL BM 절차의 일례를 나타낸다.

도 12는 SRS를 이용한 UL BM 절차의 일례를 나타낸 흐름도이다.

도 13은 CSI 관련 절차의 일례를 나타낸 흐름도이다.

도 14는 본 명세서의 일 실시예에 따른 통신 시스템을 예시적으로 설명한다.

도 15는 본 명세서의 일 실시예에 따른 방법의 순서도이다.

도 16은 본 명세서의 일 실시예에 따른 통신 환경을 예시적으로 설명한다.

도 17 내지 도 24는 본 명세서의 일 실시예에 따른 학습 리스트 생성방법을 예시적으로 설명한다.

도 25 및 도 26은 본 명세서의 일 실시예에 따른 훈련 데이터 수집방법을 예시적으로 설명한다.

도 27은 본 명세서의 일 실시예에 따른 기계 학습 네트워크 업데이트 방법을 예시적으로 설명한다.

도 28 및 도 29는 본 명세서의 일 실시예에 따른 기계 학습 네트워크의 검증방법을 예시적으로 설명한다.

도 30 내지 도32는 본 명세서의 일 실시예에 따른 기계 학습 네트워크의 적용방법을 예시적으로 설명한다.

도 33 및 도 34은 본 명세서의 일 실시예에 따른 잠금 상태인 항목의 관리방법을 예시적으로 설명한다.

도 35은 본 발명에 적용되는 통신 시스템을 예시한다.

도 36은 본 발명에 적용될 수 있는 무선 기기를 예시한다.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 명세서의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.

본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, AI 프로세싱된 정보를 필요로 하는 장치 및/또는 AI 프로세서가 필요로 하는 5G 통신(5th generation mobile communication)을 단락 A 내지 단락 G를 통해 설명하기로 한다.

A. UE 및 5G 네트워크 블록도 예시

도 1을 참조하면, AI 모듈을 포함하는 장치(AI 장치)를 제1 통신 장치로 정의(도 1의 910)하고, 프로세서(911)가 AI 상세 동작을 수행할 수 있다.

AI 장치와 통신하는 다른 장치(AI 서버)를 포함하는 5G 네트워크를 제2 통신 장치(도 1의 920)하고, 프로세서(921)가 AI 상세 동작을 수행할 수 있다.

5G 네트워크가 제 1 통신 장치로, AI 장치가 제 2 통신 장치로 표현될 수도 있다.

예를 들어, 상기 제 1 통신 장치 또는 상기 제 2 통신 장치는 기지국, 네트워크 노드, 전송 단말, 수신 단말, 무선 장치, 무선 통신 장치, 차량, 자율주행 기능을 탑재한 차량, 커넥티드카(Connected Car), 드론(Unmanned Aerial Vehicle, UAV), AI(Artificial Intelligence) 모듈, 로봇, AR(Augmented Reality) 장치, VR(Virtual Reality) 장치, MR(Mixed Reality) 장치, 홀로그램 장치, 공공 안전 장치, MTC 장치, IoT 장치, 의료 장치, 핀테크 장치(또는 금융 장치), 보안 장치, 기후/환경 장치, 5G 서비스와 관련된 장치 또는 그 이외 4차 산업 혁명 분야와 관련된 장치일 수 있다.

예를 들어, 단말 또는 UE(User Equipment)는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털 방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등을 포함할 수 있다. 예를 들어, HMD는 머리에 착용하는 형태의 디스플레이 장치일 수 있다. 예를 들어, HMD는 VR, AR 또는 MR을 구현하기 위해 사용될 수 있다. 예를 들어, 드론은 사람이 타지 않고 무선 컨트롤 신호에 의해 비행하는 비행체일 수 있다. 예를 들어, VR 장치는 가상 세계의 객체 또는 배경 등을 구현하는 장치를 포함할 수 있다. 예를 들어, AR 장치는 현실 세계의 객체 또는 배경 등에 가상 세계의 객체 또는 배경을 연결하여 구현하는 장치를 포함할 수 있다. 예를 들어, MR 장치는 현실 세계의 객체 또는 배경 등에 가상 세계의 객체 또는 배경을 융합하여 구현하는 장치를 포함할 수 있다. 예를 들어, 홀로그램 장치는 홀로그래피라는 두 개의 레이저 광이 만나서 발생하는 빛의 간섭현상을 활용하여, 입체 정보를 기록 및 재생하여 360도 입체 영상을 구현하는 장치를 포함할 수 있다. 예를 들어, 공공 안전 장치는 영상 중계 장치 또는 사용자의 인체에 착용 가능한 영상 장치 등을 포함할 수 있다. 예를 들어, MTC 장치 및 IoT 장치는 사람의 직접적인 개입이나 또는 조작이 필요하지 않는 장치일 수 있다. 예를 들어, MTC 장치 및 IoT 장치는 스마트 미터, 벤딩 머신, 온도계, 스마트 전구, 도어락 또는 각종 센서 등을 포함할 수 있다. 예를 들어, 의료 장치는 질병을 진단, 치료, 경감, 처치 또는 예방할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 상해 또는 장애를 진단, 치료, 경감 또는 보정할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 구조 또는 기능을 검사, 대체 또는 변형할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 임신을 조절할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 진료용 장치, 수술용 장치, (체외) 진단용 장치, 보청기 또는 시술용 장치 등을 포함할 수 있다. 예를 들어, 보안 장치는 발생할 우려가 있는 위험을 방지하고, 안전을 유지하기 위하여 설치한 장치일 수 있다. 예를 들어, 보안 장치는 카메라, CCTV, 녹화기(recorder) 또는 블랙박스 등일 수 있다. 예를 들어, 핀테크 장치는 모바일 결제 등 금융 서비스를 제공할 수 있는 장치일 수 있다.

도 1을 참고하면, 제 1 통신 장치(910)와 제 2 통신 장치(920)은 프로세서(processor, 911,921), 메모리(memory, 914,924), 하나 이상의 Tx/Rx RF 모듈(radio frequency module, 915,925), Tx 프로세서(912,922), Rx 프로세서(913,923), 안테나(916,926)를 포함한다. Tx/Rx 모듈은 트랜시버라고도 한다. 각각의 Tx/Rx 모듈(915)는 각각의 안테나(926)을 통해 신호를 전송한다. 프로세서는 앞서 살핀 기능, 과정 및/또는 방법을 구현한다. 프로세서 (921)는 프로그램 코드 및 데이터를 저장하는 메모리 (924)와 관련될 수 있다. 메모리는 컴퓨터 판독 가능 매체로서 지칭될 수 있다. 보다 구체적으로, DL(제 1 통신 장치에서 제 2 통신 장치로의 통신)에서, 전송(TX) 프로세서(912)는 L1 계층(즉, 물리 계층)에 대한 다양한 신호 처리 기능을 구현한다. 수신(RX) 프로세서는 L1(즉, 물리 계층)의 다양한 신호 프로세싱 기능을 구현한다.

UL(제 2 통신 장치에서 제 1 통신 장치로의 통신)은 제 2 통신 장치(920)에서 수신기 기능과 관련하여 기술된 것과 유사한 방식으로 제 1 통신 장치(910)에서 처리된다. 각각의 Tx/Rx 모듈(925)는 각각의 안테나(926)을 통해 신호를 수신한다. 각각의 Tx/Rx 모듈은 RF 반송파 및 정보를 RX 프로세서(923)에 제공한다. 프로세서 (921)는 프로그램 코드 및 데이터를 저장하는 메모리 (924)와 관련될 수 있다. 메모리는 컴퓨터 판독 가능 매체로서 지칭될 수 있다.

B. 무선 통신 시스템에서 신호 송/수신 방법

도 2를 참고하면, UE는 전원이 켜지거나 새로이 셀에 진입한 경우 BS와 동기를 맞추는 등의 초기 셀 탐색(initial cell search) 작업을 수행한다(S201). 이를 위해, UE는 BS로부터 1차 동기 채널(primary synchronization channel, P-SCH) 및 2차 동기 채널(secondary synchronization channel, S-SCH)을 수신하여 BS와 동기를 맞추고, 셀 ID 등의 정보를 획득할 수 있다. LTE 시스템과 NR 시스템에서 P-SCH와 S-SCH는 각각 1차 동기 신호(primary synchronization signal, PSS)와 2차 동기 신호(secondary synchronization signal, SSS)로 불린다. 초기 셀 탐색 후, UE는 BS로부터 물리 브로드캐스트 채널(physical broadcast channel, PBCH)를 수신하여 셀 내 브로드캐스트 정보를 획득할 수 있다. 한편, UE는 초기 셀 탐색 단계에서 하향링크 참조 신호(downlink reference Signal, DL RS)를 수신하여 하향링크 채널 상태를 확인할 수 있다. 초기 셀 탐색을 마친 UE는 물리 하향링크 제어 채널(physical downlink control channel, PDCCH) 및 상기 PDCCH에 실린 정보에 따라 물리 하향링크 공유 채널(physical downlink shared Channel, PDSCH)을 수신함으로써 좀더 구체적인 시스템 정보를 획득할 수 있다(S202).

한편, BS에 최초로 접속하거나 신호 전송을 위한 무선 자원이 없는 경우 UE는 BS에 대해 임의 접속 과정(random access procedure, RACH)을 수행할 수 있다(단계 S203 내지 단계 S206). 이를 위해, UE는 물리 임의 접속 채널(physical random access Channel, PRACH)을 통해 특정 시퀀스를 프리앰블로서 전송하고(S203 및 S205), PDCCH 및 대응하는 PDSCH를 통해 프리앰블에 대한 임의 접속 응답(random access response, RAR) 메시지를 수신할 수 있다(S204 및 S206). 경쟁 기반 RACH의 경우, 추가적으로 충돌 해결 과정(contention resolution procedure)를 수행할 수 있다.

상술한 바와 같은 과정을 수행한 UE는 이후 일반적인 상향링크/하향링크 신호 전송 과정으로서 PDCCH/PDSCH 수신(S207) 및 물리 상향링크 공유 채널(physical uplink shared Channel, PUSCH)/물리 상향링크 제어 채널(physical uplink control channel, PUCCH) 전송(S208)을 수행할 수 있다. 특히 UE는 PDCCH를 통하여 하향링크 제어 정보(downlink control information, DCI)를 수신한다. UE는 해당 탐색 공간 설정(configuration)들에 따라 서빙 셀 상의 하나 이상의 제어 요소 세트(control element set, CORESET)들에 설정된 모니터링 기회(occasion)들에서 PDCCH 후보(candidate)들의 세트를 모니터링한다. UE가 모니터할 PDCCH 후보들의 세트는 탐색 공간 세트들의 면에서 정의되며, 탐색 공간 세트는 공통 탐색 공간 세트 또는 UE-특정 탐색 공간 세트일 수 있다. CORESET은 1~3개 OFDM 심볼들의 시간 지속기간을 갖는 (물리) 자원 블록들의 세트로 구성된다. 네트워크는 UE가 복수의 CORESET들을 갖도록 설정할 수 있다. UE는 하나 이상의 탐색 공간 세트들 내 PDCCH 후보들을 모니터링한다. 여기서 모니터링이라 함은 탐색 공간 내 PDCCH 후보(들)에 대한 디코딩 시도하는 것을 의미한다. UE가 탐색 공간 내 PDCCH 후보들 중 하나에 대한 디코딩에 성공하면, 상기 UE는 해당 PDCCH 후보에서 PDCCH를 검출했다고 판단하고, 상기 검출된 PDCCH 내 DCI를 기반으로 PDSCH 수신 혹은 PUSCH 전송을 수행한다. PDCCH는 PDSCH 상의 DL 전송들 및 PUSCH 상의 UL 전송들을 스케줄링하는 데 사용될 수 있다. 여기서 PDCCH 상의 DCI는 하향링크 공유 채널과 관련된, 변조(modulation) 및 코딩 포맷과 자원 할당(resource allocation) 정보를 적어도 포함하는 하향링크 배정(assignment)(즉, downlink grant; DL grant), 또는 상향링크 공유 채널과 관련된, 변조 및 코딩 포맷과 자원 할당 정보를 포함하는 상향링크 그랜트(uplink grant; UL grant)를 포함한다.

도 2를 참고하여, 5G 통신 시스템에서의 초기 접속(Initial Access, IA) 절차에 대해 추가적으로 살펴본다.

UE는 SSB에 기반하여 셀 탐색(search), 시스템 정보 획득, 초기 접속을 위한 빔 정렬, DL 측정 등을 수행할 수 있다. SSB는 SS/PBCH(Synchronization Signal/Physical Broadcast channel) 블록과 혼용된다.

SSB는 PSS, SSS와 PBCH로 구성된다. SSB는 4개의 연속된 OFDM 심볼들에 구성되며, OFDM 심볼별로 PSS, PBCH, SSS/PBCH 또는 PBCH가 전송된다. PSS와 SSS는 각각 1개의 OFDM 심볼과 127개의 부반송파들로 구성되고, PBCH는 3개의 OFDM 심볼과 576개의 부반송파들로 구성된다.

셀 탐색은 UE가 셀의 시간/주파수 동기를 획득하고, 상기 셀의 셀 ID(Identifier)(예, Physical layer Cell ID, PCI)를 검출하는 과정을 의미한다. PSS는 셀 ID 그룹 내에서 셀 ID를 검출하는데 사용되고, SSS는 셀 ID 그룹을 검출하는데 사용된다. PBCH는 SSB (시간) 인덱스 검출 및 하프-프레임 검출에 사용된다.

336개의 셀 ID 그룹이 존재하고, 셀 ID 그룹 별로 3개의 셀 ID가 존재한다. 총 1008개의 셀 ID가 존재한다. 셀의 셀 ID가 속한 셀 ID 그룹에 관한 정보는 상기 셀의 SSS를 통해 제공/획득되며, 상기 셀 ID 내 336개 셀들 중 상기 셀 ID에 관한 정보는 PSS를 통해 제공/획득된다

SSB는 SSB 주기(periodicity)에 맞춰 주기적으로 전송된다. 초기 셀 탐색 시에 UE가 가정하는 SSB 기본 주기는 20ms로 정의된다. 셀 접속 후, SSB 주기는 네트워크(예, BS)에 의해 {5ms, 10ms, 20ms, 40ms, 80ms, 160ms} 중 하나로 설정될 수 있다.

다음으로, 시스템 정보 (system information; SI) 획득에 대해 살펴본다.

SI는 마스터 정보 블록(master information block, MIB)와 복수의 시스템 정보 블록(system information block, SIB)들로 나눠진다. MIB 외의 SI는 RMSI(Remaining Minimum System Information)으로 지칭될 수 있다. MIB는 SIB1(SystemInformationBlock1)을 나르는 PDSCH를 스케줄링하는 PDCCH의 모니터링을 위한 정보/파라미터를 포함하며 SSB의 PBCH를 통해 BS에 의해 전송된다. SIB1은 나머지 SIB들(이하, SIBx, x는 2 이상의 정수)의 가용성(availability) 및 스케줄링(예, 전송 주기, SI-윈도우 크기)과 관련된 정보를 포함한다. SIBx는 SI 메시지에 포함되며 PDSCH를 통해 전송된다. 각각의 SI 메시지는 주기적으로 발생하는 시간 윈도우(즉, SI-윈도우) 내에서 전송된다.

도 2를 참고하여, 5G 통신 시스템에서의 임의 접속(Random Access, RA) 과정에 대해 추가적으로 살펴본다.

임의 접속 과정은 다양한 용도로 사용된다. 예를 들어, 임의 접속 과정은 네트워크 초기 접속, 핸드오버, UE-트리거드(triggered) UL 데이터 전송에 사용될 수 있다. UE는 임의 접속 과정을 통해 UL 동기와 UL 전송 자원을 획득할 수 있다. 임의 접속 과정은 경쟁 기반(contention-based) 임의 접속 과정과 경쟁 프리(contention free) 임의 접속 과정으로 구분된다. 경쟁 기반의 임의 접속 과정에 대한 구체적인 절차는 아래와 같다.

UE가 UL에서 임의 접속 과정의 Msg1로서 임의 접속 프리앰블을 PRACH를 통해 전송할 수 있다. 서로 다른 두 길이를 가지는 임의 접속 프리앰블 시퀀스들이 지원된다. 긴 시퀀스 길이 839는 1.25 및 5 kHz의 부반송파 간격(subcarrier spacing)에 대해 적용되며, 짧은 시퀀스 길이 139는 15, 30, 60 및 120 kHz의 부반송파 간격에 대해 적용된다.

BS가 UE로부터 임의 접속 프리앰블을 수신하면, BS는 임의 접속 응답(random access response, RAR) 메시지(Msg2)를 상기 UE에게 전송한다. RAR을 나르는 PDSCH를 스케줄링하는 PDCCH는 임의 접속(random access, RA) 무선 네트워크 임시 식별자(radio network temporary identifier, RNTI)(RA-RNTI)로 CRC 마스킹되어 전송된다. RA-RNTI로 마스킹된 PDCCH를 검출한 UE는 상기 PDCCH가 나르는 DCI가 스케줄링하는 PDSCH로부터 RAR을 수신할 수 있다. UE는 자신이 전송한 프리앰블, 즉, Msg1에 대한 임의 접속 응답 정보가 상기 RAR 내에 있는지 확인한다. 자신이 전송한 Msg1에 대한 임의 접속 정보가 존재하는지 여부는 상기 UE가 전송한 프리앰블에 대한 임의 접속 프리앰블 ID가 존재하는지 여부에 의해 판단될 수 있다. Msg1에 대한 응답이 없으면, UE는 전력 램핑(power ramping)을 수행하면서 RACH 프리앰블을 소정의 횟수 이내에서 재전송할 수 있다. UE는 가장 최근의 경로 손실 및 전력 램핑 카운터를 기반으로 프리앰블의 재전송에 대한 PRACH 전송 전력을 계산한다.

상기 UE는 임의 접속 응답 정보를 기반으로 상향링크 공유 채널 상에서 UL 전송을 임의 접속 과정의 Msg3로서 전송할 수 있다. Msg3은 RRC 연결 요청 및 UE 식별자를 포함할 수 있다. Msg3에 대한 응답으로서, 네트워크는 Msg4를 전송할 수 있으며, 이는 DL 상에서의 경쟁 해결 메시지로 취급될 수 있다. Msg4를 수신함으로써, UE는 RRC 연결된 상태에 진입할 수 있다.

C. 5G 통신 시스템의 빔 관리(Beam Management, BM) 절차

BM 과정은 (1) SSB 또는 CSI-RS를 이용하는 DL BM 과정과, (2) SRS(sounding reference signal)을 이용하는 UL BM 과정으로 구분될 수 있다. 또한, 각 BM 과정은 Tx 빔을 결정하기 위한 Tx 빔 스위핑과 Rx 빔을 결정하기 위한 Rx 빔 스위핑을 포함할 수 있다.

SSB를 이용한 DL BM 과정에 대해 살펴본다.

SSB를 이용한 빔 보고(beam report)에 대한 설정은 RRC_CONNECTED에서 채널 상태 정보(channel state information, CSI)/빔 설정 시에 수행된다.

- UE는 BM을 위해 사용되는 SSB 자원들에 대한 CSI-SSB-ResourceSetList를 포함하는 CSI-ResourceConfig IE를 BS로부터 수신한다. RRC 파라미터 csi-SSB-ResourceSetList는 하나의 자원 세트에서 빔 관리 및 보고을 위해 사용되는 SSB 자원들의 리스트를 나타낸다. 여기서, SSB 자원 세트는 {SSBx1, SSBx2, SSBx3, SSBx4, 쪋}으로 설정될 수 있다. SSB 인덱스는 0부터 63까지 정의될 수 있다.

- UE는 상기 CSI-SSB-ResourceSetList에 기초하여 SSB 자원들 상의 신호들을 상기 BS로부터 수신한다.

- SSBRI 및 참조 신호 수신 전력(reference signal received power, RSRP)에 대한 보고와 관련된 CSI-RS reportConfig가 설정된 경우, 상기 UE는 최선(best) SSBRI 및 이에 대응하는 RSRP를 BS에게 보고한다. 예를 들어, 상기 CSI-RS reportConfig IE의 reportQuantity가 'ssb-Index-RSRP'로 설정된 경우, UE는 BS으로 최선 SSBRI 및 이에 대응하는 RSRP를 보고한다.

UE는 SSB와 동일한 OFDM 심볼(들)에 CSI-RS 자원이 설정되고, 'QCL-TypeD'가 적용 가능한 경우, 상기 UE는 CSI-RS와 SSB가 'QCL-TypeD' 관점에서 유사 동일 위치된(quasi co-located, QCL) 것으로 가정할 수 있다. 여기서, QCL-TypeD는 공간(spatial) Rx 파라미터 관점에서 안테나 포트들 간에 QCL되어 있음을 의미할 수 있다. UE가 QCL-TypeD 관계에 있는 복수의 DL 안테나 포트들의 신호들을 수신 시에는 동일한 수신 빔을 적용해도 무방하다.

다음으로, CSI-RS를 이용한 DL BM 과정에 대해 살펴본다.

CSI-RS를 이용한 UE의 Rx 빔 결정(또는 정제(refinement)) 과정과 BS의 Tx 빔 스위핑 과정에 대해 차례대로 살펴본다. UE의 Rx 빔 결정 과정은 반복 파라미터가 'ON'으로 설정되며, BS의 Tx 빔 스위핑 과정은 반복 파라미터가 'OFF'로 설정된다.

먼저, UE의 Rx 빔 결정 과정에 대해 살펴본다.

- UE는 'repetition'에 관한 RRC 파라미터를 포함하는 NZP CSI-RS resource set IE를 RRC 시그널링을 통해 BS로부터 수신한다. 여기서, 상기 RRC 파라미터 'repetition'이 'ON'으로 세팅되어 있다.

- UE는 상기 RRC 파라미터 'repetition'이 'ON'으로 설정된 CSI-RS 자원 세트 내의 자원(들) 상에서의 신호들을 BS의 동일 Tx 빔(또는 DL 공간 도메인 전송 필터)을 통해 서로 다른 OFDM 심볼에서 반복 수신한다.

- UE는 자신의 Rx 빔을 결정한다.

- UE는 CSI 보고를 생략한다. 즉, UE는 상가 RRC 파라미터 'repetition'이 'ON'으로 설정된 경우, CSI 보고를 생략할 수 있다.

다음으로, BS의 Tx 빔 결정 과정에 대해 살펴본다.

- UE는 'repetition'에 관한 RRC 파라미터를 포함하는 NZP CSI-RS resource set IE를 RRC 시그널링을 통해 BS로부터 수신한다. 여기서, 상기 RRC 파라미터 'repetition'이 'OFF'로 세팅되어 있으며, BS의 Tx 빔 스위핑 과정과 관련된다.

- UE는 상기 RRC 파라미터 'repetition'이 'OFF'로 설정된 CSI-RS 자원 세트 내의 자원들 상에서의 신호들을 BS의 서로 다른 Tx 빔(DL 공간 도메인 전송 필터)을 통해 수신한다.

- UE는 최상의(best) 빔을 선택(또는 결정)한다.

- UE는 선택된 빔에 대한 ID(예, CRI) 및 관련 품질 정보(예, RSRP)를 BS으로 보고한다. 즉, UE는 CSI-RS가 BM을 위해 전송되는 경우 CRI와 이에 대한 RSRP를 BS으로 보고한다.

다음으로, SRS를 이용한 UL BM 과정에 대해 살펴본다.

- UE는 'beam management'로 설정된 (RRC 파라미터) 용도 파라미터를 포함하는 RRC 시그널링(예, SRS-Config IE)를 BS로부터 수신한다. SRS-Config IE는 SRS 전송 설정을 위해 사용된다. SRS-Config IE는 SRS-Resources의 리스트와 SRS-ResourceSet들의 리스트를 포함한다. 각 SRS 자원 세트는 SRS-resource들의 세트를 의미한다.

- UE는 상기 SRS-Config IE에 포함된 SRS-SpatialRelation Info에 기초하여 전송할 SRS 자원에 대한 Tx 빔포밍을 결정한다. 여기서, SRS-SpatialRelation Info는 SRS 자원별로 설정되고, SRS 자원별로 SSB, CSI-RS 또는 SRS에서 사용되는 빔포밍과 동일한 빔포밍을 적용할지를 나타낸다.

- 만약 SRS 자원에 SRS-SpatialRelationInfo가 설정되면 SSB, CSI-RS 또는 SRS에서 사용되는 빔포밍과 동일한 빔포밍을 적용하여 전송한다. 하지만, SRS 자원에 SRS-SpatialRelationInfo가 설정되지 않으면, 상기 UE는 임의로 Tx 빔포밍을 결정하여 결정된 Tx 빔포밍을 통해 SRS를 전송한다.

다음으로, 빔 실패 복구(beam failure recovery, BFR) 과정에 대해 살펴본다.

빔포밍된 시스템에서, RLF(Radio Link Failure)는 UE의 회전(rotation), 이동(movement) 또는 빔포밍 블로키지(blockage)로 인해 자주 발생할 수 있다. 따라서, 잦은 RLF가 발생하는 것을 방지하기 위해 BFR이 NR에서 지원된다. BFR은 무선 링크 실패 복구 과정과 유사하고, UE가 새로운 후보 빔(들)을 아는 경우에 지원될 수 있다. 빔 실패 검출을 위해, BS는 UE에게 빔 실패 검출 참조 신호들을 설정하고, 상기 UE는 상기 UE의 물리 계층으로부터의 빔 실패 지시(indication)들의 횟수가 BS의 RRC 시그널링에 의해 설정된 기간(period) 내에 RRC 시그널링에 의해 설정된 임계치(threshold)에 이르면(reach), 빔 실패를 선언(declare)한다. 빔 실패가 검출된 후, 상기 UE는 PCell 상의 임의 접속 과정을 개시(initiate)함으로써 빔 실패 복구를 트리거하고; 적절한(suitable) 빔을 선택하여 빔 실패 복구를 수행한다(BS가 어떤(certain) 빔들에 대해 전용 임의 접속 자원들을 제공한 경우, 이들이 상기 UE에 의해 우선화된다). 상기 임의 접속 절차의 완료(completion) 시, 빔 실패 복구가 완료된 것으로 간주된다.

D. URLLC (Ultra-Reliable and Low Latency Communication)

NR에서 정의하는 URLLC 전송은 (1) 상대적으로 낮은 트래픽 크기, (2) 상대적으로 낮은 도착 레이트(low arrival rate), (3) 극도의 낮은 레이턴시 요구사항(requirement)(예, 0.5, 1ms), (4) 상대적으로 짧은 전송 지속기간(duration)(예, 2 OFDM symbols), (5) 긴급한 서비스/메시지 등에 대한 전송을 의미할 수 있다. UL의 경우, 보다 엄격(stringent)한 레이턴시 요구 사항(latency requirement)을 만족시키기 위해 특정 타입의 트래픽(예컨대, URLLC)에 대한 전송이 앞서서 스케줄링된 다른 전송(예컨대, eMBB)과 다중화(multiplexing)되어야 할 필요가 있다. 이와 관련하여 한 가지 방안으로, 앞서 스케줄링 받은 UE에게 특정 자원에 대해서 프리엠션(preemption)될 것이라는 정보를 주고, 해당 자원을 URLLC UE가 UL 전송에 사용하도록 한다.

NR의 경우, eMBB와 URLLC 사이의 동적 자원 공유(sharing)이 지원된다. eMBB와 URLLC 서비스들은 비-중첩(non-overlapping) 시간/주파수 자원들 상에서 스케줄될 수 있으며, URLLC 전송은 진행 중인(ongoing) eMBB 트래픽에 대해 스케줄된 자원들에서 발생할 수 있다. eMBB UE는 해당 UE의 PDSCH 전송이 부분적으로 펑처링(puncturing)되었는지 여부를 알 수 없을 수 있고, 손상된 코딩된 비트(corrupted coded bit)들로 인해 UE는 PDSCH를 디코딩하지 못할 수 있다. 이 점을 고려하여, NR에서는 프리엠션 지시(preemption indication)을 제공한다. 상기 프리엠션 지시(preemption indication)는 중단된 전송 지시(interrupted transmission indication)으로 지칭될 수도 있다.

프리엠션 지시와 관련하여, UE는 BS로부터의 RRC 시그널링을 통해 DownlinkPreemption IE를 수신한다. UE가 DownlinkPreemption IE를 제공받으면, DCI 포맷 2_1을 운반(convey)하는 PDCCH의 모니터링을 위해 상기 UE는 DownlinkPreemption IE 내 파라미터 int-RNTI에 의해 제공된 INT-RNTI를 가지고 설정된다. 상기 UE는 추가적으로 servingCellID에 의해 제공되는 서빙 셀 인덱스들의 세트를 포함하는 INT-ConfigurationPerServing Cell에 의해 서빙 셀들의 세트와 positionInDCI에 의해 DCI 포맷 2_1 내 필드들을 위한 위치들의 해당 세트를 가지고 설정되고, dci-PayloadSize에 의해 DCI 포맷 2_1을 위한 정보 페이로드 크기를 가지고 설졍되며, timeFrequencySect에 의한 시간-주파수 자원들의 지시 입도(granularity)를 가지고 설정된다.

상기 UE는 상기 DownlinkPreemption IE에 기초하여 DCI 포맷 2_1을 상기 BS로부터 수신한다.

UE가 서빙 셀들의 설정된 세트 내 서빙 셀에 대한 DCI 포맷 2_1을 검출하면, 상기 UE는 상기 DCI 포맷 2_1이 속한 모니터링 기간의 바로 앞(last) 모니터링 기간의 PRB들의 세트 및 심볼들의 세트 중 상기 DCI 포맷 2_1에 의해 지시되는 PRB들 및 심볼들 내에는 상기 UE로의 아무런 전송도 없다고 가정할 수 있다. 예를 들어, UE는 프리엠션에 의해 지시된 시간-주파수 자원 내 신호는 자신에게 스케줄링된 DL 전송이 아니라고 보고 나머지 자원 영역에서 수신된 신호들을 기반으로 데이터를 디코딩한다.

E. mMTC (massive MTC)

mMTC(massive Machine Type Communication)은 많은 수의 UE와 동시에 통신하는 초연결 서비스를 지원하기 위한 5G의 시나리오 중 하나이다. 이 환경에서, UE는 굉장히 낮은 전송 속도와 이동성을 가지고 간헐적으로 통신하게 된다. 따라서, mMTC는 UE를 얼마나 낮은 비용으로 오랫동안 구동할 수 있는지를 주요 목표로 하고 있다. mMTC 기술과 관련하여 3GPP에서는 MTC와 NB(NarrowBand)-IoT를 다루고 있다.

mMTC 기술은 PDCCH, PUCCH, PDSCH(physical downlink shared channel), PUSCH 등의 반복 전송, 주파수 호핑(hopping), 리튜닝(retuning), 가드 구간(guard period) 등의 특징을 가진다.

즉, 특정 정보를 포함하는 PUSCH(또는 PUCCH(특히, long PUCCH) 또는 PRACH) 및 특정 정보에 대한 응답을 포함하는 PDSCH(또는 PDCCH)가 반복 전송된다. 반복 전송은 주파수 호핑(frequency hopping)을 통해 수행되며, 반복 전송을 위해, 제 1 주파수 자원에서 제 2 주파수 자원으로 가드 구간(guard period)에서 (RF) 리튜닝(retuning)이 수행되고, 특정 정보 및 특정 정보에 대한 응답은 협대역(narrowband)(ex. 6 RB (resource block) or 1 RB)를 통해 송/수신될 수 있다.

F. 5G 통신을 이용한 AI 기본 동작

UE는 특정 정보 전송을 5G 네트워크로 전송한다(S1).그리고, 상기 5G 네트워크는 상기 특정 정보에 대한 5G 프로세싱을 수행한다(S2).여기서, 5G 프로세싱은 AI 프로세싱을 포함할 수 있다. 그리고, 상기 5G 네트워크는 AI 프로세싱 결과를 포함하는 응답을 상기 UE로 전송한다(S3).

G. 5G 통신 시스템에서 사용자 단말과 5G 네트워크 간의 응용 동작

이하, 도 1 및 도 2와 앞서 살핀 무선 통신 기술(BM 절차, URLLC, Mmtc 등)을 참고하여 5G 통신을 이용한 AI 동작에 대해 보다 구체적으로 살펴본다.

먼저, 후술할 본 명세서에서 제안하는 방법과 5G 통신의 eMBB 기술이 적용되는 응용 동작의 기본 절차에 대해 설명한다.

도 3의 S1 단계 및 S3 단계와 같이, UE가 5G 네트워크와 신호, 정보 등을 송/수신하기 위해, UE는 도 3의 S1 단계 이전에 5G 네트워크와 초기 접속(initial access) 절차 및 임의 접속(random access) 절차를 수행한다.

보다 구체적으로, UE는 DL 동기 및 시스템 정보를 획득하기 위해 SSB에 기초하여 5G 네트워크와 초기 접속 절차를 수행한다. 상기 초기 접속 절차 과정에서 빔 관리(beam management, BM) 과정, 빔 실패 복구(beam failure recovery) 과정이 추가될 수 있으며, UE가 5G 네트워크로부터 신호를 수신하는 과정에서 QCL(quasi-co location) 관계가 추가될 수 있다.

또한, UE는 UL 동기 획득 및/또는 UL 전송을 위해 5G 네트워크와 임의 접속 절차를 수행한다. 그리고, 상기 5G 네트워크는 상기 UE로 특정 정보의 전송을 스케쥴링하기 위한 UL grant를 전송할 수 있다. 따라서, 상기 UE는 상기 UL grant에 기초하여 상기 5G 네트워크로 특정 정보를 전송한다. 그리고, 상기 5G 네트워크는 상기 UE로 상기 특정 정보에 대한 5G 프로세싱 결과의 전송을 스케쥴링하기 위한 DL grant를 전송한다. 따라서, 상기 5G 네트워크는 상기 DL grant에 기초하여 상기 UE로 AI 프로세싱 결과를 포함하는 응답을 전송할 수 있다.

다음으로, 후술할 본 명세서에서 제안하는 방법과 5G 통신의 URLLC 기술이 적용되는 응용 동작의 기본 절차에 대해 설명한다.

앞서 설명한 바와 같이, UE가 5G 네트워크와 초기 접속 절차 및/또는 임의 접속 절차를 수행한 후, UE는 5G 네트워크로부터 DownlinkPreemption IE를 수신할 수 있다. 그리고, UE는 DownlinkPreemption IE에 기초하여 프리엠션 지시(pre-emption indication)을 포함하는 DCI 포맷 2_1을 5G 네트워크로부터 수신한다. 그리고, UE는 프리엠션 지시(pre-emption indication)에 의해 지시된 자원(PRB 및/또는 OFDM 심볼)에서 eMBB data의 수신을 수행(또는 기대 또는 가정)하지 않는다. 이후, UE는 특정 정보를 전송할 필요가 있는 경우 5G 네트워크로부터 UL grant를 수신할 수 있다.

다음으로, 후술할 본 명세서에서 제안하는 방법과 5G 통신의 mMTC 기술이 적용되는 응용 동작의 기본 절차에 대해 설명한다.

도 3의 단계들 중 mMTC 기술의 적용으로 달라지는 부분 위주로 설명하기로 한다.

도 3의 S1 단계에서, UE는 특정 정보를 5G 네트워크로 전송하기 위해 5G 네트워크로부터 UL grant를 수신한다. 여기서, 상기 UL grant는 상기 특정 정보의 전송에 대한 반복 횟수에 대한 정보를 포함하고, 상기 특정 정보는 상기 반복 횟수에 대한 정보에 기초하여 반복하여 전송될 수 있다. 즉, 상기 UE는 상기 UL grant에 기초하여 특정 정보를 5G 네트워크로 전송한다. 그리고, 특정 정보의 반복 전송은 주파수 호핑을 통해 수행되고, 첫 번째 특정 정보의 전송은 제 1 주파수 자원에서, 두 번째 특정 정보의 전송은 제 2 주파수 자원에서 전송될 수 있다. 상기 특정 정보는 6RB(Resource Block) 또는 1RB(Resource Block)의 협대역(narrowband)을 통해 전송될 수 있다.

앞서 살핀 5G 통신 기술은 후술할 본 명세서에서 제안하는 방법들과 결합되어 적용될 수 있으며, 또는 본 명세서에서 제안하는 방법들의 기술적 특징을 구체화하거나 명확하게 하는데 보충될 수 있다.

H. 빔 관리 (Beam Management, BM)

이하, H. 에서는 전술한 빔 관리 절차를 보다 구체적으로 설명한다.

BM 절차는 다운링크(downlink, DL) 및 업링크(uplink, UL) 송/수신에 사용될 수 있는 기지국(예: gNB, TRP 등) 및/또는 단말(예: UE) 빔들의 세트(set)를 획득하고 유지하기 위한 L1(layer 1)/L2(layer 2) 절차들로서, 아래와 같은 절차 및 용어를 포함할 수 있다.

- 빔 측정(beam measurement): 기지국 또는 UE가 수신된 빔 형성 신호의 특성을 측정하는 동작.

- 빔 결정(beam determination): 기지국 또는 UE가 자신의 송신 빔(Tx beam) / 수신 빔(Rx beam)을 선택하는 동작.

- 빔 스위핑 (Beam sweeping): 미리 결정된 방식으로 일정 시간 간격 동안 송신 및/또는 수신 빔을 이용하여 공간 영역을 커버하는 동작.

- 빔 보고(beam report): UE가 빔 측정에 기반하여 빔 형성된 신호의 정보를 보고하는 동작.

BM 절차는 (1) SS(synchronization signal)/PBCH(physical broadcast channel) Block 또는 CSI-RS를 이용하는 DL BM 절차와, (2) SRS(sounding reference signal)을 이용하는 UL BM 절차로 구분할 수 있다.

또한, 각 BM 절차는 Tx beam을 결정하기 위한 Tx beam sweeping과 Rx beam을 결정하기 위한 Rx beam sweeping을 포함할 수 있다.

H.1. DL BM

DL BM 절차는 (1) 기지국의 beamformed DL RS(reference signal)들(예: CSI-RS 또는 SS Block(SSB))에 대한 전송과, (2) 단말의 beam reporting을 포함할 수 있다.

여기서, beam reporting은 선호되는(preferred) DL RS ID(identifier)(s) 및 이에 대응하는 L1-RSRP(Reference Signal Received Power)를 포함할 수 있다.

상기 DL RS ID는 SSBRI(SSB Resource Indicator) 또는 CRI(CSI-RS Resource Indicator)일 수 있다.

도 5와 같이, SSB beam과 CSI-RS beam은 beam measurement를 위해 사용될 수 있다. 측정 메트릭(measurement metric)은 자원(resource)/블록(block) 별 L1-RSRP이다. SSB는 coarse한 beam measurement를 위해 사용되며, CSI-RS는 fine한 beam measurement를 위해 사용될 수 있다. SSB는 Tx beam sweeping과 Rx beam sweeping 모두에 사용될 수 있다.

SSB를 이용한 Rx beam sweeping은 다수의 SSB bursts에 걸쳐서(across) 동일 SSBRI에 대해 UE가 Rx beam을 변경하면서 수행될 수 있다. 여기서, 하나의 SS burst는 하나 또는 그 이상의 SSB들을 포함하고, 하나의 SS burst set은 하나 또는 그 이상의 SSB burst들을 포함한다.

H.1.1. SSB를 이용한 DL BM

도 6는 SSB를 이용한 DL BM 절차의 일례를 나타낸 흐름도이다.

SSB를 이용한 빔 보고(beam report)에 대한 설정은 RRC connected state(또는 RRC connected mode)에서 CSI/beam configuration 시에 수행된다.

- 단말은 BM을 위해 사용되는 SSB resource들을 포함하는 CSI-SSB-ResourceSetList를 포함하는 CSI-ResourceConfig IE를 기지국으로부터 수신한다(S410).

표 1은 CSI-ResourceConfig IE의 일례를 나타내며, 표 1과 같이, SSB를 이용한 BM configuration은 별도로 정의되지 않고, SSB를 CSI-RS resource처럼 설정한다.

표 1에서, csi-SSB-ResourceSetList parameter는 하나의 resource set에서 beam management 및 reporting을 위해 사용되는 SSB resource들의 리스트를 나타낸다. 여기서, SSB resource set은 {SSBx1, SSBx2, SSBx3, SSBx4, 쪋}으로 설정될 수 있다. SSB index는 0부터 63까지 정의될 수 있다.- 단말은 상기 CSI-SSB-ResourceSetList에 기초하여 SSB resource를 상기 기지국으로부터 수신한다(S420).

- SSBRI 및 L1-RSRP에 대한 보고와 관련된 CSI-RS reportConfig가 설정된 경우, 상기 단말은 best SSBRI 및 이에 대응하는 L1-RSRP를 기지국으로 (빔) report한다(S430).

즉, 상기 CSI-RS reportConfig IE의 reportQuantity가 'ssb-Index-RSRP'로 설정된 경우, 단말은 기지국으로 best SSBRI 및 이에 대응하는 L1-RSRP를 보고한다.

그리고, 단말은 SSB(SS/PBCH Block)와 동일한 OFDM 심볼(들)에서 CSI-RS resource가 설정되고, 'QCL-TypeD'가 적용 가능한 경우, 상기 단말은 CSI-RS와 SSB가 'QCL-TypeD' 관점에서 quasi co-located라고 가정할 수 있다.

여기서, 상기 QCL TypeD는 spatial Rx parameter 관점에서 antenna port들 간에 QCL되어 있음을 의미할 수 있다. 단말이 QCL Type D 관계에 있는 복수의 DL antenna port들을 수신 시에는 동일한 수신 빔을 적용하여도 무방하다. 또한, 단말은 SSB의 RE와 중첩하는 RE에서 CSI-RS가 설정될 것으로 기대하지 않는다.

H.1.2. CSI-RS를 이용한 DL BM

CSI-RS 용도에 대해 살펴보면, i) 특정 CSI-RS resource set에 repetition parameter가 설정되고, TRS_info가 설정되지 않은 경우, CSI-RS는 빔 관리(beam management)를 위해 사용된다. ii) repetition parameter가 설정되지 않고, TRS_info가 설정된 경우, CSI-RS는 TRS(tracking reference signal)을 위해 사용된다. iii) repetition parameter가 설정되지 않고, TRS_info가 설정되지 않은 경우, CSI-RS는 CSI acquisition을 위해 사용된다.

이러한, repetition parameter는 L1 RSRP 또는 'No Report(또는 None)'의 report를 가지는 CSI-ReportConfig와 연계된 CSI-RS resource set들에 대해서만 설정될 수 있다.

만약 단말이 reportQuantity가 'cri-RSRP' 또는 'none'으로 설정된 CSI-ReportConfig를 설정받고, 채널 측정을 위한 CSI-ResourceConfig (higher layer parameter resourcesForChannelMeasurement)가 higher layer parameter 'trs-Info'를 포함하지 않고, higher layer parameter 'repetition'이 설정된 NZP-CSI-RS-ResourceSet를 포함하는 경우, 상기 단말은 NZP-CSI-RS-ResourceSet 내의 모든 CSI-RS resource들에 대해 higher layer parameter 'nrofPorts'를 가지는 동일한 번호의 포트(1-port 또는 2-port)로만 구성될 수 있다.

(higher layer parameter) repetition이 'ON'으로 설정된 경우, 단말의 Rx beam sweeping 절차와 관련된다. 이 경우, 단말이 NZP-CSI-RS-ResourceSet을 설정받으면, 상기 단말은 NZP-CSI-RS-ResourceSet 내 적어도 하나의 CSI-RS resource는 동일한 downlink spatial domain transmission filter로 전송된다고 가정할 수 있다. 즉, NZP-CSI-RS-ResourceSet 내의 적어도 하나의 CSI-RS resource는 동일한 Tx beam을 통해 전송된다. 여기서, NZP-CSI-RS-ResourceSet 내 적어도 하나의 CSI-RS resource는 서로 다른 OFDM 심볼로 전송될 수 있다. 또한, 단말은 NZP-CSI-RS-Resourceset 내의 모든 CSI-RS resource들에서 periodicityAndOffset에 서로 다른 주기(periodicity)를 수신할 것으로 기대하지 않는다.

반면, Repetition이 'OFF'로 설정된 경우는 기지국의 Tx beam sweeping 절차와 관련된다. 이 경우, repetition이 'OFF'로 설정되면, 단말은 NZP-CSI-RS-ResourceSet 내의 적어도 하나의 CSI-RS resource가 동일한 downlink spatial domain transmission filter로 전송된다고 가정하지 않는다. 즉, NZP-CSI-RS-ResourceSet 내의 적어도 하나의 CSI-RS resource는 서로 다른 Tx beam을 통해 전송된다.

도 7은 CSI-RS를 이용한 DL BM 절차의 일례를 나타낸다. 도 7의 (a)는 단말의 Rx beam 결정(또는 refinement) 절차를 나타내며, 도 7의 (b)는 기지국의 Tx beam sweeping 절차를 나타낸다. 또한, 도 7의 (a)는, repetition parameter가 'ON'으로 설정된 경우이고, 도 7의 (b)는, repetition parameter가 'OFF'로 설정된 경우이다.

도 7의 (a) 및 도 8를 참고하여, 단말의 Rx beam 결정 과정에 대해 살펴본다.

도 8는 단말의 수신 빔 결정 과정의 일례를 나타낸 흐름도이다.

- 단말은 higher layer parameter repetition을 포함하는 NZP CSI-RS resource set IE를 RRC signaling을 통해 기지국으로부터 수신한다(S610). 여기서, 상기 repetition parameter는 'ON'으로 설정된다.

- 단말은 repetition 'ON'으로 설정된 CSI-RS resource set 내의 resource(들)을 기지국의 동일 Tx beam(또는 DL spatial domain transmission filter)을 통해 서로 다른 OFDM 심볼에서 반복 수신한다(S620).

- 단말은 자신의 Rx beam을 결정한다(S630).

- 단말은 CSI report를 생략한다(S640). 이 경우, CSI report config의 reportQuantity는 'No report(또는 None)'로 설정될 수 있다.

즉, 상기 단말은 repetition 'ON'으로 설정된 경우, CSI report를 생략할 수 있다.

도 7의 (b) 및 도 9를 참고하여, 기지국의 Tx beam 결정 과정에 대해 살펴본다.

- 단말은 higher layer parameter repetition을 포함하는 NZP CSI-RS resource set IE를 RRC signaling을 통해 기지국으로부터 수신한다(S710). 여기서, 상기 repetition parameter는 'OFF'로 설정되며, 기지국의 Tx beam sweeping 절차와 관련된다.

- 단말은 repetition 'OFF'로 설정된 CSI-RS resource set 내의 resource들을 기지국의 서로 다른 Tx beam(DL spatial domain transmission filter)을 통해 수신한다(S720).

- 단말은 최상의(best) beam을 선택(또는 결정)한다(S740)

- 단말은 선택된 빔에 대한 ID 및 관련 품질 정보(예: L1-RSRP)를 기지국으로 보고한다(S740). 이 경우, CSI report config의 reportQuantity는 'CRI + L1-RSRP'로 설정될 수 있다.

즉, 상기 단말은 CSI-RS가 BM을 위해 전송되는 경우 CRI와 이에 대한 L1-RSRP를 기지국으로 보고한다.

즉, CSI-RS resource set에 repetition 'ON'이 설정된 경우, 복수의 CSI-RS resource들이 동일한 송신 빔을 적용하여 반복하여 사용되고, CSI-RS resource set에 repetition 'OFF'가 설정된 경우, 서로 다른 CSI-RS resource들이 서로 다른 송신 빔으로 전송되는 것을 볼 수 있다.

H.1.3. DL BM 관련 빔 지시 (Beam Indication)

단말은 적어도 QCL(Quasi Co-location) indication의 목적을 위해 최대 M 개의 후보(candidate) 전송 설정 지시 (Transmission Configuration Indication, TCI) 상태(state)들에 대한 리스트를 RRC 설정받을 수 있다. 여기서, M은 64일 수 있다.

각 TCI state는 하나의 RS set으로 설정될 수 있다. 적어도 RS set 내의 spatial QCL 목적(QCL Type D)을 위한 DL RS의 각각의 ID는 SSB, P-CSI RS, SP-CSI RS, A-CSI RS 등의 DL RS type들 중 하나를 참조할 수 있다.

최소한 spatial QCL 목적을 위해 사용되는 RS set 내의 DL RS(들)의 ID의 초기화(initialization)/업데이트(update)는 적어도 명시적 시그널링(explicit signaling)을 통해 수행될 수 있다.

표 2는 TCI-State IE의 일례를 나타낸다.

TCI-State IE는 하나 또는 두 개의 DL reference signal(RS) 대응하는 quasi co-location (QCL) type과 연관시킨다.

표 2에서, bwp-Id parameter는 RS가 위치되는 DL BWP를 나타내며, cell parameter는 RS가 위치되는 carrier를 나타내며, referencesignal parameter는 해당 target antenna port(s)에 대해 quasi co-location 의 source가 되는 reference antenna port(s) 혹은 이를 포함하는reference signal을 나타낸다. 상기 target antenna port(s)는 CSI-RS, PDCCH DMRS, 또는 PDSCH DMRS 일 수 있다. 일례로 NZP CSI-RS에 대한 QCL reference RS정보를 지시하기 위해 NZP CSI-RS 자원 설정 정보에 해당 TCI state ID를 지시할 수 있다. 또 다른 일례로 PDCCH DMRS antenna port(s)에 대한 QCL reference 정보를 지시하기 위해 각 CORESET설정에 TCI state ID를 지시할 수 있다. 또 다른 일례로 PDSCH DMRS antenna port(s)에 대한 QCL reference 정보를 지시하기 위해 DCI를 통해 TCI state ID를 지시할 수 있다.

H.1.4. QCL(Quasi-Co Location)

안테나 포트는 안테나 포트 상의 심볼이 운반되는 채널이 동일한 안테나 포트 상의 다른 심볼이 운반되는 채널로부터 추론될 수 있도록 정의된다. 하나의 안테나 포트 상의 심볼이 운반되는 채널의 특성(property)이 다른 안테나 포트 상의 심볼이 운반되는 채널로부터 유추될 수 있는 경우, 2 개의 안테나 포트는 QC/QCL(quasi co-located 혹은 quasi co-location) 관계에 있다고 할 수 있다.

여기서, 상기 채널 특성은 지연 확산(Delay spread), 도플러 확산(Doppler spread), 주파수/도플러 쉬프트(Frequency/Doppler shift), 평균 수신 파워(Average received power), 수신 타이밍/평균지연(Received Timing / average delay), Spatial RX parameter 중 하나 이상을 포함한다. 여기서 Spatial Rx parameter는 angle of arrival과 같은 공간적인 (수신) 채널 특성 파라미터를 의미한다.

단말은 해당 단말 및 주어진 serving cell에 대해 의도된 DCI를 가지는 검출된 PDCCH에 따라 PDSCH를 디코딩하기 위해, higher layer parameter PDSCH-Config 내 M 개까지의 TCI-State configuration의 리스트로 설정될 수 있다. 상기 M은 UE capability에 의존한다.

각각의 TCI-State는 하나 또는 두 개의 DL reference signal과 PDSCH의 DM-RS port 사이의 quasi co-location 관계를 설정하기 위한 파라미터를 포함한다.

Quasi co-location 관계는 첫 번째 DL RS에 대한 higher layer parameter qcl-Type1과 두 번째 DL RS에 대한 qcl-Type2 (설정된 경우)로 설정된다. 두 개의 DL RS의 경우, reference가 동일한 DL RS 또는 서로 다른 DL RS인지에 관계없이 QCL type은 동일하지 않다.

각 DL RS에 대응하는 quasi co-location type은 QCL-Info의 higher layer parameter qcl-Type에 의해 주어지며, 다음 값 중 하나를 취할 수 있다:

- 'QCL-TypeA': {Doppler shift, Doppler spread, average delay, delay spread}

- 'QCL-TypeB': {Doppler shift, Doppler spread}

- 'QCL-TypeC': {Doppler shift, average delay}

- 'QCL-TypeD': {Spatial Rx parameter}

예를 들어, target antenna port가 특정 NZP CSI-RS 인 경우, 해당 NZP CSI-RS antenna ports는 QCL-Type A관점에서는 특정 TRS와, QCL-Type D관점에서는 특정 SSB과 QCL되었다고 지시/설정될 수 있다. 이러한 지시/설정을 받은 단말은 QCL-TypeA TRS에서 측정된 Doppler, delay값을 이용해서 해당 NZP CSI-RS를 수신하고, QCL-TypeD SSB 수신에 사용된 수신 빔을 해당 NZP CSI-RS 수신에 적용할 수 있다.

UE는 8개까지의 TCI state들을 DCI 필드 'Transmission Configuration Indication'의 codepoint에 매핑하기 위해 사용되는 MAC CE signaling에 의한 activation command를 수신할 수 있다.

H.2. UL BM

UL BM은 단말 구현에 따라 Tx beam - Rx beam 간 beam reciprocity(또는 beam correspondence)가 성립할 수 있거나 또는, 성립하지 않을 수 있다. 만약 기지국과 단말 모두에서 Tx beam - Rx beam 간 reciprocity가 성립하는 경우, DL beam pair를 통해 UL beam pair를 맞출 수 있다. 하지만, 기지국과 단말 중 어느 하나라도 Tx beam - Rx beam 간 reciprocity가 성립하지 않는 경우, DL beam pair 결정과 별개로 UL beam pair 결정 과정이 필요하다.

또한, 기지국과 단말 모두 beam correspondence를 유지하고 있는 경우에도, 단말이 선호(preferred) beam의 보고를 요청하지 않고도 기지국은 DL Tx beam 결정을 위해 UL BM 절차를 사용할 수 있다.

UL BM은 beamformed UL SRS 전송을 통해 수행될 수 있으며, SRS resource set의 UL BM의 적용 여부는 (higher layer parameter) usage에 의해 설정된다. usage가 'BeamManagement(BM)'로 설정되면, 주어진 time instant에 복수의 SRS resource set들 각각에 하나의 SRS resource만 전송될 수 있다.

단말은 (higher layer parameter) SRS-ResourceSet에 의해 설정되는 하나 또는 그 이상의 Sounding Reference Symbol (SRS) resource set들을 (higher layer signaling, RRC signaling 등을 통해) 설정받을 수 있다. 각각의 SRS resource set에 대해, UE는 K≥1 SRS resource들 (higher later parameter SRS-resource)이 설정될 수 있다. 여기서, K는 자연수이며, K의 최대 값은 SRS_capability에 의해 지시된다.

DL BM과 마찬가지로, UL BM 절차도 단말의 Tx beam sweeping과 기지국의 Rx beam sweeping으로 구분될 수 있다.

도 11은 SRS를 이용한 UL BM 절차의 일례를 나타낸다. 도 11의 (a)는 기지국의 Rx beam 결정 절차를 나타내고, 도 11의 (b)는 단말의 Tx beam sweeping 절차를 나타낸다.

도 12은 SRS를 이용한 UL BM 절차의 일례를 나타낸 흐름도이다.

- 단말은 'beam management'로 설정된 (higher layer parameter) usage parameter를 포함하는 RRC signaling(예: SRS-Config IE)를 기지국으로부터 수신한다(S1010).

표 3은 SRS-Config IE(Information Element)의 일례를 나타내며, SRS-Config IE는 SRS 전송 설정을 위해 사용된다. SRS-Config IE는 SRS-Resources의 list와 SRS-ResourceSet들의 list를 포함한다. 각 SRS resource set는 SRS-resource들의 set를 의미한다.

네트워크는 설정된 aperiodicSRS-ResourceTrigger (L1 DCI)를 사용하여 SRS resource set의 전송을 트리거할 수 있다.

표 3에서, usage는 SRS resource set이 beam management를 위해 사용되는지, codebook 기반 또는 non-codebook 기반 전송을 위해 사용되는지를 지시하는 higher layer parameter를 나타낸다. usage parameter는 L1 parameter 'SRS-SetUse'에 대응한다. 'spatialRelationInfo'는 reference RS와 target SRS 사이의 spatial relation의 설정을 나타내는 parameter이다. 여기서, reference RS는 L1 parameter 'SRS-SpatialRelationInfo'에 해당하는 SSB, CSI-RS 또는 SRS가 될 수 있다. 상기, usage는 SRS resource set 별로 설정된다.- 단말은 상기 SRS-Config IE에 포함된 SRS-SpatialRelation Info에 기초하여 전송할 SRS resource에 대한 Tx beam을 결정한다(S1020). 여기서, SRS-SpatialRelation Info는 SRS resource 별로 설정되고, SRS resource 별로 SSB, CSI-RS 또는 SRS에서 사용되는 beam과 동일한 beam을 적용할지를 나타낸다. 또한, 각 SRS resource에 SRS-SpatialRelationInfo가 설정되거나 또는 설정되지 않을 수 있다.

- 만약 SRS resource에 SRS-SpatialRelationInfo가 설정되면 SSB, CSI-RS 또는 SRS에서 사용되는 beam과 동일한 beam을 적용하여 전송한다. 하지만, SRS resource에 SRS-SpatialRelationInfo가 설정되지 않으면, 상기 단말은 임의로 Tx beam을 결정하여 결정된 Tx beam을 통해 SRS를 전송한다(S1030).

보다 구체적으로, 'SRS-ResourceConfigType'가 'periodic'으로 설정된 P-SRS에 대해:

i) SRS-SpatialRelationInfo가 'SSB/PBCH'로 설정되는 경우, UE는 SSB/PBCH의 수신을 위해 사용한 spatial domain Rx filter와 동일한 (혹은 해당 filter로부터 생성된) spatial domain transmission filter를 적용하여 해당 SRS resource를 전송한다; 또는

ii) SRS-SpatialRelationInfo가 'CSI-RS'로 설정되는 경우, UE는 periodic CSI-RS 또는 SP CSI-RS의 수신을 위해 사용되는 동일한 spatial domain transmission filter를 적용하여 SRS resource를 전송한다; 또는

iii) SRS-SpatialRelationInfo가 'SRS'로 설정되는 경우, UE는 periodic SRS의 전송을 위해 사용된 동일한 spatial domain transmission filter를 적용하여 해당 SRS resource를 전송한다.

‘SRS-ResourceConfigType'이 'SP-SRS' 또는 'AP-SRS'로 설정된 경우에도 위와 유사하게 빔 결정 및 전송 동작이 적용될 수 있다.

- 추가적으로, 단말은 기지국으로부터 SRS에 대한 feedback을 다음 3가지 경우와 같이, 수신받거나 또는 수신받지 않을 수 있다(S1040).

i) SRS resource set 내의 모든 SRS resource들에 대해 Spatial_Relation_Info가 설정되는 경우, 단말은 기지국이 지시한 빔으로 SRS를 전송한다. 예를 들어, Spatial_Relation_Info가 모두 동일한 SSB, CRI 또는 SRI를 지시하는 경우, 단말은 동일 빔으로 SRS를 반복 전송한다. 이 경우는, 기지국이 Rx beam을 selection하는 용도로서 도 G(a)에 대응한다.

ii) SRS resource set 내의 모든 SRS resource들에 대해 Spatial_Relation_Info가 설정되지 않을 수 있다. 이 경우, 단말은 자유롭게 SRS beam을 바꾸어가면서 전송할 수 있다. 즉, 이 경우는 단말이 Tx beam을 sweeping하는 용도로서, 도 G(b)에 대응한다.

iii) SRS resource set 내의 일부 SRS resource들에 대해서만 Spatial_Relation_Info가 설정될 수 있다. 이 경우, 설정된 SRS resource에 대해서는 지시된 빔으로 SRS를 전송하고, Spatial_Relation_Info가 설정되지 않은 SRS resource에 대해서는 단말이 임의로 Tx beam을 적용해서 전송할 수 있다.

I. CSI 관련 동작

NR(New Radio) 시스템에서, CSI-RS(channel state information-reference signal)은 시간 및/또는 주파수 트래킹(time/frequency tracking), CSI 계산(computation), L1(layer 1)-RSRP(reference signal received power) 계산(computation) 및 이동성(mobility)를 위해 사용된다. 여기서, CSI computation은 CSI 획득(acquisition)과 관련되며, L1-RSRP computation은 빔 관리(beam management, BM)와 관련된다.

CSI(channel state information)은 단말과 안테나 포트 사이에 형성되는 무선 채널(혹은 링크라고도 함)의 품질을 나타낼 수 있는 정보를 통칭한다.

도 13은 CSI 관련 절차의 일례를 나타낸 흐름도이다.

- 상기와 같은 CSI-RS의 용도 중 하나를 수행하기 위해, 단말(예: user equipment, UE)은 CSI와 관련된 설정(configuration) 정보를 RRC(radio resource control) signaling을 통해 기지국(예: general Node B, gNB)으로부터 수신한다(S110).

상기 CSI와 관련된 configuration 정보는 CSI-IM(interference management) 자원(resource) 관련 정보, CSI 측정 설정(measurement configuration) 관련 정보, CSI 자원 설정(resource configuration) 관련 정보, CSI-RS 자원(resource) 관련 정보 또는 CSI 보고 설정(report configuration) 관련 정보 중 적어도 하나를 포함할 수 있다.

i) CSI-IM 자원 관련 정보는 CSI-IM 자원 정보(resource information), CSI-IM 자원 세트 정보(resource set information) 등을 포함할 수 있다. CSI-IM resource set은 CSI-IM resource set ID(identifier)에 의해 식별되며, 하나의 resource set은 적어도 하나의 CSI-IM resource를 포함한다. 각각의 CSI-IM resource는 CSI-IM resource ID에 의해 식별된다.

ii) CSI resource configuration 관련 정보는 CSI-ResourceConfig IE로 표현될 수 있다. CSI resource configuration 관련 정보는 NZP(non zero power) CSI-RS resource set, CSI-IM resource set 또는 CSI-SSB resource set 중 적어도 하나를 포함하는 그룹을 정의한다. 즉, 상기 CSI resource configuration 관련 정보는 CSI-RS resource set list를 포함하며, 상기 CSI-RS resource set list는 NZP CSI-RS resource set list, CSI-IM resource set list 또는 CSI-SSB resource set list 중 적어도 하나를 포함할 수 있다. CSI-RS resource set은 CSI-RS resource set ID에 의해 식별되고, 하나의 resource set은 적어도 하나의 CSI-RS resource를 포함한다. 각각의 CSI-RS resource는 CSI-RS resource ID에 의해 식별된다.

표 4에서와 같이, NZP CSI-RS resource set 별로 CSI-RS의 용도를 나타내는 parameter들(예: BM 관련 'repetition' parameter, tracking 관련 'trs-Info' parameter)이 설정될 수 있다.

표 4은 NZP CSI-RS resource set IE의 일례를 나타낸다.

그리고, higher layer parameter에 해당하는 repetition parameter는 L1 parameter의 'CSI-RS-ResourceRep'에 대응한다.iii) CSI 보고 설정(report configuration) 관련 정보는 시간 영역 행동(time domain behavior)을 나타내는 보고 설정 타입(reportConfigType) parameter 및 보고하기 위한 CSI 관련 quantity를 나타내는 보고량(reportQuantity) parameter를 포함한다. 상기 시간 영역 동작(time domain behavior)은 periodic, aperiodic 또는 semi-persistent일 수 있다.

CSI report configuration 관련 정보는 CSI-ReportConfig IE로 표현될 수 있으며, 아래 표 5는 CSI-ReportConfig IE의 일례를 나타낸다.

- 단말은 상기 CSI와 관련된 configuration 정보에 기초하여 CSI를 측정(measurement)한다(S120). 상기 CSI 측정은 (1) 단말의 CSI-RS 수신 과정(S121)과, (2) 수신된 CSI-RS를 통해 CSI를 계산(computation)하는 과정(S122)을 포함할 수 있으며, 이에 대하여 구체적인 설명은 후술한다.

CSI-RS는 higher layer parameter CSI-RS-ResourceMapping에 의해 시간(time) 및 주파수(frequency) 영역에서 CSI-RS resource의 RE(resource element) 매핑이 설정된다.

표 6은 CSI-RS-ResourceMapping IE의 일례를 나타낸다.

표 6에서, 밀도(density, D)는 RE/port/PRB(physical resource block)에서 측정되는 CSI-RS resource의 density를 나타내며, nrofPorts는 안테나 포트의 개수를 나타낸다.

- 단말은 상기 측정된 CSI를 기지국으로 보고(report)한다(S130).

여기서, 표 6의 CSI-ReportConfig의 quantity가 'none(또는 No report)'로 설정된 경우, 상기 단말은 상기 report를 생략할 수 있다.

다만, 상기 quantity가 'none(또는 No report)'로 설정된 경우에도 상기 단말은 기지국으로 report를 할 수도 있다.

상기 quantity가 'none'으로 설정된 경우는 aperiodic TRS를 trigger하는 경우 또는 repetition이 설정된 경우이다.

여기서, repetition이 'ON'으로 설정된 경우에만 상기 단말의 report를 생략할 수 있다.

I.1. CSI 측정

NR 시스템은 보다 유연하고 동적인 CSI measurement 및 reporting을 지원한다. 여기서, 상기 CSI measurement는 CSI-RS를 수신하고, 수신된 CSI-RS를 computation하여 CSI를 acquisition하는 절차를 포함할 수 있다.

CSI measurement 및 reporting의 time domain behavior로서, aperiodic/semi-persistent/periodic CM(channel measurement) 및 IM(interference measurement)이 지원된다. CSI-IM의 설정을 위해 4 port NZP CSI-RS RE pattern을 이용한다.

NR의 CSI-IM 기반 IMR은 LTE의 CSI-IM과 유사한 디자인을 가지며, PDSCH rate matching을 위한 ZP CSI-RS resource들과는 독립적으로 설정된다. 그리고, NZP CSI-RS 기반 IMR에서 각각의 port는 (바람직한 channel 및) precoded NZP CSI-RS를 가진 interference layer를 emulate한다. 이는, multi-user case에 대해 intra-cell interference measurement에 대한 것으로, MU interference를 주로 target 한다.

기지국은 설정된 NZP CSI-RS 기반 IMR의 각 port 상에서 precoded NZP CSI-RS를 단말로 전송한다.

단말은 resource set에서 각각의 port에 대해 channel / interference layer를 가정하고 interference를 측정한다.

채널에 대해, 어떤 PMI 및 RI feedback도 없는 경우, 다수의 resource들은 set에서 설정되며, 기지국 또는 네트워크는 channel / interference measurement에 대해 NZP CSI-RS resource들의 subset을 DCI를 통해 지시한다.

resource setting 및 resource setting configuration에 대해 보다 구체적으로 살펴본다.

I.1.1 자원 세팅

각각의 CSI resource setting 'CSI-ResourceConfig'는 (higher layer parameter csi-RS-ResourceSetList에 의해 주어진) S≥1 CSI resource set에 대한 configuration을 포함한다. CSI resource setting은 CSI-RS- resourcesetlist에 대응한다. 여기서, S는 설정된 CSI-RS resource set의 수를 나타낸다. 여기서, S≥1 CSI resource set에 대한 configuration은 (NZP CSI-RS 또는 CSI-IM으로 구성된) CSI-RS resource들을 포함하는 각각의 CSI resource set과 L1-RSRP computation에 사용되는 SS/PBCH block (SSB) resource를 포함한다.

각 CSI resource setting은 higher layer parameter bwp-id로 식별되는 DL BWP(bandwidth part)에 위치된다. 그리고, CSI reporting setting에 링크된 모든 CSI resource setting들은 동일한 DL BWP를 갖는다.

CSI-ResourceConfig IE에 포함되는 CSI resource setting 내에서 CSI-RS resource의 time domain behavior는 higher layer parameter resourceType에 의해 지시되며, aperiodic, periodic 또는 semi-persistent로 설정될 수 있다. Periodic 및 semi-persistent CSI resource setting에 대해, 설정된 CSI-RS resource set의 수(S)는 '1'로 제한된다. Periodic 및 semi-persistent CSI resource setting에 대해, 설정된 주기(periodicity) 및 슬롯 오프셋(slot offset)은 bwp-id에 의해 주어지는 것과 같이, 연관된 DL BWP의 numerology에서 주어진다.

UE가 동일한 NZP CSI-RS resource ID를 포함하는 다수의 CSI-ResourceConfig들로 설정될 때, 동일한 time domain behavior는 CSI-ResourceConfig에 대해 설정된다.

UE가 동일한 CSI-IM resource ID를 포함하는 다수의 CSI-ResourceConfig들로 설정될 때, 동일한 time domain behavior는 CSI-ResourceConfig에 대해 설정된다.

다음은 channel measurement (CM) 및 interference measurement(IM)을 위한 하나 또는 그 이상의 CSI resource setting들은 higher layer signaling을 통해 설정된다.

- interference measurement에 대한 CSI-IM resource.

- interference measurement에 대한 NZP CSI-RS 자원.

- channel measurement에 대한 NZP CSI-RS 자원.

즉, CMR(channel measurement resource)는 CSI acquisition을 위한 NZP CSI-RS일 수 있으며, IMR(Interference measurement resource)는 CSI-IM과 IM을 위한 NZP CSI-RS일 수 있다.

여기서, CSI-IM(또는 IM을 위한 ZP CSI-RS)는 주로 inter-cell interference measurement에 대해 사용된다.

그리고, IM을 위한 NZP CSI-RS는 주로 multi-user로부터 intra-cell interference measurement를 위해 사용된다.

UE는 채널 측정을 위한 CSI-RS resource(들) 및 하나의 CSI reporting을 위해 설정된 interference measurement를 위한 CSI-IM / NZP CSI-RS resource(들)이 자원 별로 'QCL-TypeD'라고 가정할 수 있다.

I.1.2 자원 세팅 설정

살핀 것처럼, resource setting은 resource set list를 의미할 수 있다.

aperiodic CSI에 대해, higher layer parameter CSI-AperiodicTriggerState를 사용하여 설정되는 각 트리거 상태(trigger state)는 각각의 CSI-ReportConfig가 periodic, semi-persistent 또는 aperiodic resource setting에 링크되는 하나 또는 다수의 CSI-ReportConfig와 연관된다.

하나의 reporting setting은 최대 3개까지의 resource setting과 연결될 수 있다.

- 하나의 resource setting이 설정되면, (higher layer parameter resourcesForChannelMeasurement에 의해 주어지는) resource setting 은 L1-RSRP computation을 위한 channel measurement에 대한 것이다.

- 두 개의 resource setting들이 설정되면, (higher layer parameter resourcesForChannelMeasurement에 의해 주어지는) 첫 번째 resource setting은 channel measurement를 위한 것이고, (csi-IM-ResourcesForInterference 또는 nzp-CSI-RS -ResourcesForInterference에 의해 주어지는) 두 번째 resource setting은 CSI-IM 또는 NZP CSI-RS 상에서 수행되는 interference measurement를 위한 것이다.

- 세 개의 resource setting들이 설정되면, (resourcesForChannelMeasurement에 의해 주어지는) 첫 번째 resource setting은 channel measurement를 위한 것이고, (csi-IM-ResourcesForInterference에 의해 주어지는) 두 번째 resource setting은 CSI-IM 기반 interference measurement를 위한 것이고, (nzp-CSI-RS-ResourcesForInterference에 의해 주어지는) 세 번째 resource setting 은 NZP CSI-RS 기반 interference measurement를 위한 것이다.

Semi-persistent 또는 periodic CSI에 대해, 각 CSI-ReportConfig는 periodic 또는 semi-persistent resource setting에 링크된다.

- (resourcesForChannelMeasurement에 의해 주어지는) 하나의 resource setting 이 설정되면, 상기 resource setting은 L1-RSRP computation을 위한 channel measurement에 대한 것이다.

- 두 개의 resource setting들이 설정되면, (resourcesForChannelMeasurement에 의해 주어지는) 첫 번째 resource setting은 channel measurement를 위한 것이며, (higher layer parameter csi-IM-ResourcesForInterference에 의해 주어지는) 두 번째 resource setting은 CSI-IM 상에서 수행되는 interference measurement를 위해 사용된다.

I.1.3 CSI 계산

간섭 측정이 CSI-IM 상에서 수행되면, 채널 측정을 위한 각각의 CSI-RS resource는 대응하는 resource set 내에서 CSI-RS resource들 및 CSI-IM resource들의 순서에 의해 CSI-IM resource와 자원 별로 연관된다. 채널 측정을 위한 CSI-RS resource의 수는 CSI-IM resource의 수와 동일하다.

그리고, interference measurement가 NZP CSI-RS에서 수행되는 경우, UE는 채널 측정을 위한 resource setting 내에서 연관된 resource set에서 하나 이상의 NZP CSI-RS resource로 설정될 것으로 기대하지 않는다.

Higher layer parameter nzp-CSI-RS-ResourcesForInterference가 설정된 단말은 NZP CSI-RS resource set 내에 18 개 이상의 NZP CSI-RS port가 설정될 것으로 기대하지 않는다.

CSI 측정을 위해, 단말은 아래 사항을 가정한다.

- 간섭 측정을 위해 설정된 각각의 NZP CSI-RS port는 간섭 전송 계층에 해당한다.

- 간섭 측정을 위한 NZP CSI-RS port의 모든 간섭 전송 레이어는 EPRE(energy per resource element) 비율을 고려한다.

- 채널 측정을 위한 NZP CSI-RS resource의 RE(s) 상에서 다른 간섭 신호, 간섭 측정을 위한 NZP CSI-RS resource 또는 간섭 측정을 위한 CSI-IM resource.

I.2. CSI 보고

CSI 보고를 위해, UE가 사용할 수 있는 time 및 frequency 자원은 기지국에 의해 제어된다.

CSI(channel state information)은 채널 품질 지시자(channel quality indicator, CQI), 프리코딩 행렬 지시자 (precoding matrix indicator, PMI), CSI-RS resource indicator (CRI), SS/PBCH block resource indicator (SSBRI), layer indicator (LI), rank indicator (RI) 또는 L1-RSRP 중 적어도 하나를 포함할 수 있다.

CQI, PMI, CRI, SSBRI, LI, RI, L1-RSRP에 대해, 단말은 N≥1 CSI-ReportConfig reporting setting, M≥1 CSI-ResourceConfig resource setting 및 하나 또는 두 개의 trigger state들의 리스트(aperiodicTriggerStateList 및 semiPersistentOnPUSCH-TriggerStateList에 의해 제공되는)로 higher layer에 의해 설정된다. 상기 aperiodicTriggerStateList에서 각 trigger state는 channel 및 선택적으로 interference 대한 resource set ID들을 지시하는 연관된 CSI-ReportConfigs 리스트를 포함한다. semiPersistentOnPUSCH-TriggerStateList에서 각 trigger state는 하나의 연관된 CSI-ReportConfig가 포함된다.

그리고, CSI reporting의 time domain behavior는 periodic, semi-persistent, aperiodic을 지원한다.

i) periodic CSI reporting은 short PUCCH, long PUCCH 상에서 수행된다. Periodic CSI reporting의 주기(periodicity) 및 슬롯 오프셋(slot offset)은 RRC로 설정될 수 있으며, CSI-ReportConfig IE를 참고한다.

ii) SP(semi-periodic) CSI reporting은 short PUCCH, long PUCCH, 또는 PUSCH 상에서 수행된다.

Short/long PUCCH 상에서 SP CSI인 경우, 주기(periodicity) 및 슬롯 오프셋(slot offset)은 RRC로 설정되며, 별도의 MAC CE / DCI로 CSI 보고가 activation/deactivation 된다.

PUSCH 상에서 SP CSI인 경우, SP CSI reporting의 periodicity는 RRC로 설정되지만, slot offset은 RRC로 설정되지 않으며, DCI(format 0_1)에 의해 SP CSI reporting은 활성화/비활성화(activation/deactivation)된다. PUSCH 상에서 SP CSI reporting에 대해, 분리된 RNTI(SP-CSI C-RNTI)가 사용된다.

최초 CSI 보고 타이밍은 DCI에서 지시되는 PUSCH time domain allocation 값을 따르며, 후속되는 CSI 보고 타이밍은 RRC로 설정된 주기에 따른다.

DCI format 0_1은 CSI request field를 포함하고, 특정 configured SP-CSI trigger state를 activation/deactivation할 수 있다. SP CSI reporting은, SPS PUSCH 상에서 data 전송을 가진 mechanism과 동일 또는 유사한 활성화/비활성화를 가진다.

iii) aperiodic CSI reporting은 PUSCH 상에서 수행되며, DCI에 의해 trigger된다. 이 경우, aperiodic CSI reporting의 trigger와 관련된 정보는 MAC-CE를 통해 전달/지시/설정될 수 있다.

AP CSI-RS를 가지는 AP CSI의 경우, AP CSI-RS timing은 RRC에 의해 설정되고, AP CSI reporting에 대한 timing은 DCI에 의해 동적으로 제어된다.

NR은 LTE에서 PUCCH 기반 CSI 보고에 적용되었던 다수의 reporting instance들에서 CSI를 나누어 보고하는 방식 (예를 들어, RI, WB PMI/CQI, SB PMI/CQI 순서로 전송)이 적용되지 않는다. 대신, NR은 short/long PUCCH에서 특정 CSI 보고를 설정하지 못하도록 제한하고, CSI omission rule이 정의된다. 그리고, AP CSI reporting timing과 관련하여, PUSCH symbol/slot location은 DCI에 의해 동적으로 지시된다. 그리고, candidate slot offset들은 RRC에 의해 설정된다. CSI reporting에 대해, slot offset(Y)는 reporting setting 별로 설정된다. UL-SCH에 대해, slot offset K2는 별개로 설정된다.

2개의 CSI latency class(low latency class, high latency class)는 CSI computation complexity의 관점에서 정의된다. Low latency CSI의 경우, 최대 4 ports Type-I codebook 또는 최대 4-ports non-PMI feedback CSI를 포함하는 WB CSI이다. High latency CSI는 low latency CSI를 제외한 다른 CSI를 말한다. Normal 단말에 대해, (Z, Z')는 OFDM symbol들의 unit에서 정의된다. 여기서, Z는 Aperiodic CSI triggering DCI를 수신한 후 CSI 보고를 수행하기 까지의 최소 CSI processing time을 나타낸다. 또한, Z'는 channel/interference에 대한 CSI-RS를 수신한 후 CSI 보고를 수행하기까지의 최소 CSI processing time을 나타낸다.

추가적으로, 단말은 동시에 calculation할 수 있는 CSI의 개수를 report한다.

J. 본 명세서의 주요 실시예들

앞서 살핀 5G 통신 기술은 후술할 본 명세서에서 제안되는 방법들과 결합되어 적용될 수 있으며, 또는 본 명세서에서 제안하는 방법들의 기술적 특징을 구체화하거나 명확하게 하는데 보충될 수 있다. 한편, 본 명세서에서 제안하는 온-디바이스 기반 기계학습은 앞서 설명한 5G 통신 기술뿐만 아니라, 3G, 4G 및/또는 6G 통신 기술에 의한 통신 서비스와 결합되어 적용될 수도 있다.

종래의 대부분의 통신 시스템은 물리적 채널을 통계적 모델로 근사화하고 이에 기반하여 수학적 송수신 모델을 도출함으로써 설계되고 최적화되고 있다.

각 사용자가 처한 채널 환경에서 다양한 서비스가 요구하는 QoS에 최적화할 수 있는 유연한 통신 시스템을 실현하기 위해서는 새로운 접근 방식이 필요하다.

최근 영상 및 음성 인식을 중심으로 다양한 분야에서 괄목할 만한 성과를 보여주고 있는 기계 학습 (Machine Learning, ML), 그 중에서도 특히 심층 학습(Deep Learning, DL) 기술을 통신에 적용하고자 하는 다양한 연구가 진행되고 있다.

채널 추정, 신호 검출 등 물리 계층 신호 처리에도 기계 학습, 그 중에서도 특히 심층 학습을 적용하고자 하는 연구가 점점 활발해지고 있으며, 실제로 무선 통신 송수신 일부 또는 전체를 심층 신경망 등 기계 학습 모델로 대체할 수 있음을 보여주고 있다. 이러한 접근 방식은 수학적 모델을 기반으로 한 기존의 통신 시스템이 가지고 있는 한계를 극복할 수 있는 새로운 대안이 될 수 있다.

한편, 최근 가장 각광받고 있는 심층 학습을 포함하여 많은 기계 학습 알고리즘은 많은 양의 학습 데이터와 학습 중 높은 연산 복잡도를 필요로 하며, 이런 이유로 학습은 고용량 서버나 클라우드(Cloud)에서 수행하고, 실제 사용 환경에서는 학습이 완료된 모델을 이용한 추정(inference)만을 수행하는 경우가 대부분이다.

도 14를 참조하면, 본 명세서에서는 수학적 송수신 모델을 기계 학습에 의한 학습 모델로 대체하는 방식이 제안된다. 예를 들어, 컴퓨팅 디바이스가 채널 모델에서 획득된 학습 데이터를 이용하여 학습 모델을 생성하면, 생성된 학습 모델을 기계 학습 기반의 통신 시스템으로 전송하여, 수학적 모델링에 비해 보다 적응적인 무선 통신 시스템을 제공할 수 있다.

한편, 물리 계층에 기계 학습, 특히 심층 학습을 적용하고자 하는 대부분의 연구도 학습은 시뮬레이터 등을 이용하여 서버나 PC 등에서 수행하고, 실제 통신 시스템에는 학습이 완료된 모델을 적용하는 접근 방식을 취하고 있다.

하지만, 실제 통신 시스템에서의 학습이 없이는 여전히 각 사용자가 처한 환경과 시나리오에 최적화된 성능을 제공하기 어렵다는 한계가 존재한다. 예를 들어 오른쪽 그림과 같이 최적화하고자 하는 파라미터에 대해 다양한 사용 환경을 고려한 개발 환경에서의 최적값과 실사용 환경에서의 최적값이 서로 다를 수 있다. 이러한 차이는 단말의 수신기가 사용되는 환경에서의 입력 데이터와 클라우드로부터 제공되는 학습 모델의 트레이닝 데이터셋이 서로 다름으로 인한 것이다.

이하 명세서에서는 학습 모델의 트레이닝 데이터와 실사용환경에서의 입력 데이터의 차이로 인한 간극을 최소화할 수 있는 다양한 실시예를 설명한다. 구체적으로, 사용환경에 적응적인 적응형 학습 모델을 생성 및 검증하는 방법, 특정 환경에 대한 진입에 응답하여 다양한 적응형 학습 모델 중 어느 하나를 이용하는 방법을 설명한다.

도 15는 본 명세서의 일 실시예에 따른 방법의 순서도이다.

본 명세서의 일 실시예에 따른 방법은 소정의 동작들을 포함한다. 이때, 소정의 동작들은 단말의 적어도 하나의 프로세서에 의해 수행되고, 구체적으로, 상기 소정의 동작들은 트랜시버, 적어도 하나의 프로세서, 상기 적어도 하나의 프로세서에 연결되고, 명령들(instructions)을 저장하는 적어도 하나의 메모리를 포함하는 단말에 의해 수행된다.

상기 명령들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 다중의 수신 안테나를 이용하여 MIMO 통신 채널을 통해 통신하기 위한 동작들을 지원하고, 이하 J.1 내지 J.4의 설명을 통해 상기 동작들을 설명한다.

한편, 본 명세서의 적어도 하나의 프로세서는, 커뮤니캐이션 프로세서(communication processor, CP)와 애플리캐이션 프로세서(application processor, AP)를 중 적어도 하나를 포함할 수 있다. 다양한 실시예들에서 상기 AP 및/또는 CP 에 의한 동작들은 기능적으로 상기 AP 및 CP에 의해 구분되어 동작되거나, 기능적으로 결합된 하나의 프로세서에 의해서 수행될 수 있다. 이하의 도 15 및 그 설명은 '프로세서'에 의해 동작들이 수행되는 것으로 예시한다.

또한, 본 명세서의 다양한 실시예에서 구현되는 기계 학습 네트워크는 심층 신경망(Deep Neural Network, DNN), 컨볼루션 신경망(Convolutional Neural Network, CNN), 또는 파라메트릭 곱셈들, 덧셈들, 및 비 선형성들을 포함하는 순환 신경망(Recurrent Neural Network, RNN) 중 적어도 하나를 포함한다.

한편, 본 명세서의 다양한 실시예에서 '학습용 데이터', '트레이닝 데이터', 및/또는 '훈련 데이터'는 상호 혼용될 수 있다.

도 15를 참조하면, 적어도 하나의 프로세서는 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하거나 갱신할 수 있다(S110).

학습 리스트는 하나 이상의 제1 항목을 포함한다. 여기서, 제1 항목은 소정의 통신 환경을 의미한다. 이처럼, 학습 리스트에 포함되는 하나 이상의 통신 환경들은 기계 학습 네트워크의 학습 대상으로 이용된다. 즉, 학습 리스트에 포함된 하나 이상의 제1 항목들에 대응되는 하나 이상의 통신 환경에서 얻은 훈련 데이터를 이용하여, 적어도 하나의 프로세서는, 통신 환경 별로 최적화된 기계 학습 네트워크를 제공할 수 있다. 한편, 상기 제1 항목들은 각각의 ID에 의해 구분될 수 있다.

또한, 학습 리스트는 상기 제1 항목 별로 구분되는 장소 정보와 기지국 정보를 포함할 수 있다. 여기서, 장소 정보는 학습이 완료된 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함할 수 있다. 예를 들어, 단말이 적용 영역에 위치하는 경우, 단말은 상기 적용 영역과 연관된 기계 학습 네트워크를 이용하여 수신기를 제어할 수 있다. 예를 들어, 단말이 수집 영역에 위치하는 경우, 단말은 수집 영역에서 연결된 기지국으로부터 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻을 수 있다.

일 실시예에서, 학습 리스트를 생성하기 위하여 하나 이상의 기지국 별로 연결 정보를 측정하고, 적어도 하나의 프로세서는, 측정된 연결 정보에 기반하여 대상 기지국을 결정할 수 있다. 적어도 하나의 프로세서는 대상 기지국과 연결되거나 연결되어 있는 동안 주기적으로 단말의 위치 샘플들을 얻고, 위치 샘플들을 대상으로 클러스터링 알고리즘을 적용하여 하나 이상의 통신 환경을 결정할 수 있다. 이처럼, 결정된 하나 이상의 통신 환경은 학습 리스트의 제1 항목으로 설정될 수 있다.

다른 실시예에서, 적어도 하나의 프로세서는 학습 리스트를 생성하기 위하여 연결 리스트, 후보 리스트, 선정 리스트 중 적어도 하나를 생성하거나 업데이트하는 동작들을 수행할 수 있다.

구체적으로, 적어도 하나의 프로세서는 하나 이상의 기지국 별로 얻은 연결 정보(예:Primary Cell로 연결된 시간(T_pri), 총 연결시간(T_tot), 또는 총 수신 데이터양(D_tot))와 기지국 정보(예: Cell ID, 또는 주파수 대역) 중 하나 이상을 갖는 하나 이상의 제2 항목을 포함하는 연결 리스트를 생성하거나 업데이트할 수 있다.

적어도 하나의 프로세서는 상기 연결 리스트의 연결 정보에 기반하여 후보 리스트를 생성하거나 업데이트할 수 있다. 후보 리스트는 하나 이상의 제3 항목을 포함할 수 있다. 여기서, 제3 항목은 점수 파라미터를 더 포함할 수 있다. 점수 파라미터는 상기 연결 리스트의 연결 정보에 설정된 가중치를 적용하여 산출된다. 예를 들어, 점수는 아래의 수학식 1 에 따라 산출될 수 있다.

수학식 1에서, w_tot은 T_tot에 대한 가중치, w_pri는 T_pri에 대한 가중치, w_data는 D에 대한 가중치를 의미한다. 한편, 본 명세서에서 전술한 D_tot은 D와 동일하게 혼용될 수 있으며, 상호 구분되는 것이 아니다.

적어도 하나의 프로세서는 상기 후보 리스트에 포함된 하나 이상의 제3 항목 중 어느 하나에 설정된 가중치를 적용하여 하나 이상의 항목을 선정하여 선정 리스트를 생성하거나 업데이트할 수 있다.

적어도 하나의 프로세서는 상기 점수 파라미터를 기준으로 상기 후보 리스트에 포함된 하나 이상의 제3 항목들을 정렬(예: 내림차순)하고, 상위의 K(K는 양의 정수)개의 항목들을 선정하여 선정 리스트를 생성하거나 업데이트할 수 있다.

적어도 하나의 프로세서는 상기 선정 리스트에 기초하여 상기 선정 리스트의 하나 이상의 기지국 중 적어도 하나와 연결되거나, 연결되어 있는 동안 위치 정보를 수집할 수 있다. 일 예로, 적어도 하나의 프로세서는 위치 정보를 생성하도록 GPS 모듈에 명령을 제공하거나, 네트워크로 위치 정보의 전달을 요청하도록 트랜시버에 명령을 제공할 수 있다. 또한, 수집된 위치 정보 중 적어도 일부는 제1 항목에 대응되는 통신 환경을 선정하기 위한 위치 샘플로 샘플링된다.

이때, 적어도 하나의 프로세서는 상기 단말의 위치에 기반하여 획득된 위치 정보 또는 위치 샘플의 적어도 일부를 메모리에 저장하지 않는다. 예를 들어, 단말이 전술한, 적용 영역에 위치하는 것이 감지되면, 적어도 하나의 프로세서는 상기 위치 정보 또는 위치 샘플을 메모리에 저장하지 않도록 제어한다. 또한, 적어도 하나의 프로세서는 단말이 적용 영역에 진입할 때마다 위치 정보 획득 주기에 연관된 파라미터(N_in-region)를 1씩 증가시킨다.

그 결과, N_in-region이 설정된 임계치 이상이 되면, 적어도 하나의 프로세서는 위치 정보를 획득하는 주기를 증가시킬 수 있다. 에를 들어, 위치 정보를 획득하는 주기는 설정할 수 있는 주기 중 현재 값보다 큰 값 중에서 가장 작은 값으로 선택될 수 있다. 이때, 현재 값보다 큰 값이 없으면 현재 값으로 유지된다. 여기서, N_in-region이 임계값 이상이라는 것은 단말이 계속 학습 중이거나, 학습이 완료되었거나, 학습을 시도하였으나 실패한 통신 환경에 위치하고 있음을 의미한다. 따라서, 위치 정보의 획득의 주기를 조절함으로써 컴퓨팅 효율을 개선할 수 있다.

또한, 적어도 하나의 프로세서는 상기 선정 리스트에 포함된 하나 이상의 제4 항목에 연관된 상기 단말의 위치 샘플에 기반하여 상기 학습 리스트에 추가될 하나 이상의 제1 항목을 생성하거나 업데이트할 수 있다.

예를 들어, 적어도 하나의 프로세서는 복수의 위치 샘플들에 클러스터링 알고리즘을 적용하여 하나 이상의 위치 샘플 클러스터를 제공할 수 있다. 여기서, 클러스링 알고리즘은 밀도 기반의 클러스터링 알고리즘을 사용할 수 있으며, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), Mean-Shift Clustering 등이 있다.

한편, 학습 리스트는 상기 제1 항목 별 상태 정보를 포함할 수 있다. 상기 상태 정보는 획득 상태, 훈련 상태, 검증 상태, 적용 상태, 또는 잠금 상태 중 적어도 하나를 포함하고, 그리고, 적어도 하나의 프로세서는 상기 상태 정보에 기반하여 상기 제1 항목들을 관리할 수 있다.

예를 들어, 획득 상태의 경우, 상기 제1 항목에 대응되는 환경에서 적어도 하나의 프로세서는 훈련 데이터를 얻는다.

또한, 학습 상태는 획득 상태에서 얻은 훈련 데이터를 이용하여 상기 훈련 데이터를 얻은 제1 항목과 연관된 기계 학습 네트워크를 학습하는 상태를 의미한다. 학습 상태의 경우, 적어도 하나의 프로세서는 상기 학습 상태에서 얻은 훈련 데이터를 이용하여 상기 제1 항목에 연관된 기계 학습 네트워크의 업데이트를 수행한다.

또한, 검증 상태는 학습 상태에서 업데이트된 기계 학습 네트워크를 검증하는 상태를 의미한다. 검증 상태의 경우, 적어도 하나의 프로세서는 상기 학습 상태에서 업데이트된 기계 학습 네트워크의 성능을 검증한다.

또한, 적용 상태는 학습과 검증이 완료된 상태를 의미한다. 이때, 적어도 하나의 프로세서는 학습과 검증이 완료된 기계 학습 네트워크를 실사용환경에 적용한다.

또한, 잠금 상태는 학습 리스트의 제1 항목으로 선정되었으나, 학습 또는 검증에 실패한 상태를 의미한다. 잠금 상태의 제1 항목은 타이머에 의해 일정 시간 동안 또는 반영구적으로 학습 리스트에서 제외될 수 있다.

전술한 학습 리스트의 생성과 연관된 구체적인 설명은 이하의 도 17 내지 도 22를 참조하여 후술한다.

적어도 하나의 프로세서는 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻을 수 있다(S115).

전술한 바와 같이, 장소 정보는 학습이 완료된 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함할 수 있다.

여기서, 상기 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트는 단말이 상기 수집 영역에 진입하거나 위치하는 것이 감지되는 것을 의미한다.

전술한 바와 같이, 단말이 상기 수집 영역에 위치하는 경우, 단말은 수집 영역에서 연결된 기지국으로부터 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻을 수 있다.

여기서, 상기 훈련 데이터는 수신 관련 파라미터를 나타낸다. 일 예로, 상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함할 수 있다.

적어도 하나의 프로세서는 훈련 데이터를 이용하여 제1 기계 학습 네트워크를 업데이트할 수 있다(S120).

상기 기계 학습 네트워크의 각 레이어(layer)는 파라미터(예: 가중치)를 결정하기 위한 노드(node)를 포함한다. 은닉층(Hidden Layer)과 노드는 기계 학습 네트워크의 성능에 영향을 주지만, 그 수에 대한 정형적인 결정 방법은 없다. 일 례에서, 적어도 하나의 프로세서는 역전파(back propagation) 방법을 이용하여 기계 학습 네트워크의 출력값과 측정값의 오차를 최소화하도록, 노드와 노드 사이의 가중치 파라미터를 갱신할 수 있다. 상기 가중치의 학습 알고리즘으로는 경사 하강법(Gradient Descent), Levenberg-Marquardt 방법, Bayesian Regularization 방법 등이 이용된다.

업데이트는 상기 훈련 데이터에 기초하여 노드들 간의 가중치 및/또는 바이어스의 변경을 의미한다. 한편, 학습이 완료된 '제2 기계 학습 네트워크'는 '적응형 학습 모델'과 상호혼용될 수 있다.

적어도 하나의 프로세서는 상기 제1 기계 학습 네트워크의 학습이 성공 또는 실패를 확인할 수 있다(S125).

예를 들어, Training Error가 충분히 작아지지 않거나, Training Error와 Generalization Error(일명, Test Error)의 차이가 충분히 작아지지 않으면, 기계 학습 네트워크의 학습 결과를 실패로 분류한다.

적어도 하나의 프로세서는 상기 제1 기계 학습 네트워크의 학습이 성공되면(S125:YES), 실사용환경에서 성능을 검증할 수 있다(S130).

일 예로, 적어도 하나의 프로세서는 기계 학습 네트워크를 업데이트 전인 상기 제1 기계 학습 네트워크에 의해 측정된 제1 성능 지표와 업데이트 후인 제2 기계 학습 네트워크에 의해 측정된 제2 성능 지표를 비교하고, 상기 비교에 기초하여 상기 제1, 제2 기계 학습 네트워크 중 어느 하나를 선택할 수 있다.

다른 예로, 적어도 하나의 프로세서는 제1 기계 학습 네트워크가 업데이트되면, 업데이트 전인 제1 기계 학습 네트워크를 적용하여 측정되는 제1 성능 지표와 업데이트 후인 제2 기계 학습 네트워크를 적용하여 측정되는 제2 성능 지표를 비교하고, 상기 비교에 기초하여 상기 제1, 제2 기계 학습 네트워크 중 어느 하나를 선택할 수 있다.

또한, 적어도 하나의 프로세서는 상기 비교의 신뢰도(reliability)가 설정된 기준값 미만이면, 상기 제1, 제2 성능 지표를 다시 측정하여 비교할 수 있다.

적어도 하나의 프로세서는 상기 제1 기계 학습 네트워크의 학습이 실패하면(S125:NO), 상기 제1 기계 학습 네트워크에 관한 학습 실패 횟수를 증가할 수 있다.

적어도 하나의 프로세서는 학습 실패 횟수가 설정된 제1 최대 횟수(N_train-max-try)를 초과하면(S150:NO), 상기 제1 항목의 상태 정보를 잠금 상태로 전환할 수 있다(S160).

이때, 적어도 하나의 프로세서는 상기 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화할 수도 있다. 예를 들어, 적어도 하나의 프로세서는 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화함과 동시에 상기 제1 항목의 상태 정보를 잠금 상태로 전환하거나 설정할 수 있다.

적어도 하나의 프로세서는 학습 실패 횟수가 설정된 제1 최대 횟수 미만이면(S150:YES), 다시 훈련 데이터를 수집하고, 기계 학습 네트워크의 학습을 수행한다(S115, S120).

실사용환경에서의 성능이 검증되면(S135:YES), 적어도 하나의 프로세스는 제2 기계 학습 네트워크를 제1 항목의 적용 영역에서 적용할 수 있다(S140).

실사용환경에서의 성능이 검증되면, 제2 기계 학습 네트워크에 연관된 제1 항목의 상태 정보는 적용 상태로 천이된다. 적용 상태에서, 적어도 하나의 프로세서는 적용 상태인 제1 항목의 적용 영역으로 단말이 진입하면, 상기 적용 영역에 위치하는 동안 제2 기계 학습 네트워크를 통해 수신기를 제어할 수 있다.

적어도 하나의 프로세서는 상기 학습 리스트의 하나 이상의 제1 항목에 연관된 기지국에 연결되거나, 연결되어 있는 동안 주기적으로 단말의 위치를 확인할 수 있다.

이때, 단말의 위치 확인 주기는 단말의 이동 속도에 반비례하여 조정될 수 있다.

단말이 학습 리스트의 복수의 제1 항목들 중 어느 하나의 적용 영역에 진입한 것이 확인되면, 적어도 하나의 프로세서는 단말이 진입한 통신 환경에서 학습된 제2 기계 학습 네트워크를 적용하여 통신 서비스를 제공한다. 이후에, 단말이 적용 영역에서 이탈되면, 적어도 하나의 프로세서는 제2 기계 학습 네트워크의 적용을 중지한다. 적어도 하나의 프로세서는 제2 기계 학습 네트워크의 적용이 중지되면, 제1 기계 학습 네트워크를 적용하여 통신 서비스를 제공할 수 있다.

실사용환경에서 성능이 검증되지 않으면(S135:NO), 적어도 하나의 프로세스는 제2 기계 학습 네트워크에 관한 검증 실패 횟수를 증가할 수 있다.

적어도 하나의 프로세서는 검증 실패 횟수가 설정된 제2 최대 횟수(N_verify-max-try)를 초과하면(S155:NO), 상기 제1 항목의 상태 정보를 잠금 상태로 전환할 수 있다(S160).

적어도 하나의 프로세서는 검증 실패 횟수가 설정된 제2 최대 횟수 미만이면(S155:YES), 다시 훈련 데이터를 수집하고, 제1 기계 학습 네트워크의 학습을 수행한다(S115, S120).

한편, 적어도 하나의 프로세서는 제2 기계 학습 네트워크를 이용하여 통신 서비스를 제공하는 동안 제3 성능 지표를 측정하고, 제3 성능 지표와 검증 상태에서 측정된 제2 성능 지표를 비교하여 성능 저하 여부를 판단할 수 있다(S145). 만약, 제2 기계 학습 네트워크의 성능이 저하된 것으로 판단되면(S145:YES), 적어도 하나의 프로세서는 성능 저학 발생된 통신 환경에 대응되는 제1 항목의 적용을 중지하고, 다시 획득 상태로 천이할 수 있다(S115).

일 실시예에서, 성능 저하 여부의 판단은 설정된 타이머에 기초하여 수행될 수 있다. 본 명세서에서 성능 저하 여부와 관련된 타이머는 점검 타이머로 정의될 수 있다. 이 경우, 적어도 하나의 프로세서는 점검 타이머가 만료될 때마다 성능 저하 여부를 판단할 수 있다. 만약, 제2 기계 학습 네트워크의 성능이 저하되지 않은 것으로 판단되면(S145:NO), 적어도 하나의 프로세서는 점검 타이머를 초기화하여 다시 시작할 수 있다.

한편, 전술한 바와 같이, 적어도 하나의 프로세서는 학습 실패 횟수가 N_train-max-try를 초과하거나, 검증 실패 횟수가 N_verify-max-try를 초과하면 제1 항목의 상태 정보를 잠금으로 설정하는데(S160), 이처럼, 잠금 상태가 시작되는 것에 응답하여 잠금 해제 타이머가 시작된다.

적어도 하나의 프로세서는 잠금 해제 타이머가 만료되면(S165:YES), 해당 제1 항목을 학습 리스트에서 삭제하고, 다시 S110의 동작을 수행할 수 있다.

이하 명세서에서 도 15에서 설명한 동작들을 설명한다. 이하, 구체적인 설명에서 도 15와 중복되는 내용은 생략될 수 있으며, 추가되는 내용은 도 15와 의 동작들과 결합될 수 있다.

J.1. 훈련 데이터를 수집하기 위한 환경의 선정

도 16을 참조하면, 통신 환경은 연결된 기지국 정보(예: Cell ID, 주파수 대역)와 장소 정보(예: 중심 위치, 반경)로 특정될 수 있다.

통신 환경은 각각의 기지국 또는 기지국 정보와 연관되어 설정될 수 있다. 예를 들어, ENV1A, ENV1B 는 제1 기지국(BS1)과 연관되어 설정되고, ENV2는 제2 기지국(BS2)과 연관되어 설정되고, ENV3A, ENV3B, ENV3C는 제3 기지국(BS3)과 연관되어 설정된다. 각각의 기지국들은 각각의 커버리지(예: CO1, CO2, CO3) 내에 하나 이상의 통신 환경을 포함할 수 있다.

한편, Cell ID와 주파수 대역이 동일하더라도 장소 정보에 따라 서로 다른 통신 환경이 존재할 수 있다(ENV1A, ENV1B 참고). 또한, 동일한 장소라도 Cell ID와 주파수 대역에 따라 2 이상의 서로 다른 통신 환경이 존재할 수 있다(ENV3A, ENV3B 참고).

장소는 2차원 또는 3차원으로 표현될 수 있다. 2 차원의 경우에는 장소는 위도와 경도로 나타낼 수 있고, 3차원의 경우에는 위도, 경도, 및 고도로 나타낼 수 있다. 또한, 장소는 건물의 층, WIFI AP(access point) ID 등의 추가적인 정보를 이용하여 구체화 및 세분화될 수 있다.

도 17 내지 도 24는 본 명세서의 일 실시예에 따른 학습 리스트 생성방법을 예시적으로 설명한다. 이하 명세서에서는 도 15에서 전술한 적어도 하나의 프로세서를 AP와 CP로 예시적으로 구분하여 설명하나, AP 및 CP에 의한 적어도 하나의 동작들은 기능적으로 결합된 하나의 프로세서에 의해 수행될 수도 있다.

CP는 일정한 주기로 기지국 정보와 연결 정보를 얻을 수 있다. 이때, 기지국 정보는 Cell ID와 주파수 대역을 포함하고, 연결 정보는 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)을 가질 수 있다.

CP는 설정된 주기동안 Cell ID 및 주파수 대역으로 구분되는 항목 별로 연결시간, primary cell로 연결된 시간, 및/또는 총 수신 데이터양을 측정할 수 있다.

CP는 AP로부터 각각의 연결 정보에 대응되는 가중치를 제공받고, 항목 별 측정된 연결 정보에 가중치를 적용하여 점수를 산출할 수 있다. 예를 들어, CP는 연결 정보에 가중치를 곱한 후 모두 합하여 점수를 산출할 수 있으며, 이는, 전술한 수학식 1과 같다.

이후에, CP는 산출된 점수에 기초하여 리스트를 정렬하고, 상위의 K개(K는 양의 정수)의 항목만을 선택하여 기지국 정보와 연결 정보를 AP로 전달할 수 있다. 여기서, K 값은 AP에 의해 제공된다.

이에 따라, AP는 CP로부터 수신된 기지국 정보와 연결 정보 중 적어도 하나에 기반하여 연결 리스트를 생성 및 관리할 수 있다. 이처럼, AP로 제공된 연결 정보는 연결 리스트로 추가되어, 이후에 학습 리스트의 생성 및 관리의 기반이 된다.

도 17을 참조하면, 연결 리스트는 기지국 정보와 연결 정보를 포함할 수 있다. 이때, 기지국 정보는 Cell ID와 주파수 대역을 포함하고, 연결 정보는 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)을 가질 수 있다.

다시 도 17을 참조하면, AP는 소정의 주기로 다음과 같이 학습이 필요한 후보 기지국을 선정할 수 있다. 하나 이상의 후보 기지국을 포함하는 리스트는 후보 리스트로 호칭될 수 있다. 여기서, 소정의 주기는 CP로부터 제공되는 연결 정보 보고 주기의 배수일 수 있다.

일 실시예에서, AP는 후보 기지국을 선정하기에 앞서 CP로부터 받은 연결 정보에 기반하여 연결 리스트를 생성 및 관리할 수 있다. AP는 상기 소정의 주기의 시작점에 연결 리스트를 초기화할 수 있다. 초기화된 리스트는 빈 리스트가 되거나, 특정 시점에 기록된 종래의 연결 리스트로 변경된다. AP는 CP로부터 연결 정보를 수신할 때마다 아래의 적어도 하나의 동작들을 수행할 수 있다.

실시예에서, AP는 수신된 기지국 정보(예: Cell ID, 주파수 대역)가 미리 저장된 연결 리스트에 존재하는지 여부를 비교하고, 비교 결과 수신된 기지국 정보의 적어도 일부 중 상기 미리 저장된 연결 리스트에 존재하지 않는 정보를 상기 미리 저장된 연결 리스트에 추가할 수 있다. 다시 말해, AP는 수신된 기지국 정보가 연결 리스트에 없으면 그 기지국 정보에 대응되는 항목을 연결 리스트에 추가할 수 있다.

또한, 실시예에서, AP는 각각의 기지국 정보에 대해 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)을 누적할 수 있다. 이처럼, 누적된 연결 정보들은 후보 리스트를 업데이트하는 과정에서 이용된다.

AP는 연결 리스트의 상기 소정의 주기의 종료 시점에 후보 리스트를 업데이트하기 위한 적어도 하나의 동작들을 수행할 수 있다.

실시예에서, AP는 연결 리스트의 기지국 정보가 후보 리스트에 없으면 이에 대응되는 항목을 추가하고 연결 정보를 초기화할 수 있다. 초기화된 항목은 빈 항목이 되거나, 특정 시점에 기록된 종래의 항목으로 변경된다.

실시예에서, AP는 후보 리스트의 각 항목 별로 연결 정보를 연결 리스트의 연결 정보에 기반하여 업데이트할 수 있다. 업데이트 시, 알파 트래킹(alpha-Tracking) 또는 무빙 에버리지(moving average)가 적용될 수 있으나, 이에 한정되는 것은 아니다.

도 18을 참조하면, AP는 각 항목 별 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)과 각 항목 별로 제공된 가중치에 기초하여 학습 대상과 제외 대상을 선택할 수 있다. 예를 들어, 학습 대상은 상기 가중치에 기초하여 산출된 점수가 설정된 기준치를 초과하는 항목들을 나타낸다. 예를 들어, 도 18은 score_y, score_z를 갖는 항목들은 기준치 이하의 점수를 갖고, score_a, score_b, 쪋, score_x는 기준치를 촤가하는 점수를 갖는 경우를 예시한다. 이때, score_y, score_z를 갖는 항목들은 제외 대상으로 분류되고, 나머지 항목들은 학습 대상으로 분류될 수 있다.

여기서, 각 항목 별로 제공된 가중치는 상기 연결 리스트의 생성 및 관리 이전에 CP에서 사용되는 가중치와 같거나 다를 수 있다.

학습 대상으로 선정된 하나 이상의 항목은 선정 리스트로 업데이트될 수 있으나, 제외 대상으로 선택된 하나 이상의 항목은 후보 리스트에서 삭제된다.

도 19를 참조하면, AP는 후보 리스트가 업데이트될 때마다 선정 리스트를 업데이트하거나 관리하기 위하여 적어도 하나의 동작들을 수행할 수 있다.

실시예에서, AP는 후보 리스트의 하나 이상의 학습 대상이 선정 리스트에 없으면 이를 선정 리스트에 추가할 수 있다. 추가된 하나 이상의 학습 대상에는 각각 삭제와 연관된 파라미터(예: dropCount)가 매핑된다. 삭제와 연관된 파라미터의 값은 설정된 알고리즘에 따라 0으로 초기화되거나 1씩 증가될 수 있다. 한편, '삭제와 연관된 파라미터'는 '삭제 파라미터'와 상호 혼용될 수 있다.

예를 들어, 후보 리스트에서 선정된 학습 대상이 선정 리스트에 없으면 삭제 파라미터를 0으로 초기화한다. 다른 예를 들어, 후보 리스트에 선정된 학습 대상이 선정 리스트에 있으면 삭제 파라미터를 0으로 초기화한다. 또 다른 예를 들어, 학습 대상으로 선정되지 않은 선정 리스트의 항목은 삭제 파라미터를 1 증가시킨다.

보다 구체적으로, AP는 후보 리스트에서 선정된 학습 대상이 선정 리스트에 없으면, 선정된 학습 대상을 선정 리스트에 추가하고, 추가된 항목에 대응되는 삭제 파라미터를 0으로 초기화할 수 있다. 또한, AP는 추가된 항목 이외에 재차 학습 대상으로 선정된 하나 이상의 항목들에 대응되는 선정 리스트의 하나 이상의 항목의 삭제 파라미터를 0으로 초기화할 수 있다.

반면, AP는 새로 선정되거나, 재차 선정된 하나 이상의 학습 대상에 대응되지 않는 항목들의 삭제 파라미터를 1 증가시킬 수 있다. 다시 말해서, AP는 삭제 파라미터가 0으로 업데이트되지 않은 모든 항목들의 삭제 파라미터를 1씩 증가시킬 수 있다.

한편, 실시예에서, 삭제 파라미터가 임계값을 넘는 경우에 그 항목과 대응되는 학습 대상은 선정 리스트에서 삭제될 수 있다.

또한, 실시예에서, 선정 리스트에서 적어도 하나의 학습 대상의 삭제는 후술할 학습 리스트의 관리에도 영향을 미칠 수 있다. 구체적으로, 하나 이상의 학습 대상이 선정 리스트에서 삭제되면, 삭제된 학습 대상인 기지국과 연관된 학습 리스트의 각 항목들(즉, 학습 환경들)에 관한 취소 타이머(Cancel Timer)가 시작된다. 취소 타이머의 만료 기간이 0이면, 취소 타이머는 시작되지 않고 해당 학습 환경은 즉시 삭제된다. 반대로, 취소 타이머의 만료 기간이 0이 아니고 취소 타이머가 만료되기 이전에 학습 리스트에 포함된 학습 환경에 속하는 기지국이 다시 선정 리스트에 추가되면 취소 타이머는 중지된다. 또한, 취소 타이머의 만료 기간이 0이 아니나, 이후에 취소 타이머가 만료되면 이때 해당 학습 환경은 학습 리스트에서 삭제된다.

이처럼, 생성 및 관리된 선정 리스트는 훈련용 데이터의 수집을 위한 통신 환경의 선정의 기반이 된다.

이처럼, 본 명세서의 다양한 실시예는 단순히 연결 정보를 수집하고, 이에 따른 학습 대상인 환경을 특정하지 않고, 적어도 하나의 과정을 통해 선별된 리스트를 통해 학습 대상인 환경을 특정할 수 있다. 선정 리스트를 생성하기 이전의 적어도 하나의 과정은 본 명세서의 다양한 실시예에서 반드시 모두 수행되어야 하는 것은 아니며, 하드웨어의 속성에 기반하여 상기 연결 리스트의 생성 이전의 전처리 과정, 연결 리스트의 관리 과정, 후보 리스트의 관리 과정, 선정 리스트의 관리 과정 중 적어도 하나는 생략되거나 결합되어 수행될 수 있다. 예를 들어, 전처리 과정이 생략되는 경우, CP는 가중치에 따라 선택하지 않고 모든 연결 정보를 AP로 전달한다. 다른 예를 들어, 후보 리스트 관리 과정이 생략되면, 가중치에 따라 학습 대상인 기지국을 선별하지 않고, 연결 리스트와 선정 리스트를 비교하여 선정 리스트를 관리할 수 있다.

그리고, 도 20을 참조하면, 본 명세서의 다양한 실시예에서 AP 및/또는 CP 중 적어도 하나는 선정 리스트에 기초하여 학습 환경을 선정할 수 있다. 도 20은 선정 리스트에 포함된 기지국으로 제1 기지국(BSa), 제2 기지국(BSb), 및 제3 기지국(BSc)을 가정한다. 제1, 제2, 제3 기지국(BSa, BSb, BSc)은 각각 제1, 제2, 제3 커버리지(COa, COb, COc)를 가질 수 있다.

구체적으로, AP는 CP로 선정 리스트를 전송한다. CP는 선정 리스트에 기초하여 상기 선정 리스트에 포함된 적어도 하나의 기지국과 통신이 연결되거나 끊어질 때마다 AP로 연결 상태 보고를 전송할 수 있다. 한편, 선정 리스트에 포함된 적어도 하나의 항목에 연관된 기지국은 '선정 기지국'으로 호칭될 수 있다.

AP는 선정 기지국에 대해 위치 정보를 획득하여 메모리에 저장할 수 있다. 여기서, 단말의 위치 정보는 CP 또는 별도의 장치(예: GPS 등)에 의해 제공될 수 있다. 일 예로, AP는 다음과 같은 하나 이상의 동작들에 의해 위치 정보를 획득 및 저장할 수 있다.

실시예에서, AP는 기지국에 연결되거나 연결되어 있는 동안 주기적으로 위치를 얻을 수 있다. 예를 들어, 단말이 제3 커버리지(COc)에 진입하는 제1 이벤트(E1), 제1 커버리지(COa)에 진입하는 제3 이벤트(E3), 제2 커버리지(COb)에 진입하는 제5 이벤트(E5)에서 AP는 위치를 얻을 수 있다. 다른 예를 들어, 단말이 제1 내지 제3 커버리지(COa, COb, COc) 중 어느 하나에 연결되어 있는 동안 설정된 주기가 만료하는 제2, 제4, 그리고 제6 이벤트(E2, E4, E6)가 감지되면, 이때 위치를 얻을 수 있다.

실시예에서, AP는 획득한 위치가 학습 리스트의 적용 영역에 해당하는지 확인할 수 있다. 획득한 위치에 기반하여 단말의 위치가 학습 리스트에 포함된 적어도 하나의 학습 환경의 중심 위치로부터의 거리가 적용 반경(r_apply) 이내이면 적용 영역에 해당한다. 또한, 상기 중심 위치로부터의 거리가 학습 반경(r_training) 이내이면 학습 영역에 해당한다(도 23 참조).

한편, 학습 리스트에 기지국 정보가 동일한 항목이 적어도 2 이상인 경우에는 적용 반경이 큰 항목을 먼저 확인한다.

실시예에서, 획득한 위치가 학습 리스트에 포함된 적어도 하나의 학습 환경의 적용 영역에 해당하면, AP는 위치 정보를 저장하지 않는다. 이때, AP는 위치 정보를 저장하는 대신 적용 영역에 진입한 것을 나타내는 파라미터를 1 증가시킨다. 적용 영역에 진입한 것을 나타내는 파라미터는 'In-region 파라미터(N_in-region)'로 호칭될 수 있다. In-region 파라미터가 설정된 기준값(N_extend-period) 이상이면, AP는 단말의 위치 획득 주기를 증가시킬 수 있다. 여기서, N_extend-period는 주기 연장 파라미터로 지칭될 수 있다.

이때, 증가되는 주기는 가능한 하나 이상의 주기 중 현재 주기보다 큰 값들을 선별하고, 선별된 큰 값들 중 가장 작은 값으로 선택될 수 있다. 만약, 현재 주기가 가능한 하나 이상의 주기 중 가장 큰 값이라면, AP는 현재 주기를 유지한다. 한편, AP는 획득한 위치가 학습 리스트의 적용 영역에 해당하지 않으면 위치 정보를 저장하고 상기 위치에 연관된 위치 획득 주기를 가능한 하나 이상의 주기 중 가장 작은 값으로 설정한다.

도 21을 참조하면, 이와 같이 획득된 복수의 위치 정보들은 학습 환경의 선정을 위한 요소로서 이용된다. 학습 환경은 획득된 복수의 위치 정보들 또는 위치 정보들로부터 샘플링된 위치 샘플들에 기반한 클러스터링을 통해 제공된다. 예를 들어, 단말은 제1 내지 제3 커버리지(COa, COb, COc)를 경유하며 이동하며 복수의 위치 정보를 수집할 수 있다. 이때, 위치 정보는 소정의 장소에 밀집되어 수집될 수 있다. 이처럼, 소정의 장소에 밀집되어 수집되는 이유는 사용자의 이동 루틴에 따라 특정 장소에 자주 머무르기 때문이다. 사용자가 자주 머무르는 장소에서는 소정의 주기가 만료될 때마다 위치 정보가 수집되고, 특정 장소에서 밀집된 위치 정보가 수집되는 결과가 도출될 수 있다.

도 22를 참조하면, 실시예에서 AP는 복수의 위치 정보들 또는 위치 샘플들의 수(n_point)가 학습 장소 선정에 필요한 최소 개수(N_clustering-point) 이상이면 클러스터링을 수행하고, 그 결과 생성된 하나 이상의 클러스터의 중심 위치, 학습 반경, 적용 반경을 결정할 수 있다. 예를 들어, 도 22는 적어도 하나의 클러스터를 점선의 원 또는 타원으로 나타내고, 중심 위치를 깃발로 나타낸다.

또한, 실시예에서, AP는 생성된 하나 이상의 클러스터에 포함된 위치 정보 또는 위치 샘플의 수(n_cluster-point)가 설정된 기준값(N_min-point) 이상인 클러스터만을 대상으로 중심 위치, 학습 반경, 적용 반경을 결정할 수도 있다.

다양한 실시예에서, AP는 클러스터링 알고리즘을 이용하여 복수의 위치 정보들 또는 위치 샘플들을 하나 이상의 위치군으로 분류할 수 있다. 클러스터링 알고리즘은 밀도 기반의 클러스터링 알고리즘이 사용될 수 있으나, 이에 한정되는 것은 아니다. 여기서, 클러스터링 알고리즘은, 예를 들어, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), Mean-Shift Clustering를 포함하나, 이에 한정되는 것은 아니다.

다양한 실시예에서, AP는 소정의 기법으로 하나 이상의 클러스터 각각의 중심 위치를 산출할 수 있다. 예를 들어, 중심 위치는 하나 이상의 위치 정보들 또는 위치 샘플들의 경도, 위도의 평균값으로 산출되거나 k-Nearest Neighbor 알고리즘을 적용하여 산출될 수 있다.

도 24를 참조하면, 다양한 실시예에서, AP는 클러스터의 중심 위치로부터 상기 클러스터의 위치 정보들 또는 위치 샘플들까지의 거리값들을 확인하고, 확인된 거리값들에 기반하여 학습 반경(r_train)을 결정할 수 있다. 예를 들어, 학습 반경은 아래의 수학식 2에 기반하여 산출될 수 있다.

수학식 2에서, r_train은 학습 반경, r_train-min은 학습 반경의 최소값, r_train-max는 학습 반경의 최대값, α는 0보다 큰 실수를 나타낸다. 예를 들어, α는 3~4의 값이 적용될 수 있다.

다양한 실시예에서, AP는 학습 반경으로부터 학습이 완료된 기계 핫급 네트워크를 적용하기 위한 적용 반경(r_apply)을 결정한다. 적용 반경은 위치 측정의 오차에 기반하여 결정될 수 있다. 바람직하게는, 적용 반경은 위치 측정의 오차가 클수록 더 작아진다. 예를 들어, 적용 반경은 아래의 수학식 3에 기반하여 산출될 수 있다.

수학식 3에서, r_apply는 학습 반경, β는 0보다 크고 1이하인 실수를 나타낸다.

다양한 실시예에서 AP는 기지국의 메모리에 저장된 하나 이상의 위치 정보 또는 위치 샘플들 중 하나 이상의 클러스터에 속한 것들을 모두 삭제한다. 이때, 삭제되지 않은 나머지 위치 정보들 또는 위치 샘플들은 새로 추가되는 위치 정보들 또는 위치 샘플들과 함께 새로운 학습 환경 선정에 이용될 수 있다.

실시예에서, AP는 결정된 중심 위치와 학습 반경을 기지국 정보와 함꼐 학습 리스트에 추가할 수 있다. 이때, 추가된 항목은 획득 상태로 초기화된다.

다양한 실시예에서, AP 또는 CP 중 적어도 하나는 학습 리스트의 각 항목 의 상태를 관리하며, 항목의 상태 정보에 기반하여 이에 연관된 과정을 수행한다.

상태 정보들은 아래의 정보들 중 적어도 하나를 포함할 수 있다.

- 획득(Acquiring): 학습용 데이터를 획득한다.

- 학습(Training): 기본 모델을 기반으로 획득한 학습용 데이터를 이용하여 추가 학습을 수행한다. 기본 모델은 온-디바이스 학습이 수행되기 이전의 기계 학습 네트워크를 의미한다.

- 검증(Verifying): 실사용 환경에서 학습이 완료된 모델의 성능을 검증한다. 실사용 환경은 온-디바이스 학습이 수행된 기계 학습 네트워크의 학습 환경과 연관된 상기 학습 환경에서 생성된 기계 학습 네트워크가 적용될 환경을 의미한다. 또한, 실사용 환경에서 학습이 완료된 모델은 적응형 기계 학습 네트워크로 지칭될 수 있다.

- 적용(Applying): 학습과 검증이 완료된 모델을 실사용 환경에 적용한다.

- 잠금(Barred): 학습 환경으로 선정되었으나 학습 또는 검증에 실패한 상태로, 설정된 타이머에 의해 일정 시간 동안 또는 반영구적으로 후보 리스트로부터 선정되는 학습 대상에서 제외된다.

이하, 명세서에서 학습 상태 내지 잠금 상태에 기반한 다양한 실시예들을 후술한다.

J.2. 트레이닝 데이터의 수집

도 25를 참조하면, AP(130a) 및 CP(130b) 중 적어도 하나는 학습 리스트의 적어도 하나의 항목들의 상태 정보를 확인하고, 획득 상태인 학습 리스트의 각 항목에 대하여 후술할 적어도 하나의 동작들을 수행함으로써 학습용 데이터를 수집할 수 있다.

우선, AP(130a)는 학습 리스트의 상태 정보를 확인하여 CP(130b)로 획득 상태인 학습 환경을 전송할 수 있다. 이때, AP(130a)는 전송되는 학습 환경에 포함된 하나 이상의 기지국 리스트를 함께 전송할 수도 있다.

CP(130b)는 수신된 학습 환경의 기지국에 연결되거나 끊어질 때마다 AP(130a)로 보고할 수 있다.

실시예에서, AP(130a)는 학습 환경에 속한 하나 이상의 기지국에 연결되거나 연결되어있는 동안 주기적으로 단말의 위치 정보를 얻을 수 있다. 단말의 위치 정보는 CP(130b) 또는 별도의 장치(예: GPS)에 의해 제공된다. 여기서, 위치 정보는 학습 환경을 결정하기 위한 이전의 위치 샘플과 달리 단말이 기계 학습 네트워크의 훈련을 위한 데이터를 수집할 수 있는 학습 환경의 학습 반경 내에 위치하는 지 여부를 확인하기 위한 것이다.

실시예에서, 수집된 위치 정보에 기반하여 AP(130a)는 단말의 위치가 학습 환경의 중심 위치로부터 학습 반경 내로 진입하는 것을 확인할 수 있다.

실시예에서, 단말이 학습 환경의 학습 반경 내로 진입하는 이벤트가 감지되면, AP(130a)는 CP(130b)로 학습용 데이터의 수집을 요청한다. CP(130b)는 이러한 요청이 수신되면, 연결된 기지국으로 학습용 데이터의 전송을 요청하고, 이후에 수신되는 수신기의 수신 관련 학습용 데이터들을 수집할 수 있다. 예를 들어, 상기 학습용 데이터는 수신 관련 파라미터를 포함할 수 있다. 수신 관련 파라미터는 수신된 신호와 관련된 정보들을 포함한다. 즉, 상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함할 수 있다.

실시예에서, CP(130b)는 기지국으로부터 학습용 데이터를 수신하면, 수신된 신호와 관련된 정보를 AP(130a)로 전송할 수 있다. 이때, CP(130b)는 기지국으로부터 수신된 신호와 관련된 정보를 모아 학습용 데이터 샘플을 구성하고, 학습용 데이터 샘플을 AP(130a)로 전송할 수 있다. 또한, CP(130b)는 축적된 2 이상의 학습용 데이터 샘플을 한번에 AP(130a)로 전송할 수도 있다.

실시예에서, AP(130a)는 CP(130b)로부터 제공된 학습용 데이터 샘플을 비휘발성 메모리(120) 또는 스토리지에 저장할 수 있다.

실시예에서, AP(130a)는 단말이 학습 대상인 환경에서 이탈한 것이 감지되면, CP(130b)로 학습용 데이터 수집의 중지를 요청할 수 있다. 이때, 학습 환경에서 이탈함은 학습 환경의 중심 위치로부터 학습 반경 외로 이탈한 것을 의미한다.

실시예에서, AP(130a)는 충분한 수의 학습용 데이터가 수집되면 CP(130b)로 해당 학습 환경에 관한 이후의 추가적인 학습용 데이터의 수집의 중지를 요청한다. 이처럼, 충분한 데이터가 수집되어 학습용 데이터의 수집을 중지하는 경우, AP(130a)는 수집 중지의 대상인 학습 환경의 상태를 획득 상태에서 학습 상태로 변경할 수 있다.

도 26은 트레이닝 데이터의 수집 과정을 예시적으로 설명한다.

도 26을 참조하면, 단말은 제1 기지국(BSa)의 커버리지 내를 경유할 수 있다. 이때, 단말은 제1 기지국(BSa)의 커버리지 내에 위치한 학습 환경(ENVX)을 경유할 수 있다. 특히, 도 26은 단말이 학습 영역과 적용 영역을 모두 지나치는 경우로 전제하여 설명한다.

단말은 제1 기지국(BSa)의 커버리지 내로 진입하는 제1 이벤트가 발생하면, 제1 기지국(BSa)와 연결되고, 단말은 위치 정보를 얻을 수 있다.

단말은 제1 기지국(BSa)의 커버리지 내에서의 위치를 모니터링하던 중 학습 환경(ENVX)의 학습 반경 내로 진입하는 제2 이벤트(EEE2)가 감지되면 기지국으로부터 학습용 데이터를 얻을 수 있다. 이후에, 단말이 학습 반경 외로 이탈하는 제5 이벤트(EEE5)가 감지되면 단말은 학습용 데이터의 수집을 중지한다.

단말이 제1 기지국(BSa)의 커버리지 외로 이탈하는 제6 이벤트가 발생하면 단말은 위치 정보를 수집한다.

한편, 단말이 적용 영역 내부로 진입하거나 이탈하는 제3, 제4 이벤트(EEE3, EEE4)가 감지되는 경우, AP(103a)는 학습 리스트를 확인하여 획득 상태인 하나 이상의 항목이라면 학습용 데이터를 획득하고, 적용 상태라면 학습된 기계 학습 네트워크를 적용할 수 있다.

J.3. 적응형 기계 학습 네트워크의 학습, 적용, 및 검증

J.3.1. 학습 과정

도 27을 참조하면, 본 명세서의 다양한 실시예에서, AP 및 CP 중 적어도 하나는 학습 상태인 학습 리스트의 하나 이상의 항목에 대하여 기본 모델에 대하여 이하 적어도 하나의 동작들을 통해 온-디바이스 학습을 수행한다. 전술한 바와 같이, AP 및/또는 CP에 의한 동작들은 적어도 하나의 프로세서(130)에 의한 동작들로 상호혼용될 수 있다.

기본 모델은 전술한 바와 같이, 클라이언트 디바이스에 의한 온-디바이스 학습이 수행되지 않은 기계 학습 네트워크를 의미한다.

학습 리스트의 하나 이상의 항목의 학습 상태는 세부적으로 학습 진행 상태, 학습 가능 상태, 학습 불가능 상태를 포함할 수 있다.

학습 진행 상태는 학습이 진행 중인 기계 학습 네트워크의 하나 이상의 시점 별로 기록된 학습 상황을 의미한다.

학습 가능 상태는 기계 학습 네트워크가 클라이언트 디바이스에 의해 학습될 수 있는 상태를 의미한다. 예를 들어, 단말이 충전 장치에 의해 전력을 제공받고 있는 충전 상황이거나, 미리 설정된 시간(예: 오전 00시부터 오전 05시 사이)이 학습 가능 상태로 설정될 수 있다. 이때, 설정된 시간은 사용자에 의해 조정될 수 있다.

학습 불가능 상태는 기계 학습 네트워크가 클라이언트 디바이스에 의해 학습될 수 없는 상태를 의미한다.

우선, AP는 학습 상태인 항목의 학습 진행 상태를 초기화할 수 있다. 여기서, 초기화는 학습 진행 상태의 기록을 시작하기 위한 시작점을 설정하는 것을 의미한다. 이후에, 학습이 진행되는 중인 하나 이상의 항목에 대해서는 학습 진행 상태를 초기화하지 않으며, 이전의 학습 진행 상태로부터 이어서 새로운 학습이 진행된다.

AP는 단말이 학습 가능 상태가 되면 학습을 수행할 수 있다. 이전에 미리 진행된 학습이 있는 경우, 현 시점의 학습 가능 상태 이전까지 수행된 학습의 학습 진행 상태로부터 연속하여 학습을 수행할 수 있다.

AP는 학습을 수행하는 미리 설정된 시점마다 학습 중인 기계 학습 네트워크와 학습 중인 기계 학습 네트워크의 학습 진행 상태를 비휘발성 메모리(120) 또는 스토리지에 저장한다. AP는 예기치 못한 상황으로 학습이 중단되더라도 시스템이 정상화된 후 저장된 학습 진행 상태에 기반하여 학습을 이어서 수행할 수 있다. 예를 들어, AP는 Stochastic Gradient Descent (SGD)와 같이 반복적인 업데이트에 기반한 알고리즘인 경우에, 미리 설정된 횟수의 반복 작업이 완료될 때마다 진행 상태를 저장할 수 있다.

한편, AP는 단말이 학습 불가능한 상태가 되면 기계 학습 네트워크에 대한 학습을 중단하고 최종 학습 진행 상태를 비휘발성 메모리(120) 또는 스토리지에 저장할 수 있다. 여기서, 학습 불가능한 상태가 되는 이벤트는 전술한 학습 가능 상태가 아니게 되는 모든 이벤트를 의미한다. 예를 들어, 단말이 충전 장치로부터 분리 또는 이격되거나, 미리 설정된 학습 가능한 시간 범위에 속하지 않게 되는 이벤트가 발생하면, 단말은 학습 불가능 상태로 분류된다.

AP는 학습이 완료될 때까지 전술한 J.3.1.의 과정들을 적어도 1회 이상 반복한다. 학습이 성공적으로 완료되면, AP는 메모리(120)에 저장된 학습용 데이터를 버리고, 학습이 완료된 기계 학습 네트워크를 메모리(120)에 저장한다. 또한, AP는 학습이 완료되면, 학습이 완료된 기계 학습 네트워크에 대응되거나 관련된 학습 환경의 상태를 검증 상태로 변경할 수 있다.

AP는 학습이 실패하면, 학습 실패 파라미터를 1 증가할 수 있다. 학습 실패 파라미터는 학습이 실패한 횟수로 정의된다. 학습의 실패는 AP에 의한 기계 학습 네트워크의 학습 과정에 잇어서, 트레이닝 에러(Training Error)가 충분히 작아지지 않거나, 트레이닝 에러와 테스트 에러(Test Error, 또는 Generalization Error)의 차이가 충분히 작아지지 않는 경우를 의미하나, 이에 한정되는 것은 아니다.

학습 실패 파라미터가 미리 설정된 임계치(N_train-max-try) 이상이 되는 이벤트가 발생하면, AP는 발생된 이벤트와 연관되거나 대응되는 학습된 기계 학습 네트워크와 연관되거나 대응되는 학습용 데이터를 메모리(120)에서 삭제하고, 발생된 이벤트에 대응되는 학습 환경의 상태 정보를 잠금 상태로 설정한다.

대조적으로, 실패 파라미터가 상기 미리 설정된 임계치(N_train-max-try) 미만이면, AP는 학습용 데이터를 추가적으로 획득한 이후에 재차 학습을 수행한다.

한편, 이처럼 학습이 완료된 기계 학습 네트워크라 하더라도 실사용 환경에서 학습되지 않은 기계 학습 네트워크에 비하여 더 낮은 성능을 나타낼 수 있다. 따라서, 실사용 환경에서 학습의 전/후 기계 학습 네트워크를 검증할 필요가 있다. 이에 따라, 이하에서 검증 과정을 설명한다.

J.3.2. 검증 과정

AP 및 CP 중 적어도 하나는 학습 리스트의 하나 이상이 항목을 확인하여, 검증 상태인 항목에 대하여 실사용 환경에서의 학습 전/후 기계 학습 네트워크의 성능 비교를 수행할 수 있다.

비교 결과, 새로운 기계 학습 네트워크의 성능이 더 개선된 것으로 결정되면 AP는 새로 학습된 기계 학습 네트워크를 적용하여 수신기를 제어할 수 있다. 반대로 학습 전 기계 학습 네트워크의 성능이 더 나은 것으로 결정되면 AP는 기존의 기계 학습 네트워크를 적용하여 수신기를 제어할 수 있다.

여기서, 성능은 Block Error Rate(BLER), Packet Error Rate(PER), Symbol Error Rate(SER), 또는 Bit Error Rate(BER) 등 무선 링크의 성능 측정 기준을 이용하여 비교할 수 있다.

본 명세서의 다양한 실시예에서 이용되는 성능 비교 기법은 제1 검증 기법 또는 제2 검증 기법 중 적어도 하나에 의해 수행될 수 있으나, 이에 한정되는 것은 아니다.

일 실시예에 따르면, 제1 검증 기법에서 AP는 기계 학습 네트워크의 학습이 완료되기 이전까지 학습 전 기계 학습 네트워크를 적용하여 수신 성능을 측정하고, 학습이 완료되면 새로운 기계 학습 네트워크를 적용하여 수신 성능을 측정한다.

도 28을 참조하면, AP는 P1a 구간동안에 학습 전 기계 학습 네트워크를 적용하여 통신할 수 있다(S210). 상기 S210과 같이, 학습 전 기계 학습 네트워크를 적용하여 통신하는 동안 AP는 P1a_1 구간동안 기계 학습 네트워크의 학습을 위한 학습용 데이터를 얻을 수 있다(S220). 또한, AP는 학습용 데이터가 충분히 수집되면 수집된 데이터들을 이용하여 P1a_2 구간동안 기계 학습 네트워크를 훈련할 수 있다(S240). 한편, AP는 P1a의 적어도 일부인 P1a_3 구간에서 성능 측정을 위한 데이터를 수집할 수 있다. 여기서, 수집되는 데이터는 학습 전 기계 학습 데이터의 성능을 나타낸다.

만약 기계 학습 네트워크의 학습이 완료더라도 성능 비교를 위한 충분한 성능 정보가 측정되지 않았다면, 새로운 기계 학습 네트워크를 적용하는 경우의 수신 성능 측정의 시작점은 기존의 기계 학습 네트워크의 성능 측정이 완료되는 시점까지 지연될 수 있다.

P1a 구간 이후에 AP는 P3a 구간동안 학습된 기계 학습 네트워크를 수신기에 적용할 수 있다(S250). AP는 P3a 구간의 적어도 일부동안 학습된 기계 학습 네트워크의 성능을 측정하기 위한 데이터를 수집할 수 있다(S260).

제1 검증 기법에서 AP는 학습 후 기계 학습 네트워크의 성능 측정이 완료되면, 학습 전 기계 학습 네트워크의 성능과 비교할 수 있다. 그리고, 비교 결과에 기반하여 학습 전후의 기계 학습 네트워크 중 어느 하나를 선택하여 수신기에 적용할 수 있다(S270).

예를 들어, CP는 학습용 데이터의 수집을 수행하는 기간동안에 주기적으로 또는 일정 양 이상의 데이터가 수신될 때마다 학습 전 기계 학습 네트워크의 성능을 측정하여 AP로 전달할 수 있다.

학습 전 기계 학습 네트워크에 관련된 측정된 성능 정보가 충분히 획득된 이후에, 온-디바이스 학습이 완료되어 새로운 기계 학습 네트워크의 적용이 준비된 상태에서 학습의 대상이었던 학습 환경에 진입하면 AP는 CP로 새로운 기계 학습 네트워크의 적용을 요청한다.

CP는 새로운 기계 학습 네트워크 적용 요청에 응답하여 새로운 기계 학습 네트워크를 적용하여 데이터 수신을 제어하고, 주기적으로 또는 일정 양 이상의 데이터가 수신될 때마다 새로운 기계 학습 네트워크에 의한 성능을 측정하여 AP로 전달한다.

AP는 새로운 기계 학습 네트워크에 의한 성능 데이터가 충분히 모이면 학습 전 기계 학습 네트워크에 의한 성능 데이터와 비교할 수 있다.

이때, AP는 새로운 기계 학습 네트워크의 성능이 더 개선된 것으로 판단되면, 성능 측정을 중지하고 해당 항목의 상태 정보를 적용 상태로 변경한다. 또한, AP는 상태 정보를 적용 상태로 변경함과 동시에 학습 전후의 기계 학습 네트워크의 성능 데이터를 모두 메모리에 저장할 수 있다. 이처럼, 저장된 성능 데이터들은 시간적으로 이후에 발생할 수 있는 기계 학습 네트워크의 성능 저하를 점검할 때 이용될 수 있다.

반대로, AP는 기존의 기계 학습 네트워크의 성능이 더 나은 것으로 판단되면, 검증 실패 파라미터를 1 증가한다. 검증 실패 파라미터는 검증의 실패 횟수를 의미한다. 검증 실패 파라미터가 미리 설정된 임계치(N_veryfiy-max-try) 이상이면, AP는 학습용 데이터와 학습된 기계 학습 네트워크를 메모리에서 제거한다. 또한, AP는 제거와 동시에 학습된 기계 학습 네트워크에 대응되는 학습 리스트의 항목을 잠금 상태로 변경할 수도 있다. 만약 검증 실패 파라미터가 미리 설정된 임게치(N_verify-max-try) 미만이면, 학습용 데이터를 다시 획득한 이후에 온-디바이스 학습 및 검증 과정을 다시 수행할 수 있다.

다른 실시예에 따르면, 제2 검증 기법에서 AP는 기계 학습 네트워크의 학습이 완료된 시점부터, 학습 전 기계 학습 네트워크와 학습 후 기계 학습 네트워크를 설정된 시간 간격동안 번갈아 적용하며 성능을 측정 및 비교한다.

도 29를 참조하면, AP는 P1b 구간동안에 학습 전 기계 학습 네트워크를 적용하여 통신할 수 있다(S310). 상기 S310과 같이, 학습 전 기계 학습 네트워크를 적용하여 통신하는 동안 AP는 P1b_1 구간동안 기계 학습 네트워크의 학습을 위한 학습용 데이터를 얻을 수 있다(S320). 또한, AP는 학습용 데이터가 충분히 수집되면 수집된 데이터들을 이용하여 P1b_2 구간동안 기계 학습 네트워크를 훈련할 수 있다(S330).

이후에, AP는 설정된 시간 간격동안 학습 전후의 기계 학습 네트워크의 성능의 측정 및 비교를 수차례 반복하여 수행할 수 있다(S340). 예를 들어, 제1 내지 제K 성능 비교(K는 양의 정수)가 학습 전후의 기계 학습 네트워크를 적용 및 비교하며 수행될 수 있다(S350_1, 쪋, S350_K). 이때, 성능 비교를 위한 기계 학습 네트워크의 적용 주기의 길이인 P3b_1 값과 P3b_2 값은 서로 동일할 수 있다. 또한, 수차례 반복 수행되는 성능 비교 구간의 길이(P2b_1, 쪋, P2b_K)는 모두 동일하게 설정될 수 있다.

성능 비교가 완료되면 학습 전후의 기계 학습 네트워크 중 어느 하나를 선택하여 수신기에 적용할 수 있다(S360).

예를 들어, AP는 학습 전 기계 학습 네트워크와 학습 후 기계 학습 네트워크의 성능 데이터를 측정하여 누적할 수 있다. AP는 CP로 학습 전후의 기계 학습 네트워크를 수신기에 적용하고, 성능을 측정할 것을 순차적으로 요청한다. 성능 측정의 요청 시 AP는 측정 기간 또는 측정을 수행하는 동안 수신이 필요한 데이터의 양 중 적어도 하나를 포함하는 제어 정보를 함께 전달할 수 있다. CP는 AP가 요청한 기계 학습 네트워크를 적용하여 요청된 기간동안 요청된 데이터가 수신되는 동안의 성능을 측정하여 AP로 전달할 수 있다.

AP는 학습 전후 기계 학습 네트워크의 성능 측정이 완료될 때마다 통계적 가설 검증을 통해 새로운 기계 학습 네트워크의 성능이 학습 전 기계 학습 네트워크보다 개선된 것인지 판단할 수 있다.

이때, AP는 판단 결과의 신뢰도가 미리 설정된 신뢰도(reliability)를 만족하는 것과 동시에 새로운 기계 학습 네트워크의 성능이 개선되면, 성능 비교 과정을 중지하고 새로운 기계 학습 네트워크를 수신기에 적용한다. 또한, AP는 판단 결과의 신뢰도가 미리 설정된 신뢰도를 만족하는 것과 동시에 학습 전 기계 학습 네트워크의 성능이 더 나은 것으로 판단되면, 성능 비교 과정을 중지하고 기존의 기계 학습 네트워크를 수신기에 적용한다.

다만, AP는 판단 결과의 신뢰도가 미리 설정된 신뢰도를 만족하지 못하는 경우, 검증 시간의 초과 여부를 확인한다. 이때, 허용된 성능 검증 시간을 초과하지 않았을 경우, AP는 다시 성능 데이터를 획득 및 누적하여 검증을 수행한다. 대조적으로, 허용된 성능 검증 시간을 초과한 경우, AP는 성능 비교 절차를 중지하고 학습 전 기계 학습 네트워크를 이용한다.

한편, 일부 실시예에서, AP는 성능 데이터의 획득 및 누적 이전에, 학습 전 기계 학습 네트워크와 학습 후 기계 학습 네트워크에 연관되어 측정된 성능 데이터를 초기화할 수도 있다.

J.3.3. 적용 과정

도 30을 참조하면, AP(130a) 및 CP(130b) 중 적어도 하나는 학습 리스트의 하나 이상이 항목을 확인하여, 적용 상태인 항목이면 학습된 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다. 이러한 적용 과정은 CP(130b)가 AP(130a)에 의하지 않고 직접 위치 정보를 획득할 수 없는 경우와, CP(130b)가 직접 위치 정보를 획득할 수 있는 경우로 구분될 수 있다.

우선, CP(130b)가 AP(130a)에 의하지 않고 직접 위치 정보를 획득할 수 없는 경우를 설명한다.

AP(130a)는 CP(130b)로 적용 상태인 학습 환경의 기지국 리스트(BS List)를 전송할 수 있다. 여기서, 학습 환경의 기지국 리스트는 학습 환경의 적용 반경 내부에 위치하는 하나 이상의 기지국 정보를 포함하는 리스트를 의미한다. 또한, 학습 환경의 기지국 리스트에 포함되는 하나 이상의 기지국은 학습 환경의 선정과 연관된 기지국으로 한정될 수 있다. 이에 따라, 학습된 기계 학습 네트워크(ML model)와 연관성이 적은 학습 환경의 선정과 무관한 기지국은 적용 대상에서 제외될 수 있다.

CP(130b)는 학습된 기계 학습 네트워크의 적용 대상인 기지국에 연결되거나 끊어질 때마다 AP(130a)로 통보할 수 있다.

AP(130a)는 적용 대상인 기지국에 연결되거나, 그 기지국에 연결되어 있는 동안 주기적으로 단말의 위치 정보를 획득할 수 있다. 여기서 위치 정보의 본 명세서의 다양한 실시예에서 전술한 위치 정보 획득 방법과 결합되어 수행될 수 있다. 다만, 일 실시예에서, 적용 과정의 경우, 위치 정보의 획득 주기는 단말의 이동 속도에 반비례하여 조절될 수 있다.

획득된 위치 정보에 기반하여 단말이 적용 대상 환경의 적용 반경 내부로 진입하는 이벤트가 감지되면, AP(130a)는 CP(130b)로 상기 이벤트가 감지된 환경에서 학습된 기계 학습 네트워크를 전달할 수 있다. 그리고, AP(130a)는 전달된 기계 학습 네트워크의 적용을 요청할 수 있다. 이때, 기계 학습 네트워크의 적용 요청은 전달 동작과 동시에 수행될 수 있다.

CP(130b)는 AP(130a)로부터 요청된 기계 학습 네트워크가 존재하고, 그 기계 학습 네트워크에 연관된 기지국 정보가 현재 단말과 연결된 기지국 정보와 일치하면 요청된 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다. 만약, 기지국 정보들이 일치하지 않으면, CP(130b)는 학습 전 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다.

AP(130a)는 획득된 위치 정보에 기반하여 단말이 적용 반경 이외로 이탈하면 CP(130b)로 해당 적용 반경에 대응되는 학습 환경과 연관된 기계 학습 네트워크의 적용 중지를 요청할 수 있다. 이때, CP(130b)는 적용 중지의 요청을 수신하면 학습 전 기계 학습 네트워크를 적용하여 통신을 수행할 수 있다.

한편, 다양한 실시예에서, AP(130a)는 2 이상의 적용 대상인 환경이 서로 인접하여 단말이 제1 적용 대상 환경에서 제2 적용 대상 환경으로 연속하여 이동하는 경우에는, 제1 적용 대상 환경과 연관된 제1 기계 학습 네트워크에서 수행하던 중 제2 적용 대상 환경에 진입함과 동시에 제2 적용 대상 환경과 연관된 제2 기계 학습 네트워크로 전환하여 통신하도록 제어할 수 있다.

다음으로, CP(130b)가 직접 위치 정보를 획득할 수 있는 경우를 설명한다.

도 31을 참조하면, CP(130b)는 최대 N_apply-model 개의 학습된 적용 모델 리스트(L2)를 만들어 관리할 수 있다. 여기서, N_apply-model은 1 이상의 양의 정수이다.

AP(130a)는 CP(130b)로 적용 상태인 학습 환경의 리스트를 전달한다. 이때, AP(130a)는 기지국 정보와 장소 정보 중 적어도 하나를 상기 학습 환경의 리스트와 함께 전달할 수 있다. 이때, AP(130a)는 변경 사항이 있을 때마다 변경된 정보를 전달하거나 전체 적용 상태인 학습 환경의 리스트를 다시 전달한다.

도 32를 참조하면, CP(130b)는 주기적으로 단말의 위치 정보를 획득하여 단말의 현재 위치와 적용 대상 환경들과의 거리, 단말의 이동 속도와 방향에 따라 설정된 시간 내에 진입할 가능성이 있는 적용 대상 환경들을 선정할 수 있다. 도 32의 (a)를 참조하면, 적어도 하나의 프로세서는 입력 데이터에 가중치를 적용하여 적어도 하나의 후보 환경(candidates)에 대한 점수를 산출할 수 있다. 이후에, 적어도 하나의 프로세서는 산출된 점수 중 적어도 하나를 선택하여 적용 대상 환경을 선정할 수 있다.

또한, 도 32의 (b)를 참조하면, 적어도 하나의 프로세서는 도 32의 (a)에서 이용된 기계 학습 네트워크에 시그모이드 레이어를 더 추가하여 적어도 하나의 후보 환경(candidates)에 대한 확률값을 산출할 수 있다. 이때, 산출된 확률값에 기반하여 적어도 하나의 후보 환경 중 적어도 일부가 적용 대상 환경으로 산출될 수 있다.

다시 도 31을 참조하면, CP(130b)는 학습된 기계 학습 네트워크를 가지고 있지 않은 학습 환경들이 존재하면 AP(130a)로 학습된 기계 학습 네트워크를 요청할 수 있다. 이에 따라, 리스트(L2)에 포함된 학습 환경들은 모두 이에 연관된 기계 학습 네트워크를 가질 수 있다.

다양한 실시예에서, CP(130b)는 적용 대상 환경들까지의 거리, 단말의 이동 속도와 방향 중 적어도 하나에 기반하여 위치 정보의 획득 주기를 조정할 수 있다. 적용 대상 환경들까지의 최소 거리가 작을 수록, 단말의 이동 속도가 빠를수록, 그리고 대상 환경 방향과 이동 방향이 일치할수록 주기는 짧게 설정된다.

AP(130a)는 CP(130b)로 요청받은 학습 환경의 학습된 기계 학습 네트워크를 전달할 수 있다.

CP(130b)는 AP(130a)로부터 수신한 학습된 기계 학습 네트워크를 적용 모델 리스트(L2)에 추가할 수 있다. 이때, CP(130b)는 적용 모델 리스트(L2)에 빈 공간이 없으면 설정된 시일 내에 이용할 가능성이 낮은 기계 학습 네트워크를 버리고 새로 수신한 기계 학습 네트워크를 추가한다.

CP(130b)는 학습 전 기계 학습 네트워크와 최대 N_apply-model 개의 학습된 적용 모델을 단말의 위치 정보 또는 기지국과의 연결 상태 중 적어도 하나에 기반하여 적용한다.

일 례로, 단말이 적용 대상 환경의 기지국에 연결되어 있고, 적용 반경 내에 있는 동안 CP(130b)는 적용 모델 리스트(L2)에 포함된 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다. 만약, 적용 모델 리스트에 해당 적용 반경의 학습 환경과 연관된 기계 학습 네트워크가 없으면 AP(130a)로 연관된 기계 학습 네트워크를 요청할 수 있다.

또한, 단말이 적용 대상 환경의 기지국과 연결이 끊어지거나 적용 반경에서 이탈하면 CP(130b)는 학습 전 기계 학습 네트워크를 적용하여 통신을 수행할 수 있다.

한편, AP(130a) 및 CP(130b) 중 적어도 하나는 적용 상태의 시작점에서 성능 점검 타이머를 작동시킬 수 있다. 이때, 성능 점검 타이머는 적용 상태인 학습 리스트의 항목들 각각에 대응되어 작동된다.

성능 점검 타이머가 만료되면 AP(130a)는 CP(130b)에게 성능 측정 데이터를 요청할 수 있다. 일 례로, CP(130b)가 AP(130a)에 의하지 않고 직접 위치 정보를 획득할 수 없는 경우에 AP(130a)는 학습된 기계 학습 네트워크의 적용을 요청하는 것과 함께 그 성능의 측정도 요청할 수 있다. 다른 예로, CP(130b)가 직접 위치 정보를 획득할 수 있는 경우에 AP(130a)는 적용 상태인 학습 환경의 리스트를 전달거나 그 변경 사항을 전달하는 것과 함께 상기 성능의 측정을 요청할 수 있다.

CP(130b)는 성능 측정이 요청된 환경의 학습된 기계 학습 네트워크를 적용할 때마다 성능을 측정하여 AP(130a)에게 전달한다.

설정된 양 이상의 성능 측정 데이터를 확보되면 AP(130a)는 현재 측정된 성능을 학습된 기계 학습 네트워크의 검증 과정에서 미리 저장된 성능값들과 비교하여 성능 저하 여부를 판단한다. 성능 측정 데이터는, 예를 들어, 타이머 만료 시 또는 적용반경에 진입할 때마다 타이머를 작동하여 누적될 수 있다.

이때, AP(130a)는 현재 성능이 학습된 기계 학습 네트워크의 검증 성능 대비 일정 수준 이하, 또는 학습 전 기계 학습 네트워크의 성능 이하로 떨어지면 성능 저하가 발생한 것으로 판단한다. 또한, AP(130a)는 성능 저하가 발생했으면 학습된 모델의 적용을 중지하고 획득 상태로 천이한다. 만약, 성능 저하가 발생하지 않았으면 AP(130a)는 성능 점검 타이머를 다시 재개한다.

J.4. 학습 모델의 재학습 및 잠금(Barred)

도 33을 참조하면, AP(130a) 및 CP(130b) 중 적어도 하나는 학습 리스트의 하나 이상이 항목을 확인하여, 잠금 상태인 항목이면 잠금 상태의 시작점에서 잠금 해제 타이머를 작동시킬 수 있다. 만약, 잠금 해제 타이머가 만료되면, AP(130a)는 만료된 항목을 학습 리스트에서 삭제할 수 있다. 이때, 잠금에서 해제되어 학습 리스트에서 삭제된 항목은 다시 학습 환경으로 선정될 수도 있다.

도 34를 참조하면, 적어도 하나의 프로세서는 항목이 삭제되기 이전에는 적용 반경 내부에서 위치 샘플을 얻지 않으므로, 해당 항목에 연관된 학습 환경을 선정하거나 생성할 수 없으나, 항목이 삭제되면 삭제된 항목의 적용 반경 내부에서 위치 샘플을 재차 수집할 수 있다.

위치 샘플이 설정된 수 이상 저장되면, 적어도 하나의 프로세서는 삭제된 항목과 독립적인 새로운 학습 환경을 재차 선정할 수 있다. 여기서 새로 선정되는 학습 환경은 삭제된 학습 환경과 중심 위치 및/또는 반경 정보(예: 적용 반경, 학습 반경)이 다르게 설정될 수 있다.

재차 선정된 학습 환경은 전술한 바와 같이 학습 상태로 설정된다. 이후의 중복되는 설명은 생략한다.

K. Device to Implement the Embodiment(s)

본 명세서의 다양한 실시예에 따른 방법이 적용되는 디바이스들에는 온-디바이스 학습과 연관된 사용자 인터페이스가 제공될 수 있다.

상기 사용자 인터페이스는 전체 기능 On/Off 인터페이스, 학습용 데이터 획득 가능 조건, 학습 가능 시간, 또는 학습 리스트의 상태 확인/제어 인터페이스 중 적어도 하나를 포함할 수 있다.

이때, 학습 리스트의 상태 확인/제어 인터페이스는 학습 리스트의 항목별 상태에 따라 분류하여 적용, 검증, 학습, 획득, 잠금 순서로 사용자가 상태를 인지할 수 있도록 나타낸다.

또한, 학습 리스트의 상태 확인/제어 인터페이스는 각 항목별로 정보들(예; 사용자가 설정한 환경 이름, 기지국 정보, 장소 정보, 적용 상태인 경우, 기준 모델 대비 성능 개선 정도, 잠금 상태인 경우, 잠금 만료 일시 등)을 나타낸다. 환경 이름은, 예를 들어, 우리집, 사무실 등을 나타낸다. 기지국 정보는 셀 ID, 주파수 대역을 포함할 수 있다. 장소 정보는 중심 위치 및 학습/적용 반경을 포함할 수 있다. 이때, 중심 위치는 주소와 위도/경도(/고도)로 표시될 수 있다.

한편, 사용자는 인터페이스를 통해 학습 리스트의 항목을 삭제할 수도 있다.

K.1. 통신 시스템 예

이로 제한되는 것은 아니지만, 본 문서에 개시된 본 발명의 다양한 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 기기들간에 무선 통신/연결(예, 5G)을 필요로 하는 다양한 분야에 적용될 수 있다.

이하, 도면을 참조하여 보다 구체적으로 예시한다. 이하의 도면/설명에서 동일한 도면 부호는 다르게 기술하지 않는 한, 동일하거나 대응되는 하드웨어 블록, 소프트웨어 블록 또는 기능 블록을 예시할 수 있다.

도 35은 본 발명에 적용되는 통신 시스템을 예시한다.

도 35을 참조하면, 본 발명에 적용되는 통신 시스템(1)은 무선 기기, 기지국 및 네트워크를 포함한다. 여기서, 무선 기기는 무선 접속 기술(예, 5G NR(New RAT), LTE(Long Term Evolution))을 이용하여 통신을 수행하는 기기를 의미하며, 통신/무선/5G 기기로 지칭될 수 있다. 이로 제한되는 것은 아니지만, 무선 기기는 로봇(100a), 차량(100b-1, 100b-2), XR(eXtended Reality) 기기(100c), 휴대 기기(Hand-held device)(100d), 가전(100e), IoT(Internet of Thing) 기기(100f), AI기기/서버(400)를 포함할 수 있다. 예를 들어, 차량은 무선 통신 기능이 구비된 차량, 자율 주행 차량, 차량간 통신을 수행할 수 있는 차량 등을 포함할 수 있다. 여기서, 차량은 UAV(Unmanned Aerial Vehicle)(예, 드론)를 포함할 수 있다. XR 기기는 AR(Augmented Reality)/VR(Virtual Reality)/MR(Mixed Reality) 기기를 포함하며, HMD(Head-Mounted Device), 차량에 구비된 HUD(Head-Up Display), 텔레비전, 스마트폰, 컴퓨터, 웨어러블 디바이스, 가전 기기, 디지털 사이니지(signage), 차량, 로봇 등의 형태로 구현될 수 있다. 휴대 기기는 스마트폰, 스마트패드, 웨어러블 기기(예, 스마트워치, 스마트글래스), 컴퓨터(예, 노트북 등) 등을 포함할 수 있다. 가전은 TV, 냉장고, 세탁기 등을 포함할 수 있다. IoT 기기는 센서, 스마트미터 등을 포함할 수 있다. 예를 들어, 기지국, 네트워크는 무선 기기로도 구현될 수 있으며, 특정 무선 기기(200a)는 다른 무선 기기에게 기지국/네트워크 노드로 동작할 수도 있다.

무선 기기(100a~100f)는 기지국(200)을 통해 네트워크(300)와 연결될 수 있다. 무선 기기(100a~100f)에는 AI(Artificial Intelligence) 기술이 적용될 수 있으며, 무선 기기(100a~100f)는 네트워크(300)를 통해 AI 서버(400)와 연결될 수 있다. 네트워크(300)는 3G 네트워크, 4G(예, LTE) 네트워크 또는 5G(예, NR) 네트워크 등을 이용하여 구성될 수 있다. 무선 기기(100a~100f)는 기지국(200)/네트워크(300)를 통해 서로 통신할 수도 있지만, 기지국/네트워크를 통하지 않고 직접 통신(e.g. 사이드링크 통신(sidelink communication))할 수도 있다. 예를 들어, 차량들(100b-1, 100b-2)은 직접 통신(e.g. V2V(Vehicle to Vehicle)/V2X(Vehicle to everything) communication)을 할 수 있다. 또한, IoT 기기(예, 센서)는 다른 IoT 기기(예, 센서) 또는 다른 무선 기기(100a~100f)와 직접 통신을 할 수 있다.

무선 기기(100a~100f)/기지국(200), 기지국(200)/기지국(200) 간에는 무선 통신/연결(150a, 150b, 150c)이 이뤄질 수 있다. 여기서, 무선 통신/연결은 상향/하향링크 통신(150a)과 사이드링크 통신(150b)(또는, D2D 통신), 기지국간 통신(150c)(e.g. relay, IAB(Integrated Access Backhaul)과 같은 다양한 무선 접속 기술(예, 5G NR)을 통해 이뤄질 수 있다. 무선 통신/연결(150a, 150b, 150c)을 통해 무선 기기와 기지국/무선 기기, 기지국과 기지국은 서로 무선 신호를 송신/수신할 수 있다. 예를 들어, 무선 통신/연결(150a, 150b, 150c)은 다양한 물리 채널을 통해 신호를 송신/수신할 수 있다. 이를 위해, 본 발명의 다양한 제안들에 기반하여, 무선 신호의 송신/수신을 위한 다양한 구성정보 설정 과정, 다양한 신호 처리 과정(예, 채널 인코딩/디코딩, 변조/복조, 자원 매핑/디매핑 등), 자원 할당 과정 등 중 적어도 일부가 수행될 수 있다.

K.2. 휴대 기기 예

도 36은 본 발명에 적용될 수 있는 무선 기기를 예시한다.

도 36을 참조하면, 제1 무선 기기(100)와 제2 무선 기기(200)는 다양한 무선 접속 기술(예, LTE, NR)을 통해 무선 신호를 송수신할 수 있다. 여기서, {제1 무선 기기(100), 제2 무선 기기(200)}은 도 35의 {무선 기기(100x), 기지국(200)} 및/또는 {무선 기기(100x), 무선 기기(100x)}에 대응할 수 있다.

제1 무선 기기(100)는 하나 이상의 프로세서(102) 및 하나 이상의 메모리(104)를 포함하며, 추가적으로 하나 이상의 송수신기(106) 및/또는 하나 이상의 안테나(108)을 더 포함할 수 있다. 프로세서(102)는 메모리(104) 및/또는 송수신기(106)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(102)는 메모리(104) 내의 정보를 처리하여 제1 정보/신호를 생성한 뒤, 송수신기(106)을 통해 제1 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(102)는 송수신기(106)를 통해 제2 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제2 정보/신호의 신호 처리로부터 얻은 정보를 메모리(104)에 저장할 수 있다. 메모리(104)는 프로세서(102)와 연결될 수 있고, 프로세서(102)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(104)는 프로세서(102)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(102)와 메모리(104)는 무선 통신 기술(예, LTE, NR)을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(106)는 프로세서(102)와 연결될 수 있고, 하나 이상의 안테나(108)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(106)는 송신기 및/또는 수신기를 포함할 수 있다. 송수신기(106)는 RF(Radio Frequency) 유닛과 혼용될 수 있다. 본 발명에서 무선 기기는 통신 모뎀/회로/칩을 의미할 수도 있다.

제2 무선 기기(200)는 하나 이상의 프로세서(202), 하나 이상의 메모리(204)를 포함하며, 추가적으로 하나 이상의 송수신기(206) 및/또는 하나 이상의 안테나(208)를 더 포함할 수 있다. 프로세서(202)는 메모리(204) 및/또는 송수신기(206)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(202)는 메모리(204) 내의 정보를 처리하여 제3 정보/신호를 생성한 뒤, 송수신기(206)를 통해 제3 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(202)는 송수신기(206)를 통해 제4 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제4 정보/신호의 신호 처리로부터 얻은 정보를 메모리(204)에 저장할 수 있다. 메모리(204)는 프로세서(202)와 연결될 수 있고, 프로세서(202)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(204)는 프로세서(202)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(202)와 메모리(204)는 무선 통신 기술(예, LTE, NR)을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(206)는 프로세서(202)와 연결될 수 있고, 하나 이상의 안테나(208)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(206)는 송신기 및/또는 수신기를 포함할 수 있다 송수신기(206)는 RF 유닛과 혼용될 수 있다. 본 발명에서 무선 기기는 통신 모뎀/회로/칩을 의미할 수도 있다.

이하, 무선 기기(100, 200)의 하드웨어 요소에 대해 보다 구체적으로 설명한다. 이로 제한되는 것은 아니지만, 하나 이상의 프로토콜 계층이 하나 이상의 프로세서(102, 202)에 의해 구현될 수 있다. 예를 들어, 하나 이상의 프로세서(102, 202)는 하나 이상의 계층(예, PHY, MAC, RLC, PDCP, RRC, SDAP와 같은 기능적 계층)을 구현할 수 있다. 하나 이상의 프로세서(102, 202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 하나 이상의 PDU(Protocol Data Unit) 및/또는 하나 이상의 SDU(Service Data Unit)를 생성할 수 있다. 하나 이상의 프로세서(102, 202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 메시지, 제어정보, 데이터 또는 정보를 생성할 수 있다. 하나 이상의 프로세서(102, 202)는 본 문서에 개시된 기능, 절차, 제안 및/또는 방법에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 포함하는 신호(예, 베이스밴드 신호)를 생성하여, 하나 이상의 송수신기(106, 206)에게 제공할 수 있다. 하나 이상의 프로세서(102, 202)는 하나 이상의 송수신기(106, 206)로부터 신호(예, 베이스밴드 신호)를 수신할 수 있고, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 획득할 수 있다.

하나 이상의 프로세서(102, 202)는 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 마이크로 컴퓨터로 지칭될 수 있다. 하나 이상의 프로세서(102, 202)는 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합에 의해 구현될 수 있다. 일 예로, 하나 이상의 ASIC(Application Specific Integrated Circuit), 하나 이상의 DSP(Digital Signal Processor), 하나 이상의 DSPD(Digital Signal Processing Device), 하나 이상의 PLD(Programmable Logic Device) 또는 하나 이상의 FPGA(Field Programmable Gate Arrays)가 하나 이상의 프로세서(102, 202)에 포함될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있고, 펌웨어 또는 소프트웨어는 모듈, 절차, 기능 등을 포함하도록 구현될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 수행하도록 설정된 펌웨어 또는 소프트웨어는 하나 이상의 프로세서(102, 202)에 포함되거나, 하나 이상의 메모리(104, 204)에 저장되어 하나 이상의 프로세서(102, 202)에 의해 구동될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 코드, 명령어 및/또는 명령어의 집합 형태로 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있다.

하나 이상의 메모리(104, 204)는 하나 이상의 프로세서(102, 202)와 연결될 수 있고, 다양한 형태의 데이터, 신호, 메시지, 정보, 프로그램, 코드, 지시 및/또는 명령을 저장할 수 있다. 하나 이상의 메모리(104, 204)는 ROM, RAM, EPROM, 플래시 메모리, 하드 드라이브, 레지스터, 캐쉬 메모리, 컴퓨터 판독 저장 매체 및/또는 이들의 조합으로 구성될 수 있다. 하나 이상의 메모리(104, 204)는 하나 이상의 프로세서(102, 202)의 내부 및/또는 외부에 위치할 수 있다. 또한, 하나 이상의 메모리(104, 204)는 유선 또는 무선 연결과 같은 다양한 기술을 통해 하나 이상의 프로세서(102, 202)와 연결될 수 있다.

하나 이상의 송수신기(106, 206)는 하나 이상의 다른 장치에게 본 문서의 방법들 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 전송할 수 있다. 하나 이상의 송수신기(106, 206)는 하나 이상의 다른 장치로부터 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 수신할 수 있다. 예를 들어, 하나 이상의 송수신기(106, 206)는 하나 이상의 프로세서(102, 202)와 연결될 수 있고, 무선 신호를 송수신할 수 있다. 예를 들어, 하나 이상의 프로세서(102, 202)는 하나 이상의 송수신기(106, 206)가 하나 이상의 다른 장치에게 사용자 데이터, 제어 정보 또는 무선 신호를 전송하도록 제어할 수 있다. 또한, 하나 이상의 프로세서(102, 202)는 하나 이상의 송수신기(106, 206)가 하나 이상의 다른 장치로부터 사용자 데이터, 제어 정보 또는 무선 신호를 수신하도록 제어할 수 있다. 또한, 하나 이상의 송수신기(106, 206)는 하나 이상의 안테나(108, 208)와 연결될 수 있고, 하나 이상의 송수신기(106, 206)는 하나 이상의 안테나(108, 208)를 통해 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 송수신하도록 설정될 수 있다. 본 문서에서, 하나 이상의 안테나는 복수의 물리 안테나이거나, 복수의 논리 안테나(예, 안테나 포트)일 수 있다. 하나 이상의 송수신기(106, 206)는 수신된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 하나 이상의 프로세서(102, 202)를 이용하여 처리하기 위해, 수신된 무선 신호/채널 등을 RF 밴드 신호에서 베이스밴드 신호로 변환(Convert)할 수 있다. 하나 이상의 송수신기(106, 206)는 하나 이상의 프로세서(102, 202)를 이용하여 처리된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 베이스밴드 신호에서 RF 밴드 신호로 변환할 수 있다. 이를 위하여, 하나 이상의 송수신기(106, 206)는 (아날로그) 오실레이터 및/또는 필터를 포함할 수 있다.

전술한 본 명세서는, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 명세서의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 명세서의 등가적 범위 내에서의 모든 변경은 본 명세서의 범위에 포함된다.

Claims

다중 송신 안테나와 다중 수신 안테나를 이용하여 MIMO(multi-input-multi-output) 통신 채널을 통해 통신하기 위한 적어도 하나의 기계 학습 네트워크를 훈련하기 위하여 단말의 적어도 하나의 프로세서에 의해 수행되는 방법으로서,

상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 단계;

상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻는 단계; 및

상기 훈련 데이터를 이용하여 상기 제1 기계 학습 네트워크를 업데이트하는 단계;

를 포함하는, 방법.
제1 항에 있어서,

상기 학습 리스트를 생성하는 단계는,

하나 이상의 기지국 별로 얻은 연결 정보와 기지국 정보 중 적어도 하나로 구성된 하나 이상의 제2 항목을 포함하는 연결 리스트를 생성하는 단계;

상기 연결 리스트의 연결 정보에 기반하여 후보 리스트에 업데이트하는 단계;

상기 후보 리스트에 포함된 하나 이상의 제3 항목 중 어느 하나에 설정된 가중치를 적용하여 하나 이상의 항목을 선정하여 선정 리스트에 업데이트하는 단계;

상기 선정 리스트에 포함된 적어도 하나의 제4 항목에 연관된 상기 단말의 위치 샘플에 기반하여 상기 학습 리스트에 추가될 상기 하나 이상의 제1 항목을 생성하는 단계;

를 포함하는, 방법.
제1 항에 있어서,

상기 학습 리스트는,

상기 제1 항목 별로 구분되는 장소 정보와 기지국 정보를 갖는, 방법.
제3 항에 있어서,

상기 장소 정보는,

학습이 완료된 상기 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함하는, 방법.
제4 항에 있어서,

상기 이벤트는,

상기 단말이 상기 수집 영역에 진입하거나 위치하는 것이 감지되는 것인, 방법.
제4 항에 있어서,

상기 단말이 상기 적용 영역에 위치하는 것이 감지되면, 상기 위치 샘플의 수집을 중단하는, 방법.
제4 항에 있어서,

상기 학습 리스트를 생성하는 단계는,

상기 단말이 상기 수집 영역에 진입하면 상기 단말의 위치 샘플을 얻는 단계;

상기 얻은 위치 샘플들의 수가 설정된 수 이상이면, 상기 위치 샘플들을 대상으로 클러스터링 알고리즘을 적용하여 하나 이상의 통신 환경을 결정하는 단계; 및

상기 결정된 하나 이상의 통신 환경을 상기 학습 리스트의 각 항목으로 설정하는 단계;

를 포함하는, 방법.
제4 항에 있어서,

상기 적용 영역에 진입하면, 상기 적용 영역에서 적용될 기계 학습 네트워크를 확인하는 단계;

상기 확인된 기계 학습 네트워크에 기초하여, 수신기를 제어하는 단계;

를 더 포함하는, 방법.
제4 항에 있어서,

상기 단말이 2 이상의 적용 영역에 위치하는 경우, 상기 2 이상의 적용 영역에 대응되는 제1 항목들 중 어느 하나를 선택하는 단계;

상기 선택된 제1 항목에서 적용될 기계 학습 네트워크를 확인하는 단계; 및

상기 확인된 기계 학습 네트워크에 기초하여 수신기를 제어하는 단계;

를 더 포함하는, 방법.
제9 항에 있어서,

상기 제1 항목들 중 어느 하나를 선택하는 단계는,

상기 2 이상의 적용 영역의 반경을 비교하는 단계;

상기 비교에 기초하여, 상기 2 이상의 제1 항목들 중 어느 하나를 선택하는 단계;

를 포함하는, 방법.
제1 항에 있어서,

상기 기계 학습 네트워크는 심층 신경망(Deep Neural Network, DNN), 컨볼루션 신경망(Convolutional Neural Network, CNN), 또는 파라메트릭 곱셈들, 덧셈들, 및 비 선형성들을 포함하는 순환 신경망(Recurrent Neural Network, RNN) 중 적어도 하나를 포함하는, 방법.
제1 항에 있어서,

상기 훈련 데이터는,

수신 관련 파라미터를 나타내는, 방법.
제12 항에 있어서,

상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함하는, 방법.
제1 항에 있어서,

상기 기계 학습 네트워크를 업데이트하는 동안 업데이트 전인 제1 네트워크에 의해 측정된 제1 성능 지표와 업데이트 후인 제2 네트워크에 의해 측정된 제2 성능 지표를 비교하는 단계; 및

상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계;

를 더 포함하는, 방법.
제1 항에 있어서,

상기 기계 학습 네트워크가 업데이트되면, 업데이트 전인 제1 네트워크를 적용하여 측정되는 제1 성능 지표와 업데이트 후인 제2 네트워크를 적용하여 측정되는 제2 성능 지표를 비교하는 단계; 및

상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계;

를 더 포함하는, 방법.
제15 항에 있어서,

상기 비교의 신뢰도(reliablity)가 설정된 기준값 미만이면, 상기 제1, 제2 성능 지표를 다시 측정하여 비교하는 단계;

를 더 포함하는, 방법.
제1 항에 있어서,

상기 학습 리스트는,

상기 제1 항목 별 상태 정보를 포함하고,

상기 상태 정보는, 획득 상태, 훈련 상태, 검증 상태, 적용 상태, 또는 잠금 상태 중 적어도 하나를 포함하되,

상기 기계 학습 네트워크는 상기 상태 정보에 기초하여 상기 훈련 데이터의 수집, 상기 기계 학습 네트워크의 학습, 검증, 적용, 또는 잠금 중 적어도 하나가 결정되는, 방법.
제1 항에 있어서,

상기 기계 학습 네트워크의 업데이트의 일반화가 실패하면, 상기 기계 학습 네트워크에 대응되는 실패 횟수를 증가하는 단계;

상기 실패 횟수가 설정된 최대 횟수를 초과하면, (i) 상기 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화하고, (ii) 상기 제1 항목의 상태를 잠금 상태로 전환하는, 방법.
무선 통신 시스템에서, 기계 학습 기반 수신기가 적용된 단말에 있어서,

트랜시버;

적어도 하나의 프로세서; 및

상기 적어도 하나의 프로세서에 연결되고, 명령들(instructions)을 저장하는 적어도 하나의 메모리를 포함하고, 상기 명령들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 다중의 수신 안테나를 이용하여 MIMO 통신 채널을 통해 통신하기 위한 동작들을 지원하고,

상기 동작들은,

상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 동작,

상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용되는 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻는 동작, 및

상기 훈련 데이터를 이용하여 상기 기계 학습 네트워크를 업데이트하는 동작을 포함하는, 단말.
제1 항의 방법을 컴퓨터 시스템에서 실행하기 위한 프로그램이 기록된 컴퓨터 시스템이 판독 가능한 기록매체.