KR20190086133A - 강화 학습 기반 다중 안테나 송수신단의 i/q 불균형 파라미터 추정 방법 및 시스템 - Google Patents

강화 학습 기반 다중 안테나 송수신단의 i/q 불균형 파라미터 추정 방법 및 시스템 Download PDF

Info

Publication number
KR20190086133A
KR20190086133A KR1020180004290A KR20180004290A KR20190086133A KR 20190086133 A KR20190086133 A KR 20190086133A KR 1020180004290 A KR1020180004290 A KR 1020180004290A KR 20180004290 A KR20180004290 A KR 20180004290A KR 20190086133 A KR20190086133 A KR 20190086133A
Authority
KR
South Korea
Prior art keywords
imbalance
value
estimating
compensation
parameter
Prior art date
Application number
KR1020180004290A
Other languages
English (en)
Other versions
KR102027674B1 (ko
Inventor
박현철
지정주
권기림
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020180004290A priority Critical patent/KR102027674B1/ko
Publication of KR20190086133A publication Critical patent/KR20190086133A/ko
Application granted granted Critical
Publication of KR102027674B1 publication Critical patent/KR102027674B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/0222Estimation of channel variability, e.g. coherence bandwidth, coherence time, fading frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/024Channel estimation channel estimation algorithms
    • H04L25/0256Channel estimation using minimum mean square error criteria

Abstract

강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템이 제시된다. 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법은, 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하는 단계; I/Q 불균형 값이 포함된 유효 채널을 측정하는 단계; 이전 단계(step)에서 추정한 상기 송신단 또는 상기 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하는 단계; 계산된 상기 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산하는 단계; 상기 I/Q 불균형이 보상된 유효 채널을 이용하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하는 단계; 상기 코스트(cost)에 비례하여 보상(reward)을 계산하는 단계; 및 상기 보상을 기반으로 다음 단계 크기(step size)를 설정하는 단계를 포함하여 이루어질 수 있다.

Description

강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템{METHOD AND SYSTEM FOR ESTIMATING I/Q IMBALANCE PARAMETER OF TRANSCEIVER BASED ON REINFORCEMENT LEARNING}
아래의 실시예들은 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템에 관한 것으로, 더욱 상세하게는 송수신단에 I/Q 불균형이 존재하는 다중 안테나 시스템에서 강화 학습 기법을 이용한 I/Q 불균형 파라미터의 추정 방법 및 시스템에 관한 것이다.
많은 수의 기지국 안테나를 사용한 대용량 다중 입력 다중 출력(massive Multi Input Multi Output, massive MIMO) 기술은 사용자 간 신호 간섭을 제거하고 높은 주파수 효율을 내는 기술로 최근 각광을 받고 있다.
많은 수의 안테나를 사용하기 위해서는 저비용의 소자를 사용해야 하며, 이러한 RF 소자에서 발생하는 동 위상(in-phase) 성분 및 직교 위상(quadrature phase) 성분 불균형(I/Q 불균형)은 반송파의 동 위상 성분과 직교 위상 성분의 진폭과 위상에 불일치를 발생시켜 직교성을 떨어뜨리고 간섭을 발생시켜 성능을 크게 떨어뜨린다.
종래에 I/Q 불균형의 영향을 보상하는 기법이 제안되었으나, 이러한 기법을 위해서는 I/Q 불균형 파라미터(parameter)의 추정이 필요하다.
한국공개특허 10-2009-0089531호는 이러한 직교 주파수 분할 다중 수신기에서 아이/큐 불균형 파라미터를 추정하는 장치 및 방법에 관한 것으로, 휴대용 단말기의 외장 메모리에 저장된 파일을 효율적으로 관리하기 위한 방법 및 장치에 관한 기술을 기재하고 있다.
한국공개특허 10-2009-0089531호
실시예들은 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템에 관하여 기술하며, 보다 구체적으로 송수신단에 I/Q 불균형이 존재하는 다중 안테나 시스템에서 강화 학습 기법을 이용한 I/Q 불균형 파라미터의 추정 기술을 제공한다.
실시예들은 보상 계산을 I/Q 불균형이 보상된 정도로 측정하여, 시간에 따라 맞는 값으로 수렴하게 하며 파라미터 변화에 강인한 특성을 갖는 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템을 제공하는데 있다.
일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법은, 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하는 단계; I/Q 불균형 값이 포함된 유효 채널을 측정하는 단계; 이전 단계(step)에서 추정한 상기 송신단 또는 상기 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하는 단계; 계산된 상기 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산하는 단계; 상기 I/Q 불균형이 보상된 유효 채널을 이용하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하는 단계; 상기 코스트(cost)에 비례하여 보상(reward)을 계산하는 단계; 및 상기 보상을 기반으로 다음 단계 크기(step size)를 설정하는 단계를 포함하여 이루어질 수 있다.
상기 송신단 또는 상기 수신단에서 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택하는 단계; 및 선택된 상기 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 하는 단계를 포함하고, 상기 단계를 각 파라미터에 대해 반복하여 계산할 수 있다.
상기 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산하는 단계는, 보상기를 통해 상기 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산한 후 보상 생성기로 전달할 수 있다.
상기 I/Q 불균형이 보상된 유효 채널을 이용하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하는 단계는, 상기 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 보상 생성기에서 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하며, 오그멘티드 채널 노테이션(augmented channel notation)에서 실수부에 해당하는 부분과 허수부에 해당하는 부분의 정도를 비교하여 계산할 수 있다.
상기 보상을 기반으로 다음 단계 크기(step size)를 설정하는 단계는, 상기 단계 크기를 코스트(cost)에 비례하게 설정하여 상기 보상이 큰 경우, 추정 값이 실제 값에 가까운 것이므로 상기 단계 크기를 감소시키고, 상기 보상이 작은 경우, 추정 값이 실제 값과 차이가 큰 것이므로 상기 단계 크기를 크게 설정할 수 있다.
상기 송신단은 사용자 단말이고 상기 수신단은 기지국이며, 상기 I/Q 불균형 값은, 기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값이 될 수 있다.
다른 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템은, 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하고, I/Q 불균형 값이 포함된 유효 채널을 측정하며, 이전 단계(step)에서 추정한 상기 송신단 또는 상기 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하고 I/Q 불균형이 보상된 유효 채널을 계산하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하고, 상기 코스트(cost)에 비례하여 보상(reward)을 계산하는 수신단을 포함하여 이루어질 수 있다.
상기 수신단은, 보상된 상기 보상 중 더 높은 보상을 주는 행동(action)을 선택하여, 선택된 상기 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 할 수 있다.
상기 송신단은 사용자 단말이고 상기 수신단은 기지국이며, 상기 I/Q 불균형 값은, 기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값이 될 수 있다.
또 다른 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템은, 송신단으로부터 신호를 전달 받아 유효 채널을 추정하는 보상기; 및 상기 보상기로부터 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하고, 상기 코스트(cost)에 비례하여 보상(reward)을 계산하는 보상 생성기를 포함하고, 상기 보상기는, 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하고, I/Q 불균형 값이 포함된 유효 채널을 측정하며, 이전 단계(step)에서 추정한 상기 송신단 또는 상기 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하고 I/Q 불균형이 보상된 유효 채널을 계산할 수 있다.
상기 수신단은, 보상된 상기 보상 중 더 높은 보상을 주는 행동(action)을 선택하고, 상기 보상기는, 선택된 상기 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 할 수 있다.
상기 보상 생성기는, 상기 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 보상 생성기에서 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하며, 오그멘티드 채널 노테이션(augmented channel notation)에서 실수부에 해당하는 부분과 허수부에 해당하는 부분의 정도를 비교하여 계산할 수 있다.
상기 보상기는, 상기 보상을 기반으로 다음 단계 크기(step size)를 설정하며, 상기 단계 크기를 코스트(cost)에 비례하게 설정하여 상기 보상이 큰 경우, 추정 값이 실제 값에 가까운 것이므로 상기 단계 크기를 감소시키고, 상기 보상이 작은 경우, 추정 값이 실제 값과 차이가 큰 것이므로 상기 단계 크기를 크게 설정할 수 있다.
상기 송신단은 사용자 단말이고 상기 수신단은 기지국이며, 상기 I/Q 불균형 값은, 기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값이 될 수 있다.
강화 학습을 기반으로 측정된 상기 유효 채널로부터 I/Q 불균형 파라미터를 임의로 추정하고 보상하는 방법으로 반복(iterative)하여 추정하며, 상기 I/Q 불균형의 추정 정도에 따른 보상을 계산하여 행동(action)의 크기를 적응적으로(adaptive) 조정하여 수렴 속도와 수렴 정확도를 조절할 수 있다.
실시예들에 따르면 보상 계산을 I/Q 불균형이 보상된 정도로 측정하여, 시간에 따라 맞는 값으로 수렴하게 하며 파라미터 변화에 강인한 특성을 갖는 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템을 제공할 수 있다.
또한, 실시예들에 따르면 기존의 보상 값을 기반으로 다음 행동의 크기를 결정하기 때문에, 초기에는 빠른 수렴 속도를 가지며 수렴의 정확도가 높고, 많은 수의 안테나를 사용하는 통신 시스템에서 발생하는 I/Q 불균형을 해결하기 위해 사용될 수 있다.
도 1은 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템을 나타내는 블록도이다.
도 2는 일 실시예에 따른 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법을 나타내는 흐름도이다.
도 3은 일 실시예에 따른 진폭 불균형 파라미터 추정 MSE를 나타낸 도면이다.
도 4는 일 실시예에 따른 위상 불균형 파라미터 추정 MSE를 나타낸 도면이다.
이하, 첨부된 도면을 참조하여 실시예들을 설명한다. 그러나, 기술되는 실시예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 이하 설명되는 실시예들에 의하여 한정되는 것은 아니다. 또한, 여러 실시예들은 당해 기술분야에서 평균적인 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위해서 제공되는 것이다. 도면에서 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.
본 명세서에서 본 발명의 실시예들을 기지국과 단말 간의 데이터 송신 및 수신의 관계를 중심으로 설명한다. 여기서, 기지국은 단말과 직접적으로 통신을 수행하는 네트워크의 종단 노드(terminal node)로서의 의미를 갖는다. 아래에서 기지국에 의해 수행되는 것으로 설명된 특정 동작은 경우에 따라서는 기지국의 상위 노드(upper node)에 의해 수행될 수도 있다.
즉, 기지국을 포함하는 다수의 네트워크 노드들(network nodes)로 이루어지는 네트워크에서 단말과의 통신을 위해 수행되는 다양한 동작들은 기지국 또는 기지국 이외의 다른 네트워크 노드들에 의해 수행될 수 있음은 자명하다. '기지국(BS: Base Station)'은 고정국(fixed station), Node B, eNode B(eNB), 액세스 포인트(AP: Access Point) 등의 용어에 의해 대체될 수 있다. 또한, 아래에서 기지국이라는 용어는 셀 또는 섹터를 포함하는 개념으로 사용될 수 있다. 한편, 중계기는 Relay Node(RN), Relay Station(RS) 등의 용어에 의해 대체될 수 있다. '단말(Terminal)'은 UE(User Equipment), MS(Mobile Station), MSS(Mobile Subscriber Station), SS(Subscriber Station) 등의 용어로 대체될 수 있다.
이하의 설명에서 사용되는 특정 용어들은 본 발명의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 발명의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
몇몇의 경우, 본 발명의 개념이 모호해지는 것을 피하기 위하여 공지의 구조 및 장치는 생략되거나, 각 구조 및 장치의 핵심기능을 중심으로 한 블록도 형식으로 도시될 수 있다. 또한, 본 명세서 전체에서 동일한 구성요소에 대해서는 동일한 도면 부호를 사용하여 설명한다.
본 실시예에서는 다중 안테나 통신 시스템의 송신단과 수신단에서 I/Q 불균형이 발생하는 시스템을 고려한다. 종래에 I/Q 불균형의 영향을 보상하는 기법이 제안되었으나, 이러한 기법을 위해서는 I/Q 불균형 파라미터의 추정이 필요하다. 또한, I/Q 불균형이 수신단과 송신단 양쪽에서 발생하는 경우, 구해야 하는 변수의 수가 방정식의 수보다 많아 직접적인 계산이 불가능하다.
안테나의 수가 증가하는 대용량(massive) MIMO 시스템에서는 추정해야 하는 I/Q 불균형 파라미터의 수가 안테나 수에 비례해서 증가하기 때문에 모든 상황에 대한 라벨(label)을 제공하는 지도 학습 기법은 필요한 훈련 데이터의 수가 커서 사용하기 적합하지 않다.
한편, 강화 학습은 훈련 데이터가 필요하지 않고 에이전트(agent)가 보상을 크게 하는 방향으로 행동(action)을 진행하며 학습을 진행하므로, 제안한 문제에 적합하다.
아래의 실시예에서는 송수신단에 I/Q 불균형이 존재하는 다중 안테나 시스템에서 강화 학습 기법을 이용한 I/Q 불균형 파라미터의 추정 알고리즘을 제안한다. 제안한 알고리즘은 시간에 따라 시스템이 적응적으로 파라미터의 추정 오차를 감소시키도록 설계되었으며, 시스템의 변화에 강인한 특징을 가지고 있다.
다중 안테나의 RF 소자에서 발생하는 I/Q 불균형은 동 위상 신호와 직교 위상 신호에 간섭을 발생시켜 전송 속도를 크게 떨어뜨린다. 이를 보상하기 위해서는 정확한 I/Q 불균형 파라미터의 추정이 필요한데, 본 실시예에 따르면 정확한 I/Q 불균형 파라미터의 추정이 가능하므로 더 높은 전송 속도를 가지는 무선통신이 가능하다.
도 1은 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템을 나타내는 블록도이다.
도 1을 참조하면, 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템은 강화 학습 기반으로 다수의 안테나를 시스템의 기지국(BS)과 사용자 단말(UT)에서 I/Q 불균형을 추정할 수 있다.
일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템(100)은 사용자 단말(UT, 110)과 기지국(BS, 140) 사이에 보상기(compensator, 120)와 보상 생성기(reward generator, 130)로 구성될 수 있다.
사용자 단말(110)에서는 파일럿(pilot) 신호를 전송하여 기지국(140)에서 유효 채널을 추정하도록 할 수 있다.
기지국(140)에서는 수신한 채널 정보를 기존에 추정한 I/Q 불균형 파라미터를 기반으로 기존 단계 크기(step size)만큼 I/Q 불균형 값을 증가 또는 감소시켜 해당하는 값의 I/Q 불균형 행렬의 추정 값을 계산하여 기지국(140)와 사용자 단말(110) 양쪽에서 보상할 수 있다.
보상된 채널 정보는 보상 생성기(130)의 입력으로 전달하며, 보상 생성기(130)는 입력된 행렬 값으로부터 I/Q 불균형이 보상된 정도를 측정한다. 이는 오그멘티드 채널 노테이션(augmented channel notation)에서 실수부에 해당하는 부분과 허수부에 해당하는 부분의 정도를 비교하여 계산한다.
보상된 정도에 비례하여 보상(reward)을 계산한다.
기지국(140)에서는 보상된 보상 중 더 높은 보상을 주는 행동을 선택한다. 여기에서는 파라미터의 증가 또는 감소 중 보상을 크게 주는 방향으로 행동을 취한다
받은 보상을 기반으로 다음 단계 크기를 설정한다. 기존의 보상이 컸던 경우 추정 값이 실제 값에 가까운 것이므로 단계 크기를 감소시키고, 보상이 작은 경우 추정 값이 실제 값과 차이가 큰 것이므로 단계 크기를 크게 설정한다. 이상의 과정을 모든 파라미터에 대해서 반복한다.
아래에서 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템을 하나의 예를 들어 보다 구체적으로 설명한다.
일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템(100)은 보상기(120) 및 보상 생성기(130)를 포함하여 이루어질 수 있다. 한편, 송신단은 사용자 단말(110)이고 수신단은 기지국(140)이며, I/Q 불균형 값은 기지국(140) 진폭(gain) 불균형 값, 기지국(140) 위상(phase) 불균형 값, 사용자 단말(110) 진폭 불균형 값 및 사용자 단말(110) 위상 불균형 값이 될 수 있다.
보상기(120)는 송신단으로부터 신호를 전달 받아 유효 채널을 추정할 수 있다. 또한, 보상기(120)는 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하고, I/Q 불균형 값이 포함된 유효 채널을 측정하며, 이전 단계(step)에서 추정한 송신단 또는 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하고 I/Q 불균형이 보상된 유효 채널을 계산할 수 있다.
한편, 수신단은 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택하고, 보상기(120)는 수신단에서 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택함에 따라 선택된 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 할 수 있다.
보상기(120)는 보상을 기반으로 다음 단계 크기(step size)를 설정하며, 단계 크기를 코스트(cost)에 비례하게 설정하여 보상이 큰 경우, 추정 값이 실제 값에 가까운 것이므로 단계 크기를 감소시키고, 보상이 작은 경우, 추정 값이 실제 값과 차이가 큰 것이므로 단계 크기를 크게 설정할 수 있다.
보상 생성기(130)는 보상기(120)로부터 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하고, 코스트(cost)에 비례하여 보상(reward)을 계산할 수 있다.
또한, 보상 생성기(130)는 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 보상 생성기(130)에서 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하며, 오그멘티드 채널 노테이션(augmented channel notation)에서 실수부에 해당하는 부분과 허수부에 해당하는 부분의 정도를 비교하여 계산할 수 있다.
강화 학습을 기반으로 측정된 유효 채널로부터 I/Q 불균형 파라미터를 임의로 추정하고 보상하는 방법으로 반복(iterative)하여 추정하며, I/Q 불균형의 추정 정도에 따른 보상을 계산하여 행동(action)의 크기를 적응적으로(adaptive) 조정하여 수렴 속도와 수렴 정확도를 조절할 수 있다.
실시예들에 따르면 보상 계산을 I/Q 불균형이 보상된 정도로 측정하여, 시간에 따라 맞는 값으로 수렴하게 하며 파라미터 변화에 강인한 특성을 가진다. 기존의 보상 값을 기반으로 다음 행동의 크기를 결정하기 때문에, 초기에는 빠른 수렴 속도를 가지며 수렴의 정확도가 높다. 그리고 많은 수의 안테나를 사용하는 통신 시스템에서 발생하는 I/Q 불균형을 해결하기 위해 사용될 수 있다.
다른 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템은 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하고, I/Q 불균형 값이 포함된 유효 채널을 측정하며, 이전 단계(step)에서 추정한 송신단 또는 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하고 I/Q 불균형이 보상된 유효 채널을 계산하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하고, 코스트(cost)에 비례하여 보상(reward)을 계산하는 수신단을 포함하여 이루어질 수 있다.
수신단은 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택하여, 선택된 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 할 수 있다.
예를 들어, 수신단은 보상기 및 보상 생성기를 포함할 수 있으며, 이러한 특징을 앞에서 설명한 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템의 설명과 중복되어 생략한다.
한편, 송신단은 사용자 단말이고 수신단은 기지국이며, I/Q 불균형 값은 기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값이 될 수 있다.
도 2는 일 실시예에 따른 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법을 나타내는 흐름도이다.
도 2를 참조하면, 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법은, 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하는 단계(210), I/Q 불균형 값이 포함된 유효 채널을 측정하는 단계(220), 이전 단계(step)에서 추정한 송신단 또는 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하는 단계(230), 계산된 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산하는 단계(240), I/Q 불균형이 보상된 유효 채널을 이용하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하는 단계(250), 코스트(cost)에 비례하여 보상(reward)을 계산하는 단계(260), 및 보상을 기반으로 다음 단계 크기(step size)를 설정하는 단계(270)를 포함하여 이루어질 수 있다.
송신단 또는 수신단에서 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택하는 단계(280) 및 선택된 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 하는 단계(290)를 포함하고, 상기 단계를 각 파라미터에 대해 반복하여 계산할 수 있다.
실시예들에 따르면, 강화 학습을 기반으로 측정된 채널로부터 I/Q 불균형 파라미터를 임의로 추정하고 보상하는 방법으로 반복(iterative)하여 추정하며, 현재 I/Q 불균형의 추정 정도에 따른 보상을 계산하여 행동(action)의 크기를 적응적으로(adaptive) 조정하여 수렴 속도와 수렴 정확도를 조절할 수 있다.
아래에서 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법을 보다 구체적으로 설명한다.
일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법은 도 1에서 설명한 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템을 이용하여 하나의 예를 들어 설명할 수 있다. 여기서, 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템은 사용자 단말(UT)과 기지국(BS,) 사이에 보상기(compensator)와 보상 생성기(reward generator)로 구성될 수 있다.
단계(210)는, 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정할 수 있다. 한편, 송신단은 사용자 단말이고 수신단은 기지국이 될 수 있으며, I/Q 불균형 값은 기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값이 될 수 있다.
단계(220)에서, I/Q 불균형 값이 포함된 유효 채널을 측정할 수 있다.
단계(220)에서, 이전 단계(step)에서 추정한 송신단 또는 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산할 수 있다.
단계(240)에서, 계산된 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산할 수 있다. 이 때, 보상기를 통해 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산한 후 보상 생성기로 전달할 수 있다.
단계(250)에서, I/Q 불균형이 보상된 유효 채널을 이용하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정할 수 있다. 여기서, I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 보상 생성기에서 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하며, 오그멘티드 채널 노테이션(augmented channel notation)에서 실수부에 해당하는 부분과 허수부에 해당하는 부분의 정도를 비교하여 계산할 수 있다.
단계(260)에서, 코스트(cost)에 비례하여 보상(reward)을 계산할 수 있다.
단계(270)에서, 보상을 기반으로 다음 단계 크기(step size)를 설정할 수 있다. 여기서, 단계 크기를 코스트(cost)에 비례하게 설정하여 보상이 큰 경우, 추정 값이 실제 값에 가까운 것이므로 단계 크기를 감소시키고, 보상이 작은 경우, 추정 값이 실제 값과 차이가 큰 것이므로 단계 크기를 크게 설정할 수 있다.
또한, 단계(280)에서, 송신단 또는 수신단에서 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택할 수 있다.
단계(290)에서, 선택된 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 할 수 있다. 여기서, 단계(280)을 생략하고, 송신단 또는 수신단에서 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택함에 따라 선택된 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 할 수도 있다.
아래에서는 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템을 하나의 예를 들어 보다 상세히 설명한다.
먼저, 송수신단 I/Q 불균형이 발생하는 다중 안테나 수신 신호 모델을 설명한다.
N 개의 안테나를 가진 기지국과 단일 안테나를 K 명의 사용자가 존재하는 다중 안테나 시스템에서 송수신단 양쪽에서 I/Q 불균형이 경우 하향링크 수신 신호는 다음 식과 같이 나타낼 수 있다. 여기서, N은 기지국(BS)의 안테나 수이고, K는 사용자 단말(UT)의 수를 나타낸다.
[식 1]
Figure pat00001
여기서,
Figure pat00002
는 오그멘티드(augmented) 수신 심볼 벡터,
Figure pat00003
이고,
Figure pat00004
는 오그멘티드(augmented) 백색잡음(AWGN) 벡터,
Figure pat00005
이며,
Figure pat00006
는 오그멘티드(augmented) 송신 심볼 벡터,
Figure pat00007
이다.
Figure pat00008
는 오그멘티드(augmented) 채널 행렬,
Figure pat00009
이고,
Figure pat00010
는 프리코더(precoder) 행렬,
Figure pat00011
이다. 또한,
Figure pat00012
는 UT I/Q 불균형 행렬,
Figure pat00013
이고,
Figure pat00014
는 BS I/Q 불균형 행렬,
Figure pat00015
이며,
Figure pat00016
는 잡음 I/Q 불균형 행렬,
Figure pat00017
이다.
그리고,
Figure pat00018
은 다음 식과 같이 모델링이 가능하다.
[식 2]
Figure pat00019
여기서,
Figure pat00020
는 치환(permutation) 행렬,
Figure pat00021
이고,
Figure pat00022
Figure pat00023
을 위한 정규화 상수(normalize constant)이며, 기지국 치환 행렬(permutation matrix)
Figure pat00024
는 다음 식과 같은 성분을 가진다.
Figure pat00025
Figure pat00026
는 추적 연산자(Trace operator)이다.
[식 3]
Figure pat00027
여기서,
Figure pat00028
는 I 성분과 Q 성분이 분리되어 있는 오그멘티드 벡터(augmented vector)를 RF 체인(chain)별로 순서를 바꾸는 역할을 한다.
Figure pat00029
는 다음 식과 같이 정의될 수 있다.
[식 4]
Figure pat00030
Figure pat00031
n 번째 RF 체인의 I/Q 불균형 성분 행렬이며, 다음 식과 같이 나타낼 수 있다.
[식 5]
Figure pat00032
여기서,
Figure pat00033
n 번째 BS의 진폭 불균형이고,
Figure pat00034
n 번째 BS의 위상 불균형이다.
사용자 단말에서 발생하는 I/Q 불균형 행렬은 기지국 I/Q 불균형 행렬과 유사한 구조로 모델링되며, 다음 식과 같이 나타낼 수 있다.
[식 6]
Figure pat00035
여기서,
Figure pat00036
Figure pat00037
을 위한 정규화 상수이며, 사용자 단말 치환 행렬
Figure pat00038
는 다음 식과 같은 성분을 가질 수 있다.
[식 7]
Figure pat00039
여기서,
Figure pat00040
는 다음 식과 같이 정의될 수 있다.
[식 8]
Figure pat00041
Figure pat00042
k 번째 RF 체인의 I/Q 불균형 성분 행렬이며, 다음 식과 같이 나타낼 수 있다.
[식 9]
Figure pat00043
여기서,
Figure pat00044
k 번째 UT의 진폭 불균형이고,
Figure pat00045
k 번째 UT의 위상 불균형이다.
사용자 단말 RF 체인에서 발생하는 I/Q 불균형은 잡음에도 영향을 미친다. 이상적인 RF 체인의 경우 반송파가 서로 직교하기 때문에 발생하는 잡음 간에 상관성이 없다. 그러나 I/Q 불균형이 발생하는 경우 반송파의 직교성이 깨지므로 동 위상 잡음과 직교 위상 잡음 간에 상관성이 발생하게 된다. 이를 나타내는 행렬
Figure pat00046
는 다음 식과 같이 모델링될 수 있다.
[식 10]
Figure pat00047
여기서,
Figure pat00048
Figure pat00049
을 위한 정규화 상수이며,
Figure pat00050
는 다음 식과 같이 정의될 수 있다.
[식 11]
Figure pat00051
Figure pat00052
k 번째 RF 체인의 I/Q 불균형 성분 행렬이며, 다음 식과 같이 나타낼 수 있다.
[식 12]
Figure pat00053

다음으로, 강화 학습 기반 I/Q 불균형 추정 알고리즘을 설명한다.
기지국과 사용자 단말 양쪽에서 I/Q 불균형이 발생하는 다중 안테나 채널에서, I/Q 불균형 행렬이 포함된 유효 채널 행렬을 다음 식과 같이 정의할 수 있다.
[식 13]
Figure pat00054
여기서,
Figure pat00055
는 유효 채널 행렬,
Figure pat00056
이다.
기지국과 사용자 단말의 I/Q 불균형 행렬
Figure pat00057
,
Figure pat00058
를 추정하면, 이를 유효 채널의 양쪽에서 역행렬을 곱하는 방법으로 보상할 수 있다. 보상된 유효 채널
Figure pat00059
는 다음 식과 같이 정의할 수 있다.
[식 14]
Figure pat00060
여기서,
Figure pat00061
는 I/Q 불균형을 보상된 유효 채널 행렬,
Figure pat00062
이고,
Figure pat00063
는 추정된 UT I/Q 불균형 행렬,
Figure pat00064
이며,
Figure pat00065
는 추정된 BS I/Q 불균형 행렬,
Figure pat00066
이다.
Figure pat00067
Figure pat00068
는 각각 보상된 I/Q 불균형 행렬을 나타낸다. I/Q 불균형을 완전히 추정한 경우,
Figure pat00069
가 성립하여
Figure pat00070
가 성립한다. 여기서,
Figure pat00071
Figure pat00072
단위 행렬(Identity matrix)이고,
Figure pat00073
는 복합 공액 전치(conjugate transpose)이다.
이로부터, I/Q 불균형의 각 파라미터가 보상된 정도를 나타내는 코스트(cost)을 다음 식과 같이 정의할 수 있다.
[식 15]
Figure pat00074
여기서, U(a, b)는 최소값 a와 최대값 b를 가지는 균등확률분포를 나타낸다.
각 코스트(cost)은
Figure pat00075
에서 해당하는 파라미터가 얼마나 보상되었는지 나타내며, I/Q 불균형이 없는 이상적인 경우,
Figure pat00076
이 성립한다.
위의 성질을 강화 학습에 적용하여 I/Q 불균형을 추정할 수 있다.
여기에서 에이전트(agent)는 통신 시스템이며, 환경(environment)은 채널 환경이 된다. 에이전트의 행동(action)은 추정 파라미터의 증가 또는 감소로 설정하였다. 에이전트가 다음 행동(action)을 결정하는 척도인 보상(reward)은 코스트(cost)에 반비례하게 설정하여, 정확한 값으로 다가갈수록 에이전트가 높은 보상을 받도록 설계하였다.
수렴성과 수렴 속도를 높이기 위해, 단계 크기는 코스트(cost)도 비례하게 설정하여, 오차가 큰 초기에는 단계 크기를 크게 하여 수렴 속도를 높이고, 정확한 값을 추정할수록 단계 크기를 작게 하여 정확하게 수렴하도록 설정하였다.
위의 내용을 기반으로 다음의 알고리즘을 제안한다. 즉, 일 실시예에 따른 화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템을 나타낼 수 있다.
기지국과 사용자 단말 양쪽에서 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정한다.
그리고 I/Q 불균형 행렬이 포함된 유효 채널을 측정할 수 있으며, 다음 식과 같이 표현할 수 있다.
[식 16]
Figure pat00077
여기서,
Figure pat00078
는 유효 채널 행렬,
Figure pat00079
이다.
기지국(BS) 진폭 불균형(gain imbalance) 업데이트
모든 기지국 안테나 인덱스(index)
Figure pat00080
i에 대해 다음을 반복한다.
기존 단계(step)에서 추정한 기지국 진폭 불균형을 증가 또는 감소시킨 경우의 I/Q 불균형 추정 행렬을 계산할 수 있으며, 다음 식과 같이 나타낼 수 있다. 다른 인덱스의 진폭 불균형과 위상 불균형(phase imbalance)은 기존에 추정한대로 반영할 수 있다.
[식 17]
Figure pat00081
Figure pat00082
여기서,
Figure pat00083
는 진폭 불균형 추정 단계 크기(step size)이다.
위에서 정의한 보상 함수(reward function)로 각 경우에 대한 보상을 계산할 수 있으며, 다음 식과 같이 나타낼 수 있다. 한편, 사용자 단말 진폭(gain)/위상(phase) 불균형은 기존에 추정한 값을 반영할 수 있다.
[식 18]
Figure pat00084
Figure pat00085
Figure pat00086
코스트(cost)로부터 다음 단계 크기를 설정할 수 있으며, 다음 식과 같이 나타낼 수 있다.
[식 19]
Figure pat00087
가장 보상을 크게 주는 경우를 선택하며, 다음 식과 같이 나타낼 수 있다.
[식 20]
Figure pat00088
해당하는 값으로 기지국 진폭 불균형을 업데이트할 수 있으며, 다음 식과 같이 나타낼 수 있다.
[식 21]
Figure pat00089
사용자 단말(UT) 진폭 불균형(gain imbalance) 업데이트
앞에서 설명한 기지국을 사용자 단말로 바꾸어 같은 과정을 반복할 수 있다.
기지국(BS) 위상 불균형(phase imbalance) 업데이트
모든 기지국 안테나 인덱스
Figure pat00090
i에 대해 다음을 반복한다.
기존 단계에서 추정한 기지국 진폭 불균형을 증가 또는 감소시킨 경우의 I/Q 불균형 추정 행렬을 계산할 수 있으며, 다음 식과 같이 나타낼 수 있다. 다른 인덱스의 진폭 불균형과 위상 불균형은 기존에 추정한대로 반영한다.
[식 22]
Figure pat00091
여기서,
Figure pat00092
Figure pat00093
는 위상 불균형 추정 단계 크기(step size)이다.
위에서 정의한 보상 함수로 각 경우에 대한 보상을 계산할 수 있으며, 다음 식과 같이 나타낼 수 있다. 사용자 단말(UT)의 진폭 불균형 및 위상 불균형은 기존에 추정한 값을 반영한다.
[식 23]
Figure pat00094
코스트(cost)으로부터 다음 단계 크기를 설정할 수 있으며, 다음 식과 같이 나타낼 수 있다.
[식 24]
Figure pat00095
가장 보상을 크게 주는 경우를 선택할 수 있으며, 다음 식과 같이 나타낼 수 있다.
[식 25]
Figure pat00096
해당하는 값으로 기지국 진폭 불균형을 업데이트 할 수 있으며, 다음 식과 같이 나타낼 수 있다.
[식 26]
Figure pat00097
사용자 단말(UT) 위상 불균형(phase imbalance) 업데이트
앞에서 설명한 기지국을 사용자 단말로 바꾸어 같은 과정을 반복할 수 있다. 이후, 유효 채널 측정 단계로 돌아갈 수 있다.
시뮬레이션 환경은 MIMO 시스템에서 I/Q 불균형이 기지국과 사용자 단말 양쪽에서 발생한다고 가정할 수 있다.
Figure pat00098
는 레일리 페이딩 채널(Rayleigh fading channel)이고,
Figure pat00099
는 백색잡음으로 발생할 수 있다.
Figure pat00100
초기 추정 값은 다음 식과 같이 나타낼 수 있다.
[식 27]
Figure pat00101
초기 단계 크기는 다음 식과 같이 나타낼 수 있다.
[식 28]
Figure pat00102
Figure pat00103
로 설정할 수 있다.
채널 추정을 위한 파일럿 SNR을 0dB부터 15dB까지 바꾸어가며 실험할 수 있다.
도 3은 일 실시예에 따른 진폭 불균형 파라미터 추정 MSE를 나타낸 도면이다.
도 4는 일 실시예에 따른 위상 불균형 파라미터 추정 MSE를 나타낸 도면이다.
도 3 및 도 4를 참조하면, 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템의 성능을 확인할 수 있다. 파일럿 SNR에 따라 성능을 측정했으며, 추정된 I/Q 불균형 파라미터 값인 추정 값과 실제 파라미터 값의 평균제곱오차(MSE)를 측정하였다.
시간이 지남에 따라 낮은 MSE로 수렴하는 것을 확인하였으며, 이후에 반복(iteration)이 진행되어도 MSE가 안정적으로 크게 변하지 않음을 확인할 수 있다. 일 실시예에 따른 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법 및 시스템은 반복(iteration)을 통해 정확한 값을 추정하여 I/Q 불균형이 발생하는 시스템에서 이를 추정하고 보상하기 위해 사용할 수 있다.
실시예들을 따르면 미래 무선 통신의 핵심 기술로 주목되는 거대 배열 다중 안테나 기술에서 많은 수의 안테나로부터 쉽게 발생할 수 있는 I/Q 불균형 문제를 해결하기 위한 방법으로, 무선 통신 기술 및 다중 안테나를 사용하는 미래 차량 통신 등 다양한 분야에 적용될 것으로 보인다. 특히, 실시예들에 따르면 미래 무선 통신의 핵심 기술로 주목 받는 거대 안테나 배열 기술에서 흔하게 발생하는 하이 디바이스 코스트(high device cost) 문제를 해결하는 RF 소자에서 발생하는 문제를 해결할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 컨트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (15)

  1. 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하는 단계;
    I/Q 불균형 값이 포함된 유효 채널을 측정하는 단계;
    이전 단계(step)에서 추정한 상기 송신단 또는 상기 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하는 단계;
    계산된 상기 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산하는 단계;
    상기 I/Q 불균형이 보상된 유효 채널을 이용하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하는 단계;
    상기 코스트(cost)에 비례하여 보상(reward)을 계산하는 단계; 및
    상기 보상을 기반으로 다음 단계 크기(step size)를 설정하는 단계
    를 포함하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법.
  2. 제1항에 있어서,
    상기 송신단 또는 상기 수신단에서 보상된 보상 중 더 높은 보상을 주는 행동(action)을 선택하는 단계; 및
    선택된 상기 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 하는 단계
    를 포함하고,
    상기 단계를 각 파라미터에 대해 반복하여 계산하는 것을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법.
  3. 제1항에 있어서,
    상기 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산하는 단계는,
    보상기를 통해 상기 I/Q 불균형 값의 추정 값을 이용하여 I/Q 불균형이 보상된 유효 채널을 계산한 후 보상 생성기로 전달하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법.
  4. 제1항에 있어서,
    상기 I/Q 불균형이 보상된 유효 채널을 이용하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하는 단계는,
    상기 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 보상 생성기에서 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하며, 오그멘티드 채널 노테이션(augmented channel notation)에서 실수부에 해당하는 부분과 허수부에 해당하는 부분의 정도를 비교하여 계산하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법.
  5. 제1항에 있어서,
    상기 보상을 기반으로 다음 단계 크기(step size)를 설정하는 단계는,
    상기 단계 크기를 코스트(cost)에 비례하게 설정하여 상기 보상이 큰 경우, 추정 값이 실제 값에 가까운 것이므로 상기 단계 크기를 감소시키고, 상기 보상이 작은 경우, 추정 값이 실제 값과 차이가 큰 것이므로 상기 단계 크기를 크게 설정하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법.
  6. 제1항에 있어서,
    상기 송신단은 사용자 단말이고 상기 수신단은 기지국이며,
    상기 I/Q 불균형 값은,
    기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값인 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 방법.
  7. 송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하고, I/Q 불균형 값이 포함된 유효 채널을 측정하며, 이전 단계(step)에서 추정한 상기 송신단 또는 상기 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하고 I/Q 불균형이 보상된 유효 채널을 계산하여 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하고, 상기 코스트(cost)에 비례하여 보상(reward)을 계산하는 수신단
    을 포함하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  8. 제7항에 있어서,
    상기 수신단은,
    보상된 상기 보상 중 더 높은 보상을 주는 행동(action)을 선택하여, 선택된 상기 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  9. 제7항에 있어서,
    상기 송신단은 사용자 단말이고 상기 수신단은 기지국이며,
    상기 I/Q 불균형 값은,
    기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값인 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  10. 송신단으로부터 신호를 전달 받아 유효 채널을 추정하는 보상기; 및
    상기 보상기로부터 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하고, 상기 코스트(cost)에 비례하여 보상(reward)을 계산하는 보상 생성기
    를 포함하고,
    상기 보상기는,
    송신단 및 수신단 중 적어도 어느 하나 이상의 I/Q 불균형이 발생하는 다중 안테나 채널에서, 각 파라미터의 초기값을 임의로 설정하고, I/Q 불균형 값이 포함된 유효 채널을 측정하며, 이전 단계(step)에서 추정한 상기 송신단 또는 상기 수신단 I/Q 불균형 값을 증가 또는 감소시켜 I/Q 불균형 값의 추정 값을 계산하고 I/Q 불균형이 보상된 유효 채널을 계산하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  11. 제10항에 있어서,
    상기 수신단은,
    보상된 상기 보상 중 더 높은 보상을 주는 행동(action)을 선택하고,
    상기 보상기는,
    선택된 상기 더 높은 보상을 주는 행동을 기반으로 I/Q 불균형을 업데이트 하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  12. 제10항에 있어서,
    상기 보상 생성기는,
    상기 I/Q 불균형이 보상된 유효 채널 행렬을 입력 받아 보상 생성기에서 I/Q 불균형이 보상된 정도를 나타내는 코스트(cost)를 측정하며, 오그멘티드 채널 노테이션(augmented channel notation)에서 실수부에 해당하는 부분과 허수부에 해당하는 부분의 정도를 비교하여 계산하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  13. 제10항에 있어서,
    상기 보상기는,
    상기 보상을 기반으로 다음 단계 크기(step size)를 설정하며, 상기 단계 크기를 코스트(cost)에 비례하게 설정하여 상기 보상이 큰 경우, 추정 값이 실제 값에 가까운 것이므로 상기 단계 크기를 감소시키고, 상기 보상이 작은 경우, 추정 값이 실제 값과 차이가 큰 것이므로 상기 단계 크기를 크게 설정하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  14. 제10항에 있어서,
    상기 송신단은 사용자 단말이고 상기 수신단은 기지국이며,
    상기 I/Q 불균형 값은,
    기지국 진폭(gain) 불균형 값, 기지국 위상(phase) 불균형 값, 사용자 단말 진폭 불균형 값 및 사용자 단말 위상 불균형 값인 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
  15. 제10항에 있어서,
    강화 학습을 기반으로 측정된 상기 유효 채널로부터 I/Q 불균형 파라미터를 임의로 추정하고 보상하는 방법으로 반복(iterative)하여 추정하며, 상기 I/Q 불균형의 추정 정도에 따른 보상을 계산하여 행동(action)의 크기를 적응적으로(adaptive) 조정하여 수렴 속도와 수렴 정확도를 조절하는 것
    을 특징으로 하는, 강화 학습 기반 다중 안테나 송수신단의 I/Q 불균형 파라미터 추정 시스템.
KR1020180004290A 2018-01-12 2018-01-12 강화 학습 기반 다중 안테나 송수신단의 i/q 불균형 파라미터 추정 방법 및 시스템 KR102027674B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180004290A KR102027674B1 (ko) 2018-01-12 2018-01-12 강화 학습 기반 다중 안테나 송수신단의 i/q 불균형 파라미터 추정 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180004290A KR102027674B1 (ko) 2018-01-12 2018-01-12 강화 학습 기반 다중 안테나 송수신단의 i/q 불균형 파라미터 추정 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20190086133A true KR20190086133A (ko) 2019-07-22
KR102027674B1 KR102027674B1 (ko) 2019-10-02

Family

ID=67469035

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180004290A KR102027674B1 (ko) 2018-01-12 2018-01-12 강화 학습 기반 다중 안테나 송수신단의 i/q 불균형 파라미터 추정 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102027674B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102055141B1 (ko) * 2018-12-31 2019-12-12 한국기술교육대학교 산학협력단 강화학습 기반 디바이스 원격 제어 시스템 및 그 방법
KR102063643B1 (ko) * 2019-08-30 2020-01-08 세종대학교 산학협력단 무선 협력 통신 시스템을 기반으로 하는 q-러닝 기반의 중계기 선정 장치 및 그 방법
KR20220094872A (ko) * 2020-12-29 2022-07-06 한밭대학교 산학협력단 딥러닝 기반의 무선 통신 시스템 및 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100489409B1 (ko) * 2002-10-26 2005-05-16 텔레시스 인코포레이티드 무선 통신시스템의 송수신기 성능을 개선하기 위한 방법
KR20090089531A (ko) 2008-02-19 2009-08-24 삼성전자주식회사 직교 주파수 분할 다중 수신기에서 아이/큐 불균형파라미터를 추정하는 장치 및 방법
KR20100096279A (ko) * 2008-01-04 2010-09-01 콸콤 인코포레이티드 통신 시스템에서의 i/q 불균형 추정 및 교정
KR20110131299A (ko) * 2009-03-20 2011-12-06 시그널 프로세싱 디바이시스 스웨덴 에이비 I/q 불균형 보상 방법 및 장치
US8428180B1 (en) * 2004-09-27 2013-04-23 Marvell International Ltd. Method and apparatus for correcting I/Q mismatch in a wireless communication signal
US8792591B1 (en) * 2006-03-16 2014-07-29 Marvell International Ltd. Systems and methods for I/Q imbalance correction and calibration of variable modulus signals

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100489409B1 (ko) * 2002-10-26 2005-05-16 텔레시스 인코포레이티드 무선 통신시스템의 송수신기 성능을 개선하기 위한 방법
US8428180B1 (en) * 2004-09-27 2013-04-23 Marvell International Ltd. Method and apparatus for correcting I/Q mismatch in a wireless communication signal
US8792591B1 (en) * 2006-03-16 2014-07-29 Marvell International Ltd. Systems and methods for I/Q imbalance correction and calibration of variable modulus signals
KR20100096279A (ko) * 2008-01-04 2010-09-01 콸콤 인코포레이티드 통신 시스템에서의 i/q 불균형 추정 및 교정
KR20090089531A (ko) 2008-02-19 2009-08-24 삼성전자주식회사 직교 주파수 분할 다중 수신기에서 아이/큐 불균형파라미터를 추정하는 장치 및 방법
KR20110131299A (ko) * 2009-03-20 2011-12-06 시그널 프로세싱 디바이시스 스웨덴 에이비 I/q 불균형 보상 방법 및 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102055141B1 (ko) * 2018-12-31 2019-12-12 한국기술교육대학교 산학협력단 강화학습 기반 디바이스 원격 제어 시스템 및 그 방법
KR102063643B1 (ko) * 2019-08-30 2020-01-08 세종대학교 산학협력단 무선 협력 통신 시스템을 기반으로 하는 q-러닝 기반의 중계기 선정 장치 및 그 방법
KR20220094872A (ko) * 2020-12-29 2022-07-06 한밭대학교 산학협력단 딥러닝 기반의 무선 통신 시스템 및 방법

Also Published As

Publication number Publication date
KR102027674B1 (ko) 2019-10-02

Similar Documents

Publication Publication Date Title
EP1672824B1 (en) Method and system for MIMO channel measurement exchange
US9148803B2 (en) MIMO channel state information estimation with coupled iterative two-stage ranking
US10886986B2 (en) Estimation of channel conditions
US8175538B1 (en) Calibrating a wireless communication device
CN114424623A (zh) 基于机器学习的信道估计
US8675720B2 (en) Noise estimation filter
CN108075811B (zh) 用于混合预编码的方法以及通信设备
JP2012531132A (ja) 時分割多元接続mimoシステムにおいて信号を送信する方法および関連の装置
KR20110057893A (ko) 직교주파수 분할다중 기반 무선통신 시스템에서 전용 파일럿 신호를 이용한 채널추정 방법 및 장치
KR102027674B1 (ko) 강화 학습 기반 다중 안테나 송수신단의 i/q 불균형 파라미터 추정 방법 및 시스템
JP4459254B2 (ja) 無線通信装置
US10979251B2 (en) Computing transmit and receive filters for a network device
KR101538555B1 (ko) 시분할 이중통신 다중 사용자 다중 안테나 환경에서 파일럿 오염 공격을 검출하는 방법 및 시스템
KR20150080049A (ko) Mimo 기반 신호 간섭 제거 방법
KR101998998B1 (ko) 중계기를 사용하는 다중 안테나 다중 송수신 통신 시스템에서 송수신 신호 처리 방법 및 장치
KR20180116644A (ko) 시분할 이중통신 다중 사용자 다중 안테나 환경에서 다중 안테나를 이용한 파일럿 오염 공격을 검출하는 방법 및 시스템
CN106452676B (zh) 一种多点协同传输的方法及相关设备
JP2021170697A (ja) コンピュータシステム及びそのための方法
JP2021170696A (ja) 無線受信装置
CN115118317B (zh) 一种适用于毫米波的迭代预编码多流方法、介质及装置
CN108366035B (zh) 一种降低adma系统信号峰均功率比的预编码方法
KR20160000223A (ko) 무선랜에서 이종의 간섭정렬 기법에 기초하여 무선 통신을 수행하는 방법 및 장치
JP2021013075A (ja) 等化装置、受信装置、及びプログラム
KR20230091665A (ko) 채널 추정 오류에 따른 적응형 채널 보상 빔 형성 방법 및 그 시스템
Hussain et al. Tracking performance of an adaptive transmit beamspace beamformer in dynamic miso wireless channels

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant