WO2021235572A1 - 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법 - Google Patents

온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법 Download PDF

Info

Publication number
WO2021235572A1
WO2021235572A1 PCT/KR2020/006661 KR2020006661W WO2021235572A1 WO 2021235572 A1 WO2021235572 A1 WO 2021235572A1 KR 2020006661 W KR2020006661 W KR 2020006661W WO 2021235572 A1 WO2021235572 A1 WO 2021235572A1
Authority
WO
WIPO (PCT)
Prior art keywords
machine learning
learning
csi
network
list
Prior art date
Application number
PCT/KR2020/006661
Other languages
English (en)
French (fr)
Inventor
이종구
김일환
정익주
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to PCT/KR2020/006661 priority Critical patent/WO2021235572A1/ko
Priority to KR1020227044479A priority patent/KR20230014725A/ko
Priority to US17/926,855 priority patent/US20230209368A1/en
Publication of WO2021235572A1 publication Critical patent/WO2021235572A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/309Measuring or estimating channel quality parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/309Measuring or estimating channel quality parameters
    • H04B17/318Received signal strength
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/309Measuring or estimating channel quality parameters
    • H04B17/336Signal-to-interference ratio [SIR] or carrier-to-interference ratio [CIR]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0686Hybrid systems, i.e. switching and simultaneous transmission
    • H04B7/0695Hybrid systems, i.e. switching and simultaneous transmission using beam selection
    • H04B7/06952Selecting one or more beams from a plurality of beams, e.g. beam training, management or sweeping
    • H04B7/06958Multistage beam selection, e.g. beam refinement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems

Definitions

  • the present specification relates to a wireless communication method using an on-device learning-based machine learning network.
  • An increasingly complex communication system makes it more difficult to model a communication system that can provide optimal performance in a real environment.
  • a new approach is needed to realize a flexible communication system that can be optimized for QoS (Quality of Service) required by various services in the channel environment each user faces.
  • QoS Quality of Service
  • the present specification aims to implement a wireless communication method using an on-device learning-based machine learning network that can optimize parameters in a development environment in an actual use environment in an ML (machine learning)-based wireless communication system. do.
  • the present specification is to implement a wireless communication method using an on-device learning-based machine learning network that can select a communication environment to be studied in order to collect learning data for optimizing the parameters of the machine learning network. The purpose.
  • an object of the present specification is to implement a wireless communication method using an on-device learning-based machine learning network capable of monitoring the performance change of the machine learning network in consideration of the variability in the performance of the machine learning network.
  • the present specification provides a wireless communication method using an on-device learning-based machine learning network that can provide personalized communication services for each client device by utilizing on-device learning in addition to off-device learning outside the client device.
  • the method according to an embodiment of the present specification provides at least one machine learning network for communicating through a multi-input-multi-output (MIMO) communication channel using multiple transmit antennas and multiple receive antennas.
  • a method performed by one processor comprising: generating a learning list based on one or more location samples collected while the terminal communicates over a network; and one or more first items included in the learning list; When an associated event is detected, obtaining training data for updating a first machine learning network to be applied to a receiver of the terminal to a second machine learning network, and updating the first machine learning network using the training data includes
  • the generating of the learning list includes generating a linked list including one or more second items consisting of at least one of connection information and base station information obtained for each one or more base stations, and a candidate list based on the connection information of the linked list. updating the selection list, selecting one or more items by applying a weight set to any one of one or more third items included in the candidate list and updating the selection list, at least one fourth item included in the selection list and generating the one or more first items to be added to the learning list based on the location sample of the terminal associated with .
  • the learning list may have place information and base station information divided by the first item.
  • the location information may include spatial information about an application area to which the second machine learning network has been completed, or a collection area for obtaining the training data.
  • the event may be that it is detected that the terminal enters or is located in the collection area.
  • the collection of the location sample may be stopped.
  • the step of generating the learning list includes obtaining a location sample of the terminal when the terminal enters the collection area. If the number of the obtained location samples is greater than or equal to a set number, a clustering algorithm is applied to the location samples to It may include determining one or more communication environments and setting the determined one or more communication environments as each item of the learning list.
  • the method may further include identifying a machine learning network to be applied in the application area, and controlling a receiver based on the checked machine learning network.
  • the terminal when the terminal is located in two or more application areas, selecting any one of the first items corresponding to the two or more application areas, checking the machine learning network to be applied in the selected first item, and the The method may further include controlling the receiver based on the identified machine learning network.
  • the selecting of any one of the first items includes comparing the radii of the two or more application areas, and selecting any one of the two or more first items based on the comparison. can do.
  • the machine learning network is a Deep Neural Network (DNN), a Convolutional Neural Network (CNN), or a Recurrent Neural Network including parametric multiplications, additions, and non-linearities.
  • DNN Deep Neural Network
  • CNN Convolutional Neural Network
  • RNN Recurrent Neural Network including parametric multiplications, additions, and non-linearities.
  • the training data may indicate a reception related parameter.
  • reception-related parameters include signal to noise ratio (SNR), received signal strength indication (RSSI), reference signal received power (RSRP), or reference signal reception quality ( Reference Signal Received Quality).
  • SNR signal to noise ratio
  • RSSI received signal strength indication
  • RSRP reference signal received power
  • Reference Signal reception quality Reference Signal Received Quality
  • the method may further include selecting any one of the second networks.
  • the method may further include selecting any one of the first and second networks.
  • the method may further include measuring and comparing the first and second performance indicators again.
  • the learning list includes state information for each first item, and the state information includes at least one of an acquisition state, a training state, a verification state, an application state, and a lock state, wherein the machine learning network includes the state information At least one of collecting the training data, learning, verifying, applying, or locking the machine learning network may be determined based on the information.
  • a terminal includes a transceiver, at least one processor, and at least one memory connected to the at least one processor and storing instructions, wherein the instructions are transmitted to the at least one processor.
  • parameters in a development environment in a machine learning (ML)-based wireless communication system may be optimized in an actual use environment.
  • the present specification may monitor the performance change of the machine learning network in consideration of the variability in the performance of the machine learning network.
  • the present specification may provide a personalized communication service for each client device by utilizing on-device learning in addition to off-device learning outside the client device.
  • FIG. 1 illustrates a block diagram of a wireless communication system to which the methods proposed in the present specification can be applied.
  • FIG. 2 is a diagram illustrating an example of a signal transmission/reception method in a wireless communication system.
  • FIG. 3 shows an example of basic operations of a user terminal and a 5G network in a 5G communication system.
  • FIG. 4 is a block diagram of an AI device according to an embodiment of the present specification.
  • 5 shows an example of beamforming using SSB and CSI-RS.
  • FIG. 6 is a flowchart illustrating an example of a DL BM procedure using SSB.
  • FIG. 7 shows an example of a DL BM procedure using CSI-RS.
  • FIG. 8 is a flowchart illustrating an example of a process of determining a reception beam of a terminal.
  • FIG. 9 is a flowchart illustrating an example of a transmission beam determination process of a base station.
  • FIG. 10 shows an example of resource allocation in time and frequency domains related to the operation of FIG. 7 .
  • FIG. 11 shows an example of a UL BM procedure using SRS.
  • FIG. 12 is a flowchart illustrating an example of a UL BM procedure using SRS.
  • FIG. 13 is a flowchart illustrating an example of a CSI-related procedure.
  • 15 is a flowchart of a method according to an embodiment of the present specification.
  • 16 exemplarily illustrates a communication environment according to an embodiment of the present specification.
  • 17 to 24 exemplarily describe a method for generating a learning list according to an embodiment of the present specification.
  • 25 and 26 exemplarily describe a training data collection method according to an embodiment of the present specification.
  • 30 to 32 exemplarily describe a method of applying a machine learning network according to an embodiment of the present specification.
  • 33 and 34 exemplarily describe a method of managing an item in a locked state according to an embodiment of the present specification.
  • 35 illustrates a communication system applied to the present invention.
  • 5G communication (5th generation mobile communication) required by a device requiring AI-processed information and/or an AI processor will be described through paragraphs A to G.
  • FIG. 1 illustrates a block diagram of a wireless communication system to which the methods proposed in the present specification can be applied.
  • a device (AI device) including an AI module may be defined as a first communication device ( 910 in FIG. 1 ), and a processor 911 may perform detailed AI operations.
  • a second communication device ( 920 in FIG. 1 ) may perform a 5G network including another device (AI server) that communicates with the AI device, and the processor 921 may perform detailed AI operations.
  • AI server another device that communicates with the AI device
  • the processor 921 may perform detailed AI operations.
  • the 5G network may be represented as the first communication device, and the AI device may be represented as the second communication device.
  • the first communication device or the second communication device may include a base station, a network node, a transmitting terminal, a receiving terminal, a wireless device, a wireless communication device, a vehicle, a vehicle equipped with an autonomous driving function, and a connected car.
  • drone Unmanned Aerial Vehicle, UAV
  • AI Artificial Intelligence
  • robot Robot
  • AR Algmented Reality
  • VR Virtual Reality
  • MR Magnetic
  • hologram device public safety device
  • MTC device IoT devices
  • medical devices fintech devices (or financial devices)
  • security devices climate/environmental devices, devices related to 5G services, or other devices related to the 4th industrial revolution field.
  • a terminal or user equipment includes a mobile phone, a smart phone, a laptop computer, a digital broadcasting terminal, personal digital assistants (PDA), a portable multimedia player (PMP), a navigation system, and a slate PC.
  • PDA personal digital assistants
  • PMP portable multimedia player
  • slate PC slate PC
  • tablet PC tablet PC
  • ultrabook ultrabook
  • wearable device e.g., watch-type terminal (smartwatch), glass-type terminal (smart glass), HMD (head mounted display)
  • the HMD may be a display device worn on the head.
  • an HMD may be used to implement VR, AR or MR.
  • the drone may be a flying vehicle that does not ride by a person and flies by a wireless control signal.
  • the VR device may include a device that implements an object or a background of a virtual world.
  • the AR device may include a device that implements by connecting an object or background in the virtual world to an object or background in the real world.
  • the MR device may include a device that implements a virtual world object or background by fusion with a real world object or background.
  • the hologram device may include a device for realizing a 360-degree stereoscopic image by recording and reproducing stereoscopic information by utilizing an interference phenomenon of light generated by the meeting of two laser beams called holography.
  • the public safety device may include an image relay device or an image device that can be worn on a user's body.
  • the MTC device and the IoT device may be devices that do not require direct human intervention or manipulation.
  • the MTC device and the IoT device may include a smart meter, a bending machine, a thermometer, a smart light bulb, a door lock, or various sensors.
  • a medical device may be a device used for the purpose of diagnosing, treating, alleviating, treating, or preventing a disease.
  • a medical device may be a device used for the purpose of diagnosing, treating, alleviating or correcting an injury or disorder.
  • a medical device may be a device used for the purpose of examining, replacing, or modifying structure or function.
  • the medical device may be a device used for the purpose of controlling pregnancy.
  • the medical device may include a medical device, a surgical device, an (ex vivo) diagnostic device, a hearing aid, or a device for a procedure.
  • the security device may be a device installed to prevent a risk that may occur and maintain safety.
  • the security device may be a camera, CCTV, recorder or black box.
  • the fintech device may be a device capable of providing financial services such as mobile payment.
  • a first communication device 910 and a second communication device 920 include a processor 911,921, a memory 914,924, and one or more Tx/Rx RF modules (radio frequency module, 915,925). , including Tx processors 912 and 922 , Rx processors 913 and 923 , and antennas 916 and 926 . Tx/Rx modules are also called transceivers. Each Tx/Rx module 915 transmits a signal via a respective antenna 926 .
  • the processor implements the functions, processes and/or methods salpinned above.
  • the processor 921 may be associated with a memory 924 that stores program code and data. Memory may be referred to as a computer-readable medium.
  • the transmit (TX) processor 912 implements various signal processing functions for the L1 layer (ie, the physical layer).
  • the receive (RX) processor implements the various signal processing functions of L1 (ie, the physical layer).
  • the UL (second communication device to first communication device) is handled in the first communication device 910 in a manner similar to that described with respect to the receiver function in the second communication device 920 .
  • Each Tx/Rx module 925 receives a signal via a respective antenna 926 .
  • Each Tx/Rx module provides an RF carrier and information to the RX processor 923 .
  • the processor 921 may be associated with a memory 924 that stores program code and data. Memory may be referred to as a computer-readable medium.
  • FIG. 2 is a diagram illustrating an example of a signal transmission/reception method in a wireless communication system.
  • the UE performs an initial cell search operation such as synchronizing with the BS when the power is turned on or a new cell is entered ( S201 ).
  • the UE receives a primary synchronization channel (P-SCH) and a secondary synchronization channel (S-SCH) from the BS, synchronizes with the BS, and acquires information such as cell ID can do.
  • P-SCH primary synchronization channel
  • S-SCH secondary synchronization channel
  • the P-SCH and the S-SCH are called a primary synchronization signal (PSS) and a secondary synchronization signal (SSS), respectively.
  • PSS primary synchronization signal
  • SSS secondary synchronization signal
  • the UE may receive a physical broadcast channel (PBCH) from the BS to obtain broadcast information in the cell.
  • PBCH physical broadcast channel
  • the UE may check the downlink channel state by receiving a downlink reference signal (DL RS) in the initial cell search step.
  • DL RS downlink reference signal
  • the UE receives a physical downlink control channel (PDCCH) and a physical downlink shared channel (PDSCH) according to information carried on the PDCCH to obtain more specific system information. It can be done (S202).
  • PDCCH physical downlink control channel
  • PDSCH physical downlink shared channel
  • the UE may perform a random access procedure (RACH) to the BS (steps S203 to S206).
  • RACH random access procedure
  • the UE transmits a specific sequence as a preamble through a physical random access channel (PRACH) (S203 and S205), and a random access response to the preamble through the PDCCH and the corresponding PDSCH (random access response, RAR) message may be received (S204 and S206).
  • PRACH physical random access channel
  • RAR random access response
  • a contention resolution procedure may be additionally performed.
  • the UE receives PDCCH/PDSCH (S207) and a physical uplink shared channel (PUSCH)/physical uplink control channel as a general uplink/downlink signal transmission process.
  • Uplink control channel, PUCCH) transmission (S208) may be performed.
  • the UE receives downlink control information (DCI) through the PDCCH.
  • DCI downlink control information
  • the UE monitors a set of PDCCH candidates in monitoring opportunities set in one or more control element sets (CORESETs) on a serving cell according to corresponding search space configurations.
  • the set of PDCCH candidates to be monitored by the UE is defined in terms of search space sets, which may be a common search space set or a UE-specific search space set.
  • the CORESET consists of a set of (physical) resource blocks with a time duration of 1 to 3 OFDM symbols.
  • the network may configure the UE to have multiple CORESETs.
  • the UE monitors PDCCH candidates in one or more search space sets. Here, monitoring means trying to decode PDCCH candidate(s) in the search space. If the UE succeeds in decoding one of the PDCCH candidates in the search space, the UE determines that the PDCCH is detected in the corresponding PDCCH candidate, and performs PDSCH reception or PUSCH transmission based on the DCI in the detected PDCCH.
  • the PDCCH may be used to schedule DL transmissions on PDSCH and UL transmissions on PUSCH.
  • the DCI on the PDCCH is a downlink assignment (i.e., downlink grant; DL grant) including at least modulation and coding format and resource allocation information related to the downlink shared channel, or uplink It includes an uplink grant (UL grant) including a modulation and coding format and resource allocation information related to a shared channel.
  • DL grant downlink grant
  • UL grant uplink grant
  • an initial access (IA) procedure in a 5G communication system will be additionally described.
  • the UE may perform cell search, system information acquisition, beam alignment for initial access, DL measurement, and the like based on the SSB.
  • the SSB is mixed with an SS/PBCH (Synchronization Signal/Physical Broadcast channel) block.
  • SS/PBCH Synchronization Signal/Physical Broadcast channel
  • SSB consists of PSS, SSS and PBCH.
  • the SSB is configured in four consecutive OFDM symbols, and PSS, PBCH, SSS/PBCH or PBCH are transmitted for each OFDM symbol.
  • PSS and SSS consist of 1 OFDM symbol and 127 subcarriers, respectively, and PBCH consists of 3 OFDM symbols and 576 subcarriers.
  • Cell discovery refers to a process in which the UE acquires time/frequency synchronization of a cell, and detects a cell ID (Identifier) (eg, Physical layer Cell ID, PCI) of the cell.
  • PSS is used to detect a cell ID within a cell ID group
  • SSS is used to detect a cell ID group.
  • PBCH is used for SSB (time) index detection and half-frame detection.
  • the SSB is transmitted periodically according to the SSB period (periodicity).
  • the SSB basic period assumed by the UE during initial cell discovery is defined as 20 ms. After cell access, the SSB period may be set to one of ⁇ 5ms, 10ms, 20ms, 40ms, 80ms, 160ms ⁇ by the network (eg, BS).
  • the SI is divided into a master information block (MIB) and a plurality of system information blocks (SIB). SI other than MIB may be referred to as Remaining Minimum System Information (RMSI).
  • the MIB includes information/parameters for monitoring the PDCCH scheduling the PDSCH carrying the System Information Block1 (SIB1) and is transmitted by the BS through the PBCH of the SSB.
  • SIB1 includes information related to availability and scheduling (eg, transmission period, SI-window size) of the remaining SIBs (hereinafter, SIBx, where x is an integer of 2 or more). SIBx is included in the SI message and transmitted through the PDSCH. Each SI message is transmitted within a periodically occurring time window (ie, an SI-window).
  • RA random access
  • the random access process is used for a variety of purposes.
  • the random access procedure may be used for network initial access, handover, and UE-triggered UL data transmission.
  • the UE may acquire UL synchronization and UL transmission resources through a random access procedure.
  • the random access process is divided into a contention-based random access process and a contention free random access process.
  • the detailed procedure for the contention-based random access process is as follows.
  • the UE may transmit the random access preamble through the PRACH as Msg1 of the random access procedure in the UL.
  • Random access preamble sequences having two different lengths are supported.
  • the long sequence length 839 applies for subcarrier spacings of 1.25 and 5 kHz, and the short sequence length 139 applies for subcarrier spacings of 15, 30, 60 and 120 kHz.
  • the BS When the BS receives the random access preamble from the UE, the BS sends a random access response (RAR) message (Msg2) to the UE.
  • RAR random access response
  • the PDCCH scheduling the PDSCH carrying the RAR is CRC-masked and transmitted with a random access (RA) radio network temporary identifier (RNTI) (RA-RNTI).
  • RA-RNTI random access radio network temporary identifier
  • the UE detecting the PDCCH masked by the RA-RNTI may receive the RAR from the PDSCH scheduled by the DCI carried by the PDCCH.
  • the UE checks whether the random access response information for the preamble it has transmitted, that is, Msg1, is in the RAR.
  • Whether or not random access information for Msg1 transmitted by itself exists may be determined by whether a random access preamble ID for the preamble transmitted by the UE exists. If there is no response to Msg1, the UE may retransmit the RACH preamble within a predetermined number of times while performing power ramping. The UE calculates the PRACH transmit power for the retransmission of the preamble based on the most recent path loss and power ramping counter.
  • the UE may transmit UL transmission on the uplink shared channel as Msg3 of the random access procedure based on the random access response information.
  • Msg3 may include the RRC connection request and UE identifier.
  • the network may send Msg4, which may be treated as a contention resolution message on DL.
  • Msg4 the UE can enter the RRC connected state.
  • the BM process may be divided into (1) a DL BM process using SSB or CSI-RS, and (2) a UL BM process using a sounding reference signal (SRS).
  • each BM process may include Tx beam sweeping to determine a Tx beam and Rx beam sweeping to determine an Rx beam.
  • a configuration for a beam report using the SSB is performed during channel state information (CSI)/beam configuration in RRC_CONNECTED.
  • CSI channel state information
  • the UE receives from the BS a CSI-ResourceConfig IE including a CSI-SSB-ResourceSetList for SSB resources used for BM.
  • the RRC parameter csi-SSB-ResourceSetList indicates a list of SSB resources used for beam management and reporting in one resource set.
  • the SSB resource set may be set to ⁇ SSBx1, SSBx2, SSBx3, SSBx4, ⁇ .
  • the SSB index may be defined from 0 to 63.
  • - UE receives signals on SSB resources from the BS based on the CSI-SSB-ResourceSetList.
  • the UE reports the best SSBRI and RSRP corresponding thereto to the BS.
  • the reportQuantity of the CSI-RS reportConfig IE is set to 'ssb-Index-RSRP', the UE reports the best SSBRI and the corresponding RSRP to the BS.
  • the UE has the CSI-RS and the SSB similarly located in the 'QCL-TypeD' point of view ( quasi co-located, QCL).
  • QCL-TypeD may mean QCL between antenna ports in terms of spatial Rx parameters.
  • the Rx beam determination (or refinement) process of the UE using the CSI-RS and the Tx beam sweeping process of the BS will be described in turn.
  • the repetition parameter is set to 'ON'
  • the repetition parameter is set to 'OFF'.
  • the UE receives the NZP CSI-RS resource set IE including the RRC parameter for 'repetition' from the BS through RRC signaling.
  • the RRC parameter 'repetition' is set to 'ON'.
  • the UE repeats signals on the resource(s) in the CSI-RS resource set in which the RRC parameter 'repetition' is set to 'ON' in different OFDM symbols through the same Tx beam (or DL spatial domain transmission filter) of the BS receive
  • the UE determines its own Rx beam.
  • the UE omits CSI reporting. That is, the UE may omit the CSI report when the multi-RRC parameter 'repetition' is set to 'ON'.
  • the UE receives the NZP CSI-RS resource set IE including the RRC parameter for 'repetition' from the BS through RRC signaling.
  • the RRC parameter 'repetition' is set to 'OFF' and is related to the Tx beam sweeping process of the BS.
  • the UE receives signals on resources in the CSI-RS resource set in which the RRC parameter 'repetition' is set to 'OFF' through different Tx beams (DL spatial domain transmission filter) of the BS.
  • the UE selects (or determines) the best beam.
  • the UE reports the ID (eg, CRI) and related quality information (eg, RSRP) for the selected beam to the BS. That is, when the CSI-RS is transmitted for the BM, the UE reports the CRI and the RSRP to the BS.
  • ID eg, CRI
  • RSRP related quality information
  • the UE receives the RRC signaling (eg, SRS-Config IE) including the (RRC parameter) usage parameter set to 'beam management' from the BS.
  • SRS-Config IE is used for SRS transmission configuration.
  • the SRS-Config IE includes a list of SRS-Resources and a list of SRS-ResourceSets. Each SRS resource set means a set of SRS-resources.
  • the UE determines Tx beamforming for the SRS resource to be transmitted based on the SRS-SpatialRelation Info included in the SRS-Config IE.
  • the SRS-SpatialRelation Info is set for each SRS resource and indicates whether to apply the same beamforming as that used in SSB, CSI-RS, or SRS for each SRS resource.
  • SRS-SpatialRelationInfo is configured in the SRS resource, the same beamforming as that used in SSB, CSI-RS, or SRS is applied and transmitted. However, if SRS-SpatialRelationInfo is not configured in the SRS resource, the UE arbitrarily determines Tx beamforming and transmits the SRS through the determined Tx beamforming.
  • BFR beam failure recovery
  • Radio Link Failure may frequently occur due to rotation, movement, or beamforming blockage of the UE. Therefore, BFR is supported in NR to prevent frequent RLF from occurring. BFR is similar to the radio link failure recovery process, and can be supported when the UE knows new candidate beam(s).
  • the BS sets beam failure detection reference signals to the UE, and the UE determines that the number of beam failure indications from the physical layer of the UE is within a period set by the RRC signaling of the BS. When a threshold set by RRC signaling is reached (reach), a beam failure is declared (declare).
  • the UE triggers beam failure recovery by initiating a random access procedure on the PCell; Beam failure recovery is performed by selecting a suitable beam (if the BS provides dedicated random access resources for certain beams, these are prioritized by the UE). Upon completion of the random access procedure, it is considered that beam failure recovery has been completed.
  • URLLC transmission defined in NR is (1) a relatively low traffic size, (2) a relatively low arrival rate (low arrival rate), (3) extremely low latency requirements (eg, 0.5, 1ms), (4) a relatively short transmission duration (eg, 2 OFDM symbols), and (5) transmission for an urgent service/message.
  • transmission for a specific type of traffic eg, URLLC
  • eMBB previously scheduled transmission
  • eMBB and URLLC services may be scheduled on non-overlapping time/frequency resources, and URLLC transmission may occur on resources scheduled for ongoing eMBB traffic.
  • the eMBB UE may not know whether the PDSCH transmission of the corresponding UE is partially punctured, and the UE may not be able to decode the PDSCH due to corrupted coded bits.
  • NR provides a preemption indication.
  • the preemption indication may be referred to as an interrupted transmission indication.
  • the UE receives the DownlinkPreemption IE through RRC signaling from the BS.
  • the UE is provided with the DownlinkPreemption IE, for monitoring the PDCCH carrying DCI format 2_1, the UE is configured with the INT-RNTI provided by the parameter int-RNTI in the DownlinkPreemption IE.
  • the UE is additionally configured with a set of serving cells by INT-ConfigurationPerServing Cell including a set of serving cell indices provided by servingCellID and a corresponding set of positions for fields in DCI format 2_1 by positionInDCI, dci-PayloadSize It is established with the information payload size for DCI format 2_1 by , and is set with the indicated granularity of time-frequency resources by timeFrequencySect.
  • the UE receives DCI format 2_1 from the BS based on the DownlinkPreemption IE.
  • the UE When the UE detects the DCI format 2_1 for the serving cell in the configured set of serving cells, the UE determines that the DCI format of the set of PRBs and the set of symbols of the monitoring period immediately preceding the monitoring period to which the DCI format 2_1 belongs. It can be assumed that there is no transmission to the UE in the PRBs and symbols indicated by 2_1. For example, the UE sees that the signal in the time-frequency resource indicated by the preemption is not the scheduled DL transmission for itself and decodes data based on the signals received in the remaining resource region.
  • mMTC massive machine type communication
  • 5G to support hyper-connectivity service that communicates simultaneously with a large number of UEs.
  • the UE communicates intermittently with a very low transmission rate and mobility. Therefore, mMTC is primarily aimed at how long the UE can run at a low cost.
  • 3GPP deals with MTC and NB (NarrowBand)-IoT.
  • the mMTC technology has features such as repeated transmission of PDCCH, PUCCH, physical downlink shared channel (PDSCH), PUSCH, and the like, frequency hopping, retuning, and guard period.
  • a PUSCH (or PUCCH (particularly, long PUCCH) or PRACH) including specific information and a PDSCH (or PDCCH) including a response to specific information are repeatedly transmitted.
  • Repeated transmission is performed through frequency hopping, and for repeated transmission, (RF) retuning is performed in a guard period from a first frequency resource to a second frequency resource, and specific information
  • RF retuning is performed in a guard period from a first frequency resource to a second frequency resource
  • a response to specific information may be transmitted/received through a narrowband (ex. 6 RB (resource block) or 1 RB).
  • FIG. 3 shows an example of basic operations of a user terminal and a 5G network in a 5G communication system.
  • the UE transmits the specific information transmission to the 5G network (S1).
  • the 5G network performs 5G processing on the specific information (S2).
  • the 5G processing may include AI processing.
  • the 5G network transmits a response including the AI processing result to the UE (S3).
  • step S1 and step S3 of FIG. 3 in order for the UE to transmit/receive signals, information, etc. with the 5G network, the UE has an initial access procedure and random access with the 5G network before step S1 of FIG. random access) procedure.
  • the UE performs an initial connection procedure with the 5G network based on the SSB to obtain DL synchronization and system information.
  • a beam management (BM) process and a beam failure recovery process may be added to the initial access procedure, and in the process of the UE receiving a signal from the 5G network, a QCL (quasi-co location) relationship can be added.
  • BM beam management
  • QCL quadsi-co location
  • the UE performs a random access procedure with the 5G network for UL synchronization acquisition and/or UL transmission.
  • the 5G network may transmit a UL grant for scheduling transmission of specific information to the UE. Accordingly, the UE transmits specific information to the 5G network based on the UL grant.
  • the 5G network transmits a DL grant for scheduling transmission of a 5G processing result for the specific information to the UE. Accordingly, the 5G network may transmit a response including the AI processing result to the UE based on the DL grant.
  • the UE may receive a DownlinkPreemption IE from the 5G network. Then, the UE receives DCI format 2_1 including a pre-emption indication from the 5G network based on the DownlinkPreemption IE. And, the UE does not perform (or expect or assume) the reception of eMBB data in the resource (PRB and/or OFDM symbol) indicated by the pre-emption indication. Thereafter, the UE may receive a UL grant from the 5G network when it is necessary to transmit specific information.
  • the UE receives a UL grant from the 5G network to transmit specific information to the 5G network.
  • the UL grant includes information on the number of repetitions for the transmission of the specific information, and the specific information may be repeatedly transmitted based on the information on the number of repetitions. That is, the UE transmits specific information to the 5G network based on the UL grant.
  • repeated transmission of specific information may be performed through frequency hopping, transmission of the first specific information may be transmitted in a first frequency resource, and transmission of the second specific information may be transmitted in a second frequency resource.
  • the specific information may be transmitted through a narrowband of 6RB (Resource Block) or 1RB (Resource Block).
  • the BM procedure is a set of base station (eg gNB, TRP, etc.) and/or terminal (eg UE) beams that can be used for downlink (DL) and uplink (uplink, UL) transmission/reception.
  • base station eg gNB, TRP, etc.
  • terminal eg UE
  • L1 layer 1
  • L2 layer 2
  • - Beam measurement an operation in which a base station or a UE measures characteristics of a received beamforming signal.
  • Beam determination an operation of the base station or UE to select its own transmit beam (Tx beam) / receive beam (Rx beam).
  • Beam report an operation in which the UE reports information of a beam-formed signal based on beam measurement.
  • the BM procedure can be divided into (1) a DL BM procedure using a synchronization signal (SS)/physical broadcast channel (PBCH) block or CSI-RS, and (2) a UL BM procedure using a sounding reference signal (SRS).
  • SS synchronization signal
  • PBCH physical broadcast channel
  • SRS sounding reference signal
  • each BM procedure may include Tx beam sweeping for determining a Tx beam and Rx beam sweeping for determining an Rx beam.
  • the DL BM procedure may include (1) transmission of beamformed DL reference signals (eg, CSI-RS or SS Block (SSB)) of the base station, and (2) beam reporting of the terminal.
  • beamformed DL reference signals eg, CSI-RS or SS Block (SSB)
  • the beam reporting may include a preferred DL RS identifier (ID) (s) and a corresponding reference signal received power (L1-RSRP).
  • ID preferred DL RS identifier
  • L1-RSRP reference signal received power
  • the DL RS ID may be an SSB Resource Indicator (SSBRI) or a CSI-RS Resource Indicator (CRI).
  • SSBRI SSB Resource Indicator
  • CRI CSI-RS Resource Indicator
  • the SSB beam and the CSI-RS beam may be used for beam measurement.
  • the measurement metric is L1-RSRP for each resource/block.
  • SSB may be used for coarse beam measurement, and CSI-RS may be used for fine beam measurement.
  • SSB can be used for both Tx beam sweeping and Rx beam sweeping.
  • Rx beam sweeping using SSB may be performed while the UE changes the Rx beam for the same SSBRI across multiple SSB bursts.
  • one SS burst includes one or more SSBs
  • one SS burst set includes one or more SSB bursts.
  • FIG. 6 is a flowchart illustrating an example of a DL BM procedure using SSB.
  • a configuration for a beam report using SSB is performed during CSI/beam configuration in an RRC connected state (or RRC connected mode).
  • the terminal receives a CSI-ResourceConfig IE including a CSI-SSB-ResourceSetList including SSB resources used for BM from the base station (S410).
  • Table 1 shows an example of the CSI-ResourceConfig IE. As shown in Table 1, the BM configuration using the SSB is not separately defined, and the SSB is set as a CSI-RS resource.
  • the csi-SSB-ResourceSetList parameter represents a list of SSB resources used for beam management and reporting in one resource set.
  • the SSB resource set may be set to ⁇ SSBx1, SSBx2, SSBx3, SSBx4, ⁇ .
  • the SSB index may be defined from 0 to 63.
  • the terminal receives the SSB resource from the base station based on the CSI-SSB-ResourceSetList (S420).
  • the UE reports (beam) the best SSBRI and L1-RSRP corresponding thereto to the base station (S430).
  • the UE reports the best SSBRI and the corresponding L1-RSRP to the base station.
  • the terminal determines that the CSI-RS and the SSB are 'QCL-TypeD' ' can be assumed to be quasi co-located from the point of view.
  • the QCL TypeD may mean that it is QCL between antenna ports from the viewpoint of the spatial Rx parameter.
  • the same reception beam may be applied.
  • the UE does not expect the CSI-RS to be configured in the RE overlapping the RE of the SSB.
  • CSI-RS when a repetition parameter is set in a specific CSI-RS resource set and TRS_info is not set, CSI-RS is used for beam management. ii) If the repetition parameter is not set and TRS_info is set, CSI-RS is used for a tracking reference signal (TRS). iii) If the repetition parameter is not set and TRS_info is not set, CSI-RS is used for CSI acquisition.
  • TRS tracking reference signal
  • This repetition parameter may be set only for CSI-RS resource sets associated with CSI-ReportConfig having a report of L1 RSRP or 'No Report (or None)'.
  • the UE receives a CSI-ReportConfig set with reportQuantity set to 'cri-RSRP' or 'none', and CSI-ResourceConfig (higher layer parameter resourcesForChannelMeasurement) for channel measurement does not include a higher layer parameter 'trs-Info'
  • the higher layer parameter 'repetition' includes a set NZP-CSI-RS-ResourceSet
  • the terminal has a higher layer parameter 'nrofPorts' for all CSI-RS resources in the NZP-CSI-RS-ResourceSet of the same number. It can be configured only as a port (1-port or 2-port).
  • the terminal When repetition is set to 'ON', it is related to the Rx beam sweeping procedure of the terminal.
  • the terminal may assume that at least one CSI-RS resource in the NZP-CSI-RS-ResourceSet is transmitted through the same downlink spatial domain transmission filter. That is, at least one CSI-RS resource in the NZP-CSI-RS-ResourceSet is transmitted through the same Tx beam.
  • at least one CSI-RS resource in the NZP-CSI-RS-ResourceSet may be transmitted in different OFDM symbols.
  • the UE does not expect to receive different periodicities in periodicityAndOffset from all CSI-RS resources in the NZP-CSI-RS-Resourceset.
  • Repetition when Repetition is set to 'OFF', it is related to the Tx beam sweeping procedure of the base station.
  • repetition is set to 'OFF', the terminal does not assume that at least one CSI-RS resource in the NZP-CSI-RS-ResourceSet is transmitted through the same downlink spatial domain transmission filter. That is, at least one CSI-RS resource in the NZP-CSI-RS-ResourceSet is transmitted through different Tx beams.
  • FIG. 7 shows an example of a DL BM procedure using CSI-RS.
  • FIG. 7(a) shows the Rx beam determination (or refinement) procedure of the UE
  • FIG. 7(b) shows the Tx beam sweeping procedure of the base station.
  • (a) of FIG. 7 is a case where the repetition parameter is set to 'ON'
  • (b) of FIG. 7 is a case where the repetition parameter is set to 'OFF'.
  • FIG. 8 is a flowchart illustrating an example of a process of determining a reception beam of a terminal.
  • the terminal receives the NZP CSI-RS resource set IE including higher layer parameter repetition from the base station through RRC signaling (S610).
  • the repetition parameter is set to 'ON'.
  • the terminal repeatedly receives the resource(s) in the CSI-RS resource set set to repetition 'ON' in different OFDM symbols through the same Tx beam (or DL spatial domain transmission filter) of the base station (S620).
  • the UE determines its own Rx beam (S630).
  • the UE omits the CSI report (S640).
  • the reportQuantity of the CSI report config may be set to 'No report (or None)'.
  • the terminal may omit the CSI report when repetition 'ON' is set.
  • FIG. 9 is a flowchart illustrating an example of a transmission beam determination process of a base station.
  • the terminal receives the NZP CSI-RS resource set IE including higher layer parameter repetition from the base station through RRC signaling (S710).
  • the repetition parameter is set to 'OFF' and is related to the Tx beam sweeping procedure of the base station.
  • the terminal receives the resources in the CSI-RS resource set set to repetition 'OFF' through different Tx beams (DL spatial domain transmission filter) of the base station (S720).
  • Tx beams DL spatial domain transmission filter
  • the UE selects (or determines) the best beam (S740)
  • the terminal reports the ID and related quality information (eg, L1-RSRP) for the selected beam to the base station (S740).
  • the reportQuantity of the CSI report config may be set to 'CRI + L1-RSRP'.
  • the UE reports the CRI and the L1-RSRP for it to the base station.
  • FIG. 10 shows an example of resource allocation in time and frequency domains related to the operation of FIG. 7 .
  • the terminal may receive RRC configuration for a list of at least M candidate transmission configuration indication (TCI) states for the purpose of at least QCL (Quasi Co-location) indication.
  • TCI transmission configuration indication
  • QCL Quadrature Co-location
  • Each TCI state may be configured as one RS set.
  • At least each ID of DL RS for spatial QCL purpose (QCL Type D) in the RS set may refer to one of DL RS types such as SSB, P-CSI RS, SP-CSI RS, and A-CSI RS. .
  • initialization/update of IDs of DL RS(s) in the RS set used for spatial QCL purposes may be performed through at least explicit signaling.
  • Table 2 shows an example of TCI-State IE.
  • the TCI-State IE associates one or two DL reference signals (RS) with corresponding quasi co-location (QCL) types.
  • RS DL reference signals
  • QCL quasi co-location
  • the bwp-Id parameter indicates the DL BWP in which the RS is located
  • the cell parameter indicates the carrier in which the RS is located
  • the referencesignal parameter is the reference that becomes the source of the quasi co-location for the target antenna port(s).
  • the target antenna port(s) may be CSI-RS, PDCCH DMRS, or PDSCH DMRS.
  • the corresponding TCI state ID may be indicated in the NZP CSI-RS resource configuration information.
  • the TCI state ID may be indicated in each CORESET setting.
  • the TCI state ID may be indicated through DCI to indicate QCL reference information for the PDSCH DMRS antenna port(s).
  • An antenna port is defined such that a channel on which a symbol on an antenna port is carried can be inferred from a channel on which another symbol on the same antenna port is carried.
  • the two antenna ports are QC/QCL (quasi co-located or quasi co-location) ) can be said to be in a relationship.
  • the channel characteristics include delay spread, Doppler spread, frequency/Doppler shift, average received power, and received timing/average delay. delay) and one or more of Spatial RX parameters.
  • the Spatial Rx parameter means a spatial (reception) channel characteristic parameter such as angle of arrival.
  • a list of up to M TCI-State configurations in the higher layer parameter PDSCH-Config may be set.
  • the M depends on UE capability.
  • Each TCI-State includes a parameter for establishing a quasi co-location relationship between one or two DL reference signals and the DM-RS port of the PDSCH.
  • the quasi co-location relationship is set with the higher layer parameter qcl-Type1 for the first DL RS and qcl-Type2 (if set) for the second DL RS.
  • the QCL type is not the same regardless of whether the reference is the same DL RS or different DL RSs.
  • the quasi co-location type corresponding to each DL RS is given by the higher layer parameter qcl-Type of QCL-Info, and may take one of the following values:
  • the corresponding NZP CSI-RS antenna ports are indicated/configured to be QCL with a specific TRS from a QCL-Type A perspective and a specific SSB from a QCL-Type D perspective. have.
  • the UE receiving this instruction/configuration receives the corresponding NZP CSI-RS using the Doppler and delay values measured in QCL-TypeA TRS, and applies the reception beam used for QCL-TypeD SSB reception to the corresponding NZP CSI-RS reception. can do.
  • the UE may receive an activation command by MAC CE signaling used to map up to 8 TCI states to the codepoint of the DCI field 'Transmission Configuration Indication'.
  • beam reciprocity (or beam correspondence) between Tx beams and Rx beams may or may not be established according to UE implementation. If the reciprocity between the Tx beam and the Rx beam is established in both the base station and the terminal, the UL beam pair may be aligned through the DL beam pair. However, when the reciprocity between the Tx beam and the Rx beam is not established in either of the base station and the terminal, a UL beam pair determination process is required separately from the DL beam pair determination.
  • the base station can use the UL BM procedure for determining the DL Tx beam without the terminal requesting a report of a preferred beam.
  • UL BM may be performed through beamformed UL SRS transmission, and whether the UL BM of the SRS resource set is applied is set by (higher layer parameter) usage. If usage is set to 'BeamManagement (BM)', only one SRS resource may be transmitted to each of a plurality of SRS resource sets at a given time instant.
  • BM BeamManagement
  • the terminal may receive one or more Sounding Reference Symbol (SRS) resource sets configured by the SRS-ResourceSet (through higher layer signaling, RRC signaling, etc.).
  • SRS Sounding Reference Symbol
  • the UE K ⁇ 1 SRS resources (higher later parameter SRS-resource) may be configured.
  • K is a natural number, and the maximum value of K is indicated by SRS_capability.
  • the UL BM procedure can be divided into Tx beam sweeping of the UE and Rx beam sweeping of the base station.
  • FIG. 11 shows an example of a UL BM procedure using SRS.
  • FIG. 11(a) shows the Rx beam determination procedure of the base station
  • FIG. 11(b) shows the Tx beam sweeping procedure of the UE.
  • FIG. 12 is a flowchart illustrating an example of a UL BM procedure using SRS.
  • the terminal receives RRC signaling (eg, SRS-Config IE) including a usage parameter set to 'beam management' (higher layer parameter) from the base station (S1010).
  • RRC signaling eg, SRS-Config IE
  • SRS-Config IE a usage parameter set to 'beam management' (higher layer parameter) from the base station (S1010).
  • Table 3 shows an example of an SRS-Config IE (Information Element), and the SRS-Config IE is used for SRS transmission configuration.
  • the SRS-Config IE includes a list of SRS-Resources and a list of SRS-ResourceSets. Each SRS resource set means a set of SRS-resources.
  • the network may trigger the transmission of the SRS resource set using the configured aperiodicSRS-ResourceTrigger (L1 DCI).
  • usage indicates a higher layer parameter indicating whether the SRS resource set is used for beam management, codebook-based or non-codebook-based transmission.
  • the usage parameter corresponds to the L1 parameter 'SRS-SetUse'.
  • 'spatialRelationInfo' is a parameter indicating the setting of the spatial relation between the reference RS and the target SRS.
  • the reference RS may be an SSB, CSI-RS, or SRS corresponding to the L1 parameter 'SRS-SpatialRelationInfo'.
  • the usage is set for each SRS resource set. - The terminal determines the Tx beam for the SRS resource to be transmitted based on the SRS-SpatialRelation Info included in the SRS-Config IE (S1020).
  • SRS-SpatialRelation Info is set for each SRS resource, and indicates whether to apply the same beam as the beam used in SSB, CSI-RS, or SRS for each SRS resource.
  • SRS-SpatialRelationInfo may or may not be set in each SRS resource.
  • SRS-SpatialRelationInfo is configured in the SRS resource, the same beam as the beam used in SSB, CSI-RS or SRS is applied and transmitted. However, if the SRS-SpatialRelationInfo is not set in the SRS resource, the terminal arbitrarily determines a Tx beam and transmits the SRS through the determined Tx beam (S1030).
  • the UE applies the same spatial domain Rx filter (or generated from the filter) as the spatial domain Rx filter used for receiving the SSB/PBCH and applies the corresponding SRS resource transmits; or
  • the UE transmits the SRS resource by applying the same spatial domain transmission filter used for reception of periodic CSI-RS or SP CSI-RS;
  • beam determination and transmission operation may be applied similarly to the above.
  • the UE may or may not receive feedback on SRS from the base station as in the following three cases (S1040).
  • the UE transmits the SRS through the beam indicated by the base station.
  • the base station corresponds to FIG. G(a) for the purpose of selecting the Rx beam.
  • Spatial_Relation_Info may not be set for all SRS resources in the SRS resource set.
  • the UE can freely transmit while changing the SRS beam. That is, in this case, the UE sweeps the Tx beam, and corresponds to FIG. G(b).
  • Spatial_Relation_Info may be set only for some SRS resources in the SRS resource set. In this case, for the configured SRS resource, the SRS is transmitted with the indicated beam, and for the SRS resource for which Spatial_Relation_Info is not configured, the UE can arbitrarily apply the Tx beam and transmit it.
  • CSI-RS channel state information-reference signal
  • time/frequency tracking time/frequency tracking
  • CSI calculation computation
  • the CSI computation is related to CSI acquisition (acquisition)
  • the L1-RSRP computation is related to the beam management (beam management, BM).
  • CSI channel state information refers to information that can indicate the quality of a radio channel (or link) formed between a terminal and an antenna port.
  • FIG. 13 is a flowchart illustrating an example of a CSI-related procedure.
  • a terminal eg, user equipment, UE transmits configuration information related to CSI to a base station (eg, general Node) through radio resource control (RRC) signaling.
  • RRC radio resource control
  • B gNB (S110).
  • the CSI-related configuration information includes CSI-IM (interference management) resource-related information, CSI measurement configuration-related information, CSI resource configuration-related information, CSI-RS resource-related information. Alternatively, it may include at least one of CSI report configuration related information.
  • CSI-IM interference management
  • CSI-IM resource-related information may include CSI-IM resource information, CSI-IM resource set information, and the like.
  • the CSI-IM resource set is identified by a CSI-IM resource set ID (identifier), and one resource set includes at least one CSI-IM resource.
  • Each CSI-IM resource is identified by a CSI-IM resource ID.
  • CSI resource configuration related information may be expressed as a CSI-ResourceConfig IE.
  • CSI resource configuration related information defines a group including at least one of a non zero power (NZP) CSI-RS resource set, a CSI-IM resource set, or a CSI-SSB resource set. That is, the CSI resource configuration related information includes a CSI-RS resource set list, and the CSI-RS resource set list is at least one of a NZP CSI-RS resource set list, a CSI-IM resource set list, or a CSI-SSB resource set list. may contain one.
  • the CSI-RS resource set is identified by the CSI-RS resource set ID, and one resource set includes at least one CSI-RS resource.
  • Each CSI-RS resource is identified by a CSI-RS resource ID.
  • parameters indicating the use of CSI-RS for each NZP CSI-RS resource set may be set.
  • Table 4 shows an example of the NZP CSI-RS resource set IE.
  • CSI report configuration related information is a report configuration type indicating time domain behavior (reportConfigType) parameter and a report quantity (reportQuantity) parameter indicating a CSI-related quantity for reporting.
  • the time domain behavior may be periodic, aperiodic or semi-persistent.
  • CSI report configuration related information may be expressed as a CSI-ReportConfig IE, and Table 5 below shows an example of the CSI-ReportConfig IE.
  • the UE measures CSI based on the configuration information related to the CSI (S120).
  • the CSI measurement may include (1) a process of receiving a CSI-RS by the UE (S121), and (2) a process of calculating CSI through the received CSI-RS (S122), which will be described in detail. will be described later.
  • the RE (resource element) mapping of the CSI-RS resource in the time and frequency domains is set by the higher layer parameter CSI-RS-ResourceMapping.
  • Table 6 shows an example of the CSI-RS-ResourceMapping IE.
  • the density indicates the density of the CSI-RS resource measured in RE / port / PRB (physical resource block), nrofPorts indicates the number of antenna ports.
  • the terminal reports the measured CSI to the base station (S130).
  • the terminal may omit the report.
  • the terminal may report to the base station.
  • the report of the terminal may be omitted.
  • the NR system supports more flexible and dynamic CSI measurement and reporting.
  • the CSI measurement may include a procedure of receiving a CSI-RS and acquiring CSI by computing the received CSI-RS.
  • CM periodic/semi-persistent/periodic channel measurement
  • IM interference measurement
  • CSI-IM configuration a 4-port NZP CSI-RS RE pattern is used.
  • CSI-IM based IMR of NR has a design similar to CSI-IM of LTE, and is configured independently of ZP CSI-RS resources for PDSCH rate matching. And, in the NZP CSI-RS-based IMR, each port emulates an interference layer with a (preferred channel and) precoded NZP CSI-RS. This is for intra-cell interference measurement for a multi-user case, and mainly targets MU interference.
  • the base station transmits the precoded NZP CSI-RS to the terminal on each port of the configured NZP CSI-RS based IMR.
  • the terminal assumes a channel / interference layer for each port in the resource set and measures the interference.
  • the base station or network For the channel, if there is no PMI and RI feedback, a plurality of resources are set in the set, and the base station or network indicates a subset of NZP CSI-RS resources through DCI for channel / interference measurement.
  • Each CSI resource setting 'CSI-ResourceConfig' includes a configuration for S ⁇ 1 CSI resource set (given by the higher layer parameter csi-RS-ResourceSetList).
  • CSI resource setting corresponds to CSI-RS-resourcesetlist.
  • S represents the number of configured CSI-RS resource sets.
  • the configuration for S ⁇ 1 CSI resource set is each CSI resource set including CSI-RS resources (consisting of NZP CSI-RS or CSI-IM) and SS / PBCH block (SSB) used for L1-RSRP computation ) including resources.
  • Each CSI resource setting is located in the DL BWP (bandwidth part) identified by the higher layer parameter bwp-id. And, all CSI resource settings linked to the CSI reporting setting have the same DL BWP.
  • the time domain behavior of the CSI-RS resource within the CSI resource setting included in the CSI-ResourceConfig IE is indicated by a higher layer parameter resourceType, and may be set to aperiodic, periodic or semi-persistent.
  • resourceType For Periodic and semi-persistent CSI resource setting, the number of configured CSI-RS resource sets (S) is limited to '1'.
  • S For Periodic and semi-persistent CSI resource settings, the set periodicity and slot offset are given in the numerology of the associated DL BWP, as given by bwp-id.
  • the same time domain behavior is configured for the CSI-ResourceConfig.
  • the same time domain behavior is configured for the CSI-ResourceConfig.
  • CM channel measurement
  • IM interference measurement
  • a channel measurement resource may be an NZP CSI-RS for CSI acquisition
  • an interference measurement resource may be a CSI-IM and an NZP CSI-RS for IM.
  • CSI-IM (or ZP CSI-RS for IM) is mainly used for inter-cell interference measurement.
  • the NZP CSI-RS for IM is mainly used for intra-cell interference measurement from multi-users.
  • the UE may assume that CSI-RS resource(s) for channel measurement and CSI-IM / NZP CSI-RS resource(s) for interference measurement configured for one CSI reporting are 'QCL-TypeD' for each resource. .
  • resource setting can mean a resource set list.
  • each trigger state set using the higher layer parameter CSI-AperiodicTriggerState is one or more CSI-ReportConfig and each CSI-ReportConfig linked to a periodic, semi-persistent or aperiodic resource setting.
  • One reporting setting can be connected with up to three resource settings.
  • the resource setting (given by the higher layer parameter resourcesForChannelMeasurement) is for channel measurement for L1-RSRP computation.
  • the first resource setting (given by the higher layer parameter resourcesForChannelMeasurement) is for channel measurement, and the second resource (given by csi-IM-ResourcesForInterference or nzp-CSI-RS -ResourcesForInterference)
  • the setting is for interference measurement performed on CSI-IM or NZP CSI-RS.
  • the first resource setting (given by resourcesForChannelMeasurement) is for channel measurement
  • the second resource setting (given by csi-IM-ResourcesForInterference) is for CSI-IM based interference measurement
  • the third resource setting (given by nzp-CSI-RS-ResourcesForInterference) is for NZP CSI-RS based interference measurement.
  • each CSI-ReportConfig is linked to a periodic or semi-persistent resource setting.
  • the resource setting is for channel measurement for L1-RSRP computation.
  • the first resource setting (given by resourcesForChannelMeasurement) is for channel measurement
  • the second resource setting (given by the higher layer parameter csi-IM-ResourcesForInterference) is performed on CSI-IM It is used for interference measurement.
  • each CSI-RS resource for channel measurement is associated with CSI-IM resource and resource by the order of CSI-RS resources and CSI-IM resources in the corresponding resource set. .
  • the number of CSI-RS resources for channel measurement is the same as the number of CSI-IM resources.
  • the UE does not expect to be set to one or more NZP CSI-RS resources in the resource set associated with the resource setting for channel measurement.
  • the UE in which the higher layer parameter nzp-CSI-RS-ResourcesForInterference is set does not expect that 18 or more NZP CSI-RS ports will be set in the NZP CSI-RS resource set.
  • the UE assumes the following.
  • Each NZP CSI-RS port configured for interference measurement corresponds to an interfering transport layer.
  • NZP CSI-RS resource for channel measurement NZP CSI-RS resource for measuring interference
  • CSI-IM resource for measuring interference CSI-IM resource for measuring interference
  • time and frequency resources available to the UE are controlled by the base station.
  • CSI channel state information
  • CQI channel quality indicator
  • precoding matrix indicator precoding matrix indicator
  • PMI CSI-RS resource indicator
  • SSBRI SS / PBCH block resource indicator
  • layer It may include at least one of indicator (LI), rank indicator (RI) or L1-RSRP.
  • the terminal is a list of N ⁇ 1 CSI-ReportConfig reporting setting, M ⁇ 1 CSI-ResourceConfig resource setting and one or two trigger states (aperiodicTriggerStateList and semiPersistentOnPUSCH) -provided by TriggerStateList), set by higher layers.
  • aperiodicTriggerStateList each trigger state includes a channel and optionally an associated CSI-ReportConfigs list indicating resource set IDs for interference.
  • semiPersistentOnPUSCH-TriggerStateList each trigger state includes one associated CSI-ReportConfig.
  • time domain behavior of CSI reporting supports periodic, semi-persistent, and aperiodic.
  • Periodic CSI reporting period (periodicity) and slot offset (slot offset) may be set in RRC, refer to the CSI-ReportConfig IE.
  • SP sin-periodic CSI reporting is performed on short PUCCH, long PUCCH, or PUSCH.
  • SP CSI on PUSCH periodicity of SP CSI reporting is set to RRC, but slot offset is not set to RRC, and SP CSI reporting is activated/deactivated by DCI (format 0_1).
  • DCI format 0_1
  • SP-CSI C-RNTI SP-CSI C-RNTI
  • the initial CSI reporting timing follows the PUSCH time domain allocation value indicated by DCI, and the subsequent CSI reporting timing follows the cycle set by the RRC.
  • DCI format 0_1 includes a CSI request field, and can activate/deactivation a specific configured SP-CSI trigger state.
  • SP CSI reporting has the same or similar activation/deactivation as the mechanism with data transmission on the SPS PUSCH.
  • aperiodic CSI reporting is performed on PUSCH and is triggered by DCI.
  • information related to the trigger of aperiodic CSI reporting may be delivered/indicated/configured through the MAC-CE.
  • AP CSI-RS timing is set by RRC, and timing for AP CSI reporting is dynamically controlled by DCI.
  • NR For NR, a method of dividing and reporting CSI in multiple reporting instances applied to PUCCH-based CSI reporting in LTE (eg, transmitted in the order of RI, WB PMI/CQI, SB PMI/CQI) is not applied. Instead, NR restricts the setting of a specific CSI report in short/long PUCCH, and a CSI omission rule is defined. And, in relation to AP CSI reporting timing, PUSCH symbol/slot location is dynamically indicated by DCI. And, candidate slot offsets are set by RRC. For CSI reporting, slot offset (Y) is set for each reporting setting. For UL-SCH, slot offset K2 is configured separately.
  • Two CSI latency classes are defined in terms of CSI computation complexity.
  • low latency CSI it is WB CSI including a maximum of 4 ports Type-I codebook or a maximum of 4-ports non-PMI feedback CSI.
  • High latency CSI refers to CSI other than low latency CSI.
  • Z, Z' is defined in the unit of OFDM symbols.
  • Z represents the minimum CSI processing time from receiving an aperiodic CSI triggering DCI to performing CSI reporting.
  • Z' represents the minimum CSI processing time from receiving CSI-RS for channel/interference to performing CSI reporting.
  • the UE reports the number of CSIs that can be simultaneously calculated.
  • the above salpin 5G communication technology may be applied in combination with the methods proposed in the present specification to be described later, or may be supplemented to specify or clarify the technical characteristics of the methods proposed in the present specification.
  • the on-device-based machine learning proposed in this specification may be applied in combination with a communication service by 3G, 4G and/or 6G communication technology as well as the 5G communication technology described above.
  • An increasingly complex communication system makes it more difficult to model a communication system that can provide optimal performance in a real environment.
  • a new approach is needed to realize a flexible communication system that can be optimized for QoS required by various services in each user's channel environment.
  • Machine learning which is showing remarkable achievements in various fields, centering on image and voice recognition, and in particular, deep learning (DL) technology in particular, various studies are being conducted to apply it to communication. is becoming
  • a method of replacing a mathematical transmission/reception model with a learning model based on machine learning is proposed. For example, when the computing device generates a learning model using the learning data obtained from the channel model, the generated learning model is transmitted to a machine learning-based communication system to provide a more adaptive wireless communication system compared to mathematical modeling can do.
  • the optimum value in the development environment considering various usage environments and the optimum value in the actual usage environment may be different. This difference is due to the difference between the input data in the environment in which the receiver of the terminal is used and the training dataset of the learning model provided from the cloud.
  • 15 is a flowchart of a method according to an embodiment of the present specification.
  • a method includes certain operations.
  • the predetermined operations are performed by at least one processor of the terminal, and specifically, the predetermined operations are connected to a transceiver, at least one processor, the at least one processor, and at least storing instructions. It is performed by a terminal including one memory.
  • the instructions when executed by the at least one processor, support operations for causing the at least one processor to communicate over a MIMO communication channel using multiple receive antennas, as described below in J.1 to J.4. The above operations will be described through .
  • At least one processor of the present specification may include at least one of a communication processor (CP) and an application processor (AP).
  • CP communication processor
  • AP application processor
  • the operations by the AP and/or CP may be functionally divided by the AP and the CP, or may be performed by one processor that is functionally combined. 15 and its description below illustrate that operations are performed by a 'processor'.
  • the machine learning network implemented in various embodiments of the present specification includes a Deep Neural Network (DNN), a Convolutional Neural Network (CNN), or parametric multiplications, additions, and non-linearities. and at least one of a recurrent neural network (RNN).
  • DNN Deep Neural Network
  • CNN Convolutional Neural Network
  • RNN recurrent neural network
  • 'data for learning', 'training data', and/or 'training data' may be used interchangeably.
  • At least one processor may generate or update a learning list based on one or more location samples collected during communication through a network ( S110 ).
  • the learning list includes one or more first items.
  • the first item means a predetermined communication environment.
  • one or more communication environments included in the learning list are used as learning targets of the machine learning network. That is, using training data obtained from one or more communication environments corresponding to one or more first items included in the learning list, at least one processor may provide a machine learning network optimized for each communication environment. Meanwhile, the first items may be distinguished by their respective IDs.
  • the learning list may include place information and base station information divided by the first item.
  • the place information may include spatial information about an application area to which the second machine learning network has been completed, or a collection area for obtaining the training data.
  • the terminal may control the receiver using a machine learning network associated with the application area.
  • the terminal may obtain training data for learning the machine learning network from the base station connected in the collection area.
  • connection information may be measured for each of one or more base stations to generate a learning list, and at least one processor may determine a target base station based on the measured connection information. At least one processor may be connected to the target base station or periodically obtain location samples of the terminal while connected, and determine one or more communication environments by applying a clustering algorithm to the location samples. As such, the determined one or more communication environments may be set as the first item of the learning list.
  • the at least one processor may perform operations of generating or updating at least one of a linked list, a candidate list, and a selection list to generate a learning list.
  • the at least one processor includes connection information (eg, primary cell connection time (T_pri), total connection time (T_tot), or total received data amount (D_tot)) and base station information (eg, Cell ID, or frequency band) may create or update a linked list including one or more second items having one or more of the following.
  • connection information eg, primary cell connection time (T_pri), total connection time (T_tot), or total received data amount (D_tot)
  • base station information eg, Cell ID, or frequency band
  • At least one processor may generate or update the candidate list based on the connection information of the linked list.
  • the candidate list may include one or more third items.
  • the third item may further include a score parameter.
  • the score parameter is calculated by applying a weight set to the connection information of the linked list. For example, the score may be calculated according to Equation 1 below.
  • Equation 1 w_tot means a weight for T_tot, w_pri means a weight for T_pri, and w_data means a weight for D. Meanwhile, in the present specification, the above-described D_tot may be used interchangeably with D, and are not distinguished from each other.
  • the at least one processor may generate or update the selection list by selecting one or more items by applying a weight set to any one of the one or more third items included in the candidate list.
  • At least one processor sorts (eg, in descending order) one or more third items included in the candidate list based on the score parameter, and selects K items (where K is a positive integer) from the top to generate a selection list or you can update it.
  • At least one processor may be connected to at least one of the one or more base stations of the selection list based on the selection list, or collect location information while connected. For example, the at least one processor may provide a command to the GPS module to generate location information, or a command to a transceiver to request delivery of location information to a network. In addition, at least a portion of the collected location information is sampled as a location sample for selecting a communication environment corresponding to the first item.
  • the at least one processor does not store in the memory at least a portion of the location information or the location sample obtained based on the location of the terminal. For example, when it is sensed that the terminal is located in the aforementioned application area, the at least one processor controls not to store the location information or the location sample in the memory. In addition, the at least one processor increases the parameter (N_in-region) associated with the location information acquisition period by one whenever the terminal enters the application region.
  • the at least one processor may increase a period for acquiring location information.
  • a period for acquiring location information may be selected as a smallest value among values greater than a current value among settable periods. At this time, if there is no value greater than the current value, the current value is maintained.
  • that N_in-region is greater than or equal to the threshold value means that the terminal is continuously learning, learning is completed, or is located in a communication environment where learning is attempted but failed. Accordingly, computing efficiency can be improved by adjusting the period of acquisition of location information.
  • the at least one processor may generate or update one or more first items to be added to the learning list based on a location sample of the terminal associated with one or more fourth items included in the selection list.
  • the at least one processor may apply a clustering algorithm to the plurality of location samples to provide one or more location sample clusters.
  • the clustering algorithm may use a density-based clustering algorithm, and includes Density-Based Spatial Clustering of Applications with Noise (DBSCAN), Mean-Shift Clustering, and the like.
  • the learning list may include state information for each first item.
  • the state information may include at least one of an acquisition state, a training state, a verification state, an application state, and a lock state, and the at least one processor may manage the first items based on the state information.
  • At least one processor acquires training data in an environment corresponding to the first item.
  • the learning state means a state of learning the machine learning network associated with the first item obtained the training data by using the training data obtained in the acquisition state.
  • the at least one processor performs an update of the machine learning network associated with the first item by using the training data obtained in the learning state.
  • the validation state means a state in which the updated machine learning network is verified in the learning state.
  • at least one processor verifies the performance of the updated machine learning network in the learning state.
  • the applied state means a state in which learning and verification are completed.
  • the at least one processor applies the machine learning network that has been trained and verified to the actual use environment.
  • the locked state refers to a state in which learning or verification is unsuccessful although the first item of the learning list is selected.
  • the first item in the locked state may be excluded from the learning list for a certain period of time or semi-permanently by a timer.
  • the at least one processor may obtain training data for updating the first machine learning network to be applied to the receiver of the terminal to the second machine learning network. There is (S115).
  • the place information may include spatial information about an application area to which the second machine learning network is applied, or a collection area for obtaining the training data.
  • the event related to any one of the one or more first items means that the terminal enters or is located in the collection area is detected.
  • the terminal when the terminal is located in the collection area, the terminal may obtain training data for learning the machine learning network from the base station connected in the collection area.
  • the training data represents a reception-related parameter.
  • the reception-related parameter may include a signal to noise ratio (SNR), a received signal strength indication (RSSI), a reference signal received power (RSRP), or a reference signal reception quality.
  • SNR signal to noise ratio
  • RSSI received signal strength indication
  • RSRP reference signal received power
  • Reference Signal Received Quality may include at least one.
  • At least one processor may update the first machine learning network using the training data ( S120 ).
  • Each layer of the machine learning network includes a node for determining a parameter (eg, a weight).
  • Hidden layers and nodes affect the performance of machine learning networks, but there is no formal way to determine their number.
  • the at least one processor may update the weight parameter between the node and the node to minimize the error between the output value and the measured value of the machine learning network using a back propagation method.
  • a learning algorithm for the weights a gradient descent method, a Levenberg-Marquardt method, a Bayesian regularization method, and the like are used.
  • Update refers to a change in weight and/or bias between nodes based on the training data.
  • the 'second machine learning network' in which the learning has been completed may be used interchangeably with the 'adaptive learning model'.
  • At least one processor may confirm success or failure of learning of the first machine learning network (S125).
  • the training result of the machine learning network is classified as failure.
  • the at least one processor may verify performance in an actual use environment (S130).
  • the at least one processor compares the first performance indicator measured by the first machine learning network before updating the machine learning network with a second performance indicator measured by the second machine learning network after updating the machine learning network, and the comparison Any one of the first and second machine learning networks may be selected based on .
  • the at least one processor may have a first performance indicator measured by applying the first machine learning network before the update and a second performance indicator measured by applying the second machine learning network after the update. may be compared, and any one of the first and second machine learning networks may be selected based on the comparison.
  • the at least one processor may measure and compare the first and second performance indicators again.
  • the at least one processor may increase the number of failures in learning of the first machine learning network.
  • At least one processor may switch the state information of the first item to the locked state when the number of learning failures exceeds the set first maximum number of times (N_train-max-try) (S150: NO) (S160).
  • the at least one processor may initialize the updated machine learning network before the update.
  • the at least one processor may initialize the updated machine learning network before the update and simultaneously switch or set the state information of the first item to a locked state.
  • the at least one processor collects training data again and performs learning of the machine learning network (S115, S120).
  • At least one process may apply the second machine learning network in the application area of the first item (S140).
  • the state information of the first item associated with the second machine learning network is transferred to the applied state.
  • the at least one processor may control the receiver through the second machine learning network while being located in the application area.
  • At least one processor may be connected to the base station associated with one or more first items of the learning list, or may periodically check the location of the terminal while connected.
  • the positioning period of the terminal may be adjusted in inverse proportion to the moving speed of the terminal.
  • the at least one processor When it is confirmed that the terminal has entered the application area of any one of the plurality of first items of the learning list, the at least one processor provides a communication service by applying the second machine learning network learned in the communication environment into which the terminal entered do. Thereafter, when the terminal leaves the application area, the at least one processor stops application of the second machine learning network. When the application of the second machine learning network is stopped, the at least one processor may apply the first machine learning network to provide a communication service.
  • At least one process may increase the number of verification failures with respect to the second machine learning network.
  • the at least one processor may switch the state information of the first item to a locked state (S160).
  • the at least one processor collects training data again and performs learning of the first machine learning network (S115, S120).
  • the at least one processor measures a third performance indicator while providing a communication service using the second machine learning network, and compares the third performance indicator with the second performance indicator measured in the verification state to determine whether performance is degraded. It can be determined (S145). If it is determined that the performance of the second machine learning network is degraded (S145: YES), at least one processor stops the application of the first item corresponding to the communication environment in which the performance is low, and transitions back to the acquisition state. It can be (S115).
  • the determination of whether performance is degraded may be performed based on a set timer.
  • a timer related to performance degradation may be defined as a check timer.
  • the at least one processor may determine whether performance is degraded whenever the check timer expires. If it is determined that the performance of the second machine learning network is not degraded (S145: NO), at least one processor may initialize the check timer to start again.
  • the at least one processor sets the state information of the first item to a lock (S160). ), and thus, the unlock timer is started in response to the lock state being initiated.
  • the at least one processor may delete the corresponding first item from the learning list and perform the operation of S110 again.
  • 16 exemplarily illustrates a communication environment according to an embodiment of the present specification.
  • the communication environment may be specified by connected base station information (eg, Cell ID, frequency band) and place information (eg, central location, radius).
  • connected base station information eg, Cell ID, frequency band
  • place information eg, central location, radius
  • the communication environment may be established in association with each base station or base station information.
  • ENV1A and ENV1B are set in association with the first base station BS1
  • ENV2 is set in association with the second base station BS2
  • ENV3A, ENV3B, and ENV3C are set in association with the third base station BS3 do.
  • Each base station may include one or more communication environments within each coverage (eg, CO1, CO2, CO3).
  • ENV1A and ENV1B different communication environments may exist depending on location information (refer to ENV1A and ENV1B). Also, even in the same place, there may be two or more different communication environments depending on Cell ID and frequency band (refer to ENV3A and ENV3B).
  • a place can be expressed in two or three dimensions. In the case of two dimensions, a place can be represented by latitude and longitude, and in the case of three dimensions, it can be represented by latitude, longitude, and altitude. In addition, the place may be specified and subdivided using additional information such as a floor of a building and a WIFI access point (AP) ID.
  • AP WIFI access point
  • the at least one processor described above with reference to FIG. 15 is exemplarily divided into an AP and a CP, but at least one operation by the AP and the CP may be performed by one functionally coupled processor.
  • the CP may obtain base station information and connection information at regular intervals.
  • the base station information includes a cell ID and a frequency band
  • the connection information may have a total connection time (T_tot), a time connected to a primary cell (T_pri), and/or a total amount of received data (D_tot).
  • the CP may measure the connection time, the time connected to the primary cell, and/or the total amount of received data for each item divided by the cell ID and frequency band during the set period.
  • the CP may be provided with a weight corresponding to each connection information from the AP, and may calculate a score by applying the weight to the connection information measured for each item. For example, the CP may calculate a score by multiplying the connection information by a weight and then summing them up, which is the same as in Equation 1 above.
  • the CP may sort the list based on the calculated score, select only the top K items (K is a positive integer), and transmit the base station information and the connection information to the AP.
  • K is a positive integer
  • the K value is provided by the AP.
  • the AP may generate and manage the connection list based on at least one of the base station information and the connection information received from the CP.
  • the connection information provided to the AP is added to the connection list, and becomes the basis for the creation and management of the learning list thereafter.
  • the connection list may include base station information and connection information.
  • the base station information includes a cell ID and a frequency band
  • the connection information may have a total connection time (T_tot), a time connected to a primary cell (T_pri), and/or a total amount of received data (D_tot).
  • the AP may select a candidate base station requiring learning at a predetermined period as follows.
  • a list including one or more candidate base stations may be referred to as a candidate list.
  • the predetermined period may be a multiple of the connection information reporting period provided from the CP.
  • the AP may generate and manage a connection list based on connection information received from the CP prior to selecting a candidate base station.
  • the AP may initialize the connection list at the starting point of the predetermined period.
  • the initialized list becomes an empty list, or is changed to a conventional linked list recorded at a specific point in time.
  • the AP may perform at least one of the following operations whenever it receives connection information from the CP.
  • the AP compares whether the received base station information (eg, Cell ID, frequency band) exists in the pre-stored linked list, and as a result of the comparison, at least a portion of the received base station information does not exist in the pre-stored linked list. Unused information can be added to the pre-stored linked list. In other words, if the received base station information is not in the connected list, the AP may add an item corresponding to the base station information to the connected list.
  • the received base station information eg, Cell ID, frequency band
  • the AP may accumulate a total connection time (T_tot), a connection time to a primary cell (T_pri), and/or a total amount of received data (D_tot) for each base station information.
  • T_tot total connection time
  • T_pri connection time to a primary cell
  • D_tot total amount of received data
  • the AP may perform at least one operation for updating the candidate list at the end of the predetermined period of the linked list.
  • the AP may add a corresponding item and initialize the connection information.
  • the initialized item becomes an empty item, or is changed to a conventional item recorded at a specific point in time.
  • the AP may update the connection information for each item of the candidate list based on the connection information of the connection list.
  • alpha-tracking or moving average may be applied, but is not limited thereto.
  • the AP excludes the learning target based on the total connection time (T_tot) for each item, the time connected to the primary cell (T_pri), and/or the total received data amount (D_tot) and the weight provided for each item.
  • the learning target indicates items for which a score calculated based on the weight exceeds a set reference value.
  • FIG. 18 exemplifies a case in which items having score_y and score_z have scores less than or equal to a reference value, and score_a, score_b, j, and score_x have scores that subtract the reference value. In this case, items having score_y and score_z may be classified as exclusion targets, and the remaining items may be classified as learning targets.
  • the weight provided for each item may be the same as or different from the weight used in the CP prior to generation and management of the linked list.
  • One or more items selected as learning targets may be updated to the selection list, but one or more items selected as exclusion targets are deleted from the candidate list.
  • the AP may perform at least one operation to update or manage the selection list whenever the candidate list is updated.
  • the AP may add one or more learning objects of the candidate list to the selection list if it is not on the selection list.
  • a parameter eg, dropCount
  • the value of the parameter associated with deletion may be initialized to 0 or increased by 1 according to a set algorithm.
  • 'deletion-related parameter' may be used interchangeably with 'deletion parameter'.
  • the deletion parameter is initialized to 0.
  • the deletion parameter is initialized to 0.
  • an item in the selection list that is not selected as a learning target increases the deletion parameter by 1.
  • the AP may add the selected learning target to the selection list and initialize a deletion parameter corresponding to the added item to 0.
  • the AP may initialize the deletion parameter of one or more items in the selection list corresponding to the one or more items selected as the learning target again to 0 in addition to the added items.
  • the AP may increase the deletion parameter of items that do not correspond to one or more newly selected or re-selected learning objects by one. In other words, the AP may increment the deletion parameter of all items whose deletion parameter is not updated to 0 by one.
  • the deletion parameter exceeds a threshold value
  • the learning target corresponding to the item may be deleted from the selection list.
  • the deletion of at least one learning object from the selection list may affect the management of a learning list, which will be described later.
  • a cancellation timer for each item (ie, learning environments) of the learning list associated with the base station as the deleted learning object is started. If the expiration period of the cancellation timer is 0, the cancellation timer is not started and the learning environment is deleted immediately. Conversely, if the expiration period of the cancellation timer is not 0 and the base station belonging to the learning environment included in the learning list is added to the selection list again before the cancellation timer expires, the cancellation timer is stopped. In addition, if the expiration period of the cancellation timer is not 0, but the cancellation timer expires later, the corresponding learning environment is deleted from the learning list.
  • the generated and managed selection list is the basis for selection of a communication environment for the collection of training data.
  • various embodiments of the present specification may specify an environment as a learning target through a list selected through at least one process, without simply collecting connection information and specifying an environment as a learning target according to the collection information.
  • At least one process prior to generating the selection list is not necessarily performed in various embodiments of the present specification, and a pre-processing process before generation of the linked list, a linked list management process, and a candidate based on the hardware properties
  • At least one of the list management process and the selection list management process may be omitted or combined.
  • the CP transmits all connection information to the AP without selecting it according to the weight.
  • the selection list may be managed by comparing the connection list with the selection list without selecting the base station to be learned according to the weight.
  • At least one of an AP and/or a CP may select a learning environment based on a selection list.
  • FIG. 20 assumes a first base station (BSa), a second base station (BSb), and a third base station (BSc) as base stations included in the selection list.
  • the first, second, and third base stations BSa, BSb, and BSc may have first, second, and third coverages COa, COb, and COc, respectively.
  • the AP transmits the selection list to the CP.
  • the CP may transmit a connection status report to the AP whenever communication with at least one base station included in the selection list is connected or disconnected based on the selection list.
  • a base station associated with at least one item included in the selection list may be referred to as a 'selection base station'.
  • the AP may obtain location information for the selected base station and store it in the memory.
  • the location information of the terminal may be provided by a CP or a separate device (eg, GPS, etc.).
  • the AP may acquire and store location information by one or more of the following operations.
  • the AP may be connected to or periodically obtain a location while connected to a base station. For example, a first event E1 in which the terminal enters the third coverage COc, a third event E3 in entering the first coverage COa, and a fifth event in entering the second coverage COb At (E5), the AP can obtain the location.
  • the AP may check whether the acquired location corresponds to the application area of the learning list. If the distance from the central location of the at least one learning environment included in the learning list to the location of the terminal based on the acquired location is within the application radius (r_apply), it corresponds to the application area. In addition, if the distance from the center position is within the learning radius (r_training), it corresponds to the learning area (refer to FIG. 23).
  • the AP if the acquired location corresponds to an application area of at least one learning environment included in the learning list, the AP does not store the location information. At this time, the AP increments a parameter indicating that it has entered the application area by 1 instead of storing the location information.
  • a parameter indicating entry into the application region may be referred to as an 'in-region parameter (N_in-region)'. If the in-region parameter is greater than or equal to the set reference value (N_extend-period), the AP may increase the location acquisition period of the terminal.
  • N_extend-period may be referred to as a period extension parameter.
  • values larger than the current period may be selected among one or more possible periods, and a smallest value may be selected from among the selected large values. If the current period is the largest value among one or more possible periods, the AP maintains the current period. On the other hand, if the acquired position does not correspond to the application area of the learning list, the AP stores the position information and sets the position acquisition period associated with the position to the smallest value among one or more possible periods.
  • a learning environment is provided through clustering based on a plurality of acquired location information or location samples sampled from location information.
  • the terminal may collect a plurality of location information while moving through the first to third coverages COa, COb, and COc.
  • the location information may be concentrated and collected in a predetermined place.
  • the reason why the collection is concentrated in a predetermined place is that the user frequently stays in a specific place according to the user's movement routine.
  • the location information is collected whenever a predetermined period expires, and the result of collecting the location information dense in a specific place may be derived.
  • the AP performs clustering if the number (n_point) of a plurality of location information or location samples is greater than or equal to the minimum number (N_clustering-point) required for selecting a learning location, and as a result, one or more generated
  • the center position of the cluster, the learning radius, and the application radius can be determined.
  • at least one cluster is indicated by a dotted circle or oval, and a central position is indicated by a flag.
  • the AP only targets clusters in which the number of location information or location samples (n_cluster-point) included in one or more generated clusters is greater than or equal to a set reference value (N_min-point). may decide
  • the AP may classify a plurality of location information or location samples into one or more location groups using a clustering algorithm.
  • the clustering algorithm may be a density-based clustering algorithm, but is not limited thereto.
  • the clustering algorithm includes, for example, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), and Mean-Shift Clustering, but is not limited thereto.
  • the AP may calculate the center position of each of the one or more clusters using a predetermined technique.
  • the central location may be calculated as an average value of longitude and latitude of one or more location information or location samples, or may be calculated by applying a k-Nearest Neighbor algorithm.
  • the AP checks the distance values from the central location of the cluster to the location information or location samples of the cluster, and determines a learning radius (r_train) based on the identified distance values.
  • r_train a learning radius
  • the learning radius may be calculated based on Equation 2 below.
  • Equation 2 r_train is the learning radius, r_train-min is the minimum value of the learning radius, r_train-max is the maximum value of the learning radius, and ⁇ is a real number greater than 0. For example, a value of 3 to 4 may be applied to ⁇ .
  • the AP determines an application radius (r_apply) for applying the machine hot class network for which learning is completed from the learning radius.
  • the application radius may be determined based on the error of the position measurement. Preferably, the radius of application is smaller as the error of the position measurement is greater. For example, the application radius may be calculated based on Equation 3 below.
  • Equation 3 r_apply represents a learning radius, and ⁇ represents a real number greater than 0 and less than or equal to 1.
  • the AP deletes all of the one or more location information or location samples stored in the memory of the base station belonging to one or more clusters. In this case, the remaining location information or location samples that are not deleted may be used together with the newly added location information or location samples to select a new learning environment.
  • the AP may add the determined center position and learning radius to the learning list together with base station information. At this time, the added item is initialized to the acquired state.
  • At least one of the AP or the CP manages the status of each item in the learning list, and performs a process related thereto based on the status information of the item.
  • the state information may include at least one of the following information.
  • Additional training is performed using the training data acquired based on the basic model.
  • the basic model refers to the machine learning network before on-device learning is performed.
  • the actual use environment refers to an environment to which the machine learning network generated in the learning environment associated with the learning environment of the machine learning network in which on-device learning is performed is applied. Also, a model that has been trained in an actual use environment may be referred to as an adaptive machine learning network.
  • 25 and 26 exemplarily describe a training data collection method according to an embodiment of the present specification.
  • At least one of the AP 130a and the CP 130b checks the status information of at least one item of the learning list, and performs at least one operation to be described later for each item of the learning list in the acquired state. By performing it, you can collect data for learning.
  • the AP 130a may check the state information of the learning list and transmit the learning environment in the acquired state to the CP 130b. In this case, the AP 130a may also transmit a list of one or more base stations included in the transmitted learning environment.
  • the CP 130b may report to the AP 130a whenever it is connected to or disconnected from the base station of the received learning environment.
  • the AP 130a may periodically obtain location information of the terminal while being connected to or connected to one or more base stations belonging to the learning environment.
  • the location information of the terminal is provided by the CP 130b or a separate device (eg, GPS).
  • the location information is for determining whether the terminal is located within a learning radius of the learning environment in which data for training of the machine learning network can be collected, unlike the previous location sample for determining the learning environment.
  • the AP 130a may confirm that the location of the terminal enters within the learning radius from the central location of the learning environment.
  • the AP 130a when an event that the terminal enters within the learning radius of the learning environment is detected, the AP 130a requests the CP 130b to collect data for learning.
  • the CP 130b may request transmission of learning data to a connected base station, and may collect reception-related learning data of a receiver that is received thereafter.
  • the training data may include reception related parameters.
  • the reception related parameter includes information related to the received signal. That is, the reception-related parameters are signal to noise ratio (SNR), received signal strength indication (RSSI), reference signal received power (RSRP), or reference signal reception quality ( Reference Signal Received Quality).
  • the CP 130b when the CP 130b receives the training data from the base station, it may transmit information related to the received signal to the AP 130a. In this case, the CP 130b may collect information related to signals received from the base station to configure a data sample for learning, and transmit the data sample for learning to the AP 130a. Also, the CP 130b may transmit the accumulated two or more learning data samples to the AP 130a at once.
  • the AP 130a may store the training data sample provided from the CP 130b in the non-volatile memory 120 or storage.
  • the AP 130a may request the CP 130b to stop collecting data for learning, when it is detected that the terminal has departed from the learning target environment.
  • the departure from the learning environment means a departure outside the learning radius from the central position of the learning environment.
  • the AP 130a when a sufficient number of data for learning is collected, the AP 130a requests the CP 130b to stop the collection of subsequent additional data for learning related to the corresponding learning environment. As such, when sufficient data is collected and the collection of learning data is stopped, the AP 130a may change the state of the learning environment, which is the object of the collection stop, from the acquisition state to the learning state.
  • 26 exemplarily describes a process of collecting training data.
  • the terminal may pass through the coverage of the first base station (BSa).
  • the terminal may pass through the learning environment (ENVX) located within the coverage of the first base station (BSa).
  • ENVX learning environment
  • FIG. 26 will be described on the assumption that the terminal passes both the learning area and the application area.
  • the terminal When the first event of entering into the coverage of the first base station (BSa) occurs, the terminal is connected to the first base station (BSa), and the terminal can obtain location information.
  • the terminal can obtain learning data from the base station when the second event EEE2 entering the learning radius of the learning environment ENVX is detected while monitoring the location within the coverage of the first base station BSa. Afterwards, when a fifth event (EEE5) in which the terminal deviates from the learning radius is detected, the terminal stops the collection of learning data.
  • EEE5 a fifth event in which the terminal deviates from the learning radius is detected
  • the terminal collects location information.
  • the AP 103a checks the learning list and acquires the learning data if it is one or more items in the acquisition state and , in the applied state, the learned machine learning network can be applied.
  • At least one of an AP and a CP performs on-device learning through at least one operation below for a basic model with respect to one or more items of a learning list in a learning state.
  • operations by the AP and/or CP may be used interchangeably with operations by the at least one processor 130 .
  • the basic model refers to a machine learning network in which on-device learning by the client device is not performed, as described above.
  • the learning state of one or more items of the learning list may include a learning progress state, a learnable state, and a learnable state in detail.
  • the learning progress state means a learning state recorded for each one or more points in the machine learning network in which learning is in progress.
  • the learnable state means a state in which the machine learning network can be learned by the client device. For example, a charging situation in which the terminal is receiving power by a charging device, or a preset time (eg, between 00:00 am and 05:00 am) may be set to a learnable state. In this case, the set time may be adjusted by the user.
  • a charging situation in which the terminal is receiving power by a charging device or a preset time (eg, between 00:00 am and 05:00 am) may be set to a learnable state. In this case, the set time may be adjusted by the user.
  • the non-learning state means a state in which the machine learning network cannot be learned by the client device.
  • the AP may initialize the learning progress state of the item in the learning state.
  • initialization means setting a starting point for starting the recording of the learning progress state. After that, the learning progress state is not initialized with respect to one or more items in which learning is in progress, and new learning proceeds from the previous learning progress state.
  • the AP may perform learning when the terminal becomes a learnable state. If there is learning that has been previously conducted in advance, learning may be continuously performed from the learning progress state of the learning performed before the current learnable state.
  • the AP stores the learning progress state of the machine learning network under learning and the machine learning network under learning at each preset point in time at which learning is performed in the non-volatile memory 120 or storage. Even if learning is interrupted by an unexpected situation, the AP can continue learning based on the stored learning progress after the system is normalized. For example, in the case of an algorithm based on iterative updates, such as Stochastic Gradient Descent (SGD), the AP may store a progress state whenever a preset number of iteration tasks are completed.
  • SGD Stochastic Gradient Descent
  • the AP may stop learning of the machine learning network and store the final learning progress state in the non-volatile memory 120 or storage.
  • the event that becomes the non-learning state means all events that do not become the above-described learnable state. For example, when the terminal is separated or separated from the charging device, or an event that does not fall within a preset learnable time range occurs, the terminal is classified as an unlearnable state.
  • the AP repeats the process of J.3.1. at least once or more until learning is completed.
  • the AP discards the learning data stored in the memory 120 , and stores the machine learning network in which the learning is completed in the memory 120 .
  • the AP may change the state of the learning environment corresponding to or related to the machine learning network on which the learning is completed to the verification state.
  • the AP may increase the learning failure parameter by 1.
  • the learning failure parameter is defined as the number of times that learning has failed. Learning failure is a case in which the training error is not small enough or the difference between the training error and the test error (Test Error, or Generalization Error) is not small enough in the learning process of the machine learning network by the AP. meaning, but is not limited thereto.
  • the AP When an event occurs in which the learning failure parameter is greater than or equal to a preset threshold (N_train-max-try), the AP stores learning data associated with or corresponding to the learned machine learning network associated with the generated event or corresponding from the memory 120 . Delete, and set the state information of the learning environment corresponding to the generated event to the locked state.
  • N_train-max-try a preset threshold
  • the AP performs training again after additionally acquiring training data.
  • At least one of the AP and the CP may check one or more items in the learning list, and compare the performance of the machine learning network before and after learning in the actual use environment with respect to the item in the verified state.
  • the AP may control the receiver by applying the newly learned machine learning network. Conversely, if the performance of the machine learning network before learning is determined to be better, the AP can apply the existing machine learning network to control the receiver.
  • the performance may be compared using a performance measurement standard of a wireless link, such as Block Error Rate (BLER), Packet Error Rate (PER), Symbol Error Rate (SER), or Bit Error Rate (BER).
  • BLER Block Error Rate
  • PER Packet Error Rate
  • SER Symbol Error Rate
  • BER Bit Error Rate
  • the performance comparison technique used in various embodiments of the present specification may be performed by at least one of the first verification technique and the second verification technique, but is not limited thereto.
  • the AP measures the reception performance by applying the machine learning network before learning until the learning of the machine learning network is completed, and when the learning is completed, the reception performance is applied by applying a new machine learning network measure
  • the AP may communicate by applying the machine learning network before learning during the P1a period ( S210 ).
  • the AP may obtain learning data for learning the machine learning network during the P1a_1 section (S220).
  • the AP may train the machine learning network during the P1a_2 period using the collected data (S240).
  • the AP may collect data for performance measurement in the P1a_3 section that is at least a part of P1a.
  • the collected data represents the performance of machine learning data before learning.
  • the starting point of receiving performance measurement when a new machine learning network is applied is delayed until the performance measurement of the existing machine learning network is completed.
  • the AP may apply the machine learning network learned during the P3a period to the receiver (S250).
  • the AP may collect data for measuring the performance of the machine learning network learned during at least a part of the P3a section ( S260 ).
  • the AP may compare it with the performance of the machine learning network before learning. Then, based on the comparison result, any one of the machine learning networks before and after learning may be selected and applied to the receiver (S270).
  • the CP may measure the performance of the machine learning network before learning and transmit it to the AP, periodically or whenever more than a certain amount of data is received during the period during which the collection of learning data is performed.
  • the on-device learning is completed and the application of the new machine learning network is ready. Request the application of the learning network.
  • the CP controls data reception by applying a new machine learning network, and measures the performance by the new machine learning network periodically or whenever more than a certain amount of data is received and delivers it to the AP. .
  • the AP can compare it with the performance data by the machine learning network before learning.
  • the AP stops measuring the performance and changes the state information of the corresponding item to the applied state.
  • the AP can change the state information to the applied state and simultaneously store all the performance data of the machine learning network before and after learning in the memory. In this way, the stored performance data can be used to check the performance degradation of the machine learning network that may occur later in time.
  • the verification failure parameter is incremented by 1.
  • the verification failure parameter means the number of verification failures. If the verification failure parameter is greater than or equal to a preset threshold (N_veryfiy-max-try), the AP removes the training data and the learned machine learning network from memory. In addition, the AP may change the item of the learning list corresponding to the machine learning network learned to the locked state at the same time as the removal. If the verification failure parameter is less than the preset threshold (N_verify-max-try), the on-device learning and verification process may be performed again after acquiring the training data again.
  • N_veryfiy-max-try a preset threshold
  • N_verify-max-try the preset threshold
  • the AP alternately applies the pre-learning machine learning network and the post-learning machine learning network for a set time interval from the time when the learning of the machine learning network is completed, and measures and compares performance.
  • the AP may communicate by applying the machine learning network before learning during the P1b period ( S310 ). As in S310, while communicating by applying the machine learning network before learning, the AP may obtain learning data for learning the machine learning network during the P1b_1 section (S320). In addition, when sufficient learning data is collected, the AP may train the machine learning network during the P1b_2 period using the collected data (S330).
  • the AP may repeatedly perform measurement and comparison of the performance of the machine learning network before and after learning for a set time interval ( S340 ).
  • the first to K-th performance comparison (K is a positive integer) may be performed by applying and comparing the machine learning network before and after learning (S350_1, S, and S350_K).
  • the P3b_1 value and the P3b_2 value which are the lengths of the application period of the machine learning network for performance comparison, may be the same.
  • the lengths (P2b_1, J, and P2b_K) of the performance comparison section repeatedly performed several times may be set to be the same.
  • any one of the machine learning networks before and after learning may be selected and applied to the receiver (S360).
  • the AP may measure and accumulate performance data of a machine learning network before learning and a machine learning network after learning.
  • the AP applies the machine learning network before and after learning with the CP to the receiver and sequentially requests to measure the performance.
  • the AP may transmit control information including at least one of a measurement period or an amount of data required to be received while performing the measurement.
  • the CP can measure the performance while receiving the requested data for the requested period by applying the machine learning network requested by the AP and deliver it to the AP.
  • the AP can determine whether the performance of the new machine learning network is improved over the machine learning network before learning through statistical hypothesis verification.
  • the AP stops the performance comparison process and applies the new machine learning network to the receiver.
  • the AP stops the performance comparison process and applies the existing machine learning network to the receiver.
  • the AP checks whether the verification time is exceeded. At this time, if the allowed performance verification time is not exceeded, the AP again acquires and accumulates performance data to perform verification. In contrast, if the allowed performance verification time is exceeded, the AP stops the performance comparison procedure and uses the machine learning network before learning.
  • the AP may initialize the performance data measured in association with the pre-learning machine learning network and the post-learning machine learning network before acquisition and accumulation of the performance data.
  • 30 to 32 exemplarily describe a method of applying a machine learning network according to an embodiment of the present specification.
  • At least one of the AP 130a and the CP 130b may check one or more items in the learning list and, if the items are in an applied state, may communicate using the learned machine learning network.
  • This application process may be divided into a case in which the CP 130b cannot directly acquire location information without relying on the AP 130a, and a case in which the CP 130b can directly acquire location information.
  • the AP 130a may transmit a base station list (BS List) of the learning environment in the applied state to the CP 130b.
  • the base station list of the learning environment means a list including information on one or more base stations located within the application radius of the learning environment.
  • one or more base stations included in the list of base stations of the learning environment may be limited to base stations associated with selection of the learning environment. Accordingly, a base station that is irrelevant to the selection of a learning environment having little relevance to the learned machine learning network (ML model) may be excluded from the application target.
  • ML model learned machine learning network
  • the CP 130b may notify the AP 130a whenever it is connected to or disconnected from a base station to which the learned machine learning network is applied.
  • the AP 130a may be connected to a base station to be applied, or may periodically acquire location information of the terminal while connected to the base station.
  • the location information may be performed in combination with the above-described method for obtaining location information in various embodiments of the present specification.
  • the acquisition period of the location information may be adjusted in inverse proportion to the moving speed of the terminal.
  • the AP 130a may deliver the machine learning network learned in the environment in which the event is detected to the CP 130b. . Then, the AP 130a may request application of the delivered machine learning network. In this case, the application request of the machine learning network may be performed simultaneously with the delivery operation.
  • the CP 130b may perform communication using the requested machine learning network. have. If the base station information does not match, the CP 130b may perform communication using a machine learning network before learning.
  • the AP 130a may request the CP 130b to stop application of the machine learning network associated with the learning environment corresponding to the applicable radius when the terminal deviates outside the applied radius based on the obtained location information.
  • the CP 130b receives a request to stop the application, it can perform communication by applying the machine learning network before learning.
  • the AP 130a may perform a second application related to the first application target environment. While entering the second application target environment while performing the first machine learning network, it is possible to control communication by switching to the second machine learning network associated with the second application target environment.
  • the CP 130b may create and manage a list of N_apply-model learned applied models L2 at most.
  • N_apply-model is a positive integer of 1 or more.
  • the AP 130a transmits a list of the learning environment in the applied state to the CP 130b.
  • the AP 130a may transmit at least one of base station information and place information together with the list of learning environments.
  • the AP 130a delivers the changed information whenever there is a change or a list of the learning environment in the entire applied state again.
  • the CP 130b periodically acquires the location information of the terminal and may enter within a set time according to the distance between the current location of the terminal and the application target environments, and the moving speed and direction of the terminal.
  • Target environments can be selected.
  • at least one processor may calculate a score for at least one candidate environment by applying a weight to input data. Thereafter, the at least one processor may select at least one of the calculated scores to select an application target environment.
  • At least one processor adds a sigmoid layer to the machine learning network used in FIG. 32A to obtain probability values for at least one candidate environment (candidates). can be calculated. In this case, based on the calculated probability value, at least a part of at least one candidate environment may be calculated as an application target environment.
  • the CP 130b may request the learned machine learning network from the AP 130a if there are learning environments that do not have the learned machine learning network. Accordingly, all learning environments included in the list L2 may have machine learning networks associated therewith.
  • the CP 130b may adjust the acquisition period of location information based on at least one of a distance to application target environments, and a moving speed and direction of the terminal. As the minimum distance to the application target environments is smaller, the moving speed of the terminal is faster, and the target environment direction and the moving direction are the same, the shorter period is set.
  • the AP 130a may transmit the learned machine learning network of the requested learning environment to the CP 130b.
  • the CP 130b may add the learned machine learning network received from the AP 130a to the applied model list L2. At this time, if there is no empty space in the applied model list L2, the CP 130b discards the machine learning network that is unlikely to be used within the set time period and adds the newly received machine learning network.
  • the CP 130b applies the machine learning network before learning and up to N_apply-model learned application models based on at least one of the location information of the terminal or the connection state with the base station.
  • the CP 130b may perform communication using the machine learning network included in the application model list L2. If there is no machine learning network associated with the learning environment of the applicable radius in the application model list, the associated machine learning network may be requested from the AP 130a.
  • the CP 130b may perform communication by applying the machine learning network before learning.
  • the AP 130a may perform a second application related to the first application target environment. While entering the second application target environment while performing the first machine learning network, it is possible to control communication by switching to the second machine learning network associated with the second application target environment.
  • At least one of the AP 130a and the CP 130b may operate the performance check timer at the starting point of the applied state. At this time, the performance check timer is operated corresponding to each of the items of the learning list in the applied state.
  • the AP 130a may request performance measurement data from the CP 130b.
  • the AP 130a may request application of the learned machine learning network and measurement of its performance.
  • the AP 130a may transmit a list of the learning environment in the applied state or request measurement of the performance along with the change thereof.
  • the CP 130b measures the performance whenever the machine learning network learned in the environment in which the performance measurement is requested is applied and delivers it to the AP 130a.
  • the AP 130a compares the currently measured performance with performance values stored in advance in the verification process of the learned machine learning network to determine whether the performance is degraded.
  • the performance measurement data may be accumulated by, for example, operating a timer when the timer expires or whenever the application radius is entered.
  • the AP 130a determines that performance degradation has occurred when the current performance falls below a certain level compared to the verification performance of the machine learning network learned or below the performance of the machine learning network before learning. Also, if performance degradation occurs, the AP 130a stops applying the learned model and transitions to the acquisition state. If the performance degradation has not occurred, the AP 130a restarts the performance check timer.
  • 33 and 34 exemplarily describe a method of managing an item in a locked state according to an embodiment of the present specification.
  • At least one of the AP 130a and the CP 130b may check one or more items in the learning list, and, if the item is in the locked state, may operate the unlock timer at the starting point of the lock state. If the unlock timer expires, the AP 130a may delete the expired item from the learning list. In this case, an item that is released from the lock and deleted from the learning list may be selected again as the learning environment.
  • At least one processor does not obtain a location sample within the application radius before the item is deleted, and thus cannot select or create a learning environment associated with the item, but cannot apply the deleted item when the item is deleted. Position samples can be re-collected within the radius.
  • the at least one processor may reselect a new learning environment independent of the deleted item.
  • the newly selected learning environment may be set differently from the deleted learning environment in center position and/or radius information (eg, application radius, learning radius).
  • the re-selected learning environment is set to the learning state as described above. A subsequent overlapping description will be omitted.
  • Devices to which the method according to various embodiments of the present specification are applied may be provided with a user interface related to on-device learning.
  • the user interface may include at least one of a full function On/Off interface, a condition for acquiring data for learning, a learning available time, and a status check/control interface of the learning list.
  • the status check/control interface of the learning list classifies according to the status of each item of the learning list and displays the status so that the user can recognize the status in the order of application, verification, learning, acquisition, and locking.
  • the status check/control interface of the learning list provides information for each item (eg, environment name set by the user, base station information, place information, application status, degree of performance improvement compared to the reference model, lock status, lock status) expiration date, etc.).
  • Environment names represent, for example, our home, office, and the like.
  • the base station information may include a cell ID and a frequency band.
  • the place information may include a center position and a learning/applying radius. In this case, the central location may be displayed as an address and latitude/longitude (/altitude).
  • the user may delete an item of the learning list through the interface.
  • 35 illustrates a communication system applied to the present invention.
  • the communication system 1 applied to the present invention includes a wireless device, a base station, and a network.
  • the wireless device refers to a device that performs communication using a radio access technology (eg, 5G NR (New RAT), LTE (Long Term Evolution)), and may be referred to as a communication/wireless/5G device.
  • a radio access technology eg, 5G NR (New RAT), LTE (Long Term Evolution)
  • the wireless device includes a robot 100a, a vehicle 100b-1, 100b-2, an eXtended Reality (XR) device 100c, a hand-held device 100d, and a home appliance 100e. ), an Internet of Things (IoT) device 100f, and an AI device/server 400 .
  • the vehicle may include a vehicle equipped with a wireless communication function, an autonomous driving vehicle, a vehicle capable of performing inter-vehicle communication, and the like.
  • the vehicle may include an Unmanned Aerial Vehicle (UAV) (eg, a drone).
  • UAV Unmanned Aerial Vehicle
  • XR devices include AR (Augmented Reality)/VR (Virtual Reality)/MR (Mixed Reality) devices, and include a Head-Mounted Device (HMD), a Head-Up Display (HUD) provided in a vehicle, a television, a smartphone, It may be implemented in the form of a computer, a wearable device, a home appliance, a digital signage, a vehicle, a robot, and the like.
  • the portable device may include a smart phone, a smart pad, a wearable device (eg, a smart watch, smart glasses), a computer (eg, a laptop computer), and the like.
  • Home appliances may include a TV, a refrigerator, a washing machine, and the like.
  • the IoT device may include a sensor, a smart meter, and the like.
  • the base station and the network may be implemented as a wireless device, and a specific wireless device 200a may operate as a base station/network node to other wireless devices.
  • the wireless devices 100a to 100f may be connected to the network 300 through the base station 200 .
  • AI Artificial Intelligence
  • the network 300 may be configured using a 3G network, a 4G (eg, LTE) network, or a 5G (eg, NR) network.
  • the wireless devices 100a to 100f may communicate with each other through the base station 200/network 300, but may also communicate directly (e.g. sidelink communication) without passing through the base station/network.
  • the vehicles 100b-1 and 100b-2 may perform direct communication (e.g. Vehicle to Vehicle (V2V)/Vehicle to everything (V2X) communication).
  • the IoT device eg, sensor
  • the IoT device may directly communicate with other IoT devices (eg, sensor) or other wireless devices 100a to 100f.
  • Wireless communication/connection 150a, 150b, and 150c may be performed between the wireless devices 100a to 100f/base station 200 and the base station 200/base station 200 .
  • the wireless communication/connection includes uplink/downlink communication 150a and sidelink communication 150b (or D2D communication), and communication between base stations 150c (eg relay, IAB (Integrated Access Backhaul)).
  • This can be done through technology (eg 5G NR)
  • Wireless communication/connection 150a, 150b, 150c allows the wireless device and the base station/radio device, and the base station and the base station to transmit/receive wireless signals to each other.
  • the wireless communication/connection 150a, 150b, and 150c may transmit/receive signals through various physical channels.
  • various signal processing processes eg, channel encoding/decoding, modulation/demodulation, resource mapping/demapping, etc.
  • resource allocation processes etc.
  • the first wireless device 100 and the second wireless device 200 may transmit/receive wireless signals through various wireless access technologies (eg, LTE, NR).
  • ⁇ first wireless device 100, second wireless device 200 ⁇ is ⁇ wireless device 100x, base station 200 ⁇ of FIG. 35 and/or ⁇ wireless device 100x, wireless device 100x) ⁇ can be matched.
  • the first wireless device 100 includes one or more processors 102 and one or more memories 104 , and may further include one or more transceivers 106 and/or one or more antennas 108 .
  • the processor 102 controls the memory 104 and/or the transceiver 106 and may be configured to implement the descriptions, functions, procedures, suggestions, methods, and/or flow charts disclosed herein.
  • the processor 102 may process the information in the memory 104 to generate the first information/signal, and then transmit a wireless signal including the first information/signal through the transceiver 106 .
  • the processor 102 may receive the radio signal including the second information/signal through the transceiver 106 , and then store the information obtained from the signal processing of the second information/signal in the memory 104 .
  • the memory 104 may be connected to the processor 102 and may store various information related to the operation of the processor 102 .
  • the memory 104 may provide instructions for performing some or all of the processes controlled by the processor 102 , or for performing the descriptions, functions, procedures, suggestions, methods, and/or operational flowcharts disclosed herein. may store software code including
  • the processor 102 and the memory 104 may be part of a communication modem/circuit/chip designed to implement a wireless communication technology (eg, LTE, NR).
  • a wireless communication technology eg, LTE, NR
  • the transceiver 106 may be coupled with the processor 102 , and may transmit and/or receive wireless signals via one or more antennas 108 .
  • the transceiver 106 may include a transmitter and/or a receiver.
  • the transceiver 106 may be used interchangeably with a radio frequency (RF) unit.
  • RF radio frequency
  • a wireless device may refer to a communication modem/circuit/chip.
  • the second wireless device 200 includes one or more processors 202 , one or more memories 204 , and may further include one or more transceivers 206 and/or one or more antennas 208 .
  • the processor 202 controls the memory 204 and/or the transceiver 206 and may be configured to implement the descriptions, functions, procedures, suggestions, methods, and/or operational flowcharts disclosed herein.
  • the processor 202 may process the information in the memory 204 to generate third information/signal, and then transmit a wireless signal including the third information/signal through the transceiver 206 .
  • the processor 202 may receive the radio signal including the fourth information/signal through the transceiver 206 , and then store information obtained from signal processing of the fourth information/signal in the memory 204 .
  • the memory 204 may be connected to the processor 202 and may store various information related to the operation of the processor 202 .
  • the memory 204 may provide instructions for performing some or all of the processes controlled by the processor 202 , or for performing the descriptions, functions, procedures, suggestions, methods, and/or operational flowcharts disclosed herein. may store software code including
  • the processor 202 and the memory 204 may be part of a communication modem/circuit/chip designed to implement a wireless communication technology (eg, LTE, NR).
  • a wireless communication technology eg, LTE, NR
  • the transceiver 206 may be coupled to the processor 202 and may transmit and/or receive wireless signals via one or more antennas 208 .
  • the transceiver 206 may include a transmitter and/or a receiver.
  • the transceiver 206 may be used interchangeably with an RF unit.
  • a wireless device may refer to a communication modem/circuit/chip.
  • one or more protocol layers may be implemented by one or more processors 102 , 202 .
  • one or more processors 102 , 202 may implement one or more layers (eg, functional layers such as PHY, MAC, RLC, PDCP, RRC, SDAP).
  • the one or more processors 102, 202 may be configured to process one or more Protocol Data Units (PDUs) and/or one or more Service Data Units (SDUs) according to the description, function, procedure, proposal, method, and/or operational flowcharts disclosed herein.
  • PDUs Protocol Data Units
  • SDUs Service Data Units
  • One or more processors 102, 202 may generate messages, control information, data, or information according to the description, function, procedure, proposal, method, and/or flow charts disclosed herein.
  • the one or more processors 102 and 202 generate a signal (eg, a baseband signal) including PDUs, SDUs, messages, control information, data or information according to the functions, procedures, proposals and/or methods disclosed in this document. , to one or more transceivers 106 and 206 .
  • the one or more processors 102 , 202 may receive signals (eg, baseband signals) from one or more transceivers 106 , 206 , and may be described, functions, procedures, proposals, methods, and/or operational flowcharts disclosed herein.
  • PDUs, SDUs, messages, control information, data, or information may be acquired according to the above.
  • One or more processors 102 , 202 may be referred to as a controller, microcontroller, microprocessor, or microcomputer.
  • One or more processors 102, 202 may be implemented by hardware, firmware, software, or a combination thereof.
  • ASICs Application Specific Integrated Circuits
  • DSPs Digital Signal Processors
  • DSPDs Digital Signal Processing Devices
  • PLDs Programmable Logic Devices
  • FPGAs Field Programmable Gate Arrays
  • firmware or software which may be implemented to include modules, procedures, functions, and the like.
  • the descriptions, functions, procedures, proposals, methods, and/or flow charts disclosed herein provide that firmware or software configured to perform is included in one or more processors 102 , 202 , or stored in one or more memories 104 , 204 . It may be driven by the above processors 102 and 202 .
  • the descriptions, functions, procedures, suggestions, methods, and/or flowcharts of operations disclosed herein may be implemented using firmware or software in the form of code, instructions, and/or a set of instructions.
  • One or more memories 104 , 204 may be coupled with one or more processors 102 , 202 and may store various forms of data, signals, messages, information, programs, code, instructions, and/or instructions.
  • One or more memories 104 , 204 may be comprised of ROM, RAM, EPROM, flash memory, hard drives, registers, cache memory, computer readable storage media, and/or combinations thereof.
  • One or more memories 104 , 204 may be located inside and/or external to one or more processors 102 , 202 .
  • one or more memories 104 , 204 may be coupled to one or more processors 102 , 202 through various technologies, such as wired or wireless connections.
  • One or more transceivers 106 , 206 may transmit user data, control information, radio signals/channels, etc. referred to in the methods and/or operational flowcharts of this document to one or more other devices.
  • One or more transceivers 106, 206 may receive user data, control information, radio signals/channels, etc. referred to in the descriptions, functions, procedures, suggestions, methods and/or flow charts, etc. disclosed herein, from one or more other devices. have.
  • one or more transceivers 106 , 206 may be coupled to one or more processors 102 , 202 and may transmit and receive wireless signals.
  • one or more processors 102 , 202 may control one or more transceivers 106 , 206 to transmit user data, control information, or wireless signals to one or more other devices.
  • one or more processors 102 , 202 may control one or more transceivers 106 , 206 to receive user data, control information, or wireless signals from one or more other devices.
  • one or more transceivers 106, 206 may be coupled to one or more antennas 108, 208, and the one or more transceivers 106, 206 may be coupled via one or more antennas 108, 208 to the descriptions, functions, and functions disclosed herein. , procedures, proposals, methods and/or operation flowcharts, etc.
  • one or more antennas may be a plurality of physical antennas or a plurality of logical antennas (eg, antenna ports).
  • the one or more transceivers 106, 206 convert the received radio signal/channel, etc. from the RF band signal to process the received user data, control information, radio signal/channel, etc. using the one or more processors 102, 202. It can be converted into a baseband signal.
  • One or more transceivers 106 and 206 may convert user data, control information, radio signals/channels, etc. processed using one or more processors 102 and 202 from baseband signals to RF band signals.
  • one or more transceivers 106 , 206 may include (analog) oscillators and/or filters.
  • the above-described specification can be implemented as computer-readable code on a medium in which a program is recorded.
  • the computer-readable medium includes all kinds of recording devices in which data readable by a computer system is stored. Examples of computer-readable media include Hard Disk Drive (HDD), Solid State Disk (SSD), Silicon Disk Drive (SDD), ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc.
  • HDD Hard Disk Drive
  • SSD Solid State Disk
  • SDD Silicon Disk Drive
  • ROM Read Only Memory
  • RAM Compact Disk Drive
  • CD-ROM Compact Disk Read Only Memory
  • magnetic tape floppy disk
  • optical data storage device etc.
  • carrier wave eg, transmission over the Internet

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Electromagnetism (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법이 개시된다. 본 명세서의 일 실시예에 따른 방법은, 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 동작, 상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻는 동작, 상기 훈련 데이터를 이용하여 상기 제1 기계 학습 네트워크를 업데이트하는 동작을 포함하며, 실제 통신 환경에 적응적인 무선 통신 서비스를 제공한다. 본 명세서의 적어도 하나의 프로세서를 포함하는 시스템은 인공 지능(Artificial Intelligence) 모듈, 드론(Unmanned Aerial Vehicle, UAV), 로봇, 증강 현실(Augmented Reality, AR) 장치, 가상 현실(virtual reality, VR) 장치, 5G 서비스와 관련된 장치 등과 연계될 수 있다.

Description

온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법
본 명세서는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법에 관한 것이다.
현재 대부분의 통신 시스템은 물리적 채널을 통계적 모델로 근사화하고 이에 기반하여 수학적 송수신 모델을 도출함으로써 설계되고 최적화되고 있다.
이와 같은 접근 방식은 지금까지 비교적 성공적인 결과를 보여주고 있으나, 실제 물리적 채널과 통계적 모델 사이의 불일치, 복잡도 감소를 위해 도입된 여러 가지 가정 및 단순화로 인해 구현된 통신 시스템이 다양한 실제 채널 환경에서 최적의 성능을 보여준다고 보기는 어렵다. 실제 물리적 채널의 특성을 좀 더 잘 반영하고, 실제 채널 환경에서 최적의 성능을 보여줄 수 있도록 채널 모델과 통신 시스템의 통계적, 수학적 모델을 개선할 수는 있으나, 높은 복잡도와 trade-off 관계에 있어 실제 시스템에 적용하기가 쉽지 않다.
점점 더 복잡해지는 통신 시스템은 실제 환경에서 최적의 성능을 제공할 수 있는 통신 시스템의 수학적 모델을 더욱 어렵게 하고 있다.
각 사용자가 처한 채널 환경에서 다양한 서비스가 요구하는 QoS(Quality of Service)에 최적화할 수 있는 유연한 통신 시스템을 실현하기 위해서는 새로운 접근 방식이 필요하다.
본 명세서는 전술한 필요성 및/또는 문제점을 해결하는 것을 목적으로 한다.
또한, 본 명세서는, ML(machine learning) 기반 무선 통신 시스템에서 개발 환경에서의 파라미터를 실사용 환경에서의 최적화시킬 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.
또한, 본 명세서는, 기계 학습 네트워크의 파라미터를 최적화하기 위한 학습 데이터를 수집하기 위하여 학습의 대상이 되는 통신 환경을 선별할 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.
또한, 본 명세서는, 기계 학습 네트워크의 성능의 변동성을 고려하여 기계 학습 네트워크의 성능 변화를 모니터링 할 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.
또한, 본 명세서는, 클라이언트 디바이스 외부의 오프-디바이스 러닝 외에도 온-디바이스 러닝을 활용하여 클라이언트 디바이스 별로 개인화된 통신 서비스를 제공할 수 있는 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법을 구현하는 것을 목적으로 한다.
본 명세서의 일 실시예에 따른 방법은 다중 송신 안테나와 다중 수신 안테나를 이용하여 MIMO(multi-input-multi-output) 통신 채널을 통해 통신하기 위한 적어도 하나의 기계 학습 네트워크를 훈련하기 위하여 단말의 적어도 하나의 프로세서에 의해 수행되는 방법으로서, 상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 단계, 상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻는 단계, 및 상기 훈련 데이터를 이용하여 상기 제1 기계 학습 네트워크를 업데이트하는 단계를 포함한다.
또한, 상기 학습 리스트를 생성하는 단계는 하나 이상의 기지국 별로 얻은 연결 정보와 기지국 정보 중 적어도 하나로 구성된 하나 이상의 제2 항목을 포함하는 연결 리스트를 생성하는 단계, 상기 연결 리스트의 연결 정보에 기반하여 후보 리스트에 업데이트하는 단계, 상기 후보 리스트에 포함된 하나 이상의 제3 항목 중 어느 하나에 설정된 가중치를 적용하여 하나 이상의 항목을 선정하여 선정 리스트에 업데이트하는 단계, 상기 선정 리스트에 포함된 적어도 하나의 제4 항목에 연관된 상기 단말의 위치 샘플에 기반하여 상기 학습 리스트에 추가될 상기 하나 이상의 제1 항목을 생성하는 단계를 포함할 수 있다.
또한, 상기 학습 리스트는, 상기 제1 항목 별로 구분되는 장소 정보와 기지국 정보를 가질 수 있다.
또한, 상기 장소 정보는, 학습이 완료된 상기 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함할 수 있다.
또한, 상기 이벤트는, 상기 단말이 상기 수집 영역에 진입하거나 위치하는 것이 감지되는 것일 수 있다.
또한, 상기 단말이 상기 적용 영역에 위치하는 것이 감지되면, 상기 위치 샘플의 수집을 중단할 수 있다.
또한, 상기 학습 리스트를 생성하는 단계는 상기 단말이 상기 수집 영역에 진입하면 상기 단말의 위치 샘플을 얻는 단계, 상기 얻은 위치 샘플들의 수가 설정된 수 이상이면, 상기 위치 샘플들을 대상으로 클러스터링 알고리즘을 적용하여 하나 이상의 통신 환경을 결정하는 단계 및 상기 결정된 하나 이상의 통신 환경을 상기 학습 리스트의 각 항목으로 설정하는 단계를 포함할 수 있다.
또한, 상기 적용 영역에 진입하면, 상기 적용 영역에서 적용될 기계 학습 네트워크를 확인하는 단계, 상기 확인된 기계 학습 네트워크에 기초하여, 수신기를 제어하는 단계를 더 포함할 수 있다.
또한, 상기 단말이 2 이상의 적용 영역에 위치하는 경우, 상기 2 이상의 적용 영역에 대응되는 제1 항목들 중 어느 하나를 선택하는 단계, 상기 선택된 제1 항목에서 적용될 기계 학습 네트워크를 확인하는 단계 및 상기 확인된 기계 학습 네트워크에 기초하여 수신기를 제어하는 단계를 더 포함할 수 있다.
또한, 상기 제1 항목들 중 어느 하나를 선택하는 단계는, 상기 2 이상의 적용 영역의 반경을 비교하는 단계, 상기 비교에 기초하여, 상기 2 이상의 제1 항목들 중 어느 하나를 선택하는 단계를 포함할 수 있다.
또한, 상기 기계 학습 네트워크는 심층 신경망(Deep Neural Network, DNN), 컨볼루션 신경망(Convolutional Neural Network, CNN), 또는 파라메트릭 곱셈들, 덧셈들, 및 비 선형성들을 포함하는 순환 신경망(Recurrent Neural Network, RNN) 중 적어도 하나를 포함할 수 있다.
또한, 상기 훈련 데이터는, 수신 관련 파라미터를 나타낼 수 있다.
또한, 상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함할 수 있다.
또한, 상기 기계 학습 네트워크를 업데이트하는 동안 업데이트 전인 제1 네트워크에 의해 측정된 제1 성능 지표와 업데이트 후인 제2 네트워크에 의해 측정된 제2 성능 지표를 비교하는 단계 및 상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계를 더 포함할 수 있다.
또한, 상기 기계 학습 네트워크가 업데이트되면, 업데이트 전인 제1 네트워크를 적용하여 측정되는 제1 성능 지표와 업데이트 후인 제2 네트워크를 적용하여 측정되는 제2 성능 지표를 비교하는 단계 및 상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계를 더 포함할 수 있다.
상기 비교의 신뢰도(reliablity)가 설정된 기준값 미만이면, 상기 제1, 제2 성능 지표를 다시 측정하여 비교하는 단계를 더 포함할 수 있다.
상기 학습 리스트는, 상기 제1 항목 별 상태 정보를 포함하고, 상기 상태 정보는, 획득 상태, 훈련 상태, 검증 상태, 적용 상태, 또는 잠금 상태 중 적어도 하나를 포함하되, 상기 기계 학습 네트워크는 상기 상태 정보에 기초하여 상기 훈련 데이터의 수집, 상기 기계 학습 네트워크의 학습, 검증, 적용, 또는 잠금 중 적어도 하나가 결정될 수 있다.
상기 기계 학습 네트워크의 업데이트의 일반화가 실패하면, 상기 기계 학습 네트워크에 대응되는 실패 횟수를 증가하는 단계, 상기 실패 횟수가 설정된 최대 횟수를 초과하면, (i) 상기 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화하고, (ii) 상기 제1 항목의 상태를 잠금 상태로 전환할 수 있다.
본 명세서의 다른 실시예에 따른 단말은 트랜시버, 적어도 하나의 프로세서, 상기 적어도 하나의 프로세서에 연결되고 명령들(instructions)을 저장하는 적어도 하나의 메모리를 포함하고, 상기 명령들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 다중의 수신 안테나를 이용하여 MIMO 통신 채널을 통해 통신하기 위한 동작들을 지원하고, 상기 동작들은, 상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하고, 상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용되는 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻고, 상기 훈련 데이터를 이용하여 상기 기계 학습 네트워크를 업데이트하는 동작을 포함하는 단말.
본 명세서의 일 실시예에 따른 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법의 효과에 대해 설명하면 다음과 같다.
본 명세서는 ML(machine learning) 기반 무선 통신 시스템에서 개발 환경에서의 파라미터를 실사용 환경에서의 최적화할 수 있다.
또한, 본 명세서는 기계 학습 네트워크의 성능의 변동성을 고려하여 기계 학습 네트워크의 성능 변화를 모니터링할 수 있다.
또한, 본 명세서는 클라이언트 디바이스 외부의 오프-디바이스 러닝 외에도 온-디바이스 러닝을 활용하여 클라이언트 디바이스 별로 개인화된 통신 서비스를 제공할 수 있다.
본 명세서에서 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 명세서가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 명세서에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부 도면은 본 명세서에 대한 실시예를 제공하고, 상세한 설명과 함께 본 명세서의 기술적 특징을 설명한다.
도 1은 본 명세서에서 제안하는 방법들이 적용될 수 있는 무선 통신 시스템의 블록 구성도를 예시한다.
도 2는 무선 통신 시스템에서 신호 송/수신 방법의 일례를 나타낸 도이다.
도 3은 5G 통신 시스템에서 사용자 단말과 5G 네트워크의 기본동작의 일 예를 나타낸다.
도 4는 본 명세서의 일 실시예에 따른 AI 장치의 블록도이다.
도 5는 SSB와 CSI-RS를 이용한 빔포밍의 일례를 나타낸다.
도 6은 SSB를 이용한 DL BM 절차의 일례를 나타낸 흐름도이다.
도 7은 CSI-RS를 이용한 DL BM 절차의 일례를 나타낸다.
도 8은 단말의 수신 빔 결정 과정의 일례를 나타낸 흐름도이다.
도 9는 기지국의 전송 빔 결정 과정의 일례를 나타낸 흐름도이다.
도 10은 도 7의 동작과 관련된 시간 및 주파수 영역에서의 자원 할당의 일례를 나타낸다.
도 11은 SRS를 이용한 UL BM 절차의 일례를 나타낸다.
도 12는 SRS를 이용한 UL BM 절차의 일례를 나타낸 흐름도이다.
도 13은 CSI 관련 절차의 일례를 나타낸 흐름도이다.
도 14는 본 명세서의 일 실시예에 따른 통신 시스템을 예시적으로 설명한다.
도 15는 본 명세서의 일 실시예에 따른 방법의 순서도이다.
도 16은 본 명세서의 일 실시예에 따른 통신 환경을 예시적으로 설명한다.
도 17 내지 도 24는 본 명세서의 일 실시예에 따른 학습 리스트 생성방법을 예시적으로 설명한다.
도 25 및 도 26은 본 명세서의 일 실시예에 따른 훈련 데이터 수집방법을 예시적으로 설명한다.
도 27은 본 명세서의 일 실시예에 따른 기계 학습 네트워크 업데이트 방법을 예시적으로 설명한다.
도 28 및 도 29는 본 명세서의 일 실시예에 따른 기계 학습 네트워크의 검증방법을 예시적으로 설명한다.
도 30 내지 도32는 본 명세서의 일 실시예에 따른 기계 학습 네트워크의 적용방법을 예시적으로 설명한다.
도 33 및 도 34은 본 명세서의 일 실시예에 따른 잠금 상태인 항목의 관리방법을 예시적으로 설명한다.
도 35은 본 발명에 적용되는 통신 시스템을 예시한다.
도 36은 본 발명에 적용될 수 있는 무선 기기를 예시한다.
본 명세서에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부 도면은 본 명세서에 대한 실시예를 제공하고, 상세한 설명과 함께 본 명세서의 기술적 특징을 설명한다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 명세서의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, AI 프로세싱된 정보를 필요로 하는 장치 및/또는 AI 프로세서가 필요로 하는 5G 통신(5th generation mobile communication)을 단락 A 내지 단락 G를 통해 설명하기로 한다.
A. UE 및 5G 네트워크 블록도 예시
도 1은 본 명세서에서 제안하는 방법들이 적용될 수 있는 무선 통신 시스템의 블록 구성도를 예시한다.
도 1을 참조하면, AI 모듈을 포함하는 장치(AI 장치)를 제1 통신 장치로 정의(도 1의 910)하고, 프로세서(911)가 AI 상세 동작을 수행할 수 있다.
AI 장치와 통신하는 다른 장치(AI 서버)를 포함하는 5G 네트워크를 제2 통신 장치(도 1의 920)하고, 프로세서(921)가 AI 상세 동작을 수행할 수 있다.
5G 네트워크가 제 1 통신 장치로, AI 장치가 제 2 통신 장치로 표현될 수도 있다.
예를 들어, 상기 제 1 통신 장치 또는 상기 제 2 통신 장치는 기지국, 네트워크 노드, 전송 단말, 수신 단말, 무선 장치, 무선 통신 장치, 차량, 자율주행 기능을 탑재한 차량, 커넥티드카(Connected Car), 드론(Unmanned Aerial Vehicle, UAV), AI(Artificial Intelligence) 모듈, 로봇, AR(Augmented Reality) 장치, VR(Virtual Reality) 장치, MR(Mixed Reality) 장치, 홀로그램 장치, 공공 안전 장치, MTC 장치, IoT 장치, 의료 장치, 핀테크 장치(또는 금융 장치), 보안 장치, 기후/환경 장치, 5G 서비스와 관련된 장치 또는 그 이외 4차 산업 혁명 분야와 관련된 장치일 수 있다.
예를 들어, 단말 또는 UE(User Equipment)는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털 방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등을 포함할 수 있다. 예를 들어, HMD는 머리에 착용하는 형태의 디스플레이 장치일 수 있다. 예를 들어, HMD는 VR, AR 또는 MR을 구현하기 위해 사용될 수 있다. 예를 들어, 드론은 사람이 타지 않고 무선 컨트롤 신호에 의해 비행하는 비행체일 수 있다. 예를 들어, VR 장치는 가상 세계의 객체 또는 배경 등을 구현하는 장치를 포함할 수 있다. 예를 들어, AR 장치는 현실 세계의 객체 또는 배경 등에 가상 세계의 객체 또는 배경을 연결하여 구현하는 장치를 포함할 수 있다. 예를 들어, MR 장치는 현실 세계의 객체 또는 배경 등에 가상 세계의 객체 또는 배경을 융합하여 구현하는 장치를 포함할 수 있다. 예를 들어, 홀로그램 장치는 홀로그래피라는 두 개의 레이저 광이 만나서 발생하는 빛의 간섭현상을 활용하여, 입체 정보를 기록 및 재생하여 360도 입체 영상을 구현하는 장치를 포함할 수 있다. 예를 들어, 공공 안전 장치는 영상 중계 장치 또는 사용자의 인체에 착용 가능한 영상 장치 등을 포함할 수 있다. 예를 들어, MTC 장치 및 IoT 장치는 사람의 직접적인 개입이나 또는 조작이 필요하지 않는 장치일 수 있다. 예를 들어, MTC 장치 및 IoT 장치는 스마트 미터, 벤딩 머신, 온도계, 스마트 전구, 도어락 또는 각종 센서 등을 포함할 수 있다. 예를 들어, 의료 장치는 질병을 진단, 치료, 경감, 처치 또는 예방할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 상해 또는 장애를 진단, 치료, 경감 또는 보정할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 구조 또는 기능을 검사, 대체 또는 변형할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 임신을 조절할 목적으로 사용되는 장치일 수 있다. 예를 들어, 의료 장치는 진료용 장치, 수술용 장치, (체외) 진단용 장치, 보청기 또는 시술용 장치 등을 포함할 수 있다. 예를 들어, 보안 장치는 발생할 우려가 있는 위험을 방지하고, 안전을 유지하기 위하여 설치한 장치일 수 있다. 예를 들어, 보안 장치는 카메라, CCTV, 녹화기(recorder) 또는 블랙박스 등일 수 있다. 예를 들어, 핀테크 장치는 모바일 결제 등 금융 서비스를 제공할 수 있는 장치일 수 있다.
도 1을 참고하면, 제 1 통신 장치(910)와 제 2 통신 장치(920)은 프로세서(processor, 911,921), 메모리(memory, 914,924), 하나 이상의 Tx/Rx RF 모듈(radio frequency module, 915,925), Tx 프로세서(912,922), Rx 프로세서(913,923), 안테나(916,926)를 포함한다. Tx/Rx 모듈은 트랜시버라고도 한다. 각각의 Tx/Rx 모듈(915)는 각각의 안테나(926)을 통해 신호를 전송한다. 프로세서는 앞서 살핀 기능, 과정 및/또는 방법을 구현한다. 프로세서 (921)는 프로그램 코드 및 데이터를 저장하는 메모리 (924)와 관련될 수 있다. 메모리는 컴퓨터 판독 가능 매체로서 지칭될 수 있다. 보다 구체적으로, DL(제 1 통신 장치에서 제 2 통신 장치로의 통신)에서, 전송(TX) 프로세서(912)는 L1 계층(즉, 물리 계층)에 대한 다양한 신호 처리 기능을 구현한다. 수신(RX) 프로세서는 L1(즉, 물리 계층)의 다양한 신호 프로세싱 기능을 구현한다.
UL(제 2 통신 장치에서 제 1 통신 장치로의 통신)은 제 2 통신 장치(920)에서 수신기 기능과 관련하여 기술된 것과 유사한 방식으로 제 1 통신 장치(910)에서 처리된다. 각각의 Tx/Rx 모듈(925)는 각각의 안테나(926)을 통해 신호를 수신한다. 각각의 Tx/Rx 모듈은 RF 반송파 및 정보를 RX 프로세서(923)에 제공한다. 프로세서 (921)는 프로그램 코드 및 데이터를 저장하는 메모리 (924)와 관련될 수 있다. 메모리는 컴퓨터 판독 가능 매체로서 지칭될 수 있다.
B. 무선 통신 시스템에서 신호 송/수신 방법
도 2는 무선 통신 시스템에서 신호 송/수신 방법의 일례를 나타낸 도이다.
도 2를 참고하면, UE는 전원이 켜지거나 새로이 셀에 진입한 경우 BS와 동기를 맞추는 등의 초기 셀 탐색(initial cell search) 작업을 수행한다(S201). 이를 위해, UE는 BS로부터 1차 동기 채널(primary synchronization channel, P-SCH) 및 2차 동기 채널(secondary synchronization channel, S-SCH)을 수신하여 BS와 동기를 맞추고, 셀 ID 등의 정보를 획득할 수 있다. LTE 시스템과 NR 시스템에서 P-SCH와 S-SCH는 각각 1차 동기 신호(primary synchronization signal, PSS)와 2차 동기 신호(secondary synchronization signal, SSS)로 불린다. 초기 셀 탐색 후, UE는 BS로부터 물리 브로드캐스트 채널(physical broadcast channel, PBCH)를 수신하여 셀 내 브로드캐스트 정보를 획득할 수 있다. 한편, UE는 초기 셀 탐색 단계에서 하향링크 참조 신호(downlink reference Signal, DL RS)를 수신하여 하향링크 채널 상태를 확인할 수 있다. 초기 셀 탐색을 마친 UE는 물리 하향링크 제어 채널(physical downlink control channel, PDCCH) 및 상기 PDCCH에 실린 정보에 따라 물리 하향링크 공유 채널(physical downlink shared Channel, PDSCH)을 수신함으로써 좀더 구체적인 시스템 정보를 획득할 수 있다(S202).
한편, BS에 최초로 접속하거나 신호 전송을 위한 무선 자원이 없는 경우 UE는 BS에 대해 임의 접속 과정(random access procedure, RACH)을 수행할 수 있다(단계 S203 내지 단계 S206). 이를 위해, UE는 물리 임의 접속 채널(physical random access Channel, PRACH)을 통해 특정 시퀀스를 프리앰블로서 전송하고(S203 및 S205), PDCCH 및 대응하는 PDSCH를 통해 프리앰블에 대한 임의 접속 응답(random access response, RAR) 메시지를 수신할 수 있다(S204 및 S206). 경쟁 기반 RACH의 경우, 추가적으로 충돌 해결 과정(contention resolution procedure)를 수행할 수 있다.
상술한 바와 같은 과정을 수행한 UE는 이후 일반적인 상향링크/하향링크 신호 전송 과정으로서 PDCCH/PDSCH 수신(S207) 및 물리 상향링크 공유 채널(physical uplink shared Channel, PUSCH)/물리 상향링크 제어 채널(physical uplink control channel, PUCCH) 전송(S208)을 수행할 수 있다. 특히 UE는 PDCCH를 통하여 하향링크 제어 정보(downlink control information, DCI)를 수신한다. UE는 해당 탐색 공간 설정(configuration)들에 따라 서빙 셀 상의 하나 이상의 제어 요소 세트(control element set, CORESET)들에 설정된 모니터링 기회(occasion)들에서 PDCCH 후보(candidate)들의 세트를 모니터링한다. UE가 모니터할 PDCCH 후보들의 세트는 탐색 공간 세트들의 면에서 정의되며, 탐색 공간 세트는 공통 탐색 공간 세트 또는 UE-특정 탐색 공간 세트일 수 있다. CORESET은 1~3개 OFDM 심볼들의 시간 지속기간을 갖는 (물리) 자원 블록들의 세트로 구성된다. 네트워크는 UE가 복수의 CORESET들을 갖도록 설정할 수 있다. UE는 하나 이상의 탐색 공간 세트들 내 PDCCH 후보들을 모니터링한다. 여기서 모니터링이라 함은 탐색 공간 내 PDCCH 후보(들)에 대한 디코딩 시도하는 것을 의미한다. UE가 탐색 공간 내 PDCCH 후보들 중 하나에 대한 디코딩에 성공하면, 상기 UE는 해당 PDCCH 후보에서 PDCCH를 검출했다고 판단하고, 상기 검출된 PDCCH 내 DCI를 기반으로 PDSCH 수신 혹은 PUSCH 전송을 수행한다. PDCCH는 PDSCH 상의 DL 전송들 및 PUSCH 상의 UL 전송들을 스케줄링하는 데 사용될 수 있다. 여기서 PDCCH 상의 DCI는 하향링크 공유 채널과 관련된, 변조(modulation) 및 코딩 포맷과 자원 할당(resource allocation) 정보를 적어도 포함하는 하향링크 배정(assignment)(즉, downlink grant; DL grant), 또는 상향링크 공유 채널과 관련된, 변조 및 코딩 포맷과 자원 할당 정보를 포함하는 상향링크 그랜트(uplink grant; UL grant)를 포함한다.
도 2를 참고하여, 5G 통신 시스템에서의 초기 접속(Initial Access, IA) 절차에 대해 추가적으로 살펴본다.
UE는 SSB에 기반하여 셀 탐색(search), 시스템 정보 획득, 초기 접속을 위한 빔 정렬, DL 측정 등을 수행할 수 있다. SSB는 SS/PBCH(Synchronization Signal/Physical Broadcast channel) 블록과 혼용된다.
SSB는 PSS, SSS와 PBCH로 구성된다. SSB는 4개의 연속된 OFDM 심볼들에 구성되며, OFDM 심볼별로 PSS, PBCH, SSS/PBCH 또는 PBCH가 전송된다. PSS와 SSS는 각각 1개의 OFDM 심볼과 127개의 부반송파들로 구성되고, PBCH는 3개의 OFDM 심볼과 576개의 부반송파들로 구성된다.
셀 탐색은 UE가 셀의 시간/주파수 동기를 획득하고, 상기 셀의 셀 ID(Identifier)(예, Physical layer Cell ID, PCI)를 검출하는 과정을 의미한다. PSS는 셀 ID 그룹 내에서 셀 ID를 검출하는데 사용되고, SSS는 셀 ID 그룹을 검출하는데 사용된다. PBCH는 SSB (시간) 인덱스 검출 및 하프-프레임 검출에 사용된다.
336개의 셀 ID 그룹이 존재하고, 셀 ID 그룹 별로 3개의 셀 ID가 존재한다. 총 1008개의 셀 ID가 존재한다. 셀의 셀 ID가 속한 셀 ID 그룹에 관한 정보는 상기 셀의 SSS를 통해 제공/획득되며, 상기 셀 ID 내 336개 셀들 중 상기 셀 ID에 관한 정보는 PSS를 통해 제공/획득된다
SSB는 SSB 주기(periodicity)에 맞춰 주기적으로 전송된다. 초기 셀 탐색 시에 UE가 가정하는 SSB 기본 주기는 20ms로 정의된다. 셀 접속 후, SSB 주기는 네트워크(예, BS)에 의해 {5ms, 10ms, 20ms, 40ms, 80ms, 160ms} 중 하나로 설정될 수 있다.
다음으로, 시스템 정보 (system information; SI) 획득에 대해 살펴본다.
SI는 마스터 정보 블록(master information block, MIB)와 복수의 시스템 정보 블록(system information block, SIB)들로 나눠진다. MIB 외의 SI는 RMSI(Remaining Minimum System Information)으로 지칭될 수 있다. MIB는 SIB1(SystemInformationBlock1)을 나르는 PDSCH를 스케줄링하는 PDCCH의 모니터링을 위한 정보/파라미터를 포함하며 SSB의 PBCH를 통해 BS에 의해 전송된다. SIB1은 나머지 SIB들(이하, SIBx, x는 2 이상의 정수)의 가용성(availability) 및 스케줄링(예, 전송 주기, SI-윈도우 크기)과 관련된 정보를 포함한다. SIBx는 SI 메시지에 포함되며 PDSCH를 통해 전송된다. 각각의 SI 메시지는 주기적으로 발생하는 시간 윈도우(즉, SI-윈도우) 내에서 전송된다.
도 2를 참고하여, 5G 통신 시스템에서의 임의 접속(Random Access, RA) 과정에 대해 추가적으로 살펴본다.
임의 접속 과정은 다양한 용도로 사용된다. 예를 들어, 임의 접속 과정은 네트워크 초기 접속, 핸드오버, UE-트리거드(triggered) UL 데이터 전송에 사용될 수 있다. UE는 임의 접속 과정을 통해 UL 동기와 UL 전송 자원을 획득할 수 있다. 임의 접속 과정은 경쟁 기반(contention-based) 임의 접속 과정과 경쟁 프리(contention free) 임의 접속 과정으로 구분된다. 경쟁 기반의 임의 접속 과정에 대한 구체적인 절차는 아래와 같다.
UE가 UL에서 임의 접속 과정의 Msg1로서 임의 접속 프리앰블을 PRACH를 통해 전송할 수 있다. 서로 다른 두 길이를 가지는 임의 접속 프리앰블 시퀀스들이 지원된다. 긴 시퀀스 길이 839는 1.25 및 5 kHz의 부반송파 간격(subcarrier spacing)에 대해 적용되며, 짧은 시퀀스 길이 139는 15, 30, 60 및 120 kHz의 부반송파 간격에 대해 적용된다.
BS가 UE로부터 임의 접속 프리앰블을 수신하면, BS는 임의 접속 응답(random access response, RAR) 메시지(Msg2)를 상기 UE에게 전송한다. RAR을 나르는 PDSCH를 스케줄링하는 PDCCH는 임의 접속(random access, RA) 무선 네트워크 임시 식별자(radio network temporary identifier, RNTI)(RA-RNTI)로 CRC 마스킹되어 전송된다. RA-RNTI로 마스킹된 PDCCH를 검출한 UE는 상기 PDCCH가 나르는 DCI가 스케줄링하는 PDSCH로부터 RAR을 수신할 수 있다. UE는 자신이 전송한 프리앰블, 즉, Msg1에 대한 임의 접속 응답 정보가 상기 RAR 내에 있는지 확인한다. 자신이 전송한 Msg1에 대한 임의 접속 정보가 존재하는지 여부는 상기 UE가 전송한 프리앰블에 대한 임의 접속 프리앰블 ID가 존재하는지 여부에 의해 판단될 수 있다. Msg1에 대한 응답이 없으면, UE는 전력 램핑(power ramping)을 수행하면서 RACH 프리앰블을 소정의 횟수 이내에서 재전송할 수 있다. UE는 가장 최근의 경로 손실 및 전력 램핑 카운터를 기반으로 프리앰블의 재전송에 대한 PRACH 전송 전력을 계산한다.
상기 UE는 임의 접속 응답 정보를 기반으로 상향링크 공유 채널 상에서 UL 전송을 임의 접속 과정의 Msg3로서 전송할 수 있다. Msg3은 RRC 연결 요청 및 UE 식별자를 포함할 수 있다. Msg3에 대한 응답으로서, 네트워크는 Msg4를 전송할 수 있으며, 이는 DL 상에서의 경쟁 해결 메시지로 취급될 수 있다. Msg4를 수신함으로써, UE는 RRC 연결된 상태에 진입할 수 있다.
C. 5G 통신 시스템의 빔 관리(Beam Management, BM) 절차
BM 과정은 (1) SSB 또는 CSI-RS를 이용하는 DL BM 과정과, (2) SRS(sounding reference signal)을 이용하는 UL BM 과정으로 구분될 수 있다. 또한, 각 BM 과정은 Tx 빔을 결정하기 위한 Tx 빔 스위핑과 Rx 빔을 결정하기 위한 Rx 빔 스위핑을 포함할 수 있다.
SSB를 이용한 DL BM 과정에 대해 살펴본다.
SSB를 이용한 빔 보고(beam report)에 대한 설정은 RRC_CONNECTED에서 채널 상태 정보(channel state information, CSI)/빔 설정 시에 수행된다.
- UE는 BM을 위해 사용되는 SSB 자원들에 대한 CSI-SSB-ResourceSetList를 포함하는 CSI-ResourceConfig IE를 BS로부터 수신한다. RRC 파라미터 csi-SSB-ResourceSetList는 하나의 자원 세트에서 빔 관리 및 보고을 위해 사용되는 SSB 자원들의 리스트를 나타낸다. 여기서, SSB 자원 세트는 {SSBx1, SSBx2, SSBx3, SSBx4, 쪋}으로 설정될 수 있다. SSB 인덱스는 0부터 63까지 정의될 수 있다.
- UE는 상기 CSI-SSB-ResourceSetList에 기초하여 SSB 자원들 상의 신호들을 상기 BS로부터 수신한다.
- SSBRI 및 참조 신호 수신 전력(reference signal received power, RSRP)에 대한 보고와 관련된 CSI-RS reportConfig가 설정된 경우, 상기 UE는 최선(best) SSBRI 및 이에 대응하는 RSRP를 BS에게 보고한다. 예를 들어, 상기 CSI-RS reportConfig IE의 reportQuantity가 'ssb-Index-RSRP'로 설정된 경우, UE는 BS으로 최선 SSBRI 및 이에 대응하는 RSRP를 보고한다.
UE는 SSB와 동일한 OFDM 심볼(들)에 CSI-RS 자원이 설정되고, 'QCL-TypeD'가 적용 가능한 경우, 상기 UE는 CSI-RS와 SSB가 'QCL-TypeD' 관점에서 유사 동일 위치된(quasi co-located, QCL) 것으로 가정할 수 있다. 여기서, QCL-TypeD는 공간(spatial) Rx 파라미터 관점에서 안테나 포트들 간에 QCL되어 있음을 의미할 수 있다. UE가 QCL-TypeD 관계에 있는 복수의 DL 안테나 포트들의 신호들을 수신 시에는 동일한 수신 빔을 적용해도 무방하다.
다음으로, CSI-RS를 이용한 DL BM 과정에 대해 살펴본다.
CSI-RS를 이용한 UE의 Rx 빔 결정(또는 정제(refinement)) 과정과 BS의 Tx 빔 스위핑 과정에 대해 차례대로 살펴본다. UE의 Rx 빔 결정 과정은 반복 파라미터가 'ON'으로 설정되며, BS의 Tx 빔 스위핑 과정은 반복 파라미터가 'OFF'로 설정된다.
먼저, UE의 Rx 빔 결정 과정에 대해 살펴본다.
- UE는 'repetition'에 관한 RRC 파라미터를 포함하는 NZP CSI-RS resource set IE를 RRC 시그널링을 통해 BS로부터 수신한다. 여기서, 상기 RRC 파라미터 'repetition'이 'ON'으로 세팅되어 있다.
- UE는 상기 RRC 파라미터 'repetition'이 'ON'으로 설정된 CSI-RS 자원 세트 내의 자원(들) 상에서의 신호들을 BS의 동일 Tx 빔(또는 DL 공간 도메인 전송 필터)을 통해 서로 다른 OFDM 심볼에서 반복 수신한다.
- UE는 자신의 Rx 빔을 결정한다.
- UE는 CSI 보고를 생략한다. 즉, UE는 상가 RRC 파라미터 'repetition'이 'ON'으로 설정된 경우, CSI 보고를 생략할 수 있다.
다음으로, BS의 Tx 빔 결정 과정에 대해 살펴본다.
- UE는 'repetition'에 관한 RRC 파라미터를 포함하는 NZP CSI-RS resource set IE를 RRC 시그널링을 통해 BS로부터 수신한다. 여기서, 상기 RRC 파라미터 'repetition'이 'OFF'로 세팅되어 있으며, BS의 Tx 빔 스위핑 과정과 관련된다.
- UE는 상기 RRC 파라미터 'repetition'이 'OFF'로 설정된 CSI-RS 자원 세트 내의 자원들 상에서의 신호들을 BS의 서로 다른 Tx 빔(DL 공간 도메인 전송 필터)을 통해 수신한다.
- UE는 최상의(best) 빔을 선택(또는 결정)한다.
- UE는 선택된 빔에 대한 ID(예, CRI) 및 관련 품질 정보(예, RSRP)를 BS으로 보고한다. 즉, UE는 CSI-RS가 BM을 위해 전송되는 경우 CRI와 이에 대한 RSRP를 BS으로 보고한다.
다음으로, SRS를 이용한 UL BM 과정에 대해 살펴본다.
- UE는 'beam management'로 설정된 (RRC 파라미터) 용도 파라미터를 포함하는 RRC 시그널링(예, SRS-Config IE)를 BS로부터 수신한다. SRS-Config IE는 SRS 전송 설정을 위해 사용된다. SRS-Config IE는 SRS-Resources의 리스트와 SRS-ResourceSet들의 리스트를 포함한다. 각 SRS 자원 세트는 SRS-resource들의 세트를 의미한다.
- UE는 상기 SRS-Config IE에 포함된 SRS-SpatialRelation Info에 기초하여 전송할 SRS 자원에 대한 Tx 빔포밍을 결정한다. 여기서, SRS-SpatialRelation Info는 SRS 자원별로 설정되고, SRS 자원별로 SSB, CSI-RS 또는 SRS에서 사용되는 빔포밍과 동일한 빔포밍을 적용할지를 나타낸다.
- 만약 SRS 자원에 SRS-SpatialRelationInfo가 설정되면 SSB, CSI-RS 또는 SRS에서 사용되는 빔포밍과 동일한 빔포밍을 적용하여 전송한다. 하지만, SRS 자원에 SRS-SpatialRelationInfo가 설정되지 않으면, 상기 UE는 임의로 Tx 빔포밍을 결정하여 결정된 Tx 빔포밍을 통해 SRS를 전송한다.
다음으로, 빔 실패 복구(beam failure recovery, BFR) 과정에 대해 살펴본다.
빔포밍된 시스템에서, RLF(Radio Link Failure)는 UE의 회전(rotation), 이동(movement) 또는 빔포밍 블로키지(blockage)로 인해 자주 발생할 수 있다. 따라서, 잦은 RLF가 발생하는 것을 방지하기 위해 BFR이 NR에서 지원된다. BFR은 무선 링크 실패 복구 과정과 유사하고, UE가 새로운 후보 빔(들)을 아는 경우에 지원될 수 있다. 빔 실패 검출을 위해, BS는 UE에게 빔 실패 검출 참조 신호들을 설정하고, 상기 UE는 상기 UE의 물리 계층으로부터의 빔 실패 지시(indication)들의 횟수가 BS의 RRC 시그널링에 의해 설정된 기간(period) 내에 RRC 시그널링에 의해 설정된 임계치(threshold)에 이르면(reach), 빔 실패를 선언(declare)한다. 빔 실패가 검출된 후, 상기 UE는 PCell 상의 임의 접속 과정을 개시(initiate)함으로써 빔 실패 복구를 트리거하고; 적절한(suitable) 빔을 선택하여 빔 실패 복구를 수행한다(BS가 어떤(certain) 빔들에 대해 전용 임의 접속 자원들을 제공한 경우, 이들이 상기 UE에 의해 우선화된다). 상기 임의 접속 절차의 완료(completion) 시, 빔 실패 복구가 완료된 것으로 간주된다.
D. URLLC (Ultra-Reliable and Low Latency Communication)
NR에서 정의하는 URLLC 전송은 (1) 상대적으로 낮은 트래픽 크기, (2) 상대적으로 낮은 도착 레이트(low arrival rate), (3) 극도의 낮은 레이턴시 요구사항(requirement)(예, 0.5, 1ms), (4) 상대적으로 짧은 전송 지속기간(duration)(예, 2 OFDM symbols), (5) 긴급한 서비스/메시지 등에 대한 전송을 의미할 수 있다. UL의 경우, 보다 엄격(stringent)한 레이턴시 요구 사항(latency requirement)을 만족시키기 위해 특정 타입의 트래픽(예컨대, URLLC)에 대한 전송이 앞서서 스케줄링된 다른 전송(예컨대, eMBB)과 다중화(multiplexing)되어야 할 필요가 있다. 이와 관련하여 한 가지 방안으로, 앞서 스케줄링 받은 UE에게 특정 자원에 대해서 프리엠션(preemption)될 것이라는 정보를 주고, 해당 자원을 URLLC UE가 UL 전송에 사용하도록 한다.
NR의 경우, eMBB와 URLLC 사이의 동적 자원 공유(sharing)이 지원된다. eMBB와 URLLC 서비스들은 비-중첩(non-overlapping) 시간/주파수 자원들 상에서 스케줄될 수 있으며, URLLC 전송은 진행 중인(ongoing) eMBB 트래픽에 대해 스케줄된 자원들에서 발생할 수 있다. eMBB UE는 해당 UE의 PDSCH 전송이 부분적으로 펑처링(puncturing)되었는지 여부를 알 수 없을 수 있고, 손상된 코딩된 비트(corrupted coded bit)들로 인해 UE는 PDSCH를 디코딩하지 못할 수 있다. 이 점을 고려하여, NR에서는 프리엠션 지시(preemption indication)을 제공한다. 상기 프리엠션 지시(preemption indication)는 중단된 전송 지시(interrupted transmission indication)으로 지칭될 수도 있다.
프리엠션 지시와 관련하여, UE는 BS로부터의 RRC 시그널링을 통해 DownlinkPreemption IE를 수신한다. UE가 DownlinkPreemption IE를 제공받으면, DCI 포맷 2_1을 운반(convey)하는 PDCCH의 모니터링을 위해 상기 UE는 DownlinkPreemption IE 내 파라미터 int-RNTI에 의해 제공된 INT-RNTI를 가지고 설정된다. 상기 UE는 추가적으로 servingCellID에 의해 제공되는 서빙 셀 인덱스들의 세트를 포함하는 INT-ConfigurationPerServing Cell에 의해 서빙 셀들의 세트와 positionInDCI에 의해 DCI 포맷 2_1 내 필드들을 위한 위치들의 해당 세트를 가지고 설정되고, dci-PayloadSize에 의해 DCI 포맷 2_1을 위한 정보 페이로드 크기를 가지고 설졍되며, timeFrequencySect에 의한 시간-주파수 자원들의 지시 입도(granularity)를 가지고 설정된다.
상기 UE는 상기 DownlinkPreemption IE에 기초하여 DCI 포맷 2_1을 상기 BS로부터 수신한다.
UE가 서빙 셀들의 설정된 세트 내 서빙 셀에 대한 DCI 포맷 2_1을 검출하면, 상기 UE는 상기 DCI 포맷 2_1이 속한 모니터링 기간의 바로 앞(last) 모니터링 기간의 PRB들의 세트 및 심볼들의 세트 중 상기 DCI 포맷 2_1에 의해 지시되는 PRB들 및 심볼들 내에는 상기 UE로의 아무런 전송도 없다고 가정할 수 있다. 예를 들어, UE는 프리엠션에 의해 지시된 시간-주파수 자원 내 신호는 자신에게 스케줄링된 DL 전송이 아니라고 보고 나머지 자원 영역에서 수신된 신호들을 기반으로 데이터를 디코딩한다.
E. mMTC (massive MTC)
mMTC(massive Machine Type Communication)은 많은 수의 UE와 동시에 통신하는 초연결 서비스를 지원하기 위한 5G의 시나리오 중 하나이다. 이 환경에서, UE는 굉장히 낮은 전송 속도와 이동성을 가지고 간헐적으로 통신하게 된다. 따라서, mMTC는 UE를 얼마나 낮은 비용으로 오랫동안 구동할 수 있는지를 주요 목표로 하고 있다. mMTC 기술과 관련하여 3GPP에서는 MTC와 NB(NarrowBand)-IoT를 다루고 있다.
mMTC 기술은 PDCCH, PUCCH, PDSCH(physical downlink shared channel), PUSCH 등의 반복 전송, 주파수 호핑(hopping), 리튜닝(retuning), 가드 구간(guard period) 등의 특징을 가진다.
즉, 특정 정보를 포함하는 PUSCH(또는 PUCCH(특히, long PUCCH) 또는 PRACH) 및 특정 정보에 대한 응답을 포함하는 PDSCH(또는 PDCCH)가 반복 전송된다. 반복 전송은 주파수 호핑(frequency hopping)을 통해 수행되며, 반복 전송을 위해, 제 1 주파수 자원에서 제 2 주파수 자원으로 가드 구간(guard period)에서 (RF) 리튜닝(retuning)이 수행되고, 특정 정보 및 특정 정보에 대한 응답은 협대역(narrowband)(ex. 6 RB (resource block) or 1 RB)를 통해 송/수신될 수 있다.
F. 5G 통신을 이용한 AI 기본 동작
도 3은 5G 통신 시스템에서 사용자 단말과 5G 네트워크의 기본동작의 일 예를 나타낸다.
UE는 특정 정보 전송을 5G 네트워크로 전송한다(S1).그리고, 상기 5G 네트워크는 상기 특정 정보에 대한 5G 프로세싱을 수행한다(S2).여기서, 5G 프로세싱은 AI 프로세싱을 포함할 수 있다. 그리고, 상기 5G 네트워크는 AI 프로세싱 결과를 포함하는 응답을 상기 UE로 전송한다(S3).
G. 5G 통신 시스템에서 사용자 단말과 5G 네트워크 간의 응용 동작
이하, 도 1 및 도 2와 앞서 살핀 무선 통신 기술(BM 절차, URLLC, Mmtc 등)을 참고하여 5G 통신을 이용한 AI 동작에 대해 보다 구체적으로 살펴본다.
먼저, 후술할 본 명세서에서 제안하는 방법과 5G 통신의 eMBB 기술이 적용되는 응용 동작의 기본 절차에 대해 설명한다.
도 3의 S1 단계 및 S3 단계와 같이, UE가 5G 네트워크와 신호, 정보 등을 송/수신하기 위해, UE는 도 3의 S1 단계 이전에 5G 네트워크와 초기 접속(initial access) 절차 및 임의 접속(random access) 절차를 수행한다.
보다 구체적으로, UE는 DL 동기 및 시스템 정보를 획득하기 위해 SSB에 기초하여 5G 네트워크와 초기 접속 절차를 수행한다. 상기 초기 접속 절차 과정에서 빔 관리(beam management, BM) 과정, 빔 실패 복구(beam failure recovery) 과정이 추가될 수 있으며, UE가 5G 네트워크로부터 신호를 수신하는 과정에서 QCL(quasi-co location) 관계가 추가될 수 있다.
또한, UE는 UL 동기 획득 및/또는 UL 전송을 위해 5G 네트워크와 임의 접속 절차를 수행한다. 그리고, 상기 5G 네트워크는 상기 UE로 특정 정보의 전송을 스케쥴링하기 위한 UL grant를 전송할 수 있다. 따라서, 상기 UE는 상기 UL grant에 기초하여 상기 5G 네트워크로 특정 정보를 전송한다. 그리고, 상기 5G 네트워크는 상기 UE로 상기 특정 정보에 대한 5G 프로세싱 결과의 전송을 스케쥴링하기 위한 DL grant를 전송한다. 따라서, 상기 5G 네트워크는 상기 DL grant에 기초하여 상기 UE로 AI 프로세싱 결과를 포함하는 응답을 전송할 수 있다.
다음으로, 후술할 본 명세서에서 제안하는 방법과 5G 통신의 URLLC 기술이 적용되는 응용 동작의 기본 절차에 대해 설명한다.
앞서 설명한 바와 같이, UE가 5G 네트워크와 초기 접속 절차 및/또는 임의 접속 절차를 수행한 후, UE는 5G 네트워크로부터 DownlinkPreemption IE를 수신할 수 있다. 그리고, UE는 DownlinkPreemption IE에 기초하여 프리엠션 지시(pre-emption indication)을 포함하는 DCI 포맷 2_1을 5G 네트워크로부터 수신한다. 그리고, UE는 프리엠션 지시(pre-emption indication)에 의해 지시된 자원(PRB 및/또는 OFDM 심볼)에서 eMBB data의 수신을 수행(또는 기대 또는 가정)하지 않는다. 이후, UE는 특정 정보를 전송할 필요가 있는 경우 5G 네트워크로부터 UL grant를 수신할 수 있다.
다음으로, 후술할 본 명세서에서 제안하는 방법과 5G 통신의 mMTC 기술이 적용되는 응용 동작의 기본 절차에 대해 설명한다.
도 3의 단계들 중 mMTC 기술의 적용으로 달라지는 부분 위주로 설명하기로 한다.
도 3의 S1 단계에서, UE는 특정 정보를 5G 네트워크로 전송하기 위해 5G 네트워크로부터 UL grant를 수신한다. 여기서, 상기 UL grant는 상기 특정 정보의 전송에 대한 반복 횟수에 대한 정보를 포함하고, 상기 특정 정보는 상기 반복 횟수에 대한 정보에 기초하여 반복하여 전송될 수 있다. 즉, 상기 UE는 상기 UL grant에 기초하여 특정 정보를 5G 네트워크로 전송한다. 그리고, 특정 정보의 반복 전송은 주파수 호핑을 통해 수행되고, 첫 번째 특정 정보의 전송은 제 1 주파수 자원에서, 두 번째 특정 정보의 전송은 제 2 주파수 자원에서 전송될 수 있다. 상기 특정 정보는 6RB(Resource Block) 또는 1RB(Resource Block)의 협대역(narrowband)을 통해 전송될 수 있다.
앞서 살핀 5G 통신 기술은 후술할 본 명세서에서 제안하는 방법들과 결합되어 적용될 수 있으며, 또는 본 명세서에서 제안하는 방법들의 기술적 특징을 구체화하거나 명확하게 하는데 보충될 수 있다.
H. 빔 관리 (Beam Management, BM)
이하, H. 에서는 전술한 빔 관리 절차를 보다 구체적으로 설명한다.
BM 절차는 다운링크(downlink, DL) 및 업링크(uplink, UL) 송/수신에 사용될 수 있는 기지국(예: gNB, TRP 등) 및/또는 단말(예: UE) 빔들의 세트(set)를 획득하고 유지하기 위한 L1(layer 1)/L2(layer 2) 절차들로서, 아래와 같은 절차 및 용어를 포함할 수 있다.
- 빔 측정(beam measurement): 기지국 또는 UE가 수신된 빔 형성 신호의 특성을 측정하는 동작.
- 빔 결정(beam determination): 기지국 또는 UE가 자신의 송신 빔(Tx beam) / 수신 빔(Rx beam)을 선택하는 동작.
- 빔 스위핑 (Beam sweeping): 미리 결정된 방식으로 일정 시간 간격 동안 송신 및/또는 수신 빔을 이용하여 공간 영역을 커버하는 동작.
- 빔 보고(beam report): UE가 빔 측정에 기반하여 빔 형성된 신호의 정보를 보고하는 동작.
BM 절차는 (1) SS(synchronization signal)/PBCH(physical broadcast channel) Block 또는 CSI-RS를 이용하는 DL BM 절차와, (2) SRS(sounding reference signal)을 이용하는 UL BM 절차로 구분할 수 있다.
또한, 각 BM 절차는 Tx beam을 결정하기 위한 Tx beam sweeping과 Rx beam을 결정하기 위한 Rx beam sweeping을 포함할 수 있다.
H.1. DL BM
DL BM 절차는 (1) 기지국의 beamformed DL RS(reference signal)들(예: CSI-RS 또는 SS Block(SSB))에 대한 전송과, (2) 단말의 beam reporting을 포함할 수 있다.
여기서, beam reporting은 선호되는(preferred) DL RS ID(identifier)(s) 및 이에 대응하는 L1-RSRP(Reference Signal Received Power)를 포함할 수 있다.
상기 DL RS ID는 SSBRI(SSB Resource Indicator) 또는 CRI(CSI-RS Resource Indicator)일 수 있다.
도 5와 같이, SSB beam과 CSI-RS beam은 beam measurement를 위해 사용될 수 있다. 측정 메트릭(measurement metric)은 자원(resource)/블록(block) 별 L1-RSRP이다. SSB는 coarse한 beam measurement를 위해 사용되며, CSI-RS는 fine한 beam measurement를 위해 사용될 수 있다. SSB는 Tx beam sweeping과 Rx beam sweeping 모두에 사용될 수 있다.
SSB를 이용한 Rx beam sweeping은 다수의 SSB bursts에 걸쳐서(across) 동일 SSBRI에 대해 UE가 Rx beam을 변경하면서 수행될 수 있다. 여기서, 하나의 SS burst는 하나 또는 그 이상의 SSB들을 포함하고, 하나의 SS burst set은 하나 또는 그 이상의 SSB burst들을 포함한다.
H.1.1. SSB를 이용한 DL BM
도 6는 SSB를 이용한 DL BM 절차의 일례를 나타낸 흐름도이다.
SSB를 이용한 빔 보고(beam report)에 대한 설정은 RRC connected state(또는 RRC connected mode)에서 CSI/beam configuration 시에 수행된다.
- 단말은 BM을 위해 사용되는 SSB resource들을 포함하는 CSI-SSB-ResourceSetList를 포함하는 CSI-ResourceConfig IE를 기지국으로부터 수신한다(S410).
표 1은 CSI-ResourceConfig IE의 일례를 나타내며, 표 1과 같이, SSB를 이용한 BM configuration은 별도로 정의되지 않고, SSB를 CSI-RS resource처럼 설정한다.
Figure PCTKR2020006661-appb-T000001
표 1에서, csi-SSB-ResourceSetList parameter는 하나의 resource set에서 beam management 및 reporting을 위해 사용되는 SSB resource들의 리스트를 나타낸다. 여기서, SSB resource set은 {SSBx1, SSBx2, SSBx3, SSBx4, 쪋}으로 설정될 수 있다. SSB index는 0부터 63까지 정의될 수 있다.- 단말은 상기 CSI-SSB-ResourceSetList에 기초하여 SSB resource를 상기 기지국으로부터 수신한다(S420).
- SSBRI 및 L1-RSRP에 대한 보고와 관련된 CSI-RS reportConfig가 설정된 경우, 상기 단말은 best SSBRI 및 이에 대응하는 L1-RSRP를 기지국으로 (빔) report한다(S430).
즉, 상기 CSI-RS reportConfig IE의 reportQuantity가 'ssb-Index-RSRP'로 설정된 경우, 단말은 기지국으로 best SSBRI 및 이에 대응하는 L1-RSRP를 보고한다.
그리고, 단말은 SSB(SS/PBCH Block)와 동일한 OFDM 심볼(들)에서 CSI-RS resource가 설정되고, 'QCL-TypeD'가 적용 가능한 경우, 상기 단말은 CSI-RS와 SSB가 'QCL-TypeD' 관점에서 quasi co-located라고 가정할 수 있다.
여기서, 상기 QCL TypeD는 spatial Rx parameter 관점에서 antenna port들 간에 QCL되어 있음을 의미할 수 있다. 단말이 QCL Type D 관계에 있는 복수의 DL antenna port들을 수신 시에는 동일한 수신 빔을 적용하여도 무방하다. 또한, 단말은 SSB의 RE와 중첩하는 RE에서 CSI-RS가 설정될 것으로 기대하지 않는다.
H.1.2. CSI-RS를 이용한 DL BM
CSI-RS 용도에 대해 살펴보면, i) 특정 CSI-RS resource set에 repetition parameter가 설정되고, TRS_info가 설정되지 않은 경우, CSI-RS는 빔 관리(beam management)를 위해 사용된다. ii) repetition parameter가 설정되지 않고, TRS_info가 설정된 경우, CSI-RS는 TRS(tracking reference signal)을 위해 사용된다. iii) repetition parameter가 설정되지 않고, TRS_info가 설정되지 않은 경우, CSI-RS는 CSI acquisition을 위해 사용된다.
이러한, repetition parameter는 L1 RSRP 또는 'No Report(또는 None)'의 report를 가지는 CSI-ReportConfig와 연계된 CSI-RS resource set들에 대해서만 설정될 수 있다.
만약 단말이 reportQuantity가 'cri-RSRP' 또는 'none'으로 설정된 CSI-ReportConfig를 설정받고, 채널 측정을 위한 CSI-ResourceConfig (higher layer parameter resourcesForChannelMeasurement)가 higher layer parameter 'trs-Info'를 포함하지 않고, higher layer parameter 'repetition'이 설정된 NZP-CSI-RS-ResourceSet를 포함하는 경우, 상기 단말은 NZP-CSI-RS-ResourceSet 내의 모든 CSI-RS resource들에 대해 higher layer parameter 'nrofPorts'를 가지는 동일한 번호의 포트(1-port 또는 2-port)로만 구성될 수 있다.
(higher layer parameter) repetition이 'ON'으로 설정된 경우, 단말의 Rx beam sweeping 절차와 관련된다. 이 경우, 단말이 NZP-CSI-RS-ResourceSet을 설정받으면, 상기 단말은 NZP-CSI-RS-ResourceSet 내 적어도 하나의 CSI-RS resource는 동일한 downlink spatial domain transmission filter로 전송된다고 가정할 수 있다. 즉, NZP-CSI-RS-ResourceSet 내의 적어도 하나의 CSI-RS resource는 동일한 Tx beam을 통해 전송된다. 여기서, NZP-CSI-RS-ResourceSet 내 적어도 하나의 CSI-RS resource는 서로 다른 OFDM 심볼로 전송될 수 있다. 또한, 단말은 NZP-CSI-RS-Resourceset 내의 모든 CSI-RS resource들에서 periodicityAndOffset에 서로 다른 주기(periodicity)를 수신할 것으로 기대하지 않는다.
반면, Repetition이 'OFF'로 설정된 경우는 기지국의 Tx beam sweeping 절차와 관련된다. 이 경우, repetition이 'OFF'로 설정되면, 단말은 NZP-CSI-RS-ResourceSet 내의 적어도 하나의 CSI-RS resource가 동일한 downlink spatial domain transmission filter로 전송된다고 가정하지 않는다. 즉, NZP-CSI-RS-ResourceSet 내의 적어도 하나의 CSI-RS resource는 서로 다른 Tx beam을 통해 전송된다.
도 7은 CSI-RS를 이용한 DL BM 절차의 일례를 나타낸다. 도 7의 (a)는 단말의 Rx beam 결정(또는 refinement) 절차를 나타내며, 도 7의 (b)는 기지국의 Tx beam sweeping 절차를 나타낸다. 또한, 도 7의 (a)는, repetition parameter가 'ON'으로 설정된 경우이고, 도 7의 (b)는, repetition parameter가 'OFF'로 설정된 경우이다.
도 7의 (a) 및 도 8를 참고하여, 단말의 Rx beam 결정 과정에 대해 살펴본다.
도 8는 단말의 수신 빔 결정 과정의 일례를 나타낸 흐름도이다.
- 단말은 higher layer parameter repetition을 포함하는 NZP CSI-RS resource set IE를 RRC signaling을 통해 기지국으로부터 수신한다(S610). 여기서, 상기 repetition parameter는 'ON'으로 설정된다.
- 단말은 repetition 'ON'으로 설정된 CSI-RS resource set 내의 resource(들)을 기지국의 동일 Tx beam(또는 DL spatial domain transmission filter)을 통해 서로 다른 OFDM 심볼에서 반복 수신한다(S620).
- 단말은 자신의 Rx beam을 결정한다(S630).
- 단말은 CSI report를 생략한다(S640). 이 경우, CSI report config의 reportQuantity는 'No report(또는 None)'로 설정될 수 있다.
즉, 상기 단말은 repetition 'ON'으로 설정된 경우, CSI report를 생략할 수 있다.
도 7의 (b) 및 도 9를 참고하여, 기지국의 Tx beam 결정 과정에 대해 살펴본다.
도 9는 기지국의 전송 빔 결정 과정의 일례를 나타낸 흐름도이다.
- 단말은 higher layer parameter repetition을 포함하는 NZP CSI-RS resource set IE를 RRC signaling을 통해 기지국으로부터 수신한다(S710). 여기서, 상기 repetition parameter는 'OFF'로 설정되며, 기지국의 Tx beam sweeping 절차와 관련된다.
- 단말은 repetition 'OFF'로 설정된 CSI-RS resource set 내의 resource들을 기지국의 서로 다른 Tx beam(DL spatial domain transmission filter)을 통해 수신한다(S720).
- 단말은 최상의(best) beam을 선택(또는 결정)한다(S740)
- 단말은 선택된 빔에 대한 ID 및 관련 품질 정보(예: L1-RSRP)를 기지국으로 보고한다(S740). 이 경우, CSI report config의 reportQuantity는 'CRI + L1-RSRP'로 설정될 수 있다.
즉, 상기 단말은 CSI-RS가 BM을 위해 전송되는 경우 CRI와 이에 대한 L1-RSRP를 기지국으로 보고한다.
도 10은 도 7의 동작과 관련된 시간 및 주파수 영역에서의 자원 할당의 일례를 나타낸다.
즉, CSI-RS resource set에 repetition 'ON'이 설정된 경우, 복수의 CSI-RS resource들이 동일한 송신 빔을 적용하여 반복하여 사용되고, CSI-RS resource set에 repetition 'OFF'가 설정된 경우, 서로 다른 CSI-RS resource들이 서로 다른 송신 빔으로 전송되는 것을 볼 수 있다.
H.1.3. DL BM 관련 빔 지시 (Beam Indication)
단말은 적어도 QCL(Quasi Co-location) indication의 목적을 위해 최대 M 개의 후보(candidate) 전송 설정 지시 (Transmission Configuration Indication, TCI) 상태(state)들에 대한 리스트를 RRC 설정받을 수 있다. 여기서, M은 64일 수 있다.
각 TCI state는 하나의 RS set으로 설정될 수 있다. 적어도 RS set 내의 spatial QCL 목적(QCL Type D)을 위한 DL RS의 각각의 ID는 SSB, P-CSI RS, SP-CSI RS, A-CSI RS 등의 DL RS type들 중 하나를 참조할 수 있다.
최소한 spatial QCL 목적을 위해 사용되는 RS set 내의 DL RS(들)의 ID의 초기화(initialization)/업데이트(update)는 적어도 명시적 시그널링(explicit signaling)을 통해 수행될 수 있다.
표 2는 TCI-State IE의 일례를 나타낸다.
TCI-State IE는 하나 또는 두 개의 DL reference signal(RS) 대응하는 quasi co-location (QCL) type과 연관시킨다.
Figure PCTKR2020006661-appb-T000002
표 2에서, bwp-Id parameter는 RS가 위치되는 DL BWP를 나타내며, cell parameter는 RS가 위치되는 carrier를 나타내며, referencesignal parameter는 해당 target antenna port(s)에 대해 quasi co-location 의 source가 되는 reference antenna port(s) 혹은 이를 포함하는reference signal을 나타낸다. 상기 target antenna port(s)는 CSI-RS, PDCCH DMRS, 또는 PDSCH DMRS 일 수 있다. 일례로 NZP CSI-RS에 대한 QCL reference RS정보를 지시하기 위해 NZP CSI-RS 자원 설정 정보에 해당 TCI state ID를 지시할 수 있다. 또 다른 일례로 PDCCH DMRS antenna port(s)에 대한 QCL reference 정보를 지시하기 위해 각 CORESET설정에 TCI state ID를 지시할 수 있다. 또 다른 일례로 PDSCH DMRS antenna port(s)에 대한 QCL reference 정보를 지시하기 위해 DCI를 통해 TCI state ID를 지시할 수 있다.
H.1.4. QCL(Quasi-Co Location)
안테나 포트는 안테나 포트 상의 심볼이 운반되는 채널이 동일한 안테나 포트 상의 다른 심볼이 운반되는 채널로부터 추론될 수 있도록 정의된다. 하나의 안테나 포트 상의 심볼이 운반되는 채널의 특성(property)이 다른 안테나 포트 상의 심볼이 운반되는 채널로부터 유추될 수 있는 경우, 2 개의 안테나 포트는 QC/QCL(quasi co-located 혹은 quasi co-location) 관계에 있다고 할 수 있다.
여기서, 상기 채널 특성은 지연 확산(Delay spread), 도플러 확산(Doppler spread), 주파수/도플러 쉬프트(Frequency/Doppler shift), 평균 수신 파워(Average received power), 수신 타이밍/평균지연(Received Timing / average delay), Spatial RX parameter 중 하나 이상을 포함한다. 여기서 Spatial Rx parameter는 angle of arrival과 같은 공간적인 (수신) 채널 특성 파라미터를 의미한다.
단말은 해당 단말 및 주어진 serving cell에 대해 의도된 DCI를 가지는 검출된 PDCCH에 따라 PDSCH를 디코딩하기 위해, higher layer parameter PDSCH-Config 내 M 개까지의 TCI-State configuration의 리스트로 설정될 수 있다. 상기 M은 UE capability에 의존한다.
각각의 TCI-State는 하나 또는 두 개의 DL reference signal과 PDSCH의 DM-RS port 사이의 quasi co-location 관계를 설정하기 위한 파라미터를 포함한다.
Quasi co-location 관계는 첫 번째 DL RS에 대한 higher layer parameter qcl-Type1과 두 번째 DL RS에 대한 qcl-Type2 (설정된 경우)로 설정된다. 두 개의 DL RS의 경우, reference가 동일한 DL RS 또는 서로 다른 DL RS인지에 관계없이 QCL type은 동일하지 않다.
각 DL RS에 대응하는 quasi co-location type은 QCL-Info의 higher layer parameter qcl-Type에 의해 주어지며, 다음 값 중 하나를 취할 수 있다:
- 'QCL-TypeA': {Doppler shift, Doppler spread, average delay, delay spread}
- 'QCL-TypeB': {Doppler shift, Doppler spread}
- 'QCL-TypeC': {Doppler shift, average delay}
- 'QCL-TypeD': {Spatial Rx parameter}
예를 들어, target antenna port가 특정 NZP CSI-RS 인 경우, 해당 NZP CSI-RS antenna ports는 QCL-Type A관점에서는 특정 TRS와, QCL-Type D관점에서는 특정 SSB과 QCL되었다고 지시/설정될 수 있다. 이러한 지시/설정을 받은 단말은 QCL-TypeA TRS에서 측정된 Doppler, delay값을 이용해서 해당 NZP CSI-RS를 수신하고, QCL-TypeD SSB 수신에 사용된 수신 빔을 해당 NZP CSI-RS 수신에 적용할 수 있다.
UE는 8개까지의 TCI state들을 DCI 필드 'Transmission Configuration Indication'의 codepoint에 매핑하기 위해 사용되는 MAC CE signaling에 의한 activation command를 수신할 수 있다.
H.2. UL BM
UL BM은 단말 구현에 따라 Tx beam - Rx beam 간 beam reciprocity(또는 beam correspondence)가 성립할 수 있거나 또는, 성립하지 않을 수 있다. 만약 기지국과 단말 모두에서 Tx beam - Rx beam 간 reciprocity가 성립하는 경우, DL beam pair를 통해 UL beam pair를 맞출 수 있다. 하지만, 기지국과 단말 중 어느 하나라도 Tx beam - Rx beam 간 reciprocity가 성립하지 않는 경우, DL beam pair 결정과 별개로 UL beam pair 결정 과정이 필요하다.
또한, 기지국과 단말 모두 beam correspondence를 유지하고 있는 경우에도, 단말이 선호(preferred) beam의 보고를 요청하지 않고도 기지국은 DL Tx beam 결정을 위해 UL BM 절차를 사용할 수 있다.
UL BM은 beamformed UL SRS 전송을 통해 수행될 수 있으며, SRS resource set의 UL BM의 적용 여부는 (higher layer parameter) usage에 의해 설정된다. usage가 'BeamManagement(BM)'로 설정되면, 주어진 time instant에 복수의 SRS resource set들 각각에 하나의 SRS resource만 전송될 수 있다.
단말은 (higher layer parameter) SRS-ResourceSet에 의해 설정되는 하나 또는 그 이상의 Sounding Reference Symbol (SRS) resource set들을 (higher layer signaling, RRC signaling 등을 통해) 설정받을 수 있다. 각각의 SRS resource set에 대해, UE는 K≥1 SRS resource들 (higher later parameter SRS-resource)이 설정될 수 있다. 여기서, K는 자연수이며, K의 최대 값은 SRS_capability에 의해 지시된다.
DL BM과 마찬가지로, UL BM 절차도 단말의 Tx beam sweeping과 기지국의 Rx beam sweeping으로 구분될 수 있다.
도 11은 SRS를 이용한 UL BM 절차의 일례를 나타낸다. 도 11의 (a)는 기지국의 Rx beam 결정 절차를 나타내고, 도 11의 (b)는 단말의 Tx beam sweeping 절차를 나타낸다.
도 12은 SRS를 이용한 UL BM 절차의 일례를 나타낸 흐름도이다.
- 단말은 'beam management'로 설정된 (higher layer parameter) usage parameter를 포함하는 RRC signaling(예: SRS-Config IE)를 기지국으로부터 수신한다(S1010).
표 3은 SRS-Config IE(Information Element)의 일례를 나타내며, SRS-Config IE는 SRS 전송 설정을 위해 사용된다. SRS-Config IE는 SRS-Resources의 list와 SRS-ResourceSet들의 list를 포함한다. 각 SRS resource set는 SRS-resource들의 set를 의미한다.
네트워크는 설정된 aperiodicSRS-ResourceTrigger (L1 DCI)를 사용하여 SRS resource set의 전송을 트리거할 수 있다.
Figure PCTKR2020006661-appb-T000003
표 3에서, usage는 SRS resource set이 beam management를 위해 사용되는지, codebook 기반 또는 non-codebook 기반 전송을 위해 사용되는지를 지시하는 higher layer parameter를 나타낸다. usage parameter는 L1 parameter 'SRS-SetUse'에 대응한다. 'spatialRelationInfo'는 reference RS와 target SRS 사이의 spatial relation의 설정을 나타내는 parameter이다. 여기서, reference RS는 L1 parameter 'SRS-SpatialRelationInfo'에 해당하는 SSB, CSI-RS 또는 SRS가 될 수 있다. 상기, usage는 SRS resource set 별로 설정된다.- 단말은 상기 SRS-Config IE에 포함된 SRS-SpatialRelation Info에 기초하여 전송할 SRS resource에 대한 Tx beam을 결정한다(S1020). 여기서, SRS-SpatialRelation Info는 SRS resource 별로 설정되고, SRS resource 별로 SSB, CSI-RS 또는 SRS에서 사용되는 beam과 동일한 beam을 적용할지를 나타낸다. 또한, 각 SRS resource에 SRS-SpatialRelationInfo가 설정되거나 또는 설정되지 않을 수 있다.
- 만약 SRS resource에 SRS-SpatialRelationInfo가 설정되면 SSB, CSI-RS 또는 SRS에서 사용되는 beam과 동일한 beam을 적용하여 전송한다. 하지만, SRS resource에 SRS-SpatialRelationInfo가 설정되지 않으면, 상기 단말은 임의로 Tx beam을 결정하여 결정된 Tx beam을 통해 SRS를 전송한다(S1030).
보다 구체적으로, 'SRS-ResourceConfigType'가 'periodic'으로 설정된 P-SRS에 대해:
i) SRS-SpatialRelationInfo가 'SSB/PBCH'로 설정되는 경우, UE는 SSB/PBCH의 수신을 위해 사용한 spatial domain Rx filter와 동일한 (혹은 해당 filter로부터 생성된) spatial domain transmission filter를 적용하여 해당 SRS resource를 전송한다; 또는
ii) SRS-SpatialRelationInfo가 'CSI-RS'로 설정되는 경우, UE는 periodic CSI-RS 또는 SP CSI-RS의 수신을 위해 사용되는 동일한 spatial domain transmission filter를 적용하여 SRS resource를 전송한다; 또는
iii) SRS-SpatialRelationInfo가 'SRS'로 설정되는 경우, UE는 periodic SRS의 전송을 위해 사용된 동일한 spatial domain transmission filter를 적용하여 해당 SRS resource를 전송한다.
‘SRS-ResourceConfigType'이 'SP-SRS' 또는 'AP-SRS'로 설정된 경우에도 위와 유사하게 빔 결정 및 전송 동작이 적용될 수 있다.
- 추가적으로, 단말은 기지국으로부터 SRS에 대한 feedback을 다음 3가지 경우와 같이, 수신받거나 또는 수신받지 않을 수 있다(S1040).
i) SRS resource set 내의 모든 SRS resource들에 대해 Spatial_Relation_Info가 설정되는 경우, 단말은 기지국이 지시한 빔으로 SRS를 전송한다. 예를 들어, Spatial_Relation_Info가 모두 동일한 SSB, CRI 또는 SRI를 지시하는 경우, 단말은 동일 빔으로 SRS를 반복 전송한다. 이 경우는, 기지국이 Rx beam을 selection하는 용도로서 도 G(a)에 대응한다.
ii) SRS resource set 내의 모든 SRS resource들에 대해 Spatial_Relation_Info가 설정되지 않을 수 있다. 이 경우, 단말은 자유롭게 SRS beam을 바꾸어가면서 전송할 수 있다. 즉, 이 경우는 단말이 Tx beam을 sweeping하는 용도로서, 도 G(b)에 대응한다.
iii) SRS resource set 내의 일부 SRS resource들에 대해서만 Spatial_Relation_Info가 설정될 수 있다. 이 경우, 설정된 SRS resource에 대해서는 지시된 빔으로 SRS를 전송하고, Spatial_Relation_Info가 설정되지 않은 SRS resource에 대해서는 단말이 임의로 Tx beam을 적용해서 전송할 수 있다.
I. CSI 관련 동작
NR(New Radio) 시스템에서, CSI-RS(channel state information-reference signal)은 시간 및/또는 주파수 트래킹(time/frequency tracking), CSI 계산(computation), L1(layer 1)-RSRP(reference signal received power) 계산(computation) 및 이동성(mobility)를 위해 사용된다. 여기서, CSI computation은 CSI 획득(acquisition)과 관련되며, L1-RSRP computation은 빔 관리(beam management, BM)와 관련된다.
CSI(channel state information)은 단말과 안테나 포트 사이에 형성되는 무선 채널(혹은 링크라고도 함)의 품질을 나타낼 수 있는 정보를 통칭한다.
도 13은 CSI 관련 절차의 일례를 나타낸 흐름도이다.
- 상기와 같은 CSI-RS의 용도 중 하나를 수행하기 위해, 단말(예: user equipment, UE)은 CSI와 관련된 설정(configuration) 정보를 RRC(radio resource control) signaling을 통해 기지국(예: general Node B, gNB)으로부터 수신한다(S110).
상기 CSI와 관련된 configuration 정보는 CSI-IM(interference management) 자원(resource) 관련 정보, CSI 측정 설정(measurement configuration) 관련 정보, CSI 자원 설정(resource configuration) 관련 정보, CSI-RS 자원(resource) 관련 정보 또는 CSI 보고 설정(report configuration) 관련 정보 중 적어도 하나를 포함할 수 있다.
i) CSI-IM 자원 관련 정보는 CSI-IM 자원 정보(resource information), CSI-IM 자원 세트 정보(resource set information) 등을 포함할 수 있다. CSI-IM resource set은 CSI-IM resource set ID(identifier)에 의해 식별되며, 하나의 resource set은 적어도 하나의 CSI-IM resource를 포함한다. 각각의 CSI-IM resource는 CSI-IM resource ID에 의해 식별된다.
ii) CSI resource configuration 관련 정보는 CSI-ResourceConfig IE로 표현될 수 있다. CSI resource configuration 관련 정보는 NZP(non zero power) CSI-RS resource set, CSI-IM resource set 또는 CSI-SSB resource set 중 적어도 하나를 포함하는 그룹을 정의한다. 즉, 상기 CSI resource configuration 관련 정보는 CSI-RS resource set list를 포함하며, 상기 CSI-RS resource set list는 NZP CSI-RS resource set list, CSI-IM resource set list 또는 CSI-SSB resource set list 중 적어도 하나를 포함할 수 있다. CSI-RS resource set은 CSI-RS resource set ID에 의해 식별되고, 하나의 resource set은 적어도 하나의 CSI-RS resource를 포함한다. 각각의 CSI-RS resource는 CSI-RS resource ID에 의해 식별된다.
표 4에서와 같이, NZP CSI-RS resource set 별로 CSI-RS의 용도를 나타내는 parameter들(예: BM 관련 'repetition' parameter, tracking 관련 'trs-Info' parameter)이 설정될 수 있다.
표 4은 NZP CSI-RS resource set IE의 일례를 나타낸다.
Figure PCTKR2020006661-appb-T000004
그리고, higher layer parameter에 해당하는 repetition parameter는 L1 parameter의 'CSI-RS-ResourceRep'에 대응한다.iii) CSI 보고 설정(report configuration) 관련 정보는 시간 영역 행동(time domain behavior)을 나타내는 보고 설정 타입(reportConfigType) parameter 및 보고하기 위한 CSI 관련 quantity를 나타내는 보고량(reportQuantity) parameter를 포함한다. 상기 시간 영역 동작(time domain behavior)은 periodic, aperiodic 또는 semi-persistent일 수 있다.
CSI report configuration 관련 정보는 CSI-ReportConfig IE로 표현될 수 있으며, 아래 표 5는 CSI-ReportConfig IE의 일례를 나타낸다.
Figure PCTKR2020006661-appb-T000005
- 단말은 상기 CSI와 관련된 configuration 정보에 기초하여 CSI를 측정(measurement)한다(S120). 상기 CSI 측정은 (1) 단말의 CSI-RS 수신 과정(S121)과, (2) 수신된 CSI-RS를 통해 CSI를 계산(computation)하는 과정(S122)을 포함할 수 있으며, 이에 대하여 구체적인 설명은 후술한다.
CSI-RS는 higher layer parameter CSI-RS-ResourceMapping에 의해 시간(time) 및 주파수(frequency) 영역에서 CSI-RS resource의 RE(resource element) 매핑이 설정된다.
표 6은 CSI-RS-ResourceMapping IE의 일례를 나타낸다.
Figure PCTKR2020006661-appb-T000006
표 6에서, 밀도(density, D)는 RE/port/PRB(physical resource block)에서 측정되는 CSI-RS resource의 density를 나타내며, nrofPorts는 안테나 포트의 개수를 나타낸다.
- 단말은 상기 측정된 CSI를 기지국으로 보고(report)한다(S130).
여기서, 표 6의 CSI-ReportConfig의 quantity가 'none(또는 No report)'로 설정된 경우, 상기 단말은 상기 report를 생략할 수 있다.
다만, 상기 quantity가 'none(또는 No report)'로 설정된 경우에도 상기 단말은 기지국으로 report를 할 수도 있다.
상기 quantity가 'none'으로 설정된 경우는 aperiodic TRS를 trigger하는 경우 또는 repetition이 설정된 경우이다.
여기서, repetition이 'ON'으로 설정된 경우에만 상기 단말의 report를 생략할 수 있다.
I.1. CSI 측정
NR 시스템은 보다 유연하고 동적인 CSI measurement 및 reporting을 지원한다. 여기서, 상기 CSI measurement는 CSI-RS를 수신하고, 수신된 CSI-RS를 computation하여 CSI를 acquisition하는 절차를 포함할 수 있다.
CSI measurement 및 reporting의 time domain behavior로서, aperiodic/semi-persistent/periodic CM(channel measurement) 및 IM(interference measurement)이 지원된다. CSI-IM의 설정을 위해 4 port NZP CSI-RS RE pattern을 이용한다.
NR의 CSI-IM 기반 IMR은 LTE의 CSI-IM과 유사한 디자인을 가지며, PDSCH rate matching을 위한 ZP CSI-RS resource들과는 독립적으로 설정된다. 그리고, NZP CSI-RS 기반 IMR에서 각각의 port는 (바람직한 channel 및) precoded NZP CSI-RS를 가진 interference layer를 emulate한다. 이는, multi-user case에 대해 intra-cell interference measurement에 대한 것으로, MU interference를 주로 target 한다.
기지국은 설정된 NZP CSI-RS 기반 IMR의 각 port 상에서 precoded NZP CSI-RS를 단말로 전송한다.
단말은 resource set에서 각각의 port에 대해 channel / interference layer를 가정하고 interference를 측정한다.
채널에 대해, 어떤 PMI 및 RI feedback도 없는 경우, 다수의 resource들은 set에서 설정되며, 기지국 또는 네트워크는 channel / interference measurement에 대해 NZP CSI-RS resource들의 subset을 DCI를 통해 지시한다.
resource setting 및 resource setting configuration에 대해 보다 구체적으로 살펴본다.
I.1.1 자원 세팅
각각의 CSI resource setting 'CSI-ResourceConfig'는 (higher layer parameter csi-RS-ResourceSetList에 의해 주어진) S≥1 CSI resource set에 대한 configuration을 포함한다. CSI resource setting은 CSI-RS- resourcesetlist에 대응한다. 여기서, S는 설정된 CSI-RS resource set의 수를 나타낸다. 여기서, S≥1 CSI resource set에 대한 configuration은 (NZP CSI-RS 또는 CSI-IM으로 구성된) CSI-RS resource들을 포함하는 각각의 CSI resource set과 L1-RSRP computation에 사용되는 SS/PBCH block (SSB) resource를 포함한다.
각 CSI resource setting은 higher layer parameter bwp-id로 식별되는 DL BWP(bandwidth part)에 위치된다. 그리고, CSI reporting setting에 링크된 모든 CSI resource setting들은 동일한 DL BWP를 갖는다.
CSI-ResourceConfig IE에 포함되는 CSI resource setting 내에서 CSI-RS resource의 time domain behavior는 higher layer parameter resourceType에 의해 지시되며, aperiodic, periodic 또는 semi-persistent로 설정될 수 있다. Periodic 및 semi-persistent CSI resource setting에 대해, 설정된 CSI-RS resource set의 수(S)는 '1'로 제한된다. Periodic 및 semi-persistent CSI resource setting에 대해, 설정된 주기(periodicity) 및 슬롯 오프셋(slot offset)은 bwp-id에 의해 주어지는 것과 같이, 연관된 DL BWP의 numerology에서 주어진다.
UE가 동일한 NZP CSI-RS resource ID를 포함하는 다수의 CSI-ResourceConfig들로 설정될 때, 동일한 time domain behavior는 CSI-ResourceConfig에 대해 설정된다.
UE가 동일한 CSI-IM resource ID를 포함하는 다수의 CSI-ResourceConfig들로 설정될 때, 동일한 time domain behavior는 CSI-ResourceConfig에 대해 설정된다.
다음은 channel measurement (CM) 및 interference measurement(IM)을 위한 하나 또는 그 이상의 CSI resource setting들은 higher layer signaling을 통해 설정된다.
- interference measurement에 대한 CSI-IM resource.
- interference measurement에 대한 NZP CSI-RS 자원.
- channel measurement에 대한 NZP CSI-RS 자원.
즉, CMR(channel measurement resource)는 CSI acquisition을 위한 NZP CSI-RS일 수 있으며, IMR(Interference measurement resource)는 CSI-IM과 IM을 위한 NZP CSI-RS일 수 있다.
여기서, CSI-IM(또는 IM을 위한 ZP CSI-RS)는 주로 inter-cell interference measurement에 대해 사용된다.
그리고, IM을 위한 NZP CSI-RS는 주로 multi-user로부터 intra-cell interference measurement를 위해 사용된다.
UE는 채널 측정을 위한 CSI-RS resource(들) 및 하나의 CSI reporting을 위해 설정된 interference measurement를 위한 CSI-IM / NZP CSI-RS resource(들)이 자원 별로 'QCL-TypeD'라고 가정할 수 있다.
I.1.2 자원 세팅 설정
살핀 것처럼, resource setting은 resource set list를 의미할 수 있다.
aperiodic CSI에 대해, higher layer parameter CSI-AperiodicTriggerState를 사용하여 설정되는 각 트리거 상태(trigger state)는 각각의 CSI-ReportConfig가 periodic, semi-persistent 또는 aperiodic resource setting에 링크되는 하나 또는 다수의 CSI-ReportConfig와 연관된다.
하나의 reporting setting은 최대 3개까지의 resource setting과 연결될 수 있다.
- 하나의 resource setting이 설정되면, (higher layer parameter resourcesForChannelMeasurement에 의해 주어지는) resource setting 은 L1-RSRP computation을 위한 channel measurement에 대한 것이다.
- 두 개의 resource setting들이 설정되면, (higher layer parameter resourcesForChannelMeasurement에 의해 주어지는) 첫 번째 resource setting은 channel measurement를 위한 것이고, (csi-IM-ResourcesForInterference 또는 nzp-CSI-RS -ResourcesForInterference에 의해 주어지는) 두 번째 resource setting은 CSI-IM 또는 NZP CSI-RS 상에서 수행되는 interference measurement를 위한 것이다.
- 세 개의 resource setting들이 설정되면, (resourcesForChannelMeasurement에 의해 주어지는) 첫 번째 resource setting은 channel measurement를 위한 것이고, (csi-IM-ResourcesForInterference에 의해 주어지는) 두 번째 resource setting은 CSI-IM 기반 interference measurement를 위한 것이고, (nzp-CSI-RS-ResourcesForInterference에 의해 주어지는) 세 번째 resource setting 은 NZP CSI-RS 기반 interference measurement를 위한 것이다.
Semi-persistent 또는 periodic CSI에 대해, 각 CSI-ReportConfig는 periodic 또는 semi-persistent resource setting에 링크된다.
- (resourcesForChannelMeasurement에 의해 주어지는) 하나의 resource setting 이 설정되면, 상기 resource setting은 L1-RSRP computation을 위한 channel measurement에 대한 것이다.
- 두 개의 resource setting들이 설정되면, (resourcesForChannelMeasurement에 의해 주어지는) 첫 번째 resource setting은 channel measurement를 위한 것이며, (higher layer parameter csi-IM-ResourcesForInterference에 의해 주어지는) 두 번째 resource setting은 CSI-IM 상에서 수행되는 interference measurement를 위해 사용된다.
I.1.3 CSI 계산
간섭 측정이 CSI-IM 상에서 수행되면, 채널 측정을 위한 각각의 CSI-RS resource는 대응하는 resource set 내에서 CSI-RS resource들 및 CSI-IM resource들의 순서에 의해 CSI-IM resource와 자원 별로 연관된다. 채널 측정을 위한 CSI-RS resource의 수는 CSI-IM resource의 수와 동일하다.
그리고, interference measurement가 NZP CSI-RS에서 수행되는 경우, UE는 채널 측정을 위한 resource setting 내에서 연관된 resource set에서 하나 이상의 NZP CSI-RS resource로 설정될 것으로 기대하지 않는다.
Higher layer parameter nzp-CSI-RS-ResourcesForInterference가 설정된 단말은 NZP CSI-RS resource set 내에 18 개 이상의 NZP CSI-RS port가 설정될 것으로 기대하지 않는다.
CSI 측정을 위해, 단말은 아래 사항을 가정한다.
- 간섭 측정을 위해 설정된 각각의 NZP CSI-RS port는 간섭 전송 계층에 해당한다.
- 간섭 측정을 위한 NZP CSI-RS port의 모든 간섭 전송 레이어는 EPRE(energy per resource element) 비율을 고려한다.
- 채널 측정을 위한 NZP CSI-RS resource의 RE(s) 상에서 다른 간섭 신호, 간섭 측정을 위한 NZP CSI-RS resource 또는 간섭 측정을 위한 CSI-IM resource.
I.2. CSI 보고
CSI 보고를 위해, UE가 사용할 수 있는 time 및 frequency 자원은 기지국에 의해 제어된다.
CSI(channel state information)은 채널 품질 지시자(channel quality indicator, CQI), 프리코딩 행렬 지시자 (precoding matrix indicator, PMI), CSI-RS resource indicator (CRI), SS/PBCH block resource indicator (SSBRI), layer indicator (LI), rank indicator (RI) 또는 L1-RSRP 중 적어도 하나를 포함할 수 있다.
CQI, PMI, CRI, SSBRI, LI, RI, L1-RSRP에 대해, 단말은 N≥1 CSI-ReportConfig reporting setting, M≥1 CSI-ResourceConfig resource setting 및 하나 또는 두 개의 trigger state들의 리스트(aperiodicTriggerStateList 및 semiPersistentOnPUSCH-TriggerStateList에 의해 제공되는)로 higher layer에 의해 설정된다. 상기 aperiodicTriggerStateList에서 각 trigger state는 channel 및 선택적으로 interference 대한 resource set ID들을 지시하는 연관된 CSI-ReportConfigs 리스트를 포함한다. semiPersistentOnPUSCH-TriggerStateList에서 각 trigger state는 하나의 연관된 CSI-ReportConfig가 포함된다.
그리고, CSI reporting의 time domain behavior는 periodic, semi-persistent, aperiodic을 지원한다.
i) periodic CSI reporting은 short PUCCH, long PUCCH 상에서 수행된다. Periodic CSI reporting의 주기(periodicity) 및 슬롯 오프셋(slot offset)은 RRC로 설정될 수 있으며, CSI-ReportConfig IE를 참고한다.
ii) SP(semi-periodic) CSI reporting은 short PUCCH, long PUCCH, 또는 PUSCH 상에서 수행된다.
Short/long PUCCH 상에서 SP CSI인 경우, 주기(periodicity) 및 슬롯 오프셋(slot offset)은 RRC로 설정되며, 별도의 MAC CE / DCI로 CSI 보고가 activation/deactivation 된다.
PUSCH 상에서 SP CSI인 경우, SP CSI reporting의 periodicity는 RRC로 설정되지만, slot offset은 RRC로 설정되지 않으며, DCI(format 0_1)에 의해 SP CSI reporting은 활성화/비활성화(activation/deactivation)된다. PUSCH 상에서 SP CSI reporting에 대해, 분리된 RNTI(SP-CSI C-RNTI)가 사용된다.
최초 CSI 보고 타이밍은 DCI에서 지시되는 PUSCH time domain allocation 값을 따르며, 후속되는 CSI 보고 타이밍은 RRC로 설정된 주기에 따른다.
DCI format 0_1은 CSI request field를 포함하고, 특정 configured SP-CSI trigger state를 activation/deactivation할 수 있다. SP CSI reporting은, SPS PUSCH 상에서 data 전송을 가진 mechanism과 동일 또는 유사한 활성화/비활성화를 가진다.
iii) aperiodic CSI reporting은 PUSCH 상에서 수행되며, DCI에 의해 trigger된다. 이 경우, aperiodic CSI reporting의 trigger와 관련된 정보는 MAC-CE를 통해 전달/지시/설정될 수 있다.
AP CSI-RS를 가지는 AP CSI의 경우, AP CSI-RS timing은 RRC에 의해 설정되고, AP CSI reporting에 대한 timing은 DCI에 의해 동적으로 제어된다.
NR은 LTE에서 PUCCH 기반 CSI 보고에 적용되었던 다수의 reporting instance들에서 CSI를 나누어 보고하는 방식 (예를 들어, RI, WB PMI/CQI, SB PMI/CQI 순서로 전송)이 적용되지 않는다. 대신, NR은 short/long PUCCH에서 특정 CSI 보고를 설정하지 못하도록 제한하고, CSI omission rule이 정의된다. 그리고, AP CSI reporting timing과 관련하여, PUSCH symbol/slot location은 DCI에 의해 동적으로 지시된다. 그리고, candidate slot offset들은 RRC에 의해 설정된다. CSI reporting에 대해, slot offset(Y)는 reporting setting 별로 설정된다. UL-SCH에 대해, slot offset K2는 별개로 설정된다.
2개의 CSI latency class(low latency class, high latency class)는 CSI computation complexity의 관점에서 정의된다. Low latency CSI의 경우, 최대 4 ports Type-I codebook 또는 최대 4-ports non-PMI feedback CSI를 포함하는 WB CSI이다. High latency CSI는 low latency CSI를 제외한 다른 CSI를 말한다. Normal 단말에 대해, (Z, Z')는 OFDM symbol들의 unit에서 정의된다. 여기서, Z는 Aperiodic CSI triggering DCI를 수신한 후 CSI 보고를 수행하기 까지의 최소 CSI processing time을 나타낸다. 또한, Z'는 channel/interference에 대한 CSI-RS를 수신한 후 CSI 보고를 수행하기까지의 최소 CSI processing time을 나타낸다.
추가적으로, 단말은 동시에 calculation할 수 있는 CSI의 개수를 report한다.
앞서 살핀 5G 통신 기술은 후술할 본 명세서에서 제안하는 방법들과 결합되어 적용될 수 있으며, 또는 본 명세서에서 제안하는 방법들의 기술적 특징을 구체화하거나 명확하게 하는데 보충될 수 있다.
J. 본 명세서의 주요 실시예들
앞서 살핀 5G 통신 기술은 후술할 본 명세서에서 제안되는 방법들과 결합되어 적용될 수 있으며, 또는 본 명세서에서 제안하는 방법들의 기술적 특징을 구체화하거나 명확하게 하는데 보충될 수 있다. 한편, 본 명세서에서 제안하는 온-디바이스 기반 기계학습은 앞서 설명한 5G 통신 기술뿐만 아니라, 3G, 4G 및/또는 6G 통신 기술에 의한 통신 서비스와 결합되어 적용될 수도 있다.
도 14는 본 명세서의 일 실시예에 따른 통신 시스템을 예시적으로 설명한다.
종래의 대부분의 통신 시스템은 물리적 채널을 통계적 모델로 근사화하고 이에 기반하여 수학적 송수신 모델을 도출함으로써 설계되고 최적화되고 있다.
이와 같은 접근 방식은 지금까지 비교적 성공적인 결과를 보여주고 있으나, 실제 물리적 채널과 통계적 모델 사이의 불일치, 복잡도 감소를 위해 도입된 여러 가지 가정 및 단순화로 인해 구현된 통신 시스템이 다양한 실제 채널 환경에서 최적의 성능을 보여준다고 보기는 어렵다. 실제 물리적 채널의 특성을 좀 더 잘 반영하고, 실제 채널 환경에서 최적의 성능을 보여줄 수 있도록 채널 모델과 통신 시스템의 통계적, 수학적 모델을 개선할 수는 있으나, 높은 복잡도와 trade-off 관계에 있어 실제 시스템에 적용하기가 쉽지 않다.
점점 더 복잡해지는 통신 시스템은 실제 환경에서 최적의 성능을 제공할 수 있는 통신 시스템의 수학적 모델을 더욱 어렵게 하고 있다.
각 사용자가 처한 채널 환경에서 다양한 서비스가 요구하는 QoS에 최적화할 수 있는 유연한 통신 시스템을 실현하기 위해서는 새로운 접근 방식이 필요하다.
최근 영상 및 음성 인식을 중심으로 다양한 분야에서 괄목할 만한 성과를 보여주고 있는 기계 학습 (Machine Learning, ML), 그 중에서도 특히 심층 학습(Deep Learning, DL) 기술을 통신에 적용하고자 하는 다양한 연구가 진행되고 있다.
채널 추정, 신호 검출 등 물리 계층 신호 처리에도 기계 학습, 그 중에서도 특히 심층 학습을 적용하고자 하는 연구가 점점 활발해지고 있으며, 실제로 무선 통신 송수신 일부 또는 전체를 심층 신경망 등 기계 학습 모델로 대체할 수 있음을 보여주고 있다. 이러한 접근 방식은 수학적 모델을 기반으로 한 기존의 통신 시스템이 가지고 있는 한계를 극복할 수 있는 새로운 대안이 될 수 있다.
한편, 최근 가장 각광받고 있는 심층 학습을 포함하여 많은 기계 학습 알고리즘은 많은 양의 학습 데이터와 학습 중 높은 연산 복잡도를 필요로 하며, 이런 이유로 학습은 고용량 서버나 클라우드(Cloud)에서 수행하고, 실제 사용 환경에서는 학습이 완료된 모델을 이용한 추정(inference)만을 수행하는 경우가 대부분이다.
도 14를 참조하면, 본 명세서에서는 수학적 송수신 모델을 기계 학습에 의한 학습 모델로 대체하는 방식이 제안된다. 예를 들어, 컴퓨팅 디바이스가 채널 모델에서 획득된 학습 데이터를 이용하여 학습 모델을 생성하면, 생성된 학습 모델을 기계 학습 기반의 통신 시스템으로 전송하여, 수학적 모델링에 비해 보다 적응적인 무선 통신 시스템을 제공할 수 있다.
한편, 물리 계층에 기계 학습, 특히 심층 학습을 적용하고자 하는 대부분의 연구도 학습은 시뮬레이터 등을 이용하여 서버나 PC 등에서 수행하고, 실제 통신 시스템에는 학습이 완료된 모델을 적용하는 접근 방식을 취하고 있다.
하지만, 실제 통신 시스템에서의 학습이 없이는 여전히 각 사용자가 처한 환경과 시나리오에 최적화된 성능을 제공하기 어렵다는 한계가 존재한다. 예를 들어 오른쪽 그림과 같이 최적화하고자 하는 파라미터에 대해 다양한 사용 환경을 고려한 개발 환경에서의 최적값과 실사용 환경에서의 최적값이 서로 다를 수 있다. 이러한 차이는 단말의 수신기가 사용되는 환경에서의 입력 데이터와 클라우드로부터 제공되는 학습 모델의 트레이닝 데이터셋이 서로 다름으로 인한 것이다.
이하 명세서에서는 학습 모델의 트레이닝 데이터와 실사용환경에서의 입력 데이터의 차이로 인한 간극을 최소화할 수 있는 다양한 실시예를 설명한다. 구체적으로, 사용환경에 적응적인 적응형 학습 모델을 생성 및 검증하는 방법, 특정 환경에 대한 진입에 응답하여 다양한 적응형 학습 모델 중 어느 하나를 이용하는 방법을 설명한다.
도 15는 본 명세서의 일 실시예에 따른 방법의 순서도이다.
본 명세서의 일 실시예에 따른 방법은 소정의 동작들을 포함한다. 이때, 소정의 동작들은 단말의 적어도 하나의 프로세서에 의해 수행되고, 구체적으로, 상기 소정의 동작들은 트랜시버, 적어도 하나의 프로세서, 상기 적어도 하나의 프로세서에 연결되고, 명령들(instructions)을 저장하는 적어도 하나의 메모리를 포함하는 단말에 의해 수행된다.
상기 명령들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 다중의 수신 안테나를 이용하여 MIMO 통신 채널을 통해 통신하기 위한 동작들을 지원하고, 이하 J.1 내지 J.4의 설명을 통해 상기 동작들을 설명한다.
한편, 본 명세서의 적어도 하나의 프로세서는, 커뮤니캐이션 프로세서(communication processor, CP)와 애플리캐이션 프로세서(application processor, AP)를 중 적어도 하나를 포함할 수 있다. 다양한 실시예들에서 상기 AP 및/또는 CP 에 의한 동작들은 기능적으로 상기 AP 및 CP에 의해 구분되어 동작되거나, 기능적으로 결합된 하나의 프로세서에 의해서 수행될 수 있다. 이하의 도 15 및 그 설명은 '프로세서'에 의해 동작들이 수행되는 것으로 예시한다.
또한, 본 명세서의 다양한 실시예에서 구현되는 기계 학습 네트워크는 심층 신경망(Deep Neural Network, DNN), 컨볼루션 신경망(Convolutional Neural Network, CNN), 또는 파라메트릭 곱셈들, 덧셈들, 및 비 선형성들을 포함하는 순환 신경망(Recurrent Neural Network, RNN) 중 적어도 하나를 포함한다.
한편, 본 명세서의 다양한 실시예에서 '학습용 데이터', '트레이닝 데이터', 및/또는 '훈련 데이터'는 상호 혼용될 수 있다.
도 15를 참조하면, 적어도 하나의 프로세서는 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하거나 갱신할 수 있다(S110).
학습 리스트는 하나 이상의 제1 항목을 포함한다. 여기서, 제1 항목은 소정의 통신 환경을 의미한다. 이처럼, 학습 리스트에 포함되는 하나 이상의 통신 환경들은 기계 학습 네트워크의 학습 대상으로 이용된다. 즉, 학습 리스트에 포함된 하나 이상의 제1 항목들에 대응되는 하나 이상의 통신 환경에서 얻은 훈련 데이터를 이용하여, 적어도 하나의 프로세서는, 통신 환경 별로 최적화된 기계 학습 네트워크를 제공할 수 있다. 한편, 상기 제1 항목들은 각각의 ID에 의해 구분될 수 있다.
또한, 학습 리스트는 상기 제1 항목 별로 구분되는 장소 정보와 기지국 정보를 포함할 수 있다. 여기서, 장소 정보는 학습이 완료된 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함할 수 있다. 예를 들어, 단말이 적용 영역에 위치하는 경우, 단말은 상기 적용 영역과 연관된 기계 학습 네트워크를 이용하여 수신기를 제어할 수 있다. 예를 들어, 단말이 수집 영역에 위치하는 경우, 단말은 수집 영역에서 연결된 기지국으로부터 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻을 수 있다.
일 실시예에서, 학습 리스트를 생성하기 위하여 하나 이상의 기지국 별로 연결 정보를 측정하고, 적어도 하나의 프로세서는, 측정된 연결 정보에 기반하여 대상 기지국을 결정할 수 있다. 적어도 하나의 프로세서는 대상 기지국과 연결되거나 연결되어 있는 동안 주기적으로 단말의 위치 샘플들을 얻고, 위치 샘플들을 대상으로 클러스터링 알고리즘을 적용하여 하나 이상의 통신 환경을 결정할 수 있다. 이처럼, 결정된 하나 이상의 통신 환경은 학습 리스트의 제1 항목으로 설정될 수 있다.
다른 실시예에서, 적어도 하나의 프로세서는 학습 리스트를 생성하기 위하여 연결 리스트, 후보 리스트, 선정 리스트 중 적어도 하나를 생성하거나 업데이트하는 동작들을 수행할 수 있다.
구체적으로, 적어도 하나의 프로세서는 하나 이상의 기지국 별로 얻은 연결 정보(예:Primary Cell로 연결된 시간(T_pri), 총 연결시간(T_tot), 또는 총 수신 데이터양(D_tot))와 기지국 정보(예: Cell ID, 또는 주파수 대역) 중 하나 이상을 갖는 하나 이상의 제2 항목을 포함하는 연결 리스트를 생성하거나 업데이트할 수 있다.
적어도 하나의 프로세서는 상기 연결 리스트의 연결 정보에 기반하여 후보 리스트를 생성하거나 업데이트할 수 있다. 후보 리스트는 하나 이상의 제3 항목을 포함할 수 있다. 여기서, 제3 항목은 점수 파라미터를 더 포함할 수 있다. 점수 파라미터는 상기 연결 리스트의 연결 정보에 설정된 가중치를 적용하여 산출된다. 예를 들어, 점수는 아래의 수학식 1 에 따라 산출될 수 있다.
Figure PCTKR2020006661-appb-M000001
수학식 1에서, w_tot은 T_tot에 대한 가중치, w_pri는 T_pri에 대한 가중치, w_data는 D에 대한 가중치를 의미한다. 한편, 본 명세서에서 전술한 D_tot은 D와 동일하게 혼용될 수 있으며, 상호 구분되는 것이 아니다.
적어도 하나의 프로세서는 상기 후보 리스트에 포함된 하나 이상의 제3 항목 중 어느 하나에 설정된 가중치를 적용하여 하나 이상의 항목을 선정하여 선정 리스트를 생성하거나 업데이트할 수 있다.
적어도 하나의 프로세서는 상기 점수 파라미터를 기준으로 상기 후보 리스트에 포함된 하나 이상의 제3 항목들을 정렬(예: 내림차순)하고, 상위의 K(K는 양의 정수)개의 항목들을 선정하여 선정 리스트를 생성하거나 업데이트할 수 있다.
적어도 하나의 프로세서는 상기 선정 리스트에 기초하여 상기 선정 리스트의 하나 이상의 기지국 중 적어도 하나와 연결되거나, 연결되어 있는 동안 위치 정보를 수집할 수 있다. 일 예로, 적어도 하나의 프로세서는 위치 정보를 생성하도록 GPS 모듈에 명령을 제공하거나, 네트워크로 위치 정보의 전달을 요청하도록 트랜시버에 명령을 제공할 수 있다. 또한, 수집된 위치 정보 중 적어도 일부는 제1 항목에 대응되는 통신 환경을 선정하기 위한 위치 샘플로 샘플링된다.
이때, 적어도 하나의 프로세서는 상기 단말의 위치에 기반하여 획득된 위치 정보 또는 위치 샘플의 적어도 일부를 메모리에 저장하지 않는다. 예를 들어, 단말이 전술한, 적용 영역에 위치하는 것이 감지되면, 적어도 하나의 프로세서는 상기 위치 정보 또는 위치 샘플을 메모리에 저장하지 않도록 제어한다. 또한, 적어도 하나의 프로세서는 단말이 적용 영역에 진입할 때마다 위치 정보 획득 주기에 연관된 파라미터(N_in-region)를 1씩 증가시킨다.
그 결과, N_in-region이 설정된 임계치 이상이 되면, 적어도 하나의 프로세서는 위치 정보를 획득하는 주기를 증가시킬 수 있다. 에를 들어, 위치 정보를 획득하는 주기는 설정할 수 있는 주기 중 현재 값보다 큰 값 중에서 가장 작은 값으로 선택될 수 있다. 이때, 현재 값보다 큰 값이 없으면 현재 값으로 유지된다. 여기서, N_in-region이 임계값 이상이라는 것은 단말이 계속 학습 중이거나, 학습이 완료되었거나, 학습을 시도하였으나 실패한 통신 환경에 위치하고 있음을 의미한다. 따라서, 위치 정보의 획득의 주기를 조절함으로써 컴퓨팅 효율을 개선할 수 있다.
또한, 적어도 하나의 프로세서는 상기 선정 리스트에 포함된 하나 이상의 제4 항목에 연관된 상기 단말의 위치 샘플에 기반하여 상기 학습 리스트에 추가될 하나 이상의 제1 항목을 생성하거나 업데이트할 수 있다.
예를 들어, 적어도 하나의 프로세서는 복수의 위치 샘플들에 클러스터링 알고리즘을 적용하여 하나 이상의 위치 샘플 클러스터를 제공할 수 있다. 여기서, 클러스링 알고리즘은 밀도 기반의 클러스터링 알고리즘을 사용할 수 있으며, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), Mean-Shift Clustering 등이 있다.
한편, 학습 리스트는 상기 제1 항목 별 상태 정보를 포함할 수 있다. 상기 상태 정보는 획득 상태, 훈련 상태, 검증 상태, 적용 상태, 또는 잠금 상태 중 적어도 하나를 포함하고, 그리고, 적어도 하나의 프로세서는 상기 상태 정보에 기반하여 상기 제1 항목들을 관리할 수 있다.
예를 들어, 획득 상태의 경우, 상기 제1 항목에 대응되는 환경에서 적어도 하나의 프로세서는 훈련 데이터를 얻는다.
또한, 학습 상태는 획득 상태에서 얻은 훈련 데이터를 이용하여 상기 훈련 데이터를 얻은 제1 항목과 연관된 기계 학습 네트워크를 학습하는 상태를 의미한다. 학습 상태의 경우, 적어도 하나의 프로세서는 상기 학습 상태에서 얻은 훈련 데이터를 이용하여 상기 제1 항목에 연관된 기계 학습 네트워크의 업데이트를 수행한다.
또한, 검증 상태는 학습 상태에서 업데이트된 기계 학습 네트워크를 검증하는 상태를 의미한다. 검증 상태의 경우, 적어도 하나의 프로세서는 상기 학습 상태에서 업데이트된 기계 학습 네트워크의 성능을 검증한다.
또한, 적용 상태는 학습과 검증이 완료된 상태를 의미한다. 이때, 적어도 하나의 프로세서는 학습과 검증이 완료된 기계 학습 네트워크를 실사용환경에 적용한다.
또한, 잠금 상태는 학습 리스트의 제1 항목으로 선정되었으나, 학습 또는 검증에 실패한 상태를 의미한다. 잠금 상태의 제1 항목은 타이머에 의해 일정 시간 동안 또는 반영구적으로 학습 리스트에서 제외될 수 있다.
전술한 학습 리스트의 생성과 연관된 구체적인 설명은 이하의 도 17 내지 도 22를 참조하여 후술한다.
적어도 하나의 프로세서는 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻을 수 있다(S115).
전술한 바와 같이, 장소 정보는 학습이 완료된 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함할 수 있다.
여기서, 상기 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트는 단말이 상기 수집 영역에 진입하거나 위치하는 것이 감지되는 것을 의미한다.
전술한 바와 같이, 단말이 상기 수집 영역에 위치하는 경우, 단말은 수집 영역에서 연결된 기지국으로부터 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻을 수 있다.
여기서, 상기 훈련 데이터는 수신 관련 파라미터를 나타낸다. 일 예로, 상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함할 수 있다.
적어도 하나의 프로세서는 훈련 데이터를 이용하여 제1 기계 학습 네트워크를 업데이트할 수 있다(S120).
상기 기계 학습 네트워크의 각 레이어(layer)는 파라미터(예: 가중치)를 결정하기 위한 노드(node)를 포함한다. 은닉층(Hidden Layer)과 노드는 기계 학습 네트워크의 성능에 영향을 주지만, 그 수에 대한 정형적인 결정 방법은 없다. 일 례에서, 적어도 하나의 프로세서는 역전파(back propagation) 방법을 이용하여 기계 학습 네트워크의 출력값과 측정값의 오차를 최소화하도록, 노드와 노드 사이의 가중치 파라미터를 갱신할 수 있다. 상기 가중치의 학습 알고리즘으로는 경사 하강법(Gradient Descent), Levenberg-Marquardt 방법, Bayesian Regularization 방법 등이 이용된다.
업데이트는 상기 훈련 데이터에 기초하여 노드들 간의 가중치 및/또는 바이어스의 변경을 의미한다. 한편, 학습이 완료된 '제2 기계 학습 네트워크'는 '적응형 학습 모델'과 상호혼용될 수 있다.
적어도 하나의 프로세서는 상기 제1 기계 학습 네트워크의 학습이 성공 또는 실패를 확인할 수 있다(S125).
예를 들어, Training Error가 충분히 작아지지 않거나, Training Error와 Generalization Error(일명, Test Error)의 차이가 충분히 작아지지 않으면, 기계 학습 네트워크의 학습 결과를 실패로 분류한다.
적어도 하나의 프로세서는 상기 제1 기계 학습 네트워크의 학습이 성공되면(S125:YES), 실사용환경에서 성능을 검증할 수 있다(S130).
일 예로, 적어도 하나의 프로세서는 기계 학습 네트워크를 업데이트 전인 상기 제1 기계 학습 네트워크에 의해 측정된 제1 성능 지표와 업데이트 후인 제2 기계 학습 네트워크에 의해 측정된 제2 성능 지표를 비교하고, 상기 비교에 기초하여 상기 제1, 제2 기계 학습 네트워크 중 어느 하나를 선택할 수 있다.
다른 예로, 적어도 하나의 프로세서는 제1 기계 학습 네트워크가 업데이트되면, 업데이트 전인 제1 기계 학습 네트워크를 적용하여 측정되는 제1 성능 지표와 업데이트 후인 제2 기계 학습 네트워크를 적용하여 측정되는 제2 성능 지표를 비교하고, 상기 비교에 기초하여 상기 제1, 제2 기계 학습 네트워크 중 어느 하나를 선택할 수 있다.
또한, 적어도 하나의 프로세서는 상기 비교의 신뢰도(reliability)가 설정된 기준값 미만이면, 상기 제1, 제2 성능 지표를 다시 측정하여 비교할 수 있다.
적어도 하나의 프로세서는 상기 제1 기계 학습 네트워크의 학습이 실패하면(S125:NO), 상기 제1 기계 학습 네트워크에 관한 학습 실패 횟수를 증가할 수 있다.
적어도 하나의 프로세서는 학습 실패 횟수가 설정된 제1 최대 횟수(N_train-max-try)를 초과하면(S150:NO), 상기 제1 항목의 상태 정보를 잠금 상태로 전환할 수 있다(S160).
이때, 적어도 하나의 프로세서는 상기 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화할 수도 있다. 예를 들어, 적어도 하나의 프로세서는 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화함과 동시에 상기 제1 항목의 상태 정보를 잠금 상태로 전환하거나 설정할 수 있다.
적어도 하나의 프로세서는 학습 실패 횟수가 설정된 제1 최대 횟수 미만이면(S150:YES), 다시 훈련 데이터를 수집하고, 기계 학습 네트워크의 학습을 수행한다(S115, S120).
실사용환경에서의 성능이 검증되면(S135:YES), 적어도 하나의 프로세스는 제2 기계 학습 네트워크를 제1 항목의 적용 영역에서 적용할 수 있다(S140).
실사용환경에서의 성능이 검증되면, 제2 기계 학습 네트워크에 연관된 제1 항목의 상태 정보는 적용 상태로 천이된다. 적용 상태에서, 적어도 하나의 프로세서는 적용 상태인 제1 항목의 적용 영역으로 단말이 진입하면, 상기 적용 영역에 위치하는 동안 제2 기계 학습 네트워크를 통해 수신기를 제어할 수 있다.
적어도 하나의 프로세서는 상기 학습 리스트의 하나 이상의 제1 항목에 연관된 기지국에 연결되거나, 연결되어 있는 동안 주기적으로 단말의 위치를 확인할 수 있다.
이때, 단말의 위치 확인 주기는 단말의 이동 속도에 반비례하여 조정될 수 있다.
단말이 학습 리스트의 복수의 제1 항목들 중 어느 하나의 적용 영역에 진입한 것이 확인되면, 적어도 하나의 프로세서는 단말이 진입한 통신 환경에서 학습된 제2 기계 학습 네트워크를 적용하여 통신 서비스를 제공한다. 이후에, 단말이 적용 영역에서 이탈되면, 적어도 하나의 프로세서는 제2 기계 학습 네트워크의 적용을 중지한다. 적어도 하나의 프로세서는 제2 기계 학습 네트워크의 적용이 중지되면, 제1 기계 학습 네트워크를 적용하여 통신 서비스를 제공할 수 있다.
실사용환경에서 성능이 검증되지 않으면(S135:NO), 적어도 하나의 프로세스는 제2 기계 학습 네트워크에 관한 검증 실패 횟수를 증가할 수 있다.
적어도 하나의 프로세서는 검증 실패 횟수가 설정된 제2 최대 횟수(N_verify-max-try)를 초과하면(S155:NO), 상기 제1 항목의 상태 정보를 잠금 상태로 전환할 수 있다(S160).
적어도 하나의 프로세서는 검증 실패 횟수가 설정된 제2 최대 횟수 미만이면(S155:YES), 다시 훈련 데이터를 수집하고, 제1 기계 학습 네트워크의 학습을 수행한다(S115, S120).
한편, 적어도 하나의 프로세서는 제2 기계 학습 네트워크를 이용하여 통신 서비스를 제공하는 동안 제3 성능 지표를 측정하고, 제3 성능 지표와 검증 상태에서 측정된 제2 성능 지표를 비교하여 성능 저하 여부를 판단할 수 있다(S145). 만약, 제2 기계 학습 네트워크의 성능이 저하된 것으로 판단되면(S145:YES), 적어도 하나의 프로세서는 성능 저학 발생된 통신 환경에 대응되는 제1 항목의 적용을 중지하고, 다시 획득 상태로 천이할 수 있다(S115).
일 실시예에서, 성능 저하 여부의 판단은 설정된 타이머에 기초하여 수행될 수 있다. 본 명세서에서 성능 저하 여부와 관련된 타이머는 점검 타이머로 정의될 수 있다. 이 경우, 적어도 하나의 프로세서는 점검 타이머가 만료될 때마다 성능 저하 여부를 판단할 수 있다. 만약, 제2 기계 학습 네트워크의 성능이 저하되지 않은 것으로 판단되면(S145:NO), 적어도 하나의 프로세서는 점검 타이머를 초기화하여 다시 시작할 수 있다.
한편, 전술한 바와 같이, 적어도 하나의 프로세서는 학습 실패 횟수가 N_train-max-try를 초과하거나, 검증 실패 횟수가 N_verify-max-try를 초과하면 제1 항목의 상태 정보를 잠금으로 설정하는데(S160), 이처럼, 잠금 상태가 시작되는 것에 응답하여 잠금 해제 타이머가 시작된다.
적어도 하나의 프로세서는 잠금 해제 타이머가 만료되면(S165:YES), 해당 제1 항목을 학습 리스트에서 삭제하고, 다시 S110의 동작을 수행할 수 있다.
이하 명세서에서 도 15에서 설명한 동작들을 설명한다. 이하, 구체적인 설명에서 도 15와 중복되는 내용은 생략될 수 있으며, 추가되는 내용은 도 15와 의 동작들과 결합될 수 있다.
J.1. 훈련 데이터를 수집하기 위한 환경의 선정
도 16은 본 명세서의 일 실시예에 따른 통신 환경을 예시적으로 설명한다.
도 16을 참조하면, 통신 환경은 연결된 기지국 정보(예: Cell ID, 주파수 대역)와 장소 정보(예: 중심 위치, 반경)로 특정될 수 있다.
통신 환경은 각각의 기지국 또는 기지국 정보와 연관되어 설정될 수 있다. 예를 들어, ENV1A, ENV1B 는 제1 기지국(BS1)과 연관되어 설정되고, ENV2는 제2 기지국(BS2)과 연관되어 설정되고, ENV3A, ENV3B, ENV3C는 제3 기지국(BS3)과 연관되어 설정된다. 각각의 기지국들은 각각의 커버리지(예: CO1, CO2, CO3) 내에 하나 이상의 통신 환경을 포함할 수 있다.
한편, Cell ID와 주파수 대역이 동일하더라도 장소 정보에 따라 서로 다른 통신 환경이 존재할 수 있다(ENV1A, ENV1B 참고). 또한, 동일한 장소라도 Cell ID와 주파수 대역에 따라 2 이상의 서로 다른 통신 환경이 존재할 수 있다(ENV3A, ENV3B 참고).
장소는 2차원 또는 3차원으로 표현될 수 있다. 2 차원의 경우에는 장소는 위도와 경도로 나타낼 수 있고, 3차원의 경우에는 위도, 경도, 및 고도로 나타낼 수 있다. 또한, 장소는 건물의 층, WIFI AP(access point) ID 등의 추가적인 정보를 이용하여 구체화 및 세분화될 수 있다.
도 17 내지 도 24는 본 명세서의 일 실시예에 따른 학습 리스트 생성방법을 예시적으로 설명한다. 이하 명세서에서는 도 15에서 전술한 적어도 하나의 프로세서를 AP와 CP로 예시적으로 구분하여 설명하나, AP 및 CP에 의한 적어도 하나의 동작들은 기능적으로 결합된 하나의 프로세서에 의해 수행될 수도 있다.
CP는 일정한 주기로 기지국 정보와 연결 정보를 얻을 수 있다. 이때, 기지국 정보는 Cell ID와 주파수 대역을 포함하고, 연결 정보는 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)을 가질 수 있다.
CP는 설정된 주기동안 Cell ID 및 주파수 대역으로 구분되는 항목 별로 연결시간, primary cell로 연결된 시간, 및/또는 총 수신 데이터양을 측정할 수 있다.
CP는 AP로부터 각각의 연결 정보에 대응되는 가중치를 제공받고, 항목 별 측정된 연결 정보에 가중치를 적용하여 점수를 산출할 수 있다. 예를 들어, CP는 연결 정보에 가중치를 곱한 후 모두 합하여 점수를 산출할 수 있으며, 이는, 전술한 수학식 1과 같다.
이후에, CP는 산출된 점수에 기초하여 리스트를 정렬하고, 상위의 K개(K는 양의 정수)의 항목만을 선택하여 기지국 정보와 연결 정보를 AP로 전달할 수 있다. 여기서, K 값은 AP에 의해 제공된다.
이에 따라, AP는 CP로부터 수신된 기지국 정보와 연결 정보 중 적어도 하나에 기반하여 연결 리스트를 생성 및 관리할 수 있다. 이처럼, AP로 제공된 연결 정보는 연결 리스트로 추가되어, 이후에 학습 리스트의 생성 및 관리의 기반이 된다.
도 17을 참조하면, 연결 리스트는 기지국 정보와 연결 정보를 포함할 수 있다. 이때, 기지국 정보는 Cell ID와 주파수 대역을 포함하고, 연결 정보는 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)을 가질 수 있다.
다시 도 17을 참조하면, AP는 소정의 주기로 다음과 같이 학습이 필요한 후보 기지국을 선정할 수 있다. 하나 이상의 후보 기지국을 포함하는 리스트는 후보 리스트로 호칭될 수 있다. 여기서, 소정의 주기는 CP로부터 제공되는 연결 정보 보고 주기의 배수일 수 있다.
일 실시예에서, AP는 후보 기지국을 선정하기에 앞서 CP로부터 받은 연결 정보에 기반하여 연결 리스트를 생성 및 관리할 수 있다. AP는 상기 소정의 주기의 시작점에 연결 리스트를 초기화할 수 있다. 초기화된 리스트는 빈 리스트가 되거나, 특정 시점에 기록된 종래의 연결 리스트로 변경된다. AP는 CP로부터 연결 정보를 수신할 때마다 아래의 적어도 하나의 동작들을 수행할 수 있다.
실시예에서, AP는 수신된 기지국 정보(예: Cell ID, 주파수 대역)가 미리 저장된 연결 리스트에 존재하는지 여부를 비교하고, 비교 결과 수신된 기지국 정보의 적어도 일부 중 상기 미리 저장된 연결 리스트에 존재하지 않는 정보를 상기 미리 저장된 연결 리스트에 추가할 수 있다. 다시 말해, AP는 수신된 기지국 정보가 연결 리스트에 없으면 그 기지국 정보에 대응되는 항목을 연결 리스트에 추가할 수 있다.
또한, 실시예에서, AP는 각각의 기지국 정보에 대해 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)을 누적할 수 있다. 이처럼, 누적된 연결 정보들은 후보 리스트를 업데이트하는 과정에서 이용된다.
AP는 연결 리스트의 상기 소정의 주기의 종료 시점에 후보 리스트를 업데이트하기 위한 적어도 하나의 동작들을 수행할 수 있다.
실시예에서, AP는 연결 리스트의 기지국 정보가 후보 리스트에 없으면 이에 대응되는 항목을 추가하고 연결 정보를 초기화할 수 있다. 초기화된 항목은 빈 항목이 되거나, 특정 시점에 기록된 종래의 항목으로 변경된다.
실시예에서, AP는 후보 리스트의 각 항목 별로 연결 정보를 연결 리스트의 연결 정보에 기반하여 업데이트할 수 있다. 업데이트 시, 알파 트래킹(alpha-Tracking) 또는 무빙 에버리지(moving average)가 적용될 수 있으나, 이에 한정되는 것은 아니다.
도 18을 참조하면, AP는 각 항목 별 총 연결시간(T_tot), primary cell로 연결된 시간(T_pri), 및/또는 총 수신 데이터양(D_tot)과 각 항목 별로 제공된 가중치에 기초하여 학습 대상과 제외 대상을 선택할 수 있다. 예를 들어, 학습 대상은 상기 가중치에 기초하여 산출된 점수가 설정된 기준치를 초과하는 항목들을 나타낸다. 예를 들어, 도 18은 score_y, score_z를 갖는 항목들은 기준치 이하의 점수를 갖고, score_a, score_b, 쪋, score_x는 기준치를 촤가하는 점수를 갖는 경우를 예시한다. 이때, score_y, score_z를 갖는 항목들은 제외 대상으로 분류되고, 나머지 항목들은 학습 대상으로 분류될 수 있다.
여기서, 각 항목 별로 제공된 가중치는 상기 연결 리스트의 생성 및 관리 이전에 CP에서 사용되는 가중치와 같거나 다를 수 있다.
학습 대상으로 선정된 하나 이상의 항목은 선정 리스트로 업데이트될 수 있으나, 제외 대상으로 선택된 하나 이상의 항목은 후보 리스트에서 삭제된다.
도 19를 참조하면, AP는 후보 리스트가 업데이트될 때마다 선정 리스트를 업데이트하거나 관리하기 위하여 적어도 하나의 동작들을 수행할 수 있다.
실시예에서, AP는 후보 리스트의 하나 이상의 학습 대상이 선정 리스트에 없으면 이를 선정 리스트에 추가할 수 있다. 추가된 하나 이상의 학습 대상에는 각각 삭제와 연관된 파라미터(예: dropCount)가 매핑된다. 삭제와 연관된 파라미터의 값은 설정된 알고리즘에 따라 0으로 초기화되거나 1씩 증가될 수 있다. 한편, '삭제와 연관된 파라미터'는 '삭제 파라미터'와 상호 혼용될 수 있다.
예를 들어, 후보 리스트에서 선정된 학습 대상이 선정 리스트에 없으면 삭제 파라미터를 0으로 초기화한다. 다른 예를 들어, 후보 리스트에 선정된 학습 대상이 선정 리스트에 있으면 삭제 파라미터를 0으로 초기화한다. 또 다른 예를 들어, 학습 대상으로 선정되지 않은 선정 리스트의 항목은 삭제 파라미터를 1 증가시킨다.
보다 구체적으로, AP는 후보 리스트에서 선정된 학습 대상이 선정 리스트에 없으면, 선정된 학습 대상을 선정 리스트에 추가하고, 추가된 항목에 대응되는 삭제 파라미터를 0으로 초기화할 수 있다. 또한, AP는 추가된 항목 이외에 재차 학습 대상으로 선정된 하나 이상의 항목들에 대응되는 선정 리스트의 하나 이상의 항목의 삭제 파라미터를 0으로 초기화할 수 있다.
반면, AP는 새로 선정되거나, 재차 선정된 하나 이상의 학습 대상에 대응되지 않는 항목들의 삭제 파라미터를 1 증가시킬 수 있다. 다시 말해서, AP는 삭제 파라미터가 0으로 업데이트되지 않은 모든 항목들의 삭제 파라미터를 1씩 증가시킬 수 있다.
한편, 실시예에서, 삭제 파라미터가 임계값을 넘는 경우에 그 항목과 대응되는 학습 대상은 선정 리스트에서 삭제될 수 있다.
또한, 실시예에서, 선정 리스트에서 적어도 하나의 학습 대상의 삭제는 후술할 학습 리스트의 관리에도 영향을 미칠 수 있다. 구체적으로, 하나 이상의 학습 대상이 선정 리스트에서 삭제되면, 삭제된 학습 대상인 기지국과 연관된 학습 리스트의 각 항목들(즉, 학습 환경들)에 관한 취소 타이머(Cancel Timer)가 시작된다. 취소 타이머의 만료 기간이 0이면, 취소 타이머는 시작되지 않고 해당 학습 환경은 즉시 삭제된다. 반대로, 취소 타이머의 만료 기간이 0이 아니고 취소 타이머가 만료되기 이전에 학습 리스트에 포함된 학습 환경에 속하는 기지국이 다시 선정 리스트에 추가되면 취소 타이머는 중지된다. 또한, 취소 타이머의 만료 기간이 0이 아니나, 이후에 취소 타이머가 만료되면 이때 해당 학습 환경은 학습 리스트에서 삭제된다.
이처럼, 생성 및 관리된 선정 리스트는 훈련용 데이터의 수집을 위한 통신 환경의 선정의 기반이 된다.
이처럼, 본 명세서의 다양한 실시예는 단순히 연결 정보를 수집하고, 이에 따른 학습 대상인 환경을 특정하지 않고, 적어도 하나의 과정을 통해 선별된 리스트를 통해 학습 대상인 환경을 특정할 수 있다. 선정 리스트를 생성하기 이전의 적어도 하나의 과정은 본 명세서의 다양한 실시예에서 반드시 모두 수행되어야 하는 것은 아니며, 하드웨어의 속성에 기반하여 상기 연결 리스트의 생성 이전의 전처리 과정, 연결 리스트의 관리 과정, 후보 리스트의 관리 과정, 선정 리스트의 관리 과정 중 적어도 하나는 생략되거나 결합되어 수행될 수 있다. 예를 들어, 전처리 과정이 생략되는 경우, CP는 가중치에 따라 선택하지 않고 모든 연결 정보를 AP로 전달한다. 다른 예를 들어, 후보 리스트 관리 과정이 생략되면, 가중치에 따라 학습 대상인 기지국을 선별하지 않고, 연결 리스트와 선정 리스트를 비교하여 선정 리스트를 관리할 수 있다.
그리고, 도 20을 참조하면, 본 명세서의 다양한 실시예에서 AP 및/또는 CP 중 적어도 하나는 선정 리스트에 기초하여 학습 환경을 선정할 수 있다. 도 20은 선정 리스트에 포함된 기지국으로 제1 기지국(BSa), 제2 기지국(BSb), 및 제3 기지국(BSc)을 가정한다. 제1, 제2, 제3 기지국(BSa, BSb, BSc)은 각각 제1, 제2, 제3 커버리지(COa, COb, COc)를 가질 수 있다.
구체적으로, AP는 CP로 선정 리스트를 전송한다. CP는 선정 리스트에 기초하여 상기 선정 리스트에 포함된 적어도 하나의 기지국과 통신이 연결되거나 끊어질 때마다 AP로 연결 상태 보고를 전송할 수 있다. 한편, 선정 리스트에 포함된 적어도 하나의 항목에 연관된 기지국은 '선정 기지국'으로 호칭될 수 있다.
AP는 선정 기지국에 대해 위치 정보를 획득하여 메모리에 저장할 수 있다. 여기서, 단말의 위치 정보는 CP 또는 별도의 장치(예: GPS 등)에 의해 제공될 수 있다. 일 예로, AP는 다음과 같은 하나 이상의 동작들에 의해 위치 정보를 획득 및 저장할 수 있다.
실시예에서, AP는 기지국에 연결되거나 연결되어 있는 동안 주기적으로 위치를 얻을 수 있다. 예를 들어, 단말이 제3 커버리지(COc)에 진입하는 제1 이벤트(E1), 제1 커버리지(COa)에 진입하는 제3 이벤트(E3), 제2 커버리지(COb)에 진입하는 제5 이벤트(E5)에서 AP는 위치를 얻을 수 있다. 다른 예를 들어, 단말이 제1 내지 제3 커버리지(COa, COb, COc) 중 어느 하나에 연결되어 있는 동안 설정된 주기가 만료하는 제2, 제4, 그리고 제6 이벤트(E2, E4, E6)가 감지되면, 이때 위치를 얻을 수 있다.
실시예에서, AP는 획득한 위치가 학습 리스트의 적용 영역에 해당하는지 확인할 수 있다. 획득한 위치에 기반하여 단말의 위치가 학습 리스트에 포함된 적어도 하나의 학습 환경의 중심 위치로부터의 거리가 적용 반경(r_apply) 이내이면 적용 영역에 해당한다. 또한, 상기 중심 위치로부터의 거리가 학습 반경(r_training) 이내이면 학습 영역에 해당한다(도 23 참조).
한편, 학습 리스트에 기지국 정보가 동일한 항목이 적어도 2 이상인 경우에는 적용 반경이 큰 항목을 먼저 확인한다.
실시예에서, 획득한 위치가 학습 리스트에 포함된 적어도 하나의 학습 환경의 적용 영역에 해당하면, AP는 위치 정보를 저장하지 않는다. 이때, AP는 위치 정보를 저장하는 대신 적용 영역에 진입한 것을 나타내는 파라미터를 1 증가시킨다. 적용 영역에 진입한 것을 나타내는 파라미터는 'In-region 파라미터(N_in-region)'로 호칭될 수 있다. In-region 파라미터가 설정된 기준값(N_extend-period) 이상이면, AP는 단말의 위치 획득 주기를 증가시킬 수 있다. 여기서, N_extend-period는 주기 연장 파라미터로 지칭될 수 있다.
이때, 증가되는 주기는 가능한 하나 이상의 주기 중 현재 주기보다 큰 값들을 선별하고, 선별된 큰 값들 중 가장 작은 값으로 선택될 수 있다. 만약, 현재 주기가 가능한 하나 이상의 주기 중 가장 큰 값이라면, AP는 현재 주기를 유지한다. 한편, AP는 획득한 위치가 학습 리스트의 적용 영역에 해당하지 않으면 위치 정보를 저장하고 상기 위치에 연관된 위치 획득 주기를 가능한 하나 이상의 주기 중 가장 작은 값으로 설정한다.
도 21을 참조하면, 이와 같이 획득된 복수의 위치 정보들은 학습 환경의 선정을 위한 요소로서 이용된다. 학습 환경은 획득된 복수의 위치 정보들 또는 위치 정보들로부터 샘플링된 위치 샘플들에 기반한 클러스터링을 통해 제공된다. 예를 들어, 단말은 제1 내지 제3 커버리지(COa, COb, COc)를 경유하며 이동하며 복수의 위치 정보를 수집할 수 있다. 이때, 위치 정보는 소정의 장소에 밀집되어 수집될 수 있다. 이처럼, 소정의 장소에 밀집되어 수집되는 이유는 사용자의 이동 루틴에 따라 특정 장소에 자주 머무르기 때문이다. 사용자가 자주 머무르는 장소에서는 소정의 주기가 만료될 때마다 위치 정보가 수집되고, 특정 장소에서 밀집된 위치 정보가 수집되는 결과가 도출될 수 있다.
도 22를 참조하면, 실시예에서 AP는 복수의 위치 정보들 또는 위치 샘플들의 수(n_point)가 학습 장소 선정에 필요한 최소 개수(N_clustering-point) 이상이면 클러스터링을 수행하고, 그 결과 생성된 하나 이상의 클러스터의 중심 위치, 학습 반경, 적용 반경을 결정할 수 있다. 예를 들어, 도 22는 적어도 하나의 클러스터를 점선의 원 또는 타원으로 나타내고, 중심 위치를 깃발로 나타낸다.
또한, 실시예에서, AP는 생성된 하나 이상의 클러스터에 포함된 위치 정보 또는 위치 샘플의 수(n_cluster-point)가 설정된 기준값(N_min-point) 이상인 클러스터만을 대상으로 중심 위치, 학습 반경, 적용 반경을 결정할 수도 있다.
다양한 실시예에서, AP는 클러스터링 알고리즘을 이용하여 복수의 위치 정보들 또는 위치 샘플들을 하나 이상의 위치군으로 분류할 수 있다. 클러스터링 알고리즘은 밀도 기반의 클러스터링 알고리즘이 사용될 수 있으나, 이에 한정되는 것은 아니다. 여기서, 클러스터링 알고리즘은, 예를 들어, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), Mean-Shift Clustering를 포함하나, 이에 한정되는 것은 아니다.
다양한 실시예에서, AP는 소정의 기법으로 하나 이상의 클러스터 각각의 중심 위치를 산출할 수 있다. 예를 들어, 중심 위치는 하나 이상의 위치 정보들 또는 위치 샘플들의 경도, 위도의 평균값으로 산출되거나 k-Nearest Neighbor 알고리즘을 적용하여 산출될 수 있다.
도 24를 참조하면, 다양한 실시예에서, AP는 클러스터의 중심 위치로부터 상기 클러스터의 위치 정보들 또는 위치 샘플들까지의 거리값들을 확인하고, 확인된 거리값들에 기반하여 학습 반경(r_train)을 결정할 수 있다. 예를 들어, 학습 반경은 아래의 수학식 2에 기반하여 산출될 수 있다.
Figure PCTKR2020006661-appb-M000002
수학식 2에서, r_train은 학습 반경, r_train-min은 학습 반경의 최소값, r_train-max는 학습 반경의 최대값, α는 0보다 큰 실수를 나타낸다. 예를 들어, α는 3~4의 값이 적용될 수 있다.
다양한 실시예에서, AP는 학습 반경으로부터 학습이 완료된 기계 핫급 네트워크를 적용하기 위한 적용 반경(r_apply)을 결정한다. 적용 반경은 위치 측정의 오차에 기반하여 결정될 수 있다. 바람직하게는, 적용 반경은 위치 측정의 오차가 클수록 더 작아진다. 예를 들어, 적용 반경은 아래의 수학식 3에 기반하여 산출될 수 있다.
Figure PCTKR2020006661-appb-M000003
수학식 3에서, r_apply는 학습 반경, β는 0보다 크고 1이하인 실수를 나타낸다.
다양한 실시예에서 AP는 기지국의 메모리에 저장된 하나 이상의 위치 정보 또는 위치 샘플들 중 하나 이상의 클러스터에 속한 것들을 모두 삭제한다. 이때, 삭제되지 않은 나머지 위치 정보들 또는 위치 샘플들은 새로 추가되는 위치 정보들 또는 위치 샘플들과 함께 새로운 학습 환경 선정에 이용될 수 있다.
실시예에서, AP는 결정된 중심 위치와 학습 반경을 기지국 정보와 함꼐 학습 리스트에 추가할 수 있다. 이때, 추가된 항목은 획득 상태로 초기화된다.
다양한 실시예에서, AP 또는 CP 중 적어도 하나는 학습 리스트의 각 항목 의 상태를 관리하며, 항목의 상태 정보에 기반하여 이에 연관된 과정을 수행한다.
상태 정보들은 아래의 정보들 중 적어도 하나를 포함할 수 있다.
- 획득(Acquiring): 학습용 데이터를 획득한다.
- 학습(Training): 기본 모델을 기반으로 획득한 학습용 데이터를 이용하여 추가 학습을 수행한다. 기본 모델은 온-디바이스 학습이 수행되기 이전의 기계 학습 네트워크를 의미한다.
- 검증(Verifying): 실사용 환경에서 학습이 완료된 모델의 성능을 검증한다. 실사용 환경은 온-디바이스 학습이 수행된 기계 학습 네트워크의 학습 환경과 연관된 상기 학습 환경에서 생성된 기계 학습 네트워크가 적용될 환경을 의미한다. 또한, 실사용 환경에서 학습이 완료된 모델은 적응형 기계 학습 네트워크로 지칭될 수 있다.
- 적용(Applying): 학습과 검증이 완료된 모델을 실사용 환경에 적용한다.
- 잠금(Barred): 학습 환경으로 선정되었으나 학습 또는 검증에 실패한 상태로, 설정된 타이머에 의해 일정 시간 동안 또는 반영구적으로 후보 리스트로부터 선정되는 학습 대상에서 제외된다.
이하, 명세서에서 학습 상태 내지 잠금 상태에 기반한 다양한 실시예들을 후술한다.
J.2. 트레이닝 데이터의 수집
도 25 및 도 26은 본 명세서의 일 실시예에 따른 훈련 데이터 수집방법을 예시적으로 설명한다.
도 25를 참조하면, AP(130a) 및 CP(130b) 중 적어도 하나는 학습 리스트의 적어도 하나의 항목들의 상태 정보를 확인하고, 획득 상태인 학습 리스트의 각 항목에 대하여 후술할 적어도 하나의 동작들을 수행함으로써 학습용 데이터를 수집할 수 있다.
우선, AP(130a)는 학습 리스트의 상태 정보를 확인하여 CP(130b)로 획득 상태인 학습 환경을 전송할 수 있다. 이때, AP(130a)는 전송되는 학습 환경에 포함된 하나 이상의 기지국 리스트를 함께 전송할 수도 있다.
CP(130b)는 수신된 학습 환경의 기지국에 연결되거나 끊어질 때마다 AP(130a)로 보고할 수 있다.
실시예에서, AP(130a)는 학습 환경에 속한 하나 이상의 기지국에 연결되거나 연결되어있는 동안 주기적으로 단말의 위치 정보를 얻을 수 있다. 단말의 위치 정보는 CP(130b) 또는 별도의 장치(예: GPS)에 의해 제공된다. 여기서, 위치 정보는 학습 환경을 결정하기 위한 이전의 위치 샘플과 달리 단말이 기계 학습 네트워크의 훈련을 위한 데이터를 수집할 수 있는 학습 환경의 학습 반경 내에 위치하는 지 여부를 확인하기 위한 것이다.
실시예에서, 수집된 위치 정보에 기반하여 AP(130a)는 단말의 위치가 학습 환경의 중심 위치로부터 학습 반경 내로 진입하는 것을 확인할 수 있다.
실시예에서, 단말이 학습 환경의 학습 반경 내로 진입하는 이벤트가 감지되면, AP(130a)는 CP(130b)로 학습용 데이터의 수집을 요청한다. CP(130b)는 이러한 요청이 수신되면, 연결된 기지국으로 학습용 데이터의 전송을 요청하고, 이후에 수신되는 수신기의 수신 관련 학습용 데이터들을 수집할 수 있다. 예를 들어, 상기 학습용 데이터는 수신 관련 파라미터를 포함할 수 있다. 수신 관련 파라미터는 수신된 신호와 관련된 정보들을 포함한다. 즉, 상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함할 수 있다.
실시예에서, CP(130b)는 기지국으로부터 학습용 데이터를 수신하면, 수신된 신호와 관련된 정보를 AP(130a)로 전송할 수 있다. 이때, CP(130b)는 기지국으로부터 수신된 신호와 관련된 정보를 모아 학습용 데이터 샘플을 구성하고, 학습용 데이터 샘플을 AP(130a)로 전송할 수 있다. 또한, CP(130b)는 축적된 2 이상의 학습용 데이터 샘플을 한번에 AP(130a)로 전송할 수도 있다.
실시예에서, AP(130a)는 CP(130b)로부터 제공된 학습용 데이터 샘플을 비휘발성 메모리(120) 또는 스토리지에 저장할 수 있다.
실시예에서, AP(130a)는 단말이 학습 대상인 환경에서 이탈한 것이 감지되면, CP(130b)로 학습용 데이터 수집의 중지를 요청할 수 있다. 이때, 학습 환경에서 이탈함은 학습 환경의 중심 위치로부터 학습 반경 외로 이탈한 것을 의미한다.
실시예에서, AP(130a)는 충분한 수의 학습용 데이터가 수집되면 CP(130b)로 해당 학습 환경에 관한 이후의 추가적인 학습용 데이터의 수집의 중지를 요청한다. 이처럼, 충분한 데이터가 수집되어 학습용 데이터의 수집을 중지하는 경우, AP(130a)는 수집 중지의 대상인 학습 환경의 상태를 획득 상태에서 학습 상태로 변경할 수 있다.
도 26은 트레이닝 데이터의 수집 과정을 예시적으로 설명한다.
도 26을 참조하면, 단말은 제1 기지국(BSa)의 커버리지 내를 경유할 수 있다. 이때, 단말은 제1 기지국(BSa)의 커버리지 내에 위치한 학습 환경(ENVX)을 경유할 수 있다. 특히, 도 26은 단말이 학습 영역과 적용 영역을 모두 지나치는 경우로 전제하여 설명한다.
단말은 제1 기지국(BSa)의 커버리지 내로 진입하는 제1 이벤트가 발생하면, 제1 기지국(BSa)와 연결되고, 단말은 위치 정보를 얻을 수 있다.
단말은 제1 기지국(BSa)의 커버리지 내에서의 위치를 모니터링하던 중 학습 환경(ENVX)의 학습 반경 내로 진입하는 제2 이벤트(EEE2)가 감지되면 기지국으로부터 학습용 데이터를 얻을 수 있다. 이후에, 단말이 학습 반경 외로 이탈하는 제5 이벤트(EEE5)가 감지되면 단말은 학습용 데이터의 수집을 중지한다.
단말이 제1 기지국(BSa)의 커버리지 외로 이탈하는 제6 이벤트가 발생하면 단말은 위치 정보를 수집한다.
한편, 단말이 적용 영역 내부로 진입하거나 이탈하는 제3, 제4 이벤트(EEE3, EEE4)가 감지되는 경우, AP(103a)는 학습 리스트를 확인하여 획득 상태인 하나 이상의 항목이라면 학습용 데이터를 획득하고, 적용 상태라면 학습된 기계 학습 네트워크를 적용할 수 있다.
J.3. 적응형 기계 학습 네트워크의 학습, 적용, 및 검증
J.3.1. 학습 과정
도 27은 본 명세서의 일 실시예에 따른 기계 학습 네트워크 업데이트 방법을 예시적으로 설명한다.
도 27을 참조하면, 본 명세서의 다양한 실시예에서, AP 및 CP 중 적어도 하나는 학습 상태인 학습 리스트의 하나 이상의 항목에 대하여 기본 모델에 대하여 이하 적어도 하나의 동작들을 통해 온-디바이스 학습을 수행한다. 전술한 바와 같이, AP 및/또는 CP에 의한 동작들은 적어도 하나의 프로세서(130)에 의한 동작들로 상호혼용될 수 있다.
기본 모델은 전술한 바와 같이, 클라이언트 디바이스에 의한 온-디바이스 학습이 수행되지 않은 기계 학습 네트워크를 의미한다.
학습 리스트의 하나 이상의 항목의 학습 상태는 세부적으로 학습 진행 상태, 학습 가능 상태, 학습 불가능 상태를 포함할 수 있다.
학습 진행 상태는 학습이 진행 중인 기계 학습 네트워크의 하나 이상의 시점 별로 기록된 학습 상황을 의미한다.
학습 가능 상태는 기계 학습 네트워크가 클라이언트 디바이스에 의해 학습될 수 있는 상태를 의미한다. 예를 들어, 단말이 충전 장치에 의해 전력을 제공받고 있는 충전 상황이거나, 미리 설정된 시간(예: 오전 00시부터 오전 05시 사이)이 학습 가능 상태로 설정될 수 있다. 이때, 설정된 시간은 사용자에 의해 조정될 수 있다.
학습 불가능 상태는 기계 학습 네트워크가 클라이언트 디바이스에 의해 학습될 수 없는 상태를 의미한다.
우선, AP는 학습 상태인 항목의 학습 진행 상태를 초기화할 수 있다. 여기서, 초기화는 학습 진행 상태의 기록을 시작하기 위한 시작점을 설정하는 것을 의미한다. 이후에, 학습이 진행되는 중인 하나 이상의 항목에 대해서는 학습 진행 상태를 초기화하지 않으며, 이전의 학습 진행 상태로부터 이어서 새로운 학습이 진행된다.
AP는 단말이 학습 가능 상태가 되면 학습을 수행할 수 있다. 이전에 미리 진행된 학습이 있는 경우, 현 시점의 학습 가능 상태 이전까지 수행된 학습의 학습 진행 상태로부터 연속하여 학습을 수행할 수 있다.
AP는 학습을 수행하는 미리 설정된 시점마다 학습 중인 기계 학습 네트워크와 학습 중인 기계 학습 네트워크의 학습 진행 상태를 비휘발성 메모리(120) 또는 스토리지에 저장한다. AP는 예기치 못한 상황으로 학습이 중단되더라도 시스템이 정상화된 후 저장된 학습 진행 상태에 기반하여 학습을 이어서 수행할 수 있다. 예를 들어, AP는 Stochastic Gradient Descent (SGD)와 같이 반복적인 업데이트에 기반한 알고리즘인 경우에, 미리 설정된 횟수의 반복 작업이 완료될 때마다 진행 상태를 저장할 수 있다.
한편, AP는 단말이 학습 불가능한 상태가 되면 기계 학습 네트워크에 대한 학습을 중단하고 최종 학습 진행 상태를 비휘발성 메모리(120) 또는 스토리지에 저장할 수 있다. 여기서, 학습 불가능한 상태가 되는 이벤트는 전술한 학습 가능 상태가 아니게 되는 모든 이벤트를 의미한다. 예를 들어, 단말이 충전 장치로부터 분리 또는 이격되거나, 미리 설정된 학습 가능한 시간 범위에 속하지 않게 되는 이벤트가 발생하면, 단말은 학습 불가능 상태로 분류된다.
AP는 학습이 완료될 때까지 전술한 J.3.1.의 과정들을 적어도 1회 이상 반복한다. 학습이 성공적으로 완료되면, AP는 메모리(120)에 저장된 학습용 데이터를 버리고, 학습이 완료된 기계 학습 네트워크를 메모리(120)에 저장한다. 또한, AP는 학습이 완료되면, 학습이 완료된 기계 학습 네트워크에 대응되거나 관련된 학습 환경의 상태를 검증 상태로 변경할 수 있다.
AP는 학습이 실패하면, 학습 실패 파라미터를 1 증가할 수 있다. 학습 실패 파라미터는 학습이 실패한 횟수로 정의된다. 학습의 실패는 AP에 의한 기계 학습 네트워크의 학습 과정에 잇어서, 트레이닝 에러(Training Error)가 충분히 작아지지 않거나, 트레이닝 에러와 테스트 에러(Test Error, 또는 Generalization Error)의 차이가 충분히 작아지지 않는 경우를 의미하나, 이에 한정되는 것은 아니다.
학습 실패 파라미터가 미리 설정된 임계치(N_train-max-try) 이상이 되는 이벤트가 발생하면, AP는 발생된 이벤트와 연관되거나 대응되는 학습된 기계 학습 네트워크와 연관되거나 대응되는 학습용 데이터를 메모리(120)에서 삭제하고, 발생된 이벤트에 대응되는 학습 환경의 상태 정보를 잠금 상태로 설정한다.
대조적으로, 실패 파라미터가 상기 미리 설정된 임계치(N_train-max-try) 미만이면, AP는 학습용 데이터를 추가적으로 획득한 이후에 재차 학습을 수행한다.
한편, 이처럼 학습이 완료된 기계 학습 네트워크라 하더라도 실사용 환경에서 학습되지 않은 기계 학습 네트워크에 비하여 더 낮은 성능을 나타낼 수 있다. 따라서, 실사용 환경에서 학습의 전/후 기계 학습 네트워크를 검증할 필요가 있다. 이에 따라, 이하에서 검증 과정을 설명한다.
J.3.2. 검증 과정
도 28 및 도 29는 본 명세서의 일 실시예에 따른 기계 학습 네트워크의 검증방법을 예시적으로 설명한다.
AP 및 CP 중 적어도 하나는 학습 리스트의 하나 이상이 항목을 확인하여, 검증 상태인 항목에 대하여 실사용 환경에서의 학습 전/후 기계 학습 네트워크의 성능 비교를 수행할 수 있다.
비교 결과, 새로운 기계 학습 네트워크의 성능이 더 개선된 것으로 결정되면 AP는 새로 학습된 기계 학습 네트워크를 적용하여 수신기를 제어할 수 있다. 반대로 학습 전 기계 학습 네트워크의 성능이 더 나은 것으로 결정되면 AP는 기존의 기계 학습 네트워크를 적용하여 수신기를 제어할 수 있다.
여기서, 성능은 Block Error Rate(BLER), Packet Error Rate(PER), Symbol Error Rate(SER), 또는 Bit Error Rate(BER) 등 무선 링크의 성능 측정 기준을 이용하여 비교할 수 있다.
본 명세서의 다양한 실시예에서 이용되는 성능 비교 기법은 제1 검증 기법 또는 제2 검증 기법 중 적어도 하나에 의해 수행될 수 있으나, 이에 한정되는 것은 아니다.
일 실시예에 따르면, 제1 검증 기법에서 AP는 기계 학습 네트워크의 학습이 완료되기 이전까지 학습 전 기계 학습 네트워크를 적용하여 수신 성능을 측정하고, 학습이 완료되면 새로운 기계 학습 네트워크를 적용하여 수신 성능을 측정한다.
도 28을 참조하면, AP는 P1a 구간동안에 학습 전 기계 학습 네트워크를 적용하여 통신할 수 있다(S210). 상기 S210과 같이, 학습 전 기계 학습 네트워크를 적용하여 통신하는 동안 AP는 P1a_1 구간동안 기계 학습 네트워크의 학습을 위한 학습용 데이터를 얻을 수 있다(S220). 또한, AP는 학습용 데이터가 충분히 수집되면 수집된 데이터들을 이용하여 P1a_2 구간동안 기계 학습 네트워크를 훈련할 수 있다(S240). 한편, AP는 P1a의 적어도 일부인 P1a_3 구간에서 성능 측정을 위한 데이터를 수집할 수 있다. 여기서, 수집되는 데이터는 학습 전 기계 학습 데이터의 성능을 나타낸다.
만약 기계 학습 네트워크의 학습이 완료더라도 성능 비교를 위한 충분한 성능 정보가 측정되지 않았다면, 새로운 기계 학습 네트워크를 적용하는 경우의 수신 성능 측정의 시작점은 기존의 기계 학습 네트워크의 성능 측정이 완료되는 시점까지 지연될 수 있다.
P1a 구간 이후에 AP는 P3a 구간동안 학습된 기계 학습 네트워크를 수신기에 적용할 수 있다(S250). AP는 P3a 구간의 적어도 일부동안 학습된 기계 학습 네트워크의 성능을 측정하기 위한 데이터를 수집할 수 있다(S260).
제1 검증 기법에서 AP는 학습 후 기계 학습 네트워크의 성능 측정이 완료되면, 학습 전 기계 학습 네트워크의 성능과 비교할 수 있다. 그리고, 비교 결과에 기반하여 학습 전후의 기계 학습 네트워크 중 어느 하나를 선택하여 수신기에 적용할 수 있다(S270).
예를 들어, CP는 학습용 데이터의 수집을 수행하는 기간동안에 주기적으로 또는 일정 양 이상의 데이터가 수신될 때마다 학습 전 기계 학습 네트워크의 성능을 측정하여 AP로 전달할 수 있다.
학습 전 기계 학습 네트워크에 관련된 측정된 성능 정보가 충분히 획득된 이후에, 온-디바이스 학습이 완료되어 새로운 기계 학습 네트워크의 적용이 준비된 상태에서 학습의 대상이었던 학습 환경에 진입하면 AP는 CP로 새로운 기계 학습 네트워크의 적용을 요청한다.
CP는 새로운 기계 학습 네트워크 적용 요청에 응답하여 새로운 기계 학습 네트워크를 적용하여 데이터 수신을 제어하고, 주기적으로 또는 일정 양 이상의 데이터가 수신될 때마다 새로운 기계 학습 네트워크에 의한 성능을 측정하여 AP로 전달한다.
AP는 새로운 기계 학습 네트워크에 의한 성능 데이터가 충분히 모이면 학습 전 기계 학습 네트워크에 의한 성능 데이터와 비교할 수 있다.
이때, AP는 새로운 기계 학습 네트워크의 성능이 더 개선된 것으로 판단되면, 성능 측정을 중지하고 해당 항목의 상태 정보를 적용 상태로 변경한다. 또한, AP는 상태 정보를 적용 상태로 변경함과 동시에 학습 전후의 기계 학습 네트워크의 성능 데이터를 모두 메모리에 저장할 수 있다. 이처럼, 저장된 성능 데이터들은 시간적으로 이후에 발생할 수 있는 기계 학습 네트워크의 성능 저하를 점검할 때 이용될 수 있다.
반대로, AP는 기존의 기계 학습 네트워크의 성능이 더 나은 것으로 판단되면, 검증 실패 파라미터를 1 증가한다. 검증 실패 파라미터는 검증의 실패 횟수를 의미한다. 검증 실패 파라미터가 미리 설정된 임계치(N_veryfiy-max-try) 이상이면, AP는 학습용 데이터와 학습된 기계 학습 네트워크를 메모리에서 제거한다. 또한, AP는 제거와 동시에 학습된 기계 학습 네트워크에 대응되는 학습 리스트의 항목을 잠금 상태로 변경할 수도 있다. 만약 검증 실패 파라미터가 미리 설정된 임게치(N_verify-max-try) 미만이면, 학습용 데이터를 다시 획득한 이후에 온-디바이스 학습 및 검증 과정을 다시 수행할 수 있다.
다른 실시예에 따르면, 제2 검증 기법에서 AP는 기계 학습 네트워크의 학습이 완료된 시점부터, 학습 전 기계 학습 네트워크와 학습 후 기계 학습 네트워크를 설정된 시간 간격동안 번갈아 적용하며 성능을 측정 및 비교한다.
도 29를 참조하면, AP는 P1b 구간동안에 학습 전 기계 학습 네트워크를 적용하여 통신할 수 있다(S310). 상기 S310과 같이, 학습 전 기계 학습 네트워크를 적용하여 통신하는 동안 AP는 P1b_1 구간동안 기계 학습 네트워크의 학습을 위한 학습용 데이터를 얻을 수 있다(S320). 또한, AP는 학습용 데이터가 충분히 수집되면 수집된 데이터들을 이용하여 P1b_2 구간동안 기계 학습 네트워크를 훈련할 수 있다(S330).
이후에, AP는 설정된 시간 간격동안 학습 전후의 기계 학습 네트워크의 성능의 측정 및 비교를 수차례 반복하여 수행할 수 있다(S340). 예를 들어, 제1 내지 제K 성능 비교(K는 양의 정수)가 학습 전후의 기계 학습 네트워크를 적용 및 비교하며 수행될 수 있다(S350_1, 쪋, S350_K). 이때, 성능 비교를 위한 기계 학습 네트워크의 적용 주기의 길이인 P3b_1 값과 P3b_2 값은 서로 동일할 수 있다. 또한, 수차례 반복 수행되는 성능 비교 구간의 길이(P2b_1, 쪋, P2b_K)는 모두 동일하게 설정될 수 있다.
성능 비교가 완료되면 학습 전후의 기계 학습 네트워크 중 어느 하나를 선택하여 수신기에 적용할 수 있다(S360).
예를 들어, AP는 학습 전 기계 학습 네트워크와 학습 후 기계 학습 네트워크의 성능 데이터를 측정하여 누적할 수 있다. AP는 CP로 학습 전후의 기계 학습 네트워크를 수신기에 적용하고, 성능을 측정할 것을 순차적으로 요청한다. 성능 측정의 요청 시 AP는 측정 기간 또는 측정을 수행하는 동안 수신이 필요한 데이터의 양 중 적어도 하나를 포함하는 제어 정보를 함께 전달할 수 있다. CP는 AP가 요청한 기계 학습 네트워크를 적용하여 요청된 기간동안 요청된 데이터가 수신되는 동안의 성능을 측정하여 AP로 전달할 수 있다.
AP는 학습 전후 기계 학습 네트워크의 성능 측정이 완료될 때마다 통계적 가설 검증을 통해 새로운 기계 학습 네트워크의 성능이 학습 전 기계 학습 네트워크보다 개선된 것인지 판단할 수 있다.
이때, AP는 판단 결과의 신뢰도가 미리 설정된 신뢰도(reliability)를 만족하는 것과 동시에 새로운 기계 학습 네트워크의 성능이 개선되면, 성능 비교 과정을 중지하고 새로운 기계 학습 네트워크를 수신기에 적용한다. 또한, AP는 판단 결과의 신뢰도가 미리 설정된 신뢰도를 만족하는 것과 동시에 학습 전 기계 학습 네트워크의 성능이 더 나은 것으로 판단되면, 성능 비교 과정을 중지하고 기존의 기계 학습 네트워크를 수신기에 적용한다.
다만, AP는 판단 결과의 신뢰도가 미리 설정된 신뢰도를 만족하지 못하는 경우, 검증 시간의 초과 여부를 확인한다. 이때, 허용된 성능 검증 시간을 초과하지 않았을 경우, AP는 다시 성능 데이터를 획득 및 누적하여 검증을 수행한다. 대조적으로, 허용된 성능 검증 시간을 초과한 경우, AP는 성능 비교 절차를 중지하고 학습 전 기계 학습 네트워크를 이용한다.
한편, 일부 실시예에서, AP는 성능 데이터의 획득 및 누적 이전에, 학습 전 기계 학습 네트워크와 학습 후 기계 학습 네트워크에 연관되어 측정된 성능 데이터를 초기화할 수도 있다.
J.3.3. 적용 과정
도 30 내지 도32는 본 명세서의 일 실시예에 따른 기계 학습 네트워크의 적용방법을 예시적으로 설명한다.
도 30을 참조하면, AP(130a) 및 CP(130b) 중 적어도 하나는 학습 리스트의 하나 이상이 항목을 확인하여, 적용 상태인 항목이면 학습된 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다. 이러한 적용 과정은 CP(130b)가 AP(130a)에 의하지 않고 직접 위치 정보를 획득할 수 없는 경우와, CP(130b)가 직접 위치 정보를 획득할 수 있는 경우로 구분될 수 있다.
우선, CP(130b)가 AP(130a)에 의하지 않고 직접 위치 정보를 획득할 수 없는 경우를 설명한다.
AP(130a)는 CP(130b)로 적용 상태인 학습 환경의 기지국 리스트(BS List)를 전송할 수 있다. 여기서, 학습 환경의 기지국 리스트는 학습 환경의 적용 반경 내부에 위치하는 하나 이상의 기지국 정보를 포함하는 리스트를 의미한다. 또한, 학습 환경의 기지국 리스트에 포함되는 하나 이상의 기지국은 학습 환경의 선정과 연관된 기지국으로 한정될 수 있다. 이에 따라, 학습된 기계 학습 네트워크(ML model)와 연관성이 적은 학습 환경의 선정과 무관한 기지국은 적용 대상에서 제외될 수 있다.
CP(130b)는 학습된 기계 학습 네트워크의 적용 대상인 기지국에 연결되거나 끊어질 때마다 AP(130a)로 통보할 수 있다.
AP(130a)는 적용 대상인 기지국에 연결되거나, 그 기지국에 연결되어 있는 동안 주기적으로 단말의 위치 정보를 획득할 수 있다. 여기서 위치 정보의 본 명세서의 다양한 실시예에서 전술한 위치 정보 획득 방법과 결합되어 수행될 수 있다. 다만, 일 실시예에서, 적용 과정의 경우, 위치 정보의 획득 주기는 단말의 이동 속도에 반비례하여 조절될 수 있다.
획득된 위치 정보에 기반하여 단말이 적용 대상 환경의 적용 반경 내부로 진입하는 이벤트가 감지되면, AP(130a)는 CP(130b)로 상기 이벤트가 감지된 환경에서 학습된 기계 학습 네트워크를 전달할 수 있다. 그리고, AP(130a)는 전달된 기계 학습 네트워크의 적용을 요청할 수 있다. 이때, 기계 학습 네트워크의 적용 요청은 전달 동작과 동시에 수행될 수 있다.
CP(130b)는 AP(130a)로부터 요청된 기계 학습 네트워크가 존재하고, 그 기계 학습 네트워크에 연관된 기지국 정보가 현재 단말과 연결된 기지국 정보와 일치하면 요청된 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다. 만약, 기지국 정보들이 일치하지 않으면, CP(130b)는 학습 전 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다.
AP(130a)는 획득된 위치 정보에 기반하여 단말이 적용 반경 이외로 이탈하면 CP(130b)로 해당 적용 반경에 대응되는 학습 환경과 연관된 기계 학습 네트워크의 적용 중지를 요청할 수 있다. 이때, CP(130b)는 적용 중지의 요청을 수신하면 학습 전 기계 학습 네트워크를 적용하여 통신을 수행할 수 있다.
한편, 다양한 실시예에서, AP(130a)는 2 이상의 적용 대상인 환경이 서로 인접하여 단말이 제1 적용 대상 환경에서 제2 적용 대상 환경으로 연속하여 이동하는 경우에는, 제1 적용 대상 환경과 연관된 제1 기계 학습 네트워크에서 수행하던 중 제2 적용 대상 환경에 진입함과 동시에 제2 적용 대상 환경과 연관된 제2 기계 학습 네트워크로 전환하여 통신하도록 제어할 수 있다.
다음으로, CP(130b)가 직접 위치 정보를 획득할 수 있는 경우를 설명한다.
도 31을 참조하면, CP(130b)는 최대 N_apply-model 개의 학습된 적용 모델 리스트(L2)를 만들어 관리할 수 있다. 여기서, N_apply-model은 1 이상의 양의 정수이다.
AP(130a)는 CP(130b)로 적용 상태인 학습 환경의 리스트를 전달한다. 이때, AP(130a)는 기지국 정보와 장소 정보 중 적어도 하나를 상기 학습 환경의 리스트와 함께 전달할 수 있다. 이때, AP(130a)는 변경 사항이 있을 때마다 변경된 정보를 전달하거나 전체 적용 상태인 학습 환경의 리스트를 다시 전달한다.
도 32를 참조하면, CP(130b)는 주기적으로 단말의 위치 정보를 획득하여 단말의 현재 위치와 적용 대상 환경들과의 거리, 단말의 이동 속도와 방향에 따라 설정된 시간 내에 진입할 가능성이 있는 적용 대상 환경들을 선정할 수 있다. 도 32의 (a)를 참조하면, 적어도 하나의 프로세서는 입력 데이터에 가중치를 적용하여 적어도 하나의 후보 환경(candidates)에 대한 점수를 산출할 수 있다. 이후에, 적어도 하나의 프로세서는 산출된 점수 중 적어도 하나를 선택하여 적용 대상 환경을 선정할 수 있다.
또한, 도 32의 (b)를 참조하면, 적어도 하나의 프로세서는 도 32의 (a)에서 이용된 기계 학습 네트워크에 시그모이드 레이어를 더 추가하여 적어도 하나의 후보 환경(candidates)에 대한 확률값을 산출할 수 있다. 이때, 산출된 확률값에 기반하여 적어도 하나의 후보 환경 중 적어도 일부가 적용 대상 환경으로 산출될 수 있다.
다시 도 31을 참조하면, CP(130b)는 학습된 기계 학습 네트워크를 가지고 있지 않은 학습 환경들이 존재하면 AP(130a)로 학습된 기계 학습 네트워크를 요청할 수 있다. 이에 따라, 리스트(L2)에 포함된 학습 환경들은 모두 이에 연관된 기계 학습 네트워크를 가질 수 있다.
다양한 실시예에서, CP(130b)는 적용 대상 환경들까지의 거리, 단말의 이동 속도와 방향 중 적어도 하나에 기반하여 위치 정보의 획득 주기를 조정할 수 있다. 적용 대상 환경들까지의 최소 거리가 작을 수록, 단말의 이동 속도가 빠를수록, 그리고 대상 환경 방향과 이동 방향이 일치할수록 주기는 짧게 설정된다.
AP(130a)는 CP(130b)로 요청받은 학습 환경의 학습된 기계 학습 네트워크를 전달할 수 있다.
CP(130b)는 AP(130a)로부터 수신한 학습된 기계 학습 네트워크를 적용 모델 리스트(L2)에 추가할 수 있다. 이때, CP(130b)는 적용 모델 리스트(L2)에 빈 공간이 없으면 설정된 시일 내에 이용할 가능성이 낮은 기계 학습 네트워크를 버리고 새로 수신한 기계 학습 네트워크를 추가한다.
CP(130b)는 학습 전 기계 학습 네트워크와 최대 N_apply-model 개의 학습된 적용 모델을 단말의 위치 정보 또는 기지국과의 연결 상태 중 적어도 하나에 기반하여 적용한다.
일 례로, 단말이 적용 대상 환경의 기지국에 연결되어 있고, 적용 반경 내에 있는 동안 CP(130b)는 적용 모델 리스트(L2)에 포함된 기계 학습 네트워크를 이용하여 통신을 수행할 수 있다. 만약, 적용 모델 리스트에 해당 적용 반경의 학습 환경과 연관된 기계 학습 네트워크가 없으면 AP(130a)로 연관된 기계 학습 네트워크를 요청할 수 있다.
또한, 단말이 적용 대상 환경의 기지국과 연결이 끊어지거나 적용 반경에서 이탈하면 CP(130b)는 학습 전 기계 학습 네트워크를 적용하여 통신을 수행할 수 있다.
한편, 다양한 실시예에서, AP(130a)는 2 이상의 적용 대상인 환경이 서로 인접하여 단말이 제1 적용 대상 환경에서 제2 적용 대상 환경으로 연속하여 이동하는 경우에는, 제1 적용 대상 환경과 연관된 제1 기계 학습 네트워크에서 수행하던 중 제2 적용 대상 환경에 진입함과 동시에 제2 적용 대상 환경과 연관된 제2 기계 학습 네트워크로 전환하여 통신하도록 제어할 수 있다.
한편, AP(130a) 및 CP(130b) 중 적어도 하나는 적용 상태의 시작점에서 성능 점검 타이머를 작동시킬 수 있다. 이때, 성능 점검 타이머는 적용 상태인 학습 리스트의 항목들 각각에 대응되어 작동된다.
성능 점검 타이머가 만료되면 AP(130a)는 CP(130b)에게 성능 측정 데이터를 요청할 수 있다. 일 례로, CP(130b)가 AP(130a)에 의하지 않고 직접 위치 정보를 획득할 수 없는 경우에 AP(130a)는 학습된 기계 학습 네트워크의 적용을 요청하는 것과 함께 그 성능의 측정도 요청할 수 있다. 다른 예로, CP(130b)가 직접 위치 정보를 획득할 수 있는 경우에 AP(130a)는 적용 상태인 학습 환경의 리스트를 전달거나 그 변경 사항을 전달하는 것과 함께 상기 성능의 측정을 요청할 수 있다.
CP(130b)는 성능 측정이 요청된 환경의 학습된 기계 학습 네트워크를 적용할 때마다 성능을 측정하여 AP(130a)에게 전달한다.
설정된 양 이상의 성능 측정 데이터를 확보되면 AP(130a)는 현재 측정된 성능을 학습된 기계 학습 네트워크의 검증 과정에서 미리 저장된 성능값들과 비교하여 성능 저하 여부를 판단한다. 성능 측정 데이터는, 예를 들어, 타이머 만료 시 또는 적용반경에 진입할 때마다 타이머를 작동하여 누적될 수 있다.
이때, AP(130a)는 현재 성능이 학습된 기계 학습 네트워크의 검증 성능 대비 일정 수준 이하, 또는 학습 전 기계 학습 네트워크의 성능 이하로 떨어지면 성능 저하가 발생한 것으로 판단한다. 또한, AP(130a)는 성능 저하가 발생했으면 학습된 모델의 적용을 중지하고 획득 상태로 천이한다. 만약, 성능 저하가 발생하지 않았으면 AP(130a)는 성능 점검 타이머를 다시 재개한다.
J.4. 학습 모델의 재학습 및 잠금(Barred)
도 33 및 도 34은 본 명세서의 일 실시예에 따른 잠금 상태인 항목의 관리방법을 예시적으로 설명한다.
도 33을 참조하면, AP(130a) 및 CP(130b) 중 적어도 하나는 학습 리스트의 하나 이상이 항목을 확인하여, 잠금 상태인 항목이면 잠금 상태의 시작점에서 잠금 해제 타이머를 작동시킬 수 있다. 만약, 잠금 해제 타이머가 만료되면, AP(130a)는 만료된 항목을 학습 리스트에서 삭제할 수 있다. 이때, 잠금에서 해제되어 학습 리스트에서 삭제된 항목은 다시 학습 환경으로 선정될 수도 있다.
도 34를 참조하면, 적어도 하나의 프로세서는 항목이 삭제되기 이전에는 적용 반경 내부에서 위치 샘플을 얻지 않으므로, 해당 항목에 연관된 학습 환경을 선정하거나 생성할 수 없으나, 항목이 삭제되면 삭제된 항목의 적용 반경 내부에서 위치 샘플을 재차 수집할 수 있다.
위치 샘플이 설정된 수 이상 저장되면, 적어도 하나의 프로세서는 삭제된 항목과 독립적인 새로운 학습 환경을 재차 선정할 수 있다. 여기서 새로 선정되는 학습 환경은 삭제된 학습 환경과 중심 위치 및/또는 반경 정보(예: 적용 반경, 학습 반경)이 다르게 설정될 수 있다.
재차 선정된 학습 환경은 전술한 바와 같이 학습 상태로 설정된다. 이후의 중복되는 설명은 생략한다.
K. Device to Implement the Embodiment(s)
본 명세서의 다양한 실시예에 따른 방법이 적용되는 디바이스들에는 온-디바이스 학습과 연관된 사용자 인터페이스가 제공될 수 있다.
상기 사용자 인터페이스는 전체 기능 On/Off 인터페이스, 학습용 데이터 획득 가능 조건, 학습 가능 시간, 또는 학습 리스트의 상태 확인/제어 인터페이스 중 적어도 하나를 포함할 수 있다.
이때, 학습 리스트의 상태 확인/제어 인터페이스는 학습 리스트의 항목별 상태에 따라 분류하여 적용, 검증, 학습, 획득, 잠금 순서로 사용자가 상태를 인지할 수 있도록 나타낸다.
또한, 학습 리스트의 상태 확인/제어 인터페이스는 각 항목별로 정보들(예; 사용자가 설정한 환경 이름, 기지국 정보, 장소 정보, 적용 상태인 경우, 기준 모델 대비 성능 개선 정도, 잠금 상태인 경우, 잠금 만료 일시 등)을 나타낸다. 환경 이름은, 예를 들어, 우리집, 사무실 등을 나타낸다. 기지국 정보는 셀 ID, 주파수 대역을 포함할 수 있다. 장소 정보는 중심 위치 및 학습/적용 반경을 포함할 수 있다. 이때, 중심 위치는 주소와 위도/경도(/고도)로 표시될 수 있다.
한편, 사용자는 인터페이스를 통해 학습 리스트의 항목을 삭제할 수도 있다.
K.1. 통신 시스템 예
이로 제한되는 것은 아니지만, 본 문서에 개시된 본 발명의 다양한 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 기기들간에 무선 통신/연결(예, 5G)을 필요로 하는 다양한 분야에 적용될 수 있다.
이하, 도면을 참조하여 보다 구체적으로 예시한다. 이하의 도면/설명에서 동일한 도면 부호는 다르게 기술하지 않는 한, 동일하거나 대응되는 하드웨어 블록, 소프트웨어 블록 또는 기능 블록을 예시할 수 있다.
도 35은 본 발명에 적용되는 통신 시스템을 예시한다.
도 35을 참조하면, 본 발명에 적용되는 통신 시스템(1)은 무선 기기, 기지국 및 네트워크를 포함한다. 여기서, 무선 기기는 무선 접속 기술(예, 5G NR(New RAT), LTE(Long Term Evolution))을 이용하여 통신을 수행하는 기기를 의미하며, 통신/무선/5G 기기로 지칭될 수 있다. 이로 제한되는 것은 아니지만, 무선 기기는 로봇(100a), 차량(100b-1, 100b-2), XR(eXtended Reality) 기기(100c), 휴대 기기(Hand-held device)(100d), 가전(100e), IoT(Internet of Thing) 기기(100f), AI기기/서버(400)를 포함할 수 있다. 예를 들어, 차량은 무선 통신 기능이 구비된 차량, 자율 주행 차량, 차량간 통신을 수행할 수 있는 차량 등을 포함할 수 있다. 여기서, 차량은 UAV(Unmanned Aerial Vehicle)(예, 드론)를 포함할 수 있다. XR 기기는 AR(Augmented Reality)/VR(Virtual Reality)/MR(Mixed Reality) 기기를 포함하며, HMD(Head-Mounted Device), 차량에 구비된 HUD(Head-Up Display), 텔레비전, 스마트폰, 컴퓨터, 웨어러블 디바이스, 가전 기기, 디지털 사이니지(signage), 차량, 로봇 등의 형태로 구현될 수 있다. 휴대 기기는 스마트폰, 스마트패드, 웨어러블 기기(예, 스마트워치, 스마트글래스), 컴퓨터(예, 노트북 등) 등을 포함할 수 있다. 가전은 TV, 냉장고, 세탁기 등을 포함할 수 있다. IoT 기기는 센서, 스마트미터 등을 포함할 수 있다. 예를 들어, 기지국, 네트워크는 무선 기기로도 구현될 수 있으며, 특정 무선 기기(200a)는 다른 무선 기기에게 기지국/네트워크 노드로 동작할 수도 있다.
무선 기기(100a~100f)는 기지국(200)을 통해 네트워크(300)와 연결될 수 있다. 무선 기기(100a~100f)에는 AI(Artificial Intelligence) 기술이 적용될 수 있으며, 무선 기기(100a~100f)는 네트워크(300)를 통해 AI 서버(400)와 연결될 수 있다. 네트워크(300)는 3G 네트워크, 4G(예, LTE) 네트워크 또는 5G(예, NR) 네트워크 등을 이용하여 구성될 수 있다. 무선 기기(100a~100f)는 기지국(200)/네트워크(300)를 통해 서로 통신할 수도 있지만, 기지국/네트워크를 통하지 않고 직접 통신(e.g. 사이드링크 통신(sidelink communication))할 수도 있다. 예를 들어, 차량들(100b-1, 100b-2)은 직접 통신(e.g. V2V(Vehicle to Vehicle)/V2X(Vehicle to everything) communication)을 할 수 있다. 또한, IoT 기기(예, 센서)는 다른 IoT 기기(예, 센서) 또는 다른 무선 기기(100a~100f)와 직접 통신을 할 수 있다.
무선 기기(100a~100f)/기지국(200), 기지국(200)/기지국(200) 간에는 무선 통신/연결(150a, 150b, 150c)이 이뤄질 수 있다. 여기서, 무선 통신/연결은 상향/하향링크 통신(150a)과 사이드링크 통신(150b)(또는, D2D 통신), 기지국간 통신(150c)(e.g. relay, IAB(Integrated Access Backhaul)과 같은 다양한 무선 접속 기술(예, 5G NR)을 통해 이뤄질 수 있다. 무선 통신/연결(150a, 150b, 150c)을 통해 무선 기기와 기지국/무선 기기, 기지국과 기지국은 서로 무선 신호를 송신/수신할 수 있다. 예를 들어, 무선 통신/연결(150a, 150b, 150c)은 다양한 물리 채널을 통해 신호를 송신/수신할 수 있다. 이를 위해, 본 발명의 다양한 제안들에 기반하여, 무선 신호의 송신/수신을 위한 다양한 구성정보 설정 과정, 다양한 신호 처리 과정(예, 채널 인코딩/디코딩, 변조/복조, 자원 매핑/디매핑 등), 자원 할당 과정 등 중 적어도 일부가 수행될 수 있다.
K.2. 휴대 기기 예
도 36은 본 발명에 적용될 수 있는 무선 기기를 예시한다.
도 36을 참조하면, 제1 무선 기기(100)와 제2 무선 기기(200)는 다양한 무선 접속 기술(예, LTE, NR)을 통해 무선 신호를 송수신할 수 있다. 여기서, {제1 무선 기기(100), 제2 무선 기기(200)}은 도 35의 {무선 기기(100x), 기지국(200)} 및/또는 {무선 기기(100x), 무선 기기(100x)}에 대응할 수 있다.
제1 무선 기기(100)는 하나 이상의 프로세서(102) 및 하나 이상의 메모리(104)를 포함하며, 추가적으로 하나 이상의 송수신기(106) 및/또는 하나 이상의 안테나(108)을 더 포함할 수 있다. 프로세서(102)는 메모리(104) 및/또는 송수신기(106)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(102)는 메모리(104) 내의 정보를 처리하여 제1 정보/신호를 생성한 뒤, 송수신기(106)을 통해 제1 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(102)는 송수신기(106)를 통해 제2 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제2 정보/신호의 신호 처리로부터 얻은 정보를 메모리(104)에 저장할 수 있다. 메모리(104)는 프로세서(102)와 연결될 수 있고, 프로세서(102)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(104)는 프로세서(102)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(102)와 메모리(104)는 무선 통신 기술(예, LTE, NR)을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(106)는 프로세서(102)와 연결될 수 있고, 하나 이상의 안테나(108)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(106)는 송신기 및/또는 수신기를 포함할 수 있다. 송수신기(106)는 RF(Radio Frequency) 유닛과 혼용될 수 있다. 본 발명에서 무선 기기는 통신 모뎀/회로/칩을 의미할 수도 있다.
제2 무선 기기(200)는 하나 이상의 프로세서(202), 하나 이상의 메모리(204)를 포함하며, 추가적으로 하나 이상의 송수신기(206) 및/또는 하나 이상의 안테나(208)를 더 포함할 수 있다. 프로세서(202)는 메모리(204) 및/또는 송수신기(206)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(202)는 메모리(204) 내의 정보를 처리하여 제3 정보/신호를 생성한 뒤, 송수신기(206)를 통해 제3 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(202)는 송수신기(206)를 통해 제4 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제4 정보/신호의 신호 처리로부터 얻은 정보를 메모리(204)에 저장할 수 있다. 메모리(204)는 프로세서(202)와 연결될 수 있고, 프로세서(202)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(204)는 프로세서(202)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(202)와 메모리(204)는 무선 통신 기술(예, LTE, NR)을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(206)는 프로세서(202)와 연결될 수 있고, 하나 이상의 안테나(208)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(206)는 송신기 및/또는 수신기를 포함할 수 있다 송수신기(206)는 RF 유닛과 혼용될 수 있다. 본 발명에서 무선 기기는 통신 모뎀/회로/칩을 의미할 수도 있다.
이하, 무선 기기(100, 200)의 하드웨어 요소에 대해 보다 구체적으로 설명한다. 이로 제한되는 것은 아니지만, 하나 이상의 프로토콜 계층이 하나 이상의 프로세서(102, 202)에 의해 구현될 수 있다. 예를 들어, 하나 이상의 프로세서(102, 202)는 하나 이상의 계층(예, PHY, MAC, RLC, PDCP, RRC, SDAP와 같은 기능적 계층)을 구현할 수 있다. 하나 이상의 프로세서(102, 202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 하나 이상의 PDU(Protocol Data Unit) 및/또는 하나 이상의 SDU(Service Data Unit)를 생성할 수 있다. 하나 이상의 프로세서(102, 202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 메시지, 제어정보, 데이터 또는 정보를 생성할 수 있다. 하나 이상의 프로세서(102, 202)는 본 문서에 개시된 기능, 절차, 제안 및/또는 방법에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 포함하는 신호(예, 베이스밴드 신호)를 생성하여, 하나 이상의 송수신기(106, 206)에게 제공할 수 있다. 하나 이상의 프로세서(102, 202)는 하나 이상의 송수신기(106, 206)로부터 신호(예, 베이스밴드 신호)를 수신할 수 있고, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 획득할 수 있다.
하나 이상의 프로세서(102, 202)는 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 마이크로 컴퓨터로 지칭될 수 있다. 하나 이상의 프로세서(102, 202)는 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합에 의해 구현될 수 있다. 일 예로, 하나 이상의 ASIC(Application Specific Integrated Circuit), 하나 이상의 DSP(Digital Signal Processor), 하나 이상의 DSPD(Digital Signal Processing Device), 하나 이상의 PLD(Programmable Logic Device) 또는 하나 이상의 FPGA(Field Programmable Gate Arrays)가 하나 이상의 프로세서(102, 202)에 포함될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있고, 펌웨어 또는 소프트웨어는 모듈, 절차, 기능 등을 포함하도록 구현될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 수행하도록 설정된 펌웨어 또는 소프트웨어는 하나 이상의 프로세서(102, 202)에 포함되거나, 하나 이상의 메모리(104, 204)에 저장되어 하나 이상의 프로세서(102, 202)에 의해 구동될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 코드, 명령어 및/또는 명령어의 집합 형태로 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있다.
하나 이상의 메모리(104, 204)는 하나 이상의 프로세서(102, 202)와 연결될 수 있고, 다양한 형태의 데이터, 신호, 메시지, 정보, 프로그램, 코드, 지시 및/또는 명령을 저장할 수 있다. 하나 이상의 메모리(104, 204)는 ROM, RAM, EPROM, 플래시 메모리, 하드 드라이브, 레지스터, 캐쉬 메모리, 컴퓨터 판독 저장 매체 및/또는 이들의 조합으로 구성될 수 있다. 하나 이상의 메모리(104, 204)는 하나 이상의 프로세서(102, 202)의 내부 및/또는 외부에 위치할 수 있다. 또한, 하나 이상의 메모리(104, 204)는 유선 또는 무선 연결과 같은 다양한 기술을 통해 하나 이상의 프로세서(102, 202)와 연결될 수 있다.
하나 이상의 송수신기(106, 206)는 하나 이상의 다른 장치에게 본 문서의 방법들 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 전송할 수 있다. 하나 이상의 송수신기(106, 206)는 하나 이상의 다른 장치로부터 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 수신할 수 있다. 예를 들어, 하나 이상의 송수신기(106, 206)는 하나 이상의 프로세서(102, 202)와 연결될 수 있고, 무선 신호를 송수신할 수 있다. 예를 들어, 하나 이상의 프로세서(102, 202)는 하나 이상의 송수신기(106, 206)가 하나 이상의 다른 장치에게 사용자 데이터, 제어 정보 또는 무선 신호를 전송하도록 제어할 수 있다. 또한, 하나 이상의 프로세서(102, 202)는 하나 이상의 송수신기(106, 206)가 하나 이상의 다른 장치로부터 사용자 데이터, 제어 정보 또는 무선 신호를 수신하도록 제어할 수 있다. 또한, 하나 이상의 송수신기(106, 206)는 하나 이상의 안테나(108, 208)와 연결될 수 있고, 하나 이상의 송수신기(106, 206)는 하나 이상의 안테나(108, 208)를 통해 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 송수신하도록 설정될 수 있다. 본 문서에서, 하나 이상의 안테나는 복수의 물리 안테나이거나, 복수의 논리 안테나(예, 안테나 포트)일 수 있다. 하나 이상의 송수신기(106, 206)는 수신된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 하나 이상의 프로세서(102, 202)를 이용하여 처리하기 위해, 수신된 무선 신호/채널 등을 RF 밴드 신호에서 베이스밴드 신호로 변환(Convert)할 수 있다. 하나 이상의 송수신기(106, 206)는 하나 이상의 프로세서(102, 202)를 이용하여 처리된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 베이스밴드 신호에서 RF 밴드 신호로 변환할 수 있다. 이를 위하여, 하나 이상의 송수신기(106, 206)는 (아날로그) 오실레이터 및/또는 필터를 포함할 수 있다.
전술한 본 명세서는, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 명세서의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 명세서의 등가적 범위 내에서의 모든 변경은 본 명세서의 범위에 포함된다.

Claims (20)

  1. 다중 송신 안테나와 다중 수신 안테나를 이용하여 MIMO(multi-input-multi-output) 통신 채널을 통해 통신하기 위한 적어도 하나의 기계 학습 네트워크를 훈련하기 위하여 단말의 적어도 하나의 프로세서에 의해 수행되는 방법으로서,
    상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 단계;
    상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용될 제1 기계 학습 네트워크를 제2 기계 학습 네트워크로 업데이트하기 위한 훈련 데이터를 얻는 단계; 및
    상기 훈련 데이터를 이용하여 상기 제1 기계 학습 네트워크를 업데이트하는 단계;
    를 포함하는, 방법.
  2. 제1 항에 있어서,
    상기 학습 리스트를 생성하는 단계는,
    하나 이상의 기지국 별로 얻은 연결 정보와 기지국 정보 중 적어도 하나로 구성된 하나 이상의 제2 항목을 포함하는 연결 리스트를 생성하는 단계;
    상기 연결 리스트의 연결 정보에 기반하여 후보 리스트에 업데이트하는 단계;
    상기 후보 리스트에 포함된 하나 이상의 제3 항목 중 어느 하나에 설정된 가중치를 적용하여 하나 이상의 항목을 선정하여 선정 리스트에 업데이트하는 단계;
    상기 선정 리스트에 포함된 적어도 하나의 제4 항목에 연관된 상기 단말의 위치 샘플에 기반하여 상기 학습 리스트에 추가될 상기 하나 이상의 제1 항목을 생성하는 단계;
    를 포함하는, 방법.
  3. 제1 항에 있어서,
    상기 학습 리스트는,
    상기 제1 항목 별로 구분되는 장소 정보와 기지국 정보를 갖는, 방법.
  4. 제3 항에 있어서,
    상기 장소 정보는,
    학습이 완료된 상기 제2 기계 학습 네트워크가 적용될 적용 영역, 또는 상기 훈련 데이터를 얻기 위한 수집 영역에 관한 공간 정보를 포함하는, 방법.
  5. 제4 항에 있어서,
    상기 이벤트는,
    상기 단말이 상기 수집 영역에 진입하거나 위치하는 것이 감지되는 것인, 방법.
  6. 제4 항에 있어서,
    상기 단말이 상기 적용 영역에 위치하는 것이 감지되면, 상기 위치 샘플의 수집을 중단하는, 방법.
  7. 제4 항에 있어서,
    상기 학습 리스트를 생성하는 단계는,
    상기 단말이 상기 수집 영역에 진입하면 상기 단말의 위치 샘플을 얻는 단계;
    상기 얻은 위치 샘플들의 수가 설정된 수 이상이면, 상기 위치 샘플들을 대상으로 클러스터링 알고리즘을 적용하여 하나 이상의 통신 환경을 결정하는 단계; 및
    상기 결정된 하나 이상의 통신 환경을 상기 학습 리스트의 각 항목으로 설정하는 단계;
    를 포함하는, 방법.
  8. 제4 항에 있어서,
    상기 적용 영역에 진입하면, 상기 적용 영역에서 적용될 기계 학습 네트워크를 확인하는 단계;
    상기 확인된 기계 학습 네트워크에 기초하여, 수신기를 제어하는 단계;
    를 더 포함하는, 방법.
  9. 제4 항에 있어서,
    상기 단말이 2 이상의 적용 영역에 위치하는 경우, 상기 2 이상의 적용 영역에 대응되는 제1 항목들 중 어느 하나를 선택하는 단계;
    상기 선택된 제1 항목에서 적용될 기계 학습 네트워크를 확인하는 단계; 및
    상기 확인된 기계 학습 네트워크에 기초하여 수신기를 제어하는 단계;
    를 더 포함하는, 방법.
  10. 제9 항에 있어서,
    상기 제1 항목들 중 어느 하나를 선택하는 단계는,
    상기 2 이상의 적용 영역의 반경을 비교하는 단계;
    상기 비교에 기초하여, 상기 2 이상의 제1 항목들 중 어느 하나를 선택하는 단계;
    를 포함하는, 방법.
  11. 제1 항에 있어서,
    상기 기계 학습 네트워크는 심층 신경망(Deep Neural Network, DNN), 컨볼루션 신경망(Convolutional Neural Network, CNN), 또는 파라메트릭 곱셈들, 덧셈들, 및 비 선형성들을 포함하는 순환 신경망(Recurrent Neural Network, RNN) 중 적어도 하나를 포함하는, 방법.
  12. 제1 항에 있어서,
    상기 훈련 데이터는,
    수신 관련 파라미터를 나타내는, 방법.
  13. 제12 항에 있어서,
    상기 수신 관련 파라미터는 신호 대 잡음비(signal to noise ratio, SNR), 수신 신호 강도(Received Signal Strength Indication, RSSI), 참조 신호 수신 전력(Reference Signal Received Power, RSRP), 또는 참조 신호 수신 품질(Reference Signal Received Quality) 중 적어도 하나를 포함하는, 방법.
  14. 제1 항에 있어서,
    상기 기계 학습 네트워크를 업데이트하는 동안 업데이트 전인 제1 네트워크에 의해 측정된 제1 성능 지표와 업데이트 후인 제2 네트워크에 의해 측정된 제2 성능 지표를 비교하는 단계; 및
    상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계;
    를 더 포함하는, 방법.
  15. 제1 항에 있어서,
    상기 기계 학습 네트워크가 업데이트되면, 업데이트 전인 제1 네트워크를 적용하여 측정되는 제1 성능 지표와 업데이트 후인 제2 네트워크를 적용하여 측정되는 제2 성능 지표를 비교하는 단계; 및
    상기 비교에 기초하여 상기 제1, 제2 네트워크 중 어느 하나를 선택하는 단계;
    를 더 포함하는, 방법.
  16. 제15 항에 있어서,
    상기 비교의 신뢰도(reliablity)가 설정된 기준값 미만이면, 상기 제1, 제2 성능 지표를 다시 측정하여 비교하는 단계;
    를 더 포함하는, 방법.
  17. 제1 항에 있어서,
    상기 학습 리스트는,
    상기 제1 항목 별 상태 정보를 포함하고,
    상기 상태 정보는, 획득 상태, 훈련 상태, 검증 상태, 적용 상태, 또는 잠금 상태 중 적어도 하나를 포함하되,
    상기 기계 학습 네트워크는 상기 상태 정보에 기초하여 상기 훈련 데이터의 수집, 상기 기계 학습 네트워크의 학습, 검증, 적용, 또는 잠금 중 적어도 하나가 결정되는, 방법.
  18. 제1 항에 있어서,
    상기 기계 학습 네트워크의 업데이트의 일반화가 실패하면, 상기 기계 학습 네트워크에 대응되는 실패 횟수를 증가하는 단계;
    상기 실패 횟수가 설정된 최대 횟수를 초과하면, (i) 상기 업데이트된 기계 학습 네트워크를 업데이트 전으로 초기화하고, (ii) 상기 제1 항목의 상태를 잠금 상태로 전환하는, 방법.
  19. 무선 통신 시스템에서, 기계 학습 기반 수신기가 적용된 단말에 있어서,
    트랜시버;
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 연결되고, 명령들(instructions)을 저장하는 적어도 하나의 메모리를 포함하고, 상기 명령들은 상기 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서로 하여금 다중의 수신 안테나를 이용하여 MIMO 통신 채널을 통해 통신하기 위한 동작들을 지원하고,
    상기 동작들은,
    상기 단말이 네트워크를 통해 통신하는 동안 수집된 하나 이상의 위치 샘플에 기반하여 학습 리스트를 생성하는 동작,
    상기 학습 리스트에 포함된 하나 이상의 제1 항목 중 어느 하나와 연관된 이벤트가 감지되면, 상기 단말의 수신기에 적용되는 기계 학습 네트워크를 학습하기 위한 훈련 데이터를 얻는 동작, 및
    상기 훈련 데이터를 이용하여 상기 기계 학습 네트워크를 업데이트하는 동작을 포함하는, 단말.
  20. 제1 항의 방법을 컴퓨터 시스템에서 실행하기 위한 프로그램이 기록된 컴퓨터 시스템이 판독 가능한 기록매체.
PCT/KR2020/006661 2020-05-21 2020-05-21 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법 WO2021235572A1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/KR2020/006661 WO2021235572A1 (ko) 2020-05-21 2020-05-21 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법
KR1020227044479A KR20230014725A (ko) 2020-05-21 2020-05-21 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법
US17/926,855 US20230209368A1 (en) 2020-05-21 2020-05-21 Wireless communication method using on-device learning-based machine learning network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2020/006661 WO2021235572A1 (ko) 2020-05-21 2020-05-21 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법

Publications (1)

Publication Number Publication Date
WO2021235572A1 true WO2021235572A1 (ko) 2021-11-25

Family

ID=78708659

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/006661 WO2021235572A1 (ko) 2020-05-21 2020-05-21 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법

Country Status (3)

Country Link
US (1) US20230209368A1 (ko)
KR (1) KR20230014725A (ko)
WO (1) WO2021235572A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023206114A1 (en) * 2022-04-27 2023-11-02 Qualcomm Incorporated Inference error information feedback for machine learning-based inferences

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220140878A1 (en) * 2020-11-02 2022-05-05 Samsung Electronics Co., Ltd. Method and apparatus for beam measurement and reporting in a wireless communication system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080019593A (ko) * 2005-06-28 2008-03-04 마이크로소프트 코포레이션 현존하는 무선 기지국을 이용한 위치 확인 서비스
US20120202538A1 (en) * 2011-02-09 2012-08-09 Nokia Corporation Forecasting of dynamic environmental parameters to optimize operation of a wireless communication system
WO2016001473A1 (en) * 2014-06-30 2016-01-07 Nokia Technologies Oy System and method for radio and other parameter estimation based on maps
WO2017052709A2 (en) * 2015-07-22 2017-03-30 Qualcomm Incorporated Transfer learning in neural networks
WO2019120487A1 (en) * 2017-12-19 2019-06-27 Telefonaktiebolaget Lm Ericsson (Publ) Radio coverage map generation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080019593A (ko) * 2005-06-28 2008-03-04 마이크로소프트 코포레이션 현존하는 무선 기지국을 이용한 위치 확인 서비스
US20120202538A1 (en) * 2011-02-09 2012-08-09 Nokia Corporation Forecasting of dynamic environmental parameters to optimize operation of a wireless communication system
WO2016001473A1 (en) * 2014-06-30 2016-01-07 Nokia Technologies Oy System and method for radio and other parameter estimation based on maps
WO2017052709A2 (en) * 2015-07-22 2017-03-30 Qualcomm Incorporated Transfer learning in neural networks
WO2019120487A1 (en) * 2017-12-19 2019-06-27 Telefonaktiebolaget Lm Ericsson (Publ) Radio coverage map generation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023206114A1 (en) * 2022-04-27 2023-11-02 Qualcomm Incorporated Inference error information feedback for machine learning-based inferences

Also Published As

Publication number Publication date
US20230209368A1 (en) 2023-06-29
KR20230014725A (ko) 2023-01-30

Similar Documents

Publication Publication Date Title
WO2020091576A1 (ko) 무선 통신 시스템에서 빔 관련 보고를 수행하는 방법 및 이에 대한 장치
WO2020167057A1 (ko) 무선 통신 시스템에서 측위 방법 및 이를 지원하는 장치
WO2020204322A1 (ko) 무선 통신 시스템에서 단말의 빔 관리 수행 방법 및 이를 지원하는 단말 및 기지국
WO2020032685A1 (ko) 무선 통신 시스템에서 빔 실패 검출을 수행하는 방법 및 이에 대한 장치
WO2020222621A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 이를 지원하는 장치
WO2020091496A1 (ko) 무선 통신 시스템에서 단말 및 기지국의 동작 방법 및 이를 지원하는 장치
AU2019318976B2 (en) Method of transmitting and receiving channel state information in wireless communication system and apparatus therefor
WO2020222619A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 이를 지원하는 장치
WO2020080915A1 (ko) 무선 통신 시스템에서 복수의 물리 하향링크 공유 채널들을 송수신하는 방법 및 이를 위한 장치
WO2020091470A1 (ko) 무선 통신 시스템에서 pusch를 전송하는 방법 및 그 장치
WO2021015510A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 이를 지원하는 장치
WO2019221471A1 (ko) 무선 통신 시스템에서 채널 상태 정보 보고를 수행하는 방법 및 이를 위한 장치
WO2020222620A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 이를 지원하는 장치
WO2020226188A1 (ko) 주변 상황 인지에 따라 통화연결 디바이스를 선택하는 방법
WO2020091498A1 (ko) 무선 통신 시스템에서 단말 및 기지국의 동작 방법 및 이를 지원하는 장치
WO2020080917A1 (ko) 무선 통신 시스템에서 복수의 물리 하향링크 공유 채널들을 송수신하는 방법 및 이를 위한 장치
WO2021235572A1 (ko) 온-디바이스 학습 기반 기계 학습 네트워크를 이용한 무선 통신 방법
WO2020091474A1 (ko) 무선 통신 시스템에서 pusch를 전송하는 방법 및 그 장치
WO2022145948A1 (ko) 무선 통신 시스템에서 csi를 송수신하는 방법 및 이를 위한 장치
WO2020080916A1 (ko) 무선 통신 시스템에서 복수의 물리 하향링크 공유 채널들을 송수신하는 방법 및 이를 위한 장치
WO2022030948A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 이를 지원하는 장치
WO2020226214A1 (ko) 인증 레벨에 기반한 지능형 서비스 제공 방법 및 장치
WO2021194206A1 (ko) 무선 통신 시스템에서 신호를 송수신하는 방법 및 이를 지원하는 장치
WO2020235716A1 (ko) 지능형 전자 기기 및 지능형 전자 기기에 전송되는 메시지를 이용한 인증 방법
WO2022265141A1 (ko) 무선 통신 시스템에서 빔 관리를 수행하는 방법 및 이를 위한 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20937013

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20227044479

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20937013

Country of ref document: EP

Kind code of ref document: A1