WO2024063524A1 - 무선 통신 시스템에서 온라인 학습을 수행하기 위한 장치 및 방법 - Google Patents

무선 통신 시스템에서 온라인 학습을 수행하기 위한 장치 및 방법 Download PDF

Info

Publication number
WO2024063524A1
WO2024063524A1 PCT/KR2023/014229 KR2023014229W WO2024063524A1 WO 2024063524 A1 WO2024063524 A1 WO 2024063524A1 KR 2023014229 W KR2023014229 W KR 2023014229W WO 2024063524 A1 WO2024063524 A1 WO 2024063524A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
label
data signal
control information
information
Prior art date
Application number
PCT/KR2023/014229
Other languages
English (en)
French (fr)
Inventor
이상림
이경호
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of WO2024063524A1 publication Critical patent/WO2024063524A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition

Definitions

  • the following description relates to a wireless communication system and an apparatus and method for performing online learning in a wireless communication system.
  • Wireless access systems are being widely deployed to provide various types of communication services such as voice and data.
  • a wireless access system is a multiple access system that can support communication with multiple users by sharing available system resources (bandwidth, transmission power, etc.).
  • multiple access systems include code division multiple access (CDMA) systems, frequency division multiple access (FDMA) systems, time division multiple access (TDMA) systems, orthogonal frequency division multiple access (OFDMA) systems, and single carrier frequency (SC-FDMA) systems. division multiple access) systems, etc.
  • enhanced mobile broadband (eMBB) communication technology is being proposed compared to the existing radio access technology (RAT).
  • RAT radio access technology
  • a communication system that takes into account reliability and latency-sensitive services/UE (user equipment) as well as mMTC (massive machine type communications), which connects multiple devices and objects to provide a variety of services anytime and anywhere, is being proposed. .
  • mMTC massive machine type communications
  • the present disclosure can provide an apparatus and method for effectively performing online learning of a transmitter and/or receiver model in a wireless communication system.
  • the present disclosure can provide an apparatus and method for enabling online learning using signals passing through an actual channel in a wireless communication system.
  • the present disclosure may provide an apparatus and method for determining a label for online learning in a wireless communication system.
  • the present disclosure can provide an apparatus and method for determining a label for online learning based on rules common in wireless communication systems.
  • the present disclosure may provide an apparatus and method for determining a label for online learning based on information shared between devices in a wireless communication system.
  • the present disclosure may provide an apparatus and method for transmitting a signal including a label between devices in a wireless communication system.
  • the present disclosure can provide an apparatus and method for determining a label based on a resource that carries a signal containing the label in a wireless communication system.
  • the present disclosure can provide an apparatus and method for determining a label based on information independent of scheduling results in a wireless communication system.
  • the present disclosure can provide an apparatus and method for determining a modulation scheme for a signal including a label in a wireless communication system.
  • the present disclosure can provide an apparatus and method for signaling a modulation method for a signal including a label in a wireless communication system.
  • a method of operating a first device in a wireless communication system includes receiving control information from a second device, receiving a data signal based on the control information, and data included in the data signal. It may include a step of restoring, and a step of performing learning on an artificial intelligence model used for communication using the restored data. The learning may be performed using a label determined based on information related to the control information or the resource that delivered the data signal.
  • a method of operating a second device in a wireless communication system includes transmitting control information to a first device, generating a data signal, and transmitting the data signal based on the control information.
  • the data signal is generated based on a label used to perform learning on an artificial intelligence model used by the first device to process the data signal, and the label is the control information or the data signal. may be determined based on information related to the delivered resource.
  • a first device in a wireless communication system includes a transceiver and a processor connected to the transceiver, wherein the processor receives control information from the second device and sends a data signal based on the control information. Receives, restores data included in the data signal, and controls to perform learning on an artificial intelligence model used for communication using the restored data, wherein the learning is performed by using the control information or the data signal. It can be performed using a label that is determined based on information related to the delivered resource.
  • a second device in a wireless communication system includes a transceiver and a processor connected to the transceiver, wherein the processor transmits control information to the first device, generates a data signal, and controls the first device. Controlling to transmit the data signal based on information, wherein the data signal is generated based on a label used to perform learning on an artificial intelligence model used by the first device to process the data signal.
  • the label may be determined based on information related to the control information or the resource that delivered the data signal.
  • a communication device includes at least one processor, at least one computer memory connected to the at least one processor and storing instructions that direct operations as executed by the at least one processor.
  • the operations include receiving control information, receiving a data signal based on the control information, restoring data included in the data signal, and using the restored data for communication. It may include a step of performing learning on an artificial intelligence model. The learning may be performed using a label determined based on information related to the control information or the resource that delivered the data signal.
  • a non-transitory computer-readable medium storing at least one instruction includes the at least one instruction executable by a processor. It includes, wherein the at least one command is such that a device receives control information from another device, receives a data signal based on the control information, restores data included in the data signal, and causes the device to receive control information from another device.
  • Control is used to perform learning on the artificial intelligence model used for communication, and the learning can be performed using a label determined based on the control information or information related to the resource that delivered the data signal. .
  • online learning using a real channel can be effectively performed.
  • FIG. 1 shows an example of a communication system applicable to the present disclosure.
  • FIG. 2 shows an example of a wireless device applicable to the present disclosure.
  • Figure 3 shows a method of processing a transmission signal applicable to the present disclosure.
  • Figure 4 shows a communication procedure between a terminal and a base station applicable to the present disclosure.
  • Figure 5 shows an example of a communication structure that can be provided in a 6G (6th generation) system applicable to the present disclosure.
  • FIG. 7 shows a THz wireless communication transceiver applicable to the present disclosure.
  • FIG. 8 shows a THz signal generation method applicable to the present disclosure.
  • FIG. 9 shows a wireless communication transceiver applicable to the present disclosure.
  • Figure 10 shows a transmitter structure applicable to the present disclosure.
  • Figure 11 shows a modulator structure applicable to the present disclosure.
  • Figure 12 shows the structure of a perceptron included in an artificial neural network applicable to the present disclosure.
  • Figure 13 shows an artificial neural network structure applicable to the present disclosure.
  • Figure 14 shows an example of a functional framework for application of artificial intelligence technology applicable to the present disclosure.
  • Figure 15 shows an example of a procedure for utilizing an artificial intelligence model applicable to the present disclosure.
  • Figure 16 shows another example of a procedure for utilizing an artificial intelligence model applicable to the present disclosure.
  • Figure 17 shows another example of a procedure for utilizing an artificial intelligence model applicable to the present disclosure.
  • Figure 18 shows a communication procedure based on AI technology applicable to the present disclosure.
  • Figure 19 shows an example of a procedure for performing online learning for an artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 20 shows an example of a procedure for supporting online learning for an artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 21 shows an example of a procedure for determining a label for online learning according to an embodiment of the present disclosure.
  • Figure 22 shows an example of a procedure for performing learning on an artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 23 shows an example of a transmitting device and a receiving device that performs channel encoding/decoding using an artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 24 shows an example of a transmitting device and a receiving device that performs offset estimation and compensation using an artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 25 shows an example of a procedure for signaling competency information related to learning according to an embodiment of the present disclosure.
  • each component or feature may be considered optional unless explicitly stated otherwise.
  • Each component or feature may be implemented in a form that is not combined with other components or features. Additionally, some components and/or features may be combined to form an embodiment of the present disclosure. The order of operations described in embodiments of the present disclosure may be changed. Some features or features of one embodiment may be included in other embodiments or may be replaced with corresponding features or features of other embodiments.
  • the base station is meant as a terminal node of the network that directly communicates with the mobile station. Certain operations described in this document as being performed by the base station may, in some cases, be performed by an upper node of the base station.
  • 'base station' is a term such as fixed station, Node B, eNB (eNode B), gNB (gNode B), ng-eNB, advanced base station (ABS), or access point. It can be replaced by .
  • the terminal is a user equipment (UE), a mobile station (MS), a subscriber station (SS), and a mobile subscriber station (MSS).
  • UE user equipment
  • MS mobile station
  • SS subscriber station
  • MSS mobile subscriber station
  • AMS advanced mobile station
  • the transmitting end refers to a fixed and/or mobile node that provides a data service or a voice service
  • the receiving end refers to a fixed and/or mobile node that receives a data service or a voice service. Therefore, in the case of uplink, the mobile station can be the transmitting end and the base station can be the receiving end. Likewise, in the case of downlink, the mobile station can be the receiving end and the base station can be the transmitting end.
  • Embodiments of the present disclosure include wireless access systems such as the IEEE 802.xx system, 3GPP (3rd Generation Partnership Project) system, 3GPP LTE (Long Term Evolution) system, 3GPP 5G (5th generation) NR (New Radio) system, and 3GPP2 system.
  • wireless access systems such as the IEEE 802.xx system, 3GPP (3rd Generation Partnership Project) system, 3GPP LTE (Long Term Evolution) system, 3GPP 5G (5th generation) NR (New Radio) system, and 3GPP2 system.
  • TS 3GPP technical specification
  • 3GPP TS 38.212 3GPP TS 38.213, 3GPP TS 38.321
  • 3GPP TS 38.331 documents It can be.
  • embodiments of the present disclosure can be applied to other wireless access systems and are not limited to the above-described system. As an example, it may be applicable to systems applied after the 3GPP 5G NR system and is not limited to a specific system.
  • CDMA code division multiple access
  • FDMA frequency division multiple access
  • TDMA time division multiple access
  • OFDMA orthogonal frequency division multiple access
  • SC-FDMA single carrier frequency division multiple access
  • LTE may refer to technology after 3GPP TS 36.xxx Release 8.
  • LTE technology after 3GPP TS 36.xxx Release 10 may be referred to as LTE-A
  • LTE technology after 3GPP TS 36.xxx Release 13 may be referred to as LTE-A pro.
  • 3GPP NR may refer to technology after TS 38.xxx Release 15.
  • 3GPP 6G may refer to technologies after TS Release 17 and/or Release 18. “xxx” refers to the standard document detail number.
  • LTE/NR/6G can be collectively referred to as a 3GPP system.
  • FIG. 1 shows an example of a communication system applied to the present disclosure.
  • the communication system 100 applied to the present disclosure includes a wireless device, a base station, and a network.
  • a wireless device refers to a device that performs communication using wireless access technology (e.g. LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G).
  • Communication/wireless/5G device It may be referred to as .
  • wireless devices include robots 100a, vehicles 100b-1, 100b-2, extended reality (XR) devices 100c, hand-held devices 100d, and home appliances. appliance) (100e), IoT (Internet of Thing) device (100f), and AI (artificial intelligence) device/server (100g).
  • vehicles may include vehicles equipped with wireless communication functions, autonomous vehicles, vehicles capable of inter-vehicle communication, etc.
  • the vehicles 100b-1 and 100b-2 may include an unmanned aerial vehicle (UAV) (eg, a drone).
  • UAV unmanned aerial vehicle
  • the XR device 100c includes an augmented reality (AR)/virtual reality (VR)/mixed reality (MR) device, a head-mounted device (HMD), a head-up display (HUD) provided in a vehicle, a television, It can be implemented in the form of smartphones, computers, wearable devices, home appliances, digital signage, vehicles, robots, etc.
  • the portable device 100d may include a smartphone, smart pad, wearable device (eg, smart watch, smart glasses), computer (eg, laptop, etc.), etc.
  • Home appliances 100e may include a TV, refrigerator, washing machine, etc.
  • IoT device 100f may include sensors, smart meters, etc.
  • the base station 120 and the network 130 may also be implemented as wireless devices, and a specific wireless device 120a may operate as a base station/network node to other wireless devices.
  • Wireless devices 100a to 100f may be connected to the network 130 through the base station 120.
  • AI technology may be applied to the wireless devices 100a to 100f, and the wireless devices 100a to 100f may be connected to the AI server 100g through the network 130.
  • the network 130 may be configured using a 3G network, 4G (eg, LTE) network, 5G (eg, NR), or 6G network.
  • Wireless devices 100a through 100f may communicate with each other via base station 120/network 130, but may communicate directly (e.g., sidelink communication) rather than via base station 120/network 130. You may.
  • vehicles 100b-1 and 100b-2 may communicate directly (e.g., vehicle to vehicle (V2V)/vehicle to everything (V2X) communication).
  • the IoT device 100f eg, sensor
  • another IoT device eg, sensor
  • Wireless communication/connection may be established between the wireless devices (100a to 100f)/base station (120) and the base station (120)/base station (120).
  • wireless communication/connection includes uplink/downlink communication (150a), sidelink communication (150b) (or D2D communication), and communication between base stations (150c) (e.g., relay, integrated access backhaul (IAB)).
  • IAB integrated access backhaul
  • wireless communication/connection 150a, 150b, and 150c may transmit/receive signals through various physical channels.
  • various configuration information setting processes for transmitting/receiving wireless signals various signal processing processes (e.g., channel encoding/decoding, modulation/demodulation, resource mapping/demapping, etc.) , at least some of the resource allocation process, etc. may be performed.
  • FIG. 2 shows an example of a wireless device to which the present disclosure can be applied.
  • the wireless device 200 can transmit and receive wireless signals through various wireless access technologies (e.g., LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G).
  • the wireless device 200 includes at least one processor 202 and at least one memory 204, and may additionally include at least one transceiver 206 and/or at least one antenna 208.
  • Processor 202 controls memory 204 and/or transceiver 206 and may be configured to implement the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed herein.
  • the processor 202 may process information in the memory 204 to generate first information/signal and then transmit a wireless signal including the first information/signal through the transceiver 206.
  • the processor 202 may receive a wireless signal including the second information/signal through the transceiver 206 and then store information obtained from signal processing of the second information/signal in the memory 204.
  • the memory 204 may be connected to the processor 202 and may store various information related to the operation of the processor 202.
  • memory 204 may perform some or all of the processes controlled by processor 202 or instructions for performing the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed herein. Software code containing them can be stored.
  • the processor 202 and memory 204 may be part of a communication modem/circuit/chip designed to implement wireless communication technology.
  • Transceiver 206 may be coupled to processor 202 and may transmit and/or receive wireless signals through at least one antenna 208.
  • Transceiver 206 may include a transmitter and/or receiver.
  • the transceiver 206 may be used interchangeably with a radio frequency (RF) unit.
  • RF radio frequency
  • a wireless device may mean a communication modem/circuit/chip.
  • At least one protocol layer may be implemented by at least one processor 202.
  • at least one processor 202 may support at least one layer (e.g., physical (PHY), media access control (MAC), radio link control (RLC), packet data convergence protocol (PDCP), and radio resource (RRC). control) and functional layers such as SDAP (service data adaptation protocol) can be implemented.
  • At least one processor 202 may generate at least one protocol data unit (PDU) and/or at least one service data unit (SDU) according to the description, function, procedure, proposal, method, and/or operation flowchart disclosed in this document. can be created.
  • PDU protocol data unit
  • SDU service data unit
  • At least one processor 202 may generate messages, control information, data, or information according to the descriptions, functions, procedures, suggestions, methods, and/or operational flowcharts disclosed in this document. At least one processor 202 generates a signal (e.g., a baseband signal) containing a PDU, SDU, message, control information, data or information according to the functions, procedures, proposals and/or methods disclosed herein, It can be provided to at least one transceiver (206).
  • a signal e.g., a baseband signal
  • the at least one processor 202 may receive a signal (e.g., a baseband signal) from the at least one transceiver 206 and may be configured to receive a signal (e.g., a baseband signal) from the at least one transceiver 206, according to the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed herein. Accordingly, PDU, SDU, message, control information, data or information can be obtained.
  • a signal e.g., a baseband signal
  • a signal e.g., a baseband signal
  • At least one processor 202 may be referred to as a controller, microcontroller, microprocessor, or microcomputer. At least one processor 202 may be implemented by hardware, firmware, software, or a combination thereof. As an example, at least one application specific integrated circuit (ASIC), at least one digital signal processor (DSP), at least one digital signal processing device (DSPD), at least one programmable logic device (PLD), or at least one FPGA ( field programmable gate arrays) may be included in at least one processor 202.
  • ASIC application specific integrated circuit
  • DSP digital signal processor
  • DSPD digital signal processing device
  • PLD programmable logic device
  • FPGA field programmable gate arrays
  • Firmware or software configured to perform the descriptions, functions, procedures, suggestions, methods, and/or operation flowcharts disclosed in this document are included in at least one processor 202 or stored in at least one memory 204 to perform at least one It may be driven by the processor 202.
  • the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed in this document may be implemented using firmware or software in the form of codes, instructions and/or sets of instructions.
  • At least one memory 204 may be connected to at least one processor 202 and may store various types of data, signals, messages, information, programs, codes, instructions and/or commands. At least one memory 204 may be read only memory (ROM), random access memory (RAM), erasable programmable read only memory (EPROM), flash memory, hard drive, register, cache memory, computer readable storage medium, and/or these. It may be composed of a combination of . At least one memory 204 may be located inside and/or outside of at least one processor 202. Additionally, at least one memory 204 may be connected to at least one processor 202 through various technologies such as wired or wireless connections.
  • At least one transceiver 206 may transmit user data, control information, wireless signals/channels, etc. mentioned in the methods and/or operation flowcharts of this document to at least one other device. At least one transceiver 206 may receive user data, control information, wireless signals/channels, etc. mentioned in the description, function, procedure, proposal, method and/or operational flow chart, etc. disclosed in this document from at least one other device. there is.
  • at least one transceiver 206 may be connected to at least one processor 202 and may transmit and receive wireless signals.
  • at least one processor 202 may control at least one transceiver 206 to transmit user data, control information, or wireless signals to at least one other device.
  • At least one processor 202 may control at least one transceiver 206 to receive user data, control information, or wireless signals from at least one other device.
  • at least one transceiver 206 may be connected to at least one antenna 208, and at least one transceiver 206 may be connected to the description, function, procedure, and proposal disclosed in this document through at least one antenna 208. , may be set to transmit and receive user data, control information, wireless signals/channels, etc. mentioned in the method and/or operation flowchart.
  • at least one antenna may be a plurality of physical antennas or a plurality of logical antennas (eg, antenna ports).
  • At least one transceiver 206 converts the received wireless signal/channel from an RF band signal to a baseband in order to process the received user data, control information, wireless signal/channel, etc. using at least one processor 202. It can be converted into a signal. At least one transceiver 206 may convert user data, control information, wireless signals/channels, etc. processed using at least one processor 202 from a baseband signal to an RF band signal. To this end, at least one transceiver 206 may include an (analog) oscillator and/or filter.
  • the processor 202 may be referred to as a control unit
  • the transceiver 206 may be referred to as a communication unit
  • the memory 204 may be referred to as a storage unit.
  • the communication unit may be used to include at least a portion of the processor 202 and the transceiver 206.
  • the structure of the wireless device described with reference to FIG. 2 may be understood as the structure of at least a portion of various devices.
  • the structure of the wireless device illustrated in FIG. 2 is similar to the various devices described with reference to FIG. 1 (e.g., robot 100a, vehicle 100b-1, 100b-2, XR device 100c, portable It may be at least a part of a device (100d), a home appliance (100e), an IoT device (100f), and an AI device/server (100g).
  • the device may further include other components.
  • the device may be a portable device such as a smartphone, smartpad, wearable device (e.g., smart watch, smart glasses), portable computer (e.g., laptop, etc.).
  • the device supplies power, a power supply including a wired/wireless charging circuit, a battery, etc., and at least one port for connection to another device (e.g., audio input/output port, video input/output port).
  • a power supply including a wired/wireless charging circuit, a battery, etc.
  • at least one port for connection to another device e.g., audio input/output port, video input/output port.
  • It may further include at least one of an interface unit including an input/output unit for inputting and outputting video information/signals, audio information/signals, data, and/or information input from a user.
  • the device may be a mobile device such as a mobile robot, vehicle, train, aerial vehicle (AV), ship, etc.
  • the device is a driving unit that includes at least one of the device's engine, motor, power train, wheel, brake, and steering device, and a power supply unit that supplies power and includes a wired/wireless charging circuit, battery, etc., device, or device.
  • the device may be an XR device such as a HMD, a head-up display (HUD) installed in a vehicle, a television, a smartphone, a computer, a wearable device, a home appliance, a digital signage, a vehicle, a robot, etc. .
  • the device includes a power supply unit that supplies power and includes a wired/wireless charging circuit, a battery, etc., an input/output unit that obtains control information and data from the outside, and outputs the generated XR object, the device, or the device's surroundings. It may further include at least one of a sensor unit that senses status information, environmental information, and user information.
  • a device may be a robot that can be classified into industrial, medical, household, military, etc. depending on the purpose or field of use.
  • the device may further include at least one of a sensor unit that senses status information, environment information, and user information about the device or its surroundings, and a drive unit that performs various physical operations, such as moving robot joints.
  • devices include AI devices such as TVs, projectors, smartphones, PCs, laptops, digital broadcasting terminals, tablet PCs, wearable devices, set-top boxes (STBs), radios, washing machines, refrigerators, digital signage, robots, vehicles, etc.
  • the device includes an input unit that acquires various types of data from the outside, an output unit that generates output related to vision, hearing, or tactile sensation, a sensor unit that senses status information, environmental information, and user information on or around the device, and a learning unit. It may further include at least one training unit that learns a model composed of an artificial neural network using data.
  • the structure of the wireless device illustrated in FIG. 2 may be understood as part of a RAN node (eg, base station, DU, RU, RRH, etc.). That is, the device illustrated in FIG. 2 may be a RAN node. In this case, the device may further include a wired transceiver for front haul and/or back haul communication. However, if the fronthaul and/or backhaul communication is based on wireless communication, at least one transceiver 206 illustrated in FIG. 2 is used for the fronthaul and/or backhaul communication, and the wired transceiver may not be included.
  • a RAN node eg, base station, DU, RU, RRH, etc.
  • Figure 3 shows a method of processing a transmission signal applied to the present disclosure.
  • the transmission signal may be processed by a signal processing circuit.
  • the signal processing circuit 300 may include a scrambler 310, a modulator 320, a layer mapper 330, a precoder 330, a resource mapper 350, and a signal generator 360.
  • the operation/function of FIG. 3 may be performed by the processor 202 and/or the transceiver 206 of FIG. 2.
  • the hardware elements of FIG. 3 may be implemented in the processor 202 and/or transceiver 206 of FIG. 2.
  • blocks 310 to 360 may be implemented in processor 202 of FIG. 2.
  • blocks 310 to 350 may be implemented in the processor 202 of FIG. 2
  • block 360 may be implemented in the transceiver 206 of FIG. 2, and are not limited to the above-described embodiment.
  • the codeword can be converted into a wireless signal through the signal processing circuit 300 of FIG. 3.
  • a codeword is a coded bit sequence of an information block.
  • the information block may include a transport block (e.g., UL-SCH transport block, DL-SCH transport block).
  • Wireless signals may be transmitted through various physical channels (e.g., PUSCH, PDSCH).
  • the codeword may be converted into a scrambled bit sequence by the scrambler 310.
  • the scramble sequence used for scrambling is generated based on an initialization value, and the initialization value may include ID information of the wireless device.
  • the scrambled bit sequence may be modulated into a modulation symbol sequence by the modulator 320.
  • Modulation methods may include pi/2-binary phase shift keying (pi/2-BPSK), m-phase shift keying (m-PSK), and m-quadrature amplitude modulation (m-QAM).
  • the complex modulation symbol sequence may be mapped to at least one transport layer by the layer mapper 330.
  • the modulation symbols of each transport layer may be mapped to the corresponding antenna port(s) by the precoder 330.
  • the output z of the precoder 330 can be obtained by multiplying the output y of the layer mapper 330 with the precoding matrix W of N ⁇ M.
  • N is the number of antenna ports and M is the number of transport layers.
  • the precoder 330 may perform precoding after performing transform precoding (eg, discrete Fourier transform (DFT) transform) on complex modulation symbols. Additionally, the precoder 330 may perform precoding without performing transform precoding.
  • transform precoding eg, discrete Fourier transform (DFT) transform
  • the resource mapper 350 can map the modulation symbols of each antenna port to time-frequency resources.
  • a time-frequency resource may include a plurality of symbols (e.g., CP-OFDMA symbol, DFT-s-OFDMA symbol) in the time domain and a plurality of subcarriers in the frequency domain.
  • the signal generator 360 generates a wireless signal from the mapped modulation symbols, and the generated wireless signal can be transmitted to another device through each antenna.
  • the signal generator 360 may include an inverse fast fourier transform (IFFT) module, a cyclic prefix (CP) inserter, a digital-to-analog converter (DAC), a frequency uplink converter, etc. .
  • IFFT inverse fast fourier transform
  • CP cyclic prefix
  • DAC digital-to-analog converter
  • the signal processing process for the received signal in the wireless device may be configured as the reverse of the signal processing processes 310 to 360 of FIG. 3.
  • a wireless device eg, 200 in FIG. 2 may receive a wireless signal from the outside through an antenna port/transceiver.
  • the received wireless signal can be converted into a baseband signal through a signal restorer.
  • the signal restorer may include a frequency downlink converter, an analog-to-digital converter (ADC), a CP remover, and a fast fourier transform (FFT) module.
  • ADC analog-to-digital converter
  • FFT fast fourier transform
  • the baseband signal can be restored to a codeword through a resource de-mapper process, postcoding process, demodulation process, and de-scramble process.
  • a signal processing circuit for a received signal may include a signal restorer, resource de-mapper, postcoder, demodulator, de-scrambler, and decoder.
  • FIG. 4 shows a communication procedure between a terminal and a base station applicable to the present disclosure.
  • FIG. 4 illustrates operations in which the terminal 410 and the base station 420 transmit and/or receive data and operations performed prior thereto.
  • the terminal 410 and the base station 420 perform synchronization.
  • the terminal 410 performs an initial cell search operation.
  • the terminal 410 may detect at least one synchronization signal transmitted from the base station 420 according to a predefined rule.
  • the synchronization signal may include a plurality of synchronization signals (eg, primary synchronization signal, secondary synchronization signal) classified according to structure or purpose.
  • the terminal 410 can confirm the boundary of the frame, subframe, slot, and/or symbol of the base station 420 and obtain information (e.g., cell identifier) about the base station 420. .
  • the terminal 410 obtains system information transmitted from the base station 420.
  • System information is information related to the attributes, characteristics, and/or capabilities of the base station 420 necessary to access the base station 420 and use the service, including content (e.g., whether it is essential for connection), transmission structure, etc. It can be classified according to (e.g., the channel used, whether it is provided on-demand), etc., and can be classified into, for example, MIB (master information block) and SIB (system information block).
  • the terminal 410 may transmit a signal requesting system information prior to receiving the system information. However, requesting and providing system information may be performed after a random access procedure described later.
  • the terminal 410 and the base station 420 perform a random access procedure.
  • the terminal 410 sends at least one message for a random access procedure based on information related to the random access channel of the base station 420 (e.g., channel location, channel structure, structure of supported preamble, etc.) obtained through system information. (e.g. random access preamble, random access response (RAR) message, etc.) may be transmitted and/or received.
  • the terminal 410 transmits a preamble (e.g., MSG1) through a random access channel, receives a RAR message (e.g., MSG2), and uses the scheduling information included in the RAR message to send the terminal to the terminal 410.
  • a preamble e.g., MSG1
  • RAR message e.g., MSG2
  • a message (e.g., MSG3) containing related information (e.g., identification information) may be transmitted to the base station 420, and a message (e.g., MSG4) for contention resolution and/or connection establishment may be received.
  • MSG1 and MSG3 may be transmitted and received as one message, or MSG2 and MSG4 may be transmitted and received as one message.
  • the terminal 410 and the base station 420 perform signaling of control information.
  • the control information refers to the layer that controls the connection (e.g., radio resource control (RRC) layer), the layer that handles mapping between logical channels and transport channels (e.g., media access control (MAC) layer), and the physical channel. It can be defined in various layers, such as a layer that processes (e.g., PHY (physical) layer).
  • RRC radio resource control
  • MAC media access control
  • PHY physical layer
  • the terminal 410 and the base station 420 may perform at least one of signaling to establish a connection, signaling to determine settings related to communication, and signaling to indicate allocated resources.
  • the terminal 410 and the base station 420 transmit and/or receive data.
  • the terminal 410 and the base station 420 may process, transmit, and/or receive data based on signaling of control information.
  • the terminal 410 or the base station 420 performs channel encoding, rate matching, scrambling, constellation mapping, layer mapping, and waveform modulation on the information bits. At least one of antenna mapping and resource mapping may be performed.
  • the terminal 410 or the base station 420 performs at least one of signal extraction from resources, waveform demodulation for each antenna, signal placement considering layer mapping, constellation demapping, descrambling, and channel decoding. can do.
  • the 5G system defines various operating bands within frequency range 1 (FR1), which includes 410 MHz to 7125 MHz, and frequency range 2 (FR2), which includes 24,250 MHz to 71,000 MHz.
  • FR1 frequency range 1
  • FR2 frequency range 2
  • Various frequencies are being discussed as operating bands for the future 6G system, and the use of frequencies higher than those of the 5G system for wider bandwidth and higher transmission rates is also being considered.
  • THz Transmissionhertz
  • the THz frequency band is a band that has both radio wave transparency and light wave propagation, and communication using the THz frequency band is expected to play a transitional role from existing radio wave-based communication to light wave-based communication.
  • the 6G system utilizing the THz frequency band has i) very high data rates per device, ii) very large number of connected devices, iii) global connectivity, iv) very low latency, and v) battery-free.
  • the purpose is to reduce the energy consumption of (battery-free) IoT devices, vi) ultra-reliable connectivity, and vi) connected intelligence with machine learning capabilities.
  • the vision of the 6G system can be four aspects such as “intelligent connectivity”, “deep connectivity”, “holographic connectivity”, and “ubiquitous connectivity”, and the 6G system is designed to satisfy the requirements as shown in [Table 1] below. It can be.
  • the 6G system includes enhanced mobile broadband (eMBB), ultra-reliable low latency communications (URLLC), massive machine type communications (mMTC), AI integrated communication, and tactile communication.
  • eMBB enhanced mobile broadband
  • URLLC ultra-reliable low latency communications
  • mMTC massive machine type communications
  • AI integrated communication and tactile communication.
  • tactile internet high throughput, high network capacity, high energy efficiency, low backhaul and access network congestion, and improved data security. It may have key factors such as enhanced data security.
  • Figure 5 shows an example of a communication structure that can be provided in a 6G system applicable to the present disclosure. Referring to Figure 5, the 6G system is expected to have simultaneous wireless communication connectivity 50 times higher than that of the 5G wireless communication system.
  • URLLC a key feature of 5G, is expected to become an even more mainstream technology in 6G communications by providing end-to-end delays of less than 1ms.
  • the 6G system will have much better volume spectrum efficiency, unlike the frequently used area spectrum efficiency.
  • 6G systems can provide very long battery life
  • AI artificial intelligence
  • THz Terahertz
  • FSO backhaul network large-scale MIMO technology
  • blockchain 3D networking
  • quantum communication and unmanned technology.
  • Aircraft cell-free communication, wireless information and energy transfer (WIET), integration of sensing and communication, integration of access backhaul networks, holographic beamforming, big data analysis, LIS ( Technologies such as large intelligent surfaces can be adopted.
  • WIET wireless information and energy transfer
  • THz communication is communication that uses the spectrum of the frequency band between 0.1 THz and 10 THz with a corresponding wavelength in the range of 0.03mm-3mm as shown in FIG. 6, and can be implemented using circuit elements with the structure shown in FIG. 7. You can.
  • optical wireless technology is a technology that generates and modulates THz signals using optical devices, and can be implemented based on devices having structures such as those shown in FIGS. 8, 9, 10, and 11.
  • AI can be implemented based on various models such as neural networks and machine learning (machine models).
  • an AI model with a neural network structure may be based on the structure of a perceptron as shown in FIG. 12.
  • the artificial neural network may be composed of several perceptrons.
  • each component is multiplied by the weight ⁇ W1, W2, x, Wd ⁇ , and the results are added together
  • the activation function ⁇ ( ⁇ ) is applied.
  • the input vector can be applied to different multi-dimensional perceptrons.
  • a neural network having an input layer, a hidden layer, and an output layer as shown in FIG. 13 can be formed.
  • the data collection block 1410 performs data preparation on input data collected from objects (e.g., UE, RAN node, network node, etc.) to generate training data 1411 including processed input data. ) and/or generate inference data 1411.
  • the model training block 1420 performs training on an AI model using the training data 1411 and provides information about the trained model to the model inference block 1430.
  • the model inference block 1430 generates output 1416 by performing inference and/or prediction using the inference data 1411.
  • the model inference block 1430 may provide model performance feedback 1414 to the model training block 1420.
  • the output 1416 refers to the inference output of the AI model generated by the model inference block 1430, and the details of the inference output may vary depending on the use case.
  • the actor block 1440 triggers or performs a designated task/action based on the output 1416. Actor block 1440 may trigger tasks/actions on itself or on other objects (e.g., at least one UE, at least one RAN node, at least one network node, etc.). Any one of the functions illustrated in FIG. 14 described above may be performed through collaboration between two or more entities among the RAN, a network node, a network operator's OAM, or a UE. This may be referred to as a split AI operation.
  • FIG. 15 shows an example of a procedure for utilizing an AI model applicable to this disclosure.
  • FIG. 15 illustrates a case where a model training function (e.g., a function of the model training block 1420) is included in a network node, and a model inference function (e.g., a function of the model inference block 1430) is included in a RAN node.
  • a model training function e.g., a function of the model training block 1420
  • a model inference function e.g., a function of the model inference block 1430
  • RAN Node 1 and RAN Node 2 can transmit data collected from the UE (e.g., UE measurements related to RSRP, RSRQ, SINR of the serving cell and neighboring cells, UE location, speed, etc.) to the network node. there is.
  • the network node trains the AI model using the received training data.
  • the network node distributes/updates the AI model to RAN Node 1 and/or RAN Node 2.
  • RAN Node 1 and/or RAN Node 2 may continue to perform model training based on the received AI model. In this procedure, it is assumed that the AI model is distributed/updated only to RAN Node 1.
  • RAN node 1 receives input data (e.g., inference data) for AI model inference from the UE and RAN node 2.
  • RAN Node 1 generates output data (e.g., prediction or decision) by performing AI model-based inference using the received inference data.
  • RAN node 1 may transmit model performance feedback to the network node, if applicable.
  • RAN node 1, RAN node 2, and UE (or 'RAN node 1 and UE', or 'RAN node 1 and RAN node 2') perform an action based on the output data. For example, in the case of load balancing operation, the UE may move from RAN node 1 to RAN node 2.
  • RAN node 1 and RAN node 2 transmit feedback information to the network node.
  • Figure 16 shows another example of a procedure for utilizing an AI model applicable to this disclosure.
  • Figure 16 illustrates a case where a model training function (eg, a function of the model training block 1420) and a model inference function (eg, a function of the model inference block 1430) are included in a RAN node.
  • the UE and RAN node 2 transmit input data (e.g., training data) for training an AI model to RAN node 1.
  • RAN node 1 trains the AI model using the received training data.
  • RAN node 1 receives input data (e.g., inference data) for AI model-based inference from the UE and RAN node 2.
  • RAN Node 1 In step 4, RAN Node 1 generates output data (e.g., prediction or decision) by performing AI model-based inference using the received inference data.
  • output data e.g., prediction or decision
  • RAN node 1 and UE or 'RAN node 1 and UE', or 'RAN node 1 and RAN node 2'
  • the UE may move from RAN node 1 to RAN node 2.
  • RAN node 2 transmits feedback information to RAN node 1.
  • FIG. 17 shows another example of a procedure for utilizing an AI model applicable to this disclosure.
  • FIG. 17 illustrates a case where a model training function (e.g., a function of the model training block 1420) is included in the RAN node, and a model inference function (e.g., a function of the model inference block 1430) is included in the UE.
  • the UE transmits input data (e.g., training data) for training an AI model to the RAN node.
  • the RAN node may collect data from various UEs and/or from other RAN nodes.
  • the RAN node trains the AI model using the received training data.
  • the RAN node distributes/updates the AI model to the UE.
  • the UE may continue to perform model training based on the received AI model.
  • input data e.g., inference data
  • the UE generates output data (e.g. prediction or decision) by performing AI model-based inference using the received inference data.
  • the UE may transmit model performance feedback to the RAN node.
  • the UE and RAN node perform operations based on the output data.
  • the UE transmits feedback information to the RAN node.
  • an AI model can be trained and utilized in a wireless communication system.
  • various data such as input data, training data, and inference data were introduced, and the specific contents of the above-mentioned data may vary depending on the task for which the AI model is utilized.
  • information used in various embodiments of the present disclosure described below may be included in the above-described data.
  • Figure 18 shows a communication procedure based on AI technology applicable to the present disclosure.
  • the detailed procedures illustrated in FIG. 18 may be combined with various embodiments of the present disclosure described later.
  • data generated according to various embodiments of the present disclosure may be used for operations (e.g., setup, training, inference, and/or data transmission and reception) in at least one of the detailed procedures illustrated in FIG. 18. .
  • the results of the inference illustrated in FIG. 18 may be used to transmit and/or receive data according to various embodiments of the present disclosure.
  • step 1801 at least one of the UE 1810, the RAN node 1820, and the network node 1830 performs an initial access procedure. For example, in this step, at least one of an initial cell search operation, a system information acquisition operation, a random access operation, and a registration operation may be performed.
  • step 1803 at least one of the UE 1810, the RAN node 1820, and the network node 1830 performs a configuration procedure.
  • the setup procedure parameters, resources, and connections required to perform subsequent procedures in at least one layer between the UE 1810 and the RAN node 1820 and/or the UE 1810 and the network node 1830 and/or entities may be determined and/or created.
  • the setup procedure may be performed based on information, status, and/or characteristics of the AI model used for subsequent training and inference.
  • step 1805 at least one of the UE 1810, the RAN node 1820, and the network node 1830 performs a model training procedure.
  • At least one of the UE 1810, the RAN node 1820, and the network node 1830 may collect training data and perform learning using the training data.
  • the model training procedure may be performed as described with reference to Figures 15, 16, or 17. If an offline trained model is used, this step can be omitted.
  • a task is a procedure belonging to a communication protocol, which is a preliminary operation for subsequent data transmission and/or reception, is involved in sending and/or receiving data, or is a processing of data (e.g. encoding, decoding, etc.). may be related to
  • step 1809 at least one of the UE 1810, the RAN node 1820, and the network node 1830 transmits and/or receives data.
  • the result of the task performed in step 1807 can be used.
  • the task performed in step 1807 may include transmitting and/or receiving data, in which case this step is part of step 1807 and may be omitted.
  • the present disclosure relates to learning of an artificial intelligence model applied to implement at least some functions of a device in a wireless communication system, and is intended to perform online learning using signals that have passed through an actual channel.
  • the present disclosure relates to a technology for determining the label of learning data required to perform online learning, and proposes various embodiments for sharing label data between a plurality of devices that perform communication. do. That is, the present disclosure proposes a technology for promising labels necessary for supervised learning when performing online learning and performing online learning using the promised labels.
  • offline learning is a method of learning offline based on modeled transmission and reception simulation. Because offline learning takes place offline, it assumes that there is an absolute person who knows everything within the simulation. In other words, it is possible to assume that everything is known, whether it is the channel environment or actually generated data, so labels can already be secured during supervised learning. However, in the case of offline learning techniques, it is impossible to model everything that can happen in a real environment, and in this respect, there is a limitation that it can only work well in a modeled environment.
  • online learning is a method of performing learning using signals that pass through an actual channel while deployed in a wireless communication environment.
  • learning can be performed in accordance with environmental changes or in areas that have not been modeled in accordance with the actual environment.
  • offline learning online learning has the potential to secure better performance because it learns based on real environment data.
  • offline learning is performed from a pre-training perspective for the parts that can be primarily modeled, and the neural network is continuously updated through additional online learning after actual deployment. A method of doing it can be used.
  • there are important problems when conducting online learning Specifically, when applying general supervised learning to online learning, there is a problem as to how the receiving device can know the label in an actual communication situation.
  • the channel is only estimated without knowing the channel itself.
  • the transmitting device transmits a reference signal with a known value and the receiving device receives the reference signal
  • the channel is only estimated without knowing the channel itself.
  • the receiving device cannot know the correct answer, i.e. the label. If you do not know the label, it is the same as not knowing the error due to channel estimation, so it is not possible to perform learning.
  • a channel equalizer To train a channel equalizer, a received signal as input and a channel equalized signal as output are required.
  • the channel affects the data
  • the limitation of the correct answer channel is that learning can only be performed while treating the estimated channel as the correct answer, as mentioned above. Therefore, in the online learning environment, since the actual channel is not known, other functional blocks are bound to be affected.
  • the present disclosure proposes a method for determining a label using a common rule and various embodiments related thereto.
  • a method for transmitting labels for supervised learning of the transmitting device and receiving device is needed.
  • One conceivable method is to perform end-to-end learning using the bit sequence transmitted from the transmitting device and the bit sequence restored from the receiving device.
  • a method of performing learning at the data level through CRC may be considered.
  • CRC cyclic redundancy check
  • the CRC check fails, the actual transmitted bit sequence cannot be known, so learning is also impossible.
  • learning is impossible.
  • the reference signal and the channel itself are unknown, online learning is said to be impossible.
  • Figure 19 shows an example of a procedure for performing online learning for an artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 19 illustrates operations in which a device performs learning on an artificial intelligence model used for a reception operation, and illustrates a terminal operation method.
  • control information may include scheduling information for a later received data signal.
  • control information may include DCI or SCI.
  • control information may include configuration information for online learning.
  • setting information for online learning may include at least one of information related to the online learning section, information related to the artificial intelligence model being trained, and information related to rules for determining the label.
  • control information may be received through one message or multiple messages.
  • the device receives a data signal.
  • the device may receive a data signal based on the control information received in step S1901.
  • a device may receive a data signal through a resource indicated by scheduling information included in control information.
  • the device may receive a data signal during the online learning period indicated by setting information included in the control information.
  • step S1905 the device restores data.
  • Data can be restored by a series of processing operations on the received data signal.
  • the series of processing operations includes at least one of OFDM demodulation, channel estimation, equalization, constellation demapping, and channel decoding.
  • at least one operation among a series of processing operations is performed using an artificial intelligence model.
  • the device can obtain an estimate of the bit sequence included in the data signal.
  • the bit sequence may be included in the data signal in the form of a transport block or in the form of uncoded data.
  • the estimation of the bit sequence may have an error compared to the transport block or bit sequence transmitted from the other device.
  • the device performs learning on the artificial intelligence model.
  • the device can perform learning using the restored data.
  • the device determines the transmission value for the restored data, that is, the value of the bit sequence transmitted from the other device.
  • the device determines the label.
  • the device may determine the label according to a predefined rule based on information related to control information or data signals. Accordingly, the device can calculate the error in the estimation of the transport block based on the label, determine the loss value based on the error, and update the weights of the artificial intelligence model.
  • the artificial intelligence model may include a neural network designed to perform at least one function for communication (e.g., signal processing, data processing, channel estimation, beam management, etc.).
  • the device transmits feedback information.
  • the feedback information is feedback information corresponding to a data signal and may include HARQ-ACK/NACK.
  • the feedback information may include slope information for updating the artificial intelligence model used in the other device. In other words, if the neural network of the artificial intelligence model that is the target of online learning exists across the other device and the device, the gradient information generated by the backpropagation operation of the neural network in the device is used for learning the neural network used in the other device. Can be transmitted to the device.
  • Figure 20 shows an example of a procedure for supporting online learning for an artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 20 shows operations in which a device supports learning of an artificial intelligence model used for a reception operation in a counterpart device, and illustrates an operating method of a base station or terminal.
  • control information may include scheduling information for a later received data signal.
  • control information may include DCI or SCI.
  • control information may include configuration information for online learning.
  • setting information for online learning may include at least one of information related to the online learning section, information related to the artificial intelligence model being trained, and information related to rules for determining the label.
  • control information may be transmitted through one message or multiple messages.
  • step S2003 the device generates a data signal.
  • a data signal may be generated through a series of operations including at least one of channel encoding, constellation mapping, resource mapping, and OFDM modulation for a transport block.
  • the device may determine a label for online learning and generate a transport block including the label.
  • the device may determine the label according to a predefined rule based on information related to control information or data signals.
  • step S2005 the device transmits a data signal.
  • the device may transmit the data signal generated in step S2003 based on the control information transmitted in step S2001.
  • a device may transmit a data signal through a resource indicated by scheduling information included in control information.
  • the device may transmit a data signal during the online learning period indicated by setting information included in the control information.
  • the device receives feedback information.
  • the feedback information is feedback information corresponding to a data signal and may include HARQ-ACK/NACK.
  • the feedback information may include slope information for updating the artificial intelligence model used in the device. In other words, if the neural network of the artificial intelligence model that is the target of online learning exists across the device and the other device, the gradient information generated by the backpropagation operation of the neural network in the other device is used for learning the neural network used in the device. can be delivered to
  • the device performs learning on the artificial intelligence model.
  • the device can update the weights included in the artificial intelligence model by performing backpropagation using the gradient information included in the feedback information received in step S2007.
  • this step may be omitted.
  • Figure 21 shows an example of a procedure for determining a label for online learning according to an embodiment of the present disclosure.
  • Figure 21 is a method of operating a device that communicates with another device and illustrates operations for generating label data for online learning.
  • the device may be a base station or a terminal.
  • shared information refers to information commonly known through the operation of transmitting and/or receiving label data without any additional procedures.
  • shared information may include information related to a resource that carries at least one signal transmitted in the process of transmitting and/or receiving label data through a channel.
  • identification information, location information, index, etc. for the resource may be determined as reference information. Since the resource that transmits the signal is information that can be known without additional procedures, the same label can be determined if the same rule is used.
  • information related to resources may include at least one of frame index, subframe index, slot index, subcarrier index, frequency index, number of RBs, RB index, start symbol index, SSB detection point, and number of repetitions of the data signal. You can.
  • step S2093 the device determines label data based on reference information.
  • Bit sequences available as label data and label indexes corresponding to the bit sequences are predefined in the form of a table or formula.
  • rules for deriving a label index from reference information are also defined in advance. Accordingly, when the reference information is determined, the device can determine a label index based on the reference information and determine label data based on the determined label index.
  • label data may be determined based on shared information, for example, information related to resources transmitting signals.
  • the resource that delivered the control information or data signal is information that can be known by the device and the other device without additional procedures, so if the same rule is used, the same label can be determined.
  • information related to resources includes at least one of frame index, subframe index, slot index, subcarrier index, frequency index, number of RB (resource blocks), RB index, start symbol index, SSB detection point, and number of repetitions of data signal. It can contain one.
  • the rules for determining the label can be defined in advance.
  • labels may be defined according to predefined rules as shown in [Table 2] below.
  • label index bit sequence One 0100100110 ... 11111010101 2 0011000110 ... 10010001001 ... ... N 1110111011 ... 11101111011
  • the label index and the corresponding label bit sequence can be promised in advance.
  • the number of label indexes and the length of the label e.g., bit size
  • the bit size of the label can be promised in various ways in advance.
  • other methods other than tables may be used to generate mutually promised bit sequences based on indexes.
  • the label can be determined using a function that takes as input a label index or a value related to the label index.
  • multiple tables can be defined, and one table can be selectively used depending on the artificial intelligence model being trained, task, etc.
  • systemFrameNumber included in the MIB of NR has a value between 0 and 1023. If the number N of labels is 1024 and the frame number is 23, the bit sequence corresponding to label index 23 is used as a label. Therefore, according to one embodiment, the transmitting device may generate and transmit a transport block (TB) including a bit sequence of 512 bits.
  • the receiving device receives the signal transmitted from the transmitting device, decodes the received signal, determines the bit sequence promised to correspond to the label index 23 as the label, i.e., the correct answer, and determines the bit error, i.e., the loss function. (loss function) can be calculated. Based on the loss function, the receiving device can update the neural network by performing back propagation.
  • the frame index is used to derive the label index.
  • the subframe index can be defined as “frame index ⁇ # of subframes in frame + subframe index”.
  • FIG. 22 shows an example of a procedure for performing learning on an artificial intelligence model according to an embodiment of the present disclosure.
  • FIG. 22 illustrates signal exchange for online learning of an artificial intelligence model (eg, neural network model) used in at least one of the first device 2210 and the second device 2220.
  • an artificial intelligence model eg, neural network model
  • the second device 2220 transmits an online learning request message to the first device 2210.
  • the second device 2220 requests to perform online learning on the artificial intelligence model used in the second device 2220.
  • the online learning request message may include at least one of information related to the artificial intelligence model to be trained and information related to the learning history of the artificial intelligence model.
  • step S2203 the first device 2210 transmits an online learning response message to the second device 2220.
  • the first device 2210 responds whether the request is accepted in response to the online learning request message.
  • the online learning response message instructs to perform online learning.
  • the online learning response message is setting information for online learning, for example, information related to the start time of the online learning section 2202 (e.g., number of frame, subframe or slot, frame, sub frame or slot unit offset, etc.), information related to the labels used in online learning (e.g., label decision rules or table assignment, available label indices, etc.), and information related to feedback on gradient information (e.g., whether to feedback, feedback, etc.) may include at least one of information indicating resource allocation for, etc.
  • information related to the start time of the online learning section 2202 e.g., number of frame, subframe or slot, frame, sub frame or slot unit offset, etc.
  • information related to the labels used in online learning e.g., label decision rules or table assignment, available label indices, etc.
  • information related to feedback on gradient information e.g., whether to feedback, feedback, etc.
  • information related to feedback on gradient information may include at least one of information indicating resource allocation for, etc.
  • step S2205 the first device 2210 generates data based on the selected label bit sequence using the frame index. That is, the first device 2210 can check the frame index, determine the label index based on the confirmed frame index, and check the bit sequence corresponding to the determined label index.
  • the first device 2210 transmits label data to the second device 2220. That is, the first device 2210 may transmit a signal including the bit sequence confirmed in step S2205 as a payload. To this end, although not shown in FIG. 22, the first device 2210 or the second device 2220 may transmit control information before transmitting label data.
  • control information may include scheduling information for label data.
  • the second device 2220 detects data and calculates loss based on the selected label bit sequence using the frame index. That is, the second device 2220 performs demodulation and decoding on the received signal, and compares the bits obtained through decoding and the label bit sequence. If the bits and label bit sequence are the same, the loss is 0. However, if the bits and the label bit sequence are different, the loss value may be determined based on the difference between the bits and the label bit sequence.
  • the second device 2220 updates the neural network using the calculated gradient.
  • the second device 2220 can update the weights included in the neural network by performing a backpropagation operation based on the loss value. That is, the second device 2220 can update the weight value of the neural network using the gradient so that the loss value is reduced.
  • step S2213 the second device 2220 transmits tilt information to the first device 2210.
  • This step is performed when at least part of the artificial intelligence model to be trained is also used in the first device 2210. That is, if the artificial intelligence model to be trained is used only in the second device 2220, that is, if it is related only to the operation of the second device 2220, this step may be omitted.
  • the first device 2220 and the second device 2220 are two devices that perform communication.
  • the first device 2210 uses artificial intelligence to perform a transmitting operation and the second device 2220 performs a receiving operation. model is available.
  • the first device 2220 and the second device 2220 can be understood as a base station and a terminal.
  • the first device 2220 and the second device 2220 can be understood as a terminal and a base station.
  • the first device 2220 and the second device 2220 can be understood as a terminal and a terminal. That is, the above-described procedure can be performed for combinations such as base station-terminal, terminal-base station, terminal-terminal, etc.
  • devices can determine the label using the same rule based on the index of the frame, subframe, or slot. Accordingly, if the index of a frame, subframe, or slot is common, devices can determine a label with the same bit sequence.
  • a frame, subframe, or slot is a unit of resources that transmits signals to be transmitted and received between devices. Therefore, regardless of whether there is an error in the data included in the signal, if the signal has been transmitted and received, the devices will know the same index. .
  • the frame, subframe or slot related to the index used is a frame, subframe or slot that carries a data signal including the label as a transport block, a frame, subframe or slot that carries allocation information for the data signal, or an online It may be a frame, subframe, or slot that transmits setting information related to learning, or it may be a frame, subframe, or slot that transmits an SSB in which one of the devices detects a synchronization signal.
  • the index of a frame, subframe, or slot is used because it is not dependent on other factors and various values can be selected. Because the index of a frame, subframe, or slot increases sequentially, it is a variable that changes regardless of the communication environment or channel quality of the devices.
  • other information related to the resource that carried the signal other than the index of the frame, subframe, or slot, may be used to determine the label or label index.
  • information related to resources at least one of the frequency index, number of resource blocks (RB), RB index, start symbol index, SSB detection time, and number of repetitions of the data signal may be used. It is possible for other information to be used.
  • Examples of structures where artificial intelligence models are applied to part of the physical layer of the transmitting device and receiving device are as follows:
  • Figure 23 shows an example of a transmitting device and a receiving device that performs channel encoding/decoding using an artificial intelligence model according to an embodiment of the present disclosure.
  • the input bit sequence output from the predefined label index and label bit sequence block 2302 is divided into codeword units by the codebook segmentation block 2304, and the neural network They are converted into codewords by the channel encoder block 2306. Afterwards, the codewords are converted into modulation symbols through a rate matching block 2308, a scrambling block 2310, and a modulation block 2312. Subsequently, the DMRS output from the modulation symbols and DMRS generation block 2316 are mapped to layer(s) and REs by the layer and RE mapping block 231, and are converted to OFDM symbols by the OFDM modulator 2318. is converted to Thereafter, the OFDM symbol passes through the transmitter filter block 2320 and is transmitted over the wireless channel.
  • the signal that passes through the wireless channel is received by the receiving device.
  • the received signal is converted into modulation symbols for each subcarrier by the OFDM demodulator block 2322, and time and/or frequency offset by the sample timing offset (STO) and carrier frequency offset (CFO) correction block 2324. This is corrected.
  • STO sample timing offset
  • CFO carrier frequency offset
  • DMRS and modulation symbols are extracted by the layer and RE demapping block 2326, channel estimation is performed in the MMSE channel estimator block 2328, and equalization operation is performed based on the channel estimation result in the MMSE equalizer block 2330. do.
  • bit information (e.g., LLR value) is generated by the soft demodulation block 2332, descrambling block 2334, and rate dematching block 2336, and the bit information is sent to the neural network channel decoder 2338.
  • the neural network channel decoder 2338 outputs bits before channel encoding, and the bits are converted into a bit sequence by the codebook desegmentation block 2340.
  • the restored bit sequence and the predefined label index and label output from the label bit sequence block 2342 are input to the loss function calculation block 2344 and are used to determine the loss function. That is, the loss function calculation block 2344 determines the loss value using the restored bit sequence and the predefined label index and label output from the label bit sequence block 2342.
  • loss is calculated and learning can be performed based on a pre-defined label.
  • loss may include cross-entropy.
  • an error gradient for learning about the neural network channel encoder included in the transmission device is fed back.
  • the receiving device in the process of calculating the error gradient, can easily calculate the gradient of the neural network channel decoder, but calculates the inverse of blocks that perform intermediate operations to deliver the gradient information to the transmitting device. There are difficulties to be had.
  • the slope according to the error can be calculated and transmitted by approximating all procedures between the channel encoder of the transmitting device and the channel decoder of the receiving device to a Gaussian channel. This is because it is possible to view whitening through the MMSE equalizer block 2330 despite channel fading.
  • FIG. 24 shows an example of a transmitting device and a receiving device that performs offset estimation and compensation using an artificial intelligence model according to an embodiment of the present disclosure.
  • the information bits are divided into codeword units by the codebook segmentation and CRC attachment block 2402, connected to the CRC, and codewords by the LDPC encoder block 2404. is converted to Afterwards, the codewords are converted by the rate matching block 2406 and the scrambling block 2408, and then converted into modulation symbols through the modulation block 2412.
  • the output of the scrambling block 2408 is not input to the modulation block 2412, and the label data output from the predefined label index and label bit sequence block 2410 is input to the modulation block 2412. It is input and converted into modulation symbols.
  • the DMRS output from the modulation symbols and DMRS generation block 2416 are mapped to layer(s) and REs by the layer and RE mapping block 2414, and converted into OFDM symbols by the OFDM modulator 2418. .
  • the OFDM symbol is then passed through the transmitter filter block 2420 and transmitted over the wireless channel.
  • the signal that passes through the wireless channel is received by the receiving device.
  • the received signal is converted into modulation symbols for each subcarrier by the OFDM demodulator block 2422, and time and/or frequency offset is corrected by the neural network-based STO and CFO correction block 2424.
  • DMRS and modulation symbols are extracted by the layer and RE demapping block 2426, channel estimation is performed in the MMSE channel estimator block 2428, and equalization operation is performed based on the channel estimation result in the MMSE equalizer block 2430. do.
  • bit information (e.g., LLR value) is generated by the soft demodulation block 2432, descrambling block 2434, and rate dematching block 2436, and the bit information is input to the LDPC decoder 2438.
  • the LDPC decoder 2438 outputs bits before channel encoding, and the bits are converted into a bit sequence by the codebook desegmentation and CRC separation block 2440.
  • the output of the soft demodulation block 2432 is input to the loss function calculation block 2442.
  • the output of the predefined label index and label bit sequence block 2444 is converted into modulation symbols by the modulation block 2446 and then input to the loss function calculation block 2442.
  • the loss function calculation block 2442 determines a loss value using the output of the soft demodulation block 2432 and the modulation symbols generated by the modulation block 2446.
  • online learning may be performed through channel coding, but learning may be performed at the uncoded bit level.
  • the receiving device compares the modulation of the demodulated constellation point and the label bit sequence to determine the mean square error (MSE) between the two signals. ) can be calculated as a loss function.
  • MSE mean square error
  • the receiving device may make a hard decision on the LLR and then calculate cross-entropy as a loss function at the bit level.
  • the slope calculated based on the error is used to update the neural network in the receiving device and may not be fed back to the transmitting device.
  • FIGS. 23 and 24 a case in which one block or a pair of blocks is replaced with neural network-based functional blocks is illustrated, but the present disclosure is not limited to this.
  • FIG. 23 illustrates a channel encoder/decoder with a neural network structure
  • FIG. 24 illustrates an STO and CFO correction block with a neural network structure.
  • all blocks included in the receiving and transmitting devices shown in FIGS. 23 and 24, such as the channel estimator and equalizer, or other blocks are designed to have a neural network structure, and are used in various embodiments of the present disclosure. Can be trained accordingly.
  • Container size according to label data size, etc. can be operated by scheduling. Additionally, in addition to the index of the frame, subframe, or slot, the lowest frequency index or starting symbol index scheduled in DCI may be additionally used.
  • a bit sequence obtained from the index of a frame, subframe, or slot can be converted into a signal label modulated according to the frame index. That is, the bit sequence determined based on the index of the frame, subframe, or slot is converted into modulation symbols, and at this time, the modulation method may be determined based on the index of the frame, subframe, or slot. For example, when using the 16-PSK series for phase learning and 16-QAM for nonlinear feature learning together, if the quotient of dividing the frame index by 16 is odd, use 16-PSK, and if the quotient is even, use 16-QAM. The bit sequence can be modulated. As another example, if the number of modulation methods used is 3 or more, the modulation methods may be selectively applied based on the result of the modulo operation on the frame index.
  • the receiving device confirms the modulation method using a bit sequence determined based on the index of the frame, subframe, or slot, and restores the data by processing (e.g., demodulating) the signal received using the confirmed modulation method. You can. Alternatively, the receiving device determines an estimate for the modulation symbol sequence based on the received signal, generates the modulation symbol sequence as a label by modulating the label with the confirmed modulation method, and then uses the estimate and label for the modulation symbol sequence. You can perform learning by doing this.
  • the number of available modulation methods and modulation methods can be promised in advance.
  • modulation methods usable as labels in the terminal can be set through separate signaling. That is, the number of modulation methods described above and the modulation methods may be operated differently depending on the learning purpose in a UE-specific manner. Therefore, in the process of negotiating capabilities for online learning, etc., the number of modulation methods and the modulation methods can be promised in advance.
  • FIG. 25 shows an example of a procedure for signaling competency information related to learning according to an embodiment of the present disclosure.
  • FIG. 25 illustrates a signal exchange for acquiring capability information related to online learning of an artificial intelligence model (eg, neural network model) used in at least one of the first device 2510 and the second device 2520.
  • an artificial intelligence model eg, neural network model
  • the second device 2520 transmits an online learning capability request message to the first device 2510.
  • the online learning capability request message may indicate at least one modulation method for an unencoded label.
  • the online learning ability request message may indicate modulation methods of index 3 and index 5.
  • the first device 2510 transmits an online learning ability response message to the second device 2520.
  • the online learning capability response message may indicate at least one modulation method for an unencoded label.
  • the online learning ability response message may indicate modulation schemes of index 3 and index 5.
  • modulation methods to be used can be set through capability information. In this way, before starting online learning, a set of modulation methods and corresponding types for unencoded methods can be promised in advance. Afterwards, during learning, the devices can operate while changing the modulation methods based on the index of the frame, subframe, or slot according to the corresponding modulation method. For this purpose, it is necessary for candidates of usable modulation schemes to be defined in advance. An example of candidates for usable modulation methods is shown in [Table 3] below.
  • the modulation methods are illustrated only by those that follow the existing constellation.
  • modulation methods for online learning can be defined in various other ways. Therefore, the modulation method can be expressed in a way that specifies the coordinates of the constellation points in addition to the name as shown in [Table 3]. For example, based on a constellation defined as ⁇ (1,j),(-1,-j) ⁇ or ⁇ (1,j),(-1,-j),(1,-j) ⁇ Any modulation scheme may be used.
  • the bit sequence and modulation method can be determined using the indexes of the frame, subframe, and slot.
  • the modulation scheme may be signaled separately.
  • a signal containing label data is transmitted, transmission of DCI or SCI for the signal is required.
  • the DCI or SCI includes information about the MCS level (hereinafter referred to as the 'MCS field'), it is possible to indicate the modulation method applied to the label using the MCS field.
  • the interpretation of the MCS field may be different from that of general data signals.
  • the proposed methods described above may be implemented independently, but may also be implemented in the form of a combination (or merge) of some of the proposed methods.
  • a rule may be defined so that the base station informs the terminal of the application of the proposed methods (or information about the rules of the proposed methods) through a predefined signal (e.g., a physical layer signal or a higher layer signal). .
  • Embodiments of the present disclosure can be applied to various wireless access systems.
  • Examples of various wireless access systems include the 3rd Generation Partnership Project (3GPP) or 3GPP2 system.
  • Embodiments of the present disclosure can be applied not only to the various wireless access systems, but also to all technical fields that apply the various wireless access systems. Furthermore, the proposed method can also be applied to mmWave and THz communication systems using ultra-high frequency bands.
  • embodiments of the present disclosure can be applied to various applications such as autonomous vehicles and drones.

Abstract

본 개시는 무선 통신 시스템에서 온라인 학습(online learning)을 수행하기 위한 것으로, 무선 통신 시스템에서 제1 장치의 동작 방법은, 제2 장치로부터 제어 정보를 수신하는 단계, 상기 제어 정보에 기반하여 데이터 신호를 수신하는 단계, 상기 데이터 신호에 포함된 데이터를 복원하는 단계, 상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하는 단계를 포함할 수 있다. 상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행될 수 있다.

Description

무선 통신 시스템에서 온라인 학습을 수행하기 위한 장치 및 방법
이하의 설명은 무선 통신 시스템에 대한 것으로, 무선 통신 시스템에서 온라인 학습(online learning)을 수행하기 위한 장치 및 방법에 관한 것이다.
무선 접속 시스템이 음성이나 데이터 등과 같은 다양한 종류의 통신 서비스를 제공하기 위해 광범위하게 전개되고 있다. 일반적으로 무선 접속 시스템은 가용한 시스템 자원(대역폭, 전송 전력 등)을 공유하여 다중 사용자와의 통신을 지원할 수 있는 다중 접속(multiple access) 시스템이다. 다중 접속 시스템의 예들로는 CDMA(code division multiple access) 시스템, FDMA(frequency division multiple access) 시스템, TDMA(time division multiple access) 시스템, OFDMA(orthogonal frequency division multiple access) 시스템, SC-FDMA(single carrier frequency division multiple access) 시스템 등이 있다.
특히, 많은 통신 기기들이 큰 통신 용량을 요구하게 됨에 따라 기존 RAT(radio access technology)에 비해 향상된 모바일 브로드밴드(enhanced mobile broadband, eMBB) 통신 기술이 제안되고 있다. 또한 다수의 기기 및 사물들을 연결하여 언제 어디서나 다양한 서비스를 제공하는 mMTC(massive machine type communications) 뿐만 아니라 신뢰성 (reliability) 및 지연(latency) 민감한 서비스/UE(user equipment)를 고려한 통신 시스템이 제안되고 있다. 이를 위한 다양한 기술 구성들이 제안되고 있다.
본 개시는 무선 통신 시스템에서 송신기 및/또는 수신기 모델의 온라인 학습(online learning)을 효과적으로 수행하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 실제 채널을 통과한 신호를 이용하는 온라인 학습을 가능케 하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 온라인 학습을 위한 레이블을 결정하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 공통되는 규칙에 기반하여 온라인 학습을 위한 레이블을 결정하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 장치들 간 공유된 정보에 기반하여 온라인 학습을 위한 레이블을 결정하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 장치들 간 레이블을 포함하는 신호를 송신하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 레이블을 포함하는 신호를 전달한 자원에 기반하여 레이블을 결정하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 스케줄링 결과에 독립적인 정보에 기반하여 레이블을 결정하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 레이블을 포함하는 신호에 대한 변조 방식을 결정하기 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 레이블을 포함하는 신호에 대한 변조 방식을 시그널링하기 위한 장치 및 방법을 제공할 수 있다.
본 개시에서 이루고자 하는 기술적 목적들은 이상에서 언급한 사항들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 이하 설명할 본 개시의 실시예들로부터 본 개시의 기술 구성이 적용되는 기술분야에서 통상의 지식을 가진 자에 의해 고려될 수 있다.
본 개시의 일 예로서, 무선 통신 시스템에서 제1 장치의 동작 방법은, 제2 장치로부터 제어 정보를 수신하는 단계, 상기 제어 정보에 기반하여 데이터 신호를 수신하는 단계, 상기 데이터 신호에 포함된 데이터를 복원하는 단계, 상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하는 단계를 포함할 수 있다. 상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행될 수 있다.
본 개시의 일 예로서, 무선 통신 시스템에서 제2 장치의 동작 방법은, 제1 장치에게 제어 정보를 송신하는 단계, 데이터 신호를 생성하는 단계, 상기 제어 정보에 기반하여 상기 데이터 신호를 송신하는 단계를 포함할 수 있다. 상기 데이터 신호는, 상기 데이터 신호를 처리하기 위해 상기 제1 장치에 의해 사용되는 인공지능 모델에 대한 학습을 수행하기 위해 사용되는 레이블에 기반하여 생성되고, 상기 레이블은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정될 수 있다.
본 개시의 일 예로서, 무선 통신 시스템에서 제1 장치는, 송수신기, 및 상기 송수신기와 연결된 프로세서를 포함하며, 상기 프로세서는, 제2 장치로부터 제어 정보를 수신하고, 상기 제어 정보에 기반하여 데이터 신호를 수신하고, 상기 데이터 신호에 포함된 데이터를 복원하고, 상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하도록 제어하며, 상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행될 수 있다.
본 개시의 일 예로서, 무선 통신 시스템에서 제2 장치는, 송수신기, 및 상기 송수신기와 연결된 프로세서를 포함하며, 상기 프로세서는, 제1 장치에게 제어 정보를 송신하고, 데이터 신호를 생성하고, 상기 제어 정보에 기반하여 상기 데이터 신호를 송신하도록 제어하며, 상기 데이터 신호는, 상기 데이터 신호를 처리하기 위해 상기 제1 장치에 의해 사용되는 인공지능 모델에 대한 학습을 수행하기 위해 사용되는 레이블에 기반하여 생성되고, 상기 레이블은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정될 수 있다.
본 개시의 일 예로서, 통신 장치는, 적어도 하나의 프로세서, 상기 적어도 하나의 프로세서와 연결되며, 상기 적어도 하나의 프로세서에 의해 실행됨에 따라 동작들을 지시하는 명령어를 저장하는 적어도 하나의 컴퓨터 메모리를 포함하며, 상기 동작들은, 제어 정보를 수신하는 단계, 상기 제어 정보에 기반하여 데이터 신호를 수신하는 단계, 상기 데이터 신호에 포함된 데이터를 복원하는 단계, 상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하는 단계를 포함할 수 있다. 상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행될 수 있다.
본 개시의 일 예로서, 적어도 하나의 명령어(instructions)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)는, 프로세서에 의해 실행 가능한(executable) 상기 적어도 하나의 명령어를 포함하며, 상기 적어도 하나의 명령어는, 장치가, 다른 장치로부터 제어 정보를 수신하고, 상기 제어 정보에 기반하여 데이터 신호를 수신하고, 상기 데이터 신호에 포함된 데이터를 복원하고, 상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하도록 제어하며, 상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행될 수 있다.
상술한 본 개시의 양태들은 본 개시의 바람직한 실시예들 중 일부에 불과하며, 본 개시의 기술적 특징들이 반영된 다양한 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 본 개시의 상세한 설명을 기반으로 도출되고 이해될 수 있다.
본 개시에 기초한 실시예들에 의해 하기와 같은 효과가 있을 수 있다.
본 개시에 따르면, 실제 채널을 이용한 온라인 학습(online learning)이 효과적으로 수행될 수 있다.
본 개시의 실시예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 이하의 본 개시의 실시예들에 대한 기재로부터 본 개시의 기술 구성이 적용되는 기술분야에서 통상의 지식을 가진 자에게 명확하게 도출되고 이해될 수 있다. 즉, 본 개시에서 서술하는 구성을 실시함에 따른 의도하지 않은 효과들 역시 본 개시의 실시예들로부터 당해 기술분야의 통상의 지식을 가진 자에 의해 도출될 수 있다.
이하에 첨부되는 도면들은 본 개시에 관한 이해를 돕기 위한 것으로, 상세한 설명과 함께 본 개시에 대한 실시예들을 제공할 수 있다. 다만, 본 개시의 기술적 특징이 특정 도면에 한정되는 것은 아니며, 각 도면에서 개시하는 특징들은 서로 조합되어 새로운 실시예로 구성될 수 있다. 각 도면에서의 참조 번호(reference numerals)들은 구조적 구성요소(structural elements)를 의미할 수 있다.
도 1은 본 개시에 적용 가능한 통신 시스템 예를 도시한다.
도 2는 본 개시에 적용 가능한 무선 장치의 예를 도시한다.
도 3은 본 개시에 적용 가능한 전송 신호를 처리하는 방법을 도시한다.
도 4는 본 개시에 적용 가능한 단말 및 기지국 간 통신 절차를 도시한다.
도 5는 본 개시에 적용 가능한 6G(6th generation) 시스템에서 제공 가능한 통신 구조의 일례를 도시한다.
도 6은 본 개시에 적용 가능한 전자기 스펙트럼을 도시한다.
도 7은 본 개시에 적용 가능한 THz 무선 통신 송수신기를 도시한다.
도 8은 본 개시에 적용 가능한 THz 신호 생성 방법을 도시한다.
도 9는 본 개시에 적용 가능한 무선 통신 송수신기를 도시한다.
도 10은 본 개시에 적용 가능한 송신기 구조를 도시한다.
도 11은 본 개시에 적용 가능한 변조기 구조를 도시한다.
도 12는 본 개시에 적용 가능한 인공 신경망에 포함되는 퍼셉트론(perceptron)의 구조를 도시한다.
도 13은 본 개시에 적용 가능한 인공 신경망 구조를 도시한다.
도 14는 본 개시에 적용 가능한 인공지능 기술의 적용을 위한 기능적 프레임워크의 예를 도시한다.
도 15는 본 개시에 적용 가능한 인공지능 모델을 활용하기 위한 절차의 예를 도시한다.
도 16은 본 개시에 적용 가능한 인공지능 모델을 활용하기 위한 절차의 다른 예를 도시한다.
도 17은 본 개시에 적용 가능한 인공지능 모델을 활용하기 위한 절차의 또 다른 예를 도시한다.
도 18은 본 개시에 적용 가능한 AI 기술 기반의 통신 절차를 도시한다.
도 19는 본 개시의 일 실시예에 따라 인공지능 모델에 대한 온라인 학습을 수행하는 절차의 예를 도시한다.
도 20은 본 개시의 일 실시예에 따라 인공지능 모델에 대한 온라인 학습을 지원하는 절차의 예를 도시한다.
도 21은 본 개시의 일 실시예에 따라 온라인 학습을 위한 레이블(label)을 결정하는 절차의 예를 도시한다.
도 22는 본 개시의 일 실시예에 따라 인공지능 모델에 대한 학습을 수행하기 위한 절차의 예를 도시한다.
도 23은 본 개시의 일 실시예에 따라 인공지능 모델을 이용하여 채널 인코딩/디코딩을 수행하는 송신 장치 및 수신 장치의 예를 도시한다.
도 24는 본 개시의 일 실시예에 따라 인공지능 모델을 이용하여 오프셋 추정 및 보상을 수행하는 송신 장치 및 수신 장치의 예를 도시한다.
도 25는 본 개시의 일 실시예에 따라 학습에 관련된 능력 정보를 시그널링하기 위한 절차의 예를 도시한다.
이하의 실시예들은 본 개시의 구성요소들과 특징들을 소정 형태로 결합한 것들이다. 각 구성요소 또는 특징은 별도의 명시적 언급이 없는 한 선택적인 것으로 고려될 수 있다. 각 구성요소 또는 특징은 다른 구성요소나 특징과 결합되지 않은 형태로 실시될 수 있다. 또한, 일부 구성요소들 및/또는 특징들을 결합하여 본 개시의 실시예를 구성할 수도 있다. 본 개시의 실시예들에서 설명되는 동작들의 순서는 변경될 수 있다. 어느 실시예의 일부 구성이나 특징은 다른 실시예에 포함될 수 있고, 또는 다른 실시예의 대응하는 구성 또는 특징과 교체될 수 있다.
도면에 대한 설명에서, 본 개시의 요지를 흐릴 수 있는 절차 또는 단계 등은 기술하지 않았으며, 당업자의 수준에서 이해할 수 있을 정도의 절차 또는 단계는 또한 기술하지 아니하였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 본 개시를 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
본 명세서에서 본 개시의 실시예들은 기지국과 이동국 간의 데이터 송수신 관계를 중심으로 설명되었다. 여기서, 기지국은 이동국과 직접적으로 통신을 수행하는 네트워크의 종단 노드(terminal node)로서의 의미가 있다. 본 문서에서 기지국에 의해 수행되는 것으로 설명된 특정 동작은 경우에 따라서는 기지국의 상위 노드(upper node)에 의해 수행될 수도 있다.
즉, 기지국을 포함하는 다수의 네트워크 노드들(network nodes)로 이루어지는 네트워크에서 이동국과의 통신을 위해 수행되는 다양한 동작들은 기지국 또는 기지국 이외의 다른 네트워크 노드들에 의해 수행될 수 있다. 이때, '기지국'은 고정국(fixed station), Node B, eNB(eNode B), gNB(gNode B), ng-eNB, 발전된 기지국(advanced base station, ABS) 또는 억세스 포인트(access point) 등의 용어에 의해 대체될 수 있다.
또한, 본 개시의 실시예들에서 단말(terminal)은 사용자 장비(user equipment, UE), 이동국(mobile station, MS), 가입자국(subscriber station, SS), 이동 가입자 단말(mobile subscriber station, MSS), 이동 단말(mobile terminal) 또는 발전된 이동 단말(advanced mobile station, AMS) 등의 용어로 대체될 수 있다.
또한, 송신단은 데이터 서비스 또는 음성 서비스를 제공하는 고정 및/또는 이동 노드를 말하고, 수신단은 데이터 서비스 또는 음성 서비스를 수신하는 고정 및/또는 이동 노드를 의미한다. 따라서, 상향링크의 경우, 이동국이 송신단이 되고, 기지국이 수신단이 될 수 있다. 마찬가지로, 하향링크의 경우, 이동국이 수신단이 되고, 기지국이 송신단이 될 수 있다.
본 개시의 실시예들은 무선 접속 시스템들인 IEEE 802.xx 시스템, 3GPP(3rd Generation Partnership Project) 시스템, 3GPP LTE(Long Term Evolution) 시스템, 3GPP 5G(5th generation) NR(New Radio) 시스템 및 3GPP2 시스템 중 적어도 하나에 개시된 표준 문서들에 의해 뒷받침될 수 있으며, 특히, 본 개시의 실시예들은 3GPP TS(technical specification) 38.211, 3GPP TS 38.212, 3GPP TS 38.213, 3GPP TS 38.321 및 3GPP TS 38.331 문서들에 의해 뒷받침될 수 있다.
또한, 본 개시의 실시예들은 다른 무선 접속 시스템에도 적용될 수 있으며, 상술한 시스템으로 한정되는 것은 아니다. 일 예로, 3GPP 5G NR 시스템 이후에 적용되는 시스템에 대해서도 적용 가능할 수 있으며, 특정 시스템에 한정되지 않는다.
즉, 본 개시의 실시예들 중 설명하지 않은 자명한 단계들 또는 부분들은 상기 문서들을 참조하여 설명될 수 있다. 또한, 본 문서에서 개시하고 있는 모든 용어들은 상기 표준 문서에 의해 설명될 수 있다.
이하, 본 개시에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 개시의 예시적인 실시 형태를 설명하고자 하는 것이며, 본 개시의 기술 구성이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다.
또한, 본 개시의 실시예들에서 사용되는 특정 용어들은 본 개시의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 개시의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
이하의 기술은 CDMA(code division multiple access), FDMA(frequency division multiple access), TDMA(time division multiple access), OFDMA(orthogonal frequency division multiple access), SC-FDMA(single carrier frequency division multiple access) 등과 같은 다양한 무선 접속 시스템에 적용될 수 있다.
이하 설명을 명확하게 하기 위해, 3GPP 통신 시스템(예: LTE, NR 등)을 기반으로 설명하지만 본 개시의 기술적 사상이 이에 제한되는 것은 아니다. LTE는 3GPP TS 36.xxx Release 8 이후의 기술을 의미할 수 있다. 세부적으로, 3GPP TS 36.xxx Release 10 이후의 LTE 기술은 LTE-A로 지칭되고, 3GPP TS 36.xxx Release 13 이후의 LTE 기술은 LTE-A pro로 지칭될 수 있다. 3GPP NR은 TS 38.xxx Release 15 이후의 기술을 의미할 수 있다. 3GPP 6G는 TS Release 17 및/또는 Release 18 이후의 기술을 의미할 수 있다. "xxx"는 표준 문서 세부 번호를 의미한다. LTE/NR/6G는 3GPP 시스템으로 통칭될 수 있다.
본 개시에 사용된 배경기술, 용어, 약어 등에 관해서는 본 개시 이전에 공개된 표준 문서에 기재된 사항을 참조할 수 있다. 일 예로, 36.xxx 및 38.xxx 표준 문서를 참조할 수 있다.
본 개시에 적용 가능한 통신 시스템
이로 제한되는 것은 아니지만, 본 문서에 개시된 본 개시의 다양한 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 장치들 간에 무선 통신/연결(예: 5G)을 필요로 하는 다양한 분야에 적용될 수 있다.
이하, 도면을 참조하여 보다 구체적으로 예시한다. 이하의 도면/설명에서 동일한 도면 부호는 다르게 기술하지 않는 한, 동일하거나 대응되는 하드웨어 블록, 소프트웨어 블록 또는 기능 블록을 예시할 수 있다.
도 1은 본 개시에 적용되는 통신 시스템 예를 도시한다.
도 1을 참고하면, 본 개시에 적용되는 통신 시스템(100)은 무선 장치, 기지국 및 네트워크를 포함한다. 여기서, 무선 장치는 무선 접속 기술(예: LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G)을 이용하여 통신을 수행하는 장치를 의미하며, 통신/무선/5G 장치로 지칭될 수 있다. 이로 제한되는 것은 아니지만, 무선 장치는 로봇(100a), 차량(100b-1, 100b-2), XR(extended reality) 장치(100c), 휴대 장치(hand-held device)(100d), 가전(home appliance)(100e), IoT(Internet of Thing) 장치(100f), AI(artificial intelligence) 장치/서버(100g)를 포함할 수 있다. 예를 들어, 차량은 무선 통신 기능이 구비된 차량, 자율 주행 차량, 차량간 통신을 수행할 수 있는 차량 등을 포함할 수 있다. 여기서, 차량(100b-1, 100b-2)은 UAV(unmanned aerial vehicle)(예: 드론)를 포함할 수 있다. XR 장치(100c)는 AR(augmented reality)/VR(virtual reality)/MR(mixed reality) 장치를 포함하며, HMD(head-mounted device), 차량에 구비된 HUD(head-up display), 텔레비전, 스마트폰, 컴퓨터, 웨어러블 디바이스, 가전 장치, 디지털 사이니지(signage), 차량, 로봇 등의 형태로 구현될 수 있다. 휴대 장치(100d)는 스마트폰, 스마트패드, 웨어러블 장치(예: 스마트워치, 스마트글래스), 컴퓨터(예: 노트북 등) 등을 포함할 수 있다. 가전(100e)은 TV, 냉장고, 세탁기 등을 포함할 수 있다. IoT 장치(100f)는 센서, 스마트 미터 등을 포함할 수 있다. 예를 들어, 기지국(120), 네트워크(130)는 무선 장치로도 구현될 수 있으며, 특정 무선 장치(120a)는 다른 무선 장치에게 기지국/네트워크 노드로 동작할 수도 있다.
무선 장치(100a 내지 100f)는 기지국(120)을 통해 네트워크(130)와 연결될 수 있다. 무선 장치(100a 내지 100f)에 AI 기술이 적용될 수 있으며, 무선 장치(100a 내지 100f)는 네트워크(130)를 통해 AI 서버(100g)와 연결될 수 있다. 네트워크(130)는 3G 네트워크, 4G(예: LTE) 네트워크, 5G(예: NR) 또는 6G 네트워크 등을 이용하여 구성될 수 있다. 무선 장치(100a 내지 100f)는 기지국(120)/네트워크(130)를 통해 서로 통신할 수도 있지만, 기지국(120)/네트워크(130)를 통하지 않고 직접 통신(예: 사이드링크 통신(sidelink communication))할 수도 있다. 예를 들어, 차량들(100b-1, 100b-2)은 직접 통신(예: V2V(vehicle to vehicle)/V2X(vehicle to everything) communication)을 할 수 있다. 또한, IoT 장치(100f)(예: 센서)는 다른 IoT 장치(예: 센서) 또는 다른 무선 장치(100a 내지 100f)와 직접 통신을 할 수 있다.
무선 장치(100a 내지 100f)/기지국(120), 기지국(120)/기지국(120) 간에는 무선 통신/연결(150a, 150b, 150c)이 이뤄질 수 있다. 여기서, 무선 통신/연결은 상향/하향링크 통신(150a)과 사이드링크 통신(150b)(또는, D2D 통신), 기지국간 통신(150c)(예: 릴레이(relay), IAB(integrated access backhaul))과 같은 다양한 무선 접속 기술을 통해 이뤄질 수 있다. 무선 통신/연결(150a, 150b, 150c)을 통해 무선 장치와 기지국/무선 장치, 기지국과 기지국은 서로 무선 신호를 송신/수신할 수 있다. 예를 들어, 무선 통신/연결(150a, 150b, 150c)은 다양한 물리 채널을 통해 신호를 송신/수신할 수 있다. 이를 위해, 본 개시의 다양한 제안들에 기반하여, 무선 신호의 송신/수신을 위한 다양한 구성정보 설정 과정, 다양한 신호 처리 과정(예: 채널 인코딩/디코딩, 변조/복조, 자원 매핑/디매핑 등), 자원 할당 과정 등 중 적어도 일부가 수행될 수 있다.
본 개시에 적용 가능한 장치
도 2는 본 개시에 적용될 수 있는 무선 장치의 예를 도시한다.
도 2를 참고하면, 무선 장치(200)는 다양한 무선 접속 기술(예: LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G)을 통해 무선 신호를 송수신할 수 있다. 무선 장치(200)는 적어도 하나의 프로세서(202) 및 적어도 하나의 메모리(204)를 포함하며, 추가적으로 적어도 하나의 송수신기(206) 및/또는 적어도 하나의 안테나(208)을 더 포함할 수 있다.
프로세서(202)는 메모리(204) 및/또는 송수신기(206)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(202)는 메모리(204) 내의 정보를 처리하여 제1 정보/신호를 생성한 뒤, 송수신기(206)을 통해 제1 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(202)는 송수신기(206)를 통해 제2 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제2 정보/신호의 신호 처리로부터 얻은 정보를 메모리(204)에 저장할 수 있다. 메모리(204)는 프로세서(202)와 연결될 수 있고, 프로세서(202)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(204)는 프로세서(202)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(202)와 메모리(204)는 무선 통신 기술을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(206)는 프로세서(202)와 연결될 수 있고, 적어도 하나의 안테나(208)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(206)는 송신기 및/또는 수신기를 포함할 수 있다. 송수신기(206)는 RF(radio frequency) 유닛과 혼용될 수 있다. 본 개시에서 무선 장치는 통신 모뎀/회로/칩을 의미할 수도 있다.
이하, 무선 장치(200)의 하드웨어 요소에 대해 보다 구체적으로 설명한다. 이로 제한되는 것은 아니지만, 적어도 하나의 프로토콜 계층이 적어도 하나의 프로세서(202)에 의해 구현될 수 있다. 예를 들어, 적어도 하나의 프로세서(202)는 적어도 하나의 계층(예: PHY(physical), MAC(media access control), RLC(radio link control), PDCP(packet data convergence protocol), RRC(radio resource control), SDAP(service data adaptation protocol)와 같은 기능적 계층)을 구현할 수 있다. 적어도 하나의 프로세서(202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 적어도 하나의 PDU(Protocol Data Unit) 및/또는 적어도 하나의 SDU(service data unit)를 생성할 수 있다. 적어도 하나의 프로세서(202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 메시지, 제어정보, 데이터 또는 정보를 생성할 수 있다. 적어도 하나의 프로세서(202)는 본 문서에 개시된 기능, 절차, 제안 및/또는 방법에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 포함하는 신호(예: 베이스밴드 신호)를 생성하여, 적어도 하나의 송수신기(206)에게 제공할 수 있다. 적어도 하나의 프로세서(202)는 적어도 하나의 송수신기(206)로부터 신호(예: 베이스밴드 신호)를 수신할 수 있고, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 획득할 수 있다.
적어도 하나의 프로세서(202)는 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 마이크로 컴퓨터로 지칭될 수 있다. 적어도 하나의 프로세서(202)는 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합에 의해 구현될 수 있다. 일 예로, 적어도 하나의 ASIC(application specific integrated circuit), 적어도 하나의 DSP(digital signal processor), 적어도 하나의 DSPD(digital signal processing device), 적어도 하나의 PLD(programmable logic device) 또는 적어도 하나의 FPGA(field programmable gate arrays)가 적어도 하나의 프로세서(202)에 포함될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있고, 펌웨어 또는 소프트웨어는 모듈, 절차, 기능 등을 포함하도록 구현될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 수행하도록 설정된 펌웨어 또는 소프트웨어는 적어도 하나의 프로세서(202)에 포함되거나, 적어도 하나의 메모리(204)에 저장되어 적어도 하나의 프로세서(202)에 의해 구동될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 코드, 명령어 및/또는 명령어의 집합 형태로 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있다.
적어도 하나의 메모리(204)는 적어도 하나의 프로세서(202)와 연결될 수 있고, 다양한 형태의 데이터, 신호, 메시지, 정보, 프로그램, 코드, 지시 및/또는 명령을 저장할 수 있다. 적어도 하나의 메모리(204)는 ROM(read only memory), RAM(random access memory), EPROM(erasable programmable read only memo2ry), 플래시 메모리, 하드 드라이브, 레지스터, 캐쉬 메모리, 컴퓨터 판독 저장 매체 및/또는 이들의 조합으로 구성될 수 있다. 적어도 하나의 메모리(204)는 적어도 하나의 프로세서(202)의 내부 및/또는 외부에 위치할 수 있다. 또한, 적어도 하나의 메모리(204)는 유선 또는 무선 연결과 같은 다양한 기술을 통해 적어도 하나의 프로세서(202)와 연결될 수 있다.
적어도 하나의 송수신기(206)는 적어도 하나의 다른 장치에게 본 문서의 방법들 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 전송할 수 있다. 적어도 하나의 송수신기(206)는 적어도 하나의 다른 장치로부터 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 수신할 수 있다. 예를 들어, 적어도 하나의 송수신기(206)는 적어도 하나의 프로세서(202)와 연결될 수 있고, 무선 신호를 송수신할 수 있다. 예를 들어, 적어도 하나의 프로세서(202)는 적어도 하나의 송수신기(206)가 적어도 하나의 다른 장치에게 사용자 데이터, 제어 정보 또는 무선 신호를 전송하도록 제어할 수 있다. 또한, 적어도 하나의 프로세서(202)는 적어도 하나의 송수신기(206)가 적어도 하나의 다른 장치로부터 사용자 데이터, 제어 정보 또는 무선 신호를 수신하도록 제어할 수 있다. 또한, 적어도 하나의 송수신기(206)는 적어도 하나의 안테나(208)와 연결될 수 있고, 적어도 하나의 송수신기(206)는 적어도 하나의 안테나(208)를 통해 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 송수신하도록 설정될 수 있다. 본 문서에서, 적어도 하나의 안테나는 복수의 물리 안테나이거나, 복수의 논리 안테나(예: 안테나 포트)일 수 있다. 적어도 하나의 송수신기(206)는 수신된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 적어도 하나의 프로세서(202)를 이용하여 처리하기 위해, 수신된 무선 신호/채널 등을 RF 밴드 신호에서 베이스밴드 신호로 변환(convert)할 수 있다. 적어도 하나의 송수신기(206)는 적어도 하나의 프로세서(202)를 이용하여 처리된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 베이스밴드 신호에서 RF 밴드 신호로 변환할 수 있다. 이를 위하여, 적어도 하나의 송수신기(206)는 (아날로그) 오실레이터 및/또는 필터를 포함할 수 있다.
도 2를 참고하여 설명한 무선 장치의 구성요소들은 기능적인 측면에서 다른 용어로 지칭될 수 있다. 예를 들어, 프로세서(202)는 제어부, 송수신기(206)는 통신부, 메모리(204)는 저장부로 지칭될 수 있다. 경우에 따라, 통신부는 프로세서202)의 적어도 일부 및 송수신기(206)를 포함하는 의미로 사용될 수 있다.
도 2를 참고하여 설명한 무선 장치의 구조는 다양한 장치의 적어도 일부의 구조로 이해될 수 있다. 예를 들어, 도 2에 예시된 무선 장치의 구조는, 도 1을 참고하여 설명한 다양한 장치들(예: 로봇(100a), 차량(100b-1, 100b-2), XR 장치(100c), 휴대 장치(100d), 가전(100e), IoT 장치(100f), AI 장치/서버(100g))의 적어도 일부일 수 있다. 나아가, 다양한 실시예들에 따라, 도 2에 예시된 구성요소들 외, 장치는 다른 구성요소들을 더 포함할 수 있다.
예를 들어, 장치는 스마트폰, 스마트패드, 웨어러블 장치(예: 스마트 워치, 스마트 글래스), 휴대용 컴퓨터(예: 노트북 등)와 같은 휴대 장치일 수 있다. 이 경우, 장치는 전원을 공급하며, 유/무선 충전 회로, 배터리 등을 포함하는 전원공급부, 다른 장치와의 연결을 위한 적어도 하나의 포트(예: 오디오 입/출력 포트, 비디오 입/출력 포트)를 포함하는 인터페이스부, 영상 정보/신호, 오디오 정보/신호, 데이터, 및/또는 사용자로부터 입력되는 정보를 입력 및 출력하기 위한 입출력부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 이동형 로봇, 차량, 기차, 유/무인 비행체(aerial vehicle, AV), 선박 등과 같은 이동 장치일 수 있다. 이 경우, 장치는 장치의 엔진, 모터, 파워 트레인, 바퀴, 브레이크, 조향 장치 중 적어도 하나를 포함하는 구동부, 전원을 공급하며, 유/무선 충전 회로, 배터리 등을 포함하는 전원공급부, 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부, 경로 유지, 속도 조절, 목적지 설정 등의 기능을 수행하는 자율 주행부, GPS(global positioning system) 및 다양한 센서를 통하여 이동체 위치 정보를 획득하는 위치 측정부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 HMD, 차량에 구비된 HUD(head-up display), 텔레비전, 스마트폰, 컴퓨터, 웨어러블 디바이스, 가전 장치, 디지털 사이니지(signage), 차량, 로봇 등과 같은 XR 장치일 수 있다. 이 경우, 장치는, 전원을 공급하며, 유/무선 충전 회로, 배터리 등을 포함하는 전원공급부, 외부로부터 제어 정보, 데이터 등을 획득하며, 생성된 XR 오브젝트를 출력하는 입출력부, 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 사용 목적이나 분야에 따라 산업용, 의료용, 가정용, 군사용 등으로 분류 가능한 로봇일 수 있다. 이 경우, 장치는 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부, 로봇 관절을 움직이는 등의 다양한 물리적 동작을 수행하는 구동부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 TV, 프로젝터, 스마트폰, PC, 노트북, 디지털방송용 단말기, 태블릿 PC, 웨어러블 장치, 셋톱박스(STB), 라디오, 세탁기, 냉장고, 디지털 사이니지, 로봇, 차량 등과 같은 AI 장치일 수 있다. 이 경우, 장치는 외부로부터 다양한 종류의 데이터를 획득하는 입력부, 시각, 청각 또는 촉각 등과 관련된 출력을 생성하는 출력부, 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부, 학습 데이터를 이용하여 인공 신경망으로 구성된 모델을 학습하는 훈련부(training unit) 중 적어도 하나를 더 포함할 수 있다.
도 2에 예시된 무선 장치의 구조는, RAN 노드(예: 기지국, DU, RU, RRH 등)의 일부로 이해될 수 있다. 즉, 도 2에 예시된 장치는 RAN 노드일 수 있다. 이 경우, 장치는 프론트 홀(front haul) 및/또는 백홀(back haul) 통신을 위한 유선 송수신기를 더 포함할 수 있다. 다만, 프론트 홀 및/또는 백홀 통신이 무선 통신에 기반하면, 도 2에 예시된 적어도 하나의 송수신기(206)가 프론트 홀 및/또는 백홀 통신을 위해 사용되고, 유선 송수신기는 포함되지 아니할 수 있다.
도 3은 본 개시에 적용되는 전송 신호를 처리하는 방법을 도시한다. 일 예로, 전송 신호는 신호 처리 회로에 의해 처리될 수 있다. 이때, 신호 처리 회로(300)는 스크램블러(310), 변조기(320), 레이어 매퍼(330), 프리코더(330), 자원 매퍼(350), 신호 생성기(360)를 포함할 수 있다. 이때, 일 예로, 도 3의 동작/기능은 도 2의 프로세서(202) 및/또는 송수신기(206)에서 수행될 수 있다. 또한, 일 예로, 도 3의 하드웨어 요소는 도 2의 프로세서(202) 및/또는 송수신기(206)에서 구현될 수 있다. 일 예로, 블록 310 내지 360은 도 2의 프로세서(202)에서 구현될 수 있다. 또한, 블록 310 내지 350은 도 2의 프로세서(202)에서 구현되고, 블록 360은 도 2의 송수신기(206)에서 구현될 수 있으며, 상술한 실시예로 한정되지 않는다.
코드워드는 도 3의 신호 처리 회로(300)를 거쳐 무선 신호로 변환될 수 있다. 여기서, 코드워드는 정보 블록의 부호화된 비트 시퀀스이다. 정보 블록은 전송블록(예: UL-SCH 전송블록, DL-SCH 전송블록)을 포함할 수 있다. 무선 신호는 다양한 물리 채널(예: PUSCH, PDSCH)을 통해 전송될 수 있다. 구체적으로, 코드워드는 스크램블러(310)에 의해 스크램블된 비트 시퀀스로 변환될 수 있다. 스크램블에 사용되는 스크램블 시퀀스는 초기화 값에 기반하여 생성되며, 초기화 값은 무선 장치의 ID 정보 등이 포함될 수 있다. 스크램블된 비트 시퀀스는 변조기(320)에 의해 변조 심볼 시퀀스로 변조될 수 있다. 변조 방식은 pi/2-BPSK(pi/2-binary phase shift keying), m-PSK(m-phase shift keying), m-QAM(m-quadrature amplitude modulation) 등을 포함할 수 있다.
복소 변조 심볼 시퀀스는 레이어 매퍼(330)에 의해 적어도 하나의 전송 레이어로 매핑될 수 있다. 각 전송 레이어의 변조 심볼들은 프리코더(330)에 의해 해당 안테나 포트(들)로 매핑될 수 있다. 프리코더(330)의 출력 z는 레이어 매퍼(330)의 출력 y를 NХM의 프리코딩 행렬 W와 곱함으로써 얻어질 수 있다. 여기서, N은 안테나 포트의 개수, M은 전송 레이어의 개수이다. 여기서, 프리코더(330)는 복소 변조 심볼들에 대한 트랜스폼(transform) 프리코딩(예: DFT(discrete fourier transform) 변환)을 수행한 이후에 프리코딩을 수행할 수 있다. 또한, 프리코더(330)는 트랜스폼 프리코딩을 수행하지 않고 프리코딩을 수행할 수 있다.
자원 매퍼(350)는 각 안테나 포트의 변조 심볼들을 시간-주파수 자원에 매핑할 수 있다. 시간-주파수 자원은 시간 도메인에서 복수의 심볼(예: CP-OFDMA 심볼, DFT-s-OFDMA 심볼)을 포함하고, 주파수 도메인에서 복수의 부반송파를 포함할 수 있다. 신호 생성기(360)는 매핑된 변조 심볼들로부터 무선 신호를 생성하며, 생성된 무선 신호는 각 안테나를 통해 다른 장치로 전송될 수 있다. 이를 위해, 신호 생성기(360)는 IFFT(inverse fast fourier transform) 모듈 및 CP(cyclic prefix) 삽입기, DAC(digital-to-analog converter), 주파수 상향 변환기(frequency uplink converter) 등을 포함할 수 있다.
무선 장치에서 수신 신호를 위한 신호 처리 과정은 도 3의 신호 처리 과정(310 내지 360)의 역으로 구성될 수 있다. 일 예로, 무선 장치(예: 도 2의 200)는 안테나 포트/송수신기를 통해 외부로부터 무선 신호를 수신할 수 있다. 수신된 무선 신호는 신호 복원기를 통해 베이스밴드 신호로 변환될 수 있다. 이를 위해, 신호 복원기는 주파수 하향 변환기(frequency downlink converter), ADC(analog-to-digital converter), CP 제거기, FFT(fast fourier transform) 모듈을 포함할 수 있다. 이후, 베이스밴드 신호는 자원 디-매퍼 과정, 포스트코딩(postcoding) 과정, 복조 과정 및 디-스크램블 과정을 거쳐 코드워드로 복원될 수 있다. 코드워드는 복호(decoding)를 거쳐 원래의 정보 블록으로 복원될 수 있다. 따라서, 수신 신호를 위한 신호 처리 회로(미도시)는 신호 복원기, 자원 디-매퍼, 포스트코더, 복조기, 디-스크램블러 및 복호기를 포함할 수 있다.
도 4는 본 개시에 적용 가능한 단말 및 기지국 간 통신 절차를 도시한다. 도 4는 단말(410) 및 기지국(420)이 데이터를 송신 및/또는 수신하는 동작 및 이에 앞서 수행되는 동작들을 예시한다.
도 4를 참고하면, 401 단계에서, 단말(410) 및 기지국(420)은 동기화를 수행한다. 예를 들어, 단말(410)은 초기 셀 탐색(initial cell search) 동작을 수행한다. 구체적으로, 단말(410)은 기지국(420)에서 미리 정의된 규칙에 따라 송신되는 적어도 하나의 동기 신호를 검출할 수 있다. 여기서, 동기 신호는 구조 또는 용도에 따라 분류되는 복수의 동기 신호들(예: 프라이머리 동기 신호, 세컨더리 동기 신호)을 포함할 수 있다. 이를 통해, 단말(410)은 기지국(420)의 프레임, 서브프레임, 슬롯 및/또는 심볼의 경계(boundary)를 확인하고, 기지국(420)에 대한 정보(예: 셀 식별자)를 획득할 수 있다.
403 단계에서, 단말(410)은 기지국(420)에서 송신되는 시스템 정보를 획득한다. 시스템 정보는 기지국(420)에 접속하고, 서비스를 이용하기 위해 필요한 기지국(420)의 속성, 특성, 및/또는 능력에 관련된 정보로서, 내용(예: 접속을 위해 필수적으로 필요한지 여부), 송신 구조(예: 사용되는 채널, 요구에 따라(on-demand) 제공되는지 여부) 등에 따라 분류될 수 있으며, 예를 들어, MIB(master information block) 및 SIB(system information block)로 분류될 수 있다. 필요에 따라, 단말(410)은 시스템 정보를 수신하기에 앞서 시스템 정보를 요청하는 신호를 송신할 수 있다. 다만, 시스템 정보의 요청 및 제공은 후술되는 랜덤 액세스(random access) 절차 이후에 수행될 수 있다.
405 단계에서, 단말(410) 및 기지국(420)은 랜덤 액세스 절차를 수행한다. 단말(410)은 시스템 정보를 통해 획득된 기지국(420)의 랜덤 액세스 채널에 관련된 정보(예: 채널 위치, 채널 구조, 지원되는 프리앰블의 구조 등)에 기반하여 랜덤 액세스 절차를 위한 적어도 하나의 메시지(예: 랜덤 액세스 프리앰블, RAR(random access response) 메시지 등)을 송신 및/또는 수신할 수 있다. 예를 들어, 단말(410)은 랜덤 액세스 채널을 통해 프리앰블(예: MSG1)을 송신하고, RAR 메시지(예: MSG2)를 수신하고, RAR 메시지에 포함되는 스케줄링 정보를 이용하여 단말(410)에 관련된 정보(예: 식별 정보)를 포함하는 메시지(예: MSG3)를 기지국(420)에게 송신하고, 경쟁 해소(contention resolution) 및/또는 연결 설정을 위한 메시지(예: MSG4)를 수신할 수 있다. 다른 예로, MSG1 및 MSG3이 하나의 메시지로서, 또는 MSG2 및 MSG4가 하나의 메시지로서 송신 및 수신될 수 있다.
407 단계에서, 단말(410) 및 기지국(420)은 제어 정보의 시그널링을 수행한다. 여기서, 제어 정보는 제어 정보는 연결을 제어하는 계층(예: RRC(radio resource control) 계층), 논리 채널 및 전송 채널 간 매핑을 처리하는 계층(예: MAC(media access control) 계층), 물리 채널을 처리하는 계층(예: PHY(physical) 계층) 등 다양한 계층들에서 정의될 수 있다. 예를 들어, 단말(410) 및 기지국(420)은 연결을 수립하기 위한 시그널링, 통신과 관련된 설정을 결정하기 위한 시그널링, 할당된 자원을 지시하기 위한 시그널링 중 적어도 하나를 수행할 수 있다.
409 단계에서, 단말(410) 및 기지국(420)은 데이터를 송신 및/또는 수신한다. 다시 말해, 단말(410) 및 기지국(420)은 제어 정보의 시그널링에 기반하여 데이터를 처리하고, 송신 및/또는 수신할 수 있다. 예를 들어, 데이터를 송신하는 경우, 단말(410) 또는 기지국(420)은 정보 비트들에 대하여 채널 인코딩, 레이트 매칭(rate matching), 스크램블링, 성상도 맵핑, 레이어 맵핑, 파형(waveform) 변조, 안테나 맵핑, 자원 맵핑 중 적어도 하나를 수행할 수 있다. 반대로, 데이터를 수신하는 경우, 단말(410) 또는 기지국(420)은 자원에서 신호 추출, 안테나 별 파형 복조, 레이어 맵핑을 고려한 신호 배치, 성상도 디매핑, 디스크램블링, 채널 디코딩 중 적어도 하나를 수행할 수 있다.
6G 통신 시스템 및 6G 시스템의 핵심 구현 기술
5G 시스템은 410MHz 내지 7125MHz를 포함하는 FR1(frequency range 1) 및 24,250MHz 내지 71,000MHz를 포함하는 FR2(frequency range 2) 내에서 다양한 동작 대역들을 정의한다. 이후의 6G 시스템의 동작 대역들로서 다양한 주파수들이 논의되고 있는데, 더 넓은 대역폭 및 더 높은 전송 속도를 위해 5G 시스템보다 높은 주파수의 사용도 고려되고 있다. 그중 하나로서, 약 100GHz 내지 10THz를 포함하며 THz(Terahertz) 주파수 대역의 사용이 논의되고 있다. THz 주파수 대역은 전파의 투과성 및 광파의 직진성을 모두 가진 대역이며, THz 주파수 대역을 이용한 통신은 기존의 전파 중심의 통신에서 광파 기반의 통신으로의 과도기적 역할을 수행할 것으로 기대되기도 한다.
이와 같이 THz 주파수 대역을 활용하는 6G 시스템은 ⅰ)디바이스 당 매우 높은 데이터 속도, ⅱ)매우 많은 수의 연결된 디바이스들, ⅲ)글로벌 연결성(global connectivity), ⅳ)매우 낮은 지연, ⅴ)배터리-프리(battery-free) IoT 디바이스들의 에너지 소비를 낮추고, ⅵ)초고신뢰성 연결, ⅶ)머신 러닝 능력을 가지는 연결된 지능 등에 목적이 있다. 6G 시스템의 비젼은 "intelligent connectivity", "deep connectivity", "holographic connectivity", "ubiquitous connectivity"와 같은 4가지 측면일 수 있으며, 6G 시스템은 하기 [표 1]과 같은 요구 사항을 만족시키도록 설계될 수 있다.
Per device peak data rate 1 Tbps
E2E latency 1 ms
Maximum spectral efficiency 100 bps/Hz
Mobility support up to 1000 km/hr
Satellite integration Fully
AI Fully
Autonomous vehicle Fully
XR Fully
Haptic Communication Fully
이때, 6G 시스템은 향상된 모바일 브로드밴드(enhanced mobile broadband, eMBB), 초-저지연 통신(ultra-reliable low latency communications, URLLC), mMTC (massive machine type communications), AI 통합 통신(AI integrated communication), 촉각 인터넷(tactile internet), 높은 스루풋(high throughput), 높은 네트워크 능력(high network capacity), 높은 에너지 효율(high energy efficiency), 낮은 백홀 및 접근 네트워크 혼잡(low backhaul and access network congestion) 및 향상된 데이터 보안(enhanced data security)과 같은 핵심 요소(key factor)들을 가질 수 있다.도 5는 본 개시에 적용 가능한 6G 시스템에서 제공 가능한 통신 구조의 일례를 도시한다. 도 5를 참고하면, 6G 시스템은 5G 무선통신 시스템보다 50배 더 높은 동시 무선통신 연결성을 가질 것으로 예상된다. 5G의 핵심 요소(key feature)인 URLLC는 6G 통신에서 1ms보다 적은 단-대-단(end-to-end) 지연을 제공함으로써 보다 더 주요한 기술이 될 것으로 예상된다. 이때, 6G 시스템은 자주 사용되는 영역 스펙트럼 효율과 달리 체적 스펙트럼 효율이 훨씬 우수할 것이다. 6G 시스템은 매우 긴 배터리 수명과 에너지 수확을 위한 고급 배터리 기술을 제공할 수 있어, 6G 시스템에서 모바일 디바이스들은 별도로 충전될 필요가 없을 수 있다.
6G 시스템의 핵심 구현 기술로서, 인공 지능(artificial Intelligence, AI), THz(Terahertz) 통신, 광 무선 기술(optical wireless technology), FSO 백홀 네트워크, 대규모 MIMO 기술, 블록 체인, 3D 네트워킹, 양자 커뮤니케이션, 무인 항공기, 셀-프리 통신(cell-free communication), 무선 정보 및 에너지 전송(wireless information and energy transfer, WIET), 센싱과 커뮤니케이션의 통합, 액세스 백홀 네트워크의 통합, 홀로그램 빔포밍, 빅 데이터 분석, LIS(large intelligent surface) 등의 기술들이 채택될 수 있다.
예를 들어, THz 통신은, 도 6과 같은 0.03mm-3mm 범위의 해당 파장을 가진 0.1THz 및 10THz 사이의 주파수 대역의 스펙트럼을 이용하는 통신으로서, 도 7과 같은 구조의 회로 소자들을 이용하여 구현될 수 있다. 또한, 광 무선 기술은 광소자를 이용하여 THz 신호를 발생 및 변조하는 기술로서, 도 8, 도 9, 도 10, 도 11과 같은 구조의 장치에 기반하여 구현될 수 있다.
또한, AI는 신경망, 기계학습(machine model) 등 다양한 모델에 기반하여 구현될 수 있다. 예를 들어, 신경망 구조의 AI 모델은 도 12와 같은 퍼셉트론의 구조에 기반할 수 있다. 도 12를 참고하면, 인공 신경망은 여러 개의 퍼셉트론들로 구성될 수 있다. 퍼셉트론의 구조에 따라, 입력 벡터 x={x1, x2, ..., xd}가 입력되면, 각 성분에 가중치 {W1, W2, 쪋, Wd}가 곱해지고, 그 결과가 모두 합산된 후, 활성함수 σ(·)가 적용된다. 거대한 인공 신경망 구조는 도 12에 도시한 단순화된 퍼셉트론 구조를 확장하면, 입력벡터는 서로 다른 다 차원의 퍼셉트론에 적용될 수 있다. 퍼셉트론들이 적층되면, 도 13과 같은 입력층, 은닉층, 출력층을 가지는 신경망이 구성될 수 있다.
전술한 바와 같은 신경망의 구조를 활용하는 AI 기술은 이하 도 14와 같은 기능적 프레임워크(functional framework)에 기반하여 운용될 수 있다. 도 14는 본 개시에 적용 가능한 AI 기술의 적용을 위한 기능적 프레임워크의 예를 도시한다. 먼저, 데이터 수집 블록(1410)은 객체들(예: UE, RAN 노드, 네트워크 노드 등)로부터 수집된 입력 데이터에 대하여 데이터 준비(data preparation)를 수행함으로써 가공된 입력 데이터를 포함하는 훈련 데이터(1411) 및/또는 추론 데이터(1411)를 생성한다. 모델 훈련 블록(1420)은 훈련 데이터(1411)를 이용하여 AI 모델에 대한 훈련을 수행하며, 모델 추론 블록(1430)에게 훈련된 모델에 대한 정보를 제공한다. 모델 추론 블록(1430)은 추론 데이터(1411)를 이용하여 추론 및/또는 예측을 수행함으로써 출력 (1416)을 생성한다. 또한, 모델 추론 블록(1430)은 모델 훈련 블록(1420)에게 모델 성능 피드백(1414)을 제공할 수 있다. 여기서, 출력(1416)은 모델 추론 블록(1430)에 의해 생성된 AI 모델의 추론 출력을 의미하며, 추론 출력의 세부 정보는 사용 사례에 따라 다를 수 있다. 액터(actor) 블록(1440)은 출력(1416)에 기반하여 지정된 작업/동작을 트리거 또는 수행한다. 액터 블록(1440)은 다른 객체 (예: 적어도 하나의 UE, 적어도 하나의 RAN 노드, 적어도 하나의 네트워크 노드 등) 또는 자신에 대한 작업/동작을 트리거할 수 있다. 전술한 도 14에 예시된 기능들 중 어느 하나의 기능을 RAN, 네트워크 노드, 네트워크 사업자의 OAM 또는 UE 중 2개 이상의 개체가 협력(collaboration)하여 수행할 수도 있다. 이는 분할 AI 동작(split AI operation)으로 지칭될 수 있다.
도 15는 본 개시에 적용 가능한 AI 모델을 활용하기 위한 절차의 예를 도시한다. 도 15는 모델 훈련 기능(예: 모델 훈련 블록(1420)의 기능)이 네트워크 노드에, 모델 추론 기능(예: 모델 추론 블록(1430)의 기능)이 RAN 노드에 포함되는 경우를 예시한다. 도 15를 참고하면, 단계 1에서, RAN 노드 1 및 RAN 노드 2는 AI 모델에 대한 훈련을 위한 입력 데이터(예: 훈련 데이터)를 네트워크 노드에게 송신한다. 여기서, RAN 노드 1 및 RAN 노드 2는 UE로부터 수집한 데이터(예: 서빙 셀과 이웃 셀의 RSRP, RSRQ, SINR과 관련된 UE의 측정, UE의 위치, 속도 등)를 함께 네트워크 노드에게 송신할 수 있다. 단계 2에서, 네트워크 노드는 수신한 훈련 데이터를 이용하여 AI 모델을 훈련한다. 단계 3에서, 네트워크 노드는 RAN 노드 1 및/또는 RAN 노드 2에게 AI 모델을 배포/업데이트한다. RAN 노드 1 및/또는 RAN 노드 2는 수신된 AI 모델에 기반하여 모델 훈련을 계속 수행할 수도 있다. 본 절차에서, RAN 노드 1에게만 AI 모델이 배포/업데이트됨이 가정된다. 단계 4에서, RAN 노드 1은 UE와 RAN 노드 2로부터 AI 모델 추론을 위한 입력 데이터(예: 추론 데이터)를 수신한다. 단계 5에서, RAN 노드 1은 수신된 추론 데이터를 이용하여 AI 모델 기반의 추론을 수행함으로써 출력 데이터(예: 예측 또는 결정)을 생성한다. 단계 6에서, 적용가능한 경우, RAN 노드 1은 네트워크 노드에게 모델 성능 피드백을 송신할 수 있다. 단계 7에서, RAN 노드 1, RAN 노드 2 및 UE(또는 'RAN 노드 1과 UE', 또는 'RAN 노드 1 및 RAN 노드 2')는 출력 데이터에 기반한 동작(action)을 수행한다. 예를 들어, 로드 밸런싱(load balancing) 동작의 경우, UE가 RAN 노드 1에서 RAN 노드 2로 이동할 수도 있다. 단계 8에서, RAN 노드 1 및 RAN 노드 2는 네트워크 노드에게 피드백 정보를 송신한다.
도 16은 본 개시에 적용 가능한 AI 모델을 활용하기 위한 절차의 다른 예를 도시한다. 도 16은 모델 훈련 기능(예: 모델 훈련 블록(1420)의 기능) 및 모델 추론 기능(예: 모델 추론 블록(1430)의 기능)이 RAN 노드에 포함되는 경우를 예시한다. 도 16을 참고하면, 단계 1에서, UE와 RAN 노드 2는 AI 모델에 대한 훈련을 위한 입력 데이터(예: 훈련 데이터)를 RAN 노드 1에게 송신한다. 단계 2에서, RAN 노드 1은 수신된 훈련 데이터를 이용하여 AI 모델을 훈련한다. 단계 3에서, RAN 노드 1은 UE와 RAN 노드 2로부터 AI 모델 기반의 추론을 위한 입력 데이터(예: 추론 데이터)를 수신한다. 단계 4에서, RAN 노드 1은 수신된 추론 데이터를 이용하여 AI 모델 기반의 추론을 수행함으로써 출력 데이터(예: 예측 또는 결정)을 생성한다. 단계 5에서, RAN 노드 1, RAN 노드 2 및 UE(또는 'RAN 노드 1과 UE', 또는 'RAN 노드 1 및 RAN 노드 2')는 출력 데이터에 기반한 동작을 수행한다. 예를 들어, 로드 밸런싱 동작인 경우, UE가 RAN 노드 1에서 RAN 노드 2로 이동할 수도 있다. 단계 6에서, RAN 노드 2는 RAN 노드 1에게 피드백 정보를 송신한다.
도 17은 본 개시에 적용 가능한 AI 모델을 활용하기 위한 절차의 또 다른 예를 도시한다. 도 17는 모델 훈련 기능(예: 모델 훈련 블록(1420)의 기능)이 RAN 노드에, 모델 추론 기능(예: 모델 추론 블록(1430)의 기능)이 UE에 포함되는 경우를 예시한다. 도 17을 참고하면, 단계 1에서, UE는 AI 모델에 대한 훈련을 위한 입력 데이터(예: 훈련 데이터)를 RAN 노드에게 송신한다. 여기서, RAN 노드는 다양한 UE들로부터 및/또는 다른 RAN 노드로부터 데이터를 수집할 수 있다. 단계 2에서, RAN 노드는 수신된 훈련 데이터를 이용하여 AI 모델을 훈련한다. 단계 3에서, RAN 노드는 AI 모델을 UE에게 배포/업데이트한다. UE는 수신된 AI 모델에 기반하여 모델 훈련을 계속 수행할 수도 있다. 단계 4에서, UE와 RAN 노드 및/또는 다른 UE로부터 AI 모델 기반의 추론을 위한 입력 데이터(예: 추론 데이터)를 수신한다. 단계 5에서, UE는 수신된 추론 데이터를 이용하여 AI 모델 기반의 추론을 수행함으로써 출력 데이터(예: 예측 또는 결정)를 생성한다. 단계 6에서, 적용가능한 경우, UE는 RAN 노드에게 모델 성능 피드백을 송신할 수 있다. 단계 7에서, UE와 RAN 노드는 출력 데이터에 기반한 동작을 수행한다. 단계 8에서, UE는 RAN 노드에게 피드백 정보를 송신한다.
전술한 프레임워크 및 절차에 따라, 무선 통신 시스템에서, AI 모델이 훈련되고, 활용될 수 있다. 전술한 프레임워크 및 절차에서, 입력 데이터, 훈련 데이터, 추론 데이터 등 다양한 데이터가 소개되었으며, 전술한 데이터의 구체적인 내용은 AI 모델이 활용되는 태스크(task)에 따라 달라질 수 있다. 예를 들어, 후술되는 본 개시의 다양한 실시예들에서 사용되는 정보가 전술한 데이터에 포함될 수 있다.
도 18은 본 개시에 적용 가능한 AI 기술 기반의 통신 절차를 도시한다. 도 18에 예시된 세부 절차들은 후술되는 본 개시의 다양한 실시예들과 결합될 수 있다. 예를 들어, 본 개시의 다양한 실시예들에 따라 생성되는 데이터가 도 18에 예시된 세부 절차들 중 적어도 하나에서의 동작(예: 설정, 훈련, 추론 및/또는 데이터 송수신)을 위해 사용될 수 있다. 다른 예로, 본 개시의 다양한 실시예들에 따라 데이터를 송신 및/또는 수신하기 위해 도 18에 예시된 추론의 결과가 사용될 수 있다.
도 18을 참고하면, 1801 단계에서, UE(1810), RAN 노드(1820), 네트워크 노드(1830) 중 적어도 하나는 초기 접속 절차를 수행한다. 예를 들어, 본 단계에서, 초기 셀 탐색 동작, 시스템 정보 획득 동작, 랜덤 액세스 동작, 등록 동작 중 적어도 하나가 수행될 수 있다. 1803 단계에서, UE(1810), RAN 노드(1820), 네트워크 노드(1830) 중 적어도 하나는 설정(configuration) 절차를 수행한다. 설정 절차를 통해, UE(1810) 및 RAN 노드(1820) 간 계층들 및/또는 UE(1810) 및 네트워크 노드(1830) 간 적어도 하나의 계층에서 이후의 절차들을 수행하기 위해 필요한 파라미터, 자원, 연결 및/또는 엔티티가 결정 및/또는 생성될 수 있다. 이때, 설정 절차는 이후 훈련 및 추론을 위해 사용되는 AI 모델에 대한 정보, 상태 및/또는 특성에 기반하여 수행될 수 있다.
1805 단계에서, UE(1810), RAN 노드(1820), 네트워크 노드(1830) 중 적어도 하나는 모델 훈련 절차를 수행한다. UE(1810), RAN 노드(1820), 네트워크 노드(1830) 중 적어도 하나는 훈련 데이터를 수집하고, 훈련 데이터를 이용하여 학습을 수행할 수 있다. 예를 들어, 모델 훈련 절차는 도 15, 도 16 또는 도 17을 참고하여 설명된 바와 같이 수행될 수 있다. 만일, 오프라인에서 훈련된 모델이 사용되는 경우, 본 단계는 생략될 수 있다.
1807 단계에서, UE(1810), RAN 노드(1820), 네트워크 노드(1830) 중 적어도 하나는 훈련된 모델을 이용하여 태스크를 수행한다. 즉, 훈련된 모델을 이용한 추론 및/또는 예측의 결과에 의해 태스크가 수행될 수 있다. 예를 들어, 태스크는 통신 프로토콜에 속하는 절차로서, 이후의 데이터 송신 및/또는 수신을 위한 사전적 동작이거나, 데이터 송신 및/또는 수신에 관련되거나, 또는 데이터의 처리(예: 인코딩, 디코딩 등)에 관련될 수 있다.
1809 단계에서, UE(1810), RAN 노드(1820), 네트워크 노드(1830) 중 적어도 하나는 데이터를 송신 및/또는 수신한다. 이때, 1807 단계에서 수행된 태스크의 결과가 사용될 수 있다. 경우에 따라, 1807 단계에서 수행된 태스크가 데이터의 송신 및/또는 수신을 포함할 수 있으며, 이 경우, 본 단계는 1807 단계의 일부이므로 생략될 수 있다.
본 개시의 구체적인 실시예
본 개시는 무선 통신 시스템에서 장치의 적어도 일부 기능을 구현하기 위해 적용된 인공지능 모델의 학습에 관한 것으로, 실제 채널을 통과한 신호를 이용하여 온라인 학습(online learning)을 수행하기 위한 것이다. 구체적으로, 본 개시는 온라인 학습을 수행하기 위해 필요한 학습 데이터의 레이블(label)을 결정하기 위한 기술에 대한 것으로, 통신을 수행하는 복수의 장치들 간 레이블 데이터를 공유하기 위한 다양한 실시예들을 제안하고자 한다. 즉, 본 개시는, 온라인 학습을 수행하는 경우, 지도 학습에 필요한 레이블을 약속하고, 약속된 레이블을 이용하여 온라인 학습 수행하는 기술을 제안하고자 한다.
무선 통신 환경에서 인공지능 기술을 적용하여 전통적인 기법보다 더 나은 성능을 얻으려고 하는 목적에 의해서 많은 연구들이 진행되고 있다. 이때, 인공지능 모델에 대한 학습의 형태는 크게 두 가지, 즉 온라인 학습과 오프라인 학습으로 나누어질 수 있다.
먼저, 오프라인 학습은 모델링된 송수신 시뮬레이션을 바탕으로 오프라인에서 학습을 진행하는 방식이다. 오프라인 학습은 오프라인에서 진행되기 때문에, 시뮬레이션 내에서 모든 것을 알고 있는 절대자가 있음을 전제한다. 즉, 채널 환경이든 실제 생성한 데이터이든, 모든 것을 알다는 전제가 가능하므로, 지도 학습 시 이미 레이블도 확보될 수 있다. 하지만, 오프라인 학습 기법의 경우, 실제 환경에서 일어날 수 있는 모든 것들을 모델링하는 것은 불가능하고, 이러한 측면에서 모델링된 환경에서만 잘 작동할 수 밖에 없는 한계점이 존재한다.
이와 달리, 온라인 학습은 무선 통신 환경에 배치(deploy)된 상태에서 실제 채널을 통과한 신호를 이용하여 학습을 수행하는 방식이다. 온라인 학습의 경우, 환경 변화에 맞추어서 또는 모델링이 되지 아니한 부분도 실제 환경에 맞추어서 학습이 수행될 수 있다. 오프라인 학습에 비해서, 온라인 학습은 실제 환경 데이터를 기반으로 학습하므로, 더 좋은 성능을 확보할 수 있는 가능성을 가진다.
오프라인 학습 및 온라인 학습 각각의 장단점을 고려하면, 일차적으로 모델링할 수 있는 부분에 대하여 사전-훈련(pre-training) 관점에서 오프라인 학습을 수행하고, 실제 배치 후에 추가적인 온라인 학습을 통해서 신경망을 지속적으로 업데이트해 나가는 방식이 사용될 수 있다. 하지만, 온라인 학습을 수행함에 있어서, 중요한 문제점이 있다. 구체적으로, 일반적인 지도학습을 온라인 학습에 적용하는 경우, 실제 통신 상황에서 레이블을 어떻게 수신 장치가 알 수 있을지에 대한 문제가 존재한다.
예를 들어, 채널 추정을 수행하는 신경망을 설계하는 경우, 송신 장치에서 서로 알고 있는 값의 기준 신호를 송신하고, 수신 장치가 기준 신호를 수신하더라도, 채널은 그 자체를 모르는 상태에서 추정될 뿐이다. 랜덤 노이즈(random noise)가 존재하는 상태에서, 결국은 실제 채널이 무엇인지 알 수 있는 방법이 없으며, 따라서, 수신 장치는 정답, 즉 레이블을 알 수 없다. 레이블을 모르면, 결국 채널 추정으로 인한 오류를 모르는 것과 동일하므로, 학습을 수행하는 것은 가능하지 아니하다.
또 하나의 예로, 채널 등화기(equalizer)의 경우가 있다. 채널 등화기를 학습시키기 위해서, 입력으로서 수신된 신호, 출력으로서 채널 등화된(equalized) 신호가 필요하다. 즉, 채널이 데이터에 영향을 주며, 정답 채널은 상기에서 언급한 것처럼 추정된 채널을 정답으로 취급한 상태에서, 학습이 수행될 밖에 없다는 점이 한계로서 작용한다. 따라서, 온라인 학습의 환경 상, 실제 채널을 모르기 때문에 이후 다른 기능 블록들이 영향을 받을 수 밖에 없다.
따라서, 온라인 학습에서, 송신 장치 및 수신 장치들 간 레이블을 공유할 수 있는 방안이 필요하다. 이에, 본 개시는 공통되는 규칙으로 레이블을 결정하는 방안과, 이에 관련된 다양한 실시예들을 제안한다.
전술한 바와 같이, 온라인 학습을 위해, 송신 장치 및 수신 장치의 지도 학습을 위한 레이블을 전달하는 방안이 필요하다. 한가지 생각할 수 있는 방안으로, 송신 장치에서 송신된 비트 시퀀스와 수신 장치에서 복원한 비트 시퀀스를 가지고 종단 간(end-to-end) 학습을 하는 것이다. 이때, CRC(cyclic redundancy check)를 통해서 데이터 레벨에서 학습을 수행하는 방안이 고려될 수 있다. 하지만, CRC 검사에 성공하면, 해당 데이터가 정확하다고 해석되므로, 복원된 데이터는 레이블로서 사용될 것이다. 이 경우, 오류가 없으므로, 학습의 필요성이 적다. 반면, CRC 검사에 실패하면, 실제 송신된 비트 시퀀스(bit sequence)를 알 수 없으므로, 역시 학습이 불가능하다. 결국, 랜덤한(random) 데이터를 전송하는 상황이라면, 학습이 불가능하다 할 것이다. 또한, 전술한 바와 같이, 기준 신호 역시 채널 자체를 모르는 상황이라면, 역시 온라인 학습이 불가하다고 할 것이다.
따라서, 온라인 학습을 위한 레이블을 실시간으로 전달한다는 접근보다, 레이블을 미리 약속하는 접근법이 바람직하다. 따라서, 레이블을 결정하기 위한 새로운 방안이 필요하고, 이 새로운 방안에 따라 송신 장치 및 수신 장치가 동일하게 해석 가능한 규칙을 약속해야 할 것이다.
도 19는 본 개시의 일 실시예에 따라 인공지능 모델에 대한 온라인 학습을 수행하는 절차의 예를 도시한다. 도 19는 장치가 수신 동작을 위해 사용되는 인공지능 모델에 대한 학습을 수행하는 동작들로서, 단말의 동작 방법을 예시한다.
도 19을 참고하면, S1901 단계에서, 장치는 제어 정보를 수신한다. 일 실시예에 따라, 제어 정보는 이후 수신되는 데이터 신호에 대한 스케줄링 정보를 포함할 수 있다. 예를 들어, 제어 정보는 DCI 또는 SCI를 포함할 수 있다. 다른 실시예에 따라, 제어 정보는 온라인 학습을 위한 설정(configuration) 정보를 포함할 수 있다. 예를 들어, 온라인 학습을 위한 설정 정보는 온라인 학습 구간에 관련된 정보, 훈련되는 인공지능 모델에 관련된 정보, 레이블을 결정하기 위한 규칙에 관련된 정보 중 적어도 하나를 포함할 수 있다. 여기서, 제어 정보는 하나의 메시지 또는 복수의 메시지들을 통해 수신될 수 있다.
S1903 단계에서, 장치는 데이터 신호를 수신한다. 예를 들어, 장치는 S1901 단계에서 수신된 제어 정보에 기반하여 데이터 신호를 수신할 수 있다. 예를 들어, 장치는 제어 정보에 포함되는 스케줄링 정보에 의해 지시되는 자원을 통해 데이터 신호를 수신할 수 있다. 또는, 장치는 제어 정보에 포함되는 설정 정보에 의해 지시되는 온라인 학습 구간 동안 데이터 신호를 수신할 수 있다.
S1905 단계에서, 장치는 데이터를 복원한다. 데이터는 수신된 데이터 신호에 대한 일련의 처리 동작들에 의해 복원될 수 있다. 예를 들어, 일련의 처리 동작들은 OFDM 복조, 채널 추정, 등화, 성상도 디매핑, 채널 디코딩 중 적어도 하나를 포함한다. 이때, 일련의 처리 동작들 중 적어도 하나의 동작이 인공지능 모델을 이용하여 수행된다. 데이터를 복원함으로써, 장치는 데이터 신호에 포함된 비트 시퀀스의 추정을 획득할 수 있다. 여기서, 비트 시퀀스는 전송 블록의 형식으로 또는 부호화되지 아니한(uncoded) 데이터의 형식으로 데이터 신호에 포함될 수 있다. 여기서, 비트 시퀀스에 대한 추정은, 상대방 장치에서 송신된 전송 블록 또는 비트 시퀀스 대비, 오차를 가질 수 있다.
S1907 단계에서, 장치는 인공지능 모델에 대한 학습을 수행한다. 장치는 복원된 데이터를 이용하여 학습을 수행할 수 있다. 이를 위해, 장치는 복원된 데이터에 대한 송신 값, 즉, 상대방 장치에서 송신된 비트 시퀀스의 값을 결정한다. 다시 말해, 장치는 레이블을 결정한다. 일 실시예에 따라, 장치는 제어 정보 또는 데이터 신호에 관련된 정보에 기반하여, 미리 정의된 규칙에 따라, 레이블을 결정할 수 있다. 이에 따라, 장치는 레이블에 기반하여 전송 블록에 대한 추정이 가진 오차를 계산할 수 있으며, 오차에 기반하여 손실 값을 결정하고, 인공지능 모델의 가중치들을 업데이트할 수 있다. 여기서, 인공지능 모델은 통신을 위한 적어도 하나의 기능(예: 신호 처리, 데이터 처리, 채널 추정, 빔 관리 등)을 수행하도록 설계된 신경망을 포함할 수 있다.
S1909 단계에서, 장치는 피드백 정보를 송신한다. 예를 들어, 피드백 정보는 데이터 신호에 대응하는 피드백 정보로서, HARQ-ACK/NACK을 포함할 수 있다. 다른 예로, 일 실시예에 따라, 피드백 정보는 상대방 장치에서 사용되는 인공지능 모델을 업데이트하기 위한 기울기 정보를 포함할 수 있다. 즉, 온라인 학습의 대상인 인공지능 모델의 신경망이 상대방 장치 및 장치에 걸쳐 존재하는 경우, 장치에서의 신경망의 역전파 동작에 의해 생성되는 기울기 정보가, 상대방 장치에서 사용되는 신경망의 학습을 위해, 상대방 장치에게 전달될 수 있다.
도 20은 본 개시의 일 실시예에 따라 인공지능 모델에 대한 온라인 학습을 지원하는 절차의 예를 도시한다. 도 20은 장치가 상대방 장치에서 수신 동작을 위해 사용되는 인공지능 모델에 대한 학습을 지원하는 동작들로서, 기지국 또는 단말의 동작 방법을 예시한다.
도 20을 참고하면, S2001 단계에서, 장치는 제어 정보를 송신한다. 일 실시예에 따라, 제어 정보는 이후 수신되는 데이터 신호에 대한 스케줄링 정보를 포함할 수 있다. 예를 들어, 제어 정보는 DCI 또는 SCI를 포함할 수 있다. 다른 실시예에 따라, 제어 정보는 온라인 학습을 위한 설정(configuration) 정보를 포함할 수 있다. 예를 들어, 온라인 학습을 위한 설정 정보는 온라인 학습 구간에 관련된 정보, 훈련되는 인공지능 모델에 관련된 정보, 레이블을 결정하기 위한 규칙에 관련된 정보 중 적어도 하나를 포함할 수 있다. 여기서, 제어 정보는 하나의 메시지 또는 복수의 메시지들을 통해 송신될 수 있다.
S2003 단계에서, 장치는 데이터 신호를 생성한다. 데이터 신호는 전송 블록에 대한 채널 인코딩, 성상도 맵핑, 자원 맵핑, OFDM 변조 중 적어도 하나를 포함하는 일련의 동작들을 통해 생성될 수 있다. 이때, 일 실시예에 따라, 장치는 온라인 학습을 위한 레이블을 결정하고, 레이블을 포함하는 전송 블록을 생성할 수 있다. 일 실시예에 따라, 장치는 제어 정보 또는 데이터 신호에 관련된 정보에 기반하여, 미리 정의된 규칙에 따라, 레이블을 결정할 수 있다.
S2005 단계에서, 장치는 데이터 신호를 송신한다. 예를 들어, 장치는 S2003 단계에서 생성된 데이터 신호를 S2001 단계에서 송신된 제어 정보에 기반하여 데이터 신호를 송신할 수 있다. 예를 들어, 장치는 제어 정보에 포함되는 스케줄링 정보에 의해 지시되는 자원을 통해 데이터 신호를 송신할 수 있다. 또는, 장치는 제어 정보에 포함되는 설정 정보에 의해 지시되는 온라인 학습 구간 동안 데이터 신호를 송신할 수 있다.
S2007 단계에서, 장치는 피드백 정보를 수신한다. 예를 들어, 피드백 정보는 데이터 신호에 대응하는 피드백 정보로서, HARQ-ACK/NACK을 포함할 수 있다. 다른 예로, 일 실시예에 따라, 피드백 정보는 장치에서 사용되는 인공지능 모델을 업데이트하기 위한 기울기 정보를 포함할 수 있다. 즉, 온라인 학습의 대상인 인공지능 모델의 신경망이 장치 및 상대방 장치에 걸쳐 존재하는 경우, 상대방 장치에서의 신경망의 역전파 동작에 의해 생성되는 기울기 정보가, 장치에서 사용되는 신경망의 학습을 위해, 장치에게 전달될 수 있다.
S2009 단계에서, 장치는 인공지능 모델에 대한 학습을 수행한다. 장치는 S2007 단계에서 수신된 피드백 정보에 포함되는 기울기 정보를 이용하여 역전파를 수행함으로써, 인공지능 모델에 포함되는 가중치들을 업데이트할 수 있다. 다만, S2007 단계에서 수신된 피드백 정보에 기울기 정보가 포함되지 아니하는 경우, 본 단계는 생략될 수 있다.
도 21은 본 개시의 일 실시예에 따라 온라인 학습을 위한 레이블을 결정하는 절차의 예를 도시한다. 도 21는 다른 장치와 통신을 수행하는 장치의 동작 방법으로서, 온라인 학습을 위한 레이블 데이터를 생성하기 위한 동작들을 예시한다. 여기서, 장치는 기지국 또는 단말일 수 있다.
도 21를 참고하면, S2091 단계에서, 장치는 공유되는 정보에 기반하여 기준 정보를 결정한다. 여기서, 공유되는 정보는 별도의 추가적인 절차 없이 레이블 데이터를 송신 및/또는 수신하는 동작에 의해 공통적으로 알게 되는 정보를 의미한다. 예를 들어, 다양한 실시예들에 따라, 공유되는 정보는 레이블 데이터를 채널을 통해 송신 및/또는 수신하는 과정에서 송신되는 적어도 하나의 신호를 전달하는 자원에 관련된 정보를 포함할 수 있다. 이 경우, 자원에 대한 식별 정보, 위치 정보, 인덱스 등이 기준 정보로서 결정될 수 있다. 신호를 전달하는 자원은 추가적인 절차가 없더라도 알 수 있는 정보이므로, 동일한 규칙을 사용한다면, 동일한 레이블이 결정될 수 있다. 예를 들어, 자원에 관련된 정보는 프레임 인덱스, 서브프레임 인덱스, 슬롯 인덱스, 부반송파 인덱스, 주파수 인덱스, RB 개수, RB 인덱스, 시작 심볼 인덱스, SSB 검출 시점, 데이터 신호의 반복 횟수 중 적어도 하나를 포함할 수 있다.
S2093 단계에서, 장치는 기준 정보에 기반하여 레이블 데이터를 결정한다. 레이블 데이터로서 사용 가능한 비트 시퀀스들 및 비트 시퀀스들에 대응하는 레이블 인덱스는 테이블 또는 수식의 방식으로 미리 정의된다. 그리고, 기준 정보로부터 레이블 인덱스를 도출하기 위한 규칙 역시 미리 정의된다. 따라서, 기준 정보가 결정되면, 장치는 기준 정보에 기반하여 레이블 인덱스를 결정하고, 결정된 레이블 인덱스에 기초하여 레이블 데이터를 결정할 수 있다.
도 21를 참고하여 설명한 바와 같이, 공유되는 정보, 예를 들어, 신호를 전달하는 자원에 관련된 정보에 기반하여 레이블 데이터가 결정될 수 있다. 제어 정보 또는 데이터 신호를 전달한 자원은 장치 및 상대방 장치에서 추가적인 절차가 없더라도 알 수 있는 정보이므로, 동일한 규칙을 사용한다면, 동일한 레이블을 결정할 수 있다. 예를 들어, 자원에 관련된 정보는 프레임 인덱스, 서브프레임 인덱스, 슬롯 인덱스, 부반송파 인덱스, 주파수 인덱스, RB(resource block) 개수, RB 인덱스, 시작 심볼 인덱스, SSB 검출 시점, 데이터 신호의 반복 횟수 중 적어도 하나를 포함할 수 있다. 그리고, 레이블을 결정하는 규칙은 미리 정의될 수 있다.
전술한 바와 같이, 미리 정의된 규칙에 기반하여 온라인 학습에 관련된 장치들이 레이블을 결정함으로써, 공통되는 값의 레이블을 공유할 수 있다. 이를 위해, 미리 정의되는 레이블 인덱스 및 레이블 비트 시퀀스, 레이블들의 개수 및 공유되는 정보(예: 프레임, 서브프레임 또는 슬롯의 인덱스)에 기반한 연결(linkage) 규칙, 비트 시퀀스를 이용한 부호화 또는 비-부호화(coding or not with bit sequence) 등에 대한 정의가 필요하다. 다양한 실시예들에 따라, 레이블은 미리 정의된 규칙에 따라 이하 [표 2]와 같이 정의될 수 있다.
레이블 인덱스 비트 시퀀스 (레이블)
1 0100100110 … 11111010101
2 0011000110 … 10010001001
N 1110111011 … 11101111011
[표 2]의 예와 같이, 송신 장치 및 수신 장치 간, 레이블 인덱스와 해당 레이블인 비트 시퀀스가 미리 약속될 수 있다. 여기서, 레이블 인덱스들의 개수 및 레이블의 길이(예: 비트 사이즈) 등도 미리 약속될 수 있다. 이때, 레이블의 비트 사이즈는 다양하게 미리 약속될 수 있다. 다양한 실시예들에 따라, 테이블 외 서로 약속된 비트 시퀀스들을 인덱스에 기반하여 생성할 수 있는 다른 방식이 사용될 수 있다. 예를 들어, 레이블 인덱스 또는 레이블 인덱스에 관련된 값을 입력으로 취하는 함수를 이용하여 레이블이 결정될 수 있다. 또한, 복수의 테이블들이 정의될 수 있으며, 훈련되는 인공지능 모델, 태스크 등에 따라 어느 하나의 테이블이 선택적으로 사용될 수 있다.
전술한 미리 약속된 레이블 인덱스 및 레이블에 기반하여, 송신 장치 및 수신 장치는 다음과 같이 온라인 학습 절차 중 레이블을 해석할 수 있다. 온라인 학습을 수행하는 동안, 단말은 연결(connected) 상태에 있을 수 있다. 따라서, 동기화 절차를 통해, 기지국 및 단말은 프레임(frame) 또는 서브프레임(subframe)의 인덱스를 동일하게 알고 있을 것이다. 그 결과, 프레임 또는 서브프레임의 인덱스를 기반으로, 송신 장치 및 수신 장치는 "Label index = function (frame index, N)"와 같이 프레임 인덱스를 해석할 수 있다. 여기서, function은 프레임 인덱스를 N,즉, 레이블들의 개수(# of labels)로 나눈 나머지를 출력할 수 있다. 또는, function은 프레임 인덱스를 N,즉, 레이블들의 개수(# of labels)로 나눈 몫을 출력할 수 있다.
예를 들어, NR의 MIB에 포함되는 systemFrameNumber는 0 내지 1023 중 하나의 값을 가진다. 레이블의 개수 N를 1024이고, 프레임 번호(frame number)가 23이면, 레이블 인덱스 23에 대응하는 비트 시퀀스가 레이블로서 사용된다. 따라서, 일 실시예에 따라, 송신 장치는 512 비트 크기의 비트 시퀀스를 포함하는 TB(transport block)를 생성하고, 송신할 수 있다. 수신 장치는 송신 장치에서 송신된 신호를 수신하고, 수신된 신호를 디코딩함으로써 레이블 인덱스 23에 대응하도록 약속된 비트 시퀀스를 레이블, 즉, 정답으로 판단하고, 비트 오류(bit error), 즉, 손실 함수(loss function)을 계산할 수 있다. 손실 함수에 기반하여, 수신 장치는 역 전파(back propagation)을 수행함으로써 신경망을 업데이트할 수 있다.
전술한 실시예에서, 레이블 인덱스를 도출하기 위해 프레임 인덱스가 사용된다. 다른 실시예에 따라, 레이블 인덱스를 해석하는 과정에서, 프레임 인덱스를 대신하여, "Label index = function (subframe index, N)"와 같이, 서브프레임 인덱스가 사용될 수 있다. 여기서, subframe index는 "frame index × # of subframes in frame + subframe index"로 정의될 수 있다. 또한, 프레임 인덱스를 대신하여, "Label index = function(slot index, N)"와 같이, 슬롯 인덱스가 사용될 수 있다. 여기서, "slot index = subframe index × # of slots in subframe + slot index"로 정의될 수 있다.
도 22는 본 개시의 일 실시예에 따라 인공지능 모델에 대한 학습을 수행하기 위한 절차의 예를 도시한다. 도 22는 제1 장치(2210) 및 제2 장치(2220) 중 적어도 하나에서 사용되는 인공지능 모델(예: 신경망 모델)의 온라인 학습을 위한 신호 교환을 예시한다.
도 22를 참고하면, S2201 단계에서, 제2 장치(2220)는 제1 장치(2210)에게 온라인 학습 요청 메시지를 송신한다. 다시 말해, 제2 장치(2220)는 제2 장치(2220)에서 사용되는 인공지능 모델에 대한 온라인 학습을 수행할 것을 요청한다. 일 실시예에 따라, 온라인 학습 요청 메시지는 훈련될 인공지능 모델에 관련된 정보, 인공지능 모델의 학습 이력에 관련된 정보 중 적어도 하나를 포함할 수 있다.
S2203 단계에서, 제1 장치(2210)는 제2 장치(2220)에게 온라인 학습 응답 메시지를 송신한다. 다시 말해, 제1 장치(2210)는 온라인 학습 요청 메시지에 응하여 요청의 수락 여부를 응답한다. 본 실시예에서, 온라인 학습 응답 메시지는 온라인 학습을 수행할 것을 지시한다. 일 실시예에 따라, 온라인 학습 응답 메시지는 온라인 학습에 대한 설정 정보로서, 예를 들어, 온라인 학습 구간(2202)의 시작 시점에 관련된 정보(예: 프레임, 서브프레임 또는 슬롯의 번호, 프레임, 서브프레임 또는 슬롯 단위 오프셋 등), 온라인 학습에 사용되는 레이블에 관련된 정보(예: 레이블 결정 규칙 또는 테이블 할당, 가용한 레이블 인덱스들 등), 기울기 정보에 대한 피드백에 관련된 정보(예: 피드백 여부, 피드백을 위한 자원 할당 등)를 지시하는 정보 중 적어도 하나를 포함할 수 있다.
S2205 단계에서, 제1 장치(2210)는 프레임 인덱스를 이용하여 선택된 레이블 비트 시퀀스에 기반하여 데이터를 생성한다. 즉, 제1 장치(2210)는 프레임 인덱스를 확인하고, 확인된 프레임 인덱스에 기반하여 레이블 인덱스를 결정하고, 결정된 레이블 인덱스에 대응하는 비트 시퀀스를 확인할 수 있다.
S2207 단계에서, 제1 장치(2210)는 제2 장치(2220)에게 레이블 데이터를 송신한다. 즉, 제1 장치(2210)는 S2205 단계에서 확인된 비트 시퀀스를 페이로드로서 포함하는 신호를 송신할 수 있다. 이를 위해, 도 22에 도시되지 아니하였으나, 레이블 데이터의 송신 전, 제1 장치(2210) 또는 제2 장치(2220)는 제어 정보를 송신할 수 있다. 예를 들어, 제어 정보는 레이블 데이터를 위한 스케줄링 정보를 포함할 수 있다.
S2209 단계에서, 제2 장치(2220)는 데이터를 검출하고, 프레임 인덱스를 이용하여 선택된 레이블 비트 시퀀스에 기반하여 손실을 계산한다. 즉, 제2 장치(2220)는 수신된 신호에 대한 복조, 디코딩을 수행하고, 디코딩을 통해 얻어진 비트들 및 레이블 비트 시퀀스를 비교한다. 비트들 및 레이블 비트 시퀀스가 동일하면, 손실은 0이다. 하지만, 비트들 및 레이블 비트 시퀀스가 상이하면, 비트들 및 레이블 비트 시퀀스 간 차이에 기반하여 손실 값이 결정될 수 있다.
S2211 단계에서, 제2 장치(2220)는 계산되는 기울기를 이용하여 신경망을 업데이트한다. 다시 말해, 제2 장치(2220)는 손실 값에 기반하여 역전파 동작을 수행함으로써 신경망에 포함되는 가중치들을 업데이트할 수 있다. 즉, 제2 장치(2220)는 손실 값이 감소되도록, 기울기를 이용해서 신경망의 가중치 값을 업데이트할 수 있다.
S2213 단계에서, 제2 장치(2220)는 제1 장치(2210)에게 기울기 정보를 송신한다. 본 단계는 훈련되는 인공지능 모델의 적어도 일부가 제1 장치(2210)에서도 사용되는 경우에 수행된다. 즉, 훈련되는 인공지능 모델이 제2 장치(2220)에서만 사용되는 경우, 다시 말해, 제2 장치(2220)의 동작에만 관련되는 경우, 본 단계는 생략될 수 있다.
도 22에서 제1 장치(2220) 및 제2 장치(2220)은 통신을 수행하는 두 장치들로서, 제1 장치(2210)는 송신 동작, 제2 장치(2220)는 수신 동작을 수행하기 위해 인공지능 모델을 이용할 수 있다. 하향링크 통신을 수행하는 경우, 제1 장치(2220) 및 제2 장치(2220)은 기지국 및 단말로 이해될 수 있다. 상향링크 통신을 수행하는 경우, 제1 장치(2220) 및 제2 장치(2220)은 단말 및 기지국으로 이해될 수 있다. 사이드링크 통신을 수행하는 경우, 제1 장치(2220) 및 제2 장치(2220)은 단말 및 단말로 이해될 수 있다. 즉, 전술한 절차는 기지국-단말, 단말-기지국, 단말-단말 등의 조합들에 대하여 수행될 수 있다.
도 22를 참고하여 설명한 실시예와 같이, 프레임, 서브 프레임 또는 슬롯의 인덱스에 기반하여, 동일한 규칙을 이용하여, 장치들이 레이블을 결정할 수 있다. 이에 따라, 프레임, 서브 프레임 또는 슬롯의 인덱스가 공통되면, 장치들은 동일한 비트 시퀀스를 가지는 레이블을 결정할 수 있다. 프레임, 서브 프레임 또는 슬롯은 장치들 간 송신 및 수신되는 신호를 전달하는 자원의 단위이므로, 신호에 포함되는 데이터의 오류 여부와 무관하게, 신호를 송신 및 수신하였다면, 장치들은 동일한 인덱스를 알게 될 것이다. 이때, 사용되는 인덱스에 관련된 프레임, 서브 프레임 또는 슬롯은 레이블을 전송 블록으로서 포함하는 데이터 신호를 전달한 프레임, 서브 프레임 또는 슬롯이거나, 데이터 신호에 대한 할당 정보를 전달한 프레임, 서브 프레임 또는 슬롯이거나, 온라인 학습에 관련된 설정 정보를 전달한 프레임, 서브 프레임 또는 슬롯이거나, 또는 장치들 중 하나가 동기 신호를 검출한 SSB를 전달한 프레임, 서브 프레임 또는 슬롯일 수 있다.
다양한 실시예들에서, 프레임, 서브 프레임 또는 슬롯의 인덱스가 사용되는 것은, 다른 요인에 종속되지 아니하고, 다양한 값들이 선택될 수 있기 때문이다. 프레임, 서브 프레임 또는 슬롯의 인덱스는 순차적으로 증가하기 때문에, 장치들의 통신 환경이나 채널 품질 등에 무관하게 변화하는 변수이기 때문이다. 하지만, 다른 실시예들에 따라, 프레임, 서브 프레임 또는 슬롯의 인덱스가 아닌, 신호를 전달한 자원에 관련된 다른 정보가 레이블 또는 레이블 인덱스를 결정하기 위해 사용될 수 있다. 구체적으로, 자원에 관련된 정보로서, 주파수 인덱스, RB(resource block) 개수, RB 인덱스, 시작 심볼 인덱스, SSB 검출 시점, 데이터 신호의 반복 횟수 중 적어도 하나가 사용될 수 있다. 이 외 다른 정보가 사용되는 것도 가능하다.
송신 장치 및 수신 장치의 물리 계층의 일부에 인공지능 모델이 적용된 구조의 예들은 다음과 같다,
일 예로, 물리 계층의 기능들 중 일례로 LDPC 인코더 및 LDPC 디코더를 대체하는 신경망 기반 채널 인코더 및 디코더를 온라인 학습하는 시나리오는 다음과 같다. 도 23은 본 개시의 일 실시예에 따라 인공지능 모델을 이용하여 채널 인코딩/디코딩을 수행하는 송신 장치 및 수신 장치의 예를 도시한다.
도 23을 참고하면, 송신 장치에서, 미리 정의된 레이블 인덱스 및 레이블 비트 시퀀스 블록(2302)에서 출력되는 입력 비트 시퀀스는 코드북 세그먼테이션(codebook segmentation) 블록(2304)에 의해 코드워드 단위로 분할되고, 신경망 채널 인코더 블록(2306)에 의해 코드워드들로 변환된다. 이후, 코드워드들은 레이트 매칭(rate matching) 블록(2308), 스크램블링 블록(2310), 변조 블록(2312)을 거쳐 변조 심볼들로 변환된다. 이어, 변조 심볼들 및 DMRS 생성 블록(2316)에서 출력되는 DMRS들은 레이어 및 RE 맵핑(mapping) 블록(231)에 의해 레이어(들) 및 RE들에 맵핑되고, OFDM 변조기(2318)에 의해 OFDM 심볼로 변환된다. 이후, OFDM 심볼은 송신기 필터(transmitter filter) 블록(2320)을 거쳐, 무선 채널을 통해 송신된다.
무선 채널을 통과한 신호는 수신 장치에 수신된다. 수신된 신호는 OFDM 복조기 블록(2322)에 의해 부반송파 별 변조 심볼들로 변환되고, STO(sample timing offset) 및 CFO(carrier frequency offset) 정정(correction) 블록(2324)에 의해 시간 및/또는 주파수 오프셋이 정정된다. 이어, 레이어 및 RE 디맵핑 블록(2326)에 의해 DMRS 및 변조 심볼들이 추출되고, MMSE 채널 추정기 블록(2328)에서 채널 추정이, MMSE 등화기 블록(2330)에서 채널 추정 결과에 기반한 등화 동작이 수행된다. 이후, 소프트 복조(soft demodulation) 블록(2332), 디스크램블링 블록(2334), 레이트 디매칭 블록(2336)에 의해 비트 정보(예: LLR 값)가 생성되고, 비트 정보는 신경망 채널 디코더(2338)에 입력된다. 신경망 채널 디코더(2338)는 채널 인코딩 전의 비트들을 출력하고, 비트들은 코드북 디세그먼테이션(desegmentation) 블록(2340)에 의해 비트 시퀀스로 변환된다. 복원된 비트 시퀀스 및 미리 정의된 레이블 인덱스 및 레이블 비트 시퀀스 블록(2342)에서 출력되는 레이블은 손실 함수 계산(loss function calculation) 블록(2344)으로 입력되고, 손실 함수를 결정하기 위해 사용된다. 즉, 손실 함수 계산 블록(2344)은 복원된 비트 시퀀스 및 미리 정의된 레이블 인덱스 및 레이블 비트 시퀀스 블록(2342)에서 출력되는 레이블을 이용하여 손실 값을 결정한다.
도 23의 예와 같이, 기존의 CRC과 달리 미리 정의된(pre-defined) 레이블을 바탕으로 손실이 계산되고, 학습이 수행될 수 있다. 예를 들어, 손실은 크로스-엔트로피(cross-entropy)를 포함할 수 있다. 또한, 도 23의 예에서, 송신 장치에 포함된 신경망 채널 인코더에 대한 학습을 위한 오차 기울기(error gradient)가 피드백된다.
일 실시예에 따라, 오차 기울기를 계산하는 과정에서, 수신 장치는 신경망 채널 디코더의 기울기를 쉽게 계산할 수 있지만, 송신 장치까지 기울기 정보를 전달하기 위해서 중간 동작들을 수행하는 블록들의 역(inverse)을 계산해야 하는 어려움이 있다. 이때, 송신 장치의 채널 인코더와 수신 장치의 채널 디코더 사이의 모든 절차를 가우시안(Gaussian) 채널로 근사(approximation)함으로써 오차에 따른 기울기를 계산하고, 전달할 수 있다. 이는 채널 페이딩(channel fading)이 있음에도 불구하고 MMSE 등화기 블록(2330)를 통해 화이트닝(whitening) 되었다고 보는 것이 가능하기 때문이다.
다른 예로서, STO(sample timing offset) 및 CFO(carrier frequency offset) 정정(correction)을 수행하는 블록이 신경망 기반 기능 블록으로 대체되는 경우는 도 24와 같다. 도 24는 본 개시의 일 실시예에 따라 인공지능 모델을 이용하여 오프셋 추정 및 보상을 수행하는 송신 장치 및 수신 장치의 예를 도시한다.
도 24를 참고하면, 송신 장치에서, 정보 비트들은 코드북 세그먼테이션 및 CRC 추가(attachment) 블록(2402)에 의해 코드워드 단위로 분할되고, CRC와 연결되고, LDPC 인코더 블록(2404)에 의해 코드워드들로 변환된다. 이후, 코드워드들은 레이트 매칭 블록(2406), 스크램블링 블록(2408)의해 변환된 후, 변조 블록(2412)을 거쳐 변조 심볼들로 변환된다. 하지만, 본 실시예의 경우, 스크램블링 블록(2408)의 출력이 변조 블록(2412)으로 입력되지 아니하고, 미리 정의된 레이블 인덱스 및 레이블 비트 시퀀스 블록(2410)에서 출력되는 레이블 데이터가 변조 블록(2412)으로 입력되고, 변조 심볼들로 변환된다. 이어, 변조 심볼들 및 DMRS 생성 블록(2416)에서 출력되는 DMRS들은 레이어 및 RE 맵핑 블록(2414)에 의해 레이어(들) 및 RE들에 맵핑되고, OFDM 변조기(2418)에 의해 OFDM 심볼로 변환된다. 이후, OFDM 심볼은 송신기 필터 블록(2420)을 거쳐, 무선 채널을 통해 송신된다.
무선 채널을 통과한 신호는 수신 장치에 수신된다. 수신된 신호는 OFDM 복조기 블록(2422)에 의해 부반송파 별 변조 심볼들로 변환되고, 신경망 기반 STO 및 CFO 정정 블록(2424)에 의해 시간 및/또는 주파수 오프셋이 정정된다. 이어, 레이어 및 RE 디맵핑 블록(2426)에 의해 DMRS 및 변조 심볼들이 추출되고, MMSE 채널 추정기 블록(2428)에서 채널 추정이, MMSE 등화기 블록(2430)에서 채널 추정 결과에 기반한 등화 동작이 수행된다. 이후, 소프트 복조 블록(2432), 디스크램블링 블록(2434), 레이트 디매칭 블록(2436)에 의해 비트 정보(예: LLR 값)가 생성되고, 비트 정보는 LDPC 디코더(2438)에 입력된다. LDPC 디코더(2438)는 채널 인코딩 전의 비트들을 출력하고, 비트들은 코드북 디세그먼테이션 및 CRC 분리(detachment) 블록(2440)에 의해 비트 시퀀스로 변환된다. 여기서, 소프트 복조 블록(2432)의 출력은 손실 함수 계산 블록(2442)로 입력된다. 또한, 미리 정의된 레이블 인덱스 및 레이블 비트 시퀀스 블록(2444)의 출력은 변조 블록(2446)에 의해 변조 심볼들로 변환된 후, 손실 함수 계산 블록(2442)로 입력된다. 손실 함수 계산 블록(2442)은 소프트 복조 블록(2432)의 출력 및 변조 블록(2446)에 의해 생성된 변조 심볼들을 이용하여 손실 값을 결정한다.
이때, 채널 코딩을 거쳐서 온라인 학습을 수행할 수도 있겠지만, 코딩되지 아니한 비트(Uncoded bit) 레벨에서 학습이 수행될 수 있다. 도 24를 참고하면, 비트 시퀀스를 직접 변조(modulation) 블록에 입력하는 경우, 수신 장치는 복조된 성상도 점(demodulated constellation point) 및 레이블 비트 시퀀스의 변조를 비교함으로써 두 신호간의 MSE(mean square error)를 손실 함수로서 계산할 수 있다. 또는, 수신 장치는 LLR을 경판정(hard decision)한 후 비트 레벨(bit level)에서 크로스-엔트로피를 손실 함수로서 계산할 수도 있다. 도 24의 경우, 오차에 기반하여 계산된 기울기는 수신 장치에서 신경망을 업데이트하기 위해 사용되고, 송신 장치에게 피드백되지 아니할 수 있다.
도 23 및 도 24와 같은 예들에서, 하나의 블록 혹은 블록의 쌍(pair)을 신경망 기반의 기능 블록들로 대체한 경우가 예시되었으나, 본 개시는 이에 국한되지 아니한다. 구체적으로, 인공지능 모델의 적용 예로서, 도 23은 신경망 구조를 가지는 채널 인코더/디코더, 도 24는 신경망 구조를 가지는 STO 및 CFO 정정 블록을 예시한다. 하지만, 본 개시의 다양한 실시예들은 다른 기능 블록을 인공지능 모델로 설계한 경우에도 적용될 수 있다. 예를 들어, 채널 추정기, 등화기 등 도 23 및 도 24에 도시된 수신 장치 및 송신 장치에 포함되는 모든 블록들 또는 이외 다른 블록들이 신경망 구조를 가지도록 설계되고, 본 개시의 다양한 실시예들에 따라 훈련될 수 있다.
레이블 데이터 크기(label data size)에 따른 컨테이너 크기(container size) 등은 스케줄링에 의해서 동작될 수 있다. 또한, 프레임, 서브프레임 또는 슬롯의 인덱스에 더하여, 추가적으로 DCI에 스케줄링된 가장 낮은 주파수 인덱스(lowest frequency index) 또는 시작 심볼 인덱스(staring symbol index) 등이 추가적으로 더 사용될 수 있다.
전술한 코딩되지 아니한 비트 시퀀스의 경우, 변조를 위한 규칙이 필요하다. 기존의 기준 신호(RS) 패턴과 같이 약속된 랜덤 시퀀스(random sequence)를 사용하는 방식과 유사하나, 프레임, 서브프레임 또는 슬롯의 인덱스에 따라서, 변조 방식(modulation scheme)이 다양하게 운영될 수 있다. 다시 말해, 일반적인 데이터 또는 기준 신호에 적용가능한 변조 방식들을 위한 성상도들 외, 다른 구조의 성상도(들)이 학습을 위해 정의 및 사용될 수 있다.
예를 들어, 위상(phase)과 관련된 태스크(예: STO 및/또는 CFO 정정)를 수행하는 신경망에 대한 학습이 필요한 경우, PSK 계열의 변조 방식을 이용하여 더욱 정확한 학습이 유도될 수 있다. 반면, 채널의 비-선형성(non-linearity)에 관련된 태스크(예: PA의 특성 관련 태스크)를 위한 학습이 필요한 경우, 16QAM 또는 PSK 계열이면서 크기가 다른 2개 이상의 변조 방식들을 이용하여 학습 레이블을 생성하는 것이 필요하다. 일 실시예에 따라, "modulation pattern = function(bit sequence from frame index, frame index)"과 같은 규칙이 정의될 수 있다.
여기서, 변조 방식을 적용함으로써, 프레임, 서브프레임 또는 슬롯의 인덱스로부터 얻어지는 비트 시퀀스가 프레임 인덱스에 따라서 변조된 신호 레이블로 변환될 수 있다. 즉, 프레임, 서브프레임 또는 슬롯의 인덱스에 기반하여 결정된 비트 시퀀스가 변조 심볼들로 변환되며, 이때, 변조 방식은 프레임, 서브프레임 또는 슬롯의 인덱스에 기반하여 결정될 수 있다. 예를 들어, 위상 학습을 위한 16-PSK 계열 및 비선형 특성 학습을 위한 16-QAM을 같이 사용하는 경우, 프레임 인덱스를 16으로 나눈 몫이 홀수이면 16-PSK로, 몫이 짝수이면 16-QAM으로 비트 시퀀스가 변조될 수 있다. 다른 예로, 사용되는 변조 방식들의 개수가 3 이상이면, 프레임 인덱스에 대한 모듈로 연산의 결과에 기반하여 변조 방식들이 선택적으로 적용될 수 있다.
이에 따라, 수신 장치는 프레임, 서브프레임 또는 슬롯의 인덱스에 기반하여 결정되는 비트 시퀀스를 이용하여 변조 방식을 확인하고, 확인된 변조 방식으로 수신된 신호를 처리(예: 복조)함으로써 데이터를 복원할 수 있다. 또는, 수신 장치는 수신된 신호에 기반하여 변조 심볼 시퀀스에 대한 추정을 결정하고, 레이블을 확인된 변조 방식으로 변조함으로써 변조 심볼 시퀀스를 레이블로서 생성한 후, 변조 심볼 시퀀스에 대한 추정 및 레이블을 이용하여 학습을 수행할 수 있다.
여기서, 사용 가능한 변조 방식들 및 변조 방식의 개수는 사전에 미리 약속될 수 있다. 수개 또는 수십 개의 변조 방식들이 사용될 수 있으며, 별도의 시그널링을 통해 단말에서 레이블로서 사용 가능한 변조 방식들이 설정될 수 있다. 즉, 전술한 변조 방식들의 개수 및 변조 방식들은 UE-특정(specific)하게 학습 목적에 따라 다르게 운영될 수 있다. 따라서, 온라인 학습을 위한 능력(capability) 등을 협상(negotiation)하는 과정에서, 변조 방식들의 개수 및 변조 방식들이 미리 약속될 수 있다.
도 25는 본 개시의 일 실시예에 따라 학습에 관련된 능력 정보를 시그널링하기 위한 절차의 예를 도시한다. 도 25는 제1 장치(2510) 및 제2 장치(2520) 중 적어도 하나에서 사용되는 인공지능 모델(예: 신경망 모델)의 온라인 학습에 관련된 능력 정보를 획득하기 위한 신호 교환을 예시한다.
도 25를 참고하면, S2501 단계에서, 제2 장치(2520)는 제1 장치(2510)에게 온라인 학습 능력 요청 메시지를 송신한다. 일 실시예에 따라, 온라인 학습 능력 요청 메시지는 부호화되지 아니하는 레이블을 위한 적어도 하나의 변조 방식을 지시할 수 있다. 예를 들어, 온라인 학습 능력 요청 메시지는 인덱스 3 및 인덱스 5의 변조 방식들을 지시할 수 있다.
S2503 단계에서, 제1 장치(2510)는 제2 장치(2520)에게 온라인 학습 능력 응답 메시지를 송신한다. 일 실시예에 따라, 온라인 학습 능력 응답 메시지는 부호화되지 아니하는 레이블을 위한 적어도 하나의 변조 방식을 지시할 수 있다. 예를 들어, 온라인 학습 능력 응답 메시지는 인덱스 3 및 인덱스 5의 변조 방식들을 지시할 수 있다.
도 25와 같이, 능력 정보를 통해 사용할 변조 방식들이 설정될 수 있다. 이와 같이, 온라인 학습을 시작하기 전에 부호화되지 아니하는 방식에 대한 변조 방식들의 집합(set)과 해당 타입들이 미리 약속될 수 있다. 이후, 학습 시, 장치들은 해당 변조 방식에 따라서 프레임, 서브프레임 또는 슬롯의 인덱스에 기반하여 변조 방식들을 변경하면서 운영할 수 있다. 이를 위해, 사용 가능한 변조 방식들의 후보들이 미리 정의되는 것이 필요하다. 사용 가능한 변조 방식들의 후보들의 일 예는 이하 [표 3]과 같다.
인덱스 변조 방식
1 BPSK
2 QPSK
3 8-PSK
15 16QAM
16 64QAM
[표 3]의 예에서, 변조 방식들은 현존하는 성상도에 따르는 방식들만으로 예시되었다. 하지만, 온라인 학습을 위한 변조 방식은 이 외 다양하게 정의될 수 있다. 따라서, 변조 방식은 [표 3]과 같은 명칭 외, 성상도 점들의 좌표를 지정하는 방식으로 표현될 수 있다. 예를 들어, {(1,j),(-1,-j)} 또는 {(1,j),(-1,-j),(1,-j)}와 같이 정의되는 성상도에 기반한 변조 방식이 사용될 수 있다.
전술한 바와 같이, 프레임, 서브프레임, 슬롯의 인덱스를 이용하여 비트 시퀀스 및 변조 방식이 결정될 수 있다. 하지만, 다른 실시예에 따라, 변조 방식은 별도로 시그널링될 수 있다. 레이블 데이터를 포함하는 신호가 송신되는 경우, 신호에 대한 DCI 또는 SCI의 송신이 필요하다. 이때, DCI 또는 SCI는 MCS 레벨에 대한 정보(이하 'MCS 필드')를 포함하므로, MCS 필드를 이용하여 레이블에 적용된 변조 방식을 지시하는 것이 가능하다. 단, 레이블 데이터를 포함하는 신호를 위한 DCI 또는 SCI의 경우, MCS 필드의 해석이 일반적인 데이터 신호와 다를 수 있다. 즉, 온라인 학습 구간 동안 송신되는 DCI 또는 SCI를 생성 및 해석함에 있어서, 장치들은, 일반적인 데이터에 적용되는 MCS 테이블이 아닌, 본 개시의 다양한 실시예들에 따른 변조 방식 테이블(예: 이하 [표 3])을 기반으로 MCS 필드를 생성 및 해석할 수 있다.
상기 설명한 제안 방식들은 독립적으로 구현될 수도 있지만, 일부 제안 방식들의 조합 (또는 병합) 형태로 구현될 수도 있다. 상기 제안 방법들의 적용 여부 정보 (또는 상기 제안 방법들의 규칙들에 대한 정보)는 기지국이 단말에게 사전에 정의된 시그널 (예: 물리 계층 시그널 또는 상위 계층 시그널)을 통해서 알려주도록 규칙이 정의될 수 있다.
본 개시는 본 개시에서 서술하는 기술적 아이디어 및 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 개시의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 개시의 등가적 범위 내에서의 모든 변경은 본 개시의 범위에 포함된다. 또한, 특허청구범위에서 명시적인 인용 관계가 있지 않은 청구항들을 결합하여 실시예를 구성하거나 출원 후의 보정에 의해 새로운 청구항으로 포함할 수 있다.
본 개시의 실시예들은 다양한 무선접속 시스템에 적용될 수 있다. 다양한 무선접속 시스템들의 일례로서, 3GPP(3rd Generation Partnership Project) 또는 3GPP2 시스템 등이 있다.
본 개시의 실시예들은 상기 다양한 무선접속 시스템뿐 아니라, 상기 다양한 무선접속 시스템을 응용한 모든 기술 분야에 적용될 수 있다. 나아가, 제안한 방법은 초고주파 대역을 이용하는 mmWave, THz 통신 시스템에도 적용될 수 있다.
추가적으로, 본 개시의 실시예들은 자율 주행 차량, 드론 등 다양한 애플리케이션에도 적용될 수 있다.

Claims (18)

  1. 무선 통신 시스템에서 제1 장치의 동작 방법에 있어서,
    제2 장치로부터 제어 정보를 수신하는 단계;
    상기 제어 정보에 기반하여 데이터 신호를 수신하는 단계;
    상기 데이터 신호에 포함된 데이터를 복원하는 단계;
    상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하는 단계를 포함하며,
    상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행되는 방법.
  2. 청구항 1에 있어서,
    상기 자원에 관련된 정보는, 프레임 인덱스, 서브프레임 인덱스, 슬롯 인덱스, 부반송파 인덱스, 주파수 인덱스, RB(resource block) 개수, RB 인덱스, 시작 심볼 인덱스, SSB(synchronization signal and broadcast channel block) 검출 시점 중 적어도 하나를 포함하는 방법.
  3. 청구항 1에 있어서,
    상기 데이터에 관련된 피드백 정보를 상기 제2 장치에게 송신하는 단계를 더 포함하는 방법.
  4. 청구항 3에 있어서,
    상기 피드백 정보는, 상기 제1 장치에서 사용되는 신경망의 역전파 동작에 의해 생성되는 기울기(gradient)에 관련된 정보를 포함하는 방법.
  5. 청구항 1에 있어서,
    상기 레이블은, 상기 자원에 관련된 정보에 기반하여 결정되는 인덱스에 대응하는 비트 시퀀스를 포함하며,
    상기 인덱스 및 상기 비트 시퀀스의 대응 관계는, 미리 정의되는 방법.
  6. 청구항 1에 있어서,
    상기 인공지능 모델에 대한 학습을 수행하는 단계는,
    상기 복원된 데이터 및 상기 레이블 간 오차에 기반하여 손실 값을 결정하는 단계; 및
    상기 손실 값에 기반하여 역전파 동작을 수행하는 단계를 포함하는 방법.
  7. 청구항 6에 있어서,
    상기 인공지능 모델은, 신경망 기반의 채널 추정기, 신경망 기반의 채널 디코더, 신경망 기반의 STO(sample timing offset) 및 CFO(carrier frequency offset) 정정(correction) 블록, 채널 추정 블록, 등화 블록 중 적어도 하나를 포함하는 방법.
  8. 청구항 1에 있어서,
    상기 데이터를 복원하는 단계는,
    상기 레이블에 기반하여, 상기 데이터의 변조를 위해 사용된 변조 방식을 결정하는 단계; 및
    상기 변조 방식을 이용하여 상기 데이터를 복원하는 단계를 포함하는 방법.
  9. 청구항 1에 있어서,
    상기 데이터를 복원하는 단계는,
    상기 레이블에 기반하여, 상기 데이터의 변조를 위해 사용된 변조 방식을 결정하는 단계; 및
    상기 변조 방식을 이용하여 상기 데이터를 복원하는 단계를 포함하는 방법.
  10. 청구항 1에 있어서,
    상기 레이블은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 비트 시퀀스를 상기 비트 시퀀스에 기반하여 결정되는 변조 방식으로 변조함으로써 생성되는 방법.
  11. 무선 통신 시스템에서 제2 장치의 동작 방법에 있어서,
    제1 장치에게 제어 정보를 송신하는 단계;
    데이터 신호를 생성하는 단계;
    상기 제어 정보에 기반하여 상기 데이터 신호를 송신하는 단계를 포함하며,
    상기 데이터 신호는, 상기 데이터 신호를 처리하기 위해 상기 제1 장치에 의해 사용되는 인공지능 모델에 대한 학습을 수행하기 위해 사용되는 레이블에 기반하여 생성되고,
    상기 레이블은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 방법.
  12. 청구항 11에 있어서,
    상기 데이터에 관련된 피드백 정보를 상기 제1 장치로부터 수신하는 단계를 더 포함하는 방법.
  13. 청구항 12에 있어서,
    상기 피드백 정보는, 상기 제1 장치에서 사용되는 신경망의 역전파 동작에 의해 생성되는 기울기(gradient)에 관련된 정보를 포함하는 방법.
  14. 청구항 13에 있어서,
    상기 레이블 및 상기 기울기에 관련된 정보에 기반하여, 상기 제2 장치에 의해 사용되는 인공지능 모델에 대한 학습을 수행하는 단계를 더 포함하는 방법.
  15. 무선 통신 시스템에서 제1 장치에 있어서,
    송수신기; 및
    상기 송수신기와 연결된 프로세서를 포함하며,
    상기 프로세서는,
    제2 장치로부터 제어 정보를 수신하고,
    상기 제어 정보에 기반하여 데이터 신호를 수신하고,
    상기 데이터 신호에 포함된 데이터를 복원하고,
    상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하도록 제어하며,
    상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행되는 제1 장치.
  16. 무선 통신 시스템에서 제2 장치에 있어서,
    송수신기; 및
    상기 송수신기와 연결된 프로세서를 포함하며,
    상기 프로세서는,
    제1 장치에게 제어 정보를 송신하고,
    데이터 신호를 생성하고,
    상기 제어 정보에 기반하여 상기 데이터 신호를 송신하도록 제어하며,
    상기 데이터 신호는, 상기 데이터 신호를 처리하기 위해 상기 제1 장치에 의해 사용되는 인공지능 모델에 대한 학습을 수행하기 위해 사용되는 레이블에 기반하여 생성되고,
    상기 레이블은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 제2 장치.
  17. 통신 장치에 있어서,
    적어도 하나의 프로세서;
    상기 적어도 하나의 프로세서와 연결되며, 상기 적어도 하나의 프로세서에 의해 실행됨에 따라 동작들을 지시하는 명령어를 저장하는 적어도 하나의 컴퓨터 메모리를 포함하며,
    상기 동작들은,
    제어 정보를 수신하는 단계;
    상기 제어 정보에 기반하여 데이터 신호를 수신하는 단계;
    상기 데이터 신호에 포함된 데이터를 복원하는 단계;
    상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하는 단계를 포함하며,
    상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행되는 통신 장치.
  18. 적어도 하나의 명령어(instructions)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)에 있어서,
    프로세서에 의해 실행 가능한(executable) 상기 적어도 하나의 명령어를 포함하며,
    상기 적어도 하나의 명령어는, 장치가,
    다른 장치로부터 제어 정보를 수신하고,
    상기 제어 정보에 기반하여 데이터 신호를 수신하고,
    상기 데이터 신호에 포함된 데이터를 복원하고,
    상기 복원된 데이터를 이용하여 통신을 위해 사용되는 인공지능 모델에 대한 학습을 수행하도록 제어하며,
    상기 학습은, 상기 제어 정보 또는 상기 데이터 신호를 전달한 자원에 관련된 정보에 기반하여 결정되는 레이블을 이용하여 수행되는 비-일시적인 컴퓨터 판독 가능 매체.
PCT/KR2023/014229 2022-09-21 2023-09-20 무선 통신 시스템에서 온라인 학습을 수행하기 위한 장치 및 방법 WO2024063524A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220119469 2022-09-21
KR10-2022-0119469 2022-09-21

Publications (1)

Publication Number Publication Date
WO2024063524A1 true WO2024063524A1 (ko) 2024-03-28

Family

ID=90454943

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/014229 WO2024063524A1 (ko) 2022-09-21 2023-09-20 무선 통신 시스템에서 온라인 학습을 수행하기 위한 장치 및 방법

Country Status (1)

Country Link
WO (1) WO2024063524A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190110068A (ko) * 2018-03-19 2019-09-27 에스알아이 인터내셔널 딥 신경망들의 동적 적응
WO2022097774A1 (ko) * 2020-11-05 2022-05-12 엘지전자 주식회사 무선 통신 시스템에서 단말 및 기지국의 피드백 수행 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190110068A (ko) * 2018-03-19 2019-09-27 에스알아이 인터내셔널 딥 신경망들의 동적 적응
WO2022097774A1 (ko) * 2020-11-05 2022-05-12 엘지전자 주식회사 무선 통신 시스템에서 단말 및 기지국의 피드백 수행 방법 및 장치

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FUTUREWEI: "Functional Framework for RAN Intelligence to support different learning problems", 3GPP DRAFT; R3-211615, 3RD GENERATION PARTNERSHIP PROJECT (3GPP), MOBILE COMPETENCE CENTRE ; 650, ROUTE DES LUCIOLES ; F-06921 SOPHIA-ANTIPOLIS CEDEX ; FRANCE, vol. RAN WG3, no. Online; 20210517 - 20210528, 6 May 2021 (2021-05-06), Mobile Competence Centre ; 650, route des Lucioles ; F-06921 Sophia-Antipolis Cedex ; France , XP052001361 *
HUAWEI, HISILICON: "Discussion on general aspects of AI/ML framework", 3GPP DRAFT; R1-2203139, 3RD GENERATION PARTNERSHIP PROJECT (3GPP), MOBILE COMPETENCE CENTRE ; 650, ROUTE DES LUCIOLES ; F-06921 SOPHIA-ANTIPOLIS CEDEX ; FRANCE, vol. RAN WG1, no. e-Meeting; 20220509 - 20220520, 29 April 2022 (2022-04-29), Mobile Competence Centre ; 650, route des Lucioles ; F-06921 Sophia-Antipolis Cedex ; France, XP052143957 *
HUAWEI: "Further discussions on remaining open issues about general principles and framework", 3GPP DRAFT; R3-215664, 3RD GENERATION PARTNERSHIP PROJECT (3GPP), MOBILE COMPETENCE CENTRE ; 650, ROUTE DES LUCIOLES ; F-06921 SOPHIA-ANTIPOLIS CEDEX ; FRANCE, vol. RAN WG3, no. E-meeting; 20211101 - 20211111, 22 October 2021 (2021-10-22), Mobile Competence Centre ; 650, route des Lucioles ; F-06921 Sophia-Antipolis Cedex ; France, XP052068643 *

Similar Documents

Publication Publication Date Title
WO2020017885A1 (ko) Nr v2x에서 tbs를 결정하는 방법 및 장치
WO2021091244A1 (ko) 무선통신시스템에서 sci 관련 ue의 동작 방법
WO2021066451A1 (ko) 무선통신시스템에서 2nd stage SCI 관련 UE의 동작 방법
WO2021141408A1 (ko) 무선통신시스템에서 단말이 신호를 송수신하는 방법
WO2020036426A1 (ko) 무선 통신 시스템에서 tc와 pppp를 맵핑하는 방법 및 장치
WO2020091379A1 (ko) Nr v2x에서 자원 패턴을 선택하는 방법 및 장치
WO2020130380A1 (en) Method and apparatus for transmitting data unit using dual header compression algorithm in wireless communication system
WO2020141897A1 (en) Method and apparatus for delivering data unit based on execution time indicator in wireless communication system
WO2020067806A1 (ko) 반송파 집성 시스템에서 단말의 동작 방법 및 상기 방법을 이용하는 장치
WO2020080914A1 (en) Method and apparatus for selecting a resource related to sidelink communication based on the sidelink control information in nr v2x
WO2022250221A1 (ko) 무선 통신 시스템에서 신호 전송 방법 및 장치
WO2021010742A1 (en) Method and apparatus for performing sidelink retransmission
WO2024063524A1 (ko) 무선 통신 시스템에서 온라인 학습을 수행하기 위한 장치 및 방법
WO2020091211A1 (ko) Nr v2x에서 harq 피드백을 결정하기 위한 임계치를 조정하는 방법 및 장치
WO2022075745A1 (ko) 전력 제어 방법 및 장치
WO2021071314A1 (ko) 무선통신시스템에서 단말의 신호 송수신 방법
WO2022025369A1 (en) Method and apparatus for transmitting uplink scheduling request in wireless communication system
WO2021060953A1 (ko) 무선통신시스템에서 sci 전송 관련 ue의 동작 방법
WO2020204386A1 (en) Method and apparatus for processing data unit based on rlc group in wireless communication system
WO2020091212A1 (ko) Nr v2x에서 그룹 기반 통신에서 피드백을 수신하는 방법 및 장치
WO2024090690A1 (ko) 무선 통신 시스템에서 시맨틱 통신을 위한 부호화 및 복호화를 수행하기 위한 장치 및 방법
WO2019221509A1 (ko) 무선 통신 시스템에서 단말에 의해 수행되는 제어 정보 수신 방법 및 상기 방법을 이용하는 단말
WO2020130421A2 (en) Method and apparatus for performing dual header compression schemes in wireless communication system
WO2024058372A1 (ko) 무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 방법 및 장치
WO2023033203A1 (ko) 무선 통신 시스템에서 연합 학습을 수행하기 위한 방법 및 이를 위한 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23868576

Country of ref document: EP

Kind code of ref document: A1