WO2024058372A1 - 무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 방법 및 장치 - Google Patents

무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 방법 및 장치 Download PDF

Info

Publication number
WO2024058372A1
WO2024058372A1 PCT/KR2023/008888 KR2023008888W WO2024058372A1 WO 2024058372 A1 WO2024058372 A1 WO 2024058372A1 KR 2023008888 W KR2023008888 W KR 2023008888W WO 2024058372 A1 WO2024058372 A1 WO 2024058372A1
Authority
WO
WIPO (PCT)
Prior art keywords
base station
terminal
artificial intelligence
intelligence model
information
Prior art date
Application number
PCT/KR2023/008888
Other languages
English (en)
French (fr)
Inventor
오재기
정재훈
장지환
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of WO2024058372A1 publication Critical patent/WO2024058372A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/20Manipulation of established connections
    • H04W76/28Discontinuous transmission [DTX]; Discontinuous reception [DRX]

Definitions

  • the following description is about a wireless communication system and a device and method for power saving using context information-based artificial intelligence in a wireless communication system.
  • terminals and base stations can save power by using artificial intelligence to control DRX (discontinuous reception) control values and BWP (bandwidth part) control values.
  • DRX discontinuous reception
  • BWP bandwidth part
  • Wireless access systems are being widely deployed to provide various types of communication services such as voice and data.
  • a wireless access system is a multiple access system that can support communication with multiple users by sharing available system resources (bandwidth, transmission power, etc.).
  • multiple access systems include code division multiple access (CDMA) systems, frequency division multiple access (FDMA) systems, time division multiple access (TDMA) systems, orthogonal frequency division multiple access (OFDMA) systems, and single carrier frequency (SC-FDMA) systems. division multiple access) systems, etc.
  • enhanced mobile broadband (eMBB) communication technology is being proposed compared to the existing radio access technology (RAT).
  • RAT radio access technology
  • a communication system that considers reliability and latency sensitive services/UE (user equipment) as well as mMTC (massive machine type communications), which connects multiple devices and objects to provide a variety of services anytime, anywhere, is being proposed. .
  • mMTC massive machine type communications
  • the present disclosure can provide an apparatus and method for transmitting and receiving signals in a wireless communication system.
  • the present disclosure can provide an apparatus and method for power saving using context information-based artificial intelligence in a wireless communication system.
  • the present disclosure can provide a method for optimizing DRX control values using artificial intelligence in a wireless communication system.
  • the present disclosure may provide a method for optimizing BWP control values using artificial intelligence in a wireless communication system.
  • the present disclosure can provide a method for a terminal and a base station to obtain context information in a wireless communication system.
  • the present disclosure can provide a method for learning an artificial intelligence model based on context information in a wireless communication system.
  • the present disclosure may provide a method for updating a global artificial intelligence model based on context information in a wireless communication system.
  • the present disclosure can provide a method for optimizing DRX control values and BWP control values using a reinforcement learning model and MAB model in a wireless communication system.
  • the present disclosure can provide a method of saving power by detecting changes in the communication environment in a wireless communication system and optimizing each control value through an artificial intelligence model that recognizes situational information of the terminal and base station.
  • a method of operating a terminal in a wireless communication system obtaining situation information, transmitting a preference parameter value inferred by an artificial intelligence model based on the situation information to a base station, the preference parameter Receiving an RRC reset message determined based on the base station, receiving an RRC reset complete message from the base station, and receiving data from the base station, wherein the preferred parameter value is DRX (discontinuous reception) control.
  • the steps include transmitting situation information to a terminal, receiving preference parameter values inferred by an artificial intelligence model from the terminal, and preference parameters from the terminal. Transmitting an RRC reset message based on a value, receiving an RRC reset complete message from the terminal, and transmitting data to the terminal, wherein the preferred parameter value includes a DRX (discontinuous reception) control value. can do.
  • a terminal in a wireless communication system includes a transceiver and a processor connected to the transceiver, wherein the processor acquires context information and a preference inferred by an artificial intelligence model based on the context information.
  • a parameter value is transmitted to the base station, an RRC reset message determined based on the preference parameter is received from the base station, an RRC reset completion message is received from the base station, and data is received from the base station, where the preference parameter value is DRX (discontinuous reception) may include control values.
  • a base station in a wireless communication system includes a transceiver and a processor connected to the transceiver, wherein the processor transmits situation information to a terminal and preference parameters inferred by an artificial intelligence model from the terminal.
  • Receiving a value, transmitting an RRC reset message based on the preference parameter value from the terminal, receiving an RRC reset completion message from the terminal, and transmitting data to the terminal, wherein the preference parameter value is DRX (discontinuous reception) may include control values.
  • the communication device at least one processor, at least one computer memory connected to the at least one processor and storing instructions that direct operations as executed by the at least one processor
  • the operations include obtaining situation information, transmitting a preference parameter value inferred by an artificial intelligence model based on the situation information to the base station, and receiving an RRC reset message determined based on the preference parameter from the base station.
  • An RRC reset completion message is received from the base station, and data is received from the base station.
  • the preferred parameter value may include a DRX (discontinuous reception) control value.
  • a non-transitory computer-readable medium storing at least one instruction, the at least one executable by a processor Includes a command, wherein the at least one command is such that the device acquires context information, transmits a preference parameter value inferred by an artificial intelligence model based on the situation information to the base station, and determines the preference parameter based on the preference parameter.
  • An RRC reset message is received from the base station, an RRC reset complete message is received from the base station, and data is received from the base station.
  • the preferred parameter value may include a DRX (discontinuous reception) control value.
  • the DRX control value and the BWP control value used in wireless communication can be optimized.
  • an artificial intelligence model can be utilized to optimize the DRX control value and the control value of BWP.
  • the power saving effect of the terminal can be maximized without increasing communication delay and signaling overhead by adaptively optimizing the DRX control value according to the terminal status, base station status, or usage environment.
  • FIG. 1 shows an example of a communication system applicable to the present disclosure.
  • FIG. 2 shows an example of a wireless device applicable to the present disclosure.
  • Figure 3 shows a method of processing a transmission signal applicable to the present disclosure.
  • Figure 4 shows a communication procedure between a terminal and a base station applicable to the present disclosure.
  • Figure 5 shows an example of a communication structure that can be provided in a 6G (6th generation) system applicable to the present disclosure.
  • FIG. 7 shows a THz wireless communication transceiver applicable to the present disclosure.
  • FIG. 8 shows a THz signal generation method applicable to the present disclosure.
  • FIG. 9 shows a wireless communication transceiver applicable to the present disclosure.
  • Figure 10 shows a transmitter structure applicable to the present disclosure.
  • Figure 11 shows a modulator structure applicable to the present disclosure.
  • Figure 12 shows the structure of a perceptron included in an artificial neural network applicable to the present disclosure.
  • Figure 13 shows an artificial neural network structure applicable to the present disclosure.
  • Figure 14 shows the structure of a DRX cycle applicable to the present disclosure.
  • Figure 15 shows the structure of an inactivity timer in a DRX cycle applicable to the present disclosure.
  • Figure 16 shows an example of a procedure for setting DRX parameter values according to an embodiment of the present disclosure.
  • Figure 17 shows another example of a procedure for setting parameter values related to DRX according to an embodiment of the present disclosure.
  • Figure 18 shows examples of time distribution and power distribution related to power consumption of the terminal, depending on the service used by the terminal.
  • Figure 19 shows a conceptual diagram in which a terminal and a base station adaptively change each DRX parameter value and the bandwidth of the terminal according to an embodiment of the present disclosure.
  • Figure 20 shows an example of a procedure for a terminal to save power based on context information according to an embodiment of the present disclosure.
  • Figure 21 shows an example of a procedure for a base station to save power based on context information according to an embodiment of the present disclosure.
  • Figure 22 shows a signal flow diagram of a procedure for a terminal to acquire context information of a base station according to an embodiment of the present disclosure.
  • Figure 23 shows a signal flow diagram of a procedure in which a terminal and a base station reconfigure RRC based on context information according to an embodiment of the present disclosure.
  • Figure 24 shows a signal flow diagram of a procedure in which a terminal learns an artificial intelligence model and exchanges the artificial intelligence model with a base station according to an embodiment of the present disclosure.
  • Figure 25 illustrates a method in which a base station determines a global model through local models received from each terminal using federated learning, according to an embodiment of the present disclosure.
  • Figure 26 shows an example of an artificial intelligence model applicable according to an embodiment of the present disclosure.
  • Figure 27 shows a process of learning a reinforcement learning artificial intelligence model according to an embodiment of the present disclosure.
  • Figure 28 shows the process of learning a MAB-based artificial intelligence model according to an embodiment of the present disclosure.
  • each component or feature may be considered optional unless explicitly stated otherwise.
  • Each component or feature may be implemented in a form that is not combined with other components or features. Additionally, some components and/or features may be combined to form an embodiment of the present disclosure. The order of operations described in embodiments of the present disclosure may be changed. Some features or features of one embodiment may be included in other embodiments or may be replaced with corresponding features or features of other embodiments.
  • the base station is meant as a terminal node of the network that directly communicates with the mobile station. Certain operations described in this document as being performed by the base station may, in some cases, be performed by an upper node of the base station.
  • 'base station' is a term such as fixed station, Node B, eNB (eNode B), gNB (gNode B), ng-eNB, advanced base station (ABS), or access point. It can be replaced by .
  • the terminal is a user equipment (UE), a mobile station (MS), a subscriber station (SS), and a mobile subscriber station (MSS).
  • UE user equipment
  • MS mobile station
  • SS subscriber station
  • MSS mobile subscriber station
  • AMS advanced mobile station
  • the transmitting end refers to a fixed and/or mobile node that provides a data service or a voice service
  • the receiving end refers to a fixed and/or mobile node that receives a data service or a voice service. Therefore, in the case of uplink, the mobile station can be the transmitting end and the base station can be the receiving end. Likewise, in the case of downlink, the mobile station can be the receiving end and the base station can be the transmitting end.
  • Embodiments of the present disclosure include wireless access systems such as the IEEE 802.xx system, 3GPP (3rd Generation Partnership Project) system, 3GPP LTE (Long Term Evolution) system, 3GPP 5G (5th generation) NR (New Radio) system, and 3GPP2 system. May be supported by standard documents disclosed in at least one, and in particular, embodiments of the present disclosure are supported by the 3GPP technical specification (TS) 38.211, 3GPP TS 38.212, 3GPP TS 38.213, 3GPP TS 38.321 and 3GPP TS 38.331 documents. It can be.
  • TS 3GPP technical specification
  • embodiments of the present disclosure can be applied to other wireless access systems and are not limited to the above-described system. As an example, it may be applicable to systems applied after the 3GPP 5G NR system and is not limited to a specific system.
  • CDMA code division multiple access
  • FDMA frequency division multiple access
  • TDMA time division multiple access
  • OFDMA orthogonal frequency division multiple access
  • SC-FDMA single carrier frequency division multiple access
  • LTE may refer to technology after 3GPP TS 36.xxx Release 8.
  • LTE technology after 3GPP TS 36.xxx Release 10 may be referred to as LTE-A
  • LTE technology after 3GPP TS 36.xxx Release 13 may be referred to as LTE-A pro.
  • 3GPP NR may refer to technology after TS 38.xxx Release 15.
  • 3GPP 6G may refer to technologies after TS Release 17 and/or Release 18. “xxx” refers to the standard document detail number.
  • LTE/NR/6G can be collectively referred to as a 3GPP system.
  • FIG. 1 shows an example of a communication system applied to the present disclosure.
  • the communication system 100 applied to the present disclosure includes a wireless device, a base station, and a network.
  • a wireless device refers to a device that performs communication using wireless access technology (e.g. LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G), and is a communication/wireless/5G device. It may be referred to as .
  • wireless devices include robots 100a, vehicles 100b-1, 100b-2, extended reality (XR) devices 100c, hand-held devices 100d, and home appliances. appliance) (100e), IoT (Internet of Thing) device (100f), and AI (artificial intelligence) device/server (100g).
  • vehicles may include vehicles equipped with wireless communication functions, autonomous vehicles, vehicles capable of inter-vehicle communication, etc.
  • the vehicles 100b-1 and 100b-2 may include an unmanned aerial vehicle (UAV) (eg, a drone).
  • UAV unmanned aerial vehicle
  • the XR device 100c includes an augmented reality (AR)/virtual reality (VR)/mixed reality (MR) device, a head-mounted device (HMD), a head-up display (HUD) provided in a vehicle, a television, It can be implemented in the form of smartphones, computers, wearable devices, home appliances, digital signage, vehicles, robots, etc.
  • the portable device 100d may include a smartphone, smart pad, wearable device (eg, smart watch, smart glasses), computer (eg, laptop, etc.), etc.
  • Home appliances 100e may include a TV, refrigerator, washing machine, etc.
  • IoT device 100f may include sensors, smart meters, etc.
  • the base station 120 and the network 130 may also be implemented as wireless devices, and a specific wireless device 120a may operate as a base station/network node to other wireless devices.
  • Wireless devices 100a to 100f may be connected to the network 130 through the base station 120.
  • AI technology may be applied to the wireless devices 100a to 100f, and the wireless devices 100a to 100f may be connected to the AI server 100g through the network 130.
  • the network 130 may be configured using a 3G network, 4G (eg, LTE) network, 5G (eg, NR), or 6G network.
  • Wireless devices 100a through 100f may communicate with each other via base station 120/network 130, but may communicate directly (e.g., sidelink communication) rather than via base station 120/network 130. You may.
  • vehicles 100b-1 and 100b-2 may communicate directly (e.g., vehicle to vehicle (V2V)/vehicle to everything (V2X) communication).
  • the IoT device 100f eg, sensor
  • another IoT device eg, sensor
  • Wireless communication/connection may be established between the wireless devices (100a to 100f)/base station (120) and the base station (120)/base station (120).
  • wireless communication/connection includes uplink/downlink communication (150a), sidelink communication (150b) (or D2D communication), and communication between base stations (150c) (e.g., relay, integrated access backhaul (IAB)).
  • IAB integrated access backhaul
  • wireless communication/connection 150a, 150b, and 150c may transmit/receive signals through various physical channels.
  • various configuration information setting processes for transmitting/receiving wireless signals various signal processing processes (e.g., channel encoding/decoding, modulation/demodulation, resource mapping/demapping, etc.) , at least some of the resource allocation process, etc. may be performed.
  • FIG. 2 shows an example of a wireless device to which the present disclosure can be applied.
  • the wireless device 200 can transmit and receive wireless signals through various wireless access technologies (e.g., LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G).
  • the wireless device 200 includes at least one processor 202 and at least one memory 204, and may additionally include at least one transceiver 206 and/or at least one antenna 208.
  • Processor 202 controls memory 204 and/or transceiver 206 and may be configured to implement the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed herein.
  • the processor 202 may process information in the memory 204 to generate first information/signal and then transmit a wireless signal including the first information/signal through the transceiver 206.
  • the processor 202 may receive a wireless signal including the second information/signal through the transceiver 206 and then store information obtained from signal processing of the second information/signal in the memory 204.
  • the memory 204 may be connected to the processor 202 and may store various information related to the operation of the processor 202.
  • memory 204 may perform some or all of the processes controlled by processor 202 or instructions for performing the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed herein. Software code containing them can be stored.
  • the processor 202 and memory 204 may be part of a communication modem/circuit/chip designed to implement wireless communication technology.
  • Transceiver 206 may be connected to processor 202 and may transmit and/or receive wireless signals through at least one antenna 208.
  • Transceiver 206 may include a transmitter and/or receiver.
  • the transceiver 206 may be used interchangeably with a radio frequency (RF) unit.
  • RF radio frequency
  • a wireless device may mean a communication modem/circuit/chip.
  • At least one protocol layer may be implemented by at least one processor 202.
  • at least one processor 202 may support at least one layer (e.g., physical (PHY), media access control (MAC), radio link control (RLC), packet data convergence protocol (PDCP), and radio resource (RRC). control) and functional layers such as SDAP (service data adaptation protocol) can be implemented.
  • At least one processor 202 may generate at least one protocol data unit (PDU) and/or at least one service data unit (SDU) according to the description, function, procedure, proposal, method, and/or operation flowchart disclosed in this document. can be created.
  • PDU protocol data unit
  • SDU service data unit
  • At least one processor 202 may generate messages, control information, data, or information according to the descriptions, functions, procedures, suggestions, methods, and/or operational flowcharts disclosed in this document. At least one processor 202 generates a signal (e.g., a baseband signal) containing a PDU, SDU, message, control information, data or information according to the functions, procedures, proposals and/or methods disclosed herein, It can be provided to at least one transceiver (206).
  • a signal e.g., a baseband signal
  • the at least one processor 202 may receive a signal (e.g., a baseband signal) from the at least one transceiver 206 and may be configured to receive a signal (e.g., a baseband signal) from the at least one transceiver 206, according to the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed herein. Accordingly, PDU, SDU, message, control information, data or information can be obtained.
  • a signal e.g., a baseband signal
  • a signal e.g., a baseband signal
  • At least one processor 202 may be referred to as a controller, microcontroller, microprocessor, or microcomputer. At least one processor 202 may be implemented by hardware, firmware, software, or a combination thereof. As an example, at least one application specific integrated circuit (ASIC), at least one digital signal processor (DSP), at least one digital signal processing device (DSPD), at least one programmable logic device (PLD), or at least one FPGA ( field programmable gate arrays) may be included in at least one processor 202.
  • ASIC application specific integrated circuit
  • DSP digital signal processor
  • DSPD digital signal processing device
  • PLD programmable logic device
  • FPGA field programmable gate arrays
  • Firmware or software configured to perform the descriptions, functions, procedures, suggestions, methods, and/or operation flowcharts disclosed in this document are included in at least one processor 202 or stored in at least one memory 204 to perform at least one It may be driven by the processor 202.
  • the descriptions, functions, procedures, suggestions, methods and/or operational flowcharts disclosed in this document may be implemented using firmware or software in the form of codes, instructions and/or sets of instructions.
  • At least one memory 204 may be connected to at least one processor 202 and may store various types of data, signals, messages, information, programs, codes, instructions and/or commands. At least one memory 204 may be read only memory (ROM), random access memory (RAM), erasable programmable read only memory (EPROM), flash memory, hard drive, register, cache memory, computer readable storage medium, and/or these. It may be composed of a combination of . At least one memory 204 may be located inside and/or outside of at least one processor 202. Additionally, at least one memory 204 may be connected to at least one processor 202 through various technologies such as wired or wireless connections.
  • At least one transceiver 206 may transmit user data, control information, wireless signals/channels, etc. mentioned in the methods and/or operation flowcharts of this document to at least one other device. At least one transceiver 206 may receive user data, control information, wireless signals/channels, etc. mentioned in the description, function, procedure, proposal, method and/or operational flow chart, etc. disclosed in this document from at least one other device. there is.
  • at least one transceiver 206 may be connected to at least one processor 202 and may transmit and receive wireless signals.
  • at least one processor 202 may control at least one transceiver 206 to transmit user data, control information, or wireless signals to at least one other device.
  • At least one processor 202 may control at least one transceiver 206 to receive user data, control information, or wireless signals from at least one other device.
  • at least one transceiver 206 may be connected to at least one antenna 208, and at least one transceiver 206 may be connected to the description, function, procedure, and proposal disclosed in this document through at least one antenna 208. , may be set to transmit and receive user data, control information, wireless signals/channels, etc. mentioned in the method and/or operation flowchart.
  • at least one antenna may be a plurality of physical antennas or a plurality of logical antennas (eg, antenna ports).
  • At least one transceiver 206 converts the received wireless signal/channel from an RF band signal to a baseband in order to process the received user data, control information, wireless signal/channel, etc. using at least one processor 202. It can be converted into a signal. At least one transceiver 206 may convert user data, control information, wireless signals/channels, etc. processed using at least one processor 202 from a baseband signal to an RF band signal. To this end, at least one transceiver 206 may include an (analog) oscillator and/or filter.
  • the processor 202 may be referred to as a control unit
  • the transceiver 206 may be referred to as a communication unit
  • the memory 204 may be referred to as a storage unit.
  • the communication unit may be used to include at least a portion of the processor 202 and the transceiver 206.
  • the structure of the wireless device described with reference to FIG. 2 may be understood as the structure of at least a portion of various devices.
  • the structure of the wireless device illustrated in FIG. 2 is similar to the various devices described with reference to FIG. 1 (e.g., robot 100a, vehicle 100b-1, 100b-2, XR device 100c, portable It may be at least a part of a device (100d), a home appliance (100e), an IoT device (100f), and an AI device/server (100g).
  • the device may further include other components.
  • the device may be a portable device such as a smartphone, smartpad, wearable device (e.g., smart watch, smart glasses), portable computer (e.g., laptop, etc.).
  • the device supplies power, a power supply including a wired/wireless charging circuit, a battery, etc., and at least one port for connection to another device (e.g., audio input/output port, video input/output port).
  • a power supply including a wired/wireless charging circuit, a battery, etc.
  • at least one port for connection to another device e.g., audio input/output port, video input/output port.
  • It may further include at least one of an interface unit including an input/output unit for inputting and outputting video information/signals, audio information/signals, data, and/or information input from a user.
  • the device may be a mobile device such as a mobile robot, vehicle, train, aerial vehicle (AV), ship, etc.
  • the device is a driving unit that includes at least one of the device's engine, motor, power train, wheel, brake, and steering device, and a power supply unit that supplies power and includes a wired/wireless charging circuit, battery, etc., device, or device.
  • the device may be an XR device such as a HMD, a head-up display (HUD) installed in a vehicle, a television, a smartphone, a computer, a wearable device, a home appliance, a digital signage, a vehicle, a robot, etc. .
  • the device includes a power supply unit that supplies power and includes a wired/wireless charging circuit, a battery, etc., an input/output unit that obtains control information and data from the outside, and outputs the generated XR object, the device, or the device's surroundings. It may further include at least one of a sensor unit that senses status information, environmental information, and user information.
  • a device may be a robot that can be classified into industrial, medical, household, military, etc. depending on the purpose or field of use.
  • the device may further include at least one of a sensor unit that senses status information, environment information, and user information about the device or its surroundings, and a drive unit that performs various physical operations, such as moving robot joints.
  • devices include AI devices such as TVs, projectors, smartphones, PCs, laptops, digital broadcasting terminals, tablet PCs, wearable devices, set-top boxes (STBs), radios, washing machines, refrigerators, digital signage, robots, vehicles, etc.
  • the device includes an input unit that acquires various types of data from the outside, an output unit that generates output related to vision, hearing, or tactile sensation, a sensor unit that senses status information, environmental information, and user information on or around the device, and a learning unit. It may further include at least one training unit that learns a model composed of an artificial neural network using data.
  • the structure of the wireless device illustrated in FIG. 2 may be understood as part of a RAN node (eg, base station, DU, RU, RRH, etc.). That is, the device illustrated in FIG. 2 may be a RAN node. In this case, the device may further include a wired transceiver for front haul and/or back haul communication. However, if the fronthaul and/or backhaul communication is based on wireless communication, at least one transceiver 206 illustrated in FIG. 2 is used for the fronthaul and/or backhaul communication, and the wired transceiver may not be included.
  • a RAN node eg, base station, DU, RU, RRH, etc.
  • Figure 3 shows a method of processing a transmission signal applied to the present disclosure.
  • the transmission signal may be processed by a signal processing circuit.
  • the signal processing circuit 300 may include a scrambler 310, a modulator 320, a layer mapper 330, a precoder 340, a resource mapper 350, and a signal generator 360.
  • the operation/function of FIG. 3 may be performed by the processor 202 and/or the transceiver 206 of FIG. 2.
  • the hardware elements of FIG. 3 may be implemented in the processor 202 and/or transceiver 206 of FIG. 2.
  • blocks 310 to 360 may be implemented in processor 202 of FIG. 2.
  • blocks 310 to 350 may be implemented in the processor 202 of FIG. 2
  • block 360 may be implemented in the transceiver 206 of FIG. 2, and are not limited to the above-described embodiment.
  • the codeword can be converted into a wireless signal through the signal processing circuit 300 of FIG. 3.
  • a codeword is an encoded bit sequence of an information block.
  • the information block may include a transport block (e.g., UL-SCH transport block, DL-SCH transport block).
  • Wireless signals may be transmitted through various physical channels (e.g., PUSCH, PDSCH).
  • the codeword may be converted into a scrambled bit sequence by the scrambler 310.
  • the scramble sequence used for scrambling is generated based on an initialization value, and the initialization value may include ID information of the wireless device.
  • the scrambled bit sequence may be modulated into a modulation symbol sequence by the modulator 320.
  • Modulation methods may include pi/2-binary phase shift keying (pi/2-BPSK), m-phase shift keying (m-PSK), and m-quadrature amplitude modulation (m-QAM).
  • the complex modulation symbol sequence may be mapped to at least one transport layer by the layer mapper 330.
  • the modulation symbols of each transport layer may be mapped to the corresponding antenna port(s) by the precoder 340.
  • the output z of the precoder 340 can be obtained by multiplying the output y of the layer mapper 330 with the precoding matrix W of N ⁇ M.
  • N is the number of antenna ports and M is the number of transport layers.
  • the precoder 340 may perform precoding after performing transform precoding (eg, discrete Fourier transform (DFT) transform) on complex modulation symbols. Additionally, the precoder 340 may perform precoding without performing transform precoding.
  • transform precoding eg, discrete Fourier transform (DFT) transform
  • the resource mapper 350 can map the modulation symbols of each antenna port to time-frequency resources.
  • a time-frequency resource may include a plurality of symbols (e.g., CP-OFDMA symbol, DFT-s-OFDMA symbol) in the time domain and a plurality of subcarriers in the frequency domain.
  • the signal generator 360 generates a wireless signal from the mapped modulation symbols, and the generated wireless signal can be transmitted to another device through each antenna.
  • the signal generator 360 may include an inverse fast fourier transform (IFFT) module, a cyclic prefix (CP) inserter, a digital-to-analog converter (DAC), a frequency uplink converter, etc. .
  • IFFT inverse fast fourier transform
  • CP cyclic prefix
  • DAC digital-to-analog converter
  • the signal processing process for the received signal in the wireless device may be configured as the reverse of the signal processing processes 310 to 360 of FIG. 3.
  • a wireless device eg, 200 in FIG. 2 may receive a wireless signal from the outside through an antenna port/transceiver.
  • the received wireless signal can be converted into a baseband signal through a signal restorer.
  • the signal restorer may include a frequency downlink converter, an analog-to-digital converter (ADC), a CP remover, and a fast fourier transform (FFT) module.
  • ADC analog-to-digital converter
  • FFT fast fourier transform
  • the baseband signal can be restored to a codeword through a resource de-mapper process, postcoding process, demodulation process, and de-scramble process.
  • a signal processing circuit for a received signal may include a signal restorer, resource de-mapper, postcoder, demodulator, de-scrambler, and decoder.
  • FIG. 4 shows a communication procedure between a terminal and a base station applicable to the present disclosure.
  • FIG. 4 illustrates operations in which the terminal 410 and the base station 420 transmit and/or receive data and operations performed prior thereto.
  • the terminal 410 and the base station 420 perform synchronization.
  • the terminal 410 performs an initial cell search operation.
  • the terminal 410 may detect at least one synchronization signal transmitted from the base station 420 according to a predefined rule.
  • the synchronization signal may include a plurality of synchronization signals (eg, primary synchronization signal, secondary synchronization signal) classified according to structure or purpose.
  • the terminal 410 can confirm the boundary of the frame, subframe, slot, and/or symbol of the base station 420 and obtain information (e.g., cell identifier) about the base station 420. .
  • the terminal 410 obtains system information transmitted from the base station 420.
  • System information is information related to the attributes, characteristics, and/or capabilities of the base station 420 necessary to access the base station 420 and use the service, including content (e.g., whether it is essential for connection), transmission structure, etc. It can be classified according to (e.g., the channel used, whether it is provided on-demand), etc., and can be classified into, for example, MIB (master information block) and SIB (system information block).
  • the terminal 410 may transmit a signal requesting system information prior to receiving the system information. However, requesting and providing system information may be performed after a random access procedure described later.
  • the terminal 410 and the base station 420 perform a random access procedure.
  • the terminal 410 sends at least one message for a random access procedure based on information related to the random access channel of the base station 420 (e.g., channel location, channel structure, structure of supported preamble, etc.) obtained through system information. (e.g. random access preamble, random access response (RAR) message, etc.) may be transmitted and/or received.
  • the terminal 410 transmits a preamble (e.g., MSG1) through a random access channel, receives a RAR message (e.g., MSG2), and sends the terminal to the terminal 410 using the scheduling information included in the RAR message.
  • a preamble e.g., MSG1
  • RAR message e.g., MSG2
  • a message (e.g., MSG3) containing related information (e.g., identification information) may be transmitted to the base station 420, and a message (e.g., MSG4) for contention resolution and/or connection establishment may be received.
  • MSG1 and MSG3 may be transmitted and received as one message, or MSG2 and MSG4 may be transmitted and received as one message.
  • the terminal 410 and the base station 420 perform signaling of control information.
  • the control information refers to the layer that controls the connection (e.g., radio resource control (RRC) layer), the layer that handles mapping between logical channels and transport channels (e.g., media access control (MAC) layer), and the physical channel. It can be defined in various layers, such as a layer that processes (e.g., PHY (physical) layer).
  • RRC radio resource control
  • MAC media access control
  • PHY physical layer
  • the terminal 410 and the base station 420 may perform at least one of signaling to establish a connection, signaling to determine settings related to communication, and signaling to indicate allocated resources.
  • the terminal 410 and the base station 420 transmit and/or receive data.
  • the terminal 410 and the base station 420 may process, transmit, and/or receive data based on signaling of control information.
  • the terminal 410 or the base station 420 performs channel encoding, rate matching, scrambling, constellation mapping, layer mapping, and waveform modulation on the information bits. At least one of antenna mapping and resource mapping may be performed.
  • the terminal 410 or the base station 420 performs at least one of signal extraction from resources, waveform demodulation for each antenna, signal placement considering layer mapping, constellation demapping, descrambling, and channel decoding. can do.
  • the 5G system defines various operating bands within frequency range 1 (FR1), which includes 410 MHz to 7125 MHz, and frequency range 2 (FR2), which includes 24,250 MHz to 71,000 MHz.
  • FR1 frequency range 1
  • FR2 frequency range 2
  • Various frequencies are being discussed as operating bands for the future 6G system, and the use of frequencies higher than those of the 5G system for wider bandwidth and higher transmission rates is also being considered.
  • THz Transmissionhertz
  • the THz frequency band is a band that has both radio wave transparency and light wave propagation, and communication using the THz frequency band is expected to play a transitional role from existing radio wave-based communication to light wave-based communication.
  • the 6G system utilizing the THz frequency band has i) very high data rates per device, ii) very large number of connected devices, iii) global connectivity, iv) very low latency, and v) battery-free.
  • the purpose is to reduce the energy consumption of (battery-free) IoT devices, vi) ultra-reliable connectivity, and vii) connected intelligence with machine learning capabilities.
  • the vision of the 6G system can be four aspects such as “intelligent connectivity”, “deep connectivity”, “holographic connectivity”, and “ubiquitous connectivity”, and the 6G system is designed to satisfy the requirements as shown in [Table 1] below. It can be.
  • the 6G system includes enhanced mobile broadband (eMBB), ultra-reliable low latency communications (URLLC), massive machine type communications (mMTC), AI integrated communication, and tactile communication.
  • eMBB enhanced mobile broadband
  • URLLC ultra-reliable low latency communications
  • mMTC massive machine type communications
  • AI integrated communication and tactile communication.
  • tactile internet high throughput, high network capacity, high energy efficiency, low backhaul and access network congestion, and improved data security. It may have key factors such as enhanced data security.
  • Figure 5 shows an example of a communication structure that can be provided in a 6G system applicable to the present disclosure. Referring to Figure 5, the 6G system is expected to have simultaneous wireless communication connectivity 50 times higher than that of the 5G wireless communication system.
  • URLLC a key feature of 5G, is expected to become an even more mainstream technology in 6G communications by providing end-to-end delays of less than 1ms.
  • the 6G system will have much better volume spectrum efficiency, unlike the frequently used area spectrum efficiency.
  • 6G systems can provide very long battery life
  • AI artificial intelligence
  • THz Terahertz
  • FSO backhaul network large-scale MIMO technology
  • blockchain 3D networking
  • quantum communication and unmanned technology.
  • Aircraft cell-free communication, wireless information and energy transfer (WIET), integration of sensing and communication, integration of access backhaul networks, holographic beamforming, big data analysis, LIS ( Technologies such as large intelligent surfaces can be adopted.
  • WIET wireless information and energy transfer
  • THz communication is communication that uses the spectrum of the frequency band between 0.1 THz and 10 THz with a corresponding wavelength in the range of 0.03mm-3mm as shown in FIG. 6, and can be implemented using circuit elements with the structure shown in FIG. 7. You can.
  • optical wireless technology is a technology that generates and modulates THz signals using optical devices, and can be implemented based on devices having structures such as those shown in FIGS. 8, 9, 10, and 11.
  • an artificial intelligence model with a neural network structure may be based on the structure of a perceptron as shown in FIG. 12.
  • the artificial neural network may be composed of several perceptrons.
  • the input vector can be applied to different multi-dimensional perceptrons.
  • a neural network having an input layer, a hidden layer, and an output layer as shown in FIG. 13 can be formed.
  • the time for the terminal to monitor the physical downlink control channel (PDCCH) in a section without data transmission can be reduced by utilizing the DRX (discontinuous reception) technique.
  • the optimal parameter values related to DRX may vary depending on the terminal status and usage environment. Therefore, when the base station determines the status and usage environment of the terminal in real time and changes optimal parameter values related to DRX, signaling overhead and power consumption may increase.
  • the terminal can actively optimize parameter values related to DRX according to the terminal status and usage environment. The optimization process can be implemented based on artificial intelligence. Through this optimization, the power saving effect of the terminal can be increased without increasing communication latency and signaling overhead.
  • the terminal In the DRX technique of existing communication, the terminal must continuously monitor control signals in order to receive data sent from the base station. That is, the terminal must monitor paging messages in idle mode and PDCCH in connected mode.
  • the terminal can determine the DRX cycle as shown in FIG. 14 according to the settings of the base station.
  • the DRX cycle is a cycle that repeats the On-duration section followed by the Opportunity for DRX section, which is a section that may be inactive.
  • the terminal can efficiently reduce power consumption by adjusting the active state that monitors the actual control signal and the sleep state that does not monitor the control signal. First, the terminal performs monitoring to decode the PDCCH within the on-duration period.
  • the terminal If the UE does not successfully decode the PDCCH during the on-duration period, monitoring is not performed to decode the PDCCH in the Opportunity for DRX period. On the other hand, if the terminal successfully decodes the PDCCH during the on-duration period as shown in Figure 15, the terminal receives the PDSCH, a data channel, and the inactivity timer is activated. The terminal continues to monitor PDCCH until the deactivation timer expires. In other words, the terminal can continue to perform PDCCH monitoring even in the Opportunity for DRX section until the deactivation timer expires. Through this, the terminal can reduce communication delays that occur due to DRX settings when data is transmitted continuously.
  • FIG 16 shows an example of a procedure for setting DRX parameter values according to an embodiment of the present disclosure.
  • the terminal 1610 and the base station 1620 may perform an RRC reset procedure.
  • the base station 1620 transmits an RRC reconfiguration message to the terminal 1610, and the terminal 1610 transmits an RRC reconfiguration complete message to the base station 1620, thereby completing the RRC reconfiguration procedure.
  • the RRC reset message may include DRX-related parameter values. Therefore, the base station can use the RRC reset procedure to set parameter values related to DRX, such as DRX on/off settings.
  • the terminal 1610 may transmit UE assistance information (UAI).
  • UE assistance information may include DRX parameter values preferred by the terminal 1610.
  • the DRX parameter value may include at least one of a preferred DRX deactivation timer, a preferred DRX long cycle, and a preferred DRX short cycle.
  • Figure 17 shows another example of a procedure for setting parameter values related to DRX according to an embodiment of the present disclosure.
  • the terminal 1710 may transmit UE assistance information to the base station 1720.
  • the UE 1710 may transmit UE assistance information to the base station 1720 when preferred DRX parameter values are present or changed.
  • step S1703 the base station 1720 transmits an RRC reset message to the terminal 1710.
  • the base station 1720 may determine a new DRX parameter value based on the DRX parameter values preferred by the terminal 1720 and deliver it to the terminal 1720 through an RRC reset message.
  • step S1705 the terminal 1710 transmits an RRC reset complete message to the base station 1720.
  • the terminal 1710 can change the value to the new DRX parameter value received from the base station 1720 and notify that the RRC reset has been successfully performed through an RRC reset completion message.
  • the DRX parameter change procedure can be initiated by the base station or terminal. Therefore, the procedure in which the terminal optimizes each parameter value using artificial intelligence, which will be described below, can also be used in the procedure in which the base station optimizes each parameter value using artificial intelligence.
  • Optimal DRX parameter values may vary depending on the terminal status and usage environment.
  • Figure 18 shows examples of time distribution and power distribution related to power consumption of the terminal, depending on the service used by the terminal.
  • the main services used by the terminal are classified into three categories: streaming, messaging, and web browsing, and all show results using the same DRX parameter values.
  • the upper part of FIG. 18 shows the time distribution of the terminal state, and the lower part shows the power distribution.
  • Active Data refers to the reception state
  • Active: PDCCH-only refers to the state in which the deactivation timer is triggered after data is received and only the PDCCH is monitored before expiration
  • CDRX refers to the DRX cycle in which the deactivation timer is not triggered due to no data reception. do.
  • the terminal consumes a lot of power in the Active: PDCCH only state for all three services, and the proportion varies for each service. Therefore, the terminal needs to set optimized DRX parameter values based on the terminal's status and usage environment and minimize PDCCH monitoring in the data-free section under conditions where QoS (quality of service) is not seriously damaged.
  • QoS quality of service
  • Figure 19 shows a conceptual diagram in which a terminal and a base station adaptively change each DRX parameter value and the bandwidth of the terminal according to an embodiment of the present disclosure.
  • the base station and the terminal recognize the context and adaptively change the CDRX (connected mode DRX) parameter value or the bandwidth of the terminal based on this, thereby increasing the power saving gain for PDCCH monitoring. , the increase in average delay can be minimized.
  • the base station and the terminal each extract situational information that can affect data transmission and reception and transmit it as input to the artificial intelligence model. By using an artificial intelligence model, the terminal can determine the optimal CDRX parameter value or bandwidth based on situational information.
  • the context information that can be extracted from the base station may include at least one of a traffic pattern before scheduling is applied or an indicator value used for load balance of the base station.
  • Values used as traffic patterns may include at least one of traffic volume, peak traffic, average traffic, traffic distribution, traffic type, inter-packet arrival time interval, session duration, etc.
  • the context information that can be extracted from the terminal may include at least one of the current link quality, user pattern, and QoS of the service being used.
  • the artificial intelligence model determines the optimal CDRX parameter value and bandwidth for BWP (bandwidth part). Based on the parameter values and bandwidth determined by the artificial intelligence model, the base station and terminal reset the communication environment. Using this procedure, the terminal and base station can set optimized DRX parameter values by considering situational information and communication environment.
  • Figure 20 shows an example of a procedure for a terminal to save power based on context information according to an embodiment of the present disclosure.
  • the terminal can adaptively reset parameter values for power saving based on situational information by utilizing artificial intelligence.
  • the terminal acquires context information.
  • the context information may include at least one of the terminal's context information and the base station's context information.
  • the context information that can be extracted from the base station may include at least one of a traffic pattern before scheduling is applied or an indicator value used for load balance of the base station.
  • the context information that can be extracted from the terminal may include at least one of the current link quality, user pattern, and QoS of the service being used.
  • the terminal obtains the terminal's context information directly through measurement, and the base station's context information is obtained by receiving information measured by the base station.
  • the terminal may acquire context information periodically, or may acquire context information when a specific event, which will be described later, occurs.
  • the terminal may transmit a message requesting context information to the base station. To this end, the terminal can request situation information from the base station through an RRC reset request message.
  • the terminal transmits preferred parameter values to the base station based on context information.
  • the terminal can determine preferred parameter values based on context information and artificial intelligence model.
  • the parameter value determined by the terminal may include at least one of the terminal's preferred DRX parameter value or the bandwidth of the BWP.
  • the terminal can determine parameter values through inference from a previously learned artificial intelligence model, or it can utilize artificial intelligence that continues learning in real time. At this time, the artificial intelligence model can be learned so that QoS is maintained and the parameter value has the highest power saving gain due to setting to DRX.
  • step S2005 the terminal receives an RRC reset message from the base station. Based on the preferred parameter value transmitted by the terminal, the base station determines a new parameter value to be used for communication between the terminal and the base station and transmits it to the terminal. The terminal can receive the determined new parameter value from the base station through an RRC reset message.
  • step S2007 the terminal transmits an RRC reset completion message to the base station.
  • the terminal sets communication settings with new parameter values based on the RRC reset message received from the base station and transmits an RRC reset completion message. Therefore, at least one of the terminal's DRX cycle, DRX deactivation timer, DRX on-duration period, and BWP bandwidth may be changed.
  • step S2009 the terminal receives data from the base station. Based on the new DRX parameter values, the PDCCH can be monitored and successfully decoded before the on-duration period or deactivation timer expires. The terminal can receive PDSCH data based on the decoded PDCCH.
  • Figure 21 shows an example of a procedure for a base station to save power based on context information according to an embodiment of the present disclosure.
  • the base station can assist the terminal in finding optimized parameter values by transmitting the base station's situation information to the terminal.
  • the base station transmits situation information of the base station to the terminal.
  • the base station may periodically transmit context information to the terminal, and may transmit context information to the terminal when a specific event, which will be described later, occurs.
  • the situation information of the base station may include at least one of an indicator value used for load balance, a traffic pattern, etc.
  • the base station receives preference parameter values from the terminal.
  • the terminal uses an artificial intelligence model based on situation information to determine optimal parameter values and transmits the preferred parameter values to the base station.
  • the preferred parameter value may include at least one of the DRX parameter value or the bandwidth of BWP.
  • the base station transmits an RRC reset message to the terminal.
  • the base station determines new parameter values to be used for communication based on the received preferred parameter values.
  • the base station can use the parameter value transmitted by the terminal as is for the new parameter value, or can use another optimal parameter value considering the communication environment.
  • the new parameter value may include at least one of a new DRX parameter value or a new BWP bandwidth.
  • the base station transmits the determined new parameter value through an RRC reset message.
  • step S2107 an RRC reset completion message is received from the terminal.
  • the terminal sets the communication environment based on the received RRC reset message. Therefore, new cycle length, on-duration period, etc. can be applied based on the new DRX parameter value.
  • the terminal that has completed configuration transmits an RRC reset completion message to the base station, and the base station receives the RRC reset completion message, thereby starting communication with new parameter values applied.
  • step S2109 the base station transmits data to the terminal based on the new parameter value.
  • the base station can set a new BWP bandwidth, etc. to transmit data based on new parameter values.
  • FIG. 22 illustrates a signal flow diagram of a procedure in which the terminal 2210 acquires situation information of the base station 2220 according to an embodiment of the present disclosure.
  • the base station 2220 can transmit situation information to the terminal 2210 when DRX parameters and BWP resetting are necessary due to changes in the communication environment.
  • step S2201 the terminal 2210 and the base station 2220 detect a change in the communication environment.
  • the terminal 2210 triggers a deactivation timer after receiving data during a DRX cycle, and before expiration, if the time distribution value of the PDCCH-only monitoring state (hereinafter referred to as PDCCH-only) is above the threshold, QoS cannot be maintained, or the user's A change in the communication environment is detected by recognizing at least one event, such as when a pattern is recognized to be rapidly changing.
  • the base station 2220 detects a change in the communication environment by recognizing at least one of the following events: when load balance adjustment is necessary, when there is an urgent request from another user, or when transmission traffic changes.
  • step S2203 the device that detects a change in the communication environment transmits an RRC reset request message.
  • the terminal 2210 which recognizes the environmental change, may transmit a context information measurement request message to the base station 2220 in order to set new DRX parameter values, etc.
  • the base station 2220 may transmit a situation information measurement request message to the terminal 2210.
  • the terminal 2210 and the base station 2220 can request to reset the communication environment along with a request to measure context information by transmitting an RRC reset request message.
  • step S2205 the terminal 2210 measures context information of the terminal 2210.
  • the terminal 2210 may measure the context information of the terminal 2210.
  • the context information that can be measured by the terminal 2210 may include at least one of current link quality, user patterns, and QoS of the service being used.
  • the base station 2220 measures situation information of the base station 2220.
  • the base station 2220 may measure context information of the base station 2220 after transmitting or receiving an RRC reset request message.
  • the context information that can be extracted from the base station 2220 may include at least one of a traffic pattern before scheduling is applied or an indicator value used for load balance of the base station.
  • Values used as traffic patterns may include at least one of traffic volume, peak traffic, average traffic, traffic distribution, traffic type, inter-packet arrival time interval, session duration, etc.
  • the base station 2220 transmits the situation information of the base station 2220 to the terminal 2210.
  • the base station 2220 may transmit the above-described situation information itself to the terminal 2210.
  • the base station 2220 may allocate downlink resources for transmitting context information and transmit the context information to the terminal 2210 by including the context information in the resources. That is, the base station 2220 can transmit the situation information itself to the terminal 2210 through the allocated resources.
  • the base station 2220 may indicate situation information to the terminal 2210 based on a preset value.
  • the context information indication information may be included in the RRC reset request message described above as RRC signaling.
  • the terminal 2210 may receive an RRC reset request message including a context information indicator from the base station, recognize the context information of the base station corresponding to the indicator, and apply it.
  • the base station 2220 may indicate context information through at least one of other RRC signaling, MAC CE, and DCI. That is, it can be preset in the terminal 2210 and the base station 2220 corresponding to the context information indicator, and the context information can be recognized through the context information indicator value.
  • the terminal 2210 can transmit the context information of the base station 2220 to the base station 2220.
  • FIG. 23 illustrates a signal flow diagram of a procedure in which the terminal 2310 and the base station 2320 reconfigure RRC based on context information according to an embodiment of the present disclosure.
  • step S2301 the terminal 2310 can find optimal parameter values by inputting at least one of the received situation information of the base station 2320 and its own situation information into the artificial intelligence model.
  • Figure 23 is explained based on the terminal 2310 using an artificial intelligence model, but it is also possible for the base station 2320 to find optimal parameter values by using an artificial intelligence model. In this case, as described above, the base station 2320 must receive the situation information of the terminal 2310 from the terminal 2310.
  • the terminal 2310 transmits a UE Assistance Information (UAI) message to the base station 2320 based on the parameter values deduced from the artificial intelligence model.
  • UE assistance information may include preferred DRX parameter values or BWP-related parameter values.
  • step S2305 the base station 2320 transmits an RRC reset message to the terminal 2310.
  • the base station 2320 determines the DRX parameter value based on the received UE assistance information. If the base station 2320 determines that the DRX parameter value needs to be changed, it transmits an RRC reset message to the terminal 2310.
  • step S2307 the terminal 2310 transmits an RRC reset completion message to the base station 2320.
  • the terminal 2310 can set new DRX parameters based on the received RRC reset message.
  • terminals and base stations can use artificial intelligence models to set optimal DRX parameters and BWP bandwidth values based on situational information.
  • the terminal can set a new DRX parameter and determine a reward based on performance evaluation of the new DRX parameter value based on whether QoS is maintained and the DRX power saving gain value.
  • the terminal can learn an artificial intelligence model through compensation by using reinforcement learning or contextual MAB techniques.
  • the standard for determining compensation may be as shown in [Equation 1] below.
  • R means compensation, means the distribution value of the PDCCH-only section to which the new DRX parameter value is applied, means the distribution value of the PDCCH-only section to which the previous DRX parameter value was applied, means the minimum distribution threshold value that will compensate for the reward.
  • the terminal determines the compensation to be 0.
  • the terminal can determine compensation according to [Equation 1]. At this time, by setting a threshold value, the terminal can determine the compensation to be 1 only when the time for monitoring only the PDCCH is more than a certain value.
  • the base station can modify the global model by periodically receiving local artificial intelligence models learned by the terminal.
  • the terminal can also receive the global model from the base station.
  • the terminal can create a local model tailored to the terminal based on the global model received from the base station.
  • Figure 24 shows a signal flow diagram of a procedure in which the terminal 2410 learns an artificial intelligence model and exchanges the artificial intelligence model with the base station 2420 according to an embodiment of the present disclosure.
  • terminal 2410 can learn an artificial intelligence model that optimizes parameter values to be used for communication.
  • step S2401 the terminal 2410 and the base station 2420 change parameter values based on context information.
  • the terminal 2410 and the base station 2420 can optimize the DRX parameters and the bandwidth of the BWP using the procedure shown in FIG. 23.
  • step S2403 the terminal 2410 evaluates the performance of the artificial intelligence model and learns the artificial intelligence model.
  • the terminal 2410 may determine compensation based on [Equation 1] described above to evaluate the performance of the artificial intelligence model.
  • artificial intelligence learning can be performed by at least one of machine learning or deep learning.
  • steps S2405 and S2407 the terminal 2410 repeatedly performs steps S2401 and S2403. If the DRX parameters and BWP bandwidth need to be changed depending on the communication environment, the terminal 2410 can change parameter values based on context information, evaluate the artificial intelligence model, and train it. As a result of this repeated learning, the performance of the local artificial intelligence model of the terminal 2410 can be improved.
  • step S2409 the terminal 2410 transmits the local artificial intelligence model to the base station 2420.
  • the base station 2420 can set the terminal 2410 to transmit a local artificial intelligence model at specific intervals. Additionally, the base station 2420 can receive a local artificial intelligence model by transmitting a local artificial intelligence model request signal to the terminal 2410.
  • the terminal 2410 receives a global artificial intelligence model from the base station 2420.
  • the base station 2420 can receive local artificial intelligence models from not only the terminal 2410 but also other terminals, and can determine a global artificial intelligence model by combining the received local artificial intelligence models.
  • FIG. 25 illustrates a method in which the base station 2520 determines a global model through local models received from each terminal (2510#1 to 2510#u) using federated learning according to an embodiment of the present disclosure.
  • the base station 2520 may receive local models (w 1 to w u ) from each terminal (2510# 1 to 2510# u ) and determine a global model (w BS ) based on the received local models.
  • the base station 2520 can determine the global model by averaging the local models (w 1 to w u ) as shown in FIG. 25.
  • FIG. 25 shows only the arithmetic mean, the base station 2520 may use at least one of the weighted mean, geometric mean, and harmonic mean.
  • the base station 2520 and each terminal (2510#1 to 2510#u) may calculate a global model wirelessly using over-the-air computation using wireless signal overlap.
  • Each terminal (2510#1 to 2510#u) can perform transfer learning tailored to its communication environment by receiving a global model from the base station 2520 when necessary.
  • the input and output of the artificial intelligence model can be set according to usage patterns.
  • Figure 24 shows a conceptual diagram of an artificial intelligence model according to an embodiment of the present disclosure.
  • the input of the artificial intelligence model may include at least one of the base station's traffic pattern, an index value for load balance, the link quality of the terminal, or the QoS of the service using the user's pattern.
  • Figure 24 shows inputs as 5 elements, but the number of inputs may be 4 or less. Additionally, since traffic patterns, indicator values for load balance, and values indicating user patterns are diverse, the number of input elements may be six or more.
  • the output of the artificial intelligence model may include DRX parameter values or the bandwidth of BWP. The number of outputs can be designed in various ways like the number of inputs.
  • the terminal can predict the optimal DRX control value by inputting the measured situation information into the artificial intelligence model.
  • a person involved in artificial intelligence learning can learn the artificial intelligence model of FIG. 26 through supervised learning.
  • supervised learning it is a learning method in which the person involved knows the answer to the problem and trains the artificial intelligence to figure it out.
  • the situation information of the base station and terminal can be considered as data. Learning participants need a process of labeling optimal terminal control values corresponding to the relevant context information. Therefore, for each situation, the learning participant needs to make separate efforts to find the optimal control value for the terminal.
  • the base station updates the global model through federated learning. The base station can update the global model using the method described above with reference to FIG. 25.
  • Supervised learning allows the optimal output value to be inferred through a small amount of calculation. Therefore, supervised learning models are relatively easy to implement on a terminal. However, because a data labeling process is required for learning, supervised learning methods can place a lot of burden on those involved in learning. As the number of types of context information increases, the labeling required for supervised learning can increase exponentially. Additionally, if the learned data does not match the actual environment or the environment changes, re-learning may be required to optimize the artificial intelligence model. In this case, a new labeling process may be needed for retraining.
  • an artificial intelligence learning model that can flexibly respond to environmental changes.
  • reinforcement learning and MAB (muti-armed bandit) artificial intelligence models can be used.
  • an artificial intelligence model capable of real-time learning according to environmental changes can be implemented. Therefore, the burden of labeling required in supervised learning is reduced.
  • Reinforcement learning performs learning at the same time as prediction, so it may require more computation from a prediction perspective than supervised learning.
  • Figure 27 shows a process of learning a reinforcement learning artificial intelligence model according to an embodiment of the present disclosure.
  • the agent 2710 predicts the optimal action based on the state extracted from the environment 2730.
  • the artificial intelligence model is re-learned through the evaluation (reward) of the action performed by the agent 2710.
  • Status information is a factor extracted from the environment 2730 and may include situation information measured by the base station and terminal. Additionally, the status information may include DRX control values or BWP control values when the status information is extracted.
  • the state can be expressed as [Equation 2] below.
  • Equation 2 means the tth state, means the situation information of the base station, means the situation information of the terminal, means the current DRX control values, means the control values of the current BWP.
  • An action may consist of a DRX control value and a BWP control value.
  • the action may be composed of an index of a codebook that indicates a DRX control value and a BWP control value. Even when using the codebook, the settings of DRX and BWP are ultimately applied.
  • the learning participant can remove the BWP-related control values and learn with only the DRX control values.
  • Equation 3 means the tth action, means the tth DRX control value, means the tth BWP control value.
  • Learning participants can set the reward to 0 if QoS is adversely affected by increased communication delay. Learning participants can grant rewards based on energy efficiency if it does not affect QoS. As an example, compensation may be determined by comparing the distribution value of PDCCH-only in which the new DRX control value is set and the distribution value of PDCCH-only in which the previous DRX control value is set. Learning participants can determine that communication energy efficiency has increased if the PDCCH-only distribution value with the new DRX control value set is smaller than before. Therefore, compensation can be expressed as [Equation 4] below.
  • Equation 4 means the distribution value of PDCCH-only with the new DRX control value applied, means the distribution value of PDCCH-only with the previous DRX control value applied, R means compensation, means QoS with new DRX control value applied, refers to the QoS threshold for communication service quality.
  • Figure 28 shows the process of learning a MAB-based artificial intelligence model according to an embodiment of the present disclosure.
  • the MAB artificial intelligence model can be used because the computational amount is relatively high, and because the context information changes, the contextual MAB can be used.
  • the terminal can implement the artificial intelligence model with a lighter computational amount than general reinforcement learning. Therefore, the MAB artificial intelligence model is suitable for edge AI fields where power consumption is important.
  • Contextual MAB is a MAB that takes context into account and is an artificial intelligence model that improves MAB, which is poor in responding to rapid environmental changes. Therefore, since Contextual MAB consists of actions and rewards similar to reinforcement learning, the values used in reinforcement learning can be used as is.
  • context information is used instead of the state of reinforcement learning, and the context information may include values representing the environment.
  • the context information in Contextual MAB does not change depending on the action, and can only be changed by changes in the environment.
  • Equation 5 means the situation information of the base station, means situation information of the terminal.
  • Figure 28 shows a method using LinUCB (linear upper confidence bound) among contextual MABs.
  • LinUCB can include a ridge regression part that learns, and a policy part that actually selects the optimal action in a given situation.
  • the ridge regression part of the artificial intelligence model is a context vector through actions and reward values based on previous context values. can be estimated as shown in [Equation 7] below.
  • the artificial intelligence model estimates the situation vector like this Based on , the probability of each action according to the current situation can be obtained as shown in [Equation 8] below.
  • Equation 8 is a positive number and means the hyperparameter value that determines exploration.
  • the policy part of the artificial intelligence model can select the action with the highest probability as shown in [Equation 9] below.
  • the terminal can optimize each control value by selecting the action with the highest probability based on the contextual MAB algorithm. Unlike reinforcement learning in Figure 27, situational information with behavioral change elements removed and Reward Inn By learning only with this, the amount of computation can be reduced.
  • the proposed methods described above may be implemented independently, but may also be implemented in the form of a combination (or merge) of some of the proposed methods.
  • a rule may be defined so that the base station informs the terminal of the application of the proposed methods (or information about the rules of the proposed methods) through a predefined signal (e.g., a physical layer signal or a higher layer signal). .
  • Embodiments of the present disclosure can be applied to various wireless access systems.
  • Examples of various wireless access systems include the 3rd Generation Partnership Project (3GPP) or 3GPP2 system.
  • Embodiments of the present disclosure can be applied not only to the various wireless access systems, but also to all technical fields that apply the various wireless access systems. Furthermore, the proposed method can also be applied to mmWave and THz communication systems using ultra-high frequency bands.
  • embodiments of the present disclosure can be applied to various applications such as free-running vehicles and drones.

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

본 개시는 무선 통신 시스템에서 단말의 동작 방법에 있어서, 상황 정보를 획득하는 단계, 상기 상황 정보를 기반으로 인공지능 모델이 추론한 선호 파라미터 값을 기지국에게 전송하는 단계, 상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하는 단계, 상기 기지국으로 RRC 재설정 완료 메시지를 전송하는 단계, 상기 기지국으로부터 데이터를 수신하는 단계를 포함하되, 상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함할 수 있다.

Description

무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 방법 및 장치
이하의 설명은 무선 통신 시스템에 대한 것으로, 무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 장치 및 방법에 관한 것이다.
특히, 단말과 기지국은 인공지능을 활용하여, DRX(discontinuous reception) 제어 값 및 BWP(bandwidth part) 제어 값을 제어함으로써 전력을 절약할 수 있다.
무선 접속 시스템이 음성이나 데이터 등과 같은 다양한 종류의 통신 서비스를 제공하기 위해 광범위하게 전개되고 있다. 일반적으로 무선 접속 시스템은 가용한 시스템 자원(대역폭, 전송 파워 등)을 공유하여 다중 사용자와의 통신을 지원할 수 있는 다중 접속(multiple access) 시스템이다. 다중 접속 시스템의 예들로는 CDMA(code division multiple access) 시스템, FDMA(frequency division multiple access) 시스템, TDMA(time division multiple access) 시스템, OFDMA(orthogonal frequency division multiple access) 시스템, SC-FDMA(single carrier frequency division multiple access) 시스템 등이 있다.
특히, 많은 통신 장치들이 큰 통신 용량을 요구하게 됨에 따라 기존 RAT(radio access technology)에 비해 향상된 모바일 브로드밴드(enhanced mobile broadband, eMBB) 통신 기술이 제안되고 있다. 또한 다수의 장치 및 사물들을 연결하여 언제 어디서나 다양한 서비스를 제공하는 mMTC(massive machine type communications) 뿐만 아니라 신뢰성 (reliability) 및 지연(latency) 민감한 서비스/UE(user equipment)를 고려한 통신 시스템이 제안되고 있다. 이를 위한 다양한 기술 구성들이 제안되고 있다.
본 개시는 무선 통신 시스템에서 신호 송수신을 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 장치 및 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 인공지능을 활용하여 DRX 제어 값들을 최적화하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 인공 지능을 활용하여 BWP 제어 값들을 최적화하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 단말 및 기지국이 상황 정보를 획득하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 상황 정보를 기반으로 인공 지능 모델을 학습하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 상황 정보를 기반으로 글로벌 인공 지능 모델을 갱신하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 강화 학습 모델 및 MAB 모델을 이용하여 DRX 제어 값 및 BWP 제어 값을 최적화하는 방법을 제공할 수 있다.
본 개시는 무선 통신 시스템에서 통신 환경의 변화를 감지하고, 단말 및 기지국의 상황 정보를 인지하는 인공지능 모델을 통해 각 제어 값을 최적화함으로써, 전력을 절약하는 방법을 제공할 수 있다.
본 개시에서 이루고자 하는 기술적 목적들은 이상에서 언급한 사항들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 이하 설명할 본 개시의 실시예들로부터 본 개시의 기술 구성이 적용되는 기술분야에서 통상의 지식을 가진 자에 의해 고려될 수 있다.
본 개시의 일 예로서, 무선 통신 시스템에서 단말의 동작 방법에 있어서, 상황 정보를 획득하는 단계, 상기 상황 정보를 기반으로 인공지능 모델이 추론한 선호 파라미터 값을 기지국에게 전송하는 단계, 상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하는 단계, 상기 기지국으로 RRC 재설정 완료 메시지를 수신하는 단계, 상기 기지국으로부터 데이터를 수신하는 단계를 포함하되, 상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함할 수 있다.
또한 본 개시의 일 예로서, 무선 통신 시스템에서 기지국의 동작 방법에 있어서, 단말로 상황 정보를 전송하는 단계, 상기 단말로부터 인공지능 모델이 추론한 선호 파라미터 값을 수신하는 단계, 상기 단말로부터 선호 파라미터 값을 기반으로 RRC 재설정 메시지를 전송하는 단계, 상기 단말로부터 RRC 재설정 완료 메시지를 수신하는 단계, 상기 단말로 데이터를 전송하는 단계를 포함하되, 상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함할 수 있다.
또한 본 개시의 일 예로서, 무선 통신 시스템에서 단말에 있어서, 송수신기 및 상기 송수신기와 연결된 프로세서를 포함하며, 상기 프로세서는, 상황 정보를 획득하고, 상기 상황 정보를 기반으로 인공지능 모델이 추론한 선호 파라미터 값을 기지국에게 전송하고, 상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하고, 상기 기지국으로 RRC 재설정 완료 메시지를 수신하고, 상기 기지국으로부터 데이터를 수신하되, 기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함할 수 있다.
또한 본 개시의 일 예로서, 무선 통신 시스템에서 기지국에 있어서, 송수신기 및 상기 송수신기와 연결된 프로세서를 포함하며, 상기 프로세서는, 단말로 상황 정보를 전송하고, 상기 단말로부터 인공지능 모델이 추론한 선호 파라미터 값을 수신하고, 상기 단말로부터 선호 파라미터 값을 기반으로 RRC 재설정 메시지를 전송하고, 상기 단말로부터 RRC 재설정 완료 메시지를 수신하고, 상기 단말로 데이터를 전송하는 단계를 포함하되, 상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함할 수 있다.
또한 본 개시의 일 예로서, 통신 장치에 있어서, 적어도 하나의 프로세서, 상기 적어도 하나의 프로세서와 연결되며, 상기 적어도 하나의 프로세서에 의해 실행됨에 따라 동작들을 지시하는 명령어를 저장하는 적어도 하나의 컴퓨터 메모리를 포함하며, 상기 동작들은, 상황 정보를 획득하고, 상기 상황 정보를 기반으로 인공지능 모델이 추론한 선호 파라미터 값을 기지국에게 전송하고, 상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하고, 상기 기지국으로 RRC 재설정 완료 메시지를 수신하고, 상기 기지국으로부터 데이터를 수신하되, 상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함할 수 있다.
또한 본 개시의 일 예로서, 적어도 하나의 명령어(instructions)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)에 있어서, 프로세서에 의해 실행 가능한(executable) 상기 적어도 하나의 명령어를 포함하며, 상기 적어도 하나의 명령어는, 장치가, 상황 정보를 획득하고, 상기 상황 정보를 기반으로 인공지능 모델이 추론한 선호 파라미터 값을 기지국에게 전송하고, 상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하고, 상기 기지국으로 RRC 재설정 완료 메시지를 수신하고, 상기 기지국으로부터 데이터를 수신하되, 상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함할 수 있다.
상술한 본 개시의 양태들은 본 개시의 바람직한 실시예들 중 일부에 불과하며, 본 개시의 기술적 특징들이 반영된 다양한 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 본 개시의 상세한 설명을 기반으로 도출되고 이해될 수 있다.
본 개시에 기초한 실시예들에 의해 하기와 같은 효과가 있을 수 있다.
본 개시에 따르면, 무선 통신에서 사용되는 전력이 절약될 수 있다.
본 개시에 따르면, 무선 통신에서 사용되는 DRX 제어 값 및 BWP의 제어 값을 최적화할 수 있다.
본 개시에 따르면, DRX 제어 값 및 BWP의 제어 값을 최적화하기 위해 인공지능 모델을 활용할 수 있다.
본 개시에 따르면, 단말 상태, 기지국의 상태 또는 사용환경에 따라 적응적으로 DRX 제어 값을 최적화 하여 통신 지연 및 시그널링 오버헤드를 증가시키지 않고, 단말의 전력 절약 효과를 최대화 할 수 있다.
본 개시의 실시예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 이하의 본 개시의 실시예들에 대한 기재로부터 본 개시의 기술 구성이 적용되는 기술분야에서 통상의 지식을 가진 자에게 명확하게 도출되고 이해될 수 있다. 즉, 본 개시에서 서술하는 구성을 실시함에 따른 의도하지 않은 효과들 역시 본 개시의 실시예들로부터 당해 기술분야의 통상의 지식을 가진 자에 의해 도출될 수 있다.
이하에 첨부되는 도면들은 본 개시에 관한 이해를 돕기 위한 것으로, 상세한 설명과 함께 본 개시에 대한 실시예들을 제공할 수 있다. 다만, 본 개시의 기술적 특징이 특정 도면에 한정되는 것은 아니며, 각 도면에서 개시하는 특징들은 서로 조합되어 새로운 실시예로 구성될 수 있다. 각 도면에서의 참조 번호(reference numerals)들은 구조적 구성요소(structural elements)를 의미할 수 있다.
도 1은 본 개시에 적용 가능한 통신 시스템 예를 도시한다.
도 2는 본 개시에 적용 가능한 무선 장치의 예를 도시한다.
도 3은 본 개시에 적용 가능한 전송 신호를 처리하는 방법을 도시한다.
도 4는 본 개시에 적용 가능한 단말 및 기지국 간 통신 절차를 도시한다.
도 5는 본 개시에 적용 가능한 6G(6th generation) 시스템에서 제공 가능한 통신 구조의 일례를 도시한다.
도 6은 본 개시에 적용 가능한 전자기 스펙트럼을 도시한다.
도 7은 본 개시에 적용 가능한 THz 무선 통신 송수신기를 도시한다.
도 8은 본 개시에 적용 가능한 THz 신호 생성 방법을 도시한다.
도 9는 본 개시에 적용 가능한 무선 통신 송수신기를 도시한다.
도 10은 본 개시에 적용 가능한 송신기 구조를 도시한다.
도 11은 본 개시에 적용 가능한 변조기 구조를 도시한다.
도 12는 본 개시에 적용 가능한 인공 신경망에 포함되는 퍼셉트론(perceptron)의 구조를 도시한다.
도 13은 본 개시에 적용 가능한 인공 신경망 구조를 도시한다.
도 14는 본 개시에 적용 가능한 DRX 사이클의 구조를 도시한다.
도 15는 본 개시에 적용 가능한 DRX 사이클내의 비활성화 타이머(inactivity timer)의 구조를 도시한다.
도 16은 본 개시의 일 실시예에 따라 DRX 파라미터 값들을 설정하는 절차의 예를 도시한다.
도 17은 본 개시의 일 실시예에 따라 DRX와 관련된 파라미터 값들을 설정하는 절차의 다른 예를 도시한다.
도 18은 단말이 사용하는 서비스에 따라, 단말의 전력 소모에 관련한 시간 분포와 파워 분포의 예를 도시한다.
도 19는 본 개시의 일 실시예에 따라 단말과 기지국이 적응적으로 각 DRX 파라미터 값 및 단말의 대역폭을 변경하는 개념도를 도시한다.
도 20은 본 개시의 일 실시예에 따라 상황 정보를 기반으로 단말이 전력을 절약하는 절차의 일 예를 도시한다.
도 21은 본 개시의 일 실시예에 따라 상황 정보를 기반으로 기지국이 전력을 절약하는 절차의 일 예를 도시한다.
도 22는 본 개시의 일 실시예에 따라 단말이 기지국의 상황정보를 획득하는 절차의 신호 흐름도를 도시한다.
도 23는 본 개시의 일 실시예에 따라 단말 및 기지국이 상황 정보를 기반으로 RRC 재설정하는 절차의 신호 흐름도를 도시한다.
도 24는 본 개시의 일 실시예에 따라 단말은 인공지능 모델을 학습하고 기지국과 인공지능 모델을 교환하는 절차의 신호 흐름도를 도시한다.
도 25는 본 개시의 일 실시예에 따라 기지국은 연합학습을 이용하여 각 단말들로부터 수신한 로컬 모델을 통해 글로벌 모델을 결정하는 방법을 도시한다.
도 26은 본 개시의 일 실시예에 따라 적용 가능한 인공지능 모델의 예를 도시한다.
도 27은 본 개시의 일 실시예에 따라 강화 학습 인공지능 모델을 학습하는 과정을 도시한다.
도 28은 본 개시의 일 실시예에 따라 MAB기반의 인공지능 모델을 학습하는 과정을 도시한다.
이하의 실시예들은 본 개시의 구성요소들과 특징들을 소정 형태로 결합한 것들이다. 각 구성요소 또는 특징은 별도의 명시적 언급이 없는 한 선택적인 것으로 고려될 수 있다. 각 구성요소 또는 특징은 다른 구성요소나 특징과 결합되지 않은 형태로 실시될 수 있다. 또한, 일부 구성요소들 및/또는 특징들을 결합하여 본 개시의 실시예를 구성할 수도 있다. 본 개시의 실시예들에서 설명되는 동작들의 순서는 변경될 수 있다. 어느 실시예의 일부 구성이나 특징은 다른 실시예에 포함될 수 있고, 또는 다른 실시예의 대응하는 구성 또는 특징과 교체될 수 있다.
도면에 대한 설명에서, 본 개시의 요지를 흐릴 수 있는 절차 또는 단계 등은 기술하지 않았으며, 당업자의 수준에서 이해할 수 있을 정도의 절차 또는 단계는 또한 기술하지 아니하였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 본 개시를 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
본 명세서에서 본 개시의 실시예들은 기지국과 이동국 간의 데이터 송수신 관계를 중심으로 설명되었다. 여기서, 기지국은 이동국과 직접적으로 통신을 수행하는 네트워크의 종단 노드(terminal node)로서의 의미가 있다. 본 문서에서 기지국에 의해 수행되는 것으로 설명된 특정 동작은 경우에 따라서는 기지국의 상위 노드(upper node)에 의해 수행될 수도 있다.
즉, 기지국을 포함하는 다수의 네트워크 노드들(network nodes)로 이루어지는 네트워크에서 이동국과의 통신을 위해 수행되는 다양한 동작들은 기지국 또는 기지국 이외의 다른 네트워크 노드들에 의해 수행될 수 있다. 이때, '기지국'은 고정국(fixed station), Node B, eNB(eNode B), gNB(gNode B), ng-eNB, 발전된 기지국(advanced base station, ABS) 또는 억세스 포인트(access point) 등의 용어에 의해 대체될 수 있다.
또한, 본 개시의 실시예들에서 단말(terminal)은 사용자 장비(user equipment, UE), 이동국(mobile station, MS), 가입자국(subscriber station, SS), 이동 가입자 단말(mobile subscriber station, MSS), 이동 단말(mobile terminal) 또는 발전된 이동 단말(advanced mobile station, AMS) 등의 용어로 대체될 수 있다.
또한, 송신단은 데이터 서비스 또는 음성 서비스를 제공하는 고정 및/또는 이동 노드를 말하고, 수신단은 데이터 서비스 또는 음성 서비스를 수신하는 고정 및/또는 이동 노드를 의미한다. 따라서, 상향링크의 경우, 이동국이 송신단이 되고, 기지국이 수신단이 될 수 있다. 마찬가지로, 하향링크의 경우, 이동국이 수신단이 되고, 기지국이 송신단이 될 수 있다.
본 개시의 실시예들은 무선 접속 시스템들인 IEEE 802.xx 시스템, 3GPP(3rd Generation Partnership Project) 시스템, 3GPP LTE(Long Term Evolution) 시스템, 3GPP 5G(5th generation) NR(New Radio) 시스템 및 3GPP2 시스템 중 적어도 하나에 개시된 표준 문서들에 의해 뒷받침될 수 있으며, 특히, 본 개시의 실시예들은 3GPP TS(technical specification) 38.211, 3GPP TS 38.212, 3GPP TS 38.213, 3GPP TS 38.321 및 3GPP TS 38.331 문서들에 의해 뒷받침될 수 있다.
또한, 본 개시의 실시예들은 다른 무선 접속 시스템에도 적용될 수 있으며, 상술한 시스템으로 한정되는 것은 아니다. 일 예로, 3GPP 5G NR 시스템 이후에 적용되는 시스템에 대해서도 적용 가능할 수 있으며, 특정 시스템에 한정되지 않는다.
즉, 본 개시의 실시예들 중 설명하지 않은 자명한 단계들 또는 부분들은 상기 문서들을 참조하여 설명될 수 있다. 또한, 본 문서에서 개시하고 있는 모든 용어들은 상기 표준 문서에 의해 설명될 수 있다.
이하, 본 개시에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 개시의 예시적인 실시 형태를 설명하고자 하는 것이며, 본 개시의 기술 구성이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다.
또한, 본 개시의 실시예들에서 사용되는 특정 용어들은 본 개시의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 개시의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
이하의 기술은 CDMA(code division multiple access), FDMA(frequency division multiple access), TDMA(time division multiple access), OFDMA(orthogonal frequency division multiple access), SC-FDMA(single carrier frequency division multiple access) 등과 같은 다양한 무선 접속 시스템에 적용될 수 있다.
이하 설명을 명확하게 하기 위해, 3GPP 통신 시스템(예: LTE, NR 등)을 기반으로 설명하지만 본 개시의 기술적 사상이 이에 제한되는 것은 아니다. LTE는 3GPP TS 36.xxx Release 8 이후의 기술을 의미할 수 있다. 세부적으로, 3GPP TS 36.xxx Release 10 이후의 LTE 기술은 LTE-A로 지칭되고, 3GPP TS 36.xxx Release 13 이후의 LTE 기술은 LTE-A pro로 지칭될 수 있다. 3GPP NR은 TS 38.xxx Release 15 이후의 기술을 의미할 수 있다. 3GPP 6G는 TS Release 17 및/또는 Release 18 이후의 기술을 의미할 수 있다. "xxx"는 표준 문서 세부 번호를 의미한다. LTE/NR/6G는 3GPP 시스템으로 통칭될 수 있다.
본 개시에 사용된 배경기술, 용어, 약어 등에 관해서는 본 개시 이전에 공개된 표준 문서에 기재된 사항을 참조할 수 있다. 일 예로, 36.xxx 및 38.xxx 표준 문서를 참조할 수 있다.
본 개시에 적용 가능한 통신 시스템
이로 제한되는 것은 아니지만, 본 문서에 개시된 본 개시의 다양한 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 장치들 간에 무선 통신/연결(예: 5G)을 필요로 하는 다양한 분야에 적용될 수 있다.
이하, 도면을 참조하여 보다 구체적으로 예시한다. 이하의 도면/설명에서 동일한 도면 부호는 다르게 기술하지 않는 한, 동일하거나 대응되는 하드웨어 블록, 소프트웨어 블록 또는 기능 블록을 예시할 수 있다.
도 1은 본 개시에 적용되는 통신 시스템 예를 도시한다.
도 1을 참고하면, 본 개시에 적용되는 통신 시스템(100)은 무선 장치, 기지국 및 네트워크를 포함한다. 여기서, 무선 장치는 무선 접속 기술(예: LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G)을 이용하여 통신을 수행하는 장치를 의미하며, 통신/무선/5G 장치로 지칭될 수 있다. 이로 제한되는 것은 아니지만, 무선 장치는 로봇(100a), 차량(100b-1, 100b-2), XR(extended reality) 장치(100c), 휴대 장치(hand-held device)(100d), 가전(home appliance)(100e), IoT(Internet of Thing) 장치(100f), AI(artificial intelligence) 장치/서버(100g)를 포함할 수 있다. 예를 들어, 차량은 무선 통신 기능이 구비된 차량, 자율 주행 차량, 차량간 통신을 수행할 수 있는 차량 등을 포함할 수 있다. 여기서, 차량(100b-1, 100b-2)은 UAV(unmanned aerial vehicle)(예: 드론)를 포함할 수 있다. XR 장치(100c)는 AR(augmented reality)/VR(virtual reality)/MR(mixed reality) 장치를 포함하며, HMD(head-mounted device), 차량에 구비된 HUD(head-up display), 텔레비전, 스마트폰, 컴퓨터, 웨어러블 디바이스, 가전 장치, 디지털 사이니지(signage), 차량, 로봇 등의 형태로 구현될 수 있다. 휴대 장치(100d)는 스마트폰, 스마트패드, 웨어러블 장치(예: 스마트워치, 스마트글래스), 컴퓨터(예: 노트북 등) 등을 포함할 수 있다. 가전(100e)은 TV, 냉장고, 세탁기 등을 포함할 수 있다. IoT 장치(100f)는 센서, 스마트 미터 등을 포함할 수 있다. 예를 들어, 기지국(120), 네트워크(130)는 무선 장치로도 구현될 수 있으며, 특정 무선 장치(120a)는 다른 무선 장치에게 기지국/네트워크 노드로 동작할 수도 있다.
무선 장치(100a 내지 100f)는 기지국(120)을 통해 네트워크(130)와 연결될 수 있다. 무선 장치(100a 내지 100f)에 AI 기술이 적용될 수 있으며, 무선 장치(100a 내지 100f)는 네트워크(130)를 통해 AI 서버(100g)와 연결될 수 있다. 네트워크(130)는 3G 네트워크, 4G(예: LTE) 네트워크, 5G(예: NR) 또는 6G 네트워크 등을 이용하여 구성될 수 있다. 무선 장치(100a 내지 100f)는 기지국(120)/네트워크(130)를 통해 서로 통신할 수도 있지만, 기지국(120)/네트워크(130)를 통하지 않고 직접 통신(예: 사이드링크 통신(sidelink communication))할 수도 있다. 예를 들어, 차량들(100b-1, 100b-2)은 직접 통신(예: V2V(vehicle to vehicle)/V2X(vehicle to everything) communication)을 할 수 있다. 또한, IoT 장치(100f)(예: 센서)는 다른 IoT 장치(예: 센서) 또는 다른 무선 장치(100a 내지 100f)와 직접 통신을 할 수 있다.
무선 장치(100a 내지 100f)/기지국(120), 기지국(120)/기지국(120) 간에는 무선 통신/연결(150a, 150b, 150c)이 이뤄질 수 있다. 여기서, 무선 통신/연결은 상향/하향링크 통신(150a)과 사이드링크 통신(150b)(또는, D2D 통신), 기지국간 통신(150c)(예: 릴레이(relay), IAB(integrated access backhaul))과 같은 다양한 무선 접속 기술을 통해 이뤄질 수 있다. 무선 통신/연결(150a, 150b, 150c)을 통해 무선 장치와 기지국/무선 장치, 기지국과 기지국은 서로 무선 신호를 송신/수신할 수 있다. 예를 들어, 무선 통신/연결(150a, 150b, 150c)은 다양한 물리 채널을 통해 신호를 송신/수신할 수 있다. 이를 위해, 본 개시의 다양한 제안들에 기반하여, 무선 신호의 송신/수신을 위한 다양한 구성정보 설정 과정, 다양한 신호 처리 과정(예: 채널 인코딩/디코딩, 변조/복조, 자원 매핑/디매핑 등), 자원 할당 과정 등 중 적어도 일부가 수행될 수 있다.
본 개시에 적용 가능한 장치
도 2는 본 개시에 적용될 수 있는 무선 장치의 예를 도시한다.
도 2를 참고하면, 무선 장치(200)는 다양한 무선 접속 기술(예: LTE, LTE-A, LTE-A pro, NR, 5G, 5G-A, 6G)을 통해 무선 신호를 송수신할 수 있다. 무선 장치(200)는 적어도 하나의 프로세서(202) 및 적어도 하나의 메모리(204)를 포함하며, 추가적으로 적어도 하나의 송수신기(206) 및/또는 적어도 하나의 안테나(208)을 더 포함할 수 있다.
프로세서(202)는 메모리(204) 및/또는 송수신기(206)를 제어하며, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 구현하도록 구성될 수 있다. 예를 들어, 프로세서(202)는 메모리(204) 내의 정보를 처리하여 제1 정보/신호를 생성한 뒤, 송수신기(206)을 통해 제1 정보/신호를 포함하는 무선 신호를 전송할 수 있다. 또한, 프로세서(202)는 송수신기(206)를 통해 제2 정보/신호를 포함하는 무선 신호를 수신한 뒤, 제2 정보/신호의 신호 처리로부터 얻은 정보를 메모리(204)에 저장할 수 있다. 메모리(204)는 프로세서(202)와 연결될 수 있고, 프로세서(202)의 동작과 관련한 다양한 정보를 저장할 수 있다. 예를 들어, 메모리(204)는 프로세서(202)에 의해 제어되는 프로세스들 중 일부 또는 전부를 수행하거나, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들을 수행하기 위한 명령들을 포함하는 소프트웨어 코드를 저장할 수 있다. 여기서, 프로세서(202)와 메모리(204)는 무선 통신 기술을 구현하도록 설계된 통신 모뎀/회로/칩의 일부일 수 있다. 송수신기(206)는 프로세서(202)와 연결될 수 있고, 적어도 하나의 안테나(208)를 통해 무선 신호를 송신 및/또는 수신할 수 있다. 송수신기(206)는 송신기 및/또는 수신기를 포함할 수 있다. 송수신기(206)는 RF(radio frequency) 유닛과 혼용될 수 있다. 본 개시에서 무선 장치는 통신 모뎀/회로/칩을 의미할 수도 있다.
이하, 무선 장치(200)의 하드웨어 요소에 대해 보다 구체적으로 설명한다. 이로 제한되는 것은 아니지만, 적어도 하나의 프로토콜 계층이 적어도 하나의 프로세서(202)에 의해 구현될 수 있다. 예를 들어, 적어도 하나의 프로세서(202)는 적어도 하나의 계층(예: PHY(physical), MAC(media access control), RLC(radio link control), PDCP(packet data convergence protocol), RRC(radio resource control), SDAP(service data adaptation protocol)와 같은 기능적 계층)을 구현할 수 있다. 적어도 하나의 프로세서(202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 적어도 하나의 PDU(Protocol Data Unit) 및/또는 적어도 하나의 SDU(service data unit)를 생성할 수 있다. 적어도 하나의 프로세서(202)는 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 메시지, 제어정보, 데이터 또는 정보를 생성할 수 있다. 적어도 하나의 프로세서(202)는 본 문서에 개시된 기능, 절차, 제안 및/또는 방법에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 포함하는 신호(예: 베이스밴드 신호)를 생성하여, 적어도 하나의 송수신기(206)에게 제공할 수 있다. 적어도 하나의 프로세서(202)는 적어도 하나의 송수신기(206)로부터 신호(예: 베이스밴드 신호)를 수신할 수 있고, 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들에 따라 PDU, SDU, 메시지, 제어정보, 데이터 또는 정보를 획득할 수 있다.
적어도 하나의 프로세서(202)는 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 마이크로 컴퓨터로 지칭될 수 있다. 적어도 하나의 프로세서(202)는 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합에 의해 구현될 수 있다. 일 예로, 적어도 하나의 ASIC(application specific integrated circuit), 적어도 하나의 DSP(digital signal processor), 적어도 하나의 DSPD(digital signal processing device), 적어도 하나의 PLD(programmable logic device) 또는 적어도 하나의 FPGA(field programmable gate arrays)가 적어도 하나의 프로세서(202)에 포함될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있고, 펌웨어 또는 소프트웨어는 모듈, 절차, 기능 등을 포함하도록 구현될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 수행하도록 설정된 펌웨어 또는 소프트웨어는 적어도 하나의 프로세서(202)에 포함되거나, 적어도 하나의 메모리(204)에 저장되어 적어도 하나의 프로세서(202)에 의해 구동될 수 있다. 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도들은 코드, 명령어 및/또는 명령어의 집합 형태로 펌웨어 또는 소프트웨어를 사용하여 구현될 수 있다.
적어도 하나의 메모리(204)는 적어도 하나의 프로세서(202)와 연결될 수 있고, 다양한 형태의 데이터, 신호, 메시지, 정보, 프로그램, 코드, 지시 및/또는 명령을 저장할 수 있다. 적어도 하나의 메모리(204)는 ROM(read only memory), RAM(random access memory), EPROM(erasable programmable read only memo2ry), 플래시 메모리, 하드 드라이브, 레지스터, 캐쉬 메모리, 컴퓨터 판독 저장 매체 및/또는 이들의 조합으로 구성될 수 있다. 적어도 하나의 메모리(204)는 적어도 하나의 프로세서(202)의 내부 및/또는 외부에 위치할 수 있다. 또한, 적어도 하나의 메모리(204)는 유선 또는 무선 연결과 같은 다양한 기술을 통해 적어도 하나의 프로세서(202)와 연결될 수 있다.
적어도 하나의 송수신기(206)는 적어도 하나의 다른 장치에게 본 문서의 방법들 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 전송할 수 있다. 적어도 하나의 송수신기(206)는 적어도 하나의 다른 장치로부터 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 수신할 수 있다. 예를 들어, 적어도 하나의 송수신기(206)는 적어도 하나의 프로세서(202)와 연결될 수 있고, 무선 신호를 송수신할 수 있다. 예를 들어, 적어도 하나의 프로세서(202)는 적어도 하나의 송수신기(206)가 적어도 하나의 다른 장치에게 사용자 데이터, 제어 정보 또는 무선 신호를 전송하도록 제어할 수 있다. 또한, 적어도 하나의 프로세서(202)는 적어도 하나의 송수신기(206)가 적어도 하나의 다른 장치로부터 사용자 데이터, 제어 정보 또는 무선 신호를 수신하도록 제어할 수 있다. 또한, 적어도 하나의 송수신기(206)는 적어도 하나의 안테나(208)와 연결될 수 있고, 적어도 하나의 송수신기(206)는 적어도 하나의 안테나(208)를 통해 본 문서에 개시된 설명, 기능, 절차, 제안, 방법 및/또는 동작 순서도 등에서 언급되는 사용자 데이터, 제어 정보, 무선 신호/채널 등을 송수신하도록 설정될 수 있다. 본 문서에서, 적어도 하나의 안테나는 복수의 물리 안테나이거나, 복수의 논리 안테나(예: 안테나 포트)일 수 있다. 적어도 하나의 송수신기(206)는 수신된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 적어도 하나의 프로세서(202)를 이용하여 처리하기 위해, 수신된 무선 신호/채널 등을 RF 밴드 신호에서 베이스밴드 신호로 변환(convert)할 수 있다. 적어도 하나의 송수신기(206)는 적어도 하나의 프로세서(202)를 이용하여 처리된 사용자 데이터, 제어 정보, 무선 신호/채널 등을 베이스밴드 신호에서 RF 밴드 신호로 변환할 수 있다. 이를 위하여, 적어도 하나의 송수신기(206)는 (아날로그) 오실레이터 및/또는 필터를 포함할 수 있다.
도 2를 참고하여 설명한 무선 장치의 구성요소들은 기능적인 측면에서 다른 용어로 지칭될 수 있다. 예를 들어, 프로세서(202)는 제어부, 송수신기(206)는 통신부, 메모리(204)는 저장부로 지칭될 수 있다. 경우에 따라, 통신부는 프로세서202)의 적어도 일부 및 송수신기(206)를 포함하는 의미로 사용될 수 있다.
도 2를 참고하여 설명한 무선 장치의 구조는 다양한 장치의 적어도 일부의 구조로 이해될 수 있다. 예를 들어, 도 2에 예시된 무선 장치의 구조는, 도 1을 참고하여 설명한 다양한 장치들(예: 로봇(100a), 차량(100b-1, 100b-2), XR 장치(100c), 휴대 장치(100d), 가전(100e), IoT 장치(100f), AI 장치/서버(100g))의 적어도 일부일 수 있다. 나아가, 다양한 실시예들에 따라, 도 2에 예시된 구성요소들 외, 장치는 다른 구성요소들을 더 포함할 수 있다.
예를 들어, 장치는 스마트폰, 스마트패드, 웨어러블 장치(예: 스마트 워치, 스마트 글래스), 휴대용 컴퓨터(예: 노트북 등)와 같은 휴대 장치일 수 있다. 이 경우, 장치는 전원을 공급하며, 유/무선 충전 회로, 배터리 등을 포함하는 전원공급부, 다른 장치와의 연결을 위한 적어도 하나의 포트(예: 오디오 입/출력 포트, 비디오 입/출력 포트)를 포함하는 인터페이스부, 영상 정보/신호, 오디오 정보/신호, 데이터, 및/또는 사용자로부터 입력되는 정보를 입력 및 출력하기 위한 입출력부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 이동형 로봇, 차량, 기차, 유/무인 비행체(aerial vehicle, AV), 선박 등과 같은 이동 장치일 수 있다. 이 경우, 장치는 장치의 엔진, 모터, 파워 트레인, 바퀴, 브레이크, 조향 장치 중 적어도 하나를 포함하는 구동부, 전원을 공급하며, 유/무선 충전 회로, 배터리 등을 포함하는 전원공급부, 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부, 경로 유지, 속도 조절, 목적지 설정 등의 기능을 수행하는 자율 주행부, GPS(global positioning system) 및 다양한 센서를 통하여 이동체 위치 정보를 획득하는 위치 측정부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 HMD, 차량에 구비된 HUD(head-up display), 텔레비전, 스마트폰, 컴퓨터, 웨어러블 디바이스, 가전 장치, 디지털 사이니지(signage), 차량, 로봇 등과 같은 XR 장치일 수 있다. 이 경우, 장치는, 전원을 공급하며, 유/무선 충전 회로, 배터리 등을 포함하는 전원공급부, 외부로부터 제어 정보, 데이터 등을 획득하며, 생성된 XR 오브젝트를 출력하는 입출력부, 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 사용 목적이나 분야에 따라 산업용, 의료용, 가정용, 군사용 등으로 분류 가능한 로봇일 수 있다. 이 경우, 장치는 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부, 로봇 관절을 움직이는 등의 다양한 물리적 동작을 수행하는 구동부 중 적어도 하나를 더 포함할 수 있다.
예를 들어, 장치는 TV, 프로젝터, 스마트폰, PC, 노트북, 디지털방송용 단말기, 태블릿 PC, 웨어러블 장치, 셋톱박스(STB), 라디오, 세탁기, 냉장고, 디지털 사이니지, 로봇, 차량 등과 같은 AI 장치일 수 있다. 이 경우, 장치는 외부로부터 다양한 종류의 데이터를 획득하는 입력부, 시각, 청각 또는 촉각 등과 관련된 출력을 생성하는 출력부, 장치 또는 장치 주변의 상태 정보, 환경 정보, 사용자 정보를 센싱하는 센서부, 학습 데이터를 이용하여 인공 신경망으로 구성된 모델을 학습하는 훈련부(training unit) 중 적어도 하나를 더 포함할 수 있다.
도 2에 예시된 무선 장치의 구조는, RAN 노드(예: 기지국, DU, RU, RRH 등)의 일부로 이해될 수 있다. 즉, 도 2에 예시된 장치는 RAN 노드일 수 있다. 이 경우, 장치는 프론트 홀(front haul) 및/또는 백홀(back haul) 통신을 위한 유선 송수신기를 더 포함할 수 있다. 다만, 프론트 홀 및/또는 백홀 통신이 무선 통신에 기반하면, 도 2에 예시된 적어도 하나의 송수신기(206)가 프론트 홀 및/또는 백홀 통신을 위해 사용되고, 유선 송수신기는 포함되지 아니할 수 있다.
도 3은 본 개시에 적용되는 전송 신호를 처리하는 방법을 도시한다. 일 예로, 전송 신호는 신호 처리 회로에 의해 처리될 수 있다. 이때, 신호 처리 회로(300)는 스크램블러(310), 변조기(320), 레이어 매퍼(330), 프리코더(340), 자원 매퍼(350), 신호 생성기(360)를 포함할 수 있다. 이때, 일 예로, 도 3의 동작/기능은 도 2의 프로세서(202) 및/또는 송수신기(206)에서 수행될 수 있다. 또한, 일 예로, 도 3의 하드웨어 요소는 도 2의 프로세서(202) 및/또는 송수신기(206)에서 구현될 수 있다. 일 예로, 블록 310 내지 360은 도 2의 프로세서(202)에서 구현될 수 있다. 또한, 블록 310 내지 350은 도 2의 프로세서(202)에서 구현되고, 블록 360은 도 2의 송수신기(206)에서 구현될 수 있으며, 상술한 실시예로 한정되지 않는다.
코드워드는 도 3의 신호 처리 회로(300)를 거쳐 무선 신호로 변환될 수 있다. 여기서, 코드워드는 정보블록의 부호화된 비트 시퀀스이다. 정보블록은 전송블록(예: UL-SCH 전송블록, DL-SCH 전송블록)을 포함할 수 있다. 무선 신호는 다양한 물리 채널(예: PUSCH, PDSCH)을 통해 전송될 수 있다. 구체적으로, 코드워드는 스크램블러(310)에 의해 스크램블된 비트 시퀀스로 변환될 수 있다. 스크램블에 사용되는 스크램블 시퀀스는 초기화 값에 기반하여 생성되며, 초기화 값은 무선 장치의 ID 정보 등이 포함될 수 있다. 스크램블된 비트 시퀀스는 변조기(320)에 의해 변조 심볼 시퀀스로 변조될 수 있다. 변조 방식은 pi/2-BPSK(pi/2-binary phase shift keying), m-PSK(m-phase shift keying), m-QAM(m-quadrature amplitude modulation) 등을 포함할 수 있다.
복소 변조 심볼 시퀀스는 레이어 매퍼(330)에 의해 적어도 하나의 전송 레이어로 매핑될 수 있다. 각 전송 레이어의 변조 심볼들은 프리코더(340)에 의해 해당 안테나 포트(들)로 매핑될 수 있다. 프리코더(340)의 출력 z는 레이어 매퍼(330)의 출력 y를 NХM의 프리코딩 행렬 W와 곱함으로써 얻어질 수 있다. 여기서, N은 안테나 포트의 개수, M은 전송 레이어의 개수이다. 여기서, 프리코더(340)는 복소 변조 심볼들에 대한 트랜스폼(transform) 프리코딩(예: DFT(discrete fourier transform) 변환)을 수행한 이후에 프리코딩을 수행할 수 있다. 또한, 프리코더(340)는 트랜스폼 프리코딩을 수행하지 않고 프리코딩을 수행할 수 있다.
자원 매퍼(350)는 각 안테나 포트의 변조 심볼들을 시간-주파수 자원에 매핑할 수 있다. 시간-주파수 자원은 시간 도메인에서 복수의 심볼(예: CP-OFDMA 심볼, DFT-s-OFDMA 심볼)을 포함하고, 주파수 도메인에서 복수의 부반송파를 포함할 수 있다. 신호 생성기(360)는 매핑된 변조 심볼들로부터 무선 신호를 생성하며, 생성된 무선 신호는 각 안테나를 통해 다른 장치로 전송될 수 있다. 이를 위해, 신호 생성기(360)는 IFFT(inverse fast fourier transform) 모듈 및 CP(cyclic prefix) 삽입기, DAC(digital-to-analog converter), 주파수 상향 변환기(frequency uplink converter) 등을 포함할 수 있다.
무선 장치에서 수신 신호를 위한 신호 처리 과정은 도 3의 신호 처리 과정(310 내지 360)의 역으로 구성될 수 있다. 일 예로, 무선 장치(예: 도 2의 200)는 안테나 포트/송수신기를 통해 외부로부터 무선 신호를 수신할 수 있다. 수신된 무선 신호는 신호 복원기를 통해 베이스밴드 신호로 변환될 수 있다. 이를 위해, 신호 복원기는 주파수 하향 변환기(frequency downlink converter), ADC(analog-to-digital converter), CP 제거기, FFT(fast fourier transform) 모듈을 포함할 수 있다. 이후, 베이스밴드 신호는 자원 디-매퍼 과정, 포스트코딩(postcoding) 과정, 복조 과정 및 디-스크램블 과정을 거쳐 코드워드로 복원될 수 있다. 코드워드는 복호(decoding)를 거쳐 원래의 정보블록으로 복원될 수 있다. 따라서, 수신 신호를 위한 신호 처리 회로(미도시)는 신호 복원기, 자원 디-매퍼, 포스트코더, 복조기, 디-스크램블러 및 복호기를 포함할 수 있다.
도 4는 본 개시에 적용 가능한 단말 및 기지국 간 통신 절차를 도시한다. 도 4는 단말(410) 및 기지국(420)이 데이터를 송신 및/또는 수신하는 동작 및 이에 앞서 수행되는 동작들을 예시한다.
도 4를 참고하면, 401 단계에서, 단말(410) 및 기지국(420)은 동기화를 수행한다. 예를 들어, 단말(410)은 초기 셀 탐색(initial cell search) 동작을 수행한다. 구체적으로, 단말(410)은 기지국(420)에서 미리 정의된 규칙에 따라 송신되는 적어도 하나의 동기 신호를 검출할 수 있다. 여기서, 동기 신호는 구조 또는 용도에 따라 분류되는 복수의 동기 신호들(예: 프라이머리 동기 신호, 세컨더리 동기 신호)을 포함할 수 있다. 이를 통해, 단말(410)은 기지국(420)의 프레임, 서브프레임, 슬롯 및/또는 심볼의 경계(boundary)를 확인하고, 기지국(420)에 대한 정보(예: 셀 식별자)를 획득할 수 있다.
403 단계에서, 단말(410)은 기지국(420)에서 송신되는 시스템 정보를 획득한다. 시스템 정보는 기지국(420)에 접속하고, 서비스를 이용하기 위해 필요한 기지국(420)의 속성, 특성, 및/또는 능력에 관련된 정보로서, 내용(예: 접속을 위해 필수적으로 필요한지 여부), 송신 구조(예: 사용되는 채널, 요구에 따라(on-demand) 제공되는지 여부) 등에 따라 분류될 수 있으며, 예를 들어, MIB(master information block) 및 SIB(system information block)로 분류될 수 있다. 필요에 따라, 단말(410)은 시스템 정보를 수신하기에 앞서 시스템 정보를 요청하는 신호를 송신할 수 있다. 다만, 시스템 정보의 요청 및 제공은 후술되는 랜덤 액세스(random access) 절차 이후에 수행될 수 있다.
405 단계에서, 단말(410) 및 기지국(420)은 랜덤 액세스 절차를 수행한다. 단말(410)은 시스템 정보를 통해 획득된 기지국(420)의 랜덤 액세스 채널에 관련된 정보(예: 채널 위치, 채널 구조, 지원되는 프리앰블의 구조 등)에 기반하여 랜덤 액세스 절차를 위한 적어도 하나의 메시지(예: 랜덤 액세스 프리앰블, RAR(random access response) 메시지 등)을 송신 및/또는 수신할 수 있다. 예를 들어, 단말(410)은 랜덤 액세스 채널을 통해 프리앰블(예: MSG1)을 송신하고, RAR 메시지(예: MSG2)를 수신하고, RAR 메시지에 포함되는 스케줄링 정보를 이용하여 단말(410)에 관련된 정보(예: 식별 정보)를 포함하는 메시지(예: MSG3)를 기지국(420)에게 송신하고, 경쟁 해소(contention resolution) 및/또는 연결 설정을 위한 메시지(예: MSG4)를 수신할 수 있다. 다른 예로, MSG1 및 MSG3이 하나의 메시지로서, 또는 MSG2 및 MSG4가 하나의 메시지로서 송신 및 수신될 수 있다.
407 단계에서, 단말(410) 및 기지국(420)은 제어 정보의 시그널링을 수행한다. 여기서, 제어 정보는 제어 정보는 연결을 제어하는 계층(예: RRC(radio resource control) 계층), 논리 채널 및 전송 채널 간 매핑을 처리하는 계층(예: MAC(media access control) 계층), 물리 채널을 처리하는 계층(예: PHY(physical) 계층) 등 다양한 계층들에서 정의될 수 있다. 예를 들어, 단말(410) 및 기지국(420)은 연결을 수립하기 위한 시그널링, 통신과 관련된 설정을 결정하기 위한 시그널링, 할당된 자원을 지시하기 위한 시그널링 중 적어도 하나를 수행할 수 있다.
409 단계에서, 단말(410) 및 기지국(420)은 데이터를 송신 및/또는 수신한다. 다시 말해, 단말(410) 및 기지국(420)은 제어 정보의 시그널링에 기반하여 데이터를 처리하고, 송신 및/또는 수신할 수 있다. 예를 들어, 데이터를 송신하는 경우, 단말(410) 또는 기지국(420)은 정보 비트들에 대하여 채널 인코딩, 레이트 매칭(rate matching), 스크램블링, 성상도 맵핑, 레이어 맵핑, 파형(waveform) 변조, 안테나 맵핑, 자원 맵핑 중 적어도 하나를 수행할 수 있다. 반대로, 데이터를 수신하는 경우, 단말(410) 또는 기지국(420)은 자원에서 신호 추출, 안테나 별 파형 복조, 레이어 맵핑을 고려한 신호 배치, 성상도 디매핑, 디스크램블링, 채널 디코딩 중 적어도 하나를 수행할 수 있다.
6G 통신 시스템 및 6G 시스템의 핵심 구현 기술
5G 시스템은 410MHz 내지 7125MHz를 포함하는 FR1(frequency range 1) 및 24,250MHz 내지 71,000MHz를 포함하는 FR2(frequency range 2) 내에서 다양한 동작 대역들을 정의한다. 이후의 6G 시스템의 동작 대역들로서 다양한 주파수들이 논의되고 있는데, 더 넓은 대역폭 및 더 높은 전송 속도를 위해 5G 시스템보다 높은 주파수의 사용도 고려되고 있다. 그중 하나로서, 약 100GHz 내지 10THz를 포함하며 THz(Terahertz) 주파수 대역의 사용이 논의되고 있다. THz 주파수 대역은 전파의 투과성 및 광파의 직진성을 모두 가진 대역이며, THz 주파수 대역을 이용한 통신은 기존의 전파 중심의 통신에서 광파 기반의 통신으로의 과도기적 역할을 수행할 것으로 기대되기도 한다.
이와 같이 THz 주파수 대역을 활용하는 6G 시스템은 i)디바이스 당 매우 높은 데이터 속도, ii)매우 많은 수의 연결된 디바이스들, iii)글로벌 연결성(global connectivity), iv)매우 낮은 지연, v)배터리-프리(battery-free) IoT 디바이스들의 에너지 소비를 낮추고, vi)초고신뢰성 연결, vii)머신 러닝 능력을 가지는 연결된 지능 등에 목적이 있다. 6G 시스템의 비젼은 "intelligent connectivity", "deep connectivity", "holographic connectivity", "ubiquitous connectivity"와 같은 4가지 측면일 수 있으며, 6G 시스템은 하기 [표 1]과 같은 요구 사항을 만족시키도록 설계될 수 있다.
Per device peak data rate 1 Tbps
E2E latency 1 ms
Maximum spectral efficiency 100 bps/Hz
Mobility support up to 1000 km/hr
Satellite integration Fully
AI Fully
Autonomous vehicle Fully
XR Fully
Haptic Communication Fully
이때, 6G 시스템은 향상된 모바일 브로드밴드(enhanced mobile broadband, eMBB), 초-저지연 통신(ultra-reliable low latency communications, URLLC), mMTC (massive machine type communications), AI 통합 통신(AI integrated communication), 촉각 인터넷(tactile internet), 높은 스루풋(high throughput), 높은 네트워크 능력(high network capacity), 높은 에너지 효율(high energy efficiency), 낮은 백홀 및 접근 네트워크 혼잡(low backhaul and access network congestion) 및 향상된 데이터 보안(enhanced data security)과 같은 핵심 요소(key factor)들을 가질 수 있다.도 5는 본 개시에 적용 가능한 6G 시스템에서 제공 가능한 통신 구조의 일례를 도시한다. 도 5를 참고하면, 6G 시스템은 5G 무선통신 시스템보다 50배 더 높은 동시 무선통신 연결성을 가질 것으로 예상된다. 5G의 핵심 요소(key feature)인 URLLC는 6G 통신에서 1ms보다 적은 단-대-단(end-to-end) 지연을 제공함으로써 보다 더 주요한 기술이 될 것으로 예상된다. 이때, 6G 시스템은 자주 사용되는 영역 스펙트럼 효율과 달리 체적 스펙트럼 효율이 훨씬 우수할 것이다. 6G 시스템은 매우 긴 배터리 수명과 에너지 수확을 위한 고급 배터리 기술을 제공할 수 있어, 6G 시스템에서 모바일 디바이스들은 별도로 충전될 필요가 없을 수 있다.
6G 시스템의 핵심 구현 기술로서, 인공 지능(artificial Intelligence, AI), THz(Terahertz) 통신, 광 무선 기술(optical wireless technology), FSO 백홀 네트워크, 대규모 MIMO 기술, 블록 체인, 3D 네트워킹, 양자 커뮤니케이션, 무인 항공기, 셀-프리 통신(cell-free communication), 무선 정보 및 에너지 전송(wireless information and energy transfer, WIET), 센싱과 커뮤니케이션의 통합, 액세스 백홀 네트워크의 통합, 홀로그램 빔포밍, 빅 데이터 분석, LIS(large intelligent surface) 등의 기술들이 채택될 수 있다.
예를 들어, THz 통신은, 도 6과 같은 0.03mm-3mm 범위의 해당 파장을 가진 0.1THz 및 10THz 사이의 주파수 대역의 스펙트럼을 이용하는 통신으로서, 도 7과 같은 구조의 회로 소자들을 이용하여 구현될 수 있다. 또한, 광 무선 기술은 광소자를 이용하여 THz 신호를 발생 및 변조하는 기술로서, 도 8, 도 9, 도 10, 도 11과 같은 구조의 장치에 기반하여 구현될 수 있다.
또한, 인공지능은 신경망, 기계학습(machine model) 등 다양한 모델에 기반하여 구현될 수 있다. 예를 들어, 신경망 구조의 인공지능 모델은 도 12과 같은 퍼셉트론의 구조에 기반할 수 있다. 도 12을 참고하면, 인공 신경망은 여러 개의 퍼셉트론들로 구성될 수 있다. 퍼셉트론의 구조에 따라, 입력 벡터 x={x1, x2,
Figure PCTKR2023008888-appb-img-000001
, xd}가 입력되면, 각 성분에 가중치 {W1, W2,
Figure PCTKR2023008888-appb-img-000002
, Wd}가 곱해지고, 그 결과가 모두 합산된 후, 활성함수 σ(·)가 적용된다. 거대한 인공 신경망 구조는 도 12에 도시한 단순화된 퍼셉트론 구조를 확장하면, 입력벡터는 서로 다른 다 차원의 퍼셉트론에 적용될 수 있다. 퍼셉트론들이 적층되면, 도 13와 같은 입력층, 은닉층, 출력층을 가지는 신경망이 구성될 수 있다.
본 개시의 구체적인 실시예
무선 통신에서 데이터 사용량이 급증함에 따라, 단말의 통신 전력 소모가 증가하고 있다. 현재 통신 시스템에서는, DRX(discontinuous reception) 기법을 활용하여, 데이터 전송이 없는 구간에서, 단말이 PDCCH(physical downlink control channel)를 모니터링하는 시간을 줄일 수 있다. 하지만 단말의 상태 및 사용 환경에 따라 DRX와 관련된 최적의 파라미터 값은 달라 질 수 있다. 따라서, 기지국이 단말의 상태 및 사용 환경을 실시간으로 파악하고 DRX에 관련된 최적의 파라미터 값을 변경하는 경우, 시그널링 오버헤드(signaling overhead) 및 전력 소모가 증가할 수 있다. 이러한 한계를 극복하기 위해서, 단말은 단말의 상태 및 사용 환경에 따라 능동적으로 DRX에 관련된 파라미터 값을 최적화할 수 있다. 최적화 과정은 인공지능을 기반으로 구현될 수 있다. 이러한 최적화를 통해 통신 지연(latency) 및 시그널링 오버헤드를 증가시키지 않고, 단말의 전력 절약 효과가 증가될 수 있다.
기존 통신의 DRX 기법에서, 단말은 기지국에서 보낸 데이터를 수신하기 위하여, 지속적으로 제어 신호에 대해 모니터링을 수행해야 한다. 즉, 단말은 유휴 모드(idle mode)에서는 페이징(paging) 메시지를 모니터링 하고, 연결 모드(connected mode)에서는 PDCCH를 모니터링 해야 한다. 데이터 전송이 없는 구간에서 제어 신호를 모니터링하는 전력 소모를 줄이기 위해, 단말은 기지국의 설정에 따라 도 14와 같이 DRX 사이클을 결정할 수 있다. DRX 사이클은 On-duration 구간과 그 뒤에 비활성 상태 가능성이 있는 구간인 Opportunity for DRX 구간이 반복하는 사이클이다. 단말은 실제 제어신호를 모니터링하는 활성화 상태와 제어신호를 모니터링을 하지 않은 슬립 상태를 조절함으로써 전력 소모를 효율적으로 줄일 수 있다. 먼저 단말은 On-duration 구간내에서, PDCCH를 디코딩하기 위해 모니터링을 수행한다. 단말이 On-duration구간 동안 PDCCH를 성공적으로 디코딩하지 못했다면, Opportunity for DRX 구간에서는 PDCCH를 디코딩하기 위해 모니터링을 수행하지 않는다. 반면에, 도 15와 같이 On-duration 구간동안 단말이 PDCCH를 성공적으로 디코딩하면, 단말은 데이터 채널인 PDSCH를 수신하고, 비활성화 타이머(inactivity timer)가 활성화된다. 단말은 비활성화 타이머가 만료되기 전까지는 PDCCH 모니터링을 계속 수행한다. 즉, 비활성화 타이머가 만료되기 전까지는 단말은 Opportunity for DRX 구간에서도 PDCCH 모니터링을 계속 수행할 수 있다. 이를 통해 단말은 데이터가 연속적으로 전송될 때, DRX 설정으로 인해서 발생하는 통신 지연을 감소시킬 수 있다.
도 16은 본 개시의 일 실시예에 따라 DRX 파라미터 값들을 설정하는 절차의 예를 도시한다. S1601 단계에서, 단말(1610)과 기지국(1620)은 RRC 재설정 절차를 수행할 수 있다. 기지국(1620)은 RRC 재설정(RRC reconfiguration) 메시지를 단말(1610)에게 전송하고, 단말(1610)은 기지국(1620)으로 RRC 재설정 완료(RRC reconfiguration complete) 메시지를 전송함으로써, RRC 재설정 절차가 완료된다. RRC 재설정 메시지에는 DRX 관련 파라미터 값이 포함될 수 있다. 따라서 기지국은 RRC 재설정 절차를 이용하여 DRX의 on/off 설정 등 DRX와 관련된 파라미터 값들을 설정할 수 있다.
S1603 단계에서, 단말(1610)은 UE 지원 정보(UE assistance information, UAI)를 전송할 수 있다. UE 지원 정보는 단말(1610)이 선호하는 DRX 파라미터 값을 포함할 수 있다. DRX 파라미터 값은 선호 DRX 비활성화 타이머, 선호 DRX 롱 사이클, 선호 DRX 숏 사이클 등 중 적어도 하나를 포함할 수 있다.
도 17은 본 개시의 일 실시예에 따라 DRX와 관련된 파라미터 값들을 설정하는 절차의 다른 예를 도시한다. S1701 단계에서, 단말(1710)은 기지국(1720)으로 UE 지원 정보를 전송할 수 있다. 단말은(1710)은 선호하는 DRX 파라미터 값들을 가지고 있거나 변경된 경우에 기지국(1720)으로 UE 지원 정보를 전송할 수 있다.
S1703 단계에서, 기지국(1720)은 단말(1710)로 RRC 재설정 메시지를 전송한다. 기지국(1720)은 단말(1720)이 선호하는 DRX 파라미터 값들을 기반으로 새로운 DRX 파라미터 값을 결정하고, RRC 재설정 메시지를 통해 단말(1720)로 전달할 수 있다.
S1705 단계에서, 단말(1710)은 기지국(1720)으로 RRC 재설정 완료 메시지를 전송한다. 단말(1710)은 기지국(1720)으로부터 수신한 새로운 DRX 파라미터 값으로 변경을 하고 RRC 재설정 완료 메시지를 통해, RRC 재설정이 성공적으로 수행되었음을 알릴 수 있다.
도 16과 도 17을 참고하면, DRX 파라미터 변경 절차는 기지국 또는 단말에 의해서 시작될 수 있다. 따라서 하기에서 기술할 단말이 인공지능을 이용하여 각 파라미터 값들을 최적화하는 절차는 기지국이 인공지능을 이용하여 각 파라미터 값들을 최적화하는 절차에도 이용될 수 있다.
단말의 상태 및 사용 환경에 따라 최적의 DRX 파라미터 값들은 달라 질 수 있다. 도 18은 단말이 사용하는 서비스에 따라, 단말의 전력 소모에 관련한 시간 분포와 파워 분포의 예를 도시한다. 단말이 도 18에서 단말이 사용하는 주요 서비스는 스트리밍(streaming), 메시징(Messaging) 웹 브라우징(web browsing) 3가지로 분류하였으며, 모두 동일한 DRX 파라미터 값을 사용한 결과를 나타낸다. 도 18의 윗부분은 단말의 상태의 시간분포를 나타내고 아랫부분은 파워 분포를 나타낸다. Active Data는 수신 상태를 의미하고 Active: PDCCH-only는 데이터 수신 후 비활성화 타이머가 트리거 되고 만료되기 전 PDCCH만 모니터링 하는 상태를 의미하고, CDRX는 데이터 수신이 없어 비활성화 타이머가 트리거 되지 않는 DRX 사이클을 의미한다. 도 18을 참고하면 단말은 3가지 서비스 모두 Active: PDCCH only 상태에서 많은 전력을 소모하고 있고, 서비스 별로 비중은 다르게 나타난다. 따라서 단말은 단말의 상태 및 사용환경을 기반으로 최적화된 DRX 파라미터 값을 설정하고, QoS(quality of service)가 심각하게 훼손되지 않는 조건하에서 데이터 없는 구간의 PDCCH 모니터링을 최소화할 필요가 있다. 그러나 기지국에서 모든 정보를 실시간으로 파악하고 DRX 파라미터 값을 변경하기 위해서는 시그널링 오버헤드 및 전력 소모가 증가될 수밖에 없다. 따라서, 인공지능 알고리즘으로 단말의 상태 및 사용환경에 따라 적응적(adaptively)으로 DRX 파라미터 값을 최적화함으로써 이러한 한계를 극복하는 방법이 고려될 수 있다.
도 19는 본 개시의 일 실시예에 따라 단말과 기지국이 적응적으로 각 DRX 파라미터 값 및 단말의 대역폭을 변경하는 개념도를 도시한다.
도 19를 참고하면, 기지국과 단말은 상황(context)을 인지하고, 이를 바탕으로 적응적으로 CDRX(connected mode DRX) 파라미터 값 또는 단말의 대역폭을 변경함으로써, PDCCH 모니터링에 대한 전력 절약 이득을 증가시키되, 평균 지연의 증가는 최소화할 수 있다. 기지국과 단말은 각각 데이터 송수신에 영향을 줄 수 있는 상황 정보들을 추출하여 인공지능 모델의 입력으로 전달한다. 단말은 인공지능 모델을 활용함으로써 상황 정보들을 기반으로 최적의 CDRX 파라미터 값이나 대역폭을 결정할 수 있다. 기지국에서 추출할 수 있는 상황 정보는 스케줄링이 적용되기 전 트래픽 패턴 또는 기지국의 로드 밸런스를 위해 사용되는 지표 값 등 중 적어도 하나를 포함할 수 있다. 트래픽 패턴으로 사용되는 값들은 트래픽 볼륨, 피크 트래픽, 평균 트래픽, 트래픽 분포, 트래픽 종류, 패킷 간 도착시간 간격, 세션 지속 시간 등 중 적어도 하나를 포함할 수 있다. 단말에서 추출할 수 있는 상황 정보는 현재의 링크 퀄리티(link quality)나 사용자의 패턴, 사용 서비스의 QoS 등 중 적어도 하나를 포함할 수 있다. 기지국 및 단말이 추출한 상황 정보를 이용하여, 인공지능 모델은 최적의 CDRX 파라미터 값 및 BWP(bandwidth part)를 위한 대역폭을 결정한다. 인공지능 모델이 결정한 파라미터 값 및 대역폭을 기반으로 기지국 및 단말은 통신환경을 재설정한다. 이러한 절차를 이용하면 단말과 기지국은 상황 정보 및 통신 환경을 고려함으로써, 최적화된 DRX 파라미터 값을 설정할 수 있다.
도 20은 본 개시의 일 실시예에 따라 상황 정보를 기반으로 단말이 전력을 절약하는 절차의 일 예를 도시한다. 도 20을 참고하면 단말은 인공지능을 활용함으로써, 상황 정보를 기반으로 적응적으로 전력 절약을 위한 파라미터 값들을 재설정 할 수 있다.
S2001 단계에서, 단말은 상황(context) 정보를 획득한다. 상황 정보는 단말의 상황 정보 및 기지국의 상황 정보 중 적어도 하나를 포함할 수 있다. 상술한 바와 같이 기지국에서 추출할 수 있는 상황 정보는 스케줄링이 적용되기 전 트래픽 패턴 또는 기지국의 로드 밸런스를 위해 사용되는 지표 값 등 중 적어도 하나를 포함할 수 있다. 단말에서 추출할 수 있는 상황 정보는 현재의 링크 퀄리티(link quality)나 사용자의 패턴, 사용 서비스의 QoS 등 중 적어도 하나를 포함할 수 있다.
단말은 단말의 상황 정보는 측정을 통해 직접 획득하고, 기지국의 상황 정보는 기지국이 측정한 정보를 수신함으로써 획득한다. 단말은 상황 정보를 주기적으로 획득할 수도 있고, 후술할 특정 이벤트가 발생하는 경우에 상황 정보를 획득할 수도 있다. 기지국의 상황 정보를 획득하기 위해서, 단말은 기지국에게 상황 정보를 요청하는 메시지를 전송할 수 있다. 이를 위해, 단말은 RRC 재설정 요청 메시지를 통해 기지국에게 상황 정보를 요청할 수 있다.
S2003 단계에서, 단말은 상황정보를 기반으로 기지국으로 선호 파라미터 값을 전송한다. 단말은 상황 정보 및 인공지능 모델을 기반으로 선호 파라미터 값을 결정할 수 있다. 단말이 결정하는 파라미터 값은 단말이 선호하는 DRX 파라미터 값 또는 BWP의 대역폭 중 적어도 하나를 포함할 수 있다. 단말은 기 학습한 인공지능 모델의 추론을 통해 파라미터 값을 결정하거나, 실시간으로 학습이 계속되는 인공지능을 활용할 수도 있다. 이 때, 인공지능 모델은 QoS는 유지되고 DRX로 설정으로 인한 전력 절약 이득이 가장 높은 파라미터 값을 가지도록 학습될 수 있다.
S2005 단계에서, 단말은 기지국으로부터 RRC 재설정 메시지를 수신한다. 기지국은 단말이 전송한 선호 파라미터 값을 기반으로, 단말과 기지국 사이의 통신에 사용될 새로운 파라미터 값을 결정하고 단말로 전송한다. 단말은 결정된 새로운 파라미터 값을 기지국으로부터 RRC 재설정 메시지를 통해 수신할 수 있다.
S2007 단계에서, 단말은 기지국으로 RRC 재설정 완료 메시지를 전송한다. 단말은 기지국으로부터 수신한 RRC 재설정 메시지를 기반으로 새로운 파라미터 값으로 통신 설정을 하고, RRC 재설정 완료 메시지를 전송한다. 따라서 단말의 DRX 사이클, DRX 비활성화 타이머, DRX on-duration 기간, BWP의 대역폭 중 적어도 하나가 변경될 수 있다.
S2009 단계에서, 단말은 기지국으로부터 데이터를 수신한다. 새로운 DRX 파라미터 값을 기반으로 on-duration기간 또는 비활성화 타이머가 만료되기 전에 PDCCH을 모니터링하고 성공적으로 디코딩할 수 있다. 단말은 디코딩한 PDCCH를 기반으로 PDSCH의 데이터를 수신할 수 있다.
도 21은 본 개시의 일 실시예에 따라 상황 정보를 기반으로 기지국이 전력을 절약하는 절차의 일 예를 도시한다. 도 21을 참고하면, 기지국은 기지국의 상황 정보를 단말로 전송함으로써, 단말이 최적화된 파라미터 값을 찾도록 보조할 수 있다.
S2101 단계에서, 기지국은 기지국의 상황 정보를 단말로 전송한다. 기지국은 상황 정보를 주기적으로 단말에 전송할 수 있고, 후술할 특정 이벤트가 발생하는 경우에 상황 정보를 단말에 전송할 수 있다. 기지국의 상황 정보는 로드 밸런스를 위해 사용되는 지표 값, 트래픽 패턴 등 중 적어도 하나를 포함할 수 있다.
S2103 단계에서, 기지국은 단말로부터 선호 파라미터 값을 수신한다. 단말은 상황 정보들을 기반으로 인공지능 모델을 활용함으로써, 최적의 파라미터 값을 결정하고 기지국으로 선호 파라미터 값을 전송한다. 선호 파라미터 값은 DRX 파라미터 값 또는 BWP의 대역폭 중 적어도 하나를 포함할 수 있다.
S2105 단계에서, 기지국은 단말에게 RRC 재설정 메시지를 전송한다. 기지국은 수신한 선호 파라미터 값을 기반으로 통신에 사용될 새로운 파라미터 값을 결정한다. 기지국은 새로운 파라미터 값은 단말이 전송한 파라미터 값을 그대로 사용할 수 있고, 통신 환경을 고려하여 다른 최적의 파라미터 값을 사용할 수 있다. 새로운 파라미터 값은 새로운 DRX 파라미터 값 또는 새로운 BWP 대역폭 중 적어도 하나를 포함할 수 있다. 기지국은 결정된 새로운 파라미터 값을 RRC 재설정 메시지를 통해 전달된다.
S2107 단계에서, 단말로부터 RRC 재설정 완료 메시지를 수신한다. 단말은 수신한 RRC 재설정 메시지를 기반으로 통신 환경을 설정한다. 따라서 새로운 DRX 파라미터 값을 기반으로 사이클 길이, on-duration 기간 등이 새로 적용될 수 있다. 설정을 완료한 단말은 기지국으로 RRC 재설정 완료 메시지를 전송하고, 기지국은 RRC 재설정 완료 메시지를 수신함으로써 새로운 파라미터 값을 적용한 통신을 시작할 수 있다.
S2109 단계에서, 기지국은 새로운 파라미터 값을 기반으로 단말에게 데이터를 전송한다. 기지국은 데이터를 새로운 파라미터 값을 기반으로 전송할 새로운 BWP 대역폭 등을 설정할 수 있다.
도 22는 본 개시의 일 실시예에 따라 단말(2210)이 기지국(2220)의 상황정보를 획득하는 절차의 신호 흐름도를 도시한다. 도 22를 참고하면, 기지국(2220)은 통신 환경의 변화로 인하여 DRX 파라미터 및 BWP 재설정이 필요한 경우에 상황 정보를 단말(2210)로 전달할 수 있다.
S2201 단계에서, 단말(2210) 및 기지국(2220)은 통신 환경 변화를 감지한다. 단말(2210)은 DRX의 사이클 중에 데이터 수신 후 비활성화 타이머가 트리거 되고 만료되기 전 PDCCH만 모니터링 하는 상태(이하 PDCCH-only)의 시간 분포 값이 임계 값 이상인 경우, QoS가 유지가 안되는 경우 또는 사용자의 패턴이 급속히 변경됨을 인식한 경우 등 중 적어도 하나의 이벤트를 인식함으로써 통신 환경 변화를 감지한다. 기지국(2220)은 로드 밸런스 조정이 필요한 경우, 타 사용자의 긴급한 요청이 있는 경우 또는 전송 트래픽이 변경된 경우 중 적어도 하나의 이벤트를 인식함으로써 통신 환경 변화를 감지한다.
S2203 단계에서, 통신 환경 변화를 감지한 기기는 RRC 재설정 요청 메시지를 전송한다. S2203 단계에서, 환경 변화를 인식한 단말(2210)은 새로운 DRX 파라미터 값 등을 설정하기 위해서, 기지국(2220)에게 상황 정보 측정 요청 메시지를 전송할 수 있다. 기지국(2220)이 환경 변화를 인식한 경우에는 기지국(2220)은 단말(2210)에게 상황 정보 측정 요청 메시지를 전송할 수 있다. 이때 단말(2210) 및 기지국(2220)은 RRC 재설정 요청 메시지를 전송함으로써, 상황 정보 측정 요청과 함께 통신 환경 재설정 요청을 할 수 있다.
S2205 단계에서, 단말(2210)은 단말(2210)의 상황 정보를 측정한다. 단말(2210)은 RRC 재설정 요청 메시지를 전송하거나 수신한 후, 단말(2210)의 상황 정보를 측정할 수 있다. 단말(2210)에서 측정할 수 있는 상황 정보는 현재의 링크 퀄리티(link quality)나 사용자의 패턴, 사용 서비스의 QoS 등 중 적어도 하나를 포함할 수 있다.
S2207 단계에서, 기지국(2220)은 기지국(2220)의 상황 정보를 측정한다. 기지국(2220)은 RRC 재설정 요청 메시지를 전송하거나 수신한 후, 기지국(2220)의 상황 정보를 측정할 수 있다.
기지국(2220)에서 추출할 수 있는 상황 정보는 스케줄링이 적용되기 전 트래픽 패턴 또는 기지국의 로드 밸런스를 위해 사용되는 지표 값 등 중 적어도 하나를 포함할 수 있다. 트래픽 패턴으로 사용되는 값들은 트래픽 볼륨, 피크 트래픽, 평균 트래픽, 트래픽 분포, 트래픽 종류, 패킷 간 도착시간 간격, 세션 지속 시간 등 중 적어도 하나를 포함할 수 있다.
S2209 단계에서, 기지국(2220)은 기지국(2220)의 상황정보를 단말(2210)로 전송한다. 일 예로, 기지국(2220)이 단말(2210)로 상술한 상황 정보 자체를 전달할 수 있다. 기지국(2220)은 상황 정보 전송을 위한 다운링크 자원을 할당하고, 해당 자원에 상황 정보를 포함하여 단말(2210)로 전송할 수 있다. 즉, 기지국(2220)은 상황 정보 자체를 할당된 자원을 통해 단말(2210)로 전송할 수 있다. 또 다른 일 예로, 기지국(2220)은 기 설정된 값에 기초하여 상황 정보를 단말(2210)로 지시할 수 있다. 여기서, 상황 정보 지시 정보는 RRC 시그널링으로 상술한 RRC 재설정 요청 메시지에 포함될 수 있다. 단말(2210)은 상황 정보 지시자를 포함하는 RRC 재설정 요청 메시지를 기지국으로부터 수신하고, 해당 지시자에 대응되는 기지국의 상황 정보를 인지하여 적용할 수 있다. 또 다른 일 예로, 기지국(2220)은 다른 RRC 시그널링, MAC CE 및 DCI 중 적어도 어느 하나를 통해 상황 정보를 지시할 수 있다. 즉, 상황 정보 지시자에 대응되는 단말(2210)과 기지국(2220)에 기 설정될 수 있으며, 상황 정보 지시자 값을 통해 상황 정보를 인지할 수 있다.
만약 기지국(2220)이 상황 정보를 기반으로 인공지능 모델을 활용하는 경우에는 단말(2210)이 기지국(2220)으로 기지국(2220)의 상황 정보를 전송할 수 있다.
도 23는 본 개시의 일 실시예에 따라 단말(2310) 및 기지국(2320)이 상황 정보를 기반으로 RRC 재설정하는 절차의 신호 흐름도를 도시한다.
S2301 단계에서, 단말(2310)은 수신한 기지국(2320)의 상황 정보 및 자신의 상황 정보 중 적어도 하나를 인공지능 모델에 입력함으로써 최적의 파라미터 값을 찾을 수 있다. 도 23은 단말(2310)이 인공지능 모델을 활용하는 것을 기반으로 설명하였으나, 기지국(2320)이 인공지능 모델을 활용함으로써, 최적의 파라미터 값을 찾는 것도 가능하다. 이 경우에는 상술한 바와 같이 기지국(2320)이 단말(2310)로부터 단말(2310)의 상황 정보를 수신해야 한다.
S2303 단계에서, 단말(2310)은 인공지능 모델에서 추론한 파라미터 값을 기반으로 UE 지원 정보(UE Assistance Information, UAI) 메시지를 기지국(2320)으로 전송한다. UE 지원 정보는 선호 DRX 파라미터 값들 또는 BWP 관련 파라미터 값들을 포함할 수 있다.
S2305 단계에서, 기지국(2320)은 단말(2310)에게 RRC 재설정 메시지를 전송한다. 기지국(2320)은 수신한 UE 지원 정보를 기반으로 DRX 파라미터 값을 결정한다. 기지국(2320)은 DRX 파라미터 값이 변경이 필요하다고 판단하면, 단말(2310)에게 RRC 재설정 메시지를 전송한다.
S2307 단계에서, 단말(2310)은 기지국(2320)에게 RRC 재설정 완료 메시지를 전송한다. 단말(2310)은 수신한 RRC 재설정 메시지를 기반으로 새로운 DRX 파라미터를 설정할 수 있다.
상술한 바와 같이 단말 및 기지국은 인공지능 모델을 활용하여 상황 정보를 기반으로 최적의 DRX 파라미터 및 BWP의 대역폭 값을 설정할 수 있다. 단말은 새로운 DRX 파라미터를 설정하고 QoS 유지 여부 및 DRX 파워 절약 이득 값을 기반으로 새로운 DRX 파라미터 값에 대한 성능 평가를 기반으로 보상(reward)를 결정할 수 있다. 단말은 강화 학습이나 Contextual MAB 기법을 사용함으로써, 보상을 통해 인공지능 모델을 학습할 수 있다. 보상을 결정하는 기준은 하기 [수학식 1]과 같을 수 있다.
Figure PCTKR2023008888-appb-img-000003
[수학식 1]에서, R은 보상을 의미하고,
Figure PCTKR2023008888-appb-img-000004
는 새 DRX 파라미터 값이 적용된 PDCCH-only 구간의 분포 값을 의미하고,
Figure PCTKR2023008888-appb-img-000005
는 이전 DRX 파라미터가 값이 적용된 PDCCH-only 구간의 분포 값을 의미하고,
Figure PCTKR2023008888-appb-img-000006
는 리워드를 보상해줄 최소한의 분포 임계(threshold) 값을 의미한다.
새로운 DRX 파라미터 값이 적용된 결과, 지연 시간이 증가됨으로써, QoS가 악화되면 단말은 보상을 0으로 결정한다. 반면에 QoS가 유지된다면 [수학식 1]에 의해서 단말은 보상을 결정할 수 있다. 이때 단말은 임계(threshold) 값을 설정함으로써, PDCCH만 모니터링 하는 시간이 일정한 수치 이상인 경우에만 보상을 1로 결정할 수 있다.
기지국은 단말이 학습하는 로컬 인공지능 모델들을 주기적으로 수신함으로써, 글로벌 모델을 수정할 수 있다. 단말도 또한 글로벌 모델을 기지국으로부터 수신할 수 있다. 단말은 기지국으로부터 수신한 글로벌 모델을 기반으로 단말에 맞춘 로컬 모델을 생성할 수 있다.
도 24는 본 개시의 일 실시예에 따라 단말(2410)은 인공지능 모델을 학습하고 기지국(2420)과 인공지능 모델을 교환하는 절차의 신호 흐름도를 도시한다. 도 24를 참고하면, 단말(2410)은 통신에 활용될 파라미터 값을 최적화하는 인공지능 모델을 학습할 수 있다.
S2401 단계에서, 단말(2410) 및 기지국(2420)은 상황 정보 기반으로 파라미터 값을 변경한다. 특정 이벤트가 일어나 파라미터 값을 재설정해야 하는 경우, 단말(2410) 및 기지국(2420)은 도 23에 도시된 절차를 이용하여 DRX 파라미터 및 BWP의 대역폭을 최적화할 수 있다.
S2403 단계에서, 단말(2410)은 인공지능 모델의 성능을 평가하고, 인공지능 모델을 학습한다. 단말(2410)은 인공지능 모델의 성능을 평가하기 위해 상술한 [수학식 1]을 기반으로 보상을 결정할 수 있다. 이 때, 인공지능 학습은 머신 러닝 또는 딥 러닝 등 적어도 하나로 수행될 수 있다.
S2405 단계 및 S2407 단계에서, 단말(2410)은 S2401 단계 및 S2403 단계를 반복적으로 수행한다. 통신 환경에 따라 DRX 파라미터 및 BWP의 대역폭을 변경해야 하는 경우 단말(2410)은 상황정보를 기반으로 파라미터 값들을 변경하고, 인공지능 모델을 평가하고 학습을 시킬 수 있다. 이러한 학습이 반복적으로 이루어진 결과 단말(2410)의 로컬 인공지능 모델의 성능이 향상될 수 있다.
S2409 단계에서, 단말(2410)은 로컬 인공지능 모델을 기지국(2420)으로 전송한다. 기지국(2420)은 단말(2410)이 특정 주기마다 로컬 인공지능 모델을 전송하도록 설정할 수 있다. 또한 기지국(2420)은 로컬 인공지능 모델 요청 신호를 단말(2410)에게 전송함으로써, 로컬 인공지능 모델을 수신할 수 있다.
S2411 단계에서, 단말(2410)은 기지국(2420)로부터 글로벌 인공지능 모델을 수신한다. 기지국(2420)은 단말(2410) 뿐만 아니라 다른 단말로부터 각각 로컬 인공지능 모델을 수신할 수 있고, 수신한 로컬 인공지능 모델을 종합하여 글로벌 인공지능 모델을 결정할 수 있다.
도 25는 본 개시의 일 실시예에 따라 기지국(2520)은 연합학습을 이용하여 각 단말들(2510#1 내지 2510#u)로부터 수신한 로컬 모델을 통해 글로벌 모델을 결정하는 방법을 도시한다.
기지국(2520)은 각 단말들(2510#1 내지 2510#u)로부터 로컬 모델들(w1 내지 wu)을 수신하고 수신한 로컬 모델을 기반으로 글로벌 모델(wBS)을 결정할 수 있다. 기지국(2520)은 글로벌 모델은 도 25와 같이 로컬 모델들(w1 내지 wu)을 평균함으로써 결정할 수 있다. 도 25는 산술 평균만을 도시하였으나, 기지국(2520)은 가중 평균, 기하 평균, 조화평균 등 중 적어도 하나를 이용할 수도 있다. 기지국(2520)과 각 단말들(2510#1 내지 2510#u)은 무선상의 신호 중첩을 이용하는 over-the-air computation을 이용하여 무선상으로 글로벌 모델을 계산할 수도 있다.
각 단말들(2510#1 내지 2510#u) 필요시 글로벌 모델을 기지국(2520)으로부터 수신함으로써, 자신의 통신 환경에 맞춘 전이학습을 수행할 수 있다.
인공 지능 모델의 입력과 출력은 사용패턴에 맞추어 설정될 수 있다. 도 24는 본 개시의 일 실시예로 인공지능 모델의 개념도를 도시한다. 인공지능 모델의 입력은 기지국의 트래픽 패턴, 로드 밸런스를 위한 지표 값, 단말의 링크 퀄리티 또는 사용자의 패턴 사용 서비스의 QoS 등 중 적어도 하나를 포함할 수 있다. 도 24는 입력을 5개의 요소로 도시하였으나, 입력의 개수는 4개 이하가 될 수도 있다. 또한 트래픽 패턴, 로드 밸런스를 위한 지표 값, 및 사용자 패턴을 지시하는 값들은 다양하므로 입력의 요소는 6개 이상 일수도 있다. 인공지능 모델의 출력은 DRX 파라미터 값 또는 BWP의 대역폭을 포함할 수 있다. 출력의 개수도 입력의 개수처럼 다양하게 설계될 수 있다. 단말은 측정된 상황정보를 인공지능 모델에 입력함으로써, 최적의 DRX 제어 값 등을 예측할 수 있다.
일 예로, 인공지능 학습 관여자는 도 26의 인공지능 모델을 지도 학습을 통해 학습시킬 수 있다. 지도 학습의 경우 학습 관여자가 문제에 대한 답을 알고 있고, 인공지능이 그것을 알아낼 수 있도록 훈련하는 학습 방법이다. 지도학습을 이용하는 경우에는 기지국과 단말의 상황정보를 데이터로 간주될 수 있다. 학습 관여자는 해당 상황 정보에 해당하는 최적의 단말 제어 값들을 레이블링(labeling)하는 과정이 필요하다. 따라서 각 상황마다 학습 관여자는 단말의 최적의 제어 값을 찾는 노력이 별도로 필요하게 된다. 도 26에서
Figure PCTKR2023008888-appb-img-000007
는 연합학습을 통해서 기지국은 글로벌 모델을 업데이트 되는 것을 나타낸다. 기지국은 도 25를 통해 상술한 방법을 이용하여 글로벌 모델을 업데이트를 할 수 있다.
지도 학습은 적은 연산량을 통해서 최적의 출력 값을 추론할 수 있게 해준다. 따라서 지도 학습 모델은 단말로 구현하기가 비교적 쉽다. 하지만 학습을 시키기 위한 데이터 레이블링 과정이 필요하기 때문에, 지도학습 방법은 학습 관여자에게 많은 부담을 줄 수 있다. 상황 정보의 종류가 많을수록 지도 학습에 필요한 레이블링이 기하 급수적으로 늘어날 수 있다. 또한 학습한 데이터가 실제 환경에 맞지 않거나 환경의 변화가 일어 나는 경우, 인공지능 모델의 최적화를 위해 재학습이 요구될 수 있다. 이 경우, 재학습을 위해 새로운 레이블링 과정이 필요 될 수 있다.
따라서 환경 변화에 유동적으로 대응할 수 있는 인공지능 학습 모델이 제안될 수 있다. 일 예로 강화 학습(reinforcement learning) 및 MAB(muti-armed bandit) 인공지능 모델이 이용될 수 있다. 강화 학습 및 MAB 인공지능 모델을 이용하면, 환경 변화에 따라 실시간 학습이 가능한 인공지능 모델이 구현될 수 있다. 따라서 지도 학습에서 요구되는 레이블링의 부담이 감소한다. 강화 학습은 예측과 동시에 학습을 진행하기 때문에 지도 학습보다 예측 관점에서는 연산량이 많을 수 있다.
도 27은 본 개시의 일 실시예에 따라 강화 학습 인공지능 모델을 학습하는 과정을 도시한다. 에이전트(2710)는 환경(2730)으로부터 추출한 상태를 기반으로 최적의 행동(action)을 예측한다. 현재 상태에서 에이전트(2710)가 한 행동에 대한 평가(reward)를 통해서 인공지능 모델이 재 학습된다. 상태 정보는 환경(2730)으로 부터 추출한 인자로 기지국과 단말에서 측정한 상황정보를 포함할 수 있다. 또한 상태 정보는 상황정보를 추출했을 때의 DRX 제어 값이나, BWP 제어 값들이 포함할 수 있다. 즉 강화 학습에서는 행동도 상태를 변화시키는 인자가 될 수 있다. 따라서 상태는 하기 [수학식 2]와 같이 표현될 수 있다.
Figure PCTKR2023008888-appb-img-000008
[수학식 2]에서
Figure PCTKR2023008888-appb-img-000009
는 t번째 상태를 의미하고,
Figure PCTKR2023008888-appb-img-000010
는 기지국의 상황정보를 의미하고,
Figure PCTKR2023008888-appb-img-000011
는 단말의 상황정보를 의미하고,
Figure PCTKR2023008888-appb-img-000012
는 현재 DRX 제어 값들을 의미하고,
Figure PCTKR2023008888-appb-img-000013
는 현재 BWP의 제어 값들을 의미한다.
행동은 DRX 제어 값 및 BWP 제어 값으로 구성될 수 있다. 다른 일 예로 행동을 DRX 제어 값 및 BWP 제어 값을 지시하는 코드북의 인덱스로 구성될 수도 있다. 코드북을 이용하는 경우에도 최종적으로는 DRX 와 BWP의 설정 값이 적용되게 된다. 다른 일 예로 DRX만 제어하는 경우에는 학습 관여자는 BWP 관련한 제어 값은 제거하고 DRX 제어 값만 가지고 학습할 수 있다.
에이전트(2710)가 하는 행동은 하기 [수학식 3]와 같이 표현될 수 있다.
Figure PCTKR2023008888-appb-img-000014
[수학식 3]에서
Figure PCTKR2023008888-appb-img-000015
는 t번째 행동을 의미하고,
Figure PCTKR2023008888-appb-img-000016
는 t번째 DRX 제어 값을 의미하고,
Figure PCTKR2023008888-appb-img-000017
는 t번째 BWP 제어 값을 의미한다.
학습 관여자는 통신 지연이 증가됨으로써 QoS에 악영향을 준다면 보상(reward)를 0으로 설정할 수 있다. 학습 관여자는 QoS에 영향을 주지 않는 경우에는 에너지 효율에 기반하여 보상을 부여할 수 있다. 일 예로 보상은 새 DRX 제어 값이 설정된 PDCCH-only의 분포 값과 이전 DRX 제어 값이 설정된 PDCCH-only 분포 값을 비교해서 결정될 수 있다. 학습 관여자는 새 DRX 제어 값이 설정된 PDCCH-only 분포 값이 이전보다 적어진다면, 통신 에너지 효율이 올라 간 것으로 판단할 수 있다. 따라서 보상은 하기 [수학식 4]와 같이 표현될 수 있다.
Figure PCTKR2023008888-appb-img-000018
Figure PCTKR2023008888-appb-img-000019
[수학식 4]에서
Figure PCTKR2023008888-appb-img-000020
는 새 DRX 제어 값이 적용된 PDCCH-only의 분포 값을 의미하고,
Figure PCTKR2023008888-appb-img-000021
는 이전 DRX 제어 값이 적용된 PDCCH-only의 분포 값을 의미하고, R은 보상을 의미하고,
Figure PCTKR2023008888-appb-img-000022
는 새 DRX 제어 값이 적용된 QoS를 의미하고,
Figure PCTKR2023008888-appb-img-000023
는 통신 서비스 품질을 위한 QoS 임계 값을 의미한다.
도 28은 본 개시의 일 실시예에 따라 MAB기반의 인공지능 모델을 학습하는 과정을 도시한다. 강화학습은 연산량이 비교적 높기 때문에 MAB 인공지능 모델이 사용될 수 있고, 상황정보가 변하기 때문에 Contextual MAB가 사용될 수 있다. MAB 인공지능 모델을 이용함으로써, 단말은 일반적인 강화 학습보다 가벼운 연산량으로 인공지능 모델을 구현할 수 있다. 따라서 MAB 인공지능 모델은 전력 소모가 중요한 Edge AI 분야에서 적합하다. 특히 Contextual MAB는 상황을 고려한 MAB로써, 급격한 환경변화에 대한 대응이 떨어지는 MAB를 개선한 인공지능 모델이다. 따라서, Contextual MAB는 강화 학습과 유사하게 행동과 보상으로 구성되므로, 강화학습에 사용한 값들을 그대로 사용될 수 있다. 반면에 강화학습의 상태 대신 상황정보(context)가 사용되며, 상황정보는 환경을 대표하는 값을 포함할 수 있다. 행동에 따라 환경이 변하는 강화 학습과는 달리 Contextual MAB는 행동에 따라 상황정보가 변하지 않고, 단지 환경 변화에 의해서만 상황정보가 변경될 수 있다.
따라서 상황정보
Figure PCTKR2023008888-appb-img-000024
는 강화 학습과는 달리 행동에 따라 변한 요소를 제거한 형태인 하기 [수학식 5]와 같이 표현될 수 있다.
Figure PCTKR2023008888-appb-img-000025
[수학식 5]에서,
Figure PCTKR2023008888-appb-img-000026
는 기지국의 상황정보를 의미하고,
Figure PCTKR2023008888-appb-img-000027
는 단말의 상황정보를 의미한다.
도 28은 Contextual MAB 중 LinUCB(linear upper confidence bound)을 사용한 방법을 도시하고 있다. LinUCB는 학습을 하는 능선 회귀분석(ridge regression)부분과, 실제로 주어진 상황에서 최적의 행동을 선택하는 정책(policy)부분을 포함할 수 있다. 인공지능 모델의 초기 값
Figure PCTKR2023008888-appb-img-000028
Figure PCTKR2023008888-appb-img-000029
는 하기 [수학식 6]과 같이 설정될 수 있다.
Figure PCTKR2023008888-appb-img-000030
Figure PCTKR2023008888-appb-img-000031
인공지능 모델의 능선 회귀분석 부분은 이전의 상황 값에 기반한 행동과 보상 값을 통해서 상황 벡터(context vextor)
Figure PCTKR2023008888-appb-img-000032
를 하기 [수학식 7]과 같이 추정할 수 있다.
Figure PCTKR2023008888-appb-img-000033
Figure PCTKR2023008888-appb-img-000034
Figure PCTKR2023008888-appb-img-000035
인공지능 모델은 이렇게 추정한 상황 벡터
Figure PCTKR2023008888-appb-img-000036
를 기반으로 현재의 상황에 따른 각 행동의 확률을 하기 [수학식 8]과 같이 구할 수 있다.
Figure PCTKR2023008888-appb-img-000037
[수학식 8]에서
Figure PCTKR2023008888-appb-img-000038
는 양수로서 탐색(exploration)을 결정하는 하이퍼 파라미터 값을 의미한다.
인공지능 모델의 정책 부분은 하기 [수학식 9] 와 같이 가장 큰 확률을 행동을 선택할 수 있다.
Figure PCTKR2023008888-appb-img-000039
[수학식 9]에서
Figure PCTKR2023008888-appb-img-000040
Figure PCTKR2023008888-appb-img-000041
값이 가장 크게 만드는 a값을 찾는 함수를 의미한다.
따라서 도 28을 참고하면, contextual MAB 알고리즘을 기반으로 가장 큰 확률을 가지는 행동을 선택함으로써, 단말은 각 제어 값들을 최적화할 수 있다. 도 27의 강화 학습과 다르게 행동의 변화 요소가 제거된 상황정보
Figure PCTKR2023008888-appb-img-000042
와 리워드인
Figure PCTKR2023008888-appb-img-000043
만 가지고 학습을 함으로써, 연산량을 줄일 수 있다.
상기 설명한 제안 방식들은 독립적으로 구현될 수도 있지만, 일부 제안 방식들의 조합 (또는 병합) 형태로 구현될 수도 있다. 상기 제안 방법들의 적용 여부 정보 (또는 상기 제안 방법들의 규칙들에 대한 정보)는 기지국이 단말에게 사전에 정의된 시그널 (예: 물리 계층 시그널 또는 상위 계층 시그널)을 통해서 알려주도록 규칙이 정의될 수 있다.
본 개시는 본 개시에서 서술하는 기술적 아이디어 및 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 개시의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 개시의 등가적 범위 내에서의 모든 변경은 본 개시의 범위에 포함된다. 또한, 특허청구범위에서 명시적인 인용 관계가 있지 않은 청구항들을 결합하여 실시예를 구성하거나 출원 후의 보정에 의해 새로운 청구항으로 포함할 수 있다.
본 개시의 실시예들은 다양한 무선접속 시스템에 적용될 수 있다. 다양한 무선접속 시스템들의 일례로서, 3GPP(3rd Generation Partnership Project) 또는 3GPP2 시스템 등이 있다.
본 개시의 실시예들은 상기 다양한 무선접속 시스템 뿐 아니라, 상기 다양한 무선접속 시스템을 응용한 모든 기술 분야에 적용될 수 있다. 나아가, 제안한 방법은 초고주파 대역을 이용하는 mmWave, THz 통신 시스템에도 적용될 수 있다.
추가적으로, 본 개시의 실시예들은 자유 주행 차량, 드론 등 다양한 애플리케이션에도 적용될 수 있다.

Claims (19)

  1. 무선 통신 시스템에서 단말의 동작 방법에 있어서,
    기지국과 RRC(radio resource control) 연결을 설정하는 단계;
    상황 정보를 획득하는 단계;
    상기 상황 정보를 기반으로 인공지능 모델에 의해 도출된 선호 파라미터 값을 상기 기지국에게 전송하는 단계;
    상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하는 단계;
    상기 기지국으로 RRC 재설정 완료 메시지를 수신하는 단계; 및
    상기 기지국으로부터 데이터를 수신하는 단계를 포함하되,
    상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함하는, 단말의 동작 방법.
  2. 제1 항에 있어서,
    상기 선호 파라미터 값은 BWP(bandwidth part)의 제어 값을 더 포함하는, 단말의 동작 방법.
  3. 제1 항에 있어서,
    상기 상황 정보는 단말의 상황정보 및 기지국의 상황정보를 포함하되, 상기 단말의 상황정보는 링크 퀄리티, 사용자의 패턴 또는 사용 서비스의 QoS(quality of service) 중 적어도 하나를 포함하고, 상기 기지국의 상황정보인 트래픽 패턴 지표 값 또는 로드 밸런스 지표 값 중 적어도 하나를 포함하는, 단말의 동작 방법.
  4. 제3 항에 있어서,
    상기 인공지능 모델은 강화 학습 모델 또는 MAB(muti-armed bandit) 모델 등 중 적어도 하나를 기반으로 학습된, 단말의 동작 방법.
  5. 제4 항에 있어서,
    상기 인공지능 모델은 상기 기지국으로부터 글로벌 인공지능 모델에 기초하여 수신되는 인공지능 모델이되,
    상기 인공지능 모델의 성능을 평가하는 단계;
    상기 인공지능 모델을 학습하는 단계;
    상기 인공지능 모델을 상기 기지국으로 전송하는 단계; 및
    상기 기지국으로부터 상기 단말 및 다른 단말들의 인공지능 모델을 기반으로 결정된 글로벌 인공지능 모델을 수신하는 단계를 더 포함하는 단말의 동작 방법.
  6. 제5 항에 있어서,
    상기 상황 정보를 획득하는 단계는,
    상기 단말은 단말의 통신 환경의 변화를 감지한 후 상기 기지국으로 RRC 재설정 요청 메시지를 전송하여 상기 기지국으로부터 상기 기지국의 상황 정보를 수신하고,
    측정을 통해 상기 단말의 상황 정보를 획득하는, 단말의 동작 방법.
  7. 제6 항에 있어서,
    상기 단말의 통신 환경의 변화는 DRX의 사이클 중에 PDCCH(physical downlink control channel)만 모니터링 하는 구간이 기 설정된 값 이상인 경우, QoS 값이 기 설정된 값보다 작은 경우, 또는 사용자 패턴이 변경된 경우 등 중 적어도 하나를 포함하는, 단말의 동작 방법.
  8. 제5 항에 있어서,
    상기 상황 정보를 획득하는 단계는,
    기지국의 통신 환경의 변화를 감지한 기지국으로부터 RRC 재설정 요청 메시지를 수신하고, 상기 단말의 상황 정보를 측정하고 및 상기 기지국으로부터 상기 기지국의 상황 정보를 수신하는, 단말의 동작 방법.
  9. 제8 항에 있어서,
    상기 기지국의 통신 환경의 변화는 기지국의 설정 값 변경, 다른 단말의 요청 및 전송 트래픽 변경 중 적어도 어느 하나에 기초하여 변경되는, 단말의 동작 방법.
  10. 무선 통신 시스템에서 기지국의 동작 방법에 있어서,
    단말과 RRC(radio resource control) 연결을 설정하는 단계;
    상기 단말로 기지국의 상황 정보를 전송하는 단계;
    상기 단말로부터 인공지능 모델에 의해 도출된 선호 파라미터 값을 수신하는 단계;
    상기 단말로 상기 선호 파라미터 값을 기반으로 RRC 재설정 메시지를 전송하는 단계;
    상기 단말로부터 RRC 재설정 완료 메시지를 수신하는 단계; 및
    상기 단말로 데이터를 전송하는 단계를 포함하되,
    상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함하는, 기지국의 동작 방법.
  11. 제10 항에 있어서,
    상기 기지국의 상황 정보는 트래픽 패턴 지표 값 또는 로드 밸런스 지표 값 중 적어도 하나를 포함하는, 기지국의 동작 방법.
  12. 제11 항에 있어서,
    상기 단말로 글로벌 인공지능 모델을 전송하는 단계;
    상기 단말로부터 학습된 인공지능 모델을 수신하는 단계;
    상기 학습된 인공지능 모델 및 다른 단말로부터 학습된 인공지능 모델을 기반으로 글로벌 인공지능 모델을 갱신하는 단계;
    상기 글로벌 인공지능 모델을 단말에게 전송하는 단계를 더 포함하는, 기지국의 동작 방법.
  13. 제12 항에 있어서,
    상기 단말로부터 RRC 재설정 요청 메시지를 수신하는 단계를 더 포함하는, 기지국의 동작 방법.
  14. 제12 항에 있어서,
    기지국의 통신 환경의 변화를 감지하는 단계; 및
    상기 단말로 RRC 재설정 요청 메시지를 전송하는 단계를 더 포함하는, 기지국의 동작 방법.
  15. 제14 항에 있어서,
    상기 기지국의 통신 환경의 변화는 상기 기지국의 로드 밸런스 설정 값들을 변경해야 하는 경우, 다른 단말의 요청이 있는 경우 또는 전송 트래픽이 변경되는 경우 등 중 적어도 하나를 포함하는, 기지국의 동작 방법.
  16. 무선 통신 시스템에서 단말에 있어서,
    송수신기; 및
    상기 송수신기와 연결된 프로세서를 포함하며,
    상기 프로세서는,
    기지국과 RRC(radio resource control) 연결을 설정하고,
    상황 정보를 획득하고,
    상기 상황 정보를 기반으로 인공지능 모델에 의해 도출된 선호 파라미터 값을 상기 기지국에게 전송하고,
    상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하고,
    상기 기지국으로 RRC 재설정 완료 메시지를 수신하고,
    상기 기지국으로부터 데이터를 수신하되,
    상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함하는, 단말
  17. 무선 통신 시스템에서 기지국에 있어서,
    송수신기; 및
    상기 송수신기와 연결된 프로세서를 포함하며,
    상기 프로세서는,
    단말과 RRC(radio resource control) 연결을 설정하고,
    상기 단말로 기지국의 상황 정보를 전송하고,
    상기 단말로부터 인공지능 모델에 의해 도출된 선호 파라미터 값을 수신하고,
    상기 단말로 상기 선호 파라미터 값을 기반으로 RRC 재설정 메시지를 전송하고,
    상기 단말로부터 RRC 재설정 완료 메시지를 수신하고,
    상기 단말로 데이터를 전송하는 단계를 포함하되,
    상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함하는, 기지국.
  18. 통신 장치에 있어서,
    적어도 하나의 프로세서;
    상기 적어도 하나의 프로세서와 연결되며, 상기 적어도 하나의 프로세서에 의해 실행됨에 따라 동작들을 지시하는 명령어를 저장하는 적어도 하나의 컴퓨터 메모리를 포함하며,
    상기 동작들은,
    기지국과 RRC(radio resource control) 연결을 설정하고,
    상황 정보를 획득하고,
    상기 상황 정보를 기반으로 인공지능 모델에 의해 도출된 선호 파라미터 값을 상기 기지국에게 전송하고,
    상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하고,
    상기 기지국으로 RRC 재설정 완료 메시지를 수신하고,
    상기 기지국으로부터 데이터를 수신하되,
    상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함하는, 통신 장치.
  19. 적어도 하나의 명령어(instructions)을 저장하는 비-일시적인(non-transitory) 컴퓨터 판독 가능 매체(computer-readable medium)에 있어서,
    프로세서에 의해 실행 가능한(executable) 상기 적어도 하나의 명령어를 포함하며,
    상기 적어도 하나의 명령어는, 장치가,
    기지국과 RRC(radio resource control) 연결을 설정하고,
    상황 정보를 획득하고,
    상기 상황 정보를 기반으로 인공지능 모델에 의해 도출된 선호 파라미터 값을 상기 기지국에게 전송하고,
    상기 선호 파라미터를 기반으로 결정된 RRC 재설정 메시지를 상기 기지국으로부터 수신하고,
    상기 기지국으로 RRC 재설정 완료 메시지를 수신하고,
    상기 기지국으로부터 데이터를 수신하되,
    상기 선호 파라미터 값은 DRX(discontinuous reception) 제어 값을 포함하는, 컴퓨터 판독 가능 매체.
PCT/KR2023/008888 2022-09-13 2023-06-27 무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 방법 및 장치 WO2024058372A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220114632 2022-09-13
KR10-2022-0114632 2022-09-13

Publications (1)

Publication Number Publication Date
WO2024058372A1 true WO2024058372A1 (ko) 2024-03-21

Family

ID=90275481

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/008888 WO2024058372A1 (ko) 2022-09-13 2023-06-27 무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 방법 및 장치

Country Status (1)

Country Link
WO (1) WO2024058372A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030079632A (ko) * 2002-04-06 2003-10-10 엘지전자 주식회사 이동통신 시스템의 무선링크 파라미터 갱신 방법
KR20150032740A (ko) * 2012-07-20 2015-03-27 퀄컴 인코포레이티드 이동성 처리 및 오프로드 결정들을 개선하기 위해 ue 환경 상황 정보를 사용하기 위한 방법들, 시스템들 및 장치들
US20210219377A1 (en) * 2020-01-15 2021-07-15 Qualcomm Incorporated Aligning drx cycles using system level configuration
KR20210140901A (ko) * 2020-05-14 2021-11-23 주식회사 케이티 무선망 품질 관리장치 및 무선망 품질 관리방법
WO2022086160A1 (ko) * 2020-10-20 2022-04-28 엘지전자 주식회사 Mmwave v2x 통신 시스템에서 빔 관리를 위한 사이드링크 csi 보고의 효율적인 전송 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030079632A (ko) * 2002-04-06 2003-10-10 엘지전자 주식회사 이동통신 시스템의 무선링크 파라미터 갱신 방법
KR20150032740A (ko) * 2012-07-20 2015-03-27 퀄컴 인코포레이티드 이동성 처리 및 오프로드 결정들을 개선하기 위해 ue 환경 상황 정보를 사용하기 위한 방법들, 시스템들 및 장치들
US20210219377A1 (en) * 2020-01-15 2021-07-15 Qualcomm Incorporated Aligning drx cycles using system level configuration
KR20210140901A (ko) * 2020-05-14 2021-11-23 주식회사 케이티 무선망 품질 관리장치 및 무선망 품질 관리방법
WO2022086160A1 (ko) * 2020-10-20 2022-04-28 엘지전자 주식회사 Mmwave v2x 통신 시스템에서 빔 관리를 위한 사이드링크 csi 보고의 효율적인 전송 방법

Similar Documents

Publication Publication Date Title
WO2023277454A1 (en) Method and apparatus for channel environment classification in wireless network system
WO2020105833A1 (ko) 차세대 통신 시스템에서 릴레이 노드를 위한 자원 할당 방법 및 이를 위한 장치
WO2020197125A1 (en) Method and apparatus for performing measurement in wireless communication system
WO2024058372A1 (ko) 무선 통신 시스템에서 상황 정보 기반 인공지능을 활용한 전력 절약을 위한 방법 및 장치
WO2023017881A1 (ko) 무선 통신 시스템에서 측정 갭을 이용한 측정 결과에 기반하여 핸드오버를 수행하기 위한 장치 및 방법
WO2022050565A1 (ko) 무선 통신 시스템에서 핸드오버를 위한 장치 및 방법
WO2022060120A1 (en) Method and apparatus for paging handling in wireless communication system
WO2022075745A1 (ko) 전력 제어 방법 및 장치
WO2022031111A1 (en) Method and apparatus for handling synchronization in wireless communication system
WO2024048803A1 (ko) 무선 통신 시스템에서 불연속 수신 동작에 관련된 파라미터를 설정하기 위한 장치 및 방법
WO2020096174A1 (ko) 차세대 통신 시스템에서 릴레이 노드를 위한 하향링크 송신 타이밍 결정 방법 및 이를 위한 장치
WO2020105832A1 (ko) 차세대 통신 시스템에서 릴레이 노드가 신호를 송수신하기 위한 빔 세트를 설정하는 방법 및 이를 위한 장치
WO2024063524A1 (ko) 무선 통신 시스템에서 온라인 학습을 수행하기 위한 장치 및 방법
WO2023017882A1 (ko) 무선 통신 시스템에서 배터리 효율을 고려하여 무선 접속 기술을 선택하기 위한 장치 및 방법
WO2023120781A1 (ko) 무선 통신 시스템에서 신호 전송을 위한 장치 및 방법
WO2023042941A1 (ko) 무선 통신 시스템에서 신호 전송 방법 및 장치
WO2023058872A1 (ko) 무선 통신 시스템에서 위치에 기반하여 핸드오버를 수행하기 위한 장치 및 방법
WO2023013857A1 (ko) 무선 통신 시스템에서 데이터 학습을 수행하는 방법 및 장치
WO2023101304A1 (ko) 무선 통신 시스템에서 통신을 수행하는 방법 및 장치
WO2024048816A1 (ko) 무선 통신 시스템에서 신호를 송수신하기 위한 장치 및 방법
WO2022260200A1 (ko) 무선 통신 시스템에서 배터리 효율을 고려하여 핸드오버를 수행하기 위한 장치 및 방법
WO2022119424A1 (ko) 무선 통신 시스템에서 신호 전송을 위한 장치 및 방법
WO2023120768A1 (ko) 무선 통신 시스템에서 신호 전송을 위한 장치 및 방법
WO2022231084A1 (ko) 무선 통신 시스템에서 신호 전송 방법 및 장치
WO2023113282A1 (ko) 무선 통신 시스템에서 송수신기 모델에 대한 온라인 학습을 수행하기 위한 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23865676

Country of ref document: EP

Kind code of ref document: A1