KR20110078419A - A pomdp-based adaptive sensing scheduling scheme for cognitive radio systems - Google Patents
A pomdp-based adaptive sensing scheduling scheme for cognitive radio systems Download PDFInfo
- Publication number
- KR20110078419A KR20110078419A KR1020090135225A KR20090135225A KR20110078419A KR 20110078419 A KR20110078419 A KR 20110078419A KR 1020090135225 A KR1020090135225 A KR 1020090135225A KR 20090135225 A KR20090135225 A KR 20090135225A KR 20110078419 A KR20110078419 A KR 20110078419A
- Authority
- KR
- South Korea
- Prior art keywords
- channel
- detection
- pomdp
- sensing
- base station
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/14—Spectrum sharing arrangements between different networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/10—Scheduling measurement reports ; Arrangements for measurement reports
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/12—Wireless traffic scheduling
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
Description
본 발명은 인지라디오 시스템(Cognitive Radio Systems)에서 부분적으로 관찰가능한 마르코프 결정방법(Partially Observable Markov Decision Process: 이하, "POMDP"라 약칭함) 기반 적응 감지 스케줄링 방법에 관한 것으로서, 더욱 상세하게는 시간에 따라 변하는 네트워크 환경에서 우선 사용자를 효과적으로 보호하면서 무선인지 노드에 매우 높은 최대 채널 이용률을 제공하도록 한 인지라디오 시스템을 위한 POMDP기반 적응 감지 스케줄링 방법에 관한 것이다. The present invention relates to an adaptive sensing scheduling method based on Partially Observable Markov Decision Process (hereinafter abbreviated as " POMDP ") in Cognitive Radio Systems. The present invention relates to a POMDP-based adaptive sensing scheduling method for an cognitive radio system that provides a high maximum channel utilization rate to a wireless cognitive node while effectively protecting a user in a changing network environment.
일반적으로, 무선 인지(CR)는 무선 통신에서 스펙트럼 부족 문제에 대한 가장 실현가능성 있는 해법들 중 하나의 해법으로서 당해 분야의 종사자로부터 큰 관심을 끌고 있다. 무선 인지 시스템에서 노드는 허가받은 우선 사용자(PU)에 의해 사용되고 있지 않은 스펙트럼 홀이라고 불리는 스펙트럼 대역을 검색하고 스펙트럼 홀의 일부(또는, 전부)를 그 사용자의 통신 채널로 사용한다. 무선 인지 시스템이 PU와 간섭하지 않아야 하므로, 무선 인지 시스템은 PU가 활성화될 때에는 가능한 한 빨리 채널 밖으로 이동하여야 한다. 그 스펙트럼을 즉시 해제하기 위하여, CR 시스템은 채널에 PU가 존재하는지를 조사하는 데, 이때 스펙트럼을 감지하는데 많은 시간을 소비한다.In general, radio recognition (CR) has attracted great interest from those skilled in the art as one of the most feasible solutions to the spectrum shortage problem in wireless communication. In a radio aware system, a node searches for a spectral band called a spectral hole that is not being used by an authorized first user (PU) and uses some (or all) of the spectral hall as its communication channel. Since the radio aware system should not interfere with the PU, the radio aware system should move out of the channel as soon as possible when the PU is activated. In order to release the spectrum immediately, the CR system spends a lot of time sensing the spectrum to see if there is a PU in the channel.
특정 스펙트럼 대역을 감지하는 동안, 네트워크 내에 있는 모든 CR 노드는 불명확한 결정을 회피하기 위해 통상 채널에 대한 전송을 중지한다. 이 침묵 기간(silence duration)은 "정적 기간(quiet period)"이라고 불린다. 이 정적 기간이 CR 시스템에 필수적이긴 하지만, CR 시스템의 성능 저하를 유발하기 때문에, 이 정적 기간은 PU를 보호하기 위한 요구조건이 충족되는 한 최소화될 필요가 있다. 그러므로 CR 시스템은 PU의 양호한 보호뿐만 아니라 높은 최대 채널 이용률이 달성될 수 있도록, 즉 효율적인 스펙트럼 감지 스케줄링이 CR 시스템의 성능 개선을 위해 요구되도록 이 정적 기간을 효과적으로 관리하여야 한다.During sensing of a particular spectral band, all CR nodes in the network typically stop transmitting on the channel to avoid unclear decisions. This silence duration is called the "quiet period". Although this static period is necessary for the CR system, this static period needs to be minimized as long as the requirements for protecting the PU are met, since it causes performance degradation of the CR system. Therefore, the CR system must effectively manage this static period so that not only good protection of the PU but also high maximum channel utilization can be achieved, that is, efficient spectrum sensing scheduling is required for improving the performance of the CR system.
CR 시스템을 위한 여러 스펙트럼 감지 스케줄링 구조가 문헌에 제안되어 있다. 주목할 것은 스펙트럼 감지 스케줄링 알고리즘은 통상 CR 노드가 언제, 얼마나 오래 그리고 어떤 타입으로 감지을 수행하는지 결정한다는 것이다. Several spectrum sensing scheduling schemes for CR systems have been proposed in the literature. Note that the spectrum sensing scheduling algorithm typically determines when, how long and what type the CR node performs the sensing.
참고문헌 Y-C Liang, Y.Zang, E.Peh, and A.T.Hoang, "Sensing-throughput tradeoff for cognitive radio networks." IEEE Trans. Wireless Commun., vol. 7, no, 4, Apr, 2008.은, 에너지 검출에 기초하여, PU를 충분히 보호하면서 CR 시스템의 달성가능한 처리량을 최대화하기 위해 최적의 감지 시간(즉, 정적 시간의 길이)을 설계하는 문제를 연구하였다. References Y-C Liang, Y. Zang, E. Peh, and A. T. Hoang, "Sensing-throughput tradeoff for cognitive radio networks." IEEE Trans. Wireless Commun., Vol. 7, no, 4, Apr, 2008., based on energy detection, addresses the problem of designing an optimal sensing time (ie, length of static time) to maximize the attainable throughput of the CR system while fully protecting the PU. Studied.
또한, 참고문헌 A. T. Hoang and Y.-C. Liang, "daptive scheduling of spectrum sensing periods in cognitive radio networks,"in Proc. IEEE GLOBECOM 2007, Nov. 2007.는 채널 상에서 감지 및 데이터 전송을 공동으로 스케줄링하기 위해 2개의 구조를 제안하고 있으며, 하나의 구조는 시스템 처리량이 최대로 되도록 채널 상태에 기초하여 결정을 하는 것이고, 다른 하나의 구조는 데이터 손실이 최소로 되도록 스케줄링시 대기하는 데이터의 양과 채널 상태를 고려하는 것이다.See also A. T. Hoang and Y.-C. Liang, "daptive scheduling of spectrum sensing periods in cognitive radio networks," in Proc. IEEE GLOBECOM 2007, Nov. 2007. proposes two schemes to jointly schedule sensing and data transmission on the channel, one scheme to make the decision based on the channel condition to maximize system throughput, and the other scheme to lose data Considering the amount of data and channel state waiting for scheduling to minimize this.
나아가, 참고문헌 D. Datla, R. Rajbanshi, A. M. Wyglinski, and G. J. Minden, "Parametric adaptive spectrum sensing framework for dynamic spectrum access networks," in Proc. IEEE DySPAN 2007, Apr. 2007.는 채널에 대한 PU 점유율에 기초하여 채널의 감지 간격을 적응적으로 조절하기 위해 감지 스케줄링 구조를 제안하고 있다.Further, references D. Datla, R. Rajbanshi, A. M. Wyglinski, and G. J. Minden, "Parametric adaptive spectrum sensing framework for dynamic spectrum access networks," in Proc. IEEE DySPAN 2007, Apr. 2007. proposes a sensing scheduling structure to adaptively adjust the sensing interval of a channel based on the PU occupancy of the channel.
한편, IEEE 802.22 무선 지역 영역 네트워크(WRAN)는 고속 감지 및 정밀 감지의 2가지 단계의 감지 메커니즘을 채용하고 있다. 이 메커니즘으로, 감지 알고리즘은 각 정적 기간에 신속 감지이나 정밀 감지을 스케줄링한다. 고속 및 정밀 감지을 위한 검출 구조가 IEEE 802.22 드래프트에 명시적으로 언급되어 있지는 않지만, 이것은 짧은 감지 시간 때문에 고속 감지을 하기 위해서는 에너지 검출이 사용되고, 신호 소스를 인식할 수 있는 능력이 있기 때문에 정밀 감지을 하기 위해서는 특징 검출이 채용된다는 것이 예상된다. IEEE 802.22 WRAN에서, 다른 CR 시스템으로부터 잡음 불명확성과 간섭이 있을 때에, 참고문헌 H. Kim and K. G. Shin, "n-band spectrum sensing in cognitive radio networks: energy detection or feature detection", Proc. Mobicom 2008, Sept. 2008. vol. 7, no. 2, Feb. 2008.은 에너지 검출과 특징 검출 중 어느 것이 각 신호대 잡음 비(SNR) 레벨에서 더 우 수한지를 결정하고 그 임계치 이하에서는 특징 검출이 선호되는 수신된 PU 신호 전력에 대한 임계치를 구한다.The IEEE 802.22 Wireless Local Area Network (WRAN), on the other hand, employs a two-stage sensing mechanism: high-speed sensing and precision sensing. With this mechanism, the detection algorithm schedules fast or precise detections in each static period. Although the detection structure for high speed and precision detection is not explicitly mentioned in the IEEE 802.22 draft, it is used for precision detection because of the short detection time, energy detection is used for high speed detection, and the ability to recognize signal source is important for precision detection. It is anticipated that detection will be employed. In IEEE 802.22 WRAN, when there is noise uncertainty and interference from other CR systems, references H. Kim and K. G. Shin, "n-band spectrum sensing in cognitive radio networks: energy detection or feature detection", Proc. Mobicom 2008, Sept. 2008. vol. 7, no. 2, Feb. 2008. determines which of the energy detection and feature detection is better at each signal-to-noise ratio (SNR) level and below that threshold finds a threshold for the received PU signal power for which feature detection is preferred.
참고문헌 W. S. Jeon, D. G. Jeong, J. A. Han, G. Ko, and M. S. Song, "An efficient quiet period management scheme for cognitive radio systems",IEEE Trans. Wireless Commun., vol. 7, no. 2, pp. 505-509, Feb. 2008.은 에너지 검출로부터 PU 검출 알람이 N회 연속적으로 발행된 후에만 특징 검출을 수행하는 것에 의해 불필요한 특징 검출과 채널 스위칭을 감소시키는 감지 스케줄링 구조를 제안하고 있다. 이 구조는 PU를 효과적으로 보호하며 CR 시스템에 대해 매우 높은 채널 이용률을 제공하지만, 이 구조는 PU 신호 전력 및/또는 잡음 불명확성이 시간에 따라 변하는 시간 가변 네트워크 조건에 잘 적응할 수 없는 단점이 있다.References W. S. Jeon, D. G. Jeong, J. A. Han, G. Ko, and M. S. Song, "An efficient quiet period management scheme for cognitive radio systems", IEEE Trans. Wireless Commun., Vol. 7, no. 2, pp. 505-509, Feb. 2008. proposes a detection scheduling structure that reduces unnecessary feature detection and channel switching by performing feature detection only after a PU detection alarm has been issued N consecutive times from energy detection. This structure effectively protects the PU and provides very high channel utilization for the CR system, but this structure has the disadvantage that the PU signal power and / or noise uncertainty cannot adapt well to time varying network conditions where time varies.
이에 본 발명은 상기와 같이 기존 무선인지시스템에 적용된 특징 검출과 채널 스위칭을 감소하기 위한 감지 스케줄링 방법이, 우선 사용자 신호 전력 및/또는 잡음 불명확성이 시간에 따라 변하는 시간 가변 네트워크 조건에서 적응적이지 못하다는 제반 문제점을 해결하기 위해서 제안된 것으로서,Accordingly, the present invention is that the detection scheduling method to reduce the feature detection and channel switching applied to the existing radio recognition system as described above, is not adaptive in the first time, the time variable network conditions in which the user signal power and / or noise uncertainty changes over time Is proposed to solve various problems,
본 발명이 해결하고자 하는 과제는, 시간에 따라 변하는 네트워크 환경에서 우선 사용자를 효과적으로 보호하면서 무선인지 노드에 매우 높은 최대 채널 이용률을 제공하기 위한 인지라디오시스템을 위한 POMDP기반 적응 감지 스케줄링 방법을 제공하는 데 있다.The problem to be solved by the present invention is to provide a POMDP-based adaptive sensing scheduling method for cognitive radio system to provide a very high maximum channel utilization to a wireless cognitive node while effectively protecting the user first in a network environment that changes over time. have.
본 발명이 해결하고자 하는 다른 과제는, 특징 검출이나 채널 스위칭 전에 수행되는 에너지 검출(energy detections)의 횟수를, 수신된 우선 사용자 신호 전력과 잡음 불명확성의 정도에 따라 적응적으로 조절하여 적응 감지을 수행하도록 한 인지라디오시스템을 위한 POMDP기반 적응 감지 스케줄링 방법을 제공하는 데 있다. Another problem to be solved by the present invention is to perform adaptive detection by adaptively adjusting the number of energy detections performed before feature detection or channel switching according to the received first user signal power and the degree of noise uncertainty. It is to provide a POMDP based adaptive sensing scheduling method for an cognitive radio system.
상기와 같은 과제들을 해결하기 위한 본 발명에 따른 "인지라디오시스템을 위한 POMDP기반 적응 감지 스케줄링 방법"은,According to the present invention for solving the above problems the "POMDP-based adaptive sensing scheduling method for cognitive radio system",
채널 상에서 채널 감지, 트래픽 전송/수신, 채널 스위칭을 수행하는 다수의 무선인지 노드(CR 노드)를 포함하는 인지라디오시스템에서 적응적으로 채널을 감지하기 위한 스케줄링 방법에 있어서,A scheduling method for adaptively detecting a channel in a cognitive radio system including a plurality of radio recognition nodes (CR nodes) that perform channel detection, traffic transmission / reception, and channel switching on a channel,
상기 채널 감지을 통해 획득한 시간 가변 정보로 채널의 비 점유 확률을 검출하고, 상기 검출한 채널의 비 점유 확률에 따라 적응적으로 특징 검출이나 채널 스위칭 전에 수행되는 에너지 검출 횟수를 조절하여 적응 감지을 수행하는 것을 특징으로 한다.Detecting the non-occupancy probability of the channel with the time variable information obtained through the channel detection, and adaptively performing the adaptive detection by adaptively adjusting the number of energy detections performed before feature detection or channel switching according to the non-occupancy probability of the detected channel. It is characterized by.
상기 시간 가변 정보는, 우선 사용자 신호 전력과 잡음 불명확성의 정도를 포함하는 것을 특징으로 한다.The time varying information is characterized by first including the user signal power and the degree of noise uncertainty.
상기 비 점유 확률은 부분적으로 관찰가능한 마르코프 결정 방법(POMDP)을 기반으로 산출하는 것을 특징으로 한다.The non-occupancy probability is calculated based on the partially observable Markov decision method (POMDP).
상기 비 점유 확률은, 활성 CR 노드의 수를 고려하여 결정하는 것을 특징으 로 한다. The non-occupancy probability is determined in consideration of the number of active CR nodes.
상기 CR 노드는 각 결정 구간마다 채널 상태의 초기 분포와 마지막 액션 및 관찰 값의 공동 추적을 통해 신뢰 벡터를 계산하여 비 점유확률을 검출하고, 상기 검출한 비 점유 확률과 동작 모드 결정을 위해 미리 설정된 결정 임계값을 비교하여, 그 대소 여부로 동작 모드를 결정하는 것을 특징으로 한다.The CR node detects the non-occupancy probability by calculating a confidence vector through joint tracking of the initial distribution of the channel state and the last action and observation value in each determination interval, and presets the non-occupancy probability and the predetermined operation mode for determining the detected non-occupancy probability. The decision threshold value is compared, and the operation mode is determined by the magnitude.
상기 동작 모드는 에너지 검출 모드와 특징 검출 모드와 채널 스위칭 모드를 포함하는 것을 특징으로 한다. The operation mode includes an energy detection mode, a feature detection mode, and a channel switching mode.
본 발명에 따르면, 수신된 우선 사용자 신호 전력과 잡음 불명확성의 정도에 따라 적응적으로 특징 검출이나 채널 스위칭 전에 수행되는 에너지 검출 횟수를 조절하여 적응 감지을 수행함으로써, 시간에 따라 변하는 네트워크 환경에서 PU를 효과적으로 보호하면서 CR 노드에 매우 높은 최대 채널 이용률을 제공할 수 있는 장점이 있다.According to the present invention, the adaptive detection is performed by adaptively adjusting the number of energy detections performed before feature detection or channel switching according to the received user signal power and the degree of noise uncertainty, thereby effectively performing the PU in a network environment that changes over time. This provides the advantage of providing very high maximum channel utilization to the CR node while protecting.
이하 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다. 본 발명을 설명하기에 앞서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다.Hereinafter, described in detail with reference to the accompanying drawings a preferred embodiment of the present invention. In the following description, well-known functions or constructions are not described in detail since they would obscure the invention in unnecessary detail.
본 발명은 수신된 우선 사용자 신호 전력과 잡음 불명확성의 정도에 따라 적응적으로 특징 검출이나 채널 스위칭 전에 수행되는 에너지 검출 횟수를 조절하여 적응 감지을 수행하는 방법을 제공한다.The present invention provides a method of performing adaptive sensing by adaptively adjusting the number of energy detections performed before feature detection or channel switching according to the received priority user signal power and the degree of noise uncertainty.
이러한 본 발명은 각 결정 구간에서 CR시스템이 채널이 비어있을 확률(비 점유 확률)에 기초하여 그 다음 동작(트래픽 전송, 에너지 검출, 특징 검출, 채널 스위칭) 모드를 선택하기 때문에, 일종의 결정 알고리즘(decision making algorithm)이라고 할 수 있다.In the present invention, since the CR system selects the next mode of operation (traffic transmission, energy detection, feature detection, channel switching) based on the probability that the channel is empty (non-occupancy probability) in each decision interval, a kind of decision algorithm ( decision making algorithm).
일반적으로 스펙트럼 감지 결과는 감지 에러로 인해 채널이 비어있는 것을 정확히 지시하는 것은 아니라는 것이 주목된다. 그 결과, CR 시스템은 단지 감지 결과를 사용하여 채널이 비어있다는 것을 추측하는 것이다. 따라서, CR 시스템은 불명확한 데이터로 최적으로 가능한 동작 모드를 선택하여야 한다. 불명확성이 있는 상태에서 결정 문제를 모델링하는데 POMDP이 매우 적합하다는 것을 고려하면, POMDP 구성에 기초하여 적응 감지 스케줄링(즉, 동작 모드 선택) 구조를 제안한다.It is generally noted that the spectral sensing results do not exactly indicate empty channels due to sensing errors. As a result, the CR system simply uses the detection result to guess that the channel is empty. Therefore, the CR system should select an operating mode that is optimally possible with opaque data. Considering that POMDP is well suited for modeling decision problems in the absence of ambiguity, we propose an adaptive sensing scheduling (ie, operation mode selection) structure based on the POMDP configuration.
최근에 CR 네트워크의 여러 결정 문제는 POMDP로 공식화되고 있다. Recently, several decision problems of CR networks have been formulated into POMDP.
참고문헌 Q. Zhao, L. Tong, A. Swami, and Y. Chen, "Decentralized cognitive MAC for opportunistic spectrum access in ad-hoc networks" A POMDP framework, IEEE J. Sel. Areas Commun., vol. 25, no. 3, pp. 589", 99, Apr. 2007.은 CR 노드들이 중앙 조정자나 전용 제어 채널 없이 스펙트럼 기회를 독립적으로 검색할 수 있게 해주는 분산 MAC 프로토콜을 제안하고 있다. 여기서 데이터를 가지는 CR 노드는 먼저 POMDP 모델에 따라 선택된 채널을 감지하고, 만약 채널이 비어 있다면, 노드는 채널 상에서 데이터를 전송한다.References Q. Zhao, L. Tong, A. Swami, and Y. Chen, "Decentralized cognitive MAC for opportunistic spectrum access in ad-hoc networks" A POMDP framework, IEEE J. Sel. Areas Commun., Vol. 25, no. 3, pp. 589 ", 99, Apr. 2007. proposes a distributed MAC protocol that allows CR nodes to independently search for spectrum opportunities without a central coordinator or a dedicated control channel. The CR nodes with data must first follow the POMDP model. Detect the selected channel, and if the channel is empty, the node sends data on the channel.
참고문헌 R.-T. Ma, Y.-P. Hsu, and K.-T. Feng, "POMDP-based spectrum handoff protocol for partially observable cognitive radio networks" w, in Proc. IEEE WCNC 2009, Apr. 2009.은 POMDP 기반 스펙트럼 핸드오프 구조를 제안하고 있다. 이 구조에서, PU가 트래픽이 전송되고 있는 채널에 나타나면, 송신기는 POMDP를 적용하여 채널을 핸드오프 할 것을 결정한다. References R.-T. Ma, Y.-P. Hsu, and K.-T. Feng, "POMDP-based spectrum handoff protocol for partially observable cognitive radio networks" w, in Proc. IEEE WCNC 2009, Apr. 2009. proposes a POMDP based spectrum handoff structure. In this structure, when the PU appears on the channel on which traffic is being sent, the transmitter determines to hand off the channel by applying POMDP.
참고문헌 Y. Chen, Q. Zhao, and A. Swami, "Distributed spectrum sensing and access in cognitive radio networks with energy constraint, IEEE Trans. Signal Proc., vol. 57, no. 2, pp. 783-797, Mar. 2009는 POMDP에 기초하여 에너지 제약을 가지고 CR 특정 네트워크에 대해 분산된 스펙트럼 감지 및 액세스 전략을 설계하고 있다. 이 구조로 시스템은 PU가 슬립(Sleep) 상태에 있는지 또는 감지을 수행하고 있는지를 먼저 결정한다. 감지가 선택되면 노드는 감지할 채널을 선택한 후 감지 결과에 기초하여 채널을 액세스할지를 결정한다. 위 구조들은 주로 기회 액세스를 위한 채널 선택에 집중하는 것인 반면, 본 발명은 동작 채널에 대한 감지 스케줄링을 처리하는 것에 차이점이 있다.References Y. Chen, Q. Zhao, and A. Swami, "Distributed spectrum sensing and access in cognitive radio networks with energy constraint, IEEE Trans.Signal Proc., Vol. 57, no. 2, pp. 783-797, Mar. 2009 is designing a distributed spectrum detection and access strategy for CR-specific networks with energy constraints based on POMDP, which allows the system to determine whether the PU is in sleep or performing detection. When sensing is selected, the node selects a channel to detect and then decides whether to access the channel based on the sensing result, while the above structures focus primarily on channel selection for opportunity access, while the present invention There is a difference in handling discovery scheduling.
이하에서는 본 발명의 구체적인 동작을 설명한다.Hereinafter, the specific operation of the present invention will be described.
복수의 채널을 포함하는 채널 풀(channel pool)이 있다. 본 발명은 PU의 존재가 검출될 때까지 풀에서 비어있는 채널을 찾아 채널 상에서 동작하는 CR 시스템을 고려한다. 동작 채널 상에서 PU를 검출하면, CR 시스템은 다른 비어있는 채널로 스위칭한다.There is a channel pool including a plurality of channels. The present invention contemplates a CR system operating on a channel looking for an empty channel in the pool until the presence of the PU is detected. Upon detecting the PU on the operating channel, the CR system switches to another empty channel.
고려하는 CR 시스템은 복수의 CR 노드들로 구성되며, 이 노드들 중 하나는 시스템의 중앙 제어기(예를 들어, 마스터, 액세스 포인트 또는 베이스 스테이션)로 기능한다. 이후, "베이스 스테이션"이라는 용어는 모든 타입의 중앙 제어기를 나타낸다. 베이스 스테이션은 중앙 제어기 그 자체의 역할뿐만 아니라 CR 노드의 역할도 한다. CR 노드는 베이스 스테이션의 제어 하에 채널 상에서 정상 동작, 즉 채널 감지, 트래픽 전송/수신 그리고 채널 스위칭을 수행한다.The CR system under consideration consists of a plurality of CR nodes, one of which acts as the central controller (eg, master, access point or base station) of the system. The term “base station” hereafter refers to all types of central controllers. The base station acts not only as the central controller itself, but also as the CR node. The CR node performs normal operation on the channel under the control of the base station, namely channel sensing, traffic transmission / reception and channel switching.
참고문헌 H. Urkowitz, "energy detection of unknown deterministic signals,"in Proc. IEEE, vol. 55, pp. 523-531, Apr. 1967.와 W. A. Gardner and C. M. Spooner, "signal interception: performance advantages of cyclic-feature detectors," IEEE Trans. Commun., vol. 40, no. 1, pp. 149-159, Jan. 1992. 및 P. D. Sutton, K. E. Nolan, and L. E. Doyle, "Cyclostationary signatures in practical cognitive radio applications," IEEE J. Sel. Areas Commun., vol. 26, no. 1, pp. 13-14, Jan. 2008은 에너지 검출 및 특징 검출을 설명하며, 각각의 약점에 대해 각각 다른 것을 보완할 수 있는 것으로 잘 알려져 있다.References H. Urkowitz, "energy detection of unknown deterministic signals," in Proc. IEEE, vol. 55, pp. 523-531, Apr. 1967. and W. A. Gardner and C. M. Spooner, "signal interception: performance advantages of cyclic-feature detectors," IEEE Trans. Commun., Vol. 40, no. 1, pp. 149-159, Jan. 1992. and P. D. Sutton, K. E. Nolan, and L. E. Doyle, "Cyclostationary signatures in practical cognitive radio applications," IEEE J. Sel. Areas Commun., Vol. 26, no. 1, pp. 13-14, Jan. 2008 describes energy detection and feature detection and is well known to be able to compensate for each of the weaknesses.
에너지 검출기는 채널에 있는 신호의 에너지 레벨만을 확인하므로, 이 에너지 검출기는 특징 검출에 비해 상대적으로 짧은 감지 시간에 PU 신호를 검출할 수 있다. 그러나 에너지 검출은 잡음 불명확성 및 약하게 수신된 PU 신호에서는 신뢰할 수 없으며, PU, 잡음 및 다른 CR 시스템 중에서 에너지의 소스를 식별할 수 없다. Since the energy detector only checks the energy level of the signal in the channel, the energy detector can detect the PU signal in a relatively short sensing time compared to the feature detection. However, energy detection is unreliable in noise ambiguity and weakly received PU signals, and cannot identify sources of energy among PU, noise, and other CR systems.
한편, 특징 검출이 보다 상세히 신호 소스를 검색하기 때문에, 특징 검출은 에너지 검출보다 더 많은 감지 시간을 소비한다. 하지만, 특징 검출은 신호 소스를 인식할 수 있으며 채널에 있는 잡음 불명확성과 간섭에 강하다. 에너지 검출과 특 징 검출은 상호 약점을 보완한다는 특성을 고려하여, 제안된 CR 시스템은 스펙트럼 감지을 위해 이들 두 검출 구조를 모두 사용한다. 나아가, 채널을 감지하는 동안, 시스템에 있는 모든 노드는 트래픽의 전송/수신을 중지하며, 즉 노드는 다른 액션(action) 없이 채널 감지만을 수행한다.On the other hand, since feature detection searches for signal sources in more detail, feature detection consumes more detection time than energy detection. However, feature detection can recognize signal sources and is robust to noise uncertainty and interference in the channel. Considering the energy detection and feature detection complement each other's weaknesses, the proposed CR system uses both detection schemes for spectrum detection. Furthermore, during channel sensing, all nodes in the system stop transmitting / receiving traffic, i.e., the node only performs channel sensing without other actions.
고려하는 CR 시스템에서, 채널 시간은 고정된 길이를 갖는 프레임들로 분할되며, 베이스 스테이션은 프레임 단위로 채널 상에 전송 스케줄링을 한다. 전술된 바와 같이, CR 노드가 채널에 수행하는 정상 동작은 트래픽의 전송/수신, 에너지 검출, 특징 검출 및 채널 스위칭이다. 에너지 검출을 위한 감지 시간이 일반적으로 프레임 길이(프레임 기반 채널 구조를 갖는 대부분의 현존하는 무선 시스템에서, 프레임 길이는 수 밀리 초 또는 수십 밀리 초인 반면, 에너지 검출을 위한 감지 시간은 수십 내지 수백 마이크로 초이다.)보다 훨씬 더 짧은 것을 고려하면, 본 발명은 트래픽의 전송/수신과 에너지 검출이 동일한 프레임 내에서 스케줄링 되도록 시스템을 설계한다. 즉, 프레임의 작은 부분이 에너지 검출에 할당되고 그 나머지 부분이 트래픽의 전송/수신에 사용된다. 그러므로 시스템 동작은 3가지 타입, 즉 트래픽의 전송/수신과 에너지 검출(T/R-ED), 특징 검출(FD) 및 채널 스위칭(CS)으로 분류된다.In the CR system under consideration, the channel time is divided into frames having a fixed length, and the base station schedules transmission on the channel in units of frames. As mentioned above, the normal operations that the CR node performs on the channel are the transmission / reception of traffic, energy detection, feature detection, and channel switching. The detection time for energy detection is typically frame length (in most existing wireless systems with frame-based channel structures, the frame length is several milliseconds or tens of milliseconds, while the detection time for energy detection is tens to hundreds of microseconds. Considering much shorter than that, the present invention designs the system such that the transmission / reception of the traffic and the energy detection are scheduled within the same frame. That is, a small portion of the frame is allocated for energy detection and the remaining portion is used for transmitting / receiving traffic. Therefore, system operation is classified into three types: traffic transmission / reception and energy detection (T / R-ED), feature detection (FD) and channel switching (CS).
도 1은 본 발명에 따른 무선인지시스템을 위한 POMDP기반 적응 감지 스케줄링 방법을 도시한 것이다.1 illustrates a POMDP based adaptive sensing scheduling method for a wireless cognitive system according to the present invention.
각각의 무선인지 노드는 트래픽 전송 스케줄과 에너지 검출의 시작 시간(및 길이)을 포함하여 대응하는 고정된 길이를 갖는 프레임에 대한 스케줄링 정보를 확 인하게 된다(S10).Each radio-aware node checks scheduling information for a frame having a corresponding fixed length, including a traffic transmission schedule and a start time (and length) of energy detection (S10).
무선 인지 노드는 데이터 트래픽을 송신/수신하며, 에너지 검출을 위한 채널을 감지하게 되고(S20), 이렇게 감지한 채널 감지 정보는 베이스 스테이션에 전달된다.The radio recognition node transmits / receives data traffic, senses a channel for energy detection (S20), and the detected channel detection information is transmitted to the base station.
베이스 스테이션은 상기 감지 정보를 기초로 POMDP기반 채널의 비 점유 확률을 검출하게 되고(S30), 상기 검출한 채널의 비 점유확률과 동작 모드 결정을 위한 제1 및 제2 결정 임계값()을 비교하게 된다(S40).The base station detects the non-occupancy probability of the POMDP-based channel based on the sensed information (S30), and the first and second determination thresholds for determining the non-occupancy probability and the operation mode of the detected channel ( ) Will be compared (S40).
상기 채널의 비 점유확률이 상기 제1 결정 임계값보다 클 경우, 에너지 검출 모드로 결정하고, 상기 비 점유확률에 따라 에너지 검출 횟수를 조절하게 된다(S50, S60).When the non-occupancy probability of the channel is greater than the first determination threshold value, the energy detection mode is determined, and the number of times of energy detection is adjusted according to the non-occupancy probability (S50 and S60).
상기 비 점유 확률이 상기 제2 결정 임계값보다 작을 경우에는 채널 스위칭 모드로 결정하고, 상기 비 점유 확률이 상기 제2 결정 임계값보다 크지만 상기 제1 결정 임계값보다 작으면 특징 검출 모드로 결정하게 된다(S70).If the non-occupancy probability is less than the second decision threshold, the channel switching mode is determined. If the non-occupancy probability is greater than the second decision threshold but less than the first decision threshold, the feature detection mode is determined. It is made (S70).
이하에서는 상기와 같은 각 과정을 더욱 구체적으로 설명한다.Hereinafter, each process as described above will be described in more detail.
도 2는 시간에 따른 시스템 동작의 일례를 도시한 것이다. 도면에 도시된 바와 같이, 3가지 동작 모드의 지속시간은 서로 다르며, 모드 T/R-ED, FD 및 CS에 대해 각각 ℓT, ℓF 및 ℓC로 표시된다. 제안된 시스템에서, T/R-ED 동작은 하나의 프레임 동안 수행되므로, ℓT는 프레임의 길이와 같다. ℓE로 표시된 에너지 검출 시 간은 프레임의 길이보다 훨씬 더 작다(즉, ℓE < ℓT)는 것이 주목된다.2 illustrates an example of system operation over time. As shown in the figure, the durations of the three modes of operation are different and are represented by l T , l F and l C for the modes T / R-ED, FD and CS, respectively. In the proposed system, since the T / R-ED operation is performed for one frame, ℓ T is equal to the length of the frame. It is noted that the energy detection time, denoted by 1 E , is much smaller than the length of the frame (
시스템 동작은 동작 모드를 선택하는 베이스 스테이션에 의해 제어된다. T/R-ED 모드를 선택하면, 베이스 스테이션은 트래픽 전송 스케줄과 에너지 검출의 시작 시간(및 길이)을 포함하여 대응하는 프레임에 대한 스케줄링 정보를 CR 노드에 알려준다. 이때, 노드는 데이터 트래픽을 송신/수신하며, 에너지 검출을 수행하고 그 감지 결과를 스케줄에 따라 베이스 스테이션에 보고한다. FD 모드에서, ℓF 동안, 각 노드는 특징 검출을 수행하며 감지 결과를 베이스 스테이션에 보고한다.System operation is controlled by the base station selecting the operating mode. When the T / R-ED mode is selected, the base station informs the CR node of the scheduling information for the corresponding frame, including the traffic transmission schedule and the start time (and length) of the energy detection. At this time, the node transmits / receives data traffic, performs energy detection and reports the detection result to the base station according to a schedule. While in the FD mode, ℓ F, each node performs feature detection, and reports the detection result to the base station.
한편, CS 모드가 선택되면, ℓC 동안 시스템에 있는 모든 노드는 채널 스위칭을 완료하며, 베이스 스테이션은 새로운 채널에 대한 동작 모드를 선택할 준비를 한다.On the other hand, if the CS mode is selected, all nodes in the system complete the channel switching during ℓ C and the base station is ready to select the operating mode for the new channel.
베이스 스테이션은 현재 모드가 종료된 직후 CR 노드로부터 가장 최근의 감지 결과에 기초하여 CR 시스템의 그 다음 동작 모드를 선택한다. 본 발명에서는 베이스 스테이션이 동작 모드를 선택하는 시점을 "결정 구간(decision epoch)"이라고 부를 것이다. 도 1의 예에 도시된 바와 같이, 2개의 결정 구간들 사이의 간격은 네트워크에 의해 수행되는 동작 모드에 따라 변할 수 있다.The base station selects the next operating mode of the CR system based on the most recent sensing result from the CR node immediately after the current mode ends. In the present invention, the time point at which the base station selects an operation mode will be referred to as a "decision epoch." As shown in the example of FIG. 1, the interval between the two determination intervals may vary depending on the mode of operation performed by the network.
PU를 적절히 보호하면서 CR 시스템의 채널 효율을 증가시키기 위해, 베이스 스테이션은 동작 모드 선택시 최적의 결정을 하여야 한다. 채널 상에 PU의 존재가 높은 확률로 예상된다면, 베이스 스테이션은 채널을 스위칭하기로 결정하여야 한다. 그러나, 채널이 비어있을 확률이 더 높으면, 베이스 스테이션은 T/R-ED 모드를 선택함으로써 CR노드가 트래픽을 송신하게 할 수 있다. 한편, 베이스 스테이션이 에너지 검출로부터 나온 결과만으로 PU의 존재를 확신할 수 없다면, 신호 소스를 더욱 정확히 조사하기 위해 특징 검출 모드를 선택하는 것이 최상의 결정일 수 있다.In order to increase the channel efficiency of the CR system while adequately protecting the PU, the base station must make an optimal decision when selecting an operation mode. If the presence of a PU on a channel is expected with a high probability, the base station should decide to switch the channel. However, if the channel is more likely to be empty, the base station can select the T / R-ED mode to allow the CR node to transmit traffic. On the other hand, if the base station cannot be assured of the presence of the PU only from the results from the energy detection, it may be the best decision to select the feature detection mode to more accurately investigate the signal source.
일반적으로, 감지 결과에 의해 CR 시스템은 PU가 존재하는지 비 존재하는지 여부를 정확히 알 수는 없으나, 단지 PU의 존재를 추측할 수만 있다. 이것은 CR 시스템에 의해 사용되는 물리적 감지 기술의 대부분이 PU 신호와 잡음의 불명확성 및 복잡한 특성으로 인해 감지 에러를 가지기 때문이다.In general, based on the detection result, the CR system cannot accurately determine whether the PU exists or not, but can only infer the existence of the PU. This is because most of the physical sensing techniques used by the CR system have detection errors due to the uncertainty and complex nature of the PU signal and noise.
한편, POMDP가 불명확성을 허용하는 결정 문제를 모델링하는데 매우 적합한 수학적 도구라는 것이 잘 알려져 있다. 고려하는 CR 시스템에서, 베이스 스테이션의 모드 선택은, PU 존재에 대한 추정에 기초하여 동작 모드를 결정하여야 하므로, 불명확성이 있는 결정 문제로 고려된다. 그러므로 본 발명에서는 POMDP 구성을 적용함으로써 감지 결과에 따라 동작 모드를 적응적으로 선택하는 최적의 모드 선택 구조를 설계한다.On the other hand, it is well known that POMDP is a very suitable mathematical tool for modeling decision problems that allow for clarity. In the CR system under consideration, the mode selection of the base station should be considered an ambiguity decision problem since the operation mode should be determined based on the estimation of the PU presence. Therefore, the present invention designs an optimal mode selection structure that adaptively selects an operation mode according to the detection result by applying the POMDP configuration.
채널은 단일 PU만을 가지는 것으로 가정된다. 또한, 본 발명에서는 채널 풀에 있는 모든 채널이 동일한 PU 활성 모델을 가지는 것으로 가정한다. PU가 채널에 존재하면, PU는 온(ON) 상태에 있다고 말하며, 채널이 비어 있으면, PU의 상태는 오프(OFF)라고 말한다. PU는 ON과 OFF 사이에 교번 한다. OFF(ON) 상태의 기간은 평균 로 지수적으로 분포되는 것으로 가정한다. 즉, ON에서부터 OFF로 의 상태 전이율은 λ이며, OFF로부터 ON으로의 상태 전이율은 μ로 주어진다.It is assumed that the channel has only a single PU. In addition, the present invention assumes that all channels in the channel pool have the same PU activity model. If the PU is in the channel, it is said to be in the ON state, and if the channel is empty, the state of the PU is said to be OFF. PU alternates between ON and OFF. Average period of OFF (ON) state Suppose that it is distributed exponentially. That is, the state transition rate from ON to OFF is lambda, and the state transition rate from OFF to ON is given by μ.
베이스 스테이션이 CR 노드에 요청하여 동작 채널을 (T/R-ED 또는 FD 모드에서) 감지하게 할 때, 각 CR 노드는 채널 감지을 개별적으로 수행하며, 만약 노드가 PU 신호를 검출하면, 노드는 PU 검출 알람을 베이스 스테이션에 송신한다.When the base station makes a request to the CR node to detect the operating channel (in T / R-ED or FD mode), each CR node performs channel detection individually, and if the node detects a PU signal, the node Send a detection alarm to the base station.
감지 에러로 인해 CR 노드는 비어있는 채널에 대해 PU 검출 알람을 잘못 발생할 수 있으며(잘못된 알람), 또한 CR 노드는 채널 상에 실제 존재하는 PU를 검출하지 못할 수도 있다(오검출). 본 발명에서는 에너지 검출 및 특징 검출의 잘못된 알람을 Pf(E) 및 Pf(F)으로 각각 표시한다. 나아가, 에너지 검출 및 특징 검출의 오 검출 확률은 각각 Pm(E) 및 Pm(F)으로 표시된다.Due to a detection error, the CR node may falsely generate a PU detection alarm for an empty channel (false alarm), and the CR node may also fail to detect a PU that actually exists on the channel (false detection). In the present invention, false alarms of energy detection and feature detection are denoted by P f (E) and P f (F), respectively. Further, false detection probabilities of energy detection and feature detection are represented by P m (E) and P m (F), respectively.
CR 시스템의 동작 모드를 선택하기 위한 POMDP 모델은 6개의 성분으로 구성된 집합(S, A, Ω, P, Φ, R)으로 표시되며, 여기서, S는 동작 채널이 PU에 의해 점유되어 있는지 비 점유되어 있는지를 나타내는 핵심 프로세스의 상태 공간이다. S = {0, 1}이며, 여기서 상태 1은 채널 상에서 PU의 존재를 의미하며, 상태 0은 비어 있는 채널을 나타낸다. 제안된 구조에서, 베이스 스테이션이 동작 모드 선택을 위해 각 결정 구간에서 채널 상태를 확인하기 때문에, 핵심 프로세스의 상태는 결정 구간에서만 추정된다. st를 t번째 결정 구간(t=0,1, ...)에서 핵심 프로세스의 상태를 나타낸다고 하자. (t+1) 번째 구간에서 채널 상태는 과거 상태와는 독립적으로 t번째 구간에서의 채널 상태에만 좌우되므로, 핵심 프로세스는 마르코프 프로세스이다.The POMDP model for selecting the operating mode of the CR system is represented by a set of six components ( S, A, Ω, P, Φ, R ), where S is the non-occupied operation channel whether it is occupied by the PU. The state space of the core process that indicates if it is. S = {0, 1}, where
A는 CR시스템의 동작 모드에 대응하는 액션(actions)의 공간이다. 간단한 설명을 위해, 본 발명에서는 하나의 알파벳 문자, 즉 트래픽 전송/수신 및 에너지 검출(T), 특징 검출(F) 및 채널 스위칭(C)으로 각 액션을 표시할 것이다. 따라서, A={T, F, S}. 본 발명에서는 t번째 결정 구간에서 취해진 액션을 At로 표시한다. A is a space of actions corresponding to the operation mode of the CR system. For simplicity, the present invention will denote each action with one alphabetic character, that is, traffic transmission / reception and energy detection (T), feature detection (F), and channel switching (C). Thus, A = { T, F, S }. In the present invention, the action taken in the t-th determination section is denoted by A t .
Ω는 T/R-ED 또는 FD 모드에서 PU 검출 알람을 발행하는 CR 노드의 개수를 나타내는 관찰 프로세스의 상태 공간이다. CR 시스템이 M개의 CR 노드로 구성될 때, Ω = {0,1,...,M}. Ω is the state space of the observation process that represents the number of CR nodes that issue a PU detection alarm in T / R-ED or FD mode. Ω = {0,1, ..., M} when the CR system consists of M CR nodes.
P는 핵심 프로세스의 상태 전이 매트릭스이다. p i ,j (a)를 액션(a)이 취해질 때 핵심 프로세스(채널)가 상태(i)로부터 상태(j)로 전이할 확률이라고 하자. 즉, . t번째 구간에서 액션(a)(∈ {T, F, C})이 취해질 때, t번째 구간과 (t+1) 번째 구간 사이의 간격은 ℓa이다. 그러므로 PU 액션 모델에 기초하여, a ∈ {T, F, C}에 대해, P is the state transition matrix of the core process. Let p i , j (a) be the probability that the core process (channel) will transition from state (i) to state (j) when action (a) is taken. In other words, . When the action (a) (∈ {T, F, C}) is taken in the t th section, the interval between the t th section and the (t + 1) th section is l a . Therefore, based on the PU action model, for a ∈ {T, F, C},
Φ는 핵심 프로세스의 상태와 관찰 프로세스의 상태 사이의 상호 관계를 기술하는 확률 집합이다. (t-1) 번째 구간에서 액션(a)이 취해졌을 때, φi,j(a)를 t 번째 구간에서 관찰 값이 채널 상태(i)의 상태 하에서 j일 확률이라고 하자. Ωt 가 t번째 구간 직전에 관찰 프로세스(즉, 관찰 값)의 상태를 나타낸다면, φi,j(a)=Pr{Ωt = j│st=i, At -1 = a}. 관찰 값이 액션 T 및 F에서만 얻어진다는 것이 주목된다. 상태 0(즉, 비어 있는 채널)에서 채널에 대한 j의 관찰 값은 j개의 노드가 잘못된 알람을 발생했다는 것을 의미하며, 또한 관찰 값(j)과 채널 상태(1)는 j개의 노드들만이 채널 상에 PU의 존재를 검출했다는 것을 나타낸다. 따라서, 액션(T)에 대해,Φ is a set of probabilities describing the interrelationship between the state of the core process and the state of the observation process. When action (a) is taken in the (t-1) -th section, let φ i, j (a) be the probability that the observed value in the t-th section is j under the state of the channel state (i). If Ω t represents the state of the observation process (ie, the observed value) just before the t-th interval, φ i, j (a) = Pr {Ω t = j | s t = i, A t −1 = a}. It is noted that the observed values are obtained only in actions T and F. The observed value of j for the channel in state 0 (that is, an empty channel) means that j nodes generated false alarms, and the observed value (j) and channel state (1) indicate that only j nodes are channels. Indicates the presence of a PU on the phase. Thus, for action T,
이와 유사하게, 액션(F)이 선택되면,Similarly, if action F is selected,
R은 보상 함수이다. ri ,j(a)는 CR 시스템이 상태(j)로 전이를 초래하는 채널 상태(i)에서 액션 a (∈ A)를 취함으로써 얻어지는 수신 보상이라고 한다. 이때, 상태(i)에서 액션(a)과 연관된 총 보상은, R is a compensation function. r i , j (a) is referred to as reception compensation obtained by taking action a (X A ) in channel state i, which causes the CR system to transition to state j. At this time, the total reward associated with the action (a) in the state (i),
로 주어진다..
ξ(a)와 ρ(a)를 각각 액션(a)을 선택하는 CR 시스템에 주어지는 이점과 벌점이라고 하자. CR 시스템이 PU가 활성화되는 채널 상에서 송신하면, CR 시스템에 벌점이 주어져야 한다. 그러나 비어 있는 채널에서 송신하면, CR 시스템은 PU를 분배함이 없이 채널을 사용하므로 이점을 얻을 수 있다. 따라서, 본 발명에서는 r0,0(T)=ξ(T)라하고, 그리고 r0 ,1(T)=r1 ,0(T)=r1 ,1(T)=ρ(T)라고 한다. 또한, 비어있는 채널로부터 밖으로 불필요하게 이동하는 시스템은 필요없이 채널을 스위칭하는 것이 CR 시스템의 성능을 저하하므로 벌점을 수신할 가능성이 있다. 그러므로 우리는 r0,0(C)=r1 ,0(C)=ρ(C)라 하고, r0 ,1(C)=r1 ,1(C)=ξ(C)라 한다. Let ξ (a) and ρ (a) be the advantages and penalties given to the CR system for selecting action (a), respectively. If the CR system transmits on the channel where the PU is activated, the CR system must be penalized. However, when transmitting on an empty channel, the CR system can benefit from using the channel without distributing the PU. Therefore, in the present invention, r 0,0 (T) = ξ (T), and r 0 , 1 (T) = r 1 , 0 (T) = r 1 , 1 (T) = ρ (T) do. In addition, systems that move unnecessarily out of an empty channel are likely to receive penalties as switching channels unnecessarily degrades the performance of the CR system. Therefore, we say r 0,0 (C) = r 1 , 0 (C) = ρ (C), and r 0 , 1 (C) = r 1 , 1 (C) = ξ (C).
한편, CR 시스템이 PU가 존재하는지 비 존재하는지 확신하지 못한다면, CR 시스템은 특징 검출을 수행하는 것이 추천가능하며, 비어있는 채널 상에서 전송함이 없이 감지하는 것은 무익하다. 따라서, 본 발명에서는 r0,1(F)=r1,0(F)==r1,1(F)=ξ(F)라 하고, r0,0(F)=ρ(F)라 한다.On the other hand, if the CR system is not sure whether the PU exists or not, it is recommended that the CR system perform feature detection, and it is useless to detect without transmitting on an empty channel. Therefore, in the present invention, r 0,1 (F) = r 1,0 (F) = = r 1,1 (F) = ξ (F), and r 0,0 (F) = ρ (F). do.
채널 상태(st)는 직접 관찰가능한 값이 아니라 관찰 값{Ω1, Ω2,..., Ωt}으로부터 추론만 될 수 있는 것이다. πi(0)를 채널 상태가 초기 시간에 0일 확률(즉 πi(0) = Pr {so = i})이라고 하자. 그러면, Π(0) = (π0(0), π1(0))는 채널 상태의 초기 분포이다. t번째 구간에서 채널 상태의 분포는 Π(0) 및 액션과 관찰 값의 공동 자취(joint trace), (A0, Ω1, A1, Ω2, ..., At -1, Ωt)로부터 획득될 수 있다. 본 발명에서는 πi(t) = Pr{st=i│Π(0), A0, Ω1, ..., At -1, Ωt}라고 정의하자. 그러면, Π(t)=(π0(t), π1(t))는 t번째 결정 구간에서 신뢰 벡터(belief vector)라고 불린다. Π(t)를 t번째 구간에서 결정을 하는데 필요한 모든 정보를 요약한 것이라는 것을 주목하자. 그러므로 베이스 스테이션은 각 결정 구간에서 신뢰 벡터를 계산하여야 한다.The channel state s t can be inferred only from the observed values {Ω 1 , Ω 2 , ..., Ω t }, not directly observable values. Let π i (0) be the probability that the channel state is zero at the initial time (ie π i (0) = Pr {s o = i}). Then, π (0) = (π 0 (0), π 1 (0)) is the initial distribution of the channel state. The distribution of channel states in the t-th interval is Π (0) and the joint trace of the action and observed values, (A 0 , Ω 1 , A 1 , Ω 2 , ..., A t -1 , Ω t Can be obtained from In the present invention, it is defined that π i (t) = Pr {s t = i│Π (0), A 0 , Ω 1 , ..., A t -1 , Ω t }. Then, π (t) = (π 0 (t), π 1 (t)) is called a confidence vector in the t-th decision interval. Note that it is a summary of all the information needed to make π (t) in the t-th interval. Therefore, the base station must calculate a confidence vector in each decision interval.
t번째 구간에서 취해진 액션과 (t+1) 번째 구간에서 측정된 관찰 값에 기초하여, t번째 구간으로부터 (t+1) 번째 구간까지 신뢰 벡터의 변환 Π(t+1)=(Γ0(Π(t), At, Ωt+1), Γ1(Π(t), At, Ωt+1))은 다음과 같이 베이즈(Bayes)의 수식을 사용하여 특정된다. At=T 또는 F일 때,Based on the action taken in the t-th interval and the observed values measured in the (t + 1) th interval, the transformation of the confidence vector from the tth interval to the (t + 1) th interval Π (t + 1) = (Γ 0 ( Π (t), A t , Ω t + 1 ), Γ 1 (Π (t), A t , Ω t + 1 )) are specified using Bayes' equation as follows. When A t = T or F,
수식 (1) 부터 (5) 및 (7)을 사용하여, 베이스 스테이션은 Π(t)로부터 Π(t+1)을 계산할 수 있다.Using equations (1) through (5) and (7), the base station can calculate π (t + 1) from Π (t).
한편, At=C일 때에는 관찰 값이 없다. 새로운 채널로 이동할 때, 시스템은 채널 풀로부터 비어있는 채널을 선택하고자 시도한다. 이를 위해, CR 시스템의 대부분은 대역 밖 감지을 통해 스위칭하기 위해 비어있는 채널의 리스트를 유지한다.On the other hand, there is no observed value when A t = C. When moving to a new channel, the system attempts to select an empty channel from the channel pool. To this end, most of the CR system maintains an empty list of channels for switching through out-of-band sensing.
이들 후보 채널은 비어 있을 확률이 높으나 이들 중 일부 채널은 감지 에러로 인해 PU에 의해 실제 점유되어 있을 수 있다. Pvac를 새로운 채널이 t번째 결정 구간에서 실제 비어 있을 확률이라고 하자. 본 발명에서는 채널 풀에 있는 모든 채널이 동일한 PU 액션 모델을 가지는 것이라고 가정하고 있으므로, 새로운 채널의 상태가 채널 스위칭이 완료되는 (t+1) 번째 구간에서 i일 확률은 아래의 수식(8)과 같다.These candidate channels are likely to be empty, but some of them may actually be occupied by the PU due to sensing errors. Let P vac be the probability that the new channel is actually empty in the t-th decision interval. Since the present invention assumes that all channels in the channel pool have the same PU action model, the probability that the state of the new channel is i in the (t + 1) th period in which channel switching is completed is expressed by Equation (8) below. same.
신뢰 벡터는 각 결정 구간에서 결정을 하는데 필요한 모든 정보를 요약한 것이므로, 베이스 스테이션은 마지막 액션과 가장 최근의 관찰 값을 사용하여 이 신뢰 벡터를 갱신하고 이에 기초하여 액션을 선택한다. 정책 δ : Π → A가 신뢰 벡터로부터 액션으로 맵핑하는 함수이다. 여기에는 많은 가능한 정책들이 있을 수 있다. 이들 중에서, 베이스 스테이션은 정책에 따라 선택된 액션을 취하는 것에 의해 결정 시간에 바로 얻은 보상(순간 보상)과 미래에 얻을 것으로 기대되는 보상의 합인 보상의 총 예상되는 디스카운트된 합을 최대화하는 최적의 정책(δ*)을 채택하여야 한다. 미래의 보상은 일반적으로 순간 보상만큼 가치가 없는 것으로 평가되므로, 이들 미래의 보상은 계수 β(0≤β≤1)만큼 디스카운트된다는 것이 주목된다.Since the confidence vector summarizes all the information needed to make a decision in each decision interval, the base station updates this confidence vector using the last action and the most recent observation and selects an action based on that. Policy δ: π → A is a function that maps from a trust vector to an action. There can be many possible policies. Of these, the base station is responsible for maximizing the total expected discounted sum of rewards, which is the sum of the rewards (immediate rewards) obtained immediately at decision time by taking action selected according to the policy and the rewards expected to be obtained in the future. δ * ) shall be adopted. It is noted that since future rewards are generally valued as not as valuable as instant rewards, these future rewards are discounted by a coefficient β (0 ≦ β ≦ 1).
최적의 정책을 찾기 위해, 본 발명에서는 먼저 최적의 값 함수(V*(Π))를, 최적의 정책이 적용될 것으로 가정될 때 신뢰 벡터 Π=(π0,π1)에서 시작하여 시스템이 취할 수 있는 보상의 총 예상되는 디스카운트된 합이라고 정의한다. va *(Π)를 액션(a)이 취해질 때 신뢰 벡터(Π)에서 시작하여 보상의 최대 가능한 예상되는 디스카운트된 합이라고 하자. a = T 또는 F일 때,In order to find the optimal policy, the present invention first takes the optimal value function (V * (Π)) and takes the system into account, starting with the confidence vector π = (π 0 , π 1 ) when the optimal policy is to be applied. It is defined as the total expected discounted sum of possible rewards. Let v a * (Π) be the maximum possible expected discounted sum of the reward starting from the confidence vector Π when action (a) is taken. when a = T or F,
여기서 이다.here to be.
[수식 9]에서, 첫 번째 항은 순간 보상이고, 두 번째 항은 디스카운트된 미래의 보상이다. 한편, 액션(C)이 취해질 때,In
이때, 주어진 신뢰 벡터(Π), 최적의 값 함수, 즉 V*(Π) 및 최적의 정책(δ*(Π))에 대해,At this time, for a given confidence vector Π, optimal value function, i.e., V * (Π) and optimal policy δ * (Π),
본 발명에서는 동적 프로그래밍에 기초하여 값 반복 방법을 사용하여 최적의 값 함수와 최적의 정책을 계산할 수 있다.In the present invention, an optimal value function and an optimal policy can be calculated using a value iteration method based on dynamic programming.
도 3은 채널이 비어 있을 확률(π0)에 따라 3가지 액션의 최적의 값 함수를 도시한다. π0이 신뢰 벡터 Π=(π0, π1)의 제 1 요소라는 것이 주목된다. 도면을 얻는데 사용되는 파라미터 값은 다음과 같다. CR 노드의 수는 M = 10이고, 미래의 보상의 디스카운트 계수는 β = 0.9이며, 스위칭을 하기 위해 선택된 새로운 채널이 실제 비어있을 확률은 Pvac = 1.0이다. 3가지 동작 모드의 지속시간은 ℓF = 20ms, ℓC = 250ms, ℓT = 10ms 및 ℓE = 50㎲로 설정된다. 그리고 λ=μ=초당 1/3600이며, 이는 채널 상에서 PU의 ON 및 OFF 지속시간이 각각 1시간이라는 것을 의미한다. 나아가, 각 액션을 위한 이점과 벌점은 ξ(T)=1, ρ(T)=-10, ξ(F)=1, ρ(F)=-1 및 ξ(C)=10, ρ(C)=-10으로 설정된다. 이값으로, 본 발명에서는 [수식 6]을 사용하여 주어진 채널 상태에 대해 각 액션의 보상을 계산할 수 있다. 한편, 에너지 검출과 특징 검출에 대해 알람이 잘못된 확률은 0.1%, 즉 Pf(E)=Pf(F)=0.001로 설정된다. 그리고 PU 오검출 확률은 베이스 스테이션에서 Pm(E)=0.173이고 Pm(F)=0.282×10-4이고, 다른 CR 노드에서 Pm(E)=0.893이고, Pm(F)=0.035이다. (후술하는 물리적인 스펙트럼 감지를 위한 시뮬레이션 모델을 사용하여 이들 오검출 확률을 얻었다).3 shows the optimal value function of the three actions according to the probability that the channel is empty π 0 . It is noted that π 0 is the first element of the confidence vector π = (π 0 , π 1 ). The parameter values used to obtain the drawings are as follows. The number of CR nodes is M = 10, the discount factor for future compensation is β = 0.9, and the probability that the new channel selected for switching is actually empty is P vac = 1.0. The durations of the three operating modes are set at l F = 20 ms, l C = 250 ms, l T = 10 ms and l E = 50 ms. And [lambda] = [mu] = 1/3600 per second, which means that the ON and OFF durations of the PU on the channel are 1 hour each. Furthermore, the advantages and penalties for each action are ξ (T) = 1, ρ (T) =-10, ξ (F) = 1, ρ (F) =-1 and ξ (C) = 10, ρ (C ) =-10. With this value, the present invention can use
본 발명에서는 도 3에서 채널이 비어있을 확률이 더 높아질 때 T/R-ED 모드 를 선택하여 얻어진 총 보상은 증가하는 반면, FD 모드와 CS 모드를 위한 총 보상은 감소하며 특히 CS 모드에서 감소율이 FD 모드에서의 감소율보다 훨씬 더 크다는 것을 볼 수 있다. 이 도면으로부터 알 수 있는 바와 같이, 채널이 비어있을 확률이 더 높아질수록 T/R-ED 모드를 선호하고, 낮아질수록 CS 모드를 더 선호하게 된다.In the present invention, the total compensation obtained by selecting the T / R-ED mode is increased when the channel is more likely to be empty in FIG. It can be seen that it is much larger than the reduction rate in the FD mode. As can be seen from this figure, the higher the probability that the channel is empty, the more preferred the T / R-ED mode, and the lower, the more preferred the CS mode.
본 발명에서의 목표는 주어진 신뢰 벡터에 대해 최적의 액션을 제공하는 최적의 정책을 찾는 것이라는 것을 주목하자. 도 3은 제안된 POMDP 구성에서 최적의 정책은 간단히 2개의 임계 값(κ CS 및 κ FD )으로 표시될 수 있다는 것을 보여준다. 이 도면의 예에서, π0 ≤κ CS 일 때, 최적의 액션은 채널 스위칭이고, κ CS < π0 ≤ κ FD 에 대해 특징 검출이 최적의 액션으로 된다. 그리고 보다 더 큰 π0에 대해 최적의 액션은 T/R-ED 모드이다. 그 결과 베이스 스테이션은, 신뢰 벡터(π0, 1-π0)를 계산하고 2개의 결정 임계값(κ CS 및 κ FD )과 π0를 비교하여 CR 시스템의 동작 모드를 간단히 선택할 수 있다.Note that the goal in the present invention is to find the best policy that provides the best action for a given trust vector. 3 shows that the optimal policy in the proposed POMDP configuration can simply be represented by two thresholds ( κ CS and κ FD ). In the example of this figure, when π 0 ≤ κ CS , the optimal action is channel switching, and for κ CS <π 0 ≤ κ FD , feature detection becomes the optimal action. And The optimal action for larger π 0 is T / R-ED mode. As a result, the base station can simply select the operating mode of the CR system by calculating the confidence vectors π 0 , 1-π 0 and comparing the two decision thresholds κ CS and κ FD with π 0 .
제안된 동작 모드의 선택 구조는 POMDP 구성에 기초하여 CR 시스템의 동작 모드를 최적으로 선택한다. 후술하는 알고리즘 1은 제안된 구조에서 베이스 스테이션의 작업을 설명한다. 알고리즘 1에서, κ FD 및 κ cs 는 제안된 POMDP 모델을 사용하여 계산된 시스템 파라미터이다.The selection structure of the proposed operation mode optimally selects the operation mode of the CR system based on the POMDP configuration.
도 4는 제안된 구조의 적응성을 도시하는 일례이다. 사용되는 파라미터 값은 도 3의 것과 동일하다. PU가 CR 시스템의 동작 채널에 대해 활성화되면, T/R-ED 모 드에서 CR 노드에 의해 발생한 PU 검출 알람의 수는 증가하며, 이것은 π0의 감소를 초래한다. π0의 감소의 양은 PU 검출 알람의 수에 좌우된다. 노드가 검출 알람을 더 많이 보고하면 할수록, π0의 값은 더 낮아지게 된다. PU 검출 알람의 수(즉, 관찰 값)는 각 CR 노드에서 잡음 전력과 수신된 PU 신호 전력과 같은 시간 가변 계수에 좌우된다는 것이 주목된다. 이 관측 값의 랜덤한 특성으로 인해, 채널 스위칭이 결정될 때까지 수행되는 연속적인 동작들이 시간에 따라 변한다. 예를 들어, 도 4의 시나리오에서, PU가 370ms에서 채널 1에 나타나면, 채널 1에서 동작하는 CR 시스템은 2개의 추가적인 에너지 검출(T/R-ED 모드에서)과 하나의 특징 검출을 수행한 후에 채널 2로 이동한다. 한편, PU가 100300ms에서 채널 2에 대해 활성화되면, CR 시스템은 베이스 스테이션이 PU의 존재가 확실한 만큼 많은 노드로부터 검출 알람을 수신하였기 때문에 특징 검출 없이 2개의 추가적인 에너지 검출로부터 나온 결과에 기초하여 채널 3으로의 스위칭을 결정한다. 이 예로부터 관찰되는 바와 같이, 제안된 구조는 채널 비어있음에 대한 매트릭으로 사용되는 PU 검출 알람을 발생하는 CR 노드의 수에 따라 동작 모드를 적응적으로 선택한다.4 is an example illustrating the adaptability of the proposed structure. The parameter value used is the same as that of FIG. If the PU is activated for the operating channel of the CR system, the number of PU detection alarms generated by the CR node in T / R-ED mode increases, which results in a decrease of π 0 . The amount of decrease in π 0 depends on the number of PU detection alarms. The more the node reports the detection alarm, the lower the value of π 0 . It is noted that the number of PU detection alarms (ie, observed values) depends on time varying coefficients such as noise power and received PU signal power at each CR node. Due to the random nature of this observation, the successive operations performed until channel switching is determined vary over time. For example, in the scenario of FIG. 4, if a PU appears on
Algorithm1 : Operation Mode SelectionAlgorithm1: Operation Mode Selection
while CR system is active dowhile CR system is active do
j← the number of PU detection alarms reported from CR nodes; j ← the number of PU detection alarms reported from CR nodes;
Calculate Calculate
Calculate Calculate
end end
else else
Calculate Calculate
end end
if if
end end
else if else if
end end
else else
end end
t ← t+1; t ← t + 1;
endend
본 발명에서는 IEEE 802.22 WRAN의 스펙트럼 감지 제안을 평가하기 위한 시뮬레이션 방법론으로 제안된 다음의 시뮬레이션 모델을 사용한다. 이 모델에서, PU는 617MHz에서 동작하고 1MW의 전송전력을 사용하는 ATSC DTV 스테이션이다. DTV 스테이션의 안테나 높이는 500m이며 채널 대역폭은 6MHz이다. CR 네트워크는 M개의 CR 노드, 즉 하나의 베이스 스테이션과 (M-1) 개의 CPE 스테이션으로 구성된다. CPE 노드는 베이스 스테이션에 중심을 둔 16.7km의 반경을 갖는 원 내에 랜덤하게 위치된다.The present invention uses the following simulation model proposed as a simulation methodology for evaluating the spectral sensing proposal of IEEE 802.22 WRAN. In this model, the PU is an ATSC DTV station operating at 617 MHz and using 1 MW transmit power. The antenna height of the DTV station is 500m and the channel bandwidth is 6MHz. The CR network consists of M CR nodes, namely one base station and (M-1) CPE stations. CPE nodes are randomly located in a circle with a radius of 16.7 km centered on the base station.
그리고 베이스 스테이션과 CPE 스테이션은 각각 베이스 스테이션에 대해 75m의 높이와 CPE 스테이션에 대해 10m의 높이를 갖는 전방향 수신 안테나를 가지고 있다. 본 발명에서는 617MHz에서 수신된 전력은 전계 강도에 -133dB를 더하여 획득한 것이며, F(50,90) 곡선에 대한 전계 강도에 기초하여 CR 노드와 DTV 송신기 사이의 거리를 이용해 CR 노드에서 수신된 전력을 계산한다.The base station and the CPE station each have an omnidirectional receive antenna having a height of 75m for the base station and a height of 10m for the CPE station. In the present invention, the received power at 617 MHz is obtained by adding -133 dB to the field strength, and the power received at the CR node using the distance between the CR node and the DTV transmitter based on the field strength for the F (50,90) curve. Calculate
도 5는 PU로부터 거리에 따라 베이스 스테이션과 CPE 스테이션에서 수신된 PU 신호 전력을 도시한 것이다. 본 발명에서는 CR 노드에서 수신된 PU 신호 전력을 계산할 때 도 5의 경로 손실뿐만 아니라 5.5dB 표준 편차를 갖는 로그 정규 섀도 페이딩(lognormal shadow fading)을 고려한다.5 shows the PU signal power received at the base station and the CPE station according to distance from the PU. In the present invention, when calculating the PU signal power received at the CR node, not only the path loss of FIG. 5 but also lognormal shadow fading with 5.5 dB standard deviation is considered.
본 발명에서는 테스트 통계 값이 수신된 신호 전력인 에너지 검출 모델로 참고문헌 S. Shellhammer, S. Shankar N., R. Tandra, and J. Tomcik, "Performance of power detector sensors of DTV signals in IEEE 802.22 WRANs," in Proc. ACM TAPAS 2006, Aug. 2006.에 있는 전력 검출을 사용한다. 2개의 가설, 즉 채널이 비어있다는 가설(Ho)과, 채널이 PU로 채워져 있다는 가설(H1)이 테스트 된다. B가 채널 대역폭이라고 할 때, No는 잡음 전력 스펙트럼 밀도이며, ns는 샘플의 수이고, 테스트 통계 값이 Ho에서 평균 NoB와 분산(NoB)2/ns를 갖는 가우시안 랜덤 변수이다. 그리고 H1에서, 테스트 통계 값은 평균 PR+NoB와 분산(PR+NoB)2/ns를 갖는 가우시안 랜덤 변수로 되며, 여기서 PR은 CR 노드에서 수신된 PU 신호 전력이다. 사용된 모델에서, 수신된 신호는 나이키스트(Nyquist) 비율로 샘플링되므로, 샘플의 수는 ℓE의 에너지 검출 시간으로 이다. 이 모델에서 검출 임계값이 이고, 노드에서 수신된 PU 신호 전력이 PR일 때, 이 노드에서 전력 검출기의 오 검출 확률은 다음 수식으로 주어진다.In the present invention, the test statistic value is an energy detection model of received signal power. References S. Shellhammer, S. Shankar N., R. Tandra, and J. Tomcik, "Performance of power detector sensors of DTV signals in IEEE 802.22 WRANs" , "in Proc. ACM TAPAS 2006, Aug. Uses power detection in 2006. Two hypotheses, that is, the hypothesis (H o ) that the channel is empty, and the hypothesis (H 1 ) that the channel is filled with PU are tested. When B is the channel bandwidth, N o is the noise power spectral density, n s is the number of samples, and the test statistic is a Gaussian with an average N o B and variance (N o B) 2 / n s at H o . Random variable. And at H1, the test statistic is a Gaussian random variable with mean P R + N o B and variance (P R + N o B) 2 / n s , where P R is the PU signal power received at the CR node . In the model used, the received signal is sampled at the Nyquist ratio, so the number of samples is at an energy detection time of ℓ E. to be. In this model, the detection threshold is When the PU signal power received at the node is P R , the false detection probability of the power detector at this node is given by the following equation.
시뮬레이션에서 는 0.1%의 오 알람 확률을 야기하는 값으로 설정되며, 이에 따라 Pf(E) = 0.001이다. 그리고 ℓE = 50㎲, B = 6MHz, No = -163dBm/Hz이다.In the simulation Is set to a value that causes a false alarm probability of 0.1%, whereby P f (E) = 0.001. And ℓ E = 50㎲, B = 6MHz, N o = -163 dBm / Hz.
[수식 13]에서 보는 바와 같이, 오 검출 확률은 CR 노드의 수신된 신호 전력, 즉 네트워크 내 노드의 위치에 크게 좌우된다. 오 검출 확률에 대한 네트워크 형태의 효과를 완화하기 위하여, 본 발명에서는 100,000번의 시뮬레이션 실행을 수행한다. 각 시뮬레이션 실행에서 CR 노드는 반경 16.7km의 원 내에 랜덤하게 위치되며, 각 노드에서 수신된 PU 전력은 도 5의 경로 손실과 5.5dB의 표준 편차를 갖는 로그 정규 섀도를 고려하여 결정된다. 이때, 시뮬레이션 실행으로부터 각 노드에서 오 검출 확률의 순간은 [수식 13]을 사용하여 계산된다. 마지막으로 본 발명에서는 대응하는 노드에서 Pm(E)로서 100,000번의 시뮬레이션 실행으로부터 오 검출 확률의 평균을 취한다.As shown in Equation 13, the false detection probability greatly depends on the received signal power of the CR node, that is, the position of the node in the network. In order to mitigate the effect of the network type on the false detection probability, the present invention performs 100,000 simulation runs. In each simulation run, CR nodes are randomly located within a circle of 16.7 km radius, and the PU power received at each node is determined taking into account the log normal shadow with the path loss of FIG. 5 and the standard deviation of 5.5 dB. At this time, the instant of the false detection probability at each node from the simulation execution is calculated using [Equation 13]. Finally, the present invention averages false detection probabilities from 100,000 simulation runs as P m (E) at the corresponding node.
본 발명에서는 참고문헌 H.-S. Chen, W. Gao, and D. G. Daut, "Spectrum sensing using cyclostationary properties and application to IEEE 802.22 WRAN," in Proc. IEEE GLOBECOM 2007, Nov. 2007.에서 주기 정상(cyclostationary) 특징 검출 모델을 갖는 특징 검출기의 오 알람 및 오 검출 확률을 평가하는 시뮬레 이션을 수행한다. 사용되는 모델에서 PU(ATSC DTV 스테이션)는 주기 정상 특성을 갖는 파일럿 톤 신호를 송신한다. 그러므로 본 발명에서는 ATSC DTV 시스템의 존재를 검출하기 위해 파일럿 톤 신호의 주기 정상을 사용할 수 있다. 상기 참고문헌 H.-S. Chen, W. Gao, and D. G. Daut, "Spectrum sensing using cyclostationary properties and application to IEEE 802.22 WRAN," in Proc. IEEE GLOBECOM 2007, Nov. 2007.에 따라, ATSC DTV의 파일럿 톤 신호는 f0의 반송파 주파수를 갖는 간단한 코사인 파이다. 추가적인 백색 가우시안 잡음이 파일럿 톤 신호와 함께 수신되는 것으로 가정된다. 주기 정상 특징 검출기는 수신된 신호의 순환 스펙트럼을 사용하여 PU의 존재를 결정한다. 순환 스펙트럼을 얻기 위하여, 본 발명에서는 파일럿 톤 신호에 고속 푸리에 변환(FFT) 기반 이산 주파수 평활화 방법을 적용한다. 상기 참고문헌 H.-S. Chen, W. Gao, and D. G. Daut, "Spectrum sensing using cyclostationary properties and application to IEEE 802.22 WRAN," in Proc. IEEE GLOBECOM 2007, Nov. 2007.에서와 같이 본 발명에서는 FFT 크기가 2048이고 평활화 계수가 5이고 f0가 2.69MHz이고 시간 샘플링 증가분이 0.18578㎲인 경우를 고려한다. 이론적으로, 파일럿 톤 신호에 대한 결과적인 주기 스펙트럼은, 주파수가 0이고 주기 주파수가 2f0일 때 0이 아닌 값을 가진다. 그러므로 주기 정상 특징 검출기는 주파수가 0이고 주기 주파수가 2f0일 때 주기 스펙트럼의 절대값을 테스트 통계값으로 사용한다. 노드에서 특징 검출기는 검출 임계값 와 테스트 통계 값 을 비교하여 PU가 존재하는지 비 존재하는지를 결정한다. 얻어진 테스트 통계 값이 보다 더 크다면, CR 노드에서 특징 검출기는 ATSC DTV 신호가 존재하는 것으로 결정한다. 그렇지 않으면 채널이 비어 있는 것으로 간주된다. 본 발명에서는 1.4의 조절 계수를 가지고 상기 참고문헌에 있는 [수식 35]를 사용하여 를 계산한 결과치인 0.1%의 목표 오 알람 확률 Pf(F)을 충족시키기 위해 를 취한다. 를 CR 노드에서 수신된 DTV 파일럿 신호 전력이 PR이라 할 때 특징 검출기의 오 검출 확률을 나타낸다고 하자. 에너지 검출에서와 같이, 각 노드에 대해 본 발명에서는 시뮬레이션 실행으로부터 을 얻고 100,000번의 실행으로부터 이들 값을 평균하여 오 검출 확률 Pm(F)을 계산한다.In the present invention, reference is made to the reference H.-S. Chen, W. Gao, and DG Daut, "Spectrum sensing using cyclostationary properties and application to IEEE 802.22 WRAN," in Proc. IEEE GLOBECOM 2007, Nov. In 2007, we perform a simulation to evaluate false alarms and false detection probability of feature detectors with a cyclostationary feature detection model. In the model used, the PU (ATSC DTV station) transmits a pilot tone signal with periodic normal characteristics. Therefore, the present invention can use the period normal of the pilot tone signal to detect the presence of the ATSC DTV system. References H.-S. Chen, W. Gao, and DG Daut, "Spectrum sensing using cyclostationary properties and application to IEEE 802.22 WRAN," in Proc. IEEE GLOBECOM 2007, Nov. According to 2007., the pilot tone signal of an ATSC DTV is a simple cosine wave with a carrier frequency of f 0 . It is assumed that additional white Gaussian noise is received with the pilot tone signal. The periodic normal feature detector uses the cyclic spectrum of the received signal to determine the presence of the PU. In order to obtain a cyclic spectrum, the present invention applies a fast Fourier transform (FFT) based discrete frequency smoothing method to a pilot tone signal. References H.-S. Chen, W. Gao, and DG Daut, "Spectrum sensing using cyclostationary properties and application to IEEE 802.22 WRAN," in Proc. IEEE GLOBECOM 2007, Nov. As in 2007, the present invention considers the case where the FFT size is 2048, the smoothing coefficient is 5, f 0 is 2.69 MHz, and the time sampling increment is 0.18578 ms. In theory, the resulting periodic spectrum for the pilot tone signal has a nonzero value when the frequency is zero and the periodic frequency is 2f 0 . Therefore, the period normal feature detector uses the absolute value of the periodic spectrum as a test statistic when the frequency is zero and the periodic frequency is 2f 0 . Feature detector at the node detects the threshold The test statistics are compared to determine whether the PU exists or not. The test statistics obtained If greater, the feature detector at the CR node determines that an ATSC DTV signal is present. Otherwise the channel is considered empty. In the present invention, using an equation (35) in the above reference with a control factor of 1.4 To satisfy the target false alarm probability P f (F) of 0.1%. Take Let s denote the probability of false detection of the feature detector when the power of the DTV pilot signal received at the CR node is P R. As with energy detection, for each node in the present invention, from the simulation run The error detection probability P m (F) is calculated by averaging these values from 100,000 runs.
시뮬레이션에서, 본 발명에서는 잡음 불명확성이 존재하는 경우를 고려한다. No의 잡음 전력 스펙트럼 밀도를 가지고, dB 단위로 η의 잡음 불명확성이 존재한다면, 실제 잡음 전력 스펙트럼 밀도는 No+e 로 주어지며, 여기서 e 는 평균이 제로(0)이고 표준 편차가 η인 가우시안 랜덤 변수이다.In the simulation, the present invention considers the case where noise uncertainty exists. Has the noise power spectral density N o, if the noise uncertainty of η present in dB, the actual noise power spectral density is given by N o + e, where e is an average of zero and a standard deviation of η Gaussian random variable.
CR 시스템의 최대 채널 이용과 PU 검출 지연은 성능 평가를 위한 척도로서 사용된다. CR 시스템의 최대 채널 이용률은 채널 감지, 채널스위칭과 같은 무선인지 특성으로부터 유래하는 동작을 위해서 이용된 채널 시간을 제외한 CR 시스템이 전송을 위해서 이용할 수 있는 시간의 퍼센트를 의미하며, PU 검출 지연은 PU의 활성시로부터 CR 시스템이 채널 스위칭을 시작하기 바로 직전 시간까지의 기간이다.Maximum channel usage and PU detection delay of the CR system are used as a measure for performance evaluation. The maximum channel utilization of the CR system refers to the percentage of time that the CR system can use for transmission, excluding the channel time used for operations derived from radiocognitive characteristics such as channel sensing and channel switching, and the PU detection delay is PU Is the period from the time of activation of the time immediately before the CR system starts channel switching.
달리 언급이 없으면 시뮬레이션 파라미터 값은 다음과 같다. LT = 10ms, LF = 20ms, LC = 250ms, LE = 50㎲, M = 10, λ=μ=(초당)1/3600, Pvac = 1.0, β = 0.9, ξ(T) = 1, ρ(F) = -10, ξ(F) = 1, ρ(F) = -1, ξ(C) = 10 및 ρ(C) = -10이다.Unless otherwise noted, the simulation parameter values are as follows. L T = 10 ms, L F = 20 ms, L C = 250 ms, L E = 50 μs, M = 10, λ = μ = (per second) 1/3600, P vac = 1.0, β = 0.9, ξ (T) = 1, ρ (F) = -10, ξ (F) = 1, ρ (F) -1, ξ (C) = 10 and ρ (C) =- 10.
도 6은 제안된 구조의 성능에 대한 잡음 불명확성(η)과 수신된 PU 신호 전력의 영향을 도시한다. 도 5에서 볼 수 있는 바와 같이, 베이스 스테이션에서 -98dBm의 수신된 PU 신호 전력은 베이스 스테이션이 DTV 스테이션(PU)으로부터 약 258km 떨어진 곳에 있다는 것을 의미하고, 이때 이 PU로부터 동일한 거리에 위치된 CPE 스테이션의 평균 수신 PU 신호 전력은 약 -116dBm(802.22 WRAN의 요구조건에 따르면 IEEE 802.22-05/0007r48, "Functional requirements for the 802.22 WRAN standard,"Nov. 2006.에서 CR 시스템은 -116dBm보다 더 높은 PU 신호 전력을 검출할 수 있어야 한다. 즉, -116dBm은 검출하는데 요구되는 최대로 약하게 수신된 PU 신호 전력이다.)이라는 것이 주목된다. 수신된 PU 신호 전력이 약하거나 잡음 불명확성이 존재하는 경우, T/R-ED 모드에서 베이스 스테이션이 CR 노드로부터 PU 검출 알람을 수신하더라도, 에너지 검출기의 알람이 잘못될 확률이 매우 높아 채널 상에 PU가 존재한다고 확신하지 못한다. 이 경우에 베이스 스테이션은 CR 노드에 명령하여 보다 정확한 조사를 위해 특징 검출을 수행하게 하여야 한다.6 shows the influence of noise uncertainty η and the received PU signal power on the performance of the proposed structure. As can be seen in Figure 5, the received PU signal power of -98 dBm at the base station means that the base station is about 258 km away from the DTV station (PU), where a CPE station located at the same distance from this PU The average received PU signal power is approximately -116 dBm (according to IEEE 802.22-05 / 0007r48, "Functional requirements for the 802.22 WRAN standard," Nov. 2006. It should be noted that power should be able to be detected, ie -116 dBm is the maximum weakly received PU signal power required to detect. If the received PU signal power is weak or there is noise uncertainty, even if the base station receives a PU detection alarm from the CR node in T / R-ED mode, there is a very high probability that the alarm of the energy detector will go wrong with the PU on the channel. Not sure that it exists. In this case, the base station should command the CR node to perform feature detection for more accurate investigation.
도 6(a)에서 볼 수 있는 바와 같이, 제안된 POMDP 기반 구조에서, FD 모드를 선택하는 결정 임계값 κFD의 값은 잡음 불명확성이 증가함에 따라 수신된 PU 신호 전력이 더 낮아짐에 따라 더 높아지게 된다. 이것은 CR 시스템이 특징 검출을 보다 더 일찍 수행하게 하며 그 결과 CR 시스템은 PU 검출 지연을 감소시킬 수 있다. 나아가, 본 발명에서는 도 6(a)에서 CS 모드를 선택하는 결정 임계값 κCD이 잡음 불명확성과 수신된 PU 신호 전력에 의해 거의 영향을 받지 않는다는 것을 볼 수 있다. 이것은 잡음 불명확성이 존재하고 PU 신호가 더 약해지더라도 특징 검출이 여전히 신뢰할 만한 감지 결과를 생산하기 때문이다.As can be seen in FIG. 6 (a), in the proposed POMDP infrastructure, the value of the decision threshold κ FD for selecting the FD mode becomes higher as the received PU signal power becomes lower as noise uncertainty increases. do. This allows the CR system to perform feature detection earlier and as a result the CR system can reduce the PU detection delay. Furthermore, in the present invention, it can be seen from Fig. 6 (a) that the decision threshold κ CD for selecting the CS mode is hardly affected by the noise uncertainty and the received PU signal power. This is because there is noise uncertainty and feature detection still produces reliable detection results even if the PU signal is weaker.
한편, 도 6(b)에 도시된 바와 같이, 제안된 구조는 높은 잡음 불명확성에서 수신된 PU 신호 전력이 매우 약하더라도 높은 채널 이용률을 제공한다. 이것은 제안된 구조를 갖는 CR 시스템이 특징 검출에 들어가기 수 시간 전에 에너지 검출을 수행함으로써 에너지 검출로부터 오 알람에 의해 야기된 불필요한 특징 검출을 피할 수 있게 하기 때문이다. 특징 검출 시간이 일반적으로 에너지 검출 시간보다 훨씬 더 길기 때문에, PU가 없는 경우 특징 검출을 빈번히 수행하는 것은 채널 이용 성능을 크게 저하시킨다는 것이 주목된다. 제안된 구조에서, 신뢰 벡터가 알람의 수에 따라 갱신되므로, PU 활성과 특징 검출 사이에 에너지 검출의 수는 PU 신호 전력과 잡음 불명확성의 정도에 따라 적응적으로 조절된다. 그러므로 더 약한 PU 신호 전력 및/또는 더 높은 잡음 불명확성은 특징 검출 전에 더 많은 에너지 검출을 요구하며, 이에 따라 더 긴 PU 검출 지연을 초래한다. 그러나 도 6(b)에 도시된 바와 같이, 높은 잡음 불명확성에서 매우 약한 PU 신호를 검출하는데 걸리는 시간 도 최대 허용가능한 PU 검출 지연으로 정의되고 통상 IEEE 802.22 WRAN에서 2초로 주어진 검출 지연 제한시간보다 더 짧다.On the other hand, as shown in Fig. 6 (b), the proposed structure provides high channel utilization even if the received PU signal power is very weak at high noise ambiguity. This is because a CR system with the proposed structure can avoid unnecessary feature detection caused by false alarms from energy detection by performing energy detection several hours before entering feature detection. Since the feature detection time is generally much longer than the energy detection time, it is noted that frequent feature detection in the absence of a PU significantly degrades channel utilization performance. In the proposed structure, since the confidence vector is updated according to the number of alarms, the number of energy detections between PU activity and feature detection is adaptively adjusted according to the PU signal power and the degree of noise ambiguity. Therefore, weaker PU signal power and / or higher noise uncertainty requires more energy detection prior to feature detection, resulting in longer PU detection delay. However, as shown in Figure 6 (b), the time taken to detect a very weak PU signal at high noise uncertainty is also defined as the maximum allowable PU detection delay and is usually shorter than the detection delay timeout given by 2 seconds in IEEE 802.22 WRAN. .
도 7은 η = 0dB일 때 에너지 검출 시간에 따라 제안된 구조의 성능을 도시한 것이다. 더 긴 에너지 검출 시간은 에너지 검출기의 감지 성능을 개선하는 것은 당연하다. 그러나 에너지 검출은 디폴트 모드인 T/R-ED 모드에 속하기 때문에, 더 긴 에너지 검출 시간은 도면에 보이는 바와 같이 최대 채널 이용률을 더 저하한다. 수신된 PU 신호 전력이 매우 약할 때(PR=-98dBm일 때), PU 검출 알람의 수는 더 긴 에너지 검출 시간으로 인한 개선된 감지 성능으로 인해 증가하며, 이것은 π0의 값이 κFD에 더욱 신속하게 도달하게 한다. 그 결과, 특징 검출은 보다 일찍 수행되며 이것은 더 짧은 PU 검출 지연을 초래한다. 즉, 약한 PU 신호에 대해, 에너지 검출 시간에 따라 PU 검출 지연과 최대 채널 이용률 사이에는 트레이드오프가 존재한다. 그러나 수신된 PU 신호 전력이 강할 때(PR=-62dBm)에는, PU 검출 알람의 수는 에너지 검출 시간이 길어지더라도 크게 증가하지 않는다. 이것은 이 수신된 전력에 대해 에너지 검출기의 PU 오 검출 확률이 짧은 검출 시간으로도 높지 않기 때문이다. 그러므로 CR 시스템이 강한 PU 신호를 수신할 때, 더 긴 에너지 검출 시간은 단순히 검출 지연의 증가 없이 채널 이용 성능을 저하한다.Figure 7 shows the performance of the proposed structure according to the energy detection time when η = 0 dB. Longer energy detection time is natural to improve the detection performance of the energy detector. However, since energy detection belongs to the T / R-ED mode which is the default mode, longer energy detection time further lowers the maximum channel utilization as shown in the figure. When the received PU signal power is very weak (P R = -98 dBm), the number of PU detection alarms increases due to improved detection performance due to longer energy detection time, which means that the value of π 0 is increased to κ FD . To reach more quickly. As a result, feature detection is performed earlier, which results in shorter PU detection delay. That is, for the weak PU signal, there is a tradeoff between the PU detection delay and the maximum channel utilization depending on the energy detection time. However, when the received PU signal power is strong (P R = -62 dBm), the number of PU detection alarms does not increase significantly even if the energy detection time becomes long. This is because, for this received power, the PU false detection probability of the energy detector is not high even with a short detection time. Therefore, when the CR system receives a strong PU signal, the longer energy detection time simply degrades channel utilization performance without increasing the detection delay.
도 8은 η=0dB일 때 제안된 구조의 성능에 대한 특징 검출 시간의 영향을 도시한 것이다. CR 네트워크가 PU로부터 강한 신호를 수신한다고 가정하자. 그러면, 네트워크에 있는 여러 CR 노드들은 PU의 존재를 검출하고 알람을 보고한다. 베이스 스테이션이 많은 노드로부터 알람을 수신하기 때문에, 추가적인 감지 없이 PU 출현을 확신하고 채널 스위칭을 결정한다. 즉, CR 시스템은 하나의 에너지 검출로부터 나오는 감지 결과만으로 채널을 스위칭할지를 결정한다. 그러므로 CR 시스템이 강한 PU 신호를 수신할 때, 특징 검출 없이 PU의 존재를 확신할 수 있으므로, PU 검출 지연은 특징 검출에 의해 전혀 영향을 받지 않는다. 그러나 수신된 PU 신호가 매우 약할 때에는, 베이스 스테이션은 통상 여러 번의 에너지 검출과 특징 검출을 수행한 후에 채널 스위칭을 결정한다. 그러므로 약한 PU 신호의 경우에는, PU 검출 지연은 특징 검출 시간이 길어질 때 증가한다. 한편, 제안된 구조는 채널이 비어있거나 PU 신호가 강한 경우에 특징 검출을 거의 수행하지 않는다는 것이 주목된다. 다시 말해, 특징 검출은 PU가 존재하고 시스템이 PU로부터 약한 신호를 수신할 때에 주로 수행된다. 그 결과, 시스템은 수 회의 특징 검출만을 수행하게 되므로, 동작 채널 상에 머무르는 동안 채널 이용에 대한 특징 검출 시간의 영향은 감지할 수 없다.8 shows the effect of feature detection time on the performance of the proposed structure when η = 0 dB. Assume that the CR network receives a strong signal from the PU. The various CR nodes in the network then detect the presence of the PU and report an alarm. Since the base station receives alarms from many nodes, it determines the PU appearance and determines channel switching without further detection. That is, the CR system determines whether to switch the channel only with the sensing result from one energy detection. Therefore, when the CR system receives a strong PU signal, the presence of the PU can be assured without feature detection, so the PU detection delay is not affected at all by the feature detection. However, when the received PU signal is very weak, the base station typically determines channel switching after performing several energy and feature detections. Therefore, in the case of a weak PU signal, the PU detection delay increases as the feature detection time becomes longer. On the other hand, it is noted that the proposed structure rarely performs feature detection when the channel is empty or the PU signal is strong. In other words, feature detection is primarily performed when there is a PU and the system receives a weak signal from the PU. As a result, the system only performs a few feature detections, so the influence of feature detection time on channel usage while staying on the operating channel cannot be detected.
성능 비교를 위해, 참고문헌 W. S. Jeon, D. G. Jeong, J. A. Han, G. Ko, and M. S. Song, "An efficient quiet period management scheme for cognitive radio systems," IEEE Trans. Wireless Commun., vol. 7, no. 2, pp. 505-509, Feb. 2008.에 있는 감지 스케줄링 구조가 고려된다. 본 발명에서는 이 구조를 연속적인 에너지 검출(ED) 구조라고 부를 것이다. 연속적인 ED 구조에서, CR 시스템은 주기적으로 에너지 검출을 수행하고 에너지 검출로부터 시스템 전체(system-wide) PU 검출 알람이 연속적으로 N회 발생한 후에 특징 검출을 수행한다. 그리고 채널 스위칭은 특징 검출로부터 시스템 전체 알람에 의해 트리거된다. 이 구조에서, 시스템 전체 알람은 하나 이상의 CR 노드들이 PU 검출 알람을 베이스 스테이션에 보고할 때마다 발생하고, 이때 N의 값은 미리 결정된 상수로 고정된다.For a performance comparison, references W. S. Jeon, D. G. Jeong, J. A. Han, G. Ko, and M. S. Song, "An efficient quiet period management scheme for cognitive radio systems," IEEE Trans. Wireless Commun., Vol. 7, no. 2, pp. 505-509, Feb. The discovery scheduling structure in 2008. is considered. In the present invention, this structure will be referred to as a continuous energy detection (ED) structure. In a continuous ED structure, the CR system periodically performs energy detection and performs feature detection after a system-wide PU detection alarm has occurred consecutively N times from the energy detection. Channel switching is then triggered by system-wide alarms from feature detection. In this structure, a system-wide alarm occurs whenever one or more CR nodes report a PU detection alarm to the base station, where the value of N is fixed to a predetermined constant.
도 9a 내지 도 9c는 베이스 스테이션에서 수신된 PU 신호 전력이 약 -79.4dBm일 때 연속적인 ED 구조의 성능에 대한 파라미터 N의 영향을 도시한다. 베이스 스테이션에서 -79.4dBm의 수신된 PU 신호 전력이 참고문헌 S. Shellhammer, V. Tawil, G. Chouinard, M. Muterspaugh, and M. Ghosh, "Spectrum sensing simulation model,"IEEE 802.22-06/0028r10, Sept. 2006.에서 제안된 디폴트값이고 이것은 베이스 스테이션과 PU 사이에 약 150.3km의 거리에 대응한다는 것이 주목된다. 도면으로부터 보는 바와 같이, 연속적인 ED 구조의 성능은 N에 의해 크게 영향을 받으며, 우수한 성능을 제공하는 N의 값은 잡음 불명확성 레벨에 크게 좌우된다. 본 발명에서는 N의 값을 연속적인 ED 구조에서 채널 이용률과 PU 검출 지연 성능 사이의 트레이드오프를 고려하여 0dB, 0.1dB 및 1.0dB의 잡음 불명확성에 대해 각각 2, 8 및 32로 설정한다.9A-9C illustrate the effect of parameter N on the performance of the continuous ED structure when the PU signal power received at the base station is about -79.4 dBm. The received PU signal power of -79.4 dBm at the base station is described in S. Shellhammer, V. Tawil, G. Chouinard, M. Muterspaugh, and M. Ghosh, "Spectrum sensing simulation model," IEEE 802.22-06 / 0028r10, Sept. It is the default value proposed in 2006. It is noted that this corresponds to a distance of about 150.3 km between the base station and the PU. As can be seen from the figure, the performance of the continuous ED structure is greatly influenced by N, and the value of N, which provides good performance, is highly dependent on the noise uncertainty level. In the present invention, the value of N is set to 2, 8, and 32 for noise uncertainty of 0 dB, 0.1 dB, and 1.0 dB, respectively, considering the tradeoff between channel utilization and PU detection delay performance in a continuous ED structure.
본 발명에서는 도 10a 내지 도 10c로부터 제안된 POMDP 기반 구조가 잡음 불명확성 레벨에 상관없이 높은 채널 이용률을 제공하는 반면, 연속적인 ED 구조의 채널 이용 성능은 잡음 불명확성이 높아질수록 더 악화 된다는 것을 볼 수 있다. 그 이유는 다음과 같다. 비어있는 채널을 고려해보자. 에너지 검출로부터 오 알람 확률은 잡음 불명확성이 더 높아질수록 증가한다. 연속적인 ED 구조는 알람이 연속적으로 N회 발생하면 특징 검출을 무조건 수행한다. 또한, 하나 이상의 노드들이 특징 검출로부터 알람을 잘못 발생할 때마다, 이 구조는 채널을 쓸데없이 스위칭한다. 그러므로, 잡음 불명확성이 증가할수록, 연속적인 ED 구조에서 불필요한 특징 검출과 채널 스위칭의 가능성은 더 높아지게 되고 이것은 CR 시스템의 채널 이용률을 저하시킨다. 한편, 도 6(b)에서 이미 언급한 바와 같이 제안된 POMDP 기반 구조는 불필요한 특징 검출/채널 스위칭이 거의 일어나지 않도록 알람의 수에 따라 동작 모드를 선택하기 위한 신뢰 벡터를 적응적으로 제어한다. 따라서, 제안된 구조는 잡음 불명확성 레벨에 상관없이 매우 높은 채널 이용 성능을 제공한다.In the present invention, while the POMDP-based structure proposed from FIGS. 10A to 10C provides a high channel utilization regardless of the noise uncertainty level, it can be seen that the channel utilization performance of the continuous ED structure becomes worse as the noise uncertainty becomes higher. . The reason for this is as follows. Consider an empty channel. The probability of false alarm from energy detection increases with higher noise uncertainty. The continuous ED structure performs feature detection unconditionally when N consecutive alarms occur. In addition, whenever one or more nodes falsely generate an alarm from feature detection, this structure switches the channel uselessly. Therefore, as noise uncertainty increases, the likelihood of unnecessary feature detection and channel switching in continuous ED structures increases, which degrades the channel utilization of the CR system. Meanwhile, as already mentioned in FIG. 6 (b), the proposed POMDP infrastructure adaptively controls a confidence vector for selecting an operation mode according to the number of alarms so that unnecessary feature detection / channel switching rarely occurs. Thus, the proposed structure provides very high channel utilization performance regardless of the noise uncertainty level.
다음으로, 수신된 PU 신호 전력에 따라 2개의 구조에 대한 PU 검출 지연 성능을 조사해 보자. 연속적인 ED 구조에서, 연속적인 N회의 시스템 영역 에너지 검출 알람이 특징 검출을 수행하기 위한 전제 조건이므로, PU 검출 지연은 에너지 검출 알람의 신뢰성에 상관없이 N의 값에 주로 좌우된다(도 10a 내지 도 10c 참조). 에너지 검출로부터 감지한 결과는 더 강한 PU 신호에 대해 보다 신뢰할만하다는 것이 주목된다. 그 결과, 고정된 N을 갖는 연속적인 ED 구조는 PU로부터 수신된 신호 전력 및/또는 잡음 불명확성 레벨이 시간에 따라 변하는 시간 가변적인 환경에서는 적응될 수 없다. 연속적인 ED 구조와는 대조적으로, 도 6(b)에 이미 설명한 바와 같이 제안된 구조는 시간 가변적인 네트워크 조건에 따라 에너지 검출의 횟수를 적응적으로 조절할 수 있다. 즉, PU 신호가 더 약할수록 잡음 불명확성이 더 높을수록, 에너지 검출이 특징 검출과 채널 스위칭 전에 더 많이 수행된다. 그러므로 도 10a 내지 10c로부터 보는 바와 같이, 제안된 구조의 PU 검출 지연이 더 약한 PU 신호와 더 높은 잡음 불명확성에 따라 증가한다.Next, let us examine the PU detection delay performance for the two structures according to the received PU signal power. In the continuous ED structure, since the successive N system area energy detection alarms are a prerequisite for performing the feature detection, the PU detection delay is mainly dependent on the value of N regardless of the reliability of the energy detection alarm (FIGS. 10A-FIG. 10c). It is noted that the results detected from energy detection are more reliable for stronger PU signals. As a result, a continuous ED structure with a fixed N cannot be adapted in a time varying environment where the signal power and / or noise uncertainty level received from the PU changes over time. In contrast to the continuous ED structure, as already described in FIG. 6 (b), the proposed structure can adaptively adjust the number of energy detections according to time-varying network conditions. In other words, the weaker the PU signal, the higher the noise uncertainty, the more energy detection is performed before feature detection and channel switching. Therefore, as seen from FIGS. 10A to 10C, the PU detection delay of the proposed structure increases with weaker PU signal and higher noise uncertainty.
도 11은 CR 네트워크 내에 있는 노드들의 수에 따라 2개의 구조에 대한 최대 채널 이용률과 PU 검출 지연을 도시한다. 이 도면에서 잡음 불명확성은 η=1.0dB로 설정되고, 베이스 스테이션은 PU로부터 150.3km 멀리 위치하며, 이에 따라 베이스 스테이션에서 평균 수신 PU 신호 전력은 약 -79.4dBm이다. 본 발명에서는 이 도면으로부터 제안된 POMDP 기반 구조가 채널 이용률과 PU 검출 지연에 있어 연속적인 ED 구조보다 크게 성능이 우수하다는 것을 볼 수 있다. 2개의 구조 사이의 성능 차이는 노드들의 수가 증가함에 따라 더 커지게 된다.11 shows the maximum channel utilization and PU detection delay for two structures depending on the number of nodes in the CR network. In this figure, the noise uncertainty is set to η = 1.0 dB, and the base station is located 150.3 km away from the PU, thus the average received PU signal power at the base station is about -79.4 dBm. In the present invention, it can be seen that the proposed POMDP-based structure outperforms the continuous ED structure in terms of channel utilization and PU detection delay. The performance difference between the two structures becomes larger as the number of nodes increases.
이제, 우리는 노드들의 수에 따라 각 구조의 성능 특성을 조사해 보자. 도 11에서 보는 바와 같이, 제안된 구조는 네트워크 내에 있는 노드들의 수에 상관없이 매우 높은 채널 이용률을 제안한다. 이것은 제안된 구조를 갖는 시스템이 시간 가변적인 네트워크 조건을 반영하는 관찰 값에 따라 동작 모드를 적응적으로 선택하여 불필요한 특징 검출과 채널 스위칭을 회피하기 때문이다. 한편, 제안된 구조에서, 관찰 값(즉, PU 검출 알람의 수)은 시스템이 더 많은 노드로 구성될 때 통계적으로 보다 더 신뢰할만하다. 그러므로 제안된 구조를 갖는 베이스 스테이션은 노드들의 수가 증가함에 따라 더 적은 횟수의 에너지 검출 후에 특징 검출을 수행하는 경향이 있으며 이것은 더 짧은 PU 검출 지연을 초래한다. 연속적인 ED 구조를 조사해 보자. 이 구조에서, 베이스 스테이션은 적어도 하나의 노드가 알람을 보고할 때마다 시스템 영역 알람을 발생하며 이에 따라 시스템 영역 오 알람 확률은 노드들의 수가 많아짐에 따라 더 높아진다. 그 결과, 노드들의 수가 증가함에 따라 불필요한 특징 검출과 채널 스위칭이 보다 빈번히 일어나며 이것은 채널 이용률을 저하시킨다. PU가 활성화될 때, 네트워크 내에 더 많은 노드가 있다면, 시스템 영역 오 알람 확률이 더 높아진 것으로 인해 에너지 검출 알람이 더 많이 발생하였을 가능성이 높다. 따라서, 특징 검출에 필요한 나머지 에너지 검출 알람의 수는 시스템에 있는 노드가 많아질수록 감소한다. 그 결과, PU 검출 지연은 도 11에 도시된 바와 같이 노드들의 수가 증가할수록 더 짧아진다.Now, let's examine the performance characteristics of each structure according to the number of nodes. As shown in Fig. 11, the proposed architecture suggests very high channel utilization regardless of the number of nodes in the network. This is because a system with the proposed structure adaptively selects an operation mode according to observation values reflecting time-varying network conditions to avoid unnecessary feature detection and channel switching. On the other hand, in the proposed structure, the observed value (ie the number of PU detection alarms) is statistically more reliable when the system is configured with more nodes. Therefore, a base station with the proposed structure tends to perform feature detection after a smaller number of energy detections as the number of nodes increases, which results in shorter PU detection delay. Let's examine the continuous ED structure. In this architecture, the base station generates a system area alarm whenever at least one node reports an alarm, so the system area false alarm probability is higher as the number of nodes increases. As a result, unnecessary feature detection and channel switching occur more frequently as the number of nodes increases, which degrades channel utilization. When the PU is activated, if there are more nodes in the network, it is likely that more energy detection alarms have occurred due to the higher system area false alarm probability. Thus, the number of remaining energy detection alarms required for feature detection decreases with more nodes in the system. As a result, the PU detection delay becomes shorter as the number of nodes increases as shown in FIG.
본 발명에서는 POMDP 구조에 따라 중앙 제어기를 갖는 CR 네트워크를 위한 적응 동작 모드 선택 구조를 설계하고 그 성능을 평가하였다. 제안된 구조는 이 구조의 주된 역할이 수행할 감지 유형을 결정하는 것(즉, 에너지 검출 또는 특징 검출)이기 때문에 일종의 스펙트럼 감지 스케줄링 구조로 간주 될 수 있다. 제안된 구조를 갖는 베이스 스테이션은 채널이 비어있을 확률을 추측하며 이 확률에 기초하여 베이스 스테이션은 트래픽 전송과 에너지 검출, 특징 검출 및 채널 스위칭 중에서 CR 네트워크의 동작 모드를 선택한다. 비어 있는 채널의 주어진 확률을 동작 모드로 맵핑하는 최적의 정책은 제안된 POMDP 모델에서 2개의 임계값으로 요약되므로, 베이스 스테이션은 이들 결정 임계값들과 비어 있는 채널의 확률을 비교하여 동작 모드를 단순히 선택할 수 있으며, 그 결과 제안된 구조는 큰 계산 오버헤드 없이 용이하게 구현될 수 있다. 나아가, 제안된 구조는 불필요한 특징 검출과 채널 스위칭이 거의 일어나지 않도록 설계되므로, 이 구조는 활성 노드의 수, PU 신호 전력 또는 잡음 불명확성의 정도가 시간에 따라 변하는 시간 가변적인 환경에서 매우 높은 채널 이용률과 짧은 PU 검출 지연을 제공한다. CR 시스템이 CR 노드의 성능 저하 없이 PU를 효과적으로 보호하여야 한다는 것을 고려하면, 본 발명에서는 뛰어난 성능과 시간 가변적인 네트워크 조건에의 높은 적응성으로 인해 제안된 구조가 현재 그리고 미래의 CR 시스템에서 스펙트럼 감지을 효과적으로 스케줄링하는데 사용될 수 있다고 기대한다.In the present invention, the adaptive operation mode selection structure for the CR network with the central controller according to the POMDP structure is designed and its performance is evaluated. The proposed structure can be regarded as a kind of spectral sensing scheduling structure because its main role is to determine the type of sensing to be performed (ie energy detection or feature detection). The base station with the proposed structure estimates the probability that the channel is empty and based on this probability, the base station selects the operation mode of the CR network from among traffic transmission, energy detection, feature detection, and channel switching. Since the optimal policy for mapping a given probability of an empty channel to an operation mode is summarized by two thresholds in the proposed POMDP model, the base station simply compares these decision thresholds with the probability of an empty channel to simply define the operation mode. As a result, the proposed structure can be easily implemented without large computational overhead. In addition, the proposed scheme is designed so that unnecessary feature detection and channel switching rarely occur, so that the scheme can achieve very high channel utilization in a time varying environment where the number of active nodes, PU signal power, or noise uncertainty varies over time. Provide a short PU detection delay. Considering that the CR system should effectively protect the PU without degrading the performance of the CR node, in the present invention, the proposed structure is effective for detecting spectrum in current and future CR systems due to its excellent performance and high adaptability to time-varying network conditions. It is expected to be used for scheduling.
본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.The present invention is not limited to the above-described specific preferred embodiments, and various modifications can be made by any person having ordinary skill in the art without departing from the gist of the present invention claimed in the claims. Of course, such changes will fall within the scope of the claims.
도 1은 본 발명의 바람직한 실시 예에 따른 인지라디오시스템을 위한 POMDP기반 적응 감지 스케줄링방법을 보인 흐름도.1 is a flowchart illustrating a POMDP based adaptive sensing scheduling method for a cognitive radio system according to an exemplary embodiment of the present invention.
도 2는 본 발명에서 동작 모드의 선택 구조의 일례도.2 is an example of a structure for selecting an operation mode in the present invention.
도 3은 채널이 비어있을 확률에 따른 각 액션의 최적 값 함수 그래프.3 is a graph of the optimal value function of each action according to the probability that a channel is empty.
도 4는 시간에 따른 신뢰 벡터와 액션의 일례도.4 is an example of a confidence vector and an action over time.
도 5는 DTV 송신기로부터의 거리에 따라 수신된 DTV 신호 전력 관계도.5 is a diagram of received DTV signal power in relation to distance from a DTV transmitter.
도 6a 및 도 6b는 M = 10일 때 제안된 구조의 성능에 대한 잡음 불명확도의 영향 그래프.6A and 6B are graphs of the effect of noise uncertainty on the performance of the proposed structure when M = 10.
도 7은 η=0dB이고 M=10일 때 에너지 검출 시간에 따른 제안된 구조의 성능 그래프.7 is a performance graph of the proposed structure versus energy detection time when η = 0 dB and M = 10.
도 8은 η=0dB이고 M=10일 때 특징 검출 시간에 따른 제안된 구조의 성능 그래프.8 is a performance graph of the proposed structure versus feature detection time when η = 0 dB and M = 10.
도 9a 내지 도 9c는 M=10이고 PR=-79일 때 연속적인 ED 구조의 성능에 대한 잡음 불명확성의 영향 그래프.9A-9C are graphs of the effect of noise ambiguity on the performance of a continuous ED structure when M = 10 and P R = -79.
도 10a 내지 도 10c는 M=10일 때, 수신된 PU 신호 전력에 따라 제안된 구조와 연속적인 ED 구조 사이의 성능 비교도.10a to 10c show performance comparisons between the proposed structure and the continuous ED structure according to the received PU signal power when M = 10.
도 11은 η=1.0dB이고 PR=-79.4dBm일 때, CR 노드의 수에 따라 제안된 구조와 연속적인 ED 구조 사이의 성능 비교도.FIG. 11 is a comparison of performance between the proposed structure and the continuous ED structure according to the number of CR nodes when η = 1.0 dB and P R = -79.4 dBm. FIG.
Claims (11)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090135225A KR101133263B1 (en) | 2009-12-31 | 2009-12-31 | Adaptive Sensing Scheduling Scheme for Cognitive Radio Systems |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090135225A KR101133263B1 (en) | 2009-12-31 | 2009-12-31 | Adaptive Sensing Scheduling Scheme for Cognitive Radio Systems |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110078419A true KR20110078419A (en) | 2011-07-07 |
KR101133263B1 KR101133263B1 (en) | 2012-04-09 |
Family
ID=44917885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090135225A KR101133263B1 (en) | 2009-12-31 | 2009-12-31 | Adaptive Sensing Scheduling Scheme for Cognitive Radio Systems |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101133263B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9848377B2 (en) | 2012-11-26 | 2017-12-19 | Samsung Electronics Co., Ltd. | Communication network setting method of wireless communication terminal |
KR20230090205A (en) * | 2021-12-14 | 2023-06-21 | 숭실대학교산학협력단 | Method for executing intelligent dynamic spectrum handoff and system using the same |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101378124B1 (en) * | 2007-01-11 | 2014-03-26 | 인하대학교 산학협력단 | Method and apparatus for controlling of transmitting power in a cognitive radio technique |
KR101447571B1 (en) * | 2008-01-21 | 2014-10-07 | 삼성전자주식회사 | Cognitve radio communication method for controlling sensing operation and cognitve radio device enabling the method |
KR101460019B1 (en) * | 2008-06-02 | 2014-11-12 | 삼성전자주식회사 | Cognitive radion communication device and cognitive radion communication method using hidden markov model |
-
2009
- 2009-12-31 KR KR1020090135225A patent/KR101133263B1/en not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9848377B2 (en) | 2012-11-26 | 2017-12-19 | Samsung Electronics Co., Ltd. | Communication network setting method of wireless communication terminal |
KR20230090205A (en) * | 2021-12-14 | 2023-06-21 | 숭실대학교산학협력단 | Method for executing intelligent dynamic spectrum handoff and system using the same |
Also Published As
Publication number | Publication date |
---|---|
KR101133263B1 (en) | 2012-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Temporal adaptive link quality prediction with online learning | |
Su et al. | Energy-efficient spectrum sensing for cognitive radio networks | |
JP2004535095A (en) | Method and apparatus for controlling frequency selection inside a wireless communication system | |
KR20110050022A (en) | Apparatus and method for avoidance interference of channel in multi channel sensor network | |
Liu et al. | TALENT: Temporal adaptive link estimator with no training | |
KR102050283B1 (en) | Method for improving packet transmission performance of secondary user in cognitive radio networks and apparatus thereof | |
KR100970757B1 (en) | A collaborative channel sensing method based on the energy detection for multi-users in cognitive radio systems | |
GB2406479A (en) | Adaptive frequency-hopping | |
Awasthi et al. | Energy—efficiency techniques in cooperative spectrum sensing: a survey | |
KR101133263B1 (en) | Adaptive Sensing Scheduling Scheme for Cognitive Radio Systems | |
Toma et al. | Cooperative spectrum sensing: A new approach for minimum interference and maximum utilisation | |
EP3017623A1 (en) | Method and apparatus of switching communications from a first channel to a second channel of higher-frequency | |
KR101171383B1 (en) | Channel Management Method For Cognitive Radio Sensor Networks | |
Ahmad et al. | Predictive opportunistic spectrum access using Markov models | |
Zucchetto et al. | Random access in the IoT: An adaptive sampling and transmission strategy | |
Liu et al. | Adaptive channel access in spectrum database-driven cognitive radio networks | |
Nguyen-Thanh et al. | An efficient ordered sequential cooperative spectrum sensing scheme based on evidence theory in cognitive radio | |
Radunovic et al. | Receiver architectures for UWB-based transmit-only sensor networks | |
KR101188399B1 (en) | Collaborative sensing method in cognitive radio systems | |
Nguyen et al. | Dynamic spectrum handoff for industrial cognitive wireless sensor networks | |
Jeon et al. | An advanced quiet-period management scheme for cognitive radio systems | |
EP1337068A1 (en) | Interference measurement | |
Jeon et al. | Adaptive sensing scheduling for cognitive radio systems | |
Jaffar et al. | A Spectrum Handoff Scheme based on Joint Location and Channel State Prediction in Cognitive Radio | |
Cardoso et al. | Spectrum sensing in cognitive radio networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150212 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160122 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170224 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180222 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |