WO2023170783A1 - 信号解析装置、信号解析方法、制御回路および記憶媒体 - Google Patents

信号解析装置、信号解析方法、制御回路および記憶媒体 Download PDF

Info

Publication number
WO2023170783A1
WO2023170783A1 PCT/JP2022/009985 JP2022009985W WO2023170783A1 WO 2023170783 A1 WO2023170783 A1 WO 2023170783A1 JP 2022009985 W JP2022009985 W JP 2022009985W WO 2023170783 A1 WO2023170783 A1 WO 2023170783A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
action
learning
signal analysis
analysis device
Prior art date
Application number
PCT/JP2022/009985
Other languages
English (en)
French (fr)
Inventor
学 高木
康義 能田
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to PCT/JP2022/009985 priority Critical patent/WO2023170783A1/ja
Priority to JP2023574579A priority patent/JPWO2023170783A1/ja
Publication of WO2023170783A1 publication Critical patent/WO2023170783A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems

Definitions

  • the present disclosure relates to a signal analysis device, a signal analysis method, a control circuit, and a storage medium.
  • Non-Patent Document 1 describes a method of accurately estimating the carrier frequency and symbol timing of a QPSK (Quadrature Phase Shift Keying) signal by calculating an index called MRE (Modified Renyi Entropy).
  • the present disclosure has been made in view of the above, and provides a signal analysis device capable of estimating the carrier frequency and symbol timing of an input signal with high accuracy regardless of differences in modulation method or SNR.
  • the purpose is to
  • a signal analysis device learns behavior to correct estimated values of carrier frequency and symbol timing of an input signal, and uses a neural network with adjusted parameters.
  • the action determining unit is composed of a network, and when a signal is input, the neural network determines the action to be performed in response to the input signal, and the action determining unit executes the action determined by the action determining unit, as well as rewards for the performed action. and an environment calculation unit that calculates.
  • the signal analysis device controls the behavior determination unit to repeatedly determine the behavior, and the environment calculation unit to repeatedly execute the behavior and calculate the reward, and estimates and corrects the carrier frequency and symbol timing of the input signal.
  • a signal analysis control unit that executes the.
  • the signal analysis device has the effect of being able to estimate the carrier frequency and symbol timing of an input signal with high accuracy regardless of differences in modulation method or SNR.
  • a diagram showing an example of the functional configuration of the signal analysis device according to the first embodiment A diagram showing a first configuration example of hardware that implements the signal analysis device according to the first embodiment.
  • Flowchart showing an example of the operation of the learning step by the learning operation block of the signal analysis device according to the first embodiment A diagram showing an example of learning data stored in the learning data storage unit of the signal analysis device according to the first embodiment.
  • a diagram showing an example of a constellation of learning data after frequency correction by the environment calculation unit according to the first embodiment A diagram showing an example of an eye pattern of learning data whose frequency has been corrected by the environment calculation unit according to the first embodiment.
  • FIG. 1 is a diagram showing an example of the functional configuration of a signal analysis device 10 according to the first embodiment.
  • IQ data consisting of an in-phase signal and a quadrature signal is input to the signal analysis device 10 as a signal to be analyzed.
  • the signal analysis device 10 estimates the carrier frequency and symbol timing of the input signal. Note that in the following description, the "carrier frequency” may be simply referred to as “frequency.” Similarly, “symbol timing” may be simply referred to as "timing.”
  • the signal analysis device 10 includes a signal analysis control section 1, an action determination section 2, an environment calculation section 3, a learning data storage section 4, and a learning control section 5.
  • the behavior determining unit 2 is configured of a neural network, specifically a convolutional neural network (CNN). Note that in the following explanation, the convolutional neural network may be referred to as CNN.
  • the signal analysis control unit 1 outputs IQ data that is an input signal from the outside, or IQ data whose frequency and timing have been corrected by the environment calculation unit 3, to the behavior determination unit 2. Furthermore, when the input signal analysis process is completed, the signal analysis control section 1 outputs the analysis result to the outside.
  • the behavior determination unit 2 inputs the IQ data input from the signal analysis control unit 1 to CNN, and outputs the output to the environment calculation unit 3.
  • the CNN of the behavior determining unit 2 determines the behavior that the environment calculating unit 3 executes. That is, the CNN determines a correction method such as how to correct the current estimation result of the input IQ data, for example, an action to increase the frequency estimate by ⁇ [Hz].
  • the environment calculation unit 3 corrects the frequency and timing of the IQ data based on the behavior input from the behavior determination unit 2, calculates the environment constellation and eye pattern from the corrected IQ data, and calculates the reward for the behavior. , and outputs the result to the signal analysis control section 1.
  • the learning data storage unit 4 stores various IQ data to be learned, specifically, multiple IQ data that differ in one or more of the parameters representing signal characteristics such as signal specifications, SNR, frequency offset, and timing offset. IQ data is stored in advance. The learning data storage unit 4 outputs the stored IQ data at the timing when the learning control unit 5 performs processing to be described later.
  • signal specifications are information about signals, including radio wave transmission methods such as AM (Amplitude Modulation) and FM (Frequency Modulation), FSK (Frequency Shift Keying), and QPSK. (Quadrature Phase Shift Keying), secondary modulation methods such as DSSS (Direct Sequence Spread Spectrum), and OFDM (Orthogonal Frequency Division Multiplexing). including.
  • the learning control unit 5 controls learning using IQ data, which is learning data input from the learning data storage unit 4. Specifically, the learning control unit 5 calculates the learning data, the corrected IQ data input from the environment calculation unit 3, the constellation and eye pattern that are the environment input from the environment calculation unit 3, The learning to be performed is controlled based on the reward value for the behavior determined by the behavior determining unit 2. Note that the learning data storage section 4 and the learning control section 5 operate in a learning step to be described later.
  • IQ data which is a received signal
  • the received signal may be in another format, and the received signal may be converted into IQ data within the signal analysis device 10. It may also be configured to convert.
  • the signal analysis device 10 can be realized by hardware having the configuration shown in FIG. 2 or 3.
  • FIG. 2 is a diagram showing a first configuration example of hardware that implements the signal analysis device 10 according to the first embodiment.
  • FIG. 3 is a diagram showing a second configuration example of hardware that implements the signal analysis device 10 according to the first embodiment.
  • FIG. 2 shows the main parts of the signal analysis device 10, specifically, the signal analysis control section 1, the behavior determination section 2, the environment calculation section 3, the learning data storage section 4, and the learning control section 5 using dedicated hardware.
  • the hardware configuration when realized by a certain processing circuit 102 is shown.
  • the processing circuit 102 is, for example, an ASIC (Application Specific Integrated Circuit), an FPGA (Field Programmable Gate Array), or a combination thereof. In the example shown in FIG.
  • ASIC Application Specific Integrated Circuit
  • FPGA Field Programmable Gate Array
  • the signal analysis control section 1, action determination section 2, environment calculation section 3, learning data storage section 4, and learning control section 5 are realized by a single processing circuit 102. It is not limited to this.
  • the hardware may include a plurality of processing circuits 102, and the signal analysis control section 1, action determination section 2, environment calculation section 3, learning data storage section 4, and learning control section 5 may be realized by different processing circuits.
  • the input unit 101 is a circuit that receives IQ data, which is an input signal to the signal analysis device 10, from the outside. Further, the output unit 103 is a circuit that outputs to the outside the signal analysis result by the signal analysis device 10 and the corrected IQ data obtained by performing correction based on the signal analysis result.
  • FIG. 3 shows a hardware configuration when the processing circuit 102 shown in FIG. show.
  • the memory 104 is, for example, RAM (Random Access Memory), ROM (Read Only Memory), flash memory, EPROM (Erasable Programmable Read Only Memory), or EEPROM (registered trademark) (Electrically Erasable Programmable Read Only Memory). Memory), etc., non-volatile or volatile memory.
  • the processor 105 is a CPU (Central Processing Unit, also referred to as a central processing unit, processing unit, arithmetic unit, microprocessor, microcomputer, or DSP (Digital Signal Processor)).
  • CPU Central Processing Unit
  • the main parts of the signal analysis device 10 are realized by the memory 104 and the processor 105, a program in which processing for operating as the signal analysis control section 1, behavior determination section 2, environment calculation section 3, and learning control section 5 is written is written. Each of these units is realized by execution by the processor 105. A program in which processing for operating as the signal analysis control section 1, behavior determination section 2, environment calculation section 3, and learning control section 5 is written is stored in the memory 104 in advance. The processor 105 operates as the signal analysis control section 1, the behavior determination section 2, the environment calculation section 3, and the learning control section 5 by reading and executing programs stored in the memory 104. Further, the learning data storage unit 4 is realized by a memory 104.
  • part of the signal analysis control unit 1, behavior determination unit 2, environment calculation unit 3, and learning control unit 5 is realized by the memory 104 and the processor 105, and the rest is implemented by dedicated hardware similar to the processing circuit 102 shown in FIG. This can also be achieved with clothing.
  • the above program is assumed to be stored in the memory 104 in advance, the present invention is not limited thereto.
  • the above program may be provided to the user in a state written on a storage medium such as a CD (Compact Disc)-ROM or a DVD (Digital Versatile Disc)-ROM, and the user may install it in the memory 104.
  • a storage medium such as a CD (Compact Disc)-ROM or a DVD (Digital Versatile Disc)-ROM
  • the signal analysis device 10 has a configuration based on reinforcement learning, which is one type of machine learning, and its operation is divided into two steps: a learning step and an operation step. The operation of each of these two steps is explained below.
  • FIG. 4 is a diagram showing a processing unit that operates during the learning step of the signal analysis device 10 according to the first embodiment.
  • each section constituting the learning operation block 11, that is, the behavior determining section 2, the environment calculating section 3, the learning data storage section 4, and the learning control section 5 operate.
  • the learning step the learning data stored in the learning data storage section 4 is input, the processing of the behavior determination section 2 and the processing of the environment calculation section 3 are repeated, and the learning control section 5 uses the processing contents and results as input.
  • CNN parameters of the behavior determining unit 2 are updated.
  • the signal analysis device 10 learns frequency and timing estimation processing (behavior) for signals with various modulation methods, SNRs, frequency offsets, and timing offsets, so that it can be used in the operation step described later. It is possible to obtain the effect that the carrier frequency and symbol timing can be estimated with high precision even for modulation schemes and SNR signals.
  • FIG. 5 is a flowchart showing an example of the operation of the learning step by the learning operation block 11 of the signal analysis device 10 according to the first embodiment. It is assumed that the learning data storage unit 4 has already stored the required number of learning data for learning.
  • the learning control unit 5 acquires learning data from the learning data storage unit 4 (step S1).
  • the learning data stored in the learning data storage unit 4 is a plurality of IQ data having modulation methods, SNRs, frequency offsets, and timing offsets as shown in FIG. .
  • FIG. 6 is a diagram showing an example of learning data stored in the learning data storage section 4 of the signal analysis device 10 according to the first embodiment.
  • the learning data D1 and the learning data D2 have the same modulation method, frequency offset, and timing offset, but different SNRs. Furthermore, the learning data D1 and the learning data D3 have the same modulation method and SNR, but different frequency offsets and timing offsets.
  • the learning data D1 and the learning data D4 are data that differ in modulation method, SNR, frequency offset, and timing offset. In this way, it is assumed that a large number of IQ data having the same or different modulation methods, SNRs, frequency offsets, and timing offsets are stored in the learning data storage unit 4 as learning data. Note that although the modulation method, SNR, frequency offset, and timing offset are illustrated as parameters representing the characteristics of the signal included in the learning data, the present invention is not limited to these.
  • the learning control unit 5 selects one of the acquired learning data and passes it to the behavior determining unit 2, and the behavior determining unit 2 inputs the received learning data to CNN and calculates the behavior.
  • the behavior determination unit 2 outputs the calculated behavior to the environment calculation unit 3.
  • a behavior table as shown in FIG. 7 may be set in advance, and these behaviors may be selected using a softmax function or the like.
  • FIG. 7 is a diagram showing an example of a behavior determined by the behavior determining unit 2 of the signal analysis device 10 according to the first embodiment. For actions a1 to a4, the estimated frequency offset value is increased or decreased by 5 Hz or 10 Hz.
  • the estimated timing offset value is increased or decreased by 5 chips or 10 chips.
  • the CNN constituting the behavior determining unit 2 selects and outputs one of the behaviors a1 to a8 shown in FIG. 7.
  • the configuration of the CNN is general and similar to the conventional one, so a description thereof will be omitted.
  • the explanation will be continued assuming that the learning data D1 is input to CNN, and as a result, the behavior a1 is selected.
  • the environment calculation unit 3 implements the behavior determined by the behavior determination unit 2 and corrects the frequency and timing of the learning data (step S3). Correction may be made to both frequency and timing, or to one or the other. In this example, the frequency offset estimate is increased by +5 Hz.
  • the environment calculation unit 3 calculates the environment and reward from the corrected learning data (step S4). Specifically, the environment calculation unit 3 calculates a constellation and an eye pattern that are the environment, and further calculates a reward from the constellation and the eye pattern. Note that in reinforcement learning, a reward is a value that evaluates how appropriate the previous action was. In step S4, a reward for the correction made in step S3 is calculated.
  • FIG. 8 is a diagram showing an example of a constellation of learning data after the frequency has been corrected by the environment calculation unit 3 according to the first embodiment
  • FIG. FIG. 7 is a diagram showing an example of an eye pattern of corrected learning data. At this point, estimation of both frequency and timing has not yet been completed, resulting in a constellation and eye pattern with residual offsets as shown in FIGS. 8 and 9.
  • FIG. 10 is a diagram showing a method by which the environment calculation unit 3 of the signal analysis device 10 according to the first embodiment calculates the reward regarding the constellation
  • FIG. 11 is a diagram showing the environment calculation unit of the signal analysis device 10 according to the first embodiment.
  • FIG. 3 is a diagram showing a method for calculating rewards related to eye patterns.
  • the environment calculation unit 3 uses a histogram of the declination angle ⁇ of each signal point of the constellation when calculating the reward related to the constellation, and uses a histogram of the center of the eye when calculating the reward related to the eye pattern.
  • the calculation shown in equation (1) is performed using the calculated result.
  • the calculation shown in equation (1) is performed for each of the constellation and eye pattern.
  • Equation (2) is a normalization term and takes a value in the range of 0 to 1.
  • FIG. 12 is a diagram showing a method by which the environment calculation unit 3 of the signal analysis device 10 according to the first embodiment calculates the reward regarding the constellation of IQ data after correction
  • FIG. 3 is a diagram illustrating a method in which the environment calculation unit 3 of the signal analysis device 10 calculates a reward regarding the eye pattern of the corrected IQ data.
  • the learning control unit 5 updates the CNN parameters of the behavior determining unit 2 based on this behavior and reward, that is, from the relationship between the behavior and the reward (step S5). Since the CNN learning method is a general method and is the same as the conventional method, a description of the CNN parameter updating process will be omitted.
  • step S6 the learning control unit 5 checks whether the correction is completed (step S6), and if it is not completed (step S6: No), returns to step S2 and performs the series of processes from steps S2 to S5 described above. repeat. That is, the signal analysis device 10 repeats the processing of steps S2 to S5 until the correction of the learning data D1 is completed, and updates the parameters of the CNN that constitutes the behavior determining unit 2. For example, the signal analysis device 10 repeats the process until the reward calculated by the environment calculation unit 3 is equal to or greater than a predetermined threshold. As a result, one learning, that is, learning for one learning data is completed.
  • step S6 the learning control unit 5 checks whether learning has been completed for all the learning data acquired in step S1 (step S7).
  • step S7 the learning data D1 to D4 shown in FIG. 6 are acquired in step S1. If learning is completed for the learning data D1 to D4 (step S7: Yes), the learning control unit 5 ends the learning step. If there is one of the learning data D1 to D4 for which learning has not been completed (step S7: No), the process returns to step S2, and the learning control unit 5 selects one of the learning data for which learning has not been completed. One is selected and passed to the action determining section 2. Thereafter, steps S2 to S6 described above are repeated.
  • step S4 an example was shown in which the reward for the action is calculated based on the constellation of signals obtained by performing the action and the eye pattern, but it is also possible to calculate the reward based only on the constellation.
  • the reward may be calculated based only on the eye pattern. That is, the environment calculation unit 3 may be configured to output the reward conste calculated using formula (1) to the learning control unit 5 as a reward for the action, or the reward conste calculated using formula (1) may be output to the learning control unit 5 . may be configured to be output to the learning control unit 5 as a reward for the action.
  • FIG. 14 is a diagram showing a processing unit that operates during the operation step of the signal analysis device 10 according to the first embodiment.
  • each part constituting the operation operation block 12 that is, the signal analysis control section 1, the behavior determination section 2, and the environment calculation section 3 operates.
  • the behavior determination unit 2 which is composed of the CNN optimized in the learning step described above, and the environment calculation unit 3, which calculates the environment and reward, repeat the process described below using IQ data from the outside as input. Then, the frequency and timing of the IQ data are corrected.
  • the signal analysis control unit 1 controls the behavior determination unit 2 and the environment calculation unit 3 to repeat the process until a termination condition is satisfied, such as by reaching a predetermined number of times of processing, for example. Then, the signal analysis control unit 1 receives the processing results obtained by repeatedly executing the processing by the behavior determination unit 2 and the environment calculation unit 3, specifically, the frequency and timing estimation results, or the corrected IQ data. , or print all of these.
  • FIG. 15 is a flowchart illustrating an example of the operation of the operation step by the operation operation block 12 of the signal analysis device 10 according to the first embodiment. Note that it is assumed that the above-described learning step has been carried out and the parameter adjustment of the CNN constituting the behavior determining unit 2 has been completed.
  • step S11 the signal analysis control unit 1 acquires IQ data input from the outside (step S11).
  • step S12 the signal analysis control unit 1 passes the acquired IQ data to the behavior determination unit 2, and the behavior determination unit 2 inputs the received IQ data to CNN to calculate behavior (step S12).
  • step S12 is the same process as step S2 described above, except that the data handled is IQ data. That is, the behavior determining unit 2 performs the process of step S2 described above on the IQ data input from the signal analysis control unit 1, and determines the behavior to be performed on the IQ data that is the input signal. Therefore, the explanation of step S12 will be omitted.
  • the environment calculation unit 3 implements the behavior determined by the behavior determination unit 2 to correct the frequency and timing of the IQ data (step S13), and further calculates the environment and reward from the corrected IQ data (Ste S14).
  • steps S13 and S14 are similar to steps S3 and S4 described above, except that the data handled is IQ data. Therefore, description of steps S13 and S14 will be omitted.
  • the environment calculation section 3 outputs the corrected IQ data and the calculated reward to the signal analysis control section 1.
  • the signal analysis control unit 1 checks whether the correction is completed (step S15), and if it is not completed (step S15: No), returns to step S12 and repeats the series of processes from steps S12 to S14. . That is, the signal analysis device 10 repeats the processing of steps S12 to S15 until the correction of the input IQ data is completed. At this time, the signal analysis control unit 1 outputs the corrected IQ data output from the environment calculation unit 3 to the behavior determination unit 2. The behavior determining unit 2 executes step S12 on the corrected IQ data. For example, the signal analysis device 10 repeats the process until the reward calculated by the environment calculation unit 3 is equal to or greater than a predetermined threshold. That is, the signal analysis control unit 1 determines that the correction is completed when the reward input from the environment calculation unit 3 is equal to or greater than the threshold value.
  • step S15 If the correction is completed (step S15: Yes), the operation step ends.
  • the processing result output by the signal analysis control unit 1 may be an analysis result of the input IQ data, that is, a result of estimating the carrier frequency and symbol timing, or a result of estimating the carrier frequency and symbol timing of the input IQ data.
  • the corrected IQ data obtained by correcting based on the above may be used, or both the analysis result of the input IQ data and the corrected IQ data may be output.
  • the signal analysis device 10 performs learning in advance using IQ data of various modulation methods, SNRs, frequency offsets, and timing offsets, and performs learning on the parameters of the CNN constituting the behavior determining unit 2. Adjust. As a result, during operation, the carrier frequency and symbol timing can be estimated with high accuracy no matter what signal conditions are input, the estimation results can be output, and the carrier frequency and symbol timing can be corrected based on the estimation results. It becomes possible to output a signal that is
  • Embodiment 2 The signal analysis device 10 according to the first embodiment learns the CNN of the behavior determination unit 2 using IQ data of various modulation methods, SNR, frequency offset, and timing offset stored in the learning data storage unit 4. By doing so, it is possible to estimate the carrier frequency and symbol timing with high accuracy no matter what conditions of IQ data are input during the operation step. However, it is not always possible to prepare learning data, so in Embodiment 2, we will explain a signal analysis device that generates learning data by itself from input IQ data and performs learning even when learning data cannot be prepared in advance. do.
  • FIG. 16 is a diagram showing an example of the functional configuration of the signal analysis device 10a according to the second embodiment.
  • the signal analysis device 10a according to the second embodiment has a configuration in which the learning data storage section 4 of the signal analysis device 10 according to the first embodiment is replaced with a learning data generation section 6. Components other than the learning data generation unit 6 are the same as those in the first embodiment, and therefore their description will be omitted.
  • the learning data generation unit 6 generates learning data with different SNRs by adding an arbitrary level of AWGN (Additive White Gaussian Noise) to the input IQ data.
  • AWGN Additional White Gaussian Noise
  • the operation of the signal analysis device 10a is divided into a learning step and an operation step, similar to the operation of the signal analysis device 10 according to the first embodiment, but the operation step is common and only the learning step is different. Therefore, the learning step will be explained, and the operation step will not be explained.
  • FIG. 17 is a flowchart illustrating an example of the operation of the learning step by the signal analysis device 10a according to the second embodiment.
  • the flowchart of FIG. 17 is the flowchart of FIG. 5 showing the operation of the learning step of the signal analysis device 10 according to the first embodiment, with step S1 replaced with steps S21 and S22.
  • the learning data generation unit 6 acquires IQ data input from the outside (step S21), and generates learning data from the acquired IQ data (step S22). Specifically, the learning data generation unit 6 performs a process of adding an arbitrary level of AWGN to the acquired IQ data to generate learning data. Note that the process of adding AWGNs of arbitrary levels is a general method and is the same as the conventional method, so a description thereof will be omitted. Since this embodiment has a configuration based on reinforcement learning of machine learning, there is no need to label learning data. Therefore, it is possible to process the learning data. Steps S2 to S7 executed subsequent to step S22 are the same as in the first embodiment, and therefore their description will be omitted.
  • the signal analysis device 10a As described above, the signal analysis device 10a according to the second embodiment generates learning data based on IQ data input from the outside, and performs CNN learning of the behavior determining unit 2.
  • the signal analysis device 10a can learn the CNN of the behavior determination unit 2 using IQ data of various SNRs even when learning data cannot be prepared, and similarly to the signal analysis device 10 according to the first embodiment.
  • the carrier frequency and symbol timing are estimated with high precision no matter what signal conditions are input, and the estimation results are output, or the carrier frequency and symbol timing are corrected based on the estimation results. can be output.
  • the signal analysis devices 10 and 10a according to the present disclosure described in each embodiment are useful for estimating carrier frequencies and symbol timings of signals having various modulation schemes, SNRs, carrier frequency offsets, and symbol timing offsets. , especially suitable for spectrum monitoring, etc. Furthermore, since signal carrier frequency estimation and symbol timing estimation are fundamental technologies for wireless communications, their application is not limited to spectrum monitoring.
  • 1 Signal analysis control unit 1 Signal analysis control unit, 2 Behavior determination unit, 3 Environment calculation unit, 4 Learning data storage unit, 5 Learning control unit, 6 Learning data generation unit, 10, 10a Signal analysis device, 11 Learning operation block, 12 Operation operation block.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Abstract

信号解析装置(10)は、入力信号の搬送波周波数およびシンボルタイミングの推定値を補正するための行動を学習してパラメータが調整済みのニューラルネットワークで構成され、信号が入力されると入力された信号に対して実行する行動をニューラルネットワークにより決定する行動決定部(2)と、行動決定部で決定された行動を実行するとともに、実行した行動に対する報酬を算出する環境計算部(3)と、行動決定部による行動の決定と、環境計算部による行動の実行および報酬の計算とを繰り返し実行させる制御を行い、入力された信号の搬送波周波数およびシンボルタイミングの推定および補正を実行させる信号解析制御部(1)と、を備える。

Description

信号解析装置、信号解析方法、制御回路および記憶媒体
 本開示は、信号解析装置、信号解析方法、制御回路および記憶媒体に関する。
 スペクトル監視などの分野において変調方式識別や通信パラメータ推定は重要な技術である。特に通信パラメータの一つである搬送波周波数の推定はこれまで様々な手法が提案されてきた。例えば、非特許文献1には、MRE(Modified Renyi Entropy)という指標を計算することでQPSK(Quadrature Phase Shift Keying)方式の信号の搬送波周波数およびシンボルタイミングを正確に推定する方法が記載されている。
Xiao Liu,Jean-Francois Bousquet,"Symbol Timing and Carrier Frequency Recovery Based on Entropy Minimization",IEEE Access,vol.6,pp.53319-53329,2018.
 上記従来の技術によれば、変調方式によってMREが収束する値が異なるため、変調方式毎にしきい値を準備しておくことで複数の変調方式の搬送波周波数およびシンボルタイミングを推定できる。しかし、上記従来の技術はSNR(Signal to Noise Ratio:信号対雑音比)の高い、つまりノイズの少ない受信信号を前提として考えられた手法であるため、SNRが低い場合には搬送波周波数やシンボルタイミングの推定精度が著しく低下するという課題があった。
 本開示は、上記に鑑みてなされたものであって、変調方式の違いやSNRの違いによらずに入力信号の搬送波周波数およびシンボルタイミングを高精度に推定することが可能な信号解析装置を得ることを目的とする。
 上述した課題を解決し、目的を達成するために、本開示にかかる信号解析装置は、入力信号の搬送波周波数およびシンボルタイミングの推定値を補正するための行動を学習してパラメータが調整済みのニューラルネットワークで構成され、信号が入力されると入力された信号に対して実行する行動をニューラルネットワークにより決定する行動決定部と、行動決定部で決定された行動を実行するとともに、実行した行動に対する報酬を算出する環境計算部と、を備える。また、信号解析装置は、行動決定部による行動の決定と、環境計算部による行動の実行および報酬の計算とを繰り返し実行させる制御を行い、入力された信号の搬送波周波数およびシンボルタイミングの推定および補正を実行させる信号解析制御部、を備える。
 本開示にかかる信号解析装置は、変調方式の違いやSNRの違いによらずに入力信号の搬送波周波数およびシンボルタイミングを高精度に推定することができる、という効果を奏する。
実施の形態1にかかる信号解析装置の機能構成例を示す図 実施の形態1にかかる信号解析装置を実現するハードウェアの第1の構成例を示す図 実施の形態1にかかる信号解析装置を実現するハードウェアの第2の構成例を示す図 実施の形態1にかかる信号解析装置の学習ステップ時に動作する処理部を示す図 実施の形態1にかかる信号解析装置の学習動作ブロックによる学習ステップの動作の一例を示すフローチャート 実施の形態1にかかる信号解析装置の学習用データ保存部に保存される学習用データの一例を示す図 実施の形態1にかかる信号解析装置の行動決定部が決定する行動の一例を示す図 実施の形態1にかかる環境計算部が周波数を補正した後の学習用データのコンステレーションの一例を示す図 実施の形態1にかかる環境計算部が周波数を補正した学習用データのアイパターンの一例を示す図 実施の形態1にかかる信号解析装置の環境計算部がコンステレーションに関する報酬を計算する方法を示す図 実施の形態1にかかる信号解析装置の環境計算部がアイパターンに関する報酬を計算する方法を示す図 実施の形態1にかかる信号解析装置の環境計算部が補正後のIQデータのコンステレーションに関する報酬を計算する方法を示す図 実施の形態1にかかる信号解析装置の環境計算部が補正後のIQデータのアイパターンに関する報酬を計算する方法を示す図 実施の形態1にかかる信号解析装置の運用ステップ時に動作する処理部を示す図 実施の形態1にかかる信号解析装置の運用動作ブロックによる運用ステップの動作の一例を示すフローチャート 実施の形態2にかかる信号解析装置の機能構成例を示す図 実施の形態2にかかる信号解析装置による学習ステップの動作の一例を示すフローチャート
 以下に、本開示の実施の形態にかかる信号解析装置、信号解析方法、制御回路および記憶媒体を図面に基づいて詳細に説明する。
実施の形態1.
 図1は、実施の形態1にかかる信号解析装置10の機能構成例を示す図である。信号解析装置10には解析対象の信号として、同相信号および直交信号からなるIQデータが入力される。信号解析装置10は、入力信号の搬送波周波数とシンボルタイミングとを推定する。なお、これ以降の説明では、「搬送波周波数」を単に「周波数」と称する場合がある。同様に、「シンボルタイミング」を単に「タイミング」と称する場合がある。
 図1に示すように、信号解析装置10は、信号解析制御部1と、行動決定部2と、環境計算部3と、学習用データ保存部4と、学習制御部5とを備える。行動決定部2は、ニューラルネットワーク、詳細には畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)で構成される。なお、これ以降の説明では、畳み込みニューラルネットワークをCNNと記載する場合がある。
 信号解析制御部1は、外部からの入力信号であるIQデータ、または、環境計算部3で周波数およびタイミングが補正されたIQデータを行動決定部2に出力する。また、信号解析制御部1は、入力信号の解析処理が終了した場合には解析結果を外部に出力する。
 行動決定部2は、信号解析制御部1から入力されたIQデータをCNNへ入力し、その出力を環境計算部3に出力する。行動決定部2のCNNは環境計算部3が実行する行動を決定する。すなわち、CNNは、入力されたIQデータの現在の推定結果をどう補正するかといった補正方法、例えば、周波数推定値を±α[Hz]する行動を決定する。
 環境計算部3は、行動決定部2から入力される行動に基づきIQデータの周波数およびタイミングを補正し、補正したIQデータから環境であるコンステレーションおよびアイパターンを計算するとともに行動に対する報酬を計算し、その結果を信号解析制御部1に出力する。
 学習用データ保存部4は、学習対象である様々なIQデータ、具体的には、信号諸元、SNR、周波数オフセットおよびタイミングオフセットといった、信号の特徴を表すパラメータの中の1つ以上が異なる複数のIQデータを予め保存している。学習用データ保存部4は、学習制御部5が後述する処理を行うタイミングで、保存しているIQデータを出力する。なお、信号諸元とは、信号に関する情報であり、AM(Amplitude Modulation:振幅変調)およびFM(Frequency Modulation:周波数変調)といった電波の伝送方式、FSK(Frequency Shift Keying:周波数偏移変調)、QPSK(Quadrature Phase Shift Keying:四位相偏移変調)などの変調方式、DSSS(Direct Sequence Spread Spectrum:直接拡散方式)、OFDM(Orthogonal Frequency Division Multiplexing:直交波周波数分割多重)などの二次変調の方式までを含む。
 学習制御部5は、学習用データ保存部4から入力される学習用データであるIQデータを用いた学習の制御を行う。具体的には、学習制御部5は、学習用データと、環境計算部3から入力される補正後のIQデータと、環境計算部3から入力される、環境であるコンステレーションおよびアイパターンと、行動決定部2で決定した行動に対する報酬値とに基づいて実施する学習の制御を行う。なお、学習用データ保存部4および学習制御部5は後述する学習ステップで動作する。
 なお、本実施の形態は、受信信号であるIQデータを信号解析装置10に入力するものとして説明を行うが、受信信号をその他の形式とし、信号解析装置10の内部で受信信号をIQデータに変換する構成としてもよい。
 次に、信号解析装置10を実現するハードウェアについて説明する。信号解析装置10は、図2または図3に示す構成のハードウェアで実現することが可能である。
 図2は、実施の形態1にかかる信号解析装置10を実現するハードウェアの第1の構成例を示す図である。また、図3は、実施の形態1にかかる信号解析装置10を実現するハードウェアの第2の構成例を示す図である。図2は、信号解析装置10の要部、具体的には、信号解析制御部1、行動決定部2、環境計算部3、学習用データ保存部4および学習制御部5を専用のハードウェアである処理回路102で実現する場合のハードウェア構成を示す。処理回路102は、例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、またはこれらを組み合わせた回路である。なお、図2に示す例では、信号解析制御部1、行動決定部2、環境計算部3、学習用データ保存部4および学習制御部5を単一の処理回路102で実現するものとしたがこれに限定されない。ハードウェアが複数の処理回路102を備え、信号解析制御部1、行動決定部2、環境計算部3、学習用データ保存部4および学習制御部5をそれぞれ異なる処理回路で実現してもよい。
 入力部101は、信号解析装置10への入力信号であるIQデータを外部から受信する回路である。また、出力部103は、信号解析装置10による信号解析結果と、信号解析結果に基づいて補正を行うことにより得られる補正後のIQデータとを外部に出力する回路である。
 図3は、図2に示す処理回路102をメモリ104およびプロセッサ105で実現する場合のハードウェア構成、すなわち、信号解析装置10の要部をメモリ104およびプロセッサ105で実現する場合のハードウェア構成を示す。メモリ104は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリー、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)等の、不揮発性または揮発性のメモリである。プロセッサ105は、CPU(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、DSP(Digital Signal Processor)ともいう)である。
 信号解析装置10の要部をメモリ104およびプロセッサ105で実現する場合、信号解析制御部1、行動決定部2、環境計算部3および学習制御部5として動作するための処理が記述されたプログラムをプロセッサ105が実行することにより、これらの各部が実現される。信号解析制御部1、行動決定部2、環境計算部3および学習制御部5として動作するための処理が記述されたプログラムはメモリ104に予め格納されている。プロセッサ105は、メモリ104に格納されているプログラムを読み出して実行することにより、信号解析制御部1、行動決定部2、環境計算部3および学習制御部5として動作する。また、学習用データ保存部4はメモリ104により実現される。
 なお、信号解析制御部1、行動決定部2、環境計算部3および学習制御部5の一部をメモリ104およびプロセッサ105で実現し、残りを図2に示す処理回路102と同様の専用のハードウェアで実現してもよい。
 また、上記のプログラムは、メモリ104に予め格納されているものとしたがこれに限定されない。上記のプログラムは、CD(Compact Disc)-ROM、DVD(Digital Versatile Disc)-ROMなどの記憶媒体に書き込まれた状態でユーザに供給され、ユーザがメモリ104にインストールする形態であってもよい。
 次に、信号解析装置10の動作について説明する。本実施の形態にかかる信号解析装置10は機械学習の一つである強化学習をベースとした構成になっており、動作として学習ステップおよび運用ステップの2つのステップに分けられる。これら2つのステップのそれぞれの動作を以下で説明する。
<学習ステップ>
 図4は、実施の形態1にかかる信号解析装置10の学習ステップ時に動作する処理部を示す図である。学習ステップにおいては、学習動作ブロック11を構成する各部、すなわち、行動決定部2、環境計算部3、学習用データ保存部4および学習制御部5が動作する。
 学習ステップでは、学習用データ保存部4に保存された学習用データを入力として、行動決定部2の処理と環境計算部3の処理とを繰り返し、その処理の内容および結果から学習制御部5によって行動決定部2のCNNのパラメータが更新される。これは機械学習の強化学習をベースとした構成であり、行動決定部2は強化学習におけるエージェント、環境計算部3は環境の役割を担っている。信号解析装置10が学習ステップにおいて、様々な変調方式やSNR、周波数オフセットおよびタイミングオフセットの信号に対する周波数およびタイミングの推定処理(行動)を学習しておくことで、後述する運用ステップにおいて、どのような変調方式やSNRの信号に対しても、高精度に搬送波周波数およびシンボルタイミングを推定可能になる、という効果が得られる。
 図5は、実施の形態1にかかる信号解析装置10の学習動作ブロック11による学習ステップの動作の一例を示すフローチャートである。なお、学習用データ保存部4は、学習で必要な数の学習用データを保存済みであるものとする。
 学習ステップでは、まず、学習制御部5が、学習用データ保存部4から学習用データを取得する(ステップS1)。ここでは、一例として、学習用データ保存部4に保存されている学習用データが図6に示すような変調方式、SNR、周波数オフセットおよびタイミングオフセットをもつ複数のIQデータであるものとして説明を続ける。図6は、実施の形態1にかかる信号解析装置10の学習用データ保存部4に保存される学習用データの一例を示す図である。
 図6に示すように、学習用データD1と学習用データD2は、変調方式、周波数オフセットおよびタイミングオフセットは同じであるがSNRが異なる。また、学習用データD1と学習用データD3は、変調方式およびSNRは同じであるが周波数オフセットおよびタイミングオフセットが異なる。学習用データD1と学習用データD4は、変調方式、SNR、周波数オフセットおよびタイミングオフセットのいずれも異なるデータである。この様に、変調方式、SNR、周波数オフセットおよびタイミングオフセットが同じまたは異なる数多くのIQデータが学習用データとして学習用データ保存部4に保存されているものとする。なお、学習用データに含まれる信号の特徴を表すパラメータとして、変調方式、SNR、周波数オフセットおよびタイミングオフセットを例示したがこれらに限定されない。
 次に、学習制御部5が、取得した学習用データの中の1つを選択して行動決定部2に受け渡し、行動決定部2が、受け取った学習用データをCNNに入力して行動を算出する(ステップS2)。行動決定部2は、算出した行動を環境計算部3に出力する。CNNによる行動の算出では、例えば、図7に示すような行動テーブルをあらかじめ設定しておき、それらの行動をソフトマックス関数などで選択するようにしてもよい。図7は、実施の形態1にかかる信号解析装置10の行動決定部2が決定する行動の一例を示す図である。行動a1~a4では、周波数オフセット推定値を5Hzまたは10Hz増減させる。行動a5~a8では、タイミングオフセット推定値を5チップまたは10チップ増減させる。行動決定部2を構成するCNNは、学習用データの入力があると、図7に示す行動a1~a8のいずれかを選択して出力する。CNNの構成は一般的なものであり、従来同様のものなので説明を省略する。ここでは、一例として、学習用データD1がCNNに入力され、その結果、行動a1が選択されたものとして説明を続ける。
 次に、環境計算部3が、行動決定部2で決定された行動を実施して学習用データの周波数およびタイミングを補正する(ステップS3)。補正は周波数およびタイミングの両方に対して行ってもよいし一方に対して行ってもよい。この例では、周波数オフセット推定値を+5Hzする。
 次に、環境計算部3が、補正した学習用データから環境および報酬を算出する(ステップS4)。詳細には、環境計算部3は、環境であるコンステレーションおよびアイパターンを算出し、さらに、コンステレーションおよびアイパターンから報酬を算出する。なお、報酬とは強化学習において、直前の行動がどれだけ適切であったかを評価する値である。ステップS4では、ステップS3で行った補正についての報酬を計算する。図8は、実施の形態1にかかる環境計算部3が周波数を補正した後の学習用データのコンステレーションの一例を示す図、図9は、実施の形態1にかかる環境計算部3が周波数を補正した学習用データのアイパターンの一例を示す図である。この時点では、まだ周波数およびタイミング共に推定が完了していないため、図8および図9に示すような、オフセットが残留したコンステレーションおよびアイパターンとなる。
 補正した後の学習用データのコンステレーションおよびアイパターンに基づいて報酬を計算する方法について説明する。図10は、実施の形態1にかかる信号解析装置10の環境計算部3がコンステレーションに関する報酬を計算する方法を示す図、図11は、実施の形態1にかかる信号解析装置10の環境計算部3がアイパターンに関する報酬を計算する方法を示す図である。
 環境計算部3は、コンステレーションに関する報酬を計算する際には、コンステレーションの各信号点の偏角Θをヒストグラム化したものを用い、アイパターンに関する報酬を計算する際にはアイの中心をヒストグラム化したものを用い、式(1)に示す計算を行う。式(1)に示す計算は、コンステレーションおよびアイパターンのそれぞれについて行う。
Figure JPOXMLDOC01-appb-M000001
 rewardconsteをコンステレーションについての式(1)の計算結果、rewardeyeをアイパターンについての式(1)の計算結果とする。環境計算部3は、次に、コンステレーションおよびアイパターンそれぞれについての式(1)の計算結果を用いて式(2)に示す計算を行い、計算結果を報酬(reward)とする。式(2)において、αは正規化項であり0~1の範囲の値をとる。
Figure JPOXMLDOC01-appb-M000002
 QPSK変調方式の場合、周波数およびタイミングが精度よく推定できている場合は図12に示すようにコンステレーションは4点に収束し、図13に示すようにアイパターンは2値に収束するため、ヒストグラムの度数の平均(avg(hist))と最大(max(hist))との比が大きくなり、報酬(reward)も大きくなる。なお、図12は、実施の形態1にかかる信号解析装置10の環境計算部3が補正後のIQデータのコンステレーションに関する報酬を計算する方法を示す図、図13は、実施の形態1にかかる信号解析装置10の環境計算部3が補正後のIQデータのアイパターンに関する報酬を計算する方法を示す図である。
 これに対して、周波数およびタイミングが推定できていない場合はヒストグラムの度数の平均と最大との比は1に近づく。このため行動による周波数およびタイミングの補正の前後で報酬を計算しておくことで行動が適切であったかどうかを評価することができる。学習制御部5は、この行動および報酬に基づいて、すなわち、行動と報酬との関係から、行動決定部2のCNNのパラメータを更新する(ステップS5)。CNNの学習方法は一般的な手法であり、従来同様のものであるため、CNNのパラメータの更新処理について説明を省略する。
 次に、学習制御部5が、補正が完了したかを確認し(ステップS6)、完了していない場合(ステップS6:No)、ステップS2に戻り、上述したステップS2~S5の一連の処理を繰り返す。すなわち、信号解析装置10は、学習用データD1の補正が完了するまで、ステップS2~S5の処理を繰り返し、行動決定部2を構成するCNNのパラメータの更新を進める。信号解析装置10は、例えば、環境計算部3で算出する報酬が定められた閾値以上となるまで処理を繰り返す。この結果、1回の学習すなわち1つの学習用データについての学習が完了する。
 補正が完了した場合(ステップS6:Yes)、学習制御部5が、ステップS1で取得した全ての学習用データについて学習が完了したかを確認する(ステップS7)。ここでは、図6に示す学習用データD1~D4をステップS1で取得したものとして説明を続ける。学習制御部5は、学習用データD1~D4について学習が完了した場合(ステップS7:Yes)、学習ステップを終了する。学習用データD1~D4の中に学習が完了していないものがある場合(ステップS7:No)、ステップS2に戻り、学習制御部5は、学習が完了していない学習用データの中の1つを選択して行動決定部2に受け渡す。以下、上述したステップS2~S6を繰り返す。
 なお、上述したステップS4では、行動を実施して得られた信号のコンステレーションおよびアイパターンに基づいて行動に対する報酬を計算する例を示したが、コンステレーションのみに基づいて報酬を算出してもよいし、アイパターンのみに基づいて報酬を計算してもよい。すなわち、環境計算部3は、式(1)を用いて算出したrewardconsteを行動に対する報酬として学習制御部5に出力する構成であってもよいし、式(1)を用いて算出したrewardeyeを行動に対する報酬として学習制御部5に出力する構成であってもよい。
<運用ステップ>
 図14は、実施の形態1にかかる信号解析装置10の運用ステップ時に動作する処理部を示す図である。運用ステップにおいては、運用動作ブロック12を構成する各部、すなわち、信号解析制御部1、行動決定部2および環境計算部3が動作する。
 運用ステップでは、外部からのIQデータを入力として、上述した学習ステップで最適化したCNNで構成される行動決定部2と、環境および報酬を計算する環境計算部3とが後述の処理を繰り返すことで、IQデータの周波数およびタイミングの補正を行う。信号解析制御部1は、例えば、所定の処理回数に達するなどして終了条件を満たすまで処理を繰り返すように行動決定部2および環境計算部3を制御する。そして、信号解析制御部1は、行動決定部2および環境計算部3が処理を繰り返し実行して得られた処理結果、具体的には、周波数およびタイミングの推定結果、または、補正後のIQデータ、または、これらすべてを出力する。学習ステップで様々な変調方式やSNR、周波数オフセットおよびタイミングオフセットの信号を学習しておくことで、この運用ステップでも、いかなる条件の信号が入力された場合でも高精度に周波数およびタイミングの推定を行い、その推定結果や補正したIQデータを出力することができる。
 図15は、実施の形態1にかかる信号解析装置10の運用動作ブロック12による運用ステップの動作の一例を示すフローチャートである。なお、上述した学習ステップが実施され、行動決定部2を構成するCNNのパラメータ調整が完了しているものとする。
 運用ステップでは、まず、信号解析制御部1が、外部から入力されるIQデータを取得する(ステップS11)。次に、信号解析制御部1が、取得したIQデータを行動決定部2に受け渡し、行動決定部2が、受け取ったIQデータをCNNに入力して行動を算出する(ステップS12)。このステップS12は、取り扱うデータがIQデータである点を除いて、上述したステップS2と同様の処理である。すなわち、行動決定部2は、信号解析制御部1から入力されたIQデータを対象として、上述したステップS2の処理を行い、入力信号であるIQデータに対して実行する行動を決定する。そのため、ステップS12の説明は省略する。
 次に、環境計算部3が、行動決定部2で決定された行動を実施してIQデータの周波数およびタイミングを補正し(ステップS13)、さらに、補正したIQデータから環境および報酬を算出する(ステップS14)。これらのステップS13およびS14は、取り扱うデータがIQデータである点を除いて、上述したステップS3およびS4と同様の処理である。そのため、ステップS13およびS14の説明は省略する。環境計算部3は、補正したIQデータおよび算出した報酬を信号解析制御部1に出力する。
 次に、信号解析制御部1が、補正が完了したかを確認し(ステップS15)、完了していない場合(ステップS15:No)、ステップS12に戻り、ステップS12~S14の一連の処理を繰り返す。すなわち、信号解析装置10は、入力されたIQデータの補正が完了するまで、ステップS12~S15の処理を繰り返す。このとき、信号解析制御部1は、環境計算部3から出力された補正後のIQデータを行動決定部2に出力する。行動決定部2は、補正後のIQデータに対してステップS12を実行する。信号解析装置10は、例えば、環境計算部3で算出する報酬が定められた閾値以上となるまで処理を繰り返す。すなわち、信号解析制御部1は、環境計算部3から入力された報酬が閾値以上の場合に補正が完了したと判断する。
 補正が完了した場合(ステップS15:Yes)、運用ステップが終了となる。運用ステップが終了すると、信号解析制御部1は処理結果を外部に出力する。信号解析制御部1が出力する処理結果は、入力されたIQデータの解析結果すなわち搬送波周波数およびシンボルタイミングの推定結果であってもよいし、入力されたIQデータの搬送波周波数およびシンボルタイミングを推定結果に基づいて補正して得られた補正後のIQデータであってもよいし、入力されたIQデータの解析結果および補正後のIQデータの両方を出力してもよい。
 以上のように、本実施の形態において、信号解析装置10は、あらかじめ様々な変調方式やSNR、周波数オフセットおよびタイミングオフセットのIQデータを用いた学習を行い、行動決定部2を構成するCNNのパラメータを調整する。これにより、運用時には、いかなる条件の信号が入力された場合でも、高精度に搬送波周波数およびシンボルタイミングの推定を行い、その推定結果を出力したり、推定結果に基づいて搬送波周波数およびシンボルタイミングを補正した信号を出力したりすることが可能となる。
実施の形態2.
 実施の形態1にかかる信号解析装置10は、学習用データ保存部4に保存しておいた様々な変調方式やSNR、周波数オフセットおよびタイミングオフセットのIQデータを用いて行動決定部2のCNNを学習しておくことで、運用ステップ時にいかなる条件のIQデータが入力された場合でも高精度に搬送波周波数およびシンボルタイミングの推定を可能とした。しかし、必ずしも学習用データを用意できる訳ではないので、実施の形態2では学習用データがあらかじめ用意できない場合でも入力されたIQデータから学習用データを自身で生成し学習を行う信号解析装置について説明する。
 図16は、実施の形態2にかかる信号解析装置10aの機能構成例を示す図である。実施の形態2にかかる信号解析装置10aは、実施の形態1にかかる信号解析装置10の学習用データ保存部4を学習用データ生成部6に置き換えた構成である。学習用データ生成部6以外の構成要素については実施の形態1と共通であるため、説明を省略する。
 信号解析装置10aでは、外部からのIQデータが信号解析制御部1および学習用データ生成部6に入力される。学習用データ生成部6は、入力されたIQデータに任意のレベルのAWGN(Additive White Gaussian Noise:加算性白色ガウス雑音)を加えることで、SNRの異なる学習用データを生成する。
 次に、本実施の形態にかかる信号解析装置10aの動作について説明する。信号解析装置10aの動作は実施の形態1にかかる信号解析装置10の動作と同様に、学習ステップと運用ステップとに分けられるが、運用ステップは共通であり学習ステップのみが異なる。そのため、学習ステップについて説明し、運用ステップについては説明を省略する。
<学習ステップ>
 学習ステップでは、信号解析装置10aの行動決定部2、環境計算部3、学習制御部5および学習用データ生成部6が動作する。
 図17は、実施の形態2にかかる信号解析装置10aによる学習ステップの動作の一例を示すフローチャートである。図17のフローチャートは、実施の形態1にかかる信号解析装置10の学習ステップの動作を示す図5のフローチャートのステップS1をステップS21およびS22に置き換えたものである。
 信号解析装置10aによる学習ステップでは、まず、学習用データ生成部6が、外部から入力されるIQデータを取得し(ステップS21)、取得したIQデータから学習用データを生成する(ステップS22)。具体的には、学習用データ生成部6は、取得したIQデータに任意のレベルのAWGNを加算する処理を行い、学習用データを生成する。なお、任意のレベルのAWGNを加算する処理は一般的な手法であり、従来同様のものであるため説明は省略する。本実施の形態は、機械学習の強化学習をベースとした構成となっているため、学習用データにラベルをつける必要はない。そのため、学習用データの加工が可能である。ステップS22に続いて実行されるステップS2~S7は実施の形態1と共通であるため、説明を省略する。
 以上のように、実施の形態2にかかる信号解析装置10aは、外部から入力されるIQデータに基づいて学習用データを生成し、行動決定部2のCNNの学習を行う。信号解析装置10aは、学習用データが用意できない場合でも、様々なSNRのIQデータを用いて行動決定部2のCNNを学習することができ、実施の形態1にかかる信号解析装置10と同様に、運用時には、いかなる条件の信号が入力された場合でも、高精度に搬送波周波数およびシンボルタイミングの推定を行い、その推定結果を出力したり、推定結果に基づいて搬送波周波数およびシンボルタイミングを補正した信号を出力したりすることができる。
 各実施の形態で説明した本開示にかかる信号解析装置10および10aは、様々な変調方式やSNR、搬送波周波数オフセットおよびシンボルタイミングオフセットを持つ信号の搬送波周波数およびシンボルタイミングを推定するのに有用であり、特にスペクトル監視などに適している。また、信号の搬送波周波数推定およびシンボルタイミング推定は無線通信の根幹となる技術のため適用先はスペクトル監視にとどまらない。
 以上の実施の形態に示した構成は、一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、実施の形態同士を組み合わせることも可能であるし、要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
 1 信号解析制御部、2 行動決定部、3 環境計算部、4 学習用データ保存部、5 学習制御部、6 学習用データ生成部、10,10a 信号解析装置、11 学習動作ブロック、12 運用動作ブロック。

Claims (9)

  1.  入力信号の搬送波周波数およびシンボルタイミングの推定値を補正するための行動を学習してパラメータが調整済みのニューラルネットワークで構成され、信号が入力されると入力された前記信号に対して実行する行動を前記ニューラルネットワークにより決定する行動決定部と、
     前記行動決定部で決定された行動を実行するとともに、実行した行動に対する報酬を算出する環境計算部と、
     前記行動決定部による行動の決定と、前記環境計算部による行動の実行および報酬の計算とを繰り返し実行させる制御を行い、入力された前記信号の搬送波周波数およびシンボルタイミングの推定および補正を実行させる信号解析制御部と、
     を備えることを特徴とする信号解析装置。
  2.  前記ニューラルネットワークを学習させるための学習用データとして、信号の特徴を表す複数のパラメータの中の1つ以上が異なる複数の信号を保存する学習用データ保存部と、
     前記学習用データ保存部に保存された各信号を順番に選択し、選択した信号に対する行動を前記行動決定部に決定させるとともに、前記行動決定部により決定された行動に対する報酬を前記環境計算部に算出させ、前記行動決定部により決定された行動および前記環境計算部により算出された報酬に基づいて前記ニューラルネットワークのパラメータを更新する学習制御部と、
     を備えることを特徴とする請求項1に記載の信号解析装置。
  3.  信号の特徴を表す複数の前記パラメータを信号諸元、雑音レベル、搬送波周波数およびシンボルタイミングとする、
     ことを特徴とする請求項2に記載の信号解析装置。
  4.  外部から入力された信号を構成する同相信号および直交信号に雑音を付加して前記ニューラルネットワークを学習させるための学習用データを生成する学習用データ生成部と、
     前記学習用データ生成部で生成された各信号を順番に選択し、選択した信号に対する行動を前記行動決定部に決定させるとともに、前記行動決定部により決定された行動に対する報酬を前記環境計算部に算出させ、前記行動決定部により決定された行動および前記環境計算部により算出された報酬に基づいて前記ニューラルネットワークのパラメータを更新する学習制御部と、
     を備えることを特徴とする請求項1に記載の信号解析装置。
  5.  前記環境計算部は、前記行動決定部で決定された行動を実行して得られた信号のコンステレーションに含まれる各信号点ヒストグラム化し、ヒストグラムのピークと平均とに基づいて前記報酬を算出する、
     ことを特徴とする請求項1から4のいずれか一つに記載の信号解析装置。
  6.  前記環境計算部は、前記行動決定部で決定された行動を実行して得られた信号のアイパターンの中心をヒストグラム化し、ヒストグラムのピークと平均とに基づいて前記報酬を算出する、
     ことを特徴とする請求項1から5のいずれか一つに記載の信号解析装置。
  7.  信号解析装置が実行する信号解析方法であって、
     入力信号の搬送波周波数およびシンボルタイミングの推定値を補正するための行動を学習してパラメータが調整済みのニューラルネットワークを用いて、入力された信号に対して実行する行動を決定する第1のステップと、
     前記第1のステップで決定した行動を実行するとともに、実行した行動に対する報酬を算出する第2のステップと、
     を含み、
     前記第1のステップおよび前記第2のステップを繰り返し実行し、入力された前記信号の搬送波周波数およびシンボルタイミングの推定および補正を行う、
     ことを特徴とする信号解析方法。
  8.  信号解析装置を制御する制御回路であって、
     入力信号の搬送波周波数およびシンボルタイミングの推定値を補正するための行動を学習してパラメータが調整済みのニューラルネットワークを用いて、入力された信号に対して実行する行動を決定する第1のステップと、
     前記第1のステップで決定した行動を実行するとともに、実行した行動に対する報酬を算出する第2のステップと、
     を含み、
     前記第1のステップおよび前記第2のステップを繰り返し実行し、入力された前記信号の搬送波周波数およびシンボルタイミングの推定および補正を行う処理、
     を前記信号解析装置に実行させることを特徴とする制御回路。
  9.  信号解析装置を制御するプログラムを記憶する記憶媒体であって、
     前記プログラムは、
     入力信号の搬送波周波数およびシンボルタイミングの推定値を補正するための行動を学習してパラメータが調整済みのニューラルネットワークを用いて、入力された信号に対して実行する行動を決定する第1のステップと、
     前記第1のステップで決定した行動を実行するとともに、実行した行動に対する報酬を算出する第2のステップと、
     を含み、
     前記第1のステップおよび前記第2のステップを繰り返し実行し、入力された前記信号の搬送波周波数およびシンボルタイミングの推定および補正を行う処理、
     を前記信号解析装置に実行させることを特徴とする記憶媒体。
PCT/JP2022/009985 2022-03-08 2022-03-08 信号解析装置、信号解析方法、制御回路および記憶媒体 WO2023170783A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2022/009985 WO2023170783A1 (ja) 2022-03-08 2022-03-08 信号解析装置、信号解析方法、制御回路および記憶媒体
JP2023574579A JPWO2023170783A1 (ja) 2022-03-08 2022-03-08

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/009985 WO2023170783A1 (ja) 2022-03-08 2022-03-08 信号解析装置、信号解析方法、制御回路および記憶媒体

Publications (1)

Publication Number Publication Date
WO2023170783A1 true WO2023170783A1 (ja) 2023-09-14

Family

ID=87936376

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/009985 WO2023170783A1 (ja) 2022-03-08 2022-03-08 信号解析装置、信号解析方法、制御回路および記憶媒体

Country Status (2)

Country Link
JP (1) JPWO2023170783A1 (ja)
WO (1) WO2023170783A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001086171A (ja) * 1999-09-09 2001-03-30 Nec Corp 自動変調方式識別装置及び自動変調方式識別方法
JP2014206795A (ja) * 2013-04-11 2014-10-30 日本電信電話株式会社 線形モデルに基づく強化学習方法とその装置とプログラム
WO2020166005A1 (ja) * 2019-02-14 2020-08-20 三菱電機株式会社 機械学習装置、信号諸元識別装置および機械学習方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001086171A (ja) * 1999-09-09 2001-03-30 Nec Corp 自動変調方式識別装置及び自動変調方式識別方法
JP2014206795A (ja) * 2013-04-11 2014-10-30 日本電信電話株式会社 線形モデルに基づく強化学習方法とその装置とプログラム
WO2020166005A1 (ja) * 2019-02-14 2020-08-20 三菱電機株式会社 機械学習装置、信号諸元識別装置および機械学習方法

Also Published As

Publication number Publication date
JPWO2023170783A1 (ja) 2023-09-14

Similar Documents

Publication Publication Date Title
US9270512B2 (en) Nonlinearity compensation for reception of OFDM signals
KR101120072B1 (ko) 임의 파형 전치 왜곡 테이블 생성
CN108243125B (zh) 自动频率控制器及方法与无线通信装置及方法
JPWO2003103166A1 (ja) 歪補償装置
CN101406019A (zh) 用于计算数字通信系统中接收信号的似然度量的方法和设备
CN104300923B (zh) 为功率放大器的前置补偿的估计装置及估计方法
KR101099319B1 (ko) 전력 증폭 장치 및 전력 증폭 방법
WO2023170783A1 (ja) 信号解析装置、信号解析方法、制御回路および記憶媒体
US9923586B2 (en) Apparatus and method for estimating carrier frequency offset for multipath signals
US11765007B2 (en) Signal specification identification apparatus, control circuit, and program storage medium
JP5561280B2 (ja) サンプリング回路、通信装置、歪補償回路、信号サンプリング方法、プログラム
Jeske et al. Signal‐to‐interference‐plus‐noise ratio estimation for wireless communication systems: Methods and analysis
US9712346B2 (en) Continuous phase modulation method and emitter implementing said method
WO2022130572A1 (ja) 送信装置、送信方法、制御回路および記憶媒体
JP7270868B2 (ja) 機械学習装置および妨害信号生成装置
JP4063628B2 (ja) 歪補償装置
US20230421159A1 (en) Phase mixer non-linearity measurement within clock and data recovery circuitry
JP4602851B2 (ja) 歪み補償回路、送信機および歪み補償方法
WO2022120757A1 (zh) 一种星座符号检测方法及装置
US20230171133A1 (en) Signal magnitude shaping
JP4192110B2 (ja) A/d変換器のdcオフセット校正方法及び回路
GB2620044A (en) Machine learning device and jamming signal generation device
Nielsen et al. Adapting to Nonlinear Transmitters With Hybrid Model Training for Neural Receivers
US6925136B1 (en) Simultaneous frequency and phase synchronizer
JP2018142779A (ja) 受信機、コンピュータに実行させるためのプログラムおよびそれを記録した記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22930768

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023574579

Country of ref document: JP