WO2023062326A1 - Procédé d'estimation de signaux physiologiques - Google Patents

Procédé d'estimation de signaux physiologiques Download PDF

Info

Publication number
WO2023062326A1
WO2023062326A1 PCT/FR2022/051933 FR2022051933W WO2023062326A1 WO 2023062326 A1 WO2023062326 A1 WO 2023062326A1 FR 2022051933 W FR2022051933 W FR 2022051933W WO 2023062326 A1 WO2023062326 A1 WO 2023062326A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
respiratory
cardio
physiological
signals
Prior art date
Application number
PCT/FR2022/051933
Other languages
English (en)
Inventor
Guillaume CATHELAIN
Original Assignee
Mitral
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitral filed Critical Mitral
Publication of WO2023062326A1 publication Critical patent/WO2023062326A1/fr

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/1102Ballistocardiography
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/11Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
    • A61B5/113Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb occurring during breathing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4806Sleep evaluation
    • A61B5/4818Sleep apnoea
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7232Signal processing specially adapted for physiological signals or for diagnostic purposes involving compression of the physiological signal, e.g. to extend the signal recording period
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7278Artificial waveform generation or derivation, e.g. synthesising signals from measured signals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/003Detecting lung or respiration noise

Definitions

  • the present invention relates to a computer-implemented system and method for estimating physiological signals of a subject.
  • SAHS Sleep Apnea Hypopnea Syndrome
  • pauses apneas
  • hyperpneas difficulty breathing
  • SAHS Sleep Apnea Hypopnea Syndrome
  • These respiratory events last at least 10 seconds and occur depending on the severity of OSAHS from 5 times per hour (mild OSAS) to more than 30 times per hour (severe OSAS).
  • the causes of SAHS can be multiple, and several categories of respiratory events are conventionally defined by different clinical signs.
  • SAHS can also be positional when respiratory events occur primarily in the supine position.
  • SAHS obstructive sleep apnea syndrome
  • CSA central sleep apnea syndrome
  • SAHS cardiovascular comorbidities
  • cardiovascular comorbidities such as heart failure, hypertension, stroke, cardiac arrhythmias or myocardial infarction (Javaheri, et al., 1998).
  • Diagnosis is based on polysomnographic recording of respiratory activity (chest belt, abdominal belt, nasal flow, nasal pressure, snoring, oxygen saturation), cardiac activity (heart rate, photoplethysmogram, electrocardiogram), brain activity (EEG) and motor activity (actimeter, position sensor).
  • a simplified outpatient polygraph recording is generally sufficient for the diagnosis of POSA and analyzes at least the following sensors: the abdominal and thoracic belts, the nasal cannula, the microphone, pulse oximeter, position, and oxygen saturation (Berry, et al., 2017).
  • OSA affects approximately 950 million people worldwide (Benj afield, et al., 2019). CSA and OSA are usually confused in these estimates. Risk factors have been identified such as obesity, age, sex (men are more affected), ethnic origin, smoking, alcohol consumption, diabetes, abnormalities of the respiratory tract or neurological disorders. In France, an estimated 24 million patients suffer from at least mild OSA, i.e. with an apnea-hypopnea index greater than 5 events per hour (Benjafield, et al., 2019). There are also strong correlations with other pathologies. Thus 21% to 74% of patients with atrial fibrillation do POSA (Linz, et al., 2018); 29% to 67% of insomniac patients do POSA (Luyster, Buysse, & Strollo, 2010).
  • Ventilatory polygraphy has a limited number of sensors, which allows the patient to equip himself and perform the diagnostic examination on an outpatient basis at home. Although one night of hospitalization is avoided and the cost is therefore lower on an outpatient basis (Stewart, Penz, Fenton, & Skomro,
  • the present invention provides a solution making it possible to reduce the complexity of the acquisition system so as to drastically reduce the cost and the diagnostic examination logistics, while being more comfortable and practical for the patient. A larger number of patients could be diagnosed in this way.
  • the present invention relates to a computer-implemented method for estimating physiological signals of a subject, said method comprising: receiving at least one cardio-respiratory signal representative of sounds and/or movements originating from the rib cage and the subject's airways, the cardio-respiratory signal being acquired during the subject's sleep; the use of a non-linear regression model of the neural network type configured and trained to receive, as input, F at least one cardiorespiratory signal, and provide as output at least one estimate of a physiological signal of ventilatory polygraphy and/or a physiological electrocardiography signal; wherein the neural network comprising an encoder having one input and multiple outputs and a decoder having one output and multiple inputs, wherein at least two encoder outputs are directly connected to at least two respective inputs of the decoder, and at least two encoder outputs are interconnected and wherein said neural network is configured to perform one-dimensional convolution operations; and supplying at the output F at least one estimate of a physiological signal from ventilatory polygraphy and/or
  • the model used in the method of the invention advantageously makes it possible to obtain several signals having characteristic plots of the signals measured by the ventilatory polygraphy and/or electrocardiogram sensors using a cardio-respiratory sound signal as the only input. (ie, acquired by a microphone) and/or a cardio-respiratory movement signal (ie, acquired by a gyroscope and/or an accelerometer positioned in contact with the subject's thorax).
  • This method therefore makes it possible to obtain ventilatory polygraphy or electrocardiogram (ECG) signals by means of only an audio sensor and/or a movement sensor instead of the set of sensors necessary in a standard acquisition of ventilatory polygraphy or ECG (ie, telescope nose, chest belt, abdominal belt, electrodes, etc.).
  • the present invention aims to reconstruct as faithfully as possible several signals having characteristic plots of the signals measured by the sleep polygraphy sensors (ie, comprising the ventilatory polygraphy signals and/or a physiological electrocardiography signal) obtained by a complex measuring device using as the only input a sound cardio-respiratory signal and/or a movement cardio-respiratory signal, which can be obtained by a sensor such as an inertial unit and a microphone, for example housed in the same simple device like a cell phone.
  • the sleep polygraphy sensors ie, comprising the ventilatory polygraphy signals and/or a physiological electrocardiography signal
  • a complex measuring device using as the only input a sound cardio-respiratory signal and/or a movement cardio-respiratory signal, which can be obtained by a sensor such as an inertial unit and a microphone, for example housed in the same simple device like a cell phone.
  • the encoder transforms the input signals into points of a latent space (low-dimensional space) while the decoder transforms the points of the latent space into output signals that one wishes to reconstitute, for example those of ventilatory polygraphy.
  • the weights of the encoder and the decoder are finely adjusted, in such a way as to achieve near-lossless compression/decompression, by precisely minimizing a cost function which measures the difference between the reconstructed signals and those desired (i.e., physiological signal from ventilatory polygraphy and/or physiological signal from electrocardiography).
  • the latent space intrinsic in the encoder-decoder structure, contains the essential physiological information of a respiratory or cardiac activity, which can be represented in different ways: as a seismocardiogram measured by an accelerometer or as an electrocardiogram measured by an electrocardiogram.
  • the neural network includes a U-Net and the encoder includes a ResNet.
  • the U-Net U-shaped architecture advantageously makes it possible to connect several encoder outputs to several decoder inputs so as to extract information at several scales and then assemble them in the decoder. This gives a more reliable estimate of the output physiological signals.
  • said physiological signal of ventilatory polygraphy is chosen from: a nasal flow acquired through a nasal cannula, a nasal pressure acquired through a nasal cannula, chest respiratory effort acquired through a chest belt, or abdominal respiratory effort acquired through a abdominal belt.
  • said physiological electrocardiography signal is acquired through an electrocardiogram of at least one lead.
  • F at least one cardio-respiratory signal is a cardio-respiratory movement signal obtained using a gyroscope and/or an accelerometer.
  • F at least one cardio-respiratory signal is a cardio-respiratory sound signal; the method further comprising compression of the cardio-respiratory sound signal using a second convolutional neural network, prior to its application as input to the non-linear regression model.
  • the method further comprises merging the compressed cardio-respiratory sound signal with the cardio-respiratory motion signal.
  • F at least one cardio-respiratory signal is normalized before using the non-linear regression model.
  • the neural network includes an output layer having a linear activation function.
  • the method further comprises detecting an abnormal episode associated with sleep apnea based on at least one ventilatory polygraphy signal delivered by the non-linear regression model.
  • the method further comprises detecting an abnormal episode associated with a cardiac arrhythmia based on at least one cardiac physiological signal delivered by the non-linear regression model.
  • the present invention further relates to a device for estimating physiological signals of a subject, said device comprising: at least one input configured to receive at least one cardio-respiratory signal representative of the sounds and/or movements coming from the rib cage and the airways of the subject, the cardio-respiratory signal being acquired during the sleep of the subject; at least one processor configured to: estimate at least one physiological signal from ventilatory polygraphy and/or one physiological signal from electrocardiography using a non-linear regression model of the neural network type configured and trained to receive, as input, F at least one cardiorespiratory signal, and providing as output F at least one estimate of a physiological signal from ventilatory polygraphy and/or a physiological signal from electrocardiography; wherein the neural network comprising an encoder having one input and multiple outputs and a decoder having one output and multiple inputs, wherein each encoder output is directly connected to a respective input of the decoder, and at least two outputs of the encoder are interconnected and wherein said neural network includes one-dimensional convolution operations;
  • the device further comprises an accelerometer, a gyroscope and/or a microphone.
  • the present invention further relates to a computer program product comprising instructions which, when the program is executed by a computer, lead the latter to implement the method for the estimation of physiological signals of a subject according to the any of the embodiments described above.
  • the present invention further relates to a non-transitory computer-readable recording medium comprising instructions which, when the program is executed by a computer, cause the latter to implement the method for the estimation of physiological signals of a subject according to any of the embodiments described above.
  • a non-transitory computer-readable recording medium may be, without limitation, an electronic, magnetic, optical, electromagnetic, infrared or semiconductor device, or any suitable combination of the foregoing.
  • processor should not be interpreted as being limited to computer hardware (“hardware”) capable of executing software, and refers general to a processing device, which may for example include a computer, a microprocessor, an integrated circuit or a programmable logic device (PLD).
  • the processor may also encompass one or more graphics processing units (GPUs), whether operated for computer graphics and image processing or other functions.
  • GPUs graphics processing units
  • the instructions and/or the data making it possible to execute the associated and/or resulting functionalities can be stored on any medium readable by the processor such as, for example, an integrated circuit, a hard disk, a CD (Compact Disc ), an optical disc such as a DVD (Digital Versatile Disc), RAM (Random-Access s Memory) or ROM (Read-Only Memory).
  • the instructions may be stored in computer hardware, software, firmware (“firmware”) or any combination thereof.
  • a “neural network” or “artificial neural network (ANN)” refers to a category of machine learning algorithm comprising nodes (called neurons), and connections between neurons modeled by “weights”. For each neuron, an output is given according to an input or a set of inputs by an "activation function”. Neurons are usually organized in several “layers”, so that the neurons of one layer do not connect only to neurons of the immediately preceding and immediately following layers.
  • a “convolutional neural network” refers to a type of acyclic (“feed-forward”) artificial neural network comprising multiple hidden layers.
  • the hidden layers are generally convolutional layers followed by activation layers, some of them being followed by pooling layers.
  • “Inertial unit” relates to instruments comprising six sensors, including three gyrometers measuring the three components of the angular velocity vector, and three accelerometers measuring the three components of the specific force vector.
  • Figure 1 is a block diagram schematically representing a particular mode of a device for estimating respiratory signals and/or cardiac signals from cardio-respiratory signals, in accordance with the present disclosure.
  • Figure 2 provides an example of cardio-respiratory signals received at the input of the device and of the method of the present invention.
  • Figure 3 is a block diagram schematically representing the structure of the U-shaped architecture of the nonlinear regeneration model.
  • Figure 4 is a block diagram schematically representing the structure of the U-shaped architecture of the nonlinear regression model combined with the second neural network for the compression of sound signals.
  • Figure 5 reports the respiratory physiological signals obtained from signals in Figure 2.
  • FIG 6 reports the cardiac physiological signals of seismocardiogram (SCG) and gyrocardiogram (GCG) type obtained from signals in figure 2.
  • Figure 7 is a flowchart showing the successive steps executed with the estimation device of Figure 1.
  • Figure 8 is a functional diagram schematically representing a particular mode of a regression model training device, in accordance with the present disclosure and adapted to the prediction device of Figure 1.
  • Figure 9 schematically represents a device integrating the functions of the estimation device of Figure 1 and the training device of Figure 8.
  • Figure 10 shows a physiological signal of the thoracic respiratory effort type estimated by the device 1 (curve C1) superimposed on a signal acquired directly by a chest belt (curve C2) synchronously with the cardio-respiratory signal used in the device 1 for the estimate.
  • Figure 11 shows, from top to bottom, a first physiological signal of the thoracic respiratory effort type estimated by the device 1, a second physiological signal of the abdominal respiratory effort type estimated by the device 1, a superposition of the first signal with a signal acquired directly by a chest belt synchronously, and superimposing the first signal with a signal acquired directly by a lap belt synchronously.
  • Figure 12 shows, from top to bottom, a first physiological signal of the nasal flow type estimated by the device 1, a second physiological signal of the nasal pressure type estimated by the device 1, a superposition of the first signal with a signal acquired directly by a nasal cannula synchronously and superimposing the second signal with a signal acquired directly by a nasal cannula synchronously.
  • the device 1 is in fact adapted to output an estimate of at least one physiological signal which is typically obtained by a device for measuring sleep polygraphy (i.e., comprises sensors for measuring the physiological electrocardiography signal) or ventilatory polygraphy from the analysis of cardio-respiratory signals 21.
  • a device for measuring sleep polygraphy i.e., comprises sensors for measuring the physiological electrocardiography signal
  • ventilatory polygraphy from the analysis of cardio-respiratory signals 21.
  • Such measuring devices are complex and bulky devices comprising multiple sensors to be positioned near or in contact with the subject.
  • the estimated ventilatory polygraphy physiological signal may be at least one of the following signals: a nasal flow acquired through a nasal cannula, a nasal pressure acquired through a nasal cannula, a thoracic respiratory effort acquired by the chest belt, abdominal respiratory effort acquired via a abdominal belt and/or oxygen saturation acquired by a pulse oximeter or saturometer.
  • the estimated ventilatory polygraphy physiological signal further comprises a photoplethysmographic signal
  • the estimated physiological electrocardiography signal 31 can be a signal acquired by means of an electrocardiogram with at least one lead.
  • the invention aims to use the information included in a cardio-respiratory signal to deduce therefrom an estimate of the respiratory signals and/or cardiac signals such as they would have been acquired by dedicated sensors such as nasal prongs, chest or abdominal belts, electrodes for the electrocardiogram and others.
  • the physiological signals 31 at the output of the method therefore present traces characteristic of ventilatory polygraphy or ECG sensors so that the doctor who examines them can interpret them in the same way. as ECG or ventilatory polygraphy signals acquired directly by the dedicated sensors.
  • the cardio-respiratory signals 21 can be acquired through one or more sensors positioned close to the subject, preferably in contact with the subject.
  • the cardio-respiratory signals 21 representative of the sounds and movements originating from the rib cage and the airways of the subject, which will be referred to in this disclosure as "cardio-respiratory movement signals” are acquired thanks to at least a gyroscope and/or at least one accelerometer.
  • the cardio-respiratory movement signals 21 are acquired by an inertial unit. Said inertial unit can be included in a normally portable electronic telecommunications device, such as a portable telephone.
  • cardio-respiratory signals 21 acquired by one or more sensors positioned on the subject's thorax is particularly advantageous because it makes it possible to obtain more robust signals and with a more intense amplitude compared to the use proximity sensor such as the balistocardiogram sensor, generally positioned in the subject's bed or the sonar, generally placed next to the bed.
  • the sensors positioned close to the subject and not in direct contact are more sensitive to noise from the subject's environment and the signals collected are dependent on the objects in contact with the sensors (i.e., the bed, etc.).
  • the use of an inertial unit directly in contact with the subject makes it possible, for example, to make systole and diastole detectable in the signal.
  • the cardio-respiratory signals 21 representative of the sounds originating from the rib cage and the airways of the subject are acquired using a microphone.
  • the microphone may be an independent sensor positioned in contact with the subject's torso or neck (ie, directly in contact with the skin or in contact with a thickness, such as the fabric of an undershirt, which is itself in direct contact with the subject's skin).
  • the cardio-respiratory sound signal can be acquired by means of a microphone integrated in a normally portable electronic telecommunications device, such as a portable telephone.
  • the subject can position a mobile telephone on his thorax using a fixing device and all the cardio-respiratory signals are therefore acquired thanks to the sensors included in said telephone.
  • the phone can additionally be combined with other sensors.
  • other cardio-respiratory sound signals can be acquired by a microphone in contact with the subject's neck or positioned near the subject's nose and mouth.
  • the cardio-respiratory sound signals are received by file in MP3 (MPEG-1/2 Audio Layer III) or AAC (Advanced audio Coding) format.
  • the sensors included in the same system can be synchronized by the same internal clock so that the signals are timestamped synchronously.
  • an acquired signal synchronization system can be set up so as to obtain timestamped signals synchronously.
  • the cardio-respiratory signals 21 can be acquired continuously by the sensors, preferably during the sleep of the subject.
  • the cardio-respiratory signals 21 can therefore comprise data acquired for 5 to 12 hours, generally 8 hours.
  • the sampling frequency of sound signals is between 5 kHz and 15 kHz, and the sampling frequency of motion signals is between 80 and 150 Hz.
  • the graphs in Figure 2 show an example of the signals received as input by the module 11, comprising an audio signal and six motion signals acquired by the six sensors of an inertial unit.
  • the estimation device 1 is associated with a training device 6 suitable for adjusting the parameters of the non-linear regression model of the device 1, shown in Figure 8, which will be described later.
  • Each of the devices 1 and 6 is advantageously an appliance, or a physical part of an appliance, designed, configured and/or adapted to perform the mentioned functions and produce the mentioned effects or results.
  • any one of device 1 and device 6 is realized as a collection of devices or physical parts of devices, whether grouped together in a single machine or in different machines, possibly remote ones.
  • the device 1 and/or the device 6 can for example have functions distributed on a cloud infrastructure (“cloud infrastructure”) and be available to users as a cloud service (“cloud-based service”), or have remote functions accessible through an API.
  • cloud infrastructure cloud infrastructure
  • cloud-based service cloud-based service
  • the estimation device 1 and the training device 6 can be integrated into the same device or set of devices, and intended for the same users.
  • the structure of device 6 can be completely independent of the structure of device 1, and can be provided to other users.
  • the device 1 can have a parameterized model available to the operators for the estimations of the cardiac and/or respiratory physiological signals, entirely defined from the training carried out upstream by other actors with the device 6.
  • modules are to be understood as functional entities rather than physically separate, hardware components. They can therefore be materialized either as grouped together in the same tangible and concrete component, or distributed in several of these components. Similarly, each of these modules is optionally itself shared between at least two physical components. Further, modules are implemented as hardware, software, firmware, or any mixed form thereof. They are preferably incorporated into at least one processor of device 1 or device 6.
  • the device 1 can comprise the sensors configured to acquire the cardio-respiratory signals 21.
  • the device 1 comprising the microprocessor and the sensors are integrated into a device of compact dimensions adapted to be placed in direct contact with the thorax of the subject during his sleep, such as for example a mobile telephone.
  • the device 1 comprises a module 11 for receiving at least one cardiorespiratory signal 21 as well as parameters of the non-linear regression model 20 stored in one or more local or remote database(s).
  • the latter may take the form of storage resources available from any type of suitable storage means, which may in particular be a RAM or an EEPROM (Electrically-Erasable Programmable Read-Only Memory) such as a Flash memory, possibly within an SSD (Solid-State Disk).
  • the parameters of the model 20 have been generated beforehand by a system comprising the device 6 for learning.
  • the parameters of the model 20 are received by a communication network.
  • the device 1 also optionally comprises a module 12 for pre-processing the cardio-respiratory signals 21.
  • the module 12 can in particular be adapted to standardize the data of the cardio-respiratory signals received 21 with a view to efficient and reliable processing. It can transform the cardio-respiratory sound signals 21, for example by decompression of the acquired sound data.
  • the module 12 is configured to pre-process the cardio-respiratory signals 21 so that the signals are normalized. This can improve the efficiency of the downstream processing by the device 1. Such normalization can be particularly useful when the signals used come from different sources, possibly including different acquisition systems.
  • Signals can be normalized using Z-score normalization.
  • the signals are separated into time windows of about 15 to 60 seconds for motion signals and about 1 to 60 seconds for sound signals. These lengths for the time windows are determined in order to be able to detect sleep apnea in the estimations of the physiological signals.
  • the normalization is advantageously applied to the signals 21 of the training data sets (for example by the device 6) in a similar way.
  • the device 1 can process signals coming from a given type of source, whereas its parameters result from learning based on signals obtained with different types of sources. Through standardization, differences between sources can then be neutralized or minimized. This can make device 1 more efficient and more reliable.
  • the module 12 is further configured to perform a compression of the cardio-respiratory sound signal using a convolutional neural network.
  • Said convolutional neural network can be a residual neural network (“residual neural network”, ResNet), which are neural networks using shortcuts (“skip connections”) to skip certain layers. Said shortcuts advantageously make it possible to avoid the problem of vanishing gradients.
  • ResNet models can be implemented with two- or three-layer jumps that contain nonlinearities (ReLU) and batch normalization in between.
  • the sound signals are acquired with a higher sampling rate (i.e., large data files) than that of the motion signals, so advantageously, the compression of the sound signals makes it possible to reduce the computational cost and reduces the RAM required at the stage of using the model.
  • the compressed sound signals are merged with the movement signals.
  • the network that performs the compression is a ResNet-18 with a one-dimensional convolutional operation, configured to compress packets of 8092 sound samples into 256 samples comprising 512 components ("features"). These 512 components are then concatenated with 6 components of the inertial unit (i.e., acceleration and angular velocity for each of the three axes).
  • the device 1 comprises among other things a module 13 configured to use a non-linear regression model on cardio-respiratory signals so as to obtain at least an estimation of a physiological signal representative either of the cardiac activity or of the respiratory activity of the subject.
  • Said non-linear regression model is in particular configured to receive as input F at least one cardio-respiratory signal, and to provide as output at least one estimate of a physiological signal from ventilatory polygraphy and/or a physiological signal from electrocardiography 31.
  • the non-linear regression model used is a network of neurons configured and trained to receive, as input, F at least one cardio-respiratory signal, and provide as output at least one estimate of a physiological signal 31.
  • Said network of neurons is further configured to perform one-dimensional convolution operations.
  • a convolution is a linear operation that involves multiplying a set of weights with the input.
  • the multiplication is performed between an input data vector (ie time series) and a one-dimensional array of weights, called a filter or kernel.
  • this neural network has a structure comprising an encoder and a decoder.
  • the encoder is built with one input and several outputs and the decoder with one output and several inputs. Further, at least two encoder outputs are directly connected to at least two respective inputs of the decoder, and at least two encoder outputs are connected together. This type of structure makes it possible to solve the problem of “vanishing gradient”.
  • the neural network includes a fully convolutional neural network model, with an encoder and a decoder, called U-Net.
  • the encoder is an assembly of convolution layers, “max pooling” layers making it possible to create a map of signal components and to reduce their size to reduce the number of network parameters.
  • the decoder allows for expansion with a path symmetrical to the encoder's contraction path, resulting in the U-shape of the architecture.
  • the U-net advantageously allows several encoder outputs to be connected to several decoder inputs. Thus, it is possible to extract information at each scale (ie, each block which precedes a “max pooling”), and to assemble them in the decoder. Which is different from the case of the auto-encoder which does not keeps only the lowest scale information.
  • the U-net encoder comprises a ResNet architecture.
  • Figure 3 shows an example of architecture of the neural network configured to receive cardio-respiratory movement signals as input, possibly after a pre-processing step performed by the module 12.
  • This figure shows in particular the "skip connections" present in the encoder (left column) characteristic of a ResNet and the horizontal connections between the encoder and the decoder characteristic of a UNet (i.e., horizontal arrows between the left column and the right column representing the concatenation of components of an output of the encoder with those of another output of the decoder).
  • Figure 4 shows a second example of an architecture built to process both sound and motion signals.
  • This architecture includes, in addition to the previous architecture, the ResNet-18 neural network for the compression of sound signals.
  • the neural network for compression is located before the U-Net encoder (first column on the left of the path).
  • the neural network includes an output layer having a linear activation function.
  • the linear activation function is the identity function, and its use is advantageously suited to regression problems because the expected output value belongs to the set of reals.
  • the module 13 can also be configured to carry out a normalization of signals at the output of the regression model.
  • a normalization of signals at the output of the regression model As for the input signals of the regression model, also certain output signals can be normalized using Z-score normalization (“z-score normalization”).
  • the normalized signals include in particular the physiological signals except oxygen saturation and heart rate, of which it is interesting to know the absolute amplitude.
  • Figures 5 and 6 give examples of respiratory and cardiac physiological signals respectively. These signals in Figures 5 and 6 are obtained by analyzing the cardio-respiratory signals represented in Figure 2.
  • the device may further comprise a module 14 configured to detect an abnormal episode associated with sleep apnea. In one embodiment, this abnormal episode is detected by analyzing F at least one ventilatory polygraphy signal delivered by the non-linear regression model, by applying a segmentation model to it. In an alternative embodiment, the module 14 is configured to directly analyze the cardio-respiratory signals by applying a segmentation model.
  • the module 14 can be further configured to detect an abnormal episode associated with a cardiac arrhythmia. In one embodiment, this abnormal episode is detected by analyzing F at least one cardiac physiological signal delivered by the non-linear regression model. In an alternative embodiment, the module 14 is configured to directly analyze the cardio-respiratory signals by applying a segmentation model.
  • the Device 1 interacts with a user interface 16, through which information can be entered and retrieved by a user.
  • the user interface 16 comprises any suitable means for entering or retrieving data, information or instructions, in particular visual, tactile and/or sound capabilities which may include one or more of the following means well known to those skilled in the art: a screen, a keyboard, a trackball, a touch pad, a touch screen, a loudspeaker, a voice recognition system.
  • the device 1 can for example execute the following process (FIG. 7): receive at least one cardio-respiratory signal 21 representative of the sounds and/or movements originating from the rib cage and the airways of the subject (step 41 ); the use of a non-linear regression model of the neural network type to obtain, from F at least one cardio-respiratory signal 21, at least one estimate of a physiological signal of ventilatory polygraphy and/or a signal physiological electrocardiography 31 (step 42); provide at output F at least one estimate of a physiological signal from ventilatory polygraphy and/or a physiological signal from electrocardiography 31 (step 43).
  • the device 6 can be integrated into the same device as the estimation device 1 and share most of the functionalities of the device 1. More generally, the device 1 and the device 6 can have common processors configured to execute part of the functionalities of the device 1, whether localized or distributed. In alternative implementations, device 1 and device 6 may be completely disconnected, and possibly operated by separate actors (e.g. a service provider for device 6 and clinic staff for device 1).
  • device 6 shares the same architecture with device 1, as well as the same data preprocessing. For example, the preliminary normalization of the cardio-respiratory signals are identical. This is however not necessary, and Device 6 may have a different architecture to some extent, as long as it is able to provide model parameters suitable for correct estimations by Device 1.
  • the learning parameters 20 used by the device 1 can come from sources other than the device 6.
  • the device 6 is suitable for recovering initial learning parameters 721 defining an initial algorithmic model within the framework of a "machine learning" architecture, from one or more base(s) 60 local or remote data.
  • the latter may take the form of storage resources available from any type of suitable storage means, which may in particular be a RAM or an EEPROM such as a Flash memory, possibly within an SSD.
  • the initial training parameters 721 have been previously generated by the device 6 for training.
  • the initial training parameters 721 are received from a communication network.
  • the device 6 is configured to determine modified learning parameters 722 defining a modified algorithmic model on the basis of the input learning parameters 721, and to transmit these parameters 722 or save them, for example in the database(s). s) of data 60. This is achieved by using sets of training data 71 received by the device 6, making it possible to progressively adjust the training parameters so that an associated algorithmic model becomes more relevant for these sets of training data 71 (supervised training).
  • the training data sets 71 comprise input data including cardio-respiratory signals 711, and output data including respiratory and cardiac physiological signals 712 respectively corresponding to the inputs, which were measured simultaneously.
  • the device 6 is configured to iteratively produce results of the physiological signals evaluated from the input data 711, on the basis of learning parameters defining a current algorithmic model, and to modify these learning parameters. so as to reduce the discrepancies between the physiological respiratory signals evaluated and the known physiological respiratory signals 712.
  • the modified learning parameters 722 can themselves be taken as initial learning parameters for subsequent learning operations.
  • device 6 can be applied equally to validation datasets and test datasets.
  • the learning device 6 comprises an execution stage 60 comprising a module 61 for receiving the sets of learning data 71 and the learning parameters 721, a module 62 for pre-processing the cardio-respiratory signals 711 of the sets of data learning 71, a module 63 for using the regression model to calculate the physiological signals and to output them.
  • modules 61, 62 and 63 will not be detailed here, because their description is similar to the description above respective modules 11, 12 and 13 of the prediction device 1.
  • the machine learning based models in modules 62 and/or 63 are defined by the current values of the learning parameters.
  • the modules 61, 62 and 63 of the device 6 are at least partially identical to the modules 11, 12 and 13 of the device 1.
  • the same image normalization can be applied (modules 12 and 62 ) and/or the same neural network architecture can be used (modules 13 and 63).
  • the execution step 60 can be an entity common to the device 1 and to the device 6.
  • the device 6 further comprises a module 65 for comparing the estimates of the physiological signals evaluated with the known physiological signals 712 and for modifying the current training parameters in order to reduce the difference between them.
  • a module 65 for comparing the estimates of the physiological signals evaluated with the known physiological signals 712 and for modifying the current training parameters in order to reduce the difference between them.
  • the device 6 also comprises a module 66 for stopping the modifications of the learning parameters on the basis of the sets of data 71.
  • This module 66 can provide for stopping the associated iterations when the differences between the physiological signals evaluated and the known physiological signals 712 fall below a predefined threshold. It can, on the contrary, or cumulatively, provide for the end of these iterations when a predefined maximum number of iterations is reached.
  • device 6 is configured to train exclusively towards the neural network with U-shaped architecture.
  • device 6 includes additional machine learning stages, which can be intended in particular to compress the sound signals 711. Then, the device 6 can also be configured to train these additional machine learning stages.
  • the device 6 is configured to jointly train some or all of the additional learning stages with the neural network with U-shaped architecture of module 63.
  • device 6 can be adapted to perform back-propagation through time (BPTT).
  • BPTT back-propagation through time
  • a gradient-based technique is applied at a cost relative to all network parameters, as known to those skilled in the art.
  • Stochastic gradient descent can also be used (i.e., “batch gradient descent” or “mini-batch gradient descent”).
  • the two architectures can be trained together.
  • At least one of the residual neural networks can be used, with transfer learning from a pre-trained model that used, for example, the known database.
  • the device 6 also comprises a module 67 making it possible to provide the modified training parameters 722 resulting from the training operations by the device 6. It also interacts with a user interface 68, for the description of which the reader can refer to the user interface 20 associated with the device 1.
  • the device 6 can for example execute the following process:
  • step 6) if the stopping criteria are not satisfied, returning iteratively to step 3) with the modified values of the current learning parameters, and repeating the operations;
  • the modified learning parameters 722 may be distinct from the currently modified learning parameters when the stopping criteria are met, and be calculated from these currently modified learning parameters as well as one or more parameter values obtained previously (for example, by taking the average).
  • a particular device 9, visible in FIG. 9, implements device 1 as well as device 6 described above. It corresponds, for example, to a workstation, a laptop, a tablet, a smartphone, or even a "head-mounted display” (HMD).
  • HMD head-mounted display
  • This device 9 is suitable for estimating physiological signals and forming the corresponding model. It comprises the following elements, linked to each other by an address and data bus 95 which also carries a clock signal:
  • microprocessor 91 or CPU
  • graphics card 92 comprising several graphics processing units (or GPUs) 920 and a graphics random access memory (GRAM) 921;
  • I/O input/output devices
  • I/O input/output devices
  • the power supply 98 is external to the device 9.
  • the apparatus 9 also comprises a display device 93 of the display screen type directly connected to the graphics card 92 to display synthesized images calculated and composed in the graphics card.
  • a dedicated bus to connect the display device 93 to the graphics card 92 offers the advantage of having much higher data transmission rates and therefore of reducing the latency time for the display of images. composed by the graphics card.
  • a display device is external to the device 9 and is connected to the latter by a cable or wirelessly to transmit the display signals.
  • the device 9, for example through the graphics card 92, comprises a transmission or connection interface suitable for transmitting a display signal to an external display means such as for example an LCD or plasma screen or a video projector.
  • the radio frequency unit 99 can be used for wireless transmissions.
  • register used below in the description of memories 97 and 921 can designate, in each of the memories mentioned, a low capacity memory area (some binary data) as well as a high capacity memory area. (allowing to store an entire program or to calculate or display all or part of the data representative of the data).
  • the registers shown for RAM 97 and GRAM 921 can be arranged and made up in any way, and each of them does not necessarily correspond to adjacent memory locations and can be distributed in other ways (which covers especially the case where a register comprises several smaller registers).
  • the microprocessor 91 loads and executes the instructions of the program contained in the RAM 97.
  • graphics card 92 is not required, and may be replaced by full CPU processing and/or simpler visualization implementations.
  • device 9 may include only the functionality of device 1, and not the learning capabilities of device 6. Further, device 1 and/or device 6 may be implemented differently from a stand-alone software, and a device or set of devices including only parts of the device 9 can be operated through an API call or cloud interface.
  • the records were first mixed. Then, as the recordings do not have the same durations (from ⁇ 4 to 12 hours), the 18 recordings were divided into three sets: a dataset for training, a set of validation data and a set of test data with an approximate ratio (33%, 33%, 33%), so that they have the same overall duration.
  • the device of the invention is used to receive several recordings.
  • Each recording includes 6 cardio-respiratory movement signals acquired by an inertial unit (ie, signals obtained by a 3-axis accelerometer and a gyroscope at 3 axes), sampled at 100 Hz and measured by the smartphone. Before any further processing, these recordings are manually synchronized with two signals from the Nox RIP belt: thoracic and abdominal respiratory efforts. These signals were recorded by the device of the invention, and HSAT (Nox T3) or PSG (Nox Al) overnight for each volunteer.
  • HSAT Nox T3
  • PSG Nox Al
  • the 6 cardio-respiratory movement signals obtained from the phone are used as inputs for two models based on neural networks. Both models are trained to output a thoracic respiratory effort signal acquired through a chest belt for one, an abdominal respiratory effort signal acquired through a lap belt for the other. Thus, the outputs always contain a single channel signal.
  • Inputs i.e., cardio-respiratory signals
  • outputs i.e., physiological signals
  • the sliding window has a duration of one minute.
  • Inputs and outputs are filtered by a band-pass filter between [0.05; 5] Hz (respiration rates) using an 8th order forward-backward Butterworth filter. Inputs and outputs are decimated at 20 Hz and are divided into 1 minute windows.
  • the neural network architecture for the regression is a U-Net based on ResNetl8, with a final linear activation layer.
  • the cost function is of logcosh type.
  • this number of epochs can be reduced by an early stop which is set when the loss of validation does not decrease for at least 5 epochs.
  • FIG. 10 represents an example of a one-minute physiological signal estimated by the device of the invention for a volunteer, where the model obtains the worst predictions. An 11-second apnea occurs in the middle of this window. Even if the prediction is inaccurate just after the apnea, the general dynamics of the signal are well predicted.
  • Figures 11 and 12 show results obtained for a patient. The first and second signals at the top of FIG. 11 respectively show the thoracic respiratory effort signal and the abdominal respiratory effort signal estimated by the method of the invention.
  • the last line shows a superposition of these signals with, respectively, the signals acquired directly by a chest belt and an abdominal belt in synchrony with the cardio-respiratory signals used for the estimation.
  • the first and second signals at the top of Figure 12 respectively show a nasal flow signal and a nasal pressure signal estimated by the method of the invention.
  • the last line shows a superposition of these signals with, respectively, the signals acquired directly by a nasal cannula synchronously with the cardio-respiratory signals used for the estimation.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Physiology (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Dentistry (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Cardiology (AREA)
  • Evolutionary Computation (AREA)
  • Pulmonology (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

La présente invention concerne un dispositif (1) pour mettre en œuvre un procédé et le procédé pour l'estimation de signaux physiologiques d'un sujet, ledit procédé comprenant : l'utilisation d'un modèle de régression non-linéaire du type réseau de neurones (43) configuré et entraîné pour recevoir, en entrée, au moins un signal cardio- respiratoire, et fournir en sortie au moins une estimation d'un signal physiologique de polygraphie ventilatoire et/ou un signal physiologique d'électrocardiographie (31); et fournir en sortie l'au moins une estimation d'un signal physiologique de polygraphie ventilatoire et/ou un signal physiologique d'électrocardiographie (31).

Description

PROCÉDÉ D’ESTIMATION DE SIGNAUX PHYSIOLOGIQUES
DOMAINE DE L’INVENTION
La présente invention concerne un système et un procédé mis en œuvre par ordinateur pour l’estimation de signaux physiologiques d’un sujet.
ÉTAT DE LA TECHNIQUE
Le Syndrome d’Apnée Hypopnée du Sommeil (SAHS) est caractérisé par des pauses (apnées) ou difficultés respiratoires (hypopnées) pendant le sommeil. Ces événements respiratoires durent au moins 10 secondes et surviennent selon la gravité du SAHS de 5 fois par heure (SAHS léger) à plus de 30 fois par heure (SAHS sévère). Les causes du SAHS peuvent être multiples, et on définit classiquement plusieurs catégories d’événements respiratoires par différents signes cliniques. Le SAHS peut être également positionnel lorsque les événements respiratoires ont principalement lieu en position dorsale. On définit ainsi deux grands types de SAHS : le syndrome d’apnée du sommeil obstructif (OSA) (Lévy, et al., 2015) et le syndrome d’apnée du sommeil central (CSA) lorsqu’au moins 50 % des événements respiratoires sont d’origine centrale (Eckert, Jordan, Merchia, & Malhotra, 2007).
Le SAHS a pour symptômes une fatigue excessive au réveil, la somnolence diurne ou encore les ronflements excessifs. Il est associé à des comorbidités cardiovasculaires telles que l’insuffisance cardiaque, l’hypertension, l’accident vasculaire cérébral, les arythmies cardiaques ou l’infarctus du myocarde (Javaheri, et al., 1998). Le diagnostic repose sur l’enregistrement polysomnographique de l’activité respiratoire (ceinture thoracique, ceinture abdominale, flux nasal, pression nasale, ronflements, saturation en oxygène), de l’activité cardiaque (fréquence cardiaque, photopléthysmogramme, électrocardiogramme), de l’activité cérébrale (EEG) et de l’activité motrice (actimètre, capteur de position). En pratique clinique chez l’adulte, un enregistrement polygraphique en ambulatoire simplifié suffit généralement au diagnostic de POSA et analyse au moins les capteurs suivants : les ceintures abdominales et thoraciques, la lunette nasale, le microphone, l’oxymètre de pouls, la position et la saturation en oxygène (Berry, et al., 2017).
L’OSA touche environ 950 millions de personnes dans le monde (Benj afield, et al., 2019). On confond généralement CSA et OSA dans ces estimations. Des facteurs de risque ont été identifiés comme l’obésité, l’âge, le sexe (les hommes sont plus concernés), l’origine ethnique, le tabagisme, la consommation d’alcool, le diabète, des anomalies des voies respiratoires ou des troubles neurologiques. En France, on estime que 24 millions de patients souffrent d’OSA au moins léger, i.e. avec un indice d’apnée-hypopnée supérieur à 5 événements par heure (Benjafield, et al., 2019). Il existe par ailleurs de fortes corrélations avec d’autres pathologies. Ainsi 21 % à 74 % des patients avec une fibrillation atriale font de POSA (Linz, et al., 2018) ; 29 % à 67 % des patients insomniaques font de POSA (Luyster, Buysse, & Strollo, 2010).
Les traitements du SAHS existent et sont de plusieurs natures. Cependant, le dépistage et le diagnostic sont trop peu souvent effectués et un grand nombre de patients apnéiques s’ignorent. Ainsi 80 % des apnéiques ne sont pas diagnostiqués aux Etats-Unis (Watson,
2016). Cela représente également un enjeu économique important car un patient apnéique non traité coûtera trois fois plus cher (6 366 $) qu’un patient traité (2 105 $) par an. Les principaux freins au diagnostic sont la prise de conscience des patients, le manque de formation des généralistes à cette pathologie, le coût du diagnostic et du traitement, et l’immaturité du système de soin vis-à-vis de la médecine préventive.
En ce qui concerne le coût du diagnostic, il a été considérablement réduit par la mise en place systématique de la polygraphie ventilatoire à domicile qui peut être réalisée en cabinet libéral par des médecins de différentes spécialités (pneumologue, ORL, cardiologue, psychiatre) ou par le médecin généraliste spécialisé sommeil (Safadi, Etzioni, Fliss, Pillar, & Shapira, 2014). La polygraphie ventilatoire comporte un nombre limité de capteurs, ce qui permet au patient de s’équiper tout seul et de réaliser l’examen de diagnostic en ambulatoire à son domicile. Bien qu’une nuit d’hospitalisation soit évitée et que le coût soit donc moins élevé en ambulatoire (Stewart, Penz, Fenton, & Skomro,
2017), l’investissement en matériel et la logistique de l’examen (prêt du matériel, récupération, désinfection, lecture de tracés) restent un frein pour le nombre de diagnostics effectués. Par ailleurs, l’examen reste assez peu confortable pour le patient et il doit se rendre plusieurs fois chez son médecin au cours d’un seul examen, ce qui pourrait être évité. Enfin, le délai d’attente moyen pour une poly graphie ventilatoire est plus court que pour une polysomnographie, mais reste élevé dans certains pays (10 mois de délai entre la première consultation et le diagnostic au Royaume-Uni) ce qui est préjudiciable pour le patient (Flemons, Douglas, Kuna, Rodenstein, & Wheatley, 2004).
Durant ces dix dernières années, on a constaté une innovation accrue dans les dispositifs de dépistage et de diagnostic poussé par la constante augmentation de l’utilisation des technologies numériques, l’émergence des objets connectés et de l’intelligence artificielle en santé. La tendance est nette à la simplification des capteurs, pour améliorer le confort du patient et diminuer le coût de l’équipement. On note les méthodes de mesures de l’oxymétrie de pouls, des sons trachéaux, des ronflements et bruits respiratoires, du ballistocardiogramme, des mouvements mandibulaires (Kelly, Strecker, & Bianchi, 2012) (Penzel, Schôbel, & Fietze, 2018). Les équipements électroniques sont soit achetés par les patients (pour les dispositifs grand public), soit proposés en location : dans ce dernier cas, les patients sont invités à venir au cabinet pour récupérer le matériel et/ou se le faire installer, ou à réceptionner le matériel par voie postale et l’installer soi-même, ou à accueillir un prestataire qui peut effectuer la pose de l’équipement. Après examen, le patient doit renvoyer le matériel ou se déplacer directement au cabinet. Les équipements électroniques sont connectés, ou simplement munis d’une carte mémoire que le médecin connectera à son PC pour effectuer la lecture des tracés et l’annotation des événements respiratoires. Parmi les systèmes couramment accessibles, seuls certains objets connectés ont une valeur diagnostique et simplifient l’examen de polygraphie ventilatoire en réduisant le nombre de capteurs nécessaire ; cependant, le nombre d’examen réalisables par ces systèmes restent matériellement limités par l’acquisition de ces objets connectés. Inversement, d’autres systèmes, utilisant par exemple seulement un microphone ou un procédé sonar, n’ont jusqu’à présent aucune ou une faible valeur diagnostique à cause de leurs fonctionnalités et mesures physiologiques limitées.
Dans ce contexte, la présente invention fournit une solution permettant de diminuer la complexité du système d’acquisition de sorte à réduire drastiquement le coût et la logistique de l’examen diagnostic, tout en étant plus confortable et plus pratique pour le patient. Un nombre plus important de patients pourraient être ainsi diagnostiqués.
RÉSUMÉ
La présente invention concerne un procédé mis en œuvre par ordinateur pour l’estimation de signaux physiologiques d’un sujet, ledit procédé comprenant : la réception d’au moins un signal cardio-respiratoire représentatif des sons et/ou mouvements provenant de la cage thoracique et des voies aériennes du sujet, le signal cardio-respiratoire étant acquis pendant le sommeil du sujet ; l’utilisation d’un modèle de régression non-linéaire du type réseau de neurones configuré et entraîné pour recevoir, en entrée, F au moins un signal cardiorespiratoire, et fournir en sortie au moins une estimation d’un signal physiologique de poly graphie ventilatoire et/ou un signal physiologique d’électrocardiographie ; dans lequel le réseau de neurones comprenant un encodeur ayant une entrée et plusieurs sorties et un décodeur ayant une sortie et plusieurs entrées, dans lequel au moins deux sorties d’encodeur sont directement reliées à au moins deux entrées respectives du décodeur, et au moins deux sorties de l’encodeur sont connectées entre elles et dans lequel ledit réseau de neurones est configuré pour réaliser des opérations de convolution unidimensionnelles ; et fournir en sortie F au moins une estimation d’un signal physiologique de poly graphie ventilatoire et/ou un signal physiologique d’électrocardiographie.
Le modèle utilisé dans le procédé de l’invention permet de manière avantageuse d’obtenir plusieurs signaux ayant des tracés caractéristiques des signaux mesurés par les capteurs de poly graphie ventilatoire et/ou d’électrocardiogramme en utilisant comme seule entrée un signal cardio-respiratoire sonore (i.e., acquis par un microphone) et/ou un signal cardio-respiratoire de mouvement (i.e., acquis par un gyroscope et/ou un accéléromètre positionné en contact du thorax du sujet). Ce procédé permet donc d’obtenir des signaux de polygraphie ventilatoire ou d’électrocardiogramme (ECG) par le biais seulement d’un capteur audio et/ou un capteur de mouvement à la place de l’ensemble de capteurs nécessaires dans une acquisition standard de polygraphie ventilatoire ou ECG (i.e., lunette nasale, ceinture thoracique, ceinture abdominale, électrodes, etc.). En effet, la présente invention vise à reconstruire de manière la plus fidèle possible plusieurs signaux ayant des tracés caractéristiques des signaux mesurés par les capteurs de polygraphie du sommeil (i.e., comprenant les signaux de polygraphie ventilatoire et/ou un signal physiologique d’électrocardiographie) obtenus par un appareil de mesure complexe en utilisant comme seule entrée un signal cardio-respiratoire sonore et/ou un signal cardiorespiratoire de mouvement, qui peut être obtenu par un capteur comme une centrale inertielle et un microphone, par exemple logé dans un même simple appareil comme un téléphone portable.
Plus en détail, dans la présente invention, de manière avantageuse, l'encodeur transforme les signaux d'entrée en des points d'un espace latent (espace à faible dimension) tandis que le décodeur transforme les points de l'espace latent en des signaux de sortie que l'on souhaite reconstituer, par exemple ceux de la polygraphie ventilatoire.
Lors de l'apprentissage, les poids de l'encodeur et du décodeur sont finement ajustés, de telle sorte à réaliser une compression / décompression quasi sans perte, en minimisant de manière précise une fonction de coût qui mesure la différence entre les signaux reconstitués et ceux désirés (i.e., signal physiologique de polygraphie ventilatoire et/ou signal physiologique d’électrocardiographie).
En fait, l'espace latent, intrinsèque dans la structure encodeur-décodeur, contient l'information physiologique essentielle d'une activité respiratoire ou cardiaque, qui peut être représentée de différentes manières : comme un séismocardiogramme mesuré par un accéléromètre ou comme un électrocardiogramme mesuré par un électrocardiogramme.
Dans un mode de réalisation, le réseau de neurones comporte un U-Net et l’encodeur comporte un ResNet. L’architecture en U du U-Net permet avantageusement de connecter plusieurs sorties du l’encodeur à plusieurs entrées du décodeur de sorte à extraire des informations à plusieurs échelles pour ensuite les assembler dans le décodeur. Ceci donne une estimation plus fiable des signaux physiologiques en sortie.
Dans un mode de réalisation, ledit signal physiologique de polygraphie ventilatoire est choisi parmi : un débit nasal acquis par le biais d’une lunette nasale, une pression nasale acquis par le biais d’une lunette nasale, un effort respiratoire thoracique acquis par le biais d’une ceinture thoracique ou un effort respiratoire abdominal acquis par le biais d’une ceinture abdominale.
Dans un mode de réalisation, ledit signal physiologique d’électrocardiographie est acquis par le biais d’un électrocardiogramme d’au moins une dérivation.
Dans un mode de réalisation, F au moins un signal cardio-respiratoire est un signal de mouvement cardio-respiratoire obtenu à l’aide d’un gyroscope et/ou un accéléromètre.
Dans un mode de réalisation, F au moins un signal cardio-respiratoire est signal sonore cardio-respiratoire ; le procédé comprenant, en outre, une compression du signal sonore cardio-respiratoire à l’aide d’un deuxième réseau de neurones convolutif, préalablement à son application en entrée du modèle de régression non-linéaire.
Dans un mode de réalisation, le procédé comprend en outre, une fusion du signal sonore cardio-respiratoire compressé avec le signal de mouvement cardio-respiratoire.
Dans un mode de réalisation, F au moins un signal cardio-respiratoire est normalisé avant l’utilisation du modèle de régression non-linéaire.
Dans un mode de réalisation, le réseau de neurones comprend une couche de sortie ayant une fonction d’activation linéaire.
Dans un mode de réalisation, le procédé comprend, en outre, une détection d’un épisode anormal associé à une apnée du sommeil sur la base d’au moins un signal de poly graphie ventilatoire délivré par le modèle de régression non-linéaire.
Dans un mode de réalisation, le procédé comprend, en outre, une détection d’un épisode anormal associé à une arythmie cardiaque sur la base d’au moins un signal physiologique cardiaque délivré par le modèle de régression non-linéaire.
La présente invention concerne en outre un dispositif pour l’estimation de signaux physiologiques d’un sujet, ledit dispositif comprenant : au moins une entrée configurée pour recevoir au moins un signal cardiorespiratoire représentatif des sons et/ou mouvements provenant de la cage thoracique et des voies aériennes du sujet, le signal cardio-respiratoire étant acquis pendant le sommeil du sujet ; au moins un processeur configuré pour : estimer au moins un signal physiologique de poly graphie ventilatoire et/ou un signal physiologique d’électrocardiographie en utilisant un modèle de régression non-linéaire du type réseau de neurones configuré et entraîné pour recevoir, en entrée, F au moins un signal cardiorespiratoire, et fournir en sortie F au moins une estimation d’un signal physiologique de polygraphie ventilatoire et/ou un signal physiologique d’électrocardiographie ; dans lequel le réseau de neurones comprenant un encodeur ayant une entrée et plusieurs sorties et un décodeur ayant une sortie et plusieurs entrées, dans lequel chaque sortie d’encodeur est directement reliée à une entrée respective du décodeur, et au moins deux sorties de l’encodeur sont connectées entre elles et dans lequel ledit réseau de neurones comprend des opérations de convolution unidimensionnelles ; au moins une sortie configurée pour fournir F au moins un signal de polygraphie ventilatoire et/ou un signal physiologique d’électrocardiographie.
Dans un mode de réalisation, le dispositif comprend en outre, un accéléromètre, un gyroscope et/ou un microphone.
La présente invention concerne en outre un produit programme d’ordinateur comprenant des instructions qui, lorsque le programme est exécuté par un ordinateur, conduisent celui-ci à mettre en œuvre la méthode pour l’estimation de signaux physiologiques d’un sujet selon l’une quelconque des modes de réalisation décrits ci-dessus.
La présente invention concerne en outre un support d’enregistrement non transitoire lisible par ordinateur comprenant des instructions qui, lorsque le programme est exécuté par un ordinateur, conduisent celui-ci à mettre en œuvre la méthode pour l’estimation de signaux physiologiques d’un sujet selon l’une quelconque des modes de réalisation décrits ci-dessus. Un tel support d’enregistrement non transitoire lisible par ordinateur peut être, sans limitation, un dispositif électronique, magnétique, optique, électromagnétique, infrarouge ou semi-conducteur, ou toute combinaison appropriée de ce qui précède. On appréciera que ce qui suit, tout en fournissant des exemples plus spécifiques, n'est qu'une liste illustrative et non exhaustive telle qu'elle est facilement appréciée par l’homme du métier : une disquette d'ordinateur portable, un disque dur, une ROM, une EPROM (Erasable Programmable ROM) ou une mémoire Flash, un CD-ROM portable (Compact-Disc ROM).
DÉFINITIONS
Dans la présente invention, les termes ci-dessous sont définis de la manière suivante : le terme « processeur » ne doit pas être interprété comme étant limité au matériel informatique (« hardware ») capable d'exécuter un logiciel, et se réfère de manière générale à un dispositif de traitement, qui peut par exemple inclure un ordinateur, un microprocesseur, un circuit intégré ou un dispositif logique programmable (« programmable logic device », PLD). Le processeur peut également englober un ou plusieurs processeurs graphiques (GPU), qu'ils soient exploités pour l'infographie et le traitement d'images ou d'autres fonctions. En outre, les instructions et/ou les données permettant d'exécuter les fonctionnalités associées et/ou résultantes peuvent être stockées sur tout support lisible par le processeur tel que, par exemple, un circuit intégré, un disque dur, un CD (Compact Disc), un disque optique tel qu'un DVD (Digital Versatile Disc), une RAM (Random- Accès s Memory) ou une ROM (Read-Only Memory). Les instructions peuvent notamment être stockées dans du matériel informatique, des logiciels, des microprogrammes (« firmware ») ou dans toute combinaison de ceux-ci.
Un « réseau neuronal » ou « réseau neuronal artificiel (RNA) » désigne une catégorie d'algorithme d'apprentissage automatique comprenant des nœuds (appelés neurones), et des connexions entre les neurones modélisées par des « poids ». Pour chaque neurone, une sortie est donnée en fonction d'une entrée ou d'un ensemble d'entrées par une « fonction d'activation » (« activation function »). Les neurones sont généralement organisés en plusieurs « couches », de sorte que les neurones d'une couche ne se connectent qu'aux neurones des couches immédiatement précédentes et immédiatement suivantes.
Un « réseau neuronal convolutif » désigne un type de réseau de neurones artificiels acycliques (« feed-forward ») comprenant de multiples couches cachées. Les couches cachées sont généralement des couches convolutionnelles suivies de couches d'activation, certaines d'entre elles étant suivies de couches de « pooling » (i.e. mise en commun).
« Centrale inertielle » concerne des instruments comprenant six capteurs, desquels trois gyromètres mesurant les trois composantes du vecteur vitesse angulaire, et trois accéléromètres mesurant les trois composantes du vecteur force spécifique.
DESCRIPTION DES FIGURES
Figure 1 est un schéma fonctionnel représentant schématiquement un mode particulier d'un dispositif pour l’estimation de signaux respiratoire et/ou signaux cardiaque à partir de signaux cardio-respiratoire, conforme à la présente divulgation.
Figure 2 fournit un exemple de signaux cardio-respiratoire reçus en entrée du dispositif et du procédé de la présente invention.
Figure 3 est schéma fonctionnel représentant schématiquement la structure de l'architecture en forme de U du modèle de régénération non linéaire.
Figure 4 est un schéma fonctionnel représentant schématiquement la structure de l'architecture en forme de U du modèle de régression non linéaire combiné au deuxième réseau neuronal pour la compression des signaux sonores.
Figure 5 reporte les signaux physiologiques respiratoires obtenus à partir de signaux en figure 2.
Figure 6 reporte les signaux physiologiques cardiaques de type séismocardiogramme (SCG) et gyrocardiogramme (GCG) obtenus à partir de signaux en figure 2. Figure 7 est un organigramme montrant les étapes successives exécutées avec le dispositif d’estimation de la figure 1.
Figure 8 est un schéma fonctionnel représentant de manière schématique un mode particulier d'un dispositif d'entraînement du modèle de régression, conforme à la présente divulgation et adapté au dispositif de prédiction de la figure 1.
Figure 9 représente schématiquement un appareil intégrant les fonctions du dispositif d’estimation de la figure 1 et du dispositif d'entraînement de la figure 8.
Figure 10 montre un signal physiologique de type effort respiratoire thoracique estimé par le dispositif 1 (courbe Cl) superposé à un signal acquis directement par une ceinture thoracique (courbe C2) de manière synchrone au signal cardio-respiratoire utilisé dans le dispositif 1 pour l’estimation.
Figure 11 montre, du haut vers le bas, un premier signal physiologique de type effort respiratoire thoracique estimé par le dispositif 1, un deuxième signal physiologique de type effort respiratoire abdominale estimé par le dispositif 1, une superposition du premier signal avec un signal acquis directement par une ceinture thoracique de manière synchrone, et une superposition du premier signal avec un signal acquis directement par une ceinture abdominale de manière synchrone.
Figure 12 montre, du haut vers le bas, un premier signal physiologique de type un débit nasal estimé par le dispositif 1, un deuxième signal physiologique de type pression nasal estimé par le dispositif 1, une superposition du premier signal avec un signal acquis directement par une lunette nasale de manière synchrone et une superposition du deuxième signal avec un signal acquis directement par une lunette nasale de manière synchrone.
DESCRIPTION DÉTAILLÉE
La présente description illustre les principes de la présente divulgation. Il sera donc apprécié que les hommes du métier seront en mesure de concevoir divers arrangements qui, bien que non explicitement décrits ou montrés ici, incarnent les principes de la divulgation et sont inclus dans sa portée.
Tous les exemples et le langage conditionnel cités ici sont destinés à des fins éducatives pour aider le lecteur à comprendre les principes de la divulgation et les concepts apportés par l'inventeur pour faire avancer l'état de l’art, et doivent être interprétés comme n'étant pas limités à ces exemples et conditions spécifiquement cités.
De plus, toutes les déclarations de principes, d'aspects et de modes de réalisation de la divulgation, ainsi que leurs exemples spécifiques, sont destinés à englober leurs équivalents structurels et fonctionnels. En outre, il est prévu que ces équivalents comprennent à la fois les équivalents actuellement connus et les équivalents développés à l'avenir, c'est-à-dire tous les éléments développés qui remplissent la même fonction, indépendamment de leur structure.
Ainsi, par exemple, l'homme du métier comprendra que les schémas de principe présentés ici peuvent représenter des vues conceptuelles de circuits illustratifs mettant en œuvre les principes de la divulgation. De même, il sera apprécié que tous les organigrammes, diagrammes de flux et autres représentent divers processus qui peuvent être essentiellement représentés sur un support lisible par ordinateur et ainsi exécutés par un ordinateur ou un processeur, que cet ordinateur ou ce processeur soit ou non explicitement représenté.
Les fonctions des divers éléments illustrés sur les figures peuvent être assurées par l'utilisation de matériel informatique dédié ainsi que de matériel informatique capable d'exécuter un logiciel en association avec un logiciel approprié. Lorsqu'elles sont assurées par un processeur, les fonctions peuvent être assurées par un seul processeur dédié, un seul processeur partagé ou une pluralité de processeurs individuels, dont certains peuvent être partagés.
Il est entendu que les éléments illustrés dans les figures peuvent être mis en œuvre sous diverses formes de matériel informatique, de logiciel ou de combinaisons de ceux-ci. De préférence, ces éléments sont mis en œuvre dans une combinaison de matériel informatique et de logiciel sur un ou plusieurs dispositifs polyvalents programmés de manière appropriée, qui peuvent comprendre un processeur, une mémoire et des interfaces d'entrée/sortie.
[0049] La présente divulgation sera décrite en référence à un mode de réalisation fonctionnel particulier d'un dispositif 1 pour l’estimation de signaux physiologiques d’un sujet, tel qu'illustré sur la figure 1.
Le dispositif 1 est en effet adapté pour fournir en sortie une estimation d’au moins un signal physiologique qui est typiquement obtenu par un appareil de mesure de poly graphie du sommeil (i.e., comprend des capteurs de mesure du signal physiologique d’électrocardiographie) ou polygraphie ventilatoire à partir de l’analyse des signaux cardio-respiratoire 21. Des tels appareils de mesure sont des appareils complexes et volumineux comprenant multiples capteurs à positionner en proximité ou en contact du sujet. Le signal physiologique de polygraphie ventilatoire estimé peut être au moins un parmi les signaux suivants : un débit nasal acquis par le biais d’une lunette nasale, une pression nasale acquis par le biais d’une lunette nasale, un effort respiratoire thoracique acquis par le biais d’une ceinture thoracique, un effort respiratoire abdominal acquis par le biais d’une ceinture abdominale et/ou une saturation en oxygène acquis par un oxymètre de pouls ou saturomètre. Dans un mode de réalisation, le signal physiologique de polygraphie ventilatoire estimé comprend en outre un signal photopléthysmographique et/ou un électromyogramme de muscles du menton ou des gambes.
Le signal physiologique d’électrocardiographie 31 estimé peut être un signal acquis par le biais d’un électrocardiogramme à au moins une dérivation.
En effet, l’invention a comme objectif d’utiliser les informations comprises dans un signal cardio-respiratoire pour en déduire une estimation des signaux respiratoires et/ou signaux cardiaques telle qu’ils auraient été acquis par des capteurs dédiés comme les lunettes nasales, les ceintures thoracique ou abdominale, des électrodes pour de l’électrocardiogramme et autres. Les signaux physiologiques 31 en sortie du procédé présentent donc des tracés caractéristiques de capteurs de polygraphie ventilatoire ou ECG de sorte que le docteur qui les examine puisse les interpréter de la même manière que des signaux ECG ou de polygraphie ventilatoire acquis directement par les capteurs dédiés.
Les signaux cardio-respiratoire 21 peuvent être acquis par le biais d’un ou plusieurs capteurs positionnés à proximité du sujet, de préférence en contact avec le sujet. Dans un mode de réalisation, les signaux cardio-respiratoire 21 représentatifs des sons et mouvements provenant de la cage thoracique et des voies aériennes du sujet, qui seront appelés dans cette divulgation « signaux de mouvement cardio-respiratoires », sont acquis grâce à au moins un gyroscope et/ou au moins un accéléromètre. Dans un mode de réalisation, les signaux de mouvement cardio-respiratoire 21 sont acquis par une centrale inertielle. Ladite centrale inertielle peut être comprise dans un appareil électronique de télécommunication, normalement portatif, tel qu’un téléphone portable. L’utilisation de signaux cardio-respiratoire 21 acquis par un(des) capteur(s) positionné sur le thorax du sujet est particulièrement avantageuse car il permet d’obtenir des signaux plus robustes et avec une amplitude plus intense par rapport à l’utilisation de capteur de proximité comme par exemple le capteur de balistocardiogramme, généralement positionné dans le lit du sujet ou le sonar, généralement posé à côté du lit. En effet, les capteurs positionnés à proximité du sujet et non en contact direct sont plus sensibles au bruit de l’environnement du sujet et les signaux collectés sont dépendants des objets en contact avec les capteurs (i.e., le lit etc.). L’utilisation d’un central inertielle directement en contact avec le sujet permet par exemple de rendre détectable dans le signal la systole et diastole.
Dans un mode de réalisation, les signaux cardio-respiratoires 21 représentatifs des sons provenant de la cage thoracique et des voies aériennes du sujet, qui seront appelés dans cette divulgation « signaux sonores cardio-respiratoires », sont acquis grâce à un microphone. Le microphone peut être un capteur indépendant positionné en contact du torse ou du cou du sujet (i.e., directement à contact de la peau ou en contact d’une épaisseur, telle que le tissu d’un maillot de corps, qui est lui-même en contact direct avec la peau du sujet). De manière alternative, le signal sonore cardio-respiratoire peut être acquis grâce à un microphone intégré dans un appareil électronique de télécommunication, normalement portatif, tel qu’un téléphone portable. En effet, dans un exemple, le sujet peut positionner un téléphone portable sur son thorax à l’aide d’un dispositif de fixation et tous les signaux cardio-respiratoires sont donc acquis grâce aux capteurs compris dans ledit téléphone. Le téléphone peut être en outre combiné avec d’autres capteurs. Par exemple, en plus des signaux acquis par le téléphone, d’autres signaux sonores cardio-respiratoires peuvent être acquis par un microphone en contact avec le cou du sujet ou positionné à proximité du nez et de la bouche du sujet. Les signaux sonores cardio-respiratoires sont reçus par fichier en format MP3 (MPEG- 1/2 Audio Layer III) ou AAC (« Advanced audio Coding »).
Les capteurs compris dans un même système, tel que par exemple un circuit intégré de type centrale inertielle, peuvent être synchronisés par une même horloge interne de sorte que les signaux soient horodatés de manière synchrone. Alternativement, dans les cas des signaux enregistrés via des capteurs indépendants, tels que le microphone et la centrale inertielle d’un téléphone, un système de synchronisation de signaux acquis peut être mis en place de sorte à obtenir des signaux horodatés de manière synchrone.
Les signaux cardio-respiratoires 21 peuvent être acquis en continu par les capteurs, de préférence pendant le sommeil du sujet. Les signaux cardio-respiratoires 21 peuvent donc comprendre des données acquises pendant 5 à 12 heures, généralement 8 heures. La fréquence d'échantillonnage des signaux sonores est comprise entre 5 kHz et 15 kHz, et la fréquence d'échantillonnage des signaux de mouvement est comprise entre 80 et 150 Hz. Les graphes en Figure 2 montrent un exemple des signaux reçus en entrée par le module 11, comprenant un signal audio et six signaux de mouvement acquis par les six capteurs d’une centrale inertielle.
Le dispositif 1 d’estimation est associé à un dispositif 6 d’entraînement adapté au réglage des paramètres du modèle de régression non-linéaire du dispositif 1, représenté sur la Figure 8, qui sera décrit par la suite.
Bien que les dispositifs 1 et 6 actuellement décrits soient polyvalents et dotés de plusieurs fonctions qui peuvent être exécutées alternativement ou de n'importe quelle manière cumulative, d'autres mises en œuvre dans le cadre de la présente divulgation comprennent des dispositifs n'ayant que des parties des fonctionnalités décrites dans la présente divulgation.
Chacun des dispositifs 1 et 6 est avantageusement un appareil, ou une partie physique d'un appareil, conçu, configuré et/ou adapté pour exécuter les fonctions mentionnées et produire les effets ou résultats mentionnés. Dans des mises en œuvre alternatives, l'un quelconque du dispositif 1 et du dispositif 6 est réalisé sous la forme d'un ensemble d'appareils ou de parties physiques d'appareils, qu'ils soient regroupés dans une même machine ou dans des machines différentes, éventuellement distantes. Le dispositif 1 et/ou le dispositif 6 peuvent par exemple avoir des fonctions distribuées sur une infrastructure en nuage (« cloud infrastructure ») et être disponibles pour les utilisateurs en tant que service en nuage (« cloud-based service »), ou avoir des fonctions distantes accessibles par le biais d'une API.
Le dispositif 1 d’estimation et le dispositif 6 d'entraînement peuvent être intégrés dans un même appareil ou ensemble d'appareils, et destinés aux mêmes utilisateurs. Dans d'autres mises en œuvre, la structure du dispositif 6 peut être complètement indépendante de la structure du dispositif 1, et peut être fournie à d'autres utilisateurs. Par exemple, le dispositif 1 peut avoir un modèle paramétré disponible pour les opérateurs pour les estimations des signaux physiologiques cardiaque et/ou respiratoire, entièrement défini à partir des entrainements effectués en amont par d'autres acteurs avec le dispositif 6.
Dans les divulgations qui suivent, les modules doivent être compris comme des entités fonctionnelles plutôt que comme des composants matériels, physiquement distincts. Ils peuvent donc être matérialisés soit comme regroupés dans un même composant tangible et concret, soit répartis dans plusieurs de ces composants. De même, chacun de ces modules est éventuellement lui-même partagé entre au moins deux composants physiques. En outre, les modules sont mis en œuvre sous forme de matériel, de logiciel, de microprogramme ou sous toute forme mixte de ceux-ci. Ils sont de préférence incorporés dans au moins un processeur du dispositif 1 ou du dispositif 6.
Notamment, le dispositif 1 peut comprendre les capteurs configurés pour acquérir les signaux cardio-respiratoires 21. Dans un mode de réalisation, le dispositif 1 comprenant le microprocesseur et les capteurs est intégré dans un appareil de dimensions compactes adapté pour être placé en contact direct avec le thorax du sujet pendant son sommeil, tel que par exemple un téléphone portable.
Le dispositif 1 comprend un module 11 de réception d’au moins un signal cardiorespiratoire 21 ainsi que des paramètres du modèle de régression non-linéaire 20 stockés dans une ou plusieurs base(s) de données 10 locales ou distantes. Cette dernière peut prendre la forme de ressources de stockage disponibles à partir de tout type de moyens de stockage appropriés, qui peuvent être notamment une RAM ou une EEPROM (Electrically-Erasable Programmable Read-Only Memory) comme une mémoire Flash, éventuellement au sein d'un SSD (Solid-State Disk). Dans des modes de réalisation avantageux, les paramètres du modèle 20 ont été préalablement générés par un système comprenant le dispositif 6 pour l'apprentissage. En variante, les paramètres du modèle 20 sont reçus par un réseau de communication.
Le dispositif 1 comprend en outre optionnellement un module 12 de prétraitement des signaux cardio-respiratoires 21. Le module 12 peut notamment être adapté pour normaliser les données des signaux cardio-respiratoires reçues 21 en vue d'un traitement efficace et fiable. Il peut transformer les signaux sonores cardio-respiratoires 21, par exemple par décompression des données sonores acquises.
Dans des modes avantageux, le module 12 est configuré pour prétraiter les signaux cardio-respiratoires 21 de manière à ce que les signaux soient normalisés. Ceci peut améliorer l'efficacité du traitement en aval par le dispositif 1. Une telle normalisation peut être particulièrement utile lorsque les signaux exploités proviennent de sources différentes, y compris éventuellement de systèmes d'acquisition différents.
Les signaux peuvent être normalisés en utilisant une normalisation par cote Z (« z-score normalisation »). Les signaux sont séparés en des fenêtres temporelles d’environ 15 à 60 secondes pour les signaux de mouvement et d’environ 1 à 60 secondes pour les signaux sonores. Ces longueurs pour les fenêtres temporelles sont déterminées pour pouvoir être capable de détecter une apnée du sommeil dans les estimations des signaux physiologiques. La normalisation est avantageusement appliquée aux signaux 21 des jeux de données d'entraînement (par exemple par le dispositif 6) de manière similaire. Notamment, le dispositif 1 peut traiter des signaux provenant d'un type de source donné, alors que ses paramètres résultent d'un apprentissage basé sur des signaux obtenus avec différents types de sources. Grâce à la standardisation, les différences entre les sources peuvent alors être neutralisées ou minimisées. Cela peut rendre le dispositif 1 plus efficace et plus fiable.
Dans un mode de réalisation, dans lequel F au moins un signal cardio-respiratoire comprend un signal sonore cardio-respiratoire, le module 12 est configuré, en outre, pour effectuer une compression du signal sonore cardio-respiratoire à l’aide d’un réseau de neurones convolutif. Ledit réseau de neurones convolutif peut être un réseau neuronal résiduel (en anglais « residual neural network », ResNet), qui sont des réseaux neuronaux utilisant des raccourcis (« skip connections ») pour sauter certaines couches. Lesdits raccourcis permettent de manière avantageuse d’éviter le problème des gradients évanescents (« vanishing gradient »). Les modèles ResNet peuvent être implémentés avec des sauts à deux ou trois couches qui contiennent des non-linéarités (ReLU) et une normalisation par lots (« batch normalisation ») entre les deux. Les signaux sonores sont acquis avec une fréquence d’échantillonnages supérieure (i.e., fichiers des données volumineux) à celle des signaux de mouvement, donc de manière avantageuse, la compression des signaux sonores permet de réduire le coût de calcul et réduit la mémoire vive nécessaire à l’étape d’utilisation du modèle.
Dans ce mode de réalisation comprenant à la fois les signaux sonores et les signaux de mouvement cardio-respiratoire, les signaux sonores compressés sont fusionnés avec les signaux de mouvement. Dans un exemple, le réseau qui effectue la compression est un ResNet- 18 avec une opération convolutionnelle unidimensionnelle, configuré pour comprimer des paquets de 8092 échantillons sonores en 256 échantillons comprenant 512 composantes (« features »). Ces 512 composantes sont ensuite concaténées avec 6 composantes de la centrale inertielle (i.e., accélération et vitesse angulaire pour chacune des trois axes).
Le dispositif 1 comprend entre autres un module 13 configuré pour utiliser un modèle de régression non-linéaire sur des signaux cardio-respiratoires de sorte à obtenir au moins une estimation d’un signal physiologique représentatif soit de l’activité cardiaque soit de l’activité respiratoire du sujet. Ledit modèle de régression non-linéaire est notamment configuré pour recevoir en entrée F au moins un signal cardio-respiratoire, et fournir en sortie au moins une estimation d’un signal physiologique de polygraphie ventilatoire et/ou un signal physiologique d’électrocardiographie 31. Le modèle de régression non- linéaire utilisé est un réseau de neurones configuré et entraîné pour recevoir, en entrée, F au moins un signal cardio-respiratoire, et fournir en sortie au moins une estimation d’un signal physiologique 31. Ledit réseau de neurones est en outre configuré pour réaliser des opérations de convolution unidimensionnelles. Une convolution est une opération linéaire qui implique la multiplication d'un ensemble de poids avec l'entrée. Dans le cas d’une entrée unidimensionnelle, la multiplication est effectuée entre un vecteur de données d'entrée (i.e. série temporelle) et un tableau unidimensionnel de poids, appelé filtre ou noyau.
De manière avantageuse, ce réseau de neurones présente une structure comprenant un encodeur et un décodeur. L’encodeur est construit avec une entrée et plusieurs sorties et le décodeur avec une sortie et plusieurs entrées. En outre, au moins deux sorties d’encodeur sont directement reliées à au moins deux entrées respectives du décodeur, et au moins deux sorties de l’encodeur sont connectées entre elles. Ce type de structure permet de résoudre le problème de « vanishing gradient ».
Dans un mode de réalisation, le réseau de neurones comporte un modèle de réseau de neurones entièrement convolutif, avec un encodeur et un décodeur, appelé U-Net. L’encodeur est un assemblage de couches de convolution, de couches de « max pooling » permettant de créer une carte de composantes des signaux et de réduire leur taille pour diminuer le nombre de paramètres du réseau. Le décodeur permet une expansion avec un chemin symétrique au chemin de contraction de l’encodeur, ce qui donne la forme en U de l’architecture. L’U-net, permet de manière avantageuse, de connecter plusieurs sorties de l’encodeur à plusieurs entrées du décodeur. Ainsi, il est possible d’extraire des informations à chaque échelle (i.e., chaque bloc qui précède un « max pooling »), et de les assembler dans le décodeur. Ce qui est différent du cas de l'auto-encodeur qui ne conserve que les informations de l'échelle la plus basse. Dans ce mode de réalisation, l’encodeur du U-net comporte une architecture ResNet.
La Figure 3 montre un exemple d’architecture du réseau de neurones configurée pour recevoir en entrée les signaux de mouvements cardio-respiratoires, éventuellement après une étape de pré-traitement effectuée par le module 12. Cette figure montre notamment les « skip connections » présentes dans l’encodeur (colonne de gauche) caractéristique d’un ResNet et les connexions horizontales entre l’encodeur et le décodeur caractéristique d’un UNet (i.e., flèches horizontales entre la colonne de gauche et la colonne de droite représentant la concaténation de composantes d'une sortie de l’encodeur avec celles d'une autre sortie du décodeur). La Figure 4 montre un deuxième exemple d’architecture construite pour traiter à la fois les signaux sonores et les signaux de mouvement. Cette architecture comprenant, en plus de l’architecture précédente, le réseau de neurones ResNet- 18 pour la compression des signaux sonores. Le réseau de neurones pour la compression est situé avant l’encodeur du U-Net (première colonne sur la gauche du chemin).
Dans un mode de réalisation, le réseau de neurones comprend une couche de sortie ayant une fonction d’activation linéaire. La fonction d'activation linéaire est la fonction identité, et son utilisation est adaptée de manière avantageuse aux problèmes de régression car la valeur attendue en sortie appartient à l'ensemble des réels.
Le module 13 peut en outre être configuré pour effectuer une normalisation de signaux en sortie du modèle de régression. Comme pour les signaux en entrée du modèle de régression, aussi certains signaux en sortie peuvent être normalisés en utilisant une normalisation par cote Z (« z-score normalisation »). Les signaux normalisés comprennent notamment les signaux physiologiques exceptés la saturation en oxygène et la fréquence cardiaque, dont il est intéressant de connaître l’amplitude absolue.
Les Figures 5 et 6 donnent des exemples de signaux physiologiques respiratoires et cardiaques respectivement. Ces signaux in Figures 5 et 6 sont obtenus par l’analyse des signaux cardio-respiratoires représentés en Figure 2. Le dispositif peut en outre comprendre un module 14 configuré pour détecter un épisode anormal associé à une apnée du sommeil. Dans un mode de réalisation, cet épisode anormal est détecté en analysant F au moins un signal de polygraphie ventilatoire délivré par le modèle de régression non-linéaire, en lui appliquant un modèle de segmentation. Dans un mode de réalisation alternatif, le module 14 est configuré pour analyser directement les signaux cardio-respiratoires en appliquant un modèle de segmentation.
Le module 14 peut être en outre configuré pour détecter un épisode anormal associé à une arythmie cardiaque. Dans un mode de réalisation, cet épisode anormal est détecté en analysant F au moins un signal physiologique cardiaque délivré par le modèle de régression non-linéaire. Dans un mode de réalisation alternatif, le module 14 est configuré pour analyser directement les signaux cardio-respiratoires en appliquant un modèle de segmentation.
Le dispositif 1 interagit avec une interface utilisateur 16, par laquelle des informations peuvent être entrées et récupérées par un utilisateur. L'interface utilisateur 16 comprend tout moyen approprié pour entrer ou récupérer des données, des informations ou des instructions, notamment des capacités visuelles, tactiles et/ou sonores pouvant englober un ou plusieurs des moyens suivants bien connus de l'homme du métier : un écran, un clavier, une boule de commande, une tablette tactile, un écran tactile, un haut-parleur, un système de reconnaissance vocale.
Dans ses actions automatiques, le dispositif 1 peut par exemple exécuter le procédé suivant (Figure 7) : recevoir au moins un signal cardio-respiratoire 21 représentatif des sons et/ou mouvements provenant de la cage thoracique et des voies aériennes du sujet (étape 41) ; l’utilisation d’un modèle de régression non-linéaire du type réseau de neurones pour obtenir, à partir de F au moins un signal cardio-respiratoire 21, au moins une estimation d’un signal physiologique de polygraphie ventilatoire et/ou un signal physiologique d’électrocardiographie 31 (étape 42) ; fournir en sortie F au moins une estimation d’un signal physiologique de polygraphie ventilatoire et/ou un signal physiologique d’électrocardiographie 31 (étape 43).
De plus amples informations seront données ci-après sur le dispositif 6 pour l’entrainement. Le dispositif 6 peut être intégré dans un même appareil que le dispositif 1 d’estimation et partager la plupart des fonctionnalités du dispositif 1. Plus généralement, le dispositif 1 et le dispositif 6 peuvent avoir des processeurs communs configurés pour exécuter une partie des fonctionnalités du dispositif 1, qu'elles soient localisées ou distribuées. Dans des mises en œuvre alternatives, le dispositif 1 et le dispositif 6 peuvent être complètement déconnectés, et éventuellement exploités par des acteurs distincts (par exemple un fournisseur de services pour le dispositif 6 et le personnel de la clinique pour le dispositif 1).
Dans des modes de réalisation avantageux, le dispositif 6 partage une même architecture avec le dispositif 1, ainsi qu'un même prétraitement des données. Par exemple, la normalisation préliminaire des signaux cardio-respiratoire sont identiques. Ceci n'est cependant pas nécessaire, et le dispositif 6 peut avoir une architecture différente dans une certaine mesure, dans la mesure où il est capable de fournir des paramètres de modèle adaptés à des estimations correctes par le dispositif 1.
De même, les paramètres d'apprentissage 20 exploités par le dispositif 1 peuvent provenir d'autres sources que le dispositif 6.
Comme représenté sur la Figure 8, le dispositif 6 est adapté pour récupérer des paramètres d'apprentissage initiaux 721 définissant un modèle algorithmique initial dans le cadre d'une architecture de « machine learning », à partir d'une ou plusieurs base(s) de données 60 locales ou distantes. Cette dernière peut prendre la forme de ressources de stockage disponibles à partir de tout type de moyens de stockage appropriés, qui peuvent être notamment une RAM ou une EEPROM tel qu'une mémoire Flash, éventuellement au sein d'un SSD. Dans des modes de réalisation avantageux, les paramètres initiaux d'entraînement 721 ont été préalablement générés par le dispositif 6 pour l'entraînement. En variante, les paramètres d'entraînement initial 721 sont reçus depuis un réseau de communication.
Le dispositif 6 est configuré pour déterminer des paramètres d'apprentissage modifiés 722 définissant un modèle algorithmique modifié sur la base des paramètres d'apprentissage d'entrée 721, et pour transmettre ces paramètres 722 ou les enregistrer, par exemple dans la ou les base(s) de données 60. Ceci est réalisé en utilisant des ensembles de données d'apprentissage 71 reçus par le dispositif 6, permettant d'ajuster progressivement les paramètres d'apprentissage de sorte qu'un modèle algorithmique associé devienne plus pertinent pour ces ensembles de données d'apprentissage 71 (apprentissage supervisé).
Plus précisément, les ensembles de données d'apprentissage 71 comprennent des données d’entrées incluant des signaux cardio-respiratoire 711, et des données de sorties incluant les signaux physiologiques respiratoire et cardiaque 712 correspondants respectivement aux entrées, qui ont été mesurés simultanément. En outre, le dispositif 6 est configuré pour produire de manière itérative des résultats des signaux physiologiques évalués à partir des données d'entrée 711, sur la base de paramètres d'apprentissage définissant un modèle algorithmique actuel, et pour modifier ces paramètres d'apprentissage de manière à réduire les écarts entre les signaux physiologiques respiratoire évalués et les signaux physiologiques respiratoire connus 712.
Les paramètres d'apprentissage modifiés 722 peuvent eux-mêmes être pris comme paramètres d'apprentissage initiaux pour les opérations d'apprentissage subséquentes.
Bien que les aspects de formation du dispositif 6 soient actuellement développés, on peut observer que le dispositif 6 peut être appliqué de la même manière aux ensembles de données de validation et aux ensembles de données de test.
Le dispositif 6 d'apprentissage comprend un étage d'exécution 60 comprenant un module 61 pour recevoir les ensembles de données d'apprentissage 71 et les paramètres d'apprentissage 721, un module 62 pour prétraiter les signaux cardio-respiratoires 711 des ensembles de données d'apprentissage 71, un module 63 pour l’utilisation du modèle de régression pour calculer les signaux physiologiques et pour les sortir. Ces modules 61, 62 et 63 ne seront pas détaillés ici, car leur description est similaire à la description ci-dessus des modules respectifs 11, 12 et 13 du dispositif 1 de prédiction. Les modèles basés sur l’apprentissage machine dans les modules 62 et/ou 63 sont définis par les valeurs actuelles des paramètres d'apprentissage.
Dans des mises en œuvre avantageuses, les modules 61, 62 et 63 du dispositif 6 sont au moins partiellement identiques aux modules 11, 12 et 13 du dispositif 1. En particulier, une même normalisation d'image peut être appliquée (modules 12 et 62) et/ou une même architecture de réseau de neurones peut être utilisée (modules 13 et 63). En particulier, l'étape d'exécution 60 peut être une entité commune au dispositif 1 et au dispositif 6. Par « même architecture de réseau » et « mêmes méthodes », on entend sous réserve de l'exploitation éventuelle de paramètres d'apprentissage distincts.
Le dispositif 6 comprend en outre un module 65 pour comparer les estimations des signaux physiologiques évalués avec les signaux physiologiques connus 712 et pour modifier les paramètres d'entraînement actuels en vue de réduire l'écart entre eux. Les termes "comparaisons" et "modifications" sont utilisés pour simplifier l'expression, alors qu'en pratique, les deux opérations peuvent être étroitement combinées dans des actions de synthèse, par exemple par une descente de gradient.
Le dispositif 6 comprend également un module 66 pour arrêter les modifications des paramètres d'apprentissage sur la base des ensembles de données 71. Ce module 66 peut prévoir d'arrêter les itérations associées lorsque les écarts entre les signaux physiologiques évalués et les signaux physiologiques connus 712 deviennent inférieurs à un seuil prédéfini. Il peut, au contraire, ou de manière cumulative, prévoir la fin de ces itérations lorsqu'un nombre maximal prédéfini d'itérations est atteint.
Dans une version d'apprentissage de base, le dispositif 6 est configuré pour procéder à un apprentissage exclusivement dirigé vers le réseau de neurones avec architecture en U. Dans d'autres modes, le dispositif 6 comprend des étages de machine learning supplémentaires, qui peuvent être notamment destinés à compresser les signaux sonore 711. Ensuite, le dispositif 6 peut également être configuré pour entraîner ces étages machine learning supplémentaires. Dans des modes de réalisation particuliers, le dispositif 6 est configuré pour entraîner conjointement certains ou tous les étages learning supplémentaires avec le réseau de neurones avec architecture en U du module 63.
Dans les implémentations impliquant des réseaux de neurones, le dispositif 6 peut être adapté pour exécuter une rétro-propagation (« back-propagation ») à travers le temps (BPTT). Selon cette méthode d'apprentissage, une technique basée sur le gradient est appliquée à un coût par rapport à tous les paramètres du réseau, comme le sait l'homme du métier. Une descente de gradient stochastique peut également être utilisée (i.e., « batch gradient descent » ou « mini-batch gradient descent »).
Par exemple, avec la mise en œuvre décrite ci-dessus impliquant le deuxième réseau de neurones de compression et le réseau de neurones en architecture en U, les deux architectures peuvent être entrainées conjointement. Au moins un des réseaux neuronaux résiduels (ResNet) peut être utilisé, avec un apprentissage par transfert à partir d'un modèle pré-entraîné qui a utilisé, par exemple, la base de données connue. Les paramètres associés peuvent être, par exemple, les suivants : nom_couches : 18 époques : 50 optimiseur : Adam décroissance exponentielle pour l'estimation du premier moment = 0.9 décroissance exponentielle pour l'estimation du deuxième moment = 0.999 dimension_lot : 32 forme_signal_son : (1, 81920) forme_signal_centrale inertielle : (1, 5984)
Le dispositif 6 comprend également un module 67 permettant de fournir les paramètres d'entraînement modifiés 722 résultant des opérations d'entraînement par le dispositif 6. Il interagit en outre avec une interface utilisateur 68, pour la description de laquelle le lecteur pourra se référer à l'interface utilisateur 20 associée au dispositif 1.
Le dispositif 6 peut par exemple exécuter le processus suivant :
1) recevoir les paramètres d'apprentissage initiaux 721 et un ou plusieurs des ensembles de données d'apprentissage 71, ou une partie de ceux-ci, y compris les entrées comprenant les signaux cardio-respiratoires 711 et les sorties comprenant les résultats connus de signaux physiologiques 712 ;
2) prétraiter des signaux cardio-respiratoires 711 en vue d'un traitement plus efficace et/ou plus fiable ;
3) exécuter le modèle de régression sur les signaux cardio-respiratoires 711 après leur prétraitement ;
4) comparer les signaux physiologiques estimés aux signaux physiologiques connus 712 et modifier les paramètres de formation actuels en conséquence ;
5) vérifier les critères d'arrêt ;
6) si les critères d'arrêt ne sont pas satisfaits, revenir itérativement à l'étape 3) avec les valeurs modifiées des paramètres d'apprentissage courants, et réitérer les opérations ;
7) si les critères d'arrêt sont satisfaits, conserver les paramètres d'apprentissage actuellement modifiés en tant que paramètres d'apprentissage modifiés 722 et les fournir.
Dans des variantes de modes d'exécution, les paramètres d'apprentissage modifiés 722 peuvent être distincts des paramètres d'apprentissage actuellement modifiés lorsque les critères d'arrêt sont satisfaits, et être calculés à partir de ces paramètres d'apprentissage actuellement modifiés ainsi que d'une ou plusieurs valeurs de paramètres obtenues précédemment (par exemple, en faisant la moyenne).
Un appareil particulier 9, visible sur la figure 9, met en œuvre le dispositif 1 ainsi que le dispositif 6 décrits ci-dessus. Il correspond par exemple à une station de travail, à un ordinateur portable, à une tablette, à un smartphone, ou encore à un « head-mounted display » (HMD).
Cet appareil 9 est adapté à l’estimation de signaux physiologiques et à la formation du modèle correspondant. Il comprend les éléments suivants, reliés les uns aux autres par un bus 95 d'adresses et de données qui transporte également un signal d'horloge (« clock signal ») :
- un microprocesseur 91 (ou CPU) ;
- une carte graphique 92 comprenant plusieurs unités de traitement graphique (ou GPU) 920 et une mémoire vive graphique (GRAM) 921 ;
- une mémoire non volatile de type ROM 96 ; - une mémoire vive 97 ;
- un ou plusieurs dispositifs d'entrée/s ortie (E/S) 94 comme par exemple un clavier, une souris, une boule de commande, une webcam ; d'autres modes d'introduction de commandes comme par exemple la reconnaissance vocale sont également possibles ;
- une source d'alimentation 98 ; et
- une unité de radiofréquence 99.
Selon une variante, l'alimentation électrique 98 est externe à l'appareil 9.
L'appareil 9 comprend également un dispositif d'affichage 93 de type écran d'affichage directement connecté à la carte graphique 92 pour afficher des images synthétisées calculées et composées dans la carte graphique. L'utilisation d'un bus dédié pour connecter le dispositif d'affichage 93 à la carte graphique 92 offre l'avantage de disposer de débits de transmission de données beaucoup plus importants et donc de réduire le temps de latence pour l'affichage des images composées par la carte graphique.
Selon une variante, un dispositif d'affichage est externe à l'appareil 9 et est relié à celui- ci par un câble ou sans fil pour transmettre les signaux d'affichage. L'appareil 9, par exemple au travers de la carte graphique 92, comprend une interface de transmission ou de connexion adaptée pour transmettre un signal d'affichage à un moyen d'affichage externe tel que par exemple un écran LCD ou plasma ou un vidéoprojecteur. A cet égard, l'unité radiofréquence 99 peut être utilisée pour des transmissions sans fil.
Il est à noter que le mot "registre" utilisé ci-après dans la description des mémoires 97 et 921 peut désigner dans chacune des mémoires mentionnées, une zone mémoire de faible capacité (quelques données binaires) ainsi qu'une zone mémoire de grande capacité (permettant de stocker tout un programme ou de calculer ou d'afficher tout ou partie des données représentatives des données). De même, les registres représentés pour la RAM 97 et la GRAM 921 peuvent être disposés et constitués de n'importe quelle manière, et chacun d'entre eux ne correspond pas nécessairement à des emplacements mémoire adjacents et peut être réparti autrement (ce qui couvre notamment le cas où un registre comprend plusieurs registres plus petits). A la mise sous tension, le microprocesseur 91 charge et exécute les instructions du programme contenu dans la RAM 97.
Comme le comprendra l'homme du métier, la présence de la carte graphique 92 n'est pas obligatoire, et peut être remplacée par un traitement complet par l'unité centrale et/ou des implémentations de visualisation plus simples.
Dans des modes alternatifs, l'appareil 9 peut comprendre uniquement les fonctionnalités du dispositif 1, et non les capacités d'apprentissage du dispositif 6. En outre, le dispositif 1 et/ou le dispositif 6 peuvent être mis en œuvre différemment d'un logiciel autonome, et un appareil ou un ensemble d'appareils comprenant uniquement des parties de l'appareil 9 peut être exploité par le biais d'un appel API ou d'une interface cloud.
EXEMPLES
La présente invention se comprendra mieux à la lecture des exemples suivants qui illustrent non-limitativement l’invention.
Exemple 1 :
Matériaux et méthodes
18 volontaires recrutés pour le dépistage de l'apnée du sommeil ont été utilisé pour cet exemple.
Pour l’entraînement du modèle, les enregistrements ont d'abord été mélangés. Ensuite, comme les enregistrements n'ont pas les mêmes durées (de ~4 à 12 heures), les 18 enregistrements ont été divisés en trois ensembles : un ensemble de données pour l’entraînement, un ensemble de données de validation et un ensemble de données de test avec un ratio approximatif (33%, 33%, 33%), afin qu'ils aient la même durée globale.
Le dispositif de l’invention est utilisé pour recevoir plusieurs enregistrements. Chaque enregistrement comprend 6 signaux cardio-respiratoire de mouvement acquis par une centrale inertielle (i.e., signaux obtenus par un accéléromètre à 3 axes et un gyroscope à 3 axes), échantillonnés à 100 Hz et mesurés par le smartphone. Avant tout traitement ultérieur, ces enregistrements sont synchronisés manuellement avec deux signaux de la ceinture Nox RIP : les efforts respiratoires thoraciques et abdominaux. Ces signaux ont été enregistrés par le dispositif de l’invention, et HSAT (Nox T3) ou PSG (Nox Al) pendant une nuit pour chaque volontaire.
Les 6 signaux cardio-respiratoire de mouvement obtenus du téléphone sont utilisés comme entrées pour deux modèles basés sur des réseaux de neurones. Les deux modèles sont entraînés pour obtenir en sortie un signal d’effort respiratoire thoracique acquis par le biais d’une ceinture thoracique pour l’un, un signal d’un effort respiratoire abdominal acquis par le biais d’une ceinture abdominale pour l'autre. Ainsi, les sorties contiennent toujours un signal à canal unique.
Les entrées (i.e., signaux cardio-respiratoires) et les sorties (i.e., signaux physiologiques) sont normalisées en utilisant la normalisation du z-score par fenêtre glissante. Dans cet exemple, la fenêtre glissante a une durée d’une minute.
Les entrées et les sorties sont filtrées par un filtre passe-bande entre [0.05 ; 5] Hz (fréquences respiratoires) en utilisant un filtre Butterworth avant-arrière de 8ème ordre. Les entrées et les sorties sont décimées à 20 Hz et sont divisées en fenêtres de 1 minute.
L'architecture du réseau de neurones pour la régression est un U-Net basé sur ResNetl8, avec une couche d'activation linéaire finale. La fonction de coût est de type logcosh.
10 époques d'entraînement ont été utilisées. A des fins de régularisation, ce nombre d'époques peut être réduit par un arrêt précoce qui est fixé lorsque la perte de validation ne diminue pas pendant au moins 5 époques.
Résultats
Les fonctions de perte (« loss ») pour l’entraînement et la validation diminuent rapidement. L’erreur, pour cet exemple, n’est pas supérieur à 22 % (en termes de logcosh). On peut s'attendre à ce que ce résultat s'améliore avec l'utilisation de données provenant d'un plus grand nombre de volontaires. Figure 10 représente un exemple de signal physiologique d’une minute estimé par le dispositif de l’invention pour un volontaire, où le modèle obtient les pires prédictions. Une apnée de 11 secondes se produit au milieu de cette fenêtre. Même si la prédiction est inexacte juste après l'apnée, la dynamique générale du signal est bien prédite. Figures 11 et 12 montrent des résultats obtenus pour un patient. Le premier et deuxième signal dans le haut de la figure 11 montrent respectivement le signal de l’effort respiratoire thoracique et le signal de l’effort respiratoire abdominal estimés par le procédé de l’invention. La dernière ligne montre une superposition de ces signaux avec, respectivement, les signaux acquis directement par une ceinture thoracique et une ceinture abdominale de manière synchrone aux signaux cardio-respiratoires utilisés pour l’estimation. De la même manière, le premier et deuxième signal dans le haut de la figure 12 montrent respectivement un signal de débit nasal et un signal de pression nasale estimé par le procédé de l’invention. La dernière ligne montre une superposition de ces signaux avec, respectivement, les signaux acquis directement par une lunette nasale de manière synchrone aux signaux cardio-respiratoires utilisés pour l’estimation.
En considérant les résultats obtenus pour tous les volontaires, le taux d’erreur est de 20%. Une base de données plus importante facilitera la généralisation et améliorera les résultats.

Claims

REVENDICATIONS
1. Procédé mis en œuvre par ordinateur pour l’estimation de signaux physiologiques d’un sujet, ledit procédé comprenant : la réception (41) d’au moins un signal cardio-respiratoire (21) représentatif des sons et/ou mouvements provenant de la cage thoracique et des voies aériennes du sujet, le signal cardio-respiratoire (21) étant acquis pendant le sommeil du sujet ; l’utilisation d’un modèle de régression non-linéaire du type réseau de neurones (43) configuré et entraîné pour recevoir, en entrée, F au moins un signal cardio-respiratoire, et fournir en sortie au moins une estimation d’un signal physiologique de poly graphie ventilatoire (31) ; dans lequel ledit signal physiologique de polygraphie ventilatoire est choisi parmi : un débit nasal acquis par le biais d’une lunette nasale, une pression nasale acquis par le biais d’une lunette nasale, un effort respiratoire thoracique acquis par le biais d’une ceinture thoracique ou un effort respiratoire abdominal acquis par le biais d’une ceinture abdominale ; dans lequel le réseau de neurones comprenant un encodeur ayant une entrée et plusieurs sorties et un décodeur ayant une sortie et plusieurs entrées, dans lequel au moins deux sorties d’encodeur sont directement reliées à au moins deux entrées respectives du décodeur, et au moins deux sorties de l’encodeur sont connectées entre elles et dans lequel ledit réseau de neurones est configuré pour réaliser des opérations de convolution unidimensionnelles ; et fournir en sortie F au moins une estimation d’un signal physiologique de polygraphie ventilatoire (31).
2. Procédé selon la revendication 1, dans lequel le réseau de neurones comporte un U-Net dont l’encodeur comporte un ResNet.
3. Procédé selon la revendication 1 ou 2, dans lequel le modèle de régression non- linéaire du type réseau de neurones (43) est configuré et entraîné pour fournir en sortie au moins une estimation d’un signal physiologique d’électrocardiographie (31).
4. Procédé la revendication 3, dans lequel ledit signal physiologique d’électrocardiographie est acquis par le biais d’un électrocardiogramme d’au moins une dérivation.
5. Procédé selon l’une quelconque des revendications 1 à 4, dans lequel F au moins un signal cardio-respiratoire est un signal de mouvement cardio-respiratoire obtenu à l’aide d’un gyroscope et/ou un accéléromètre.
6. Procédé selon l’une quelconque des revendications 1 à 5, dans lequel F au moins un signal cardio-respiratoire est signal sonore cardio-respiratoire ; le procédé comprenant, en outre, une compression du signal sonore cardio-respiratoire à l’aide d’un deuxième réseau de neurones convolutif, préalablement à son application en entrée du modèle de régression non-linéaire.
7. Procédé selon les revendications 5 et 6, comprenant, en outre, une fusion du signal sonore cardio-respiratoire compressé avec le signal de mouvement cardiorespiratoire.
8. Procédé selon l’une quelconque des revendications 1 à 7, dans lequel F au moins un signal cardio-respiratoire est normalisé avant l’utilisation du modèle de régression non-linéaire.
9. Procédé selon l’une quelconque des revendications 1 à 8, dans lequel le réseau de neurones comprend une couche de sortie ayant une fonction d’activation linéaire.
10. Procédé selon l’une quelconque des revendications 1 à 9, comprend, en outre, une détection d’un épisode anormal associé à une apnée du sommeil sur la base d’au moins un signal de poly graphie ventilatoire délivré par le modèle de régression non-linéaire.
11. Procédé selon l’une quelconque des revendications 1 à 10, comprenant, en outre, une détection d’un épisode anormal associé à une arythmie cardiaque sur la base d’au moins un signal physiologique cardiaque délivré par le modèle de régression non-linéaire.
12. Dispositif (1) pour l’estimation de signaux physiologiques d’un sujet, ledit dispositif (1) comprenant :
- au moins une entrée configurée pour recevoir au moins un signal cardiorespiratoire représentatif des sons et/ou mouvements provenant de la cage thoracique et des voies aériennes du sujet (21), le signal cardio-respiratoire (21) étant acquis pendant le sommeil du sujet ;
- au moins un processeur configuré pour : estimer au moins un signal physiologique de poly graphie ventilatoire (31) en utilisant un modèle de régression non-linéaire du type réseau de neurones configuré et entraîné pour recevoir, en entrée, F au moins un signal cardio-respiratoire, et fournir en sortie F au moins une estimation d’un signal physiologique de polygraphie ventilatoire ; dans lequel ledit signal physiologique de polygraphie ventilatoire est choisi parmi : un débit nasal acquis par le biais d’une lunette nasale, une pression nasale acquis par le biais d’une lunette nasale, un effort respiratoire thoracique acquis par le biais d’une ceinture thoracique ou un effort respiratoire abdominal acquis par le biais d’une ceinture abdominale ; dans lequel le réseau de neurones comprenant un encodeur ayant une entrée et plusieurs sorties et un décodeur ayant une sortie et plusieurs entrées, dans lequel au moins deux sorties d’encodeur sont directement reliées à au moins deux entrées respectives du décodeur, et au moins deux sorties de l’encodeur sont connectées entre elles et dans lequel ledit réseau de neurones est configuré pour réaliser des opérations de convolution unidimensionnelles ; au moins une sortie configurée pour fournir F au moins un signal de poly graphie ventilatoire et/ou un signal physiologique d’électrocardiographie (31).
13. Dispositif (1) selon la revendication 12, comprenant en autre au moins au capteur choisi parmi un gyroscope, un accéléromètre et/ou microphone.
14. Produit programme d’ordinateur comprenant des instructions qui, lorsque le programme est exécuté par un ordinateur, conduisent celui-ci à mettre en œuvre la méthode pour l’estimation de signaux physiologiques d’un sujet selon l’une quelconque des revendications 1 à 11.
15. Support d’enregistrement lisible par ordinateur comprenant des instructions qui, lorsque le programme est exécuté par un ordinateur, conduisent celui-ci à mettre en œuvre la méthode pour l’estimation de signaux physiologiques d’un sujet selon l’une quelconque des revendications 1 à 11.
PCT/FR2022/051933 2021-10-14 2022-10-13 Procédé d'estimation de signaux physiologiques WO2023062326A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR2110882A FR3128110A1 (fr) 2021-10-14 2021-10-14 Procédé d’estimation de signaux physiologiques
FRFR2110882 2021-10-14

Publications (1)

Publication Number Publication Date
WO2023062326A1 true WO2023062326A1 (fr) 2023-04-20

Family

ID=80786428

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2022/051933 WO2023062326A1 (fr) 2021-10-14 2022-10-13 Procédé d'estimation de signaux physiologiques

Country Status (2)

Country Link
FR (1) FR3128110A1 (fr)
WO (1) WO2023062326A1 (fr)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200163627A1 (en) * 2018-10-08 2020-05-28 UDP Labs, Inc. Systems and Methods for Generating Synthetic Cardio-Respiratory Signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200163627A1 (en) * 2018-10-08 2020-05-28 UDP Labs, Inc. Systems and Methods for Generating Synthetic Cardio-Respiratory Signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HUI XUE ET AL: "Automated Detection of Left Ventricle in Arterial Input Function Images for Inline Perfusion Mapping using Deep Learning: A study of 15,000 Patients", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 16 October 2019 (2019-10-16), XP081636716 *

Also Published As

Publication number Publication date
FR3128110A1 (fr) 2023-04-21

Similar Documents

Publication Publication Date Title
Perez-Pozuelo et al. The future of sleep health: a data-driven revolution in sleep science and medicine
Al-Dhief et al. A survey of voice pathology surveillance systems based on internet of things and machine learning algorithms
Oung et al. Technologies for assessment of motor disorders in Parkinson’s disease: a review
Dubosson et al. The open D1NAMO dataset: A multi-modal dataset for research on non-invasive type 1 diabetes management
Gudi et al. Real-time webcam heart-rate and variability estimation with clean ground truth for evaluation
WO2017147552A1 (fr) Système et procédé de méta-apprentissage multiformat, multi-domaine et multi-algorithme permettant de surveiller la santé humaine et de dériver un état et une trajectoire de santé
US11232857B2 (en) Fully automated non-contact remote biometric and health sensing systems, architectures, and methods
CA2872061C (fr) Procede de caracterisation de l'etat physiologique d'un patient a partir de l'analyse de son activite electrique cerebrale, et dispositif de surveillance faisant application
Rodriguez-Villegas et al. Wearable medical devices: High-level system design considerations and tradeoffs
JP2023538287A (ja) 呼吸器症候群を検出するためのアンサンブル機械学習モデル
Villarroel et al. Non-contact vital-sign monitoring of patients undergoing haemodialysis treatment
CN116092673B (zh) 一种便携式多信息融合分析及干预评估系统及其方法
Zlatintsi et al. E-prevention: Advanced support system for monitoring and relapse prevention in patients with psychotic disorders analyzing long-term multimodal data from wearables and video captures
Premkumar et al. Intelligent remote photoplethysmography-based methods for heart rate estimation from face videos: A survey
Sonawani et al. Biomedical signal processing for health monitoring applications: a review
Zhao et al. A CNN based human bowel sound segment recognition algorithm with reduced computation complexity for wearable healthcare system
Kimura et al. TieLent: A Casual Neck-Mounted Mouth Capturing Device for Silent Speech Interaction
Alam et al. Autocognisys: Iot assisted context-aware automatic cognitive health assessment
Chu et al. Non-invasive arterial blood pressure measurement and SpO2 estimation using PPG signal: A deep learning framework
Cakmak et al. An unbiased, efficient sleep–wake detection algorithm for a population with sleep disorders: change point decoder
Mehmood et al. Your smartphone could act as a pulse-oximeter and as a single-lead ECG
Botina-Monsalve et al. Performance analysis of remote photoplethysmography deep filtering using long short-term memory neural network
WO2023062326A1 (fr) Procédé d'estimation de signaux physiologiques
Zhao et al. Dysphagia diagnosis system with integrated speech analysis from throat vibration
Bi et al. Measuring children’s eating behavior with a wearable device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22801512

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2022801512

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2022801512

Country of ref document: EP

Effective date: 20240514