WO2022216173A1 - Artificial intelligence-based diagnosis of pathologies - Google Patents

Artificial intelligence-based diagnosis of pathologies Download PDF

Info

Publication number
WO2022216173A1
WO2022216173A1 PCT/RU2021/000146 RU2021000146W WO2022216173A1 WO 2022216173 A1 WO2022216173 A1 WO 2022216173A1 RU 2021000146 W RU2021000146 W RU 2021000146W WO 2022216173 A1 WO2022216173 A1 WO 2022216173A1
Authority
WO
WIPO (PCT)
Prior art keywords
pathologies
pathology
biopsy
image
patches
Prior art date
Application number
PCT/RU2021/000146
Other languages
French (fr)
Russian (ru)
Inventor
Геннадий Викторович ПОПОВ
Александр Андреевич ЧУБ
Павел Андреевич МАЕВСКИХ
Владимир Андреевич ЮРОВСКИЙ
Original Assignee
Геннадий Викторович ПОПОВ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Геннадий Викторович ПОПОВ filed Critical Геннадий Викторович ПОПОВ
Publication of WO2022216173A1 publication Critical patent/WO2022216173A1/en

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N29/00Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Definitions

  • the present technical solution generally relates to the medical field of technology, and in particular to methods and systems for diagnosing pathologies based on artificial intelligence technology, and can be used as a doctor's assistant for diagnosing based on artificial intelligence technology.
  • the prior art application US20200364587A1 "Systems and methods for processing images to classify the processed images for digital pathology" (publication date: 2020-11-19, copyright holder: PAIGE Al INC).
  • This solution discloses systems and methods for obtaining a target image corresponding to a target sample, the target sample includes a patient tissue sample, applying a machine learning model to the target image to determine at least one characteristic of the target sample and / or at least one characteristic of the target image.
  • the machine learning model was generated by processing a plurality of training images to predict at least one feature, the training images contain images of human tissues and/or images that are algorithmically generated, and output at least one feature of the target sample and/or at least one feature target image.
  • the method includes: obtaining an image with a tissue through the processor; image quantification through a processor based on: segmentation through an image processor into a plurality of segments; identifying through the processor a plurality of histological elements in the segments; forming through the processor a network graph containing a plurality of nodes, in which the histological elements correspond to the nodes; measuring with the help of the processor characteristics of the network graph; performing, through the feature-based image transformation processor; determining by the processor a non-parametric feature of the image based on the transformation; saving through the processor of non-parametric characteristics in the database.
  • the technical result achieved by solving the above technical problem is to increase the accuracy and speed of the doctor's diagnosis by means of digitized histological glasses.
  • An additional technical result is the reduction of errors associated with the human factor by automatically marking the slide, instantly determining the pathological areas of the tissue in the images and the type of pathology, as well as making a diagnosis.
  • the specified technical result is achieved by implementing a method for diagnosing pathologies based on artificial intelligence technology, performed by at least one computing device, in which at least one biopsy image containing a pathology is obtained; searching for areas containing tissue (as an optimization, the search can occur on a lower resolution slide), as well as clustering the areas into larger objects; read patches in high resolution; passing the patches obtained in the previous steps through a segmenting artificial neural network (ANN) to obtain a multi-channel mask with pathology classes; carry out the vectorization of the mask with classes of pathologies for presentation in the form of polygons; group polygons according to the biopsy specimens from which they were extracted for obtaining a preliminary diagnosis for each of the biopsy specimens; determine for each biopsy the total area of the lesion, the length of the lesion, the type of pathology and the Gleason sum.
  • ANN segmenting artificial neural network
  • patches are read with overlap to reduce prediction artifacts due to edge effects.
  • the multi-channel mask has the number of channels equal to the number of detected pathologies.
  • vectorization is carried out by representing in the form of coordinates for each class.
  • the search is carried out using the OpenCV library.
  • polygons obtained from neighboring patches are combined to eliminate joints between them in the final rendering.
  • the ANN is modified into an encoder.
  • FIG. 1 shows an example of the implementation of a method for diagnosing pathologies based on artificial intelligence technology.
  • FIG. Figure 2 shows a variant of the implementation of a graphical user interface that displays slides with the ability to edit the markup of the resulting image from pathologies.
  • FIG. 3 shows an implementation of a graphical user interface displaying slides with pathological diagnoses on the left side of the interface.
  • FIG. 4 shows an example of the implementation of a system for diagnosing pathologies based on artificial intelligence technology in the form of a block diagram.
  • FIG. 5 shows an example implementation of a table with Cohen's Kappa metrics (Cohen's Carr).
  • the system refers to a computer system, a computer (electronic computer), CNC (numerical control), PLC (programmable logic controller), computerized control systems and any other devices capable of performing a given, well-defined sequence of operations (actions, instructions), centralized and distributed databases, smart contracts.
  • a computer electronic computer
  • CNC numerical control
  • PLC programmable logic controller
  • computerized control systems and any other devices capable of performing a given, well-defined sequence of operations (actions, instructions), centralized and distributed databases, smart contracts.
  • a command processing device refers to an electronic unit or an integrated circuit (microprocessor) executing machine instructions (programs), a smart contract, an Ethereum virtual machine (EVM), or the like.
  • An instruction processing device reads and executes machine instructions (programs) from one or more data storage devices.
  • the role of a storage device can be, but not limited to, hard disk drives (HDD), flash memory, ROM (read only memory), solid state drives (SSD), optical drives.
  • a program is a sequence of instructions intended to be executed by a computer control device or command processing device.
  • Biopsy - is a diagnostic method of research, which consists in excising the tissues of a certain organ or taking a suspension of cells, carried out in a living organism, with the aim of subsequent microscopic examination, carried out after processing the drug with special dyes.
  • Slides are digitized glasses (biomaterial of the patient), according to which the pathology is determined and the diagnosis is made.
  • a biopsy is a material obtained by biopsy. In most cases, a biopsy is a direct research method that allows you to accurately diagnose a particular disease. The biopsy method has a particularly important information for the recognition of tumors.
  • Histological examination - is the study of a specific tissue area of interest under a microscope. These tissue areas are dehydrated using specially prepared solutions. The tissues become fat-soluble, and then they are moved into pre-prepared molds and soaked in paraffin, taking the form of solid cubes. After that, using a special knife with an ultra-thin blade, small sections are made with a thickness of no more than 3 micrometers.
  • slides where histological examination is used
  • images with pathology i.e. digitized slides
  • any known types of pathological images eg, MRI, X-ray, etc.
  • pathological images eg, MRI, X-ray, etc.
  • a puncture biopsy is used using specific thin needles that are inserted directly into the area under study. The tissue column located in the lumen of the needle is sent to the laboratory for research, where this technical solution is used in the study of the biopsy.
  • This technical solution can be implemented as a computing system with a microservice architecture, consisting of three main parts.
  • the first component is an artificial neural network (hereinafter referred to as ANN), which generates a slide layout and a diagnosis and, for example, is a modified Resnet-34.
  • ANN artificial neural network
  • ResNet-50, ResNet-101, HRNetV2-W18, HRNetV2-W32, HRNetV2-W48 can be used as an artificial neural convolutional network.
  • the ANN detects the following pathologies, but is not limited to: a. Atrophy;
  • the second component is a module for viewing an image with a pathology, for example, slides (with and without markup) and a diagnosis, is configured to edit the markup of the resulting image from pathologies, for example, a slide and a diagnosis, manually marking a slide and making a diagnosis (without participation INS) as shown in Fig. 2.
  • An image in some implementations can be received from a client to a server, from a database of images with pathologies, or from any other external system. In order for a technical solution to produce a result in the form of a definition of a pathology on a slide and form a conclusion, it is preliminarily trained.
  • One of the stages of this training is the preparation by doctors of a data set (a set of slides, i.e. digitized glasses), which is the so-called manual markup.
  • This preparation may include the marking of these slides by doctors in a separate program or within a technical solution by area (areas of tissue damage / biomaterial of the patient).
  • the technical solution can automatically mark up the slides loaded into it.
  • the doctor can correct the automatic markup of the system if he does not agree with it, and also send his own version and the version of the system to receive a third b other doctor's opinions.
  • the performed automatic markup is a selected area on a slide with a pathology (label). In some implementations, the ability to change the label and add a description to the area.
  • GUI graphical user interface
  • LC personal account
  • DB database
  • RO working areas
  • This technical solution is one or more interacting artificial neural networks.
  • Each neural network works on a certain slide scale and is aimed at finding its features. This approach takes place because that some signs appear only at the macro level, while others can only be recognized at the cellular level.
  • the slide is processed by one or more ANNs with different levels of detail, and upon completion of the analysis and collection of all found features, the machine learning model decides whether each area belongs to a certain class of pathologies.
  • the model is assembled on previously trained scales. Assembling the model means loading the weights into the well-known ANN architecture. In this technical solution, these are the weights of the previously trained machine learning model.
  • the analyzed slide is read in low resolution to obtain a thumbnail. The miniature searches for areas containing tissue, as well as clustering areas into larger objects, since one slide can contain a series of sections of a paraffin block with one or more biopsy specimens (columns). The slide is read in grayscale and a median filter is applied to it, and then the extreme values are cut off by a threshold. Thus, there is a rejection of "peaks” in the image. Rejection of the "plateau” can occur using the Laplace transform. As a result of these actions, a binary mask for the slide is obtained, in which 0 is the background value, 1 is the value for tissues. Thus, areas are selected for a more detailed analysis using ANN.
  • a patch is a fixed-size image (usually a square shape) cut out of a slide.
  • the patches are read with overlap to reduce prediction artifacts due to edge effects.
  • These patches are passed through a segmenting ANN to obtain a multi-channel mask.
  • a normal image has 3 channels: Red, Green, Blue or RGB for short.
  • the multi-channel mask will have the number of channels equal to the number of classes, that is, the number of detected pathologies.
  • models known from the prior art for example, from information sources [2], [3], can be used.
  • a segmented ANN is an ANN that assigns a label to each pixel in an image. Pixels with the same labels have common visual characteristics.
  • the thus obtained mask with classes is vectorized for a more compact representation in the form of polygons.
  • a multi-band mask is a bitmap representation. One of the disadvantages of this representation is the speed of further processing.
  • the vectorization process is a representation in the form of coordinates for each class. For each of the channels, that is, for each class, the contours are searched, and hence the coordinates. The search can be carried out using the OpenCV library. Polygons obtained from adjacent patches are merged to eliminate joints between them in the final rendering.
  • the polygons are grouped by the biopsies (bars) from which they are extracted to obtain a preliminary diagnosis for each of the biopsies (bars), as shown in FIG. 3, both on the server side and on the client side. For example, a doctor, for some reason, changes the contour of the biopsy specimen (column), accordingly, on the client side (in a web browser), the polygons belong to the new boundaries of the column and form a new conclusion on the biopsy specimen (column)
  • the Gleason sum is one of the signs of determining the degree of pathology for making a conclusion.
  • the Gleason score is determined by adding the scores (on a 5-point scale) of the two most characteristic areas of the tumor biopsy. Gleason scores can range from 2 to 10, with 2 being the least aggressive tumor and 10 being the most aggressive. The Gleason sum is sometimes called the Gleason scale. To make a diagnosis for one patient, the doctor needs 10 to 12 of these patient tissue samples. They are also called columns.
  • the Gleason score (Gleason sum) is used for histological assessment of the differentiation of prostate cancer (small values of the scale correspond to highly differentiated forms, and high values correspond to poorly differentiated). High values on the Gleason scale are associated with a poor prognosis of the outcome of the disease.
  • a biopsy of the prostate is carried out, then the two most characteristic areas of the biopsy are evaluated on a five-point scale. One point means the highest degree of differentiation, and 5 means the lowest.
  • the "Gleason sum" obtained as a result of adding these estimates varies from 2 (1 + 1) to 10 (5 + 5) points.
  • Gleason score helps classify prostate carcinoma, assess prognosis, and select optimal therapy.
  • All the information received (polygons and a preliminary diagnosis, which can be compiled on the client side) are output to a file and / or to a database (DB) for further visualization through a graphical user interface.
  • DB database
  • the ResNet-34 model from the official PyTorch repository is taken as the basis. [1] The model is assembled unchanged in order to load the weights of the ImageNet dataset. Then this ANN with layers pretrained on ImageNet is modified into the so-called encoder by the following actions.
  • AvgPool2d - goes through the sliding window and takes the average value, and thereby reduces the size of the data.
  • Fc is a fully connected layer that is responsible for classification, which is not needed in the problem being solved.
  • MaxPool2d goes through the sliding window and takes the maximum value, and thus reduces the size of the data. This item was selected empirically in the implementation example and allowed to increase the accuracy on the data set used.
  • the encoder converts the incoming images into a fixed length vector.
  • the encoder is a set of Conv2d layers, ReLU, BatchNorm, AvgPool2d, MaxPool. Different models use different combinations with different parameters of these layers.
  • the final machine learning model is a modification of U-Net - SkipNet [2][3], which uses a modification of the ResNet-34 model as an encoder.
  • the output is the Conv2d layer, which converts the features it contains into n_classes.
  • n_classes the number of detected classes +1 (for an empty background).
  • the final number of parameters in the model in a specific implementation example is ⁇ 21.5M.
  • Fragments of 256x256 in size with a 1 ⁇ m pixel are read from the slide, and then fed into the ANN.
  • the choice of this approach is due to the maximization of information from images that are portioned into the model. Also, to reduce overfitting, training took place on randomly selected areas, and not on solid slides.
  • the loss function is a measure of how well the ANN predicts the expected outcome. During the learning process, this function is minimized and the ANN parameters are updated to improve accuracy.
  • Rectified Adam is a loss function minimization algorithm. During the training process, Rectified Adam slightly changes the parameters of the ANN so that it works more accurately.
  • L2_norm_weights L2 norm of model weights. This method is used to reduce the effect of overfitting the model.
  • Last division factor 1e4.
  • the loss function used was CrossEntropyLoss, whose behavior was adjusted so that unlabeled areas of the slide do not contribute to training.
  • Cohen's kappa is a metric that indicates the consistency of the opinions of two experts, in our case these are the labels that the doctors noted and the labels that the ANN predicted. It is more correct to use it for unbalanced datasets, such as in this solution, since it is more resistant to class imbalance than the Accuracy metric.
  • the left column indicates in brackets the total number of contours for each of the studied classes. Above are the classes that ANN predicts. The following examples consider the upper left cell.
  • Each cell has 5 values (listed from top to bottom):
  • the labels are arranged so that there are correct hits on the diagonal, and misses in the remaining cells.
  • the created technical solution can be practically implemented using a computing device.
  • the user can open the solution via the link on his PC, then registers in the LC of the solution, then he can upload digitized slides (histological images) from any folder on the PC and get the result from the solution in the form of a formed conclusion with a diagnosis.
  • this technical solution can be implemented as a computer system 400 for performing pathology diagnostics based on artificial intelligence technology, which contains one or more of the following components:
  • a processing component 401 comprising at least one processor 402
  • the processing component 401 mainly manages all operations of the system 400, such as processing user data or a pathology search request, and managing display, phone call, data transmission, camera operation, and operation mobile communication device records.
  • Processing component 401 may include one or more processors 402 executing instructions for completing all or part of the steps from the above methods.
  • the processing component 401 may include one or more modules for convenient interaction between other processing modules 401 and other modules.
  • the processing component 401 may include a multimedia module for convenient, lightweight interaction between the multimedia component 405 and the processing component 401.
  • the memory 403 is configured to store various types of data to support the operation of the system 400, such as a user profile database. Examples of such data include instructions from any application or method, contact data, address book data, messages, images, videos, etc., all of which run on system 400.
  • Memory 403 may be implemented as any type of volatile memory, non-volatile memory, or a combination thereof, e.g., static random access memory (SRAM), Electrically Erasable Programmable Read Only Memory (EEPROM), Erasable Programmable Read Only Memory (EPROM), Programmable Read Only Memory (PROM), Read Only Memory device (ROM), magnetic memory, flash memory, magnetic disk or optical disk, and others, without being limited.
  • SRAM static random access memory
  • EEPROM Electrically Erasable Programmable Read Only Memory
  • EPROM Erasable Programmable Read Only Memory
  • PROM Programmable Read Only Memory
  • ROM Read Only Memory device
  • magnetic memory flash memory
  • flash memory magnetic disk or optical disk, and others, without being limited.
  • the media component 405 includes a screen that provides an output interface between the system 400, which may be installed on the user's mobile communications device, and the user.
  • the screen may be a liquid crystal display (LCD) or a touch panel (TP). If the screen includes a touch panel, the screen may be implemented as a touch screen to receive input from a user.
  • the touchpad includes one or more touch sensors in terms of gestures, touching and sliding on the touchpad. The touch sensor can not only sense the subject's touch boundary or swipe gesture, but also to determine the duration of time and pressure associated with the operation mode of touch and slide.
  • media component 405 includes one front camera and/or one rear camera. When the system 400 is in an operating mode, such as shooting mode or video mode, the front camera and/or rear camera can receive media data from outside. Each front camera and rear camera can be one fixed lens optics system or can have focal length or optical zoom.
  • the audio component 406 is configured to output and/or input an audio signal.
  • the audio component 406 includes one microphone (MIC) that is configured to receive an external audio signal when the system 400 is in an operating mode, such as a call mode, a recording mode, and a speech recognition mode.
  • the received audio signal may be further stored in the memory 403 or routed through the communication component 409 .
  • the audio component 406 also includes a single speaker configured to output an audio signal.
  • An input/output (I/O) interface 407 provides an interface between the processing component 401 and any peripheral interface module.
  • the above peripheral interface module may be a keyboard, steering wheel, button, etc. These buttons may include, but are not limited to, a start button, a volume button, a home button, and a lock button.
  • the touch component 408 includes one or more sensors and is configured to provide various aspects of assessing the state of system 400. system 400, the presence or absence of contact between a subject and system 400, as well as the orientation or acceleration/deceleration and temperature change of system 400.
  • Sensor component 408 includes a proximity sensor configured to detect the presence of a nearby object when there is no physical contact.
  • the sensor component 408 includes an optical sensor (eg, CMOS or CCD image sensor) configured for use in rendering an application.
  • the sensor component 408 includes an acceleration sensor, a gyroscope sensor, a magnetic sensor, a pressure sensor, or a temperature sensor.
  • the communication component 409 is configured to facilitate wired or wireless communication between the system 400 and other devices.
  • System 400 may access a wireless network based on a communication standard such as WiFi, 2G, 3G, 5G, or combinations thereof.
  • the communication component 409 receives a broadcast signal or broadcast related information from an external broadcast control system via a broadcast channel.
  • communication component 409 includes a Near Field Communication (NFC) module to facilitate near field communications.
  • NFC Near Field Communication
  • the NFC module may be based on radio frequency identification (RFID) technology, infrared data association (IrDA) technology, ultra-wideband (UWB) technology, Bluetooth (BT) technology, and other technologies.
  • RFID radio frequency identification
  • IrDA infrared data association
  • UWB ultra-wideband
  • Bluetooth Bluetooth
  • system 400 may be implemented by one or more Application-Specific Integrated Circuits (ASICs), a Digital Signal Processor (DSP), a Digital Signal Processor (DSP), a Programmable Logic Unit (PLU), a logic chip programmable in operating conditions (FPGA), controller, microcontroller, microprocessor or other electronic components, and can be configured to implement a method 500 for performing pathology diagnostics based on artificial intelligence technology.
  • ASICs Application-Specific Integrated Circuits
  • DSP Digital Signal Processor
  • DSP Digital Signal Processor
  • PLU Programmable Logic Unit
  • FPGA logic chip programmable in operating conditions
  • the non-volatile computer-readable medium includes a memory 403 that includes instructions, where the instructions are executed by the processor 401 of the system 400 to implement the above-described methods for performing pathology diagnosis based on artificial intelligence technology.
  • a non-volatile computer-readable medium can be ROM, random access memory (RAM), compact disk, magnetic tape, floppy disks, optical storage devices, and the like.
  • Computing system 400 may include a display interface that transmits graphics, text, and other data from a communications infrastructure (or framebuffer, not shown) for display on media component 405.
  • Computing system 400 further includes input devices or peripherals.
  • Peripheral devices may include one or more devices for interacting with a user's mobile communications device, such as a keyboard, microphone, wearable device, camera, one or more audio speakers, and other sensors. Peripherals may be external or internal to the user's mobile communications device.
  • the touch screen can display typically graphics and text, and also provides a user interface (such as, but not limited to, a graphical user interface (GUI)) through which a subject can interact with the user's mobile communication device, such as accessing and interacting with with applications running on the device.
  • GUI graphical user interface
  • All blocks used in the system can be implemented using electronic components used to create digital integrated circuits, which is obvious to a person skilled in the art. Not limited to, microcircuits can be used, the logic of which is determined during manufacture, or programmable logic integrated circuits (FPGAs), the logic of which is set by programming. For programming, programmers and debugging environments are used, which allow you to set the desired structure of a digital device in the form of a fundamental electrical diagrams or programs in special hardware description languages: Verilog, VHDL, AHDL, etc.
  • FPGAs programmable logic controllers
  • BMCs basic matrix crystals
  • ASIC - specialized custom-made large integrated circuits (LSI) which are significantly more expensive for small-scale and single-piece production.
  • the FPGA chip itself consists of the following components:
  • Blocks can also be implemented using read-only memories.
  • aspects of the present technical solution may be implemented as a system, method, or computer program product. Accordingly, various aspects of the present technical solution may be implemented solely as hardware, as software (including application software, etc.), or as an embodiment combining software and hardware aspects, which may be generally referred to as a "module” , "system” or “architecture”. In addition, aspects of the present technical solution may take the form of a computer program product implemented on one or more computer-readable media having a computer-readable program code that is implemented on them.
  • the computer-readable storage medium can be, without limitation, an electronic, magnetic, optical, electromagnetic, infrared, or semiconductor system, apparatus, device, or any suitable combination thereof. More specifically, examples (non-exhaustive list) of a computer-readable storage medium include: an electrical connection using one or more wires, a portable computer diskette; hard disk, random access memory (RAM), read only memory (ROM), erasable programmable read only memory (EPROM or Flash memory), fiber optic connection, compact disc read only memory (CD-ROM), optical storage device, magnetic storage device or any combination of the above.
  • a computer-readable storage medium can be any flexible storage medium that can contain or store a program for use by or in connection with a system, device, apparatus.
  • Program code embedded in a computer-readable medium may be transmitted using any medium, including, without limitation, wireless, wired, fiber optic, infrared, and any other suitable network, or a combination of the foregoing.
  • the computer program code for performing the operations for the steps of the present technical solution may be written in any programming language or combinations of programming languages, including an object-oriented programming language such as Python, R, Java, Smalltalk, C++, and so on, and conventional procedural programming languages, such as the "C" programming language or similar programming languages.
  • the program code may run on the user's computer in whole, in part, or as a separate software package, in part on the user's computer and in part on a remote computer, or in full on remote computer.
  • the remote computer may be connected to the user's computer via any type of network, including a local area network (LAN), a wide area network (WAN), or a connection to an external computer (eg, via the Internet via ISPs).
  • LAN local area network
  • WAN wide area network
  • ISPs Internet via ISPs
  • These computer program instructions may also be stored on a computer-readable medium that can control a computer other than a programmable data processing device or other than devices that operate in a particular manner such that the instructions stored on the computer-readable medium create a device including instructions that perform the functions/actions indicated in the block diagram and/or diagram.

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

The invention relates to the field of medicine and can be used as a medical assistant for making diagnoses using artificial intelligence technology. In a method for diagnosing pathologies using artificial intelligence technology, implemented by a computing device, an image of a biopsy specimen is obtained containing a pathology. The obtained biopsy image is analyzed at a low resolution to obtain a thumbnail image which is searched for regions containing tissues, and said regions are clustered into larger objects. Patches are read at a high resolution. The patches obtained in the previous step are run through a segmenting artificial neural network (ANN) to obtain a multichannel mask containing classes of pathologies. The mask containing classes of pathologies is vectorized for representation in the form of polygons. The polygons are grouped according to biopsy specimens, from which they are extracted to obtain a provisional diagnosis for each biopsy specimen. The following are determined for each biopsy specimen: the total area of damage, the length of damage, the type of pathology and the Gleason score to allow more accurate and rapid diagnosis by a doctor with the aid of digitized histological slides.

Description

ДИАГНОСТИКА ПАТОЛОГИЙ НА ОСНОВЕ ИСКУССТВЕННОГО DIAGNOSTICS OF PATHOLOGIES ON THE BASIS OF ARTIFICIAL
ИНТЕЛЛЕКТАINTELLIGENCE
ОБЛАСТЬ ТЕХНИКИ FIELD OF TECHNOLOGY
[001] Настоящее техническое решение в общем относится к медицинской области техники, а в частности к способам и системам проведения диагностики патологий на основе технологии искусственного интеллекта, и может быть использовано как ассистент врача для проведения диагностики на основе технологии искусственного интеллекта. [001] The present technical solution generally relates to the medical field of technology, and in particular to methods and systems for diagnosing pathologies based on artificial intelligence technology, and can be used as a doctor's assistant for diagnosing based on artificial intelligence technology.
УРОВЕНЬ ТЕХНИКИ BACKGROUND OF THE INVENTION
[002] В настоящее время из уровня техники известны компании, как разработавшие аналоги, так и в процессе разработки таковых. [002] Currently, companies are known from the prior art, both having developed analogues and in the process of developing them.
[003] Например, из уровня техники известна заявка US20200364587A1 «Systems and methods for processing images to classify the processed images for digital pathology» (дата публикации: 2020-11-19, правообладатель: PAIGE Al INC). В данном решении раскрыты системы и способы для получения целевого изображения, соответствующего целевому образцу, целевой образец включает образец ткани пациента, применения модели машинного обучения к целевому изображению для определения по меньшей мере одной характеристики целевого образца и / или по меньшей мере одной характеристики целевого изображения. Модель машинного обучения была сгенерирована путем обработки множества обучающих изображений для прогнозирования по меньшей мере одной характеристики, обучающие изображения содержат изображения тканей человека и / или изображения, которые генерируются алгоритмически, и вывод по меньшей мере одной характеристики целевого образца и / или по меньшей мере одной характеристики целевого изображения. [003] For example, the prior art application US20200364587A1 "Systems and methods for processing images to classify the processed images for digital pathology" (publication date: 2020-11-19, copyright holder: PAIGE Al INC). This solution discloses systems and methods for obtaining a target image corresponding to a target sample, the target sample includes a patient tissue sample, applying a machine learning model to the target image to determine at least one characteristic of the target sample and / or at least one characteristic of the target image. The machine learning model was generated by processing a plurality of training images to predict at least one feature, the training images contain images of human tissues and/or images that are algorithmically generated, and output at least one feature of the target sample and/or at least one feature target image.
[004] Также из уровня техники известен патент US10614285B2 «Computing technologies for image operations» (дата публикации: 2020-04-07, правообладатель: PROSCIA INC). Способ включает: получение через процессор изображения с тканью; количественную оценку изображения через процессор на основе: сегментации через процессор изображения на множество сегментов; идентификации через процессор множества гистологических элементов в сегментах; формировании через процессор сетевого графа, содержащего множество узлов, в котором гистологические элементы соответствуют узлам; измерении с помощью процессора характеристики сетевого графа; выполнении через процессор преобразования изображения на основе признака; определении с помощью процессора непараметрического признака изображения на основе преобразования; сохранении через процессор непараметрических характеристик в базе данных. [004] Also known from the prior art is patent US10614285B2 “Computing technologies for image operations” (publication date: 2020-04-07, copyright holder: PROSCIA INC). The method includes: obtaining an image with a tissue through the processor; image quantification through a processor based on: segmentation through an image processor into a plurality of segments; identifying through the processor a plurality of histological elements in the segments; forming through the processor a network graph containing a plurality of nodes, in which the histological elements correspond to the nodes; measuring with the help of the processor characteristics of the network graph; performing, through the feature-based image transformation processor; determining by the processor a non-parametric feature of the image based on the transformation; saving through the processor of non-parametric characteristics in the database.
[005] Однако существующие коммерческие системы не позволяют обеспечить точность осуществления цифровой диагностики. [005] However, existing commercial systems do not allow for the accuracy of digital diagnostics.
СУЩНОСТЬ ТЕХНИЧЕСКОГО РЕШЕНИЯ ESSENCE OF THE TECHNICAL SOLUTION
[006] Техническим результатом, достигаемым при решении вышеуказанной технической задачи, является повышение точности и скорости постановки врачом диагноза посредством оцифрованных гистологических стекол. [006] The technical result achieved by solving the above technical problem is to increase the accuracy and speed of the doctor's diagnosis by means of digitized histological glasses.
[007] Дополнительным техническим результатом является уменьшение ошибок, связанных с человеческим фактором, путем автоматической разметки слайда, мгновенного определения патологических областей ткани на изображениях и типа патологии, а также постановки диагноза. [007] An additional technical result is the reduction of errors associated with the human factor by automatically marking the slide, instantly determining the pathological areas of the tissue in the images and the type of pathology, as well as making a diagnosis.
[008] Указанный технический результат достигается за счет осуществления способа проведения диагностики патологий на основе технологии искусственного интеллекта, выполняемого по меньшей мере одним вычислительным устройством, в котором получают по меньшей мере одно изображение биоптата, содержащее патологию; осуществляют поиск областей, содержащих ткань (в качестве оптимизации поиск может происходить на слайде более низкого разрешения), а также кластеризацию областей в более крупные объекты; считывают патчи в большом разрешении; пропускают полученные на предыдущем шаги патчи через сегментирующую искусственную нейронную сеть (ИНС) для получения многоканальной маски с классами патологий; осуществляют векторизацию маски с классами патологий для представления в виде полигонов; группируют полигоны по биоптатам, из которых они извлечены для получения предварительного диагноза по каждому из биоптатов; определяют для каждого биоптата суммарную площадь поражения, длину поражения, тип патологии и сумму Глисона. [008] The specified technical result is achieved by implementing a method for diagnosing pathologies based on artificial intelligence technology, performed by at least one computing device, in which at least one biopsy image containing a pathology is obtained; searching for areas containing tissue (as an optimization, the search can occur on a lower resolution slide), as well as clustering the areas into larger objects; read patches in high resolution; passing the patches obtained in the previous steps through a segmenting artificial neural network (ANN) to obtain a multi-channel mask with pathology classes; carry out the vectorization of the mask with classes of pathologies for presentation in the form of polygons; group polygons according to the biopsy specimens from which they were extracted for obtaining a preliminary diagnosis for each of the biopsy specimens; determine for each biopsy the total area of the lesion, the length of the lesion, the type of pathology and the Gleason sum.
[009] В некоторых вариантах реализации технического решения патчи считываются с перекрытием для уменьшения артефактов предсказания в связи с краевыми эффектами. [009] In some implementations of the technical solution, patches are read with overlap to reduce prediction artifacts due to edge effects.
[0010] В некоторых вариантах реализации технического решения многоканальная маска имеет количество каналов, равное количеству детектируемых патологий. [0010] In some embodiments of the technical solution, the multi-channel mask has the number of channels equal to the number of detected pathologies.
[0011] В некоторых вариантах реализации технического решения осуществляют векторизацию посредством представления в виде координат для каждого класса. [0011] In some implementations of the technical solution, vectorization is carried out by representing in the form of coordinates for each class.
[0012] В некоторых вариантах реализации технического решения при осуществлении векторизации для каждого класса происходит поиск контуров патологий. [0012] In some embodiments of the technical solution, when performing vectorization for each class, pathological contours are searched.
[0013] В некоторых вариантах реализации технического решения поиск осуществляется средствами библиотеки OpenCV. [0013] In some embodiments of the technical solution, the search is carried out using the OpenCV library.
[0014] В некоторых вариантах реализации технического решения объединяют полигоны, полученные из соседних патчей, для устранения стыков между ними на итоговой визуализации. [0014] In some implementations of the technical solution, polygons obtained from neighboring patches are combined to eliminate joints between them in the final rendering.
[0015] В некоторых вариантах реализации технического решения ИНС модифицируется в энкодер. [0015] In some implementations of the technical solution, the ANN is modified into an encoder.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ BRIEF DESCRIPTION OF THE DRAWINGS
[0016] Признаки и преимущества настоящего технического решения станут очевидными из приведенного ниже подробного описания и прилагаемых чертежей, на которых: [0016] The features and advantages of the present technical solution will become apparent from the following detailed description and the accompanying drawings, in which:
[0017] На Фиг. 1 показан пример реализации способа проведения диагностики патологий на основе технологии искусственного интеллекта. [0018] На Фиг. 2 показан вариант реализации графического интерфейса пользователя, отражающего слайды с возможностью редактирования разметки полученного изображения с патологий. [0019] На Фиг. 3 показан вариант реализации графического интерфейса пользователя, отражающего слайды с поставленным диагнозом по патологиям в левой части интерфейса. [0017] In FIG. 1 shows an example of the implementation of a method for diagnosing pathologies based on artificial intelligence technology. [0018] In FIG. Figure 2 shows a variant of the implementation of a graphical user interface that displays slides with the ability to edit the markup of the resulting image from pathologies. [0019] In FIG. 3 shows an implementation of a graphical user interface displaying slides with pathological diagnoses on the left side of the interface.
[0020] На Фиг. 4 показан пример реализации системы проведения диагностики патологий на основе технологии искусственного интеллекта в виде блок-схемы. [0020] In FIG. 4 shows an example of the implementation of a system for diagnosing pathologies based on artificial intelligence technology in the form of a block diagram.
[0021] На Фиг. 5 показан пример реализации таблицы с метриками Каппа Коэна (Cohen's Карра). [0021] In FIG. 5 shows an example implementation of a table with Cohen's Kappa metrics (Cohen's Carr).
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ DETAILED DESCRIPTION OF THE INVENTION
[0022] Ниже будут подробно рассмотрены термины и их определения, используемые в описании технического решения. [0022] Below will be discussed in detail the terms and their definitions used in the description of the technical solution.
[0023] В данном изобретении под системой подразумевается компьютерная система, ЭВМ (электронно-вычислительная машина), ЧПУ (числовое программное управление), ПЛК (программируемый логический контроллер), компьютеризированные системы управления и любые другие устройства, способные выполнять заданную, четко определенную последовательность операций (действий, инструкций), централизованные и распределенные базы данных, смарт-контракты. [0023] In this invention, the system refers to a computer system, a computer (electronic computer), CNC (numerical control), PLC (programmable logic controller), computerized control systems and any other devices capable of performing a given, well-defined sequence of operations (actions, instructions), centralized and distributed databases, smart contracts.
[0024] Под устройством обработки команд подразумевается электронный блок либо интегральная схема (микропроцессор), исполняющая машинные инструкции (программы), смарт-контракт, виртуальная машина Ethereum (EVM) или подобное. Устройство обработки команд считывает и выполняет машинные инструкции (программы) с одного или более устройства хранения данных. В роли устройства хранения данных могут выступать, но, не ограничиваясь, жесткие диски (HDD), флеш-память, ПЗУ (постоянное запоминающее устройство), твердотельные накопители (SSD), оптические приводы. [0024] A command processing device refers to an electronic unit or an integrated circuit (microprocessor) executing machine instructions (programs), a smart contract, an Ethereum virtual machine (EVM), or the like. An instruction processing device reads and executes machine instructions (programs) from one or more data storage devices. The role of a storage device can be, but not limited to, hard disk drives (HDD), flash memory, ROM (read only memory), solid state drives (SSD), optical drives.
[0025] Программа - последовательность инструкций, предназначенных для исполнения устройством управления вычислительной машины или устройством обработки команд. [0025] A program is a sequence of instructions intended to be executed by a computer control device or command processing device.
[0026] Биопсия - представляет собой диагностический метод исследования, заключающийся в иссечении тканей определённого органа или взятие взвеси клеток, проводящийся в живом организме, с целью последующего микроскопического изучения, осуществляемого после обработки препарата специальными красителями. [0026] Biopsy - is a diagnostic method of research, which consists in excising the tissues of a certain organ or taking a suspension of cells, carried out in a living organism, with the aim of subsequent microscopic examination, carried out after processing the drug with special dyes.
[0027] Слайды - это оцифрованные стекла (биоматериал пациента), по которому происходит определение патологии и постановка диагноза. [0027] Slides are digitized glasses (biomaterial of the patient), according to which the pathology is determined and the diagnosis is made.
[0028] Биоптат — это материал, полученный путём биопсии. В большинстве случаев биопсия — это прямой метод исследования, позволяющий точно поставить диагноз той или иной болезни. Особенно важную информацию метод биопсии имеет для распознавания опухолей. [0028] A biopsy is a material obtained by biopsy. In most cases, a biopsy is a direct research method that allows you to accurately diagnose a particular disease. The biopsy method has a particularly important information for the recognition of tumors.
[0029] Гистологическое исследование - представляет собой исследование определённого интересующего участка ткани под микроскопом. Данные участки ткани обезвоживаются при помощи специфически приготовленных растворов. Ткани становятся жирорастворимыми, а затем перемещаются в заранее подготовленные формочки и пропитываются парафином, приобретая вид твёрдых кубиков. После чего, при помощи специального ножа с ультратонким лезвием, делаются небольшие срезы толщиной не более 3 микрометров. [0029] Histological examination - is the study of a specific tissue area of interest under a microscope. These tissue areas are dehydrated using specially prepared solutions. The tissues become fat-soluble, and then they are moved into pre-prepared molds and soaked in paraffin, taking the form of solid cubes. After that, using a special knife with an ultra-thin blade, small sections are made with a thickness of no more than 3 micrometers.
[0030] В конкретном варианте реализации в качестве примера изображений с патологией в описании будут описываться слайды (где используется гистологическое исследование), т.е. оцифрованные стекла, однако любому специалисту в уровне техники очевидно, что могут использоваться любые известные типы изображений с патологией (например, МРТ, рентген и т.д.). [0031] В конкретном варианте реализации при исследовании участков тканей или органов, расположенных у поверхности кожи, применяют пункционную биопсию с использованием специфических тонких игл, которые вводятся непосредственно в исследуемый участок. Столбик ткани, находящийся в просвете иглы, направляется в лабораторию на исследование, где применяют данное техническое решение при исследовании биоптата. [0030] In a specific implementation, slides (where histological examination is used) will be described as an example of images with pathology, i.e. digitized slides, however, it is obvious to any person skilled in the art that any known types of pathological images (eg, MRI, X-ray, etc.) can be used. [0031] In a specific embodiment, when examining areas of tissues or organs located near the surface of the skin, a puncture biopsy is used using specific thin needles that are inserted directly into the area under study. The tissue column located in the lumen of the needle is sent to the laboratory for research, where this technical solution is used in the study of the biopsy.
[0032] Данное техническое решение может быть реализовано в качестве вычислительной системы с микросервисной архитектурой, состоящей из трёх основных частей. [0032] This technical solution can be implemented as a computing system with a microservice architecture, consisting of three main parts.
[0033] Первой компонентной является искусственная нейронная сеть (далее - ИНС), которая генерирует разметку слайда и диагноз и, например, представляет собой модифицированную Resnet-34. В некоторых вариантах реализации в качестве такой сети могут использоваться Unet, LinkNet. Аналогично, в качестве искусственной нейронной сверточной сети могут использоваться ResNet-50, ResNet-101, HRNetV2-W18, HRNetV2-W32, HRNetV2-W48. [0033] The first component is an artificial neural network (hereinafter referred to as ANN), which generates a slide layout and a diagnosis and, for example, is a modified Resnet-34. In some variants implementations as such a network can be used by Unet, LinkNet. Similarly, ResNet-50, ResNet-101, HRNetV2-W18, HRNetV2-W32, HRNetV2-W48 can be used as an artificial neural convolutional network.
[0034] В конкретном примере реализации ИНС обнаруживает следующие патологии, не ограничиваясь: a. Атрофия; [0034] In a specific implementation example, the ANN detects the following pathologies, but is not limited to: a. Atrophy;
B. Аденокарцинома; i. Глисон 3 ii. Глисон 4 iii. Глисон 5 c. Пенистоклеточный рак; d. Протоковый рак; e. ПИН (Простатическая интраэпителиальная неоплазия); f. Хроническое воспаление; B. Adenocarcinoma; i. Gleason 3 ii. Gleason 4 iii. Gleason 5 c. foamy cell carcinoma; d. ductal cancer; e. PIN (Prostatic intraepithelial neoplasia); f. chronic inflammation;
[0035] Второй компонентной является модуль для просмотра изображения с патологией, например, слайдов (с разметкой и без) и диагноза, выполнен с возможностью редактирования разметки полученного изображения с патологий, например, слайда и диагноза, ручной разметки слайда и постановки диагноза (без участия ИНС), как показано на Фиг. 2. Изображение в некоторых вариантах реализации могут получать от клиента на сервер, из базы данных изображений с патологиями или из любой другой внешней системы, Для того, чтобы техническое решение могло выдать результат в виде определения патологии на слайде и сформировать заключение, оно предварительно обучается. Один из этапов этого обучения - подготовка врачами набора данных (набора слайдов, т.е. оцифрованных стекол), что является так называемой ручной разметкой. В эту подготовку может входить разметка этих слайдов врачами в отдельной программе или внутри технического решения по областям (зонам поражения ткани/ биоматериала пациента). По завершению процесса обучения искусственной нейронной сети техническое решение может автоматически размечать загруженные в него слайды. Врач может корректировать автоматическую разметку системы в случае, если не согласен с ней, а также, отправлять свой вариант и вариант системы для получения третьего б мнения другому врачу. Выполненная автоматическая разметка представляет собой выделенную область на слайде с патологией (меткой). В некоторых вариантах реализации возможность изменения метки и добавления описания к области. [0035] The second component is a module for viewing an image with a pathology, for example, slides (with and without markup) and a diagnosis, is configured to edit the markup of the resulting image from pathologies, for example, a slide and a diagnosis, manually marking a slide and making a diagnosis (without participation INS) as shown in Fig. 2. An image in some implementations can be received from a client to a server, from a database of images with pathologies, or from any other external system. In order for a technical solution to produce a result in the form of a definition of a pathology on a slide and form a conclusion, it is preliminarily trained. One of the stages of this training is the preparation by doctors of a data set (a set of slides, i.e. digitized glasses), which is the so-called manual markup. This preparation may include the marking of these slides by doctors in a separate program or within a technical solution by area (areas of tissue damage / biomaterial of the patient). Upon completion of the learning process of the artificial neural network, the technical solution can automatically mark up the slides loaded into it. The doctor can correct the automatic markup of the system if he does not agree with it, and also send his own version and the version of the system to receive a third b other doctor's opinions. The performed automatic markup is a selected area on a slide with a pathology (label). In some implementations, the ability to change the label and add a description to the area.
[001] Еще одной компонентой системы является графический интерфейс пользователя (англ. «GUI») с личным кабинетом (далее - ЛК) и базой данных (далее - БД), которая может храниться на сервере. Для работы с веб- интерфейсом необходима регистрация. ЛК позволяет создавать «рабочие области» (далее - РО) (некий аналог врачебного учреждения или лаборатории). РО нужны для изоляции работы врачей в различных мед. учреждениях, в частности для защиты персональных данных. Существует возможность добавления пользователей в рабочую область с различными уровнями доступа к информации, например: [001] Another component of the system is a graphical user interface ("GUI") with a personal account (hereinafter - LC) and a database (hereinafter - DB), which can be stored on the server. Registration is required to use the web interface. LC allows you to create "working areas" (hereinafter - RO) (some analogue of a medical institution or laboratory). RO is needed to isolate the work of doctors in various medical institutions. institutions, in particular for the protection of personal data. It is possible to add users to the workspace with different levels of access to information, for example:
- владелец (полный доступ ко всем слайдам РО) - owner (full access to all RO slides)
- врач (имеет доступ только к своим слайдам) - doctor (only has access to his own slides)
- супервизор (имеет доступ к своим слайдам и слайдам, назначенным на кейсы всех врачей РО) - supervisor (has access to his own slides and slides assigned to the cases of all RO doctors)
- администратор (любой из показанных выше пользователей может быть администратором, может менять уровни доступа пользователей). - administrator (any of the users shown above can be an administrator, can change user access levels).
[002] Внутри рабочей области находятся «локализации» (в конкретном варианте реализации - простата). Зайдя в локализацию, находят два блока («Кейсы» (можно трактовать как пациент) и «Слайды» (загруженные слайды и не добавленные в Кейс). Имеется возможность просмотреть слайды как из кейса, так и из блока «Слайды». Каждый кейс может содержать один и более слайдов (обычно принадлежащих одному пациенту). Для автоматической обработки (разметки и постановки диагноза) нажимается соответствующая кнопка. На обработку с помощью ИНС отправляется весь кейс. При желании можно разметить слайд и поставить диагноз в ручном режиме, для чего открывается каждый слайд отдельно. [002] Within the workspace are "localizations" (in a specific implementation, the prostate). Having entered the localization, they find two blocks (“Cases” (can be interpreted as a patient) and “Slides” (downloaded slides and not added to the Case). It is possible to view slides from both the case and from the Slides block. Each case can contain one or more slides (usually belonging to one patient) For automatic processing (marking up and making a diagnosis), the corresponding button is pressed The entire case is sent for processing using ANN If desired, you can mark up a slide and make a diagnosis in manual mode, for which each slide separately.
[003] Данное техническое решение представляет собой одну или несколько взаимодействующих между собой искусственных нейронных сетей. Каждая нейронная сеть работает на определенном масштабе слайда и нацелена на нахождение своих признаков. Такой подход имеет место быть в связи с тем, что некоторые признаки проявляются только на макроуровне, в то время как остальные возможно распознать только на клеточном уровне. В конкретном примере реализации слайд обрабатывается одной или несколькими ИНС с различными уровнями детализации, и по завершению анализа и сбора всех найденных признаков модель машинного обучения принимает решение о принадлежности каждой области к определенному классу патологий. [003] This technical solution is one or more interacting artificial neural networks. Each neural network works on a certain slide scale and is aimed at finding its features. This approach takes place because that some signs appear only at the macro level, while others can only be recognized at the cellular level. In a specific implementation example, the slide is processed by one or more ANNs with different levels of detail, and upon completion of the analysis and collection of all found features, the machine learning model decides whether each area belongs to a certain class of pathologies.
[004] Предварительно на первом шаге собирается модель на ранее обученных весах. Под сборкой модели подразумевается загрузка весов в известную архитектуру ИНС. В данном техническом решении это веса ранее обученной модели машинного обучения. В данной реализации анализируемый слайд считывается в низком разрешении для получения миниатюры. На миниатюре происходит поиск областей, содержащих ткань, а также кластеризация областей в более крупные объекты, поскольку на одном слайде может находиться серия срезов парафинового блока с одним или несколькими биоптатами (столбиками). Слайд считывается в оттенках серого и к нему применяется медианный фильтр, а затем отсечение экстремальных значений по порогу. Таким образом, происходит отброс «пиков» на изображении. Отбрасывание «плато» может происходить при помощи преобразования Лапласа. В результате этих действий получают бинарную маску для слайда, в которой 0 - фоновое значение, 1 - значение для тканей. Таким образом отбираются области для более детального анализа с помощью ИНС. [004] Previously, in the first step, the model is assembled on previously trained scales. Assembling the model means loading the weights into the well-known ANN architecture. In this technical solution, these are the weights of the previously trained machine learning model. In this implementation, the analyzed slide is read in low resolution to obtain a thumbnail. The miniature searches for areas containing tissue, as well as clustering areas into larger objects, since one slide can contain a series of sections of a paraffin block with one or more biopsy specimens (columns). The slide is read in grayscale and a median filter is applied to it, and then the extreme values are cut off by a threshold. Thus, there is a rejection of "peaks" in the image. Rejection of the "plateau" can occur using the Laplace transform. As a result of these actions, a binary mask for the slide is obtained, in which 0 is the background value, 1 is the value for tissues. Thus, areas are selected for a more detailed analysis using ANN.
[005] Из выбранных областей происходит считывание патчей в большом разрешении. Патчем называется изображение фиксированного размера (чаще квадратной формы), вырезанное из слайда. Патчи считываются с перекрытием для уменьшения артефактов предсказания в связи с краевыми эффектами. Эти патчи пропускаются через сегментирующую ИНС для получения многоканальной маски. Обычное изображение имеет 3 канала: Red, Green, Blue или коротко RGB. Многоканальная маска будет иметь количество каналов, равное количеству классов, то есть количеству детектируемых патологий. В качества примера ИНС могут использоваться модели, известные из уровня техники, например, из источников информации [2], [3]. Сегментирующая ИНС — это ИНС, которая присваивает метку каждому пикселю изображения. Пиксели с одинаковыми метками имеют общие визуальные характеристики. Полученная таким образом маска с классами векторизуется для более компактного представления в виде полигонов. Количество классов берётся из количества детектируемых патологий и здоровой ткани. По одному на каждую патологию плюс ещё по одному на каждую градацию Глисона. В конкретном примере реализации получается 9 классов + 1 = 10. Многоканальная маска — это растровое представление. Один из минусов такого представления — это скорость дальнейшей обработки. Процесс векторизации — это представление в виде координат для каждого класса. Для каждого из каналов, то есть для каждого класса происходит поиск контуров, а значит и координат. Поиск может осуществляться средствами библиотеки OpenCV. Полигоны, полученные из соседних патчей, объединяются для устранения стыков между ними на итоговой визуализации. Полигоны группируются по биоптатам (столбикам), из которых они извлечены для получения предварительного диагноза по каждому из биоптатов (столбиков), как показано на Фиг. 3, причем как на стороне сервера, так и на стороне клиента. Например, врач по каким-то причинам изменяет контур биоптата (столбика), соответственно ему на стороне клиента (в веб-браузере) пересчитывают принадлежность полигонов новым границам столбика и формируют новое заключение по биоптату (столбику) [005] High resolution patches are read from the selected areas. A patch is a fixed-size image (usually a square shape) cut out of a slide. The patches are read with overlap to reduce prediction artifacts due to edge effects. These patches are passed through a segmenting ANN to obtain a multi-channel mask. A normal image has 3 channels: Red, Green, Blue or RGB for short. The multi-channel mask will have the number of channels equal to the number of classes, that is, the number of detected pathologies. As an example of an ANN, models known from the prior art, for example, from information sources [2], [3], can be used. A segmented ANN is an ANN that assigns a label to each pixel in an image. Pixels with the same labels have common visual characteristics. The thus obtained mask with classes is vectorized for a more compact representation in the form of polygons. The number of classes is taken from the number of detected pathologies and healthy tissue. One for each pathology plus one more for each Gleason grade. In a specific implementation example, 9 classes + 1 = 10 are obtained. A multi-band mask is a bitmap representation. One of the disadvantages of this representation is the speed of further processing. The vectorization process is a representation in the form of coordinates for each class. For each of the channels, that is, for each class, the contours are searched, and hence the coordinates. The search can be carried out using the OpenCV library. Polygons obtained from adjacent patches are merged to eliminate joints between them in the final rendering. The polygons are grouped by the biopsies (bars) from which they are extracted to obtain a preliminary diagnosis for each of the biopsies (bars), as shown in FIG. 3, both on the server side and on the client side. For example, a doctor, for some reason, changes the contour of the biopsy specimen (column), accordingly, on the client side (in a web browser), the polygons belong to the new boundaries of the column and form a new conclusion on the biopsy specimen (column)
[006] Для каждого биоптата (столбика) рассчитываются такие характеристики как суммарная площадь поражения, длина поражения, самый распространённый и самый агрессивный типы рака (при их наличии) и так называемая сумма Глисона. Сумма Глисона — это один из признаков определения степени патологии для постановки заключения. Сумма баллов по Глисону определяется сложением баллов (по 5-балльной шкале) двух самых характерных участков биоптата опухоли. Сумма баллов по Глисону может варьироваться от 2 до 10, где 2 обозначает наименее агрессивную опухоль, а 10 - наиболее агрессивную. Сумма Глисона иногда называется шкалой Глисона. Для постановки диагноза по одному пациенту, врачу необходимо от 10 до 12 таких образцов ткани пациента. Они также называются столбиками. Шкала Глисона (сумма Глисона) используется для гистологической оценки дифференцировки рака простаты (малые значения шкалы соответствуют высокодифференцированным формам, а высокие - низкодифференцированным). Высокие значения по шкале Глисона связывают с плохим прогнозом исхода заболевания. Осуществляется биопсия простаты, затем два наиболее характерных участка биоптата оцениваются по пятибалльной шкале. Один балл означает наиболее высокую степень дифференцировки, а 5 — низкую. Полученная в результате сложения этих оценок «сумма Глисона» варьирует от 2 (1+1) до 10 (5+5) баллов. Низкодифференцированные опухоли (то есть имеющие высокую оценку по шкале Глисона) как правило более агрессивны (быстрее распространяются и метастазируют), однако лучше поддаются химиотерапии и лучевой терапии, чем высокодифференцированные. Совместно с другими методами оценки, шкала Глисона помогает классифицировать карциному простаты, оценивать прогноз и подбирать оптимальную терапию. [006] For each biopsy specimen (bar), such characteristics as the total area of the lesion, the length of the lesion, the most common and most aggressive types of cancer (if any) and the so-called Gleason sum are calculated. The Gleason sum is one of the signs of determining the degree of pathology for making a conclusion. The Gleason score is determined by adding the scores (on a 5-point scale) of the two most characteristic areas of the tumor biopsy. Gleason scores can range from 2 to 10, with 2 being the least aggressive tumor and 10 being the most aggressive. The Gleason sum is sometimes called the Gleason scale. To make a diagnosis for one patient, the doctor needs 10 to 12 of these patient tissue samples. They are also called columns. The Gleason score (Gleason sum) is used for histological assessment of the differentiation of prostate cancer (small values of the scale correspond to highly differentiated forms, and high values correspond to poorly differentiated). High values on the Gleason scale are associated with a poor prognosis of the outcome of the disease. A biopsy of the prostate is carried out, then the two most characteristic areas of the biopsy are evaluated on a five-point scale. One point means the highest degree of differentiation, and 5 means the lowest. The "Gleason sum" obtained as a result of adding these estimates varies from 2 (1 + 1) to 10 (5 + 5) points. Poorly differentiated tumors (that is, those with a high Gleason score) tend to be more aggressive (spread and metastasize faster), but respond better to chemotherapy and radiation therapy than well-differentiated ones. Together with other assessment methods, the Gleason score helps classify prostate carcinoma, assess prognosis, and select optimal therapy.
[007] Вся полученная информация (полигоны и предварительный диагноз, который может быть составлен на стороне клиента) выводятся в файл и/или в базу данных (БД) для дальнейшей визуализации через графический интерфейс пользователя. [007] All the information received (polygons and a preliminary diagnosis, which can be compiled on the client side) are output to a file and / or to a database (DB) for further visualization through a graphical user interface.
[008] В конкретном примере реализации за основу взята модель ResNet-34 из официального репозитория PyTorch. [1] Модель собирается без изменений для того, чтобы подгрузить веса набора данных ImageNet. Затем данная ИНС с предобученными на ImageNet слоями модифицируется в так называемый энкодер следующими действиями. [008] In a specific implementation example, the ResNet-34 model from the official PyTorch repository is taken as the basis. [1] The model is assembled unchanged in order to load the weights of the ImageNet dataset. Then this ANN with layers pretrained on ImageNet is modified into the so-called encoder by the following actions.
[009] Убираются два последних слоя avgpool и fc, так как они не используются для сегментации. AvgPool2d - проходит скользящим окном и берёт среднее значение, и тем самым уменьшает размер данных. Fc - полносвязный слой, который отвечает за классификацию, который в решаемой задаче не нужен. [009] The last two layers avgpool and fc are removed, since they are not used for segmentation. AvgPool2d - goes through the sliding window and takes the average value, and thereby reduces the size of the data. Fc is a fully connected layer that is responsible for classification, which is not needed in the problem being solved.
[0010] Далее вырезается слой maxpool в начале для сохранения большего объёма контекстной информации. MaxPool2d проходит скользящим окном и берёт максимальное значение, и тем самым уменьшает размер данных. Данный пункт был подобран опытным путём в примере реализации и позволил увеличить точность на используемом наборе данных. [0010] Next, the maxpool layer at the beginning is cut to save more contextual information. MaxPool2d goes through the sliding window and takes the maximum value, and thus reduces the size of the data. This item was selected empirically in the implementation example and allowed to increase the accuracy on the data set used.
[0011] Энкодер преобразует входящие изображения в вектор фиксированной длины. Энкодер представляет собой набор слоёв Conv2d, ReLU, BatchNorm, AvgPool2d, MaxPool. В разных моделях используются разные комбинации с разными параметрами этих слоёв. [0011] The encoder converts the incoming images into a fixed length vector. The encoder is a set of Conv2d layers, ReLU, BatchNorm, AvgPool2d, MaxPool. Different models use different combinations with different parameters of these layers.
[0012] Финальная модель машинного обучения представляет собой модификацию U-Net - SkipNet [2][3], у которого в качестве энкодера используется модификация модели ResNet-34. На выходе слой Conv2d, который преобразует входящие в него признаки в n_classes. Количество классов берётся из количества детектируемых патологий плюс здоровая ткань. По одному на каждую патологию и ещё по одному на каждую градацию Глисона. Итого 9 классов + 1 = 10. В конкретном примере реализации n_classes = количеству детектируемых классов +1 (за пустой фон). Финальное количество параметров в модели в конкретном примере реализации ~ 21 ,5М. [0012] The final machine learning model is a modification of U-Net - SkipNet [2][3], which uses a modification of the ResNet-34 model as an encoder. The output is the Conv2d layer, which converts the features it contains into n_classes. The number of classes is taken from the number of detected pathologies plus healthy tissue. One for each pathology and one more for each Gleason grade. Total 9 classes + 1 = 10. In a specific implementation example, n_classes = the number of detected classes +1 (for an empty background). The final number of parameters in the model in a specific implementation example is ~ 21.5M.
[0013] Имеющиеся слайды разделяются на тренировочный, валидационный и тестовый наборы данных. Для получения более сбалансированной выборки при обучении использовалось распределение, при котором порции данных выбирались с равной вероятностью для каждого класса. [0013] The available slides are divided into training, validation and test datasets. To obtain a more balanced sample during training, a distribution was used in which data portions were selected with equal probability for each class.
[0014] Из слайда читаются фрагменты размером 256x256 с пикселем 1 мкм, после чего подаются в ИНС. Выбор такого подхода обусловлен максимизацией информации с изображений, порционно попадающих в модель. Так же, для уменьшения переобучения, обучение происходило на случайно выбранных областях, а не на цельных слайдах. [0014] Fragments of 256x256 in size with a 1 μm pixel are read from the slide, and then fed into the ANN. The choice of this approach is due to the maximization of information from images that are portioned into the model. Also, to reduce overfitting, training took place on randomly selected areas, and not on solid slides.
[0015] Для обеспечения большей вариативности данных были применены такие аугментации, как: [0015] To provide greater data variability, augmentations were applied such as:
• Отражения картинок по вертикали, горизонтали. Вероятность применения 100% • Reflections of pictures vertically, horizontally. 100% cast chance
• Уменьшение качества изображения через сжатие кодеком jpeg. Вероятность применения 50%. • Image quality reduction through jpeg codec compression. The probability of application is 50%.
• Эластичное искажение картинки с параметрами scale = 1 , sigma = 50. Для аугментаций изменяющих размер/форму выбранного патча использовалась линейная интерполяция и отзеркаливание граничных областей. Вероятность применения 50%. • Elastic distortion of the image with the parameters scale = 1 , sigma = 50. For augmentations that change the size/shape of the selected patch, linear interpolation and mirroring of boundary areas were used. The probability of application is 50%.
• Добавление перепадов по яркости. Вероятность применения 50%. • Adding changes in brightness. The probability of application is 50%.
• Перемешивание каналов. Вероятность применения 50%. • Изменение оттенка и насыщенности. Вероятность применения 50%. • Mixing channels. The probability of application is 50%. • Change Hue and Saturation. The probability of application is 50%.
• Добавление мультипликативного шума с параметрами low = 0.5, high = 1.5. Вероятность применения 50%. • Adding multiplicative noise with parameters low = 0.5, high = 1.5. The probability of application is 50%.
[0016] В качестве оптимизатора используется Rectified Adam [4] с параметром weight_decay = 1е-2. Функция потерь - мера того, насколько хорошо ИНС предсказывает ожидаемый результат. В процессе обучения минимизируют эту функцию и обновляют параметры ИНС для повышения точности. Rectified Adam - это алгоритм минимизации функции потерь. В процессе обучения Rectified Adam незначительно меняет параметры ИНС, чтобы она работала точнее. weight_decay - метод регуляризации, который добавляет небольшой штраф к функции потери по формуле: loss=loss+weight_decay*L2_norm_weights loss - функция потерь weight_decay - параметр, который мы задаём из вне[0016] Rectified Adam [4] is used as an optimizer with weight_decay = 1e-2. The loss function is a measure of how well the ANN predicts the expected outcome. During the learning process, this function is minimized and the ANN parameters are updated to improve accuracy. Rectified Adam is a loss function minimization algorithm. During the training process, Rectified Adam slightly changes the parameters of the ANN so that it works more accurately. weight_decay - regularization method that adds a small penalty to the loss function according to the formula: loss=loss+weight_decay*L2_norm_weights loss - loss function weight_decay - a parameter that we set from outside
[0017]L2_norm_weights - L2 норма весов модели. Данный метод используется для того, чтобы понизить эффект переобучения модели. [0017] L2_norm_weights - L2 norm of model weights. This method is used to reduce the effect of overfitting the model.
[0018] Для изменения скорости обучения использовался планировщик OneCycleLR из официального репозитория pytorch со следующими параметрами: [0018] To change the learning rate, the OneCycleLR scheduler from the official pytorch repository was used with the following parameters:
• Оптимизатор = Rectified Adam (weight_decay = 1е-2). • Optimizer = Rectified Adam (weight_decay = 1e-2).
• Верхние границы скорости обучения в цикле для каждой группы параметров = 7е-4. Значение подобрано опытным путём. • Upper bounds on learning rate in a cycle for each group of parameters = 7e-4. The value was chosen empirically.
• Общее количество шагов в цикле = длине тренировочного датасета. • Total number of steps in the cycle = length of the training dataset.
• Количество эпох = 1023. • Number of epochs = 1023.
• Процент цикла (в количестве шагов), потраченный на увеличение скорости обучения = 0.3. • Percentage of a cycle (in number of steps) spent on increasing the learning rate = 0.3.
• Стратегия “отжига” = cos. • Annealing strategy = cos.
• Импульс цикла = True. • Cycle impulse = True.
• Базовый момент = 0.85. • Basic moment = 0.85.
• Максимальный момент = 0.95. • Maximum torque = 0.95.
• Коэффициент деления = 25. • Dividing factor = 25.
• Последний коэффициент деления = 1е4. [0019] В качестве функции потерь использовалась CrossEntropyLoss, поведение которой было скорректировано таким образом, чтобы неразмеченные области слайда не давали вклад в обучение. • Last division factor = 1e4. [0019] The loss function used was CrossEntropyLoss, whose behavior was adjusted so that unlabeled areas of the slide do not contribute to training.
[0020] В процессе обучения основные метрики, по которым отслеживались результаты были Accuracy[5] и Cohen’s kappa [6]. По метрике Accuracy отслеживается, как хорошо ИНС предсказывает тот или иной класс, а по Cohen's kappa отслеживается согласованность предсказания метки и контура ИНС с меткой и контуром врача. [0020] During the learning process, the main metrics by which results were tracked were Accuracy[5] and Cohen's kappa[6]. The Accuracy metric tracks how well the ANN predicts a particular class, and Cohen's kappa tracks the consistency of ANN label and contour prediction with the doctor's label and contour.
[0021] Сохранение результатов обучения происходит по показателю метрики Cohen's kappa. Сохраняются три лучших результата, которая выдаёт ИНС. Сохраняются веса модели, которые выдали максимальные показатели по метрике Cohen’s kappa. На этих трех сохранённых моделях происходит повторная валидация, но уже на валидационном и тестовых наборах данных, то есть на тех слайдах, на которых не училась ИНС. В итоге мы считаем следующую матрицу ошибок. [0021] The retention of learning outcomes occurs in terms of Cohen's kappa metric. The three best results that the ANN produces are stored. The weights of the model that produced the highest scores on Cohen's kappa metric are saved. On these three saved models, re-validation takes place, but already on the validation and test data sets, that is, on those slides on which the ANN was not learned. As a result, we calculate the following error matrix.
[0022] Cohen’s kappa =0,813 [0022] Cohen's kappa = 0.813
[0023] Cohen’s kappa - метрика, которая указывает согласованность мнений двух экспертов, в нашем случае это метки, которые отметили врачи и метки, которые предсказала ИНС. Её корректнее использовать для несбалансированных наборов данных, таких как в данном решении, так как она более устойчива к несбалансированности классов, чем метрика Accuracy. [0023] Cohen's kappa is a metric that indicates the consistency of the opinions of two experts, in our case these are the labels that the doctors noted and the labels that the ANN predicted. It is more correct to use it for unbalanced datasets, such as in this solution, since it is more resistant to class imbalance than the Accuracy metric.
[0024] Объяснение таблицы с метриками показано ниже и на Фиг. 5: [0024] An explanation of the metrics table is shown below and in FIG. 5:
[0025] В левой колонке указано в скобках общее количество контуров для каждого из исследуемых классов. Сверху указаны классы, которые предсказывает ИНС. Далее в примерах рассматривается левая верхняя ячейка. [0025] The left column indicates in brackets the total number of contours for each of the studied classes. Above are the classes that ANN predicts. The following examples consider the upper left cell.
[0026] В каждой ячейке имеется 5 значений (перечисляются сверху вниз): [0026] Each cell has 5 values (listed from top to bottom):
• Доля контуров класса-строки, которые были классифицированы как класс-столбец. Для каждого контура берутся только те классы, которые занимают больше 10% от его площади, и среди них берётся доминирующий. Сумма таких значений по строкам всегда меньше или равна 1; • Percentage of row-class contours that were classified as a column-class. For each contour, only those classes are taken that occupy more than 10% of its area, and the dominant one is taken among them. The sum of such values across rows is always less than or equal to 1;
• Абсолютное количество таких контуров; • Абсолютное количество контуров, которые перешагнули порог по классифицированным пикселям в 10% от площади контура (без учёта доминирующий это класс или нет); • The absolute number of such circuits; • The absolute number of contours that crossed the threshold for classified pixels in 10% of the contour area (regardless of whether this class is dominant or not);
• Абсолютное количество контуров, у которых хотя бы один пиксель классифицирован как принадлежащий к данному классу; • The absolute number of contours with at least one pixel classified as belonging to this class;
• Доля таких пикселей по отношению к суммарной площади контуров данного класса. • The proportion of such pixels in relation to the total area of contours of the given class.
[0027] Метки расположены так, что на диагонали находятся верные попадания, а в остальных ячейках промахи. [0027] The labels are arranged so that there are correct hits on the diagonal, and misses in the remaining cells.
[0028] Созданное техническое решение может быть практически реализовано с помощью вычислительного устройства. Пользователь (врач) может открыть решение по ссылке на своем ПК, далее регистрируется в ЛК решения, далее может загрузить оцифрованные слайды (гистологические снимки) из любой папки ПК и получить результат от решения в виде сформированного заключения с постановкой диагноза. [0028] The created technical solution can be practically implemented using a computing device. The user (doctor) can open the solution via the link on his PC, then registers in the LC of the solution, then he can upload digitized slides (histological images) from any folder on the PC and get the result from the solution in the form of a formed conclusion with a diagnosis.
[0029] Сведения, подтверждающие возможность реализации назначения и достижение технического результата - проведенное внутреннее тестирование продукта с помощью команды врачей. [0029] Information confirming the possibility of implementing the appointment and achieving a technical result - internal testing of the product with the help of a team of doctors.
[0030] Ссылаясь на Фиг. 4, данное техническое решение может быть реализовано в виде вычислительной системы 400 осуществления проведения диагностики патологий на основе технологии искусственного интеллекта, которая содержит один или более из следующих компонентов: [0030] Referring to FIG. 4, this technical solution can be implemented as a computer system 400 for performing pathology diagnostics based on artificial intelligence technology, which contains one or more of the following components:
• компонент 401 обработки, содержащий по меньшей мере один процессор 402, • a processing component 401 comprising at least one processor 402,
• память 403, • memory 403,
• компонент 405 мультимедиа, • multimedia component 405,
• компонент 406 аудио, • audio component 406,
• интерфейс 407 ввода / вывода (I / О), • interface 407 input / output (I / O),
• сенсорный компонент 408, • sensor component 408,
• компонент 409 передачи данных. • component 409 data.
[0031] Компонент 401 обработки в основном управляет всеми операциями системы 400, например, осуществляет обработку данных о пользователе или его запросе на поиск патологии, а также управляет дисплеем, телефонным звонком, передачей данных, работой камеры и операцией записи мобильного устройства связи. Компонент 401 обработки может включать в себя один или более процессоров 402, реализующих инструкции для завершения всех или части шагов из указанных выше способов. Кроме того, компонент 401 обработки может включать в себя один или более модулей для удобного процесса взаимодействия между другими модулями 401 обработки и другими модулями. Например, компонент 401 обработки может включать в себя мультимедийный модуль для удобного облегченного взаимодействия между компонентом 405 мультимедиа и компонентом 401 обработки. [0031] The processing component 401 mainly manages all operations of the system 400, such as processing user data or a pathology search request, and managing display, phone call, data transmission, camera operation, and operation mobile communication device records. Processing component 401 may include one or more processors 402 executing instructions for completing all or part of the steps from the above methods. In addition, the processing component 401 may include one or more modules for convenient interaction between other processing modules 401 and other modules. For example, the processing component 401 may include a multimedia module for convenient, lightweight interaction between the multimedia component 405 and the processing component 401.
[0032] Память 403 выполнена с возможностью хранения различных типов данных для поддержки работы системы 400, например, базу данных с профилями пользователей. Примеры таких данных включают в себя инструкции из любого приложения или способа, контактные данные, данные адресной книги, сообщения, изображения, видео, и т. д., и все они работают на системе 400. Память 403 может быть реализована в виде любого типа энергозависимого запоминающего устройства, энергонезависимого запоминающего устройства или их комбинации, например, статического оперативного запоминающего устройства (СОЗУ), Электрически- Стираемого Программируемого постоянного запоминающего устройства (ЭСППЗУ), Стираемого Программируемого постоянного запоминающего устройства (СППЗУ), Программируемого постоянного запоминающего устройства (ППЗУ), постоянного запоминающего устройства (ПЗУ), магнитной памяти, флэш-памяти, магнитного диска или оптического диска и другого, не ограничиваясь. [0032] The memory 403 is configured to store various types of data to support the operation of the system 400, such as a user profile database. Examples of such data include instructions from any application or method, contact data, address book data, messages, images, videos, etc., all of which run on system 400. Memory 403 may be implemented as any type of volatile memory, non-volatile memory, or a combination thereof, e.g., static random access memory (SRAM), Electrically Erasable Programmable Read Only Memory (EEPROM), Erasable Programmable Read Only Memory (EPROM), Programmable Read Only Memory (PROM), Read Only Memory device (ROM), magnetic memory, flash memory, magnetic disk or optical disk, and others, without being limited.
[0033] Компонент 405 мультимедиа включает в себя экран, обеспечивающий выходной интерфейс между системой 400, которая может быть установлена на мобильном устройстве связи пользователя и пользователем. В некоторых вариантах реализации, экран может быть жидкокристаллическим дисплеем (ЖКД) или сенсорной панелью (СП). Если экран включает в себя сенсорную панель, экран может быть реализован в виде сенсорного экрана для приема входного сигнала от пользователя. Сенсорная панель включает один или более сенсорных датчиков в смысле жестов, прикосновения и скольжения по сенсорной панели. Сенсорный датчик может не только чувствовать границу прикосновения субъекта или жест перелистывания, но и определять длительность времени и давления, связанных с режимом работы на прикосновение и скольжение. В некоторых вариантах осуществления компонент 405 мультимедиа включает одну фронтальную камеру и/или одну заднюю камеру. Когда система 400 находится в режиме работы, например, режиме съемки или режиме видео, фронтальная камера и/или задняя камера могут получать данные мультимедиа извне. Каждая фронтальная камера и задняя камера может быть одной фиксированной оптической системой объектива или может иметь фокусное расстояние или оптический зум. [0033] The media component 405 includes a screen that provides an output interface between the system 400, which may be installed on the user's mobile communications device, and the user. In some implementations, the screen may be a liquid crystal display (LCD) or a touch panel (TP). If the screen includes a touch panel, the screen may be implemented as a touch screen to receive input from a user. The touchpad includes one or more touch sensors in terms of gestures, touching and sliding on the touchpad. The touch sensor can not only sense the subject's touch boundary or swipe gesture, but also to determine the duration of time and pressure associated with the operation mode of touch and slide. In some embodiments, media component 405 includes one front camera and/or one rear camera. When the system 400 is in an operating mode, such as shooting mode or video mode, the front camera and/or rear camera can receive media data from outside. Each front camera and rear camera can be one fixed lens optics system or can have focal length or optical zoom.
[0034] Компонент 406 аудио выполнен с возможностью выходного и/или входного аудио сигнала. Например, компонент 406 аудио включает один микрофон (MIC), который выполнен с возможностью получать внешний аудио сигнал, когда система 400 находится в режиме работы, например, режиме вызова, режима записи и режима распознавания речи. Полученный аудио сигнал может быть далее сохранен в памяти 403 или направлен по компоненту 409 передачи данных. В некоторых вариантах осуществления компонент 406 аудио также включает в себя один динамик, выполненный с возможностью вывода аудио сигнала. [0034] The audio component 406 is configured to output and/or input an audio signal. For example, the audio component 406 includes one microphone (MIC) that is configured to receive an external audio signal when the system 400 is in an operating mode, such as a call mode, a recording mode, and a speech recognition mode. The received audio signal may be further stored in the memory 403 or routed through the communication component 409 . In some embodiments, the audio component 406 also includes a single speaker configured to output an audio signal.
[0035] Интерфейс 407 ввода / вывода (I / О) обеспечивает интерфейс между компонентом 401 обработки и любым периферийным интерфейсным модулем. Вышеуказанным периферийным интерфейсным модулем может быть клавиатура, руль, кнопка, и т. д. Эти кнопки могут включать, но не ограничиваясь, кнопку запуска, кнопку регулировки громкости, начальную кнопку и кнопку блокировки. [0035] An input/output (I/O) interface 407 provides an interface between the processing component 401 and any peripheral interface module. The above peripheral interface module may be a keyboard, steering wheel, button, etc. These buttons may include, but are not limited to, a start button, a volume button, a home button, and a lock button.
[0036] Сенсорный компонент 408 содержит один или более сенсоров и выполнен с возможностью обеспечения различных аспектов оценки состояния системы 400. Например, сенсорный компонент 408 может обнаружить состояния вкл/выкл системы 400, относительное расположение компонентов, например, дисплея и кнопочной панели, одного компонента системы 400, наличие или отсутствие контакта между субъектом и системой 400, а также ориентацию или ускорение/замедление и изменение температуры системы 400. Сенсорный компонент 408 содержит бесконтактный датчик, выполненный с возможностью обнаружения присутствия объекта, находящегося поблизости, когда нет физического контакта. Сенсорный компонент 408 содержит оптический датчик (например, КМОП или ПЗС-датчик изображения) выполненный с возможностью использования в визуализации приложения. В некоторых вариантах сенсорный компонент 408 содержит датчик ускорения, датчик гироскопа, магнитный датчик, датчик давления или датчик температуры. [0037] Компонент 409 передачи данных выполнен с возможностью облегчения проводной или беспроводной связи между системой 400 и другими устройствами. Система 400 может получить доступ к беспроводной сети на основе стандарта связи, таких как WiFi, 2G, 3G, 5G, или их комбинации. В одном примерном варианте компонент 409 передачи данных получает широковещательный сигнал или трансляцию, связанную с ними информацию из внешней широковещательной системы управления через широковещательный канал. В одном варианте осуществления компонент 409 передачи данных содержит модуль коммуникации ближнего поля (NFC), чтобы облегчить ближнюю связь. Например, модуль NFC может быть основан на технологии радиочастотной идентификации (RFID), технологии ассоциации передачи данных в инфракрасном диапазоне (IrDA), сверхширокополосных (UWB) технологии, Bluetooth (ВТ) технологии и других технологиях. [0036] The touch component 408 includes one or more sensors and is configured to provide various aspects of assessing the state of system 400. system 400, the presence or absence of contact between a subject and system 400, as well as the orientation or acceleration/deceleration and temperature change of system 400. Sensor component 408 includes a proximity sensor configured to detect the presence of a nearby object when there is no physical contact. The sensor component 408 includes an optical sensor (eg, CMOS or CCD image sensor) configured for use in rendering an application. In some embodiments, the sensor component 408 includes an acceleration sensor, a gyroscope sensor, a magnetic sensor, a pressure sensor, or a temperature sensor. [0037] The communication component 409 is configured to facilitate wired or wireless communication between the system 400 and other devices. System 400 may access a wireless network based on a communication standard such as WiFi, 2G, 3G, 5G, or combinations thereof. In one exemplary embodiment, the communication component 409 receives a broadcast signal or broadcast related information from an external broadcast control system via a broadcast channel. In one embodiment, communication component 409 includes a Near Field Communication (NFC) module to facilitate near field communications. For example, the NFC module may be based on radio frequency identification (RFID) technology, infrared data association (IrDA) technology, ultra-wideband (UWB) technology, Bluetooth (BT) technology, and other technologies.
[0038] В примерном варианте осуществления система 400 может быть реализована посредством одной или более Специализированных Интегральных Схем (СИС), Цифрового Сигнального Процессора (ЦСП), Устройств Цифровой Обработки Сигнала (УЦОС), Программируемым Логическим Устройством (ПЛУ), логической микросхемой, программируемой в условиях эксплуатации (ППВМ), контроллера, микроконтроллера, микропроцессора или других электронных компонентов, и может быть сконфигурирован для реализации способа 500 осуществления проведения диагностики патологий на основе технологии искусственного интеллекта. [0038] In an exemplary embodiment, system 400 may be implemented by one or more Application-Specific Integrated Circuits (ASICs), a Digital Signal Processor (DSP), a Digital Signal Processor (DSP), a Programmable Logic Unit (PLU), a logic chip programmable in operating conditions (FPGA), controller, microcontroller, microprocessor or other electronic components, and can be configured to implement a method 500 for performing pathology diagnostics based on artificial intelligence technology.
[0039] В примерном варианте осуществления энергонезависимый машиночитаемый носитель содержит память 403, которая включает инструкции, где инструкции выполняются процессором 401 системы 400 для реализации описанных выше способов осуществления проведения диагностики патологий на основе технологии искусственного интеллекта. Например, энергонезависимым машиночитаемым носителем может быть ПЗУ, оперативное запоминающее устройство (ОЗУ), компакт-диск, магнитная лента, дискеты, оптические устройства хранения данных и тому подобное. [0039] In an exemplary embodiment, the non-volatile computer-readable medium includes a memory 403 that includes instructions, where the instructions are executed by the processor 401 of the system 400 to implement the above-described methods for performing pathology diagnosis based on artificial intelligence technology. For example, a non-volatile computer-readable medium can be ROM, random access memory (RAM), compact disk, magnetic tape, floppy disks, optical storage devices, and the like.
[0040] Вычислительная система 400 может включать в себя интерфейс дисплея, который передает графику, текст и другие данные из коммуникационной инфраструктуры (или из буфера кадра, не показан) для отображения на компоненте 405 мультимедиа. Вычислительная система 400 дополнительно включает в себя устройства ввода или периферийные устройства. Периферийные устройства могут включать в себя одно или несколько устройств для взаимодействия с мобильным устройством связи пользователя, такие как клавиатура, микрофон, носимое устройство, камера, один или более звуковых динамиков и другие датчики. Периферийные устройства могут быть внешними или внутренними по отношению к мобильному устройству связи пользователя. Сенсорный экран может отображать, как правило, графику и текст, а также предоставляет пользовательский интерфейс (например, но не ограничиваясь ими, графический пользовательский интерфейс (GUI)), через который субъект может взаимодействовать с мобильным устройством связи пользователя, например, получать доступ и взаимодействовать с приложениями, запущенными на устройстве. [0040] Computing system 400 may include a display interface that transmits graphics, text, and other data from a communications infrastructure (or framebuffer, not shown) for display on media component 405. Computing system 400 further includes input devices or peripherals. Peripheral devices may include one or more devices for interacting with a user's mobile communications device, such as a keyboard, microphone, wearable device, camera, one or more audio speakers, and other sensors. Peripherals may be external or internal to the user's mobile communications device. The touch screen can display typically graphics and text, and also provides a user interface (such as, but not limited to, a graphical user interface (GUI)) through which a subject can interact with the user's mobile communication device, such as accessing and interacting with with applications running on the device.
[0041] Элементы заявляемого технического решения находятся в функциональной взаимосвязи, а их совместное использование приводит к созданию нового и уникального технического решения. Таким образом, все блоки функционально связаны. [0041] The elements of the proposed technical solution are in a functional relationship, and their joint use leads to the creation of a new and unique technical solution. Thus, all blocks are functionally connected.
[0042] Все блоки, используемые в системе, могут быть реализованы с помощью электронных компонент, используемых для создания цифровых интегральных схем, что очевидно для специалиста в данном уровне техники. Не ограничиваюсь, могут использоваться микросхемы, логика работы которых определяется при изготовлении, или программируемые логические интегральные схемы (ПЛИС), логика работы которых задаётся посредством программирования. Для программирования используются программаторы и отладочные среды, позволяющие задать желаемую структуру цифрового устройства в виде принципиальной электрической схемы или программы на специальных языках описания аппаратуры: Verilog, VHDL, AHDL и др. Альтернативой ПЛИС могут быть программируемые логические контроллеры (ПЛК), базовые матричные кристаллы (БМК), требующие заводского производственного процесса для программирования; ASIC - специализированные заказные большие интегральные схемы (БИС), которые при мелкосерийном и единичном производстве существенно дороже. [0042] All blocks used in the system can be implemented using electronic components used to create digital integrated circuits, which is obvious to a person skilled in the art. Not limited to, microcircuits can be used, the logic of which is determined during manufacture, or programmable logic integrated circuits (FPGAs), the logic of which is set by programming. For programming, programmers and debugging environments are used, which allow you to set the desired structure of a digital device in the form of a fundamental electrical diagrams or programs in special hardware description languages: Verilog, VHDL, AHDL, etc. An alternative to FPGAs can be programmable logic controllers (PLCs), basic matrix crystals (BMCs), which require a factory production process for programming; ASIC - specialized custom-made large integrated circuits (LSI), which are significantly more expensive for small-scale and single-piece production.
[0043] Обычно, сама микросхема ПЛИС состоит из следующих компонент: [0043] Typically, the FPGA chip itself consists of the following components:
• конфигурируемых логических блоков, реализующих требуемую логическую функцию; • configurable logical blocks that implement the required logical function;
• программируемых электронных связей между конфигурируемыми логическими блоками; • programmable electronic links between configurable logic blocks;
• программируемых блоков ввода/вывода, обеспечивающих связь внешнего вывода микросхемы с внутренней логикой. • programmable input/output blocks that provide communication between the external output of the microcircuit and the internal logic.
[0044] Также блоки могут быть реализованы с помощью постоянных запоминающих устройств. [0044] Blocks can also be implemented using read-only memories.
[0045] Таким образом, реализация всех используемых блоков достигается стандартными средствами, базирующимися на классических принципах реализации основ вычислительной техники. [0045] Thus, the implementation of all used blocks is achieved by standard means based on the classical principles of implementing the fundamentals of computer technology.
[0046] Как будет понятно специалисту в данной области техники, аспекты настоящего технического решения могут быть выполнены в виде системы, способа или компьютерного программного продукта. Соответственно, различные аспекты настоящего технического решения могут быть реализованы исключительно как аппаратное обеспечение, как программное обеспечение (включая прикладное программное обеспечение и так далее) или как вариант осуществления, сочетающий в себе программные и аппаратные аспекты, которые в общем случае могут упоминаться как «модуль», «система» или «архитектура». Кроме того, аспекты настоящего технического решения могут принимать форму компьютерного программного продукта, реализованного на одном или нескольких машиночитаемых носителях, имеющих машиночитаемый программный код, который на них реализован. [0046] As will be appreciated by one of skill in the art, aspects of the present technical solution may be implemented as a system, method, or computer program product. Accordingly, various aspects of the present technical solution may be implemented solely as hardware, as software (including application software, etc.), or as an embodiment combining software and hardware aspects, which may be generally referred to as a "module" , "system" or "architecture". In addition, aspects of the present technical solution may take the form of a computer program product implemented on one or more computer-readable media having a computer-readable program code that is implemented on them.
[0047] Также может быть использована любая комбинация одного или нескольких машиночитаемых носителей. Машиночитаемый носитель хранилища может представлять собой, без ограничений, электронную, магнитную, оптическую, электромагнитную, инфракрасную или полупроводниковую систему, аппарат, устройство или любую подходящую их комбинацию. Конкретнее, примеры (неисчерпывающий список) машиночитаемого носителя хранилища включают в себя: электрическое соединение с помощью одного или нескольких проводов, портативную компьютерную дискету; жесткий диск, оперативную память (ОЗУ), постоянную память (ПЗУ), стираемую программируемую постоянную память (EPROM или Flash-память), оптоволоконное соединение, постоянную память на компакт-диске (CD-ROM), оптическое устройство хранения, магнитное устройство хранения или любую комбинацию вышеперечисленного. В контексте настоящего описания, машиночитаемый носитель хранилища может представлять собой любой гибкий носитель данных, который может содержать или хранить программу для использования самой системой, устройством, аппаратом или в соединении с ними. [0047] Any combination of one or more computer-readable media can also be used. The computer-readable storage medium can be, without limitation, an electronic, magnetic, optical, electromagnetic, infrared, or semiconductor system, apparatus, device, or any suitable combination thereof. More specifically, examples (non-exhaustive list) of a computer-readable storage medium include: an electrical connection using one or more wires, a portable computer diskette; hard disk, random access memory (RAM), read only memory (ROM), erasable programmable read only memory (EPROM or Flash memory), fiber optic connection, compact disc read only memory (CD-ROM), optical storage device, magnetic storage device or any combination of the above. As used herein, a computer-readable storage medium can be any flexible storage medium that can contain or store a program for use by or in connection with a system, device, apparatus.
[0048] Программный код, встроенный в машиночитаемый носитель, может быть передан с помощью любого носителя, включая, без ограничений, беспроводную, проводную, оптоволоконную, инфракрасную и любую другую подходящую сеть или комбинацию вышеперечисленного. [0048] Program code embedded in a computer-readable medium may be transmitted using any medium, including, without limitation, wireless, wired, fiber optic, infrared, and any other suitable network, or a combination of the foregoing.
[0049] Компьютерный программный код для выполнения операций для шагов настоящего технического решения может быть написан на любом языке программирования или комбинаций языков программирования, включая объектно-ориентированный язык программирования, например Python, R, Java, Smalltalk, C++ и так далее, и обычные процедурные языки программирования, например язык программирования «С» или аналогичные языки программирования. Программный код может выполняться на компьютере пользователя полностью, частично, или же как отдельный пакет программного обеспечения, частично на компьютере пользователя и частично на удаленном компьютере, или же полностью на удаленном компьютере. В последнем случае, удаленный компьютер может быть соединен с компьютером пользователя через сеть любого типа, включая локальную сеть (LAN), глобальную сеть (WAN) или соединение с внешним компьютером (например, через Интернет с помощью Интернет- провайдеров). [0049] The computer program code for performing the operations for the steps of the present technical solution may be written in any programming language or combinations of programming languages, including an object-oriented programming language such as Python, R, Java, Smalltalk, C++, and so on, and conventional procedural programming languages, such as the "C" programming language or similar programming languages. The program code may run on the user's computer in whole, in part, or as a separate software package, in part on the user's computer and in part on a remote computer, or in full on remote computer. In the latter case, the remote computer may be connected to the user's computer via any type of network, including a local area network (LAN), a wide area network (WAN), or a connection to an external computer (eg, via the Internet via ISPs).
[0050] Аспекты настоящего технического решения были описаны подробно со ссылкой на блок-схемы, принципиальные схемы и/или диаграммы способов, устройств (систем) и компьютерных программных продуктов в соответствии с вариантами осуществления настоящего технического решения. Следует иметь в виду, что каждый блок из блок-схемы и/или диаграмм, а также комбинации блоков из блок-схемы и/или диаграмм, могут быть реализованы компьютерными программными инструкциями. Эти компьютерные программные инструкции могут быть предоставлены процессору компьютера общего назначения, компьютера специального назначения или другому устройству обработки данных для создания процедуры, таким образом, чтобы инструкции, выполняемые процессором компьютера или другим программируемым устройством обработки данных, создавали средства для реализации функций/действий, указанных в блоке или блоках блок-схемы и/или диаграммы. [0050] Aspects of the present technical solution have been described in detail with reference to block diagrams, circuit diagrams and/or diagrams of methods, devices (systems), and computer program products in accordance with embodiments of the present technical solution. It should be appreciated that each block from the block diagram and/or diagrams, as well as combinations of blocks from the block diagram and/or diagrams, may be implemented by computer program instructions. These computer program instructions may be provided to the processor of a general purpose computer, a special purpose computer, or other data processing device to create a procedure, such that the instructions executed by the computer processor or other programmable data processing device create the means to implement the functions/actions specified in block or blocks of a flowchart and/or diagram.
[0051] Эти компьютерные программные инструкции также могут храниться на машиночитаемом носителе, который может управлять компьютером, отличным от программируемого устройства обработки данных или отличным от устройств, которые функционируют конкретным образом, таким образом, что инструкции, хранящиеся на машиночитаемом носителе, создают устройство, включающее инструкции, которые осуществляют функции/действия, указанные в блоке блок-схемы и/или диаграммы. [0051] These computer program instructions may also be stored on a computer-readable medium that can control a computer other than a programmable data processing device or other than devices that operate in a particular manner such that the instructions stored on the computer-readable medium create a device including instructions that perform the functions/actions indicated in the block diagram and/or diagram.
ИСПОЛЬЗУЕМЫЕ ИСТОЧНИКИ ИНФОРМАЦИИ SOURCES OF INFORMATION USED
1. URL:htps://pytorch.org/docs/stable/torchvision/models.html?highlight=resne fflorchvision. models. resnet34 , дата обращения: 25.12.2021. 1. URL: htps://pytorch.org/docs/stable/torchvision/models.html?highlight=resne fflorchvision. models. resnet34, accessed 12/25/2021.
2. Ronneberger О., Fischer R, Brox T. U-net: Convolutional networks for biomedical image segmentation //International Conference on Medical image computing and computer-assisted intervention. - Springer, Cham, 2015. - C. 234-241. 2. Ronneberger O., Fischer R, Brox T. U-net: Convolutional networks for biomedical image segmentation // International Conference on Medical image computing and computer-assisted intervention. - Springer, Cham, 2015. - C. 234-241.
3. Wang X. et al. Skipnet: Learning dynamic routing in convolutional networks //Proceedings of the European Conference on Computer Vision (ECCV). - 2018. - C. 409-424. 3. Wang X. et al. Skipnet: Learning dynamic routing in convolutional networks // Proceedings of the European Conference on Computer Vision (ECCV). - 2018. - C. 409-424.
4. Liu L. et al. On the variance of the adaptive learning rate and beyond //arXiv preprint arXiv: 1908.03265. - 2019. 4. Liu L. et al. On the variance of the adaptive learning rate and beyond //arXiv preprint arXiv: 1908.03265. - 2019.
5. URL: https://en.wikipedia.org/wiki/Accuracy_and_precision , дата обращения: 25.12.2021. 6. URL: https://en.wikipedia.org/wiki/Cohen%27s_kappa, дата обращения: 5. URL: https://en.wikipedia.org/wiki/Accuracy_and_precision , accessed 12/25/2021. 6. URL: https://en.wikipedia.org/wiki/Cohen%27s_kappa, accessed:
25.12.2021. 12/25/2021.

Claims

ФОРМУЛА FORMULA
1. Способ проведения диагностики патологий на основе технологии искусственного интеллекта, выполняемый по меньшей мере одним вычислительным устройством и включающий следующие шаги: 1. A method for diagnosing pathologies based on artificial intelligence technology, which is performed by at least one computing device and includes the following steps:
• получают по меньшей мере одно изображение биоптата; • receive at least one image of the biopsy;
• осуществляют поиск областей, содержащих ткань, а также кластеризацию областей в более крупные объекты; • search for areas containing tissue, as well as clustering areas into larger objects;
• считывают патчи в большом разрешении; • read patches in high resolution;
• пропускают полученные на предыдущем шаги патчи через сегментирующую искусственную нейронную сеть (ИНС) для получения многоканальной маски с классами патологий; • the patches obtained in the previous step are passed through a segmenting artificial neural network (ANN) to obtain a multi-channel mask with pathology classes;
• осуществляют векторизацию маски с классами патологий для представления в виде полигонов; • vectorization of the mask with pathology classes for representation in the form of polygons;
• группируют полигоны по биоптатам, из которых они извлечены для получения предварительного диагноза по каждому из биоптатов; • group polygons according to the biopsy specimens from which they are extracted to obtain a preliminary diagnosis for each of the biopsy specimens;
• определяют для каждого биоптата суммарную площадь поражения, длину поражения, тип патологии и сумму Глисона. • determine for each biopsy the total area of the lesion, the length of the lesion, the type of pathology and the Gleason sum.
2. Способ по п. 1, характеризующийся тем, что патчи считываются с перекрытием для уменьшения артефактов предсказания в связи с краевыми эффектами. 2. The method of claim. 1, characterized in that the patches are read with overlap to reduce prediction artifacts due to edge effects.
3. Способ по п. 1, характеризующийся тем, что многоканальная маска имеет количество каналов, равное количеству детектируемых патологий. 3. The method according to claim 1, characterized in that the multi-channel mask has the number of channels equal to the number of detected pathologies.
4. Способ по п. 1, характеризующийся тем, что поиск областей, содержащих ткань осуществляется на слайде более низкого разрешения. 4. The method according to claim 1, characterized in that the search for areas containing tissue is carried out on a lower resolution slide.
5. Способ по п. 1, характеризующийся тем, что осуществляют векторизацию посредством представления в виде координат для каждого класса. 5. The method according to claim 1, characterized in that vectorization is carried out by representing in the form of coordinates for each class.
6. Способ по п. 1, характеризующийся тем, что при осуществлении векторизации для каждого класса происходит поиск контуров патологий. 6. The method according to p. 1, characterized in that when performing vectorization for each class, the contours of pathologies are searched.
7. Способ по п. 6, характеризующийся тем, что поиск осуществляется средствами библиотеки OpenCV. 7. The method according to claim 6, characterized in that the search is carried out using the OpenCV library.
8. Способ по п. 1, характеризующийся тем, что объединяют полигоны, полученные из соседних патчей, для устранения стыков между ними на итоговой визуализации. 8. The method according to claim 1, characterized in that the polygons obtained from neighboring patches are combined to eliminate joints between them in the final visualization.
9. Способ по п. 1, характеризующийся тем, что ИНС модифицируется в эн кодер. 9. The method according to p. 1, characterized in that the ANN is modified into an encoder.
10. Система проведения диагностики патологий на основе технологии искусственного интеллекта, имеющая микросервисную архитектуру и содержащая по меньшей мере, модуль для просмотра изображения с патологией, выполненный с возможностью редактирования разметки полученного изображения с патологией, соединенный с, по меньшей мере, одним процессором и, по меньшей мере, одним запоминающим устройством, причем упомянутое запоминающее устройство содержит машиночитаемые команды, которые при их исполнении, по меньшей мере, одним процессором реализуют этапы способа по пп. 1-9. 10. A system for diagnosing pathologies based on artificial intelligence technology, having a microservice architecture and containing at least a module for viewing an image with pathology, configured to edit the markup of the received image with pathology, connected to at least one processor and, by at least one storage device, and said storage device contains machine-readable instructions that, when executed by at least one processor, implement the steps of the method according to paragraphs. 1-9.
PCT/RU2021/000146 2021-04-06 2021-04-06 Artificial intelligence-based diagnosis of pathologies WO2022216173A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2021109483 2021-04-06
RU2021109483A RU2757256C1 (en) 2021-04-06 2021-04-06 Method and system for diagnosing pathological changes in prostate biopsy specimen

Publications (1)

Publication Number Publication Date
WO2022216173A1 true WO2022216173A1 (en) 2022-10-13

Family

ID=78286386

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2021/000146 WO2022216173A1 (en) 2021-04-06 2021-04-06 Artificial intelligence-based diagnosis of pathologies

Country Status (2)

Country Link
RU (1) RU2757256C1 (en)
WO (1) WO2022216173A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170293717A1 (en) * 2016-04-08 2017-10-12 Bingsheng Technology (Wuhan) Co., Ltd. System and method for remote pathology consultation data transfer and storage
CN110287966A (en) * 2019-06-26 2019-09-27 上海昌岛医疗科技有限公司 A method of the image procossing about glomerulus segmentation
US20200364587A1 (en) * 2019-05-16 2020-11-19 PAIGE.AI, Inc. Systems and methods for processing images to classify the processed images for digital pathology

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016149468A1 (en) * 2015-03-18 2016-09-22 Proscia Inc. Computing technologies for image operations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170293717A1 (en) * 2016-04-08 2017-10-12 Bingsheng Technology (Wuhan) Co., Ltd. System and method for remote pathology consultation data transfer and storage
US20200364587A1 (en) * 2019-05-16 2020-11-19 PAIGE.AI, Inc. Systems and methods for processing images to classify the processed images for digital pathology
CN110287966A (en) * 2019-06-26 2019-09-27 上海昌岛医疗科技有限公司 A method of the image procossing about glomerulus segmentation

Also Published As

Publication number Publication date
RU2757256C1 (en) 2021-10-12

Similar Documents

Publication Publication Date Title
Cai et al. A review of the application of deep learning in medical image classification and segmentation
Zeng et al. Identification of glomerular lesions and intrinsic glomerular cell types in kidney diseases via deep learning
US11908188B2 (en) Image analysis method, microscope video stream processing method, and related apparatus
Fraz et al. FABnet: feature attention-based network for simultaneous segmentation of microvessels and nerves in routine histology images of oral cancer
CN113474811A (en) Neural network-based identification of regions of interest in digital pathology images
Duggento et al. Deep computational pathology in breast cancer
Haj-Hassan et al. Classifications of multispectral colorectal cancer tissues using convolution neural network
Yoon et al. Tumor identification in colorectal histology images using a convolutional neural network
Stalin David et al. A new expert system based on hybrid colour and structure descriptor and machine learning algorithms for early glaucoma diagnosis
Sharma et al. Artificial intelligence in endoscopy
Ørting et al. A survey of crowdsourcing in medical image analysis
Jia et al. Detection of cervical cancer cells in complex situation based on improved YOLOv3 network
Khattar et al. Computer assisted diagnosis of skin cancer: a survey and future recommendations
Bozkurt et al. Skin strata delineation in reflectance confocal microscopy images using recurrent convolutional networks with attention
Matton et al. Analysis of cataract surgery instrument identification performance of convolutional and recurrent neural network ensembles leveraging BigCat
Bao et al. Orbital and eyelid diseases: The next breakthrough in artificial intelligence?
CN115867936A (en) System and method for processing electronic images to produce a histological visualization
Kusta et al. Lost in digitization–A systematic review about the diagnostic test accuracy of digital pathology solutions
Ding et al. Automatic identification of benign pigmented skin lesions from clinical images using deep convolutional neural network
RU2757256C1 (en) Method and system for diagnosing pathological changes in prostate biopsy specimen
Mahmud et al. Non-invasive detection of anemia using lip mucosa images transfer learning convolutional neural networks
US20220375077A1 (en) Method for generating models to automatically classify medical or veterinary images derived from original images into at least one class of interest
Rezazadeh et al. Multi-task learning for gland segmentation
Manan et al. Semantic segmentation of retinal exudates using a residual encoder–decoder architecture in diabetic retinopathy
Monroy et al. Automated chronic wounds medical assessment and tracking framework based on deep learning

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21936174

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21936174

Country of ref document: EP

Kind code of ref document: A1