WO2021128851A1 - 基于数字切片的图片分类方法、装置和计算机设备 - Google Patents

基于数字切片的图片分类方法、装置和计算机设备 Download PDF

Info

Publication number
WO2021128851A1
WO2021128851A1 PCT/CN2020/106079 CN2020106079W WO2021128851A1 WO 2021128851 A1 WO2021128851 A1 WO 2021128851A1 CN 2020106079 W CN2020106079 W CN 2020106079W WO 2021128851 A1 WO2021128851 A1 WO 2021128851A1
Authority
WO
WIPO (PCT)
Prior art keywords
picture
vector
value
preset
digital
Prior art date
Application number
PCT/CN2020/106079
Other languages
English (en)
French (fr)
Inventor
叶春毅
朱军明
叶雪辉
Original Assignee
平安国际智慧城市科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安国际智慧城市科技股份有限公司 filed Critical 平安国际智慧城市科技股份有限公司
Publication of WO2021128851A1 publication Critical patent/WO2021128851A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification

Definitions

  • This application relates to the field of medical informatization in digital medicine, and in particular to a method, device, computer equipment and storage medium for image classification based on digital slices.
  • Liquid-based thin-layer cell detection is one of the current common detection methods.
  • Digital pictures can be obtained through liquid-based thin-layer cell detection.
  • the digital pictures contain a lot of useful information.
  • the digital pictures are classified and stored.
  • the inventor realizes that the current classification of digital pictures obtained by liquid-based thin-layer cell detection requires professionals to perform accurate classification (this is because the large amount of information in digital pictures cannot be understood by non-professionals). Therefore, the traditional method for the above The accuracy of the digital picture division scheme cannot be guaranteed, the controllability of the classification is poor, and the consistency is low. Therefore, the traditional technology lacks a method for accurately and efficiently classifying the above-mentioned digital pictures.
  • the main purpose of this application is to provide a digital slice-based image classification method, device, computer equipment, and storage medium, aiming to achieve accurate image classification.
  • this application proposes a digital slice-based image classification method, which includes the following steps:
  • the picture vector generator in the preset digital picture classification model is used to perform operations on the digital picture to obtain the first designated vector A encoded by the first encoder in the picture vector generator, wherein the The picture vector generator is composed of a first encoder, a first decoder, and a second encoder that are sequentially connected; wherein the digital picture classification model is trained using specified sample data;
  • the digital slice is determined to be a preset classification picture.
  • This application provides a picture classification device based on digital slices, including:
  • the digital slice acquisition unit is configured to acquire a digital slice, which is obtained by scanning a liquid-based thin-layer cell sample with a preset micro-scanner;
  • a preprocessing unit configured to preprocess the digital slice using a preset preprocessing method to obtain a digital picture
  • the first designated vector A generating unit is configured to use the picture vector generator in the preset digital picture classification model to perform operations on the digital picture, so as to obtain the picture vector generator for encoding by the first encoder
  • the first designated vector A of the picture vector generator is composed of a first encoder, a first decoder, and a second encoder connected in sequence; wherein the digital picture classification model is trained using designated sample data ;
  • a decoded picture generating unit configured to use the first decoder to perform decoding processing on the first designated vector A, so as to obtain a decoded picture output by the first decoder;
  • a second designated vector B generating unit configured to use the second encoder to perform encoding processing on the decoded picture, so as to obtain a second designated vector B output by the second encoder;
  • the similarity value judgment unit is configured to use a preset similarity degree calculation method to calculate the similarity value between the first designated vector A and the second designated vector B, and determine whether the similarity value is greater than the predetermined value.
  • Set similarity threshold
  • the picture classification unit is configured to determine the digital slice as a preset classification picture if the similarity value is greater than a preset similarity threshold.
  • the present application provides a computer device, including a memory and a processor, the memory stores a computer program, and the processor implements a digital slice-based image classification method when the computer program is executed.
  • the digital slice-based image classification method includes: acquiring a digital slice, which is obtained by scanning a liquid-based thin-layer cell sample with a preset micro-scanner; and preprocessing the digital slice using a preset preprocessing method to obtain a digital slice.
  • the picture vector generator in the preset digital picture classification model is used to perform operations on the digital picture to obtain the first designated vector A encoded by the first encoder in the picture vector generator, where
  • the picture vector generator is composed of a first encoder, a first decoder, and a second encoder that are sequentially connected; wherein the digital picture classification model is trained using specified sample data; and the first decoder is used
  • the decoder performs decoding processing on the first designated vector A to obtain the decoded picture output by the first decoder; and uses the second encoder to perform encoding processing on the decoded picture to obtain the The second designated vector B output by the second encoder; using a preset similarity degree calculation method, calculate the similarity value between the first designated vector A and the second designated vector B, and determine the degree of similarity Whether the value is greater than a preset similarity threshold; if the similarity value is greater than the preset similarity threshold, the digital slice is determined to be a preset classification picture.
  • the present application provides a computer-readable storage medium on which a computer program is stored.
  • a digital slice-based image classification method is implemented.
  • the digital slice-based image classification method includes: obtaining a digital slice , The digital slice is obtained by scanning a liquid-based thin-layer cell sample using a preset microscanner; the digital slice is preprocessed by a preset preprocessing method to obtain a digital picture;
  • the picture vector generator in the digital picture classification model of the digital picture performs operations on the digital picture to obtain a first designated vector A encoded by the first encoder in the picture vector generator, wherein the picture vector generates
  • the device is composed of a first encoder, a first decoder, and a second encoder that are sequentially connected; wherein the digital picture classification model is trained using specified sample data; the first decoder is used to perform the A designated vector A is decoded to obtain the decoded picture output by the first decoder; the second encoder is used to encode the decoded picture to obtain the output
  • FIG. 1 is a schematic flowchart of a digital slice-based image classification method according to an embodiment of this application
  • FIG. 2 is a schematic block diagram of the structure of a digital slice-based image classification device according to an embodiment of the application
  • FIG. 3 is a schematic block diagram of the structure of a computer device according to an embodiment of the application.
  • an embodiment of the present application provides a digital slice-based image classification method, including the following steps:
  • the picture vector generator in the preset digital picture classification model to perform operations on the digital picture, so as to obtain the first designated vector A encoded by the first encoder in the picture vector generator, where
  • the picture vector generator is composed of a first encoder, a first decoder, and a second encoder that are sequentially connected; wherein the digital picture classification model is trained using specified sample data;
  • a digital slice is obtained, and the digital slice is obtained by scanning a liquid-based thin-layer cell sample using a preset micro-scanner.
  • the liquid-based thin-layer cell sample can exist in any form suitable for being scanned, for example, made into a physical section.
  • the liquid-based thin-layer cell sample may be any type of sample, for example, a sample of a patient with cervical cancer.
  • the digital slice is preprocessed by using a preset preprocessing method to obtain a digital picture. Since digital slices are obtained by direct scanning of liquid-based thin-layer cell samples, although they retain complete information, processing directly as a subsequent step will increase the burden of calculation. Therefore, this application also preprocesses the digital slice.
  • the preprocessing method is, for example, to obtain the value R of the red color channel, the value G of the green color channel, and the value G of the blue color channel in the RGB color model of the pixels in the digital slice.
  • the picture vector generator in the preset digital picture classification model is used to perform operations on the digital picture, so as to obtain the first code encoded by the first encoder in the picture vector generator.
  • the designated vector A wherein the picture vector generator is composed of a first encoder, a first decoder, and a second encoder connected in sequence; wherein the digital picture classification model is trained using designated sample data.
  • This application uses a special digital picture classification model for picture classification, where the digital picture classification model at least includes a picture vector generator, and the picture vector generator consists of a first encoder, a first decoder, and a second encoder that are connected in sequence. And constitute.
  • the specified sample data only includes digital pictures that have been diagnosed, so the first encoder can only fully identify digital pictures of the diagnosed patients, and perform operations on pictures other than the digital pictures that have been diagnosed.
  • Information is inevitably lost during recognition, causing the first designated vector A generated by the first encoder to be different or dissimilar to the second designated vector B generated by the second encoder, and the diagnosed digital picture is just the opposite (first The first designated vector A generated by the encoder is the same or similar to the second designated vector B generated by the second encoder), and the classification is implemented accordingly. And since only confirmed digital pictures are used during training, the training speed is faster.
  • the classification model may adopt any structure, for example, a network structure based on a deep convolutional confrontation generation network.
  • the first encoder may have any structure, for example, a convolutional network composed of multiple convolutional layers, and the final output of the convolutional network is the first designated vector.
  • the first decoder is used to perform decoding processing on the first designated vector A, so as to obtain the decoded picture output by the first decoder.
  • the first decoder may be a decoder of any structure, but can decode the first designated vector A, for example, a structure including multiple convolutional layers and deconvolutional layers. Since the first decoder is based on the decoding process of the first designated vector A, and the first designated vector A is extracted from the digital picture, if the information loss in the extraction process is too much, the decoded picture will be different from the data picture. Big. If the digital picture is a digital picture of the patient, there will be no information loss, so the decoded picture is similar to the data picture.
  • the second encoder is used to perform encoding processing on the decoded picture, so as to obtain the second designated vector B output by the second encoder.
  • the second encoder is, for example, a convolutional network composed of multiple convolutional layers, and its final output is a second designated vector.
  • the second encoder has the same structure as the first encoder or different from the first encoder, but can encode the decoded picture.
  • the similarity calculation method can be any algorithm, for example: According to the formula: The similarity value Sim between the first designated vector A and the second designated vector B is calculated, where Ai is the value of the i-th component of the first designated vector A, and Bi is the second designated vector A The value of the i-th component vector of the vector B.
  • the first designated vector A and the second designated vector B each include n component vectors.
  • the digital slice is determined to be a preset classification picture.
  • the digital slice corresponds to the preset classification picture, for example, when the digital slice is a digital slice of a cervical cancer patient, the preset classification picture is a cervical cancer classification picture.
  • the similarity value is greater than the preset similarity threshold, it indicates that almost no information is lost during the entire data processing process of the first encoder, decoder, and second encoder, so the digital slice is the preset classification Picture (so if it is a picture other than the preset classified picture, information will be lost during recognition, resulting in the similarity value not greater than the preset similarity threshold).
  • the liquid-based thin-layer cell sample undergoes at least two staining treatments before scanning, and the step S2 of preprocessing the digital slice by using a preset preprocessing method includes:
  • F1 MIN ⁇ ROUND[(a1R+a2G+a3B)/H,0],P1 ⁇ , obtain the reference value F1, where MIN is the minimum value function, ROUND is the rounding function, a1, a2, a3 are all Is a positive number greater than 0 and less than H, H is an integer greater than 0, and P1 is the first threshold parameter with a preset value within the range (0,255);
  • the digital slice is preprocessed by using a preset preprocessing method.
  • the liquid-based thin-layer cell sample undergoes at least two staining treatments before scanning, so that the liquid-based thin-layer cell sample is stained with at least three colors (primary color, the first staining makes part of the structure or The substance is dyed in the first color, and the second dyeing causes part of the structure or substance in the sample to be dyed in the second color).
  • this application also sets different pixels to (0, 0, 0), preset values or (E, E, E), where E is greater than 0 and less than 255, so The preset value is, for example, (255,255,255).
  • the RGB color of the pixel is set to (0, 0, 0).
  • the RGB color of the pixel is set to (E, E, E). In this way, the digital slices are completely three-color, which makes the contrast more obvious, and it is easier to reduce the calculation amount and improve the processing efficiency.
  • the digital picture classification model further includes a first discriminator, the first discriminator is used to discriminate whether the digital picture and the decoded picture are the same, and the picture vector generator and the The first discriminator is jointly trained with the same data, and the picture vector generator in the preset digital picture classification model is used to perform operations on the digital pictures to obtain the first encoder in the picture vector generator.
  • the first designated vector A is encoded, wherein the picture vector generator is composed of a first encoder, a first decoder, and a second encoder connected in sequence; wherein the digital picture classification model uses designated sample data Before step S3 of training, it includes:
  • the digital picture classification model further includes a first discriminator, and the first discriminator is used to discriminate whether the digital picture and the decoded picture are the same.
  • the first discriminator can have any structure, for example, a deep convolutional network composed of a series of convolutional layers and pooling layers. The first discriminator only functions in the training process to assist in optimizing parameters, and in the process of classifying the digital picture classification model, only the picture vector generator is used, thereby improving the speed of classification processing. And because the common training is adopted, the discriminator and the vector generator are more adaptable and robust.
  • the threshold value indicates that the current digital picture classification model can correctly classify the designated sample pictures, so the parameters of the digital picture classification model are kept unchanged, and the designated sample pictures are deleted from the training sample set.
  • the step S22 of calculating the first picture similarity value between the designated sample picture and the intermediate picture includes:
  • the proportion of the same pixels the number of the same pixels/the number of all the pixels in the specified sample picture, so as to obtain the proportion of the same pixels;
  • the calculation of the first picture similarity value between the digital picture and the intermediate picture is realized.
  • the first encoder and the second encoder each include a plurality of convolutional layers
  • the digital picture classification model further includes a second discriminator
  • the second encoder pair Before step S5 of performing encoding processing on the decoded picture to obtain the second designated vector B output by the second encoder, the method includes:
  • the structure of the first encoder and the second encoder may be the same or different, but both include multiple convolutional layers, and preferably have the same convolutional layer.
  • the second discriminator is signally connected to the first encoder and the second encoder, so as to obtain a first encoded convolutional image from the first encoder, and a second encoder from the second encoder.
  • the coded convolutional image is then discriminated whether the first coded convolutional image is similar to the second coded convolutional image. If they are not similar, it indicates that the digital picture classification model has lost too many picture features in the classification process, that is, the digital picture is not a digital picture of the patient (the reason is: the digital picture classification model is only trained from the digital picture of the patient Therefore, when the digital pictures of non-patients are classified, the picture features will be lost; for the digital pictures of patients, there will be no loss of picture features, and the identification results should be similar at this time). If they are similar, the second encoder needs to be used to continue processing, and a continue encoding instruction is generated accordingly.
  • the continue encoding instruction is used to instruct to use the m+1th convolutional layer in the second encoder to perform the translation.
  • the code picture continues to be coded.
  • the digital pictures of non-patients are recognized in advance, which further improves the accuracy of classification and the efficiency of classification processing.
  • the preset similarity degree calculation method is used to calculate the similarity value between the first designated vector A and the second designated vector B, and it is determined whether the similarity value is greater than the predetermined value.
  • Step S6 of setting the similarity threshold includes:
  • the similarity value Sim between the first designated vector A and the second designated vector B is calculated, where Ai is the value of the i-th component of the first designated vector A, and Bi is the second designated vector A
  • Ai is the value of the i-th component of the first designated vector A
  • Bi is the second designated vector A
  • the value of the i-th component vector of the vector B, the first designated vector A and the second designated vector B each include n component vectors;
  • S502 Determine whether the similarity value Sim is greater than a preset similarity threshold.
  • the formula used is: The maximum value of the similarity value Sim is 1. When the value of the similarity degree value Sim is equal to 1, it indicates that the first designated vector A and the second designated vector B are the most similar. When the value of the similarity value Sim is more different from 1, it indicates that the first designated vector A and the second designated vector B are more dissimilar.
  • the classification model can be fully recognized (without losing features), so as to determine whether the digital picture is a preset classification picture.
  • the category of the preset classified picture can be classified into late-stage picture sub-category or non-late-stage picture sub-category, and if the similarity value is greater than a preset similarity threshold, the digital slice After the step S7 of determining as the preset classified picture, it includes:
  • classification result is a late picture
  • the use of the late image classification model to achieve fine classification is realized.
  • this application further classifies the digital pictures.
  • the category of the preset classified picture may be classified into a late picture sub-category or a non-late picture sub-category. Therefore, the digital picture may be further subdivided into a late picture sub-category or a non-late picture sub-category.
  • the late-stage picture refers to a digital picture that is diagnosed as a late-stage symptom
  • the non-late stage picture subcategory is a digital picture that is diagnosed as a non-late-stage symptom (such as an early picture).
  • the training set only includes late-stage digital pictures, and is therefore capable of at least a classification task of late-stage pictures. If the classification result is a late picture, the digital slice is classified as a late picture sub-category, so that the digital slice is further classified from a relatively rough preset classification picture to a late picture sub-category, realizing fine classification of data .
  • the digital slice-based image classification method of the present application obtains digital slices; preprocesses the digital slices to obtain digital pictures; uses a picture vector generator in a preset digital picture classification model to perform operations on the digital pictures , So as to obtain the first designated vector A obtained by encoding by the first encoder in the picture vector generator; use the first decoder to decode the first designated vector A, thereby obtaining the first designated vector A
  • the decoded picture output by the decoder; the decoded picture is encoded by the second encoder to obtain the second designated vector B output by the second encoder; the first designated vector A is calculated A similarity value between the second designated vector B and the second designated vector B; if the similarity value is greater than a preset similarity threshold, the digital slice is determined to be a preset classification picture.
  • a preset digital picture classification model So as to obtain the first designated vector A obtained by encoding by the first encoder in the picture vector generator; use the first decoder to decode the first designated vector A, thereby obtaining the first
  • an embodiment of the present application provides a digital slice-based image classification device, including:
  • the digital slice acquisition unit 10 is configured to acquire a digital slice obtained by scanning a liquid-based thin-layer cell sample using a preset micro-scanner;
  • the preprocessing unit 20 is configured to preprocess the digital slice using a preset preprocessing method to obtain a digital picture
  • the first designated vector A generating unit 30 is configured to use the picture vector generator in the preset digital picture classification model to perform operations on the digital picture, so as to obtain the first encoder in the picture vector generator for encoding.
  • the first designated vector A wherein the picture vector generator is composed of a first encoder, a first decoder, and a second encoder connected in sequence; wherein the digital picture classification model is trained using designated sample data to make;
  • a decoded picture generating unit 40 configured to use the first decoder to perform decoding processing on the first designated vector A, so as to obtain a decoded picture output by the first decoder;
  • the second designated vector B generating unit 50 is configured to use the second encoder to perform encoding processing on the decoded picture, so as to obtain a second designated vector B output by the second encoder;
  • the similarity value judgment unit 60 is configured to use a preset similarity degree calculation method to calculate the similarity value between the first designated vector A and the second designated vector B, and determine whether the similarity value is greater than The preset similarity threshold;
  • the picture classification unit 70 is configured to determine the digital slice as a preset classification picture if the similarity value is greater than a preset similarity threshold.
  • the liquid-based thin-layer cell sample undergoes at least two staining treatments before scanning, and the pre-processing unit 20 includes:
  • the color value obtaining subunit is used to obtain the value R of the red color channel, the value G of the green color channel, and the value B of the blue color channel in the RGB color model of the pixels in the digital slice;
  • the reference value F1 judging subunit is used to judge whether the value of the reference value F1 is equal to P1;
  • the reference value F2 judging subunit is used to judge whether the value of the reference value F2 is equal to P2;
  • the color setting subunit is configured to set the RGB color of the pixel to a preset value if the value of the reference value F2 is not equal to P2.
  • the digital picture classification model further includes a first discriminator, the first discriminator is used to discriminate whether the digital picture and the decoded picture are the same, and the picture vector generator and the The first discriminator is jointly trained using the same data, and the device includes:
  • the specified sample picture extraction unit is configured to extract a specified sample picture from a preset training sample set, and input the specified sample picture into the picture vector generator for operation, so as to obtain the first picture in the picture vector generator.
  • a first similarity value calculation unit for calculating a first vector similarity value between the first training vector M1 and the second training vector M2, and using the first discriminator to calculate the specified sample The first picture similarity value between the picture and the intermediate picture;
  • the first similarity degree value judgment unit is configured to judge whether the first vector similarity degree value is greater than a preset vector similarity degree threshold, and to determine whether the first picture similarity degree value is greater than a preset picture similarity threshold;
  • the designated sample picture deletion unit is configured to keep the digital picture if the first vector similarity degree value is greater than a preset vector similarity degree threshold, and the first picture similarity degree value is greater than a preset picture similarity threshold value
  • the parameters of the classification model are unchanged, and the specified sample picture is deleted from the training sample set.
  • the first similarity degree value calculation unit includes:
  • the subunit for counting the number of the same pixels is used to sequentially compare the pixels corresponding to the designated sample picture and the intermediate picture, and to count the number of the same pixels;
  • the first picture similarity value obtaining subunit is configured to use the same pixel ratio as the first picture similarity value between the designated sample picture and the intermediate picture.
  • the first encoder and the second encoder each include a plurality of convolutional layers
  • the digital picture classification model further includes a second discriminator
  • the device includes:
  • a coded convolutional image obtaining unit configured to obtain the first coded convolutional image output by the mth convolutional layer in the first encoder, and obtain the mth convolutional layer output from the second encoder
  • the authentication result obtaining unit is configured to input the first coded convolution image and the second coded convolution image into the second discriminator for operation to obtain the authentication result, wherein the authentication result includes similarity or non-identity similar;
  • a continuing encoding instruction generating unit configured to generate a continuing encoding instruction if the identification results are similar, where the continuing encoding instruction is used to instruct to use the m+1th convolutional layer in the second encoder to Decode the picture to continue encoding.
  • the similarity value judgment unit 60 includes:
  • the similarity value Sim calculation subunit is used according to the formula:
  • the similarity value Sim between the first designated vector A and the second designated vector B is calculated, where Ai is the value of the i-th component of the first designated vector A, and Bi is the second designated vector A
  • Ai is the value of the i-th component of the first designated vector A
  • Bi is the second designated vector A
  • the value of the i-th component vector of the vector B, the first designated vector A and the second designated vector B each include n component vectors;
  • the similarity value Sim judging subunit is used for judging whether the similarity value Sim is greater than a preset similarity threshold.
  • the category of the preset classified picture may be classified into a late-stage picture sub-category or a non-late-stage picture sub-category, and the device includes:
  • a late-stage picture classification model processing unit configured to input the digital picture into a preset late-stage picture classification model for processing, wherein the late-stage picture classification model is obtained by training a preset training set, and the training set only includes late-stage digits image;
  • a late-stage picture classification result obtaining unit configured to obtain a classification result output by the late-stage picture classification model, and determine whether the classification result is a late-stage picture
  • the late picture sub-classification unit is configured to classify the digital slice as a late picture sub-category if the classification result is a late picture.
  • the digital slice-based picture classification device of the present application obtains digital slices; preprocesses the digital slices to obtain digital pictures; uses a picture vector generator in a preset digital picture classification model to perform operations on the digital pictures , So as to obtain the first designated vector A obtained by encoding by the first encoder in the picture vector generator; use the first decoder to decode the first designated vector A to obtain the first The decoded picture output by the decoder; the second encoder is used to encode the decoded picture to obtain the second designated vector B output by the second encoder; the first designated vector A is calculated A similarity value between the second designated vector B and the second designated vector B; if the similarity value is greater than a preset similarity threshold, the digital slice is determined to be a preset classification picture. Thereby realizing accurate picture classification.
  • an embodiment of the present application also provides a computer device.
  • the computer device may be a server, and its internal structure may be as shown in the figure.
  • the computer equipment includes a processor, a memory, a network interface, and a database connected through a system bus. Among them, the processor designed by the computer is used to provide calculation and control capabilities.
  • the memory of the computer device includes a storage medium and an internal memory.
  • the storage medium may be non-volatile or volatile.
  • the storage medium stores an operating system, a computer program, and a database.
  • the memory provides an environment for the operation of the operating system and computer programs in the storage medium.
  • the database of the computer equipment is used to store the data used in the image classification method based on digital slices.
  • the network interface of the computer device is used to communicate with an external terminal through a network connection.
  • the computer program is executed by the processor to realize a digital slice-based image classification method.
  • the above-mentioned processor executes the above-mentioned digital slice-based picture classification method, wherein the steps included in the method respectively correspond to the steps of executing the digital slice-based picture classification method of the foregoing embodiment, and will not be repeated here.
  • the computer device of the present application obtains a digital slice; preprocesses the digital slice to obtain a digital picture; uses a picture vector generator in a preset digital picture classification model to perform operations on the digital picture to obtain the The first designated vector A obtained by encoding by the first encoder in the picture vector generator; the first designated vector A is decoded by the first decoder, so as to obtain the output of the first decoder Decode picture; use the second encoder to encode the decoded picture, thereby obtaining the second designated vector B output by the second encoder; calculate the first designated vector A and the second designated vector A Specify a similarity value between vectors B; if the similarity value is greater than a preset similarity threshold, the digital slice is determined to be a preset classification picture. Thereby realizing accurate picture classification.
  • An embodiment of the present application also provides a computer-readable storage medium on which a computer program is stored.
  • a computer program is executed by a processor, a digital slice-based image classification method is implemented, wherein the steps included in the method are the same as those in the previous implementation.
  • the steps of the digital slice-based image classification method correspond to each other, so I will not repeat them here.
  • the computer-readable storage medium of the present application obtains digital slices; preprocesses the digital slices to obtain digital pictures; uses a picture vector generator in a preset digital picture classification model to perform operations on the digital pictures, thereby Obtain the first designated vector A obtained by encoding by the first encoder in the picture vector generator; use the first decoder to decode the first designated vector A, thereby obtaining the first decoding
  • the decoded picture output by the encoder; the decoded picture is encoded by the second encoder to obtain the second designated vector B output by the second encoder; the first designated vector A and the The similarity value between the second designated vectors B; if the similarity value is greater than a preset similarity threshold, the digital slice is determined to be a preset classification picture.
  • the computer-readable storage medium may be non-volatile or volatile.
  • a person of ordinary skill in the art can understand that all or part of the processes in the above-mentioned embodiment methods can be implemented by instructing relevant hardware through a computer program.
  • the computer program can be stored in a non-volatile computer readable storage.
  • the medium when the computer program is executed, it may include the processes of the above-mentioned method embodiments.
  • any reference to memory, storage, database or other media provided in this application and used in the embodiments may include non-volatile and/or volatile memory.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及数字医疗中的医疗信息化领域,揭示了一种基于数字切片的图片分类方法、装置、计算机设备和存储介质,所述方法包括:获取数字切片;对所述数字切片进行预处理,从而得到数字图片;采用图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码得到的第一指定向量A;采用第一译码器对所述第一指定向量A进行译码处理,得到第一译码器输出的译码图片;采用第二编码器对所述译码图片进行编码处理,得到第二编码器输出的第二指定向量B;计算第一指定向量A和第二指定向量B之间的相似程度值;若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。从而实现了准确的图片分类。

Description

基于数字切片的图片分类方法、装置和计算机设备
本申请要求于2019年12月23日提交中国专利局、申请号为201911342350.5,发明名称为“基于数字切片的图片分类方法、装置和计算机设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及到数字医疗中的医疗信息化领域,特别是涉及到一种基于数字切片的图片分类方法、装置、计算机设备和存储介质。
背景技术
液基薄层细胞检测是目前常见的检测方式之一,通过液基薄层细胞检测能够得到数字图片,该数字图片中存在大量有用信息,一般情况下会将该数字图片进行分类存储。但是发明人意识到目前对于液基薄层细胞检测得到的数字图片进行分类时,需要专业人士进行准确分类(这是因为数字图片中的大量信息,非专业人士无法理解),因此传统的对于上述数字图片进行分案的方案,其准确性得不到保证,分类的可控性差、一致性低。因此,传统技术缺乏准确高效地进行上述数字图片分类的方法。
技术问题
实现准确的图片分类。
技术解决方案
本申请的主要目的为提供一种基于数字切片的图片分类方法、装置、计算机设备和存储介质,旨在实现准确的图片分类。
为了实现上述发明目的,本申请提出一种基于数字切片的图片分类方法,包括以下步骤:
获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
本申请提供一种基于数字切片的图片分类装置,包括:
数字切片获取单元,用于获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
预处理单元,用于采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
第一指定向量A生成单元,用于采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
译码图片生成单元,用于采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
第二指定向量B生成单元,用于采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
相似程度值判断单元,用于使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
图片分类单元,用于若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现基于数字切片的图片分类方法,该基于数字切片的图片分类方法,包括:获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
有益效果
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于数字切片的图片分类方法,该基于数字切片的图片分类方法,包括:获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得 到;采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
附图说明
图1为本申请一实施例的基于数字切片的图片分类方法的流程示意图;
图2为本申请一实施例的基于数字切片的图片分类装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
本发明的最佳实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种基于数字切片的图片分类方法,包括以下步骤:
S1、获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
S2、采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
S3、采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
S4、采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
S5、采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
S6、使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
S7、若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
如上述步骤S1所述,获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到。其中所述液基薄层细胞样本可以以任意适合于被扫描的形式存在,例如被制作成物理切片。其中所述液基薄层细胞样本可为任意类型的样本,例如为宫颈癌患者的样本。
如上述步骤S2所述,采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片。由于数字切片是对液基薄层细胞样本进行直接扫描得到的,虽然其保留了完整的信息,但是直接作为后续步骤的处理会加重计算的负担。因此本申请还对所述数字切片进行预处理,预处理的方法例如为:获取所述数字切片中的像素点的RGB颜色模型中的红颜色通道的数值R、绿颜色通道的数值G和蓝颜色通道的数值B;根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/H,0],P1},获取参考数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于H的正数,H为大于0的整数,P1为预设的取值在范围(0,255)之内第一阈值参数;判断所述参考数值F1的值是否等于P1;若所述参考数值F1的值不等于P1,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/H,0],P2},获取参考数值F2,其中MAX为最大值函数,P2为预设的取值在范围(0,255)之内第二阈值参数,并且P2大于P1;
判断所述参考数值F2的值是否等于P2;若所述参考数值F2的值不等于P2,则将所述像素点的RGB颜色设置为预设数值。
如上述步骤S3所述,采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成。本申请采用特殊的数字图片分类模型进行图片分类,其中数字图片分类模型至少包括图片向量生成器,所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成。进一步地,所述指定样本数据仅包括已确诊的数字图片,因此所述第一编码器只能对已确诊患者的数字图片进行完全识别,而对于除已确诊的数字图片之外的其他图片进行识别时不可避免的会有信息丢失,造成第一编码器生成的第一指定向量A与第二编码器生成的第二指定向量B不相同或不相似,而已确诊的数字图片正好相反(第一编码器生成的第一指定向量A与第二编码器生成的第二指定向量B相同或相似),据此实现分类。并且由于训练时只采用了已确诊的数字图片,因此训练速度更快。其中所述分类模型可以采用任意结构,例如基于深度卷积对抗生成网络的网络结构。所述第一编码器可以为任意结构,例如为由多个卷积层构成的卷积网络,其最终输出为第一指定向量。
如上述步骤S4所述,采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片。其中所述第一解码器可以为任意结构的解码器,但能够对所述第一指定向量A进行译码,例如包括多个卷积层和反卷积层的结构。由于第一解码器是基于第一指定向量A的译码处理,而第一指定向量A是从数字图片中提取的, 若提取过程的信息损失过多,将导致译码图片与数据图片区别过大。而若数字图片是患者的数字图片,则不会有信息损失,因此译码图片与数据图片相似。
如上述步骤S5所述,采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B。其中所述第二编码器例如为由多个卷积层构成的卷积网络,其最终输出为第二指定向量。并且所述第二编码器的结构与所述第一编码器相同,或者与所述第一编码器不相同,但能够对所述译码图片进行编码。
如上述步骤S6所述,使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值。相似程度计算方法可为任意算法,例如为:根据公式:
Figure PCTCN2020106079-appb-000001
计算得到所述第一指定向量A和所述第二指定向量B的相似程度值Sim,其中,Ai为所述第一指定向量A的第i个分向量的数值,Bi为所述第二指定向量B的第i个分向量的数值,所述第一指定向量A和所述第二指定向量B均包括n个分向量。
如上述步骤S7所述,若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。其中,若所述数字切片与所述预设分类图片对应,例如,当所述数字切片为宫颈癌患者的数字切片时,所述预设分类图片即为宫颈癌分类图片。若所述相似程度值大于预设的相似度阈值,表明由第一编码器、译码器、第二编码器的整个数据处理过程中几乎没有信息丢失,因此所述数字切片即为预设分类图片(因此若为除预设分类图片之外的其他图片,在识别时会有信息丢失,导致所述相似程度值不大于预设的相似度阈值)。
在一个实施方式中,所述液基薄层细胞样本在进行扫描前经过了至少两次染色处理,所述采用预设的预处理方法对所述数字切片进行预处理的步骤S2,包括:
S201、获取所述数字切片中的像素点的RGB颜色模型中的红颜色通道的数值R、绿颜色通道的数值G和蓝颜色通道的数值B;
S202、根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/H,0],P1},获取参考数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于H的正数,H为大于0的整数,P1为预设的取值在范围(0,255)之内第一阈值参数;
S203、判断所述参考数值F1的值是否等于P1;
S204、若所述参考数值F1的值等于P1,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/H,0],P2},获取参考数值F2,其中MAX为最大值函数,P2为预设的取值在范围(0,255)之内第二阈值参数,并且P2大于P1;
S205、判断所述参考数值F2的值是否等于P2;
S206、若所述参考数值F2的值不等于P2,则将所述像素点的RGB颜色设置为预设数值。
如上所述,实现了采用预设的预处理方法对所述数字切片进行预处理。其中,所述液基薄层细胞样本在进行扫描前经过了至少两次染色处理,从而使液基薄层细胞样本被染为 至少三种颜色(原色、第一染色使样本中的部分结构或物质被染为第一颜色、第二染色使样本中的部分结构或物质被染为第二颜色)。为了进一步使结构更清晰并且计算负担更小,本申请还将不同像素点分别设置为(0,0,0)、预设数值或者(E,E,E),其中E大于0小于255,所述预设数值例如为(255,255,255)。进一步地,当所述参考数值F1的值等于P1时,将所述像素点的RGB颜色设置为(0,0,0)。进一步地,当所述参考数值F2的值等于P2时,将所述像素点的RGB颜色设置为(E,E,E)。从而使所述数字切片呈完全的三色,使得对比更加明显,更便于减少计算量,提高处理效率。
在一个实施方式中,所述数字图片分类模型还包括第一鉴别器,所述第一鉴别器用于鉴别所述数字图片和所述译码图片是否相同,并且所述图片向量生成器与所述第一鉴别器采用相同的数据共同训练,所述采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成的步骤S3之前,包括:
S21、从预设的训练样本集中提取指定样本图片,并将所述指定样本图片输入所述图片向量生成器中进行运算,从而得到所述图片向量生成器中的第一编码器输出的第一训练向量M1、第一译码器输出的中间图片和第二编码器输出的第二训练向量M2;
S22、计算所述第一训练向量M1和所述第二训练向量M2之间的第一向量相似程度值,并且利用所述第一鉴别器,计算所述指定样本图片与所述中间图片之间的第一图片相似程度值;
S23、判断所述第一向量相似程度值是否大于预设的向量相似程度阈值,并且判断所述第一图片相似程度值是否大于预设的图片相似程度阈值;
S24、若所述第一向量相似程度值大于预设的向量相似程度阈值,并且所述第一图片相似程度值大于预设的图片相似程度阈值,则保持所述数字图片分类模型的参数不变,并且将所述指定样本图片从所述训练样本集中删除。
如上所述,实现了保持所述数字图片分类模型的参数不变,将所述指定样本图片从所述训练样本集中删除。所述数字图片分类模型还包括第一鉴别器,所述第一鉴别器用于鉴别所述数字图片和所述译码图片是否相同。其中所述第一辨别器可为任意结构,例如为一系列卷积层、池化层组成的深度卷积分类网络。所述第一辨别器仅在训练过程中起作用,用于辅助优化参数,而在数字图片分类模型进行分类的过程中,仅使用图片向量生成器即可,从而提高分类处理的速度。并且由于采用的是共同训练,因此辨别器与向量生成器的适应性更高,鲁棒性更好。若所述第一训练向量M1和所述第二训练向量M2之间的第一向量相似程度值大于预设的图片相似程度阈值,并且所述第一图片相似程度值大于预设的图片相似程度阈值,则表明当前的数字图片分类模型能够对所述指定样本图片进行正确分类,因此保持所述数字图片分类模型的参数不变,并且将所述指定样本图片从所述训练样本集中删除。
在一个实施方式中,所述计算所述指定样本图片与所述中间图片之间的第一图片相似程度值的步骤S22,包括:
S221、依次对比所述指定样本图片与所述中间图片对应的像素点,并统计相同像素点的数量;
S222、利用公式:相同像素点占比率=相同像素点的数量/所述指定样本图片中所有像素点的数量,从而得到所述相同像素点占比率;
S223、将所述相同像素点占比率作为所述指定样本图片与所述中间图片之间的第一图片相似程度值。
如上所述,实现了计算所述数字图片与所述中间图片之间的第一图片相似度值。本申请采用逐次比对像素点的方式进行判断。若所述数字图片与所述中间图片是相同的,那么相同像素点的数量应当占绝大多数,即所述相同占比趋近于1。据此,根据公式:相同像素点占比率=相同像素点的数量/所述指定样本图片中所有像素点的数量,从而得到所述相同像素点占比率,若所述相同像素点占比大于预设的占比阈值,则判定所述数字图片与所述中间图片相同。其中相同像素点的判断,可以用任意方式来判断,例如以三原色的数值差别均在预设的颜色阈值之内,则判定为相同像素点。
在一个实施方式中,所述第一编码器和所述第二编码器均包括多个卷积层,所述数字图片分类模型还包括第二鉴别器,所述采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B的步骤S5之前,包括:
S41、获取所述第一编码器中的第m个卷积层输出的第一编码卷积图像,以及获取所述第二编码器中的第m个卷积层输出的第二编码卷积图像,其中m为大于1的整数;
S42、将所述第一编码卷积图像和所述第二编码卷积图像输入所述第二鉴别器中进行运算,从而得到鉴别结果,其中所述鉴别结果包括相似或者不相似;
S43、若所述鉴别结果为相似,则生成继续编码指令,所述继续编码指令用于指示利用所述第二编码器中的第m+1个卷积层对所述译码图片进行继续编码。
如上所述,实现了设置第二鉴别器以提高准确性。所述第一编码器与所述第二编码器的结构可以相同,也可以不同,但是均包括多个卷积层,并且优选具有相同的卷积层。其中所述第一编码器包括第m个卷积层(用于生成第一编码卷积图像),第二编码器包括第m个卷积层(用于生成第二编码卷积图像),其中m为大于1的整数,例如m=2或5。第二鉴别器与所述第一编码器与所述第二编码器信号连接,从而从所述第一编码器中获取第一编码卷积图像,并从所述第二编码器中获取第二编码卷积图像,再鉴别第一编码卷积图像与第二编码卷积图像是否相似。若不相似,表明数字图片分类模型在分类处理过程中丢失了过多的图片特征,也即所述数字图片不是患者的数字图片(原因在于:数字图片分类模型仅由患者的数字图片训练而成,因此在对非患者的数字图片进行分类处理之时,会出现图片特征丢失的情况;而对于患者的数字图片,则不会出现图片特征丢失,此时鉴别结果应为相似)。若为相似,则需要利用第二编码器继续处理,据此生成继续编码指令,所 述继续编码指令用于指示利用所述第二编码器中的第m+1个卷积层对所述译码图片进行继续编码。本申请通过设置第二鉴别器,提前识别出非患者的数字图片,进一步提高分类的准确性,并且提高分类处理的效率。
在一个实施方式中,所述使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值的步骤S6,包括:
S501、根据公式:
Figure PCTCN2020106079-appb-000002
计算得到所述第一指定向量A和所述第二指定向量B的相似程度值Sim,其中,Ai为所述第一指定向量A的第i个分向量的数值,Bi为所述第二指定向量B的第i个分向量的数值,所述第一指定向量A和所述第二指定向量B均包括n个分向量;
S502、判断所述相似程度值Sim是否大于预设的相似度阈值。
如上所述,实现了使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值。其中采用的公式为:
Figure PCTCN2020106079-appb-000003
所述相似程度值Sim的最大值为1。当所述相似程度值Sim的数值等于1时,表明所述第一指定向量A和所述第二指定向量B最相似。当所述相似程度值Sim的数值与1差别越大,表明所述第一指定向量A和所述第二指定向量B越不相似。据此,通过判断所述相似程度值Sim是否大于预设的相似度阈值,从而确定所述第一指定向量A和所述第二指定向量B是否相似,进而确定数字图片是否是所述数字图片分类模型能够完全识别的(不丢失特征),从而确定所述数字图片是否为预设分类图片。
在一个实施方式中,所述预设分类图片的类别可划分为晚期图片子分类或者非晚期图片子分类,所述若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片的步骤S7之后,包括:
S71、将所述数字图片输入预设的晚期图片分类模型中进行处理,其中所述晚期图片分类模型通过预设的训练集训练得到,所述训练集仅包括晚期数字图片;
S72、获取所述晚期图片分类模型输出的分类结果,并判断所述分类结果是否为晚期图片;
S73、若所述分类结果为晚期图片,则将所述数字切片分类为晚期图片子分类。
如上所述,实现了利用晚期图片分类模型实现细分类。为了使分类结果更加精确,以利于数据的再次利用,本申请对所述数字图片进行了进一步分类。其中,所述预设分类图片的类别可划分为晚期图片子分类或者非晚期图片子分类,因此,所述数字图片可被进一步细分为晚期图片子分类或者非晚期图片子分类。所述晚期图片指被确诊为晚期症状的数字图片,所述非晚期图片子分类是被确诊为非晚期症状的数字图片(例如早期图片)。由 于所述晚期图片分类模型通过预设的训练集训练得到,所述训练集仅包括晚期数字图片,因此能够胜任至少对晚期图片的分类任务。若所述分类结果为晚期图片,则将所述数字切片分类为晚期图片子分类,从而将数字切片从较为粗略的预设分类图片,进一步分类为晚期图片子分类,实现了数据的精细归类。
本申请的基于数字切片的图片分类方法,获取数字切片;对所述数字切片进行预处理,从而得到数字图片;采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码得到的第一指定向量A;采用第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;计算所述第一指定向量A和所述第二指定向量B之间的相似程度值;若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。从而实现了准确的图片分类。
参照图2,本申请实施例提供一种基于数字切片的图片分类装置,包括:
数字切片获取单元10,用于获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
预处理单元20,用于采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
第一指定向量A生成单元30,用于采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
译码图片生成单元40,用于采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
第二指定向量B生成单元50,用于采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
相似程度值判断单元60,用于使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
图片分类单元70,用于若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
其中上述单元分别用于执行的操作与前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述液基薄层细胞样本在进行扫描前经过了至少两次染色处理,所述预处理单元20,包括:
颜色数值获取子单元,用于获取所述数字切片中的像素点的RGB颜色模型中的红颜色 通道的数值R、绿颜色通道的数值G和蓝颜色通道的数值B;
参考数值F1获取子单元,用于根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/H,0],P1},获取参考数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于H的正数,H为大于0的整数,P1为预设的取值在范围(0,255)之内第一阈值参数;
参考数值F1判断子单元,用于判断所述参考数值F1的值是否等于P1;
参考数值F2获取子单元,用于若所述参考数值F1的值等于P1,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/H,0],P2},获取参考数值F2,其中MAX为最大值函数,P2为预设的取值在范围(0,255)之内第二阈值参数,并且P2大于P1;
参考数值F2判断子单元,用于判断所述参考数值F2的值是否等于P2;
颜色设置子单元,用于若所述参考数值F2的值不等于P2,则将所述像素点的RGB颜色设置为预设数值。
其中上述子单元分别用于执行的操作与前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述数字图片分类模型还包括第一鉴别器,所述第一鉴别器用于鉴别所述数字图片和所述译码图片是否相同,并且所述图片向量生成器与所述第一鉴别器采用相同的数据共同训练,所述装置,包括:
指定样本图片提取单元,用于从预设的训练样本集中提取指定样本图片,并将所述指定样本图片输入所述图片向量生成器中进行运算,从而得到所述图片向量生成器中的第一编码器输出的第一训练向量M1、第一译码器输出的中间图片和第二编码器输出的第二训练向量M2;
第一相似程度值计算单元,用于计算所述第一训练向量M1和所述第二训练向量M2之间的第一向量相似程度值,并且利用所述第一鉴别器,计算所述指定样本图片与所述中间图片之间的第一图片相似程度值;
第一相似程度值判断单元,用于判断所述第一向量相似程度值是否大于预设的向量相似程度阈值,并且判断所述第一图片相似程度值是否大于预设的图片相似程度阈值;
指定样本图片删除单元,用于若所述第一向量相似程度值大于预设的向量相似程度阈值,并且所述第一图片相似程度值大于预设的图片相似程度阈值,则保持所述数字图片分类模型的参数不变,并且将所述指定样本图片从所述训练样本集中删除。
其中上述单元分别用于执行的操作与前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述第一相似程度值计算单元,包括:
相同像素点的数量统计子单元,用于依次对比所述指定样本图片与所述中间图片对应的像素点,并统计相同像素点的数量;
相同像素点占比率获取子单元,用于利用公式:相同像素点占比率=相同像素点的数 量/所述指定样本图片中所有像素点的数量,从而得到所述相同像素点占比率;
第一图片相似程度值获取子单元,用于将所述相同像素点占比率作为所述指定样本图片与所述中间图片之间的第一图片相似程度值。
其中上述子单元分别用于执行的操作与前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述第一编码器和所述第二编码器均包括多个卷积层,所述数字图片分类模型还包括第二鉴别器,所述装置,包括:
编码卷积图像获取单元,用于获取所述第一编码器中的第m个卷积层输出的第一编码卷积图像,以及获取所述第二编码器中的第m个卷积层输出的第二编码卷积图像,其中m为大于1的整数;
鉴别结果获取单元,用于将所述第一编码卷积图像和所述第二编码卷积图像输入所述第二鉴别器中进行运算,从而得到鉴别结果,其中所述鉴别结果包括相似或者不相似;
继续编码指令生成单元,用于若所述鉴别结果为相似,则生成继续编码指令,所述继续编码指令用于指示利用所述第二编码器中的第m+1个卷积层对所述译码图片进行继续编码。
其中上述单元分别用于执行的操作与前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述相似程度值判断单元60,包括:
相似程度值Sim计算子单元,用于根据公式:
Figure PCTCN2020106079-appb-000004
计算得到所述第一指定向量A和所述第二指定向量B的相似程度值Sim,其中,Ai为所述第一指定向量A的第i个分向量的数值,Bi为所述第二指定向量B的第i个分向量的数值,所述第一指定向量A和所述第二指定向量B均包括n个分向量;
相似程度值Sim判断子单元,用于判断所述相似程度值Sim是否大于预设的相似度阈值。
其中上述子单元分别用于执行的操作与前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述预设分类图片的类别可划分为晚期图片子分类或者非晚期图片子分类,所述装置,包括:
晚期图片分类模型处理单元,用于将所述数字图片输入预设的晚期图片分类模型中进行处理,其中所述晚期图片分类模型通过预设的训练集训练得到,所述训练集仅包括晚期数字图片;
晚期图片分类结果获取单元,用于获取所述晚期图片分类模型输出的分类结果,并判断所述分类结果是否为晚期图片;
晚期图片子分类单元,用于若所述分类结果为晚期图片,则将所述数字切片分类为晚期图片子分类。
其中上述单元分别用于执行的操作与前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
本申请的基于数字切片的图片分类装置,获取数字切片;对所述数字切片进行预处理,从而得到数字图片;采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码得到的第一指定向量A;采用第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;计算所述第一指定向量A和所述第二指定向量B之间的相似程度值;若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。从而实现了准确的图片分类。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。所述存储介质可以是非易失性的,也可以是易失性的。该存储介质存储有操作系统、计算机程序和数据库。该内存器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于数字切片的图片分类方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于数字切片的图片分类方法。
上述处理器执行上述基于数字切片的图片分类方法,其中所述方法包括的步骤分别与执行前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请的计算机设备,获取数字切片;对所述数字切片进行预处理,从而得到数字图片;采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码得到的第一指定向量A;采用第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;计算所述第一指定向量A和所述第二指定向量B之间的相似程度值;若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。从而实现了准确的图片分类。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于数字切片的图片分类方法,其中所述方法包括的步骤分别与执行前述实施方式的基于数字切片的图片分类方法的步骤一一对应,在此不再赘述。
本申请的计算机可读存储介质,获取数字切片;对所述数字切片进行预处理,从而得到数字图片;采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码得到的第一指定向量A;采用第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;计算所述第一指定向量A和所述第二指定向量B之间的相似程度值;若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。从而实现了准确的图片分类。所述计算机可读存储介质可以是非易失性,也可以是易失性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

Claims (20)

  1. 一种基于数字切片的图片分类方法,其中,包括:
    获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
    采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
    采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
    采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
    采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
    使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
    若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
  2. 根据权利要求1所述的基于数字切片的图片分类方法,其中,所述液基薄层细胞样本在进行扫描前经过了至少两次染色处理,所述采用预设的预处理方法对所述数字切片进行预处理的步骤,包括:
    获取所述数字切片中的像素点的RGB颜色模型中的红颜色通道的数值R、绿颜色通道的数值G和蓝颜色通道的数值B;
    根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/H,0],P1},获取参考数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于H的正数,H为大于0的整数,P1为预设的取值在范围(0,255)之内第一阈值参数;
    判断所述参考数值F1的值是否等于P1;
    若所述参考数值F1的值等于P1,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/H,0],P2},获取参考数值F2,其中MAX为最大值函数,P2为预设的取值在范围(0,255)之内第二阈值参数,并且P2大于P1;
    判断所述参考数值F2的值是否等于P2;
    若所述参考数值F2的值不等于P2,则将所述像素点的RGB颜色设置为预设数值。
  3. 根据权利要求1所述的基于数字切片的图片分类方法,其中,所述数字图片分类模型还包括第一鉴别器,所述第一鉴别器用于鉴别所述数字图片和所述译码图片是否相同,并且所述图片向量生成器与所述第一鉴别器采用相同的数据共同训练,所述采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成的步骤之前,包括:
    从预设的训练样本集中提取指定样本图片,并将所述指定样本图片输入所述图片向量生成器中进行运算,从而得到所述图片向量生成器中的第一编码器输出的第一训练向量M1、第一译码器输出的中间图片和第二编码器输出的第二训练向量M2;
    计算所述第一训练向量M1和所述第二训练向量M2之间的第一向量相似程度值,并且利用所述第一鉴别器,计算所述指定样本图片与所述中间图片之间的第一图片相似程度值;
    判断所述第一向量相似程度值是否大于预设的向量相似程度阈值,并且判断所述第一图片相似程度值是否大于预设的图片相似程度阈值;
    若所述第一向量相似程度值大于预设的向量相似程度阈值,并且所述第一图片相似程度值大于预设的图片相似程度阈值,则保持所述数字图片分类模型的参数不变,并且将所述指定样本图片从所述训练样本集中删除。
  4. 根据权利要求3所述的基于数字切片的图片分类方法,其中,所述计算所述指定样本图片与所述中间图片之间的第一图片相似程度值的步骤,包括:
    依次对比所述指定样本图片与所述中间图片对应的像素点,并统计相同像素点的数量;
    利用公式:相同像素点占比率=相同像素点的数量/所述指定样本图片中所有像素点的数量,从而得到所述相同像素点占比率;
    将所述相同像素点占比率作为所述指定样本图片与所述中间图片之间的第一图片相似程度值。
  5. 根据权利要求1所述的基于数字切片的图片分类方法,其中,所述第一编码器和所述第二编码器均包括多个卷积层,所述数字图片分类模型还包括第二鉴别器,所述采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B的步骤之前,包括:
    获取所述第一编码器中的第m个卷积层输出的第一编码卷积图像,以及获取所述第二编码器中的第m个卷积层输出的第二编码卷积图像,其中m为大于1的整数;
    将所述第一编码卷积图像和所述第二编码卷积图像输入所述第二鉴别器中进行运算,从而得到鉴别结果,其中所述鉴别结果包括相似或者不相似;
    若所述鉴别结果为相似,则生成继续编码指令,所述继续编码指令用于指示利用所述第二编码器中的第m+1个卷积层对所述译码图片进行继续编码。
  6. 根据权利要求1所述的基于数字切片的图片分类方法,其中,所述使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值的步骤,包括:
    根据公式:
    Figure PCTCN2020106079-appb-100001
    计算得到所述第一指定向量A和所述第二指定向量B的相似程度值Sim,其中,Ai为所述第一指定向量A的第i个分向量的数值,Bi为所述第二指定向量B的第i个分向量的数值,所述第一指定向量A和所述第二指定向量B均包括n个分向量;
    判断所述相似程度值Sim是否大于预设的相似度阈值。
  7. 根据权利要求1所述的基于数字切片的图片分类方法,其中,所述预设分类图片的类别可划分为晚期图片子分类或者非晚期图片子分类,所述若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片的步骤之后,包括:
    将所述数字图片输入预设的晚期图片分类模型中进行处理,其中所述晚期图片分类模型通过预设的训练集训练得到,所述训练集仅包括晚期数字图片;
    获取所述晚期图片分类模型输出的分类结果,并判断所述分类结果是否为晚期图片;
    若所述分类结果为晚期图片,则将所述数字切片分类为晚期图片子分类。
  8. 一种基于数字切片的图片分类装置,其中,包括:
    数字切片获取单元,用于获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
    预处理单元,用于采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
    第一指定向量A生成单元,用于采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第 一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
    译码图片生成单元,用于采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
    第二指定向量B生成单元,用于采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
    相似程度值判断单元,用于使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
    图片分类单元,用于若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
  9. 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中,所述处理器执行所述计算机程序时实现基于数字切片的图片分类方法,该基于数字切片的图片分类方法,包括:
    获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
    采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
    采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
    采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
    采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
    使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
    若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
  10. 根据权利要求9所述的计算机设备,其中,所述液基薄层细胞样本在进行扫描前经过了至少两次染色处理,所述采用预设的预处理方法对所述数字切片进行预处理的步骤,包括:
    获取所述数字切片中的像素点的RGB颜色模型中的红颜色通道的数值R、绿颜色通道的数值G和蓝颜色通道的数值B;
    根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/H,0],P1},获取参考数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于H的正数,H为大于0的整数,P1为预设的取值在范围(0,255)之内第一阈值参数;
    判断所述参考数值F1的值是否等于P1;
    若所述参考数值F1的值等于P1,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/H,0],P2},获取参考数值F2,其中MAX为最大值函数,P2为预设的取值在范围(0,255)之内第二阈值参数,并且P2大于P1;
    判断所述参考数值F2的值是否等于P2;
    若所述参考数值F2的值不等于P2,则将所述像素点的RGB颜色设置为预设数值。
  11. 根据权利要求9所述的计算机设备,其中,所述数字图片分类模型还包括第一鉴别器,所述第一鉴别器用于鉴别所述数字图片和所述译码图片是否相同,并且所述图片向量生成器与所述第一鉴别器采用相同的数据共同训练,所述采用预设的数字图片分类模型 中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成的步骤之前,包括:
    从预设的训练样本集中提取指定样本图片,并将所述指定样本图片输入所述图片向量生成器中进行运算,从而得到所述图片向量生成器中的第一编码器输出的第一训练向量M1、第一译码器输出的中间图片和第二编码器输出的第二训练向量M2;
    计算所述第一训练向量M1和所述第二训练向量M2之间的第一向量相似程度值,并且利用所述第一鉴别器,计算所述指定样本图片与所述中间图片之间的第一图片相似程度值;
    判断所述第一向量相似程度值是否大于预设的向量相似程度阈值,并且判断所述第一图片相似程度值是否大于预设的图片相似程度阈值;
    若所述第一向量相似程度值大于预设的向量相似程度阈值,并且所述第一图片相似程度值大于预设的图片相似程度阈值,则保持所述数字图片分类模型的参数不变,并且将所述指定样本图片从所述训练样本集中删除。
  12. 根据权利要求11所述的计算机设备,其中,所述计算所述指定样本图片与所述中间图片之间的第一图片相似程度值的步骤,包括:
    依次对比所述指定样本图片与所述中间图片对应的像素点,并统计相同像素点的数量;
    利用公式:相同像素点占比率=相同像素点的数量/所述指定样本图片中所有像素点的数量,从而得到所述相同像素点占比率;
    将所述相同像素点占比率作为所述指定样本图片与所述中间图片之间的第一图片相似程度值。
  13. 根据权利要求9所述的计算机设备,其中,所述第一编码器和所述第二编码器均包括多个卷积层,所述数字图片分类模型还包括第二鉴别器,所述采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B的步骤之前,包括:
    获取所述第一编码器中的第m个卷积层输出的第一编码卷积图像,以及获取所述第二编码器中的第m个卷积层输出的第二编码卷积图像,其中m为大于1的整数;
    将所述第一编码卷积图像和所述第二编码卷积图像输入所述第二鉴别器中进行运算,从而得到鉴别结果,其中所述鉴别结果包括相似或者不相似;
    若所述鉴别结果为相似,则生成继续编码指令,所述继续编码指令用于指示利用所述第二编码器中的第m+1个卷积层对所述译码图片进行继续编码。
  14. 根据权利要求9所述的计算机设备,其中,所述使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值的步骤,包括:
    根据公式:
    Figure PCTCN2020106079-appb-100002
    计算得到所述第一指定向量A和所述第二指定向量B的相似程度值Sim,其中,Ai为所述第一指定向量A的第i个分向量的数值,Bi为所述第二指定向量B的第i个分向量的数值,所述第一指定向量A和所述第二指定向量B均包括n个分向量;
    判断所述相似程度值Sim是否大于预设的相似度阈值。
  15. 一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现基于数字切片的图片分类方法,该基于数字切片的图片分类方法,包括:
    获取数字切片,所述数字切片是采用预设的显微扫描仪对液基薄层细胞样本进行扫描而得到;
    采用预设的预处理方法对所述数字切片进行预处理,从而得到数字图片;
    采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成;
    采用所述第一译码器对所述第一指定向量A进行译码处理,从而得到所述第一译码器输出的译码图片;
    采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B;
    使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值;
    若所述相似程度值大于预设的相似度阈值,则将所述数字切片确定为预设分类图片。
  16. 根据权利要求15所述的计算机可读存储介质,其中,所述液基薄层细胞样本在进行扫描前经过了至少两次染色处理,所述采用预设的预处理方法对所述数字切片进行预处理的步骤,包括:
    获取所述数字切片中的像素点的RGB颜色模型中的红颜色通道的数值R、绿颜色通道的数值G和蓝颜色通道的数值B;
    根据公式:F1=MIN{ROUND[(a1R+a2G+a3B)/H,0],P1},获取参考数值F1,其中MIN为最小值函数,ROUND为四舍五入函数,a1、a2、a3均为大于0且小于H的正数,H为大于0的整数,P1为预设的取值在范围(0,255)之内第一阈值参数;
    判断所述参考数值F1的值是否等于P1;
    若所述参考数值F1的值等于P1,则根据公式:F2=MAX{ROUND[(a1R+a2G+a3B)/H,0],P2},获取参考数值F2,其中MAX为最大值函数,P2为预设的取值在范围(0,255)之内第二阈值参数,并且P2大于P1;
    判断所述参考数值F2的值是否等于P2;
    若所述参考数值F2的值不等于P2,则将所述像素点的RGB颜色设置为预设数值。
  17. 根据权利要求15所述的计算机可读存储介质,其中,所述数字图片分类模型还包括第一鉴别器,所述第一鉴别器用于鉴别所述数字图片和所述译码图片是否相同,并且所述图片向量生成器与所述第一鉴别器采用相同的数据共同训练,所述采用预设的数字图片分类模型中的图片向量生成器对所述数字图片进行运算,从而得到所述图片向量生成器中的第一编码器进行编码而成的第一指定向量A,其中所述图片向量生成器由依次连接的第一编码器、第一译码器和第二编码器而构成;其中所述数字图片分类模型采用指定样本数据训练而成的步骤之前,包括:
    从预设的训练样本集中提取指定样本图片,并将所述指定样本图片输入所述图片向量生成器中进行运算,从而得到所述图片向量生成器中的第一编码器输出的第一训练向量M1、第一译码器输出的中间图片和第二编码器输出的第二训练向量M2;
    计算所述第一训练向量M1和所述第二训练向量M2之间的第一向量相似程度值,并且利用所述第一鉴别器,计算所述指定样本图片与所述中间图片之间的第一图片相似程度值;
    判断所述第一向量相似程度值是否大于预设的向量相似程度阈值,并且判断所述第一图片相似程度值是否大于预设的图片相似程度阈值;
    若所述第一向量相似程度值大于预设的向量相似程度阈值,并且所述第一图片相似程度值大于预设的图片相似程度阈值,则保持所述数字图片分类模型的参数不变,并且将所 述指定样本图片从所述训练样本集中删除。
  18. 根据权利要求17所述的计算机可读存储介质,其中,所述计算所述指定样本图片与所述中间图片之间的第一图片相似程度值的步骤,包括:
    依次对比所述指定样本图片与所述中间图片对应的像素点,并统计相同像素点的数量;
    利用公式:相同像素点占比率=相同像素点的数量/所述指定样本图片中所有像素点的数量,从而得到所述相同像素点占比率;
    将所述相同像素点占比率作为所述指定样本图片与所述中间图片之间的第一图片相似程度值。
  19. 根据权利要求15所述的计算机可读存储介质,其中,所述第一编码器和所述第二编码器均包括多个卷积层,所述数字图片分类模型还包括第二鉴别器,所述采用所述第二编码器对所述译码图片进行编码处理,从而得到所述第二编码器输出的第二指定向量B的步骤之前,包括:
    获取所述第一编码器中的第m个卷积层输出的第一编码卷积图像,以及获取所述第二编码器中的第m个卷积层输出的第二编码卷积图像,其中m为大于1的整数;
    将所述第一编码卷积图像和所述第二编码卷积图像输入所述第二鉴别器中进行运算,从而得到鉴别结果,其中所述鉴别结果包括相似或者不相似;
    若所述鉴别结果为相似,则生成继续编码指令,所述继续编码指令用于指示利用所述第二编码器中的第m+1个卷积层对所述译码图片进行继续编码。
  20. 根据权利要求15所述的计算机可读存储介质,其中,所述使用预设的相似程度计算方法,计算所述第一指定向量A和所述第二指定向量B之间的相似程度值,并判断所述相似程度值是否大于预设的相似度阈值的步骤,包括:
    根据公式:
    Figure PCTCN2020106079-appb-100003
    计算得到所述第一指定向量A和所述第二指定向量B的相似程度值Sim,其中,Ai为所述第一指定向量A的第i个分向量的数值,Bi为所述第二指定向量B的第i个分向量的数值,所述第一指定向量A和所述第二指定向量B均包括n个分向量;
    判断所述相似程度值Sim是否大于预设的相似度阈值。
PCT/CN2020/106079 2019-12-23 2020-07-31 基于数字切片的图片分类方法、装置和计算机设备 WO2021128851A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911342350.5 2019-12-23
CN201911342350.5A CN111199193B (zh) 2019-12-23 2019-12-23 基于数字切片的图片分类方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
WO2021128851A1 true WO2021128851A1 (zh) 2021-07-01

Family

ID=70746712

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/106079 WO2021128851A1 (zh) 2019-12-23 2020-07-31 基于数字切片的图片分类方法、装置和计算机设备

Country Status (2)

Country Link
CN (1) CN111199193B (zh)
WO (1) WO2021128851A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111199193B (zh) * 2019-12-23 2022-03-18 平安国际智慧城市科技股份有限公司 基于数字切片的图片分类方法、装置和计算机设备
CN112668649B (zh) * 2020-12-29 2022-04-22 中国南方电网有限责任公司 一种基于计算机取证的可靠性验证方法、装置和系统
CN112669299B (zh) * 2020-12-31 2023-04-07 上海智臻智能网络科技股份有限公司 瑕疵检测方法及装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334909A (zh) * 2018-03-09 2018-07-27 南京天数信息科技有限公司 基于ResNet的宫颈癌TCT数字切片数据分析方法
CN110047056A (zh) * 2018-01-16 2019-07-23 西门子保健有限责任公司 用深度图像到图像网络和对抗网络的跨域图像分析和合成
EP3522079A1 (en) * 2018-02-01 2019-08-07 Siemens Healthcare Limited Data encoding and classification
CN111008643A (zh) * 2019-10-29 2020-04-14 平安科技(深圳)有限公司 基于半监督学习的图片分类方法、装置和计算机设备
CN111199193A (zh) * 2019-12-23 2020-05-26 平安国际智慧城市科技股份有限公司 基于数字切片的图片分类方法、装置和计算机设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804878B (zh) * 2018-06-16 2020-08-11 志诺维思(北京)基因科技有限公司 一种染色模拟方法及装置
CN110363296B (zh) * 2019-06-28 2022-02-08 腾讯医疗健康(深圳)有限公司 任务模型获取方法和装置、存储介质及电子装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047056A (zh) * 2018-01-16 2019-07-23 西门子保健有限责任公司 用深度图像到图像网络和对抗网络的跨域图像分析和合成
EP3522079A1 (en) * 2018-02-01 2019-08-07 Siemens Healthcare Limited Data encoding and classification
CN108334909A (zh) * 2018-03-09 2018-07-27 南京天数信息科技有限公司 基于ResNet的宫颈癌TCT数字切片数据分析方法
CN111008643A (zh) * 2019-10-29 2020-04-14 平安科技(深圳)有限公司 基于半监督学习的图片分类方法、装置和计算机设备
CN111199193A (zh) * 2019-12-23 2020-05-26 平安国际智慧城市科技股份有限公司 基于数字切片的图片分类方法、装置和计算机设备

Also Published As

Publication number Publication date
CN111199193A (zh) 2020-05-26
CN111199193B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
WO2021128851A1 (zh) 基于数字切片的图片分类方法、装置和计算机设备
CN105844669B (zh) 一种基于局部哈希特征的视频目标实时跟踪方法
CN112818862B (zh) 基于多源线索与混合注意力的人脸篡改检测方法与系统
JP4505362B2 (ja) 赤目検出装置および方法並びにプログラム
CN109359541A (zh) 一种基于深度迁移学习的素描人脸识别方法
US7627146B2 (en) Method and apparatus for effecting automatic red eye reduction
CN111160313B (zh) 一种基于lbp-vae异常检测模型的人脸表示攻击检测方法
CN108921782A (zh) 一种图像处理方法、装置及存储介质
CN107292307B (zh) 一种倒置汉字验证码自动识别方法及系统
US20200279101A1 (en) Face verification method and apparatus, server and readable storage medium
CN113344826B (zh) 图像处理方法、装置、电子设备及存储介质
CN111339897B (zh) 活体识别方法、装置、计算机设备和存储介质
CN112836625A (zh) 人脸活体检测方法、装置、电子设备
TWI803243B (zh) 圖像擴增方法、電腦設備及儲存介質
WO2021159802A1 (zh) 图形验证码识别方法、装置、计算机设备及存储介质
CN118038515B (zh) 一种人脸识别方法
KR20220056707A (ko) 얼굴의 정렬 형태에 강인한 얼굴 인식 방법 및 그 장치
TWI792696B (zh) 顏色恆常性對比學習的方法和裝置
CN113052783A (zh) 一种基于人脸关键点的人脸图像融合方法
CN116822548B (zh) 生成高识别率ai二维码的方法及计算机可读存储介质
CN115497097A (zh) 一种倾斜汉字点选验证码识别方法
CN111539263B (zh) 一种基于聚合对抗网络的视频人脸识别方法
CN116912918B (zh) 一种人脸识别方法、装置、设备及计算机可读存储介质
CN116895093B (zh) 一种人脸识别方法、装置、设备及计算机可读存储介质
CN111738242B (zh) 一种基于自适应和色彩归一的人脸识别方法及系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20906714

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 31.10.2022)

122 Ep: pct application non-entry in european phase

Ref document number: 20906714

Country of ref document: EP

Kind code of ref document: A1