WO2020222555A1 - 영상 분석 장치 및 방법 - Google Patents

영상 분석 장치 및 방법 Download PDF

Info

Publication number
WO2020222555A1
WO2020222555A1 PCT/KR2020/005745 KR2020005745W WO2020222555A1 WO 2020222555 A1 WO2020222555 A1 WO 2020222555A1 KR 2020005745 W KR2020005745 W KR 2020005745W WO 2020222555 A1 WO2020222555 A1 WO 2020222555A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
analysis
sensitivity
learning model
object image
Prior art date
Application number
PCT/KR2020/005745
Other languages
English (en)
French (fr)
Inventor
김원태
강신욱
이명재
김동민
송우혁
Original Assignee
(주)제이엘케이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)제이엘케이 filed Critical (주)제이엘케이
Publication of WO2020222555A1 publication Critical patent/WO2020222555A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Definitions

  • the present disclosure relates to an image analysis apparatus and method. More specifically, the present disclosure relates to an apparatus and method for analyzing an object included in an input image by using a pre-learned deep learning-based model.
  • Deep learning is to learn a very large amount of data, and when new data is input, the highest probability is selected based on the learning result.
  • Such deep learning can operate adaptively according to an image, and since feature factors are automatically found in the process of learning a model based on data, attempts to utilize this in the field of artificial intelligence are increasing.
  • the conventional image analysis technology using deep learning uses a convolutional neural network (CNN) and a max pooling technique to extract local features for each area of the image and Recognize images based on the background.
  • CNN convolutional neural network
  • max pooling technique to extract local features for each area of the image and Recognize images based on the background.
  • this method has a problem in that the content of the actual image is different, but it does not provide an accurate recognition result for an image having a similar local information type.
  • Images used in the electronic customs clearance system generally use different colors depending on the physical properties of objects included in the image (for example, whether the object is an organic material, inorganic material, metal, etc.) for more effective image reading.
  • the object is an organic material, inorganic material, metal, etc.
  • the object detection method according to the prior art is configured to analyze by applying the same level of accuracy to the entire area of the image, there is a problem in that it is not possible to adaptively analyze the area where a specific object exists.
  • An object of the present disclosure is to provide an image analysis apparatus and method capable of controlling an accuracy level for a specific region using a level based on color information of an image.
  • Another technical problem of the present disclosure is to provide an apparatus and method for determining a sensitivity level based on color information of an image and performing image analysis in consideration of the determined sensitivity level.
  • Another technical problem of the present disclosure is to provide an apparatus and method for performing image analysis using a learning model for determining a sensitivity level based on color information of an image.
  • an apparatus for analyzing an object included in an image comprising: an image receiving unit configured to receive an analysis target image; An object image extracting unit for extracting an object included in the analysis target image and configuring an object image including the object; An object characteristic checker for acquiring color information of the object image and checking a characteristic of the object image based on the color information; A sensitivity determination unit for checking sensitivity information of the object image by using a sensitivity classification learning model for classifying the sensitivity level of the object image; And an image analysis unit configured to control an accuracy level of a region in which the object image exists based on sensitivity information of the object image, and output a result of analyzing the analysis target image according to the accuracy level.
  • an image receiving unit configured to receive an analysis target image
  • An object image extracting unit for extracting an object included in the analysis target image and configuring an object image including the object
  • An object characteristic checker for acquiring color information of the object image and checking a characteristic of the object image based on the color information
  • a sensitivity determination unit for checking sensitivity information of the
  • An image analysis method comprising the step of controlling an accuracy level of an area in which the object image exists based on sensitivity information of the object image and outputting a result of analyzing the analysis target image according to the accuracy level may be provided.
  • a computer-readable recording medium in which a program for executing the image analysis method of the present disclosure is recorded may be provided.
  • an image analysis apparatus and method may be provided.
  • an image analysis apparatus and method capable of controlling an accuracy level for a specific region by using a level based on color information of an image may be provided.
  • an apparatus and method for determining a sensitivity level based on color information of an image and performing image analysis in consideration of the determined sensitivity level may be provided.
  • an apparatus and method for performing image analysis using a learning model for determining a sensitivity level based on color information of an image may be provided.
  • FIG. 1 is a diagram illustrating an artificial intelligence system to which an image analysis device according to an exemplary embodiment is applied.
  • FIG. 2 is a block diagram illustrating a configuration of an image analysis apparatus according to an embodiment of the present disclosure.
  • FIG. 3 is a diagram for describing an operation of configuring an object image according to an embodiment of the present disclosure.
  • 4A to 4D are diagrams illustrating an image generated by an image analysis apparatus according to an embodiment of the present disclosure.
  • 5A and 5B are diagrams illustrating a difference image and a characteristic image generated by an image analysis device according to an embodiment of the present disclosure.
  • FIG. 6 is a diagram illustrating an operation of calculating the best reference value for an outlier score by an image analysis device according to an embodiment of the present disclosure.
  • FIG. 7 is a flowchart illustrating a procedure of an image analysis method according to an embodiment of the present disclosure.
  • a component when a component is said to be “connected”, “coupled” or “connected” with another component, it is not only a direct connection relationship, but an indirect connection relationship in which another component exists in the middle. It can also include.
  • a certain component when a certain component “includes” or “have” another component, it means that other components may be further included rather than excluding other components unless otherwise stated. .
  • first and second are used only for the purpose of distinguishing one component from other components, and do not limit the order or importance of the components unless otherwise noted. Accordingly, within the scope of the present disclosure, a first component in one embodiment may be referred to as a second component in another embodiment, and similarly, a second component in one embodiment is a first component in another embodiment. It can also be called.
  • components that are distinguished from each other are intended to clearly describe each feature, and do not necessarily mean that the components are separated. That is, a plurality of components may be integrated to be formed in one hardware or software unit, or one component may be distributed in a plurality of hardware or software units. Therefore, even if not stated otherwise, such integrated or distributed embodiments are also included in the scope of the present disclosure.
  • components described in various embodiments do not necessarily mean essential components, and some may be optional components. Accordingly, an embodiment consisting of a subset of components described in the embodiment is also included in the scope of the present disclosure. In addition, embodiments including other components in addition to the components described in the various embodiments are included in the scope of the present disclosure.
  • FIG. 1 is a diagram illustrating an artificial intelligence system to which an image analysis device according to an exemplary embodiment is applied.
  • the artificial intelligence system 100 may include a reading unit 110 and/or a learning unit 120.
  • the reading unit 110 may include an image analysis device 112 and/or an output device 114.
  • the learning unit 120 may include a database 122, a deep learning learning unit 124, an algorithm verification unit 126, and/or a learned model storage unit 128.
  • the reading unit 110 can function as a reading interface, and the learning unit 120 can function as a centrally managed AI data center.
  • the artificial intelligence system 100 detects a lesion area or detects a lesion area based on an electronic customs clearance system that detects a target object based on an image of a cargo, and medical images (eg, MRI, CT, Ultrasonic, etc.). It may include a medical image analysis system to be analyzed.
  • the artificial intelligence system 100 illustrates the configuration of the artificial intelligence system 100 based on the electronic customs clearance system, but the present disclosure is not limited thereto, and as described above, It can be modified and used in artificial intelligence systems.
  • the input 130 of the artificial intelligence system 100 may include video and/or cargo information.
  • the image may be an image of a cargo including at least one object.
  • it may be an X-ray image of a cargo captured by an X-ray reading device.
  • the image may be a raw image captured by an X-ray imaging device, or may be an image in any form (format) for storing or transmitting the raw image.
  • the image may be obtained by capturing image information that is captured by an X-ray reader and transmitted to an output device such as a monitor, and converting it into data.
  • the image may be enhanced before being output to the output device 114 or before being input to the image analysis device 112.
  • the output device 114 may output an image or an enhanced image.
  • the image analysis device 112 may receive an image or an enhanced image and perform an operation of the image analysis device 112 to be described later.
  • the cargo information may be information on a cargo included in a corresponding video.
  • the cargo information may include, for example, import declaration information and/or customs clearance list information.
  • the cargo information may undergo a predetermined pre-processing process before being input to the image analysis device 112. For example, a product name refinement operation may be performed on a cargo list, carry-in information, etc. included in the cargo information.
  • the refining of product names may mean unifying the names of various cargoes input for the same or similar cargo.
  • the cargo is a cargo to be inspected or read and may include all kinds of cargo.
  • the cargo may be at least one of express cargo, postal cargo, container cargo, tourist transport cargo, and traveler himself.
  • the traveler is read, and the traveler is a critical traveler with a history of transporting abnormal or dangerous objects in the past, the traveler's cargo is analyzed and/or read at a higher level than that of other travelers. You can do it.
  • the artificial intelligence system 100 may receive the image and/or cargo information 130 and transmit it to the output device 114 or transmit it to the image analysis device 112.
  • the image analysis device 112 may analyze the input image using a deep learning-based model that has been learned in advance.
  • the image analysis device 112 may transmit the analyzed result to the output device 114.
  • the output device 114 outputs the input image and/or cargo information 130 and the image analysis result transmitted from the image analysis device 112, and the reader 140 reads the output result of the output device 114 can do.
  • the refining operation may be performed on the cargo information 130, and before being input to the image analysis device 112 and/or before being output to the output device 114, the image to be analyzed is Reinforcement can be performed.
  • the output device 114 outputs all types of signals that can be detected by humans, such as a device that outputs visual information such as a monitor and a warning light, a device that outputs sound information such as a speaker, and a device that outputs tactile information such as a vibrator. Includes devices capable of.
  • the image analysis device 112 may perform various processes of analyzing an image to be analyzed. For example, the image analysis device 112 may perform context analysis in order to more accurately analyze an image to be analyzed. Various processes and context analysis performed by the image analysis device 112 will be described later.
  • the reader 140 may determine whether to perform an additional test based on the image analysis result output through the output device 114.
  • the additional inspection may include a retrofit inspection of directly opening the cargo related to the image to check objects included in the cargo.
  • the object to be searched may mean an object having an abnormality or an object having a risk of a threshold value or more, as described above.
  • the present disclosure is not limited thereto, and various objects to be detected or searched for by the system of the present disclosure may be included.
  • the image analysis result of the image analysis device, the remodeling test result input after the reader directly performs the refurbishment test, and/or the matching result information obtained by matching the image and cargo information by the image analysis device will be transmitted to the learning unit 120.
  • the learning unit 120 may store newly received information in the database 122, and the deep learning learning unit 124 may perform deep learning learning using information stored in the database 122. Alternatively, the deep learning learning unit 124 may directly receive all or part of the training data without being stored in the database 122.
  • the result learned by the deep learning learning unit 124 is verified by the algorithm verification unit 126, and the verified model may be stored as an updated model in the learned model storage unit 128.
  • the model stored in the learned model storage unit 128 is transmitted to the image analysis device 112 again, and the image analysis device 112 may update and use the received model as the previously learned deep learning-based model. .
  • the learning unit 120 may generate one synthesized image by receiving and synthesizing a plurality of images.
  • a virtual image analysis result corresponding to the composite image, remodeling test result and/or matching result information may be generated using image analysis results, remodeling test results, and/or matching result information for each of the plurality of images. I can.
  • the learning unit 120 may use the synthesized image and the generated virtual information as learning data. According to this, even if the number of training data is absolutely small, by synthesizing or merging these training data, a sufficient amount of training data required for training of an artificial intelligence model can be generated. Synthesis of images and generation of virtual information on the synthesized images will be described later.
  • the reading unit 110 and the learning unit 120 may be implemented as separate devices, or may be implemented in the same device. In addition, some or all of the configurations included in the reading unit 110 and the learning unit 120 may be composed of hardware or software.
  • Artificial intelligence technology allows computers to learn data and make decisions on their own like humans.
  • Artificial neural networks are mathematical models inspired by biological neural networks. By changing the strength of synaptic coupling through learning, neurons can mean the overall model with problem solving ability.
  • Artificial neural networks are generally composed of an input layer, a hidden layer, and an output layer, and neurons included in each layer are connected through weights, and linear combination of weights and neuron values and nonlinearity. Through the activation function, the artificial neural network can have a form that can approximate complex functions.
  • the purpose of artificial neural network training is to find a weight that minimizes the difference between the calculated output and the actual output in the output layer.
  • a deep neural network is an artificial neural network consisting of several hidden layers between the input layer and the output layer. Complex nonlinear relationships can be modeled through many hidden layers, and advanced abstraction is possible by increasing the number of layers.
  • the structure is called deep learning. Deep learning learns a very large amount of data, and when new data is input, it selects the highest probabilistic answer based on the learning result, so it can operate adaptively according to the image and build a model based on the data. Feature factors can be found automatically during the learning process.
  • a deep learning-based model is a fully convolutional neural network (a fully convolutional neural network), a convolutional neural network (a convolutional neural network), a recurrent neural network (regression It may include at least one of a neural network, a recurrent neural network, a restricted Boltzmann machine (RBM), and a deep belief neural network (DBN), but is not limited thereto.
  • machine learning methods other than deep learning may also be included.
  • a hybrid model that combines deep learning and machine learning may be included.
  • a deep learning-based model may be applied to extract features of an image, and a machine learning-based model may be applied when classifying or recognizing an image based on the extracted features.
  • the machine learning-based model may include, but is not limited to, a support vector machine (SVM), AdaBoost, and the like.
  • a method of learning a deep learning-based model may include at least one of supervised learning, unsupervised learning, and reinforcement learning.
  • Supervised learning is performed by using a series of training data and a corresponding label (label, target output value), and a neural network model based on supervised learning is a model that infers a function from training data.
  • Supervised learning receives a series of training data and the corresponding target output value, finds errors through learning that compares the actual output value of the input data with the target output value, and corrects the model based on the result. do.
  • Supervised learning can be further divided into regression, classification, detection, semantic segmentation, and the like according to the shape of the result. Functions derived through supervised learning can be used to predict new outcomes again. In this way, the neural network model based on supervised learning optimizes the parameters of the neural network model through learning a number of training data.
  • the deep learning-based model may use input images and information on cargo for learning, and even after generating the trained model, the image and cargo information acquired from the device of the present disclosure are Can be used to update the neural network model.
  • the deep learning-based model searches for an analysis result output by the method of the present disclosure, for example, whether there is an abnormality or risk of an identified object, information about the object, and the identified object.
  • the neural network model may be updated using a prediction result such as whether or not the object is a target object, comparison information on the prediction result and the final remodeling test result, and evaluation or reliability information on the prediction result.
  • FIG. 2 is a block diagram illustrating a configuration of an image analysis apparatus according to an embodiment of the present disclosure.
  • the image analysis apparatus 200 of FIG. 2 is an embodiment of the image analysis apparatus 112 of FIG. 1.
  • the image analysis apparatus 200 receives an analysis target image, configures an object image in which an object included in the analysis target image exists, obtains color information for each of the object images, and color information On the basis of, it is possible to check the characteristics of the object, set the sensitivity level of the object image based on the characteristics of the checked object, and output the result of analyzing the image using the set sensitivity level, that is, the image analysis result. .
  • the image analysis apparatus 200 may include an image receiving unit 210, an object image extracting unit 220, an object characteristic checking unit 230, a sensitivity determining unit 240, and/or an image analyzing unit 250.
  • an image receiving unit 210 may include an image receiving unit 210, an object image extracting unit 220, an object characteristic checking unit 230, a sensitivity determining unit 240, and/or an image analyzing unit 250.
  • this is only showing some components necessary to describe the present embodiment, and components included in the image analysis apparatus 200 are not limited to the above-described examples.
  • two or more constituent units may be implemented in one constituent unit, or an operation executed in one constituent unit may be divided and implemented to be executed in two or more constituent units.
  • some components may be omitted or additional components may be added.
  • the image receiver 210 may receive the analysis target image 20 including one or more objects.
  • the image to be analyzed 20 may be an image of a cargo including one object.
  • the image to be analyzed 20 may be an X-ray image of a cargo photographed by an X-ray reading device.
  • the analysis target image 20 may be a raw image captured by an X-ray imaging device, or may be an image of an arbitrary form (format) for storing or transmitting the raw image.
  • the analysis target image 20 may be obtained by capturing image information that is captured by an X-ray reader and transmitted to an output device such as a monitor, and converting it into data.
  • the object image extracting unit 220 may extract at least one object included in the analysis target image received from the image receiving unit 210 and divide each of the extracted at least one object to construct at least one object image. have.
  • the image to be analyzed may be an image photographed using a predetermined light such as X-ray, in which a region including various objects is used, and each object is They may appear in different colors, and the boundaries or outlines of objects may be distinguished.
  • extracting an object means cropping a partial area of the image in consideration of an area in which the same color is continuously displayed, an area in which a color change appears in the analysis target image, etc. It can mean doing.
  • the object image extractor 220 may compare the pixel value of the analysis target image with a predetermined threshold value to binarize the pixel value, and group the binarized pixel values to extract an object included in the analysis target image.
  • the object image extraction unit 220 removes noise from the binarized pixel value, detects a blob of a predetermined size or more, and crops the detected blob to generate at least one object. You can compose the video.
  • the object image extracting unit 220 may remove noise from an image to be analyzed by performing a morphology operation transformation (morphology).
  • the object image extracting unit 220 may acquire an object image by specifying a bounding box surrounding the object area, and based on the specified rectangular box, generate position information of the divided object You may.
  • an object and a background may be included in the image to be analyzed.
  • the object refers to a specific object in the image
  • the background may refer to a portion of the image excluding an object.
  • the background of the image may be expressed in a predetermined color according to the image capturing method or the capturing device.
  • the predetermined color may be white.
  • the object image extracting unit 220 preferentially separates the background and the object based on the specified background color, and then extracts the above-described object image for the area where the object is separated. You can also perform the configuration operation.
  • the object image extracting unit 220 may perform an operation of dividing the object region and the background region from the analysis target image as a preprocessing operation.
  • the object image extractor 300 of FIG. 3 may be an embodiment of the object image extractor 220 of FIG. 2.
  • the image to be analyzed 310 may be the image to be analyzed 20 described with reference to FIG. 2, and may be, for example, an image of a cargo including a container 311 filled with liquid, a mobile phone 312, and the like. .
  • the object image extracting unit 300 first compares the pixel value of the image to be analyzed 310 including the container 311 filled with liquid, the mobile phone 312, and the like with a predetermined threshold to calculate the pixel value.
  • the binarized image 320 may be obtained by performing a binarization operation.
  • the object image extraction unit 300 processes adjacent pixels (clustering, morphology, cropping) to select a portion for each object in the binarized image 320 to obtain a noise-removed image 330. I can.
  • the cropped object images 340a, 340b which roughly cut the surrounding area based on the container 311 filled with liquid, the mobile phone 312, etc. 340c) can be obtained.
  • the object image is made based on an X-ray image, it may appear in different colors depending on the physical properties of the object (for example, whether the object is an organic material, inorganic material, metal, etc.). I can. For example, if the object is a plastic container filled with liquid, the object may appear orange in the object image, and if the object is an electronic device made of metal, the object may appear blue in the object image.
  • the object characteristic checking unit 230 may check the characteristics of each of the object images divided by the object image extracting unit 220 based on color information displayed on the object image.
  • the color information may include information on each of n (n is an integer greater than 1) color expression ranges.
  • the color expression range may vary depending on the type and performance of the image acquisition device.
  • the color distribution information may include information on each of the three color expression ranges.
  • the color expression ranges are R, G, B, Y (yellow), and P (purple)
  • the color information may include information on each of the five color expression ranges.
  • the input image is an X-ray image of a cargo captured by an X-ray reader
  • the X-ray image is the physical properties of the objects included in the image (e.g., the object is organic, inorganic, metal). Etc.)
  • different color expression ranges may be used. That is, the range of color expression may differ according to the physical properties of the objects.
  • the object characteristic checking unit 230 may calculate and provide an anomaly score indicating characteristics of the object image. Specifically, the object characteristic check unit 230 separates the object image 410 (see FIG. 4A) into R, G, and B channels, and separates the R-channel object image 420 (see FIG. 4B), and the G-channel object image 430 (FIG. 4c), a B-channel object image 440 (refer to FIG. 4D) may be configured. In addition, the object characteristic check unit 230 may calculate an outlier score capable of expressing the characteristic of the object to be detected using the object images 420, 430, and 440 divided into R, G, and B channels.
  • the object characteristic checker 230 extracts the R-channel object image 420, detects a pixel corresponding to orange color in the R-channel object image 420, and detects the entire area of the R-channel object image.
  • the percentage of pixels can be calculated as an outlier score.
  • the object image is based on an X-ray image
  • characteristics of the overlapped objects may appear in the object image.
  • the object image 410 is configured based on a state in which a metal object 412 is overlapped in front of a container 411 filled with a liquid as shown in FIG. 4A
  • a region in which a metal object exists In 413 not only a blue area but also an orange component may appear.
  • the object characteristic check unit 230 extracts the R-channel object image 420 and the B-channel object image 440, and subtracts the B-channel object image 440 from the R-channel object image 420 to make a difference.
  • An image 510 (refer to FIG. 5A) may be configured.
  • the object characteristic checker 230 may calculate a pixel ratio of an area in which the object to be detected exists in the difference image 510 as an outlier score.
  • the object characteristic check unit 230 sets a threshold value that is a reference for detecting an area where an object exists in the difference image 510, and binarizes it based on the set threshold value, and the characteristic image 520 (see FIG. 5B) ), and the ratio of pixels remaining in the characteristic image 520 may be calculated as an outlier score.
  • an object image is configured based on an X-ray image
  • the present invention is not limited thereto.
  • the object image may be configured based on various images such as MRI, CT, and Ultrasonic depending on the object to be detected.
  • the object to be detected is a container filled with liquid, and the outlier score is calculated using an R-channel object image or a B-channel object image corresponding thereto, but the present invention is not limited thereto.
  • the object to be detected may be variously changed, and it is sufficient if the object characteristic check unit 230 can calculate an outlier score that can be represented by the characteristic of the object to be detected.
  • the object to be detected may be composed of a body region, a lesion region, and the like, and the object characteristic check unit 230 may be configured to calculate an outlier score that can be expressed by characteristics such as a body region and a lesion region.
  • the sensitivity determiner 240 may receive an outlier score provided by the object characteristic checker 230 and output sensitivity information corresponding thereto.
  • the sensitivity information may include a sensitivity level corresponding to an outlier score of the object image, location information of an area where the object image is located, and the like.
  • the sensitivity determination unit 240 may determine a sensitivity level using the sensitivity classification learning model 245.
  • the sensitivity classification learning model 245 may be stored and managed in the learned model storage unit 128 of FIG. 1 described above.
  • the sensitivity classification learning model 245 may be a model trained to perform binary classification of an object image into an abnormal region and a normal image.
  • the abnormal area is an area where the object to be detected is likely to exist and means an area that the user should carefully observe
  • the normal area is an area where the object to be detected is unlikely to exist and does not require careful observation by the user. Can mean area.
  • the sensitivity classification learning model 245 calculates the best reference value for the outlier score that can separate the abnormal region from the normal image, and the sensitivity corresponding to the abnormal region based on the calculated reference value (hereinafter referred to as'abnormal sensitivity'). Wow, it may be learned to configure a sensitivity (hereinafter referred to as'normal sensitivity') corresponding to the normal region. For example, as illustrated in FIG. 6, the sensitivity classification learning model 245 may receive an outlier score of an object region, and whether the input outlier score is an outlier score 610 classified as an abnormal region or classified as a normal region. It may be learned to set the reference value 630 for classifying the recognition of the outlier score 620 to be the best.
  • the sensitivity classification learning model 245 can be learned to calculate the best reference value for the outlier score by further considering the target to be detected. have. Based on the foregoing, the sensitivity classification learning model 245 may receive an outlier score and information on an object to be detected, and output a corresponding sensitivity level using the outlier score and information on the object to be detected. I can.
  • the sensitivity determination unit 240 exemplifies classifying an object image as an abnormal sensitivity level and a normal sensitivity using the sensitivity classification learning model 245, but the present disclosure is not limited thereto. , It can be changed in various ways.
  • the sensitivity classification learning model 245 may be configured to classify sensitivity levels divided into a predetermined number (eg, 3, 4, 5, etc.).
  • the image analysis unit 250 receives the analysis target image and sensitivity information, analyzes the image (analysis target image) using the previously learned image analysis learning model 255, and outputs the analyzed result.
  • the image analysis unit 250 may identify an object included in the image and determine whether there is an abnormality or a risk of the identified object, and may control the accuracy level of object identification by reflecting the sensitivity information. That is, the image analysis unit 250 may check a sensitivity level included in the sensitivity information and an area corresponding to the sensitivity level (eg, an area in which a corresponding object image is located). The image analysis unit 250 may set an accuracy level of the image analysis learning model 255 according to the sensitivity level, and the image analysis learning model 255 may identify an object with a set level of accuracy. Specifically, the image analysis learning model 255 may output location information of an object and a probability of whether the corresponding object corresponds to a search target object.
  • the image analysis learning model 255 outputs the detected probability as it is, and the probability for the object appears to be relatively smaller than the above-described sensitivity when the probability for the object is equal to or relatively larger than the above-described sensitivity. Case can be configured to ignore the detection result.
  • the image analysis result output by the image analysis unit 250 may include at least one of a risk, type, amount, number, size, and location of the object.
  • the location of the corresponding object may be displayed on the analysis target image and output to an output device.
  • the location of the object may be displayed in coordinates, but the object can be highlighted and displayed at the corresponding location in the output image so that the reader can easily read it.
  • the edge of the object may be emphasized or the object may be emphasized by displaying a rectangular box surrounding the object.
  • a predetermined object area may be enhanced so that the reader can more easily identify the object through the image enhancement process. For example, by enhancing an area corresponding to a predetermined color, the image may be transformed so that the area can be more clearly identified.
  • the image analysis unit 250 may determine whether an object to be searched (eg, an object for which customs clearance is prohibited or inappropriate) is included in the image to be analyzed. To this end, the image analysis unit 250 may receive or store information on the object to be searched in advance. Also, the image analysis unit 250 may identify an object included in the image and determine whether the identified object is a search target object.
  • an object to be searched e.g, an object for which customs clearance is prohibited or inappropriate
  • FIG. 7 is a flowchart illustrating a procedure of an image analysis method according to an embodiment of the present disclosure.
  • An image analysis method according to an embodiment of the present disclosure may be performed by the image analysis apparatus 200 (see FIG. 2) described above.
  • An image analysis method analyzes an area in which a predetermined object included in an input image or an image to be analyzed is located, and results of image analysis such as risk, type, amount, number, size, location, etc. Can be configured to output.
  • the image analysis method is an electronic customs clearance system that detects an object based on an image of a cargo, and a medical system that detects a lesion area or analyzes the lesion area based on medical images (e.g., MRI, CT, Ultrasonic, etc.). It can be applied to image analysis systems and the like.
  • the image analysis method illustrates an operation performed based on an electronic customs clearance system, but the present disclosure is not limited thereto, and as described above, it may be changed and applied to artificial intelligence systems in various fields. have.
  • the image analysis apparatus may receive an analysis target image including one or more objects.
  • the image to be analyzed may be an image of a cargo including one object, an image formed by photographing at least a part of a body (eg, MRI, CT, Ultrasonic, etc.).
  • the image to be analyzed may be an X-ray image of a cargo photographed by an X-ray reading device.
  • the analysis target image may be a raw image captured by an X-ray imaging device, or may be an image in any form (format) for storing or transmitting the raw image.
  • the analysis target image may be acquired by capturing image information that is captured by an X-ray reader and transmitted to an output device such as a monitor, and converts it into data.
  • the image analysis apparatus may extract at least one object included in the received analysis target image, and divide each of the extracted at least one object to construct at least one object image.
  • the image to be analyzed may be an image photographed using a predetermined light such as X-ray, in which a region including various objects is used, and each object is They may appear in different colors, and the boundaries or outlines of objects may be distinguished.
  • extracting an object means cropping a partial area of the image in consideration of an area in which the same color is continuously displayed in the image to be analyzed, an area in which a change in the image occurs, etc. It can mean doing.
  • the image analysis apparatus may binaryize a pixel value by comparing a pixel value of an analysis target image with a predetermined threshold value, and group the binarized pixel values to extract an object included in the analysis target image.
  • the image analysis device removes noise from the binarized pixel value, detects a blob larger than a predetermined size, and constructs at least one object image by cropping the detected blob.
  • the object image extracting unit 220 may remove noise from an image to be analyzed by performing a morphology operation transformation (morphology).
  • the image analysis apparatus may obtain an object image by specifying a bounding box surrounding the object area, and may generate location information of the divided object based on the specified rectangular box.
  • an object and a background may be included in the image to be analyzed.
  • the object refers to a specific object in the image
  • the background may refer to a portion of the image excluding an object.
  • the background of the image may be expressed in a predetermined color according to the image capturing method or the capturing device.
  • the predetermined color may be white.
  • the image analysis apparatus first separates the background and the object based on the specified background color, and then performs the operation of constructing the above-described object image for the area where the object is separated. You can also do it.
  • the image to be analyzed is an X-ray image of a cargo captured by an X-ray reader
  • the background part other than the cargo is unnecessary, so the background part can be cut out and analyzed only in the area where the cargo exists. have.
  • the image analysis apparatus may perform an operation of dividing the object region and the background region from the analysis target image as a preprocessing operation.
  • the object image is made based on an X-ray image, it may appear in different colors depending on the physical properties of the object (for example, whether the object is an organic material, inorganic material, metal, etc.). I can. For example, if the object is a plastic container filled with liquid, the object may appear orange in the object image, and if the object is an electronic device made of metal, the object may appear blue in the object image.
  • the image analysis apparatus may check characteristics of each object image based on color information displayed on the object image.
  • the color information may include information on each of n (n is an integer greater than 1) color expression ranges.
  • the color expression range may vary depending on the type and performance of the image acquisition device.
  • the color distribution information may include information on each of the three color expression ranges.
  • the color expression ranges are R, G, B, Y (yellow), and P (purple)
  • the color information may include information on each of the five color expression ranges.
  • the input image is an X-ray image of a cargo captured by an X-ray reader
  • the X-ray image is the physical properties of the objects included in the image (e.g., the object is organic, inorganic, metal). Etc.)
  • different color expression ranges may be used. That is, the range of color expression may differ according to the physical properties of the objects.
  • the image analysis apparatus may calculate and provide an anomaly score indicating characteristics of an object image. Specifically, the image analysis apparatus separates the object image 410 (refer to FIG. 4A) into R, G, and B channels, and the R-channel object image 420 (refer to FIG. 4B), the G-channel object image 430 (refer to FIG. 4C), A B-channel object image 440 (refer to FIG. 4D) may be configured. In addition, the image analysis apparatus may calculate an outlier score capable of expressing the characteristics of the object to be detected using the object images 420, 430, and 440 divided into R, G, and B channels.
  • the image analysis apparatus extracts the R-channel object image 420, detects a pixel corresponding to orange color in the R-channel object image 420, and calculates the ratio of the detected pixel to the entire area of the R-channel object image. It can be calculated as an outlier score.
  • the object image is based on an X-ray image
  • characteristics of the overlapped objects may appear in the object image.
  • the object image 410 is configured based on a state in which a metal object 412 is overlapped in front of a container 411 filled with a liquid as shown in FIG. 4A
  • a region in which a metal object exists In 413 not only a blue area but also an orange component may appear.
  • the object characteristic check unit 230 extracts the R-channel object image 420 and the B-channel object image 440, and subtracts the B-channel object image 440 from the R-channel object image 420 to make a difference.
  • An image 510 (refer to FIG. 5A) may be configured.
  • the object characteristic checker 230 may calculate a pixel ratio of an area in which the object to be detected exists in the difference image 510 as an outlier score.
  • the image analysis apparatus sets a threshold value that is a reference for detecting an area where an object exists in the difference image 510, and configures a characteristic image 5520 by binarizing based on the set threshold value.
  • the ratio of pixels remaining in the characteristic image 520 may be calculated as an outlier score.
  • an object image is configured based on an X-ray image
  • the present invention is not limited thereto.
  • the object image may be configured based on various images such as MRI, CT, and Ultrasonic depending on the object to be detected.
  • the object to be detected is a container filled with liquid, and in response to this, an outlier score is calculated using an R-channel object image or a B-channel object image, but the present invention is not limited thereto.
  • the object to be detected may be variously changed, and it is sufficient if the image analysis apparatus can calculate an outlier score that can be represented by the characteristics of the object to be detected.
  • the object to be detected may consist of a body region, a lesion region, and the like, and the image analysis apparatus may be configured to calculate an outlier score that can be expressed by characteristics such as a body region and a lesion region.
  • the image analysis device may check the outlier score and output sensitivity information corresponding thereto.
  • the sensitivity information may include a sensitivity corresponding to an outlier score of the object image, location information of an area where the object image is located, and the like.
  • the image analysis apparatus may determine a sensitivity level using a sensitivity classification learning model.
  • the sensitivity classification learning model may be stored and managed in the learned model storage unit 128 of FIG. 1 described above.
  • the sensitivity classification learning model may be a model trained to perform binary classification of an object image into an abnormal region and a normal image.
  • the abnormal area is an area where the object to be detected is likely to exist and means an area that the user should carefully observe
  • the normal area is an area where the object to be detected is unlikely to exist and does not require careful observation by the user. Can mean area.
  • the sensitivity classification learning model calculates the best reference value for the outlier score that can separate the abnormal region from the normal image, and based on the calculated reference value, the sensitivity corresponding to the abnormal region (hereinafter referred to as'abnormal sensitivity') and normal It can be learned to configure the sensitivity (hereinafter referred to as'normal sensitivity') corresponding to the region.
  • the sensitivity classification learning model may receive an outlier score of an object region, and whether the input outlier score is an outlier score 610 classified as an abnormal region or an outlier score classified as a normal region (620) It may be learned to set the reference value 630 for classifying perception as the best.
  • the sensitivity classification learning model may be trained to calculate the best reference value for the outlier score by further considering the target to be detected. Based on the foregoing, the sensitivity classification learning model may receive an outlier score and information on an object to be detected, and may output a corresponding sensitivity level using the outlier score and information on the object to be detected.
  • the image analysis apparatus exemplifies classifying an object image as an abnormal sensitivity level and a normal sensitivity using a sensitivity classification learning model, but the present disclosure is not limited thereto and may be variously changed.
  • the sensitivity classification learning model may be configured to classify sensitivity levels divided into a predetermined number (eg, 3, 4, 5, etc.).
  • the image analysis device may receive the analysis target image and sensitivity information, analyze the image (analysis target image) using a pre-learned image analysis learning model, and then output the analyzed result to the output device. have.
  • the image analysis apparatus may identify an object included in an image, and may control an accuracy level of object identification by reflecting sensitivity information. That is, the image analysis apparatus may check a sensitivity level included in the sensitivity information and an area corresponding to the sensitivity level (eg, an area in which a corresponding object image is located).
  • the image analysis device may set the accuracy level of the image analysis learning model according to the sensitivity level, and the learning model may identify objects with a set level of accuracy.
  • the image analysis learning model may output location information of an object and a probability of whether the object corresponds to a search target object.
  • the image analysis learning model outputs the detected probability as it is when the probability for the object is equal to or relatively higher than the above-described sensitivity, and detects when the probability for the object is relatively smaller than the above-described sensitivity. It can be configured to ignore the result.
  • the image analysis result output by the image analysis device may include at least one of the risk, type, amount, number, size, and location of the object.
  • the location of the corresponding object may be displayed on the analysis target image and output to an output device.
  • the location of the object may be displayed in coordinates, but the object can be highlighted and displayed at the corresponding location in the output image so that the reader can easily read it.
  • the edge of the object may be emphasized or the object may be emphasized by displaying a rectangular box surrounding the object.
  • the image analysis apparatus may determine whether an object to be searched (eg, an object for which customs clearance is prohibited or inappropriate) is included in the image to be analyzed. To this end, the image analysis apparatus may receive or store information on the object to be searched in advance. Also, the image analysis apparatus may identify an object included in the image and determine whether the identified object is a search target object.
  • an object to be searched e.g, an object for which customs clearance is prohibited or inappropriate
  • the image analysis apparatus may identify an object included in the image and determine whether the identified object is a search target object.
  • At least some of the components of the image processing apparatus of the present disclosure and steps of the image processing method may be performed using an artificial intelligence-based or deep learning-based model.
  • the weight determined based on the size, number, and color distribution information of the area generated by dividing the object image, various thresholds mentioned in the present disclosure, whether or not to generate the second output image, etc. are based on artificial intelligence or deep learning. It can be learned using a model, and information according to the learned model can be used.
  • the deep learning-based model of the present disclosure is a fully convolutional neural network (a fully convolutional neural network), a convolutional neural network (convolutional neural network), a recurrent neural network (recurrent neural network). ), a restricted Boltzmann machine (RBM), and a deep belief neural network (DBN), but is not limited thereto.
  • machine learning methods other than deep learning may also be included.
  • a hybrid model that combines deep learning and machine learning may be included.
  • a deep learning-based model may be applied to extract features of an image, and a machine learning-based model may be applied when classifying or recognizing an image based on the extracted features.
  • the machine learning-based model may include, but is not limited to, a support vector machine (SVM), AdaBoost, and the like.
  • exemplary methods of the present disclosure are expressed as a series of operations for clarity of explanation, but this is not intended to limit the order in which steps are performed, and each step may be performed simultaneously or in a different order if necessary.
  • the illustrative steps may include additional steps, other steps may be included excluding some steps, or may include additional other steps excluding some steps.
  • various embodiments of the present disclosure may be implemented by hardware, firmware, software, or a combination thereof.
  • one or more ASICs Application Specific Integrated Circuits
  • DSPs Digital Signal Processors
  • DSPDs Digital Signal Processing Devices
  • PLDs Programmable Logic Devices
  • FPGAs Field Programmable Gate Arrays
  • general purpose It may be implemented by a processor (general processor), a controller, a microcontroller, a microprocessor, or the like.
  • the scope of the present disclosure is software or machine-executable instructions (e.g., operating systems, applications, firmware, programs, etc.) that allow an operation according to a method of various embodiments to be executed on a device or computer, and such software or It includes a non-transitory computer-readable medium (non-transitory computer-readable medium) which stores instructions and the like and is executable on a device or a computer.
  • a non-transitory computer-readable medium non-transitory computer-readable medium

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

영상의 민감도 수준에 기반한 영상 분석 장치 및 방법이 제공된다. 본 개시의 영상 분석 장치는 분석 대상 영상을 수신하는 영상 수신부; 상기 분석 대상 영상에 포함되어 있는 객체를 추출하고, 상기 객체를 포함하는 객체 영상을 구성하는 객체 영상 추출부; 상기 객체 영상의 색상 정보를 획득하고, 상기 색상 정보에 기초하여, 상기 객체 영상의 특성을 확인하는 객체 특성 확인부; 상기 객체 영상의 민감도 수준을 분류하는 민감도 분류 학습모델을 사용하여, 상기 객체 영상의 민감도 정보를 확인하는 민감도 결정부; 및 상기 객체 영상의 민감도 정보에 기초하여 상기 객체 영상이 존재하는 영역의 정확도 수준을 제어하고, 상기 정확도 수준에 따라 상기 분석 대상 영상을 분석한 결과를 출력하는 영상 분석부를 포함한다.

Description

영상 분석 장치 및 방법
본 개시는 영상 분석 장치 및 방법에 관한 것이다. 보다 구체적으로, 본 개시는 미리 학습된 딥러닝 기반의 모델을 이용하여 입력 영상에 포함된 객체를 분석하는 장치 및 방법에 관한 것이다.
딥러닝(deep learning)은 매우 방대한 양의 데이터를 학습하여, 새로운 데이터가 입력될 경우 학습 결과를 바탕으로 확률적으로 가장 높은 답을 선택하는 것이다. 이러한, 딥러닝은 영상에 따라 적응적으로 동작할 수 있으며, 데이터에 기초하여 모델을 학습하는 과정에서 특성인자를 자동으로 찾아내기 때문에 최근 인공 지능 분야에서 이를 활용하려는 시도가 늘어나고 있는 추세이다.
한편, 영상 인식과 관련하여 딥러닝을 이용한 종래의 영상 분석 기술은 합성곱 신경망(Convolutional Neural Network, CNN)과 최대 풀링(max pooling)기법을 이용하여 영상의 각 영역마다 국소적인 특징을 추출하고 이를 바탕으로 영상을 인식한다. 그러나, 이러한 방법은 실제 영상의 내용은 상이하지만 국소적인 정보 형태가 유사한 영상에 대해서는 정확한 인식 결과를 제공하지 못하는 문제가 있다.
전술한, 딥러닝을 이용한 영상 분석 기술은 전자 통관 시스템에 적용될 수 있다. 전자 통관 시스템에서 이용되는 영상은, 보다 효과적인 영상 판독을 위해 일반적으로 영상에 포함되어 있는 객체들의 물성(예를 들어, 해당 객체가 유기물, 무기물, 금속 등인지 여부)에 따라 다른 색상이 사용된다. 그러나, 해당 객체의 외형적인 형상, 명암의 차이, 객체 고유의 X-Ray 감쇄율, 관측 각도 등의 다양한 요인으로 인해 영상에서 해당 객체들을 명확하게 파악하기 어렵다는 문제가 있다.
또한, 객체들의 물성(예를 들어, 해당 객체가 유기물, 무기물, 금속 등인지 여부)에 따라, 대상물을 좀 더 정확한 수준으로 검출할 필요가 있다. 그러나, 종래기술에 따른 객체 검출 방식은 영상 전체 영역에 대해 동일한 수준의 정확도를 적용하여 분석하도록 구성되므로, 특정 대상물이 존재하는 영역에 대해 적응적으로 분석하지 못하는 문제가 있다.
본 개시의 기술적 과제는, 영상의 색상 정보에 기초한 수준을 사용하여 특정 영역에 대한 정확도 수준을 제어할 수 있는 영상 분석 장치 및 방법을 제공하는 것이다.
본 개시의 다른 기술적 과제는, 영상의 색상 정보에 기초하여 민감도 수준을 결정하고, 결정된 민감도 수준을 고려하여 영상 분석을 수행하는 장치 및 방법을 제공하는 것이다.
본 개시의 또 다른 기술적 과제는, 영상의 색상 정보 기반의 민감도 수준을 결정하는 학습 모델을 사용하여 영상 분석을 수행하는 장치 및 방법을 제공하는 것이다.
본 개시에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 개시의 일 양상에 따르면, 영상에 포함되는 객체를 분석하는 장치에 있어서, 분석 대상 영상을 수신하는 영상 수신부; 상기 분석 대상 영상에 포함되어 있는 객체를 추출하고, 상기 객체를 포함하는 객체 영상을 구성하는 객체 영상 추출부; 상기 객체 영상의 색상 정보를 획득하고, 상기 색상 정보에 기초하여, 상기 객체 영상의 특성을 확인하는 객체 특성 확인부; 상기 객체 영상의 민감도 수준을 분류하는 민감도 분류 학습모델을 사용하여, 상기 객체 영상의 민감도 정보를 확인하는 민감도 결정부; 및 상기 객체 영상의 민감도 정보에 기초하여 상기 객체 영상이 존재하는 영역의 정확도 수준을 제어하고, 상기 정확도 수준에 따라 상기 분석 대상 영상을 분석한 결과를 출력하는 영상 분석부를 포함하는 영상 분석 장치가 제공될 수 있다.
본 개시의 다른 양상에 따르면, 분석 대상 영상을 수신하는 과정과, 상기 분석 대상 영상에 포함되어 있는 객체를 추출하고, 상기 객체를 포함하는 객체 영상을 구성하는 과정과, 상기 객체 영상의 색상 정보를 획득하고, 상기 색상 정보에 기초하여, 상기 객체 영상의 특성을 확인하는 과정과, 상기 객체 영상의 민감도 수준을 분류하는 민감도 분류 학습모델을 사용하여, 상기 객체 영상의 민감도 정보를 확인하는 과정과, 상기 객체 영상의 민감도 정보에 기초하여 상기 객체 영상이 존재하는 영역의 정확도 수준을 제어하고, 상기 정확도 수준에 따라 상기 분석 대상 영상을 분석한 결과를 출력하는 과정을 포함하는 영상 분석 방법이 제공될 수 있다.
본 개시의 또 다른 양상에 따르면, 본 개시의 영상 분석 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체가 제공될 수 있다.
본 개시에 대하여 위에서 간략하게 요약된 특징들은 후술하는 본 개시의 상세한 설명의 예시적인 양상일 뿐이며, 본 개시의 범위를 제한하는 것은 아니다.
본 개시에 따르면, 영상 분석 장치 및 방법이 제공될 수 있다.
또한, 본 개시에 따르면, 영상의 색상 정보에 기초한 수준을 사용하여 특정 영역에 대한 정확도 수준을 제어할 수 있는 영상 분석 장치 및 방법이 제공될 수 있다.
또한, 본 개시에 따르면, 영상의 색상 정보에 기초하여 민감도 수준을 결정하고, 결정된 민감도 수준을 고려하여 영상 분석을 수행하는 장치 및 방법이 제공될 수 있다.
또한, 본 개시에 따르면, 영상의 색상 정보 기반의 민감도 수준을 결정하는 학습 모델을 사용하여 영상 분석을 수행하는 장치 및 방법이 제공될 수 있다.
본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 개시의 일 실시 예에 따른 영상 분석 장치가 적용되는 인공지능 시스템을 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 영상 분석 장치의 구성을 나타내는 블록도이다.
도 3은 본 개시의 일 실시 예에 따른 객체 영상을 구성하는 동작을 설명하기 위한 도면이다.
도 4a 내지 도 4d는 본 개시의 일 실시 예에 따른 영상 분석 장치에서 생성되는 영상을 예시하는 도면이다.
도 5a 및 도 5b는 본 개시의 일 실시 예에 따른 영상 분석 장치에서 생성되는 차분영상 및 특성영상을 예시하는 도면이다.
도 6은 본 개시의 일 실시 예에 따른 영상 분석 장치에 의해 이상치 점수에 대한 최상의 기준값을 산출하는 동작을 설명하는 도면이다.
도 7은 본 개시의 일 실시 예에 따른 영상 분석 방법의 순서를 나타내는 흐름도이다.
이하에서는 첨부한 도면을 참고로 하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나, 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다.
본 개시의 실시 예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 개시에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 개시에 있어서, 어떤 구성요소가 다른 구성요소와 "연결", "결합" 또는 "접속"되어 있다고 할 때, 이는 직접적인 연결관계뿐만 아니라, 그 중간에 또 다른 구성요소가 존재하는 간접적인 연결관계도 포함할 수 있다. 또한 어떤 구성요소가 다른 구성요소를 "포함한다" 또는 "가진다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 배제하는 것이 아니라 또 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 개시에 있어서, 제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 특별히 언급되지 않는 한 구성요소들 간의 순서 또는 중요도 등을 한정하지 않는다. 따라서, 본 개시의 범위 내에서 일 실시 예에서의 제1 구성요소는 다른 실시 예에서 제2 구성요소라고 칭할 수도 있고, 마찬가지로 일 실시 예에서의 제2 구성요소를 다른 실시 예에서 제1 구성요소라고 칭할 수도 있다.
본 개시에 있어서, 서로 구별되는 구성요소들은 각각의 특징을 명확하게 설명하기 위함이며, 구성요소들이 반드시 분리되는 것을 의미하지는 않는다. 즉, 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있고, 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 따라서, 별도로 언급하지 않더라도 이와 같이 통합된 또는 분산된 실시 예도 본 개시의 범위에 포함된다.
본 개시에 있어서, 다양한 실시 예에서 설명하는 구성요소들이 반드시 필수적인 구성요소들은 의미하는 것은 아니며, 일부는 선택적인 구성요소일 수 있다. 따라서, 일 실시 예에서 설명하는 구성요소들의 부분집합으로 구성되는 실시 예도 본 개시의 범위에 포함된다. 또한, 다양한 실시 예에서 설명하는 구성요소들에 추가적으로 다른 구성요소를 포함하는 실시 예도 본 개시의 범위에 포함된다.
이하, 첨부한 도면을 참조하여 본 개시의 실시 예들에 대해서 설명한다.
도 1은 본 개시의 일 실시 예에 따른 영상 분석 장치가 적용되는 인공지능 시스템을 설명하기 위한 도면이다.
인공지능 시스템(100)은 판독부(110) 및/또는 학습부(120)를 포함할 수 있다. 판독부(110)는 영상 분석 장치(112) 및/또는 출력 장치(114)를 포함할 수 있다. 학습부(120)는 데이터 베이스(122), 딥러닝 학습부(124), 알고리즘 검증부(126) 및/또는 학습된 모델 저장부(128)를 포함할 수 있다. 판독부(110)는 판독 인터페이스로서 기능할 수 있으며, 학습부(120)는 중앙 관리되는 인공지능 데이터 센터로서 기능할 수 있다.
예를 들어, 인공지능 시스템(100)은 화물을 촬영한 영상을 기반으로 목적물을 검출하는 전자 통관 시스템, 의료 영상(예, MRI, CT, Ultrasonic등)을 기반으로 병변영역을 검출 또는 병변영역을 분석하는 의료영상 분석 시스템 등을 포함할 수 있다. 이하, 본 개시의 일실시예에서 인공지능 시스템(100)은 전자 통관 시스템을 기반으로 인공지능 시스템(100)의 구성을 예시하지만, 본 개시가 이를 한정하는 것은 아니며, 전술한 바와 같이 다양한 분야의 인공지능 시스템에 변경되어 사용될 수 있다.
인공지능 시스템(100)의 입력(130)은 영상 및/또는 화물 정보를 포함할 수 있다.
상기 영상은 적어도 하나의 객체를 포함하는 화물에 관한 영상일 수 있다. 예컨대, X-Ray 판독 기기가 촬영한 화물에 관한 X-Ray 영상일 수 있다. 상기 영상은 X-Ray 영상 기기가 촬영한 로(raw) 이미지이거나 상기 로 이미지를 저장 또는 전송하기 위한 임의의 형태(포맷)의 이미지일 수 있다. 상기 영상은 X-Ray 판독 기기가 촬영하여 모니터와 같은 출력 장치로 전송하는 영상 정보를 캡쳐하여 데이터화함으로써 획득될 수도 있다. 영상은 출력 장치(114)에 출력되기 전, 또는 영상 분석 장치(112)에 입력되기 전에 강화될 수 있다. 출력 장치(114)는 영상 또는 강화된 영상을 출력할 수 있다. 영상 분석 장치(112)는 영상 또는 강화된 영상을 입력받아 후술하는 영상 분석 장치(112)의 동작을 수행할 수 있다.
상기 화물 정보는 대응하는 영상에 포함된 화물에 관한 정보일 수 있다. 화물 정보는 예컨대, 수입 신고된 정보 및/또는 통관 목록 리스트 정보를 포함할 수 있다. 화물 정보는 영상 분석 장치(112)에 입력되기 전에 소정의 전처리 과정을 거칠 수 있다. 예컨대, 화물 정보에 포함된 화물 목록, 반입 정보 등에 대해 품명의 정제 작업이 수행될 수 있다. 품명의 정제 작업이란 동일 또는 유사한 화물에 대해 입력되는 다양한 화물의 명칭을 통일하는 작업을 의미할 수 있다.
화물 정보의 입력은 선택적일 수 있다. 예컨대, 본 개시의 인공지능 시스템(100)은 화물 정보의 입력이 없어도 영상만을 입력으로 받아 동작할 수 있다. 상기 화물은 검사 또는 판독 대상의 화물로서 모든 종류의 화물을 포함할 수 있다. 예컨대, 상기 화물은 특송 화물, 우편 화물, 컨테이너 화물, 여행자 수송 화물 및 여행자 자신 중 적어도 하나일 수 있다. 예컨대, 여행자를 판독하고, 판독된 여행자가 이상이 있거나 위험한 객체를 과거에 운송한 이력이 있는 요주의 여행자인 경우, 해당 여행자의 화물에 대해서는 다른 여행자의 화물보다 높은 수준의 분석 및/또는 판독을 수행하도록 할 수 있다. 예컨대, 특정 화물이 요주의 여행자의 화물이라는 정보를 판독원에게 제공할 수 있다.
인공지능 시스템(100)은 영상 및/또는 화물 정보(130)를 입력받아 출력 장치(114)에 전송하거나, 영상 분석 장치(112)에 전송할 수 있다. 영상 분석 장치(112)는 미리 학습된 딥러닝 기반의 모델을 이용하여 입력된 영상을 분석할 수 있다. 영상 분석 장치(112)는 분석된 결과를 출력 장치(114)로 전송할 수 있다. 출력 장치(114)는 입력된 영상 및/또는 화물 정보(130), 영상 분석 장치(112)로부터 전송받은 영상 분석 결과를 출력하고, 판독원(140)은 출력 장치(114)의 출력 결과를 판독할 수 있다. 전술한 바와 같이, 화물 정보(130)에 대해 정제 작업이 수행될 수 있으며, 또한, 영상 분석 장치(112)에 입력되기 전 및/또는 출력 장치(114)에 출력되기 전에 분석 대상 영상에 대해 영상 강화가 수행될 수 있다.
출력 장치(114)는 모니터, 경고등 등의 시각 정보를 출력하는 장치, 스피커 등의 음향 정보를 출력하는 장치, 바이브레이터 등의 촉각 정보를 출력하는 장치 등 인간이 감지할 수 있는 모든 형태의 신호를 출력할 수 있는 장치를 포함한다.
상기 영상 분석 장치(112)의 영상 분석 결과, 해당 영상에 검출 대상인 객체, 이상이 있는 객체 또는 위험도가 임계치 이상인 객체가 포함된 경우, 이와 관련된 정보가 영상 분석 결과로서 출력 장치(114)를 통해 출력되고, 판독원(140)은 이를 확인할 수 있다. 상기 영상 분석 장치(112)는 분석 대상 영상을 분석하는 다양한 과정을 수행할 수 있다. 예컨대, 영상 분석 장치(112)는 분석 대상 영상을 보다 정확히 분석하기 위해, 맥락 분석을 수행할 수 있다. 상기 영상 분석 장치(112)가 수행하는 다양한 과정 및 맥락 분석에 대해서는 후술한다.
판독원(140)은 출력 장치(114)를 통해 출력된 영상 분석 결과에 기초하여 추가적인 검사의 수행 여부를 결정할 수 있다. 상기 추가적인 검사는 해당 영상에 관한 화물을 직접 열어 해당 화물에 포함된 객체를 확인하는 개장 검사를 포함할 수 있다. 본 명세서에서 검색 대상 객체는 전술한 바와 같이 이상이 있는 객체 또는 위험도가 임계치 이상인 객체를 의미할 수 있다. 그러나 이에 한정되지 않으며, 본 개시의 시스템에 의해 검출 또는 검색하고자 하는 다양한 객체를 포함할 수 있다.
영상 분석 장치의 영상 분석 결과, 판독원이 직접 개장 검사를 수행한 후 입력하는 개장 검사 결과 및/또는 영상 분석 장치가 영상과 화물 정보를 매칭한 매칭 결과 정보 등은 학습부(120)에 전송될 수 있다. 학습부(120)는 새롭게 수신한 정보를 데이터 베이스(122)에 저장하고, 딥러닝 학습부(124)는 데이터 베이스(122)에 저장된 정보를 이용하여 딥러닝 학습을 수행할 수 있다. 또는 데이터 베이스(122)에 저장됨이 없이, 딥러닝 학습부(124)가 상기 학습 데이터의 전부 또는 일부를 직접 수신할 수도 있다. 딥러닝 학습부(124)에서 학습된 결과는 알고리즘 검증부(126)에서 검증되고, 검증된 모델은 학습된 모델 저장부(128)에 업데이트된 모델로서 저장될 수 있다. 학습된 모델 저장부(128)에 저장된 모델은 다시 영상 분석 장치(112)로 전송되고, 영상 분석 장치(112)는 수신한 모델을 전술한 미리 학습된 딥러닝 기반의 모델로서 업데이트하여 이용할 수 있다.
학습부(120)는 복수의 영상을 수신하여 합성함으로써 하나의 합성 영상을 생성할 수 있다. 또한 상기 복수의 영상의 각각에 대한 영상 분석 결과, 개장 검사 결과 및/또는 매칭 결과 정보 등을 이용하여 상기 합성 영상에 대응하는 가상의 영상 분석 결과, 개장 검사 결과 및/또는 매칭 결과 정보를 생성할 수 있다. 학습부(120)는 상기 합성 영상 및 상기 생성된 가상의 정보 등을 학습 데이터로서 이용할 수 있다. 이에 따르면 학습 데이터의 수가 절대적으로 적다고 하더라도, 이들 학습 데이터를 합성하거나 병합함으로써, 인공 지능 모델의 학습에 필요한 충분한 양의 학습 데이터를 생성해 낼 수 있다. 영상의 합성 및 합성 영상에 대한 가상의 정보의 생성에 대해서는 후술한다.
판독부(110)와 학습부(120)는 별개의 장치로 구현될 수도 있고, 동일한 장치 내에서 구현될 수도 있다. 또한 판독부(110)와 학습부(120)가 포함하는 구성의 일부 또는 전부는 하드웨어로 구성되거나 소프트웨어로 구성될 수 있다.
인공지능 기술은 컴퓨터에게 데이터를 학습시켜 마치 사람처럼 스스로 의사결정을 할 수 있게 하는데, 인공 신경망(artificial neural network)은 생물학의 신경망에서 영감을 얻은 수학적 모델로서, 시냅스의 결합으로 네트워크를 형성한 인공 뉴런이 학습을 통해 시냅스의 결합 세기를 변화시킴으로써 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다. 인공 신경망은 일반적으로 입력층(input layer), 은닉층(hidden layer) 및 출력층(output layer)로 구성되어 있으며 각 층에 포함된 뉴런들이 가중치를 통해 연결되어 있으며, 가중치와 뉴런값의 선형 결합과 비선형 활성화 함수를 통해 인공 신경망은 복잡한 함수를 근사화할 수 있는 형태를 가질 수 있다. 인공 신경망 학습의 목적은 출력층에서 계산된 출력과 실제 출력의 값 차이를 최소화시키는 가중치를 찾는데 있다.
심층 신경망(deep neural network)은 입력층과 출력층 사이에 여러 개의 은닉층들로 이루어진 인공 신경망으로서, 많은 은닉층을 통해 복잡한 비선형 관계들을 모델링할 수 있으며, 이처럼 층의 개수를 늘림으로써 고도화된 추상화가 가능한 신경망 구조를 딥러닝(deep learning)이라고 부른다. 딥러닝은 매우 방대한 양의 데이터를 학습하여, 새로운 데이터가 입력될 경우 학습 결과를 바탕으로 확률적으로 가장 높은 답을 선택하기 때문에 영상에 따라 적응적으로 동작할 수 있으며, 데이터에 기초하여 모델을 학습하는 과정에서 특성인자를 자동으로 찾아낼 수 있다.
본 개시의 일 실시 예에 따르면, 딥러닝 기반의 모델은 완전 합성곱 신경망(완전 컨볼루션 뉴럴 네트워크, fully convolutional neural network), 합성곱 신경망(컨볼루션 뉴럴 네트워크, convolutional neural network), 순환 신경망(회귀 뉴럴 네트워크, recurrent neural network), 제한 볼츠만 머신(restricted Boltzmann machine, RBM) 및 심층 신뢰 신경망(deep belief neural network, DBN) 중 적어도 하나를 포함할 수 있으나, 이에 제한되지 않는다. 또는, 딥러닝 이외의 머신 러닝 방법도 포함할 수 있다. 또는 딥러닝과 머신 러닝을 결합한 하이브리드 형태의 모델도 포함할 수 있다. 예컨대, 딥러닝 기반의 모델을 적용하여 영상의 특징을 추출하고, 상기 추출된 특징에 기초하여 영상을 분류하거나 인식할 때는 머신 러닝 기반의 모델을 적용할 수도 있다. 머신 러닝 기반의 모델은 서포트 벡터 머신(Support Vector Machine, SVM), 에이다부스트(AdaBoost) 등을 포함할 수 있으나, 이에 한정되지 않는다.
또한, 본 개시의 일 실시 예에 따르면, 딥러닝 기반의 모델을 학습하는 방법은 지도 학습(supervised learning), 비지도 학습(unsupervised learning) 또는 강화 학습(reinforcement learning) 중 적어도 하나를 포함할 수 있으나, 이에 제한되지 않는다. 지도 학습은 일련의 학습 데이터와 그에 상응하는 레이블(label, 목표 출력값)을 이용하여 학습이 이루어지며, 지도 학습에 기초한 신경망 모델은 훈련용 데이터(training data)로부터 함수를 추론해내는 형태의 모델일 수 있다. 지도 학습은 일련의 학습 데이터와 그에 상응하는 목표 출력 값을 수신하고, 입력되는 데이터에 대한 실제 출력 값과 목표 출력 값을 비교하는 학습을 통해 오류를 찾아내고, 해당 결과를 근거로 모델을 수정하게 된다. 지도 학습은 결과물의 형태에 따라 다시 회귀(regression), 분류(classification), 검출(detection), 시멘틱 세그멘테이션(semantic segmentation) 등으로 구분될 수 있다. 지도 학습을 통해 도출된 함수는 다시 새로운 결과값을 예측하는데 사용될 수 있다. 이처럼, 지도 학습에 기초한 신경망 모델은 수많은 학습 데이터의 학습을 통해, 신경망 모델의 파라미터를 최적화하게 된다.
본 개시의 일 실시 예에 따르면, 딥러닝 기반의 모델은 입력 영상과 화물에 대한 정보를 학습에 이용할 수 있으며, 학습된 모델을 생성한 후에도 본 개시의 장치에서 획득된 영상과 화물에 대한 정보를 이용하여 신경망 모델을 업데이트할 수 있다. 또한, 본 개시의 일 실시 예에 따른 딥러닝 기반의 모델은 본 개시의 방법에 의해 출력되는 분석 결과, 예를 들어 식별된 객체에 대한 이상 유무 또는 위험도, 객체에 관한 정보, 식별된 객체가 검색 대상 객체인지의 여부 등의 예측 결과, 상기 예측 결과와 최종 개장 검사 결과에 대한 비교 정보, 상기 예측 결과에 대한 평가도 또는 신뢰도 정보 등을 이용하여 신경망 모델을 업데이트할 수 있다.
도 2는 본 개시의 일 실시 예에 따른 영상 분석 장치의 구성을 나타내는 블록도이다. 도 2의 영상 분석 장치(200)는 도 1의 영상 분석 장치(112)의 일 실시 예이다.
일 실시 예에 따른 영상 분석 장치(200)는 분석 대상 영상을 수신하고, 분석 대상 영상에 포함되어 있는 객체가 존재하는 객체 영상을 구성하고, 객체 영상들 각각에 대해 색상 정보를 획득하고, 색상 정보에 기초하여, 객체의 특성을 확인하고, 확인된 객체의 특성을 기반으로 객체 영상의 민감도 수준을 설정하고, 설정된 민감도 수준을 사용하여 영상을 분석한 결과, 즉, 영상 분석 결과를 출력할 수 있다.
영상 분석 장치(200)는 영상 수신부(210), 객체 영상 추출부(220), 객체 특성 확인부(230), 민감도 결정부(240), 및/또는 영상 분석부(250)를 포함할 수 있다. 다만, 이는 본 실시예를 설명하기 위해 필요한 일부 구성요소만을 도시한 것일 뿐, 영상 분석 장치(200)에 포함된 구성요소가 전술한 예에 한정되는 것은 아니다. 예컨대, 둘 이상의 구성부가 하나의 구성부 내에서 구현될 수도 있고, 하나의 구성부에서 실행되는 동작이 분할되어 둘 이상의 구성부에서 실행되도록 구현될 수도 있다. 또한, 일부 구성부가 생략되거나 부가적인 구성부가 추가될 수도 있다.
영상 수신부(210)는 하나 이상의 객체를 포함하는 분석 대상 영상(20)을 수신할 수 있다. 도 1의 설명에서 전술한 바와 같이 분석 대상 영상(20)은 하나의 객체를 포함하는 화물에 관한 영상일 수 있다. 다른 예로서, 분석 대상 영상(20)은 X-Ray 판독 기기가 촬영한 화물에 관한 X-Ray 영상일 수 있다. 상기 분석 대상 영상(20)은 X-Ray 영상 기기가 촬영한 로(raw) 이미지이거나 상기 로 이미지를 저장 또는 전송하기 위한 임의의 형태(포맷)의 이미지일 수 있다. 또 다른 예로서, 상기 분석 대상 영상(20)은 X-Ray 판독 기기가 촬영하여 모니터와 같은 출력 장치로 전송하는 영상 정보를 캡쳐하여 데이터화 함으로써 획득될 수도 있다.
객체 영상 추출부(220)는 영상 수신부(210)에서 수신된 분석 대상 영상에 포함되어 있는 적어도 하나의 객체를 추출하고, 추출된 적어도 하나의 객체 각각을 분할하여 적어도 하나의 객체 영상을 구성할 수 있다.
본 개시의 일실시예에서, 분석 대상 영상은 다양한 사물이 포함되어 있는 영역을 X-ray 등과 같은 소정의 광을 사용하여 촬영한 영상일 수 있는데, 각각의 사물은 그 특성에 따라 영상 내에서 서로 다른 색상으로 나타날 수 있으며, 사물의 경계 또는 윤곽이 구분될 수 있다. 이에 기초하여, 본 개시의 일실시예에서, 객체를 추출한다는 것은 분석 대상 영상에서 동일한 색상이 연속적으로 나타나는 영역, 색상의 변화가 나타나는 영역 등을 고려하여, 영상의 일부 영역을 크로핑(cropping)하는 것을 의미할 수 있다.
예컨대, 객체 영상 추출부(220)는 분석 대상 영상의 픽셀값과 소정의 임계값을 비교하여 픽셀값을 이진화하고, 이진화된 픽셀값을 그룹핑함으로써 분석 대상 영상에 포함된 객체를 추출할 수 있다.
나아가, 객체 영상 추출부(220)는 이진화된 픽셀값에 대한 노이즈를 제거한 후, 미리 정해진 크기 이상의 덩어리(Blob)를 검출하고, 검출된 덩어리(Blob)를 크로핑(cropping)하여 적어도 하나의 객체 영상을 구성할 수 있다. 이때, 객체 영상 추출부(220)는 형태학 연산 변환(morphology)을 수행함으로써, 분석 대상 영상의 노이즈를 제거할 수 있다.
다른 예로서, 객체 영상 추출부(220)는 객체 영역을 둘러싸는 사각형 박스(bounding box)를 특정함으로써 객체 영상을 획득할 수 있으며, 특정된 사각형 박스에 기초하여, 구분된 객체의 위치 정보를 생성할 수도 있다.
추가적으로, 분석 대상 영상에는 객체와 배경이 포함될 수 있는데, 객체는 영상 내의 특정한 물체를 의미하며 또한 배경은 영상에서 객체를 제외한 부분을 의미할 수 있다. 영상의 배경은 영상의 촬영 방법 또는 촬영 장치에 따라 소정의 색상으로 표현될 수 있다. 예컨대, 상기 소정의 색상은 흰색일 수 있다. 영상의 배경을 표현하는 색상이 특정된 경우, 객체 영상 추출부(220)는 우선적으로 특정된 배경 색상에 기초하여 배경과 객체를 분리한 후, 객체가 분리된 영역을 대상으로 전술한 객체 영상을 구성하는 동작을 수행할 수도 있다.
예를 들어, 분석 대상 영상이 X-Ray 판독 기기가 촬영한 화물에 관한 X-Ray 영상이라고 하면, 화물이 아닌 배경 부분은 불필요하기 때문에 해당 배경 부분은 잘라내고 화물이 존재하는 영역만으로 분석할 수 있다. 특히, 화물들이 컨베이어 벨트를 통해 계속적으로 X-Ray 판독 기기를 통과하는 실제 환경에서는 화물에 대한 영역을 획득하는 것이 중요하다고 할 수 있다. 따라서, 객체 영상 추출부(220)는 객체 영상을 구성하는 동작을 수행하기 전, 전처리 동작으로서 분석 대상 영상으로부터 객체 영역과 배경 영역을 구분하는 동작을 수행할 수 있다.
도 3은 본 개시의 일 실시 예에 따른 객체 영상을 구성하는 동작을 설명하기 위한 도면이다. 도 3의 객체 영상 추출부(300)는 도 2의 객체 영상 추출부(220)의 일 실시 예일 수 있다. 분석 대상 영상(310)은 도 2를 참조하여 설명한 분석 대상 영상(20)일 수 있으며, 예컨대, 액체류가 채워진 용기(311), 휴대전화(312) 등을 포함하는 화물에 관한 영상일 수 있다.
객체 영상 추출부(300)는 먼저 액체류가 채워진 용기(311), 휴대전화(312) 등을 포함하는 분석 대상 영상(310)의 픽셀값과 소정의 임계값을 비교(thresholding)하여 픽셀값을 이진화 연산하여 이진화된 영상(320)을 획득할 수 있다. 그리고, 객체 영상 추출부(300)는 이진화된 영상(320)에서 각각의 객체에 대한 부분을 선택하기 위해 근접한 픽셀끼리 그룹핑(군집화, morphology, cropping) 처리하여 잡음 제거된 영상(330)을 획득할 수 있다. 그런 다음 크로핑(cropping) 연산을 수행함으로써 액체류가 채워진 용기(311), 휴대전화(312) 등을 기준으로 주변 영역을 대략적으로(roughly) 잘라버린, 크로핑된 객체 영상(340a, 340b, 340c)들을 획득할 수 있다.
한편, 본 개시의 일 실시예에서 객체 영상은 X-Ray 영상을 기반으로 이루어지는 것을 예시하므로, 객체의 물성(예를 들어, 해당 객체가 유기물, 무기물, 금속 등인지 여부)에 따라 다른 색상으로 나타날 수 있다. 예컨대, 객체가 액체류가 채워진 플라스틱 용기일 경우, 객체 영상에서 해당 객체는 주황색으로 나타날 수 있으며, 객체가 금속으로 이루어질 전자장치일 경우, 객체 영상에서 해당 객체는 청색으로 나타날 수 있다.
이에 기초하여, 객체 특성 확인부(230)는 객체 영상에 나타나는 색상 정보를 기반으로, 객체 영상 추출부(220)에서 분할된 객체 영상 각각에 대한 특성을 확인할 수 있다.
색상 정보는 n(n은 1보다 큰 정수)개의 색상 표현 범위의 각각에 대한 정보를 포함할 수 있다. 색상 표현 범위는 영상 획득 장치의 종류, 성능 등에 따라 달라질 수 있다. 또한, 예컨대, R(red)에 대한 "색상"은 8비트의 영상에서 픽셀값이 (R, G, B)= (255,0,0)을 가지는 픽셀의 색상만을 의미할 수 있으나, R에 대한 "색상 표현 범위"는 상기 픽셀값이 (R, G, B)= (255,0,0)인 경우뿐만 아니라 상기 픽셀값을 기준으로 소정의 범위 내에 있는 유사 색상을 포함하는 의미이다. 예컨대, 영상 획득 장치의 색상 표현 범위가 R, G(green), B(blue) 3가지라면 색상 분포 정보는 3개의 색상 표현 범위의 각각에 대한 정보를 포함할 수 있다. 색상 표현 범위가 R, G, B, Y(yellow), P(purple) 5가지라면 색상 정보는 5개의 색상 표현 범위의 각각에 대한 정보를 포함할 수 있다. 예컨대, 입력 영상이 X-Ray 판독 기기가 촬영한 화물에 관한 X-Ray 영상이라고 하면, X-Ray 영상은 해당 영상에 포함되어 있는 객체들의 물성(예를 들어, 해당 객체가 유기물, 무기물, 금속 등인지 여부)에 따라 다른 색상 표현 범위가 사용될 수 있다. 즉, 객체들의 물성에 따라 색상 표현 범위가 다를 수 있다.
바람직하게, 객체 특성 확인부(230)는 객체 영상에 대한 특성을 나타내는 이상치 점수(anomaly score)를 산출하여 제공할 수 있다. 구체적으로, 객체 특성 확인부(230)는 객체 영상(410, 도 4a 참조)을 R, G, B 채널로 분리하여 R채널 객체 영상(420, 도 4b 참조), G채널 객체 영상(430, 도 4c 참조), B채널 객체 영상(440, 도 4d 참조)을 구성할 수 있다. 그리고, 객체 특성 확인부(230)는 R, G, B 채널로 분리된 객체 영상(420, 430, 440)을 사용하여 검출하고자 하는 대상물의 특성을 표현할 수 있는 이상치 점수를 산출할 수 있다.
예를 들어, 검출하고자 하는 대상물이 액체류가 채워진 용기일 경우, 액체류가 채워진 용기는 주황색으로 나타날 수 있다. 이를 고려하여, 객체 특성 확인부(230)는 R채널 객체 영상(420)을 추출하고, R채널 객체 영상(420)에서 주황색에 대응되는 픽셀을 검출하고, R채널 객체 영상의 전체 영역 대 검출된 픽셀의 비율을 이상치 점수로서 산출할 수 있다.
나아가, 본 개시의 일 실시예에서 객체 영상은 X-ray 영상을 기반으로 하므로, 사물이 겹쳐서 존재할 경우 겹쳐진 사물들의 특성이 객체 영상에 나타날 수 있다. 예를 들어, 도 4a와 같이 액체류가 채워진 용기(411)의 전방에 금속 재질의 사물(412)이 겹쳐져 있는 상태를 기반으로 객체 영상(410)이 구성된 경우, 금속 재질의 사물이 존재하는 영역(413)은 청색 영역뿐 아니라 주황색 성분이 함께 나타날 수 있다. 이를 고려하여, 객체 특성 확인부(230)는 R채널 객체 영상(420)과 B채널 객체 영상(440)을 추출하고, R채널 객체 영상(420)에서 B채널 객체 영상(440)을 차감하여 차분영상(510, 도 5a 참조)을 구성할 수 있다. 그리고, 객체 특성 확인부(230)는 차분영상(510)에 검출하고자 하는 대상물이 존재하는 영역의 픽셀 비율을 이상치 점수로서 산출할 수 있다.
더 나아가, 객체 특성 확인부(230)는 차분영상(510)에서 대상물이 존재하는 영역을 검출하는 기준이 되는 임계값을 설정하고, 설정된 임계값을 기준으로 이진화하여 특성영상(520, 도 5b 참조)을 구성하고, 특성영상(520)에 잔존하는 픽셀의 비율을 이상치 점수로서 산출할 수 있다.
비록, 본 개시의 일 실시예에서, 객체 영상이 X-ray 영상을 기반으로 구성되는 것을 예시하였으나, 본 발명이 이를 한정하는 것은 아니다. 예컨대, 객체 영상은 검출하고자 하는 대상물에 따라 MRI, CT, Ultrasonic 등 다양한 영상을 기반으로 구성될 수 있다.
또한, 검출하고자 하는 대상물이 액체류가 채워진 용기임을 예시하고, 이에 대응하여 R채널 객체 영상 또는 B채널 객체 영상을 사용하여 이상치 점수를 산출하는 것을 예시하였으나, 본 발명이 이를 한정하는 것은 아니다. 본 발명에서, 검출하고자 하는 대상물은 다양하게 변경될 수 있으며, 객체 특성 확인부(230)는 검출하고자 하는 대상물의 특성이 나타낼 수 있는 이상치 점수를 산출할 수 있으면 충분하다. 예컨대, 검출하고자 하는 대상물은 신체 영역, 병변 영역 등으로 이루어질 수 있으며, 객체 특성 확인부(230)는 신체 영역, 병변 영역 등의 특성이 나타낼 수 있는 이상치 점수를 산출하도록 구성될 수 있다.
한편, 민감도 결정부(240)는 객체 특성 확인부(230)가 제공하는 이상치 점수를 입력받고, 이에 대응되는 민감도 정보를 출력할 수 있다. 여기서, 민감도 정보는 객체 영상의 이상치 점수에 대응되는 민감도 수준, 객체 영상이 위치한 영역의 위치정보 등을 포함할 수 있다.
특히, 민감도 결정부(240)는 민감도 분류 학습모델(245)을 사용하여 민감도 수준을 결정할 수 있다. 민감도 분류 학습모델(245)은 전술한 도 1의 학습된 모델 저장부(128)에 저장 및 관리될 수 있다.
민감도 분류 학습모델(245)은 객체 영상을 비정상 영역과 정상 영상으로 이진 분류(binary classification)하도록 학습된 모델일 수 있다. 여기서, 비정상 영역은 검출하고자 하는 대상물이 존재할 가능성이 높은 영역으로서 사용자가 주의 깊게 관찰해야 하는 영역을 의미하며, 정상 영역은 검출하고자 하는 대상물이 존재할 가능성이 낮은 영역으로서 사용자가 주의 깊게 관찰하지 않아도 되는 영역을 의미할 수 있다.
민감도 분류 학습모델(245)은 비정상 영역과 정상 영상을 분리할 수 있는 이상치 점수에 대한 최상의 기준값을 산출하고, 산출된 기준값을 기준으로 비정상 영역에 대응되는 민감도(이하, '비정상 민감도'라 함)와, 정상 영역에 대응되는 민감도(이하, '정상 민감도'라 함)를 구성하도록 학습될 수 있다. 예컨대, 도 6에 예시되는 바와 같이, 민감도 분류 학습모델(245)은 객체 영역의 이상치 점수를 입력받을 수 있으며, 입력된 이상치 점수가 비정상 영역으로 분류되는 이상치 점수(610)인지 또는 정상 영역으로 분류되는 이상치 점수(620) 인지를 분류하는 기준값(630)을 최상으로 설정할 수 있도록 학습될 수 있다.
나아가, 검출하고자 하는 대상물에 따라 이상치 점수를 산출하는 방식이 다양하게 변경될 수 있으므로, 민감도 분류 학습모델(245)은 검출하고자 하는 대상물을 더 고려하여 이상치 점수에 대한 최상의 기준값을 산출하도록 학습될 수 있다. 전술한 바에 기초하여, 민감도 분류 학습모델(245)은 이상치 점수 및 검출하고자 하는 대상물에 대한 정보를 입력받을 수 있으며, 이상치 점수 및 검출하고자 하는 대상물에 대한 정보를 사용하여 대응되는 민감도 수준을 출력할 수 있다.
본 개시의 일 실시예에서, 민감도 결정부(240)는 민감도 분류 학습모델(245)을 사용하여 객체 영상을 비정상 민감도 수준과, 정상 민감도로 분류하는 것을 예시하였으나, 본 개시가 이를 한정하는 것은 아니며, 다양하게 변경될 수 있다. 예컨대, 민감도 분류 학습모델(245)은 미리 정해진 개수(예, 3, 4, 5 개 등)로 구분되는 민감도 수준을 분류하도록 구성될 수도 있다.
한편, 영상 분석부(250)는 분석 대상 영상과 민감도 정보를 수신하고, 미리 학습된 영상 분석 학습 모델(255)을 이용하여 상기 영상(분석 대상 영상)을 분석한 후, 분석된 결과를 출력 장치로 출력할 수 있다.
특히, 영상 분석부(250)는 영상에 포함된 객체를 식별하고, 식별된 객체에 대한 이상 유무 또는 위험도를 판단할 수 있는데, 민감도 정보를 반영하여 객체 식별의 정확도 수준을 제어할 수 있다. 즉, 영상 분석부(250)는 민감도 정보에 포함된 민감도 수준과, 상기 민감도 수준에 대응되는 영역(예, 해당 객체 영상이 위치한 영역)을 확인할 수 있다. 영상 분석부(250)는 민감도 수준에 맞게, 영상 분석 학습 모델(255)의 정확도 수준을 설정할 수 있으며, 영상 분석 학습 모델(255)은 설정된 수준의 정확도로 객체를 식별할 수 있다. 구체적으로, 영상 분석 학습 모델(255)은 객체의 위치 정보와, 해당 객체가 검색 대상 객체에 해당되는지에 대한 확률을 출력할 수 있다. 이때, 영상 분석 학습 모델(255)은 해당 객체에 대한 확률이 전술한 민감도와 같거나 상대적으로 크게 나타날 경우, 검출된 확률을 그대로 출력하고, 해당 객체에 대한 확률이 전술한 민감도보다 상대적으로 작게 나타날 경우 해당 검출 결과를 무시하도록 구성될 수 있다.
나아가, 영상 분석부(250)가 출력하는 영상 분석 결과는 객체의 위험도, 종류, 양, 수, 크기 및 위치 중 적어도 하나를 포함할 수 있다. 영상 분석 결과가 객체의 위치인 경우, 분석 대상 영상에 해당 객체의 위치를 표시하여 출력 장치로 출력할 수 있다. 해당 객체의 위치는 좌표로 표시될 수도 있으나, 판독원이 용이하게 판독할 수 있도록 출력 영상 내의 해당 위치에 객체를 강조하여 표시할 수 있다. 예컨대, 객체의 에지를 강조하거나 객체를 둘러싸는 사각 박스를 표시하여 객체를 강조할 수도 있다. 또한, 영상 강화 과정을 통해 판독원이 보다 용이하게 객체를 식별할 수 있도록 소정의 객체 영역을 강화할 수 있다. 예컨대, 소정의 색상에 해당하는 영역을 강화하여, 영역이 보다 명확히 식별될 수 있도록 영상을 변환할 수 있다.
또는, 영상 분석부(250)는 분석 대상 영상에 검색 대상 객체(예컨대, 통관이 금지되거나 부적합한 객체)가 포함되는지 여부를 판단할 수 있다. 이를 위해, 영상 분석부(250)는 검색 대상 객체에 관한 정보를 수신하거나 미리 저장할 수 있다. 또한, 영상 분석부(250)는 영상에 포함된 객체를 식별하고, 식별된 객체가 검색 대상 객체인지 여부를 판단할 수 있다.
도 7은 본 개시의 일 실시 예에 따른 영상 분석 방법의 순서를 나타내는 흐름도이다. 본 개시의 일 실시예에 따른 영상 분석 방법은 전술한 영상 분석 장치(200, 도 2 참조)에 의해 수행될 수 있다.
본 개시의 일 실시예에 따른 영상 분석 방법은 입력 영상 또는 분석 대상 영상에 포함된 소정의 객체가 위치한 영역을 분석하여, 객체의 위험도, 종류, 양, 수, 크기, 위치, 등과 같은 영상 분석 결과를 출력하도록 구성될 수 있다. 예를 들어, 영상 분석 방법은 화물을 촬영한 영상을 기반으로 목적물을 검출하는 전자 통관 시스템, 의료 영상(예, MRI, CT, Ultrasonic등)을 기반으로 병변영역을 검출 또는 병변영역을 분석하는 의료영상 분석 시스템 등에 적용될 수 있다. 이하, 본 개시의 일실시예에서 영상 분석 방법은 전자 통관 시스템을 기반으로 수행되는 동작을 예시하지만, 본 개시가 이를 한정하는 것은 아니며, 전술한 바와 같이 다양한 분야의 인공지능 시스템에 변경되어 적용될 수 있다.
S710 단계에서, 영상 분석 장치는 하나 이상의 객체를 포함하는 분석 대상 영상을 수신할 수 있다. 여기서, 분석 대상 영상은 하나의 객체를 포함하는 화물에 관한 영상, 신체의 적어도 일부를 촬영하여 구성된 영상(예, MRI, CT, Ultrasonic등)일 수 있다. 다른 예로서, 분석 대상 영상은 X-Ray 판독 기기가 촬영한 화물에 관한 X-Ray 영상일 수 있다. 상기 분석 대상 영상은 X-Ray 영상 기기가 촬영한 로(raw) 이미지이거나 상기 로 이미지를 저장 또는 전송하기 위한 임의의 형태(포맷)의 이미지일 수 있다. 또 다른 예로서, 상기 분석 대상 영상은 X-Ray 판독 기기가 촬영하여 모니터와 같은 출력 장치로 전송하는 영상 정보를 캡쳐하여 데이터화함으로써 획득될 수도 있다.
S720 단계에서, 영상 분석 장치는 수신된 분석 대상 영상에 포함되어 있는 적어도 하나의 객체를 추출하고, 추출된 적어도 하나의 객체 각각을 분할하여 적어도 하나의 객체 영상을 구성할 수 있다.
본 개시의 일실시예에서, 분석 대상 영상은 다양한 사물이 포함되어 있는 영역을 X-ray 등과 같은 소정의 광을 사용하여 촬영한 영상일 수 있는데, 각각의 사물은 그 특성에 따라 영상 내에서 서로 다른 색상으로 나타날 수 있으며, 사물의 경계 또는 윤곽이 구분될 수 있다. 이에 기초하여, 본 개시의 일실시예에서, 객체를 추출한다는 것은 분석 대상 영상에서 동일한 색상이 연속적으로 나타나는 영역, 생상의 변화가 나타나는 영역 등을 고려하여, 영상의 일부 영역을 크로핑(cropping)하는 것을 의미할 수 있다.
예컨대, 영상 분석 장치는 분석 대상 영상의 픽셀값과 소정의 임계값을 비교하여 픽셀값을 이진화하고, 이진화된 픽셀값을 그룹핑함으로써 분석 대상 영상에 포함된 객체를 추출할 수 있다.
나아가, 영상 분석 장치는 이진화된 픽셀값에 대한 노이즈를 제거한 후, 미리 정해진 크기 이상의 덩어리(Blob)를 검출하고, 검출된 덩어리(Blob)를 크로핑(cropping)하여 적어도 하나의 객체 영상을 구성할 수 있다. 이때, 객체 영상 추출부(220)는 형태학 연산 변환(morphology)을 수행함으로써, 분석 대상 영상의 노이즈를 제거할 수 있다.
다른 예로서, 영상 분석 장치는 객체 영역을 둘러싸는 사각형 박스(bounding box)를 특정함으로써 객체 영상을 획득될 수 있으며, 특정된 사각형 박스에 기초하여, 구분된 객체의 위치 정보를 생성할 수도 있다.
추가적으로, 분석 대상 영상에는 객체와 배경이 포함될 수 있는데, 객체는 영상 내의 특정한 물체를 의미하며 또한 배경은 영상에서 객체를 제외한 부분을 의미할 수 있다. 영상의 배경은 영상의 촬영 방법 또는 촬영 장치에 따라 소정의 색상으로 표현될 수 있다. 예컨대, 상기 소정의 색상은 흰색일 수 있다. 영상의 배경을 표현하는 색상이 특정된 경우, 영상 분석 장치는 우선적으로 특정된 배경 색상에 기초하여 배경과 객체를 분리한 후, 객체가 분리된 영역을 대상으로 전술한 객체 영상을 구성하는 동작을 수행할 수도 있다.
예를 들어, 분석 대상 영상이 X-Ray 판독 기기가 촬영한 화물에 관한 X-Ray 영상이라고 하면, 화물이 아닌 배경 부분은 불필요하기 때문에 해당 배경 부분은 잘라내고 화물이 존재하는 영역만으로 분석할 수 있다. 특히, 화물들이 컨베이어 벨트를 통해 계속적으로 X-Ray 판독 기기를 통과하는 실제 환경에서는 화물에 대한 영역을 획득하는 것이 중요하다고 할 수 있다. 따라서, 영상 분석 장치는 객체 영상을 구성하는 동작을 수행하기 전, 전처리 동작으로 분석 대상 영상으로부터 객체 영역과 배경 영역을 구분하는 동작을 수행할 수 있다.
한편, 본 개시의 일 실시예에서 객체 영상은 X-Ray 영상을 기반으로 이루어지는 것을 예시하므로, 객체의 물성(예를 들어, 해당 객체가 유기물, 무기물, 금속 등인지 여부)에 따라 다른 색상으로 나타날 수 있다. 예컨대, 객체가 액체류가 채워진 플라스틱 용기일 경우, 객체 영상에서 해당 객체는 주황색으로 나타날 수 있으며, 객체가 금속으로 이루어질 전자장치일 경우, 객체 영상에서 해당 객체는 청색으로 나타날 수 있다.
이에 기초하여, S730 단계에서, 영상 분석 장치는 객체 영상에 나타나는 색상 정보를 기반으로, 객체 영상 각각에 대한 특성을 확인할 수 있다.
색상 정보는 n(n은 1보다 큰 정수)개의 색상 표현 범위의 각각에 대한 정보를 포함할 수 있다. 색상 표현 범위는 영상 획득 장치의 종류, 성능 등에 따라 달라질 수 있다. 또한, 예컨대, R(red)에 대한 "색상"은 8비트의 영상에서 픽셀값이 (R, G, B)= (255,0,0)을 가지는 픽셀의 색상만을 의미할 수 있으나, R에 대한 "색상 표현 범위"는 상기 픽셀값이 (R, G, B)= (255,0,0)인 경우뿐만 아니라 상기 픽셀값을 기준으로 소정의 범위 내에 있는 유사 색상을 포함하는 의미이다. 예컨대, 영상 획득 장치의 색상 표현 범위가 R, G(green), B(blue) 3가지라면 색상 분포 정보는 3개의 색상 표현 범위의 각각에 대한 정보를 포함할 수 있다. 색상 표현 범위가 R, G, B, Y(yellow), P(purple) 5가지라면 색상 정보는 5개의 색상 표현 범위의 각각에 대한 정보를 포함할 수 있다. 예컨대, 입력 영상이 X-Ray 판독 기기가 촬영한 화물에 관한 X-Ray 영상이라고 하면, X-Ray 영상은 해당 영상에 포함되어 있는 객체들의 물성(예를 들어, 해당 객체가 유기물, 무기물, 금속 등인지 여부)에 따라 다른 색상 표현 범위가 사용될 수 있다. 즉, 객체들의 물성에 따라 색상 표현 범위가 다를 수 있다.
바람직하게, 영상 분석 장치는 객체 영상에 대한 특성을 나타내는 이상치 점수(anomaly score)를 산출하여 제공할 수 있다. 구체적으로, 영상 분석 장치는 객체 영상(410, 도 4a 참조)을 R, G, B 채널로 분리하여 R채널 객체 영상(420, 도 4b 참조), G채널 객체 영상(430, 도 4c 참조), B채널 객체 영상(440, 도 4d 참조)을 구성할 수 있다. 그리고, 영상 분석 장치는 R, G, B 채널로 분리된 객체 영상(420, 430, 440)을 사용하여 검출하고자 하는 대상물의 특성을 표현할 수 있는 이상치 점수를 산출할 수 있다.
예를 들어, 검출하고자 하는 대상물이 액체류가 채워진 용기일 경우, 액체류가 채워진 용기는 주황색으로 나타날 수 있다. 이를 고려하여, 영상 분석 장치는 R채널 객체 영상(420)을 추출하고, R채널 객체 영상(420)에서 주황색에 대응되는 픽셀을 검출하고, R채널 객체 영상의 전체 영역 대 검출된 픽셀의 비율을 이상치 점수로서 산출할 수 있다.
나아가, 본 개시의 일 실시예에서 객체 영상이 X-ray 영상을 기반으로 하므로, 사물이 겹쳐서 존재할 경우 겹쳐진 사물들의 특성이 객체 영상에 나타날 수 있다. 예를 들어, 도 4a와 같이 액체류가 채워진 용기(411)의 전방에 금속 재질의 사물(412)이 겹쳐져 있는 상태를 기반으로 객체 영상(410)이 구성된 경우, 금속 재질의 사물이 존재하는 영역(413)은 청색 영역뿐만 아니라 주황색 성분이 함께 나타날 수 있다. 이를 고려하여, 객체 특성 확인부(230)는 R채널 객체 영상(420)과 B채널 객체 영상(440)을 추출하고, R채널 객체 영상(420)에서 B채널 객체 영상(440)을 차감하여 차분영상(510, 도 5a 참조)을 구성할 수 있다. 그리고, 객체 특성 확인부(230)는 차분영상(510)에 검출하고자 하는 대상물이 존재하는 영역의 픽셀 비율을 이상치 점수로서 산출할 수 있다.
더 나아가, 영상 분석 장치는 차분영상(510)에서 대상물이 존재하는 영역을 검출하는 기준이 되는 임계값을 설정하고, 설정된 임계값을 기준으로 이진화하여 특성영상(5520, 도 5b 참조)을 구성하고, 특성영상(520)에 잔존하는 픽셀의 비율을 이상치 점수로서 산출할 수 있다.
비록, 본 개시의 일 실시예에서, 객체 영상이 X-ray 영상을 기반으로 구성되는 것을 예시하였으나, 본 발명이 이를 한정하는 것은 아니다. 예컨대, 객체 영상은 검출하고자 하는 대상물에 따라 MRI, CT, Ultrasonic 등 다양한 영상을 기반으로 구성될 수 있다.
*또한, 검출하고자 하는 대상물이 액체류가 채워진 용기임을 예시하고, 이에 대응하여 R채널 객체 영상 또는 B채널 객체 영상을 사용하여 이상치 점수를 산출하는 것을 예시하였으나, 본 발명이 이를 한정하는 것은 아니다. 본 발명에서, 검출하고자 하는 대상물은 다양하게 변경될 수 있으며, 영상 분석 장치는 검출하고자 하는 대상물의 특성이 나타낼 수 있는 이상치 점수를 산출할 수 있으면 충분하다. 예컨대, 검출하고자 하는 대상물은 신체 영역, 병변 영역 등으로 이루어질 수 있으며, 영상 분석 장치는 신체 영역, 병변 영역 등의 특성이 나타낼 수 있는 이상치 점수를 산출하도록 구성될 수 있다.
한편, S740 단계에서, 영상 분석 장치는 이상치 점수를 확인하고, 이에 대응되는 민감도 정보를 출력할 수 있다. 여기서, 민감도 정보는 객체 영상의 이상치 점수에 대응되는 민감도, 객체 영상이 위치한 영역의 위치정보 등을 포함할 수 있다.
특히, 영상 분석 장치는 민감도 분류 학습모델을 사용하여 민감도 수준을 결정할 수 있다. 민감도 분류 학습모델은 전술한 도 1의 학습된 모델 저장부(128)에 저장 및 관리될 수 있다.
민감도 분류 학습모델은 객체 영상을 비정상 영역과 정상 영상으로 이진 분류(binary classification)하도록 학습된 모델일 수 있다. 여기서, 비정상 영역은 검출하고자 하는 대상물이 존재할 가능성이 높은 영역으로서 사용자가 주의 깊게 관찰해야 하는 영역을 의미하며, 정상 영역은 검출하고자 하는 대상물이 존재할 가능성이 낮은 영역으로서 사용자가 주의 깊게 관찰하지 않아도 되는 영역을 의미할 수 있다.
민감도 분류 학습모델은 비정상 영역과 정상 영상을 분리할 수 있는 이상치 점수에 대한 최상의 기준값을 산출하고, 산출된 기준값을 기준으로 비정상 영역에 대응되는 민감도(이하, '비정상 민감도'라 함)와, 정상 영역에 대응되는 민감도(이하, '정상 민감도'라 함)를 구성하도록 학습될 수 있다. 예컨대, 도 6에 예시되는 바와 같이, 민감도 분류 학습모델은 객체 영역의 이상치 점수를 입력받을 수 있으며, 입력된 이상치 점수가 비정상 영역으로 분류되는 이상치 점수(610)인지 또는 정상 영역으로 분류되는 이상치 점수(620) 인지를 분류하는 기준값(630)을 최상으로 설정할 수 있도록 학습될 수 있다.
나아가, 검출하고자 하는 대상물에 따라 이상치 점수를 산출하는 방식이 다양하게 변경될 수 있으므로, 민감도 분류 학습모델은 검출하고자 하는 대상물을 더 고려하여 이상치 점수에 대한 최상의 기준값을 산출하도록 학습될 수 있다. 전술한 바에 기초하여, 민감도 분류 학습모델은 이상치 점수 및 검출하고자 하는 대상물에 대한 정보를 입력받을 수 있으며, 이상치 점수 및 검출하고자 하는 대상물에 대한 정보를 사용하여 대응되는 민감도 수준을 출력할 수 있다.
본 개시의 일 실시예에서, 영상 분석 장치는 민감도 분류 학습모델을 사용하여 객체 영상을 비정상 민감도 수준과, 정상 민감도로 분류하는 것을 예시하였으나, 본 개시가 이를 한정하는 것은 아니며, 다양하게 변경될 수 있다. 예컨대, 민감도 분류 학습모델은 미리 정해진 개수(예, 3, 4, 5 개 등)로 구분되는 민감도 수준을 분류하도록 구성될 수도 있다.
S750 단계에서, 영상 분석 장치는 분석 대상 영상과 민감도 정보를 수신하고, 미리 학습된 영상 분석 학습 모델을 이용하여 상기 영상(분석 대상 영상)을 분석한 후, 분석된 결과를 출력 장치로 출력할 수 있다.
특히, 영상 분석 장치는 영상에 포함된 객체를 식별할 수 있는데, 민감도 정보를 반영하여 객체 식별의 정확도 수준을 제어할 수 있다. 즉, 영상 분석 장치는 민감도 정보에 포함된 민감도 수준과, 상기 민감도 수준에 대응되는 영역(예, 해당 객체 영상이 위치한 영역)을 확인할 수 있다. 영상 분석 장치는 민감도 수준에 맞게, 영상 분석 학습 모델의 정확도 수준을 설정할 수 있으며, 이 학습 모델은 설정된 수준의 정확도로 객체를 식별할 수 있다. 구체적으로는, 영상 분석 학습 모델은 객체의 위치 정보와, 해당 객체가 검색 대상 객체에 해당되는지에 대한 확률을 출력할 수 있다. 이때, 영상 분석 학습 모델은 해당 객체에 대한 확률이 전술한 민감도와 같거나 상대적으로 크게 나타날 경우, 검출된 확률을 그대로 출력하고, 해당 객체에 대한 확률이 전술한 민감도보다 상대적으로 작게 나타날 경우 해당 검출 결과를 무시하도록 구성될 수 있다.
나아가, 영상 분석 장치가 출력하는 영상 분석 결과는 객체의 위험도, 종류, 양, 수, 크기 및 위치 중 적어도 하나를 포함할 수 있다. 영상 분석 결과가 객체의 위치인 경우, 분석 대상 영상에 해당 객체의 위치를 표시하여 출력 장치로 출력할 수 있다. 해당 객체의 위치는 좌표로 표시될 수도 있으나, 판독원이 용이하게 판독할 수 있도록 출력 영상 내의 해당 위치에 객체를 강조하여 표시할 수 있다. 예컨대, 객체의 에지를 강조하거나 객체를 둘러싸는 사각 박스를 표시하여 객체를 강조할 수도 있다.
또는, 영상 분석 장치는 분석 대상 영상에 검색 대상 객체(예컨대, 통관이 금지되거나 부적합한 객체)가 포함되는지 여부를 판단할 수 있다. 이를 위해, 영상 분석 장치는 검색 대상 객체에 관한 정보를 수신하거나 미리 저장할 수 있다. 또한, 영상 분석 장치는 영상에 포함된 객체를 식별하고, 식별된 객체가 검색 대상 객체인지 여부를 판단할 수 있다.
본 개시의 영상 처리 장치의 구성부들 및 영상 처리 방법의 단계들 중 적어도 일부는 인공지능 기반 또는 딥러닝 기반의 모델을 이용하여 수행될 수 있다. 예컨대, 객체 영상을 분할하여 생성되는 영역의 크기, 개수, 색상 분포 정보에 기초하여 결정되는 가중치, 본 개시에서 언급된 각종 임계치, 제2 출력 영상의 생성 여부 등은 인공지능 기반 또는 딥러닝 기반의 모델을 이용하여 학습될 수 있고, 학습된 모델에 따른 정보가 이용될 수 있다.
본 개시의 딥러닝 기반의 모델은 완전 합성곱 신경망(완전 컨볼루션 뉴럴 네트워크, fully convolutional neural network), 합성곱 신경망(컨볼루션 뉴럴 네트워크, convolutional neural network), 순환 신경망(회귀 뉴럴 네트워크, recurrent neural network), 제한 볼츠만 머신(restricted Boltzmann machine, RBM) 및 심층 신뢰 신경망(deep belief neural network, DBN) 중 적어도 하나를 포함할 수 있으나, 이에 한정되지 않는다. 또는, 딥러닝 이외의 머신 러닝 방법도 포함할 수 있다. 또는 딥러닝과 머신 러닝을 결합한 하이브리드 형태의 모델도 포함할 수 있다. 예컨대, 딥러닝 기반의 모델을 적용하여 영상의 특징을 추출하고, 상기 추출된 특징에 기초하여 영상을 분류하거나 인식할 때는 머신 러닝 기반의 모델을 적용할 수도 있다. 머신 러닝 기반의 모델은 서포트 벡터 머신(Support Vector Machine, SVM), 에이다부스트(AdaBoost) 등을 포함할 수 있으나, 이에 한정되지 않는다.
본 개시의 예시적인 방법들은 설명의 명확성을 위해서 동작의 시리즈로 표현되어 있지만, 이는 단계가 수행되는 순서를 제한하기 위한 것은 아니며, 필요한 경우에는 각각의 단계가 동시에 또는 상이한 순서로 수행될 수도 있다. 본 개시에 따른 방법을 구현하기 위해서, 예시하는 단계에 추가적으로 다른 단계를 포함하거나, 일부의 단계를 제외하고 나머지 단계를 포함하거나, 또는 일부의 단계를 제외하고 추가적인 다른 단계를 포함할 수도 있다.
본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.
또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.

Claims (20)

  1. 영상에 포함되는 객체를 분석하는 장치에 있어서,
    분석 대상 영상을 수신하는 영상 수신부;
    상기 분석 대상 영상에 포함되어 있는 객체를 추출하고, 상기 객체를 포함하는 객체 영상을 구성하는 객체 영상 추출부;
    상기 객체 영상의 색상 정보를 획득하고, 상기 색상 정보에 기초하여, 상기 객체 영상의 특성을 확인하는 객체 특성 확인부;
    상기 객체 영상의 민감도 수준을 분류하는 민감도 분류 학습모델을 사용하여, 상기 객체 영상의 민감도 정보를 확인하는 민감도 결정부; 및
    상기 객체 영상의 민감도 정보에 기초하여 상기 객체 영상이 존재하는 영역의 정확도 수준을 제어하고, 상기 정확도 수준에 따라 상기 분석 대상 영상을 분석한 결과를 출력하는 영상 분석부를 포함하는 영상 분석 장치.
  2. 제1항에 있어서,
    상기 민감도 분류 학습모델은,
    상기 객체 영상의 민감도 수준을 구분하는 기준값을 학습하여 구축된 학습 모델인 것을 특징으로 하는 영상 분석 장치.
  3. 제1항에 있어서,
    상기 민감도 분류 학습모델은,
    상기 객체 영상의 특성을 수치화한 정보를 입력받고,
    상기 기준값을 기준으로 상기 객체 영상의 민감도 수준을 분류한 결과를 출력하는 것을 특징으로 하는 영상 분석 장치.
  4. 제1항에 있어서,
    상기 객체 특성 확인부는,
    상기 객체 영상에 대한 특성을 나타내는 이상치 점수(anomaly score)를 산출하는 것을 특징으로 하는 영상 분석 장치.
  5. 제4항에 있어서,
    상기 객체 특성 확인부는,
    상기 객체 영상의 적색(red) 채널의 영상으로부터, 상기 객체 영상의 청색(blue) 채널의 영상을 차감하여 구성한 차분영상을 구성하고,
    상기 차분영상에 포함되며, 미리 정해진 색상의 픽셀 비율을 수치화하여 상기 이상치 점수를 산출하는 것을 특징으로 하는 영상 분석 장치.
  6. 제5항에 있어서,
    상기 객체 특성 확인부는,
    상기 차분영상을 미리 정해진 임계값을 기준으로 이진화한 특성영상을 구성하고,
    상기 특성영상에서, 상기 미리 정해진 임계값을 초과하는 픽셀의 비율을 수치화하여 상기 이상치 점수를 산출하는 것을 특징으로 하는 영상 분석 장치.
  7. 제1항에 있어서,
    상기 영상 분석부는,
    맥락 분석 기반으로 미리 학습된 영상 분석 학습 모델을 사용하여, 상기 분석 대상 영상을 분석한 결과를 출력하는 것을 특징으로 하는 영상 분석 장치.
  8. 제7항에 있어서,
    상기 영상 분석부는,
    상기 객체 영상의 민감도 정보에 대응되는 정확도 수준을 상기 영상 분석 학습 모델에 제공하고,
    상기 영상 분석 학습 모델은,
    상기 객체 영상에 대한 정확도 수준을 제어하여 상기 분석 대상 영상을 분석한 결과를 출력하는 것을 특징으로 하는 영상 분석 장치.
  9. 제7항에 있어서,
    상기 영상 분석 학습 모델은,
    상기 정확도 수준에 맞게 상기 맥락 분석에 사용되는 설정값을 제어하는 것을 특징으로 하는 영상 분석 장치.
  10. 제1항에 있어서,
    상기 분석 대상 영상은, 상기 객체의 물성에 따라 해당 객체의 영역이 상이한 색상으로 표현된 영상이고,
    상기 분석한 결과는 상기 분석 대상 영상에 대응하는 분석 결과 영상인 것을 특징으로 하는 영상 분석 장치.
  11. 영상에 포함되는 객체를 분석하는 방법에 있어서,
    분석 대상 영상을 수신하는 과정과,
    상기 분석 대상 영상에 포함되어 있는 객체를 추출하고, 상기 객체를 포함하는 객체 영상을 구성하는 과정과,
    상기 객체 영상의 색상 정보를 획득하고, 상기 색상 정보에 기초하여, 상기 객체 영상의 특성을 확인하는 과정과,
    상기 객체 영상의 민감도 수준을 분류하는 민감도 분류 학습모델을 사용하여, 상기 객체 영상의 민감도 정보를 확인하는 과정과,
    상기 객체 영상의 민감도 정보에 기초하여 상기 객체 영상이 존재하는 영역의 정확도 수준을 제어하고, 상기 정확도 수준에 따라 상기 분석 대상 영상을 분석한 결과를 출력하는 과정을 포함하는 영상 분석 방법.
  12. 제11항에 있어서,
    상기 민감도 분류 학습모델은,
    상기 객체 영상의 민감도 수준을 구분하는 기준값을 학습하여 구축된 학습 모델인 것을 특징으로 하는 영상 분석 방법.
  13. 제11항에 있어서,
    상기 민감도 분류 학습모델은,
    상기 객체 영상의 특성을 수치화한 정보를 입력받고,
    상기 기준값을 기준으로 상기 객체 영상의 민감도 수준을 분류한 결과를 출력하는 것을 특징으로 하는 영상 분석 방법.
  14. 제11항에 있어서,
    상기 객체 영상의 특성을 확인하는 과정은,
    상기 객체 영상에 대한 특성을 나타내는 이상치 점수(anomaly score)를 산출하는 과정을 포함하는 것을 특징으로 하는 영상 분석 방법.
  15. 제14항에 있어서,
    상기 객체 영상의 특성을 확인하는 과정은,
    상기 객체 영상의 적색(red) 채널의 영상으로부터, 상기 객체 영상의 청색(blue) 채널의 영상을 차감하여 구성한 차분영상을 구성하는 과정과,
    상기 차분영상에 포함되며, 미리 정해진 색상의 픽셀 비율을 수치화하여 상기 이상치 점수를 산출하는 과정을 포함하는 것을 특징으로 하는 영상 분석 방법.
  16. 제15항에 있어서,
    상기 객체 영상의 특성을 확인하는 과정은,
    상기 차분영상을 미리 정해진 임계값을 기준으로 이진화하여 특성영상을 구성하는 과정과,
    상기 특성영상에서, 상기 미리 정해진 임계값을 초과하는 픽셀의 비율을 수치화하여 상기 이상치 점수를 산출하는 과정을 포함하는 것을 특징으로 하는 영상 분석 방법.
  17. 제11항에 있어서,
    상기 분석 대상 영상을 분석한 결과를 출력하는 과정은,
    맥락 분석 기반으로 미리 학습된 영상 분석 학습 모델을 사용하여, 상기 분석 대상 영상을 분석한 결과를 출력하는 과정을 포함하는 것을 특징으로 하는 영상 분석 방법.
  18. 제17항에 있어서,
    상기 분석 대상 영상을 분석한 결과를 출력하는 과정은,
    상기 객체 영상의 민감도 정보에 대응되는 정확도 수준을 상기 영상 분석 학습 모델에 제공함에 따라, 상기 영상 분석 학습 모델이 상기 객체 영상에 대한 정확도 수준을 제어하여 상기 분석 대상 영상을 분석한 결과를 출력하는 과정을 포함하는 것을 특징으로 하는 영상 분석 방법.
  19. 제17항에 있어서,
    상기 영상 분석 학습 모델은,
    상기 정확도 수준에 맞게 상기 맥락 분석에 사용되는 설정값을 제어하는 것을 특징으로 하는 영상 분석 방법.
  20. 제11항에 있어서,
    상기 분석 대상 영상은, 상기 객체의 물성에 따라 해당 객체의 영역이 상이한 색상으로 표현된 영상이고,
    상기 분석한 결과는 상기 분석 대상 영상에 대응하는 분석 결과 영상인 것을 특징으로 하는 영상 분석 방법.
PCT/KR2020/005745 2019-04-30 2020-04-29 영상 분석 장치 및 방법 WO2020222555A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190050898A KR102048948B1 (ko) 2019-04-30 2019-04-30 영상 분석 장치 및 방법
KR10-2019-0050898 2019-04-30

Publications (1)

Publication Number Publication Date
WO2020222555A1 true WO2020222555A1 (ko) 2020-11-05

Family

ID=69154010

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/005745 WO2020222555A1 (ko) 2019-04-30 2020-04-29 영상 분석 장치 및 방법

Country Status (2)

Country Link
KR (1) KR102048948B1 (ko)
WO (1) WO2020222555A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102048948B1 (ko) * 2019-04-30 2020-01-08 (주)제이엘케이인스펙션 영상 분석 장치 및 방법
KR102575689B1 (ko) * 2023-04-05 2023-09-06 (주)에이스엘이디 딥러닝 기반의 객체 선별이 가능한 cctv 보색 영상 처리 장치 및 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080159626A1 (en) * 2005-03-15 2008-07-03 Ramsay Thomas E Method for determining whether a feature of interest or an anomaly is present in an image
KR101825689B1 (ko) * 2016-11-03 2018-02-05 재단법인대구경북과학기술원 객체 인식 장치, 이의 학습 방법 및 이를 이용한 객체 인식 방법
KR20180082904A (ko) * 2017-01-11 2018-07-19 포항공과대학교 산학협력단 영상의 특성 추출을 위한 영상 분석 방법 및 장치
KR20180119013A (ko) * 2017-04-24 2018-11-01 세종대학교산학협력단 컨볼루션 신경망을 이용한 영상 검색 방법 및 그 장치
KR101969022B1 (ko) * 2017-12-29 2019-04-15 (주)제이엘케이인스펙션 영상 분석 장치 및 방법
KR102048948B1 (ko) * 2019-04-30 2020-01-08 (주)제이엘케이인스펙션 영상 분석 장치 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080159626A1 (en) * 2005-03-15 2008-07-03 Ramsay Thomas E Method for determining whether a feature of interest or an anomaly is present in an image
KR101825689B1 (ko) * 2016-11-03 2018-02-05 재단법인대구경북과학기술원 객체 인식 장치, 이의 학습 방법 및 이를 이용한 객체 인식 방법
KR20180082904A (ko) * 2017-01-11 2018-07-19 포항공과대학교 산학협력단 영상의 특성 추출을 위한 영상 분석 방법 및 장치
KR20180119013A (ko) * 2017-04-24 2018-11-01 세종대학교산학협력단 컨볼루션 신경망을 이용한 영상 검색 방법 및 그 장치
KR101969022B1 (ko) * 2017-12-29 2019-04-15 (주)제이엘케이인스펙션 영상 분석 장치 및 방법
KR102048948B1 (ko) * 2019-04-30 2020-01-08 (주)제이엘케이인스펙션 영상 분석 장치 및 방법

Also Published As

Publication number Publication date
KR102048948B1 (ko) 2020-01-08

Similar Documents

Publication Publication Date Title
WO2017022882A1 (ko) 의료 영상의 병리 진단 분류 장치 및 이를 이용한 병리 진단 시스템
WO2019132589A1 (ko) 다중 객체 검출을 위한 영상 처리 장치 및 방법
WO2019054638A1 (ko) 영상 분석 방법, 장치 및 컴퓨터 프로그램
WO2016171341A1 (ko) 클라우드 기반 병리 분석 시스템 및 방법
WO2020222555A1 (ko) 영상 분석 장치 및 방법
WO2019132587A1 (ko) 영상 분석 장치 및 방법
WO2016159726A1 (ko) 의료 영상으로부터 병변의 위치를 자동으로 감지하는 장치 및 그 방법
KR20060119968A (ko) 형상 인식 장치 및 방법
WO2019132592A1 (ko) 영상 처리 장치 및 방법
US20130108102A1 (en) Abandoned Object Recognition Using Pedestrian Detection
CN111553266A (zh) 识别验证方法、装置及电子设备
WO2021261808A1 (ko) 병변 판독 결과 표시 방법
WO2021153858A1 (ko) 비정형 피부질환 영상데이터를 활용한 판독보조장치
WO2021100919A1 (ko) 행동 시퀀스 기반으로 이상행동 여부를 판단하는 방법, 프로그램 및 시스템
Miller et al. What’s in the black box? the false negative mechanisms inside object detectors
WO2022265197A1 (ko) 인공지능에 기반하여 내시경 영상을 분석하기 위한 방법 및 장치
KR20180045473A (ko) 이미지 분석을 이용한 흑색종 검사 시스템, 방법 및 컴퓨터 프로그램
CN109145752A (zh) 用于评估对象检测和跟踪算法的方法、装置、设备和介质
KR20200021398A (ko) 영상 처리 장치 및 방법
CN113221667B (zh) 一种基于深度学习的人脸口罩属性分类方法及系统
Miller et al. Why object detectors fail: Investigating the influence of the dataset
CN110197722B (zh) Ai-cpu系统平台
WO2017010612A1 (ko) 의료 영상 분석 기반의 병리 진단 예측 시스템 및 방법
ALSAADI et al. An automated classification of mammals and reptiles animal classes using deep learning
WO2021071258A1 (ko) 인공지능 기반의 휴대용 보안영상 학습장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20798716

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20798716

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 29.04.2022)

122 Ep: pct application non-entry in european phase

Ref document number: 20798716

Country of ref document: EP

Kind code of ref document: A1