WO2019050247A2 - 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스 - Google Patents

클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스 Download PDF

Info

Publication number
WO2019050247A2
WO2019050247A2 PCT/KR2018/010271 KR2018010271W WO2019050247A2 WO 2019050247 A2 WO2019050247 A2 WO 2019050247A2 KR 2018010271 W KR2018010271 W KR 2018010271W WO 2019050247 A2 WO2019050247 A2 WO 2019050247A2
Authority
WO
WIPO (PCT)
Prior art keywords
image
learning
characteristic information
network model
class
Prior art date
Application number
PCT/KR2018/010271
Other languages
English (en)
French (fr)
Other versions
WO2019050247A3 (ko
Inventor
김준모
김병주
김주창
이예강
박민석
윤주승
이재영
주동규
Original Assignee
삼성전자 주식회사
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사, 한국과학기술원 filed Critical 삼성전자 주식회사
Priority to US16/645,344 priority Critical patent/US11449733B2/en
Publication of WO2019050247A2 publication Critical patent/WO2019050247A2/ko
Publication of WO2019050247A3 publication Critical patent/WO2019050247A3/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Definitions

  • the disclosed embodiment relates to a neural network learning method for class recognition, a neural network learning device for class recognition, and a recording medium on which a program for performing a neural network learning method for class recognition is recorded.
  • AI Artificial intelligence
  • AI is a computer system that implements human-level intelligence. Unlike existing Rule-based smart systems, AI is a system in which machines learn, judge and become smart. Artificial intelligence systems are increasingly recognized and improving their understanding of user preferences as they are used, and existing rule-based smart systems are gradually being replaced by deep-run-based artificial intelligence systems.
  • Artificial intelligence technology consists of element technologies that utilize deep learning and machine learning.
  • Machine learning is an algorithm technology that classifies / learns the characteristics of input data by itself.
  • Element technology is a technology that simulates functions such as recognition and judgment of human brain using machine learning algorithms such as deep learning. Understanding, reasoning / prediction, knowledge representation, and motion control.
  • Linguistic understanding is a technology for recognizing, applying, and processing human language / characters, including natural language processing, machine translation, dialogue system, query response, speech recognition / synthesis, and the like.
  • Visual understanding is a technology for recognizing and processing objects as human vision, including object recognition, object tracking, image search, human recognition, scene understanding, spatial understanding, and image enhancement.
  • Inference prediction is a technique for judging and logically inferring and predicting information, including knowledge / probability based reasoning, optimization prediction, preference base planning, and recommendation.
  • Knowledge representation is a technology for automating human experience information into knowledge data, including knowledge building (data generation / classification) and knowledge management (data utilization).
  • the motion control is a technique for controlling the autonomous travel of the vehicle and the motion of the robot, and includes motion control (navigation, collision, traveling), operation control (behavior control), and the like.
  • the disclosed embodiment generates additional learning data from a query image of a new class that has not been previously learned using at least one learning network model and gradually learns a learning network model by using additional learning data, Neural network learning method and device for solving the catastrophic forgetting problem that may occur when recognizing the image of the neural network.
  • the present disclosure relates to an artificial intelligence (AI) system and its application that simulate functions such as recognition and judgment of a human brain using a machine learning algorithm such as deep learning.
  • AI artificial intelligence
  • the present disclosure relates to a neural network learning method for class recognition of an object included in an image according to an artificial intelligence system and its application, including a first learning network model learning based on a source learning image included in each of at least one class, Acquires characteristic information of a query image included in at least one class and another class, acquires a generated image from characteristic information of a query image using a second learning network model, Acquiring characteristic information of the acquired generated image by using the network model, and based on the difference between the characteristic information of the query image and the characteristic information of the generated image and the difference between the query image and the generated image, We can update the weights of layers included in each learning network model.
  • FIG. 1 is a conceptual diagram for explaining a neural network learning method according to an embodiment.
  • FIG. 2 is a flowchart illustrating a method for a device according to an embodiment to learn a neural network for class recognition.
  • FIG. 3 is a diagram for explaining a method in which a device according to an embodiment obtains a generated image for numerical class recognition.
  • FIG. 4 is a flowchart illustrating a neural network learning method for class recognition of a device and a server according to an exemplary embodiment.
  • 5 and 6 are block diagrams of a neural network learning device for class recognition according to an embodiment.
  • FIG. 7 is a diagram for explaining a processor according to an embodiment.
  • FIG. 8 is a block diagram of a data learning unit according to an embodiment.
  • FIG. 9 is a block diagram of a data recognition unit according to an embodiment.
  • FIG. 10 is a diagram for explaining a method of integrating a second learning network model generated from a plurality of devices in a server according to an embodiment.
  • a neural network learning method for class recognition including learning a first learning network model based on a source learning image included in each of at least one class, Obtaining characteristic information of a query image; Obtaining a generated image from characteristic information of a query image using a second learning network model; Acquiring characteristic information of the generated image using the first learning network model; And updating a weight of a layer included in each of the first learning network model and the second learning network model based on the difference between the characteristic information of the query image and the characteristic information of the generated image and the difference between the query image and the generated image . ≪ / RTI >
  • the neural network learning method for class recognition further includes acquiring information on a target class, and the step of acquiring a generated image may include acquiring characteristic information of a query image and information on a target class
  • the second learning network model can be used to obtain the generated image included in the target class.
  • the step of acquiring characteristic information of a generated image may include acquiring characteristic information of a plurality of generated images generated from characteristic information of a query image using a second learning network model The characteristic information of the generated image having the smallest difference between the images can be obtained.
  • the step of acquiring characteristic information of an image includes receiving characteristic information of a query image obtained using a first learning network model stored in a server from a server and the learning method of the neural network may further include transmitting the generated image obtained using the second learning network model to the server.
  • a neural network learning device for class recognition comprises: a memory for storing one or more instructions; And at least one processor executing at least one instruction stored in a memory, wherein the at least one processor is configured to use at least one of the at least one class, Acquiring characteristics information of a query image included in one class and another class, acquiring a generated image from characteristic information of the query image using a second learning network model, and using the first learning network model, And acquiring characteristic information of the generated image based on the difference between the characteristic information of the query image and the characteristic information of the generated image and the difference between the query image and the generated image, You can update the weights of the layers.
  • first, second, etc. may be used to describe various elements, but the elements are not limited by terms. Terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component.
  • the term " and / or " includes any combination of a plurality of related items or any of a plurality of related items.
  • part refers to a hardware component such as software, FPGA or ASIC, and “ part " However, “ part “ is not meant to be limited to software or hardware. &Quot; Part " may be configured to reside on an addressable storage medium and may be configured to play back one or more processors.
  • a is intended to be broadly interpreted as encompassing any and all patentable subject matter, including components such as software components, object oriented software components, class components and task components, Subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables.
  • components such as software components, object oriented software components, class components and task components, Subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables.
  • the functions provided in the components and " parts " may be combined into a smaller number of components and “ parts “ or further separated into additional components and " parts ".
  • FIG. 1 is a conceptual diagram for explaining a neural network learning method according to an embodiment.
  • a neural network learning device may generate a learning image for learning a neural network-based recognition model for class recognition.
  • a device may generate a learning image for learning a neural network-based recognition model for class recognition.
  • an existing learning image using at least one learning network model constituting a recognition model is described as a source learning image, and a learning image of a new class to be additionally input is described as a generated image do.
  • a class represents a type of an object included in an image, and various classes may exist depending on the category.
  • the types of numbers such as 0, 1, 2, 3, 4, and 5 may be classes, respectively, or animal classes such as dogs and cats.
  • a language type such as Korean, English, or Japanese may be a class.
  • a device may aim at learning a model capable of sequentially learning images of various classes to one model and finally recognizing images of all classes.
  • learning an image of a new class if learning continues for the pre-generated learning network model, a problem may occur that the contents of learning such as the weight of the previously learned layer are forgotten. This problem can also be referred to as catastrophic forgetting.
  • the device is configured to classify the query image 10 of a new class into a new class of classes to minimize the problem that the learning content of the created learning network model is over-fitting due to the query image 10 of the new class, ), It is possible to acquire the generated image 30 reflecting the previously learned class in the learning network model while maintaining the characteristics of the query image 10.
  • the device may store a first learning network model 110 and a second learning network model 120 for acquiring the generated image 30 from the query image 10.
  • the first learning network model 110 and the second learning network model 120 are merely an example, and the device may store two or more learning network models for acquiring the generated image 30.
  • the first learning network model 110 and the second learning network model 120 may be described as an encoder and a decoder, respectively.
  • the device can extract the property information 20 of the query image 10 using the first learning network model 110.
  • the characteristic information includes, for example, color, edge, polygon, saturation, brightness, color temperature, blur, sharpness, Contrast, and the like, but the characteristic information is not limited thereto.
  • the device may use the second learning network model 120 to obtain the generated image 30 from the characteristic information 20 of the query image 10.
  • the generated image 30 has a characteristic corresponding to the query image 10, and it is possible to classify the class of the source learning image used for learning in the past, based on the characteristic information 20 of the query image 10 Lt; / RTI >
  • the second learning network model 120 may be a generative model.
  • the generation model is a model for generating a new input having the same characteristics as the input for class recognition. For example, in a model in which an image of a specific class is learned, an image of the same style as the image of the specific class is generated .
  • the device may obtain the characteristic information 40 of the generated image 30 by applying the generated image 30 as an input to the first learning network model 110.
  • the device includes an adversarial loss which is information on the difference between the query image 10 and the generated image 30 and information on the difference between the characteristic information of the query image 10 and the characteristic information of the generated image 40, Loss (L2 loss) can be obtained.
  • the device repeatedly performs the above-described series of processes so as to reduce the collision loss and the L2 loss, thereby updating the parameters of the layers included in the first learning network model 110 and the second learning network model 120, The first learning network model 110 and the second learning network model 120 can be learned.
  • the device can progressively learn the class using the second learning network model 120, which is a generation model.
  • gradual class learning is a method of gradually improving the hypothesis using one or more conceptual hypotheses and then using the additional examples to generate knowledge from the presently given example and the counter example, It is a progressive learning method that progressively modifies current knowledge.
  • the device uses a classifier to select a generated image closest to the source learning image from among the generated generated images based on the opposition loss and the L2 loss, and generates a first learning network model 110 and a second learning And can be used for learning of the network model 120.
  • a conditional GAN Geneative Adversarial Network
  • the device adds a constraint to make the output data of the discriminator match condition of the recognizer, 2 learning network model 120 can be learned.
  • the recognizer may be configured as a learned neural network so as to recognize the class of the object included in the input image.
  • the device can acquire a generated image having various characteristic information of the query image 10 while learning the existing class, and learn the recognition model, thereby improving the accuracy of class recognition.
  • the device can utilize the acquired image and the query image of the new class together to learn the recognizer so that a new class can be recognized.
  • FIG. 2 is a flowchart illustrating a method for a device according to an embodiment to learn a neural network for class recognition.
  • step S210 the device acquires the property information of the query image included in the class different from the at least one class, using the learned first learning network model based on the source learning image included in each of the at least one class .
  • the first learning network model may include at least one layer for extracting characteristic information from an input image. It is also assumed that the weights of at least one layer in the first learning network model have been previously learned based on the previously input source learning image.
  • the device can acquire a query image having a class different from the class of the source learning image that has been used for learning.
  • the device can input the query image to the first learning network model and obtain the characteristic information of the query image with the output data.
  • step S220 the device can use the second learning network model to obtain the generated image from the characteristic information of the query image.
  • the generated image may be an image of a class corresponding to a class of an existing source learning image as it is acquired based on a second learning network model learned based on an existing source learning image.
  • the class of the generated image may be different from the class of the source learning image.
  • the generated image may have characteristic information corresponding to the characteristic information of the query image.
  • step S230 the device can acquire the characteristic information of the generated image obtained using the first learning network model.
  • the device can again input the generated image obtained using the second learning network model to the first learning network model.
  • the device can acquire the characteristic information of the generated image using a plurality of layers included in the first learning network model.
  • step S240 the device updates the weight of the layer included in each of the first learning network model and the second learning network model based on the difference between the characteristic information of the query image and the characteristic information of the generated image and the difference between the query image and the generated image can do.
  • the difference between the characteristic information of the query image and the characteristic information of the generated image can be represented as the L2 loss.
  • the difference between the query image and the generated image can be represented by an adversarial loss.
  • information regarding the difference between the characteristic information of the query image and the characteristic information of the generated image and the difference between the query image and the generated image is not limited to the L2 loss or the conflicting loss.
  • the device can learn the first learning network model and the second learning network model by repeatedly performing the steps S210 to S240 until the L2 loss and the opposing loss become less than a predetermined threshold value.
  • a device extracts features from a query image of a new class instead of simply memorizing existing learning contents, and further uses another learning image having extracted features to learn, thereby improving the performance of the learning network model Can be improved.
  • FIG. 3 is a diagram for explaining a method in which a device according to an embodiment obtains a generated image for numerical class recognition.
  • the device may store the learned first learning network model 110 and the second learning network model 120 based on the source learning image 305 for numbers 0 through 5.
  • a class may mean a kind of a number.
  • each of the first learning network model 110 and the second learning network model 120 is learned based on a source learning image having classes of 0, 1, 2, 3, 4, and 5,
  • the weights of layers constituting the network model can be set to recognize the numbers 0, 1, 2, 3, 4, and 5.
  • the device can obtain a query image 310 of the number 6, which is a new class.
  • the device may use the first learning network model 110 to obtain the characteristic information 320 of the query image 310 of the number 6.
  • the device may use the second learning network model 120 to obtain the generated image 330 from the characteristic information 320 of the query image of numeral 6.
  • the generated image 330 may have a class corresponding to any one of the source learning images 305 for 0 to 5.
  • the device may enter information about the target class into the second learning network model 120.
  • the target class indicates a class of the generated image according to the intention of the user or the like, and can be selected as any one of the classes previously learned by the second learning network model 120.
  • the device may also obtain the generated image 330 using the second learning network model 120 based on the information about the target class and the characteristic information 320 of the query image of numeral 6.
  • the generated image 330 generated through the second learning network model 120 may be an image having class 5 with characteristics corresponding to the characteristic information of numeral 6.
  • the device may obtain the property information 340 of the generated image 330 by entering the generated image 330 generated in the first learning network model 110.
  • the device also calculates the L2 loss corresponding to the difference between the characteristic information 320 of the query image and the characteristic information 340 of the generated image 330, which is a difference between the query image 310 and the generated image 330,
  • the weight of the layers constituting each of the first learning network model 110 and the second learning network model 120 can be updated.
  • FIG. 4 is a flowchart illustrating a neural network learning method for class recognition of a device and a server according to an exemplary embodiment.
  • the device may send a query image to the server.
  • the device can obtain a query image corresponding to a different class from the source learning image based on learning of the first learning network model and the second learning network model.
  • the device can send it to the server as the query image is acquired.
  • step S420 the server can acquire characteristic information of the query image using the first learning network model.
  • the first learning network model for extracting the characteristic information from the input image may be stored in the server.
  • the server may obtain the property information from the query image using the first learning network model as the query image is received from the device.
  • step S430 the server can transmit characteristic information of the query image of the device.
  • the device may use the second learning network model to obtain the generated image from the characteristic information of the query image.
  • a device may acquire a generated image reflecting a class of an existing source learning image while having characteristics corresponding to characteristics of a query image.
  • step S450 the device may send the generated image to the server.
  • the server may update the weights of the first learning network model based on the difference between the query image and the generated image and the difference between the respective characteristic information.
  • the server can update the weight of the first learning network model in a direction in which the difference between the query image and the generated image and the difference between the respective characteristic information is reduced.
  • step S470 the server can send to the device information about the difference between the query image and the generated image and the difference between the respective characteristic information.
  • the device may update the weight of the second learning network model based on the difference between the query image and the generated image and the difference between the respective characteristic information.
  • the device can update the weight of the second learning network model in such a direction that the difference between the query image and the generated image and the difference between the respective characteristic information is reduced.
  • 5 and 6 are block diagrams of a neural network learning device 500 for class recognition according to an embodiment.
  • a neural network learning device 500 may include a processor 510 and a memory 520.
  • the device 500 may include fewer or more components than the processor 510 and the memory 520, although this is only an example.
  • a device 600 may further include a communication unit 520 and an output unit 540 in addition to the processor 510 and the memory 520.
  • the device 500 may include a plurality of processors.
  • the processor 510 may include one or more cores (not shown) and a connection path (e.g., a bus, etc.) to transmit and receive signals to and / or from a graphics processing unit (not shown) .
  • a connection path e.g., a bus, etc.
  • the processor 510 may include one or more cores (not shown) and a connection path (e.g., a bus, etc.) to transmit and receive signals to and / or from a graphics processing unit (not shown) .
  • a connection path e.g., a bus, etc.
  • the processor 510 may perform the operations of the device described above with reference to Figures 1-4.
  • the processor 510 may use the first learning network model that is learned based on the source learning image included in each of the at least one class to classify characteristic information of the query image included in at least one class and another class Can be obtained.
  • the processor 520 may use the second learning network model to obtain the generated image from the characteristic information of the query image.
  • the processor 520 may use the first learning network model to obtain characteristic information of the acquired generated image.
  • the processor 520 may obtain information about the difference between the characteristic information of the query image and the characteristic information of the generated image, and the difference between the query image and the generated image.
  • the processor 520 may update the parameters of at least one layer included in each of the first learning network model and the second learning network model based on the information on the obtained difference.
  • the processor 520 may obtain information about the target class.
  • the processor 520 can acquire a generated image included in the target class using the second learning network model based on the characteristic information of the query image and information on the target class.
  • the processor 520 can repeatedly perform the above-described update operation until the difference between the characteristic information of the query image and the characteristic information of the generated image and the difference between the query image and the generated image are less than a predetermined threshold value for each .
  • the processor 120 may include a random access memory (RAM) (not shown) and a read only memory (ROM) for temporarily and / or permanently storing signals (or data) , Not shown).
  • the processor 120 may be implemented as a system-on-chip (SoC) including at least one of a graphics processing unit, a RAM, and a ROM.
  • SoC system-on-chip
  • the memory 520 may store programs (one or more instructions) for processing and control of the processor 510. Programs stored in the memory 520 may be divided into a plurality of modules according to functions. According to one embodiment, the memory 520 may include a data learning unit and a data recognition unit software module, which will be described later with reference to FIG. Further, the data learning unit and the data recognition unit may independently include a learning network model or may share one learning network model.
  • the communication unit 530 may include one or more components for communicating with an external server (e.g., the server of Fig. 4) and other external devices.
  • the communication unit 530 can receive characteristic information of the query image obtained using the first learning network model stored in the server from the server.
  • the communication unit 530 can transmit the generated image obtained using the second learning network model to the server based on the characteristic information.
  • the output unit 540 can output the obtained generated image.
  • the output unit 540 may output information on the difference between the characteristic information of the query image and the characteristic information of the generated image, and the difference between the query image and the generated image.
  • the device 500 may be, for example, a PC, a laptop, a mobile phone, a micro server, a GPS (global positioning system) device, a smart phone, a wearable terminal, an electronic book terminal, Mobile computing device.
  • the device 500 may include all sorts of devices with data processing capabilities.
  • FIG. 7 is a diagram for explaining a processor 510 according to an embodiment.
  • the processor 510 may include a data learning unit 710 and a data recognizing unit 720.
  • the data learning unit 710 can learn a criterion for acquiring characteristic information from an image.
  • the data learning unit 710 may learn a criterion for acquiring characteristic information from at least one of a source learning image, a query learning image, and a generation image.
  • the weight of at least one layer included in the data learning unit 710 can be determined.
  • the data recognition unit 720 can extract the characteristic information of each of the plurality of images or recognize the class of the object included in each of the plurality of images based on the learned criterion through the data learning unit 710.
  • At least one of the data learning unit 710 and the data recognition unit 720 may be manufactured in at least one hardware chip form and mounted on a neural network learning device.
  • at least one of the data learning unit 710 and the data recognition unit 720 may be manufactured in the form of a dedicated hardware chip for artificial intelligence (AI), or may be a conventional general-purpose processor Or an application processor) or a graphics-only processor (e.g., a GPU) and may be mounted on the various neural network learning devices described above.
  • AI artificial intelligence
  • a graphics-only processor e.g., a GPU
  • the data learning unit 710 and the data recognition unit 720 may be mounted on one neural network learning device, or may be mounted on separate neural network learning devices, respectively.
  • one of the data learning unit 710 and the data recognizing unit 720 may be included in the device, and the other may be included in the server.
  • the data learning unit 710 and the data recognition unit 720 may provide the model information constructed by the data learning unit 710 to the data recognition unit 720 via a wire or wireless connection, 720 may be provided to the data learning unit 710 as additional learning data.
  • At least one of the data learning unit 710 and the data recognition unit 720 may be implemented as a software module.
  • the software module may be a computer-readable, And may be stored in non-transitory computer readable media.
  • at least one software module may be provided by an operating system (OS) or by a predetermined application.
  • OS operating system
  • OS operating system
  • OS operating system
  • FIG. 8 is a block diagram of a data learning unit 710 according to an embodiment.
  • a data learning unit 710 includes a data obtaining unit 810, a preprocessing unit 820, a learning data selecting unit 830, a model learning unit 840, 850).
  • the data acquisition unit 810 may acquire at least one of the source learning image and the query image as a learning image.
  • the data acquisition unit 810 may acquire at least one image from an external device or server that can communicate with a neural network learning device including a neural network learning device or data learning unit 710 including a data learning unit 710, Can be obtained.
  • the data obtaining unit 810 may obtain the generated image obtained from the characteristic information of the query image, using the first learning network model and the second learning network model described above with reference to Figs.
  • At least one image acquired by the data acquisition unit 810 may be one of images classified according to a class.
  • the data acquisition unit 810 may perform learning based on images classified by species.
  • the preprocessing unit 820 can preprocess the acquired image so that the acquired image can be used for learning to extract characteristic information of an image or class recognition of an object in an image.
  • the preprocessing unit 820 may process the acquired at least one image into a predetermined format so that the model learning unit 840 can use at least one image acquired for learning.
  • the learning data selection unit 830 can select an image required for learning from the preprocessed data.
  • the selected image may be provided to the model learning unit 840.
  • the learning data selecting unit 830 can select an image required for learning from among the preprocessed images according to a set criterion.
  • the model learning unit 840 can learn a criterion for using the information from the image at a plurality of layers in the learning network model to acquire the characteristic information or recognize the object in the image. For example, the model learning unit 840 may determine whether to extract the characteristic information from the query image or to extract the generated image from the extracted characteristic information in order to acquire the generated image close to the source learning image Can be learned.
  • the model learning unit 840 can determine a data recognition model in which the input learning data and the basic learning data are highly relevant, have.
  • the basic learning data may be pre-classified according to the type of data, and the data recognition model may be pre-built for each data type.
  • the basic learning data may be pre-classified by various criteria such as an area where the learning data is generated, a time at which the learning data is generated, a size of the learning data, a genre of the learning data, a creator of the learning data, .
  • model learning unit 840 can learn the data generation model through reinforcement learning using, for example, feedback as to whether the recognized class is correct according to the learning.
  • the model learning unit 840 can store the learned data generation model.
  • the model learning unit 840 can store the learned data generation model in the memory of the neural network learning device including the data acquisition unit 810.
  • the model learning unit 840 may store the learned data generation model in a memory of a server connected to the neural network learning device via a wired or wireless network.
  • the memory in which the learned data generation model is stored may also store, for example, instructions or data associated with at least one other component of the neural network learning device.
  • the memory may also store software and / or programs.
  • the program may include, for example, a kernel, a middleware, an application programming interface (API) and / or an application program (or " application ").
  • the model evaluation unit 850 inputs the evaluation data to the data generation model and, if the result of generation of the additional learning data output from the evaluation data does not satisfy the predetermined criterion, the model learning unit 840 can re- have.
  • the evaluation data may be predetermined data for evaluating the data generation model.
  • the evaluation data may include a difference between the generated image and the query image generated based on the learning network model, and the difference between the characteristic information of the generated image and the characteristic information of the query image.
  • the model evaluating unit 750 may evaluate whether each learning network model satisfies a predetermined criterion, and determine a model satisfying a predetermined criterion as a final learning network model.
  • At least one of the data acquiring unit 810, the preprocessing unit 820, the learning data selecting unit 830, the model learning unit 840, and the model evaluating unit 850 in the data learning unit 710 includes at least one And can be mounted on a neural network learning device.
  • at least one of the data acquisition unit 810, the preprocessing unit 820, the learning data selection unit 830, the model learning unit 840, and the model evaluation unit 850 may be an artificial intelligence (AI) Or may be implemented as part of a conventional general purpose processor (e.g., a CPU or an application processor) or a graphics dedicated processor (e.g., a GPU) and loaded on the various neural network learning devices described above .
  • AI artificial intelligence
  • a conventional general purpose processor e.g., a CPU or an application processor
  • a graphics dedicated processor e.g., a GPU
  • the data acquiring unit 810, the preprocessing unit 820, the learning data selecting unit 830, the model learning unit 840 and the model evaluating unit 850 may be mounted on one neural network learning device, Or may be mounted on separate neural network learning devices, respectively.
  • some of the data acquisition unit 810, the preprocessing unit 820, the learning data selection unit 830, the model learning unit 840, and the model evaluation unit 850 are included in the neural network learning device, Some may be included in the server.
  • At least one of the data acquisition unit 810, the preprocessing unit 820, the learning data selection unit 830, the model learning unit 840, and the model evaluation unit 850 may be implemented as a software module.
  • At least one of the data acquiring unit 810, the preprocessing unit 820, the learning data selecting unit 830, the model learning unit 840 and the model evaluating unit 850 is a software module (or a program including an instruction) Module), the software module may be stored in a computer-readable, readable non-transitory computer readable media.
  • the at least one software module may be provided by an operating system (OS) or by a predetermined application.
  • OS operating system
  • OS Operating System
  • some of the software modules may be provided by a predetermined application.
  • FIG. 9 is a block diagram of a data recognition unit 720 according to an embodiment.
  • a data recognition unit 720 includes a data acquisition unit 910, a preprocessing unit 920, a recognition data selection unit 930, a recognition result providing unit 940, (950).
  • the data acquisition unit 910 may acquire at least one image necessary for extracting characteristic information of an image or recognizing an object in an image
  • the preprocessor 920 may acquire characteristic information of the image or acquire Processing the acquired image so that at least one image that has been acquired can be used.
  • the preprocessing unit 920 can process the acquired image into a predetermined format so that the recognition result providing unit 940, which will be described later, can use the acquired image for extracting the characteristic information of the image or the class of the object in the image .
  • the recognition data selecting unit 930 can select an image for characteristic extraction or class recognition from the preprocessed data. The selected data may be provided to the recognition result providing unit 840.
  • the recognition result providing unit 940 may apply the selected image to the learning network model according to an exemplary embodiment to extract characteristic information of the image or recognize an object in the image.
  • the method of extracting characteristic information or recognizing an object by inputting at least one image to the learning network model may correspond to the method described above with reference to FIGS.
  • the recognition result providing unit 940 may provide a result of recognizing a class of an object included in at least one image.
  • the model updating unit 950 updates the parameter of the classification classification network included in the learning network model or the at least one characteristic extraction layer Etc. to the model learning unit 840 described above with reference to FIG.
  • At least one of the data acquiring unit 910, the preprocessing unit 920, the recognition data selecting unit 930, the recognition result providing unit 940 and the model updating unit 950 in the data recognizing unit 720 may be at least It can be manufactured in one hardware chip form and mounted on a neural network learning device.
  • at least one of the data acquisition unit 910, the preprocessing unit 920, the recognition data selection unit 930, the recognition result providing unit 940 and the model updating unit 950 is a dedicated hardware chip for artificial intelligence Or may be built into a variety of neural network learning devices, such as those described above, that are fabricated as part of a conventional general purpose processor (e.g., a CPU or an application processor) or a graphics dedicated processor (e.g., a GPU).
  • a conventional general purpose processor e.g., a CPU or an application processor
  • a graphics dedicated processor e.g., a GPU
  • the data obtaining unit 910, the preprocessing unit 920, the recognition data selecting unit 930, the recognition result providing unit 940, and the model updating unit 950 may be mounted on one neural network learning device, Or separate neural network learning devices, respectively.
  • some of the data acquisition unit 910, the preprocessing unit 920, the recognition data selection unit 930, the recognition result providing unit 940, and the model updating unit 950 are included in the neural network learning device, Some of the rest can be included in the server.
  • At least one of the data acquisition unit 910, the preprocessing unit 920, the recognition data selection unit 930, the recognition result providing unit 940, and the model updating unit 950 may be implemented as a software module.
  • At least one of the data acquisition unit 910, the preprocessing unit 920, the recognition data selection unit 930, the recognition result providing unit 940 and the model updating unit 950 may be a software module Program modules), the software modules may be stored in a computer-readable, readable non-transitory computer readable media.
  • at least one software module may be provided by an operating system (OS) or by a predetermined application.
  • OS operating system
  • OS operating system
  • some of the at least one software module may be provided by an operating system (OS)
  • some of the software modules may be provided by a predetermined application.
  • FIG. 10 is a diagram for explaining a method of integrating a second learning network model generated from a plurality of devices 1022 and 1024 in a server 1010 according to an embodiment.
  • the neural network learning system 1000 may include a plurality of devices 1022 and 1024 and a server 1010. [ However, this is only an example, and the elements of the neural network learning system 1000 are not limited to the above-described examples.
  • the neural network learning system 1000 may be composed of a plurality of servers and a plurality of devices.
  • the first device 1022 and the second device 1024 may each store a second learning network model as described above with reference to FIG.
  • the first device 1022 may provide a query image to the server 1010 and receive characteristic information of the query image obtained using the first learning network model from the server 1010. [
  • the first device 1022 can acquire the generated image using the second learning network model based on the characteristic information of the query image.
  • the second device 1024 can also acquire the generated image by performing an operation corresponding to the operation of the first device 1022 described above.
  • the first device 1022 and the second device 1024 may provide the updated second learning network model to the server 1010 according to the obtained generated image and the acquired image acquisition.
  • the server 1010 can construct a new learning network model capable of recognizing various classes based on the second learning network model and the additional learning data generated in each of the plurality of devices 1022 and 1024 have.
  • the computer readable recording medium may be a magnetic storage medium such as a ROM, a floppy disk, a hard disk, etc., an optical reading medium such as a CD-ROM or a DVD and a carrier wave such as the Internet Lt; / RTI > transmission).

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

본 개시는 인공지능 시스템 및 그 응용에 따라 이미지에 포함된 객체의 클래스 인식을 위한 뉴럴 네트워크 학습 방법으로, 적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 적어도 하나의 클래스와 다른 클래스에 포함된 쿼리(query) 이미지의 특성 정보를 획득하고, 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득하며, 제 1 학습 네트워크 모델을 이용하여, 획득된 생성 이미지의 특성 정보를 획득하고, 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이에 기초하여, 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델 각각에 포함된 레이어의 가중치를 업데이트 할 수 있다.

Description

클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스
개시된 실시예는 클래스 인식을 위한 뉴럴 네트워크 학습 방법, 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스 및 클래스 인식을 위한 뉴럴 네트워크 학습 방법을 수행하는 프로그램이 기록된 기록매체에 관한 것이다.
인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.
인공지능 기술은 기계학습(딥러닝) 및 기계학습을 활용한 요소 기술들로 구성된다.
기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.
인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.
개시된 실시예는 적어도 하나의 학습 네트워크 모델을 이용하여, 기존에 학습되지 않은 새로운 클래스의 쿼리 이미지로부터 추가 학습 데이터를 생성하고, 추가 학습 데이터를 이용하여, 점진적으로 학습 네트워크 모델을 학습시킴으로써 를 새로운 클래스의 이미지를 인식하는 경우 발생될 수 있는 파괴적 망각(catastrophic forgetting) 문제를 해결하기 위한 뉴럴 네트워크 학승 방법 및 디바이스를 제공할 수 있다.
본 개시는 딥러닝 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 인공지능(AI) 시스템 및 그 응용에 관련된 것이다. 특히, 본 개시는 인공지능 시스템 및 그 응용에 따라 이미지에 포함된 객체의 클래스 인식을 위한 뉴럴 네트워크 학습 방법으로, 적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 적어도 하나의 클래스와 다른 클래스에 포함된 쿼리(query) 이미지의 특성 정보를 획득하고, 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득하며, 제 1 학습 네트워크 모델을 이용하여, 획득된 생성 이미지의 특성 정보를 획득하고, 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이에 기초하여, 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델 각각에 포함된 레이어의 가중치를 업데이트 할 수 있다.
도 1은 일 실시예에 따른 뉴럴 네트워크 학습 방법을 설명하기 위한 개념도이다.
도 2는 일 실시예에 따른 디바이스가 클래스 인식을 위해 뉴럴 네트워크를 학습시키는 방법을 설명하기 위한 흐름도이다.
도 3은 일 실시예에 따른 디바이스가 숫자 클래스 인식을 위한 생성 이미지를 획득하는 방법을 설명하기 위한 도면이다.
도 4는 일 실시예에 따른 디바이스 및 서버의 클래스 인식을 위한 뉴럴 네트워크 학습 방법을 설명하기 위한 흐름도이다.
도 5 및 도 6은 일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스의 블록도이다.
도 7은 일 실시예에 따른 프로세서를 설명하기 위한 도면이다.
도 8은 일 실시예에 따른 데이터 학습부의 블록도이다.
도 9는 일 실시예에 따른 데이터 인식부의 블록도이다.
도 10은 일 실시예에 따른 서버에서 복수의 디바이스로부터 생성된 제 2 학습 네트워크 모델을 통합하는 방법을 설명하기 위한 도면이다.
일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 방법은, 적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 적어도 하나의 클래스와 다른 클래스에 포함된 쿼리 이미지의 특성 정보를 획득하는 단계; 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득하는 단계; 제 1 학습 네트워크 모델을 이용하여, 생성 이미지의 특성 정보를 획득하는 단계; 및 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 상기 쿼리 이미지와 상기 생성 이미지 간의 차이에 기초하여, 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델 각각에 포함된 레이어의 가중치를 업데이트 하는 단계를 포함할 수 있다.
일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 방법은, 타겟 클래스에 관한 정보를 획득하는 단계를 더 포함하고, 생성 이미지를 획득하는 단계는, 쿼리 이미지의 특성 정보 및 타겟 클래스에 관한 정보를 기초로 제 2 학습 네트워크 모델을 이용하여, 타겟 클래스에 포함되는 생성 이미지를 획득할 수 있다.
일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 방법에 있어서, 업데이트 하는 단계는, 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이가 각각에 대해 기 설정된 임계값 미만으로 획득될 때까지 반복적으로 수행될 수 있다.
일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 방법에 있어서,
반복적으로 업데이트를 수행한 결과 획득된 제 2 학습 네트워크 모델을 이용하여 획득된 생성 이미지를 클래스 인식을 위한 인식 모델의 학습 이미지로 결정하는 단계를 더 포함할 수 있다.
일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 방법에 있어서, 생성 이미지의 특성 정보를 획득하는 단계는, 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 생성된 복수의 생성 이미지 중 쿼리 이미지 간의 차이가 가장 작은 생성 이미지의 특성 정보를 획득할 수 있다.
일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 방법에 있어서, 이미지의 특성 정보를 획득하는 단계는, 서버에 저장된 제 1 학습 네트워크 모델을 이용하여 획득된 쿼리 이미지의 특성 정보를 서버로부터 수신하는 단계를 포함하고, 뉴럴 네트워크의 학습 방법은, 제 2 학습 네트워크 모델을 이용하여 획득된 생성 이미지를 서버에 전송하는 단계를 더 포함할 수 있다.
일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스는, 하나 이상의 인스트럭션을 저장하는 메모리; 및 메모리에 저장된 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로세서는, 적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 적어도 하나의 클래스와 다른 클래스에 포함된 쿼리 이미지의 특성 정보를 획득하고, 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득하며, 제 1 학습 네트워크 모델을 이용하여, 획득된 생성 이미지의 특성 정보를 획득하고, 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 상기 쿼리 이미지와 생성 이미지 간의 차이에 기초하여, 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델 각각에 포함된 레이어의 가중치를 업데이트 할 수 있다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 구성 요소들은 용어들에 의해 한정되지는 않는다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 항목들의 조합 또는 복수의 관련된 항목들 중의 어느 하나의 항목을 포함한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 특성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1은 일 실시예에 따른 뉴럴 네트워크 학습 방법을 설명하기 위한 개념도이다.
도 1을 참조하면, 뉴럴 네트워크 학습 디바이스(이하, 디바이스)는 클래스 인식을 위한 뉴럴 네트워크 기반의 인식 모델을 학습시키기 위한 학습 이미지를 생성할 수 있다. 본 명세서에서는, 설명의 편의를 위해, 인식 모델을 구성하는 적어도 하나의 학습 네트워크 모델의 이용된 기존의 학습 이미지를 소스 학습 이미지로 설명하고, 추가적으로 입력되는 새로운 클래스의 학습 이미지를 생성 이미지로 설명하도록 한다.
한편, 클래스란 이미지에 포함된 객체의 종류를 나타내는 것으로서, 범주에 따라 다양한 클래스가 존재할 수 있다. 예를 들어, 0, 1, 2, 3, 4, 5 등의 숫자의 종류가 각각 클래스가 될 수도 있고, 강아지, 고양이 등 동물의 종이 클래스가 될 수도 있다. 또한, 다른 예에 따라, 한국어, 영어, 일본어 등 언어의 종류가 클래스가 될 수도 있다.
일 실시예에 따른 디바이스는 다양한 클래스의 이미지를 하나의 모델에 순차적으로 학습시켜, 최종적으로 모든 클래스의 이미지의 인식이 가능한 모델을 학습시키는 것을 목표로 할 수 있다. 다만, 새로운 클래스의 이미지를 학습시키는 경우, 기 생성된 학습 네트워크 모델에 대해 계속해서 학습을 진행하면 이전에 학습한 레이어의 가중치 등의 학습 내용을 망각하게 되는 문제가 발생할 수 있다. 이러한 문제는, 파괴적 망각(catastrophic forgetting)이라고도 표현될 수 있다.
일 실시예에 따른 디바이스는 파괴적 망각 문제에 따라, 기 생성된 학습 네트워크 모델의 학습 내용이 새로운 클래스의 쿼리 이미지(10)로 인해 오버-피팅되는 문제를 최소화하기 위해, 새로운 클래스의 쿼리 이미지(10)가 입력되는 경우, 쿼리 이미지(10)의 특성을 유지하면서도, 학습 네트워크 모델에서 기존에 학습된 클래스를 반영한 생성 이미지(30)를 획득할 수 있다.
구체적으로, 디바이스는 쿼리 이미지(10)로부터 생성 이미지(30)를 획득하기 위한, 제 1 학습 네트워크 모델(110) 및 제 2 학습 네트워크 모델(120)을 저장할 수 있다. 여기에서, 제 1 학습 네트워크 모델(110) 및 제 2 학습 네트워크 모델(120)은 일 예일 뿐, 디바이스는 생성 이미지(30) 획득을 위해 2개 이상의 학습 네트워크 모델을 저장할 수도 있다. 또한, 제 1 학습 네트워크 모델(110) 및 제 2 학습 네트워크 모델(120)은 각각 인코더(encoder) 및 디코더(decoder)로 설명될 수도 있다.
디바이스는 제 1 학습 네트워크 모델(110)을 이용하여, 쿼리 이미지(10)의 특성 정보(20)를 추출할 수 있다. 여기에서, 특성 정보는, 예를 들어, 쿼리 이미지를 구성하는 색상, 엣지(edge), 폴리건(polygon), 채도(saturation), 명도(brightness), 색온도, 블러(blur), 선명도(sharpness) 및 명도비(contrast) 등을 포함할 수 있으나, 특성 정보가 이에 한정되는 것은 아니다.
또한, 디바이스는 제 2 학습 네트워크 모델(120)을 이용하여, 쿼리 이미지(10)의 특성 정보(20)로부터 생성 이미지(30)를 획득할 수 있다. 여기에서, 생성 이미지(30)는 쿼리 이미지(10)의 특성 정보(20)에 기반함에 따라, 쿼리 이미지(10)와 대응되는 특성을 가지면서도, 기존에 학습에 이용된 소스 학습 이미지의 클래스를 가질 수 있다.
일 실시예에 따른 제 2 학습 네트워크 모델(120)은 생성 모델(Generative model)일 수 있다. 생성 모델은 클래스 인식을 위해, 입력과 특성이 동일한 새로운 입력을 생성하기 위한 모델로서, 예를 들어, 특정 클래스의 이미지를 학습한 모델에서, 다시 그 특정 클래스의 이미지와 같은 스타일의 이미지를 생성시킬 수 있다.
디바이스는 생성 이미지(30)를 제 1 학습 네트워크 모델(110)에 입력으로 적용함으로써, 생성 이미지(30)의 특성 정보(40)를 획득할 수 있다.
디바이스는 쿼리 이미지(10)와 생성 이미지(30) 간의 차이에 관한 정보인 대립 손실(adversarial loss) 및 쿼리 이미지(10)의 특성 정보와 생성 이미지(40)의 특성 정보 간의 차이에 관한 정보인 L2 손실(L2 loss)를 획득할 수 있다. 디바이스는 대립 손실과 L2 손실이 줄어들 수 있도록 전술한 일련의 과정을 반복적으로 수행하여, 제 1 학습 네트워크 모델(110)과 제 2 학습 네트워크 모델(120) 각각에 포함된 레이어의 파라미터를 업데이트 함으로써, 제 1 학습 네트워크 모델(110)과 제 2 학습 네트워크 모델(120)을 학습시킬 수 있다.
즉, 디바이스는 생성 모델인 제 2 학습 네트워크 모델(120)을 이용하여 점진적으로 클래스를 학습시킬 수 있다. 여기에서, 점진적인 클래스 학습이란 하나 이상의 개념 가설을 형성한 후에, 점차적으로 추가 예제들을 이용하여 가설을 개선하는 방법으로, 현재 주어진 예와 반례로부터 지식을 생성하고, 계속 새로운 예와 반례가 생길 때마다 점진적으로 현재의 지식을 수정하는 방향으로 진행되는 학습 방법이다.
또한, 디바이스는 인식기(classifier)를 이용하여, 대립 손실과 L2 손실을 기초로, 획득된 생성 이미지 중에서 소스 학습 이미지와 가장 근접한 생성 이미지를 선택하여, 제 1 학습 네트워크 모델(110) 및 제 2 학습 네트워크 모델(120)의 학습에 이용할 수 있다. 예를 들어, 디바이스는 조건부 GAN(Generative Adversarial Network) 알고리즘을 이용하는 경우, 구별망(discriminator)의 조건 별 출력 데이터를 인식기의 결과와 일치하도록 하는 컨스트레인트(constraint)를 추가하여, 생성 모델인 제 2 학습 네트워크 모델(120)을 학습시킬 수 있다. 여기에서, 인식기는 입력 이미지에 포함된 객체의 클래스를 인식할 수 있도록 학습된 뉴럴 네트워크로 구성될 수 있다.
전술한 실시예에 따라 디바이스는 기존의 클래스가 반영되면서도, 쿼리 이미지(10)의 다양한 특성 정보를 갖는 생성 이미지를 획득하여, 인식 모델을 학습시킴으로써, 클래스 인식에 대한 정확도를 높일 수 있다. 또한, 디바이스는 획득된 생성 이미지와 새로운 클래스의 쿼리 이미지를 함께 활용하여 새로운 클래스의 인식이 가능하도록 인식기를 학습시킬 수 있다.
도 2는 일 실시예에 따른 디바이스가 클래스 인식을 위해 뉴럴 네트워크를 학습시키는 방법을 설명하기 위한 흐름도이다.
단계 S210에서, 디바이스는 적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 적어도 하나의 클래스와는 다른 클래스에 포함된 쿼리 이미지의 특성 정보를 획득할 수 있다.
일 실시예에 따른 제 1 학습 네트워크 모델은 입력되는 이미지로부터 특성 정보를 추출하기 위한 적어도 하나의 레이어로 구성될 수 있다. 또한, 제 1 학습 네트워크 모델에서 적어도 하나의 레이어의 가중치는 기존에 입력된 소스 학습 이미지를 기초로 미리 학습된 것으로 가정한다.
한편, 디바이스는 기존에 학습에 이용된 소스 학습 이미지의 클래스와는 다른 클래스를 갖는 쿼리 이미지를 획득할 수 있다. 디바이스는 제 1 학습 네트워크 모델에 쿼리 이미지를 입력하여, 출력 데이터로 쿼리 이미지의 특성 정보를 획득할 수 있다.
단계 S220에서, 디바이스는 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득할 수 있다.
일 실시예에 따른 생성 이미지는 기존의 소스 학습 이미지를 기초로 학습된 제 2 학습 네트워크 모델을 기반으로 획득됨에 따라, 기존의 소스 학습 이미지의 클래스와 대응되는 클래스의 이미지일 수 있다. 다만, 이는 일 실시예일 뿐 생성 이미지의 클래스는 소스 학습 이미지의 클래스와 상이할 수 있다. 또한, 생성 이미지는 쿼리 이미지의 특성 정보와 대응되는 특성 정보를 가질 수 있다.
단계 S230에서, 디바이스는 제 1 학습 네트워크 모델을 이용하여 획득된 생성 이미지의 특성 정보를 획득할 수 있다.
디바이스는 제 2 학습 네트워크 모델을 이용하여 획득된 생성 이미지를 다시 제 1 학습 네트워크 모델에 입력할 수 있다. 디바이스는 제 1 학습 네트워크 모델에 포함된 복수의 레이어를 이용하여, 생성 이미지의 특성 정보를 획득할 수 있다.
단계 S240에서, 디바이스는 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이에 기초하여 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델 각각에 포함된 레이어의 가중치를 업데이트 할 수 있다.
여기에서, 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이는 L2 손실로서 나타낼 수 있다. 또한, 쿼리 이미지와 생성 이미지 간의 차이는 대립(adversarial) 손실로 나타낼 수 있다. 다만, 이는 일 예일 뿐, 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이에 관한 정보가 L2 손실 또는 대립 손실에 한정되는 것은 아니다.
디바이스는 L2 손실과 대립 손실 각각이 기 설정된 임계값 미만이 되는 시점까지 단계 S210 내지 단계 S240을 반복적으로 수행함으로써, 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델을 학습시킬 수 있다.
일 실시예에 따른 디바이스는 단순히 기존의 학습 내용을 기억해 내는 것이 아닌, 새로운 클래스의 쿼리 이미지로부터 특징을 추출하여, 추출된 특징을 갖는 다른 학습 이미지를 학습에 추가적으로 이용으로써, 학습 네트워크 모델의 성능을 향상시킬 수 있다.
도 3은 일 실시예에 따른 디바이스가 숫자 클래스 인식을 위한 생성 이미지를 획득하는 방법을 설명하기 위한 도면이다.
도 3을 참조하면, 디바이스는 숫자 0 내지 5에 대한 소스 학습 이미지(305)를 기초로 학습된 제 1 학습 네트워크 모델(110) 및 제 2 학습 네트워크 모델(120)을 저장할 수 있다. 또한, 본 실시예에서 클래스는 숫자의 종류를 의미할 수 있다. 예를 들어, 제 1 학습 네트워크 모델(110) 및 제 2 학습 네트워크 모델(120) 각각은 0, 1, 2, 3, 4, 5의 클래스를 갖는 소스 학습 이미지를 기초로 학습됨에 따라 각각의 학습 네트워크 모델을 구성하는 레이어의 가중치가 숫자 0, 1, 2, 3, 4, 5를 인식할 수 있도록 설정될 수 있다.
한편, 디바이스는 새로운 클래스인 숫자 6의 쿼리 이미지(310)를 획득할 수 있다. 디바이스는 제 1 학습 네트워크 모델(110)을 이용하여, 숫자 6의 쿼리 이미지(310)의 특성 정보(320)를 획득할 수 있다. 디바이스는 제 2 학습 네트워크 모델(120)을 이용하여, 숫자 6의 쿼리 이미지의 특성 정보(320)로부터 생성 이미지(330)를 획득할 수 있다. 여기에서, 생성 이미지(330)는 0 내지 5에 대한 소스 학습 이미지(305) 중 어느 하나에 대응되는 클래스를 가질 수 있다.
다른 실시예에 따라, 디바이스는 제 2 학습 네트워크 모델(120)에 타겟 클래스에 관한 정보를 입력할 수도 있다. 여기에서, 타겟 클래스는 사용자 등의 의도에 따른 생성 이미지의 클래스를 나타내는 것으로서, 제 2 학습 네트워크 모델(120)이 기존에 학습하였던 클래스 중 어느 하나로서 선택될 수 있다.
또한, 디바이스는 타겟 클래스에 관한 정보 및 숫자 6의 쿼리 이미지의 특성 정보(320)를 기초로 제 2 학습 네트워크 모델(120)을 이용하여 생성 이미지(330)를 획득할 수 있다. 타겟 클래스가 5인 경우, 제 2 학습 네트워크 모델(120)을 통해 생성되는 생성 이미지(330)는 숫자 6의 특성 정보에 대응되는 특성을 가지면서, 클래스가 5인 이미지일 수 있다.
일 실시예에 따른, 디바이스는 제 1 학습 네트워크 모델(110)에 생성된 생성 이미지(330)를 입력함으로써, 생성 이미지(330)의 특성 정보(340)를 획득할 수 있다.
또한, 디바이스는 쿼리 이미지(310)와 생성 이미지(330) 간의 차이에 해당하는 대립 손실 및 쿼리 이미지의 특성 정보(320)와 생성 이미지(330)의 특성 정보(340) 간의 차이에 해당하는 L2 손실에 기초하여, 제 1 학습 네트워크 모델(110) 및 제 2 학습 네트워크 모델(120) 각각을 구성하는 레이어의 가중치를 업데이트 할 수 있다.
도 4는 일 실시예에 따른 디바이스 및 서버의 클래스 인식을 위한 뉴럴 네트워크 학습 방법을 설명하기 위한 흐름도이다.
단계 S410에서, 디바이스는 서버에 쿼리 이미지를 전송할 수 있다. 디바이스는 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델의 학습에 기초가 된 소스 학습 이미지와 다른 클래스에 해당하는 쿼리 이미지를 획득할 수 있다. 디바이스는 쿼리 이미지가 획득됨에 따라, 이를 서버에 전송할 수 있다.
단계 S420에서, 서버는 제 1 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보를 획득할 수 있다.
서버에는 입력된 이미지로부터 특성 정보를 추출하기 위한 제 1 학습 네트워크 모델이 저장될 수 있다. 서버는 디바이스로부터 쿼리 이미지가 수신됨에 따라, 제 1 학습 네트워크 모델을 이용하여 쿼리 이미지로부터 특성 정보를 획득할 수 있다.
단계 S430에서, 서버는 디바이스의 쿼리 이미지의 특성 정보를 전송할 수 있다.
단계 S440에서, 디바이스는 제 2 학습 네트워크 모델을 이용하여 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득할 수 있다.
일 실시예에 따른 디바이스는 쿼리 이미지의 특성과 대응되는 특성을 가지면서도, 기존의 소스 학습 이미지의 클래스를 반영한 생성 이미지를 획득할 수 있다.
단계 S450에서, 디바이스는 생성 이미지를 서버에 전송할 수 있다.
단계 S460에서, 서버는 쿼리 이미지와 생성 이미지 간의 차이 및 각각의 특성 정보간의 차이에 기초하여, 제 1 학습 네트워크 모델의 가중치를 업데이트 할 수 있다.
서버는 쿼리 이미지와 생성 이미지 간의 차이 및 각각의 특성 정보간의 차이가 줄어드는 방향으로, 제 1 학습 네트워크 모델의 가중치를 업데이트 할 수 있다.
단계 S470에서, 서버는 쿼리 이미지와 생성 이미지 간의 차이 및 각각의 특성 정보 간의 차이에 관한 정보를 디바이스에 전송할 수 있다.
단계 S480에서, 디바이스는 쿼리 이미지와 생성 이미지 간의 차이 및 각각의 특성 정보 간의 차이에 기초하여 제 2 학습 네트워크 모델의 가중치를 업데이트 할 수 있다.
디바이스는 쿼리 이미지와 생성 이미지 간의 차이 및 각각의 특성 정보간의 차이가 줄어드는 방향으로, 제 2 학습 네트워크 모델의 가중치를 업데이트 할 수 있다.
도 5 및 도 6은 일 실시예에 따른 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스(500)의 블록도이다.
도 5를 참조하면, 뉴럴 네트워크 학습 디바이스(500, 이하, 디바이스)는 프로세서(510) 및 메모리(520)를 포함할 수 있다. 다만, 이는 일 실시예일 뿐, 디바이스(500)는 프로세서(510) 및 메모리(520) 보다 더 적거나 더 많은 구성 요소를 포함할 수 있다. 예를 들어, 도 6을 참조하면, 다른 실시예에 따른 디바이스(600)는 프로세서(510) 및 메모리(520) 이외에 통신부(520) 및 출력부(540)를 더 포함할 수 있다. 또한, 다른 예에 따라, 디바이스(500)는 복수의 프로세서들을 포함할 수도 있다.
프로세서(510)는 하나 이상의 코어(core, 미도시) 및 그래픽 처리부(미도시) 및/또는 다른 구성 요소와 신호를 송수신하는 연결 통로(예를 들어, 버스(bus) 등)를 포함할 수 있다.
프로세서(510)는 하나 이상의 코어(core, 미도시) 및 그래픽 처리부(미도시) 및/또는 다른 구성 요소와 신호를 송수신하는 연결 통로(예를 들어, 버스(bus) 등)를 포함할 수 있다.
일 실시예에 따라 프로세서(510)는 도 1 내지 도 4을 참고하여 전술한 디바이스의 동작을 수행할 수 있다.
예를 들어, 프로세서(510)는 적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 적어도 하나의 클래스와 다른 클래스에 포함된 쿼리 이미지의 특성 정보를 획득할 수 있다. 프로세서(520)는 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득할 수 있다. 프로세서(520)는 제 1 학습 네트워크 모델을 이용하여, 획득된 생성 이미지의 특성 정보를 획득할 수 있다.
또한, 프로세서(520)는 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이에 관한 정보를 획득할 수 있다. 프로세서(520)는 획득된 차이에 관한 정보에 기초하여, 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델 각각에 포함된 적어도 하나의 레이어의 파라미터를 업데이트 할 수 있다.
일 실시예에 따른 프로세서(520)는 타겟 클래스에 관한 정보를 획득할 수 있다. 또한, 프로세서(520)는 쿼리 이미지의 특성 정보 및 타겟 클래스에 관한 정보를 기초로 제 2 학습 네트워크 모델을 이용하여, 타겟 클래스에 포함되는 생성 이미지를 획득할 수 있다.
프로세서(520)는 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이가 각각에 대해 기 설정된 임계값 미만으로 획득될 까지 전술한 업데이트 동작을 반복적으로 수행할 수 있다.
한편, 프로세서(120)는 프로세서(120) 내부에서 처리되는 신호(또는, 데이터)를 일시적 및/또는 영구적으로 저장하는 램(RAM: Random Access Memory, 미도시) 및 롬(ROM: Read-Only Memory, 미도시)을 더 포함할 수 있다. 또한, 프로세서(120)는 그래픽 처리부, 램 및 롬 중 적어도 하나를 포함하는 시스템온칩(SoC: system on chip) 형태로 구현될 수 있다.
메모리(520)는 프로세서(510)의 처리 및 제어를 위한 프로그램들(하나 이상의 인스트럭션들)을 저장할 수 있다. 메모리(520)에 저장된 프로그램들은 기능에 따라 복수 개의 모듈들로 구분될 수 있다. 일 실시예에 따라 메모리(520)는 도 7을 참고하여 후술할 데이터 학습부 및 데이터 인식부가 소프트웨어 모듈로 구성될 수 있다. 또한, 데이터 학습부 및 데이터 인식부는 각각 독립적으로 학습 네트워크 모델을 포함하거나, 하나의 학습 네트워크 모델을 공유할 수 있다.
통신부(530)는 외부 서버(예를 들어, 도 4의 서버 등) 및 기타 외부 장치와 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 통신부(530)는 서버에 저장된 제 1 학습 네트워크 모델을 이용하여 획득된 쿼리 이미지의 특성 정보를 서버로부터 수신할 수 있다. 또한, 통신부(530)는 특성 정보를 기초로 제 2 학습 네트워크 모델을 이용하여 획득된 생성 이미지를 서버에 전송할 수 있다.
출력부(540)는 획득된 생성 이미지를 출력할 수 있다. 또한, 출력부(540)는 쿼리 이미지의 특성 정보와 생성 이미지의 특성 정보 간의 차이 및 쿼리 이미지와 생성 이미지 간의 차이에 관한 정보를 출력할 수 있다.
한편, 디바이스(500)는 예를 들어, PC, 랩톱, 휴대폰, 마이크로 서버, GPS(global positioning system) 장치, 스마트 폰, 웨어러블 단말기, 전자책 단말기, 가전기기, 자동차 내의 전자 장치 및 기타 모바일 또는 비모바일 컴퓨팅 장치일 수 있다. 그러나, 이에 제한되지 않으며, 디바이스(500)는 데이터 프로세싱 기능을 구비한 모든 종류의 기기를 포함할 수 있다.
도 7은 일 실시예에 따른 프로세서(510)를 설명하기 위한 도면이다.
도 7을 참조하면, 일 실시예에 따른 프로세서(510)는 데이터 학습부(710) 및 데이터 인식부(720)를 포함할 수 있다.
데이터 학습부(710)는 이미지로부터 특성 정보를 획득하기 위한 기준을 학습할 수 있다. 예를 들어, 데이터 학습부(710)는 소스 학습 이미지, 쿼리 학습 이미지 및 생성 이미지 중 적어도 하나로부터 특성 정보를 획득하기 위한 기준을 학습할 수 있다. 여기에서, 학습된 기준에 따라, 데이터 학습부(710)에 포함된 적어도 하나의 레이어의 가중치가 결정될 수 있다.
데이터 인식부(720)는 데이터 학습부(710)를 통해 학습된 기준에 기초하여, 복수의 이미지 각각의 특성 정보를 추출하거나, 복수의 이미지 각각에 포함된 객체의 클래스를 인식할 수 있다.
데이터 학습부(710) 및 데이터 인식부(720) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 뉴럴 네트워크 학습 디바이스에 탑재될 수 있다. 예를 들어, 데이터 학습부(710) 및 데이터 인식부(720) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 뉴럴 네트워크 학습 디바이스에 탑재될 수도 있다.
이 경우, 데이터 학습부(710) 및 데이터 인식부(720)는 하나의 뉴럴 네트워크 학습 디바이스에 탑재될 수도 있으며, 또는 별개의 뉴럴 네트워크 학습 디바이스에 각각 탑재될 수도 있다. 예를 들어, 데이터 학습부(710) 및 데이터 인식부(720) 중 하나는 디바이스에 포함되고, 나머지 하나는 서버에 포함될 수 있다. 또한, 데이터 학습부(710) 및 데이터 인식부(720)는 유선 또는 무선으로 통하여, 데이터 학습부(710)가 구축한 모델 정보를 데이터 인식부(720)로 제공할 수도 있고, 데이터 인식부(720)로 입력된 데이터가 추가 학습 데이터로서 데이터 학습부(710)로 제공될 수도 있다.
한편, 데이터 학습부(710) 및 데이터 인식부(720) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 학습부(710) 및 데이터 인식부(720) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 어플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 어플리케이션에 의해 제공될 수 있다.
도 8은 일 실시예에 따른 데이터 학습부(710)의 블록도이다.
도 8을 참조하면, 일부 실시예에 따른 데이터 학습부(710)는 데이터 획득부(810), 전처리부(820), 학습 데이터 선택부(830), 모델 학습부(840) 및 모델 평가부(850)를 포함할 수 있다. 다만, 이는 일 실시예일 뿐, 전술한 구성 들 보다 적은 구성 요소로 데이터 학습부(710)가 구성되거나, 전술한 구성들 이외에 다른 구성 요소가 추가적으로 데이터 학습부(710)에 포함될 수 있다.
데이터 획득부(810)는 소스 학습 이미지 및 쿼리 이미지 중 적어도 하나를 학습 이미지로 획득할 수 있다. 일 예로, 데이터 획득부(810)는 데이터 학습부(710)를 포함하는 뉴럴 네트워크 학습 디바이스 또는 데이터 학습부(710)를 포함하는 뉴럴 네트워크 학습 디바이스와 통신 가능한 외부의 디바이스 또는 서버로부터 적어도 하나의 이미지를 획득할 수 있다.
또한, 데이터 획득부(810)는 도 1 내지 도 4를 참고하여 전술한 제 1 학습 네트워크 모델 및 제 2 학습 네트워크 모델을 이용하여, 쿼리 이미지의 특성 정보로부터 획득한 생성 이미지를 획득할 수도 있다.
한편, 일 실시예에 따른 데이터 획득부(810)에서 획득하는 적어도 하나의 이미지는 클래스에 따라 분류된 이미지 중 하나일 수 있다. 예를 들어, 데이터 획득부(810)는 종 별로 분류된 이미지를 기초로 학습을 수행할 수 있다.
전처리부(820)는 이미지의 특성 정보 추출 또는 이미지 내의 객체의 클래스 인식을 위한 학습에 획득된 이미지가 이용될 수 있도록, 획득된 이미지를 전처리할 수 있다. 전처리부(820)는 후술할 모델 학습부(840)가 학습을 위하여 획득된 적어도 하나의 이미지를 이용할 수 있도록, 획득된 적어도 하나의 이미지를 기 설정된 포맷으로 가공할 수 있다.
학습 데이터 선택부(830)는 전처리된 데이터 중에서 학습에 필요한 이미지를 선택할 수 있다. 선택된 이미지는 모델 학습부(840)에 제공될 수 있다. 학습 데이터 선택부(830)는 설정된 기준에 따라, 전처리된 이미지 중에서 학습에 필요한 이미지를 선택할 수 있다.
모델 학습부(840)는 학습 네트워크 모델 내의 복수의 레이어에서 이미지로부터 어떠한 정보를 이용하여, 특성 정보를 획득하거나, 이미지 내의 객체를 인식하는지에 대한 기준을 학습할 수 있다. 예를 들어, 모델 학습부(840)는 소스 학습 이미지에 근접한 생성 이미지 획득을 위하여, 쿼리 이미지로부터 어떠한 특성 정보를 추출해야 하는지 또는 추출된 특성 정보로부터 어떠한 기준에 따라 생성 이미지를 획득할 지에 대한 기준을 학습할 수 있다.
다양한 실시예에 따르면, 모델 학습부(840)는 미리 구축된 데이터 인식 모델이 복수 개가 존재하는 경우, 입력된 학습 데이터와 기본 학습 데이터의 관련성이 큰 데이터 인식 모델을 학습할 데이터 인식 모델로 결정할 수 있다. 이 경우, 기본 학습 데이터는 데이터의 타입 별로 기 분류되어 있을 수 있으며, 데이터 인식 모델은 데이터의 타입 별로 미리 구축되어 있을 수 있다. 예를 들어, 기본 학습 데이터는 학습 데이터가 생성된 지역, 학습 데이터가 생성된 시간, 학습 데이터의 크기, 학습 데이터의 장르, 학습 데이터의 생성자, 학습 데이터 내의 객체의 종류 등과 같은 다양한 기준으로 기 분류되어 있을 수 있다.
또한, 모델 학습부(840)는, 예를 들어, 학습에 따라 인식된 클래스가 올바른 지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 통하여, 데이터 생성 모델을 학습시킬 수 있다.
또한, 데이터 생성 모델이 학습되면, 모델 학습부(840)는 학습된 데이터 생성 모델을 저장할 수 있다. 이 경우, 모델 학습부(840)는 학습된 데이터 생성 모델을 데이터 획득부(810)를 포함하는 뉴럴 네트워크 학습 디바이스의 메모리에 저장할 수 있다. 또는, 모델 학습부(840)는 학습된 데이터 생성 모델을 뉴럴 네트워크 학습 디바이스와 유선 또는 무선 네트워크로 연결되는 서버의 메모리에 저장할 수도 있다.
이 경우, 학습된 데이터 생성 모델이 저장되는 메모리는, 예를 들면, 뉴럴 네트워크 학습 디바이스의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 함께 저장할 수도 있다. 또한, 메모리는 소프트웨어 및/또는 프로그램을 저장할 수도 있다. 프로그램은, 예를 들면, 커널, 미들웨어, 애플리케이션 프로그래밍 인터페이스(API) 및/또는 애플리케이션 프로그램(또는 "애플리케이션") 등을 포함할 수 있다.
모델 평가부(850)는 데이터 생성 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 추가 학습 데이터의 생성 결과, 소정 기준을 만족하지 못하는 경우, 모델 학습부(840)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 데이터 생성 모델을 평가하기 위한 기 설정된 데이터일 수 있다. 여기에서, 평가 데이터는 학습 네트워크 모델을 기반으로 생성된 생성 이미지와 쿼리 이미지 간의 차이 및 생성 이미지의 특성 정보와 쿼리 이미지의 특성 정보 간의 차이 등을 포함할 수 있다.
한편, 학습 네트워크 모델이 복수 개 존재하는 경우, 모델 평가부(750)는 각각의 학습 네트워크 모델에 대하여 소정 기준을 만족하는지를 평가하고, 소정 기준을 만족하는 모델을 최종 학습 네트워크 모델로서 결정할 수 있다.
한편, 데이터 학습부(710) 내의 데이터 획득부(810), 전처리부(820), 학습 데이터 선택부(830), 모델 학습부(840) 및 모델 평가부(850) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 뉴럴 네트워크 학습 디바이스에 탑재될 수 있다. 예를 들어, 데이터 획득부(810), 전처리부(820), 학습 데이터 선택부(830), 모델 학습부(840) 및 모델 평가부(850) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 뉴럴 네트워크 학습 디바이스 에 탑재될 수도 있다.
또한, 데이터 획득부(810), 전처리부(820), 학습 데이터 선택부(830), 모델 학습부(840) 및 모델 평가부(850)는 하나의 뉴럴 네트워크 학습 디바이스에 탑재될 수도 있으며, 또는 별개의 뉴럴 네트워크 학습 디바이스들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(810), 전처리부(820), 학습 데이터 선택부(830), 모델 학습부(840) 및 모델 평가부(850) 중 일부는 뉴럴 네트워크 학습 디바이스에 포함되고, 나머지 일부는 서버에 포함될 수 있다.
또한, 데이터 획득부(810), 전처리부(820), 학습 데이터 선택부(830), 모델 학습부(840) 및 모델 평가부(850) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(810), 전처리부(820), 학습 데이터 선택부(830), 모델 학습부(840) 및 모델 평가부(850) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
도 9는 일 실시예에 따른 데이터 인식부(720)의 블록도이다.
도 9를 참조하면, 일부 실시예에 따른 데이터 인식부(720)는 데이터 획득부(910), 전처리부(920), 인식 데이터 선택부(930), 인식 결과 제공부(940) 및 모델 갱신부(950)를 포함할 수 있다.
데이터 획득부(910)는 이미지의 특성 정보 추출 또는 이미지 내의 객체 인식에 필요한 적어도 하나의 이미지를 획득할 수 있으며, 전처리부(920)는 이미지의 특성 정보 추출 또는 이미지 내의 객체의 클래스 인식을 위해 획득된 적어도 하나의 이미지가 이용될 수 있도록, 획득된 이미지를 전처리할 수 있다. 전처리부(920)는 후술할 인식 결과 제공부(940)가 이미지의 특성 정보 추출 또는 이미지 내의 객체의 클래스 인식을 위하여 획득된 이미지를 이용할 수 있도록, 획득된 이미지를 기 설정된 포맷으로 가공할 수 있다. 인식 데이터 선택부(930)는 전처리된 데이터 중에서 특성 추출 또는 클래스 인식에 필요한 이미지를 선택할 수 있다. 선택된 데이터는 인식 결과 제공부(840)에게 제공될 수 있다.
인식 결과 제공부(940)는 선택된 이미지를 일 실시예에 따른 학습 네트워크 모델에 적용하여 이미지의 특성 정보를 추출하거나, 이미지 내의 객체를 인식할 수 있다. 학습 네트워크 모델에 적어도 하나의 이미지를 입력하여 특성 정보를 추출하거나 객체를 인식하는 방법은 도 1 내지 4을 참고하여 전술한 방법과 대응될 수 있다.
인식 결과 제공부(940)는 적어도 하나의 이미지 내에 포함된 객체의 클래스를 인식한 결과를 제공할 수 있다.
모델 갱신부(950)는 인식 결과 제공부(940)에 의해 제공되는 이미지 내의 객체의 클래스 인식 결과에 대한 평가에 기초하여, 학습 네트워크 모델에 포함된 종분류 네트워크 또는 적어도 하나의 특성 추출 레이어의 파라미터 등이 갱신되도록 평가에 대한 정보를 도 8을 참고하여 전술한 모델 학습부(840)에게 제공할 수 있다.
한편, 데이터 인식부(720) 내의 데이터 획득부(910), 전처리부(920), 인식 데이터 선택부(930), 인식 결과 제공부(940) 및 모델 갱신부(950) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 뉴럴 네트워크 학습 디바이스에 탑재될 수 있다. 예를 들어, 데이터 획득부(910), 전처리부(920), 인식 데이터 선택부(930), 인식 결과 제공부(940) 및 모델 갱신부(950) 중 적어도 하나는 인공 지능을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 뉴럴 네트워크 학습 디바이스에 탑재될 수도 있다.
또한, 데이터 획득부(910), 전처리부(920), 인식 데이터 선택부(930), 인식 결과 제공부(940) 및 모델 갱신부(950)는 하나의 뉴럴 네트워크 학습 디바이스에 탑재될 수도 있으며, 또는 별개의 뉴럴 네트워크 학습 디바이스들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(910), 전처리부(920), 인식 데이터 선택부(930), 인식 결과 제공부(940) 및 모델 갱신부(950) 중 일부는 뉴럴 네트워크 학습 디바이스에 포함되고, 나머지 일부는 서버에 포함될 수 있다.
또한, 데이터 획득부(910), 전처리부(920), 인식 데이터 선택부(930), 인식 결과 제공부(940) 및 모델 갱신부(950) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(910), 전처리부(920), 인식 데이터 선택부(930), 인식 결과 제공부(940) 및 모델 갱신부(950) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 어플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 어플리케이션에 의해 제공될 수 있다.
도 10은 일 실시예에 따른 서버(1010)에서 복수의 디바이스(1022, 1024)로부터 생성된 제 2 학습 네트워크 모델을 통합하는 방법을 설명하기 위한 도면이다.
도 10을 참조하면, 뉴럴 네트워크 학습 시스템(1000)은 복수의 디바이스(1022, 1024) 및 서버(1010)를 포함할 수 있다. 다만, 이는 일 예일 뿐, 뉴럴 네트워크 학습 시스템(1000)의 구성 요소가 전술한 예에 한정되는 것은 아니다. 예를 들어, 뉴럴 네트워크 학습 시스템(1000)은 복수의 서버 및 복수의 디바이스로 구성될 수도 있다.
제 1 디바이스(1022) 및 제 2 디바이스(1024)는 도 4를 참조하여 전술한 바와 같이 각각 제 2 학습 네트워크 모델을 저장할 수 있다. 제 1 디바이스(1022)는 서버(1010)에 쿼리 이미지를 제공하고, 서버(1010)로부터 제 1 학습 네트워크 모델을 이용하여 획득된 쿼리 이미지의 특성 정보를 수신할 수 있다. 제 1 디바이스(1022)는 쿼리 이미지의 특성 정보를 기초로 제 2 학습 네트워크 모델을 이용하여 생성 이미지를 획득할 수 있다.
또한, 제 2 디바이스(1024) 역시, 전술한 제 1 디바이스(1022)의 동작에 대응되는 동작을 수행함으로써, 생성 이미지를 획득할 수 있다.
한편, 일 실시예에 따른 제 1 디바이스(1022) 및 제 2 디바이스(1024)는 획득된 생성 이미지 및 생성 이미지 획득에 따라 업데이트 된 제 2 학습 네트워크 모델을 서버(1010)에 제공할 수 있다.
일 실시예에 따른 서버(1010)는 복수의 디바이스(1022, 1024) 각각에서 생성된 추가 학습 데이터 및 제 2 학습 네트워크 모델을 기반으로, 다양한 클래스를 인식할 수 있는 새로운 학습 네트워크 모델을 구축할 수 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이상과 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

Claims (13)

  1. 적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 상기 적어도 하나의 클래스와 다른 클래스에 포함된 쿼리(query) 이미지의 특성 정보를 획득하는 단계;
    제 2 학습 네트워크 모델을 이용하여, 상기 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득하는 단계;
    상기 제 1 학습 네트워크 모델을 이용하여, 상기 획득된 생성 이미지의 특성 정보를 획득하는 단계; 및
    상기 쿼리 이미지의 특성 정보와 상기 생성 이미지의 특성 정보 간의 차이 및 상기 쿼리 이미지와 상기 생성 이미지 간의 차이에 기초하여, 상기 제 1 학습 네트워크 모델 및 상기 제 2 학습 네트워크 모델 각각에 포함된 레이어의 가중치를 업데이트 하는 단계를 포함하는, 클래스 인식을 위한 뉴럴 네트워크 학습 방법.
  2. 제 1 항에 있어서,
    타겟 클래스에 관한 정보를 획득하는 단계를 더 포함하고,
    상기 생성 이미지를 획득하는 단계는,
    상기 쿼리 이미지의 특성 정보 및 상기 타겟 클래스에 관한 정보를 기초로 상기 제 2 학습 네트워크 모델을 이용하여, 상기 타겟 클래스에 포함되는 생성 이미지를 획득하는, 클래스 인식을 위한 뉴럴 네트워크 학습 방법.
  3. 제 1 항에 있어서, 상기 업데이트 하는 단계는,
    상기 쿼리 이미지의 특성 정보와 상기 생성 이미지의 특성 정보 간의 차이 및 상기 쿼리 이미지와 상기 생성 이미지 간의 차이가 각각에 대해 기 설정된 임계값 미만으로 획득될 때까지 반복적으로 수행되는, 클래스 인식을 위한 뉴럴 네트워크 학습 방법.
  4. 제 3 항에 있어서,
    반복적으로 업데이트를 수행한 결과 획득된 제 2 학습 네트워크 모델을 이용하여 생성된 생성 이미지를 클래스 인식을 위한 인식 모델의 학습 이미지로 결정하는 단계를 더 포함하는, 클래스 인식을 위한 뉴럴 네트워크 학습 방법.
  5. 제 1 항에 있어서, 상기 생성 이미지의 특성 정보를 획득하는 단계는,
    상기 제 2 학습 네트워크 모델을 이용하여, 상기 쿼리 이미지의 특성 정보로부터 생성된 복수의 생성 이미지 중 상기 쿼리 이미지 간의 차이가 가장 작은 생성 이미지의 특성 정보를 획득하는, 클래스 인식을 위한 뉴럴 네트워크 학습 방법.
  6. 제 1 항에 있어서, 상기 이미지의 특성 정보를 획득하는 단계는,
    서버에 저장된 상기 제 1 학습 네트워크 모델을 이용하여 획득된 상기 쿼리 이미지의 특성 정보를 상기 서버로부터 수신하는 단계를 포함하고,
    상기 뉴럴 네트워크의 학습 방법은,
    상기 제 2 학습 네트워크 모델을 이용하여 획득된 상기 생성 이미지를 상기 서버에 전송하는 단계를 더 포함하는, 클래스 인식을 위한 뉴럴 네트워크 학습 방법.
  7. 하나 이상의 인스트럭션을 저장하는 메모리; 및
    상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서를 포함하고,
    상기 적어도 하나의 프로세서는,
    적어도 하나의 클래스 각각에 포함된 소스 학습 이미지를 기초로 학습된 제 1 학습 네트워크 모델을 이용하여, 상기 적어도 하나의 클래스와 다른 클래스에 포함된 쿼리 이미지의 특성 정보를 획득하고,
    제 2 학습 네트워크 모델을 이용하여, 상기 쿼리 이미지의 특성 정보로부터 생성 이미지를 획득하며,
    상기 제 1 학습 네트워크 모델을 이용하여, 상기 획득된 생성 이미지의 특성 정보를 획득하고,
    상기 쿼리 이미지의 특성 정보와 상기 생성 이미지의 특성 정보 간의 차이 및 상기 쿼리 이미지와 상기 생성 이미지 간의 차이에 기초하여, 상기 제 1 학습 네트워크 모델 및 상기 제 2 학습 네트워크 모델 각각에 포함된 레이어의 가중치를 업데이트 하는, 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스.
  8. 제 7 항에 있어서, 상기 적어도 하나의 프로세서는,
    타겟 클래스에 관한 정보를 획득하고,
    상기 쿼리 이미지의 특성 정보 및 상기 타겟 클래스에 관한 정보를 기초로 상기 제 2 학습 네트워크 모델을 이용하여, 상기 타겟 클래스에 포함되는 생성 이미지를 획득하는, 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스.
  9. 제 7 항에 있어서, 상기 업데이트 하는 단계는,
    상기 쿼리 이미지의 특성 정보와 상기 생성 이미지의 특성 정보 간의 차이 및 상기 쿼리 이미지와 상기 생성 이미지 간의 차이가 각각에 대해 기 설정된 임계값 미만으로 획득될 때까지 반복적으로 수행되는, 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스.
  10. 제 9 항에 있어서,
    반복적으로 업데이트를 수행한 결과 획득된 제 2 학습 네트워크 모델을 이용하여 생성된 생성 이미지를 클래스 인식을 위한 인식 모델의 학습 이미지로 결정하는 단계를 더 포함하는, 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스.
  11. 제 7 항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 제 2 학습 네트워크 모델을 이용하여, 상기 쿼리 이미지의 특성 정보로부터 생성된 복수의 생성 이미지 중 상기 쿼리 이미지 간의 차이가 가장 작은 생성 이미지의 특성 정보를 획득하는, 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스.
  12. 제 7 항에 있어서,
    통신부를 더 포함하고,
    상기 적어도 하나의 프로세서는,
    서버에 저장된 상기 제 1 학습 네트워크 모델을 이용하여 획득된 상기 쿼리 이미지의 특성 정보를 상기 서버로부터 수신하고, 상기 디바이스에 저장된 제 2 학습 네트워크 모델을 이용하여 생성된 상기 생성 이미지를 상기 서버에 전송하도록 상기 통신부를 제어하는, 클래스 인식을 위한 뉴럴 네트워크 학습 디바이스.
  13. 제 1항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
PCT/KR2018/010271 2017-09-08 2018-09-04 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스 WO2019050247A2 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/645,344 US11449733B2 (en) 2017-09-08 2018-09-04 Neural network learning method and device for recognizing class

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2017-0115451 2017-09-08
KR1020170115451A KR102481885B1 (ko) 2017-09-08 2017-09-08 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스

Publications (2)

Publication Number Publication Date
WO2019050247A2 true WO2019050247A2 (ko) 2019-03-14
WO2019050247A3 WO2019050247A3 (ko) 2019-05-02

Family

ID=65634503

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/010271 WO2019050247A2 (ko) 2017-09-08 2018-09-04 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스

Country Status (3)

Country Link
US (1) US11449733B2 (ko)
KR (1) KR102481885B1 (ko)
WO (1) WO2019050247A2 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523604A (zh) * 2020-04-27 2020-08-11 中国银行股份有限公司 一种用户分类的方法和相关装置
CN112037760A (zh) * 2020-08-24 2020-12-04 北京百度网讯科技有限公司 语音频谱生成模型的训练方法、装置及电子设备
CN112085051A (zh) * 2020-07-24 2020-12-15 西安电子科技大学 基于加权投票的图像分类方法、系统及电子设备
CN112101404A (zh) * 2020-07-24 2020-12-18 西安电子科技大学 基于生成对抗网络的图像分类方法、系统及电子设备
WO2021085785A1 (en) * 2019-10-29 2021-05-06 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling thereof
CN112836714A (zh) * 2019-11-22 2021-05-25 杭州海康威视数字技术股份有限公司 一种智能模型的训练方法及装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3477591B1 (en) * 2017-10-24 2020-05-27 AGFA Healthcare Avoiding catastrophic interference while training an artificial neural network on an additional task
KR102211762B1 (ko) 2019-04-02 2021-02-04 네이버웹툰 유한회사 딥러닝 기반 컬러링 방법, 시스템 및 프로그램
KR102149184B1 (ko) * 2019-04-29 2020-08-28 연세대학교 산학협력단 처음 보는 클래스의 설명 가능한 이미지를 생성하는 장치 및 방법
CN110147836B (zh) * 2019-05-13 2021-07-02 腾讯科技(深圳)有限公司 模型训练方法、装置、终端及存储介质
KR102635606B1 (ko) * 2019-11-21 2024-02-13 고려대학교 산학협력단 거리 학습을 이용한 사용자간 유사도 반영 특징 추출 기반의 사용자 독립적 뇌-컴퓨터 인터페이스 장치 및 이를 이용한 태스크 분류 방법
KR102253402B1 (ko) * 2019-11-28 2021-05-17 광운대학교 산학협력단 Ai방식을 이용한 적대적 이미지 생성장치 및 그 방법
CN111178446B (zh) * 2019-12-31 2023-08-04 歌尔股份有限公司 一种基于神经网络的目标分类模型的优化方法、装置
KR102291111B1 (ko) * 2020-01-31 2021-08-17 연세대학교 산학협력단 자기 지도 기반의 제로샷 인식 장치 및 방법
KR102135479B1 (ko) * 2020-05-09 2020-07-17 주식회사 디퍼아이 인공 지능형 동전 계수 장치 및 그 방법
WO2022005158A1 (en) * 2020-07-03 2022-01-06 Samsung Electronics Co., Ltd. Electronic device and controlling method of electronic device
KR102512625B1 (ko) * 2020-10-26 2023-03-23 한국생산기술연구원 데이터 증강을 이용하여 결함 검사를 위한 학습 방법 및 이를 수행하는 장치
KR102429534B1 (ko) * 2020-11-02 2022-08-04 주식회사 루닛 대상 이미지에 대한 추론 작업을 수행하는 방법 및 시스템
CN113256457A (zh) * 2021-04-22 2021-08-13 深圳市鹰硕教育服务有限公司 一种基于人工智能的在线学习诊断方法及装置
CN113177543B (zh) * 2021-05-28 2024-01-23 平安国际智慧城市科技股份有限公司 证件识别方法、装置、设备及存储介质
CN113485203B (zh) * 2021-08-03 2022-05-31 上海德衡数据科技有限公司 一种智能控制网络资源共享的方法及系统
KR102659399B1 (ko) * 2021-11-26 2024-04-19 연세대학교 산학협력단 제로샷 시맨틱 분할 장치 및 방법
KR20230129940A (ko) * 2022-03-02 2023-09-11 주식회사 엘지에너지솔루션 배터리 불량 검출 장치, 방법 및 시스템
KR20240051487A (ko) * 2022-10-13 2024-04-22 주식회사 워시스왓 라벨 검출 시스템 및 그 방법
KR102620475B1 (ko) * 2023-07-13 2024-01-03 주식회사 메드픽쳐스 이미지를 기초로 딥러닝 알고리즘을 이용하여 리토폴로지를수행하기 위한 방법 및 장치

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680341B2 (en) * 2006-05-05 2010-03-16 Xerox Corporation Generic visual classification with gradient components-based dimensionality enhancement
US8200025B2 (en) * 2007-12-07 2012-06-12 University Of Ottawa Image classification and search
DE102011113154B4 (de) * 2011-09-14 2015-12-03 Airbus Defence and Space GmbH Maschinelles Lernverfahren zum maschinellen Erlernen von Erscheinungsformen von Objekten in Bildern
KR102190484B1 (ko) * 2013-11-11 2020-12-11 삼성전자주식회사 인식기 학습 방법 및 장치, 데이터 인식 방법 및 장치
WO2015134665A1 (en) 2014-03-04 2015-09-11 SignalSense, Inc. Classifying data with deep learning neural records incrementally refined through expert input
CN106537379A (zh) * 2014-06-20 2017-03-22 谷歌公司 细粒度图像相似性
KR20160096460A (ko) * 2015-02-05 2016-08-16 삼성전자주식회사 복수의 분류기를 포함하는 딥 러닝 기반 인식 시스템 및 그 제어 방법
KR101749427B1 (ko) * 2015-11-26 2017-07-03 제주대학교 산학협력단 다양한 특성을 갖는 인공 신경망에 기초한 풍속 예측 방법 및 그 방법을 이용한 장치
KR102450374B1 (ko) * 2016-11-17 2022-10-04 삼성전자주식회사 데이터 인식 및 트레이닝 장치 및 방법
US20200242736A1 (en) * 2019-01-29 2020-07-30 Nvidia Corporation Method for few-shot unsupervised image-to-image translation
US11430088B2 (en) * 2019-12-23 2022-08-30 Samsung Electronics Co., Ltd. Method and apparatus for data anonymization

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021085785A1 (en) * 2019-10-29 2021-05-06 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling thereof
US11797824B2 (en) 2019-10-29 2023-10-24 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling thereof
CN112836714A (zh) * 2019-11-22 2021-05-25 杭州海康威视数字技术股份有限公司 一种智能模型的训练方法及装置
CN112836714B (zh) * 2019-11-22 2024-05-10 杭州海康威视数字技术股份有限公司 一种智能模型的训练方法及装置
CN111523604A (zh) * 2020-04-27 2020-08-11 中国银行股份有限公司 一种用户分类的方法和相关装置
CN112085051A (zh) * 2020-07-24 2020-12-15 西安电子科技大学 基于加权投票的图像分类方法、系统及电子设备
CN112101404A (zh) * 2020-07-24 2020-12-18 西安电子科技大学 基于生成对抗网络的图像分类方法、系统及电子设备
CN112101404B (zh) * 2020-07-24 2024-02-09 西安电子科技大学 基于生成对抗网络的图像分类方法、系统及电子设备
CN112085051B (zh) * 2020-07-24 2024-02-09 西安电子科技大学 基于加权投票的图像分类方法、系统及电子设备
CN112037760A (zh) * 2020-08-24 2020-12-04 北京百度网讯科技有限公司 语音频谱生成模型的训练方法、装置及电子设备
US11488578B2 (en) 2020-08-24 2022-11-01 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for training speech spectrum generation model, and electronic device

Also Published As

Publication number Publication date
US11449733B2 (en) 2022-09-20
WO2019050247A3 (ko) 2019-05-02
KR20190028235A (ko) 2019-03-18
US20200285938A1 (en) 2020-09-10
KR102481885B1 (ko) 2022-12-28

Similar Documents

Publication Publication Date Title
WO2019050247A2 (ko) 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스
WO2018212494A1 (ko) 객체를 식별하는 방법 및 디바이스
WO2019098414A1 (ko) 약한 지도 학습에 기초한 뉴럴 네트워크의 계층적 학습 방법 및 장치
WO2019031714A1 (ko) 객체를 인식하는 방법 및 장치
WO2019098418A1 (ko) 뉴럴 네트워크 학습 방법 및 디바이스
WO2019098449A1 (ko) 메트릭 학습 기반의 데이터 분류와 관련된 장치 및 그 방법
US11200467B2 (en) Artificial intelligence apparatus and method for recognizing object included in image data
WO2019050297A1 (ko) 뉴럴 네트워크 학습 방법 및 장치
WO2019182346A1 (ko) 인공지능 모델을 이용하여 사용자 음성을 변조하기 위한 전자 장치 및 이의 제어 방법
WO2019059505A1 (ko) 객체를 인식하는 방법 및 장치
WO2019093599A1 (ko) 사용자 관심 정보 생성 장치 및 그 방법
WO2020060223A1 (ko) 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법
WO2020130747A1 (ko) 스타일 변환을 위한 영상 처리 장치 및 방법
KR20190056720A (ko) 뉴럴 네트워크 학습 방법 및 디바이스
CN113095346A (zh) 数据标注的方法以及数据标注的装置
WO2020032467A1 (ko) 인공지능 기반 질의응답 도출방법, 장치 및 프로그램
EP3765995B1 (en) Systems and methods for inter-camera recognition of individuals and their properties
WO2020116768A1 (ko) 영상 처리 장치 및 그 동작방법
CN117079299B (zh) 数据处理方法、装置、电子设备及存储介质
WO2020159241A1 (ko) 이미지를 처리하기 위한 방법 및 그에 따른 장치
WO2018212584A2 (ko) 딥 뉴럴 네트워크를 이용하여 문장이 속하는 클래스를 분류하는 방법 및 장치
WO2021085785A1 (en) Electronic apparatus and method for controlling thereof
WO2018164435A1 (en) Electronic apparatus, method for controlling the same, and non-transitory computer readable recording medium
US20200202068A1 (en) Computing apparatus and information input method of the computing apparatus
WO2020141907A1 (ko) 키워드에 기초하여 이미지를 생성하는 이미지 생성 장치 및 이미지 생성 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18853443

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18853443

Country of ref document: EP

Kind code of ref document: A2