WO2023191374A1 - 구조식 이미지를 인식하는 인공 지능 장치 및 그 방법 - Google Patents

구조식 이미지를 인식하는 인공 지능 장치 및 그 방법 Download PDF

Info

Publication number
WO2023191374A1
WO2023191374A1 PCT/KR2023/003770 KR2023003770W WO2023191374A1 WO 2023191374 A1 WO2023191374 A1 WO 2023191374A1 KR 2023003770 W KR2023003770 W KR 2023003770W WO 2023191374 A1 WO2023191374 A1 WO 2023191374A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
atomic
image
atomic region
processor
Prior art date
Application number
PCT/KR2023/003770
Other languages
English (en)
French (fr)
Inventor
조연식
조아라
이순영
박창영
로드리고호르마자발
김태훈
Original Assignee
주식회사 엘지경영개발원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지경영개발원 filed Critical 주식회사 엘지경영개발원
Publication of WO2023191374A1 publication Critical patent/WO2023191374A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means

Definitions

  • the present disclosure relates to an artificial intelligence device and method for recognizing structural images. Specifically, it relates to an artificial intelligence device and method that can recognize a chemical structural formula image or a molecular structural formula image and convert the structural formula image into a predetermined character string.
  • Structural formula refers to a graphical representation of a chemical or molecular structure. Structural formulas can show how atoms are arranged in three-dimensional space. Chemical bonds in molecules can also be shown explicitly or implicitly.
  • structural formulas can provide geometric information of the molecular structure. For example, isomers with the same molecular formula but different atomic structures or arrangements can be expressed.
  • the present disclosure aims to solve the above-described problems and other problems.
  • the purpose of the present disclosure is to provide an artificial intelligence device and method that can obtain information about atoms from structural images and more accurately recognize bonding relationships between atoms.
  • the purpose of the present disclosure is to provide an artificial intelligence device and method capable of recognizing structural images and converting them into a predetermined string format.
  • An embodiment of the present disclosure includes a memory for storing a structural image, obtaining information on a plurality of atomic regions from the structural image, obtaining bonding relationship information between a plurality of atoms based on the information on the plurality of atomic regions, and obtaining information on a plurality of atomic regions based on the information on the plurality of atomic regions.
  • An artificial intelligence device is provided including a processor that generates an adjacency matrix based on information and bond relationship information between a plurality of atoms, and generates a predetermined string format corresponding to a structural image based on the adjacency matrix.
  • An embodiment of the present disclosure provides an artificial intelligence device including a processor that inputs a structural image into an atomic domain recognition model and acquires a plurality of atomic domain information output from the atomic domain recognition model.
  • An embodiment of the present disclosure acquires a bond image between the first atom and the second atom based on first atomic region information and second atomic region information among a plurality of atomic region information, and acquires a bond image between the first atom and the second atom based on the bond image. And it provides an artificial intelligence device including a processor that acquires bonding relationship information of the second atom.
  • An embodiment of the present disclosure provides an artificial intelligence device including a processor that inputs a combined image into a combined relationship recognition model and acquires combined relationship information output from the combined relationship recognition model.
  • One embodiment of the present disclosure is artificial intelligence that includes a processor that acquires a combined image including the center point position of the first atomic region and the center point position of the second atomic region based on the first atomic region information and the second atomic region information. Provides a device.
  • One embodiment of the present disclosure provides an artificial intelligence device including a processor that selects a second atomic region located within a predetermined distance based on first atomic region information.
  • An embodiment of the present disclosure provides an artificial intelligence device including a processor that generates an adjacency matrix based on a plurality of atomic region information with each of the plurality of atoms as a vertex and the bond relationship information of each of the plurality of atoms as an edge. do.
  • One embodiment of the present disclosure provides an artificial intelligence device including a processor that converts a structural image into a predetermined string format including SMILES (Simplified Molecular Input Line Entry System) based on the generated adjacency matrix.
  • SMILES Simple Molecular Input Line Entry System
  • an artificial intelligence device can obtain information about atoms from a structural image and accurately recognize the bonding relationship between atoms.
  • an artificial intelligence device can recognize a structural image and convert it into a predetermined string format.
  • FIG 1 shows an artificial intelligence device according to an embodiment of the present disclosure.
  • Figure 2 shows an artificial intelligence server according to an embodiment of the present disclosure.
  • FIG. 3 is a flowchart for explaining a structural formula recognition method according to an embodiment of the present disclosure.
  • FIG. 4 is a diagram for explaining a structural image according to an embodiment of the present disclosure.
  • Figure 5 is a diagram for explaining an atomic region recognition model according to an embodiment of the present disclosure.
  • FIG. 6 is a diagram for explaining a plurality of atomic region information according to an embodiment of the present disclosure.
  • FIG. 7 is a diagram illustrating a method of obtaining association relationship information according to an embodiment of the present disclosure.
  • Figure 8 is a diagram for explaining a combination relationship recognition model according to an embodiment of the present disclosure.
  • Machine learning refers to the field of defining various problems dealt with in the field of artificial intelligence and researching methodologies to solve them. do.
  • Machine learning is also defined as an algorithm that improves the performance of a task through consistent experience.
  • ANN Artificial Neural Network
  • ANN is a model used in machine learning. It can refer to an overall model with problem-solving capabilities that is composed of artificial neurons (nodes) that form a network through the combination of synapses. Artificial neural networks can be defined by connection patterns between neurons in different layers, a learning process that updates model parameters, and an activation function that generates output values.
  • An artificial neural network may include an input layer, an output layer, and optionally one or more hidden layers. Each layer includes one or more neurons, and the artificial neural network may include synapses connecting neurons. In an artificial neural network, each neuron can output the activation function value for the input signals, weight, and bias input through the synapse.
  • Model parameters refer to parameters determined through learning and include the weight of synaptic connections and the bias of neurons.
  • Hyperparameters refer to parameters that must be set before learning in a machine learning algorithm and include learning rate, number of repetitions, mini-batch size, initialization function, etc.
  • the purpose of artificial neural network learning can be seen as determining model parameters that minimize the loss function.
  • the loss function can be used as an indicator to determine optimal model parameters in the learning process of an artificial neural network.
  • Machine learning can be classified into supervised learning, unsupervised learning, and reinforcement learning depending on the learning method.
  • Supervised learning refers to a method of training an artificial neural network with a given label for the learning data.
  • a label refers to the correct answer (or result value) that the artificial neural network must infer when learning data is input to the artificial neural network. It can mean.
  • Unsupervised learning can refer to a method of training an artificial neural network in a state where no labels for training data are given.
  • Reinforcement learning can refer to a learning method in which an agent defined within an environment learns to select an action or action sequence that maximizes the cumulative reward in each state.
  • machine learning implemented with a deep neural network is also called deep learning, and deep learning is a part of machine learning.
  • machine learning is used to include deep learning.
  • FIG 1 shows an artificial intelligence device according to an embodiment of the present disclosure.
  • the artificial intelligence (AI) device 100 includes TVs, projectors, mobile phones, smartphones, desktop computers, laptops, digital broadcasting terminals, personal digital assistants (PDAs), portable multimedia players (PMPs), navigation, tablet PCs, wearable devices, It can be implemented as a fixed or movable device, such as a set-top box (STB), DMB receiver, radio, washing machine, refrigerator, desktop computer, digital signage, robot, vehicle, etc.
  • PDAs personal digital assistants
  • PMPs portable multimedia players
  • STB set-top box
  • DMB receiver radio, washing machine, refrigerator, desktop computer, digital signage, robot, vehicle, etc.
  • the terminal 100 includes a communication unit 110, an input unit 120, a learning processor 130, a sensing unit 140, an output unit 150, a memory 170, and a processor 180. It can be included.
  • the communication unit 110 can transmit and receive data with external devices such as other AI devices 100a to 100e or the AI server 200 using wired or wireless communication technology.
  • the communication unit 110 may transmit and receive sensor information, user input, learning models, and control signals with external devices.
  • the communication technologies used by the communication unit 110 include Global System for Mobile communication (GSM), Code Division Multi Access (CDMA), Long Term Evolution (LTE), 5G, Wireless LAN (WLAN), and Wireless-Fidelity (Wi-Fi). ), Bluetooth, RFID (Radio Frequency Identification), Infrared Data Association (IrDA), ZigBee, NFC (Near Field Communication), etc.
  • GSM Global System for Mobile communication
  • CDMA Code Division Multi Access
  • LTE Long Term Evolution
  • 5G Fifth Generation
  • WLAN Wireless LAN
  • Wi-Fi Wireless-Fidelity
  • Bluetooth Bluetooth
  • RFID Radio Frequency Identification
  • IrDA Infrared Data Association
  • ZigBee ZigBee
  • NFC Near Field Communication
  • the input unit 120 can acquire various types of data.
  • the input unit 120 may include a camera for inputting video signals, a microphone for receiving audio signals, and a user input unit for receiving information from the user.
  • the camera or microphone may be treated as a sensor, and the signal obtained from the camera or microphone may be referred to as sensing data or sensor information.
  • the input unit 120 may acquire training data for model learning and input data to be used when obtaining an output using the learning model.
  • the input unit 120 may acquire unprocessed input data, and in this case, the processor 180 or the learning processor 130 may extract input features by preprocessing the input data.
  • the learning processor 130 can train a model composed of an artificial neural network using training data.
  • the learned artificial neural network may be referred to as a learning model.
  • a learning model can be used to infer a result value for new input data other than learning data, and the inferred value can be used as the basis for a decision to perform an operation.
  • the learning processor 130 may perform AI processing together with the learning processor 240 of the AI server 200.
  • the learning processor 130 may include memory integrated or implemented in the AI device 100.
  • the learning processor 130 may be implemented using the memory 170, an external memory directly coupled to the AI device 100, or a memory maintained in an external device.
  • the sensing unit 140 may use various sensors to obtain at least one of internal information of the AI device 100, information about the surrounding environment of the AI device 100, and user information.
  • the sensors included in the sensing unit 140 include a proximity sensor, illuminance sensor, acceleration sensor, magnetic sensor, gyro sensor, inertial sensor, RGB sensor, IR sensor, fingerprint recognition sensor, ultrasonic sensor, light sensor, microphone, and lidar. , radar, etc.
  • the output unit 150 may generate output related to vision, hearing, or tactile sensation.
  • the output unit 150 may include a display unit that outputs visual information, a speaker that outputs auditory information, and a haptic module that outputs tactile information.
  • the memory 170 may store data supporting various functions of the AI device 100.
  • the memory 170 may store input data, learning data, learning models, learning history, etc. obtained from the input unit 120.
  • the processor 180 may determine at least one executable operation of the AI device 100 based on information determined or generated using a data analysis algorithm or a machine learning algorithm. Additionally, the processor 180 may control the components of the AI device 100 to perform the determined operation.
  • the processor 180 may request, retrieve, receive, or utilize data from the learning processor 130 or the memory 170, and perform an operation that is predicted or determined to be desirable among the at least one executable operation.
  • Components of the AI device 100 can be controlled to execute.
  • the processor 180 may generate a control signal to control the external device and transmit the generated control signal to the external device.
  • the processor 180 may obtain intent information regarding user input and determine the user's request based on the obtained intent information.
  • the processor 180 uses at least one of a STT (Speech To Text) engine for converting voice input into a character string or a Natural Language Processing (NLP) engine for acquiring intent information of natural language, so that the user Intent information corresponding to the input can be obtained.
  • STT Seech To Text
  • NLP Natural Language Processing
  • At this time, at least one of the STT engine or the NLP engine may be composed of at least a portion of an artificial neural network learned according to a machine learning algorithm. And, at least one of the STT engine or the NLP engine is learned by the learning processor 130, learned by the learning processor 240 of the AI server 200, or learned by distributed processing thereof. It may be.
  • the processor 180 collects history information including the user's feedback on the operation or operation of the AI device 100 and stores it in the memory 170 or the learning processor 130, or in the AI server 200, etc. Can be transmitted to an external device. The collected history information can be used to update the learning model.
  • the processor 180 may control at least some of the components of the AI device 100 to run an application program stored in the memory 170. Furthermore, the processor 180 may operate two or more of the components included in the AI device 100 in combination with each other to run the application program.
  • Figure 2 shows an artificial intelligence server according to an embodiment of the present disclosure.
  • the artificial intelligence server 200 may refer to a device that trains an artificial neural network using a machine learning algorithm or uses a learned artificial neural network.
  • the AI server 200 may be composed of a plurality of servers to perform distributed processing, and may be defined as a 5G network.
  • the AI server 200 may be included as a part of the AI device 100 and may perform at least part of the AI processing.
  • the AI server 200 may include a communication unit 210, a memory 230, a learning processor 240, and a processor 260.
  • the communication unit 210 can transmit and receive data with an external device such as the AI device 100.
  • Memory 230 may include a model storage unit 231.
  • the model storage unit 231 may store a model (or artificial neural network, 231a) that is being trained or has been learned through the learning processor 240.
  • the learning processor 240 can train the artificial neural network 231a using training data.
  • the learning model may be used while mounted on the AI server 200 of the artificial neural network, or may be mounted and used on an external device such as the AI device 100.
  • Learning models can be implemented in hardware, software, or a combination of hardware and software.
  • the learning model When part or all of the learning model is implemented as software, one or more instructions constituting the learning model may be stored in the memory 230.
  • the processor 260 may infer a result value for new input data using a learning model and generate a response or control command based on the inferred result value.
  • Figure 3 also shows a sequence for explaining a structural formula recognition method according to an embodiment of the present disclosure.
  • the processor 180 may acquire a structural image (S301).
  • the structural image may be an image stored in the memory 170 or an image received and stored from an external device through the communication unit 110.
  • the structural formula image may be an image in which the structural formula is expressed in graphic form.
  • Structural formula may mean a graphical representation of a chemical structure or molecular structure.
  • the structural formula may include information about the arrangement of atoms in three-dimensional space. Additionally, chemical bonds between atoms can also be expressed.
  • annotation may mean the name of a compound, etc.
  • FIG. 4 is a diagram for explaining a structural image according to an embodiment of the present disclosure.
  • the structural formula image 400 may include a structural formula 401 that graphically represents the molecular structure. Additionally, the structural image 400 may include annotations 402. When the structural formula image 400 is generated, annotations as descriptions or names of molecular structures may be imaged and included in the structural formula image. Therefore, when it is desired to recognize the structural image 400 and convert it into a predetermined string format, it is necessary to filter only the structural formula 401 as a recognition target, excluding the annotation 402 included in the structural formula image 400.
  • the processor 180 may obtain information on a plurality of atomic regions from the structural image (S302).
  • the atomic region information may include at least one of atomic region identification information, atomic position information, and atomic information in the structural formula image.
  • Atomic region identification information may refer to identification information (or numbers) that can distinguish each of a plurality of atomic regions recognized in the structural image.
  • atomic position information may mean coordinate information corresponding to the atomic region in the structural image.
  • the atomic position information may include the coordinates of the vertices of each square corresponding to the atomic region and the coordinates of the center point of the square.
  • the atomic information may include element symbol information of the atom corresponding to the atomic region.
  • element symbol information for example, if the image corresponding to the atomic area is expressed as a vertex, carbon (C) may correspond to the atomic information.
  • element symbol for example, oxygen (O)
  • O oxygen
  • the atomic domain information may include reliability information of the atomic domain information obtained from the structural image.
  • the processor 180 may obtain reliability information of atomic domain information obtained from a structural image with a value between 0.00 and 1.00, and may use only atomic domain information having reliability information greater than a predetermined value.
  • the processor 180 may input a structural image into an atomic domain recognition model and obtain a plurality of atomic domain information output from the atomic domain recognition model.
  • Figure 5 is a diagram for explaining an atomic region recognition model according to an embodiment of the present disclosure.
  • the processor 180 may input the structural formula image 501 into the atomic domain recognition model 502 and obtain atomic domain information output from the atomic domain recognition model 502.
  • the atomic domain recognition model 502 may be an artificial neural network (ANN) trained to output at least one atomic domain information 503 included in the input structural formula image 501.
  • Artificial Neural Network is a model used in machine learning and can refer to an overall model with problem-solving capabilities that is composed of artificial neurons (nodes) that form a network through the combination of synapses.
  • the atomic region recognition model 502 may be an artificial neural network model based on Convolutional Neural Networks (CNN).
  • the learning processor 130 can train an atomic domain recognition model 502 composed of an artificial neural network using structural images and learning data about atomic domain information. Meanwhile, the atomic region recognition model 502 may be a model learned by the learning processor 240 of the artificial intelligence server 200.
  • the learned atomic region recognition model 502 may be stored in the memory 170 or in the model storage unit 231 of the artificial intelligence server 200.
  • the processor 180 may use the atomic domain recognition model 502 stored in the memory 170 or the model storage unit 231.
  • FIG. 6 is a diagram for explaining a plurality of atomic region information according to an embodiment of the present disclosure.
  • the processor 180 uses a plurality of atomic domain information (601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611) output from the atomic domain recognition model 502. It can be obtained.
  • the plurality of atomic region information includes information about the vertex region (601, 602, 603, 604, 605, 606, 608, 609, 610) in the structural formula, the element symbol region (607) where the element symbol is described, and the annotation region (611). may include.
  • the atomic region recognition model 502 can be trained to also output the element symbol region 607 in which the element symbol is described, so that the atomic region recognition model 502 can output the annotation region 611 as atomic region information. There may also be cases where it is output as . Therefore, there is a need to filter information about the annotation region from the plurality of atomic region information. For example, since the annotation area 611 is not shown to have a bonding relationship with other atomic regions, the processor 180 operates in the annotation region ( 611) can be classified as annotations.
  • the processor 180 may obtain bond relationship information between a plurality of atoms based on the plurality of atomic region information (S303).
  • the processor 180 may obtain bonding relationship information for each atomic region with other atomic regions based on information on a plurality of atomic regions.
  • Processor 180 acquires a bonding image between the first atom and the second atom based on first atomic region information and second atomic region information among the plurality of atomic region information, and acquires a bonding image between the first atom and the second atom based on the obtained bonding image.
  • Information on the bonding relationship of the second atom can be obtained.
  • FIG. 7 is a diagram for explaining a method of obtaining association relationship information according to an embodiment of the present disclosure.
  • the processor 180 may select the first atomic region information 301 among a plurality of atomic region information. Additionally, the processor 180 may select second atomic region information 602 that is different from the first atomic region information. In addition, the processor 180 determines the first atom and the A bond image 701 between two atoms can be obtained. In this case, the first atom position information 702 and the second atom position information 703 may be the center point of each atomic region. However, it is not limited to the location of the center point of the atomic region.
  • the processor 180 determines each atom based on the first atom position information 702 of the first atom region information 601 and the second atom position information 703 of the second atom region information 602. A combined image 701 including the location of the center point of the region can be obtained.
  • the processor 180 may obtain a combined image 704 including the first atomic region and the second atomic region based on the first atomic region information 601 and the second atomic region information 602.
  • the size and shape of the combined image can be adjusted in various ways.
  • the processor 180 may acquire a bond image between combinable atoms for each of a plurality of atomic regions.
  • the amount of computation may increase if images of bonds between all combinable atoms are acquired. Accordingly, the processor 180 can obtain only a bonded image between the first atom and the second atom within a predetermined distance from each other based on the plurality of atomic region information.
  • the processor 180 may select a second atomic region located within a predetermined distance from the first atomic region based on the first atomic region information among the plurality of atomic region information.
  • the processor 180 specifies second atomic regions 602, 603, 608, 609, and 610 located within a predetermined distance from the first atomic region 601, and ) and each second atom, and bond images are obtained, thereby obtaining bond relationship information between the first atom and the second atom.
  • the processor 180 may determine that the third atomic regions 604, 605, 606, 607, and 611 located outside a predetermined distance from the first atomic region 601 do not have a bonding relationship. Therefore, the amount of computation can be reduced.
  • the processor 180 may obtain bond relationship information between atoms based on the obtained bond image.
  • the processor 180 may input a combined image into a combined relationship recognition model and obtain combined relationship information output from the combined relationship recognition model.
  • Figure 8 is a diagram for explaining a combination relationship recognition model according to an embodiment of the present disclosure.
  • the processor 180 may input the combined image 801 into the combined relationship recognition model 802 and obtain combined relationship information output from the combined relationship recognition model 802.
  • Bond relationship information is information about bonds between atoms and may include information about non-bonds, single bonds, double bonds, triple bonds, up-direction bonds, down-direction bonds, etc. Non-bonding may mean that no bond exists between atoms.
  • An upward direction bond may mean a bond coming forward of a plane indicated by a wedge. Additionally, downward coupling may mean coupling behind the plane indicated by the dashed line.
  • the combination relationship recognition model 802 may be an artificial neural network (ANN) trained to output combination relationship information 803 for the input combination image 801.
  • Artificial Neural Network ANN is a model used in machine learning and can refer to an overall model with problem-solving capabilities that is composed of artificial neurons (nodes) that form a network through the combination of synapses.
  • the combination relationship recognition model 802 may be an artificial neural network model based on CNN (Convolutional Neural Networks).
  • the learning processor 130 may train a combination relationship recognition model 802 composed of an artificial neural network using training data regarding the combination image and combination relationship information. Meanwhile, the combination relationship recognition model 802 may be a model learned by the learning processor 240 of the artificial intelligence server 200.
  • the learned combination relationship recognition model 802 may be stored in the memory 170 or in the model storage unit 231 of the artificial intelligence server 200.
  • the processor 180 may use the combination relationship recognition model 802 stored in the memory 170 or the model storage unit 231.
  • the processor 180 may generate an adjacency matrix based on a plurality of atomic region information and bond relationship information between a plurality of atoms (S304).
  • the processor 180 may generate an adjacency matrix using each of the plurality of atoms as a vertex and the bonding relationship information of each of the plurality of atoms as an edge.
  • FIG. 9 is a diagram for explaining an adjacency matrix according to an embodiment of the present disclosure.
  • the processor 180 may generate each atom of the plurality of atomic regions 601 to 611 as a vertex of an adjacency matrix. Meanwhile, the processor 180 may generate an adjacency matrix using the bonding relationship information of each of a plurality of atoms as an edge. For example, the processor 180 may generate an edge value of an adjacency matrix by corresponding each piece of combination relationship information with a random number. For example, the processor 178 may correspond to a non-bond as '0', a single bond as '1', a double bond as '2', and a triple bond as '3'.
  • the processor 180 corresponds to '5' when the up direction is combined in the order of rows and columns with the row as the starting vertex and the column as the destination vertex to indicate directionality, and for the opposite direction, It can be matched with '0'.
  • the value of the 6th column of the 5th row of the adjacency matrix is coupled in the up direction from the first atom 605 to the second atom 606, and the corresponding value of '5' is can be created.
  • the value of the 5th column of the 6th row of the adjacency matrix may be generated as '0'.
  • the processor 180 corresponds to '6' when downward combining is done in the order of rows and columns with the row as the starting vertex and the column as the destination vertex to indicate directionality, and for the opposite direction, It can be matched with '0'.
  • the processor 180 may generate a predetermined string format corresponding to the structural image based on the generated adjacency matrix (S305).
  • the processor 180 may acquire bond relationship information with other atoms by traversing each of the atomic regions corresponding to the vertices of the adjacency matrix.
  • the processor 180 uses the obtained bonding relationship information between atoms to specify atomic information in each of the plurality of atomic regions, and generates a predetermined string corresponding to the structural image based on the plurality of atomic information and bonding relationship information between the plurality of atoms. You can create formats.
  • the string format is a file format that can represent information about compounds (for example, the position of elements, bonding relationships, etc.) and may include a mol file format or an sdf file format. Meanwhile, the string format may include information about SMILES (Simplified Molecular Input Line Entry System).
  • Computer-readable media includes all types of recording devices that store data that can be read by a computer system.
  • Examples of computer-readable media include HDD (Hard Disk Drive), SSD (Solid State Disk), SDD (Silicon Disk Drive), ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc. There is. Additionally, the computer may include a processor 180 of the artificial intelligence device 100.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

본 개시의 일 실시 예에 따른 인공 지능 장치는 구조식 이미지를 저장하는 메모리 및 구조식 이미지에서 복수의 원자 영역 정보를 획득하고, 복수의 원자 영역 정보를 기초로 복수의 원자 간의 결합 관계 정보를 획득하고, 복수의 원자 영역 정보 및 복수의 원자 간의 결합 관계 정보를 기초로 인접 행렬을 생성하고, 인접 행렬을 기초로 구조식 이미지에 대응하는 소정의 문자열 포맷을 생성하는 프로세서를 포함한다.

Description

구조식 이미지를 인식하는 인공 지능 장치 및 그 방법
본 개시는, 구조식 이미지를 인식하는 인공 지능 장치 및 그 방법에 관한 것이다. 구체적으로, 화학 구조식 이미지 또는 분자 구조식 이미지를 인식하여 구조식 이미지로부터 소정의 문자열로 변환할 수 있는 인공 지능 장치 및 그 방법에 관한 것이다.
구조식(structural formula) 는 화학 구조 또는 분자 구조를 그래픽으로 표현된 것을 의미한다. 구조식은 3차원 공간에서 원자가 어떻게 배열되는지를 보여줄 수 있다. 분자의 화학 결합도 분명하게 하거나 내포하여 표시할 수 있다.
특히, 한정된 수의 기호를 갖고 제한된 서술만을 할 수 있는 분자식과는 달리, 구조식은 분자 구조의 기하학적 정보를 제공할 수 있다. 예를 들어, 분자식은 같지만 원자의 구조나 배열이 다른 이성질체를 표현할 수 있다.
특히, 각종 문헌, 논문 등에서 구조식은 이미지 형태로 제공된다.
그러나 구조식 이미지는 일반적으로 검색을 어렵게 하는 문제점이 있다.
따라서, 구조식 이미지를 소정의 문자열로 변환하여 검색을 원활하게 할 수 있도록 할 필요성이 대두되고 있다.
본 개시는 전술한 문제 및 다른 문제를 해결하는 것을 목적으로 한다.
본 개시는 구조식 이미지에서 원자에 관한 정보를 획득하고, 원자와 원자 간의 결합관계를 보다 정확하게 인식할 수 있는 인공 지능 장치 및 그 방법을 제공하는 것을 목적으로 한다.
본 개시는 구조식 이미지를 인식하여 소정의 문자열 포맷으로 변환할 수 있는 인공 지능 장치 및 그 방법을 제공하는 것을 목적으로 한다.
본 개시의 일 실시 예는 구조식 이미지를 저장하는 메모리, 및 구조식 이미지에서 복수의 원자 영역 정보를 획득하고, 복수의 원자 영역 정보를 기초로 복수의 원자 간의 결합 관계 정보를 획득하고, 복수의 원자 영역 정보 및 복수의 원자 간의 결합 관계 정보를 기초로 인접 행렬을 생성하고, 인접 행렬을 기초로 구조식 이미지에 대응하는 소정의 문자열 포맷을 생성하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 일 실시 예는 구조식 이미지를 원자 영역 인식 모델에 입력하고, 원자 영역 인식 모델로부터 출력되는 복수의 원자 영역 정보를 획득하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 일 실시 예는 복수의 원자 영역 정보 중 제1 원자 영역 정보 및 제2 원자 영역 정보를 기초로 제1 원자 및 제2 원자 사이의 결합 이미지를 획득하고, 결합 이미지를 기초로 제1 원자 및 제2 원자의 결합 관계 정보를 획득하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 일 실시 예는 결합 이미지를 결합 관계 인식 모델에 입력하고, 결합 관계 인식 모델로부터 출력되는 결합 관계 정보를 획득하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 일 실시 예는 제1 원자 영역 정보 및 제2 원자 영역 정보를 기초로 제1 원자 영역의 중심점 위치와 제2 원자 영역의 중심점 위치를 포함하는 결합 이미지를 획득하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 일 실시 예는 제1 원자 영역 정보를 기초로 소정의 거리 내에 위치하는 제2 원자 영역을 선택하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 일 실시 예는 복수의 원자 영역 정보를 기초로 복수의 원자들 각각을 정점으로, 복수의 원자 각각의 결합 관계 정보를 간선으로 하여 인접 행렬을 생성하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 일 실시 예는 생성된 인접 행렬을 기초로 SMILES(Simplified Molecular Input Line Entry System)를 포함하는 소정의 문자열 포맷으로 구조식 이미지를 변환하는 프로세서를 포함하는 인공 지능 장치를 제공한다.
본 개시의 실시 예에 따르면, 인공 지능 장치는 구조식 이미지에서 원자에 관한 정보를 획득할 수 있으며, 원자와 원자 간의 결합관계를 정확하게 인식할 수 있다.
본 개시의 실시 예에 따르면, 인공 지능 장치는 구조식 이미지를 인식하여 소정의 문자열 포맷으로 변환할 수 있다.
도 1은 본 개시의 일 실시 예에 따른 인공 지능 장치를 나타낸다.
도 2는 본 개시의 일 실시 예에 따른 인공 지능 서버를 나타낸다.
도 3은 본 개시의 일 실시 예에 따른 구조식 인식 방법을 설명하기 위한 순서도이다.
도 4는 본 개시의 일 실시 예에 따른 구조식 이미지를 설명하기 위한 도면이다.
도 5는 본 개시의 일 실시 예에 따른 원자 영역 인식 모델을 설명하기 위한 도면이다.
도 6은 본 개시의 일 실시 예에 따른 복수의 원자 영역 정보를 설명하기 위한 도면이다.
도 7은 본 개시의 일 실시 예에 따른 결합 관계 정보를 획득하는 방법을 설명하기 위한 도면이다.
도 8은 본 개시의 일 실시 예에 따른 결합 관계 인식 모델을 설명하기 위한 도면이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 개시의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않은 것으로 이해되어야 할 것이다.
<인공 지능(AI: Artificial Intelligence)>
인공 지능은 인공적인 지능 또는 이를 만들 수 있는 방법론을 연구하는 분야를 의미하며, 머신 러닝(기계 학습, Machine Learning)은 인공 지능 분야에서 다루는 다양한 문제를 정의하고 그것을 해결하는 방법론을 연구하는 분야를 의미한다. 머신 러닝은 어떠한 작업에 대하여 꾸준한 경험을 통해 그 작업에 대한 성능을 높이는 알고리즘으로 정의하기도 한다.
인공 신경망(ANN: Artificial Neural Network)은 머신 러닝에서 사용되는 모델로써, 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)들로 구성되는, 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다. 인공 신경망은 다른레이어의 뉴런들 사이의 연결 패턴, 모델 파라미터를 갱신하는 학습 과정, 출력값을 생성하는 활성화 함수(Activation Function)에 의해 정의될 수 있다.
인공 신경망은 입력층(Input Layer), 출력층(Output Layer), 그리고 선택적으로 하나 이상의 은닉층(Hidden Layer)를 포함할 수 있다. 각 층은 하나 이상의 뉴런을 포함하고, 인공 신경망은 뉴런과 뉴런을 연결하는 시냅스를 포함할 수 있다. 인공 신경망에서 각 뉴런은 시냅스를 통해 입력되는 입력 신호들, 가중치, 편향에 대한 활성 함수의 함숫값을 출력할 수 있다.
모델 파라미터는 학습을 통해 결정되는 파라미터를 의미하며, 시냅스 연결의 가중치와 뉴런의 편향 등이 포함된다. 그리고, 하이퍼파라미터는 머신 러닝 알고리즘에서 학습 전에 설정되어야 하는 파라미터를 의미하며, 학습률(Learning Rate), 반복 횟수, 미니 배치 크기, 초기화 함수 등이 포함된다.
인공 신경망의 학습의 목적은 손실 함수를 최소화하는 모델 파라미터를 결정하는 것으로 볼 수 있다. 손실 함수는 인공 신경망의 학습 과정에서 최적의 모델 파라미터를 결정하기 위한 지표로 이용될 수 있다.
머신 러닝은 학습 방식에 따라 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화 학습(Reinforcement Learning)으로 분류할 수 있다.
지도 학습은 학습 데이터에 대한 레이블(label)이 주어진 상태에서 인공 신경망을 학습시키는 방법을 의미하며, 레이블이란 학습 데이터가 인공 신경망에 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과 값)을 의미할 수 있다. 비지도 학습은 학습 데이터에 대한 레이블이 주어지지 않는 상태에서 인공 신경망을 학습시키는 방법을 의미할 수 있다. 강화 학습은 어떤 환경 안에서 정의된 에이전트가 각 상태에서 누적 보상을 최대화하는 행동 혹은 행동 순서를 선택하도록 학습시키는 학습 방법을 의미할 수 있다.
인공 신경망 중에서 복수의 은닉층을 포함하는 심층 신경망(DNN: Deep Neural Network)으로 구현되는 머신 러닝을 딥 러닝(심층 학습, Deep Learning)이라 부르기도 하며, 딥 러닝은 머신 러닝의 일부이다. 이하에서, 머신 러닝은 딥 러닝을 포함하는 의미로 사용된다.
도 1은 본 개시의 일 실시 예에 따른 인공 지능 장치를 나타낸다.
인공 지능(AI) 장치(100)는 TV, 프로젝터, 휴대폰, 스마트폰, 데스크탑 컴퓨터, 노트북, 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 태블릿 PC, 웨어러블 장치, 셋톱박스(STB), DMB 수신기, 라디오, 세탁기, 냉장고, 데스크탑 컴퓨터, 디지털 사이니지, 로봇, 차량 등과 같은, 고정형 기기 또는 이동 가능한 기기 등으로 구현될 수 있다.
도 1을 참조하면, 단말기(100)는 통신부(110), 입력부(120), 러닝 프로세서(130), 센싱부(140), 출력부(150), 메모리(170) 및 프로세서(180) 등을 포함할 수 있다.
통신부(110)는 유무선 통신 기술을 이용하여 다른 AI 장치(100a 내지 100e)나 AI 서버(200) 등의 외부 장치들과 데이터를 송수신할 수 있다. 예컨대, 통신부(110)는 외부 장치들과 센서 정보, 사용자 입력, 학습 모델, 제어 신호 등을 송수신할 수 있다.
이때, 통신부(110)가 이용하는 통신 기술에는 GSM(Global System for Mobile communication), CDMA(Code Division Multi Access), LTE(Long Term Evolution), 5G, WLAN(Wireless LAN), Wi-Fi(Wireless-Fidelity), 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), ZigBee, NFC(Near Field Communication) 등이 있다.
입력부(120)는 다양한 종류의 데이터를 획득할 수 있다.
이때, 입력부(120)는 영상 신호 입력을 위한 카메라, 오디오 신호를 수신하기 위한 마이크로폰, 사용자로부터 정보를 입력받기 위한 사용자 입력부 등 을 포함할 수 있다. 여기서, 카메라나 마이크로폰을 센서로 취급하여, 카메라나 마이크로폰으로부터 획득한 신호를 센싱 데이터 또는 센서 정보라고 할 수도 있다.
입력부(120)는 모델 학습을 위한 학습 데이터 및 학습 모델을 이용하여 출력을 획득할 때 사용될 입력 데이터 등을 획득할 수 있다. 입력부(120)는 가공되지 않은 입력 데이터를 획득할 수도 있으며, 이 경우 프로세서(180) 또는 러닝 프로세서(130)는 입력 데이터에 대하여 전처리로써 입력 특징점(input feature)을 추출할 수 있다
러닝 프로세서(130)는 학습 데이터를 이용하여 인공 신경망으로 구성된 모델을 학습시킬 수 있다. 여기서, 학습된 인공 신경망을 학습 모델이라 칭할 수 있다. 학습 모델은 학습 데이터가 아닌 새로운 입력 데이터에 대하여 결과 값을 추론해 내는데 사용될 수 있고, 추론된 값은 어떠한 동작을 수행하기 위한 판단의 기초로 이용될 수 있다.
이때, 러닝 프로세서(130)는 AI 서버(200)의 러닝 프로세서(240)와 함께 AI 프로세싱을 수행할 수 있다.
이때, 러닝 프로세서(130)는 AI 장치(100)에 통합되거나 구현된 메모리를 포함할 수 있다. 또는, 러닝 프로세서(130)는 메모리(170), AI 장치(100)에 직접 결합된 외부 메모리 또는 외부 장치에서 유지되는 메모리를 사용하여 구현될 수도 있다.
센싱부(140)는 다양한 센서들을 이용하여 AI 장치(100) 내부 정보, AI 장치(100)의 주변 환경 정보 및 사용자 정보 중 적어도 하나를 획득할 수 있다.
이때, 센싱부(140)에 포함되는 센서에는 근접 센서, 조도 센서, 가속도 센서, 자기 센서, 자이로 센서, 관성 센서, RGB 센서, IR 센서, 지문 인식 센서, 초음파 센서, 광 센서, 마이크로폰, 라이다, 레이더 등이 있다.
출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시킬 수 있다.
이때, 출력부(150)에는 시각 정보를 출력하는 디스플레이부, 청각 정보를 출력하는 스피커, 촉각 정보를 출력하는 햅틱 모듈 등이 포함될 수 있다.
메모리(170)는 AI 장치(100)의 다양한 기능을 지원하는 데이터를 저장할 수 있다. 예컨대, 메모리(170)는 입력부(120)에서 획득한 입력 데이터, 학습 데이터, 학습 모델, 학습 히스토리 등을 저장할 수 있다.
프로세서(180)는 데이터 분석 알고리즘 또는 머신 러닝 알고리즘을 사용하여 결정되거나 생성된 정보에 기초하여, AI 장치(100)의 적어도 하나의 실행 가능한 동작을 결정할 수 있다. 그리고, 프로세서(180)는 AI 장치(100)의 구성 요소들을 제어하여 결정된 동작을 수행할 수 있다.
이를 위해, 프로세서(180)는 러닝 프로세서(130) 또는 메모리(170)의 데이터를 요청, 검색, 수신 또는 활용할 수 있고, 상기 적어도 하나의 실행 가능한 동작 중 예측되는 동작이나, 바람직한 것으로 판단되는 동작을 실행하도록 AI 장치(100)의 구성 요소들을 제어할 수 있다.
이때, 프로세서(180)는 결정된 동작을 수행하기 위하여 외부 장치의 연계가 필요한 경우, 해당 외부 장치를 제어하기 위한 제어 신호를 생성하고, 생성한 제어 신호를 해당 외부 장치에 전송할 수 있다.
프로세서(180)는 사용자 입력에 대하여 의도 정보를 획득하고, 획득한 의도 정보에 기초하여 사용자의 요구 사항을 결정할 수 있다.
이때, 프로세서(180)는 음성 입력을 문자열로 변환하기 위한 STT(Speech To Text) 엔진 또는 자연어의 의도 정보를 획득하기 위한 자연어 처리(NLP: Natural Language Processing) 엔진 중에서 적어도 하나 이상을 이용하여, 사용자 입력에 상응하는 의도 정보를 획득할 수 있다.
이때, STT 엔진 또는 NLP 엔진 중에서 적어도 하나 이상은 적어도 일부가 머신 러닝 알고리즘에 따라 학습된 인공 신경망으로 구성될 수 있다. 그리고, STT 엔진 또는 NLP 엔진 중에서 적어도 하나 이상은 러닝 프로세서(130)에 의해 학습된 것이나, AI 서버(200)의 러닝 프로세서(240)에 의해 학습된 것이거나, 또는 이들의 분산 처리에 의해 학습된 것일 수 있다.
프로세서(180)는 AI 장치(100)의 동작 내용이나 동작에 대한 사용자의 피드백 등을 포함하는 이력 정보를 수집하여 메모리(170) 또는 러닝 프로세서(130)에 저장하거나, AI 서버(200) 등의 외부 장치에 전송할 수 있다. 수집된 이력정보는 학습 모델을 갱신하는데 이용될 수 있다.
프로세서(180)는 메모리(170)에 저장된 응용 프로그램을 구동하기 위하여, AI 장치(100)의 구성 요소들 중 적어도 일부를 제어할 수 있다. 나아가, 프로세서(180)는 상기 응용 프로그램의 구동을 위하여, AI 장치(100)에 포함된 구성 요소들 중 둘 이상을 서로 조합하여 동작시킬 수 있다.
도 2는 본 개시의 일 실시 예에 따른 인공 지능 서버를 나타낸다.
도 2를 참조하면, 인공 지능 서버(200)는 머신 러닝 알고리즘을 이용하여 인공 신경망을 학습시키거나 학습된 인공 신경망을 이용하는 장치를 의미할 수 있다. 여기서, AI 서버(200)는 복수의 서버들로 구성되어 분산 처리를 수행할 수도 있고, 5G 네트워크로 정의될 수 있다. 이때, AI 서버(200)는 AI 장치(100)의 일부의 구성으로 포함되어, AI 프로세싱 중 적어도 일부를 함께 수행할 수도 있다.
AI 서버(200)는 통신부(210), 메모리(230), 러닝 프로세서(240) 및 프로세서(260) 등을 포함할 수 있다.
통신부(210)는 AI 장치(100) 등의 외부 장치와 데이터를 송수신할 수 있다.
메모리(230)는 모델 저장부(231)를 포함할 수 있다. 모델 저장부(231)는 러닝 프로세서(240)을 통하여 학습 중인 또는 학습된 모델(또는 인공 신경망, 231a)을 저장할 수 있다.
러닝 프로세서(240)는 학습 데이터를 이용하여 인공 신경망(231a)을 학습시킬 수 있다. 학습 모델은 인공 신경망의 AI 서버(200)에 탑재된 상태에서 이용되거나, AI 장치(100) 등의 외부 장치에 탑재되어 이용될 수도 있다.
학습 모델은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 학습 모델의 일부 또는 전부가 소프트웨어로 구현되는 경우 학습 모델을 구성하는 하나 이상의 명령어(instruction)는 메모리(230)에 저장될 수 있다.
프로세서(260)는 학습 모델을 이용하여 새로운 입력 데이터에 대하여 결과 값을 추론하고, 추론한 결과 값에 기초한 응답이나 제어 명령을 생성할 수 있다.
도 3는 본 개시의 일 실시 예에 따른 구조식 인식 방법을 설명하기 위한 순서도 있다.
프로세서(180)는 구조식 이미지를 획득할 수 있다(S301). 구조식 이미지는 메모리(170)에 저장된 이미지이거나 통신부(110)를 통해 외부 장치로부터 수신되어 저장된 이미지일 수 있다.
구조식 이미지는 구조식이 그래픽 형태로 표현된 이미지일 수 있다.
구조식(structural formula)은 화학 구조 또는 분자 구조를 그래픽적으로 표현한 것을 의미할 수 있다. 구조식은 3차원 공간에서의 원자의 배열에 관한 정보를 포함할 수 있다. 또한, 원자 간의 화학 결합도 표현할 수 있다.
한편, 구조식 이미지는 주석을 포함할 수 있다. 예를 들어, 주석은 화합물의 명칭 등을 의미할 수 있다.
도 4는 본 개시의 일 실시 예에 따른 구조식 이미지를 설명하기 위한 도면이다.
구조식 이미지(400)는 분자 구조를 그래픽적으로 표현한 구조식(401)를 포함할 수 있다. 또한, 구조식 이미지(400)는 주석(402)을 포함할 수 있다. 구조식 이미지(400)가 생성되는 경우 구조식 이미지에 분자 구조에 관한 설명 또는 명칭으로서 주석이 이미지화되어 포함되는 경우가 있다. 따라서, 구조식 이미지(400)를 인식하여 소정의 문자열 포맷으로 변환하고자 하는 경우, 구조식 이미지(400)에 포함된 주석(402)을 제외하고 구조식(401)만을 인식 대상으로 필터링할 필요성이 있다.
한편, 프로세서(180)는 구조식 이미지에서 복수의 원자 영역 정보를 획득할 수 있다(S302).
원자 영역 정보는 구조식 이미지에서의 원자 영역 식별 정보, 원자 위치 정보 및 원자 정보 중 적어도 하나를 포함할 수 있다.
원자 영역 식별 정보는 구조식 이미지에서 인식된 복수의 원자 영역 각각을 구별할 수 있는 식별 정보(또는 번호)를 의미할 수 있다.
또한, 원자 위치 정보는 구조식 이미지에서 원자 영역에 해당하는 좌표 정보를 의미할 수 있다. 예를 들어, 원자 영역이 사각형으로 표현되는 경우, 원자 위치 정보는 원자 영역에 해당하는 사각형 각각의 꼭지점 좌표 및 사각형의 중심점 좌표를 포함할 수 있다.
또한, 원자 정보는 원자 영역에 해당하는 원자의 원소 기호 정보를 포함할 수 있다. 예를 들어, 원자 영역에 해당하는 이미지가 꼭지점으로 표현되는 경우 탄소(C)가 원자 정보에 해당할 수 있다. 또한, 원자 영역에 해당하는 이미지에 원소 기호(예를 들어, 산소(O))가 기재되어 있는 경우 해당 원소 기호(O) 정보가 원자 정보에 해당할 수 있다.
한편, 원자 영역 정보는 구조식 이미지에서 획득한 원자 영역 정보의 신뢰도 정보를 포함할 수 있다. 예를 들어, 프로세서(180)는 구조식 이미지에서 획득한 원자 영역 정보의 신뢰도 정보를 0.00에서 1.00 사이의 값으로 획득할 수 있으며, 소정의 값 이상의 신뢰도 정보를 갖는 원자 영역 정보만을 이용할 수 있다.
한편, 프로세서(180)는 구조식 이미지를 원자 영역 인식 모델에 입력하고, 원자 영역 인식 모델로부터 출력되는 복수의 원자 영역 정보를 획득할 수 있다.
도 5는 본 개시의 일 실시 예에 따른 원자 영역 인식 모델을 설명하기 위한 도면이다.
도 5를 참고하면, 프로세서(180)는 구조식 이미지(501)를 원자 영역 인식 모델(502)에 입력하고, 원자 영역 인식 모델(502)로부터 출력되는 원자 영역 정보를 획득할 수 있다.
원자 영역 인식 모델(502)은 입력된 구조식 이미지(501)에 대하여 이미지에 포함된 적어도 하나의 원자 영역 정보(503)를 출력하도록 훈련된 인공 신경망(ANN: Artificial Neural Network)일 수 있다. 인공 신경망(ANN: Artificial Neural Network)은 머신 러닝에서 사용되는 모델로서, 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)들로 구성되는, 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다. 예를 들어, 원자 영역 인식 모델(502)은 CNN(Convolutional Neural Networks) 기반의 인공 신경망 모델일 수 있다.
러닝 프로세서(130)는 구조식 이미지와 원자 영역 정보에 관한 학습 데이터를 이용하여 인공 신경망으로 구성된 원자 영역 인식 모델(502)을 학습시킬 수 있다. 한편, 원자 영역 인식 모델(502)은 인공 지능 서버(200)의 러닝 프로세서(240)에 의해 학습된 모델일 수 있다.
학습된 원자 영역 인식 모델(502)은 메모리(170)에 저장되거나, 인공 지능 서버(200)의 모델 저장부(231)에 저장될 수 있다. 프로세서(180)는 메모리(170) 또는 모델 저장부(231)에 저장된 원자 영역 인식 모델(502)을 이용할 수 있다.
한편, 도 6은 본 개시의 일 실시 예에 따른 복수의 원자 영역 정보를 설명하기 위한 도면이다.
도 6을 참고하면, 프로세서(180)는 원자 영역 인식 모델(502)로부터 출력되는 복수의 원자 영역 정보(601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611)를 획득할 수 있다.
복수의 원자 영역 정보는 구조식에서 꼭지점 영역(601, 602, 603, 604, 605, 606, 608, 609, 610), 원소 기호가 기술된 원소 기호 영역(607) 및 주석 영역(611)에 관한 정보를 포함할 수 있다. 예를 들어, 원자 영역 인식 모델(502)은 원소 기호가 기술된 원소 기호 영역(607)도 출력할 수 있도록 훈련될 수 있으므로, 원자 영역 인식 모델(502)이 주석 영역(611)을 원자 영역 정보로 출력하는 경우도 발생할 수 있다. 따라서, 복수의 원자 영역 정보에서 주석 영역에 관한 정보를 필터링할 필요성이 있다. 예를 들어, 주석 영역(611)은 다른 원자 영역들과 결합 관계가 도시되어 있지 않으므로, 프로세서(180)는 주석 영역(611)과 다른 원자 영역들 간에 결합 관계가 존재하지 않는 경우, 주석 영역(611)을 주석으로 분류할 수 있다.
한편, 프로세서(180) 복수의 원자 영역 정보를 기초로 복수의 원자 간의 결합 관계 정보를 획득할 수 있다(S303).
프로세서(180)는 복수의 원자 영역 정보를 기초로 각각의 원자 영역에 대하여 다른 원자 영역과의 결합 관계 정보를 획득할 수 있다.
프로세서(180) 복수의 원자 영역 정보 중 제1 원자 영역 정보 및 제2 원자 영역 정보를 기초로 제1 원자 및 제2 원자 사이의 결합 이미지를 획득하고, 획득한 결합 이미지를 기초로 제1 원자 및 제2 원자의 결합 관계 정보를 획득할 수 있다.
한편, 도 7은 본 개시의 일 실시 예에 따른 결합 관계 정보를 획득하는 방법을 설명하기 위한 도면이다.
프로세서(180)는 복수의 원자 영역 정보 중 제1 원자 영역 정보(301)를 선택할 수 있다. 또한, 프로세서(180)는 제1 원자 영역 정보와 다른 제2 원자 영역 정보(602)를 선택할 수 있다. 또한, 프로세서(180)는 제1 원자 영역 정보(601)의 제1 원자 위치 정보(702) 및 제2 원자 영역 정보(602)의 제2 원자 위치 정보(703)를 기초로 제1 원자와 제2 원자 사이의 결합 이미지(701)를 획득할 수 있다. 이 경우, 제1 원자 위치 정보(702) 및 제2 원자 위치 정보(703)는 각 원자 영역의 중심점 위치일 수 있다. 그러나, 원자 영역의 중심점 위치로 한정되는 것은 아니다.
프로세서(180)는 프로세서(180)는 제1 원자 영역 정보(601)의 제1 원자 위치 정보(702) 및 제2 원자 영역 정보(602)의 제2 원자 위치 정보(703)를 기초로 각 원자 영역의 중심점 위치를 포함하는 결합 이미지(701)를 획득할 수 있다.
또한, 프로세서(180)는 제1 원자 영역 정보(601) 및 제2 원자 영역 정보(602)를 기초로 제1 원자 영역 및 제2 원자 영역을 포함하는 결합 이미지(704)를 획득할 수도 있다. 결합 이미지의 크기 및 형태는 다양하게 조절될 수 있다.
한편, 프로세서(180)는 복수의 원자 영역 각각에 대하여 조합 가능 한 원자 사이의 결합 이미지를 획득할 수 있다. 그러나 조합 가능한 모든 원자 사이의 결합 이미지를 획득하는 경우 연산량이 증가할 수 있다. 따라서, 프로세서(180)는 복수의 원자 영역 정보를 기초로 서로 소정의 거리 내에 있는 제1 원자와 제2 원자 간의 결합 이미지만을 획득할 수 있다.
예를 들어, 프로세서(180)는 복수의 원자 영역 정보 중 제1 원자 영역 정보를 기초로 제1 원자 영역과 소정의 거리 내에 위치하는 제2 원자 영역을 선택할 수 있다. 도 7을 참고하면, 프로세서(180)는 제1 원자 영역(601)에서 소정의 거리 내에 위치하는 제2 원자 영역들(602, 603, 608, 609, 610)을 특정하고, 제1 원자(601)와 각각의 제2 원자 사이의 결합 이미지들을 획득하여, 제1 원자 및 제2 원자들 간의 결합 관계 정보를 획득할 수 있다. 또한, 프로세서(180)는 제1 원자 영역(601)에서 소정의 거리 밖에 위치하는 제3 원자 영역들(604, 605, 606, 607, 611)은 결합관계가 없는 것으로 판별할 수 있다. 따라서, 연산량을 줄일 수 있다.
한편, 프로세서(180)는 획득한 결합 이미지를 기초로 원자 간의 결합 관계 정보를 획득할 수 있다.
예를 들어, 프로세서(180)는 결합 이미지를 결합 관계 인식 모델에 입력하고, 결합 관계 인식 모델로부터 출력되는 결합 관계 정보를 획득할 수 있다.
도 8은 본 개시의 일 실시 예에 따른 결합 관계 인식 모델을 설명하기 위한 도면이다.
도 8을 참고하면, 프로세서(180)는 결합 이미지(801)를 결합 관계 인식 모델(802)에 입력하고, 결합 관계 인식 모델(802)로부터 출력되는 결합 관계 정보를 획득할 수 있다.
결합 관계 정보는 원자 간 결합에 관한 정보로서 미결합, 단일 결합, 이중 결합, 삼중 결합, 업 방향 결합, 다운 방향 결합 등에 관한 정보를 포함할 수 있다. 미결합은 원자 간에 결합이 존재하지 않는 경우를 의미할 수 있다.
업 방향 결합은 쐐기선(wedge)으로 표시되는 평면 앞으로 나오는 결합을 의미할 수 있다. 또한, 다운 방향 결합은 점선(dash)으로 표시되는 평면 뒤로 들어가는 결합을 의미할 수 있다.
결합 관계 인식 모델(802)은 입력된 결합 이미지(801)에 대하여 결합 관계 정보(803)를 출력하도록 훈련된 인공 신경망(ANN: Artificial Neural Network)일 수 있다. 인공 신경망(ANN: Artificial Neural Network)은 머신 러닝에 서 사용되는 모델로서, 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)들로 구성되는, 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다. 예를 들어, 결합 관계 인식 모델(802)은 CNN(Convolutional Neural Networks) 기반의 인공 신경망모델일 수 있다.
러닝 프로세서(130)는 결합 이미지와 결합 관계 정보에 관한 학습 데이터를 이용하여 인공 신경망으로 구성된 결합 관계 인식 모델(802)을 학습시킬 수 있다. 한편, 결합 관계 인식 모델(802)은 인공 지능 서버(200)의 러닝 프로세서(240)에 의해 학습된 모델일 수 있다.
학습된 결합 관계 인식 모델(802)은 메모리(170)에 저장되거나, 인공 지능 서버(200)의 모델 저장부(231)에 저장될 수 있다. 프로세서(180)는 메모리(170) 또는 모델 저장부(231)에 저장된 결합 관계 인식 모델(802)을 이용할 수 있다.
한편, 프로세서(180)는 복수의 원자 영역 정보 및 복수의 원자 간의 결합 관계 정보를 기초로 인접 행렬을 생성할 수 있다(S304).
프로세서(180)는 복수의 원자들 각각을 정점으로, 복수의 원자 각각의 결합 관계 정보를 간선으로 하여 인접 행렬을 생성할 수 있다.
도 9는 본 개시의 일 실시 예에 따른 인접 행렬을 설명하기 위한 도면이다.
도 9를 참고하면, 프로세서(180)는 복수의 원자 영역(601 내지 611)의 각각의 원자들을 인접 행렬의 정점으로 생성할 수 있다. 한편, 프로세서(180)는 복수의 원자 각각의 결합 관계 정보를 간선으로 하여 인접 행렬을 생성할 수 있다. 예를 들어, 프로세서(180)는 결합 관계 정보 각각을 임의의 숫자로 대응하여 인접 행렬의 간선 값으로 생성할 수 있다. 예를 들어, 프로세서(178)는 미결합은 '0'으로, 단일 결합은 '1', 이중 결합은 '2', 삼중 결합은 '3'으로 대응시킬 수 있다.
또한, 프로세서(180)는 업 방향 결합은 방향성을 나타내기 위하여 행을 출발 정점으로 열을 도착 정점으로 하여 행과 열 순으로 업 방향으로 결합된 경우 '5'로 대응시키고, 그 반대 방향에 대하여는 '0'으로 대응시킬 수 있다. 예를 들어, 도 9를 참고하면 인접행렬의 5번째 행의 6번째 열의 값은 제1 원자(605)에서 제2 원자(606)로 업 방향 결합이 되어 있는바 대응되는 '5'의 값이 생성될 수 있다. 한편, 그 반대 방향인 인접행렬의 6번째 행의 5번째 열의 값은 '0'으로 생성될 수 있다.
마찬가지로, 프로세서(180)는 다운 방향 결합은 방향성을 나타내기 위하여 행을 출발 정점으로 열을 도착 정점으로 하여 행과 열 순으로 다운 방향으로 결합된 경우 '6'으로 대응시키고, 그 반대 방향에 대하여는 '0'으로 대응시킬 수 있다.
한편, 프로세서(180)는 생성된 인접 행렬을 기초로 구조식 이미지에 대응하는 소정의 문자열 포맷을 생성할 수 있다(S305).
프로세서(180)는 인접 행렬의 정점에 대응하는 원자 영역들 각각을 순회하면서 다른 원자들과의 결합 관계 정보를 획득할 수 있다. 프로세서(180)는 획득한 원자 간의 결합 관계 정보들을 이용하여 복수의 원자 영역 각각의 원자 정보를 특정하고, 복수의 원자 정보 및 복수의 원자 간의 결합 관계 정보를 기초로 구조식 이미지에 대응하는 소정의 문자열 포맷을 생성할 수 있다.
이 경우, 문자열 포맷은 화합물들의 정보(예를 들어, 원소의 위치, 결합 관계 등)을 나타낼 수 있는 파일 포맷으로 mol 파일 포맷 또는 sdf 파일 포맷 등을 포함할 수 있다. 한편, 문자열 포맷은 SMILES(Simplified Molecular Input Line Entry System)에 관한 정보를 포함할 수 있다.
전술한 본 개시는, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다.
컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 상기 컴퓨터는 인공지능장치(100)의 프로세서(180)를 포함할 수도 있다.

Claims (15)

  1. 구조식 이미지를 저장하는 메모리;
    상기 구조식 이미지에서 복수의 원자 영역 정보를 획득하고, 상기 복수의 원자 영역 정보를 기초로 복수의 원자 간의 결합 관계 정보를 획득하고, 상기 복수의 원자 영역 정보 및 상기 복수의 원자 간의 결합 관계 정보를 기초로 인접 행렬을 생성하고, 상기 인접 행렬을 기초로 상기 구조식 이미지에 대응하는 소정의 문자열 포맷을 생성하는 프로세서를 포함하는,
    인공 지능 장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    상기 구조식 이미지를 원자 영역 인식 모델에 입력하고, 상기 원자 영역 인식 모델로부터 출력되는 상기 복수의 원자 영역 정보를 획득하는,
    인공 지능 장치.
  3. 제2항에 있어서,
    상기 복수의 원자 영역 정보는,
    원자 위치 정보 및 원자 정보를 포함하는,
    인공 지능 장치.
  4. 제3항에 있어서,
    상기 프로세서는,
    상기 복수의 원자 영역 정보 중 제1 원자 영역 정보 및 제2 원자 영역 정보를 기초로 제1 원자 및 제2 원자 사이의 결합 이미지를 획득하고, 상기 결합 이미지를 기초로 상기 제1 원자 및 상기 제2 원자의 결합 관계 정보를 획득하는,
    인공 지능 장치.
  5. 제4항에 있어서,
    상기 프로세서는,
    상기 결합 이미지를 결합 관계 인식 모델에 입력하고, 상기 결합 관계 인식 모델로부터 출력되는 상기 결합 관계 정보를 획득하는,
    인공 지능 장치.
  6. 제4항에 있어서,
    상기 프로세서는,
    상기 제1 원자 영역 정보 및 상기 제2 원자 영역 정보를 기초로 상기 제1 원자 영역의 중심점 위치와 상기 제2 원자 영역의 중심점 위치를 포함하는 상기 결합 이미지를 획득하는,
    인공 지능 장치.
  7. 제4항에 있어서,
    상기 프로세서는,
    상기 제1 원자 영역 정보를 기초로 소정의 거리 내에 위치하는 상기 제2 원자 영역을 선택하는,
    인공 지능 장치.
  8. 제1항에 있어서,
    상기 프로세서는,
    상기 복수의 원자 영역 정보를 기초로 복수의 원자들 각각을 정점으로, 복수의 원자 각각의 결합 관계 정보를 간선으로 하여 상기 인접 행렬을 생성하는,
    인공 지능 장치.
  9. 제1항에 있어서,
    상기 프로세서는,
    상기 생성된 인접 행렬을 기초로 SMILES(Simplified Molecular Input Line Entry System)를 포함하는 소정의 문자열 포맷으로 상기 구조식 이미지를 변환하는,
    인공 지능 장치.
  10. 구조식 이미지에서 복수의 원자 영역 정보를 획득하는 단계;
    상기 복수의 원자 영역 정보를 기초로 복수의 원자 간의 결합 관계 정보를 획득하는 단계;
    상기 복수의 원자 영역 정보 및 상기 복수의 원자 간의 결합 관계 정보를 기초로 인접 행렬을 생성하는 단계; 및
    상기 인접 행렬을 기초로 상기 구조식 이미지에 대응하는 소정의 문자열 포맷을 생성하는 단계를 포함하는,
    구조식 이미지 인식 방법.
  11. 제10항에 있어서,
    상기 복수의 원자 영역 정보를 획득하는 단계는,
    상기 구조식 이미지를 원자 영역 인식 모델에 입력하는 단계; 및
    상기 원자 영역 인식 모델로부터 출력되는 상기 복수의 원자 영역 정보를 획득하는 단계를 포함하고,
    상기 복수의 원자 영역 정보는, 원자 위치 정보 및 원자 정보를 포함하는,
    구조식 이미지 인식 방법.
  12. 제11항에 있어서,
    상기 결합 관계 정보를 획득하는 단계는,
    상기 복수의 원자 영역 정보 중 제1 원자 영역 정보 및 제2 원자 영역 정보를 기초로 제1 원자 및 제2 원자 사이의 결합 이미지를 획득하는 단계; 및
    상기 결합 이미지를 기초로 상기 제1 원자 및 상기 제2 원자의 결합 관계 정보를 획득하는 단계를 포함하고,
    상기 결합 관계 정보를 획득하는 단계는,
    상기 결합 이미지를 결합 관계 인식 모델에 입력하는 단계; 및
    상기 결합 관계 인식 모델로부터 출력되는 상기 결합 관계 정보를 획득하는
    단계를 포함하는,
    구조식 이미지 인식 방법.
  13. 제12항에 있어서,
    상기 결합 이미지를 획득하는 단계는, 상기 제1 원자 영역 정보 및 상기 제2 원자 영역 정보를 기초로 상기 제1 원자 영역의 중심점 위치와 상기 제2 원자 영역의 중심점 위치를 포함하는 상기 결합 이미지를 획득하는 단계를 포함하고,
    상기 결합 관계 정보를 획득하는 단계는, 상기 제1 원자 영역 정보를 기초로 소정의 거리 내에 위치하는 상기 제2 원자 영역을 선택하는 단계를 포함하는,
    구조식 이미지 인식 방법.
  14. 제10항에 있어서,
    상기 인접 행렬을 생성하는 단계는,
    상기 복수의 원자 영역 정보를 기초로 복수의 원자들 각각을 정점으로, 복수의 원자 각각의 결합 관계 정보를 간선으로 하여 상기 인접 행렬을 생성하는,
    구조식 이미지 인식 방법.
  15. 제10항에 있어서,
    상기 소정의 문자열 포맷을 생성하는 단계는,
    상기 생성된 인접 행렬을 기초로 SMILES(Simplified Molecular Input Line Entry System)를 포함하는 소정의 문자열 포맷으로 상기 구조식 이미지를 변환하는 단계를 포함하는,
    구조식 이미지 인식 방법.
PCT/KR2023/003770 2022-04-01 2023-03-22 구조식 이미지를 인식하는 인공 지능 장치 및 그 방법 WO2023191374A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2022-0041054 2022-04-01
KR1020220041054A KR20230142164A (ko) 2022-04-01 2022-04-01 구조식 이미지를 인식하는 인공 지능 장치 및 그 방법

Publications (1)

Publication Number Publication Date
WO2023191374A1 true WO2023191374A1 (ko) 2023-10-05

Family

ID=88202558

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/003770 WO2023191374A1 (ko) 2022-04-01 2023-03-22 구조식 이미지를 인식하는 인공 지능 장치 및 그 방법

Country Status (2)

Country Link
KR (1) KR20230142164A (ko)
WO (1) WO2023191374A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160121379A (ko) * 2015-04-09 2016-10-19 한국전자통신연구원 골프 동작 분석 장치 및 방법
KR20200003310A (ko) * 2018-06-19 2020-01-09 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR20200128486A (ko) * 2019-06-05 2020-11-13 엘지전자 주식회사 사용자의 위치를 결정하는 인공 지능 장치 및 그 방법
KR20210042777A (ko) * 2019-10-10 2021-04-20 삼성전자주식회사 화학구조를 생성하는 장치 및 방법
KR20210147862A (ko) * 2020-05-29 2021-12-07 삼성전자주식회사 역합성 예측 모델의 학습 방법 및 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160121379A (ko) * 2015-04-09 2016-10-19 한국전자통신연구원 골프 동작 분석 장치 및 방법
KR20200003310A (ko) * 2018-06-19 2020-01-09 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR20200128486A (ko) * 2019-06-05 2020-11-13 엘지전자 주식회사 사용자의 위치를 결정하는 인공 지능 장치 및 그 방법
KR20210042777A (ko) * 2019-10-10 2021-04-20 삼성전자주식회사 화학구조를 생성하는 장치 및 방법
KR20210147862A (ko) * 2020-05-29 2021-12-07 삼성전자주식회사 역합성 예측 모델의 학습 방법 및 장치

Also Published As

Publication number Publication date
KR20230142164A (ko) 2023-10-11

Similar Documents

Publication Publication Date Title
WO2020213762A1 (ko) 전자장치, 그 동작방법, 및 복수의 인공지능장치를 포함한 시스템
WO2017213398A1 (en) Learning model for salient facial region detection
WO2020204655A1 (en) System and method for context-enriched attentive memory network with global and local encoding for dialogue breakdown detection
WO2014051246A1 (en) Method and apparatus for inferring facial composite
WO2020027454A1 (en) Multi-layered machine learning system to support ensemble learning
WO2019093599A1 (ko) 사용자 관심 정보 생성 장치 및 그 방법
WO2020262788A1 (en) System and method for natural language understanding
WO2020071854A1 (en) Electronic apparatus and control method thereof
WO2020246655A1 (ko) 상황 인지 방법 및 이를 수행하는 장치
WO2021040105A1 (ko) 개체명 테이블을 생성하는 인공 지능 장치 및 그 방법
WO2014061905A1 (ko) 동작 및 음성 기반 북마크 제공 시스템 과 그 방법
WO2023191374A1 (ko) 구조식 이미지를 인식하는 인공 지능 장치 및 그 방법
WO2023177108A1 (en) Method and system for learning to share weights across transformer backbones in vision and language tasks
WO2019198900A1 (en) Electronic apparatus and control method thereof
WO2019216484A1 (ko) 전자 장치 및 그 동작방법
WO2021045434A1 (ko) 전자 장치 및 이의 제어 방법
WO2020130687A1 (en) System and method for automated execution of user-specified commands
WO2023182796A1 (ko) 제품 이미지를 기반으로 불량 제품을 감지하는 인공 지능 장치 및 그 방법
WO2023182794A1 (ko) 검사 성능을 유지하기 위한 메모리 기반 비전 검사 장치 및 그 방법
WO2023059000A1 (ko) 학습을 보조하기 위한 방법 및 장치
WO2022139327A1 (en) Method and apparatus for detecting unsupported utterances in natural language understanding
WO2022182135A1 (ko) 전자 장치 및 그 동작 방법
WO2023106531A1 (ko) 인공 지능 장치
WO2021054572A1 (ko) 디스플레이 장치 및 이의 영상 처리 방법
WO2023128721A1 (ko) 전자 장치 및 전자 장치의 제어 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23781230

Country of ref document: EP

Kind code of ref document: A1