KR101851675B1 - System for automatic goods classification using heterogeneous data - Google Patents

System for automatic goods classification using heterogeneous data Download PDF

Info

Publication number
KR101851675B1
KR101851675B1 KR1020160145823A KR20160145823A KR101851675B1 KR 101851675 B1 KR101851675 B1 KR 101851675B1 KR 1020160145823 A KR1020160145823 A KR 1020160145823A KR 20160145823 A KR20160145823 A KR 20160145823A KR 101851675 B1 KR101851675 B1 KR 101851675B1
Authority
KR
South Korea
Prior art keywords
data
unit
products
kind data
image
Prior art date
Application number
KR1020160145823A
Other languages
Korean (ko)
Other versions
KR20180049642A (en
Inventor
유성준
Original Assignee
네모커머스(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네모커머스(주) filed Critical 네모커머스(주)
Priority to KR1020160145823A priority Critical patent/KR101851675B1/en
Publication of KR20180049642A publication Critical patent/KR20180049642A/en
Application granted granted Critical
Publication of KR101851675B1 publication Critical patent/KR101851675B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0627Directed, with specific intent or strategy using item specifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N99/005
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Development Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)

Abstract

본 발명은 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템에 관한 것으로서, 더욱 상세하게는 이질적인 두 가지 형태의 데이터를 이용하여 제품을 분류하는 두 가지 알고리즘을 결합함으로써, 제품 분류의 정확도를 높일 수 있고, 제1종 데이터와 제2종 데이터를 사용함으로써, 상품 설명을 위한 문자 데이터 그리고 이미지 데이터를 활용할 수 있으며, 문자 데이터를 입력 받아 수행하는 변환부를 통해 단어의 수치화 방법이 적용 가능함은 물론 이미지 데이터를 입력 받아 수행하는 변환부를 통해 이미지의 확대 및 축소를 통한 정형화 방법이 가능하고, 네트워크를 수치화한 모델을 저장하는 기계 학습의 출력부에서 저장한 모델을 적용함으로써, 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류할 수 있으며, 판매자가 제공하는 정보를 바탕으로 판매하려고 하는 제품을 자동으로 분류함으로써, 분류를 하고자 할 때 비용이 절약됨은 물론 판매되는 제품과 관련한 다양하고 양질의 통계 데이터의 생산도 적은 비용으로 수행이 가능하고, 사용자가 판매하고자 하는 상품을 자동으로 분류하는데 판매하고자 하는 상품의 설명 문장 및 단어 그리고 이미지를 활용할 수 있는 효과가 있다.The present invention relates to a product classification system that automatically classifies products using heterogeneous data, and more particularly, to a product classification system that combines two algorithms for classifying products using two types of heterogeneous data, And by using the first kind data and the second kind data, the character data and the image data for describing the product can be used, and the method of quantifying the word can be applied through the conversion unit which receives and executes the character data A method of shaping the image by enlarging and reducing an image can be performed through a conversion unit that receives and receives image data. By applying a model stored in an output unit of a machine learning storing a model in which a network is quantified, And image data to input goods, By automatically classifying the products to be sold based on the information provided by the seller, it is possible to reduce the cost when sorting, and to produce various high quality statistical data related to the products to be sold, at a low cost, The user can automatically classify the products he wants to sell, so that he can utilize the description sentences, words and images of the products to be sold.

Description

이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템{System for automatic goods classification using heterogeneous data}[0001] The present invention relates to a goods classification system for automatically sorting goods using heterogeneous data,

본 발명은 이질적인 두 가지 형태의 데이터를 이용하여 제품을 분류하는 두 가지 알고리즘을 결합함으로써, 제품 분류의 정확도를 높일 수 있고, 제1종 데이터와 제2종 데이터를 사용함으로써, 상품 설명을 위한 문자 데이터 그리고 이미지 데이터를 활용할 수 있으며, 문자 데이터를 입력 받아 수행하는 변환부를 통해 단어의 수치화 방법이 적용 가능함은 물론 이미지 데이터를 입력 받아 수행하는 변환부를 통해 이미지의 확대 및 축소를 통한 정형화 방법이 가능하고, 네트워크를 수치화한 모델을 저장하는 기계 학습의 출력부에서 저장한 모델을 적용함으로써, 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류할 수 있으며, 판매자가 제공하는 정보를 바탕으로 판매하려고 하는 제품을 자동으로 분류함으로써, 분류를 하고자 할 때 비용이 절약됨은 물론 판매되는 제품과 관련한 다양하고 양질의 통계 데이터의 생산도 적은 비용으로 수행이 가능하고, 사용자가 판매하고자 하는 상품을 자동으로 분류하는데 판매하고자 하는 상품의 설명 문장 및 단어 그리고 이미지를 활용할 수 있는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템에 관한 기술이다.The present invention combines two algorithms for classifying products using two types of heterogeneous data, thereby improving the accuracy of product classification. By using first type data and second type data, Data and image data can be utilized and a method of digitizing a word can be applied through a conversion unit that receives and receives character data, and a formatting method can be performed by enlarging and reducing an image through a conversion unit that receives and receives image data By applying the model stored in the output part of the machine learning storing the model in which the network is quantified, it is possible to classify the goods by inputting the character data and the image data for describing the goods, By automatically classifying the products you want to In addition to cost savings, the production of various high-quality statistical data related to the products being sold can be carried out at low cost, and automatically classify the products the user wants to sell, Which can utilize heterogeneous data that can utilize the product classification system.

인공 지능 분야에서는 통계 학습, 기계 학습 등 많은 기반 기술의 발전이 이루어져 왔으며, 인공지능 알고리즘은 학습시, 클래스를 구분을 미리 알려주는 크게 지도학습과 그렇지 않은 비지도학습으로 나눈다.In the artificial intelligence field, many basic technologies such as statistical learning and machine learning have been developed. Artificial intelligence algorithms are divided into large guidance learning which classifies classes in advance and non - guidance learning which does not.

인공지능 알고리즘은 예측하고자 하는 결과가 실수와 같은 특정한 값을 예측하는 회귀(Regression) 모델과 비연속적인 이산 분류를 예측하는 분류(Classification)이 있는데, 회기 모델로는 선형회귀 등이 있고, 이산 분류를 구현하는 알고리즘은 크게 SVM (Support Vector Machine), LDA (Linear Discriminant Analysis), QDA (Quadratic Discriminant Analysis), Decision Tree, Neural Networks 등이 있다.The artificial intelligence algorithm has a regression model in which the result to be predicted predicts a specific value such as a real number and a classification that predicts a discontinuous discrete classification. The regression model includes a linear regression, (SVM), Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA), Decision Tree, and Neural Networks.

인공 지능 알고리즘은 학습한 결과를 데이터 또는 모델의 형태로 생성하고 이를 바탕으로 예측 또는 인식 단계를 수행한다.Artificial intelligence algorithms generate learning results in the form of data or models and perform prediction or recognition steps based on them.

최근에는 Neural Networks 분야에서 많은 발전이 이루어져 Deep Learning 라는 이름으로 기술이 전개되고 많은 실생활에 응용되는 연구가 전 세계적으로 이루어지고 있다. In recent years, many developments have been made in the field of Neural Networks, and the technology has been developed under the name Deep Learning, and many real world applications have been made worldwide.

도 1에 도시한 바와 같은, CNN(Convolution Neural Networks)은 주로 스냅이나 속사 형태의 이미지를 분석하는 데 주로 활용하고 있고, 도 2에 도시한 바와 같은, RNN(Recursive Neural Networks)은 음성 인식, 문장 번역과 같이 시계열 형태의 데이터를 해석하는 데 활용하고 있다.As shown in FIG. 1, CNN (Convolution Neural Networks) is mainly used for analyzing images in snap or snapshot form. RNN (Recursive Neural Networks), as shown in FIG. 2, It is used to interpret time series data like translation.

그러므로 이미지와 텍스트를 모두 결합하여 활용할 수 있는 신경망의 기법이 필요한 실정이다.Therefore, it is necessary to use neural network technique which can combine both image and text.

도 3과 도 4에 도시한 바와 같은, CNN(Convolution Neural Networks)과 RNN(Recursive Neural Networks)이 결합된 경우에도 같은 형태의 데이터가 CNN과 RNN의 이미지 형태로만 입력되므로, 이미지와 텍스트를 모두 결합하여 활용할 수 있는 신경망의 기법이 필요한 실정이다.Even if CNN (Convolution Neural Networks) and RNN (Recursive Neural Networks) are combined as shown in FIGS. 3 and 4, since the same type of data is input only in the image form of CNN and RNN, In this paper,

따라서 이질적인 두 가지 형태의 데이터를 이용하여 제품을 분류하는 두 가지 알고리즘을 결합하여 제품 분류의 정확도를 높일 수 있고, 제1종 데이터와 제2종 데이터를 사용하여 상품 설명을 위한 문자 데이터 그리고 이미지 데이터를 활용할 수 있으며, 문자 데이터를 입력 받아 수행하는 변환부를 통해 단어의 수치화 방법이 적용 가능함은 물론 이미지 데이터를 입력 받아 수행하는 변환부를 통해 이미지의 확대 및 축소를 통한 정형화 방법이 가능하고, 네트워크를 수치화한 모델을 저장하는 기계 학습의 출력부에서 저장한 모델을 적용하여 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류할 수 있는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템의 개발이 절실한 실정이다.Therefore, it is possible to increase the accuracy of the product classification by combining the two algorithms for classifying products using two types of heterogeneous data, and by using the first kind data and the second kind data, character data for product description and image data A method of digitizing a word can be applied through a conversion unit that receives and receives character data, a formatting method by enlarging and reducing an image can be performed through a conversion unit that receives and receives image data, A product classification system that automatically classifies products by using heterogeneous data that can classify products by inputting character data and image data for product description by applying a model stored at the output of the machine learning storing one model The development is urgent.

KR 10-2012-0075160(2012. 7. 10)KR 10-2012-0075160 (Jul 10, 2012)

따라서 본 발명은 상기와 같은 문제점을 해결하기 위하여 착상된 것으로서, 이질적인 두 가지 형태의 데이터를 이용하여 제품을 분류하는 두 가지 알고리즘을 결합함으로써, 제품 분류의 정확도를 높일 수 있는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 제공하는데 그 목적이 있다. SUMMARY OF THE INVENTION Accordingly, the present invention has been made keeping in mind the above problems occurring in the prior art, and it is an object of the present invention to provide a method and apparatus for combining products using two types of heterogeneous data, And an object classification system that automatically classifies the goods.

본 발명의 다른 목적은 제1종 데이터와 제2종 데이터를 사용함으로써, 상품 설명을 위한 문자 데이터 그리고 이미지 데이터를 활용할 수 있는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 제공하는데 있다. Another object of the present invention is to provide a goods classification system which automatically classifies goods by using heterogeneous data capable of utilizing character data and image data for product description by using first type data and second type data .

본 발명의 다른 목적은 문자 데이터를 입력 받아 수행하는 변환부를 통해 단어의 수치화 방법이 적용 가능함은 물론 이미지 데이터를 입력 받아 수행하는 변환부를 통해 이미지의 확대 및 축소를 통한 정형화 방법이 가능한 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 제공하는데 있다. It is another object of the present invention to provide a method of quantifying a word through a conversion unit that receives character data, and a method of formatting the image by enlarging and reducing an image through a conversion unit that receives image data, And to classify the goods automatically.

본 발명의 다른 목적은 네트워크를 수치화한 모델을 저장하는 기계 학습의 출력부에서 저장한 모델을 적용함으로써, 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류할 수 있는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 제공하는데 있다. It is another object of the present invention to provide a method and apparatus for applying a model stored in an output unit of a machine learning storing a model in which a network is numerically quantized so as to utilize heterogeneous data for inputting character data and image data for product description, And to provide a goods classification system that automatically classifies goods.

본 발명의 다른 목적은 판매자가 제공하는 정보를 바탕으로 판매하려고 하는 제품을 자동으로 분류함으로써, 분류를 하고자 할 때 비용이 절약됨은 물론 판매되는 제품과 관련한 다양하고 양질의 통계 데이터의 생산도 적은 비용으로 수행이 가능한 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 제공하는데 있다. Another object of the present invention is to automatically classify the products to be sold based on the information provided by the sellers, thereby saving cost when sorting, and producing a variety of high-quality statistical data related to the products to be sold, And to provide a goods classification system that automatically classifies a product by using heterogeneous data that can be executed by the goods classification system.

본 발명의 다른 목적은 사용자가 판매하고자 하는 상품을 자동으로 분류하는데 판매하고자 하는 상품의 설명 문장 및 단어 그리고 이미지를 활용할 수 있는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 제공하는데 있다.Another object of the present invention is to provide a goods classification system that automatically classifies goods by using heterogeneous data that can utilize descriptive sentences, words, and images of the goods to be sold in order to automatically classify the goods to be sold by the user .

상기 목적을 달성하기 위한 본 발명의 바람직한 일실시예에 따른 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템은 제1종 데이터를 입력하는 제1입력부와, 상기 제1입력부에서 입력한 데이터를 단어의 수치화 방법을 적용하여 변환하는 제1변환부와, 제2종 데이터를 입력하는 제2입력부와, 상기 제2입력부에서 입력한 데이터를 이미지의 확대 및 축소를 통한 정형화 방법을 적용하여 변환하는 제2변환부를 포함하며, 상기 제1종 데이터와 상기 제2종 데이터를 입력받아 변환 수행하는 데이터 입력부와; 상기 데이터 입력부에서 입력받은 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n ), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n ), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn, 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m=n )중에서 선택되는 구성을 기계 학습으로 판단하는 제1판단부와, 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n ), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n ), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn, 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m=n )중에서 선택되는 구성을 기계 학습으로 판단하는 제2판단부와, 상기 제1판단부와 제2판단부의 기계학습 모델을 생성하고, 제어부에서 결정한 최적의 제1판단부와 제2판단부의 모델을 출력부에 전달하는 제어부를 포함하는 기계학습부와; 상기 기계학습부의 제어부에서 결정한 최적의 모델을 출력하는 출력부; 을 포함함을 특징으로 한다.According to an aspect of the present invention, there is provided a goods classification system for automatically sorting goods using heterogeneous data, the system comprising: a first input unit for inputting first type data; a second input unit for inputting data A second input unit for inputting second type data, and a second input unit for converting the data input from the second input unit by a formatting method by enlarging and reducing the image, And a second conversion unit for converting the first and second type data into the first type data and the second type data; X 1 , X 2 , ... received from the data input unit; , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n), first kind data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n , first kind data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... , And Y n (m = n), based on the first type data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n), first kind data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n , first kind data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... , And Y n (m = n) in a machine learning mode; and a second determination unit for generating a machine learning model of the first determination unit and the second determination unit, And a control unit for transmitting the model of the second determination unit to the output unit; An output unit for outputting an optimal model determined by the control unit of the machine learning unit; .

삭제delete

삭제delete

상기 본 발명에 있어서, 상기 출력부는 학습한 네트워크를 수치화한 모델을 저장하고, 출력부에서 저장한 모델을 적용하여 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류하는 것을 포함함을 특징으로 한다. In the present invention, the output unit may include a model in which the learned network is modeled, and a model stored in the output unit is applied to classify the product by inputting character data and image data for product description, .

상기 본 발명에 있어서, 상기 제1종 데이터가 문자 데이터이고, 제2종 데이터가 이미지 데이터이거나 또는 제1종 데이터가 이미지 데이터이고, 제2종 데이터가 문자 데이터인 것을 포함함을 특징으로 한다. In the present invention, the first type data may be character data, the second type data may be image data, or the first type data may be image data and the second type data may be character data.

삭제delete

삭제delete

상술한 바와 같이, 본 발명인 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템은 다음과 같은 효과를 가진다. As described above, the merchandise classification system that automatically classifies merchandise utilizing heterogeneous data of the present invention has the following effects.

첫째, 본 발명은 이질적인 두 가지 형태의 데이터를 이용하여 제품을 분류하는 두 가지 알고리즘을 결합함으로써, 제품 분류의 정확도를 높일 수 있다. First, the present invention can improve the accuracy of product classification by combining two algorithms for classifying products using two types of heterogeneous data.

둘째, 본 발명은 제1종 데이터와 제2종 데이터를 사용함으로써, 상품 설명을 위한 문자 데이터 그리고 이미지 데이터를 활용할 수 있다. Second, the present invention can utilize character data and image data for product description by using first type data and second type data.

셋째, 본 발명은 문자 데이터를 입력 받아 수행하는 변환부를 통해 단어의 수치화 방법이 적용 가능함은 물론 이미지 데이터를 입력 받아 수행하는 변환부를 통해 이미지의 확대 및 축소를 통한 정형화 방법이 가능하다. Third, the present invention is applicable to a method of digitizing a word through a conversion unit that receives and receives character data, as well as a method of expanding and reducing an image through a conversion unit that receives and receives image data.

넷째, 본 발명은 네트워크를 수치화한 모델을 저장하는 기계 학습의 출력부에서 저장한 모델을 적용함으로써, 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류할 수 있다. Fourth, the present invention can classify a product by inputting character data and image data for describing a product by applying a model stored in an output unit of a machine learning storing a model in which a network is quantified.

다섯째, 본 발명은 판매자가 제공하는 정보를 바탕으로 판매하려고 하는 제품을 자동으로 분류함으로써, 분류를 하고자 할 때 비용이 절약됨은 물론 판매되는 제품과 관련한 다양하고 양질의 통계 데이터의 생산도 적은 비용으로 수행이 가능하다. Fifth, the present invention automatically classifies products to be sold on the basis of information provided by sellers, thereby saving cost when sorting, and also producing various high-quality statistical data related to products to be sold, at a low cost It is possible to perform.

여섯째, 본 발명은 사용자가 판매하고자 하는 상품을 자동으로 분류하는데 판매하고자 하는 상품의 설명 문장 및 단어 그리고 이미지를 활용할 수 있다. Sixth, the present invention can utilize a description sentence, a word, and an image of a product to be sold for automatically classifying a product to be sold by a user.

도 1은 종래의 CNN(Convolution Neural Networks)을 활용하여 스냅이나 속사 형태의 이미지를 분석하는 형태를 나타낸 도면.
도 2는 종래의 RNN(Recursive Neural Networks)을 활용하여 음성인식, 문장 번역과 같이 시계열 형태의 데이터를 해석하는 형태를 나타낸 도면.
도 3은 종래의 CNN(Convolution Neural Networks)과 RNN(Recursive Neural Networks)이 결합된 형태를 나타낸 도면.
도 4는 다른 종래의 CNN(Convolution Neural Networks)과 RNN(Recursive Neural Networks)이 결합된 형태를 나타낸 도면.
도 5는 발명의 일실시예에 따른 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템의 구성을 설명하기 위해 나타낸 도면.
도 6은 본 발명의 일실시예에 따른 이종 데이터 각각의 개수가 일치하지 않는 경우에 적용 가능한 학습 형태를 나타낸 도면.
도 7은 본 발명의 다른 일실시예에 따른 이종 데이터 각각의 개수가 일치하지 않는 경우에 적용 가능한 학습 형태를 나타낸 도면.
도 8은 본 발명의 일실시예에 따른 이종 데이터 각각의 개수가 일치하는 경우에 적용 가능한 학습 형태를 나타낸 도면.
도 9는 본 발명의 일실시예에 따른 이종 데이터 중 제1데이터를 반복하여 적용한 후, 제2데이터를 반복 적용한 학습 형태를 나타낸 도면.
FIG. 1 is a view showing a form of analyzing a snap or snapshot image using conventional CNN (Convolution Neural Networks). FIG.
FIG. 2 is a diagram showing a form of interpreting time-series data such as speech recognition and sentence translation using conventional RNN (Recursive Neural Networks). FIG.
3 is a view showing a combination of conventional CNN (Convolution Neural Networks) and RNN (Recursive Neural Networks).
FIG. 4 is a view showing a combination of another conventional CNN (Convolution Neural Networks) and RNN (Recursive Neural Networks). FIG.
5 is a view for explaining a configuration of a goods classification system that automatically classifies goods using heterogeneous data according to an embodiment of the present invention.
FIG. 6 is a diagram illustrating a learning form applicable when the numbers of different pieces of heterogeneous data do not coincide with each other according to an embodiment of the present invention. FIG.
FIG. 7 is a diagram showing a learning form applicable when the number of different pieces of heterogeneous data according to another embodiment of the present invention do not match; FIG.
FIG. 8 is a diagram illustrating a learning form applicable when the numbers of different pieces of heterogeneous data according to an embodiment of the present invention are identical. FIG.
9 is a diagram showing a learning form in which second data is repeatedly applied after repeatedly applying first data among heterogeneous data according to an embodiment of the present invention.

이하 첨부된 도면과 함께 본 발명의 바람직한 실시예를 살펴보면 다음과 같은데, 본 발명을 설명함에 있어서 관련된 공지기술 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략할 것이며, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있으므로, 그 정의는 본 발명인 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 설명하는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, when it is determined that a detailed description of related art or configuration may unnecessarily obscure the gist of the present invention, The description will be omitted, and the terms described below are defined in consideration of the functions of the present invention, and this may vary depending on the intention of the user, the operator, or the custom. Based on the contents of the present specification, which describes the classification system for classification.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 일실시예에 따른 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a goods classification system for automatically sorting goods using heterogeneous data according to a preferred embodiment of the present invention will be described in detail with reference to the accompanying drawings.

도 5는 발명의 일실시예에 따른 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템의 구성을 설명하기 위해 나타낸 도면이고, 도 6은 본 발명의 일실시예에 따른 이종 데이터 각각의 개수가 일치하지 않는 경우에 적용 가능한 학습 형태를 나타낸 도면이며, 도 7은 본 발명의 다른 일실시예에 따른 이종 데이터 각각의 개수가 일치하지 않는 경우에 적용 가능한 학습 형태를 나타낸 도면이고, 도 8은 본 발명의 일실시예에 따른 이종 데이터 각각의 개수가 일치하는 경우에 적용 가능한 학습 형태를 나타낸 도면이며, 도 9는 본 발명의 일실시예에 따른 이종 데이터 중 제1데이터를 반복하여 적용한 후, 제2데이터를 반복 적용한 학습 형태를 나타낸 도면이다. FIG. 5 is a view for explaining a configuration of a goods classification system that automatically classifies goods using heterogeneous data according to an embodiment of the present invention. FIG. 6 is a diagram illustrating the number of different types of heterogeneous data according to an embodiment of the present invention FIG. 7 is a diagram showing a learning form that can be applied when the number of different kinds of heterogeneous data according to another embodiment of the present invention do not match, and FIG. FIG. 9 is a diagram illustrating a learning type applicable when the number of different types of heterogeneous data according to an embodiment of the present invention is coincident. FIG. 9 is a flowchart illustrating a method of applying repeatedly first data among heterogeneous data according to an embodiment of the present invention, And the second data is repeatedly applied.

본 발명인 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템은 데이터 입력부(10), 제1입력부(11), 제1변환부(12), 제2입력부(13), 제2변환부(14), 기계학습부(20), 제어부(21), 제1판단부(22), 제2판단부(23), 출력부(30)로 구성된다. A goods classification system for automatically sorting goods using heterogeneous data according to the present invention includes a data input unit 10, a first input unit 11, a first conversion unit 12, a second input unit 13, a second conversion unit A controller 20 and a control unit 21. The control unit 21 includes a first determination unit 22 and a second determination unit 23 and an output unit 30.

도 5 내지 도 9에 도시한 바와 같이, 본 발명인 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템은 제1종 데이터와 제2종 데이터를 입력받아 변환 수행하는 데이터 입력부(10)와; 상기 데이터 입력부(10)에서 입력받은 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n ), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n ), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn, 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn( m=n ) 중에서 선택되는 구성을 재현하여 제1판단부(22)와 제2판단부(23)의 기계학습 모델을 생성하고, 제어부(21)에서 결정한 최적의 제1판단부(22)와 제2판단부(23)의 모델을 출력부(30)에 전달하는 기계학습부(20)와; 상기 기계학습부(20)의 제어부(21)에서 결정한 최적의 모델을 출력하는 출력부(30); 을 구비한다.As shown in FIGS. 5 to 9, a goods classification system that automatically classifies goods using heterogeneous data according to the present invention includes a data input unit 10 for receiving and converting first type data and second type data; The first kind data X 1 , X 2 , ... received from the data input unit 10 , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n), first kind data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n , first kind data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... And Y n (m = n) to generate a machine learning model of the first determination unit 22 and the second determination unit 23, and the optimal first determination unit 22, determined by the control unit 21, A machine learning unit (20) for transferring the models of the first determination unit (22) and the second determination unit (23) to the output unit (30); An output unit 30 for outputting an optimal model determined by the control unit 21 of the machine learning unit 20; Respectively.

상기 본 발명인 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템을 구성하는 각 기술적 수단들의 기능을 설명하면 다음과 같다.The function of each technical means constituting the goods classification system for automatically classifying the goods using the heterogeneous data according to the present invention will be described as follows.

상기 데이터 입력부(10)는 제1종 데이터와 제2종 데이터를 입력받아 변환 수행하는 것이다. The data input unit 10 receives and converts first type data and second type data.

여기서, 상기 데이터 입력부(10)는 제1종 데이터를 입력하는 제1입력부(11)와, 상기 제1입력부(11)에서 입력한 데이터를 단어의 수치화 방법을 적용하여 변환하는 제1변환부(12)와, 제2종 데이터를 입력하는 제2입력부(13)와, 상기 제2입력부(13)에서 입력한 데이터를 이미지의 확대 및 축소를 통한 정형화 방법을 적용하여 변환하는 제2변환부(14)를 포함하는 것이다. The data input unit 10 includes a first input unit 11 for inputting first type data and a first conversion unit 11 for converting data inputted from the first input unit 11 by applying a word digitization method A second input unit 13 for inputting second type data, a second conversion unit 12 for applying the formatting method by enlarging and reducing the image inputted by the second input unit 13, 14).

상기 기계학습부(20)는 상기 데이터 입력부(10)에서 입력받은 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n ), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n ), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn, 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m=n )중에서 선택되는 구성을 재현하여 제1판단부(22)와 제2판단부(23)의 기계학습 모델을 생성하고, 제어부(21)에서 결정한 최적의 제1판단부(22)와 제2판단부(23)의 모델을 출력부(30)에 전달하는 것이다.The machine learning unit 20 receives the first kind data X 1 , X 2 , ... received from the data input unit 10. , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n), first kind data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n , first kind data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... And Y n (m = n) to generate a machine learning model of the first determination unit 22 and the second determination unit 23, and the optimal first determination unit 22, determined by the control unit 21, To the output unit 30, the model of the first determination unit 22 and the second determination unit 23.

여기서, 상기 기계학습부(20)는 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n )(도 6에 도시함), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n )(도 7에 도시함), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn(도 8에 도시함), 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn( m=n )(도 9에 도시함) 중에서 선택되는 구성을 기계 학습으로 판단하는 제1판단부(22)와, 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n )(도 6에 도시함), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n )(도 7에 도시함), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn(도 8에 도시함), 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn( m=n )(도 9에 도시함) 중에서 선택되는 구성을 기계 학습으로 판단하는 제2판단부(23)와, 상기 제1판단부(22)와 제2판단부(23)의 기계학습 모델을 생성하고, 제어부(21)에서 결정한 최적의 제1판단부(22)와 제2판단부(23)의 모델을 출력부(30)에 전달하는 제어부(21)를 포함하는 것이다. Here, the machine learning unit 20 generates the first kind data X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n) (shown in FIG. 6), first kind data X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n) (shown in FIG. 7), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n (shown in FIG. 8), first type data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... , And Y n (m = n) (shown in FIG. 9) by machine learning, and a first determination unit 22 for determining the configuration selected from among the first kind data X 1 , X 2 ,. , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n) (shown in FIG. 6), first kind data X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n) (shown in FIG. 7), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n (shown in FIG. 8), first type data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... And Y n (m = n) (shown in FIG. 9) by machine learning, and a second determination unit 23 for determining the configuration selected from among the first determination unit 22 and the second determination unit 23, And a control unit 21 for generating a model of the optimal learning unit 22 and a model of the second determination unit 23 determined by the control unit 21 to the output unit 30 .

또한, 상기 제1판단부(22)와 제2판단부(23)는 총칭하여 분류부(24)로 칭한다.The first determination unit 22 and the second determination unit 23 are collectively referred to as a classification unit 24.

상기 출력부(30)는 상기 기계학습부(20)의 제어부(21)에서 결정한 최적의 모델을 출력하는 것이다.The output unit 30 outputs the optimal model determined by the control unit 21 of the machine learning unit 20. [

여기서, 상기 출력부(30)는 학습한 네트워크를 수치화한 모델을 저장하고, 출력부(30)에서 저장한 모델을 적용하여 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류하는 것이다. Here, the output unit 30 stores a model obtained by digitizing the learned network, and classifies the goods by inputting character data and image data for product description by applying a model stored in the output unit 30. [

또한, 상술한 상기 제1종 데이터가 문자 데이터이고, 제2종 데이터가 이미지 데이터이거나 또는 제1종 데이터가 이미지 데이터이고, 제2종 데이터가 문자 데이터인 것이다. The first type data is character data, the second type data is image data, or the first type data is image data and the second type data is character data.

그리고 상기 제1종 데이터와 제2종 데이터를 사용하여 상품 설명을 위한 문자 데이터와 이미지 데이터를 활용할 수 있는 것이다. 예를 들어, 제1종 데이터를 문자 데이터라고 하고 제2종 데이터를 이미지 데이터라고 하면, 학습을 위하여 사용하는 문자 데이터와 이미지 데이터를 활용하여 각각 도 5의 제1판단부와 제2판단부의 파라메타 값이 정하여진다. 이와 같은 학습절차를 거친 후에 분류가 필요한 실제 상품에 관한 다수의 문자 데이터와 다수의 이미지 데이터를 도 6, 도 7, 도 8 중의 어느 한 가지 방법을 사용하여 문자 데이터의 개수와 이미지 데이터의 개수에 따라 적절한 방법을 찾아 활용하여 상품을 분류하는 것이다.And character data and image data for product description can be utilized by using the first kind data and the second kind data. For example, when the first type data is referred to as character data and the second type data is referred to as image data, character data and image data used for learning are used to calculate the parameters of the first determination unit and the second determination unit, The value is determined. After the learning procedure, a plurality of character data and a plurality of image data related to the actual goods that need to be classified are stored in the number of character data and the number of image data by using any one of the methods of Figs. 6, 7, It is to classify the products by finding and utilizing appropriate methods.

또한, 이종 데이터 각각의 개수가 일치하는 경우와 이종 데이터 각각의 개수가 일치하지 않는 경우에서 상기 이종 데이터를 교대로 반복 활용하여 각 데이터에 적절한 판단부를 조합하여 학습하는 방법을 적용하여 상품을 분류하는 것이다. 이를 구체적으로 기술하면, 도 5는 제1종의 데이터의 개수가 제2종의 데이터의 개수보다 많은 경우의 실행하는 방법이고, 도 6은 제2종의 데이터의 개수가 제1종의 데이터의 개수보다 많은 경우의 실행하는 방법이며, 도 7은 제1종의 데이터의 개수와 제2종의 데이터의 개수가 같은 경우의 실행하는 방법이다. 상기 도 5, 도 6, 도 7에서 입력되는 데이터의 종류에 따라 제1판단부와 제2판단부가 교대로 실행되는데, 각각이 실행될 때, 이전의 판단부의 출력 값을 새로운 종류의 데이터를 활용한 판단부의 입력 값으로 활용하는 것이다.In addition, in the case where the numbers of the different kinds of data coincide with each other and the numbers of the different kinds of data do not coincide with each other, will be. Specifically, FIG. 5 shows a method for executing the case where the number of first type data is greater than the number of second type data, and FIG. 6 shows a case where the number of second type data is FIG. 7 shows a method for executing the case where the number of the first type of data is equal to the number of the second type of data. 5, 6 and 7, the first judging unit and the second judging unit are alternately executed according to the type of data input. When each of the first judging unit and the second judging unit is executed, the output value of the previous judging unit is used It is used as an input value of the judgment unit.

이상에서 설명한 바와 같이, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것은 아니다.It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the invention. It is not.

상술한 바와 같이, 본 발명인 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템은 상품을 자동으로 분류하는 상품분류시스템 분야에 폭 넓게 적용할 수 있는 것이다.As described above, the commodity classification system that automatically classifies commodities using heterogeneous data according to the present invention can be widely applied to a commodity classification system field for automatically classifying commodities.

10 : 데이터 입력부 11 : 제1입력부
12 : 제1변환부 13 : 제2입력부
14 : 제2변환부 20 : 기계학습부
21 : 제어부 22 : 제1판단부
23 : 제2판단부 24 : 분류부
30 : 출력부
10: data input unit 11: first input unit
12: first conversion section 13: second input section
14: second conversion section 20: machine learning section
21: control unit 22:
23: second judgment section 24:
30: Output section

Claims (7)

이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템에 있어서,
제1종 데이터를 입력하는 제1입력부와, 상기 제1입력부에서 입력한 데이터를 단어의 수치화 방법을 적용하여 변환하는 제1변환부와, 제2종 데이터를 입력하는 제2입력부와, 상기 제2입력부에서 입력한 데이터를 이미지의 확대 및 축소를 통한 정형화 방법을 적용하여 변환하는 제2변환부를 포함하며, 상기 제1종 데이터와 상기 제2종 데이터를 입력받아 변환 수행하는 데이터 입력부와;
상기 데이터 입력부에서 입력받은 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n ), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n ), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn, 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m=n )중에서 선택되는 구성을 기계 학습으로 판단하는 제1판단부와, 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m<n ), 제1종 데이터: X1, X2, … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m>n ), 제1종 데이터: X1, X2, … , Xn / 제2종 데이터: Y1, Y2, … , Yn, 제1종 데이터: X1, X2 … , Xm / 제2종 데이터: Y1, Y2, … , Yn ( m=n )중에서 선택되는 구성을 기계 학습으로 판단하는 제2판단부와, 상기 제1판단부와 제2판단부의 기계학습 모델을 생성하고, 제어부에서 결정한 최적의 제1판단부와 제2판단부의 모델을 출력부에 전달하는 제어부를 포함하는 기계학습부와;
상기 기계학습부의 제어부에서 결정한 최적의 모델을 출력하는 출력부; 을 포함함을 특징으로 하는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템.
A goods classification system for automatically classifying goods using heterogeneous data,
A first input unit for inputting first type data; a first conversion unit for converting the data input from the first input unit by applying a word digitization method; a second input unit for inputting second type data; A data input unit for receiving and converting the first type data and the second type data, and a second conversion unit for converting the data inputted from the two-input unit by applying a formatting method by enlarging and reducing an image;
X 1 , X 2 , ... received from the data input unit; , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n), first kind data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n , first kind data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... , And Y n (m = n), based on the first type data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m < n), first kind data: X 1 , X 2 , ... , X m / second kind data: Y 1 , Y 2 , ... , Y n (m> n), first kind data: X 1 , X 2 , ... , X n / second kind data: Y 1 , Y 2 , ... , Y n , first kind data: X 1 , X 2 ... , X m / second kind data: Y 1 , Y 2 , ... , And Y n (m = n) in a machine learning mode; and a second determination unit for generating a machine learning model of the first determination unit and the second determination unit, And a control unit for transmitting the model of the second determination unit to the output unit;
An output unit for outputting an optimal model determined by the control unit of the machine learning unit; And a product classifying system for automatically classifying products using heterogeneous data.
삭제delete 삭제delete 제 1항에 있어서,
상기 출력부는 학습한 네트워크를 수치화한 모델을 저장하고, 출력부에서 저장한 모델을 적용하여 상품 설명을 위한 문자 데이터와 이미지 데이터를 입력하여 상품을 분류하는 것을 포함함을 특징으로 하는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템.
The method according to claim 1,
Wherein the output unit stores a model obtained by digitizing the learned network and classifies the goods by inputting character data and image data for product description by applying a model stored in an output unit, A product classification system that automatically classifies products.
제 1항에 있어서,
상기 제1종 데이터가 문자 데이터이고, 제2종 데이터가 이미지 데이터이거나 또는 제1종 데이터가 이미지 데이터이고, 제2종 데이터가 문자 데이터인 것을 포함함을 특징으로 하는 이종 데이터를 활용하여 상품을 자동으로 분류하는 상품분류시스템.
The method according to claim 1,
Characterized in that the first kind data is character data, the second kind data is image data, or the first kind data is image data, and the second kind data is character data. Automatically classify goods classification system.
삭제delete 삭제delete
KR1020160145823A 2016-11-03 2016-11-03 System for automatic goods classification using heterogeneous data KR101851675B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160145823A KR101851675B1 (en) 2016-11-03 2016-11-03 System for automatic goods classification using heterogeneous data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160145823A KR101851675B1 (en) 2016-11-03 2016-11-03 System for automatic goods classification using heterogeneous data

Publications (2)

Publication Number Publication Date
KR20180049642A KR20180049642A (en) 2018-05-11
KR101851675B1 true KR101851675B1 (en) 2018-05-17

Family

ID=62185421

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160145823A KR101851675B1 (en) 2016-11-03 2016-11-03 System for automatic goods classification using heterogeneous data

Country Status (1)

Country Link
KR (1) KR101851675B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220018663A (en) 2020-08-07 2022-02-15 주식회사 에이젠글로벌 Improved prediction system and prediction method using heterogeneous data
KR20230075856A (en) 2021-11-23 2023-05-31 단국대학교 산학협력단 Apparatus and method for machine learning-based sensibility appraisal of ceramic-like products manufactured by injection molding

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102142126B1 (en) * 2018-06-12 2020-08-14 한신대학교 산학협력단 Hierarchical Category Cluster Based Shopping Basket Associated Recommendation Method
KR102115973B1 (en) * 2018-07-11 2020-05-27 국민대학교산학협력단 Heterogeneity learning based information classification apparatus
KR102192015B1 (en) * 2019-01-11 2020-12-16 연세대학교 산학협력단 Apparatus and method for generating manipulated image based on natural language and system using the same
CN110647630A (en) * 2019-09-30 2020-01-03 浙江执御信息技术有限公司 Method and device for detecting same-style commodities
KR102559574B1 (en) * 2020-10-15 2023-07-26 한국전자기술연구원 Data conversion method and system for improving the accuracy of artificial intelligence algorithms

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026195A (en) * 2007-07-23 2009-02-05 Yokohama National Univ Article classification apparatus, article classification method and program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026195A (en) * 2007-07-23 2009-02-05 Yokohama National Univ Article classification apparatus, article classification method and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220018663A (en) 2020-08-07 2022-02-15 주식회사 에이젠글로벌 Improved prediction system and prediction method using heterogeneous data
KR20220109375A (en) 2020-08-07 2022-08-04 주식회사 에이젠글로벌 Improved prediction system and prediction method using heterogeneous data
KR20230075856A (en) 2021-11-23 2023-05-31 단국대학교 산학협력단 Apparatus and method for machine learning-based sensibility appraisal of ceramic-like products manufactured by injection molding

Also Published As

Publication number Publication date
KR20180049642A (en) 2018-05-11

Similar Documents

Publication Publication Date Title
KR101851675B1 (en) System for automatic goods classification using heterogeneous data
US11003995B2 (en) Semi-supervised regression with generative adversarial networks
US11568240B2 (en) Method and apparatus for classifying class, to which sentence belongs, using deep neural network
CN110188202B (en) Training method and device of semantic relation recognition model and terminal
CN111738016B (en) Multi-intention recognition method and related equipment
US11210827B2 (en) Electronic device providing text-related image and method for operating the same
Majewski et al. Human-machine speech-based interfaces with augmented reality and interactive systems for controlling mobile cranes
JP2022546811A (en) Image captioning method, device, computing device and storage medium
JPWO2007138875A1 (en) Word dictionary / language model creation system, method, program, and speech recognition system for speech recognition
CN110543930A (en) Assistance system and method for planning supporting an automation system and training method
JP7095599B2 (en) Dictionary learning device, dictionary learning method, data recognition method and computer program
US20210158136A1 (en) Calculation scheme decision system, calculation scheme decision device, calculation scheme decision method, and storage medium
CN112989041A (en) Text data processing method and device based on BERT
JP6989450B2 (en) Image analysis device, image analysis method and program
EP4332823A1 (en) Method of training sentiment preference recognition model for comment information, recognition method, and device thereof
KR20180123826A (en) Correspondences generation system of goods classification between heterogeneous classification
KR102437193B1 (en) Apparatus and method for parallel deep neural networks trained by resized images with multiple scaling factors
US11176327B2 (en) Information processing device, learning method, and storage medium
US20240037335A1 (en) Methods, systems, and media for bi-modal generation of natural languages and neural architectures
Zantout et al. Ensemble Models for Enhancement of an Arabic Speech Emotion Recognition System
JP6846310B2 (en) Distance measuring device, data conversion device, distance measuring method, and program
KR20200134813A (en) Apparatus and method for image processing for machine learning
US20210168195A1 (en) Server and method for controlling server
Kenshimov et al. A COMPARISON OF CONVOLUTIONAL NEURAL NETWORKS FOR KAZAKH SIGN LANGUAGE RECOGNITION.
US20190065586A1 (en) Learning method, method of using result of learning, generating method, computer-readable recording medium and learning device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right