KR102595384B1 - 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 - Google Patents
문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 Download PDFInfo
- Publication number
- KR102595384B1 KR102595384B1 KR1020230008765A KR20230008765A KR102595384B1 KR 102595384 B1 KR102595384 B1 KR 102595384B1 KR 1020230008765 A KR1020230008765 A KR 1020230008765A KR 20230008765 A KR20230008765 A KR 20230008765A KR 102595384 B1 KR102595384 B1 KR 102595384B1
- Authority
- KR
- South Korea
- Prior art keywords
- similarity
- learning
- model
- document
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000013526 transfer learning Methods 0.000 title claims abstract description 35
- 238000013136 deep learning model Methods 0.000 title abstract description 6
- 230000006870 function Effects 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000004590 computer program Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000012886 linear function Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 9
- 238000013145 classification model Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 4
- 241000282412 Homo Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Operations Research (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Informatics (AREA)
- Feedback Control In General (AREA)
- Electrically Operated Instructional Devices (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 본 발명의 일실시예에 따른 컴퓨터 장치의 예를 도시한 블록도이다.
도 3은 본 발명의 일실시예에 있어서, 사전 학습을 위한 전이 학습 시스템의 예를 도시한 도면이다.
도 4는 본 발명의 일실시예에 있어서, 사전 학습을 위한 유사도 모델의 학습 과정의 예를 도시한 도면이다.
도 5는 본 발명의 일실시예에 있어서, 본 학습 모델의 학습 과정의 예를 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 전이 학습 방법의 예를 도시한 흐름도이다.
도 7은 본 발명의 일실시예에 따른 악성댓글 탐지 모델의 예를 도시한 도면이다.
Claims (7)
- 적어도 하나의 프로세서를 포함하는 컴퓨터 장치의 전이 학습 방법에 있어서,
상기 적어도 하나의 프로세서에 의해, 문서들간의 유사도를 출력하도록 공통 모델 구조 및 제1 출력함수를 포함하는 유사도 모델을 사전 학습시키는 단계;
상기 적어도 하나의 프로세서에 의해, 상기 사전 학습된 유사도 모델의 상기 제1 출력함수를 본 학습을 위한 제2 출력함수로 교체하여 상기 공통 모델 구조 및 상기 제2 출력함수를 포함하는 본 학습 모델을 생성하는 단계; 및
상기 적어도 하나의 프로세서에 의해, 상기 본 학습 모델이 입력되는 문서에 대해 적어도 하나의 스코어를 출력하도록 상기 본 학습 모델을 학습시키는 단계
를 포함하는 전이 학습 방법. - 제1항에 있어서,
상기 본 학습 모델을 학습시키는 단계는,
입력되는 문서의 스코어와 정답 레이블간의 CEE(Cross Entropy Error)를 최소화하는 상기 스코어를 출력하도록 상기 본 학습 모델을 학습시키는 것을 특징으로 하는 전이 학습 방법. - 제2항에 있어서,
상기 정답 레이블은 상기 입력되는 문서에 대해 미리 결정된 상기 입력되는 문서의 악성댓글 여부에 대한 값을 포함하고,
상기 본 학습 모델은 상기 입력되는 문서의 악성댓글 여부를 상기 스코어로서 출력하도록 학습되는 악성댓글 탐지 모델인 것
을 특징으로 하는 전이 학습 방법. - 컴퓨터 장치와 결합되어 제1항 내지 제3항 중 어느 한 항의 방법을 컴퓨터 장치에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
- 제1항 내지 제3항 중 어느 한 항의 방법을 컴퓨터 장치에 실행시키기 위한 컴퓨터 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체.
- 컴퓨터에서 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서
를 포함하고,
상기 적어도 하나의 프로세서에 의해,
문서들간의 유사도를 출력하도록 공통 모델 구조 및 제1 출력함수를 포함하는 유사도 모델을 사전 학습시키고,
상기 사전 학습된 유사도 모델의 상기 제1 출력함수를 본 학습을 위한 제2 출력함수로 교체하여 상기 공통 모델 구조 및 상기 제2 출력함수를 포함하는 본 학습 모델을 생성하고,
상기 본 학습 모델이 입력되는 문서에 대해 적어도 하나의 스코어를 출력하도록 상기 본 학습 모델을 학습시키는 것
을 특징으로 하는 컴퓨터 장치. - 제6항에 있어서,
상기 적어도 하나의 프로세서에 의해,
입력되는 문서의 스코어와 정답 레이블간의 CEE(Cross Entropy Error)를 최소화하는 상기 스코어를 출력하도록 상기 본 학습 모델을 학습시키는 것
을 특징으로 하는 컴퓨터 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230008765A KR102595384B1 (ko) | 2021-01-19 | 2023-01-20 | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210007453A KR102554750B1 (ko) | 2021-01-19 | 2021-01-19 | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 |
KR1020230008765A KR102595384B1 (ko) | 2021-01-19 | 2023-01-20 | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210007453A Division KR102554750B1 (ko) | 2021-01-19 | 2021-01-19 | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230019257A KR20230019257A (ko) | 2023-02-07 |
KR102595384B1 true KR102595384B1 (ko) | 2023-10-27 |
Family
ID=82405745
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210007453A Active KR102554750B1 (ko) | 2021-01-19 | 2021-01-19 | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 |
KR1020230008765A Active KR102595384B1 (ko) | 2021-01-19 | 2023-01-20 | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210007453A Active KR102554750B1 (ko) | 2021-01-19 | 2021-01-19 | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220230014A1 (ko) |
JP (1) | JP7236501B2 (ko) |
KR (2) | KR102554750B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117057413B (zh) * | 2023-09-27 | 2024-03-15 | 传申弘安智能(深圳)有限公司 | 强化学习模型微调方法、装置、计算机设备及存储介质 |
KR102820323B1 (ko) * | 2024-11-18 | 2025-06-13 | 더에이아이랩(주) | 문제 유사도 기반 학습 추천 방법 및 이를 수행하는 학습 추천 시스템 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060294101A1 (en) * | 2005-06-24 | 2006-12-28 | Content Analyst Company, Llc | Multi-strategy document classification system and method |
US8874663B2 (en) * | 2009-08-28 | 2014-10-28 | Facebook, Inc. | Comparing similarity between documents for filtering unwanted documents |
US9355171B2 (en) * | 2009-10-09 | 2016-05-31 | Hewlett Packard Enterprise Development Lp | Clustering of near-duplicate documents |
US20120323968A1 (en) * | 2011-06-14 | 2012-12-20 | Microsoft Corporation | Learning Discriminative Projections for Text Similarity Measures |
US12141878B2 (en) * | 2018-09-21 | 2024-11-12 | Kai SHU | Method and apparatus for collecting, detecting and visualizing fake news |
US11689561B2 (en) * | 2019-11-11 | 2023-06-27 | Microsoft Technology Licensing, Llc | Detecting unknown malicious content in computer systems |
KR102179086B1 (ko) * | 2020-03-11 | 2020-11-16 | 주식회사 씨몬 | 컨벤션 참가자 매칭 방법, 장치, 및 시스템 |
US11379720B2 (en) * | 2020-03-20 | 2022-07-05 | Avid Technology, Inc. | Adaptive deep learning for efficient media content creation and manipulation |
JP2023530421A (ja) * | 2020-06-11 | 2023-07-18 | グーグル エルエルシー | テキストまたは音声通信のための標準発話の使用 |
US11580764B2 (en) * | 2021-06-22 | 2023-02-14 | Microsoft Technology Licensing, Llc. | Self-supervised document-to-document similarity system |
-
2021
- 2021-01-19 KR KR1020210007453A patent/KR102554750B1/ko active Active
- 2021-06-10 JP JP2021097090A patent/JP7236501B2/ja active Active
- 2021-06-23 US US17/355,406 patent/US20220230014A1/en active Pending
-
2023
- 2023-01-20 KR KR1020230008765A patent/KR102595384B1/ko active Active
Non-Patent Citations (4)
Title |
---|
"BERT를 이용한 한국어 특허상담 기계독해", 2019년 추계학수발표대회 논문집 제26권 제2호(pp. 767-769), 2019.11. |
"Better Fine-Tuning via Instance Weighting for Text Classification", The Thirty-Third AAAI Conference on Artificial Intelligence, 2019. |
"Pre-training via Paraphrasing", 34th Conference on Neural Information Processing Systems, 2020.06.26. |
"하이웨이 네트워크 기반 CNN 모델링 및 사전 외 어휘 처리 기술을 활용한 악성 댓글 분류연구", 한국정보시스템학회 정보시스템연구 제29권 제3호(pp. 103-117), 2020.09. |
Also Published As
Publication number | Publication date |
---|---|
KR102554750B1 (ko) | 2023-07-12 |
JP7236501B2 (ja) | 2023-03-09 |
US20220230014A1 (en) | 2022-07-21 |
JP2022111020A (ja) | 2022-07-29 |
KR20220104984A (ko) | 2022-07-26 |
KR20230019257A (ko) | 2023-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444340B (zh) | 文本分类方法、装置、设备及存储介质 | |
CN114780727B (zh) | 基于强化学习的文本分类方法、装置、计算机设备及介质 | |
KR102432600B1 (ko) | 벡터 양자화를 이용한 중복 문서 탐지 방법 및 시스템 | |
US11640529B2 (en) | Training a neural network to create an embedding for an unlabeled vertex in a hypergraph | |
CN104574192B (zh) | 在多个社交网络中识别同一用户的方法及装置 | |
CN111967266A (zh) | 中文命名实体识别模型及其构建方法和应用 | |
KR102523160B1 (ko) | 딥러닝 기반의 문서 유사도 측정 모델을 이용한 중복 문서 탐지 방법 및 시스템 | |
WO2023065859A1 (zh) | 物品推荐方法、装置及存储介质 | |
US20200101383A1 (en) | Method and apparatus for recognizing game command | |
KR102595384B1 (ko) | 문서 유사도 학습에 기반한 딥러닝 모델의 전이 학습 방법 및 시스템 | |
Shehu et al. | Deep sentiment analysis: a case study on stemmed Turkish twitter data | |
Raschka et al. | Python machine learning second edition | |
CN114330966A (zh) | 一种风险预测方法、装置、设备以及可读存储介质 | |
Chen et al. | A comparison of machine learning algorithms for detecting XSS attacks | |
CN112307048B (zh) | 语义匹配模型训练方法、匹配方法、装置、设备及存储介质 | |
Du et al. | Structure tuning method on deep convolutional generative adversarial network with nondominated sorting genetic algorithm II | |
US20220147547A1 (en) | Analogy based recognition | |
CN115131058B (zh) | 账号识别方法、装置、设备及存储介质 | |
Zhao et al. | Hot question prediction in Stack Overflow | |
Rungta et al. | Two-phase multimodal neural network for app categorization using APK resources | |
CN110020214A (zh) | 一种融合知识的社交网络流式事件检测系统 | |
Im et al. | Cross-active connection for image-text multimodal feature fusion | |
CN114817697A (zh) | 标签信息的确定方法、装置、电子设备以及存储介质 | |
Chen et al. | Layer imbalance-aware multiplex network embedding | |
Wandabwa et al. | Document level semantic comprehension of noisy text streams via convolutional neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
PA0107 | Divisional application |
Comment text: Divisional Application of Patent Patent event date: 20230120 Patent event code: PA01071R01D Filing date: 20210119 Application number text: 1020210007453 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230916 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20231010 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20231024 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20231025 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |