KR102213763B1 - 자연어 처리와 딥러닝 네트워크를 이용하여 선별된 기사를 제공하는 방법 및 기사 분류 시스템 - Google Patents
자연어 처리와 딥러닝 네트워크를 이용하여 선별된 기사를 제공하는 방법 및 기사 분류 시스템 Download PDFInfo
- Publication number
- KR102213763B1 KR102213763B1 KR1020200123717A KR20200123717A KR102213763B1 KR 102213763 B1 KR102213763 B1 KR 102213763B1 KR 1020200123717 A KR1020200123717 A KR 1020200123717A KR 20200123717 A KR20200123717 A KR 20200123717A KR 102213763 B1 KR102213763 B1 KR 102213763B1
- Authority
- KR
- South Korea
- Prior art keywords
- articles
- subject
- neural network
- company
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 52
- 238000003058 natural language processing Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 title abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims abstract description 65
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 18
- 230000000306 recurrent effect Effects 0.000 claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000012417 linear regression Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 102100033814 Alanine aminotransferase 2 Human genes 0.000 description 1
- 101710096000 Alanine aminotransferase 2 Proteins 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 서비스 제공 서버를 개략적으로 나타낸 블록도이다.
도 3은 도 1에 따른 딥러닝 뉴럴 네트워크 서버의 구성을 나타낸 도면이다.
도 4는 일 실시예에 따른 보조 가중치 이미지를 나타낸 도면이다.
도 5 내지 도 6은 일 실시예에 따른 서비스 제공 서버에서 단말에 제공하는 기사들의 분류와 정렬 방법을 예시적으로 나타낸 도면이다.
도 7은 도 1에 따른 딥러닝 뉴럴 네트워크 기반의 기사 분류 시스템을 구현하기 위한 하드웨어를 예시적으로 나타낸 도면이다.
110: 제어부 120: 통신부
130: 기사 수집부 140: 저장부
150: 자연어 처리부 160: 기업 가중치 산출부
170: 주제 가중치 결정부 180: 분류 엔진
200: 딥러닝 뉴럴 네트워크 서버
300: 단말 310: 표시부
Claims (8)
- 복수의 기사들을 수집하고, 딥러닝 뉴럴 네트워크(deep learning neural network) 및 자연어 처리(NLP, natural language processing)를 이용하여 상기 기사들 각각에 대응하는 중요도를 산출하고 산출된 중요도에 따라 상기 기사들을 분류하거나 정렬함으로써 기사 분류 서비스를 제공하는 서비스 제공 서버;
상기 서비스 제공 서버로부터 상기 기사들을 제공받아 상기 기사들을 열람하는 단말; 및
상기 서비스 제공 서버로부터 상기 기사들을 수신하고, 순환 신경망과 합성곱 신경망을 함께 이용하여 상기 기사들 각각과 대응하는 적어도 하나의 주제에 상응하는 주제 가중치를 산출하는 딥러닝 뉴럴 네트워크 서버를 포함하되,
상기 서비스 제공 서버는,
상기 기사들 각각에서 키워드들을 추출하고, 추출된 키워드들을 상기 자연어 처리함으로써 상기 기사들 각각에 대응하는 적어도 하나의 주제와 대상 기업을 결정하고,
상기 적어도 하나의 주제는,
기업의 상장, 기업의 합병, 기업의 투자, 기업의 상품 출시, 기업의 실적, 기업의 업무제휴, 및 기업의 사장이나 임원급 인사 처리를 모두 포함하고,
상기 딥러닝 뉴럴 네트워크 서버는,
상기 서비스 제공 서버로부터 제1 기사 및 제1 기사와 대응하는 적어도 하나의 제1 주제를 수신하고, 상기 적어도 하나의 제1 주제와 대응하는 상기 주제 가중치를 결정하고,
상기 딥러닝 뉴럴 네트워크 서버는,
상기 적어도 하나의 제1 주제와 대응하도록 미리 결정된 복수의 제1 키워드들 중에서 상기 제1 기사에 포함된 상기 제1 키워드들과 각각 대응하는 보조 가중치들을 결정하는 순환 신경망;
상기 순환 신경망에서 출력된 상기 보조 가중치들을 이미지 형태의 데이터인 보조 가중치 이미지로 변환하는 이미지 변환부; 및
상기 보조 가중치 이미지를 입력받아 상기 적어도 하나의 제1 주제와 대응하는 주제 가중치를 결정하는 합성곱 신경망을 포함하되,
상기 이미지 변환부는,
상기 보조 가중치들 각각을 미리 설정된 p(상기 p는 2 이상의 자연수) 개의 단계들로 양자화하고, 양자화된 상기 보조 가중치들의 단계들을 상기 p개의 화소들로 구성된 열과 대응시키고, 하나의 행에 있는 상기 화소들을 q(상기 q는 1 이상의 자연수)개의 상기 제1 키워드들 각각과 대응시켜 p×q 의 크기를 갖는 격자형 이미지인 상기 보조 가중치 이미지를 생성하는, 기사 분류 시스템. - 삭제
- 삭제
- ◈청구항 4은(는) 설정등록료 납부시 포기되었습니다.◈청구항 1에서,
상기 서비스 제공 서버는,
상기 적어도 하나의 주제에 대하여 미리 설정된 주제 점수와 상기 딥러닝 뉴럴 네트워크 서버에 의해 산출된 상기 주제 가중치를 결정하고, 상기 대상 기업에 대하여 미리 설정된 기업 점수와 동적으로 설정되는 기업 가중치를 결정하는, 기사 분류 시스템. - ◈청구항 6은(는) 설정등록료 납부시 포기되었습니다.◈청구항 5에서,
상기 서비스 제공 서버는,
상기 대상 기업과 대응하는 회사 규모, 상기 기사들 중에서 상기 대상 기업에 대한 기사들의 개수, 및 상기 대상 기업이 속하는 산업군과 기술군 중 적어도 하나에 기초하여 상기 기업 가중치를 산출하는, 기사 분류 시스템. - 삭제
- 삭제
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200123717A KR102213763B1 (ko) | 2020-09-24 | 2020-09-24 | 자연어 처리와 딥러닝 네트워크를 이용하여 선별된 기사를 제공하는 방법 및 기사 분류 시스템 |
KR1020210014637A KR102358189B1 (ko) | 2020-09-24 | 2021-02-02 | 키워드 기반으로 선별된 기사를 제공하는 시스템 |
KR1020210014642A KR102358192B1 (ko) | 2020-09-24 | 2021-02-02 | 순환 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014647A KR102358195B1 (ko) | 2020-09-24 | 2021-02-02 | 선형 회귀 분석을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014643A KR102358194B1 (ko) | 2020-09-24 | 2021-02-02 | 합성곱 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014639A KR102358191B1 (ko) | 2020-09-24 | 2021-02-02 | 주제 가중치와 기업 가중치를 기초로 딥러닝 네트워크를 이용해 선별된 기사를 제공하기 위한 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200123717A KR102213763B1 (ko) | 2020-09-24 | 2020-09-24 | 자연어 처리와 딥러닝 네트워크를 이용하여 선별된 기사를 제공하는 방법 및 기사 분류 시스템 |
Related Child Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210014643A Division KR102358194B1 (ko) | 2020-09-24 | 2021-02-02 | 합성곱 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014637A Division KR102358189B1 (ko) | 2020-09-24 | 2021-02-02 | 키워드 기반으로 선별된 기사를 제공하는 시스템 |
KR1020210014647A Division KR102358195B1 (ko) | 2020-09-24 | 2021-02-02 | 선형 회귀 분석을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014639A Division KR102358191B1 (ko) | 2020-09-24 | 2021-02-02 | 주제 가중치와 기업 가중치를 기초로 딥러닝 네트워크를 이용해 선별된 기사를 제공하기 위한 시스템 |
KR1020210014642A Division KR102358192B1 (ko) | 2020-09-24 | 2021-02-02 | 순환 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102213763B1 true KR102213763B1 (ko) | 2021-02-08 |
Family
ID=74560139
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200123717A Active KR102213763B1 (ko) | 2020-09-24 | 2020-09-24 | 자연어 처리와 딥러닝 네트워크를 이용하여 선별된 기사를 제공하는 방법 및 기사 분류 시스템 |
KR1020210014639A Active KR102358191B1 (ko) | 2020-09-24 | 2021-02-02 | 주제 가중치와 기업 가중치를 기초로 딥러닝 네트워크를 이용해 선별된 기사를 제공하기 위한 시스템 |
KR1020210014647A Active KR102358195B1 (ko) | 2020-09-24 | 2021-02-02 | 선형 회귀 분석을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014642A Active KR102358192B1 (ko) | 2020-09-24 | 2021-02-02 | 순환 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014637A Active KR102358189B1 (ko) | 2020-09-24 | 2021-02-02 | 키워드 기반으로 선별된 기사를 제공하는 시스템 |
KR1020210014643A Active KR102358194B1 (ko) | 2020-09-24 | 2021-02-02 | 합성곱 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210014639A Active KR102358191B1 (ko) | 2020-09-24 | 2021-02-02 | 주제 가중치와 기업 가중치를 기초로 딥러닝 네트워크를 이용해 선별된 기사를 제공하기 위한 시스템 |
KR1020210014647A Active KR102358195B1 (ko) | 2020-09-24 | 2021-02-02 | 선형 회귀 분석을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014642A Active KR102358192B1 (ko) | 2020-09-24 | 2021-02-02 | 순환 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
KR1020210014637A Active KR102358189B1 (ko) | 2020-09-24 | 2021-02-02 | 키워드 기반으로 선별된 기사를 제공하는 시스템 |
KR1020210014643A Active KR102358194B1 (ko) | 2020-09-24 | 2021-02-02 | 합성곱 신경망을 이용하여 선별된 기사를 제공하는 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (6) | KR102213763B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886587A (zh) * | 2021-10-09 | 2022-01-04 | 杭州凡闻科技有限公司 | 一种基于深度学习的数据分类方法以及图谱的建立方法 |
CN114757170A (zh) * | 2022-04-19 | 2022-07-15 | 北京字节跳动网络技术有限公司 | 一种主题聚合方法、装置及电子设备 |
KR20230143038A (ko) | 2022-04-04 | 2023-10-11 | 한화오션 주식회사 | 자연어 처리 기반 선주 요청사항 업무분장 분류 시스템 및 이에 의한 분류 방법 그리고 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102671016B1 (ko) * | 2022-11-10 | 2024-05-31 | (주)비엔에스브랜딩 | 상표 제작 서비스 제공 방법, 장치 및 컴퓨터-판독가능 기록매체 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090014504A (ko) * | 2007-08-06 | 2009-02-11 | 한국과학기술원 | 매체 편향의 효과를 완화하는 뉴스 서비스 시스템 및 방법 |
KR20170004165A (ko) * | 2015-07-01 | 2017-01-11 | 지속가능발전소 주식회사 | 뉴스의 데이터마이닝을 통한 기업 평판 분석 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 |
-
2020
- 2020-09-24 KR KR1020200123717A patent/KR102213763B1/ko active Active
-
2021
- 2021-02-02 KR KR1020210014639A patent/KR102358191B1/ko active Active
- 2021-02-02 KR KR1020210014647A patent/KR102358195B1/ko active Active
- 2021-02-02 KR KR1020210014642A patent/KR102358192B1/ko active Active
- 2021-02-02 KR KR1020210014637A patent/KR102358189B1/ko active Active
- 2021-02-02 KR KR1020210014643A patent/KR102358194B1/ko active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090014504A (ko) * | 2007-08-06 | 2009-02-11 | 한국과학기술원 | 매체 편향의 효과를 완화하는 뉴스 서비스 시스템 및 방법 |
KR20170004165A (ko) * | 2015-07-01 | 2017-01-11 | 지속가능발전소 주식회사 | 뉴스의 데이터마이닝을 통한 기업 평판 분석 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 |
Non-Patent Citations (3)
Title |
---|
Savaş Yıldırım et al., Classification of "Hot News" for Financial Forecast Using NLP Techniques, 2018 IEEE International Conference on Big Data, 2018.12.10. <DOI: 10.1109/BigData.2018.8621903> * |
박대민, 뉴스 기사의 자연어처리, 커뮤니케이션 이론 12(1), 2016.3. 4-52pages.* * |
오승빈 외 2인, 순환 신경망과 합성곱 신경망을 이용한 뉴스 기사 편향도 분석, 한국정보통신학회논문지 24(8), 2020.08. 999-1005pages.* * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886587A (zh) * | 2021-10-09 | 2022-01-04 | 杭州凡闻科技有限公司 | 一种基于深度学习的数据分类方法以及图谱的建立方法 |
KR20230143038A (ko) | 2022-04-04 | 2023-10-11 | 한화오션 주식회사 | 자연어 처리 기반 선주 요청사항 업무분장 분류 시스템 및 이에 의한 분류 방법 그리고 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체 |
CN114757170A (zh) * | 2022-04-19 | 2022-07-15 | 北京字节跳动网络技术有限公司 | 一种主题聚合方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
KR102358191B1 (ko) | 2022-02-08 |
KR102358189B1 (ko) | 2022-02-08 |
KR102358194B1 (ko) | 2022-02-08 |
KR102358195B1 (ko) | 2022-02-08 |
KR102358192B1 (ko) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102213763B1 (ko) | 자연어 처리와 딥러닝 네트워크를 이용하여 선별된 기사를 제공하는 방법 및 기사 분류 시스템 | |
CN107463704B (zh) | 基于人工智能的搜索方法和装置 | |
Yu et al. | Attention-based convolutional approach for misinformation identification from massive and noisy microblog posts | |
US9449271B2 (en) | Classifying resources using a deep network | |
US11386318B2 (en) | Machine learning based webinterface production and deployment system | |
AU2019239454B2 (en) | Method and system for retrieving video temporal segments | |
CN111597446B (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
EP4134900A2 (en) | Method and apparatus for recommending content, method and apparatus for training ranking model, device, and storage medium | |
US12038958B1 (en) | System, method, and user interface for a search engine based on multi-document summarization | |
CN111382361A (zh) | 信息推送方法、装置、存储介质和计算机设备 | |
CN111625715B (zh) | 信息提取方法、装置、电子设备及存储介质 | |
Wang et al. | The monkeytyping solution to the youtube-8m video understanding challenge | |
CN114239730B (zh) | 一种基于近邻排序关系的跨模态检索方法 | |
CN113761220A (zh) | 信息获取方法、装置、设备及存储介质 | |
US12259934B2 (en) | Machine-learning-aided automatic taxonomy for web data | |
CN112800111B (zh) | 一种基于训练数据挖掘的位置预测方法 | |
Liu | The construction of a digital dissemination platform for the intangible cultural heritage using convolutional neural network models | |
CN113360769A (zh) | 信息查询方法、装置、电子设备以及存储介质 | |
CN107451194A (zh) | 一种图片搜索方法及装置 | |
CN112100345A (zh) | 是非类问答模型的训练方法、装置、电子设备及存储介质 | |
CN111931034A (zh) | 数据搜索方法、装置、设备及存储介质 | |
Rao et al. | A method for classifying information in education policy texts based on an improved attention mechanism model | |
Ruichen | [Retracted] The Basic Principles of Marxism with the Internet as a Carrier | |
CN117216361A (zh) | 推荐方法、装置、电子设备及计算机可读存储介质 | |
CN107391556A (zh) | 基于推荐应用的搜索方法、服务器及计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20200924 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20200925 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20200924 Patent event code: PA03021R01I Comment text: Patent Application |
|
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20201210 |
|
A107 | Divisional application of patent | ||
GRNT | Written decision to grant | ||
PA0107 | Divisional application |
Comment text: Divisional Application of Patent Patent event date: 20210202 Patent event code: PA01071R01D |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210202 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210202 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240206 Start annual number: 4 End annual number: 4 |