KR20160002199A - 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템 - Google Patents
연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템 Download PDFInfo
- Publication number
- KR20160002199A KR20160002199A KR1020140081204A KR20140081204A KR20160002199A KR 20160002199 A KR20160002199 A KR 20160002199A KR 1020140081204 A KR1020140081204 A KR 1020140081204A KR 20140081204 A KR20140081204 A KR 20140081204A KR 20160002199 A KR20160002199 A KR 20160002199A
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- issue data
- keywords
- core
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000013075 data extraction Methods 0.000 claims abstract description 14
- 239000000284 extract Substances 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 5
- 230000001010 compromised effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 종래의 연관 검색어 추출 방법을 개념적으로 표현한 참조도면을 도시한다.
도 3은 실시예에 따른 이슈 데이터 시스템의 연관 검색어 추출 방법을 개념적으로 표현한 참조도면을 도시한다.
도 4는 실시예에 따른 이슈 데이터 시스템이 연관 키워드들 중에서 이슈 데이터를 추출하는 방법에 대한 참조도면을 도시한다.
도 5는 본 발명에 따른 연관 키워드를 이용한 이슈 데이터 추출방법에 따른 흐름도를 도시한다.
120 : 연관 키워드 추출부 130 : 이슈 데이터 추출부
140 : 부가정보 추출부 150 : 데이터베이스
Claims (8)
- 네트워크 접속되는 복수의 웹 페이지에 접속하여 키워드를 수집하는 이슈 데이터 추출 서버를 통해 수행되며,
웹 수집을 통해 웹 페이지에서의 노출 빈도를 참조하여 핵심 키워드를 추출하고, 상기 핵심 키워드와 동반 노출되는 복수의 연관 키워드를 추출하는 단계;
상기 연관 키워드들을 노출 빈도가 낮은 순위에 따라 정렬하는 단계; 및
상기 노출 빈도가 낮은 순위에 따라 정렬된 연관 키워드들 중 적어도 하나를 이슈 데이터로 분류하는 단계;를 포함하는 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출방법. - 제1항에 있어서,
상기 이슈 데이터는,
상기 노출 빈도가 가장 낮은 것부터 사용자 설정된 노출 빈도 순위에 대응하는 연관 키워드인 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출방법. - 제1항에 있어서,
상기 연관 키워드는,
동일 스트링(String) 내에서 상기 핵심 키워드와 동반 노출되는 키워드 또는 동일 웹 페이지 내에서 상기 핵심 키워드와 동반 노출되는 키워드 중 적어도 하나인 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출방법. - 제1항에 있어서,
상기 핵심 키워드는,
상기 웹 수집에 의해 노출 빈도가 가장 높은 것부터 사용자 설정된 노출 빈도 순위의 범위 내에서 설정되는 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출방법. - 네트워크 접속되는 복수의 웹 페이지에 접속하여 웹 페이지에 분포하는 키워드를 웹 페이지 또는 스트링(String) 단위로 수집하고, 상기 키워드들 중 노출 빈도가 가장 높은 것부터 사용자 설정된 제1노출 빈도 순위에 대응하는 키워드를 핵심 키워드로 분류하는 핵심 키워드 추출부;
상기 핵심 키워드와 상기 스트링 또는 상기 웹 페이지 단위로 동반 노출되는 연관 키워드를 추출하는 연관 키워드 추출부; 및
상기 연관 키워드 중 노출 빈도가 가장 낮은 노출 빈도 순위부터 사용자 설정된 제2노출 빈도 순위에 대응하는 것을 이슈 데이터로 분류하는 이슈 데이터 추출부;를 포함하는 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출 시스템. - 제5항에 있어서,
상기 이슈 데이터를 키워드로 하여 상기 이슈 데이터와 관련된 부가정보를 추출하는 부가정보 추출부;를 더 포함하는 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출 시스템. - 제5항에 있어서,
상기 웹 수집부는,
상기 웹 페이지에 둘 이상의 콘텐츠가 존재하는 경우, 각 콘텐츠별로 키워드를 추출하는 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출 시스템. - 제5항에 있어서,
상기 스트링은,
상기 핵심 키워드를 포함하는 문장 및 문단 중 어느 하나인 것을 특징으로 하는 연관 키워드를 이용한 이슈 데이터 추출 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140081204A KR101606758B1 (ko) | 2014-06-30 | 2014-06-30 | 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140081204A KR101606758B1 (ko) | 2014-06-30 | 2014-06-30 | 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160002199A true KR20160002199A (ko) | 2016-01-07 |
KR101606758B1 KR101606758B1 (ko) | 2016-03-28 |
Family
ID=55168894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140081204A Active KR101606758B1 (ko) | 2014-06-30 | 2014-06-30 | 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101606758B1 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108241699A (zh) * | 2016-12-26 | 2018-07-03 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
KR101941924B1 (ko) * | 2018-10-29 | 2019-01-25 | 주식회사 인라이플 | 자율 인지 신경망 기반 연관 모델 학습을 이용한 나노 의도 분석 서비스 제공 방법 |
KR101976841B1 (ko) * | 2018-10-29 | 2019-05-15 | 한경훈 | 자율 인지 신경망 기반 연관 모델 학습을 이용한 의사 결정 서비스 제공 방법 |
KR102001375B1 (ko) * | 2019-02-19 | 2019-07-18 | 미래에셋대우 주식회사 | 금융뉴스 스팸구별 장치 및 그 방법 |
KR102585107B1 (ko) * | 2023-03-21 | 2023-10-06 | 주식회사 중고나라 | 연관 검색어 관리 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100068532A (ko) * | 2008-12-15 | 2010-06-24 | 한국전자통신연구원 | 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법 |
US20120072406A1 (en) * | 2009-03-17 | 2012-03-22 | Fujitsu Limited | Search processing method and apparatus |
KR20130037976A (ko) * | 2011-10-07 | 2013-04-17 | 한국전자통신연구원 | 토픽 템플릿과 연관어에 기반한 관련토픽 및 경쟁토픽 탐지 시스템, 탐지 방법 및 탐지 장치 |
KR101318843B1 (ko) * | 2011-08-30 | 2013-10-17 | 성균관대학교산학협력단 | 시간 정보를 활용한 블로그 카테고리 분류 방법 및 장치 |
-
2014
- 2014-06-30 KR KR1020140081204A patent/KR101606758B1/ko active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100068532A (ko) * | 2008-12-15 | 2010-06-24 | 한국전자통신연구원 | 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법 |
US20120072406A1 (en) * | 2009-03-17 | 2012-03-22 | Fujitsu Limited | Search processing method and apparatus |
KR101318843B1 (ko) * | 2011-08-30 | 2013-10-17 | 성균관대학교산학협력단 | 시간 정보를 활용한 블로그 카테고리 분류 방법 및 장치 |
KR20130037976A (ko) * | 2011-10-07 | 2013-04-17 | 한국전자통신연구원 | 토픽 템플릿과 연관어에 기반한 관련토픽 및 경쟁토픽 탐지 시스템, 탐지 방법 및 탐지 장치 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108241699A (zh) * | 2016-12-26 | 2018-07-03 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN108241699B (zh) * | 2016-12-26 | 2022-03-11 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
KR101941924B1 (ko) * | 2018-10-29 | 2019-01-25 | 주식회사 인라이플 | 자율 인지 신경망 기반 연관 모델 학습을 이용한 나노 의도 분석 서비스 제공 방법 |
KR101976841B1 (ko) * | 2018-10-29 | 2019-05-15 | 한경훈 | 자율 인지 신경망 기반 연관 모델 학습을 이용한 의사 결정 서비스 제공 방법 |
KR102001375B1 (ko) * | 2019-02-19 | 2019-07-18 | 미래에셋대우 주식회사 | 금융뉴스 스팸구별 장치 및 그 방법 |
KR102585107B1 (ko) * | 2023-03-21 | 2023-10-06 | 주식회사 중고나라 | 연관 검색어 관리 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR101606758B1 (ko) | 2016-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lu et al. | Opinion integration through semi-supervised topic modeling | |
US9323827B2 (en) | Identifying key terms related to similar passages | |
WO2017020451A1 (zh) | 信息推送方法和装置 | |
CN112966009B (zh) | 脉络化知识面板 | |
Foley et al. | Learning to extract local events from the web | |
Zangerle et al. | Using tag recommendations to homogenize folksonomies in microblogging environments | |
US10025783B2 (en) | Identifying similar documents using graphs | |
CN103430172A (zh) | 检索装置、检索方法及程序 | |
KR101606758B1 (ko) | 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템 | |
CN104919457A (zh) | 用于丰富社交媒体以改进个性化用户体验的方法和装置 | |
US20160048575A1 (en) | System and method for topics extraction and filtering | |
US20150206101A1 (en) | System for determining infringement of copyright based on the text reference point and method thereof | |
US9904736B2 (en) | Determining key ebook terms for presentation of additional information related thereto | |
KR20110019131A (ko) | 소셜 관계를 이용한 정보 검색 장치 및 방법 | |
JP6130270B2 (ja) | メディアコンテンツに対応するコメント集合をソートして明示するコメントリスト公開サーバ、プログラム及び方法 | |
Xu et al. | Mining Web search engines for query suggestion | |
JP2014085694A (ja) | 検索装置、検索プログラムおよび検索方法 | |
Jatowt et al. | Multi-lingual analysis of future-related information on the web | |
Brenner et al. | MediaEval Benchmark: Social Event Detection in collaborative photo collections. | |
Djuana Tjhwa et al. | Learning personalized tag ontology from user tagging information | |
JP6152333B2 (ja) | メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法 | |
Baeza-Yates et al. | The new frontier of web search technology: Seven challenges | |
KR102434880B1 (ko) | 멀티미디어 플랫폼 기반 지식 공유 서비스 제공 시스템 | |
KR101308821B1 (ko) | 검색엔진용 키워드 추출 시스템 및 추출 방법 | |
KR101140263B1 (ko) | 텍스트 패턴 추출을 이용하여 웹문서를 정제하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20140630 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20150623 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160125 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20160316 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20160322 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20160323 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20190410 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20190410 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20200310 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20200310 Start annual number: 5 End annual number: 5 |
|
PC1903 | Unpaid annual fee | ||
PR0401 | Registration of restoration |
Patent event code: PR04011E01D Patent event date: 20211126 Comment text: Registration of Restoration |
|
PR1001 | Payment of annual fee |
Payment date: 20211126 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20220118 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20230131 Start annual number: 8 End annual number: 8 |