KR20110090354A - 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 - Google Patents
사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 Download PDFInfo
- Publication number
- KR20110090354A KR20110090354A KR1020100010078A KR20100010078A KR20110090354A KR 20110090354 A KR20110090354 A KR 20110090354A KR 1020100010078 A KR1020100010078 A KR 1020100010078A KR 20100010078 A KR20100010078 A KR 20100010078A KR 20110090354 A KR20110090354 A KR 20110090354A
- Authority
- KR
- South Korea
- Prior art keywords
- word
- classification tree
- directory
- similarity
- text data
- Prior art date
Links
- 238000004891 communication Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 title claims description 25
- 239000013598 vector Substances 0.000 claims abstract description 79
- 238000012549 training Methods 0.000 claims abstract description 18
- 239000000284 extract Substances 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 22
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 공개된 디렉토리 데이터를 가공하는 방법을 수식화한 도면이다.
도 3은 본 발명의 일 실시예에 따른 공개된 디렉토리 데이터를 가공하는 방법을 수식화한 도면이다.
도 4는 본 발명의 일 실시예에 따라 공개된 디렉토리 데이터를 가공하는 방법을 수식화한 도면이다.
도 5는 본 발명의 일실시예에 따른 오픈 디렉토리 프로젝트의 디렉토리 구조를 이용하여 생성된 주제 분류 트리의 일부를 나타낸다.
도 6은 본 발명의 일 실시예에 따른 학습 데이터 생성 단계를 수식화한 도면이다.
도 7은 본 발명의 일 실시예에 따른 각 노드에 생성된 학습 데이터에 대한 개념도이다.
도 8는 본 발명의 일 실시예에 따른 분류부의 구성을 수식화한 도면이다.
도 9는 본 발명의 일 실시예에 따른 사용자 관심 주제를 추출하는 휴대용 통신 단말기의 블록도이다.
도 10은 본 발명의 일 실시예에 따른 입력되는 데이터에서 텍스트 데이터를 추출하여 XML 형태로 저장하는 개념도이다.
도 11은 본 발명의 일 실시예에 따른 텍스트 데이터를 분석하여 단어 벡터를 생성하는 개념도이다.
도 12는 본 발명의 일 실시예에 따른 텍스트 데이터를 분석하여 유사도에 따라 사용자 관심 주제에 해당하는 노드명을 추출하는 개념도이다.
도 13은 본 발명의 일 실시예에 따른 주제 분류 트리를 생성하는 순서도이다.
도 14는 본 발명의 일 실시예에 따른 주제 분류 트리에서 사용자 관심 주제에 해당하는 노드명을 추출하는 순서도이다.
130: 학습 데이터 생성부 140: 분류부
210: 단어 벡터 생성부 220: 유사도 산출부
212: 단어 추출부 214: 단어 가중치 산출부
215: 주제 분류 트리 저장부 220: 유사도 산출부
230: 정보 저장부
Claims (10)
- 사용자 관심 주제를 추출하는 휴대용 통신 단말기에 있어서,
상기 휴대용 통신 단말기에 저장된 텍스트 데이터의 종류에 따라 각 텍스트 데이터를 대표하는 단어 벡터를 생성하는 단어 벡터 생성부,
하나 이상의 학습 데이터를 포함하고, 주제를 나타내는 복수의 노드가 트리 구조로 연결된 주제 분류 트리를 저장하는 주제 분류 트리 저장부 및
상기 단어 벡터와 상기 주제 분류 트리에 포함된 각 노드별 학습 데이터간의 유사도를 산출하는 유사도 산출부를 포함하되,
상기 유사도 산출부는 상기 유사도에 따라 상기 주제 분류 트리 중에서 사용자의 관심 주제를 대표할 노드명을 추출하는 것인 사용자 관심 주제를 추출하는 휴대용 통신 단말기. - 제 1 항에 있어서,
상기 단어 벡터 생성부는,
상기 텍스트 데이터로부터 단어를 추출하는 단어 추출부 및
상기 텍스트 데이터 내에서 사용되는 각 단어의 사용 빈도수, 및 상기 단어가 포함된 텍스트 데이터의 생성 시간에 기초하여 단어 가중치를 산출하는 단어 가중치 산출부를 포함하는 사용자 관심 주제를 추출하는 휴대용 통신 단말기. - 제 1 항에 있어서,
상기 유사도 산출부는,
상기 단어 벡터와 상기 주제 분류 트리의 각 노드에 포함된 학습 데이터간의 유사도를 산출하되,
상기 주제 분류 트리의 각 노드에 있어서 동일한 상위 노드에 속한 하위 노드들에 대해서는 각각의 유사도 값을 모두 합산하여 상기 상위 노드의 유사도 값으로 산출하는 것인 사용자 관심 주제를 추출하는 휴대용 통신 단말기. - 제 1 항에 있어서,
상기 유사도 산출부는,
상기 주제 분류 트리 중에서 상기 유사도가 가장 높은 노드명을 상기 사용자의 관심 주제로 추출하는 것인 사용자 관심 주제를 추출하는 휴대용 통신 단말기. - 제 1 항에 있어서,
공개된 디렉토리 데이터를 가공하여 상기 주제 분류 트리를 생성하는 주제 분류 트리 생성부,
상기 공개된 디렉토리 데이터 중 각 디렉토리에 포함되는 웹 사이트의 텍스트 데이터 정보에 기초하여 각 디렉토리를 대표하는 상기 학습 데이터를 생성하는 학습 데이터 생성부 및
상기 학습 데이터를 상기 주제 분류 트리에 포함된 디렉토리에 대응시키는 분류부를 더 포함하는 사용자 관심 주제를 추출하는 휴대용 통신 단말기. - 제 1 항 내지 제 5 항 중 하나의 항에 있어서,
상기 텍스트 데이터는,
상기 휴대용 통신 단말기에서 생성되는 문자 메시지, 파일명, 이메일, 모바일 웹 사용 히스토리 중 하나 이상에서 추출된 텍스트 데이터인 것인 사용자 관심 주제를 추출하는 휴대용 통신 단말기. - 사용자 관심 주제 추출 방법에 있어서,
단어 추출부가 휴대용 통신 단말기에 저장된 텍스트 데이터로부터 단어를 추출하는 단계,
단어 가중치 산출부가 상기 텍스트 데이터 내에서 사용되는 각 단어의 사용 빈도수, 및 상기 단어가 포함된 텍스트 데이터의 생성 시간에 기초하여 단어 가중치를 산출하는 단계,
단어 벡터 생성부가 상기 단어 가중치를 기초로 상기 텍스트 데이터의 종류에 따라 각 텍스트 데이터를 대표하는 단어 벡터를 생성하는 단계 및
유사도 산출부가 하나 이상의 학습 데이터를 포함하고 주제를 나타내는 복수의 노드가 트리 구조로 연결된 주제 분류 트리에 포함된 각 노드별 학습 데이터와 상기 단어 벡터간의 유사도를 산출하는 단계를 포함하되,
상기 유사도 산출부는 산출된 상기 유사도에 따라 상기 주제 분류 트리 중에서 사용자의 관심 주제를 대표할 노드명을 추출하는 것인 사용자 관심 주제 추출 방법. - 제 7 항에 있어서,
상기 유사도 산출부는,
상기 주제 분류 트리의 각 노드에 있어서 동일한 상위 노드에 속한 하위 노드들에 대해서는 각각의 유사도 값을 모두 합산하여 상기 상위 노드의 유사도 값으로 산출하는 것인 사용자 관심 주제 추출 방법. - 제 7 항에 있어서,
상기 유사도 산출부는,
상기 주제 분류 트리 중에서 상기 유사도가 가장 높은 노드명을 상기 사용자의 관심 주제로 추출하는 것인 사용자 관심 주제 추출 방법. - 제 7 항에 있어서,
상기 텍스트 데이터를 추출하는 단계에 앞서서, 상기 주제 분류 트리를 생성하는 단계를 포함하되,
상기 주제 분류 트리를 생성하는 단계는,
공개 디렉토리 데이터 수집부가 공개되어 있는 각종 디렉토리 및 각 디렉토리에 포함되는 웹 페이지 정보를 수집하는 단계,
주제 분류 트리 생성부가 상기 수집된 디렉토리 데이터를 가공하여 상기 주제 분류 트리를 생성하는 단계,
학습 데이터 생성부가 상기 수집된 디렉토리 데이터 중 각 디렉토리에 포함되는 웹 사이트의 텍스트 데이터 정보에 기초하여 각 디렉토리를 대표하는 상기 학습 데이터를 생성하는 단계 및
분류부가 디렉토리별 상기 학습 데이터를 상기 주제 분류 트리에 포함된 디렉토리에 대응시키는 단계를 포함하는 사용자 관심 주제 추출 방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100010078A KR101095069B1 (ko) | 2010-02-03 | 2010-02-03 | 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 |
US13/577,149 US9323845B2 (en) | 2010-02-03 | 2011-01-31 | Portable communication terminal for extracting subjects of interest to the user, and a method therefor |
PCT/KR2011/000663 WO2011096690A2 (ko) | 2010-02-03 | 2011-01-31 | 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 |
EP11739986.5A EP2533430B1 (en) | 2010-02-03 | 2011-01-31 | Portable communication terminal for extracting subjects of interest to the user, and a method therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100010078A KR101095069B1 (ko) | 2010-02-03 | 2010-02-03 | 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110090354A true KR20110090354A (ko) | 2011-08-10 |
KR101095069B1 KR101095069B1 (ko) | 2011-12-20 |
Family
ID=44355938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100010078A KR101095069B1 (ko) | 2010-02-03 | 2010-02-03 | 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9323845B2 (ko) |
EP (1) | EP2533430B1 (ko) |
KR (1) | KR101095069B1 (ko) |
WO (1) | WO2011096690A2 (ko) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013187587A1 (ko) * | 2012-06-13 | 2013-12-19 | 포항공과대학교 산학협력단 | 데이터 샘플링 방법 및 장치 |
KR101401175B1 (ko) * | 2012-12-28 | 2014-05-29 | 성균관대학교산학협력단 | 가중치 tf 기법을 이용한 텍스트 마이닝 방법 및 시스템 |
WO2015037815A1 (ko) * | 2013-09-16 | 2015-03-19 | 고려대학교 산학협력단 | 스마트 기기 내 시맨틱 검색 시스템 및 검색방법 |
WO2015037814A1 (ko) * | 2013-09-16 | 2015-03-19 | 고려대학교 산학협력단 | 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법 |
KR101508583B1 (ko) * | 2013-09-16 | 2015-04-14 | 고려대학교 산학협력단 | 스마트 기기 내 시맨틱 검색 시스템 및 검색방법 |
WO2016186362A1 (ko) * | 2015-05-19 | 2016-11-24 | 트윈워드 주식회사 | 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법 |
CN112101008A (zh) * | 2020-09-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种文本热度确定方法、装置、电子设备和存储介质 |
CN112100360A (zh) * | 2020-10-30 | 2020-12-18 | 北京淇瑀信息科技有限公司 | 一种基于向量检索的对话应答方法、装置和系统 |
KR20210015524A (ko) * | 2019-08-02 | 2021-02-10 | 삼성전자주식회사 | 사용자 관심도의 산출 방법 및 이를 지원하는 전자 장치 |
KR20210086820A (ko) * | 2019-12-30 | 2021-07-09 | 주식회사 에비드넷 | 위계정보를 이용한 표준화된 용어 추천 방법 및 장치 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9582767B2 (en) * | 2012-05-16 | 2017-02-28 | Excalibur Ip, Llc | Media recommendation using internet media stream modeling |
CN106202124B (zh) * | 2015-05-08 | 2019-12-31 | 广州市动景计算机科技有限公司 | 网页分类方法及装置 |
CN106372086B (zh) * | 2015-07-23 | 2019-12-03 | 华中师范大学 | 一种获取词向量的方法和装置 |
CN109582790A (zh) * | 2018-11-13 | 2019-04-05 | 深圳市康拓普信息技术有限公司 | 一种基于名称高效核对不同系统中的电力设备的方法及装置 |
CN109684554B (zh) * | 2018-12-26 | 2021-07-20 | 腾讯科技(深圳)有限公司 | 新闻的潜在用户的确定方法及新闻推送方法 |
US11017179B2 (en) | 2018-12-28 | 2021-05-25 | Open Text Sa Ulc | Real-time in-context smart summarizer |
CN110097395B (zh) * | 2019-03-27 | 2023-05-26 | 平安科技(深圳)有限公司 | 定向广告投放方法、装置及计算机可读存储介质 |
US11003840B2 (en) | 2019-06-27 | 2021-05-11 | Open Text Corporation | System and method for in-context document composition using subject metadata queries |
US11423114B2 (en) | 2019-11-07 | 2022-08-23 | Open Text Holdings, Inc. | Content management systems for providing automated generation of content suggestions |
US11256735B2 (en) | 2019-11-07 | 2022-02-22 | Open Text Holdings, Inc. | Content management systems providing automated generation of content summaries |
US11620351B2 (en) | 2019-11-07 | 2023-04-04 | Open Text Holdings, Inc. | Content management methods for providing automated generation of content summaries |
US11216521B2 (en) * | 2019-11-07 | 2022-01-04 | Open Text Holdings, Inc. | Content management methods for providing automated generation of content suggestions |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7912868B2 (en) | 2000-05-02 | 2011-03-22 | Textwise Llc | Advertisement placement method and system using semantic analysis |
US20030074409A1 (en) * | 2001-10-16 | 2003-04-17 | Xerox Corporation | Method and apparatus for generating a user interest profile |
WO2006121542A2 (en) * | 2005-04-05 | 2006-11-16 | Ai Limited | Systems and methods for semantic knowledge assessment, instruction, and acquisition |
KR100832859B1 (ko) * | 2006-08-30 | 2008-05-28 | 한양대학교 산학협력단 | 모바일 웹 콘텐츠 서비스 시스템 및 그 방법 |
KR101112989B1 (ko) | 2008-04-11 | 2012-04-23 | 한국전자통신연구원 | 지능형 정보 서비스를 위한 계층적 문서 분류 장치 및 방법 |
-
2010
- 2010-02-03 KR KR1020100010078A patent/KR101095069B1/ko active IP Right Grant
-
2011
- 2011-01-31 US US13/577,149 patent/US9323845B2/en active Active
- 2011-01-31 EP EP11739986.5A patent/EP2533430B1/en active Active
- 2011-01-31 WO PCT/KR2011/000663 patent/WO2011096690A2/ko active Application Filing
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013187587A1 (ko) * | 2012-06-13 | 2013-12-19 | 포항공과대학교 산학협력단 | 데이터 샘플링 방법 및 장치 |
KR101350782B1 (ko) * | 2012-06-13 | 2014-01-16 | 포항공과대학교 산학협력단 | 데이터 샘플링 방법 및 장치 |
KR101401175B1 (ko) * | 2012-12-28 | 2014-05-29 | 성균관대학교산학협력단 | 가중치 tf 기법을 이용한 텍스트 마이닝 방법 및 시스템 |
WO2015037815A1 (ko) * | 2013-09-16 | 2015-03-19 | 고려대학교 산학협력단 | 스마트 기기 내 시맨틱 검색 시스템 및 검색방법 |
WO2015037814A1 (ko) * | 2013-09-16 | 2015-03-19 | 고려대학교 산학협력단 | 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법 |
KR101508583B1 (ko) * | 2013-09-16 | 2015-04-14 | 고려대학교 산학협력단 | 스마트 기기 내 시맨틱 검색 시스템 및 검색방법 |
WO2016186362A1 (ko) * | 2015-05-19 | 2016-11-24 | 트윈워드 주식회사 | 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법 |
KR20160136054A (ko) * | 2015-05-19 | 2016-11-29 | 트윈워드 주식회사 | 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법 |
KR20210015524A (ko) * | 2019-08-02 | 2021-02-10 | 삼성전자주식회사 | 사용자 관심도의 산출 방법 및 이를 지원하는 전자 장치 |
KR20210086820A (ko) * | 2019-12-30 | 2021-07-09 | 주식회사 에비드넷 | 위계정보를 이용한 표준화된 용어 추천 방법 및 장치 |
CN112101008A (zh) * | 2020-09-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 一种文本热度确定方法、装置、电子设备和存储介质 |
CN112100360A (zh) * | 2020-10-30 | 2020-12-18 | 北京淇瑀信息科技有限公司 | 一种基于向量检索的对话应答方法、装置和系统 |
CN112100360B (zh) * | 2020-10-30 | 2024-02-02 | 北京淇瑀信息科技有限公司 | 一种基于向量检索的对话应答方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2011096690A2 (ko) | 2011-08-11 |
KR101095069B1 (ko) | 2011-12-20 |
WO2011096690A3 (ko) | 2011-12-15 |
EP2533430A4 (en) | 2015-11-18 |
US9323845B2 (en) | 2016-04-26 |
EP2533430A2 (en) | 2012-12-12 |
US20130073569A1 (en) | 2013-03-21 |
EP2533430B1 (en) | 2020-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101095069B1 (ko) | 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 | |
CN106383887B (zh) | 一种环保新闻数据采集和推荐展示的方法及系统 | |
CN109299271B (zh) | 训练样本生成、文本数据、舆情事件分类方法及相关设备 | |
Liu et al. | Identifying web spam with the wisdom of the crowds | |
KR100930455B1 (ko) | 쿼리별 검색 컬렉션 생성 방법 및 시스템 | |
KR20100107610A (ko) | 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법 | |
Alsaqer et al. | Movie review summarization and sentiment analysis using rapidminer | |
KR20130022042A (ko) | 토픽별 오피니언과 소셜 영향력자를 기반으로 토픽을 탐지하고 추적하는 시스템 및 방법 | |
Al-Safadi et al. | Developing ontology for Arabic blogs retrieval | |
Wu et al. | Efficient near-duplicate detection for q&a forum | |
Chasin et al. | Extracting and displaying temporal and geospatial entities from articles on historical events | |
CN104899306A (zh) | 信息处理方法、信息显示方法及装置 | |
Jagtap et al. | Misinformation detection on YouTube using video captions | |
JP6047365B2 (ja) | 検索装置、検索プログラムおよび検索方法 | |
CN109948154A (zh) | 一种基于邮箱名的人物获取及关系推荐系统和方法 | |
Moumtzidou et al. | Discovery of environmental nodes in the web | |
Comber et al. | Semantic analysis of citizen sensing, crowdsourcing and VGI | |
Ozkan et al. | A large-scale database of images and captions for automatic face naming | |
CN114238735B (zh) | 一种互联网数据智能采集方法 | |
Samah et al. | TF-IDF and Data Visualization For Syafie Madhhab Hadith Scriptures Authenticity | |
Ha et al. | Automatic classification for vietnamese news | |
Sreeja et al. | Review of web crawlers | |
CN103530418A (zh) | 信息搜索与发布方法与系统 | |
Sabetghadam et al. | Reachability analysis of graph modelled collections | |
Wen et al. | Automatic Web page classification using various features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20100203 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20110407 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20111128 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20111209 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20111212 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20151030 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20151030 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160928 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20160928 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20181120 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20181120 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20201122 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20211121 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20230912 Start annual number: 13 End annual number: 13 |
|
PR1001 | Payment of annual fee |
Payment date: 20240910 Start annual number: 14 End annual number: 14 |