KR100645614B1 - 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 - Google Patents
정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 Download PDFInfo
- Publication number
- KR100645614B1 KR100645614B1 KR1020050064495A KR20050064495A KR100645614B1 KR 100645614 B1 KR100645614 B1 KR 100645614B1 KR 1020050064495 A KR1020050064495 A KR 1020050064495A KR 20050064495 A KR20050064495 A KR 20050064495A KR 100645614 B1 KR100645614 B1 KR 100645614B1
- Authority
- KR
- South Korea
- Prior art keywords
- information
- document
- similarity
- text
- documents
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (15)
- (a) 복수개의 정보들간의 유사도를 계산하는 단계;(b) 상기 유사도 계산 결과에 따라 동일한 정보들끼리 분류하고, 실질적으로 동일한 정보로 판정된 정보들의 개수에 따라 각각의 정보의 가치를 계산하는 단계; 및(c) 상기 계산된 가치를 정보 검색이나 정보 추천에 반영하여 그 결과를 디스플레이 하는 단계를 포함하는 것을 특징으로 하는 검색 방법.
- 제1항에 있어서,상기 정보는 텍스트 정보인 것을 특징으로 하는 검색 방법.
- 제2항에 있어서, 상기 (a) 단계는상기 정보들의 제목, 본문 내용을 이용하여 상기 텍스트 정보들간의 유사도를 계산하는 것을 특징으로 하는 검색 방법.
- 제3항에 있어서, 상기 (a) 단계는(a1) 상기 텍스트 정보에 포함된 단어의 수 및 조사의 수에 따라 상기 텍스트 정보를 분할하는 단계;(a2) 상기 분할된 그룹내에서의 단어들 각각에 대한 역파일을 생성하는 단계;(a3) 상기 역파일을 분석하여 소정의 임계값 이하의 빈도를 갖는 텍스트 정보를 제거하여 유사도를 계산할 텍스트 정보를 선정하는 단계; 및(a4) 상기 선정된 텍스트 정보들간의 유사도를 계산하여, 실질적으로 동일한 텍스트 정보로 판정된 정보들을 하나의 그룹으로 묶는 단계를 포함하는 것을 특징으로 하는 검색 방법.
- 제4항에 있어서,상기 (a4) 단계에서의 유사도 계산시에 본문 내용보다 제목에 가중치를 두어 유사도를 계산하는 것을 특징으로 하는 검색 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 (b) 단계는상기 유사도 계산 결과에 따라 실질적으로 동일한 정보들끼리 분류하고, 각각의 분류된 그룹내에서 실질적으로 동일한 정보로 판정된 정보들의 개수가 많을수록 가치가 높은 정보로 계산하는 것을 특징으로 하는 검색 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 (b) 단계는상기 유사도 계산 결과에 따라 동일한 정보들끼리 분류하고, 각각의 분류된 그룹내에서의 정보중에서 가장 최근에 생성되었거나 이미지를 포함하고 있는 문서를 해당 그룹의 대표문서로 추출하는 것을 특징으로 하는 검색 방법.
- 제1항에 있어서, 상기 (c) 단계는사용자로부터 검색어를 입력받아 정보 검색을 수행하되, 검색 결과들 중에서 가장 가치가 높은 정보 순으로 디스플레이 하는 것을 특징으로 하는 검색 방법.
- 제1항에 있어서, 상기 (c) 단계는사용자로부터의 입력 검색어가 없는 경우에는, 가장 가치가 높은 정보가 속한 그룹의 대표문서를 소정의 설정에 따라 사용자에게 디스플레이 하는 것을 특징으로 하는 검색 방법.
- 삭제
- 수집된 인터넷상의 정보들중에서 텍스트 정보를 저장하는 텍스트 문서 저장 부;상기 텍스트 문서들간의 유사도를 계산하는 유사도 분석부;상기 유사도 분석결과에 따라 동일한 문서로 판정된 문서들을 하나의 그룹으로 묶고 그 그룹내에서 대표 문서를 추출하는 대표문서 추출부;상기 유사도 분석결과에 따라 유사한 문서로 판정된 문서들을 추출하는 유사문서 추출부; 및입력받은 검색어에 대응되는 대표문서와 유사문서를 제공하되, 대표문서들중에서 그 출현 빈도가 가장 높은 정보 순으로 출력위치를 조정하여 디스플레이 하고 상기 유사문서를 볼 수 있는 링크를 제공하는 것을 특징으로 하는 검색부를 포함하는 것을 특징으로 하는 검색 장치.
- 제11항에 있어서,상기 대표문서 추출부에서 추출된 대표문서들 중에서 그 출현 빈도가 일정한 값 이상 되는 경우 가치 있는 정보로 판단하여 사용자의 요청없이도 출력하는 정보 추천부를 더 포함하는 것을 특징으로 하는 검색 장치.
- 제11항에 있어서, 상기 유사도 분석부는상기 텍스트 문서에 포함된 단어의 수 및 조사의 수에 따라 상기 텍스트 문서를 그룹핑하고, 상기 단어들 각각에 대한 역파일을 생성하고 이를 분석하여 소정의 임계값 이하의 빈도를 갖는 텍스트 문서를 제거하여 유사도를 계산할 텍스트 문 서를 선정하여 이들 문서들간의 유사도를 계산하여, 동일한 텍스트 문서로 판정된 문서들을 하나의 그룹으로 묶고 유사한 텍스트 문서를 유사문서로 출력하는 것을 특징으로 하는 검색 장치.
- 제13항에 있어서,상기 유사도의 계산시에 본문 내용보다 제목에 가중치를 두어 유사도를 계산하는 것을 특징으로 하는 검색 장치.
- 제1항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050064495A KR100645614B1 (ko) | 2005-07-15 | 2005-07-15 | 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 |
JP2008521324A JP4896132B2 (ja) | 2005-07-15 | 2006-07-13 | 情報価値を反映した情報検索方法及びその装置 |
PCT/KR2006/002758 WO2007011129A1 (en) | 2005-07-15 | 2006-07-13 | Information search method and information search apparatus on which information value is reflected |
JP2011205200A JP4896268B2 (ja) | 2005-07-15 | 2011-09-20 | 情報価値を反映した情報検索方法及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050064495A KR100645614B1 (ko) | 2005-07-15 | 2005-07-15 | 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100645614B1 true KR100645614B1 (ko) | 2006-11-14 |
Family
ID=37654523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050064495A KR100645614B1 (ko) | 2005-07-15 | 2005-07-15 | 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 |
Country Status (3)
Country | Link |
---|---|
JP (2) | JP4896132B2 (ko) |
KR (1) | KR100645614B1 (ko) |
WO (1) | WO2007011129A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101527198B1 (ko) * | 2012-01-06 | 2015-06-09 | (주)광개토연구소 | 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법 및 그 정보를 처리하는 특허 정보 시스템 |
KR101544142B1 (ko) * | 2010-04-06 | 2015-08-17 | 네이버 주식회사 | 화제도 기반의 검색 제공 방법 및 시스템 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5286712B2 (ja) * | 2007-08-17 | 2013-09-11 | 日本電気株式会社 | 情報評価装置、情報評価方法、及び情報評価プログラム |
JP5682113B2 (ja) * | 2010-01-22 | 2015-03-11 | カシオ計算機株式会社 | 情報表示装置およびプログラム |
CN102411583B (zh) * | 2010-09-20 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种文本匹配方法及装置 |
JP5834815B2 (ja) * | 2011-11-22 | 2015-12-24 | 株式会社リコー | 情報処理装置、プログラムおよび文書を検索するための方法 |
JP5921379B2 (ja) | 2012-08-10 | 2016-05-24 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | テキスト処理方法、システム及びコンピュータ・プログラム。 |
JP2015092398A (ja) * | 2015-01-13 | 2015-05-14 | カシオ計算機株式会社 | 情報表示制御装置およびプログラム |
JP7267714B2 (ja) * | 2018-11-06 | 2023-05-02 | 株式会社東芝 | 知識情報作成支援装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010104873A (ko) * | 2000-05-16 | 2001-11-28 | 임갑철 | 메타 검색엔진을 이용한 인터넷 사이트 검색 서비스 시스템 |
KR20010105842A (ko) * | 2000-05-18 | 2001-11-29 | 구자홍 | 인터넷을 이용한 정보검색 결과 제공방법 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5924090A (en) * | 1997-05-01 | 1999-07-13 | Northern Light Technology Llc | Method and apparatus for searching a database of records |
US6012053A (en) * | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
JP2003044490A (ja) * | 2001-07-30 | 2003-02-14 | Toshiba Corp | 知識分析システムおよび同システムにおける知識重複登録設定方法 |
JP4142881B2 (ja) * | 2002-03-07 | 2008-09-03 | 富士通株式会社 | 文書類似度算出装置、クラスタリング装置および文書抽出装置 |
KR100505848B1 (ko) * | 2002-10-02 | 2005-08-04 | 씨씨알 주식회사 | 검색 시스템 |
US7536408B2 (en) * | 2004-07-26 | 2009-05-19 | Google Inc. | Phrase-based indexing in an information retrieval system |
KR100685277B1 (ko) * | 2004-08-23 | 2007-02-22 | 현인호 | 검색엔진을 이용한 검색결과의 재구성 장치 및 방법 |
-
2005
- 2005-07-15 KR KR1020050064495A patent/KR100645614B1/ko active IP Right Grant
-
2006
- 2006-07-13 WO PCT/KR2006/002758 patent/WO2007011129A1/en active Application Filing
- 2006-07-13 JP JP2008521324A patent/JP4896132B2/ja active Active
-
2011
- 2011-09-20 JP JP2011205200A patent/JP4896268B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010104873A (ko) * | 2000-05-16 | 2001-11-28 | 임갑철 | 메타 검색엔진을 이용한 인터넷 사이트 검색 서비스 시스템 |
KR20010105842A (ko) * | 2000-05-18 | 2001-11-29 | 구자홍 | 인터넷을 이용한 정보검색 결과 제공방법 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101544142B1 (ko) * | 2010-04-06 | 2015-08-17 | 네이버 주식회사 | 화제도 기반의 검색 제공 방법 및 시스템 |
KR101527198B1 (ko) * | 2012-01-06 | 2015-06-09 | (주)광개토연구소 | 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법 및 그 정보를 처리하는 특허 정보 시스템 |
Also Published As
Publication number | Publication date |
---|---|
WO2007011129A1 (en) | 2007-01-25 |
JP4896268B2 (ja) | 2012-03-14 |
JP2011253572A (ja) | 2011-12-15 |
JP4896132B2 (ja) | 2012-03-14 |
JP2009500764A (ja) | 2009-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100645614B1 (ko) | 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 | |
TWI472720B (zh) | 興趣點資訊地圖呈現系統、方法及其記錄媒體 | |
US9146999B2 (en) | Search keyword improvement apparatus, server and method | |
KR100706389B1 (ko) | 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치 | |
US9158846B2 (en) | Entity detection and extraction for entity cards | |
CN103678576B (zh) | 基于动态语义分析的全文检索系统 | |
KR100898456B1 (ko) | 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템 | |
US8886661B2 (en) | Information extraction system, information extraction method, information extraction program, and information service system | |
US20120102017A1 (en) | Media discovery and playlist generation | |
US20130110839A1 (en) | Constructing an analysis of a document | |
EP1391834A2 (en) | Document retrieval system and question answering system | |
US20090055390A1 (en) | Information sorting device and information retrieval device | |
US20150172299A1 (en) | Indexing and retrieval of blogs | |
JP2011154668A (ja) | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 | |
KR101355945B1 (ko) | 온라인 문맥기반 광고 장치 및 방법 | |
JP2004280661A (ja) | 検索方法及びプログラム | |
KR20090017268A (ko) | 사용자의 관심 키워드를 업데이트 하는 방법과 그 방법을수행하기 위한 시스템 | |
JP2008084193A (ja) | インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム | |
CN111538903A (zh) | 搜索推荐词确定方法、装置、电子设备及计算机可读介质 | |
KR101011726B1 (ko) | 스니펫 제공 장치 및 방법 | |
CN111753526A (zh) | 一种相似竞品数据分析方法及系统 | |
CN106919649B (zh) | 一种词条权重计算的方法及装置 | |
KR101008877B1 (ko) | 디지털 포렌식에서의 검색 및 검색 결과를 제시하는 방법, 그리고 그 장치 | |
JP2000331020A (ja) | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 | |
JP4009937B2 (ja) | 文書検索装置、文書検索プログラム及び文書検索プログラムを記録した媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20111010 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131001 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140925 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20151106 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20161025 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20171025 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20181105 Year of fee payment: 13 |