JP2011253572A - 情報価値を反映した情報検索方法及びその装置 - Google Patents
情報価値を反映した情報検索方法及びその装置 Download PDFInfo
- Publication number
- JP2011253572A JP2011253572A JP2011205200A JP2011205200A JP2011253572A JP 2011253572 A JP2011253572 A JP 2011253572A JP 2011205200 A JP2011205200 A JP 2011205200A JP 2011205200 A JP2011205200 A JP 2011205200A JP 2011253572 A JP2011253572 A JP 2011253572A
- Authority
- JP
- Japan
- Prior art keywords
- information
- similarity
- text
- search
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 239000002245 particle Substances 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明の一実施形態として、(1)グループ内に属する一つ以上の情報それぞれに含まれるテキスト情報を構成する単語ごとにその単語を含むテキスト情報の出現頻度を求め、前記テキスト情報の出現頻度が所定の閾値以下である情報を、前記前記グループから除いて得られる情報を、類似度を計算すべき対象情報として選定して前記選定された対象情報間の類似度を計算する段階と、(2)前記類似度に基づいて前記情報をグルーピングし、前記類似度に基づいて所定の閾値以上の類似性を有する同じ情報と判定された情報の個数に応じて、それぞれの情報の価値を計算する段階と、(3)前記計算された価値が反映された情報検索結果を表示する段階と、を含むことを特徴とする情報検索方法を提供する。
【選択図】図1
Description
単語Bの逆ファイル:DocID2,DocID3,DocID4,DocID5
単語Cの逆ファイル:DocID2,DocID3,DocID5,DocID6,DocID7
...
単語Jの逆ファイル:DocID2,DocID3,DocID5,DocID7,DocID10,...,DocID85
Claims (8)
- 情報検索方法であって、コンピュータにより実行されるステップが、
(a)テキスト情報を含む複数個の情報毎の各テキスト情報を構成する単語の数及び助詞の数に基づいて、前記複数個の情報を一つ以上のグループにグルーピングする第1グルーピング処理を遂行する段階と、
(b)前記グループ内に属する一つ以上の情報それぞれに含まれるテキスト情報を構成する単語ごとにその単語を含むテキスト情報の出現頻度を求め、前記テキスト情報の出現頻度が所定の閾値以下である情報を、前記グループから除いて得られる情報を、類似度を計算すべき対象情報として選定して前記選定された対象情報間の類似度を計算する段階と、
(c)前記類似度に基づいて前記情報をグルーピングする第2グルーピング処理を遂行するとともに、前記類似度に基づいて所定の閾値以上の類似性を有する同じ情報と判定された情報の個数に応じて、それぞれの情報の価値を計算する段階と、
(d)前記計算された価値が反映された情報検索結果を表示する段階と、
を含むことを特徴とする情報検索方法。 - 前記(b)段階は、
前記テキスト情報に含まれる題名及び本文内容を用いて前記情報間の類似度を計算することを特徴とする請求項1に記載の情報検索方法。 - 前記(a4)段階は、
前記本文内容によりも前記題名に対してより高い重み値を付与して前記類似度を計算することを特徴とする請求項2に記載の情報検索方法。 - 前記(c)段階は、
前記類似度に基づいて前記情報をグルーピングする前記第2グルーピング処理を遂行し、前記第2グルーピング処理によってグルーピングされたそれぞれのグループ内における前記類似度に基づいて所定の閾値以上の類似性を有する情報と判定された情報の個数に基づいてそれぞれの情報の価値を算出することを特徴とする請求項1から3のいずれか1項に記載の情報検索方法。 - 前記(c)段階は、
前記類似度に基づいて前記情報をグルーピングする前記第2グルーピング処理を遂行し、前記第2グルーピング処理によってグルーピングされたそれぞれのグループ内における情報の中から、最も最近の情報又はイメージを含んでいる情報を当該グループの代表文書として抽出することを特徴とする請求項1から4のいずれか1項に記載の情報検索方法。 - 前記(d)段階は、
ユーザからの検索語入力に応答して情報検索を遂行し、該情報検索の結果を、情報の価値の高い順に表示することを特徴とする請求項1から5のいずれか1つに記載の情報検索方法。 - 前記(d)段階は、
ユーザからの検索語入力がない場合には、予め定められた条件に基づいて最も価値の高い情報を含むグループの代表文書をユーザに表示することを特徴とする請求項1から5のいずれか1つに記載の情報検索方法。 - コンピュータに請求項1から7のいずれか1つに記載の情報検索方法を実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050064495A KR100645614B1 (ko) | 2005-07-15 | 2005-07-15 | 정보 가치 측정결과를 반영한 검색 방법 및 검색 장치 |
KR10-2005-0064495 | 2005-07-15 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521324A Division JP4896132B2 (ja) | 2005-07-15 | 2006-07-13 | 情報価値を反映した情報検索方法及びその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011253572A true JP2011253572A (ja) | 2011-12-15 |
JP4896268B2 JP4896268B2 (ja) | 2012-03-14 |
Family
ID=37654523
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521324A Active JP4896132B2 (ja) | 2005-07-15 | 2006-07-13 | 情報価値を反映した情報検索方法及びその装置 |
JP2011205200A Active JP4896268B2 (ja) | 2005-07-15 | 2011-09-20 | 情報価値を反映した情報検索方法及びその装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521324A Active JP4896132B2 (ja) | 2005-07-15 | 2006-07-13 | 情報価値を反映した情報検索方法及びその装置 |
Country Status (3)
Country | Link |
---|---|
JP (2) | JP4896132B2 (ja) |
KR (1) | KR100645614B1 (ja) |
WO (1) | WO2007011129A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9471548B2 (en) | 2012-08-10 | 2016-10-18 | International Business Machines Corporation | Text processing method, system and computer program |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5286712B2 (ja) * | 2007-08-17 | 2013-09-11 | 日本電気株式会社 | 情報評価装置、情報評価方法、及び情報評価プログラム |
JP5682113B2 (ja) * | 2010-01-22 | 2015-03-11 | カシオ計算機株式会社 | 情報表示装置およびプログラム |
KR101544142B1 (ko) * | 2010-04-06 | 2015-08-17 | 네이버 주식회사 | 화제도 기반의 검색 제공 방법 및 시스템 |
CN102411583B (zh) * | 2010-09-20 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种文本匹配方法及装置 |
JP5834815B2 (ja) * | 2011-11-22 | 2015-12-24 | 株式会社リコー | 情報処理装置、プログラムおよび文書を検索するための方法 |
KR101527198B1 (ko) * | 2012-01-06 | 2015-06-09 | (주)광개토연구소 | 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법 및 그 정보를 처리하는 특허 정보 시스템 |
JP2015092398A (ja) * | 2015-01-13 | 2015-05-14 | カシオ計算機株式会社 | 情報表示制御装置およびプログラム |
JP7267714B2 (ja) * | 2018-11-06 | 2023-05-02 | 株式会社東芝 | 知識情報作成支援装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003044490A (ja) * | 2001-07-30 | 2003-02-14 | Toshiba Corp | 知識分析システムおよび同システムにおける知識重複登録設定方法 |
JP2003263443A (ja) * | 2002-03-07 | 2003-09-19 | Fujitsu Ltd | 文書類似度算出装置、クラスタリング装置および文書抽出装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5924090A (en) * | 1997-05-01 | 1999-07-13 | Northern Light Technology Llc | Method and apparatus for searching a database of records |
US6012053A (en) * | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
KR20010104873A (ko) * | 2000-05-16 | 2001-11-28 | 임갑철 | 메타 검색엔진을 이용한 인터넷 사이트 검색 서비스 시스템 |
KR100643979B1 (ko) * | 2000-05-18 | 2006-11-13 | 엘지전자 주식회사 | 인터넷을 이용한 정보검색 결과 제공방법 |
KR100505848B1 (ko) * | 2002-10-02 | 2005-08-04 | 씨씨알 주식회사 | 검색 시스템 |
US7536408B2 (en) * | 2004-07-26 | 2009-05-19 | Google Inc. | Phrase-based indexing in an information retrieval system |
KR100685277B1 (ko) * | 2004-08-23 | 2007-02-22 | 현인호 | 검색엔진을 이용한 검색결과의 재구성 장치 및 방법 |
-
2005
- 2005-07-15 KR KR1020050064495A patent/KR100645614B1/ko active IP Right Grant
-
2006
- 2006-07-13 WO PCT/KR2006/002758 patent/WO2007011129A1/en active Application Filing
- 2006-07-13 JP JP2008521324A patent/JP4896132B2/ja active Active
-
2011
- 2011-09-20 JP JP2011205200A patent/JP4896268B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003044490A (ja) * | 2001-07-30 | 2003-02-14 | Toshiba Corp | 知識分析システムおよび同システムにおける知識重複登録設定方法 |
JP2003263443A (ja) * | 2002-03-07 | 2003-09-19 | Fujitsu Ltd | 文書類似度算出装置、クラスタリング装置および文書抽出装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9471548B2 (en) | 2012-08-10 | 2016-10-18 | International Business Machines Corporation | Text processing method, system and computer program |
US9652526B2 (en) | 2012-08-10 | 2017-05-16 | International Business Machines Corporation | Text processing method, system and computer program |
US10353932B2 (en) | 2012-08-10 | 2019-07-16 | International Business Machines Corporation | Text processing method, system and computer program |
Also Published As
Publication number | Publication date |
---|---|
WO2007011129A1 (en) | 2007-01-25 |
JP4896268B2 (ja) | 2012-03-14 |
KR100645614B1 (ko) | 2006-11-14 |
JP4896132B2 (ja) | 2012-03-14 |
JP2009500764A (ja) | 2009-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4896268B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
US9652537B2 (en) | Identifying terms associated with queries | |
TWI461939B (zh) | 補充文章內容之方法、設備、電腦可讀取紀錄媒體、電腦程式產品、以及電腦系統 | |
KR100898456B1 (ko) | 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템 | |
US8484179B2 (en) | On-demand search result details | |
US8886661B2 (en) | Information extraction system, information extraction method, information extraction program, and information service system | |
US20180004850A1 (en) | Method for inputting and processing feature word of file content | |
US20060212441A1 (en) | Full text query and search systems and methods of use | |
US9864768B2 (en) | Surfacing actions from social data | |
KR100706389B1 (ko) | 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치 | |
WO2012003191A1 (en) | Systems and methods for augmenting a keyword of a web pagr with video content | |
JP2011154668A (ja) | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 | |
WO2010014082A1 (en) | Method and apparatus for relating datasets by using semantic vectors and keyword analyses | |
Sun et al. | CWS: a comparative web search system | |
JP2020135891A (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
CN105653701A (zh) | 模型生成方法及装置、词语赋权方法及装置 | |
CN111538903B (zh) | 搜索推荐词确定方法、装置、电子设备及计算机可读介质 | |
CN114330329A (zh) | 一种业务内容搜索方法、装置、电子设备及存储介质 | |
KR20090120843A (ko) | 사용자 웹 사용 정보에 기반한 멀티 컨셉 네트워크 생성시스템 및 방법 | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
Brilakis et al. | Multimodal image retrieval from construction databases and model-based systems | |
JP2000331020A (ja) | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 | |
JP2010055164A (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
CN116431895A (zh) | 安全生产知识个性化推荐方法及系统 | |
KR101172487B1 (ko) | 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4896268 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150106 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |