JP2015088190A - リアルタイム検索実現方法およびそのシステム - Google Patents
リアルタイム検索実現方法およびそのシステム Download PDFInfo
- Publication number
- JP2015088190A JP2015088190A JP2014219919A JP2014219919A JP2015088190A JP 2015088190 A JP2015088190 A JP 2015088190A JP 2014219919 A JP2014219919 A JP 2014219919A JP 2014219919 A JP2014219919 A JP 2014219919A JP 2015088190 A JP2015088190 A JP 2015088190A
- Authority
- JP
- Japan
- Prior art keywords
- time
- index
- document
- real
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000010586 diagram Methods 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【解決手段】リアルタイム検索方法は、複数の文書からなる文書コレクションを、文書が登録された時間を基準として時間区間別に分けて複数の文書グループに分割し、前記文書グループそれぞれに対して該当する時間区間の周期に応じて索引を実行し、前記索引による索引データを利用して前記文書コレクションに対する検索を実行することを含んでもよい。
【選択図】図1
Description
520:索引部
530:検索部
Claims (18)
- 複数の文書からなる文書コレクションを、文書が登録された時間を基準として時間区間別に分けて複数の文書グループに分割し、
前記複数の文書グループそれぞれに対して該当する時間区間の周期に応じて索引を実行し、
前記索引による索引データを利用して前記文書コレクションに対する検索を実行すること
を含む、リアルタイム検索方法。 - 前記複数の文書グループに分割することは、
隣接する時間区間の間に重なる時間が存在するように前記時間区間を分けること
を特徴とする、請求項1に記載のリアルタイム検索方法。 - 前記複数の文書グループに分割することは、
前記時間区間のうち直近の時間区間である最近区間を最も短い時間周期で設定し、前記最近区間を基準とし、以後の時間区間の場合には時間の経過に応じて漸次的に長い時間周期で設定すること
を特徴とする、請求項1に記載のリアルタイム検索方法。 - 前記索引を実行することは、
前記文書グループのうち直近の時間区間である最近区間に該当する文書グループの場合には無限ループ(infinite loop)で索引を実行し、前記最近区間に該当する文書グループの索引結果を持続してアップデートすること
を特徴とする、請求項1に記載のリアルタイム検索方法。 - 前記索引を実行することは、
語節単位索引技法、形態素単位索引技法、およびNグラム(N−Gram)基盤索引技法のうちいずれか1つを利用して索引を実行すること
を特徴とする、請求項1に記載のリアルタイム検索方法。 - 前記複数の文書グループに分割することは、
前記文書グループのうち直近の時間区間である最近区間に該当する文書グループに含まれた文書の数が基準値を超過する場合には、該当の文書グループを複数の小グループに分割すること
を特徴とする、請求項1に記載のリアルタイム検索方法。 - 前記索引を実行することは、
前記最近区間に該当する文書グループに対して前記複数の小グループを並列に同時索引すること
を特徴とする、請求項6に記載のリアルタイム検索方法。 - 前記文書コレクションに対する検索を実行することは、
前記索引データを利用した検索結果から前記文書グループ間に前記重なった時間によって重複する検索結果を取り除いた後、最終的な検索結果を提供すること
を特徴とする、請求項2に記載のリアルタイム検索方法。 - コンピュータシステムに、
複数の文書からなる文書コレクションを、文書が登録された時間を基準として時間区間別に分けて複数の文書グループに分割するステップと、
前記文書グループそれぞれに対して該当する時間区間の周期に応じて索引を実行するステップと、
前記索引による索引データを利用して前記文書コレクションに対する検索を実行するステップ
を実行させ、前記コンピュータシステムに検索対象である文書に対するリアルタイム検索を実行させるためのプログラムを記録した、コンピュータで読み取り可能な記録媒体。 - 複数の文書からなる文書コレクションを、文書が登録された時間を基準として時間区間別に分けて複数の文書グループに分割する分割部と、
前記文書グループそれぞれに対して該当する時間区間の周期に応じて索引を実行する索引部と、
前記索引による索引データを利用して前記文書コレクションに対する検索を実行する検索部と
を備える、リアルタイム検索システム。 - 前記分割部は、
隣接する時間区間の間に重なる時間が存在するように前記時間区間を分けること
を特徴とする、請求項10に記載のリアルタイム検索システム。 - 前記分割部は、
前記時間区間のうち直近の時間区間である最近区間を最も短い時間周期で設定し、前記最近区間を基準とし、以後の時間区間の場合には時間の経過に応じて漸次的に長い時間周期で設定すること
を特徴とする、請求項10に記載のリアルタイム検索システム。 - 前記索引部は、
前記文書グループのうち直近の時間区間である最近区間に該当する文書グループの場合には無限ループ(infinite loop)で索引を実行し、前記最近区間に該当する文書グループの索引結果を持続してアップデートすること
を特徴とする、請求項10に記載のリアルタイム検索システム。 - 前記索引部は、
語節単位索引技法、形態素単位索引技法、およびNグラム(N−Gram)基盤索引技法のうちいずれか1つを利用して索引を実行すること
を特徴とする、請求項10に記載のリアルタイム検索システム。 - 前記分割部は、
前記文書グループのうち直近の時間区間である最近区間に該当する文書グループに含まれた文書の数が基準値を超過する場合には、該当の文書グループを複数の小グループに分割すること
を特徴とする、請求項10に記載のリアルタイム検索システム。 - 前記索引部は、
前記最近区間に該当する文書グループに対して前記複数の小グループを並列に同時索引すること
を特徴とする、請求項15に記載のリアルタイム検索システム。 - 前記検索部は、
前記索引データを利用した検索結果から前記文書グループ間に前記重なる時間によって重複する検索結果を取り除いた後、最終的な検索結果を提供すること
を特徴とする、請求項11に記載のリアルタイム検索システム。 - コンピュータシステムに、
複数の文書からなる文書コレクションを、文書が登録された時間を基準として時間区間別に分けて複数の文書グループに分割するステップと、
前記文書グループそれぞれに対して該当する時間区間の周期に応じて索引を実行するステップと、
前記索引による索引データを利用して前記文書コレクションに対する検索を実行するステップ
を実行させ、前記コンピュータシステムに検索対象である文書に対するリアルタイム検索を実行させる処理を行わせるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130129196A KR101425816B1 (ko) | 2013-10-29 | 2013-10-29 | 실시간 검색 구현 방법 및 그 시스템 |
KR10-2013-0129196 | 2013-10-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015088190A true JP2015088190A (ja) | 2015-05-07 |
JP5951729B2 JP5951729B2 (ja) | 2016-07-13 |
Family
ID=51749323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014219919A Active JP5951729B2 (ja) | 2013-10-29 | 2014-10-29 | リアルタイム検索実現方法およびそのシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5951729B2 (ja) |
KR (1) | KR101425816B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101744017B1 (ko) * | 2016-03-11 | 2017-06-07 | 주식회사 지앤클라우드 | 실시간 검색을 위한 데이터 인덱싱 방법 및 장치 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006172363A (ja) * | 2004-12-20 | 2006-06-29 | Hitachi Ltd | 文書検索装置、インデクス再構成方法及びプログラム |
JP2008186157A (ja) * | 2007-01-29 | 2008-08-14 | Mitsubishi Electric Corp | Webページ再収集方式 |
JP2009110196A (ja) * | 2007-10-29 | 2009-05-21 | Mitsubishi Electric Corp | Webサーバアクセススケジューリングシステム |
JP2009122930A (ja) * | 2007-11-14 | 2009-06-04 | Ntt Resonant Inc | 情報検索装置およびその方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020014026A (ko) * | 2000-08-14 | 2002-02-25 | (주) 인포마스터 | 웹 개인화에 바탕한 뉴스 추적 및 분석 서비스 |
US20090077073A1 (en) | 2005-04-21 | 2009-03-19 | Hiroaki Masuyama | Index term extraction device for document-to-be-surveyed |
KR100871470B1 (ko) * | 2007-04-12 | 2008-12-03 | 주식회사 케이티프리텔 | 색인 데이터를 구축하기 위한 검색 시스템 및 이를 위한 방법 |
KR100963352B1 (ko) * | 2008-04-14 | 2010-06-14 | 제주대학교 산학협력단 | 궤적 데이터의 인덱싱 방법 및 그 방법을 이용하는 장치 |
-
2013
- 2013-10-29 KR KR1020130129196A patent/KR101425816B1/ko active IP Right Grant
-
2014
- 2014-10-29 JP JP2014219919A patent/JP5951729B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006172363A (ja) * | 2004-12-20 | 2006-06-29 | Hitachi Ltd | 文書検索装置、インデクス再構成方法及びプログラム |
JP2008186157A (ja) * | 2007-01-29 | 2008-08-14 | Mitsubishi Electric Corp | Webページ再収集方式 |
JP2009110196A (ja) * | 2007-10-29 | 2009-05-21 | Mitsubishi Electric Corp | Webサーバアクセススケジューリングシステム |
JP2009122930A (ja) * | 2007-11-14 | 2009-06-04 | Ntt Resonant Inc | 情報検索装置およびその方法 |
Non-Patent Citations (3)
Title |
---|
JPN6015037458; 田村 孝之、外1名: '多周期的Webクローリングにおける時間分解能向上手法' 情報処理学会論文誌 論文誌トランザクション 平成22年度(2) [CD-ROM] 第4巻,第1号, 20110502, p.40-49, 一般社団法人情報処理学会 * |
JPN6015037459; 田村 孝之、外1名: '多周期的更新アクセスに適した二次記憶管理技法' 電子情報通信学会論文誌 第J93-D巻,第6号, 20100601, p.805-815, 社団法人電子情報通信学会 * |
JPN6016016304; 山名 早人: 'データベース最前線' bit 第32巻,第12号, 20001201, p.72-79, 共立出版株式会社 * |
Also Published As
Publication number | Publication date |
---|---|
JP5951729B2 (ja) | 2016-07-13 |
KR101425816B1 (ko) | 2014-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8775442B2 (en) | Semantic search using a single-source semantic model | |
US10169471B2 (en) | Generating and executing query language statements from natural language | |
US10268758B2 (en) | Method and system of acquiring semantic information, keyword expansion and keyword search thereof | |
US8468146B2 (en) | System and method for creating search index on cloud database | |
US10970324B2 (en) | System for generation of automated response follow-up | |
US11074266B2 (en) | Semantic concept discovery over event databases | |
US11232267B2 (en) | Proximity information retrieval boost method for medical knowledge question answering systems | |
US20180039889A1 (en) | Surfacing unique facts for entities | |
KR101651780B1 (ko) | 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템 | |
US10289642B2 (en) | Method and system for matching images with content using whitelists and blacklists in response to a search query | |
CN111539193A (zh) | 基于本体的文档分析和注释生成 | |
US10915537B2 (en) | System and a method for associating contextual structured data with unstructured documents on map-reduce | |
US10229187B2 (en) | System for determination of automated response follow-up | |
US20170357712A1 (en) | Method and system for searching and identifying content items in response to a search query using a matched keyword whitelist | |
US8862556B2 (en) | Difference analysis in file sub-regions | |
US9916375B2 (en) | Extraction of concept-based summaries from documents | |
US9529830B1 (en) | Data matching for column-oriented data tables | |
JP5951729B2 (ja) | リアルタイム検索実現方法およびそのシステム | |
US11244007B2 (en) | Automatic adaption of a search configuration | |
CN105824976A (zh) | 一种优化分词库的方法和装置 | |
KR101656077B1 (ko) | 암시적 타임 칼럼값을 이용한 시간 기반 파티셔닝 시스템 및 방법 | |
Bommannavar et al. | Estimating topical volume in social media streams | |
KR102052823B1 (ko) | 잠재 디리클레 할당을 이용한 토픽 모델 자동화 방법 및 장치 | |
KR101508939B1 (ko) | 실시간 검색을 위한 병렬 색인 방법 및 그 시스템 | |
US20200272648A1 (en) | Text Extraction and Processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5951729 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |