KR101148552B1 - 수정된 문서의 정보를 이용한 문서 색인 시스템 및 방법 - Google Patents
수정된 문서의 정보를 이용한 문서 색인 시스템 및 방법 Download PDFInfo
- Publication number
- KR101148552B1 KR101148552B1 KR1020100097229A KR20100097229A KR101148552B1 KR 101148552 B1 KR101148552 B1 KR 101148552B1 KR 1020100097229 A KR1020100097229 A KR 1020100097229A KR 20100097229 A KR20100097229 A KR 20100097229A KR 101148552 B1 KR101148552 B1 KR 101148552B1
- Authority
- KR
- South Korea
- Prior art keywords
- document
- collection
- unit information
- indexing
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012986 modification Methods 0.000 claims description 19
- 230000004048 modification Effects 0.000 claims description 19
- 239000000284 extract Substances 0.000 abstract description 16
- 238000012937 correction Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
Images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
Abstract
Description
도 2는 본 발명의 일실시예에 있어서, 문서 색인 방법을 도시한 흐름도이다.
도 3은 본 발명의 일실시예에 있어서, 단위 정보의 일례를 나타낸 표이다.
도 4는 본 발명의 일실시예에 있어서, 색인용 문서 컬렉션의 일례를 나타낸 도면이다.
111: 단위 정보 추출부
112: 데이터베이스
113: 색인용 문서 컬렉션 생성부
114: 추가 수정 사항 반영부
120: 검색용 복제 데이터베이스
130: 문서 컬렉션 생성부
140: 색인부
Claims (16)
- 검색 색인을 위해 문서를 가공한 데이터인 색인용 문서 컬렉션을 제공하는 문서 색인 시스템에 있어서,
전체 문서 중 신규 생성된 문서 및 수정된 문서를 포함하는 문서 컬렉션을 수신하여 상기 문서 컬렉션에서 각 문서의 저장 위치에 대한 정보를 적어도 포함하는 단위 정보를 추출하고, 상기 추출된 단위 정보 및 상기 문서 컬렉션을 저장하는 단위 정보 추출부; 및
상기 색인용 문서 컬렉션에 대한 생성 요청에 대응하는 단위 정보를 통해 상기 저장된 문서 컬렉션에서 상기 생성 요청에 해당하는 문서를 추출하고, 상기 추출된 문서를 이용하여 상기 색인용 문서 컬렉션을 생성하는 색인용 문서 컬렉션 생성부
를 포함하고,
상기 수정된 문서는 전체 문서 각각에 대해 공통적으로 정의된 모든 항목 중 미리 설정된 항목이 기선정된 기간동안 수정된 문서를 포함하는 문서 색인 시스템. - 제1항에 있어서,
상기 단위 정보는 해당 문서가 저장된 경로, 상기 문서 컬렉션에서 시작하는 위치(offset) 및 상기 해당 문서의 길이를 포함하는 문서 색인 시스템. - 제1항에 있어서,
상기 단위 정보는 해당 문서의 식별자, 상기 해당 문서가 게재된 사이트의 식별자, 상기 해당 문서의 카테고리, 상기 해당 문서의 타입, 상기 해당 문서가 생성된 시간, 상기 해당 문서가 수정된 시간, 상기 해당 문서가 갱신된 시간, 상기 해당 문서의 상태를 정의한 정보 및 상기 해당 문서의 품질을 정의한 정보 중 적어도 하나를 더 포함하는 문서 색인 시스템. - 제1항에 있어서,
상기 생성 요청은 필요한 문서의 식별자, 상기 필요한 문서가 게재된 사이트의 식별자, 상기 필요한 문서의 카테고리, 상기 필요한 문서의 타입, 상기 필요한 문서가 생성된 시간, 상기 필요한 문서가 수정된 시간, 상기 필요한 문서가 갱신된 시간, 상기 필요한 문서의 상태를 정의한 정보 및 상기 필요한 문서의 품질을 정의한 정보 중 적어도 하나를 포함하는 문서 색인 시스템. - 검색 색인을 위해 문서를 가공한 데이터인 색인용 문서 컬렉션을 제공하는 문서 색인 시스템에 있어서,
전체 문서 중 신규 생성된 문서 및 수정된 문서를 포함하는 문서 컬렉션을 수신하여 상기 문서 컬렉션에서 각 문서의 저장 위치에 대한 정보를 적어도 포함하는 단위 정보를 추출하고, 상기 추출된 단위 정보 및 상기 문서 컬렉션을 저장하는 단위 정보 추출부; 및
상기 색인용 문서 컬렉션에 대한 생성 요청에 대응하는 단위 정보를 통해 상기 저장된 문서 컬렉션에서 상기 생성 요청에 해당하는 문서를 추출하고, 상기 추출된 문서를 이용하여 상기 색인용 문서 컬렉션을 생성하는 색인용 문서 컬렉션 생성부
를 포함하고,
최근 기간에 생성된 색인용 문서 컨렉션과 기존에 생성된 색인용 문서 컬렉션을 이용하여 상기 전체 문서에 대한 검색이 수행되는 문서 색인 시스템. - 검색 색인을 위해 문서를 가공한 데이터인 색인용 문서 컬렉션을 제공하는 문서 색인 시스템에 있어서,
전체 문서 중 신규 생성된 문서 및 수정된 문서를 포함하는 문서 컬렉션을 수신하여 상기 문서 컬렉션에서 각 문서의 저장 위치에 대한 정보를 적어도 포함하는 단위 정보를 추출하고, 상기 추출된 단위 정보 및 상기 문서 컬렉션을 저장하는 단위 정보 추출부; 및
상기 색인용 문서 컬렉션에 대한 생성 요청에 대응하는 단위 정보를 통해 상기 저장된 문서 컬렉션에서 상기 생성 요청에 해당하는 문서를 추출하고, 상기 추출된 문서를 이용하여 상기 색인용 문서 컬렉션을 생성하는 색인용 문서 컬렉션 생성부
를 포함하고,
상기 추출된 단위 정보가 저장되는 데이터베이스
를 더 포함하고,
상기 색인용 문서 컬렉션 생성부는,
상기 생성 요청에 대응하는 단위 정보를 상기 데이터베이스로부터 추출하고, 상기 추출된 단위 정보를 이용하여 상기 문서 컬렉션에서 상기 생성 요청에 해당하는 문서를 추출하여 상기 색인용 문서 컬렉션을 생성하는 문서 색인 시스템. - 삭제
- 제1항에 있어서,
상기 기선정된 기간과는 다른 기간마다 상기 미리 설정된 항목을 제외한 나머지 항목들의 추가 수정 사항을 상기 단위 정보 또는 상기 문서 컬렉션에 반영하는 추가 수정 사항 반영부
를 더 포함하는 문서 색인 시스템. - 검색 색인을 위해 문서를 가공한 데이터인 색인용 문서 컬렉션을 제공하는 문서 색인 방법에 있어서,
전체 문서 중 신규 생성된 문서 및 수정된 문서를 포함하는 문서 컬렉션을 수신하는 단계;
상기 문서 컬렉션에서 각 문서의 저장 위치에 대한 정보를 적어도 포함하는 단위 정보를 추출하고, 상기 추출된 단위 정보 및 상기 문서 컬렉션을 저장하는 단계;
상기 색인용 문서 컬렉션에 대한 생성 요청에 대응하는 단위 정보를 조회하는 단계; 및
상기 단위 정보를 통해 상기 문서 컬렉션에서 추출된 문서를 이용하여 상기 색인용 문서 컬렉션을 생성하는 단계
를 포함하고,
상기 수정된 문서는 전체 문서 각각에 대해 공통적으로 정의된 모든 항목 중 미리 설정된 항목이 기선정된 기간동안 수정된 문서를 포함하는 문서 색인 방법. - 제9항에 있어서,
상기 단위 정보는 해당 문서가 저장된 경로, 상기 문서 컬렉션 내에서 시작하는 위치 및 상기 해당 문서의 길이를 포함하는 문서 색인 방법. - 제9항에 있어서,
상기 단위 정보는 해당 문서의 식별자, 상기 해당 문서가 게재된 사이트의 식별자, 상기 해당 문서의 카테고리, 상기 해당 문서의 타입, 상기 해당 문서가 생성된 시간, 상기 해당 문서가 수정된 시간, 상기 해당 문서가 갱신된 시간, 상기 해당 문서의 상태를 정의한 정보 및 상기 해당 문서의 품질을 정의한 정보 중 적어도 하나를 더 포함하는 문서 색인 방법. - 제9항에 있어서,
상기 생성 요청은 필요한 문서의 식별자, 상기 필요한 문서가 게재된 사이트의 식별자, 상기 필요한 문서의 카테고리, 상기 필요한 문서의 타입, 상기 필요한 문서가 생성된 시간, 상기 필요한 문서가 수정된 시간, 상기 필요한 문서가 갱신된 시간, 상기 필요한 문서의 상태를 정의한 정보 및 상기 필요한 문서의 품질을 정의한 정보 중 적어도 하나를 포함하는 문서 색인 방법. - 검색 색인을 위해 문서를 가공한 데이터인 색인용 문서 컬렉션을 제공하는 문서 색인 방법에 있어서,
전체 문서 중 신규 생성된 문서 및 수정된 문서를 포함하는 문서 컬렉션을 수신하는 단계;
상기 문서 컬렉션에서 각 문서의 저장 위치에 대한 정보를 적어도 포함하는 단위 정보를 추출하고, 상기 추출된 단위 정보 및 상기 문서 컬렉션을 저장하는 단계;
상기 색인용 문서 컬렉션에 대한 생성 요청에 대응하는 단위 정보를 조회하는 단계; 및
상기 단위 정보를 통해 상기 문서 컬렉션에서 추출된 문서를 이용하여 상기 색인용 문서 컬렉션을 생성하는 단계
를 포함하고,
최근 기간에 생성된 색인용 문서 컨렉션과 기존에 생성된 색인용 문서 컬렉션을 이용하여 상기 전체 문서에 대한 검색이 수행되는 문서 색인 방법. - 삭제
- 제9항에 있어서,
상기 기선정된 기간과는 다른 기간마다 상기 미리 설정된 항목을 제외한 나머지 항목들의 추가 수정 사항을 상기 단위 정보 또는 상기 문서 컬렉션에 반영하는 단계
를 더 포함하는 문서 색인 방법. - 제9항 내지 제13항 또는 제15항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020100097229A KR101148552B1 (ko) | 2010-10-06 | 2010-10-06 | 수정된 문서의 정보를 이용한 문서 색인 시스템 및 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020100097229A KR101148552B1 (ko) | 2010-10-06 | 2010-10-06 | 수정된 문서의 정보를 이용한 문서 색인 시스템 및 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20120035605A KR20120035605A (ko) | 2012-04-16 |
| KR101148552B1 true KR101148552B1 (ko) | 2012-05-23 |
Family
ID=46137488
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020100097229A Active KR101148552B1 (ko) | 2010-10-06 | 2010-10-06 | 수정된 문서의 정보를 이용한 문서 색인 시스템 및 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR101148552B1 (ko) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20130326323A1 (en) * | 2012-05-30 | 2013-12-05 | Google Inc. | Systems and methods for displaying contextual revision history |
| JP7293780B2 (ja) * | 2019-03-25 | 2023-06-20 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、文書管理システム及びプログラム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001075982A (ja) * | 1999-09-02 | 2001-03-23 | Sumitomo Metal Ind Ltd | 文書検索方法、文書検索用インデックスの作成方法、文書検索装置、及び記録媒体 |
-
2010
- 2010-10-06 KR KR1020100097229A patent/KR101148552B1/ko active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001075982A (ja) * | 1999-09-02 | 2001-03-23 | Sumitomo Metal Ind Ltd | 文書検索方法、文書検索用インデックスの作成方法、文書検索装置、及び記録媒体 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20120035605A (ko) | 2012-04-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6024559B2 (ja) | プログラムおよびバージョン管理方法 | |
| JP4522170B2 (ja) | リレーショナルデータベースのインデックス追加プログラム,インデックス追加装置及びインデックス追加方法 | |
| JP5961689B2 (ja) | 増分データの抽出 | |
| US8719237B2 (en) | Method and apparatus for deleting duplicate data | |
| US20150142735A1 (en) | Memory searching system and method, real-time searching system and method, and computer storage medium | |
| JP2015181059A5 (ja) | 情報をユーザに送る方法、コンピュータ読み取り可能な記録媒体、および情報収集方法 | |
| CN109669925B (zh) | 非结构化数据的管理方法及装置 | |
| CN103778176A (zh) | Mes系统中数据的长期归档 | |
| KR101148552B1 (ko) | 수정된 문서의 정보를 이용한 문서 색인 시스템 및 방법 | |
| JP5186390B2 (ja) | ノードの番号付けによるファイル・システムのダンプ/復元のための方法、システム、およびデバイス | |
| CN103309899A (zh) | 一种数据保护系统文件索引结构、更新及定位方法 | |
| EP4533290A1 (en) | Automatic preservation of digital documents | |
| KR101588375B1 (ko) | 데이터베이스 관리 방법 및 데이터베이스 관리 시스템 | |
| JP2010272006A (ja) | 関係抽出装置、関係抽出方法、及びプログラム | |
| CN117272953B (zh) | 一种文档信息自动填充方法、系统和存储介质 | |
| CN111737397B (zh) | 信息处理装置、文档管理系统、记录媒体、信息处理方法及计算机程序产品 | |
| JP6849910B2 (ja) | 差分ログ適用プログラム、差分ログ適用装置及び差分ログ適用方法 | |
| JP2009288962A (ja) | 情報処理装置、プログラム、及び保険商品約款生成方法 | |
| CN115269548A (zh) | 一种数据仓库开发模型的生成方法、系统及相关设备 | |
| JP2010061200A (ja) | 文書管理システム及び操作履歴表示方法 | |
| JP6011790B2 (ja) | ファイル管理装置およびコンピュータプログラム | |
| KR100834293B1 (ko) | 문서 처리 시스템 및 방법 | |
| JP6361472B2 (ja) | 対応情報生成プログラム、対応情報生成装置及び対応情報生成方法 | |
| Heinrichs et al. | Asynchronous Data Provenance for Research Data in a Distributed System. | |
| KR101926165B1 (ko) | 웹 기반 hmi 솔루션의 문서 편집 시스템 및 그 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20101006 |
|
| PA0201 | Request for examination | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20111125 Patent event code: PE09021S01D |
|
| PG1501 | Laying open of application | ||
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20120503 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20120515 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20120515 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| FPAY | Annual fee payment |
Payment date: 20160329 Year of fee payment: 5 |
|
| PR1001 | Payment of annual fee |
Payment date: 20160329 Start annual number: 5 End annual number: 5 |
|
| FPAY | Annual fee payment |
Payment date: 20170328 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
Payment date: 20170328 Start annual number: 6 End annual number: 6 |
|
| PR1001 | Payment of annual fee |
Payment date: 20200330 Start annual number: 9 End annual number: 9 |
|
| PR1001 | Payment of annual fee |
Payment date: 20210325 Start annual number: 10 End annual number: 10 |
|
| PR1001 | Payment of annual fee |
Payment date: 20220328 Start annual number: 11 End annual number: 11 |
|
| PR1001 | Payment of annual fee |
Payment date: 20240327 Start annual number: 13 End annual number: 13 |