KR20090084161A - 문서 내 목차정보를 이용한 검색 시스템 - Google Patents
문서 내 목차정보를 이용한 검색 시스템 Download PDFInfo
- Publication number
- KR20090084161A KR20090084161A KR1020080010177A KR20080010177A KR20090084161A KR 20090084161 A KR20090084161 A KR 20090084161A KR 1020080010177 A KR1020080010177 A KR 1020080010177A KR 20080010177 A KR20080010177 A KR 20080010177A KR 20090084161 A KR20090084161 A KR 20090084161A
- Authority
- KR
- South Korea
- Prior art keywords
- contents
- file
- search
- document
- title
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
Abstract
Description
Claims (6)
- 문서파일 내의 정보 검색을 위한 시스템에 관한 것으로서,사용자로부터 선택받은 문서파일을 등록하되, 상기 문서파일의 파일제목을 문서파일별 고유한 파일고유코드와 연계하여 문서파일을 등록하는 문서등록부;상기 문서등록부에 등록된 문서파일 내의 각 목차를 추출하되, 각 목차별로 목차제목, 목차가 위치한 페이지, 현재 목차에 대한 상하 목차 간의 계층관계, 목차 내의 텍스트 내용인 내용정보를 각각 추출하고, 상기 목차제목, 페이지, 계층관계 및 내용정보를 상기 목차별 고유한 목차고유코드와 연계하여 저장하는 목차추출부;상기 목차추출부에서 추출이 수행된 문서파일을 PDF파일로 변환하여 저장하는 파일변환부; 및검색창에 검색어가 입력되는 경우, 상기 문서파일 중 상기 내용정보의 텍스트 상에 해당 검색어가 존재하는 모든 문서파일을 검색하여, 해당 문서파일의 파일제목, 상기 텍스트를 포함한 내용정보, 상기 내용정보를 포함하고 있는 목차의 목차제목을 각각 문서파일별로 그룹핑한 검색결과를 검색결과란에 표시하되, 상기 내용정보의 경우 미리보기 형태로 제공하는 검색부를 포함하는 문서 내 목차정보를 이용한 검색 시스템.
- 제 1항에 있어서, 상기 검색부는,상기 검색결과란에 표시된 상기 내용정보 또는 목차제목의 어느 일 부분을 사용자로부터 선택받는 경우, 해당 문서파일에 대응되는 PDF파일을 상기 파일변환부에서 취출하여 파일을 오픈하여 제공하되, 상기 페이지 및 상기 목차고유코드를 이용하여 상기 선택받은 부분의 위치가 바로 표시되도록 하는 것을 특징으로 하는 문서 내 목차정보를 이용한 검색 시스템.
- 제 1항 또는 제 2항에 있어서, 상기 검색부는,상기 목차추출부에서 추출된 상기 계층관계를 이용하여, 상기 목차제목의 표시시 상기 목차제목에 대한 상위 목차제목을 함께 표시하는 것을 특징으로 하는 문서 내 목차정보를 이용한 검색 시스템.
- 제 3항에 있어서,사용자인증을 거친 사용자의 개인정보, 아이디 및 패스워드가 등록된 사용자등록부를 더 포함하며,상기 검색부는,상기 검색결과란에 표시된 상기 목차제목마다 바로가기 등록 옵션을 제공하여 목차의 바로가기 등록이 개인별로 가능하고, 상기 바로가기 등록 옵션을 사용자로부터 선택받는 경우 개인별 바로가기 목록을 바로가기공간 상에 제공하되, 해당 파일제목, 바로가기 등록된 목차제목, 상기 목차제목의 상위 목차제목을 각각 문서파일 별로 그룹핑하여 제공하고, 바로가기 등록된 목차제목마다 바로가기 삭제 옵 션을 제공하는 것을 특징으로 하는 문서 내 목차정보를 이용한 검색 시스템.
- 제 4항에 있어서, 상기 검색부는,모든 사용자를 대상으로 상기 목차에 관한 바로가기 등록 횟수를 카운트하여 바로가기 등록 횟수가 높은 순으로 정렬된 인기목차 목록을 모든 사용자에게 공통결과로 제공하되, 해당 파일제목, 상기 목차제목, 상기 목차제목의 상위 목차제목을 각각 문서파일별로 그룹핑하여 제공하는 것을 특징으로 하는 문서 내 목차정보를 이용한 검색 시스템.
- 제 4항에 있어서, 상기 검색부는,사용자로부터 검색어가 입력되는 경우, 상기 내용정보, 상기 내용정보를 포함한 목차제목, 상기 목차제목의 상위 목차제목, 상기 파일제목 상에 각각 해당 검색어가 포함된 갯수를 카운트하고, 상기 목차의 바로가기 등록 횟수를 카운트하여, 상기 카운트에 의한 가중치가 높은 순으로 상기 검색결과를 재정렬하여 상기 검색결과란에 제공하는 것을 특징으로 하는 문서 내 목차정보를 이용한 검색 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080010177A KR100912288B1 (ko) | 2008-01-31 | 2008-01-31 | 문서 내 목차정보를 이용한 검색 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080010177A KR100912288B1 (ko) | 2008-01-31 | 2008-01-31 | 문서 내 목차정보를 이용한 검색 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090084161A true KR20090084161A (ko) | 2009-08-05 |
KR100912288B1 KR100912288B1 (ko) | 2009-08-17 |
Family
ID=41204758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20080010177A KR100912288B1 (ko) | 2008-01-31 | 2008-01-31 | 문서 내 목차정보를 이용한 검색 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100912288B1 (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130009950A (ko) * | 2010-02-19 | 2013-01-24 | 마이크로소프트 코포레이션 | 데이터 구조 매핑 및 네비게이션 |
KR101497235B1 (ko) * | 2013-09-25 | 2015-02-27 | 경호연 | 문서의 생산등록번호를 이용한 사업단위 문서 정보 구축 시스템 및 방법, 문서의 생산등록번호를 이용한 사업단위 문서 정보 검색시스템 및 방법 |
US20200005329A1 (en) * | 2013-09-09 | 2020-01-02 | UnitedLex Corp. | Unique documents determination |
KR20200073700A (ko) * | 2018-12-14 | 2020-06-24 | 아주대학교산학협력단 | 문서를 생성하고 관리하기 위한 장치 및 방법 |
KR102171325B1 (ko) * | 2020-01-14 | 2020-10-28 | 티아이테크놀로지 주식회사 | Pdf 파일을 대상으로 하는 테이블 데이터 파싱 방법 |
CN112001150A (zh) * | 2019-05-27 | 2020-11-27 | 珠海金山办公软件有限公司 | 一种文档格式转换的方法、装置、计算机存储介质及终端 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000049925A (ko) * | 2000-05-06 | 2000-08-05 | 조규철 | 인터넷에서 서적내용을 피디에프파일로 제공하는 방법 및그 시스템 |
KR100386804B1 (ko) * | 2000-08-19 | 2003-06-09 | (주) 지식공학 | 유의어 전자사전 및 그 전자사전을 이용한 유의어 검색방법 |
KR100751691B1 (ko) * | 2005-11-08 | 2007-08-23 | 삼성에스디에스 주식회사 | 다수의 파워포인트 문서 편집 방법 |
-
2008
- 2008-01-31 KR KR20080010177A patent/KR100912288B1/ko active IP Right Grant
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130009950A (ko) * | 2010-02-19 | 2013-01-24 | 마이크로소프트 코포레이션 | 데이터 구조 매핑 및 네비게이션 |
US20200005329A1 (en) * | 2013-09-09 | 2020-01-02 | UnitedLex Corp. | Unique documents determination |
US11978057B2 (en) | 2013-09-09 | 2024-05-07 | UnitedLex Corp. | Single instance storage of metadata and extracted text |
KR101497235B1 (ko) * | 2013-09-25 | 2015-02-27 | 경호연 | 문서의 생산등록번호를 이용한 사업단위 문서 정보 구축 시스템 및 방법, 문서의 생산등록번호를 이용한 사업단위 문서 정보 검색시스템 및 방법 |
KR20200073700A (ko) * | 2018-12-14 | 2020-06-24 | 아주대학교산학협력단 | 문서를 생성하고 관리하기 위한 장치 및 방법 |
CN112001150A (zh) * | 2019-05-27 | 2020-11-27 | 珠海金山办公软件有限公司 | 一种文档格式转换的方法、装置、计算机存储介质及终端 |
KR102171325B1 (ko) * | 2020-01-14 | 2020-10-28 | 티아이테크놀로지 주식회사 | Pdf 파일을 대상으로 하는 테이블 데이터 파싱 방법 |
WO2021145541A1 (ko) * | 2020-01-14 | 2021-07-22 | 티아이테크놀로지 주식회사 | Pdf 파일을 대상으로 하는 테이블 데이터 파싱 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR100912288B1 (ko) | 2009-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614504B (zh) | 一种互联网电子书的管理系统及方法 | |
CN104123269B (zh) | 一种基于模板的出版物半自动生成方法及系统 | |
EP2506208A1 (en) | Forensic system and forensic method, and forensic program | |
KR100912288B1 (ko) | 문서 내 목차정보를 이용한 검색 시스템 | |
US20020083045A1 (en) | Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program | |
Ugale et al. | Document management system: A notion towards paperless office | |
US6694302B2 (en) | System, method and article of manufacture for personal catalog and knowledge management | |
Hassel | Resource lean and portable automatic text summarization | |
JP5103051B2 (ja) | 情報処理システム及び情報処理方法 | |
WO2008041367A1 (fr) | Dispositif de recherche de document, procédé de recherche de document et programme de recherche de document | |
KR101401250B1 (ko) | 전자문서에 대한 키워드맵 제공 방법 및 이를 위한 키워드맵 제공 프로그램을 기록한 컴퓨터로 판독가능한 기록매체 | |
Rehm et al. | Curation Technologies for Cultural Heritage Archives: Analysing and transforming a heterogeneous data set into an interactive curation workbench | |
CN112199960B (zh) | 一种标准知识元粒度解析系统 | |
Bhatia et al. | Specialized research datasets in the citeseerx digital library | |
US20100211562A1 (en) | Multi-part record searches | |
Fragkou et al. | BOEMIE Ontology-Based Text Annotation Tool. | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
Malhotra et al. | Web page segmentation towards information extraction for web semantics | |
Witten | Browsing around a digital library | |
Balakrishnan et al. | Digital library of India: a testbed for Indian language research | |
Bhat | Development of Digital Libraries in India: a Survey of Digital Collection of National Digital Library of India | |
JP2000020549A (ja) | 文書データベースシステムへの入力支援装置 | |
JPH117452A (ja) | ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体 | |
JP5746912B2 (ja) | テキストパターン抽出を用いてWeb文書をリファインするための方法、システム及びコンピュータ読み出し可能記録媒体 | |
CN104516941A (zh) | 相关文档检索装置、方法及程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130516 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140519 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150522 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160608 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170526 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180524 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20190523 Year of fee payment: 11 |