KR20220140321A - 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법 - Google Patents

맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법 Download PDF

Info

Publication number
KR20220140321A
KR20220140321A KR1020210046681A KR20210046681A KR20220140321A KR 20220140321 A KR20220140321 A KR 20220140321A KR 1020210046681 A KR1020210046681 A KR 1020210046681A KR 20210046681 A KR20210046681 A KR 20210046681A KR 20220140321 A KR20220140321 A KR 20220140321A
Authority
KR
South Korea
Prior art keywords
search
file
document file
document
reading
Prior art date
Application number
KR1020210046681A
Other languages
English (en)
Other versions
KR102546690B1 (ko
Inventor
황영식
Original Assignee
주식회사 디지북
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디지북 filed Critical 주식회사 디지북
Priority to KR1020210046681A priority Critical patent/KR102546690B1/ko
Publication of KR20220140321A publication Critical patent/KR20220140321A/ko
Application granted granted Critical
Publication of KR102546690B1 publication Critical patent/KR102546690B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content

Abstract

본 발명은 문서관리 및 빅데이터 처리 기술을 개시한다. 즉, 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법은 검색창에 검색 키워드를 입력해 전체 폴더 검색 혹은 지정 폴더 검색을 통해 검색 키워드가 기재된 적어도 하나의 문서 파일을 찾아 자동 정렬된 파일 리스트정보를 보여주며, 파일 리스트정보 중 어느 하나를 선택할 시, 선택된 문서 파일의 전체 페이지를 문자 판독해 검색 키워드가 적어도 하나 이상 기재된 페이지 상에 기재된 상세 글들을 화면 디스플레이한다.

Description

맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법{Customized document file search and search keyword-centered selection information system and drive method of the Same}
본 발명은 문서관리 및 빅데이터 처리 기술에 관한 것으로, 특히 검색창에 검색 키워드를 입력해 전체 폴더 검색 혹은 지정 폴더 검색을 통해 검색 키워드가 기재된 적어도 하나의 문서 파일을 찾아 자동 정렬된 파일 리스트정보를 보여주며, 파일 리스트정보 중 어느 하나를 선택할 시, 선택된 문서 파일의 전체 페이지를 문자 판독해 검색 키워드가 적어도 하나 이상 기재된 페이지 상에 기재된 상세 글들을 화면 디스플레이하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법에 관한 것이다.
일반적으로, 검색엔진은 인터넷상에 있는 수 많은 사이트들 중 자신이 찾고자 하는 정보를 포함하고 있는 사이트를 검색할 수 있도록 도와주는 인터넷 사이트를 말하며, 인터넷상에는 수백종의 검색엔진이 존재하고 있다.
검색엔진을 분류하는 기준에 대하여 공식적으로 정립된 바는 없지만, 일반적으로 검색엔진의 동작형태에 따라 주제별 검색엔진과 키워드형 검색엔진으로 구별되며, 키워드형 검색엔진은 다시 일반키워드형 검색 엔진, 프론트-앤드(Front-End)형 검색엔진, 지능형검색엔진으로 구분된다.
그러나, 모든 검색엔진들이 상기에서 언급한 것처럼 뚜렷이 구분되는 것이 아니며, 주제별 검색엔진의 대명사격인 '야후(YAHOO;상표명)'도 키워드 검색을 지원하고 있으며, 키워드형 검색엔진들 대부분도 주제별 검색 서비스를 동시에 제공하고 있다.
주제별 검색엔진이라 함은 인터넷에 있는 정보를 사회, 문화, 예술, 스포츠, 정치 등 큰 주제에 따라 분류해 놓은 목록을 제공하는 검색엔진을 말하는 것으로, 해당 주제에 해당하는 각종 정보를 목록으로 제공하기 때문에 디렉토리 서버, 주제별 카탈로그, 메뉴검색 등으로도 불려지며, 정보를 찾기 위한 특별한 주제어나 중심어를 뽑아낼 수 없는 상황일 때 사용하면 쉽게 해당정보에 접근할 수 있다는 장점이 있으나, 원하는 정보에 접근하기까지 '대분류 → 중분류 → 소분류 → 찾는정보'와 같이 여러 단계를 거쳐야 하므로 중간에 길을 잘못 설정하면 자신이 찾는 내용과 더욱 더 멀어질 가능성이 산재하고 있는 단점이 있다.
종래의, 키워드형 검색엔진은 인터넷에 있는 홈페이지의 내용과 URL(홈페이지 주소)을 자체 데이터베이스로 구축해 둔 것을 말하는 것으로, 단 몇개의 키워드(검색어)를 입력하여 원하는 정보를 신속하게 찾을 수 있다는 장점을 가지고 있으나, 정확한 키워드를 뽑아낼 수 없는 상황에서 키워드 검색을 실시할 경우, 엉뚱한 결과의 출력으로 많은 시간을 낭비하는 결과를 초래할 수 있는 단점이 있으며, 프론트-앤드형 검색엔진이란 많은 검색엔진을 한 화면에 모아놓은 것을 말하는 것으로, 자기 자신은 로봇, 스파이더, 크롤러 등을 이용한 정보 데이터베이스를 구축해 놓지 않고 여러 가지 엔진의 '검색어 입력창'만을 따로 모아서 제공하는 것이며, 다른 검색엔진으로 진입하는 전초기지 성격을 가진다하여 프론트-앤드형 검색엔진이라고 부르고 있고, 여러 가지의 검색엔진을 옮겨 다니면서 검색할 필요없이 한 화면안에서 다양한 검색엔진을 이용할 수 있을 뿐만 아니라 웹에 있는 HTML 문서만을 대상으로 검색하는 것이 아니라 공개 소프트웨어나 뉴스그룹 또는 학술문서까지도 찾아주는 아주 넓은 검색 영역을 가지고 잇다는 장점이 있지만 자기 자신은 데이터베이스를 갖고 있지 않기 때문에 각가의 검색엔진에서 사용할 수 있는 여러 가지 검색 옵션을 모두 지원해 주지 못하고 있으며, 정교한 검색을 이끌어내는 데 어느 정도 한게를 드러낸다는 단점이 있다.
최근에 인터넷 사용이 점차 활발해짐에 따라, 많은 사람들이 인터넷에서 예컨대, 블로그(Blog), 위키(Wiki)와 같은 매체를 통해서 자신의 의견을 표현하고 있는 추세이다. 또한, 특정한 정보의 가치를 평가할 때, 이러한 다른 사람들이 인터넷 상에 올려놓은 의견 정보를 참조하고자 하는 수요도 높아지고 있다.
예를 들면, 인터넷 상에는 상품 리뷰(Review)에서 영화 리뷰까지 다양한 사용자들의 의견이 존재한다. 이러한 각 사용자들의 의견들은 일반 사용자들이 물품을 구매하거나, 영화를 보기 전에 다른 사용자들의 의견을 보고자하는 경우에도 이용될 수 있으며, 마케팅 담당자나 주식 매매자 등이 각 물품이나 회사에 대한 일반 사용자들의 다양한 의견을 알고자 하는 경우에도 사용될 수 있다. 특히, 일반 사용자들은 특정 물품을 구매하기 전에 다른 사용자들의 평가를 먼저 보고 나서 이런 물품을 구매하려는 경향이 크다.
하지만, 이러한 인터넷 상에 존재하는 의견들은 개개의 웹사이트들에만 존재하여, 이러한 의견 정보들을 사용하고자 할 경우에는 사용자가 일일이 이러한 개개의 모든 웹사이트를 수동으로 찾아보아야 하는 번거로움이 존재한다.
이러한 모든 웹사이트들을 사용자들이 모두 찾아보기 어려우며 일반 검색으로 다른 사용자들의 의견을 찾고자 하는 경우에는 의견이 있는 웹 문서, 긍정적인 의견이 있는 웹 문서, 부정적인 의견이 있는 웹 문서 등이 혼재하여 효과적으로 다른 사용자들의 의견을 찾아보기 어려운 문제점이 있다.
이러한 문제점을 해결하기 위하여 국/내외 학계를 중심으로 사용자 의견 추출 기술이 활발하게 연구되고 있으며, 정보 검색 분야에서도 2000년도 초반부터 크게 발전하여 다양한 기술이 연구되고 있다.
그러나, 기존의 정보 검색 기술은 단순히 키워드가 존재하는 정보에 기반한 검색만 제공해주고 있을 뿐이고, 각 키워드가 등장하는 문서나 문장에서 긍정적/부정적으로 평가된 내용을 기반으로 한 좀더 고차원적인 검색까지 제공해주고 있지 못하고 있다. 최근에 사용자 의견 추출 기술을 정보 검색에 적용하려는 시도가 진행되고 있으나 아직도 단순히 긍정, 부정 문서를 나누는 수준에만 머무르고 있는 실정이다.
한국특허 등록번호 : 10-1100830-0000 한국특허 공개번호 : 10-2000-0072482 한국특허 공개번호 : 10-2012-0003834 한국특허 공개번호 : 10-2015-0136809
본 발명의 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법은 앞서 본 종래 기술의 문제점을 해결하기 위해 안출된 것으로, 본 발명의 제 1 목적은 검색창에 검색 키워드를 입력해 전체 폴더 검색 혹은 지정 폴더 검색을 통해 검색 키워드가 기재된 적어도 하나의 문서 파일을 찾아 자동 정렬된 파일 리스트정보를 보여주며, 파일 리스트정보 중 어느 하나를 선택할 시, 선택된 문서 파일의 전체 페이지를 문자 판독해 검색 키워드가 적어도 하나 이상 기재된 페이지 상에 기재된 상세 글들을 화면 디스플레이해 관심어이자 연관어인 검색 키워드가 포함된 페이지들을 상세 검토하기 위함이다.
또한, 본 발명의 제 2 목적은 자체 개발한 문서판독 크롤링 컨텐츠(웹/앱)를 활용해 다수의 문서 파일 중 검색 키워드가 포함된 파일 리스트정보를 일목요연하게 모니티링하여 이를 가공해 정량데이터로 활성화시키거나 오피니언 분석이나 각종 통계분석에 적용되는 빅데이터로 유용하기 위함이다.
또한, 본 발명의 제 3 목적은 문서 파일을 선택해 열린 전체 페이지를 크롤링하여 전체 페이지를 대상으로 관심어이자 연관어인 검색 키워드가 기재된 페이지들을 검출한 후 이를 열람 가능토록 정보 제공해 줌으로써, 비관심사 분야도 함께 기술되어 있는 전체 페이지 모두를 시간을 드려 읽어야 하는 낭비적 요소를 최대한 줄이고, 독자의 선택적 사고 및 효율적 분석이 이루어지도록 소비자 맞춤 선택적독서 정보지원 서비스를 제공하기 위함이다.
상기의 과제를 달성하기 위한 본 발명은 다음과 같은 구성을 포함한다. 즉, 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템은, 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 파일 리스트정보 열람부; 및 상기 파일 리스트정보 열람부로부터 인지되는 상기 적어도 하나의 문서 파일 중 어느 하나를 선택할 시, OCR(optical character reader) 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 적어도 하나 이상 기재된 페이지만 선별 치합하고, 페이지 업-다운 버튼조작시 상기 선별 치합된 적어도 하나의 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이하는 문자판독 및 문서파일 선별 제공부를 포함한다.
또한, 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템의 구동방법은, 파일 리스트정보 열람부가 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시하는 단계; 파일 리스트정보 열람부가 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 단계; 문자판독 및 문서파일 선별 제공부가 상기 파일 리스트정보 열람부로부터 인지되는 상기 적어도 하나의 문서 파일 중 어느 하나를 선택하는 단계; 상기 문자판독 및 문서파일 선별 제공부가 OCR(optical character reader) 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 문자판독하는 단계; 상기 문자판독 및 문서파일 선별 제공부가 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 적어도 하나 이상 기재된 페이지만 선별 치합하는 단계; 및 상기 문자판독 및 문서파일 선별 제공부가 페이지 업-다운 버튼조작시 상기 선별 치합된 적어도 하나의 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이하는 단계를 포함한다.
본 발명의 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법은 검색창에 검색 키워드를 입력해 전체 폴더 검색 혹은 지정 폴더 검색을 통해 검색 키워드가 기재된 적어도 하나의 문서 파일을 찾아 자동 정렬된 파일 리스트정보를 보여주며, 파일 리스트정보 중 어느 하나를 선택할 시, 선택된 문서 파일의 전체 페이지를 문자 판독해 검색 키워드가 적어도 하나 이상 기재된 페이지 상에 기재된 상세 글들을 화면 디스플레이해 관심어이자 연관어인 검색 키워드가 포함된 페이지들을 상세 검토할 수 있는 제 1 효과를 준다.
또한, 본 발명은 자체 개발한 문서판독 크롤링 컨텐츠(웹/앱)를 활용해 다수의 문서 파일 중 검색 키워드가 포함된 파일 리스트정보를 일목요연하게 모니티링하여 이를 가공해 정량데이터로 활성화시키거나 오피니언 분석이나 각종 통계분석에 적용되는 빅데이터로 유용하는 제 2 효과를 준다.
또한, 본 발명은 문서 파일을 선택해 열린 전체 페이지를 크롤링하여 전체 페이지를 대상으로 관심어이자 연관어인 검색 키워드가 기재된 페이지들을 검출한 후 이를 열람 가능토록 정보 제공해 줌으로써, 비관심사 분야도 함께 기술되어 있는 전체 페이지 모두를 시간을 드려 읽어야 하는 낭비적 요소를 최대한 줄이고, 독자의 선택적 사고 및 효율적 분석이 이루어지도록 소비자 맞춤 선택적독서 정보지원 서비스를 제공하는 제 3 효과를 준다.
도 1은 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템을 도시한 도면이다.
도 2는 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템을 도시한 다른 도면이다.
도 3은 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템에 포함된 주요 구성요소 구동에 의해 화면 표출된 문서판독 크롤링 컨텐츠를 스크린한 도면이다.
도 4는 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템의 구동방법을 나타낸 순서도이다.
[실시예]
이하, 본 발명의 실시예에 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다.
도 1은 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템을 도시한 도면이다.
도 1를 참조하면, 본 발명의 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템(1000)은 자체 개발한 문서판독 크롤링 컨텐츠 상에 보이는 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주며, 파일 리스트정보 중 어느 하나 선택시, 선택된 문서 파일의 전체 페이지를 문자판독 및 검색 키워드가 적어도 하나 이상 기재된 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이하는 시스템으로, 파일 리스트정보 열람부(100), 문자판독 및 문서파일 선별 제공부(200) 및 메타정보 자동 오픈부(300)를 포함한다.
파일 리스트정보 열람부(100)는 도 3를 통해 알수 있듯이, 검색창(110)에 검색 키워드를 입력해 데이터베이스부(미도시) 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시한다.
파일 리스트정보 열람부(100)는 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여준다.
파일 리스트정보 열람부(100)는 적어도 하나의 문서파일의 메타 정보 중 파일 연결프로그램명끼리 구분 정렬해 보여줄 수도 있고, 파일크기 순으로 내림차순 또는 오름차순으로 재정렬해 보여줄 수도 있으며, 파일생성 년월일나 파일다운로드 년월일 자로 내림차순 또는 오른차순으로 재정렬해 보여준다.
또한, 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 파일 리스트정보 열람부(100)는 전체문서 파일 각각이 서로 다름을 구분하고자 정한 파일명 상에 검색 키워드가 기재된 적어도 하나의 문서 파일을 찾아내는 것은 물론, 전체문서 파일의 전수 검색에 따른 전체문서 파일의 각기 다른 페이지마다 적어도 하나 이상의 검색 키워드가 기재되어 있는지를 판별해 전체 문서 파일 중에서 검색 키워드가 적어도 하나 이상 기재된 페이지를 포함한 문서 파일을 찾아낸다.
문자판독 및 문서파일 선별 제공부(200)는 파일 리스트정보 열람부(100)로부터 인지되는 적어도 하나의 문서 파일 중 어느 하나를 선택할 시, 문자판독 및 문서파일 선별 제공부(200)는 OCR(optical character reader) 엔진을 가동시켜 선택된 문서 파일의 전체 페이지를 문자판독한다.
또한, 문자판독 및 문서파일 선별 제공부(200)는 문자판독된 전체 페이지 중 검색 키워드가 적어도 하나 이상 기재된 페이지만 선별 치합하고, 문자판독 및 문서파일 선별 제공부(200)는 페이지 업-다운 버튼조작시 선별 치합된 적어도 하나의 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이한다.
문자판독 및 문서파일 선별 제공부(200)는 문자판독 완료시, 읽기용으로만 제한되었던 문서 파일을 읽기/쓰기 겸용 문서파일로 변환 및 생성시켜 상세 글들을 내용 검토하고자 하는 전문가 통신 단말기에게 유,무상 결제 승인 후에 정보 제공 또는 파일 다운로드해 준다.
또한, 문자판독 및 문서파일 선별 제공부(200)는 읽기/쓰기 겸용 문서 파일에 속하는 한컴오피스 워드파일, MS오피스 워드파일, 구글 워드파일, 텍스트 워드파일 중 선택된 하나를 생성시킨다.
문자판독 및 문서파일 선별 제공부(200)는 검색 키워드가 적어도 하나 이상 기재된 페이지마다 나타난 검색 키워드를 대상으로 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체 표시로 화면 디스플레이되도록 설정해 둠으로써, 검색 키워드에 대한 중요성이 내용 검토시 강조되게끔 지원해 준다.
문자판독 및 문서파일 선별 제공부(200)는 페이지마다 표기된 검색 키워드 외에 적어도 3회 이상 반복적으로 등장한 다른 검색 키워드를 파생 키워드로 설정해 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체로 검색 키워드와 다르게 구분 표시해 준다.
문자판독 및 문서파일 선별 제공부(200)는 선택된 문서 파일의 각 페이지마다 적어도 하나 이상 표현된 검색 키워드의 수를 카운트하여 검색 키워드 수가 가장 많은 페이지 순서대로 정렬하거나 검색 키워드가 가장 적은 페이지 순서대로 정렬하며, 화면 디스플레이시 현재 화면상에 구현된 페이지의 쪽번호와 검색 키워드의 수를 함께 표시해 준다.
메타정보 자동 오픈부(200)는 도 2에서도 도시되었듯이, 선택된 문서 파일로부터 확인 가능한 파일명, 파일 간략설명, 파일 연결프로그램명, 파일 저작자명, 파일크기, 파일생성 년월일, 파일다운로드 년월일, 파일 출처명, 페이지 수, 파일경로를 포함하는 메타정보 그대로를 화면 디스플레이하거나 메타정보의 정보보안 및 정보유출 방지를 위해 메타정보 중 일부를 2진수, 8진수 혹은 16진수로 선택 변환해 화면 디스플레이한다.
도 4는 본 발명의 실시예에 따른 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템의 구동방법을 나타낸 순서도이다.
도 4를 참조하면, 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템의 구동방법은 문서판독 크롤링 컨텐츠 상에 보이는 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주며, 파일 리스트정보 중 어느 하나 선택시, 선택된 문서 파일의 전체 페이지를 문자판독 및 검색 키워드가 적어도 하나 이상 기재된 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이하는 구동방법이다.
먼저, 파일 리스트정보 열람부는 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시한다(S100).
파일 리스트정보 열람부는 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여준다(S200).
문자판독 및 문서파일 선별 제공부는 파일 리스트정보 열람부로부터 인지되는 적어도 하나의 문서 파일 중 어느 하나를 선택한다(S300).
문자판독 및 문서파일 선별 제공부는 OCR(optical character reader) 엔진을 가동시켜 선택된 문서 파일의 전체 페이지를 문자판독한다(S400).
문자판독 및 문서파일 선별 제공부는 문자판독된 전체 페이지 중 검색 키워드가 적어도 하나 이상 기재된 페이지만 선별 치합한다(S500).
문자판독 및 문서파일 선별 제공부는 페이지 업-다운 버튼조작시 선별 치합된 적어도 하나의 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이한다(S600).
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬수 있음을 이해할 수 있을 것이다.
맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템(1000)
파일 리스트정보 열람부(100)
문자판독 및 문서파일 선별 제공부(200)
메타정보 자동 오픈부(300)

Claims (8)

  1. 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 파일 리스트정보 열람부; 및
    상기 파일 리스트정보 열람부로부터 인지되는 상기 적어도 하나의 문서 파일 중 어느 하나를 선택할 시, OCR(optical character reader) 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 적어도 하나 이상 기재된 페이지만 선별 치합하고, 페이지 업-다운 버튼조작시 상기 선별 치합된 적어도 하나의 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이하는 문자판독 및 문서파일 선별 제공부를 포함하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템.
  2. 제 1 항에 있어서, 상기 파일 리스트정보 열람부는,
    상기 적어도 하나의 문서파일의 메타 정보 중 파일 연결프로그램명끼리 구분 정렬해 보여줄 수도 있고, 파일크기 순으로 내림차순 또는 오름차순으로 재정렬해 보여줄 수도 있으며, 파일생성 년월일나 파일다운로드 년월일 자로 내림차순 또는 오른차순으로 재정렬해 보여주고,
    상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일 각각이 서로 다름을 구분하고자 정한 파일명 상에 상기 검색 키워드가 기재된 적어도 하나의 문서 파일을 찾아내는 것은 물론, 상기 전체문서 파일의 전수 검색에 따른 상기 전체문서 파일의 각기 다른 페이지마다 적어도 하나 이상의 상기 검색 키워드가 기재되어 있는지를 판별해 상기 전체 문서 파일 중에서 상기 검색 키워드가 적어도 하나 이상 기재된 페이지를 포함한 문서 파일을 찾아내는 것을 특징으로 하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템.
  3. 제 1 항에 있어서, 상기 문자판독 및 문서파일 선별 제공부는,
    상기 문자판독 완료시, 읽기용으로만 제한되었던 상기 문서 파일을 읽기/쓰기 겸용 문서파일로 변환 및 생성시켜 상기 상세 글들을 내용 검토하고자 하는 전문가 통신 단말기에게 유,무상 결제 승인 후에 정보 제공 또는 파일 다운로드해주며,
    상기 읽기/쓰기 겸용 문서 파일에 속하는 한컴오피스 워드파일, MS오피스 워드파일, 구글 워드파일, 텍스트 워드파일 중 선택된 하나를 생성시키는 것을 특징으로 하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템.
  4. 제 1 항에 있어서,
    상기 선택된 문서 파일로부터 확인 가능한 파일명, 파일 간략설명, 파일 연결프로그램명, 파일 저작자명, 파일크기, 파일생성 년월일, 파일다운로드 년월일, 파일 출처명, 페이지 수, 파일경로를 포함하는 메타정보 그대로를 화면 디스플레이하거나 상기 메타정보의 정보보안 및 정보유출 방지를 위해 상기 메타정보 중 일부를 2진수, 8진수 혹은 16진수로 선택 변환해 화면 디스플레이하는 메타정보 자동 오픈부를 더 포함하는 것을 특징으로 하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템.
  5. 제 1 항에 있어서, 상기 문자판독 및 문서파일 선별 제공부는,
    상기 검색 키워드가 적어도 하나 이상 기재된 페이지마다 나타난 검색 키워드를 대상으로 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체 표시로 화면 디스플레이되도록 설정해 둠으로써, 상기 검색 키워드에 대한 중요성이 상기 내용 검토시 강조되게끔 지원해 주는 것을 포함하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템.
  6. 제 1 항에 있어서, 상기 문자판독 및 문서파일 선별 제공부는,
    상기 페이지마다 표기된 상기 검색 키워드 외에 적어도 3회 이상 반복적으로 등장한 다른 검색 키워드를 파생 키워드로 설정해 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체로 상기 검색 키워드와 다르게 구분 표시해 주는 것을 특징으로 하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템.
  7. 제 1 항에 있어서, 상기 문자판독 및 문서파일 선별 제공부는,
    상기 선택된 문서 파일의 각 페이지마다 적어도 하나 이상 표현된 상기 검색 키워드의 수를 카운트하여 상기 검색 키워드 수가 가장 많은 페이지 순서대로 정렬하거나 상기 검색 키워드가 가장 적은 페이지 순서대로 정렬하며, 상기 화면 디스플레이시 현재 화면상에 구현된 상기 페이지의 쪽번호와 상기 검색 키워드의 수를 함께 표시해 주는 것을 특징으로 하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템.
  8. 파일 리스트정보 열람부가 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시하는 단계;
    파일 리스트정보 열람부가 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 단계;
    문자판독 및 문서파일 선별 제공부가 상기 파일 리스트정보 열람부로부터 인지되는 상기 적어도 하나의 문서 파일 중 어느 하나를 선택하는 단계;
    상기 문자판독 및 문서파일 선별 제공부가 OCR(optical character reader) 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 문자판독하는 단계;
    상기 문자판독 및 문서파일 선별 제공부가 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 적어도 하나 이상 기재된 페이지만 선별 치합하는 단계; 및
    상기 문자판독 및 문서파일 선별 제공부가 페이지 업-다운 버튼조작시 상기 선별 치합된 적어도 하나의 페이지 상에 기재된 상세 글들이 내용 검토될 수 있도록 화면 디스플레이하는 단계를 포함하는 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템의 구동방법.
KR1020210046681A 2021-04-09 2021-04-09 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법 KR102546690B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210046681A KR102546690B1 (ko) 2021-04-09 2021-04-09 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210046681A KR102546690B1 (ko) 2021-04-09 2021-04-09 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법

Publications (2)

Publication Number Publication Date
KR20220140321A true KR20220140321A (ko) 2022-10-18
KR102546690B1 KR102546690B1 (ko) 2023-06-22

Family

ID=83803515

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210046681A KR102546690B1 (ko) 2021-04-09 2021-04-09 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법

Country Status (1)

Country Link
KR (1) KR102546690B1 (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000072482A (ko) 2000-09-06 2000-12-05 이재학 이용자의 검색을 용이하게 하는 인터넷 검색 시스템 및 그방법
JP2004157668A (ja) * 2002-11-05 2004-06-03 Ricoh Co Ltd 検索システム、検索方法および検索プログラム
KR20080076585A (ko) * 2007-02-16 2008-08-20 강민수 문서보안용 검색기능을 제공하는 네트워크 검색서버,네트워크 검색서버의 검색방법, 문서보안용 검색기능을제공하는 화상형성장치, 문서보안용 네트워크 검색기능을제공하는 네트워크 보안 시스템 및 기록매체
KR101100830B1 (ko) 2009-10-27 2012-01-02 주식회사 버즈니 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법
KR20120003834A (ko) 2011-11-24 2012-01-11 주식회사 버즈니 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법
JP2015018371A (ja) * 2013-07-10 2015-01-29 キヤノン株式会社 情報検索システム、サーバ装置、情報処理装置、サーバ装置の制御方法、情報処理装置の制御方法、及びプログラム
KR20150136809A (ko) 2014-05-28 2015-12-08 네이버 주식회사 이미지 파일의 메타데이터를 이용한 이미지 제공 방법과 시스템 및 기록 매체

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000072482A (ko) 2000-09-06 2000-12-05 이재학 이용자의 검색을 용이하게 하는 인터넷 검색 시스템 및 그방법
JP2004157668A (ja) * 2002-11-05 2004-06-03 Ricoh Co Ltd 検索システム、検索方法および検索プログラム
KR20080076585A (ko) * 2007-02-16 2008-08-20 강민수 문서보안용 검색기능을 제공하는 네트워크 검색서버,네트워크 검색서버의 검색방법, 문서보안용 검색기능을제공하는 화상형성장치, 문서보안용 네트워크 검색기능을제공하는 네트워크 보안 시스템 및 기록매체
KR101100830B1 (ko) 2009-10-27 2012-01-02 주식회사 버즈니 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법
KR20120003834A (ko) 2011-11-24 2012-01-11 주식회사 버즈니 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법
JP2015018371A (ja) * 2013-07-10 2015-01-29 キヤノン株式会社 情報検索システム、サーバ装置、情報処理装置、サーバ装置の制御方法、情報処理装置の制御方法、及びプログラム
KR20150136809A (ko) 2014-05-28 2015-12-08 네이버 주식회사 이미지 파일의 메타데이터를 이용한 이미지 제공 방법과 시스템 및 기록 매체

Also Published As

Publication number Publication date
KR102546690B1 (ko) 2023-06-22

Similar Documents

Publication Publication Date Title
US10885078B2 (en) Apparatus and method for automated and assisted patent claim mapping and expense planning
US7333984B2 (en) Methods for document indexing and analysis
US7814102B2 (en) Method and system for linking documents with multiple topics to related documents
US9659084B1 (en) System, methods, and user interface for presenting information from unstructured data
US7403932B2 (en) Text differentiation methods, systems, and computer program products for content analysis
US5819259A (en) Searching media and text information and categorizing the same employing expert system apparatus and methods
AU2010249253B2 (en) A method for automatically indexing documents
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
US8886661B2 (en) Information extraction system, information extraction method, information extraction program, and information service system
US20050177555A1 (en) System and method for providing information on a set of search returned documents
US20020049705A1 (en) Method for creating content oriented databases and content files
KR102237274B1 (ko) 키워드의 중요도에 의한 사용자간의 매칭정보를 제공하는 시스템 및 방법
JP2008071372A (ja) データベースのデータを検索するための方法と装置
Chumtong et al. Beyond the Google ngram viewer
KR101803150B1 (ko) 빅데이터를 이용한 중요 판례 추출 및 정리 방법
US8881007B2 (en) Method and system for visual cues to facilitate navigation through an ordered set of documents
JP2001134600A (ja) 情報抽出システム、情報抽出方法および情報抽出用プログラムを記録した記録媒体
JP2014102626A (ja) レコメンド装置、プログラム、および方法
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
KR100616152B1 (ko) 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법
JP2005190284A (ja) 情報分類装置および情報分類方法
US20010051942A1 (en) Information retrieval user interface method
JP2014102625A (ja) 情報検索システム、プログラム、および方法
KR20100031912A (ko) 데이터베이스의 개체유형을 이용한 자동 완성 검색 시스템 및 방법 및 프로그램 소스를 기록한 기록매체
KR102546690B1 (ko) 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant