KR20220146923A - 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법 - Google Patents

검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법 Download PDF

Info

Publication number
KR20220146923A
KR20220146923A KR1020210053824A KR20210053824A KR20220146923A KR 20220146923 A KR20220146923 A KR 20220146923A KR 1020210053824 A KR1020210053824 A KR 1020210053824A KR 20210053824 A KR20210053824 A KR 20210053824A KR 20220146923 A KR20220146923 A KR 20220146923A
Authority
KR
South Korea
Prior art keywords
file
search
document
page
priority
Prior art date
Application number
KR1020210053824A
Other languages
English (en)
Other versions
KR102594717B1 (ko
Inventor
임황용
김현종
Original Assignee
주식회사 글로벌제조혁신네트웍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 글로벌제조혁신네트웍 filed Critical 주식회사 글로벌제조혁신네트웍
Priority to KR1020210053824A priority Critical patent/KR102594717B1/ko
Publication of KR20220146923A publication Critical patent/KR20220146923A/ko
Application granted granted Critical
Publication of KR102594717B1 publication Critical patent/KR102594717B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • G06F16/1794Details of file format conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04806Zoom, i.e. interaction techniques or interactors for controlling the zooming operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 문서관리 및 빅데이터 처리 기술을 개시한다. 즉, 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이한다.

Description

검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법{Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same}
본 발명은 문서관리 및 빅데이터 처리 기술에 관한 것으로, 특히 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법에 관한 것이다.
일반적으로, 검색엔진은 인터넷상에 있는 수 많은 사이트들 중 자신이 찾고자 하는 정보를 포함하고 있는 사이트를 검색할 수 있도록 도와주는 인터넷 사이트를 말하며, 인터넷상에는 수백종의 검색엔진이 존재하고 있다.
검색엔진을 분류하는 기준에 대하여 공식적으로 정립된 바는 없지만, 일반적으로 검색엔진의 동작형태에 따라 주제별 검색엔진과 키워드형 검색엔진으로 구별되며, 키워드형 검색엔진은 다시 일반키워드형 검색 엔진, 프론트-앤드(Front-End)형 검색엔진, 지능형검색엔진으로 구분된다.
그러나, 모든 검색엔진들이 상기에서 언급한 것처럼 뚜렷이 구분되는 것이 아니며, 주제별 검색엔진의 대명사격인 '야후(YAHOO;상표명)'도 키워드 검색을 지원하고 있으며, 키워드형 검색엔진들 대부분도 주제별 검색 서비스를 동시에 제공하고 있다.
주제별 검색엔진이라 함은 인터넷에 있는 정보를 사회, 문화, 예술, 스포츠, 정치 등 큰 주제에 따라 분류해 놓은 목록을 제공하는 검색엔진을 말하는 것으로, 해당 주제에 해당하는 각종 정보를 목록으로 제공하기 때문에 디렉토리 서버, 주제별 카탈로그, 메뉴검색 등으로도 불려지며, 정보를 찾기 위한 특별한 주제어나 중심어를 뽑아낼 수 없는 상황일 때 사용하면 쉽게 해당정보에 접근할 수 있다는 장점이 있으나, 원하는 정보에 접근하기까지 '대분류 → 중분류 → 소분류 → 찾는정보'와 같이 여러 단계를 거쳐야 하므로 중간에 길을 잘못 설정하면 자신이 찾는 내용과 더욱 더 멀어질 가능성이 산재하고 있는 단점이 있다.
종래의, 키워드형 검색엔진은 인터넷에 있는 홈페이지의 내용과 URL(홈페이지 주소)을 자체 데이터베이스로 구축해 둔 것을 말하는 것으로, 단 몇개의 키워드(검색어)를 입력하여 원하는 정보를 신속하게 찾을 수 있다는 장점을 가지고 있으나, 정확한 키워드를 뽑아낼 수 없는 상황에서 키워드 검색을 실시할 경우, 엉뚱한 결과의 출력으로 많은 시간을 낭비하는 결과를 초래할 수 있는 단점이 있으며, 프론트-앤드형 검색엔진이란 많은 검색엔진을 한 화면에 모아놓은 것을 말하는 것으로, 자기 자신은 로봇, 스파이더, 크롤러 등을 이용한 정보 데이터베이스를 구축해 놓지 않고 여러 가지 엔진의 '검색어 입력창'만을 따로 모아서 제공하는 것이며, 다른 검색엔진으로 진입하는 전초기지 성격을 가진다하여 프론트-앤드형 검색엔진이라고 부르고 있고, 여러 가지의 검색엔진을 옮겨 다니면서 검색할 필요없이 한 화면안에서 다양한 검색엔진을 이용할 수 있을 뿐만 아니라 웹에 있는 HTML 문서만을 대상으로 검색하는 것이 아니라 공개 소프트웨어나 뉴스그룹 또는 학술문서까지도 찾아주는 아주 넓은 검색 영역을 가지고 잇다는 장점이 있지만 자기 자신은 데이터베이스를 갖고 있지 않기 때문에 각가의 검색엔진에서 사용할 수 있는 여러 가지 검색 옵션을 모두 지원해 주지 못하고 있으며, 정교한 검색을 이끌어내는 데 어느 정도 한게를 드러낸다는 단점이 있다.
최근에 인터넷 사용이 점차 활발해짐에 따라, 많은 사람들이 인터넷에서 예컨대, 블로그(Blog), 위키(Wiki)와 같은 매체를 통해서 자신의 의견을 표현하고 있는 추세이다. 또한, 특정한 정보의 가치를 평가할 때, 이러한 다른 사람들이 인터넷 상에 올려놓은 의견 정보를 참조하고자 하는 수요도 높아지고 있다.
예를 들면, 인터넷 상에는 상품 리뷰(Review)에서 영화 리뷰까지 다양한 사용자들의 의견이 존재한다. 이러한 각 사용자들의 의견들은 일반 사용자들이 물품을 구매하거나, 영화를 보기 전에 다른 사용자들의 의견을 보고자하는 경우에도 이용될 수 있으며, 마케팅 담당자나 주식 매매자 등이 각 물품이나 회사에 대한 일반 사용자들의 다양한 의견을 알고자 하는 경우에도 사용될 수 있다. 특히, 일반 사용자들은 특정 물품을 구매하기 전에 다른 사용자들의 평가를 먼저 보고 나서 이런 물품을 구매하려는 경향이 크다.
하지만, 이러한 인터넷 상에 존재하는 의견들은 개개의 웹사이트들에만 존재하여, 이러한 의견 정보들을 사용하고자 할 경우에는 사용자가 일일이 이러한 개개의 모든 웹사이트를 수동으로 찾아보아야 하는 번거로움이 존재한다.
이러한 모든 웹사이트들을 사용자들이 모두 찾아보기 어려우며 일반 검색으로 다른 사용자들의 의견을 찾고자 하는 경우에는 의견이 있는 웹 문서, 긍정적인 의견이 있는 웹 문서, 부정적인 의견이 있는 웹 문서 등이 혼재하여 효과적으로 다른 사용자들의 의견을 찾아보기 어려운 문제점이 있다.
이러한 문제점을 해결하기 위하여 국/내외 학계를 중심으로 사용자 의견 추출 기술이 활발하게 연구되고 있으며, 정보 검색 분야에서도 2000년도 초반부터 크게 발전하여 다양한 기술이 연구되고 있다.
그러나, 기존의 정보 검색 기술은 단순히 키워드가 존재하는 정보에 기반한 검색만 제공해주고 있을 뿐이고, 각 키워드가 등장하는 문서나 문장에서 긍정적/부정적으로 평가된 내용을 기반으로 한 좀더 고차원적인 검색까지 제공해주고 있지 못하고 있다. 최근에 사용자 의견 추출 기술을 정보 검색에 적용하려는 시도가 진행되고 있으나 아직도 단순히 긍정, 부정 문서를 나누는 수준에만 머무르고 있는 실정이다.
한국특허 등록번호 : 10-0869624-0000 한국특허 등록번호 : 10-2174462-0000 한국특허 등록번호 : 10-0903726-0000 한국특허 등록번호 : 10-0796905-0000
본 발명의 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법은 앞서 본 종래 기술의 문제점을 해결하기 위해 안출된 것으로, 본 발명의 제 1 목적은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이함으로써, 검색 키워드와 연관성이 높은 주요 핵심 문단을 대상으로 이를 집중분석하고 상세글에서 언급하고 있는 핵심 내용을 빠르고 정확하게 숙지할 수 있기 위함이다.
또한, 본 발명의 제 2 목적은 소프트웨어 개발한 문자판독 및 문단특출 시연용 컨텐츠(웹/앱)를 활용해 다수의 문서 파일 중 검색 키워드가 포함된 파일 리스트정보를 일목요연하게 모니티링하여 이를 가공해 정량데이터로 활성화시키거나 오피니언 분석이나 각종 통계분석에 적용되는 빅데이터로 유용하기 위함이다.
또한, 본 발명의 제 3 목적은 문서 파일을 선택해 열린 전체 페이지를 크롤링하여 전체 페이지를 대상으로 관심어이자 연관어인 검색 키워드가 기재된 페이지들을 검출한 후 이를 열람 가능토록 정보 제공해 줌으로써, 비관심사 분야도 함께 기술되어 있는 전체 페이지 모두를 시간을 드려 읽어야 하는 낭비적 요소를 최대한 줄이고, 독자의 선택적 사고 및 효율적 분석이 이루어지도록 소비자 맞춤 선택적독서 정보지원 서비스를 제공하기 위함이다.
상기의 과제를 달성하기 위한 본 발명은 다음과 같은 구성을 포함한다. 즉, 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템은, 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주며, 상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진으로 자동 파악해 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 파일 리스트정보 개시부; 및 상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택할 시, 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하고, 상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시함에 따라, 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키며, 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 문자판독 및 문단특출 개현부를 포함한다.
또한, 본 발명의 실시예에 따른 파일 리스트정보 개시부가 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시하는 단계; 상기 파일 리스트정보 개시부가 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 단계; 상기 파일 리스트정보 개시부가 상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진을 이용해 자동 파악하는 단계; 상기 파일 리스트정보 개시부가 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 단계; 문자판독 및 문단특출 개현부가 상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택하는 단계; 상기 문자판독 및 문단특출 개현부가 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하는 단계; 상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시하는 단계; 상기 문자판독 및 문단특출 개현부가 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키는 단계; 및 상기 문자판독 및 문단특출 개현부가 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 단계를 포함한다.
본 발명의 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이함으로써, 검색 키워드와 연관성이 높은 주요 핵심 문단을 대상으로 이를 집중분석하고 상세글에서 언급하고 있는 핵심 내용을 빠르고 정확하게 숙지허눈 제 1 효과를 준다.
또한, 본 발명은 소프트웨어 개발한 문자판독 및 문단특출 시연용 컨텐츠(웹/앱)를 활용해 다수의 문서 파일 중 검색 키워드가 포함된 파일 리스트정보를 일목요연하게 모니티링하여 이를 가공해 정량데이터로 활성화시키거나 오피니언 분석이나 각종 통계분석에 적용되는 빅데이터로 유용하는 제 2 효과를 준다.
또한, 본 발명은 문서 파일을 선택해 열린 전체 페이지를 크롤링하여 전체 페이지를 대상으로 관심어이자 연관어인 검색 키워드가 기재된 페이지들을 검출한 후 이를 열람 가능토록 정보 제공해 줌으로써, 비관심사 분야도 함께 기술되어 있는 전체 페이지 모두를 시간을 드려 읽어야 하는 낭비적 요소를 최대한 줄이고, 독자의 선택적 사고 및 효율적 분석이 이루어지도록 소비자 맞춤 선택적독서 정보지원 서비스를 제공하는 제 3 효과를 준다.
도 1은 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템을 도시한 도면이다.
도 2는 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템을 도시한 다른 도면이다.
도 3은 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 주요 구성요소가 문자판독 및 문단특출 시연용 컨텐츠상에 구현되어 나타난 도면이다.
도 4는 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법을 나타낸 순서도이다.
[실시예]
이하, 본 발명의 실시예에 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다.
도 1은 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템을 도시한 도면이다.
도 1를 참조하면, 본 발명의 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템(1000)은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진(400)을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 근접동작에 인해 바로 인지된 문단을 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이하는 시스템으로, 파일 리스트정보 개시부(100), 문자판독 및 문단특출 개현부(200), 메타정보 자동 표출부(300) 및 카운트 스크린 AI(artificial intelligence) 엔진(400)를 포함한다.
검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템(1000)은 앱/웹 접속이 가능하도록 소프트웨어 개발한 문자판독 및 문단특출 시연용 컨텐츠상에 파일 리스트정보 개시부(100), 문자판독 및 문단특출 개현부(200) 및 메타정보 자동 표출부(300) 및 카운트 스크린 AI(artificial intelligence) 엔진(400)을 탑재시켜 하기 동작이 구현되도록 시그널 프로세싱을 지원함에 유의한다.
좀 더 구체적으로, 파일 리스트정보 개시부(100)는 도 3를 통해 알수 있듯이, 검색창(110)에 검색 키워드를 입력해 데이터베이스부(미도시) 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시한다.
파일 리스트정보 개시부(100)는 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여준다.
또한, 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 파일 리스트정보 개시부(100)는 전체문서 파일의 각기 다른 페이지마다 표기된 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진(400)으로 자동 파악해 전체 문서 파일 중 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬한다.
파일 리스트정보 개시부(100)는 적어도 하나의 문서파일의 메타 정보 중 파일 연결프로그램명끼리 구분 정렬해 보여줄 수도 있고, 파일크기 순으로 내림차순 또는 오름차순으로 재정렬해 보여줄 수도 있으며, 파일생성 년월일이나 파일다운로드 년월일 자로 내림차순 또는 오른차순으로 재정렬해 보여준다.
문자판독 및 문단특출 개현부(200)는 파일 리스트정보 개시부(100)로부터 인지되는 문서 파일 중 어느 하나를 선택할 시, 카운트 스크린 AI 엔진(400)을 가동시켜 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 문자판독된 전체 페이지 중 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출한다.
또한, 문자판독 및 문단특출 개현부(200)는 카운트 스크린 AI 엔진(400)이 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시함으로 인해 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시, 문단들 중 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시킨다.
또한, 문자판독 및 문단특출 개현부(200)는 문단들 중 어느 하나에 표기된 검색 키워드들에 바탕색을 자동으로 부여하고, 배경면보다 돋보이도록 카운트 스크린 AI 엔진(400)을 이용해 색 보정을 실시한다.
문자판독 및 문단특출 개현부(200)는 문자판독 완료시, 읽기용으로만 제한되었던 문서 파일을 읽기/쓰기 겸용 문서파일로 변환 및 생성시켜 상세 글들을 내용 검토하고자 하는 고객 통신 단말기에게 유,무상 결제 승인 후에 정보 제공 또는 파일 다운로드해 준다.
또한, 문자판독 및 문단특출 개현부(200)는 읽기/쓰기 겸용 문서 파일에 속하는 한컴오피스 워드파일, MS오피스 워드파일, 구글 워드파일, 텍스트 워드파일 중 선택된 하나를 생성시킨다.
문자판독 및 문단특출 개현부(200)는 검색 키워드가 적어도 하나 이상 기재된 페이지마다 나타난 검색 키워드를 대상으로 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체 표시로 화면 디스플레이되도록 설정해 둠으로써, 검색 키워드에 대한 중요성이 내용 검토시 강조되게끔 지원해 준다.
문자판독 및 문단특출 개현부(200)는 페이지마다 표기된 검색 키워드 외에 적어도 3회 이상 반복적으로 등장한 다른 검색 키워드를 파생 키워드로 설정해 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체로 검색 키워드와 다르게 구분 표시해 준다.
문자판독 및 문단특출 개현부(200)는 선택된 문서 파일의 각 페이지마다 적어도 하나 이상 표현된 검색 키워드의 수를 카운트하여 검색 키워드 수가 가장 많은 페이지 순서대로 정렬하거나 검색 키워드가 가장 적은 페이지 순서대로 정렬하며, 화면 디스플레이시 현재 화면상에 구현된 페이지의 쪽번호와 검색 키워드의 수를 함께 표시해 준다.
본 발명의 따른 다른 실시예로, 문자판독 및 문단특출 개현부(200)는 마우스로 구분 표시된 문단들 중 어느 하나를 클릭할 시, 클릭한 어느 하나를 팝 업시켜 팝업창에 보이도록 디스플레이시킨다.
또한, 문자판독 및 문단특출 개현부(200)는 카운트 스크린 AI 엔진(400) 구동에 따른 자연어 처리(NLP)를 실시함에 따라, 클릭된 어느 하나에 기재된 문장 내 존재하는 주어, 목적어, 서술어를 필수 입력사항으로 하겠다는 조건 하에서 클릭된 어느 하나로부터 인지되는 문장을 간단히 요약 정리한 단문(요약서)을 자동 생성시킨다.
메타정보 자동 표출부(300)는 도 2에서도 도시되었듯이, 선택된 문서 파일로부터 확인 가능한 파일명, 파일 간략설명, 파일 연결프로그램명, 파일 저작자명, 파일크기, 파일생성 년월일, 파일다운로드 년월일, 파일 출처명, 페이지 수, 파일경로를 포함하는 메타정보 그대로를 화면 디스플레이하거나 메타정보의 정보보안 및 정보유출 방지를 위해 메타정보 중 일부를 2진수, 8진수 혹은 16진수로 선택 변환해 화면 디스플레이한다.
도 4는 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법을 나타낸 순서도이다.
도 4를 참조하면, 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이하는 구동방법이다.
먼저, 파일 리스트정보 개시부는 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시한다(S100).
파일 리스트정보 개시부는 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여준다(S200).
파일 리스트정보 개시부는 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 전체문서 파일의 각기 다른 페이지마다 표기된 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진을 이용해 자동 파악한다(S300).
파일 리스트정보 개시부는 전체 문서 파일 중 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬한다(S400).
문자판독 및 문단특출 개현부는 파일 리스트정보 개시부로부터 인지되는 문서 파일 중 어느 하나를 선택한다(S500).
문자판독 및 문단특출 개현부는 카운트 스크린 AI 엔진을 가동시켜 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 문자판독된 전체 페이지 중 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출한다(S600).
카운트 스크린 AI 엔진은 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시한다(S700).
문자판독 및 문단특출 개현부는 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시, 근접을 통해 바로 인식된 문단을 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시킨다(S800).
문자판독 및 문단특출 개현부는 어느 하나에 표기된 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 카운트 스크린 AI 엔진에서 구현되는 (비)강화학습에 따른 딥러닝 기법 또는 유전자 알고리즘을 활용해 색 보정을 실시한다(S900).
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬수 있음을 이해할 수 있을 것이다.
검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템(1000)
파일 리스트정보 개시부(100)
문자판독 및 문단특출 개현부(200)
메타정보 자동 표출부(300)
카운트 스크린 AI(400)

Claims (8)

  1. 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주며,
    상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진으로 자동 파악해 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 파일 리스트정보 개시부; 및
    상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택할 시, 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하고,
    상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시함에 따라, 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키며, 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 문자판독 및 문단특출 개현부를 포함하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
  2. 제 1 항에 있어서, 상기 파일 리스트정보 개시부는,
    상기 적어도 하나의 문서파일의 메타 정보 중 파일 연결 프로그램명끼리 구분 정렬해 보여줄 수도 있고, 파일크기 순으로 내림차순 또는 오름차순으로 재정렬해 보여줄 수도 있으며, 파일생성 년월일이나 파일다운로드 년월일자로 내림차순 또는 오름차순으로 재정렬해 보여주는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
  3. 제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
    상기 문자판독 완료시, 읽기용으로만 제한되었던 상기 문서 파일을 읽기/쓰기 겸용 문서파일로 변환 및 생성시켜 상기 상세글들을 내용 검토하고자 하는 고객 통신 단말기에게 유,무상 결제 승인 후에 정보 제공 또는 파일 다운로드해주며,
    상기 읽기/쓰기 겸용 문서 파일을 한컴오피스 워드파일, MS오피스 워드파일, 구글 워드파일, 텍스트 워드파일 중 선택된 하나로 생성시키는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
  4. 제 1 항에 있어서,
    상기 선택된 문서 파일로부터 확인 가능한 파일명, 파일 간략설명, 파일 연결프로그램명, 파일 저작자명, 파일크기, 파일생성 년월일, 파일다운로드 년월일, 파일 출처명, 페이지 수, 파일경로를 포함하는 메타정보 그대로를 화면 디스플레이하거나 상기 메타정보의 정보보안 및 정보유출 방지를 위해 상기 메타정보 중 일부를 2진수, 8진수 혹은 16진수로 선택 변환해 화면 디스플레이하는 메타정보 자동 표출부를 더 포함하는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
  5. 제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
    상기 검색 키워드가 적어도 하나 이상 기재된 페이지마다 나타난 검색 키워드를 대상으로 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체 표시로 화면 디스플레이되도록 설정해 둠으로써, 상기 검색 키워드에 대한 중요성이 상기 내용 검토시 강조되게끔 지원해 주는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
  6. 제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
    상기 페이지마다 표기된 상기 검색 키워드 외에 적어도 3회 이상 반복적으로 등장한 다른 검색 키워드를 파생 키워드로 설정해 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체로 상기 검색 키워드와 다르게 구분 표시해 주는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
  7. 제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
    상기 마우스로 상기 구분 표시된 문단들 중 어느 하나를 클릭할 시 상기 어느 하나를 팝 업시켜 팝업창에 보이도록 디스플레이시키며,
    상기 카운트 스크린 AI 엔진 구동에 따른 자연어 처리를 실시함에 따라, 상기 어느 하나에 기재된 문장 내 존재하는 주어, 목적어, 서술어를 필수 입력사항으로 둔 전제하에 상기 문장이 간단히 요약된 단문을 생성시키는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
  8. 파일 리스트정보 개시부가 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시하는 단계;
    상기 파일 리스트정보 개시부가 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 단계;
    상기 파일 리스트정보 개시부가 상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진을 이용해 자동 파악하는 단계;
    상기 파일 리스트정보 개시부가 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 단계;
    문자판독 및 문단특출 개현부가 상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택하는 단계;
    상기 문자판독 및 문단특출 개현부가 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하는 단계;
    상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시하는 단계;
    상기 문자판독 및 문단특출 개현부가 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키는 단계; 및
    상기 문자판독 및 문단특출 개현부가 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 단계를 포함하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법.
KR1020210053824A 2021-04-26 2021-04-26 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법 KR102594717B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210053824A KR102594717B1 (ko) 2021-04-26 2021-04-26 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210053824A KR102594717B1 (ko) 2021-04-26 2021-04-26 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법

Publications (2)

Publication Number Publication Date
KR20220146923A true KR20220146923A (ko) 2022-11-02
KR102594717B1 KR102594717B1 (ko) 2023-10-26

Family

ID=84084526

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210053824A KR102594717B1 (ko) 2021-04-26 2021-04-26 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법

Country Status (1)

Country Link
KR (1) KR102594717B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH036664A (ja) * 1989-06-02 1991-01-14 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法
KR100796905B1 (ko) 2006-06-29 2008-01-22 (재)한국데이터베이스진흥센터 데이터베이스 품질관리 시스템
KR100869624B1 (ko) 2000-03-16 2008-11-21 마이크로소프트 코포레이션 우선 순위화 시스템, 및 우선 순위 생성 및 관리를 제공하는 방법 및 시스템
KR100903726B1 (ko) 2006-09-20 2009-06-19 (재)한국데이터베이스진흥센터 데이터 품질 관리 성숙도 평가 시스템
KR102174462B1 (ko) 2018-05-15 2020-11-05 엑사비스 주식회사 네트워크 보안 방법 및 이를 수행하는 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH036664A (ja) * 1989-06-02 1991-01-14 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法
KR100869624B1 (ko) 2000-03-16 2008-11-21 마이크로소프트 코포레이션 우선 순위화 시스템, 및 우선 순위 생성 및 관리를 제공하는 방법 및 시스템
KR100796905B1 (ko) 2006-06-29 2008-01-22 (재)한국데이터베이스진흥센터 데이터베이스 품질관리 시스템
KR100903726B1 (ko) 2006-09-20 2009-06-19 (재)한국데이터베이스진흥센터 데이터 품질 관리 성숙도 평가 시스템
KR102174462B1 (ko) 2018-05-15 2020-11-05 엑사비스 주식회사 네트워크 보안 방법 및 이를 수행하는 시스템

Also Published As

Publication number Publication date
KR102594717B1 (ko) 2023-10-26

Similar Documents

Publication Publication Date Title
Koch et al. VarifocalReader—in-depth visual analysis of large text documents
US9659071B2 (en) Patent mapping
US7403932B2 (en) Text differentiation methods, systems, and computer program products for content analysis
US9659084B1 (en) System, methods, and user interface for presenting information from unstructured data
US6078924A (en) Method and apparatus for performing data collection, interpretation and analysis, in an information platform
US8347237B2 (en) Method, apparatus, and program product for efficiently detecting relationships in a comprehension state of a collection of information
US10108720B2 (en) Automatically providing relevant search results based on user behavior
US20080141126A1 (en) Method and system to aid in viewing digital content
US20020062302A1 (en) Methods for document indexing and analysis
US20020049705A1 (en) Method for creating content oriented databases and content files
US20110270876A1 (en) Method and system for filtering information
Luz et al. Methods and visualization tools for the analysis of medical, political and scientific concepts in Genealogies of Knowledge
Skeppstedt et al. Topics2Themes: Computer-Assisted Argument Extraction by Visual Analysis of Important Topics
JP2005190284A (ja) 情報分類装置および情報分類方法
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
KR20100031912A (ko) 데이터베이스의 개체유형을 이용한 자동 완성 검색 시스템 및 방법 및 프로그램 소스를 기록한 기록매체
Kuckartz et al. Working with bibliographic information and creating literature reviews
JP2014102625A (ja) 情報検索システム、プログラム、および方法
KR20050074058A (ko) 인터넷상에서 기사를 자동분류하여 타 웹사이트에자동송출하는 시스템 및 그 제어방법
KR102594717B1 (ko) 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법
KR102546690B1 (ko) 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법
Sattar Chaudhry Assessment of taxonomy building tools
Shneiderman Designing information-abundant websites
CN110297629A (zh) 一种编程控件的智能布局与排序方法及系统
Arora et al. Web‐Based News Straining and Summarization Using Machine Learning Enabled Communication Techniques for Large‐Scale 5G Networks

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant