KR102594717B1 - Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same - Google Patents

Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same Download PDF

Info

Publication number
KR102594717B1
KR102594717B1 KR1020210053824A KR20210053824A KR102594717B1 KR 102594717 B1 KR102594717 B1 KR 102594717B1 KR 1020210053824 A KR1020210053824 A KR 1020210053824A KR 20210053824 A KR20210053824 A KR 20210053824A KR 102594717 B1 KR102594717 B1 KR 102594717B1
Authority
KR
South Korea
Prior art keywords
file
search
document
search keywords
priority
Prior art date
Application number
KR1020210053824A
Other languages
Korean (ko)
Other versions
KR20220146923A (en
Inventor
임황용
김현종
Original Assignee
주식회사 글로벌제조혁신네트웍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 글로벌제조혁신네트웍 filed Critical 주식회사 글로벌제조혁신네트웍
Priority to KR1020210053824A priority Critical patent/KR102594717B1/en
Publication of KR20220146923A publication Critical patent/KR20220146923A/en
Application granted granted Critical
Publication of KR102594717B1 publication Critical patent/KR102594717B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • G06F16/1794Details of file format conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04806Zoom, i.e. interaction techniques or interactors for controlling the zooming operation

Abstract

본 발명은 문서관리 및 빅데이터 처리 기술을 개시한다. 즉, 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이한다.The present invention discloses document management and big data processing technology. In other words, the priority-based selection document adoption system and driving method according to the multiple notation of search keywords according to an embodiment of the present invention determines the number of search keywords indicated on each page of the entire document file through a count screen AI (artificial intelligence) engine. In addition, when the mouse approaches one of the paragraphs described on the page that are sequentially arranged based on the number of search keywords revealed in all pages of the selected document file among all document files, any one of the above is zoomed in. Displays in enlarged and embossed three-dimensional form.

Description

검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법{Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same}Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same}

본 발명은 문서관리 및 빅데이터 처리 기술에 관한 것으로, 특히 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법에 관한 것이다.The present invention relates to document management and big data processing technology. In particular, the number of search keywords indicated on each page of the entire document file is identified through a count screen AI (artificial intelligence) engine, and the total page of the selected document file among the entire document file is identified. When the mouse approaches one of the paragraphs described on the page, which are sequentially arranged based on the number of search keywords revealed in the search keyword, one of the paragraphs is zoomed in and displayed in an enlarged and embossed three-dimensional shape. This relates to a priority-based selection document adoption system and its operation method according to multiple notations.

일반적으로, 검색엔진은 인터넷상에 있는 수 많은 사이트들 중 자신이 찾고자 하는 정보를 포함하고 있는 사이트를 검색할 수 있도록 도와주는 인터넷 사이트를 말하며, 인터넷상에는 수백종의 검색엔진이 존재하고 있다.In general, a search engine refers to an Internet site that helps users search for sites that contain the information they are looking for among the numerous sites on the Internet. There are hundreds of search engines on the Internet.

검색엔진을 분류하는 기준에 대하여 공식적으로 정립된 바는 없지만, 일반적으로 검색엔진의 동작형태에 따라 주제별 검색엔진과 키워드형 검색엔진으로 구별되며, 키워드형 검색엔진은 다시 일반키워드형 검색 엔진, 프론트-앤드(Front-End)형 검색엔진, 지능형검색엔진으로 구분된다.Although there are no officially established standards for classifying search engines, they are generally divided into topic-specific search engines and keyword-type search engines depending on the operation mode of the search engine. Keyword-type search engines are further divided into general keyword-type search engines and front-end search engines. -It is divided into front-end search engines and intelligent search engines.

그러나, 모든 검색엔진들이 상기에서 언급한 것처럼 뚜렷이 구분되는 것이 아니며, 주제별 검색엔진의 대명사격인 '야후(YAHOO;상표명)'도 키워드 검색을 지원하고 있으며, 키워드형 검색엔진들 대부분도 주제별 검색 서비스를 동시에 제공하고 있다.However, not all search engines are clearly differentiated as mentioned above, and 'YAHOO (brand name)', a synonym for topical search engines, also supports keyword search, and most keyword-type search engines also provide topical search services. provided at the same time.

주제별 검색엔진이라 함은 인터넷에 있는 정보를 사회, 문화, 예술, 스포츠, 정치 등 큰 주제에 따라 분류해 놓은 목록을 제공하는 검색엔진을 말하는 것으로, 해당 주제에 해당하는 각종 정보를 목록으로 제공하기 때문에 디렉토리 서버, 주제별 카탈로그, 메뉴검색 등으로도 불려지며, 정보를 찾기 위한 특별한 주제어나 중심어를 뽑아낼 수 없는 상황일 때 사용하면 쉽게 해당정보에 접근할 수 있다는 장점이 있으나, 원하는 정보에 접근하기까지 '대분류 → 중분류 → 소분류 → 찾는정보'와 같이 여러 단계를 거쳐야 하므로 중간에 길을 잘못 설정하면 자신이 찾는 내용과 더욱 더 멀어질 가능성이 산재하고 있는 단점이 있다.A thematic search engine refers to a search engine that provides a list of information on the Internet classified according to major topics such as society, culture, art, sports, and politics. It provides a list of various information corresponding to the topic. Therefore, it is also called a directory server, subject catalog, menu search, etc., and has the advantage of being able to easily access the information when used in situations where it is not possible to extract special keywords or key words to find information, but it is difficult to access the desired information. Since you have to go through several steps such as 'major category → middle category → small category → information you are looking for', there is a risk that if you set the wrong path in the middle, you may end up further away from what you are looking for.

종래의, 키워드형 검색엔진은 인터넷에 있는 홈페이지의 내용과 URL(홈페이지 주소)을 자체 데이터베이스로 구축해 둔 것을 말하는 것으로, 단 몇개의 키워드(검색어)를 입력하여 원하는 정보를 신속하게 찾을 수 있다는 장점을 가지고 있으나, 정확한 키워드를 뽑아낼 수 없는 상황에서 키워드 검색을 실시할 경우, 엉뚱한 결과의 출력으로 많은 시간을 낭비하는 결과를 초래할 수 있는 단점이 있으며, 프론트-앤드형 검색엔진이란 많은 검색엔진을 한 화면에 모아놓은 것을 말하는 것으로, 자기 자신은 로봇, 스파이더, 크롤러 등을 이용한 정보 데이터베이스를 구축해 놓지 않고 여러 가지 엔진의 '검색어 입력창'만을 따로 모아서 제공하는 것이며, 다른 검색엔진으로 진입하는 전초기지 성격을 가진다하여 프론트-앤드형 검색엔진이라고 부르고 있고, 여러 가지의 검색엔진을 옮겨 다니면서 검색할 필요없이 한 화면안에서 다양한 검색엔진을 이용할 수 있을 뿐만 아니라 웹에 있는 HTML 문서만을 대상으로 검색하는 것이 아니라 공개 소프트웨어나 뉴스그룹 또는 학술문서까지도 찾아주는 아주 넓은 검색 영역을 가지고 잇다는 장점이 있지만 자기 자신은 데이터베이스를 갖고 있지 않기 때문에 각가의 검색엔진에서 사용할 수 있는 여러 가지 검색 옵션을 모두 지원해 주지 못하고 있으며, 정교한 검색을 이끌어내는 데 어느 정도 한게를 드러낸다는 단점이 있다.A conventional, keyword-type search engine refers to one that has built its own database of the contents and URLs (homepage addresses) of homepages on the Internet. It has the advantage of being able to quickly find the information you want by entering just a few keywords (search terms). However, if you perform a keyword search in a situation where the correct keyword cannot be extracted, it has the disadvantage of resulting in wasting a lot of time by outputting incorrect results, and a front-end search engine is one that uses many search engines. This refers to what is collected on the screen, and does not build an information database using robots, spiders, crawlers, etc., but only collects and provides 'search term input windows' of various engines, and is an outpost for entering other search engines. It is called a front-end search engine, and not only can you use a variety of search engines on one screen without having to move around and search through multiple search engines, but it also allows you to search not only for HTML documents on the web, but also for public search engines. It has the advantage of having a very wide search area that can even find software, newsgroups, or academic documents, but since it does not have its own database, it cannot support all of the various search options that can be used in each search engine, and it cannot support all the various search options that can be used in each search engine. It has the disadvantage of revealing a certain amount of information in leading searches.

최근에 인터넷 사용이 점차 활발해짐에 따라, 많은 사람들이 인터넷에서 예컨대, 블로그(Blog), 위키(Wiki)와 같은 매체를 통해서 자신의 의견을 표현하고 있는 추세이다. 또한, 특정한 정보의 가치를 평가할 때, 이러한 다른 사람들이 인터넷 상에 올려놓은 의견 정보를 참조하고자 하는 수요도 높아지고 있다.Recently, as Internet use has become increasingly active, many people are expressing their opinions on the Internet through media such as blogs and wikis. Additionally, when evaluating the value of specific information, there is a growing demand to refer to opinion information posted by others on the Internet.

예를 들면, 인터넷 상에는 상품 리뷰(Review)에서 영화 리뷰까지 다양한 사용자들의 의견이 존재한다. 이러한 각 사용자들의 의견들은 일반 사용자들이 물품을 구매하거나, 영화를 보기 전에 다른 사용자들의 의견을 보고자하는 경우에도 이용될 수 있으며, 마케팅 담당자나 주식 매매자 등이 각 물품이나 회사에 대한 일반 사용자들의 다양한 의견을 알고자 하는 경우에도 사용될 수 있다. 특히, 일반 사용자들은 특정 물품을 구매하기 전에 다른 사용자들의 평가를 먼저 보고 나서 이런 물품을 구매하려는 경향이 크다.For example, there are a variety of user opinions on the Internet, ranging from product reviews to movie reviews. These opinions of each user can also be used when general users want to see the opinions of other users before purchasing a product or watching a movie, and marketers, stock traders, etc. can use the various opinions of general users about each product or company. It can also be used when you want to know. In particular, general users have a strong tendency to read other users' reviews before purchasing a specific product and then purchase that product.

하지만, 이러한 인터넷 상에 존재하는 의견들은 개개의 웹사이트들에만 존재하여, 이러한 의견 정보들을 사용하고자 할 경우에는 사용자가 일일이 이러한 개개의 모든 웹사이트를 수동으로 찾아보아야 하는 번거로움이 존재한다.However, the opinions that exist on the Internet exist only on individual websites, so when users want to use such opinion information, there is the inconvenience of having to manually search through each and every website.

이러한 모든 웹사이트들을 사용자들이 모두 찾아보기 어려우며 일반 검색으로 다른 사용자들의 의견을 찾고자 하는 경우에는 의견이 있는 웹 문서, 긍정적인 의견이 있는 웹 문서, 부정적인 의견이 있는 웹 문서 등이 혼재하여 효과적으로 다른 사용자들의 의견을 찾아보기 어려운 문제점이 있다.It is difficult for users to find all of these websites, and if they want to find other users' opinions through general search, web documents with opinions, web documents with positive opinions, and web documents with negative opinions are mixed, effectively different users. There is a problem where it is difficult to find their opinions.

이러한 문제점을 해결하기 위하여 국/내외 학계를 중심으로 사용자 의견 추출 기술이 활발하게 연구되고 있으며, 정보 검색 분야에서도 2000년도 초반부터 크게 발전하여 다양한 기술이 연구되고 있다.To solve these problems, user opinion extraction technology is being actively researched in academia at home and abroad, and in the field of information retrieval, there has been significant development since the early 2000s, and various technologies are being researched.

그러나, 기존의 정보 검색 기술은 단순히 키워드가 존재하는 정보에 기반한 검색만 제공해주고 있을 뿐이고, 각 키워드가 등장하는 문서나 문장에서 긍정적/부정적으로 평가된 내용을 기반으로 한 좀더 고차원적인 검색까지 제공해주고 있지 못하고 있다. 최근에 사용자 의견 추출 기술을 정보 검색에 적용하려는 시도가 진행되고 있으나 아직도 단순히 긍정, 부정 문서를 나누는 수준에만 머무르고 있는 실정이다.However, existing information retrieval technologies simply provide searches based on information where keywords exist, and also provide more high-level searches based on positively/negatively evaluated content in documents or sentences in which each keyword appears. I can't stay. Recently, attempts have been made to apply user opinion extraction technology to information retrieval, but they are still limited to simply dividing positive and negative documents.

한국특허 등록번호 : 10-0869624-0000Korean Patent Registration Number: 10-0869624-0000 한국특허 등록번호 : 10-2174462-0000Korean Patent Registration Number: 10-2174462-0000 한국특허 등록번호 : 10-0903726-0000Korean Patent Registration Number: 10-0903726-0000 한국특허 등록번호 : 10-0796905-0000Korean Patent Registration Number: 10-0796905-0000

본 발명의 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법은 앞서 본 종래 기술의 문제점을 해결하기 위해 안출된 것으로, 본 발명의 제 1 목적은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이함으로써, 검색 키워드와 연관성이 높은 주요 핵심 문단을 대상으로 이를 집중분석하고 상세글에서 언급하고 있는 핵심 내용을 빠르고 정확하게 숙지할 수 있기 위함이다.The priority-based selection document selection system and its operating method according to the multiple notation of search keywords of the present invention were devised to solve the problems of the prior art, and the first purpose of the present invention is to select The number of search keywords is determined through the count screen AI (artificial intelligence) engine, and the mouse moves the mouse to any one of the paragraphs described on the page that are sequentially arranged based on the number of search keywords revealed in all pages of the selected document file among all document files. When approaching, one of the above is zoomed in and displayed in an enlarged and embossed three-dimensional shape, thereby intensively analyzing key paragraphs that are highly related to the search keyword and key content mentioned in the detailed article. This is so that you can learn quickly and accurately.

또한, 본 발명의 제 2 목적은 소프트웨어 개발한 문자판독 및 문단특출 시연용 컨텐츠(웹/앱)를 활용해 다수의 문서 파일 중 검색 키워드가 포함된 파일 리스트정보를 일목요연하게 모니티링하여 이를 가공해 정량데이터로 활성화시키거나 오피니언 분석이나 각종 통계분석에 적용되는 빅데이터로 유용하기 위함이다.In addition, the second purpose of the present invention is to clearly monitor file list information containing search keywords among a large number of document files by utilizing software-developed text reading and paragraph special demonstration content (web/app) and process them. This is to activate it as quantitative data or to use it as big data applied to opinion analysis or various statistical analyses.

또한, 본 발명의 제 3 목적은 문서 파일을 선택해 열린 전체 페이지를 크롤링하여 전체 페이지를 대상으로 관심어이자 연관어인 검색 키워드가 기재된 페이지들을 검출한 후 이를 열람 가능토록 정보 제공해 줌으로써, 비관심사 분야도 함께 기술되어 있는 전체 페이지 모두를 시간을 드려 읽어야 하는 낭비적 요소를 최대한 줄이고, 독자의 선택적 사고 및 효율적 분석이 이루어지도록 소비자 맞춤 선택적독서 정보지원 서비스를 제공하기 위함이다.In addition, the third purpose of the present invention is to crawl all pages opened by selecting a document file, detect pages containing search keywords that are words of interest and related words for all pages, and then provide information so that they can be viewed, so that even fields of interest are not covered. This is to reduce as much as possible the wasteful elements of having to spend time reading all of the pages described together, and to provide a selective reading information support service tailored to consumers to enable readers to think selectively and analyze efficiently.

상기의 과제를 달성하기 위한 본 발명은 다음과 같은 구성을 포함한다. 즉, 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템은, 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주며, 상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진으로 자동 파악해 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 파일 리스트정보 개시부; 및 상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택할 시, 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하고, 상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시함에 따라, 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키며, 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 문자판독 및 문단특출 개현부를 포함한다.The present invention for achieving the above problems includes the following configuration. In other words, the priority-based selection document adoption system according to the multiple notation of search keywords according to an embodiment of the present invention performs an entire folder search or a specified folder search for all document files stored in the database by entering a search keyword in the search box. As a result, at least one document file included in the entire folder or a designated folder is searched and the first letter of the at least one document file is identified to generate and display file list information automatically sorted in Korean consonant order or alphabet order. When the entire folder search or the specified folder search operation is performed, the number of search keywords displayed on each different page of the entire document file is automatically identified by a count screen AI (artificial intelligence) engine that counts and screens the search keyword among the entire document file. A file list information start section that sorts document files including the most frequently listed pages in descending or ascending order; And when one of the document files recognized from the file list information start unit is selected, the count screen AI engine is activated to screen all pages of the selected document file and read the text, and among all the pages whose text has been read, the The page with the most search keywords is given priority and is called sequentially, and as the count screen AI engine divides the detailed articles written on the called page into paragraphs and automatically displays them differently, among the classified paragraphs When the mouse approaches any one of them, it zooms in and displays it in an enlarged and embossed three-dimensional shape, and automatically assigns a background color to the search keywords indicated in any one of them to color correct them so that they stand out from the background. Includes text reading and paragraph special opening section.

또한, 본 발명의 실시예에 따른 파일 리스트정보 개시부가 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시하는 단계; 상기 파일 리스트정보 개시부가 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 단계; 상기 파일 리스트정보 개시부가 상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진을 이용해 자동 파악하는 단계; 상기 파일 리스트정보 개시부가 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 단계; 문자판독 및 문단특출 개현부가 상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택하는 단계; 상기 문자판독 및 문단특출 개현부가 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하는 단계; 상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시하는 단계; 상기 문자판독 및 문단특출 개현부가 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키는 단계; 및 상기 문자판독 및 문단특출 개현부가 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 단계를 포함한다.In addition, the file list information starting unit according to an embodiment of the present invention enters a search keyword into a search box and performs an entire folder search or a designated folder search for all document files stored in the database unit; The file list information starting unit searches for at least one document file included in the entire folder or a designated folder and identifies the first letter of the at least one document file to generate file list information automatically sorted in Korean consonant order or alphabet order. step of showing; Automatically identifying, by the file list information starting unit, a count screen AI (artificial intelligence) engine that counts and screens the number of search keywords displayed on each different page of the entire document file when the entire folder search or designated folder search operation is performed; arranging, by the file list information starting unit, document files including pages on which the search keyword is most frequently described among all document files in descending or ascending order; selecting one of the document files recognized from the file list information start unit by a character reading and paragraph special opening unit; The character reading and paragraph special expression unit operates the count screen AI engine to screen all pages of the selected document file and read the characters, and gives priority to the page with the most search keywords among all the read text pages. sequentially calling steps; The count screen AI engine automatically displays detailed articles written on the called page separately by paragraph; When the character reading and paragraph special display unit approaches one of the classified paragraphs with a mouse, zooming in on one of the paragraphs and displaying it in an enlarged and embossed three-dimensional shape; And a step of automatically assigning a background color to the search keywords indicated in any one of the text reading and paragraph special expression units to perform color correction so that they stand out from the background.

본 발명의 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이함으로써, 검색 키워드와 연관성이 높은 주요 핵심 문단을 대상으로 이를 집중분석하고 상세글에서 언급하고 있는 핵심 내용을 빠르고 정확하게 숙지허눈 제 1 효과를 준다.The priority-based selection document adoption system and method for operating the same according to the multiple notation of search keywords of the present invention determines the number of search keywords indicated on each page of the entire document file through a count screen AI (artificial intelligence) engine, and determines the number of search keywords displayed on each page of the entire document file. When the mouse is brought close to any one of the paragraphs described on the page, which are sequentially arranged based on the number of search keywords revealed in all pages of the selected document file, any one of the paragraphs is zoomed in and displayed enlarged and embossed. By displaying it in a shape, it focuses on key paragraphs that are highly related to the search keyword and analyzes them, giving the first effect of quickly and accurately understanding the key content mentioned in the detailed article.

또한, 본 발명은 소프트웨어 개발한 문자판독 및 문단특출 시연용 컨텐츠(웹/앱)를 활용해 다수의 문서 파일 중 검색 키워드가 포함된 파일 리스트정보를 일목요연하게 모니티링하여 이를 가공해 정량데이터로 활성화시키거나 오피니언 분석이나 각종 통계분석에 적용되는 빅데이터로 유용하는 제 2 효과를 준다.In addition, the present invention utilizes software-developed text reading and paragraph special demonstration content (web/app) to clearly monitor file list information containing search keywords among a large number of document files, process them, and activate them as quantitative data. It gives a second effect that is useful as big data that is applied to opinion analysis or various statistical analyses.

또한, 본 발명은 문서 파일을 선택해 열린 전체 페이지를 크롤링하여 전체 페이지를 대상으로 관심어이자 연관어인 검색 키워드가 기재된 페이지들을 검출한 후 이를 열람 가능토록 정보 제공해 줌으로써, 비관심사 분야도 함께 기술되어 있는 전체 페이지 모두를 시간을 드려 읽어야 하는 낭비적 요소를 최대한 줄이고, 독자의 선택적 사고 및 효율적 분석이 이루어지도록 소비자 맞춤 선택적독서 정보지원 서비스를 제공하는 제 3 효과를 준다.In addition, the present invention crawls all pages opened by selecting a document file, detects pages containing search keywords that are words of interest and related words for all pages, and provides information so that they can be viewed, so that fields of interest are also described. It reduces as much as possible the wasteful elements of having to spend time reading the entire page, and provides a third effect of providing a customized selective reading information support service to enable readers to think selectively and analyze efficiently.

도 1은 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템을 도시한 도면이다.
도 2는 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템을 도시한 다른 도면이다.
도 3은 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 주요 구성요소가 문자판독 및 문단특출 시연용 컨텐츠상에 구현되어 나타난 도면이다.
도 4는 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법을 나타낸 순서도이다.
Figure 1 is a diagram illustrating a priority-based selection document selection system based on multiple notation of search keywords according to an embodiment of the present invention.
Figure 2 is another diagram showing a priority-based selection document selection system according to multiple notation of search keywords according to an embodiment of the present invention.
Figure 3 is a diagram showing the main components of the priority-based selection document selection system based on multiple notation of search keywords according to an embodiment of the present invention implemented on content for character reading and paragraph special demonstration.
Figure 4 is a flowchart showing a method of operating a priority-based selection document selection system according to multiple notation of search keywords according to an embodiment of the present invention.

[실시예][Example]

이하, 본 발명의 실시예에 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템을 도시한 도면이다.Figure 1 is a diagram illustrating a priority-based selection document selection system based on multiple notation of search keywords according to an embodiment of the present invention.

도 1를 참조하면, 본 발명의 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템(1000)은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진(400)을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 근접동작에 인해 바로 인지된 문단을 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이하는 시스템으로, 파일 리스트정보 개시부(100), 문자판독 및 문단특출 개현부(200), 메타정보 자동 표출부(300) 및 카운트 스크린 AI(artificial intelligence) 엔진(400)를 포함한다.Referring to FIG. 1, the priority-based selection document selection system 1000 according to the multiple notation of search keywords of the present invention uses a screen AI (artificial intelligence) engine 400 to count the number of search keywords indicated on each page of the entire document file. When the mouse approaches one of the paragraphs described on the page, which are sequentially arranged based on the number of search keywords revealed in all pages of the selected document file among all document files, the immediately recognized paragraph is displayed due to the proximity movement. It is a system that zooms in to enlarge and display in an embossed three-dimensional shape, including a file list information opening unit (100), a character reading and paragraph special opening unit (200), an automatic meta information display unit (300), and a count. Includes a screen AI (artificial intelligence) engine 400.

검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템(1000)은 앱/웹 접속이 가능하도록 소프트웨어 개발한 문자판독 및 문단특출 시연용 컨텐츠상에 파일 리스트정보 개시부(100), 문자판독 및 문단특출 개현부(200) 및 메타정보 자동 표출부(300) 및 카운트 스크린 AI(artificial intelligence) 엔진(400)을 탑재시켜 하기 동작이 구현되도록 시그널 프로세싱을 지원함에 유의한다.The priority-based selection document adoption system (1000) according to multiple notation of search keywords is a file list information start section (100), character reading and paragraph specialization content on text reading and paragraph special demonstration content developed by software to enable app/web access. Note that the special display unit 200, the automatic meta information display unit 300, and the count screen AI (artificial intelligence) engine 400 are mounted to support signal processing to implement the following operations.

좀 더 구체적으로, 파일 리스트정보 개시부(100)는 도 3를 통해 알수 있듯이, 검색창(110)에 검색 키워드를 입력해 데이터베이스부(미도시) 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시한다.More specifically, as can be seen in FIG. 3, the file list information initiating unit 100 enters a search keyword in the search box 110 to search the entire folder for all document files stored in the database unit (not shown). Performs a search of the specified folder.

파일 리스트정보 개시부(100)는 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여준다.The file list information initiator 100 searches for at least one document file included in the entire folder or a designated folder, and identifies the first letter of the at least one document file to provide file list information automatically sorted in Korean consonant order or alphabet order. Create it and show it.

또한, 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 파일 리스트정보 개시부(100)는 전체문서 파일의 각기 다른 페이지마다 표기된 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진(400)으로 자동 파악해 전체 문서 파일 중 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬한다.In addition, when searching an entire folder or searching a designated folder, the file list information initiator 100 automatically uses the count screen AI (artificial intelligence) engine 400 to count and screen the number of search keywords displayed on each different page of the entire document file. Sort document files including pages with the most search keywords among all document files in descending or ascending order.

파일 리스트정보 개시부(100)는 적어도 하나의 문서파일의 메타 정보 중 파일 연결프로그램명끼리 구분 정렬해 보여줄 수도 있고, 파일크기 순으로 내림차순 또는 오름차순으로 재정렬해 보여줄 수도 있으며, 파일생성 년월일이나 파일다운로드 년월일 자로 내림차순 또는 오른차순으로 재정렬해 보여준다.The file list information starting unit 100 may sort the meta information of at least one document file by sorting it by file connection program name, or rearrange it in descending or ascending order by file size, file creation date, or file download. It is rearranged in descending or ascending order by year, month, and date.

문자판독 및 문단특출 개현부(200)는 파일 리스트정보 개시부(100)로부터 인지되는 문서 파일 중 어느 하나를 선택할 시, 카운트 스크린 AI 엔진(400)을 가동시켜 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 문자판독된 전체 페이지 중 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출한다.When the character reading and paragraph special opening unit 200 selects one of the document files recognized from the file list information opening unit 100, it operates the count screen AI engine 400 to screen all pages of the selected document file. It reads text and calls it sequentially, giving priority starting from the page with the most search keywords among all pages read .

또한, 문자판독 및 문단특출 개현부(200)는 카운트 스크린 AI 엔진(400)이 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시함으로 인해 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시, 문단들 중 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시킨다.In addition, the character reading and paragraph special display unit 200 automatically displays the detailed text written on the page on which the count screen AI engine 400 is called by dividing it into paragraphs, so that the mouse approaches any one of the classified paragraphs. When doing so, one of the paragraphs is zoomed in and displayed in an enlarged and embossed three-dimensional shape.

또한, 문자판독 및 문단특출 개현부(200)는 문단들 중 어느 하나에 표기된 검색 키워드들에 바탕색을 자동으로 부여하고, 배경면보다 돋보이도록 카운트 스크린 AI 엔진(400)을 이용해 색 보정을 실시한다.In addition, the character reading and paragraph special display unit 200 automatically assigns a background color to the search keywords indicated in one of the paragraphs and performs color correction using the count screen AI engine 400 to make it stand out from the background.

문자판독 및 문단특출 개현부(200)는 문자판독 완료시, 읽기용으로만 제한되었던 문서 파일을 읽기/쓰기 겸용 문서파일로 변환 및 생성시켜 상세 글들을 내용 검토하고자 하는 고객 통신 단말기에게 유,무상 결제 승인 후에 정보 제공 또는 파일 다운로드해 준다.Upon completion of text reading, the text reading and paragraph special display unit 200 converts and creates document files that were limited for reading only into read/write document files for a fee or free of charge to customer communication terminals who wish to review detailed texts. After payment approval, information is provided or files are downloaded.

또한, 문자판독 및 문단특출 개현부(200)는 읽기/쓰기 겸용 문서 파일에 속하는 한컴오피스 워드파일, MS오피스 워드파일, 구글 워드파일, 텍스트 워드파일 중 선택된 하나를 생성시킨다.In addition, the character reading and paragraph special expression unit 200 generates a selected one of a Hancom Office Word file, an MS Office Word file, a Google Word file, and a text Word file that belong to read/write document files.

문자판독 및 문단특출 개현부(200)는 검색 키워드가 적어도 하나 이상 기재된 페이지마다 나타난 검색 키워드를 대상으로 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체 표시로 화면 디스플레이되도록 설정해 둠으로써, 검색 키워드에 대한 중요성이 내용 검토시 강조되게끔 지원해 준다.The character reading and paragraph special display unit 200 sets the screen to be displayed with different colors, different thicknesses, underlines, and different fonts for the search keywords that appear on each page where at least one search keyword is listed, so that the search keywords are displayed. We provide support so that the importance of is emphasized when reviewing the content.

문자판독 및 문단특출 개현부(200)는 페이지마다 표기된 검색 키워드 외에 적어도 3회 이상 반복적으로 등장한 다른 검색 키워드를 파생 키워드로 설정해 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체로 검색 키워드와 다르게 구분 표시해 준다.In addition to the search keywords indicated on each page, the character reading and paragraph special expression unit 200 sets other search keywords that appear repeatedly at least three times as derived keywords and uses different colors, different thicknesses, underlines, and different fonts to differentiate them from the search keywords. Indicates distinction.

문자판독 및 문단특출 개현부(200)는 카운트 스크린 AI 엔진(400)을 가동시켜 선택된 문서 파일의 각 페이지마다 적어도 하나 이상 표현된 검색 키워드의 수를 카운트하여 검색 키워드 수가 가장 많은 페이지 순서대로 정렬하거나 검색 키워드가 가장 적은 페이지 순서대로 정렬하며, 화면 디스플레이시 현재 화면상에 구현된 페이지의 쪽번호와 검색 키워드의 수를 함께 표시해 준다.The character reading and paragraph special expression unit 200 operates the count screen AI engine 400 to count the number of search keywords expressed at least one on each page of the selected document file and sorts them in order of pages with the highest number of search keywords. Pages with the fewest search keywords are sorted in order, and when displaying the screen, the page number of the page currently implemented on the screen and the number of search keywords are displayed together.

본 발명의 따른 다른 실시예로, 문자판독 및 문단특출 개현부(200)는 마우스로 구분 표시된 문단들 중 어느 하나를 클릭할 시, 클릭한 어느 하나를 팝 업시켜 팝업창에 보이도록 디스플레이시킨다.In another embodiment according to the present invention, when the character reading and paragraph special display unit 200 clicks on any one of the paragraphs displayed separately with a mouse, the clicked one pops up and displays it to be visible in a pop-up window.

또한, 문자판독 및 문단특출 개현부(200)는 카운트 스크린 AI 엔진(400) 구동에 따른 자연어 처리(NLP)를 실시함에 따라, 클릭된 어느 하나에 기재된 문장 내 존재하는 주어, 목적어, 서술어를 필수 입력사항으로 하겠다는 조건 하에서 클릭된 어느 하나로부터 인지되는 문장을 간단히 요약 정리한 단문(요약서)을 자동 생성시킨다.In addition, as the character reading and paragraph special expression unit 200 performs natural language processing (NLP) according to the operation of the count screen AI engine 400, the subject, object, and predicate existing in the sentence described in any clicked item are essential. Under the condition that it be used as an input, a short sentence (summary) is automatically generated that simply summarizes the sentences recognized from any one clicked.

메타정보 자동 표출부(300)는 도 2에서도 도시되었듯이, 선택된 문서 파일로부터 확인 가능한 파일명, 파일 간략설명, 파일 연결프로그램명, 파일 저작자명, 파일크기, 파일생성 년월일, 파일다운로드 년월일, 파일 출처명, 페이지 수, 파일경로를 포함하는 메타정보 그대로를 화면 디스플레이하거나 메타정보의 정보보안 및 정보유출 방지를 위해 메타정보 중 일부를 2진수, 8진수 혹은 16진수로 선택 변환해 화면 디스플레이한다.As shown in FIG. 2, the automatic meta information display unit 300 displays the file name, brief description of the file, file connection program name, file author name, file size, file creation date, file download date, and file source that can be confirmed from the selected document file. The meta information, including name, number of pages, and file path, is displayed on the screen as is, or some of the meta information is selectively converted to binary, octal, or hexadecimal numbers and displayed on the screen to ensure information security and prevent information leakage.

도 4는 본 발명의 실시예에 따른 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법을 나타낸 순서도이다.Figure 4 is a flowchart showing a method of operating a priority-based selection document selection system according to multiple notation of search keywords according to an embodiment of the present invention.

도 4를 참조하면, 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법은 전체문서 파일의 각 페이지마다 표기된 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 통해 파악하며, 전체문서 파일 중 선택된 문서 파일의 전체 페이지에서 드러난 검색 키워드 수를 기준으로 순차 정렬된 페이지 상에 기술된 문단들 중 어느 하나에 마우스를 근접시킬 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이하는 구동방법이다.Referring to Figure 4, the method of operating the priority-based selection document adoption system according to multiple notation of search keywords determines the number of search keywords indicated on each page of the entire document file through a count screen AI (artificial intelligence) engine, and When the mouse approaches one of the paragraphs described on the page, which are sequentially arranged based on the number of search keywords revealed in all pages of the selected document file among the files, any one of the above is zoomed in and displayed enlarged and embossed. This is a driving method that displays in a three-dimensional shape.

먼저, 파일 리스트정보 개시부는 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시한다(S100).First, the file list information initiating unit enters a search keyword in the search box and performs an entire folder search or a designated folder search for all document files stored in the database unit (S100).

파일 리스트정보 개시부는 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여준다(S200).The file list information start section searches for at least one document file included in the entire folder or a designated folder and identifies the first letter of at least one document file to generate and display file list information automatically sorted in Korean consonant order or alphabet order ( S200).

파일 리스트정보 개시부는 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 전체문서 파일의 각기 다른 페이지마다 표기된 검색 키워드 수를 카운트 스크린하는 카운트 스크린 AI(artificial intelligence) 엔진을 이용해 자동 파악한다(S300).When performing an entire folder search or a designated folder search operation, the file list information start unit automatically determines the number of search keywords displayed on each page of the entire document file using a count screen AI (artificial intelligence) engine that counts and screens (S300).

파일 리스트정보 개시부는 전체 문서 파일 중 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬한다(S400).The file list information starting unit sorts document files including pages with the most search keywords among all document files in descending or ascending order (S400).

문자판독 및 문단특출 개현부는 파일 리스트정보 개시부로부터 인지되는 문서 파일 중 어느 하나를 선택한다(S500).The character reading and paragraph special opening unit selects one of the document files recognized from the file list information opening unit (S500).

문자판독 및 문단특출 개현부는 카운트 스크린 AI 엔진을 가동시켜 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 문자판독된 전체 페이지 중 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출한다(S600).The character reading and paragraph special expression unit runs the count screen AI engine to screen all pages of the selected document file to read the characters, and calls them sequentially, starting from the page with the most search keywords among all read pages. S600).

카운트 스크린 AI 엔진은 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시한다(S700).The count screen AI engine divides detailed articles written on the called page into paragraphs and automatically displays them differently (S700).

문자판독 및 문단특출 개현부는 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시, 근접을 통해 바로 인식된 문단을 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시킨다(S800).When the character reading and paragraph special display unit approaches one of the marked paragraphs with the mouse, it zooms in on the paragraph immediately recognized through proximity and displays it in an enlarged and embossed three-dimensional shape (S800).

문자판독 및 문단특출 개현부는 어느 하나에 표기된 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 카운트 스크린 AI 엔진에서 구현되는 (비)강화학습에 따른 딥러닝 기법 또는 유전자 알고리즘을 활용해 색 보정을 실시한다(S900).The character reading and paragraph special expression department automatically assigns a background color to the search keywords indicated in any one of them to make them stand out from the background. Color correction is performed using deep learning techniques or genetic algorithms based on (non-)reinforcement learning implemented in the count screen AI engine. Perform (S900).

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬수 있음을 이해할 수 있을 것이다.Although the present invention has been described above with reference to preferred embodiments, those skilled in the art may make various modifications and changes to the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. You will be able to understand that it exists.

검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템(1000)
파일 리스트정보 개시부(100)
문자판독 및 문단특출 개현부(200)
메타정보 자동 표출부(300)
카운트 스크린 AI(400)
Priority-based selection document adoption system based on multiple search keyword notation (1000)
File list information start section (100)
Character reading and literary specials (200)
Automatic meta information display unit (300)
Count Screen AI (400)

Claims (8)

검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시함에 따라, 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주며,
상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진으로 자동 파악해 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 파일 리스트정보 개시부; 및
상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택할 시, 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하고,
상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시함에 따라, 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키며, 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 문자판독 및 문단특출 개현부를 포함하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
By entering a search keyword in the search box and performing an entire folder search or a specified folder search for all document files stored in the database section, at least one document file included in the entire folder or a specified folder is searched and the at least one document file is searched. By identifying the first letter of the document file, it generates and displays file list information automatically sorted in Korean consonant order or alphabet order.
When searching the entire folder or searching the specified folder, the number of search keywords displayed on each different page of the entire document file is automatically determined by the count screen AI (artificial intelligence) engine, and the page on which the search keyword is listed the most among the entire document file is automatically identified. A file list information starting unit that sorts document files including in descending or ascending order; and
When selecting one of the document files recognized from the file list information start unit, the count screen AI engine is activated to screen all pages of the selected document file and read the text, and perform the search among all pages whose text has been read. It is called sequentially, giving priority starting from the page with the most keywords.
As the count screen AI engine automatically displays the detailed articles written on the called page separately by paragraph, when the mouse approaches one of the paragraphs, the mouse zooms in on one of the paragraphs. It displays the search keywords in an enlarged and embossed three-dimensional shape, and automatically assigns a background color to the search keywords indicated in any one of the above to perform color correction to make them stand out from the background. A priority-based selection document adoption system.
제 1 항에 있어서, 상기 파일 리스트정보 개시부는,
상기 적어도 하나의 문서파일의 메타 정보 중 파일 연결 프로그램명끼리 구분 정렬해 보여줄 수도 있고, 파일크기 순으로 내림차순 또는 오름차순으로 재정렬해 보여줄 수도 있으며, 파일생성 년월일이나 파일다운로드 년월일자로 내림차순 또는 오름차순으로 재정렬해 보여주는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
The method of claim 1, wherein the file list information starting unit,
Among the meta information of the at least one document file, it can be displayed sorted by file connection program name, rearranged in descending or ascending order by file size, and rearranged in descending or ascending order by file creation date or file download date. A priority-based selection document adoption system based on multiple notation of search keywords, characterized by showing.
제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
상기 문자판독 완료시, 읽기용으로만 제한되었던 상기 문서 파일을 읽기/쓰기 겸용 문서파일로 변환 및 생성시켜 상기 상세글들을 내용 검토하고자 하는 고객 통신 단말기에게 유,무상 결제 승인 후에 정보 제공 또는 파일 다운로드해주며,
상기 읽기/쓰기 겸용 문서 파일을 한컴오피스 워드파일, MS오피스 워드파일, 구글 워드파일, 텍스트 워드파일 중 선택된 하나로 생성시키는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
The method of claim 1, wherein the character reading and paragraph special expression unit,
When the text reading is completed, the document file, which was limited to reading only, is converted and created into a read/write document file, and information is provided or the file is downloaded after approving paid or free payment to the customer's communication terminal who wishes to review the detailed text. I do it for you,
A priority-based selection document selection system based on multiple notation of search keywords, characterized in that the read/write document file is generated as a selected one of Hancom Office Word file, MS Office Word file, Google Word file, and text Word file.
제 1 항에 있어서,
상기 선택된 문서 파일로부터 확인 가능한 파일명, 파일 간략설명, 파일 연결프로그램명, 파일 저작자명, 파일크기, 파일생성 년월일, 파일다운로드 년월일, 파일 출처명, 페이지 수, 파일경로를 포함하는 메타정보 그대로를 화면 디스플레이하거나 상기 메타정보의 정보보안 및 정보유출 방지를 위해 상기 메타정보 중 일부를 2진수, 8진수 혹은 16진수로 선택 변환해 화면 디스플레이하는 메타정보 자동 표출부를 더 포함하는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
According to claim 1,
The meta information including the file name, file brief description, file connection program name, file author name, file size, file creation date, file download date, file source name, number of pages, and file path that can be confirmed from the selected document file is displayed on the screen. Search keyword multiple search, characterized in that it further includes a meta information automatic display unit that displays or selectively converts some of the meta information into binary, octal, or hexadecimal numbers to display on the screen in order to ensure information security and prevent information leakage of the meta information. Priority-based selection document adoption system according to notation.
제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
상기 검색 키워드가 적어도 하나 이상 기재된 페이지마다 나타난 검색 키워드를 대상으로 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체 표시로 화면 디스플레이되도록 설정해 둠으로써, 상기 검색 키워드에 대한 중요성이 내용 검토시에 강조되게끔 지원해 주는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
The method of claim 1, wherein the character reading and paragraph special expression unit,
The importance of the search keyword is emphasized when reviewing the content by setting the screen to be displayed in a different color, thickness, underline, and font for the search keyword that appears on each page where at least one search keyword is listed. A priority-based selection document adoption system based on multiple notation of search keywords, characterized by supporting this.
제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
상기 페이지마다 표기된 상기 검색 키워드 외에 적어도 3회 이상 반복적으로 등장한 다른 검색 키워드를 파생 키워드로 설정해 다른 색깔표시, 다른 굵기주기, 밑줄표시, 다른 글자체로 상기 검색 키워드와 다르게 구분 표시해 주는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
The method of claim 1, wherein the character reading and paragraph special expression unit,
A search characterized in that, in addition to the search keywords indicated on each page, other search keywords that appear repeatedly at least three times are set as derived keywords and displayed differently from the search keywords with different colors, different thicknesses, underlines, and different fonts. A priority-based selection document adoption system based on multiple keyword notation.
제 1 항에 있어서, 상기 문자판독 및 문단특출 개현부는,
상기 마우스로 상기 구분 표시된 문단들 중 어느 하나를 클릭할 시 상기 어느 하나를 팝 업시켜 팝업창에 보이도록 디스플레이시키며,
상기 카운트 스크린 AI 엔진 구동에 따른 자연어 처리를 실시함에 따라, 상기 어느 하나에 기재된 문장 내 존재하는 주어, 목적어, 서술어를 필수 입력사항으로 둔 전제하에 상기 문장이 간단히 요약된 단문을 생성시키는 것을 특징으로 하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템.
The method of claim 1, wherein the character reading and paragraph special expression unit,
When you click on any one of the separated paragraphs with the mouse, one of the paragraphs pops up and is displayed in a pop-up window,
As natural language processing is performed according to the operation of the count screen AI engine, a short sentence in which the sentence is briefly summarized is generated on the premise that the subject, object, and predicate existing in the sentence described in any of the above are required inputs. A priority-based selection document adoption system based on multiple notation of search keywords.
파일 리스트정보 개시부가 검색창에 검색 키워드를 입력해 데이터베이스부 내 저장된 전체문서 파일을 대상으로 전체 폴더 검색 혹은 지정 폴더 검색을 실시하는 단계;
상기 파일 리스트정보 개시부가 상기 전체 폴더나 혹은 지정 폴더 내 포함된 적어도 하나의 문서 파일을 찾고 상기 적어도 하나의 문서 파일의 첫글자 감식을 통해 한글 자음 순이나 알파벳 순으로 자동 정렬된 파일 리스트정보를 생성시켜 보여주는 단계;
상기 파일 리스트정보 개시부가 상기 전체 폴더 검색 혹은 지정 폴더 검색 동작시, 상기 전체문서 파일의 각기 다른 페이지마다 표기된 상기 검색 키워드 수를 카운트 스크린 AI(artificial intelligence) 엔진을 이용해 자동 파악하는 단계;
상기 파일 리스트정보 개시부가 상기 전체 문서 파일 중 상기 검색 키워드가 가장 많이 기재된 페이지를 포함한 문서 파일을 내림차순 혹은 오름차순 형태로 정렬하는 단계;
문자판독 및 문단특출 개현부가 상기 파일 리스트정보 개시부로부터 인지되는 상기 문서 파일 중 어느 하나를 선택하는 단계;
상기 문자판독 및 문단특출 개현부가 상기 카운트 스크린 AI 엔진을 가동시켜 상기 선택된 문서 파일의 전체 페이지를 스크린해 문자판독하며, 상기 문자판독된 전체 페이지 중 상기 검색 키워드가 가장 많이 기재된 페이지부터 우선순위를 주어 순차적으로 호출하는 단계;
상기 카운트 스크린 AI 엔진이 상기 호출된 페이지 상에 기재된 상세글들을 문단별로 구분해 각기 다르게 자동 표시하는 단계;
상기 문자판독 및 문단특출 개현부가 상기 구분 표시된 문단들 중 어느 하나에 마우스 근접할 시 상기 어느 하나를 줌 인(Zoom in)해 확대 표시 및 양각된 입체 형상으로 디스플레이시키는 단계; 및
상기 문자판독 및 문단특출 개현부가 상기 어느 하나에 표기된 상기 검색 키워드들에 바탕색을 자동으로 부여해 배경면보다 돋보이도록 색 보정을 실시하는 단계를 포함하는 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템의 구동방법.
A step where the file list information initiating unit enters a search keyword in the search box and performs an entire folder search or a designated folder search for all document files stored in the database unit;
The file list information starting unit searches for at least one document file included in the entire folder or a designated folder and identifies the first letter of the at least one document file to generate file list information automatically sorted in Korean consonant order or alphabet order. step of showing;
automatically determining the number of search keywords displayed on each page of the entire document file using a count screen artificial intelligence (AI) engine when the file list information initiator operates to search the entire folder or search the specified folder;
arranging, by the file list information starting unit, document files including pages on which the search keyword is most frequently described among all document files in descending or ascending order;
selecting one of the document files recognized from the file list information start unit by a character reading and paragraph special opening unit;
The character reading and paragraph special expression unit operates the count screen AI engine to screen all pages of the selected document file and read the characters, and gives priority to the page with the most search keywords among all the read text pages. sequentially calling steps;
The count screen AI engine automatically displays detailed articles written on the called page separately by paragraph;
When the character reading and paragraph special display unit approaches any one of the classified paragraphs with a mouse, zooming in on one of the paragraphs and displaying it in an enlarged and embossed three-dimensional shape; and
A priority-based selection document selection system according to multiple notation of search keywords, including the step of the character reading and paragraph special expression unit automatically assigning a background color to the search keywords indicated in any one of the above and performing color correction to make them stand out from the background. How to drive.
KR1020210053824A 2021-04-26 2021-04-26 Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same KR102594717B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210053824A KR102594717B1 (en) 2021-04-26 2021-04-26 Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210053824A KR102594717B1 (en) 2021-04-26 2021-04-26 Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same

Publications (2)

Publication Number Publication Date
KR20220146923A KR20220146923A (en) 2022-11-02
KR102594717B1 true KR102594717B1 (en) 2023-10-26

Family

ID=84084526

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210053824A KR102594717B1 (en) 2021-04-26 2021-04-26 Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same

Country Status (1)

Country Link
KR (1) KR102594717B1 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH036664A (en) * 1989-06-02 1991-01-14 Nippon Telegr & Teleph Corp <Ntt> Document retrieving method
AU2001247555A1 (en) 2000-03-16 2001-09-24 Microsoft Corporation Priorities generation and management
KR100796905B1 (en) 2006-06-29 2008-01-22 (재)한국데이터베이스진흥센터 System for Quality Control of DataBase
KR100903726B1 (en) 2006-09-20 2009-06-19 (재)한국데이터베이스진흥센터 System for Evaluating Data Quality Management Maturity
KR102174462B1 (en) 2018-05-15 2020-11-05 엑사비스 주식회사 Method for network security and system performing the same

Also Published As

Publication number Publication date
KR20220146923A (en) 2022-11-02

Similar Documents

Publication Publication Date Title
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
US9384245B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US9659084B1 (en) System, methods, and user interface for presenting information from unstructured data
US9449080B1 (en) System, methods, and user interface for information searching, tagging, organization, and display
Koch et al. VarifocalReader—in-depth visual analysis of large text documents
US7403932B2 (en) Text differentiation methods, systems, and computer program products for content analysis
US10108720B2 (en) Automatically providing relevant search results based on user behavior
US20110270876A1 (en) Method and system for filtering information
US20130124515A1 (en) Method for document search and analysis
Mahmood Library web OPACs in Pakistan: an overview
JP2005190284A (en) Information classification device and method
Kuckartz et al. Working with bibliographic information and creating literature reviews
KR102594717B1 (en) Priority-centered selection document adoption system based on multiple search keywords and drive method of the Same
US8195458B2 (en) Open class noun classification
Grüblbauer et al. Social media monitoring tools as instruments of strategic issues management
KR102546690B1 (en) Customized document file search and search keyword-centered selection information system and drive method of the Same
Shneiderman Designing information-abundant websites
Kumar From Clay Tablets to Web: Journey of Library Catalogue
de Brito et al. Sentiment analysis tool in website comments
KR101003084B1 (en) Blog creating and blog information search system and the method thereof
Kuckartz et al. Coding text and PDF files
Bornales et al. Gunita: Visualizing the evolution of the Philippines’ languages with a historical Philippine text corpora
CN114817378A (en) Tax file search engine-based retrieval method
KR20240021387A (en) Job search matching method and system
KR20030009997A (en) The methods for data presentation and auto-recognition by 5W1H and hierarchical structural presentation

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant