KR102196547B1 - Method and apparatus for blind processing of specific information in document - Google Patents

Method and apparatus for blind processing of specific information in document Download PDF

Info

Publication number
KR102196547B1
KR102196547B1 KR1020190058836A KR20190058836A KR102196547B1 KR 102196547 B1 KR102196547 B1 KR 102196547B1 KR 1020190058836 A KR1020190058836 A KR 1020190058836A KR 20190058836 A KR20190058836 A KR 20190058836A KR 102196547 B1 KR102196547 B1 KR 102196547B1
Authority
KR
South Korea
Prior art keywords
inspection
document
blind
specific information
inspection document
Prior art date
Application number
KR1020190058836A
Other languages
Korean (ko)
Other versions
KR20200096043A (en
Inventor
박혜린
최재영
문민주
Original Assignee
주식회사 무하유
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 무하유 filed Critical 주식회사 무하유
Priority to KR1020190058836A priority Critical patent/KR102196547B1/en
Publication of KR20200096043A publication Critical patent/KR20200096043A/en
Application granted granted Critical
Publication of KR102196547B1 publication Critical patent/KR102196547B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

검사문서 내 특정정보의 블라인드 처리 방법이 제공된다. 상기 방법은 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 단계, 상기 검사문서로부터 구문분석을 수행하여 상기 검사대상 항목에 대응하는 특정정보를 추출하는 단계, 및 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 단계를 포함한다. A method of blind processing of specific information in inspection documents is provided. The method includes determining an item to be inspected that needs blind processing in the inspection document, extracting specific information corresponding to the item to be inspected by performing a syntax analysis from the inspection document, and masking the specific information or And selecting and applying one of the highlighting treatments.

Description

검사문서 내 특정정보의 블라인드 처리 방법 및 장치{METHOD AND APPARATUS FOR BLIND PROCESSING OF SPECIFIC INFORMATION IN DOCUMENT}Blind processing method and device of specific information in inspection document {METHOD AND APPARATUS FOR BLIND PROCESSING OF SPECIFIC INFORMATION IN DOCUMENT}

본 발명은 검사문서 내 특정정보의 블라인드 처리 방법 및 장치에 관한 것이다. The present invention relates to a method and apparatus for blind processing of specific information in an inspection document.

대학입시전형, 기업채용 등과 같은 입시절차나 채용절차 시에 투명성과 공정성 제고를 위해 각 대학이나 각 기업체마다 다양한 규정들을 마련하고 있다. 특히, 선발과정에서 지원자들의 성별, 연령, 출신학교, 출신지, 신체조건, 가족관계 등과 같은 지원자의 역량과 무관한 사항들은 배제하고 선발할 수 있도록 하는 다양한 방안들을 채택하고 있다. In order to enhance transparency and fairness in the admission procedures and recruitment procedures such as university entrance examination and corporate recruitment, various regulations are established for each university and each enterprise. In particular, in the selection process, various measures are adopted so that the applicants' gender, age, school of origin, place of origin, physical condition, family relations, etc. that are irrelevant to the applicant's capacity are excluded and selected.

따라서, 각 대학이나 각 기업체마다 채택한 선발규정을 바탕으로 지원자의 특정한 정보(예: 성별, 연령, 출신학교, 출신지, 신체조건, 가족관계 등)를 배제하고 선발과정을 진행할 수 있는 방법이 필요하다. Therefore, there is a need for a method to proceed with the selection process by excluding specific information (e.g., gender, age, school of origin, place of origin, physical condition, family relationship, etc.) of applicants based on the selection rules adopted by each university or each company. .

특히, 선발과정에서 제출하는 지원자들의 서류상에 기재된 다양한 정보 중에서 각 대학이나 각 기업체마다 배제하고자 하는 특정한 정보를 블라인드 처리할 수 있는 방안이 요구된다. In particular, there is a need for a method to blindly process specific information that each university or each company wants to exclude among the various information on the documents of applicants submitted during the selection process.

본 발명이 해결하고자 하는 과제는 검사문서 내 특정정보의 블라인드 처리 방법 및 장치를 제공하는 것이다.The problem to be solved by the present invention is to provide a method and apparatus for blind processing of specific information in an inspection document.

본 발명이 해결하고자 하는 과제는 구문분석을 수행하여 검사문서 내 블라인드 처리가 필요한 구문을 추출하는 방법 및 장치를 제공하는 것이다. The problem to be solved by the present invention is to provide a method and apparatus for extracting a phrase requiring blind processing in a test document by performing a syntax analysis.

본 발명이 해결하고자 하는 과제는 검사문서 내 블라인드 처리가 필요한 구문에 대해 마스킹 또는 하이라이팅을 선택적으로 적용하여 표시하는 방법 및 장치를 제공하는 것이다. The problem to be solved by the present invention is to provide a method and apparatus for selectively applying masking or highlighting to a sentence requiring blind processing in an inspection document.

본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The problems to be solved by the present invention are not limited to the problems mentioned above, and other problems that are not mentioned will be clearly understood by those skilled in the art from the following description.

본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법은, 컴퓨터에 의해 수행되며, 특정 전형에 지원한 지원자의 검사문서 내 특정정보의 블라인드 처리 방법에 있어서, 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 단계; 상기 검사문서로부터 구문분석을 수행하여 상기 검사대상 항목에 대응하는 특정정보를 추출하는 단계; 및 미리 정해진 블라인드 규정을 기초로 하여 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 단계를 포함한다.The blind processing method of specific information in the inspection document according to an embodiment of the present invention is performed by a computer, and in the blind processing method of specific information in the inspection document of an applicant who applied for a specific screening, blind processing in the inspection document is Determining a necessary item to be inspected; Extracting specific information corresponding to the item to be inspected by performing syntax analysis from the inspection document; And selecting and applying either a masking process or a highlighting process for the specific information based on a predetermined blind rule.

또한, 상기 검사대상 항목 결정 단계는, 상기 전형을 진행하는 전형주체와 전형절차에 따라서 설정된 전형규정을 반영하여 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 것을 특징으로 한다.In addition, in the step of determining the item to be inspected, an item to be inspected that needs to be blinded in the inspection document is determined by reflecting an admission rule set in accordance with the screening subject and the screening procedure.

또한, 상기 적용 단계는, 상기 전형을 진행하는 전형주체와 전형절차에 따라서 설정된 전형규정을 기초로 하여 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 것을 특징으로 한다In addition, the applying step is characterized in that one of a masking process or a highlighting process is selected and applied for the specific information based on the selection rule set according to the selection subject and the selection procedure.

또한, 상기 특정정보 추출 단계는, 상기 검사문서로부터 상기 검사대상 항목의 종류에 따라서 추출 가능한 하나 이상의 키워드를 획득하는 단계; 및 상기 획득된 키워드를 기반으로 상기 검사문서 내 문장의 문맥 파악을 통해 상기 특정정보를 포함하는 후보 구문을 추출하는 단계를 포함할 수 있다.In addition, the step of extracting the specific information may include obtaining one or more keywords that can be extracted from the inspection document according to the type of the item to be inspected; And extracting a candidate phrase including the specific information by grasping the context of the sentence in the test document based on the acquired keyword.

또한, 상기 컴퓨터는, 동일한 지원자에 대한 검사문서가 복수 개일 경우, 동일한 지원자에 대한 제1 검사문서로부터 추출된 키워드를 기초로 유추 가능한 확장 키워드를 추가로 획득하고, 상기 획득된 키워드와 확장 키워드를 기초로 상기 제1 검사문서와 연계된 제2 검사문서에 대한 구문분석을 수행하여, 상기 제2 검사문서 내 상기 특정정보를 포함하는 후보 구문을 추출하는 것을 특징으로 한다.In addition, when there are a plurality of inspection documents for the same applicant, the computer additionally obtains an inferable extended keyword based on the keyword extracted from the first inspection document for the same applicant, and the obtained keyword and the extended keyword A syntax analysis is performed on a second inspection document linked to the first inspection document, and a candidate phrase including the specific information in the second inspection document is extracted.

또한, 상기 키워드 획득 단계는, 상기 전형주체와 전형절차에 따라서 정해진 블라인드 규정을 기초로 하여 키워드 목록을 제공하고, 사용자로부터 상기 키워드 목록을 적용할 적용 범위를 입력받는 단계를 더 포함할 수 있다.In addition, the step of obtaining the keyword may further include providing a keyword list based on a blind rule determined according to the screening subject and the screening procedure, and receiving an application range to which the keyword list is applied from the user.

또한, 상기 적용 단계 다음에, 상기 처리가 적용되어 화면으로 제공된 검사문서 내에서 사용자로부터 특정 구문을 선택받아 블라인드 규칙 또는 하이라이트 규칙 설정을 입력받은 경우, 상기 특정 구문에 대한 규칙을 추가하고, 상기 검사문서에 대한 재검사를 수행하는 단계를 더 포함할 수 있다.In addition, after the applying step, when a specific phrase is selected from the user in the inspection document provided on the screen after the processing is applied and the blind rule or highlight rule setting is input, a rule for the specific phrase is added, and the inspection It may further include the step of performing a re-inspection of the document.

또한, 상기 블라인드 규정은, 상기 검사문서에 포함된 내용 중에서, 0점 처리되어야 하는 정보, 평가에 반영되지 않아야 하는 정보, 및 가점이나 우선순위가 부여되어야 하는 정보 중 적어도 하나를 포함하는 것을 특징으로 한다.In addition, the blind rule is characterized in that it includes at least one of information that should be processed with zero points, information that should not be reflected in evaluation, and information that should be given an additional point or priority, among the contents included in the inspection document. do.

본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 장치는, 특정 전형에 지원한 지원자의 검사문서 내 특정정보의 블라인드 처리 장치에 있어서, 하나 이상의 인스트럭션을 저장하는 메모리; 및 상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 프로세서를 포함하며, 상기 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써, 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 단계; 상기 검사문서로부터 구문분석을 수행하여 상기 검사대상 항목에 대응하는 특정정보를 추출하는 단계; 및 미리 정해진 블라인드 규정을 기초로 하여 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 단계를 수행한다.An apparatus for blind processing of specific information in an inspection document according to an embodiment of the present invention, in the blind processing apparatus for specific information in an inspection document of an applicant who applied for a specific selection, includes: a memory for storing one or more instructions; And a processor that executes the one or more instructions stored in the memory, wherein the processor executes the one or more instructions to determine an item to be inspected for blind processing in the inspection document; Extracting specific information corresponding to the item to be inspected by performing syntax analysis from the inspection document; And selecting and applying one of a masking process or a highlighting process for the specific information based on a predetermined blind rule.

본 발명의 일 실시예에 따른 컴퓨터프로그램은 하드웨어인 컴퓨터와 결합되어, 상기 검사문서 내 특정정보의 블라인드 처리 방법을 수행할 수 있도록 컴퓨터에서 독출가능한 기록매체에 저장된다.A computer program according to an embodiment of the present invention is combined with a computer that is hardware, and is stored in a computer-readable recording medium so that the blind processing method of specific information in the inspection document can be performed.

삭제delete

삭제delete

본 발명에 따르면, 문서 내의 텍스트에 대해 구문분석을 통해 문맥을 파악할 수 있도록 함으로써, 단순 단어나 단순 키워드 매칭 방식에 비해 문맥상 의미를 정확히 인식할 수 있고, 간접적인 표현의 경우에도 블라인드 처리 대상 정보를 정확히 검출하는데 효과적이다. According to the present invention, it is possible to recognize the context of text in a document through syntax analysis, so that the meaning in context can be accurately recognized compared to a simple word or simple keyword matching method, and even in the case of an indirect expression, blind processing target information It is effective to accurately detect

본 발명에 따르면, 각 검사문서마다 상이한 블라인드 처리 규칙을 각각 적용할 수 있도록 함으로써, 각 대학별 또는 각 기업체별 서로 다른 블라인드 처리 방식을 설정하는데 효과적이다. According to the present invention, different blind processing rules can be applied to each inspection document, so that it is effective to set different blind processing methods for each university or each enterprise.

본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the following description.

도 1은 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 개략적으로 도시한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 딥러닝을 이용한 학습을 통해 구문분석을 수행하는 방법을 설명하기 위해 도시한 흐름도이다.
도 3 내지 도 7은 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 수행할 때 사용자에게 제공되는 사용자 인터페이스 화면의 예시들을 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 수행하는 장치(600)의 구성을 개략적으로 나타내는 도면이다.
1 is a flowchart schematically illustrating a blind processing method of specific information in an inspection document according to an embodiment of the present invention.
FIG. 2 is a flowchart illustrating a method of performing syntax analysis through learning using deep learning according to an embodiment of the present invention.
3 to 7 are diagrams illustrating examples of user interface screens provided to a user when performing a blind processing method of specific information in an inspection document according to an embodiment of the present invention.
8 is a diagram schematically showing the configuration of an apparatus 600 for performing a blind processing method of specific information in an inspection document according to an embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.Advantages and features of the present invention, and a method of achieving them will become apparent with reference to the embodiments described below in detail together with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in a variety of different forms, only the present embodiments are intended to complete the disclosure of the present invention, It is provided to fully inform the technician of the scope of the present invention, and the present invention is only defined by the scope of the claims.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.The terms used in the present specification are for describing exemplary embodiments and are not intended to limit the present invention. In this specification, the singular form also includes the plural form unless specifically stated in the phrase. As used in the specification, “comprises” and/or “comprising” do not exclude the presence or addition of one or more other elements other than the mentioned elements. Throughout the specification, the same reference numerals refer to the same elements, and “and/or” includes each and all combinations of one or more of the mentioned elements. Although "first", "second", and the like are used to describe various elements, it goes without saying that these elements are not limited by these terms. These terms are only used to distinguish one component from another component. Therefore, it goes without saying that the first component mentioned below may be the second component within the technical idea of the present invention.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in the present specification may be used as meanings that can be commonly understood by those of ordinary skill in the art to which the present invention belongs. In addition, terms defined in a commonly used dictionary are not interpreted ideally or excessively unless explicitly defined specifically.

명세서에서 사용되는 "부" 또는 “모듈”이라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부" 또는 “모듈”은 어떤 역할들을 수행한다. 그렇지만 "부" 또는 “모듈”은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부" 또는 “모듈”은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부" 또는 “모듈”은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부" 또는 “모듈”들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부" 또는 “모듈”들로 결합되거나 추가적인 구성요소들과 "부" 또는 “모듈”들로 더 분리될 수 있다.The term "unit" or "module" used in the specification refers to a hardware component such as software, FPGA or ASIC, and the "unit" or "module" performs certain roles. However, "unit" or "module" is not meant to be limited to software or hardware. The “unit” or “module” may be configured to be in an addressable storage medium, or may be configured to reproduce one or more processors. Thus, as an example, "sub" or "module" refers to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, It includes procedures, subroutines, segments of program code, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays and variables. Components and functions provided within "sub" or "module" may be combined into a smaller number of components and "sub" or "modules" or into additional components and "sub" or "modules". Can be further separated.

본 명세서에서 "컴퓨터"는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 컴퓨터는 데스크 탑 PC, 노트북(Note Book) 뿐만 아니라 스마트폰(Smart phone), 태블릿 PC, 셀룰러폰(Cellular phone), 피씨에스폰(PCS phone; Personal Communication Service phone), 동기식/비동기식 IMT-2000(International Mobile Telecommunication-2000)의 이동 단말기, 팜 PC(Palm Personal Computer), 개인용 디지털 보조기(PDA; Personal Digital Assistant) 등도 해당될 수 있다. 또한, 헤드마운트 디스플레이(Head Mounted Display; HMD) 장치가 컴퓨팅 기능을 포함하는 경우, HMD장치가 컴퓨터가 될 수 있다. 또한, 컴퓨터는 클라이언트로부터 요청을 수신하여 정보처리를 수행하는 서버가 해당될 수 있다.In the present specification, "computer" includes all various devices capable of performing arithmetic processing and providing results to a user. For example, computers are not only desktop PCs and notebooks, but also smart phones, tablet PCs, cellular phones, PCS phones, and synchronous/asynchronous systems. A mobile terminal of the International Mobile Telecommunication-2000 (IMT-2000), a Palm Personal Computer (PC), a personal digital assistant (PDA), and the like may also be applicable. In addition, when a head mounted display (HMD) device includes a computing function, the HMD device may be a computer. Also, the computer may correspond to a server that receives a request from a client and performs information processing.

한편, 대학입시전형, 기업채용 등과 같은 입시절차나 채용절차 시에 투명성과 공정성 제고를 위해 각 대학이나 각 기업체마다 다양한 규정들을 마련하고 있다. 특히, 선발과정에서 지원자들의 성별, 연령, 출신학교, 출신지, 신체조건, 가족관계 등과 같은 지원자의 역량과 무관한 사항들은 배제하고 선발할 수 있도록 하는 다양한 방안들을 채택하고 있다. On the other hand, in order to enhance transparency and fairness in the admission procedures or recruitment procedures such as university entrance examination and corporate recruitment, various regulations have been established for each university and each enterprise. In particular, in the selection process, various measures are adopted so that the applicants' gender, age, school of origin, place of origin, physical condition, family relations, etc. that are irrelevant to the applicant's capacity are excluded and selected.

이에, 본 발명에서는 각 대학이나 각 기업체마다 채택한 선발규정을 바탕으로 지원자의 특정한 정보(예: 성별, 연령, 출신학교, 출신지, 신체조건, 가족관계 등)를 배제하고 선발과정을 진행할 수 있는 방법을 제공하고자 한다. 특히, 선발과정에서 제출하는 지원자들의 서류상에 기재된 다양한 정보 중에서 각 대학이나 각 기업체마다 배제하고자 하는 특정한 정보를 배제시킬 수 있는 블라인드 처리 방법을 제안한다. Therefore, in the present invention, a method for excluding specific information of applicants (eg, gender, age, school of origin, place of origin, physical condition, family relationship, etc.) based on the selection rules adopted by each university or each company, and proceeding with the selection process Want to provide. In particular, we propose a blind processing method that can exclude specific information that each university or each company wants to exclude from among the various information on the documents of applicants submitted during the selection process.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 개략적으로 도시한 흐름도이다. 1 is a flowchart schematically illustrating a blind processing method of specific information in an inspection document according to an embodiment of the present invention.

도 1의 방법은 설명의 편의를 위하여 컴퓨터에 의하여 수행되는 것으로 서술하나, 각 단계의 수행주체가 특정 장치에 제한되는 것은 아니고 컴퓨팅 처리를 수행할 수 있는 장치를 포괄하는 의미로 사용될 수 있다. 즉, 본 실시예에서 컴퓨터는 본 발명의 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 수행할 수 있는 장치를 의미할 수 있다.The method of FIG. 1 is described as being performed by a computer for convenience of explanation, but the subject of performing each step is not limited to a specific device and may be used in a sense of encompassing devices capable of performing computing processing. That is, in the present embodiment, the computer may mean an apparatus capable of performing the blind processing method of specific information in the inspection document according to the embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법은, 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 단계(S100), 상기 검사문서로부터 구문분석을 수행하여 상기 검사대상 항목에 대응하는 특정정보를 추출하는 단계(S200), 및 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 단계(S300)를 포함할 수 있다. 이하, 각 단계에 대한 상세한 설명을 기재한다. Referring to Figure 1, the blind processing method of specific information in the inspection document according to an embodiment of the present invention, the step of determining an inspection target item that needs blind processing in the inspection document (S100), a syntax analysis from the inspection document And extracting specific information corresponding to the item to be inspected (S200), and selecting and applying one of a masking process or a highlighting process to the specific information (S300). Hereinafter, a detailed description of each step will be described.

컴퓨터는 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정할 수 있다(S100).The computer may determine an item to be inspected in the inspection document requiring blind processing (S100).

여기서, 검사문서라 함은, 다양한 형식의 전자문서를 말하며, 전자문서 내 블라인드 처리가 필요한 정보를 포함하고 있는지 여부를 확인하고자 하는 검사 대상 문서를 말한다. 예를 들어, 대학입시전형의 경우, 지원자들은 학생부, 자기소개서, 추천서 등을 각 대학의 전형절차 시스템 상에 제출할 수 있다. 이 경우, 학생부 파일, 자기소개서 파일, 추천서 파일 등을 검사문서로서 설정하여, 이 파일들에 대해 블라인드 처리 대상 정보를 포함하고 있는지 여부를 검사할 수 있다. 또는, 기업채용전형의 경우, 지원자들은 자기소개서, 기타 여러가지 파일들을 각 기업체의 전형절차 시스템 상에 제출할 수 있다. 이 경우, 자기소개서 파일, 기타 파일들을 검사문서로서 설정하여, 이 파일들에 대해 블라인드 처리 대상 정보를 포함하고 있는지 여부를 검사할 수 있다. Here, the inspection document refers to an electronic document in various formats, and refers to a document to be inspected to determine whether the electronic document contains information required for blind processing. For example, in the case of the university entrance examination, applicants can submit the student department, self-introduction letter, and letter of recommendation on each university's screening process system. In this case, by setting a student department file, a self-introduction file, a recommendation letter file, and the like as inspection documents, it is possible to check whether or not these files contain blind processing target information. Alternatively, in the case of corporate recruitment screening, applicants can submit self-introduction and other various files on each company's screening process system. In this case, by setting the self-introduction file and other files as inspection documents, it is possible to check whether or not the files contain blind processing target information.

블라인드 처리라 함은, 대학입시전형, 기업채용 등과 같은 입시절차나 채용절차 시에 지원자들이 제출한 서류(즉, 검사문서)상에서 특정한 정보(예: 성별, 연령, 출신학교, 출신지, 신체조건, 가족관계 등)를 배제시켜야 함을 의미한다. Blind processing refers to specific information (e.g. gender, age, school of origin, place of origin, physical condition, etc.) on the documents submitted by applicants (i.e., examination documents) during the admission procedure or recruitment procedure such as university entrance examination, corporate employment, etc. It means that family relations, etc.) should be excluded.

일 실시예로, 컴퓨터는 지원자의 학생부, 자기소개서, 추천서 등을 획득하여 검사문서로 지정하고, 지정된 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정할 수 있다. In one embodiment, the computer may obtain the applicant's student department, self-introduction letter, recommendation letter, etc., designate it as an inspection document, and determine an inspection subject item requiring blind processing in the designated inspection document.

예를 들어, 각 대학별 대학입시전형(예컨대, 대입 블라인드 면접)의 경우, 자기소개서, 추천서 등에 인적사항, 학적사항, 수상경력, 체험활동상황, 공인어학성적 등을 기재할 경우 해당 항목 또는 서류 전체에 대해 0점 처리하는 규정을 둘 수 있다. 또는, 자기소개서, 추천서 등과 같은 서류에 인적사항, 학적사항, 수상경력, 체험활동상황, 공인어학성적 등을 기재하더라도 0점 처리는 되지 않으나 평가에 반영되지 않는 정보로서 취급되는 규정을 둘 수도 있다. For example, in the case of college entrance examinations for each university (e.g., blind interview for college admission), if personal information, academic records, awards, experience activities, official language scores, etc. are written in the self-introduction letter or recommendation letter, the relevant item or the entire document There can be a rule that treats 0 points. Alternatively, even if personal information, academic records, awards, experience activities, official language scores, etc. are written in documents such as self-introduction and recommendation letters, it is possible to set rules that are treated as information that is not reflected in the evaluation, but is not scored as 0. .

또한, 각 기업체별 채용절차(예컨대, 블라인드 면접)의 경우, 자기소개서 등의 서류에 인적사항, 학적사항, 신체조건정보 등을 기재하지 않도록 하거나 또는 기재하더라도 점수화하지 않는 규정을 둘 수 있다. 또는, 기업체의 채용방식에 따라서는 특정한 사항에 대해서는 가점이나 우선순위를 부여하는 방식을 채택할 수도 있다.In addition, in the case of recruitment procedures for each company (e.g., blind interview), there may be a rule not to write personal information, academic records, physical condition information, etc. in documents such as self-introduction, or not to score even if written. Alternatively, depending on the hiring method of the company, a method of assigning additional points or priorities to specific matters may be adopted.

즉, 전형절차를 진행하는 주체(예컨대, 대학, 기업체 등)에 따라서 각기 다른 전형규정을 마련하여 전형절차를 진행할 수 있으며, 이러한 전형규정에 따라 서류(즉, 검사문서)상에서 블라인드 처리가 필요한 항목이 달라질 수 있다. In other words, according to the subject (e.g., university, business, etc.), different screening rules can be prepared to proceed with the screening process, and items that require blind processing on documents (i.e., inspection documents) according to these screening rules This can be different.

따라서, 블라인드 처리가 필요한 검사대상 항목을 결정함에 있어서, 각 전형절차에 따라 상이한 전형규정을 반영하여 검사대상 항목을 설정할 수 있는 것이 중요하다. Therefore, in determining the items to be inspected that require blind treatment, it is important to be able to set the items to be inspected by reflecting different screening regulations according to each screening procedure.

일 실시예로, 컴퓨터는 각 전형절차에 따라 미리 정해진 전형규정(즉, 블라인드 규정)을 기초로 적어도 하나의 검사대상 항목을 결정할 수 있다. 또한, 각 검사문서(예컨대, 대학입시전형의 자기소개서나 학생부, 기업채용전형의 자기소개서 등)의 특징에 따라서도 상이한 블라인드 규정이 정해질 수 있으므로, 컴퓨터는 각 검사문서의 특징에 따라 미리 정해진 블라인드 규정을 기초로 적어도 하나의 검사대상 항목을 결정할 수 있다. In an embodiment, the computer may determine at least one item to be examined based on a pre-determined screening rule (ie, blind rule) according to each screening procedure. In addition, different blind rules may be set depending on the characteristics of each inspection document (e.g., a self-introduction letter for college entrance examination, student department, corporate employment examination, etc.), so the computer is pre-determined according to the characteristics of each examination document. At least one item to be inspected may be determined based on the blind rule.

일례로, 아래 표 1은 대학입시전형에서 학생부 및 자기소개서, 교사추천서 등과 같은 문서 내 작성되는 항목들의 예시를 나타낸 것이다. As an example, Table 1 below shows examples of items written in documents such as the student department, self-introduction letter, teacher recommendation letter, etc. in the college entrance examination.

Figure 112019051384993-pat00001
Figure 112019051384993-pat00001

각 대학별 전형규정에 따라서 표 1의 항목들 중 블라인드 처리가 필요한 항목들이 상이하게 설정될 수 있다. 예를 들어, 자기소개서에 인적사항이나 학적사항을 기재하는 경우 해당 정보는 문서 내에서 마스킹(masking)되어 평가에 반영되지 않는 블라인드 규정이 있을 수 있다. 또는, 자기소개서에 수상경력을 기재할 경우 해당 정보는 0점 처리하는 블라인드 규정이 있을 수 있다. 또는, 특기자 전형이나 재외국민, 외국인 특별전형에는 공인어학성적 등을 기재하더라도 제한을 두지 않거나 해당 정보를 하이라이팅(highlighting) 처리하는 블라인드 규정이 있을 수 있다. Among the items in Table 1, items requiring blind treatment may be set differently according to the admission regulations for each university. For example, when personal information or academic information is entered in the self-introduction letter, the information may be masked in the document and there may be a blind rule that is not reflected in the evaluation. Alternatively, there may be a blind rule that treats 0 points for the information if you write your awards on your self-introduction. Alternatively, there may be a blind rule that does not restrict or highlights the relevant information even if the official language score, etc. is written in the special admissions screening, overseas Koreans, and foreigners special screening.

따라서, 컴퓨터는 각 전형절차에 따라 미리 정해진 블라인드 규정을 기초로, 각 검사문서에 대해 블라인드 처리가 필요한 검사대상 항목을 상이하게 설정할 수 있는 사용자 인터페이스(UI; User Interface)를 제공할 수 있다. 일 실시예로, 컴퓨터는 적어도 하나의 검사대상 항목을 포함하는 리스트를 사용자에게 제공하고, 사용자로부터 상기 리스트 내 검사대상 항목들 중 블라인드 처리가 필요한 항목을 선택하도록 할 수 있다.Accordingly, the computer may provide a user interface (UI) capable of differently setting an inspection target item requiring blind processing for each inspection document based on a predetermined blind rule according to each screening procedure. In one embodiment, the computer may provide a list including at least one item to be inspected to a user, and allow the user to select an item to be blinded from among the items to be inspected in the list.

컴퓨터는 검사문서로부터 구문분석을 수행하여 검사대상 항목에 대응하는 특정정보를 추출할 수 있다(S200).The computer may perform syntax analysis from the inspection document to extract specific information corresponding to the inspection target item (S200).

즉, 컴퓨터는 검사문서 내 기재된 텍스트에 대해 구문분석을 수행하고, 구문분석을 통해 검사문서 내 텍스트로부터 검사대상 항목에 대응하는 특정정보를 추출할 수 있다. That is, the computer may perform syntax analysis on the text written in the inspection document, and extract specific information corresponding to the item to be inspected from the text in the inspection document through syntax analysis.

종래 대부분의 기술은 관공서 등에서 사용되는 문서 내 개인정보가 노출되는 것을 방지하기 위해서 문서 내 개인정보를 검출하는 것에 특화되어 있다. 개인정보는 법률적으로 정의되어 있는만큼 그 기준이 명확하다. 따라서, 문서 내 개인정보는 특정 패턴을 이용하면 용이하게 검출할 수 있다. Conventionally, most of the technologies are specialized in detecting personal information in documents in order to prevent exposure of personal information in documents used in public offices and the like. As for personal information, the standard is clear as it is legally defined. Therefore, personal information in a document can be easily detected by using a specific pattern.

그러나, 대입입시전형이나 기업채용전형 시에 제출하는 문서들 내 블라인드 처리가 필요한 검사대상 항목에 대응하는 특정정보의 경우, 명확한 기준이 정의되어 있지 않고 일정한 패턴을 가지는 것도 아니다. 대부분의 경우, 자기소개서에 자신의 역량이나 가족관계 등을 직접적으로 표현하는 것이 아니라 간접적으로 표현하는 경우가 많기 때문에, 검사대상 항목마다 일정한 패턴을 정의하는 것도 어렵고, 단순히 단어나 키워드 매칭만을 통해서 간접적인 표현으로부터 블라인드 처리가 필요한 특정정보를 검출하는데 한계가 있다. However, in the case of specific information corresponding to items subject to inspection that require blind processing in documents submitted during college admission or corporate employment screening, a clear standard is not defined and does not have a certain pattern. In most cases, it is difficult to define a certain pattern for each item to be examined, as it is often indirectly expressed rather than directly expressing one's competence or family relationship in the self-introduction letter. There is a limit to detecting specific information that needs to be blinded from the human expression.

예를 들어, 주민번호의 경우는 "111111-2222222"와 같이 특정 패턴이 존재하므로, 용이하게 검출할 수 있다. 이와 달리, 자기소개서의 경우, 1) "?? 선생님과 어머니의 제안에 따라 미국 유학을 가게??", 2) "?? 선생님인 어미니의 제안에 따라 미국 유학을 가게 ??" 와 같이 표현될 수 있다. 1)과 2)의 문장은 단순히 "선생님", "어머니" 등의 단어나 키워드 매칭만 이용할 경우, 1)과 2) 모두 인적사항을 표현한 블라인드 처리 대상으로 판단될 수 있다. 그러나, 문장의 문맥상으로는 2)의 문장이 인적사항을 기재한 표현이다. For example, in the case of the social security number, since a specific pattern exists, such as "111111-2222222", it can be easily detected. Alternatively, if the self-introduction: 1) "?? according to the suggestion of a teacher and her mother go to study in the United States?", 2) "?? go to study in the United States in accordance with the proposal of eomini a teacher?" It can be expressed as The sentences 1) and 2) may be judged as blind processing targets expressing personal information when only matching words or keywords such as "teacher" and "mother" are used. However, in the context of the sentence, the sentence 2) is an expression that describes personal information.

즉, 개인정보(예컨대, 주민번호)와 같이 일정한 패턴이 있는 경우는 문맥 독립적(context free)으로 파악될 수 있지만, 본 발명에서와 같은 블라인드 처리가 필요한 특정정보는 문맥 의존적(context sensitive)으로 파악해야 한다. 따라서, 본 발명에서는 검사문서 내 기재된 텍스트에 대해 구문분석을 수행하여 문맥 의존적으로 텍스트의 내용을 파악할 수 있도록 한다. In other words, if there is a certain pattern such as personal information (e.g., social security number), it can be identified as context-free, but specific information requiring blind processing as in the present invention is identified as context sensitive. Should be. Accordingly, in the present invention, it is possible to grasp the contents of the text in a context-dependent manner by performing a syntax analysis on the text written in the inspection document.

일 실시예로, 컴퓨터는 검사문서에 대해 구문분석을 수행하여 검사대상 항목에 대응하는 구문의 문맥을 파악하고, 그 결과를 기초로 검사대상 항목에 대응하는 특정정보를 추출할 수 있다. 이때, 컴퓨터는 딥러닝을 이용한 학습을 통해 구문분석을 수행하여 문맥을 파악할 수 있다. 이에 대한 구체적인 설명은 도 2를 참조하여 후술하도록 한다. In one embodiment, the computer may perform syntax analysis on the inspection document to determine the context of the syntax corresponding to the inspection target item, and extract specific information corresponding to the inspection target item based on the result. In this case, the computer can grasp the context by performing syntax analysis through learning using deep learning. A detailed description of this will be described later with reference to FIG. 2.

보다 구체적으로, 컴퓨터는 검사문서에 대한 구문분석을 통해 검사대상 항목에 대응하는 적어도 하나의 키워드를 추출하고, 추출된 적어도 하나의 키워드를 기반으로 문장의 문맥 파악을 통해 특정정보를 포함하는 후보 구문을 추출할 수 있다. More specifically, the computer extracts at least one keyword corresponding to the item to be inspected through the syntax analysis of the inspection document, and a candidate phrase including specific information by identifying the context of the sentence based on the extracted at least one keyword. Can be extracted.

일 실시예로, 키워드를 추출함에 있어서, 컴퓨터는 검사대상 항목의 종류에 따라서 추출 가능한 키워드를 획득할 수 있다. 예를 들어, 검사대상 항목으로 인적사항을 지정한 경우, 인적사항에 포함될 수 있는 성명, 주소, 부모 직업 등을 기초로 이와 관련된 정보를 키워드로서 추출할 수 있고, 검사대상 항목으로 학적사항을 지정한 경우, 학적사항에 포함될 수 있는 출신학교명, 성적 등을 기초로 이와 관련된 정보를 키워드로서 추출할 수 있다. 또한, 컴퓨터는 검사대상 항목에 대응하는 키워드를 추출한 다음, 추출한 키워드로부터 유추 가능한 정보를 추가적으로 획득하여 키워드를 확장시킬 수 있다. 예를 들어, 검사대상 항목에 대응하는 키워드로서 특정 학교 이름을 추출한 경우, 컴퓨터는 추출한 특정 학교 이름으로부터 유추할 수 있는 학교 축제명, 학교 주소, 학교 내 건물명 등과 같은 특정 학교과 관련된 확장 키워드를 추가적으로 획득할 수 있다.In one embodiment, in extracting the keyword, the computer may acquire the extractable keyword according to the type of the item to be examined. For example, when personal information is designated as an item to be inspected, related information can be extracted as a keyword based on the name, address, and parental occupation that can be included in the personal information, and academic information is designated as an item to be inspected. In addition, information related to this can be extracted as a keyword based on the name of the school where you graduated, grades, etc. that can be included in the academic information. In addition, the computer may extract a keyword corresponding to the item to be inspected, and then expand the keyword by additionally obtaining inferred information from the extracted keyword. For example, when a specific school name is extracted as a keyword corresponding to the item to be inspected, the computer additionally acquires extended keywords related to a specific school such as school festival name, school address, and building name within the school that can be inferred from the extracted specific school name. can do.

이때, 동일한 지원자에 대한 검사문서가 복수 개일 경우, 컴퓨터는 동일한 지원자에 대한 복수 개의 검사문서를 기초로 검사대상 항목에 대응하는 키워드를 추출할 수도 있다. 일 실시예로, 컴퓨터는 제1 지원자에 대한 제1 검사문서(예컨대, 학생부 문서)와 제2 검사문서(예컨대, 자기소개서 문서)를 획득한 경우, 제1 검사문서로부터 제1 지원자의 인적사항, 학적사항 등을 키워드로 추출할 수 있다. 또한, 컴퓨터는 제1 검사문서로부터 추출된 키워드를 기초로 유추 가능한 확장 키워드를 추가적으로 더 획득할 수 있다. 컴퓨터는 제1 검사문서로부터 추출된 키워드(확장 키워드 포함)를 기초로 제1 검사문서와 연계된 제2 검사문서에 대해 구문분석을 수행할 수 있다. 그 결과, 컴퓨터는 제2 검사문서 내 상기 키워드에 해당하는 특정정보를 포함하고 있는 후보 구문들을 추출할 수 있다. In this case, when there are a plurality of inspection documents for the same applicant, the computer may extract a keyword corresponding to the inspection target item based on the plurality of inspection documents for the same applicant. In one embodiment, when the computer obtains a first examination document (eg, student department document) and a second examination document (eg, self-introduction document) for the first applicant, the personal information of the first applicant from the first examination document , Academic information, etc. can be extracted as keywords. In addition, the computer may additionally obtain an extended keyword that can be inferred based on the keyword extracted from the first inspection document. The computer may perform syntax analysis on the second inspection document linked to the first inspection document based on the keyword (including the extended keyword) extracted from the first inspection document. As a result, the computer can extract candidate phrases including specific information corresponding to the keyword in the second inspection document.

다른 실시예로, 키워드를 추출함에 있어서, 컴퓨터는 사용자로부터 미리 정해진 키워드 목록을 획득할 수 있다. 이 경우, 컴퓨터는 검사문서에 대해 사용자에 의해 미리 정해진 키워드 목록을 적용하여 적어도 하나의 키워드를 추출할 수 있다. 예를 들어, 사용자(예컨대, 지원자)가 자신의 검사문서를 대상으로 블라인드 처리가 필요한 내용이 포함되어 있는지 여부를 검사하기 위해서 자신의 인적사항, 학적사항 등과 관련된 정보를 키워드로 미리 정하고, 이를 키워드 목록으로 제공할 수 있다. 또는, 사용자(예컨대, 대학입시전형을 주최하는 대학, 채용전형을 주최하는 기업체 등)가 지원자들의 검사문서를 대상으로 블라인드 처리가 필요한 내용이 포함되어 있는지 여부를 검사하기 위해서 각 대학별로 또는 각 기업체별로 정해진 블라인드 규정을 기초로 키워드들을 미리 생성한 다음, 이러한 키워드들을 포함하는 키워드 목록을 제공할 수 있다. In another embodiment, in extracting keywords, the computer may obtain a predetermined keyword list from the user. In this case, the computer may extract at least one keyword by applying a keyword list predetermined by the user to the inspection document. For example, in order to check whether a user (e.g., an applicant) contains information that needs to be blinded to his or her inspection document, information related to his/her personal information and academic information is predetermined as a keyword, and this keyword Can be provided as a list. Or, in order to check whether the user (e.g., a university that hosts the university entrance examination, a company that hosts the recruitment examination, etc.) Keywords may be generated in advance based on blind rules determined for each, and then a keyword list including these keywords may be provided.

이때, 컴퓨터가 사용자로부터 미리 정해진 키워드 목록을 제공받은 경우, 실시예에 따라서는 사용자로부터 제공받은 키워드 목록을 우선적으로 적용하여 검사대상 항목에 대응하는 키워드를 추출할 수 있다.In this case, when the computer receives a predetermined keyword list from the user, according to an embodiment, a keyword corresponding to the item to be examined may be extracted by preferentially applying the keyword list provided from the user.

또한, 실시에에 따라서, 컴퓨터는 사용자로부터 키워드 목록을 적용할 적용 범위를 획득할 수 있다. 적용 범위는 검사문서 내 특정 항목을 대상으로 결정되거나, 검사문서에 대한 소유자를 대상으로 결정될 수 있다. 일 실시예로, 컴퓨터는 사용자로부터 키워드 목록을 획득하고, 획득된 키워드 목록을 적용할 적용 범위를 추가적으로 입력 받을 수 있다. 예를 들어, 컴퓨터는 적용 범위를 설정할 수 있는 사용자 인터페이스 화면을 제공할 수 있다. 이 경우, 사용자는 사용자 인터페이스 화면을 통해 검사문서 내 키워드 목록을 적용할 적용 범위를 선택할 수 있다. 예컨대, 사용자 인터페이스 화면은 인적사항, 학적사항, 수상경력 사항 등과 같은 검사대상 항목별로 적용 범위를 지정할 수 있도록 제공될 수도 있고, 특정 지원자에게만 적용할지 지원자 전체에 대해 적용할지, 지원자가 제출한 전체 검사문서에 대해 적용할지 일부 검사문서에 대해 적용할지 등을 적용 범위로 지정할 수 있도록 제공될 수도 있다. In addition, depending on implementation, the computer may obtain an application range to which the keyword list is applied from the user. The scope of application may be determined for specific items in the inspection document, or may be determined for the owner of the inspection document. In an embodiment, the computer may obtain a keyword list from a user and additionally receive an input range to which the obtained keyword list is applied. For example, the computer may provide a user interface screen through which the application range can be set. In this case, the user can select an application range to apply the keyword list in the inspection document through the user interface screen. For example, the user interface screen may be provided so that the scope of application can be specified for each item to be examined, such as personal information, academic records, awards, etc., whether to apply only to specific applicants or to all applicants, or to apply the entire examination submitted by the applicant. It may be provided to designate whether to apply to documents or to some inspection documents as the scope of application.

컴퓨터는 검사문서로부터 추출된 검사대상 항목에 대응하는 특정정보에 대해, 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 블라인드 처리로서 적용할 수 있다(S300).The computer may select one of a masking process or a highlighting process for the specific information corresponding to the item to be inspected extracted from the inspection document and apply it as a blind process (S300).

일 실시예로, 컴퓨터는 상술한 바와 같이 검사문서에 대한 구문분석을 통해, 검사대상 항목에 대응하는 키워드를 기반으로 특정정보를 포함하는 후보 구문을 추출할 수 있다. 이때, 컴퓨터는 검사문서로부터 추출된 후보 구문이 블라인드 처리 대상 구문인지 여부에 대해 사용자로부터 선택하도록 할 수 있다. 즉, 컴퓨터는 후보 구문이 블라인드 처리 대상인지 여부에 대한 선택 결과를 사용자로부터 획득할 수 있다. 사용자의 선택에 의해 후보 구문이 블라인드 처리 대상 구문인 것으로 선택된 경우, 컴퓨터는 후보 구문에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용할 수 있다. In an embodiment, the computer may extract a candidate phrase including specific information based on a keyword corresponding to the item to be inspected through syntax analysis on the inspection document as described above. In this case, the computer may allow the user to select whether or not the candidate phrase extracted from the inspection document is a phrase subject to blind processing. That is, the computer may obtain a selection result of whether or not the candidate phrase is a blind processing target from the user. When the candidate phrase is selected as the phrase to be blinded by the user's selection, the computer may select and apply either a masking process or a highlighting process to the candidate phrase.

이와 같은 본 발명의 일 실시예에 따르면, 먼저 검사대상 항목에 대응하는 키워드를 기반으로 특정정보를 포함하는 후보 구문들을 추출한 다음, 후보 구문들 중에서 마스킹 처리 또는 하이라이팅 처리가 되어야 할 필요가 있는 실제 구문들만 최종적으로 선별할 수 있게 된다. 따라서, 최종적으로는 블라인드 처리 대상에 대한 인식률을 높일 수 있고, 이를 통해 정확성과 객관성이 보장된 결과를 제공해 줄 수 있다. According to one embodiment of the present invention, first, candidate phrases including specific information are extracted based on a keyword corresponding to an item to be inspected, and then the actual phrases that need to be masked or highlighted among candidate phrases. Only people can finally be selected. Therefore, it is possible to increase the recognition rate of the blind processing target in the end, and through this, it is possible to provide a result with guaranteed accuracy and objectivity.

또한 후보 구문에 대한 마스킹 처리 또는 하이라이팅 처리를 함에 있어서, 컴퓨터는 검사대상 항목별로 마스킹 처리를 할지 하이라이팅 처리를 할지를 결정할 수 있다. 예컨대, 컴퓨터는 사용자로부터 각 검사대상 항목별로 마스킹 처리를 할지 하이라이팅 처리를 할지를 결정하도록 할 수도 있고, 블라인드 규정(예컨대, 0점 처리되는 정보, 평가에 반영되지 않는 정보, 가점이나 우선순위가 부여되는 정보 등)에 따라 각 검사대상 항목별로 마스킹 처리 또는 하이라이팅 처리를 결정하여 적용할 수도 있다.In addition, in masking or highlighting the candidate phrase, the computer may determine whether to perform masking or highlighting for each inspection target item. For example, the computer may allow the user to decide whether to perform masking or highlighting for each item to be inspected, and blind regulations (e.g., information processed with zero points, information not reflected in the evaluation, additional points or priority) Depending on information, etc.), masking processing or highlighting processing may be determined and applied for each inspection target item.

실시예에 따라, 컴퓨터는 특정정보를 포함하는 후보 구문을 바탕으로 추출되어야 하는 항목인데 추출되지 않았거나, 추출될 필요가 없는 항목이 추출된 경우를 판단하여, 해당 항목에 대해 후보정을 수행할 수 있다. Depending on the embodiment, the computer may determine an item that is to be extracted based on a candidate phrase including specific information, but has not been extracted, or an item that does not need to be extracted is extracted, and can perform candidate correction on the item. have.

후보정을 수행함에 있어, 컴퓨터는 특정정보를 포함하는 후보 구문을 바탕으로 블라인드 규칙 또는 하이라이트 규칙을 추가하거나 제외할 수 있다. 블라인드 규칙은 검사문서로부터 마스킹 처리를 하고 싶은 검사대상 항목이나 특정 문구를 정하는 것을 말하며, 하이라이트 규칙은 검사문서로부터 하이라이트 처리를 하고 싶은 검사대상 항목이나 특정 문구를 정하는 것을 말한다. In performing the candidate correction, the computer may add or exclude a blind rule or a highlight rule based on a candidate phrase including specific information. The blind rule refers to specifying an item to be inspected or a specific phrase to be masked from an inspection document, and a highlight rule refers to setting an item to be inspected or a specific phrase to be highlighted from an inspection document.

일 실시예로, 컴퓨터는 특정정보를 포함하는 후보 구문을 바탕으로 검사대상 항목에 추가할 추가 구문을 등록함으로써, 새로운 블라인드 규칙을 생성할 수 있다. 또는, 컴퓨터는 특정정보를 포함하는 후보 구문을 바탕으로 검사대상 항목에서 제외할 제외 구문을 등록함으로써, 블라인드 규칙으로부터 제외 구문에 해당하는 규칙을 제거할 수 있다. 또한, 컴퓨터는 블라인드 규칙과는 별도로 특정 구문을 확인하고 싶을 때 특정 구문을 등록하여, 하이라이트 규칙으로 지정할 수도 있다. 이와 같이 블라인드 규칙 및 하이라이트 규칙을 추가하거나 제외한 경우, 컴퓨터는 검사문서를 대상으로 검사를 다시 수행함으로써 추가 또는 제외한 블라인드 규칙 및 하이라이트 규칙을 적용할 수 있다.In an embodiment, the computer may create a new blind rule by registering an additional phrase to be added to the item to be inspected based on a candidate phrase including specific information. Alternatively, the computer may remove the rule corresponding to the excluded phrase from the blind rule by registering the excluded phrase to be excluded from the item to be examined based on the candidate phrase including the specific information. In addition, when the computer wants to check a specific phrase separate from the blind rule, it can register a specific phrase and designate it as a highlight rule. In the case of adding or excluding the blind rule and the highlight rule as described above, the computer may apply the added or excluded blind rule and the highlight rule by performing the inspection again on the inspection document.

컴퓨터는 단계 S100 ~ S300을 통해 검사문서로부터 추출된 블라인드 처리가 필요한 특정정보를 포함하는 구문에 대해 최종적으로 마스킹 처리 또는 하이라이팅 처리하여, 사용자에게 제공할 수 있다. The computer may provide a final masking process or highlighting process for the phrase including the specific information required for blind processing extracted from the inspection document through steps S100 to S300, and provide it to the user.

도 2는 본 발명의 일 실시예에 따른 딥러닝을 이용한 학습을 통해 구문분석을 수행하는 방법을 설명하기 위해 도시한 흐름도이다. 2 is a flow chart illustrating a method of performing syntax analysis through learning using deep learning according to an embodiment of the present invention.

도 2의 방법은 상술한 도 1의 단계 S200 과정에 적용될 수 있다. 이때 딥러닝을 통한 학습 과정은 사전에 수행된 것일 수 있고, 도 1의 단계 S200 과정에는 이러한 학습을 통해 도출된 구문분석을 위한 학습 모델을 사용할 수 있다. The method of FIG. 2 can be applied to the step S200 of FIG. 1 described above. In this case, the learning process through deep learning may be performed in advance, and a learning model for syntax analysis derived through such learning may be used in step S200 of FIG. 1.

도 2를 참조하면, 컴퓨터는 검사문서를 딥러닝이 처리할 수 있는 형태(즉, 벡터값)로 데이터를 변환할 수 있다(S210).Referring to FIG. 2, the computer may convert data into a form (ie, vector value) that can be processed by deep learning (S210).

일 실시예로, 컴퓨터는 자기소개서 등과 같은 검사문서를 획득하고, 획득한 검사문서 내 텍스트를 단어 레벨, 글자 레벨, 자모 레벨 중 적어도 하나의 형태로 변환할 수 있다. 본 발명의 실시예에서는 글자 레벨의 형태로 검사문서를 변환할 수 있다. 글자 레벨의 경우는 새로운 데이터에 대한 대처 능력이 상대적으로 뛰어나고, 특히 새로운 단어나 글자의 조합이 생겼을 때 대처하기 용이하다. In one embodiment, the computer may obtain a test document such as a self-introduction letter, and convert the text in the obtained test document into at least one of a word level, a character level, and a letter level. In an embodiment of the present invention, the inspection document may be converted into a text level form. In the case of the letter level, the ability to cope with new data is relatively excellent, and it is particularly easy to cope with new words or letter combinations.

예를 들어, 컴퓨터는 먼저 한글에서 쓰일 수 있는 글자를 바탕으로, 각 글자를 벡터값으로 변환하여 정의해 둘 수 있다. 그리고, 컴퓨터는 검사문서를 획득하여 검사문서 내 각 글자를 정의된 벡터값으로 변환하여 표현할 수 있다.For example, a computer can first convert and define each character into a vector value based on the characters that can be used in Korean. In addition, the computer may obtain the inspection document and convert each character in the inspection document into a defined vector value for expression.

컴퓨터는 변환된 데이터를 학습데이터로 사용하여 학습을 수행할 수 있다(S220).The computer may perform learning by using the converted data as training data (S220).

일 실시예로, 컴퓨터는 변환된 데이터로부터 검사대상 항목에 대응하는 데이터(예컨대, 부모직업이 포함된 데이터)와 검사대상 항목에 대응하지 않는 데이터(예컨대, 부모직업이 포함되지 않은 데이터)를 분리하고, 이를 각각 학습시킬 수 있다. 이때, 컴퓨터는 글자 단위로 N-gram 모델을 적용하여 학습을 수행할 수 있다. 또한, 학습은 훈련과 검증 과정을 거쳐 수행될 수 있다. In one embodiment, the computer separates data corresponding to the item to be inspected (e.g., data including parental occupation) and data that does not correspond to the item to be inspected (e.g., data not including parental occupation) from the converted data And you can learn each. In this case, the computer may perform learning by applying the N-gram model in units of letters. In addition, learning can be performed through training and verification processes.

컴퓨터는 학습 데이터에 대한 학습의 결과를 판단하고, 이를 통해 문맥 의존적인 구문분석을 수행하는 학습 모델을 도출할 수 있다(S230).The computer may determine the result of learning about the learning data, and derive a learning model that performs context-dependent syntax analysis through this (S230).

일 실시예로, 컴퓨터는 변환된 데이터(즉, 학습 데이터)를 기초로 학습을 수행한 결과로서 정확률과 재현율을 산출하고, 산출된 정확률과 재현율을 종합적으로 고려하여 최종적인 학습 결과를 판단할 수 있다. 그리고, 컴퓨터는 학습 결과를 바탕으로 학습 모델을 도출할 수 있다. In one embodiment, the computer calculates an accuracy rate and a recall rate as a result of performing learning based on the converted data (i.e., training data), and can determine the final learning result by comprehensively considering the calculated accuracy rate and recall rate. have. And, the computer can derive a learning model based on the learning result.

따라서, 컴퓨터는 도출된 학습 모델을 이용함으로써, 블라인드 처리가 필요한 검사문서에 대해 구문분석을 수행하여 검사대상 항목에 해당하는 각 문장의 문맥을 파악할 수 있다. 예를 들어, 컴퓨터는 블라인드 처리가 필요한 검사문서를 학습 모델에 입력값으로 입력하여 구문분석을 수행한 다음, 그 결과로서 검사문서 내 각 문장에 대한 문맥 파악을 통해 블라인드 처리가 필요한 특정정보를 추출한 출력값을 출력할 수 있다. Accordingly, the computer can grasp the context of each sentence corresponding to the item to be inspected by performing syntax analysis on the inspection document requiring blind processing by using the derived learning model. For example, the computer performs syntax analysis by inputting a test document requiring blind processing as an input value into the learning model, and as a result, extracting specific information requiring blind processing by identifying the context of each sentence in the test document. You can print the output value.

도 3 내지 도 7은 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 수행할 때 사용자에게 제공되는 사용자 인터페이스 화면의 예시들을 도시한 도면이다. 3 to 7 are diagrams illustrating examples of user interface screens provided to a user when performing a blind processing method of specific information in an inspection document according to an embodiment of the present invention.

먼저, 사용자는 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 수행할 수 있는 프로그램을 컴퓨팅 장치(즉, 컴퓨터)에 설치하고, 이를 실행시킬 수 있다. 컴퓨터는 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 수행할 수 있는 프로그램을 구동시킴으로써, 후술할 도 3 내지 도 8과 같은 다양한 사용자 인터페이스 화면을 제공할 수 있다. 사용자는 사용자 인터페이스 화면을 통해 검사문서를 대상으로 블라인드 처리 대상 정보가 존재하는지 여부를 검사할 수 있다. First, a user may install a program capable of performing a blind processing method of specific information in an inspection document according to an embodiment of the present invention in a computing device (ie, a computer) and execute it. The computer may provide various user interface screens as shown in FIGS. 3 to 8 to be described later by running a program capable of performing the blind processing method of specific information in the inspection document according to an embodiment of the present invention. The user can check whether blind processing target information exists for the inspection document through the user interface screen.

도 3은 사용자가 블라인드 처리 여부를 검사하기 위한 검사문서를 입력하는 사용자 인터페이스 화면의 일례를 도시한 것이다. 3 is a diagram illustrating an example of a user interface screen in which a user inputs an inspection document for inspecting whether or not blind is processed.

일 실시예로, 컴퓨터는 사용자로부터 검사문서 파일을 입력하는 입력 액션을 수신하면, 도 3의 파일 입력을 위한 사용자 인터페이스(100)와 같은 화면을 제공할 수 있다. 이때, 사용자는 파일 입력을 위한 사용자 인터페이스(100)를 통해 '불러오기'(110)를 실행하여 검사문서 파일을 입력할 수 있다. In an embodiment, when receiving an input action for inputting an inspection document file from a user, the computer may provide a screen such as the user interface 100 for file input of FIG. 3. In this case, the user may input the inspection document file by executing the'import' 110 through the user interface 100 for file input.

컴퓨터는 사용자로부터 '불러오기'(110) 액션을 수신하면, 도 3의 불러오기 사용자 인터페이스(120)와 같은 화면을 제공할 수 있다. 이때, 사용자는 불러오기 사용자 인터페이스(120)를 통해 검사문서(예컨대, 학생부 파일, 자기소개서 파일 등)를 검사를 실행할 해당 폴더에 입력할 수 있다. 따라서, 컴퓨터는 사용자로부터 검사문서를 획득할 수 있다. When the computer receives the'load' 110 action from the user, the computer may provide the same screen as the loading user interface 120 of FIG. 3. In this case, the user may input a test document (eg, a student department file, a self-introduction file, etc.) through the import user interface 120 into a corresponding folder to perform the test. Thus, the computer can obtain the inspection document from the user.

실시예에 따라, 컴퓨터는 검사문서를 특정 형식의 파일(예컨대, db3 파일)로 변환하는 과정을 수행할 수도 있다. 이 경우, 사용자는 도 3의 사용자 인터페이스(100)를 통해 '자기소개서 변환'을 실행하여 검사문서를 특정 형식의 파일로 변환할 수 있다. Depending on the embodiment, the computer may perform a process of converting the inspection document into a file of a specific format (eg, a db3 file). In this case, the user may convert the inspection document into a file of a specific format by executing'Convert self-introduction' through the user interface 100 of FIG. 3.

도 4는 검사문서 내에서 블라인드 처리 여부를 검사할 검사 범위를 설정하는 사용자 인터페이스 화면의 일례를 도시한 것이다. 4 is a diagram illustrating an example of a user interface screen for setting an inspection range to be inspected for blind processing in an inspection document.

일 실시예로, 컴퓨터는 사용자로부터 검사문서 내 검사 범위를 설정하는 액션을 수신하면, 도 4의 학생부 설정을 위한 사용자 인터페이스(200) 또는 도 4의 자기소개서 설정을 위한 사용자 인터페이스(210)와 같은 화면을 제공할 수 있다. 이때, 사용자는 학생부 설정을 위한 사용자 인터페이스(200) 또는 자기소개서 설정을 위한 사용자 인터페이스(210)를 통해 검사문서 내 기재된 각 항목별로 블라인드 처리 여부를 검사할 검사 범위를 선택할 수 있다. In one embodiment, the computer receives an action for setting the inspection range in the inspection document from the user, such as the user interface 200 for setting the student department of FIG. 4 or the user interface 210 for setting the self-introduction letter of FIG. You can provide a screen. In this case, the user may select the inspection range to be inspected for blind processing for each item described in the inspection document through the user interface 200 for setting the student department or the user interface 210 for setting the self-introduction letter.

이에 따라, 컴퓨터는 사용자로부터 검사 범위를 설정한 설정 정보를 수신하고, 수신한 설정 정보를 기초로 검사문서 내 해당 검사 범위에 대해서만 블라인드 처리가 필요한 정보가 포함되어 있는지 여부를 검사할 수 있다. Accordingly, the computer may receive setting information for setting an inspection range from a user, and check whether information necessary for blind processing is included only for a corresponding inspection range in the inspection document based on the received setting information.

도 5는 검사문서 내에서 블라인드 처리가 필요한 검사대상 항목을 설정하는 사용자 인터페이스 화면의 일례를 도시한 것이다. 5 shows an example of a user interface screen for setting an inspection target item requiring blind processing in an inspection document.

일 실시예로, 컴퓨터는 사용자로부터 검사문서 내 검사대상 항목을 설정하는 액션을 수신하면, 도 5의 검사항목 설정을 위한 사용자 인터페이스(300)와 같은 화면을 제공할 수 있다. 이때, 사용자는 검사항목 설정을 위한 사용자 인터페이스(300)를 통해 검사문서 내 기재된 각 항목별로 검사대상 정보를 설정할 수 있다. In an embodiment, when receiving an action for setting an item to be inspected in the inspection document from the user, the computer may provide a screen such as the user interface 300 for setting inspection items of FIG. 5. In this case, the user may set inspection target information for each item described in the inspection document through the user interface 300 for setting inspection items.

예를 들어, 각 대학입시전형별로 자기소개서 등과 같은 검사문서 내 배제시켜야 할 정보, 즉 블라인드 처리가 필요한 규칙이 다를 수 있다. 예컨대, 대학입시전형 시 자기소개서 내에 인적사항 항목, 학적사항 항목, 0점처리 항목 등을 배제시켜야 할 항목으로 지정할 수 있다. 특히, 인적사항 항목 중에서 부모 직업, 출신 고등학교, 수험번호, 지원자 성명 등의 특정정보에 대해 자기소개서에 기재해서는 안되는 블라인드 처리 항목으로 지정할 수 있다. For example, information to be excluded in examination documents, such as self-introduction letters, for each college entrance examination, that is, rules requiring blind processing may be different. For example, during the university entrance examination, personal information items, academic information items, and zero-point processing items can be designated as items to be excluded in the self-introduction. In particular, specific information such as parent's occupation, high school from which he graduated, and applicant's name, among personal information items, can be designated as blind items that should not be entered in the self-introduction letter.

이 경우, 사용자는 도 5의 검사항목 설정을 위한 사용자 인터페이스(300)를 통해 검사문서 내 부모직업, 고등학교, 수험번호, 지원자 성명, 공인어학성적, 교회수상실적 등과 같은 특정한 정보를 검사대상 항목으로 지정할 수 있다. 이에 따라, 컴퓨터는 사용자로부터 검사대상 항목에 대한 정보를 수신하고, 수신한 검사대상 항목에 대한 정보를 기초로 검사문서로부터 검사대상 항목에 대응하는 특정정보를 추출할 수 있다. In this case, the user selects specific information such as parental occupation, high school, test number, applicant's name, official language score, church awards, etc. in the test document through the user interface 300 for setting test items in FIG. Can be specified. Accordingly, the computer may receive information on the item to be inspected from the user, and extract specific information corresponding to the item to be inspected from the inspection document based on the information on the item to be inspected.

도 6은 검사문서에 대해 검사를 실행한 결과를 나타내는 사용자 인터페이스 화면의 일례를 도시한 것이다. 6 shows an example of a user interface screen showing a result of performing an inspection on an inspection document.

일 실시예로, 컴퓨터는 검사문서에 대한 블라인드 처리 여부 검사를 실행한 다음, 그 결과로 도 6과 사용자 인터페이스(400)와 같은 결과 화면을 제공할 수 있다. In one embodiment, the computer may perform a blind processing check on the inspection document, and then provide a result screen as shown in FIG. 6 and the user interface 400 as a result.

이때, 결과 화면에는 학생부 또는 자기소개서 등의 검사문서에 대해 검사를 실행한 최종 결과를 요약해서 보여주는 검사문서 리스트 화면(410)을 포함할 수 있다. In this case, the result screen may include a test document list screen 410 that summarizes and shows the final result of performing the test on the test document such as the student department or self-introduction.

또한, 결과 화면에는 검사문서로부터 추출된 블라인드 처리가 필요한 특정정보를 보여주는 화면(420)을 포함할 수 있다. 이때, 화면(420) 상에는 특정정보를 하이라이트 처리하여 표시할 수 있으며, 또한 해당 특정정보를 포함하는 구문 전체에 대해 하이라이트 처리할 수도 있다. In addition, the result screen may include a screen 420 showing specific information requiring blind processing extracted from the inspection document. In this case, specific information may be highlighted and displayed on the screen 420, and the entire phrase including the specific information may be highlighted.

일 실시예로, 사용자는 검사문서로부터 추출된 특정정보를 보여주는 화면(420)을 통해 출력된 하이라이트 처리된 구문들 중에서 실제 블라인드 처리 대상 구문인지 여부를 결정할 수 있고, 실제 블라인드 처리 대상 구문에 대해 블라인드 처리할 것을 요청할 수 있다. 따라서, 컴퓨터는 사용자의 블라인드 처리 요청에 대해, 해당 구문을 블라인드 처리(예컨대, 하이라이트 처리 또는 마스킹 처리)를 수행할 수 있다. In one embodiment, the user may determine whether or not the phrase is the actual blind treatment target statement among the highlighted phrases output through the screen 420 showing the specific information extracted from the inspection document, and the actual blind treatment target statement is blinded. You can ask to do it. Accordingly, the computer may perform blind processing (eg, highlight processing or masking processing) on the corresponding statement in response to the user's blind processing request.

또한, 결과 화면에는 하나의 검사문서 전체 내용을 출력하여 보여주되, 검사문서 내 텍스트에 대해 마스킹 처리 또는 하이라이팅 처리를 적용한 화면(430)을 포함할 수 있다. 이때, 검사문서로부터 추출된 블라인드 처리가 필요한 특정정보를 다양하게 볼 수 있는 사용자 인터페이스(440)를 제공할 수 있다. 예를 들어, 표시하기(하이라이팅) 탭, 가리기(마스킹) 탭, 원본 탭을 포함하는 사용자 인터페이스(440)를 제공할 수 있다. 컴퓨터는 사용자로부터 사용자 인터페이스(440)의 표시하기(하이라이팅) 탭을 실행시키는 액션을 수신하면, 검사문서 내 추출된 특정정보를 하이라이트하여 출력할 수 있다. 컴퓨터는 사용자로부터 사용자 인터페이스(440)의 가리기(마스킹) 탭을 실행시키는 액션을 수신하면, 검사문서 내 추출된 특정정보를 마스킹하여 출력할 수 있다. 컴퓨터는 사용자로부터 사용자 인터페이스(440)의 원본 탭을 실행시키는 액션을 수신하면, 검사문서 내 텍스트를 마스킹 또는 하이라이팅 처리 없이 원본 상태로 출력할 수 있다. In addition, the result screen displays the entire contents of one inspection document, but may include a screen 430 to which a masking process or highlighting process is applied to the text in the inspection document. In this case, a user interface 440 for variously viewing specific information requiring blind processing extracted from the inspection document may be provided. For example, a user interface 440 including a display (highlighting) tab, a masking (masking) tab, and an original tab may be provided. When the computer receives an action of executing the display (highlighting) tab of the user interface 440 from the user, the computer may highlight and output specific information extracted in the inspection document. When the computer receives an action of executing the masking (masking) tab of the user interface 440 from the user, the computer may mask and output specific information extracted in the inspection document. When the computer receives an action of executing the original tab of the user interface 440 from the user, the computer may output the text in the inspection document in the original state without masking or highlighting.

도 7은 사용자가 블라인드 규칙 및 하이라이트 규칙을 추가/제거할 수 있는 사용자 인터페이스 화면의 일례를 도시한 것이다. 7 shows an example of a user interface screen through which a user can add/remove a blind rule and a highlight rule.

일 실시예로, 컴퓨터는 사용자로부터 블라인드 규칙 또는 하이라이트 규칙을 추가하거나 제외하는 액션을 수신하면, 도 7의 사용자 인터페이스(500)와 같은 화면을 제공할 수 있다. 이때, 사용자는 사용자 인터페이스(500)를 통해 '블라인드 규칙 추가', '블라인드 규칙 제외', '하이라이트 규칙 추가' 등의 기능을 실행시킬 수 있다. 이에 따라, 컴퓨터는 해당 기능에 대한 화면(510)을 제공하고, 사용자로부터 블라인드 규칙 또는 하이라이트 규칙을 입력 받을 수 있다. In an embodiment, when receiving an action for adding or excluding a blind rule or a highlight rule from a user, the computer may provide a screen such as the user interface 500 of FIG. 7. In this case, the user may execute functions such as'add blind rule','exclude blind rule', and'add highlight rule' through the user interface 500. Accordingly, the computer may provide a screen 510 for a corresponding function and receive a blind rule or a highlight rule from a user.

예컨대, 사용자는 도 6의 결과 화면(420) 상에 출력된 특정정보를 포함하는 텍스트를 바탕으로, 텍스트 내 원하는 구문을 지정하여 블라인드 규칙 또는 하이라이트 규칙을 설정할 수 있다. 도 6의 결과 화면(420) 상에서 텍스트 내 원하는 구문을 지정하여 특정 액션(예컨대, 마우스 오른쪽 버튼 클릭)을 수행하면, 도 7의 사용자 인터페이스(500) 화면이 제공될 수 있다. For example, the user may set a blind rule or a highlight rule by designating a desired phrase in the text based on the text including specific information output on the result screen 420 of FIG. 6. When a specific action (eg, right-clicking a mouse) is performed by designating a desired phrase in the text on the result screen 420 of FIG. 6, the screen of the user interface 500 of FIG. 7 may be provided.

사용자는 도 7과 같은 블라인드 규칙 또는 하이라이트 규칙을 추가/제거할 수 있는 사용자 인터페이스(500)를 통해 다음과 같은 다양한 규칙들을 설정할 수 있다. A user may set various rules as follows through a user interface 500 capable of adding/removing a blind rule or a highlight rule as illustrated in FIG. 7.

예를 들어, 지원자의 출신고교명은 블라인드 처리(예컨대, 마스킹 처리)를 하되, 지원자의 출신고교명이 아닌 다른 고등학교 명칭은 블라인드 처리를 하지 않는 규칙을 설정할 수 있다. 또는, 지원자가 2개 이상의 고등학교를 다닌 경우(예컨대, 고등학교를 전학한 경우), 지원자가 다닌 모든 고등학교를 출신고교로 인식하여 블라인드 처리하는 규칙을 설정할 수 있다. 학생부 파일과 연동하여 지원자의 이름 정보를 추출하고, 추출된 지원자의 이름 정보를 자기소개서 파일에 적용한다는 규칙을 설정할 수 있다. 또는, 지원자의 이름에서 성을 제외하고 이름만 사용한 경우, 이름에 한해서도 블라인드 처리하는 규칙을 설정할 수 있다. For example, it is possible to set a rule that blinds the name of the applicant's high school (for example, masking), but does not blind the name of a high school other than the name of the applicant's high school. Alternatively, if an applicant has attended two or more high schools (eg, transfers from high school), a rule that blinds all high schools attended by the applicant is recognized as the high school they attended can be set. You can set a rule that extracts the applicant's name information in conjunction with the student department file and applies the extracted applicant's name information to the self-introduction file. Or, if the applicant's first name is excluded from the last name and only the first name is used, a rule to blind only the first name can be set.

또한, 블라인드 규칙 또는 하이라이트 규칙을 추가/제거함에 있어서, 사용자는 블라인드 처리를 위한 추가 구문 또는 제외 구문을 등록하면서 등록된 구문의 검사 방식에 대해 설정할 수도 있다. In addition, in adding/removing a blind rule or a highlight rule, the user may set an inspection method of the registered phrase while registering an additional phrase or an excluded phrase for blind processing.

예를 들어, 블라인드 규칙 또는 하이라이트 규칙으로 추가 구문 또는 제외 구문이 등록된 경우, 컴퓨터는 검사문서 내에서 추가 구문 또는 제외 구문을 어절 단위로 매칭할지 음절 단위로 매칭할지를 선택하는 사용자 인터페이스를 추가적으로 제공할 수 있다. 일례로, 추가 구문으로 '아버지'가 등록되었고 검사문서 상에는 '할아버지'가 있는 경우를 예로 들어 설명하면, 사용자가 어절 단위 매칭을 선택한 경우에는 검사문서로부터 추가 구문('아버지')과 매칭되는 구문을 검출할 수 없으나, 사용자가 음절 단위 매칭을 선택한 경우에는 검사문서로부터 추가 구문('아버지')과 매칭되는 구문('할아버지')을 검출하게 된다. For example, when an additional phrase or an excluded phrase is registered as a blind rule or a highlight rule, the computer may additionally provide a user interface that selects whether to match the additional phrase or the excluded phrase by word or by syllable in the inspection document. I can. As an example, if'father' is registered as an additional phrase and there is'grandfather' on the inspection document as an example, when the user selects word unit matching, a phrase matching the additional phrase ('father') from the inspection document Is not detectable, but when the user selects syllable unit matching, the phrase matching the additional phrase ('father') ('grandfather') is detected from the inspection document.

다른 예로, 블라인드 규칙 또는 하이라이트 규칙으로 추가 구문 또는 제외 구문이 등록된 경우, 컴퓨터는 추가 구문 또는 제외 구문에 대해 검사문서 내에서 띄워쓰기를 유지한 채로 매칭할지 무시하고 매칭할지를 선택하는 사용자 인터페이스를 추가적으로 제공할 수 있다. 일례로, 추가 구문으로 '친형'이 등록되었고 검사문서 상에는 '도망친 형을 만나서'가 있는 경우를 예로 들어 설명하면, 사용자가 띄어쓰기 유지 매칭을 선택한 경우에는 검사문서로부터 추가 구문('친형')과 매칭되는 구문을 검출할 수 없으나, 사용자가 띄어쓰기 무시 매칭을 선택한 경우에는 검사문서로부터 추가 구문('친형')과 매칭되는 구문('도망친 형을 만나서')을 검출하게 된다. As another example, when additional phrases or excluded phrases are registered as blind rule or highlight rule, the computer additionally provides a user interface for selecting whether to match or ignore the additional phrases or excluded phrases with spaces in the inspection document. Can provide. As an example, explaining a case where'brother' is registered as an additional phrase and'I met the runaway brother' on the inspection document. If the user chooses to keep spaces matching, the additional phrase ('brother') from the inspection document and When the matching phrase cannot be detected, but the user selects the matching by ignoring spaces, the phrase matching the additional phrase ('brother brother') ('meet the runaway brother') is detected from the inspection document.

도 8은 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법을 수행하는 장치(600)의 구성을 개략적으로 나타내는 도면이다. 8 is a diagram schematically showing the configuration of an apparatus 600 for performing a blind processing method of specific information in an inspection document according to an embodiment of the present invention.

도 8을 참조하면, 프로세서(610)는 하나 이상의 코어(core, 미도시) 및 그래픽 처리부(미도시) 및/또는 다른 구성 요소와 신호를 송수신하는 연결 통로(예를 들어, 버스(bus) 등)를 포함할 수 있다.Referring to FIG. 8, the processor 610 is a connection path (eg, a bus) for transmitting and receiving signals with one or more cores (not shown), a graphic processing unit (not shown), and/or other components. ) Can be included.

일 실시예에 따른 프로세서(610)는 메모리(620)에 저장된 하나 이상의 인스트럭션을 실행함으로써, 도 1 내지 도 7과 관련하여 설명된 검사문서 내 특정정보의 블라인드 처리 방법을 수행한다.The processor 610 according to an exemplary embodiment executes one or more instructions stored in the memory 620 to perform the blind processing method of specific information in the inspection document described with reference to FIGS. 1 to 7.

일례로, 프로세서(610)는 메모리(620)에 저장된 하나 이상의 인스트럭션을 실행함으로써 검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 단계, 상기 검사문서로부터 구문분석을 수행하여 상기 검사대상 항목에 대응하는 특정정보를 추출하는 단계, 및 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 단계를 수행할 수 있다. In one example, the processor 610 determines an item to be inspected that needs blind processing in the inspection document by executing one or more instructions stored in the memory 620, and performs a syntax analysis from the inspection document to correspond to the item to be inspected. A step of extracting specific information to be performed, and a step of selecting and applying one of a masking process or a highlighting process to the specific information may be performed.

한편, 프로세서(610)는 프로세서(610) 내부에서 처리되는 신호(또는, 데이터)를 일시적 및/또는 영구적으로 저장하는 램(RAM: Random Access Memory, 미도시) 및 롬(ROM: Read-Only Memory, 미도시)을 더 포함할 수 있다. 또한, 프로세서(610)는 그래픽 처리부, 램 및 롬 중 적어도 하나를 포함하는 시스템온칩(SoC: system on chip) 형태로 구현될 수 있다.On the other hand, the processor 610 is a RAM (Random Access Memory, not shown) and a ROM (ROM: Read-Only Memory) for temporarily and/or permanently storing signals (or data) processed inside the processor 610. , Not shown) may further include. In addition, the processor 610 may be implemented in the form of a system on chip (SoC) including at least one of a graphic processing unit, RAM, and ROM.

메모리(620)에는 프로세서(610)의 처리 및 제어를 위한 프로그램들(하나 이상의 인스트럭션들)을 저장할 수 있다. 메모리(620)에 저장된 프로그램들은 기능에 따라 복수 개의 모듈들로 구분될 수 있다.The memory 620 may store programs (one or more instructions) for processing and controlling the processor 610. Programs stored in the memory 620 may be divided into a plurality of modules according to functions.

이상에서 전술한 본 발명의 일 실시예에 따른 검사문서 내 특정정보의 블라인드 처리 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다.The blind processing method of specific information in an inspection document according to an embodiment of the present invention described above may be implemented as a program (or application) to be executed in combination with a computer, which is hardware, and stored in a medium.

상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.The above-described program is C, C++, JAVA, machine language, etc. that can be read by the computer's processor (CPU) through the device interface of the computer in order for the computer to read the program and execute the methods implemented as a program. It may include a code (Code) coded in the computer language of. Such code may include a functional code related to a function defining necessary functions for executing the methods, and a control code related to an execution procedure necessary for the processor of the computer to execute the functions according to a predetermined procedure. can do. In addition, such code may further include additional information required for the processor of the computer to execute the functions or code related to a memory reference to which location (address address) of the internal or external memory of the computer should be referenced. have. In addition, when the processor of the computer needs to communicate with any other computer or server in the remote in order to execute the functions, the code uses the communication module of the computer to determine how It may further include a communication-related code for whether to communicate or what information or media to transmit and receive during communication.

상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.The stored medium is not a medium that stores data for a short moment, such as a register, cache, memory, etc., but a medium that stores data semi-permanently and can be read by a device. Specifically, examples of the storage medium include, but are not limited to, ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like. That is, the program may be stored in various recording media on various servers to which the computer can access, or on various recording media on the user's computer. In addition, the medium may be distributed over a computer system connected through a network, and computer-readable codes may be stored in a distributed manner.

본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.The steps of a method or algorithm described in connection with an embodiment of the present invention may be implemented directly in hardware, implemented as a software module executed by hardware, or a combination thereof. Software modules include Random Access Memory (RAM), Read Only Memory (ROM), Erasable Programmable ROM (EPROM), Electrically Erasable Programmable ROM (EEPROM), Flash Memory, hard disk, removable disk, CD-ROM, or It may reside on any type of computer-readable recording medium well known in the art to which the present invention pertains.

이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.In the above, embodiments of the present invention have been described with reference to the accompanying drawings, but those skilled in the art to which the present invention pertains can be implemented in other specific forms without changing the technical spirit or essential features. You can understand. Therefore, the embodiments described above are illustrative in all respects, and should be understood as non-limiting.

Claims (12)

삭제delete 컴퓨터에 의해 수행되며, 특정 전형에 지원한 지원자의 검사문서 내 특정정보의 블라인드 처리 방법에 있어서,
검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 단계;
상기 검사문서로부터 구문분석을 수행하여 상기 검사대상 항목에 대응하는 특정정보를 추출하는 단계;
상기 검사문서로부터 상기 검사대상 항목의 종류에 따라서 추출 가능한 하나 이상의 키워드를 획득하는 단계; 및
미리 정해진 블라인드 규정을 기초로 하여 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 단계를 포함하고,
동일한 지원자에 대한 검사문서가 복수 개일 경우, 동일한 지원자에 대한 제1 검사문서로부터 추출된 키워드를 기초로 유추 가능한 확장 키워드를 추가로 획득하고,
상기 획득된 키워드와 확장 키워드를 기초로 상기 제1 검사문서와 연계된 제2 검사문서에 대한 구문분석을 수행하여, 상기 제2 검사문서 내 상기 특정정보를 포함하는 후보 구문을 추출하는 것을 특징으로 하는, 검사문서 내 특정정보의 블라인드 처리 방법.
In the blind processing method of specific information in the examination document of the applicant who applied for a specific screening, performed by a computer,
Determining an inspection target item requiring blind processing in the inspection document;
Extracting specific information corresponding to the item to be inspected by performing syntax analysis from the inspection document;
Acquiring one or more keywords extractable according to the type of the item to be inspected from the inspection document; And
Including the step of selecting and applying one of a masking process or a highlighting process for the specific information based on a predetermined blind rule,
If there are multiple inspection documents for the same applicant, additionally obtainable extended keywords that can be inferred based on the keywords extracted from the first inspection document for the same applicant,
By performing a syntax analysis on the second inspection document linked to the first inspection document based on the acquired keyword and the extended keyword, the candidate syntax including the specific information in the second inspection document is extracted. How to blind the specific information in the inspection document
제2항에 있어서,
사용자 인터페이스를 통해서 상기 결정된 검사대상 항목을 특정 지원자에게만 적용할지 또는 지원자 전체에게 적용할지, 그리고 지원자가 제출한 검사문서 전체에 대하여 적용할지 또는 일부 검사문서에 대하여 적용할지 여부에 대한 입력을 요청하는 것을 특징으로 하는, 검사문서 내 특정정보의 블라인드 처리 방법.
The method of claim 2,
Through the user interface, a request for input on whether to apply the above-determined inspection target item to only a specific applicant or to all applicants, and whether to apply to the entire inspection document submitted by the applicant or to some inspection documents Characterized in, the blind processing method of specific information in the inspection document.
제2항에 있어서,
상기 키워드 추출 단계 다음에,
상기 추출된 키워드를 기반으로 상기 검사문서 내 문장의 문맥 파악을 통해 상기 특정정보를 포함하는 후보 구문을 추출하는 단계를 더 포함하는, 검사문서 내 특정정보의 블라인드 처리 방법.
The method of claim 2,
After the keyword extraction step,
Further comprising the step of extracting a candidate phrase including the specific information through the context of the sentence in the inspection document based on the extracted keywords, blind processing method of the specific information in the inspection document.
제2항에 있어서,
상기 키워드 추출 단계는,
상기 전형주체와 전형절차에 따라서 정해진 블라인드 규정을 기초로 하여 키워드 목록을 제공하고, 사용자로부터 상기 키워드 목록을 적용할 적용 범위를 입력받는 단계를 더 포함하는, 검사문서 내 특정정보의 블라인드 처리 방법.
The method of claim 2,
The keyword extraction step,
Providing a keyword list based on a blind rule determined according to the screening subject and the screening procedure, and receiving an application range to which the keyword list is to be applied from a user.
제2항에 있어서,
상기 적용 단계 다음에,
상기 처리가 적용되어 화면으로 제공된 검사문서 내에서 사용자로부터 특정 구문을 선택받아 블라인드 규칙 또는 하이라이트 규칙 설정을 입력받은 경우, 상기 특정 구문에 대한 규칙을 추가하고, 상기 검사문서에 대한 재검사를 수행하는 단계를 더 포함하는, 검사문서 내 특정정보의 블라인드 처리 방법.
The method of claim 2,
After the above applying step,
In the case where the processing is applied and a specific phrase is selected from the user in the inspection document provided on the screen and the blind rule or the highlight rule setting is input, adding a rule for the specific syntax and performing a re-test on the inspection document The blind processing method of the specific information in the inspection document further comprising a.
제2항에 있어서,
상기 블라인드 규정은,
상기 검사문서에 포함된 내용 중에서, 0점 처리되어야 하는 정보, 평가에 반영되지 않아야 하는 정보, 및 가점이나 우선순위가 부여되어야 하는 정보 중 적어도 하나를 포함하는 것을 특징으로 하는, 검사문서 내 특정정보의 블라인드 처리 방법.
The method of claim 2,
The above blind regulations are:
Among the contents included in the inspection document, specific information in the inspection document, characterized in that it includes at least one of information that should be processed with zero points, information that should not be reflected in the evaluation, and information that should be given an additional point or priority Blind treatment method.
삭제delete 특정 전형에 지원한 지원자의 검사문서 내 특정정보의 블라인드 처리 장치에 있어서,
하나 이상의 인스트럭션을 저장하는 메모리; 및
상기 메모리에 저장된 상기 하나 이상의 인스트럭션을 실행하는 프로세서를 포함하며,
상기 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써,
검사문서 내 블라인드 처리가 필요한 검사대상 항목을 결정하는 단계;
상기 검사문서로부터 구문분석을 수행하여 상기 검사대상 항목에 대응하는 특정정보를 추출하는 단계;
상기 검사문서로부터 상기 검사대상 항목의 종류에 따라서 추출 가능한 하나 이상의 키워드를 획득하는 단계; 및
미리 정해진 블라인드 규정을 기초로 하여 상기 특정정보에 대해 마스킹 처리 또는 하이라이팅 처리 중 하나를 선택하여 적용하는 단계를 포함하고,
동일한 지원자에 대한 검사문서가 복수 개일 경우, 동일한 지원자에 대한 제1 검사문서로부터 추출된 키워드를 기초로 유추 가능한 확장 키워드를 추가로 획득하고,
상기 획득된 키워드와 확장 키워드를 기초로 상기 제1 검사문서와 연계된 제2 검사문서에 대한 구문분석을 수행하여, 상기 제2 검사문서 내 상기 특정정보를 포함하는 후보 구문을 추출하는 것을 특징으로 하는, 장치.
In the blind processing device of specific information in the examination document of the applicant who applied for the specific screening,
A memory for storing one or more instructions; And
And a processor that executes the one or more instructions stored in the memory,
The processor executes the one or more instructions,
Determining an inspection target item requiring blind processing in the inspection document;
Extracting specific information corresponding to the item to be inspected by performing syntax analysis from the inspection document;
Acquiring one or more keywords extractable according to the type of the item to be inspected from the inspection document; And
Including the step of selecting and applying one of a masking process or a highlighting process for the specific information based on a predetermined blind rule,
If there are multiple inspection documents for the same applicant, additionally obtainable extended keywords that can be inferred based on the keywords extracted from the first inspection document for the same applicant,
By performing a syntax analysis on the second inspection document linked to the first inspection document based on the acquired keyword and the extended keyword, the candidate syntax including the specific information in the second inspection document is extracted. That, the device.
하드웨어인 컴퓨터와 결합되어, 제2항의 방법을 수행할 수 있도록 컴퓨터에서 독출가능한 기록매체에 저장된 컴퓨터프로그램.A computer program combined with a computer as hardware and stored in a recording medium readable by a computer to perform the method of claim 2. 삭제delete 삭제delete
KR1020190058836A 2019-05-20 2019-05-20 Method and apparatus for blind processing of specific information in document KR102196547B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190058836A KR102196547B1 (en) 2019-05-20 2019-05-20 Method and apparatus for blind processing of specific information in document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190058836A KR102196547B1 (en) 2019-05-20 2019-05-20 Method and apparatus for blind processing of specific information in document

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020190013317A Division KR101982207B1 (en) 2019-02-01 2019-02-01 Method and apparatus for blind processing of specific information in document

Publications (2)

Publication Number Publication Date
KR20200096043A KR20200096043A (en) 2020-08-11
KR102196547B1 true KR102196547B1 (en) 2020-12-29

Family

ID=72048220

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190058836A KR102196547B1 (en) 2019-05-20 2019-05-20 Method and apparatus for blind processing of specific information in document

Country Status (1)

Country Link
KR (1) KR102196547B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11232230B1 (en) * 2021-04-19 2022-01-25 Tekion Corp Data security for a document management system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101282705B1 (en) 2012-07-30 2013-08-23 주식회사 한글과컴퓨터 Apparatus and method for preventing disclosure of personal information contained in electronic document
JP2014131217A (en) 2012-12-28 2014-07-10 Canon Marketing Japan Inc Photographing device, photographing system, control method, and program for deterring leakage of personal information
KR101756288B1 (en) * 2017-02-07 2017-07-10 윤상훈 Document security system
WO2018175212A1 (en) 2017-03-23 2018-09-27 Microsoft Technology Licensing, Llc Obfuscation of user content in structured user data files

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100546743B1 (en) * 2003-10-02 2006-01-26 한국전자통신연구원 Method for automatically creating a question and indexing the question-answer by language-analysis and the question-answering method and system
KR101590828B1 (en) * 2009-07-25 2016-02-02 공주대학교 산학협력단 Selective Masking of Electronics Document and Confirmation Notice Service Method and System

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101282705B1 (en) 2012-07-30 2013-08-23 주식회사 한글과컴퓨터 Apparatus and method for preventing disclosure of personal information contained in electronic document
JP2014131217A (en) 2012-12-28 2014-07-10 Canon Marketing Japan Inc Photographing device, photographing system, control method, and program for deterring leakage of personal information
KR101756288B1 (en) * 2017-02-07 2017-07-10 윤상훈 Document security system
WO2018175212A1 (en) 2017-03-23 2018-09-27 Microsoft Technology Licensing, Llc Obfuscation of user content in structured user data files

Also Published As

Publication number Publication date
KR20200096043A (en) 2020-08-11

Similar Documents

Publication Publication Date Title
Mandera et al. Subtlex-pl: subtitle-based word frequency estimates for Polish
US9852337B1 (en) Method and system for assessing similarity of documents
US11573954B1 (en) Systems and methods for processing natural language queries for healthcare data
US9483460B2 (en) Automated formation of specialized dictionaries
US9766868B2 (en) Dynamic source code generation
US9619209B1 (en) Dynamic source code generation
US10755094B2 (en) Information processing apparatus, system and program for evaluating contract
US9697819B2 (en) Method for building a speech feature library, and method, apparatus, device, and computer readable storage media for speech synthesis
US11762926B2 (en) Recommending web API's and associated endpoints
US20170177180A1 (en) Dynamic Highlighting of Text in Electronic Documents
US9703773B2 (en) Pattern identification and correction of document misinterpretations in a natural language processing system
US20220309332A1 (en) Automated contextual processing of unstructured data
CN104008123B (en) The method and system matched for Chinese Name
US9542474B2 (en) Forensic system, forensic method, and forensic program
US9223889B2 (en) Age appropriate filtering
US9690797B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
KR102196547B1 (en) Method and apparatus for blind processing of specific information in document
CN114003725A (en) Information annotation model construction method and information annotation generation method
KR102280490B1 (en) Training data construction method for automatically generating training data for artificial intelligence model for counseling intention classification
US10706109B2 (en) Persona based content modification
US11681732B2 (en) Tuning query generation patterns
CN112508432A (en) Advertisement potential risk detection method and device, electronic equipment, medium and product
US20200302076A1 (en) Document processing apparatus and non-transitory computer readable medium
Gañan Plagiarism detection
US11501072B1 (en) System, method, and computer program product for automated factual citation detection

Legal Events

Date Code Title Description
AMND Amendment
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant