KR20210115670A - Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof - Google Patents

Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof Download PDF

Info

Publication number
KR20210115670A
KR20210115670A KR1020200031773A KR20200031773A KR20210115670A KR 20210115670 A KR20210115670 A KR 20210115670A KR 1020200031773 A KR1020200031773 A KR 1020200031773A KR 20200031773 A KR20200031773 A KR 20200031773A KR 20210115670 A KR20210115670 A KR 20210115670A
Authority
KR
South Korea
Prior art keywords
keyword
important
keywords
document
entity
Prior art date
Application number
KR1020200031773A
Other languages
Korean (ko)
Other versions
KR102375507B1 (en
Inventor
홍승현
전창현
안치연
서종성
최혜영
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Priority to KR1020200031773A priority Critical patent/KR102375507B1/en
Publication of KR20210115670A publication Critical patent/KR20210115670A/en
Application granted granted Critical
Publication of KR102375507B1 publication Critical patent/KR102375507B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • G06K9/6201

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Disclosed are an electronic device for supporting object search from a document through matching an object inserted into a document and related keywords, and an operating method thereof. According to the electronic device and the operating method thereof in the present invention, after extracting a plurality of words included within a predetermined distance from the midpoint of the object inserted into the document, by selecting important keywords related to the object in consideration of the letter style applied to the plurality of words, and recording the object and the selected important keywords in the object keyword table so that the object and the keywords correspond to each other, a user can be supported to search for an object he or she wants based on the important keywords.

Description

문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법{ELECTRONIC DEVICE THAT SUPPORTS RETRIEVAL OF OBJECTS FROM DOCUMENT BY MATCHING OBJECTS AND KEYWORDS INSERTED INTO DOCUMENT AND OPERATING METHOD THEREOF}ELECTRONIC DEVICE THAT SUPPORTS RETRIEVAL OF OBJECTS FROM DOCUMENT BY MATCHING OBJECTS AND KEYWORDS INSERTED INTO DOCUMENT AND OPERATING METHOD THEREOF

본 발명은 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법에 대한 것이다.The present invention relates to an electronic device that supports searching for an object from a document through matching keywords and an object inserted into a document, and an operating method thereof.

최근, 컴퓨터나 스마트폰 또는 태블릿 PC 등이 널리 보급됨에 따라, 이러한 전자 장치를 이용하여 전자 문서를 열람, 작성, 편집할 수 있도록 하는 다양한 종류의 전자 문서 관련 프로그램들이 출시되고 있다. Recently, as computers, smart phones, or tablet PCs are widely used, various types of electronic document-related programs have been released that allow users to read, write, and edit electronic documents using such electronic devices.

이러한 전자 문서 관련 프로그램들로는 기본적인 문서의 작성, 편집 등을 지원하는 워드프로세서, 데이터의 입력, 산술연산, 데이터 관리를 보조하는 스프레드시트, 발표자의 발표를 보조하기 위한 프레젠테이션 프로그램들이 있다. These electronic document-related programs include a word processor supporting basic document creation and editing, a spreadsheet supporting data input, arithmetic operations, and data management, and presentation programs supporting a presenter's presentation.

관련하여, 사용자는 전자 문서 관련 프로그램 상에서 다수의 페이지로 구성된 문서를 편집하는 중, 화면 상에 표시되고 있는 문서의 부분 외에 다른 부분을 참조하려는 경우, 참조하려는 부분과 관련된 키워드를 검색함에 따라 해당 키워드가 삽입되어 있는 문서의 페이지로 화면이 이동하도록 지원하는 '텍스트 검색 기능'을 활용할 수 있다.In relation to this, if the user intends to refer to a part other than the part of the document displayed on the screen while editing a document composed of a plurality of pages on the electronic document-related program, as the user searches for a keyword related to the part to be referenced, the corresponding keyword You can use the 'text search function' that supports moving the screen to the page of the document in which the is inserted.

다만, 전자 문서에는 텍스트 외에도 이미지, 표, 차트 등과 같은 개체들이 삽입될 수 있는데, 기존의 전자 문서 관련 프로그램들은 텍스트 검색 기능만을 지원할 뿐, 개체 검색 기능은 지원하지 않아 사용자가 문서에 삽입된 다수의 개체들 중 어느 하나의 개체를 참조하려는 경우, 문서 전체에 삽입된 개체들을 하나씩 확인하여 찾아낼 수 밖에 없다는 불편함이 존재하였다.However, in addition to text, objects such as images, tables, and charts can be inserted into electronic documents. Existing electronic document-related programs only support text search functions, but do not support object search functions. If you want to refer to any one of the objects, there is an inconvenience in that you have to check and find the objects inserted in the entire document one by one.

만약, 문서에 개체가 삽입되는 경우, 해당 개체와 관련된 중요 키워드들을 선정해 둔 후 상기 선정된 중요 키워드들을 기초로 사용자가 해당 개체를 검색할 수 있도록 하는 개체 검색 기능을 지원한다면, 사용자가 문서에서 자신이 원하는 개체를 키워드를 기반으로 쉽게 검색할 수 있을 것이다. When an object is inserted into a document, if important keywords related to the object are selected and the object search function is supported so that the user can search for the object based on the selected important keywords, the user can search for the object in the document. You will be able to easily search for the object you want based on keywords.

따라서, 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 기술에 대한 연구가 필요하다.Therefore, there is a need for research on a technology for supporting object search from a document through matching keywords with an object inserted into the document.

본 발명에 따른 전자 장치 및 그 동작 방법은 문서에 삽입된 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출한 후, 상기 복수의 단어들에 적용되어 있는 글자 서식을 고려하여 상기 개체에 관련된 중요 키워드들을 선정하고, 상기 개체와 상기 선정된 중요 키워드들이 서로 대응되도록 개체 키워드 테이블에 기록함으로써, 사용자가 중요 키워드를 기초로 자신이 원하는 개체를 검색할 수 있도록 지원하고자 한다.An electronic device and an operating method thereof according to the present invention extract a plurality of words included within a predetermined distance from a midpoint of an object inserted in a document, and then take the letter format applied to the plurality of words into account By selecting important keywords related to the entity, and recording the entity and the selected important keywords to correspond to each other in the entity keyword table, it is intended to support the user to search for an entity desired by the user based on the important keyword.

본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치는 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 개체 키워드 테이블 유지부, 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 점수 테이블 유지부, 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 고유 식별자 생성부, 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단어 추출부, 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 서식 속성 확인부, 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 중요도 점수 지정부, 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 중요 키워드 선정부, 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 중요 키워드 기록부 및 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 개체 검색부를 포함한다.According to an embodiment of the present invention, an electronic device supporting an object search from a document through matching keywords with an object inserted into a document includes a unique identifier for each of a plurality of objects inserted into a document and the plurality of objects an entity keyword table maintaining unit for storing and maintaining an entity keyword table in which important keywords related to each of the keywords are recorded in correspondence with each other; A score table maintaining unit that stores and maintains a score table in which pre-designated importance assignment scores are recorded for each format attribute value that can be designated in each of the format categories. When a first object is newly inserted into the document by a user, the A unique identifier generating unit for generating a unique identifier for an entity, a word extracting unit for extracting a plurality of words included within a predetermined distance from a midpoint of the first entity from the text inserted in the document; A format attribute check unit for confirming a value of a format attribute of each of the plurality of letter format categories applied to each of a plurality of words, for each of the plurality of words, the plurality of words applied to each word with reference to the score table an importance score designation unit for calculating the total sum of importance assignment scores for each format attribute value of each of the letter format categories, and designating the total sum calculated for each of the plurality of words as the importance score of each word, the plurality of words An important keyword selector that selects a predetermined number of words in the order of the highest importance score among them, and selects the selected words as first important keywords that are important keywords related to the first entity, the first important keywords are selected , an important keyword recorder that records the unique identifier for the first entity and the first important keywords in correspondence with each other in the entity keyword table, and at least one search keyword is input from the user, based When an entity search command is received, a unique identifier for a second entity including a keyword matching the at least one search keyword is retrieved from the entity keyword table, among important keywords, and then the second entity is and an object search unit that moves the screen to a point where the second object is inserted in the document so as to be displayed on the screen as a search result.

또한, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 단계, 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 단계, 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 단계, 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단계, 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 단계, 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 단계, 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 단계, 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 단계 및 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 단계를 포함한다.In addition, according to an embodiment of the present invention, there is provided a method of operating an electronic device that supports searching for an object from a document through matching keywords with an object inserted into a document, a unique identifier for each of a plurality of objects inserted into a document. and storing and maintaining an entity keyword table in which important keywords related to each of the plurality of entities are recorded in correspondence with each other; Storing and maintaining a score table in which pre-designated importance assignment scores are recorded for each format attribute value that can be designated in each of the letter format categories; when a first object is newly inserted into the document by a user, the first object generating a unique identifier for, extracting, from the text inserted in the document, a plurality of words included within a predetermined distance from the midpoint of the first object, the plurality of words applied to each of the plurality of words checking the format attribute value of each of the plurality of letter format categories; for each of the plurality of words, an importance allocation score for each format attribute value of the plurality of letter format categories applied to each word with reference to the score table calculating the total sum of , and designating the total sum calculated for each of the plurality of words as the importance score of each word, selecting a predetermined number of words from among the plurality of words in the order of the highest importance score, and , selecting the selected words as first important keywords that are important keywords related to the first entity; Recording important keywords in correspondence with each other, and when at least one search keyword is input from the user and an object search command based on the at least one search keyword is received, matching the at least one search keyword from the object keyword table Keywords that are important After searching for the unique identifier for the second object that is maximally included in the words, the screen is moved to the point where the second object is inserted in the document so that the second object is displayed on the screen as a search result. including the step of making

본 발명에 따른 전자 장치 및 그 동작 방법은 문서에 삽입된 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출한 후, 상기 복수의 단어들에 적용되어 있는 글자 서식을 고려하여 상기 개체에 관련된 중요 키워드들을 선정하고, 상기 개체와 상기 선정된 중요 키워드들이 서로 대응되도록 개체 키워드 테이블에 기록함으로써, 사용자가 중요 키워드를 기초로 자신이 원하는 개체를 검색할 수 있도록 지원할 수 있다.An electronic device and an operating method thereof according to the present invention extract a plurality of words included within a predetermined distance from a midpoint of an object inserted in a document, and then take the letter format applied to the plurality of words into account By selecting important keywords related to the entity and recording the entity and the selected important keywords to correspond to each other in the entity keyword table, it is possible to support a user to search for a desired entity based on the important keyword.

도 1은 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 구조를 도시한 도면이다.
도 2와 도 3은 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치를 설명하기 위한 도면이다.
도 4는 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법을 도시한 순서도이다.
1 is a diagram illustrating a structure of an electronic device supporting an object search from a document through matching keywords with an object inserted into a document according to an embodiment of the present invention.
2 and 3 are diagrams for explaining an electronic device supporting an object search from a document through matching keywords with an object inserted into a document according to an embodiment of the present invention.
4 is a flowchart illustrating an operation method of an electronic device supporting an object search from a document through matching keywords with an object inserted into a document according to an embodiment of the present invention.

이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. These descriptions are not intended to limit the present invention to specific embodiments, and should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. While describing each drawing, like reference numerals are used for similar components, and unless otherwise defined, all terms used in this specification, including technical or scientific terms, refer to those of ordinary skill in the art to which the present invention belongs. It has the same meaning as is commonly understood by those who have it.

본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다. In this document, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated. In addition, in various embodiments of the present invention, each of the components, functional blocks or means may be composed of one or more sub-components, and the electrical, electronic, and mechanical functions performed by each component are electronic. A circuit, an integrated circuit, an ASIC (Application Specific Integrated Circuit), etc. may be implemented with various well-known devices or mechanical elements, and may be implemented separately or two or more may be integrated into one.

한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.On the other hand, the blocks in the accompanying block diagram or steps in the flowchart are computer program instructions that are loaded in a processor or memory of equipment capable of data processing, such as a general-purpose computer, a special-purpose computer, a portable notebook computer, and a network computer, and perform specified functions. can be interpreted as meaning Since these computer program instructions may be stored in a memory provided in a computer device or in a memory readable by a computer, the functions described in the blocks of the block diagrams or the steps of the flowcharts are produced as articles of manufacture containing instruction means for performing the same. could be In addition, each block or each step may represent a module, segment, or portion of code comprising one or more executable instructions for executing the specified logical function(s). It should also be noted that, in some alternative embodiments, it is also possible for the functions recited in blocks or steps to be executed out of the prescribed order. For example, two blocks or steps shown one after another may be performed substantially simultaneously or in the reverse order, and in some cases, some blocks or steps may be omitted.

도 1은 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 구조를 도시한 도면이다. 1 is a diagram illustrating a structure of an electronic device supporting an object search from a document through matching keywords with an object inserted into a document according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치(110)는 개체 키워드 테이블 유지부(111), 점수 테이블 유지부(112), 고유 식별자 생성부(113), 단어 추출부(114), 서식 속성 확인부(115), 중요도 점수 지정부(116), 중요 키워드 선정부(117), 중요 키워드 기록부(118) 및 개체 검색부(119)를 포함한다.Referring to FIG. 1 , an electronic device 110 supporting an entity search from a document through matching keywords with an entity inserted into a document according to an embodiment of the present invention includes an entity keyword table maintaining unit 111, a score Table holding unit 112, unique identifier generating unit 113, word extracting unit 114, format attribute checking unit 115, importance score designation unit 116, important keyword selection unit 117, important keyword recording unit ( 118) and an entity search unit 119.

개체 키워드 테이블 유지부(111)는 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지한다.The entity keyword table maintaining unit 111 stores and maintains an entity keyword table in which unique identifiers for each of the plurality of entities inserted in the document and important keywords related to each of the plurality of entities are recorded in correspondence with each other.

예컨대, 상기 개체 키워드 테이블에는 하기의 표 1과 같이 정보가 기록되어 있을 수 있다.For example, information may be recorded in the entity keyword table as shown in Table 1 below.

개체에 대한 고유 식별자unique identifier for an object 개체에 관련된 중요 키워드들Important keywords related to objects 개체 1에 대한 고유 식별자 1Unique identifier 1 for object 1 2017년2017 한글과컴퓨터Hangul and computer 매출현황Sales Status 개체 2에 대한 고유 식별자 2Unique Identifier 2 for Entity 2 2016년2016 서울시Seoul City 흡연율smoking rate

점수 테이블 유지부(112)는 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지한다.The score table maintaining unit 112 records a plurality of different types of character format categories that are pre-designated as applicable to a character and a pre-specified importance assignment score for each format attribute value that can be designated in each of the plurality of character format categories. Save and maintain the score table.

여기서, 복수의 글자 서식 카테고리들이란 문서에 포함된 글자에 적용할 수 있는 글꼴, 색상, 크기 등과 같은 소정의 서식 카테고리들을 의미하며, 서식 속성 값이란 각 글자 서식 카테고리에 대해 설정할 수 있는 속성 값으로, '글꼴'이라는 글자 서식 카테고리에 대해서는 '명조체', '고딕체' 등이 서식 속성 값이 될 수 있고, '색상'이라는 글자 서식 카테고리에 대해서는 '검은색', '빨간색' 등이 서식 속성 값이 될 수 있다.Here, the plurality of character format categories means predetermined format categories such as font, color, and size that can be applied to characters included in a document, and the format attribute value is an attribute value that can be set for each character format category. , 'Font', 'Myeongjo', 'Gothic', etc. can be the format attribute values. For the character format category called 'Color', 'Black' and 'Red' are the format attribute values. can be

이때, 상기 점수 테이블에는 하기의 표 2와 같이 정보가 기록되어 있을 수 있다.In this case, information may be recorded in the score table as shown in Table 2 below.

복수의 글자 서식 카테고리들Multiple letter formatting categories 서식 속성 값Format property value 중요도 할당 점수Severity Assignment Score 글꼴font 명조체Myeongjo style 1점1 point 고딕체gothic 2점2 points 궁서체cursive 10점10 points ...... .... 색상color 검은색Black color 1점1 point 빨간색Red 10점10 points 파란색blue 5점5 points ...... ...... 크기size 0pt~10pt0pt~10pt 1점1 point 11pt~13pt11pt~13pt 4점4 points 13pt~15pt13pt~15pt 8점8 points ...... ...... ...... ...... ......

고유 식별자 생성부(113)는 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성한다. When a first object is newly inserted into the document by a user, the unique identifier generator 113 generates a unique identifier for the first object.

단어 추출부(114)는 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출한다.The word extraction unit 114 extracts, from the text inserted into the document, a plurality of words included within a predetermined distance from the midpoint of the first object.

이때, 단어 추출부(114)는 상기 문서에 삽입되어 있는 텍스트에 대해 형태소 분석을 수행하여 상기 복수의 단어들을 추출할 수 있고, 상기 복수의 단어들 간에는 동일한 단어가 중복해서 존재할 수 있다. 만약, 상기 문서에 '문장 1', '문장 2'가 존재한다고 할 때, '문장 1'에서 '컴퓨터'라는 단어가 존재하고, '문장 2'에서도 '컴퓨터'라는 단어가 존재한다고 하면, 단어 추출부(114)는 '문장 1'과 '문장 2' 각각으로부터 '컴퓨터'라는 단어를 추출할 수 있다.In this case, the word extraction unit 114 may extract the plurality of words by performing morphological analysis on the text inserted into the document, and the same word may overlap among the plurality of words. If 'sentence 1' and 'sentence 2' exist in the document, if the word 'computer' exists in 'sentence 1' and the word 'computer' also exists in 'sentence 2', the word The extraction unit 114 may extract the word 'computer' from each of 'sentence 1' and 'sentence 2'.

예컨대, 도 2에 도시된 바와 같이 문서(211)가 존재한다고 가정하면, 단어 추출부(114)는 문서(211)에 삽입되어 있는 텍스트에서, 제1 개체(212)의 중점(213)으로부터 기설정된 거리(214) 이내를 나타내는 파란색 바탕의 원 내부에 포함되어 있는 '특허', '상표', '디자인'을 추출할 수 있을 것이다.For example, assuming that the document 211 exists as shown in FIG. 2 , the word extracting unit 114 extracts from the midpoint 213 of the first object 212 in the text inserted into the document 211 . It will be possible to extract 'patent', 'trademark', and 'design' contained within a circle on a blue background indicating within the set distance 214 .

서식 속성 확인부(115)는 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인한다.The format attribute checker 115 checks the format attribute value of each of the plurality of letter format categories applied to each of the plurality of words.

중요도 점수 지정부(116)는 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정한다.For each of the plurality of words, the importance score designation unit 116 calculates the total sum of importance allocation scores for each format attribute value of the plurality of letter format categories applied to each word with reference to the score table, The total sum calculated for each of the plurality of words is designated as the importance score of each word.

예컨대, 상기 복수의 단어들 중 '특허'라는 단어가 존재하고, '특허'라는 단어의 글꼴이 '명조체', 색상이 '빨간색', 크기가 '11pt'라고 하는 경우, 중요도 점수 지정부(116)는 '특허'라는 단어에 적용된 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 점수인 '1점', '10점', '4점'의 총 합계인 '15점'을 '특허'라는 단어에 대한 중요도 점수로 지정할 수 있다.For example, when the word 'patent' exists among the plurality of words, the font of the word 'patent' is 'Myeongjo font', the color is 'red', and the size is '11pt', the importance score designation unit 116 ) is the total sum of '1 points', '10 points', and '4 points', which is the importance score for each format attribute value of the letter format categories applied to the word 'patent', to the word 'patent'. It can be assigned as an importance score for

중요 키워드 선정부(117)는 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정한다.The important keyword selection unit 117 selects a predetermined number of words from among the plurality of words in the order of the highest importance score, and selects the selected words as first important keywords that are important keywords related to the first entity. .

예컨대, 상기 미리 지정된 개수가 '3개'라고 하는 경우, 중요 키워드 선정부(117)는 상기 복수의 단어들 중 중요도 점수가 높은 순서로 '3개'의 단어들을 선택하고, 상기 선택된 '3개'의 단어들을 상기 제1 개체에 관련된 중요 키워드들인 상기 제1 중요 키워드들로 선정할 수 있다.For example, if the predetermined number is '3', the important keyword selector 117 selects '3' words in the order of the highest importance score among the plurality of words, and selects the selected '3 words'. ' may be selected as the first important keywords that are important keywords related to the first entity.

이때, 본 발명의 일실시예에 따르면, 중요 키워드 선정부(117)는 상기 미리 지정된 개수만큼 단어들을 선택할 때, 중요도 점수가 동률인 단어가 존재하는 경우, 상기 미리 지정된 개수만큼 중요도 점수가 동률인 단어들을 상기 제1 중요 키워드들로 선정하고, 마지막 순번에서 동률인 단어가 존재하면, 랜덤하게 단어를 선택하는 방식으로 상기 미리 지정된 개수까지의 단어를 선택함으로써, 상기 제1 중요 키워드들의 선정을 완료할 수 있다.At this time, according to an embodiment of the present invention, when the important keyword selection unit 117 selects the predetermined number of words, if there are words having the same importance score, the priority score is the same by the predetermined number. The selection of the first important keywords is completed by selecting words as the first important keywords, and selecting up to the predetermined number of words in a manner of randomly selecting words when there is a word with a tie in the last order number. can do.

중요 키워드 기록부(118)는 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록한다.When the first important keywords are selected, the important keyword recording unit 118 records the unique identifier of the first entity and the first important keywords in correspondence with each other in the entity keyword table.

예컨대, 상기 제1 개체가 '개체 3'이고, 고유 식별자 생성부(113)에 의해 상기 제1 개체인 '개체 3'에 대해 '고유 식별자 3'이 생성되었으며, 중요 키워드 선정부(117)에 의해 '개체 3'에 관련된 제1 중요 키워드들로 '특허', '상표', '디자인'이 선정되었다고 가정하는 경우, 중요 키워드 기록부(118)는 상기 표 1과 같은 상기 개체 키워드 테이블에 하기의 표 3과 같이 '개체 3'에 대한 '고유 식별자 3'과 '개체 3'에 관련된 제1 중요 키워드들인 '특허', '상표', '디자인'을 서로 대응시켜 기록할 수 있다.For example, the first entity is 'object 3', and 'unique identifier 3' is generated for 'object 3', which is the first entity, by the unique identifier generating unit 113, and the important keyword selection unit 117 is If it is assumed that 'patent', 'trademark', and 'design' are selected as the first important keywords related to 'object 3' by As shown in Table 3, 'unique identifier 3' for 'object 3' and the first important keywords 'patent', 'trademark', and 'design' related to 'object 3' can be recorded in correspondence with each other.

개체에 대한 고유 식별자unique identifier for an object 중요 키워드들important keywords 개체 1에 대한 고유 식별자 1Unique identifier 1 for object 1 2017년2017 한글과컴퓨터Hangul and computer 매출현황Sales Status 개체 2에 대한 고유 식별자 2Unique Identifier 2 for Entity 2 2016년2016 서울시Seoul City 흡연율smoking rate 개체 3에 대한 고유 식별자 3Unique identifier 3 for object 3 특허Patent 상표brand 디자인design

개체 검색부(119)는 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시킨다.When at least one search keyword is input from the user and an object search command based on the at least one search keyword is received, the object search unit 119 searches for a keyword matching the at least one search keyword from the object keyword table. After searching for the unique identifier for the second object that contains the maximum within the important keywords, the screen is moved to the point where the second object is inserted in the document so that the second object is displayed on the screen as a search result. move it

즉, 상기 개체 키워드 테이블에 각 개체에 대한 고유 식별자에 대응되도록 중요 키워드들의 매칭이 완료된 이후, 상기 사용자로부터 소정의 적어도 하나의 중요 키워드를 검색 키워드로 하는 개체 검색 명령이 수신되면, 개체 검색부(119)는 검색 키워드로 입력된 적어도 하나의 중요 키워드가 상기 개체 키워드 테이블 상에서 최대로 매칭되어 있는 상기 제2 개체에 대한 고유 식별자를 검색하고, 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시킴으로써, 상기 사용자에게 빠른 개체 검색 결과를 제공하도록 지원할 수 있다.That is, after matching of important keywords to correspond to the unique identifier of each entity in the entity keyword table is completed, when an entity search command is received from the user using at least one important keyword as a search keyword, the entity search unit ( 119) searches for a unique identifier for the second object in which at least one important keyword input as a search keyword is maximally matched on the object keyword table, and displays the screen as a point where the second object is inserted in the document By moving the , it can be supported to provide a quick object search result to the user.

이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 특징 벡터 생성부(120), 코사인 유사도 연산부(121), 연관 키워드 선정부(122) 및 연관 키워드 기록부(124)를 더 포함할 수 있다.In this case, according to an embodiment of the present invention, the electronic device 110 may further include a feature vector generating unit 120 , a cosine similarity calculating unit 121 , a related keyword selecting unit 122 , and a related keyword recording unit 124 . can

특징 벡터 생성부(120)는 상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성한다.When the recording of the first important keywords in the entity keyword table is completed, the feature vector generating unit 120 is configured to, for each of the first important keywords, form attributes of each of the plurality of letter style categories applied to each important keyword. A feature vector having the importance assignment score for each value as a component is generated.

예컨대, '특허'라는 단어가 상기 제1 중요 키워드들 중 어느 하나로 선정되었고, '특허'라는 단어의 글꼴이 '명조체'인 관계로 중요도 할당 점수가 '1점', 색상이 '빨간색'인 관계로 중요도 할당 점수가 '10점', 크기가 '11pt'인 관계로 중요도 할당 점수가 '4점'이라고 하는 경우, 특징 벡터 생성부(120)는 '특허'라는 단어에 대해 중요도 할당 점수를 성분으로 갖는 '[1 10 4]'라고 하는 3차원의 특징 벡터를 생성할 수 있다.For example, since the word 'patent' is selected as one of the first important keywords, and the font of the word 'patent' is 'Myeongjo font', the importance assignment score is '1 point' and the color is 'red'. When the importance assignment score is '4 points' because the importance assignment score is '10 points' and the size is '11 pt', the feature vector generator 120 divides the importance assignment score for the word 'patent' as a component. It is possible to create a three-dimensional feature vector called '[1 10 4]' with

코사인 유사도 연산부(121)는 상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산한다.The cosine similarity calculating unit 121 calculates the cosine similarity between the feature vector of each important keyword and the feature vectors of other important keywords for each of the first important keywords based on the feature vector generated for each of the first important keywords. Calculate.

예컨대, 상기 제1 중요 키워드들이 '특허', '상표', '디자인'이라는 단어라고 하는 경우, 코사인 유사도 연산부(121)는 '특허'라는 단어에 대해 '상표'라는 단어와 '디자인'이라는 단어 각각과의 특징 벡터 간의 코사인 유사도를 연산하고, '상표'라는 단어에 대해 '특허'라는 단어와 '디자인'이라는 단어 각각과의 특징 벡터 간의 코사인 유사도를 연산하며, '디자인'이라는 단어에 대해 '특허'라는 단어와 '상표'라는 단어 각각과의 특징 벡터 간의 코사인 유사도를 연산할 수 있다.For example, when the first important keywords are the words 'patent', 'trademark', and 'design', the cosine similarity calculating unit 121 responds to the word 'patent' with the word 'trademark' and the word 'design'. Calculate the cosine similarity between the feature vectors with each, calculate the cosine similarity between the feature vectors with each of the word 'patent' and the word 'design' for the word 'trademark', and calculate the cosine similarity between the word 'design' and ' A cosine similarity between the word 'patent' and the word 'trademark' may be calculated.

이때, 본 발명의 일실시예에 따르면, 코사인 유사도 연산부(121)는 하기의 수학식 1에 기초하여 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산할 수 있다.In this case, according to an embodiment of the present invention, the cosine similarity calculator 121 may calculate the cosine similarity between the feature vector of each important keyword and the feature vectors of other important keywords based on Equation 1 below.

Figure pat00001
Figure pat00001

여기서, S는 특징 벡터 A와 B 사이의 코사인 유사도로 -1에서 1사이의 값을 가지며, 그 값이 클수록 두 특징 벡터는 유사한 벡터임을 의미하고, Ai는 특징 벡터 A의 i번째 성분, Bi는 특징 벡터 B의 i번째 성분을 의미한다.Here, S is the cosine similarity between the feature vectors A and B, and has a value between -1 and 1, and a larger value means that the two feature vectors are similar vectors, and A i is the i-th component of the feature vector A, B i denotes the i-th component of the feature vector B.

연관 키워드 선정부(122)는 상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정한다.The related keyword selecting unit 122 selects, as the related keyword, another important keyword for which the cosine similarity is calculated to the maximum for each of the first important keywords.

예컨대, 상기 제1 중요 키워드들이 '특허', '상표', '디자인'이라는 단어라고 하고, '특허'에 대해 '상표', '디자인'이라는 단어 각각의 특징 벡터와의 코사인 유사도를 연산한 결과, '상표'라는 단어와의 코사인 유사도가 최대로 연산되었다고 하는 경우, 연관 키워드 선정부(122)는 '특허'라는 중요 키워드에 대해 '상표'라는 중요 키워드를 연관 키워드로 선정할 수 있다.For example, the first important keywords are the words 'patent', 'trademark', and 'design', and the cosine similarity of the words 'trademark' and 'design' with respect to 'patent' is calculated. , , when it is assumed that the cosine similarity with the word 'trademark' is calculated at the maximum, the related keyword selector 122 may select the important keyword 'trademark' as the related keyword with respect to the important keyword 'patent'.

즉, 연관 키워드 선정부(122)는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 복수의 글자 서식 카테고리들 각각의 서식 속성 값에 따른 중요도 할당 점수가 유사한 패턴을 갖는 다른 중요 키워드를 연관 키워드로 선정할 수 있다.That is, the related keyword selecting unit 122 selects, for each of the first important keywords, another important keyword having a similar pattern of importance assignment scores according to the format attribute values of the plurality of letter style categories applied to the respective important keywords. You can select related keywords.

연관 키워드 기록부(123)는 상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록한다.When the selection of the relevant keyword for each of the first important keywords is completed, the related keyword recording unit 123 records a related keyword for each of the first important keywords for each of the first important keywords recorded in the individual keyword table. Correspond to each other and record additionally.

예컨대, 앞선 예와 같이, 상기 제1 중요 키워드들이 '개체 3'에 대한 '고유 식별자 3'에 대응되는 중요 키워드들인 '특허', '상표', '디자인'이라는 단어이고, '특허'라는 중요 키워드에 대해 '상표'라는 중요 키워드가 연관 키워드로 선정되었으며, '상표'라는 중요 키워드에 대해 '특허'라는 중요 키워드가 연관 키워드로 선정되었고, '디자인'이라는 중요 키워드에 대해 '특허'라는 중요 키워드가 연관 키워드로 선정된 경우, 연관 키워드 기록부(123)는 하기의 표 4와 같이 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록할 수 있다.For example, as in the previous example, the first important keywords are the words 'patent', 'trademark', and 'design', which are important keywords corresponding to 'unique identifier 3' for 'entity 3', and the important word 'patent' For the keyword, the important keyword 'trademark' was selected as a related keyword, for the important keyword 'trademark', the important keyword 'patent' was selected as the related keyword, and for the important keyword 'design', the important keyword 'patent' was selected. When the keyword is selected as the related keyword, the related keyword recorder 123 may additionally record the related keywords for each important keyword as shown in Table 4 below.

개체에 대한 고유 식별자unique identifier for an object 중요 키워드들important keywords 연관 키워드Related keywords 개체 3에 대한 고유 식별자 3Unique identifier 3 for object 3 특허Patent 상표brand 상표brand 특허Patent 디자인design 특허Patent

이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 키워드 표시부(124)를 더 포함할 수 있다.In this case, according to an embodiment of the present invention, the electronic device 110 may further include a keyword display unit 124 .

키워드 표시부(124)는 상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시한다.After the screen is moved to the point where the second object is inserted, the keyword display unit 124 receives a command to select the second object from the user, the unique identifier for the second object in the object keyword table After extracting the second important keywords that are important keywords recorded in correspondence to and the relevant keywords for each of the second important keywords, a guide message indicating that the second important keywords are important keywords related to the second entity; Together, related keywords for each of the second important keywords are displayed on the screen.

예컨대, 전술한 예에 따라 도 3의 도면부호 310이, '개체 3'(311)이 삽입되어 있는 지점으로 이동된 화면을 나타낸다고 가정하면, 키워드 표시부(124)는 '개체 3'(311)이 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 '개체 3'(311)에 대한 선택 명령이 수신되는 경우, 상기 표 4와 같은 상기 개체 키워드 테이블로부터 '특허', '상표', '디자인'이라는 '개체 3'(311)에 관련된 중요 키워드들과 각 중요 키워드에 대한 연관 키워드를 추출한 후, '특허', '상표', '디자인'이라는 단어들이 '개체 3'(311)에 관련된 중요 키워드들임을 알리는 안내 메시지(312)와, '특허'에 대해서는 '상표'를, '상표'에 대해서는 '디자인'을, '디자인'에 대해서는 '특허'를 연관 키워드로 도면부호 313과 같이 화면 상에 표시할 수 있다.For example, assuming that reference numeral 310 of FIG. 3 indicates a screen moved to a point where 'object 3' 311 is inserted according to the above-described example, the keyword display unit 124 indicates that 'object 3' 311 is When a selection command for 'object 3' 311 is received from the user after the screen is moved to the inserted point, 'patent', 'trademark', and 'design' from the entity keyword table as shown in Table 4 After extracting important keywords related to 'object 3' (311) and related keywords for each important keyword, the words 'patent', 'trademark' and 'design' are A guide message 312 notifying that they are keywords, 'trademark' for 'patent', 'design' for 'trademark', and 'patent' for 'design' as related keywords are displayed on the screen as shown in reference numeral 313. can be displayed in

이렇게, 키워드 표시부(124)는 상기 사용자가 '개체 3'(311)에 관련된 중요 키워드들이 '특허', '상표', '디자인'이라는 것을 인식할 수 있도록 함과 동시에, '개체 3'(311)과 관련된 중요 키워드들 각각에 대한 연관 키워드를 한 눈에 파악할 수 있도록 지원할 수 있다. 즉, 키워드 표시부(124)는 도면부호 312, 313에 도시된 그림과 같이, '개체 3'(311)에 관련된 중요 키워드와 그에 대한 연관 키워드를 화면 상에 표시함으로써, 상기 사용자가 '개체 3'(311)에 대한 정보를 보다 쉽게 파악할 수 있도록 도와줄 수 있다.In this way, the keyword display unit 124 allows the user to recognize that important keywords related to 'object 3' 311 are 'patent', 'trademark', and 'design', and at the same time, 'object 3' (311). ) can be supported so that keywords related to each of the important keywords can be identified at a glance. That is, the keyword display unit 124 displays important keywords related to the 'object 3' 311 and related keywords on the screen as shown in the figures 312 and 313, so that the user can select the 'object 3'. (311) can help to more easily grasp the information.

또한, 본 발명의 일실시예에 따르면, 전자 장치(110)는 추가 기록부(125)를 더 포함할 수 있다.Also, according to an embodiment of the present invention, the electronic device 110 may further include an additional recording unit 125 .

추가 기록부(125)는 상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록한다.After the first important keywords are recorded in the entity keyword table, the additional recording unit 125 includes the first keyword as an important keyword related to the first entity in the entity keyword table as the first keyword is input from the user. When an important keyword addition recording command is received, the first keyword is additionally recorded as important keywords related to the first entity in addition to the first important keywords in the entity keyword table.

즉, 추가 기록부(125)는 상기 문서에 상기 제1 개체가 삽입되면, 상기 제1 개체에 관련된 중요 키워드들이 자동으로 선정되는 것 외에도, 상기 사용자가 상기 제1 개체에 관련된 중요 키워드를 직접 지정할 수 있도록 지원할 수 있다.That is, in the additional recording unit 125, when the first object is inserted into the document, in addition to automatically selecting important keywords related to the first object, the user can directly designate important keywords related to the first object. can support you to

도 4는 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법을 도시한 순서도이다.4 is a flowchart illustrating an operation method of an electronic device supporting an object search from a document through matching keywords with an object inserted into a document according to an embodiment of the present invention.

단계(S410)에서는 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지한다.In step S410, a unique identifier for each of the plurality of objects inserted in the document and important keywords related to each of the plurality of objects are stored and maintained in an object keyword table in which they are recorded in correspondence with each other.

단계(S420)에서는 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지한다.In step S420, a score table in which a plurality of different types of character format categories that are previously designated as applicable to a character and an importance assignment score preset for each format attribute value that can be designated in each of the plurality of character format categories are recorded. save and keep

단계(S430)에서는 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성한다.In step S430, when a first object is newly inserted into the document by the user, a unique identifier for the first object is generated.

단계(S440)에서는 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된 거리 이내에 포함되어 있는 복수의 단어들을 추출한다.In step S440, a plurality of words included within a predetermined distance from the midpoint of the first object are extracted from the text inserted into the document.

단계(S450)에서는 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인한다.In step S450, a value of a format attribute of each of the plurality of letter style categories applied to each of the plurality of words is checked.

단계(S460)에서는 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정한다.In step S460, for each of the plurality of words, the total sum of importance assignment scores for each format attribute value of the plurality of letter format categories applied to each word is calculated with reference to the score table, and the plurality of words The total sum calculated for each of them is designated as the importance score of each word.

단계(S470)에서는 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정한다.In step S470, a predetermined number of words are selected from among the plurality of words in an order of high importance score, and the selected words are selected as first important keywords that are important keywords related to the first entity.

단계(S480)에서는 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록한다.In step S480, when the first important keywords are selected, the unique identifier of the first entity and the first important keywords are recorded in correspondence with each other in the entity keyword table.

단계(S490)에서는 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시킨다.In step S490, when at least one search keyword is input from the user and an object search command based on the at least one search keyword is received, a keyword matching the at least one search keyword is selected from the object keyword table as an important keyword After searching for the unique identifier for the second object that is included at the maximum in the list, the screen is moved to the point where the second object is inserted in the document so that the second object is displayed on the screen as a result of the search. .

이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성하는 단계, 상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산하는 단계, 상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정하는 단계 및 상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록하는 단계를 더 포함할 수 있다.In this case, according to an embodiment of the present invention, in the method of operating the electronic device, when the recording of the first important keywords in the entity keyword table is completed, for each of the first important keywords, the first important keyword applied to each important keyword generating a feature vector having, as a component, an importance assignment score for each format attribute value of each of the plurality of character format categories; , calculating the cosine similarity between the feature vector of each important keyword and the feature vectors of other important keywords; When the selection of the relevant keywords for each of the first important keywords is completed, for each of the first important keywords recorded in the individual keyword table, the related keywords for each important keyword are additionally recorded in correspondence with each other It may include further steps.

또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시하는 단계를 더 포함할 수 있다.Also, according to an embodiment of the present invention, in the method of operating the electronic device, when a selection command for the second object is received from the user after the screen is moved to the point where the second object is inserted, the After extracting second important keywords, which are important keywords recorded in correspondence with the unique identifier of the second entity, and a keyword related to each of the second important keywords from the entity keyword table, the second important keywords are The method may further include displaying, on a screen, a keyword related to each of the second important keywords together with a guide message indicating that they are important keywords related to the two objects.

또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록하는 단계를 더 포함할 수 있다.Also, according to an embodiment of the present invention, in the method of operating the electronic device, after the first important keywords are recorded in the entity keyword table, the first keyword is inputted from the user and the first keyword is entered into the entity keyword table. When an important keyword addition recording command instructing to include a keyword as an important keyword related to the first entity is received, the first keyword is added to the important keyword related to the first entity in the entity keyword table in addition to the first important keywords. It may further include the step of additionally recording.

이상, 도 4를 참조하여 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 도 1 내지 도 3을 이용하여 설명한 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.A method of operating an electronic device supporting an object search from a document through matching keywords and an object inserted into a document according to an embodiment of the present invention has been described above with reference to FIG. 4 . Here, the operating method of an electronic device supporting object search from a document through matching keywords with an object inserted into a document according to an embodiment of the present invention is an object inserted into a document described with reference to FIGS. 1 to 3 . Since it may correspond to the configuration of the operation of the electronic device 110 supporting object search from a document through matching of keywords and related keywords, a detailed description thereof will be omitted.

본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.According to an embodiment of the present invention, a method of operating an electronic device that supports object search from a document through matching keywords with an object inserted into a document is a computer program stored in a storage medium for execution through combination with a computer. can be implemented.

또한, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. In addition, according to an embodiment of the present invention, an operating method of an electronic device that supports object search from a document through matching keywords with an object inserted into a document is in the form of a computer program command for execution through combination with a computer. It may be implemented and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and available to those skilled in the art of computer software. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic such as floppy disks. - includes magneto-optical media, and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described with specific matters such as specific components and limited embodiments and drawings, but these are provided to help a more general understanding of the present invention, and the present invention is not limited to the above embodiments. , various modifications and variations are possible from these descriptions by those of ordinary skill in the art to which the present invention pertains.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and not only the claims to be described later, but also all those with equivalent or equivalent modifications to the claims will be said to belong to the scope of the spirit of the present invention. .

110: 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치
111: 개체 키워드 테이블 유지부 112: 점수 테이블 유지부
113: 고유 식별자 생성부 114: 단어 추출부
115: 서식 속성 확인부 116: 중요도 점수 지정부
117: 중요 키워드 선정부 118: 중요 키워드 기록부
119: 개체 검색부 120: 특징 벡터 생성부
121: 코사인 유사도 연산부 122: 연관 키워드 선정부
123: 연관 키워드 기록부 124: 키워드 표시부
125: 추가 기록부
110: Electronic device that supports object search from a document through matching keywords with an object inserted into the document
111: entity keyword table maintaining unit 112: score table maintaining unit
113: unique identifier generation unit 114: word extraction unit
115: form attribute verification unit 116: importance score designation unit
117: important keyword selection unit 118: important keyword register
119: entity search unit 120: feature vector generation unit
121: cosine similarity calculating unit 122: related keyword selection unit
123: related keyword record unit 124: keyword display unit
125: additional log

Claims (10)

문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 개체 키워드 테이블 유지부;
글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 점수 테이블 유지부;
사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 고유 식별자 생성부;
상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단어 추출부;
상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 서식 속성 확인부;
상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 중요도 점수 지정부;
상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 중요 키워드 선정부;
상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 중요 키워드 기록부; 및
상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 개체 검색부
를 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치.
an entity keyword table maintaining unit for storing and maintaining an entity keyword table in which unique identifiers for each of the plurality of entities inserted in the document and important keywords related to each of the plurality of entities are recorded in correspondence with each other;
Storing and maintaining a score table in which a plurality of different types of character format categories of different types that are pre-designated as applicable to a character and a score assigned in advance for each format attribute value that can be designated in each of the plurality of character format categories are recorded score table maintenance unit;
a unique identifier generating unit that generates a unique identifier for the first object when a first object is newly inserted into the document by a user;
a word extraction unit for extracting a plurality of words included within a predetermined distance from a midpoint of the first object from the text inserted into the document;
a format attribute check unit for confirming a format attribute value of each of the plurality of letter format categories applied to each of the plurality of words;
For each of the plurality of words, with reference to the score table, a total sum of importance assignment scores for each format attribute value of each of the plurality of letter format categories applied to each word is calculated, and the calculation is performed for each of the plurality of words an importance score assigning unit for designating the total sum as the importance score of each word;
an important keyword selecting unit for selecting a predetermined number of words from among the plurality of words in an order of high importance score, and selecting the selected words as first important keywords which are important keywords related to the first entity;
an important keyword recording unit that, when the first important keywords are selected, records the unique identifier of the first entity and the first important keywords in correspondence with each other in the entity keyword table; and
When at least one search keyword is input from the user and an object search command based on the at least one search keyword is received, a keyword matching the at least one search keyword is maximally selected from the object keyword table within important keywords. After searching the unique identifier for the included second object, the object search unit moves the screen to the point where the second object is inserted in the document so that the second object is displayed on the screen as a search result.
An electronic device that supports searching for an object from a document through matching keywords and an object inserted into a document including
제1항에 있어서,
상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성하는 특징 벡터 생성부;
상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산하는 코사인 유사도 연산부;
상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정하는 연관 키워드 선정부; 및
상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록하는 연관 키워드 기록부
를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치.
According to claim 1,
When the recording of the first important keywords in the individual keyword table is completed, for each of the first important keywords, an importance allocation score for each format attribute value of each of the plurality of letter style categories applied to each important keyword as a component; a feature vector generator that generates a feature vector;
a cosine similarity calculating unit for calculating a cosine similarity between a feature vector of each important keyword and a feature vector of other important keywords for each of the first important keywords based on the feature vector generated for each of the first important keywords;
a related keyword selecting unit for selecting, as a related keyword, another important keyword having a maximum cosine similarity calculated for each of the first important keywords; and
When the selection of the relevant keywords for each of the first important keywords is completed, for each of the first important keywords recorded in the individual keyword table, the related keywords for each important keyword are additionally recorded in correspondence with each other Related keyword register
An electronic device supporting an object search from a document through matching keywords and an object inserted into the document further comprising:
제2항에 있어서,
상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시하는 키워드 표시부
를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치.
3. The method of claim 2,
After the screen is moved to the point where the second object is inserted, when a selection command for the second object is received from the user, it is recorded corresponding to the unique identifier of the second object in the object keyword table. After extracting the second important keywords, which are important keywords, and a keyword related to each of the second important keywords, the second important keyword together with a guide message indicating that the second important keywords are important keywords related to the second entity Keyword display unit for displaying related keywords for each of them on the screen
An electronic device supporting an object search from a document through matching keywords and an object inserted into the document further comprising:
제1항에 있어서,
상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록하는 추가 기록부
를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치.
According to claim 1,
After the first important keywords are recorded in the entity keyword table, when the first keyword is input from the user, the important keyword instructs to include the first keyword as the important keyword related to the first entity in the entity keyword table When an additional recording command is received, the additional recording unit additionally records the first keyword as important keywords related to the first entity in addition to the first important keywords in the entity keyword table
An electronic device supporting an object search from a document through matching keywords and an object inserted into the document further comprising:
문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 단계;
글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 단계;
사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 단계;
상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단계;
상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 단계;
상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 단계;
상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 단계;
상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 단계; 및
상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 단계
를 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법.
storing and maintaining an object keyword table in which unique identifiers for each of the plurality of objects inserted in the document and important keywords related to each of the plurality of objects are recorded in correspondence with each other;
Storing and maintaining a score table in which a plurality of different types of character format categories of different types that are pre-designated as applicable to a character and a score assigned in advance for each format attribute value that can be designated in each of the plurality of character format categories are recorded step;
generating a unique identifier for the first object when a first object is newly inserted into the document by a user;
extracting a plurality of words included within a predetermined distance from a midpoint of the first object from the text inserted into the document;
checking a format attribute value of each of the plurality of letter style categories applied to each of the plurality of words;
For each of the plurality of words, with reference to the score table, a total sum of importance assignment scores for each format attribute value of each of the plurality of letter format categories applied to each word is calculated, and the calculation is performed for each of the plurality of words assigning the total sum to the importance score of each word;
selecting a predetermined number of words from among the plurality of words in an order of high importance score, and selecting the selected words as first important keywords that are important keywords related to the first entity;
when the first important keywords are selected, recording the unique identifier of the first entity and the first important keywords in the entity keyword table in correspondence with each other; and
When at least one search keyword is input from the user and an object search command based on the at least one search keyword is received, a keyword matching the at least one search keyword is maximized from among important keywords from the object keyword table. After searching the unique identifier for the included second object, moving the screen to the point where the second object is inserted in the document so that the second object is displayed on the screen as a result of the search
An operating method of an electronic device that supports searching for an object from a document through matching keywords and an object inserted into a document including
제5항에 있어서,
상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성하는 단계;
상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산하는 단계;
상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정하는 단계; 및
상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록하는 단계
를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법.
6. The method of claim 5,
When the recording of the first important keywords in the individual keyword table is completed, for each of the first important keywords, an importance allocation score for each format attribute value of each of the plurality of letter style categories applied to each important keyword as a component; generating a feature vector;
calculating a cosine similarity between a feature vector of each important keyword and a feature vector of other important keywords for each of the first important keywords based on the feature vector generated for each of the first important keywords;
selecting, for each of the first important keywords, another important keyword having a maximum cosine similarity calculated as a related keyword; and
When the selection of the relevant keywords for each of the first important keywords is completed, for each of the first important keywords recorded in the individual keyword table, the related keywords for each important keyword are additionally recorded in correspondence with each other step
An operating method of an electronic device that supports searching for an object from a document through matching keywords and an object inserted into the document further comprising:
제6항에 있어서,
상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시하는 단계
를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법.
7. The method of claim 6,
After the screen is moved to the point where the second object is inserted, when a selection command for the second object is received from the user, it is recorded corresponding to the unique identifier of the second object in the object keyword table. After extracting the second important keywords, which are important keywords, and a keyword related to each of the second important keywords, the second important keyword together with a guide message indicating that the second important keywords are important keywords related to the second entity Displaying the relevant keywords for each of them on the screen
An operating method of an electronic device that supports searching for an object from a document through matching keywords and an object inserted into the document further comprising:
제5항에 있어서,
상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록하는 단계
를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법.
6. The method of claim 5,
After the first important keywords are recorded in the entity keyword table, when the first keyword is input from the user, the important keyword instructs to include the first keyword as the important keyword related to the first entity in the entity keyword table additionally recording the first keyword as important keywords related to the first entity in addition to the first important keywords in the entity keyword table when an additional recording command is received
An operating method of an electronic device that supports searching for an object from a document through matching keywords and an object inserted into the document further comprising:
제5항 내지 제8항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.A computer-readable recording medium recording a computer program for executing the method of any one of claims 5 to 8 through combination with a computer. 제5항 내지 제8항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.A computer program stored in a storage medium for executing the method of any one of claims 5 to 8 through combination with a computer.
KR1020200031773A 2020-03-16 2020-03-16 Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof KR102375507B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200031773A KR102375507B1 (en) 2020-03-16 2020-03-16 Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200031773A KR102375507B1 (en) 2020-03-16 2020-03-16 Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof

Publications (2)

Publication Number Publication Date
KR20210115670A true KR20210115670A (en) 2021-09-27
KR102375507B1 KR102375507B1 (en) 2022-03-17

Family

ID=77925616

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200031773A KR102375507B1 (en) 2020-03-16 2020-03-16 Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof

Country Status (1)

Country Link
KR (1) KR102375507B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102500756B1 (en) * 2021-10-20 2023-02-16 주식회사 한글과컴퓨터 Electronic terminal device generating electronic document into which chatting messages, inputted by users through the chatting service, are inserted, and the operating method thereof

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267057A (en) * 2004-03-17 2005-09-29 Seiko Epson Corp Text data extraction method, searching index creation method, electronic filing system, and program
JP2010205060A (en) * 2009-03-04 2010-09-16 Nomura Research Institute Ltd Method for retrieving image in document, and system for retrieving image in document
KR20100133084A (en) * 2009-06-11 2010-12-21 국민대학교산학협력단 Contents management system based on web service
KR101270958B1 (en) * 2013-01-02 2013-06-11 주식회사 한글과컴퓨터 Apparatus and method for searching image in the electronic document
KR20200013298A (en) * 2018-07-30 2020-02-07 주식회사 한글과컴퓨터 Apparatus for managing document utilizing of morphological analysis and operating method thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267057A (en) * 2004-03-17 2005-09-29 Seiko Epson Corp Text data extraction method, searching index creation method, electronic filing system, and program
JP2010205060A (en) * 2009-03-04 2010-09-16 Nomura Research Institute Ltd Method for retrieving image in document, and system for retrieving image in document
KR20100133084A (en) * 2009-06-11 2010-12-21 국민대학교산학협력단 Contents management system based on web service
KR101270958B1 (en) * 2013-01-02 2013-06-11 주식회사 한글과컴퓨터 Apparatus and method for searching image in the electronic document
KR20200013298A (en) * 2018-07-30 2020-02-07 주식회사 한글과컴퓨터 Apparatus for managing document utilizing of morphological analysis and operating method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102500756B1 (en) * 2021-10-20 2023-02-16 주식회사 한글과컴퓨터 Electronic terminal device generating electronic document into which chatting messages, inputted by users through the chatting service, are inserted, and the operating method thereof

Also Published As

Publication number Publication date
KR102375507B1 (en) 2022-03-17

Similar Documents

Publication Publication Date Title
US8606779B2 (en) Search method, similarity calculation method, similarity calculation, same document matching system, and program thereof
KR102187550B1 (en) Electronic device that can generate a summary preview of an ole object inserted into a document and operating method thereof
KR102287149B1 (en) Electronic device that displays a separation line of a paragraph based on text line information in a pdf document and operating method thereof
KR102375507B1 (en) Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof
KR102004981B1 (en) Electronic document editing apparatus for automatically inserting a description of a selected word and operating method thereof
KR102067504B1 (en) Spreadsheet document editing apparatus for performing an automatic filter function through the creation of a temporary header and operating method thereof
KR102215613B1 (en) Electronic device that enables text retrieval based on the language that makes up text inserted in a document and operating method thereof
KR102215580B1 (en) Electronic device for selecting important keywords for documents based on style attributes and operating method thereof
KR102466701B1 (en) Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof
KR20220165702A (en) BOM data editing system and method thereof
KR102300437B1 (en) Electronic document editing apparatus that enables the insertion of special characters at specific locations on the electronic document based on the entered characters and operating method thereof
KR101835994B1 (en) Method and apparatus of providing searching service for electronic books
KR102328051B1 (en) Document editing device that enables display of a document to which a font in unsupported data format is applied and operating method thereof
KR102300444B1 (en) Document editing device to check whether the font applied to the document is a supported font and operating method thereof
KR102227881B1 (en) Apparatus and method for searching special characters using images
KR20230016277A (en) Electronic apparatus which is able to convert the format of annotations inserted into a pdf document fast to the format editable by the application editing tools and then load the annotations, and the operating method thereof
KR102053076B1 (en) Document editing apparatus capable of applying styles based on emotion analysis and operating method thereof
KR102545262B1 (en) Electronic terminal apparatus for providing information of the associated documents which are associated with the particular document based on simultaneous usage criteria and operating method thereof
KR102375557B1 (en) Electronic device that performs a search for an object inserted in a document through execution of a query corresponding to a search keyword and operating method thereof
KR102545260B1 (en) Electronic terminal apparatus that supports application of natural substitute fonts when loading electronic documents with unsupported fonts applied and operating method thereof
KR102300457B1 (en) Electronic device that supports efficient typing practice by presenting words by level according to phoneme classification and operating method thereof
KR102395674B1 (en) Electronic device supporting detailed search for electronic documents through search keyword analysis and operating method thereof
KR102500730B1 (en) Electronic apparatus that provides a translation function that maintains the style information of the sentence and operating method thereof
KR102566921B1 (en) Electronic terminal apparatus which inserts source information of the image inserted into an electronic document, and the operating method thereof
KR102507487B1 (en) Electronic apparatus which generates the dedicated document file for supporting fast editing of the pages comprising of a document, and the operating method thereof

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant