KR102466701B1 - Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof - Google Patents

Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof Download PDF

Info

Publication number
KR102466701B1
KR102466701B1 KR1020200056907A KR20200056907A KR102466701B1 KR 102466701 B1 KR102466701 B1 KR 102466701B1 KR 1020200056907 A KR1020200056907 A KR 1020200056907A KR 20200056907 A KR20200056907 A KR 20200056907A KR 102466701 B1 KR102466701 B1 KR 102466701B1
Authority
KR
South Korea
Prior art keywords
cell
similarity
characters
character
sentences
Prior art date
Application number
KR1020200056907A
Other languages
Korean (ko)
Other versions
KR20210138894A (en
Inventor
손재연
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Priority to KR1020200056907A priority Critical patent/KR102466701B1/en
Publication of KR20210138894A publication Critical patent/KR20210138894A/en
Application granted granted Critical
Publication of KR102466701B1 publication Critical patent/KR102466701B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/191Automatic line break hyphenation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치가 개시된다. 본 발명은 사용자로부터 줄바꿈이 되어 있지 않은 텍스트가 삽입되어 있는 스프레드시트의 특정 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기를 기초로 상기 텍스트를 문장 단위로 분리하여 복수의 문장들을 생성하고, 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 특정 셀에 대한 가독성을 향상시킬 수 있는 전자 장치 및 그 동작 방법에 대한 것이다.Disclosed is an electronic device capable of breaking lines in units of sentences on a spreadsheet. According to the present invention, when a line break command is received from a user for a specific cell of a spreadsheet into which text without line breaks is inserted, the text is divided into sentence units based on a pre-built morpheme analyzer to form a plurality of sentences. The present invention relates to an electronic device capable of improving readability of the specific cell by generating lines and breaking the plurality of sentences for each sentence, and an operating method thereof.

Description

스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치 및 그 동작 방법{ELECTRONIC DEVICE CAPABLE OF LINE BREAK IN SENTENCE UNIT ON SPREADSHEET AND OPERATING METHOD THEREOF}Electronic device capable of breaking lines in sentence units on a spreadsheet and its operating method

본 발명은 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치 및 그 동작 방법에 대한 것이다.The present invention relates to an electronic device capable of line breaking in units of sentences on a spreadsheet and an operating method thereof.

최근, 컴퓨터나 스마트폰 또는 태블릿 PC 등이 널리 보급됨에 따라, 이러한 전자 장치를 이용하여 전자 문서를 열람, 작성, 편집할 수 있도록 하는 다양한 종류의 전자 문서 관련 프로그램들이 출시되고 있다.Recently, as computers, smart phones, tablet PCs, etc. have been widely spread, various types of electronic document-related programs have been released that enable users to view, create, and edit electronic documents using these electronic devices.

이러한 전자 문서 관련 프로그램들로는 기본적인 문서의 작성, 편집 등을 지원하는 워드프로세서, 데이터의 입력, 산술연산, 데이터 관리를 보조하는 스프레드시트, 발표자의 발표를 보조하기 위한 프레젠테이션 프로그램들이 있다.These electronic document-related programs include a word processor supporting basic document creation and editing, a spreadsheet assisting data input, arithmetic operation, and data management, and a presentation program assisting a presenter's presentation.

전술한 전자 문서 관련 프로그램들 중에서 스프레드시트는 데이터를 입력할 수 있는 복수의 셀들을 제공해 줌으로써, 데이터 관리의 편의를 도모해 주고, 다양한 함수 명령어를 지원하고 있어서, 사무업무에 많이 활용되고 있다.Among the above-mentioned electronic document-related programs, a spreadsheet provides a plurality of cells into which data can be input, promotes the convenience of data management, and supports various function commands, so it is widely used in office work.

스프레드시트에서는 사용자가 특정 셀에 복수의 문장들을 연속해서 한 줄로 입력하는 경우, 가독성이 떨어지는 문제가 발생할 수 있다.In a spreadsheet, when a user continuously inputs a plurality of sentences in a single line in a specific cell, a problem in readability may occur.

이와 관련하여, 기존의 스프레드시트 프로그램에서는 사용자가 특정 셀에 복수의 문장들을 연속해서 한 줄로 입력할 경우, 연속해서 한 줄로 입력된 복수의 문장들을 문장 단위로 줄바꿈 해주는 기능을 제공하지 않았다.In this regard, when a user continuously inputs a plurality of sentences in a single line in a specific cell, the existing spreadsheet program does not provide a function of line-breaking the plurality of sentences consecutively input in a single line in sentence units.

예컨대, 사용자가 특정 셀에 'a', 'b', 'c', 'd', 'e'라는 각 문장을 연속해서 한 줄로 입력하는 경우, 기존의 스프레드시트 프로그램에서는 특정 셀에 연속해서 입력된 'a, b, c, d, e'라는 문장들을 문장 단위로 줄바꿈 해주는 기능을 제공해주지 못했기 때문에, 사용자가 특정 셀에 연속해서 입력된 'a, b, c, d, e'라는 문장들을 읽을 때 가독성이 떨어지는 문제가 존재하였다.For example, when a user continuously inputs the sentences 'a', 'b', 'c', 'd', and 'e' in a single line in a specific cell, in an existing spreadsheet program, the user continuously inputs the sentences in a specific cell. Since it did not provide a function to break the sentences 'a, b, c, d, e' in sentence units, the sentences 'a, b, c, d, e' entered consecutively by the user in a specific cell. There was a problem with poor readability when reading them.

따라서, 스프레드시트의 특정 셀에 연속해서 한 줄로 입력된 복수의 문장들을 문장 단위로 줄바꿈 해줄 수 있도록 하는 기법에 대한 연구가 필요하다.Therefore, it is necessary to research a technique that allows a plurality of sentences input in a single line to be line-wrapped in sentence units in a specific cell of the spreadsheet.

본 발명은 사용자로부터 줄바꿈이 되어 있지 않은 텍스트가 삽입되어 있는 스프레드시트의 특정 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기를 기초로 상기 텍스트를 문장 단위로 분리하여 복수의 문장들을 생성하고, 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 특정 셀에 대한 가독성을 향상시킬 수 있는 전자 장치 및 그 동작 방법을 제시하고자 한다.According to the present invention, when a line break command is received from a user for a specific cell of a spreadsheet into which text without line breaks is inserted, the text is divided into sentence units based on a pre-built morpheme analyzer to form a plurality of sentences. An electronic device capable of improving the readability of the specific cell by generating lines and breaking the plurality of sentences for each sentence, and an operating method thereof are proposed.

본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치는 사용자로부터 스프레드시트를 구성하는 복수의 셀들 중 줄바꿈이 되어 있지 않은 텍스트(Text)가 삽입되어 있는 제1 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기(Morphological Analyzer)를 기초로 상기 텍스트를 문장 단위로 분리함으로써, 복수의 문장들을 생성하는 문장 생성부, 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 제1 셀 내에서 상기 복수의 문장들을 세로로 정렬시키는 문장 줄바꿈부 및 상기 복수의 셀들 중 상기 제1 셀이 포함된 열을 구성하는 셀들의 가로 너비를 상기 복수의 문장들 각각의 길이 중 최대 길이에 매칭되도록 조정하는 가로 너비 조정부를 포함한다.According to an embodiment of the present invention, an electronic device capable of breaking lines in units of sentences on a spreadsheet sends a user to a first cell in which non-linebreaked text is inserted among a plurality of cells constituting a spreadsheet. When a line-breaking command is received, a sentence generation unit that generates a plurality of sentences by dividing the text into sentence units based on a pre-built morphological analyzer, and line-breaking the plurality of sentences for each sentence By doing so, the sentence breakers for vertically arranging the plurality of sentences in the first cell and the horizontal width of the cells constituting the column including the first cell among the plurality of cells are set to each of the plurality of sentences. It includes a horizontal width adjustment unit that adjusts to match the maximum length of the length.

또한, 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법은 사용자로부터 스프레드시트를 구성하는 복수의 셀들 중 줄바꿈이 되어 있지 않은 텍스트가 삽입되어 있는 제1 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기를 기초로 상기 텍스트를 문장 단위로 분리함으로써, 복수의 문장들을 생성하는 단계, 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 제1 셀 내에서 상기 복수의 문장들을 세로로 정렬시키는 단계 및 상기 복수의 셀들 중 상기 제1 셀이 포함된 열을 구성하는 셀들의 가로 너비를 상기 복수의 문장들 각각의 길이 중 최대 길이에 매칭되도록 조정하는 단계를 포함한다.In addition, according to an embodiment of the present invention, in a method of operating an electronic device capable of breaking lines in units of sentences on a spreadsheet, a first cell in which text without line breaks is inserted among a plurality of cells constituting the spreadsheet is inserted by the user. Generating a plurality of sentences by dividing the text into sentence units based on a pre-built morpheme analyzer when a line-breaking command is received for a cell; by breaking the plurality of sentences into lines for each sentence, vertically arranging the plurality of sentences in one cell, and matching the horizontal widths of the cells constituting the column including the first cell among the plurality of cells to the maximum length of each of the plurality of sentences It includes an adjustment step.

본 발명은 사용자로부터 줄바꿈이 되어 있지 않은 텍스트가 삽입되어 있는 스프레드시트의 특정 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기를 기초로 상기 텍스트를 문장 단위로 분리하여 복수의 문장들을 생성하고, 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 특정 셀에 대한 가독성을 향상시킬 수 있는 전자 장치 및 그 동작 방법을 제시할 수 있다.According to the present invention, when a line break command is received from a user for a specific cell of a spreadsheet into which text without line breaks is inserted, the text is divided into sentence units based on a pre-built morpheme analyzer to form a plurality of sentences. It is possible to propose an electronic device and an operating method thereof capable of improving readability of the specific cell by generating lines and breaking the plurality of sentences for each sentence.

도 1은 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 구조를 도시한 도면이다.
도 2 내지 도 3은 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작을 설명하기 위한 도면이다.
도 4는 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법을 도시한 순서도이다.
1 is a diagram showing the structure of an electronic device capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention.
2 and 3 are diagrams for explaining the operation of an electronic device capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention.
4 is a flowchart illustrating an operating method of an electronic device capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention.

이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings. This description is not intended to limit the present invention to specific embodiments, but should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. While describing each drawing, similar reference numerals have been used for similar components, and unless otherwise defined, all terms used in this specification, including technical or scientific terms, are common knowledge in the art to which the present invention belongs. has the same meaning as commonly understood by the person who has it.

본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다. In this document, when a certain component is said to "include", it means that it may further include other components without excluding other components unless otherwise stated. In addition, in various embodiments of the present invention, each component, functional block, or means may be composed of one or more sub-components, and the electrical, electronic, and mechanical functions performed by each component are electronic It may be implemented with various known elements or mechanical elements such as circuits, integrated circuits, ASICs (Application Specific Integrated Circuits), and may be implemented separately or two or more may be integrated into one.

한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.On the other hand, the blocks of the accompanying block diagram or the steps of the flowchart are computer program instructions that perform designated functions by being loaded into a processor or memory of a device capable of data processing, such as a general-purpose computer, a special purpose computer, a portable notebook computer, and a network computer. can be interpreted as meaning Since these computer program instructions may be stored in a memory included in a computer device or in a computer readable memory, the functions described in blocks of a block diagram or steps of a flowchart are produced as a product containing instruction means for performing them. It could be. Further, each block or each step may represent a module, segment or portion of code that includes one or more executable instructions for executing specified logical function(s). Also, it should be noted that in some alternative embodiments, functions mentioned in blocks or steps may be executed out of a predetermined order. For example, two blocks or steps shown in succession may be performed substantially simultaneously or in reverse order, and in some cases, some blocks or steps may be omitted.

도 1은 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 구조를 도시한 도면이다.1 is a diagram showing the structure of an electronic device capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치(110)는 문장 생성부(111), 문장 줄바꿈부(112) 및 가로 너비 조정부(113)를 포함한다.Referring to FIG. 1 , an electronic device 110 capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention includes a sentence generator 111, a sentence line breaker 112, and a horizontal width adjuster 113. ).

문장 생성부(111)는 사용자로부터 스프레드시트를 구성하는 복수의 셀들 중 줄바꿈이 되어 있지 않은 텍스트(Text)가 삽입되어 있는 제1 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기(Morphological Analyzer)를 기초로 상기 텍스트를 문장 단위로 분리함으로써, 복수의 문장들을 생성한다.The sentence generation unit 111 receives a line break command for a first cell in which text that is not line broken among a plurality of cells constituting the spreadsheet is inserted from the user, the morpheme analyzer built in advance A plurality of sentences are generated by dividing the text into sentence units based on a (Morphological Analyzer).

문장 줄바꿈부(112)는 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 제1 셀 내에서 상기 복수의 문장들을 세로로 정렬시킨다.The sentence line breaking unit 112 vertically aligns the plurality of sentences within the first cell by line breaking the plurality of sentences for each sentence.

관련하여, 도 2는 문장 생성부(111) 및 문장 줄바꿈부(112)의 동작을 설명하기 위한 도면이다.In this regard, FIG. 2 is a diagram for explaining the operation of the sentence generator 111 and the sentence line breaker 112 .

먼저, 사용자로부터 도면부호 210과 같이, 줄바꿈이 되어 있지 않은 텍스트인 '안녕하세요 경영팀 가나다입니다 잘 부탁드립니다'가 삽입되어 있는 제1 셀(211)에 대해 줄바꿈 명령이 수신되면, 문장 생성부(111)는 미리 구축되어 있는 형태소 분석기를 기초로 상기 텍스트인 '안녕하세요 경영팀 가나다입니다 잘 부탁드립니다'를 문장 단위로 분리함으로써, '안녕하세요', '경영팀 가나다입니다', '잘 부탁드립니다'와 같은 복수의 문장들을 생성할 수 있다.First, when a line break command is received from the user for the first cell 211 into which non-line-wrapped text 'Hello, management team, Kanada, thank you' is inserted, as shown by reference numeral 210, the sentence generation unit (111) separates the above text, 'Hello, this is Kanada, the management team', into sentence units based on the pre-built morpheme analyzer, You can create multiple sentences of the same type.

그러고 나서, 문장 줄바꿈부(112)는 도면부호 220과 같이, 상기 복수의 문장들인 '안녕하세요', '경영팀 가나다입니다', '잘 부탁드립니다'를 각 문장별로 줄바꿈함으로써, 제1 셀(211) 내에서 상기 복수의 문장들인 '안녕하세요', '경영팀 가나다입니다', '잘 부탁드립니다'를 세로로 정렬시킬 수 있다.Then, as shown in reference numeral 220, the sentence break unit 112 breaks the plurality of sentences 'Hello', 'Management Team Kanada', and 'Thank you in advance' for each sentence, so that the first cell ( 211), 'Hello', 'This is Kanada from the management team', and 'Thank you', which are the above sentences, can be vertically aligned.

가로 너비 조정부(113)는 상기 복수의 셀들 중 상기 제1 셀이 포함된 열을 구성하는 셀들의 가로 너비를 상기 복수의 문장들 각각의 길이 중 최대 길이에 매칭되도록 조정한다.The horizontal width adjusting unit 113 adjusts the horizontal width of the cells constituting the column including the first cell among the plurality of cells to match the maximum length of each of the plurality of sentences.

이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 세로 너비 조정부(114)를 더 포함할 수 있다.In this case, according to an embodiment of the present invention, the electronic device 110 may further include a vertical width adjusting unit 114 .

세로 너비 조정부(114)는 상기 복수의 셀들 중 상기 제1 셀이 포함된 행을 구성하는 셀들의 세로 너비를 상기 복수의 문장들의 개수와 미리 정해진(predetermined) 기준 세로 너비의 곱에 매칭되도록 조정한다.The vertical width adjusting unit 114 adjusts the vertical width of the cells constituting the row including the first cell among the plurality of cells to match the product of the number of sentences and a predetermined standard vertical width. .

관련하여, 도 3은 가로 너비 조정부(113) 및 세로 너비 조정부(114)의 동작을 설명하기 위한 도면이다.In this regard, FIG. 3 is a diagram for explaining operations of the horizontal width adjusting unit 113 and the vertical width adjusting unit 114 .

앞선 도면부호 220을 통해 설명한 바와 같이, 문장 줄바꿈부(112)에 의해 상기 복수의 문장들인 '안녕하세요', '경영팀 가나다입니다', '잘 부탁드립니다'가 제1 셀(211) 내에서 세로로 정렬되었다고 가정하는 경우, 가로 너비 조정부(113)는 도면부호 310과 같이, 상기 복수의 셀들 중 제1 셀(211)이 포함된 열을 구성하는 셀들(212)의 가로 너비(311)를 문장 줄바꿈부(112)에 의해 세로로 정렬된 상기 복수의 문장들인 '안녕하세요', '경영팀 가나다입니다', '잘 부탁드립니다' 각각의 길이 중 최대 길이인 '경영팀 가나다입니다'에 매칭되도록 조정할 수 있다.As described above with reference numeral 220, the plurality of sentences 'Hello', 'This is Management Team Kanada', and 'Thank you' are displayed vertically in the first cell 211 by the sentence break unit 112. Assuming that they are aligned, the horizontal width adjusting unit 113 sets the horizontal width 311 of the cells 212 constituting the column including the first cell 211 among the plurality of cells, as shown by reference numeral 310. Among the plurality of sentences vertically aligned by the line break 112, 'Hello', 'Management Team', and 'Thank you' are adjusted to match the maximum length of 'Management Team's Kanada'. can

그 이후, 세로 너비 조정부(114)는 도면부호 320과 같이, 상기 복수의 셀들 중 제1 셀(211)이 포함된 행을 구성하는 셀들(213)의 세로 너비(322)를 상기 복수의 문장들인 '안녕하세요', '경영팀 가나다입니다', '잘 부탁드립니다'의 개수인 '3'과 기준 세로 너비의 곱에 매칭되도록 조정할 수 있다.After that, the vertical width adjusting unit 114 sets the vertical width 322 of the cells 213 constituting the row including the first cell 211 among the plurality of cells, as shown by reference numeral 320, to the plurality of sentences. It can be adjusted to match the product of '3', which is the number of 'Hello', 'Management Team', and 'Thank you', and the standard vertical width.

관련해서, 상기 기준 세로 너비가 도면부호 321로 표시한 크기를 갖는 너비라고 하는 경우, 세로 너비 조정부(114)는 제1 셀(211)이 포함된 행을 구성하는 셀들(213)의 세로 너비(322)를 상기 복수의 문장들인 '안녕하세요', '경영팀 가나다입니다', '잘 부탁드립니다'의 개수인 '3'과 상기 기준 세로 너비(321)의 곱에 매칭되도록 조정할 수 있다.In this regard, when the standard vertical width is a width having a size indicated by reference numeral 321, the vertical width adjusting unit 114 determines the vertical width of the cells 213 constituting the row including the first cell 211 ( 322) can be adjusted to match the product of '3', which is the number of the plurality of sentences 'Hello', 'Management Team', and 'Thank you', and the standard vertical width 321.

즉, 전자 장치(110)는 사용자로부터 스프레드시트를 구성하는 복수의 셀들 중 줄바꿈이 되어 있지 않은 텍스트가 삽입되어 있는 제1 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기를 기초로 상기 텍스트를 문장 단위로 분리함으로써, 복수의 문장들을 생성하고, 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 제1 셀 내에서 상기 복수의 문장들을 세로로 정렬시키며, 상기 복수의 셀들 중 상기 제1 셀이 포함된 열을 구성하는 셀들의 가로 너비를 상기 복수의 문장들 각각의 길이 중 최대 길이에 매칭되도록 조정한 후 상기 복수의 셀들 중 상기 제1 셀이 포함된 행을 구성하는 셀들의 세로 너비를 상기 복수의 문장들의 개수와 미리 정해진 기준 세로 너비의 곱에 매칭되도록 조정함으로써, 상기 제1 셀에 삽입된 텍스트에 대한 줄바꿈을 처리할 수 있다.That is, when the electronic device 110 receives a line break command for a first cell in which text without line breaks is inserted among a plurality of cells constituting the spreadsheet from the user, the electronic device 110 based on a pre-built morpheme analyzer. By dividing the text into sentence units, a plurality of sentences are generated, and the plurality of sentences are vertically aligned in the first cell by line breaking for each sentence, and among the plurality of cells After adjusting the horizontal width of the cells constituting the column including the first cell to match the maximum length of each of the plurality of sentences, the cell constituting the row including the first cell among the plurality of cells By adjusting the vertical width of the text to match the product of the number of the plurality of sentences and a predetermined standard vertical width, line breaks for the text inserted into the first cell may be processed.

본 발명의 일실시예에 따르면, 전자 장치(110)는 문자 정보 데이터베이스(115), 문자 추출부(116), 문자 그룹 생성부(117), 합계 연산부(118), 벡터 유사도 연산부(119), LCS 유사도 연산부(120) 및 유사도 측정 값 표시부(121)를 더 포함할 수 있다.According to an embodiment of the present invention, the electronic device 110 includes a character information database 115, a character extractor 116, a character group generator 117, a sum calculator 118, a vector similarity calculator 119, An LCS similarity calculation unit 120 and a similarity measurement value display unit 121 may be further included.

문자 정보 데이터베이스(115)에는 미리 정해진 복수의 문자들과 상기 복수의 문자들 각각에 대한 서로 다른 미리 정해진 인덱스 번호가 서로 대응되어 저장되어 있다.In the character information database 115, a plurality of predetermined characters and different predetermined index numbers for each of the plurality of characters are stored in correspondence with each other.

예컨대, 문자 정보 데이터베이스(115)에는 하기의 표 1과 같이 데이터가 저장되어 있을 수 있다.For example, data as shown in Table 1 below may be stored in the text information database 115 .

복수의 문자들multiple characters 인덱스 번호index number go 1One he 22 thing 33 chaff 44 ...... ......

문자 추출부(116)는 상기 사용자로부터 상기 제1 셀과, 텍스트가 삽입되어 있는 또 다른 셀인 제2 셀 간의 유사도 측정 명령이 수신되면, 상기 제1 셀로부터 상기 제1 셀에 포함된 복수의 제1 문자들을 미리 정해진 제1 방향으로 순차적으로 추출하고, 상기 제2 셀로부터 상기 제2 셀에 포함된 복수의 제2 문자들을 상기 제1 방향으로 순차적으로 추출한다.When a similarity measurement command between the first cell and a second cell, which is another cell into which text is inserted, is received from the user, the character extractor 116 receives a plurality of first cells included in the first cell from the first cell. One character is sequentially extracted in a predetermined first direction, and a plurality of second characters included in the second cell are sequentially extracted from the second cell in the first direction.

여기서, 상기 제1 방향은 개발자에 의해 미리 설정될 수 있는 방향으로, 왼쪽에서 오른쪽 방향, 위쪽에서 아래쪽 방향으로 설정될 수 있다.Here, the first direction is a direction that can be set in advance by a developer, and may be set from left to right and from top to bottom.

문자 그룹 생성부(117)는 상기 복수의 제1 문자들을 미리 정해진 문자 수 단위로 그룹화하여 복수의 제1 문자 그룹들을 생성하고, 상기 복수의 제2 문자들을 상기 문자 수 단위로 그룹화하여 복수의 제2 문자 그룹들을 생성한다.The character group generation unit 117 groups the plurality of first characters in units of a predetermined number of characters to generate a plurality of first character groups, and groups the plurality of second characters in units of the number of characters to create a plurality of first character groups. 2 Create character groups.

예컨대, 앞서 설명한 바와 같이, 상기 제1 셀에 '안녕하세요 경영팀 가나다입니다 잘 부탁드립니다'라는 문자들이 포함되어 있고, 상기 문자 수가 '10'이라고 가정하자.For example, as described above, it is assumed that the first cell includes characters such as 'Hello, management team, this is Kanada.

이때, 문자 그룹 생성부(117)는 '안녕하세요 경영팀 가나다입니다 잘 부탁드립니다'라는 문자들을 '10'문자씩 그룹화하여 '문자 그룹 1(안녕하세요경영팀가나)', '문자 그룹 2(다입니다잘부탁드립니)', '문자 그룹 3(다)'을 생성할 수 있다. 마찬가지로, 문자 그룹 생성부(117)는 텍스트가 삽입되어 있는 또 다른 셀인 상기 제2 셀에 대해서도 위와 같은 동작을 수행할 수 있다.At this time, the character group generation unit 117 groups the characters 'Hello, this is Kana, the management team. Please)' and 'Character group 3(C)' can be created. Similarly, the character group generator 117 may perform the same operation with respect to the second cell, which is another cell into which text is inserted.

그리고, 합계 연산부(118)는 문자 정보 데이터베이스(115)로부터 상기 복수의 제1 문자들과 상기 복수의 제2 문자들에 대응되는 인덱스 번호들을 확인한 후, 상기 복수의 제1 문자 그룹들과 상기 복수의 제2 문자 그룹들을 구성하는 각 문자 그룹에 대해, 상기 각 문자 그룹에 포함된 문자들에 대응되는 인덱스 번호들의 총 합계를 연산한다.Then, the sum operation unit 118 checks index numbers corresponding to the plurality of first characters and the plurality of second characters from the character information database 115, and determines the plurality of first character groups and the plurality of second characters. For each character group constituting the second character groups of , a total sum of index numbers corresponding to characters included in each character group is calculated.

예컨대, 앞서 설명한 예를 이용하면, 합계 연산부(118)는 상기 제1 셀의 경우, 문자 정보 데이터베이스(115)로부터 상기 제1 셀에 포함된 '안녕하세요 경영팀 가나다입니다 잘 부탁드립니다'라는 문자들 각각에 대응되는 인덱스 번호들을 확인한 후, 상기 '문자 그룹 1(안녕하세요경영팀가나)'에 포함된 문자들인 '안', '녕', '하', '세', '요', '경', '영', '팀', '가', '나'에 대응되는 인덱스 번호들의 총 합계인 '연산 값 1'을 연산할 수 있고, 상기 '문자 그룹 2(다입니다잘부탁드립니)'에 포함된 문자들인 '다', '입', '니', '다', '잘', '부', '탁', '드', '립', '니'에 대응되는 인덱스 번호들의 총 합계인 '연산 값 2'를 연산할 수 있으며, 상기 '문자 그룹 3(다)'에 포함된 문자들인 '다'에 대응되는 인덱스 번호들의 총 합계인 '연산 값 3'을 연산할 수 있다. 마찬가지로, 합계 연산부(118)는 상기 제2 셀에 대해서도 위와 같은 동작을 수행할 수 있다.For example, using the example described above, in the case of the first cell, the sum operation unit 118 calculates each of the characters 'Hello, this is Management Team Kanada. After checking the index numbers corresponding to 'character group 1 (Hello Management Team Kana)', the characters included in 'An', 'Nyeong', 'Ha', 'Se', 'Yo', 'Kyung', 'Operation value 1', which is the total sum of index numbers corresponding to 'zero', 'team', 'ga', and 'me', can be calculated, and is included in the 'character group 2 (thank you)' The total sum of the index numbers corresponding to the characters 'Da', 'Ip', 'Ni', 'Da', 'Jal', 'Bu', 'Tak', 'De', 'Lip', and 'Ni'. 'Calculation value 2' can be calculated, and 'calculation value 3', which is the total sum of index numbers corresponding to 'C', which is the characters included in the 'character group 3 (C)', can be calculated. Similarly, the sum calculation unit 118 may perform the same operation with respect to the second cell.

벡터 유사도 연산부(119)는 상기 복수의 제1 문자 그룹들에 대해, 상기 복수의 제1 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제1 특징 벡터를 생성하고, 상기 복수의 제2 문자 그룹들에 대해, 상기 복수의 제2 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제2 특징 벡터를 생성한 후, 상기 제1 특징 벡터와 상기 제2 특징 벡터 간의 벡터 유사도를 연산한다.The vector similarity calculation unit 119 generates a first feature vector having as a component a total sum of index numbers calculated for each of the plurality of first character groups for the plurality of first character groups, and For the second character groups, after generating a second feature vector having as a component the total sum of the index numbers calculated for each of the plurality of second character groups, Calculate vector similarity.

이때, 본 발명의 일실시예에 따르면, 상기 벡터 유사도는 하기의 수학식 1에 따라 연산될 수 있다.In this case, according to an embodiment of the present invention, the vector similarity may be calculated according to Equation 1 below.

Figure 112020048151397-pat00001
Figure 112020048151397-pat00001

여기서, M은 두 벡터 사이의 벡터 유사도로, D는 두 벡터 사이의 유클리드 거리(Euclidean Distance)를 의미하고, 상기 두 벡터 사이의 유클리드 거리 D는 하기의 수학식 2에 따라 연산될 수 있다.Here, M is the vector similarity between two vectors, D is the Euclidean distance between the two vectors, and the Euclidean distance D between the two vectors can be calculated according to Equation 2 below.

Figure 112020048151397-pat00002
Figure 112020048151397-pat00002

상기 수학식 2에서 D는 유클리드 거리, Ai와 Bi는 두 벡터에 포함되어 있는 i번째 성분들을 의미한다. 보통, 두 벡터 간의 유클리드 거리가 작을수록 두 벡터는 유사한 벡터라고 볼 수 있고, 두 벡터 간의 유클리드 거리가 클수록 두 벡터는 비유사한 벡터라고 볼 수 있다.In Equation 2, D is the Euclidean distance, and A i and B i denote i-th components included in the two vectors. In general, the smaller the Euclidean distance between two vectors, the more similar the two vectors are, and the larger the Euclidean distance between the two vectors, the more dissimilar vectors they are.

예컨대, 앞서 설명한 예를 이용하여 벡터 유사도 연산부(119)의 동작을 설명하면, 벡터 유사도 연산부(119)는 상기 '문자 그룹 1(안녕하세요경영팀가나)', 상기 '문자 그룹 2(다입니다잘부탁드립니)', 상기 '문자 그룹 3(다)'에 대해, 상기 '문자 그룹 1(안녕하세요경영팀가나)'에서 연산된 상기 '연산 값 1', 상기 '문자 그룹 2(다입니다잘부탁드립니)'에서 연산된 상기 '연산 값 2', 상기 '문자 그룹 3(다)'에서 연산된 상기 '연산 값 3'을 성분으로 갖는 3차원의 '특징 벡터 1'을 생성할 수 있고, 마찬가지로, 상기 제2 셀에서 생성된 복수의 문자 그룹들에 대해, 상기 제2 셀에서 생성된 복수의 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 '특징 벡터 2'를 생성할 수 있다. 그러고 나서, 벡터 유사도 연산부(119)는 상기 '특징 벡터 1'과 상기 '특징 벡터 2' 간의 벡터 유사도를 연산할 수 있다.For example, if the operation of the vector similarity calculating unit 119 is described using the example described above, the vector similarity calculating unit 119 will use the 'character group 1 (Hello Business Team Kana)' and the 'character group 2 (I'm sorry) Dripni)', the 'character group 3 (C)', the 'calculated value 1' calculated from the 'character group 1 (Hello Management Team Gana)', the 'character group 2 (Daily) It is possible to generate a three-dimensional 'feature vector 1' having as components the 'operation value 2' calculated in the 'character group 3 (c)' and the 'operation value 3' calculated in the 'character group 3 (c)'. With respect to the plurality of character groups generated in the second cell, 'feature vector 2' having as a component a total sum of index numbers calculated in each of the plurality of character groups generated in the second cell may be generated. Then, the vector similarity calculation unit 119 may calculate the vector similarity between the 'feature vector 1' and the 'feature vector 2'.

이후, LCS 유사도 연산부(120)는 상기 복수의 제1 문자 그룹들 각각에 대해, 상기 복수의 제1 문자 그룹들 각각에 포함된 문자들과 상기 복수의 제2 문자 그룹들 중 같은 순서에 있는 문자 그룹에 포함된 문자들 간의 최장 공통 부분 수열(Longest Common Subsequence: LCS)의 길이를 연산한 후, 상기 복수의 제1 문자 그룹들에 대해 연산된 LCS의 길이들의 평균 값을 0 이상 1 이하의 값으로 정규화하여 LCS 유사도로 연산한다.Thereafter, the LCS similarity calculating unit 120 performs, for each of the plurality of first character groups, characters included in each of the plurality of first character groups and characters in the same order among the plurality of second character groups. After calculating the length of the longest common subsequence (LCS) between the characters included in the group, the average value of the lengths of the LCS calculated for the plurality of first character groups is a value of 0 or more and 1 or less. It is normalized to , and the LCS similarity is calculated.

여기서, LCS란 두 개의 문자열에서 일치하는 연속된 문자열을 의미하는 것으로, 'ACAYKP'와 'CAPCAK'가 있다고 하였을 때, 두 문자열 간의 LCS는 'ACAK'이고, 이때 LCS의 길이는 '4'가 된다.Here, LCS means a continuous string that matches two strings. When there are 'ACAYKP' and 'CAPCAK', the LCS between the two strings is 'ACAK', and the length of the LCS is '4'. .

예컨대, 상기 복수의 제1 문자 그룹들이 상기 '문자 그룹 1(안녕하세요경영팀가나)'과 상기 '문자 그룹 2(다입니다잘부탁드립니)'로 구성되어 있고, 상기 복수의 제2 문자 그룹들이 '문자 그룹 4(안녕하세요인사팀마바)'와 '문자 그룹 5(사입니다잘부탁드립니)'로 구성되어 있다고 가정하자.For example, the plurality of first character groups are composed of the 'character group 1 (Hello Management Team Kana)' and the 'character group 2 (Thank you for your patience)', and the plurality of second character groups are 'character group 2'. Let's assume that it consists of 'character group 4 (Hello greetings team maba)' and 'character group 5 (I'm sorry)'.

이때, LCS 유사도 연산부(120)는 상기 '문자 그룹 1(안녕하세요경영팀가나)'에 포함된 문자들인 '안녕하세요경영팀가나'와 상기 복수의 제2 문자 그룹들 중 같은 순서에 있는 문자 그룹인 상기 '문자 그룹4(안녕하세요인사팀마바)'에 포함된 문자들인 '안녕하세요인사팀마바' 간의 LCS의 길이로 '안녕하세요팀'에 대한 '6'을 연산할 수 있고, 상기 '문자 그룹 2(다입니다잘부탁드립니)'에 포함된 문자들인 '다입니다잘부탁드립니'와 상기 복수의 제2 문자 그룹들 중 같은 순서에 있는 문자 그룹인 상기 '문자 그룹 5(사입니다잘부탁드립니)'에 포함된 문자들인 '사입니다잘부탁드립니' 간의 LCS의 길이로 '입니다잘부탁드립니'에 대한 '9'를 연산할 수 있다. 이후, LCS 유사도 연산부(120)는 상기 '문자 그룹 1(안녕하세요경영팀가나)'에 대해서 연산된 LCS의 길이인 '안녕하세요팀'에 대한 '6'과, 상기 '문자 그룹 2(다입니다잘부탁드립니)'에 대해서 연산된 LCS의 길이인 '입니다잘부탁드립니'에 대한 '9'의 평균 값을 '7.5'로 연산한 후 상기 평균 값인 '7.5'를 0 이상 1 이하의 값으로 정규화하여 LCS 유사도로 연산할 수 있다.At this time, the LCS similarity calculating unit 120 performs the character group 'Hello Management Team Kana' included in the 'character group 1 (Hello Management Team Kana)' and the character group in the same order among the plurality of second character groups. With the length of the LCS between 'Hello Greetings Timmaba', which is the characters included in 'Character Group 4 (Hello Greetings Timmaba)', '6' for 'Hello Team' can be calculated, The characters included in 'I'm sorry' are the characters included in 'I'm sorry' and the characters included in the 'character group 5 (please take care of me)', which is a character group in the same order among the plurality of second character groups. '9' for 'Please' can be calculated as the length of the LCS between 'Please'. Thereafter, the LCS similarity calculation unit 120 calculates '6' for 'Hello Team', which is the length of the LCS calculated for 'Character Group 1 (Hello Business Team Kana)', and After calculating the average value of '9' for 'Please', which is the length of the LCS calculated for 'Please,' as '7.5', the average value of '7.5' is normalized to a value between 0 and 1, and the LCS similarity can be computed.

이때, 본 발명의 일실시에에 따르면, LCS 유사도 연산부(120)는 상기 LCS의 길이들의 평균 값을 상기 복수의 제1 문자들과 상기 복수의 제2 문자들을 그룹화할 때 사용한 상기 문자 수로 나눔으로써, 0 이상 1 이하의 값으로 정규화할 수 있다.At this time, according to one embodiment of the present invention, the LCS similarity calculation unit 120 divides the average value of the lengths of the LCS by the number of characters used when grouping the plurality of first characters and the plurality of second characters. , can be normalized to a value between 0 and 1.

앞선 예에 따르면, 상기 복수의 제1 문자들과 상기 복수의 제2 문자들을 그룹화할 때 사용한 상기 문자 수가 '10'이기 때문에, LCS 유사도 연산부(120)는 상기 평균 값인 '7.5'를 상기 문자 수인 '10'으로 나누어 '0.75'로 연산함으로써, 0 이상 1 이하의 값으로 정규화할 수 있다.According to the previous example, since the number of characters used when grouping the plurality of first characters and the plurality of second characters is '10', the LCS similarity calculation unit 120 sets the average value '7.5' as the number of characters. By dividing by '10' and calculating '0.75', it can be normalized to a value of 0 or more and 1 or less.

유사도 측정 값 표시부(121)는 상기 벡터 유사도와 상기 LCS 유사도를 기초로 상기 제1 셀과 상기 제2 셀 간의 유사도 측정 값을 산출하고, 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값을 화면 상에 표시한다.The similarity measurement value display unit 121 calculates a similarity measurement value between the first cell and the second cell based on the vector similarity and the LCS similarity, and calculates the similarity measurement value between the first cell and the second cell. display on the screen.

이때, 본 발명의 일실시예에 따르면, 유사도 측정 값 표시부(121)는 상기 유사도 측정 값을 산출하는 과정에서 상기 벡터 유사도와 상기 LCS 유사도의 중요도나 영향도를 고려하기 위해, 상기 벡터 유사도에 미리 정해진 제1 가중치를 곱하고, 상기 LCS 유사도에 미리 정해진 제2 가중치를 곱하여 상기 벡터 유사도와 상기 LCS 유사도의 가중 평균 값을 연산한 후, 상기 가중 평균 값을 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값으로 산출할 수 있다.At this time, according to an embodiment of the present invention, the similarity measurement value display unit 121 determines the vector similarity in advance in order to consider the importance or influence of the vector similarity and the LCS similarity in the process of calculating the similarity measurement value. A weighted average value of the vector similarity and the LCS similarity is calculated by multiplying the LCS similarity by a predetermined first weight and by multiplying the LCS similarity by a predetermined second weight, and then calculating the weighted average value as the It can be calculated as a similarity measurement value.

이때, 본 발명의 일실시예에 따르면, 상기 제1 가중치와 상기 제2 가중치는 0 초과 1 미만의 값으로 구성되고, 상기 제1 가중치와 상기 제2 가중치의 합은 1로 연산될 수 있다.At this time, according to an embodiment of the present invention, the first weight and the second weight may be composed of a value greater than 0 and less than 1, and the sum of the first weight and the second weight may be calculated as 1.

또한, 본 발명의 일실시예에 따르면, 전자 장치(110)는 스프레드시트 상에서 상기 제1 셀과 상기 제2 셀 간의 유사도를 한눈에 파악할 수 있도록 색상 테이블 유지부(122) 및 배경 표시부(123)를 더 포함할 수 있다.In addition, according to an embodiment of the present invention, the electronic device 110 includes a color table holding unit 122 and a background display unit 123 so that the degree of similarity between the first cell and the second cell can be recognized at a glance on the spreadsheet. may further include.

색상 테이블 유지부(122)는 미리 정해진 서로 다른 복수의 색상들과 상기 복수의 색상들 각각에 대응하는 미리 정해진 서로 다른 유사도 측정 값에 대한 상한 값과 하한 값이 지정된 범위 값이 기록되어 있는 색상 테이블을 저장하여 유지한다.The color table maintaining unit 122 is a color table in which a plurality of predetermined different colors and a range value to which upper and lower limits are specified for different predetermined similarity measurement values corresponding to each of the plurality of colors are recorded. save and maintain

예컨대, 색상 테이블 유지부(122)는 하기의 표 2와 같이 색상 테이블을 저장하여 유지하고 있을 수 있다.For example, the color table maintenance unit 122 may store and maintain a color table as shown in Table 2 below.

복수의 색상들multiple colors 유사도 측정 값에 대한 범위 값Range values for similarity measures 빨간색Red 0 ~ 0.20 to 0.2 주황색Orange 0.2 ~ 0.40.2 to 0.4 노란색yellow 0.4 ~ 0.60.4 to 0.6 초록색green 0.6 ~ 0.80.6 to 0.8 파란색blue 0.8 ~ 10.8 to 1

배경 표시부(123)는 상기 유사도 측정 값이 상기 화면 상에 표시된 이후, 상기 사용자로부터 상기 유사도 측정 값에 따른 배경 표시 명령이 수신되면, 상기 색상 테이블로부터 상기 유사도 측정 값이 속해있는 제1 범위 값에 대응되어 기록되어 있는 제1 색상을 확인한 후, 상기 제1 셀의 배경과 상기 제2 셀의 배경을 상기 제1 색상으로 채워지도록 구성하여 상기 화면 상에 표시한다.When the background display unit 123 receives a background display command according to the similarity measurement value from the user after the similarity measurement value is displayed on the screen, the background display unit 123 sets the first range value to which the similarity measurement value belongs from the color table. After confirming the first color recorded in correspondence, the background of the first cell and the background of the second cell are configured to be filled with the first color and displayed on the screen.

예컨대, 앞서 설명한 예시와 같이, 유사도 측정 값 표시부(121)에 의해 상기 유사도 측정 값이 '0.81'로 산출되었다고 가정하자. 이때, 상기 유사도 측정 값인 '0.81'이 상기 화면 상에 표시된 이후, 상기 사용자로부터 상기 유사도 측정 값인 '0.81'에 따른 배경 표시 명령이 수신되면, 배경 표시부(123)는 상기 표 2와 같은 색상 테이블로부터 상기 유사도 측정 값인 '0.81'이 속해있는 제1 범위 값인 '0.8 ~ 1'에 대응되어 기록되어 있는 제1 색상인 '파란색'을 확인한 후, 상기 제1 셀의 배경과 상기 제2 셀의 배경을 상기 제1 색상인 '파란색'으로 채워지도록 구성하여 상기 화면 상에 표시할 수 있다.For example, as in the example described above, suppose that the similarity measurement value is calculated as '0.81' by the similarity measurement value display unit 121 . At this time, after the similarity measurement value '0.81' is displayed on the screen, when a background display command according to the similarity measurement value '0.81' is received from the user, the background display unit 123 displays the color table as shown in Table 2 above. After checking the first color 'blue' recorded in correspondence with the first range value '0.8 to 1' to which the similarity measurement value '0.81' belongs, the background of the first cell and the background of the second cell It can be configured to be filled with 'blue', which is the first color, and displayed on the screen.

도 4는 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법을 도시한 순서도이다.4 is a flowchart illustrating an operating method of an electronic device capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention.

단계(S410)에서는 사용자로부터 스프레드시트를 구성하는 복수의 셀들 중 줄바꿈이 되어 있지 않은 텍스트가 삽입되어 있는 제1 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기를 기초로 상기 텍스트를 문장 단위로 분리함으로써, 복수의 문장들을 생성한다.In step S410, when a line break command is received from the user for a first cell in which text without line breaks is inserted among a plurality of cells constituting the spreadsheet, the text is read based on a pre-built morpheme analyzer. A plurality of sentences are generated by separating the sentence into sentence units.

단계(S420)에서는 상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 제1 셀 내에서 상기 복수의 문장들을 세로로 정렬시킨다.In step S420, the plurality of sentences are vertically aligned in the first cell by breaking lines for each sentence.

단계(S430)에서는 상기 복수의 셀들 중 상기 제1 셀이 포함된 열을 구성하는 셀들의 가로 너비를 상기 복수의 문장들 각각의 길이 중 최대 길이에 매칭되도록 조정한다.In step S430, the horizontal width of the cells constituting the column including the first cell among the plurality of cells is adjusted to match the maximum length among the lengths of each of the plurality of sentences.

이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 복수의 셀들 중 상기 제1 셀이 포함된 행을 구성하는 셀들의 세로 너비를 상기 복수의 문장들의 개수와 미리 정해진 기준 세로 너비의 곱에 매칭되도록 조정하는 단계를 더 포함할 수 있다.In this case, according to an embodiment of the present invention, the operating method of the electronic device may determine the vertical width of the cells constituting the row including the first cell among the plurality of cells by the number of sentences and a predetermined reference height. A step of adjusting to match the product of the width may be further included.

또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 미리 정해진 복수의 문자들과 상기 복수의 문자들 각각에 대한 서로 다른 미리 정해진 인덱스 번호가 서로 대응되어 저장되어 있는 문자 정보 데이터베이스를 유지하는 단계, 상기 사용자로부터 상기 제1 셀과, 텍스트가 삽입되어 있는 또 다른 셀인 제2 셀 간의 유사도 측정 명령이 수신되면, 상기 제1 셀로부터 상기 제1 셀에 포함된 복수의 제1 문자들을 미리 정해진 제1 방향으로 순차적으로 추출하고, 상기 제2 셀로부터 상기 제2 셀에 포함된 복수의 제2 문자들을 상기 제1 방향으로 순차적으로 추출하는 단계, 상기 복수의 제1 문자들을 미리 정해진 문자 수 단위로 그룹화하여 복수의 제1 문자 그룹들을 생성하고, 상기 복수의 제2 문자들을 상기 문자 수 단위로 그룹화하여 복수의 제2 문자 그룹들을 생성하는 단계, 상기 문자 정보 데이터베이스로부터 상기 복수의 제1 문자들과 상기 복수의 제2 문자들에 대응되는 인덱스 번호들을 확인한 후, 상기 복수의 제1 문자 그룹들과 상기 복수의 제2 문자 그룹들을 구성하는 각 문자 그룹에 대해, 상기 각 문자 그룹에 포함된 문자들에 대응되는 인덱스 번호들의 총 합계를 연산하는 단계, 상기 복수의 제1 문자 그룹들에 대해, 상기 복수의 제1 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제1 특징 벡터를 생성하고, 상기 복수의 제2 문자 그룹들에 대해, 상기 복수의 제2 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제2 특징 벡터를 생성한 후, 상기 제1 특징 벡터와 상기 제2 특징 벡터 간의 벡터 유사도를 연산하는 단계, 상기 복수의 제1 문자 그룹들 각각에 대해, 상기 복수의 제1 문자 그룹들 각각에 포함된 문자들과 상기 복수의 제2 문자 그룹들 중 같은 순서에 있는 문자 그룹에 포함된 문자들 간의 최장 공통 부분 수열의 길이를 연산한 후, 상기 복수의 제1 문자 그룹들에 대해 연산된 LCS의 길이들의 평균 값을 0 이상 1 이하의 값으로 정규화하여 LCS 유사도로 연산하는 단계 및 상기 벡터 유사도와 상기 LCS 유사도를 기초로 상기 제1 셀과 상기 제2 셀 간의 유사도 측정 값을 산출하고, 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값을 화면 상에 표시하는 단계를 더 포함할 수 있다.In addition, according to an embodiment of the present invention, the operating method of the electronic device includes a character information database in which a plurality of predetermined characters and different predetermined index numbers for each of the plurality of characters are stored in correspondence with each other. and maintaining a plurality of first characters included in the first cell from the first cell when a similarity measuring command between the first cell and a second cell, which is another cell into which text is inserted, is received from the user. sequentially extracting a plurality of second characters included in the second cell from the second cell in a predetermined first direction, and sequentially extracting a plurality of second characters included in the second cell in the first direction; generating a plurality of first character groups by grouping the plurality of second characters by number, and generating a plurality of second character groups by grouping the plurality of second characters by the number of characters; After identifying characters and index numbers corresponding to the plurality of second characters, each character group constituting the plurality of first character groups and the plurality of second character groups is included in each character group. calculating a total sum of index numbers corresponding to the selected characters; a first step having, as a component, a total sum of index numbers calculated in each of the plurality of first character groups for the plurality of first character groups; A feature vector is generated, and a second feature vector having as a component a total sum of index numbers calculated for each of the plurality of second character groups for the plurality of second character groups is generated, and then the first feature vector is generated. calculating a vector similarity between the feature vector and the second feature vector; for each of the plurality of first character groups, characters included in each of the plurality of first character groups and the plurality of second character groups After calculating the length of the longest common subsequence among the characters included in the character groups in the same order among them, the average value of the LCS lengths calculated for the plurality of first character groups is 0 Calculating the LCS similarity by normalizing to a value greater than or equal to 1 and calculating a similarity measurement value between the first cell and the second cell based on the vector similarity and the LCS similarity, and calculating the similarity between the first cell and the second cell. The method may further include displaying the similarity measurement value between cells on a screen.

이때, 본 발명의 일실시예에 따르면, 상기 유사도 측정 값을 화면 상에 표시하는 단계는 상기 벡터 유사도에 미리 정해진 제1 가중치를 곱하고, 상기 LCS 유사도에 미리 정해진 제2 가중치를 곱하여 상기 벡터 유사도와 상기 LCS 유사도의 가중 평균 값을 연산한 후, 상기 가중 평균 값을 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값으로 산출할 수 있다.At this time, according to an embodiment of the present invention, the step of displaying the similarity measurement value on the screen is to multiply the vector similarity by a predetermined first weight, and multiply the LCS similarity by a predetermined second weight to determine the vector similarity and After calculating the weighted average value of the LCS similarities, the weighted average value may be calculated as the similarity measurement value between the first cell and the second cell.

이때, 본 발명의 일실시예에 따르면, 상기 제1 가중치와 상기 제2 가중치는 0 초과 1 미만의 값으로 구성되고, 상기 제1 가중치와 상기 제2 가중치의 합은 1로 연산될 수 있다.At this time, according to an embodiment of the present invention, the first weight and the second weight may be composed of a value greater than 0 and less than 1, and the sum of the first weight and the second weight may be calculated as 1.

또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 미리 정해진 서로 다른 복수의 색상들과 상기 복수의 색상들 각각에 대응하는 미리 정해진 서로 다른 유사도 측정 값에 대한 상한 값과 하한 값이 지정된 범위 값이 기록되어 있는 색상 테이블을 저장하여 유지하는 단계 및 상기 유사도 측정 값이 상기 화면 상에 표시된 이후, 상기 사용자로부터 상기 유사도 측정 값에 따른 배경 표시 명령이 수신되면, 상기 색상 테이블로부터 상기 유사도 측정 값이 속해있는 제1 범위 값에 대응되어 기록되어 있는 제1 색상을 확인한 후, 상기 제1 셀의 배경과 상기 제2 셀의 배경을 상기 제1 색상으로 채워지도록 구성하여 상기 화면 상에 표시하는 단계를 더 포함할 수 있다.In addition, according to an embodiment of the present invention, the operating method of the electronic device provides upper and lower limit values for a plurality of predetermined different colors and different predetermined similarity measurement values corresponding to each of the plurality of colors. After storing and maintaining the color table in which the designated range value is recorded and displaying the similarity measurement value on the screen, when a background display command according to the similarity measurement value is received from the user, the color table displays the color table. After checking the first color recorded in correspondence with the first range value to which the similarity measurement value belongs, the background of the first cell and the background of the second cell are configured to be filled with the first color, and displayed on the screen. A displaying step may be further included.

이상, 도 4를 참조하여 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법은 도 1을 이용하여 설명한 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.In the above, with reference to FIG. 4 , the operating method of an electronic device capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention has been described. Here, the operating method of an electronic device capable of breaking lines in sentence units on a spreadsheet according to an embodiment of the present invention relates to the operation of the electronic device 110 capable of breaking lines in sentence units on a spreadsheet described with reference to FIG. 1 . Since it may correspond to the configuration for, a more detailed description thereof will be omitted.

본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.A method of operating an electronic device capable of line breaking in units of sentences on a spreadsheet according to an embodiment of the present invention may be implemented as a computer program stored in a storage medium for execution through a combination with a computer.

또한, 본 발명의 일실시예에 따른 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.In addition, the operating method of an electronic device capable of breaking lines in sentence units on a spreadsheet according to an embodiment of the present invention may be implemented in the form of computer program instructions for execution through combination with a computer and recorded on a computer readable medium. have. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the medium may be those specially designed and configured for the present invention or those known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. - includes hardware devices specially configured to store and execute program instructions, such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language codes that can be executed by a computer using an interpreter, as well as machine language codes such as those produced by a compiler.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described by specific details such as specific components and limited embodiments and drawings, but these are provided to help a more general understanding of the present invention, and the present invention is not limited to the above embodiments. , Those skilled in the art in the field to which the present invention belongs can make various modifications and variations from these descriptions.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and it will be said that not only the claims to be described later, but also all modifications equivalent or equivalent to these claims belong to the scope of the present invention. .

110: 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치
111: 문장 생성부 112: 문장 줄바꿈부
113: 가로 너비 조정부 114: 세로 너비 조정부
115: 문자 정보 데이터베이스 116: 문자 추출부
117: 문자 그룹 생성부 118: 합계 연산부
119: 벡터 유사도 연산부 120: LCS 유사도 연산부
121: 유사도 측정 값 표시부 122: 색상 테이블 유지부
123: 배경 표시부
110: Electronic device capable of breaking lines in sentence units on a spreadsheet
111: sentence generation unit 112: sentence line break unit
113: horizontal width adjustment unit 114: vertical width adjustment unit
115: character information database 116: character extraction unit
117: character group generation unit 118: sum calculation unit
119: vector similarity calculation unit 120: LCS similarity calculation unit
121: similarity measurement value display unit 122: color table maintenance unit
123: background display unit

Claims (14)

미리 정해진 복수의 문자들과 상기 복수의 문자들 각각에 대한 서로 다른 미리 정해진 인덱스 번호가 서로 대응되어 저장되어 있는 문자 정보 데이터베이스;
사용자로부터 스프레드시트를 구성하는 복수의 셀들 중 줄바꿈이 되어 있지 않은 텍스트(Text)가 삽입되어 있는 제1 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기(Morphological Analyzer)를 기초로 상기 텍스트를 문장 단위로 분리함으로써, 복수의 문장들을 생성하는 문장 생성부;
상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 제1 셀 내에서 상기 복수의 문장들을 세로로 정렬시키는 문장 줄바꿈부;
상기 복수의 셀들 중 상기 제1 셀이 포함된 열을 구성하는 셀들의 가로 너비를 상기 복수의 문장들 각각의 길이 중 최대 길이에 매칭되도록 조정하는 가로 너비 조정부;
상기 사용자로부터 상기 제1 셀과, 텍스트가 삽입되어 있는 또 다른 셀인 제2 셀 간의 유사도 측정 명령이 수신되면, 상기 제1 셀로부터 상기 제1 셀에 포함된 복수의 제1 문자들을 미리 정해진 제1 방향으로 순차적으로 추출하고, 상기 제2 셀로부터 상기 제2 셀에 포함된 복수의 제2 문자들을 상기 제1 방향으로 순차적으로 추출하는 문자 추출부;
상기 복수의 제1 문자들을 미리 정해진 문자 수 단위로 그룹화하여 복수의 제1 문자 그룹들을 생성하고, 상기 복수의 제2 문자들을 상기 문자 수 단위로 그룹화하여 복수의 제2 문자 그룹들을 생성하는 문자 그룹 생성부;
상기 문자 정보 데이터베이스로부터 상기 복수의 제1 문자들과 상기 복수의 제2 문자들에 대응되는 인덱스 번호들을 확인한 후, 상기 복수의 제1 문자 그룹들과 상기 복수의 제2 문자 그룹들을 구성하는 각 문자 그룹에 대해, 상기 각 문자 그룹에 포함된 문자들에 대응되는 인덱스 번호들의 총 합계를 연산하는 합계 연산부;
상기 복수의 제1 문자 그룹들에 대해, 상기 복수의 제1 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제1 특징 벡터를 생성하고, 상기 복수의 제2 문자 그룹들에 대해, 상기 복수의 제2 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제2 특징 벡터를 생성한 후, 상기 제1 특징 벡터와 상기 제2 특징 벡터 간의 벡터 유사도를 연산하는 벡터 유사도 연산부;
상기 복수의 제1 문자 그룹들 각각에 대해, 상기 복수의 제1 문자 그룹들 각각에 포함된 문자들과 상기 복수의 제2 문자 그룹들 중 같은 순서에 있는 문자 그룹에 포함된 문자들 간의 최장 공통 부분 수열(Longest Common Subsequence: LCS)의 길이를 연산한 후, 상기 복수의 제1 문자 그룹들에 대해 연산된 LCS의 길이들의 평균 값을 0 이상 1 이하의 값으로 정규화하여 LCS 유사도로 연산하는 LCS 유사도 연산부; 및
상기 벡터 유사도와 상기 LCS 유사도를 기초로 상기 제1 셀과 상기 제2 셀 간의 유사도 측정 값을 산출하고, 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값을 화면 상에 표시하는 유사도 측정 값 표시부
를 포함하고,
상기 유사도 측정 값 표시부는
상기 벡터 유사도에 미리 정해진 제1 가중치를 곱하고, 상기 LCS 유사도에 미리 정해진 제2 가중치를 곱하여 상기 벡터 유사도와 상기 LCS 유사도의 가중 평균 값을 연산한 후, 상기 가중 평균 값을 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값으로 산출하는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치.
a character information database in which a plurality of predetermined characters and different predetermined index numbers for each of the plurality of characters are stored in correspondence with each other;
When a line break command is received from the user for a first cell in which text that is not line-wrapped is inserted among a plurality of cells constituting the spreadsheet, based on a pre-built Morphological Analyzer, a sentence generation unit generating a plurality of sentences by dividing the text into sentence units;
a sentence line breaking unit for vertically arranging the plurality of sentences within the first cell by breaking the plurality of sentences for each sentence;
a horizontal width adjusting unit for adjusting the horizontal width of the cells constituting the column including the first cell among the plurality of cells to match the maximum length of each of the plurality of sentences;
When a similarity measurement command between the first cell and a second cell, which is another cell into which text is inserted, is received from the user, a plurality of first characters included in the first cell is converted from the first cell into a predetermined first cell. a character extraction unit sequentially extracting a plurality of second characters included in the second cell from the second cell in the first direction;
A character group generating a plurality of first character groups by grouping the plurality of first characters in units of a predetermined number of characters, and generating a plurality of second character groups by grouping the plurality of second characters in units of the number of characters. generating unit;
After checking the index numbers corresponding to the plurality of first characters and the plurality of second characters from the character information database, each character constituting the plurality of first character groups and the plurality of second character groups a sum calculation unit for calculating a total sum of index numbers corresponding to characters included in each character group, for each group;
For the plurality of first character groups, a first feature vector having as a component a total sum of index numbers calculated for each of the plurality of first character groups is generated, and for the plurality of second character groups , Vector similarity of generating a second feature vector having as a component the total sum of index numbers calculated from each of the plurality of second character groups, and then calculating a vector similarity between the first feature vector and the second feature vector. calculation unit;
For each of the plurality of first character groups, the longest commonality between characters included in each of the plurality of first character groups and characters included in a character group in the same order among the plurality of second character groups After calculating the length of the longest common sequence (LCS), the LCS similarity is calculated by normalizing the average value of the LCS lengths calculated for the plurality of first character groups to a value of 0 or more and 1 or less. a similarity calculation unit; and
A similarity measurement value for calculating a similarity measurement value between the first cell and the second cell based on the vector similarity and the LCS similarity, and displaying the similarity measurement value between the first cell and the second cell on a screen. display part
including,
The similarity measurement value display unit
A weighted average value of the vector similarity and the LCS similarity is calculated by multiplying the vector similarity by a predetermined first weight and by multiplying the LCS similarity by a predetermined second weight, and then calculating the weighted average value between the first cell and the LCS similarity. An electronic device capable of breaking lines in sentence units on a spreadsheet calculated with the similarity measurement value between second cells.
제1항에 있어서,
상기 복수의 셀들 중 상기 제1 셀이 포함된 행을 구성하는 셀들의 세로 너비를 상기 복수의 문장들의 개수와 미리 정해진(predetermined) 기준 세로 너비의 곱에 매칭되도록 조정하는 세로 너비 조정부
를 더 포함하는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치.
According to claim 1,
A vertical width adjusting unit that adjusts the vertical width of the cells constituting the row including the first cell among the plurality of cells to match the product of the number of sentences and a predetermined standard vertical width.
An electronic device capable of breaking lines in units of sentences on a spreadsheet further comprising.
삭제delete 삭제delete 제1항에 있어서,
상기 제1 가중치와 상기 제2 가중치는 0 초과 1 미만의 값으로 구성되고, 상기 제1 가중치와 상기 제2 가중치의 합은 1로 연산되는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치.
According to claim 1,
The electronic device capable of breaking lines in sentence units on a spreadsheet in which the first weight and the second weight are composed of values greater than 0 and less than 1, and the sum of the first weight and the second weight is calculated as 1.
제1항에 있어서,
미리 정해진 서로 다른 복수의 색상들과 상기 복수의 색상들 각각에 대응하는 미리 정해진 서로 다른 유사도 측정 값에 대한 상한 값과 하한 값이 지정된 범위 값이 기록되어 있는 색상 테이블을 저장하여 유지하는 색상 테이블 유지부; 및
상기 유사도 측정 값이 상기 화면 상에 표시된 이후, 상기 사용자로부터 상기 유사도 측정 값에 따른 배경 표시 명령이 수신되면, 상기 색상 테이블로부터 상기 유사도 측정 값이 속해있는 제1 범위 값에 대응되어 기록되어 있는 제1 색상을 확인한 후, 상기 제1 셀의 배경과 상기 제2 셀의 배경을 상기 제1 색상으로 채워지도록 구성하여 상기 화면 상에 표시하는 배경 표시부
를 더 포함하는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치.
According to claim 1,
Maintaining a color table that stores and maintains a color table in which a plurality of different predetermined colors and range values in which upper and lower limits are designated for different predetermined similarity measurement values corresponding to each of the plurality of colors are recorded wealth; and
After the similarity measurement value is displayed on the screen, if a command to display a background according to the similarity measurement value is received from the user, the first range value to which the similarity measurement value belongs is recorded from the color table. After confirming one color, the background display unit configures the background of the first cell and the background of the second cell to be filled with the first color and displays the background on the screen.
An electronic device capable of breaking lines in units of sentences on a spreadsheet further comprising.
미리 정해진 복수의 문자들과 상기 복수의 문자들 각각에 대한 서로 다른 미리 정해진 인덱스 번호가 서로 대응되어 저장되어 있는 문자 정보 데이터베이스를 유지하는 단계;
사용자로부터 스프레드시트를 구성하는 복수의 셀들 중 줄바꿈이 되어 있지 않은 텍스트(Text)가 삽입되어 있는 제1 셀에 대해 줄바꿈 명령이 수신되면, 미리 구축되어 있는 형태소 분석기(Morphological Analyzer)를 기초로 상기 텍스트를 문장 단위로 분리함으로써, 복수의 문장들을 생성하는 단계;
상기 복수의 문장들을 각 문장별로 줄바꿈함으로써, 상기 제1 셀 내에서 상기 복수의 문장들을 세로로 정렬시키는 단계;
상기 복수의 셀들 중 상기 제1 셀이 포함된 열을 구성하는 셀들의 가로 너비를 상기 복수의 문장들 각각의 길이 중 최대 길이에 매칭되도록 조정하는 단계;
상기 사용자로부터 상기 제1 셀과, 텍스트가 삽입되어 있는 또 다른 셀인 제2 셀 간의 유사도 측정 명령이 수신되면, 상기 제1 셀로부터 상기 제1 셀에 포함된 복수의 제1 문자들을 미리 정해진 제1 방향으로 순차적으로 추출하고, 상기 제2 셀로부터 상기 제2 셀에 포함된 복수의 제2 문자들을 상기 제1 방향으로 순차적으로 추출하는 단계;
상기 복수의 제1 문자들을 미리 정해진 문자 수 단위로 그룹화하여 복수의 제1 문자 그룹들을 생성하고, 상기 복수의 제2 문자들을 상기 문자 수 단위로 그룹화하여 복수의 제2 문자 그룹들을 생성하는 단계;
상기 문자 정보 데이터베이스로부터 상기 복수의 제1 문자들과 상기 복수의 제2 문자들에 대응되는 인덱스 번호들을 확인한 후, 상기 복수의 제1 문자 그룹들과 상기 복수의 제2 문자 그룹들을 구성하는 각 문자 그룹에 대해, 상기 각 문자 그룹에 포함된 문자들에 대응되는 인덱스 번호들의 총 합계를 연산하는 단계;
상기 복수의 제1 문자 그룹들에 대해, 상기 복수의 제1 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제1 특징 벡터를 생성하고, 상기 복수의 제2 문자 그룹들에 대해, 상기 복수의 제2 문자 그룹들 각각에서 연산된 인덱스 번호들의 총 합계를 성분으로 갖는 제2 특징 벡터를 생성한 후, 상기 제1 특징 벡터와 상기 제2 특징 벡터 간의 벡터 유사도를 연산하는 단계;
상기 복수의 제1 문자 그룹들 각각에 대해, 상기 복수의 제1 문자 그룹들 각각에 포함된 문자들과 상기 복수의 제2 문자 그룹들 중 같은 순서에 있는 문자 그룹에 포함된 문자들 간의 최장 공통 부분 수열(Longest Common Subsequence: LCS)의 길이를 연산한 후, 상기 복수의 제1 문자 그룹들에 대해 연산된 LCS의 길이들의 평균 값을 0 이상 1 이하의 값으로 정규화하여 LCS 유사도로 연산하는 단계; 및
상기 벡터 유사도와 상기 LCS 유사도를 기초로 상기 제1 셀과 상기 제2 셀 간의 유사도 측정 값을 산출하고, 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값을 화면 상에 표시하는 단계
를 포함하고,
상기 유사도 측정 값을 화면 상에 표시하는 단계는
상기 벡터 유사도에 미리 정해진 제1 가중치를 곱하고, 상기 LCS 유사도에 미리 정해진 제2 가중치를 곱하여 상기 벡터 유사도와 상기 LCS 유사도의 가중 평균 값을 연산한 후, 상기 가중 평균 값을 상기 제1 셀과 상기 제2 셀 간의 상기 유사도 측정 값으로 산출하는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법.
maintaining a character information database in which a plurality of predetermined characters and different predetermined index numbers corresponding to each other are stored;
When a line break command is received from the user for a first cell in which text that is not line-wrapped is inserted among a plurality of cells constituting the spreadsheet, based on a pre-built Morphological Analyzer, generating a plurality of sentences by dividing the text into sentence units;
arranging the plurality of sentences vertically in the first cell by breaking lines for each sentence;
adjusting a horizontal width of cells constituting a column including the first cell among the plurality of cells to match a maximum length among lengths of each of the plurality of sentences;
When a similarity measurement command between the first cell and a second cell, which is another cell into which text is inserted, is received from the user, a plurality of first characters included in the first cell is converted from the first cell into a predetermined first cell. sequentially extracting in the first direction, and sequentially extracting a plurality of second characters included in the second cell from the second cell in the first direction;
generating a plurality of first character groups by grouping the plurality of first characters by a predetermined number of characters, and generating a plurality of second character groups by grouping the plurality of second characters by the number of characters;
After checking the index numbers corresponding to the plurality of first characters and the plurality of second characters from the character information database, each character constituting the plurality of first character groups and the plurality of second character groups calculating a total sum of index numbers corresponding to characters included in each character group, for each group;
For the plurality of first character groups, a first feature vector having as a component a total sum of index numbers calculated for each of the plurality of first character groups is generated, and for the plurality of second character groups After generating a second feature vector having as a component the total sum of index numbers calculated from each of the plurality of second character groups, calculating a vector similarity between the first feature vector and the second feature vector;
For each of the plurality of first character groups, the longest commonality between characters included in each of the plurality of first character groups and characters included in a character group in the same order among the plurality of second character groups After calculating the length of the longest common sequence (LCS), calculating the LCS similarity by normalizing the average value of the lengths of the LCS calculated for the plurality of first character groups to a value greater than or equal to 0 and less than or equal to 1 ; and
Calculating a similarity measurement value between the first cell and the second cell based on the vector similarity and the LCS similarity, and displaying the similarity measurement value between the first cell and the second cell on a screen
including,
Displaying the similarity measurement value on the screen
A weighted average value of the vector similarity and the LCS similarity is calculated by multiplying the vector similarity by a predetermined first weight and by multiplying the LCS similarity by a predetermined second weight, and then calculating the weighted average value between the first cell and the LCS similarity. A method of operating an electronic device capable of breaking lines in sentence units on a spreadsheet calculated with the similarity measurement value between second cells.
제7항에 있어서,
상기 복수의 셀들 중 상기 제1 셀이 포함된 행을 구성하는 셀들의 세로 너비를 상기 복수의 문장들의 개수와 미리 정해진(predetermined) 기준 세로 너비의 곱에 매칭되도록 조정하는 단계
를 더 포함하는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법.
According to claim 7,
Adjusting the vertical width of cells constituting a row including the first cell among the plurality of cells to match the product of the number of sentences and a predetermined reference vertical width
A method of operating an electronic device capable of line breaking in units of sentences on a spreadsheet further comprising:
삭제delete 삭제delete 제7항에 있어서,
상기 제1 가중치와 상기 제2 가중치는 0 초과 1 미만의 값으로 구성되고, 상기 제1 가중치와 상기 제2 가중치의 합은 1로 연산되는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법.
According to claim 7,
The first weight and the second weight are composed of values greater than 0 and less than 1, and the sum of the first weight and the second weight is calculated as 1. Operation of an electronic device capable of breaking lines in sentence units on a spreadsheet. Way.
제7항에 있어서,
미리 정해진 서로 다른 복수의 색상들과 상기 복수의 색상들 각각에 대응하는 미리 정해진 서로 다른 유사도 측정 값에 대한 상한 값과 하한 값이 지정된 범위 값이 기록되어 있는 색상 테이블을 저장하여 유지하는 단계; 및
상기 유사도 측정 값이 상기 화면 상에 표시된 이후, 상기 사용자로부터 상기 유사도 측정 값에 따른 배경 표시 명령이 수신되면, 상기 색상 테이블로부터 상기 유사도 측정 값이 속해있는 제1 범위 값에 대응되어 기록되어 있는 제1 색상을 확인한 후, 상기 제1 셀의 배경과 상기 제2 셀의 배경을 상기 제1 색상으로 채워지도록 구성하여 상기 화면 상에 표시하는 단계
를 더 포함하는 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치의 동작 방법.
According to claim 7,
Storing and maintaining a color table in which a plurality of predetermined different colors and range values to which upper and lower limits are designated for different predetermined similarity measurement values corresponding to each of the plurality of colors are recorded; and
After the similarity measurement value is displayed on the screen, if a command to display a background according to the similarity measurement value is received from the user, the first range value to which the similarity measurement value belongs is recorded from the color table. After confirming 1 color, configuring the background of the first cell and the background of the second cell to be filled with the first color and displaying the background on the screen
A method of operating an electronic device capable of line breaking in units of sentences on a spreadsheet further comprising:
제7항, 제8항, 제11항 또는 제12항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.Claim 7, claim 8, claim 11 or claim 12 of any one of the method through a combination with a computer to execute a computer program recorded on a computer-readable recording medium. 제7항, 제8항, 제11항 또는 제12항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.A computer program stored in a storage medium for executing the method of any one of claims 7, 8, 11 or 12 through a combination with a computer.
KR1020200056907A 2020-05-13 2020-05-13 Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof KR102466701B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200056907A KR102466701B1 (en) 2020-05-13 2020-05-13 Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200056907A KR102466701B1 (en) 2020-05-13 2020-05-13 Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof

Publications (2)

Publication Number Publication Date
KR20210138894A KR20210138894A (en) 2021-11-22
KR102466701B1 true KR102466701B1 (en) 2022-11-15

Family

ID=78717812

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200056907A KR102466701B1 (en) 2020-05-13 2020-05-13 Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof

Country Status (1)

Country Link
KR (1) KR102466701B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102466719B1 (en) * 2020-10-13 2022-11-15 주식회사 한글과컴퓨터 Electronic devices that support natural pasting of copied text from pdf documents into electronic documents and the operating method thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017062580A (en) 2015-09-24 2017-03-30 富士通株式会社 Common information output method, device and program, and route graph generation method
KR102187554B1 (en) 2019-08-27 2020-12-07 주식회사 한글과컴퓨터 Electronic device capable of measuring the similarity between two areas specified on a spreadsheet and operating method thereof
KR102287149B1 (en) 2019-09-19 2021-08-06 주식회사 한글과컴퓨터 Electronic device that displays a separation line of a paragraph based on text line information in a pdf document and operating method thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102004831B1 (en) * 2012-10-25 2019-07-29 에스케이텔레콤 주식회사 Method for sentence evaluation using similar of sentence, apparatus thereof and computer recordable medium storing the method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017062580A (en) 2015-09-24 2017-03-30 富士通株式会社 Common information output method, device and program, and route graph generation method
KR102187554B1 (en) 2019-08-27 2020-12-07 주식회사 한글과컴퓨터 Electronic device capable of measuring the similarity between two areas specified on a spreadsheet and operating method thereof
KR102287149B1 (en) 2019-09-19 2021-08-06 주식회사 한글과컴퓨터 Electronic device that displays a separation line of a paragraph based on text line information in a pdf document and operating method thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
it is, "엑셀 입력값에 따른 셀 색 다르게 채우기." [Online], [URL: https://juke.tistory.com/100]*
yourjune, "엑셀에서 줄 내림(줄 바꿈) 하는 방법 세 가지." [Online], [URL: https://yourjune.tistory.com/1025]*

Also Published As

Publication number Publication date
KR20210138894A (en) 2021-11-22

Similar Documents

Publication Publication Date Title
JP2007004633A (en) Language model generation device and language processing device using language model generated by the same
US20140212040A1 (en) Document Alteration Based on Native Text Analysis and OCR
KR102287149B1 (en) Electronic device that displays a separation line of a paragraph based on text line information in a pdf document and operating method thereof
EP3029567B1 (en) Method and device for updating input method system, computer storage medium, and device
US20050131931A1 (en) Abstract generation method and program product
US11704484B2 (en) Cross channel digital data parsing and generation system
CN110222331A (en) Lie recognition methods and device, storage medium, computer equipment
KR102187550B1 (en) Electronic device that can generate a summary preview of an ole object inserted into a document and operating method thereof
KR102466701B1 (en) Electronic device capable of line break in sentence unit on spreadsheet and operating method thereof
CN110297932B (en) Method and device for determining maximum inscribed circle of closed graph in vector diagram and electronic equipment
KR102187554B1 (en) Electronic device capable of measuring the similarity between two areas specified on a spreadsheet and operating method thereof
JP2005031259A (en) Natural language processing method
KR102375507B1 (en) Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof
KR102300437B1 (en) Electronic document editing apparatus that enables the insertion of special characters at specific locations on the electronic document based on the entered characters and operating method thereof
KR102053076B1 (en) Document editing apparatus capable of applying styles based on emotion analysis and operating method thereof
JP2010102564A (en) Emotion specifying device, emotion specification method, program, and recording medium
KR20200110880A (en) Electronic device for selecting important keywords for documents based on style attributes and operating method thereof
KR20210060808A (en) Document editing device to check whether the font applied to the document is a supported font and operating method thereof
US20040139056A1 (en) Information display control apparatus and recording medium having recorded information display control program
KR20210126908A (en) Document editing device that enables display of a document to which a font in unsupported data format is applied and operating method thereof
KR102545262B1 (en) Electronic terminal apparatus for providing information of the associated documents which are associated with the particular document based on simultaneous usage criteria and operating method thereof
KR102500730B1 (en) Electronic apparatus that provides a translation function that maintains the style information of the sentence and operating method thereof
KR102466706B1 (en) Electronic device that enables easy selection of dependent edit action in document editing programs and operating method thereof
KR102300457B1 (en) Electronic device that supports efficient typing practice by presenting words by level according to phoneme classification and operating method thereof
KR102215613B1 (en) Electronic device that enables text retrieval based on the language that makes up text inserted in a document and operating method thereof

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant