KR102466719B1 - Pdf 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법 - Google Patents

Pdf 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법 Download PDF

Info

Publication number
KR102466719B1
KR102466719B1 KR1020200131875A KR20200131875A KR102466719B1 KR 102466719 B1 KR102466719 B1 KR 102466719B1 KR 1020200131875 A KR1020200131875 A KR 1020200131875A KR 20200131875 A KR20200131875 A KR 20200131875A KR 102466719 B1 KR102466719 B1 KR 102466719B1
Authority
KR
South Korea
Prior art keywords
point
text
electronic document
line
font
Prior art date
Application number
KR1020200131875A
Other languages
English (en)
Other versions
KR20220048688A (ko
Inventor
안치연
김준현
유진석
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Priority to KR1020200131875A priority Critical patent/KR102466719B1/ko
Publication of KR20220048688A publication Critical patent/KR20220048688A/ko
Application granted granted Critical
Publication of KR102466719B1 publication Critical patent/KR102466719B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/191Automatic line break hyphenation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법이 개시된다. 본 발명은 사용자에 의해 PDF 문서에서 복사된 텍스트에 대한 전자 문서로의 붙여넣기 명령이 인가되면, 상기 복사된 텍스트를 상기 전자 문서에 자연스럽게 보정하여 붙여넣기함으로써, 상기 사용자가 상기 전자 문서에 붙여넣기 된 텍스트를 재편집할 필요가 없도록 지원하는 전자 장치 및 그 동작 방법에 대한 것이다.

Description

PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법{ELECTRONIC DEVICES THAT SUPPORT NATURAL PASTING OF COPIED TEXT FROM PDF DOCUMENTS INTO ELECTRONIC DOCUMENTS AND THE OPERATING METHOD THEREOF}
본 발명은 PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법에 대한 것이다.
최근, 컴퓨터나 스마트폰 또는 태블릿 PC 등이 널리 보급됨에 따라, 이러한 단말 기기를 이용하여 전자 문서를 열람, 작성, 편집할 수 있도록 하는 다양한 종류의 전자 문서 관련 프로그램들이 출시되고 있다.
이러한 전자 문서 관련 프로그램들로는 기본적인 문서의 작성, 편집 등을 지원하는 워드프로세서, 데이터의 입력, 산술연산, 데이터 관리를 보조하는 스프레드시트, 발표자의 발표를 보조하기 위한 프레젠테이션 프로그램들이 있다.
이렇게, 다양한 전자 문서 관련 프로그램들이 출시되고 있고, 사용자들이 전자 단말 기기를 이용하여 전자 문서를 열람, 작성, 편집을 수행하는 횟수가 증가함에 따라, 다양한 종류의 포맷을 갖는 전자 문서들이 등장하고 있다.
이러한 다양한 종류의 포맷을 갖는 전자 문서들 중 PDF(Portable Document Format) 문서는 대부분의 운영체제에서 호환될 수 있는 높은 호환성을 가지고 있고, 원본 문서의 글꼴, 이미지, 그래픽, 문서 형태 등이 그대로 유지될 수 있기 때문에 사람들에게 널리 사용되고 있다.
하지만, PDF 문서의 경우, 사용자가 PDF 문서의 내용을 복사하여 hwp, docx 등의 포맷을 갖는 다른 전자 문서에 붙여넣기 하면, PDF 문서의 원본 형태와 다르게 문장의 연결성이 깨지는 형태로 내용이 전자 문서에 붙여넣기 되는 문제가 발생할 수 있다.
관련해서, 사용자가 PDF 문서로부터 소정의 텍스트를 복사하여 다른 전자 문서에 붙여넣기를 하는 경우, 도 2에 도시된 그림과 같이, 문장이 마무리되는 지점이 아닌, '최근, 세계화 시대에 맞춰 다양한 언어로 작성된 문서들을 인터넷을'이라고 하는 문장의 중간 지점에서 줄바꿈이 되는 문제가 발생할 수 있다.
이러한 문제로 인해, 사용자는 문장의 연결성이 깨지는 부분들을 직접 일일이 찾아가면서 보정을 해야 하는 번거로운 작업을 해야 할 필요가 있다.
따라서, 사용자가 PDF 문서의 내용을 복사하여 다른 전자 문서에 붙여넣기할 때, 문장의 연결성이 깨지는 부분없이, 자연스러운 붙여넣기가 될 수 있도록 지원하는 기술에 대한 연구가 필요하다.
본 발명에 따른 전자 장치 및 그 동작 방법은 사용자에 의해 PDF 문서에서 복사된 텍스트에 대한 전자 문서로의 붙여넣기 명령이 인가되면, 상기 복사된 텍스트를 상기 전자 문서에 자연스럽게 보정하여 붙여넣기함으로써, 상기 사용자가 상기 전자 문서에 붙여넣기 된 텍스트를 재편집할 필요가 없도록 지원하고자 한다.
본 발명의 일실시예에 따른 PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치는 사용자에 의해 PDF(Portable Document Format) 문서에서 복사된 제1 텍스트가 전자 문서에 붙여넣기가 되도록 하는 붙여넣기 명령이 인가되면, 상기 전자 문서에 상기 제1 텍스트를 삽입하는 삽입부, 상기 전자 문서에 상기 제1 텍스트가 삽입되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 줄바꿈이 되어 있는 적어도 하나의 제1 지점을 추출하는 줄바꿈 지점 추출부, 상기 적어도 하나의 제1 지점이 추출되면, 상기 적어도 하나의 제1 지점에 사전 설정된 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는지를 확인하는 종료 부호 확인부, 상기 적어도 하나의 제1 지점 중 적어도 하나의 제2 지점에서 상기 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제1 지점 중 상기 적어도 하나의 제2 지점을 제외한 나머지 지점인 적어도 하나의 제3 지점을 확인한 후, 상기 적어도 하나의 제2 지점에 설정되어 있는 줄바꿈은 유지하면서, 상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈을 제거하는 줄바꿈 제거부를 포함한다.
또한, 본 발명의 일실시예에 따른 PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치의 동작 방법은 사용자에 의해 PDF(Portable Document Format) 문서에서 복사된 제1 텍스트가 전자 문서에 붙여넣기가 되도록 하는 붙여넣기 명령이 인가되면, 상기 전자 문서에 상기 제1 텍스트를 삽입하는 단계, 상기 전자 문서에 상기 제1 텍스트가 삽입되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 줄바꿈이 되어 있는 적어도 하나의 제1 지점을 추출하는 단계, 상기 적어도 하나의 제1 지점이 추출되면, 상기 적어도 하나의 제1 지점에 사전 설정된 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는지를 확인하는 단계, 상기 적어도 하나의 제1 지점 중 적어도 하나의 제2 지점에서 상기 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제1 지점 중 상기 적어도 하나의 제2 지점을 제외한 나머지 지점인 적어도 하나의 제3 지점을 확인한 후, 상기 적어도 하나의 제2 지점에 설정되어 있는 줄바꿈은 유지하면서, 상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈을 제거하는 단계를 포함한다.
본 발명에 따른 전자 장치 및 그 동작 방법은 사용자에 의해 PDF 문서에서 복사된 텍스트에 대한 전자 문서로의 붙여넣기 명령이 인가되면, 상기 복사된 텍스트를 상기 전자 문서에 자연스럽게 보정하여 붙여넣기함으로써, 상기 사용자가 상기 전자 문서에 붙여넣기 된 텍스트를 재편집할 필요가 없도록 지원할 수 있다.
도 1은 본 발명의 일실시예에 따른 전자 장치의 구조를 도시한 도면이다.
도 2 내지 도 7은 본 발명의 일실시예에 따른 전자 장치를 설명하기 위한 도면이다.
도 8은 본 발명의 일실시예에 따른 전자 장치의 동작 방법을 도시한 순서도이다.
이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다.
한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.
도 1은 본 발명의 일실시예에 따른 PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치의 구조를 도시한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 전자 장치(110)는 삽입부(111), 줄바꿈 지점 추출부(112), 종료 부호 확인부(113) 및 줄바꿈 제거부(114)를 포함한다.
삽입부(111)는 사용자에 의해 PDF(Portable Document Format) 문서에서 복사된 제1 텍스트가 전자 문서에 붙여넣기가 되도록 하는 붙여넣기 명령이 인가되면, 상기 전자 문서에 상기 제1 텍스트를 삽입한다.
예컨대, 사용자에 의해 PDF 문서에서 복사된 제1 텍스트(210)가 상기 전자 문서에 붙여넣기가 되도록 하는 붙여넣기 명령이 인가되면, 삽입부(111)는 도 2에 도시된 그림과 같이, 상기 전자 문서에 제1 텍스트(210)를 삽입할 수 있다.
이때, 본 발명의 일실시예에 따르면, 삽입부(111)는 벡터 저장부(119), 문자 그룹 저장부(120), 폰트 벡터 생성부(121), 텍스트 벡터 생성부(122) 및 폰트 적용 삽입부(123)를 포함할 수 있다.
벡터 저장부(119)에는 복수의 문자들 각각에 대응되는 사전 설정된 원-핫(One-Hot) 벡터가 저장되어 있다.
예컨대, 벡터 저장부(119)에는 하기의 표 1과 같이, 상기 복수의 문자들 각각에 대응되는 사전 설정된 원-핫 벡터가 저장되어 있을 수 있다.
복수의 문자들 원-핫 벡터
[1 0 0 0 0 0 ...]
[0 1 0 0 0 0 ...]
[0 0 1 0 0 0 ...]
[0 0 0 1 0 0 ...]
[0 0 0 0 1 0 ...]
[0 0 0 0 0 1 ...]
... ...
문자 그룹 저장부(120)에는 복수의 폰트 데이터들과 상기 복수의 폰트 데이터들 각각에 대응되는 것으로 사전 설정된 문자 그룹에 대한 정보가 저장되어 있다.
여기서, 상기 문자 그룹은 상기 복수의 문자들 중에서 선택된 둘 이상의 문자들로 구성된 그룹을 의미한다.
예컨대, 문자 그룹 저장부(120)에는 하기의 표 2와 같이, 상기 복수의 폰트 데이터들과 상기 복수의 폰트 데이터들 각각에 대응되는 것으로 사전 설정된 문자 그룹에 대한 정보가 저장되어 있을 수 있다.
복수의 폰트 데이터들 문자 그룹
명조체 (가, 나, 다, 라, ...)
고딕체 (나, 마, 바, ...)
바탕체 (특, 상, 디, ...)
궁서체 (문, 서, 외, 배, ...)
돋움체 (지, 통, 내, ...)
굴림체 (경, 세, 최, 맞, ...)
... ...
관련해서, 개발자는 상기 복수의 폰트 데이터들 각각에 대응되는 문자 그룹을 지정할 때, 각 폰트 데이터에 어울릴 것으로 예상되는 문자들을 선택하여 각 폰트 데이터에 대응되는 문자 그룹으로 미리 지정해 둘 수 있다. 예컨대, '명조체'에 어울리는 문자들이 '가, 나, 다, 라, ...'라고 하는 경우, 관리자는 상기 표 2에 나타낸 바와 같이, '명조체'에 대한 폰트 데이터에 대해서 '가, 나, 다, 라, ...'라고 하는 문자들로 구성된 문자 그룹을 지정해서 문자 그룹 저장부(120) 상에 저장해 둘 수 있다. 이러한 방식으로, 개발자는 상기 복수의 폰트 데이터들 각각에 대해 각 폰트 데이터에 어울리는 것으로 판단되는 문자 그룹을 지정해서 문자 그룹 저장부(120) 상에 저장해 둘 수 있다.
폰트 벡터 생성부(121)는 상기 사용자에 의해 상기 전자 문서에 상기 PDF 문서로부터 복사된 상기 제1 텍스트(210)에 대한 붙여넣기 명령이 인가되면, 벡터 저장부(119)와 문자 그룹 저장부(120)를 참조하여 상기 복수의 폰트 데이터들 각각에 대해, 각 폰트 데이터에 대응되는 문자 그룹에 포함된 문자들에 대한 원-핫 벡터를 모두 합산함으로써, 상기 복수의 폰트 데이터들 각각에 대응되는 폰트 벡터를 생성한다.
예컨대, 폰트 벡터 생성부(121)가 상기 표 2에서 '명조체'에 대응되는 폰트 벡터를 생성한다고 하는 경우, 폰트 벡터 생성부(121)는 '명조체'라는 폰트 데이터에 대응되는 문자 그룹인 '(가, 나, 다, 라, ...)'에 포함된 문자들에 대한 원-핫 벡터를 벡터 저장부(119)로부터 확인한 후 해당 문자들에 대한 원-핫 벡터를 모두 합산함으로써, '명조체'라는 폰트 데이터에 대응되는 폰트 벡터를 생성할 수 있다. 이러한 방식으로, 폰트 벡터 생성부(121)는 문자 그룹 저장부(120)에 저장되어 있는 상기 복수의 폰트 데이터들 각각에 대응되는 폰트 벡터를 생성할 수 있다.
텍스트 벡터 생성부(122)는 벡터 저장부(119)를 참조하여 상기 제1 텍스트(210)를 구성하는 문자들 각각에 대응되는 원-핫 벡터를 모두 합산함으로써, 상기 제1 텍스트(210)에 대응되는 제1 텍스트 벡터를 생성한다.
관련해서, 텍스트 벡터 생성부(122)는 상기 표 1과 같은 벡터 저장부(119)에 저장되어 있는 상기 복수의 문자들 각각에 대응되는 사전 설정된 원-핫 벡터를 참조하여, 제1 텍스트(210)를 구성하는 문자들 각각에 대응되는 원-핫 벡터를 모두 합산함으로써, 제1 텍스트(210)에 대응되는 제1 텍스트 벡터를 생성할 수 있다.
폰트 적용 삽입부(123)는 상기 복수의 폰트 데이터들 중 상기 제1 텍스트 벡터와의 코사인 유사도가 최대인 폰트 벡터를 갖는 제1 폰트 데이터를 선택하고, 상기 제1 폰트 데이터를 기초로 상기 제1 텍스트(210)의 폰트를 상기 제1 폰트 데이터에 따른 폰트로 적용한 후 상기 제1 텍스트(210)를 상기 전자 문서에 삽입한다.
여기서, 코사인 유사도란 하기의 수학식 1에 따라 연산될 수 있는 두 벡터 간의 유사도를 의미한다.
Figure 112020107911397-pat00001
여기서, S는 벡터 A와 B 사이의 코사인 유사도로 -1에서 1사이의 값을 가지며, 그 값이 클수록 유사한 벡터임을 의미하고, Ai는 벡터 A의 i번째 성분, Bi는 벡터 B의 i번째 성분을 의미한다.
예컨대, 상기 복수의 폰트 데이터들 중 상기 제1 텍스트 벡터와의 코사인 유사도가 최대인 폰트 벡터를 갖는 제1 폰트 데이터가 '명조체'에 대한 폰트 데이터라고 하는 경우, 폰트 적용 삽입부(123)는 상기 복수의 폰트 데이터들 중 상기 제1 텍스트 벡터와 코사인 유사도가 최대인 폰트 벡터를 갖는 제1 폰트 데이터인 '명조체'에 대한 폰트 데이터를 선택하고, 상기 제1 폰트 데이터인 '명조체'에 대한 폰트 데이터를 기초로 상기 제1 텍스트(210)의 폰트를 상기 제1 폰트 데이터에 따른 '명조체'로 적용한 후, 상기 제1 텍스트(210)를 상기 전자 문서에 삽입할 수 있다.
즉, 상기 표 2와 같은 문자 그룹 저장부(120)에 저장되어 있는 상기 복수의 폰트 데이터들 중 상기 제1 텍스트 벡터와의 코사인 유사도가 최대인 폰트 벡터를 갖는 제1 폰트 데이터가 '명조체'라는 의미는 상기 제1 텍스트(210)에서 '명조체'에 대한 폰트 데이터에 대응되는 문자 그룹에 포함된 문자들이 많이 등장하는 경우라고 볼 수 있고, 이는 상기 제1 텍스트(210)의 폰트를 '명조체'로 적용되는 것이 상기 표 2와 같은 문자 그룹 저장부(120)를 구성한 개발자의 의도를 반영하는 가장 어울리는 상황이라고 볼 수 있기 때문에, 폰트 적용 삽입부(123)는 상기 제1 텍스트(210)의 폰트를 '명조체'라고 하는 상기 제1 폰트 데이터에 따른 폰트로 적용한 후 상기 전자 문서에 삽입할 수 있다.
이렇게, 삽입부(111)를 통해 상기 전자 문서에 상기 제1 텍스트(210)가 삽입되면, 줄바꿈 지점 추출부(112)는 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 줄바꿈이 되어 있는 적어도 하나의 제1 지점을 추출한다.
여기서, 줄바꿈이란 전자 문서에서 특정 지점에 사용자가 엔터키와 같은 줄바꿈 키를 누르게 되면, 해당 지점이 다음 행으로 이동하게 되는데, 이렇게 줄바꿈 키가 눌러짐으로 인해 특정 지점이 다음 행으로 이동된 상태를 의미한다.
관련해서, 도 3에 도시된 그림과 같이, 삽입부(111)를 통해 상기 전자 문서에 제1 텍스트(210)가 삽입되면, 줄바꿈 지점 추출부(112)는 상기 전자 문서에 삽입된 제1 텍스트(210)에서 줄바꿈이 되어 있는 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216)을 추출할 수 있다. 참고로, 도 3의 예시에서, 두 번째 줄과 세 번째 줄에 존재하는 '1) 예컨대,'와 '다운로드받을 수' 부분은 줄바꿈이 되어 있는 것이 아니라, 하나의 줄로 구성된 문장으로서, 전자 문서의 표시 영역의 한계로 인해 줄이 변경되어 있는 것으로 보이는 부분일 뿐이다.
종료 부호 확인부(113)는 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216)이 추출되면, 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216)에 사전 설정된 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는지를 확인한다.
여기서, 문장 종료 부호란 '.', '?', '!' 등과 같은 문장 종료시 사용되는 부호를 의미한다.
줄바꿈 제거부(114)는 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216) 중 적어도 하나의 제2 지점에서 상기 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216) 중 상기 적어도 하나의 제2 지점을 제외한 나머지 지점인 적어도 하나의 제3 지점을 확인한 후, 상기 적어도 하나의 제2 지점에 설정되어 있는 줄바꿈은 유지하면서, 상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈을 제거한다.
관련해서, 도 3에 도시된 그림과 같이, 줄바꿈 지점 추출부(112)를 통해 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216)이 추출되면, 종료 부호 확인부(113)는 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216)에 사전 설정된 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는지를 확인할 수 있다.
이때, 도 3에 도시된 그림과 같이, 종료 부호 확인부(113)에 의해 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216) 중 적어도 하나의 제2 지점(212)에서 상기 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호인 '.'이 삽입되어 있는 것으로 확인되면, 줄바꿈 제거부(114)는 상기 적어도 하나의 제1 지점(211, 212, 213, 214, 215, 216) 중 상기 문장 종료 부호가 삽입되어 있는 상기 적어도 하나의 제2 지점(212)을 제외한 나머지 지점인 적어도 하나의 제3 지점(211, 213, 214, 215, 216)을 확인한 후, 도 4에 도시된 그림과 같이, 상기 적어도 하나의 제2 지점(212)에 설정되어 있는 줄바꿈은 유지하면서, 상기 적어도 하나의 제3 지점(211, 213, 214, 215, 216)에 설정되어 있는 줄바꿈을 제거할 수 있다.
이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 공백 영역 추가부(115)를 더 포함할 수 있다.
공백 영역 추가부(115)는 상기 적어도 하나의 제3 지점(211, 213, 214, 215, 216)에 설정되어 있는 줄바꿈이 제거됨에 따라 상기 적어도 하나의 제3 지점(211, 213, 214, 215, 216) 각각에서 하단 줄의 텍스트가 상단 줄의 텍스트에 연결되면, 상기 상단 줄의 텍스트와 상기 하단 줄의 텍스트 사이에 사전 설정된 길이를 갖는 공백 영역을 추가한다.
예컨대, 도 4에 도시된 그림과 같이, 상기 적어도 하나의 제3 지점(211, 213, 214, 215, 216)에 설정되어 있는 줄바꿈이 제거됨에 따라 상기 적어도 하나의 제3 지점(211, 213, 214, 215, 216) 각각에서 하단 줄의 텍스트가 상단 줄의 텍스트에 연결되면, 공백 영역 추가부(115)는 도 5에 도시된 그림과 같이, 상기 적어도 하나의 제3 지점(211, 213, 214, 215, 216) 각각에 상기 상단 줄의 텍스트와 상기 하단 줄의 텍스트 사이에 사전 설정된 길이를 갖는 공백 영역을 추가할 수 있다.
이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 글머리 기호 확인부(116) 및 줄바꿈 진행부(117)를 더 포함할 수 있다.
글머리 기호 확인부(116)는 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 상기 공백 영역에 대한 추가가 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 사전 설정된 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입된 지점이 존재하는지를 확인한다.
여기서, 글머리 기호란 '1)', 'A)', '①' 등과 같은 글의 시작에 사용되는 기호를 의미한다.
줄바꿈 진행부(117)는 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 적어도 하나의 제4 지점에서 상기 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제4 지점 중 줄바꿈이 되어있지 않은 지점을 확인하고, 상기 적어도 하나의 제4 지점 중 적어도 하나의 제5 지점에서 줄바꿈이 되어 있지 않으면, 상기 적어도 하나의 제5 지점에서 줄바꿈을 진행한다.
관련해서, 도 5에 도시된 그림과 같이, 공백 영역 추가부(115)에 의해 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 상기 적어도 하나의 제3 지점(211, 213, 214, 215, 216)에 상기 공백 영역에 대한 추가가 완료되면, 글머리 기호 확인부(116)는 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 사전 설정된 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입된 지점이 존재하는지를 확인할 수 있다.
이때, 글머리 기호 확인부(116)는 도 6의 도면부호 310에 도시된 그림과 같이, 상기 전자 문서에 삽입된 제1 텍스트(210)에서 적어도 하나의 제4 지점(217, 218)에 상기 복수의 글머리 기호들 중 어느 하나의 글머리 기호인 '1)'과 '2)'가 삽입되어 있는 것으로 확인할 수 있고, 줄바꿈 진행부(117)는 상기 적어도 하나의 제4 지점(217, 218)의 확인이 완료되면, 상기 적어도 하나의 제4 지점(217, 218) 중 줄바꿈이 되어 있지 않은 지점을 확인할 수 있다.
이때, 도 6의 도면부호 310에 도시된 그림과 같이, 상기 적어도 하나의 제4 지점(217, 218) 중 적어도 하나의 제5 지점(217)이 줄바꿈이 되어 있지 않은 지점으로 확인되면, 줄바꿈 진행부(117)는 도 6의 도면부호 320에 도시된 그림과 같이, 상기 적어도 하나의 제5 지점(217)에서 줄바꿈을 진행할 수 있다.
이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 공백 영역 처리부(118)를 더 포함할 수 있다.
공백 영역 처리부(118)는 상기 적어도 하나의 제5 지점(217)에서 줄바꿈이 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 상기 공백 영역이 둘 이상 연속해서 존재하는 지점을 확인하고, 상기 공백 영역이 둘 이상 연속해서 존재하는 지점으로 적어도 하나의 제6 지점이 확인되면, 상기 적어도 하나의 제6 지점에서 상기 공백 영역을 하나로 축소한다.
관련해서, 줄바꿈 진행부(117)에 의해 상기 적어도 하나의 제5 지점(217)에서 줄바꿈이 완료되면, 공백 영역 처리부(118)는 도 7의 도면부호 330에 도시된 그림과 같이, 상기 전자 문서에 삽입된 상기 제1 텍스트(210)에서 상기 공백 영역이 둘 이상 연속해서 존재하는 지점을 확인할 수 있고, 상기 공백 영역이 둘 이상 연속해서 존재하는 지점으로 적어도 하나의 제6 지점(219, 220)이 확인되면, 공백 영역 처리부(118)는 도 7의 도면부호 340에 도시된 그림과 같이, 상기 적어도 하나의 제6 지점(219, 220)에서 상기 공백 영역을 하나로 축소할 수 있다.
결국, 본 발명에 따른 전자 장치(110)는 PDF 문서로부터 복사된 제1 텍스트(210)가 전자 문서에 붙여넣기 되면, 소정의 문장 종료 부호가 존재하지 않는 줄바꿈 지점에서의 줄바꿈을 제거하고, 줄바꿈이 제거되면, 줄바꿈이 제거된 지점에 공백 영역을 추가하며, 상기 제1 텍스트(210)에서 소정의 글머리 기호가 있는 지점에서 줄바꿈을 진행하고, 상기 제1 텍스트(210)에서 공백 영역이 둘 이상 연속해서 존재하는 지점이 있다면, 해당 공백 영역을 하나로 축소함으로써, 상기 제1 텍스트(210)가 도 7의 도면부호 340에 도시된 그림과 같이, 상기 전자 문서에서 자연스러운 형태로 붙여넣기 될 수 있도록 지원할 수 있다.
도 8은 본 발명의 일실시예에 따른 PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치의 동작 방법을 도시한 순서도이다.
단계(S810)에서는 사용자에 의해 PDF 문서에서 복사된 제1 텍스트가 전자 문서에 붙여넣기가 되도록 하는 붙여넣기 명령이 인가되면, 상기 전자 문서에 상기 제1 텍스트를 삽입한다.
단계(S820)에서는 상기 전자 문서에 상기 제1 텍스트가 삽입되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 줄바꿈이 되어 있는 적어도 하나의 제1 지점을 추출한다.
단계(S830)에서는 상기 적어도 하나의 제1 지점이 추출되면, 상기 적어도 하나의 제1 지점에 사전 설정된 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는지를 확인한다.
단계(S840)에서는 상기 적어도 하나의 제1 지점 중 적어도 하나의 제2 지점에서 상기 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제1 지점 중 상기 적어도 하나의 제2 지점을 제외한 나머지 지점인 적어도 하나의 제3 지점을 확인한 후, 상기 적어도 하나의 제2 지점에 설정되어 있는 줄바꿈은 유지하면서, 상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈을 제거한다.
이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈이 제거됨에 따라 상기 적어도 하나의 제3 지점 각각에서 하단 줄의 텍스트가 상단 줄의 텍스트에 연결되면, 상기 상단 줄의 텍스트와 상기 하단 줄의 텍스트 사이에 사전 설정된 길이를 갖는 공백 영역을 추가하는 단계를 더 포함할 수 있다.
이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 전자 문서에 삽입된 상기 제1 텍스트에서 상기 공백 영역에 대한 추가가 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 사전 설정된 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입된 지점이 존재하는지를 확인하는 단계, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 적어도 하나의 제4 지점에서 상기 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제4 지점 중 줄바꿈이 되어있지 않은 지점을 확인하고, 상기 적어도 하나의 제4 지점 중 적어도 하나의 제5 지점에서 줄바꿈이 되어 있지 않으면, 상기 적어도 하나의 제5 지점에서 줄바꿈을 진행하는 단계를 더 포함할 수 있다.
이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 적어도 하나의 제5 지점에서 줄바꿈이 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 상기 공백 영역이 둘 이상 연속해서 존재하는 지점을 확인하고, 상기 공백 영역이 둘 이상 연속해서 존재하는 지점으로 적어도 하나의 제6 지점이 확인되면, 상기 적어도 하나의 제6 지점에서 상기 공백 영역을 하나로 축소하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 단계(S810)에서는 복수의 문자들 각각에 대응되는 사전 설정된 원-핫 벡터가 저장되어 있는 벡터 저장부를 유지하는 단계, 복수의 폰트 데이터들과 상기 복수의 폰트 데이터들 각각에 대응되는 것으로 사전 설정된 문자 그룹(상기 문자 그룹은 상기 복수의 문자들 중에서 선택된 둘 이상의 문자들로 구성된 그룹임)에 대한 정보가 저장되어 있는 문자 그룹 저장부를 유지하는 단계, 상기 사용자에 의해 상기 전자 문서에 상기 PDF 문서로부터 복사된 상기 제1 텍스트에 대한 붙여넣기 명령이 인가되면, 상기 벡터 저장부와 상기 문자 그룹 저장부를 참조하여 상기 복수의 폰트 데이터들 각각에 대해, 각 폰트 데이터에 대응되는 문자 그룹에 포함된 문자들에 대한 원-핫 벡터를 모두 합산함으로써, 상기 복수의 폰트 데이터들 각각에 대응되는 폰트 벡터를 생성하는 단계, 상기 벡터 저장부를 참조하여 상기 제1 텍스트를 구성하는 문자들 각각에 대응되는 원-핫 벡터를 모두 합산함으로써, 상기 제1 텍스트에 대응되는 제1 텍스트 벡터를 생성하는 단계, 상기 복수의 폰트 데이터들 중 상기 제1 텍스트 벡터와의 코사인 유사도가 최대인 폰트 벡터를 갖는 제1 폰트 데이터를 선택하고, 상기 제1 폰트 데이터를 기초로 상기 제1 텍스트의 폰트를 상기 제1 폰트 데이터에 따른 폰트로 적용한 후 상기 제1 텍스트를 상기 전자 문서에 삽입하는 단계를 포함할 수 있다.
이상, 도 8를 참조하여 본 발명의 일실시예에 따른 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 전자 장치의 동작 방법은 도 1 내지 도 7을 이용하여 설명한 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.
본 발명의 일실시예에 따른 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.
또한, 본 발명의 일실시예에 따른 전자 장치의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
110: 전자 장치 111: 삽입부
112: 줄바꿈 지점 추출부 113: 종료 부호 확인부
114: 줄바꿈 제거부 115: 공백 영역 추가부
116: 글머리 기호 확인부 117: 줄바꿈 진행부
118: 공백 영역 처리부 119: 벡터 저장부
120: 문자 그룹 저장부 121: 폰트 벡터 생성부
122: 텍스트 벡터 생성부 123: 폰트 적용 삽입부

Claims (12)

  1. PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치에 있어서,
    사용자에 의해 PDF(Portable Document Format) 문서에서 복사된 제1 텍스트가 전자 문서에 붙여넣기가 되도록 하는 붙여넣기 명령이 인가되면, 상기 전자 문서에 상기 제1 텍스트를 삽입하는 삽입부;
    상기 전자 문서에 상기 제1 텍스트가 삽입되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 줄바꿈이 되어 있는 적어도 하나의 제1 지점을 추출하는 줄바꿈 지점 추출부;
    상기 적어도 하나의 제1 지점이 추출되면, 상기 적어도 하나의 제1 지점에 사전 설정된 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는지를 확인하는 종료 부호 확인부; 및
    상기 적어도 하나의 제1 지점 중 적어도 하나의 제2 지점에서 상기 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제1 지점 중 상기 적어도 하나의 제2 지점을 제외한 나머지 지점인 적어도 하나의 제3 지점을 확인한 후, 상기 적어도 하나의 제2 지점에 설정되어 있는 줄바꿈은 유지하면서, 상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈을 제거하는 줄바꿈 제거부
    를 포함하고,
    상기 삽입부는
    복수의 문자들 각각에 대응되는 사전 설정된 원-핫(One-Hot) 벡터가 저장되어 있는 벡터 저장부;
    복수의 폰트 데이터들과 상기 복수의 폰트 데이터들 각각에 대응되는 것으로 사전 설정된 문자 그룹 - 상기 문자 그룹은 상기 복수의 문자들 중에서 선택된 둘 이상의 문자들로 구성된 그룹임 - 에 대한 정보가 저장되어 있는 문자 그룹 저장부;
    상기 사용자에 의해 상기 전자 문서에 상기 PDF 문서로부터 복사된 상기 제1 텍스트에 대한 붙여넣기 명령이 인가되면, 상기 벡터 저장부와 상기 문자 그룹 저장부를 참조하여 상기 복수의 폰트 데이터들 각각에 대해, 각 폰트 데이터에 대응되는 문자 그룹에 포함된 문자들에 대한 원-핫 벡터를 모두 합산함으로써, 상기 복수의 폰트 데이터들 각각에 대응되는 폰트 벡터를 생성하는 폰트 벡터 생성부;
    상기 벡터 저장부를 참조하여 상기 제1 텍스트를 구성하는 문자들 각각에 대응되는 원-핫 벡터를 모두 합산함으로써, 상기 제1 텍스트에 대응되는 제1 텍스트 벡터를 생성하는 텍스트 벡터 생성부; 및
    상기 복수의 폰트 데이터들 중 상기 제1 텍스트 벡터와의 코사인 유사도가 최대인 폰트 벡터를 갖는 제1 폰트 데이터를 선택하고, 상기 제1 폰트 데이터를 기초로 상기 제1 텍스트의 폰트를 상기 제1 폰트 데이터에 따른 폰트로 적용한 후 상기 제1 텍스트를 상기 전자 문서에 삽입하는 폰트 적용 삽입부
    를 포함하는 전자 장치.
  2. 제1항에 있어서,
    상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈이 제거됨에 따라 상기 적어도 하나의 제3 지점 각각에서 하단 줄의 텍스트가 상단 줄의 텍스트에 연결되면, 상기 상단 줄의 텍스트와 상기 하단 줄의 텍스트 사이에 사전 설정된 길이를 갖는 공백 영역을 추가하는 공백 영역 추가부
    를 더 포함하는 전자 장치.
  3. 제2항에 있어서,
    상기 전자 문서에 삽입된 상기 제1 텍스트에서 상기 공백 영역에 대한 추가가 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 사전 설정된 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입된 지점이 존재하는지를 확인하는 글머리 기호 확인부; 및
    상기 전자 문서에 삽입된 상기 제1 텍스트에서 적어도 하나의 제4 지점에서 상기 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제4 지점 중 줄바꿈이 되어있지 않은 지점을 확인하고, 상기 적어도 하나의 제4 지점 중 적어도 하나의 제5 지점에서 줄바꿈이 되어 있지 않으면, 상기 적어도 하나의 제5 지점에서 줄바꿈을 진행하는 줄바꿈 진행부
    를 더 포함하는 전자 장치.
  4. 제3항에 있어서,
    상기 적어도 하나의 제5 지점에서 줄바꿈이 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 상기 공백 영역이 둘 이상 연속해서 존재하는 지점을 확인하고, 상기 공백 영역이 둘 이상 연속해서 존재하는 지점으로 적어도 하나의 제6 지점이 확인되면, 상기 적어도 하나의 제6 지점에서 상기 공백 영역을 하나로 축소하는 공백 영역 처리부
    를 더 포함하는 전자 장치.
  5. 삭제
  6. PDF 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치의 동작 방법에 있어서,
    사용자에 의해 PDF(Portable Document Format) 문서에서 복사된 제1 텍스트가 전자 문서에 붙여넣기가 되도록 하는 붙여넣기 명령이 인가되면, 상기 전자 문서에 상기 제1 텍스트를 삽입하는 단계;
    상기 전자 문서에 상기 제1 텍스트가 삽입되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 줄바꿈이 되어 있는 적어도 하나의 제1 지점을 추출하는 단계;
    상기 적어도 하나의 제1 지점이 추출되면, 상기 적어도 하나의 제1 지점에 사전 설정된 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는지를 확인하는 단계; 및
    상기 적어도 하나의 제1 지점 중 적어도 하나의 제2 지점에서 상기 복수의 문장 종료 부호들 중 어느 하나의 문장 종료 부호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제1 지점 중 상기 적어도 하나의 제2 지점을 제외한 나머지 지점인 적어도 하나의 제3 지점을 확인한 후, 상기 적어도 하나의 제2 지점에 설정되어 있는 줄바꿈은 유지하면서, 상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈을 제거하는 단계
    를 포함하고,
    상기 제1 텍스트를 삽입하는 단계는
    복수의 문자들 각각에 대응되는 사전 설정된 원-핫(One-Hot) 벡터가 저장되어 있는 벡터 저장부를 유지하는 단계;
    복수의 폰트 데이터들과 상기 복수의 폰트 데이터들 각각에 대응되는 것으로 사전 설정된 문자 그룹 - 상기 문자 그룹은 상기 복수의 문자들 중에서 선택된 둘 이상의 문자들로 구성된 그룹임 - 에 대한 정보가 저장되어 있는 문자 그룹 저장부를 유지하는 단계;
    상기 사용자에 의해 상기 전자 문서에 상기 PDF 문서로부터 복사된 상기 제1 텍스트에 대한 붙여넣기 명령이 인가되면, 상기 벡터 저장부와 상기 문자 그룹 저장부를 참조하여 상기 복수의 폰트 데이터들 각각에 대해, 각 폰트 데이터에 대응되는 문자 그룹에 포함된 문자들에 대한 원-핫 벡터를 모두 합산함으로써, 상기 복수의 폰트 데이터들 각각에 대응되는 폰트 벡터를 생성하는 단계;
    상기 벡터 저장부를 참조하여 상기 제1 텍스트를 구성하는 문자들 각각에 대응되는 원-핫 벡터를 모두 합산함으로써, 상기 제1 텍스트에 대응되는 제1 텍스트 벡터를 생성하는 단계; 및
    상기 복수의 폰트 데이터들 중 상기 제1 텍스트 벡터와의 코사인 유사도가 최대인 폰트 벡터를 갖는 제1 폰트 데이터를 선택하고, 상기 제1 폰트 데이터를 기초로 상기 제1 텍스트의 폰트를 상기 제1 폰트 데이터에 따른 폰트로 적용한 후 상기 제1 텍스트를 상기 전자 문서에 삽입하는 단계
    를 포함하는 전자 장치의 동작 방법.
  7. 제6항에 있어서,
    상기 적어도 하나의 제3 지점에 설정되어 있는 줄바꿈이 제거됨에 따라 상기 적어도 하나의 제3 지점 각각에서 하단 줄의 텍스트가 상단 줄의 텍스트에 연결되면, 상기 상단 줄의 텍스트와 상기 하단 줄의 텍스트 사이에 사전 설정된 길이를 갖는 공백 영역을 추가하는 단계
    를 더 포함하는 전자 장치의 동작 방법.
  8. 제7항에 있어서,
    상기 전자 문서에 삽입된 상기 제1 텍스트에서 상기 공백 영역에 대한 추가가 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 사전 설정된 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입된 지점이 존재하는지를 확인하는 단계; 및
    상기 전자 문서에 삽입된 상기 제1 텍스트에서 적어도 하나의 제4 지점에서 상기 복수의 글머리 기호들 중 어느 하나의 글머리 기호가 삽입되어 있는 것으로 확인되면, 상기 적어도 하나의 제4 지점 중 줄바꿈이 되어있지 않은 지점을 확인하고, 상기 적어도 하나의 제4 지점 중 적어도 하나의 제5 지점에서 줄바꿈이 되어 있지 않으면, 상기 적어도 하나의 제5 지점에서 줄바꿈을 진행하는 단계
    를 더 포함하는 전자 장치의 동작 방법.
  9. 제8항에 있어서,
    상기 적어도 하나의 제5 지점에서 줄바꿈이 완료되면, 상기 전자 문서에 삽입된 상기 제1 텍스트에서 상기 공백 영역이 둘 이상 연속해서 존재하는 지점을 확인하고, 상기 공백 영역이 둘 이상 연속해서 존재하는 지점으로 적어도 하나의 제6 지점이 확인되면, 상기 적어도 하나의 제6 지점에서 상기 공백 영역을 하나로 축소하는 단계
    를 더 포함하는 전자 장치의 동작 방법.
  10. 삭제
  11. 제6항 내지 제9항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
  12. 제6항 내지 제9항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.
KR1020200131875A 2020-10-13 2020-10-13 Pdf 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법 KR102466719B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200131875A KR102466719B1 (ko) 2020-10-13 2020-10-13 Pdf 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200131875A KR102466719B1 (ko) 2020-10-13 2020-10-13 Pdf 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법

Publications (2)

Publication Number Publication Date
KR20220048688A KR20220048688A (ko) 2022-04-20
KR102466719B1 true KR102466719B1 (ko) 2022-11-15

Family

ID=81395384

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200131875A KR102466719B1 (ko) 2020-10-13 2020-10-13 Pdf 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법

Country Status (1)

Country Link
KR (1) KR102466719B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102030547B1 (ko) 2018-06-19 2019-10-10 주식회사 한글과컴퓨터 지원하지 않는 폰트가 적용되어 있는 문서의 표시가 가능한 문서 편집 장치 및 그 동작 방법
KR102287149B1 (ko) 2019-09-19 2021-08-06 주식회사 한글과컴퓨터 Pdf 문서에서 텍스트 라인 정보를 기초로 단락의 구분선을 표시하는 전자 장치 및 그 동작 방법
KR102300464B1 (ko) 2019-10-28 2021-09-09 주식회사 한글과컴퓨터 교정부호가 삽입된 텍스트를 기반으로 구축된 교정 데이터베이스를 활용한 문장 자동 교정 장치 및 그 동작 방법
KR102300437B1 (ko) 2019-10-28 2021-09-09 주식회사 한글과컴퓨터 입력된 문자를 기초로 전자 문서 상의 특정 위치에 특수문자의 삽입을 가능하게 하는 전자 문서 편집 장치 및 그 동작 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102466701B1 (ko) * 2020-05-13 2022-11-15 주식회사 한글과컴퓨터 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치 및 그 동작 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102030547B1 (ko) 2018-06-19 2019-10-10 주식회사 한글과컴퓨터 지원하지 않는 폰트가 적용되어 있는 문서의 표시가 가능한 문서 편집 장치 및 그 동작 방법
KR102287149B1 (ko) 2019-09-19 2021-08-06 주식회사 한글과컴퓨터 Pdf 문서에서 텍스트 라인 정보를 기초로 단락의 구분선을 표시하는 전자 장치 및 그 동작 방법
KR102300464B1 (ko) 2019-10-28 2021-09-09 주식회사 한글과컴퓨터 교정부호가 삽입된 텍스트를 기반으로 구축된 교정 데이터베이스를 활용한 문장 자동 교정 장치 및 그 동작 방법
KR102300437B1 (ko) 2019-10-28 2021-09-09 주식회사 한글과컴퓨터 입력된 문자를 기초로 전자 문서 상의 특정 위치에 특수문자의 삽입을 가능하게 하는 전자 문서 편집 장치 및 그 동작 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Aloha Mood, "PDF 시나리오 편하게 마스터링하기." [Online], [URL: https://702535.tistory.com/9], (2020.04.09.)*
mapoo, "PDF에서 TEXT 발췌 후 구글 번역하기." [Online], [URL: https://mapoo.net/etc/pdf에서-text-발췌-후-구글-번역하기/], (2017.05.18.)*

Also Published As

Publication number Publication date
KR20220048688A (ko) 2022-04-20

Similar Documents

Publication Publication Date Title
CN1841364A (zh) 文件翻译方法和文件翻译装置
US9658988B2 (en) Systems and methods to segment text for layout and rendering
KR102187550B1 (ko) 문서에 삽입되는 ole 개체에 대한 요약된 미리보기 화면을 생성할 수 있는 전자 장치 및 그 동작 방법
CN112784009A (zh) 一种主题词挖掘方法、装置、电子设备及存储介质
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20240104290A1 (en) Device dependent rendering of pdf content including multiple articles and a table of contents
KR101768899B1 (ko) 문단 내 메모 삽입이 가능한 전자 문서 편집 장치 및 그 동작 방법
KR102466719B1 (ko) Pdf 문서로부터 복사된 텍스트에 대한 전자 문서로의 자연스러운 붙여넣기를 지원하는 전자 장치 및 그 동작 방법
KR102287149B1 (ko) Pdf 문서에서 텍스트 라인 정보를 기초로 단락의 구분선을 표시하는 전자 장치 및 그 동작 방법
JP2003186889A (ja) 文書に注釈付けし、文書イメージから要約を生成する方法及び装置
JPH10162098A (ja) 文書電子化装置及び文書電子化方法
KR102500730B1 (ko) 문장의 스타일 정보를 유지하는 번역 기능을 제공하는 전자 장치 및 그 동작 방법
US11416671B2 (en) Device dependent rendering of PDF content
KR101758098B1 (ko) Pdf 문서에 포함된 문자의 모양 유지 복사를 위한 전자 단말 장치 및 상기 전자 단말 장치의 pdf 문서에 포함된 문자에 대한 모양 유지 복사 방법
KR102576826B1 (ko) 전자 문서에 삽입되는 이미지 개체 내에 포함된 개인 정보를 식별할 수 있는 전자 단말 장치 및 그 동작 방법
JP3076348B2 (ja) 文書整形装置及び文書整形方法
KR20150085282A (ko) 전자 문서의 첨삭을 위한 단말의 동작 방법
KR102300457B1 (ko) 자소 구분에 따른 레벨별 단어 제시를 통해 효율적인 타자 연습을 지원하는 전자 장치 및 그 동작 방법
EP4109435A1 (en) Braille editting method using error output function, recording medium storing program for executing same, and computer program stored in recording medium for executing same
Stefanovitch Recovering Text from Endangered Languages Corrupted PDF documents
CN113378527A (zh) Pdf文档编辑方法、装置、存储介质及电子设备
JP2003346161A (ja) 図表内テキスト・図表キャプション・図表説明文・図表種類抽出プログラム、及び当該抽出プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに図表内テキスト・図表キャプション・図表説明文・図表種類抽出装置
JPS6370372A (ja) 文書処理装置
CN115878851A (zh) 一种编辑xml文件的方法、装置、电子设备及存储介质
CN115099248A (zh) 翻译方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant