KR101228865B1 - 문서 표시 장치 및 문서 내 중요 단어 추출 방법 - Google Patents

문서 표시 장치 및 문서 내 중요 단어 추출 방법 Download PDF

Info

Publication number
KR101228865B1
KR101228865B1 KR1020120091126A KR20120091126A KR101228865B1 KR 101228865 B1 KR101228865 B1 KR 101228865B1 KR 1020120091126 A KR1020120091126 A KR 1020120091126A KR 20120091126 A KR20120091126 A KR 20120091126A KR 101228865 B1 KR101228865 B1 KR 101228865B1
Authority
KR
South Korea
Prior art keywords
words
word
document
importance
extracted
Prior art date
Application number
KR1020120091126A
Other languages
English (en)
Inventor
박지훈
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Application granted granted Critical
Publication of KR101228865B1 publication Critical patent/KR101228865B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

문서 표시 장치 및 문서 내 중요 단어 추출 방법이 개시된다. 본 발명의 실시예들은 문서에 포함된 복수의 단어들의 상기 문서 내에서의 등장 빈도수와 상기 복수의 단어들 각각의 특성에 따른 가중치를 고려하여 각 단어 별 중요도를 연산한 후 특정 순위에 해당하는 단어를 선택하여 디스플레이함으로써, 사용자가 상기 문서에 대한 핵심 단어를 손쉽게 확인할 수 있도록 하는 기술에 대한 것이다.

Description

문서 표시 장치 및 문서 내 중요 단어 추출 방법{DOCUMENT DISPLAY APPARATUS AND METHOD FOR EXTRACTING KEY WORD IN DOCUMENT}
본 발명의 실시예들은 문서 표시 장치를 통해 실행되는 문서 내에서 중요 단어를 추출하는 기법에 대한 기술들과 관련된다.
최근, 문서 작성과 연관된 다양한 오피스 프로그램들이 등장하면서, 업무의 편의성이 증가하고 있다.
이러한 오피스 프로그램들의 대표적인 예로는 문서의 작성 및 편집이 가능하도록 하는 프로그램인 워드 프로세서(word processor), 데이터의 입력, 계산, 검색, 관리를 일괄하여 처리해주는 프로그램인 스프레드시트(spreadsheet), 발표자의 발표를 보조하는 프레젠테이션(presentation) 프로그램 등이 있다.
보통, 사용자는 이러한 오피스 프로그램들을 통해 작성된 문서에 대한 내용을 요약하고자 하는 경우, 상기 문서의 내용을 읽어본 후 주요 내용을 간추려서 상기 문서에 대한 내용을 요약하곤 한다.
이때, 사용자는 상기 문서로부터 중요한 핵심 단어들만을 검색해서 따로 볼 수 있다면, 상기 문서에 대한 내용 요약을 좀 더 손쉽게 수행할 수 있을 것이다.
또한, 사용자가 상기 문서를 보고, 상기 문서에 대한 내용을 한 번에 파악할 수 있도록 하기 위해서는 상기 문서에서 중요한 단어들을 추출하여 사용자에게 보여줄 수 있도록 하는 기술이 필요하다.
따라서, 다양한 오피스 프로그램들을 통해 작성된 문서로부터 핵심 단어들을 추출하여 사용자에게 보여줄 수 있도록 하는 방안에 대한 연구가 필요하다.
본 발명의 실시예들은 문서에 포함된 복수의 단어들의 상기 문서 내에서의 등장 빈도수와 상기 복수의 단어들 각각의 특성에 따른 가중치를 고려하여 각 단어 별 중요도를 연산한 후 특정 순위에 해당하는 단어를 선택하여 디스플레이함으로써, 사용자가 상기 문서에 대한 핵심 단어를 손쉽게 확인할 수 있도록 한다.
또한, 본 발명의 실시예들은 상기 문서 내에서 중요 단어를 선택하여 디스플레이함과 동시에 상기 중요 단어에 인접하여 위치하는 단어들 중 인접 횟수가 소정 횟수를 초과하는 단어를 상기 중요 단어와 함께 디스플레이함으로써, 사용자가 문서 내의 중요 단어를 볼 수 있도록 함과 동시에 상기 중요 단어와 인접해서 존재하는 중요 인접 단어들도 함께 볼 수 있도록 하여 사용자의 편의를 도모하고자 한다.
본 발명의 일실시예에 따른 문서 표시 장치는 문서에 포함된 문장에 대해 형태소 분석을 수행하여 상기 문서로부터 상기 문서에 포함된 복수의 단어들을 추출하는 단어 추출부, 상기 문서에서 상기 추출된 복수의 단어들이 등장하는 빈도수를 연산하는 빈도수 연산부, 상기 연산된 빈도수에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산하는 중요도 연산부, 상기 연산된 중요도에 기초하여 상기 추출된 복수의 단어들 중 선정된(predetermined) 순위 내에 해당하는 중요도를 갖는 적어도 하나의 단어를 선택하는 선택부, 사용자로부터 글자 수를 입력받아, 상기 추출된 복수의 단어들 각각에 대해, 상기 문서에 포함된 문장 내에서 상기 추출된 복수의 단어들 각각을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출하는 인접 단어 추출부, 상기 추출된 적어도 하나의 인접 단어의 상기 추출된 복수의 단어들 각각에 대한 인접 횟수를 연산하는 인접 횟수 연산부, 상기 선택부에서 상기 적어도 하나의 단어가 선택되면, 상기 선택된 적어도 하나의 단어 각각에 대한 적어도 하나의 인접 단어 중 상기 연산된 인접 횟수가 선정된 인접 횟수를 초과하는 인접 단어를 선택하는 인접 단어 선택부 및 상기 선택된 적어도 하나의 단어와 상기 선택된 인접 단어 함께를 디스플레이하는 디스플레이부를 포함한다.
또한, 본 발명의 일실시예에 따른 문서 내 중요 단어 추출 방법은 문서에 포함된 문장에 대해 형태소 분석을 수행하여 상기 문서로부터 상기 문서에 포함된 복수의 단어들을 추출하는 단계, 상기 문서에서 상기 추출된 복수의 단어들이 등장하는 빈도수를 연산하는 단계, 상기 연산된 빈도수에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산하는 단계, 상기 연산된 중요도에 기초하여 상기 추출된 복수의 단어들 중 선정된 순위 내에 해당하는 중요도를 갖는 적어도 하나의 단어를 선택하는 단계, 사용자로부터 글자 수를 입력받아, 상기 추출된 복수의 단어들 각각에 대해, 상기 문서에 포함된 문장 내에서 상기 추출된 복수의 단어들 각각을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출하는 단계, 상기 추출된 적어도 하나의 인접 단어의 상기 추출된 복수의 단어들 각각에 대한 인접 횟수를 연산하는 단계, 상기 추출된 복수의 단어들 중 상기 선정된 순위 내에 해당하는 중요도를 갖는 상기 적어도 하나의 단어가 선택되면, 상기 선택된 적어도 하나의 단어 각각에 대한 적어도 하나의 인접 단어 중 상기 연산된 인접 횟수가 선정된 인접 횟수를 초과하는 인접 단어를 선택하는 단계 및 상기 선택된 적어도 하나의 단어와 상기 선택된 인접 단어를 함께 디스플레이하는 단계를 포함한다.
본 발명의 실시예들은 문서에 포함된 복수의 단어들의 상기 문서 내에서의 등장 빈도수와 상기 복수의 단어들 각각의 특성에 따른 가중치를 고려하여 각 단어 별 중요도를 연산한 후 특정 순위에 해당하는 단어를 선택하여 디스플레이함으로써, 사용자가 상기 문서에 대한 핵심 단어를 손쉽게 확인할 수 있도록 보조할 수 있다.
또한, 본 발명의 실시예들은 상기 문서 내에서 중요 단어를 선택하여 디스플레이함과 동시에 상기 중요 단어에 인접하여 위치하는 단어들 중 인접 횟수가 소정 횟수를 초과하는 단어를 상기 중요 단어와 함께 디스플레이함으로써, 사용자가 문서 내의 중요 단어를 볼 수 있도록 함과 동시에 상기 중요 단어와 인접해서 존재하는 중요 인접 단어들도 함께 볼 수 있도록 하여 사용자의 편의를 도모할 수 있다.
도 1은 본 발명의 일실시예에 따른 문서 표시 장치의 구조를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 문서 내 중요 단어 추출 방법을 도시한 순서도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
어떤 구성요소가 다른 구성요소에 “연결되어” 있다거나 “접속되어” 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 “직접 연결되어” 있다거나 “직접 접속되어” 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, “포함하다” 또는 “가지다” 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 문서 표시 장치의 구조를 도시한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 문서 표시 장치(110)는 단어 추출부(111), 빈도수 연산부(112), 중요도 연산부(113), 선택부(114) 및 디스플레이부(115)를 포함한다.
여기서, 문서 표시 장치(110)는 데스크탑 PC, 모바일 단말, PDA, 노트북, 태블릿 PC 등 문서 파일을 로드하여 문서의 내용을 표시할 수 있는 다양한 종류의 마이크로프로세서 기반의 장치를 기반으로 구현될 수 있다.
단어 추출부(111)는 문서 표시 장치(110)에서 실행되는 문서에 포함된 문장들에 대해 형태소 분석을 수행하여 상기 문서로부터 상기 문서에 포함된 복수의 단어들을 추출한다.
이때, 단어 추출부(111)는 다수의 단어들이 저장되어 있는 소정의 단어 사전 데이터베이스를 저장하여 유지할 수 있고, 상기 단어 사전 데이터베이스를 참조하여 상기 문서로부터 상기 단어 사전 데이터베이스에 저장되어 있는 단어들과 매칭되는 단어들을 상기 복수의 단어들로 추출할 수 있다.
이때, 본 발명의 일실시예에 따르면, 단어 추출부(111)는 상기 추출된 복수의 단어들에 대해 인덱스(index)를 지정할 수 있다.
예컨대, 단어 추출부(111)가 상기 문서로부터 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어를 추출한 경우, 단어 추출부(111)는 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어에 대해 “1”부터 “6”까지에 해당하는 번호를 인덱스로 지정할 수 있다.
빈도수 연산부(112)는 상기 문서에서 상기 추출된 복수의 단어들이 등장하는 빈도수를 연산한다.
예컨대, 단어 추출부(111)가 상기 문서로부터 단어를 추출한 결과, 상기 문서로부터 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어가 추출된 경우, 빈도수 연산부(112)는 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어가 상기 문서에서 등장하는 빈도수를 연산할 수 있다.
중요도 연산부(113)는 상기 연산된 빈도수에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산한다.
이때, 본 발명의 일실시예에 따르면, 문서 표시 장치(110)는 가중치 할당부(116)를 더 포함할 수 있다.
가중치 할당부(116)는 상기 추출된 복수의 단어들에 대해 상기 추출된 복수의 단어들 각각에 특성에 기초하여 서로 다른 가중치를 할당한다.
이때, 본 발명의 일실시예에 따르면, 가중치 할당부(116)는 상기 추출된 복수의 단어들 각각에 대한 상기 문서 상에서의 구조 정보를 기초로 상기 추출된 복수의 단어들에 대해 서로 다른 가중치를 할당할 수 있다.
예컨대, 가중치 할당부(116)는 상기 추출된 복수의 단어들에 대해 각 단어들이 상기 문서 상에서 제목에 해당하는 단어인지, 또는 상기 각 단어들에 지정된 서식 정보를 기초로 개요, 들여쓰기, 글머리 기호, 문단 정보, 주석, 머리말, 꼬릿말 등에 해당하는 단어인지에 대한 상기 문서 상에서의 구조 정보를 기초로 상기 추출된 복수의 단어들에 대해 서로 다른 가중치를 할당할 수 있다.
또한, 본 발명의 일실시예에 따르면, 가중치 할당부(116)는 상기 추출된 복수의 단어들 각각에 지정된 텍스트 서식 정보를 기초로 상기 복수의 단어들에 대해 서로 다른 가중치를 할당할 수 있다.
예컨대, 가중치 할당부(116)는 상기 추출된 복수의 단어들 각각에 지정된 텍스트 서식 정보를 기초로 각 단어들이 상기 문서 상에서 굵게 표시된 단어인지, 상기 문서 상에서 밑줄이 그어진 단어인지, 글자의 크기 또는 글자의 색깔 등에 기초하여 서로 다른 가중치를 할당할 수 있다.
관련하여, 가중치 할당부(116)의 동작을 예를 들어 설명하면, 다음과 같다.
먼저, 상기 문서로부터 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어가 추출되었고, 제목에 해당하는 단어에 대해서는 가중치가 10, 상기 문서 상에서 굵게 표시된 단어나 밑줄이 그어진 단어에 대해서는 가중치가 1.3, 글자 크기가 12포인트 이상인 단어에 대해서는 가중치가 3, 글자 색깔이 검은색 이외의 색깔에 해당하는 단어에 대해서는 가중치가 2, 나머지 단어에 대해서는 가중치가 1이 할당되는 것으로 규정되어 있다고 가정하자.
만약, “특허”라는 단어는 제목에 해당하는 단어이고, “발명”이라는 단어는 굵게 표시된 단어이며, “신규성”이라는 단어는 글자 크기가 15포인트인 경우, 가중치 할당부(116)는 “특허”라는 단어에 대해 가중치 10을 할당할 수 있고, “발명”이라는 단어에 대해 가중치 1.3을 할당할 수 있으며, “신규성”이라는 단어에 대해 가중치 3을 할당할 수 있고, 나머지 단어들에 대해 가중치 1을 할당할 수 있다.
본 발명의 일실시예에 따르면, 가중치 할당부(116)는 상기 추출된 복수의 단어들에 대해 상기 추출된 복수의 단어들 각각에 설정된 소정의 특성에 기초하여 서로 다른 가중치를 할당할 때, 상기 추출된 복수의 단어들 각각에 대해 상기 소정의 특성을 갖는 단어의 등장 횟수가 선정된 횟수 이상 등장하는 경우에 한해서 상기 추출된 복수의 단어들에 대해 상기 가중치를 할당할 수 있다.
예컨대, 단어 추출부(111)에 의해 상기 문서로부터 “특허”라는 단어가 10회 추출되었고, 제목에 해당하는 단어의 경우 상기 단어가 상기 문서 상에서 2회 이상 제목으로 등장하면, 가중치 10이 할당되는 것으로 규정되어 있으며, 실제로 상기 문서 상에서 “특허”라는 단어가 제목으로 3회 등장하는 경우, 가중치 할당부(116)는 “특허”라는 단어에 대해 가중치 10을 할당할 수 있다. 하지만, “특허”라는 단어가 상기 문서 상에서 제목으로 2회 미만으로 등장하는 경우, 가중치 할당부(116)는 “특허”라는 단어에 대해 일반적인 단어에 할당되는 가중치인 가중치 1만을 할당할 수 있다.
가중치 할당부(116)에 의해 상기 추출된 복수의 단어들에 대해 서로 다른 가중치의 할당이 완료되면, 중요도 연산부(113)는 빈도수 연산부(112)에서 연산된 상기 추출된 복수의 단어들이 상기 문서에서 등장하는 빈도수와 가중치 할당부(116)에서 할당된 가중치에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산할 수 있다.
이때, 중요도 연산부(113)는 하기의 수학식 1에 기초하여 상기 중요도를 연산할 수 있다.
Figure 112012066915868-pat00001
여기서, I는 상기 중요도, F는 상기 빈도수, ω는 상기 가중치, n은 상기 추출된 복수의 단어들에 지정된 인덱스를 의미한다.
예컨대, 단어 추출부(111)에 의해 상기 문서로부터 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어가 추출되었고, “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어에 대해 “1”부터 “6”까지 해당하는 숫자가 인덱스로 지정되었으며, “특허”라는 단어가 상기 문서에서 등장하는 빈도수가 10회, “발명”이라는 단어가 상기 문서에서 등장하는 횟수가 15회, “선행기술”이라는 단어가 상기 문서에서 등장하는 횟수가 5회, “신규성”이라는 단어가 상기 문서에서 등장하는 횟수가 7회, “진보성”이라는 단어가 상기 문서에서 등장하는 횟수가 17회, “출원”이라는 단어가 상기 문서에서 등장하는 횟수가 20회라고 가정하자.
그리고, 가중치 할당부(116)에 의해 “특허”라는 단어에 대해 가중치 10이 할당되었고, “발명”이라는 단어에 대해 가중치 1.3이 할당되었으며, “신규성”이라는 단어에 대해 가중치 3이 할당되었고, 나머지 단어들에 대해 가중치 1이 할당되었다고 가정하자.
이때, 중요도 연산부(113)는 상기 수학식 1에 기초하여 하기의 표 1과 같이, “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어에 대해 중요도를 연산할 수 있다.
단어 인덱스 빈도수 가중치 중요도
특허 1 10 10 100
발명 2 15 1.3 19.5
선행기술 3 5 1 5
신규성 4 7 3 21
진보성 5 17 1 17
출원 6 20 1 20
중요도 연산부(113)를 통해 상기 추출된 복수의 단어들에 대한 중요도 연산이 완료되면, 선택부(114)는 상기 연산된 중요도에 기초하여 상기 추출된 복수의 단어들 중 선정된(predetermined) 순위 내에 해당되는 중요도를 갖는 적어도 하나의 단어를 선택한다.
전술한 예를 이용하여 선택부(114)의 동작을 예를 들어 설명하면, 상기 선정된 순위가 3위인 경우, 선택부(114)는 표 1에 나타낸 중요도에 기초하여 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어 중 “특허”, “신규성”, “출원”이라는 단어를 선택할 수 있다.
선택부(114)를 통해 단어의 선택이 완료되면, 디스플레이부(115)는 상기 선택된 적어도 하나의 단어를 디스플레이한다.
결국, 본 발명의 일실시예에 따른 문서 표시 장치(110)는 상기 문서에 포함된 복수의 단어들의 상기 문서 내에서의 등장 빈도수와 상기 복수의 단어들 각각의 특성에 따른 가중치를 고려하여 각 단어 별 중요도를 연산한 후 특정 순위에 해당하는 단어를 선택하여 디스플레이함으로써, 사용자가 상기 문서에 대한 핵심 단어를 손쉽게 확인할 수 있도록 보조할 수 있다.
본 발명의 일실시예에 따르면, 문서 표시 장치(110)는 인접 단어 추출부(117), 인접 횟수 연산부(118) 및 인접 단어 선택부(119)를 더 포함할 수 있다.
인접 단어 추출부(117)는 사용자로부터 글자 수를 입력받아, 단어 추출부(111)에서 추출된 복수의 단어들 각각에 대해, 상기 문서에 포함된 문장들 내에서 상기 추출된 복수의 단어들 각각을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출한다.
여기서, 상기 사용자로부터 입력받은 글자 수란 음절 단위의 글자 개수를 의미하며, 문장 내에서 띄어쓰기 공란도 1개의 글자 수로 볼 수 있다. 예컨대, “신규성이 인정되는 발명”이라는 문장에 대한 글자 수는 12개가 될 수 있다.
이하에서는, 인접 단어 추출부(117)의 동작에 대해 예를 들어 상세히 설명하기로 한다.
우선, 전술한 예에서 설명한 바와 같이, 단어 추출부(111)가 문서로부터 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어를 추출하였다고 가정하자.
이때, 인접 단어 추출부(117)는 사용자로부터 인접 단어의 추출을 위한 파라미터로 소정의 글자 수를 입력받은 후, 단어 추출부(111)를 통해 추출된 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어 각각에 대해, 상기 문서에 포함된 문장들 내에서 각 단어들을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출할 수 있다.
예컨대, 상기 문서 상에 “선행기술과의 관계에서 진보성이 있는 특허는 신규성도 있다”라는 문장이 있고, 인접 단어 추출부(117)가 사용자로부터 인접 단어 추출을 위한 파라미터로 “8개”라는 글자 수를 입력받았다고 가정하자.
이때, 인접 단어 추출부(117)는 “특허”라는 단어에 대해, “선행기술과의 관계에서 진보성이 있는 특허는 신규성도 있다”라는 문장 내에서 “특허”라는 단어를 중심으로 좌우로 8개의 글자 수 이내에 인접하여 위치하는 인접 단어인 “진보성”과 “신규성”이라는 단어를 추출할 수 있다.
여기서, 인접 단어 추출부(117)는 단어 추출부(111)에서 추출된 단어를 중심으로 조사나 문장 기호 등이 아닌, 상기 사용자로부터 입력받은 글자 수 이내 인접하여 위치하는 단어만을 추출하기 위해, 단어 추출부(111)가 저장하여 유지하고 있는 단어 사전 데이터베이스를 참조하여 상기 단어 사전 데이터베이스에 저장되어 있는 단어들과 매칭되는 단어만을 인접 단어로 추출할 수 있다.
이러한 방식으로, 인접 단어 추출부(117)는 단어 추출부(111)를 통해 추출된 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어 각각에 대해, 문서에 포함된 문장들 내에서 각 단어들을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출할 수 있다.
인접 횟수 연산부(118)는 상기 추출된 적어도 하나의 인접 단어의 상기 추출된 복수의 단어들 각각에 대한 인접 횟수를 연산한다.
관련하여, 전술한 예를 이용하여 인접 횟수 연산부(118)의 동작을 설명하면, 먼저, 인접 단어 추출부(117)에서 “특허”라는 단어에 대해서는 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 인접 단어로 “신규성”, “진보성”이라는 단어가 추출되었고, “발명”이라는 단어에 대해서는 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 인접 단어로 “출원”, “신규성”, “선행기술”이라는 단어가 추출되었으며, “선행기술”이라는 단어에 대해서는 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 인접 단어로 “발명”, “출원”이라는 단어가 추출되었고, “신규성”이라는 단어에 대해서는 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 인접 단어로 “특허”, “발명”이라는 단어가 추출되었고, “진보성”이라는 단어에 대해서는 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 인접 단어로 “특허”라는 단어가 추출되었고, “출원”이라는 단어에 대해서는 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 인접 단어로 “발명”, “선행기술”이라는 단어가 추출된 경우, 인접 횟수 연산부(118)는 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어에 대해 인접 단어 추출부(117)에서 추출된 각 인접 단어들의 인접 횟수를 연산할 수 있다.
관련하여, 하기의 표 2에는 인접 횟수 연산부(118)를 통해 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어에 대해, 각 단어 별로 앞서 인접 단어 추출부(117)에서 추출된 각 인접 단어들의 인접 횟수가 연산된 예가 나타나 있다.
단어 추출부(111)를 통해 추출된 단어 인접 단어 추출부(117)를 통해 추출된 인접 단어
특허 발명 선행기술 신규성 진보성 출원
특허 - - - 3 5 -
발명 - - 7 2 - 9
선행기술 - 7 - - - 12
신규성 3 2 - - - -
진보성 5 - - - - -
출원 - 9 12 - - -
상기 표 2에서 각 셀에 표시된 숫자는 인접 횟수 연산부(118)를 통해 연산된 각 인접 단어의 인접 횟수를 의미하고, “-”표시는 인접 단어가 아닌 경우를 의미한다. 예컨대, “특허”라는 단어에 대해서는 “특허”, “발명”, “선행기술”, “출원”이라는 단어가 인접하여 위치하는 인접 단어가 아니기 때문에 셀에 “-”표기를 수행하였다.
인접 단어 선택부(119)는 선택부(114)가 선정된 순위 내에 해당하는 중요도를 갖는 적어도 하나의 단어에 대한 선택을 완료하면, 상기 선택된 적어도 하나의 단어 각각에 대한 적어도 하나의 인접 단어 중 상기 연산된 인접 횟수가 선정된 횟수를 초과하는 인접 단어를 선택한다.
관련하여, 전술한 예를 이용하여 인접 단어 선택부(119)의 동작을 설명하면, 선택부(114)가 “특허”, “발명”, “선행기술”, “신규성”, “진보성” 및 “출원”이라는 단어 중 상기 표 1에 나타낸 중요도에 기초하여 3위 이내의 중요도를 갖는 단어인 “특허”, “신규성”, “출원”이라는 단어의 선택을 완료한 경우, 인접 단어 선택부(119)는 “특허”, “신규성”, “출원”이라는 단어 각각에 대해 “특허”, “신규성”, “출원”이라는 단어 각각에 인접한 단어들 중 상기 표 2에 나타낸 인접 횟수가 선정된 횟수를 초과하는 인접 단어를 선택할 수 있다.
만약, 상기 선정된 횟수가 2회인 경우, 인접 단어 선택부(119)는 “특허”라는 단어에 대해 “신규성”과 “진보성”이라는 인접 단어를 선택할 수 있고, “신규성”이라는 단어에 대해 “특허”라는 인접 단어를 선택할 수 있으며, “출원”이라는 단어에 대해 “발명”과 “선행기술”이라는 단어를 선택할 수 있다.
인접 단어 선택부(119)가 인접 단어의 선택을 완료하면, 디스플레이부(115)는 선택부(114)에서 선택된 적어도 하나의 단어와 인접 단어 선택부(119)에서 선택된 인접 단어를 함께 디스플레이할 수 있다.
전술한 예를 이용하여 디스플레이부(115)의 동작을 설명하면, 디스플레이부(115)는 “특허”라는 단어와 “신규성”, “진보성”이라는 인접 단어를 함께 디스플레이할 수 있고, “신규성”이라는 단어와 “특허”라는 인접 단어를 함께 디스플레이할 수 있으며, “출원”이라는 단어와 “발명”, “선행기술”이라는 인접 단어를 함께 디스플레이할 수 있다.
결국, 본 발명의 일실시예에 따른 문서 표시 장치(110)는 상기 문서 내에서 중요 단어를 선택하여 디스플레이함과 동시에 상기 중요 단어에 인접하는 단어들 중 인접 횟수가 소정 횟수를 초과하는 단어를 상기 중요 단어와 함께 디스플레이함으로써, 사용자가 문서 내의 중요 단어를 볼 수 있도록 함과 동시에 상기 중요 단어와 인접해서 존재하는 중요 인접 단어들도 함께 볼 수 있도록 하여 사용자의 편의를 도모할 수 있다.
도 2는 본 발명의 일실시예에 따른 문서 내 중요 단어 추출 방법을 도시한 순서도이다.
단계(S210)에서는 문서에 포함된 문장들에 대해 형태소 분석을 수행하여 상기 문서로부터 상기 문서에 포함된 복수의 단어들을 추출한다.
단계(S220)에서는 상기 문서에서 상기 추출된 복수의 단어들이 등장하는 빈도수를 연산한다.
단계(S230)에서는 상기 연산된 빈도수에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산한다.
이때, 본 발명의 일실시예에 따르면, 상기 문서 내 중요 단어 추출 방법은 단계(S230)이전에 상기 추출된 복수의 단어들에 대해 상기 추출된 복수의 단어들 각각의 특성에 기초하여 서로 다른 가중치를 할당하는 단계를 더 포함할 수 있다.
이때, 본 발명의 일실시예에 따르면, 상기 가중치를 할당하는 단계는 상기 추출된 복수의 단어들 각각에 대한 상기 문서 상에서의 구조 정보를 기초로 상기 추출된 복수의 단어들에 대해 서로 다른 가중치를 할당할 수 있다.
이때, 단계(S230)에서는 상기 가중치의 할당이 완료되면, 상기 연산된 빈도수와 상기 할당된 가중치에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산할 수 있다.
이때, 본 발명의 일실시예에 따르면, 단계(S210)에서는 상기 추출된 복수의 단어들에 대해 인덱스를 지정하고, 단계(S230)에서는 상기 수학식 1에 기초하여 상기 중요도를 연산할 수 있다.
단계(S240)에서는 상기 연산된 중요도에 기초하여 상기 추출된 복수의 단어들 중 선정된 순위 내에 해당하는 중요도를 갖는 적어도 하나의 단어를 선택한다.
단계(S250)에서는 사용자로부터 글자 수를 입력받아, 상기 추출된 복수의 단어들 각각에 대해, 상기 문서에 포함된 문장들 내에서 상기 추출된 복수의 단어들 각각을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출한다.
단계(S260)에서는 상기 추출된 적어도 하나의 인접 단어의 상기 추출된 복수의 단어들 각각에 대한 인접 횟수를 연산한다.
단계(S270)에서는 상기 추출된 복수의 단어들 중 상기 선정된 순위 내에 해당하는 중요도를 갖는 상기 적어도 하나의 단어가 선택되면, 상기 선택된 적어도 하나의 단어 각각에 대한 적어도 하나의 인접 단어 중 상기 연산된 인접 횟수가 선정된 인접 횟수를 초과하는 인접 단어를 선택한다.
단계(S280)에서는 상기 선택된 적어도 하나의 단어와 상기 선택된 인접 단어를 함께 디스플레이한다.
이상, 도 2를 참조하여 본 발명의 일실시예에 따른 문서 내 중요 단어 추출 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 문서 내 중요 단어 추출 방법은 도 1을 이용하여 설명한 문서 표시 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.
본 발명의 일실시예에 따른 문서 내 중요 단어 추출 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
110: 문서 표시 장치
111: 단어 추출부 112: 빈도수 연산부
113: 중요도 연산부 114: 선택부
115: 디스플레이부 116: 가중치 할당부
117: 인접 단어 추출부 118: 인접 횟수 연산부
119: 인접 단어 선택부

Claims (9)

  1. 문서에 포함된 문장들에 대해 형태소 분석을 수행하여 상기 문서로부터 상기 문서에 포함된 복수의 단어들을 추출하는 단어 추출부;
    상기 문서에서 상기 추출된 복수의 단어들이 등장하는 빈도수를 연산하는 빈도수 연산부;
    상기 연산된 빈도수에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산하는 중요도 연산부;
    상기 연산된 중요도에 기초하여 상기 추출된 복수의 단어들 중 선정된(predetermined) 순위 내에 해당하는 중요도를 갖는 적어도 하나의 단어를 선택하는 선택부;
    사용자로부터 글자 수를 입력받아, 상기 추출된 복수의 단어들 각각에 대해, 상기 문서에 포함된 문장들 내에서 상기 추출된 복수의 단어들 각각을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출하는 인접 단어 추출부;
    상기 추출된 적어도 하나의 인접 단어의 상기 추출된 복수의 단어들 각각에 대한 인접 횟수를 연산하는 인접 횟수 연산부;
    상기 선택부에서 상기 적어도 하나의 단어가 선택되면, 상기 선택된 적어도 하나의 단어 각각에 대한 적어도 하나의 인접 단어 중 상기 연산된 인접 횟수가 선정된 인접 횟수를 초과하는 인접 단어를 선택하는 인접 단어 선택부; 및
    상기 선택된 적어도 하나의 단어와 상기 선택된 인접 단어를 함께 디스플레이하는 디스플레이부
    를 포함하는 문서 표시 장치.
  2. 제1항에 있어서,
    상기 추출된 복수의 단어들에 대해 상기 추출된 복수의 단어들 각각의 특성에 기초하여 서로 다른 가중치를 할당하는 가중치 할당부
    를 더 포함하고,
    상기 중요도 연산부는
    상기 연산된 빈도수와 상기 할당된 가중치에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산하는 문서 표시 장치.
  3. 제2항에 있어서,
    상기 가중치 할당부는
    상기 추출된 복수의 단어들 각각에 대한 상기 문서 상에서의 구조 정보를 기초로 상기 추출된 복수의 단어들에 대해 서로 다른 가중치를 할당하는 문서 표시 장치.
  4. 제2항에 있어서,
    상기 단어 추출부는
    상기 추출된 복수의 단어들에 대해 인덱스(index)를 지정하고,
    상기 중요도 연산부는
    하기의 수학식 1에 기초하여 상기 중요도를 연산하는 문서 표시 장치.
    [수학식 1]
    Figure 112012066915868-pat00002

    여기서, I는 상기 중요도, F는 상기 빈도수, ω는 상기 가중치, n은 상기 추출된 복수의 단어들에 지정된 인덱스를 의미함.
  5. 단어 추출부가 문서에 포함된 문장들에 대해 형태소 분석을 수행하여 상기 문서로부터 상기 문서에 포함된 복수의 단어들을 추출하는 단계;
    빈도수 연산부가 상기 문서에서 상기 추출된 복수의 단어들이 등장하는 빈도수를 연산하는 단계;
    중요도 연산부가 상기 연산된 빈도수에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산하는 단계;
    선택부가 상기 연산된 중요도에 기초하여 상기 추출된 복수의 단어들 중 선정된(predetermined) 순위 내에 해당하는 중요도를 갖는 적어도 하나의 단어를 선택하는 단계;
    인접 단어 추출부가 사용자로부터 글자 수를 입력받아, 상기 추출된 복수의 단어들 각각에 대해, 상기 문서에 포함된 문장들 내에서 상기 추출된 복수의 단어들 각각을 중심으로 좌우로 상기 사용자로부터 입력받은 글자 수 간격 이내에 인접하여 위치하는 적어도 하나의 인접 단어를 추출하는 단계;
    인접 횟수 연산부가 상기 추출된 적어도 하나의 인접 단어의 상기 추출된 복수의 단어들 각각에 대한 인접 횟수를 연산하는 단계;
    인접 단어 선택부가 상기 추출된 복수의 단어들 중 상기 선정된 순위 내에 해당하는 중요도를 갖는 상기 적어도 하나의 단어가 선택되면, 상기 선택된 적어도 하나의 단어 각각에 대한 적어도 하나의 인접 단어 중 상기 연산된 인접 횟수가 선정된 인접 횟수를 초과하는 인접 단어를 선택하는 단계; 및
    디스플레이부가 상기 선택된 적어도 하나의 단어와 상기 선택된 인접 단어를 함께 디스플레이하는 단계
    를 포함하는 문서 내 중요 단어 추출 방법.
  6. 제5항에 있어서,
    가중치 할당부가 상기 추출된 복수의 단어들에 대해 상기 추출된 복수의 단어들 각각의 특성에 기초하여 서로 다른 가중치를 할당하는 단계
    를 더 포함하고,
    상기 중요도를 연산하는 단계는
    상기 중요도 연산부가 상기 연산된 빈도수와 상기 할당된 가중치에 기초하여 상기 추출된 복수의 단어들에 대한 중요도를 연산하는 문서 내 중요 단어 추출 방법.
  7. 제6항에 있어서,
    상기 가중치를 할당하는 단계는
    상기 가중치 할당부가 상기 추출된 복수의 단어들 각각에 대한 상기 문서 상에서의 구조 정보를 기초로 상기 추출된 복수의 단어들에 대해 서로 다른 가중치를 할당하는 문서 내 중요 단어 추출 방법.
  8. 제6항에 있어서,
    상기 복수의 단어들을 추출하는 단계는
    상기 단어 추출부가 상기 추출된 복수의 단어들에 대해 인덱스(index)를 지정하고,
    상기 중요도를 연산하는 단계는
    상기 중요도 연산부가 하기의 수학식 2에 기초하여 상기 중요도를 연산하는 문서 내 중요 단어 추출 방법.
    [수학식 2]
    Figure 112012103156676-pat00003

    여기서, I는 상기 중요도, F는 상기 빈도수, ω는 상기 가중치, n은 상기 추출된 복수의 단어들에 지정된 인덱스를 의미함.
  9. 제5항 내지 제8항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
KR1020120091126A 2011-11-23 2012-08-21 문서 표시 장치 및 문서 내 중요 단어 추출 방법 KR101228865B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110123234 2011-11-23
KR20110123234 2011-11-23

Publications (1)

Publication Number Publication Date
KR101228865B1 true KR101228865B1 (ko) 2013-02-01

Family

ID=47898712

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120091126A KR101228865B1 (ko) 2011-11-23 2012-08-21 문서 표시 장치 및 문서 내 중요 단어 추출 방법

Country Status (1)

Country Link
KR (1) KR101228865B1 (ko)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160072326A (ko) 2014-12-12 2016-06-23 한국기초과학지원연구원 전자결재 시스템 및 결재방법
KR101778192B1 (ko) * 2016-04-19 2017-09-13 주식회사 한글과컴퓨터 중요한 단어를 중심으로 한 문장 재정렬 및 재정렬된 문장 디스플레이를 위한 방법 및 그 장치
KR101849544B1 (ko) * 2017-04-28 2018-04-17 주식회사 케이비금융지주 빅데이터를 이용한 부동산 예측 방법 및 이를 수행하기 위한 장치
WO2019039673A1 (ko) * 2017-08-21 2019-02-28 인천대학교 산학협력단 인공지능 기반의 웹 페이지 분석에 기초한 제품 키워드 정보 자동추출 장치 및 방법
US10474901B2 (en) 2016-05-02 2019-11-12 Electronics And Telecommunications Research Institute Video interpretation apparatus and method
WO2020013615A1 (ko) * 2018-07-10 2020-01-16 삼성전자 주식회사 전자 장치 및 전자 장치의 제어 방법
KR102187550B1 (ko) * 2019-08-19 2020-12-07 주식회사 한글과컴퓨터 문서에 삽입되는 ole 개체에 대한 요약된 미리보기 화면을 생성할 수 있는 전자 장치 및 그 동작 방법
KR102215613B1 (ko) * 2020-02-03 2021-02-15 주식회사 한글과컴퓨터 문서에 삽입된 텍스트를 구성하는 언어에 기반한 텍스트 검색을 가능하게 하는 전자 장치 및 그 동작 방법
KR20220013081A (ko) * 2020-07-24 2022-02-04 주식회사 한글과컴퓨터 개체 박스를 통해 전자 문서에 대한 개선된 개체 삽입 기능을 제공하는 전자 장치 및 그 동작 방법
KR20220070919A (ko) 2020-11-23 2022-05-31 숭실대학교산학협력단 질의문과 지식 그래프 관계 학습을 이용한 지식 완성 방법 및 장치
KR20220081009A (ko) * 2020-12-08 2022-06-15 주식회사 카카오엔터프라이즈 주요 키워드 추출 장치, 그것의 제어 방법 및 주요 키워드 추출 프로그램

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090083747A (ko) * 2008-01-30 2009-08-04 삼성전자주식회사 웹 문서 요약 제공을 위한 사용자 단말 장치 및 웹 문서제공 방법
KR20100068532A (ko) * 2008-12-15 2010-06-24 한국전자통신연구원 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090083747A (ko) * 2008-01-30 2009-08-04 삼성전자주식회사 웹 문서 요약 제공을 위한 사용자 단말 장치 및 웹 문서제공 방법
KR20100068532A (ko) * 2008-12-15 2010-06-24 한국전자통신연구원 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160072326A (ko) 2014-12-12 2016-06-23 한국기초과학지원연구원 전자결재 시스템 및 결재방법
KR101778192B1 (ko) * 2016-04-19 2017-09-13 주식회사 한글과컴퓨터 중요한 단어를 중심으로 한 문장 재정렬 및 재정렬된 문장 디스플레이를 위한 방법 및 그 장치
US10474901B2 (en) 2016-05-02 2019-11-12 Electronics And Telecommunications Research Institute Video interpretation apparatus and method
KR101849544B1 (ko) * 2017-04-28 2018-04-17 주식회사 케이비금융지주 빅데이터를 이용한 부동산 예측 방법 및 이를 수행하기 위한 장치
WO2019039673A1 (ko) * 2017-08-21 2019-02-28 인천대학교 산학협력단 인공지능 기반의 웹 페이지 분석에 기초한 제품 키워드 정보 자동추출 장치 및 방법
CN112771532A (zh) * 2018-07-10 2021-05-07 三星电子株式会社 电子装置和用于控制电子装置的方法
WO2020013615A1 (ko) * 2018-07-10 2020-01-16 삼성전자 주식회사 전자 장치 및 전자 장치의 제어 방법
US11435883B2 (en) 2018-07-10 2022-09-06 Samsung Electronics Co., Ltd. Electronic device, and method for controlling electronic device
US12131013B2 (en) 2018-07-10 2024-10-29 Samsung Electronics Co., Ltd. Electronic device, and method for controlling electronic device
KR102187550B1 (ko) * 2019-08-19 2020-12-07 주식회사 한글과컴퓨터 문서에 삽입되는 ole 개체에 대한 요약된 미리보기 화면을 생성할 수 있는 전자 장치 및 그 동작 방법
KR102215613B1 (ko) * 2020-02-03 2021-02-15 주식회사 한글과컴퓨터 문서에 삽입된 텍스트를 구성하는 언어에 기반한 텍스트 검색을 가능하게 하는 전자 장치 및 그 동작 방법
KR20220013081A (ko) * 2020-07-24 2022-02-04 주식회사 한글과컴퓨터 개체 박스를 통해 전자 문서에 대한 개선된 개체 삽입 기능을 제공하는 전자 장치 및 그 동작 방법
KR102466714B1 (ko) 2020-07-24 2022-11-15 주식회사 한글과컴퓨터 개체 박스를 통해 전자 문서에 대한 개선된 개체 삽입 기능을 제공하는 전자 장치 및 그 동작 방법
KR20220070919A (ko) 2020-11-23 2022-05-31 숭실대학교산학협력단 질의문과 지식 그래프 관계 학습을 이용한 지식 완성 방법 및 장치
KR20220081009A (ko) * 2020-12-08 2022-06-15 주식회사 카카오엔터프라이즈 주요 키워드 추출 장치, 그것의 제어 방법 및 주요 키워드 추출 프로그램
KR102639979B1 (ko) 2020-12-08 2024-02-22 주식회사 카카오엔터프라이즈 주요 키워드 추출 장치, 그것의 제어 방법 및 주요 키워드 추출 프로그램

Similar Documents

Publication Publication Date Title
KR101228865B1 (ko) 문서 표시 장치 및 문서 내 중요 단어 추출 방법
US11880382B2 (en) Systems and methods for generating tables from print-ready digital source documents
US9400775B2 (en) Document data entry suggestions
US9146915B2 (en) Method, apparatus, and computer storage medium for automatically adding tags to document
US20170220129A1 (en) Predictive Text Input Method and Device
CN103777774B (zh) 终端装置及输入法的文字纠错方法
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
CN106484699B (zh) 数据库查询字段的生成方法及装置
CN108717469B (zh) 一种帖子排序方法、装置、设备及计算机可读存储介质
CN109670183B (zh) 一种文本重要性的计算方法、装置、设备和存储介质
JP6667452B2 (ja) テキスト情報の入力方法及び装置
US10997252B2 (en) Methods, apparatuses, and computer storage media for data searching
KR101334154B1 (ko) 중국어 단어 입력 장치 및 방법
US20150040058A1 (en) Method and System for Inputting Variant Character and Storage Medium
US20180181555A1 (en) Rewriting forms for constrained interaction
CN114492303A (zh) 电子书的排版处理方法、电子设备及存储介质
CN108829266A (zh) 音节补全方法及装置、存储介质、电子设备
WO2017056164A1 (ja) 情報提示システム、及び情報提示方法
CN107491443B (zh) 一种包含非常规词汇的中文句子翻译方法及系统
JP5428622B2 (ja) 電子機器及びプログラム
Cuff et al. Statistical analysis of surgical pathology data using the R program
EP2800014A1 (en) Method for searching curriculum vitae's on a job portal website, server and computer program product therefore
TWI451277B (zh) 檢索標籤視覺化系統及其方法
JP6884172B2 (ja) 計算機システム及び文書の評価方法

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160126

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170106

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180104

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190107

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 8