KR102414391B1 - 과거이력 기반 실시간 문서작성 추천 시스템 - Google Patents

과거이력 기반 실시간 문서작성 추천 시스템 Download PDF

Info

Publication number
KR102414391B1
KR102414391B1 KR1020200188377A KR20200188377A KR102414391B1 KR 102414391 B1 KR102414391 B1 KR 102414391B1 KR 1020200188377 A KR1020200188377 A KR 1020200188377A KR 20200188377 A KR20200188377 A KR 20200188377A KR 102414391 B1 KR102414391 B1 KR 102414391B1
Authority
KR
South Korea
Prior art keywords
user
recommendation
data
unit
word
Prior art date
Application number
KR1020200188377A
Other languages
English (en)
Inventor
추철민
황혜진
차기벽
안진범
권승훈
Original Assignee
추철민
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 추철민 filed Critical 추철민
Priority to KR1020200188377A priority Critical patent/KR102414391B1/ko
Application granted granted Critical
Publication of KR102414391B1 publication Critical patent/KR102414391B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템은 사용자 과거 이력 데이터를 수집 및 분석하는 데이터 수집부, 상기 데이터 수집부로부터 상기 사용자가 입력한 단어, 문자, 문장, 기호 적어도 하나를 식별하여 데이터베이스에 저장하고, 상기 사용자의 선호도를 반영하여 선호객체를 산출하는 선호 객체처리부, 상기 선호 객체처리부에서 산출된 선호객체를 형태소, 어휘의미, 구문, 개체명에 따라 색인하여 색인별로 구분하여 저장하는 추천어 저장부, 상기 사용자에 의해 웹브라우저에 입력된 키워드를 식별하여 상기 추천어 저장부로부터 상기 사용자가 입력한 키워드와 연관된 적어도 하나의 추천어를 제공하는 추천어 추천부, 상기 추천어 추천부로부터 제공된 다수의 추천어를 노출하는 추천어 출력부를 포함할 수 있다.

Description

과거이력 기반 실시간 문서작성 추천 시스템{SYSTEM FOR RECOMMENDING REAL-TIME DOCUMENT WRITING BASED ON PAST HISTORY}
본 발명은 사용자의 과거 이력 정보를 기반으로 사용자의 문서 작성 상황에 따라 단어 또는 문장을 실시간으로 추천하여 제공하는 과거이력 기반 실시간 문서작성 추천 시스템에 관한 것이다.
오늘날 컴퓨터 기술의 발전으로 컴퓨터 시스템은 다양한 기능을 제공하고 있으며, 가장 대표적인 컴퓨터 기능이 문서 작성 기능이다. 일반적으로 문서 작성 기능을 제공하는 대표적인 문서 작성 프로그램(소프트웨어 애플리케이션)은 마이크로 소프트사의 워드 프로세서 및 한글과 컴퓨터 사에서 제공하는 한글 프로그램이 있다.
이러한 문서 작성 프로그램은 사용자들의 보다 향상된 기능에 대한 끊임없는 요구에 따라 개발자들은 문서 작성 또는 문서와 연관된 가시적인 포맷화를 담당하는 소프트웨어 애플리케이션의 일반 기능은 제쳐놓고, 사용자들이 문서에 주석을 달수 있도록 XML(Extensible Markup Language)와 같은 마크업 언어들을 포함하는 구조화된 데이터 포맷을 제공하고 있으며, 한자 변환 기능 또는 사전 검색 기능 등과 같은 다양한 기능을 제공하고 있다.
일반적으로 문서 작성자가 문서 작성을 위해 수집한 각종 이미지에 포함된 문자를 자신의 문서에 포함시키고 싶을 때, 그 문자를 일일이 다시 타이핑을 해야 하고, 문서 작성상 자주 사용되는 단어나 문장들을 반복해서 타이핑 해야만 하는 번거로운 문제점이 있었다.
각종 문서 작성에서 시간의 낭비를 발생시키는 이러한 과정들을 줄이고자 종래 한국등록특허 제 10-2166516호에는 인공 지능 기반의 문서 자동 작성 시스템에 관한 기술이 공지되어 있으나, 이는 사용자가 문자 또는 이미지만 제공을 하면, 제공된 문자 또는 이미지의 내용을 분석하여, 분석된 내용이 포함된 사용자가 원하는 형태의 문서를 만들어 사용자에게 제공하는 것이다.
이는, 단순히 문자 또는 이미지 상의 내용만을 분석하여 이를 문서화할 수 있는 기능만을 가질 뿐 문서 작성시 사용자가 입력한 키워드를 포함하는 최적의 또는 적절한 표현을 추천하거나 자주 사용되는 문구를 추천하여 문서 작성의 편의성향상시키는 결과는 얻지 못하고 있다.
한국등록특허 제10-2166516호
본 발명의 목적은, 사용자의 과거 이력을 기반으로 자주 사용하는 단어, 문장, 기호 등을 하나 이상의 색인에 따라 분류하여 각 색인별로 이를 저장하고, 문서 작성 시 사용자 입력 키워드와 연관된 추천어를 실시간으로 추출하여 제공함으로써, 문서 작성 시간을 단축할 수 있는 과거이력 기반 실시간 문서작성 추천 시스템을 제공하는 것이다.
또한, 사용자가 입력한 키워드를 포함하는 다수개의 문장을 추천하여 문서 작성시 필요한 적절한 표현이나 전문 용어, 사전적 용어를 제공함으로써, 문서 작성의 편의성을 높일 수 있는 과거이력 기반 실시간 문서작성 추천 시스템을 제공하는 것이다.
본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템은용자 과거 이력 데이터를 수집 및 분석하는 데이터 수집부, 상기 데이터 수집부로부터 상기 사용자가 입력한 단어, 문자, 문장, 기호 적어도 하나를 식별하여 데이터베이스에 저장하고, 상기 사용자의 선호도를 반영하여 선호객체를 산출하는 선호 객체처리부, 상기 선호 객체처리부에서 산출된 선호객체를 형태소, 어휘의미, 구문, 개체명에 따라 색인하여 색인별로 구분하여 저장하는 추천어 저장부, 상기 사용자에 의해 웹브라우저에 입력된 키워드를 식별하여 상기 추천어 저장부로부터 상기 사용자가 입력한 키워드와 연관된 적어도 하나의 추천어를 제공하는 추천어 추천부 및 상기 추천어 추천부로부터 제공된 다수의 추천어를 노출하는 추천어 출력부를 포함할 수 있다.
본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템의 상기 데이터 수집부는, 상기 사용자의 과거 웹 검색 이력, 문서 작성 이력을 바탕으로 빅데이터를 생성하여 사용자별로 검색, 작성 빈도의 순에 따라 소정 개수의 리스트를 추출할 수 있다.
본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템의상기 선호 객체처리부는, 상기 데이터 수집부로부터 제공받은 상기 사용자 과거 이력 데이터를 분석하여 기설정된 기간동안 다수 사용된 객체를 제 1선호도로 산출하고, 상기 사용자가 지정한 특정 객체를 제 2선호도로 산출하여 상기 제 1선호도, 상기 제 2선호도 중 적어도 하나를 이용하여 최종 선호 객체를 산출할 수 있다.
본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템의 상기 추천어 추천부는, 상기 사용자가 입력한 키워드가 상기 추천어 저장부의 데이터에 포함되는지 여부에 기초하여 상기 키워드가 포함된 추천어를 다수개 생성할 수 있다.
본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템의상기 추천어 추천부는, 상기 사용자가 키워드를 입력하는 것에 대응하여 상기 추천어를 실시간으로 사용자에게 제공할 수 있다.
본 발명에 의하면, 사용자의 과거 이력을 기반으로 자주 사용하는 단어, 문장, 기호 등을 하나 이상의 색인에 따라 분류하여 각 색인별로 이를 저장하고, 문서 작성 시 사용자 입력 키워드와 연관된 추천어를 실시간으로 추출하여 제공함으로써, 문장을 일일이 타이핑 해야하는 번거로움을 해소하고 문서 작성 시간을 단축할 수 있는 효과가 있다.
또한, 사용자가 입력한 키워드를 포함하는 다수개의 문장을 추천하여 문서 작성시 필요한 적절한 표현이나 전문 용어, 사전적 용어를 제공함으로써, 문서 작성의 편의성을 높일 수 있는 효과가 있다.
도 1은 본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템의 구성을 도시한 블록도이다.
도 2는 본 발명의 일 실시례에 따른 데이터 수집부의 예시를 도시한 도면이다.
도 3은 본 발명의 일 실시례에 따른 선호 객체처리부를 도시한 도면이다.
이하에서는 도면을 참조하여 본 발명의 구체적인 실시례를 상세하게 설명한다. 다만, 본 발명의 사상은 제시되는 실시례에 제한되지 아니하고, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서 다른 구성요소를 추가, 변경, 삭제 등을 통하여, 퇴보적인 다른 발명이나 본 발명 사상의 범위 내에 포함되는 다른 실시례를 용이하게 제안할 수 있을 것이나, 이 또한 본원 발명 사상 범위 내에 포함된다고 할 것이다.
또한, 각 실시례의 도면에 나타나는 동일한 사상의 범위 내의 기능이 동일한 구성요소는 동일한 참조부호를 사용하여 설명한다.
도 1은 본 발명의 일 실시례에 따른 과거이력 기반 실시간 문서작성 추천 시스템의 구성을 도시한 블록도이다.
도 1을 참고하면, 본 발명의 과거이력 기반 실시간 문서작성 추천 시스템(100)은, 데이터 수집부(10), 선호 객체처리부(20), 추천어 저장부(30), 추천어 추천부(40), 추천어 출력부(50)를 포함할 수 있다.
상기 데이터 수집부(10)는, 사용자 과거 이력 데이터를 수집하여 이를 바탕으로 빅데이터를 생성할 수 있다.
도 2는 본 발명의 일 실시례에 따른 데이터 수집부(10)의 예시를 도시한 도면이다.
예를 들면, 상기 사용자 과거 이력 데이터는 블로그, 커뮤니티, 기타 웹상에서 상기 사용자가 사용한 단어, 문장, 어휘, 기호 등을 수집하거나, 논문, 논설, 기사, 독후감, 에세이, 일기 등 기타 문서를 작성 시 사용된 이력을 수집할 수 있다.
또한, 상기 사용자 과거 이력 데이터는, 사용자가 작성한 문서뿐만 아니라 타 사용자의 게시물에 대하여 상기 사용자가 호감을 표시하고 열람한 이력과 사용자의 교육과정 이력도 포함할 수 있다.
또한, 과거이력 기반 실시간 문서작성 추천 시스템(100)은 프로그램 형태로 사용자 단말기에 설치되어 수행될 수 있다. 이때, 과거이력 기반 실시간 문서작성 추천 시스템(100)은 상기 사용자 단말기의 쿠키(cookie) 정보를 이용하여 사용자별로 검색, 작성 빈도의 순에 따라 소정 개수의 리스트를 추출할 수도 있다.
도 3은 본 발명의 일 실시례에 따른 선호 객체처리부(20)의 예시를 도시한 도면이다.
상기 선호 객체처리부(20)는 상기 데이터 수집부(10)로부터 상기 사용자가 입력한 단어, 문자, 문장, 기호 중 적어도 하나를 식별하여 데이터베이스에 저장하고, 상기 사용자의 선호도를 반영하여 선호 객체를 산출할 수 있다.
또한, 상기 선호 객체처리부(20)는, 상기 데이터 수집부(10)로부터 제공받은 상기 사용자 과거 이력 데이터를 분석하여 기설정된 기간동안 다수 사용된 객체를 제 1선호도로 산출하고, 상기 사용자가 지정한 특정 객체를 제 2선호도로 산출하여 상기 제 1선호도, 상기 제 2선호도 중 적어도 하나를 이용하여 최종 선호 객체를 산출할 수 있다.
도 3을 참고하면, 상기 선호 객체처리부(20)는, 상기 데이터 수집부(10)로부터 제공받은 상기 사용자 과거 이력 데이터를 분석하여 상기 사용자가 자주 사용하는 단어, 문장, 어휘, 기호 등을 산출할 수 있다.
상기 선호 객체처리부(20)는 상기 데이터 수집부(10)로부터 제공받은 데이터에 근거하여 사용자별 객체 패턴을 산출하는 구성이다. 여기서 객체 패턴이란 사용자의 문체 성향을 제시하는 하나의 지표로서, 소정 시기 내지 일정 기간 동안 검색 또는 작성 빈도를 확인할 수 있는 통계 분석 결과이다.
실시례로, 상기 선호 객체처리부(20)는 기설정된 기간 동안 다수 사용된 객체를 제 1선호도로 산출하고, 상기 사용자가 지정한 특정 객체를 제 2선호도로 산출할 수 있다.
예를 들어, 주별, 월별, 년별로 설정한 기간 동안 상기 사용자가 “단어”또는“문장”또는“결과”등의 키워드를 다수 사용하였다면, 이를 상기 제 1선호도로 산출하여 작성 빈도에 따라 리스트를 출력할 수 있다.
그리고, 상기 사용자가 특정 단어, 문장, 기호, 사자성어, 명언, 전문용어 등을 선택하여 제 2선호도로 지정할 수 있다. 예를 들어, “맹모삼천”이라는 사자성어 또는“창의성의 비밀은 자신의 창의력의 원천을 숨길 줄 아는 것이다”라는 명언 키워드를 직접 지정하여 이를 상기 제 2선호도로 산출할 수 있다.
따라서, 상기 제 1선호도, 상기 제 2선호도 중 적어도 하나를 이용하여 최종선호 객체를 산출할 수 있다.
상기 추천어 저장부(30)는, 상기 선호 객체처리부(20)에서 산출된 선호객체를 형태소, 어휘의미, 구문, 개체명에 따라 색인하여 색인별로 구분하여 저장할 수 있다.
상기 형태소는 문장에서 의미를 가진 최소 단위인 형태소(명사, 동사, 형용사, 부사, 조사, 어미 등)을 구분하여 저장할 수 있다.
상기 어휘의미는 동음이의어, 다의어 등 어휘의 형태는 동일하지만 의미가 다른 어휘에 대해서 의미를 분석하여 주변 문맥을 고려해서 가장 적합한 의미를 찾아 표준국어대사전을 기반으로 저장할 수 있다.
상기 구문은 문장의 구조를 분석하여 문장 내 각 어절에 대해서 지배소 어절을 인식하고, 주격, 목적격과 같은 세부 의존관계 유형을 인식하여 저장할 수 있다.
상기 개체명은 인명, 지명, 기관명 등과 같은 개체명을 인식하여 저장할 수 있다.
또한, 상기 추천어 저장부(30)는 상기 데이터 수집부(10)로부터 수집된 데이터에 대하여, 상기 데이터가 정보전달 목적의 데이터인지, 사용자의 감상을 담은 데이터인지, 공식문서인지, 비공식문서인지 등 인공지능을 이용한 문장 및 키워드 분석으로 데이터를 종류에 따라 분류할 수 있다.
상기 추천어 추천부(40)는, 웹브라우저에 입력된 상기 사용자 입력 키워드를 식별하여 상기 추천어 저장부(30)로부터 상기 사용자 입력 키워드와 연관된 적어도 하나의 추천어를 제공할 수 있다.
상기 사용자가 입력한 키워드가 상기 추천어 저장부(30)의 데이터에 포함되는지 여부에 기초하여 상기 키워드를 포함하는 최적의 문장 또는 적절한 표현 등을 다수개 생성하여 추천할 수 있다.
예를 들어, 상기 사용자가 특정 키워드를 입력하면 그에 따른 문장 추천, 해당 키워드를 포함하는 사자성어, 관련 명언, 해당 키워드의 전문용어 등을 추천할 수 있다.
따라서, 상기 사용자가 문서 작성 시 적절한 표현이 생각나지 않을 때, 해당 키워드를 입력하면 이에 대응하는 적절한 표현이나 전문 용어, 사전적 용어들을 추천하여 문서 작성의 편의성을 높일 수 있다.
그리고, 상기 추천어 추천부(40)는, 상기 사용자가 키워드를 입력하는 것에 대응하여 상기 추천어를 실시간으로 사용자에게 제공하여 문장을 일일히 타이핑 해야하는 번거로움을 해소하고 문서 작성 시간을 단축할 수 있다.
또한, 상기 추천어 추천부(40)는, 공식문서와 비공식문서에서 사용하는 표현들을 구분하여 추천할 수 있다.
상기 데이터 수집부(10)에서 수집한 사용자의 과거 이력 문서들을 공식문서와 비공식문서로 분류하여, 공식문서 작성시에는 공식문서들에 빈번하게 사용되는 표현 등을 가중치 부여하여 추천하고, 비공식문서 작성시에는 비공식문서들에 빈번하게 사용되는 표현 등을 가중치 부여하여 추천할 수 있다.
또한, 상기 추천어 추천부(40)가 제공하는 상기 추천어에는 기호와 특수문자가 포함될 수 있다.
일례로, 상기 데이터 수집부(10)에서 제공받은 데이터에 섭씨온도 기호(°C)가 다수 포함되어있다면, 문서 작성중 사용자가 숫자 키워드를 입력했을 때, 섭씨온도 기호(°C)를 추천할 수 있다.
또한, 상기 추천어 추천부(40)는 사용자가 자주 사용하는 글꼴 서식도 추천할 수 있다.
상기 글꼴 서식에는 글꼴, 기울기, 굵기, 자간, 폰트 크기, 들여쓰기, 밑줄 기능 등이 포함될 수 있다.
상기 추천어 출력부(50)는, 상기 추천어 추천부(40)로부터 제공된 다수의 추천어를 노출할 수 있다.
또한, 상기 추천어 추천부(40)로부터 제공 받은 다수개의 추천어를 상기 사용자가 비교하여 해당 키워드에 대응하는 단어나 문장, 어휘, 기호 등을 직접 선택하여 출력할 수 있다.
<실시례 1>
또한, 본 발명의 일실시례에 따르면, 과거이력 기반 실시간 문서작성 추천 시스템은 맞춤형 정보 수집부를 더 포함할 수 있다.
상기 맞춤형 정보 수집부는 사용자의 성별, 나이, 직업, 관심분야, 웹검색 이력 등을 기반으로 정보를 수집함과 동시에 사용자가 현재 참여하고 있는 최소 2인 이상의 대화방내의 대화주제 및 협업주제에 대한 관련 정보를 수집할 수 있다.
또한, 본 발명의 일실시례에 따르면, 과거이력 기반 실시간 문서작성 추천 시스템은 빅데이터 정보 분석부를 더 포함할 수 있다.
상기 빅데이터 정보 분석부는 상기 맞춤형 정보 수집부로부터 수집된 정보 데이터를 기반으로 분석하여 분류할 수 있다.
이때, 상기 분류된 정보를 기반으로 사용자 정보 기반 자주 사용하는 단어, 사용자가 참여한 대화방 주제를 포함한 대화방 전체에 언급된 내용과 관련도 및 대화의 최신시간에 대하여 언급된 단어에 가중치를 두어 자동완성 시 우선순위를 매겨 자동완성 기능을 제공하고, 상기 가중치에 대하여 1~5사이의 기본 설정된 가중치 계수를 통해 자동완성 순위를 결정하되, 사용자의 사용 방식에 따라 가중치 계수를 재설정할 수 있고,
상기 자동완성 순위는 아래 [수학식 1]을 통해 산출한 값의 크기 순으로 순위를 결정지을 수 있다.
[수학식 1]
Figure 112020143671783-pat00001
여기서,
Figure 112021054487690-pat00017
는 자동완성 순위를 결정하는 스코어,
Figure 112021054487690-pat00018
는 사용자 데이터 분석 기반 가중치,
Figure 112021054487690-pat00019
는 메신저를 통한 주제에 대한 관련도 가중치,
Figure 112021054487690-pat00020
는 대화방 내에서의 특정 단어의 사용횟수의 총합,
Figure 112021054487690-pat00021
는 모든 대화방에서의 특정 단어의 총 사용횟수,
Figure 112021054487690-pat00022
는 최근 사용된 단어에 대한 가중치(t시간 전에 사용되었을때, t시간의 역수)임.
여기서, 사용자 데이터 분석 기반 가중치(
Figure 112020143671783-pat00008
) 는 사용자가 메신저를 통해 사용한 모든 정보를 빅데이터화하여 분석한 데이터를 단어나 문장에 빈도수에 비례하여 가중치를 결정할 수 있고, 대화 주제에 대한 관련도 가중치(
Figure 112020143671783-pat00009
)는 주제어에 대한 연관 키워드를 관련도에 따라 1~5단계로 나누어 가중치를 지정할 수 있으며, 최근시간순으로 사용된 단어의 가중치(
Figure 112020143671783-pat00010
)는 단어의 사용시간에 대한 역수를 가중치로 설정하여 향후 더 자주 쓰일것인지를 판단할 수 있다.
예를 들어 '단추'라는 단어가 30분전에 사용된 것이 마지막이라면 시간으로 계산했을 때 0.5시간 이므로 2의 가중치를 가지게 된다.
한편, 사용자 데이터 분석 기반 가중치(
Figure 112020143671783-pat00011
)와 관련도 가중치(
Figure 112020143671783-pat00012
)는 수집된 빅데이터를 기반으로 관련도에 따라 1~5까지의 크기로 가감될 수 있고, 최근 시간순으로 사용된 단어에 대한 가중치(
Figure 112020143671783-pat00013
)는 대화방에서 최초로 사용한 경우 1의 가중치를, 여러차례에 걸친 대화방의 협업에서 기존에 사용하였으나 당일 사용하지 않을경우 0.01의 가중치를, 당일 사용하였으나 사용하지 않은지 2시간이 지났을 경우 0.008의 가중치를, 2시간 이내에 t시간전에 마지막으로 사용이 되었을 경우 시간의 역수인 1/t로 가중치를 둘 수 있다.
<실시례 2>
한편, 과거이력 기반 실시간 문서작성 추천 시스템은 상기 문서작성 추천을 통해 작성된 문서가 연구노트로 자동생성 되도록 연구노트 변환부를 더 포함할 수 있다.
상기 연구노트 변환부는 상기 작성된 문서로부터 받은 데이터를 하나의 통일된 연구노트 형식으로 변환하여 사용자에게 제공할 수 있다.
상기 연구노트 변환부는 하나의 양식에 상기 작성된 문서 데이터를 재가공하여 변환함으로써, 사용자가 연구 자료와 정보를 용이하게 파악하고 관리할 수 있다.
그리고, 상기 연구노트 생성 시 삽입할 정보를 사용자에게 추가로 요청할 수 있다.
상기 요청에 따라 사용자로부터 추가로 입력 받은 정보를 기설정된 연구노트 형식에 맞추어 추가하고, 상기 작성된 문서로부터 받은 데이터와 조합하여 상기 연구노트를 생성할 수 있다.
또한, 상기 연구노트 생성 시 필요한 목차항목을 사용자가 선택할 수 있는 구성을 마련할 수 있다. 사용자가 선택한 항목에 대응하여 상기 연구노트를 생성하여 사용자가 가공되어 보여질 데이터의 가공 형태를 설정할 수 있다.
또한, 상기 연구노트 변환부에서 생성된 연구노트를 저장하고, 상기 연구노트에 대한 사용자의 내용 변경이 있는 경우, 그 변경된 내용으로 상기 연구노트를 재저장하는 연구노트 관리부를 더 포함할 수 있다.
상기 연구노트 관리부는 상기 연구노트의 내용을 삭제, 복사, 이동시키거나 내용을 편집하는 기능을 제공할 수 있을 뿐만 아니라, 연구노트 편집도구를 이용하여 글씨 크기, 글자 정렬, 문단 조절, 사진 삽입 등의 편집기능을 사용할 수 있다.
따라서, 사용자는 작성한 연구노트의 내용을 선택적으로 삭제, 복사, 이동시킬 수 있어 연구노트를 더 편리하게 작성할 수 있다.
또한, 사용자는 상기 연구노트의 내용 중 필요한 내용을 담고 있는 부분만을 추출하여, 새로운 문서를 생성하거나 해당 내용을 열람할 수 있다.
또한, 본 발명의 일실시례에 따른, 과거이력 기반 실시간 문서작성 추천 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상기에서는 본 발명에 따른 실시례를 기준으로 본 발명의 구성과 특징을 설명하였으나 본 발명은 이에 한정되지 않으며, 본 발명의 사상과 범위 내에서 다양하게 변경 또는 변형할 수 있음은 본 발명이 속하는 기술분야의 당업자에게 명백한 것이며, 따라서 이와 같은 변경 또는 변형은 첨부된 특허청구범위에 속함을 밝혀둔다.
100: 과거이력 기반 실시간 문서작성 추천 시스템
10: 데이터 수집부
20: 선호 객체처리부
30: 추천어 저장부
40: 추천어 추천부
50: 추천어 출력부

Claims (5)

  1. 사용자 과거 이력 데이터를 수집 및 분석하는 데이터 수집부(10);
    상기 데이터 수집부(10)로부터 상기 사용자가 입력한 단어, 문자, 문장, 기호 중 적어도 하나를 식별하여 데이터베이스에 저장하고, 상기 사용자의 선호도를 반영하여 선호객체를 산출하는 선호 객체처리부(20);
    상기 선호 객체처리부(20)에서 산출된 선호객체를 형태소, 어휘의미, 구문, 개체명에 따라 색인하여 색인별로 구분하여 저장하는 추천어 저장부(30);
    상기 사용자에 의해 웹브라우저에 입력된 키워드를 식별하여 상기 추천어 저장부(30)로부터 상기 사용자가 입력한 키워드와 연관된 적어도 하나의 추천어를 제공하는 추천어 추천부(40); 및
    상기 추천어 추천부(40)로부터 제공된 다수의 추천어를 노출하는 추천어 출력부(50);를 포함하고,

    작성된 문서를 하나의 통일된 연구노트 형식으로 변환하는 연구노트 변환부;
    상기 사용자의 성별, 나이, 직업, 관심분야, 웹검색 이력 등을 기반으로 정보를 수집함과 동시에 상기 사용자가 상기 웹브라우저 내에서 현재 참여하고 있는 최소 2인 이상의 대화방 내의 대화주제 및 협업주제에 대한 관련 정보를 수집하는 맞춤형 정보 수집부; 및
    상기 맞춤형 정보 수집부로부터 수집된 정보 데이터를 기반으로 분석하여 분류하는 빅데이터 정보 분석부;
    를 더 포함하며,

    상기 데이터 수집부(10)는,
    상기 사용자의 과거 웹 검색 이력, 문서 작성 이력을 바탕으로 빅데이터를 생성하여 사용자별로 검색, 작성 빈도의 순에 따라 소정 개수의 리스트를 추출하고,

    상기 선호 객체처리부(20)는,
    상기 데이터 수집부(10)로부터 제공받은 상기 사용자 과거 이력 데이터를 분석하여 기설정된 기간동안 다수 사용된 객체를 제 1선호도로 산출하고, 상기 사용자가 지정한 특정 객체를 제 2선호도로 산출하여 상기 제 1선호도, 상기 제 2선호도 중 적어도 하나를 이용하여 최종 선호 객체를 산출하며,

    상기 추천어 저장부(30)는,
    상기 데이터 수집부(10)에서 수집된 데이터에 포함된 문장 및 키워드를 분석하여 상기 데이터의 작성 목적을 공식 문서 데이터 및 비공식 문서 데이터 중 적어도 어느 하나로 구분하여 저장하고,

    상기 추천어 추천부(40)는,
    상기 사용자가 입력한 키워드가 상기 추천어 저장부(30)의 데이터에 포함되는지 여부에 기초하여 상기 키워드가 포함된 추천어를 다수개 생성하며,

    상기 추천어 추천부(40)는,
    상기 사용자가 키워드를 입력하는 것에 대응하여 상기 추천어를 실시간으로 사용자에게 제공하되,
    상기 데이터 수집부(10)에 입력되는 키워드가 상기 공식 문서 데이터에서 사용되는 키워드를 포함하는 경우, 상기 데이터 수집부(10)에서 수집된 상기 사용자 과거 이력 데이터에 기초하여 상기 공식 문서 데이터에서만 사용되는 표현에 가중치를 부여하여 추천하고,
    상기 데이터 수집부(10)에 입력되는 키워드가 상기 비공식 문서 데이터에서 사용되는 키워드를 포함하는 경우, 상기 사용자 과거 이력 데이터에 기초하여 상기 비공식 문서 데이터에서만 사용되는 표현에 가중치를 부여하여 추천하며,

    상기 빅데이터 정보 분석부는,
    상기 맞춤형 정보 수집부에서 수집된 정보에 기초하여 상기 사용자가 자주 사용하는 단어, 상기 사용자가 상기 웹브라우저 내에서 참여한 대화방 주제를 포함한 대화방 전체에 언급된 내용과 관련도 및 대화의 최신시간에 대하여 언급된 단어에 가중치를 두어 자동완성 시 우선순위를 매겨 자동완성 기능을 제공하고, 상기 가중치에 대하여 1 ~ 5사이의 기본 설정된 가중치 계수를 통해 자동완성 순위를 결정하되,
    상기 자동완성 순위는 하기 [수학식 1]을 통해 산출한 값의 크기 순으로 순위를 결정되고,

    [수학식 1]
    Figure 112021107395844-pat00023

    여기서,
    Figure 112021107395844-pat00024
    는 자동완성 순위를 결정하는 스코어,
    Figure 112021107395844-pat00025
    는 사용자 데이터 분석 기반 가중치,
    Figure 112021107395844-pat00026
    는 메신저를 통한 주제에 대한 관련도 가중치,
    Figure 112021107395844-pat00027
    는 대화방 내에서의 특정 단어의 사용횟수의 총합,
    Figure 112021107395844-pat00028
    는 모든 대화방에서의 특정 단어의 총 사용횟수,
    Figure 112021107395844-pat00029
    는 최근 사용된 단어에 대한 가중치(t시간 전에 사용되었을때, t시간의 역수)임,

    상기 사용자 데이터 분석 기반 가중치(
    Figure 112021107395844-pat00030
    ) 는 사용자가 메신저를 통해 사용한 모든 정보를 빅데이터화하여 분석한 데이터를 단어나 문장에 빈도수에 비례하여 가중치가 결정되고,
    상기 대화 주제에 대한 관련도 가중치(
    Figure 112021107395844-pat00031
    )는 주제어에 대한 연관 키워드를 관련도에 기초하여 1 ~ 5단계 중 어느 하나의 단계의 대응되는 값으로 결정하는 것을 특징으로 하는 과거이력 기반 실시간 문서작성 추천 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
KR1020200188377A 2020-12-30 2020-12-30 과거이력 기반 실시간 문서작성 추천 시스템 KR102414391B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200188377A KR102414391B1 (ko) 2020-12-30 2020-12-30 과거이력 기반 실시간 문서작성 추천 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200188377A KR102414391B1 (ko) 2020-12-30 2020-12-30 과거이력 기반 실시간 문서작성 추천 시스템

Publications (1)

Publication Number Publication Date
KR102414391B1 true KR102414391B1 (ko) 2022-06-29

Family

ID=82270333

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200188377A KR102414391B1 (ko) 2020-12-30 2020-12-30 과거이력 기반 실시간 문서작성 추천 시스템

Country Status (1)

Country Link
KR (1) KR102414391B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115577167A (zh) * 2022-08-29 2023-01-06 建信金融科技有限责任公司 基于Webassembly的内容推荐方法、装置、设备及存储介质
KR102581936B1 (ko) * 2022-09-30 2023-09-21 에스케이 주식회사 드래그 앤 드롭 입력 방식을 적용하여 웹 문서를 생성하는 방법 및 시스템
CN117725314A (zh) * 2023-12-18 2024-03-19 无锡市泛亚资讯网络有限公司 一种基于关键字的网站管理推广方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101450453B1 (ko) * 2013-05-10 2014-10-13 서울대학교산학협력단 컨텐츠 추천 방법 및 장치
KR20180117506A (ko) * 2017-04-19 2018-10-29 (주)휴먼웍스 빅데이터 기반의 인공지능을 활용한 메시지 서비스의 개인 맞춤형 문장마디 제시 방법과 시스템
KR102166516B1 (ko) 2020-07-27 2020-10-15 김밀알 인공 지능 기반의 문서 자동 작성 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101450453B1 (ko) * 2013-05-10 2014-10-13 서울대학교산학협력단 컨텐츠 추천 방법 및 장치
KR20180117506A (ko) * 2017-04-19 2018-10-29 (주)휴먼웍스 빅데이터 기반의 인공지능을 활용한 메시지 서비스의 개인 맞춤형 문장마디 제시 방법과 시스템
KR102166516B1 (ko) 2020-07-27 2020-10-15 김밀알 인공 지능 기반의 문서 자동 작성 시스템

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115577167A (zh) * 2022-08-29 2023-01-06 建信金融科技有限责任公司 基于Webassembly的内容推荐方法、装置、设备及存储介质
CN115577167B (zh) * 2022-08-29 2023-11-21 建信金融科技有限责任公司 基于Webassembly的内容推荐方法、装置、设备及存储介质
KR102581936B1 (ko) * 2022-09-30 2023-09-21 에스케이 주식회사 드래그 앤 드롭 입력 방식을 적용하여 웹 문서를 생성하는 방법 및 시스템
CN117725314A (zh) * 2023-12-18 2024-03-19 无锡市泛亚资讯网络有限公司 一种基于关键字的网站管理推广方法及系统
CN117725314B (zh) * 2023-12-18 2024-06-07 无锡市泛亚资讯网络有限公司 一种基于关键字的网站管理推广方法及系统

Similar Documents

Publication Publication Date Title
KR102414391B1 (ko) 과거이력 기반 실시간 문서작성 추천 시스템
US9483532B1 (en) Text processing system and methods for automated topic discovery, content tagging, categorization, and search
US9460195B1 (en) System and methods for determining term importance, search relevance, and content summarization
RU2571373C2 (ru) Метод анализа тональности текстовых данных
El-Haj et al. Creating language resources for under-resourced languages: methodologies, and experiments with Arabic
Saldanha Style of Translation: An exploration of stylistic patterns in the translations of Margaret Jull Costa and Peter Bush
JPH1173417A (ja) テキストジャンル識別方法
Dorr et al. Machine translation evaluation and optimization
Smith et al. Corpus tools and methods, today and tomorrow: Incorporating linguists’ manual annotations
WO2007105202A2 (en) Automatic reusable definitions identification (rdi) method
Wynne Searching and concordancing
Bisiada Translation and editing: a study of editorial treatment of nominalisations in draft translations
Knight et al. Developing computational infrastructure for the CorCenCC corpus: the national corpus of contemporary Welsh
Hassel Evaluation of automatic text summarization
Kerremans et al. Using data-mining to identify and study patterns in lexical innovation on the web: The NeoCrawler
McGillivray et al. Applying language technology in humanities research: Design, application, and the underlying logic
US6973423B1 (en) Article and method of automatically determining text genre using surface features of untagged texts
Salway et al. Investigating Curatorial Voice with Corpus Linguistic Techniques: the case of Dorothy George and applications in museological practice
Dimitrova et al. Implementation of the Bulgarian-Polish online dictionary
JP5679400B2 (ja) カテゴリ主題語句抽出装置及び階層的タグ付与装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
Tamboli et al. Author identification with feature transformation method
Brookes et al. Corpus linguistics for indexing
Hu et al. A corpus-based study of the distributions of adnominals across registers and disciplines
Jatowt et al. Document in Context of its Time (DICT) Providing Temporal Context to Support Analysis of Past Documents

Legal Events

Date Code Title Description
GRNT Written decision to grant