KR102345818B1 - 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템 - Google Patents

텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템 Download PDF

Info

Publication number
KR102345818B1
KR102345818B1 KR1020210081930A KR20210081930A KR102345818B1 KR 102345818 B1 KR102345818 B1 KR 102345818B1 KR 1020210081930 A KR1020210081930 A KR 1020210081930A KR 20210081930 A KR20210081930 A KR 20210081930A KR 102345818 B1 KR102345818 B1 KR 102345818B1
Authority
KR
South Korea
Prior art keywords
target
speech
word
words
connectivity
Prior art date
Application number
KR1020210081930A
Other languages
English (en)
Inventor
김기영
Original Assignee
주식회사 아티피셜 소사이어티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아티피셜 소사이어티 filed Critical 주식회사 아티피셜 소사이어티
Priority to KR1020210081930A priority Critical patent/KR102345818B1/ko
Application granted granted Critical
Publication of KR102345818B1 publication Critical patent/KR102345818B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템에 관한 것으로, 시스템이 주어진 텍스트 데이터에 포함된 복수의 문장으로부터 필터링하고자 하는 적어도 하나의 타겟 품사를 설정하는 단계, 상기 복수의 문장으로부터 타겟 품사에 해당되는 복수의 타겟 단어를 검색하는 단계, 복수의 문장으로부터 복수의 타겟 단어 각각의 출현 빈도 및 복수의 타겟 단어 사이의 연결성을 분석하는 단계 및 복수의 타겟 단어에 대한 출현 빈도 및 연결성을 마인드맵으로 표시하는 단계를 포함하되, 마인드맵은 복수의 타겟 단어 중 적어도 일부가 노드로 표시되고 노드 사이가 에지 라인에 의해 연결되는 형태를 가지고, 노드의 표시 영역은 노드에 표시되는 타겟 단어 각각의 출현 빈도에 따라 다른 크기로 표시되고, 에지 라인은 노드에 표시되는 타겟 단어 사이의 연결성 정도에 따라 서로 다른 두께 또는 색상으로 표시된다.

Description

텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템{System and method of generating the mind map of the structure of thought with targeted part-of-speech words from text data}
본 발명은 텍스트 데이터의 타게팅된 품사의 단어를 마인드맵으로 구성하여 텍스트 생성자의 사고구조를 파악하는 방법 및 시스템에 관한 것이다.
사람은 말로 마음의 관심사를 표현한다.
최근에는 사람의 말을 음성 인식을 통해 텍스트로 변환하는 STT(speech-to-text) 기술이 많이 연구되어 사용자 편의성이 높은 서비스들이 출시되고 있다.
한편 소셜 네트워크 서비스(SNS) 등에 기재된 텍스트 메시지를 이용하여 사람의 감정을 분석하여 서비스에 활용하는 사례도 늘어나고 있다.
그러나, 종래의 기술들은 전체 데이터를 문장 또는 단어 단위로 분해하여 이해함으로써 사람의 마음이나 머리에 어떠한 생각을 가지고 있는지, 주된 관심사는 무엇인지에 대한 종합적인 분석에는 한계가 있었다.
한국 공개특허10-2001-0026991
본 발명이 해결하려는 과제는, 텍스트 데이터의 타게팅된 품사의 단어를 마인드맵으로 구성하여 텍스트 생성자의 사고구조를 파악하는 방법 및 시스템을 제공하는데, 그 목적이 있다.
본 발명의 일례에 따라 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법은 시스템이 주어진 텍스트 데이터에 포함된 복수의 문장으로부터 필터링하고자 하는 적어도 하나의 타겟 품사를 설정하는 단계, 상기 시스템이 상기 복수의 문장으로부터 상기 적어도 하나의 타겟 품사에 해당되는 복수의 타겟 단어를 검색하는 단계, 상기 시스템이 상기 복수의 문장으로부터 상기 복수의 타겟 단어 각각의 출현 빈도 및 상기 복수의 타겟 단어 사이의 연결성을 분석하는 단계 및 상기 시스템이 상기 복수의 타겟 단어에 대한 상기 출현 빈도 및 상기 연결성을 마인드맵으로 표시하는 단계를 포함하되, 상기 표시하는 단계에서, 상기 마인드맵은 상기 복수의 타겟 단어 중 적어도 일부가 노드로 표시되고 상기 노드 사이가 에지 라인에 의해 연결되는 형태를 가지고, 상기 노드의 표시 영역은 상기 노드에 표시되는 타겟 단어 각각의 상기 출현 빈도에 따라 다른 크기로 표시되고, 상기 에지 라인은 상기 노드에 표시되는 타겟 단어 사이의 상기 연결성 정도에 따라 서로 다른 두께 또는 색상으로 표시된다.
상기 설정하는 단계 이전에, 상기 시스템이 음성을 인식하여 상기 텍스트 데이터로 변환하는 단계를 더 포함할 수 있다.
상기 설정하는 단계에서, 상기 타겟 품사는 상기 시스템에 사전에 설정되어 있거나 상기 시스템의 사용자로부터 입력받아 설정될 수 있다.
상기 설정하는 단계에서 설정되는 상기 타겟 품사는 명사, 형용사 및 동사 중 적어도 하나를 포함할 수 있다.
상기 설정하는 단계에서 설정되는 상기 타겟 품사에서 대명사, 조사, 부사 및 감탄사 중 적어도 하나는 제외될 수 있다.
상기 검색하는 단계에서 상기 시스템은 상기 타겟 품사에 해당되는 상기 복수의 타겟 단어 각각의 형태소를 검색할 수 있다.
상기 분석하는 단계에서, 상기 시스템은 상기 복수의 문장 전체에서 상기 복수의 타겟 단어 각각의 형태소에 대한 출현 빈도를 산출하고, 상기 복수의 문장에 포함된 각 문장 내에서 상기 복수의 타겟 단어 각각의 형태소 사이의 연결성에 대한 값을 산출할 수 있다.
상기 분석하는 단계에서, 상기 시스템은 상기 출현 빈도에 따라 상기 복수의 타겟 단어 각각에 대한 가중치를 다르게 부여할 수 있다.
상기 분석하는 단계에서, 상기 시스템은 상기 복수의 문장 중 어느 하나의 제1 문장 내에 상기 복수의 타겟 단어 중 어느 하나인 제1 타겟 단어에 대한 형태소와 다른 하나인 제2 타겟 단어에 대한 형태소가 포함된 경우, 상기 제1 타겟 단어와 상기 제2 타겟 단어 사이의 연결성이 있는 것으로 판단하고, 상기 제1 문장에 상기 제1 타겟 단어에 대한 형태소가 포함되고, 상기 제1 문장과 다른 제2 문장에 상기 제2 타겟 단어에 대한 형태소가 포함되는 경우, 상기 제1 타겟 단어와 상기 제2 타겟 단어 사이의 연결성이 없는 것으로 판단할 수 있다.
상기 분석하는 단계에서, 상기 시스템은 상기 제1 문장 내에 포함된 상기 제1 타겟 단어에 대한 형태소와 상기 제2 타겟 단어에 대한 형태소 사이의 거리에 따라 상기 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여할 수 있다.
상기 분석하는 단계에서, 상기 시스템은 상기 제1 문장 내에 포함된 상기 제1, 2 타겟 단어가 서로 동일한 품사인지 또는 다른 품사인지에 따라 상기 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여할 수 있다.
상기 표시하는 단계에서, 상기 시스템은 상기 복수의 타겟 단어 중 상기 출현 빈도가 미리 설정된 임계치를 만족하는 타겟 단어를 상기 노드로 표시할 수 있다.
상기 복수의 타겟 단어는 제1 출현 빈도를 갖는 제1 타겟 단어와 상기 제1 출현 빈도보다 낮은 제2 출현 빈도를 갖는 제2 타겟 단어를 포함하는 경우, 상기 표시하는 단계에서, 상기 시스템은 상기 제1 타겟 단어에 대한 노드의 표시 영역을 상기 제2 타겟 단어에 대한 노드의 표시 영역보다 크게 표시할 수 있다.
상기 복수의 타겟 단어는 제1, 2, 3 타겟 단어를 포함하되, 상기 제1, 2 타겟 단어 사이의 연결성에 대한 값은 제1 값을 가지며, 상기 제2, 3 타겟 단어 사이의 연결성에 대한 값은 상기 제1 값보다 작은 제2 값을 가지는 경우, 상기 표시하는 단계에서, 상기 시스템은 상기 제1, 2 타겟 단어 사이의 연결성을 표시하는 제1 에지 라인의 두께를 상기 제2, 3 타겟 단어 사이의 연결성을 표시하는 제2 에지 라인의 두께보다 크게 표시할 수 있다.
상기 타겟 품사가 형용사 또는 동사를 포함하는 경우, 상기 표시하는 단계에서, 상기 시스템은 형용사 또는 동사의 기본형을 상기 타겟 단어의 노드로 표시할 수 있다.
본 발명의 일례에 따라 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 시스템은 메모리 및 상기 메모리와 연결되고, 상기 메모리에 포함된 명령들을 실행하도록 구성된 프로세서를 포함하고, 상기 프로세서가 주어진 텍스트 데이터에 포함된 복수의 문장으로부터 필터링하고자 하는 적어도 하나의 타겟 품사를 설정하도록 제어하고, 상기 복수의 문장으로부터 상기 적어도 하나의 타겟 품사에 해당되는 복수의 타겟 단어를 검색하 도록 제어하고, 상기 복수의 문장으로부터 상기 복수의 타겟 단어 각각의 출현 빈도 및 상기 복수의 타겟 단어 사이의 연결성을 분석하도록 제어하고, 상기 복수의 타겟 단어에 대한 상기 출현 빈도 및 상기 연결성을 마인드맵으로 표시하도록 제어하되, 상기 마인드맵은 상기 복수의 타겟 단어 중 적어도 일부가 노드로 표시되고 상기 노드 사이가 에지 라인에 의해 연결되는 형태를 가지고, 상기 노드의 표시 영역은 상기 노드에 표시되는 타겟 단어 각각의 상기 출현 빈도에 따라 다른 크기로 표시되고, 상기 에지 라인은 상기 노드에 표시되는 타겟 단어 사이의 상기 연결성 정도에 따라 서로 다른 두께 또는 색상으로 표시된다.
본 발명은 주어진 텍스트 데이터로부터 설정된 타겟 품사에 해당되는 타겟 단어를 검색하고, 타겟 단어의 출현 빈도 및 타겟 단어사이의 연결성을 고려한 해당 단어의 중요도를 분석하여 마인드맵으로 표시되도록 함으로써, 텍스트 데이터를 제공한 분석 대상자의 사고 구조 및 생각이나 관심사가 보다 직관적으로 파악되도록 할 수 있다.
이에 따라, 본 발명은 분석 대상자에게 분석 대상자의 종합적인 사고구조를 파악함으로써 관심사가 높은 상품 정보를 제공하거나 교육 자료 및 인지 건강 자료를 제공할 수 있다.
도 1은 본 발명의 일례에 따른 텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 시스템을 설명하기 위한 도이다.
도 2는 본 발명의 시스템이 텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법의 일례를 설명하기 위한 도이다.
도 3은 본 발명의 시스템에 주어진 텍스트 데이터의 일례이다.
도 4는 본 발명의 시스템이 주어진 텍스트 데이터의 각 문장에서 복수의 타겟 단어를 검색하는 방법의 일례를 설명하기 위한 도이다.
도 5는 본 발명의 시스템이 각 문장에서 복수의 타겟 단어 각각의 출현 빈도 및 타겟 단어 사이의 연결성 값을 산출하는 방법의 일례를 설명하기 위한 도이다.
도 6는 본 발명의 시스템이 주어진 텍스트의 전체 문장에서 복수의 타겟 단어 각각의 출현 빈도 및 타겟 단어 사이의 연결성 값을 산출하는 방법의 일례를 설명하기 위한 도이다.
도 7은 본 발명의 시스템이 주어진 텍스트로부터 분석된 타겟 품사에 대한 단어를 마인드맵으로 표시한 일례이다.
도 8은 본 발명의 시스템에 타겟 품사가 복수로 설정된 경우, 타겟 단어를 검색하고, 출현 빈도 및 연결성 값을 산출하는 방법의 일례를 설명하기 위한 도이다.
도 9는 타겟 품사가 복수로 설정된 경우, 본 발명의 시스템이 복수의 타겟 품사에 대한 단어를 마인드맵으로 표시한 일례이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, 설명되는 각 단계들은 특별한 인과관계에 의해 나열된 순서에 따라 수행되어야 하는 경우를 제외하고, 나열된 순서와 상관없이 수행될 수 있다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부된 도면들을 참조하여 본 발명에 대해 설명한다.
도 1은 본 발명의 일례에 따른 텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 시스템을 설명하기 위한 도이다.
도 1에 도시된 바와 같이, 본 발명의 일례에 따른 타겟 단어가 포함된 문장 생성 시스템은 프로세서(100), 메모리(200), 입력부(300), 출력부(400) 및 통신부(500)를 포함할 수 있다.
도 1에 도시된 본 발명의 일례에 따른 시스템은 스마트폰(smart phone), 휴대폰, 태블릿 PC, 컴퓨터, 노트북, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player) 등을 포함할 수 있다.
도 1에서는 시스템은 인터넷 네트워크를 통하여 공간적으로 이격되는 외부 단말과 통신을 수행할 수 있는 통신 모듈이 도시되지는 않았지만, 경우에 따라서 통신 모듈이 구비될 수도 있다.
아울러, 도 1에서는 입력부(300)와 출력부(400)를 함께 구비한 경우를 일례로 도시하였으나, 본 발명은 이에 한정되는 것은 아니고, 도 1의 시스템에서 입력부(300)와 출력부(400)가 생략되고, 통신 모듈이 구비될 수도 있다. 이와 같은 경우, 입력부(300)와 출력부(400)가 인터넷 네트워크를 통하여 시스템에 연동되는 외부 단말에 구비되는 것도 가능하다.
이하에서는 설명의 편의상 도 1과 같이, 본 발명의 시스템이 메모리(200), 프로세서(100), 입력부(300), 출력부(400) 및 통신부(500)를 모두 구비한 경우를 일례로 설명한다.
메모리(200)는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있으며, 인터넷(internet)상에서 메모리(200)의 저장 기능을 수행하는 웹 스토리지(webstorage) 형태도 포함될 수 있다.
또한, 메모리(200)에는 운영체제나 적어도 하나의 프로그램 코드가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(200)와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다.
이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리(200) 카드 등의 컴퓨터에서 판독 가능한 기록 매체를 포함할 수 있다.
이와 같은 메모리(200)에는 일례로, 텍스트 데이터를 설정된 타겟 품사에 따라 분석하여 타겟 품사에 해당하는 타겟 단어의 출현 빈도 및 연결성 정도에 따라 마인드맵으로 표시하는 프로그램이 저장될 수 있으며, 분석의 대상이 되는 텍스트 데이터가 저장될 수 있다. 또한, 메모리(200)에는 시스템의 동작 중에 발생되는 타겟 단어, 타겟 단어의 출현 빈도 및 타겟 단어 사이의 연결성 정도에 대한 결과값 등이 저장될 수 있다.
여기서, 텍스트 데이터는 복수의 문장을 포함하는 문자 정보를 포함하며 분석 대상자로부터 입력된 데이터일 수 있다. 일례로, 텍스트 데이터는 분석 대상자에 의해 음성으로 입력된 음원 형태의 데이터가 텍스트 형태로 변환된 데이터일 수 있다.
타겟 품사는 시스템이 텍스트 데이터로부터 필터링하고자 설정된 품사를 의미하고, 시스템은 실질적으로 의미를 가지는 품사를 타겟 품사로 설정할 수 있다.
일례로, 시스템은 실질적 의미를 내포하는 명사, 형용사 및 동사 중 적어도 하나를 타겟 품사로 설정할 수 있으며, 실질적 의미를 상대적으로 적게 내포하거나 거의 내포하지 않는 대명사, 조사, 부사 및 감탄사 중 적어도 하나는 타겟 품사로 설정되지 않을 수 있다. 그러나, 본 발명이 이에 한정되는 것은 아니다.
이와 같은 타겟 품사는 텍스트 데이터가 입력되기 전부터 시스템에 사전에 설정되어 있거나 시스템의 사용자로부터 입력받아 설정될 수 있다.
이와 같이 타겟 품사가 설정된 경우, 시스템은 텍스트 데이터로부터 타겟 품사에 해당되는 타겟 단어를 검색할 수 있다. 이와 같이 텍스트 데이터로부터 검색되는 타겟 단어는 복수 개일 수 있다. 예를 들어, 타겟 품사가 명사로 설정된 경우, 시스템은 텍스트 데이터로부터 명사에 해당되는 단어를 검색할 수 있다.
마인드맵은 검색된 복수의 타겟 단어 중 적어도 일부의 타겟 단어가 노드로 표시되고, 노드로 표시된 각 타겟 단어 사이가 에지 라인으로 연결된 형태의 지도를 의미할 수 있다.
프로세서(100)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(200) 또는 통신 모듈(미도시)에 의해 프로세서(100)로 제공될 수 있다. 예를 들어 프로세서(100)는 메모리(200)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.
이에 따라, 프로세서(100)는 주어진 텍스트로부터 타겟 품사에 해당하는 복수의 타겟 단어를 검색하여 전술한 타겟 단어의 출현 빈도 및 연결성을 분석하여 마인드맵에 대한 정보를 생성할 수 있다.
입력부(300)는 분석 대상자로부터 음원 형태의 데이터를 입력받거나 시스템의 사용자로부터 타겟 품사의 입력을 받는 기능을 수행하며, 일례로, 입력부(300)는 키보드, 마우스, 터치 센서, 마이크와 같은 물리적인 입력 장치를 포함할 수 있다.
만약 입력부(300)가 분석 대상자로부터 음원 형태의 데이터를 입력받은 경우, 프로세서는 음원 형태의 데이터를 분석하여 텍스트 데이터로 변환할 수 있다.
출력부(400)는 프로세서에 의해 생성된 마인드맵에 대한 정보를 표시하는 기능을 수행하며, 일례로, 모니터, 터치 스크린, 스피커와 같은 물리적 디스플레이 장치를 포함할 수 있다.
통신부(500)는 시스템이 인터넷 네트워크 등을 이용하여 외부 단말과 통신을 수행할 수 있다. 만약 분석 대상자가 이동 단말기를 이용하여 음원 형태의 데이터를 시스템으로 전송하는 경우, 통신부(500)는 이를 수신하여 메모리에 저장할 수 있다. 이와 같은 경우 시스템은 외부로부터 입력된 음원 형태의 데이터를 텍스트 데이터로 변환하여 분석을 수행할 수 있다.
이하에서는, 본 발명의 시스템이 텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법에 대해 설명한다.
도 2는 본 발명의 시스템이 텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법의 일례를 설명하기 위한 도이다.
본 발명의 시스템이 텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법의 일례는 도 2에 도시된 바와 같이, 변환하는 단계(S100), 설정하는 단계(S200), 검색하는 단계(S300), 분석하는 단계(S400) 및 표시하는 단계(S500)를 포함할 수 있다.
도 2에서는, 각 단계가 시계열적 순서에 따라 수행되는 경우를 일례로 도시하였지만, 본 발명은 이에 한정되는 것은 아니고, 설정하는 단계(S200)와 변환하는 단계(S100)의 순서가 변경될 수도 있으며, 변환하는 단계(S100)가 생략될 수도 있다. 이하에서는 설명의 편의상 도 2와 같은 순서로 설명한다.
변환하는 단계(S100)에서는 시스템이 분석 대상자의 음성을 인식하여 텍스트 데이터로 변환할 수 있다. 일례로, 변환하는 단계(S100)에서는 시스템에 구비된 입력부로 마이크가 구비된 경우, 시스템은 마이크를 통하여 분석 대상자의 음성을 입력받을 수 있으며, 프로세서가 입력된 분석 대상자의 음원 정보를 분석하여 텍스트 데이터로 변환할 수 있다.
또는 분석 대상자가 이동 단말기를 통하여 음성을 입력하여 시스템으로 전송한 경우, 시스템은 통신부(500)를 통하여 분석 대상자의 음원 정보를 수신하고 수신된 음원 형태의 데이터를 분석하여 텍스트 데이터로 변환할 수도 있다.
설정하는 단계(S200)에서는 시스템이 주어진 텍스트 데이터에 포함된 복수의 문장으로부터 필터링하고자 하는 적어도 하나의 타겟 품사를 설정할 수 있다.
설정하는 단계(S200)에서 타겟 품사는 시스템에 사전에 설정되어 있거나 입력부를 통하여 시스템의 사용자로부터 입력받아 설정될 수 있다.
여기서 설정되는 타겟 품사는 일례로, 실질적으로 의미를 내포하는 명사, 형용사 및 동사 중 적어도 하나를 포함할 수 있으며, 설정하는 단계(S200)에서 설정되는 타겟 품사에서 실질적으로 내포하는 의미가 적은 대명사, 조사, 부사 및 감탄사 중 적어도 하나는 제외될 수 있다.
검색하는 단계(S300)에서는, 시스템이 복수의 문장으로부터 적어도 하나의 타겟 품사에 해당되는 복수의 타겟 단어를 검색할 수 있다.
구체적으로 검색하는 단계(S300)에서는, 시스템이 타겟 품사에 해당하는 복수의 타겟 단어를 텍스트 데이터에서 검색할 수 있다.
여기서, 시스템은 타겟 품사에 해당되는 복수의 타겟 단어를 검색할 때, 타겟 단어의 각각의 형태소를 검색할 수 있다. 예를 들어, 타겟 단어가 명사인 경우 명사의 형태소를 검색할 수 있으며, 타겟 단어가 형용사 또는 동사인 경우 형용사 또는 동사에 해당되는 타겟 단어의 형태소를 검색할 수 있다.
이후, 분석하는 단계(S400)에서는 시스템이 복수의 문장으로부터 복수의 타겟 단어 각각의 출현 빈도 및 복수의 타겟 단어 사이의 연결성을 분석할 수 있다.
보다 구체적으로 분석하는 단계(S400)에서, 시스템은 복수의 문장 전체에서 복수의 타겟 단어 각각의 형태소에 대한 출현 빈도를 산출할 수 있다.
일례로, 시스템은 타겟 품사로 명사가 설정된 경우, 복수의 문장 전체에서 명사에 해당하는 각 타겟 단어를 출현 빈도를 산출할 수 있다.
예를 들어 타겟 품사에 해당하는 타겟 단어로 흑인이 검색된 경우, 흑인이 전체 문장에 출현된 횟수를 카운팅하여 전체 문장에서 흑인에 대한 출현 빈도를 산출할 수 있다.
아울러, 복수의 타겟 단어 사이의 연결성은 각 문장을 기준으로 분석될 수 있다. 보다 구체적으로 시스템은 각 문장 내에서 복수의 타겟 단어 각각의 형태소 사이의 연결성에 대한 값을 산출할 수 있다.
예를 들어 타겟 품사에 해당하는 타겟 단어로 흑인과 평등이 검색되되, 어느 하나의 문장 내에 흑인과 평등이 함께 등장하는 경우, 본 발명의 시스템은 흑인과 평등 사이에는 연결성이 있는 것으로 분석할 수 있다. 또한 한 문장 내 연결성도 타겟 단어 사이 거리에 따라 가중치가 부여될 수 있다.
표시하는 단계(S500)에서는 시스템이 복수의 타겟 단어에 대한 출현 빈도 및 연결성을 마인드맵으로 표시할 수 있다.
여기서, 마인드맵은 복수의 타겟 단어 중 적어도 일부가 노드로 표시되고 복수의 노드 사이가 에지 라인에 의해 연결되는 형태로 구성될 수 있다.
여기서, 각 노드의 표시 영역은 노드에 표시되는 타겟 단어 각각의 출현 빈도에 따라 다른 크기로 표시될 수 있다. 일례로, 출현 빈도가 높은 해당 타겟 단어는 표시되는 노드의 표시가 상대적으로 크게 표시될 수 있으며, 출현 빈도가 낮은 해당 타겟 단어는 표시되는 노드의 표시가 상대적으로 작게 표시될 수 있다.
아울러, 노드와 노드 사이를 연결하는 에지 라인은 노드에 표시되는 타겟 단어 사이의 연결성 정도에 따라 서로 다른 두께 또는 색상으로 표시될 수 있다. 예를 들어, 어느 한 노드에 표시된 타겟 단어와 다른 노드에 표시된 타겟 단어 사이의 연결성이 크면 에지 라인의 두께가 상대적으로 두껍게 표시될 수 있으며 작으면 두께가 상대적으로 작게 표시될 수 있다.
이에 따라 본 발명은 주어진 텍스트 데이터로부터 설정된 타겟 품사에 해당되는 타겟 단어를 검색하고, 타겟 단어의 출현 빈도 및 타겟 단어 사이의 연결성을 분석하여 마인드맵으로 표시되도록 함으로써, 텍스트 데이터를 제공한 분석 대상자의 사고 구조 및 생각이나 관심사가 보다 직관적으로 파악되도록 할 수 있다.
이에 따라, 본 발명은 분석 대상자에게 분석 대상자의 종합적인 사고구조를 파악함으로써 관심사가 높은 상품 정보를 제공하거나 교육 자료 및 인지 건강 자료를 제공할 수 있다.
이하에서는 도 2의 각 단계에 대해 보다 구체적으로 예를 들어 설명한다.
도 3은 본 발명의 시스템에 주어진 텍스트 데이터의 일례이고, 도 4는 본 발명의 시스템이 주어진 텍스트 데이터의 각 문장에서 복수의 타겟 단어를 검색하는 방법의 일례를 설명하기 위한 도이고, 도 5는 본 발명의 시스템이 각 문장에서 복수의 타겟 단어 각각의 출현 빈도 및 타겟 단어 사이의 연결성 값을 산출하는 방법의 일례를 설명하기 위한 도이고, 도 6는 본 발명의 시스템이 주어진 텍스트의 전체 문장에서 복수의 타겟 단어 각각의 출현 빈도 및 타겟 단어 사이의 연결성 값을 산출하는 방법의 일례를 설명하기 위한 도이다. 도 7은 본 발명의 시스템이 주어진 텍스트로부터 분석된 타겟 품사에 대한 단어를 마인드맵으로 표시한 일례이다.
도 3과 같이, 시스템에는 텍스트 데이터가 주어질 수 있다. 본 발명의 시스템은 분석 대상자의 음성을 입력받거나 음원 형태의 정보를 원격으로 입력받아 텍스트 데이터로 변환할 수 있다.
설정하는 단계(S200)에서는 주어진 텍스트 데이터에 포함된 복수의 문장으로부터 필터링하고자 하는 타겟 품사를 설정할 수 있다. 여기서 타겟 품사는 시스템에 사전에 설정되거나, 시스템의 사용자에 의해 설정될 수 있다.
일례로, 도 4와 같이, 타겟 품사로 명사가 설정된 경우, 시스템은 텍스트 데이터에 포함되는 복수의 문장 각각에서 명사에 해당하는 타겟 단어를 검색할 수 있다.
보다 구체적으로, 타겟 품사로 명사가 설정된 경우, 텍스트 데이터에 포함된 복수의 문장 중 문장 1에서는 명사로 흑인, 평등, 권리, 요구 및 워싱턴이 검색될 수 있으며, 문장 2에서는 명사로 기념과, 계단, 꿈, 세대가 검색될 수 있다.
이후, 분석하는 단계(S400)에서는 일례로, 도 5와 같이 각 타겟 단어의 출현 빈도 및 각 타겟 단어 사이의 연결성이 분석될 수 있다. 일례로, 도 5의 (a)와 같이, 각 타겟 단어의 출현 빈도는 각 타겟 단어가 출현된 횟수에 따라 결정될 수 있으며, 시스템은 출현 빈도에 따라 복수의 타겟 단어 각각에 대한 가중치를 다르게 부여할 수 있다. 즉, 각 타겟 단어가 출현된 횟수가 많을수록 가중치가 상대적으로 높게 부여될 수 있으며, 반대로 출현 횟수가 작을수록 가중치가 상대적으로 낮게 부여될 수 있다.
연결성과 관련하여 복수의 문장 중 어느 하나의 제1 문장 내에서 복수의 타겟 단어 중 어느 하나인 제1 타겟 단어에 대한 형태소와 다른 하나인 제2 타겟 단어에 대한 형태소가 포함된 경우, 제1 타겟 단어와 제2 타겟 단어 사이의 연결성이 있는 것으로 판단할 수 있다.
일례로, 도 5의 (a)에서, 문장 1에 기재된 흑인, 평등, 권리, 요구, 워싱턴이라는 타겟 단어에 대해서는 각 타겟 단어 사이에 연결성이 있는 것으로 판단하여 연결성 값으로 1의 가중치를 부여할 수 있다.
또한, 문장 2에 기재된 문장 2에 기념관, 계단, 꿈, 세대라는 타겟 단어에 대해서는 각 타겟 단어 사이에 연결성이 있는 것으로 판단하여 연결성 값으로 1의 가중치를 부여할 수 있다.
그러나, 제1 문장에 제1 타겟 단어에 대한 형태소가 포함되고, 제1 문장과 다른 제2 문장에 제2 타겟 단어에 대한 형태소가 포함되는 경우, 제1 타겟 단어와 제2 타겟 단어 사이의 연결성이 없는 것으로 판단할 수 있다.
예를 들어, 도 5의 (a)와 같이, 문장 1에 흑인, 평등, 권리, 요구, 워싱턴이라는 타겟 단어가 출현하고, 문장 2에 기념관, 계단, 꿈, 세대가 출현한 경우, 문장 1에 출현된 흑인, 평등, 권리, 요구, 워싱턴이라는 타겟 단어와 문장 2에 출현된 기념관, 계단, 꿈, 세대라는 타겟 단어 사이에는 연결성이 없는 것으로 판단할 수 있다.
즉, 각 타겟 단어 사이의 연결성은 동일한 문장 내에서만 인정되고 다른 문장에 대해서는 인정되지 않을 수 있다.
여기서, 시스템은 제1 문장 내에서 제1 타겟 단어에 대한 형태소와 제2 타겟 단어에 대한 형태소 사이의 거리에 따라 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여할 수 있다. 즉 동일한 문장 내에 복수의 타겟 단어가 출현하는 경우, 두 타겟 단어 사이의 연결성 값은 두 타겟 단어 사이의 거리에 따라 다르게 부여될 수 있다.
일례로, 도 5의 (b)와 같이, 문장 1 내에서 흑인이라는 타겟 단어와 다른 타겟 단어 사이의 연결성 값은 타겟 단어 사이의 거리에 따라 흑인과 평등 사이에는 연결성 값으로 1을, 흑인과 권리 사이에는 0.8, 흑인과 요구 사이에는 0.6 과 같이 단어 사이의 거리에 따라 연결성에 대한 가중치 값을 다르게 부여할 수 있다.
이와 같은 방식으로, 분석하는 단계(S400)에서, 본 발명의 시스템은 텍스트 데이터에 포함된 전체 문장에 대해 예를 들어 도 6과 같이, 복수의 타겟 단어 각각에 대한 출현 빈도와 연결성 값을 분석할 수 있다. 이때, 복수의 타겟 단어 각각에 대한 출현 빈도와 연결성 값은 각 문장에서 출현한 각 타겟 단어의 출현 빈도 및 연결성 값이 합산되어 산출될 수 있다.
이후, 표시하는 단계(S500)에서, 도 7과 같이, 시스템은 복수의 타겟 단어에 대한 출현 빈도 및 연결성을 마인드맵으로 표시할 수 있다.
여기서, 본 발명의 시스템은 복수의 타겟 단어 중 출현 빈도 및 연결성에 대해 미리 설정된 임계치를 만족하는 경우만 노드로 표시할 수 있다.
예를 들어, 표시하는 단계(S500)에서는 출현 빈도 임계치가 5회, 연결성 값에 대한 임계치가 3으로 설정된 경우, 시스템은 분석 단계에서 분석된 도 6의 타겟 단어 중 출현 빈도가 5회 이상인, 흑인(출현 빈도 10), 평등(출현 빈도 5), 꿈(출현 빈도 15), 백인(출현 빈도 7), 자유(출현 빈도 8), 때(출현 빈도 11) 등에 대해서만 노드로 표시할 수 있고, 임계치 미만의 값을 갖는 타겟 단어는 표시되지 않을 수 있다.
또한, 연결성에 대한 임계치가 설정된 경우, 임계치를 만족하는 경우, 예를 들어 도 6에서 흑인과 평등 사이의 연결성 값 5, 흑인과 백인 사이의 연결성 값 3, 흑인과 자유 사이의 연결성 값 7 등에 대해서 에지 라인으로 표시할 수 있으며, 임계치 미만의 값을 갖는 에지 라인은 표시되지 않을 수 있다.
여기서, 노드의 표시 영역은 노드에 표시되는 타겟 단어 각각의 출현 빈도에 따라 다른 크기로 표시될 수 있다.
구체적으로, 복수의 타겟 단어가 제1 출현 빈도를 갖는 제1 타겟 단어와 제1 출현 빈도보다 낮은 제2 출현 빈도를 갖는 제2 타겟 단어를 포함하는 경우, 표시하는 단계(S500)에서, 시스템은 제1 타겟 단어에 대한 노드의 표시 영역을 제2 타겟 단어에 대한 노드의 표시 영역보다 크게 표시할 수 있다.
예를 들어, 도 7과 같이, 흑인(출현 빈도 10)이 표시된 노드(N1), 평등(출현 빈도 5)이 표시된 노드(N3), 꿈(출현 빈도 15)이 표시된 노드(N2), 백인(출현 빈도 7)이 표시된 노드(N4) 등은 각 출현 빈도에 따라 노드의 크기가 다르게 표시될 수 있다.
또한, 에지 라인은 노드에 표시되는 타겟 단어 사이의 연결성 정도에 따라 서로 다른 두께 또는 색상으로 표시될 수 있다.
구체적으로, 복수의 타겟 단어는 제1, 2, 3 타겟 단어를 포함하되, 제1, 2 타겟 단어 사이의 연결성에 대한 값은 제1 값을 가지며, 제2, 3 타겟 단어 사이의 연결성에 대한 값은 제1 값보다 작은 제2 값을 가지는 경우, 표시하는 단계(S500)에서, 시스템은 제1, 2 타겟 단어 사이의 연결성을 표시하는 제1 에지 라인의 두께를 제2, 3 타겟 단어 사이의 연결성을 표시하는 제2 에지 라인의 두께보다 크게 표시할 수 있다.
예를 들어, 도 6에서 연결성 값 5를 갖는 흑인과 평등 사이 에지 라인(E5)의 두께는 연결성 값 3을 갖는 흑인과 백인 사이의 에지 라인(E1)의 두께보다 크게 표시될 수 있다.
또한, 연결성 값 7을 갖는 흑인과 자유 사이의 에지 라인(E3)은 연결성 값 5를 갖는 흑인과 평등 사이 에지 라인(E5)의 두께보다 크게 표시될 수 있다.
이에 따라 본 발명은 주어진 텍스트 데이터로부터 설정된 타겟 품사에 해당되는 타겟 단어를 분석하여 마인드맵으로 표시되도록 함으로써, 텍스트 데이터를 제공한 분석 대상자의 사고 구조 및 생각이나 관심사가 보다 직관적으로 파악되도록 할 수 있다.
지금까지는 시스템에 필터링을 위해 설정되는 타겟 품사가 1개인 경우를 일례로 설명하였지만, 본 발명은 이에 한정되는 것은 아니고, 본 발명은 시스템에 필터링을 위해 설정되는 타겟 품사가 복수 개인 경우에도 적용될 수 있다. 이에 대해 도 8 및 도 9를 참조하여 설명한다.
도 8은 본 발명의 시스템에 타겟 품사가 복수로 설정된 경우, 타겟 단어를 검색하고, 출현 빈도 및 연결성 값을 산출하는 방법의 일례를 설명하기 위한 도이고, 도 9는 타겟 품사가 복수로 설정된 경우, 본 발명의 시스템이 복수의 타겟 품사에 대한 단어를 마인드맵으로 표시한 일례이다.
도 8 이하에서는 앞선 도 1 내지 도 7에서 설명한 내용과 동일한 내용은 앞선 내용으로 대체하고, 다른 내용을 위주로 설명한다.
도 8의 (a)에 도시된 바와 같이, 설정하는 단계(S200)에서 타겟 품사로 명사와 동사가 설정된 경우, 검색하는 단계(S300)에서, 본 발명의 시스템은 각 문장에서 명사 및 형용사에 해당하는 형태소인 “미국, 나라, 되, 꿈, 실현, 되, 하”를 타겟 단어로 검색할 수 있다.
이후, 분석하는 단계(S400)에서, 본 발명의 시스템은 각 타겟 단어에 대한 연결성 값을 가중치로 부여할 수 있다. 이때, 도 8의 (b)와 같이, 일례로, 본 발명의 시스템은 동일한 문장 내에 출현하는 각 타겟 단어의 연결성에 대해 동일한 가중치(예, 연결성 값 1)를 부여할 수 있다.
그러나, 본 발명은 이에 한정되는 것은 아니고, 다른 일례로, 도 8의 (c)와 같이, 본 발명의 시스템은 제1, 2 타겟 단어가 서로 동일한 품사인지 또는 다른 품사인지에 따라 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여할 수도 있다.
예를 들어, 도 8의 (c)에서 제1 타겟 단어가 명사인 꿈인 경우, 꿈과 동일한 명사인 제2 타겟 단어(예, 실현)에 대해서는 연결성 값에 대한 가중치로 1을 부여하고, 명사가 아닌 동사인 제2 타겟 단어(예, 되다)에 대해서는 연결성 값에 대한 가중치로 0.5를 부여할 수 있다.
이와 같이, 본 발명은 제1, 2 타겟 단어가 서로 동일한 품사에 속하는 경우에 대해 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 제1, 2 타겟 단어가 서로 다른 품사에 속하는 경우에 대한 제1, 2 타겟 단어 사이의 연결성에 대한 가중치보다 크게 부여할 수 있다.
이후, 표시하는 단계(S500)에서, 본 발명은 타겟 품사가 형용사 또는 동사를 포함하는 경우, 시스템은 형용사 또는 동사의 기본형을 타겟 단어의 노드로 표시할 수 있다.
예를 들어, 도 9와 같이, 동사의 형태소인 “되, 가, 오, 있” 등에 대해서는 동사의 기본형인 되다, 가다, 오다, 있다 등으로 타겟 단어의 노드가 표시되도록 할 수 있다.
본 발명의 각 실시예에 개시된 기술적 특징들은 해당 실시예에만 한정되는 것은 아니고, 서로 양립 불가능하지 않은 이상, 각 실시예에 개시된 기술적 특징들은 서로 다른 실시예에 병합되어 적용될 수 있다.
따라서, 각 실시예에서는 각각의 기술적 특징을 위주로 설명하지만, 각 기술적 특징이 서로 양립 불가능하지 않은 이상, 서로 병합되어 적용될 수 있다.
본 발명은 상술한 실시예 및 첨부한 도면에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자의 관점에서 다양한 수정 및 변형이 가능할 것이다. 따라서 본 발명의 범위는 본 명세서의 청구범위뿐만 아니라 이 청구범위와 균등한 것들에 의해 정해져야 한다.
100: 프로세서 200: 메모리
300: 입력부 400: 출력부
500: 통신부

Claims (16)

  1. 시스템이 주어진 텍스트 데이터에 포함된 복수의 문장으로부터 필터링하고자 하는 적어도 하나의 타겟 품사를 설정하는 단계;
    상기 시스템이 상기 복수의 문장으로부터 상기 적어도 하나의 타겟 품사에 해당되는 복수의 타겟 단어를 검색하는 단계;
    상기 시스템이 상기 복수의 문장으로부터 상기 복수의 타겟 단어 각각의 출현 빈도 및 상기 복수의 타겟 단어 사이의 연결성을 분석하는 단계; 및
    상기 시스템이 상기 복수의 타겟 단어에 대한 상기 출현 빈도 및 상기 연결성을 마인드맵으로 표시하는 단계를 포함하되,
    상기 표시하는 단계에서, 상기 마인드맵은 상기 복수의 타겟 단어 중 적어도 일부가 노드로 표시되고 상기 노드 사이가 에지 라인에 의해 연결되는 형태를 가지고,
    상기 노드의 표시 영역은 상기 노드에 표시되는 타겟 단어 각각의 상기 출현 빈도에 따라 다른 크기로 표시되고,
    상기 에지 라인은 상기 노드에 표시되는 타겟 단어 사이의 상기 연결성 정도에 따라 서로 다른 두께 또는 색상으로 표시되고,
    상기 분석하는 단계에서,
    상기 시스템은 상기 복수의 문장 중 어느 하나의 제1 문장 내에 상기 복수의 타겟 단어 중 어느 하나인 제1 타겟 단어에 대한 형태소와 다른 하나인 제2 타겟 단어에 대한 형태소가 포함된 경우, 상기 제1 타겟 단어와 상기 제2 타겟 단어 사이의 연결성이 있는 것으로 판단하고,
    상기 제1 문장에 상기 제1 타겟 단어에 대한 형태소가 포함되고, 상기 제1 문장과 다른 제2 문장에 상기 제2 타겟 단어에 대한 형태소가 포함되는 경우, 상기 제1 타겟 단어와 상기 제2 타겟 단어 사이의 연결성이 없는 것으로 판단하고,
    상기 시스템은 상기 제1 문장 내에 포함된 상기 제1 타겟 단어에 대한 형태소와 상기 제2 타겟 단어에 대한 형태소 사이의 거리에 따라 상기 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여하고,
    상기 시스템은 상기 제1 문장 내에 포함된 상기 제1, 2 타겟 단어가 서로 동일한 품사인지 또는 다른 품사인지에 따라 상기 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여하되 상기 제1, 제2 타겟 단어가 서로 동일한 품사인 경우 상기 제1, 제2 타겟 단어가 서로 다른 품사인 경우보다 더 높은 가중치를 부여하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  2. 제1 항에 있어서,
    상기 설정하는 단계 이전에,
    상기 시스템이 음성을 인식하여 상기 텍스트 데이터로 변환하는 단계를 더 포함하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  3. 제1 항에 있어서,
    상기 설정하는 단계에서,
    상기 타겟 품사는 상기 시스템에 사전에 설정되어 있거나 상기 시스템의 사용자로부터 입력받아 설정되는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  4. 제1 항에 있어서,
    상기 설정하는 단계에서 설정되는 상기 타겟 품사는 명사, 형용사 및 동사 중 적어도 하나를 포함하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  5. 제1 항에 있어서,
    상기 설정하는 단계에서 설정되는 상기 타겟 품사에서 대명사, 조사, 부사 및 감탄사 중 적어도 하나는 제외되는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  6. 제1 항에 있어서,
    상기 검색하는 단계에서
    상기 시스템은 상기 타겟 품사에 해당되는 상기 복수의 타겟 단어 각각의 형태소를 검색하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  7. 제1 항에 있어서,
    상기 분석하는 단계에서,
    상기 시스템은
    상기 복수의 문장 전체에서 상기 복수의 타겟 단어 각각의 형태소에 대한 출현 빈도를 산출하고,
    상기 복수의 문장에 포함된 각 문장 내에서 상기 복수의 타겟 단어 각각의 형태소 사이의 연결성에 대한 값을 산출하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  8. 제1 항에 있어서,
    상기 분석하는 단계에서,
    상기 시스템은 상기 출현 빈도에 따라 상기 복수의 타겟 단어 각각에 대한 가중치를 다르게 부여하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 제1 항에 있어서,
    상기 표시하는 단계에서,
    상기 시스템은 상기 복수의 타겟 단어 중 상기 출현 빈도가 미리 설정된 임계치를 만족하는 타겟 단어를 상기 노드로 표시하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  13. 제1 항에 있어서,
    상기 복수의 타겟 단어는 제1 출현 빈도를 갖는 제1 타겟 단어와 상기 제1 출현 빈도보다 낮은 제2 출현 빈도를 갖는 제2 타겟 단어를 포함하는 경우,
    상기 표시하는 단계에서,
    상기 시스템은 상기 제1 타겟 단어에 대한 노드의 표시 영역을 상기 제2 타겟 단어에 대한 노드의 표시 영역보다 크게 표시하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  14. 제1 항에 있어서,
    상기 복수의 타겟 단어는 제1, 2, 3 타겟 단어를 포함하되, 상기 제1, 2 타겟 단어 사이의 연결성에 대한 값은 제1 값을 가지며, 상기 제2, 3 타겟 단어 사이의 연결성에 대한 값은 상기 제1 값보다 작은 제2 값을 가지는 경우,
    상기 표시하는 단계에서,
    상기 시스템은 상기 제1, 2 타겟 단어 사이의 연결성을 표시하는 제1 에지 라인의 두께를 상기 제2, 3 타겟 단어 사이의 연결성을 표시하는 제2 에지 라인의 두께보다 크게 표시하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  15. 제1 항에 있어서,
    상기 타겟 품사가 형용사 또는 동사를 포함하는 경우,
    상기 표시하는 단계에서,
    상기 시스템은 형용사 또는 동사의 기본형을 상기 타겟 단어의 노드로 표시하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 방법.
  16. 메모리; 및
    상기 메모리와 연결되고, 상기 메모리에 포함된 명령들을 실행하도록 구성된 프로세서를 포함하고,
    상기 프로세서가
    주어진 텍스트 데이터에 포함된 복수의 문장으로부터 필터링하고자 하는 적어도 하나의 타겟 품사를 설정하도록 제어하고,
    상기 복수의 문장으로부터 상기 적어도 하나의 타겟 품사에 해당되는 복수의 타겟 단어를 검색하도록 제어하고,
    상기 복수의 문장으로부터 상기 복수의 타겟 단어 각각의 출현 빈도 및 상기 복수의 타겟 단어 사이의 연결성을 분석하도록 제어하고,
    상기 복수의 타겟 단어에 대한 상기 출현 빈도 및 상기 연결성을 마인드맵으로 표시하도록 제어하되,
    상기 마인드맵은 상기 복수의 타겟 단어 중 적어도 일부가 노드로 표시되고 상기 노드 사이가 에지 라인에 의해 연결되는 형태를 가지고,
    상기 노드의 표시 영역은 상기 노드에 표시되는 타겟 단어 각각의 상기 출현 빈도에 따라 다른 크기로 표시되고,
    상기 에지 라인은 상기 노드에 표시되는 타겟 단어 사이의 상기 연결성 정도에 따라 서로 다른 두께 또는 색상으로 표시되고,
    상기 프로세서가 상기 연결성을 분석할 때,
    상기 프로세서는 상기 복수의 문장 중 어느 하나의 제1 문장 내에 상기 복수의 타겟 단어 중 어느 하나인 제1 타겟 단어에 대한 형태소와 다른 하나인 제2 타겟 단어에 대한 형태소가 포함된 경우, 상기 제1 타겟 단어와 상기 제2 타겟 단어 사이의 연결성이 있는 것으로 판단하고,
    상기 제1 문장에 상기 제1 타겟 단어에 대한 형태소가 포함되고, 상기 제1 문장과 다른 제2 문장에 상기 제2 타겟 단어에 대한 형태소가 포함되는 경우, 상기 제1 타겟 단어와 상기 제2 타겟 단어 사이의 연결성이 없는 것으로 판단하고,
    상기 프로세서는 상기 제1 문장 내에 포함된 상기 제1 타겟 단어에 대한 형태소와 상기 제2 타겟 단어에 대한 형태소 사이의 거리에 따라 상기 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여하고,
    상기 프로세서는 상기 제1 문장 내에 포함된 상기 제1, 2 타겟 단어가 서로 동일한 품사인지 또는 다른 품사인지에 따라 상기 제1, 2 타겟 단어 사이의 연결성에 대한 가중치를 다르게 부여하되 상기 제1, 제2 타겟 단어가 서로 동일한 품사인 경우 상기 제1, 제2 타겟 단어가 서로 다른 품사인 경우보다 더 높은 가중치를 부여하도록 제어하는
    텍스트 데이터로부터 타겟팅된 품사의 단어를 마인드맵으로 생성하는 시스템.
KR1020210081930A 2021-06-23 2021-06-23 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템 KR102345818B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210081930A KR102345818B1 (ko) 2021-06-23 2021-06-23 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210081930A KR102345818B1 (ko) 2021-06-23 2021-06-23 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR102345818B1 true KR102345818B1 (ko) 2021-12-31

Family

ID=79177499

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210081930A KR102345818B1 (ko) 2021-06-23 2021-06-23 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102345818B1 (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010026991A (ko) 1999-09-10 2001-04-06 정선종 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
US20050278325A1 (en) * 2004-06-14 2005-12-15 Rada Mihalcea Graph-based ranking algorithms for text processing
US20110283205A1 (en) * 2010-05-14 2011-11-17 Microsoft Corporation Automated social networking graph mining and visualization
KR20140008185A (ko) * 2012-07-11 2014-01-21 정영교 문서작성과 실시간으로 연동되는 마인드맵 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체
US20150120717A1 (en) * 2013-10-25 2015-04-30 Marketwire L.P. Systems and methods for determining influencers in a social data network and ranking data objects based on influencers
KR20160014944A (ko) * 2014-07-30 2016-02-12 문상훈 3차원 마인드맵 생성 장치 및 그 방법
KR20170067918A (ko) * 2015-12-08 2017-06-19 전자부품연구원 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010026991A (ko) 1999-09-10 2001-04-06 정선종 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
US20050278325A1 (en) * 2004-06-14 2005-12-15 Rada Mihalcea Graph-based ranking algorithms for text processing
US20110283205A1 (en) * 2010-05-14 2011-11-17 Microsoft Corporation Automated social networking graph mining and visualization
KR20140008185A (ko) * 2012-07-11 2014-01-21 정영교 문서작성과 실시간으로 연동되는 마인드맵 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체
US20150120717A1 (en) * 2013-10-25 2015-04-30 Marketwire L.P. Systems and methods for determining influencers in a social data network and ranking data objects based on influencers
KR20160014944A (ko) * 2014-07-30 2016-02-12 문상훈 3차원 마인드맵 생성 장치 및 그 방법
KR20170067918A (ko) * 2015-12-08 2017-06-19 전자부품연구원 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치

Similar Documents

Publication Publication Date Title
US10665226B2 (en) System and method for data-driven socially customized models for language generation
Gregoromichelaki Quotation in dialogue
US7860705B2 (en) Methods and apparatus for context adaptation of speech-to-speech translation systems
KR20190096304A (ko) 대화 내용에 대한 요약문 생성 장치 및 방법
Griol et al. Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances
JP5620349B2 (ja) 対話装置、対話方法および対話プログラム
JP2007219190A (ja) 音声認識装置と認識方法及びそのプログラム
JP2013083897A (ja) 認識装置、認識プログラム、認識方法、生成装置、生成プログラムおよび生成方法
Hämäläinen et al. Multilingual speech recognition for the elderly: The AALFred personal life assistant
Ungureanu et al. Analysing frequent natural language expressions from design conversations
Brockmann et al. Modelling alignment for affective dialogue
KR100949353B1 (ko) 언어 장애인용 대화 보조 장치
KR102345818B1 (ko) 텍스트 데이터로부터 타겟팅 된 품사의 단어를 통해 사고구조 마인드맵을 생성하는 방법 및 시스템
JP5722375B2 (ja) 文末表現変換装置、方法、及びプログラム
KR102350359B1 (ko) 음성 인식 알고리즘을 이용한 영상 편집 방법
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
Feng et al. Trends in speech and language processing
Dahl Natural language processing: past, present and future
Reddy et al. Indian sign language generation from live audio or text for tamil
JP6951763B2 (ja) 発話生成装置、発話生成方法、及びコンピュータプログラム
Buschmeier et al. Adaptive expressiveness: virtual conversational agents that can align to their interaction partner
JP2006330060A (ja) 音声合成装置、音声処理装置、およびプログラム
Judge et al. What is the potential for context aware communication aids?
WO2018015999A1 (ja) 議論支援システム、議論支援方法、及び議論支援プログラム
JP6985311B2 (ja) 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant