KR101725628B1 - 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법 - Google Patents
텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법 Download PDFInfo
- Publication number
- KR101725628B1 KR101725628B1 KR1020150057199A KR20150057199A KR101725628B1 KR 101725628 B1 KR101725628 B1 KR 101725628B1 KR 1020150057199 A KR1020150057199 A KR 1020150057199A KR 20150057199 A KR20150057199 A KR 20150057199A KR 101725628 B1 KR101725628 B1 KR 101725628B1
- Authority
- KR
- South Korea
- Prior art keywords
- scene
- speaker
- conversation history
- character
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004458 analytical method Methods 0.000 title claims abstract description 32
- 239000000284 extract Substances 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 238000000926 separation method Methods 0.000 claims description 7
- 230000004060 metabolic process Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 10
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000001149 cognitive effect Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000007654 immersion Methods 0.000 description 2
- YTPUIQCGRWDPTM-UHFFFAOYSA-N 2-acetyloxybenzoic acid;5-(2-methylpropyl)-5-prop-2-enyl-1,3-diazinane-2,4,6-trione;1,3,7-trimethylpurine-2,6-dione Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O.CN1C(=O)N(C)C(=O)C2=C1N=CN2C.CC(C)CC1(CC=C)C(=O)NC(=O)NC1=O YTPUIQCGRWDPTM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G06F17/279—
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Machine Translation (AREA)
Abstract
소설 내의 장면을 미리 설정된 시간기준을 바탕으로 조정하는 장면 조정 단계, 소설의 장면에서 등장인물의 대화 이력을 검출하여 저장하는 대화 정보 생성 단계, 등장인물의 대화 이력을 추적하여, 특정 화제에 대하여 각 등장인물이 인지하고 있는 정보와 인지하고 있지 못한 정보로 분류하여 사용자에게 제공하는 대화 이력 추적 단계를 포함하고, 포스트 프로덕션 단계에서 스토리의 완전성과 무결성을 유지할 수 있도록 소설 내 등장인물들이 가지고 있는 정보를 작가에게 제공하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법.
Description
본 발명은 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법에 관한 것으로, 더욱 상세하게는 문장 내 텍스트를 분석하여 대화 이력을 추적하고 그 결과를 이용하여 작가에게 등장 인물들이 가지고 있는 정보를 제공하여 작가를 지원하는 기술에 관한 것이다.
현대 소설들의 이야기 형식과 내용은 복잡한 구조를 띄고 있다. 여러 개의 사건이 동시에 진행되는 다중 플롯을 추구하고 있으며, 다양한 등장인물들이 복잡한 관계로 얽히면서 갈등을 만들어낸다. 특히 작품이 연작(series)의 형태로 저작되거나 많은 수의 등장인물들이 등장하는 역사 소설일 경우, 그리고 여러 명의 작가가 공동으로 소설을 집필할 경우에 작가는 창작 과정에서 생산되는 수많은 정보들에 대해 혼란을 일으킬 가능성이 커지게 된다.
창작 과정은 크게 프리 프로덕션(Pre-Production), 프로덕션(Production), 포스트 프로덕션(Post-Production)으로 구분되며, 종래의 저작 도구는 주로 앞의 두 단계인 프리 프로덕션과 프로덕션 단계를 지원할 뿐, 포스트 프로덕션을 지원하지 못하는 문제점이 있다.
종래의 저작도구들은, 주로 스토리의 아이디어를 지원하거나, 스토리에 필요한 정보를 저장, 관리하는 툴로 사용된다. 또한 상업적으로 성공한 영화들의 시나리오를 분석하여 스토리 템플릿이나 가이드라인을 제공한다.
그러나, 작가가 작품을 집필함에 있어서, 스토리의 완전성과 무결성을 해치지 않기 위하여 작품 속 등장인물들 각각이 알고 있는 정보와 모르는 정보를 정확하게 인지해야 한다. 만약 작가가 등장인물들 각각이 알고 있는 정보와 모르는 정보를 착각한다면 스토리의 완전성과 무결성을 해칠 수 있으며, 이는 곧 독자의 작품에 대한 몰입감과 작품의 완성도를 떨어트리게 된다.
따라서, 등장인물들의 정보를 효과적으로 관리하여 작가의 인지적 부담을 덜고, 등장인물들간의 대화를 추적하여 각 등장인물들이 알고 있는 정보와 모르는 정보를 관리함으로써 스토리의 오류를 사전에 방지할 수 있도록 하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법이 필요한 실정이다.
본 발명은 상기한 종래의 문제점을 해결하기 위한 것으로, 포스트 프로덕션 단계에서 작가를 지원하여 스토리의 오류를 사전에 방지하고, 스토리가 완전성과 무결성을 유지할 수 있도록 돕는 것을 목적으로 한다.
또한, 본 발명은 텍스트를 분석하여 대화를 추적하고 이를 이용해 등장인물들 각각이 알고 있는 정보와 모르는 정보를 작가에게 전달하여 작가의 인지적 부담을 덜고, 독자가 얻을 수 있는 정보의 양을 조절할 수 있도록 하여, 독자에게 지나치게 많은 정보가 전달되지도 지나치게 부족한 정보가 전달되지도 않도록 하여 독자의 몰입도를 높일 수 있는 것을 추가적인 목적으로 한다.
상기한 목적을 달성하기 위하여 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법은, 소설 내의 장면을 미리 설정된 시간기준을 바탕으로 조정하는 장면 조정 단계 소설의 장면에서 등장인물의 대화 이력을 검출하여 저장하는 대화 정보 생성 단계, 등장인물의 대화 이력을 추적하여, 특정 화제에 대하여 각 등장인물이 인지하고 있는 정보와 인지하고 있지 못한 정보로 분류하여 사용자에게 제공하는 대화 이력 추적 단계를 포함한다.
장면 조정 단계는 소설 내 문단 사이의 빈 줄, 챕터 이름 및 특수 문자 중 적어도 하나 이상을 인식하여 장면 단위로 분리하는 장면 분리 단계를 포함한다.
이때, 미리 설정된 시간기준은 소설의 등장인물을 기준으로 하는 스토리 시간(story time)이고, 장면 조정 단계는, 분리된 장면을 스토리 시간 순으로 정렬하는 장면 정렬 단계를 더 포함한다.
대화 정보 생성 단계는 소설의 각 장면에 등장하는 등장인물을 추출하는 등장인물 추출 단계, 등장인물 중 대사를 말한 적이 있는 화자를 판별하는 화자 판별 단계, 화자와 청자 간 대화 이력을 추출하는 대화 이력 추출 단계를 포함한다.
등장인물 추출 단계는 소설에서 동일인을 지칭하는 호칭들을 추적하고, 동일인을 지칭하는 호칭들을 리스트로 매칭한다.
등장인물 추출 단계는 수식 5를 이용하여 소설의 각 장면에 등장하는 등장인물을 추출한다.
(수식 5)
화자 판별 단계는 대화문과 같은 줄 또는 인접한 줄의 비대화문에서 주어를 검출하여 대화문의 화자로 설정하고, 만약 인접한 줄에 비대화문이 없어 이것이 어려운 경우, 직전 대화문의 화자를 현재의 화자로 설정한다.
화자 판별 단계는 비대화문에서 주격조사를 검출하고, 주격조사 앞의 단어를 주어로 설정한다.
(수식 1)
(수식 2)
(수식 3)
(수식 4)
상기한 목적을 달성하기 위하여 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 프로그램은, 장면 조정 프로그램, 대화 정보 생성 프로그램, 대화 이력 추적 프로그램을 포함할 수 있으며 이 외에도 상술한 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법의 모든 단계를 실행시키기 위하여 기록매체에 저장된 컴퓨터 프로그램일 수 있다.
본 발명에 의하면, 작성을 마친 원고를 분석하여 등장인물의 대화 이력을 추적하고 요약하여 보여줌으로써 창작 과정에서 발생하는 수많은 정보에 대한 작가의 인지적 부담을 덜어주어 스토리의 논리적 오류를 방지하는 효과가 있다.
또한, 작가에게 작품의 내용을 확인할 수 있는 기회를 제공하며, 창작 과정의 작업의 효율을 제고함으로써 작품의 품질을 높일 수 있는 효과가 있다.
도 1은 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치를 설명하기 위한 블록도이다.
도 2는 본 발명의 실시예에 따른 작가 지원 장치에서 장면 조정부를 설명하기 위한 블록도이다.
도 3은 본 발명의 실시예에 따른 작가 지원 장치에서 장면 조정부의 구동원리를 설명하기 위한 도면이다.
도 4는 본 발명의 실시예에 따른 작가 지원 장치에서 대화 정보 생성부를 설명하기 위한 블록도이다.
도 5는 본 발명의 실시예에 따른 작가 지원 장치에서 화자 판별부가 주어를 감지하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법를 설명하기 위한 순서도이다.
도 7은 본 발명의 실시예에 따른 작가 지원 방법에서 장면 조정 단계를 설명하기 위한 순서도이다.
도 8은 본 발명의 실시예에 따른 작가 지원 방법에서 대화 정보 생성 단계를 설명하기 위한 순서도이다.
도 9는 본 발명의 실시예에 따른 작가 지원 방법에서 화자 판별 단계의 알고리즘을 설명하기 위한 도면이다.
도 10는 본 발명의 실시예에 따른 작가 지원 방법을 기록매체에 저장한 프로그램을 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 작가 지원 장치에서 장면 조정부를 설명하기 위한 블록도이다.
도 3은 본 발명의 실시예에 따른 작가 지원 장치에서 장면 조정부의 구동원리를 설명하기 위한 도면이다.
도 4는 본 발명의 실시예에 따른 작가 지원 장치에서 대화 정보 생성부를 설명하기 위한 블록도이다.
도 5는 본 발명의 실시예에 따른 작가 지원 장치에서 화자 판별부가 주어를 감지하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법를 설명하기 위한 순서도이다.
도 7은 본 발명의 실시예에 따른 작가 지원 방법에서 장면 조정 단계를 설명하기 위한 순서도이다.
도 8은 본 발명의 실시예에 따른 작가 지원 방법에서 대화 정보 생성 단계를 설명하기 위한 순서도이다.
도 9는 본 발명의 실시예에 따른 작가 지원 방법에서 화자 판별 단계의 알고리즘을 설명하기 위한 도면이다.
도 10는 본 발명의 실시예에 따른 작가 지원 방법을 기록매체에 저장한 프로그램을 설명하기 위한 도면이다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 가장 바람직한 실시예를 첨부 도면을 참조하여 설명하기로 한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
이하, 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법을 첨부된 도면을 참조하여 상세하게 설명하면 아래와 같다. 도 1은 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치를 설명하기 위한 블록도이다. 도 2 및 도 4는 본 발명의 실시예에 따른 작가 지원 장치의 각 구성을 설명하기 위한 블록도이다. 도 3 및 도 5는 각각 장면 조정부와 화자 판별부의 동작을 설명하기 위한 도면이다. 도 6은 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법를 설명하기 위한 순서도이다. 도 7 및 도 8은 본 발명의 실시예에 따른 작가 지원 방법의 각 단계를 설명하기 위한 순서도이다. 도 9는 본 발명의 실시예에 따른 작가 지원 방법의 화자 판별 단계의 알고리즘을 설명하기 위한 도면이다. 그리고, 도 10는 본 발명의 실시예에 따른 작가 지원 방법을 기록매체에 저장한 프로그램을 설명하기 위한 도면이다.
도 1에 도시된 바와 같이, 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치는 장면 조정부(100), 대화 정보 생성부(200), 대화 이력 추적부(300)를 포함할 수 있다.
장면 조정부(100)는 소설 내의 장면을 분리하고, 분리된 장면을 미리 설정된 시간기준을 바탕으로 정렬한다.
대화 정보 생성부(200)는 소설의 장면에서 등장인물의 대화 이력을 검출하여 저장한다.
더욱 상세하게, 대화 정보 생성부(200)는 등장인물들이 가지고 있는 정보를 데이터베이스화하기 위하여 소설의 각 장면마다 등장하는 모든 등장인물을 추출하고, 추출된 등장인물 중 대사를 말한 적이 있는 화자를 판별하고, 소설의 각 등장인물마다 인지하고 있는 정보와 인지하고 있지 못한 정보를 분류하여 구별하기 위하여 화자와 청자 간 대화 이력을 추출한 뒤, 추출된 대화 이력을 저장하여 데이터베이스(Data Base)를 생성한다.
대화 이력 추적부(300)는 등장인물의 대화 이력을 추적하여, 특정 화제에 대하여 각 등장인물이 인지하고 있는 정보와 인지하고 있지 못한 정보로 분류하여 사용자에게 제공한다.
더욱 상세하게, 대화 이력 추적부(300)는 대화 이력이 저장된 데이터베이스를 이용하여 특정 등장 인물이 등장하는 장면들을 탐색하여 특정 등장 인물이 듣거나 말한 모든 대사를 추적하여 특정 화제에 대하여 각 등장 인물이 인지하고 있는 정보와 인지하고 있지 못한 정보를 분류하거나, 특정 정보를 알고 있는 모든 등장인물을 분류하여 사용자에게 제공한다.
더욱 상세하게, 대화 이력 추적부(300)는, 수식 1을 이용하여 특정한 청자 가 등장하는 장면을 검출하고 이를 통해 청자 가 인지하고 있는 정보를 사용자에게 제공하고, 수식 2와 같이, 특정한 청자 와 가 모두 등장하는 장면은 집합은 청자 가 등장하는 장면들의 집합과 청자 가 등장하는 장면들의 집합의 교집합이며, 이를 이용하여 청자 와 가 모두 인지하고 있는 정보를 사용자에게 제공하고, 수식 3과 같이, 청자 가 알고 있지만 청자 는 모르는 정보는 청자 가 참여한 대화 집합과 청자 가 참여한 대화 집합의 차집합으로 표현될 수 있으며, 이를 이용하여 청자 는 인지하고 있지만 청자 는 인지하고 있지 못하는 정보를 사용자에게 제공하고, 수식 4와 같이 특정 정보 를 알고 있는 등장인물들의 집합은 상기 정보 를 포함하고 있는 대화들의 청자들의 합집합으로 표현될 수 있으며, 이를 이용하여 정보 를 알고 있는 등장인물들을 사용자에게 제공한다.
(수식 1)
(수식 2)
(수식 3)
(수식 4)
여기서, 장면은 동일 장소와 동일 시간 범위 내에서 이루어지는 일련의 대사를 의미할 수 있다.
도 2에 도시된 바와 같이, 상기 장면 조정부(100)는 소설 속 장면을 분리하는 장면 분리부(110), 분리된 각각의 장면을 스토리 시간순으로 정렬하는 장면 정렬부(120)를 포함할 수 있다.
장면 분리부(110)는 소설의 각 장면을 분리하기 위하여, 시공간이 변할 때 빈 줄, 챕터 이름, 특수 문자 등으로 시공간의 변화를 독자에게 알려주는 소설의 특징을 이용할 수 있으며, 상술한 특징을 이용하여 소설 내 문단 사이의 빈 줄, 챕터 이름 및 특수 문자를 검출하고, 검출된 소설 내 문단 사이의 빈 줄, 챕터 이름 및 특수 문자 중 적어도 하나 이상을 이용하여 소설을 장면 단위로 분리한다.
장면 정렬부(120)는 독자가 경험하는 시간인 담화 시간(Plot Time)에 따라 기술된 소설 속 장면의 흐름을 등장인물들이 경험하는 시간인 스토리 시간(Story Time) 순으로 재정렬한다. 즉, 미리 설정된 시간 기준은 소설의 등장인물을 기준으로 하는 스토리 시간일 수 있다.
이때, 스토리 시간은 작가가 창조한 스토리 세계에서 연대기적으로 흐르는 시간으로, 소설 속 등장인물들은 이 시간 축을 따라 사건을 경험하게 된다. 그리고, 담화 시간은 작가가 독자에게 스토리를 전달하기 위하여 재구성된 시간으로 독자는 담화 시간을 따라서 소설 내 사건을 경험하게 된다. 여기서, 스토리 시간과 담화 시간은 일치할 수도 있으나 일치하지 않을 수도 있으며, 일치하지 않는 예로는 회상 장면을 들 수 있다.
도 3에 도시된 바와 같이, 장면 분리부(110)는 담화 시간에 따라 전개되는 소설의 각 장면들을 분리하고, 장면 정렬부(120)는 분리된 장면을 스토리 시간순으로 재정렬한다.
구체적으로, 소설이 2014년 5월 5일의 장면 A를 기술하고, 1997년 12월 5일의 과거 회상 장면 B를 기술한 뒤, 2014년 5월 6일의 장면 C를 기술하고 있다면 독자는 담화 시간 순서인 A-B-C 순으로 사건을 경험하게 된다. 그러나, 소설 내 등장인물들은 스토리 시간 순서인 B-A-C 순으로 사건을 경험하게 되므로 스토리 시간과 담화 시간은 일치하지 않게 된다. 이때, 소설 내 등장인물들은 스토리 시간 순서에 따라 정보를 가지고 있으므로 등장인물들이 가지고 있는 정보를 데이터베이스화하기 위하여 장면 조정부(100)는 장면을 분리하고, 분리된 장면을 스토리 시간순으로 재정렬한다.
나아가, 장면 조정부(100)는 소설의 각 장면마다 장면번호(Scene Number)를 부여할 수 있으며, 각 장면에 이어지는 다음 장면의 장면번호(Next Scence Number)를 소설의 각 장면에 tag(태그)할 수 있다.
도 4에 도시된 바와 같이, 대화 정보 생성부(200)는 소설의 각 장면에 등장하는 모든 등장인물을 추출하는 등장인물 추출부(210), 등장인물들 중 대사를 말한 적이 있는 화자를 판별하는 화자 판별부(220), 화자와 청자 간 대화이력을 추출하는 대화이력 추출부(230), 추출된 대화이력을 저장하여 데이터베이스화하는 대화이력 저장부(240)를 포함할 수 있다.
등장인물 추출부(210)는 소설의 각 장면에 존재하는 모든 등장인물들을 추출한다. 이때, 각 장면에 존재하는 모든 등장인물들은 청자일 수 있고 수식 5와 같이 표현될 수 있다.
(수식 5)
나아가, 등장인물 추출부(210)는 소설의 각 장면마다 등장하는 모든 등장인물을 소설의 각 장면에 태그(tag)할 수 있다.
나아가, 등장인물 추출부(210)는 소설에서 동일인을 지칭하는 호칭들을 추적하고, 동일인을 지칭하는 호칭들을 리스트로 매칭한다.
더욱 상세하게, 소설 속 등장인물들은 애칭 또는 예명을 갖고 있거나, 본인의 신분을 속이기 위하여 가명을 쓸 수도 있고, 이름을 바꾸는 경우가 있을 수도 있다. 이 경우에, 등장인물 추출부(210)는 소설의 각 등장인물들의 애칭, 예명, 가명, 바뀐 이름을 추적하여 동일인을 지칭하는 여러 가지 호칭들을 리스트로 매칭(matching)할 수 있다.
화자 판별부(220)는 문장을 추출하고, 추출된 문장이 대화문인 경우, 대화문의 인접문장에서 화자의 추출이 가능한지 여부를 판단한다. 이때, 대화문의 인접 비 대화문 문장에서 화자의 추출이 가능하다면, 해당 문장의 주격조사 '은', '는', '이', '가'를 검출한 뒤 검출된 주격 조사 앞의 단어를 주어로 설정하고 설정된 주어를 현재 화자로 설정한다. 만약 인접 비대화문 문장에서 화자를 추출할 수 없으면 이전화자가 있는지 여부를 판단하여 이전화자가 있는 경우 이전 화자를 현재 화자로 설정하고 현재 화자를 이전화자로 설정한다. 이때, 인접 비대화문 문장에서 화자를 추출할 수 없고 이전 화자 또한 없으면 화자를 판별할 수 없는 것으로 판단한다.
대화 이력 추출부(230)는 등장인물 추출부(210)를 통해 검출된 청자와, 화자 판별부(220)를 통해 검출된 화자가 존재하는 특정 장면에서 화자의 대사를 이용하여 대화의 이력을 추출한다.
대화 이력 저장부(240)는 추출된 대화 이력을 저장하여 데이터베이스를 생성한다.
도 5에 도시된 바와 같이, 화자 판별부(220)는 문장구조를 파악하여 주어를 판별할 수 있다. 문장은 주어 뒤에 주격조사가 이어지고, 주격조사 뒤에 각 단어들이 연속적으로 이어진 뒤, 단어들 뒤에 동사가 연결되어 생성된다. 문장의 특징을 이용하여 주어를 판별함에 있어서 화자 판별부(220)는 문장 내 주격조사 '은', '는', '이', '가'를 검출한 뒤 주격조사 앞의 단어를 주어로 판별한다.
예를 들어, 소설 내에 '"운동시간이야 벅" 아트 스나이더가 그를 불렀다.'와 같은 문장이 있다면, 화자 판별부(220)는 문장 내 대화문인 '"운동시간이야 벅"'의 인접 비대화문인 ' 아트 스나이더가 그를 불렀다.'를 검출하고 상기 비대화문의 주격조사 '가'를 검출하여 상기 대화문의 화자가 ' 아트 스나이더 ' 임을 판단할 수 있다. 나아가 대화문의 화자를 검출한 이후 연속되는 대화는 동일한 등장인물들간의 대화로 판단할 수 있다.
도 6에 도시된 바와 같이, 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법은 장면을 조정하고(S100), 대화 정보를 생성한 뒤(S200), 대화 이력을 추적(S300)한다.
도 7에 도시된 바와 같이, 장면 조정부가 장면을 조정(S100)하기 위하여, 소설 내의 장면을 분리(S110)하고, 분리된 장면을 미리 설정된 시간순으로 정렬(S120)한다.
나아가, 장면을 조정(S100)함과 동시에 소설의 각 장면마다 장면번호(Scene Number)를 부여할 수 있으며, 각 장면에 이어지는 다음 장면의 장면번호(Next Scence Number)를 소설의 각 장면에 tag(태그)할 수 있다.
이때, 소설의 각 장면을 분리(S110)하기 위하여, 시공간이 변할 때 빈 줄, 챕터 이름, 특수 문자 등으로 시공간의 변화를 독자에게 알려주는 소설의 특징을 이용할 수 있으며, 상술한 특징을 이용하여 소설 내 문단 사이의 빈 줄, 챕터 이름 및 특수 문자를 검출하고, 검출된 소설 내 문단 사이의 빈 줄, 챕터 이름 및 특수 문자 중 적어도 하나 이상을 이용하여 이를 장면 분리의 기준으로 할 수 있다.
그리고, 장면을 정렬(S120)하기 위하여, 담화 시간(plot time)과 스토리 시간(story time)의 개념을 도입하여, 독자가 경험하는 시간인 담화 시간에 따라 기술된 소설 속 장면의 흐름을 등장인물들이 경험하는 시간인 스토리 시간 순으로 재정렬한다. 즉, 미리 설정된 시간 기준은 소설의 등장인물을 기준으로 하는 스토리 시간일 수 있다.
이때, 스토리 시간은 작가가 창조한 스토리 세계에서 연대기적으로 흐르는 시간으로, 소설 속 등장인물들은 이 시간 축을 따라 사건을 경험하게 된다. 그리고, 담화 시간은 작가가 독자에게 스토리를 전달하기 위하여 재구성된 시간으로 독자는 담화 시간을 따라서 소설 내 사건을 경험하게 된다. 스토리 시간과 담화 시간은 일치할 수도 있으나 일치하지 않을 수도 있으며, 일치하지 않는 예로는 회상 장면을 들 수 있다.
대화 정보를 생성(S200)하기 위하여, 대화 정보 생성부는 소설의 장면에서 등장인물의 대화 이력을 검출하여 저장한다.
더욱 상세하게, 대화 정보를 생성(S200)하기 위하여, 등장인물들이 가지고 있는 정보를 데이터베이스화하기 위하여 소설의 각 장면마다 등장하는 모든 등장인물을 추출하고, 추출된 등장인물 중 대사를 말한 적이 있는 화자를 판별하고, 소설의 각 등장인물마다 인지하고 있는 정보와 인지하고 있지 못한 정보를 분류하여 구별하기 위하여 화자와 청자간 대화 이력을 추출한 뒤, 추출된 대화 이력을 저장하여 데이터베이스(Data Base)를 생성한다.
도 8에 도시된 바와 같이, 대화 정보 생성(S200)은, 소설의 각 장면에 등장하는 모든 등장인물을 추출(S210)하고, 등장인물들 중 대사를 말한 적이 있는 화자를 판별(S220)한 뒤, 화자와 청자 간 대화 이력을 추출(S230)하고, 추출된 대화 이력을 저장(S240)하여 데이터베이스화하여 이루어진다.
여기서, 등장인물 추출부는, 소설의 각 장면에 존재하는 모든 등장인물들을 추출(S210)한다. 이때, 각 장면에 존재하는 모든 등장인물들은 청자일 수 있고 수식 5와 같이 표현될 수 있다.
(수식 5)
나아가, 등장인물을 추출한 뒤, 소설의 각 장면마다 등장하는 모든 등장인물을 소설의 각 장면에 태그(tag)할 수 있다.
또한, 등장인물을 추출함과 동시에 소설에서 동일인을 지칭하는 호칭들을 추적하고, 동일인을 지칭하는 호칭들을 리스트로 매칭한다.
더욱 상세하게, 소설 속 등장인물들은 애칭 또는 예명을 갖고 있거나, 본인의 신분을 속이기 위하여 가명을 쓸 수도 있고, 이름을 바꾸는 경우가 있을 수도 있다. 이 경우에도, 등장인물을 올바르게 추출하기 위하여 소설의 각 등장인물들의 애칭, 예명, 가명, 바뀐 이름을 추적하여 동일인을 지칭하는 여러 가지 호칭들을 리스트로 매칭할 수 있다.
여기서, 화자 판별부는 화자를 판별(S220)하기 위하여, 문장을 추출하고, 추출된 문장이 대화문인 경우, 대화문의 인접 비대화문 문장에서 화자의 추출이 가능한지 여부를 판단한다. 이때, 대화문의 인접 비대화문 문장에서 화자의 추출이 가능하다면, 해당 인접문장의 주격조사 '은', '는', '이', '가'를 검출한 뒤 검출된 주격 조사 앞의 단어를 주어로 설정하고 설정된 주어를 현재 화자로 설정한다. 만약 상술한 방법으로 화자를 추출할 수 없으면 화자가 결정된 직전 대화문이 있는지 여부를 판단하여 해당 대화문이 있는 경우 이전 화자를 현재 화자로 설정하고 현재 화자를 이전화자로 설정한다. 이때, 두 방법 모두 실패하면 화자를 판별할 수 없는 것으로 판단한다.
그리고, 대화 이력을 추출부는, 이전 단계인 등장인물을 추출 하는 단계(S210)를 통해 검출된 청자와, 화자를 판별하는 단계(S220)를 통해 검출된 화자가 존재하는 특정 장면에서 화자의 대사를 이용하여 대화의 이력을 추출(S230)한다.
이때, 추출된 대화 이력은 각 등장인물들이 가지고 있는 정보를 데이터화 하기 위하여 저장(S240)되고, 저장된 대화이력들을 이용하여 데이터베이스를 생성한다.
도 9에 도시된 바와 같이, 화자 판별부는 화자를 판별(S220)하기 위하여, 문장을 추출(S221)한다. 그 뒤, 추출된 문장이 대화문인지 여부를 판단(S222)하고 추출된 문장이 대화문이라면 대화문의 인접 비대화문 문장에서 화자의 추출이 가능한지 여부를 판단(S223)한다.
이때, 대화문의 인접 비대화문 문장에서 화자를 추출할 수 있다면, 해당 문장에서 주격조사 '은', '는', '이', '가'를 검출한 뒤, 검출된 주격조사 앞의 단어를 주어로 판단하여 주어를 추출(S224)하고 추출된 주어를 현재의 화자로 설정(S225)한다.
만약, 대화문의 인접 비대화문 문장에서 화자를 추출할 수 없다면, 화자가 결정된 직전 대화문이 있는지 여부를 판단(S226)하고, 판단 결과에 따라 이전화자가 있는 경우, 이전화자를 현재 화자로 설정하고 현재화자를 이전화자로 설정(S227)한다. 반면에, 판단 결과에 따라 이전화자가 없는 경우 화자의 판별이 불가(S228)한 것으로 판단한다.
한편, 본 발명은 상술한 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법을 기록매체에 저장한 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 프로그램일 수 있다.
다시 도 6을 참고하면, 대화 이력을 추적(S300)하기 위하여, 대화 이력이 저장된 데이터베이스를 이용하여 특정 등장 인물이 등장하는 장면들을 탐색하여 특정 등장 인물이 듣거나 말한 모든 대사를 추적하여 특정 화제에 대하여 각 등장 인물이 인지하고 있는 정보와 인지하고 있지 못한 정보를 분류하거나, 특정 정보를 알고 있는 모든 등장인물을 분류하여 사용자에게 제공한다.
더욱 상세하게, 수식 1을 이용하여 특정한 청자 가 등장하는 장면을 검출하고 이를 통해 청자 가 인지하고 있는 정보를 사용자에게 제공하고, 수식 2와 같이, 특정한 청자 와 가 모두 등장하는 장면은 집합은 청자 가 등장하는 장면들의 집합과 청자 가 등장하는 장면들의 집합의 교집합이며, 이를 이용하여 청자 와 가 모두 인지하고 있는 정보를 사용자에게 제공하고, 수식 3과 같이, 청자 가 알고 있지만 청자 는 모르는 정보는 청자 가 참여한 대화 집합과 청자 가 참여한 대화 집합의 차집합으로 표현될 수 있으며, 이를 이용하여 청자 는 인지하고 있지만 청자 는 인지하고 있지 못하는 정보를 사용자에게 제공하고, 수식 4와 같이 특정 정보 를 알고 있는 등장인물들의 집합은 상기 정보 를 포함하고 있는 대화들의 청자들의 합집합으로 표현될 수 있으며, 이를 이용하여 정보 를 알고 있는 등장인물들을 사용자에게 제공한다.
(수식 1)
(수식 2)
(수식 3)
(수식 4)
상기한 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 프로그램은, 장면 조정 프로그램, 대화 정보 생성 프로그램, 대화 이력 추적 프로그램을 포함할 수 있으며 이 외에도 상술한 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법의 모든 단계를 실행시키기 위하여 기록매체에 저장된 컴퓨터 프로그램일 수 있다.
상기 기록매체는 CD-ROM, DVD, 블루레이, 하드디스크, SSD, USB, 클라우드 스토리지를 포함하며 통상의 기술자가 프로그램을 저장하기 위하여 이용할 수 있는 모든 기록매체를 포함할 수 있다.
상기 프로그램은, 데스크톱 응용프로그램, 모바일 애플리케이션, 웹 사이트를 포함하는 통상의 기술자가 용이하게 이용할 수 있는 프로그래밍 언어 및 기술을 통해 구현된 프로그램일 수 있다.
도 10에 도시된 바와 같이, 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 프로그램은 데이터베이스 질의 언어인 SQL명령을 통해 작가가 알고 싶은 특정 정보를 추출해낼 수 있다.
예를 들어, SELECT DISTINCT 명령으로 scene(장면)과 listener(청자)를 입력하고 FROM 명령으로 작품 'The_Road_Not_Taken'가 입력되고 WHERE 명령으로 Dialogue(대화)가 입력되고 LIKE 명령으로 정보 a가 입력된 경우, 본 발명의 실시예에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 프로그램은 작품 'The_Road_Not_Taken'의 dialogue(대화)를 추적하여, 20번째 scene(장면)에서 listener(청자) A 와 B가 a에 대한 정보를 들었으며, 22번째 scene(장면)에서 listener(청자) A 와 C가 a에 대한 정보를 들었다는 사실을 출력할 수 있다.
그러나, 본 발명에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 프로그램은 상술한 실시예에 한정되지 않고, 등장인물 A와 B는 알지만 C는 모르는 정보를 추적하거나, 등장인물 A와 B가 동시에 알고 있는 정보를 추적하는 등 여러가지 변형된 실시예를 가질 수 있다.
이상에서 본 발명에 따른 바람직한 실시예에 대해 설명하였으나, 다양한 형태로 변형이 가능하며, 본 기술분야에서 통상의 지식을 가진 자라면 본 발명의 특허청구범위를 벗어남이 없이 다양한 변형예 및 수정예를 실시할 수 있을 것으로 이해된다.
100: 장면 조정부 200: 대화 정보 생성부
300: 대화 이력 추적부 110: 장면 분리부
120: 장면 정렬부 210: 등장인물 추출부
220: 화자 판별부 230: 대화 이력 추출부
240: 대화 이력 저장부
300: 대화 이력 추적부 110: 장면 분리부
120: 장면 정렬부 210: 등장인물 추출부
220: 화자 판별부 230: 대화 이력 추출부
240: 대화 이력 저장부
Claims (13)
- 작가지원 장치의 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법에서, 장면 조정부에 의해, 소설 내의 장면을 미리 설정된 시간기준을 바탕으로 조정하는 장면 조정 단계;
대화 정보 생성부에 의해, 소설의 장면에서 등장인물의 대화 이력을 검출하여 저장하는 대화 정보 생성 단계; 및
대화 이력 추적부에 의해, 등장인물의 대화 이력을 추적하여, 특정 화제에 대하여 각 등장인물이 인지하고 있는 정보와 인지하고 있지 못한 정보로 분류하여 사용자에게 제공하는 대화 이력 추적 단계; 를 포함하고,
상기 대화 이력 추적 단계는,
수식 1을 이용하여 청자 가 인지하고 있는 정보를 사용자에게 제공하는 정보 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법.
(수식 1)
(이때, 는 번째 청자, 는 가 등장한 장면의 집합을 의미함) - 청구항 1에 있어서,
상기 장면 조정 단계는,
장면 분리부에 의해, 소설 내 문단 사이의 빈 줄, 챕터 이름 및 특수 문자 중 적어도 하나 이상을 인식하여 장면 단위로 분리하는 장면 분리 단계를 포함하는 것을 특징으로 하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법. - 청구항 2에 있어서,
상기 미리 설정된 시간기준은 소설의 등장인물을 기준으로 하는 스토리 시간(story time)이고,
상기 장면 조정 단계는,
장면 정렬부에 의해, 분리된 장면을 스토리 시간 순으로 정렬하는 장면 정렬 단계를 더 포함하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법. - 청구항 1에 있어서,
상기 대화 정보 생성 단계는,
등장인물 추출부에 의해, 소설의 각 장면에 등장하는 등장인물을 추출하는 등장인물 추출 단계;
화자 판별부에 의해, 상기 등장인물 중 대사를 말한 적이 있는 화자를 판별하는 화자 판별 단계; 및
대화 이력 추출부에 의해, 화자와 청자 간 대화 이력을 추출하는 대화 이력 추출 단계;
를 포함하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법. - 청구항 4에 있어서,
상기 등장인물 추출 단계는,
소설에서 동일인을 지칭하는 호칭들을 추적하고, 상기 동일인을 지칭하는 호칭들을 리스트로 매칭하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법. - 청구항 4에 있어서,
상기 화자 판별 단계는,
대화문의 인접 비대화문 문장에서 화자를 추출할 수 있다면, 인접문장의 주어를 검출하여 대화문의 화자로 설정하고,
인접문장의 주어를 검출하는 방법으로 화자를 추출할 수 없다면, 이전 화자를 현재의 화자로 설정하고 현재의 화자를 이전 화자로 설정하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법. - 청구항 7에 있어서,
상기 화자 판별 단계는,
상기 인접 비대화문 문장에서 주격조사를 검출하고, 상기 주격조사 앞의 단어를 주어로 설정하는 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법. - 삭제
- 청구항 1 내지 청구항 8 및 청구항 10 내지 청구항 12 중 어느 한 항에 따른 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 방법을 실행시키기 위하여 컴퓨터 판독가능한 기록매체에 저장된 컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150057199A KR101725628B1 (ko) | 2015-04-23 | 2015-04-23 | 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150057199A KR101725628B1 (ko) | 2015-04-23 | 2015-04-23 | 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160126294A KR20160126294A (ko) | 2016-11-02 |
KR101725628B1 true KR101725628B1 (ko) | 2017-04-26 |
Family
ID=57518726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150057199A KR101725628B1 (ko) | 2015-04-23 | 2015-04-23 | 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101725628B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230001705A (ko) | 2021-06-29 | 2023-01-05 | 동명대학교산학협력단 | 콘텐츠 창작 의사지원 시스템 |
KR20230015164A (ko) | 2021-07-22 | 2023-01-31 | 동명대학교산학협력단 | 콘텐츠에 대한 감성평가 방법 |
KR102652355B1 (ko) | 2023-11-22 | 2024-03-28 | 주식회사 더만타스토리 | 시나리오 텍스트 콘텐츠의 분석 결과를 기초로 새로운 시나리오 텍스트 콘텐츠를 생성하는 방법 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101879311B1 (ko) * | 2017-01-05 | 2018-07-17 | 단국대학교 산학협력단 | 접속조사를 이용한 유정명사 추출 방법 및 장치 |
KR101879309B1 (ko) * | 2017-01-05 | 2018-07-17 | 단국대학교 산학협력단 | 관형격조사를 이용한 유정명사 추출 방법 및 장치 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013195823A (ja) | 2012-03-21 | 2013-09-30 | Toshiba Corp | 対話支援装置、対話支援方法および対話支援プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100980113B1 (ko) | 2009-11-13 | 2010-09-03 | 한국예술종합학교 산학협력단 | 미디어 콘텐츠 창작 시스템 및 그 방법 |
-
2015
- 2015-04-23 KR KR1020150057199A patent/KR101725628B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013195823A (ja) | 2012-03-21 | 2013-09-30 | Toshiba Corp | 対話支援装置、対話支援方法および対話支援プログラム |
Non-Patent Citations (1)
Title |
---|
김현식 외 4명, 극작가의 글쓰기 지원을 위한 캐릭터 이력 추적 시스템, 한국멀티미디어학회 학술발표논문집 , 2010.11, 155-158 (4 pages)* |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230001705A (ko) | 2021-06-29 | 2023-01-05 | 동명대학교산학협력단 | 콘텐츠 창작 의사지원 시스템 |
KR20230015164A (ko) | 2021-07-22 | 2023-01-31 | 동명대학교산학협력단 | 콘텐츠에 대한 감성평가 방법 |
KR102652355B1 (ko) | 2023-11-22 | 2024-03-28 | 주식회사 더만타스토리 | 시나리오 텍스트 콘텐츠의 분석 결과를 기초로 새로운 시나리오 텍스트 콘텐츠를 생성하는 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20160126294A (ko) | 2016-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101725628B1 (ko) | 텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 장치 및 방법 | |
JP4600828B2 (ja) | 文書対応付け装置、および文書対応付け方法 | |
Yang et al. | Content based lecture video retrieval using speech and video text information | |
JP4218758B2 (ja) | 字幕生成装置、字幕生成方法、及びプログラム | |
US20200126583A1 (en) | Discovering highlights in transcribed source material for rapid multimedia production | |
KR20200118894A (ko) | 미리 레코딩된 비디오들에 대한 자동화된 보이스 번역 더빙 | |
US20100299131A1 (en) | Transcript alignment | |
WO2022015585A1 (en) | System and method for multi-modal podcast summarization | |
CN109145149B (zh) | 一种信息对齐方法、装置、设备及可读存储介质 | |
JP2004229283A (ja) | ニュースビデオにおいてニュース司会者の遷移を識別する方法 | |
CN109033060B (zh) | 一种信息对齐方法、装置、设备及可读存储介质 | |
US20240064383A1 (en) | Method and Apparatus for Generating Video Corpus, and Related Device | |
CN114996506B (zh) | 语料生成方法、装置、电子设备和计算机可读存储介质 | |
AlMousa et al. | Nlp-enriched automatic video segmentation | |
JP4344418B2 (ja) | 音声要約装置及び音声要約プログラムを記録した記録媒体 | |
JP5099367B2 (ja) | 要求内容識別システム、自然言語による要求内容の識別方法及びプログラム | |
CN115103225B (zh) | 视频片段提取方法、装置、电子设备和存储介质 | |
Bechet et al. | Detecting person presence in tv shows with linguistic and structural features | |
JP2004157337A (ja) | トピック境界決定方法及び装置及びトピック境界決定プログラム | |
Frampton et al. | Real-time decision detection in multi-party dialogue | |
US12119028B2 (en) | Video segment selection and editing using transcript interactions | |
Laskowski | Finding emotionally involved speech using implicitly proximity-annotated laughter | |
US12125501B2 (en) | Face-aware speaker diarization for transcripts and text-based video editing | |
US20240134909A1 (en) | Visual and text search interface for text-based video editing | |
US20240134597A1 (en) | Transcript question search for text-based video editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
GRNT | Written decision to grant |