KR100823271B1 - 멀티미디어 문서 자동 생성 방법 및 장치 - Google Patents

멀티미디어 문서 자동 생성 방법 및 장치 Download PDF

Info

Publication number
KR100823271B1
KR100823271B1 KR1020060054916A KR20060054916A KR100823271B1 KR 100823271 B1 KR100823271 B1 KR 100823271B1 KR 1020060054916 A KR1020060054916 A KR 1020060054916A KR 20060054916 A KR20060054916 A KR 20060054916A KR 100823271 B1 KR100823271 B1 KR 100823271B1
Authority
KR
South Korea
Prior art keywords
multimedia
document
text
database
representative value
Prior art date
Application number
KR1020060054916A
Other languages
English (en)
Other versions
KR20070120314A (ko
Inventor
박근한
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060054916A priority Critical patent/KR100823271B1/ko
Publication of KR20070120314A publication Critical patent/KR20070120314A/ko
Application granted granted Critical
Publication of KR100823271B1 publication Critical patent/KR100823271B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 멀티미디어 기기에서 텍스트 위주의 문서를 다양한 이미지, 오디오, 음향효과 등이 포함된 멀티미디어 문서로 자동으로 변환, 생성하는 방법 및 그 장치에 관한 것으로, 멀티미디어 문서 자동 생성 방법에 있어서, 적어도 하나의 단어 이상을 포함하는 텍스트 문서를 입력받는 단계와, 상기 입력된 텍스트 문서를 복수의 문자열로 구분하는 파싱(parsing) 단계와, 상기 파싱된 문자열들에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스에서 검색하는 단계와, 상기 검색된 멀티미디어 정보를 이용하여 멀티미디어 문서를 생성하는 단계를 포함하는 것을 특징으로 한다.

Description

멀티미디어 문서 자동 생성 방법 및 장치{Method for generating a automatic multimedia story and apparatus thereof}
도 1은 종래의 전문제작자가 멀티미디어 저작도구를 이용해 멀티미디어 문서를 제작하는 과정을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른, 멀티미디어 문서 자동 생성 방법을 나타내는 플로우 차트이다.
도 3은 본 발명의 일 실시예에 따른, 텍스트 스토리를 멀티미디어 스토리로 변환하는 예시를 나타내는 도면이다.
도 4는 본 발명의 다른 실시예에 따른, 텍스트 스토리로부터 멀티미디어 스토리를 생성하는 방법을 나타내는 플로우 차트이다.
도 5는 본 발명의 다른 실시예에 따른, 텍스트 문장에서 대표값을 결정하는 예시를 나타내는 도면이다.
도 6은 본 발명의 다른 실시예에 따른, 멀티미디어 데이터베이스를 검색하고 새로운 멀티미디어 정보를 추가하는 방법을 나타내는 플로우 차트이다.
도 7은 본 발명의 일 실시예에 따른, 멀티미디어 문서 자동 생성 장치를 나타내는 기능 블록도이다.
도 8은 본 발명의 일 실시예에 따른, 상기 도 7의 검색부 및 저장부의 구체 적인 구성을 나타내는 기능 블록도이다.
본 발명은 멀티미디어 문서 자동 생성 방법에 관한 것으로, 더욱 상세하게는 휴대용 개인정보단말기(PDA), 노트북, 휴대폰단말기, PMP(Portable Multimedia Player) 등의 멀티미디어 기기에서 텍스트 위주의 문서뿐만이 아니라 이미지, 오디오, 음향효과 등이 포함된 멀티미디어 문서를 자동으로 생성하는 방법 및 그 장치에 관한 것이다.
멀티미디어 기기의 발전과 더불어 기존의 문자로만 구성된 문서에서 텍스트, 오디오, 이미지, 동영상, 음향효과 등의 다양한 멀티미디어 객체들이 혼합된 문서에 대한 요구가 급격히 증가하고 있다. 그러나 현재는 몇몇의 일부 제작 회사나 전문가들에 의해 일괄적으로 멀티미디어 문서, 특히 유아나 아동들을 위한 이야기 책들이 제작되어 판매되고 있는 실정이다.
도 1은 종래의 전문제작자가 멀티미디어 저작도구를 이용해 멀티미디어 문서를 제작하는 과정을 나타내는 도면이다.
도 1을 참조하면, 종래의 멀티미디어 문서를 제작하는 과정은 전문 기술을 가진 제작자들이 특수한 저작툴을 사용하여 기존의 하드카피의 텍스트 문서들을 특정한 형식의 멀티미디어 스토리 북으로 제작한다. 즉, 텍스트에 담긴 내용에 따라 적절한 이미지를 삽입시키며, 이와 호응하는 배경음악, 음향효과들을 세팅하여 수 작업으로 완성한다. 따라서 수요자들은 이렇게 이미 만들어져 있는 기성품을 구매하여 이용할 수 밖에 없다.
결국 이 경우, 종래의 멀티미디어 문서 제작 방법은 i)전문 기술을 가진 제작자가 수동으로 제작하며 ii)수요자는 사업자가 판매하는 멀티미디어 문서를 일방적으로 구매하여 사용하여야한다. 즉, 사용자가 자신만의 멀티미디어 문서를 자동으로 만들 수가 없는 문제점이 있었다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로, 본 발명이 이루고자 하는 기술적 과제는 개별적인 텍스트 문서를 입력받아 이에 대하여 관련 이미지, 배경음악, 음향효과 등을 자동으로 지정하게 함으로써 자신만의 멀티미디어 스토리 북을 손쉽게 제작하는 멀티미디어 문서 자동 생성 방법 및 그 장치를 제공하는 데 있다.
상기 목적의 달성을 위해 본 발명은, 주어진 텍스트 문장에 대해서 자연어 처리 방법과 같은 문장 처리 방법을 이용하여 텍스트 문장을 명사 또는 형용사별로 구분하여 이러한 명사들의 관계성을 조사하고 미리 정의되어 있는 이미지 등의 멀티미디어 데이터베이스를 검색하여 일치하는 정보를 선택하여 시간 단위로 배열하는 멀티미디어 문서 자동 생성 방법 및 그 장치를 제공한다.
본 발명의 특징은, 적어도 하나의 단어 이상을 포함하는 텍스트 문서를 입력받는 단계와, 상기 입력된 텍스트 문서를 복수의 문자열로 구분하는 파싱(parsing) 단계와, 상기 파싱된 문자열들에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스에서 검색하는 단계를 포함하는 것이다.
바람직하게는 상기 검색하는 단계가, 상기 파싱된 문자열에 대응하는 소정의 문자열 정보를 유의어 데이터베이스에서 검색하는 단계를 포함한다.
또한 바람직하게는 상기 검색하는 단계가 상기 텍스트 문서를 소정의 단위로 나누는 단계와, 상기 각 단위에서 상기 파싱된 문자열들 중 대표값을 결정하는 단계와, 상기 결정된 대표값을 이용하여 상기 멀티미디어 정보를 멀티미디어 데이터베이스에서 검색하는 단계를 포함한다.
본 발명의 또 다른 특징은, 멀티미디어 문서 자동 생성 장치에 있어서, 적어도 하나의 단어 이상을 포함하는 텍스트를 입력받는 수신부와, 상기 입력된 텍스트를 복수의 문자열로 구분하는 파서(parser)와, 상기 구분된 문자열들에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스에서 검색하는 검색부와, 상기 검색된 멀티미디어 정보를 포함하는 멀티미디어 문서를 저장하는 저장부를 포함하는 것이다.
이하에서, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명한다.
도 2는 본 발명의 일 실시예에 따른, 멀티미디어 문서 자동 생성 방법을 나타내는 플로우 차트이다.
단계 210에서는, 먼저 멀티미디어 문서를 만들기 위한 소스 파일인 텍스트 문서를 입력받는다. 텍스트 문서는 이미 완성된 파일 형태로 입력될 수 있으며, 키 보드, 마우스, 트랙볼, 터치스크린, 태블릿 등의 다양한 형태의 입력 장치를 통해 직접 입력 받을 수도 있다.
먼저 단계 220에서는, 상기 입력된 텍스트를 복수의 문자열로 파싱(parsing)이라는 문장의 구조를 분석하는 과정을 거친다. 적어도 하나 이상의 단어가 포함된 텍스트를 명사, 동사, 형용사와 같은 단어들로 구분할 수 있다. 이러한 파싱 기법에는 파싱 과정이 전이망 안의 시작 상태에서 종료 상태로의 상태 전이로 기술되는 확장 전이망(ATN:Augmented Transition Network), 프로그래밍 언어 파싱을 위한 LR 파싱 알고리즘을 자연언어를 파싱하기에 적합하도록 확장된 토미타 파싱(Tomita Parsing), 파싱의 중간 과정의 부분적인 구조를 기록하는 차트를 이용, 파싱의 중간 과정에서 구해지는 모든 부분 구조들을 저장하여 선택적인 파싱 경로를 따라 이들을 재사용함으로써 백업을 피하는 방법인 차트 파싱(Chart Parsing) 등이 있다.
다음으로 단계 230에서는, 상기 단계 220에서 구해진 파싱된 조각들에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스에서 검색한다. 데이터베이스는 미리 정의되어 있으며 사용자에 의해 삽입(insertion)과 삭제(deletion), 갱신(update) 등의 연산이 가능하다. 만약 사용자에 의해 이미지, 배경음악, 음향효과 등의 멀티미디어 정보의 추가적인 삽입이 있는 경우 기존의 자료보다 더 높은 우선 순위를 가진다(higher priority). 멀티미디어 정보들은 이미지, 배경음악, 음향효과 등의 카테고리에 따라 각각의 테이블로 구성될 수 있으며 선형 검색(linear search), 인덱스 검색(index search), 해쉬 검색(hash search) 등의 다양한 검색 알고리즘에 의해 효율적으로 검색될 수 있다. 또한 데이터베이스는 내부적으로 저 장되어 있는 기록 매체를 이용할 수 있을 뿐만 아니라 외부의 이동성 저장 매체 또는 네트워크로 연결된 데이터베이스 서버를 이용할 수도 있다.
또한 단계 240 내지 260을 더 포함할 수 있는데, 단계 240에서는 상기 단계 230에서 검색 결과에 따라 일치하는 멀티미디어 정보의 유무를 판단한다. 일치하는 정보가 있는 경우에는 해당 멀티미디어 정보를 선택하여 시간의 순서에 맞추어 나열시킴으로써 기존의 입력된 텍스트에 대응하는 멀티미디어 문서가 생성된다(단계 260). 그러나 단계 230에서의 검색 결과 일치하는 정보가 없어서 검색이 실패하는 경우에는 그대로 스킵하는 것이 아니라 유의어 데이터베이스를 검색하여 가장 가까운 정보를 검색한다(단계 250). 대표적으로 관련어집이라고 불리는 시소러스를 이용할 수 있다. 시소러스란 용어의 사용법과 용어들 사이의 관계에 대한 정보를 제공하는 어휘 도구를 말한다. 즉, 정보 검색을 위한 키(색인)와 단어간의 관계, 즉 동의어, 하위어(그 색인에 속하는 용어), 관련어 등의 관계를 나타낸 일종의 색인표이다. 용어의 관계성은 일반적으로 상위 개념(BT: broader term), 하위 개념(NT: Narrower Term), 용례 혹은 동의어(UF: Use For Or Synonymous), 관계어(RT: Related Term), 대체어(USE) 등으로 분류되는데, 시소러스는 이러한 관계성을 이용, 탐색시 질의에 포함된 용어의 의미를 확대하기 위해 주로 사용된다. 가장 유사한 혹은 직접적인 동의어나 의미를 부여하고 이를 알파벳순으로 정렬함으로써, 검색자에게 도움이 되도록 그 용어에 가깝게 되는 알파벳순 항목들의 집합이다. 상기 유의어 데이터베이스에서 관련어를 검색한 후, 이를 검색 키값으로 하여 다시 멀티미디어 데이터베이스에서 일치하는 데이터가 있는지 검색한다. 상기 과정을 반복하 여 의미상 가장 가까운 멀티미디어 데이터가 선택되고 최종적으로 멀티미디어 문서가 생성된다(단계 260). 상기 멀티미디어 문서는 이미지, 배경음악, 음향효과 등의 다양한 포맷의 미디어 정보들이 함께 결합되어 있는 복합 문서의 형식을 가진다. 따라서 SGML(Standard Generalized Markup Language), ODA(Office Document Architecture), 포스트스크립트(post-script), OLE(Object Linking and Embedding), CDA(compound document architecture) 파일 포맷 등의 국제 표준 및 업계 표준을 준수한다.
앞에서 설명한 바와 같이, 멀티미디어 문서 자동 생성 방법의 일 실시예에 따른 동작 과정의 흐름도는 텍스트를 입력받는 단계(210), 상기 입력된 텍스트를 복수의 문자열로 파싱하는 단계(220), 파싱된 문자열들에 해당하는 멀티미디어 데이터를 DB에서 검색하는 단계(230), 상기 검색 결과 일치하는 정보가 있는지 판단하는 단계(240), 일치하는 정보가 없다고 판단된 경우에는 유의어 DB에서 검색하는 단계(250), 최종적으로 멀티미디어 문서를 생성하는 단계(260)를 포함하며, 이로써 입력된 텍스트 문서가 이미지, 배경음악, 음향효과 등의 다양한 멀티미디어 데이터로 구성된 멀티미디어 문서로 자동으로 변환된다.
도 3은 본 발명의 일 실시예에 따른, 텍스트 스토리를 멀티미디어 스토리로 변환하는 예시를 나타내는 도면이다.
도 3을 참조하면, 상기 멀티미디어 스토리는 사진으로 이루어진 관련 이미지, 배경음악, 관련 음향효과로 구성되어 있으며, 여기에 TTS(text-to-speech) 기능이 추가될 수 있다. TTS는 도움말 파일이나 웹페이지와 같은 컴퓨터 문서의 내용 을 사람이 읽어주는 소리로 만들어주는 음성합성 프로그램이다. TTS는 시각 장애가 있는 사람들을 위해 컴퓨터 화면에 나타난 정보를 대신 읽어주는 것도 가능하다. 현재 나와 있는 TTS 프로그램들로는 음성으로 내용을 읽어주는 이메일과, 자동 응답 시스템의 음성안내 기능 등이 있다. 상기 화면의 구성에서 관련 이미지 사이의 일련의 마침표들은 시간의 경과를 나타내며 시간의 경과에 따라 상기 멀티미디어 데이터들은 하나씩 또는 동시에 복수로 나타날 수 있다. 상기 관련 이미지는 또한 정적인 이미지들인 사진, 그림, 갖가지 시각적 구성요소로 이루어진 클립 아트 뿐만 아니라 동적인 이미지인 AGIF(Animated GIF)가 될 수 있다.
상기 도 3에 나와있듯이, "바닷가"라는 텍스트에 대응하는 바닷가 사진과 함께 "바다"를 키워드로 가지고 있는 배경음악이 선택되고 "파도소리"와 같은 음향효과가 아울러 삽입된다. 이때, 멀티미디어 데이터베이스에서 "바닷가"라는 키워드가 부재시에는 유의어 데이터베이스를 검색하여 "바닷가"와 관련된 유의어인 "바다"를 키워드로 삼을 수 있고 이를 이용, 재검색하여 "바다"와 관련된 다양한 멀티미디어 데이터를 삽입하게 된다. 또한 상기 도 3에는 도시되지 않았지만 "바다"와 관련한 유용한 정보들(각종 지리정보, 여행정보 등)을 하이퍼텍스트 링크(hypertext link) 같은 하이퍼미디어와 함께 표시할 수도 있다. 이로써 문자로만 구성된 텍스트가 다양한 시각적, 청각적 효과를 동반하는 멀티미디어 문서로 바뀌어 자동으로 생성된다.
도 4 및 도 5는 본 발명의 다른 실시예에 따른, 텍스트 스토리로부터 멀티미디어 스토리를 생성하는 방법을 나타내는 플로우 차트 및 예시 텍스트 문장에서 대 표값을 결정하는 예를 나타내는 도면이다.
단계 410에서는, 앞에서 설명한 바와 같이 먼저 멀티미디어 스토리를 만들기 위한 소스 파일인 텍스트 스토리를 입력받는다. 텍스트 스토리는 완성된 파일 형태로 입력되거나 키보드 등의 입력 장치를 통해 직접 입력될 수 있다. 예를 들어, 기존의 동화책의 내용이 담긴 텍스트 파일이나 또는 이를 직접 타이핑한 것을 입력으로 받을 수 있다. 즉, 도 5와 같은 동화책 내용이 텍스트 형식으로 입력되는 것이다.
단계 420에서는, 입력받은 텍스트 스토리를 파싱하는데 여기서의 일 실시예를 따르면 명사를 기준으로 파싱한다. 도 5에서 보면 "나무꾼", "사슴" 등이 명사로써 파싱된다. 따라서, 한 문장에 있어서도 여러개의 명사가 파싱되어 경합할 수 있으므로 어떠한 대표값을 정하여 그에 해당하는 멀티미디어 데이터만을 선택할 필요성이 제기된다. 텍스트 내에서 대표값이 미치는 범위(range)는 문장이 될 수 있을뿐만 아니라 띄워쓰기 단위와 일치하며 단어가 모여 이루어진 도막도막의 단위인 어절, 문장의 단락으로 소주제가 달라지는 문장의 집합인 문단(paragraph) 등이 될 수 있다.
따라서 단계 430에서는, 일 실시예에 따라 문장별로 대표값을 설정한다. 상기 단계 420에서 파싱된 여러 명사들 중에서 일단 문장별로 그룹핑을 한 후, 각 문장별로 다음과 같은 규칙을 가지고 대표값을 결정한다.
i) 해당 문장에서 출현 빈도수가 가장 높은 명사를 대표값으로 선택한다.
ii) 상기 빈도수가 모두 동일하다면 처음 나온 명사를 대표값으로 선택한다.
도 5의 예를 들어보면, 첫째 문장에 있어서 "나무꾼", "사슴", "말", "연못"의 단어들이 파싱되고 이들의 출현빈도가 모두 1번씩으로 동일하므로 제일 처음 등장한 단어인 "나무꾼"을 첫째 문장의 대표값을 결정한다. 반면에, 둘째 문장과 셋째 문장에 있어서는 각각 "옷"과 "선녀"라는 단어가 가장 빈번하게 나타나고 있으므로 이들 단어를 각 문장의 대표값으로 결정한다.
단계 440에서는, 상기 단계 430에서 결정된 대표값에 따라 그에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스를 통해 검색한다. 도 5에서 첫째 문장의 대표값인 "나무꾼"에 대응하는 멀티미디어 데이터을 검색하여 나무꾼이 나오는 사진 또는 그림파일 등의 이미지 파일을 검색하고, 나무꾼을 키워드로 갖는 배경음악을 검색하고, 나무꾼의 나무베는 소리와 같은 음향효과등을 검색하게 된다. 그리고 일치하는 정보가 있는지를 판단하여(단계 450) 해당 정보가 있을 때는 이들 멀티미디어 데이터를 문장의 선후에 맞춰 시간별로 나열함으로써 결국 멀티미디어 스토리가 생성된다.
그러나 일치하는 해당 정보가 없는 경우에는 단계 460에서 유의어 데이터베이스를 검색한다. 예를 들어, 도 5의 첫째 문장에서 "나무꾼"이라는 키워드를 갖는 배경음악의 검색이 실패할 수 있다. 이때, "나무꾼"의 관련어를 검색하여 "산" 이라는 단어로 다시 멀티미디어 데이터베이스를 검색하여 산을 키워드로 갖는 배경음악의 오디오 파일을 찾을 수 있다.
따라서, 상기의 단계 410 내지 단계 470을 거쳐 도 5의 텍스트 스토리는 배경음악과 함께 이미지가 표시되고 음향효과가 삽입되는 멀티미디어 스토리로 변환 된다. 여기에 TTS 기능이 부과되어 상기 문장별 대표값만으로 자칫 스토리의 내용이 너무 축소되는 것을 방지할 수 있다.
도 6은 본 발명의 다른 실시예에 따른, 멀티미디어 데이터베이스를 검색하고 새로운 멀티미디어 정보를 추가하는 방법을 나타내는 플로우 차트이다.
도 6을 참조하면, 도 6은 상기 도 4에 있어서 멀티미디어 데이터베이스를 검색하여 일치하는 정보가 있는지를 판단하는 단계인 단계 450 내지 단계 470을 더욱 구체화하여 나타내고 있다.
단계 610에서 일치하는 멀티미디어 데이터가 없는 경우에는 단계 620과 같이 유의어 데이터베이스에서 키워드에 해당하는 유의어를 검색하고 이를 이용, 단계 610에서 재검색하는 과정을 반복한다. 이 경우, 단계 620는 계속해서 새로운 유의어를 검색하고 반복을 계속한 후에도 결국 검색을 실패한 경우에는 단계 630에서 새로운 멀티미디어 데이터를 추가(addition) 할 수 있다. 이렇게 하여 입력된 텍스트 스토리에 대응하는 멀티미디어 데이터는 빠짐없이 채워지고 멀티미디어 스토리가 완성된다(단계 640).
도 7은 본 발명의 일 실시예에 따른, 멀티미디어 문서 자동 생성 장치를 나타내는 기능 블록도이며, 도 8은 상기 도 7의 검색부(730) 및 저장부(740)의 구체적인 구성을 나타내는 기능 블록도이다.
도 7을 참조하면, 수신부(710)는 먼저 멀티미디어 문서를 만들기 위한 소스 파일인 텍스트 문서를 입력받는다. 텍스트 문서는 이미 완성된 파일 형태로 입력될 수 있으며 또한 키보드, 마우스, 트랙볼, 터치스크린, 태블릿 등의 다양한 형태의 입력 장치를 통해 직접 입력 받을 수 있다.
파서(parser, 720)는 상기 입력된 텍스트 문서를 복수의 문자열로 쪼개어 문장의 구조를 분석하는 기능을 한다. 적어도 하나 이상의 단어가 포함된 텍스트를 명사, 동사, 형용사와 같은 단어들로 구분할 수 있다. 이러한 파싱 기법에는 확장 전이망(ATN:Augmented Transition Network), 토미타 파싱(Tomita Parsing), 차트 파싱(Chart Parsing) 등이 있음은 앞서 설명한 바와 같다.
검색부(730)는 상기 파서(720)에서 파싱된 조각들에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스(731)에서 검색한다. 멀티미디어 데이터베이스(731)는 미리 정의되어 있으며 사용자에 의해 삽입과 삭제, 갱신 등의 연산이 가능하다. 만약 사용자에 의해 이미지, 배경음악, 음향효과 등의 멀티미디어 정보의 추가적인 삽입이 있다면 이들 데이터는 기존의 데이터보다 더 높은 우선 순위를 가진다(higher priority). 따라서 주관적 기호에 따라 데이터를 변경, 저장할 수 있으므로 각각의 사용자에 최적화된(optimized) 데이터베이스를 구축할 수 있다. 멀티미디어 정보들은 이미지, 배경음악, 음향효과 등의 카테고리에 따라 각각의 테이블로 구성되며 선형 검색, 인덱스 검색, 해쉬 검색 등의 다양한 검색 알고리즘에 의해 효율적으로 검색된다. 또한 멀티미디어 데이터베이스(731)는 내부적으로 저장되어 있는 기록 매체를 이용할 수 있을 뿐만 아니라 외부의 이동성 저장 매체 또는 네트워크로 연결된 데이터베이스 서버(도시하지 않음)를 이용할 수도 있다. 멀티미디어 데이터베이스(731)은 검색이 실패할 경우를 대비하여, 유의어 데이터베이스(810)과 연동하여 동작한다.
저장부(740)는 상기 검색된 멀티미디어 정보를 포함하는 멀티미디어 문서를 저장한다. 상기 저장부(740)는 화면으로 표시하기 위한 메모리와 같은 임시적인 저장 장소가 될 수 있으며, 영구적인 저장을 위한 마그네틱 저장매체, 광학적 판독매체, 인터넷 서버등의 다양한 형태의 저장 매체를 이용할 수도 있음은 자명하다. 저장부(740)는 변환된 멀티미디어 문서에 TTS 기능을 부과하기 위하여 내부에 TTS(741) 시스템을 구비할 수도 있다.
본 발명에 따른 멀티미디어 문서 자동 생성 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, 자기 테이프, 플로피디스크와 같은 마그네틱 저장매체와 CD-ROM, 광 데이터 저장장치와 같은 광학적 판독매체 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
전술한 바와 같이, 본 발명에 의한 멀티미디어 문서 자동 생성 방법 및 장치에 의하면, 기존의 동화책과 같은 개별적인 텍스트 문서를 입력받아 이에 대하여 관련 이미지, 배경음악, 음향효과 등을 자동으로 지정하게 함으로써 멀티미디어 문서를 손쉽게 제작할 수 있다. 또한 사용자가 직접 스토리를 지어내고 자신과 관련된 멀티미디어 컨텐츠를 매칭시켜 자신만의 멀티미디어 스토리 북을 만들 수 있다. 이로써 사용자의 주관적 만족도와 차별적 성향에 대한 욕구를 충족시킬 수 있다.

Claims (5)

  1. 적어도 하나의 단어 이상을 포함하는 텍스트 문서를 입력받는 단계와,
    상기 입력된 텍스트 문서를 복수의 문자열로 구분하는 파싱(parsing) 단계와,
    상기 텍스트 문서의 단락, 문장 및 어절 중 어느 하나의 단위에 대하여, 상기 각 단위에서 파싱된 문자열의 출현 빈도수에 기초한 대표값을 결정하는 단계와,
    상기 결정된 대표값에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스에서 검색하는 단계와,
    상기 검색된 멀티미디어 정보를 이용하여 멀티미디어 문서를 생성하는 단계를 포함하는 것을 특징으로 하는 멀티미디어 문서 자동 생성 방법.
  2. 제1항에 있어서, 상기 검색하는 단계는
    상기 파싱된 문자열들에 대응하는 문자열 정보를 유의어 데이터베이스에서 검색하는 단계를 더 포함하는 것을 특징으로 하는 멀티미디어 문서 자동 생성 방법.
  3. 삭제
  4. 적어도 하나의 단어 이상을 포함하는 텍스트 문서를 입력받는 수신부와,
    상기 입력된 텍스트 문서를 복수의 문자열로 구분하는 파서(parser)와,
    상기 텍스트 문서의 단락, 문장 및 어절 중 어느 하나의 단위에 대하여, 상기 각 단위에서 파싱된 문자열의 출현 빈도수에 기초한 대표값을 결정하여 상기 대표값에 해당하는 멀티미디어 정보를 멀티미디어 데이터베이스에서 검색하는 검색부와,
    상기 검색된 멀티미디어 정보를 포함하는 멀티미디어 문서를 저장하는 저장부를 포함하는 것을 특징으로 하는 멀티미디어 문서 자동 생성 장치.
  5. 제1항 또는 제2항에 기재된 방법을 구현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1020060054916A 2006-06-19 2006-06-19 멀티미디어 문서 자동 생성 방법 및 장치 KR100823271B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060054916A KR100823271B1 (ko) 2006-06-19 2006-06-19 멀티미디어 문서 자동 생성 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060054916A KR100823271B1 (ko) 2006-06-19 2006-06-19 멀티미디어 문서 자동 생성 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20070120314A KR20070120314A (ko) 2007-12-24
KR100823271B1 true KR100823271B1 (ko) 2008-04-21

Family

ID=39138165

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060054916A KR100823271B1 (ko) 2006-06-19 2006-06-19 멀티미디어 문서 자동 생성 방법 및 장치

Country Status (1)

Country Link
KR (1) KR100823271B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101245665B1 (ko) * 2011-03-21 2013-03-20 주식회사 코난테크놀로지 통합 멀티미디어 컨텐츠를 제공하는 검색 시스템 및 검색 방법
KR101636335B1 (ko) * 2015-04-29 2016-07-06 (주)오렌지디지트코리아 인터랙티브 효과를 자동 부여하는 문서 변환 시스템, 방법 및 그 방법을 실행시킬 수 있는 프로그램이 저장된 기록매체
KR102206838B1 (ko) * 2019-01-21 2021-01-25 박준희 작품 이미지와 텍스트를 매칭하여 도서를 제작하는 도서 제작 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259750A (ja) * 1999-03-10 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> マルチメディア報告書作成装置および報告書作成方法
JP2001229203A (ja) * 1999-12-07 2001-08-24 Nec Corp マルチメディア検索サーバーおよび画像音声混合文章生成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259750A (ja) * 1999-03-10 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> マルチメディア報告書作成装置および報告書作成方法
JP2001229203A (ja) * 1999-12-07 2001-08-24 Nec Corp マルチメディア検索サーバーおよび画像音声混合文章生成装置

Also Published As

Publication number Publication date
KR20070120314A (ko) 2007-12-24

Similar Documents

Publication Publication Date Title
US10096145B2 (en) Method and system for assembling animated media based on keyword and string input
US7788084B2 (en) Labeling of work of art titles in text for natural language processing
US11379518B2 (en) Detecting musical references in natural language search input
US20070276866A1 (en) Providing disparate content as a playlist of media files
JP2000081892A (ja) 効果音付加装置および効果音付加方法
Leake et al. Generating audio-visual slideshows from text articles using word concreteness
CN103020105A (zh) 文档读出支持设备和方法
US20110040555A1 (en) System and method for creating and playing timed, artistic multimedia representations of typed, spoken, or loaded narratives, theatrical scripts, dialogues, lyrics, or other linguistic texts
Kalender et al. Videolization: knowledge graph based automated video generation from web content
KR20210081058A (ko) 한국어 언어학습 콘텐츠 제작 시스템
KR100823271B1 (ko) 멀티미디어 문서 자동 생성 방법 및 장치
KR102252522B1 (ko) 내용 기반 동영상 목차 자동생성 방법 및 시스템
Androutsopoulos et al. Generating multilingual personalized descriptions of museum exhibits-The M-PIRO project
JP6903364B1 (ja) サーバおよびデータ割り当て方法
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JP2997469B2 (ja) 自然言語理解方法および情報検索装置
Bonch-Osmolovskaya Digital edition of Leo Tolstoy works: contributing to advances in Russian literary scholarship
KR20210136609A (ko) 영상 뉴스 콘텐츠 생성 장치 및 방법
KR20210081083A (ko) 한국어 언어학습 콘텐츠 제작을 위한 비디오 클립 검색 방법
Caillet et al. Multimedia applications for playing with digitized theater performances
Jansz et al. Kirrkirr: Interactive visualisation and multimedia from a structured Warlpiri dictionary
Terzić et al. Diversification of serbian-french-english-spanish parallel corpus parcolab with spoken language data
JP3734101B2 (ja) ハイパーメディア構築支援装置
Baumann et al. The spoken wikipedia corpus collection
JP2016027415A (ja) 文書読み上げ支援装置、方法及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment
FPAY Annual fee payment
FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170330

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190109

Year of fee payment: 11

R401 Registration of restoration
FPAY Annual fee payment

Payment date: 20190411

Year of fee payment: 12

R401 Registration of restoration