KR20120111855A - Apparatus and method for generating story according to user information - Google Patents
Apparatus and method for generating story according to user information Download PDFInfo
- Publication number
- KR20120111855A KR20120111855A KR1020110055102A KR20110055102A KR20120111855A KR 20120111855 A KR20120111855 A KR 20120111855A KR 1020110055102 A KR1020110055102 A KR 1020110055102A KR 20110055102 A KR20110055102 A KR 20110055102A KR 20120111855 A KR20120111855 A KR 20120111855A
- Authority
- KR
- South Korea
- Prior art keywords
- topic
- information
- sentence
- segment
- story
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
Description
본 발명은 사용자 정보에 따른 스토리를 생성하기 위한 장치 및 방법에 관한 것으로서, 특히, 적어도 하나의 전자 장치로부터 수집한 사용자 정보에 따른 사용자의 생활 정보를 스토리를 요약하여 사용자에게 제공하기 위한 장치 및 방법에 관한 것이다.
The present invention relates to an apparatus and method for generating a story according to user information, and more particularly, to an apparatus and method for providing a user by summarizing a story of user's living information according to user information collected from at least one electronic device. It is about.
유무선 기술의 발전으로 사용자의 일상과 관련된 정보를 지속적으로 수집할 수 있게 되었다. 예를 들어, 사용자는 이동 통신 기술의 발전으로 이동장치(mobile device)를 항상 휴대한다. 이에 따라, 상기 이동 장치는 사용자의 통화 기록, 사진, 음악 파일 재생, 위치 정보 등의 다양한 정보를 수집할 수 있다.With the development of wired and wireless technology, it is possible to continuously collect information related to users' daily lives. For example, users always carry a mobile device with the development of mobile communication technology. Accordingly, the mobile device may collect various information such as a call log, a photo, a music file, and location information of the user.
상술한 바와 같이 사용자가 항상 휴대하는 이동 장치는 사용자의 일상 정보를 수집할 수 있다. 이 경우, 상기 이동 장치는 상기 수집한 사용자의 일상 정보를 토대로 사용자에게 다양한 서비스를 제공할 수 있다. As described above, the mobile device which is always carried by the user may collect daily information of the user. In this case, the mobile device may provide various services to the user based on the collected daily information of the user.
하지만, 현재 이동 장치는 사용자의 일상 정보를 토대로 사용자의 편의를 고려한 서비스를 제공하기 않는다. 이에 따라, 이동 장치에서 사용자의 일상 정보를 토대로 상기 사용자의 생활 정보를 스토리를 요약하여 사용자에게 제공할 수 있는 기술이 필요하다.However, the current mobile device does not provide a service considering the user's convenience based on the user's daily information. Accordingly, there is a need for a technology in which a mobile device can provide the user with the user's life information by summarizing the story based on the user's daily information.
따라서, 본 발명의 목적은 적어도 하나의 전자 장치에서 수집한 사용자 정보에 따라 스토리를 생성하기 위한 장치 및 방법을 제공함에 있다.Accordingly, an object of the present invention is to provide an apparatus and method for generating a story according to user information collected by at least one electronic device.
본 발명의 다른 목적은 적어도 하나의 전자 장치에서 수집한 사용자 정보에 따라 스토리를 생성하여 사용자에게 제공하기 위한 장치 및 방법을 제공함에 있다.Another object of the present invention is to provide an apparatus and method for generating and providing a story to a user according to user information collected by at least one electronic device.
본 발명의 또 다른 목적은 적어도 하나의 전자 장치에서 수집한 사용자 정보에 따라 시간별 스토리를 생성하기 위한 장치 및 방법을 제공함에 있다.Another object of the present invention is to provide an apparatus and method for generating an hourly story based on user information collected by at least one electronic device.
본 발명의 또 다른 목적은 적어도 하나의 전자 장치에서 수집한 사용자 정보에 따라 주제별 스토리를 생성하기 위한 장치 및 방법을 제공함에 있다.
Another object of the present invention is to provide an apparatus and method for generating a story by theme based on user information collected by at least one electronic device.
본 발명의 목적들을 달성하기 위한 본 발명의 제 1 견지에 따르면, 사용자의 일상 정보를 요약하기 위한 장치는, 적어도 하나의 전자 기기로부터 사용자의 일상 정보를 포함하는 로그 정보를 수집하는 정보 수집부와, 상기 정보 수집부에서 수집한 로그 정보를 분석하여 사용자의 일상 정보를 나타내는 적어도 하나의 토픽을 결정하는 분석부와, 상기 분석부에서 결정한 적어도 하나의 토픽을 이용하여 사용자의 일상 정보를 나타내는 적어도 하나의 문장을 생성하는 스토리 생성부를 포함하여 구성되는 것을 특징으로 한다.According to a first aspect of the present invention for achieving the objects of the present invention, an apparatus for summarizing daily information of a user comprises: an information collecting unit for collecting log information including daily information of the user from at least one electronic device; An analysis unit determining at least one topic representing daily information of a user by analyzing log information collected by the information collecting unit, and at least one representing daily information of a user using at least one topic determined by the analysis unit Characterized in that it comprises a story generating unit for generating a sentence.
본 발명의 제 2 견지에 따르면, 사용자의 일상 정보를 요약하기 위한 방법은, 적어도 하나의 전자 기기로부터 사용자의 일상 정보를 포함하는 로그 정보를 수집하는 과정과, 상기 정보 수집부에서 수집한 로그 정보를 분석하여 사용자의 일상 정보를 나타내는 적어도 하나의 토픽을 결정하는 과정과, 상기 분석부에서 결정한 적어도 하나의 토픽을 이용하여 사용자의 일상 정보를 나타내는 적어도 하나의 문장을 생성하는 과정을 포함하는 것을 특징으로 한다.
According to a second aspect of the present invention, a method for summarizing daily information of a user includes: collecting log information including daily information of a user from at least one electronic device, and log information collected by the information collecting unit; Determining at least one topic representing the user's daily information by analyzing the information, and generating at least one sentence representing the user's daily information using the at least one topic determined by the analyzer. It is done.
상술한 바와 같이 적어도 하나의 전자 장치를 통해 수집한 사용자 정보에 따라 사용자 생활 정보를 스토리로 구성하여 사용자에게 제공함으로써, 사용자가 자신의 생활 정보 및 생활 패턴을 손쉽게 인식할 수 있는 이점이 있다.
As described above, the user's life information is composed as a story and provided to the user according to the user information collected through the at least one electronic device, so that the user can easily recognize his / her life information and life pattern.
도 1은 본 발명의 실시 예에 따른 사용자 정보에 따른 스토리 생성 장치의 구성을 도시하는 도면,
도 2는 본 발명의 실시 예에 따른 스토리 생성 장치의 분석부의 상세 구성을 도시하는 도면,
도 3은 본 발명의 실시 예에 따른 스토리 생성 장치의 자질 추출부의 상세 구성을 도시하는 도면,
도 4는 본 발명의 실시 예에 따른 사용자 정보에 따른 스토리 생성 절차를 도시하는 도면,
도 5는 본 발명의 실시 예에 따른 토픽 세그먼트를 구성하기 위한 절차를 도시하는 도면,
도 6은 본 발명의 실시 예에 따른 개체 인식 절차를 도시하는 도면,
도 7은 본 발명의 실시 예에 따른 시간별로 스토리를 생성하기 위한 절차를 도시하는 도면,
도 8은 본 발명의 실시 예에 따른 주제별로 스토리를 생성하기 위한 절차를 도시하는 도면, 및
도 9는 본 발명의 실시 예에 따른 스토리의 표시 화면을 도시하는 도면. 1 is a view showing the configuration of a story generating apparatus according to user information according to an embodiment of the present invention;
2 is a diagram illustrating a detailed configuration of an analysis unit of a story generating device according to an embodiment of the present invention;
3 is a diagram illustrating a detailed configuration of a feature extraction unit of a story generating device according to an embodiment of the present invention;
4 is a diagram illustrating a story generation procedure according to user information according to an embodiment of the present invention;
5 is a diagram illustrating a procedure for configuring a topic segment according to an embodiment of the present invention;
6 is a diagram illustrating an object recognition procedure according to an embodiment of the present invention;
7 is a diagram illustrating a procedure for generating a story by time according to an embodiment of the present invention;
8 is a diagram illustrating a procedure for generating a story for each topic according to an embodiment of the present invention; and
9 is a diagram illustrating a display screen of a story according to an embodiment of the present invention.
이하 본 발명의 바람직한 실시 예를 첨부된 도면을 참조하여 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. The following terms are defined in consideration of the functions of the present invention, and may be changed according to the intentions or customs of the user, the operator, and the like. Therefore, the definition should be based on the contents throughout this specification.
이하 본 발명은 적어도 하나의 전자 장치로부터 수집한 사용자 정보에 따른 사용자의 생활 정보를 스토리로 요약하여 사용자에게 제공하기 위한 기술에 대해 설명한다.Hereinafter, a description will be given of a technology for providing a user by summarizing a user's life information according to user information collected from at least one electronic device into a story.
이하 설명에서 스토리 생성 장치는 사용자의 일상 정보를 수집하고, 수집한 일상 정보를 기반으로 사용자의 생활 정보를 요약한 스토리를 생성한다. In the following description, the story generating device collects daily information of the user and generates a story summarizing the living information of the user based on the collected daily information.
이하 설명에서 스토리 생성 장치는 휴대 전화로 구성되는 것으로 가정한다. 하지만, 상기 스토리 생성 장치는 데이터를 처리할 수 있는 컴퓨터, 디지털 카메라, 디지털 가전기기, 디지털 전화, 디지털 프로젝트, 홈서버, 디지털 비디오 레코더, 디지털 위성 방송 수신기, 셋탑 박스 및 디지털 TV 방송 수신기 중 어느 하나로 구성될 수 있다. In the following description, it is assumed that the story generating device is composed of a mobile phone. However, the story generating device may be any one of a computer, a digital camera, a digital home appliance, a digital telephone, a digital project, a home server, a digital video recorder, a digital satellite broadcast receiver, a set-top box, and a digital TV broadcast receiver capable of processing data. Can be configured.
도 1은 본 발명의 실시 예에 따른 사용자 정보에 따른 스토리 생성 장치의 구성을 도시하고 있다.1 is a block diagram of a story generating apparatus based on user information according to an exemplary embodiment.
상기 도 1에 도시된 바와 같이 상기 스토리 생성 장치는 제어부(100), 정보 수집부(110), 분석부(120), 스토리 생성부(130), 저장부(140), 표시부(150) 및 입력부(160)를 포함하여 구성된다.As shown in FIG. 1, the story generating apparatus includes a
상기 제어부(100)는 상기 스토리 생성 장치의 전반적인 동작을 제어한다. 상기 제어부(100)는 상기 스토리 생성부(130)로부터 제공받은 스토리를 상기 표시부(150)에 표시하도록 제어한다.The
상기 정보 수집부(110)는 적어도 하나의 전자 기기의 로그 데이터를 활용하여 사용자의 일상 정보를 수집한다. 예를 들어, 상기 정보 수집부(110)는 외부로부터 수신되는 데이터, 내부에서 생성되는 데이터 및 외부 저장소에 저장된 데이터를 이용하여 사용자의 일상 정보를 수집한다. 여기서, 상기 외부로부터 수신되는 데이터는 날씨, 위경도 정보, 블로그 정보 및 소셜 데이터 등을 포함한다. 상기 내부에서 생성되는 데이터는 통화기록, 단문 메시지(SMS: Short Message Service), 멀티미디어 메시지(MMS: Multi-media Message Service), 위성 항법 장비(GPS: Global Positioning System)에서 측정된 위경도 정보, 일정 및 주소록 등을 포함한다. 상기 외부 저장소에 저장된 데이터는 이미지 촬영 영상, 재생한 음악 파일 목록, TV 시청 정보 등을 포함한다.The
상기 분석부(120)는 상기 정부 수집부(110)에 의해 수집된 정보를 분석하여 사용자의 일상 정보를 나타내기 위한 에피소드를 추정한다. 예를 들어, 상기 분석부(120)는 하기 도 2에 도시된 바와 같이 구성된다.The
상기 스토리 생성부(130)는 상기 분석부(120)에서 추정한 에피소드를 이용하여 사용자의 일상 정보를 요약하여 표현한 스토리를 생성한다. 예를 들어, 상기 스토리 생성부(130)는 상기 분석부(120)에서 추정한 에피소드를 이용하여 시간별로 스토리를 생성한다. 다른 예를 들어, 상기 스토리 생성부(130)는 상기 분석부(120)에서 추정한 에피소드를 이용하여 주제별로 스토리를 생성할 수도 있다. 이때, 상기 스토리 생성부(130)는 유의 동사를 이용하여 추출한 자질과 다른 형식의 스토리를 생성할 수 있다. 또한, 상기 스토리 생성부(130)는 사용자의 연령 및 지역 등을 고려하여 스토리를 생성할 수도 있다.The
상기 저장부(140)는 상기 스토리 생성 장치의 동작을 제어하기 위한 프로그램을 저장하는 프로그램 저장부 및 프로그램 수행 중에 발생되는 데이터를 저장하는 데이터 저장부로 구성될 수 있다. 예를 들어, 상기 저장부(140)는 상기 정부 수집부(110)에서 수집한 사용자 일정 정보를 하기 <표 1>와 같은 형태로 저장한다.The storage unit 140 may include a program storage unit for storing a program for controlling the operation of the story generating device and a data storage unit for storing data generated during program execution. For example, the storage unit 140 stores the user schedule information collected by the
상기 표시부(150)는 상기 제어부(100)의 제어에 따라 상기 스토리 생성 장치의 상태 정보, 메뉴 화면 및 스토리 정보를 표시한다. 예를 들어, 상기 표시부(150)는 상기 제어부(100)의 제어에 따라 상기 스토리 생성부(130)에서 생성한 스토리를 사용자가 확인할 수 있도록 표시한다.The display unit 150 displays the state information, the menu screen, and the story information of the story generating apparatus under the control of the
상기 입력부(160)는 사용자의 선택에 의해 발생하는 입력 데이터를 상기 제어부(100)로 제공한다.The input unit 160 provides input data generated by a user's selection to the
상기 통신 모듈(170)은 음성 및 데이터 통신을 위해 안테나를 통해 송수신되는 신호를 처리한다.The communication module 170 processes signals transmitted and received through an antenna for voice and data communication.
상술한 구성에서, 상기 제어부(100)는 상기 정보 수집부(110), 상기 분석부(120) 및 상기 스토리 생성부(130)의 기능을 수행할 수 있다. 본 발명에서 이를 별도로 구성한 것은 각 기능들을 구별하여 설명하기 위함이다. 따라서, 실제로 구현하는 경우, 상기 정보 수집부(110), 상기 분석부(120) 및 상기 스토리 생성부(130)의 모든 기능 또는 일부 기능을 상기 제어부(100)에서 처리하도록 구성할 수 있다.In the above configuration, the
도 2는 본 발명의 실시 예에 따른 스토리 생성 장치의 분석부의 상세 구성을 도시하고 있다.2 illustrates a detailed configuration of an analysis unit of a story generating device according to an embodiment of the present invention.
상기 도 2에 도시된 바와 같이 상기 분석부(120)는 토픽 세그먼트 구성부(201), 자질 추출부(203), 토픽 결정부(205) 및 에피소드 결정부(207)를 포함하여 구성된다.As illustrated in FIG. 2, the
상기 토픽 세그먼트 구성부(201)는 상기 정보 수집부(110)에서 수집한 사용자 일정 정보를 이용하여 스토리를 구성하기 위한 후보 토픽들의 집합인 토픽 세그먼트를 구성한다. 예를 들어, 상기 토픽 세그먼트 구성부(201)는 주사건들을 시간 구간으로 분리하여 각각의 시간 구간에 포함되는 주사건으로 토픽 세그먼트를 구성한다. 만일, 일정 정보가 주사건인 경우, 상기 토픽 세그먼트 구성부(201)는 각각의 일정 정보를 각각의 토픽 세그먼트로 구성한다. 이후, 상기 토픽 세그먼트 구성부(201)는 각각의 보조 사건의 발생 시간이 토픽 세그먼트의 시간 구간에 포함되는 보조 사건을 해당 토픽 세그먼트에 매핑한다. 만일, 보조 사건이 매핑될 토픽 세그먼트가 없는 경우, 상기 토픽 세그먼트 구성부(201)는 토픽 세그먼트에 매핑되지 않는 보조 사건을 이용하여 더미 세그먼트를 구성한다. 이때, 상기 더미 세그먼크의 시간 구간은 기 설정된다. 예를 들어, 상기 더미 세그먼트는 1시간 간격으로 구성된다. 여기서, 상기 주사건은 상기 정보 수집부(110)에서 수집한 사용자 일정 정보 중 스토리 구성하는데 주체가 되는 일정 정보를 나타낸다. 상기 보조 사건은 상기 정보 수집부(110)에서 수집한 사용자 일정 정보에서 상기 주사건을 제외한 정보를 나타낸다.The topic segment configuration unit 201 configures a topic segment that is a set of candidate topics for composing a story using user schedule information collected by the
상기 자질 추출부(203)는 상기 토픽 세그먼트 구성부(201)에서 구성한 토픽 세그먼트에 포함되는 주사건 및 보조 사건들로부터 자질을 추출한다. 즉, 상기 자질 추출부(203)는 각 토픽 세그먼트에서 자질을 추출한다. 예를 들어, 상기 자질 추출부(203)는 하기 도 3에 도시된 바와 같이 구성되어 자질을 추출한다. 여기서, 자질은 문장 구성 요소가 될 수 있는 데이터를 나타낸다. 예를 들어, 상기 자질은 문장 구성 요소가 될 수 있는 동사, 개체명, 문장 연결 정보, 개체명과 연관된 토픽 정보 및 부가 정보를 포함한다. 이때, 상기 개체명은 분류, 개체명 인식기 및 문장 템플릿 중 적어도 하나에 따라 달라질 수 있지만, 하기 <표 2>와 같이 환경 설정에 정의된 개체명만을 이용할 수 있다. The
상기 토픽 결정부(205)는 상기 자질 추출부(203)가 각 토픽 세그먼트에서 추출한 자질들을 이용하여 토픽을 결정한다. 예를 들어, 상기 토픽 결정부(205)는 하기 <수학식 1>과 같이 토픽의 발생 확률을 고려하여 토픽을 결정한다. 이때, 상기 토픽 결정부(205)는 각 토픽 세그먼트에서 토픽을 결정한다.The
여기서, 상기 T*는 토픽 세그먼트 내에서 최적의 토픽을 나타내고, 상기 T는 전체 토픽의 집합을 나타내며, 상기 St는 토픽 t에 대한 토픽 스코어를 나타낸다. 여기서, 상기 St는 하기 <수학식 2>와 같이 나타낼 수 있다.Here, T * denotes an optimal topic in a topic segment, T denotes a set of all topics, and S t denotes a topic score for topic t. Here, S t may be represented by Equation 2 below.
여기서, 상기 St는 토픽 t에 대한 토픽 스코어를 나타내고, 상기 L은 토픽 세그먼트에 포함되는 로그들의 종류를 나타내며, 상기 Wx는 해당 로그 타입에 대한 가중치를 나타내고, 상기 P(word)는 해당 토픽과 관련된 단어의 발생 확률을 나타내며, 상기 P(exts)는 부가 자질의 특성을 나타낸다.Here, S t denotes a topic score for topic t, L denotes a type of logs included in a topic segment, Wx denotes a weight for the corresponding log type, and P (word) corresponds to a corresponding topic. The probability of occurrence of a related word is represented, and P (exts) represents a characteristic of an additional feature.
상기 에피소드 결정부(207)는 시간 대별로 최적의 토픽 세그먼트를 선택한다. 이때, 상기 에피소드 결정부(207)는 상기 최적의 토픽 세그먼트의 토픽을 해당 시간의 에피스드로 인식한다. 상기 에피소드 결정부(207)는 동일한 시간 구간에 다수 개의 토픽 세그먼트들이 존재하는 경우, 상기 토픽 결정부(205)에서 결정한 각 토픽 세그먼트에 대한 토픽의 토픽 스코어를 비교하여 해당 시간 구간의 최적 토픽 세그먼트를 선택한다. 이후, 연속된 토픽 세그먼트의 토픽이 동일한 경우, 상기 에피소드 결정부(207)는 상기 연속된 토픽 세그먼트들을 하나로 토픽 세그먼트로 병합한다.The episode determiner 207 selects an optimal topic segment for each time period. In this case, the episode determination unit 207 recognizes the topic of the optimal topic segment as an epid of the corresponding time. When there are a plurality of topic segments in the same time interval, the episode determiner 207 compares the topic scores of the topics for each topic segment determined by the
또한, 상기 에피소드 결정부(207)는 각 시간 구간의 에피스드를 고려하여 사용자 일정 정보의 가장 중요한 특징을 나타낼 수 있는 주토픽을 결정한다. 예를 들어, 상기 에피소드 결정부(207)는 하기 <수학식 3>과 같이 주토픽을 결정한다.In addition, the episode determination unit 207 determines the main topic that can represent the most important feature of the user schedule information in consideration of the episodes of each time interval. For example, the episode determination unit 207 determines the main topic as shown in Equation 3 below.
여기서, 상기 T**는 주토픽을 나타내고, 상기 T는 전체 토픽의 집합을 나타내며, 상기 EP는 각 시간 구간의 에피소드를 나타내고, 상기 d는 에피소드의 길이를 나타내며, 상기 St는 토픽 t에 대한 토픽 스코어를 나타낸다. Where T ** represents the main topic, T represents a set of all topics, EP represents an episode of each time interval, d represents the length of the episode, and S t represents a topic t Indicates a topic score.
또한, 상기 에피소드 결정부(207)는 각 시간 구간의 에피스드를 결정하는 과정에서 확인된 감정 단어의 발생 확률을 고려하여 사용자의 감정을 추정할 수도 있다.In addition, the episode determiner 207 may estimate the user's emotion in consideration of the occurrence probability of the emotion word identified in the process of determining the episode of each time interval.
도 3은 본 발명의 실시 예에 따른 스토리 생성 장치의 자질 추출부의 상세 구성을 도시하고 있다. 3 illustrates a detailed configuration of a feature extraction unit of a story generating device according to an embodiment of the present invention.
상기 도 3에 도시된 바와 같이 상기 자질 추출부(203)는 소셜 정보 추출부(301), 위치 정보 추출부(303), 텍스트 추출부(305) 및 개체명 설정부(307)를 포함하여 구성된다.As shown in FIG. 3, the
상기 소셜 정보 추출부(301)는 상기 토픽 세그먼크(201)에서 구성된 각각의 토픽 세그먼트에 포함되는 주사건 및 보조사건에서 휴대폰 정보, 그룹 정보 등과 같은 소셜정보를 추출한다. The social information extracting unit 301 extracts social information such as mobile phone information, group information, etc. from the scan and auxiliary events included in each topic segment configured in the topic segment monk 201.
상기 위치 정보 추출부(303)는 상기 토픽 세그먼크(201)에서 구성된 각각의 토픽 세그먼트에 포함되는 주사건 및 보조사건에서 위경도, 주소 및 지명과 같은 위치 정보를 추출한다. 예를 들어, 상기 위치정보 추출부(303)는 추출한 주소 정보를 LOCATION이란 개체명으로 설정한다. The location information extractor 303 extracts location information, such as latitude, longitude, address, and place name, from scans and auxiliary events included in each topic segment configured in the topic segment monk 201. For example, the location information extraction unit 303 sets the extracted address information to an entity name of LOCATION.
또한, 상기 위치 정보 추출부(303)는 거리 정보를 추출한다. 여기서, 거리 정보는 상기 스토리 생성 장치의 이동 거리, 이동하기 위한 목적지까지의 거리 등을 포함한다.In addition, the location information extractor 303 extracts distance information. Here, the distance information includes a moving distance of the story generating device, a distance to a destination for moving, and the like.
상기 텍스트 추출부(305)는 상기 토픽 세그먼크(201)에서 구성된 각각의 토픽 세그먼트에 포함되는 주사건 및 보조사건의 텍스트 정보에서 자질을 추출한다. 예를 들어, 상기 텍스트 추출부(305)는 개체명 인식기를 이용하여 동사 포함 텍스트 추출, 제목 텍스트 추출, 정형화된 텍스트 추출, 파일명 추출, 문장 연결 정보 추출 및 감정 정보를 추출한다.The text extractor 305 extracts a feature from text information of scan and auxiliary events included in each topic segment configured in the topic segment 201. For example, the text extractor 305 extracts a verb-containing text, extracts a title text, extracts a formatted text, extracts a file name, extracts sentence information, and emotions using an entity name recognizer.
상기 동사 포함 텍스트 추출의 경우, 상기 텍스트 추출부(305)는 텍스트에 포함되는 단어가 명사 사전에 포함되는지 확인한다. 이때, 상기 텍스트 추출부(305)는 해당 단어에 포함된 조사를 제거한 후, 명사 사전에 포함되는지 확인한다. In the case of extracting the verb-containing text, the text extracting unit 305 checks whether a word included in the text is included in the noun dictionary. In this case, the text extracting unit 305 removes the survey included in the word and checks whether it is included in the noun dictionary.
상기 단어가 명사 사전에 포함되는 경우, 상기 텍스트 추출부(305)는 상기 단어의 개체명을 확인한다. 예를 들어, 상기 텍스트 추출부(305)는 하기 <표 3>와 같은 개체명 사전을 이용하여 인식된 단어의 개체명을 확인한다.When the word is included in the noun dictionary, the text extracting unit 305 checks the entity name of the word. For example, the text extraction unit 305 checks the entity name of the recognized word using the entity name dictionary as shown in Table 3 below.
상기 텍스트 추출부(305)는 명사 사전의 크기를 줄이기 위해 일정한 패턴을 갖는 명사들을 포함하는 개체명 패턴 사전을 하기 <표 4>와 같이 별도로 구성할 수 있다.The text extractor 305 may separately configure an entity name pattern dictionary including nouns having a predetermined pattern to reduce the size of the noun dictionary as shown in Table 4 below.
상기 <표 4>와 같은 개체명 패턴 사전을 사용하는 경우, 상기 텍스트 추출부(305)는 상기 단어가 명사 사전에 포함되지 않으면 상기 개체명 패턴 사전에 포함되는지 확인한다. When using the entity name pattern dictionary as shown in Table 4, the text extracting unit 305 checks whether the word is included in the entity name pattern dictionary if the word is not included in the noun dictionary.
상기 단어가 명사 사전과 개체명 패턴 사전에 포함되지 않는 경우, 상기 텍스츠 추출부(305)는 상기 단어가 동사 사전 또는 동사 활용형 패턴 사전에 포함되는지 확인한다. 예를 들어, 상기 동사 사전은 하기 <표 5>와 같이 구성된다.When the word is not included in the noun dictionary and the entity name pattern dictionary, the text extractor 305 checks whether the word is included in the verb dictionary or the verb utilization pattern dictionary. For example, the verb dictionary is configured as shown in Table 5 below.
다른 예를 들어, 상기 동사 활용형 패턴 사전은 하기 <표 6>과 같이 구성된다.For another example, the verb utilization pattern dictionary is configured as shown in Table 6 below.
여기서, 상기 "~|"는 "~그"가 여러 개의 패턴들로 사용될 수 있음을 나타냅니다.Here, "~ |" indicates that "~" can be used in multiple patterns.
상기 제목 텍스트 추출의 경우, 상기 텍스트 추출부(305)는 상기 제목 텍스트에 포함되는 단어가 명사 사전에 포함되는지 확인한다. 상기 단어가 명사 사전에 포함되는 경우, 상기 텍스트 추출부(305)는 상기 단어의 개체명을 확인한다. In the case of extracting the title text, the text extracting unit 305 checks whether a word included in the title text is included in the noun dictionary. When the word is included in the noun dictionary, the text extracting unit 305 checks the entity name of the word.
상술한 바와 같이 동사 포함 텍스트와 제목 텍스트를 추출하는 경우, 상기 텍스트 추출부(305)는 인식한 개체명에 동사가 포함되는지 여부를 확인한다. 만일, 인식한 개체명에 동사가 포함되지 않은 경우, 상기 텍스트 추출부(305)는 상기 개체명에 기본 동사를 추가한다.As described above, when extracting the verb-containing text and the title text, the text extraction unit 305 checks whether or not the verb is included in the recognized entity name. If the recognized entity name does not include a verb, the text extractor 305 adds a basic verb to the entity name.
상기 문장 연결 정보 추출의 경우, 상기 텍스트 추출부(305)는 상기 토픽 세그먼크(201)에서 구성된 각각의 토픽 세그먼트에 포함되는 주사건 및 보조사건에서 문장 연결 정보를 추출한다. 이때, 상기 텍스트 추출부(305)는 하기 <표 7>과 같은 문장 연결어미 사전을 이용하여 문장 연결 정보를 추출한다.In the case of the sentence linkage information extraction, the text extractor 305 extracts the sentence linkage information from the scan cases and auxiliary events included in each topic segment configured in the topic segment 201. In this case, the text extracting unit 305 extracts sentence linking information using a sentence linking ending dictionary as shown in Table 7 below.
예를 들어, "철수와 영희가 집에 갔고, 영민이도 같이 집에 갔다."의 문장이 존재하는 경우, 상기 텍스트 추출부(305)는 "철수와 영희가 집에 갔다"와 "영민이도 같이 집에 갔다."라는 문장이 어미 "고"에 의해 결합된 형태의 복문이다. 이때, 상기 텍스트 추출부(305)는 "갔고(원형 "가")"와 "갔다(원형 "가")"라는 키에 대해 합동형이라는 정보가 삽입된다.For example, if the sentence "Cheol and Young-hee went home, and Yeong-min went home," the text extractor 305, "Cheol and Young-hee went home" and "Young-min" Also went home together. " At this time, the text extraction unit 305 is inserted into the information "joint (circular" ga ")" and "go (circular" ga ")" is a joint type.
상기 감정 정보 추출의 경우, 상기 텍스트 추출부(305)는 상기 토픽 세그먼크(201)에서 구성된 각각의 토픽 세그먼트에 포함되는 주사건 및 보조사건에서 감정 정보를 추출한다. 이때, 상기 텍스트 추출부(305)는 하기 <표 8>과 같은 감정 사전을 이용하여 감정 정보를 추출한다.In the case of extracting the emotion information, the text extractor 305 extracts the emotion information from the scan cases and the auxiliary events included in each topic segment configured in the topic segment 201. In this case, the text extractor 305 extracts emotion information using an emotion dictionary as shown in Table 8 below.
상기 정형화된 텍스트를 추출하는 경우, 상기 텍스트 추출부(305)는 상기 토픽 세그먼크(201)에서 구성된 각각의 토픽 세그먼트에 포함되는 주사건 및 보조사건에 포함된 정형화된 형식의 데이터에서 자질을 추출한다. 이때, 상기 텍스트 추출부(305)는 하기 <표 9>와 같은 정형화 패턴 사전을 이용하여 정형화된 형식의 데이터에서 자질을 추출한다.When extracting the standardized text, the text extraction unit 305 extracts a feature from data of a standardized form included in an injection case and an auxiliary event included in each topic segment configured in the topic segment 201. do. In this case, the text extracting unit 305 extracts a feature from the data in the standardized format using a standardized pattern dictionary as shown in Table 9 below.
상기 사진 파일명을 추출하는 경우, 상기 텍스트 추출부(305)는 상기 토픽 세그먼크(201)에서 구성된 각각의 토픽 세그먼트에 포함되는 주사건 및 보조사건에 포함된 사진 관련 파일의 경로 정보와 태그 정보를 이용하여 개체명을 추출한다. When extracting the photo file name, the text extracting unit 305 extracts the path information and tag information of the photo-related file included in the scan gun and the sub-event included in each topic segment configured in the topic segment monk 201. Extract the entity name by using
상기 개체명 설정부(307)는 입력 데이터를 미리 정해진 개체명으로 설정한다. 예를 들어, 사진 로그 중 파일명 컬럼(column)의 데이터를 OBJECT라는 개체명으로 설정한다.The entity
상기 자질 추출부(203)는 추출한 자질 정보를 이용하여 각 토픽의 발생 빈도를 확인한다. 예를 들어, 상기 자질 추출부(203)에서 추출한 자질 중 개체명은 상기 <표 2>와 같이 해당 토픽 정보를 포함한다. 이에 따라, 상기 자질 추출부(203)는 추출한 개체명의 토픽 정보에 따라 토픽 발생 빈도를 갱신한다. 예를 들어, 상기 위치 정보 추출부(301)에서 추출한 주소가 "대한민국 제주도 서귀포시"이고, "제주도"와 "서귀포시"가 명사 사전에 여행이란 토픽으로 설정된 경우, 상기 자질 추출부(203)는 여행 토픽의 발생 빈도를 2로 설정한다.The
상술한 바와 같이 구성되는 자질 추출부(203)는 로그 데이터의 형식에 따라 구조가 달라질 수 있다. 이에 따라, 상기 도 3에 도시된 자질 추출부(203)의 구성은 로그 데이터의 형식에 따라 변경될 수 있다.The
상술한 바와 같이 구성되는 자질 추출부(203)에서 추출한 자질은 하기 <표 10>과 같은 형태로 관리될 수 있다.The features extracted by the
상기 <표 3>과 같이 상기 자질 추출부(203)에서 추출한 자질 중 문장 연결 어미와 로그별 토픽의 빈도 정보를 제외한 다른 자질 정보는 주요 자질과 부가 자질로 구분되어 관리된다. 예를 들어, 상기 소셜 정보 추출부(301), 상기 위치 정보 추출부(303), 상기 텍스트 추출부(305) 및 상기 개체명 설정부(307)는 각각 추출한 자질을 주요 자질 또는 부가 자질로 구분한다. 다른 예를 들어, 상기 자질 추출부(203)는 상기 소셜 정보 추출부(301), 상기 위치 정보 추출부(303), 상기 텍스트 추출부(305) 및 상기 개체명 설정부(307)에서 추출한 자질을 주요 자질 또는 부가 자질로 구분하는 자질 추출 후처리기를 포함하여 구성될 수도 있다.As shown in Table 3, among the features extracted by the
상술한 바와 같이 스토리 생성 장치는 적어도 하나의 전자기기로부터 수집한 로그 정보를 분석하여 사용자 일상 정보에 따른 에피소드를 결정한다. 이때, 상기 스토리 생성 장치는 하기 도 4에 도시된 바와 같이 사용자의 일상 정보에 따른 스토리를 생성한다.As described above, the story generating device determines the episode according to the user's daily information by analyzing log information collected from at least one electronic device. At this time, the story generating device generates a story according to the user's daily information, as shown in FIG.
도 4는 본 발명의 실시 예에 따른 사용자 정보에 따른 스토리 생성 절차를 도시하고 있다.4 illustrates a story generation procedure based on user information according to an exemplary embodiment of the present invention.
상기 도 4를 참조하면 상기 스토리 생성 장치는 401단계에서 적어도 하나의 전자 기기로부터 로그 정보를 수집한다. 예를 들어, 상기 스토리 생성 장치는 외부로부터 수신되는 데이터, 내부에서 생성되는 데이터 및 외부 저장소에 저장된 데이터를 이용하여 사용자의 일상 정보를 수집한다. 여기서, 상기 외부로부터 수신되는 데이터는 날씨, 위경도 정보, 블로그 정보 및 소셜 데이터 등을 포함한다. 상기 내부에서 생성되는 데이터는 통화기록, 단문 메시지(SMS), 멀티미디어 메시지(MMS), 위성 항법 장비(GPS)에서 측정된 위경도 정보, 일정 및 주소록 등을 포함한다. 상기 외부 저장소에 저장된 데이터는 이미지 촬영 영상, 재생한 음악 파일 목록, TV 시청 정보 등을 포함한다.Referring to FIG. 4, in
이후, 상기 스토리 생성 장치는 403단계로 진행하여 상기 수집한 로그 정보를 이용하여 스토리를 구성하기 위한 후보 토픽들의 집합인 토픽 세그먼트를 구성한다. 예를 들어, 상기 스토리 생성 장치는 하기 도 5에 도시된 바와 같이 토픽 세그먼트를 구성한다. In
상기 403단계에서 토픽 세그먼트를 구성한 후, 상기 스토리 생성 장치는 405단계로 진행하여 각각의 토픽 세그먼트의 주사건 및 보조 사건에서 자질을 추출한다. 예를 들어, 상기 스토리 생성 장치는 상기 도 3과 같이 구성되는 자질 추출부(203)를 이용하여 하기 도 6에 도시된 바와 같이 각 토픽 세그먼트에서 자질을 추출한다. 여기서, 자질은 문장 구성 요소가 될 수 있는 데이터를 나타낸다. 예를 들어, 상기 자질은 문장 구성 요소가 될 수 있는 동사, 개체명, 문장 연결 정보, 개체명과 연관된 토픽 정보 및 부가 정보를 포함한다After configuring the topic segment in
각 토픽 세그먼트에서 자질을 추출한 후, 상기 스토리 생성 장치는 407단계로 진행하여 로그들의 토픽 발생 빈도를 고려하여 각각의 토픽 세그먼트에 대한 토픽을 결정한다. 예를 들어, 상기 스토리 생성 장치는 상기 <수학식 1>을 이용하여 각 토픽 세그먼트의 토픽을 결정한다.After extracting the feature from each topic segment, the story generating apparatus proceeds to step 407 to determine a topic for each topic segment in consideration of the frequency of occurrence of the topic in the logs. For example, the story generating apparatus determines a topic of each topic segment by using Equation 1.
각각의 토픽 세그먼트에 대한 토픽을 결정한 후, 상기 스토리 생성 장치는 409단계로 진행하여 각 시간 구간에서 최적의 토픽 세그먼트를 결정한다. 예를 들어, 동일한 시간 구간에 다수 개의 토픽 세그먼트들이 존재하는 경우, 상기 스토리 생성 장치는 각 토픽 세그먼트에 포함되는 토픽의 토픽 스코어를 비교하여 해당 시간 구간의 최적 토픽 세그먼트를 선택한다. 이때, 상기 스토리 생성 장치는 상기 최적의 토픽 세그먼트의 토픽을 해당 시간의 에피스드로 인식한다.After determining the topic for each topic segment, the story generating apparatus proceeds to step 409 to determine the optimal topic segment in each time interval. For example, when there are a plurality of topic segments in the same time interval, the story generating apparatus selects an optimal topic segment of the corresponding time interval by comparing topic scores of topics included in each topic segment. In this case, the story generating apparatus recognizes the topic of the optimal topic segment as an epid of the corresponding time.
이후, 상기 스토리 생성 장치는 411단계로 진행하여 동일한 토픽을 갖는 토픽 세그먼트를 하나의 토픽 세그먼트로 병합한다. 예를 들어, 연속된 토픽 세그먼트들의 토픽이 동일한 경우, 상기 스토리 생성 장치는 상기 연속된 토픽 세그먼트들을 하나의 토픽 세그먼트로 병합한다. 다른 예를 들어, 동일한 시간 구간의 토픽 세그먼트들의 토픽이 동일한 경우, 상기 스토리 생성 장치는 상기 토픽 세그먼트들을 하나의 토픽 세그먼트로 병합한다.In
상기 동일한 토픽을 갖는 토픽 세그먼트를 병합한 후, 상기 스토리 생성 장치는 413단계로 진행하여 시간별 스토리를 생성할 것인지 결정한다.After merging the topic segments having the same topic, the story generating apparatus proceeds to step 413 and determines whether to generate a story over time.
시간별 스토리를 생성하는 것으로 결정한 경우, 상기 스토리 생성 장치는 415단계로 진행하여 상기 411단계에서 결정한 에피소드를 이용하여 시간별로 각각의 스토리를 생성한다. 예를 들어, 상기 스토리 생성 장치는 하기 도 7에 도시된 바와 같이 시간별 스토리를 생성한다.If it is determined to generate the hourly story, the story generating apparatus proceeds to step 415 to generate each story by time using the episode determined in
이후, 상기 스토리 생성 장치는 417단계로 진행하여 상기 시간별로 생성한 스토리를 표시부에 표시한다. 예를 들어, 상기 스토리 생성 장치는 도 9의 (a)에 도시된 바와 같이 시간별로 생성한 스토리를 표시부에 표시한다. 이때, 상기 스토리 생성 장치는 텍스트 형식의 문장뿐만 아니라 문장과 관련된 멀티미디어 정보를 함께 출력할 수도 있다.In
한편, 시간별 스토리를 생성하지 않는 것으로 결정한 경우, 상기 스토리 생성 장치는 주제별 스토리를 생성하는 것으로 인식한다. 이에 따라, 상기 스토리 생성 장치는 419단계로 진행하여 주토픽을 결정한다. 즉, 상기 스토리 생성 장치는 각 시간 구간의 에피스드를 고려하여 사용자 일정 정보의 가장 중요한 특징을 나타낼 수 있는 주토픽을 결정한다. 예를 들어, 상기 스토리 생성장치는 상기 <수학식 3>을 이용하여 주토픽을 결정한다.On the other hand, if it is decided not to generate a story by time, the story generating device recognizes that the story by theme is generated. Accordingly, the story generating apparatus proceeds to step 419 to determine the main topic. That is, the story generation device determines the main topic that can represent the most important feature of the user schedule information in consideration of the episodes of each time section. For example, the story generating apparatus determines a main topic by using Equation 3.
상기 주토픽을 결정한 후, 상기 스토리 생성 장치는 421단계로 진행하여 주토픽에 관련된 에피소드 내 자질을 병합하여 하나의 주토픽에 관련된 스토리를 생성한다. 이때, 상기 스토리 생성 장치는 주토픽뿐만 아니라 날씨, 사용자의 감정에 관련된 스토리를 생성할 수도 있다. 예를 들어, 상기 스토리 생성 장치는 하기 도 8에 도시된 바와 같이 주제별 스토리를 생성한다.After determining the main topic, the story generating apparatus proceeds to step 421 to merge the qualities in the episode related to the main topic to generate a story related to one main topic. In this case, the story generating device may generate a story related to the weather, the user's emotion as well as the main topic. For example, the story generating device generates a story by theme as shown in FIG. 8.
이후, 상기 스토리 생성 장치는 상기 417단계로 진행하여 상기 주제별로 생성한 스토리를 표시부에 표시한다. 예를 들어, 상기 스토리 생성 장치는 도 9의 (b)에 도시된 바와 같이 주제별로 생성한 스토리를 표시부에 표시한다. 이때, 상기 스토리 생성 장치는 텍스트 형식의 문장뿐만 아니라 문장과 관련된 멀티미디어 정보를 함께 출력할 수도 있다.In
이후, 상기 스토리 생성 장치는 본 알고리즘을 종료한다.Thereafter, the story generating device ends the present algorithm.
도 5는 본 발명의 실시 예에 따른 토픽 세그먼트를 구성하기 위한 절차를 도시하고 있다.5 illustrates a procedure for configuring a topic segment according to an embodiment of the present invention.
상기 도 5를 참조하면, 상기 도 4의 401단계에서 로그 정보를 수집한 후, 상기 스토리 생성 장치는 501단계로 진행하여 주 사건이 존재하는지 확인한다. 여기서, 상기 주사건은 상기 수집한 사용자 일정 정보 중 스토리 구성하는데 주체가 되는 일정 정보를 나타낸다.Referring to FIG. 5, after collecting log information in
주사건이 존재하지 않는 경우, 상기 스토리 생성 장치는 507단계로 진행하여 더미 세그먼트를 생성할 것인지 확인한다.If there is no scan gun, the story generating apparatus proceeds to step 507 and determines whether to generate a dummy segment.
한편, 주 사건이 존재하는 경우, 상기 스토리 생성 장치는 503단계로 진행하여 주 사건으로 토픽 세그먼트를 구성한다. 예를 들어, 일정 정보가 주 사건인 경우, 상기 스토리 생성 장치는 일정 정보를 시간 순으로 나열하고 각각의 일정 정보를 토픽 세그먼트로 구성한다. 만일, 주 사건의 발생 시간이 중복되는 경우, 상기 스토리 생성 장치는 짧은 시간 구간의 주 사건을 기준으로 토픽 세그먼트를 분할한다. 예를 들어, 13시부터 14시까지 일정 A가 있고, 13시부터 15시까지 일정 B가 있는 경우, 상기 스토리 생성 장치는 13시부터 14시까지 일정 A와 일정 B 각각에 대한 토픽 세그먼트를 구성한다. 또한, 상기 스토리 생성 장치는 14시부터 15시까지 일정 B에 대한 토픽 세그먼트를 구성한다.On the other hand, if there is a main event, the story generating device proceeds to step 503 to form a topic segment with the main event. For example, when the schedule information is a main event, the story generating device lists the schedule information in chronological order and organizes each schedule information into topic segments. If the occurrence time of the main event overlaps, the story generating device divides the topic segment based on the main event of the short time interval. For example, if there is a schedule A from 13:00 to 14:00 and a schedule B from 13:00 to 15:00, the story generating device constructs a topic segment for each of schedules A and B from 13:00 to 14:00. do. In addition, the story generating device configures a topic segment for schedule B from 14:00 to 15:00.
토픽 세그먼트를 구성한 후, 상기 스토리 생성 장치는 505단계로 진행하여 보조 사건의 발생 시간이 토픽 세그먼트의 시간 구간에 포함되는 경우, 해당 보조 사건을 상기 토픽 세그먼트에 매핑한다. 여기서, 상기 보조 사건은 상기 수집한 사용자 일정 정보에서 상기 주사건을 제외한 정보를 나타낸다. After configuring the topic segment, the story generating apparatus proceeds to step 505 and, when the occurrence time of the auxiliary event is included in the time segment of the topic segment, maps the corresponding auxiliary event to the topic segment. Here, the auxiliary event represents information excluding the scan gun from the collected user schedule information.
이후, 상기 스토리 생성 장치는 상기 507단계로 진행하여 더미 세그먼트를 생성할 것인지 확인한다. 예를 들어, 상기 스토리 생성 장치는 토픽 세그먼트에 매핑되지 않은 보조 사건을 이용하여 더미 세그먼트를 생성한다. 이에 따라, 상기 스토리 생성장치는 토픽 세그먼트에 매핑되지 않은 보조 사건이 존재하는지 확인한다.In
토픽 세그먼트에 매핑되지 않은 보조 사건이 존재하지 않는 경우, 상기 스토리 생성 장치는 더미 세그먼트를 생성하지 않는 것으로 인식한다. 이에 따라 상기 스토리 생성 장치는 405단계로 진행하여 각각의 토픽 세그먼트에서 자질을 추출한다.If there is no auxiliary event not mapped to the topic segment, the story generating device recognizes that it does not generate a dummy segment. Accordingly, the story generating apparatus proceeds to step 405 to extract the features from each topic segment.
한편, 토픽 세그먼트에 매핑되지 않은 보조 사건이 존재하는 경우, 상기 스토리 생성 장치는 509단계로 진행하여 토픽 세그먼트에 매핑되지 않은 보조 사건을 이용하여 더미 세그먼트를 생성한다. 이때, 상기 더미 세그먼크는 기설정된 시간 구간으로 설정된다. On the other hand, if there is an auxiliary event not mapped to the topic segment, the story generating device proceeds to step 509 to generate a dummy segment using the auxiliary event not mapped to the topic segment. In this case, the dummy segment is set to a predetermined time interval.
이후, 상기 스토리 생성 장치는 405단계로 진행하여 각각의 토픽 세그먼트에서 자질을 추출한다.In
이하 설명은 상기 텍스트 추출부(305)에서 텍스트 형식의 데이터에서 자질을 추출하기 위한 방법에 대해 설명한다. Hereinafter, a description will be given of a method for extracting a feature from text data in the text extractor 305.
도 6은 본 발명의 실시 예에 따른 개체 인식 절차를 도시하고 있다.6 illustrates an object recognition procedure according to an embodiment of the present invention.
상기 도 6을 참조하면 상기 도 4의 403단계에서 토픽 세그먼트를 구성한 후, 상기 스토리 생성 장치는 601단계로 진행하여 개체명 인식기를 이용하여 개체명 인식을 수행할 것인지 결정한다. 예를 들어, 상기 스토리 생성 장치는 상기 개채명 인식기를 통한 개체명 인식이 필요한 후보 단어가 존재하는지 확인한다. Referring to FIG. 6, after configuring a topic segment in
상기 개체명 인식기를 이용하여 개체명 인식을 수행하지 않는 경우, 상기 스토리 생성 장치는 개체명 인식이 필요한 후보 단말이 존재하지 않는 것으로 인식한다. 이에 따라, 상기 스토리 생성 장치는 본 알고리즘을 종료한다. 즉, 상기 스토리 생성 장치는 407단계로 진행하여 각 토픽 세그먼트의 토픽을 결정한다.If the entity name recognition is not performed using the entity name recognizer, the story generating apparatus recognizes that there is no candidate terminal for entity name recognition. Accordingly, the story generating device ends the present algorithm. In other words, the story generating apparatus proceeds to step 407 to determine the topic of each topic segment.
한편, 개체명 인식을 수행하는 경우, 상기 스토리 생성 장치는 개체명 인식이 필요한 후보 단말이 존재하는 것으로 인식한다. 이에 따라, 상기 스토리 생성 장치는 603단계로 진행하여 개체명 인식을 수행할 단어를 확인한다. 예를 들어, "철수와 영희가 집에 갔다"의 텍스트에서 자질을 추출하는 경우, 상기 스토리 생성 장치는 개체명 인식을 위해 "철수와"를 확인한다.Meanwhile, when performing entity name recognition, the story generating device recognizes that there is a candidate terminal requiring entity name recognition. In
이후, 상기 스토리 생성 장치는 605단계로 진행하여 상기 603단계에서 확인한 단어의 개체명을 확인한다. 예를 들어, "철수와"의 개체명을 확인하는 경우, 상기 스토리 생성 장치는 "철수와"에서 조사인 "와"를 제거한 후, 상기 "철수"가 명사 사전에 포함되는지 확인한다. 만일, 상기 "철수"가 명사 사전에 포함되지 않는 경우, 상기 스토리 생성 장치는 상기 <표 4>와 같이 구성되는 개체명 패턴 사전에 상기 "철수"가 포함되는지 확인할 수도 있다. In
상기 603단계에서 확인한 단어의 개체명을 확인한 경우, 상기 스토리 생성 장치는 611단계로 진행하여 상기 인식한 개체명의 토픽의 발생 빈도를 갱신한다. 예를 들어, "친구"라는 단어의 PERSON 개체명을 확인한 경우, 상기 스토리 생성 장치는 PERSON의 토픽인 "생활"과 "소풍"의 발생 빈도를 하나 추가한다.When the entity name of the word checked in
한편, 단어의 개체명을 확인할 수 없는 경우, 상기 스토리 생성 장치는 607단계로 진행하여 상기 단어가 동사 사전 또는 동사 활용형 패턴 사전에 포함되는지 확인한다.On the other hand, if the entity name of the word cannot be confirmed, the story generating apparatus proceeds to step 607 to check whether the word is included in the verb dictionary or verb utilization pattern dictionary.
상기 단어가 동사 사전 또는 동사 활용형 패턴 사전에 포함되지 않는 경우, 상기 스토리 생성 장치는 상기 단어에서 자질을 추출할 수 없는 것으로 인식한다. 이에 따라, 상기 스토리 생성 장치는 609단계로 진행하여 다음 단어가 존재하는지 확인한다.If the word is not included in the verb dictionary or the verb utilization pattern dictionary, the story generating device recognizes that the feature cannot be extracted from the word. Accordingly, the story generating apparatus proceeds to step 609 to check whether the next word exists.
상기 607단계에서 단어가 동사 사전 또는 동사 활용형 패턴 사전에 포함되는 경우, 상기 스토리 생성 장치는 동사 추정을 성공한 것으로 인식한다. 이에 따라, 상기 스토리 생성 장치는 611단계로 진행하여 상기 동사 정보에 따른 토픽의 발생 빈도를 갱신한다.When the word is included in the verb dictionary or the verb utilization pattern dictionary in
이후, 상기 스토리 생성 장치는 609단계로 진행하여 다음 단어가 존재하는지 확인한다.In
다음 단어가 존재하지 않는 경우, 상기 스토리 생성 장치는 모든 자질을 추출한 것으로 인식한다. 이에 따라, 상기 스토리 생성 장치는 상기 407단계로 진행하여 각 토픽 세그먼트의 토픽을 결정한다.If the next word does not exist, the story generating device recognizes that all the qualities are extracted. Accordingly, the story generating apparatus proceeds to step 407 to determine the topic of each topic segment.
한편, 다음 단어가 존재하는 경우, 상기 스토리 생성 장치는 상기 603단계로 진행하여 자질을 추출할 다음 단어를 확인한다.On the other hand, if there is a next word, the story generating apparatus proceeds to step 603 to identify the next word to extract the feature.
미 도시되었지만, 상기 스토리 생성 장치는 인식한 개체명에 동사가 포함되는지 여부를 확인한다. 예를 들어, "철수와 영희가 집에 갔다"의 텍스트에서 "철수", "영희", "집"의 명사와 "갔다"의 동사를 추출한 경우, 상기 스토리 생성 장치는 "철수", "영희", "집"의 명사는 "갔다"라는 동사를 포함하는 것으로 인식한다. 하지만, 인식한 개체명에 동사가 포함되지 않은 경우, 상기 스토리 생성 장치는 기본 동사 사전에서 상기 개체명에 추가할 동사를 추정한다.Although not shown, the story generating apparatus checks whether the verb is included in the recognized entity name. For example, in the case of extracting the nouns of "Abstract", "Younghee", "House", and the verb "Go" from the text of "Cheon and Young-Hee went home," the story generating device is "Hole", "Young-Hee". The noun of "house" is understood to include the verb "go". However, when no verb is included in the recognized entity name, the story generating device estimates a verb to be added to the entity name in the basic verb dictionary.
도 7은 본 발명의 실시 예에 따른 시간별로 스토리를 생성하기 위한 절차를 도시하고 있다.7 illustrates a procedure for generating a story by time according to an embodiment of the present invention.
상기 도 7을 참조하면 상기 419단계에서 시간별로 스토리를 생성하는 것으로 결정한 경우, 상기 스토리 생성 장치는 701단계에서 각 에피소드의 주요 자질을 이용하여 각 에피소드에 대한 중간 문장을 생성한다. 예를 들어, 상기 스토리 생성 장치는 에피소드의 주요 자질에서 토픽과 동사를 확인한다. 이후, 상기 스토리 생성 장치는 하기 <표 11>에서 상기 토픽과 동사에 해당하는 문장 템플릿을 선택한다. 여기서, 상기 문장 템플릿은 특정 토픽과 동사에 의해 구성되는 문장 형식을 나타낸다. Referring to FIG. 7, if it is determined in
상기 <표 11>에서 첫 번째 열(colunm)은 토픽을 나타낸다. 이때, $는 기본 문장 생성에 이용되는 문장 템플릿을 나타낸다. 두 번째 열은 동사를 나타내며, 세 번째 열은 두 번째 열의 동사와 동일한 의미를 가지면서 표현 방식만 다른 유사 동사를 나타낸다. 네 번째 열은 문장 템플릿으로 동사와 토픽에 따라 구성된다. 다섯 번째 열은 문장 템플릿이 사용될 때 반드시 필요한 개체명 정보를 나타낸다. 예를 들어, 에피소드의 토픽이 "공부"이고 동사가 "전해주다"인 경우, 상기 스토리 생성 장치는 상기 <표 11>에 따라 "<DAY> <TIME>에 <LOCATION>에서 <OBJECT><을>/전해줬"과 같은 문장 템플릿을 해당 에피소드의 중간 문장으로 인식한다. 이때, 상기 스토리 생성 장치는 상기 <DAY>, <TIME>, <LOCATION> 및 <OBJECT> 중 어느 하나를 필수적으로 필요로 한다. 예를 들어, <OBJECT>를 필수적으로 가져야 하는 경우, 필수적으로 <OBJECT> 개체명을 포함하여 중간 문장을 생성한다. 만일, 필수적으로 필요한 <OBJECT> 개체명이 없는 경우, 상기 스토리 생성 장치는 문장 템플릿 생성 조건을 만족하지 않으므로 에피소드를 구성하지 않는다. In Table 11, the first column indicates a topic. In this case, $ represents a sentence template used for generating a basic sentence. The second column represents verbs, and the third column represents similar verbs with the same meaning as the verbs in the second column, but with different expressions. The fourth column is a sentence template, organized by verb and topic. The fifth column shows entity name information that is essential when a sentence template is used. For example, if the topic of the episode is "study" and the verb is "tell", the story generating device may change <OBJECT> <from <LOCATION> to "<DAY> <TIME> according to <Table 11>. Recognize a sentence template, such as> / ", as the middle sentence of the episode. In this case, the story generating device essentially requires any one of the <DAY>, <TIME>, <LOCATION>, and <OBJECT>. For example, if it is necessary to have an <OBJECT>, then an intermediate statement is created, including the <OBJECT> object name. If there is no required <OBJECT> entity name, the story generating device does not form an episode because the story template generation condition is not satisfied.
추가적으로, 상기 스토리 생성 장치는 문장 생성의 다양성을 제공하기 위해 에피소드의 동사가 아닌 유사 동사로 중간 문장을 생성할 수도 있다. 예를 들어, 에피소드의 토픽이 "공부"이고 동사가 "전해주다"인 경우, 상기 스토리 생성 장치는 상기 "전해주다"의 유의 동사인 "건내주"를 이용하여 "<DAY> <TIME>에 <LOCATION>에서 <OBJECT><을>/건네줬"과 같은 문장 템플릿을 해당 에피소드의 중간 문장으로 인식할 수도 있다.Additionally, the story generation device may generate intermediate sentences with similar verbs rather than verbs of episodes to provide diversity of sentence generation. For example, if the topic of the episode is "study" and the verb is "tell", the story generating device uses "Kun-na-ju", which is a significant verb of "tell", to "<DAY> <TIME>". Sentence templates such as <OBJECT> <and / handed> in <LOCATION> may be recognized as intermediate sentences of the episode.
에피소드에 대한 중간 문장을 생성한 후, 상기 스토리 생성 장치는 703단계로 진행하여 중복되는 문장을 제거한다. 예를 들어, “학교에/갔/가”과 “오늘 영희랑 학교에/갔/가"의 중간 문장을 생성한 경우, 상기 스토리 생성 장치는 “오늘 영희랑 학교에/갔/가"의 중간 문장이 “학교에/갔/가"의 중간 문장을 포괄하기 때문에 “학교에/갔/가"를 삭제한다. After generating the intermediate sentence for the episode, the story generating apparatus proceeds to step 703 to remove the duplicate sentence. For example, if a middle sentence between “going to / from school” and “to go to / from school today” is generated, the story generating device may be in the middle of “to / from / going to school with today”. Delete "go to school" because the sentence covers the middle sentence of "go / go".
중복되는 문장을 제거한 후, 상기 스토리 생성 장치는 705단계로 진행하여 중간 문장을 완전한 형태의 문장으로 변환한다. 즉, 상기 스토리 생성 장치는 어미 정보와 문장 연결 정보를 이용하여 중간 문장을 완전한 형태의 문장으로 변환한다. 예를 들어, “오늘 학교에서/시험쳤/시험치”와 “철수와/농구했/농구하”라는 중간 문장이 존재하고, 문장 연결 정보가 합동인 경우, 상기 스토리 생성 장치는 상기 두 문장을 하나의 문장으로 연결한다. 이때, 상기 스토리 생성 장치는 상기 <표 7>의 문장 연결어미 사전을 이용하여 두 문장을 연결할 문장 연결 어미를 선택한다. 이후, 상기 스토리 생성 장치는 종결 어미를 선택하여 "오늘 학교에서 시험쳤고, 철수와 농구했다"라는 완전한 문장을 생성한다. 이때, 상기 스토리 생성 장치는 지역, 성별 및 나이 중 적어도 하나를 고려하여 종결 어미를 선택할 수 있다. 만일, 연령별로 종결 어미를 다르게 설정하는 경우, 상기 스토리 생성 장치는 하기 <표 12>를 이용하여 종결 어미를 선택할 수 있다.After removing the duplicate sentences, the story generating apparatus proceeds to step 705 to convert the intermediate sentences into complete sentences. That is, the story generating device converts the intermediate sentence into a complete sentence using the mother information and the sentence connection information. For example, if there is an intermediate sentence of “today at school / tested / tested” and “withdrawn / basketballed / basketballed” and sentence linking information is conjoined, the story generating device may interpret the two sentences. Concatenate one sentence. In this case, the story generating apparatus selects a sentence connecting ending to connect two sentences using the sentence connecting ending dictionary of <Table 7>. The story generating device then selects the ending mother to generate a complete sentence, "tested at school today, withdrawn and basketball." In this case, the story generating device may select the ending ending in consideration of at least one of region, gender and age. If the ending ending is set differently for each age, the story generating device may select the ending ending using the following Table 12.
한편, 지역별로 종결 어미를 다르게 설정하는 경우, 상기 스토리 생성 장치는 하기 <표 13>을 이용하여 종결 어미를 선택할 수 있다.On the other hand, when the ending ending is set differently for each region, the story generating device may select the ending ending using the following <Table 13>.
상기 705단계에서 중간 문장을 완전한 문장으로 변환한 후, 상기 스토리 생성 장치는 상기 417단계로 진행하여 시간별로 생성한 문장을 사용자가 확인할 수 있도록 표시부에 표시한다.After converting the intermediate sentence into a complete sentence in
도 8은 본 발명의 실시 예에 따른 주제별로 스토리를 생성하기 위한 절차를 도시하고 있다.8 illustrates a procedure for generating a story for each topic according to an embodiment of the present invention.
상기 도 8을 참조하면 상기 419단계에서 주제별로 스토리를 생성하는 것으로 결정한 경우, 상기 스토리 생성 장치는 801단계에서 주 토픽에 관련된 에피소드들의 자질을 수집한다. 이 경우, 상기 스토리 생성 장치는 동일한 토픽이지만 발생 시간이 다른 에피소드들을 하나의 에피소드로 병합한다.Referring to FIG. 8, if it is determined in
이후, 상기 스토리 생성 장치는 803단계로 진행하여 상기 수집한 자질을 이용하여 중간 문장을 생성한다. 예를 들어, 상기 스토리 생성 장치는 상기 수집한 자질에서 토픽과 동사를 확인한다. 이후, 상기 스토리 생성 장치는 상기 <표 11>에서 상기 토픽과 동사에 해당하는 문장 템플릿을 선택한다. 만일, 에피소드의 토픽이 "공부"이고 동사가 "전해주다"인 경우, 상기 스토리 생성 장치는 상기 <표 11>에 따라 "<DAY> <TIME>에 <LOCATION>에서 <OBJECT><을>/전해줬"과 같은 문장 템플릿을 해당 에피소드의 중간 문장으로 인식한다. 이때, 상기 스토리 생성 장치는 상기 <DAY>, <TIME>, <LOCATION> 및 <OBJECT> 중 어느 하나를 필수적으로 필요로 한다. 예를 들어, <OBJECT>를 필수적으로 가져야 하는 경우, 필수적으로 <OBJECT> 개체명을 포함하여 중간 문장을 생성한다. 만일, 필수적으로 필요한 <OBJECT> 개체명이 없는 경우, 상기 스토리 생성 장치는 문장 템플릿 생성 조건을 만족하지 않으므로 에피소드를 구성하지 않는다. In
추가적으로, 상기 스토리 생성 장치는 문장 생성의 다양성을 제공하기 위해 에피소드의 동사가 아닌 유사 동사로 중간 문장을 생성할 수도 있다. 예를 들어, 에피소드의 토픽이 "공부"이고 동사가 "전해주다"인 경우, 상기 스토리 생성 장치는 상기 "전해주다"의 유의 동사인 "건내주"를 이용하여 "<DAY> <TIME>에 <LOCATION>에서 <OBJECT><을>/건네줬"과 같은 문장 템플릿을 해당 에피소드의 중간 문장으로 인식할 수도 있다.Additionally, the story generation device may generate intermediate sentences with similar verbs rather than verbs of episodes to provide diversity of sentence generation. For example, if the topic of the episode is "study" and the verb is "tell", the story generating device uses "Kun-na-ju", which is a significant verb of "tell", to "<DAY> <TIME>". Sentence templates such as <OBJECT> <and / handed> in <LOCATION> may be recognized as intermediate sentences of the episode.
에피소드에 대한 중간 문장을 생성한 후, 상기 스토리 생성 장치는 805단계로 진행하여 중복되는 문장을 제거한다. 예를 들어, “학교에/갔/가”과 “오늘 영희랑 학교에/갔/가"의 중간 문장을 생성한 경우, 상기 스토리 생성 장치는 “오늘 영희랑 학교에/갔/가"의 중간 문장이 “학교에/갔/가"의 중간 문장을 포괄하기 때문에 “학교에/갔/가"를 삭제한다. After generating the intermediate sentence for the episode, the story generating device proceeds to step 805 to remove the duplicate sentence. For example, if a middle sentence between “going to / from school” and “to go to / from school today” is generated, the story generating device may be in the middle of “to / from / going to school with today”. Delete "go to school" because the sentence covers the middle sentence of "go / go".
중복되는 문장을 제거한 후, 상기 스토리 생성 장치는 807단계로 진행하여 중간 문장을 완전한 형태의 문장으로 변환한다. 즉, 상기 스토리 생성 장치는 어미 정보와 문장 연결 정보를 이용하여 중간 문장을 완전한 형태의 문장으로 변환한다. 예를 들어, “오늘 학교에서/시험쳤/시험치”와 “철수와/농구했/농구하”라는 중간 문장이 존재하고, 문장 연결 정보가 합동인 경우, 상기 스토리 생성 장치는 상기 두 문장을 하나의 문장으로 연결한다. 이때, 상기 스토리 생성 장치는 상기 <표 7>의 문장 연결어미 사전을 이용하여 두 문장을 연결할 문장 연결 어미를 선택한다. 이후, 상기 스토리 생성 장치는 종결 어미를 선택하여 "오늘 학교에서 시험쳤고, 철수와 농구했다"라는 완전한 문장을 생성한다. 이때, 상기 스토리 생성 장치는 지역, 성별 및 나이 중 적어도 하나를 고려하여 종결 어미를 선택할 수 있다. 만일, 연령별로 종결 어미를 다르게 설정하는 경우, 상기 스토리 생성 장치는 하기 <표 12>를 이용하여 종결 어미를 선택할 수 있다.After removing the duplicate sentences, the story generating apparatus proceeds to step 807 and converts the intermediate sentences into complete sentences. That is, the story generating device converts the intermediate sentence into a complete sentence using the mother information and the sentence connection information. For example, if there is an intermediate sentence of “today at school / tested / tested” and “withdrawn / basketballed / basketballed” and sentence linking information is conjoined, the story generating device may interpret the two sentences. Concatenate one sentence. In this case, the story generating apparatus selects a sentence connecting ending to connect two sentences using the sentence connecting ending dictionary of <Table 7>. The story generating device then selects the ending mother to generate a complete sentence, "tested at school today, withdrawn and basketball." In this case, the story generating device may select the ending ending in consideration of at least one of region, gender and age. If the ending ending is set differently for each age, the story generating device may select the ending ending using the following Table 12.
상기 807단계에서 중간 문장을 완전한 문장으로 변환한 후, 상기 스토리 생성 장치는 상기 417단계로 진행하여 주제별로 생성한 문장을 사용자가 확인할 수 있도록 표시부에 표시한다. After converting the intermediate sentence into a complete sentence in
상술한 바와 같이 주제별 스토리를 생성하는 경우, 상기 스토리 생성 장치는 주토픽뿐만 아니라 날씨, 사용자의 감정에 관련된 스토리를 함께 생성할 수도 있다.As described above, when generating a story by theme, the story generating device may generate a story related to weather and user emotion as well as a main topic.
상술한 실시 예에서 이동 장치는 사용자 정보 수집, 사용자 정보 분석 및 스토리 생성을 모두 수행한다. 이때, 상기 이동 장치는 사용자 정보를 축척하여 상기 사용자의 행동 패턴을 추정할 수 있다. 이에 따라, 상기 이동장치는 사용자의 행동 패턴을 요약할 수 있는 토픽 정보를 토대로 스토리를 생성할 수 있다.In the above-described embodiment, the mobile device performs user information collection, user information analysis, and story generation. In this case, the mobile device may estimate user's behavior pattern by accumulating user information. Accordingly, the mobile device can generate a story based on topic information that can summarize a user's behavior pattern.
다른 실시 예에서 상기 이동 장치에서 사용자 정보를 수집하고, 정보 분석 서버에서 정보 분석 및 스토리를 생성할 수 있다. 예를 들어, 상기 이동 장치는 수집한 사용자 정보를 상기 정보 분석 서버로 제공한다. 상기 정보 분석 서버는 상기 이동 장치로부터 제공받은 사용자 정보를 분석하여 스토리를 생성한다. 이후, 상기 정보 분석 서버는 상기 생성한 스토리를 상기 이동 장치로 제공한다. 상기 이동 장치는 상기 정보 분석 서버에서 생성한 스토리를 사용자가 확인할 수 있도록 표시부에 표시한다. 즉, 상기 정보 분석 서버는 상기 도 1의 분석부(120) 및 스토리 생성부(130)와 동일한 동작을 수행한다. 이때, 상기 정보 분석 서버는 사용자 정보를 축척하여 상기 사용자의 행동 패턴을 추정할 수 있다. 이에 따라, 상기 정보 분석 서버는 상기 사용자의 행동 패턴을 요약할 수 있는 토픽 정보를 토대로 스토리를 생성할 수 있다.In another embodiment, user information may be collected by the mobile device, and information analysis and stories may be generated by an information analysis server. For example, the mobile device provides the collected user information to the information analysis server. The information analysis server analyzes user information provided from the mobile device to generate a story. Thereafter, the information analysis server provides the generated story to the mobile device. The mobile device displays a story generated by the information analysis server on a display unit for the user to check. That is, the information analysis server performs the same operations as the
또 다른 실시 예에서 상기 이동 장치는 사용자 정보를 수집하고, 정보 분석 서버에서 정보를 분석하며, 스토리 생성 서버에서 스토리를 생성할 수도 있다. 예를 들어, 상기 이동 장치는 수집한 사용자 정보를 상기 정보 분석 서버로 제공한다. 상기 정보 분석 서버는 상기 이동 장치로부터 제공받은 사용자 정보를 분석하여 스토리 생성 서버로 제공한다. 상기 스토리 생성 서버는 상기 정보 분석 서버로부터 제공받은 사용자 정보에 대한 분석 정보를 이용하여 스토리를 생성하고, 상기 생성한 스토리를 상기 이동 장치로 제공한다. 상기 이동 장치는 상기 정보 분석 서버에서 생성한 스토리를 사용자가 확인할 수 있도록 표시부에 표시한다. 즉, 상기 정보 분석 서버는 상기 도 1의 분석부(120)와 동일한 동작을 수행하고, 상기 스토리 생성 서버는 상기 도 1의 스토리 생성부(130)와 동일한 동작을 수행한다. 이때, 상기 정보 분석 서버는 사용자 정보를 축척하여 상기 사용자의 행동 패턴을 추정할 수 있다. 이에 따라, 상기 스토리 생성 서버는 상기 정보 분석 서버로부터 제공받은 사용자의 행동 패턴을 요약할 수 있는 토픽 정보를 토대로 스토리를 생성할 수 있다.In another embodiment, the mobile device may collect user information, analyze information in an information analysis server, and generate a story in a story generation server. For example, the mobile device provides the collected user information to the information analysis server. The information analysis server analyzes the user information provided from the mobile device and provides it to the story generation server. The story generation server generates a story using the analysis information on the user information provided from the information analysis server, and provides the generated story to the mobile device. The mobile device displays a story generated by the information analysis server on a display unit for the user to check. That is, the information analysis server performs the same operation as that of the
또 다른 실시 예에서 상기 이동 장치는 사용자 정보의 수집 및 스토리 생성을 수행하고, 정보 분석 서버에서 정보를 분석할 수도 있다. 예를 들어, 상기 이동 장치는 수집한 사용자 정보를 상기 정보 분석 서버로 제공한다. 상기 정보 분석 서버는 상기 이동 장치로부터 제공받은 사용자 정보를 분석하여 상기 이동 장치로 제공한다. 상기 이동 장치는 상기 정보 분석 서버로부터 제공받은 사용자 정보에 대한 분석 정보를 이용하여 스토리를 생성하고, 상기 스토리를 사용자가 확인할 수 있도록 표시부에 표시한다. 즉, 상기 정보 분석 서버는 상기 도 1의 분석부(120)와 동일한 동작을 수행한다. 이때, 상기 정보 분석 서버는 사용자 정보를 축척하여 상기 사용자의 행동 패턴을 추정할 수 있다. 이에 따라, 상기 이동 장치는 상기 정보 분석 서버로부터 제공받은 사용자의 행동 패턴을 요약할 수 있는 토픽 정보를 토대로 스토리를 생성할 수 있다. In another embodiment, the mobile device may collect user information and generate a story, and analyze the information in the information analysis server. For example, the mobile device provides the collected user information to the information analysis server. The information analysis server analyzes the user information provided from the mobile device and provides it to the mobile device. The mobile device generates a story using analysis information on user information provided from the information analysis server, and displays the story on a display unit for the user to check. That is, the information analysis server performs the same operation as the
상술한 실시 예에서 스토리 생성 장치는 사용자 일상 정보와 관련된 토픽을 선정하여 스토리를 생성한다. 이때, 상기 스토리 생성 장치는 하기 <표 14>와 같은 토픽 분류 목록을 이용하여 토픽을 선정할 수 있다.In the above-described embodiment, the story generating device generates a story by selecting a topic related to user daily information. In this case, the story generating device may select a topic using a topic classification list as shown in Table 14 below.
해외 여행, 국내 여행Work in zoo, botanical garden, amusement park
Overseas travel, domestic travel
뮤지컬
콘서트Theater
musical
concert
또한, 상기 스토리 생성 장치는 하기 <표 15>와 같이 기 설정된 환경 설정 파일을 토대로 로그 정보를 저장 및 분석할 수 있다.In addition, the story generating apparatus may store and analyze log information based on a preset environment setting file as shown in Table 15 below.
...
n라인4 lines
...
n lines
일정\t
GPS\tG\t1:걷|산책하|여행하:0|100|50000\t0.1\t100100\t100200
통화기록\tC\t2:통화하:20\t0.1\t020000\t100002SMS \ tS \ t \ t0.2 \ t000010 \ t010000
Event \ t
GPS \ tG \ t1: Walking | Walking | Travel: 0 | 100 | 50000 \ t0.1 \ t100100 \ t100200
Call Log \ tC \ t2: Call To: 20 \ t0.1 \ t020000 \ t100002
상기 <표 15>를 이용하여 구성한 GPS의 환경 설정 정보는 하기 <표 16>과 같이 구성될 수 있다.The environment setting information of the GPS configured using the <Table 15> may be configured as shown in the following <Table 16>.
...
항목 nItem 5
...
Item n
처리 방법 정보Log data
Processing method information
상기 <표 16>에서 기본 동사 정보는 거리에 따라 사용되는 기본 동사를 정의한다. 즉, 거리가 0m 이상 100m미만인 경우, 상기 스토리 생성 장치는 기본동사로 “걷다”를 선택하고, 거리가 100m 이상 50km미만인 경우, 기본 동사로 “산책하다”를 선택한다. In Table 16, basic verb information defines basic verbs used according to distance. That is, when the distance is 0m or more and less than 100m, the story generating device selects "walk" as the basic verb, and when the distance is 100m or more and less than 50km, the "verb" is selected as the basic verb.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능하다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.Meanwhile, in the detailed description of the present invention, specific embodiments have been described, but various modifications may be made without departing from the scope of the present invention. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the scope of the following claims, but also by the equivalents of the claims.
Claims (24)
적어도 하나의 전자 기기로부터 사용자의 일상 정보를 포함하는 로그 정보를 수집하는 정보 수집부와,
상기 정보 수집부에서 수집한 로그 정보를 분석하여 사용자의 일상 정보를 나타내는 적어도 하나의 토픽을 결정하는 분석부와,
상기 분석부에서 결정한 적어도 하나의 토픽을 이용하여 사용자의 일상 정보를 나타내는 적어도 하나의 문장을 생성하는 스토리 생성부를 포함하여 구성되는 것을 특징으로 하는 장치.
An apparatus for summarizing daily information of a user,
An information collecting unit collecting log information including daily information of a user from at least one electronic device;
An analysis unit for analyzing at least one log information collected by the information collection unit to determine at least one topic representing daily information of a user;
And a story generator for generating at least one sentence representing daily information of a user using at least one topic determined by the analyzer.
상기 분석부는,
상기 정보 수집부에서 수집한 로그 정보를 이용하여 적어도 하나의 후보 토픽을 포함하는 적어도 하나의 토픽 세그먼트를 구성하는 토픽 세그먼트 구성부와,
각각의 토픽 세그먼트에서 문장을 구성하기 위한 문장 구성 요소를 추출하는 추출부와,
상기 추출부에서 추출한 문장 구성 요소에 따른 토픽 발생 빈도를 고려하여 각각의 토픽 세그먼트에 대한 토픽을 결정하는 토픽 결정부와,
각각의 토픽 세그먼트에 포함되는 토픽의 발생 빈도를 고려하여 기준 시간에 대한 하나의 토픽 세그먼트를 선택하는 에피소드 결정부를 포함하여 구성되는 것을 특징으로 하는 장치.
The method of claim 1,
The analysis unit,
A topic segment configuration unit constituting at least one topic segment including at least one candidate topic using log information collected by the information collection unit;
An extraction unit for extracting sentence components for constructing sentences from each topic segment;
A topic determiner which determines a topic for each topic segment in consideration of the frequency of occurrence of the topic according to the sentence component extracted by the extractor;
And an episode determination unit for selecting one topic segment for a reference time in consideration of the frequency of occurrence of the topic included in each topic segment.
상기 토픽 세그먼트 구성부는, 다수 개의 로그 정보 중 어느 하나의 기준 로그 정보를 이용하여 적어도 하나의 토픽 세그먼트를 구성하고, 보조 로그 정보의 발생 시간을 고려하여 각각의 토픽 세그먼트에 보조 로그 정보를 매핑하며, 토픽 세그먼트에 매핑되지 않은 보조 로그 정보를 이용하여 더미 세그먼트를 구성하며,
상기 보조 로그 정보는, 상기 다수 개의 로그 정보 중 상기 기준 로그 정보를 제외한 로그 정보를 나타내는 것을 특징으로 하는 장치.
The method of claim 2,
The topic segment configuration unit configures at least one topic segment using any one of the plurality of log information using reference log information, and maps auxiliary log information to each topic segment in consideration of an occurrence time of the auxiliary log information. Dummy segments are constructed using secondary log information that is not mapped to topic segments.
The auxiliary log information, characterized in that the log information of the plurality of log information except the reference log information, characterized in that the log information.
상기 추출부는, 개체명 인식기를 포함하여 구성되는 것을 특징으로 하는 장치.
The method of claim 2,
The extractor is characterized in that it comprises an entity name recognizer.
상기 추출부는, 각각의 토픽 세그먼트에서 추출한 문장 구성 요소에 대한 토픽의 발생 빈도를 갱신하는 것을 특징으로 하는 장치.
The method of claim 2,
The extractor, characterized in that for updating the frequency of occurrence of the topic for the sentence component extracted from each topic segment.
상기 에피소드 추출부는, 각각의 기준 시간에서 선택된 토픽 세그먼트의 토픽 발생 빈도를 고려하여 어느 하나의 기준 토픽을 선택하는 것을 특징으로 하는 장치.
The method of claim 2,
The episode extraction unit, characterized in that for selecting any one of the reference topic in consideration of the frequency of occurrence of the topic of the selected topic segment at each reference time.
상기 에피소드 결정부는, 연속된 토픽 세그먼트들의 기준 토픽이 동일한 경우, 상기 동일한 기준 토픽을 포함하는 연속된 토픽 세그먼트들을 하나의 토픽 세그먼트로 통합하는 것을 특징으로 하는 장치.
The method according to claim 6,
The episode determiner, when the reference topics of the consecutive topic segments are the same, characterized in that the consolidation of consecutive topic segments including the same reference topic into one topic segment.
상기 분석부는, 기 설정된 환경 설정 정보에 따라 상기 정보 수집부에서 수집한 로그 정보를 분석하는 것을 특징으로 하는 장치.
The method of claim 1,
The analysis unit, characterized in that for analyzing the log information collected by the information collecting unit according to the preset environment setting information.
상기 스토리 생성부는, 기준 시간에 설정된 에피소드에 포함되는 문장 구성 요소를 이용하여 적어도 하나의 중간 문장을 구성하고, 동일한 의미의 중간 문장을 제거하며, 중간 문장에 문장 연결 어미와 종결 어미 정보를 추가하여 에피소드에 대한 문장을 생성하는 것을 특징으로 하는 장치.
The method of claim 1,
The story generator comprises at least one intermediate sentence using sentence components included in an episode set at a reference time, removes an intermediate sentence having the same meaning, and adds a sentence linking ending and ending ending information to the intermediate sentence. Device for generating a sentence for the episode.
상기 스토리 생성부는, 성별, 지역 및 연령 중 적어도 하나를 고려하여 상기 종결 어미를 설정하는 것을 특징으로 하는 장치.
The method of claim 9,
The story generation unit, characterized in that for setting the ending ending in consideration of at least one of gender, region and age.
상기 스토리 생성부는, 사용자의 일상 정보에서 대표가 되는 기준 토픽, 날씨 및 감정 중 적어도 하나를 고려하여 사용자의 일상 정보를 나타내는 적어도 하나의 문장을 생성하는 것을 특징으로 하는 장치.
The method of claim 1,
The story generation unit, characterized in that for generating at least one sentence representing the user's daily information in consideration of at least one of the reference topic, weather, and emotion that is representative of the user's daily information.
상기 스토리 생성부에서 생성한 적어도 하나의 문장을 표시하는 표시부를 더 포함하여 구성되는 것을 특징으로 하는 장치.
The method of claim 1,
And a display unit for displaying at least one sentence generated by the story generator.
적어도 하나의 전자 기기로부터 사용자의 일상 정보를 포함하는 로그 정보를 수집하는 과정과,
상기 정보 수집부에서 수집한 로그 정보를 분석하여 사용자의 일상 정보를 나타내는 적어도 하나의 토픽을 결정하는 과정과,
상기 분석부에서 결정한 적어도 하나의 토픽을 이용하여 사용자의 일상 정보를 나타내는 적어도 하나의 문장을 생성하는 과정을 포함하는 것을 특징으로 하는 방법.
In a method for summarizing daily information of a user,
Collecting log information including daily information of a user from at least one electronic device;
Determining at least one topic representing daily information of a user by analyzing log information collected by the information collector;
And generating at least one sentence representing daily information of a user using at least one topic determined by the analysis unit.
상기 토픽을 결정하는 과정은,
상기 수집한 로그 정보를 이용하여 적어도 하나의 후보 토픽을 포함하는 적어도 하나의 토픽 세그먼트를 구성하는 과정과,
각각의 토픽 세그먼트에서 문장을 구성하기 위한 문장 구성 요소를 추출하는 과정과,
상기 추출한 문장 구성 요소에 따른 토픽 발생 빈도를 고려하여 각각의 토픽 세그먼트에 대한 토픽을 결정하는 과정과,
각각의 토픽 세그먼트에 포함되는 토픽의 발생 빈도를 고려하여 기준 시간에 대한 하나의 토픽 세그먼트를 선택하는 과정을 포함하는 것을 특징으로 하는 방법.
The method of claim 13,
The process of determining the topic,
Constructing at least one topic segment including at least one candidate topic using the collected log information;
Extracting sentence components for constructing sentences from each topic segment;
Determining a topic for each topic segment in consideration of the frequency of occurrence of the topic according to the extracted sentence component;
Selecting one topic segment for a reference time in consideration of the frequency of occurrence of the topic included in each topic segment.
상기 토픽 세그먼트를 구성하는 과정은,
다수 개의 로그 정보 중 어느 하나의 기준 로그 정보를 이용하여 적어도 하나의 토픽 세그먼트를 구성하는 과정과,
보조 로그 정보의 발생 시간을 고려하여 각각의 토픽 세그먼트에 보조 로그 정보를 매핑하는 과정과,
토픽 세그먼트에 매핑되지 않은 보조 로그 정보가 존재하는 경우, 상기 토픽 세그먼트에 매핑되지 않은 보조 로그 정보를 이용하여 더미 세그먼트를 구성하는 과정을 포함하며,
상기 보조 로그 정보는, 상기 다수 개의 로그 정보 중 상기 기준 로그 정보를 제외한 로그 정보를 나타내는 것을 특징으로 하는 방법.
The method of claim 14,
The process of configuring the topic segment,
Configuring at least one topic segment by using any one of the plurality of log information based on the reference log information;
Mapping the auxiliary log information to each topic segment in consideration of the occurrence time of the auxiliary log information;
If there is auxiliary log information not mapped to the topic segment, including a step of configuring a dummy segment by using the auxiliary log information not mapped to the topic segment;
And the auxiliary log information indicates log information excluding the reference log information among the plurality of log information.
상기 문장 구성 요소를 추출하는 과정, 개체명 인식기를 이용하여 텍스트 형식의 데이터에서 문장 구성 요소를 추출하는 과정을 포함하는 것을 특징으로 하는 방법.
The method of claim 14,
Extracting the sentence component; extracting the sentence component from textual data using an entity name recognizer.
상기 문장 구성 요소를 추출한 후, 각각의 토픽 세그먼트에서 추출한 문장 구성 요소에 대한 토픽의 발생 빈도를 갱신하는 과정을 더 포함하는 것을 특징으로 하는 방법.
The method of claim 14,
And after extracting the sentence component, updating the frequency of occurrence of the topic for the sentence component extracted from each topic segment.
상기 토픽 세그먼트를 선택하는 과정은,
각각의 기준 시간에서 선택된 토픽 세그먼트의 토픽 발생 빈도를 고려하여 어느 하나의 기준 토픽을 선택하는 과정을 포함하는 것을 특징으로 하는 방법.
The method of claim 14,
The process of selecting the topic segment,
And selecting one reference topic in consideration of the frequency of occurrence of the topic of the selected topic segment at each reference time.
상기 기준 토픽을 선택한 후, 연속된 토픽 세그먼트들의 기준 토픽이 동일한지 확인하는 과정과,
연속된 세그먼트들의 기준 토픽이 동일한 경우, 상기 동일한 기준 토픽을 포함하는 연속된 토픽 세그먼트들을 하나의 토픽 세그먼트로 통합하는 과정을 더 포함하는 것을 특징으로 하는 방법.
19. The method of claim 18,
Selecting the reference topic and checking whether the reference topics of consecutive topic segments are the same;
If the reference topics of consecutive segments are the same, further comprising merging consecutive topic segments comprising the same reference topic into one topic segment.
상기 적어도 하나의 토픽을 결정하는 과정은,
기 설정된 환경 설정 정보에 따라 상기 수집한 로그 정보를 분석하여 적어도 하나의 토픽을 결정하는 과정을 포함하는 것을 특징으로 하는 방법.
The method of claim 13,
Determining the at least one topic,
And determining at least one topic by analyzing the collected log information according to preset environment setting information.
상기 문장을 생성하는 과정은,
기준 시간에 설정된 에피소드에 포함되는 문장 구성 요소를 이용하여 적어도 하나의 중간 문장을 구성하는 과정과,
동일한 의미의 중간 문장을 제거하는 과정과,
중간 문장에 문장 연결 어미와 종결 어미 정보를 추가하여 에피소드에 대한 문장을 생성하는 과정을 포함하는 것을 특징으로 하는 방법.
The method of claim 13,
The process of generating the sentence,
Constructing at least one intermediate sentence using sentence components included in the episode set at the reference time;
Removing the middle sentence of the same meaning,
And adding a sentence linking ending and ending ending information to the middle sentence to generate a sentence for the episode.
상기 종결 어미는, 성별, 지역 및 연령 중 적어도 하나를 고려하여 설정되는 것을 특징으로 하는 방법.
22. The method of claim 21,
The ending ending is set in consideration of at least one of gender, region and age.
상기 문장을 생성하는 과정은,
사용자의 일상 정보에서 대표가 되는 기준 토픽, 날씨 및 감정 중 적어도 하나를 고려하여 사용자의 일상 정보를 나타내는 적어도 하나의 문장을 생성하는 과정을 포함하는 것을 특징으로 하는 방법.
The method of claim 13,
The process of generating the sentence,
And generating at least one sentence representing the user's daily information in consideration of at least one of reference topics, weather, and emotions that are representative of the user's daily information.
상기 생성한 적어도 하나의 문장을 표시하는 과정을 더 포함하는 것을 특징으로 하는 방법.The method of claim 13,
And displaying the generated at least one sentence.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/436,441 US8892555B2 (en) | 2011-03-31 | 2012-03-30 | Apparatus and method for generating story according to user information |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110029154 | 2011-03-31 | ||
KR20110029154 | 2011-03-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120111855A true KR20120111855A (en) | 2012-10-11 |
KR101804889B1 KR101804889B1 (en) | 2018-01-10 |
Family
ID=47282448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110055102A KR101804889B1 (en) | 2011-03-31 | 2011-06-08 | Apparatus and method for generating story according to user information |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101804889B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140121074A (en) * | 2013-04-05 | 2014-10-15 | 에스케이텔레콤 주식회사 | Method for recording life log diary based on context aware, apparatus and terminal thereof |
US20210224310A1 (en) * | 2020-01-22 | 2021-07-22 | Samsung Electronics Co., Ltd. | Electronic device and story generation method thereof |
CN113762474A (en) * | 2021-08-26 | 2021-12-07 | 厦门大学 | Story ending generation method and storage medium for adaptive theme |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090210516A1 (en) * | 2008-02-15 | 2009-08-20 | Carrier Iq, Inc. | Using mobile device to create activity record |
JP2010279638A (en) * | 2009-06-08 | 2010-12-16 | Nikon Corp | Life log recording apparatus |
KR20110000054A (en) | 2009-06-26 | 2011-01-03 | 삼성전자주식회사 | Apparatus and method for displaying landmakr based on lifelog |
KR101194186B1 (en) * | 2012-03-21 | 2012-10-24 | 주식회사 좋은정보기술 | A lifelog system by using intelligent context-aware |
-
2011
- 2011-06-08 KR KR1020110055102A patent/KR101804889B1/en not_active Application Discontinuation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140121074A (en) * | 2013-04-05 | 2014-10-15 | 에스케이텔레콤 주식회사 | Method for recording life log diary based on context aware, apparatus and terminal thereof |
US20210224310A1 (en) * | 2020-01-22 | 2021-07-22 | Samsung Electronics Co., Ltd. | Electronic device and story generation method thereof |
WO2021149930A1 (en) * | 2020-01-22 | 2021-07-29 | Samsung Electronics Co., Ltd. | Electronic device and story generation method thereof |
CN113762474A (en) * | 2021-08-26 | 2021-12-07 | 厦门大学 | Story ending generation method and storage medium for adaptive theme |
Also Published As
Publication number | Publication date |
---|---|
KR101804889B1 (en) | 2018-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9159313B2 (en) | Playback control apparatus, playback control method, and medium for playing a program including segments generated using speech synthesis and segments not generated using speech synthesis | |
EP3288275B1 (en) | Methods and systems of providing visual content editing functions | |
CN103412951A (en) | Individual-photo-based human network correlation analysis and management system and method | |
EP2549390A1 (en) | Data processing device and data processing method | |
CN109416805A (en) | The method and system of presentation for the media collection with automatic advertising | |
US20140294167A1 (en) | Terminal, server, and method for actively providing information based on communication contents | |
CN112088370A (en) | Digital asset search user interface | |
CN102282442A (en) | Tool and method for mapping and viewing an event | |
CN102741835A (en) | Method, apparatus or system for image processing | |
KR20120013044A (en) | Mobile system, search system and search result providing method for mobile search | |
JP7155248B2 (en) | Implementing a Cue Data Model for Adaptive Presentation of Collaborative Recollection of Memories | |
US8892555B2 (en) | Apparatus and method for generating story according to user information | |
CN110147467A (en) | A kind of generation method, device, mobile terminal and the storage medium of text description | |
KR20150016786A (en) | Device and sever for providing a subject of conversation and method for providing the same | |
CN106664450A (en) | Server, information providing method of server, display apparatus, controlling method of display apparatus and information providing system | |
CN111563151B (en) | Information acquisition method, session configuration method, device and storage medium | |
Adolphs et al. | Capturing context for heterogeneous corpus analysis: Some first steps | |
US20120185417A1 (en) | Apparatus and method for generating activity history | |
US8074176B2 (en) | Electronic communications dialog using sequenced digital images stored in an image dictionary | |
JP5779938B2 (en) | Playlist creation device, playlist creation method, and playlist creation program | |
KR101804889B1 (en) | Apparatus and method for generating story according to user information | |
US20140278404A1 (en) | Audio merge tags | |
CN110166345A (en) | Resource sharing method, resource acquiring method, device and storage medium | |
CN108628988A (en) | A kind of clothing matching recommends method, apparatus, Intelligent clothes cabinet and storage medium | |
JP2012168862A (en) | Behavior information recording apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |