KR101020138B1 - Method and apparutus for automatic contents generation - Google Patents

Method and apparutus for automatic contents generation Download PDF

Info

Publication number
KR101020138B1
KR101020138B1 KR1020080028797A KR20080028797A KR101020138B1 KR 101020138 B1 KR101020138 B1 KR 101020138B1 KR 1020080028797 A KR1020080028797 A KR 1020080028797A KR 20080028797 A KR20080028797 A KR 20080028797A KR 101020138 B1 KR101020138 B1 KR 101020138B1
Authority
KR
South Korea
Prior art keywords
data
information
content
generating
information data
Prior art date
Application number
KR1020080028797A
Other languages
Korean (ko)
Other versions
KR20090103287A (en
Inventor
김동진
김정민
박광수
정준섭
김백중
박경하
이창원
Original Assignee
주식회사 씽크풀
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씽크풀 filed Critical 주식회사 씽크풀
Priority to KR1020080028797A priority Critical patent/KR101020138B1/en
Priority to PCT/KR2008/001837 priority patent/WO2009119931A1/en
Publication of KR20090103287A publication Critical patent/KR20090103287A/en
Application granted granted Critical
Publication of KR101020138B1 publication Critical patent/KR101020138B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

컨텐츠 자동 생성 방법 및 그 장치가 개시된다. 상기 기술적 과제를 달성하기 위한 컨텐츠 자동 생성 방법은 컨텐츠 자동 생성 장치가 정보 제공원 시스템으로부터 정보 데이터를 수신하는 단계, 수신된 상기 정보 데이터 또는 상기 정보 데이터와 관련된 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(data base) 중 적어도 하나에 기초하여 가공 데이터를 생성하는 단계, 및 생성된 상기 가공 데이터, 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 단계를 포함한다.Disclosed are a method and apparatus for automatically generating content. According to an aspect of the present invention, there is provided a method for automatically generating content to receive information data from an information source system, and to store at least some of the received information data or past information data related to the information data. Generating processing data based on at least one of cumulative data DBs; and generating content based on at least one of the generated processing data, past processing data, the cumulative data DB, or the information data It includes a step.

Description

컨텐츠 자동 생성 방법 및 그 장치{Method and apparutus for automatic contents generation}Method for generating content automatically and its device {Method and apparutus for automatic contents generation}

본 발명은 컨텐츠 자동 생성 방법 및 그 장치에 관한 것으로, 보다 상세하게는 속보성 기사를 수신하면 이를 단순히 전달하거나 정리하는 수준이 아니라 과거의 축적된 데이터 및 관련 정보에 기초하여 상기 속보성 기사와 관련된 유익한 부가 정보 및 분석의견 등이 자동으로 생성되어 정보 이용자에게 제공될 수 있는 방법 및 장치에 관한 것이다.The present invention relates to a method for automatically generating content and a device thereof, and more particularly, to receive a breaking news article and not to simply deliver or organize the breaking news article, but to relate to the breaking news article based on past accumulated data and related information. The present invention relates to a method and an apparatus in which beneficial additional information, an analysis opinion, and the like can be automatically generated and provided to an information user.

본 발명은 컨텐츠를 자동으로 생성할 수 있는 기술적 사상을 제공한다. 본 명세서에서 컨텐츠라 함은 정보 소비자에게 유용한 의미를 갖는 정보로써 형태를 불문하고 본 발명의 기술적 사상에 따라 생성될 수 있는 모든 정보를 포함하는 의미로 사용될 수 있다. 예컨대, 부동산 시세, 상품정보, 날씨 정보, 생명보험협회, 자산운용협회 펀드관련 정보가 컨텐츠가 될 수 있다. 또한, 상기 컨텐츠는 텍스트, 이미지, 표, 그래프, 오디오 정보 및/또는 비디오 정보 등 어떠한 형태로도 제공될 수 있다.The present invention provides a technical idea that can automatically generate content. In the present specification, content refers to information having a useful meaning to an information consumer, and may be used to include all information that may be generated according to the technical spirit of the present invention, regardless of form. For example, real estate quotes, product information, weather information, life insurance association, asset management association fund-related information may be the content. In addition, the content may be provided in any form such as text, image, table, graph, audio information and / or video information.

이하 본 명세서에서는 설명의 편의를 위해 상기 컨텐츠가 주식과 관련한 공 시자료 및 이에 따른 다양하고 유용한 정보인 경우를 일 예로 들어 설명하지만 본 발명의 권리범위가 이에 한정되는 것은 아니다.Hereinafter, for convenience of description, the contents will be described as an example of a case in which the contents are disclosure data and various useful information related to the stock, but the scope of the present invention is not limited thereto.

증권에 관련된 기사를 제공하는 온라인 신문사의 보도기사는 시급히 보도해야하는 속보성 보도 기사(스트레이트 기사)의 비중이 크다. 하지만, 이러한 속보성 보도 기사를 제공하기 위해서 종래에는 도 1a에 도시되는 바와 같이 대부분 기자의 손에 의해 수작업으로 이루어지기 때문에 많은 시간, 노동력 및 비용이 소요되어 왔다.News articles from online newspapers that provide securities related articles have a high proportion of breaking news reports (straight articles) that must be reported urgently. However, in order to provide such a breaking news, it has been a lot of time, labor and cost because it is made manually by the hands of the journalist as shown in Figure 1a.

도 1a는 종래의 컨텐츠 생성 방법을 설명하기 위한 도면이다.1A is a diagram for describing a conventional content generation method.

도 1a를 참조하면, 정보 제공원 시스템(예컨대, 금융 감독원 시스템 등)으로부터 2006.10.23. 15:26분 경에 한독약품(종목고유번호: 002390)의 실적관련공시정보(1)가 제공되었다. 그러면, 기존의 정보 제공 서비스업자(예컨대, 온라인 신문사들)는 한독약품(종목고유번호: 002390)의 실적관련공시정보(1)를 기반으로 보도 기사를 수작업으로 작성하였다. 예컨대, 도 1a에 도시된 바와 같이 A 신문사에서는 상기 실적관련공시정보(1)에 기초하여 보도기사(2)를 수작업으로 작성한 후 15:29 분경에 정보 소비자에게 제공한다. 또한, B 신문사에서는 동일한 상기 실적관련공시정보(1)에 기초하여 보도기사(3)를 수작업으로 작성한 후 15:35 분경에 정보 소비자에게 제공하였다. 또한, C 신문사에서도 마찬가지로 상기 실적관련 공시정보(1)에 기초하여 보도기사(4)를 수작업으로 작성한 후 16:22 분경에 정보 소비자에게 제공하였다.Referring to FIG. 1A, an information source system (eg, financial supervisory system, etc.) may be used. At around 15:26, performance-related disclosure information (1) was provided for Handok Pharmaceuticals (stock unique number: 002390). Then, the existing information providing service provider (eg, online newspapers) wrote a news article by hand based on the performance-related disclosure information (1) of Handok Pharmaceuticals (stock unique number: 002390). For example, as illustrated in FIG. 1A, the newspaper A produces a press article 2 manually based on the performance-related disclosure information 1 and provides the information consumer at about 15:29. In addition, the newspaper B produced the press article 3 by hand based on the same performance-related disclosure information 1 and provided it to the information consumer at about 15:35. In addition, the newspaper C also similarly prepared the press article 4 on the basis of the performance-related disclosure information 1 and provided it to the information consumer at about 16:22.

이와 같은 종래의 방법은 도 1a에서도 알 수 있듯이, 수작업으로 인한 기사 작성의 시간을 요하는 단점이 있다. 즉, A 신문의 경우 보도 시각은 2006년 10월 23일 15시 29분 59초, B 신문의 경우 보도 시각은 2006년 10월 23일 15시 35분 18초, C 신문의 경우 보도 시각은 2006년 10월 23일 16시 22분 17초로서, 공시발생 후 각각 3분 2초, 8분 21초 및 55분 30초가 소요되었다. 더구나 보도기사(2), 보도기사(3), 및 보도기사(4) 모두가 부가 자료나 분석 의견도 없이 공시 원본을 한 번 더 보도한 것에 지나지 않아 정보 소비자는 동일한 정보를 반복적으로 확인하여야 하며, 그 정보의 질도 공시 원본 그 이상도 이하도 아닌 문제점이 있다.As can be seen in Figure 1a, such a conventional method has a disadvantage in that it takes time for writing an article by hand. That is, in the case of newspaper A, the reporting time is 15:29:59 seconds on October 23, 2006, in the case of newspaper B: 15:35:18 seconds on October 23, 2006, and in the case of newspaper C: 2006 At 23:22:17 on 23 October, it took 3 minutes, 2 seconds, 8 minutes, 21 seconds, and 55 minutes, 30 seconds, respectively. Furthermore, the news reporter (2), the news reporter (3), and the news reporter (4) all reported the original disclosure once more without additional data or analytical opinions. However, there is a problem that the quality of the information is not more than or less than the published original.

또한, 본 발명의 기술적 과제에서처럼 정보 소비자에게 공시 원본 이외의 다양한 부가 정보 등을 추가로 제공하고자 하는 경우, 신문사는 이러한 부가 정보를 수작업으로 생성하는데 많은 시간을 소비하게 되어 분초를 다투는 증권 컨텐츠 생성에 있어서 속보성 컨텐츠로서의 가치가 훼손된다는 문제가 있었다.In addition, in the technical problem of the present invention, if you want to provide additional information, such as a variety of additional information other than the original disclosure to the information consumer, newspapers spend a lot of time manually generating such additional information to create securities content to compete There is a problem that the value as breaking news content is damaged.

이에 따라 본 발명의 기술적 과제는 도 1a에 도시된 상기 실적관련 공시정보(1)를 수신하면, 도 1b에 도시된 바와 같이 상기 실적관련 공시정보(1)와 관련된 다양한 부가정보 및/또는 분석의견을 자동으로 생성하여 신속하게 정보 소비자에게 제공하는 것이다. 예컨대, 도 1b에 도시된 바와 같이 본 발명의 기술적 과제는 상기 실적관련 공시정보(1)와 관련하여 한독약품의 3/4분기 실적을 과거의 실적과 비교한 표, 과거의 주가 추이를 분석정보, 상기 실적관련 공시정보(1)에서 제공되는 정보에 기초하여 상기 실적관련 공시정보(1)에서는 알 수 없는 ROE(영업 이익률), PER, 및/또는 PBR 등의 정보, 및/또는 동일 업종에서의 타종목과의 실적 비교 정보 등을 컨텐츠로 자동으로 생성하여 제공할 수 있다.Accordingly, when the technical problem of the present invention receives the performance-related disclosure information 1 illustrated in FIG. 1A, various additional information and / or analysis opinions related to the performance-related disclosure information 1 are illustrated as shown in FIG. 1B. Is automatically generated and quickly provided to the information consumer. For example, as shown in FIG. 1B, the technical problem of the present invention is a table comparing the past quarterly results of Handok Pharmaceuticals with the past results in relation to the above performance related disclosure information (1), and analysis of past stock price trends. On the basis of the information provided in the performance-related disclosure information (1), information such as ROE (operating profit margin), PER, and / or PBR, which are unknown in the performance-related disclosure information (1), and / or in the same industry You can automatically generate and provide content comparison information with other events as a content.

한편, 종래의 선행기술로서 특허 제0416953호 "시스템 뉴스 제공 시스템 및 방법(이하 선행 특허라 한다)"가 있다. 상기 선행 특허는 투자정보에 대하여 '사용자 또는 시스템 운영자'에 의해 미리 설정된 로직에 대응되는 뉴스를 발생시키는 구조로 되어 있다. 그러나 상기 선행 특허의 경우에서는 상시로 흘러나오는 정보를 정보 소비자 또는 시스템 운영자가 설정해 둔 소정의 로직에 상응하는 이벤트에 대해 고정화된 문구 정도를 발생시키는 구조이므로 그것이 기사라고 할 수 있을 만큼 양적으로나 질적으로나 완결성이 떨어진다.  On the other hand, there is a prior art patent No. 0416953, "System news providing system and method (hereinafter referred to as prior patent)". The preceding patent has a structure for generating news corresponding to logic preset by the 'user or system operator' with respect to the investment information. However, in the case of the preceding patent, since it is a structure that generates a fixed phrase for an event corresponding to a predetermined logic set by an information consumer or a system operator, information flowing out at all times is quantitatively and qualitatively enough to be called an article. Incompleteness

또한, 정보 소비자가 직접 설정한 로직에 대해 그 해당 정보 소비자만 뉴스를 제공 받는다면 그것은 속보성 컨텐츠라기보다는 현재 홈트레이딩시스템(HTS)에서 사용하는 실시간 검색 기능과 별다를 바가 없다는 것이다. 그리고 그것이 보여줄 결과물도 단편적인 내용으로서, 주식거래를 하고 있는 일부 사용자들에게만 의미 있는 내용, 예컨대 상한가, 하한가 정보, 매도량 정보 등으로 기사라고 보기 어렵다. 또한, 뉴스생성의 근본이 되는 기반 데이터도 시세정보 등과 같이 단일 데이터를 기반으로 하므로, 생성되는 기사가 단순하고 뉴스라기보다는 알람(alarm) 장치에 불과하다고 볼 수 있다. 또한, 상기 선행 특허는 단일 데이터 내에서 로직에 해당하느냐 해당하지 않느냐가 뉴스 발생 여부를 결정짓는데, 이는 결국, '시스템 운영자 또는 정보 소비자가 의미가 있다고 생각하는 정보'만을 기사로 생성시킨다는 것을 의미한다. 이것은 '기사 발생 여부'를 시스템운영자 또는 정보 소비자의 자의적 판단에 맡기는 것이며 자칫 중요한 기사를 상당수 놓칠 수 있고 또한 클라이언트마다 서로 다른 뉴스가 생성되어 실제로는 정보의 비대칭성이 발생하는바, 뉴스라고 하기 어렵다는 문제점이 있다. 또한, 상기 선행 특허는 '로직에 해당하는 사건이 있느냐?' 가 뉴스생성의 중요한 결정인자이자 내용이므로 전달할 내용이 '로직에 해당하는 사건발생'이기 때문에 내용에서 객관성이 떨어지고 6하 원칙의 필수 요소들이 빠질 가능성이 높다.In addition, if only the information consumer is informed about the logic set by the information consumer, it is not the breaking news content but the real-time search function currently used in the home trading system (HTS). And the result it shows is fragmentary, and it is hard to say that it is an article that is meaningful only to some users who are trading stocks, such as the upper and lower limit information, and the selling amount information. In addition, since the base data, which is the basis of news generation, is also based on a single data such as quote information, the generated article may be regarded as a simple alarm device rather than a news. In addition, the preceding patent determines whether or not news occurs in a single data logic, which means that only 'information that the system operator or information consumer thinks meaningful' is generated as an article. . It is left to the arbitrary judgment of the system operator or the information consumer. It is difficult to say that the news is difficult because it can miss a large number of important articles and generate different news for each client. There is a problem. In addition, the preceding patent asks 'is there a case corresponding to logic?' Is an important determinant and content of news creation, so the content to be delivered is the occurrence of logic-related events.

결국, 선행 특허에서도 본 출원인이 이루고자 하는 기술적 과제를 해결하기 위한 기술적 사상을 제공하지는 못한다.As a result, the preceding patent does not provide a technical idea for solving the technical problem that the applicant intends to achieve.

따라서, 복잡하고 다양한 공시정보들을 가공하여 보도성 컨텐츠를 자동으로 생성하여 중요한 정보들을 신속하게 제공할 수 있으며, 기업의 공시담당자의 입력 오류와 같이 공시정보의 기재 오류가 있는 경우에도 이를 필터링할 수 있어서 유효한 정보만을 컨텐츠로 생성하여 컨텐츠의 신뢰성을 높이며, 마치 사람이 직접 문장을 작성한 것과 같은 느낌을 줄 수 있을 정도로 분석의견이나 가공정보를 소정의 로직, 문장의 의미파싱, 및 합성 등에 필요한 언어처리기술을 이용하여 완성도 있는 컨텐츠를 제공할 수 있는 방법 및 그 장치가 절실히 요구된다.Therefore, by processing complex and diverse disclosure information, it is possible to automatically generate press release contents to provide important information quickly, and filter the disclosure information even if there is a description error of disclosure information, such as a company's disclosure officer's input error. Therefore, only the valid information is generated as the content, which improves the reliability of the content, and the language processing necessary for the analysis of logic, sentence semantic parsing, and synthesizing the opinion or processing information to the extent that it can feel as if a person wrote the sentence. There is an urgent need for a method and an apparatus capable of providing complete content using technology.

따라서 본 발명이 이루고자 하는 기술적인 과제는 정보 데이터(예컨대, 공시정보)를 수신하면, 상기 정보 데이터 자체를 정보 소비자가 접근하기 쉽도록 표 또는 그래프 등의 형태로 생성하여 정보 소비자에게 제공하거나, 상기 정보 데이터와 관련한 다양한 부가정보 및 분석의견을 자동으로 컨텐츠로 생성하여 제공할 수 있는 방법 및 그 장치를 제공하는 것이다.Accordingly, the technical problem to be achieved by the present invention is to provide the information consumer by generating the information data itself in the form of a table or graph so that the information consumer can easily access the information data (for example, the disclosure information). The present invention provides a method and apparatus for automatically generating and providing various additional information and analysis opinions related to information data.

또한, 수신되는 정보 데이터의 입력 오류 등을 검사하여 오류가 있는 정보 데이터라고 판단되면 컨텐츠를 생성하지 않아서 신뢰성 있는 컨텐츠를 제공하는 것이다.In addition, if it is determined that there is an error of the information data by checking an input error or the like of the received information data, the content is not generated, thereby providing reliable content.

상기 기술적 과제를 달성하기 위한 컨텐츠 자동 생성 방법은 컨텐츠 자동 생성 장치가 정보 제공원 시스템으로부터 정보 데이터를 수신하는 단계, 수신된 상기 정보 데이터 또는 상기 정보 데이터와 관련된 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(data base) 중 적어도 하나에 기초하여 가공 데이터를 생성하는 단계, 및 생성된 상기 가공 데이터, 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 단계를 포함한다.According to an aspect of the present invention, there is provided a method for automatically generating content to receive information data from an information source system, and to store at least some of the received information data or past information data related to the information data. Generating processing data based on at least one of cumulative data DBs; and generating content based on at least one of the generated processing data, past processing data, the cumulative data DB, or the information data It includes a step.

상기 가공 데이터를 생성하는 단계는 수신된 상기 정보 데이터를 파싱하여 상기 정보 데이터 중 적어도 일부를 추출하고, 추출된 상기 정보 데이터 중 적어도 일부를 상기 누적 데이터 DB에 저장하는 단계, 추출된 상기 정보 데이터 중 적어도 일부, 상기 누적 데이터 DB에 저장되어 있던 데이터, 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 가공 데이터를 생성하는 단계를 포함할 수 있다.The generating of the processed data includes parsing the received information data to extract at least a portion of the information data, and storing at least a portion of the extracted information data in the cumulative data DB, among the extracted information data. And generating the processed data based on at least one of at least one of data stored in the cumulative data DB or real-time data corresponding to the information data.

상기 정보 데이터를 수신하는 단계는 미리 저장된 검색어에 기초하여 상기 검색어에 상응하는 상기 정보 데이터를 상기 정보 제공원 시스템으로부터 수신하는 단계를 포함할 수 있다.Receiving the information data may include receiving the information data corresponding to the search word from the information provider system based on a pre-stored search word.

상기 가공 데이터를 생성하는 단계는 수신된 상기 정보 데이터의 유효성을 검사하는 단계를 더 포함하며, 유효한 경우에 상기 누적 데이터 DB에 상기 정보 데이터 중 적어도 일부를 추출하여 상기 누적 데이터 DB에 저장할 수 있다.The generating of the processed data may further include checking validity of the received information data. If the processed data is valid, at least a part of the information data may be extracted from the accumulated data DB and stored in the accumulated data DB.

상기 컨텐츠 자동 생성 장치는 미리 저장된 양식 정보에 기초하여 상기 정보 데이터의 적어도 일부를 추출하거나 상기 컨텐츠 데이터의 유효성을 검사할 수 있다.The apparatus for automatically generating content may extract at least a portion of the information data or check the validity of the content data based on previously stored form information.

상기 컨텐츠를 생성하는 단계는 생성된 상기 가공 데이터, 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에서 상기 컨텐츠로 생성될 부분인 컨텐츠 데이터를 결정하는 단계 및 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터, 표, 또는 그래프 중 적어도 하나로 변환하는 단계를 포함할 수 있다.The generating of the content may include determining content data that is a part to be generated as the content from at least one of the generated processing data, past processing data, the cumulative data DB, or the information data, and determining the determined content data. And converting it into at least one of text data, a table, or a graph.

상기 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터, 표, 또는 그래프 중 적어도 하나로 변환하는 단계는 결정된 상기 컨텐츠 데이터에서 키워드를 추출하고, 추출된 키워드에 대응되는 용어를 결정하는 단계, 키워드에 대응되는 수치데이터가 있는 경우 수치데이터를 결정하는 단계, 상기 용어, 결정된 상기 수치데이터를 재배열하는 단계, 및 재배열 결과에 기초하여 문장성분을 추가하는 단계를 포함할 수 있다.The converting of the determined content data into at least one of text data, a table, or a graph may include extracting a keyword from the determined content data, determining a term corresponding to the extracted keyword, and a numerical value corresponding to the keyword. If there is data, the method may include determining numerical data, rearranging the term, determined numerical data, and adding a sentence component based on the rearrangement result.

상기 결정된 상기 컨텐츠 데이터를 텍스트 데이터, 표, 또는 그래프 중 적어도 하나로 변환하는 단계는, 상기 컨텐츠 데이터에 포함되는 키워드를 추출하고, 상기 키워드에 대응되는 수치데이터를 비교하는 단계, 비교결과에 상응하는 용언을 선택하고 선택된 상기 용언 및 상기 키워드에 기초하여 분석 정보를 결정하는 단계, 결정된 상기 분석 정보, 상기 키워드, 또는 상기 용언 각각의 사이에 들어갈 문장성분을 결정하고, 결정된 문장성분, 상기 분석정보, 상기 키워드, 및 상기 용언을 조합하여 텍스트 데이터로 변환하는 단계를 포함할 수 있다.The converting of the determined content data into at least one of text data, a table, and a graph may include extracting a keyword included in the content data, comparing numerical data corresponding to the keyword, and a term corresponding to a comparison result. Selecting and determining analysis information based on the selected term and the keyword, determining the sentence component to be included between each of the determined analysis information, the keyword, or the term, and determining the determined sentence component, the analysis information, the Combining the keyword and the term into text data.

상기 컨텐츠 자동 생성 방법은 생성된 상기 컨텐츠 중 적어도 일부를 타국어로 변환하는 단계를 더 포함할 수 있다. 상기 가공데이터는 주가 수익 비율, 영업 이익률, 또는 자기 자본 이익률 중 적어도 하나를 포함할 수 있으며, 상기 정보 데이터는 주식 관련 속보성 기사일 수 있다. The automatic content generation method may further include converting at least a portion of the generated content into a foreign language. The processed data may include at least one of a stock price return ratio, an operating profit margin, or a return on equity, and the information data may be a stock-related breaking news article.

또한, 상기 가공 데이터를 생성하는 단계는 상기 정보 데이터에 포함된 유의미한 표시를 대응되는 의미로 변환하는 단계를 포함할 수 있다. 한편, 상기 컨텐츠는 텍스트 데이터, 표, 그래프, 이미지, 오디오 정보, 또는 비디오 정보 중 적어도 하나를 포함할 수 있다. 상기 컨텐츠 자동 생성 방법은 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 저장될 수 있다.The generating of the processing data may include converting a meaningful display included in the information data into a corresponding meaning. The content may include at least one of text data, tables, graphs, images, audio information, or video information. The automatic content generation method may be stored in a computer-readable recording medium recording a program.

상기 기술적 과제를 달성하기 위한 컨텐츠 자동 생성 장치는 과거 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(Data Base) 및 가공 데이터를 저장하는 가공 데이터 DB를 포함하는 정보 저장부, 정보 제공원 시스템으로부터 정보 데이터를 수신하는 전처리부, 수신된 상기 정보 데이터 또는 상기 누적 데이터 DB에 저장된 정보 중 상기 정보 데이터와 관련된 정보 중 적어도 하나에 기초하여 가공 데이터를 생성하기 위한 가공 데이터 생성 모듈, 및 상기 가공 데이터 생성 모듈에 의해 생성된 상기 가공 데이터, 상기 가공 데이터 DB에 저장된 정보, 상기 누적 데이터 DB에 저장된 정보, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 컨텐츠 생성부를 포함한다.An apparatus for automatically generating content for achieving the technical problem includes an information storage unit including a cumulative data DB (Data Base) storing at least some of the past information data and a processed data DB storing the processed data, the information from an information provider system A pre-processing unit for receiving data, a processing data generation module for generating processing data based on at least one of the information related to the information data among the received information data or the information stored in the accumulated data DB, and the processing data generation module And a content generation unit generating content based on at least one of the processed data generated by the stored data, the information stored in the processed data DB, the information stored in the accumulated data DB, or the information data.

상기 전처리부는 수신된 상기 정보 데이터를 파싱하여 상기 정보 데이터 중 적어도 일부를 추출하고, 추출된 상기 정보 데이터 중 적어도 일부를 상기 누적 데이터 DB에 저장하는 전처리 모듈을 포함하며, 상기 가공 데이터 생성 모듈은 추출된 상기 정보 데이터 중 적어도 일부, 상기 누적 데이터 DB에 저장되어 있던 데이터, 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 가공 데이터를 생성할 수 있다.The preprocessing unit includes a preprocessing module that parses the received information data to extract at least a portion of the information data, and stores at least a portion of the extracted information data in the cumulative data DB, wherein the processed data generation module is extracted. The processed data may be generated based on at least one of the at least one piece of information data, data stored in the cumulative data DB, or at least one of real time data corresponding to the information data.

상기 전처리부는 검색어를 저장하는 검색어 DB를 더 포함하며, 상기 전처리 모듈은 상기 검색어 DB에 포함된 검색어에 기초하여 상기 검색어에 상응하는 상기 정보 데이터를 상기 정보 제공원 시스템으로부터 수신할 수 있다.The preprocessing unit may further include a search word DB for storing a search word, and the preprocessing module may receive the information data corresponding to the search word from the information provider system based on the search word included in the search word DB.

또한, 상기 전처리 모듈은 수신된 상기 정보 데이터의 유효성을 검사하며, 검사결과 유효한 경우에 상기 누적 데이터 DB에 상기 정보 데이터 중 적어도 일부를 추출하여 저장할 수 있다. 상기 전처리 모듈은 미리 결정된 양식 정보에 기초하여 상기 정보 데이터의 적어도 일부를 추출하거나 상기 컨텐츠 데이터의 유효성을 검사할 수 있다.In addition, the preprocessing module checks the validity of the received information data, and if valid, the at least one part of the information data may be extracted and stored in the cumulative data DB. The preprocessing module may extract at least a portion of the information data or check the validity of the content data based on predetermined form information.

상기 컨텐츠 생성부는 컨텐츠 생성 모듈 및 그래픽 데이터 생성 모듈을 포함하며, 상기 컨텐츠 생성 모듈은 상기 가공 데이터 DB에 저장된 정보, 상기 누적 데이터 DB에 저장된 정보, 또는 상기 정보 데이터 중 적어도 하나에서 상기 컨텐츠로 생성될 부분인 컨텐츠 데이터를 결정하고, 상기 그래픽 데이터 생성 모듈은 결정된 상기 컨텐츠 데이터를 표 또는 그래프 중 적어도 하나로 변환하며, 상기 컨텐츠 생성 모듈은 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터로 변환하고 변환된 상기 텍스트 데이터, 상기 표, 또는 상기 그래프 중 적어도 하나를 포함하는 컨텐츠를 생성할 수 있다.The content generation unit includes a content generation module and a graphic data generation module, wherein the content generation module is generated as the content from at least one of information stored in the processed data DB, information stored in the cumulative data DB, or the information data. Determine content data that is a portion, the graphic data generation module converts the determined content data into at least one of a table or a graph, and the content generation module converts the determined content data into text data and converts the converted text Content including at least one of data, the table, and the graph may be generated.

상기 컨텐츠 생성모듈은 결정된 상기 컨텐츠 데이터에서 키워드를 추출하고, 추출된 키워드에 대응되는 용어를 결정하며, 키워드에 대응되는 수치데이터가 있는 경우 수치데이터를 결정하고, 상기 용어, 결정된 상기 수치데이터를 재배열하며, 재배열 결과에 기초하여 문장성분을 추가할 수 있다.The content generation module extracts a keyword from the determined content data, determines a term corresponding to the extracted keyword, determines numerical data when there is numerical data corresponding to the keyword, and reconstructs the term and the determined numerical data. Arrange and add sentence components based on the rearrangement results.

상기 컨텐츠 생성모듈은 상기 컨텐츠 데이터에 포함되는 키워드를 추출하고, 상기 키워드에 대응되는 수치데이터를 비교하고, 비교결과에 상응하는 용언을 선택하고 선택된 상기 용언 및 상기 키워드에 기초하여 분석 정보를 결정하며, 결정된 상기 분석 정보, 상기 키워드, 또는 상기 용언 각각의 사이에 들어갈 문장성분을 결정하고, 결정된 문장성분, 상기 분석정보, 상기 키워드, 및 상기 용언을 조합하여 텍스트 데이터로 변환할 수 있다.The content generation module extracts a keyword included in the content data, compares numerical data corresponding to the keyword, selects a term corresponding to a comparison result, and determines analysis information based on the selected term and the keyword. The sentence component may be determined to be included between each of the determined analysis information, the keyword, or the verb, and may be converted into text data by combining the determined sentence component, the analysis information, the keyword, and the verb.

상기 컨텐츠 생성부는 생성된 상기 컨텐츠 중 적어도 일부를 타국어로 변환하기 위한 번역모듈을 더 포함할 수 있다.The content generation unit may further include a translation module for converting at least a portion of the generated content into another language.

본 발명에 따른 컨텐츠 자동 생성 방법 및 장치는 정보 데이터를 수신하고 상기 정보 데이터와 관련된 다양한 부가 정보 또는 분석 의견을 생성하여 상기 정보 데이터와 함께 정보 소비자에게 제공할 수 있으므로 정보 소비자는 유용한 양질 의 정보를 얻을 수 있는 효과가 있다.The method and apparatus for automatically generating content according to the present invention may receive information data, generate various additional information or analysis opinions related to the information data, and provide the information consumer with the information data, thereby providing useful high quality information. There is an effect that can be obtained.

또한, 이러한 다양한 부가정보 또는 분석의견이 자동으로 생성되므로 양질의 정보를 최대한 신속하게 정보 소비자에게 제공할 수 있는 효과가 있다.In addition, since these various additional information or analysis opinions are automatically generated, it is possible to provide high quality information to information consumers as quickly as possible.

또한, 정보 데이터 자체를 정보 소비자에게 전달할 때에도 가독성을 높일 수 있는 다양한 표 또는 그래프 등의 인터페이스를 이용하여 제공할 수 있는 효과가 있다.In addition, even when delivering the information data itself to the information consumer has an effect that can be provided using the interface, such as various tables or graphs that can increase the readability.

또한, 정보 데이터에 소정의 오류가 있는 경우에 이를 필터링 할 수 있으므로 항상 신뢰성 있는 컨텐츠를 제공할 수 있는 효과가 있다.In addition, if there is a predetermined error in the information data can be filtered, there is an effect that can always provide reliable content.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다.In order to fully understand the present invention, the operational advantages of the present invention, and the objects achieved by the practice of the present invention, reference should be made to the accompanying drawings which illustrate preferred embodiments of the present invention and the contents described in the accompanying drawings.

또한, 본 명세서에 있어서는 어느 하나의 구성요소가 다른 구성요소로 데이터를 '전송'하는 경우에는 상기 구성요소는 상기 다른 구성요소로 직접 상기 데이터를 전송할 수도 있고, 적어도 하나의 또 다른 구성요소를 통하여 상기 데이터를 상기 다른 구성요소로 전송할 수도 있는 것을 의미한다. Also, in this specification, when any one element 'transmits' data to another element, the element may transmit the data directly to the other element, or may be transmitted through at least one other element And may transmit the data to the other component.

반대로 어느 하나의 구성요소가 다른 구성요소로 데이터를 '직접 전송'하는 경우에는 상기 구성요소에서 다른 구성요소를 통하지 않고 상기 다른 구성요소로 상기 데이터가 전송되는 것을 의미한다.Conversely, when one element 'directly transmits' data to another element, it means that the data is transmitted to the other element without passing through another element in the element.

이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. Like reference numerals in the drawings denote like elements.

도 2는 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치의 개략적인 기능 블록도를 나타낸다.2 is a schematic functional block diagram of an apparatus for automatically generating content according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치(100)는 전처리부(110), 정보 저장부(120), 가공데이터 생성 모듈(130), 및 컨텐츠 생성부(140)를 포함한다. Referring to FIG. 2, the apparatus 100 for automatically generating content according to an exemplary embodiment of the present invention may include a preprocessor 110, an information storage unit 120, a processed data generation module 130, and a content generation unit 140. Include.

상기 컨텐츠 자동 생성 장치(100)의 각각의 구성요소들은 기능 및 논리적으로 분리될 수 있음을 나타나기 위해 별도로 도면에 표시한 것이며, 물리적으로 반드시 별도의 구성요소이거나 별도의 코드로 구현되는 것을 의미하는 것은 아니다.Each component of the automatic content generating apparatus 100 is separately shown in the drawings to indicate that it may be functionally and logically separated, and means that it is physically necessarily a separate component or implemented as a separate code. no.

본 명세서에서 모듈이라 함은, 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 모듈은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아님은 본 발명의 기술분야의 평균적 전문가에게는 용이하게 추론될 수 있다.In the present specification, the module may mean a functional and structural combination of hardware for performing the technical idea of the present invention and software for driving the hardware. For example, the module may mean a logical unit of a predetermined code and a hardware resource for performing the predetermined code, and means a physically connected code or does not necessarily mean one kind of hardware. It can be easily inferred by the average expert in the art.

상기 전처리부(110)는 전처리 모듈(111)을 포함하며, 검색어 DB(112), 양식 정보(113), 메타데이터 DB(114), 및/또는 타이머(115)를 더 포함할 수 있다. The preprocessing unit 110 may include a preprocessing module 111, and may further include a search word DB 112, form information 113, metadata DB 114, and / or a timer 115.

상기 정보 저장부(120)는 누적 데이터 DB(121) 및/또는 가공 데이터 DB(123)를 포함할 수 있다. The information storage unit 120 may include a cumulative data DB 121 and / or processed data DB (123).

상기 컨텐츠 생성부(140)는 컨텐츠 생성 모듈(141)을 포함하며, 문장 생성용 시소러스(thesaurus, 142), 그래픽 데이터 생성 모듈(143), 및/또는 번역 모듈(144)을 더 포함할 수 있다.The content generation unit 140 may include a content generation module 141, and may further include a thesaurus 142 for generating a sentence, a graphic data generation module 143, and / or a translation module 144. .

본 명세서에서 DB라 함은, 각각의 DB에 대응되는 정보를 저장하는 소프트웨어 및 하드웨어의 기능적 구조적 결합을 의미할 수 있다. DB는 적어도 하나의 테이블로 구현될 수도 있으며, 상기 DB에 저장된 정보를 검색, 저장, 및 관리하기 위한 별도의 DBMS(Database Management System)을 더 포함할 수도 있다. 또한, 링크드 리스트(linked-list), 트리(Tree), 관계형 DB의 형태 등 다양한 방식으로 구현될 수 있으며, 상기 DB에 대응되는 정보를 저장할 수 있는 모든 데이터 저장매체 및 데이터 구조를 포함한다.In the present specification, the DB may mean a functional structural combination of software and hardware for storing information corresponding to each DB. The DB may be implemented as at least one table, and may further include a separate DBMS (Database Management System) for searching, storing, and managing information stored in the DB. In addition, it may be implemented in various ways such as a linked-list, a tree, a relational DB, and includes all data storage media and data structures capable of storing information corresponding to the DB.

상기 전처리부(110)에 포함된 전처리 모듈(111)은 정보 제공원 시스템(200)으로부터 정보 데이터(예컨대, 공시정보)를 수신하고, 수신된 정보 데이터를 본 발명의 기술적 사상을 구현하기 위해 검사하거나, 내용을 파싱하거나, 필요한 부분의 추출을 수행하는 등의 전처리(pre-processing)을 수행하는 역할을 수행한다. 상기 정보 제공원 시스템(200)은 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치(100)가 주식과 관련한 속보성 기사 생성 장치에 적용되는 경우에는 증권 거래소, 코스닥, 및/또는 금융감독원 등이 될 수 있지만, 상기 컨텐츠 자동 생성 장치(100)가 적용되는 분야 또는 시스템에 따라 다양해 질 수 있음은 본 발명의 기술분야의 평균적 전문가에게는 용이하게 추론될 수 있다.The preprocessing module 111 included in the preprocessor 110 receives information data (for example, disclosure information) from the information provider system 200, and inspects the received information data to implement the technical idea of the present invention. Pre-processing, parsing the contents, or extracting the necessary parts. The information provider system 200 may be a stock exchange, a KOSDAQ, a financial supervisor, or the like, when the automatic content generation device 100 according to an embodiment of the present invention is applied to a news article generating device related to a stock. However, it can be easily inferred by the average expert in the technical field of the present invention that the content automatic generation apparatus 100 may be varied according to the field or system to which the automatic content generating device 100 is applied.

그러면, 상기 전처리부(110)에서 전처리된 상기 정보 데이터(예컨대, 공시 정보) 즉, 상기 정보 데이터 중 실제로 필요한 부분은 상기 정보 저장부(120)에 포함된 누적 데이터 DB(121)에 저장될 수 있다.Then, the information data (eg, disclosure information) pre-processed by the preprocessing unit 110, that is, a necessary portion of the information data, may be stored in the cumulative data DB 121 included in the information storage unit 120. have.

상기 누적 데이터 DB(121)에 저장되어 있는 정보들은 과거의 정보 데이터 전체 또는 일부를 포함한다. 따라서 상기 정보 데이터 중 실제로 필요한 부분은 상기 누적 데이터 DB(121)에 저장되어 있지 않은 새로운 데이터를 의미할 수 있다. 예컨대, 도 6에 도시되는 바와 같이 상기 정보 데이터(즉, 한독약품의 2006년 3/4분기 영업실적공시)에는 과거의 정보 데이터에 포함되어 있던 데이터(즉, 2/4분기 실적)도 포함되어 있고 상기 데이터(즉, 2/4분기 실적)은 상기 누적 데이터 DB(121)에 이미 포함되어 있는 내용이므로 상기 전처리부(110)에서는 필요한 부분(즉, 3/4분기 실적, 20)만을 추출하여 누적 데이터 DB(121)에 저장하는 역할을 수행할 수 있다.The information stored in the cumulative data DB 121 includes all or part of information data of the past. Therefore, the actually required portion of the information data may mean new data that is not stored in the cumulative data DB 121. For example, as shown in FIG. 6, the information data (ie, the third quarter of 2006 business results disclosure of Handok Pharmaceuticals) also includes data included in the information information of the past (ie, second quarter results). And since the data (that is, the second quarter results) is already included in the cumulative data DB 121, the preprocessing unit 110 extracts only the necessary portion (that is, the third quarter results, 20) It may serve to store in the cumulative data DB (121).

이렇게 전처리되어 상기 정보 데이터 중 적어도 일부가 상기 누적 데이터 DB(121)에 저장되면 상기 누적 데이터 DB(121)에는 상기 정보 데이터(2006년 3/4분기 한독약품 영업실적)와 관련된 과거의 정보 데이터(2006년 3/4분기 이전의 영업실적들)을 모두 포함할 수 있게 된다.When the pre-processing is performed so that at least a part of the information data is stored in the cumulative data DB 121, the cumulative data DB 121 includes historical information data related to the information data (3rd quarter of 2006, Dokdo Pharmaceutical Sales Performance). Business performance before the third quarter of 2006).

따라서, 상기 컨텐츠 자동 생성 장치(100)는 현재 수신된 상기 정보 데이터(2006년 3/4분기 한독약품 영업실적)를 단순히 전달 또는 정리하여 전달하는 것이 아니라 과거의 데이터와 비교 및/또는 분석하여 정보 소비자에게 유용한 정보를 전달할 수 있는 것이다.Therefore, the content automatic generating device 100 does not simply deliver or arrange and deliver the information data (Q3 2006 Q1 2006 sales results), but compares and / or analyzes the information with the past data. It can deliver useful information to consumers.

이처럼 정보 소비자에게 유용한 정보는 단지 상기 누적 데이터 DB(121)에 저장된 현재의 정보 데이터와 과거의 정보 데이터들 자체에 기초하여 생성될 수도 있지만, 상기 누적 데이터 DB(121)에 저장된 정보간의 연동 및/또는 연산이라는 소정의 가공행위를 통하여 새로이 만들어지는 정보일 수도 있다.Such information useful to the information consumer may be generated only based on the current information data stored in the cumulative data DB 121 and the past information data itself, but the linkage between the information stored in the cumulative data DB 121 and / or Alternatively, the information may be newly generated through a predetermined processing action called an operation.

본 명세서에서는 이렇게 가공되어 만들어지는 새로운 정보들을 가공 데이터라 정의하도록 한다. 결국, 누적 데이터 DB(121)에 포함되는 정보 즉, 누적 데이터 DB(121)는 적어도 정보 제공원 시스템(200)으로부터 제공되는 정보들의 체계적인 모음인 반면, 상기 가공 데이터는 상기 누적 데이터에서 제공되지 않는 모든 종류 또는 형태의 정보를 포함하는 의미로 사용될 수 있다. 이러한 가공 데이터(130)는 상기 가공 데이터 생성 모듈(130)에 의해 생성될 수 있다. 상기 가공 데이터 생성 모듈(130)이 가공 데이터를 생성하기 위해서는 상기 누적 데이터 DB(121)에 저장된 정보 즉, 현재의 정보 데이터와 과거의 정보 데이터에 기초하여 생성할 수도 있지만 상기 누적 데이터 DB(121)에 포함된 정보 이외에도 어떠한 형태의 정보도 활용할 수 있다. 예컨대, 상기 가공 데이터 생성 모듈(130)은 누적 데이터 이외에도 실시간 데이터에 기초하여 가공 데이터를 생성할 수 있다. 예컨대, 상기 실시간 데이터는 주식관련 컨텐츠에 적용되는 경우에는 현재의 주식시세 데이터일 수 있다.In this specification, new information generated by processing is defined as processing data. As a result, the information included in the cumulative data DB 121, that is, the cumulative data DB 121 is at least a systematic collection of information provided from the information provider system 200, while the processed data is not provided in the cumulative data. It can be used to include all kinds or forms of information. Such processing data 130 may be generated by the processing data generation module 130. In order to generate the processed data, the processed data generating module 130 may generate the data based on the information stored in the accumulated data DB 121, that is, the current information data and the past information data. In addition to the information contained within, any form of information may be utilized. For example, the processing data generation module 130 may generate processing data based on real-time data in addition to the accumulated data. For example, the real-time data may be current stock quote data when applied to stock-related content.

이러한 실시간 데이터(예컨대, 주식시세 데이터)도 소정의 DB(미도시)에 저장되어 현재의 실시간 데이터(예컨대, 현재의 주식시세 데이터) 뿐만 아니라 과거 실시간 데이터(예컨대, 과거의 주식시세 데이터)를 모두 포함하도록 저장될 수 있다. 따라서 상기 가공 데이터 생성 모듈(130)은 현재의 실시간 데이터(주식시세)에 기초하여 소정의 가공 데이터(예컨대, PER(price earnigs ratio, 주가수익률) 또는 PBR(price book value ratio, 주가순자산비율) 등)를 생성할 수도 있으며, 과거의 실시간 데이터(과거 주식시세)에 기초하여 현재 정보 데이터(예컨대, 영업실적)에 포함된 내용이 실시간 데이터(주식시세)에는 어떠한 영향을 줄 수 있는지를 과거 실시간 데이터(과거 주식시세)에 기초하여 분석 또는 가공한 정보인 가공 데이터를 생성할 수도 있는 것이다.Such real-time data (eg, stock quote data) is also stored in a predetermined DB (not shown), so that not only current real-time data (eg, current stock quote data) but also historical real time data (eg, past stock quote data) Can be stored for inclusion. Accordingly, the processing data generation module 130 may use predetermined processing data (for example, price earnigs ratio (PER) or price book value ratio (PBR) based on current real-time data (stock price)). ), And based on past real-time data (historical stock quotes), how real-time data (stock quotes) can affect what is included in current information data (for example, operating results). It is also possible to generate processed data, which is information analyzed or processed based on (past stock quotes).

상기가공 데이터 생성 모듈(130)은 생성된 상기 가공 데이터를 가공 데이터 DB(123)에 저장할 수 있다. 따라서, 상기 가공 데이터 DB(123)에도 현재의 가공 데이터뿐만 아니라, 과거의 가공 데이터들도 모두 저장되어 있을 수 있다. The processing data generation module 130 may store the generated processing data in the processing data DB 123. Therefore, not only the current processing data but also the past processing data may be stored in the processing data DB 123.

결국, 상기 정보 저장부(120)에는 상술한 누적 데이터 또는 가공 데이터의 집합뿐만 아니라, 정보 소비자(300)에게 유용할 수 있는 어떠한 종류 또는 형태의 정보도 포함할 수 있다. 예컨대, 특정 기업의 총수의 이미지 또는 음성 정보 등이 상기 정보 저장부(120)에 저장되는 경우에는 상기 특정 기업과 관련된 컨텐츠가 제공될 때 상기 이미지 및/또는 음성 정보 등이 같이 제공될 수도 있다.As a result, the information storage unit 120 may include not only the above-described cumulative or processed data set but also any kind or form of information that may be useful to the information consumer 300. For example, when the total number of images or voice information of a specific company is stored in the information storage unit 120, the image and / or voice information may be provided together when content related to the specific company is provided.

한편, 이렇게 생성된 가공 데이터는 정보 소비자(300)에게 유용한 정보일 수 있다. 상기 정보 소비자(300)는 예컨대, 주식 투자자의 웹 클라이언트(예컨대, HTS(Home Trading System), 310) 또는 뉴스 제공 사업자(예컨대, 인터넷 신문사 등 320)일 수 있다. 또한, 가공 데이터뿐만 아니라 상기 누적 데이터 DB(121)에 저장된 누적 데이터 간의 비교(즉, 현재의 정보 데이터와 과거의 정보 데이터와의 비교) 및/또는 분석 정보도 정보 소비자(300)에게는 유용한 정보가 될 수 있다. 또는 과거의 가공 데이터와 현재의 가공 데이터의 비교 및/또는 분석 정보도 정보 소비 자(300)에게 유용한 정보가 될 수 있다. 따라서, 이러한 모든 정보들이 컨텐츠로 생성되어 정보 소비자(300)에게 제공될 수 있다. Meanwhile, the generated processing data may be useful information for the information consumer 300. The information consumer 300 may be, for example, a web client of a stock investor (eg, a home trading system (HTS) 310) or a news provider (eg, an internet newspaper, etc. 320). In addition, not only the processing data but also the comparison between the accumulated data stored in the cumulative data DB 121 (that is, the comparison between the current information data and the past information data) and / or the analysis information may also be useful to the information consumer 300. Can be. Alternatively, comparison and / or analysis information of past processed data and current processed data may also be useful information to the information consumer 300. Accordingly, all such information may be generated as content and provided to the information consumer 300.

컨텐츠라 함은 정보 소비자(300)에게 유의미한 정보를 갖고 있는 모든 종류 또는 형태의 정보를 포함하는 의미로 사용될 수 있으며, 이러한 컨텐츠는 비단 텍스트 뿐만 아니라, 이미지, 표, 그래프, 동영상, 음성 등의 모든 형태로 제공될 수 있다. 상기 컨텐츠가 가질 수 있는 종류 및 형태는 구현 예에 따라 다양할 수 있다. 즉, 상기 정보 저장부(120)에 저장되는 데이터들의 종류 또는 형태에 따라 상기 컨텐츠가 포함할 수 있는 정보 또는 그 형태가 다양해질 수 있음은 물론이다.The content may be used to include all kinds or forms of information having information meaningful to the information consumer 300. The content may include not only text but also images, tables, graphs, videos, and voices. It may be provided in the form. The type and form of the content may vary according to implementation. That is, the information that may be included in the content or its form may vary according to the type or form of data stored in the information storage unit 120.

이처럼 상기 가공 데이터, 상기 누적 데이터, 및/또는 실시간 데이터 등의 다양한 정보에 기초하여 생성되는 유용한 정보들을 컨텐츠의 형태로 생성하는 역할을 수행하는 구성요소는 상기 컨텐츠 생성부(140)일 수 있다.As such, the content generating unit 140 may be a component that generates useful information generated based on various information such as the processed data, the accumulated data, and / or real time data in the form of content.

즉, 상기 컨텐츠 생성부(140)는 상기 가공 데이터 생성 모듈(130)에 의해 생성되는 가공 데이터 또는 상기 정보 저장부(120)에 저장되어 있는 정보 중 어느 일부와 같이 단편적인 수치 또는 기호인 데이터를 도 1b에 도시된 바와 같이 문장으로 생성하고, 표 또는 그래프 등을 생성하는 역할을 수행할 수 있다.That is, the content generation unit 140 generates data that is fragmentary numerical values or symbols, such as some of the processing data generated by the processing data generation module 130 or the information stored in the information storage unit 120. As shown in FIG. 1B, a sentence may be generated and a table or a graph may be generated.

또한, 상기 컨텐츠 생성부(140)는 상기 정보 저장부(120)로부터 수신되는 정보에 기초하여 소정의 로직에 따른 분석의견을 생성하여 상기 컨텐츠에 포함시킬 수도 있다.In addition, the content generation unit 140 may generate an analysis opinion based on a predetermined logic based on the information received from the information storage unit 120 and include it in the content.

이렇게 생성되는 다양하고 유용한 부가 정보 또는 분석 의견 등의 컨텐츠는 정보 소비자(300)에게 자동으로 제공되어, 양질의 정보를 최대한 신속하게 정보 소 비자에게 제공할 수 있는 효과가 있다.The various useful information generated in this way, such as additional information or analysis opinions are automatically provided to the information consumer 300, thereby providing an information consumer with high quality information as quickly as possible.

이하에서는 각각의 구성요소들의 기능 및 역할을 좀 더 상세히 설명하도록 한다.Hereinafter, the function and role of each component will be described in more detail.

다시 도 2를 참조하면, 상기 전처리부(110)에 포함되는 전처리 모듈(111)은 상술한 바와 같은 다양한 전처리 기능을 수행한다. 즉, 상기 전처리 모듈(111)은 수신된 상기 정보 데이터를 파싱(parsing)하여 상기 정보 데이터 중 필요한 적어도 일부를 추출하고, 추출된 상기 정보 데이터 중 적어도 일부를 상기 누적 데이터 DB(121)에 저장할 수 있다.Referring back to FIG. 2, the preprocessing module 111 included in the preprocessor 110 performs various preprocessing functions as described above. That is, the preprocessing module 111 may parse at least the received information data to extract at least a portion of the information data and store at least a portion of the extracted information data in the cumulative data DB 121. have.

한편, 상기 전처리 모듈(111)은 상기 정보 제공원 시스템(200)으로부터 필요한 정보만을 상기 정보 데이터로써 수신하기 위해 소정의 검색어 DB(112)를 참조할 수 있다. Meanwhile, the preprocessing module 111 may refer to a predetermined search word DB 112 to receive only necessary information from the information provider system 200 as the information data.

도 3은 본 발명의 실시 예에 따른 검색어 DB의 일 예를 나타낸다.3 shows an example of a search word DB according to an embodiment of the present invention.

도 3을 참조하면, 상기 검색어 DB(112)에는 상기 컨텐츠 자동 생성 장치(100)가 원하는 정보 또는 필요한 정보를 수신하기 위해 소정의 검색어를 상기 검색어 DB(112)에 저장할 수 있다. 따라서, 상기 전처리 모듈(111)은 상기 검색어 DB(112)에 포함된 검색어에 기초하여 상기 검색어에 상응하는 상기 정보 데이터만을 상기 정보 제공원 시스템(200)으로부터 수신할 수 있다. 이는 상기 정보 제공원 시스템(200)에서 제공되는 정보의 종류가 다양하고 직접 컨텐츠를 생성하기에 적합하지 않은 정보가 포함되어 있을 수도 있기 때문이다. 예컨대, 특정 기업의 동태나 홍보성 자료등도 상기 정보 제공원 시스템(200)에서 생성하여 제공할 수 있으며, 이러한 정보는 정보 소비자(300)가 원치 않은 정보 일 수 있으므로 무조건 컨텐츠로 생성하는 것이 바람직하지 않기 때문이다. 이처럼 상기 정보 제공원 시스템(200)으로부터 생성되어 제공되는 다양한 정보들의 일 예는 도 4에 도시된다. 도 4를 참조하면 명의개서정지등 안내와 같은 정보들은 구현 예에 따라 컨텐츠로 생성하기에 적합하지 않는 정보 일 수 있다. 물론, 상기 컨텐츠 자동 생성 장치(100)의 구현 예에 따라 이러한 정보를 이용하여서도 컨텐츠를 생성할 수 있음은 자명하다.Referring to FIG. 3, in the search word DB 112, a predetermined search word may be stored in the search word DB 112 in order to receive desired information or necessary information by the content automatic generation device 100. Therefore, the preprocessing module 111 may receive only the information data corresponding to the search word from the information provider system 200 based on the search word included in the search word DB 112. This is because there are various types of information provided by the information provider system 200 and may include information that is not suitable for generating content directly. For example, the dynamic or promotional materials of a specific company may be generated and provided by the information provider system 200, and such information may be undesired information by the information consumer 300. Because it does not. As such, an example of various information generated and provided from the information provider system 200 is illustrated in FIG. 4. Referring to FIG. 4, information such as guidance of renaming and suspension may be information that is not suitable for generating content according to an embodiment. Of course, according to the embodiment of the automatic content generation device 100, it is obvious that the content can be generated using this information.

결국 상기 전처리 모듈(111)은 도 4에 도시된 바와 같은 여러 정보들 중 도 3의 검색어 DB(112)에 포함되어 있는 영업(잠정)실적(공정공시)라는 검색어에 대응되는 번호 1040 한독약품의 영업(잠정)실적(공정공시)에 해당하는 정보 데이터를 수신하게 된다.As a result, the pretreatment module 111 of the number 1040 Handok Pharmaceutical Co., Ltd. corresponding to a search term of a sales (provisional) record (process disclosure) included in the search word DB 112 of FIG. 3 among various pieces of information as shown in FIG. 4. Information data corresponding to business (provisional) performance (fair disclosure) will be received.

상기 검색어 DB(112)에 저장되는 검색어는 상기 정보 제공원 시스템(200)이 제공하는 정보의 종류 및/또는 상기 컨텐츠 자동 생성 장치(100)의 구현 예에 따라 다양할 수 있음은 물론이다.The search word stored in the search word DB 112 may vary according to the type of information provided by the information provider system 200 and / or an implementation example of the automatic content generating device 100.

한편, 도 3에 도시된 바와 같이 각각의 검색어에 대응되는 정보 데이터에 따라 상기 전처리 모듈(111)이 상기 정보 제공원 시스템(200)으로부터 정보 데이터를 검색하는 주기는 다를 수 있다. 예컨대, 단일판매, 공급계약체결(구분번호 01)과 같이 언제든지 발생할 수 있는 이벤트는 실시간으로 검색을 하는 것이 바람직하다. 한편, 반기보고서(구분번호 03)와 같이 일정한 주기에 따라 제공되는 정보 데이터는 주기적으로만 검색하면 된다.Meanwhile, as illustrated in FIG. 3, a period in which the preprocessing module 111 searches for information data from the information provider system 200 may vary according to information data corresponding to each search word. For example, it is desirable to search in real time for events that may occur at any time, such as a single sale or supply contract (part number 01). On the other hand, the information data provided according to a certain period, such as the semi-annual report (section number 03) need only be periodically retrieved.

이처럼 정보 데이터를 정보 제공원 시스템(200)으로부터 효율적으로 검색하여 수신하기 위해 상기 전처리부(110)는 소정의 검색 주기 제어 장치 즉, 타이머(115)를 더 포함할 수 있다.As such, the preprocessor 110 may further include a predetermined retrieval period control device, that is, a timer 115, to efficiently retrieve and receive the information data from the information provider system 200.

한편, 상기 전처리 모듈(111)은 도 1a에 도시된 바와 같이 텍스트 또는 다양한 양식으로 제공된 공시정보의 내용을 인식하기 위해 소정의 정형화된 양식을 이용할 수 있으며, 이러한 정형화된 양식은 양식정보(113)에 저장되어 있을 수 있다. 예컨대, 도 6에 도시된 바와 같은 실적 공시의 경우에 일부 데이터(10)에 대한 필드(field)만을 가진 양식을 이용하여 상기 양식에 상기 일부 데이터(10)가 대응되는 위치로 자동으로 입력되도록 할 수 있다. 이렇게 특정 양식에 입력된 정보들은 검색, 가공, 연산 등을 하기 용이하며, 특정 위치에는 정해진 정보만이 오므로 실적 공시의 내용을 파악하고 필요한 부분만을 용이하게 추출할 수 있다. 예컨대, 상기 특정 양식이 Excel®로 작성된 경우 상기 일부 데이터(10) Excel의 대응되는 각 셀에 입력될 수 있다.Meanwhile, the preprocessing module 111 may use a predetermined form to recognize the contents of the disclosure information provided in text or various forms, as shown in FIG. 1A. It may be stored in. For example, in the case of the performance disclosure as shown in FIG. 6, a form having only a field for some data 10 may be automatically input to the corresponding position in the form. Can be. In this way, the information entered in a specific form is easy to search, process, and calculation, and since only specific information comes to a specific location, it is possible to grasp the contents of the performance disclosure and easily extract only necessary parts. For example, when the specific form is written in Excel®, the partial data 10 may be input into each corresponding cell of Excel.

이처럼 특정 양식을 이용하여 내용을 파싱하거나, 검색, 가공 등을 수행할 수 있지만 상기 전처리 모듈(111)은 수신된 상기 정보 데이터의 유효성을 검사할 수도 있다. As described above, the content may be parsed, searched, processed, etc., but the preprocessing module 111 may also check the validity of the received information data.

예컨대, 공시 정보 중 실적 공시에 대한 검사 로직은 재무제표에 대한 종적 검사 및 횡적 검사가 있으며, 횡적인 검사는 기업의 매출액이 전분기 대비 이상 급변하는 경우가 통계상 매우 드물다는 전제 하에, 관리자에 의해 설정된 일정 범위를 벗어나면 오류로 인식한다. 상기 오류는 기업이 공시 내용을 입력할 때에 단위를 잘못 기재함으로써 종종 발생한다(억 원->백 만원으로 기재하는 경우 등). 상기 의 일정 범위는 구현 예에 따라 다양하게 설정될 수 있다. 이러한 설정의 정도에 따라 자칫 매출이 이상 급변한 기업에 대해 유효한 정보 데이터를 유효하지 않다고 판단할 수도 있다. 하지만, 이러한 경우는 유효하지 않다고 판단되는 정보 데이터에 대해 관리자 또는 관리 시스템에 확인 절차 등을 거치는 방법으로 보완하는 등의 다른 추가적인 방법을 더 사용할 수도 있다. 종적인 검사는 회계원리를 이용한 항목간 차감의 값이 일치하는 지의 여부로 검사한다. 이러한 유효성의 검사는 실제 정보 데이터가 어떠한 종류인지에 따라 검사 로직이 다양할 수 있음은 물론이다.For example, the inspection logic for performance disclosure among disclosure information includes longitudinal inspection and horizontal inspection of financial statements, and horizontal inspection is established by the manager on the premise that the company's sales are rarely changed suddenly QoQ. If it is out of range, it is recognized as an error. This error is often caused by mis-entering the unit when the company enters the disclosure (eg, when it is stated between 100 million won and 1 million won). The predetermined range of the above may be variously set according to the implementation example. Depending on the degree of such setting, it may be determined that valid information data is not valid for a company whose sales suddenly change abruptly. However, in such a case, other additional methods may be further used, such as supplementing the information data determined to be invalid by a verification procedure or the like by the manager or the management system. Longitudinal inspection is to check whether the value of the deduction between items using accounting principles is consistent. Of course, the validity of the inspection may vary depending on the kind of the actual information data.

이처럼 유효성 검사결과 정보 제공원 시스템(200)으로부터 수신된 정보 데이터 또는 정보 데이터의 일부가 유효하다고 판단된 경우에만, 상기 전처리 모듈(111)은 상기 누적 데이터 DB(121)에 상기 정보 데이터 중 적어도 일부를 추출하여 저장할 수 있다. 따라서, 상기 컨텐츠 자동 생성 장치(100)에 의해 생성되는 컨텐츠의 신뢰성을 높일 수 있는 효과가 있다.As described above, only when it is determined that the information data or a part of the information data received from the information providing source system 200 is valid, the preprocessing module 111 transmits at least some of the information data to the cumulative data DB 121. Can be extracted and stored. Therefore, there is an effect that can increase the reliability of the content generated by the content automatically generating device 100.

이처럼 수신된 정보 데이터의 유효성 검사의 결과 또는 전처리 과정에서 필요한 소정의 정보(예컨대, 가공 데이터 생성여부) 등의 메타데이터들을 저장하기 위해 상기 전처리부(110)는 메타데이터 DB(114)를 더 포함할 수 있다.The preprocessing unit 110 further includes a metadata DB 114 to store metadata such as a result of validity of the received information data or predetermined information (eg, whether or not processing data is generated) required in the preprocessing process. can do.

도 5는 본 발명의 실시 예에 따른 메타데이터 DB의 일 예를 나타내는데, 도 5에 도시된 바와 같이, 상기 전처리 모듈(111)은 상기 메타데이터 DB(114)의 정보 데이터의 유효성 여부를 나타내는 필드에 검사를 하였는지 여부 및/또는 검사결과 유효한지 여부를 기록하고, 그 결과에 따라 상기 누적 데이터 DB(121)에 상기 정보 데이터 또는 상기 정보 데이터의 적어도 일부를 저장할지 여부를 판단할 수 있다. 또한 전처리 과정에서 필요한 여러 가지 태그(예컨대, 가공데이터가 생성되었는지 여부 등) 등이 상기 메타데이터 DB(114)에 더 포함될 수 있다.FIG. 5 shows an example of a metadata DB according to an embodiment of the present invention. As shown in FIG. 5, the preprocessing module 111 indicates a field indicating whether information data of the metadata DB 114 is valid. Whether the test result and / or the test result is valid is recorded, and according to the result, it is possible to determine whether to store the information data or at least part of the information data in the cumulative data DB 121. In addition, various tags (eg, whether processed data is generated, etc.) necessary in the preprocessing may be further included in the metadata DB 114.

도 6은 본 발명의 실시 예에 따른 전처리 과정의 일 예를 나타내기 위한 도면이다.6 is a diagram illustrating an example of a pretreatment process according to an exemplary embodiment of the present invention.

도 6을 참조하면, 상기 전처리부(110)는 정보 제공원 시스템(200)으로부터 수신된 정보 데이터(한독약품 3/4분기 영업(잠정)실적(공정공시))를 수신하고 특정 부분(10)만을 파악한다. 또한, 상기의 특정 부분(10)에서 누적 데이터 DB(121)에 추가로 저장할 부분(즉, 3/4분기 실적, 20)을 추출하고, 추출된 부분을 소정의 포맷을 갖는 누적 데이터 DB(121)의 특정 테이블(30)에 저장한다. 저장된 데이터(40) 중에서 수치 데이터는 필요에 따라 그 단위를 변경하여 저장될 수도 있다. 또한, 상기 정보 데이터(한독약품 3/4분기 영업(잠정)실적(공정공시)) 중 특정 부분(10)만을 파악하거나 추가로 저장할 부분(즉, 3/4분기 실적, 20)을 추출하기 위해 소정의 양식 정보(113)를 이용할 수 있음은 전술한 바와 같다.Referring to FIG. 6, the preprocessing unit 110 receives the information data (handok drug third quarter business (provisional) results (process disclosure)) received from the information provider system 200 and the specific portion 10 Figure out only. In addition, a portion (ie, third quarter performance, 20) to be additionally stored in the cumulative data DB 121 is extracted from the specific portion 10, and the extracted portion is accumulated data DB 121 having a predetermined format. ) Is stored in a specific table (30). Numerical data among the stored data 40 may be stored by changing its unit as necessary. In addition, in order to grasp only a specific portion 10 of the information data (Handok Pharmaceutical's third quarter sales (provisional) results (process disclosure)) or to store additional portions (ie, third quarter's performance, 20) As described above, the predetermined form information 113 can be used.

이처럼, 저장된 누적 데이터 DB(121)의 상기 테이블(30)은 상기 정보 데이터(현재 영업실적)와 관련된 과거의 정보 데이터(과거 영업실적)을 모두 포함할 수 있다. 그러므로, 상기 누적 데이터 DB(121)에는 수신되는 정보 데이터의 종류에 따라 다수의 테이블을 포함할 수 있다.As such, the table 30 of the stored cumulative data DB 121 may include all past information data (past business results) related to the information data (current business results). Therefore, the cumulative data DB 121 may include a plurality of tables according to the type of received information data.

그러면, 이러한 누적 데이터 DB(121)에 저장된 정보에 기초하여 상기 가공 데이터 생성 모듈(130)은 가공 데이터를 생성할 수 있다. 물론, 상기 누적 데이터 DB(121)에 저장된 정보 외에 다른 정보(예컨대, 실시간 데이터)가 추가로 필요할 수도 있다. Then, the processing data generation module 130 may generate processing data based on the information stored in the accumulated data DB 121. Of course, other information (for example, real-time data) may be additionally required in addition to the information stored in the cumulative data DB 121.

도 7은 본 발명의 실시 예에 따른 가공 데이터의 생성을 설명하기 위한 도면이다. 7 is a diagram for describing generation of processing data according to an exemplary embodiment of the present invention.

도 7을 참조하면, 상기 가공 데이터 생성모듈(130)은 누적 데이터 DB(121)에 저장된 정보에 기초하여 가공 데이터를 생성할 수 있다. 예컨대, 누적 데이터 DB(121)에 포함된 테이블 중에서 자본총계 데이터를 갖고 있는 테이블(121-1)과 당기 순이익 데이터를 갖고 있는 테이블(121-2)을 연동하여 상기 가공 데이터 생성 모듈(130)은 ROE(Return on Equity, 자기자본 순이익률)을 계산할 수 있다. Referring to FIG. 7, the processed data generation module 130 may generate processed data based on the information stored in the accumulated data DB 121. For example, the processed data generation module 130 may be interlocked by interlocking a table 121-1 having total capital data and a table 121-2 having net profit data among tables included in the cumulative data DB 121. Return on equity (ROE) can be calculated.

또는 자본총계 데이터를 갖고 있는 테이블(121-1)과 실시간 데이터(예컨대, 주가시세)에 기초하여 PBR을 계산할 수 있다. 또는 당기 순이익 데이터를 갖고 있는 테이블(121-2)과 실시간 데이터(예컨대, 주가시세)에 기초하여 PER을 계산할 수 있다.Alternatively, the PBR may be calculated based on the table 121-1 having the total capital data and real time data (eg, stock quote). Alternatively, the PER may be calculated based on the table 121-2 having the net profit data and real time data (eg, stock price).

이러한 가공 데이터는 누적 데이터 DB(121)에는 포함되어 있지 않은 정보 즉, 정보 제공원 시스템(200)으로부터 제공되지 않은 정보를 소정의 연산 또는 가공을 통하여 생성되는 유의미한 데이터일 수 있다.The processed data may be meaningful data generated through a predetermined calculation or processing of information not included in the cumulative data DB 121, that is, information not provided from the information provider system 200.

생성된 가공 데이터는 가공 데이터 DB(123)의 소정의 테이블(123-1)에 저장될 수 있다. 가공 데이터는 구현 예에 따라 다양할 수 있으며, 가공 데이터의 종류 및 그 특징에 따라 적어도 하나의 테이블에 각각 저장될 수도 있다.The generated processing data may be stored in a predetermined table 123-1 of the processing data DB 123. The machining data may vary according to an embodiment, and may be stored in at least one table according to the type and characteristic of the machining data.

또한, 상기 가공 데이터 생성모듈(130)이 생성할 수 있는 가공 데이터는 상기 정보 저장부(120)에 저장된 정보 및 상기 실시간 데이터와 같은 부가정보의 종 류 및 형태에 따라 다양할 수 있음은 전술한 바와 같다.In addition, the processing data that can be generated by the processing data generation module 130 may vary depending on the type and form of the information stored in the information storage unit 120 and the additional information, such as the real-time data. As shown.

이렇게 생성된 가공 데이터는 도 7에 도시된 바와 같이 하나의 키워드(예컨대, ROE, 영업이익률, PER, 또는 PBR) 또는 키워드에 대응되는 수치데이터일 뿐이다. 하지만 본 발명의 기술적 사상은 이러한 키워드 또는 수치데이터를 정보 소비자(300)가 쉽게 활용할 수 있는 컨텐츠로 생성하여 제공한다. 예컨대, 가공 데이터 테이블(123-1)에 저장된 정보와 상기 누적 데이터 DB(121)에 저장된 정보에 기초하여 상기 컨텐츠 자동 생성 장치(100)는 도 7에 도시된 컨텐츠(50) 및/또는 컨텐츠(60)을 생성할 수 있다. As shown in FIG. 7, the generated processing data is only numerical data corresponding to one keyword (eg, ROE, OP margin, PER, or PBR) or a keyword. However, the technical idea of the present invention generates and provides such keywords or numerical data as contents that can be easily utilized by the information consumer 300. For example, based on the information stored in the processed data table 123-1 and the information stored in the cumulative data DB 121, the apparatus 100 automatically generates the content 50 and / or the content (shown in FIG. 7). 60).

컨텐츠(50)에는 생성된 가공 데이터 중 ROE와 영업이익률에 관한 텍스트 데이터(즉, "3/4분기 실적을 포함한 한독약품의 1년 기준 ROE와 영업이익률은 10.1%와 12.5%이다" 등) 및 이에 대응되는 그래프가 포함된다.The content 50 includes text data on the ROE and OP margin among the generated processed data (ie, "Hando's annual ROE and OP margin including 1Q quarter results are 10.1% and 12.5%", etc.) and Corresponding graph is included.

상기 컨텐츠(50)에서 이용되는 가공 데이터는 ROE, 영업이익률, 5개분기 최고치 등일 수 있는데, 이를 도 7에 도시된 바와 같이 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치(100)는 기사형태의 텍스트 데이터로 생성할 수 있다. 또한, 상기 텍스트 데이터에 상응하는 그래프도 생성할 수 있다. The processed data used in the content 50 may be ROE, OP margin, peak of five quarters, and the like. As shown in FIG. Can be created as text data. In addition, a graph corresponding to the text data may be generated.

또한, 컨텐츠(60)에는 가공 데이터 PER 및 PBR에 기초하여 텍스트 데이터 및 그래프가 포함된다. 특히, 컨텐츠(60)에는 가공 데이터에 기초하여 분석의견("당사의 경우 전년 동기대비 실적은~ 중략 ~ 현 주가는 매력적이라고 할 수 있다.")도 포함되어 있음을 알 수 있다.In addition, the content 60 includes text data and graphs based on the processed data PER and PBR. In particular, it can be seen that the content 60 also includes an analysis opinion based on the processed data ("In our case, the results compared to the same period last year."

이처럼 가공 데이터를 텍스트 데이터, 그래프뿐만 아니라, 표 등 다양한 형 태의 컨텐츠로 생성하고, 분석의견 등을 생성하는 기능을 컨텐츠 생성부(140)가 수행할 수 있다.As such, the content generation unit 140 may perform a function of generating the processed data into various types of contents such as not only text data and graphs but also tables and generating analysis opinions.

상기 컨텐츠 생성부(140)는 컨텐츠 생성 모듈(141) 및 그래픽 데이터 생성 모듈(143)을 포함한다. 또한, 상기 컨텐츠 생성부(140)는 문장생성용 시소러스(142) 및/또는 번역 모듈(144)을 더 포함할 수 있다.The content generation unit 140 includes a content generation module 141 and a graphic data generation module 143. In addition, the content generation unit 140 may further include a sentence generation thesaurus 142 and / or a translation module 144.

상기 컨텐츠 생성부(140)는 도 7에 도시된 바와 같이 가공 데이터에 기초하여 컨텐츠를 생성할 수도 있지만, 상기 누적 데이터 DB(121)에 저장된 정보 및/또는 수신된 현재의 정보 데이터 자체에 기초하여 컨텐츠를 생성할 수도 있다. 이처럼 가공 데이터 DB(123)에 저장되어 있거나 저장될 가공 데이터, 누적 데이터 DB(121)에 저장된 정보 및/또는 정보 데이터 중에서 컨텐츠로 생성될 부분을 컨텐츠 데이터로 정의할 수 있다. 어떠한 정보가 컨텐츠 데이터로 결정될지는 수신되는 정보 데이터의 종류 및 구현 예에 따라 다양할 수 있음은 물론이다.The content generation unit 140 may generate content based on the processed data as shown in FIG. 7, but based on the information stored in the accumulated data DB 121 and / or the received current information data itself. You can also create content. As such, a portion of the processed data to be stored in or stored in the processed data DB 123, information stored in the accumulated data DB 121, and / or information data to be generated as content may be defined as content data. What information may be determined as the content data may vary depending on the type and implementation of the received information data.

상기 컨텐츠 생성모듈(141)은 컨텐츠 데이터를 결정하고, 결정된 컨텐츠 데이터를 컨텐츠로 변환할 수 있다. 특히, 본 발명의 실시 예에 따른 컨텐츠 생성부(140)에서는 컨텐츠 데이터를 텍스트 데이터로 변환하거나 이에 상응하는 분석의견을 생성하는 역할은 상기 컨텐츠 생성모듈(141)에서 담당하며, 컨텐츠 데이터를 표, 이미지, 그래프 등의 다양한 그래픽 데이터로 생성하는 역할은 상기 그래픽 데이터 생성모듈(143)에서 별도로 담당할 수 있다. 하지만, 이는 일 실시 예에 불과하면 다양한 변형 예가 가능할 수 있다.The content generation module 141 may determine content data and convert the determined content data into content. In particular, in the content generation unit 140 according to an embodiment of the present invention, the content generation module 141 is responsible for converting content data into text data or generating an analysis opinion corresponding thereto. The graphic data generating module 143 may separately perform a role of generating various graphic data such as an image and a graph. However, this may be various modifications if only one embodiment.

상기 컨텐츠 생성모듈(141)이 컨텐츠 데이터를 텍스트 데이터로 변환하는 방 법은 다양할 수 있다. 그 중 한 실시 예는 다음과 같다.How the content generation module 141 converts the content data into text data may vary. One embodiment thereof is as follows.

예컨대, 도 7에 도시된 가공 데이터 테이블(123-1)에서 종목 코드(002390) 년월(200609), ROE(10.1) 및 영업이익률(12.5)가 컨텐츠 데이터로 결정되었다고 가정할 수 있다. 그러면 상기 컨텐츠 생성모듈(141)은 상기 컨텐츠 데이터에서 키워드(종목코드, 년 월, ROE, 영업이익률)를 추출하고, 추출된 키워드에 대응되는 용어(한독약품, 3/4분기, ROE, 영업이익률)를 결정할 수 있다. 또한, 키워드에 대응되는 수치데이터가 있는 경우 수치 데이터(예컨대, ROE 10.1 및 영업이익률 12.5)를 결정할 수 있다. 여기서 키워드에 대응되는 용어는 문장생성용 시소러스(142)에 기초하여 결정될 수 있다. 상기 문장생성용 시소러스(142)의 일 예는 도 9에 도시되는데, 상기 문장생성용 시소러스(142)는 특정 단어 또는 키워드가 저장되고 이와 관련된 유사어, 문장성분, 설명 등 다양한 정보들이 저장될 수 있다. 이러한 시소러스(142)를 이용하면 다양한 실시 예에 따른 문장 생성이 가능함을 알 수 있다.For example, in the processed data table 123-1 shown in FIG. 7, it may be assumed that the item code (002390), the year (200609), the ROE (10.1), and the operating margin (12.5) are determined as content data. Then, the content generation module 141 extracts a keyword (item code, year, month, ROE, OP margin) from the content data, and corresponds to the term (Handok Pharm, Q3, ROE, OP margin) corresponding to the extracted keyword. ) Can be determined. In addition, when there is numerical data corresponding to the keyword, the numerical data (eg, ROE 10.1 and OP margin 12.5) may be determined. The term corresponding to the keyword may be determined based on the sentence generation thesaurus 142. An example of the sentence generation thesaurus 142 is illustrated in FIG. 9. The sentence generation thesaurus 142 may store a specific word or keyword, and various information such as a similar word, a sentence component, and a description thereof may be stored. . Using the thesaurus 142, it can be seen that sentences can be generated according to various embodiments.

그러면, 키워드에 대응되는 용어, 및 결정된 수치데이터에 기초하여 필요한 경우 상기 용어 및 수치데이터를 재배열할 수 있다. 물론, 재배열이 필요가 없는 경우도 있을 수 있다. 그리고, 미리 결정된 부가어(예컨대, "1년 기준") 결정할 수 있다. 이러한 부가어는 정보 데이터의 종류에 따라 미리 설정되어 있을 수 있다. 그리고, 상기 용어, 수치데이터, 및 부가어에 기초하여 필요한 문장성분(예컨대, 조사, 어미 등)을 추가함으로써 텍스트 데이터를 생성할 수 있다. 상기 문장성분을 추가하기 위해서는 전산학의 오토마타 분야에서 널리 알려진 스테이트 머신(state machine)을 이용하여 알맞은 조사 또는 어미를 선택할 수 있다.Then, the term and the numerical data may be rearranged as necessary based on the term corresponding to the keyword and the determined numerical data. Of course, there may be cases where no rearrangement is necessary. Then, a predetermined additional word (eg, “one year standard”) may be determined. Such additional words may be preset according to the type of the information data. Then, text data can be generated by adding necessary sentence components (eg, search, ending, etc.) based on the terms, numerical data, and additional words. In order to add the sentence component, a suitable investigation or a mother may be selected using a state machine well known in the automata field of computational science.

이렇게 생성된 텍스트 데이터는 도 7의 컨텐츠(50)에 포함되는 "3/4분기 실적을 포함한 한독약품의 1년 기준 ROE와 영업이익률은 10.1%와 12.5%이다"일 수 있다.The text data generated as described above may be included in the content 50 of FIG. 7, wherein the year-end ROE and operating margin are 10.1% and 12.5% of Handok Pharmaceuticals including 3Q results.

또한, 상기 컨텐츠 데이터에 기초하여 생성되는 텍스트 데이터 중에는 분석의견이 있을 수도 있다. 이러한 분석의견을 생성하는 과정은 도 8 및 도 9에 도시된다.In addition, there may be an opinion of analysis among the text data generated based on the content data. The process of generating such an opinion is shown in FIGS. 8 and 9.

도 8 및 도 9는 본 발명의 실시 예에 따른 컨텐츠 데이터를 텍스트 데이터로 변환하는 과정을 설명하기 위한 도면이다.8 and 9 are diagrams for describing a process of converting content data into text data according to an embodiment of the present invention.

도 8 및 도 9를 참조하면, 상기 컨텐츠 생성모듈(141)은 누적 데이터 DB(121)에 포함된 소정의 테이블(70) 중 두 분기에 걸친 매출액 및 영업이익 데이터(71)를 컨텐츠 데이터로 결정할 수 있다.8 and 9, the content generation module 141 determines the sales and operating profit data 71 over two quarters of the predetermined table 70 included in the cumulative data DB 121 as the content data. Can be.

그러면, 상기 컨텐츠 생성모듈(141)은 상기 컨텐츠 데이터를 전술한 바와 같이 단지 텍스트 데이터로 변환하여 컨텐츠로 생성할 수도 있지만, 상기 컨텐츠 데이터를 분석하여 소정의 분석 의견을 컨텐츠로 생성할 수도 있다.Then, the content generation module 141 may convert the content data into text data and generate the content as described above. However, the content generation module 141 may generate the predetermined analysis opinion as the content by analyzing the content data.

이를 위해 상기 컨텐츠 생성모듈(141)은 상기 컨텐츠 데이터에 포함되는 키워드를 추출한다. 예컨대, 매출액 및 영업이익이 키워드 일 수 있다. 그 후 상기 컨텐츠 생성 모듈(141)은 상기 키워드(예컨대, 매출액)에 대응되는 수치데이터(561.7억 및 638.8억)를 비교하고, 비교결과에 상응하는 용언(예컨대, 증가)을 선택할 수 있다. 또한, 또 다른 키워드(예컨대, 영업이익)에 대응되는 수치데이터(59.6억 및 113.8억)을 비교하고, 비교결과에 상응하는 용언(예컨대, 증가)를 선 택할 수 있다. 그러면 상기 컨텐츠 생성모듈은 선택된 상기 용언(예컨대, 모두 증가) 및 상기 키워드(예컨대, 영업이익 및 매출액)에 기초하여 분석 정보(예컨대, 활황기 도래)를 결정할 수 있다.To this end, the content generation module 141 extracts a keyword included in the content data. For example, sales and operating profit may be keywords. Thereafter, the content generation module 141 may compare numerical data (561.7 billion and 638.8 billion) corresponding to the keyword (eg, sales) and select a word (eg, increase) corresponding to the comparison result. In addition, it is possible to compare numerical data (59.6 billion and 11.3.8 billion) corresponding to another keyword (eg, operating profit), and select a corresponding word (eg, increase) according to the comparison result. The content generation module may then determine analysis information (eg, the arrival of an active period) based on the selected verb (eg, all increase) and the keyword (eg, operating profit and sales).

그러면, 결정된 상기 분석 정보(예컨대, 활황기 도래), 상기 키워드(예컨대, 매출액 및 영업이익), 또는 상기 용언(증가, 증가) 각각의 사이에 들어갈 문장성분을 결정하고, 결정된 문장성분, 상기 분석정보, 상기 키워드, 및 상기 용언을 조합하여 분석의견에 상응하는 텍스트 데이터(예컨대, "매출액이 증가하였으며 영업이익도 증가하였으므로 활황기가 도래할 것으로 기대됩니다")를 생성할 수 있는 것이다.Then, a sentence component to be included between each of the determined analysis information (eg, the arrival of the boom period), the keyword (eg, sales and operating profit), or the verb (increase, increase) is determined, and the determined sentence component and the analysis information are determined. , The keyword, and the term may be combined to generate text data corresponding to the opinion of the analysis (eg, “a sales are expected and operating profit is also expected to be a booming period”).

한편, 상기의 요언, 분석 정보 및/또는 상기 문장성분을 결정하기 위해서는 상기 컨텐츠 생성 모듈(141)은 도 8에 도시된 소정의 로직을 이용할 수 있다. Meanwhile, in order to determine the gist, analysis information, and / or the sentence component, the content generation module 141 may use predetermined logic illustrated in FIG. 8.

예컨대, 먼저 상기 컨텐츠 생성 모듈(141)은 매출액을 비교하여 매출액이 증가되었는지 여부를 판단하고(S1), 그 후 영업이익이 증가하였는지 여부를 판단할 수 있다(S2). 이러한 2번의 판단에 따라 결정된 키워드(A1, E1)에 대응되는 용언(C1 또는 C2, G1 또는 G2)과 분석정보(H1, H2, H3, 또는 H4)가 결정될 수 있다. 그러면 이에 따라 문장성분(b, d, f)도 결정될 수 있다. 여기서 문장성분 b1은 "이"에 대응되고, d1은 "하였으며", d2는 "하였으나", f1 및 f2는 각각 "은"과 "도"에 대응된다. For example, the content generation module 141 may first determine whether the sales increase by comparing the sales (S1), and then determine whether the operating profit has increased (S2). According to the second determination, a term C1 or C2, G1 or G2 corresponding to the keyword A1 or E1 determined and analysis information H1, H2, H3 or H4 may be determined. The sentence components b, d, and f may also be determined accordingly. The sentence component b1 corresponds to "this", d1 corresponds to "is", d2 corresponds to "but", and f1 and f2 correspond to "silver" and "degree", respectively.

이러한 순차적인 판단 과정에 따라 생성될 수 있는 분석의견의 종류는 도 9의 부재번호 80에 도시된다.Types of analysis comments that may be generated according to the sequential determination process are shown in reference numeral 80 of FIG. 9.

한편, 이러한 키워드, 용어, 문장성분 등을 결정하기 위해 상기 컨텐츠 생성 모듈(141)은 도 9에 도시되는 바와 같이 문장생성용 시소러스(142)를 참조할 수 있다. 예컨대, 전술한 로직에 의한 판단 과정 중에서 용언이 반대되는 의미를 갖는 경우(예컨대, 증가 및 감소)에는 상기 문장생성용 시소러스(142)의 비고를 참조하여 역접 어미(예컨대, 하였으나)를 선택할 수 있는 것이다.Meanwhile, in order to determine such keywords, terms, sentence components, and the like, the content generation module 141 may refer to the sentence generation thesaurus 142 as shown in FIG. 9. For example, when the word has the opposite meaning (eg, increase and decrease) in the above-described determination process by logic, it is possible to select an inverse ending (for example, but not referring to the note of the sentence generation thesaurus 142). will be.

이와 같은 방식으로 생성되는 분석의견 중 하나는 도 7의 컨텐츠(60)에 포함된 분석의견일 수 있다.One of the opinions generated in this way may be an opinion included in the content 60 of FIG. 7.

한편, 상기 그래픽 데이터 생성모듈(143)이 컨텐츠 데이터를 표 또는 그래프로 생성하는 방법은 컨텐츠 데이터에 포함되는 수치데이터를 수학적 과정에 의해 표 또는 그래프로 나타내는 과정을 수행함으로써 가능하다. 또한, 상기 표 또는 그래프의 UI(user interface)는 구현 예에 따라 다양할 수 있다.Meanwhile, the graphic data generating module 143 may generate the content data in a table or graph by performing a process of displaying numerical data included in the content data in a table or graph by a mathematical process. In addition, the user interface (UI) of the table or graph may vary depending on implementation.

도 10a 내지 도 10d는 본 발명의 다른 실시 예에 따른 정보 데이터 및 그에 따라 생성되는 컨텐츠 데이터를 설명하기 위한 도면이다.10A to 10D are diagrams for describing information data and content data generated according to another embodiment of the present invention.

도 10a 내지 도 10d를 참조하여 설명하면 다음과 같다.A description with reference to FIGS. 10A to 10D is as follows.

먼저 본 발명의 실시 예에 따른 컨텐츠 자동 생성장치(100)는 정보 제공원 시스템(200)으로부터 도 10a에 도시된 바와 같은 공시정보를 수신할 수 있다.First, the automatic content generating apparatus 100 according to an embodiment of the present invention may receive disclosure information as shown in FIG. 10A from the information provider system 200.

그러면, 종래의 방법에 의하면 도 10b에 도시된 바와 같이 AAA 신문사에서 상기 공시정보에 기초하여 보도기사(91)를 작성하고 이를 정보 소비자(300)에게 제공하였다.Then, according to the conventional method, as shown in FIG. 10B, the AAA newspaper company created a news story 91 based on the disclosure information and provided it to the information consumer 300.

하지만, 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치(100)는 도 10a에 도시된 공시 정보를 수신하고, 도 10c 내지 도 10d에 도시된 바와 같은 컨텐츠를 자동으로 생성하여 정보 소비자(300)에게 제공할 수 있다.However, the apparatus 100 for automatically generating content according to an embodiment of the present invention receives the disclosure information illustrated in FIG. 10A, and automatically generates the contents as illustrated in FIGS. 10C to 10D to the information consumer 300. Can provide.

이를 위해 전처리부(110)는 상기 공시 정보를 파싱하여 특정 부분(90)을 추출할 수 있다. 그리고 상기 특정 부분(90)을 누적 데이터 DB(121)에 저장할 수 있다. 저장 후의 누적 데이터 DB(121) 및 상기 누적 데이터 DB(121)에 저장된 정보에 기초하여 생성되는 가공 데이터와 컨텐츠의 일 예는 도 10c 및 도 10d에 도시된다.To this end, the preprocessor 110 may parse the disclosure information and extract a specific portion 90. The specific portion 90 may be stored in the cumulative data DB 121. Examples of the processed data and the contents generated based on the accumulated data DB 121 after storing and the information stored in the accumulated data DB 121 are illustrated in FIGS. 10C and 10D.

전처리부(110)는 상기 공시정보의 핵심 내용 즉, 공시 데이터(예컨대, 계약 물품, 계약금액, 최근 매출액, 매출액 대비(%) 및 계약 상대방)을 파싱하고, 컨텐츠 생성부(140)는 우선 상기 공시 원문에 포함된 공시 데이터를 문장 형태의 기사(93)로 변환할 수 있다. 또한 공시 데이터에 기초하여 가공 데이터 생성모듈(130)에서 생성된 가공 데이터(예컨대, 영업이익률 등) 및/또는 상기 컨텐츠 생성부(140)에서 생성되는 분석의견을 텍스트 데이터(94)로 생성할수 있다.The preprocessing unit 110 parses the core content of the disclosure information, that is, disclosure data (eg, contracted goods, contracted amount, recent sales,% of sales, and counterparties), and the content generator 140 first The disclosure data included in the disclosure text may be converted into an article 93 in a sentence form. In addition, the processing data (eg, operating margin) and the like and / or the analysis opinion generated by the content generation unit 140 may be generated as text data 94 based on the disclosure data. .

또한 상기 컨텐츠 생성부(140)는 상기 누적 데이터 DB(121)에서 해당 종목에 대한 누적 데이터를 표 형태로 생성하여 컨텐츠(95)를 생성할 수도 있다. 또한, 상기 컨텐츠 생성부(140)는 다른 종목에 대한 누적 데이터에서 계약명이 같은 정보에 대한 검색결과와 주가반응(공시당일 등락율) 및 가공 데이터(영업이익률)을 연동하여 컨텐츠(96)을 생성할 수 있다. 또한, 상기 컨텐츠 생성부(140)는 다른 종목에 대한 누적데이터에서 계약상대방이 같은 정보에 대한 검색결과와 주가흐름 등을 누적 데이터 DB(121) 및 실시간 데이터를 저장하는 DB(미도시)를 참조하여 생성할 수도 있다. In addition, the content generation unit 140 may generate the content 95 by generating the cumulative data for the corresponding item in the form of a table in the cumulative data DB 121. In addition, the content generation unit 140 may generate the content 96 by interlocking a search result for information having the same contract name in the cumulative data for another item, a stock price response (annual rate of change on the day of publication), and processing data (operating profit rate). Can be. In addition, the content generation unit 140 refers to a DB (not shown) for storing the cumulative data DB 121 and the real-time data for the search results and the stock price flow for the same information in the cumulative data for other items. You can also create

또한, 상기 컨텐츠 생성부(140)는 상기 정보 저장부(120)에 저장된 정보와는 별도로 실시간 데이터를 저장하는 DB(미도시)를 참조하여 컨텐츠(98)을 생성할 수 도 있다. In addition, the content generation unit 140 may generate the content 98 by referring to a DB (not shown) that stores real time data separately from the information stored in the information storage unit 120.

이처럼, 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치(100)는 누적 데이터 및 가공 데이터, 그리고 부가정보(예컨대, 실시간 데이터)등을 이용하여 매우 다양하고 유용한 컨텐츠를 생성하여 정보 소비자(300)에게 제공할 수 있다.As such, the automatic content generation device 100 according to an embodiment of the present invention generates a variety of useful content by using accumulated data, processed data, and additional information (for example, real-time data) to the information consumer 300. Can provide.

결국, 종래의 방법에 의하면 정보 데이터에 해당하는 내용만을 그대로 보도한 것에 그치지만 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치(100)에 의하면 서술형 문장 형태는 물론 가공 데이터 또는 분석의견을 자동으로 생성할 수 있으며, 해당종목의 누적 데이타에 기초한 다양한 응용 컨텐츠 및 동일한 이벤트(예컨대, 계약)가 발생한 다른 종목의 누적 데이타를 응용한 컨텐츠 등 다면적인 정보를 제공할 수 있는 효과가 있다. As a result, according to the conventional method, only the content corresponding to the information data is reported as it is, but the content automatic generation device 100 according to the embodiment of the present invention automatically generates the descriptive sentence form as well as the processed data or the analysis opinion. It is possible to provide multi-faceted information such as various application contents based on the cumulative data of the corresponding item and content using the cumulative data of other items in which the same event (for example, a contract) occurs.

또한, 정보 소비자가 미처 생각하지 못한 제3의 정보를 새롭게 가공 데이터 형태로 추출하여 보여줄 수 있는 효과가 있다. 이러한 가공 데이터를 포함하는 컨텐츠를 생성하여 정보 소비자에게 제공함으로써 정보 데이터에서 제공하지 않아 정보 소비자가 직접 검색하고 정리해야하는 여러가지 정보(예컨대, 투자정보 등)들처럼 분초를 다투는 투자판단이 필요한 컨텐츠에서 상기 컨텐츠 자동 생성 장치(100)의 효과는 극대화될 수 있다. In addition, there is an effect that can be extracted and displayed in the form of processed data of the third information that the information consumer did not think. By generating the content containing such processed data and providing it to the information consumer, the content consumer does not provide it in the information data, and thus the content that requires investment judgment to compete for minutes, such as various information (for example, investment information, etc.) that the information consumer must search and organize directly. The effect of the automatic content generating apparatus 100 may be maximized.

또한 정보 데이터의 내용에 숫자나 문자 데이터가 아닌 유의미한 표시 예컨대, '#', '*', '$' 등의 기호, 심벌, 상징 또는 특수문자일 경우에도 상기 컨텐츠 자동 생성장치(100)의 전처리부(110)에 포함된 전처리모듈(111)은 심벌 또는 특수문자를 인식하여 대응되는 의미로 변환하는 과정을 수행할 수 있다. 예컨대, '+' 란 기호가 있는 경우에는 '증가'라는 용어로 변환을 하거나, 상기 컨텐츠 자동 생성 장치(100)에서 사용되는 별도의 기호로 변환할 수 있다. 예컨대, 계약 상대방란에 ㈜나 'Co.LTD'처럼 주식회사를 의미하는 문자열이 포함된 경우 상기 컨텐츠 자동 생성 장치(100)는 이를 '주식회사'의 의미로 변환하여 인식할 수 있다. 이것은 별도의 유사어 DB를 유지하거나 또는 문장생성용 시소러스(142)에 유사어를 더 저장함으로써 가능할 수 있다. In addition, even if the information of the information data is not a number or a letter, but meaningful display, for example, '#', '*', '$', such as a symbol, symbol, symbol or special character pre-processing of the automatic content generating device 100 The preprocessing module 111 included in the unit 110 may perform a process of recognizing a symbol or a special character and converting the symbol or special character into a corresponding meaning. For example, when the symbol '+' is present, the term 'increase' may be converted into a term 'increase', or may be converted into a separate symbol used in the automatic content generating apparatus 100. For example, when a contract counterpart includes a string representing a stock company, such as a stock company or a 'Co.LTD', the content automatic generating device 100 may recognize the content by converting it into a meaning of 'stock company'. This may be possible by maintaining a separate synonym DB or by storing the synonym further in the sentence generation thesaurus 142.

도 11은 본 발명의 실시 예에 따른 컨텐츠 생성 장치가 생성된 상기 컨텐츠 중 적어도 일부를 타국어로 변환하는 과정을 설명하기 위한 도면이다.FIG. 11 is a diagram for describing a process of converting at least a part of the generated content into a foreign language by a content generating device according to an embodiment of the present disclosure.

도 11을 참조하면 상기 컨텐츠 생성부(140)는 생성된 상기 컨텐츠 중 적어도 일부를 타국어로 변환기 위한 번역모듈(144)을 더 포함할 수 있으며, 상기 번역 모듈(144)은 생성된 컨텐츠 중 일부(예컨대, 텍스트 데이터)를 타국어로 변환할 수 있다.Referring to FIG. 11, the content generation unit 140 may further include a translation module 144 for converting at least some of the generated content into a foreign language, and the translation module 144 may include some of the generated content. (Eg, text data) can be converted into other languages.

이를 위해 상기 번역 모듈(144)은 상기 컨텐츠 생성모듈(141)로부터 생성된 컨텐츠를 수신하고, 이를 널리 실시되고 있는 번역기를 이용하여 번역할 수도 있다. 또한, 문장생성용 시소러스(142)에 저장된 단어 각각에 대응되는 외국어 단어를 추가로 더 저장함으로써 번역을 수행할 수도 있다. 이러한 방법으로 도 9의 부재번호 80에 도시된 텍스트 데이터는 도 11에 도시된 바와 같이 일본어로 번역될 수 있다.To this end, the translation module 144 may receive the content generated from the content generation module 141 and translate it using a translator that is widely implemented. In addition, translation may be performed by further storing foreign language words corresponding to the words stored in the sentence generation thesaurus 142. In this way, the text data shown by reference numeral 80 of FIG. 9 can be translated into Japanese as shown in FIG.

본 발명의 실시 예에 따른 컨텐츠 자동 생성 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.The automatic content generation method according to an embodiment of the present invention can be embodied as computer readable codes on a computer readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, hard disk, floppy disk, optical data storage, and the like, and also in the form of carrier waves (e.g., transmission over the Internet). It also includes implementations. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion. And functional programs, codes and code segments for implementing the present invention can be easily inferred by programmers in the art to which the present invention belongs.

본 발명은 도면에 도시된 일 실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.Although the present invention has been described with reference to one embodiment shown in the drawings, this is merely exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. Therefore, the true technical protection scope of the present invention will be defined by the technical spirit of the appended claims.

본 발명의 상세한 설명에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 간단한 설명이 제공된다.BRIEF DESCRIPTION OF THE DRAWINGS In order to better understand the drawings cited in the detailed description of the invention, a brief description of each drawing is provided.

도 1a는 종래의 컨텐츠 생성 방법을 설명하기 위한 도면이고, 도 1b는 본 발명의 실시 예에 따라 생성되는 컨텐츠의 일 예를 나타낸다.FIG. 1A illustrates a conventional content generation method, and FIG. 1B illustrates an example of content generated according to an exemplary embodiment of the present invention.

도 2는 본 발명의 실시 예에 따른 컨텐츠 자동 생성 장치의 개략적인 기능 블록도를 나타낸다.2 is a schematic functional block diagram of an apparatus for automatically generating content according to an embodiment of the present invention.

도 3은 본 발명의 실시 예에 따른 검색어 DB의 일 예를 나타낸다.3 shows an example of a search word DB according to an embodiment of the present invention.

도 4는 정보 제공원 시스템으로부터 제공되는 다양한 정보들의 일 예를 나타낸다.4 shows an example of various information provided from an information provider system.

도 5는 본 발명의 실시 예에 따른 메타데이터 DB의 일 예를 나타낸다.5 shows an example of a metadata DB according to an embodiment of the present invention.

도 6은 본 발명의 실시 예에 따른 전처리 과정의 일 예를 나타내기 위한 도면이다.6 is a diagram illustrating an example of a pretreatment process according to an exemplary embodiment of the present invention.

도 7은 본 발명의 실시 예에 따른 가공 데이터의 생성을 설명하기 위한 도면이다. 7 is a diagram for describing generation of processing data according to an exemplary embodiment of the present invention.

도 8 및 도 9는 본 발명의 실시 예에 따른 컨텐츠 데이터를 텍스트 데이터로 변환하는 과정을 설명하기 위한 도면이다.8 and 9 are diagrams for describing a process of converting content data into text data according to an embodiment of the present invention.

도 10a 내지 도 10d는 본 발명의 다른 실시 예에 따른 정보 데이터 및 그에 따라 생성되는 컨텐츠 데이터를 설명하기 위한 도면이다.10A to 10D are diagrams for describing information data and content data generated according to another embodiment of the present invention.

도 11은 본 발명의 실시 예에 따른 컨텐츠 생성 장치가 생성된 상기 컨텐츠 중 적어도 일부를 타국어로 변환하는 과정을 설명하기 위한 도면이다.FIG. 11 is a diagram for describing a process of converting at least a part of the generated content into a foreign language by a content generating device according to an embodiment of the present disclosure.

Claims (24)

컨텐츠 자동 생성 장치가 정보 제공원 시스템으로부터 정보 데이터를 수신하는 단계;Receiving, by the apparatus for automatically generating content, information data from the information provider system; 수신된 상기 정보 데이터, 상기 정보 데이터와 관련된 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(data base), 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 정보 데이터와 관련된 가공 데이터를 생성하는 단계; 및Processing associated with the information data based on at least one of the received information data, a cumulative data database (DB) storing at least a portion of past information data related to the information data, or real-time data corresponding to the information data Generating data; And 생성된 상기 가공 데이터, 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 단계를 포함하며,Generating content based on at least one of the generated processing data, past processing data, the cumulative data DB, or the information data, 상기 정보 데이터를 수신하는 단계는,Receiving the information data, 미리 저장된 검색어에 기초하여 상기 검색어에 상응하는 상기 정보 데이터를 상기 정보 제공원 시스템으로부터 수신하는 단계를 포함하는 컨텐츠 자동 생성 방법.And receiving the information data corresponding to the search word from the information provider system based on a pre-stored search word. 제 1항에 있어서, 상기 가공 데이터를 생성하는 단계는,The method of claim 1, wherein generating the processing data comprises: 수신된 상기 정보 데이터를 파싱하여 상기 정보 데이터 중 적어도 일부를 추출하고, 추출된 상기 정보 데이터 중 적어도 일부를 상기 누적 데이터 DB에 저장하는 단계;Parsing the received information data to extract at least a portion of the information data, and storing at least a portion of the extracted information data in the accumulated data DB; 추출된 상기 정보 데이터 중 적어도 일부, 상기 누적 데이터 DB에 저장되어 있던 데이터, 또는 상기 실시간 데이터 중 적어도 하나에 기초하여 상기 가공 데이터를 생성하는 단계를 포함하는 컨텐츠 자동 생성 방법.And generating the processed data based on at least one of the extracted information data, data stored in the cumulative data DB, or at least one of the real-time data. 삭제delete 컨텐츠 자동 생성 장치가 정보 제공원 시스템으로부터 정보 데이터를 수신하는 단계;Receiving, by the apparatus for automatically generating content, information data from the information provider system; 수신된 상기 정보 데이터, 상기 정보 데이터와 관련된 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(data base), 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 정보 데이터와 관련된 가공 데이터를 생성하는 단계; 및Processing associated with the information data based on at least one of the received information data, a cumulative data database (DB) storing at least a portion of past information data related to the information data, or real-time data corresponding to the information data Generating data; And 생성된 상기 가공 데이터, 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 단계를 포함하며,Generating content based on at least one of the generated processing data, past processing data, the cumulative data DB, or the information data, 상기 가공 데이터를 생성하는 단계는,Generating the processing data, 수신된 상기 정보 데이터의 유효성을 검사하는 단계;Validating the received information data; 유효한 경우에 수신된 상기 정보 데이터를 파싱하여 상기 정보 데이터 중 적어도 일부를 추출하고, 추출된 상기 정보 데이터 중 적어도 일부를 상기 누적 데이터 DB에 저장하는 단계;Parsing the received information data when valid, extracting at least some of the information data, and storing at least some of the extracted information data in the cumulative data DB; 추출된 상기 정보 데이터 중 적어도 일부, 상기 누적 데이터 DB에 저장되어 있던 데이터, 또는 상기 실시간 데이터 중 적어도 하나에 기초하여 상기 가공 데이터를 생성하는 단계를 포함하는 컨텐츠 자동 생성 방법.And generating the processed data based on at least one of the extracted information data, data stored in the cumulative data DB, or at least one of the real-time data. 제 4항에 있어서, 상기 컨텐츠 자동 생성 장치는,The apparatus of claim 4, wherein the apparatus for automatically generating content comprises: 미리 저장된 양식 정보에 기초하여 상기 정보 데이터의 적어도 일부를 추출하거나 상기 컨텐츠 데이터의 유효성을 검사하는 컨텐츠 자동 생성 방법.And extracting at least a part of the information data or validating the content data based on pre-stored form information. 컨텐츠 자동 생성 장치가 정보 제공원 시스템으로부터 정보 데이터를 수신하는 단계;Receiving, by the apparatus for automatically generating content, information data from the information provider system; 수신된 상기 정보 데이터, 상기 정보 데이터와 관련된 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(data base), 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 정보 데이터와 관련된 가공 데이터를 생성하는 단계; 및Processing associated with the information data based on at least one of the received information data, a cumulative data database (DB) storing at least a portion of past information data related to the information data, or real-time data corresponding to the information data Generating data; And 생성된 상기 가공 데이터, 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 단계를 포함하며,Generating content based on at least one of the generated processing data, past processing data, the cumulative data DB, or the information data, 상기 컨텐츠를 생성하는 단계는,Generating the content, 생성된 상기 가공 데이터, 상기 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에서 상기 컨텐츠로 생성될 부분인 컨텐츠 데이터를 결정하는 단계; 및Determining content data which is a part to be generated as the content from at least one of the generated processing data, the past processing data, the accumulated data DB, or the information data; And 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터, 표, 또는 그래프 중 적어도 하나로 변환하는 단계를 포함하고,Converting the determined content data into at least one of text data, a table, and a graph, 상기 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터, 표, 또는 그래프 중 적어도 하나로 변환하는 단계는,Converting the determined content data into at least one of text data, a table, or a graph, 결정된 상기 컨텐츠 데이터에서 키워드를 추출하고, 추출된 키워드에 대응되는 용어를 결정하는 단계;Extracting a keyword from the determined content data and determining a term corresponding to the extracted keyword; 키워드에 대응되는 수치데이터가 있는 경우 수치데이터를 결정하는 단계;Determining numerical data when there is numerical data corresponding to the keyword; 상기 용어, 결정된 상기 수치데이터를 재배열하는 단계; 및Rearranging the term, the numerical data determined; And 재배열 결과에 기초하여 문장성분을 추가하는 단계를 포함하는 컨텐츠 자동 생성방법.Automatically generating content comprising the step of adding a sentence component based on the rearrangement result. 삭제delete 컨텐츠 자동 생성 장치가 정보 제공원 시스템으로부터 정보 데이터를 수신하는 단계;Receiving, by the apparatus for automatically generating content, information data from the information provider system; 수신된 상기 정보 데이터, 상기 정보 데이터와 관련된 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(data base), 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 정보 데이터와 관련된 가공 데이터를 생성하는 단계; 및Processing associated with the information data based on at least one of the received information data, a cumulative data database (DB) storing at least a portion of past information data related to the information data, or real-time data corresponding to the information data Generating data; And 생성된 상기 가공 데이터, 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 단계를 포함하며,Generating content based on at least one of the generated processing data, past processing data, the cumulative data DB, or the information data, 상기 컨텐츠를 생성하는 단계는,Generating the content, 생성된 상기 가공 데이터, 상기 과거의 가공 데이터, 상기 누적 데이터 DB, 또는 상기 정보 데이터 중 적어도 하나에서 상기 컨텐츠로 생성될 부분인 컨텐츠 데이터를 결정하는 단계; 및Determining content data which is a part to be generated as the content from at least one of the generated processing data, the past processing data, the accumulated data DB, or the information data; And 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터, 표, 또는 그래프 중 적어도 하나로 변환하는 단계를 포함하고,Converting the determined content data into at least one of text data, a table, and a graph, 상기 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터, 표, 또는 그래프 중 적어도 하나로 변환하는 단계는,Converting the determined content data into at least one of text data, a table, or a graph, 상기 컨텐츠 데이터에 포함되는 키워드를 추출하고, 상기 키워드에 대응되는 수치데이터를 비교하는 단계;Extracting keywords included in the content data and comparing numerical data corresponding to the keywords; 비교결과에 상응하는 용언을 선택하고 선택된 상기 용언 및 상기 키워드에 기초하여 분석 정보를 결정하는 단계;Selecting a word corresponding to a comparison result and determining analysis information based on the selected word and the keyword; 결정된 상기 분석 정보, 상기 키워드, 또는 상기 용언 각각의 사이에 들어갈 문장성분을 결정하고, 결정된 문장성분, 상기 분석정보, 상기 키워드, 및 상기 용언을 조합하여 텍스트 데이터로 변환하는 단계를 포함하는 컨텐츠 자동 생성 방법.Determining a sentence component to be included between each of the determined analysis information, the keyword, or the verb, and converting the determined sentence component, the analysis information, the keyword, and the verb into text data. How to produce. 제 1항에 있어서, 상기 컨텐츠 자동 생성 방법은,The method of claim 1, wherein the automatic content generation method comprises: 생성된 상기 컨텐츠 중 적어도 일부를 타국어로 변환하는 단계를 더 포함하 는 컨텐츠 자동 생성 방법.And converting at least a portion of the generated content into a foreign language. 제 1항, 제 4항, 제 6항, 또는 제8항에 있어서, 상기 가공데이터는,The method according to claim 1, 4, 6 or 8, wherein the processing data, 주가 수익 비율, 영업 이익률, 또는 자기 자본 이익률 중 적어도 하나를 포함하는 컨텐츠 자동 생성 방법.A method of automatically generating content including at least one of a stock price return ratio, an operating profit margin, or a return on equity. 제 1항, 제 4항, 제 6항, 또는 제8항에 있어서, 상기 정보 데이터는,The method according to claim 1, 4, 6 or 8, wherein the information data, 주식 관련 속보성 기사인 컨텐츠 자동 생성 방법.How to automatically generate content that is a stock breaking news article. 제 1항, 제 4항, 제 6항, 또는 제8항에 있어서, 상기 컨텐츠는,The method of claim 1, 4, 6 or 8, wherein the content is, 텍스트 데이터, 표, 그래프, 이미지, 오디오 정보, 또는 비디오 정보 중 적어도 하나를 포함하는 컨텐츠 자동 생성 방법.A method for automatically generating content including at least one of text data, tables, graphs, images, audio information, or video information. 제 1항, 제 4항, 제 6항, 또는 제8항에 있어서, 상기 가공 데이터를 생성하는 단계는,The method of claim 1, 4, 6, or 8, wherein the generating of the processing data comprises: 상기 정보 데이터에 포함된 유의미한 표시를 대응되는 의미로 변환하는 단계를 포함하는 컨텐츠 자동 생성 방법.And converting the meaningful display included in the information data into a corresponding meaning. 제 1항, 제2항, 제4항, 제5항, 제6항, 제8항, 또는 제9항 중 어느 한 항에 기재된 방법을 수행하기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for performing the method according to any one of claims 1, 2, 4, 5, 6, 8, or 9. 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(Data Base) 및 가공 데이터를 저장하는 가공 데이터 DB를 포함하는 정보 저장부;An information storage unit including a cumulative data DB (Data Base) for storing at least a portion of past information data and a processed data DB for storing processed data; 정보 제공원 시스템으로부터 정보 데이터를 수신하는 전처리부;A preprocessor for receiving information data from the information provider system; 수신된 상기 정보 데이터, 상기 누적 데이터 DB에 저장된 정보 중 상기 정보 데이터와 관련된 정보, 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 정보 데이터와 관련된 가공 데이터를 생성하기 위한 가공 데이터 생성 모듈; 및Generate processing data for generating processing data related to the information data based on at least one of the received information data, information stored in the cumulative data DB, information related to the information data, or real time data corresponding to the information data module; And 상기 가공 데이터 생성 모듈에 의해 생성된 상기 가공 데이터, 상기 가공 데이터 DB에 저장된 정보, 상기 누적 데이터 DB에 저장된 정보, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 컨텐츠 생성부를 포함하며,And a content generation unit generating content based on at least one of the processing data generated by the processing data generating module, information stored in the processing data DB, information stored in the cumulative data DB, or the information data. 상기 전처리부는,The preprocessing unit, 수신된 상기 정보 데이터를 파싱하여 상기 정보 데이터 중 적어도 일부를 추출하고, 추출된 상기 정보 데이터 중 적어도 일부를 상기 누적 데이터 DB에 저장하는 전처리 모듈을 포함하며,A preprocessing module for parsing the received information data to extract at least a portion of the information data and storing at least a portion of the extracted information data in the cumulative data DB, 상기 가공 데이터 생성 모듈은,The processing data generation module, 추출된 상기 정보 데이터 중 적어도 일부, 상기 누적 데이터 DB에 저장되어 있던 데이터, 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 가공 데이터를 생성하는 컨텐츠 자동 생성 장치.And automatically generate the processed data based on at least one of the extracted information data, data stored in the cumulative data DB, or real time data corresponding to the information data. 삭제delete 제 15항에 있어서, 상기 전처리부는,The method of claim 15, wherein the preprocessing unit, 검색어를 저장하는 검색어 DB를 더 포함하며,It further includes a search query DB that stores the search terms. 상기 전처리 모듈은 상기 검색어 DB에 포함된 검색어에 기초하여 상기 검색어에 상응하는 상기 정보 데이터를 상기 정보 제공원 시스템으로부터 수신하는 컨텐츠 자동 생성 장치.And the preprocessing module is configured to receive the information data corresponding to the search word from the information provider system based on the search word included in the search word DB. 제 17항에 있어서, 상기 전처리 모듈은,The method of claim 17, wherein the pretreatment module, 수신된 상기 정보 데이터의 유효성을 검사하며,Validating the information data received, 검사결과 유효한 경우에 상기 누적 데이터 DB에 상기 정보 데이터 중 적어도 일부를 추출하여 저장하는 컨텐츠 자동 생성 장치.And automatically extracting and storing at least a portion of the information data in the cumulative data DB when the test result is valid. 제 18항에 있어서, 상기 전처리 모듈은,The method of claim 18, wherein the pretreatment module, 미리 결정된 양식 정보에 기초하여 상기 정보 데이터의 적어도 일부를 추출하거나 상기 컨텐츠 데이터의 유효성을 검사하는 컨텐츠 자동 생성 장치.And automatically extracting at least a portion of the information data or validating the content data based on predetermined form information. 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(Data Base) 및 가공 데이터를 저장하는 가공 데이터 DB를 포함하는 정보 저장부;An information storage unit including a cumulative data DB (Data Base) for storing at least a portion of past information data and a processed data DB for storing processed data; 정보 제공원 시스템으로부터 정보 데이터를 수신하는 전처리부;A preprocessor for receiving information data from the information provider system; 수신된 상기 정보 데이터, 상기 누적 데이터 DB에 저장된 정보 중 상기 정보 데이터와 관련된 정보, 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 정보 데이터와 관련된 가공 데이터를 생성하기 위한 가공 데이터 생성 모듈; 및Generate processing data for generating processing data related to the information data based on at least one of the received information data, information stored in the cumulative data DB, information related to the information data, or real time data corresponding to the information data module; And 상기 가공 데이터 생성 모듈에 의해 생성된 상기 가공 데이터, 상기 가공 데이터 DB에 저장된 정보, 상기 누적 데이터 DB에 저장된 정보, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 컨텐츠 생성부를 포함하며,And a content generation unit generating content based on at least one of the processing data generated by the processing data generating module, information stored in the processing data DB, information stored in the cumulative data DB, or the information data. 상기 컨텐츠 생성부는,The content generation unit, 컨텐츠 생성 모듈; 및A content generation module; And 그래픽 데이터 생성 모듈을 포함하며,Includes a graphic data generation module, 상기 컨텐츠 생성 모듈은 상기 가공 데이터 DB에 저장된 정보, 상기 누적 데이터 DB에 저장된 정보, 또는 상기 정보 데이터 중 적어도 하나에서 상기 컨텐츠로 생성될 부분인 컨텐츠 데이터를 결정하고,The content generation module determines content data which is a part to be generated as the content from at least one of information stored in the processed data DB, information stored in the accumulated data DB, or the information data, 상기 그래픽 데이터 생성 모듈은 결정된 상기 컨텐츠 데이터를 표 또는 그래프 중 적어도 하나로 변환하며,The graphic data generation module converts the determined content data into at least one of a table or a graph, 상기 컨텐츠 생성 모듈은 결정된 상기 컨텐츠 데이터를 텍스트(text) 데이터로 변환하고 변환된 상기 텍스트 데이터, 상기 표, 또는 상기 그래프 중 적어도 하나를 포함하는 컨텐츠를 생성하는 컨텐츠 자동 생성 장치.The content generation module converts the determined content data into text data and automatically generates content including at least one of the converted text data, the table, or the graph. 제 20항에 있어서, 상기 컨텐츠 생성모듈은,The method of claim 20, wherein the content generation module, 결정된 상기 컨텐츠 데이터에서 키워드를 추출하고, 추출된 키워드에 대응되는 용어를 결정하며, 키워드에 대응되는 수치데이터가 있는 경우 수치데이터를 결정하고, 상기 용어, 결정된 상기 수치데이터를 재배열하며, 재배열 결과에 기초하여 문장성분을 추가하는 컨텐츠 자동 생성장치.Extracting a keyword from the determined content data, determining a term corresponding to the extracted keyword, determining numerical data when there is numerical data corresponding to the keyword, rearranging the term, the determined numerical data, and rearranging. Automatic content generation device for adding a sentence component based on the result. 제 20항에 있어서, 상기 컨텐츠 생성모듈은,The method of claim 20, wherein the content generation module, 상기 컨텐츠 데이터에 포함되는 키워드를 추출하고, 상기 키워드에 대응되는 수치데이터를 비교하고, 비교결과에 상응하는 용언을 선택하고 선택된 상기 용언 및 상기 키워드에 기초하여 분석 정보를 결정하며, 결정된 상기 분석 정보, 상기 키워드, 또는 상기 용언 각각의 사이에 들어갈 문장성분을 결정하고, 결정된 문장성분, 상기 분석정보, 상기 키워드, 및 상기 용언을 조합하여 텍스트 데이터로 변환하는 컨텐츠 자동 생성 장치.Extracts a keyword included in the content data, compares numerical data corresponding to the keyword, selects a word corresponding to a comparison result, determines analysis information based on the selected word and the keyword, and determines the determined analysis information And a sentence component to be inserted between each of the keyword and the verb and converting the determined sentence component, the analysis information, the keyword, and the verb into text data. 과거의 정보 데이터 중 적어도 일부를 저장하는 누적 데이터 DB(Data Base) 및 가공 데이터를 저장하는 가공 데이터 DB를 포함하는 정보 저장부;An information storage unit including a cumulative data DB (Data Base) for storing at least a portion of past information data and a processed data DB for storing processed data; 정보 제공원 시스템으로부터 정보 데이터를 수신하는 전처리부;A preprocessor for receiving information data from the information provider system; 수신된 상기 정보 데이터, 상기 누적 데이터 DB에 저장된 정보 중 상기 정보 데이터와 관련된 정보, 또는 상기 정보 데이터에 대응되는 실시간 데이터 중 적어도 하나에 기초하여 상기 정보 데이터와 관련된 가공 데이터를 생성하기 위한 가공 데이터 생성 모듈; 및Generate processing data for generating processing data related to the information data based on at least one of the received information data, information stored in the cumulative data DB, information related to the information data, or real time data corresponding to the information data module; And 상기 가공 데이터 생성 모듈에 의해 생성된 상기 가공 데이터, 상기 가공 데이터 DB에 저장된 정보, 상기 누적 데이터 DB에 저장된 정보, 또는 상기 정보 데이터 중 적어도 하나에 기초하여 컨텐츠를 생성하는 컨텐츠 생성부를 포함하며,And a content generation unit generating content based on at least one of the processing data generated by the processing data generating module, information stored in the processing data DB, information stored in the cumulative data DB, or the information data. 상기 컨텐츠 생성부는,The content generation unit, 생성된 상기 컨텐츠 중 적어도 일부를 타국어로 변환하기 위한 번역모듈을 더 포함하는 컨텐츠 자동 생성 장치.And a translation module for converting at least a portion of the generated content into a foreign language. 제 15항에 있어서, 상기 전처리 모듈은,The method of claim 15, wherein the pretreatment module, 수신된 상기 정보 데이터를 파싱하여 상기 정보 데이터에 포함된 유의미한 표시를 대응되는 의미로 변환하는 컨텐츠 자동 생성 장치.Parsing the received information data and converting the meaningful display included in the information data into a corresponding meaning.
KR1020080028797A 2008-03-28 2008-03-28 Method and apparutus for automatic contents generation KR101020138B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020080028797A KR101020138B1 (en) 2008-03-28 2008-03-28 Method and apparutus for automatic contents generation
PCT/KR2008/001837 WO2009119931A1 (en) 2008-03-28 2008-04-01 Method and apparatus for automatic contents generation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080028797A KR101020138B1 (en) 2008-03-28 2008-03-28 Method and apparutus for automatic contents generation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020100120682A Division KR101145818B1 (en) 2010-11-30 2010-11-30 Method and apparutus for automatic contents generation

Publications (2)

Publication Number Publication Date
KR20090103287A KR20090103287A (en) 2009-10-01
KR101020138B1 true KR101020138B1 (en) 2011-03-08

Family

ID=41114100

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080028797A KR101020138B1 (en) 2008-03-28 2008-03-28 Method and apparutus for automatic contents generation

Country Status (2)

Country Link
KR (1) KR101020138B1 (en)
WO (1) WO2009119931A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190077950A (en) * 2017-12-26 2019-07-04 주식회사 씽크풀 Method for providing user customized contents and system thereof
CA3218003A1 (en) * 2021-04-27 2022-11-03 Learnexperts Edtech Inc. System and method for generating content based on other source content

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000062514A (en) * 1999-03-08 2000-10-25 구자홍 Method for automatically sorting and searching patent materials and analyzing searched data
KR20030091106A (en) * 2002-05-22 2003-12-03 주식회사 에어코드 A system for creating and operating real-time data contents for data broadcasting and a controlling method thereof
KR20070022063A (en) * 2004-07-08 2007-02-23 마이크로소프트 코포레이션 Importation of automatically generated content
KR20070043974A (en) * 2004-06-30 2007-04-26 구글, 인코포레이티드 Enhanced document browsing with automatically generated links based on user information and context

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020042044A (en) * 2000-11-29 2002-06-05 중앙엠엔에스(주) System amd method of supply foreign language content use of automated translation apparatus
KR100615679B1 (en) * 2003-06-25 2006-08-25 주식회사 쇼테크 Method of Receiving and Displaying Realtime Informations from Various Information Providers including Contents Information Providers and Corporate Information Providers
KR100706896B1 (en) * 2004-11-03 2007-04-11 에스케이 텔레콤주식회사 Providing System and Method for Customized Contents Information

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000062514A (en) * 1999-03-08 2000-10-25 구자홍 Method for automatically sorting and searching patent materials and analyzing searched data
KR20030091106A (en) * 2002-05-22 2003-12-03 주식회사 에어코드 A system for creating and operating real-time data contents for data broadcasting and a controlling method thereof
KR20070043974A (en) * 2004-06-30 2007-04-26 구글, 인코포레이티드 Enhanced document browsing with automatically generated links based on user information and context
KR20070022063A (en) * 2004-07-08 2007-02-23 마이크로소프트 코포레이션 Importation of automatically generated content

Also Published As

Publication number Publication date
WO2009119931A1 (en) 2009-10-01
KR20090103287A (en) 2009-10-01

Similar Documents

Publication Publication Date Title
US7907140B2 (en) Displaying time-series data and correlated events derived from text mining
US11227109B1 (en) User interface for use with a search engine for searching financial related documents
US7716228B2 (en) Content quality apparatus, systems, and methods
US20240152558A1 (en) Search activity prediction
US20070050702A1 (en) System and method for rendering of financial data
JP2006509307A (en) Providing system and providing method for mixed data integration service
US11263523B1 (en) System and method for organizational health analysis
CN105786961A (en) Data sorting treatment method based on financial information
KR101145818B1 (en) Method and apparutus for automatic contents generation
KR100853022B1 (en) Method and apparatus for automatically generating articles
Borsje et al. Hermes: a semantic web-based news decision support system
KR101020138B1 (en) Method and apparutus for automatic contents generation
Sneed Requirement-based testing-extracting logical test cases from requirement documents
De Clercq et al. Identifying disputed topics in the news
Li et al. A design of temporal event extraction from Chinese financial news
Harikumar et al. An augmented semantic search tool for multilingual news analytics
KR20240010964A (en) Apparatus and method for providing personalized investment summary based on recommendation rate of mydata roboadvisor portfolio using deep learning
Li et al. An Accounting Classification System Using Constituency Analysis and Semantic Web Technologies
TW202042144A (en) Financial news credibility evaluation system and method thereof in which accuracy of financial news is recorded as a reference for investment and financial management of a user
Meier et al. Linking key figures and internet business news for personalized management information
Minev et al. Domain-Driven News Representation Using Conditional Attribute-Value Pairs
Bolasco¹ et al. 2 ISTAT-DISS DCCE
Chen et al. Use Text Mining Approach to Generate the Draft of Indictment for Prosecutor
Upadhyay Real Time Extraction of Quantitative Information from Economic

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E902 Notification of reason for refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140228

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150227

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160222

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170220

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180201

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200204

Year of fee payment: 10