JP2018195006A - Document automatic creating device and program - Google Patents

Document automatic creating device and program Download PDF

Info

Publication number
JP2018195006A
JP2018195006A JP2017097369A JP2017097369A JP2018195006A JP 2018195006 A JP2018195006 A JP 2018195006A JP 2017097369 A JP2017097369 A JP 2017097369A JP 2017097369 A JP2017097369 A JP 2017097369A JP 2018195006 A JP2018195006 A JP 2018195006A
Authority
JP
Japan
Prior art keywords
sensor information
manuscript
observation
template
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017097369A
Other languages
Japanese (ja)
Other versions
JP6920104B2 (en
Inventor
後藤 淳
Atsushi Goto
淳 後藤
友香 武井
Yuka Takei
友香 武井
太郎 宮▲崎▼
Taro Miyazaki
太郎 宮▲崎▼
三島 剛
Takeshi Mishima
剛 三島
庄衛 佐藤
Shoe Sato
庄衛 佐藤
山田 一郎
Ichiro Yamada
一郎 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2017097369A priority Critical patent/JP6920104B2/en
Publication of JP2018195006A publication Critical patent/JP2018195006A/en
Application granted granted Critical
Publication of JP6920104B2 publication Critical patent/JP6920104B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Instructional Devices (AREA)
  • Document Processing Apparatus (AREA)

Abstract

To provide a document automatic creating device and a program that automatically create news documents by machine learning on the basis of predetermined sensor information installed in various areas throughout the country and obtained as a public observation value in order to achieve a prompt and precise news report while reducing manpower costs.SOLUTION: A document automatic creating device 1 according to the present invention includes: a sensor information monitoring unit 11 which automatically collects predetermined sensor information from a sensor information providing server 2, and which monitors the collected sensor information so as to be stored in a sensor information storing unit 12; a template creating unit 13 which automatically and periodically obtains past actual documents from an actual document database 3, automatically creates a template, and automatically stores the template in a template storing unit 14; and a document creating unit 15 which automatically creates a predetermined number of documents using the predetermined number of templates obtained by a template ranking unit 16 for each ranking on the basis of the sensor information relating to a user designation, and which presents the documents on a user interface via a document presenting unit 17.SELECTED DRAWING: Figure 1

Description

本発明は、河川の水位を計測する水位計、地震の際の揺れを計測する地震計、気象、風速、風向、降水量、気圧、又は気温を計測する気象観測計など、全国各地に設置され公開観測値として得られるセンサー情報を基に、自動でニュース原稿を生成する原稿自動生成装置及びプログラムに関する。   The present invention is installed in various parts of the country such as a water level meter that measures the water level of a river, a seismometer that measures shaking during an earthquake, and a weather observation meter that measures weather, wind speed, wind direction, precipitation, atmospheric pressure, or temperature. The present invention relates to an automatic manuscript generation apparatus and program for automatically generating a news manuscript based on sensor information obtained as a public observation value.

近年、報道機関では様々な機関が公開しているデータを取得しており、得られたデータを基に取材を行い、現状、人手でデータを分析・確認した上で人手でニュース原稿を作成している。しかしながら、例えば、大雨の際の河川の増水などの災害報道においては、迅速な報道が求められているが、現状では、作成したニュース原稿を放送するまでに迅速性に沿わない一定の時間が必要となっている。また、人手でデータを分析・確認した上で人手でニュース原稿を作成するとヒューマンエラーも危惧される。   In recent years, news organizations have acquired data published by various organizations, and based on the obtained data, we have interviewed and currently manually analyzed and confirmed the data, then manually created the news manuscript. ing. However, for example, disaster reports such as flooding of rivers during heavy rains require prompt reporting, but at present, a certain amount of time is not required to broadcast the prepared news manuscript. It has become. Human error is also a concern if the news manuscript is created manually after manually analyzing and checking the data.

このため、河川の水位を計測する水位計、地震の際の揺れを計測する地震計、気象、風速、風向、降水量、気圧、又は気温を計測する気象観測計など、全国各地に設置され公開観測値として得られるセンサー情報を基に、自動でニュース原稿を生成する技法が望まれる。   For this reason, water level meters that measure the water level of rivers, seismometers that measure shaking during an earthquake, and weather observation meters that measure weather, wind speed, wind direction, precipitation, atmospheric pressure, or temperature are installed and disclosed throughout the country. A technique for automatically generating a news manuscript based on sensor information obtained as an observation value is desired.

尚、全国各地に設置され公開観測値として得られるセンサー情報としてLアラートと呼ばれる情報がある。このLアラートで得られる河川情報をセンサー情報とし、その河川情報を地図上にマッピングする技法が知られている(例えば、特許文献1参照)。   In addition, there is information called L alert as sensor information that is installed in various places in the country and obtained as public observation values. A technique is known in which river information obtained by the L alert is used as sensor information, and the river information is mapped on a map (see, for example, Patent Document 1).

また、地震や台風等の災害情報に関し通報者からの緊急通報を受信して出動指令又は出動指令書を生成する本部施設と、当該出動指令又は出動指令書を受信して出動指令データを抽出し、当該災害情報を公開するためのホームページを自動生成して、そのホームページを開設するWebサーバを制御する端末とを備える技法が開示されている(例えば、特許文献2参照)。   In addition, the headquarters facility that receives emergency notifications from the whistleblower regarding disaster information such as earthquakes and typhoons and generates dispatch commands or dispatch command documents, and receives the dispatch commands or dispatch command documents to extract dispatch command data. A technique is disclosed that includes automatically generating a home page for disclosing the disaster information and a terminal that controls a Web server that opens the home page (see, for example, Patent Document 2).

特開2002−269656号公報JP 2002-269656 A 特開2003−30766号公報JP 2003-30766 A

上述したように、河川の水位を計測する水位計、地震の際の揺れを計測する地震計、気象、風速、風向、降水量、気圧、又は気温を計測する気象観測計など、全国各地に設置され公開観測値として得られる所定のセンサー情報を基に、自動でニュース原稿を生成する技法が望まれる。   As mentioned above, water level meters that measure the water level of rivers, seismometers that measure shaking during an earthquake, meteorological observation meters that measure weather, wind speed, wind direction, precipitation, atmospheric pressure, or temperature are installed throughout the country. A technique for automatically generating a news manuscript based on predetermined sensor information obtained as a public observation value is desired.

特許文献1には、Lアラートで得られる河川情報をセンサー情報とし、その河川情報を地図上にマッピングする技法が開示されているが、この技法を用いても自動でニュース原稿を生成することはできない。   Patent Document 1 discloses a technique for mapping river information obtained by L alert as sensor information and mapping the river information on a map. However, a news manuscript can be automatically generated using this technique. Can not.

また、特許文献2には、出動指令又は出動指令書を基に当該災害情報を公開するためのホームページを自動生成する技法が開示されているが、この技法では、通報者からの緊急通報を聴取し災害の発生場所や内容を特定し出動レベルを設定することは人手となっている。そして、人手によって決定した出動レベルを基に、出動指令又は出動指令書を自動生成しホームページを自動生成する技法となっている。   Further, Patent Document 2 discloses a technique for automatically generating a homepage for disclosing disaster information based on a dispatch command or a dispatch command document. In this technique, an emergency report from a reporter is heard. However, it is manual to specify the location and content of the disaster and set the dispatch level. Based on the dispatch level determined manually, the dispatch command or dispatch command document is automatically generated to automatically generate a home page.

しかしながら、この技法を応用してホームページの自動生成の代わりにニュース原稿の自動生成へと転用しようとしても、まず、ニュース原稿の場合では必ずしも定型的なテンプレートで全てのセンサー情報に対応することが困難であり、この技法のみでは足らず何らかの工夫が必要になる。また、この技法では、自動生成した出動指令又は出動指令書、或いはホームページについて検証する手段がない。このため、誤って自動生成したものを頒布又は公開するおそれがあり、これを解消することができない技法となっている。また、この技法では、当該災害情報の入手、及び出動レベルの決定までは人手によるところとなり、即ち人手でデータを分析・確認した上で動作する仕組みであるため、ヒューマンエラーも危惧される問題が依然として残り、ニュース原稿の自動生成へと転用しようとしても、依然として放送するまでに迅速性に沿わない一定の時間を要する。   However, even if this technique is applied to diverted to the automatic generation of news manuscripts instead of the automatic generation of homepages, first, in the case of news manuscripts, it is not always possible to deal with all sensor information with a standard template. However, this technique alone is not enough, and some ingenuity is required. Also, with this technique, there is no means for verifying the automatically generated dispatch command or dispatch command document or home page. For this reason, there is a possibility that the automatically generated one may be distributed or disclosed, and this is a technique that cannot be solved. In addition, with this technique, the acquisition of the disaster information and the determination of the dispatch level are done manually, that is, the system operates after manually analyzing and confirming the data. Even if it is going to be diverted to the automatic generation of the news manuscript, it still takes a certain amount of time before it is broadcasted.

本発明の目的は、上述の問題に鑑みて、人手によるコストを削減しつつ迅速で正確な報道を実現するために、全国各地に設置され公開観測値として得られる所定のセンサー情報を基に、機械学習により自動でニュース原稿を生成する原稿自動生成装置及びプログラムを提供することにある。   The purpose of the present invention is based on the predetermined sensor information obtained as public observation values installed throughout the country in order to realize quick and accurate reporting while reducing human costs in view of the above-mentioned problems, An object of the present invention is to provide an automatic manuscript generating apparatus and program for automatically generating a news manuscript by machine learning.

本発明の原稿自動生成装置は、全国各地に設置され公開観測値として得られる所定のセンサー情報を基に、機械学習により自動でニュース原稿を生成する原稿自動生成装置であって、全国各地に設置され公開観測値として得られる所定のセンサー情報をセンサー情報提供サーバから自動収集し、センサー情報蓄積部に蓄積するよう監視するセンサー情報監視手段と、過去の実原稿を蓄積する実原稿データベースから、前記所定のセンサー情報に応じた実原稿を定期的に自動取得し、取得した実原稿の変数部分を固有表現抽出技法により特定し、実原稿毎のテンプレートを自動生成してテンプレート蓄積部に自動的に蓄積するテンプレート生成手段と、前記センサー情報蓄積部に蓄積されるセンサー情報に少なくとも含まれる観測地点及び観測日時を基にユーザーに対し原稿作成用センサー情報を指定させるユーザーインターフェースを提示する原稿提示手段と、前記ユーザーインターフェースを経て前記原稿作成用センサー情報のユーザー指定の受け付け時に、当該原稿作成用センサー情報に対応するセンサー情報を前記センサー情報蓄積部から読み出すとともに、ランキング別に得られる所定数のテンプレートを前記テンプレート蓄積部から読み出し、読み出したセンサー情報を当該所定数のテンプレートに割り当てることにより当該原稿作成用センサー情報に応じた所定数の原稿を自動生成し、前記原稿提示部を経て前記ユーザーインターフェース上に提示する原稿生成手段と、前記原稿生成手段による制御により、当該ユーザーによって指定される原稿作成用センサー情報に関して、過去の実原稿を基にして生成され前記テンプレート蓄積部に蓄積されたテンプレートのうち、いずれのテンプレートが最も良いかを機械学習によりランキングして選別し、選別した所定数のテンプレートを前記原稿生成手段に出力するテンプレートランキング手段と、を備えることを特徴とする。   The automatic manuscript generation apparatus of the present invention is an automatic manuscript generation device that automatically generates a news manuscript by machine learning based on predetermined sensor information that is installed throughout the country and obtained as a public observation value. The sensor information monitoring means for automatically collecting predetermined sensor information obtained as public observation values from the sensor information providing server and storing it in the sensor information storage unit, and the actual manuscript database for accumulating past actual manuscripts, Regular and automatic acquisition of actual manuscripts according to predetermined sensor information, variable parts of the obtained manuscripts are specified by the specific expression extraction technique, templates for each manuscript are automatically generated and automatically stored in the template storage unit Template generating means for accumulating, observation points and observations included at least in the sensor information accumulated in the sensor information accumulating unit Document presentation means for presenting a user interface for allowing the user to specify sensor information for document creation based on time, and when the user designation of the document creation sensor information is received via the user interface, The corresponding sensor information is read from the sensor information storage unit, a predetermined number of templates obtained for each ranking is read from the template storage unit, and the read sensor information is assigned to the predetermined number of templates, so that the original creation sensor information A document generation unit that automatically generates a predetermined number of documents corresponding to the document and presents it on the user interface through the document presentation unit, and the document creation sensor information specified by the user by the control of the document generation unit. Then, among the templates generated based on the past actual manuscript and stored in the template storage unit, which template is the best is ranked and selected by machine learning, and a predetermined number of the selected templates are selected. Template ranking means for outputting to the document generation means.

また、本発明の原稿自動生成装置において、前記センサー情報は、観測地点、観測日時、観測地点における観測値、前記観測値に対するクラスを示す閾値を少なくとも含むことを特徴とする。   In the automatic document generation apparatus of the present invention, the sensor information includes at least an observation point, an observation date and time, an observation value at the observation point, and a threshold value indicating a class for the observation value.

また、本発明の原稿自動生成装置において、前記テンプレートランキング手段は、機械学習のスコアに基づきランキングするアルゴリズムで構成されていることを特徴とする。   In the automatic document generation device of the present invention, the template ranking means is constituted by an algorithm for ranking based on a machine learning score.

また、本発明の原稿自動生成装置において、前記原稿提示手段は、前記ユーザーインターフェース上に、前記原稿生成手段によって自動生成した所定数の原稿をユーザーによって当該ランキング別に、且つ編集可能に提示する手段と、前記ユーザーインターフェース上に提示する自動生成した原稿に対応するセンサー情報の生データを参照可能に提示する手段と、ユーザーによって最終決定された原稿に用いられたテンプレートは使用実績として以後のランキングの上位に位置するよう学習するべく前記テンプレートランキング手段へ通知する手段と、を有することを特徴とする。   Further, in the automatic document generation apparatus of the present invention, the document presentation means is a means for presenting a predetermined number of documents automatically generated by the document generation means on the user interface in a ranking-editable manner by the user. Means for presenting the sensor data raw data corresponding to the automatically generated manuscript presented on the user interface in a referable manner, and the template used for the manuscript finally decided by the user is used as the highest ranking in the subsequent ranking And means for notifying the template ranking means to learn to be located in the position.

また、本発明の原稿自動生成装置において、前記原稿提示手段は、前記センサー情報に少なくとも含まれる観測地点、観測日時、観測地点における観測値、前記観測値に対するクラスを示す閾値を基に、ユーザーに対し、前記観測値に対するクラスの指定、前記観測日時の指定、前記観測地点の指定、前記観測地点を示す地域の指定、当該指定した地域に関して前記クラスによって順位付けした観測地点の指定、或いは、当該指定したクラスの地域について当該指定した観測日時から所定日時までの遡る履歴を示す範囲でセンサー情報の生データのファイル名の指定を可能とする表示を前記ユーザーインターフェース上に提示することを特徴とする。   Further, in the automatic document generation device of the present invention, the document presenting means provides the user with the observation point, the observation date and time, the observation value at the observation point, and the threshold value indicating the class with respect to the observation value, which are at least included in the sensor information. On the other hand, designation of a class for the observed value, designation of the observation date, designation of the observation point, designation of an area indicating the observation point, designation of observation points ranked by the class with respect to the designated area, or A display that allows designation of a file name of raw data of sensor information is presented on the user interface in a range indicating a history that goes back from the designated observation date and time to a predetermined date and time for an area of the designated class. .

また、本発明の原稿自動生成装置において、前記原稿提示手段は、前記ユーザーインターフェース上に、当該所定のセンサー情報に関してユーザーが指定した地域について、該地域における観測地点を地図上に表示するか、航空写真で表示するか、或いは前記地図上の表示又は航空写真の表示に重ねて、他のセンサー情報として得られる情報を表示する手段と、当該指定日時に到る所定範囲の観測推移のデータを表示する手段と、を備えることを特徴とする。   Further, in the automatic document generation device of the present invention, the document presentation means displays an observation point in the area on the map for the area specified by the user with respect to the predetermined sensor information on the user interface, A means for displaying information obtained as other sensor information on the map or displaying on the map or an aerial photograph, and data of observation transition within a predetermined range up to the specified date and time And means for performing.

更に、本発明のプログラムは、本発明の原稿自動生成装置をコンピュータとして機能させるためのプログラムとして構成される。   Furthermore, the program of the present invention is configured as a program for causing the automatic document generator of the present invention to function as a computer.

本発明によれば、河川の水位を計測する水位計、地震の際の揺れを計測する地震計、気象、風速、風向、降水量、気圧、又は気温を計測する気象観測計など、全国各地に設置され公開観測値として得られるセンサー情報と、実原稿データベースに格納される過去の大量の実原稿を用いて、機械学習により自動でニュース原稿を生成することにより、迅速で正確な報道を実現することができる。そして、本発明によれば、これまで人手でデータを分析してニュース原稿を生成していたコストを軽減することができる。   According to the present invention, a water level meter that measures the water level of a river, a seismometer that measures shaking during an earthquake, a weather observation meter that measures weather, wind speed, wind direction, precipitation, atmospheric pressure, or temperature, etc. throughout the country. Realize quick and accurate reporting by automatically generating news manuscripts by machine learning using sensor information installed and obtained as public observations and a large number of past manuscripts stored in the actual manuscript database. be able to. According to the present invention, it is possible to reduce the cost of manually generating data by analyzing data manually.

本発明による一実施形態の原稿自動生成装置の概略構成と、その周辺装置を例示するブロック図である。1 is a block diagram illustrating a schematic configuration of an automatic document generation device according to an embodiment of the present invention and peripheral devices thereof. 本発明による一実施形態の原稿自動生成装置に係るJSONと呼ばれる形式で示したデータの例を示す図である。It is a figure which shows the example of the data shown in the format called JSON which concerns on the original document production | generation apparatus of one Embodiment by this invention. 本発明による一実施形態の原稿自動生成装置の動作を示すフローチャートである。6 is a flowchart showing the operation of the automatic document generator according to an embodiment of the present invention. 本発明による一実施形態の原稿自動生成装置における原稿自動作成UI(ユーザーインターフェース)を例示する図である。FIG. 2 is a diagram illustrating an automatic document creation UI (user interface) in the automatic document generation apparatus according to the embodiment of the present invention. 本発明による別の実施形態の原稿自動生成装置の概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the original document automatic generation apparatus of another embodiment by this invention.

以下、図面を参照して、本発明による一実施形態の原稿自動生成装置1を説明する。図1は、本発明による一実施形態の原稿自動生成装置1の概略構成とその周辺装置を例示する図である。   Hereinafter, an automatic document generator 1 according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a diagram illustrating a schematic configuration of an automatic document generation device 1 according to an embodiment of the present invention and its peripheral devices.

〔全体構成〕
図1に示すように、本実施形態の原稿自動生成装置1はネートワーク4に接続され、同じくネットワーク4に接続される、N(Nは1以上の整数)台のセンサー情報提供サーバ2‐1,…,2‐N(以下、個々を区別することがないときは包括して「センサー情報提供サーバ2」と称する)、及び実原稿データベース3と通信可能となっている。
〔overall structure〕
As shown in FIG. 1, the automatic document generator 1 according to this embodiment is connected to a network 4 and is also connected to the network 4. N (N is an integer of 1 or more) sensor information providing servers 2-1. ,..., 2-N (hereinafter, collectively referred to as “sensor information providing server 2” when they are not distinguished from each other) and the actual manuscript database 3.

センサー情報提供サーバ2は、全国各地に設置され公開観測値として得られるセンサー情報を提供するサーバであり、例えば、センサー情報提供サーバ2‐1は、それぞれの地方公共団体が運用する河川の水位を計測する水位計の情報をセンサー情報として提供している(例えば、国土交通省ホームページ、川の防災情報、URL:『http://www.river.go.jp/kawabou/ipTopGaikyo.do』参照)。当該国土交通省ホームページに係るセンサー情報提供サーバ2‐1は、全国各地に設置されるセンサー情報として、水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位に警戒レベルを分けて、各警戒レベルに関する公開観測値を提供している。   The sensor information providing server 2 is a server that is installed throughout the country and provides sensor information obtained as public observation values. For example, the sensor information providing server 2-1 determines the water level of a river operated by each local public entity. Information on the water level meter to be measured is provided as sensor information (for example, the Ministry of Land, Infrastructure, Transport and Tourism website, river disaster prevention information, URL: see http://www.river.go.jp/kawabou/ipTopGaikyo.do) . The sensor information provision server 2-1 related to the MLIT website divides the alert level into the flood protection standby level, flood warning level, evacuation judgment level, and flood risk level as sensor information installed throughout the country. Provides public observations for each alert level.

例えば、センサー情報提供サーバ2‐2は全国各地に設置され公開観測値として得られる地震の際の揺れを計測する地震計の情報を提供しており、センサー情報提供サーバ2‐3は全国各地に設置され公開観測値として得られる、気象、風速、風向、降水量、気圧、又は気温を計測する気象観測計の情報を提供しているものとし、N台のセンサー情報提供サーバ2‐1,…,2‐Nは、それぞれの計測種別に応じたセンサー情報を提供するサーバとして構成される。   For example, the sensor information providing server 2-2 provides information on seismometers that are installed in various parts of the country to measure shaking during earthquakes that are obtained as public observation values. The sensor information providing server 2-3 is provided throughout the country. It is assumed that it provides information on meteorological observations that measure the weather, wind speed, wind direction, precipitation, atmospheric pressure, or temperature that are installed and obtained as public observation values, and N sensor information providing servers 2-1,. , 2-N is configured as a server that provides sensor information corresponding to each measurement type.

元より報道機関では様々な機関が公開しているデータを取得しており、気象情報を始め、さまざまな種類のデータを取得している。その中に地方公共団体から得られる災害に関する情報があり、その一つに河川の水位に関する情報がある。   Originally, the news media has acquired data published by various organizations, including weather information and various types of data. Among them is information on disasters obtained from local governments, one of which is information on river water levels.

そこで、本実施形態の原稿自動生成装置1は、例えばセンサー情報提供サーバ2‐1から、全国各地に設置され公開観測値として得られる河川の水位を計測する水位計の情報(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位に関する観測値等)をセンサー情報として自動収集し、自動でニュース原稿を生成する装置として構成される。ただし、本発明に係る原稿自動生成装置1は、水位計の情報をセンサー情報とする代わりに、他のセンサー情報提供サーバ2から、全国各地に設置され公開観測値として得られる、地震の際の揺れを計測する地震計、気象、風速、風向、降水量、気圧、又は気温を計測する気象観測計などの情報をセンサー情報として自動収集し、自動でニュース原稿を生成する装置として構成することもできる。   Therefore, the automatic document generator 1 of the present embodiment, for example, from the sensor information providing server 2-1, information on a water level meter that measures the water level of a river that is installed in various parts of the country and is obtained as a public observation value (water defense team standby water level, It is configured as a device that automatically collects the flood warning level, evacuation judgment level, observation values related to the flood risk level, etc. as sensor information and automatically generates a news manuscript. However, the automatic manuscript generator 1 according to the present invention is not limited to the sensor information of the water level gauge, but is provided from other sensor information providing servers 2 throughout the country as public observation values. It can also be configured as a device that automatically collects information such as seismometers that measure shaking, weather, wind speed, wind direction, precipitation, atmospheric pressure, or weather stations that measure temperature as sensor information and automatically generates a news manuscript. it can.

実原稿データベース3は、実際に利用されたニュース原稿を実原稿として保存している。一般に、放送局では、大雨や台風などで河川の水位が上昇した際、その情報をニュースとして放送すると、放送局で実際に放送されたニュース原稿は実原稿として実原稿データベース3に保存される。従って、本実施形態の原稿自動生成装置1は、この実原稿データベース3から、河川が増水した際のニュース原稿(過去の実原稿)を大量に取得することができる。このような実原稿データベース3は、実際に利用されたニュース原稿であればよく、放送に利用したものでなくとも通信配信や紙頒布されたニュース原稿であってもよい。   The actual manuscript database 3 stores actually used news manuscripts as actual manuscripts. In general, when the water level of a river rises due to heavy rain, a typhoon or the like in a broadcasting station, when the information is broadcast as news, the news manuscript actually broadcast by the broadcasting station is stored in the actual manuscript database 3 as an actual manuscript. Therefore, the automatic manuscript generation apparatus 1 of the present embodiment can acquire a large amount of news manuscripts (past actual manuscripts) when the river has increased from the actual manuscript database 3. Such a real manuscript database 3 may be a news manuscript that is actually used, and may be a news manuscript that has been distributed by communication or distributed, even if it is not used for broadcasting.

そこで、本実施形態の原稿自動生成装置1は、実原稿データベース3から、防団待機水位、氾濫注意水位、避難判断水位、氾濫危険水位、氾濫危険水位を含む記事(実原稿)を自動取得するよう構成される。   Therefore, the automatic manuscript generation apparatus 1 of the present embodiment automatically acquires articles (actual manuscripts) including the defense team standby water level, the flood attention water level, the evacuation judgment water level, the flood danger water level, and the flood danger water level from the real manuscript database 3. It is configured as follows.

〔装置構成〕
本実施形態の原稿自動生成装置1は、センサー情報監視部11、センサー情報蓄積部12、テンプレート生成部13、テンプレート蓄積部14、原稿生成部15、テンプレートランキング部16、及び原稿提示部17を備える。
〔Device configuration〕
The automatic document generation apparatus 1 of the present embodiment includes a sensor information monitoring unit 11, a sensor information storage unit 12, a template generation unit 13, a template storage unit 14, a document generation unit 15, a template ranking unit 16, and a document presentation unit 17. .

センサー情報監視部11は、センサー情報提供サーバ2‐1から、全国各地に設置され公開観測値として得られる河川の水位を計測する水位計の情報(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位に関する観測値等)をセンサー情報として自動収集し、センサー情報蓄積部12に蓄積する。センサー情報監視部11により自動収集する契機は、監視しているセンサー情報が変化したとき、或いは定期的(Lアラートは10分おきに更新されるため、例えば10分おき)とすることができる。   The sensor information monitoring unit 11 provides information on water level gauges that measure the water level of rivers that are installed throughout the country and obtained as public observation values from the sensor information providing server 2-1 (water defense team standby water level, flood warning water level, evacuation judgment water level). , And observation values relating to the flood risk level) are automatically collected as sensor information and stored in the sensor information storage unit 12. The opportunity for automatic collection by the sensor information monitoring unit 11 can be triggered when the monitored sensor information changes or periodically (for example, every 10 minutes because the L alert is updated every 10 minutes).

このセンサー情報は、観測地点、観測日時、観測地点における観測値、及び観測値に対するクラスを示す閾値を少なくとも含み、例えば図2に例示するようにJSONと呼ばれる形式で示されるデータとして取得することができる。図2に例示するセンサー情報の一例としての水位計の情報には、観測地点の識別子(“wlid”)、観測地点名(“wlname”)、観測地点(“wlriver”)、観測地点の住所(“wladdr”)、観測地点の番号(“wlcd”)、観測地点の緯度経度(“wlpos”)、観測地点における水位(“wlsuii”)、水位計の状態(“wlatatus”)、前日との増減(“wlud”)、観測データの更新フラグ(“wlflg”)、観測時刻(“wltime”)、水防団待機水位の閾値(“wltaiki”)、氾濫注意水位の閾値(“wltyui”)、氾濫出動水位の閾値(“wlsyutudo”:現在未使用のため常にnull)、避難判断水位の閾値(“wlhandan”)、氾濫危険水位の閾値(“wlkiken”)などが含まれている。即ち、図2に示す例では、観測値に対し4段階のクラス、即ち、水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位の警戒水位で分類し、その警戒度合を示すものとなっている。   This sensor information includes at least an observation point, an observation date and time, an observation value at the observation point, and a threshold value indicating a class for the observation value. For example, the sensor information can be acquired as data represented in a format called JSON as illustrated in FIG. it can. As an example of sensor information illustrated in FIG. 2, the water level gauge information includes an observation point identifier (“wlid”), an observation point name (“wlname”), an observation point (“wlriver”), and an observation point address ( “Wladdr”), observation point number (“wlcd”), observation point latitude and longitude (“wlpos”), water level at the observation point (“wlsuii”), water gauge status (“wlatatus”), increase / decrease from the previous day (“Wlud”), observation data update flag (“wlflg”), observation time (“wltime”), threshold value for flood control standby water level (“wltaiki”), flood warning water level threshold value (“wltyui”), flooding Water level threshold (“wlsyutudo”: always null because it is not currently used), evacuation judgment water level threshold (“wlhandan”), flood danger water level threshold (“wlkiken”), etc. are included. In other words, in the example shown in FIG. 2, the observed values are classified into four classes, that is, the basin standby level, the flood warning level, the evacuation judgment level, and the flood level warning level, and indicate the level of warning. It has become.

センサー情報蓄積部12は、センサー情報監視部11の制御によって、全国各地に設置され公開観測値として得られる河川の水位を計測する水位計の情報(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位に関する観測値等)を自動的に蓄積する。   The sensor information accumulating unit 12 is controlled by the sensor information monitoring unit 11 to provide information on water level gauges that are installed throughout the country and that are obtained as public observation values (water defense team standby water level, inundation warning water level, evacuation judgment water level). , And observation values related to flood risk levels).

テンプレート生成部13は、実原稿データベース3から、センサー情報に応じた実原稿を定期的に自動取得し、取得した実原稿の変数部分を固有表現抽出技法により特定し、実原稿毎のテンプレートを自動生成してテンプレート蓄積部14に自動的に蓄積する。テンプレート生成部13により自動取得する契機は、例えば1箇月おきとすることができる。   The template generation unit 13 automatically automatically acquires a real manuscript according to sensor information from the real manuscript database 3, specifies a variable portion of the obtained real manuscript using a specific expression extraction technique, and automatically creates a template for each real manuscript. It is generated and automatically stored in the template storage unit 14. The opportunity for automatic acquisition by the template generation unit 13 can be, for example, every other month.

テンプレート蓄積部14は、テンプレート生成部13の制御によって、センサー情報に応じた実原稿を基にして自動生成した実原稿毎のテンプレートを自動的に蓄積する。   The template storage unit 14 automatically stores a template for each actual document that is automatically generated based on the actual document according to the sensor information under the control of the template generation unit 13.

原稿生成部15は、原稿提示部17によるユーザーインターフェース(図4に示す原稿自動作成UI)を経てユーザーによって指定される原稿作成用センサー情報(観測地点又は履歴生データの選択指定)を受け付け時に、当該原稿作成用センサー情報に対応するセンサー情報をセンサー情報蓄積部12から読み出すとともに、テンプレートランキング部16を経てランキング別に得られる所定数のテンプレート(例えば、第上位から5番目までの所定ランキング内のテンプレート)をテンプレート蓄積部14から読み出し、読み出したセンサー情報を当該所定数のテンプレートに割り当てることにより当該原稿作成用センサー情報に応じた所定数の原稿を自動生成し、原稿提示部17を経てユーザーインターフェース(図4に示す原稿自動作成UI)上に提示する。   The manuscript generation unit 15 receives manuscript creation sensor information (selection of observation point or history raw data) designated by the user via the user interface (automatic manuscript creation UI shown in FIG. 4) by the manuscript presentation unit 17. Sensor information corresponding to the document creation sensor information is read from the sensor information storage unit 12 and a predetermined number of templates obtained by ranking through the template ranking unit 16 (for example, templates in a predetermined ranking from the top to the fifth) ) From the template storage unit 14, and the read sensor information is assigned to the predetermined number of templates to automatically generate a predetermined number of documents according to the document creation sensor information, and the user interface ( Automatic document shown in FIG. Presented to the formed UI) on.

テンプレートランキング部16は、原稿生成部15による制御により、当該ユーザーによって指定される原稿作成用センサー情報に関して、過去の実原稿を基にして生成されテンプレート蓄積部14に蓄積されたテンプレートのうち、いずれのテンプレートが最も良いかを機械学習によりランキングして選別し、選別した所定数のテンプレート(例えば、第上位から5番目までの所定ランキング内のテンプレート)を原稿生成部15に出力する。   The template ranking unit 16 controls any one of the templates generated based on the past actual manuscript and stored in the template accumulating unit 14 with respect to the manuscript creation sensor information specified by the user under the control of the manuscript generator 15. The selected template is ranked by machine learning and selected, and a predetermined number of the selected templates (for example, templates in the predetermined ranking from the top to the fifth) are output to the document generation unit 15.

原稿提示部17は、センサー情報蓄積部12に蓄積されるセンサー情報に少なくとも含まれる観測地点及び観測日時を基にユーザーに対し原稿作成用センサー情報を指定させ、当該原稿作成用センサー情報のユーザー指定の受け付け時に、原稿生成部15により自動生成したランキング別の所定数の原稿を提示するとともに、ユーザーに対しニュースにすべき情報を直感的に把握させ、尚且つ当該自動生成した原稿をユーザーによって編集可能にするためのユーザーインターフェース(図4に示す原稿自動作成UI)を提示する機能部である。   The manuscript presentation unit 17 causes the user to designate manuscript creation sensor information based on at least the observation point and the observation date / time included in the sensor information accumulated in the sensor information accumulation unit 12, and the user designation of the manuscript creation sensor information is specified. When a document is received, a predetermined number of originals classified by ranking automatically generated by the original generation unit 15 are presented, and the user can intuitively grasp information to be news, and the automatically generated original is edited by the user. This is a functional unit that presents a user interface (automatic document creation UI shown in FIG. 4) for enabling the user interface.

尚、原稿提示部17は、センサー情報に少なくとも含まれる観測地点、観測日時、観測地点における観測値、及び該観測値に対するクラスを示す閾値を基に、ユーザーに対し、当該観測値に対するクラスの指定、当該観測日時の指定、当該観測地点の指定、当該観測地点を示す地域の指定、当該指定した地域に関して当該クラスによって順位付けした観測地点の指定、或いは、当該指定したクラスの地域について当該指定した観測日時から所定日時までの遡る履歴を示す範囲でセンサー情報の生データのファイル名の指定を可能とする表示をユーザーインターフェース(図4に示す原稿自動作成UI)上に提示する。これにより、センサー情報蓄積部12に蓄積されるセンサー情報に少なくとも含まれる観測地点及び観測日時を基にユーザーに対し原稿作成用センサー情報を指定させる。   The manuscript presentation unit 17 designates the class for the observed value based on at least the observation point included in the sensor information, the observation date and time, the observation value at the observation point, and the threshold value indicating the class for the observation value. Designation of the observation date, designation of the observation point, designation of the area indicating the observation point, designation of observation points ranked by the class with respect to the designated area, or designation of the area of the designated class A display that allows the designation of the file name of the raw data of the sensor information within a range indicating the history going back from the observation date to the predetermined date is presented on the user interface (automatic document creation UI shown in FIG. 4). This allows the user to specify the document creation sensor information based on the observation point and the observation date and time included at least in the sensor information stored in the sensor information storage unit 12.

より具体的には、原稿提示部17は、原稿編集部171、原稿用生データ参照部172、履歴生データ参照部173、観測日指定部174、クラス別地域提示部175、地域別クラス提示部176、順位別観測地点提示部177、観測地点地図表示部178、観測推移表示部179、及び原稿出力部180を備える。   More specifically, the manuscript presentation unit 17 includes a manuscript editing unit 171, a manuscript raw data reference unit 172, a history raw data reference unit 173, an observation date designation unit 174, a class-specific region presentation unit 175, and a region-specific class presentation unit. 176, an observation point presentation unit 177 by rank, an observation point map display unit 178, an observation transition display unit 179, and a manuscript output unit 180.

原稿編集部171は、当該原稿作成用センサー情報のユーザー指定の受け付け時に、原稿生成部15により自動生成したランキング別の原稿を編集可能にテキスト形式で提示する機能部である。従って、原稿編集部171は、自動生成した原稿を編集修正したり、追加情報や別のセンサー情報を統合するなどのエディタ機能も備えている。図4に示す原稿自動作成UIの例では、原稿編集部171は、ランキング最上位のテンプレートを基に自動生成した原稿をデフォルト提示し、ユーザーによって原稿のテンプレートのランキングを指定することで(図示する選択ボタン“171a”)、ランキング別の所定数の原稿をテキスト形式で提示する。   The manuscript editing unit 171 is a functional unit that presents the manuscripts by ranking automatically generated by the manuscript generation unit 15 in a text format so as to be editable when accepting user designation of the manuscript creation sensor information. Accordingly, the document editing unit 171 also has an editor function such as editing and correcting an automatically generated document, and integrating additional information and other sensor information. In the example of the automatic document creation UI shown in FIG. 4, the document editing unit 171 presents a document automatically generated based on the highest ranking template by default, and designates the ranking of the document template by the user (illustrated). A selection button “171a”), a predetermined number of documents by ranking are presented in text format.

原稿用生データ参照部172は、原稿編集部171によって提示される自動生成したランキング別の原稿に対応する生データを参照可能にする機能部である。図4に示す原稿自動作成UIの例では、原稿用生データ参照部172を機能させるボタンをユーザーが押下することで、原稿用生データ参照部172は、図2に示す生データをウィンドウ提示するようになっている。これにより、ユーザーは、当該自動作成した原稿と生データが一致しているかを検証できる。   The raw document data reference unit 172 is a functional unit that makes it possible to refer to the raw data corresponding to the automatically generated ranking-by-ranking document presented by the document editing unit 171. In the example of the automatic document creation UI illustrated in FIG. 4, when the user presses a button that causes the document raw data reference unit 172 to function, the document raw data reference unit 172 presents the raw data illustrated in FIG. 2 in a window. It is like that. As a result, the user can verify whether the automatically created document matches the raw data.

履歴生データ参照部173は、本例では4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)のうち指定クラス(チェックボックス175a〜175dに従う)の地域について、当該指定日時(指定した観測日時)から所定日時までの遡る履歴を示す範囲で、それぞれ図2に示すような形式のセンサー情報の生データのファイル名をユーザーが指定可能にリスト提示する機能部である。図4に示す原稿自動作成UIの例では、ユーザーが履歴生データ参照部173を示すボタンを押下すると、履歴生データ参照部173は、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)のうち指定クラスの地域について、当該指定日時から所定日時までの遡る履歴を示す範囲でセンサー情報の生データのファイル名(履歴生データ)を提示して、このうちいずれかをユーザーによって指定できるようにする。そして、原稿生成部15が、ユーザーによって指定される原稿作成用センサー情報の1つとして履歴生データ参照部173を介してリスト提示される履歴生データの選択指定を受け付けると、当該履歴生データに対応する原稿をテンプレートのランキング別に自動生成し、当該原稿編集部171を動作させて、ユーザによって編集可能にテキスト形式で図4に示す原稿自動作成UI上に提示する。   In this example, the history raw data reference unit 173 is configured with respect to the areas of the designated class (according to the check boxes 175a to 175d) among the four-stage classes (the flood control team standby water level, the flood warning water level, the evacuation judgment water level, and the flood risk water level). A function unit that presents a list of file names of raw data of sensor information in the format shown in FIG. 2 so that the user can specify them within a range that shows the history going back from the specified date and time (specified observation date and time) to a predetermined date and time. is there. In the example of the automatic document creation UI shown in FIG. 4, when the user presses a button indicating the history raw data reference unit 173, the history raw data reference unit 173 has four classes (water defense team standby water level, flood warning water level, evacuation level). The file name of the sensor data raw data (historical raw data) within the range showing the history going back from the specified date to the specified date for the designated class area in the judgment water level and the flood risk water level) Allow either to be specified by the user. When the document generation unit 15 receives selection specification of history raw data presented as a list via the history raw data reference unit 173 as one of the document creation sensor information specified by the user, the history raw data is included in the history raw data. Corresponding manuscripts are automatically generated for each template ranking, and the manuscript editing unit 171 is operated to present the manuscript editing unit 171 on the automatic manuscript creation UI shown in FIG.

観測日指定部174は、センサー情報蓄積部12に蓄積しているセンサー情報について、原稿の自動生成に係る観測日をユーザーが指定する機能部である。図4に示す原稿自動作成UIの例では、観測日指定部174は、ユーザが観測日を直接指定する入力欄174a(その入力欄174aの日時を基に送り/戻し指定可能)、及び“最新のデータを見る”ことを指定する最新データボタン174bを提示して、センサー情報における所望の観測日を指定する指定日時を設定できるようにしている。   The observation date specifying unit 174 is a functional unit that allows the user to specify an observation date related to automatic generation of a document for the sensor information stored in the sensor information storage unit 12. In the example of the automatic document creation UI shown in FIG. 4, the observation date designating unit 174 has an input field 174a in which the user directly designates the observation date (can be sent / returned based on the date / time of the input field 174a), The latest data button 174b for designating that “view the data of” is presented so that a designated date and time for designating a desired observation date in the sensor information can be set.

クラス別地域提示部175は、本例では4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)について、各クラスに属する地域(都道府県)を表示し、原稿の自動生成に係るクラスをユーザーが指定する機能部である。図4に示す原稿自動作成UIの例では、クラス別地域提示部175は、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)について色分け提示し、ユーザーが各クラスを指定できるチェックボックス175a,175b,175c,175dを提示して、その指定された範囲内で原稿の自動生成が行われるよう設定するものとなっている。   In this example, the class-specific area presentation unit 175 displays the areas (prefectures) belonging to each class for the four levels of classes (water defense team standby water level, inundation warning water level, evacuation judgment water level, and flood risk water level). This is a functional unit that allows the user to specify a class related to the automatic generation of. In the example of the automatic document creation UI shown in FIG. 4, the class-specific area presentation unit 175 presents the four-stage classes (water defense team standby water level, inundation warning water level, evacuation judgment water level, and inundation risk water level) in different colors. The check boxes 175a, 175b, 175c, and 175d that can specify each class are presented, and the automatic document generation is set within the specified range.

地域別クラス提示部176は、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)をそれぞれ超えている地域(都道府県)について区別可能に一覧提示する機能部である。図4に示す原稿自動作成UIの例では、地域別クラス提示部176は、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)について、クラス別地域提示部175と対応付けて色分け提示する。そして、ユーザーが地域別クラス提示部176によって一覧提示される地域(都道府県)を指定すると(例えば岩手県を指定する地域指定ボタン176a)、順位別観測地点提示部177が機能して、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)順にその地域(都道府県)における観測地点を提示し、且つ観測地点地図表示部178が機能して、その地域(都道府県)における観測地点を地図上に表示するようになっている。   The class-by-region class presentation unit 176 is a functional unit that presents a list of areas (prefectures) that exceed the four-stage classes (water defense team standby water level, flood warning water level, evacuation judgment water level, and flood risk water level). It is. In the example of the automatic document creation UI shown in FIG. 4, the regional class presentation unit 176 is configured to provide a class-specific regional presentation unit for four levels of classes (water defense team standby water level, flood warning water level, evacuation judgment water level, and flood risk water level). 175 is displayed in association with the color. When the user designates a region (prefecture) to be presented as a list by the region-specific class presentation unit 176 (for example, the region designation button 176a for designating Iwate Prefecture), the rank-specific observation point presentation unit 177 functions to perform four steps. The observation points in the area (prefecture) are presented in the order of the classes (basic defense water level, flood warning water level, evacuation judgment water level, and flood risk water level), and the observation point map display unit 178 functions, Observation points in prefectures are displayed on the map.

順位別観測地点提示部177は、地域別クラス提示部176にてユーザーが指定した地域(都道府県)について、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位の警戒水位)と当該指定日時(例えば、現在)の水位との差で順序付けし、その地域(都道府県)における観測地点を区別可能に提示する機能部である。図4に示す原稿自動作成UIの例では、ユーザーが地域別クラス提示部176によって一覧提示される地域(都道府県)を指定すると(例えば岩手県を指定する地域指定ボタン176a)、順位別観測地点提示部177は、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位の警戒水位)と当該指定日時(例えば、現在)の水位との差で順序付けし、最も警戒度の高い順でクラス別地域提示部175と対応付けて色分け提示して、当該指定日時における岩手県のクラス別の水位の情報を各クラスの閾値とともに提示する。そして、ユーザーが順位別観測地点提示部177によってクラス順位別に提示される観測地点を指定すると(例えば観測地点指定ボタン177aで夏井川を指定)、原稿生成部15が機能して、この観測地点に対応する原稿を自動生成し、続いて原稿提示部17における原稿編集部171が機能して当該原稿を提示し、更に、観測推移表示部179が機能して、当該指定日時に到る所定範囲の観測推移のデータをウィンドウ表示するようになっている。   The rank-specific observation point presentation unit 177 has four levels of classes (prefecture water level, flood warning level, evacuation judgment level, and inundation risk level) for the region (prefecture) designated by the user in the regional class presentation unit 176. This is a functional unit that orders according to the difference between the water level at the specified date and time (for example, the current) and presents the observation points in that region (prefecture) in a distinguishable manner. In the example of the automatic document creation UI shown in FIG. 4, when the user designates a region (prefecture) to be displayed as a list by the region-specific class presentation unit 176 (for example, region designation button 176 a for designating Iwate Prefecture), The presentation unit 177 orders by the difference between the four levels of classes (the flood control team standby water level, the flood warning water level, the evacuation judgment water level, and the flood warning water level warning water level) and the water level of the designated date and time (for example, the present). The color level is presented in association with the class-specific region presentation unit 175 in descending order of alertness, and the water level information for each class of Iwate Prefecture at the designated date and time is presented together with the threshold value of each class. Then, when the user designates observation points presented by class order by the observation point presentation unit 177 by rank (for example, the Natai River is designated by the observation point designation button 177a), the manuscript generation unit 15 functions and the observation point is displayed. A corresponding manuscript is automatically generated, then the manuscript editing unit 171 in the manuscript presentation unit 17 functions to present the manuscript, and the observation transition display unit 179 functions to operate within a predetermined range up to the designated date and time. The observation transition data is displayed in a window.

観測地点地図表示部178は、地域別クラス提示部176にてユーザーが指定した地域(都道府県)について、その地域(都道府県)における観測地点を地図上に表示する機能部である。図4に示す原稿自動作成UIの例では、観測地点地図表示部178は、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)について、地域(都道府県)における観測地点を地図上でポイント表示している。特に、順位別観測地点提示部177によって指定される観測地点では(例えば観測地点指定ボタン178aで夏井川を指定)、順位別観測地点提示部177による選択指定によって観測推移表示部179が機能して、当該指定日時に到る所定範囲の観測推移のデータをウィンドウ表示している。尚、観測地点地図表示部178は、当該地域(都道府県)における観測地点を地図上に表示させるにあたり、拡大縮小させる機能(図示する拡大縮小ボタン178b)や、航空写真で表示する機能(図示する航空写真表示ボタン178c)をユーザーにより指定できるようになっている。   The observation point map display unit 178 is a functional unit that displays the observation points in the region (prefecture) on the map for the region (prefecture) designated by the user in the class presentation unit 176 by region. In the example of the automatic manuscript creation UI shown in FIG. 4, the observation point map display unit 178 has the four levels of classes (the flood control team standby water level, the inundation warning water level, the evacuation judgment water level, and the inundation risk water level) in the region (prefecture). The observation points at are displayed as points on the map. In particular, at the observation point designated by the observation point presentation unit 177 by rank (for example, the Natai River is designated by the observation point designation button 178a), the observation transition display unit 179 functions by the selection designation by the observation point presentation unit 177 by rank. The observation transition data within a predetermined range up to the designated date and time are displayed in a window. Note that the observation point map display unit 178 enlarges / reduces the observation point in the region (prefecture) on the map, or displays the aerial photograph (shown). The aerial photograph display button 178c) can be designated by the user.

特に、図4に示す原稿自動作成UI上において、他のセンサー情報として得られる衛星写真による表示(例えば雲の状況)を重ねて提示することもでき、これにより、より直感的に災害情報を理解できるようになる。これは、避難情報が水位の状況と今後の雨量予測に基づき出されるためである。また、図4に示す原稿自動作成UI上において、他のセンサー情報として得られる降雨量のマップや台風の進路を重ねて提示することもでき、この場合も、より直感的に災害情報を理解できるようになる。   In particular, on the automatic document creation UI shown in FIG. 4, it is also possible to present a display (for example, a cloud situation) with satellite photographs obtained as other sensor information, thereby enabling more intuitive understanding of disaster information. become able to. This is because evacuation information is issued based on the water level and future rainfall forecasts. In addition, on the automatic document creation UI shown in FIG. 4, it is possible to present a map of rainfall amounts and typhoon paths obtained as other sensor information, and in this case, disaster information can be understood more intuitively. It becomes like this.

このように、図4に示す原稿自動作成UI上において、原稿提示部17は、当該所定のセンサー情報に関してユーザーが指定した日時及び地域について、該地域における観測地点を地図上に表示するか、航空写真で表示するか、或いはその地図上の表示又は航空写真の表示に重ねて、他のセンサー情報として得られる情報を表示し、更には当該指定日時に到る所定範囲の観測推移のデータを表示する。これにより、ユーザーに対し、原稿生成部15によって自動生成しユーザーインターフェース上で提示した原稿の検証又は編集を容易化するようになっている。   As described above, on the automatic document creation UI shown in FIG. 4, the document presentation unit 17 displays the observation point in the region on the map for the date and region designated by the user with respect to the predetermined sensor information, Displayed as a photo, or superimposed on the map display or aerial photo display, displays the information obtained as other sensor information, and further displays the observation transition data within a specified range until the specified date and time To do. This facilitates verification or editing of the document automatically generated by the document generation unit 15 and presented on the user interface to the user.

観測推移表示部179は、順位別観測地点提示部177による選択指定によって、当該指定日時に到る所定範囲の観測推移のデータをウィンドウ表示する機能部である。図4に示す原稿自動作成UIの例では、観測推移表示部179は、対応するセンサー情報を自動分析して、河川名(観測地点:“wlriver”)、観測所名(観測地点名:“wlname”)、所在地(観測地点の住所:“wladdr”)の情報とともに、観測時刻(“wltime”)、観測地点における水位(“wlsuii”)、前日との増減(“wlud”)、当該指定日時に対応するクラス(氾濫危険水位の閾値:“wlkiken”)を、当該指定日時に到る所定範囲の観測推移を10分毎のデータとしてグラフ表示している。また、ボタン179a及びボタン179bの提示で、当該指定日時を一定時間(例えば、10分間)単位で特定してグラフ表示できるようになっている。   The observation transition display unit 179 is a functional unit that displays, in a window, data of observation transitions in a predetermined range up to the designated date and time according to selection designation by the observation point presentation unit 177 by rank. In the example of the automatic manuscript creation UI shown in FIG. 4, the observation transition display unit 179 automatically analyzes the corresponding sensor information to obtain a river name (observation point: “wlriver”), an observation station name (observation point name: “wlname”). ”), Location (observation point address:“ wladdr ”), observation time (“ wltime ”), water level at the observation point (“ wlsuii ”), increase / decrease from the previous day (“ wlud ”), The corresponding class (flooding danger water level threshold: “wlkiken”) is displayed as a graph of the observation transition within a predetermined range up to the designated date and time as data every 10 minutes. In addition, when the button 179a and the button 179b are presented, the designated date and time can be specified and displayed in a graph for a predetermined time (for example, 10 minutes).

原稿出力部180は、原稿編集部171によって編集可能にテキスト形式で提示された原稿をユーザーが最終決定し外部出力するとともに、この最終決定された原稿に用いられたテンプレートの最終決定を使用実績としてテンプレートランキング部16へ通知する機能部である。図4に示す原稿自動作成UIの例では、原稿出力部180はOKボタンとして提示され、ユーザーが原稿編集部171によって編集可能にテキスト形式で提示された原稿を最終決定し押下すると、原稿出力部180は、当該最終決定した原稿が所定の出力先(図示しないプリンタや外部通信機器)へ出力するとともに、この最終決定された原稿に用いられたテンプレートの優先度が高くなるよう、テンプレートランキング部16におけるランキング学習へ使用実績として通知する。このように、原稿出力部180は、ユーザーが選んだ原稿のテンプレートをテンプレートランキング部16におけるランキング学習へ反映する機能を有している。   The manuscript output unit 180 finally decides and externally outputs the manuscript presented in text format so that it can be edited by the manuscript editing unit 171, and uses the final decision of the template used for the finally decided manuscript as a usage record. This is a functional unit that notifies the template ranking unit 16. In the example of the automatic document creation UI shown in FIG. 4, the document output unit 180 is presented as an OK button, and when the user finally determines and presses the document presented in the text format so as to be edited by the document editing unit 171, the document output unit Reference numeral 180 denotes a template ranking unit 16 so that the final determined original is output to a predetermined output destination (a printer or an external communication device (not shown)), and the priority of the template used for the final determined original is increased. Notify as a usage record to ranking learning in. As described above, the document output unit 180 has a function of reflecting the document template selected by the user in the ranking learning in the template ranking unit 16.

尚、原稿出力部180は、緊急報道用のL字型画面用の原稿データの作成・出力にも応用可能である。   The manuscript output unit 180 can also be applied to creation and output of manuscript data for an L-shaped screen for emergency reporting.

このように、原稿提示部17は、ユーザーによって指定される原稿作成用センサー情報の受け付け時に、原稿生成部15により自動生成したランキング別の所定数の原稿を提示するとともに、ユーザーに対しニュースにすべき情報を直感的に把握させ、尚且つ当該自動生成した原稿をユーザによって編集可能にするためのユーザーインターフェース(図4に示す原稿自動作成UI)を提示するようになっている。   As described above, the manuscript presentation unit 17 presents a predetermined number of manuscripts by ranking automatically generated by the manuscript generation unit 15 when accepting manuscript creation sensor information designated by the user, and provides the user with news. A user interface (automatic document creation UI shown in FIG. 4) is provided for allowing the user to intuitively grasp information to be processed and enabling the user to edit the automatically generated document.

〔装置動作〕
図3は、本発明による一実施形態の原稿自動生成装置1の動作を示すフローチャートである。まず、センサー情報監視部11は、センサー情報提供サーバ2から全国各地に設置され公開観測値として得られるセンサー情報を監視してセンサー情報蓄積部12に蓄積する(ステップS1)。特に、本実施形態の例におけるセンサー情報監視部11は、センサー情報提供サーバ2‐1から、全国各地に設置され公開観測値として得られる河川の水位を計測する水位計の情報(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位に関する観測値等)をセンサー情報として自動収集し、センサー情報蓄積部12に蓄積する。
[Device operation]
FIG. 3 is a flowchart showing the operation of the automatic document generator 1 according to the embodiment of the present invention. First, the sensor information monitoring unit 11 monitors sensor information that is installed from various places throughout the country from the sensor information providing server 2 and is obtained as a public observation value, and accumulates it in the sensor information accumulation unit 12 (step S1). In particular, the sensor information monitoring unit 11 in the example of the present embodiment provides information on water level gauges (water defense team standby water levels) that measure the water level of rivers that are installed throughout the country and obtained as public observation values from the sensor information providing server 2-1. , Inundation caution water level, evacuation judgment water level, observation value related to inundation risk water level, etc.) are automatically collected as sensor information and stored in the sensor information storage unit 12.

更に、テンプレート生成部13は、実原稿データベース3から、センサー情報に応じた実原稿を定期的に自動取得し(ステップS2)、取得した実原稿の変数部分を固有表現抽出技法により特定し、実原稿毎のテンプレートを自動生成してテンプレート蓄積部14に自動的に蓄積する(ステップS3)。特に、本実施形態の例におけるテンプレート生成部13は、センサー情報に応じた実原稿を定期的に自動取得し、取得した実原稿の変数部分を固有表現抽出技法により特定し、実原稿毎のテンプレートを自動生成してテンプレート蓄積部14に自動的に蓄積する。   Further, the template generation unit 13 periodically and automatically acquires an actual document according to the sensor information from the actual document database 3 (step S2), specifies a variable part of the acquired actual document by a specific expression extraction technique, A template for each document is automatically generated and automatically stored in the template storage unit 14 (step S3). In particular, the template generation unit 13 in the example of the present embodiment automatically obtains a real manuscript periodically according to sensor information, specifies a variable portion of the obtained real manuscript using a specific expression extraction technique, and creates a template for each real manuscript. Is automatically generated and stored in the template storage unit 14 automatically.

例えば、テンプレート生成部13によって実原稿データベース3から取得した実原稿の変数部分を固有表現抽出技法により特定する例として、センサー情報に含まれる情報に対応する変数部分、例えば、時刻、都道府県名、河川名、地方公共団体名、観測所名、警戒水位名、水位、を特定する。   For example, as an example of specifying the variable part of the actual manuscript acquired from the actual manuscript database 3 by the template generation unit 13 using the specific expression extraction technique, the variable part corresponding to the information included in the sensor information, for example, time, prefecture name, Identify river names, local government names, observation station names, warning water level names, and water levels.

より具体的には、実原稿が『国土交通省によりますと、(0時)現在(岩手県)を流れる(夏井川)が(久慈市)の(夏井)で、(氾濫危険水位)を越える(2.66m)の水位を観測しました。』であるとすると、変数部分として( )で示されている。   To be more specific, the actual manuscript is “According to the Ministry of Land, Infrastructure, Transport and Tourism, (Natsui River) flowing in (Iwate Prefecture) as of (0:00) is (Natsui) in (Kuji City) and exceeds (Dangerous flooding level) ( 2.66m) water level was observed. ], It is indicated by () as a variable part.

この実原稿から特定したものをテンプレートとして利用すると、『国土交通省によりますと、(時刻)現在(都道府県名)を流れる(河川名)が(地方公共団体名)の(観測所名)で、(警戒水位名)を越える(水位)の水位を観測しました。』として生成される。   Using the actual manuscript specified as a template, “According to the Ministry of Land, Infrastructure, Transport and Tourism, (current time) (river name) flowing through (prefecture name) is (local public entity name) (observation name), The water level of (water level) exceeding (warning water level name) was observed. Is generated.

つまり、河川水位に関するセンサー情報から取得したデータをこのテンプレートの変数部分に挿入することにより、別のセンサー情報のデータに対しても次のような原稿を生成することができる。
『国土交通省によりますと、0時現在、山形県を流れる最上川が川西町の下田で、氾濫注意水位を越える15.74mの水位を観測しました。』
That is, by inserting the data acquired from the sensor information relating to the river water level into the variable portion of this template, the following original can be generated for data of another sensor information.
“According to the Ministry of Land, Infrastructure, Transport and Tourism, as of 0:00, the Mogami River flowing through Yamagata Prefecture was Shimoda in Kawanishi Town. ]

このようなテンプレートを生成するための変数部分の特定には、固有表現抽出技法を用いる。固有表現抽出技法では、まず、実原稿に対し形態素解析を行い、例えば、(時刻)、(都道府県名)、(河川名)、(地方公共団体名)、(観測所名)、(警戒水位名)、(水位)がどの部分であるかが識別できるマーカーを付与する。これをCRF(Conditional Random Fields)やSVM(Support Vector Machine)などのアルゴリズムを用いて、固有表現部分を特定する。SVMによる固有表現抽出の実装には、YAMCHA(『http://www.chasen.org/~taku/software/yamcha/』参照)、CRFによる固有表現抽出の実装には、CRF++(『https://taku910.github.io/crfpp/』参照)がある。そのほか、隠れマルコフモデル(Hidden Markov Model)、隠れマルコフパーセプトロン(Structured Perceptron)など、他のアルゴリズムによる実装を利用してもよい。学習の際の特徴量については、形態素、形態素の基本形、読み、品詞、文字種(ひらがな、カタカナ、アルファベット、漢字、数字)およびそれらのn-gram(nは2以上の最適な数を設定)などを用いる。そして、学習により得られたモデルを用いて、取得した実原稿毎にテンプレートを生成する。   A specific expression extraction technique is used to specify a variable part for generating such a template. In the specific expression extraction technique, first, morphological analysis is performed on the actual manuscript, for example, (time), (prefecture name), (river name), (local government name), (observation name), (warning water level) A marker for identifying which part is (name) and (water level) is given. The specific expression portion is specified by using an algorithm such as CRF (Conditional Random Fields) or SVM (Support Vector Machine). YAMACHA (see “http://www.chasen.org/~taku/software/yamcha/”) is used to implement SVM-specific expression extraction, and CRF ++ (“https: / /taku910.github.io/crfpp/ ”). In addition, implementations using other algorithms such as Hidden Markov Model and Structured Perceptron may be used. For feature quantities during learning, morphemes, basic forms of morphemes, readings, parts of speech, character types (Hiragana, Katakana, Alphabet, Kanji, numbers) and their n-grams (where n is an optimal number of 2 or more) Is used. Then, a template is generated for each acquired actual document using a model obtained by learning.

テンプレートの生成にあたって、機械学習を利用する以外にも、予めセンサー情報に含まれる文字列が有限であることが分かっている場合は辞書ベースの固有表現抽出によりテンプレートを生成し、テンプレート蓄積部14に追加設定することを含めてもよい。また、確実に利用可能なテンプレートを予め人手で生成し、テンプレート蓄積部14に追加設定してもよい。   When generating a template, in addition to using machine learning, if it is known in advance that the character string included in the sensor information is finite, the template is generated by dictionary-based unique expression extraction, and the template storage unit 14 Additional settings may be included. Alternatively, a surely usable template may be manually generated in advance and additionally set in the template storage unit 14.

また、上述したとおり、テンプレートの作成のための固有表現抽出技法には、系列ラベル予測ができる手法であれば、どのような手法を用いてもよい。例えば、RNN(Recurrent Neural Network)、特にRNNの一つであるLSTM(Long short-term memory)を利用してもよい(例えば、Sequence labeler、URL:『https://github.com/marekrei/sequence-labeler』参照)。   Further, as described above, any technique may be used as the specific expression extraction technique for creating the template as long as it is a technique that can perform sequence label prediction. For example, RNN (Recurrent Neural Network), in particular, LSTM (Long short-term memory) which is one of RNNs may be used (for example, Sequence labeler, URL: “https://github.com/marekrei/sequence -labeler)).

そして、原稿生成部15は、原稿提示部17によるユーザーインターフェース(図4に示す原稿自動作成UI)を経てユーザーによって指定される原稿作成用センサー情報の受け付け時に、当該原稿作成用センサー情報に対応するセンサー情報をセンサー情報蓄積部12から読み出すとともに、テンプレートランキング部16を制御して、ランキング別に得られる所定数のテンプレート(例えば、10位までの所定ランキングのテンプレート)をテンプレート蓄積部14から読み出して取得する(ステップS4)。   Then, the document generation unit 15 responds to the document creation sensor information when receiving document creation sensor information designated by the user via the user interface (automatic document creation UI shown in FIG. 4) by the document presentation unit 17. The sensor information is read from the sensor information storage unit 12 and the template ranking unit 16 is controlled to read and acquire a predetermined number of templates obtained by ranking (for example, templates with a predetermined ranking up to 10th) from the template storage unit 14. (Step S4).

このとき、テンプレートランキング部16は、原稿生成部15による制御により、当該ユーザーによって指定される原稿作成用センサー情報に関して、過去の実原稿を基にして生成されテンプレート蓄積部14に蓄積されたテンプレートのうち、いずれのテンプレートが最も良いかを機械学習、例えばSVMが出力するスコアによりランキングして選別し、選別した所定数のテンプレート(例えば、第上位から5番目までの所定ランキング内のテンプレート)を原稿生成部15に出力する(ステップS5)。   At this time, the template ranking unit 16 generates the template information generated based on the past actual document and stored in the template storage unit 14 with respect to the document creation sensor information designated by the user under the control of the document generation unit 15. Which template is best is selected by machine learning, for example, ranking by the score output by the SVM, and a predetermined number of selected templates (for example, templates in the predetermined ranking from the top to the fifth) are drafted. It outputs to the production | generation part 15 (step S5).

例えば、テンプレートランキング部16は、過去の実原稿を基にして生成されテンプレート蓄積部14に蓄積されたテンプレートのうち、いずれのテンプレートが最も良いかを出力する。このランキングを生成するために、予めセンサー情報に対応するテンプレートか否かをアノテートした学習データを作成する。この学習データを機械学習、例えば、SVMで学習し、その分離超平面からの距離によりランキングを行う。もしくは、利用可能なテンプレートと利用不可能なテンプレートのペアから作成した特徴量を入力としたランキングSVMで学習する。この機械学習に用いる特徴量は、テンプレートの形態素単位でのn−gram(nは1以上)、テンプレートに含まれる変数の種類、変数の出現順序、それぞれの変数の度数、テンプレートに含まれる変数の延べ数などを用い、このほか、センサー情報から得られる情報の種類との割合などを特徴量として追加してもよい。   For example, the template ranking unit 16 outputs which template is the best among the templates generated based on the past actual manuscript and stored in the template storage unit 14. In order to generate this ranking, learning data in which the template corresponding to the sensor information is previously annotated is created. This learning data is learned by machine learning, for example, SVM, and ranking is performed based on the distance from the separation hyperplane. Alternatively, learning is performed with a ranking SVM using as input a feature amount created from a pair of an available template and an unavailable template. The feature quantity used for this machine learning includes n-gram (n is 1 or more) in the morpheme unit of the template, the type of the variable included in the template, the order of appearance of the variable, the frequency of each variable, and the variable included in the template. In addition to this, a total number or the like may be added as a feature amount such as a ratio with the type of information obtained from the sensor information.

また、テンプレートランキング部16におけるテンプレートのランキング学習として、RNNを用いた判別手法のスコアに基づきランキングを行うアルゴリズムで構成することができ、特にRNNの一つであるLSTMを利用できる。例えば、tweetの自動抽出手法(宮崎,鳥海,武井,山田,後藤、“ニュース制作に役立つtweetの自動抽出手法”、言語処理学会第23回年次大会(NLP2017),D4-1,2017年3月、URL:『http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/D4-1.pdf』参照)のアルゴリズムによるスコアでランキング、もしくは、その単位を文字単位から形態素単位に変更したアルゴリズムによるスコアでランキングする。   Further, the template ranking learning in the template ranking unit 16 can be configured by an algorithm that performs ranking based on the score of the discrimination method using RNN, and in particular, LSTM that is one of RNNs can be used. For example, an automatic extraction method of tweet (Miyazaki, Toriumi, Takei, Yamada, Goto, “Automatic extraction method of tweet useful for news production”, 23rd Annual Conference of Language Processing Society of Japan (NLP2017), D4-1, 20173 Month, URL: See http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/D4-1.pdf) ranking by algorithm score, or change unit from character unit to morpheme unit Ranking by the score of the algorithm.

また、テンプレートのランキング学習として、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位の警戒水位)毎にテンプレートのSVM学習を行うこともでき、このようなマルチクラスSVMは、各クラスに分類された原稿を用意し、更に素性にクラス(警戒水位の分類情報)を加えることで実現される。   In addition, as template ranking learning, SVM learning of templates can be performed for each of the four classes (water defense team standby water level, inundation warning water level, evacuation judgment water level, and flood warning water level). The class SVM is realized by preparing a document classified into each class and adding a class (warning water level classification information) to the feature.

最終的に、原稿生成部15は、ユーザーによって指定される原稿作成用センサー情報の受け付け時に、この原稿作成用センサー情報に対応するセンサー情報をセンサー情報蓄積部12から読み出し、読み出したセンサー情報を当該所定数のテンプレートに割り当てることによりセンサー情報に応じた所定数の原稿を自動生成し、原稿提示部17を経て図4に示す原稿自動作成UI上に提示する(ステップS6)。   Finally, when receiving the document creation sensor information designated by the user, the document generation unit 15 reads sensor information corresponding to the document creation sensor information from the sensor information storage unit 12, and reads the read sensor information. By assigning to a predetermined number of templates, a predetermined number of originals corresponding to the sensor information are automatically generated and presented on the automatic original creation UI shown in FIG. 4 via the original presentation unit 17 (step S6).

そして、ユーザーが最終決定した原稿に用いられたテンプレートは、使用実績としてテンプレートランキング部16へ通知され、以後のランキングの上位に位置するよう学習される。   Then, the template used for the manuscript finally determined by the user is notified to the template ranking unit 16 as a usage record, and is learned to be positioned higher in the ranking thereafter.

従って、本発明に係る原稿自動生成装置1は、センサー情報提供サーバ2から得られるセンサー情報と、実原稿データベース3に格納される過去の大量の実原稿を用いて、機械学習により自動でニュース原稿を生成することにより、迅速で正確な報道を実現することができる。そして、本発明に係る原稿自動生成装置1は、これまで人手でデータを分析してニュース原稿を生成していたコストを軽減することができる。   Accordingly, the automatic manuscript generation apparatus 1 according to the present invention uses a sensor information obtained from the sensor information providing server 2 and a large number of past actual manuscripts stored in the actual manuscript database 3 to automatically generate news manuscripts by machine learning. By generating, it is possible to achieve quick and accurate coverage. The automatic manuscript generation apparatus 1 according to the present invention can reduce the cost of manually generating a news manuscript by analyzing data manually.

尚、本実施形態の例では、全国各地に設置され公開観測値として得られる河川の水位を計測する水位計に関する情報をセンサー情報とする例を主として説明したが、地震の際の揺れを計測する地震計、気象、風速、風向、降水量、気圧、又は気温を計測する気象観測計などの情報をセンサー情報とすることができる。例えば、4段階のクラス(水防団待機水位、氾濫注意水位、避難判断水位、及び氾濫危険水位)について、例えば5段階の震度と置き換えることで地震の際の揺れを計測する地震計に関する情報をセンサー情報とすることができる。同様に、気象観測計の情報についても、それぞれの警戒レベルを示す閾値を基にクラス分けすることができる。   In the example of the present embodiment, the example of using sensor information as information on a water level meter that measures the water level of a river that is installed throughout the country and obtained as a public observation value has been described. Information such as a seismometer, weather, wind speed, wind direction, precipitation, atmospheric pressure, or a meteorological instrument that measures temperature can be used as sensor information. For example, sensor information on seismometers that measure shaking during an earthquake by substituting it with, for example, five levels of seismic intensity for four levels of classes (water defense team standby level, flood warning level, evacuation judgment level, and flood risk level) It can be information. Similarly, the meteorological observation information can also be classified based on threshold values indicating the respective alert levels.

また、本実施形態の例では、N台のセンサー情報提供サーバ2‐1,…,2‐N、及び実原稿データベース3と通信可能な単一装置として、本発明に係る原稿自動生成装置1を構成する例を説明したが、例えば図5に示すように、センサー情報監視部11、センサー情報蓄積部12、テンプレート生成部13、テンプレート蓄積部14、原稿生成部15、及びテンプレートランキング部16を備えるWebサーバとして機能する原稿自動生成サーバ1aと、原稿提示部17を備え原稿自動生成サーバ1aと連動するようネットワーク4を介して接続されるWeb端末として機能する原稿自動生成端末1bとにより構成することができる。   In the example of this embodiment, the automatic document generator 1 according to the present invention is used as a single device that can communicate with the N sensor information providing servers 2-1,..., 2-N and the actual document database 3. The configuration example has been described. For example, as shown in FIG. 5, the sensor information monitoring unit 11, the sensor information storage unit 12, the template generation unit 13, the template storage unit 14, the document generation unit 15, and the template ranking unit 16 are provided. An automatic document generation server 1a that functions as a Web server, and an automatic document generation terminal 1b that functions as a Web terminal that includes the document presentation unit 17 and is connected via the network 4 so as to be linked to the automatic document generation server 1a. Can do.

従って、本発明に係る原稿自動生成装置1を単一装置としてのコンピュータ、或いはWeb端末にユーザーインターフェースを提示するWebサーバとしてのコンピュータとして構成することができ、当該コンピュータに、本発明に係る各構成要素を実現させるためのプログラムは、当該コンピュータの内部又は外部に備えられるメモリ(図示せず)に記憶される。当該コンピュータに備えられる中央演算処理装置(CPU)などの制御で、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、メモリから読み込んで、本発明に係る原稿自動生成装置1の各構成要素の機能をコンピュータに実現させることができる。   Therefore, the automatic document generation apparatus 1 according to the present invention can be configured as a computer as a single apparatus or a computer as a Web server that presents a user interface to a Web terminal. A program for realizing the elements is stored in a memory (not shown) provided inside or outside the computer. A program in which processing content for realizing the function of each component is described is appropriately read from a memory under the control of a central processing unit (CPU) provided in the computer, and automatic document generation according to the present invention is performed. The function of each component of the device 1 can be realized by a computer.

本発明は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。例えば、上述した実施形態の例では、原稿自動生成装置1における原稿生成部15が、原稿提示部17によるユーザーインターフェース(図4に示す原稿自動作成UI)を経てユーザーによって指定される原稿作成用センサー情報(観測地点又は履歴生データの選択指定)の受け付け時に原稿を自動生成する例を説明したが、センサー情報監視部11が、監視しているセンサー情報に更新があると検知した際にその旨を原稿生成部15に通知し、この通知を受け付けた原稿生成部15が当該更新されたセンサー情報に係る原稿を自動生成する構成とすることもできる。   The present invention is not limited to the above-described exemplary embodiments, but is limited only by the description of the scope of claims. For example, in the example of the embodiment described above, the document generation unit 15 in the automatic document generation apparatus 1 is a document generation sensor designated by the user via the user interface (automatic document generation UI shown in FIG. 4) by the document presentation unit 17. Although an example in which a document is automatically generated when information (observation point or history raw data selection specification) is received has been described, when the sensor information monitoring unit 11 detects that the monitored sensor information is updated, that fact The document generation unit 15 may be notified, and the document generation unit 15 that receives the notification may automatically generate a document related to the updated sensor information.

本発明によれば、所定のセンサー情報と過去の実原稿とを用いて、機械学習により自動でニュース原稿を生成することができるので、人手によるコストを削減しつつ迅速で正確な報道を実現することを要する用途に有用である。   According to the present invention, since a news manuscript can be automatically generated by machine learning using predetermined sensor information and a past actual manuscript, quick and accurate reporting can be realized while reducing human costs. It is useful for applications that require

1 原稿自動生成装置
1a 原稿自動生成サーバ(Webサーバ)
1b 原稿自動生成端末(Web端末)
2,2‐1,…,2‐N センサー情報提供サーバ
3 実原稿データベース
4 ネットワーク
11 センサー情報監視部
12 センサー情報蓄積部
13 テンプレート生成部
14 テンプレート蓄積部
15 原稿生成部
16 テンプレートランキング部
17 原稿提示部
171 原稿編集部
171a 選択ボタン
172 原稿用生データ参照部
173 履歴生データ参照部
174 観測日指定部
174a 入力欄
174b 最新データボタン
175 クラス別地域提示部
175a,175b,175c,175d チェックボックス
176 地域別クラス提示部
176a 地域指定ボタン
177a 観測地点指定ボタン
177 順位別観測地点提示部
178 観測地点地図表示部
178a 観測地点指定ボタン
178b 拡大縮小ボタン
178c 航空写真表示ボタン
179 観測推移表示部
180 原稿出力部
1 Automatic Document Generation Device 1a Automatic Document Generation Server (Web Server)
1b Automatic document generation terminal (Web terminal)
2,2-1, ..., 2-N Sensor information providing server 3 Actual document database 4 Network 11 Sensor information monitoring unit 12 Sensor information storage unit 13 Template generation unit 14 Template storage unit 15 Document generation unit 16 Template ranking unit 17 Document presentation Section 171 Document editing section 171a Selection button 172 Document raw data reference section 173 History raw data reference section 174 Observation date designation section 174a Input field 174b Latest data button 175 Class-specific area presentation section 175a, 175b, 175c, 175d Check box 176 Area Separate class presentation part 176a Area designation button 177a Observation point designation button 177 Observation point presentation part by rank 178 Observation point map display part 178a Observation point designation button 178b Enlargement / reduction button 178c Aerial view display Tan 179 observation transition display unit 180 manuscript output section

Claims (7)

全国各地に設置され公開観測値として得られる所定のセンサー情報を基に、機械学習により自動でニュース原稿を生成する原稿自動生成装置であって、
全国各地に設置され公開観測値として得られる所定のセンサー情報をセンサー情報提供サーバから自動収集し、センサー情報蓄積部に蓄積するよう監視するセンサー情報監視手段と、
過去の実原稿を蓄積する実原稿データベースから、前記所定のセンサー情報に応じた実原稿を定期的に自動取得し、取得した実原稿の変数部分を固有表現抽出技法により特定し、実原稿毎のテンプレートを自動生成してテンプレート蓄積部に自動的に蓄積するテンプレート生成手段と、
前記センサー情報蓄積部に蓄積されるセンサー情報に少なくとも含まれる観測地点及び観測日時を基にユーザーに対し原稿作成用センサー情報を指定させるユーザーインターフェースを提示する原稿提示手段と、
前記ユーザーインターフェースを経て前記原稿作成用センサー情報のユーザー指定の受け付け時に、当該原稿作成用センサー情報に対応するセンサー情報を前記センサー情報蓄積部から読み出すとともに、ランキング別に得られる所定数のテンプレートを前記テンプレート蓄積部から読み出し、読み出したセンサー情報を当該所定数のテンプレートに割り当てることにより当該原稿作成用センサー情報に応じた所定数の原稿を自動生成し、前記原稿提示部を経て前記ユーザーインターフェース上に提示する原稿生成手段と、
前記原稿生成手段による制御により、当該ユーザーによって指定される原稿作成用センサー情報に関して、過去の実原稿を基にして生成され前記テンプレート蓄積部に蓄積されたテンプレートのうち、いずれのテンプレートが最も良いかを機械学習によりランキングして選別し、選別した所定数のテンプレートを前記原稿生成手段に出力するテンプレートランキング手段と、
を備えることを特徴とする原稿自動生成装置。
An automatic manuscript generator that automatically generates news manuscripts by machine learning based on predetermined sensor information that is installed throughout the country and obtained as public observations.
Sensor information monitoring means for monitoring to be automatically collected from the sensor information provision server and stored in the sensor information storage unit, which is set up in various parts of the country and obtained as public observation values.
A real manuscript corresponding to the predetermined sensor information is automatically and periodically acquired from a real manuscript database that stores past real manuscripts, and a variable portion of the obtained real manuscript is specified by a specific expression extraction technique. Template generation means for automatically generating a template and automatically storing it in a template storage unit;
Manuscript presenting means for presenting a user interface that allows the user to specify manuscript creation sensor information based on at least observation points and observation dates / times included in the sensor information accumulated in the sensor information accumulating unit;
Upon receiving a user designation of the document creation sensor information via the user interface, sensor information corresponding to the document creation sensor information is read from the sensor information storage unit, and a predetermined number of templates obtained by ranking are read from the template A predetermined number of manuscripts corresponding to the manuscript creation sensor information are automatically generated by reading out from the storage unit and assigning the read sensor information to the predetermined number of templates, and presenting it on the user interface via the manuscript presentation unit. Manuscript generation means;
Which template is the best of the templates generated based on the past actual manuscript and stored in the template accumulating unit with respect to the manuscript creation sensor information specified by the user under the control of the manuscript generator? Template ranking means for ranking and sorting by machine learning, and outputting a predetermined number of sorted templates to the document generating means;
An apparatus for automatically generating a document.
前記センサー情報は、観測地点、観測日時、観測地点における観測値、前記観測値に対するクラスを示す閾値を少なくとも含むことを特徴とする、請求項1に記載の原稿自動生成装置。   The automatic document generator according to claim 1, wherein the sensor information includes at least an observation point, an observation date and time, an observation value at the observation point, and a threshold value indicating a class for the observation value. 前記テンプレートランキング手段は、機械学習のスコアに基づきランキングするアルゴリズムで構成されていることを特徴とする、請求項1又は2に記載の原稿自動生成装置。   The automatic document generation device according to claim 1, wherein the template ranking unit includes an algorithm that ranks based on a machine learning score. 前記原稿提示手段は、
前記ユーザーインターフェース上に、前記原稿生成手段によって自動生成した所定数の原稿をユーザーによって当該ランキング別に、且つ編集可能に提示する手段と、
前記ユーザーインターフェース上に提示する自動生成した原稿に対応するセンサー情報の生データを参照可能に提示する手段と、
ユーザーによって最終決定された原稿に用いられたテンプレートは使用実績として以後のランキングの上位に位置するよう学習するべく前記テンプレートランキング手段へ通知する手段と、
を有することを特徴とする、請求項1から3のいずれか一項に記載の原稿自動生成装置。
The manuscript presentation means includes
Means for presenting a predetermined number of originals automatically generated by the original generation means on the user interface in a ranking and editable manner by the user;
Means for presenting the raw data of sensor information corresponding to the automatically generated manuscript presented on the user interface in a referable manner;
Means for notifying the template ranking means to learn that the template used for the manuscript finally determined by the user is positioned higher in the subsequent ranking as a usage record;
The automatic document generator according to any one of claims 1 to 3, wherein the automatic document generator is provided.
前記原稿提示手段は、前記センサー情報に少なくとも含まれる観測地点、観測日時、観測地点における観測値、前記観測値に対するクラスを示す閾値を基に、ユーザーに対し、前記観測値に対するクラスの指定、前記観測日時の指定、前記観測地点の指定、前記観測地点を示す地域の指定、当該指定した地域に関して前記クラスによって順位付けした観測地点の指定、或いは、当該指定したクラスの地域について当該指定した観測日時から所定日時までの遡る履歴を示す範囲でセンサー情報の生データのファイル名の指定を可能とする表示を前記ユーザーインターフェース上に提示することを特徴とする、請求項1から4のいずれか一項に記載の原稿自動生成装置。   The manuscript presentation means, based on at least an observation point included in the sensor information, an observation date and time, an observation value at the observation point, and a threshold value indicating a class for the observation value, specifies a class for the observation value, Designation of observation date and time, designation of the observation point, designation of the area indicating the observation point, designation of observation points ranked by the class with respect to the designated area, or the designated observation date and time for the area of the designated class 5. A display that enables designation of a file name of raw data of sensor information within a range indicating a history going back to a predetermined date and time is presented on the user interface. 6. The automatic document generator described in 1. 前記原稿提示手段は、
前記ユーザーインターフェース上に、当該所定のセンサー情報に関してユーザーが指定した地域について、該地域における観測地点を地図上に表示するか、航空写真で表示するか、或いは前記地図上の表示又は航空写真の表示に重ねて、他のセンサー情報として得られる情報を表示する手段と、
当該指定日時に到る所定範囲の観測推移のデータを表示する手段と、
を備えることを特徴とする、請求項1から5のいずれか一項に記載の原稿自動生成装置。
The manuscript presentation means includes
On the user interface, for an area designated by the user with respect to the predetermined sensor information, an observation point in the area is displayed on a map, an aerial photograph, or a display on the map or an aerial photograph display Means for displaying information obtained as other sensor information,
Means for displaying observation transition data in a predetermined range up to the designated date and time;
The automatic document generator according to any one of claims 1 to 5, further comprising:
請求項1から6のいずれか一項に記載の原稿自動生成装置をコンピュータとして機能させるためのプログラム。   A program for causing the automatic document generator according to any one of claims 1 to 6 to function as a computer.
JP2017097369A 2017-05-16 2017-05-16 Manuscript automatic generator and program Active JP6920104B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017097369A JP6920104B2 (en) 2017-05-16 2017-05-16 Manuscript automatic generator and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017097369A JP6920104B2 (en) 2017-05-16 2017-05-16 Manuscript automatic generator and program

Publications (2)

Publication Number Publication Date
JP2018195006A true JP2018195006A (en) 2018-12-06
JP6920104B2 JP6920104B2 (en) 2021-08-18

Family

ID=64570364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017097369A Active JP6920104B2 (en) 2017-05-16 2017-05-16 Manuscript automatic generator and program

Country Status (1)

Country Link
JP (1) JP6920104B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160975A (en) * 2019-03-27 2020-10-01 Nttテクノクロス株式会社 Document creation support device, document creation support method, and program
JP7228937B1 (en) 2022-02-17 2023-02-27 株式会社Jx通信社 Information processing device, program and information processing method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010022469A (en) * 2008-07-16 2010-02-04 Taiyo Elec Co Ltd Game machine
JP2012008839A (en) * 2010-06-25 2012-01-12 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method for generating introduction, development, turn, and conclusion type story, and program thereof
JP2013120547A (en) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd Discourse summary template creation system and discourse summary template creation program
JP2015153261A (en) * 2014-02-17 2015-08-24 株式会社デンソーアイティーラボラトリ Dialogue sentence generating device, dialogue sentence generating method, and program
US20150261745A1 (en) * 2012-11-29 2015-09-17 Dezhao Song Template bootstrapping for domain-adaptable natural language generation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010022469A (en) * 2008-07-16 2010-02-04 Taiyo Elec Co Ltd Game machine
JP2012008839A (en) * 2010-06-25 2012-01-12 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method for generating introduction, development, turn, and conclusion type story, and program thereof
JP2013120547A (en) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd Discourse summary template creation system and discourse summary template creation program
US20150261745A1 (en) * 2012-11-29 2015-09-17 Dezhao Song Template bootstrapping for domain-adaptable natural language generation
JP2015153261A (en) * 2014-02-17 2015-08-24 株式会社デンソーアイティーラボラトリ Dialogue sentence generating device, dialogue sentence generating method, and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
村上 聡一朗 外3名: "数値予報マップからの天気予報コメントの自動生成", 言語処理学会第23回年次大会 発表論文集 [ONLINE], JPN6021024707, 6 March 2017 (2017-03-06), JP, pages 1121 - 1124, ISSN: 0004538216 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160975A (en) * 2019-03-27 2020-10-01 Nttテクノクロス株式会社 Document creation support device, document creation support method, and program
JP7228937B1 (en) 2022-02-17 2023-02-27 株式会社Jx通信社 Information processing device, program and information processing method
JP2023119614A (en) * 2022-02-17 2023-08-29 株式会社Jx通信社 Information processing device, program and information processing method

Also Published As

Publication number Publication date
JP6920104B2 (en) 2021-08-18

Similar Documents

Publication Publication Date Title
Seibert et al. Virtual staff gauges for crowd-based stream level observations
US20110153368A1 (en) User Interactive Reinsurance Risk Analysis Application
JP6094132B2 (en) Disaster information management apparatus, disaster information system, disaster information management method, disaster information management program, portable terminal, portable terminal control method, and control program for controlling portable terminal operation
Hoque et al. Assessing tropical cyclone impacts using object-based moderate spatial resolution image analysis: a case study in Bangladesh
JP6374341B2 (en) Crisis management information sharing apparatus, crisis management information sharing method, and crisis management information sharing program
KR101965598B1 (en) APPARATUS AND METHOD for DETECTING DATA OUTLIERS IN FRAUN DETECTION SYSTEM
CN107092694B (en) Data quality inspection task generation method and device
Kwon et al. Risk analysis and visualization for detecting signs of flood disaster in Twitter
Pontius Jr et al. Methods to summarize change among land categories across time intervals
JP6920104B2 (en) Manuscript automatic generator and program
Dittrich et al. Is this twitter event a disaster?
Rennie Providing information on environmental change: Data management, discovery and access in the UK Environmental Change Network Data Centre
Kadochnikov et al. Prototype of city environmental monitoring system based on geoportal technologies
Hall et al. USACE coastal and hydraulics laboratory quality controlled, consistent measurement archive
Peek et al. Understanding the controls on storm surge through the building of a national storm surge database
JP6664698B2 (en) Seismic intensity information providing device and seismic intensity information providing method
Kang et al. New categorical metrics for air quality model evaluation
JP7191620B2 (en) DISASTER INFORMATION MANAGEMENT DEVICE, DISASTER INFORMATION MANAGEMENT SYSTEM AND DISASTER INFORMATION MANAGEMENT METHOD
Kosar et al. Aurorasaurus database of real‐time, crowd‐sourced aurora data for space weather research
Osorio et al. Development of data collecting system for forecasting with meteorological sensors
JP2016224710A (en) Analysis system, analysis method and analysis program
KR101835778B1 (en) Apparatus and method for providing public data open interface
Hohmann Review of Early Warning Dissemination in Media and Assessment of Flood Early Warning Systems in Media: A case study in West Africa
KR102249726B1 (en) Disaster Monitoring System, Method Using Crowd Sourcing, and Computer Program therefor
Gunther Data Stewardship Maturity Report for NCEI/WDS Natural Hazards Image Database

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210726

R150 Certificate of patent or registration of utility model

Ref document number: 6920104

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250