JP2021096548A

JP2021096548A - データ処理システム及びデータ処理方法

Info

Publication number: JP2021096548A
Application number: JP2019226120A
Authority: JP
Inventors: 田井　光春; Mitsuharu Tai; 光春田井; 純古谷; Jun Furuya
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-12-16
Filing date: 2019-12-16
Publication date: 2021-06-24

Abstract

【課題】定性的な指標も含めて、例えばまちの状態等を的確に可視化する指標を自動的に生成し、それを最適化していく特性を備えたデータ処理装置を提供する。【解決手段】演算装置と、記憶装置と、通信装置と、を有するデータ処理システムであって、記憶装置は、複数のデータを保持し、演算装置は、取得したテキストデータを参照して、入力されたテキストと、その他のテキストとの相関関係を抽出し、記憶装置に保持された複数のデータのうち、入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータから、入力されたテキストに対応する評価指標を算出するための演算仕様を生成し、生成した演算仕様に基づいて算出した評価指標を出力し、出力した評価指標に対する修正要求が入力されると、相関関係が所定の条件を満たすテキストに対応するデータから修正要求に基づいて修正された評価指標が算出されるように、演算仕様を修正する。【選択図】図１Ａ

Description

本発明は、情報通信、都市計画、及び行政サービス等に関する。

分野横断型の情報処理基盤の必要性が高まっている。国内では、非特許文献１及び非特許文献２で記載されるとおり、政府主導で、ＩＣＴ（information and communication technology）技術を最大限に活用することによって、新しい産業、社会変革を誘導し、生活の質を向上するいわゆる超スマート社会の実現に向けた取組みをSociety 5.0と銘打ち、これを世界に先駆けて遂行する旨提言されている。

例えば都市計画の分野では、あらゆるＩＣＴを駆使することによって、行政サービスの充実及び地域の高付加価値化に貢献し、ステークホルダーの合意形成をサポートする、データ駆動型都市計画手法の構築及び普及が注目されている。従来の都市計画は行政主導の、経験と感覚、もしくはある定まった手法に基づいたものが多く、ステレオタイプのトップダウン的な住民には受け入れにくい事例や、効果がはっきりしない事例、あるいは、有効であっても、経験的、計画者依存的で継承されない事例が殆どである。Society 5.0が掲げるビジョンの下、本分野では、街づくりをデータドリブンで進めることによって、有効かつ暮らすヒトの受容性が高い事例を積み上げる仕組みを構築することが重要となる。

都市計画に必要となるであろうデータは、経済活動を示すデータ、交通流、不動産情報のデータ、水利データ、暮らしやすさ等アンケート等で取得するような定性的なデータなど枚挙に暇がない。これらのデータを活用して得られる情報に関しても、街の状態や施策の効果を可視化する指標（卑近な例では地方の税収額、観光地の収入額、建物やイベントの動員数、データの項で挙げた交通流自体や交通流の渋滞状況、物流など）も多岐に亘る。

特に施策効果の可視化では、時間、時刻の影響も重要な因子であり、これらを有効に処理できる分野横断型の情報処理基盤構築が重要である。

米国特許出願公開第２０１４／０１８８４４９号明細書米国特許出願公開第２００８／０１７２３４８号明細書

Society 5.0実現による日本再興、［ｏｎｌｉｎｅ］、２０１７年２月１４日、日本経済団体連合会資料、［２０１９年６月６日検索］、インターネット＜ＵＲＬ：http://www.keidanren.or.jp/policy/2017/010_gaiyo.pdf＞原山優子, Society 5.0がめざすのは人間中心の新しい社会,

日立評論 vol.99 pp.8-13. (2017)
張峻屹, 小林敏生，健康増進に寄与するまちづくりのための健康関連QOLの調査および因果構造分析, 日本都市計画学会都市計画論文集，2012 年 47 巻 3 号 pp. 277-282 中居隆, テキストマイニング（データマイニング）技術紹介, 特許庁技術懇話会誌 2009.1.30. no.252

データ駆動型都市計画手法の目的は、現状の都市の状態の把握のための可視化、および、政策、施策に対する効果の可視化である。目的のために重要なのは、可視化のための指標(KPI:key performance indicator)群の選定と、これに寄与するデータ群の特定、関係解析である。殆どの場合、それぞれのＫＰＩは、一般的には、複数種のデータ群、および他のＫＰＩ、更には自身の過去の履歴と時間的、空間的に相関を持ちながら変化する。

現状の都市の状態は、例えば非特許文献３に記載されているように、取扱いを簡単にするために、限定種の入力による単純化したモデルから近似的に目的のＫＰＩを導出する手法がとられてきた。この場合、直接的で、緩和時間が短いＫＰＩについては、実際と良い一致を確認できる場合が多いが、そのようなＫＰＩの例はごく希である。間接、輻輳的、定性的なもの、あるいは緩和時間が長いＫＰＩの例が殆どであり、実際との一致をみることは困難で利用されないことが多い。

さらに単純化したモデルの策定では、恣意的に、もしくは議論の中で寄与するデータ群を選択し、因果関係を洗い出してＫＰＩを特定、策定している。したがって、定性的で数値化が難しい、あるいは、あまりに複雑に因果関係が絡んでいるために単純化できない指標については追跡しきれず、精度を欠いた指標化がなされていた。また、寄与するデータ群策定の過程で想定しないデータは、決して組み入れられることがない。

これらの課題は特に、質的なＫＰＩを可視化する際に顕在化する。都市が暮らしの場と捉えた場合、質的なＫＰＩは都市の状態を可視化する重要な因子となる。

以上の背景から、分野横断型の情報処理基盤には、下記の属性を付与することが必要となる。（１）（初期の）ＫＰＩを、質的なものも含め、データベースで根拠立てて人力に頼らず、自動で設定できる、（２）ＫＰＩに寄与するデータ群を、データベースで根拠立てて人力に頼らず、自動で策定できる、（３）（初期の）ＫＰＩを、利用者が実情（感覚）にあった指標値に変更できて、変更以降は、ＫＰＩに寄与するデータ群を入力すれば、変更値を予測できるように演算を修正することができる。

例えば、特許文献１、２などでは、分野横断型の都市経営用途の情報処理基盤の構成が記載されている。これらの基盤の構成、機能ブロックの範疇内でＫＰＩを可視化するためには、ＫＰＩの決定因子（入力データ）と、それら入力からのＫＰＩの導出過程が明らかになっていることが前提であり、この構成の下では、上記（１）−（３）の属性（特に（１）と（３）の属性）を付与することはできない。

上記（１）から（３）の要件を備えるデータ処理システムとして、以下の解決手段を示す。

すなわち、演算装置と、記憶装置と、通信装置と、を有するデータ処理システムであって、前記記憶装置は、複数のデータを保持し、前記演算装置は、前記通信装置を介して取得したテキストデータを参照して、入力されたテキストと、その他のテキストとの相関関係を抽出し、前記記憶装置に保持された複数のデータのうち、前記入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータから、前記入力されたテキストに対応する評価指標を算出するための演算仕様を生成し、前記生成した演算仕様に基づいて算出した前記評価指標を出力し、前記出力した評価指標に対する修正要求が入力されると、前記相関関係が所定の条件を満たすテキストに対応するデータから前記修正要求に基づいて修正された前記評価指標が算出されるように、前記演算仕様を修正することを特徴とする。

本発明の一態様によれば、定性的な指標も含めて、例えばまちの状態等を的確に可視化する指標が自動的に生成され、その指標が、使う人の目的に合うように、使う人によって最適化されていくシステムが、データベースで構築できるようになる。

その結果、データ駆動型都市計画手法に用いるデータ処理装置として好適なものを供給することが可能となる。

上記した以外の課題、構成、及び効果は、以下の実施形態の説明によって明らかにされる。

本発明の実施例のデータ処理装置の構成機能の一例を示すブロック図である。本発明の実施例のデータストレージサーバのハードウェア構成の一例を示すブロック図である。本発明の実施例のクローリング・テキストマイニングサーバのハードウェア構成の一例を示すブロック図である。本発明の実施例の演算器サーバのハードウェア構成の一例を示すブロック図である。本発明の実施例のデータ処理装置によるクレンジング後の格納データの例を示す説明図である。本発明の実施例のデータストレージサーバが、可視化したいＫＰＩの策定時に実行するシーケンスを示すフローチャートである。本発明の実施例のデータストレージサーバが、可視化したいＫＰＩの策定時に実行するシーケンスを示すフローチャートである。本発明の実施例におけるクローリングとテキストマイニングによってｗｅｂサイトから抽出した対象テキストと、これに相関するテキスト群との仮想的な相関図である。本発明の実施例における対象テキストとこれに相関するテキスト群との仮想的な相関図に閾値を設定した例を示す説明図である。本発明の実施例のクローリング・テキストマイニングサーバが、可視化したいＫＰＩの策定時に実行するシーケンスを示すフローチャートである。本発明の実施例の演算器サーバがＫＰＩを算出する際に実行するシーケンスを示すフローチャートである。本発明の実施例において可視化されたＫＰＩを模式的に示す説明図である。本発明の実施例における相関関係の改訂のフローを概念的に示す説明図である。本発明の実施例における相関関係の改訂の処理を示すフローチャートである。本発明の実施例において、可視化したいＫＰＩ群が策定できた後の、ＫＰＩ導出の処理を示すフローチャートである。

以下で本発明の実施形態を図面を用いて説明する。図面では本発明の内容の具体的な実施例を示すが、これらは本発明の理解のための例であり、本発明が図面の範疇で限定されるものではない。

図１Ａは、本発明の実施例のデータ処理装置の構成機能の一例を示すブロック図である。

本実施例のデータ処理装置１００は、データストレージサーバ１１０と、クローリング・テキストマイニングサーバ１２０と、演算器サーバ１３０と、の３つの主要サーバから構成される。

図１Ｂは、本発明の実施例のデータストレージサーバ１１０のハードウェア構成の一例を示すブロック図である。

データストレージサーバ１１０は、例えば、図１Ｂに示す計算機システムによって構成される。具体的には、データストレージサーバ１１０は、通信バス１５２−１を介して相互に接続されたプロセサ（演算器）１５１−１、データストレージ１５３−１、入力機能１５４−１、出力機能１５５−１、外付けのデータストレージ１５６−１及び通信機能１５７−１を有する。

プロセサ１５１−１は、データストレージ１５３−１に格納されたプログラムに従って種々の処理を実行する。以下の説明においてデータストレージサーバ１１０が実行する処理は、実際には、プロセサ１５１−１がデータストレージサーバ１１０内の各部を制御することによって実現する。

データストレージ１５３−１は、プロセサ１５１−１によって実行されるプログラム、プロセサ１５１−１が実行する処理において参照されるデータ、及び、プロセサ１５１−１が実行した処理の結果として生成されたデータ等を格納する機能を有する。データストレージ１５３−１には、例えば、後述するクレンジングデータ等が格納される。データストレージ１５３−１は、例えば、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）等のメモリ及びハードディスク（ＨＤ）又はフラッシュメモリ等のデータストレージを含んでもよい。

入力機能１５４−１は、利用者からデータストレージサーバ１１０への情報の入力を受ける機能であり、例えば、入力インタフェース（ＩＦ）と、それに接続されたキーボード、マウスおよびタッチパネルの少なくともいずれかと、によって実現される。

出力機能１５５−１は、利用者に情報を出力する機能であり、例えば、ビデオ（ＶＤ）アダプタと、モニタおよびスピーカの少なくともいずれかと、によって実現される。

外付けのデータストレージ１５６−１は、例えば、デジタルバーサタイルディスク（ＤＶＤ）、ユニバーサルシリアルバス（ＵＳＢ）メモリまたは外付けのＨＤ等と、それらに対するデータの読み書きを行うドライバと、を含んでもよい。データストレージサーバ１１０は、実行する処理のために必要なデータを外付けのデータストレージ１５６−１から読み込んでもよいし、処理によって生成されたデータを外付けのデータストレージ１５６−１に書き込んでもよい。

通信機能１５７−１は、ワイドエリアネットワーク（ＷＡＮ）１５８またはローカルエリアネットワーク（ＬＡＮ）１５９を介して外部装置と通信する機能であり、例えば入力ＩＦおよびネットワークアダプタ等を含んでもよい。通信する対象の外部装置は、例えば、外部パーソナルコンピュータ（ＰＣ）（図示省略）、後述するセンサ１４３、後述するインターネット１４７、演算器サーバ１３０、クローリング・テキストマイニングサーバ１２０及び後述するデータセンタ１４０等である。

後述するＩＦ１４４の機能は、例えば、入力機能１５４−１および出力機能１５５−１によって実現されてもよいし、外部ＰＣによって実現されてもよい。

データストレージサーバ１１０は、必要があれば、上記以外の構成要素を有してもよいし、必要がなければ上記の構成要素の一つ以上を有しなくてもよい。例えば、データストレージサーバ１１０は、必要がなければ、外付けのデータストレージ１５６−１を有しなくてもよい。

図１Ｃは、本発明の実施例のクローリング・テキストマイニングサーバ１２０のハードウェア構成の一例を示すブロック図である。

クローリング・テキストマイニングサーバ１２０は、例えば、図１Ｃに示す計算機システムによって構成される。具体的には、クローリング・テキストマイニングサーバ１２０は、通信バス１５２−２を介して相互に接続されたプロセサ１５１−２、データストレージ１５３−２、入力機能１５４−２、出力機能１５５−２、外付けのデータストレージ１５６−２及び通信機能１５７−２を有する。これらは、図１Ｂに示した通信バス１５２−１を介して相互に接続されたプロセサ１５１−１、データストレージ１５３−１、入力機能１５４−１、出力機能１５５−１、外付けのデータストレージ１５６−１及び通信機能１５７−１と同様のものであってよいため、以下に特記する点を除いて、詳細な説明を省略する。

プロセサ１５１−２は、データストレージ１５３−２に格納されたプログラムに従って種々の処理を実行する。以下の説明においてクローリング・テキストマイニングサーバ１２０が実行する処理は、実際には、プロセサ１５１−２がクローリング・テキストマイニングサーバ１２０内の各部を制御することによって実現する。

データストレージ１５３−２は、プロセサ１５１−２によって実行されるプログラム、プロセサ１５１−２が実行する処理において参照されるデータ、及び、プロセサ１５１−２が実行した処理の結果として生成されたデータ等を格納する機能を有する。データストレージ１５３−２には、例えば、後述する基本相関データおよび相関データ等が格納される。

通信機能１５７−２による通信の対象の外部装置は、例えば、外部ＰＣ（図示省略）、インターネット１４７、データストレージサーバ１１０および演算器サーバ１３０等である。

後述するＩＦ１４５の機能は、例えば、入力機能１５４−２および出力機能１５５−２によって実現されてもよいし、外部ＰＣによって実現されてもよい。

図１Ｄは、本発明の実施例の演算器サーバ１３０のハードウェア構成の一例を示すブロック図である。

演算器サーバ１３０は、例えば、図１Ｄに示す計算機システムによって構成される。具体的には、演算器サーバ１３０は、通信バス１５２−３を介して相互に接続されたプロセサ１５１−３、データストレージ１５３−３、入力機能１５４−３、出力機能１５５−３、外付けのデータストレージ１５６−３及び通信機能１５７−３を有する。これらは、図１Ｂに示した通信バス１５２−１を介して相互に接続されたプロセサ１５１−１、データストレージ１５３−１、入力機能１５４−１、出力機能１５５−１、外付けのデータストレージ１５６−１及び通信機能１５７−１と同様のものであってよいため、以下に特記する点を除いて、詳細な説明を省略する。

プロセサ１５１−３は、データストレージ１５３−３に格納されたプログラムに従って種々の処理を実行する。以下の説明において演算器サーバ１３０が実行する処理は、実際には、プロセサ１５１−３が演算器サーバ１３０内の各部を制御することによって実現する。

データストレージ１５３−３は、プロセサ１５１−３によって実行されるプログラム、プロセサ１５１−３が実行する処理において参照されるデータ、及び、プロセサ１５１−３が実行した処理の結果として生成されたデータ等を格納する機能を有する。データストレージ１５３−３には、例えば、後述するＫＰＩ演算仕様およびそれに基づく演算結果等が格納される。

通信機能１５７−３による通信の対象の外部装置は、例えば、外部ＰＣ（図示省略）、データストレージサーバ１１０およびクローリング・テキストマイニングサーバ１２０等である。

後述するＩＦ１４６の機能は、例えば、入力機能１５４−３および出力機能１５５−３によって実現されてもよいし、外部ＰＣによって実現されてもよい。

本実施例では上記のようにデータストレージサーバ１１０、クローリング・テキストマイニングサーバ１２０および演算器サーバ１３０がそれぞれ独立した計算機によって実現される。このため、データ処理装置１００は、複数の計算機からなるデータ処理システムと読み替えてもよい。しかし、このような構成は一例であり、上記の任意の二つ、または全部が一つの計算機によって実現されてもよい。

再び図１Ａを参照して説明する。データストレージサーバ１１０は、所謂クレンジング機能およびストレージ機能を有している。クレンジング機能は、データセンタ１４０に格納されたデータ、データストレージサーバ１１０に直接繋がったセンサ群１４３からのデータ、および、インターフェース（ＩＦ）１４４を介してデータ提供者に入力されたデータを収集し、演算器サーバでデータ処理できるようデータを加工する機能である。なお、データセンタ１４０には、例えば、データセンタ１４０に繋がったセンサ群１４１からのデータ、および、ＩＦ１４２を介してデータ提供者に入力されたデータが格納される。ストレージ機能は、クレンジング機能によって加工されたデータ（すなわちクレンジングデータ）を格納する機能である。

クレンジング機能は、データクレンジングの際、各データに対してタイトリングのデータを所定の書式で追記し、クレンジングデータとして格納する。簡単な例で表記すると、例えば総人口の場合は、“population of xx area”などのテキストデータを取得データに付記する。追記されるデータはこの例のようにダイレクトな表記である必要はなく、後に参照およびデータ選択に利用できるものであれば良い。例えば特定の記載ルールを策定し、これに従う表記を追記しても良い。例えば“ａ−３２”、“ａ−３３”（アルファベットはデータ種で、ａは人口、数字はエリアを示す）、“ｂ−１−４”、“ｂ−１−５”（アルファベットはデータ種で、ｂは電力使用量、真中の数値はビルのｉｄ、右端の数値は階を示す）などを追記してもよい。

図２は、本発明の実施例のデータ処理装置によるクレンジング後の格納データの例を示す説明図である。

先に記載したとおり、クレンジングの結果として、演算器サーバ１３０で処理できるデータが得られれば十分であるので、データの並びは図２に示した通りでなくてもよい。データフォーマットは、データ互換性の観点からテキストデータの形が望ましい。後述するようにエリアごとのＫＰＩ表記が多用されるため、図２の例ではエリア毎にデータを分け、時刻と対象データの２カラム構成とし、データタイトルもそれぞれ付記する例を示している。しかし、必ずしもこの例に倣う必要はなく、３カラム以上の構成とし、エリアはカラム毎に割り当てる形式を採用してもよい。

図２には、例として、二つの地域の人口と余暇時間のクレンジング後の格納データを示す。例えば、データ２０１は、ｘｘエリアという地域における人口のデータであり、「ｐｏｐｕｌａｔｉｏｎｏｆｘｘａｒｅａ」というタイトルが付けられ、時刻（この例では年）と、対象データ（この例では人口）とが対応付けて格納されている。また、データ２０３は、ｘｘエリアにおける余暇時間のデータであり、「Ｌｅｉｓｕｒｅｔｉｍｅｏｆｘｘａｒｅａ」というタイトルが付けられ、時刻（この例では年）と、対象データ（この例では１カ月当たりの余暇時間）とが対応付けて格納されている。同様に、ｙｙエリアにおける人口のデータ２０２およびｙｙエリアにおける余暇時間のデータ２０４が格納される。

図２は一例であり、実際にはデータストレージサーバ１１０は種々のデータをクレンジングして上記と同様の形式のデータを作成して格納することができる。

データストレージサーバ１１０は、後述のクローリング・テキストマイニングサーバ１２０へ、データストレージサーバ１１０が保有するデータのタイトリングのリストを転送し、逆にクローリング・テキストマイニングサーバ１２０から、演算に使用するデータのタイトリングのリストの供給を受ける。データストレージサーバ１１０は、クローリング・テキストマイニングサーバ１２０から供給されたリストを参照しながら、演算に必要なデータ群を選択し、演算器サーバ１３０にデータを転送する。

図３及び図４は、本発明の実施例のデータストレージサーバ１１０が、可視化したいＫＰＩの策定時に実行するシーケンスを示すフローチャートである。

データクレンジング（図３）、及びＫＰＩ算出時のデータセレクティング（図４）の独立した２種のフローがあり、最初は、図３から図４へシーケンシャルにフローが進むが、それ以降はパラレルにフローを進めても良い。初回以降の図３のフローは、ストレージするデータのアップデートに相当する。

図３において時系列のタイムステップは統一されていることが理想的である。統一されたタイムステップの限りではない時系列データに関しては、データストレージサーバ１１０は、統一されたタイムステップになる様、データを間引く、あるいは補間する。データの補間方法は特に指定はなく、統一しても良いし、データの性質にあわせ適宜選択することにしても良い。統一されたタイムステップは、得られるデータの最小タイムステップにするのが単純で良いが、複数の規格を設けるなど任意に設定してもよい。例えば、エリアの面積など、時系列データではないデータについては、データストレージサーバ１１０は、タイムステップを付与し、擬似的に時系列データに加工する。

図３には、図２の例にしたがって加工する際のフローを記載している。ストレージに格納されるデータは、｛データ名、時刻、データ｝の対で再構成されたものである。データ名は、主に格納データの利用の際の検索のタグとして機能する。これとは別に、タグのみを纏めたデータ名リストを格納する。これらは新しいデータが追加されるたびに更新される。

ここで、図３のフローをステップごとに説明する。最初に、データストレージサーバ１１０は、外部データを読み込む（ステップ３０１）。外部データとは、例えば、センサ１４１もしくはＩＦ１４２からデータセンタ１４０を介してデータストレージサーバ１１０が取得したデータ、または、センサ１４３もしくはＩＦ１４４からデータストレージサーバ１１０が直接取得したデータである。

次に、データストレージサーバ１１０は、読み込んだ外部データが時系列データかを判定する（ステップ３０２）。例えば読み込んだ外部データがｘｘエリアの年ごとの人口のデータである場合、時系列データである（ステップ３０２：ＹＥＳ）。この場合、データストレージサーバ１１０は、読み込んだ外部データを分解して（ステップ３０３）、再結合する（ステップ３０４）。

これによって、例えば、「ｐｏｐｕｌａｔｉｏｎｏｆｘｘａｒｅａ」といったデータ名と、「１９００」といった時刻（この例では年）と、「２１２９４」といったデータ（この例では人口）と、の対の、例えば１９００年から２０１９年までのリストが作成され、ストレージに格納される（ステップ３０７）。

次に、データストレージサーバ１１０は、作成したデータ名（上記の例では「ｐｏｐｕｌａｔｉｏｎｏｆｘｘａｒｅａ」）をデータ名リストファイルに追加して（ステップ３０８）、それを新規データ名リストファイルとしてストレージに保存する（ステップ３０９）。そして、データストレージサーバ１１０は、保存したデータ名リストファイルをクローリング・テキストマイニングサーバ１２０に転送する（ステップ３１０）。

なお、ステップ３０１で読み込んだ外部データが、例えばｘｘエリアの面積など、時刻に応じて変化しないデータである場合、時系列データでないと判定される（ステップ３０２：ＮＯ）。この場合、データストレージサーバ１１０は、例えば、読み込んだｘｘエリアの面積を各年のｘｘエリアの面積として複製して（ステップ３０５におけるデータ分解）、ｘｘエリアの面積を示すデータ名と、時刻（例えば年）と、ｘｘエリアの面積と、の対のリストを生成して（ステップ３０６におけるデータ再結合）、ストレージに格納する（ステップ３０７）。

クローリング・テキストマイニングサーバ１２０では、後述のように、可視化したいＫＰＩの入力となるべきデータが特定され、それらのデータ名がＫＰＩ導出データリストとしてリスト化される。図４に示すように、クローリング・テキストマイニングサーバ１２０から、可視化したいＫＰＩについてのＫＰＩ導出データリストがデータストレージサーバ１１０に転送される（ステップ４０１）。

その後、ＫＰＩの入力値を演算器サーバ１３０に入力するよう要請があると、データストレージサーバ１１０は、ストレージからデータ名リストを読み出し（ステップ４０２）、ＫＰＩ導出データリストに記載されたデータ名をタグにしながら、ストレージに格納された該当データを選択する。

例えば、データストレージサーバ１１０は、ステップ４０２で読みだしたデータ名リスト（すなわちデータストレージサーバ１１０が保持しているデータのリスト）と、ステップ４０１で転送されたデータ名リストとを比較して、両方のリストに記載されているデータ名のリストを作成する（ステップ４０３）。そして、データストレージサーバ１１０は、そのリストを参照してストレージに格納されているデータ（すなわちそのリストに含まれるデータ名に対応するデータ）を選択する（ステップ４０４）。

その後、データストレージサーバ１１０は、これらを演算器サーバの入力データとして転送する。

再び図１Ａを参照して説明する。クローリング・テキストマイニングサーバ１２０は、インターネット１４７を介して、外部のｗｅｂサーバ（図示省略）をクローリングする機能と、ウェブサイトから特定の対象テキスト（名詞に相当する単語）を検索、及び関連するテキスト（これも名詞に相当する単語）をピックアップする、所謂テキストマイニングの機能と、を有する。更に、クローリング・テキストマイニングサーバ１２０は、ピックアップしたテキストの頻度、および関連の頻度を統計処理し、相関の強さ、および相関の距離を算出する機能を持つ。

利用者（解析者）は、ＩＦ１４５を介して、ＫＰＩ化したい事象を表現するテキストを入力する。例えば“幸福度”または“余暇時間“といった対象テキストを入力する。クローリング・テキストマイニングサーバ１２０は、クローリングとテキストマイニングによって、対象テキストを検索し、対象テキストに関連するテキスト群をピックアップする。

ピックアップしたテキスト群の対象テキストに対する相関の強さ、および相関の距離の決定ルールは、例えば、単純に対象テキストの前後にあるピックアップテキストの頻出度で相関の強さを決め、対象テキストと、ピックアップテキストとの間に何個のテキストがあるかで相関の距離を決める、といった単純なルールであってもよい。あるいは、近年発展している機械学習を活用して、文脈から相関の強さ、相関の距離を決定するルールであってもよい。その他、任意のルールを適用することができる。例えば非特許文献４などには、特許マップ作成の自動化を一例としたテキストマイニングの施行例が紹介されている。

図５は、本発明の実施例におけるクローリングとテキストマイニングによってｗｅｂサイトから抽出した対象テキスト（すなわち可視化したいＫＰＩ）と、これに相関するテキスト群との仮想的な相関図である。

図５には、可視化したいＫＰＩの例として“まちの賑わい”に関する相関図を示す。この相関図において、結線の太さは相関の強さを示したものである。図５では、例えばピックアップテキストの一つである“インフラ充実度”は、“まちの賑わい”と太い線で直接接続されている。これは、両者の相関が強く、相関の距離も近いことを示している。一方、別のピックアップテキストの一つである“バス路線数”は、“インフラ充実度”を介して、“まちの賑わい”と太い線で接続されている。これは、“バス路線数”と“まちの賑わい”との相関は強いが、相関の距離は“インフラ充実度”に対して２倍遠いことを示している。“公園規模”は上記の２つのピックアップテキストに比べて“まちの賑わい”との相関は弱く、距離も遠い。

クローリング・テキストマイニングサーバ１２０は、可視化するしないに関係なく、膨大なｗｅｂデータから、図５のような仮想的な相関図を策定する。テキストマイニングにおいて先に述べた機械学習を適用し、文脈の意味を自動解析できる機能を付加してもよい。これによって、相関の強さに時間の要素を組みこんだり、同意語となるテキストを考慮したりする（例えば、“まちの繁栄度”、“賑やかさ”、“騒がしさ”などからも相関を解析する）などができるようになり、より豊かで精度良い解析を行なうことができる。

本実施例のクローリング・テキストマイニングサーバ１２０では、利用者（解析者）が、上記相関の強さ、及び相関の距離のしきい値を設定することができる。

図６は、本発明の実施例における対象テキストとこれに相関するテキスト群との仮想的な相関図に閾値を設定した例を示す説明図である。

具体的には、図６は、図５の相関図において、相関の強さα以上、相関の距離が２以下という閾値を設定した場合に出力される相関図を示している。本機能の効果は、入力すべきデータの候補が絞られるので、演算器部分の計算負担が減ると同時に、どの入力が可視化したいＫＰＩに効いてくるのか判別しやすくなるため、まちの課題と、解決方法（施策）を見出し易くなることである。実際の利用に際しては、データ候補をなるべく絞れる様、しきい値を高めに設定し、計算結果を観ながら徐々にしきい値を下げて複雑な相関を探索、設定していくことになる。

図７は、本発明の実施例のクローリング・テキストマイニングサーバ１２０が、可視化したいＫＰＩの策定時に実行するシーケンスを示すフローチャートである。

利用者（解析者）が、ＫＰＩ化したい事象を表現するテキスト（例えば“まちの賑わい”）と、相関図の相関強度および相関距離の設定値とを入力することによって、フローが開始される（ステップ７０１）。図７のフローには、入力されたテキストの類似または同義テキストを選定し、それらに基づいてマイニングで参照する定義テキスト群を規定する行程（ステップ７０２）も含めている。

例えば、クローリング・テキストマイニングサーバ１２０は、ＫＰＩ化したい事象を表現するテキストとして“まちの賑わい”が入力された場合、そのテキストに加えて“まちの活気”、“まちの元気度”といった類似又は同義テキストを含むテキスト群をマイニングで参照する定義テキスト群として規定してもよい。このような類似又は同義テキストの選定は、利用者が手動で行ってもよいし、任意の方法で自動で行われてもよい。

クローリング・テキストマイニングサーバ１２０は、定義テキスト群を参照し、ｗｅｂサイトをクローリングし、サイト内のテキストマイニングによって相関図を策定する（ステップ７０３）。この相関図は、例えば、ＫＰＩ化したい事象を表現するテキストと、それに相関するテキストのリストと、それらの相関関係（例えば相関の強さ及び距離）と、を含む。その一例が図５に示した相関図である。

ここで、相関図の相関強度と距離の閾値が入力された場合（ステップ７０４）、クローリング・テキストマイニングサーバ１２０は、閾値を用いて相関図を加工してもよい。その一例が図６に示した相関図である。

クローリング・テキストマイニングサーバ１２０は、策定した相関図を一旦サーバのストレージに基本相関データとして格納する（ステップ７０５）。基本相関データは、後にクローリング・テキストマイニングサーバ１２０のＩＦを介して参照可能であり（ステップ７０６）、データストレージサーバ１１０に取り込むデータの不足分を追加するなどのために活用できるようになっている。

クローリング・テキストマイニングサーバ１２０は、基本相関データをストレージに格納するとともに、データストレージサーバ１１０にデータ名リストの提供の要求を発信する。発信を受けたデータストレージサーバ１１０は、データ名リストをクローリング・テキストマイニングサーバ１２０に提供する。

クローリング・テキストマイニングサーバ１２０は、ストレージから基本相関データを読み込み（ステップ７０６）、さらに、データストレージサーバ１１０からデータ名リストを取得すると（ステップ７０７）、基本相関データ中の相関するテキストリストと、データ名リストとの照合を行い、両リストに記載されたテキスト、すなわち、現時点でシステムが扱える入力値を同定し、これらのみを残した相関データを再構成する（ステップ７０８）。再構成した相関データは、｛ＫＰＩ、相関するテキストリスト（入力可能な入力データ名）、相関関係（入力可能なもののみ残したもの）｝の対で構成されるものであるが、クローリング・テキストマイニングサーバ１２０は、これを更に｛ＫＰＩ、相関するテキストリスト｝をＫＰＩ導出データリスト、｛ＫＰＩ、相関関係｝をＫＰＩ演算仕様としてストレージに格納する（ステップ７０９）。これらは、基本相関データと同様に後で参照することができる。さらに、クローリング・テキストマイニングサーバ１２０は、ＫＰＩ導出データリストをデータストレージサーバ１１０へ転送し、図４のフローを通して入力データを演算器サーバ１３０に入力する（ステップ７１０）。加えて、クローリング・テキストマイニングサーバ１２０は、ＫＰＩ演算仕様を演算器サーバ１３０へ転送する（ステップ７１１）。

図８は、本発明の実施例の演算器サーバ１３０がＫＰＩを算出する際に実行するシーケンスを示すフローチャートである。

演算器サーバ１３０は、データストレージサーバ１１０で選択された演算に必要なデータ群を入力として受ける（ステップ８０１）。これは、図４のステップ４０５において転送されたものである。さらに、演算器サーバ１３０は、クローリング・テキストマイニングサーバ１２０で策定されたＫＰＩ演算仕様の入力を受ける（ステップ８０２）。これは、図７のステップ７１１において転送されたものである。

演算器サーバ１３０は、入力されたデータ群に対して、入力されたＫＰＩ演算仕様に従って演算し、可視化したいＫＰＩ値を計算結果として導出する（ステップ８０３）。演算器サーバ１３０は、算出したＫＰＩ値をＩＦ１４６に転送する（ステップ８０４）。転送されたＫＰＩ値は、ＩＦ１４６によって可視化され、利用者に提示される。

さらに、ＫＰＩ演算仕様は演算器サーバ１３０のストレージに格納される（ステップ８０５）。格納されたＫＰＩ演算仕様は、ＫＰＩを算出する毎に読み出され、算出に利用される。

本実施例の演算器サーバ１３０は、可視化したいＫＰＩを活用する利用者が、ＩＦ１４６を介して、ＫＰＩの修正要求（修正データの入力）を受けることができ、その修正値をもとに、相関関係を補正する機能を有していることが特徴である。

図９は、本発明の実施例において可視化されたＫＰＩを模式的に示す説明図である。

具体的には、図９（Ｂ）の実線は、演算器サーバ１３０にて、データストレージサーバ１１０から供給されたデータ群と、クローリング・テキストマイニングサーバ１２０によって策定された演算仕様と、に従って演算器サーバ１３０が演算し、可視化したＫＰＩ値を模式的に示した図である。この例は、図９（Ａ）に示すように、とある自治体の街区ａ〜ｃそれぞれの賑わい度の年次推移を可視化したものである。ここで、計算されたＫＰＩ値である、まちの賑わい度が、街区ａ及び街区ｃについては概ね住民の実感と合致しているが、街区ｂについては実感と合致しておらず、過小評価されているという感触を持った場合を想定する。この場合、例えば図９のように可視化されたＫＰＩを参照した利用者が、新たなＫＰＩ値を示す破線データを恣意的に引く。これが実感と合致するとした時、演算器サーバ１３０は、現状の供給データ群から、上記のように入力された恣意的なデータが算出されるように、ＫＰＩ演算仕様に含まれる相関関係を改訂する。

図１０Ａは、本発明の実施例における相関関係の改訂のフローを概念的に示す説明図である。

図１０Ａの最上段には、クローリング・テキストマイニングサーバ１２０によって絞りこまれた入力値（すなわち図８のステップ８０１で転送されたデータ値群）に対して、クローリング・テキストマイニングサーバ１２０によって決定された相関関係（例えば図８のステップ８０２で転送されたＫＰＩ演算仕様）を適用することで演算器サーバ１３０が計算した、街区ごとのまちの賑わい度の年次推移を示す。これは、図９（Ｂ）に実線で示したものである。

図１０Ａの中段には、利用者の手動によるデータ補正を示す。ここに示す街区ごとのまちの賑わい度の年次推移データの内、街区ｂのデータは、例えば、利用者の当該街区ｂの賑わい度の実感に合うように恣意的に校正された新データである。これは、図９（Ｂ）に示した破線データに相当する。

演算器サーバ１３０は、相関関係からＫＰＩを導出する機能ブロックに機械学習機能を有しており、利用者の要請に応じて、相関関係を改訂することが可能となっている。

図１０Ａの最下段に示すように、演算器サーバ１３０は、街区ｂの新データを教師データとし、データストレージサーバ１１０で選択された演算に必要なデータ群を入力値として、教師データが吐き出されるように機械学習する。学習後は、改定した相関関係を新しいＫＰＩ演算仕様としてストレージに上書きし、計算の度にこれを読み出してＫＰＩを算出し、可視化する。

上記の例において、教師データは、可視化したいＫＰＩを活用する利用者が恣意的に作成すると記載した。これは、作成したデータに対する客観的な根拠の有無が本発明では本質的ではないためである。本システムの運用側で、公平性または客観性を必要とする場合は、例えばデータの改訂ルールまたは改訂権限者の制限などのルール化でこれを担保してもよい。

一定期間の評価などを経て、新ＫＰＩに信頼性が担保されるようになれば、それを新しいＫＰＩとして活用するだけではなく、入力データのひとつとして、データストレージサーバ１１０に格納することも可能となる。

図１０Ｂは、本発明の実施例における相関関係の改訂の処理を示すフローチャートである。

演算器サーバ１３０は、これまでのＫＰＩ演算仕様１００１（例えば、図８のステップ８０２で転送されたＫＰＩ演算仕様、または、前回の相関関係の改定の処理において上書きされたＫＰＩ演算仕様）と、入力データ値群１００２と、が入力されると、それらに基づいて、対象ＫＰＩを算出する（ステップ１００３）。そして、演算器サーバ１３０は、算出したＫＰＩ値をＩＦ１４６に転送して可視化する（ステップ１００４）。これらの処理が、図１０Ａの最上段に示した処理に相当する。

次に、算出されたＫＰＩ値が実感と一致する時系列データかが判定される（ステップ１００５）。例えば、利用者が可視化されたＫＰＩ値を参照してそれが実感と一致するかを判断して、その結果をＩＦ１４６に入力してもよい。

算出されたＫＰＩ値が実感と一致しないと判定された場合（ステップ１００５：ＮＯ）、演算器サーバ１３０は、手動によるデータ補正によって教師データを作成する（ステップ１００６）。これは、図１０Ａにおいて、街区ｂについて算出されたＫＰＩ値が実感と一致しないと判定されたときに実行される中段の処理に相当する。

次に、演算器サーバ１３０は、入力データ値群１００７に基づいて、ステップ１００６で補正されたＫＰＩ値を算出するように、ＫＰＩ演算仕様を機械学習する（ステップ１００８）。入力データ値群１００７は、入力データ値群１００２と同じものである。この処理は、図１０Ａの最下段の処理に相当する。

その後、演算器サーバ１３０は、学習結果を新ＫＰＩ演算仕様として演算器サーバ１３０のストレージに上書きする（ステップ１００９）。

一方、算出されたＫＰＩ値が実感と一致すると判定された場合（ステップ１００５：ＹＥＳ）、ＫＰＩ演算仕様は更新されない。これは、図１０Ａの街区ａおよびｃのＫＰＩ値の場合に相当する。

図１１は、本発明の実施例において、可視化したいＫＰＩ群が策定できた後の、ＫＰＩ導出の処理を示すフローチャートである。

まず本発明のデータ処理装置１００に可視化したいＫＰＩの要求が転送される（ステップ１１０１）。要求の転送方法は、例えば、演算器サーバ１３０のＩＦ１４６を介して、利用者がＫＰＩをテキストで指定する方法、または、利用者がバッチ型プログラミングをＩＦ１４６を介して演算器サーバ１３０に実装し、逐次ＫＰＩを指定しながら、バッチ処理が進む方法などがある。

演算器サーバ１３０では、ストレージに格納されているＫＰＩ演算仕様の中から、該当の仕様をタグ検索して選出し（ステップ１１０２）、相関関係を読み込む（ステップ１１０３）。

要求は同時にクローリング・テキストマイニングサーバ１２０にも転送される。クローリング・テキストマイニングサーバ１２０は、ストレージに格納されているＫＰＩ導出データリストの中から、該当のリストをタグ検索して選出し（ステップ１１０４）、これをデータストレージサーバ１１０へ転送する（ステップ１１０５）。転送を受けたデータストレージサーバ１１０は、図４に示すように、ＫＰＩ導出データリストを参照してストレージからデータを選択し（ステップ１１０６）、選択したデータを入力データ群として演算器サーバ１３０へ入力する（ステップ１１０７）。

演算器サーバ１３０は、入力データ群と、相関関係とから可視化したいＫＰＩの数値を算出し（ステップ１１０８）、ＩＦ１４６へ転送すると、ＩＦ１４６の一つである表示装置などが利用者に対しＫＰＩを可視化して提示する（ステップ１１０９）。さらに、演算器サーバ１３０は、算出したＫＰＩをストレージに格納する。

以上のように、本発明の一実施形態によれば、ＫＰＩ（質的なものも含め）をデータベースで根拠立てて設定できるようになる。そのデータベースはインターネットのウェブサイト及びツイート等を情報源にするため、相関関係は過去の不特定多数の経験積み上げから推論することと等価となる。テキストマイニングなどの手法を活用すれば、利用者の技能に依らずに既知、未知の好適ＫＰＩを抽出し、新たに定義することが可能となる。また、相関関係の重み、および、関連テキスト間の相関距離のしきい値を設けて制御できるようにすることが可能となるため、ＫＰＩ値の計算が発散したり、殆ど効かない因子を過大評価したりする懸念が排除できるようになる。また入力すべきデータが絞られるので、都市の課題と解決方法を見出し易くなる。更に、演算器サーバが、ユーザーによる定量指標の修正要求を受け、機械学習などの適用で相関関係を修正する機能を備えることで、ユーザーの感覚にあった指標値を得たり、予測したりすることができるようになる。

以上の属性を備えたデータ処理装置１００において、以上で記載した行程を継続的に繰り返すことで、定性的な指標も含めて、例えばまちの状態等を的確に可視化する指標が自動的に生成され、その指標が、使う人の目的に合うように、使う人によって最適化されていくシステムが、データベースで構築できるようになる。

以上の本発明の実施形態のうち代表的な例を列挙すれば、次の通りである。

（１）本発明の実施形態の一例のデータ処理システム（例えばデータ処理装置１００）は、演算装置（例えばプロセサ１５１−２〜１５１−３の少なくともいずれか）と、記憶装置（例えばデータストレージ１５３−１〜１５３−３および外付けのデータストレージ１５６−１〜１５６−３の少なくともいずれか）と、通信装置（例えば通信機能１５７−１〜１５７−３を実現する入力ＩＦおよびネットワークアダプタの少なくともいずれか）と、を有してもよい。記憶装置は、複数のデータ（例えばセンサ１４１、１４３等によって取得されたデータ、および、ＩＦ１４２、１４３を介して入力されたデータの少なくともいずれか）を保持してもよい。演算装置は、通信装置を介して取得したテキストデータ（例えばクローリング・テキストマイニングサーバによって参照されるテキストデータ）を参照して、入力されたテキスト（例えばＫＰＩ化したい事象を表現するテキスト）と、その他のテキストとの相関関係を抽出し、記憶装置に保持された複数のデータのうち、入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータから、入力されたテキストに対応する評価指標を算出するための演算仕様（例えばＫＰＩ演算仕様）を生成し、生成した演算仕様に基づいて算出した評価指標を出力し（例えば図８のステップ８０４、図１０Ａの最上段または図１０Ｂのステップ１００４）、出力した評価指標に対する修正要求が入力されると（例えば図１０Ａの中段または図１０Ｂのステップ１００６）、相関関係が所定の条件を満たすテキストに対応するデータから修正要求に基づいて修正された評価指標が算出されるように、演算仕様を修正してもよい（例えば図１０Ａの中段または図１０Ｂのステップ１００６）。

これによって、ＫＰＩ（質的なものも含め）をデータベースで根拠立てて設定できるようになる。また、ユーザーの感覚にあった指標値を得たり、予測したりすることができるようになる。

（２）ここで、記憶装置が保持する複数のデータは、それぞれ、時刻と対応付けられた時系列データ（例えば図２に示す格納データ）であってもよい。演算装置は、時系列データから、時刻に対応付けられた時系列の評価指標を算出するための演算仕様を生成してもよい。

これによって、変動するＫＰＩを適切に算出するための演算仕様を生成することができる。

（３）また、記憶装置が保持する複数のデータは、１以上のセンサ（例えばセンサ１４１および１４３）によって計測されたデータを含んでもよい。

これによって、各種のセンサデータからＫＰＩを適切に算出するための演算仕様を生成することができる。

（４）また、記憶装置が保持する複数のデータは、それぞれ、当該データの内容を示すタイトル情報（例えば図２に示すタイトリング）を含んでもよい。演算装置は、タイトル情報に基づいて、記憶装置に保持された複数のデータから、入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータを抽出してもよい。

これによって、テキストに対応するデータを適切に抽出することができる。

（５）また、演算装置は、入力されたテキストとの相関関係が所定の条件を満たすテキストのリストを生成し、生成したリストを記憶装置に格納し（例えば図７のステップ７０５）、生成したリストと記憶装置に保持された複数のデータのタイトル情報とを照合する（例えば図４のステップ４０３）ことによって、入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータを抽出してもよい。

これによって、テキストの相関関係に基づいてＫＰＩの算出に利用できると推定されるデータのうち、実際にシステムが保持しているデータを用いてＫＰＩを適切に算出するための演算仕様を生成することができる。

（６）また、演算装置は、入力されたテキストとその他のテキストとの相関関係として、入力されたテキストとその他のテキストとの相関の強さ及び相関の距離を抽出し、その他のテキストのうち、相関の強さ及び相関の距離が所定の条件を満たすテキストを、入力されたテキストとの相関関係が所定の条件を満たすテキストとして抽出してもよい（例えば図６）。

（７）また、所定の条件に相当する前記相関の強さ及び前記相関の距離が変更可能であってもよい（例えば図７のステップ７０４）。

これによって、ＫＰＩ値の計算が発散したり、殆ど効かない因子を過大評価したりする懸念が排除できるようになる。また入力すべきデータが絞られるので、都市の課題と解決方法を見出し易くなる。

（８）また、演算装置は、入力されたテキストとその類義テキストとを含むテキスト群を定義し（例えば図７のステップ７０２）、通信装置を介して取得したテキストデータを参照して、定義されたテキスト群と、その他のテキストとの相関関係を抽出し、記憶装置に保持された複数のデータのうち、定義されたテキスト群との相関関係が所定の条件を満たすテキストに対応するデータから、入力されたテキストに対応する評価指標を算出するための演算仕様を生成してもよい（例えば図７のステップ７０９）。

これによって、入力されたテキストの類義語も含めて、テキストの相関関係を抽出して、ＫＰＩを適切に算出するための演算仕様を生成することができる。

（９）また、通信装置を介して取得したテキストデータは、演算装置（例えばクローリング・テキストマイニングサーバ１２０のプロセサ１５１−２）が、通信装置を介してクローリングを行うことによって取得したテキストデータであってもよい。

これによって、例えばインターネットのウェブサイト及びツイート等を情報源にすることができ、相関関係は過去の不特定多数の経験積み上げから推論することと等価となる。また、利用者の技能に依らずに既知、未知の好適ＫＰＩを抽出し、新たに定義することが可能となる。

（１０）また、演算装置は、修正要求に基づいて修正された評価指標を教師データとする機械学習によって、演算仕様を修正してもよい（例えば図１０Ａの最下段または図１０Ｂのステップ１００８）。

これによって、ユーザーの感覚にあった指標値を推定するための演算仕様を得ることができる。

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明のより良い理解のために詳細に説明したのであり、必ずしも説明の全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることが可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によってハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによってソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、不揮発性半導体メモリ、ハードディスクドライブ、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶デバイス、または、ＩＣカード、ＳＤカード、ＤＶＤ等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。

また、制御線及び情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線及び情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。

１００データ処理装置
１１０データストレージサーバ
１２０クローリング・テキストマイニングサーバ
１３０演算器サーバ
１４０データセンタ
１４１、１４３センサ
１４２、１４４、１４５、１４６インターフェース（ＩＦ）
１４７インターネット

Claims

演算装置と、記憶装置と、通信装置と、を有するデータ処理システムであって、
前記記憶装置は、複数のデータを保持し、
前記演算装置は、
前記通信装置を介して取得したテキストデータを参照して、入力されたテキストと、その他のテキストとの相関関係を抽出し、
前記記憶装置に保持された複数のデータのうち、前記入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータから、前記入力されたテキストに対応する評価指標を算出するための演算仕様を生成し、
前記生成した演算仕様に基づいて算出した前記評価指標を出力し、
前記出力した評価指標に対する修正要求が入力されると、前記相関関係が所定の条件を満たすテキストに対応するデータから前記修正要求に基づいて修正された前記評価指標が算出されるように、前記演算仕様を修正することを特徴とするデータ処理システム。
請求項１に記載のデータ処理システムであって、
前記記憶装置が保持する複数のデータは、それぞれ、時刻と対応付けられた時系列データであり、
前記演算装置は、前記時系列データから、時刻に対応付けられた時系列の前記評価指標を算出するための前記演算仕様を生成することを特徴とするデータ処理システム。
請求項２に記載のデータ処理システムであって、
前記記憶装置が保持する複数のデータは、１以上のセンサによって計測されたデータを含むことを特徴とするデータ処理システム。
請求項１に記載のデータ処理システムであって、
前記記憶装置が保持する複数のデータは、それぞれ、当該データの内容を示すタイトル情報を含み、
前記演算装置は、前記タイトル情報に基づいて、前記記憶装置に保持された複数のデータから、前記入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータを抽出することを特徴とするデータ処理システム。
請求項４に記載のデータ処理システムであって、
前記演算装置は、前記入力されたテキストとの相関関係が所定の条件を満たすテキストのリストを生成し、
前記生成したリストを前記記憶装置に格納し、
前記生成したリストと前記記憶装置に保持された複数のデータの前記タイトル情報とを照合することによって、前記入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータを抽出することを特徴とするデータ処理システム。
請求項１に記載のデータ処理システムであって、
前記演算装置は、前記入力されたテキストと前記その他のテキストとの相関関係として、前記入力されたテキストと前記その他のテキストとの相関の強さ及び相関の距離を抽出し、
前記その他のテキストのうち、前記相関の強さ及び前記相関の距離が所定の条件を満たすテキストを、前記入力されたテキストとの相関関係が所定の条件を満たすテキストとして抽出することを特徴とするデータ処理システム。
請求項６に記載のデータ処理システムであって、
前記所定の条件に相当する前記相関の強さ及び前記相関の距離が変更可能であることを特徴とするデータ処理システム。
請求項１に記載のデータ処理システムであって、
前記演算装置は、
前記入力されたテキストとその類義テキストとを含むテキスト群を定義し、
前記通信装置を介して取得したテキストデータを参照して、前記定義されたテキスト群と、その他のテキストとの相関関係を抽出し、
前記記憶装置に保持された複数のデータのうち、前記定義されたテキスト群との相関関係が所定の条件を満たすテキストに対応するデータから、前記入力されたテキストに対応する評価指標を算出するための演算仕様を生成することを特徴とするデータ処理システム。
請求項１に記載のデータ処理システムであって、
前記通信装置を介して取得したテキストデータは、前記演算装置が、前記通信装置を介してクローリングを行うことによって取得したテキストデータであることを特徴とするデータ処理システム。
請求項１に記載のデータ処理システムであって、
前記演算装置は、前記修正要求に基づいて修正された前記評価指標を教師データとする機械学習によって、前記演算仕様を修正することを特徴とするデータ処理システム。
演算装置と、記憶装置と、通信装置と、を有するデータ処理システムが実行するデータ処理方法であって、
前記記憶装置は、複数のデータを保持し、
前記データ処理方法は、
前記演算装置が、前記通信装置を介して取得したテキストデータを参照して、入力されたテキストと、その他のテキストとの相関関係を抽出する手順と、
前記演算装置が、前記記憶装置に保持された複数のデータのうち、前記入力されたテキストとの相関関係が所定の条件を満たすテキストに対応するデータから、前記入力されたテキストに対応する評価指標を算出するための演算仕様を生成する手順と、
前記演算装置が、前記生成した演算仕様に基づいて算出した前記評価指標を出力する手順と、
前記演算装置が、前記出力した評価指標に対する修正要求が入力されると、前記相関関係が所定の条件を満たすテキストに対応するデータから前記修正要求に基づいて修正された前記評価指標が算出されるように、前記演算仕様を修正する手順と、を含むことを特徴とするデータ処理方法。