JP2017182544A - 情報抽出装置、情報抽出方法、およびプログラム - Google Patents
情報抽出装置、情報抽出方法、およびプログラム Download PDFInfo
- Publication number
- JP2017182544A JP2017182544A JP2016070380A JP2016070380A JP2017182544A JP 2017182544 A JP2017182544 A JP 2017182544A JP 2016070380 A JP2016070380 A JP 2016070380A JP 2016070380 A JP2016070380 A JP 2016070380A JP 2017182544 A JP2017182544 A JP 2017182544A
- Authority
- JP
- Japan
- Prior art keywords
- information
- road
- construction
- update
- road construction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 69
- 238000010276 construction Methods 0.000 claims abstract description 176
- 239000000284 extract Substances 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 4
- 230000002093 peripheral effect Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000008520 organization Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000009193 crawling Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 効率的に道路更新に関する情報を抽出することが可能な、情報処理装置等を提供する。【解決手段】 情報抽出装置1は、Web上のリソースから道路工事に関する情報(道路工事関連情報20)を収集し、道路更新に関する情報(道路更新情報30)を抽出する。そして、情報抽出装置1は、抽出した道路更新情報30に基づいて、利用者端末3に情報提供を行う。道路工事関連情報20とは、第1には、各公共団体がWeb上で公開している道路工事の工事入札公告に関する情報(工事入札情報20A)である。また道路工事関連情報20とは、第2には、任意のソーシャルメディアの投稿記事やコメントなどから収集される道路工事に関する情報(ソーシャル情報20B)である。【選択図】図1
Description
本発明は、情報抽出装置、情報抽出方法、およびプログラムに関し、特に、道路更新に関する情報を抽出する技術に関する。
近年、カーナビゲーションやマンナビゲーションをはじめ様々な分野において、地理空間情報を活用したサービスが広がっている。この中で、道路構造や道路利用ルールの変化(道路の新規供用、車線拡幅、交差点改良などの構造変化を伴う変化の他、信号機、街灯、防音壁の設置などによる変化や、道路標示(車線の白線など)、道路標識の変更など)が生じた(または生じる)ことを伝える情報(以下、道路更新情報)は、地理空間情報を活用したサービスを提供する各業者にとって、利用価値の高い情報である。
ところで、従来から、道路更新情報の収集は、道路管理者への問合せ、現地調査、調査車両等を用いた計測などにより行われている。しかしながら、このような収集方法は、多くの手間と時間を要するため、効率的ではない。
本発明は、前述した問題点に鑑みてなされたものであり、その目的とすることは、効率的に道路更新に関する情報を抽出することが可能な、情報抽出装置、情報抽出方法、およびプログラムを提供することである。
前述した目的を達成するための第1の発明は、道路工事に関する情報を収集する収集手段と、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、を備えることを特徴とする情報抽出装置である。第1の発明によれば、収集した道路工事に関する情報に基づいて、道路更新に関する情報を自動で抽出する、情報抽出装置が提供される。これにより、効率的に道路更新に関する情報を抽出することが可能となる。
また第1の発明において、前記収集手段は、道路工事の入札に関する情報を収集し、前記抽出手段は、前記情報を解析して、道路更新に関する情報を抽出して
もよい。ここで、道路工事の入札に関する情報(工事入札情報)とは、少なくとも、工事入札公告、工事発注見通し、及び工事実績を含む情報のことをいう。これにより、例えば、各公共団体がWeb上で公開している工事入札情報から、道路更新に関する情報を抽出するので、行政主体で行われる全ての道路工事を把握できる。また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。
もよい。ここで、道路工事の入札に関する情報(工事入札情報)とは、少なくとも、工事入札公告、工事発注見通し、及び工事実績を含む情報のことをいう。これにより、例えば、各公共団体がWeb上で公開している工事入札情報から、道路更新に関する情報を抽出するので、行政主体で行われる全ての道路工事を把握できる。また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。
また第1の発明において、前記収集手段は、任意のソーシャルメディアから道路工事に関する情報を収集し、前記抽出手段は、前記情報を解析して、道路更新に関する情報を抽出してもよい。これにより、例えば、民間機関が実施する道路工事についての道路更新に関する情報を把握できる。
また第1の発明において、道路更新の有無を既知とする道路工事に関する情報に基づいて学習生成された、道路更新の有無を判別する判別器を有し、前記抽出手段は、前記判別器を用いて、道路更新を伴う道路工事を特定し、当該道路工事についての道路更新に関する情報を抽出することが望ましい。これにより、判別器を用いて道路更新を伴う道路工事を特定するので、好適に道路更新に関する情報を抽出できる。
また第1の発明において、前記道路更新に関する情報は、道路更新が生ずる場所に関する情報、道路更新の日時に関する情報、道路更新の種別に関する情報、の少なくともいずれかであることが望ましい。これにより、道路更新に関する
情報の詳細を得ることができる。
情報の詳細を得ることができる。
また第1の発明において、前記抽出手段により抽出した道路更新に関する情報に基づいて、情報抽出装置とネットワーク接続された利用者端末に情報提供を行う情報提供手段を更に備えるようにしてもよい。これにより、例えば、利用者(地図作成業者など)は、提供された情報に基づいて、効率的に地図データの更新作業を行うことができる。
このとき、前記収集手段は、道路工事に関する情報に付随する付随情報を更に収集し、前記提供手段は、前記付随情報を併せて提供することが望ましい。これにより、利用者は、道路更新に関する内容を、より詳細に把握することができる。
このとき、前記収集手段は、道路工事に関する情報に付随する付随情報を更に収集し、前記提供手段は、前記付随情報を併せて提供することが望ましい。これにより、利用者は、道路更新に関する内容を、より詳細に把握することができる。
また第1の発明において、前記収集手段は、収集対象であるリソースに対して、テキスト解析を行い、道路工事に関連するキーワードを含み、かつ、道路工事に関連しないキーワードを含まない、前記リソースを道路工事に関する情報として収集することが望ましい。これにより、道路工事に関する情報を好適に収集することができる。
第2の発明は、道路工事に関する情報を収集する収集ステップと、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出ステップと、を含むことを特徴とする情報抽出方法である。第2の発明によれば、収集した道路工事に関する情報に基づいて、道路更新に関する情報を自動で抽出する、情報抽出方法が提供される。これにより、効率的に道路更新に関する情報を抽出することが可能となる。
また第2の発明において、前記収集ステップは、道路工事の入札に関する情報を収集し、前記抽出ステップは、前記情報に基づいて、道路更新情報を抽出してもよい。これにより、例えば、各公共団体がWeb上で公開している工事入札情報から、道路更新に関する情報を抽出するので、行政主体で行われる全ての道路工事を把握できる。また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。
また第2の発明において、前記収集ステップは、任意のソーシャルメディアから道路工事に関する情報を収集し、前記抽出ステップは、前記情報に基づいて、道路更新情報を抽出してもよい。これにより、例えば、民間機関が実施する道路工事についての道路更新に関する情報を把握できる。
第3の発明は、請求項1から請求項8のいずれかに記載の情報抽出装置として機能させることを特徴とするプログラムである。第3の発明に係るプログラムをコンピュータにインストールすることで、第1の発明に係る情報抽出装置が得られる。
本発明により、効率的に道路更新に関する情報を抽出することが可能な、情報処理装置、情報抽出方法、およびプログラムが提供される。
以下図面に基づいて、本発明の実施形態を詳細に説明する。
図1は、本実施形態に係る情報提供システム100の概要を示す図である。図に示すように、情報提供システム100は、情報抽出装置1と、情報抽出装置1とネットワーク接続された1以上の利用者端末3と、を備える。
情報抽出装置1は、例えば、Web上のリソースから道路工事に関する情報(道路工事関連情報20)を収集し、道路更新に関する情報(道路更新情報30)を抽出する。そして、情報抽出装置1は、抽出した道路更新情報30に基づいて、利用者端末3に情報を提供する。
Web上のリソースとは、Webサイトを構成する任意の情報(テキスト情報、画像情報、その他種々のデータファイル)を指す。また道路工事関連情報20とは、その一部または全部に、テキスト情報(またはテキスト化可能な情報)を含むデータとする。
図1は、本実施形態に係る情報提供システム100の概要を示す図である。図に示すように、情報提供システム100は、情報抽出装置1と、情報抽出装置1とネットワーク接続された1以上の利用者端末3と、を備える。
情報抽出装置1は、例えば、Web上のリソースから道路工事に関する情報(道路工事関連情報20)を収集し、道路更新に関する情報(道路更新情報30)を抽出する。そして、情報抽出装置1は、抽出した道路更新情報30に基づいて、利用者端末3に情報を提供する。
Web上のリソースとは、Webサイトを構成する任意の情報(テキスト情報、画像情報、その他種々のデータファイル)を指す。また道路工事関連情報20とは、その一部または全部に、テキスト情報(またはテキスト化可能な情報)を含むデータとする。
図2は、本実施形態に係る情報抽出装置1のハードウェア構成を示す図である。図に示すように、情報抽出装置1は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17から構成される。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。
CPUは、記憶部12、ROM、記憶媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス19を介して情報抽出装置1が行う全ての処理を実行する。
ROMは、不揮発性メモリであり、情報抽出装置1のブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部12、ROM、記憶媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
ROMは、不揮発性メモリであり、情報抽出装置1のブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部12、ROM、記憶媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
記憶部12は、通常はHDD(ハードディスクドライブ)から構成され、制御部11が実行するプログラム、プログラム実行に必要なデータ等が格納される。プログラムに関しては、OS(オペレーティングシステム)に相当する制御プログラムや、後述する情報抽出装置1の処理を実行するためのプログラム等が格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
記憶部12には、Web上のリソースを対象として、周期的に、道路工事に関する情報(道路工事関連情報20)、およびこれに付随する付随情報50を収集(クローリング)するプログラム(クローラ―)が格納されている。また、収集した道路工事関連情報20から、道路更新の有無を判別する判別器7が格納されている。
メディア入出力部13は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)のメディア入出力装置を有する。
通信制御部14は、通信制御装置、通信ポート等を有し、ネットワーク5を介してWeb上のリソースから道路工事情報20および付随情報50を収集し、また、利用者端末3とデータ通信(例えば、TCP/IPを用いた通信)を行う。
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキ―等の入力装置を有する。入力部15を介して、コンピュータに対して、操作指示、動作指示、データ入力等を行うことができる。
表示部16は、CRTモニタ、液晶パネル等のディスプレイ装置等を有する。
周辺機器I/F(インタフェース)部17は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部17を介してコンピュータは周辺機器とのデータ通信を行う。周辺機器I/F部17は、USBやIEEE1394やRS−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。
バス19は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
次に、図3のフローチャートを参照して、情報提供システム100(情報抽出装置1)の動作について説明する。
(道路工事関連情報および付随情報の収集)
まず、情報抽出装置1は、例えば、Web上のリソース(クローリングの対象)から、道路工事に関する情報である道路工事関連情報20を収集する(ステップS1)。クローリングの対象とするWeb上のリソース(Webサイト等)は、予め記憶部12に設定・保持されている。なお、道路工事関連情報20は、Web以外の一般公開されていない任意のリソースから、自動または手動にて収集し、記憶部12に記憶された情報でもよい。
まず、情報抽出装置1は、例えば、Web上のリソース(クローリングの対象)から、道路工事に関する情報である道路工事関連情報20を収集する(ステップS1)。クローリングの対象とするWeb上のリソース(Webサイト等)は、予め記憶部12に設定・保持されている。なお、道路工事関連情報20は、Web以外の一般公開されていない任意のリソースから、自動または手動にて収集し、記憶部12に記憶された情報でもよい。
ここで道路工事関連情報20とは、第1には、工事入札情報20A(図1参照)である。工事入札情報20Aとは、少なくとも、工事入札公告、工事発注見通し、及び工事実績を含む情報のことをいう。これらの情報の多くは、各公共団体がWeb上に公開している。工事入札公告等は、公的な工事を行う際に提供が法的に義務付けられている。このため、工事入札公告等によって行政主体で行われる全ての道路工事を把握できる。また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。
また道路工事関連情報20とは、第2には、ソーシャル情報20B(図1参照)である。ソーシャル情報20Bとは、任意のソーシャルメディア(Twitter、ブログ、Facebookなど)の投稿記事やコメントなどから収集される道路工事に関する情報のことをいう。前記した工事入札情報20Aでは、例えば、民間機関が実施する道路工事に関する情報を得ることができない。ソーシャル情報20Bを用いることで、工事入札情報20Aでは得られない道路工事に関する情報を網羅することができる。
公的機関および民間機関が実施する道路工事に関する情報を幅広く網羅する観点から、前記した工事入札情報20Aおよびソーシャル情報20Bの双方を道路工事関連情報20として収集するのが望ましいが、実施の目的に応じて工事入札情報20Aのみ、或いはソーシャル情報20Bのみを収集するのでもよい。
ステップS1において道路工事関連情報20(工事入札情報20A、及び/又は、ソーシャル情報20B)を収集する際、情報抽出装置1はクローリングの対象となる全てのリソースに対して、テキスト解析を行い、所定のキーワード条件を満たす前記リソースを道路工事関連情報20として収集する。キーワード条件は、例えば、道路工事に関連するキーワード(例えば「道」「線」「国」「号」など)を含み、かつ、道路工事に関連しないキーワード(例えば「水道」「排水」「照明」など)を含まない、などの条件である。これにより、道路工事に関する情報のみが効果的に収集され、後段(ステップS2)において、道路更新に関する情報を精度よく抽出することができる。また、全国の路線名や地名などの名称を登録した辞書を予め用意しておき、この辞書を用いて、収集する情報を更に絞り込んでもよい。なお、クローリングの対象となる全てのリソースを一旦収集した後に、収集したリソースに対して、テキスト解析を行い、所定のキーワード条件等を満たすリソースのみを道路工事関連情報20とするのでもよい。すなわち、情報を選別してから収集するか、或いは収集した後に情報を選別するか、の処理順序はいずれでもよい。
また、工事入札公告は、通常、HTMLで記述されWeb上に公開されている工事の概要情報と、PDFファイル等で公開されている工事の詳細情報と、の2つを含む。情報抽出装置1は、両者をテキストデータ化して工事入札情報20A(道路工事関連情報20)として収集する。
道路工事関連情報20(工事入札情報20A、及び/又は、ソーシャル情報20B)を収集後、情報抽出装置1は、収集した道路工事関連情報20を、各道路を識別する任意の識別情報(道路識別情報)と対応付けて、道路ごとにデータ分化した上で記憶部12に管理記憶する。道路識別情報とは、例えば、道路工事関連情報20(工事入札情報20A、及び/又は、ソーシャル情報20B)から抽出される道路の住所、緯度経度、路線名やリンクIDの位置情報などである。この道路識別情報に基づいて、収集した道路工事関連情報20を道路ごとにデータ分化する。なお道路工事関連情報20として、工事入札情報20Aとソーシャル情報20Bの2つの情報を収集した場合には、道路ごとにデータ分化された各情報(工事入札情報20Aとソーシャル情報20B)のうち、同じ道路に関する各情報(例えば、道路識別情報が一致する各情報)を1つのデータとして管理記憶する。これにより、同じ道路に関する工事入札情報20Aとソーシャル情報20Bの双方が正確に紐付くこととなる。
以降、道路工事関連情報20は、道路ごとにデータ分化されているものとして説明する。
以降、道路工事関連情報20は、道路ごとにデータ分化されているものとして説明する。
また情報抽出装置1は、道路工事関連情報20に加え、道路工事関連情報20に付随する付随情報50を更に収集し、道路工事関連情報20の各道路(道路識別情報)と紐づけて、記憶部12に記憶する。付随情報50とは、例えば、各公共団体のWebサイトに公開されている各道路工事に関する添付データ(工事報告書等に添付される工事現場の写真データや図面データ)である。これにより、道路工事の内容を、写真や図面とともに視覚的に把握できるデータが得られるため、現地での道路更新箇所の照合等が容易となる。また付随情報50は、道路工事関連情報20をテキスト解析して得られる道路識別情報等を検索キーワードとし、任意の検索エンジンを用いて検索される検索情報(検索URLや検索画像など)等であってもよい。
(道路更新情報の抽出)
続いて、情報抽出装置1は、ステップS1において収集した道路工事関連情報20を解析し、各道路について、道路更新に関する情報(以下、道路更新情報30)を抽出する。
続いて、情報抽出装置1は、ステップS1において収集した道路工事関連情報20を解析し、各道路について、道路更新に関する情報(以下、道路更新情報30)を抽出する。
まず、情報抽出装置1は、各道路工事について、道路更新の有無を判別する。これにより、道路更新を伴う(道路構造や道路利用ルールの変化が生ずる)道路工事が特定される。
具体的には、収集した道路工事関連情報20に対して、形態素解析を実施し、キーワードを抽出し、抽出したキーワードを判別器7に入力し、各道路工事について、道路更新の有無を判別する。
具体的には、収集した道路工事関連情報20に対して、形態素解析を実施し、キーワードを抽出し、抽出したキーワードを判別器7に入力し、各道路工事について、道路更新の有無を判別する。
ここで判別器7は、例えば次のような手順で、事前に機械学習により学習生成され、記憶部12に格納されている。
(手順1)多数の道路について、道路更新の有無を明らかとした道路工事関連情報を準備する。
(手順2)準備した道路工事関連情報に対して、形態素解析を実施し、語句(キーワード)を抽出する。このとき、道路更新に関連しない用語の影響による機械学習の精度低下を抑制するため、「名詞」および「サ変名詞」の語句のみを抽出する(但し、地名などの「固有名詞」は除外する)。
(手順3)抽出した語句(キーワード)と道路更新の有無の情報を学習用データセットとして、任意の機械学習法(例えばサポートベクターマシン、ニューラルネットワーク、ブースティング、ディープラーニングなど)により判別器7を学習させる。
(手順1)多数の道路について、道路更新の有無を明らかとした道路工事関連情報を準備する。
(手順2)準備した道路工事関連情報に対して、形態素解析を実施し、語句(キーワード)を抽出する。このとき、道路更新に関連しない用語の影響による機械学習の精度低下を抑制するため、「名詞」および「サ変名詞」の語句のみを抽出する(但し、地名などの「固有名詞」は除外する)。
(手順3)抽出した語句(キーワード)と道路更新の有無の情報を学習用データセットとして、任意の機械学習法(例えばサポートベクターマシン、ニューラルネットワーク、ブースティング、ディープラーニングなど)により判別器7を学習させる。
以上のような手順で学習生成された判別器7を用いて、情報抽出装置1は、各道路について、道路更新の有無を判別し、道路更新を伴う道路を特定する。
そして、情報抽出装置1は、道路工事関連情報20を更にテキスト解析し、特定された道路更新を伴う道路について、道路更新が生ずる場所に関する情報(「住所」等の情報)、道路更新の日時に関する情報(「工事完了日」等の情報)、道路更新の種別に関する情報(例えば「新設工事」「改良工事」など)などを道路更新情報30として抽出する。これらの情報は、予め定められた各道路更新情報の記載ルール(例えば、「住所」や「日付」等の記載ルール)と整合する道路工事関連情報20中のテキスト部分を特定することで、抽出される。
(情報の提供)
そして、情報抽出装置1は、ステップS2において抽出した道路更新情報30に基づいて、利用者端末3に情報提供を行う(ステップS3)。例えば、道路更新「有り」と判別された道路の住所一覧や道路更新の場所を明示した地図データを提供する。
そして、情報抽出装置1は、ステップS2において抽出した道路更新情報30に基づいて、利用者端末3に情報提供を行う(ステップS3)。例えば、道路更新「有り」と判別された道路の住所一覧や道路更新の場所を明示した地図データを提供する。
このとき、情報抽出装置1は、道路更新「有り」と判別された道路に関する付随情報50を記憶部12から取得し、この付随情報50を併せて提供することが望ましい。
以上、本実施形態によれば、情報抽出装置1が、Web上のリソースから道路工事関連情報20を収集し(ステップS1)、収集した道路関連情報20を解析して、道路更新情報30を抽出する(ステップS2)。そして、抽出した道路更新情報30に基づいて、利用者端末3に情報提供を行う(ステップS3)。これにより、従来のように、道路管理者への問合せ、現地調査、調査車両等を用いた計測など、人海戦術に頼った手法と比べ、効率的に道路更新情報を抽出し提供することができる。
また、道路工事関連情報20として、道路工事の工事入札公告に関する情報(工事入札情報20A)を採用すれば、行政主体で行われる全ての道路工事を把握でき、また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。また、道路工事関連情報20として、任意のソーシャルメディア(Twitter、ブログ、Facebookなど)の投稿記事やコメントなどから収集される道路工事に関する情報(ソーシャル情報20B)を採用すれば、民間機関が実施する道路工事について道路更新に関する情報を得ることができる。加えて、付随情報50を更に収集することで、道路更新に関する内容をより詳細に把握することができる。
なお、上記した工事入札情報20A、ソーシャル情報20B、付随情報50は、それぞれ独立に管理されるのではなく、道路を識別する道路識別情報と紐づけて統合的に管理される。これにより、特定の道路に関する道路更新情報30を、工事入札情報20Aおよびソーシャル情報20Bの双方に含まれる情報から抽出することができ、また、当該道路に紐づく付随情報50を道路更新情報30と併せて利用者に提供することができる。
なお、上記した工事入札情報20A、ソーシャル情報20B、付随情報50は、それぞれ独立に管理されるのではなく、道路を識別する道路識別情報と紐づけて統合的に管理される。これにより、特定の道路に関する道路更新情報30を、工事入札情報20Aおよびソーシャル情報20Bの双方に含まれる情報から抽出することができ、また、当該道路に紐づく付随情報50を道路更新情報30と併せて利用者に提供することができる。
以上、添付図面を参照しながら、本発明に係る好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1 :情報抽出装置
3 :利用者端末
5 :ネットワーク
7 :判別器
20 :道路工事関連情報
20A :工事入札情報
20B :ソーシャル情報
30 :道路更新情報
50 :付随情報
100 :情報提供システム
3 :利用者端末
5 :ネットワーク
7 :判別器
20 :道路工事関連情報
20A :工事入札情報
20B :ソーシャル情報
30 :道路更新情報
50 :付随情報
100 :情報提供システム
前述した目的を達成するための第1の発明は、道路工事に関する情報を収集する収集手段と、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、を備え、前記収集手段は、道路工事の入札に関する情報を収集
することを特徴とする情報抽出装置である。ここで、道路工事の入札に関する情報(工事入札情報)とは、少なくとも、工事入札公告、工事発注見通し、及び工事実績を含む情報のことをいう。これにより、例えば、各公共団体がWeb上で公開している工事入札情報から、道路更新に関する情報を抽出するので、行政主体で行われる全ての道路工事を把握できる。また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。
することを特徴とする情報抽出装置である。ここで、道路工事の入札に関する情報(工事入札情報)とは、少なくとも、工事入札公告、工事発注見通し、及び工事実績を含む情報のことをいう。これにより、例えば、各公共団体がWeb上で公開している工事入札情報から、道路更新に関する情報を抽出するので、行政主体で行われる全ての道路工事を把握できる。また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。
第2の発明は、道路工事に関する情報を収集する収集手段と、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、を備え、前記収集手段は、任意のソーシャルメディアから道路工事に関する情報を収集することを特徴とする情報抽出装置である。これにより、例えば、民間機関が実施する道路工事についての道路更新に関する情報を把握できる。
第3の発明は、道路工事に関する情報を収集する収集手段と、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、を備え、道路更新の有無を既知とする道路工事に関する情報に基づいて学習生成された、道路更新の有無を判別する判別器を有し、前記抽出手段は、前記判別器を用いて、道路更新を伴う道路工事を特定し、当該道路工事についての道路更新に関する情報を抽出することを特徴とする情報抽出装置である。これにより、判別器を用いて道路更新を伴う道路工事を特定するので、好適に道路更新に関する情報を抽出できる。
第4の発明は、道路工事に関する情報を収集する収集手段と、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、を備え、前記道路更新に関する情報は、道路更新が生ずる場所に関する情報、道路更新の日時に関する情報、道路更新の種別に関する情報、の少なくともいずれかであることを特徴とする情報抽出装置である。これにより、道路更新に関する情報の詳細を得ることができる。
第5の発明は、道路工事に関する情報を収集する収集手段と、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、を備え、前記抽出手段により抽出した道路更新に関する情報に基づいて、情報抽出装置とネットワーク接続された利用者端末に情報提供を行う情報提供手段を更に備えることを特徴とする情報抽出装置である。これにより、例えば、利用者(地図作成業者など)は、提供された情報に基づいて、効率的に地図データの更新作業を行うことができる。
このとき、前記収集手段は、道路工事に関する情報に付随する付随情報を更に収集し、前記情報提供手段は、前記付随情報を併せて提供することが望ましい。これにより、利用者は、道路更新に関する内容を、より詳細に把握することができる。
このとき、前記収集手段は、道路工事に関する情報に付随する付随情報を更に収集し、前記情報提供手段は、前記付随情報を併せて提供することが望ましい。これにより、利用者は、道路更新に関する内容を、より詳細に把握することができる。
第6の発明は、道路工事に関する情報を収集する収集手段と、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、を備え、前記収集手段は、収集対象であるリソースに対して、テキスト解析を行い、道路工事に関連するキーワードを含み、かつ、道路工事に関連しないキーワードを含まない、前記リソースを道路工事に関する情報として収集することを特徴とする情報抽出装置である。これにより、道路工事に関する情報を好適に収集することができる。
第7の発明は、道路工事に関する情報を収集する収集ステップと、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出ステップと、を含み、前記収集ステップは、道路工事の入札に関する情報を収集することを特徴とする情報抽出方法である。これにより、例えば、各公共団体がWeb上で公開している工事入札情報から、道路更新に関する情報を抽出するので、行政主体で行われる全ての道路工事を把握できる。また、工事着工前または工事実施中の早い段階から、将来の道路更新について把握することができる。
第8の発明は、道路工事に関する情報を収集する収集ステップと、収集した前記情報を解析して、道路更新に関する情報を抽出する抽出ステップと、を含み、前記収集ステップは、任意のソーシャルメディアから道路工事に関する情報を収集することを特徴とする情報抽出方法である。これにより、例えば、民間機関が実施する道路工事についての道路更新に関する情報を把握できる。
第9の発明は、請求項1から請求項7のいずれかに記載の情報抽出装置として機能させることを特徴とするプログラムである。第9の発明に係るプログラムをコンピュータにインストールすることで、第1〜第6の発明に係る情報抽出装置が得られる。
第3の発明は、請求項1または請求項2に記載の情報抽出装置として機能させることを特徴とするプログラムである。第3の発明に係るプログラムをコンピュータにインストールすることで、第1、第2の発明に係る情報抽出装置が得られる。
Claims (12)
- 道路工事に関する情報を収集する収集手段と、
収集した前記情報を解析して、道路更新に関する情報を抽出する抽出手段と、
を備えることを特徴とする情報抽出装置。 - 前記収集手段は、道路工事の入札に関する情報を収集し、
前記抽出手段は、前記情報を解析して、道路更新に関する情報を抽出する
ことを特徴とする請求項1に記載の情報抽出装置。 - 前記収集手段は、任意のソーシャルメディアから道路工事に関する情報を収集し、
前記抽出手段は、前記情報を解析して、道路更新に関する情報を抽出する
ことを特徴とする請求項1に記載の情報抽出装置。 - 道路更新の有無を既知とする道路工事に関する情報に基づいて学習生成された、道路更新の有無を判別する判別器を有し、
前記抽出手段は、前記判別器を用いて、道路更新を伴う道路工事を特定し、当該道路工事についての道路更新に関する情報を抽出する
ことを特徴とする請求項1から請求項3のいずれかに記載の情報抽出装置。 - 前記道路更新に関する情報は、道路更新が生ずる場所に関する情報、道路更新の日時に関する情報、道路更新の種別に関する情報、の少なくともいずれかである
ことを特徴とする請求項1から請求項4のいずれかに記載の情報抽出装置。 - 前記抽出手段により抽出した道路更新に関する情報に基づいて、情報抽出装置とネットワーク接続された利用者端末に情報提供を行う情報提供手段
を更に備えることを特徴とする請求項1から請求項5のいずれかに記載の情報抽出装置。 - 前記収集手段は、道路工事に関する情報に付随する付随情報を更に収集し、
前記提供手段は、前記付随情報を併せて提供する
ことを特徴とする請求項6に記載の情報抽出装置。 - 前記収集手段は、収集対象であるリソースに対して、テキスト解析を行い、道路工事に関連するキーワードを含み、かつ、道路工事に関連しないキーワードを含まない、前記リソースを道路工事に関する情報として収集する
ことを特徴とする請求項1から請求項7のいずれかに記載の情報抽出装置。 - 道路工事に関する情報を収集する収集ステップと、
収集した前記情報を解析して、道路更新に関する情報を抽出する抽出ステップと、
を含むことを特徴とする情報抽出方法。 - 前記収集ステップは、道路工事の入札に関する情報を収集し、
前記抽出ステップは、前記情報を解析して、道路更新に関する情報を抽出する
ことを特徴とする請求項8に記載の情報抽出方法。 - 前記収集ステップは、任意のソーシャルメディアから道路工事に関する情報を収集し、
前記抽出ステップは、前記情報を解析して、道路更新に関する情報を抽出する
ことを特徴とする請求項8に記載の情報抽出方法。 - 請求項1から請求項8のいずれかの情報抽出装置として機能させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016070380A JP6097429B1 (ja) | 2016-03-31 | 2016-03-31 | 情報抽出装置、情報抽出方法、およびプログラム |
PCT/JP2016/074595 WO2017168779A1 (ja) | 2016-03-31 | 2016-08-24 | 情報抽出装置、情報抽出方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016070380A JP6097429B1 (ja) | 2016-03-31 | 2016-03-31 | 情報抽出装置、情報抽出方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6097429B1 JP6097429B1 (ja) | 2017-03-15 |
JP2017182544A true JP2017182544A (ja) | 2017-10-05 |
Family
ID=58281141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016070380A Active JP6097429B1 (ja) | 2016-03-31 | 2016-03-31 | 情報抽出装置、情報抽出方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6097429B1 (ja) |
WO (1) | WO2017168779A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6541737B2 (ja) | 2017-09-20 | 2019-07-10 | ヤフー株式会社 | 選択装置、選択方法、選択プログラム、モデルおよび学習データ |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163435A (ja) * | 1998-11-27 | 2000-06-16 | Hokuriku Kensetsu Kosaikai | 土木工事画像管理方法及び土木工事画像管理装置 |
JP2002092084A (ja) * | 2000-09-14 | 2002-03-29 | Pasuko:Kk | 道路工事情報収集、開示システム及び道路工事情報収集開示方法 |
JP2004227304A (ja) * | 2003-01-23 | 2004-08-12 | Taiheiyo Cement Corp | コンクリートソリューションシステム |
JP2007249584A (ja) * | 2006-03-15 | 2007-09-27 | Softec:Kk | クライアントデータベース構築方法、データ検索方法、データ検索システム、データ検索フィルタリングシステム、クライアントデータベース構築プログラム、データ検索プログラム、データ検索フィルタリングプログラム及びプログラムを格納したコンピュータで読み取り可能な記録媒体並びに記録した機器 |
JP2011503625A (ja) * | 2007-11-18 | 2011-01-27 | クゥアルコム・インコーポレイテッド | ナビゲーションデバイスに警告位置を送信するシステムおよび方法 |
JP2011508874A (ja) * | 2007-12-13 | 2011-03-17 | ガーミン スウィッツァランド ゲーエムベーハー | テキストデータにおける位置情報の自動識別 |
-
2016
- 2016-03-31 JP JP2016070380A patent/JP6097429B1/ja active Active
- 2016-08-24 WO PCT/JP2016/074595 patent/WO2017168779A1/ja active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163435A (ja) * | 1998-11-27 | 2000-06-16 | Hokuriku Kensetsu Kosaikai | 土木工事画像管理方法及び土木工事画像管理装置 |
JP2002092084A (ja) * | 2000-09-14 | 2002-03-29 | Pasuko:Kk | 道路工事情報収集、開示システム及び道路工事情報収集開示方法 |
JP2004227304A (ja) * | 2003-01-23 | 2004-08-12 | Taiheiyo Cement Corp | コンクリートソリューションシステム |
JP2007249584A (ja) * | 2006-03-15 | 2007-09-27 | Softec:Kk | クライアントデータベース構築方法、データ検索方法、データ検索システム、データ検索フィルタリングシステム、クライアントデータベース構築プログラム、データ検索プログラム、データ検索フィルタリングプログラム及びプログラムを格納したコンピュータで読み取り可能な記録媒体並びに記録した機器 |
JP2011503625A (ja) * | 2007-11-18 | 2011-01-27 | クゥアルコム・インコーポレイテッド | ナビゲーションデバイスに警告位置を送信するシステムおよび方法 |
JP2011508874A (ja) * | 2007-12-13 | 2011-03-17 | ガーミン スウィッツァランド ゲーエムベーハー | テキストデータにおける位置情報の自動識別 |
Non-Patent Citations (2)
Title |
---|
小笠原 淳二: "社会インフラセキュリティ", 日立評論 第96巻 第3号, vol. 第96巻第3号, JPN6016026772, pages 25 - 30, ISSN: 0003494013 * |
柴崎 亮介: "都市のスマートセンシング", 計測と制御, vol. 第52巻 第11号, JPN6016026770, 10 November 2013 (2013-11-10), JP, pages 946 - 952, ISSN: 0003494012 * |
Also Published As
Publication number | Publication date |
---|---|
JP6097429B1 (ja) | 2017-03-15 |
WO2017168779A1 (ja) | 2017-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008300B (zh) | Poi别名的确定方法、装置、计算机设备和存储介质 | |
US8380693B1 (en) | System and method for automatically identifying classified websites | |
US20220253612A1 (en) | Method and apparatus for acquiring poi state information, device and computer storage medium | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
CN107168991B (zh) | 一种搜索结果展示方法和装置 | |
JP4950508B2 (ja) | 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム | |
US9535978B2 (en) | Semantic mapping of topic map meta-models identifying assets and events to include weights | |
CN111522901A (zh) | 文本中地址信息的处理方法及装置 | |
WO2021151305A1 (zh) | 基于缺失数据的样本分析方法、装置、电子设备及介质 | |
US20130031458A1 (en) | Hyperlocal content determination | |
CN103092855B (zh) | 探测地址更新的方法及装置 | |
KR101747532B1 (ko) | 여행성 질의에 대응하는 검색 결과로 코스를 추천하는 방법 및 시스템 | |
US10909473B2 (en) | Method to determine columns that contain location data in a data set | |
WO2019070412A1 (en) | SYSTEM FOR GENERATING AND USING GEOGRAPHIC HASH EXPRESSIONS | |
CN112818072A (zh) | 旅游知识图谱更新方法、系统、设备及存储介质 | |
KR20210038496A (ko) | 키워드 관계 구조를 이용한 동의어 추출 방법 및 시스템 | |
JP6097429B1 (ja) | 情報抽出装置、情報抽出方法、およびプログラム | |
KR20090001871A (ko) | 광고 집행에 따른 반응정보 제공 방법 및 시스템 | |
KR102592561B1 (ko) | 인공지능 학습용 데이터 구축 시스템 | |
KR20190000061A (ko) | 키워드 속성을 기준으로 관련 있는 키워드를 제공하는 방법 및 시스템 | |
JP6517072B2 (ja) | 語彙意味パターン分析方法に基づいてビッグデータから店舗創業用データ又は運営支援用データを生成する方法 | |
CN111125272B (zh) | 一种区域特征获取方法、装置、计算机设备及介质 | |
US20210224478A1 (en) | Capture and search of virtual machine application properties using log analysis techniques | |
TW202146850A (zh) | 確定路名之處理裝置及方法 | |
JP5826148B2 (ja) | 図面管理サーバ及びこれを用いた図面管理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6097429 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |