JP2021170158A - Information processing system - Google Patents
Information processing system Download PDFInfo
- Publication number
- JP2021170158A JP2021170158A JP2020072115A JP2020072115A JP2021170158A JP 2021170158 A JP2021170158 A JP 2021170158A JP 2020072115 A JP2020072115 A JP 2020072115A JP 2020072115 A JP2020072115 A JP 2020072115A JP 2021170158 A JP2021170158 A JP 2021170158A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- data
- target building
- archive
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 59
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 238000010801 machine learning Methods 0.000 claims abstract description 18
- 238000013480 data collection Methods 0.000 claims abstract description 12
- 230000007704 transition Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 238000010422 painting Methods 0.000 abstract description 10
- 230000004044 response Effects 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000011176 pooling Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007790 scraping Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Abstract
Description
本発明は、図書館・文書館・博物館等でデジタルアーカイブ化され、画像データサーバー等で提供されるアーカイブ画像データの分析に好適な情報処理システムに関する。 The present invention relates to an information processing system that is digitally archived in a library, archive, museum, etc., and is suitable for analyzing archived image data provided by an image data server, etc.
近年、Googleマップ(登録商標)などのデジタル地図アプリケーションの進展により、地図上の位置を、路上からの風景写真や、衛星写真と切り替えて閲覧することが容易になっている。例えば、Googleマップ(登録商標)には、ストリートビュー(登録商標)として知られる地図データと相関を有する実画像データ(地図データが示す場所を実際に撮影した画像データ)を提供する機能がある。Google社が提供するアプリケーション以外にも、Apple社によるマップとLook Aroundの機能なども、類次の機能を持つアプリケーションとして挙げることができる。ここで、本明細書において、これらのアプリケーションに代表されるような、インターネット上でデジタル地図アプリケーションを提供するサーバーを、地図・実画像データサーバーと称している。なお、本発明では、地図・実画像データサーバーは、地図上の位置データと風景写真や衛星写真または実画像データとが対応づけられたアプリケーション一般をさすもので、Google社、Apple社が提供するものに限定されるものではない。 In recent years, with the development of digital map applications such as Google Maps (registered trademark), it has become easy to switch the position on the map between landscape photographs and satellite photographs from the street. For example, Google Maps (registered trademark) has a function of providing real image data (image data in which a place indicated by map data is actually photographed) having a correlation with map data known as street view (registered trademark). In addition to the applications provided by Google, the map and Look Around functions by Apple can also be mentioned as applications with similar functions. Here, in the present specification, a server that provides a digital map application on the Internet, as represented by these applications, is referred to as a map / real image data server. In the present invention, the map / actual image data server refers to a general application in which position data on a map is associated with landscape photographs, satellite photographs, or actual image data, and is provided by Google and Apple. It is not limited to things.
また、様々な資料(図書・公文書・絵画・図面・写真等)のデジタルアーカイブ化が、国内外の図書館・文書館・博物館等で進められており、画像資料がデジタル化され、メタデータのインデックス(例:IIIF;International Image Interoperability Frameworkなど)とともにインターネット上で検索可能になりつつある。例えば、大規模なアーカイブ横断検索を行うことができるサービスとしては欧州連合によるEuropeanaや、国立国会図書館によるJapan Searchを挙げることができる。 In addition, digital archiving of various materials (books, official documents, paintings, drawings, photographs, etc.) is being promoted at libraries, archives, museums, etc. in Japan and overseas, and image materials have been digitized and metadata. It is becoming searchable on the Internet together with indexes (eg, IIIF; International Image International Library, etc.). For example, Europeana by the European Union and Japan Search by the National Diet Library can be mentioned as services capable of performing a large-scale cross-archive search.
そうした中、編集可能な地図アプリケーションと、公文書館などの歴史アーカイブ写真群を組み合わせ、地図上に歴史写真をプロットする試みが行われている。 Under such circumstances, attempts are being made to plot historical photographs on a map by combining an editable map application with a group of historical archive photographs such as archives.
例えば、Sidewalk Labsによる非特許文献1では、トロントの街の歴史的変遷を写真により理解することができるようになっている。
前述のデジタル地図アプリケーションのようなシステムは、人間の閲覧を目的とするのみならず、自動運転車の位置把握など様々な用途で使われるようになっている。また、ドライブレコーダーや車載センサー、スマートフォンなどの普及により、撮影される街の写真は数が飛躍的に増えており、それらの一部もウェブサービスなどで利用・共有されるようになっている。こうした状況の中、近年撮影された街の様子は、位置情報のメタデータにより、ウェブサービスなどを構築することで、画像で容易に確認する仕組みをつくることが可能となってきている。 Systems such as the digital map application described above are used not only for human viewing but also for various purposes such as locating autonomous vehicles. In addition, with the spread of drive recorders, in-vehicle sensors, smartphones, etc., the number of photographs of the city taken has increased dramatically, and some of them are also being used and shared by web services. Under these circumstances, it has become possible to create a mechanism for easily confirming the state of the city photographed in recent years with images by constructing a web service or the like based on the metadata of the location information.
しかしながら、例えば数10年以上前に撮影・描写された過去の写真・絵画などの画像については、基本的に位置情報のメタデータなどはなく、正確な撮影・描写位置等を特定することが容易でない。 However, for example, for images such as past photographs and paintings taken and drawn more than several decades ago, there is basically no metadata of position information, and it is easy to specify the exact shooting and drawing position. Not.
例えば、歴史写真を地図データ上へプロットするには、資料のもつ情報(撮影場所の住所などの書き込みやタイトルなど)、或いは、当時の住人からのフィードバックなどによりおおよその位置を特定することになり、多大な手間や労力がかかることになる。 For example, in order to plot a historical photograph on map data, the approximate location must be specified by the information contained in the material (writing the address of the shooting location, title, etc.) or the feedback from the residents at that time. , It will take a lot of time and effort.
このような手間や労力にも関わらず、厳密な撮影・描写の位置と被写体の位置をデータとして記録するのは容易ではない。また、記録されている書き込みが間違っていたり、住所表示が変わっていたり、住人の記憶が間違っていたりすることもある。 Despite such labor and effort, it is not easy to record the exact position of shooting / depiction and the position of the subject as data. In addition, the recorded writing may be incorrect, the address display may have changed, or the resident's memory may be incorrect.
さらに、一枚の古い写真・絵画に関する位置データを割り出すのにも、上述のような手間や労力がかかることを鑑みると、大量の過去の写真群のそれぞれの位置データを特定することは、非常に困難であることがわかる。 Furthermore, considering that it takes time and effort as described above to determine the position data related to one old photograph / painting, it is very difficult to specify the position data of each of a large amount of past photographs. It turns out to be difficult.
以上、位置情報のメタデータなどがない過去に撮影・描写された写真・絵画に関連する情報を取得すること、より具体的には、過去において撮影・描写された建築物の位置データを取得することが、本発明で実現しようとする課題である。 As described above, it is necessary to acquire information related to photographs / paintings taken / drawn in the past without metadata of position information, and more specifically, to obtain position data of buildings taken / drawn in the past. That is the problem to be realized by the present invention.
この発明は、上記課題を解決するものであって、本発明に係る情報処理システムは、対象建築物の位置データと対応づけられた実画像データと、実画像データ中における対象建築物の存否とを関連付けてニューラルネットワークを機械学習させる機械学習部と、インターネットと接続されている画像データサーバーから、建築物が写り込んでいるアーカイブ画像データを収集するアーカイブ画像データ収集部と、前記アーカイブ画像データ収集部で収集されたアーカイブ画像データを、前記機械学習部によって学習させた前記ニューラルネットワークに入力し、対象建築物の存否を推定し、対象建築物が存在すると推定されるアーカイブ画像データを選定するアーカイブ画像データ選定部と、前記アーカイブ画像データ選定部で選定されたアーカイブ画像データ中に存在すると推定された対象建築物の位置データを回答する位置データ回答部と、を有することを特徴とする。 The present invention solves the above problems, and the information processing system according to the present invention includes actual image data associated with the position data of the target building and the presence or absence of the target building in the actual image data. A machine learning unit that machine-learns a neural network in association with each other, an archive image data collection unit that collects archive image data in which a building is reflected from an image data server connected to the Internet, and the archive image data collection. The archive image data collected by the unit is input to the neural network trained by the machine learning unit, the existence or nonexistence of the target building is estimated, and the archive image data estimated that the target building exists is selected. It is characterized by having an image data selection unit and a position data response unit that answers the position data of the target building estimated to exist in the archive image data selected by the archive image data selection unit.
また、本発明に係る情報処理システムは、対象建築物の位置データと、実画像データとを対応づけて記憶する対象建築物データベースを有することを特徴とする。 Further, the information processing system according to the present invention is characterized by having a target building database that stores the position data of the target building and the actual image data in association with each other.
また、本発明に係る情報処理システムは、前記対象建築物データベースにおける実画像データには、撮影方向データを含むことを特徴とする。 Further, the information processing system according to the present invention is characterized in that the actual image data in the target building database includes shooting direction data.
また、本発明に係る情報処理システムは、位置データと、年代別の住所名とを対応づけて記憶する住所名変遷データベースを有し、前記アーカイブ画像データ収集部は、前記住所名変遷データベースに記憶される住所名を検索キーとして、画像データサーバーからアーカイブ画像データを収集することを特徴とする。 Further, the information processing system according to the present invention has an address name transition database that stores location data and address names by age group in association with each other, and the archive image data collection unit stores the location data in the address name transition database. It is characterized in that archived image data is collected from an image data server using the address name to be used as a search key.
また、本発明に係る情報処理システムは、アーカイブ画像データ中に存在すると推定された対象建築物が撮影された方向を回答する撮影方向回答部を、を有することを特徴とする。 Further, the information processing system according to the present invention is characterized by having a shooting direction answering unit that answers the shooting direction of the target building presumed to exist in the archive image data.
本発明に係る情報処理システムは、アーカイブ画像データを、機械学習部によって学習させたニューラルネットワークに入力し、対象建築物の存否を推定し、対象建築物が存在すると推定されるアーカイブ画像データを選定し、選定されたアーカイブ画像データ中に存在すると推定された対象建築物の位置データを回答する構成であるので、このような本発明に係る情報処理システムによれば、過去に撮影・描写され、位置情報のメタデータなどがない写真・絵画に写り込んでいる対象建築物の位置データを取得することが可能となる。 The information processing system according to the present invention inputs archive image data into a neural network trained by a machine learning unit, estimates the existence of a target building, and selects archive image data in which the target building is presumed to exist. However, since the configuration is such that the position data of the target building presumed to exist in the selected archive image data is returned, the information processing system according to the present invention has been photographed and depicted in the past. It is possible to acquire the position data of the target building reflected in the photograph / painting without the metadata of the position information.
また、上記のように本発明では、アーカイブ画像データにおける対象建築物の位置データが取得可能であるので、本発明に係る情報処理システムによれば、アーカイブ資料の整理・分析の労力を劇的に下げ、今まで手作業では見つけることが困難であった、資料間の関係性を抽出することができるようになる。 Further, as described above, in the present invention, the position data of the target building in the archive image data can be acquired. Therefore, according to the information processing system according to the present invention, the labor for organizing and analyzing the archived materials is dramatically reduced. By lowering it, it will be possible to extract relationships between materials that were previously difficult to find manually.
また、本発明に係る情報処理システムによれば、建築物の位置データが取得可能となることで、 建築物の履歴を調べることを容易にし、資産評価などに利用できる。 Further, according to the information processing system according to the present invention, since the position data of the building can be acquired, it becomes easy to check the history of the building and it can be used for asset evaluation and the like.
また、本発明に係る情報処理システムに明らかとなる建築物の位置データなどは、観光コンテンツとしても利用し得る。 In addition, the location data of the building revealed in the information processing system according to the present invention can also be used as tourism content.
以下、本発明の実施の形態を図面を参照しつつ説明する。図1は本発明の実施形態に係る情報処理システム100の運用例を説明する図である。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram illustrating an operation example of the
本発明に係る情報処理システム100は、インターネットとデータ通信可能に接続できるサーバーなどを用いることができる。このようなサーバーは、サーバコンピューター又はパーソナルコンピュータ等の情報処理装置であり、複数台設けられてもよいし、1台のサーバー内に設けられた複数の仮想マシンによって実現されてもよいし、クラウドサーバーを用いて実現されてもよい。
The
本発明においては、インターネット上でデジタル地図アプリケーションを提供する地図・実画像データサーバー200が設けられていることが想定される。地図・実画像データサーバー200における地図データには、地図データ上で示されている建築物などのランドマークの名称とその位置に係る緯度経度など位置データなどが含まれている。本明細書では、位置データについては緯度経度を用いず、xy座標を用いることとする。 In the present invention, it is assumed that a map / real image data server 200 that provides a digital map application on the Internet is provided. The map data in the map / actual image data server 200 includes the names of landmarks such as buildings shown on the map data and position data such as latitude and longitude related to the positions. In this specification, the latitude and longitude are not used for the position data, but the xy coordinates are used.
なお、本実施形態に係る情報処理システム100では、地図などの位置データとしてxy座標を用いた2次元の例で説明を行うが、本発明の考え方は3次元空間における位置座標を用いる実施形態にも拡張することが可能である。
In the
また、地図・実画像データサーバー200においては、地図データと相関を有する実画像データを提供するサービスを提供していることを想定する。このようなサービスによれば、実画像データに写り込んでおり、地図データ上で位置データが既知である建物を、どの位置から撮影しているかを把握することが可能となる。 Further, it is assumed that the map / real image data server 200 provides a service that provides real image data having a correlation with the map data. According to such a service, it is possible to grasp from which position a building that is reflected in the actual image data and whose position data is known on the map data is photographed.
なお、本実施形態では、上記のような地図・実画像データサーバー200が提供するサービスから、位置データやそれに対応した実画像データを取得する例に基づいて説明を行うが、地図・実画像データサーバー200から取得し得る位置データやそれに対応した実画像データと同様のものを、手動で入手するようにしてもよい。従って、本発明に係る情報処理システム100においては、地図・実画像データサーバー200は必須のものではないが、本明細書では地図・実画像データサーバー200から種々のデータを取得することを前提に説明を進める。
In this embodiment, the description will be given based on an example of acquiring position data and the corresponding real image data from the service provided by the map / real image data server 200 as described above. It is also possible to manually obtain the position data that can be acquired from the server 200 and the corresponding real image data. Therefore, in the
また、インターネット上では、種々の画像データを提供する画像データサーバー300が存在し、これらの画像データサーバー300から、画像データとそれに付随するデータ(画像データ元のアドレスデータ、メタデータ、インデックスデータ等)を、情報処理システム100が取得し得るように構成されている。画像データサーバー300が提供する画像データを、特に本明細書では、先の「実画像データ」と区別して「アーカイブ画像データ」と称する場合がある。
Further, on the Internet, there are
本発明に係る情報処理システム100においては、上記のようなアーカイブ画像データとしては、国内外の図書館・文書館・博物館等でデジタルアーカイブ化された、建築物が写り込んでいる写真・絵画に係るものを想定しているが、本発明に係る情報処理システム100が扱い得るアーカイブ画像データはこれに限定されるものではない。すなわち、本発明は、特段アーカイブ化を意図していないような画像データについても扱い得るものである。
In the
次に、以上のようなインターネット環境に接続されている本発明に係る情報処理システム100の構成や動作について説明する。図2は本発明の実施形態に係る情報処理システム100のブロック図である。
Next, the configuration and operation of the
情報処理システム100は、制御部111、記憶部120、通信部140、表示部150、入力部160、読み取り部170等を含み、これらの各部はバスを介して相互に接続されている。制御部111は、CPU(Central Processing Unit)、MPU(Micro−Processing Unit)又はGPU(Graphics Processing Unit)等の1又は複数のプロセッサを含む。制御部111は、記憶部120に記憶してある制御プログラム121を適宜実行することにより、情報処理システム100が行うべき種々の情報処理、制御処理等を行う。
The
記憶部120は、RAM(Random Access Memory)、フラッシュメモリ、ハードディスク、SSD(Solid State Drive)等を含み得る。記憶部120は、制御部111が実行する制御プログラム121及び制御プログラム121の実行に必要な各種のデータ等を予め記憶している。
The storage unit 120 may include a RAM (Random Access Memory), a flash memory, a hard disk, an SSD (Solid State Drive), and the like. The storage unit 120 stores in advance various data and the like necessary for executing the
また記憶部120は、制御部111が制御プログラム121を実行する際に発生するデータ等を一時的に記憶する。更に記憶部120は、例えば機械学習処理によって構築されたニューラルネットワークである学習モデル123を記憶している。本明細書では、学習モデル123のニューラルネットワークを機械学習させる、ということは、このニューラルネットワークにおけるノード間(図2に不図示)の重みなどの係数を算出し更新していくことを意味している。
Further, the storage unit 120 temporarily stores data or the like generated when the
本発明に係る情報処理システム100では、学習モデル123は、地図・実画像データサーバー200から取得された実画像データと、その実画像データ中において着目している対象の建築物が存在しているか否かを正解ラベルとする教師データを用いて学習されたものである。このような学習モデル123は、ある(アーカイブ)画像データが入力された場合に、当該(アーカイブ)画像データ中に、着目している対象の建築物が写り込んでいるか否かを示す情報を出力するように学習された学習済モデルである。
In the
なお、学習済モデルは、入力値に対して所定の演算を行い、演算結果を出力するものであり、記憶部120にはこの演算を規定する関数の係数や閾値等のデータが、学習モデル123として記憶される。学習モデル123は、情報処理システム100に接続された外部の記憶装置に記憶されていてもよく、ネットワークを介して情報処理システム100と通信可能な記憶装置に記憶されていてもよい。
The trained model performs a predetermined operation on the input value and outputs the operation result, and the storage unit 120 stores data such as coefficients and thresholds of the function that defines this operation in the
記憶部120には、地図・実画像データサーバー200からデータが取得され、学習モデル123のニューラルネットワークを機械学習させるために用いられる対象建築物データベース122が記憶されている。対象建築物データベース122を構築するためには、地図・実画像データサーバー200に対してアクセスして、必要とするデータを抽出するような手順を記述したスクリプトを用いたスクレイピング技術を適宜用いることができる。
Data is acquired from the map / real image data server 200, and the
また、記憶部120には、学習モデル123のニューラルネットワークに入力するアーカイブ画像データを画像データサーバー300から収集すると共に、学習モデル123により当該アーカイブ画像データに着目している対象の建築物が存在している(写り込んでいる)と判断された場合、これを選定するプログラムであるアーカイブ画像データ収集・選定モジュール127が記憶されている。
Further, in the storage unit 120, there is a target building that collects archive image data to be input to the neural network of the
また、アーカイブ画像データ収集・選定モジュール127が、インターネット上のアーカイブ画像データを収集する際には、予め定められた所定のURLを巡回するよう設定することができる。また、これ以外に所定のキーワードを用いて、このキーワードに基づき検索エンジンによりURLを見出すようにしてもよい。このとき用いるキーワードは建築物の名称、旧称や、当該建築物が存在する土地の住所、地名などを用いることができる。ところで、住所については、その名が時代と共に変更されることがある。そこで、住所名の変遷について記述されている住所名変遷データベース128が記憶部120に記憶され、アーカイブ画像データ収集・選定モジュール127が参照することができるようになっている。
In addition, the archive image data collection /
通信部140は、有線通信又は無線通信によってネットワークに接続するためのインタフェースであり、ネットワークを介して外部装置との間で情報の送受信を行う。表示部150は、液晶ディスプレイ又は有機ELディスプレイ等であり、制御部111からの指示に従って各種の情報を表示する。入力部160は、マウス及びキーボード等を含み、ユーザーによる操作入力を受け付け、操作内容に対応した制御信号を制御部111へ送出する。なお、表示部150及び入力部160は、一体として構成されたタッチパネルであってもよい。
The communication unit 140 is an interface for connecting to a network by wired communication or wireless communication, and transmits / receives information to / from an external device via the network. The
読み取り部170は、CD(Compact Disc)−ROM又はDVD(Digital Versatile Disc)−ROMを含む可搬型記憶媒体190に記憶された情報を読み取る。記憶部120に予め記憶される制御プログラム及びデータは、制御部111が読み取り部16を介して可搬型記憶媒体1aから読み取って記憶部120に記憶してもよい。また、記憶部120に予め記憶される制御プログラム及びデータは、制御部111が通信部140を介してネットワーク経由で外部装置からダウンロードして記憶部120に記憶してもよい。更に、半導体メモリ195から、制御部111が制御プログラム及びデータを読み出してもよい。
The
次に、本発明に係る情報処理システム100において、学習モデル123のニューラルネットワークを学習させるためのアルゴリズムについて説明する。本発明に係る情報処理システム100では、画像データサーバー300で収集されるアーカイブ画像データに写り込んでいる建築物の位置データを取得することを目的としている。このために、まず、着目している対象となる建築物が、画像データ中に存在している(写り込んでいる)か否かを判定するための学習モデル123を構築する。
Next, in the
図3は本発明の実施形態に係る情報処理システム1における対象建築物学習処理のフローチャートを示す図である。図3において、ステップS100で、対象建築物学習処理が開始されると、続いて、ユーザーはステップS101において、着目している対象となる建築物の名称を入力する。 FIG. 3 is a diagram showing a flowchart of a target building learning process in the information processing system 1 according to the embodiment of the present invention. In FIG. 3, when the target building learning process is started in step S100, the user subsequently inputs the name of the target building of interest in step S101.
なお、本実施形態ではステップS101において、建築物の名称を入力することで、着目している対象建築物を特定するようにしているが、その他の方法により対象建築物の特定を行うように構成することもできる。例えば、視覚化された地図上で対象建築物を特定するようにしてもよいし、住所によって対象建築物を特定するようにしてもよい。 In the present embodiment, in step S101, the target building of interest is specified by inputting the name of the building, but the target building is specified by another method. You can also do it. For example, the target building may be specified on a visualized map, or the target building may be specified by an address.
続く、ステップS102では、地図・実画像データサーバー200から、入力された名称に基づいて対象建築物の位置データ・実画像データ・撮像方向データを収集する。実画像データとしては、対象建築物を種々のアングルからみた複数のデータが収集される。ステップS102で収集されたデータに基づいて、次のステップS103では、対象建築物データベース122が更新される。
Subsequently, in step S102, the position data, the actual image data, and the imaging direction data of the target building are collected from the map / actual image data server 200 based on the input name. As the actual image data, a plurality of data of the target building viewed from various angles are collected. Based on the data collected in step S102, the
図4は対象建築物データベース122のデータ構造例を示す図である。図4に示すように、対象建築物データベース122には、少なくもそれぞれ固有のIDデータと、当該IDデータに対応する対象建築物の名称に係るデータと、対象建築物が所在する位置データと、対象建築物が写り込んでいる実画像データ、その実画像データが撮影された際のアングルに係るデータと、が対応付けられて記憶されている。
FIG. 4 is a diagram showing an example of a data structure of the
図4に示すID=0000のデータを例に取ると、当該IDデータには、「昭和ビルディング」の名称データを有し、その所在地の位置データとして(x0,y0)を有し、図示する複数の実画像データと、実画像データが撮影された際の撮影方向データとが対応付けられて記憶されている。 Taking the data of ID = 0000 shown in FIG. 4 as an example, the ID data has the name data of "Showa Building" and (x 0 , y 0 ) as the position data of the location, and is illustrated. A plurality of real image data to be used and the shooting direction data when the real image data is shot are stored in association with each other.
ここで、実画像データと、実画像データが撮影された際の撮影方向データとの関連を、図5を参照して説明する。図5(A)乃至(D)は、いずれも位置データ(x0,y0)で、名称データ「昭和ビルディング」である対象建築物が写り込んでいる実画像データである。一方、図5(A)乃至(D)はいずれも異なるアングルで撮影された実画像データである。 Here, the relationship between the actual image data and the photographing direction data when the actual image data is photographed will be described with reference to FIG. 5 (A) to 5 (D) are position data (x 0 , y 0 ), and are actual image data in which the target building, which is the name data “Showa Building”, is reflected. On the other hand, FIGS. 5A to 5D are actual image data taken at different angles.
対象建築物データベース122には、実画像データと共に、当該実画像データが撮影されたアングルに係るデータ(撮影方向データ)とが対応付けられて記憶されている。このような撮影方向データの形式としては、(撮影座標の位置データ)→(対象建築物の位置データ)の形式を取ることができる。図5(A)の例では、撮影座標の位置データ(x1,y1)→対象建築物の位置データ(x0,y0)のような形式とすることができる。このように、本発明に係る情報処理システム100においては、実画像データと撮影方向データとが対象建築物データベース122に記録されており、これを参照することで、アーカイブ画像データの撮影・描写方向を推定することができるようになっている。
In the
ステップS103で対象建築物データベース122が更新されると、続いて、ステップS104 に進み、機械学習処理のサブルーチンが実行され、ステップS105で処理が終了となる。
When the
次に、上記の機械学習処理サブルーチンについて説明する。図6は本発明の実施形態に係る情報処理システム1における機械学習処理サブルーチンのフローチャートを示す図である。このようフローチャートによって、学習モデル123におけるニューラルネットワークが機械学習されることとなる。
Next, the above machine learning processing subroutine will be described. FIG. 6 is a diagram showing a flowchart of a machine learning processing subroutine in the information processing system 1 according to the embodiment of the present invention. With this flowchart, the neural network in the
図5は、学習モデル123の構成例を示す模式図である。学習モデル123は、深層学習アルゴリズムを用いて学習した深層学習モデルであり、例えば図5に示すように畳み込みニューラルネットワーク(CNN:Convolution Neural Network)モデルで構成され得る。学習モデル123は、CNNモデルのほかに、リカレントニューラルネットワーク(RNN:Recurrent Neural Network)モデルで構成されていてもよい。また、学習モデル123は、図5に示すように多層のニューラルネットワーク(深層学習)に限定されるものではなく、他の機械学習のアルゴリズムを用いて構成されていてもよい。
FIG. 5 is a schematic diagram showing a configuration example of the
図5に示す学習モデル123は、入力層、中間層及び出力層から構成されている。中間層は畳み込み層、プーリング層及び全結合層を含むことができる。本実施形態の学習モデル123では、入力層を介して実画像データ(又は、アーカイブ画像データ)が入力される。
The
入力層の各ノードを介して入力された画像データは中間層に入力され、中間層において、畳み込み層でフィルタ処理等によって画像特徴量が抽出されて特徴マップが生成され、プーリング層で圧縮されて情報量を削減される。畳み込み層及びプーリング層は複数層繰り返し設けられており、複数の畳み込み層及びプーリング層によって生成された特徴マップは、全結合層に入力される。 The image data input via each node of the input layer is input to the intermediate layer, and in the intermediate layer, the image feature amount is extracted by filtering etc. in the convolutional layer to generate a feature map, which is compressed by the pooling layer. The amount of information is reduced. The convolution layer and the pooling layer are repeatedly provided in a plurality of layers, and the feature map generated by the plurality of convolution layers and the pooling layer is input to the fully connected layer.
全結合層は複数層(図5では2層)設けられており、入力された特徴マップに基づいて、各種の関数や閾値等を用いて各層のノードの出力値を算出し、算出した出力値を順次後の層のノードに入力する。全結合層は、各層のノードの出力値を順次後の層のノードに入力することにより、最終的に出力層の各ノードにそれぞれの出力値を与える。 A plurality of fully connected layers (two layers in FIG. 5) are provided, and the output values of the nodes of each layer are calculated using various functions and threshold values based on the input feature map, and the calculated output values are calculated. Is sequentially input to the node of the next layer. The fully connected layer finally gives each node of the output layer its own output value by sequentially inputting the output value of the node of each layer to the node of the subsequent layer.
畳み込み層、プーリング層及び全結合層のそれぞれの層数は図5に示す例に限定されない。本実施形態の学習モデル123では、出力層は2つのノードを有しており、例えばノード0は、入力された画像データ中に対象建造物が存在しない、と判別すべき確率を出力し、ノード1は、入力された画像データ中に対象建造物が存在する、と判別すべき確率を出力する。出力層の各ノードの出力値は例えば0〜1.0の値であり、2つのノードから出力された確率の合計が1.0(100%)となる。
The number of each of the convolution layer, the pooling layer and the fully connected layer is not limited to the example shown in FIG. In the
学習モデル123は、対象建造物が写り込んでいない実画像データと、実画像データ中に対象建造物が存在しないことを示す情報(正解ラベル)とを1セットとした教師データを用いて学習する。
The
また学習モデル123は、対象建造物が写り込んでいる実画像データと、実画像データ中に対象建造物が存在することを示す情報(正解ラベル)とを1セットとした教師データを用いて学習する。
Further, the
学習モデル123は、教師データに含まれる、対象建造物が写り込んでいない実画像データが入力された場合に、対象建造物が存在しないと判別すべき確率が出力されるノード0からの出力値が1.0に近づき、他方のノード1からの出力値が0に近づくように学習する。これにより、対象建造物が写り込んでいないアーカイブ画像データが入力された場合に、ノード0からの出力値が1.0に近い値となる学習モデル123を生成できる。
The
また、学習モデル123は、教師データに含まれる、対象建造物が写り込んでいる実画像データが入力された場合に、対象建造物が存在すると判別すべき確率が出力されるノード1からの出力値が1.0に近づき、他方のノード0からの出力値が0に近づくように学習する。これにより、対象建造物が写り込んでいるアーカイブ画像データが入力された場合に、ノード1からの出力値が1.0に近い値となる学習モデル123を生成できる。
Further, the
なお、学習処理において学習モデル123は、入力値に対して行う所定の演算を規定する各種の関数の係数や閾値等のデータを最適化する。これにより、画像データに基づいて、画像データ中に対象建造物が写り込んでいるか否かを示す情報を出力するように学習された学習済みの学習モデル123が得られる。学習モデル123は、情報処理システム100で学習が行われてもよいし、異なる学習装置で学習された後に情報処理システム100の記憶部120に記憶されてもよい。
In the learning process, the
さて、図6の機械学習処理サブルーチンのフローチャートに戻り、ステップS200で、機械学習処理サブルーチンが開始されると、ステップS201では、対象建築物データベース122から、実画像データを取得し、ステップS202では、当該実画像データに対して、対象建築物の存否を正解ラベルとしてニューラルネットワークにおける各種の関数の係数や閾値等を算出する。
By the way, returning to the flowchart of the machine learning processing subroutine of FIG. 6, when the machine learning processing subroutine is started in step S200, the actual image data is acquired from the
ステップS203では、算出した各種の関数の係数や閾値等を更新し、学習モデル123として、次にステップS204に進み、元のルーチンにリターンする。
In step S203, the coefficients, threshold values, and the like of the various calculated functions are updated, and the
なお、対象建築物データベース122の実画像データにより、ニューラルネットワークを学習させる際には、実画像データについてゆがみ補正などの画像処理を必要に応じて行うことで、より効率的な学習を期待することができる。
When training a neural network using the real image data of the
次に、以上のような学習済みの学習モデル123を用いて、画像データサーバー300から取得される(アーカイブ)画像データを分析する処理について説明する。図8は本発明の実施形態に係る情報処理システム1におけるアーカイブ画像データ分析処理のフローチャートを示す図である。このようなアルゴリズムは、主として記憶部120に記憶されているアーカイブ画像データ収集・選定モジュール127によって実行される。
Next, a process of analyzing the (archived) image data acquired from the
ステップS300で、アーカイブ画像データ分析処理が開始されると、続いて、ステップS301に進み、画像データサーバー300から、建築物が写り込んでいるアーカイブ画像データを収集する。
When the archive image data analysis process is started in step S300, the process proceeds to step S301, and the archive image data in which the building is reflected is collected from the
画像データサーバー300から建築物が写り込んでいるアーカイブ画像データを収集するにあたっては、予め定められた所定のURLを巡回する手順を記述したスクリプトによってスクレイピングを行い、アーカイブ画像データを収集するようにしてもよいし、所定のキーワードに基づき検索エンジンによりURLを抽出して、抽出したURL先からアーカイブ画像データを収集するようにしてもよい。
When collecting archive image data in which a building is reflected from the
ところで、検索エンジンでキーワードを使用する場合、住所名については時代と共に変更されることがある。そこで、本発明に係る情報処理システム100においては、住所名の変遷について記述されている住所名変遷データベース128が設けられており、これを適宜参照することができるようになっている。
By the way, when keywords are used in search engines, the address name may change with the times. Therefore, in the
図9は住所名変遷データベース128のデータ構造例を示す図である。住所名変遷データベース128には、地図上の座標の範囲(位置データの範囲)と、年代、住所の名称などのデータが記述される。例えば、本発明に係る情報処理システム100は、ステップS301で、このような住所名変遷データベース128を参照することで、「東京府北豊島郡王子町」のキーワード検索を実行し、1908年〜1932年頃の建築物が写り込んだアーカイブ画像データを収集し得る。
FIG. 9 is a diagram showing an example of a data structure of the address
なお、本実施形態では、住所名が時代と共に変遷することに対応して住所名変遷データベース128を設けるようにしたが、建築物の名称も時代と共に変遷し得るので、建築物の名称の変遷をデータ化した、住所名変遷データベース128と類似したデータベースを準備するようにしてもよい。
In this embodiment, the address
ステップS302では、取得したアーカイブ画像データを、学習済みの学習モデル123におけるニューラルネットワークに入力し、対象建築物の存否を推定する。ここで、アーカイブ画像データに対象建築物が存在すると推定される、とは、ニューラルネットワークのノード1からの出力値が予め定められた所定値(例えば、0.9)以上である、ことを意味している。
In step S302, the acquired archive image data is input to the neural network in the trained
ステップS303で、対象建築物が存在すると推定されるアーカイブ画像データを選定する。すなわち、ニューラルネットワークのノード1からの出力値が予め定められた所定値以上であるアーカイブ画像データを選定する。 In step S303, archive image data that is presumed to have the target building is selected. That is, the archive image data whose output value from the node 1 of the neural network is equal to or more than a predetermined predetermined value is selected.
続く、ステップS304では、対象建築物データベース122を参照して、アーカイブ画像データ中に存在すると推定された当該対象建築物に対応する位置データを取得する。
Subsequently, in step S304, the position data corresponding to the target building estimated to exist in the archive image data is acquired with reference to the
ステップS305では、対象建築物データベース122を参照して、アーカイブ画像データ中に存在すると推定された当該対象建築物に対応する撮影方向データを取得する。撮影方向データは、対象建築物データベース122中の実画像データを参照して、アーカイブ画像データと近い撮影アングルを有するものの撮影方向データを取得することができる。
In step S305, the shooting direction data corresponding to the target building estimated to exist in the archive image data is acquired with reference to the
ステップS306では、ステップS304、S305で得られた各データを、アーカイブ画像データ中の当該対象建築物の位置データ、撮影方向データとして、表示部150などに回答する。続くステップS307で処理を終了する。
In step S306, each data obtained in steps S304 and S305 is returned to the
図10は、ステップS306において、表示部150でアーカイブ画像データ中の対象建築物の位置データ、撮影方向データを回答する際の画面例を示している。
FIG. 10 shows an example of a screen when the
図10の画面例において、アーカイブ画像データ中、ニューラルネットワークで推定された対象建築物は、Target buildingとしてマーキングされる。また、同画面例においては、当該アーカイブ画像データの収集元のURL情報も併せて表示される。 In the screen example of FIG. 10, in the archive image data, the target building estimated by the neural network is marked as Target building. Further, in the same screen example, the URL information of the collection source of the archive image data is also displayed.
さらに、図10に示す画面例では、アーカイブ画像データ中で、Target buildingとしてマーキングされている対象建築物の位置、及び撮影方向について、「アーカイブ画像データの分析結果」の欄で、それぞれ(x0,y0)及び(x1,y1)→(x0,y0)と示されるようになっている。 Further, in the screen example shown in FIG. 10, in the archive image data, the position of the target building marked as Target building and the shooting direction are described in the column of "Analysis result of archive image data" (x 0). , Y 0 ) and (x 1 , y 1 ) → (x 0 , y 0 ).
本発明に係る情報処理システム100は、アーカイブ画像データを、機械学習部によって学習させたニューラルネットワーク(学習モデル123)に入力し、対象建築物の存否を推定し、対象建築物が存在すると推定されるアーカイブ画像データを選定し、選定されたアーカイブ画像データ中に存在すると推定された対象建築物の位置データを回答する構成であるので、このような本発明に係る情報処理システム100によれば、過去に撮影・描写され、位置情報のメタデータなどがない写真・絵画に写り込んでいる対象建築物の位置データを取得することが可能となる。
The
また、上記のように本発明では、アーカイブ画像データにおける対象建築物の位置データが取得可能であるので、本発明に係る情報処理システム100によれば、アーカイブ資料の整理・分析の労力を劇的に下げ、今まで手作業では見つけることが困難であった、資料間の関係性を抽出することができるようになる。
Further, as described above, in the present invention, the position data of the target building in the archive image data can be acquired. Therefore, according to the
また、本発明に係る情報処理システム100によれば、建築物の位置データが取得可能となることで、 建築物の履歴を調べることを容易にし、資産評価などに利用できる。
Further, according to the
また、本発明に係る情報処理システム100に明らかとなる建築物の位置データなどは、観光コンテンツとしても利用し得る。
In addition, the location data of the building revealed in the
また、本発明に係る情報処理システム100により、一枚の歴史的な写真・絵画(アーカイブ画像データ)における建築物の位置データが特定できると、その写真・絵画に写りこんだ、他の建物(現存しないものを含む)について、写真間で連鎖的に位置の特定をしていくことができる。
In addition, when the
また、本発明に係る情報処理システム100によれば、コラージュ的に街の過去を生成していくことができる。また、本発明に係る情報処理システム100によれば、撮影時期が特定できない歴史写真においても、建築物の建て替わる順番により、おおよその撮影時期の範囲を絞り込むことができるようになる。
Further, according to the
また、本発明に係る情報処理システム100により整理された歴史写真(アーカイブ画像データ)は、新たに付与された位置情報を用いて、地図アプリケーションやARアプリなどにプロットすることで、ユーザーが撮影場所や撮影時期を任意に切り替えて閲覧することができるようなシステムを提供することができるようになる。
Further, the historical photograph (archive image data) organized by the
100・・・情報処理システム
111・・・制御部
120・・・記憶部
121・・・制御プログラム
122・・・対象建築物データベース
123・・・学習モデル
127・・・アーカイブ画像データ収集・選定モジュール
128・・・住所名変遷データベース
140・・・通信部
150・・・表示部
160・・・入力部
170・・・読み取り部
190・・・可搬型記憶媒体
195・・・半導体メモリ
200・・・地図・実画像データサーバー
300・・・画像データサーバー
100 ...
Claims (5)
インターネットと接続されている画像データサーバーから、建築物が写り込んでいるアーカイブ画像データを収集するアーカイブ画像データ収集部と、
前記アーカイブ画像データ収集部で収集されたアーカイブ画像データを、前記機械学習部によって学習させた前記ニューラルネットワークに入力し、対象建築物の存否を推定し、対象建築物が存在すると推定されるアーカイブ画像データを選定するアーカイブ画像データ選定部と、
前記アーカイブ画像データ選定部で選定されたアーカイブ画像データ中に存在すると推定された対象建築物の位置データを回答する位置データ回答部と、を有することを特徴とする情報処理システム。 A machine learning unit that machine-learns a neural network by associating the actual image data associated with the position data of the target building with the presence or absence of the target building in the actual image data.
An archive image data collection unit that collects archive image data in which buildings are reflected from an image data server connected to the Internet,
The archive image data collected by the archive image data collection unit is input to the neural network trained by the machine learning unit, the existence or nonexistence of the target building is estimated, and the archive image estimated that the target building exists. Archive image data selection department that selects data and
An information processing system including a position data answering unit that answers position data of a target building estimated to exist in the archive image data selected by the archive image data selection unit.
前記アーカイブ画像データ収集部は、前記住所名変遷データベースに記憶される住所名を検索キーとして、画像データサーバーからアーカイブ画像データを収集することを特徴とする請求項1乃至請求項3のいずれか1項に記載の情報処理システム。 It has an address name transition database that stores location data in association with address names by age group.
Any one of claims 1 to 3, wherein the archive image data collection unit collects archive image data from an image data server using an address name stored in the address name transition database as a search key. The information processing system described in the section.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020072115A JP7409947B2 (en) | 2020-04-14 | 2020-04-14 | information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020072115A JP7409947B2 (en) | 2020-04-14 | 2020-04-14 | information processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021170158A true JP2021170158A (en) | 2021-10-28 |
JP7409947B2 JP7409947B2 (en) | 2024-01-09 |
Family
ID=78119558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020072115A Active JP7409947B2 (en) | 2020-04-14 | 2020-04-14 | information processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7409947B2 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000047578A (en) | 1998-07-30 | 2000-02-18 | Nippon Telegr & Teleph Corp <Ntt> | Map data base updating device |
US7787697B2 (en) | 2006-06-09 | 2010-08-31 | Sony Ericsson Mobile Communications Ab | Identification of an object in media and of related media objects |
CN103988220B (en) | 2011-12-20 | 2020-11-10 | 英特尔公司 | Local sensor augmentation of stored content and AR communication |
JP5946372B2 (en) | 2012-08-30 | 2016-07-06 | 技研商事インターナショナル株式会社 | Geocoding system |
JP6440303B2 (en) | 2014-12-02 | 2018-12-19 | エヌ・ティ・ティ・コムウェア株式会社 | Object recognition device, object recognition method, and program |
JP7087844B2 (en) | 2018-08-31 | 2022-06-21 | トヨタ自動車株式会社 | Image processing equipment, image processing system and vehicle |
-
2020
- 2020-04-14 JP JP2020072115A patent/JP7409947B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP7409947B2 (en) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee et al. | Context-aware risk management for architectural heritage using historic building information modeling and virtual reality | |
US8769396B2 (en) | Calibration and annotation of video content | |
US8447787B2 (en) | System and method for geocoding content | |
EP1732016B1 (en) | Information processing apparatus, information processing method, and information processing program | |
US20070173956A1 (en) | System and method for presenting geo-located objects | |
MX2009001948A (en) | Panoramic ring user interface. | |
CN104520848B (en) | According to attendant's search events | |
US10810466B2 (en) | Method for location inference from map images | |
JP5419644B2 (en) | Method, system and computer-readable recording medium for providing image data | |
Friedrichs et al. | Creating suitable tools for art and architectural research with historic media repositories | |
Münster et al. | An automated pipeline for a browser-based, city-scale mobile 4d vr application based on historical images | |
Blettery et al. | How to Spatialize Geographical Iconographic Heritage | |
McAuliffe et al. | Access to online historical aerial photography collections: Past practice, present state, and future opportunities | |
US9188444B2 (en) | 3D object positioning in street view | |
JP2021170158A (en) | Information processing system | |
KR100563085B1 (en) | Method for compositively displaying digital map and photo image | |
CN112907740B (en) | Real estate visualization display method and system based on GIS | |
CN114238541A (en) | Sensitive target information acquisition method and device and computer equipment | |
JP7313941B2 (en) | Information management system and information management method | |
JP7132860B2 (en) | VIDEO INFORMATION MANAGEMENT SYSTEM AND VIDEO INFORMATION MANAGEMENT METHOD | |
Bastin et al. | Volunteered metadata, and metadata on VGI: challenges and current practices | |
Wu et al. | Photoscope: visualizing spatiotemporal coverage of photos for construction management | |
JP2005086265A (en) | Mobile terminal, image data file management system, and image data file management method | |
Parker et al. | Archaeology in the Third and Fourth Dimensions: A Case Study of 3D Data Collection and Analysis From Prince Rupert, BC, Canada | |
JP5058201B2 (en) | Information management system and information management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230213 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7409947 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |