JP2015049697A - Information processing apparatus, information processing method, and program - Google Patents

Information processing apparatus, information processing method, and program Download PDF

Info

Publication number
JP2015049697A
JP2015049697A JP2013180699A JP2013180699A JP2015049697A JP 2015049697 A JP2015049697 A JP 2015049697A JP 2013180699 A JP2013180699 A JP 2013180699A JP 2013180699 A JP2013180699 A JP 2013180699A JP 2015049697 A JP2015049697 A JP 2015049697A
Authority
JP
Japan
Prior art keywords
metadata
information
attribute
attribute value
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013180699A
Other languages
Japanese (ja)
Other versions
JP6239318B2 (en
Inventor
長野 伸一
Shinichi Nagano
伸一 長野
隆浩 川村
Takahiro Kawamura
隆浩 川村
洋一 島田
Yoichi Shimada
洋一 島田
善之 松田
Yoshiyuki Matsuda
善之 松田
小林 義孝
Yoshitaka Kobayashi
義孝 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013180699A priority Critical patent/JP6239318B2/en
Priority to US14/469,906 priority patent/US20150066931A1/en
Priority to CN201410436765.XA priority patent/CN104424357A/en
Publication of JP2015049697A publication Critical patent/JP2015049697A/en
Application granted granted Critical
Publication of JP6239318B2 publication Critical patent/JP6239318B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

PROBLEM TO BE SOLVED: To enable appropriate management and search of information.SOLUTION: An information processing apparatus according to one embodiment of the present disclosure includes a collection unit, a storage unit, and a search unit. The collection unit collects a plurality of first metadata relating to information for which a common specification to a plurality of information sources transmitting the information is not stipulated, from the information sources. The storage unit stores a first attribute indicating an item of an element included in the first metadata and a first attribute value that is a value corresponding to the first attribute while making the first attribute and the first attribute value correspond to each first metadata. The search unit searches the plurality of first metadata on the basis of a correspondence between a second attribute indicating an item of an element included in newly acquired second metadata and a second attribute value corresponding to the second attribute and the first attribute and the first attribute value, and extracts corresponding metadata that is the first metadata corresponding to the second metadata.

Description

本発明の実施形態は、情報処理装置、方法およびプログラムに関する。   Embodiments described herein relate generally to an information processing apparatus, a method, and a program.

官公庁や各自治体、および市民などから情報を広域的に収集し、状況を監視するシステムが要求されている。例えば、災害が発生した場合に複数の情報源から情報を収集し、市民の安否情報などを一元管理することは、情報の信頼性の面でも有用である。このようなシステムとしては、地理空間情報と管理したい情報とを関連付けて統一管理する手法がある。   There is a need for a system that collects information from government agencies, local governments, and citizens over a wide area and monitors the situation. For example, in the event of a disaster, collecting information from a plurality of information sources and centrally managing the safety information of citizens is also useful in terms of information reliability. As such a system, there is a method of unifying and managing geospatial information and information to be managed.

特開2012−194620号公報JP 2012-194620 A

しかし、上述の手法において、所管が異なる複数の地域情報、防災情報を融合して統合管理するためには、データを統一するための規格化が必須であり、さらに管理対象となる情報は、地理空間情報との関連づけが必須となる。そのため、データを収集できる情報源が限定され、例えば自治体の管轄外の地域の状況などは把握することができない。   However, in the above method, in order to integrate and manage a plurality of regional information and disaster prevention information with different jurisdictions, standardization for unifying data is essential, and the information to be managed is geographical Association with spatial information is essential. Therefore, the information sources from which data can be collected are limited, and for example, the situation of areas outside the jurisdiction of the local government cannot be grasped.

本発明は、上述した課題を解決するためになされたものであり、複数の情報源からの情報を適切に管理および検索することができる情報処理装置、方法、およびプログラムを提供することを目的とする。   The present invention has been made to solve the above-described problem, and an object thereof is to provide an information processing apparatus, method, and program capable of appropriately managing and searching information from a plurality of information sources. To do.

本発明の一実施形態に係る情報処理装置は、収集部、格納部および検索部を含む。収集部は、情報を発信する複数の情報源から、前記複数の情報源で共通の規格を有していない該情報に関する第1メタデータをそれぞれ収集する。格納部は、前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納する。検索部は、新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出する。   An information processing apparatus according to an embodiment of the present invention includes a collection unit, a storage unit, and a search unit. The collection unit collects first metadata relating to information that does not have a common standard among the plurality of information sources, from a plurality of information sources that transmit information. The storage unit stores a first attribute indicating an item of an element included in the first metadata and a first attribute value that is a value corresponding to the first attribute in association with each first metadata. . The search unit associates the second attribute indicating the item of the element included in the newly acquired second metadata and the second attribute value corresponding to the second attribute with the first attribute and the first attribute value. A plurality of the first metadata is searched based on the relationship, and corresponding metadata that is the first metadata corresponding to the second metadata is extracted.

第1の実施形態に係る情報処理装置を含む情報処理システムを示すブロック図。1 is a block diagram showing an information processing system including an information processing apparatus according to a first embodiment. メタデータ格納部に格納されるメタデータの一例を示す図。The figure which shows an example of the metadata stored in a metadata storage part. 第1の実施形態に係るメタデータ検索部の検索処理を示すフローチャート。5 is a flowchart showing search processing of a metadata search unit according to the first embodiment. 第1の実施形態の変形例に係るメタデータ検索部の検索処理を示すフローチャート。The flowchart which shows the search process of the metadata search part which concerns on the modification of 1st Embodiment. 欠損した属性値に対応付ける場合の一例を示す図。The figure which shows an example in the case of matching with the missing attribute value. 第2の実施形態に係る情報処理装置を含む情報処理システムを示すブロック図。The block diagram which shows the information processing system containing the information processing apparatus which concerns on 2nd Embodiment. 第2の実施形態に係るメタデータ検索部の検索処理を示すフローチャート。The flowchart which shows the search process of the metadata search part which concerns on 2nd Embodiment. 第2の実施形態に係るメタデータ検索部の検索処理の具体例を示す図。The figure which shows the specific example of the search process of the metadata search part which concerns on 2nd Embodiment. 第3の実施形態に係る情報処理装置を含む情報処理システムを示すブロック図。The block diagram which shows the information processing system containing the information processing apparatus which concerns on 3rd Embodiment. 第3の実施形態に係るメタデータ検索部および重要度算出部の処理を示すフローチャート。The flowchart which shows the process of the metadata search part and importance calculation part which concern on 3rd Embodiment.

以下、図面を参照しながら本開示の一実施形態に係る情報処理装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の番号を付した部分については同様の動作を行なうものとして、重ねての説明を省略する。
(第1の実施形態)
第1の実施形態に係る情報処理装置を含む情報処理システムについて図1のブロック図を参照して説明する。なお、本実施形態では、災害時における情報収集を一例として説明するが、これに限らず、どのようなイベントに対しても適用できる。例えば、自治体が企画した花火大会、講演会、商業施設の安売り日などといった情報や、電車の運行状況や道路の渋滞などといった交通機関の情報などに対しても同様に適用することができる。
Hereinafter, an information processing apparatus, method, and program according to an embodiment of the present disclosure will be described in detail with reference to the drawings. In the following embodiments, the same numbered parts are assumed to perform the same operation, and repeated description is omitted.
(First embodiment)
An information processing system including an information processing apparatus according to the first embodiment will be described with reference to the block diagram of FIG. In the present embodiment, information collection at the time of a disaster is described as an example, but the present invention is not limited to this and can be applied to any event. For example, the present invention can be similarly applied to information such as a fireworks display planned by a local government, a lecture, a sale date of a commercial facility, and information on transportation such as a train operation state or a traffic jam on a road.

第1の実施形態に係る情報処理システム100は、情報源151、152、153、154および155、メタデータ生成部161、162、163、164および165、情報処理装置101およびシソーラス辞書106を含む。また、情報処理装置101は、メタデータ収集部102、メタデータ格納部103、メタデータ検索部104および表示部105を含む。   The information processing system 100 according to the first embodiment includes information sources 151, 152, 153, 154 and 155, metadata generation units 161, 162, 163, 164 and 165, an information processing apparatus 101 and a thesaurus dictionary 106. The information processing apparatus 101 includes a metadata collection unit 102, a metadata storage unit 103, a metadata search unit 104, and a display unit 105.

情報源151は、例えば、商業施設、避難所、道路に設置される定点カメラであり、カメラにより動画像を生成する。
情報源152は、例えば、公共施設や避難所に設置されるマイクであり、マイクに向かってユーザが話すことにより、ユーザの音声信号を生成する。
情報源153は、例えば、自治体およびマスメディアからの災害発表または公式発表であり、自治体やメディアから発信される情報をwebなどによるテキストデータを生成する。なお、公式会見などといった音声による発表であれば、音声信号を生成してもよい。
The information source 151 is, for example, a fixed point camera installed in a commercial facility, a shelter, or a road, and generates a moving image by the camera.
The information source 152 is, for example, a microphone installed in a public facility or a shelter, and generates a user's voice signal when the user speaks into the microphone.
The information source 153 is, for example, a disaster announcement or official announcement from the local government and mass media, and generates text data such as web from information transmitted from the local government or the media. Note that an audio signal may be generated for an audio presentation such as an official conference.

情報源154は、例えば気象センサーであり、気温や湿度、風速などといった気象に関する情報を数値として生成する。
情報源155は、例えば、SNS(ソーシャルネットワーキングサービス)を利用する一般市民(一般ユーザともいう)であり、SNSを利用して一般ユーザが投稿した災害情報などのテキストデータを生成する。なお、一般ユーザが、動画および音声などにより情報を発信した場合は、それぞれ動画像および音声信号を取得すればよい。
The information source 154 is, for example, a weather sensor, and generates information on weather such as temperature, humidity, and wind speed as numerical values.
The information source 155 is, for example, a general citizen (also referred to as a general user) who uses an SNS (social networking service), and generates text data such as disaster information posted by the general user using the SNS. In addition, when a general user transmits information by a moving image, a sound, or the like, a moving image and a sound signal may be acquired, respectively.

メタデータ生成部161は、情報源151からカメラ画像(静止画、または動画)を受け取り、カメラ画像を取得したカメラの識別子(ID)、カメラ画像を取得した日時に関する日時情報、カメラが設置される位置に関する位置情報を含むメタデータを生成し、カメラ画像と対応付ける。また、オブジェクト認識技術を利用して、カメラ画像に映っている人物や、ビルや自動車などの物体、火災や煙などの災害事象を認識し、認識したオブジェクトの名称をメタデータに含めてよい。さらには、認識した人物の顔画像を、SNSなど顔画像が登録されたサービスを利用して、登録されているプロフィール画像と照合し、該人物の姓名をメタデータに含めてよい。また、OCR技術を利用して、カメラ画像に映っている文字画像を認識してテキストを抽出し、メタデータに含めてよい。   The metadata generation unit 161 receives a camera image (still image or moving image) from the information source 151, and an identifier (ID) of the camera that acquired the camera image, date / time information about the date and time when the camera image was acquired, and a camera are installed. Metadata including position information regarding the position is generated and associated with the camera image. Further, by using object recognition technology, a person reflected in a camera image, an object such as a building or a car, a disaster such as fire or smoke may be recognized, and the name of the recognized object may be included in the metadata. Furthermore, the face image of the recognized person may be collated with a registered profile image using a service in which the face image is registered such as SNS, and the first and last name of the person may be included in the metadata. In addition, the text may be extracted by recognizing the character image shown in the camera image using the OCR technology and included in the metadata.

メタデータ生成部162は、情報源152から音声信号を受け取り、音声信号を取得したマイクの識別子(ID)、音声信号を取得した日時に関する日時情報、マイクが設置される位置に関する位置情報を含むメタデータを生成し、音声信号と対応付ける。また、音声認識技術を利用して、音声信号をテキストに変換してメタデータに含めてよい。さらに、自然言語処理技術を利用して、テキストから人物名や地名などの固有表現を抽出し、それらをメタデータに含めてよい。   The metadata generation unit 162 receives an audio signal from the information source 152, and includes an identifier (ID) of the microphone that acquired the audio signal, date and time information about the date and time when the audio signal was acquired, and position information about the position where the microphone is installed. Generate data and associate it with audio signals. Further, a speech signal may be converted into text and included in the metadata by using speech recognition technology. Furthermore, natural language processing technology may be used to extract specific expressions such as person names and place names from the text and include them in the metadata.

メタデータ生成部163は、情報源153からテキストデータを受け取り、テキストデータを発表した自治体やメディアの識別子(ID)、テキストデータが発表された日時に関する日時情報、自治体およびメディアの所在地に関する位置情報を含むメタデータを生成し、テキストデータと対応付ける。また、自然言語処理技術を利用して、テキストデータから人物名や地名などの固有表現を抽出し、それらをメタデータに含めてよい。   The metadata generation unit 163 receives the text data from the information source 153, and obtains the identifier (ID) of the local government or the media that announced the text data, the date and time information regarding the date and time when the text data was announced, and the location information about the local government and the location of the media. Generate metadata to include and associate with text data. Also, natural language processing technology may be used to extract specific expressions such as person names and place names from text data and include them in the metadata.

メタデータ生成部164は、情報源154から観測対象に対して観測した数値を受け取り、観測対象を示す識別子(ID)、数値を取得した日時に関する日時情報、どの地域に関する情報であるかを示す位置情報を含むメタデータを生成し、数値と対応付ける。
メタデータ生成部165は、情報源155からテキストデータを受け取り、テキストデータを作成したユーザのID、テキストデータを作成した日時に関する日時情報を含むメタデータを生成し、テキストデータと対応付ける。また、自然言語処理技術を利用して、テキストデータから人物名や地名などの固有表現を抽出し、それらをメタデータに含めてよい。さらには、テキストデータに含まれる単語の品詞に着目して、テキストデータを作成したユーザの意図、例えば「知りたい」「欲しい」といった要望や、「避難所はどこ?」「電車動いてる?」といった質問を判定し、それらをメタデータに含めてよい。なお、情報源155においてテキストデータを生成したときの位置情報については、一般ユーザのプライバシー保護の観点から必ずしも必要としないことが望ましい。
The metadata generation unit 164 receives a numerical value observed for the observation target from the information source 154, an identifier (ID) indicating the observation target, date / time information regarding the date and time when the numerical value was acquired, and a position indicating which area the information is related to Generate metadata including information and associate it with numerical values.
The metadata generation unit 165 receives text data from the information source 155, generates metadata including date and time information regarding the ID of the user who created the text data and the date and time when the text data was created, and associates the text data. Also, natural language processing technology may be used to extract specific expressions such as person names and place names from text data and include them in the metadata. Furthermore, paying attention to the part of speech of the word included in the text data, the intention of the user who created the text data, for example, “I want to know” or “I want it”, “Where is the refuge?” “Is the train moving?” May be determined and included in the metadata. It is desirable that the position information when the text data is generated in the information source 155 is not necessarily required from the viewpoint of protecting the privacy of general users.

なお、情報源151、152、153、154および155は、メタデータ生成部161、162、163、164および165をそれぞれ含んでいてもよく、メタデータ生成部の処理は、一般的な処理を用いて実現可能である。   Note that the information sources 151, 152, 153, 154, and 155 may include metadata generation units 161, 162, 163, 164, and 165, respectively. The processing of the metadata generation unit uses general processing. Is feasible.

メタデータ収集部102は、メタデータ生成部161、162、163、164および165から、メタデータをそれぞれ収集する。メタデータを収集する間隔は、一定時間間隔で収集するようにしてもよいし、情報源から新規のメタデータが生成されるたびに収集するようにしてもよい。なお、メタデータ収集の際に、メタデータと対応する動画像、音声信号、数値およびテキストデータも併せて収集してもよい。   The metadata collection unit 102 collects metadata from the metadata generation units 161, 162, 163, 164, and 165, respectively. The interval for collecting the metadata may be collected at regular time intervals, or may be collected every time new metadata is generated from the information source. Note that when collecting metadata, moving images, audio signals, numerical values, and text data corresponding to the metadata may also be collected.

メタデータ格納部103は、メタデータ収集部102からメタデータを受け取って格納する。メタデータ格納部103は、メタデータ収集部102においてメタデータに対応する各動画像、音声信号、数値およびテキストデータを収集する場合は、メタデータと併せてそれぞれ格納してもよい。また、各動画像、音声信号、数値およびテキストデータは、外部の格納部(図示せず)に格納し、メタデータ格納部103に格納されるメタデータと関連付けてもよい。
メタデータ検索部104は、新規に格納されるメタデータに関して、メタデータ格納部103に格納されたメタデータの中で対応するメタデータを検索し、対応するメタデータを対応メタデータとして抽出する。メタデータの検索処理は、一定時間間隔で行なってもよいし、メタデータが新規に格納されるごとに行なってもよい。メタデータ検索部104の検索処理の具体例については後述する。
The metadata storage unit 103 receives and stores metadata from the metadata collection unit 102. When the metadata collection unit 102 collects each moving image, audio signal, numerical value, and text data corresponding to the metadata in the metadata collection unit 102, the metadata storage unit 103 may store them together with the metadata. Further, each moving image, audio signal, numerical value, and text data may be stored in an external storage unit (not shown) and associated with metadata stored in the metadata storage unit 103.
The metadata search unit 104 searches the metadata stored in the metadata storage unit 103 for the metadata that is newly stored, searches for the corresponding metadata, and extracts the corresponding metadata as the corresponding metadata. The metadata search process may be performed at regular time intervals or each time metadata is newly stored. A specific example of the search process of the metadata search unit 104 will be described later.

表示部105は、メタデータ検索部104から対応メタデータを受け取り、例えば検索された対応メタデータをディスプレイに表示する。
シソーラス辞書106は、類義語および同義語を格納しており、メタデータ検索部104からの要求に応じて類義語および同義語を提示する。
The display unit 105 receives the corresponding metadata from the metadata search unit 104, and displays the searched corresponding metadata on the display, for example.
The thesaurus dictionary 106 stores synonyms and synonyms, and presents synonyms and synonyms in response to a request from the metadata search unit 104.

次に、メタデータ格納部103に格納されるメタデータの一例について図2を参照して説明する。図2では、商業施設のカメラにより撮像された動画像から生成されるメタデータを例に説明する。
メタデータ200は、属性201および属性値202を含み、互いに対応付けられて、メタデータごとにメタデータ格納部103にそれぞれ格納される。属性201は、メタデータの項目名であり、属性値202は、属性201に対応する値または状態である。図2の例では、属性201として、アカウントID203、位置情報204、日時情報205、事象206、状況207を含む。
Next, an example of metadata stored in the metadata storage unit 103 will be described with reference to FIG. In FIG. 2, metadata generated from a moving image captured by a commercial facility camera will be described as an example.
The metadata 200 includes an attribute 201 and an attribute value 202, is associated with each other, and is stored in the metadata storage unit 103 for each metadata. An attribute 201 is a metadata item name, and an attribute value 202 is a value or state corresponding to the attribute 201. In the example of FIG. 2, the attribute 201 includes an account ID 203, position information 204, date / time information 205, an event 206, and a situation 207.

アカウントID203は、所属する施設での識別子やSNSなどにおけるアカウントを示す識別子である。ここでは施設におけるカメラのIDであり、属性201「アカウントID」と属性値202「商業施設A_カメラ1」とが対応付けられる。
位置情報204は、情報源の位置、および情報源から発信された話題の中心となる人物または施設の位置情報であり、ここでは、カメラ1が設置される位置に関する情報である。なお、位置情報は、緯度および経度に関する情報であってもよい。
日時情報205は、情報を取得した日時であり、ここでは、カメラにより撮像された日時が属性値202として格納される。
事象206は、どのような出来事が起こっているかを示す。
状況207は、事象206の状況がどのようなものかを示す。
The account ID 203 is an identifier indicating an account in an affiliation facility or an SNS. Here, the ID of the camera in the facility, the attribute 201 “account ID” and the attribute value 202 “commercial facility A_camera 1” are associated with each other.
The position information 204 is the position information of the information source and the position information of the person or facility that is the center of the topic transmitted from the information source. Here, the position information 204 is information regarding the position where the camera 1 is installed. The position information may be information regarding latitude and longitude.
The date / time information 205 is the date / time when the information is acquired. Here, the date / time captured by the camera is stored as the attribute value 202.
Event 206 indicates what event is occurring.
The situation 207 indicates what the situation of the event 206 is.

次に、第1の実施形態に係るメタデータ検索部104の検索処理について図3のフローチャートを参照して説明する。
ステップS301では、メタデータ格納部103に新規に格納されるメタデータを読み込む。
ステップS302では、メタデータに含まれる属性および属性値から日時情報を特定し、日時情報として所定期間内に含まれる属性値を有するメタデータをメタデータ格納部103から検索する。
ステップS303では、メタデータに含まれる属性および属性値から位置情報を特定し、位置情報として所定エリア内に含まれる属性値を有するメタデータをメタデータ格納部103から検索する。
Next, search processing of the metadata search unit 104 according to the first embodiment will be described with reference to the flowchart of FIG.
In step S301, metadata newly stored in the metadata storage unit 103 is read.
In step S <b> 302, date / time information is specified from the attributes and attribute values included in the metadata, and metadata having an attribute value included in a predetermined period as the date / time information is searched from the metadata storage unit 103.
In step S303, position information is specified from attributes and attribute values included in the metadata, and metadata having an attribute value included in a predetermined area as position information is searched from the metadata storage unit 103.

ステップS304では、ステップS302およびステップS303に基づいて該当するメタデータが存在するかどうかを判定する。該当するメタデータが存在すればステップS305へ進み、該当するメタデータが存在しなければステップS301へ戻り、同様の処理を繰り返す。   In step S304, it is determined whether corresponding metadata exists based on step S302 and step S303. If the corresponding metadata exists, the process proceeds to step S305. If the corresponding metadata does not exist, the process returns to step S301, and the same processing is repeated.

ステップS305では、該当するメタデータのうち、新規に格納されるメタデータの属性と属性が一致するメタデータを特定し、対応する属性値の類似度を算出する。
相互に共通の規格が存在しない情報源ごとにメタデータを生成する場合は、属性201として挙げられる項目名が情報源ごとに異なる可能性がある。ここで、「共通の規格」とは、メタデータに含まれる属性の名称、および属性値として取りうる値の種類と範囲を定めたものである。メタデータを表現するフォーマットは統一されているとする。そのようなデータフォーマットの例として、CSV(Comma Separated Value、カンマ区切りのテキストデータ)や、JSON(Java(登録商標) Script Object Notation)、Linked Datなどがある。このような場合は、属性値の類似度が閾値以上のメタデータを抽出すればよい。類似度が閾値以上であるかどうかの判定は、例えば、それぞれの属性値を表す文字列の編集距離やコサイン類似度を算出したり、シソーラス辞書を用いて類義語を判定すればよい。
In step S305, metadata corresponding to the attribute of the newly stored metadata is identified from the corresponding metadata, and the similarity of the corresponding attribute value is calculated.
When metadata is generated for each information source that does not have a common standard with each other, the item name listed as the attribute 201 may be different for each information source. Here, the “common standard” defines the name of an attribute included in metadata and the type and range of values that can be taken as attribute values. Assume that the format for expressing metadata is unified. Examples of such data formats include CSV (Comma Separated Value, comma separated text data), JSON (Java (registered trademark) Script Object Notation), Linked Dat, and the like. In such a case, it is only necessary to extract metadata whose attribute value similarity is equal to or greater than a threshold value. The determination as to whether the degree of similarity is equal to or greater than a threshold value may be made by, for example, calculating the edit distance and cosine similarity of the character string representing each attribute value, or determining a synonym using a thesaurus dictionary.

ステップS306では、該当するメタデータのうち、新規に格納されるメタデータの属性値と属性値が一致するメタデータを特定し、対応する属性の類似度を算出して、類似度が閾値以上のメタデータを抽出する。具体的には、例えば、「日時」「日付情報」「Time」等が属性としてあれば、時間を表す類義語であるので、これらの属性の類似度は閾値以上であると判定できる。   In step S306, among the corresponding metadata, metadata whose attribute value matches the attribute value of the newly stored metadata is specified, the similarity of the corresponding attribute is calculated, and the similarity is equal to or greater than the threshold value. Extract metadata. Specifically, for example, if “date and time”, “date information”, “Time”, and the like are attributes, they are synonyms representing time, and therefore the similarity of these attributes can be determined to be equal to or greater than a threshold value.

ステップS307では、抽出したメタデータを対応メタデータとして出力する。以上でメタデータ検索部104の検索処理を終了する。なお、ステップS305およびステップS306のどちらか一方だけ処理を行なって、属性または属性値の類似度を判定してもよい。   In step S307, the extracted metadata is output as corresponding metadata. Thus, the search process of the metadata search unit 104 ends. Note that only one of step S305 and step S306 may be processed to determine the similarity of attributes or attribute values.

類似度の判定の具体例について上述した図2を参照して説明する。
図2では、メタデータ200の属性201と、メタデータ210の属性201とを比較すると、位置情報204と日時情報205とは属性が一致するが、事象206と災害とは属性が一致していない。この場合、事象206の属性202「火災」と災害の属性値202「火災」とが一致しており、事象と災害との類似度が閾値以上と判定できる場合、メタデータ200に対して、メタデータ210が対応メタデータとして抽出することができる。
A specific example of similarity determination will be described with reference to FIG. 2 described above.
In FIG. 2, when the attribute 201 of the metadata 200 and the attribute 201 of the metadata 210 are compared, the position information 204 and the date / time information 205 match, but the event 206 and the disaster do not match. . In this case, if the attribute 202 “fire” of the event 206 matches the attribute value 202 “fire” of the disaster, and the similarity between the event and the disaster can be determined to be equal to or greater than the threshold, the metadata 200 Data 210 can be extracted as corresponding metadata.

(第1の実施形態の変形例)
収集されるメタデータの中には、属性値の一部が欠損している、すなわち値が入っていないメタデータも想定される。このような場合でも、属性および属性値を参照して対応メタデータを得ることができる。
(Modification of the first embodiment)
Among the collected metadata, a part of attribute value is missing, that is, metadata that does not contain a value is assumed. Even in such a case, the corresponding metadata can be obtained by referring to the attribute and the attribute value.

第1の実施形態の変形例に係るメタデータ検索部104の動作について図4のフローチャートを参照して説明する。なお、ステップS301からステップS307までの処理は、図3と同様であるので説明を省略する。   The operation of the metadata search unit 104 according to the modification of the first embodiment will be described with reference to the flowchart of FIG. Note that the processing from step S301 to step S307 is the same as that in FIG.

ステップS401では、新規に格納されるメタデータの属性値に欠損が含まれるかどうかを判定する。属性値に欠損が含まれる場合はステップS402に進み、属性値に欠損が含まれない場合はステップS404に進む。   In step S401, it is determined whether or not the attribute value of the newly stored metadata includes a defect. If the attribute value includes a defect, the process proceeds to step S402. If the attribute value does not include a defect, the process proceeds to step S404.

ステップS402では、新規に格納されるメタデータとステップS304で該当するメタデータとを比較し、新規に格納されるメタデータの欠損した属性値に対応する属性を、ステップS304で該当するメタデータから抽出する。   In step S402, the newly stored metadata is compared with the corresponding metadata in step S304, and the attribute corresponding to the missing attribute value of the newly stored metadata is determined from the corresponding metadata in step S304. Extract.

ステップS403では、欠損した属性値と、ステップS402で抽出したメタデータの属性値とを対応付ける。   In step S403, the missing attribute value is associated with the metadata attribute value extracted in step S402.

ステップS404では、検索されたメタデータの属性値に欠損が含まれるかどうかを判定する。属性値に欠損が含まれる場合はステップS405に進み、属性値に欠損が含まれない場合はステップS305に進み、同様の処理を繰り返す。   In step S404, it is determined whether or not a defect is included in the attribute value of the searched metadata. If the attribute value includes a defect, the process proceeds to step S405. If the attribute value does not include a defect, the process proceeds to step S305, and the same processing is repeated.

ステップS405では、検索されたメタデータと新規に格納されるメタデータとを比較し、検索されたメタデータの欠損した属性値に対応する属性を、新規に格納されるメタデータから抽出する。   In step S405, the searched metadata is compared with the newly stored metadata, and the attribute corresponding to the missing attribute value of the searched metadata is extracted from the newly stored metadata.

ステップS406では、欠損した属性値と、ステップS405で抽出したメタデータの属性値とを対応付ける。以上で、属性値をする場合のメタデータ検索部104の動作を終了する。   In step S406, the missing attribute value is associated with the attribute value of the metadata extracted in step S405. This is the end of the operation of the metadata search unit 104 when the attribute value is used.

次に、欠損した属性値に対応付ける場合の具体例について図5を参照して説明する。
図5は、メタデータ501、502および503の順に、メタデータ格納部103に格納される場合を想定し、メタデータ502は、属性値の一部が欠落している場合を示す。なお、メタデータ501は、定点カメラのカメラ画像から生成されるメタデータであり、オブジェクト認識技術を利用して、人物である「山田太郎」が認識されており、メタデータ502は、一般ユーザのSNS上での発信から生成されるメタデータであり、メタデータ503は、避難所における音声信号やwebなどにアップロードされるテキストデータから、音声認識技術や自然言語処理技術を利用して生成されるメタデータであると想定する。
Next, a specific example of associating with a missing attribute value will be described with reference to FIG.
FIG. 5 assumes a case in which metadata 501, 502, and 503 are stored in the metadata storage unit 103 in this order, and the metadata 502 shows a case where some of the attribute values are missing. Note that the metadata 501 is metadata generated from the camera image of the fixed point camera, and the person “Taro Yamada” is recognized using the object recognition technology. This metadata is generated from transmission on the SNS, and the metadata 503 is generated by using a speech recognition technology or a natural language processing technology from text data uploaded to a speech signal or a web in a shelter. Assume metadata.

具体的には、メタデータ502の属性「写真」に対応する属性値504および属性「状況」に対応する属性値505が欠落している。つまり、このメタデータ502は、鈴木花子が「山田太郎の状況を知りたい」といった情報を発信した場合に、自然言語処理技術を利用して生成されるメタデータの例である。   Specifically, the attribute value 504 corresponding to the attribute “photo” in the metadata 502 and the attribute value 505 corresponding to the attribute “situation” are missing. That is, this metadata 502 is an example of metadata generated using natural language processing technology when Hanako Suzuki sends information such as “I want to know the situation of Taro Yamada”.

図4のステップS402およびステップS403に従って、対応関係を比較すると、氏名「山田太郎」が一致しており、メタデータ501に対応付けられる画像は、山田太郎であると判定でき、日時「2011/3/11 14:50」の時点では、生存確認という情報を得ることができる。   When the correspondences are compared according to step S402 and step S403 in FIG. 4, the name “Taro Yamada” matches, and the image associated with the metadata 501 can be determined to be Taro Yamada. / 11 14:50 ", information on survival confirmation can be obtained.

続いて、新規にメタデータ503が格納されると、ステップS405およびステップS406に従って、属性値に欠損のあるメタデータ502と対応関係が比較される。このとき、氏名「山田太郎」が一致し、メタデータ502の欠落した属性「状況」とメタデータ503の属性「状況」とが一致するので、欠落した属性値に、メタデータ503の属性値「生存確認」を対応付けることができる。これによって、新たな情報として、山田太郎が生存しているという情報を抽出することができる。このように、例えば、人物を捜す場合に、その人物に関する以前の情報や最新の情報を的確に検索することができる。   Subsequently, when the metadata 503 is newly stored, the correspondence is compared with the metadata 502 having a missing attribute value in accordance with steps S405 and S406. At this time, the name “Taro Yamada” matches and the missing attribute “situation” of the metadata 502 matches the attribute “situation” of the metadata 503, so that the attribute value “ “Survival confirmation” can be associated. As a result, information that Taro Yamada is alive can be extracted as new information. Thus, for example, when searching for a person, it is possible to accurately retrieve previous information and latest information about the person.

以上に示した第1の実施形態によれば、複数の情報源から規格化されていないメタデータを収集する場合でも、メタデータに含まれる属性および属性値の類似性に基づいて判定することで、情報を適切に管理および検索することができる。また、情報が欠損している場合でも、他のメタデータから情報を補充することができ、多種多様なデータから必要な情報を検索することができ、より精度の高い情報を得ることができる。   According to the first embodiment described above, even when metadata that is not standardized is collected from a plurality of information sources, it is determined based on the similarity of attributes and attribute values included in the metadata. Information can be managed and searched properly. In addition, even when information is missing, information can be supplemented from other metadata, and necessary information can be searched from a wide variety of data, and more accurate information can be obtained.

(第2の実施形態)
第2の実施形態では、複数の情報源間の関心関係(フォロー関係)を参照して、メタデータを検索する点が異なる。
(Second Embodiment)
The second embodiment is different in that metadata is searched with reference to an interest relationship (follow relationship) between a plurality of information sources.

第2の実施形態に係る情報処理装置を含む情報処理システムについて図6のブロック図を参照して説明する。
第2の実施形態に係る情報処理システム600は、情報源151、152、153、154および155、メタデータ生成部161、162、163、164および165、および、情報処理装置601を含む。また、情報処理装置601は、メタデータ収集部102、メタデータ格納部103、表示部105、フォロー関係格納部602およびメタデータ検索部603を含む。
An information processing system including an information processing apparatus according to the second embodiment will be described with reference to the block diagram of FIG.
An information processing system 600 according to the second embodiment includes information sources 151, 152, 153, 154 and 155, metadata generation units 161, 162, 163, 164 and 165, and an information processing device 601. The information processing apparatus 601 includes a metadata collection unit 102, a metadata storage unit 103, a display unit 105, a follow relationship storage unit 602, and a metadata search unit 603.

フォロー関係格納部602およびメタデータ検索部603以外は、第1の実施形態と同様であるのでここでの説明は省略する。   Other than the follow relationship storage unit 602 and the metadata search unit 603 are the same as those in the first embodiment, and a description thereof will be omitted here.

フォロー関係格納部602は、複数の情報源のフォロー関係を格納する。フォロー関係は、例えば、複数の情報源各々を擬人化して、それぞれがSNSのIDを有し、お互いに関心があるかどうかを示すSNSにおけるフォロー関係を格納すればよい。具体的には、ある市民が商業施設Aのカメラの映像(いわゆるLIVEカメラなど)に興味があったり、ある自治体からの情報の発信に興味があったりする場合、フォロー関係を結ぶことができる。ここで、フォロー関係には方向性があり、ここの例では、フォロー者である市民が、非フォロー者である商業施設Aのカメラの映像、および自治体に対して、フォロー関係が結ばれる。なお、フォロー関係格納部602は、外部にあるフォロー関係のデータベースを参照するようにしてもよい。   The follow relationship storage unit 602 stores follow relationships of a plurality of information sources. The follow relationship may be, for example, an anthropomorphic of each of a plurality of information sources, each having an SNS ID, and storing the follow relationship in the SNS indicating whether or not they are interested in each other. Specifically, when a citizen is interested in a camera image of a commercial facility A (so-called LIVE camera or the like) or interested in sending information from a certain local government, a follow relationship can be established. Here, the follow relationship has a direction, and in this example, the follower is connected to the video of the camera of the commercial facility A, which is a non-follower, and the local government. The follow relationship storage unit 602 may refer to an external follow relationship database.

メタデータ検索部603は、メタデータ検索部104とほぼ同様であるが、フォロー関係格納部602に格納されるフォロー関係を参照して、対応メタデータを検索する点が異なる。   The metadata search unit 603 is substantially the same as the metadata search unit 104, except that the corresponding metadata is searched with reference to the follow relationship stored in the follow relationship storage unit 602.

次に、第2の実施形態に係るメタデータ検索部603の検索処理について図7のフローチャートを参照して説明する。   Next, search processing of the metadata search unit 603 according to the second embodiment will be described with reference to the flowchart of FIG.

ステップS301からステップS307、ステップS401からステップS406までの処理は、図4のフローチャートと同様であるのでここでの説明は省略する。   Since the processing from step S301 to step S307 and from step S401 to step S406 is the same as that in the flowchart of FIG. 4, description thereof is omitted here.

ステップS701では、抽出した対応メタデータのうち、アカウントIDのそれぞれフォロー関係についてフォロー関係格納部602を参照し、新規に格納されたメタデータのアカウントIDをフォローしている、アカウントIDのメタデータを優先して抽出する。   In step S701, the metadata of the account ID that follows the account ID of the newly stored metadata is referred to the follow relationship storage unit 602 for each follow relationship of the account ID among the extracted corresponding metadata. Extract with priority.

次に、フォロー関係を用いた対応メタデータの検索処理の具体例について図8を参照して説明する。
図8に示すように、フォロー関係801は、アカウントID802とフォローID803とが対応付けられる。アカウントID802は、メタデータに含まれるアカウントIDと同一である。フォローID803は、アカウントID802をフォローしているIDを示し、ここでは、人物名をフォローIDとする。
Next, a specific example of the corresponding metadata search processing using the follow relationship will be described with reference to FIG.
As shown in FIG. 8, in the follow relationship 801, an account ID 802 and a follow ID 803 are associated with each other. The account ID 802 is the same as the account ID included in the metadata. The follow ID 803 indicates an ID that follows the account ID 802. Here, the person name is a follow ID.

図8の例では、商業施設Aの定点カメラAに火災の動画像が撮像されており、メタデータ804が得られる。市民である佐藤一郎が「商業施設Aで火事」とSNS上で発言し、メタデータ805を得る。また、山本二郎も「商業施設Aで煙」とSNS上で発言し、メタデータ806を得た想定する。
このとき、フォロー関係801を参照すると、佐藤一郎は商業施設Aの定点カメラをフォローしており、山本二郎は商業施設Aの定点カメラをフォローしていない。商業施設Aの定点カメラをフォローしている山本二郎は、商業施設Aの定点カメラをフォローしていない佐藤一郎よりも、商業施設Aの定点カメラに対して関心が高いと考えられる。よって、佐藤一郎の発言は、山本二郎の発言よりも、現地の状況を反映していると考えられるので、メタデータ805が優先して対応メタデータとして抽出される。
In the example of FIG. 8, a fire moving image is captured by the fixed point camera A of the commercial facility A, and metadata 804 is obtained. Ichiro Sato, a citizen, says on the SNS “Fire at Commercial Facility A” and gets metadata 805. In addition, it is assumed that Jiro Yamamoto also said “Smoke at commercial facility A” on SNS and obtained metadata 806.
At this time, referring to the follow relationship 801, Ichiro Sato follows the fixed point camera of the commercial facility A, and Jiro Yamamoto does not follow the fixed point camera of the commercial facility A. Jiro Yamamoto, who is following the fixed point camera at commercial facility A, is considered more interested in the fixed point camera at commercial facility A than Ichiro Sato, who is not following the fixed point camera at commercial facility A. Therefore, the speech of Ichiro Sato is considered to reflect the local situation rather than the speech of Jiro Yamamoto, so the metadata 805 is preferentially extracted as corresponding metadata.

以上に示した第2の実施形態によれば、フォロー関係を参照することにより、より信頼性が高い情報源のメタデータを抽出することができる。   According to the second embodiment described above, it is possible to extract metadata of an information source with higher reliability by referring to the follow relationship.

(第3の実施形態)
第3の実施形態では、フォロー関係を参照して対応メタデータの重要度を決定する点が異なる。
(Third embodiment)
The third embodiment is different in that the importance of the corresponding metadata is determined with reference to the follow relationship.

第3の実施形態に係る情報処理装置を含む情報処理システムについて図9のブロック図を参照して説明する。
第2の実施形態に係る情報処理システム900は、情報源151、152、153、154および155、メタデータ生成部161、162、163、164および165、および、情報処理装置901を含む。また、情報処理装置901は、メタデータ収集部102、メタデータ格納部103、表示部105、メタデータ検索部104、フォロー関係格納部602および重要度算出部902を含む。なお、第2の実施形態と同様に、フォロー関係格納部602を含まずに、外部のフォロー関係を参照するようにしてもよい。
重要度算出部902以外は、第1の実施形態と同様であるのでここでの説明は省略する。
An information processing system including an information processing apparatus according to the third embodiment will be described with reference to the block diagram of FIG.
An information processing system 900 according to the second embodiment includes information sources 151, 152, 153, 154 and 155, metadata generation units 161, 162, 163, 164 and 165, and an information processing device 901. The information processing apparatus 901 includes a metadata collection unit 102, a metadata storage unit 103, a display unit 105, a metadata search unit 104, a follow relationship storage unit 602, and an importance level calculation unit 902. Note that, as in the second embodiment, an external follow relationship may be referred to without including the follow relationship storage unit 602.
Except for the importance calculation unit 902, the process is the same as that of the first embodiment, and a description thereof will be omitted.

重要度算出部902は、フォロー関係格納部602に格納されるフォロー関係を参照して、対応メタデータごとに重要度を算出する。   The importance calculation unit 902 refers to the follow relationship stored in the follow relationship storage unit 602 and calculates the importance for each corresponding metadata.

次に、第3の実施形態に係るメタデータ検索部104および重要度算出部902の動作について図10のフローチャートを参照して説明する。
ステップS301からステップS307まで、ステップS401からステップS406まで、およびステップS701の処理については上述したのと同様の処理を行なうのでここでの説明を省略する。
ステップS1001では、ステップS701で抽出されたメタデータに対して、このメタデータのアカウントIDをフォローしている他のアカウントIDの件数を算出し、重要度を決定する。重要度は、件数が多いほど重要度を高く設定してもよいし、各アカウントIDに対して年齢や地域などを関連づけたメタデータを構築しておき、それらの情報で重み付けを行って重要度を設定してもよい。
ステップS1002では、対応するメタデータの重要度が高い順に出力する。例えば、重要度が高い上位3つを出力すればよい。なお、重要度を付けた全ての対応メタデータを出力してもよい。
Next, operations of the metadata search unit 104 and the importance calculation unit 902 according to the third embodiment will be described with reference to the flowchart of FIG.
The processing from step S301 to step S307, from step S401 to step S406, and step S701 is the same as that described above, so description thereof is omitted here.
In step S1001, the number of other account IDs that follow the metadata account ID is calculated for the metadata extracted in step S701, and the importance is determined. The importance may be set higher as the number of cases increases, or metadata that associates the age or region with each account ID is built, and weighted with those information May be set.
In step S1002, the corresponding metadata is output in descending order of importance. For example, it is only necessary to output the top three highest importance levels. It should be noted that all corresponding metadata to which importance is attached may be output.

以上に示した第3の実施形態によれば、フォロー関係に基づいて重要度を算出することにより、信頼度が高い情報源のメタデータを抽出することができる。   According to the third embodiment described above, metadata of an information source with high reliability can be extracted by calculating the importance based on the follow relationship.

上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した情報処理装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の情報処理装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
The instructions shown in the processing procedure shown in the above-described embodiment can be executed based on a program that is software. The general-purpose computer system stores this program in advance and reads this program, so that the same effect as that obtained by the information processing apparatus described above can be obtained. The instructions described in the above-described embodiments are, as programs that can be executed by a computer, magnetic disks (flexible disks, hard disks, etc.), optical disks (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD). ± R, DVD ± RW, Blu-ray (registered trademark) Disc, etc.), semiconductor memory, or a similar recording medium. As long as the recording medium is readable by the computer or the embedded system, the storage format may be any form. If the computer reads the program from the recording medium and causes the CPU to execute instructions described in the program based on the program, the same operation as the information processing apparatus of the above-described embodiment can be realized. Of course, when the computer acquires or reads the program, it may be acquired or read through a network.
In addition, the OS (operating system), database management software, MW (middleware) such as a network, etc. running on the computer based on the instructions of the program installed in the computer or embedded system from the recording medium implement this embodiment. A part of each process for performing may be executed.
Furthermore, the recording medium in the present embodiment is not limited to a medium independent of a computer or an embedded system, but also includes a recording medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.
Further, the number of recording media is not limited to one, and when the processing in this embodiment is executed from a plurality of media, it is included in the recording medium in this embodiment, and the configuration of the media may be any configuration.

なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
The computer or the embedded system in the present embodiment is for executing each process in the present embodiment based on a program stored in a recording medium. The computer or the embedded system includes a single device such as a personal computer or a microcomputer. The system may be any configuration such as a system connected to the network.
In addition, the computer in this embodiment is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device. ing.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

100,600,900・・・情報処理システム、101,601,901・・・情報処理装置、102・・・メタデータ収集部、103・・・メタデータ格納部、104,603・・・メタデータ検索部、105・・・表示部、106・・・シソーラス辞書、151〜155・・・情報源、161〜165・・・メタデータ生成部、200,210,501〜503,804〜806・・・メタデータ、201・・・属性、202,504,505・・・属性値、203,802・・・アカウントID、204・・・位置情報、205・・・日時情報、206・・・事象、207・・・状況、602・・・フォロー関係格納部、801・・・フォロー関係、803・・・フォローID、902・・・重要度算出部。 100, 600, 900 ... Information processing system, 101, 601, 901 ... Information processing apparatus, 102 ... Metadata collection unit, 103 ... Metadata storage unit, 104, 603 ... Metadata Retrieval part, 105 ... Display part, 106 ... Thesaurus dictionary, 151 to 155 ... Information source, 161 to 165 ... Metadata generation part, 200, 210, 501 to 503, 804 to 806 ... Metadata, 201 ... attribute, 202,504,505 ... attribute value, 203,802 ... account ID, 204 ... location information, 205 ... date / time information, 206 ... event, 207 ... Situation, 602 ... Follow relationship storage unit, 801 ... Follow relationship, 803 ... Follow ID, 902 ... Importance calculation unit.

Claims (10)

情報を発信する複数の情報源から、前記複数の情報源で共通の規格を有していない該情報に関する第1メタデータをそれぞれ収集する収集部と、
前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納する格納部と、
新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出する検索部とを具備することを特徴とする情報処理装置。
A collection unit that respectively collects first metadata related to the information that does not have a common standard among the plurality of information sources from a plurality of information sources that transmit information;
A storage unit that stores a first attribute indicating an item of an element included in the first metadata and a first attribute value that is a value corresponding to the first attribute in association with each first metadata;
Based on the correspondence between the second attribute indicating the item of the element included in the newly acquired second metadata, the second attribute value corresponding to the second attribute, and the first attribute and the first attribute value An information processing apparatus comprising: a search unit that searches a plurality of the first metadata and extracts corresponding metadata that is the first metadata corresponding to the second metadata.
前記第1属性は、前記情報源の識別子、該情報源の位置情報および該情報源が前記情報を生成した日時情報を含み、
前記検索部は、前記第2属性と前記第1属性との類似度が閾値以上であるか、前記第2属性値と前記第1属性値との類似度が前記閾値以上であるかの少なくともどちらか一方に基づいて、前記対応メタデータを抽出することを特徴とする請求項1に記載の情報処理装置。
The first attribute includes an identifier of the information source, position information of the information source, and date information when the information source generated the information,
The search unit has at least either the similarity between the second attribute and the first attribute is greater than or equal to a threshold, or the similarity between the second attribute value and the first attribute value is greater than or equal to the threshold. The information processing apparatus according to claim 1, wherein the corresponding metadata is extracted based on one of them.
前記第1属性は、前記情報源の識別子、該情報源の位置情報および該情報源が前記情報を生成した日時情報を含み、
前記検索部は、シソーラス辞書を参照することにより、前記第2属性および前記第2属性値と類似する第1属性および第1属性値を含む第1メタデータを、前記対応メタデータとして抽出することを特徴とする請求項1に記載の情報処理装置。
The first attribute includes an identifier of the information source, position information of the information source, and date information when the information source generated the information,
The search unit extracts, as the corresponding metadata, first metadata including a first attribute and a first attribute value similar to the second attribute and the second attribute value by referring to a thesaurus dictionary. The information processing apparatus according to claim 1.
前記検索部は、前記第2メタデータに含まれる前記第2属性に対応する前記第2属性値の少なくとも一部が欠損している場合、前記第2属性との類似度が閾値以上である第1属性を有する第1メタデータを前記対応メタデータとして抽出し、前記第1メタデータに含まれる前記第1属性に対応する前記第1属性値の少なくとも一部が欠損している場合、前記第1属性との類似度が閾値以上である第2属性を有する第2メタデータを前記対応メタデータとして抽出することを特徴とする請求項1から請求項3のいずれか1項に記載の情報処理装置。   When at least a part of the second attribute value corresponding to the second attribute included in the second metadata is missing, the search unit has a similarity with the second attribute equal to or greater than a threshold value. When the first metadata having one attribute is extracted as the corresponding metadata, and at least part of the first attribute value corresponding to the first attribute included in the first metadata is missing, the first metadata The information processing according to any one of claims 1 to 3, wherein second metadata having a second attribute whose similarity with one attribute is equal to or greater than a threshold is extracted as the corresponding metadata. apparatus. 前記検索部は、前記複数の情報源が同一のシステムを利用するための識別子をそれぞれ有する場合、該複数の情報源に対応する識別子同士の関係を示すフォロー関係を参照して、前記第2メタデータを生成した情報源に対して該フォロー関係を有する第1メタデータを優先して前記対応メタデータとして抽出することを特徴とする請求項1から請求項4のいずれか1項に記載の情報処理装置。   When the plurality of information sources have identifiers for using the same system, the search unit refers to a follow relationship indicating a relationship between identifiers corresponding to the plurality of information sources, and The information according to any one of claims 1 to 4, wherein the first metadata having the follow relationship is preferentially extracted as the corresponding metadata with respect to the information source that generated the data. Processing equipment. 前記検索部は、前記フォロー関係を参照して、前記情報源に対して関心を有する人数が多いほど、該情報源から発信された前記対応メタデータの重要度を高く設定することを特徴とする請求項5に記載の情報処理装置。   The search unit refers to the follow relationship, and sets a higher importance level of the corresponding metadata transmitted from the information source as the number of people interested in the information source increases. The information processing apparatus according to claim 5. 前記収集部は、前記情報源が一般ユーザである場合は、該一般ユーザが作成したテキストに含まれる地名から該情報源の位置情報を収集することを特徴とする請求項1から請求項6のいずれか1項に記載の情報処理装置。   The said collection part collects the positional information on this information source from the place name contained in the text created by this general user, when the said information source is a general user. The information processing apparatus according to any one of claims. 前記情報源は、商業施設または道路に設置され動画像または静止画像を撮像する定点カメラ、避難所に設置される音声信号を取得するマイク、自治体またはマスメディアから発表される災害情報、気象に関する情報、および一般ユーザから発信される災害情報の少なくともいずれか1つを含むことを特徴とする請求項1から請求項7のいずれか1項に記載の情報処理装置。   The information source is a fixed-point camera that is installed in a commercial facility or road and captures a moving image or a still image, a microphone that acquires an audio signal installed in an evacuation center, disaster information announced by a local government or mass media, and information on weather The information processing apparatus according to claim 1, further comprising at least one of disaster information transmitted from a general user. 情報を発信する複数の情報源から、前記複数の情報源で共通の規格化を有していない該情報に関する第1メタデータをそれぞれ収集し、
前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納部に格納し、
新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出することを特徴とする情報処理方法。
Collecting first metadata about the information that does not have a standardization common to the plurality of information sources from a plurality of information sources that transmit the information;
Storing a first attribute indicating an item of an element included in the first metadata and a first attribute value that is a value corresponding to the first attribute in the storage unit in association with each first metadata;
Based on the correspondence between the second attribute indicating the item of the element included in the newly acquired second metadata, the second attribute value corresponding to the second attribute, and the first attribute and the first attribute value An information processing method characterized by searching a plurality of the first metadata and extracting corresponding metadata that is the first metadata corresponding to the second metadata.
コンピュータを、
情報を発信する複数の情報源から、前記複数の情報源で共通の規格を有していない該情報に関する第1メタデータをそれぞれ収集する収集手段と、
前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納する格納手段と、
新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出する検索手段として機能させるための情報処理プログラム。
Computer
Collecting means for collecting, from each of a plurality of information sources that transmit information, first metadata relating to the information that does not have a common standard among the plurality of information sources;
Storage means for storing a first attribute indicating an item of an element included in the first metadata and a first attribute value that is a value corresponding to the first attribute in association with each first metadata;
Based on the correspondence between the second attribute indicating the item of the element included in the newly acquired second metadata, the second attribute value corresponding to the second attribute, and the first attribute and the first attribute value An information processing program for causing a plurality of first metadata to be searched and functioning as search means for extracting corresponding metadata that is the first metadata corresponding to the second metadata.
JP2013180699A 2013-08-30 2013-08-30 Information processing apparatus, method, and program Active JP6239318B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013180699A JP6239318B2 (en) 2013-08-30 2013-08-30 Information processing apparatus, method, and program
US14/469,906 US20150066931A1 (en) 2013-08-30 2014-08-27 Information processing apparatus and method
CN201410436765.XA CN104424357A (en) 2013-08-30 2014-08-29 Information processing apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013180699A JP6239318B2 (en) 2013-08-30 2013-08-30 Information processing apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2015049697A true JP2015049697A (en) 2015-03-16
JP6239318B2 JP6239318B2 (en) 2017-11-29

Family

ID=52584719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013180699A Active JP6239318B2 (en) 2013-08-30 2013-08-30 Information processing apparatus, method, and program

Country Status (3)

Country Link
US (1) US20150066931A1 (en)
JP (1) JP6239318B2 (en)
CN (1) CN104424357A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017224158A (en) * 2016-06-15 2017-12-21 国立大学法人 東京大学 Information processing device, data retrieval method, program, data structure and data processing system
JP2018169697A (en) * 2017-03-29 2018-11-01 西日本電信電話株式会社 Video data processing apparatus, video data processing method, and computer program
JP2020170299A (en) * 2019-04-02 2020-10-15 Kddi株式会社 Video search system, tag management device, computer program, and video search method

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9471954B2 (en) * 2015-03-16 2016-10-18 International Business Machines Corporation Video sequence assembly
JP6501007B1 (en) * 2018-02-13 2019-04-17 オムロン株式会社 OUTPUT MANAGEMENT DEVICE, OUTPUT MANAGEMENT METHOD, AND PROGRAM

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113984A (en) * 2004-10-18 2006-04-27 Sony Corp Information providing system, metadata collection analysis server, and computer program
JP2007164702A (en) * 2005-12-16 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> Disaster prevention information sharing system, disaster prevention information transmitting terminal, and disaster prevention information processor
JP2007193532A (en) * 2006-01-18 2007-08-02 Toshiba Corp Metadata retrieval device, metadata retrieval method, and metadata retrieval program
US20110225178A1 (en) * 2010-03-11 2011-09-15 Apple Inc. Automatic discovery of metadata
WO2011161851A1 (en) * 2010-06-22 2011-12-29 パナソニック株式会社 Content management device, method of content management, content management program and integrated circuit
JP2012527157A (en) * 2009-05-13 2012-11-01 ティヴォ インク Correlation of media metadata collected from various sources

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9792351B2 (en) * 2005-06-10 2017-10-17 International Business Machines Corporation Tolerant and extensible discovery of relationships in data using structural information and data analysis
EP2252050B1 (en) * 2009-05-13 2014-06-25 Sony Europe Limited A method of recommending local and remote content
US8463756B2 (en) * 2010-04-21 2013-06-11 Haileo, Inc. Systems and methods for building a universal multimedia learner
US8856121B1 (en) * 2011-04-28 2014-10-07 Adobe Systems Incorporated Event based metadata synthesis
US9305083B2 (en) * 2012-01-26 2016-04-05 Microsoft Technology Licensing, Llc Author disambiguation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113984A (en) * 2004-10-18 2006-04-27 Sony Corp Information providing system, metadata collection analysis server, and computer program
JP2007164702A (en) * 2005-12-16 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> Disaster prevention information sharing system, disaster prevention information transmitting terminal, and disaster prevention information processor
JP2007193532A (en) * 2006-01-18 2007-08-02 Toshiba Corp Metadata retrieval device, metadata retrieval method, and metadata retrieval program
JP2012527157A (en) * 2009-05-13 2012-11-01 ティヴォ インク Correlation of media metadata collected from various sources
US20110225178A1 (en) * 2010-03-11 2011-09-15 Apple Inc. Automatic discovery of metadata
WO2011161851A1 (en) * 2010-06-22 2011-12-29 パナソニック株式会社 Content management device, method of content management, content management program and integrated circuit

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
川村隆浩: "セマンティックWebサービスへのファーストステップ", 人工知能学会誌, vol. 20, no. 6, JPN6017006579, 1 November 2005 (2005-11-01), pages 649 - 657, ISSN: 0003507492 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017224158A (en) * 2016-06-15 2017-12-21 国立大学法人 東京大学 Information processing device, data retrieval method, program, data structure and data processing system
JP2018169697A (en) * 2017-03-29 2018-11-01 西日本電信電話株式会社 Video data processing apparatus, video data processing method, and computer program
JP2020170299A (en) * 2019-04-02 2020-10-15 Kddi株式会社 Video search system, tag management device, computer program, and video search method

Also Published As

Publication number Publication date
JP6239318B2 (en) 2017-11-29
CN104424357A (en) 2015-03-18
US20150066931A1 (en) 2015-03-05

Similar Documents

Publication Publication Date Title
JP6239318B2 (en) Information processing apparatus, method, and program
US10692506B2 (en) Keyword determinations from conversational data
US9418143B2 (en) Dynamic language model
US20150187353A1 (en) Audio tagging
JP6300889B2 (en) System and method for improving extraction performance of atypical text
US9569467B1 (en) Intelligent news management platform and social network
US9972340B2 (en) Deep tagging background noises
US20160019659A1 (en) Predicting the business impact of tweet conversations
WO2021120818A1 (en) Methods and systems for managing image collection
US10891959B1 (en) Voice message capturing system
JP2014130445A (en) Information extraction server, information extraction client, information extraction method, and information extraction program
WO2015052785A1 (en) Information processing system
EP3493078A1 (en) Environment information storage and playback method, and storage and playback system and terminal
US9224388B2 (en) Sound recognition method and system
JP6267298B1 (en) Providing device, providing method, providing program, terminal device, output method, and output program
KR20180052334A (en) Automatic news text formation method and system based on mobile and web program
JP2013152607A (en) Management program and device
US11909914B2 (en) Forwarding emergency messages from IoT devices to PSAPs
US20220342930A1 (en) Systems and methods to increase viewership of online content
JP7470523B2 (en) Control device, control method, and control program
WO2020129465A1 (en) Information processing device, information processing system, information processing method, and program
JP2018054926A (en) Voice interactive apparatus and voice interactive method
JP2020042071A (en) Information processing device and information processing method
WO2018097181A1 (en) Knowledge construction and utilization system and program
JPWO2020039754A1 (en) Information processing device and information processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170414

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170815

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170823

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20170904

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171101

R150 Certificate of patent or registration of utility model

Ref document number: 6239318

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150