JP6239318B2 - 情報処理装置、方法およびプログラム - Google Patents

情報処理装置、方法およびプログラム Download PDF

Info

Publication number
JP6239318B2
JP6239318B2 JP2013180699A JP2013180699A JP6239318B2 JP 6239318 B2 JP6239318 B2 JP 6239318B2 JP 2013180699 A JP2013180699 A JP 2013180699A JP 2013180699 A JP2013180699 A JP 2013180699A JP 6239318 B2 JP6239318 B2 JP 6239318B2
Authority
JP
Japan
Prior art keywords
metadata
information
attribute
attribute value
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013180699A
Other languages
English (en)
Other versions
JP2015049697A (ja
Inventor
長野 伸一
伸一 長野
隆浩 川村
隆浩 川村
洋一 島田
洋一 島田
善之 松田
善之 松田
小林 義孝
義孝 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2013180699A priority Critical patent/JP6239318B2/ja
Priority to US14/469,906 priority patent/US20150066931A1/en
Priority to CN201410436765.XA priority patent/CN104424357A/zh
Publication of JP2015049697A publication Critical patent/JP2015049697A/ja
Application granted granted Critical
Publication of JP6239318B2 publication Critical patent/JP6239318B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は、情報処理装置、方法およびプログラムに関する。
官公庁や各自治体、および市民などから情報を広域的に収集し、状況を監視するシステムが要求されている。例えば、災害が発生した場合に複数の情報源から情報を収集し、市民の安否情報などを一元管理することは、情報の信頼性の面でも有用である。このようなシステムとしては、地理空間情報と管理したい情報とを関連付けて統一管理する手法がある。
特開2012−194620号公報
しかし、上述の手法において、所管が異なる複数の地域情報、防災情報を融合して統合管理するためには、データを統一するための規格化が必須であり、さらに管理対象となる情報は、地理空間情報との関連づけが必須となる。そのため、データを収集できる情報源が限定され、例えば自治体の管轄外の地域の状況などは把握することができない。
本発明は、上述した課題を解決するためになされたものであり、複数の情報源からの情報を適切に管理および検索することができる情報処理装置、方法、およびプログラムを提供することを目的とする。
本発明の一実施形態に係る情報処理装置は、収集部、格納部および検索部を含む。収集部は、情報を発信する複数の情報源から、前記複数の情報源で共通の規格を有していない該情報に関する第1メタデータをそれぞれ収集する。格納部は、前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納する。検索部は、新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出する。
第1の実施形態に係る情報処理装置を含む情報処理システムを示すブロック図。 メタデータ格納部に格納されるメタデータの一例を示す図。 第1の実施形態に係るメタデータ検索部の検索処理を示すフローチャート。 第1の実施形態の変形例に係るメタデータ検索部の検索処理を示すフローチャート。 欠損した属性値に対応付ける場合の一例を示す図。 第2の実施形態に係る情報処理装置を含む情報処理システムを示すブロック図。 第2の実施形態に係るメタデータ検索部の検索処理を示すフローチャート。 第2の実施形態に係るメタデータ検索部の検索処理の具体例を示す図。 第3の実施形態に係る情報処理装置を含む情報処理システムを示すブロック図。 第3の実施形態に係るメタデータ検索部および重要度算出部の処理を示すフローチャート。
以下、図面を参照しながら本開示の一実施形態に係る情報処理装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の番号を付した部分については同様の動作を行なうものとして、重ねての説明を省略する。
(第1の実施形態)
第1の実施形態に係る情報処理装置を含む情報処理システムについて図1のブロック図を参照して説明する。なお、本実施形態では、災害時における情報収集を一例として説明するが、これに限らず、どのようなイベントに対しても適用できる。例えば、自治体が企画した花火大会、講演会、商業施設の安売り日などといった情報や、電車の運行状況や道路の渋滞などといった交通機関の情報などに対しても同様に適用することができる。
第1の実施形態に係る情報処理システム100は、情報源151、152、153、154および155、メタデータ生成部161、162、163、164および165、情報処理装置101およびシソーラス辞書106を含む。また、情報処理装置101は、メタデータ収集部102、メタデータ格納部103、メタデータ検索部104および表示部105を含む。
情報源151は、例えば、商業施設、避難所、道路に設置される定点カメラであり、カメラにより動画像を生成する。
情報源152は、例えば、公共施設や避難所に設置されるマイクであり、マイクに向かってユーザが話すことにより、ユーザの音声信号を生成する。
情報源153は、例えば、自治体およびマスメディアからの災害発表または公式発表であり、自治体やメディアから発信される情報をwebなどによるテキストデータを生成する。なお、公式会見などといった音声による発表であれば、音声信号を生成してもよい。
情報源154は、例えば気象センサーであり、気温や湿度、風速などといった気象に関する情報を数値として生成する。
情報源155は、例えば、SNS(ソーシャルネットワーキングサービス)を利用する一般市民(一般ユーザともいう)であり、SNSを利用して一般ユーザが投稿した災害情報などのテキストデータを生成する。なお、一般ユーザが、動画および音声などにより情報を発信した場合は、それぞれ動画像および音声信号を取得すればよい。
メタデータ生成部161は、情報源151からカメラ画像(静止画、または動画)を受け取り、カメラ画像を取得したカメラの識別子(ID)、カメラ画像を取得した日時に関する日時情報、カメラが設置される位置に関する位置情報を含むメタデータを生成し、カメラ画像と対応付ける。また、オブジェクト認識技術を利用して、カメラ画像に映っている人物や、ビルや自動車などの物体、火災や煙などの災害事象を認識し、認識したオブジェクトの名称をメタデータに含めてよい。さらには、認識した人物の顔画像を、SNSなど顔画像が登録されたサービスを利用して、登録されているプロフィール画像と照合し、該人物の姓名をメタデータに含めてよい。また、OCR技術を利用して、カメラ画像に映っている文字画像を認識してテキストを抽出し、メタデータに含めてよい。
メタデータ生成部162は、情報源152から音声信号を受け取り、音声信号を取得したマイクの識別子(ID)、音声信号を取得した日時に関する日時情報、マイクが設置される位置に関する位置情報を含むメタデータを生成し、音声信号と対応付ける。また、音声認識技術を利用して、音声信号をテキストに変換してメタデータに含めてよい。さらに、自然言語処理技術を利用して、テキストから人物名や地名などの固有表現を抽出し、それらをメタデータに含めてよい。
メタデータ生成部163は、情報源153からテキストデータを受け取り、テキストデータを発表した自治体やメディアの識別子(ID)、テキストデータが発表された日時に関する日時情報、自治体およびメディアの所在地に関する位置情報を含むメタデータを生成し、テキストデータと対応付ける。また、自然言語処理技術を利用して、テキストデータから人物名や地名などの固有表現を抽出し、それらをメタデータに含めてよい。
メタデータ生成部164は、情報源154から観測対象に対して観測した数値を受け取り、観測対象を示す識別子(ID)、数値を取得した日時に関する日時情報、どの地域に関する情報であるかを示す位置情報を含むメタデータを生成し、数値と対応付ける。
メタデータ生成部165は、情報源155からテキストデータを受け取り、テキストデータを作成したユーザのID、テキストデータを作成した日時に関する日時情報を含むメタデータを生成し、テキストデータと対応付ける。また、自然言語処理技術を利用して、テキストデータから人物名や地名などの固有表現を抽出し、それらをメタデータに含めてよい。さらには、テキストデータに含まれる単語の品詞に着目して、テキストデータを作成したユーザの意図、例えば「知りたい」「欲しい」といった要望や、「避難所はどこ?」「電車動いてる?」といった質問を判定し、それらをメタデータに含めてよい。なお、情報源155においてテキストデータを生成したときの位置情報については、一般ユーザのプライバシー保護の観点から必ずしも必要としないことが望ましい。
なお、情報源151、152、153、154および155は、メタデータ生成部161、162、163、164および165をそれぞれ含んでいてもよく、メタデータ生成部の処理は、一般的な処理を用いて実現可能である。
メタデータ収集部102は、メタデータ生成部161、162、163、164および165から、メタデータをそれぞれ収集する。メタデータを収集する間隔は、一定時間間隔で収集するようにしてもよいし、情報源から新規のメタデータが生成されるたびに収集するようにしてもよい。なお、メタデータ収集の際に、メタデータと対応する動画像、音声信号、数値およびテキストデータも併せて収集してもよい。
メタデータ格納部103は、メタデータ収集部102からメタデータを受け取って格納する。メタデータ格納部103は、メタデータ収集部102においてメタデータに対応する各動画像、音声信号、数値およびテキストデータを収集する場合は、メタデータと併せてそれぞれ格納してもよい。また、各動画像、音声信号、数値およびテキストデータは、外部の格納部(図示せず)に格納し、メタデータ格納部103に格納されるメタデータと関連付けてもよい。
メタデータ検索部104は、新規に格納されるメタデータに関して、メタデータ格納部103に格納されたメタデータの中で対応するメタデータを検索し、対応するメタデータを対応メタデータとして抽出する。メタデータの検索処理は、一定時間間隔で行なってもよいし、メタデータが新規に格納されるごとに行なってもよい。メタデータ検索部104の検索処理の具体例については後述する。
表示部105は、メタデータ検索部104から対応メタデータを受け取り、例えば検索された対応メタデータをディスプレイに表示する。
シソーラス辞書106は、類義語および同義語を格納しており、メタデータ検索部104からの要求に応じて類義語および同義語を提示する。
次に、メタデータ格納部103に格納されるメタデータの一例について図2を参照して説明する。図2では、商業施設のカメラにより撮像された動画像から生成されるメタデータを例に説明する。
メタデータ200は、属性201および属性値202を含み、互いに対応付けられて、メタデータごとにメタデータ格納部103にそれぞれ格納される。属性201は、メタデータの項目名であり、属性値202は、属性201に対応する値または状態である。図2の例では、属性201として、アカウントID203、位置情報204、日時情報205、事象206、状況207を含む。
アカウントID203は、所属する施設での識別子やSNSなどにおけるアカウントを示す識別子である。ここでは施設におけるカメラのIDであり、属性201「アカウントID」と属性値202「商業施設A_カメラ1」とが対応付けられる。
位置情報204は、情報源の位置、および情報源から発信された話題の中心となる人物または施設の位置情報であり、ここでは、カメラ1が設置される位置に関する情報である。なお、位置情報は、緯度および経度に関する情報であってもよい。
日時情報205は、情報を取得した日時であり、ここでは、カメラにより撮像された日時が属性値202として格納される。
事象206は、どのような出来事が起こっているかを示す。
状況207は、事象206の状況がどのようなものかを示す。
次に、第1の実施形態に係るメタデータ検索部104の検索処理について図3のフローチャートを参照して説明する。
ステップS301では、メタデータ格納部103に新規に格納されるメタデータを読み込む。
ステップS302では、メタデータに含まれる属性および属性値から日時情報を特定し、日時情報として所定期間内に含まれる属性値を有するメタデータをメタデータ格納部103から検索する。
ステップS303では、メタデータに含まれる属性および属性値から位置情報を特定し、位置情報として所定エリア内に含まれる属性値を有するメタデータをメタデータ格納部103から検索する。
ステップS304では、ステップS302およびステップS303に基づいて該当するメタデータが存在するかどうかを判定する。該当するメタデータが存在すればステップS305へ進み、該当するメタデータが存在しなければステップS301へ戻り、同様の処理を繰り返す。
ステップS305では、該当するメタデータのうち、新規に格納されるメタデータの属性と属性が一致するメタデータを特定し、対応する属性値の類似度を算出する。
相互に共通の規格が存在しない情報源ごとにメタデータを生成する場合は、属性201として挙げられる項目名が情報源ごとに異なる可能性がある。ここで、「共通の規格」とは、メタデータに含まれる属性の名称、および属性値として取りうる値の種類と範囲を定めたものである。メタデータを表現するフォーマットは統一されているとする。そのようなデータフォーマットの例として、CSV(Comma Separated Value、カンマ区切りのテキストデータ)や、JSON(Java(登録商標) Script Object Notation)、Linked Datなどがある。このような場合は、属性値の類似度が閾値以上のメタデータを抽出すればよい。類似度が閾値以上であるかどうかの判定は、例えば、それぞれの属性値を表す文字列の編集距離やコサイン類似度を算出したり、シソーラス辞書を用いて類義語を判定すればよい。
ステップS306では、該当するメタデータのうち、新規に格納されるメタデータの属性値と属性値が一致するメタデータを特定し、対応する属性の類似度を算出して、類似度が閾値以上のメタデータを抽出する。具体的には、例えば、「日時」「日付情報」「Time」等が属性としてあれば、時間を表す類義語であるので、これらの属性の類似度は閾値以上であると判定できる。
ステップS307では、抽出したメタデータを対応メタデータとして出力する。以上でメタデータ検索部104の検索処理を終了する。なお、ステップS305およびステップS306のどちらか一方だけ処理を行なって、属性または属性値の類似度を判定してもよい。
類似度の判定の具体例について上述した図2を参照して説明する。
図2では、メタデータ200の属性201と、メタデータ210の属性201とを比較すると、位置情報204と日時情報205とは属性が一致するが、事象206と災害とは属性が一致していない。この場合、事象206の属性202「火災」と災害の属性値202「火災」とが一致しており、事象と災害との類似度が閾値以上と判定できる場合、メタデータ200に対して、メタデータ210が対応メタデータとして抽出することができる。
(第1の実施形態の変形例)
収集されるメタデータの中には、属性値の一部が欠損している、すなわち値が入っていないメタデータも想定される。このような場合でも、属性および属性値を参照して対応メタデータを得ることができる。
第1の実施形態の変形例に係るメタデータ検索部104の動作について図4のフローチャートを参照して説明する。なお、ステップS301からステップS307までの処理は、図3と同様であるので説明を省略する。
ステップS401では、新規に格納されるメタデータの属性値に欠損が含まれるかどうかを判定する。属性値に欠損が含まれる場合はステップS402に進み、属性値に欠損が含まれない場合はステップS404に進む。
ステップS402では、新規に格納されるメタデータとステップS304で該当するメタデータとを比較し、新規に格納されるメタデータの欠損した属性値に対応する属性を、ステップS304で該当するメタデータから抽出する。
ステップS403では、欠損した属性値と、ステップS402で抽出したメタデータの属性値とを対応付ける。
ステップS404では、検索されたメタデータの属性値に欠損が含まれるかどうかを判定する。属性値に欠損が含まれる場合はステップS405に進み、属性値に欠損が含まれない場合はステップS305に進み、同様の処理を繰り返す。
ステップS405では、検索されたメタデータと新規に格納されるメタデータとを比較し、検索されたメタデータの欠損した属性値に対応する属性を、新規に格納されるメタデータから抽出する。
ステップS406では、欠損した属性値と、ステップS405で抽出したメタデータの属性値とを対応付ける。以上で、属性値をする場合のメタデータ検索部104の動作を終了する。
次に、欠損した属性値に対応付ける場合の具体例について図5を参照して説明する。
図5は、メタデータ501、502および503の順に、メタデータ格納部103に格納される場合を想定し、メタデータ502は、属性値の一部が欠落している場合を示す。なお、メタデータ501は、定点カメラのカメラ画像から生成されるメタデータであり、オブジェクト認識技術を利用して、人物である「山田太郎」が認識されており、メタデータ502は、一般ユーザのSNS上での発信から生成されるメタデータであり、メタデータ503は、避難所における音声信号やwebなどにアップロードされるテキストデータから、音声認識技術や自然言語処理技術を利用して生成されるメタデータであると想定する。
具体的には、メタデータ502の属性「写真」に対応する属性値504および属性「状況」に対応する属性値505が欠落している。つまり、このメタデータ502は、鈴木花子が「山田太郎の状況を知りたい」といった情報を発信した場合に、自然言語処理技術を利用して生成されるメタデータの例である。
図4のステップS402およびステップS403に従って、対応関係を比較すると、氏名「山田太郎」が一致しており、メタデータ501に対応付けられる画像は、山田太郎であると判定でき、日時「2011/3/11 14:50」の時点では、生存確認という情報を得ることができる。
続いて、新規にメタデータ503が格納されると、ステップS405およびステップS406に従って、属性値に欠損のあるメタデータ502と対応関係が比較される。このとき、氏名「山田太郎」が一致し、メタデータ502の欠落した属性「状況」とメタデータ503の属性「状況」とが一致するので、欠落した属性値に、メタデータ503の属性値「生存確認」を対応付けることができる。これによって、新たな情報として、山田太郎が生存しているという情報を抽出することができる。このように、例えば、人物を捜す場合に、その人物に関する以前の情報や最新の情報を的確に検索することができる。
以上に示した第1の実施形態によれば、複数の情報源から規格化されていないメタデータを収集する場合でも、メタデータに含まれる属性および属性値の類似性に基づいて判定することで、情報を適切に管理および検索することができる。また、情報が欠損している場合でも、他のメタデータから情報を補充することができ、多種多様なデータから必要な情報を検索することができ、より精度の高い情報を得ることができる。
(第2の実施形態)
第2の実施形態では、複数の情報源間の関心関係(フォロー関係)を参照して、メタデータを検索する点が異なる。
第2の実施形態に係る情報処理装置を含む情報処理システムについて図6のブロック図を参照して説明する。
第2の実施形態に係る情報処理システム600は、情報源151、152、153、154および155、メタデータ生成部161、162、163、164および165、および、情報処理装置601を含む。また、情報処理装置601は、メタデータ収集部102、メタデータ格納部103、表示部105、フォロー関係格納部602およびメタデータ検索部603を含む。
フォロー関係格納部602およびメタデータ検索部603以外は、第1の実施形態と同様であるのでここでの説明は省略する。
フォロー関係格納部602は、複数の情報源のフォロー関係を格納する。フォロー関係は、例えば、複数の情報源各々を擬人化して、それぞれがSNSのIDを有し、お互いに関心があるかどうかを示すSNSにおけるフォロー関係を格納すればよい。具体的には、ある市民が商業施設Aのカメラの映像(いわゆるLIVEカメラなど)に興味があったり、ある自治体からの情報の発信に興味があったりする場合、フォロー関係を結ぶことができる。ここで、フォロー関係には方向性があり、ここの例では、フォロー者である市民が、非フォロー者である商業施設Aのカメラの映像、および自治体に対して、フォロー関係が結ばれる。なお、フォロー関係格納部602は、外部にあるフォロー関係のデータベースを参照するようにしてもよい。
メタデータ検索部603は、メタデータ検索部104とほぼ同様であるが、フォロー関係格納部602に格納されるフォロー関係を参照して、対応メタデータを検索する点が異なる。
次に、第2の実施形態に係るメタデータ検索部603の検索処理について図7のフローチャートを参照して説明する。
ステップS301からステップS307、ステップS401からステップS406までの処理は、図4のフローチャートと同様であるのでここでの説明は省略する。
ステップS701では、抽出した対応メタデータのうち、アカウントIDのそれぞれフォロー関係についてフォロー関係格納部602を参照し、新規に格納されたメタデータのアカウントIDをフォローしている、アカウントIDのメタデータを優先して抽出する。
次に、フォロー関係を用いた対応メタデータの検索処理の具体例について図8を参照して説明する。
図8に示すように、フォロー関係801は、アカウントID802とフォローID803とが対応付けられる。アカウントID802は、メタデータに含まれるアカウントIDと同一である。フォローID803は、アカウントID802をフォローしているIDを示し、ここでは、人物名をフォローIDとする。
図8の例では、商業施設Aの定点カメラAに火災の動画像が撮像されており、メタデータ804が得られる。市民である佐藤一郎が「商業施設Aで火事」とSNS上で発言し、メタデータ805を得る。また、山本二郎も「商業施設Aで煙」とSNS上で発言し、メタデータ806を得た想定する。
このとき、フォロー関係801を参照すると、佐藤一郎は商業施設Aの定点カメラをフォローしており、山本二郎は商業施設Aの定点カメラをフォローしていない。商業施設Aの定点カメラをフォローしている山本二郎は、商業施設Aの定点カメラをフォローしていない佐藤一郎よりも、商業施設Aの定点カメラに対して関心が高いと考えられる。よって、佐藤一郎の発言は、山本二郎の発言よりも、現地の状況を反映していると考えられるので、メタデータ805が優先して対応メタデータとして抽出される。
以上に示した第2の実施形態によれば、フォロー関係を参照することにより、より信頼性が高い情報源のメタデータを抽出することができる。
(第3の実施形態)
第3の実施形態では、フォロー関係を参照して対応メタデータの重要度を決定する点が異なる。
第3の実施形態に係る情報処理装置を含む情報処理システムについて図9のブロック図を参照して説明する。
第2の実施形態に係る情報処理システム900は、情報源151、152、153、154および155、メタデータ生成部161、162、163、164および165、および、情報処理装置901を含む。また、情報処理装置901は、メタデータ収集部102、メタデータ格納部103、表示部105、メタデータ検索部104、フォロー関係格納部602および重要度算出部902を含む。なお、第2の実施形態と同様に、フォロー関係格納部602を含まずに、外部のフォロー関係を参照するようにしてもよい。
重要度算出部902以外は、第1の実施形態と同様であるのでここでの説明は省略する。
重要度算出部902は、フォロー関係格納部602に格納されるフォロー関係を参照して、対応メタデータごとに重要度を算出する。
次に、第3の実施形態に係るメタデータ検索部104および重要度算出部902の動作について図10のフローチャートを参照して説明する。
ステップS301からステップS307まで、ステップS401からステップS406まで、およびステップS701の処理については上述したのと同様の処理を行なうのでここでの説明を省略する。
ステップS1001では、ステップS701で抽出されたメタデータに対して、このメタデータのアカウントIDをフォローしている他のアカウントIDの件数を算出し、重要度を決定する。重要度は、件数が多いほど重要度を高く設定してもよいし、各アカウントIDに対して年齢や地域などを関連づけたメタデータを構築しておき、それらの情報で重み付けを行って重要度を設定してもよい。
ステップS1002では、対応するメタデータの重要度が高い順に出力する。例えば、重要度が高い上位3つを出力すればよい。なお、重要度を付けた全ての対応メタデータを出力してもよい。
以上に示した第3の実施形態によれば、フォロー関係に基づいて重要度を算出することにより、信頼度が高い情報源のメタデータを抽出することができる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した情報処理装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の情報処理装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100,600,900・・・情報処理システム、101,601,901・・・情報処理装置、102・・・メタデータ収集部、103・・・メタデータ格納部、104,603・・・メタデータ検索部、105・・・表示部、106・・・シソーラス辞書、151〜155・・・情報源、161〜165・・・メタデータ生成部、200,210,501〜503,804〜806・・・メタデータ、201・・・属性、202,504,505・・・属性値、203,802・・・アカウントID、204・・・位置情報、205・・・日時情報、206・・・事象、207・・・状況、602・・・フォロー関係格納部、801・・・フォロー関係、803・・・フォローID、902・・・重要度算出部。

Claims (9)

  1. 複数の情報源から得られる情報から抽出可能な項目を用いて生成された複数の第1メタデータであって、当該複数の情報源で共通の規格を有していない複数の第1メタデータをそれぞれ収集する収集部と、
    前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納する格納部と、
    新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出する検索部とを具備し、
    前記検索部は、前記複数の情報源が同一のシステムを利用するための識別子をそれぞれ有する場合、該複数の情報源に対応する識別子同士の関係を示すフォロー関係を参照して、前記第2メタデータを生成した情報源に対して該フォロー関係を有する第1メタデータを優先して前記対応メタデータとして抽出することを特徴とする情報処理装置。
  2. 前記第1属性は、前記情報源の識別子、該情報源の位置情報および該情報源が前記情報を生成した日時情報を含み、
    前記検索部は、前記第2属性と前記第1属性との類似度が閾値以上であるか、前記第2属性値と前記第1属性値との類似度が前記閾値以上であるかの少なくともどちらか一方に基づいて、前記対応メタデータを抽出することを特徴とする請求項1に記載の情報処理装置。
  3. 前記第1属性は、前記情報源の識別子、該情報源の位置情報および該情報源が前記情報を生成した日時情報を含み、
    前記検索部は、シソーラス辞書を参照することにより、前記第2属性および前記第2属性値と類似する第1属性および第1属性値を含む第1メタデータを、前記対応メタデータとして抽出することを特徴とする請求項1に記載の情報処理装置。
  4. 前記検索部は、前記第2メタデータに含まれる前記第2属性に対応する前記第2属性値の少なくとも一部が欠損している場合、前記第2属性との類似度が閾値以上である第1属性を有する第1メタデータを前記対応メタデータとして抽出し、前記第1メタデータに含まれる前記第1属性に対応する前記第1属性値の少なくとも一部が欠損している場合、前記第1属性との類似度が閾値以上である第2属性を有する第2メタデータを前記対応メタデータとして抽出することを特徴とする請求項1から請求項3のいずれか1項に記載の情報処理装置。
  5. 前記検索部は、前記フォロー関係を参照して、前記情報源に対して関心を有する人数が多いほど、該情報源から発信された前記対応メタデータの重要度を高く設定することを特徴とする請求項1に記載の情報処理装置。
  6. 前記収集部は、前記情報源が一般ユーザである場合は、該一般ユーザが作成したテキストに含まれる地名から該情報源の位置情報を収集することを特徴とする請求項1から請求項5のいずれか1項に記載の情報処理装置。
  7. 前記情報源は、商業施設または道路に設置され動画像または静止画像を撮像する定点カメラ、避難所に設置される音声信号を取得するマイク、自治体またはマスメディアから発表される災害情報、気象に関する情報、および一般ユーザから発信される災害情報の少なくともいずれか1つを含むことを特徴とする請求項1から請求項6のいずれか1項に記載の情報処理装置。
  8. コンピュータが実行する情報処理方法であって、
    複数の情報源から得られる情報から抽出可能な項目を用いて生成された複数の第1メタデータであって、当該複数の情報源で共通の規格を有していない複数の第1メタデータをそれぞれ収集し、
    前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納部に格納し、
    新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出し、
    前記複数の情報源が同一のシステムを利用するための識別子をそれぞれ有する場合、該複数の情報源に対応する識別子同士の関係を示すフォロー関係を参照して、前記第2メタデータを生成した情報源に対して該フォロー関係を有する第1メタデータを優先して前記対応メタデータとして抽出することを特徴とする情報処理方法。
  9. コンピュータを、
    複数の情報源から得られる情報から抽出可能な項目を用いて生成された複数の第1メタデータであって、当該複数の情報源で共通の規格を有していない複数の第1メタデータをそれぞれ収集する収集手段と、
    前記第1メタデータに含まれる要素の項目を示す第1属性と、該第1属性に対応する値である第1属性値とを前記第1メタデータ毎に対応付けて格納する格納手段と、
    新たに取得した第2メタデータに含まれる要素の項目を示す第2属性および該第2属性に対応する第2属性値と、前記第1属性および前記第1属性値との対応関係に基づいて複数の前記第1メタデータを検索し、前記第2メタデータに対応する前記第1メタデータである対応メタデータを抽出する検索手段として機能させための情報処理プログラムであって、
    前記検索手段は、前記複数の情報源が同一のシステムを利用するための識別子をそれぞれ有する場合、該複数の情報源に対応する識別子同士の関係を示すフォロー関係を参照して、前記第2メタデータを生成した情報源に対して該フォロー関係を有する第1メタデータを優先して前記対応メタデータとして抽出する情報処理プログラム
JP2013180699A 2013-08-30 2013-08-30 情報処理装置、方法およびプログラム Active JP6239318B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013180699A JP6239318B2 (ja) 2013-08-30 2013-08-30 情報処理装置、方法およびプログラム
US14/469,906 US20150066931A1 (en) 2013-08-30 2014-08-27 Information processing apparatus and method
CN201410436765.XA CN104424357A (zh) 2013-08-30 2014-08-29 信息处理装置、方法以及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013180699A JP6239318B2 (ja) 2013-08-30 2013-08-30 情報処理装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2015049697A JP2015049697A (ja) 2015-03-16
JP6239318B2 true JP6239318B2 (ja) 2017-11-29

Family

ID=52584719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013180699A Active JP6239318B2 (ja) 2013-08-30 2013-08-30 情報処理装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US20150066931A1 (ja)
JP (1) JP6239318B2 (ja)
CN (1) CN104424357A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9471954B2 (en) * 2015-03-16 2016-10-18 International Business Machines Corporation Video sequence assembly
JP6811468B2 (ja) * 2016-06-15 2021-01-13 国立大学法人 東京大学 情報処理装置、データ検索方法、プログラム、データ構造及びデータ処理システム
JP6389296B1 (ja) * 2017-03-29 2018-09-12 西日本電信電話株式会社 映像データ処理装置、映像データ処理方法、及びコンピュータプログラム
JP6501007B1 (ja) * 2018-02-13 2019-04-17 オムロン株式会社 出力管理装置、出力管理方法及びプログラム
JP2020170299A (ja) * 2019-04-02 2020-10-15 Kddi株式会社 映像検索システム、タグ管理装置、コンピュータプログラム及び映像検索方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4661159B2 (ja) * 2004-10-18 2011-03-30 ソニー株式会社 情報提供システム,メタデータ収集解析サーバ,およびコンピュータプログラム
US9792351B2 (en) * 2005-06-10 2017-10-17 International Business Machines Corporation Tolerant and extensible discovery of relationships in data using structural information and data analysis
JP4627719B2 (ja) * 2005-12-16 2011-02-09 日本電信電話株式会社 防災情報共有システム
JP4468309B2 (ja) * 2006-01-18 2010-05-26 株式会社東芝 メタデータ検索装置、メタデータ検索方法およびメタデータ検索プログラム
EP2252050B1 (en) * 2009-05-13 2014-06-25 Sony Europe Limited A method of recommending local and remote content
US8316396B2 (en) * 2009-05-13 2012-11-20 Tivo Inc. Correlation of media metadata gathered from diverse sources
US8140570B2 (en) * 2010-03-11 2012-03-20 Apple Inc. Automatic discovery of metadata
US8463756B2 (en) * 2010-04-21 2013-06-11 Haileo, Inc. Systems and methods for building a universal multimedia learner
CN102576373B (zh) * 2010-06-22 2015-09-30 松下电器(美国)知识产权公司 内容管理装置、内容管理方法、内容管理程序及集成电路
US8856121B1 (en) * 2011-04-28 2014-10-07 Adobe Systems Incorporated Event based metadata synthesis
US9305083B2 (en) * 2012-01-26 2016-04-05 Microsoft Technology Licensing, Llc Author disambiguation

Also Published As

Publication number Publication date
CN104424357A (zh) 2015-03-18
JP2015049697A (ja) 2015-03-16
US20150066931A1 (en) 2015-03-05

Similar Documents

Publication Publication Date Title
JP6239318B2 (ja) 情報処理装置、方法およびプログラム
US20230377583A1 (en) Keyword determinations from conversational data
US10380160B2 (en) Dynamic language model
US9304657B2 (en) Audio tagging
JP6300889B2 (ja) 非定型テキストの抽出性能の向上のためのシステム及び方法
WO2021120818A1 (en) Methods and systems for managing image collection
US20090123021A1 (en) System, method, and medium indexing photos semantically
US20160026919A1 (en) System and method for social event detection
US9472209B2 (en) Deep tagging background noises
US10382938B1 (en) Detecting and validating planned event information
US20160019659A1 (en) Predicting the business impact of tweet conversations
US9569467B1 (en) Intelligent news management platform and social network
US10318574B1 (en) Generating moments
JP2015072578A (ja) 人物特定装置、人物特定方法及びプログラム
US20180075066A1 (en) Method and apparatus for displaying electronic photo, and mobile device
JP2006018551A (ja) 情報処理装置および方法、並びにプログラム
CA3217258A1 (en) Systems and methods to increase viewership of online content
CN113301382A (zh) 视频处理方法、设备、介质及程序产品
CN116521966A (zh) 索引构建方法和流量查询方法、设备及存储介质
JP5102883B2 (ja) ユーザ発言抽出装置とその方法と、プログラム
CN111367955B (zh) 目标对象的识别方法、装置、电子设备和存储介质
JP5810937B2 (ja) 管理プログラムおよび装置
WO2020129465A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
Setty LiveFC: A System for Live Fact-Checking of Audio Streams
JP6421087B2 (ja) 周辺状況推定支援装置、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170414

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170516

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170815

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170823

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20170904

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171101

R150 Certificate of patent or registration of utility model

Ref document number: 6239318

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150