JP6909183B2 - 情報処理装置、情報処理方法、及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法、及び情報処理プログラム Download PDF

Info

Publication number
JP6909183B2
JP6909183B2 JP2018117244A JP2018117244A JP6909183B2 JP 6909183 B2 JP6909183 B2 JP 6909183B2 JP 2018117244 A JP2018117244 A JP 2018117244A JP 2018117244 A JP2018117244 A JP 2018117244A JP 6909183 B2 JP6909183 B2 JP 6909183B2
Authority
JP
Japan
Prior art keywords
data
information
information processing
value
business operator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018117244A
Other languages
English (en)
Other versions
JP2019219952A (ja
Inventor
山口 寛
寛 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018117244A priority Critical patent/JP6909183B2/ja
Publication of JP2019219952A publication Critical patent/JP2019219952A/ja
Application granted granted Critical
Publication of JP6909183B2 publication Critical patent/JP6909183B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
従来、情報(データ)の価値評価に関する技術が提供されている。例えば、ターゲティング配信の運用を維持しつつ外部から取得した情報における広告効果への貢献度を算出する技術が提案されている。
特開2013−242657号公報 特開2014−81961号公報 特開2014−81962号公報
しかしながら、上記の従来技術では、事業者が所有するデータの価値を算出することが難しい場合がある。例えば、広告等に利用された場合のデータについては、広告に対するユーザの反応等により、そのデータの貢献度(価値)を算出することができるが、単に事業者が所有するデータについての価値評価を適切に行うことができない場合がある。このように、事業者が所有するデータの価値を適切に算出することが難しいという課題がある。
本願は、上記に鑑みてなされたものであって、事業者が所有するデータの価値を適切に算出する情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
本願に係る情報処理装置は、事業者が所有するデータの特徴を示す特徴情報を取得する取得部と、前記取得部により取得された前記データの前記特徴情報に基づいて、前記データの価値を示す価値スコアを算出する算出部と、を備えることを特徴とする。
実施形態の一態様によれば、事業者が所有するデータの価値を適切に算出することができるという効果を奏する。
図1は、実施形態に係る情報処理の一例を示す図である。 図2は、実施形態に係る情報処理システムの構成例を示す図である。 図3は、実施形態に係る情報処理装置の構成例を示す図である。 図4は、実施形態に係る事業者情報記憶部の一例を示す図である。 図5は、実施形態に係る特徴情報記憶部の一例を示す図である。 図6は、実施形態に係る価値スコア情報記憶部の一例を示す図である。 図7は、実施形態に係る情報処理の一例を示すフローチャートである。 図8は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔1.情報処理〕
まず、図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1では、情報処理装置100(図3参照)が事業者が所有するデータの特徴情報に基づいて、事業者のデータの価値スコアを算出する場合を一例として説明する。
図1の例では、情報処理装置100は、所定のプラットフォーム(以下、「プラットフォームPF」とする)を利用する事業者EA(図4参照)のデータDT1や事業者EB(図4参照)のデータDT2の価値スコアを算出する。以下では、価値スコアを単に「価値」と記載する場合がある。なお、ここでいうプラットフォームは、所定のサービス(以下、「プラットフォームサービス」とする)を提供するための環境のことであるものとする。図1の例に示すプラットフォームPFは、情報処理装置100を用いて種々のサービスを行うサービス事業者が提供する環境であってもよい。また、プラットフォームPFは、複数のクラウドサービス(以下、「クラウド」ともいう)等に跨って提供されてもよい。
上記のように「事業者*(*は任意の文字列)」と記載した場合、その事業者は事業者ID「*」により識別される事業者であることを示す。例えば、「事業者EA」と記載した場合、その事業者は事業者ID「EA」により識別される事業者である。また、「データDT*(*は任意の数値)」と記載した場合、そのデータはデータID「DT*」により識別されるデータであることを示す。例えば、「データDT1」と記載した場合、そのデータはデータID「DT1」により識別されるデータである。
図示を省略するがプラットフォームPFは、データを所有する各所有者(事業者)が、自身のデータを他の事業者が利用可能にしたり、自身が他の事業者のデータを利用したりするためのプラットフォームサービスであるものとする。なお、各事業者は、プラットフォームサービスにおけるデータを、所定のインターフェース(Interface:IF)を介して、利用可能となるものとする。例えば、図1の例に示すプラットフォームPFに登録されたデータは、所定のアプリケーションプログラミングインターフェイス(API:Application Programming Interface)や仮想機械(VM:virtual machine)等の種々のネットワークコンピューティング等に関する従来技術を適宜用いることにより、取得等の利用が可能になるものとする。例えば、事業者は、所定のアプリケーションプログラミングインタフェースや仮想機械等を利用することにより、プラットフォームPFを介して他の事業者のデータの取得等の利用が可能であってもよい。
図1の例では、事業者EAがデータDT1をプラットフォームPFに登録している。例えば、プラットフォームPFには、事業者EAが利用する事業者端末20−1(図2参照)からデータDT1が登録される。例えば、事業者EAのデータDT1は、事業者EAが利用する事業者サーバ50cに格納される。例えば、事業者EAのデータDT1は、プラットフォームPF外のクラウドサーバである事業者サーバ50−2に格納される。また、事業者EAのデータDT1は、プラットフォームPFを経由した取得要求等により、プラットフォームPFを介して、プラットフォームPFを利用する他の事業者に提供される。なお、事業者EAが登録するデータDT1は、どのようなデータ(情報)であってもよい。例えば、事業者EAが登録するデータDT1は、事業者EAが所有するデータであれば、どのようなデータであってもよい。例えば、事業者EAが登録するデータDT1は、事業者EAが保険を販売する事業者である場合、保険の販売データ等であってもよい。例えば、事業者EAが登録するデータDT1は、保険に加入したユーザ(個人)の性別や年齢(年代)や職業等の種々のデモグラフィック属性やサイコグラフィック属性に関する情報であってもよい。また、事業者EAが登録するデータDT1は、保険業務に特有のデータ(例えば資産や病歴等)が含まれてもよい。また、図1の例では、事業者EAは、プラットフォームPFを利用する事業者であり、事業者EAが所有するデータ(データDT1等)の利用が許可されている事業者であるものとする。
また、図1の例では、事業者EBがデータDT2をプラットフォームPFに登録している。例えば、プラットフォームPFには、事業者EBが利用する事業者端末20−2(図2参照)からデータDT2が登録される。例えば、事業者EBのデータDT2は、事業者EBが利用する事業者サーバ50−2に格納される。例えば、事業者EBのデータDT2は、プラットフォームPF外のクラウドサーバである事業者サーバ50−2に格納される。また、事業者EBのデータDT2は、プラットフォームPFを経由した取得要求等により、プラットフォームPFを介して、プラットフォームPFを利用する他の事業者に提供される。なお、事業者EBが登録するデータDT2は、どのようなデータ(情報)であってもよい。例えば、事業者EBが登録するデータDT2は、事業者EBが所有するデータであれば、どのようなデータであってもよい。例えば、事業者EBが登録するデータDT2は、事業者EBが自動車を販売する事業者である場合、自動車の販売データ等であってもよい。例えば、事業者EBが登録するデータDT2は、自動車を購入したユーザ(個人)の性別や年齢(年代)や職業等の種々のデモグラフィック属性やサイコグラフィック属性に関する情報であってもよい。また、事業者EBが登録するデータDT2は、自動車販売業務に特有のデータ(例えば自動車の所有有無等)が含まれてもよい。また、図1の例では、事業者EAは、プラットフォームPFを利用する事業者であり、事業者EBが所有するデータ(データDT2等)の利用が許可されている事業者であるものとする。
まず、図1の例では、情報処理装置100は、データDT1を取得する(ステップS11)。情報処理装置100は、事業者情報記憶部121(図4参照)に記憶された登録データ情報に基づいて、データDT1を取得する。情報処理装置100は、事業者情報記憶部121(図4参照)に記憶されたデータDT1が事業者サーバ50−1に格納されていることを示す情報に基づいて、事業者サーバ50−1からデータDT1を取得する。例えば、情報処理装置100は、事業者サーバ50−1にデータDT1の取得要求を送信することにより、事業者サーバ50−1からデータDT1を取得する。なお、情報処理装置100は、記憶部120(図3参照)に事業者が登録したデータが記憶されている場合、記憶部120からデータDT1を取得してもよい。
そして、情報処理装置100は、データDT1の価値を算出する(ステップS12)。情報処理装置100は、データDT1の特徴情報に基づいて、データDT1の価値を算出する。例えば、情報処理装置100は、特徴情報記憶部122(図5参照)に示すような、データDT1の特徴情報に基づいて、データDT1の価値を算出する。情報処理装置100は、データDT1の特徴を示す「データ列数」や「各列の利用頻度」や「データ行数」や「各行の利用頻度」や「更新頻度」といった情報を用いて、データDT1の価値を算出する。
「データ列数」は、対応するデータの列数を示す。「データ列数」は、対応するデータのうち、重複データを排除した列数であってもよい。「データ列数」は、対応するデータのうち、重複する列を除いた列数であってもよい。例えば、「データ列数」は、対応するデータの項目(カラム)数を示す。「各列の利用頻度」は、対応するデータの各列の利用頻度を示す。なお、ここでいう「列の利用」とは、データ所有する事業者以外の事業者がそのデータ中の項目に対応するデータを利用(要求)することであってもよい。例えば、「各列の利用頻度」は、対応するデータの各項目(カラム)の利用頻度を示す。例えば、「各列の利用頻度」は、対応するデータの各列の利用回数の平均であってもよい。例えば、「各列の利用頻度」は、対応するデータの各列の所定の期間(例えば1週間等)における利用回数の平均であってもよい。例えば、「各列の利用頻度」は、対応するデータの各列の利用回数の合計であってもよい。例えば、「各列の利用頻度」は、対応するデータの各列の所定の期間(例えば1日等)における利用回数の合計であってもよい。
「データ行数」は、対応するデータの行数を示す。例えば、「データ行数」は、対応するデータのレコード数を示す。「データ行数」は、対応するデータのうち、重複データを排除した行数であってもよい。「データ行数」は、対応するデータのうち、重複する行を除いた行数であってもよい。「各行の利用頻度」は、対応するデータの各行の利用頻度を示す。なお、ここでいう「行の利用」とは、データ所有する事業者以外の事業者がそのデータ中のレコード(行)を利用(要求)することであってもよい。例えば、「各行の利用頻度」は、対応するデータの各レコードの利用頻度を示す。例えば、「各行の利用頻度」は、対応するデータの各行の利用回数の平均であってもよい。例えば、「各行の利用頻度」は、対応するデータの各行の所定の期間(例えば3日間等)における利用回数の平均であってもよい。例えば、「各行の利用頻度」は、対応するデータの各行の利用回数の合計であってもよい。例えば、「各行の利用頻度」は、対応するデータの各行の所定の期間(例えば2日間等)における利用回数の合計であってもよい。
また、「更新頻度」は、対応するデータが更新される頻度を示す。例えば、「更新頻度」は、対応するデータに新たなレコードが追加される頻度であってもよい。例えば、「更新頻度」は、所定の期間(例えば5日間等)において、対応するデータに新たなレコードが追加される頻度であってもよい。また、例えば、「更新頻度」は、対応するデータに含まれるレコードの内容が更新される頻度であってもよい。例えば、「更新頻度」は、所定の期間(例えば1日間等)において、対応するデータに含まれるレコードの内容が更新される頻度であってもよい。
図1に示す例では、データDT1は、データ列数が「DC1」であり、各列の利用頻度が「CF1」であることを示す。また、データDT1は、データ行数が「DL1」であり、各行の利用頻度が「LF1」であることを示す。また、データDT1は、更新頻度が「RF1」であることを示す。
情報処理装置100は、データDT1の特徴を示すデータ列数「DC1」や各列の利用頻度「CF1」やデータ行数「DL1」や各行の利用頻度「LF1」や更新頻度「RF1」等を用いて、データDT1の価値を算出する。なお、データ列数「DC1」や各列の利用頻度「CF1」やデータ行数「DL1」や各行の利用頻度「LF1」や更新頻度「RF1」は、具体的な数値であるものとする。
なお、情報処理装置100は、データDT1からデータDT1の特徴情報を生成(抽出)してもよいし、所定の外部装置からデータDT1の特徴情報を取得してもよい。例えば、情報処理装置100は、データDT1の行(レコード)や列(カラム)を解析することにより、データDT1の特徴情報を生成してもよい。また、例えば、情報処理装置100は、事業者サーバ50−1や事業者端末20−1等からデータDT1の特徴情報を取得してもよい。
そして、図1の例では、情報処理装置100は、上記のデータDT1の特徴情報と、下記の式(1)とを用いて、データDT1の価値を算出する。なお、下記の式(1)は、図1中の算出式FCに対応する。
データの価値スコア=(データ列数*各列の利用頻度+データの行数*各行の利用頻度)*(係数*更新頻度)+定数 … (1)
上記の式(1)のうち、「係数」及び「定数」については、所定の値が割り当てられる。例えば、情報処理装置100は、「定数」を固定値とすることにより、価格が所定値よりも下がらないようにする。また、例えば、情報処理装置100は、上記の式(1)中の「係数*更新頻度」について、更新頻度を100分率などであらわし、それと係数をかけることで、更新頻度が高い場合に価値が高く(大きく)なるようにする。
そして、情報処理装置100は、上記の式(1)の各項にデータDT1の特徴情報を割り当てることにより、データDT1の価値を算出する。なお、上記の式(1)は一例であり、情報処理装置100は、種々の情報を適宜用いて、データの価値を算出してもよい。
図1では、情報処理装置100は、上記の式(1)の各項にデータDT1の特徴情報を割り当てることにより、下記の式(2)のように、データDT1の価値を算出する。
データDT1の価値スコア=(DC1*CF1+DL1*LF1)*(係数*RF1)+定数 … (2)
情報処理装置100は、上記の式(2)により、図1中のスコア情報SL1に示すように、データDT1の価値スコアを「VS1」と算出する。なお、価値スコア「VS1」は、具体的な数値であるものとする。
また、図1の例では、情報処理装置100は、データDT2を取得する(ステップS21)。情報処理装置100は、事業者情報記憶部121(図4参照)に記憶された登録データ情報に基づいて、データDT2を取得する。情報処理装置100は、事業者情報記憶部121(図4参照)に記憶されたデータDT2が事業者サーバ50−2に格納されていることを示す情報に基づいて、事業者サーバ50−2からデータDT2を取得する。例えば、情報処理装置100は、事業者サーバ50−2にデータDT2の取得要求を送信することにより、事業者サーバ50−2からデータDT2を取得する。なお、情報処理装置100は、記憶部120(図3参照)に事業者が登録したデータが記憶されている場合、記憶部120からデータDT2を取得してもよい。
そして、情報処理装置100は、データDT2の価値を算出する(ステップS22)。情報処理装置100は、データDT2の特徴情報に基づいて、データDT2の価値を算出する。例えば、情報処理装置100は、特徴情報記憶部122(図5参照)に示すような、データDT2の特徴情報に基づいて、データDT2の価値を算出する。情報処理装置100は、データDT2の特徴を示す「データ列数」や「各列の利用頻度」や「データ行数」や「各行の利用頻度」や「更新頻度」といった情報を用いて、データDT2の価値を算出する。
図1に示す例では、データDT2は、データ列数が「DC2」であり、各列の利用頻度が「CF2」であることを示す。また、データDT2は、データ行数が「DL2」であり、各行の利用頻度が「LF2」であることを示す。また、データDT2は、更新頻度が「RF2」であることを示す。
情報処理装置100は、データDT2の特徴を示すデータ列数「DC2」や各列の利用頻度「CF2」やデータ行数「DL2」や各行の利用頻度「LF2」や更新頻度「RF2」等を用いて、データDT2の価値を算出する。なお、データ列数「DC2」や各列の利用頻度「CF2」やデータ行数「DL2」や各行の利用頻度「LF2」や更新頻度「RF2」は、具体的な数値であるものとする。
なお、情報処理装置100は、データDT2からデータDT2の特徴情報を生成(抽出)してもよいし、所定の外部装置からデータDT2の特徴情報を取得してもよい。例えば、情報処理装置100は、データDT2の行(レコード)や列(カラム)を解析することにより、データDT2の特徴情報を生成してもよい。また、例えば、情報処理装置100は、事業者サーバ50−2や事業者端末20−2等からデータDT2の特徴情報を取得してもよい。
そして、図1の例では、情報処理装置100は、上記のデータDT2の特徴情報と、上記の式(1)とを用いて、データDT2の価値を算出する。情報処理装置100は、上記の式(1)の各項にデータDT2の特徴情報を割り当てることにより、データDT2の価値を算出する。図1では、情報処理装置100は、上記の式(1)の各項にデータDT2の特徴情報を割り当てることにより、下記の式(3)のように、データDT2の価値を算出する。
データDT2の価値スコア=(DC2*CF2+DL2*LF2)*(係数*RF2)+定数 … (3)
情報処理装置100は、上記の式(3)により、図1中のスコア情報SL2に示すように、データDT2の価値スコアを「VS2」と算出する。なお、価値スコア「VS2」は、具体的な数値であるものとする。
上述したように、情報処理装置100は、データDT1の特徴情報に基づいて、データDT1の価値スコアを「VS1」と算出する。また、情報処理装置100は、データDT2の特徴情報に基づいて、データDT2の価値スコアを「VS2」と算出する。このように、情報処理装置100は、事業者が所有するデータの価値を適切に算出することができる。
例えば、上記のようなプラットフォームPFにおけるデータの相互利用においては、よいデータを提供するデータ提供者(事業者)を優遇し、悪いデータを提供するデータ提供者(事業者)を冷遇するために、よいデータの定義が必要となる。また、情報(データ)は通常の製品(有体物)とは異なる、提供しても在庫が減ることがない。一方で、情報の価値は広まることで誰もが知る情報となり、価値が低下する。つまり、よいデータは利用される事となる一方で価値が下がる可能性が高い。このため、情報処理システム1においては、データを軸にした価値を定義する。具体的には、情報処理システム1においては、データの価値を、量と質とに基づいて定義する。
例えば、データの量については、ユニークなデータ量に基づいて定義する。例えば、データの量については、冗長なデータを除き重複排除したデータ量に基づいて定義する。例えば、単純に1つのデータテーブルなどにおいてのユニークなデータ行数をデータ量として定義し、その量が多いほど量が多いデータとする。したがって、情報処理システム1においては、データの価値は、データ量が多いものほど価値が高くなる。また、同様に、情報処理システム1においては、列数が多いものほど価値が高くなる。
例えば、データの質については、情報(データ)の鮮度に基づいて定義する。更新頻度が高い情報(データ)程データの質が高いデータとする。したがって、情報処理システム1においては、更新頻度が高い情報ほどデータの質が高くなり、データの価値が高くなる。また、情報処理システム1においては、変更されにくいデータは価値を低く保つ。例えば、情報処理システム1においては、マスターデータなどは優良ではあるが、高価ではないため価値を低く保つ。
データの質については、情報(データ)の利用頻度に基づいて定義する。例えば、情報処理システム1においては、データ量が多くとも、利用される行と列が少ない場合、価値は低くする。これにより、事業者が無駄な行や列を提供することで価値を高く見せることを抑制することができる。また、情報処理システム1においては、他の事業者等に提供できないデータは各サービス(事業者)にとっては価値が高いが、プラットフォームPFとしては多くの事業者が使えないデータとなるため、価値を低くする。これにより、情報処理システム1は、他の事業者等に提供できないデータは、プラットフォームPF等のデータを相互利用する環境では、その価値が低いものとして、価値を算出する。
〔1−1.価値比較〕
また、情報処理装置100は、算出した価値スコアを比較することにより、各データ間の価値比較をすることができる。例えば、情報処理装置100は、データDT1の価値スコア「VS1」とデータDT2の価値スコア「VS2」とを比較することにより、データDT1とデータDT2との価値比較をすることができる。例えば、価値スコア「VS1」が価値スコア「VS2」よりも大きい場合、情報処理装置100は、データDT1の方がデータDT2よりも価値が高いと判定することができる。また、例えば、価値スコア「VS2」が価値スコア「VS1」よりも大きい場合、情報処理装置100は、データDT2の方がデータDT1よりも価値が高いと判定することができる。例えば、価値スコア「VS1」と価値スコア「VS2」とは等しい場合、情報処理装置100は、データDT1とデータDT2とが等価であると判定することができる。
〔1−2.レア度(希少度)に基づく価値算出〕
なお、情報処理装置100は、種々の情報を適宜用いてデータの価値を算出してもよい。例えば、情報処理装置100は、データのレア度(希少度)を用いて、データの価値を算出してもよい。例えば、情報処理装置100は、データのレア度が高い程、データの価値が高くなるように、価値を算出してもよい。
例えば、情報処理装置100は、データの項目(カラム)が他のデータに少ない場合、そのデータのレア度が高いと判定し、そのデータのレア度を示す値を大きくしてもよい。例えば、情報処理装置100は、データの項目(カラム)が他のデータに多い場合、そのデータのレア度が低いと判定し、そのデータのレア度を示す値を小さくしてもよい。
例えば、情報処理装置100は、下記の式(4)を用いて、データの価値を算出してもよい。
データの価値スコア=(データ列数*各列の利用頻度+データの行数*各行の利用頻度)*(係数*更新頻度)*レア度+定数 … (4)
なお、上記の式(4)は一例であり、情報処理装置100は、種々の情報を適宜用いて、レア度を加味したデータの価値を算出してもよい。
〔1−3.レア度(希少度)について〕
例えば、情報処理装置100は、事業者情報記憶部121(図4参照)に記憶された各種情報を用いて、各データのレア度を算出してもよい。情報処理装置100は、一の事業者のデータと他の事業者の他のデータとの比較に基づいて、データの価値スコアを算出してもよい。例えば、情報処理装置100は、データの要素であるカラムと他のデータの他の要素であるカラムとの比較に基づいて、データの価値スコアを算出してもよい。
情報処理装置100は、事業者のデータのデータ形式(メタデータフォーマット)を、他の事業者のデータ形式(メタデータフォーマット)に変換するための情報を用いて、各データのレア度を算出してもよい。情報処理装置100は、各事業者のデータ間の対応関係を示す対応関係情報を用いて、各データのレア度を算出してもよい。情報処理装置100は、各事業者のデータのメタデータフォーマット間の対応関係を示す対応関係情報を用いて、各データのレア度を算出してもよい。情報処理装置100は、各事業者のメタデータに含まれるデータの項目(カラム)間の対応関係を示す対応関係情報を用いて、各データのレア度を算出してもよい。また、情報処理装置100は、メタデータ変換における変換内容を示す変換情報を用いて、各データのレア度を算出してもよい。情報処理装置100は、各事業者間のデータの変換に用いる変換テーブル等の変換情報に基づいて、各データのレア度を算出してもよい。
情報処理装置100は、データの要素(カラムなど)に対応する他の要素(カラムなど)が含まれる他のデータを所有する他の事業者の数に基づいて、データの価値スコアを算出してもよい。情報処理装置100は、データの要素に対応する他の要素が含まれる他のデータを所有する他の事業者の数が少ない程値が大きくなるように、データの前記価値スコアを算出してもよい。情報処理装置100は、データのカラムが変換可能な変換先の事業者数に基づいて、各データのレア度を算出してもよい。例えば、情報処理装置100は、データのカラムが変換可能な変換先の事業者数が少ない程、各データのレア度を高く算出してもよい。例えば、情報処理装置100は、データのカラムが変換可能な変換先の事業者数が多い程、各データのレア度を低く算出してもよい。
情報処理装置100は、データのカラムごとに部分レア度を算出し、各カラムの部分レア度に基づいて、データのレア度を算出してもよい。例えば、情報処理装置100は、データの各カラムの部分レア度の合計を、データのレア度として算出してもよい。例えば、情報処理装置100は、データの各カラムの部分レア度の平均を、データのレア度として算出してもよい。
例えば、情報処理装置100は、事業者EAのデータDT1におけるカラム「性別」が多くの事業者のデータのカラムと変換可能である場合、データDT1におけるカラム「性別」の部分レア度を低く算出してもよい。情報処理装置100は、事業者EAのデータDT1におけるカラム「性別」が、100の事業者のデータのカラムと変換可能である場合、データDT1におけるカラム「性別」の部分レア度を低く算出してもよい。例えば、情報処理装置100は、下記の式(5)を用いてカラムの部分レア度を算出してもよい。
部分レア度=1/変換可能な事業者数 … (5)
情報処理装置100は、上記の式(5)を用いて最大値が「1」となる部分レア度を算出してもよい。例えば、情報処理装置100は、事業者EAのデータDT1におけるカラム「性別」が、100個の事業者のデータのカラムと変換可能である場合、データDT1におけるカラム「性別」の部分レア度を「0.01(=1/100)」と算出してもよい。
また、情報処理装置100は、事業者EAのデータDT1におけるカラム「資産」が少数の事業者のデータのカラムと変換可能である場合、データDT1におけるカラム「資産」の部分レア度を高く算出してもよい。情報処理装置100は、事業者EAのデータDT1におけるカラム「資産」が、1個の事業者のデータのカラムのみと変換可能である場合、データDT1におけるカラム「資産別」の部分レア度を高く算出してもよい。例えば、情報処理装置100は、下記の式(5)を用いてカラムの部分レア度を算出してもよい。
例えば、情報処理装置100は、事業者EAのデータDT1におけるカラム「資産」が、1個の事業者のデータのカラムのみと変換可能である場合、データDT1におけるカラム「資産」の部分レア度を「1(=1/1)」と算出してもよい。
変換可能な事業者数が「0」である場合、上記の式(5)で算出する部分レア度は「∞(無限)」となるため、情報処理装置100は、変換可能な事業者数が「0」であるカラムの部分レア度を所定の値(例えば、1より大きい数)として算出してもよい。例えば、情報処理装置100は、変換可能な事業者数が「0」である場合、そのカラムの部分レア度を「10」と算出してもよい。例えば、情報処理装置100は、事業者EAのデータDT1におけるカラム「病歴」がどの事業者のデータのカラムとも変換できない場合、変換可能な事業者数を「0」として、そのカラム「病歴」の部分レア度を算出してもよい。情報処理装置100は、変換可能な事業者数が「0」であるデータDT1におけるカラム「病歴」の部分レア度を「10」と算出してもよい。なお、情報処理装置100は、変換可能な事業者数が「0」である場合、交換可能性が無いため価値が低いとして、そのカラムの部分レア度を「0」と算出してもよい。
そして、情報処理装置100は、上記のように算出した事業者EAのデータDT1における各カラムの部分レア度に基づいて、データDT1のレア度を算出してもよい。例えば、情報処理装置100は、上記のように算出した事業者EAのデータDT1における各カラムの部分レア度の合計を、データDT1のレア度として算出してもよい。また、例えば、情報処理装置100は、上記のように算出した事業者EAのデータDT1における各カラムの部分レア度の平均を、データDT1のレア度として算出してもよい。
なお、上記は一例であり、情報処理装置100は、どのように各データのレア度を算出してもよい。例えば、データのカラムはデータの要素の一例であり、情報処理装置100は、データの要素であれば、どのような要素の比較に基づいて、データの価値スコアを算出してもよい。例えば、情報処理装置100は、データのレコードの比較に基づいて、データの価値スコアを算出してもよい。
〔1−4.データの価値に基づくサービス提供〕
また、情報処理装置100は、事業者が所有するデータの価値に応じて、事業者に種々のサービスを提供してもよい。情報処理装置100は、事業者が所有するデータの価値に応じて、事業者に提供するサービスの態様を変更してもよい。例えば、情報処理装置100は、価値が高いデータを所有する事業者に対して、所定のインセンティブを提供してもよい。例えば、情報処理装置100は、価値が高いデータを所有する事業者に対して、所定のインセンティブを提供してもよい。例えば、情報処理装置100は、価値が高いデータを所有する事業者に対して、プラットフォームPFを優先的に利用可能にしてもよい。例えば、情報処理装置100は、価値が高いデータを所有する事業者に対して、プラットフォームPFを介して他の事業者のデータを優先的に取得可能にしてもよい。
また、情報処理装置100は、価値が低いデータを所有する事業者に対して、所定のサービスを提供しなくてもよい。情報処理装置100は、所定の閾値未満の価値スコアであるデータを所有する事業者に対して、プラットフォームPFを介した他の事業者のデータを制限してもよい。情報処理装置100は、所定の閾値未満の価値スコアであるデータを所有する事業者に対して、所定の閾値以上の価値スコアのデータを利用不可としてもよい。例えば、情報処理装置100は、各事業者に対して、自身の所有するデータの価値スコア以下の価値スコアのデータのみを利用可能としてもよい。
〔2.情報処理システムの構成〕
図2に示すように、情報処理システム1には、事業者端末20と、事業者サーバ50と、情報処理装置100とが含まれる。事業者端末20と、事業者サーバ50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。図2は、実施形態に係る情報処理システムの構成例を示す図である。なお、情報処理システム1には、複数台の情報処理装置100が含まれてもよい。
例えば、情報処理システム1には、事業者端末20−1、事業者端末20−2、事業者端末20−3、及び事業者端末20−4に限らず、5つ以上の事業者端末20が含まれてもよい。なお、事業者端末20−1、事業者端末20−2、事業者端末20−3、及び事業者端末20−4等を区別せずに説明する場合、事業者端末20と記載する場合がある。また、情報処理システム1には、事業者サーバ50−1、事業者サーバ50−2、事業者サーバ50−3、及び事業者サーバ50−4に限らず、5つ以上の事業者サーバ50が含まれてもよい。なお、事業者サーバ50−1、事業者サーバ50−2、事業者サーバ50−3、及び事業者サーバ50−4等を区別せずに説明する場合、事業者サーバ50と記載する場合がある。
事業者端末20は、事業者(企業)によって利用される情報処理装置である。例えば、事業者端末20は、事業者サーバ50にデータを格納(登録)したり、事業者サーバ50に記憶されたデータを利用したりするために用いられる情報処理装置(コンピュータ)である。事業者端末20は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。以下では、事業者端末20を事業者と表記する場合がある。すなわち、以下では、事業者を事業者端末20と読み替えることもできる。
例えば、事業者端末20−1は、事業者EAにおいて利用される情報処理装置である。例えば、事業者端末20−2は、事業者EBにおいて利用される情報処理装置である。例えば、事業者端末20−3は、事業者ECにおいて利用される情報処理装置である。例えば、事業者端末20−4は、事業者EDにおいて利用される情報処理装置である。また、事業者端末20は、例えば、スマートフォンや、タブレット型端末や、ノート型PCや、デスクトップPCや、携帯電話機や、PDA等により実現される。図1は、事業者端末20がノート型PCである場合を示す。
情報処理装置100は、事業者が所有するデータの特徴を示す特徴情報に基づいて、データの価値を示す価値スコアを算出する情報処理装置(コンピュータ)である。例えば、情報処理装置100は、事業者端末20や事業者サーバ50から種々の情報を取得する。例えば、情報処理装置100は、事業者端末20や事業者サーバ50に種々の情報を送信する。なお、情報処理装置100は、記憶部120(図3参照)に記憶される各種情報を外部の情報処理装置から取得してもよい。
事業者サーバ50は、各事業者が利用する情報処理装置である。事業者サーバ50は、各事業者が所有するデータを記憶する装置である。事業者サーバ50は、いわゆるクラウドサーバであってもよい。例えば、事業者サーバ50は、クラウドサービスにおける各種のデータを記憶する記憶手段を有する。
なお、情報処理システム1には、クラウドサーバに限らず、種々の運用形態のサーバが含まれてもよい。例えば、情報処理システム1には、事業者の施設内等に配置されるオンプレミスの運用形態によるサーバが含まれてもよい。
〔2−1.システム構成一例〕
ここで、実施形態に係る情報処理システム1の構成の一例を説明する。例えば、事業者サーバ50−1に、事業者EAのデータが格納される。事業者サーバ50−1に、データDT1等が格納される。なお、事業者サーバ50−1は、複数のサーバであってもよい。
例えば、事業者サーバ50−2に、事業者EBのデータが格納される。事業者サーバ50−2に、データDT2等が格納される。なお、事業者サーバ50−2は、複数のサーバであってもよい。例えば、事業者サーバ50−3に、事業者ECのデータが格納される。事業者サーバ50−3に、データDT3等が格納される。なお、事業者サーバ50−3は、複数のサーバであってもよい。例えば、事業者サーバ50−4に、事業者EDのデータが格納される。事業者サーバ50−4に、データDT4等が格納される。なお、事業者サーバ50−4は、複数のサーバであってもよい。
例えば、プラットフォームPFは、事業者サーバ50−1〜50−4と情報を通信することにより、各事業者のデータを取得する。例えば、事業者EAは、事業者サーバ50−1にデータを格納することにより、プラットフォームPFにデータを登録する。また、例えば、事業者EBは、事業者サーバ50−2にデータを格納することにより、プラットフォームPFにデータを登録する。これにより、プラットフォームPFでは、異なる事業者間においてもデータを相互利用が可能になる。
例えば、情報処理システム1においては、各事業者は、各事業者サーバ50に配置されたデータを、プラットフォームPFを介することによりアクセス可能であってもよい。例えば、情報処理システム1においては、各事業者は、プラットフォームPFのアプリケーションプログラミングインタフェースを利用することにより、一の事業者サーバ50に配置されたデータにアクセス可能であってもよい。
〔2−2.システム構成態様〕
なお、図2に示した構成は一例であり、情報処理システム1は種々の構成であってもよい。例えば、情報処理システム1における情報処理装置100は、事業者サーバ50と一体であってもよい。この場合、一の事業者が、情報処理装置100を用いてプラットフォームサービスを提供してもよい。例えば、情報処理システム1においては、データを所有する一事業者が、プラットフォームサービスを提供するサービス提供者であってもよい。
例えば、情報処理システム1においては、プラットフォームPFは、事業者サーバ50−1に構築されてもよい。例えば、複数の事業者サーバ50に跨ってプラットフォームPFが構築されてもよいし、プラットフォームPFは、1つの事業者サーバ50に構築されてもよい。このように、情報処理システム1の構成は、上述のような情報処理やデータに関する制御が可能であればどのような構成であってもよい。すなわち、情報処理システム1において、プラットフォームPFを利用する各事業者が相互にデータを利用可能であれば、どのようなシステム構成であってもよい。
〔3.情報処理装置の構成〕
次に、図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置の構成例を示す図である。図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、所定のネットワークN(図2参照)と有線または無線で接続され、事業者端末20との間で情報の送受信を行う。
(記憶部120)
記憶部120は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、事業者情報記憶部121と特徴情報記憶部122と価値スコア情報記憶部123とを有する。また、図示することを省略するが、記憶部120には、各データがどのように利用されたかを示す履歴情報(ログ)が記憶されてもよい。例えば、記憶部120には、プラットフォームPF内の各データの登録に関する情報や各データがどの事業者にどのように利用されたかを示すログが記憶されてもよい。
(事業者情報記憶部121)
実施形態に係る事業者情報記憶部121は、事業者に関する各種情報を記憶する。例えば、事業者情報記憶部121は、プラットフォームサービスを利用する事業者に関する情報を記憶する。図4は、実施形態に係る事業者情報記憶部の一例を示す図である。図4に示すように、事業者情報記憶部121は、事業者に関する情報として、「事業者ID」、「業種」、「登録メタデータ情報」、「登録データ情報」といった項目が含まれる。
「事業者ID」は、事業者を識別するための識別情報を示す。「業種」は、対応する事業者IDにより識別される事業者の業種を示す。なお、図4の例では業種を「A業種」等の抽象的な符号で図示するが、「業種」は、「保険」、「食品」、「化粧品」、「自動車」等の具体的な情報であってもよい。
「登録メタデータ情報」は、対応する事業者IDにより識別される事業者が登録したメタデータを示す。「登録メタデータ情報」は、事業者のデータのメタデータフォーマット(メタデータ形式)を示す。例えば、「登録メタデータ情報」は、事業者がプラットフォームPFに登録したデータのメタデータフォーマットを示す。また、「登録データ情報」は、対応する事業者IDにより識別される事業者が登録したデータを示す。例えば、「登録データ情報」は、事業者がプラットフォームPFに登録したデータを示す。
図4に示す例において、事業者ID「EA」により識別される事業者(事業者EA)は、業種が「A業種」であることを示す。事業者EAのデータのメタデータフォーマットは、メタデータフォーマットMDT1であることを示す。また、事業者EAは、データDT1をプラットフォームPFに登録したことを示す。例えば、事業者EAは、データDT1を事業者サーバ50−1に登録したことを示す。
なお、事業者情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、事業者情報記憶部121は、対応する事業者IDにより識別される事業者の名称等が記憶されてもよい。例えば、事業者情報記憶部121は、事業者の従業員数や売上高等の事業規模に関する情報を記憶してもよい。
また、事業者情報記憶部121は、事業者のデータのデータ形式(メタデータフォーマット)を、他の事業者のデータ形式(メタデータフォーマット)に変換するための情報を記憶してもよい。事業者情報記憶部121は、各事業者のデータ間の対応関係を示す情報(対応関係情報)を記憶してもよい。事業者情報記憶部121は、各事業者のデータのメタデータフォーマット間の対応関係を示す対応関係情報を記憶してもよい。事業者情報記憶部121は、各事業者のメタデータに含まれるデータの項目(カラム)間の対応関係を示す対応関係情報を記憶してもよい。また、事業者情報記憶部121は、メタデータ変換における変換内容を示す情報(変換情報)を記憶してもよい。
(特徴情報記憶部122)
実施形態に係る特徴情報記憶部122は、データに関する情報を記憶する。特徴情報記憶部122は、データの特徴情報等の各種情報を記憶する。図5は、実施形態に係る特徴情報記憶部の一例を示す図である。図5に示すように、特徴情報記憶部122は、「データID」、「データ列数」、「各列の利用頻度」、「データ行数」、「各行の利用頻度」、「更新頻度」といった項目を有する。
「データID」は、データを識別するための識別情報を示す。例えば、データID「DT1」により識別されるデータは、図4中の事業者EAが所有するデータDT1に対応する。
「データ列数」は、対応するデータの列数を示す。例えば、「データ列数」は、対応するデータの項目(カラム)数を示す。図5では、「データ列数」には、「DC2」等のように抽象的に図示するが、「10」や「100」等の具体的な値が記憶される。「各列の利用頻度」は、対応するデータの各列の利用頻度を示す。図5では、「各列の利用頻度」には、「CF2」等のように抽象的に図示するが、「5.4」や「25」等の具体的な値が記憶される。
なお、ここでいう「列の利用」とは、データ所有する事業者以外の事業者がそのデータ中の項目に対応するデータを利用(要求)することであってもよい。例えば、「各列の利用頻度」は、対応するデータの各項目(カラム)の利用頻度を示す。例えば、「各列の利用頻度」は、対応するデータの各列の利用回数の平均であってもよい。例えば、「各列の利用頻度」は、対応するデータの各列の所定の期間(例えば1週間等)における利用回数の平均であってもよい。
「データ行数」は、対応するデータの行数を示す。例えば、「データ行数」は、対応するデータのレコード数を示す。図5では、「データ行数」には、「DL2」等のように抽象的に図示するが、「1000」や「50000」等の具体的な値が記憶される。「各行の利用頻度」は、対応するデータの各行の利用頻度を示す。図5では、「各行の利用頻度」には、「LF2」等のように抽象的に図示するが、「15」や「35.2」等の具体的な値が記憶される。
「なお、ここでいう「行の利用」とは、データ所有する事業者以外の事業者がそのデータ中のレコード(行)を利用(要求)することであってもよい。例えば、「各行の利用頻度」は、対応するデータの各レコードの利用頻度を示す。例えば、「各行の利用頻度」は、対応するデータの各行の利用回数の平均であってもよい。例えば、「各行の利用頻度」は、対応するデータの各行の所定の期間(例えば3日間等)における利用回数の平均であってもよい。
また、「更新頻度」は、対応するデータが更新される頻度を示す。図5では、「更新頻度」には、「RF2」等のように抽象的に図示するが、「8.2」や「350」等の具体的な値が記憶される。例えば、「更新頻度」は、対応するデータに新たなレコードが追加される頻度であってもよい。例えば、「更新頻度」は、所定の期間(例えば5日間等)において、対応するデータに新たなレコードが追加される頻度であってもよい。また、例えば、「更新頻度」は、対応するデータに含まれるレコードの内容が更新される頻度であってもよい。例えば、「更新頻度」は、所定の期間(例えば1日間等)において、対応するデータに含まれるレコードの内容が更新される頻度であってもよい。
図5に示す例では、データID「DT1」により識別されるデータ(データDT1)は、データ列数が「DC1」であり、各列の利用頻度が「CF1」であることを示す。また、データDT1は、データ行数が「DL1」であり、各行の利用頻度が「LF1」であることを示す。また、データDT1は、更新頻度が「RF1」であることを示す。
なお、特徴情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。特徴情報記憶部122は、各データを所有する事業者を特定する情報を記憶してもよい。
また、特徴情報記憶部122は、各データのレア度(希少度)を示す情報を記憶してもよい。例えば、特徴情報記憶部122は、各データの項目(カラム)が他のデータに少ない程場合、値が大きくなるレア度(希少度)を示す情報を記憶してもよい。特徴情報記憶部122は、対応関係情報や変換情報に基づいて算出された各データのレア度を示す情報を記憶してもよい。
(価値スコア情報記憶部123)
実施形態に係る価値スコア情報記憶部123は、データの価値に関する情報を記憶する。価値スコア情報記憶部123は、データの価値スコア等の各種情報を記憶する。図6は、実施形態に係る価値スコア情報記憶部の一例を示す図である。図6に示すように、価値スコア情報記憶部123は、「データID」、「価値スコア」といった項目を有する。
「データID」は、データを識別するための識別情報を示す。例えば、データID「DT2」により識別されるデータは、図4中の事業者EBが所有するデータDT2に対応する。「価値スコア」は、対応するデータの価値を示す。図5では、「価値スコア」には、「VS2」等のように抽象的に図示するが、「35」や「105.8」等の具体的な値が記憶される。
図6に示す例では、データID「DT1」により識別されるデータ(データDT1)は、価値スコアが「VS1」であることを示す。
なお、価値スコア情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。価値スコア情報記憶部123は、価値スコアを算出した日時を記憶してもよい。価値スコア情報記憶部123は、各データを所有する事業者を特定する情報を記憶してもよい。
(制御部130)
制御部130は、コントローラ(controller)であり、例えば、CPUやMPU等によって、情報処理装置100内部の記憶部120などの記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。例えば、この各種プログラムは、インストールされている管理アプリケーション等の種々のプログラムが含まれる。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部130は、取得部131と、算出部132と、提供部133とを有し、以下に説明する管理処理の機能や作用を実現または実行する。例えば、制御部130は、情報処理を行うために用いる情報を管理する管理処理を行う。
(取得部131)
取得部131は、各種情報を取得する。例えば、取得部131は、外部の情報処理装置から各種情報を取得する。例えば、取得部131は、事業者端末20や事業者サーバ50から各種情報を取得する。例えば、取得部131は、事業者が他の事業者のデータの利用要求していることを示す情報を取得する。例えば、取得部131は、事業者が他の事業者のデータの利用要求していることを示す情報を事業者端末20や事業者サーバ50から取得する。
また、取得部131は、記憶部120から各種情報を取得する。取得部131は、事業者情報記憶部121や特徴情報記憶部122や価値スコア情報記憶部123等から各種情報を取得する。
取得部131は、事業者が所有するデータの特徴を示す特徴情報を取得する。取得部131は、データの量的な特徴を示す量情報を取得する。取得部131は、データにおける重複したデータを除いたデータ量を示す量情報を取得する。取得部131は、データの質的な特徴を示す質情報含む特徴情報を取得する。取得部131は、データの更新頻度を示す質情報を取得する。取得部131は、データの更新頻度に関する質情報を取得する。取得部131は、データの利用頻度を示す質情報を取得する。取得部131は、データの利用頻度に関する質情報を取得する。取得部131は、データにおける要素の利用を示す質情報を取得する。取得部131は、データにおける要素の利用に関する質情報を取得する。取得部131は、事業者とは異なる他の事業者が所有する他のデータを取得する。
図1の例では、取得部131は、データDT1を取得する。取得部131は、事業者情報記憶部121に記憶された登録データ情報に基づいて、データDT1を取得する。取得部131は、事業者情報記憶部121に記憶されたデータDT1が事業者サーバ50−1に格納されていることを示す情報に基づいて、事業者サーバ50−1からデータDT1を取得する。取得部131は、事業者サーバ50−1にデータDT1の取得要求を送信することにより、事業者サーバ50−1からデータDT1を取得する。
図1の例では、取得部131は、データDT2を取得する。取得部131は、事業者情報記憶部121に記憶された登録データ情報に基づいて、データDT2を取得する。取得部131は、事業者情報記憶部121に記憶されたデータDT2が事業者サーバ50−2に格納されていることを示す情報に基づいて、事業者サーバ50−2からデータDT2を取得する。取得部131は、事業者サーバ50−2にデータDT2の取得要求を送信することにより、事業者サーバ50−2からデータDT2を取得する。
(算出部132)
算出部132は、種々の情報を算出する。算出部132は、種々の情報を生成する。算出部132は、各種情報を判定する。算出部132は、各種情報を抽出する。例えば、算出部132は、事業者情報記憶部121や特徴情報記憶部122や価値スコア情報記憶部123等に記憶された情報に基づいて、各種算出を行う。例えば、算出部132は、取得部131により取得された情報に基づいて、種々の算出処理を行う。
算出部132は、取得部131により取得されたデータの特徴情報に基づいて、データの価値を示す価値スコアを算出する。算出部132は、データの量情報に基づいて、データの価値スコアを算出する。算出部132は、データ量が多い程値が大きくなるように、データの価値スコアを算出する。算出部132は、データの質情報に基づいて、データの価値スコアを算出する。
算出部132は、更新頻度が多い程値が大きくなるように、データの価値スコアを算出する。算出部132は、利用頻度が多い程値が大きくなるように、データの価値スコアを算出する。算出部132は、要素のうち利用される要素の割合が大きい程値が大きくなるように、データの価値スコアを算出する。
算出部132は、データと他のデータとの比較に基づいて、データの価値スコアを算出する。算出部132は、データの要素と他のデータの他の要素との比較に基づいて、データの価値スコアを算出する。算出部132は、データの要素に対応する他の要素が含まれる他のデータを所有する他の事業者の数に基づいて、データの価値スコアを算出する。算出部132は、データの要素に対応する他の要素が含まれる他のデータを所有する他の事業者の数が少ない程値が大きくなるように、データの価値スコアを算出する。
図1の例では、算出部132は、データDT1の価値を算出する。算出部132は、データDT1の特徴情報に基づいて、データDT1の価値を算出する。例えば、算出部132は、特徴情報記憶部122に示すような、データDT1の特徴情報に基づいて、データDT1の価値を算出する。算出部132は、データDT1の特徴を示す「データ列数」や「各列の利用頻度」や「データ行数」や「各行の利用頻度」や「更新頻度」といった情報を用いて、データDT1の価値を算出する。
算出部132は、データDT1の特徴を示すデータ列数「DC1」や各列の利用頻度「CF1」やデータ行数「DL1」や各行の利用頻度「LF1」や更新頻度「RF1」等を用いて、データDT1の価値を算出する。算出部132は、データDT1の特徴情報と、上記の式(1)とを用いて、データDT1の価値を算出する。
そして、算出部132は、上記の式(1)の各項にデータDT1の特徴情報を割り当てることにより、データDT1の価値を算出する。算出部132は、上記の式(1)の各項にデータDT1の特徴情報を割り当てることにより、上記の式(2)のように、データDT1の価値を算出する。算出部132は、上記の式(2)により、図1中のスコア情報SL1に示すように、データDT1の価値スコアを「VS1」と算出する。
算出部132は、データDT2の価値を算出する。算出部132は、データDT2の特徴情報に基づいて、データDT2の価値を算出する。例えば、算出部132は、特徴情報記憶部122に示すような、データDT2の特徴情報に基づいて、データDT2の価値を算出する。算出部132は、データDT2の特徴を示す「データ列数」や「各列の利用頻度」や「データ行数」や「各行の利用頻度」や「更新頻度」といった情報を用いて、データDT2の価値を算出する。
算出部132は、データDT2の特徴を示すデータ列数「DC2」や各列の利用頻度「CF2」やデータ行数「DL2」や各行の利用頻度「LF2」や更新頻度「RF2」等を用いて、データDT2の価値を算出する。
算出部132は、上記のデータDT2の特徴情報と、上記の式(1)とを用いて、データDT2の価値を算出する。算出部132は、上記の式(1)の各項にデータDT2の特徴情報を割り当てることにより、データDT2の価値を算出する。算出部132は、上記の式(1)の各項にデータDT2の特徴情報を割り当てることにより、上記の式(3)のように、データDT2の価値を算出する。算出部132は、上記の式(3)により、図1中のスコア情報SL2に示すように、データDT2の価値スコアを「VS2」と算出する。
(提供部133)
提供部133は、各種情報を提供する。例えば、提供部133は、事業者端末20や事業者サーバ50等の外部の情報処理装置に各種情報を提供する。例えば、提供部133は、事業者端末20や事業者サーバ50等の外部の情報処理装置に各種情報を要求する。提供部133は、事業者端末10や事業者サーバ50に各種情報を送信する。提供部133は、事業者端末20や事業者サーバ50等に各種情報を配信する。提供部133は、取得部131により取得された各種情報に基づいて、種々の情報を提供する。提供部133は、算出部132により算出された各種情報に基づいて、種々の情報を提供する。例えば、提供部133は、算出部132により算出されたデータの価値スコアを提供する。提供部133は、算出部132により算出されたデータの価値スコアを事業者に提供する。
〔4.情報処理のフロー〕
次に、図7を用いて、実施形態に係る情報処理装置100による情報処理の手順について説明する。図7は、実施形態に係る情報処理の一例を示すフローチャートである。
図7に示すように、情報処理装置100は、事業者が所有するデータの特徴を示す特徴情報を取得する(ステップS101)。そして、情報処理装置100は、特徴情報に基づいて、データの価値を示す価値スコアを算出する(ステップS102)。
〔5.効果〕
上述してきたように、実施形態に係る情報処理装置100は、取得部131と、算出部132とを有する。取得部131は、事業者が所有するデータの特徴を示す特徴情報を取得する。算出部132は、取得部131により取得されたデータの特徴情報に基づいて、データの価値を示す価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの特徴情報に基づいて、データの価値を示す価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、データの量的な特徴を示す量情報を取得する。算出部132は、データの量情報に基づいて、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの量情報に基づいて、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、データにおける重複したデータを除いたデータ量を示す量情報を取得する。算出部132は、データ量が多い程値が大きくなるように、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データにおける重複したデータを除いたデータ量を示す量情報を取得し、データ量が多い程値が大きくなるように、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、データの質的な特徴を示す質情報含む特徴情報を取得する。算出部132は、データの質情報に基づいて、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの質情報に基づいて、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、データの更新頻度を示す質情報を取得する。算出部132は、更新頻度が多い程値が大きくなるように、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの更新頻度を示す質情報を取得し、更新頻度が多い程値が大きくなるように、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、データの利用頻度を示す質情報を取得する。算出部132は、利用頻度が多い程値が大きくなるように、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの利用頻度を示す質情報を取得し、利用頻度が多い程値が大きくなるように、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、事業者とは異なる他の事業者が所有する他のデータを取得する。算出部132は、データと他のデータとの比較に基づいて、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、事業者とは異なる他の事業者が所有する他のデータを取得し、データと他のデータとの比較に基づいて、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、算出部132は、データの要素と他のデータの他の要素との比較に基づいて、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの要素と他のデータの他の要素との比較に基づいて、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、算出部132は、データの要素に対応する他の要素が含まれる他のデータを所有する他の事業者の数に基づいて、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの要素に対応する他の要素が含まれる他のデータを所有する他の事業者の数に基づいて、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
また、実施形態に係る情報処理装置100において、算出部132は、データの要素に対応する他の要素が含まれる他のデータを所有する他の事業者の数が少ない程値が大きくなるように、データの価値スコアを算出する。
このように、実施形態に係る情報処理装置100は、データの要素に対応する他の要素が含まれる他のデータを所有する他の事業者の数が少ない程値が大きくなるように、データの価値スコアを算出することにより、事業者が所有するデータの価値を適切に算出することができる。
〔6.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置100は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定のネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定のネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定のネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態を図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔7.その他〕
また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
1 情報処理システム
100 情報処理装置
121 事業者情報記憶部
122 特徴情報記憶部
123 価値スコア情報記憶部
130 制御部
131 取得部
132 算出部
133 提供部
20 事業者端末
50 事業者サーバ
PF プラットフォーム
N ネットワーク

Claims (8)

  1. 事業者が所有するデータの特徴を示す特徴情報を取得する取得部と、
    前記取得部により取得された前記データの前記特徴情報に基づいて、前記データの価値を示す価値スコアを算出する算出部と、
    を備え
    前記取得部は、
    前記事業者とは異なる他の事業者が所有する他のデータを取得し、
    前記算出部は、
    前記データの要素と前記他のデータの他の要素との比較に基づいて、前記データの前記要素と変換可能である前記他の要素が含まれる前記他のデータを所有する前記他の事業者の数である変換可能数を分母とする部分スコアであって、前記変換可能数が0である場合は0となる部分スコアを用いて、前記データの前記価値スコアを算出する
    ことを特徴とする情報処理装置。
  2. 前記取得部は、
    前記データの量的な特徴を示す量情報を取得し、
    前記算出部は、
    前記データの前記量情報に基づいて、前記データの前記価値スコアを算出する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記取得部は、
    前記データにおける重複したデータを除いたデータ量を示す前記量情報を取得し、
    前記算出部は、
    前記データ量が多い程値が大きくなるように、前記データの前記価値スコアを算出する
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 前記取得部は、
    前記データの質的な特徴を示す質情報含む前記特徴情報を取得し、
    前記算出部は、
    前記データの前記質情報に基づいて、前記データの前記価値スコアを算出する
    ことを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。
  5. 前記取得部は、
    前記データの更新頻度を示す前記質情報を取得し、
    前記算出部は、
    前記更新頻度が多い程値が大きくなるように、前記データの前記価値スコアを算出する
    ことを特徴とする請求項4に記載の情報処理装置。
  6. 前記取得部は、
    前記データの利用頻度を示す前記質情報を取得し、
    前記算出部は、
    前記利用頻度が多い程値が大きくなるように、前記データの前記価値スコアを算出する
    ことを特徴とする請求項4または請求項5に記載の情報処理装置。
  7. コンピュータが実行する情報処理方法であって、
    事業者が所有するデータの特徴を示す特徴情報を取得する取得工程と、
    前記取得工程により取得された前記データの前記特徴情報に基づいて、前記データの価値を示す価値スコアを算出する算出工程と、
    を含み、
    前記取得工程は、
    前記事業者とは異なる他の事業者が所有する他のデータを取得し、
    前記算出工程は、
    前記データの要素と前記他のデータの他の要素との比較に基づいて、前記データの前記要素と変換可能である前記他の要素が含まれる前記他のデータを所有する前記他の事業者の数である変換可能数を分母とする部分スコアであって、前記変換可能数が0である場合は0となる部分スコアを用いて、前記データの前記価値スコアを算出する
    ことを特徴とする情報処理方法。
  8. 事業者が所有するデータの特徴を示す特徴情報を取得する取得手順と、
    前記取得手順により取得された前記データの前記特徴情報に基づいて、前記データの価値を示す価値スコアを算出する算出手順と、
    をコンピュータに実行させ
    前記取得手順は、
    前記事業者とは異なる他の事業者が所有する他のデータを取得し、
    前記算出手順は、
    前記データの要素と前記他のデータの他の要素との比較に基づいて、前記データの前記要素と変換可能である前記他の要素が含まれる前記他のデータを所有する前記他の事業者の数である変換可能数を分母とする部分スコアであって、前記変換可能数が0である場合は0となる部分スコアを用いて、前記データの前記価値スコアを算出す
    ことを特徴とする情報処理プログラム。
JP2018117244A 2018-06-20 2018-06-20 情報処理装置、情報処理方法、及び情報処理プログラム Active JP6909183B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018117244A JP6909183B2 (ja) 2018-06-20 2018-06-20 情報処理装置、情報処理方法、及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018117244A JP6909183B2 (ja) 2018-06-20 2018-06-20 情報処理装置、情報処理方法、及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2019219952A JP2019219952A (ja) 2019-12-26
JP6909183B2 true JP6909183B2 (ja) 2021-07-28

Family

ID=69096633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018117244A Active JP6909183B2 (ja) 2018-06-20 2018-06-20 情報処理装置、情報処理方法、及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6909183B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4145378A4 (en) * 2020-04-27 2023-05-31 Mitsubishi Electric Corporation DATA COLLECTION DEVICE, REMOTE CONTROL SYSTEM, DATA COLLECTION METHOD AND PROGRAM
WO2023073841A1 (ja) * 2021-10-27 2023-05-04 株式会社日立製作所 データ価値評価システム、データ価値評価方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005011049A (ja) * 2003-06-19 2005-01-13 Nec Soft Ltd データベース統合装置
WO2013038905A1 (ja) * 2011-09-13 2013-03-21 オムロン株式会社 情報管理装置、ネットワークシステム、情報管理プログラム、および情報管理方法
US20130151423A1 (en) * 2011-12-09 2013-06-13 Wells Fargo Bank, N.A. Valuation of data
CN103136695B (zh) * 2013-03-26 2017-06-13 明日互动(北京)广告传媒有限公司 媒体投放价值分析方法及其系统
JP5978198B2 (ja) * 2013-12-19 2016-08-24 ヤフー株式会社 情報取引装置、情報取引方法及び情報取引プログラム
JP6183955B2 (ja) * 2014-03-18 2017-08-23 Kddi株式会社 データセンター装置

Also Published As

Publication number Publication date
JP2019219952A (ja) 2019-12-26

Similar Documents

Publication Publication Date Title
US8386285B2 (en) Demand modeling and prediction in a retail category
Glazebrook et al. Benefits of Hybrid Lateral Transshipments in Multi‐Item Inventory Systems under Periodic Replenishment
Chen et al. Pricing schemes in cloud computing: Utilization‐based vs. reservation‐based
US20180308030A1 (en) System and Method for Establishing Regional Distribution Center Inventory Levels for New Third Party Products
US20160117703A1 (en) Large-Scale Customer-Product Relationship Mapping and Contact Scheduling
Gilland et al. Sequence matters: Shelf‐space allocation under dynamic customer‐driven substitution
CN112819504A (zh) 用于定制评论的系统和方法
JP6909183B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2019032620A (ja) 生成装置、生成方法及び生成プログラム
JP2019046456A (ja) 推定装置、推定方法および推定プログラム
Wu et al. Fulfillment scheduling for buy‐online‐pickup‐in‐store orders
JP6389310B1 (ja) 提示装置、提示方法、提示プログラムおよび情報管理システム
JP6193817B2 (ja) 需要予測装置およびプログラム
US20210233102A1 (en) Providing promotion recommendations and implementation of individualized promotions
JP2019032827A (ja) 生成装置、生成方法及び生成プログラム
JP2019046181A (ja) 推定装置、推定方法および推定プログラム
US20180285793A1 (en) Patron presence based workforce capacity notification
JP6805211B2 (ja) 提供装置、提供方法および提供プログラム
JP6298204B1 (ja) 算出装置、算出方法および算出プログラム
JP6276655B2 (ja) 需要予測装置およびプログラム
JP6353141B1 (ja) 生成装置、生成方法、および生成プログラム
Neale et al. The failure of practical intuition: How forward‐coverage inventory targets cause the landslide effect
US20140074752A1 (en) Commerce System and Method of Providing Access to an Investment Signal Based on Product Information
JP7080741B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP7000259B2 (ja) 生成装置、生成方法、および生成プログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210702

R150 Certificate of patent or registration of utility model

Ref document number: 6909183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250