JP6132698B2 - 表形式多次元データ変換方法及び装置 - Google Patents

表形式多次元データ変換方法及び装置 Download PDF

Info

Publication number
JP6132698B2
JP6132698B2 JP2013158408A JP2013158408A JP6132698B2 JP 6132698 B2 JP6132698 B2 JP 6132698B2 JP 2013158408 A JP2013158408 A JP 2013158408A JP 2013158408 A JP2013158408 A JP 2013158408A JP 6132698 B2 JP6132698 B2 JP 6132698B2
Authority
JP
Japan
Prior art keywords
row
column
tabular
data
heading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013158408A
Other languages
English (en)
Other versions
JP2015028736A (ja
Inventor
優 浅野
優 浅野
真 岩山
真 岩山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2013158408A priority Critical patent/JP6132698B2/ja
Priority to US14/445,681 priority patent/US9619455B2/en
Publication of JP2015028736A publication Critical patent/JP2015028736A/ja
Application granted granted Critical
Publication of JP6132698B2 publication Critical patent/JP6132698B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、表形式の多次元データを読み込み、計算機が処理しやすい形式に変換する方法および装置に関する。
現在、以下に示す処理に対するニーズが存在する。
(1) 表形式で表現されている統計データ等の多次元データを様々な観点から絞り込んで集計する処理
(2) 異なる表形式で表現されている多次元データを1つの多次元データに統合する処理
しかし、表形式で表現された多次元データは、一般に、計算機処理にはあまり適さない。そこで近年、前述した計算機処理のために、多次元データをRDF(Resource Description Framework)と呼ばれる形式で表現することが試みられている。例えば図1や図2に示すように3行3列で表現された表データをRDF形式で表現すると、模式的には、図3に示すようなネットワーク形式で表現される。図3は、図1及び図2に示す表のデータ部(2行2列のセルで構成される)のうち「セル1」をRDF形式で表したものであり、各セルを一意に特定するための次元情報や測度情報により記述される。このような記述方式を採用すれば、仮に同じセルが異なる表形式によって記述されていたとしても、RDF形式では表現が同一となり、計算機による絞込み処理や統合処理などが容易になる。
前述の通り、表形式は、一般的に、計算処理には適さないが人間には扱い易い形式である。一方で、データ数が数千にも及ぶ多次元データをRDF形式で表現した場合、人間にはデータ間の関係を把握することが困難なだけでなく、データの一覧性に欠ける問題がある。また、RDF形式は、人間にとっては目的とするデータを見つけ難いため、データの編集も難しい問題がある。更に、表形式であれば、行見出しや列見出しの要素(例えば図2の「製品出荷額」)を一度に変更できるのに対し、RDF形式で同じ処理を実行するには、個々のセルに対して、対応するノードやリンク(図3の場合は「ex:vStocks」というノードとリンク)の情報を全て変更する必要がある。
このため、同じ多次元データを、人間が扱いやすい二次元の表形式と、計算機が扱いやすいRDF形式との間で相互に変換できることが望まれる。ところが、表形式をRDF形式に変換する処理を計算機で実行しようにも、表形式には計算機処理に必要な情報が欠けていることが多い。以下、具体例により説明する。
まず、多次元データを計算機で処理する際に必須となる情報について説明する。表の構成データ(セル)は、複数の観点で測定された観測値である。例えば図1の符号105の構成データ(セル)は、「北海道」という「都道府県」に対応する製品出荷額の値を表している。「都道府県」の要素が「北海道」であるという観点がないと、この構成データ(セル)は意味をもたない。ここで、「都道府県」のことを次元、「北海道」のことを次元の値と呼ぶ。図1には、次元の値である「北海道」しか記載されていないが、人間はこの表全体を見れば、「北海道」が「都道府県」という次元の値であることを予測できる。しかし、「北海道」は「工業地域」という別の次元の値である可能性もあるため、計算機処理を行うためには次元を明示しておく必要がある。
また、符号101で示す列見出しの「製品出荷額」は、観測値を定める次元ではなく、観測値が何を測定したものであるかを表している。このような情報を測度と呼ぶ。ここでも、人間が見れば「製品出荷額」が「測度」を表していることを理解可能であるが、計算機処理を行うには、「測度」を「次元」と明確に区別することが必要となる。また、後述するように、人間用の表では、「測度」の記載自体が省略されることも多い。
計算機であっても、「都道府県」、「北海道」、「製品出荷額」といった次元、次元の値、測度の文字列に対し、URI(Uniform Resource Identifier)のような一意のIDが付与されていれば、同一IDを介してデータを統合することができる。しかし、このようなIDは、人間用の表では不要なため、図1に示す表でも明記されていない。
以上をまとめると、以下のような特徴が確認される。
(1) 人間用の表では、次元、測度が省略されることがある。
(2) 人間用の表では、次元と測度の区別はほとんどの場合なされていない。
(3) 人間用の表では、次元、次元の値、測度のIDも明記されていない。
そのため、表形式からRDF形式への変換処理を計算機で実行させるためには、人間用の表で欠けている情報を、変換処理に先立って記述しておく必要がある。その際、人間用の表の構造を可能な限り保存した状態で、変換処理に必要な情報を自然に埋め込むことができれば、人間にとって扱いやすい表形式の利点を保ったまま、計算機による処理が可能なRDF形式のデータに変換することができると発明者らは考える。
上記課題を解決するために、発明者らは、例えば特許請求の範囲に記載の構成を採用する。本出願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、表形式多次元データ変換装置(方法)は、(1) オリジナルの表の列見出し部を構成する各行の下に1行ずつ挿入し、挿入した行の各セルに対応する列見出しのIDを記入すると共に、オリジナル表の行見出し部を構成する各列の右に1列ずつ挿入し、挿入した列の各セルに対応する行見出しのIDを記入する第1の処理部(処理)と、(2) 列見出し部とデータ部の間に1行挿入すると共に、行見出し部とデータ部の間に1列挿入し、挿入した1行及び1列の各セルには、それぞれ対応する列見出し又は行見出しが次元の値であれば次元のIDを記入し、測度であれば何も記入せず、すべての列見出し及び行見出しが次元であれば、挿入した1行及び1列の交点のセルに測度のIDを更に記入する第2の処理部(処理)と、(3) 前記第1及び第2の処理部(処理)(実行順序は問わない)により作成されたテンプレート表(中間表)のデータ部の各セルから、各セルに対応する列見出し及び行見出しに記入されている次元、次元の値、測度を同定し、それらの情報をRDF形式のデータとして出力する第3の処理部(処理)とを有する。
本発明によれば、入力されたオリジナルの表のデータ部に対しては全く変更を加えることなく、RDF形式への変換に必要な情報をオリジナルの表に埋め込んだテンプレート表(中間表)を作成し、更に作成されたテンプレート表(中間表)からRDF形式のデータに必要な情報を同定する。この処理手法の採用により、本発明は、人間にとって扱いやすいという表形式の利点を保持した状態のまま、入力されたオリジナルの表のデータ部を計算機処理が可能なRDF形式のデータに変換することができる。前述した以外の課題、構成及び効果は、以下の実施の形態の説明により明らかにされる。
表データの一例を示す図。 表データを構成するセルデータとRDF形式による記述に必要な情報との関連付けを説明する図。 RDFデータの模式例を示す図。 表形式多次元データ変換装置の構成例を示すブロック図。 RDFデータのテキスト表現の例を示す図。 RDF化に必要な情報を埋め込んだテンプレート表の例を示す図。 単一測度の表データの例を示す図。 単一測度の表データから生成したテンプレート表の例を示す図。 複数測度の表データの例を示す図。 複数測度の表データから生成したテンプレート表の例を示す図。 表データおよびRDFデータの編集画面例1を示す図。 表データおよびRDFデータの編集画面例2を示す図。 表データからテンプレート表を生成する処理を説明するフローチャート。 テンプレート行とテンプレート列の交点位置をハイライト表示した画面例を示す図。 各列見出し行の直下に挿入されたURI行をハイライト表示した画面例を示す図。 各行見出し列の直右に挿入されたURI列をハイライト表示した画面例を示す図。 テンプレート表の表示を隠蔽状態に切り替える場合の処理を説明するフローチャート。 テンプレート表にURI行を挿入する処理を説明するフローチャート。 テンプレート表からURI行を削除する処理を説明するフローチャート。 表データをRDFデータに変換する処理を説明するフローチャート。 RDFデータを表データに変換する処理を説明するフローチャート。 RDFデータから変換した表データの例を示す図。 RDFデータのトリプルの例を示す図。
以下、図面に基づいて、本発明の実施の形態を説明する。なお、本発明の実施態様は、後述する形態例に限定されるものではなく、その技術思想の範囲において、種々の変形が可能である。
[実施例1]
(1)装置構成
図4に、本実施例に係る表形式多次元データ変換装置の構成を示す。表形式多次元データ変換装置400は、CPU401、メモリ402、キーボード・マウス403、ディスプレイ404、テンプレート生成部405、RDF変換部406、表変換部407、入出力制御部408、表示制御部409、データ通信部410、二次記憶部411を備える。
CPU401は、テンプレート生成部405、RDF変換部406、表変換部407、入出力制御部408、表示制御部409を構成する各種プログラムを実行することによって各種の処理を実行する。メモリ402は、CPU401が実行するプログラムと、プログラムを実行するために必要なデータとを一時的に記憶する。キーボード・マウス403は、ユーザからの入力を受け付ける。ディスプレイ404は、編集画面(例えば図11の編集画面1100や図12の編集画面1200)を表示制御部409の制御の下で表示する。二次記憶部411は、入力データや出力データなどを永続的に記憶するハードディスク等で構成される。
テンプレート生成部405は、表データに行や列を挿入し、RDF化に必要な情報(以下「RDF化情報」ともいう)が記入されるテンプレート表(中間表)を生成するプログラムで構成される。RDF変換部406は、必要な情報が記入されたテンプレート表(中間表)を使用して、データ部を構成する各セルが表すデータをRDF形式のデータに変換するプログラムで構成される。表変換部407は、RDF形式のデータを表形式に変換するプログラムで構成される。入出力制御部408は、表形式やRDF形式のデータの入出力を制御する。表示制御部409は、編集画面を表示するプログラムで構成される。データ通信部410はネットワーク420を介してデータ通信をするインターフェースであり、例えば、TCP/IPプロトコルによって通信可能なLANカードによって構成される。
(2)テンプレート表の構成
各構成部のプログラムの詳細を説明する前に、テンプレート生成部405で生成されるテンプレート表(中間表)について説明する。以下の説明では、図1及び図2に示す表をオリジナルの表として使用し、当該表からテンプレート表(中間表)を生成し、生成されたテンプレート表に必要な情報を入力した後、データ部を構成する各セルのデータを後述するRDF変換部406によってRDF形式のデータに変換する場合について説明する。
前述の通り、図2のセル1をRDF形式を模式化したのが図3である。RDF形式のデータは、実際には、図5に示すようなテキスト形式で出力される。発明が解決する課題で述べたように、表をRDF化する際には、観測値である表のデータ部を構成するセル毎に、観測の観点である次元とその値、観測の対象である測度の情報を図3に示すような形式で記述する。図3の場合、セル1の都道府県「ex:pref」の次元値が北海道「pref:C00」であること、セル1の測度「qb:measureType」が製品出荷額「ex:vStocks」であること、セル1の製品出荷額「ex:vStocks」が“6182”であることを表している。ここで、「ex:pref」などは、URIという一意のIDである。
図2は、RDF形式で表されたセル1の情報が、オリジナルの表のどこのセルに対応するかを示している。都道府県「ex:pref」は表中には記入されていない。次元の値である「北海道」と、測度である「製品出荷額」という情報自体は記入されているが、前者が次元の値で、後者が測度であるという区別まではオリジナルの表中には記入されていない。また、これらのURIもオリジナルの表には記入されていない。
そこで、これらの情報が記入できるように、図1及び図2に行や列を挿入して図6に示すようなテンプレート表(中間表)を生成する。テンプレート表(中間表)の生成処理の詳細については後述する。
まず、テンプレート生成部405は、列見出しの行601の下に1行挿入し(行602)、同行内に対応する測度のURIを記入できるようにする。同様に、テンプレート生成部405は、行見出しの列603の右に1列挿入し(列604)、同列内に対応する次元の値のURIを記入できるようにする。図6の例では、既に対応する速度や次元の値のURIが記入されている。なお、図6の場合とは異なり、列見出し行601の上に1行挿入し、行見出し列603の左に1行挿入することもできる。
次に、テンプレート生成部405は、列見出し部(図6では、行601と行602)とデータ部の間に1行挿入し(行605)、行見出し部(図6では、列603と列604)とデータ部の間にも1列挿入する(列606)。なお、ここでは、行602と列604を挿入した後に行605と列606を挿入しているが、挿入順序はこれにかぎらず、先に行605と列606を挿入し、その後、行602と列604を挿入しても良い。
図6に示すように、見出し部(行見出し部と列見出し部)とデータ部を分離するように挿入された行605及び列606を構成するセルのうち斜線が引いてあるセルは未使用セルとする。斜線を引いていないセルは、次元や測度の情報の記入に使用する。例えばセル607を含む列604には都道府県という次元の値が挿入されるため、セル607には、都道府県に対応する次元のURIを記入する。一方、セル608を含む行の各セルが対応する列見出しは全て測度を表すため、セル608は空白とする。
このような挿入ルールの採用により、テンプレート生成部405は、セルが空白か否かにより、該当セルに対応する行見出しや列見出しが次元を表しているか測度を表しているかを区別することができる。以上により、RDF化情報を全て表に埋め込むことができる。因みに、ここでの情報の挿入は、例えば利用者が手動で行う。図6に示すテンプレート表(中間表)が完成すれば、プログラムは、データ部のデータからRDF形式のデータを自動生成することができる。
ここで、テンプレート表(中間表)を生成する際にオリジナルの表に自動挿入される行や列は、全て、列見出し部や行見出し部に限られている。つまり、データ部には全く変更がないため、オリジナルの表の基本構造が保存される。よって、挿入した行や列を隠せば、いつでもテンプレート表(中間表)からオリジナルの表を再現できる。つまり、利用者は、オリジナルの表上で、データを閲覧したり、データを編集したりすることができる。テンプレート表(中間表)からオリジナルの表への変換処理については図17を用いて説明し、データの編集処理(行/列の挿入又は削除処理)については図18や図19を用いて説明する。
本実施例で提案するテンプレート表(中間表)では、オリジナルの表(2次元表)を構成する列見出しの各要素の下(又は上)に隣り合うようにURIを記入することができるだけでなく、行見出しの右(又は左)に隣り合うようにURIを記入することができる。このため、利用者は、URIの記入漏れや記入誤りを即座に見つけることができる。また、このテンプレート表(中間表)の場合、利用者は、列見出し部や行見出し部にまとめられている次元の値や測度とURIとを一度に一覧できるため、URIの表記の一貫性も保持しやすい。
以下、図7〜図10を用い、オリジナルの表が単一測度の場合と複数測度の場合とで、生成されるテンプレート表がどのように異なるかを説明する。因みに、図7はオリジナルの表が単一測度の表データの例であり、図9はオリジナルの表が複数測度の表データの例を示している。また、図8は単一測度の表データから生成されるテンプレート表の例であり、図10は複数測度の表データから生成されるテンプレート表の例である。以下、測度が単一の場合と複数の場合を順番に説明し、図6に示すテンプレート表(中間表)が、様々な表形式に対応可能であることを説明する。
図7は、オリジナルの表を構成する列見出しと行見出しがいずれも次元で与えられる例である。列見出しの行701は「産業分類」という次元を与え、行見出しの列702は「都道府県」という次元を与えている。測度は全てのデータに共通であり、例えば「売上高」とする。しかし、測度の情報は、オリジナルの表内には記載されず、表のタイトルなどに記載されることが多い。このような形式の表は、単一測度の表と呼ばれる。
図8は、図7に示すオリジナルの表から生成したテンプレート表の一例である。図6を生成した手順と同じ手順で生成する。ただし、図7に示す単一測度の表の場合、列見出しの行701と行見出しの列702が全て次元で与えられる。このため、列見出しの行の下に挿入された行803と行見出し部とデータ部との間に挿入された列805の交点に位置するセル802には測度の次元が入力される(図6との違い)。このため、データ部を構成する各セルの測度の次元は、見出し部とデータ部との間に挿入された行804と列805の交点に位置するセル801に記入する。
図9は、列見出し部と行見出し部がそれぞれ複数の行及び列で構成される複雑な表の例である。図9で表すオリジナルの表のうち行見出しの列903及び904と列見出しの行902は次元を表し、列見出しの行901は測度を表している。図10は、図9に示す複数測度のオリジナルの表から生成したテンプレート表の一例である。このテンプレート表の場合、2行目の列見出しの行1003の下に挿入された行1004と、行見出し部とデータ部との間に挿入された列1009とが交差するセル1013に次元が書き込まれる。なお、1行目の列見出しの行1001の下に挿入された行1002と、行見出し部とデータ部との間に挿入された列1009とが交差するセル1012は、対応する列見出しの行の要素が全て測度に対応するため空白である。なお、測度URIは行1002の対応セルに書き込まれるため、見出し部とデータ部の間に挿入された行1010と列1009の交点に位置するセル1011は空白のままとなる(図8との違い)。
以上のように、本実施例で提案するテンプレート表は、見出し部(列見出しの行と行見出しの列)が、(1)「次元(次元の値)」で構成される見出しと「測度」で構成される見出しの組み合わせ、(2)「次元(次元の値)」で構成される見出し同士の組み合わせ、(3)「次元(次元の値)と測度」で構成される複合見出しと「次元(次元の値)」で構成される見出しの組み合わせ等にも対応することができる。
(3)編集画面
図11に、表形式多次元データ変換装置400で使用する編集画面の一例を示す。編集画面1100は、表形式のデータからRDF形式のデータを生成する場合だけでなく、RDF形式のデータから表形式のデータを作成する場合にも使用される。編集画面1100上には、同じデータに対応する表形式の表示エリアとRDF形式の表示エリアが並んで表示される。利用者は、編集画面1100上で、これら2つのデータを相互に変換することができる。また、個々の表示エリアでは、対応するデータを個別に編集するために利用することもできる。
表示エリア1104は表形式のデータを表示するエリアであり、表示エリア1105はRDF形式のデータを表示するエリアである。表示エリア1104には、オリジナルの表又はRDF形式のデータから作成された表だけでなく、テンプレート表も選択的に表示される。表示エリア1105には、図5に示したように、RDF形式のデータがテキスト形式で表示される。利用者は、この編集画面1100により、データ全体の内容を容易に理解しつつ、セル毎のリンク関係も容易に確認することができる。
表読込ボタン1101が画面上でクリック操作されると、表示制御部409は、ファイル選択画面を編集画面1100上に表示する。なお、ディスプレイ404の画面表面に入力用のタッチスクリーンが配置されている場合には、マウスによるクリック操作に代えて、タッチ操作が用いられる。選択対象である表データは、二次記憶部411又はネットワーク420を通じて外部記憶部から読み出される。表示制御部409は、読み込んだ表データから生成されたテンプレート表(中間表)を表示エリア1104に表示する。また、表示制御部409は、表示エリア1104にテンプレート表が表示されている場合、オリジナルの表をRDF化するために必要な情報(例えば次元URI、値URI、測度URI)を対応するセルに記入した状態で表示する。
表示切替ボタン1102は、表示エリア1104に表示する表の形式を切り替えるために使用される。例えばテンプレート表が表示エリア1104に表示されている状態で表示切替ボタン1102がクリック操作されると、表示制御部409は、テンプレート表の生成時に挿入された行や列を隠し、表示内容をオリジナルの表に戻す。また例えば、オリジナルの表が表示されている状態で表示切替ボタン1102がクリック操作されると、表示制御部409は、隠されている行や列を再度表示する。すなわち、本実施例の場合、表示切替ボタン1102は、挿入行や挿入列を表示する状態と挿入行や挿入列を表示しない状態を相互に切り替えるトグルスイッチとして機能する。
利用者は、表示切替ボタン1102を使用目的に応じて操作することにより、表示エリア1104の表示状態を切り替えて所望の作業を行うことができる。例えばRDF化情報を入力する際には、表示エリア1104に挿入行や挿入列を表示させる(すなわち、テンプレート表を表示させる)。RDF化情報の入力が終わると、利用者は、挿入行や挿入列を隠してオリジナルの表と同じ表示状態でデータの閲覧やデータの編集に集中する。
表書き出しボタン1106が画面上でクリック操作されると、表形式多次元データ変換装置400は、表示エリア1104に表示されている表を、二次記憶部411に保存する、又は、ネットワーク420を通じて接続された外部記憶部に保存する。
変換ボタン1108は、表示エリア1104に表示されている表形式のデータをRDF形式のデータに変換する際にクリック操作される。当該ボタンがクリック操作されると、表示エリア1104に表示された表形式のデータから生成されたRDF形式のデータが表示エリア1105に表示される。この機能により、利用者は、計算機が処理可能なRDFデータを容易に生成することができる。
これとは別に、RDF読込ボタン1103は、二次記憶部411又はネットワーク420を通じて接続された外部記憶部からRDF形式のデータを読み出して表示エリア1105に表示するために使用される。
RDF書き出しボタン1107が画面上でクリック操作されると、入出力制御部408は、表示エリア1105に表示されているRDF形式のデータを、二次記憶部411に保存する、又は、ネットワーク420を通じて接続された外部記憶部に保存する。
変換ボタン1109は、表示エリア1105に表示されているRDF形式のデータを表形式のデータに変換する際にクリック操作される。当該ボタンがクリック操作されると、表示エリア1105に表示されていたRDF形式のデータから生成された表形式のデータが表示エリア1104に表示される。この機能により、利用者は、RDFデータに対応する表の内容を容易に確認することができる。
図12に、他の編集画面例を示す。編集画面1200は、表形式のデータとRDF形式のデータとは画面内で排他的に切り替え表示され、表示形式の切り替えにはタブ1201及び1202が用いられる。タブ1201は、表形式のデータを画面表示する際にクリック操作される。図中上段の画面に相当する。タブ1202は、RDF形式のデータを画面表示する際にクリック操作される。図中の下段の画面に相当する。なお、図12には、図11と対応する部分に同一符号を付して表している。当該表示形式を採用すれば、ディスプレイ404の限られた表示サイズを有効に活用することができる。すなわち、利用者による表の確認を容易にできる。
(4)処理動作例
以下、CPU401が実行するプログラムを通じて実現される処理動作の一例を説明する。
(4−1)表データからテンプレート表を生成する処理
まずは、利用者が表読込ボタン1101をクリック操作した場合に実行される処理内容を説明する。すなわち、読み込んだ表からテンプレート表を生成する処理について説明する。図13に、テンプレート生成処理手順を示す。なお、図13に示す処理は、プログラムに従い、CPU401とテンプレート生成部405が連携して実行する。
(ステップ1301)
表読込ボタン1101のクリック操作を検知したCPU401は、ファイル選択画面で選択された表データをメモリ402に読み込み、編集画面1100又は編集画面1200の形態で読み込まれた表データを表示する。
(ステップ1302)
表示エリア1104にオリジナルの表が表示されている場合において、利用者がデータ部の開始行と開始列を指示入力すると、テンプレート生成部405は、それぞれの列番号を変数DR及びDCとして保存する。図9に示す表の場合であれば、データの開始行DRは3行目、データの開始列DCは3列目になる。もっとも、データのフォーマットの均一性(例えば日付形式)からデータ部分をテンプレート生成部405に自動推定させる手法を採用してもよい。また、自動推定された値を画面上に表示させ、必要に応じて、利用者の修正を受け付ける手法を採用してもよい。
(ステップ1303−1304)
前ステップで変数DR及びDCが定まると、テンプレート生成部405は、データ部の上側に1行を挿入すると共にデータ部の左側に1列を挿入し、次元と測度の情報を記入するための行および列を用意する。具体的には、DR行の1行上に空行を挿入し、DC列の1列左に空列を挿入する。本明細書では、このようにデータ部と見出し部(データ部以外の部分であり、行見出しや列見出しを含む)の間に挿入される行及び列のことをテンプレート行及びテンプレート列と呼ぶ。例えば図9に示す表が与えられた場合、テンプレート生成部405は、行905の上にテンプレート行を挿入し、列906の左にテンプレート列を挿入する。すなわち、図10の行1010及び列1009が挿入される。
(ステップ1305)
テンプレート行とテンプレート列が表中に挿入されると、テンプレート生成部405は、それらの交点に位置するセル1011をハイライト表示する。図14に表示例を示す。ハイライト表示されているセルは、RDF化情報の入力対象となるセルであり、利用者に入力を促す効果がある。ハイライト表示により、利用者は、入力可能なセルを間違えずに済む。
(ステップ1306)
次に、テンプレート生成部405は、列見出し行(列見出し行が複数行の場合には、個々の列見出し行)の直下に空行を1行ずつ挿入し、次元の値と測度のURIを記入するための行を用意する。この挿入行をURI行と呼ぶ。図15に、列見出しの行が2行の場合の表示例である。同時に、テンプレート生成部405は、利用者が入力すべき箇所をハイライト表示する。このハイライト表示により、利用者は、入力可能なセルを間違えずに済む。
(ステップ1307)
この後、テンプレート生成部405は、データの開始行DRの値を更新する。具体的には、ステップ1302で設定された開始行DRの値を2倍する。
(ステップ1308)
さらに、テンプレート生成部405は、行見出し列(行見出し列が複数列の場合には、個々の行見出し列)の直右隣りに1列ずつ挿入し、次元の値と測度のURIを記入するための行を用意する。同時に、テンプレート生成部405は、利用者が入力すべき箇所をハイライト表示する。この挿入列をURI列と呼ぶ。図16に、行見出し列が2行の場合の表示例を示す。この場合も、ハイライト表示により、利用者は、入力可能なセルを間違えずに済む。
(ステップ1309)
この後、テンプレート生成部405は、データの開始列DCの値を更新する。具体的には、ステップ1302で設定された開始列DCの値を2倍する。
(まとめ)
以上の処理によりテンプレート表の生成が終了する。利用者は、テンプレート表のうちハイライト表示されているセルにRDF化情報を入力する。テンプレート生成部405は、入力された情報を各セルに対応付けて保存する。なお、過去に入力された履歴や辞書等を利用できる場合、テンプレート生成部405は、これらの情報に基づいて、RDF化情報を対応セルに自動的に入力する仕組みを採用することもできる。自動入力機能が搭載される場合、利用者の入力負担を軽減することができる。もっとも、全ての情報を自動入力できない場合も考えられるし、自動入力された情報の内容に誤りがある場合も考えられる。従って、自動入力された情報は、利用者が入力内容を確認できる表示態様で表示されることが望ましい。
(4−2)表示切替ボタン操作時の処理
次に、利用者が表示切替ボタン1102をクリック操作した場合に実行される処理内容を説明する。すなわち、表示エリア1104に表示される表の表示状態を切り替える場合の処理動作を説明する。表示制御部409は、表示切替ボタン1102がクリック操作された時点で、テンプレート行/列及びURI行/列が隠蔽済みか否か判断する。隠蔽済みの場合、CPU401は隠蔽設定をキャンセルする。一方、隠蔽済みでなかった場合、表示制御部409は、隠蔽設定を有効とし、図17に示す処理手順に従って、対象となる行や列を隠蔽する。図17に示す処理は、プログラムに従い、表示制御部409が実行する。
(ステップ1701)
ここでは、表示制御部409が処理対象であるテンプレート表を入力し、表示エリア1104に表示する。
(ステップ1702)
表示制御部409は、列見出しの行の直下に挿入されたURI行を隠蔽する。これらのURI行は全て偶数行である。従って、表示制御部409は、データ部の開始行DRよりも2行小さい範囲までの偶数行を隠蔽対象とする。
(ステップ1703)
次に、表示制御部409は、行見出しの列の右隣に挿入されたURI列を隠蔽する。これらのURI列は全て偶数列である。従って、表示制御部409は、データ部の開始列DCよりも2列小さい範囲までの偶数列を隠蔽対象とする。
(ステップ1704−1705)
続いて、表示制御部409は、テンプレート行とテンプレート列を隠蔽する。具体的には、データ部の開始行DRよりも1行小さい行と、データ部の開始列DCよりも1列小さい列を隠蔽する。
(まとめ)
表示エリア1104に表示される表示態様の切り替え機能の搭載により、利用者は、編集作業を効率的に行うことができる。例えばRDF化情報の記入する場合や記入されている情報を確認したい場合には、テンプレート行/列とURI行/列を含むテンプレート表を画面表示する。また、表の記載内容を利用者が確認したい場合には、テンプレート行/列とURI行/列を含まない2次形式の表を画面表示する。
(4−3)行/列の挿入/削除時の処理
利用者は、表示エリア1104上で、表示されている表(入力されたオリジナルの表だけでなく、テンプレート表を含む)に対して必要に応じて行や列を挿入又は削除することができる。なお、CPU401は、行や列の挿入/削除を実行する前に、現在画面上に表示されているかを判定する。以下では、説明を容易にするため、表示エリア1104には、テンプレート表が表示されている場合について説明する。
(行/列の挿入)
まず、図18を用い、既存のテンプレート表に対し、新たに行を挿入する場合の処理手順を説明する。なお、既存のテンプレート表に対し、新たに列を挿入する場合の処理手順は、図18と同様であるので説明を省略する。
(ステップ1801)
CPU401は、編集対象とするテンプレート表、挿入する行番号R、データ部の開始行DRを読み込む。因みに、開始行DRの値は、オリジナルの表を読み込んでテンプレート表を生成した時点で判明している。
(ステップ1802)
次に、CPU401は、挿入する行がテンプレート行及びURI行に該当するか否かを判定する。これらの場所には行を挿入できないため、挿入行としてテンプレート行又はURI行が指定された場合にはそのまま処理を終了する。一方、挿入行がテンプレート行でもURI行でない場合、CPU401は、ステップ1803に進む。
(ステップ1803)
CPU401は、挿入行の位置(行番号R)がデータの開始行DRより小さい値か否かを判定する。すなわち、挿入行が列見出し部に属するか、データ部に属するかを判定する。列見出し部への行の挿入である場合、CPU401はステップ1804以下の処理を実行し、データ部への行の挿入である場合、CPU401はステップ1807以降の処理を実行する。
(ステップ1804)
ここで、CPU401は、テンプレート表に対し、実際に行を挿入する。この場合、挿入される行は列見出し行であるため、RDF化情報を入力するためのURI行(1行)も同時に挿入する。当該機能により、RDF化情報の入力漏れ等を無くすことができる。
(ステップ1805−1806)
次に、CPU401は、RDF化情報の入力が必要なセルをハイライト表示する。ハイライト表示により、利用者は、入力可能なセルを間違えずに済む。ハイライト表示されたセルに所定の情報が入力された場合には、入力された情報を保持する。次に、CPU401は、データ部の開始行DRの値を更新する。前述のステップ1804で2行追加されているので、開始行DRの値はDR+2に更新される。
(ステップ1807−1808)
一方、挿入行がデータ部への行の追加である場合、列見出し部への行の挿入の場合のようにURI行を追加する必要はないので、CPU401は、指定された行番号Rに空行を挿入する。次に、CPU401は、挿入行のうちデータ部の開始列DCの左側のセルをハイライト表示する。
(行/列の削除)
次に、図19を用い、既存のテンプレート表から任意の行を削除する場合の処理手順を説明する。なお、既存のテンプレート表から任意の列を削除する場合の処理手順は、図19と同様であるので説明を省略する。
(ステップ1901)
CPU401は、編集対象とするテンプレート表、削除する行番号R、データ部の開始行DRを読み込む。因みに、開始行DRの値は、オリジナルの表を読み込んでテンプレート表を生成した時点で判明している。
(ステップ1902)
次に、CPU401は、削除する行がテンプレート行及びURI行に該当するか否かを判定する。これらの行は削除できないため、削除行としてテンプレート行又はURI行が指定された場合にはそのまま処理を終了する。一方、削除行がテンプレート行でもURI行でない場合、CPU401は、ステップ1903に進む。
(ステップ1903)
CPU401は、削除行の位置(行番号R)はデータ開始行DRより小さい値か否かを判定する。すなわち、削除行が列見出し部に属するか、データ部に属するかを判定する。列見出し部からの行の削除である場合、CPU401はステップ1904以降の処理を実行する。
(ステップ1904−1905)
ここで、CPU401は、テンプレート表から実際に行を削除する。この場合、削除される行は列見出し行であるため、URI行(1行)も同時に削除する。当該機能により、不必要なデータがテンプレート表内に残る可能性を無くすことができる。次に、CPU401は、データ開始行DRの値をDR-2に更新する。
(ステップ1906)
一方、削除行がデータ部の行である場合、CPU401は、指定された行を削除する。このように、本実施例の場合には、行見出し部の不要な情報も一度に削除することができる。これに対し、RDF化情報をテンプレート表以外の場所で定義して管理するような方式では、不要なRDF化情報を検索して削除する必要がある。すなわち、削除行に対応する各行見出し列の要素について検索処理を実行し、該当した要素のRDF化情報を削除する必要がある。
しかし、本実施例において提案するテンプレート表の場合には、前述の通り、オリジナルの表構造をそのまま保持しているため、データ行を削除するだけで関連する行見出し部の情報も自動的に削除することができる。
(4−4)表形式からRDF形式への変換
続いて、利用者が変換ボタン1108をクリック操作した場合に実行される処理内容を説明する。すなわち、表示エリア1104に表示される表形式のデータをRDF形式のデータに変換し、表示エリア1105に表示する場合の処理動作を説明する。なお、前提として、表示エリア1104にオリジナルの表が表示されている場合でも、対応するテンプレート表は既に生成されているものとする。以下では、図20を用い、表形式のデータからRDF形式のデータに変換する際の処理手順を説明する。
(ステップ2001)
まず、RDF変換部406は、変換対象とするテンプレート表、データ部の開始行DR及び開始列DCを読み出す。
(ステップ2002)
次に、RDF変換部406は、テンプレート行及びテンプレート列の交点に値があるか否かを判定する。具体的には、座標(DR-1,DC-1)のセルが空白(ブランク)か否かを判定する。例えば図8に示すテンプレート表であれば、符号801のセルが空白(ブランク)か否かを、図10に示すテンプレート表であれば、符号1011のセルが空白(ブランク)か否かを判定する。
この交点のセルに値を有するテンプレート表は「単一測度の表」である。図8のテンプレート表がこの場合に相当する。「単一測度の表」と判定された場合、RDF変換部406はステップ2003に進む。一方、この交点のセルに値を有しないテンプレート表は「複数測度の表」である。図10のテンプレート表がこの場合に相当する。「複数測度の表」と判定された場合、RDF変換部406はステップ2008に進む。
(ステップ2003)
RDF変換部406は、テンプレート行とテンプレート列の交点に位置するセルの値を測度URIとする。この測度URIで特定される測度は、表内のデータ部に記載された全てのデータの測度となる。
(ステップ2004−2006)
次に、RDF変換部406は、列見出し部のURI行(データ部の開始行DRより上に位置する各偶数行)とURI列(データ部の開始列DCより左に位置する各偶数列)から次元のURIと次元の値のURIを抽出する。ただし、単一測度の表の場合、列見出し部と行見出し部におけるURI行とURI列の情報は、必然的にすべて次元に関する情報である。そのため、RDF変換部406は、URI行とURI列から次元のURIと次元の値のURIを抽出することができる。
(ステップ2008−2012)
次に、ステップ2002の判定所で肯定結果が得られた場合について説明する。この場合、検査対象である交点セルは空白であるので、変換対象である表は「複数測度の表」である。例えば図10のテンプレート表がこの場合に相当する。この場合、複数の測度が、列見出し行又は行見出し列のどこかに埋め込まれている。
そこで、RDF変換部406は、まず測度が埋め込まれているURI行又はURI列を探す処理を実行する。この場合、RDF変換部406は、列見出し部のURI行(データ部の開始行DRより上に位置する各偶数行)とテンプレート列との交点セルが空白(ブランク)であるか否か、それともURI列(データ部の開始列DCより左に位置する各偶数列)とテンプレート行との交点セルが空白(ブランク)か否かを判定する。
測度が埋め込まれている場合、対応するURI行とテンプレート列との交点セル又はURI列とテンプレート行との交点セルは空白(ブランク)のはずである。ステップ2009は、この条件判定に対応する。従って、RDF変換部406は、交点セルが空白セルであるURI行又はURI列から測度のURIの集合を抽出する。一方、RDF変換部406は、交点セルが空白セルでないURI行又はURI列から次元のURIとその値のURIを抽出する。
(ステップ2007)
以上の処理により、任意のデータセルに対応する「測度」、「次元」、「次元の値」のURIを抽出できるため、RDF変換部406は、それらの情報を使用して任意のデータセルのデータをRDF化する。
(4−5)RDF形式から表形式への変換
最後に、利用者が変換ボタン1109をクリック操作した場合に実行される処理内容を説明する。すなわち、表示エリア1105に表示されるRDF形式のデータを表形式のデータに変換し、表示エリア1104に表示する場合の処理動作を説明する。以下では、図21を用い、RDF形式のデータから表形式のデータに変換する際の処理手順を説明する。
(ステップ2101)
まず、表変換部407は、表示エリア1105に表示されているRDF形式のデータからトリプル(s,p,o)と呼ばれる3つの要素を収集して集合Rを作る。RDF形式は、主語s、述語p、目的語oの三つ組み(トリプル)により、sの性質又は属性がoであることを表現する。図3のネットワーク表現で説明すると、主語はリンク元のノード、述語がリンク、目的語がリンク先のノードになる。図3の例には、3個のトリプルが含まれる。
(ステップ2102)
次に、表変換部407は、トリプルの集合Rから測度である述語pを抽出した後、任意の順番でソートしてリストPAとする。以下では、図9に示す表形式のデータを変換して作成したRDF形式のデータを入力に用い、それらを表形式に再変換する例について説明する。この場合、測度は「製品出荷額」と「従業者数」である。よって、リストPAは、例えば[製品出荷額,従業者数]となる。実際の測度はURIで表現されているが、説明の便宜上、文字列で表現する。
(ステップ2103)
表変換部407は、トリプルの集合Rから次元の述語pを抽出した後、任意の順番でソートして次元リストPDとする。例の場合は、例えば[都道府県、市区町村、年]となる。
(ステップ2104)
表変換部407は、トリプルの集合Rから主語のみを抽出した後、任意の順番でソートしてリストSとする。主語はデータセルの数だけ存在する。例の場合は、対応する図9の表には8個のデータセルがあるので、主語も8個ある。
(ステップ2105)
表変換部407は、リストSの各要素に対し長さが次元数|PD|の次元値リストpvを作る。例の場合は、次元リストPDの要素は3個であるため長さが3の次元値リストpvになる。このリストの要素には対応する次元の値を入れる。例えば図9の3行3列のセルの次元値リストpvは、[北海道、札幌市、2010]である。このようにして作成した次元値リストpvは主語sの数だけ存在し、主語と1対1に対応している。
次に、表変換部407は、次元値リストpvのN番目の要素をキーに、次元値リストpvの集合を多重ソートしてリストPVUとする。前述したように、次元値リストpvは、主語sと1対1対応している。このため、次元値リストpvを多重ソートすると、主語sも連動して並べ変える。更に、表変換部407は、ソートした次元値リストpvの要素の重複をつぶしてリストPVUとする。
以上で変換処理のための準備が終わり、データを表形式に配置していく。表変換部407は、測度が複数ある場合、列見出し部に測度のみを配置し、次元は全て行見出し部に配置する。なお、表変換部407は、単一測度の場合、次元を適当に分割して、一方を列見出し部に配置し、他方を行見出し部に振り分ける。図21は、複数測度の場合に適用する処理手順の例であるが、単一測度の場合にも容易に対応できる。
(ステップ2106−2108)
まず、表変換部407は、列見出し部を構成し、続くステップ2107とステップ2108で行見出し部を構成する。具体的には、リストPAの各要素を測度として列見出し部に順番に並べ、リストPDの各要素を次元名として行見出し部に順番に並べる。この際、リストPVUのi番目の要素をi+1行目の行見出し列の要素とする。
図22に、このようにして構成した表の構造例を示す。ここでは、説明を簡単にするために、テンプレート表ではなく人間用の表について説明するが、実際は、テンプレート表のURI行およびURI列に次元、次元の値、測度のURIを配置していく。なお、作成される表の構造は一例であり、一般には複数の構造を採り得る。
ステップ2106で説明したように、列見出し部には、測度として、リストPAの要素をそのまま並べる。行見出し部には、次元として、リストPVUの要素を上から並べる。図22は、これらの配置関係を示している。
(ステップ2109からステップ2111)
以上で表の構造が決まる。表変換部407は、主語Sの各要素S[i]がどのデータセルに対応するのかを決定して、データセルを埋めていく。図23に要素S[1]を主語に持つトリプルRの集合を示す。まず、要素S[1]が主語で測度が述語であるトリプルを探す。各セルに対し測度は一つしか存在しないので、このようなトリプルは一意に定まる。ここでは、符号2301で示すトリプルが見つかり、要素S[1]の測度が「従業者数」であることが分かる。測度のリストPA内を検索すれば、要素S[1]の列番号が決まる。次に、要素S[1]の次元リスト[北海道,札幌,2011]をリストPVU内で探せば、要素S[i]の行番号も決まる。
最後に、表変換部407は、要素S[i]が主語で述語が属性であるトリプルの目的語を、前述の処理で同定したデータセルの値に入れる。以上の処理を主語Sの全ての要素に対して繰り返せば、すべてのデータを表内のデータセルに配置できる。ここで説明した手法を用いれば、次元数と測度がいずれも複数の場合も含め、任意のデータ形式の表を作成することができる。
(4−5)まとめ
前述の説明では、RDF読込ボタン1103のクリック操作を通じ、RDF形式のデータを二次記憶部411又はネットワーク420から取得する場合を想定するが、RDF形式のデータを検索により取得する手法を採用してもよい。RDF形式のデータは、SPARQL(SPARQL Protocol and RDF Query Language)と呼ばれるクエリ言語を用いると、柔軟に検索することができる。例えば都道府県における特許出願数の総額と、都道府県における研究投資額の総額を別々のソースから検索し、それらを統合することもできる。
ただし、検索結果はRDF形式であるため、人間にとっては閲覧し難い。そこで、RDF形式の検索結果データを表示エリア1105に読み込んで変換ボタン1109をクリック操作することで、検索結果のデータを表形式で閲覧することができる。更に必要であれば、表上でデータを修正して、変換ボタン1108を押してRDF形式に戻すこともできる。前述したように、RDF形式のままでデータを編集することは面倒であるが、本実施例の場合には変換ボタン1108及び1109のクリック操作により、RDF形式のデータ内容の確認作業や編集作業を効率的に進めることができる。
(6)効果
実施例に係る表形式多次元データ変換装置は、入力したオリジナルの表を構成するデータ部には全く変更を加えることなく、RDF形式のデータへの変換に必要な情報をオリジナルの表に埋め込んだテンプレート表(中間表)を作成する。このため、オリジナルの表上でデータの閲覧やデータ編集をいつでも行える状態のまま、オリジナルの表のデータ部を構成する各データをRDF形式のデータに変換することができる。
また、本実施例の場合には、入力した表自体に必要な情報が全て埋め込めるため、データ管理が容易になる。また、列見出し及び行見出しの要素とそれらに対応付けるURI(ID)が隣り合って表示されるため、URIの入力漏れや入力誤りを防止することができる。また、関連するURIを画面上で一覧できるため、URIの一貫性も保持しやすい。
(7)他の形態例
本発明は、上述した実施例の構成に限定されるものでなく、様々な変形例を含んでいる。例えば上述した実施例は、本発明を分かりやすく説明するために、一部の実施例について詳細に説明したものであり、必ずしも説明した全ての構成を備える必要は無い。また、ある実施例の一部を他の実施例の構成に置き換えることが可能であり、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成に他の構成を追加し、又は、各実施例の一部構成を他の構成で置換し、又は各実施例の一部構成を削除することも可能である。
また、上述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路その他のハードウェアとして実現しても良い。また、上記の各構成、機能等は、それぞれの機能を実現するプログラムをプロセッサが解釈して実行することにより実現しても良い。すなわち、各構成等をソフトウェアにより実現しても良い。この場合、各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記憶装置、ICカード、SDカード、DVD等の記憶媒体に格納することができる。
また、制御線や情報線は、説明上必要と考えられるものを示すものであり、製品上必要な全ての制御線や情報線を表すものでない。実際にはほとんど全ての構成が相互に接続されていると考えて良い。
400 表形式多次元データ変換装置
401 CPU
402 メモリ
403 キーボード・マウス
404 ディスプレイ
405 テンプレート生成部
406 RDF変換部
407 表変換部
408 入出力制御部
409 表示制御部
410 データ通信部
411 二次記憶部
420 ネットワーク

Claims (15)

  1. オリジナルの表の列見出し部を構成する各行の下に1行ずつ挿入し、挿入した行の各セルに対応する列見出しのIDを記入すると共に、オリジナルの表の行見出し部を構成する各列の右に1列ずつ挿入し、挿入した列の各セルに対応する行見出しのIDを記入する第1の処理部と、
    前記列見出し部とデータ部の間に1行挿入すると共に、行見出し部とデータ部の間に1列挿入し、挿入した1行及び1列の各セルには、それぞれ対応する列見出し又は行見出しが次元の値であれば次元のIDを記入し、測度であれば何も記入せず、すべての列見出し又は行見出しが次元の値であれば、挿入した1行及び1列の交点のセルに測度のIDを更に記入する第2の処理部と、
    前記第1及び第2の処理部により作成されたテンプレート表のデータ部の各セルから、各セルに対応する列見出し及び行見出しに記入されている次元とその値及び測度を同定し、それらの情報をRDF形式のデータとして出力する第3の処理部と
    を有することを特徴とする表形式多次元データ変換装置。
  2. 請求項1に記載の表形式多次元データ変換装置において、
    前記オリジナルの表又は前記テンプレート表を表示する第1の表示エリアと、RDF形式のデータを表示する第2の表示エリアとを表示画面上に表示させる表示制御部
    を更に有することを特徴とする表形式多次元データ変換装置。
  3. 請求項2に記載の表形式多次元データ変換装置において、
    前記表示制御部は、表示画面上に、前記第1及び第2の表示エリアを並列表示する
    ことを特徴とする表形式多次元データ変換装置。
  4. 請求項2に記載の表形式多次元データ変換装置において、
    前記表示制御部は、表示画面上に、前記第1及び第2の表示エリアのいずれか一方だけを切り替え可能に表示する
    ことを特徴とする表形式多次元データ変換装置。
  5. 請求項2に記載の表形式多次元データ変換装置において、
    前記表示制御部は、前記第1の表示エリアに、前記オリジナルの表及び前記テンプレート表のいずれか一方だけを切り替え可能に表示する
    ことを特徴とする表形式多次元データ変換装置。
  6. 請求項2に記載の表形式多次元データ変換装置において、
    前記表示制御部は、前記第1の処理部が挿入した行及び列のうち列見出しのID及び行見出しのIDを記入するべきセルをハイライト表示する
    ことを特徴とする表形式多次元データ変換装置。
  7. 請求項2に記載の表形式多次元データ変換装置において、
    前記表示制御部は、前記第2の処理部が挿入した行及び列のうち次元のID及び測度のIDを記入するべきセルをハイライト表示する
    ことを特徴とする表形式多次元データ変換装置。
  8. 請求項1に記載の表形式多次元データ変換装置において、
    表示画面上に表示されている前記オリジナルの表又は前記テンプレート表に対して行又は列を挿入する操作の受付時、挿入行の下に1行を自動的に挿入する、又は、挿入列の右に1列を自動的に挿入する第4の処理部
    を更に有することを特徴とする表形式多次元データ変換装置。
  9. 請求項1に記載の表形式多次元データ変換装置において、
    表示画面上に表示されている前記オリジナルの表又は前記テンプレート表から行又は列を削除する操作の受付時、削除行の下の1行も同時に削除する、又は、削除列の右の1列も同時に削除する第5の処理部
    を更に有することを特徴とする表形式多次元データ変換装置。
  10. 請求項2に記載の表形式多次元データ変換装置において、
    前記表示制御部は、前記第1のエリアに表示された前記オリジナルの表又は前記テンプレート表をRDF形式のデータに変換するボタンを表示する
    ことを特徴とする表形式多次元データ変換装置。
  11. 請求項2に記載の表形式多次元データ変換装置において、
    前記表示制御部は、前記第2のエリアに表示されたRDF形式のデータを前記オリジナルの表又はテンプレート表に変換するボタンを表示する
    ことを特徴とする表形式多次元データ変換装置。
  12. 請求項11に記載の表形式多次元データ変換装置において、
    前記ボタンの操作時、
    RDF形式のデータから3要素の集合を生成する第6の処理部と、
    前記集合から測度の述語を抽出した後、任意の順番でソートして第1のリストと生成する第7の処理部と、
    前記集合から次元の述語を抽出した後、任意の順番でソートして第2のリストを生成する第8の処理部と、
    前記集合から主語を抽出した後、任意の順番でソートして第3のリストを生成する第9の処理部と、
    前記第3のリストの各要素に対して長さが次元数の第4のリストを生成する第10の処理部と、
    前記第4のリストをその第i番目(iは自然数)の要素について多重ソートして第5のリストを生成する第11の処理部と、
    前記第5のリストの要素の重複を削除して第6のリストを生成する第12の処理部と、
    前記第1のリストの各要素を測度として列見出し部に配列する第13の処理部と、
    前記第2のリストの各要素を次元名として行見出し部に配列する第14の処理部と、
    前記第6のリストの第j番目(jは自然数)の要素を第j+1行目の行見出し要素に配置する第15の処理部と、
    前記第3のリストの各要素について前記集合を検索し、測度のインデックスを同定する処理と、前記第5のリストの要素と一致する前記第6のリストの要素を検索し、次元のインデックスを同定する処理と、前記測度のインデックスを同定する処理で同定された目的語を、前記同定された2つのインデックスで与えられるセルに配置する処理とを含む第16の処理部と
    を有することを特徴とする表形式多次元データ変換装置。
  13. 計算機を利用して表形式の多次元データの形式を変換する表形式多次元データ変換方法であって、
    前記計算機のプロセッサが、オリジナルの表の列見出し部を構成する各行の下に1行ずつ挿入し、挿入した行の各セルに対応する列見出しのIDを記入すると共に、オリジナルの表の行見出し部を構成する各列の右に1列ずつ挿入し、挿入した列の各セルに対応する行見出しのIDを記入する第1の処理を実行することと、
    前記プロセッサが、前記列見出し部とデータ部の間に1行挿入すると共に、行見出し部とデータ部の間に1列挿入し、挿入した1行及び1列の各セルには、それぞれ対応する列見出し又は行見出しが次元の値であれば次元のIDを記入し、測度であれば何も記入せず、すべての列見出し又は行見出しが次元の値であれば、挿入した1行及び1列の交点のセルに測度のIDを更に記入する第2の処理を実行することと、
    前記プロセッサが、前記第1及び第2の処理の実行により作成されたテンプレート表のデータ部の各セルから、各セルに対応する列見出し及び行見出しに記入されている次元とその値及び測度を同定し、それらの情報をRDF形式のデータとして出力する第3の処理を実行すること
    含む、表形式多次元データ変換方法。
  14. 請求項13に記載の表形式多次元データ変換方法において、さらに、
    前記プロセッサが、前記オリジナルの表又は前記テンプレート表を表示する第1の表示エリアと、RDF形式のデータを表示する第2の表示エリアとを表示画面上に表示させる第4の処理を実行すること含む、表形式多次元データ変換方法。
  15. 請求項14に記載の表形式多次元データ変換方法において、
    前記プロセッサは、前記第4の処理において、表示画面上に、前記第1及び第2の表示エリアを並列表示する表形式多次元データ変換方法。
JP2013158408A 2013-07-31 2013-07-31 表形式多次元データ変換方法及び装置 Active JP6132698B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013158408A JP6132698B2 (ja) 2013-07-31 2013-07-31 表形式多次元データ変換方法及び装置
US14/445,681 US9619455B2 (en) 2013-07-31 2014-07-29 Table format multi-dimensional data translation method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013158408A JP6132698B2 (ja) 2013-07-31 2013-07-31 表形式多次元データ変換方法及び装置

Publications (2)

Publication Number Publication Date
JP2015028736A JP2015028736A (ja) 2015-02-12
JP6132698B2 true JP6132698B2 (ja) 2017-05-24

Family

ID=52428838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013158408A Active JP6132698B2 (ja) 2013-07-31 2013-07-31 表形式多次元データ変換方法及び装置

Country Status (2)

Country Link
US (1) US9619455B2 (ja)
JP (1) JP6132698B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9558577B2 (en) * 2012-02-07 2017-01-31 Rowland Hobbs Rhythmic mosaic generation methods, apparatuses and media
US10592196B2 (en) 2012-02-07 2020-03-17 David H. Sonnenberg Mosaic generating platform methods, apparatuses and media
US10127000B2 (en) 2012-02-07 2018-11-13 Rowland Hobbs Mosaic generating platform methods, apparatuses and media
CN107766309B (zh) * 2017-08-29 2021-06-25 腾讯科技(深圳)有限公司 数据表格生成方法、装置以及存储介质、电子装置
CN108647337B (zh) * 2018-05-14 2023-10-20 中国电力科学研究院有限公司 一种仿真分析数据的格式处理方法及装置
US11036768B2 (en) * 2018-06-21 2021-06-15 LeapAnalysis Inc. Scalable capturing, modeling and reasoning over complex types of data for high level analysis applications
CN109447134B (zh) * 2018-10-11 2024-07-02 平安科技(深圳)有限公司 数据合并方法、装置、计算机设备及存储介质
CN109491742B (zh) * 2018-10-31 2021-10-22 天津字节跳动科技有限公司 页面表格渲染方法及装置
CN111507075B (zh) * 2019-01-31 2023-06-16 贵州白山云科技股份有限公司 一种进行数据格式转换的方法及装置
CN110688826B (zh) * 2019-08-14 2023-07-25 中国平安人寿保险股份有限公司 无序行列转置方法、装置、计算机设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070198541A1 (en) * 2006-02-06 2007-08-23 International Business Machines Corporation Method and system for efficiently storing semantic web statements in a relational database
JP2007249754A (ja) * 2006-03-17 2007-09-27 Internatl Business Mach Corp <Ibm> 情報処理装置、情報処理方法およびプログラム
US7979455B2 (en) * 2007-11-26 2011-07-12 Microsoft Corporation RDF store database design for faster triplet access
US8078646B2 (en) * 2008-08-08 2011-12-13 Oracle International Corporation Representing and manipulating RDF data in a relational database management system
US8037108B1 (en) * 2009-07-22 2011-10-11 Adobe Systems Incorporated Conversion of relational databases into triplestores
US9098566B2 (en) * 2011-05-24 2015-08-04 Oracle International Corporation Method and system for presenting RDF data as a set of relational views

Also Published As

Publication number Publication date
US9619455B2 (en) 2017-04-11
US20150039984A1 (en) 2015-02-05
JP2015028736A (ja) 2015-02-12

Similar Documents

Publication Publication Date Title
JP6132698B2 (ja) 表形式多次元データ変換方法及び装置
JP5337745B2 (ja) データ処理装置
US10579678B2 (en) Dynamic hierarchy generation based on graph data
Stitz et al. Avocado: Visualization of workflow–derived data provenance for reproducible biomedical research
US9069830B2 (en) Retrieving data objects
JP6518768B2 (ja) レポートの構築
CN116662382A (zh) 准备和整理用于后续分析的数据的用户界面
JP6078437B2 (ja) パーソナル情報匿名化システム
JP2008046703A (ja) データ連携システムとその制御方法および制御プログラム
CN104239073A (zh) 一种数据维护系统快速原型开发系统及方法
CN103810152A (zh) 可视化公式编辑器
CN104866598A (zh) 基于可配置模板的异构数据库集成方法
KR20160117965A (ko) NoSQL 모델 생성 방법 및 그 장치
KR100581687B1 (ko) 이기종의 데이타베이스 관리시스템 통합방법 및 그 방법을실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는기록매체
Morris et al. setsApp for Cytoscape: set operations for Cytoscape nodes and edges
JP2014089646A (ja) 電子データ処理装置、及び電子データ処理方法
JP2006277127A (ja) 修正プログラムの比較方法
JP6245571B2 (ja) データ構造、データ生成装置、その方法及びプログラム
JP6287506B2 (ja) データベースアクセス制御プログラム、データベースアクセス制御方法、及び情報処理装置
JP2013125429A (ja) 分析対象決定装置
WO2018016001A1 (ja) データモデリングシステム、データモデリング方法
JP2004164363A (ja) リレーショナル・データベース構造を樹状図で表示する方法
US20230418451A1 (en) Operation support device, operation support method, and operation support program
JP2004341770A (ja) データ管理システム及びデータ管理方法
Tao et al. Kyrix-J: Visual Discovery of Connected Datasets in a Data Lake.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170418

R151 Written notification of patent or utility model registration

Ref document number: 6132698

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151