JP5572255B1 - デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム - Google Patents

デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム Download PDF

Info

Publication number
JP5572255B1
JP5572255B1 JP2013213717A JP2013213717A JP5572255B1 JP 5572255 B1 JP5572255 B1 JP 5572255B1 JP 2013213717 A JP2013213717 A JP 2013213717A JP 2013213717 A JP2013213717 A JP 2013213717A JP 5572255 B1 JP5572255 B1 JP 5572255B1
Authority
JP
Japan
Prior art keywords
digital information
relevance
information
classifier
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013213717A
Other languages
English (en)
Other versions
JP2015076043A (ja
Inventor
正宏 守本
秀樹 武田
彰晃 花谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ubic Inc
Original Assignee
Ubic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ubic Inc filed Critical Ubic Inc
Priority to JP2013213717A priority Critical patent/JP5572255B1/ja
Priority to EP14852397.0A priority patent/EP3057060A4/en
Priority to PCT/JP2014/057067 priority patent/WO2015052946A1/ja
Priority to US14/397,823 priority patent/US20160055157A1/en
Application granted granted Critical
Publication of JP5572255B1 publication Critical patent/JP5572255B1/ja
Priority to TW103135331A priority patent/TW201514724A/zh
Publication of JP2015076043A publication Critical patent/JP2015076043A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】分類者の分類精度を評価できるデジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラムを提供する。
【解決手段】デジタル情報分析システム1は、複数のデジタル情報のそれぞれに分類者によって付与されるデジタル情報と予め定められた特定事項との関連性を示す関連性情報を取得する関連性情報取得部14と、複数のデジタル情報のそれぞれと予め定められた特定事項との関連に応じて決定される関連性スコアを複数のデジタル情報ごとに算出する関連性スコア算出部16と、関連性スコアの予め定められた範囲ごとに、各範囲に含まれる関連性スコアを有するデジタル情報の総数に対する当該範囲に含まれるデジタル情報に付与された関連性情報の数の比率を算出する比率算出部18と、各範囲のそれぞれに対応づけられた複数の区画を比率に基づいて色を変化させて表示する表示部24とを備える。
【選択図】図1

Description

本発明は、デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラムに関する。特に、本発明は、デジタル情報を分類する分類者の分類精度の評価に資するデジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラムに関する。
従来、記録されたデジタル情報を表示し、複数の文書ファイルごとに、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、設定された利用者特定情報を記憶部に記録するように設定し、少なくとも一人以上の利用者を指定し、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索し、表示部を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力するシステムが知られている(例えば、特許文献1参照。)。特許文献1に記載のシステムによれば、特定の者に関係するデジタル文書情報のみを抽出し、訴訟の証拠資料作成のための作業負荷の軽減を図ることができる。
特開2012−181851号公報
特許文献1に記載されているようなシステムにおいて、デジタル情報に付帯情報を設定する分類者の分類結果を視覚的に表示することにより、分類者の分類精度の向上を図ることができると考えられる。
したがって、本発明の目的は、分類者の分類精度を評価できるデジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラムを提供することにある。
本発明は、上記目的を達成するため、複数のデジタル情報のそれぞれに分類者によって付与されるデジタル情報と予め定められた特定事項との関連性を示す関連性情報を取得する関連性情報取得部と、複数のデジタル情報のそれぞれと予め定められた特定事項との関連に応じて決定される関連性スコアを複数のデジタル情報ごとに算出する関連性スコア算出部と、関連性スコアの予め定められた範囲ごとに、各範囲に含まれる関連性スコアを有するデジタル情報の総数に対する範囲に含まれるデジタル情報に付与された関連性情報の数の比率を算出する比率算出部と、各範囲のそれぞれに対応づけられた複数の区画を、比率に基づいて色相、明度、若しくは彩度を変化させて表示する表示部とを備えるデジタル情報分析システムが提供される。
また、上記デジタル情報分析システムにおいて、関連性情報が、デジタル情報と予め定められた特定事項とが関連することを示す第1関連性情報、及びデジタル情報と予め定められた特定事項とが関連しないことを示す第2関連性情報を含み、比率算出部が、第1関連性情報の数に基づいて比率を算出することもできる。
また、上記デジタル情報分析システムにおいて、関連性情報取得部が、分類者を識別する分類者識別子に対応づけて関連性情報を取得し、表示部が、分類者識別子で識別される分類者ごとに複数の区画を表示することもできる。
また、上記デジタル情報分析システムにおいて、一のデジタル情報に対して関連性情報が付与される時間を計測する付与時間計測部を更に備え、表示部が、分類者識別子で識別される分類者ごとに時間から算出される分類スピードを表示することもできる。
また、上記デジタル情報分析システムにおいて、複数の区画のいずれかを選択する区画選択部を更に備え、表示部が、区画選択部が選択した区画に対応する範囲に含まれる関連性スコアを有するデジタル情報を表示することもできる。
また、本発明は、上記目的を達成するため、複数のデジタル情報のそれぞれに分類者によって付与されるデジタル情報と予め定められた特定事項との関連性を示す関連性情報を取得する関連性情報取得段階と、複数のデジタル情報のそれぞれと予め定められた特定事項との関連に応じて決定される関連性スコアを複数のデジタル情報ごとに算出する関連性スコア算出段階と、関連性スコアの予め定められた範囲ごとに、各範囲に含まれる関連性スコアを有するデジタル情報の総数に対する範囲に含まれるデジタル情報に付与された関連性情報の数の比率を算出する比率算出段階と、各範囲のそれぞれに対応づけられた複数の区画を、比率に基づいて色相、明度、若しくは彩度を変化させて表示する表示段階とを備えるデジタル情報分析方法が提供される。
また、本発明は、上記目的を達成するため、デジタル情報分析プログラムであって、コンピュータに、複数のデジタル情報のそれぞれに分類者によって付与されるデジタル情報と予め定められた特定事項との関連性を示す関連性情報を取得する関連性情報取得機能と、複数のデジタル情報のそれぞれと予め定められた特定事項との関連に応じて決定される関連性スコアを複数のデジタル情報ごとに算出する関連性スコア算出機能と、関連性スコアの予め定められた範囲ごとに、各範囲に含まれる関連性スコアを有するデジタル情報の総数に対する、範囲に含まれるデジタル情報に付与された関連性情報の数の比率を算出する比率算出機能と、各範囲のそれぞれに対応づけられた複数の区画を、比率に基づいて色相、明度、若しくは彩度を変化させて表示する表示機能とを実現させるデジタル情報分析プログラムが提供される。
本発明に係るデジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラムによれば、分類者の分類精度を評価できるデジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラムを提供できる。
本実施の形態に係るデジタル情報分析システムの機能構成ブロック図である。 本発明の実施の形態に係るデジタル情報分析システムの表示画面である。 本発明の実施の形態に係るデジタル情報分析システムの表示画面の一部の概要図である。 本発明の実施の形態に係るデジタル情報分析システムの処理のフロー図である。 本実施の形態に係るデジタル情報分析システムのハードウェア構成図である。
[実施の形態]
(デジタル情報分析システム1の概要)
本実施の形態に係るデジタル情報分析システム1は、ユーザー端末若しくはサーバー等の情報処理装置2に格納されている複数のデジタル情報に、各デジタル情報が予め定められた特定事項と関連性を有するか否かを示す関連性情報を付与するシステムであって、関連性情報を付与する分類者ごとに、デジタル情報に適切な関連性情報を付与しているか否かを示す分類精度を視覚的に表示するシステムである。
なお、予め定められた特定事項は、例えば、訴訟に関連することを示す情報である。そして、本実施の形態に係るデジタル情報分析システム1は、一例として、不正アクセスや機密情報漏洩等のコンピュータに関する犯罪や法的紛争が生じた場合に、犯罪や紛争の原因究明や捜査に要する電子的記録であるデジタル情報を収集及び分析し、その法的な証拠性を明らかにする技術であるフォレンジックに適用できる。
また、本実施の形態においてサーバーは、1つ以上のサーバーであって、複数のサーバーを含んで構成することもできる。例えば、サーバーは、メールサーバー、ファイルサーバー、又は文書管理サーバー等のデジタル情報を格納可能なサーバーを含む。また、ユーザー端末は、1つ以上のユーザー端末であって、複数のユーザー端末を含んで構成することもできる。例えば、ユーザー端末は、パーソナルコンピュータ、ノートパソコン、タブレットPC、又は携帯電話等の携帯通信端末等を含む。
(デジタル情報分析システム1の詳細)
図1は、本実施の形態に係るデジタル情報分析システムの機能構成ブロックの一例を示す。
本実施の形態に係るデジタル情報分析システム1は、外部からの入力を受け付ける入力部10と、情報処理装置2に格納されているデジタル情報を取得する情報取得部12と、分類者によってデジタル情報に付与される関連性情報を取得する関連性情報取得部14と、デジタル情報と予め定められた特定事項との関連に応じて決定される関連性スコアを算出する関連性スコア算出部16と、関連性スコアの予め定められた範囲ごとに、各範囲に含まれる関連性スコアを有するデジタル情報の総数に対する当該範囲に含まれるデジタル情報に付与された関連性情報の数の比率を算出する比率算出部18とを備える。
また、デジタル情報分析システム1は、分類者の関連性情報の付与に要する時間を計測する付与時間計測部20と、関連性スコアの予め定められた各範囲を表示する表示部24の表示を制御する表示制御部22と、関連性スコアの予め定められた各範囲のそれぞれに対応づけられた複数の区画のいずれかを選択する区画選択部26とを備える。
なお、関連性スコアは、例えばデジタル情報が文書ファイルである場合、当該文書と予め定められた特定事項との関連性を示す値である。関連性スコアの値が大きい程、当該デジタル情報の予め定められた特定事項との関連性が高いことを示す。関連性スコアは、デジタル情報に含まれるキーワード若しくは関連用語等に基づいて算出される。
(情報処理装置2)
情報処理装置2は、複数のデジタル情報を格納するデジタル情報格納部と、デジタル情報を外部に出力する情報出力部とを有する。デジタル情報格納部は、文章情報を含む文書ファイル、テキストファイル、又は電子メール等の複数のデジタル情報を格納する。デジタル情報格納部は、情報取得部12からの働きかけに応じ、所定のデジタル情報を情報取得部12に供給する。なお、デジタル情報分析システム1と情報処理装置2とは、インターネット等の通信ネットワーク、又はLAN等の有線若しくは無線のネットワーク等により相互に通信可能に接続される。また、デジタル情報分析システム1は、情報処理装置2が有する機能及び構成の一部又は全部を備えることもできる。
(入力部10)
入力部10は、分類者を一意に識別する分類者識別子に対応づけて外部からの入力を受け付ける。具体的に入力部10は、分類者がデジタル情報に付与する関連性情報の入力を分類者識別子、及び当該デジタル情報(若しくは、当該デジタル情報を一意に識別するデジタル情報識別子)に対応づけて受け付ける。ここで、関連性情報は、デジタル情報と予め定められた特定事項とが関連することを示す第1関連性情報と、デジタル情報と予め定められた特定事項とが関連しないことを示す第2関連性情報とを含む。第1関連性情報は、例えば、デジタル情報が予め定められた特定事項と関係を有する「HOTドキュメント」であることを示す情報である。また、第2関連性情報は、例えば、デジタル情報が予め定められた特定事項と関係を有さない「Non−HOTドキュメント」であることを示す情報である。入力部10は、入力された関連性情報を分類者識別子に対応づけて関連性情報取得部14に供給する。また、入力部10は、分類者が一のデジタル情報に対する関連性情報の入力を開始した時刻を示す情報を分類者識別子に対応づけて付与時間計測部20に供給する。
(情報取得部12)
情報取得部12は、情報処理装置2からデジタル情報を取得する。具体的に、情報取得部12は、分類者が関連性情報を付与する対象であるデジタル情報を情報処置装置2から取得する。例えば、情報取得部12は、入力部10に入力されたデジタル情報を識別するデジタル情報識別子に基づいて、情報処理装置2からデジタル情報を取得する。情報取得部12は、取得したデジタル情報を分類者識別子に対応づけて関連性スコア算出部16に供給する。
(関連性情報取得部14)
関連性情報取得部14は、複数のデジタル情報のそれぞれに分類者によって手動で付与される関連性情報を入力部10から取得する。関連性情報取得部14は分類者識別子に対応づけて関連性情報を取得する。関連性情報取得部14は、一のデジタル情報に対して付与される関連性情報を、分類者識別子と当該一のデジタル情報のデジタル情報識別子とに対応づけて比率算出部18に供給する。また、関連性情報取得部14は、当該関連性情報を取得した時刻を示す情報を分類者識別子に対応づけて付与時間計測部20に供給する。
(関連性スコア算出部16)
関連性スコア算出部16は、複数のデジタル情報のそれぞれと予め定められた特定事項との関連に応じて決定される関連性スコアを複数のデジタル情報ごとに算出する。関連性スコア算出部16は、デジタル情報の内容に基づいて関連性スコアを自動的に算出する。具体的に、関連性スコア算出部16は、一のデジタル情報に含まれるテキストデータ等を形態素解析する。そして、関連性スコア算出部16は、予め定められた特定事項と当該特定事項との関連性が高い形態素との対応関係に基づいて、一のデジタル情報に対する関連性スコアを算出する。
例えば、関連性スコア算出部16は、デジタル情報に含まれるテキストデータを形態素解析する。そして、関連性スコア算出部16は、形態素解析して得られる形態素自体の評価値、形態素が当該デジタル情報に含まれる数、形態素の当該デジタル情報における出現頻度、当該デジタル情報に含まれる関連用語の評価値、関連用語の当該デジタル情報に含まれる数、及び/又は関連用語の当該デジタル情報における出現頻度等に基づいて、関連性スコアを算出する。一例として、関連性スコア算出部16は、形態素の評価値が高いほど、デジタル情報に含まれる形態素の数が多いほど、デジタル情報における形態素の出現頻度が高いほど高い関連性スコアを算出する。同様に、関連性スコア算出部16は、デジタル情報に含まれる関連用語の評価値が高いほど、当該デジタル情報に含まれる関連用語の数が多いほど、当該デジタル情報における関連用語の出現頻度が高いほど高い関連性スコアを算出する。
なお、関連用語とは、例えば、第1関連性情報が対応づけられた複数のデジタル情報に共通して含まれると共に出現頻度が予め定められた頻度以上の形態素のうち、評価値が予め定められた値以上の形態素である。出現頻度とは、一のデジタル情報に含まれる形態素の総数に対して関連用語が含まれる割合である。なお、関連性スコア算出部16は、予め定められた特定事項と関連性を有する形態素のデータベースを含むこともできる。この場合、関連性スコア算出部16は、当該データベースを参照することで形態素が予め定められた特定事項と関連性を有するか否かを判断することができる。そして、関連性スコア算出部16は、予め定められた特定事項と関連性を有する形態素を用いて関連性スコアを算出できる。関連性スコア算出部16は、算出した関連性スコアを比率算出部18に供給する。
(比率算出部18)
比率算出部18は、関連性スコアの予め定められた範囲ごとに、各範囲に含まれる関連性スコアを有するデジタル情報の総数に対する当該範囲に含まれるデジタル情報に付与された関連性情報の数の比率を算出する。比率算出部18は、例えば、デジタル情報に付与された第1関連性情報の数に基づいて比率を算出することができる。ここで、関連性スコアの予め定められた範囲とは、関連性スコアが「0(ゼロ)」から「X(Xは1以上の正数)」までの数値範囲である場合、当該数値範囲を予め定められた間隔で区切った範囲である。一例として、予め定められた範囲とは、関連性スコアを200点ごとに区切った複数の範囲のそれぞれである。なお、関連性スコアを区切る数値範囲は適宜変更できる。
具体的に比率算出部18は、以下のプロセスにより比率を算出する。まず、比率算出部18は、関連性情報取得部14から受け取る情報に基づいて、デジタル情報に第1関連性情報と第2関連性情報とのいずれが対応づけられているかを判断する。また、比率算出部18は、関連性スコア算出部16から受け取る情報に基づいて、デジタル情報それぞれの関連性スコアを把握する。そして、比率算出部18は、一の関連性スコアの範囲に含まれるデジタル情報の総数を計測する。続いて、比率算出部18は、当該一の関連性スコアの範囲に含まれるデジタル情報のうち、第1関連性情報が付与されているデジタル情報の数を計測する。そして、比率算出部18は、第1関連性情報が付与されているデジタル情報の数を、当該一の関連性スコアの範囲に含まれるデジタル情報の総数で除することにより、分類者識別子に対応づけて比率を算出する。
一例として、比率算出部18が、関連性スコアが6200点以上6400点未満の関連性スコアのスコア範囲における比率を算出する場合を説明する。比率算出部18は、複数のデジタル情報のうち関連性スコアが6200点以上6400点未満の範囲に含まれるデジタル情報の数(以下、「A」と表す。)を計測する。そして、比率算出部18は、関連性スコアが6200点以上6400点未満の範囲に含まれるデジタル情報のうち、「HOTドキュメント」であることを示す情報が付与されているデジタル情報の数(以下、「B」と表す。)を計測する。そして、比率算出部18は、「B/A」の値を比率として算出する。比率算出部18は、算出した比率を示す情報を当該比率が算出されたスコア範囲、及び分類者識別子に対応づけて表示制御部22に供給する。
(付与時間計測部20)
付与時間計測部20は、一のデジタル情報に対して関連性情報が付与される時間を計測する。具体的に、付与時間計測部20は、入力部10から一の分類者が一のデジタル情報に対する関連性情報の入力を開始した時刻を示す情報を受け取った時点から、関連性情報取得部14から当該一のデジタル情報に付与された関連性情報を取得した時刻を示す情報を受け取った時点までに要した時間を計測する。付与時間計測部20は、複数のデジタル情報のそれぞれについて、関連性情報が付与される時間を計測する。また、付与時間計測部20は、分類者識別子に対応づけて関連性情報が付与される時間を計測する。そして、付与時間計測部20は、分類者識別子ごとに、当該分類者識別子で識別される分類者の関連性情報を付与するスピード(例えば、1つのデジタル情報あたりに費やした関連性情報を付与する時間)を算出する。付与時間計測部20は、計測した時間、及び/又は算出したスピードを示す情報を分類者識別子に対応づけて表示制御部22に供給する。
(表示制御部22、表示部24)
表示部24は、関連性スコアの予め定められた各範囲のそれぞれに対応づけられた複数の区画をデジタル情報を表示可能なディスプレイ等の表示装置に表示する。具体的に、表示部24は、表示制御部22が比率算出部18から受け取った比率を示す情報に基づいて複数の区画それぞれの色相、明度、若しくは彩度を変化させて表示する。ここで、表示部24は、分類者識別子で識別される分類者ごとに複数の区画を表示する。すなわち、表示制御部22は、複数の分類者ごとに比率算出部18から受け取った比率に応じ、複数の区画の色相、明度、若しくは彩度を変化させた状態で表示部24に各区画を表示させる。例えば、表示制御部22は、比率が0%から100%に増加するに応じて、各区画の色を寒色系の色から暖色系の色に徐々に変化させて表示する。
また、表示部24は、分類者識別子で識別される分類者ごとに付与時間計測部20から受け取った情報に基づいて、各分類者のデジタル情報を分類するスピードである分類スピードを表示する。表示部24は、付与時間計測部20から受け取った計測した時間を示す情報から算出される分類スピードを、複数の区画と共に表示する。なお、表示部24は、分類スピードを表示する場合、横軸に時間軸を取り、縦軸に分類スピード軸を取ったグラフとして表示できる。ここで、時間軸のタイムスパンは適宜変更できる。
(区画選択部26)
区画選択部26は、関連性スコアの予め定められた各範囲のそれぞれに対応づけられた複数の区画のいずれかを外部からの指示に応じて選択する。表示制御部22は、区画選択部26によって選択された区画に対応するスコア範囲に含まれる関連性スコアを有するデジタル情報を、表示部24に表示させる。これにより、デジタル情報分析システム1は、表示部24に表示されている複数の区画それぞれに含まれるデジタル情報の内容を表示することができる。
(デジタル情報分析システム1の表示画面260の概要)
図2は、本発明の実施の形態に係るデジタル情報分析システムの表示画面の一例を示す。また、図3は、本発明の実施の形態に係るデジタル情報分析システムの表示画面の一部の概要を模式的に示す。
表示制御部22に制御されて表示部24に表示される表示画面260は、関連性スコアの予め定められた各範囲のそれぞれに対応づけられた複数の区画及び比率を表示する表示領域262を有する。表示領域262は、分類スピードを表示する分類スピード領域264と、複数の分類者の氏名又は名称を表示する分類者欄266と、関連性スコアを表示する関連性スコア欄268とを含む。一例として、デジタル情報分析システム1は、表示領域262の横方向に予め定められたスコア範囲ごとに複数の区画を有して構成される関連性スコア欄268を有する。そして、デジタル情報分析システム1は、表示領域262の縦方向に分類者を表示する分類者欄266を有する。したがって、関連性スコア欄268は、分類者ごとに設けられる。
図3を参照する。一例として、デジタル情報分析システム1の表示部24は、一の分類者の分類者名266aを分類者欄266に表示する。関連性スコア欄268は、表示部24の一方向(図3の例では、横方向)に沿って複数の区画を表示する。ここで、表示部24は、関連性スコアが予め定められたスコア範囲ごとに順に増大する順序で複数の区画を配列して表示する。図3の例で表示部24は、左から右方向に沿って、200点ずつ関連性スコアが増大するように複数の区画を配列して表示している。
したがって、各区画には、予め定められたスコア範囲を有する関連性スコアが対応づけられている。具体的に、一の区画にx点以上x+y点未満(ただし、x及びyは0以上の正数あり、x≠yである。)の関連性スコアのスコア範囲が対応づけられている場合、当該一の区画に隣接する他の区画には、x+y点以上x+y+z点未満(ただし、zは0以上の正数あり、y≠zである。)の関連性スコアのスコア範囲が対応づけられる。例えば、一の区画には0点以上200点未満の関連性スコアが対応づけられる場合、当該一の区画の隣の区画には200点以上400点未満の関連性スコアが対応づけられる。すなわち、この例では、スコア範囲は一定である。
表示制御部22は、比率算出部18から分類者識別子に対応づけて比率を示す情報を受け取った場合、当該分類者識別子で識別される分類者の分類者欄266であって、当該比率の算出に用いられたデジタル情報の関連性スコアに該当する関連性スコア欄268の区画300の色相、明度、若しくは彩度を変化さて表示部24に表示させる。例えば、表示制御部22は、比率算出部18が算出した比率が0%から100%に増大するにしたがって、徐々に寒色系の色(例えば、青色)から暖色系の色(例えば、赤色)に変化させて区画を表示する。関連性スコアが高いデジタル情報は、予め定められた特定事項との関連性が高いデジタル情報である。したがって、関連性スコアが高いほど、高い関連性スコアに対応する区画の色は暖色系であることが好ましいことになる。よって、表示部24に表示される各区画の色を参照することで、各分類者の分類精度の良し悪しを一目で把握できることになる。
(デジタル情報分析システムの処理の流れの概要)
図4は、本発明の実施の形態に係るデジタル情報分析システムの処理の流れの一例を示す。
まず、関連性情報取得部14は、情報取得部12が取得したデジタル情報に対して入力部10を介して付与される関連性情報を取得する(ステップ10。以下、ステップを「S」と表す。)。関連性情報取得部14は、入力部10に関連性情報を入力した分類者の分類者識別子に対応づけて関連性情報を取得する。関連性情報取得部14は、取得した関連性情報を比率算出部18に供給する。また、関連性スコア算出部16は、情報取得部12が取得したデジタル情報の関連性スコアを算出する(S15)。関連性スコア算出部16は、算出した関連性スコアを比率算出部18に供給する。
比率算出部18は、予め定められた関連性スコアのスコア範囲に含まれる関連性スコアを有するデジタル情報の総数を計測する。そして、比率算出部18は、当該スコア範囲に含まれる関連性スコアを有するデジタル情報であって、第1関連性情報が対応づけられているデジタル情報の数を計測する。次に、比率算出部18は、第1関連性情報が対応づけられているデジタル情報の数を、計測した総数で除することにより比率を算出する(S20)。比率算出部18は、複数のスコア範囲のそれぞれについて比率を算出する。比率算出部18は、算出した比率を示す情報を表示制御部22に供給する。
表示制御部22は、比率算出部18から受け取った比率を示す情報に基づいて、表示部24の複数の区画のそれぞれの色相、明度、若しくは彩度を変化させて表示する(S25)。表示制御部22は、複数の分類者のそれぞれごとに複数の区画を表示する。
図5は、本発明の実施の形態に係るデジタル情報分析システムのハードウェア構成の一例を示す。
本実施の形態に係るデジタル情報分析システム1は、CPU1500と、グラフィックコントローラ1520と、Random Access Memory(RAM)、Read−Only Memory(ROM)及び/又はフラッシュROM等のメモリ1530と、データを記憶する記憶装置1540と、記録媒体からデータを読み込み及び/又は記録媒体にデータを書き込む読込/書込み装置1545と、データを入力する入力装置1560と、外部の通信機器とデータを送受信する通信インターフェース1550と、CPU1500とグラフィックコントローラ1520とメモリ1530と記憶装置1540と読込/書込み装置1545と入力装置1560と通信インターフェース1550とを互いに通信可能に接続するチップセット1510とを備える。
チップセット1510は、メモリ1530と、メモリ1530にアクセスして所定の処理を実行するCPU1500と、外部の表示装置の表示を制御するグラフィックコントローラ1520とを相互に接続することにより、各構成要素間のデータの受渡しを実行する。CPU1500は、メモリ1530に格納されたプログラムに基づいて動作して、各構成要素を制御する。グラフィックコントローラ1520は、メモリ1530内に設けられたバッファ上に一時的に蓄えられた画像データに基づいて、画像を所定の表示装置に表示させる。
また、チップセット1510は、記憶装置1540と、読込/書込み装置1545と、通信インターフェース1550とを接続する。記憶装置1540は、デジタル情報分析システム1のCPU1500が使用するプログラムとデータとを格納する。記憶装置1540は、例えば、フラッシュメモリである。読込/書込み装置1545は、プログラム及び/又はデータを記憶している記憶媒体からプログラム及び/又はデータを読み取って、読み取ったプログラム及び/又はデータを記憶装置1540に格納する。読込/書込み装置1545は、例えば、通信インターフェース1550を介し、インターネット上のサーバーから所定のプログラムを取得して、取得したプログラムを記憶装置1540に格納する。
通信インターフェース1550は、通信ネットワークを介して外部の装置とデータの送受信を実行する。また、通信インターフェース1550は、通信ネットワークが不通の場合、通信ネットワークを介さずに外部の装置とデータの送受信を実行することもできる。そして、キーボード、タブレット、マウス等の入力装置1560は、所定のインターフェースを介してチップセット1510と接続する。
記憶装置1540に格納されるデジタル情報分析システム1用のデジタル情報分析プログラムは、インターネット等の通信ネットワーク、又は磁気記録媒体、光学記録媒体等の記録媒体を介して記憶装置1540に提供される。そして、記憶装置1540に格納されたデジタル情報分析システム1用のデジタル情報分析プログラムは、CPU1500により実行される。
本実施の形態に係るデジタル情報分析システム1により実行されるデジタル情報分析プログラムは、CPU1500に働きかけて、デジタル情報分析システム1を、図1から図4において説明した入力部10、情報取得部12、関連性情報取得部14、関連性スコア算出部16、比率算出部18、付与時間計測部20、表示制御部22、表示部24、及び区画選択部26として機能させる。
(実施の形態の効果)
本実施の形態に係るデジタル情報分析システム1は、デジタル情報に適切な関連性情報を付与しているか否かを示す精度を複数の分類者それぞれごとに一目で把握することができるように、分類者ごとの分類精度をマップ表示(例えば、ヒートマップ表示)することができる。そして、デジタル情報分析システム1は、デジタル情報の関連性スコアが高いほど当該デジタル情報が予め定められた特定事項との関連性が高いことを利用し、関連性スコアの高さに応じて区画の表示状態を変更することができる。すなわち、本実施の形態に係るデジタル情報分析システム1によれば、関連性スコアの各区画の色を参照するだけで、各分類者のデジタル情報の分類精度を一目で把握することができるように区画の色を比率に応じて変化させて表示できる。これにより、デジタル情報分析システム1によれば、各分類者のデジタル情報の分類精度を視覚的に表示することができるので、分類者に分類精度を向上させる情報を提供することができる。
更に、デジタル情報分析システム1は、一の分類者がデジタル情報に関連性情報を付与するスピードを分類スピード領域264に表示するので、分類者の分類スピードを分類者の分類精度と共に一目で把握することができる。これにより、デジタル情報分析システム1は、例えば、一の分類者の分類精度が高い場合であっても、分類スピードが遅い等の分類者の特徴を把握することができる。
以上、本発明の実施の形態を説明したが、上記に記載した実施の形態は特許請求の範囲に係る発明を限定するものではない。また、実施の形態の中で説明した特徴の組合せのすべてが発明の課題を解決するための手段に必須であるとは限らない点に留意すべきである。更に、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品とのような複数の部分に分割されて適用されるようにすることもできる。
1 デジタル情報分析システム
2 情報処理装置
10 入力部
12 情報取得部
14 関連性情報取得部
16 関連性スコア算出部
18 比率算出部
20 付与時間計測部
22 表示制御部
24 表示部
26 区画選択部
260 表示画面
262 表示領域
264 分類スピード領域
266 分類者欄
266a 分類者名
268 関連性スコア欄
300 区画
1500 CPU
1510 チップセット
1520 グラフィックコントローラ
1530 メモリ
1540 記憶装置
1545 読込/書込み装置
1550 通信インターフェース
1560 入力装置

Claims (7)

  1. 複数のデジタル情報のそれぞれに分類者によって付与される前記デジタル情報と予め定められた特定事項との関連性を示す関連性情報を取得する関連性情報取得部と、
    前記複数のデジタル情報のそれぞれと前記予め定められた特定事項との関連に応じて決定される関連性スコアを前記複数のデジタル情報ごとに算出する関連性スコア算出部と、
    前記関連性スコアの予め定められた範囲ごとに、各範囲に含まれる前記関連性スコアを有する前記デジタル情報の総数に対する前記範囲に含まれる前記デジタル情報に付与された前記関連性情報の数の比率を算出する比率算出部と、
    前記各範囲のそれぞれに対応づけられた複数の区画を、前記比率に基づいて色相、明度、若しくは彩度を変化させて表示する表示部と
    を備えるデジタル情報分析システム。
  2. 前記関連性情報が、前記デジタル情報と前記予め定められた特定事項とが関連することを示す第1関連性情報、及び前記デジタル情報と前記予め定められた特定事項とが関連しないことを示す第2関連性情報を含み、
    前記比率算出部が、前記第1関連性情報の数に基づいて前記比率を算出する請求項1に記載のデジタル情報分析システム。
  3. 前記関連性情報取得部が、前記分類者を識別する分類者識別子に対応づけて前記関連性情報を取得し、
    前記表示部が、前記分類者識別子で識別される前記分類者ごとに前記複数の区画を表示する請求項1又は2に記載のデジタル情報分析システム。
  4. 一のデジタル情報に対して前記関連性情報が付与される時間を計測する付与時間計測部
    を更に備え、
    前記表示部が、前記分類者識別子で識別される前記分類者ごとに前記時間から算出される分類スピードを表示する請求項3に記載のデジタル情報分析システム。
  5. 前記複数の区画のいずれかを選択する区画選択部
    を更に備え、
    前記表示部が、前記区画選択部が選択した区画に対応する前記範囲に含まれる前記関連性スコアを有する前記デジタル情報を表示する請求項1〜4のいずれか1項に記載のデジタル情報分析システム。
  6. 関連性情報取得部、関連性スコア算出部、比率算出部、表示部を備えたデジタル情報分析システムの動作方法であって、
    前記関連性情報取得部が、複数のデジタル情報のそれぞれに分類者によって付与される前記デジタル情報と予め定められた特定事項との関連性を示す関連性情報を取得する関連性情報取得段階と、
    前記関連性スコア算出部が、前記複数のデジタル情報のそれぞれと前記予め定められた特定事項との関連に応じて決定される関連性スコアを前記複数のデジタル情報ごとに算出する関連性スコア算出段階と、
    前記比率算出部が、前記関連性スコアの予め定められた範囲ごとに、各範囲に含まれる前記関連性スコアを有する前記デジタル情報の総数に対する前記範囲に含まれる前記デジタル情報に付与された前記関連性情報の数の比率を算出する比率算出段階と、
    前記表示部が、前記各範囲のそれぞれに対応づけられた複数の区画を、前記比率に基づいて色相、明度、若しくは彩度を変化させて表示する表示段階と
    を実行するデジタル情報分析システムの動作方法。
  7. デジタル情報分析プログラムであって、
    コンピュータに、
    複数のデジタル情報のそれぞれに分類者によって付与される前記デジタル情報と予め定められた特定事項との関連性を示す関連性情報を取得する関連性情報取得機能と、
    前記複数のデジタル情報のそれぞれと前記予め定められた特定事項との関連に応じて決定される関連性スコアを前記複数のデジタル情報ごとに算出する関連性スコア算出機能と、
    前記関連性スコアの予め定められた範囲ごとに、各範囲に含まれる前記関連性スコアを有する前記デジタル情報の総数に対する、前記範囲に含まれる前記デジタル情報に付与された前記関連性情報の数の比率を算出する比率算出機能と、
    前記各範囲のそれぞれに対応づけられた複数の区画を、前記比率に基づいて色相、明度、若しくは彩度を変化させて表示する表示機能と
    を実現させるデジタル情報分析プログラム。
JP2013213717A 2013-10-11 2013-10-11 デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム Active JP5572255B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2013213717A JP5572255B1 (ja) 2013-10-11 2013-10-11 デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
EP14852397.0A EP3057060A4 (en) 2013-10-11 2014-03-17 DIGITAL INFORMATION ANALYSIS SYSTEM, DIGITAL INFORMATION ANALYSIS PROCEDURE AND DIGITAL INFORMATION ANALYSIS PROGRAM
PCT/JP2014/057067 WO2015052946A1 (ja) 2013-10-11 2014-03-17 デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
US14/397,823 US20160055157A1 (en) 2013-10-11 2014-03-17 Digital information analysis system, digital information analysis method, and digital information analysis program
TW103135331A TW201514724A (zh) 2013-10-11 2014-10-13 數位資訊分析系統、數位資訊分析方法及數位資訊分析程式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013213717A JP5572255B1 (ja) 2013-10-11 2013-10-11 デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム

Publications (2)

Publication Number Publication Date
JP5572255B1 true JP5572255B1 (ja) 2014-08-13
JP2015076043A JP2015076043A (ja) 2015-04-20

Family

ID=51427301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013213717A Active JP5572255B1 (ja) 2013-10-11 2013-10-11 デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム

Country Status (5)

Country Link
US (1) US20160055157A1 (ja)
EP (1) EP3057060A4 (ja)
JP (1) JP5572255B1 (ja)
TW (1) TW201514724A (ja)
WO (1) WO2015052946A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157467A1 (ja) * 2015-03-31 2016-10-06 株式会社Ubic データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569696B1 (en) * 2015-08-12 2017-02-14 Yahoo! Inc. Media content analysis system and method
US11256710B2 (en) 2016-10-20 2022-02-22 Microsoft Technology Licensing, Llc String transformation sub-program suggestion
US11620304B2 (en) * 2016-10-20 2023-04-04 Microsoft Technology Licensing, Llc Example management for string transformation
US10846298B2 (en) 2016-10-28 2020-11-24 Microsoft Technology Licensing, Llc Record profiling for dataset sampling
US11853697B2 (en) 2021-04-23 2023-12-26 International Business Machines Corporation Dynamically inheriting accumulated attribution

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217528A (ja) * 2008-03-11 2009-09-24 Hitachi Ltd 文書分類付与方法、システムまたはコンピュータプログラム
JP2011008355A (ja) * 2009-06-23 2011-01-13 Omron Corp Fmeaシートの作成支援システムおよび作成支援用のプログラム
JP2013182338A (ja) * 2012-02-29 2013-09-12 Ubic:Kk 文書分別システム及び文書分別方法並びに文書分別プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6886010B2 (en) * 2002-09-30 2005-04-26 The United States Of America As Represented By The Secretary Of The Navy Method for data and text mining and literature-based discovery
JP2004206476A (ja) * 2002-12-25 2004-07-22 Internatl Business Mach Corp <Ibm> データベースシステム、端末装置、検索データベースサーバ、検索キー入力支援方法及びプログラム
EP1583023B1 (en) * 2004-03-30 2008-11-12 EMC Corporation Model of documents and method for automatically classifying a document
JP5669785B2 (ja) 2012-04-18 2015-02-18 株式会社Ubic フォレンジックシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217528A (ja) * 2008-03-11 2009-09-24 Hitachi Ltd 文書分類付与方法、システムまたはコンピュータプログラム
JP2011008355A (ja) * 2009-06-23 2011-01-13 Omron Corp Fmeaシートの作成支援システムおよび作成支援用のプログラム
JP2013182338A (ja) * 2012-02-29 2013-09-12 Ubic:Kk 文書分別システム及び文書分別方法並びに文書分別プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157467A1 (ja) * 2015-03-31 2016-10-06 株式会社Ubic データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体
US9563652B2 (en) 2015-03-31 2017-02-07 Ubic, Inc. Data analysis system, data analysis method, data analysis program, and storage medium
JPWO2016157467A1 (ja) * 2015-03-31 2017-04-27 株式会社Ubic データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体
US10204153B2 (en) 2015-03-31 2019-02-12 Fronteo, Inc. Data analysis system, data analysis method, data analysis program, and storage medium

Also Published As

Publication number Publication date
JP2015076043A (ja) 2015-04-20
WO2015052946A1 (ja) 2015-04-16
EP3057060A1 (en) 2016-08-17
EP3057060A4 (en) 2016-11-23
US20160055157A1 (en) 2016-02-25
TW201514724A (zh) 2015-04-16

Similar Documents

Publication Publication Date Title
JP5572255B1 (ja) デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
JP6043277B2 (ja) 表示システム、表示方法、プログラム、及び、記録媒体
CN109446095A (zh) 一种页面展示速度的测试方法、装置及电子设备
JP6696568B2 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
CN110675017A (zh) 基于人工智能的绩效评价方法和装置
WO2018113469A1 (zh) 一种资源分配方法和装置
EP3408752B1 (en) Object management and visualization using a computing device
US10990985B2 (en) Remote supervision of client device activity
US8918419B2 (en) Object comparison via real time metadata calculation
CN104715000B (zh) 用于支持评价分析的装置和方法
JP2020046825A (ja) 画像表示制御装置、画像表示制御方法、プログラムおよび記録媒体
TW201342093A (zh) 圖像搜尋方法及系統
US11163918B2 (en) Assistance system, design assistance apparatus, and non-transitory computer readable medium storing design assistance program
JP2016181045A (ja) 書籍データ閲覧プログラム、書籍データ閲覧方法および情報処理装置
KR102238586B1 (ko) 가치 의식 판단을 위한 전자 장치 및 방법
CN106484710B (zh) 动态数据处理方法和装置、信息显示方法和装置
WO2019092778A1 (ja) 表示プログラム、表示方法及び表示装置
CN110379039A (zh) 信息输出装置及信息输出方法
CN117573847B (zh) 可视化答案的生成方法、装置、设备及存储介质
JP6879107B2 (ja) 匿名性評価装置、匿名性評価方法および匿名性評価プログラム
CN113688298A (zh) 数据的呈现方法和存储介质
CN114912745A (zh) 设备信息管理方法、装置、设备及介质
JP2023040536A (ja) 画像提示装置および画像提示方法
CN116051525A (zh) 一种基于5s的线上管理方法、装置及电子设备
JP2020177454A (ja) 目標未達情報提示システム及び目標未達情報提示プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140627

R150 Certificate of patent or registration of utility model

Ref document number: 5572255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250