JP5576544B1 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP5576544B1
JP5576544B1 JP2013216382A JP2013216382A JP5576544B1 JP 5576544 B1 JP5576544 B1 JP 5576544B1 JP 2013216382 A JP2013216382 A JP 2013216382A JP 2013216382 A JP2013216382 A JP 2013216382A JP 5576544 B1 JP5576544 B1 JP 5576544B1
Authority
JP
Japan
Prior art keywords
information
feature information
feature
weight
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013216382A
Other languages
English (en)
Other versions
JP2015079367A (ja
Inventor
裕也 海野
慶 秋田
祐一郎 今村
創史 渡部
昌昭 福田
Original Assignee
株式会社プリファードインフラストラクチャー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社プリファードインフラストラクチャー filed Critical 株式会社プリファードインフラストラクチャー
Priority to JP2013216382A priority Critical patent/JP5576544B1/ja
Application granted granted Critical
Publication of JP5576544B1 publication Critical patent/JP5576544B1/ja
Priority to US14/515,336 priority patent/US20150112902A1/en
Publication of JP2015079367A publication Critical patent/JP2015079367A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 非構造化データの解析により得られた結果に対して該非構造化データに含まれた特徴情報が与える影響をユーザに提示する情報処理装置を提供する。
【解決手段】 一実施形態に係る情報処理装置は、学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段と、前記複数のラベルのうちの少なくとも1つのラベル(20代)について前記モデル情報に含まれた前記特徴情報(312、314、322、324)を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段と、を具備する。
【選択図】 図8

Description

本発明は、非構造化データの解析に関連した情報処理を実行する情報処理装置に関する。
非構造化データの解析に関連した情報処理を実行する情報処理装置としては、特開2013−101415号公報(特許文献1)に記載されたものが知られている。この文献に記載された情報処理装置は、非構造化データとして商品ウェブページを用いるものであって、第1の商品ウェブページ及び第2の商品ウェブページに含まれたそれぞれの特徴情報に基づいて、これらの商品ウェブページ間の類似度を算出することによって、これらの商品ウェブページが類似した商品を扱うものであるか否かを判定することができる。
特開2013−101415号公報
しかしながら、上記特許文献に記載された従来技術に係る情報処理装置においては、非構造化データ(表品ウェブページ)に対する解析の結果のみをユーザに提示するのみであって、非構造化データに含まれた特徴情報がその結果にどのような影響を与えるかをユーザに提示することはできない。
そこで、本発明の様々な実施形態により、非構造化データの解析により得られた結果に対して該非構造化データに含まれた特徴情報が与える影響をユーザに提示する情報処理装置を提供する。
本発明の一態様に係る情報処理装置は、学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段と、前記複数のラベルのうちの少なくとも1つのラベルについて前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段と、を具備するものである。
本発明の一態様に係るコンピュータプログラムは、コンピュータを、学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段、及び、前記複数のラベルのうちの少なくとも1つのラベルについて前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段、として動作させるものである。
本発明の様々な実施形態により、非構造化データの解析により得られた結果に対して該非構造化データに含まれた特徴情報が与える影響をユーザに提示する情報処理装置を提供する。
図1は、本発明の一実施形態に係る情報処理装置を含む情報処理システムの構成を示すブロック図である。 図2は、図1に示した情報処理システムに含まれる端末装置30のアーキテクチャを示すブロック図である。 図3は、本発明の一実施形態に係るサーバ装置10の機能の具体例を示すブロック図である。 図4は、図1に示した情報処理システムにより学習処理に際して行われる動作の具体例を示すフロー図である。 図5は、本発明の一実施形態に係る情報処理装置を含む情報処理システムにより扱われる学習データの具体例を示す図である。 図6は、図5に示した学習データに対する形態素解析の具体例を概念的に示す模式図である。 図7は、図1に示した情報処理システムにより分析処理に際して行われる動作の具体例を示すフロー図である。 図8は、本発明の一実施形態に係る情報処理装置を含む情報処理システムにより行われる表示制御の結果として表示装置に表示される画面の具体例を示す模式図である。 図8は、本発明の一実施形態に係る情報処理装置を含む情報処理システムにより行われる表示制御の結果として表示装置に表示される画面の別の具体例を示す模式図である。
以下、添付図面を参照して本発明の様々な実施形態を説明する。なお、図面における共通する構成要素には同一の参照符号が付されている。
まず、最も好ましい実施形態として、端末装置が、通信回線を介してサーバ装置にアクセスし、非構造化データの解析をサーバ装置に実行させ、その解析の結果を端末装置に接続された表示装置に表示する実施形態について説明する。すなわち、端末装置は、サーバ装置から非構造化データの解析に関するサービス(以下「解析サービス」という。)の提供を受ける。
また、端末装置がサーバ装置から提供を受ける解析サービスが、一例として、インターネット上に設けられた掲示板に投稿された文章が、10代、20代、30代、40代及び50代のいずれの世代により作成されたものであるかを判定するためのサービスであるものとして説明する。
1.概要
図1は、本発明の一実施形態に係る情報処理装置を含む情報処理システムの構成を示すブロック図である。情報処理システムは、サーバ装置10と、通信機能を備える複数の端末装置30−1、30−2、・・・、30−N(これらの各々を「端末装置30」と総称することがある。)、を含む。サーバ装置10と各端末装置とはインターネット等の通信網(通信回線)20を介して接続される。
ユーザは、端末装置30を用いて、通信網20を介して、サーバ装置10から解析サービスの提供を受ける。
2.サーバ装置10の構成
サーバ装置10は、CPU11と、メインメモリ12と、ユーザインターフェイス(I/F)13と、通信インターフェイス(I/F)14と、外部メモリ15と、ディスクドライブ16と、を含み、これらの各構成要素がバス17を介して互いに電気的に接続されている。CPU11は、外部メモリ15からオペレーティングシステム、及び、解析サービスに関する機能を実現するためのプログラム等をメインメモリ12にロードし、ロードしたプログラムに含まれる命令を実行する。メインメモリ12は、CPU11が実行するプログラムを格納するために用いられ、例えばDRAMによって構成される。
ユーザI/F13は、例えば、オペレータの入力を受け付けるキーボードやマウス等の情報入力装置と、CPU11の演算結果を出力する液晶ディスプレイ等の情報出力装置と、を含む。通信I/F14は、ハードウェア、ファームウェア、TCP/IPドライバやPPPドライバ等の通信用ソフトウェア、又は、これらの組み合わせとして実装され、通信網20を介して端末装置30と通信可能に構成される。
外部メモリ15は、例えば磁気ディスクドライブで構成され、解析サービスに関する機能を実現するためのプログラム等の様々なプログラムが記憶される。また、外部メモリ15には、これらのプログラムにおいて用いられる各種データも記憶されうる。
ディスクドライブ16は、CD−ROM、DVD−ROM、DVD−R等の各種の記憶メディアに格納されたデータを読み込み、又は、これらの記憶メディアにデータを書き込む。
一実施形態において、サーバ装置10は、階層構造を有する複数のウェブページから成るウェブサイトを管理するウェブサーバであり、端末装置30に対して解析サービスを提供することができる。端末装置30に備えられたブラウザソフトウェアは、ウェブページを表示するためのHTMLデータをサーバ装置10から取得し、取得したHTMLデータを解析して、当該ウェブページを端末装置30のユーザに提示することができる。このウェブページを表示するためのHTMLデータも外部メモリ15に記憶されうる。HTMLデータは、HTML等のマークアップ言語で記述されたHTML文書から成り、このHTML文書には、タグを利用して様々な画像を関連付けることができる。また、HTML文書には、ActionScriptやJavaScript(登録商標)等のスクリプト言語等で記述されたプログラムを埋め込むことができる。
このように、サーバ装置10は、解析サービスを提供するウェブサイトを管理し、このウェブサイトを構成するウェブページを端末装置30からの要求に応じて配信することにより、ユーザに解析サービスを提供することができる。
3.端末装置30の構成
一方、端末装置30は、一実施形態において、サーバ装置10から取得したウェブサイトのウェブページをウェブブラウザ上で表示することができる任意の情報処理装置であって、例えば、携帯電話機、スマートフォン、ゲーム用コンソール、パーソナルコンピュータ、タッチパッド、及び、電子書籍リーダーを含むが、これらには限られない。
図2を参照して端末装置30のアーキテクチャを説明する。図2は、図1に示した情報処理システムに含まれる端末装置30のアーキテクチャを示すブロック図である。端末装置30は、図示のように、CPU31、メインメモリ32と、ユーザインターフェイス(I/F)33と、通信インターフェイス(I/F)34と、外部メモリ35と、を含み、これらの各構成要素がバス36を介して互いに電気的に接続されている。
CPU31は、外部メモリ35からオペレーティングシステム等の様々なプログラムをメインメモリ32にロードし、ロードしたプログラムに含まれる命令を実行する。メインメモリ32は、CPU31が実行するプログラムを格納するために用いられ、例えばDRAMによって構成される。
ユーザI/F33は、例えば、ユーザの入力を受け付けるタッチパネル、キーボード、ボタンやマウス等の情報入力装置と、CPU31の演算結果を出力する液晶ディスプレイ等の情報出力装置と、を含む。通信I/F34は、ハードウェア、ファームウェア、又は、TCP/IPドライバやPPPドライバ等の通信用ソフトウェア又はこれらの組み合わせとして実装され、通信網20を介してサーバ装置10と通信可能に構成される。
外部メモリ35は、例えば磁気ディスクドライブやフラッシュメモリ等により構成され、オペレーティングシステム等の様々なプログラムを記憶する。
このようなアーキテクチャを有する端末装置30は、例えば、HTML形式のファイル(HTMLデータ)を解釈して画面表示するためのブラウザソフトウェアを備えており、このブラウザソフトウェアの機能によりサーバ装置10から取得したHTMLデータを解釈して、受信したHTMLデータに対応するウェブページを表示することができる。また、端末装置30は、ブラウザソフトウェアに組み込まれるプラグインソフト(例えば、アドビシステムズ社から提供されているFLASH Player)(FLASHは商標)を備えており、HTMLデータに埋め込まれたSWF形式のファイルをサーバ装置10から取得し、当該SWF形式のファイルをブラウザソフトウェア及びプラグインソフトを用いて実行することができる。
端末装置30においてHTML形式のファイル(HTMLデータ)が解釈されると、例えば、このファイルにおいて指定されたアニメーションや操作用アイコンが端末装置30の画面に表示される。ユーザは、端末装置30の入力インターフェース(例えば、タッチスクリーンやボタン)を用いて解析サービスを進行させるための指示を入力することができる。ユーザから入力された指示は、端末装置30のブラウザやNgCore(商標)等のプラットフォームの機能を通じてサーバ装置10に伝達される。
4.サーバ装置10の機能
次に、図1に示した各構成要素により実現されるサーバ装置10の機能について、図3を参照して説明する。図3は、本発明の一実施形態に係るサーバ装置10の機能の具体例を示すブロック図である。
図3に示すように、サーバ装置10は、記憶部51と、特徴抽出部52と、機械学習部53と、判定部54と、表示制御部55と、を含む。
4−1.記憶部51
記憶部51は、解析サービスに用いられる様々な情報を記憶する。記憶部51は、例えば、後述するように、学習データ、被分析データ、これらのデータから抽出された特徴情報、モデル情報等を含む様々な情報を記憶する。この記憶部51に記憶される情報は、適宜、更新することが可能なものである。
4−2.特徴抽出部52
特徴抽出部52は、非構造化データに対して特徴抽出(ここでは一例として形態素解析)を実行することにより、この非構造化データから特徴情報(特徴語、特徴ベクトル)を抽出する。このように抽出された特徴情報は、記憶部51に記憶されうる。
4−3.機械学習部53
機械学習部53は、記憶部51に記憶された非構造化データ及び特徴情報を用いて機械学習を実行することにより、モデル情報を生成する。このモデル情報は、特徴情報とこのモデル情報に対応付けられた重み情報(ウェイト情報)とを複数のラベルの各々について含むものである。このように生成されたモデル情報は、記憶部51に記憶されうる。
4−4.判定部54
判定部54は、記憶部51に記憶された分析対象データ(被分析データ)及びモデル情報を用いて、分析対象データが10代〜50代のいずれの世代により作成されたものであるかを判定する。
4−5.表示制御部55
表示制御部55は、複数のラベルについてモデル情報に含まれた特徴情報を、この特徴情報に対応付けられた重み情報に基づいて、サーバ装置10のユーザI/F13に含まれた表示装置、及び、端末装置30のユーザI/F33に含まれた表示装置のうちの少なくとも一方に表示する。
具体的には、表示制御部55は、少なくとも第1表示モード及び第2表示モードに従って特徴情報を表示することができる。すなわち、表示制御部55は、第1表示モードでは、被分析データに含まれた特徴情報のうちモデル情報に含まれた特徴情報と同一の特徴情報を、この特徴情報に対応付けられた重み情報に基づいて表示装置に表示する。また、表示制御部55は、第2表示モードでは、モデル情報に含まれた特徴情報を、この特徴情報に対応付けられた重み情報の大きさに基づいて決定された順序に従って表示装置に表示する。
5.解析サービスの提供時に行われる動作
図1に示した情報処理システムにより行われる動作は、少なくとも、学習処理及び分析処理を含む。学習処理とは、学習データ(モデル情報を生成するために用いられる非構造化データであって、ここでは、例えば10代〜50代のそれぞれの世代により作成された多数の文章)を用いて機械学習を実行することにより、モデル情報を生成する処理である。分析処理とは、被分析データ(分析の対象となる非構造化データであって、ここでは、例えば10代〜50代のいずれの世代により作成されたのか不明である文章)及び学習処理により生成されたモデル情報を用いて、被分析データがいずれの世代により作成されたものであるのかを判定する処理である。
5−1.学習処理
図4は、図1に示した情報処理システムにより学習処理に際して行われる動作の具体例を示すフロー図である。
ステップ(以下「ST」という。)100では、サーバ装置10において、記憶部51に記憶された学習データが読み出される。図5は、本発明の一実施形態に係る情報処理装置を含む情報処理システムにより扱われる学習データの具体例を概念的に示す模式図である。
読み出される学習データは、10代〜50代のそれぞれの世代により作成された多数の文章(非構造化データ)を含む。各学習データがいずれの世代により作成されたものであるのかは、サーバ装置10にとって既知なものであり、いずれの世代により作成されたものであるかを示す情報が、その学習データに対応付けて記憶部51に記憶されている。図5には、それらの学習データの一例として、20代の人間により作成された文章を含む学習データ110が示されている。
ST102では、読込まれた学習データのそれぞれに対して特徴抽出部52により形態素解析が実行されることにより、特徴情報(特徴語)が抽出される。図6は、図5に示した学習データに対する形態素解析の具体例を概念的に示す模式図である。図6には、学習データ110から多数の特徴情報112が抽出される様子が示されている(なお、図6では、簡略化のために、3つの特徴情報のみにしか参照符号112が付与されていない)。ここでは、特徴情報として、多数の単語が抽出されている。これらの単語は、名詞、形容詞、動詞、助詞等を含む。図6に示された方式の形態素解析だけでなく、様々な形態素解析が利用可能である。
抽出された各特徴情報は、この特徴情報に対応する年代を示す情報と対応付けて、記憶部51に記憶される。
ST104では、各学習データから抽出された特徴情報(及び年代を示す情報)を用いた機械学習が機械学習部53により実行される。この機械学習によりモデル情報が生成される。
モデル情報は、特徴情報とこのモデル情報に対応付けられた重み情報(ウェイト情報)とを複数のラベルの各々について含むものである。具体的には、モデル情報は、例えば、「10代」というラベルについては、次の表1に示すように、10代に対応する多数の学習データから抽出された複数の特徴情報(特徴情報A1〜AX。但し、Xは自然数)と、各特徴情報に対応付けられた重み情報と、を含む。ここで、重み情報は、その数値が大きい程、その重み情報に対応する特徴情報が10代の世代により利用される確率、頻度乃至可能性がより高いことを意味する一方、その数値が小さい程、その重み情報に対応する特徴情報が10代の世代により利用される確率、頻度乃至可能性がより低いことを意味する。
Figure 0005576544
また、モデル情報は、「20代」というラベルについても、次の表2に示すように、20代に対応する多数の学習データから抽出された複数の特徴情報(特徴情報A1〜AX。但し、Xは自然数)と、各特徴情報に対応付けられた重み情報と、を含む。
Figure 0005576544
さらに、モデル情報は、「30代」、「40代」及び「50代」というラベルについても同様に、それぞれ、次の表3、表4及び表5に示すように、複数の特徴情報と、各特徴情報に対応付けられた重み情報とを含む。このように生成されたモデル情報は、記憶部51に記憶される。
Figure 0005576544
Figure 0005576544
Figure 0005576544
次に、ST106では、複数のラベルのうちの少なくとも1つのラベルについて、モデル情報に含まれた複数の特徴情報を、この特徴情報に対応付けられた重み情報に基づいて、表示装置に表示するような制御が、表示制御部55により行われる。具体的には、例えば、「10代」というラベルについて、モデル情報に含まれた複数の特徴情報(表1参照)が、次の表6及び表7に示すようなランキング表として、表示装置に表示される(第2表示モード)。
表6に示すように、最も大きい重み情報を有する20個の特徴情報が、その重み情報の大きさに基づいて決定された順序に従って(すなわち降順に)表示されている。ここで、高い順位にランキングされている特徴情報は、その特徴情報が被分析データの中に含まれている場合に、その被分析データが10代の人間により作成されたものであると推定されることに寄与する特徴情報であることを意味する。
また、表7に示すように、最も小さい重み情報を有する20個の特徴情報が、その重み情報の大きさに基づいて決定された順序に従って(すなわち昇順に)表示されている。ここで、高い順位にランキングされている特徴情報は、その特徴情報が被分析データの中に含まれている場合に、その被分析データが10代の人間により作成されたものであると推定されないことに寄与する特徴情報であることを意味する。
Figure 0005576544
Figure 0005576544
なお、「20代」〜「50代」のそれぞれのラベルについても、モデル情報に含まれた複数の特徴情報(それぞれ表2〜表5参照)が、次の表6及び表7に示したものと同様のランキング表として、表示装置に表示されうる。
別の実施形態では、表6及び表7に例示されたランキング表示に代えて、又は、ランキング表示とともに、複数の特徴情報が各特徴情報に対応付けられた重み情報を用いた円グラフや棒グラフ等のグラフにより表示される。
また、複数の特徴情報は、各特徴情報に対応付けられた重み情報の大きさに基づいて決定された態様により表示されるものとすることができる。これらの態様としては、サイズ、色、濃淡、模様、形状、輝度、書体及びデザインのうちの少なくとも1つの態様を含む。これらの態様の具体例については後に説明する。
5−2.分析処理
図7は、図1に示した情報処理システムにより分析処理に際して行われる動作の具体例を示すフロー図である。
ST200では、どの世代の人間により作成されたのかが不明である文章、例えばインターネット上の掲示板に投稿された文章(非構造化データ)が、被分析データとして記憶部51から読込まれる。ST202では、この被分析データに対して特徴抽出部52により形態素解析が行われることにより特徴情報が抽出される。ここで行われる形態素解析は、上述した図4におけるST102において行われるものと同様である。
次に、ST204では、被分析データが10代〜50代のいずれの世代により作成されたものであるのかが、判定部54により判定される。具体的には、まず、被分析データから抽出された複数の特徴情報のうち、モデル情報において「10代」というラベルについて含まれた複数の特徴情報と同一の特徴情報が検索される。次に、このように検索された特徴情報のすべてについて、それらに対応する重み情報の合計値が算出される。この合計値は、「10代」の合計値X1とされる。同様の検索及び算出が、「20代」〜「50代」のそれぞれについて行われる。これにより、「20代」の合計値X2〜「50代」の合計値X5が得られる。さらに、合計値X1〜合計値X5のうちその数値が最大である合計値に対応する年代が、判定の結果とされる。例えば、合計値X2が最大である場合には、その被分析データは20代の人間により作成されたものであるとの判定がなされる。
次に、ST206では、被分析データに含まれた特徴情報のうちモデル情報に含まれた特徴情報と同一の特徴情報を、この特徴情報に対応付けられた重み情報に基づいて表示装置に表示するような制御が、表示制御部55により行われる。
まず、上述したST202において被分析データから抽出された多数の特徴情報が、記憶部51から読み出される。まず、これら多数の特徴情報の中から、モデル情報において「10代」というラベルについて含まれた特徴情報と同一の特徴情報が検索される。このように検索された特徴情報の各々について対応付けられた重み情報もまた検索される。これにより、被分析データから抽出された多数の特徴情報の各々について、「10代」についての重み情報が得られる。
上記と同様の検索が行われることにより、被分析データから抽出された多数の特徴情報の各々について、「20代」〜「50代」についての重み情報も得られる。
次に、被分析データから抽出された多数の特徴情報が、「20代」〜「50代」のぞれぞれについての重み情報の大きさに基づいて、表示される(第1表示モード)。
図8は、本発明の一実施形態に係る情報処理装置を含む情報処理システムにより行われる表示制御の結果として表示装置に表示される画面の具体例を示す模式図である(図8には、被分析データとして、単に説明の簡略化のために、図5に示した学習データ110と同一である被分析データ300が示されているが、実際には、学習データと被分析データとが同一であるケースは稀である)。
図8には、一例として、被分析データから抽出された多数の特徴情報が「20代」についての重み情報の大きさに基づいて表示される例が示されている。なお、上述したように、被分析データを作成したのは「10代」〜「50代」のうち「20代」であると、判定部54により判定されている。
図8に示す画面おいては、一例として、多数の特徴情報のうち、「20代」という判定結果に対して「肯定的に」寄与した特徴情報、すなわち、より大きな重み情報を有する特徴情報は、実線で描かれた矩形により囲まれている一方、「20代」という判定結果に対して「否定的に」寄与した特徴情報、すなわち、より小さな重み情報を有する特徴情報は、一点鎖線で描かれた矩形により囲まれている。
さらに、「肯定的に」寄与した特徴情報(0以上の重み情報を有する特徴情報)、例えば、特徴情報312、314のうち、より大きな重み情報を有する特徴情報314は、より小さな重み情報を有する特徴情報312に比べて、特徴情報それ自体がより大きく表示され、さらには、その特徴情報を囲む矩形もまたより大きく表示されている。
逆に、「否定的に」寄与した特徴情報(0未満の重み情報を有する特徴情報)、例えば、特徴情報322、324のうち、より小さな重み情報を有する特徴情報324は、より大きな重み情報を有する特徴情報322よりもまたより大きく表示されている。
これにより、ユーザは、各特徴情報が(i)判定結果に対して肯定的に又は否定的に寄与したものであるのか、(ii)各特徴情報によるその寄与がどの程度のものであるのか、を簡単に認識することができる。
図8には、特徴情報がその特徴情報に対応付けられた重み情報の大きさに基づいて表示されることに関する具体例として、特徴情報それ自体のサイズ、及び、その特徴情報を囲む矩形のサイズの両方が、対応する重み情報の大きさに基づいて表示される例が示されているが、特徴情報それ自体のサイズ及び矩形のサイズのいずれか一方が、重み情報の大きさに基づいて表示されるようにしてもよい。
図8は、特徴情報がこの特徴情報に対応付けられた重み情報の大きさに基づいて決定された態様により表示されることに関して、態様が「サイズ」であることを例示するものである。
特徴情報を重み情報の大きさに基づいて表示する態様としては、サイズ、色、濃淡、模様、形状、輝度、書体、音、言語及びデザインのうちの少なくとも1つを含むものとすることができる。
態様として「色」を用いる場合には、例えば、より大きな重み情報を有する特徴情報を彩度のより少ない色により表示し、より小さな重み情報を有する特徴情報を彩度のより多い色により(又はその逆の手法により)表示することができる。
態様として「濃淡」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより濃い色により表示し、より小さな重み情報を有する特徴情報をより淡い色により(又はその逆の手法により)表示することができる。
態様として「模様」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑な模様により表示し、より小さな重み情報を有する特徴情報をより簡潔な模様により(又はその逆の手法により)表示することができる。
態様として「形状」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑な形状により表示し、より小さな重み情報を有する特徴情報をより簡潔な形状により(又はその逆の手法により)表示することができる。
態様として「輝度」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより高い輝度により表示し、より小さな重み情報を有する特徴情報をより低い輝度により(又はその逆の手法により)表示することができる。
態様として「書体」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑な書体により表示し、より小さな重み情報を有する特徴情報をより簡潔な書体により(又はその逆の手法により)表示することができる。
態様として「デザイン」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑なデザインにより表示し、より小さな重み情報を有する特徴情報をより簡潔なデザインにより(又はその逆の手法により)表示することができる。
なお、これらの上述した態様は組み合わせて用いることが可能なものである。
また、図8には、被分析データから抽出された多数の特徴情報が「20代」についての重み情報の大きさに基づいて表示される例が示されているが、これらの特徴情報は「10代」及び「30代」〜「50代」についての重み情報の大きさに基づいて表示されるようにしてもよい。
さらに、別の実施形態では、図9に示すように、ユーザが表示された特徴情報を(ポインタ等により)選択したときに、そのように選択された特徴情報が学習データにおいてどのように用いられていたものであるのかを示すインデックスが表示されるようにしてもよい。図9には、例えば、ユーザが特徴情報330を選択したときに、その特徴情報330に対応するインデックス400が表示される様子が示されている。このインデックス400は、例えば、モデル情報の生成に用いられた学習データにおいて、どの年代が作成した文章において、どのような文章にその特徴情報が含まれていたのかを示すものとなっている。
以上、解析サービスの一例として、インターネット上に設けられた掲示板に投稿された文章が、10代、20代、30代、40代及び50代のいずれの世代により作成されたものであるかを判定するサービスについて説明したが、解析サービスとしては、様々なものが利用可能である。
例えば、利用客からの音声又は文章による問い合わせが、苦情なのか、質問なのか、お褒めなのか、を解析するサービスが利用可能である。この場合、学習データとしては、利用客から寄せられた問い合わせ(音声又は文章)が用いられ、モデル情報における特徴情報としては、問い合わせに係る音声データ又は文章データから抽出された単語が用いられ、モデル情報におけるラベルとしては、「苦情」、「質問」及び「お褒め」等が用いられる。その他については、上述したものと同様の情報及び処理を用いることができる。
また別の例としては、新聞記事又は放送されたニュースが、国際、政治、芸能、スポーツ、科学等のいずれの分野に関連するものであるかを判定するサービスが利用可能である。この場合、学習データとしては、発行された新聞記事又は放送されたニュースが用いられ、モデル情報における特徴情報としては、新聞記事に係る文章データ又はニュースに係る音声データから抽出された単語が用いられ、モデル情報におけるラベルとしては、「国際」、「政治」、「芸能」、「スポーツ」及び「科学」等が用いられる。その他については、上述したものと同様の情報及び処理を用いることができる。
さらに別の例としては、新たに開発された薬品が心臓の機能を阻害するものかしないものかを推定するサービスが利用可能である。この場合、モデル情報における特徴情報としては、その薬に含まれる化合物の構造及び科学的性質(親水性、酸性度及び塩基制度等)が用いられ、モデル情報におけるラベルとしては、「心臓の機能を阻害する」及び「心臓の機能を阻害しない」が用いられる。
また、上記実施形態では、端末装置がサーバ装置にアクセスすることによって解析サービスの提供を受ける(この実施形態では、サーバ装置が特許請求の範囲に記載された「情報処理装置」に相当し、サーバ装置及び/又は端末装置に有線により接続された表示装置、及び/又は、端末装置自体に備えられた表示装置が、特許請求の範囲に記載された「表示装置」に相当する)。
別の実施形態では、端末装置は、サーバ装置にアクセスすることなく、単にインストールされたプログラムに従って動作することによって、解析サービスをユーザに提供することができる。この場合、端末装置は、図3を参照して説明した各機能と同一又は等価な機能を有するものとすることができる(この実施形態では、端末装置が特許請求の範囲に記載された「情報処理装置」に相当し、端末装置に有線により接続された表示装置、及び/又は、端末装置自体に備えられた表示装置が、特許請求の範囲に記載された「表示装置」に相当する)。
本明細書で説明される処理及び手順は、実施形態において明示的に説明されたものによってのみならず、ソフトウェア、ハードウェア又はこれらの組み合わせによっても実現可能なものである。具体的には、本明細書で説明された処理及び手順は、集積回路、揮発性メモリ、不揮発性メモリ、磁気ディスク、光ストレージ等の媒体に、当該処理に相当するロジックを実装することによって実現される。また、本明細書で説明される処理及び手順は、それらの処理・手順をコンピュータプログラムとして実装し、各種のコンピュータに実行させることが可能である。
本明細書中で説明される処理及び手順が単一の装置、ソフトウェア、コンポーネント、モジュールによって実行される旨が説明されたとしても、そのような処理又は手順は、複数の装置、複数のソフトウェア、複数のコンポーネント、及び/又は、複数のモジュールによって実行されるものとすることができる。また、本明細書中で説明されるデータ、テーブル又はデータベースが単一のメモリに格納される旨説明されたとしても、そのようなデータ、テーブル又はデータベースは、単一の装置に備えられた複数のメモリ又は複数の装置に分散して配置された複数のメモリに分散して格納されるものとすることができる。さらに、本明細書において説明されるソフトウェアおよびハードウェアの要素は、それらをより少ない構成要素に統合して、又は、より多い構成要素に分解することによって実現されるものとすることができる。
10 サーバ装置
30 端末装置
51 記憶部
52 特徴抽出部
53 機械学習部
54 判定部
55 表示制御部

Claims (8)

  1. 学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段と、
    前記複数のラベルのうちの少なくとも1つのラベルについて前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段であって、被分析データに含まれた特徴情報のうち前記モデル情報に含まれた前記特徴情報と同一の特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて表示する表示制御手段と、
    を具備することを特徴とする情報処理装置。
  2. 前記表示制御手段は、前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて表示する、請求項1に記載の情報処理装置。
  3. 前記表示制御手段は、前記特徴情報を、該特徴情報に対応付けられた重み情報の大きさに基づいて決定された態様により表示する、請求項又は請求項に記載の情報処理装置。
  4. 前記態様は、サイズ、色、濃淡、模様、形状、輝度、書体及びデザインのうちの少なくとも1つの態様を含む、請求項に記載の情報処理装置。
  5. 前記表示制御手段は、前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて決定された順序に従って表示する、請求項に記載の情報処理装置。
  6. 請求項1から請求項のいずれかに記載された情報処理装置を備えることを特徴とする端末装置。
  7. 請求項1から請求項のいずれかに記載された情報処理装置を備えることを特徴とするサーバ装置。
  8. コンピュータを、
    学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段、及び、
    前記複数のラベルのうちの少なくとも1つのラベルについて前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段であって、被分析データに含まれた特徴情報のうち前記モデル情報に含まれた前記特徴情報と同一の特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて表示する表示制御手段
    として動作させることを特徴とするコンピュータプログラム。
JP2013216382A 2013-10-17 2013-10-17 情報処理装置 Active JP5576544B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013216382A JP5576544B1 (ja) 2013-10-17 2013-10-17 情報処理装置
US14/515,336 US20150112902A1 (en) 2013-10-17 2014-10-15 Information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013216382A JP5576544B1 (ja) 2013-10-17 2013-10-17 情報処理装置

Publications (2)

Publication Number Publication Date
JP5576544B1 true JP5576544B1 (ja) 2014-08-20
JP2015079367A JP2015079367A (ja) 2015-04-23

Family

ID=51579043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013216382A Active JP5576544B1 (ja) 2013-10-17 2013-10-17 情報処理装置

Country Status (2)

Country Link
US (1) US20150112902A1 (ja)
JP (1) JP5576544B1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10621497B2 (en) * 2016-08-19 2020-04-14 International Business Machines Corporation Iterative and targeted feature selection
US11005678B2 (en) 2018-05-18 2021-05-11 Alarm.Com Incorporated Machine learning for home understanding and notification
US11755924B2 (en) 2018-05-18 2023-09-12 Objectvideo Labs, Llc Machine learning for home understanding and notification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010118050A (ja) * 2008-10-17 2010-05-27 Toyohashi Univ Of Technology 特許文献自動検索システムおよび特許文献自動検索方法
JP2013131075A (ja) * 2011-12-21 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6337699B1 (en) * 1996-06-27 2002-01-08 Sun Microsystems, Inc. Visualizing degrees of information object attributes
US6035057A (en) * 1997-03-10 2000-03-07 Hoffman; Efrem H. Hierarchical data matrix pattern recognition and identification system
US7024033B2 (en) * 2001-12-08 2006-04-04 Microsoft Corp. Method for boosting the performance of machine-learning classifiers
US7383241B2 (en) * 2003-07-25 2008-06-03 Enkata Technologies, Inc. System and method for estimating performance of a classifier
US7580909B2 (en) * 2003-08-26 2009-08-25 Northrop Grumman Corporation Visual representation tool for structured arguments
US7287012B2 (en) * 2004-01-09 2007-10-23 Microsoft Corporation Machine-learned approach to determining document relevance for search over large electronic collections of documents
US7426497B2 (en) * 2004-08-31 2008-09-16 Microsoft Corporation Method and apparatus for analysis and decomposition of classifier data anomalies
US20060085181A1 (en) * 2004-10-20 2006-04-20 Kabushiki Kaisha Toshiba Keyword extraction apparatus and keyword extraction program
US7509381B1 (en) * 2008-04-21 2009-03-24 International Business Machines Corporation Adaptive email in-basket ordering
US20120054642A1 (en) * 2010-08-27 2012-03-01 Peter Wernes Balsiger Sorted Inbox User Interface for Messaging Application

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010118050A (ja) * 2008-10-17 2010-05-27 Toyohashi Univ Of Technology 特許文献自動検索システムおよび特許文献自動検索方法
JP2013131075A (ja) * 2011-12-21 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200801133041; 田中 秀和: 'ブログ記事における話題の流行に注目したリコメンドシステム' 情報処理学会研究報告 Vol.2008 No.126, 20081210, p.181-184, 社団法人情報処理学会 *
JPN6014015005; 田中 秀和: 'ブログ記事における話題の流行に注目したリコメンドシステム' 情報処理学会研究報告 Vol.2008 No.126, 20081210, p.181-184, 社団法人情報処理学会 *

Also Published As

Publication number Publication date
US20150112902A1 (en) 2015-04-23
JP2015079367A (ja) 2015-04-23

Similar Documents

Publication Publication Date Title
CN102612691B (zh) 给文本评分的方法和系统
US11222087B2 (en) Dynamically debiasing an online job application system
KR101994499B1 (ko) 하이퍼링크 목적지의 가시화 기법
CN107908959A (zh) 网站信息检测方法、装置、电子设备及存储介质
US20110307792A1 (en) Accessing elements in an operating system
CN104137071A (zh) 用于脚本编译的简档数据的持久性存储
CN102243582A (zh) 用于为自定义用户接口生成用户帮助信息的方法和装置
JP5576544B1 (ja) 情報処理装置
KR101725008B1 (ko) 가상현실 광고 관리서버 및 이를 이용한 광고 시스템
CN107003923A (zh) 浏览器提供的网站统计数据
CN103577547B (zh) 网页类型识别方法及装置
KR101194638B1 (ko) 이북 콘텐츠를 레벨에 따라 디스플레이하는 장치 및 방법
JP5559750B2 (ja) 広告処理装置、情報処理システム及び広告処理方法
KR101976306B1 (ko) 웹 페이지 작성 지원 장치, 및 기억 매체
CN111177236B (zh) 基于医养照护场景的量表生成方法、系统、设备及介质
CN114637866A (zh) 数字化新媒体的信息管理方法及装置
CN114117303A (zh) 多选列表的展示装置及方法
US10576381B2 (en) Method for performing game by using activity count
CN106537372A (zh) 用于增强的文档生产率的实体识别
KR100952510B1 (ko) 컬러 폰트를 이용한 웹 문서 표시 방법 및 장치
US20230289674A1 (en) Computer-readable recording medium storing control program, control method, and information processing apparatus
JP7131518B2 (ja) 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム
JP4721344B2 (ja) 単語検索装置、単語検索方法及びプログラム
JP7450103B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP5794073B2 (ja) 情報表示装置及び情報表示プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140703

R150 Certificate of patent or registration of utility model

Ref document number: 5576544

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250