JP5576544B1 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP5576544B1 JP5576544B1 JP2013216382A JP2013216382A JP5576544B1 JP 5576544 B1 JP5576544 B1 JP 5576544B1 JP 2013216382 A JP2013216382 A JP 2013216382A JP 2013216382 A JP2013216382 A JP 2013216382A JP 5576544 B1 JP5576544 B1 JP 5576544B1
- Authority
- JP
- Japan
- Prior art keywords
- information
- feature information
- feature
- weight
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 一実施形態に係る情報処理装置は、学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段と、前記複数のラベルのうちの少なくとも1つのラベル(20代)について前記モデル情報に含まれた前記特徴情報(312、314、322、324)を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段と、を具備する。
【選択図】 図8
Description
また、端末装置がサーバ装置から提供を受ける解析サービスが、一例として、インターネット上に設けられた掲示板に投稿された文章が、10代、20代、30代、40代及び50代のいずれの世代により作成されたものであるかを判定するためのサービスであるものとして説明する。
図1は、本発明の一実施形態に係る情報処理装置を含む情報処理システムの構成を示すブロック図である。情報処理システムは、サーバ装置10と、通信機能を備える複数の端末装置30−1、30−2、・・・、30−N(これらの各々を「端末装置30」と総称することがある。)、を含む。サーバ装置10と各端末装置とはインターネット等の通信網(通信回線)20を介して接続される。
ユーザは、端末装置30を用いて、通信網20を介して、サーバ装置10から解析サービスの提供を受ける。
サーバ装置10は、CPU11と、メインメモリ12と、ユーザインターフェイス(I/F)13と、通信インターフェイス(I/F)14と、外部メモリ15と、ディスクドライブ16と、を含み、これらの各構成要素がバス17を介して互いに電気的に接続されている。CPU11は、外部メモリ15からオペレーティングシステム、及び、解析サービスに関する機能を実現するためのプログラム等をメインメモリ12にロードし、ロードしたプログラムに含まれる命令を実行する。メインメモリ12は、CPU11が実行するプログラムを格納するために用いられ、例えばDRAMによって構成される。
このように、サーバ装置10は、解析サービスを提供するウェブサイトを管理し、このウェブサイトを構成するウェブページを端末装置30からの要求に応じて配信することにより、ユーザに解析サービスを提供することができる。
一方、端末装置30は、一実施形態において、サーバ装置10から取得したウェブサイトのウェブページをウェブブラウザ上で表示することができる任意の情報処理装置であって、例えば、携帯電話機、スマートフォン、ゲーム用コンソール、パーソナルコンピュータ、タッチパッド、及び、電子書籍リーダーを含むが、これらには限られない。
外部メモリ35は、例えば磁気ディスクドライブやフラッシュメモリ等により構成され、オペレーティングシステム等の様々なプログラムを記憶する。
次に、図1に示した各構成要素により実現されるサーバ装置10の機能について、図3を参照して説明する。図3は、本発明の一実施形態に係るサーバ装置10の機能の具体例を示すブロック図である。
図3に示すように、サーバ装置10は、記憶部51と、特徴抽出部52と、機械学習部53と、判定部54と、表示制御部55と、を含む。
記憶部51は、解析サービスに用いられる様々な情報を記憶する。記憶部51は、例えば、後述するように、学習データ、被分析データ、これらのデータから抽出された特徴情報、モデル情報等を含む様々な情報を記憶する。この記憶部51に記憶される情報は、適宜、更新することが可能なものである。
特徴抽出部52は、非構造化データに対して特徴抽出(ここでは一例として形態素解析)を実行することにより、この非構造化データから特徴情報(特徴語、特徴ベクトル)を抽出する。このように抽出された特徴情報は、記憶部51に記憶されうる。
機械学習部53は、記憶部51に記憶された非構造化データ及び特徴情報を用いて機械学習を実行することにより、モデル情報を生成する。このモデル情報は、特徴情報とこのモデル情報に対応付けられた重み情報(ウェイト情報)とを複数のラベルの各々について含むものである。このように生成されたモデル情報は、記憶部51に記憶されうる。
判定部54は、記憶部51に記憶された分析対象データ(被分析データ)及びモデル情報を用いて、分析対象データが10代〜50代のいずれの世代により作成されたものであるかを判定する。
表示制御部55は、複数のラベルについてモデル情報に含まれた特徴情報を、この特徴情報に対応付けられた重み情報に基づいて、サーバ装置10のユーザI/F13に含まれた表示装置、及び、端末装置30のユーザI/F33に含まれた表示装置のうちの少なくとも一方に表示する。
図1に示した情報処理システムにより行われる動作は、少なくとも、学習処理及び分析処理を含む。学習処理とは、学習データ(モデル情報を生成するために用いられる非構造化データであって、ここでは、例えば10代〜50代のそれぞれの世代により作成された多数の文章)を用いて機械学習を実行することにより、モデル情報を生成する処理である。分析処理とは、被分析データ(分析の対象となる非構造化データであって、ここでは、例えば10代〜50代のいずれの世代により作成されたのか不明である文章)及び学習処理により生成されたモデル情報を用いて、被分析データがいずれの世代により作成されたものであるのかを判定する処理である。
図4は、図1に示した情報処理システムにより学習処理に際して行われる動作の具体例を示すフロー図である。
読み出される学習データは、10代〜50代のそれぞれの世代により作成された多数の文章(非構造化データ)を含む。各学習データがいずれの世代により作成されたものであるのかは、サーバ装置10にとって既知なものであり、いずれの世代により作成されたものであるかを示す情報が、その学習データに対応付けて記憶部51に記憶されている。図5には、それらの学習データの一例として、20代の人間により作成された文章を含む学習データ110が示されている。
抽出された各特徴情報は、この特徴情報に対応する年代を示す情報と対応付けて、記憶部51に記憶される。
また、表7に示すように、最も小さい重み情報を有する20個の特徴情報が、その重み情報の大きさに基づいて決定された順序に従って(すなわち昇順に)表示されている。ここで、高い順位にランキングされている特徴情報は、その特徴情報が被分析データの中に含まれている場合に、その被分析データが10代の人間により作成されたものであると推定されないことに寄与する特徴情報であることを意味する。
別の実施形態では、表6及び表7に例示されたランキング表示に代えて、又は、ランキング表示とともに、複数の特徴情報が各特徴情報に対応付けられた重み情報を用いた円グラフや棒グラフ等のグラフにより表示される。
また、複数の特徴情報は、各特徴情報に対応付けられた重み情報の大きさに基づいて決定された態様により表示されるものとすることができる。これらの態様としては、サイズ、色、濃淡、模様、形状、輝度、書体及びデザインのうちの少なくとも1つの態様を含む。これらの態様の具体例については後に説明する。
図7は、図1に示した情報処理システムにより分析処理に際して行われる動作の具体例を示すフロー図である。
ST200では、どの世代の人間により作成されたのかが不明である文章、例えばインターネット上の掲示板に投稿された文章(非構造化データ)が、被分析データとして記憶部51から読込まれる。ST202では、この被分析データに対して特徴抽出部52により形態素解析が行われることにより特徴情報が抽出される。ここで行われる形態素解析は、上述した図4におけるST102において行われるものと同様である。
さらに、「肯定的に」寄与した特徴情報(0以上の重み情報を有する特徴情報)、例えば、特徴情報312、314のうち、より大きな重み情報を有する特徴情報314は、より小さな重み情報を有する特徴情報312に比べて、特徴情報それ自体がより大きく表示され、さらには、その特徴情報を囲む矩形もまたより大きく表示されている。
逆に、「否定的に」寄与した特徴情報(0未満の重み情報を有する特徴情報)、例えば、特徴情報322、324のうち、より小さな重み情報を有する特徴情報324は、より大きな重み情報を有する特徴情報322よりもまたより大きく表示されている。
これにより、ユーザは、各特徴情報が(i)判定結果に対して肯定的に又は否定的に寄与したものであるのか、(ii)各特徴情報によるその寄与がどの程度のものであるのか、を簡単に認識することができる。
態様として「色」を用いる場合には、例えば、より大きな重み情報を有する特徴情報を彩度のより少ない色により表示し、より小さな重み情報を有する特徴情報を彩度のより多い色により(又はその逆の手法により)表示することができる。
態様として「濃淡」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより濃い色により表示し、より小さな重み情報を有する特徴情報をより淡い色により(又はその逆の手法により)表示することができる。
態様として「模様」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑な模様により表示し、より小さな重み情報を有する特徴情報をより簡潔な模様により(又はその逆の手法により)表示することができる。
態様として「形状」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑な形状により表示し、より小さな重み情報を有する特徴情報をより簡潔な形状により(又はその逆の手法により)表示することができる。
態様として「輝度」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより高い輝度により表示し、より小さな重み情報を有する特徴情報をより低い輝度により(又はその逆の手法により)表示することができる。
態様として「書体」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑な書体により表示し、より小さな重み情報を有する特徴情報をより簡潔な書体により(又はその逆の手法により)表示することができる。
態様として「デザイン」を用いる場合には、例えば、より大きな重み情報を有する特徴情報をより複雑なデザインにより表示し、より小さな重み情報を有する特徴情報をより簡潔なデザインにより(又はその逆の手法により)表示することができる。
なお、これらの上述した態様は組み合わせて用いることが可能なものである。
例えば、利用客からの音声又は文章による問い合わせが、苦情なのか、質問なのか、お褒めなのか、を解析するサービスが利用可能である。この場合、学習データとしては、利用客から寄せられた問い合わせ(音声又は文章)が用いられ、モデル情報における特徴情報としては、問い合わせに係る音声データ又は文章データから抽出された単語が用いられ、モデル情報におけるラベルとしては、「苦情」、「質問」及び「お褒め」等が用いられる。その他については、上述したものと同様の情報及び処理を用いることができる。
また別の例としては、新聞記事又は放送されたニュースが、国際、政治、芸能、スポーツ、科学等のいずれの分野に関連するものであるかを判定するサービスが利用可能である。この場合、学習データとしては、発行された新聞記事又は放送されたニュースが用いられ、モデル情報における特徴情報としては、新聞記事に係る文章データ又はニュースに係る音声データから抽出された単語が用いられ、モデル情報におけるラベルとしては、「国際」、「政治」、「芸能」、「スポーツ」及び「科学」等が用いられる。その他については、上述したものと同様の情報及び処理を用いることができる。
さらに別の例としては、新たに開発された薬品が心臓の機能を阻害するものかしないものかを推定するサービスが利用可能である。この場合、モデル情報における特徴情報としては、その薬に含まれる化合物の構造及び科学的性質(親水性、酸性度及び塩基制度等)が用いられ、モデル情報におけるラベルとしては、「心臓の機能を阻害する」及び「心臓の機能を阻害しない」が用いられる。
別の実施形態では、端末装置は、サーバ装置にアクセスすることなく、単にインストールされたプログラムに従って動作することによって、解析サービスをユーザに提供することができる。この場合、端末装置は、図3を参照して説明した各機能と同一又は等価な機能を有するものとすることができる(この実施形態では、端末装置が特許請求の範囲に記載された「情報処理装置」に相当し、端末装置に有線により接続された表示装置、及び/又は、端末装置自体に備えられた表示装置が、特許請求の範囲に記載された「表示装置」に相当する)。
30 端末装置
51 記憶部
52 特徴抽出部
53 機械学習部
54 判定部
55 表示制御部
Claims (8)
- 学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段と、
前記複数のラベルのうちの少なくとも1つのラベルについて前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段であって、被分析データに含まれた特徴情報のうち前記モデル情報に含まれた前記特徴情報と同一の特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて表示する表示制御手段と、
を具備することを特徴とする情報処理装置。 - 前記表示制御手段は、前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて表示する、請求項1に記載の情報処理装置。
- 前記表示制御手段は、前記特徴情報を、該特徴情報に対応付けられた重み情報の大きさに基づいて決定された態様により表示する、請求項1又は請求項2に記載の情報処理装置。
- 前記態様は、サイズ、色、濃淡、模様、形状、輝度、書体及びデザインのうちの少なくとも1つの態様を含む、請求項3に記載の情報処理装置。
- 前記表示制御手段は、前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて決定された順序に従って表示する、請求項2に記載の情報処理装置。
- 請求項1から請求項5のいずれかに記載された情報処理装置を備えることを特徴とする端末装置。
- 請求項1から請求項5のいずれかに記載された情報処理装置を備えることを特徴とするサーバ装置。
- コンピュータを、
学習データを用いて機械学習を実行することにより生成されたモデル情報であって、特徴情報と該特徴情報に対応付けられた重み情報とを複数のラベルの各々について含むモデル情報、を記憶する記憶手段、及び、
前記複数のラベルのうちの少なくとも1つのラベルについて前記モデル情報に含まれた前記特徴情報を、該特徴情報に対応付けられた前記重み情報に基づいて表示装置に表示する表示制御手段であって、被分析データに含まれた特徴情報のうち前記モデル情報に含まれた前記特徴情報と同一の特徴情報を、該特徴情報に対応付けられた前記重み情報の大きさに基づいて表示する表示制御手段、
として動作させることを特徴とするコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013216382A JP5576544B1 (ja) | 2013-10-17 | 2013-10-17 | 情報処理装置 |
US14/515,336 US20150112902A1 (en) | 2013-10-17 | 2014-10-15 | Information processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013216382A JP5576544B1 (ja) | 2013-10-17 | 2013-10-17 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5576544B1 true JP5576544B1 (ja) | 2014-08-20 |
JP2015079367A JP2015079367A (ja) | 2015-04-23 |
Family
ID=51579043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013216382A Active JP5576544B1 (ja) | 2013-10-17 | 2013-10-17 | 情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20150112902A1 (ja) |
JP (1) | JP5576544B1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10621497B2 (en) * | 2016-08-19 | 2020-04-14 | International Business Machines Corporation | Iterative and targeted feature selection |
US11005678B2 (en) | 2018-05-18 | 2021-05-11 | Alarm.Com Incorporated | Machine learning for home understanding and notification |
US11755924B2 (en) | 2018-05-18 | 2023-09-12 | Objectvideo Labs, Llc | Machine learning for home understanding and notification |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010118050A (ja) * | 2008-10-17 | 2010-05-27 | Toyohashi Univ Of Technology | 特許文献自動検索システムおよび特許文献自動検索方法 |
JP2013131075A (ja) * | 2011-12-21 | 2013-07-04 | Nippon Telegr & Teleph Corp <Ntt> | 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6337699B1 (en) * | 1996-06-27 | 2002-01-08 | Sun Microsystems, Inc. | Visualizing degrees of information object attributes |
US6035057A (en) * | 1997-03-10 | 2000-03-07 | Hoffman; Efrem H. | Hierarchical data matrix pattern recognition and identification system |
US7024033B2 (en) * | 2001-12-08 | 2006-04-04 | Microsoft Corp. | Method for boosting the performance of machine-learning classifiers |
US7383241B2 (en) * | 2003-07-25 | 2008-06-03 | Enkata Technologies, Inc. | System and method for estimating performance of a classifier |
US7580909B2 (en) * | 2003-08-26 | 2009-08-25 | Northrop Grumman Corporation | Visual representation tool for structured arguments |
US7287012B2 (en) * | 2004-01-09 | 2007-10-23 | Microsoft Corporation | Machine-learned approach to determining document relevance for search over large electronic collections of documents |
US7426497B2 (en) * | 2004-08-31 | 2008-09-16 | Microsoft Corporation | Method and apparatus for analysis and decomposition of classifier data anomalies |
US20060085181A1 (en) * | 2004-10-20 | 2006-04-20 | Kabushiki Kaisha Toshiba | Keyword extraction apparatus and keyword extraction program |
US7509381B1 (en) * | 2008-04-21 | 2009-03-24 | International Business Machines Corporation | Adaptive email in-basket ordering |
US20120054642A1 (en) * | 2010-08-27 | 2012-03-01 | Peter Wernes Balsiger | Sorted Inbox User Interface for Messaging Application |
-
2013
- 2013-10-17 JP JP2013216382A patent/JP5576544B1/ja active Active
-
2014
- 2014-10-15 US US14/515,336 patent/US20150112902A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010118050A (ja) * | 2008-10-17 | 2010-05-27 | Toyohashi Univ Of Technology | 特許文献自動検索システムおよび特許文献自動検索方法 |
JP2013131075A (ja) * | 2011-12-21 | 2013-07-04 | Nippon Telegr & Teleph Corp <Ntt> | 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法 |
Non-Patent Citations (2)
Title |
---|
CSNG200801133041; 田中 秀和: 'ブログ記事における話題の流行に注目したリコメンドシステム' 情報処理学会研究報告 Vol.2008 No.126, 20081210, p.181-184, 社団法人情報処理学会 * |
JPN6014015005; 田中 秀和: 'ブログ記事における話題の流行に注目したリコメンドシステム' 情報処理学会研究報告 Vol.2008 No.126, 20081210, p.181-184, 社団法人情報処理学会 * |
Also Published As
Publication number | Publication date |
---|---|
US20150112902A1 (en) | 2015-04-23 |
JP2015079367A (ja) | 2015-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102612691B (zh) | 给文本评分的方法和系统 | |
US11222087B2 (en) | Dynamically debiasing an online job application system | |
KR101994499B1 (ko) | 하이퍼링크 목적지의 가시화 기법 | |
CN107908959A (zh) | 网站信息检测方法、装置、电子设备及存储介质 | |
US20110307792A1 (en) | Accessing elements in an operating system | |
CN104137071A (zh) | 用于脚本编译的简档数据的持久性存储 | |
CN102243582A (zh) | 用于为自定义用户接口生成用户帮助信息的方法和装置 | |
JP5576544B1 (ja) | 情報処理装置 | |
KR101725008B1 (ko) | 가상현실 광고 관리서버 및 이를 이용한 광고 시스템 | |
CN107003923A (zh) | 浏览器提供的网站统计数据 | |
CN103577547B (zh) | 网页类型识别方法及装置 | |
KR101194638B1 (ko) | 이북 콘텐츠를 레벨에 따라 디스플레이하는 장치 및 방법 | |
JP5559750B2 (ja) | 広告処理装置、情報処理システム及び広告処理方法 | |
KR101976306B1 (ko) | 웹 페이지 작성 지원 장치, 및 기억 매체 | |
CN111177236B (zh) | 基于医养照护场景的量表生成方法、系统、设备及介质 | |
CN114637866A (zh) | 数字化新媒体的信息管理方法及装置 | |
CN114117303A (zh) | 多选列表的展示装置及方法 | |
US10576381B2 (en) | Method for performing game by using activity count | |
CN106537372A (zh) | 用于增强的文档生产率的实体识别 | |
KR100952510B1 (ko) | 컬러 폰트를 이용한 웹 문서 표시 방법 및 장치 | |
US20230289674A1 (en) | Computer-readable recording medium storing control program, control method, and information processing apparatus | |
JP7131518B2 (ja) | 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム | |
JP4721344B2 (ja) | 単語検索装置、単語検索方法及びプログラム | |
JP7450103B1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP5794073B2 (ja) | 情報表示装置及び情報表示プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140624 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5576544 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |