JP2019215886A - 可視化装置、可視化方法、及びプログラム - Google Patents

可視化装置、可視化方法、及びプログラム Download PDF

Info

Publication number
JP2019215886A
JP2019215886A JP2019135628A JP2019135628A JP2019215886A JP 2019215886 A JP2019215886 A JP 2019215886A JP 2019135628 A JP2019135628 A JP 2019135628A JP 2019135628 A JP2019135628 A JP 2019135628A JP 2019215886 A JP2019215886 A JP 2019215886A
Authority
JP
Japan
Prior art keywords
classification
document
unit
result
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019135628A
Other languages
English (en)
Other versions
JP6974751B2 (ja
Inventor
節夫 山田
Setsuo Yamada
節夫 山田
喜昭 野田
Yoshiaki Noda
喜昭 野田
杉崎 正之
Masayuki Sugizaki
正之 杉崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2017063573A external-priority patent/JP6635966B2/ja
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2019135628A priority Critical patent/JP6974751B2/ja
Publication of JP2019215886A publication Critical patent/JP2019215886A/ja
Application granted granted Critical
Publication of JP6974751B2 publication Critical patent/JP6974751B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】入力された文書の分類結果に対する判断基準を可視化する可視化装置、可視化方法及びプログラムを提供する。【解決手段】可視化装置2は、文書を取得する文書取得部11と、文書を複数の文に分割する分割部15と、文書及び複数の文それぞれについて、予め定められた複数の分類それぞれに対する分類結果を推定する分類推定部12と、文書及び複数の文と、文書及び複数の文それぞれに対する前記分類結果とを含む結果情報を表示する表示部14と、を備える。【選択図】図5

Description

本発明は、可視化装置、可視化方法、及びプログラムに関する。
従来、文書(テキスト)が属する分類が多値(3種類以上)の場合に、文書がどの分類に属するかを推定(N値分類の推定)し、最も可能性が高い分類結果を1つ表示する分類判定方法が知られている。例えば、パソコンの故障状況を記述した文書を故障の種類に分類する場合に、分類が「電源」、「HDD(Hard Disc Drive)」、「ディスプレイ」、及び「ファン」であるとき、例えば、「電源を入れても画面に何も表示されない」という文書が入力されると、図17に示すように入力された文書を取得する(ステップS51)。ステップS51で文書が取得されると、N値分類の推定により文書が上記複数の分類の中から「ディスプレイ」という分類に属すると推定する(ステップS52)。ステップS52でN値分類が推定されると、「ディスプレイ」という分類結果を含む結果情報を格納し(ステップS53)、ディスプレイ等に表示する(ステップS54)。N値分類の推定に用いられる分類器としては、SVM(Support Vector Machine)が非常に高い分類性能を持つことが知られている(例えば、非特許文献1参照)。また、分類結果の信頼度を付与し、信頼度とともに1つまたは複数の分類結果を表示する方法もある。
高村大也著、「言語処理のための機械学習入門」コロナ社、2010年8月10日、P.117−127
しかしながら、上述のような従来技術によって表示された分類結果を参考にして利用者が分類を確定しようとする際、1つの分類結果のみが表示される場合、分類結果の信頼度が分からないため、利用者が分類結果を採用してよいか判断することが困難な場合がある。また、分類結果が信頼度とともに表示される場合であっても、表示された分類結果の信頼度は分かるが、その分類結果を採用する判断基準(例えば、何パーセントの信頼度なら採用できるのか)を決めることが困難な場合がある。さらに、文書に複数の文が含まれる場合、いずれの文が分類の判定に寄与しているのか判断しかねる場合がある。
したがって、かかる点に鑑みてなされた本発明の目的は、入力された文書の分類結果に対するユーザの判断基準を可視化することである。
上記の課題を解決するため、本発明に係る可視化装置は、文書を取得する文書取得部と、前記文書を複数の文に分割する分割部と、前記文書及び前記複数の文それぞれについて、予め定められた複数の分類それぞれに対する分類結果を推定する分類推定部と、前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれに対する前記分類結果とを含む結果情報を表示する表示部と、を備えることを特徴とする。
また、本発明に係る可視化方法は、文書の分類を推定する可視化装置が実行する可視化方法であって、文書を取得するステップと、前記文書を複数の文に分割する分割するステップと、前記文書及び前記複数の文それぞれについて、予め定められた複数の分類それぞれに対する分類結果を推定するステップと、前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれに対する前記分類結果とを含む結果情報を表示するステップと、
を含むことを特徴とする。
また、本発明に係るプログラムは、コンピュータを、上記可視化装置として機能させるためのプログラム。
本発明によれば、入力された文書の分類結果に対するユーザの判断基準を可視化することができる。
第1の実施形態に係る可視化装置の構成例を示すブロック図である。 第2の実施形態における表示部の表示例を示す図である。 第1の実施形態の結果情報の一例を示す図である。 第1の実施形態に係る可視化方法の一例を示すフローチャートである。 第2の実施形態に係る可視化装置の構成例を示すブロック図である。 第2の実施形態における表示部の表示例を示す図である。 第2の実施形態の結果情報の一例を示す図である。 第2の実施形態に係る可視化方法の一例を示すフローチャートである。 第3の実施形態における表示部の表示例を示す図である。 第3の実施形態の結果情報の一例を示す図である。 第3の実施形態に係る可視化方法の一例を示すフローチャートである。 第4の実施形態の表示部の表示例を示す図である。 第4の実施形態における結果情報の一例を示す図である。 第4の実施形態に係る可視化方法の一例を示すフローチャートである。 第5の実施形態結果情報の一例を示す図である。 第1の実施形態の変形例に係る可視化装置の構成例を示すブロック図である。 従来技術における分類判定方法の一例を示すフローチャートである。
[第1の実施形態]
まず、図1を参照して、本発明の第1の実施形態の機能構成について説明する。図1は、第1の実施形態に係る可視化装置1の機能構成図である。
図1に示すように、可視化装置1は、文書取得部11、2値分類推定部12、格納部13、及び表示部14を備える。
文書取得部11は、利用者の操作に基づいて文書を取得する。文書取得部11によって取得される文書は任意であるが、本実施形態では、一例として、利用者は、Webアプリケーションを用いて、図2(a)に示すような画面に「電源を入れても画面に何も表示されない。」という文書を入力し、送信ボタンを押下する。この場合、文書取得部11は入力された文書を取得する。
2値分類推定部12は、文書取得部11によって取得された文書が複数の分類それぞれに属するか否かを、学習データに基づいて公知の機械推定の手法により推定する。分類は任意のものであってよいが、本実施形態では、分類の例を「電源」、「HDD」、「ディスプレイ」、及び「ファン」として説明する。
この場合、2値分類推定部12は、文書取得部11によって取得された文書が「電源」、「HDD」、「ディスプレイ」、及び「ファン」にそれぞれ属するか否かを学習データに基づき推定する。文書が「電源を入れても画面に何も表示されない。」である場合、2値分類推定部12は、学習データに基づいて、文書が「電源」という分類に属する(○)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属する(○)と推定し、「ファン」という分類に属さない(×)と推定したとする。
格納部13は結果情報を格納する。図3に示すように、結果情報には、文書を一意に識別するためのID(Identification)と、文書と、分類結果とが含まれる。分類結果は、上述のように2値分類推定部12によって推定された、該文書が各分類に属する(○)か否か(×)を示す情報である。例えば、格納部13は、ID「A」の「電源を入れても画面に何も表示されない。」という文書に対応して、電源「○」、HDD「×」、ディスプレイ「○」、ファン「×」を分類結果として格納する。
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、文書、及び分類結果をディスプレイ等に表示する。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図2(b)に示すように、文書は「電源」、「ディスプレイ」という分類に属することを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
続いて、第1の実施形態における可視化装置1の可視化方法について図4に示すシーケンス図を参照して説明する。
まず、文書取得部11は、利用者の操作に基づいて文書を取得する(ステップS11)。本実施形態では、文書取得部11は、例えば、「電源を入れても画面に何も表示されない。」という文書を取得する。
ステップS11で文書が取得されると、2値分類推定部12が文書の2値分類を推定する(ステップS12)。具体的には、2値分類推定部12は、文書が予め定められた分類それぞれに属するか否かを推定する。本実施形態では、例えば、2値分類推定部12は、文書が「電源」という分類に属するか否かを推定する。
ステップS12で2値分類が推定されると、2値分類推定部12は、全ての分類について推定されたか否かを判定する(ステップS13)。本実施形態の例では、2値分類推定部12は、「電源」、「HDD」、「ディスプレイ」、及び「ファン」の全ての分類について2値分類が推定されたか否かを判定する。
ステップS13で全ての分類について推定されていない場合には、ステップS12に戻って、2値分類推定部12は、まだ推定されていない分類に文書が属するか推定する。ステップS13で全ての分類について推定されていた場合には、格納部13が分類結果を含む結果情報を格納する(ステップS14)。
ステップS14で結果情報が格納されると、表示部14が結果情報をディスプレイ等に表示する(ステップS15)。
以上のように、第1の実施形態によれば、入力された文書に対して、全ての分類についての分類結果が格納され、表示される。文書が、複数の分類に属する場合は、どちらの分類もありえることを意味し、逆にどの分類にも属さない場合は、決め手に欠けることを意味する。例えば、図3に示す分類結果の場合、「電源を入れても画面に何も表示されない」という文書は、「電源」「ディスプレイ」という分類の両方に属する可能性があることを示している。これにより、入力された文書において過不足の情報を考え、不要な情報は削除し、足りない情報は補うなどして、分類を確定することが可能となる。例えば、図3に示す分類結果の場合、足りない情報として「パソコン本体の電源ランプが点灯しない」を補えば、分類を「電源」に確定することができる。
[第2の実施形態]
続いて、本発明の第2の実施形態について図面を参照して説明する。
図5に示すように、第2の実施形態に係る可視化装置2は、第1の実施形態に係る可視化装置1と同様に、文書取得部11、2値分類推定部12、格納部13、及び表示部14を備え、さらに分割部15を備える。なお、第1の実施形態における可視化装置1と同様の構成ブロックについては同一の参照符号を付して、適宜、説明を省略する。
分割部15は、文書取得部11によって取得された文書を分割する。分割部15は、例えば、文書に含まれる文を1文ずつ抽出する。分割部15は、例えば、句点「。」を検索し、文書の最初の文字から、最初の句点以前の文字列を1文として抽出することができる。また、分割部15は、句点より後の文字から次の句点以前の文字列を1文として抽出することができる。また、分割部15は、文書が改行されている場合、改行の前後で文書を分割してもよい。
一例として、利用者は、Webアプリケーションを用いて、図6(a)に示すような画面に「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書を入力し、送信ボタンを押下する。この場合、文書取得部11は入力された文書を取得する。そして、分割部15は、文書取得部11が取得した文書を、「動作が非常に遅く、ファンの音がしない。」という文と「立ち上がらないこともある。」という文とに分割する。
2値分類推定部12は、分割部15によって分割された各文について、学習データに基づいて、公知の機械推定の手法により2値分類を推定する。上述のように、分割部15によって、「動作が非常に遅く、ファンの音がしない。」という文と「立ち上がらないこともある。」という文に分割された場合、2値分類推定部12は、分割部15によって分割された文がそれぞれ「電源」、「HDD」、「ディスプレイ」、及び「ファン」にそれぞれ属するか否かを推定する。
具体的には、2値分類推定部12は、「動作が非常に遅く、ファンの音がしない。」という文について、学習データに基づいて、図7に示すように、文が「電源」という分類に属さない(×)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属する(○)と推定したとする。
また、2値分類推定部12は、「立ち上がらないこともある。」という文について、学習データに基づいて、文が「電源」という分類に属する(○)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属さない(×)と推定したとする。
さらに、2値分類推定部12は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書全体について、学習データに基づいて、文書が「電源」という分類に属する(○)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属する(○)と推定したとする。
格納部13は、結果情報を格納する。図7に示すように、結果情報には、IDと、文書と、分割された各文と、2値分類推定部12によって推定された、各文が各分類に属するか否かを示す分類結果、及び文書全体が各分類に属するか否かを示す分類結果とが含まれる。
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、文書、各文、及び分類結果をディスプレイ等に表示する。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図6(b)に示すように、文書の全体では「ファン」、「電源」という分類に属し、「動作が非常に遅く、ファンの音がしない。」という文は「ファン」という分類に属し、「立ち上がらないこともある。」という文は「電源」という分類に属することを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
続いて、第2の実施形態における可視化装置2の可視化方法について図8に示すシーケンス図を参照して説明する。
まず、文書取得部11は、利用者の操作に基づいて文書を取得する(ステップS21)。例えば、文書取得部11は、利用者が、Webアプリケーションを用いて、図6(a)に示したような画面に「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書を入力し、送信ボタンを押下すると、入力された文書を取得する。
ステップS21で文書が取得されると、分割部15が文書を分割する(ステップS22)。例えば、分割部15は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書を「動作が非常に遅く、ファンの音がしない。」という文と「立ち上がらないこともある。」という文に分割する。
ステップS22で文書が分割されると、2値分類推定部12は分割された文の2値分類を推定する(ステップS23)。具体的には、2値分類推定部12は、分割された文が予め定められた分類に属するか否かを推定する。本実施形態では、例えば、2値分類推定部12は、文書に含まれる「動作が非常に遅く、ファンの音がしない。」という文が「電源」という分類に属するか否かを推定する。
ステップS23で2値分類が推定されると、2値分類推定部12は、全ての分類について推定されたか否かを判定する(ステップS24)。本実施形態の例では、2値分類推定部12は、「電源」、「HDD」、「ディスプレイ」、及び「ファン」の全ての分類についてそれぞれ文書が属するか推定したか否かを判定する。
ステップS24で全ての分類について文が推定されていない場合には、ステップS23に戻って、2値分類推定部12が、まだ推定されていない分類に文が属するか推定する。ステップS24で全ての分類について文が推定された場合、2値分類推定部12は、分割された全ての文について推定されたか否かを判定する(ステップS25)。本実施形態では、分割された「動作が非常に遅く、ファンの音がしない。」という文と、「立ち上がらないこともある。」という文のいずれについても推定されたか否かを判定する。
ステップS25で全ての文について判定がされていた場合、格納部13が分類結果を含む結果情報を格納する(ステップS26)。ステップS25で全ての文について判定がされていなかった場合、ステップS23に戻って、まだ推定されていない文が各分類に属するか否かを判定する。
ステップS26で結果情報が格納されると、表示部14が結果情報をディスプレイ等に表示する(ステップS27)。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図6(b)に示したように、文書の全体では「ファン」、「電源」という分類に属し、「動作が非常に遅く、ファンの音がしない。」という文は「ファン」という分類に属し、「立ち上がらないこともある。」という文は「電源」という分類に属することを表示する。
以上のように、第2の実施形態によれば、分割部15が、文書を複数の文に分割する。そして、2値分類推定部12は、複数の文それぞれが、分類それぞれに該当するか否かを推定する。そのため、入力された文書に、複数の文が含まれている場合、文ごとに分類結果が格納され、表示される。これにより、文書全体では分類の判断がつかない場合であっても、文ごとに推定された分類結果を参考に、分類を再考することが可能となる。
[第3の実施形態]
続いて、本発明の第3の実施形態について図面を参照して説明する。
図1に示すように、第3の実施形態に係る可視化装置1は、第1の実施形態と同様に、文書取得部11、2値分類推定部12、格納部13、及び表示部14を備える。なお、構成ブロックは、第1の実施形態と同じであるので、構成ブロックの説明を省略する
第3の実施形態において、文書取得部11は、文書を取得するとともに、利用者の操作に基づいて該文書に対応する分類(人手付与分類)を取得する。一例として、利用者は、Webアプリケーションを用いて、図9(a)に示すような画面に「立ち上がりが悪い。」という文書を入力し、人手付与分類としての故障分類に「HDD」を入力する。そして、利用者は、送信ボタンを押下する。この場合、文書取得部11は、「立ち上がりが悪い。」という文書を取得し、「HDD」という故障分類を人手付与分類として取得する。
2値分類推定部12は、取得された文書が各分類に属するか否かを、学習データに基づいて、公知の機械推定の手法により推定する。例えば、2値分類推定部12は、「立ち上がりが悪い。」という文書について、学習データに基づいて、図10に示すように、文書が「電源」という分類に属さない(×)と推定し、「HDD」という分類に属する(○)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属さない(×)と推定したとする。
格納部13は結果情報を格納する。図10示すように、結果情報には、IDと、文書と、2値分類推定部12によって推定された機械推定の分類結果と、人手付与分類とが含まれる。例えば、格納部13は、図10示すように、ID「C」の「立ち上がりが悪い」という文書に対応して、「HDD」という人手付与分類を格納する。さらに格納部13は、電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」を機械推定の分類結果と
して格納する。
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、ディスプレイ等に文書、2値分類推定部12によって推定された機械推定の分類結果、及び人手付与分類を表示する。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図9(b)に示すように、文書が「HDD」という分類に属すること、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
続いて、第3の実施形態における可視化装置3の可視化方法について図11に示すシーケンス図を参照して説明する。
まず、文書取得部11は、利用者の操作に基づいて文書及び人手付与分類を取得する(ステップS31)。例えば、利用者の操作により、図9(a)に示すように、「立ち上がりが悪い。」という文書と、「HDD」という人手付与分類とが入力された場合、入力された文書及び人手付与分類を取得する。
本実施形態で可視化装置3が行う可視化方法のステップS32及びS33の処理は、第1の実施形態のステップS12及びS13の処理と同様である。
ステップS33で全ての分類について文書が推定された場合には、格納部13が結果情報を格納する(ステップS34)。第3の実施形態における結果情報には、第1の実施形態における分類結果に加えて、人手付与分類が含まれる。例えば、格納部13は、図10に示したように、電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」という
分類結果と、「HDD」という人手分類とを含む結果情報を格納する。
ステップS34で結果情報が格納されると、表示部14が、結果情報をディスプレイ等に表示する(ステップS35)。例えば、表示部14は、図9(b)に示すように、機械学習による判定で「HDD」という分類に属する可能性が高いと判定されたこと、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。
以上のように、第3の実施形態によれば、文書取得部11は、利用者の操作に基づいて文書の人手付与分類をさらに取得する。そして、表示部14は、2値分類推定部12によって推定された分類結果と、人手付与分類とを結果情報として表示する。そのため、利用者は、学習データに基づいて推定された分類結果を認識するとともに、文書を取得した利用者の判断を示す人手付与分類を考慮して、文書の分類を最終的に決定することができる。
[第4の実施形態]
続いて、本発明の第4の実施形態について図面を参照して説明する。
図5に示すように、第4の実施形態に係る可視化装置2は、第2の実施形態と同様に、文書取得部11、2値分類推定部12、格納部13、表示部14、及び分割部15を備える。なお、構成ブロックは、第2の実施形態と同じであるので、構成ブロックの説明を省略する。
第4の実施形態において、文書取得部11は、利用者の操作に基づいて文書を取得するとともに、該文書に対応する人手付与分類を取得する。一例として、利用者は、Webアプリケーションを用いて、図12(a)に示すような画面に「立ち上がりが悪い。電源を切って立ち上げても同じ。」という文書を入力し、人手付与分類としての故障分類に「HDD」を入力する。そして、利用者は、送信ボタンを押下する。この場合、文書取得部11は、「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書を取得する。さらに、「HDD」を人手付与分類として取得する。
そして、分割部15は、文書取得部11が取得した文書を「立ち上がりが悪い。」という文と「電源を切って再度立ち上げても同じ。」という文に分割する。
また、2値分類推定部12は、分割部15によって分割された各文が各分類に属するか否かを、学習データに基づいて、公知の機械推定の手法により推定する。例えば、2値分類推定部12は、図13に示すように、学習データに基づいて、「立ち上がりが悪い。」という文について、文が「電源」という分類に属さない(×)と推定し、「HDD」という分類に属する(○)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属さない(×)と推定したとする。
また、2値分類推定部12は、「電源を切って再度立ち上げても同じ。」という文について、学習データに基づいて文が「電源」という分類に属さない(×)と推定し、「HDD」に属さない(×)と推定し、「ディスプレイ」に属さない(×)と推定し、「ファン」に属さない(×)と推定したとする。また、2値分類推定部12は、「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書全体について、学習データに基づいて文書全体が「電源」という分類に属さない(×)と推定し、「HDD」に属する(○)と推定し、「ディスプレイ」に属さない(×)と推定し、「ファン」に属さない(×)と推定したとする。
格納部13は、結果情報を格納する。図13に示すように、結果情報にはIDと、文書と、分割された各文と、2値分類推定部12によって推定された、各文が各分類に属するか否かを示す分類結果、及び文書全体が各分類に属するか否かを示す分類結果と、人手付与分類とが含まれる。
上述のように、文書取得部11によって「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書と、「HDD」という人手付与分類とが取得され、2値分類推定部12によって推定された場合に格納部13が格納する結果情報について説明する。格納部13は、図13に示すように、ID「D」の「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書に対応して、人手付与分類である「HDD」、機械推定による分類結果である電源「×」、HDD「○」、ディスプレイ「×」、及びファン「×
」を格納する。また、格納部13は、分割された「立ち上がりが悪い。」という文に対応して、電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」を格納する。さら
に、格納部13は、分割された「電源を切って再度立ち上げても同じ。」という文に対応して、電源「×」、HDD「×」、ディスプレイ「×」、ファン「×」を格納する。
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、文書、各文、各文が各分類に属するか否かを示す分類結果、各文を含む文書が各分類に属するか否かを示す分類結果、及び人手付与分類をディスプレイ等に表示する。
例えば、表示部14は、図12(b)に示すように、文書全体が機械学習による判定で「HDD」という分類に属する可能性が高いと判定されたこと、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。さらに表示部14は、分割された「立ち上がりが悪い」という文が「HDD」という分類に属する可能性が高いと判定されたこと、「電源を切って立ち上げても同じ」という文がいずれの分類にも属さない可能性が高いと判定されたことを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
続いて、第4の実施形態における可視化装置4の可視化方法について図14に示すシーケンス図を参照して説明する。
まず、文書取得部11は、利用者の操作に基づいて文書及び人手付与分類を取得する(ステップS41)。例えば、利用者の操作により、図12(a)に示したように、「立ち上がりが悪い。電源を切って立ち上げても同じ。」という文書と、「HDD」という人手付与分類とが入力された場合、入力された文書及び人手付与分類を取得する。
本実施形態で可視化装置3が行う可視化方法のステップS42からS45の処理は、第2の実施形態のステップS22からS25の処理と同様である。
ステップS45で全ての文について推定された場合には、格納部13が結果情報を格納する(ステップS46)。第4の実施形態における結果情報は、第2の実施形態における分類結果に加えて、人手付与分類が含まれる。例えば、格納部13は、図13に示したような、ID「D」の「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書に対応して、人手付与分類である「HDD」、機械推定による分類結果である電源「×」、HDD「○」、ディスプレイ「×」、及びファン「×」を格納する。また、格納部
13は、分割された「立ち上がりが悪い。」という文に対応して、機械推定による分類結果である電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」を格納する。さ
らに、格納部13は、分割された「電源を切って再度立ち上げても同じ。」という文に対応して、機械推定による分類結果である電源「×」、HDD「×」、ディスプレイ「×」
、ファン「×」を格納する。
ステップS34で結果情報が格納されると、表示部14が、結果情報をディスプレイ等に表示する(ステップS47)。表示部14は、例えば、図12(b)に示したように、文書全体が機械学習による判定で「HDD」という分類に属する可能性が高いと判定されたこと、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。さらに表示部14は、分割された「立ち上がりが悪い」という文が「HDD」という分類に属する可能性が高いと判定されたこと、「電源を切って立ち上げても同じ」という文がいずれの分類にも属さない可能性が高いと判定されたことを表示する。
以上のように、第4の実施形態によれば、第2の実施形態と同様に、分割部15が、文書を複数の文に分割する。そして、2値分類推定部12は、複数の文それぞれが、分類それぞれに該当するか否かを推定する。そのため、利用者は、文書に含まれる文それぞれが、各分類に該当するかを認識することができる。また、第4の実施形態によれば、第3の実施形態と同様に、文書取得部11は、利用者の操作に基づいて文書の人手付与分類をさらに取得する。そして、表示部14は、2値分類推定部12によって推定された分類と、人手付与分類とを結果情報として表示する。そのため、利用者は、学習データに基づいて推定された分類とともに文書を取得した利用者の判断を示す人手付与分類を認識することができる。したがって利用者が文書の属する分類を最終的に決定するときに、文ごとの分類結果及び人手付与分類の両方を鑑みて総合的な決定を行うことが可能となる。
[第5の実施形態]
続いて、本発明の第5の実施形態について図面を参照して説明する。
図5に示すように、第5の実施形態に係る可視化装置2は、第4の実施形態と同様に、文書取得部11、2値分類推定部12、格納部13、表示部14、及び分割部15を備える。なお、構成ブロックは、第4の実施形態と同じであるので、構成ブロックの説明を省略する。
第5の実施形態においては、文書取得部11は、複数の文書を取得するとともに、利用者の操作に基づいて各文書に対応する人手付与分類を取得する。例えば、文書取得部11は、「電源を入れても画面に何も表示されない」という文書と、「ディスプレイ」という人手付与分類とを取得する。また、文書取得部11は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書と、「ファン」という人手付与分類とを取得する。また、文書取得部11は、「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書と、「HDD」という人手付与分類とを取得する。
この場合、2値分類推定部12及び格納部13は、「電源を入れても画面に何も表示されない。」という文書について、第3の実施形態と同様の処理を行う。また、分割部15、2値分類推定部12、及び格納部13は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書と「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書とについて第4の実施形態と同様の処理を行う。
表示部14は、格納部13によって格納されている各文書についての結果情報を合わせてディスプレイ等に表示する。なお、表示部14は、各文書についての結果情報を合わせて、通信ネットワークを介して他の情報処理装置に送信してもよい。
第5の実施形態における可視化装置2の可視化方法は、第3の実施形態の可視化方法と第4の実施形態の可視化方法との組合せである。具体的には、文書取得部11は、複数の文書とそれぞれの文書に対応する分類を取得する。文書に1つの文のみが含まれる場合、可視化装置5は、第3の実施形態のステップS32からS34の処理を行う。また、文書に複数の文が含まれる場合、可視化装置2は、第4の実施形態のステップS42からS46の処理を行う。そして、格納部13は、図15に示すように、ステップS34で格納された結果情報と、ステップS46で格納された結果情報とを合わせて格納する。
以上のように、第5の実施形態によれば、文書取得部11は、複数の文書と、それぞれの文書に対応する人手付与分類を取得する。そのため、利用者は、複数の文書それぞれについて、学習データに基づいて推定された分類と人手付与分類とを認識することができる。したがって利用者が複数の文書の属する分類を最終的に決定するときに、文書及び各文書に含まれる文それぞれの分類結果及び人手付与分類を鑑みて総合的な決定を行うことが可能となる。
また、上述の実施形態では、可視化装置1,2,3,4,5の各機能は、これらの機能を実現する処理内容を記述したプログラムをコンピュータの記憶部に記憶しておき、当該コンピュータのCPUによってこのプログラムを読み出して実行することで実現してもよい。また、プログラムを記録媒体に記録したり、ネットワークを通して提供したりしてもよい。
また、第1の実施形態では、図16に示すように、可視化装置1は、さらに音声認識部16を備えてもよい。音声認識部16は、利用者が発した音声について音声認識処理を行い、文書に変換する。そして、文書取得部11は、音声認識部16によって変換された文書を取得し、上述と同様の処理を行う。これにより、音声で表される情報についても分類を推定することができる。第2〜第5の実施形態についても同様である。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
1,2,3,4,5 可視化装置
11 文書取得部
12 2値分類推定部
13 格納部
14 表示部
15 分割部
16 音声認識部

Claims (4)

  1. 文書を取得する文書取得部と、
    前記文書を複数の文に分割する分割部と、
    前記文書及び前記複数の文それぞれについて、予め定められた複数の分類それぞれに対する分類結果を推定する分類推定部と、
    前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれに対する前記分類結果とを含む結果情報を表示する表示部と、
    を備えることを特徴とする可視化装置。
  2. 前記文書取得部は、前記文書に対する人手付与分類をさらに取得し、
    前記結果情報は、前記人手付与分類による分類結果をさらに含み、
    前記表示部は、前記結果情報に含まれる分類結果が、前記分類推定部において推定された分類結果であるか、人手付与分類による分類結果であるかを示す情報をさらに表示することを特徴とする請求項1に記載の可視化装置。
  3. 文書の分類を推定する可視化装置が実行する可視化方法であって、
    文書を取得するステップと、
    前記文書を複数の文に分割する分割するステップと、
    前記文書及び前記複数の文それぞれについて、予め定められた複数の分類それぞれに対する分類結果を推定するステップと、
    前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれに対する前記分類結果とを含む結果情報を表示するステップと、
    を含むことを特徴とする可視化方法。
  4. コンピュータを、請求項1又は2に記載の可視化装置として機能させるためのプログラム。

JP2019135628A 2017-03-28 2019-07-23 可視化装置、可視化方法、及びプログラム Active JP6974751B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019135628A JP6974751B2 (ja) 2017-03-28 2019-07-23 可視化装置、可視化方法、及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017063573A JP6635966B2 (ja) 2017-03-28 2017-03-28 可視化装置、可視化方法、及びプログラム
JP2019135628A JP6974751B2 (ja) 2017-03-28 2019-07-23 可視化装置、可視化方法、及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017063573A Division JP6635966B2 (ja) 2017-03-28 2017-03-28 可視化装置、可視化方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019215886A true JP2019215886A (ja) 2019-12-19
JP6974751B2 JP6974751B2 (ja) 2021-12-01

Family

ID=68918789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019135628A Active JP6974751B2 (ja) 2017-03-28 2019-07-23 可視化装置、可視化方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6974751B2 (ja)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145247A (ja) * 1997-07-27 1999-02-16 Just Syst Corp 文書分類装置、文書分類プログラムが記憶された記憶媒体、及び文書分類方法
JP2000285140A (ja) * 1998-12-24 2000-10-13 Ricoh Co Ltd 文書処理装置、文書分類装置、文書処理方法、文書分類方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003256441A (ja) * 2002-03-01 2003-09-12 Hewlett Packard Co <Hp> 文書分類方法及び装置
JP2005141476A (ja) * 2003-11-06 2005-06-02 Ricoh Co Ltd 文書管理装置、プログラムおよび記録媒体
JP2006164028A (ja) * 2004-12-09 2006-06-22 Canon Inc ウィンドウ型表示装置及びその方法
JP2006293767A (ja) * 2005-04-12 2006-10-26 Nomura Research Institute Ltd 文章分類装置、文章分類方法および分類辞書作成装置
JP2009217528A (ja) * 2008-03-11 2009-09-24 Hitachi Ltd 文書分類付与方法、システムまたはコンピュータプログラム
JP2010182253A (ja) * 2009-02-09 2010-08-19 Hitachi Ltd 文書分類装置及び文書分類方法
JP2013131075A (ja) * 2011-12-21 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法
WO2014208298A1 (ja) * 2013-06-28 2014-12-31 日本電気株式会社 文章分類装置、文章分類方法、及び記録媒体
US20160140210A1 (en) * 2014-11-19 2016-05-19 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for automatic identification of potential material facts in documents

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145247A (ja) * 1997-07-27 1999-02-16 Just Syst Corp 文書分類装置、文書分類プログラムが記憶された記憶媒体、及び文書分類方法
JP2000285140A (ja) * 1998-12-24 2000-10-13 Ricoh Co Ltd 文書処理装置、文書分類装置、文書処理方法、文書分類方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003256441A (ja) * 2002-03-01 2003-09-12 Hewlett Packard Co <Hp> 文書分類方法及び装置
JP2005141476A (ja) * 2003-11-06 2005-06-02 Ricoh Co Ltd 文書管理装置、プログラムおよび記録媒体
JP2006164028A (ja) * 2004-12-09 2006-06-22 Canon Inc ウィンドウ型表示装置及びその方法
JP2006293767A (ja) * 2005-04-12 2006-10-26 Nomura Research Institute Ltd 文章分類装置、文章分類方法および分類辞書作成装置
JP2009217528A (ja) * 2008-03-11 2009-09-24 Hitachi Ltd 文書分類付与方法、システムまたはコンピュータプログラム
JP2010182253A (ja) * 2009-02-09 2010-08-19 Hitachi Ltd 文書分類装置及び文書分類方法
JP2013131075A (ja) * 2011-12-21 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法
WO2014208298A1 (ja) * 2013-06-28 2014-12-31 日本電気株式会社 文章分類装置、文章分類方法、及び記録媒体
US20160140210A1 (en) * 2014-11-19 2016-05-19 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for automatic identification of potential material facts in documents

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
乙武 北斗、外4名: "地方議会会議録における政治的カテゴリの自動推定手法の提案", 情報処理学会研究報告 平成22年度(2), JPN6019049208, 8 September 2010 (2010-09-08), JP, pages 1 - 6, ISSN: 0004247106 *

Also Published As

Publication number Publication date
JP6974751B2 (ja) 2021-12-01

Similar Documents

Publication Publication Date Title
CN107832469B (zh) 一种企业logo图像的生成方法及装置
CN112637675B (zh) 视频生成方法、装置、电子设备以及存储介质
CN104281656B (zh) 在应用程序中加入标签信息的方法和装置
JP5489660B2 (ja) 画像管理装置およびその制御方法およびプログラム
US20130035929A1 (en) Information processing apparatus and method
JPWO2020099986A1 (ja) コンテンツの分類方法
CN105027116A (zh) 电子阅读器内平面书籍到富书籍的转换
KR20210086836A (ko) 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
US8218876B2 (en) Information processing apparatus and control method
JP6635966B2 (ja) 可視化装置、可視化方法、及びプログラム
JP2019215886A (ja) 可視化装置、可視化方法、及びプログラム
US20240211682A1 (en) A personalized communication text compression system
US8510118B2 (en) Attaching audio generated scripts to graphical representations of applications
US8705871B2 (en) Form image managing system and method
JP7259403B2 (ja) 情報処理装置及びプログラム
JP2022181319A (ja) 動画検索装置、動画検索システム及びプログラム
JP6926402B2 (ja) 情報処理装置及び情報処理プログラム
US20190089670A1 (en) Information processing apparatus
US12124683B1 (en) Content analytics as part of content creation
US11907508B1 (en) Content analytics as part of content creation
JP7513019B2 (ja) 画像処理装置および方法、並びに、プログラム
JP7293767B2 (ja) テキストセグメンテーション装置、テキストセグメンテーション方法、テキストセグメンテーションプログラム、及びテキストセグメンテーションシステム
CN116740232A (zh) 模板处理方法、装置、设备及介质
JP2010073092A (ja) 情報処理装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201222

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6974751

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150