JPWO2016147219A1 - テキスト可視化システム、テキスト可視化方法、及び、プログラム - Google Patents

テキスト可視化システム、テキスト可視化方法、及び、プログラム Download PDF

Info

Publication number
JPWO2016147219A1
JPWO2016147219A1 JP2017505747A JP2017505747A JPWO2016147219A1 JP WO2016147219 A1 JPWO2016147219 A1 JP WO2016147219A1 JP 2017505747 A JP2017505747 A JP 2017505747A JP 2017505747 A JP2017505747 A JP 2017505747A JP WO2016147219 A1 JPWO2016147219 A1 JP WO2016147219A1
Authority
JP
Japan
Prior art keywords
text
representative
categories
texts
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017505747A
Other languages
English (en)
Other versions
JP6508327B2 (ja
Inventor
貴士 大西
貴士 大西
康高 山本
康高 山本
正明 土田
正明 土田
享 赤峯
享 赤峯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2016147219A1 publication Critical patent/JPWO2016147219A1/ja
Application granted granted Critical
Publication of JP6508327B2 publication Critical patent/JP6508327B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

複数のカテゴリを含む文書に対するクラスタリングにおいて、カテゴリ間での観点の関連性を把握できるクラスタリングシステムを提供する。複数の文書の各々は複数のカテゴリの各々のテキストを含み、当該複数のカテゴリの各々について、複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストとが設定されている。代表テキスト表示部(51)は、複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示する。代表テキスト表示部(51)は、受付部(55)が特定のカテゴリの代表テキストの指定を受け付けたことに応じて、他のカテゴリの複数の代表テキストから、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する。

Description

本発明は、テキスト可視化システム、テキスト可視化方法、及び、記録媒体に関し、特に、テキストのクラスタリングを行うテキスト可視化システム、テキスト可視化方法、及び、記録媒体に関する。
大量の文書データの概要を把握するための技術として、複数のテキストに含まれる観点を抽出し、当該複数のテキストを抽出した観点毎に分類する、クラスタリング技術がある。
このようなテキストクラスタリング技術として、例えば、非特許文献1には、テキストに含まれるキーワードをベースに、複数のテキストに含まれる意図を抽出する技術が開示されている。
キーワードをベースにしたクラスタリング技術では、例えば、テキスト間のキーワードの共有度合いをもとに、分類が行われる。しかしながら、一般に、クラスタリング対象の各テキストには、複数の観点が混在していることがある。このため、キーワードの共有度合いをもとに分類を行っても、観点の見落とし、或いは、異なる観点のテキストの同じクラスタへの分類等により、各クラスタの観点が不明確になることがある。この場合、ユーザは、観点を明確にするために、複数のクラスタのテキストを確認し、テキストの再分類を行うといった煩雑な作業が強いられる。
また、テキストクラスタリングの他の技術として、非特許文献2には、テキスト間の含意関係を抽出し、含意関係があるテキストを同じクラスタに分類する、含意クラスタリング技術が開示されている。
含意クラスタリングとは、テキスト間の意味の関係である、含意関係をもとにしたクラスタリングである。含意クラスタリングを用いることにより、分析対象のテキストに含まれる観点をもれなく、かつ、クラスタ内のテキストが共通に含意し、クラスタの概要を表す代表テキストとともに抽出できる。
なお、関連技術として、特許文献1には、テキスト間の含意関係をもとに、含意関係を表す含意グラフを生成する技術が開示されている。また、特許文献2には、製品の不具合に係る「現象」、「原因」、「処置」、「対策」等の不具合情報の閲覧や集計を行う技術が開示されている。
特許第5494999号公報 特開2003−216222号公報
「テキストマイニング・ソリューション〜IBM Content Analyzer V8.4〜ご紹介と活用事例」、[online]、日本アイ・ビー・エム株式会社、[2015年2月17日検索]、インターネット<URL:http://www.ibm.com/developerworks/jp/data/library/ecm/j-d_icaseminar01/pdf/ica01.pdf> 「NEC、大量の文書データを同じ意味で自動グループ化する技術を開発」、[online]、日本電気株式会社、[2015年2月17日検索]、インターネット<URL:http://jpn.nec.com/press/201411/20141118_02.html>
クラスタリング対象の文書は、複数のカテゴリのテキストを含む可能性がある。この場合、複数のカテゴリの各々に対して、上述の非特許文献2の技術を適用することで、各カテゴリの話題の観点を抽出することが考えられる。
ここで、クラスタリング対象の文書によっては、現象、原因、対策のように、カテゴリ間の話題に何らかの関連性が存在する場合がある。しかしながら、複数のカテゴリの各々に対して含意クラスタリングを行っただけでは、カテゴリ間での観点の関連性を把握できないという技術課題があった。
本発明の目的は、上述の技術課題を解決し、複数のカテゴリを含む文書に対するクラスタリングにおいて、カテゴリ間での観点の関連性を把握できる、テキスト可視化システム、テキスト可視化方法、及び、記録媒体を提供することである。
本発明の一態様におけるテキスト可視化システムは、複数の文書の各々に含まれる複数のカテゴリの各々のテキスト、及び、当該複数のカテゴリの各々について、前記複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストとを示す情報、を記憶する記憶手段にアクセス可能に接続され、前記複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示する第1の表示手段と、前記1以上のカテゴリの各々の複数の代表テキストの内の、特定のカテゴリの代表テキストの指定を受け付ける受付手段と、を含み、前記第1の表示手段は、前記特定のカテゴリの代表テキストの指定を受け付けたことに応じて、他のカテゴリの複数の代表テキストから、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する。
本発明の一態様におけるテキスト可視化方法は、複数の文書の各々が複数のカテゴリの各々のテキストを含み、当該複数のカテゴリの各々について、前記複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストが設定されている場合に、前記複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示し、前記1以上のカテゴリの各々の複数の代表テキストの内の、特定のカテゴリの代表テキストの指定を受け付け、前記特定のカテゴリの代表テキストの指定を受け付けたことに応じて、他のカテゴリの複数の代表テキストから、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する。
本発明の一態様におけるコンピュータが読み取り可能な記録媒体は、コンピュータに、複数の文書の各々が複数のカテゴリの各々のテキストを含み、当該複数のカテゴリの各々について、前記複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストが設定されている場合に、前記複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示し、前記1以上のカテゴリの各々の複数の代表テキストの内の、特定のカテゴリの代表テキストの指定を受け付け、前記特定のカテゴリの代表テキストの指定を受け付けたことに応じて、他のカテゴリの複数の代表テキストから、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する、処理を実行させるプログラムを格納する。
本発明の技術効果は、複数のカテゴリを含む文書に対するクラスタリングにおいて、カテゴリ間での観点の関連性を把握できることである。
本発明の第1の実施の形態の基本的な構成を示すブロック図である。 本発明の第1の実施の形態における、クラスタリングシステム1の構成を示すブロック図である。 本発明の第1の実施の形態における、コンピュータにより実現されたクラスタリングシステム1の構成を示すブロック図である。 本発明の第1の実施の形態における、クラスタリングシステム1の動作を示すフローチャートである。 本発明の第1の実施の形態における、クラスタリング対象のテキストデータの例を示す図である。 本発明の第1の実施の形態における、含意関係の抽出結果の例を示す図である。 本発明の第1の実施の形態における、クラスタリング結果の例を示す図である。 本発明の第1の実施の形態における、クラスタリング画面80(代表テキスト指定前)の例を示す図である。 本発明の第1の実施の形態における、クラスタリング画面80(現象カテゴリの代表テキスト指定時)の例を示す図である。 本発明の第1の実施の形態における、クラスタリング画面80(現象カテゴリ及び原因カテゴリの代表テキスト指定時)の例を示す図である。 本発明の第1の実施の形態における、クラスタリング画面80(原因カテゴリの代表テキスト指定時)の例を示す図である。 本発明の第2の実施の形態における、クラスタリングシステム1の構成を示すブロック図である。 本発明の第2の実施の形態における、分析画面90の例を示す図である。 本発明の実施の形態における、代表テキストと要素テキストの関係の例を示す図である。
はじめに、本発明の実施の形態で用いるテキストのクラスタリング手法である、含意クラスタリングについて説明する。含意クラスタリングでは、非特許文献2に記載されているように、テキスト間の意味の関係である、含意関係をもとにクラスタリングを行う。本発明の実施の形態では、含意関係を、特許文献1と同様に、次のように定義する。すなわち、第1のテキストの内容が真であるならば第2のテキストの内容が真である場合、第1のテキストが第2のテキストを含意(entailment)すると定義する。また、第1のテキストの内容から第2のテキストの内容が読み取れる場合、第1のテキストが第2のテキストを含意すると定義してもよい。
含意関係の理解を容易にするため、具体例を用いて説明する、
<具体例1>
第1のテキスト:オバマ大統領はホワイトハウスに住んでいる。
第2のテキスト:オバマ大統領はアメリカに住んでいる。
この場合、第1のテキストの内容が真であるならば第2のテキストの内容が真であるので、第1のテキストが第2のテキストを含意するといえる。
<具体例2>
第1のテキスト:犬養毅首相は海軍将校らに暗殺された。
第2のテキスト:犬養毅首相は亡くなった
この場合、第1のテキストの内容が真であるならば第2のテキストの内容が真であるので、第1のテキストが第2のテキストを含意するといえる。
ここで、「代表テキスト」と「要素テキスト」を定義する。テキストの集合に対して含意クラスタリング処理を実行すると、代表テキストと要素テキストとが決定される。代表テキストと要素テキストとの関係は、要素テキストの内容が真であるならば代表テキストの内容が真である、という関係である。すなわち、代表テキストと要素テキストとの関係は、要素テキストは代表テキストを含意するという関係である。
図14は、本発明の実施の形態における、代表テキストと要素テキストの関係の例を示す図である。代表テキストと要素テキストの理解を容易にするため、図14を用いて説明する。図14は、T1からT11までの11個のテキストについて、含意クラスタリング処理を実行した様子を示す。図14における円形のシンボルは一つのテキストを示す。図14における矢印は、矢印の元のテキストが矢印の先のテキストを含意することを示す。図14において、テキストT6、T7、T11が、テキストT1を含意している。同様に、テキストT2、T3、T7、T10が、テキストT5を含意しており、テキストT2、T4、T7、T8が、テキストT9を含意している。このとき、テキストT6、T7、T11は、代表テキストT1の要素テキストである。同様に、テキストT2、T3、T7、T10は、代表テキストT5の要素テキストである。同様に、テキストT2、T4、T7、T8は、代表テキストT9の要素テキストである。
ここで、代表テキスト自身が要素テキストとして扱われてもよい。例えば、テキストT1、T6、T7、T11が代表テキストT1の要素テキストでもよい。
(第1の実施の形態)
次に、本発明の第1の実施の形態について説明する。
はじめに、本発明の第1の実施の形態の構成を説明する。
図2は、本発明の第1の実施の形態における、クラスタリングシステム1の構成を示すブロック図である。
図2を参照すると、本発明の第1の実施の形態におけるクラスタリングシステム1は、記憶部10、含意関係抽出部20、クラスタリング部30、及び、表示制御部50を含む。クラスタリングシステム1は、本発明のテキスト可視化システムの一実施形態である。
記憶部10は、クラスタリング対象の文書に含まれる複数のカテゴリの各々のテキストを示すテキストデータ、及び、各カテゴリのテキスト間のクラスタリングの結果(クラスタリング結果)を記憶する。
図5は、本発明の第1の実施の形態における、テキストデータの例を示す図である。図5の例は、クラスタリング対象のテキストが、PC(パーソナルコンピュータ)の不具合報告に係る文書から抽出された、現象、原因、対策に係る自然言語のテキストである場合の例である。図5の例では、テキストデータは、文書の識別子(D1、D2、…)、文書の取得日時を含む。テキストデータは、さらに、各カテゴリ(現象、原因、対策)について、当該文書に含まれるテキストを含む。なお、テキストの前の括弧内の符号は、テキストの識別子を示す。
テキストは、例えば、所定の形式に従って、複数のカテゴリ(現象、原因、対策)毎に記載された文書から、各カテゴリに対する記載を取得することにより抽出される。また、テキストは、自由形式で記述された文書から、各カテゴリに係る記載部分を特定することにより抽出されてもよい。また、文書は、例えば、コールセンタ等における会話を音声認識することにより生成した、コールログであってもよい。
含意関係抽出部20は、クラスタリング対象の文書に含まれる各カテゴリのテキスト間の含意関係を抽出する。
クラスタリング部30は、抽出された含意関係をもとに、各カテゴリについて、テキストに対する含意クラスタリングを行う。そして、クラスタリング部30は、代表テキスト、及び、当該代表テキストを含意する要素テキストが設定されたクラスタを複数生成する。
表示制御部50は、クラスタリング結果をもとに、各カテゴリの代表テキスト、及び、表示対象の文書(以下、対象文書とも記載する)の要素テキストを表示するためのクラスタリング画面80を生成し、ユーザ等に表示(出力)する。
図8は、本発明の第1の実施の形態における、クラスタリング画面80(代表テキスト指定前)の例を示す図である。
クラスタリング画面80は、代表テキスト表示領域81(81a、81b、81c)、及び、要素テキスト表示領域82を含む。
代表テキスト表示領域81の「クラスタ」欄には、各カテゴリの代表テキストが表示される。また、「件数」欄には、対象文書の内、各代表テキストを含意する要素テキストを含む文書の数が表示される。代表テキスト表示領域81の代表テキストは、「件数」欄に示される文書の数の大きい(または小さい)順に表示されてもよい。
要素テキスト表示領域82の「詳細テキスト」欄には、各対象文書の各カテゴリの要素テキストが、文書識別子、及び、取得日時に関連付けられて、例えば、時系列順で表示される。
表示制御部50は、代表テキスト表示部51(または、第1の表示部)、要素テキスト表示部52(または、第2の表示部)、及び、受付部55を含む。
受付部55は、代表テキスト表示領域81において、ユーザ等から、対象文書に係る条件(以下、表示条件とも記載する)の指定を受け付ける。本発明の実施の形態では、表示条件として、1以上のカテゴリの各々の代表テキスト(クラスタ)の組み合わせ(AND条件)が指定される。この場合、対象文書は、クラスタリング対象の全文書の内、表示条件で指定された1以上のカテゴリの各々の代表テキストを含意する(代表テキストのクラスタに属する)要素テキストを、当該1以上のカテゴリの全てについて含む文書である。
要素テキスト表示部52は、クラスタリング対象の文書から、表示条件に応じた対象文書を抽出し(絞り込み)、当該抽出した文書の各カテゴリの要素テキストを、要素テキスト表示領域82に表示する。
代表テキスト表示部51は、各カテゴリの代表テキストを、代表テキスト表示領域81に表示する。また、代表テキスト表示部51は、表示条件で指定されたカテゴリとは異なるカテゴリの代表テキストから、表示条件に応じた関連代表テキストを抽出し(絞り込み)、代表テキスト表示領域81に表示する。ここで、関連代表テキストとは、表示条件で指定された1以上のカテゴリとは異なるカテゴリの代表テキストであって、対象文書に含まれる要素テキストが含意する代表テキストである。
なお、クラスタリングシステム1は、CPU(Central Processing Unit)とプログラムを記憶した記憶媒体を含み、プログラムにもとづく制御によって動作するコンピュータであってもよい。
図3は、本発明の第1の実施の形態における、コンピュータにより実現されたクラスタリングシステム1の構成を示すブロック図である。
クラスタリングシステム1は、CPU2、HDD(ハードディスクドライブ)やメモリ等の記憶デバイス(記憶媒体)3、他の装置等と通信を行う通信デバイス4、マウスやキーボード等の入力デバイス5、及び、ディスプレイ等の出力デバイス6を含む。
CPU2は、含意関係抽出部20、クラスタリング部30、及び、表示制御部50の機能を実現するためのコンピュータプログラムを実行する。記憶デバイス3は、記憶部10のデータを記憶する。出力デバイス6は、ユーザ等へ、クラスタリング画面80を出力する。入力デバイス5は、ユーザ等から、表示条件の指定を受け付ける。また、通信デバイス4が、他の装置へクラスタリング画面80を出力し、他の装置から表示条件の指定を受け付けてもよい。
また、図2に示されたクラスタリングシステム1の各構成要素は、独立した論理回路でもよい。また、図2に示されたクラスタリングシステム1の各構成要素は、有線または無線で接続された複数の物理的な装置に分散的に配置されていてもよい。
次に、本発明の第1の実施の形態の動作を説明する。
ここでは、図5のようなテキストデータが、記憶部10に記憶されていると仮定する。
図4は、本発明の第1の実施の形態における、クラスタリングシステム1の動作を示すフローチャートである。
はじめに、含意関係抽出部20は、記憶部10に記憶された、クラスタリング対象の文書の各カテゴリのテキスト間の含意関係を抽出する(ステップS101)。
ここで、含意関係抽出部20は、例えば、特許文献1と同様の判定処理を行うことにより、テキスト間の含意関係を抽出する。この場合、含意関係抽出部20は、テキストに含まれる内容語を比較し、被覆率を算出することにより、含意関係の有無を判定する。なお、含意関係抽出部20は、テキスト間の含意関係を抽出できれば、特許文献1と異なる判定処理により、テキスト間の含意関係を判定してもよい。
図6は、本発明の第1の実施の形態における、含意関係の抽出結果の例を示す図である。図6において、矢印の元のテキストは、先のテキストを含意することを示す。図6の例では、例えば、カテゴリ「現象」について、テキストT2a、T7aが、テキストT1aを含意している。
例えば、含意関係抽出部20は、図5の各カテゴリのテキストに対して、図6に示すように、含意関係を抽出する。
クラスタリング部30は、記憶部10に記憶された、クラスタリング対象の文書の各カテゴリのテキストに対して、含意クラスタリングを行う(ステップS102)。
ここで、クラスタリング部30は、例えば、非特許文献2の技術と同様に、含意関係抽出部20により抽出された含意関係をもとに、含意クラスタリングを行う。クラスタリングの結果、テキストが複数の代表テキストを含意する場合、当該テキストは、複数のクラスタの要素テキストに設定される。なお、本発明の実施の形態では、あるクラスタの代表テキストに設定されたテキスト自身も、当該クラスタの代表テキストを含意する要素テキストとして設定される。クラスタリング部30は、各カテゴリについて、各クラスタの代表テキストの識別子を当該クラスタの要素テキストの識別子と関連付けたクラスタリング結果を、記憶部10に保存する。
図7は、本発明の第1の実施の形態における、クラスタリング結果の例を示す図である。図7の例では、例えば、現象カテゴリについて、テキストT1a、T4a、及び、T5aが、それぞれ、クラスタA1、A2、及び、A3の代表テキストに設定されている。また、テキストT1aとテキストT1aを含意するテキストT2a、T7aが、クラスタA1の要素テキストに設定されている。
例えば、クラスタリング部30は、図6の含意関係をもとに、図7に示すようなクラスタリング結果を生成する。
なお、クラスタリング部30は、さらに、各カテゴリにおいて、異なる二つのクラスタ間の要素テキストの重複の度合いをもとに、当該二つのクラスタを一つのクラスタに統合してもよい。
次に、表示制御部50の代表テキスト表示部51は、記憶部10に記憶されたクラスタリング結果をもとに、各カテゴリの代表テキストを、クラスタリング画面80の代表テキスト表示領域81に表示する(ステップS103)。
例えば、代表テキスト表示部51は、図7のクラスタリング結果をもとに、現象カテゴリについて、図8のように、代表テキスト表示領域81aに、代表テキストT1a、T4a、T5aを表示する。同様に、代表テキスト表示部51は、代表テキスト表示領域81bに、原因クラスタについて、代表テキストT1b、T5b、T4bを表示し、代表テキスト表示領域81cに、対策クラスタについて、代表テキストT1c、T5c、T3cを表示する。
要素テキスト表示部52は、表示条件に応じて、クラスタリング対象の文書から対象文書を抽出し、当該抽出した文書の各カテゴリの要素テキストを、要素テキスト表示領域82に表示する(ステップS104)。なお、最初の時点では、表示条件が指定されていないため、例えば、クラスタリング対象の全文書が、対象文書として用いられる。
例えば、要素テキスト表示部52は、図8のように、要素テキスト表示領域82に、クラスタリング対象の全文書D1〜D7について、各カテゴリの要素テキストを表示する。
代表テキスト表示部51は、表示条件に応じて、関連代表テキストを抽出し、代表テキスト表示領域81に表示する(ステップS105)。また、同時に、代表テキスト表示部51は、代表テキスト表示領域81の文書の数を、対象文書に応じて更新する。なお、最初の時点では、表示条件が指定されていないため、関連代表テキストの抽出は省略される。
例えば、代表テキスト表示部51は、図8のように、代表テキスト表示領域81a〜81cに、クラスタリング対象の全文書D1〜D7の内、各代表テキストを含意する要素テキストを含む文書の数を表示する。
ユーザ等は、図8のクラスタリング画面80の代表テキスト表示領域81を参照し、概要レベルで、全体的な現象、原因、対策や、それらの発生数を把握できる。
次に、受付部55は、クラスタリング画面80において、表示条件(代表テキスト)の指定を受け付ける(ステップS106)。
ここで、受付部55は、例えば、代表テキスト表示領域81に表示されている代表テキストの、マウスによるクリックを検出することにより、代表テキストの指定を受け付ける。
以降、ステップS104からの処理が繰り返され、表示条件を受け付けるたびに、当該表示条件に応じて、クラスタリング画面80が更新される。
以下、表示条件のいくつかの例を用いて、ステップS104〜S106の動作を説明する。
<表示条件として現象カテゴリの代表テキストが指定された場合>
ユーザ等が、図8の代表テキスト表示領域81において、概要レベルの現象「起動しない」について、関連する原因や対策を分析する場合を考える。例えば、受付部55は、図8の代表テキスト表示領域81aにおいて、ユーザ等から、現象カテゴリの代表テキストT1a「起動しない」の指定を受け付ける。
図9は、本発明の第1の実施の形態における、クラスタリング画面80(現象カテゴリの代表テキスト指定時)の例を示す図である。
この場合、表示条件(代表テキストT1a)に応じた対象文書は、代表テキストT1aを含意する要素テキストT1a、T2a、T7aを含む文書D1、D2、D7である。
要素テキスト表示部52は、図9のように、要素テキスト表示領域82に、対象文書である文書D1、D2、D7の要素テキストを表示する。
代表テキスト表示部51は、代表テキストT1aに対する原因カテゴリの関連代表テキストとして、図9のように、代表テキスト表示領域81bに、対象文書D1、D2、D7に含まれる要素テキストが含意する、代表テキストT1b、T5bを表示する。また、代表テキスト表示部51は、代表テキストT1aに対する対策カテゴリの関連代表テキストとして、代表テキスト表示領域81cに、対象文書D1、D2、D7に含まれる要素テキストが含意する、代表テキストT1c、T5cを表示する。さらに、代表テキスト表示部51は、図9のように、代表テキスト表示領域81の各代表テキストに対する文書の数を、対象文書D1、D2、D7の内の、各代表テキストを含意する要素テキストを含む文書の数で更新する。
ユーザ等は、図9のクラスタリング画面80の代表テキスト表示領域81を参照し、概要レベルで、指定した現象に関連する原因、対策や、それらの発生数を把握できる。また、要素テキスト表示領域82を参照し、指定した現象や当該現象に関連する原因、対策の詳細を把握できる。
<表示条件として現象カテゴリ及び原因カテゴリの代表テキストが指定された場合>
ユーザ等が、図9の代表テキスト表示領域81において、概要レベルの現象「起動しない」、及び、原因「HDDが壊れた」について、関連する対策を分析する場合を考える。例えば、受付部55は、さらに、図9の代表テキスト表示領域81bにおいて、ユーザ等から、原因カテゴリの代表テキストT5b「HDDが壊れた」の指定を受け付ける。
図10は、本発明の第1の実施の形態における、クラスタリング画面80(現象カテゴリ及び原因カテゴリの代表テキスト指定時)の例を示す図である。
この場合、表示条件(代表テキストT1a及びT5bの組み合わせ)に応じた対象文書は、代表テキストT1aを含意する要素テキストT2a、及び、代表テキストT5bを含意する要素テキストT2bを含む文書D2である。
要素テキスト表示部52は、図10のように、要素テキスト表示領域82に対象文書である文書D2の要素テキストを表示する。
代表テキスト表示部51は、代表テキストT1a及びT5bの組み合わせに対する対策カテゴリの関連代表テキストとして、図10のように、代表テキスト表示領域81cに、対象文書D2に含まれる要素テキストが含意する、代表テキストT5cを表示する。
<表示条件として原因カテゴリの代表テキストが指定された場合>
ユーザ等が、図8の代表テキスト表示領域81において、概要レベルの現象「メインボードが故障」について、関連する現象や対策を分析する場合を考える。例えば、受付部55は、図8の代表テキスト表示領域81bにおいて、ユーザ等から、原因カテゴリの代表テキストT4b「メインボードが故障」の指定を受け付ける。
図11は、本発明の第1の実施の形態における、クラスタリング画面80(原因カテゴリの代表テキスト指定時)の例を示す図である。
この場合、表示条件(代表テキストT4b)に応じた対象文書は、代表テキストT4bを含意する要素テキストT3b、T4b、T6bを含む文書D3、D4、D6である。
要素テキスト表示部52は、図11のように、要素テキスト表示領域82に、対象文書である文書D3、D4、D6の要素テキストを表示する。
代表テキスト表示部51は、代表テキストT4bに対する現象カテゴリの関連代表テキストとして、図11のように、代表テキスト表示領域81aに、対象文書D3、D4、D6に含まれる要素テキストが含意する、代表テキストT4a、T5aを表示する。また、代表テキスト表示部51は、代表テキストT1aに対する対策カテゴリの関連代表テキストとして、代表テキスト表示領域81cに、対象文書D3、D4、D6に含まれる要素テキストが含意する、代表テキストT3cを表示する。さらに、代表テキスト表示部51は、図11のように、代表テキスト表示領域81の各代表テキストに対する文書の数を、対象文書D3、D4、D6の内の、各代表テキストを含意する要素テキストを含む文書の数で更新する。
ユーザ等は、図11のクラスタリング画面80の代表テキスト表示領域81を参照し、概要レベルで、指定した原因に関連する現象、対策や、それらの発生数を把握できる。また、要素テキスト表示領域82を参照し、指定した原因や当該原因に関連する現象、対策の詳細を把握できる。
なお、ここでは、表示条件が「現象カテゴリの代表テキスト」、「現象カテゴリ及び原因カテゴリの代表テキスト」、「原因カテゴリの代表テキスト」の場合を例に説明した。しかしながら、これに限らず、表示条件として、現象、原因、対策の内の1以上の任意の組み合わせについて、各カテゴリの代表テキストが指定されてもよい。
以上により、本発明の第1の実施の形態の動作が完了する。
なお、本発明の第1の実施の形態では、クラスタリング対象のテキストのカテゴリが、PCの不具合に係る現象、原因、対策である場合を例に説明した。しかしながら、これに限らず、クラスタリング対象のカテゴリは、他の製品や、サービス等の課題に係る、現象、原因、対策でもよい。また、クラスタリング対象のカテゴリは、顧客からの苦情の対象、苦情の内容、要望でもよい。また、クラスタリング対象のカテゴリは、各文書に含まれる互いに関連するカテゴリであれば、どのようなカテゴリでもよい。
また、本発明の第1の実施の形態では、要素テキスト表示部52は、表示条件が指定されていない段階では、クラスタリング対象の全文書を対象文書として、当該対象文書の要素テキストを要素テキスト表示領域82に表示した。これに限らず、要素テキスト表示部52は、表示条件が指定されていない段階では、対象文書の要素テキストの表示を省略してもよい。
また、本発明の第1の実施の形態では、要素テキスト表示部52は、対象文書の全カテゴリの要素テキストを要素テキスト表示領域82に表示した。これに限らず、要素テキスト表示部52は、対象文書の特定のカテゴリの要素テキストのみを表示してもよい。
また、本発明の第1の実施の形態では、代表テキスト表示部51は、表示条件が指定されていない段階で、全カテゴリの全代表テキストを、代表テキスト表示領域81に表示した。これに限らず、代表テキスト表示部51は、表示条件が指定されていない段階では、表示条件としての指定を受け付けるカテゴリの代表テキストのみを表示してもよい。
また、本発明の第1の実施の形態では、要素テキスト表示部52は、抽出した対象文書の要素テキストの表示方法として、抽出した対象文書の要素テキストのみを要素テキスト表示領域82に表示した。これに限らず、要素テキスト表示部52は、クラスタリング対象の全文書、或いは、特定の文書の要素テキストを表示したまま、抽出した対象文書の要素テキストのみを強調表示してもよい。
また、本発明の第1の実施の形態では、代表テキスト表示部51は、各カテゴリの抽出した代表テキストの表示方法として、抽出した代表テキストのみを代表テキスト表示領域81に表示した。これに限らず、代表テキスト表示部51は、各カテゴリの全代表テキスト、或いは、特定の代表テキストを表示したまま、抽出した代表テキストのみを強調表示してもよい。
次に、本発明の第1の実施の形態の基本的な構成を説明する。
図1は、本発明の第1の実施の形態の基本的な構成を示すブロック図である。図1を参照すると、本発明のクラスタリングシステム1(テキスト可視化システム)は、代表テキスト表示部51(第1の表示部)、及び、受付部55を含む。クラスタリングシステム1は、記憶部にアクセス可能に接続される。記憶部は、複数の文書の各々に含まれる複数のカテゴリの各々のテキストを記憶する。記憶部は、さらに、複数のカテゴリの各々について、複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストとを示す情報を記憶する。代表テキスト表示部51は、複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示する。受付部55は、1以上のカテゴリの各々の複数の代表テキストの内の、特定のカテゴリの代表テキストの指定を受け付ける。代表テキスト表示部51は、他のカテゴリの複数の代表テキストから、指定された特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する。
次に、本発明の第1の実施の形態の効果を説明する。
本発明の第1の実施の形態によれば、複数のカテゴリを含む文書に対するクラスタリングにおいて、カテゴリ間での観点の関連性を把握できる。その理由は、以下の通りである。すなわち、代表テキスト表示部51は、複数のカテゴリの各々の代表テキストを表示する。そして、代表テキスト表示部51は、他のカテゴリの複数の代表テキストから、指定された特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する。
これにより、ユーザは、最初に、各カテゴリの代表テキストにより、概要レベルで各カテゴリの観点を把握でき、次に、特定のカテゴリの観点の代表テキストを指定することで、当該観点に関連する他のカテゴリの観点を把握できる。
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。
本発明の第2の実施の形態では、表示制御部50が分析テーブル91を表示する点において、本発明の第1の実施の形態と異なる。
はじめに、本発明の第2の実施の形態の構成を説明する。
図12は、本発明の第2の実施の形態における、クラスタリングシステム1の構成を示すブロック図である。
図12を参照すると、本発明の第2の実施の形態のクラスタリングシステム1は、本発明の第1の実施の形態のクラスタリングシステム1の構成に加えて、表示制御部50に、さらに、分析結果表示部56(または、第3の表示部)を含む。
分析結果表示部56は、二つのカテゴリの代表テキストの関係性(相関)を表す分析テーブル91を生成し、表示する。
次に、本発明の第2の実施の形態の動作を説明する。
上述のステップS106で、表示制御部50の受付部55は、分析テーブル91の作成指示を受け付ける。分析結果表示部56は、クラスタリング結果をもとに、二つのカテゴリ毎に分析テーブル91を生成する。分析結果表示部56は、二つのカテゴリの各代表テキストのペアについて、クラスタリング対象の文書の内、当該二つのカテゴリの要素テキストが、それぞれ、当該ペアの代表テキストを含意する文書の数を集計する。分析結果表示部56は、集計結果を表す集計表を、分析テーブル91として生成する。
図13は、本発明の第2の実施の形態における、分析画面90の例を示す図である。分析画面90は、分析テーブル91(91a、b、c)を含む。分析テーブル91a、b、cは、それぞれ、現象と原因カテゴリ、原因と対策カテゴリ、現象と対策カテゴリについての、分析テーブル91である。
例えば、分析結果表示部56は、図7のクラスタリング結果をもとに、図13のような分析テーブル91a、b、cを生成し、分析画面90に表示する。
ユーザ等は、図13の分析画面90を参照し、概要レベルの現象、原因、対策の内の二つのカテゴリ間で、それらのカテゴリの各観点のペアの発生数を、容易に把握できる。
なお、分析結果表示部56は、上述の集計表の各セルについて、さらに、調整済み標準化残差等を算出したテーブルを、カテゴリ間の相関を表す分析テーブル91として生成してもよい。また、分析結果表示部56は、カテゴリ間の関係性を算出できれば、他の方法により算出された関係性を表すテーブルを分析テーブル91として生成してもよい。例えば、分析結果表示部56は、調整済み標準化残差の代わりに、上述の集計表の各セルについて、標準化残差や、単に残差を算出したテーブルを生成してもよい。また、分析結果表示部56は、カイ二乗値や対数尤度比(log-likelihood ratio)により、カテゴリ間の関係性を示してもよい。
以上により、本発明の第2の実施の形態の動作が完了する。
次に、本発明の第2の実施の形態の効果を説明する。
本発明の第2の実施の形態によれば、複数のカテゴリを含む文書に対するクラスタリングにおいて、二つのカテゴリ間の、観点の関係性を容易に把握できる。その理由は、分析結果表示部56が、二つのカテゴリについて、文書に含まれる当該二つのカテゴリの要素テキストがそれぞれ含意する代表テキストの関係性を表す分析テーブル91を生成し、表示するためである。なお、上述のキーワードをベースにしたクラスタリングでは、各クラスタの観点が不明確となるため、このようにカテゴリ間のクラスタの関係性を表すテーブルを生成しても、意味のある結果を得ることができない。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本発明は、大量文書データをクラスタリングするシステムに適用できる。例えば、本発明は、製品やサービスの改善、マーケティング、営業活動の効率化のために、コールログや顧客の意見等を分析するシステムに適用できる。また、本発明は、製品の不具合や製品に対する評価や要望を分析するシステム、学術文献等を分析するシステムにも適用できる。また、本発明は、カスタマーサポートに対する質問を分析して、FAQ(Frequently Asked Questions)を生成するシステムにも適用できる。
1 クラスタリングシステム
2 CPU
3 記憶デバイス
4 通信デバイス
5 入力デバイス
6 出力デバイス
10 記憶部
20 含意関係抽出部
30 クラスタリング部
50 表示制御部
51 代表テキスト表示部
52 要素テキスト表示部
55 受付部
56 分析結果表示部
80 クラスタリング画面
81 代表テキスト表示領域
82 要素テキスト表示領域
90 分析画面
91 分析テーブル

Claims (7)

  1. 複数の文書の各々に含まれる複数のカテゴリの各々のテキスト、及び、当該複数のカテゴリの各々について、前記複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストとを示す情報、を記憶する記憶手段にアクセス可能に接続され、
    前記複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示する第1の表示手段と、
    前記1以上のカテゴリの各々の複数の代表テキストの内の、特定のカテゴリの代表テキストの指定を受け付ける受付手段と、を備え、
    前記第1の表示手段は、前記特定のカテゴリの代表テキストの指定を受け付けたことに応じて、他のカテゴリの複数の代表テキストから、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する、
    テキスト可視化システム。
  2. さらに、前記特定のカテゴリの代表テキストの指定を受け付けたことに応じて、前記複数の文書から、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書を抽出し、当該抽出した文書に含まれる、前記複数のカテゴリの内の1以上のカテゴリの各々の要素テキストを表示する第2の表示手段を備える、
    請求項1に記載のテキスト可視化システム。
  3. 前記受付手段は、前記1以上のカテゴリの各々の複数の代表テキストの内の、複数の特定のカテゴリの各々の代表テキストの指定を受け付け、
    前記第1の表示手段は、前記複数の特定のカテゴリの各々の代表テキストの指定を受け付けたことに応じて、当該複数の特定のカテゴリの各々の代表テキストを含意する要素テキストを当該複数の特定のカテゴリの全てについて含む文書に含まれる、他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する、
    請求項1に記載のテキスト可視化システム。
  4. さらに、前記複数の特定のカテゴリの各々の代表テキストの指定を受け付けたことに応じて、前記複数の文書から、当該複数の特定のカテゴリの各々の代表テキストを含意する要素テキストを当該複数の特定のカテゴリの全てについて含む文書を抽出し、当該抽出した文書に含まれる、前記複数のカテゴリの内の1以上のカテゴリの各々の要素テキストを表示する第2の表示手段を備える、
    請求項3に記載のテキスト可視化システム。
  5. さらに、前記複数のカテゴリの内の二つのカテゴリについて、文書に含まれる当該二つのカテゴリの要素テキストがそれぞれ含意する代表テキストの関係性を表すテーブルを表示する第3の表示手段を備える、
    請求項1乃至4のいずれかに記載のテキスト可視化システム。
  6. 複数の文書の各々が複数のカテゴリの各々のテキストを含み、当該複数のカテゴリの各々について、前記複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストが設定されている場合に、
    前記複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示し、
    前記1以上のカテゴリの各々の複数の代表テキストの内の、特定のカテゴリの代表テキストの指定を受け付け、
    前記特定のカテゴリの代表テキストの指定を受け付けたことに応じて、他のカテゴリの複数の代表テキストから、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する、
    テキスト可視化方法。
  7. コンピュータに、
    複数の文書の各々が複数のカテゴリの各々のテキストを含み、当該複数のカテゴリの各々について、前記複数の文書に含まれるテキストの内の代表テキストと当該代表テキストを含意する要素テキストが設定されている場合に、
    前記複数のカテゴリの内の1以上のカテゴリの各々の複数の代表テキストを表示し、
    前記1以上のカテゴリの各々の複数の代表テキストの内の、特定のカテゴリの代表テキストの指定を受け付け、
    前記特定のカテゴリの代表テキストの指定を受け付けたことに応じて、他のカテゴリの複数の代表テキストから、当該特定のカテゴリの代表テキストを含意する要素テキストを含む文書に含まれる、当該他のカテゴリの要素テキストを含意する代表テキストを抽出して表示する、
    処理を実行させるプログラムを格納する、コンピュータが読み取り可能な記録媒体。
JP2017505747A 2015-03-18 2015-03-18 テキスト可視化システム、テキスト可視化方法、及び、プログラム Active JP6508327B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/001510 WO2016147219A1 (ja) 2015-03-18 2015-03-18 テキスト可視化システム、テキスト可視化方法、及び、記録媒体

Publications (2)

Publication Number Publication Date
JPWO2016147219A1 true JPWO2016147219A1 (ja) 2017-12-21
JP6508327B2 JP6508327B2 (ja) 2019-05-08

Family

ID=56918427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017505747A Active JP6508327B2 (ja) 2015-03-18 2015-03-18 テキスト可視化システム、テキスト可視化方法、及び、プログラム

Country Status (3)

Country Link
US (1) US10489514B2 (ja)
JP (1) JP6508327B2 (ja)
WO (1) WO2016147219A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6885211B2 (ja) * 2017-06-19 2021-06-09 富士通株式会社 情報分析装置、情報分析方法および情報分析プログラム
JP7404713B2 (ja) 2018-12-18 2023-12-26 富士電機株式会社 対応提示装置および対応提示方法
JP7118037B2 (ja) * 2019-07-30 2022-08-15 株式会社日立製作所 テキストデータ解析システム、テキストデータ解析方法、および故障対応リコメンドシステム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108894A (ja) * 2000-09-27 2002-04-12 Ricoh Co Ltd 文書分類装置、文書分類方法及び該方法を実行するための記録媒体
WO2008146456A1 (ja) * 2007-05-28 2008-12-04 Panasonic Corporation 情報探索支援方法および情報探索支援装置
JP2011118869A (ja) * 2009-10-30 2011-06-16 Toshiba Corp 代表文抽出装置およびプログラム
JP2012073804A (ja) * 2010-09-28 2012-04-12 Toshiba Corp キーワード提示装置、方法及びプログラム
JP5494999B1 (ja) * 2012-04-26 2014-05-21 日本電気株式会社 テキストマイニングシステム、テキストマイニング方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7269546B2 (en) * 2001-05-09 2007-09-11 International Business Machines Corporation System and method of finding documents related to other documents and of finding related words in response to a query to refine a search
JP2003216222A (ja) 2002-01-22 2003-07-31 Mitsubishi Electric Corp 組立・調整・検査工程の情報管理装置および情報管理方法
US8554542B2 (en) * 2010-05-05 2013-10-08 Xerox Corporation Textual entailment method for linking text of an abstract to text in the main body of a document
US20130332450A1 (en) * 2012-06-11 2013-12-12 International Business Machines Corporation System and Method for Automatically Detecting and Interactively Displaying Information About Entities, Activities, and Events from Multiple-Modality Natural Language Sources
US20140372102A1 (en) * 2013-06-18 2014-12-18 Xerox Corporation Combining temporal processing and textual entailment to detect temporally anchored events

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108894A (ja) * 2000-09-27 2002-04-12 Ricoh Co Ltd 文書分類装置、文書分類方法及び該方法を実行するための記録媒体
WO2008146456A1 (ja) * 2007-05-28 2008-12-04 Panasonic Corporation 情報探索支援方法および情報探索支援装置
JP2011118869A (ja) * 2009-10-30 2011-06-16 Toshiba Corp 代表文抽出装置およびプログラム
JP2012073804A (ja) * 2010-09-28 2012-04-12 Toshiba Corp キーワード提示装置、方法及びプログラム
JP5494999B1 (ja) * 2012-04-26 2014-05-21 日本電気株式会社 テキストマイニングシステム、テキストマイニング方法及びプログラム

Also Published As

Publication number Publication date
JP6508327B2 (ja) 2019-05-08
WO2016147219A1 (ja) 2016-09-22
US20180089181A1 (en) 2018-03-29
US10489514B2 (en) 2019-11-26

Similar Documents

Publication Publication Date Title
US11216453B2 (en) Data visualization in a dashboard display using panel templates
CN105573966B (zh) 电子表格中所呈现的内容的自适应修改
US9842102B2 (en) Automatic ontology generation for natural-language processing applications
CN109308254B (zh) 一种测试方法、装置及测试设备
JP2015036945A (ja) 質問回答制御プログラム、質問回答制御サーバ及び質問回答制御方法
US20150077419A1 (en) Visualization of data related to unstructured text
US20150120302A1 (en) Method and system for performing term analysis in social data
US20090249248A1 (en) User directed refinement of search results while preserving the scope of the initial search
US20210263916A1 (en) Systems and methods for automated pattern matching
AU2017216520A1 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
US20180285746A1 (en) Dashboard Usage Tracking and Generation of Dashboard Recommendations
JP2021523492A (ja) 検索動作出力要素のアクションインジケータ
US20150081690A1 (en) Network sourced enrichment and categorization of media content
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
CN107408105A (zh) 有条件受控加样式
WO2016147219A1 (ja) テキスト可視化システム、テキスト可視化方法、及び、記録媒体
JP6536671B2 (ja) テキスト可視化システム、テキスト可視化方法、及び、プログラム
KR102349495B1 (ko) 가상 서버들로부터 대용량 로그 파일들을 프로세싱하는 컴퓨터 시스템 및 방법.
US20150006578A1 (en) Dynamic search system
US11106864B2 (en) Comment-based article augmentation
JP2019053763A (ja) テキスト可視化システム、テキスト可視化方法、及び、プログラム
US10572560B2 (en) Detecting relevant facets by leveraging diagram identification, social media and statistical analysis software
JP6954426B2 (ja) テキスト監視システム、テキスト監視方法、及び、プログラム
CN109101473B (zh) 用于处理二维数据表的方法和装置
US20150046439A1 (en) Determining Recommendations In Data Analysis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190318

R150 Certificate of patent or registration of utility model

Ref document number: 6508327

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150