JP2019164593A - Text mining method, text mining program, and text mining device - Google Patents

Text mining method, text mining program, and text mining device Download PDF

Info

Publication number
JP2019164593A
JP2019164593A JP2018052074A JP2018052074A JP2019164593A JP 2019164593 A JP2019164593 A JP 2019164593A JP 2018052074 A JP2018052074 A JP 2018052074A JP 2018052074 A JP2018052074 A JP 2018052074A JP 2019164593 A JP2019164593 A JP 2019164593A
Authority
JP
Japan
Prior art keywords
occurrence
word
screen
text data
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018052074A
Other languages
Japanese (ja)
Other versions
JP2019164593A5 (en
JP6987003B2 (en
Inventor
未希 柿ノ木
Miki Kakinoki
未希 柿ノ木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2018052074A priority Critical patent/JP6987003B2/en
Priority to KR1020190013093A priority patent/KR102162779B1/en
Priority to CN201910096738.5A priority patent/CN110309290B/en
Priority to TW108106540A priority patent/TWI703457B/en
Publication of JP2019164593A publication Critical patent/JP2019164593A/en
Publication of JP2019164593A5 publication Critical patent/JP2019164593A5/ja
Application granted granted Critical
Publication of JP6987003B2 publication Critical patent/JP6987003B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)

Abstract

To display a screen including a co-occurrence network by simple operation when designating an attention word.SOLUTION: A text mining method includes: a step for extracting a word from text data; a step for generating a co-occurrence matrix for the extracted word; a step for generating a co-occurrence network on the basis of the generated co-occurrence matrix; and a step for displaying a screen including the generated co-occurrence network. When an instruction for designating an attention word is input in a first screen including a first co-occurrence network on the basis of the whole of the designated text data, the text mining method extracts the word from limited text data constituted of a part including the attention word among the designated text data, generates a second co-occurrence matrix by using the limited text data for the extracted word, generates a second co-occurrence network on the basis of the second co-occurrence matrix, and displays a second screen including the second co-occurrence network.SELECTED DRAWING: Figure 3

Description

本発明は、テキストマイニングに関し、特に、単語の共起ネットワークを含む画面を表示するテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置に関する。   The present invention relates to text mining, and more particularly to a text mining method, a text mining program, and a text mining apparatus that display a screen including a word co-occurrence network.

近年、自由記述されたテキストデータを分析し、分析結果から有用な情報を求めるテキストマイニングが注目されている。テキストマイニングでは、例えば、分析対象のテキストデータから単語を抽出し、単語の出現頻度や出現傾向などを解析することにより、情報を求める。   In recent years, text mining that analyzes free-written text data and obtains useful information from the analysis results has attracted attention. In text mining, for example, a word is extracted from text data to be analyzed, and information is obtained by analyzing the appearance frequency and appearance tendency of the word.

自由記述されたテキストデータを分析するときには、分析者は、初期段階では対象を主観的に選択するのではなく、テキストデータの全体像を把握する必要がある。このため、分析者は、テキストデータに含まれる単語の共起ネットワークを用いることがある。   When analyzing freely described text data, an analyst needs to grasp the whole image of text data instead of subjectively selecting an object in the initial stage. For this reason, an analyst may use a co-occurrence network of words included in text data.

図19は、共起ネットワークの例を示す図である。共起ネットワークは、テキストデータから同じ文に含まれることが多い単語のペアを抽出し、その結果を無向グラフで表現したものである。分析対象のテキストデータにおいて単語Waと単語Wbが同じ文に含まれることが多い場合、共起ネットワークには、単語Waに対応するノード、単語Wbに対応するノード、および、両者を接続するエッジが含まれる。図19に示す共起ネットワークは、「スタッフ」に対応するノード、「対応」に対応するノード、および、両者を接続するエッジを含んでいる。図19に示す共起ネットワークを見れば、分析対象のテキストデータでは「スタッフ」と「対応」が同じ文に含まれることが多いことが分かる。   FIG. 19 is a diagram illustrating an example of a co-occurrence network. The co-occurrence network extracts word pairs that are often included in the same sentence from text data, and expresses the result as an undirected graph. When the word Wa and the word Wb are often included in the same sentence in the text data to be analyzed, the co-occurrence network includes a node corresponding to the word Wa, a node corresponding to the word Wb, and an edge connecting the two. included. The co-occurrence network shown in FIG. 19 includes a node corresponding to “staff”, a node corresponding to “correspondence”, and an edge connecting both. From the co-occurrence network shown in FIG. 19, it is understood that “staff” and “correspondence” are often included in the same sentence in the text data to be analyzed.

一般に、共起ネットワークは、指定されたテキストデータの全体に基づき生成される。以下、このような共起ネットワークを「全体共起ネットワーク」という。分析者は、自分が立てた仮説や分析目的に応じて全体共起ネットワークから注目すべき単語(以下、注目語という)を複数個選択し、注目語を考慮して以降の分析を行う。   In general, the co-occurrence network is generated based on the entire designated text data. Hereinafter, such a co-occurrence network is referred to as an “overall co-occurrence network”. The analyst selects a plurality of words (hereinafter referred to as attention words) to be noticed from the entire co-occurrence network according to the hypothesis and analysis purpose that he / she has established, and performs subsequent analysis in consideration of the attention words.

分析者は、注目語を選択するときに、選択した注目語が分析目的などに適しているか否かを判断するために、注目語を含む文の中で注目語がどのように使われているかを考察する。このため、分析者は、指定されたテキストデータのうち注目語を含む文からなるテキストデータ(以下、限定テキストデータという)に基づく共起ネットワークを用いることがある。なお、ここで言う「注目語を含む文」は、注目語を含む単一の文を意味する場合だけでなく、注目語を含む文を包含する段落など、ブロック単位に分割された複数の文(文の集合)を意味する場合がある。以下、このような共起ネットワークを「限定共起ネットワーク」という。分析者は、限定共起ネットワークを用いることにより、限定テキストデータの内容を把握することができる。分析者は、すべての注目語を選択するまで、全体共起ネットワークと限定共起ネットワークを繰り返し参照する。   When an analyst selects an attention word, how the attention word is used in a sentence including the attention word to determine whether the selected attention word is suitable for the purpose of analysis, etc. Is considered. For this reason, an analyst may use a co-occurrence network based on text data (hereinafter referred to as limited text data) composed of a sentence including a noticed word among designated text data. Note that the “sentence containing the attention word” here refers not only to a single sentence including the attention word, but also to a plurality of sentences divided into block units, such as paragraphs including the sentence including the attention word. It may mean (a set of sentences). Hereinafter, such a co-occurrence network is referred to as a “limited co-occurrence network”. The analyst can grasp the contents of the limited text data by using the limited co-occurrence network. The analyst repeatedly refers to the global co-occurrence network and the limited co-occurrence network until all attention words are selected.

以下、テキストデータに含まれる単語の共起ネットワークを生成し、生成した共起ネットワークを含む画面を表示するテキストマイニング装置について考える。特許文献1には、複数の文書のそれぞれについて全体共起ネットワークを生成し、生成した複数の全体共起ネットワークを含む画面を表示するドキュメントデータベース表示装置が記載されている。この表示装置は、複数の全体共起ネットワークの中から利用者が入力した単語を検索し、検索した単語を画面内で強調表示する。   Hereinafter, a text mining device that generates a co-occurrence network of words included in text data and displays a screen including the generated co-occurrence network will be considered. Patent Document 1 describes a document database display device that generates a global co-occurrence network for each of a plurality of documents and displays a screen including the generated global co-occurrence networks. This display device searches for a word input by the user from a plurality of global co-occurrence networks, and highlights the searched word on the screen.

特開平8−314980号公報JP-A-8-314980

従来のテキストマイニング装置は、指定されたテキストデータの全体に基づき共起ネットワークを生成する。したがって、従来のテキストマイニング装置によれば、全体共起ネットワークを含む画面を容易に表示することができる。   A conventional text mining device generates a co-occurrence network based on the entire designated text data. Therefore, according to the conventional text mining device, a screen including the entire co-occurrence network can be easily displayed.

一方、従来のテキストマイニング装置を用いて限定共起ネットワークを含む画面を表示するときには、分析者は煩雑な操作を行う必要がある。具体的には、分析者は、全体共起ネットワークの中から1個の注目語を選択するたびに、指定されたテキストデータに基づき限定テキストデータを生成し、生成した限定テキストデータをテキストマイニング装置に与える必要がある。また、分析者は、注目語を選択するときに、全体共起ネットワークと限定共起ネットワークの両方を参照する。このため、テキストマイニング装置は、全体共起ネットワークの画像データと限定共起ネットワークの画像データの両方を保存する必要がある。しかし、多くの共起ネットワークを生成した場合、画像データの保存と管理が困難になる。   On the other hand, when displaying a screen including a limited co-occurrence network using a conventional text mining device, the analyst needs to perform a complicated operation. Specifically, each time an analyst selects one attention word from the entire co-occurrence network, the analyst generates limited text data based on the specified text data, and the generated limited text data is converted into a text mining device. Need to give to. Also, the analyst refers to both the global co-occurrence network and the limited co-occurrence network when selecting the attention word. For this reason, the text mining device needs to store both the image data of the entire co-occurrence network and the image data of the limited co-occurrence network. However, when many co-occurrence networks are generated, it becomes difficult to store and manage image data.

それ故に、本発明は、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示できるテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置を提供することを目的とする。   Therefore, an object of the present invention is to provide a text mining method, a text mining program, and a text mining device that can display a screen including a co-occurrence network when an attention word is designated by a simple operation.

本発明の第1の局面は、テキストデータの分析結果を含む画面を表示するテキストマイニング方法であって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
A first aspect of the present invention is a text mining method for displaying a screen including an analysis result of text data,
Extracting words from text data;
Generating a co-occurrence matrix for the word;
Generating a co-occurrence network based on the co-occurrence matrix;
Displaying a screen including the co-occurrence network,
The step of extracting the word when the instruction to specify the attention word is input in the first screen including the first co-occurrence network based on the whole of the specified text data includes the step of extracting the word from the specified text data. The step of extracting the word from the limited text data including the part including the attention word and generating the co-occurrence matrix generates a second co-occurrence matrix using the limited text data for the word, The generating step generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network.

本発明の第2の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
According to a second aspect of the present invention, in the first aspect of the present invention,
By selecting one or a plurality of nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction for designating a word corresponding to the node as the attention word is input. It is characterized by that.

本発明の第3の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
According to a third aspect of the present invention, in the first aspect of the present invention,
By sequentially selecting one node included in the first co-occurrence network in the first screen, an instruction for designating a word corresponding to the node as the attention word is input. .

本発明の第4の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
According to a fourth aspect of the present invention, in the first aspect of the present invention,
An instruction for designating a word corresponding to two nodes connected to the edge as the attention word by successively selecting one edge included in the first co-occurrence network in the first screen. It is input.

本発明の第5の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
According to a fifth aspect of the present invention, in the first aspect of the present invention,
By selecting one or a plurality of edges included in the first co-occurrence network in the first screen and selecting start analysis, words corresponding to a plurality of nodes connected to the edges are selected as the attention word. An instruction to designate as is input.

本発明の第6の局面は、本発明の第1の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
According to a sixth aspect of the present invention, in the first aspect of the present invention,
The step of displaying the screen when a merge instruction is input in a second screen including a plurality of second co-occurrence networks includes displaying the plurality of second co-occurrence networks in a tab format. .

本発明の第7の局面は、本発明の第6の局面において、
前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする。
A seventh aspect of the present invention is the sixth aspect of the present invention,
The merging instruction is input by grasping one second co-occurrence network in the second screen and releasing it in another second co-occurrence network.

本発明の第8の局面は、本発明の第1の局面において、
前記限定テキストデータは、前記指定されたテキストデータのうち前記注目語を含む文からなることを特徴とする。
According to an eighth aspect of the present invention, in the first aspect of the present invention,
The limited text data includes a sentence including the attention word in the designated text data.

本発明の第9の局面は、本発明の第8の局面において、
複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のすべてを含む文からなることを特徴とする。
A ninth aspect of the present invention is the eighth aspect of the present invention,
The limited text data when a plurality of attention words are designated is characterized by comprising a sentence including all of the plurality of attention words in the designated text data.

本発明の第10の局面は、本発明の第8の局面において、
複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のいずれかを含む文からなることを特徴とする。
A tenth aspect of the present invention is the eighth aspect of the present invention,
The limited text data when a plurality of attention words are designated is composed of a sentence including any of the plurality of attention words in the designated text data.

本発明の第11の局面は、本発明の第1の局面において、
前記共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成することを特徴とする。
According to an eleventh aspect of the present invention, in the first aspect of the present invention,
The step of generating the co-occurrence matrix generates a co-occurrence matrix having a Jaccard coefficient as an element.

本発明の第12の局面は、テキストデータの分析結果を含む画面を表示するためのテキストマイニングプログラムであって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとをコンピュータにCPUがメモリを利用して実行させ、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
A twelfth aspect of the present invention is a text mining program for displaying a screen including an analysis result of text data,
Extracting words from text data;
Generating a co-occurrence matrix for the word;
Generating a co-occurrence network based on the co-occurrence matrix;
And causing the computer to execute a step of displaying a screen including the co-occurrence network using a memory,
The step of extracting the word when the instruction to specify the attention word is input in the first screen including the first co-occurrence network based on the whole of the specified text data includes the step of extracting the word from the specified text data. The step of extracting the word from the limited text data including the part including the attention word and generating the co-occurrence matrix generates a second co-occurrence matrix using the limited text data for the word, The generating step generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network.

本発明の第13の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
A thirteenth aspect of the present invention is the twelfth aspect of the present invention,
By selecting one or a plurality of nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction for designating a word corresponding to the node as the attention word is input. It is characterized by that.

本発明の第14の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
A fourteenth aspect of the present invention is the twelfth aspect of the present invention,
By sequentially selecting one node included in the first co-occurrence network in the first screen, an instruction for designating a word corresponding to the node as the attention word is input. .

本発明の第15の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
A fifteenth aspect of the present invention is the twelfth aspect of the present invention,
An instruction for designating a word corresponding to two nodes connected to the edge as the attention word by successively selecting one edge included in the first co-occurrence network in the first screen. It is input.

本発明の第16の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
A sixteenth aspect of the present invention is the twelfth aspect of the present invention,
By selecting one or a plurality of edges included in the first co-occurrence network in the first screen and selecting start analysis, words corresponding to a plurality of nodes connected to the edges are selected as the attention word. An instruction to designate as is input.

本発明の第17の局面は、本発明の第12の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
A seventeenth aspect of the present invention is the twelfth aspect of the present invention,
The step of displaying the screen when a merge instruction is input in a second screen including a plurality of second co-occurrence networks includes displaying the plurality of second co-occurrence networks in a tab format. .

本発明の第18の局面は、本発明の第17の局面において、
前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする。
According to an eighteenth aspect of the present invention, in an seventeenth aspect of the present invention,
The merging instruction is input by grasping one second co-occurrence network in the second screen and releasing it in another second co-occurrence network.

本発明の第19の局面は、テキストデータの分析結果を含む画面を表示するテキストマイニング装置であって、
テキストデータから単語を抽出する単語抽出部と、
前記単語について共起行列を生成する共起行列生成部と、
前記共起行列に基づき共起ネットワークを生成する共起ネットワーク生成部と、
前記共起ネットワークを含む画面を表示する画面表示部とを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語抽出部は前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列生成部は前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワーク生成部は前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面表示部は前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
A nineteenth aspect of the present invention is a text mining device that displays a screen including an analysis result of text data,
A word extraction unit for extracting words from text data;
A co-occurrence matrix generator for generating a co-occurrence matrix for the word;
A co-occurrence network generation unit that generates a co-occurrence network based on the co-occurrence matrix;
A screen display unit for displaying a screen including the co-occurrence network,
When an instruction for designating a word of interest is input in the first screen including the first co-occurrence network based on the whole of the designated text data, the word extraction unit extracts the word of interest from the designated text data The co-occurrence matrix generation unit generates a second co-occurrence matrix using the limited text data for the word, and the co-occurrence network generation unit A second co-occurrence network is generated based on a two-co-occurrence matrix, and the screen display unit displays a second screen including the second co-occurrence network.

本発明の第20の局面は、本発明の第19の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面表示部は、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
According to a twentieth aspect of the present invention, in a nineteenth aspect of the present invention,
When a merge instruction is input within a second screen including a plurality of second co-occurrence networks, the screen display unit displays the plurality of second co-occurrence networks in a tab format.

上記第1、第12または第19の局面によれば、指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、指定されたテキストデータのうち注目語を含む部分に基づく第2共起ネットワークを含む第2画面が表示される。したがって、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。   According to the first, twelfth, or nineteenth aspect, the designation is made when an instruction for designating the attention word is input in the first screen including the first co-occurrence network based on the entire designated text data. A second screen including the second co-occurrence network based on the portion including the attention word in the text data thus displayed is displayed. Therefore, the screen including the co-occurrence network when the attention word is designated can be displayed with a simple operation.

上記第2または第13の局面によれば、第1画面内で1個または複数のノードと分析開始を選択することにより、1個または複数の注目語を指定する指示を簡単な操作で入力し、1個または複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。   According to the second or thirteenth aspect, by selecting one or a plurality of nodes and analysis start in the first screen, an instruction for designating one or a plurality of attention words is input by a simple operation. A screen including a co-occurrence network when one or more attention words are designated can be displayed.

上記第3または第14の局面によれば、第1画面内で1個のノード続けて選択することにより、1個の注目語を指定する指示を簡単な操作で入力し、1個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。   According to the third or fourteenth aspect, by selecting one node in succession in the first screen, an instruction for designating one attention word is input by a simple operation, and one attention word The screen including the co-occurrence network can be displayed.

上記第4または第15の局面によれば、第1画面内で1本のエッジを続けて選択することにより、2個の注目語を指定する指示を簡単な操作で入力し、2個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。   According to the fourth or fifteenth aspect, an instruction for designating two attention words is input by a simple operation by continuously selecting one edge in the first screen, and two attentions are given. A screen including a co-occurrence network when a word is specified can be displayed.

上記第5または第16の局面によれば、第1画面内で1本または複数のエッジと分析開始を選択することにより、複数の注目語を指定する指示を簡単な操作で入力し、複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。   According to the fifth or sixteenth aspect, by selecting one or more edges and analysis start in the first screen, an instruction for designating a plurality of attention words can be input by a simple operation, A screen including the co-occurrence network when the attention word is designated can be displayed.

上記第6、第17または第20の局面によれば、併合指示が入力されたときに複数の第2共起ネットワークをタブ形式で表示することにより、複数の第2共起ネットワークをコンパクトに表示することができる。   According to the sixth, seventeenth, or twentieth aspect, a plurality of second co-occurrence networks are displayed in a compact manner by displaying the plurality of second co-occurrence networks in a tab format when a merge instruction is input. can do.

上記第7または第18の局面によれば、第2画面内で第2共起ネットワークを掴んで離すことにより、併合指示を簡単な操作で入力し、複数の第2共起ネットワークをコンパクトに表示することができる。   According to the seventh or eighteenth aspect, by holding and releasing the second co-occurrence network in the second screen, a merge instruction can be input with a simple operation, and a plurality of second co-occurrence networks can be displayed in a compact manner. can do.

上記第8の局面によれば、注目語を指定する指示が入力されたときに、指定されたテキストデータを文単位で分けて限定テキストデータを求め、求めた限定テキストデータに基づく第2共起ネットワークを含む画面を表示することができる。   According to the eighth aspect, when an instruction for designating an attention word is input, the designated text data is divided into sentence units to obtain limited text data, and the second co-occurrence based on the obtained limited text data A screen including the network can be displayed.

上記第9または第10の局面によれば、複数の注目語についてAND処理またはOR処理を行ったときの第2共起ネットワークを含む画面を表示することができる。   According to the ninth or tenth aspect, it is possible to display a screen including the second co-occurrence network when AND processing or OR processing is performed on a plurality of attention words.

上記第11の局面によれば、Jaccard係数を要素とする共起行列を生成することにより、テキストデータに含まれる単語の共起性を好適に分析することができる。   According to the eleventh aspect, by generating a co-occurrence matrix having Jaccard coefficients as elements, it is possible to suitably analyze the co-occurrence of words included in text data.

本発明の実施形態に係るテキストマイニング装置の構成を示すブロック図である。It is a block diagram which shows the structure of the text mining device which concerns on embodiment of this invention. 図1に示すテキストマイニング装置として機能するコンピュータの構成を示すブロック図である。It is a block diagram which shows the structure of the computer which functions as a text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置で生成される共起行列の例を示す図である。It is a figure which shows the example of the co-occurrence matrix produced | generated with the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置が表示する全体共起ネットワークを含むウインドウの例を示す図である。It is a figure which shows the example of the window containing the whole co-occurrence network which the text mining apparatus shown in FIG. 1 displays. 図5に示すウインドウ内で注目語を指定する第1の操作を示す図である。It is a figure which shows 1st operation which designates an attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第2の操作を示す図である。It is a figure which shows 2nd operation which designates an attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第3の操作を示す図である。It is a figure which shows 3rd operation which designates an attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第4の操作を示す図である。It is a figure which shows 4th operation which designates an attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第5の操作を示す図である。It is a figure which shows 5th operation which designates an attention word within the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第6の操作を示す図である。It is a figure which shows 6th operation which designates an attention word in the window shown in FIG. 図1に示すテキストマイニング装置が表示する限定共起ネットワークを含むウインドウの例を示す図である。It is a figure which shows the example of the window containing the limited co-occurrence network which the text mining apparatus shown in FIG. 1 displays. 図1に示すテキストマイニング装置が表示する限定共起ネットワークを含むウインドウの例を示す図である。It is a figure which shows the example of the window containing the limited co-occurrence network which the text mining apparatus shown in FIG. 1 displays. 図1に示すテキストマイニング装置の表示画面の例を示す図である。It is a figure which shows the example of the display screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の表示画面の例を示す図である。It is a figure which shows the example of the display screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の表示画面の例を示す図である。It is a figure which shows the example of the display screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置におけるウインドウを併合する操作を示す図である。It is a figure which shows operation which merges the window in the text mining apparatus shown in FIG. 図17に示す操作を行った後の表示画面を示す図である。It is a figure which shows the display screen after performing operation shown in FIG. 共起ネットワークの例を示す図である。It is a figure which shows the example of a co-occurrence network.

以下、図面を参照して、本発明の実施形態に係るテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置について説明する。本実施形態に係るテキストマイニング方法は、典型的にはコンピュータを用いて実行される。本実施形態に係るテキストマイニングプログラムは、コンピュータを用いてテキストマイニング方法を実施するためのプログラムである。本実施形態に係るテキストマイニング装置は、典型的にはコンピュータを用いて構成される。テキストマイニングプログラムを実行するコンピュータは、テキストマイニング装置として機能する。   Hereinafter, a text mining method, a text mining program, and a text mining apparatus according to an embodiment of the present invention will be described with reference to the drawings. The text mining method according to the present embodiment is typically executed using a computer. The text mining program according to the present embodiment is a program for implementing a text mining method using a computer. The text mining device according to the present embodiment is typically configured using a computer. A computer that executes the text mining program functions as a text mining device.

図1は、本発明の実施形態に係るテキストマイニング装置の構成を示すブロック図である。図1に示すテキストマイニング装置10は、指示入力部11、テキストデータ記憶部12、単語抽出部13、共起行列生成部14、共起ネットワーク生成部15、および、画面表示部16を備えている。テキストマイニング装置10は、テキストデータ記憶部12に記憶されたテキストデータに基づきテキストデータの分析結果として共起ネットワークを生成し、生成した共起ネットワークを含む画面を表示する。   FIG. 1 is a block diagram showing a configuration of a text mining apparatus according to an embodiment of the present invention. A text mining apparatus 10 shown in FIG. 1 includes an instruction input unit 11, a text data storage unit 12, a word extraction unit 13, a co-occurrence matrix generation unit 14, a co-occurrence network generation unit 15, and a screen display unit 16. . The text mining device 10 generates a co-occurrence network as a text data analysis result based on the text data stored in the text data storage unit 12, and displays a screen including the generated co-occurrence network.

テキストマイニング装置10の動作の概要は、以下のとおりである。指示入力部11には、利用者(テキストデータの分析者)からの指示が入力される。テキストデータ記憶部12は、自由記述された1以上のテキストデータを記憶している。単語抽出部13は、テキストデータ記憶部12から指定されたテキストデータを読み出し、読み出したテキストデータに対して形態素解析を行うことにより、テキストデータから単語を抽出する。共起行列生成部14は、単語抽出部13で抽出された単語について共起行列を生成する。共起ネットワーク生成部15は、共起行列生成部14で生成された共起行列に基づき共起ネットワークを生成する。画面表示部16は、共起ネットワーク生成部15で生成された共起ネットワークを含む画面を表示する。   The outline of the operation of the text mining apparatus 10 is as follows. An instruction from the user (text data analyst) is input to the instruction input unit 11. The text data storage unit 12 stores one or more freely described text data. The word extraction unit 13 reads the designated text data from the text data storage unit 12 and extracts words from the text data by performing morphological analysis on the read text data. The co-occurrence matrix generation unit 14 generates a co-occurrence matrix for the words extracted by the word extraction unit 13. The co-occurrence network generation unit 15 generates a co-occurrence network based on the co-occurrence matrix generated by the co-occurrence matrix generation unit 14. The screen display unit 16 displays a screen including the co-occurrence network generated by the co-occurrence network generation unit 15.

利用者は、指示入力部11を用いて、分析対象のテキストデータを指定する指示、注目語を指定する指示などを入力する。単語抽出部13、共起ネットワーク生成部15、および、画面表示部16は、利用者からの指示に従い、共起ネットワークを含む画面を表示するための動作を行う。テキストデータを指定する指示が入力されたときには、指定されたテキストデータの全体に基づく全体共起ネットワークが生成され、全体共起ネットワークを含む画面が表示される。全体共起ネットワークを含む画面内で注目語を指定する指示が入力されたときには、指定されたテキストデータのうち注目語を含む文に基づく限定共起ネットワークが生成され、限定共起ネットワークを含む画面が表示される。   The user uses the instruction input unit 11 to input an instruction for specifying text data to be analyzed, an instruction for specifying a target word, and the like. The word extraction unit 13, the co-occurrence network generation unit 15, and the screen display unit 16 perform an operation for displaying a screen including the co-occurrence network in accordance with an instruction from the user. When an instruction to specify text data is input, an entire co-occurrence network based on the entire specified text data is generated, and a screen including the entire co-occurrence network is displayed. When an instruction to specify the attention word is input in the screen including the entire co-occurrence network, a limited co-occurrence network is generated based on the sentence including the attention word in the specified text data, and the screen includes the limited co-occurrence network. Is displayed.

図2は、テキストマイニング装置10として機能するコンピュータの構成を示すブロック図である。図2に示すコンピュータ20は、CPU21、メインメモリ22、記憶部23、入力部24、表示部25、通信部26、および、記録媒体読み取り部27を備えている。メインメモリ22には、例えば、DRAMが使用される。記憶部23には、例えば、ハードディスクやソリッドステートドライブが使用される。入力部24には、例えば、キーボード28やマウス29が含まれる。表示部25には、例えば、液晶ディスプレイが使用される。通信部26は、有線通信または無線通信のインターフェイス回路である。記録媒体読み取り部27は、プログラムなどを記憶した記録媒体30のインターフェイス回路である。記録媒体30には、例えば、CD−ROM、DVD−ROM、USBメモリなどの非一過性の記録媒体が使用される。   FIG. 2 is a block diagram illustrating a configuration of a computer that functions as the text mining apparatus 10. The computer 20 illustrated in FIG. 2 includes a CPU 21, a main memory 22, a storage unit 23, an input unit 24, a display unit 25, a communication unit 26, and a recording medium reading unit 27. For example, a DRAM is used as the main memory 22. For the storage unit 23, for example, a hard disk or a solid state drive is used. The input unit 24 includes a keyboard 28 and a mouse 29, for example. For example, a liquid crystal display is used for the display unit 25. The communication unit 26 is an interface circuit for wired communication or wireless communication. The recording medium reading unit 27 is an interface circuit of the recording medium 30 that stores programs and the like. As the recording medium 30, for example, a non-transitory recording medium such as a CD-ROM, a DVD-ROM, or a USB memory is used.

コンピュータ20がテキストマイニングプログラム31を実行する場合、記憶部23は、テキストマイニングプログラム31とテキストデータ32を記憶する。テキストマイニングプログラム31とテキストデータ32は、例えば、サーバや他のコンピュータから通信部26を用いて受信したものでもよく、記録媒体30から記録媒体読み取り部27を用いて読み出したものでもよい。   When the computer 20 executes the text mining program 31, the storage unit 23 stores the text mining program 31 and text data 32. For example, the text mining program 31 and the text data 32 may be received from a server or another computer using the communication unit 26, or may be read from the recording medium 30 using the recording medium reading unit 27.

テキストマイニングプログラム31を実行するときには、テキストマイニングプログラム31とテキストデータ32はメインメモリ22に複写転送される。CPU21は、メインメモリ22を作業用メモリとして利用して、メインメモリ22に記憶されたテキストマイニングプログラム31を実行することにより、テキストデータ32から単語を抽出する処理、抽出した単語について共起行列を生成する処理、生成した共起行列に基づき共起ネットワークを生成する処理、生成した共起ネットワークを含む画面を表示する処理などを行う。このときコンピュータ20は、テキストマイニング装置10として機能する。なお、以上に述べたコンピュータ20の構成は一例に過ぎず、任意のコンピュータを用いてテキストマイニング装置10を構成することができる。   When the text mining program 31 is executed, the text mining program 31 and the text data 32 are copied and transferred to the main memory 22. The CPU 21 uses the main memory 22 as a working memory to execute a text mining program 31 stored in the main memory 22, thereby extracting a word from the text data 32, and a co-occurrence matrix for the extracted word. Processing to generate, processing to generate a co-occurrence network based on the generated co-occurrence matrix, processing to display a screen including the generated co-occurrence network, and the like are performed. At this time, the computer 20 functions as the text mining device 10. The configuration of the computer 20 described above is merely an example, and the text mining apparatus 10 can be configured using an arbitrary computer.

図3は、テキストマイニング装置10の動作を示すフローチャートである。図3に示す動作を行う前に、テキストデータ記憶部12は自由記述された1以上のテキストデータを記憶している。各テキストデータは、複数の文を含んでいる。テキストマイニング装置10は、テキストデータ記憶部12に記憶されたテキストデータのうちで利用者が指定したテキストデータに対して処理を行う。   FIG. 3 is a flowchart showing the operation of the text mining apparatus 10. Prior to performing the operation shown in FIG. 3, the text data storage unit 12 stores one or more freely described text data. Each text data includes a plurality of sentences. The text mining device 10 performs processing on the text data specified by the user among the text data stored in the text data storage unit 12.

図3において、指示入力部11は、まず利用者からテキストデータを指定する指示を受け取る(ステップS101)。このとき、指示入力部11は、テキストデータを指定する指示に加えて、共起行列の基準値(詳細は後述)を設定する指示、AND処理とOR処理(詳細は後述)を切り替える指示、共起ネットワークの表示態様の詳細を設定する指示などを受け取ってもよい。受け取った指示は、テキストマイニング装置10の各部に対して出力される。   In FIG. 3, the instruction input unit 11 first receives an instruction for designating text data from a user (step S101). At this time, the instruction input unit 11 in addition to an instruction to specify text data, an instruction to set a reference value (details will be described later) of the co-occurrence matrix, an instruction to switch between AND processing and OR processing (details will be described later), You may receive the instruction | indication etc. which set the detail of the display aspect of the origin network. The received instruction is output to each unit of the text mining device 10.

次に、単語抽出部13は、テキストデータ記憶部12から指定されたテキストデータを読み出す(ステップS102)。次に、単語抽出部13は、ステップS102で読み出したテキストデータに対して形態素解析を行うことにより、読み出したテキストデータから単語を抽出する(ステップS103)。このとき、単語抽出部13は、読み出したテキストデータから、後の分析で必要となる単語だけを抽出する。次に、共起行列生成部14は、ステップS103で抽出された単語について、ステップS102で読み出されたテキストデータを用いて共起行列を生成する(ステップS104)。   Next, the word extraction unit 13 reads the designated text data from the text data storage unit 12 (step S102). Next, the word extraction unit 13 extracts words from the read text data by performing morphological analysis on the text data read in step S102 (step S103). At this time, the word extraction unit 13 extracts only words necessary for later analysis from the read text data. Next, the co-occurrence matrix generation unit 14 generates a co-occurrence matrix for the words extracted in step S103, using the text data read in step S102 (step S104).

図4は、共起行列生成部14で生成された共起行列の例を示す図である。共起行列の要素は、単語のペアについて求めたJaccard係数である。分析対象のテキストデータについて、単語Waを含む文の集合をA、単語Wbを含む文の集合をBとする。単語のペア(Wa,Wb)についてのJaccard係数K(Wa,Wb)は、次式(1)で与えられる。
K(Wa,Wb)=|A∩B|/|A∪B| …(1)
ただし、式(1)において、記号∩は積集合を求める演算を表し、記号∪は和集合を求める演算を表し、|S|は集合Sに含まれる要素の個数を表す。
FIG. 4 is a diagram illustrating an example of the co-occurrence matrix generated by the co-occurrence matrix generation unit 14. The elements of the co-occurrence matrix are Jaccard coefficients obtained for word pairs. For text data to be analyzed, a set of sentences including the word Wa is A, and a set of sentences including the word Wb is B. The Jaccard coefficient K (Wa, Wb) for the word pair (Wa, Wb) is given by the following equation (1).
K (Wa, Wb) = | A∩B | / | A∪B | (1)
In Equation (1), symbol ∩ represents an operation for obtaining a product set, symbol ∪ represents an operation for obtaining a union, and | S | represents the number of elements included in the set S.

共起行列生成部14は、ステップS104において、ステップS102で読み出されたテキストデータの全体から抽出された単語のペアのすべてについてJaccard係数を求め、求めたJaccard係数を要素とする共起行列を生成する。共起行列の行および列は、ステップS102で読み出されたテキストデータの全体から抽出された単語の種類に対応する。読み出されたテキストデータの全体からn種類の単語が抽出されたとき、ステップS104で生成される共起行列は、対角要素がすべて1であるn行n列の対称行列である。   In step S104, the co-occurrence matrix generation unit 14 obtains a Jaccard coefficient for all the word pairs extracted from the entire text data read in step S102, and obtains a co-occurrence matrix having the obtained Jaccard coefficient as an element. Generate. The rows and columns of the co-occurrence matrix correspond to the word types extracted from the entire text data read in step S102. When n types of words are extracted from the entire read text data, the co-occurrence matrix generated in step S104 is an n-by-n symmetric matrix whose diagonal elements are all 1.

なお、共起行列生成部14は、テキストデータを文以外の単位で分けてJaccard係数を求めてもよい。例えば、共起行列生成部14は、単語Waを含む段落の集合をA、単語Wbを含む段落の集合をBとして、式(1)に従いJaccard係数を求めてもよい。また、テキストデータに含まれる文が日付を有する場合には、共起行列生成部14は、テキストデータを同じ日付を有する文からなる複数の部分に分け、単語Waを含む部分の集合をA、単語Wbを含む部分の集合をBとして、式(1)に従いJaccard係数を求めてもよい。また、共起行列生成部14は、単語の共起性を示す他の値(例えば、Simpson係数やコサイン距離など)を要素として含む共起行列を生成してもよい。   Note that the co-occurrence matrix generation unit 14 may obtain the Jaccard coefficient by dividing the text data into units other than sentences. For example, the co-occurrence matrix generation unit 14 may obtain the Jaccard coefficient according to Equation (1), where A is a set of paragraphs including the word Wa and B is a set of paragraphs including the word Wb. When the sentence included in the text data has a date, the co-occurrence matrix generation unit 14 divides the text data into a plurality of parts including sentences having the same date, and sets a set of parts including the word Wa as A, A set of portions including the word Wb may be B, and the Jaccard coefficient may be obtained according to the equation (1). In addition, the co-occurrence matrix generation unit 14 may generate a co-occurrence matrix that includes other values indicating the co-occurrence of words (for example, a Simpson coefficient, a cosine distance, and the like) as elements.

次に、共起ネットワーク生成部15は、ステップS104で生成された共起行列に基づき、全体共起ネットワークを生成する(ステップS105)。次に、画面表示部16は、ステップS105で生成された全体共起ネットワークを含む画面を表示する(ステップS106)。図5は、ステップS106で表示される、全体共起ネットワークを含むウインドウの例を示す図である。図5に示すウインドウ41は、全体共起ネットワーク51と分析ボタン61を含んでいる。分析ボタン61は、分析開始を指示するために設けられる。   Next, the co-occurrence network generation unit 15 generates an entire co-occurrence network based on the co-occurrence matrix generated in step S104 (step S105). Next, the screen display unit 16 displays a screen including the entire co-occurrence network generated in step S105 (step S106). FIG. 5 is a diagram showing an example of a window including the entire co-occurrence network displayed in step S106. A window 41 shown in FIG. 5 includes an entire co-occurrence network 51 and an analysis button 61. The analysis button 61 is provided for instructing the start of analysis.

共起ネットワーク生成部15は、共起行列の基準値(以下、Vとする)を有している。基準値Vは、予め決定された値でもよく、指示入力部11を用いて利用者から設定された値でもよい。ステップS104で生成された共起行列において、単語Waに対応する行に含まれるJaccard係数K(Wa,*)の最大値が基準値V以上である場合、共起ネットワーク生成部15は単語Waに対応するノード(単語Waと記載したノード)を全体共起ネットワークに含める。また、ステップS104で生成された共起行列において、単語のペア(Wa,Wb)に係るJaccard係数K(Wa,Wb)が基準値V以上である場合、共起ネットワーク生成部15は単語Waに対応するノードと単語Wbに対応するノードとを接続するエッジを全体共起ネットワークに含める。   The co-occurrence network generation unit 15 has a co-occurrence matrix reference value (hereinafter referred to as V). The reference value V may be a predetermined value or a value set by the user using the instruction input unit 11. In the co-occurrence matrix generated in step S104, if the maximum value of the Jaccard coefficient K (Wa, *) included in the row corresponding to the word Wa is equal to or greater than the reference value V, the co-occurrence network generation unit 15 sets the word Wa. The corresponding node (the node described as word Wa) is included in the entire co-occurrence network. In the co-occurrence matrix generated in step S104, if the Jaccard coefficient K (Wa, Wb) relating to the word pair (Wa, Wb) is greater than or equal to the reference value V, the co-occurrence network generation unit 15 adds the word Wa. An edge connecting the corresponding node and the node corresponding to the word Wb is included in the entire co-occurrence network.

図5に示す全体共起ネットワーク51では、出現頻度が大きい単語に対応するノードは大きく表示されている。共起ネットワークを含む画面を表示するときに、Jaccard係数K(Wa,Wb)が大きいときに、単語Waに対応するノードと単語Wbに対応するノードとを接続するエッジを太く表示してもよい。また、Jaccard係数に応じて、エッジの色を切り替えてもよく、エッジの太さと色の両方を切り替えてもよい。共起ネットワークは、エッジを介して到達可能な複数の部分に分けられる。共起ネットワークを含む画面を表示するときに、各部分に含まれる複数のノードを各部分に割り当てた色で表示してもよい。なお、共起ネットワークに含まれるノードとエッジの位置に意味はない。   In the entire co-occurrence network 51 shown in FIG. 5, nodes corresponding to words having a high appearance frequency are displayed large. When the screen including the co-occurrence network is displayed, when the Jaccard coefficient K (Wa, Wb) is large, the edge connecting the node corresponding to the word Wa and the node corresponding to the word Wb may be displayed thickly. . Further, the color of the edge may be switched according to the Jaccard coefficient, or both the thickness and the color of the edge may be switched. A co-occurrence network is divided into a plurality of parts that can be reached through the edge. When a screen including a co-occurrence network is displayed, a plurality of nodes included in each part may be displayed in a color assigned to each part. Note that the positions of nodes and edges included in the co-occurrence network are meaningless.

次に、指示入力部11は、利用者から注目語を指定する指示を受け取る(ステップS111)。ステップS111を実行するときには、全体共起ネットワークを含む画面が表示されている。利用者は、マウス29を操作して、全体共起ネットワークの要素を選択することにより、注目語を指定する指示を入力する。なお、利用者は、指示を入力するときに、マウス29に代えてキーボード28を用いてもよく、表示画面に直接触れるなどの操作を行ってもよい。以下、ステップS111を実行するときに、図5に示すウインドウ41を含む画面が表示されているとする。   Next, the instruction input unit 11 receives an instruction for designating the attention word from the user (step S111). When executing step S111, a screen including the entire co-occurrence network is displayed. The user operates the mouse 29 to select an element of the entire co-occurrence network, thereby inputting an instruction for designating the attention word. Note that the user may use the keyboard 28 instead of the mouse 29 when inputting an instruction, or may perform an operation such as directly touching the display screen. Hereinafter, it is assumed that a screen including the window 41 shown in FIG. 5 is displayed when step S111 is executed.

図6〜図11は、それぞれ、ウインドウ41内で注目語を指定する第1〜第6の操作を示す図である。図6〜図11において、吹き出しは操作の手順を示し、白い矢印はマウスカーソル62の移動を示す。吹き出しおよび矢印は、実際の画面には表示されない。以下、マウスカーソル62が表示画面内のある要素の上にあるときにマウス29のボタンをクリック(ダブルクリック)することを「要素をクリック(ダブルクリック)する」という。   6 to 11 are diagrams showing first to sixth operations for designating a word of interest in the window 41, respectively. 6 to 11, balloons indicate the operation procedure, and white arrows indicate the movement of the mouse cursor 62. Balloons and arrows are not displayed on the actual screen. Hereinafter, clicking (double-clicking) the button of the mouse 29 when the mouse cursor 62 is on a certain element in the display screen is referred to as “clicking (double-clicking) the element”.

図6に示すように、利用者は、ウインドウ41内でまず注目語として指定する単語(ここでは「露天風呂」)に対応するノードをクリックし(1回目のクリック)、次に分析ボタン61をクリックする(2回目のクリック)。この操作により、1回目にクリックされたノードに対応する単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のノードを選択し、分析開始を選択することにより、1個の注目語を指定する指示が入力される。   As shown in FIG. 6, the user first clicks a node corresponding to a word (here, “open-air bath”) designated as an attention word in the window 41 (first click), and then clicks the analysis button 61. Click (second click). By this operation, the word corresponding to the node clicked for the first time is designated as the attention word. In this way, by selecting one node included in the entire co-occurrence network on the screen including the entire co-occurrence network and selecting the start of analysis, an instruction for designating one attention word is input.

図7に示すように、利用者は、ウインドウ41内で注目語として指定する単語(ここでは「露天風呂」)に対応するノードをダブルクリックする。この操作により、ダブルクリックされたノードに対応する単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のノードを続けて選択することにより、1個の注目語を指定する指示が入力される。   As shown in FIG. 7, the user double-clicks a node corresponding to a word (here, “open-air bath”) designated as the attention word in the window 41. By this operation, the word corresponding to the double-clicked node is designated as the attention word. In this way, by successively selecting one node included in the entire co-occurrence network on the screen including the entire co-occurrence network, an instruction for designating one attention word is input.

図8に示すように、利用者は、ウインドウ41内でまず注目語として指定する単語(ここでは「露天風呂」)に対応するノードをクリックし(1回目のクリック)、次に注目語として指定する別の単語(ここでは「値段」)に対応するノードをクリックし(2回目のクリック)、最後に分析ボタン61をクリックする(最後のクリック)。この操作により、1回目と2回目にクリックされたノードに対応する2個の単語が注目語として指定される。利用者は、ウインドウ41内でp個(pは3以上の整数)のノードを順にクリックし、最後に分析ボタン61をクリックしてもよい。この操作により、p個のノードに対応するp個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる複数のノードを選択し、分析開始を選択することにより、複数の注目語を指定する指示が入力される。   As shown in FIG. 8, the user first clicks the node corresponding to the word (here, “open-air bath”) designated as the attention word in the window 41 (first click), and then designates it as the attention word. Click the node corresponding to another word (here “price”) (second click), and finally click the analysis button 61 (last click). By this operation, two words corresponding to the node clicked for the first time and the second time are designated as attention words. The user may sequentially click p nodes (p is an integer of 3 or more) in the window 41 and finally click the analysis button 61. By this operation, p words corresponding to p nodes are designated as attention words. In this way, by selecting a plurality of nodes included in the global co-occurrence network on the screen including the global co-occurrence network and selecting the start of analysis, an instruction for designating a plurality of attention words is input.

図9に示すように、利用者は、ウインドウ41内で注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをダブルクリックする。これにより、ダブルクリックされたエッジに接続された2個のノードに対応する2個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のエッジを続けて選択することにより、2個の注目語を指定する指示が入力される。   As shown in FIG. 9, the user double-clicks an edge connecting two nodes corresponding to two words (here, “open-air bath” and “stairs”) designated as attention words in the window 41. To do. Thus, two words corresponding to the two nodes connected to the double-clicked edge are designated as the attention word. In this way, by successively selecting one edge included in the entire co-occurrence network on the screen including the entire co-occurrence network, an instruction for designating two attention words is input.

図10に示すように、利用者は、ウインドウ41内でまず注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをクリックし(1回目のクリック)、次に分析ボタン61をクリックする(2回目のクリック)。これにより、1回目にクリックされたエッジに接続された2個のノードに対応する2個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のエッジを選択し、分析開始を選択することにより、2個の注目語を指定する指示が入力される。   As shown in FIG. 10, the user first clicks an edge connecting two nodes corresponding to two words (here, “open-air bath” and “stairs”) designated as attention words in the window 41. (First click), and then click the analysis button 61 (second click). As a result, two words corresponding to the two nodes connected to the edge clicked for the first time are designated as attention words. In this way, by selecting one edge included in the global co-occurrence network in the screen including the global co-occurrence network and selecting the start of analysis, an instruction for designating two attention words is input.

図11に示すように、利用者は、ウインドウ41内でまず注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをクリックし(1回目のクリック)、次に注目語として指定する別の2個の単語(ここでは「値段」と「考える」)に対応する2個のノードを接続するエッジをクリックし(2回目のクリック)、最後に分析ボタン61をクリックする(最後のクリック)。この操作により、1回目と2回目にクリックされた2個のエッジに接続された4個のノードに対応する4個の単語が注目語として指定される。利用者は、ウインドウ41内でq本(qは3以上の整数)のエッジを順にクリックし、最後に分析ボタン61をクリックしてもよい。この操作により、q本のエッジに接続された2q個のノードに対応する2q個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる複数のエッジを選択し、分析開始を選択することにより、複数の注目語を指定する指示が入力される。   As shown in FIG. 11, the user first clicks an edge connecting two nodes corresponding to two words (here, “open-air bath” and “stairs”) designated as attention words in the window 41. (First click), then click the edge that connects the two nodes corresponding to the other two words (in this case, “price” and “think”) to be specified as the attention word (second time click) Click) and finally click the analysis button 61 (last click). By this operation, four words corresponding to four nodes connected to the two edges clicked for the first time and the second time are designated as attention words. The user may sequentially click q edges (q is an integer of 3 or more) in the window 41, and finally click the analysis button 61. By this operation, 2q words corresponding to 2q nodes connected to q edges are designated as attention words. In this way, by selecting a plurality of edges included in the global co-occurrence network on the screen including the global co-occurrence network and selecting the start of analysis, an instruction for designating a plurality of attention words is input.

指示入力部11は、ステップS111において、注目語を指定する指示に加えて、共起行列の基準値を設定する指示、AND処理とOR処理を切り替える指示、共起ネットワークの表示態様の詳細を設定する指示などを受け取ってもよい。受け取った指示は、テキストマイニング装置10の各部に対して出力される。   In step S111, the instruction input unit 11 sets an instruction to set a reference value of the co-occurrence matrix, an instruction to switch between AND processing and OR processing, and details of the display mode of the co-occurrence network in addition to the instruction to specify the attention word. You may receive instructions to do so. The received instruction is output to each unit of the text mining device 10.

次に、単語抽出部13は、ステップS102で読み出したテキストデータからステップS111で指定された注目語を含む文を抽出することにより、注目語を含む文からなる限定テキストデータを求める(ステップS112)。   Next, the word extraction unit 13 obtains limited text data including a sentence including the attention word by extracting the sentence including the attention word specified in step S111 from the text data read out in step S102 (step S112). .

単語抽出部13は、複数の注目語が指定された場合にAND処理とOR処理のうちいずれを行うかを示すフラグを有している。フラグの値は、予め決定された値でもよく、指示入力部11を用いて利用者から設定された値でもよい。フラグがAND処理を示す場合、単語抽出部13は、読み出したテキストデータから指定された複数の注目語のすべてを含む文を抽出することにより、限定テキストデータを求める。フラグがOR処理を示す場合、単語抽出部13は、読み出したテキストデータから指定されたいずれかの注目語を含む文を抽出することにより、限定テキストデータを求める。   The word extraction unit 13 has a flag indicating which of AND processing and OR processing is performed when a plurality of attention words are designated. The value of the flag may be a predetermined value or a value set by the user using the instruction input unit 11. When the flag indicates AND processing, the word extraction unit 13 obtains limited text data by extracting a sentence including all of the plurality of attention words specified from the read text data. When the flag indicates OR processing, the word extraction unit 13 obtains limited text data by extracting a sentence including any one of the attention words specified from the read text data.

次に、単語抽出部13は、ステップS112で求めた限定テキストデータに対して形態素解析を行うことにより、限定テキストデータから単語を抽出する(ステップS113)。次に、共起行列生成部14は、ステップS113で抽出された単語について、ステップS112で求められた限定テキストデータを用いて共起行列を生成する(ステップS114)。次に、共起ネットワーク生成部15は、ステップS114で生成された共起行列に基づき、限定共起ネットワークを生成する(ステップS115)。なお、ステップS103〜S105とステップS113〜S115の間では、処理対象は異なるが、処理内容は同じである。   Next, the word extraction unit 13 extracts words from the limited text data by performing morphological analysis on the limited text data obtained in step S112 (step S113). Next, the co-occurrence matrix generation unit 14 generates a co-occurrence matrix for the words extracted in step S113, using the limited text data obtained in step S112 (step S114). Next, the co-occurrence network generation unit 15 generates a limited co-occurrence network based on the co-occurrence matrix generated in step S114 (step S115). Note that, although the processing target is different between steps S103 to S105 and steps S113 to S115, the processing content is the same.

一般に、ステップS112で求められた限定テキストデータから抽出される単語の種類は、ステップS102で読み出されたテキストデータから抽出される単語の種類よりも少ない。ステップS114で生成された共起行列は、ステップS104で生成された共起行列とは異なる。ステップS115で生成された限定共起ネットワークは、ステップS105で生成された全体共起ネットワークとは異なる。   In general, the types of words extracted from the limited text data obtained in step S112 are fewer than the types of words extracted from the text data read in step S102. The co-occurrence matrix generated in step S114 is different from the co-occurrence matrix generated in step S104. The limited co-occurrence network generated in step S115 is different from the overall co-occurrence network generated in step S105.

次に、画面表示部16は、ステップS115で生成された限定共起ネットワークを含む画面を表示する(ステップS116)。図12および図13は、ステップS116で表示される、限定共起ネットワークを含むウインドウの例を示す図である。図12に示すウインドウ42は、1個の注目語(ここでは「露天風呂」)を指定したときの限定共起ネットワーク52を含んでいる。図13に示すウインドウ43は、2個の注目語(ここでは「露天風呂」と「浴場」)を指定したときの限定共起ネットワーク53を含んでいる。   Next, the screen display unit 16 displays a screen including the limited co-occurrence network generated in step S115 (step S116). 12 and 13 are diagrams illustrating examples of windows including the limited co-occurrence network displayed in step S116. A window 42 shown in FIG. 12 includes a limited co-occurrence network 52 when one attention word (here, “open-air bath”) is designated. A window 43 shown in FIG. 13 includes a limited co-occurrence network 53 when two attention words (here, “open-air bath” and “bathroom”) are designated.

図14および図15は、テキストマイニング装置10の表示画面の例を示す図である。画面表示部16は、全体共起ネットワークを含むウインドウと限定共起ネットワークを含むウインドウとを重ねずに並べて表示してもよく、両者を重ねて表示してもよい。図14に示す画面71では、全体共起ネットワーク51を含むウインドウ41と限定共起ネットワーク52を含むウインドウ42とは、重ねずに並べて表示されている。利用者は、画面71において、全体共起ネットワーク51と限定共起ネットワーク52を同時に見ることができる。図15に示す画面72では、限定共起ネットワーク52を含むウインドウ42は、全体共起ネットワーク51を含むウインドウ41に重ねて表示されている。利用者は、画面72において、全体共起ネットワーク51と限定共起ネットワーク52を切り替えて見ることができる。   14 and 15 are diagrams illustrating examples of display screens of the text mining device 10. The screen display unit 16 may display the window including the entire co-occurrence network and the window including the limited co-occurrence network side by side without overlapping, or may display both of them in an overlapping manner. In the screen 71 shown in FIG. 14, the window 41 including the entire co-occurrence network 51 and the window 42 including the limited co-occurrence network 52 are displayed side by side without being overlapped. The user can view the entire co-occurrence network 51 and the limited co-occurrence network 52 simultaneously on the screen 71. In the screen 72 shown in FIG. 15, the window 42 including the limited co-occurrence network 52 is displayed so as to overlap the window 41 including the entire co-occurrence network 51. The user can switch the entire co-occurrence network 51 and the limited co-occurrence network 52 and view them on the screen 72.

次に、指示入力部11は、利用者から指示を受け取る(ステップS121)。次に、テキストマイニング装置10は、ステップS121で受け取った指示が注目語を指定する指示か否かを判断する(ステップS122)。ステップS122でYesの場合、テキストマイニング装置10の制御はステップS112へ進む。この場合、ステップS121で指定された注目語についてステップS112〜S116が実行され、ステップS121で指定された注目語を含む文からなる限定テキストデータに基づく限定共起ネットワークを含む画面が表示される。   Next, the instruction input unit 11 receives an instruction from the user (step S121). Next, the text mining apparatus 10 determines whether or not the instruction received in step S121 is an instruction for designating the attention word (step S122). If Yes in step S122, the control of the text mining device 10 proceeds to step S112. In this case, steps S112 to S116 are executed for the attention word specified in step S121, and a screen including a limited co-occurrence network based on limited text data including sentences including the attention word specified in step S121 is displayed.

図16は、テキストマイニング装置10の表示画面の例を示す図である。図16に示す画面73では、全体共起ネットワーク51を含むウインドウ41と限定共起ネットワーク52を含むウインドウ42とに重ねて、注目語として「浴場」を指定したときの限定共起ネットワーク54を含むウインドウ44が表示されている。画面73は、ステップS111で「露天風呂」を注目語として指定し、ステップS121で「浴場」を注目語として指定したときに表示される。利用者は、画面73において、全体共起ネットワーク51と限定共起ネットワーク52、54を切り替えて見ることができる。   FIG. 16 is a diagram illustrating an example of a display screen of the text mining device 10. The screen 73 shown in FIG. 16 includes the limited co-occurrence network 54 when “bathhouse” is designated as the attention word, overlapping the window 41 including the entire co-occurrence network 51 and the window 42 including the limited co-occurrence network 52. A window 44 is displayed. The screen 73 is displayed when “open-air bath” is designated as an attention word in step S111 and “bathhouse” is designated as an attention word in step S121. On the screen 73, the user can switch between the overall co-occurrence network 51 and the limited co-occurrence networks 52 and 54.

ステップS122でNoの場合、テキストマイニング装置10の制御はステップS123へ進む。この場合、ステップS121で受け取った指示は、例えば、ウインドウを移動させる指示、ウインドウを非表示にする指示、ウインドウを閉じる指示、ウインドウを併合する指示などである。利用者は、全体共起ネットワークと限定共起ネットワークを含む画面が表示されているときに指示入力部11を操作することにより、これらの指示を入力する。画面表示部16は、ステップS121で受け取った指示に従い、更新後の画面を表示する(ステップS123)。その後、テキストマイニング装置10の制御は、ステップS121へ進む。   In the case of No in step S122, the control of the text mining device 10 proceeds to step S123. In this case, the instruction received in step S121 is, for example, an instruction to move the window, an instruction to hide the window, an instruction to close the window, or an instruction to merge the windows. The user inputs these instructions by operating the instruction input unit 11 when a screen including the entire co-occurrence network and the limited co-occurrence network is displayed. The screen display unit 16 displays the updated screen according to the instruction received in step S121 (step S123). Thereafter, the control of the text mining device 10 proceeds to step S121.

図17は、ウインドウを併合する操作を示す図である。図17に示す画面74には、「露天風呂」を注目語として指定したときの限定共起ネットワーク52を含むウインドウ42と、「浴場」を注目語として指定したときの限定共起ネットワーク54を含むウインドウ44とが表示されている。利用者は、画面74において、2個の限定共起ネットワーク52、54を同時に見ることができる。   FIG. 17 is a diagram illustrating an operation of merging windows. The screen 74 shown in FIG. 17 includes a window 42 including a limited co-occurrence network 52 when “open-air bath” is designated as an attention word, and a limited co-occurrence network 54 when “bath” is designated as an attention word. A window 44 is displayed. The user can simultaneously view the two limited co-occurrence networks 52 and 54 on the screen 74.

図17に示すハッチング付き矢印は、マウス29のボタンが押された状態でマウスカーソル62が移動したことを示す。この矢印は、実際の画面には表示されない。利用者は、画面74内で限定共起ネットワーク52を掴んで限定共起ネットワーク54内で離す操作(ドロップ操作)を行う。より詳細には、利用者は、マウスカーソル62がウインドウ42内にあるときにマウス29のボタンを押し、マウス29のボタンを押したままでマウスカーソル62をウインドウ44内まで移動させて、マウスカーソル62がウインドウ44内にあるときにマウス29のボタンを離す。この操作により、ウインドウを併合する指示が入力される。   The hatched arrow shown in FIG. 17 indicates that the mouse cursor 62 has moved in a state where the button of the mouse 29 is pressed. This arrow is not displayed on the actual screen. The user performs an operation (drop operation) for grasping the limited co-occurrence network 52 within the screen 74 and releasing it within the limited co-occurrence network 54. More specifically, the user presses the button of the mouse 29 while the mouse cursor 62 is in the window 42, moves the mouse cursor 62 into the window 44 while holding down the button of the mouse 29, and moves the mouse cursor 62. Release the mouse 29 button when is in the window 44. By this operation, an instruction to merge windows is input.

図18は、図17に示す操作を行った後の表示画面を示す図である。図18に示す画面75には、複数の限定共起ネットワークをタブ形式で表示するウインドウ45が表示されている。図18では、「露天風呂」と記載したタブ64が選択され、ウインドウ45には「露天風呂」を注目語として指定したときの限定共起ネットワーク52が表示されている。「浴場」と記載したタブ63が選択されたときには、ウインドウ45には図17に示す限定共起ネットワーク54が表示される。   FIG. 18 is a diagram showing a display screen after the operation shown in FIG. 17 is performed. A window 75 for displaying a plurality of limited co-occurrence networks in a tab format is displayed on the screen 75 shown in FIG. In FIG. 18, the tab 64 described as “open-air bath” is selected, and the limited co-occurrence network 52 when “open-air bath” is designated as an attention word is displayed in the window 45. When the tab 63 described as “Bathhouse” is selected, the limited co-occurrence network 54 shown in FIG.

利用者がウインドウ45内の閉じるボタン(×印)をクリックしたときに、ウインドウ45は閉じる。利用者がタブ63内の閉じるボタンをクリックしたときには、タブ63は表示されなくなる。利用者がタブ64内の閉じるボタンをクリックしたときには、タブ64は表示されなくなり、ウインドウ45には限定共起ネットワーク54が表示される。   When the user clicks the close button (x mark) in the window 45, the window 45 is closed. When the user clicks the close button in the tab 63, the tab 63 is not displayed. When the user clicks the close button in the tab 64, the tab 64 is not displayed and the limited co-occurrence network 54 is displayed in the window 45.

以上に示すように、本実施形態に係るテキストマイニング方法は、テキストデータから単語を抽出するステップ(ステップS102、S103、S112、S113)と、抽出した単語について共起行列を生成するステップ(ステップS104、S114)と、生成した共起行列に基づき共起ネットワークを生成するステップ(ステップS105、S115)と、共起ネットワークを含む画面を表示するステップ(ステップS106、S116)とを備えている。指定されたテキストデータの全体に基づく第1共起ネットワーク(全体共起ネットワーク51)を含む第1画面(ウインドウ41を含む画面)内で注目語を指定する指示が入力されたときに、単語を抽出するステップ(ステップS112、S113)は指定されたテキストデータのうち注目語を含む部分(注目語を含む文)からなる限定テキストデータから単語を抽出し、共起行列を生成するステップ(ステップS114)は抽出した単語について限定テキストデータを用いて第2共起行列を生成し、共起ネットワークを生成するステップ(ステップS115)は第2共起行列に基づき第2共起ネットワーク(限定共起ネットワーク52〜54)を生成し、画面を表示するステップ(ステップS116)は第2共起ネットワークを含む第2画面(ウインドウ42〜45を含む画面)を表示する。このように本実施形態に係るテキストマイニング方法では、指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、指定されたテキストデータのうち注目語を含む部分に基づく第2共起ネットワークを含む第2画面が表示される。したがって、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。   As described above, in the text mining method according to the present embodiment, the step of extracting words from the text data (steps S102, S103, S112, S113) and the step of generating a co-occurrence matrix for the extracted words (step S104). , S114), a step of generating a co-occurrence network based on the generated co-occurrence matrix (steps S105, S115), and a step of displaying a screen including the co-occurrence network (steps S106, S116). When an instruction for designating a word of interest is input in the first screen (screen including window 41) including the first co-occurrence network (global co-occurrence network 51) based on the entire designated text data, In the extracting step (steps S112 and S113), a word is extracted from the limited text data including a portion including the attention word (a sentence including the attention word) in the designated text data, and a co-occurrence matrix is generated (step S114). ) Generates a second co-occurrence matrix using the limited text data for the extracted word, and the step of generating a co-occurrence network (step S115) is a second co-occurrence network (limited co-occurrence network) based on the second co-occurrence matrix. 52-54) and displaying the screen (step S116) is the second image including the second co-occurrence network. To display the (screen containing the window 42 to 45). As described above, in the text mining method according to the present embodiment, when the instruction to specify the attention word is input in the first screen including the first co-occurrence network based on the entire specified text data, it is specified. A second screen including the second co-occurrence network based on the portion including the attention word in the text data is displayed. Therefore, the screen including the co-occurrence network when the attention word is designated can be displayed with a simple operation.

また、第1画面内で第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、ノードに対応する単語を注目語として指定する指示が入力される(図6、図8)。このように第1画面内で1個または複数のノードと分析開始を選択することにより、1個または複数の注目語を指定する指示を簡単な操作で入力し、1個または複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。また、第1画面内で第1共起ネットワークに含まれる1個のノードを続けて選択することにより、ノードに対応する単語を注目語として指定する指示が入力される(図7)。このように第1画面内で1個のノード続けて選択することにより、1個の注目語を指定する指示を簡単な操作で入力し、1個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。   Further, by selecting one or a plurality of nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction for designating a word corresponding to the node as an attention word is input ( 6 and 8). In this way, by selecting one or more nodes and analysis start in the first screen, an instruction for designating one or more attention words can be input by a simple operation, and one or more attention words can be input. A screen containing the co-occurrence network at the specified time can be displayed. Further, by successively selecting one node included in the first co-occurrence network in the first screen, an instruction for designating a word corresponding to the node as an attention word is input (FIG. 7). In this way, by selecting one node in succession in the first screen, an instruction to designate one attention word is input by a simple operation, and the co-occurrence network when one attention word is designated is specified. The screen that contains it can be displayed.

また、第1画面内で第1共起ネットワークに含まれる1本のエッジを選択することにより、エッジに接続された2個のノードに対応する単語を注目語として指定する指示が入力される(図9)。このように第1画面内で1本のエッジを続けて選択することにより、2個の注目語を指定する指示を簡単な操作で入力し、2個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。また、第1画面内で第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、エッジに接続された複数のノードに対応する単語を注目語として指定する指示が入力される(図10、図11)。このように第1画面内で1本または複数のエッジと分析開始を選択することにより、複数の注目語を指定する指示を簡単な操作で入力し、複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。   In addition, by selecting one edge included in the first co-occurrence network in the first screen, an instruction for designating a word corresponding to two nodes connected to the edge as an attention word is input ( FIG. 9). In this way, by selecting one edge continuously in the first screen, an instruction for designating two attention words is input by a simple operation, and the co-occurrence network when two attention words are designated Can be displayed. In addition, by selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, words corresponding to a plurality of nodes connected to the edges are designated as attention words. Is input (FIGS. 10 and 11). In this way, by selecting one or more edges and analysis start in the first screen, an instruction to specify a plurality of attention words can be input with a simple operation, and co-occurrence when a plurality of attention words are specified A screen including the network can be displayed.

また、複数の第2共起ネットワーク(限定共起ネットワーク52、54)を含む第2画面(画面74)内で併合指示が入力されたときに(図17)、画面を表示するステップは、複数の第2共起ネットワークをタブ形式で表示する(図18)。これにより、複数の第2共起ネットワークをコンパクトに表示することができる。また、第2画面内で一の第2共起ネットワーク(限定共起ネットワーク52)を掴んで他の第2共起ネットワーク(限定共起ネットワーク54)内で離すことにより、併合指示が入力される。したがって、併合指示を簡単な操作で入力し、複数の第2共起ネットワークをコンパクトに表示することができる。   Further, when a merge instruction is input in the second screen (screen 74) including a plurality of second co-occurrence networks (limited co-occurrence networks 52, 54) (FIG. 17), there are a plurality of steps for displaying the screen. The second co-occurrence network is displayed in a tab format (FIG. 18). Thereby, a some 2nd co-occurrence network can be displayed compactly. Also, a merge instruction is input by grabbing one second co-occurrence network (limited co-occurrence network 52) in the second screen and releasing it in another second co-occurrence network (limited co-occurrence network 54). . Therefore, a merge instruction can be input by a simple operation, and a plurality of second co-occurrence networks can be displayed in a compact manner.

限定テキストデータは、指定されたテキストデータのうち注目語を含む文から構成されていてもよい。この場合、注目語を指定する指示が入力されたときに、指定されたテキストデータを文単位で分けて限定テキストデータを求め、求めた限定テキストデータに基づく第2共起ネットワークを含む画面を表示することができる。複数の注目語が指定されたときの限定テキストデータは、指定されたテキストデータのうち複数の注目語のすべてを含む文から構成されていてもよい。この場合、複数の注目語についてAND処理を行ったときの第2共起ネットワークを含む画面を表示することができる。複数の注目語が指定されたときの限定テキストデータは、指定されたテキストデータのうち複数の注目語のいずれかを含む文から構成されていてもよい。この場合、複数の注目語についてOR処理を行ったときの第2共起ネットワークを含む画面を表示することができる。また、共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成する。したがって、テキストデータに含まれる単語の共起性を好適に分析することができる。   The limited text data may be composed of a sentence including the attention word among the designated text data. In this case, when an instruction to specify the attention word is input, the specified text data is divided into sentence units to obtain limited text data, and a screen including the second co-occurrence network based on the determined limited text data is displayed. can do. The limited text data when a plurality of attention words are designated may be composed of a sentence including all of the plurality of attention words among the designated text data. In this case, it is possible to display a screen including the second co-occurrence network when AND processing is performed on a plurality of attention words. The limited text data when a plurality of attention words are designated may be composed of a sentence including any of the plurality of attention words among the designated text data. In this case, it is possible to display a screen including the second co-occurrence network when OR processing is performed on a plurality of attention words. In the step of generating a co-occurrence matrix, a co-occurrence matrix having Jaccard coefficients as elements is generated. Therefore, it is possible to suitably analyze the co-occurrence of words included in the text data.

本実施形態に係るテキストマイニング装置10およびテキストマイニングプログラム31は、上記のテキストマイニング方法と同様の特徴を有し、同様の効果を奏する。本実施形態に係るテキストマイニング方法、テキストマイニング装置10、および、テキストマイニングプログラム31によれば、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。   The text mining apparatus 10 and the text mining program 31 according to the present embodiment have the same characteristics as the above text mining method and have the same effects. According to the text mining method, the text mining apparatus 10, and the text mining program 31 according to the present embodiment, a screen including a co-occurrence network when an attention word is designated can be displayed with a simple operation.

10…テキストマイニング装置
11…指示入力部
12…テキストデータ記憶部
13…単語抽出部
14…共起行列生成部
15…共起ネットワーク生成部
16…画面表示部
20…コンピュータ
21…CPU
22…メインメモリ
29…マウス
30…記録媒体
31…テキストマイニングプログラム
32…テキストデータ
41〜45…ウインドウ
51…全体共起ネットワーク
52〜54…限定共起ネットワーク
61…分析ボタン
62…マウスカーソル
63〜64…タブ
71〜75…画面
DESCRIPTION OF SYMBOLS 10 ... Text mining apparatus 11 ... Instruction input part 12 ... Text data memory | storage part 13 ... Word extraction part 14 ... Co-occurrence matrix generation part 15 ... Co-occurrence network generation part 16 ... Screen display part 20 ... Computer 21 ... CPU
DESCRIPTION OF SYMBOLS 22 ... Main memory 29 ... Mouse 30 ... Recording medium 31 ... Text mining program 32 ... Text data 41-45 ... Window 51 ... Whole co-occurrence network 52-54 ... Limited co-occurrence network 61 ... Analysis button 62 ... Mouse cursor 63-64 ... tabs 71-75 ... screen

Claims (20)

テキストデータの分析結果を含む画面を表示するテキストマイニング方法であって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニング方法。
A text mining method for displaying a screen including an analysis result of text data,
Extracting words from text data;
Generating a co-occurrence matrix for the word;
Generating a co-occurrence network based on the co-occurrence matrix;
Displaying a screen including the co-occurrence network,
The step of extracting the word when the instruction to specify the attention word is input in the first screen including the first co-occurrence network based on the whole of the specified text data includes the step of extracting the word from the specified text data. The step of extracting the word from the limited text data including the part including the attention word and generating the co-occurrence matrix generates a second co-occurrence matrix using the limited text data for the word, The step of generating generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network. Method.
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。   By selecting one or a plurality of nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction for designating a word corresponding to the node as the attention word is input. The text mining method according to claim 1, wherein: 前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。   By sequentially selecting one node included in the first co-occurrence network in the first screen, an instruction for designating a word corresponding to the node as the attention word is input. The text mining method according to claim 1. 前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。   An instruction for designating a word corresponding to two nodes connected to the edge as the attention word by successively selecting one edge included in the first co-occurrence network in the first screen. The text mining method according to claim 1, wherein the text mining method is input. 前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。   By selecting one or a plurality of edges included in the first co-occurrence network in the first screen and selecting start analysis, words corresponding to a plurality of nodes connected to the edges are selected as the attention word. The text mining method according to claim 1, wherein an instruction to designate as is input. 複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする、請求項1に記載のテキストマイニング方法。   The step of displaying the screen when a merge instruction is input in a second screen including a plurality of second co-occurrence networks includes displaying the plurality of second co-occurrence networks in a tab format. The text mining method according to claim 1. 前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする、請求項6に記載のテキストマイニング方法。   The text mining according to claim 6, wherein the merging instruction is input by grabbing one second co-occurrence network in the second screen and releasing it in another second co-occurrence network. Method. 前記限定テキストデータは、前記指定されたテキストデータのうち前記注目語を含む文からなることを特徴とする、請求項1に記載のテキストマイニング方法。   The text mining method according to claim 1, wherein the limited text data includes a sentence including the attention word in the designated text data. 複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のすべてを含む文からなることを特徴とする、請求項8に記載のテキストマイニング方法。   9. The text mining according to claim 8, wherein the limited text data when a plurality of attention words are specified includes a sentence including all of the plurality of attention words in the specified text data. Method. 複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のいずれかを含む文からなることを特徴とする、請求項8に記載のテキストマイニング方法。   9. The text according to claim 8, wherein the limited text data when a plurality of attention words are designated is composed of a sentence including any of the plurality of attention words in the designated text data. Mining method. 前記共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成することを特徴とする、請求項1に記載のテキストマイニング方法。   2. The text mining method according to claim 1, wherein the step of generating the co-occurrence matrix generates a co-occurrence matrix having Jaccard coefficients as elements. テキストデータの分析結果を含む画面を表示するためのテキストマイニングプログラムであって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとをコンピュータにCPUがメモリを利用して実行させ、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニングプログラム。
A text mining program for displaying a screen including the analysis result of text data,
Extracting words from text data;
Generating a co-occurrence matrix for the word;
Generating a co-occurrence network based on the co-occurrence matrix;
And causing the computer to execute a step of displaying a screen including the co-occurrence network using a memory,
The step of extracting the word when the instruction to specify the attention word is input in the first screen including the first co-occurrence network based on the whole of the specified text data includes the step of extracting the word from the specified text data. The step of extracting the word from the limited text data including the part including the attention word and generating the co-occurrence matrix generates a second co-occurrence matrix using the limited text data for the word, The step of generating generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network. program.
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。   By selecting one or a plurality of nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction for designating a word corresponding to the node as the attention word is input. The text mining program according to claim 12, wherein: 前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。   By sequentially selecting one node included in the first co-occurrence network in the first screen, an instruction for designating a word corresponding to the node as the attention word is input. The text mining program according to claim 12. 前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。   An instruction for designating a word corresponding to two nodes connected to the edge as the attention word by successively selecting one edge included in the first co-occurrence network in the first screen. The text mining program according to claim 12, wherein the text mining program is input. 前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。   By selecting one or a plurality of edges included in the first co-occurrence network in the first screen and selecting start analysis, words corresponding to a plurality of nodes connected to the edges are selected as the attention word. The text mining program according to claim 12, wherein an instruction to designate as is input. 複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする、請求項12に記載のテキストマイニングプログラム。   The step of displaying the screen when a merge instruction is input in a second screen including a plurality of second co-occurrence networks includes displaying the plurality of second co-occurrence networks in a tab format. The text mining program according to claim 12. 前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする、請求項17に記載のテキストマイニングプログラム。   18. The text mining according to claim 17, wherein the merge instruction is input by grasping one second co-occurrence network in the second screen and releasing it in another second co-occurrence network. program. テキストデータの分析結果を含む画面を表示するテキストマイニング装置であって、
テキストデータから単語を抽出する単語抽出部と、
前記単語について共起行列を生成する共起行列生成部と、
前記共起行列に基づき共起ネットワークを生成する共起ネットワーク生成部と、
前記共起ネットワークを含む画面を表示する画面表示部とを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語抽出部は前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列生成部は前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワーク生成部は前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面表示部は前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニング装置。
A text mining device that displays a screen including the analysis result of text data,
A word extraction unit for extracting words from text data;
A co-occurrence matrix generator for generating a co-occurrence matrix for the word;
A co-occurrence network generation unit that generates a co-occurrence network based on the co-occurrence matrix;
A screen display unit for displaying a screen including the co-occurrence network,
When an instruction for designating a word of interest is input in the first screen including the first co-occurrence network based on the whole of the designated text data, the word extraction unit extracts the word of interest from the designated text data The co-occurrence matrix generation unit generates a second co-occurrence matrix using the limited text data for the word, and the co-occurrence network generation unit A text mining apparatus, wherein a second co-occurrence network is generated based on a two-co-occurrence matrix, and the screen display unit displays a second screen including the second co-occurrence network.
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面表示部は、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする、請求項19に記載のテキストマイニング装置。   The screen display unit displays the plurality of second co-occurrence networks in a tab format when a merge instruction is input in a second screen including a plurality of second co-occurrence networks. Item 20. The text mining device according to Item 19.
JP2018052074A 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment Active JP6987003B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018052074A JP6987003B2 (en) 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment
KR1020190013093A KR102162779B1 (en) 2018-03-20 2019-01-31 Text mining method, text mining program and text mining apparatus
CN201910096738.5A CN110309290B (en) 2018-03-20 2019-01-31 Text mining method, text mining program, and text mining device
TW108106540A TWI703457B (en) 2018-03-20 2019-02-26 Text exploration method, text exploration program and text exploration device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018052074A JP6987003B2 (en) 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment

Publications (3)

Publication Number Publication Date
JP2019164593A true JP2019164593A (en) 2019-09-26
JP2019164593A5 JP2019164593A5 (en) 2021-02-18
JP6987003B2 JP6987003B2 (en) 2021-12-22

Family

ID=68065531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018052074A Active JP6987003B2 (en) 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment

Country Status (4)

Country Link
JP (1) JP6987003B2 (en)
KR (1) KR102162779B1 (en)
CN (1) CN110309290B (en)
TW (1) TWI703457B (en)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10283367A (en) * 1997-04-09 1998-10-23 Mitsubishi Electric Corp Hypermedia device
JP2005122321A (en) * 2003-10-14 2005-05-12 Sony Corp System and server for providing information, user terminal device, content display device, computer program, and content display method
JP2006215936A (en) * 2005-02-07 2006-08-17 Hitachi Ltd Search system and search method
JP2007193380A (en) * 2006-01-16 2007-08-02 So-Net Entertainment Corp Information processor, information processing method and computer program
JP2011128748A (en) * 2009-12-16 2011-06-30 Nec Corp Graph creation device, graph creation method and graph creation program
JP2013537329A (en) * 2010-09-09 2013-09-30 マイクロソフト コーポレーション Draggable tab
JP2014085992A (en) * 2012-10-26 2014-05-12 Hitachi Ltd Document recognition support device, document recognition support method and document recognition support program
JP2014115911A (en) * 2012-12-11 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> Information recommendation apparatus, information recommendation method, and information recommendation program
JP2015125594A (en) * 2013-12-26 2015-07-06 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method and program
JP2016099751A (en) * 2014-11-20 2016-05-30 日本電信電話株式会社 Action network information extraction device, action network information extraction method and action network information extraction program
WO2017061253A1 (en) * 2015-10-09 2017-04-13 アイビーリサーチ株式会社 Display control device, display control method, and display control program
US20170270223A1 (en) * 2014-08-22 2017-09-21 Hitachi, Ltd. Autopoietic information processing system and method

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2806867B2 (en) * 1995-03-13 1998-09-30 株式会社トレンディ Document database construction method, display method, and display device
JP4404323B2 (en) * 1999-02-05 2010-01-27 経済産業大臣 Thesaurus browsing system and method
JP5331723B2 (en) 2010-02-05 2013-10-30 株式会社エヌ・ティ・ティ・データ Feature word extraction device, feature word extraction method, and feature word extraction program
US9177104B2 (en) * 2013-03-29 2015-11-03 Case Western Reserve University Discriminatively weighted multi-scale local binary patterns
KR101512084B1 (en) 2013-11-15 2015-04-17 한국과학기술원 Web search system for providing 3 dimensional web search interface based virtual reality and method thereof
CN104375989A (en) * 2014-12-01 2015-02-25 国家电网公司 Natural language text keyword association network construction system
JP6524790B2 (en) 2015-05-14 2019-06-05 富士ゼロックス株式会社 INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM
TWM523901U (en) * 2016-01-04 2016-06-11 信義房屋仲介股份有限公司 Search engine device for performing semantic keyword analysis
US9710544B1 (en) * 2016-05-19 2017-07-18 Quid, Inc. Pivoting from a graph of semantic similarity of documents to a derivative graph of relationships between entities mentioned in the documents
CN107766318B (en) * 2016-08-17 2021-03-16 北京金山安全软件有限公司 Keyword extraction method and device and electronic equipment
CN107193803B (en) * 2017-05-26 2020-07-10 北京东方科诺科技发展有限公司 Semantic-based specific task text keyword extraction method
CN107451120B (en) * 2017-08-01 2020-10-30 中国人民解放军火箭军工程大学 Content conflict detection method and system for open text information

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10283367A (en) * 1997-04-09 1998-10-23 Mitsubishi Electric Corp Hypermedia device
JP2005122321A (en) * 2003-10-14 2005-05-12 Sony Corp System and server for providing information, user terminal device, content display device, computer program, and content display method
JP2006215936A (en) * 2005-02-07 2006-08-17 Hitachi Ltd Search system and search method
JP2007193380A (en) * 2006-01-16 2007-08-02 So-Net Entertainment Corp Information processor, information processing method and computer program
JP2011128748A (en) * 2009-12-16 2011-06-30 Nec Corp Graph creation device, graph creation method and graph creation program
JP2013537329A (en) * 2010-09-09 2013-09-30 マイクロソフト コーポレーション Draggable tab
JP2014085992A (en) * 2012-10-26 2014-05-12 Hitachi Ltd Document recognition support device, document recognition support method and document recognition support program
JP2014115911A (en) * 2012-12-11 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> Information recommendation apparatus, information recommendation method, and information recommendation program
JP2015125594A (en) * 2013-12-26 2015-07-06 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method and program
US20170270223A1 (en) * 2014-08-22 2017-09-21 Hitachi, Ltd. Autopoietic information processing system and method
JP2016099751A (en) * 2014-11-20 2016-05-30 日本電信電話株式会社 Action network information extraction device, action network information extraction method and action network information extraction program
WO2017061253A1 (en) * 2015-10-09 2017-04-13 アイビーリサーチ株式会社 Display control device, display control method, and display control program

Also Published As

Publication number Publication date
CN110309290A (en) 2019-10-08
TWI703457B (en) 2020-09-01
JP6987003B2 (en) 2021-12-22
KR102162779B1 (en) 2020-10-07
TW201945958A (en) 2019-12-01
CN110309290B (en) 2023-06-06
KR20190110428A (en) 2019-09-30

Similar Documents

Publication Publication Date Title
US10678824B2 (en) Method of searching for relevant node, and computer therefor and computer program
WO2018020842A1 (en) Text mining method, text mining program, and text mining apparatus
KR101910179B1 (en) Web-based chart library system for data visualization
JP2016151908A (en) Personal information anonymization support device
JP6987003B2 (en) Text mining methods, text mining programs, and text mining equipment
JP5623023B2 (en) Idea organization support device, idea support method, and computer program
JP6402637B2 (en) Analysis program, analysis method, and analysis apparatus
JP2012226697A (en) Wbs creation system and wbs creation method
Slob et al. The interactive narrator tool: Effective requirements exploration and discussion through visualization
KR101985014B1 (en) System and method for exploratory data visualization
JP5202598B2 (en) Workflow management device and workflow management program
KR20190110435A (en) Text mining method, text mining program and text mining apparatus
WO2024090367A1 (en) Information processing method, computer program, and information processing device
JP5716223B1 (en) Thought support dictionary, thought support dictionary system, thought support system, thought support method, thought support program, thought support program storage medium, and thought support data storage medium
JP5574775B2 (en) Idea organization support device and idea organization support program
JP2007272517A (en) Micro-scenario data analysis system and micro scenario data analysis program
Parulian et al. or2yw: Modeling and Visualizing OpenRefineHistories as YesWorkflow Diagrams
Martynovsky Developing an Interactive Visualization Tool for Pangenome Graphs
JP2007052533A (en) Statistical optimization integration device and statistical optimization integration program
JP2006164044A (en) Content information display support method, device, and program, and storage medium with program stored thereon
III et al. Explore, Edit, Guess: Understanding Novice Programmers’ Use of CodeBlocks for Regression Experiments
JP2015045939A (en) Unstructured data processing system, unstructured data processing method, and program
JP4728878B2 (en) Time series analysis support system, time series analysis support method, and time series analysis support program
JP2004139199A (en) Data analysis method
KR20200008830A (en) Recipe tree construction system for cooking recipe visualization and recipe tree construction method using the same

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211130

R150 Certificate of patent or registration of utility model

Ref document number: 6987003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150