JP2017187828A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2017187828A
JP2017187828A JP2016073971A JP2016073971A JP2017187828A JP 2017187828 A JP2017187828 A JP 2017187828A JP 2016073971 A JP2016073971 A JP 2016073971A JP 2016073971 A JP2016073971 A JP 2016073971A JP 2017187828 A JP2017187828 A JP 2017187828A
Authority
JP
Japan
Prior art keywords
cluster
phrase
initial value
information processing
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016073971A
Other languages
English (en)
Other versions
JP6555174B2 (ja
Inventor
友博 三浦
Tomohiro Miura
友博 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2016073971A priority Critical patent/JP6555174B2/ja
Publication of JP2017187828A publication Critical patent/JP2017187828A/ja
Application granted granted Critical
Publication of JP6555174B2 publication Critical patent/JP6555174B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出する。【解決手段】情報処理装置は、1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出するクラスタ抽出部と、前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部とを備える。【選択図】図3

Description

本開示は、初期値としての語句に対する関連語句を抽出することが可能な情報処理装置及びプログラムに関する。
一般的に、多数の語句等のデータをクラスタ(データの集合)に分類する技術(クラスタリング)が知られている。例えば、キーワードをその同義語等に変換してクラスタ分類を行う方法(例えば、特許文献1参照)や、概念検索を利用して検索対象文をクラスタに分類する方法が知られている(例えば、特許文献2参照)。
特開2008−293271号公報 特開2005−092442号公報
本開示の目的は、クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出することにある。
上記目的を達成するため、本開示の一形態に係る情報処理装置は、
1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部と
を備える。
本形態によれば、クラスタ抽出部が第1のクラスタと異なる第2のクラスタを抽出し、語句抽出部が抽出された第2のクラスタから関連語句を抽出することにより、初期値である語句に対して異なる複数の分野から関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い語句でありながら、異なる分野から抽出された関連語句を学習することで、初期値について幅広く学習することができる。
前記クラスタ抽出部は、前記第1のクラスタと関連性の高い1以上のクラスタを、前記第2のクラスタとして抽出する。
本形態によれば、クラスタ抽出部が第1のクラスタと関連性の高いクラスタを抽出することにより、初期値である語句に対して当該語句の分野と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値の分野と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値の分野と関連性の高い内容を学習することができる。
あるいは、
前記クラスタ抽出部は、前記初期値と関連性の高い1以上のクラスタを、前記第1のクラスタと関連性の高い前記第2のクラスタとして抽出する。
本形態によれば、クラスタ抽出部が初期値と関連性の高いクラスタを抽出することにより、初期値である語句に対して当該語句と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値と関連性の高い内容を学習することができる。
前記語句抽出部は、前記第1のクラスタと各前記第2のクラスタとの関連性に応じて、各前記第2のクラスタから抽出する関連語句の数を異ならせる。
本形態によれば、例えば、第1のクラスタと関連性の高い第2のクラスタから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタと関連性の比較的高い関連語句を多数抽出することができる。これにより、ユーザーは、初期値と関連性の比較的高い情報を多数知ることができ、初期値についてより深く学習することができる。あるいは、第1のクラスタと関連性の比較的低い第2のクラスタから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタと関連性の比較的低い関連語句を多数抽出することができる。これにより、ユーザーは、初期値から離れて広範な分野の語句を多数知ることができ、初期値についてより広く学習することができる。
前記情報処理装置は、前記抽出した各関連語句の情報資源の所在情報が前記各関連語句に紐付けられたリンク情報を生成するリンク生成部をさらに備える。
本形態によれば、リンク情報に各関連語句の情報資源の所在情報が紐づけられているため、ユーザーは、容易に各関連語句の情報資源にアクセスすることができる。
前記情報処理装置は、前記初期値と、前記リンク情報が紐付けられた各関連語句とを、表示部に出力する出力部をさらに備える。
本形態によれば、リンク情報が紐付けられた各関連語句が表示部に表示されるため、ユーザーは、容易に各関連語句の情報資源にアクセスすることができる。
前記情報処理装置は、
ユーザーにより前記初期値として選択された、前記表示部に表示された何れかの前記関連語句を検出し、
前記選択された初期値としての関連語句を、前記クラスタ抽出部に入力する
初期値入力部をさらに備える。
本形態によれば、初期値入力部は、ユーザーにより選択された関連語句を初期値としてクラスタ抽出部に入力する。これにより、ユーザーは、初期値から関連語句、この関連語句から別の関連語句へと、連鎖的に学習を深めることができる。
前記語句抽出部は、
複数の語句と、前記各語句が属するクラスタと、前記複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを参照し、
前記1以上の第2のクラスタにそれぞれ属する、前記初期値と関連性の高い語句である関連語句を、前記テーブルから抽出する。
前記情報処理装置は、前記テーブルを生成するクラスタ解析部をさらに備える。
上記目的を達成するため、本開示の一形態に係るプログラムは、
情報処理装置を、
1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部
として機能させる。
本開示によれば、クラスタリングの技術を利用して、初期値としての語句に対する関連語句を抽出することができる。
情報処理装置のハードウェア構成を示すブロック図である。 情報処理装置の機能的構成を示すブロック図である。 情報処理装置の動作を示すフローチャートである。 各クラスタ、初期値及び各関連語句を模式的に示す図である。
以下、図面を参照しながら、本開示の実施形態を説明する。
(1.情報処理装置のハードウェア構成)
図1は、情報処理装置のハードウェア構成を示すブロック図である。情報処理装置10は、典型的には、PC(Personal Computer)であり、以下、「PC10」と記載する。
PC10は、制御部11と、制御部11とバス16を介して接続された表示部12、通信インターフェース13、操作部14及び記憶部15とを有する。
制御部11は、CPU(Central Processing Unit)等を含む。制御部11は、RAM(Random Access Memory)にロードされたプログラムを実行する。
表示部12は、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)ディスプレイ等を含む。表示部12は、制御部11から受け取った情報に基づいて演算処理を行い、生成した画像信号を画面に表示する。典型的には、表示部12は外付けの表示装置である。
通信インターフェース13は、ネットワークNに接続するためのインターフェースである。
操作部14は、キーボード、マウス及び各種スイッチ等を含む。操作部14は、ユーザーからの操作を検出して制御部11に出力する。
記憶部15は、ROM(Read Only Memory)と、RAMと、HDD(Hard Disk Drive)等の大容量の記憶装置とを含む。ROMは、制御部11が実行するプログラムやデータ等を固定的に格納する。RAMには、ROMに格納されたプログラムがロードされる。
(2.情報処理装置の機能的構成)
図2は、情報処理装置の機能的構成を示すブロック図である。
PC10は、情報処理プログラムを実行することにより、クラスタ解析部111と、初期値入力部112と、クラスタ抽出部113と、語句抽出部114と、リンク生成部115と、出力部116として機能する。
クラスタ解析部111は、複数の語句と、各語句が属するクラスタと、複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを生成する。
初期値入力部112は、ユーザーによる操作部14に対する特定の操作を、初期値である語句の入力要求として検出する。
クラスタ抽出部113は、1以上の語句をそれぞれ含む複数のクラスタから、初期値を含む第1のクラスタを抽出する。また、クラスタ抽出部113は、複数のクラスタから、第1のクラスタと異なる1以上の第2のクラスタを抽出する。
語句抽出部114は、1以上の第2のクラスタから、それぞれ、初期値と関連性の高い語句である関連語句を抽出する。
リンク生成部115は、抽出した各関連語句の情報資源の所在情報が紐付けられたリンク情報を生成する。
出力部116は、初期値と、リンク情報が紐付けられた各関連語句とを、表示部12に出力する。
(3.情報処理装置の動作)
図3は、情報処理装置の動作を示すフローチャートである。図4は、各クラスタ、初期値及び各関連語句を模式的に示す図である。
クラスタ解析部111は、テーブル15aを生成する(ステップS101)。具体的には、クラスタ解析部111は、図2に示すように、複数の語句151と、位置情報152と、クラスタ153とを、互いに関連付けてテーブル15aに登録する。例えば、まず、クラスタ解析部111は、記憶部15に記憶されたデータベース(図示せず)に蓄積された文書データを形態素解析により複数の語句に分割し、語句151としてテーブル15aに登録する。「文書データ」としては、例えば、書籍(例えば、教科書や各種資料等)の文章のテキストデータが挙げられる。
クラスタ解析部111は、テーブル15aに登録した語句151を複数のクラスタに分類する。具体的には、クラスタ解析部111は、語句151同士の関連性を算出するための値を決定する。「関連性を算出するための値」とは、例えば、各語句151の位置情報152である。「位置情報」は、例えば、公知のクラスタリング手法で用いられる多次元空間における座標や、書籍のページ番号又は行番号等である。
本例では、以下、位置情報152として「座標」を用いるものとする。クラスタ解析部111は、ユークリッド距離等の座標間の距離に基づいて語句151を分類する。クラスタ解析部111は、ユークリッド距離d(f,g)を、以下の数1の式を用いて求める。式中、nは次元数、f及びgは座標のベクトルを表す。クラスタ解析部111は、求めた座標間の距離を用いて、座標間の距離が小さい複数の語句151を、関連性の高い語句の集合として、1つのクラスタにまとめる。
図4Aの例では、クラスタ解析部111は、複数の語句を、関連性の高い語句の集合として、複数のクラスタA、B、C、D、E、F、Xに分類する。
Figure 2017187828
初期値入力部112は、ユーザーによる操作部14に対する特定の操作を、初期値である語句の入力要求として検出する(ステップS102)。初期値入力部112は、検出した初期値xを、クラスタ抽出部113に入力する。
クラスタ抽出部113は、初期値入力部112から取得した初期値xがテーブル15aに登録されているか否かを判断する(ステップS103)。初期値xがテーブル15aに登録されていない場合(ステップS103、No)、クラスタ抽出部113は、出力部116に、表示部12にエラーメッセージを表示させるための信号を出力してもよい。初期値入力部112は、新たな初期値を検出(ステップS102)するまで待機する。
一方、初期値xがテーブル15aに登録されている場合(ステップS103、Yes)、クラスタ抽出部113は、複数のクラスタ153から、初期値xを含むクラスタである第1のクラスタ153aを抽出する。具体的には、クラスタ抽出部113は、初期値xである語句151に関連付けてテーブル15aに登録されたクラスタ153を、第1のクラスタ153aとして抽出する。
図4Bの例では、クラスタ抽出部113は、複数のクラスタA、B、C、D、E、F、Xから、初期値x(図中の白点)が属するクラスタXを、第1のクラスタ153aとして抽出する。
クラスタ抽出部113は、複数のクラスタ153から、第1のクラスタ153a(クラスタX)と異なる1以上のクラスタである第2のクラスタ153bを抽出する(ステップS104)。例えば、クラスタ抽出部113は、第1のクラスタ153a(クラスタX)と関連性を有する1以上のクラスタを、予め設定された数の第2のクラスタ153bとして抽出する。具体的には、クラスタ抽出部113は、第1のクラスタ153aの位置情報と他の各クラスタの位置情報とに基づいて、第2のクラスタ153bを抽出する。「クラスタの位置情報」とは、例えば、特定のクラスタに属するすべての語句の座標から求めたクラスタの重心である。より具体的には、クラスタ抽出部113は、特定のクラスタに属するすべての語句151のすべての座標(位置情報152)の和を、そのクラスタに属するすべての語句151の数で除算して得た値(座標)を、「クラスタの位置情報」として用いる。クラスタ抽出部113は、第1のクラスタ153aとの重心間の距離が短い(すなわち、第1のクラスタ153aとの関連性が高い)特定数のクラスタを、複数の第2のクラスタ153bとして抽出する。
図4Cの例では、クラスタ抽出部113は、第2のクラスタ153bとして、第1のクラスタXとの重心の距離が短い特定数(本例では4個)のクラスタA、B、C及びDを抽出する。図4C中、各クラスタ中の黒点は、クラスタの位置情報としての、クラスタの重心の座標を示す。
語句抽出部114は、第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である特定数の関連語句を抽出する(ステップS105)。具体的には、語句抽出部114は、第2のクラスタ153bそれぞれに属する、初期値xと関連性の最も高い語句151である関連語句を、テーブル15aから抽出する。具体的には、語句抽出部114は、テーブル15aに登録された、初期値xの位置情報152(座標)と、各第2のクラスタ153bに含まれる各語句151の位置情報152(座標)との距離を算出する。語句抽出部114は、初期値xの位置情報152(座標)との距離が短い(関連性が高い)位置情報152に関連付けられた語句151を、関連語句として抽出する。
図4Dの例では、語句抽出部114は、第2のクラスタA、B、C及びDから、それぞれ、初期値xとの距離が短い特定数(本例では1個)の関連語句a1、b1、c1及びd1を抽出する。図4D中、各クラスタ中の白点は、語句の座標を示す。
リンク生成部115は、抽出した各関連語句に対して、各関連語句の情報資源の所在情報が紐付けられたリンク情報を生成する(ステップS106)。「情報資源」とは、例えば、その関連語句が解説された文書データ等であり、インターネット等のネットワークNに接続されたサーバー装置(図示せず)やPC10の記憶部15に格納されている。「所在情報」とは、例えば、ネットワークNに格納された情報資源にアクセスするためのURL(Uniform Resource Locator)や、PC10の記憶部15に格納された情報資源にアクセスするためのアドレス情報である。
出力部116は、初期値xと、リンク情報が紐付けられた各関連語句とを、表示部12に出力する(ステップS107)。典型的には、出力部116は、各関連語句にリンク(ハイパーリンク)を設定し、ユーザーが操作部14を用いて選択可能な形式で表示部12に出力する。
初期値入力部112は、ユーザーによる操作部14に対する特定の操作を、表示部12に表示された何れかの関連語句の選択要求として検出する(ステップS108、Yes)。初期値入力部112は、選択された関連語句を、初期値としてクラスタ抽出部113に入力する(ステップS109)。PC10は、クラスタ抽出部113に入力された関連語句を初期値として、ステップS103以後の処理を繰り返す。
(4.まとめ)
初期値としての語句に対する関連語句を抽出する技術においては、ユーザーの学習効果を深めるため、初期値と関連性が高い関連語句を抽出することが一般的である。
これに対して、本実施形態によれば、クラスタ抽出部113が第1のクラスタ153aと異なる第2のクラスタ153bを抽出し、語句抽出部114が第2のクラスタ153bから関連語句を抽出する。これにより、初期値に対して異なる複数の分野から関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い語句でありながら、異なる分野から抽出された関連語句を学習することで、初期値について幅広く学習することができる。
また、本実施形態によれば、クラスタ抽出部113は、第1のクラスタ153aと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出することにより、初期値である語句に対して当該語句の分野と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値の分野と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値の分野と関連性の高い内容を学習することができる。
(5.変形例)
(5−1.変形例1)
本実施形態では、クラスタ抽出部113は、テーブル15aに基づき第2のクラスタ153bを抽出した。これに替えて、記憶部15が予めクラスタ同士の関連性を示すテーブル(図示せず)を記憶し、クラスタ抽出部113はこのテーブルから第2のクラスタ153bを抽出してもよい。
(5−2.変形例2)
本実施形態では、クラスタ抽出部113は、第1のクラスタ153aと関連性を有する(具体的には、関連性の高い)1以上のクラスタを、第2のクラスタ153bとして抽出した。これに替えて、クラスタ抽出部113は、初期値と関連性を有する(具体的には、関連性の高い)1以上のクラスタを、第2のクラスタ153bとして抽出してもよい。具体的には、クラスタ抽出部113は、初期値の位置情報とクラスタの位置情報とに基づいて、第2のクラスタ153bを抽出する。さらに具体的には、クラスタ抽出部113は、初期値の位置情報(座標)と位置情報(重心の座標)との距離が小さいクラスタを、第2のクラスタ153bとして抽出する。
本形態によれば、クラスタ抽出部113が初期値と関連性の高いクラスタを抽出することにより、初期値である語句に対して当該語句と関連性の高い分野の関連語句を抽出することができる。これにより、ユーザーは、初期値と関連性の高い分野から抽出された関連語句を学習することで、初期値について幅広く、且つ、初期値と関連性の高い内容を学習することができる。
(5−3.変形例3)
また、本実施形態では、語句抽出部114は、1以上の第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である関連語句を同数(1個)ずつ抽出した。これに替えて、語句抽出部114は、第1のクラスタ153aと各第2のクラスタ153bとの関連性に応じて、各第2のクラスタ153bから抽出する関連語句の数を異ならせてもよい。
例えば、第1のクラスタ153aと関連性の比較的高い第2のクラスタ153bから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタ153aと関連性の比較的高い関連語句を多数抽出することができる。これにより、ユーザーは、初期値と関連性の比較的高い情報を多数知ることができ、初期値についてより深く学習することができる。
あるいは、第1のクラスタ153aと関連性の比較的低い第2のクラスタ153bから抽出する関連語句の数を増やすことで、初期値を含む第1のクラスタ153aと関連性の比較的低い関連語句を多数抽出することができる。これにより、ユーザーは、初期値と関連する語句でありながら、初期値から離れて広範な分野の語句を多数知ることができ、初期値についてより広く学習することができる。
(5−4.変形例4)
本実施形態では、語句抽出部114は、1以上の第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である関連語句を抽出した。これに加えて、第1のクラスタ153aからも初期値xと関連性の高い語句である関連語句を抽出してもよい。これにより、広範な関連語句に加えて、初期値xと特に関連性の高い関連語句をもユーザーに提供できる。なお、第1のクラスタ153aからも関連語句を抽出する場合、第2のクラスタ153bから抽出する関連語句の数を、第1のクラスタ153aから抽出する関連語句の数より増やすようにすれば、ユーザーは、広範な分野の語句を多数知ることができ、初期値についてより広く学習することができる。
(5−5.変形例5)
本実施形態では、クラスタ抽出部113は、図4Dに示すように、第1のクラスタ153aと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出した。また、変形例2では、クラスタ抽出部113は、図4Fに示すように、初期値xと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出した。これに替えて、例えば、クラスタ抽出部113は、必ずしもすべての第2のクラスタ153bを、第1のクラスタ153a又は初期値xを基準として選択しなくても良い。
例えば、クラスタ抽出部113は、まず、第1のクラスタと関連性の最も高い第2のクラスタを抽出し、次に、抽出した第2のクラスタと関連性の最も高い別の第2のクラスタを抽出し、それを繰り返して言わば連鎖的に複数の第2のクラスタ153bを抽出してもよい。これにより、ユーザーは、初期値と関連する語句でありながら、初期値から離れて連鎖的な分野の語句を多数知ることができ、初期値についてより広く学習することができる。
(5−6.変形例6)
本実施形態では、1つの情報処理装置(PC10)が全ての動作を実行した。これに替えて、2以上の情報処理装置が動作を分担してもよい。例えば、外部の情報処理装置(例えば、ネットワーク上のサーバー装置(図示せず)が制御部11と記憶部15とを有し、エンドユーザーが利用する情報処理装置(図示せず)が表示部12と操作部14とを有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。
(5−7.変形例7)
あるいは、サーバー装置が制御部11を有し、エンドユーザーが利用する情報処理装置が表示部12、操作部14及び記憶部15を有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。
(5−8.変形例8)
あるいは、サーバー装置が制御部11を有し、エンドユーザーが利用する情報処理装置が表示部12及び操作部14を有し、ネットワーク上にあるさらに別の情報処理装置が記憶部15のデータベースを有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。
10…PC
111…クラスタ解析部
112…初期値入力部
113…クラスタ抽出部
114…語句抽出部
115…リンク生成部
116…出力部

Claims (10)

  1. 1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
    前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
    クラスタ抽出部と、
    前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部と
    を具備する情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記クラスタ抽出部は、前記第1のクラスタと関連性を有する1以上のクラスタを、前記第2のクラスタとして抽出する
    情報処理装置。
  3. 請求項1又は2に記載の情報処理装置であって、
    前記クラスタ抽出部は、前記初期値と関連性を有する1以上のクラスタを、前記第1のクラスタと関連性を有する前記第2のクラスタとして抽出する
    情報処理装置。
  4. 請求項1乃至3の何れか一項に記載の情報処理装置であって、
    前記語句抽出部は、前記第1のクラスタと各前記第2のクラスタとの関連性に応じて、各前記第2のクラスタから抽出する関連語句の数を異ならせる
    情報処理装置。
  5. 請求項1乃至4の何れか一項に記載の情報処理装置であって、
    前記抽出した各関連語句の情報資源の所在情報が前記各関連語句に紐付けられたリンク情報を生成するリンク生成部
    をさらに具備する情報処理装置。
  6. 請求項5に記載の情報処理装置であって、
    前記初期値と、前記リンク情報が紐付けられた各関連語句とを、表示部に出力する出力部
    をさらに具備する情報処理装置。
  7. 請求項1乃至6の何れか一項に記載の情報処理装置であって、
    ユーザーにより前記初期値として選択された、前記表示部に表示された何れかの前記関連語句を検出し、
    前記選択された初期値としての関連語句を、前記クラスタ抽出部に入力する
    初期値入力部
    をさらに具備する情報処理装置。
  8. 請求項1乃至7の何れか一項に記載の情報処理装置であって、
    前記語句抽出部は、
    複数の語句と、前記各語句が属するクラスタと、前記複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを参照し、
    前記1以上の第2のクラスタにそれぞれ属する、前記初期値と関連性の高い語句である関連語句を、前記テーブルから抽出する
    情報処理装置。
  9. 請求項8に記載の情報処理装置であって、
    前記テーブルを生成するクラスタ解析部
    をさらに具備する情報処理装置。
  10. 情報処理装置を、
    1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
    前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
    クラスタ抽出部と、
    前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部
    として機能させるプログラム。
JP2016073971A 2016-04-01 2016-04-01 情報処理装置及びプログラム Expired - Fee Related JP6555174B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016073971A JP6555174B2 (ja) 2016-04-01 2016-04-01 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016073971A JP6555174B2 (ja) 2016-04-01 2016-04-01 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017187828A true JP2017187828A (ja) 2017-10-12
JP6555174B2 JP6555174B2 (ja) 2019-08-07

Family

ID=60045574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016073971A Expired - Fee Related JP6555174B2 (ja) 2016-04-01 2016-04-01 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6555174B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005149014A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> 文書関連語彙獲得方法及び装置及びプログラム
JP2005302042A (ja) * 2004-04-15 2005-10-27 Microsoft Corp マルチセンスクエリについての関連語提案
JP2006039871A (ja) * 2004-07-26 2006-02-09 Patolis Corp 類義語検索装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報検索装置
US20090234832A1 (en) * 2008-03-12 2009-09-17 Microsoft Corporation Graph-based keyword expansion
US20100145972A1 (en) * 2008-12-10 2010-06-10 Oscar Kipersztok Method for vocabulary amplification
JP2015022676A (ja) * 2013-07-23 2015-02-02 日本放送協会 類義語検索装置及び類義語検索プログラム
JP2015103210A (ja) * 2013-11-28 2015-06-04 国立大学法人北見工業大学 インターネット上の有害書き込み検出装置及び検出方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005149014A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> 文書関連語彙獲得方法及び装置及びプログラム
JP2005302042A (ja) * 2004-04-15 2005-10-27 Microsoft Corp マルチセンスクエリについての関連語提案
JP2006039871A (ja) * 2004-07-26 2006-02-09 Patolis Corp 類義語検索装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報検索装置
US20090234832A1 (en) * 2008-03-12 2009-09-17 Microsoft Corporation Graph-based keyword expansion
US20100145972A1 (en) * 2008-12-10 2010-06-10 Oscar Kipersztok Method for vocabulary amplification
JP2015022676A (ja) * 2013-07-23 2015-02-02 日本放送協会 類義語検索装置及び類義語検索プログラム
JP2015103210A (ja) * 2013-11-28 2015-06-04 国立大学法人北見工業大学 インターネット上の有害書き込み検出装置及び検出方法

Also Published As

Publication number Publication date
JP6555174B2 (ja) 2019-08-07

Similar Documents

Publication Publication Date Title
US20200311342A1 (en) Populating values in a spreadsheet using semantic cues
US8749553B1 (en) Systems and methods for accurately plotting mathematical functions
JP6381002B2 (ja) 検索推奨方法及び装置
JP4878624B2 (ja) 文書処理装置および文書処理方法
US20150169710A1 (en) Method and apparatus for providing search results
JP2020074193A (ja) サーチ方法、装置、設備および不揮発性計算機メモリ
EP3175375A1 (en) Image based search to identify objects in documents
CN111753094B (zh) 事件知识图谱的构建方法、装置及事件确定方法、装置
US20150089415A1 (en) Method of processing big data, apparatus performing the same and storage media storing the same
JPWO2013161850A1 (ja) テキストマイニングシステム、テキストマイニング方法及びプログラム
US20160171106A1 (en) Webpage content storage and review
CN106951509B (zh) 多标签核化典型相关分析检索方法
EP3037985A1 (en) Search method and system, search engine and client
CN111373386A (zh) 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序
JP6737187B2 (ja) プロセスグラフィックスの状況に応じたレンダリング
JP2018045548A (ja) Fmea作成支援システムおよび方法
WO2019135897A1 (en) Smart search for annotations and inking
US11934448B2 (en) Keyword localization digital image search
JP6883561B2 (ja) 脆弱性推定装置及び脆弱性推定方法
JP2010224625A (ja) キーワード二次元可視化方法およびキーワード二次元可視化プログラム
WO2017134800A1 (ja) 表形式データの解析方法、表形式データの解析プログラム及び情報処理装置
JP6252296B2 (ja) データ識別方法、データ識別プログラム及びデータ識別装置
JP6555174B2 (ja) 情報処理装置及びプログラム
Andrews et al. An interactive interface for text variant graph models
CN111177236B (zh) 基于医养照护场景的量表生成方法、系统、设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190624

R150 Certificate of patent or registration of utility model

Ref document number: 6555174

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees