JP2017187828A - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2017187828A JP2017187828A JP2016073971A JP2016073971A JP2017187828A JP 2017187828 A JP2017187828 A JP 2017187828A JP 2016073971 A JP2016073971 A JP 2016073971A JP 2016073971 A JP2016073971 A JP 2016073971A JP 2017187828 A JP2017187828 A JP 2017187828A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- phrase
- initial value
- information processing
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部と
を備える。
前記クラスタ抽出部は、前記初期値と関連性の高い1以上のクラスタを、前記第1のクラスタと関連性の高い前記第2のクラスタとして抽出する。
ユーザーにより前記初期値として選択された、前記表示部に表示された何れかの前記関連語句を検出し、
前記選択された初期値としての関連語句を、前記クラスタ抽出部に入力する
初期値入力部をさらに備える。
複数の語句と、前記各語句が属するクラスタと、前記複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを参照し、
前記1以上の第2のクラスタにそれぞれ属する、前記初期値と関連性の高い語句である関連語句を、前記テーブルから抽出する。
情報処理装置を、
1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部
として機能させる。
図1は、情報処理装置のハードウェア構成を示すブロック図である。情報処理装置10は、典型的には、PC(Personal Computer)であり、以下、「PC10」と記載する。
PC10は、制御部11と、制御部11とバス16を介して接続された表示部12、通信インターフェース13、操作部14及び記憶部15とを有する。
図2は、情報処理装置の機能的構成を示すブロック図である。
図3は、情報処理装置の動作を示すフローチャートである。図4は、各クラスタ、初期値及び各関連語句を模式的に示す図である。
初期値としての語句に対する関連語句を抽出する技術においては、ユーザーの学習効果を深めるため、初期値と関連性が高い関連語句を抽出することが一般的である。
(5−1.変形例1)
本実施形態では、クラスタ抽出部113は、テーブル15aに基づき第2のクラスタ153bを抽出した。これに替えて、記憶部15が予めクラスタ同士の関連性を示すテーブル(図示せず)を記憶し、クラスタ抽出部113はこのテーブルから第2のクラスタ153bを抽出してもよい。
本実施形態では、クラスタ抽出部113は、第1のクラスタ153aと関連性を有する(具体的には、関連性の高い)1以上のクラスタを、第2のクラスタ153bとして抽出した。これに替えて、クラスタ抽出部113は、初期値と関連性を有する(具体的には、関連性の高い)1以上のクラスタを、第2のクラスタ153bとして抽出してもよい。具体的には、クラスタ抽出部113は、初期値の位置情報とクラスタの位置情報とに基づいて、第2のクラスタ153bを抽出する。さらに具体的には、クラスタ抽出部113は、初期値の位置情報(座標)と位置情報(重心の座標)との距離が小さいクラスタを、第2のクラスタ153bとして抽出する。
また、本実施形態では、語句抽出部114は、1以上の第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である関連語句を同数(1個)ずつ抽出した。これに替えて、語句抽出部114は、第1のクラスタ153aと各第2のクラスタ153bとの関連性に応じて、各第2のクラスタ153bから抽出する関連語句の数を異ならせてもよい。
本実施形態では、語句抽出部114は、1以上の第2のクラスタ153bから、それぞれ、初期値xと関連性の高い語句である関連語句を抽出した。これに加えて、第1のクラスタ153aからも初期値xと関連性の高い語句である関連語句を抽出してもよい。これにより、広範な関連語句に加えて、初期値xと特に関連性の高い関連語句をもユーザーに提供できる。なお、第1のクラスタ153aからも関連語句を抽出する場合、第2のクラスタ153bから抽出する関連語句の数を、第1のクラスタ153aから抽出する関連語句の数より増やすようにすれば、ユーザーは、広範な分野の語句を多数知ることができ、初期値についてより広く学習することができる。
本実施形態では、クラスタ抽出部113は、図4Dに示すように、第1のクラスタ153aと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出した。また、変形例2では、クラスタ抽出部113は、図4Fに示すように、初期値xと関連性の高い1以上のクラスタを、第2のクラスタ153bとして抽出した。これに替えて、例えば、クラスタ抽出部113は、必ずしもすべての第2のクラスタ153bを、第1のクラスタ153a又は初期値xを基準として選択しなくても良い。
本実施形態では、1つの情報処理装置(PC10)が全ての動作を実行した。これに替えて、2以上の情報処理装置が動作を分担してもよい。例えば、外部の情報処理装置(例えば、ネットワーク上のサーバー装置(図示せず)が制御部11と記憶部15とを有し、エンドユーザーが利用する情報処理装置(図示せず)が表示部12と操作部14とを有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。
あるいは、サーバー装置が制御部11を有し、エンドユーザーが利用する情報処理装置が表示部12、操作部14及び記憶部15を有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。
あるいは、サーバー装置が制御部11を有し、エンドユーザーが利用する情報処理装置が表示部12及び操作部14を有し、ネットワーク上にあるさらに別の情報処理装置が記憶部15のデータベースを有し、ネットワークを介して情報処理装置間でデータをやり取りしてもよい。
111…クラスタ解析部
112…初期値入力部
113…クラスタ抽出部
114…語句抽出部
115…リンク生成部
116…出力部
Claims (10)
- 1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部と
を具備する情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記クラスタ抽出部は、前記第1のクラスタと関連性を有する1以上のクラスタを、前記第2のクラスタとして抽出する
情報処理装置。 - 請求項1又は2に記載の情報処理装置であって、
前記クラスタ抽出部は、前記初期値と関連性を有する1以上のクラスタを、前記第1のクラスタと関連性を有する前記第2のクラスタとして抽出する
情報処理装置。 - 請求項1乃至3の何れか一項に記載の情報処理装置であって、
前記語句抽出部は、前記第1のクラスタと各前記第2のクラスタとの関連性に応じて、各前記第2のクラスタから抽出する関連語句の数を異ならせる
情報処理装置。 - 請求項1乃至4の何れか一項に記載の情報処理装置であって、
前記抽出した各関連語句の情報資源の所在情報が前記各関連語句に紐付けられたリンク情報を生成するリンク生成部
をさらに具備する情報処理装置。 - 請求項5に記載の情報処理装置であって、
前記初期値と、前記リンク情報が紐付けられた各関連語句とを、表示部に出力する出力部
をさらに具備する情報処理装置。 - 請求項1乃至6の何れか一項に記載の情報処理装置であって、
ユーザーにより前記初期値として選択された、前記表示部に表示された何れかの前記関連語句を検出し、
前記選択された初期値としての関連語句を、前記クラスタ抽出部に入力する
初期値入力部
をさらに具備する情報処理装置。 - 請求項1乃至7の何れか一項に記載の情報処理装置であって、
前記語句抽出部は、
複数の語句と、前記各語句が属するクラスタと、前記複数の語句同士の関連性を算出するための値とを互いに関連付けて登録したテーブルを参照し、
前記1以上の第2のクラスタにそれぞれ属する、前記初期値と関連性の高い語句である関連語句を、前記テーブルから抽出する
情報処理装置。 - 請求項8に記載の情報処理装置であって、
前記テーブルを生成するクラスタ解析部
をさらに具備する情報処理装置。 - 情報処理装置を、
1以上の語句をそれぞれ含む複数のクラスタから、初期値である1つの語句を含む第1のクラスタを抽出し、
前記複数のクラスタから、前記第1のクラスタと異なる1以上の第2のクラスタを抽出する
クラスタ抽出部と、
前記1以上の第2のクラスタから、それぞれ、前記初期値と関連性の高い語句である関連語句を抽出する語句抽出部
として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016073971A JP6555174B2 (ja) | 2016-04-01 | 2016-04-01 | 情報処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016073971A JP6555174B2 (ja) | 2016-04-01 | 2016-04-01 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017187828A true JP2017187828A (ja) | 2017-10-12 |
JP6555174B2 JP6555174B2 (ja) | 2019-08-07 |
Family
ID=60045574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016073971A Expired - Fee Related JP6555174B2 (ja) | 2016-04-01 | 2016-04-01 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6555174B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005149014A (ja) * | 2003-11-13 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書関連語彙獲得方法及び装置及びプログラム |
JP2005302042A (ja) * | 2004-04-15 | 2005-10-27 | Microsoft Corp | マルチセンスクエリについての関連語提案 |
JP2006039871A (ja) * | 2004-07-26 | 2006-02-09 | Patolis Corp | 類義語検索装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報検索装置 |
US20090234832A1 (en) * | 2008-03-12 | 2009-09-17 | Microsoft Corporation | Graph-based keyword expansion |
US20100145972A1 (en) * | 2008-12-10 | 2010-06-10 | Oscar Kipersztok | Method for vocabulary amplification |
JP2015022676A (ja) * | 2013-07-23 | 2015-02-02 | 日本放送協会 | 類義語検索装置及び類義語検索プログラム |
JP2015103210A (ja) * | 2013-11-28 | 2015-06-04 | 国立大学法人北見工業大学 | インターネット上の有害書き込み検出装置及び検出方法 |
-
2016
- 2016-04-01 JP JP2016073971A patent/JP6555174B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005149014A (ja) * | 2003-11-13 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書関連語彙獲得方法及び装置及びプログラム |
JP2005302042A (ja) * | 2004-04-15 | 2005-10-27 | Microsoft Corp | マルチセンスクエリについての関連語提案 |
JP2006039871A (ja) * | 2004-07-26 | 2006-02-09 | Patolis Corp | 類義語検索装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報検索装置 |
US20090234832A1 (en) * | 2008-03-12 | 2009-09-17 | Microsoft Corporation | Graph-based keyword expansion |
US20100145972A1 (en) * | 2008-12-10 | 2010-06-10 | Oscar Kipersztok | Method for vocabulary amplification |
JP2015022676A (ja) * | 2013-07-23 | 2015-02-02 | 日本放送協会 | 類義語検索装置及び類義語検索プログラム |
JP2015103210A (ja) * | 2013-11-28 | 2015-06-04 | 国立大学法人北見工業大学 | インターネット上の有害書き込み検出装置及び検出方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6555174B2 (ja) | 2019-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200311342A1 (en) | Populating values in a spreadsheet using semantic cues | |
US8749553B1 (en) | Systems and methods for accurately plotting mathematical functions | |
JP6381002B2 (ja) | 検索推奨方法及び装置 | |
JP4878624B2 (ja) | 文書処理装置および文書処理方法 | |
US20150169710A1 (en) | Method and apparatus for providing search results | |
JP2020074193A (ja) | サーチ方法、装置、設備および不揮発性計算機メモリ | |
EP3175375A1 (en) | Image based search to identify objects in documents | |
CN111753094B (zh) | 事件知识图谱的构建方法、装置及事件确定方法、装置 | |
US20150089415A1 (en) | Method of processing big data, apparatus performing the same and storage media storing the same | |
JPWO2013161850A1 (ja) | テキストマイニングシステム、テキストマイニング方法及びプログラム | |
US20160171106A1 (en) | Webpage content storage and review | |
CN106951509B (zh) | 多标签核化典型相关分析检索方法 | |
EP3037985A1 (en) | Search method and system, search engine and client | |
CN111373386A (zh) | 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序 | |
JP6737187B2 (ja) | プロセスグラフィックスの状況に応じたレンダリング | |
JP2018045548A (ja) | Fmea作成支援システムおよび方法 | |
WO2019135897A1 (en) | Smart search for annotations and inking | |
US11934448B2 (en) | Keyword localization digital image search | |
JP6883561B2 (ja) | 脆弱性推定装置及び脆弱性推定方法 | |
JP2010224625A (ja) | キーワード二次元可視化方法およびキーワード二次元可視化プログラム | |
WO2017134800A1 (ja) | 表形式データの解析方法、表形式データの解析プログラム及び情報処理装置 | |
JP6252296B2 (ja) | データ識別方法、データ識別プログラム及びデータ識別装置 | |
JP6555174B2 (ja) | 情報処理装置及びプログラム | |
Andrews et al. | An interactive interface for text variant graph models | |
CN111177236B (zh) | 基于医养照护场景的量表生成方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190624 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6555174 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |