JP5277914B2 - 単語関係判定装置及びプログラム - Google Patents
単語関係判定装置及びプログラムInfo
- Publication number
- JP5277914B2 JP5277914B2 JP2008305972A JP2008305972A JP5277914B2 JP 5277914 B2 JP5277914 B2 JP 5277914B2 JP 2008305972 A JP2008305972 A JP 2008305972A JP 2008305972 A JP2008305972 A JP 2008305972A JP 5277914 B2 JP5277914 B2 JP 5277914B2
- Authority
- JP
- Japan
- Prior art keywords
- noun
- verb
- group
- thesaurus
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
Claims (5)
- 第1の動詞と第2の動詞を判定対象として設定する設定手段と、
複数の文から前記第1の動詞に関して1以上の所与の条件にそれぞれ合致する1又は複数の名詞を含む第1の名詞群を取得する第1名詞群取得手段と、
前記複数の文から前記第2の動詞に関して前記1以上の所与の条件にそれぞれ合致する1又は複数の名詞を含む第2の名詞群を取得する第2名詞群取得手段と、
前記第1の名詞群に含まれる各名詞を、複数の名詞を当該各名詞が有する概念の上位下位の関係に基づいて木構造に表した名詞シソーラスにおける予め定められた基準概念の名詞に変換した第1の基準概念名詞群の特徴ベクトルと、前記第2の名詞群に含まれる各名詞を前記名詞シソーラスにおける予め定められた基準概念の名詞に変換した第2の基準概念名詞群の特徴ベクトルとの内積が第1の閾値よりも大きい場合に、前記第1の動詞と第2の動詞が類似と判定する類否判定手段と、
前記類否判定手段により類似と判定された場合に、前記名詞シソーラスにおける前記第1の名詞群の分布を示すベクトルと、前記第2の名詞群の分布を示すベクトルとの距離が第2の閾値よりも大きい場合に、前記第1の動詞と前記第2の動詞とが上位下位の関係にあると判定する判定手段と、を含む
ことを特徴とする単語関係判定装置。 - 前記第1の名詞群の分布を示すベクトルは、当該第1の名詞群において前記1以上の所与の条件にそれぞれ合致する名詞の集合ごとに算出される、該集合に含まれる名詞の各組の前記名詞シソーラスにおけるホップ数の平均値を要素として生成され、
前記第2の名詞群の分布を示すベクトルは、当該第2の名詞群において前記1以上の所与の条件にそれぞれ合致する名詞の集合ごとに算出される、該集合に含まれる名詞の各組の前記名詞シソーラスにおけるホップ数の平均値を要素として生成される
ことを特徴とする請求項1に記載の単語関係判定装置。 - 前記名詞シソーラスにおける前記第1の名詞群の分布を示すベクトルと、前記第2の名詞群の分布を示すベクトルとの距離が前記第1の閾値よりも大きくない場合に、前記複数の文から前記第1の動詞と前記第2の動詞のそれぞれに因果関係を表す表現を介して係る文節に含まれる第1の因果関係名詞群と第2の因果関係名詞群とをそれぞれ抽出する抽出手段をさらに含み、
前記判定手段は、前記名詞シソーラスにおける前記第1の因果関係名詞群の分布距離と、前記第2の因果関係名詞群の分布距離との距離が第3の閾値よりも大きい場合に、前記第1の動詞と前記第2の動詞とが上位下位の関係にあると判定し、
因果関係名詞群の分布距離は、当該因果関係名詞群に含まれる名詞の各組の前記名詞シソーラスにおけるホップ数の平均値である
ことを特徴とする請求項1又は2に記載の単語関係判定装置。 - 前記類否判定手段により類似と判定され、かつ、前記判定手段により上位下位の関係にないと判定された前記第1の動詞と前記第2の動詞は、同義語の関係にあると判定する
ことを特徴とする請求項1乃至3のいずれかに記載の単語関係判定装置。 - 第1の動詞と第2の動詞を判定対象として設定する設定ステップと、
複数の文から前記第1の動詞に関して1以上の所与の条件にそれぞれ合致する1又は複数の名詞を含む第1の名詞群を取得する第1名詞群取得ステップと、
前記複数の文から前記第2の動詞に関して前記1以上の所与の条件にそれぞれ合致する1又は複数の名詞を含む第2の名詞群を取得する第2名詞群取得ステップと、
前記第1の名詞群に含まれる各名詞を、複数の名詞を当該各名詞が有する概念の上位下位の関係に基づいて木構造に表した名詞シソーラスにおける予め定められた基準概念の名詞に変換した第1の基準概念名詞群の特徴ベクトルと、前記第2の名詞群に含まれる各名詞を前記名詞シソーラスにおける予め定められた基準概念の名詞に変換した第2の基準概念名詞群の特徴ベクトルとの内積が第1の閾値よりも大きい場合に、前記第1の動詞と第2の動詞が類似と判定する類否判定ステップと、
前記類否判定ステップで類似と判定された場合に、前記名詞シソーラスにおける前記第1の名詞群の分布を示すベクトルと、前記第2の名詞群の分布を示すベクトルとの距離が第2の閾値よりも大きい場合に、前記第1の動詞と前記第2の動詞とが上位下位の関係にあると判定する判定ステップと、をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305972A JP5277914B2 (ja) | 2008-12-01 | 2008-12-01 | 単語関係判定装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305972A JP5277914B2 (ja) | 2008-12-01 | 2008-12-01 | 単語関係判定装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010129025A JP2010129025A (ja) | 2010-06-10 |
JP5277914B2 true JP5277914B2 (ja) | 2013-08-28 |
Family
ID=42329339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008305972A Expired - Fee Related JP5277914B2 (ja) | 2008-12-01 | 2008-12-01 | 単語関係判定装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5277914B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0736897A (ja) * | 1993-07-22 | 1995-02-07 | Sharp Corp | 文書分類装置 |
JPH11296552A (ja) * | 1998-04-13 | 1999-10-29 | Ricoh Co Ltd | 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2000129025A (ja) * | 1998-10-22 | 2000-05-09 | Nobumasa Nakaso | 接着剤内蔵発泡シートとその製造方法 |
JP2001331515A (ja) * | 2000-05-23 | 2001-11-30 | Sigmatics Inc | 単語シソーラス構築方法及びコンピュータシステムに単語シソーラスの構築を行わせるためのコンピュータソフトウエアプログラム製品 |
-
2008
- 2008-12-01 JP JP2008305972A patent/JP5277914B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010129025A (ja) | 2010-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
US10839155B2 (en) | Text analysis of morphemes by syntax dependency relationship with determination rules | |
US10496756B2 (en) | Sentence creation system | |
TW201222291A (en) | Method and device for providing text segmentation results with multiple granularity levels | |
JP2001043236A (ja) | 類似語抽出方法、文書検索方法及びこれらに用いる装置 | |
US11893537B2 (en) | Linguistic analysis of seed documents and peer groups | |
US20150205860A1 (en) | Information retrieval device, information retrieval method, and information retrieval program | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
JP4534666B2 (ja) | テキスト文検索装置及びテキスト文検索プログラム | |
CN107168953A (zh) | 海量文本中基于词向量表征的新词发现方法及系统 | |
JP5504097B2 (ja) | 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置 | |
JP2006227823A (ja) | 情報処理装置及びその制御方法 | |
JP2017201478A (ja) | キーワード評価装置、類似度評価装置、検索装置、評価方法、検索方法、及びプログラム | |
Mangairkarasi et al. | Semantic based text summarization using universal networking language | |
JP2001331515A (ja) | 単語シソーラス構築方法及びコンピュータシステムに単語シソーラスの構築を行わせるためのコンピュータソフトウエアプログラム製品 | |
JP2011175568A (ja) | 文書間距離算出器および文章検索器 | |
Fudholi et al. | Ontology-based information extraction for knowledge enrichment and validation | |
US20110106849A1 (en) | New case generation device, new case generation method, and new case generation program | |
JP5277914B2 (ja) | 単語関係判定装置及びプログラム | |
JP2004272352A (ja) | 類似度計算方法、装置、プログラムおよび該プログラムを格納した記録媒体 | |
Li et al. | Chinese frame identification using t-crf model | |
Reddy et al. | POS Tagger for Kannada Sentence Translation | |
Mathew et al. | Paraphrase identification of Malayalam sentences-an experience | |
JP2008129662A (ja) | 情報抽出装置、情報抽出方法、情報抽出プログラム | |
Reddy et al. | Text Summarization of Telugu Scripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130506 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5277914 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |