JP2008225561A - 相互に関係する固有表現の組抽出装置及びその方法 - Google Patents
相互に関係する固有表現の組抽出装置及びその方法 Download PDFInfo
- Publication number
- JP2008225561A JP2008225561A JP2007058771A JP2007058771A JP2008225561A JP 2008225561 A JP2008225561 A JP 2008225561A JP 2007058771 A JP2007058771 A JP 2007058771A JP 2007058771 A JP2007058771 A JP 2007058771A JP 2008225561 A JP2008225561 A JP 2008225561A
- Authority
- JP
- Japan
- Prior art keywords
- specific
- expressions
- phrase
- specific expression
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出した後に、抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、入力テキストに含まれる名詞句を、その名詞句に伴う助詞にそれぞれ対応する領域を有する語句記憶部30に順に記憶するとともに、固有表現の組に対応する各固有表現のうち後方固有表現を含む語句を読み出したときに語句記憶部30における前方固有表現の格納状態を表す情報を取得して、該情報を少なくとも含む素性を抽出し、抽出された素性とモデル記憶部50に記憶されたモデルに基づいて固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する。
【選択図】図1
Description
Kambhatla、"Combining Lexical, Syntactic, and Semantic Features with Maximum Entropy Models for Extracting Relations"、The Companion Volume to the Proceedings of 42st Annual Meeting of the Association for Computational Linguistics、Association for Computational Linguistics、2004年7月、p.178−181
Claims (12)
- 相互に関係する複数の固有表現からなる固有表現の組を入力テキストから抽出する装置であって、
テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出する固有表現抽出処理部と、
複数の助詞のそれぞれに対応する領域を有し、入力テキストに含まれる名詞句を、その名詞句に伴う助詞の対応領域に順に記憶する語句記憶部と、
固有表現抽出処理部によって抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、前記名詞句を入力テキストの文頭から順に読み出して語句記憶部に記憶するとともに、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、語句記憶部における他方の固有表現の格納状態を表す情報を取得して、該情報を少なくとも含む素性を抽出する素性抽出処理部と、
素性抽出処理部によって抽出された素性、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果及び該所定の固有表現の組に対応する各固有表現を含むテキストを用いて素性抽出処理部から事前に抽出された事前素性に基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する判別処理部とを備えた
ことを特徴とする相互に関係する固有表現の組抽出装置。 - 前記素性抽出処理部は、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、他方の固有表現を含む語句が語句記憶部に記憶されているか否かを表す情報を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項1記載の相互に関係する固有表現の組抽出装置。 - 前記素性抽出処理部は、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、語句記憶部において他方の固有表現を含む語句が記憶された領域に対応する助詞を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項1記載の相互に関係する固有表現の組抽出装置。 - 前記素性抽出処理部は、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、他方の固有表現を含む語句が記憶された領域に対応する助詞が、語句記憶部の領域に対応する各助詞のうち主語として最も用いられる助詞であるか否かを表す情報を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項1記載の相互に関係する固有表現の組抽出装置。 - 前記素性抽出処理部は、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、各固有表現のそれぞれを含む語句と、語句記憶部において他方の固有表現が記憶された領域に対応する助詞とを組み合わせた情報を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項1記載の相互に関係する固有表現の組抽出装置。 - 前記各固有表現の組に含まれる各固有表現間の関係の有無が判別処理部によって判別される毎に判別結果を記憶する判別結果記憶部を備え、
判別処理部は、固有表現の組に対応する素性が素性抽出処理部によって抽出されると判別結果記憶部に記憶された判別結果を取得し、該判別結果と、抽出された素性と、所定の固有表現の組に対応する各固有表現の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて素性抽出処理部から事前に抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを判別する
ことを特徴とする請求項1乃至5何れか1項記載の相互に関係する固有表現の組抽出装置。 - コンピュータを用いて、相互に関係する複数の固有表現からなる固有表現の組を入力テキストから抽出する方法であって、
前記コンピュータは、テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出する第1のステップと、
複数の助詞のそれぞれに対応する領域を有する所定の語句記憶部に対して、入力テキストに含まれる名詞句を、該名詞句に伴う助詞の対応領域に順に記憶する第2のステップと、
抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、前記名詞句を入力テキストの文頭から順に読み出して第2のステップを行うとともに、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、語句記憶部における他方の固有表現の格納状態を表す情報を取得して、該情報を少なくとも含む素性を抽出する第3のステップと、
抽出された素性、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果及び該所定の固有表現の組に対応する各固有表現を含むテキストを用いて事前に第3のステップを行うことにより抽出された事前素性に基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する第4のステップとを行う
ことを特徴とする相互に関係する固有表現の組抽出方法。 - 前記コンピュータは、第3のステップにおいて、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、他方の固有表現を含む語句が語句記憶部に記憶されているか否かを表す情報を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項7記載の相互に関係する固有表現の組抽出方法。 - 前記コンピュータは、第3のステップにおいて、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、語句記憶部において他方の固有表現を含む語句が記憶された領域に対応する助詞を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項7記載の相互に関係する固有表現の組抽出方法。 - 前記コンピュータは、第3のステップにおいて、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、他方の固有表現を含む語句が記憶された領域に対応する助詞が、語句記憶部の領域に対応する各助詞のうち主語として最も用いられる助詞であるか否かを表す情報を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項7記載の相互に関係する固有表現の組抽出方法。 - 前記コンピュータは、第3のステップにおいて、固有表現の組に対応する各固有表現のうち入力テキストにおいて後に現れる一方の固有表現を含む語句を読み出したときに、各固有表現のそれぞれを含む語句と、語句記憶部において他方の固有表現が記憶された領域に対応する助詞とを組み合わせた情報を少なくとも含む情報を素性として抽出する
ことを特徴とする請求項7記載の相互に関係する固有表現の組抽出方法。 - 前記コンピュータは、第4のステップにおいて各固有表現の組に対応する各固有表現間の関係の有無が判別される毎に、判別結果を所定の判別結果記憶部に記憶する第5のステップを行い、
第4のステップにおいて、固有表現の組に対応する素性が抽出されると判別結果記憶部に記憶された判別結果を取得し、該判別結果と、抽出された素性と、所定の固有表現の組に対応する各固有表現の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて事前に第3のステップを行うことにより抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを判別する
ことを特徴とする請求項7乃至11何れか1項記載の相互に関係する固有表現の組抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007058771A JP4793932B2 (ja) | 2007-03-08 | 2007-03-08 | 相互に関係する固有表現の組抽出装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007058771A JP4793932B2 (ja) | 2007-03-08 | 2007-03-08 | 相互に関係する固有表現の組抽出装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008225561A true JP2008225561A (ja) | 2008-09-25 |
JP4793932B2 JP4793932B2 (ja) | 2011-10-12 |
Family
ID=39844155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007058771A Active JP4793932B2 (ja) | 2007-03-08 | 2007-03-08 | 相互に関係する固有表現の組抽出装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4793932B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011257791A (ja) * | 2010-06-04 | 2011-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置、その方法及びプログラム |
US9262735B2 (en) | 2013-08-12 | 2016-02-16 | International Business Machines Corporation | Identifying and amalgamating conditional actions in business processes |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004458A (ja) * | 2005-06-23 | 2007-01-11 | National Institute Of Information & Communication Technology | 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム |
-
2007
- 2007-03-08 JP JP2007058771A patent/JP4793932B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004458A (ja) * | 2005-06-23 | 2007-01-11 | National Institute Of Information & Communication Technology | 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011257791A (ja) * | 2010-06-04 | 2011-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 関係情報抽出装置、その方法及びプログラム |
US9262735B2 (en) | 2013-08-12 | 2016-02-16 | International Business Machines Corporation | Identifying and amalgamating conditional actions in business processes |
US9558462B2 (en) | 2013-08-12 | 2017-01-31 | International Business Machines Corporation | Identifying and amalgamating conditional actions in business processes |
Also Published As
Publication number | Publication date |
---|---|
JP4793932B2 (ja) | 2011-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5229226B2 (ja) | 情報共有システム、情報共有方法、および情報共有プログラム | |
CN111597351A (zh) | 可视化文档图谱构建方法 | |
JP2002215617A (ja) | 品詞タグ付けをする方法 | |
RU2601166C2 (ru) | Разрешение анафоры на основе технологии глубинного анализа | |
JP4600045B2 (ja) | 意見抽出用学習装置及び意見抽出用分類装置 | |
US20120124467A1 (en) | Method for automatically generating descriptive headings for a text element | |
JP2020035036A (ja) | 試験計画策定支援装置、試験計画策定支援方法及びプログラム | |
JP6239344B2 (ja) | テキスト処理装置、テキスト処理方法およびプログラム | |
JP2019032704A (ja) | 表データ構造化システムおよび表データ構造化方法 | |
JP3372532B2 (ja) | 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体 | |
JP4793931B2 (ja) | 相互に関係する固有表現の組抽出装置及びその方法 | |
JP4793932B2 (ja) | 相互に関係する固有表現の組抽出装置及びその方法 | |
JP5117744B2 (ja) | 単語意味タグ付与装置および方法、プログラム並びに記録媒体 | |
JP5112027B2 (ja) | 文書群提示装置および文書群提示プログラム | |
CN114970543A (zh) | 一种众包设计资源的语义分析方法 | |
JP2008225565A (ja) | 相互に関係する固有表現の組抽出装置及びその方法 | |
CN114299525A (zh) | 图片处理方法、装置及电子设备 | |
JP4646078B2 (ja) | 相互に関係する固有表現の組抽出装置及びその方法 | |
JP4646328B2 (ja) | 関係情報抽出装置及びその方法 | |
JP5142395B2 (ja) | 関係情報抽出装置、その方法、プログラム及び記録媒体 | |
JP5441174B2 (ja) | 関係情報抽出装置、その方法及びプログラム | |
JP5441173B2 (ja) | 関係情報抽出装置、その方法及びプログラム | |
JP2005202924A (ja) | 対訳判断装置、方法及びプログラム | |
JP2009140113A (ja) | 辞書編集装置、および辞書編集方法、並びにコンピュータ・プログラム | |
JP2009140048A (ja) | 評判関係抽出装置、その方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101202 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110114 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110613 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110614 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110615 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110720 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110722 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4793932 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |