JP4031492B2 - テンプレート作成装置、辞書作成装置、テンプレート作成方法、辞書作成方法、テンプレート作成プログラム、辞書作成プログラムおよび記録媒体 - Google Patents
テンプレート作成装置、辞書作成装置、テンプレート作成方法、辞書作成方法、テンプレート作成プログラム、辞書作成プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4031492B2 JP4031492B2 JP2005192885A JP2005192885A JP4031492B2 JP 4031492 B2 JP4031492 B2 JP 4031492B2 JP 2005192885 A JP2005192885 A JP 2005192885A JP 2005192885 A JP2005192885 A JP 2005192885A JP 4031492 B2 JP4031492 B2 JP 4031492B2
- Authority
- JP
- Japan
- Prior art keywords
- template
- semantic
- dictionary
- meaning
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
非特許文献2に開示された自然言語処理システムは、解析器により辞書の定義文や例文を解析し、定義文や例文の単語の意味的関係を自動的に構造化してオントロジ辞書を構築するものである。
非特許文献3に開示された自然言語処理システムは、国語辞書の語義文の表層的パターンから語義文中に存在する同義語、上位語など関連する語を自動抽出してオントロジ辞書を構築するものである。
また、本発明に係る辞書作成方法は、テンプレートを記憶した記憶手段と、単語の語義を説明する語義文を取得する取得手段と、文章の構文意味構造を解析する解析手段と、テンプレートを作成する特徴抽出手段と、複数の単語間の意味関係を検出する検出手段と、複数の単語をオントロジ辞書に登録する辞書登録手段とを備えた辞書作成装置を用いてオントロジ辞書を作成する辞書作成方法であって、記憶手段が、所定の構文意味構造と、この構文意味構造に対応する意味関係とを抽象化して対応付けたテンプレートを記憶する記憶ステップと、取得手段が、外部より入力された複数の単語それぞれの語義を説明する語義文を外部より取得する取得ステップと、解析手段が、取得手段が取得した語義文の構文意味構造を解析する解析ステップと、特徴抽出手段が、解析手段が解析した構文意味構造と意味関係とを抽象化して対応付けたテンプレートを作成する特徴抽出ステップと、検出手段が、特徴抽出手段が作成したテンプレートと、記憶手段に記憶させたテンプレートとに基づいて、複数の単語間の意味関係を検出する検出ステップと、辞書登録手段が、検出手段による検出結果に基づいて複数の単語をオントロジ辞書に登録する辞書登録ステップとを備えたことを特徴とする。
また、本発明に係るテンプレートプログラムは、コンピュータを、上記テンプレート作成装置の各手段として機能させることを特徴とする。
また、本発明に係る辞書作成プログラムは、コンピュータを、上記辞書作成装置の各手段として機能させることを特徴とする。
また、本発明に係る記録媒体は、上記プログラムを記録したことを特徴とする。
以下、図面を参照して、本発明の第1の実施の形態について図面を参照して説明する。図1は、本発明の第1の実施の形態となるテンプレート作成装置の構成を示すブロック図である。テンプレート作成装置1は、受付部11と、語義辞書12と、語義抽出部13と、文法辞書14と、解析部15と、特徴抽出部16と、テンプレート登録部17と、テンプレートDB(Data Base)18とから構成される。このようなテンプレート作成装置1は、CPU等の演算装置と、メモリ、HDD(Hard Disc Drive)等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)またはFED(Field Emission Display)等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した受付部11、語義辞書12、語義抽出部13、文法辞書14、解析部15、特徴抽出部16、テンプレート登録部17、テンプレートDB18が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
まず、受付部11は、外部から入力された2つの見出し語およびこれらの見出し語の関係を読み込む(ステップS201)。ここで、受付部11には、例えば、同義語、類義語、および意味的に上下関係にある上位語と下位語など、所定の意味関係にある2つの見出し語と、これらの見出し語の関係に関する情報とが入力される。
図3(A)は、見出し語「ドライバ」の語義文「車を運転する人」の解析木、図3(B)は、見出し語「ドライバ」の他の語義文「車の運転を担当する人」の解析木、図3(C)は、図3(A),(B)を抽象化した解析木を示す図である。ここで、図3(A)と図3(B)に示す解析木は、何れも見出し語「ドライバ」の語義文から生成されたものである。これは、例えば、複数の辞書から語義文を抽出することにより、図3(A),(B)に示すように同じ見出し語であっても異なる語義文を抽出することができる。特徴抽出部16は、図3(A),(B)に示すように、同じまたは同義の見出し語に基づく解析木が入力された場合、図3(C)に示すように、それぞれの特徴を抽出して対応付けた2つの解析木を、同義パターンのテンプレートとして生成する。
図4(A)は、見出し語「上り」の語義文「下から上へ移ること」の解析木、図4(B)は、見出し語「下り」の語義文「上から下へ移ること」の解析木、図4(C)は、図4(A),(B)を抽象化した解析木を示す図である。ここで、図4(A)と図4(B)に示す解析木は、反義の関係にある「上り」と「下り」という見出し語の語義文から生成されたものである。特徴抽出部16は、図4(A),(B)に示すように、反義の見出し語に基づく解析木が入力された場合、図4(C)に示すように、それぞれの特徴を抽出して対応付けた2つの解析木を、反義パターンのテンプレートとして生成する。
図5(A)は、見出し語「ドライバ」の語義文「車を運転する人」の解析木、図5(B)は、見出し語「運転手」の語義文「電車や車を運転する人」の解析木、図5(C)は、図5(A),(B)を抽象化した解析木を示す図である。ここで、図5(A)と図5(B)に示す解析木は、意味的に上位と下位の関係にある「ドライバ」と「運転手」という見出し語の語義文から生成されたものである。ここで、見出し語「運転手」の語義文が定義する意味は、見出し語「ドライバ」の語義文が定義する意味を包含しているので、見出し語「運転手」は見出し語「ドライバ」よりも上位にある。特徴抽出部16は、図5(A),(B)に示すように、上位と下位の関係にある見出し語に基づく解析木が入力された場合、図5(C)に示すように、それぞれの特徴を抽出して対応付けた2つの解析木を、上位・下位パターンのテンプレートとして生成する。
図6(A)は、見出し語「桜」の語義文「バラ科の葉が枯れて落ちる木」の解析木、図6(B)は、見出し語「檜」の語義文「檜科の一年葉が緑色の木」の解析木、図6(C)は、図6(A),(B)を抽象化した解析木を示す図である。ここで、図6(A)と図6(B)に示す解析木は、意味的に兄弟の関係、すなわち、共に共通の上位語を有する「桜」と「檜」という見出し語の語義文から生成されたものである。特徴抽出部16は、図6(A),(B)に示すように、兄弟の関係にある見出し語に基づく解析木が入力された場合、図6(C)に示すように、それぞれの特徴を抽出して対応付けた2つの解析木を、兄弟パターンのテンプレートとして生成する。
次に、本発明の第2の実施の形態について詳細に説明する、図7は、本実施の形態にかかる辞書作成装置の構成を示すブロック図である。なお、本実施の形態にかかる辞書作成装置2は、第1の実施の形態のテンプレート作成装置1にさらに関係検出部21、辞書登録部22およびオントロジ辞書23を設けたもので、テンプレートDB18に記憶されたテンプレートを用いて単語の関係を検出し、それをオントロジ辞書に登録することにより、オントロジ辞書を作成するものである。したがって、本実施の形態において、第1の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
Claims (9)
- 入力された意味関係が既知の複数の単語それぞれの語義を説明する語義文を取得する取得手段と、
この取得手段により取得された語義文の構文意味構造を解析する解析手段と、
この解析手段により解析された前記構文意味構造と前記意味関係とを抽象化して対応付けたテンプレートを作成する特徴抽出手段と、
この特徴抽出手段により作成されたテンプレートを記憶する記憶手段と
を備えたことを特徴とするテンプレート作成装置。 - 前記取得手段は、同義語、反義語、意味的に兄弟関係にある語、および、意味的に上下関係にある上位語と下位語のうち何れかの意味関係にある複数の単語が入力される
ことを特徴とする請求項1記載のテンプレート作成装置。 - 複数の単語を各単語間の意味関係に基づいて構造化して記憶したオントロジ辞書を作成する辞書作成装置であって、
所定の構文意味構造と、この構文意味構造に対応する意味関係とを抽象化して対応付けたテンプレートを記憶する記憶手段と、
外部より入力された複数の単語それぞれの語義を説明する語義文を外部より取得する取得手段と、
この取得手段により取得された語義文の構文意味構造を解析する解析手段と、
この解析手段により解析された前記構文意味構造と前記意味関係とを抽象化して対応付けたテンプレートを作成する特徴抽出手段と、
この特徴抽出手段により作成されたテンプレートと、前記記憶手段に記憶されたテンプレートとに基づいて、前記複数の単語間の意味関係を検出する検出手段と、
この検出手段による検出結果に基づいて前記複数の単語を前記オントロジ辞書に登録する辞書登録手段と
を備えたことを特徴とする辞書作成装置。 - 前記検出手段により検出された意味関係を確認する確認手段と、
前記意味関係が正しいと確認されたときに、前記解析手段により解析された構文意味構造と前記意味関係とを対応付けたテンプレートを前記記憶手段に登録させるテンプレート登録手段と
をさらに備えることを特徴とする請求項3記載の辞書作成装置。 - 単語の語義を説明する語義文を取得する取得手段と、文章の構文意味構造を解析する解析手段と、テンプレートを作成する特徴抽出手段と、前記テンプレートを記憶する記憶手段とを備えた辞書作成装置を用いてテンプレートを作成するテンプレート作成方法において、
前記取得手段が、入力された意味関係が既知の複数の単語それぞれの語義を説明する語義文を取得する取得ステップと、
前記解析手段が、前記取得手段が取得した語義文の構文意味構造を解析する解析ステップと、
前記特徴抽出手段が、前記解析手段が解析した前記構文意味構造と前記意味関係とを抽象化して対応付けたテンプレートを作成する特徴抽出ステップと、
前記記憶手段が、前記特徴抽出手段が作成したテンプレートを記憶する記憶ステップと
を備えたことを特徴とするテンプレート作成方法。 - テンプレートを記憶した記憶手段と、単語の語義を説明する語義文を取得する取得手段と、文章の構文意味構造を解析する解析手段と、前記テンプレートを作成する特徴抽出手段と、複数の単語間の意味関係を検出する検出手段と、複数の単語をオントロジ辞書に登録する辞書登録手段とを備えた辞書作成装置を用いてオントロジ辞書を作成する辞書作成方法であって、
前記記憶手段が、所定の構文意味構造と、この構文意味構造に対応する意味関係とを抽象化して対応付けたテンプレートを記憶する記憶ステップと、
前記取得手段が、外部より入力された複数の単語それぞれの語義を説明する語義文を外部より取得する取得ステップと、
前記解析手段が、前記取得手段が取得した語義文の構文意味構造を解析する解析ステップと、
前記特徴抽出手段が、前記解析手段が解析した前記構文意味構造と前記意味関係とを抽象化して対応付けたテンプレートを作成する特徴抽出ステップと、
前記検出手段が、前記特徴抽出手段が作成したテンプレートと、前記記憶手段に記憶させたテンプレートとに基づいて、前記複数の単語間の意味関係を検出する検出ステップと、
前記辞書登録手段が、前記検出手段による検出結果に基づいて前記複数の単語を前記オントロジ辞書に登録する辞書登録ステップと
を備えたことを特徴とする辞書作成方法。 - コンピュータを、請求項1または2に記載のテンプレート作成装置の各手段として機能させることを特徴とするテンプレート作成プログラム。
- コンピュータを、請求項3または4に記載の辞書作成装置の各手段として機能させることを特徴とする辞書作成プログラム。
- 請求項7または8に記載のプログラムを記録したことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005192885A JP4031492B2 (ja) | 2005-06-30 | 2005-06-30 | テンプレート作成装置、辞書作成装置、テンプレート作成方法、辞書作成方法、テンプレート作成プログラム、辞書作成プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005192885A JP4031492B2 (ja) | 2005-06-30 | 2005-06-30 | テンプレート作成装置、辞書作成装置、テンプレート作成方法、辞書作成方法、テンプレート作成プログラム、辞書作成プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007011771A JP2007011771A (ja) | 2007-01-18 |
JP4031492B2 true JP4031492B2 (ja) | 2008-01-09 |
Family
ID=37750165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005192885A Expired - Fee Related JP4031492B2 (ja) | 2005-06-30 | 2005-06-30 | テンプレート作成装置、辞書作成装置、テンプレート作成方法、辞書作成方法、テンプレート作成プログラム、辞書作成プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4031492B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7110554B2 (ja) * | 2017-07-05 | 2022-08-02 | 富士通株式会社 | オントロジー生成装置、オントロジー生成プログラム及びオントロジー生成方法 |
-
2005
- 2005-06-30 JP JP2005192885A patent/JP4031492B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007011771A (ja) | 2007-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101139903B1 (ko) | 자연어 문서들에서 전체 부분 관계들을 인식하는 시만틱 프로세서 | |
US7526474B2 (en) | Question answering system, data search method, and computer program | |
JP4654745B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
US7844598B2 (en) | Question answering system, data search method, and computer program | |
US8185377B2 (en) | Diagnostic evaluation of machine translators | |
US6910004B2 (en) | Method and computer system for part-of-speech tagging of incomplete sentences | |
JP2012520528A (ja) | 自然言語テキストの自動的意味ラベリングのためのシステム及び方法 | |
US20070011160A1 (en) | Literacy automation software | |
JP2016516247A (ja) | 翻字、翻訳、書記素洞察のキュレーション及び統合による多言語ビジネスの印の向上 | |
JP6466138B2 (ja) | 外国語文作成支援装置、方法及びプログラム | |
JP3765799B2 (ja) | 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム | |
Rodrigues et al. | Advanced applications of natural language processing for performing information extraction | |
JP2007011775A (ja) | 辞書作成装置、辞書作成方法、プログラム及び記録媒体 | |
JP2010244385A (ja) | 機械翻訳装置、機械翻訳方法、およびプログラム | |
JP4031492B2 (ja) | テンプレート作成装置、辞書作成装置、テンプレート作成方法、辞書作成方法、テンプレート作成プログラム、辞書作成プログラムおよび記録媒体 | |
JP4054035B2 (ja) | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 | |
Souter et al. | Using Parsed Corpora: A review of current practice | |
KR950013129B1 (ko) | 기계번역장치 및 방법 | |
Fehri et al. | ARmed question answering system | |
Bouziane et al. | Question answering systems: the story till the Arabic linked data | |
Chandra | An intelligent natural language query processor for a relational database | |
JP3353647B2 (ja) | 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体 | |
Osenova et al. | Bulgarian-english question answering: Adaptation of language resources | |
Narayan et al. | Pre-Neural Approaches | |
RAO et al. | A NEW FRAMEWORK: POST-POSITIONAL PARSER AND NALYZER FOR TELUGU PRONOUNS. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071016 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071018 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101026 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101026 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111026 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111026 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121026 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121026 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131026 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |