JP4054035B2 - データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 - Google Patents
データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4054035B2 JP4054035B2 JP2005260331A JP2005260331A JP4054035B2 JP 4054035 B2 JP4054035 B2 JP 4054035B2 JP 2005260331 A JP2005260331 A JP 2005260331A JP 2005260331 A JP2005260331 A JP 2005260331A JP 4054035 B2 JP4054035 B2 JP 4054035B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- meaning
- noun
- dictionary
- typical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
以下、図面を参照して、本発明の第1の実施の形態について図面を参照して説明する。図1は、本実施の形態におけるデータベース構築装置の構成を示すブロック図である。データベース構築装置1は、取得部11と、語義辞書12と、解析部13と、文法辞書14と、抽出部15と、登録部16と、格フレーム辞書17と、典型文DB(Data Base)18とから構成される。このようなデータベース構築装置1は、CPU等の演算装置と、メモリ、HDD(Hard Disc Drive)等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)またはFED(Field Emission Display)等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した取得部11、語義辞書12、解析部13、文法辞書14、抽出部15、登録部16、格フレーム辞書17および典型文DB18が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
説明文削除手段15bは、主節抽出手段15aにより抽出された主節または単文に基づいて、取得部11が取得した語義文が説明文であるか否かを判定し、説明文と判定した語義文を削除するようにしてもよい。なお、説明文以外の語義文は、名詞抽出手段15dに送出される。
名詞抽出手段15cは、説明文削除手段15bから取得した主節または単文から名詞を抽出する。
選択手段15dは、名詞抽出手段15cにより抽出された名詞の中から、典型的指示対象となり得る名詞を選択する。
次に、本発明の第2の実施の形態について詳細に説明する、図5は、本実施の形態にかかるデータベース構築装置の構成を示すブロック図である。なお、本実施の形態にかかるデータベース構築装置2は、第1の実施の形態のデータベース構築装置1にさらに拡張部19および外国語辞書20を設けたものであり、典型文DB18に記憶された述語と典型的指示対象の意味関係を外国語に拡張するものである。したがって、本実施の形態において、第1の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
次に、本発明の第3の実施の形態について詳細に説明する、図8は、本実施の形態にかかる推定装置の構成を示すブロック図である。なお、本実施の形態にかかる推論装置3は、第1,2の実施の形態のデータベース構築装置1により構築された典型文DB18に基づいて、外部から入力された文章が意味するところを検出する
推論を行うものである。したがって、本実施の形態において、第1,2の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
Claims (6)
- 単語と、この単語の語義を説明する語義文とを記憶した語義辞書と、
文法規則を登録した文法辞書と、
個々の動詞について格フレームを記憶した格フレーム辞書と、
前記語義辞書から述語の見出し語と、この見出し語の語義を説明する語義文とを取得する取得手段と、
この取得手段により取得した語義文を前記文法辞書に登録された文法規則に基づいて構文解析する解析手段と、
この解析手段により構文解析された語義文のうち、複文の語義文から主節または単文の語義文を抽出する主節抽出手段と、
この主節抽出手段により抽出された主節または単文の語義文から名詞を抽出する名詞抽出手段と、
この名詞抽出手段により抽出された名詞の中から、形式名詞以外の名詞を選択する選択手段と、
前記格フレーム辞書に基づいて、前記選択手段により選択された名詞の中から、見出し語と組み合わせたときに文章として意味をなす名詞と、この名詞が含まれる語義文の見出し語とを対応づけて見出し語の語義毎に典型文データベースに登録する登録手段と
を備えることを特徴とするデータベース構築装置。 - 前記主節抽出手段により抽出された前記単文の語義文または前記主節に基づいて、当該単文の語義文または当該主節に対応する見出し語が説明文であるか否かを判定し、説明文である場合に当該単文の語義文または当該主節を削除する説明文削除手段をさらに備える
ことを特徴とする請求項1記載のデータベース構築装置。 - 前記説明文削除手段は、前記主節抽出手段により抽出された前記単文の語義文または前記主節に含まれる述語が抽象動詞または状況の意味を持つ名詞である場合に、当該単文の語義文または当該主節が説明文であると判定する
ことを特徴とする請求項2記載のデータベース構築装置。 - 単語およびこの単語の語義を説明する語義文を記憶した語義辞書と、文法規則を登録した文法辞書と、個々の動詞について格フレームを記憶した格フレーム辞書と、前記語義辞書から単語および語義文を取得する取得手段と、文を構文解析する解析手段と、文から主節を抽出する主節抽出手段と、文から名詞を抽出する名詞抽出手段と、選択手段と、単語を典型文データベースに登録する登録手段とを備えたデータベース構築装置を用いて前記典型文データベースを構築するデータベース構築方法であって、
前記取得手段が、前記語義辞書から述語の見出し語と、この見出し語の語義を説明する語義文とを取得する取得ステップと、
前記解析手段が、前記取得ステップにより取得した語義文を前記文法辞書に登録された文法規則に基づいて構文解析する解析ステップと、
前記主節抽出手段が、前記解析ステップにより構文解析された語義文のうち、複文の語義文から主節または単文の語義文を抽出する主節抽出ステップと、
前記名詞抽出手段が、前記主節抽出ステップにより抽出された主節または単文の語義文から名詞を抽出する名詞抽出ステップと、
前記選択手段が、前記名詞抽出ステップにより抽出された名詞の中から、形式名詞以外の名詞を選択する選択ステップと、
前記登録手段が、前記格フレーム辞書に基づいて、前記選択ステップにより選択された名詞の中から、見出し語と組み合わせたときに文章として意味をなす名詞と、この名詞が含まれる語義文の見出し語とを対応づけて見出し語の語義毎に典型文データベースに登録する登録ステップと
を有することを特徴とするデータベース構築方法。 - コンピュータを、請求項1乃至3の何れか1項に記載のデータベース構築装置の各手段として機能させることを特徴とするデータベース構築プログラム。
- 請求項5記載のデータベース構築プログラムが記録されたコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005260331A JP4054035B2 (ja) | 2005-09-08 | 2005-09-08 | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005260331A JP4054035B2 (ja) | 2005-09-08 | 2005-09-08 | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007072841A JP2007072841A (ja) | 2007-03-22 |
JP4054035B2 true JP4054035B2 (ja) | 2008-02-27 |
Family
ID=37934219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005260331A Expired - Fee Related JP4054035B2 (ja) | 2005-09-08 | 2005-09-08 | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4054035B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11017172B2 (en) | 2018-08-01 | 2021-05-25 | Signals Analytics Ltd. | Proposition identification in natural language and usage thereof for search and retrieval |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630313A (zh) * | 2008-07-18 | 2010-01-20 | 富士施乐株式会社 | 单词对齐装置、例句对译词典及单词对齐方法 |
CN115304536B (zh) * | 2022-07-26 | 2023-09-22 | 合肥工业大学 | 一种吲哚啉-2-酮化合物衍生物的制备及用途 |
-
2005
- 2005-09-08 JP JP2005260331A patent/JP4054035B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11017172B2 (en) | 2018-08-01 | 2021-05-25 | Signals Analytics Ltd. | Proposition identification in natural language and usage thereof for search and retrieval |
Also Published As
Publication number | Publication date |
---|---|
JP2007072841A (ja) | 2007-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McKeown et al. | Collocations | |
US6910004B2 (en) | Method and computer system for part-of-speech tagging of incomplete sentences | |
JP2008276517A (ja) | 訳文評価装置、訳文評価方法およびプログラム | |
Petrović et al. | Extending lexical association measures for collocation extraction | |
US20120124467A1 (en) | Method for automatically generating descriptive headings for a text element | |
Evans et al. | Identifying signs of syntactic complexity for rule-based sentence simplification | |
Lee | Using lexical bundle analysis as discovery tool for corpus-based translation research | |
Glass et al. | A naive salience-based method for speaker identification in fiction books | |
JP4054035B2 (ja) | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 | |
Boulaknadel et al. | Amazighe Named Entity Recognition using a A rule based approach | |
Radoev et al. | AMAL: answering french natural language questions using DBpedia | |
Foufi et al. | Multilingual parsing and MWE detection | |
Sánchez et al. | An unsupervised method for automatic validation of verbal phraseological units | |
JPH0332106B2 (ja) | ||
Lloret et al. | Are better summaries also easier to understand? analyzing text complexity in automatic summarization | |
JPH09179875A (ja) | 情報検索装置 | |
Roberts et al. | A large automatically-acquired all-words list of multiword expressions scored for compositionality | |
Subcommittee | White Paper-Indian Language Resources--Text Processing Subcommittee Report | |
JPH0322083A (ja) | 自然言語処理装置 | |
JP2009223373A (ja) | 曖昧性評価装置およびプログラム | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
JP3956730B2 (ja) | 言語処理装置 | |
Zakria et al. | Semantic Representation Extraction from Unstructured Arabic Text | |
JP3109123B2 (ja) | 画像処理装置 | |
Bilal | Detecting Location Names in French Life-Story Interview Transcripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070911 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131214 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |