JP2007072841A - 単語抽出方法、データベース構築方法、データベース構築装置、データベース構築プログラムおよび記録媒体 - Google Patents
単語抽出方法、データベース構築方法、データベース構築装置、データベース構築プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2007072841A JP2007072841A JP2005260331A JP2005260331A JP2007072841A JP 2007072841 A JP2007072841 A JP 2007072841A JP 2005260331 A JP2005260331 A JP 2005260331A JP 2005260331 A JP2005260331 A JP 2005260331A JP 2007072841 A JP2007072841 A JP 2007072841A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- noun
- predicate
- word
- meaning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】取得部11は、語義辞書12から述語の見出し語と、この見出し語の語義文とを取得する。解析部13は、取得部11が取得した語義文を構造解析する。抽出部15は、解析部13により構造解析が行われた語義文から名詞を抽出する。登録部16は、取得部11が取得した述語と、抽出部15が抽出した名詞とを対応付けて典型文DB18に登録する。これにより、典型文DB18には、述語に対応するより具体的な主語または目的語が登録される。
【選択図】 図1
Description
以下、図面を参照して、本発明の第1の実施の形態について図面を参照して説明する。図1は、本実施の形態におけるデータベース構築装置の構成を示すブロック図である。データベース構築装置1は、取得部11と、語義辞書12と、解析部13と、文法辞書14と、抽出部15と、登録部16と、格フレーム辞書17と、典型文DB(Data Base)18とから構成される。このようなデータベース構築装置1は、CPU等の演算装置と、メモリ、HDD(Hard Disc Drive)等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)またはFED(Field Emission Display)等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した取得部11、語義辞書12、解析部13、文法辞書14、抽出部15、登録部16、格フレーム辞書17および典型文DB18が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
説明文削除手段15bは、主節抽出手段15aにより抽出された主節または単文に基づいて、取得部11が取得した語義文が説明文であるか否かを判定し、説明文と判定した語義文を削除するようにしてもよい。なお、説明文以外の語義文は、名詞抽出手段15dに送出される。
名詞抽出手段15cは、説明文削除手段15bから取得した主節または単文から名詞を抽出する。
選択手段15dは、名詞抽出手段15cにより抽出された名詞の中から、典型的指示対象となり得る名詞を選択する。
次に、本発明の第2の実施の形態について詳細に説明する、図5は、本実施の形態にかかるデータベース構築装置の構成を示すブロック図である。なお、本実施の形態にかかるデータベース構築装置2は、第1の実施の形態のデータベース構築装置1にさらに拡張部19および外国語辞書20を設けたものであり、典型文DB18に記憶された述語と典型的指示対象の意味関係を外国語に拡張するものである。したがって、本実施の形態において、第1の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
次に、本発明の第3の実施の形態について詳細に説明する、図8は、本実施の形態にかかる推定装置の構成を示すブロック図である。なお、本実施の形態にかかる推論装置3は、第1,2の実施の形態のデータベース構築装置1により構築された典型文DB18に基づいて、外部から入力された文章が意味するところを検出する
推論を行うものである。したがって、本実施の形態において、第1,2の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
Claims (10)
- 述語とこの述語の語義文とを電子化された語義辞書から取得する取得ステップと、
前記語義文から名詞を抽出する抽出ステップと
を備えることを特徴とする単語抽出方法。 - 前記抽出ステップは、
前記語義文に対して構文解析を行う解析ステップと、
この解析ステップにより構文解析が行われた語義文から名詞を抽出する名詞抽出ステップと
を有することを特徴とする請求項1記載の単語抽出方法。 - 前記名詞抽出ステップは、前記語義文が複文の場合、前記語義文の主節から名詞を抽出する
ことを特徴とする請求項2記載の単語抽出方法。 - 前記名詞抽出ステップは、前記語義文の文末の単語が所定の単語の場合、前記語義文から名詞を抽出しない
ことを特徴とする請求項2または3記載の単語抽出方法。 - 前記抽出ステップは、前記名詞抽出ステップにより抽出された名詞が所定の単語の場合、その名詞を抽出しない選択ステップ
をさらに有することを特徴とする請求項2乃至4の何れか1項に記載の単語抽出方法。 - 述語とこの述語の語義文とを電子化された語義辞書から取得する取得ステップと、
前記語義文から名詞を抽出する抽出ステップと、
この抽出ステップにより抽出された名詞と、前記述語とを対応付けてデータベースに登録する登録ステップと
を有することを特徴とするデータベース構築方法。 - 前記データベースに登録された述語を他の言語に翻訳する翻訳ステップと、
この翻訳ステップにより翻訳された訳語と、前記述語とを対応付けて前記データベースに登録する訳語登録ステップと
をさらに有することを特徴とする請求項6記載のデータベース構築方法。 - 述語とこの述語の語義文とを電子化された語義辞書から取得する取得手段と、
前記語義文から名詞を抽出する抽出手段と、
この抽出ステップにより抽出された名詞と、前記述語とを対応付けてデータベースに登録する登録手段と
を有することを特徴とするデータベース構築装置。 - コンピュータに、
述語とこの述語の語義文とを電子化された語義辞書から取得する取得ステップと、
前記語義文から名詞を抽出する抽出ステップと、
この抽出ステップにより抽出された名詞と、前記述語とを対応付けてデータベースに登録する登録ステップと
を実行させることを特徴とするデータベース構築プログラム。 - 請求項9に記載のデータベース構築プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005260331A JP4054035B2 (ja) | 2005-09-08 | 2005-09-08 | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005260331A JP4054035B2 (ja) | 2005-09-08 | 2005-09-08 | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007072841A true JP2007072841A (ja) | 2007-03-22 |
JP4054035B2 JP4054035B2 (ja) | 2008-02-27 |
Family
ID=37934219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005260331A Expired - Fee Related JP4054035B2 (ja) | 2005-09-08 | 2005-09-08 | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4054035B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010027020A (ja) * | 2008-07-18 | 2010-02-04 | Fuji Xerox Co Ltd | 単語アライメント装置及び単語アライメントプログラム |
CN115304536A (zh) * | 2022-07-26 | 2022-11-08 | 合肥工业大学 | 一种吲哚啉-2-酮化合物衍生物的制备及用途 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11017172B2 (en) | 2018-08-01 | 2021-05-25 | Signals Analytics Ltd. | Proposition identification in natural language and usage thereof for search and retrieval |
-
2005
- 2005-09-08 JP JP2005260331A patent/JP4054035B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010027020A (ja) * | 2008-07-18 | 2010-02-04 | Fuji Xerox Co Ltd | 単語アライメント装置及び単語アライメントプログラム |
CN115304536A (zh) * | 2022-07-26 | 2022-11-08 | 合肥工业大学 | 一种吲哚啉-2-酮化合物衍生物的制备及用途 |
Also Published As
Publication number | Publication date |
---|---|
JP4054035B2 (ja) | 2008-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McKeown et al. | Collocations | |
US6910004B2 (en) | Method and computer system for part-of-speech tagging of incomplete sentences | |
US10296584B2 (en) | Semantic textual analysis | |
Baker et al. | Modality and negation in SIMT use of modality and negation in semantically-informed syntactic MT | |
JP2008276517A (ja) | 訳文評価装置、訳文評価方法およびプログラム | |
US20120124467A1 (en) | Method for automatically generating descriptive headings for a text element | |
Evans et al. | Identifying signs of syntactic complexity for rule-based sentence simplification | |
Glass et al. | A naive salience-based method for speaker identification in fiction books | |
JP4054035B2 (ja) | データベース構築装置、データベース構築方法、データベース構築プログラムおよび記録媒体 | |
Boulaknadel et al. | Amazighe Named Entity Recognition using a A rule based approach | |
Radoev et al. | AMAL: answering french natural language questions using DBpedia | |
Martínez Alonso et al. | Identification of sense selection in regular polysemy using shallow features | |
Sánchez et al. | An unsupervised method for automatic validation of verbal phraseological units | |
Lloret et al. | Are better summaries also easier to understand? analyzing text complexity in automatic summarization | |
JPH09179875A (ja) | 情報検索装置 | |
Subcommittee | White Paper-Indian Language Resources--Text Processing Subcommittee Report | |
Srdanovic et al. | A web corpus and word sketches for Japanese | |
Althobaiti | Minimally-supervised Methods for Arabic Named Entity Recognition | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
JPH0322083A (ja) | 自然言語処理装置 | |
JP2009223373A (ja) | 曖昧性評価装置およびプログラム | |
JP3109123B2 (ja) | 画像処理装置 | |
Bilal | Detecting Location Names in French Life-Story Interview Transcripts | |
Farghaly et al. | Natural Language Understanding for Simultaneous Conference Interpretation | |
KR101450795B1 (ko) | 대용어 복원 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070911 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131214 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |