JPH03188566A - 辞書連動テキストベース装置 - Google Patents

辞書連動テキストベース装置

Info

Publication number
JPH03188566A
JPH03188566A JP1327671A JP32767189A JPH03188566A JP H03188566 A JPH03188566 A JP H03188566A JP 1327671 A JP1327671 A JP 1327671A JP 32767189 A JP32767189 A JP 32767189A JP H03188566 A JPH03188566 A JP H03188566A
Authority
JP
Japan
Prior art keywords
text
search
level
dictionary
morpheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1327671A
Other languages
English (en)
Inventor
Kunio Matsui
くにお 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1327671A priority Critical patent/JPH03188566A/ja
Priority to US07/629,741 priority patent/US5151857A/en
Publication of JPH03188566A publication Critical patent/JPH03188566A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 テキストの検索機能を有するテキストベース装置におい
て、テキストベースを、電子化辞書に連動させることに
より、多種多様のレベルによる検索を可能とした辞書連
動テキストベース装置に関し。
検索結果の高精度化を可能とすることを目的とし。
検索対象となるテキストベースと、各項目の形態素と文
法属性と概念とを結び付ける情報を持つ辞書と、上記辞
書中の各項目に関する形態素1文法属性、概念のそれぞ
れについて関係するテキストベースを示す情報を持つ関
係情報部とを備え。
形態素レベル、構文レベル、意味レベルでそれぞれの検
索を可能とするように構成する。
〔産業上の利用分野〕
本発明は、テキストの検索機能を有するデータベース装
置において、テキストベースを、電子化辞書に連動させ
ることにより、多種多様のレベルによる検索を可能とし
た辞書連動テキストベース装置に関する。
近年の自然言語処理技術の発達に伴い、情報検索技術の
高精度化が要求されている。このため。
ユーザのニーズにマツチするレベルでのテキストの検索
を可能にし、さらに検索した結果を、自然言語処理技術
へフィート′バックすることが必要である。
〔従来の技術〕
従来のテキストベース装置においては、テキストベース
中に存在する単語をキーワードとして蓄え、そのキーワ
ードを索引としてテキストを検索するようにしていた。
ところが、キーワードを索引とする検索では。
検索する単語が多義である場合、ユーザが要求する意味
以外のテキストについても検索を行ってしまい、検索結
果の識別は、ユーザに依存することになった。また、キ
ーワードの設定は、テキストベース作成者に依存すると
ころが多いため、キーワードの統一がなく、検索結果の
一貫性が保たれなくなることがあった。
〔発明が解決しようとする課題〕
したがって、従来のテキストベース装置において、形態
素レベルのみの検索では、単語の多義性を解消できない
という欠点が生じていた。また。
テキストベースと辞書とが連動していないため。
キーワードに新語を登録しても、以前のテキストに反映
することができず、検索結果の一貫性が保たれなく問題
も生じていた。
本発明は、ii電子化辞書テキストベースとを連動させ
ることにより、形態素レベル・構文レベル・意味レベル
でのテキスト検索を可能とし、辞書に基づいたキーワー
ドの設定によって検索結果の高精度化を可能とすること
を目的としている。
〔課題を解決するための手段〕
第1図は本発明の原理構成図である。
第1図において、10は本発明に係る辞書連動テキスト
ベース装置、11はマンマシンインクフェースを含む入
出力の制御を行う入出力制御部。
12は検索処理に関する制御を行う検索制御部。
13は辞書編集処理に関する制御を行う辞書編集部、1
4はテキス)[集処理に関する制御を行うテキスト編集
部、15はアクセスを行うデータの関係情報を制御する
データ制御部、16は電子化辞書、17は関係情報部、
1Bは形態索表、19は文法属性表520は概念表、2
1は検索対象となるテキストに関する情報が格納されて
いるテキストベースを表す。
入出力制御部11は、検索制御部12.辞書編集部13
およびテキスト編集部14の入出力を制御する。検索制
御部12は、入出力制御部11から受は取った検索要求
を、データ制御部15に対して送出する。辞書編集部1
3は、を子化辞書16のデータの編集・管理を行う。テ
キスト編集部14は、テキストベース21のデータの編
集・管理を行う。
関係情報部17における形態索表18は、言語固有の形
態素を、その識別子(MID)と対応させたものである
文法属性表19は1品詞や構文要素などの文法属性をセ
ットとしてまとめ、それぞれを識別子(GID)と対応
させたものである。
概念表20は、言語に依存しない概念を、その識別子(
CI D)と対応させたものである。
電子化辞書16は、形態素・文法属性・概念のそれぞれ
の識別子を組み合わせたものと、辞書項目の識別子(D
ID)とを対応させたものである。
電子化辞書16において1文法属性の識別子は。
常に単一であるが、形態素と概念の識別子は、単一の場
合と複合の場合とがある。これは、複合形態素(いわゆ
る慣用句)や複合概念(複数の概念の組み合わせによる
概念)に対応するためであるが、形態素および概念の識
別子のどちらか一方は。
必ず単一である。
テキストベース21は、1つの文について、形態素列・
文法属性構造・概念構造のそれぞれの識別子を組み合わ
せたものと、その文の識別子(TID)とを対応させた
ものである。
形態索表18中のDIDIは、電子化辞書16における
項目の識別子DIDとその順序を示し。
TIDIは、テキストベース21におけるテキスト文の
識別子TIDとその順序を示す。文法属性表19中のD
ID2は、電子化辞書16におけるDIDとその構造(
深さと構文関係と依存関係)を示し、TID2は、テキ
ストベース21におけるTIDとその構造(深さと構文
関係と依存関係)を示す。概念表20中のDID3は、
1を子化辞書16におけるDIDとその構造(深さと意
味的関係と依存関係)を示し、TID3は、テキストベ
ース21におけるTIDとその構造(深さと意味的関係
と依存関係)を示す。
なお、いずれの項目も、電子化辞書16およびテキスト
ベース21上に出現するすべての表現を格納する。
〔作用〕
第2図は9本発明で扱う検索関係情報の例を示す。
例えば、検索対象のテキス1−TEXTが、「彼は東京
へ行<、」であるとする。これに関連する情報として1
本発明では、第2図に示すような形態素1文法属性構造
および概念のそれぞれの面から捉えた情報を、各要素ご
とに、関係情報部17の形態索表181文法属性表19
.概念表20にあらかじめ設定しておき、これらの要素
の関係を電子化辞書16で管理しておく。なお、形態素
は。
「彼/は/東京/・・・」というように、テキストベー
ス21に現れる文を単語要素に分解したものであり1文
法属性構造は1代名詞、助詞、・・・といった品詞や、
係り受けなどを示す構文要素などの情報を持つものであ
る。概念は、言語表現から離れた意味内容を示す。
また、形態索表18.文法属性表19.概念表20の要
素を、それに関係するテキストベース21に対応づける
こうして管理される関係情報部17により、形態素レベ
ル、構文レベルおよび意味レベルの検索要求に対して、
柔軟に対応することができる。
また、を子化辞書16またはテキストベース21の編集
による変更に対して、結果を関係情報部17に反映させ
、電子化辞書16とテキストベース21とを連動させて
変化させることにより、検索関係情報の一貫性を保ち、
検索結果の高精度化を実現することができる。
〔実施例〕
第3図は本発明の実施例に係るデータ構造の例。
第4図は本発明の実施例に係る検索要求に対する処理フ
ロー、第5図は本発明の実施例に係る辞書編集要求に対
する処理フロー、第6図は本発明の実施例に係るテキス
トa集要求に対する処理フロ第7図は本発明の実施例に
よる形態素レベルの検索の例、第8図は本発明の実施例
による構文レベルの検索の例、第9図は本発明の実施例
による意味レベル(多義語)の検索の例、第10図は本
発明の実施例による意味レベル(含有語)の検索の例、
第11図は本発明の実施例による辞書編集の例を示す。
例えば、第2図に示すような形態素1文法属性構造、概
念の検索関係情報は、第3図に示すようなデータ構造に
よって実現される。
形態索表18は、「は」、「へJ+  r彼」、・・・
などの言語間をの形態素を、その識別子MIDに対応さ
せたもので、DIDI、TIDIとして。
関係する電子化辞書16とテキストベース21を示す情
報を保持する。
文法属性表19は1品詞や構文要素などの文法属性を、
その識別子GIDに対応させたもので。
DID2.TID2として、関係する電子化辞書16と
テキストベース21を示す情報を保持する。
概念表20は、言語に依存しない意味的な要素を1wh
別子CIDに対応させたもので、関係する電子化辞書1
6とテキストベース21を示す情報を保持する。
第3図において、電子化辞書16のDIDが20066
1のものを見ると、MID4.CID4.CID4によ
り、形態素が「彼」1文法属性が「代名詞」、概念が「
あの男」および「遠くにある事物」を意味するものが、
関連付けられることがわかる。
「私は東京へ行く。」を表すテキストの場合。
第3図に示すテキストベース21のMID5.CID5
.CID5の形で、データを保持する。
検索要求に対する処理は、第4図に示すように行われる
。以下、第4図に示す処理■〜[相]に従って説明する
■ 入出力制御部11ば、ユーザからの検索要求を受は
付けると、検索制御部12に通知する。
■ 検索制御部12は、その検索要求を解析し。
データ制御部15における検索の手順を決定する。
■ まず、要求された検索レベルが、形態素レベルかど
うかを判定する。形態素レベルの検索の場合、形態索表
18からその識別子MIDを参照し、テキストベース2
1を直接検索し、その識別子TIDを求める。そのため
、処理[相]へ制御を移す。
■ 検索レベルが形態素レベルでないとき5次に構文レ
ベルかどうかを判定する。構文レベルでないときには、
処理■へ移る。
■〜■ 構文レベルの検索では、形態索表18から得た
識別子DIDIから電子化辞書16を参照し、その識別
子GID4を求め、さらにその識別子GID4から文法
属性表19を参照し。
その要素を求め、要求の確認を行ってから処理[株]へ
移る。また、検索要求が文法属性表19の要素であるな
らば、処理[相]へ移り、テキストベース21を直接検
索する。
■ 検索レベルが意味レベルかどうかを判定する。
意味レベルでもない場合、処理を終了する。
[相]〜■ 意味レベルの検索では、形態索表18から
得た識別子DIDIから電子、化辞書16を参照し、そ
の識別子CID4を求め、さらにその識別子CID4か
ら概念表20を参照し、要素を求め、特に複数の要素が
存在するときなど要求の確認を行って5処理[相]へ移
る。また、検索要求が、概念表20の要素であるならば
、処理■へ移り、テキストベース2工を直接検索する。
[相] テキストベース21を検索することにより。
その識別子TIDを求める。そのTJDに基づいて検索
結果を編集し出力する。
辞書編集要求に対する処理は、第5図に示すように行わ
れる。以下、第5図に示す処理■〜■に従って説明する
■ 入出力制御部11は、ユーザからの辞書編集要求を
受は付けると、辞書編集部13に通知する。
■ 辞書編集部13は、その辞書編集要求を解析し、デ
ータ制御部15における辞書編集の手順を決定する。
■〜■ ここで、形態索表181文法属性表19または
概念表20に、追加・更新・削除の変更が生した場合に
は、それぞれの変更に応してテキストベース21を変更
する。
テキス[集要求に対する処理は、第6図に示すように行
われる。以下、第6図に示す処理■〜■に従って説明す
る。
■ 入出力制御部11は、ユーザからのテキスト編集要
求を受は付けると、テキスト編集部14に通知する。
■ テキス)I集部14は、そのテキスト編集要求を解
析し、データ制御部15におけるテキスト編集の手順を
決定する。
■〜■ ここで、形態索表181文法属性表19または
概念表20に、追加・更新・削除の変更が生じた場合に
は、それぞれの変更に応じて電子化辞書16を変更する
以上のように処理することにより、電子化辞書16とテ
キストベース21とが連動して変化することになり、一
貫性が保たれるとともに、検索結果の高精度化が実現さ
れる。
第7図は、検索レベルが形態素レベルの場合の本発明の
実施例を示している。
例えば、形態素レベルの指定による「東京」の検索要求
があった場合、形態索表18から、その識別子M I 
D (000412)を参照し、テキストベース21を
直接検索する。この例では、検索結果として、「彼が東
京に来た。」というテキストが求められている。
第8図は、検索レベルが構文レベルの場合の本発明の実
施例を示している。
例えば、構文レベルの指定による「東京」の検索要求が
あった場合、形態索表18から得た識別子M I D 
(000412)から、を子化辞書16を参照し、その
識別子c r D 4 (OooO08)を求め、さら
にその識別子G I D 4 (00000B)から9
文法属性表19を参照し、その要素を求め、テキストベ
ース21を検索して、その識別子TIDを求める。
ここでは、「東京」も「大阪」も同じ文法属性を持つた
め、「彼が東京に来た。」、「大阪に来た人は、幸運だ
った。」、・・・というような検索結果が得られている
第9図は、検索レベルが意味レベルの多義語の場合の本
発明の実施例を示している。
例えば、意味レベル(多義語)の指定によるrMT、の
検索要求があった場合、形態索表18から得た識別子M
 I D (000111)から、を子化辞書16を参
照し、その識別子CID4 (103459/1034
60)を求め、さらにその識別子CID4 (1034
59/103460)から、概念表20を参照し。
その要素を求める。ここでは要素が2つあるので。
要求が「磁気テープ」という意味の概念であるのか、「
機械翻訳」という意味の概念であるのかを。
ユーザに確認する。もし、「機械翻訳」の概念が選択さ
れたならば、それの対応するテキストベース21を検索
し、その識別子TIDを求める。
この例では、検索結果として、rMTは翻訳者に脅威で
あった。」のテキストが出力され rMTによって記憶
する。」のテキストは検索対象から外されている。
第10図は5検索レベルが意味レベルの含有語の場合の
本発明の実施例を示している。
例えば、意味レベル(含有語)の指定による「東京」の
検索要求があった場合、形態索表18から得た識別子M
 I D (000412)から、を子化辞書16を参
照し、その識別子CI D 4 (103457)を求
める。さらにその識別子Cr D 4 (103457
)から、概念表20を参照し、その要素を求めて。
確認の上、テキストベース21を検索し、その識別子T
IDを求める。
ここでは、「上京」という語が、「東京という所」とい
う概念と「出掛けること」という概念から成り立ってい
るため5検索要求が「上京」という語を指定しなくても
、検索の対象として選択される。この例では、検索結果
として、「彼が東京に来た。」「故郷の友人が上京した
。」、・・・のテキストが出力されている。
以上の検索要求に対する処理では、形態素レベル・構文
レベル・意味レベルの個々の要求についての処理を説明
したが、もちろん複数の語について複数の検索レベルを
指定し、AND条件やOR条件で結合した要求を同様に
処理することが可能である。
第11図は、辞書編集要求に対して、テキストベース2
1が連動して変更される場合の本発明の実施例を示して
いる。
例えば、′を子化辞書16に「東京ドーム」を追加する
辞書編集要求があったとする。ここで、形態索表18お
よび文法属性表19では、既存の「東京」と「ドーム」
という要素の組み合わせで「東京ドーム」を定義できる
が、概念表20に追加が生じる。
そこで、第11図に示すように、追加された「東京ドー
ムという野球場」の概念(CID−557868)を、
テキストベース21に反映させるとともに、既存の分割
された概念(CI D =009856゜103457
)に対しては、その関連するDID3およびTID3の
削除を行う、このようにして、1を子化辞書16の変更
が、既存のテキストベース21に反映され、検索結果の
高精度化が実現される。
テキス)W集要求に対する処理の場合も同様に。
テキストベース21と電子化辞書16が連動して変化す
るようにされ、一貫性が保たれる。
〔発明の効果〕
以上説明したように9本発明によれば、形態素レベル・
構文レベル・意味レベルでそれぞれの検素が可能となる
効果を奏し、テキストベースと電子化辞書とを連動させ
ることにより、辞書の変更をテキストベースに反映させ
ることができるため。
情報検索技術の高精度化に寄与するところが大きい。
【図面の簡単な説明】
第1図は本発明の原理構成図。 第2図は本発明で扱う検索関係情報の例。 第3図は本発明の実施例に係るデータ構造の例。 第4図は本発明の実施例に係る検索要求に対する処理フ
ロー 第5図は本発明の実施例に係る辞書編集要求に対する処
理フロー 第6図は本発明の実施例に係るテキス)W集要求に対す
る処理フロー 第7図は本発明の実施例による形態素レベルの検索の例
。 第8図は本発明の実施例による構文レベルの検索の例。 第9図は本発明の実施例による意味レベル(多義語)の
検索の例。 第10図は本発明の実施例による意味レベル(含有梧)
の検索の例。 第11図は本発明の実施例による辞書編集の例を示す。 図中、10は辞書連動テキストベース装置、11は入出
力制御部、12は検索制御部、13は辞書編集部、14
はテキス)[東部、15はデータ制御部、16は電子化
辞書、17は関係情報部。 18は形態索表、19は文法属性表、20は概念表、2
1はテキストベースを表す。

Claims (1)

  1. 【特許請求の範囲】 テキストの検索機能を有するテキストベース装置におい
    て、 検索対象となるテキストベース(21)と、各項目の形
    態素と文法属性と概念とを結び付ける情報を持つ辞書(
    16)と、 上記辞書中の各項目に関する形態素、文法属性、概念の
    それぞれについて関係するテキストベースを示す情報を
    持つ関係情報部(17)とを備え、形態素レベル、構文
    レベル、意味レベルでそれぞれの検索を可能とした辞書
    連動テキストベース装置。
JP1327671A 1989-12-18 1989-12-18 辞書連動テキストベース装置 Pending JPH03188566A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1327671A JPH03188566A (ja) 1989-12-18 1989-12-18 辞書連動テキストベース装置
US07/629,741 US5151857A (en) 1989-12-18 1990-12-18 Dictionary linked text base apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1327671A JPH03188566A (ja) 1989-12-18 1989-12-18 辞書連動テキストベース装置

Publications (1)

Publication Number Publication Date
JPH03188566A true JPH03188566A (ja) 1991-08-16

Family

ID=18201674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1327671A Pending JPH03188566A (ja) 1989-12-18 1989-12-18 辞書連動テキストベース装置

Country Status (2)

Country Link
US (1) US5151857A (ja)
JP (1) JPH03188566A (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297040A (en) * 1991-10-23 1994-03-22 Franklin T. Hu Molecular natural language processing system
JP3516208B2 (ja) * 1992-02-20 2004-04-05 富士通株式会社 テキスト編集処理装置および編集処理方法
JP2596869B2 (ja) * 1992-04-30 1997-04-02 松下電器産業株式会社 概念辞書管理装置
JPH05314166A (ja) * 1992-05-08 1993-11-26 Sharp Corp 電子化辞書および辞書検索装置
DE69432575T2 (de) * 1993-01-28 2004-03-18 Kabushiki Kaisha Toshiba, Kawasaki Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
ES2163402T3 (es) * 1993-10-19 2002-02-01 Xerox Corp Grupos de palabras almacenados de manera compacta.
WO1995012173A2 (en) * 1993-10-28 1995-05-04 Teltech Resource Network Corporation Database search summary with user determined characteristics
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
EP0720090A2 (en) * 1994-12-28 1996-07-03 Canon Kabushiki Kaisha Information processing system for completing or resolving ambiguity of input information and method therefor
US6173298B1 (en) 1996-09-17 2001-01-09 Asap, Ltd. Method and apparatus for implementing a dynamic collocation dictionary
US6119114A (en) * 1996-09-17 2000-09-12 Smadja; Frank Method and apparatus for dynamic relevance ranking
US6092074A (en) 1998-02-10 2000-07-18 Connect Innovations, Inc. Dynamic insertion and updating of hypertext links for internet servers
US6401061B1 (en) * 1999-05-13 2002-06-04 Yuri L. Zieman Combinatorial computational technique for transformation phrase text-phrase meaning
JP3662519B2 (ja) * 2000-07-13 2005-06-22 シャープ株式会社 光ピックアップ
US7010479B2 (en) * 2000-07-26 2006-03-07 Oki Electric Industry Co., Ltd. Apparatus and method for natural language processing
US7130861B2 (en) 2001-08-16 2006-10-31 Sentius International Corporation Automated creation and delivery of database content
US6859803B2 (en) 2001-11-13 2005-02-22 Koninklijke Philips Electronics N.V. Apparatus and method for program selection utilizing exclusive and inclusive metadata searches
US7200589B1 (en) * 2002-10-03 2007-04-03 Hewlett-Packard Development Company, L.P. Format-independent advertising of data center resource capabilities
US6980949B2 (en) * 2003-03-14 2005-12-27 Sonum Technologies, Inc. Natural language processor
US7739255B2 (en) * 2006-09-01 2010-06-15 Ma Capital Lllp System for and method of visual representation and review of media files
US20080109845A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp System and method for generating advertisements for use in broadcast media
US20080109409A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp Brokering keywords in radio broadcasts
US20080109305A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp Using internet advertising as a test bed for radio advertisements
US9396262B2 (en) * 2007-10-12 2016-07-19 Lexxe Pty Ltd System and method for enhancing search relevancy using semantic keys
US9875298B2 (en) * 2007-10-12 2018-01-23 Lexxe Pty Ltd Automatic generation of a search query
US20110119261A1 (en) * 2007-10-12 2011-05-19 Lexxe Pty Ltd. Searching using semantic keys
US9367608B1 (en) * 2009-01-07 2016-06-14 Guangsheng Zhang System and methods for searching objects and providing answers to queries using association data
US9201927B1 (en) * 2009-01-07 2015-12-01 Guangsheng Zhang System and methods for quantitative assessment of information in natural language contents and for determining relevance using association data
EP2478451A2 (en) * 2009-09-18 2012-07-25 Lexxe PTY Ltd Method and system for scoring texts
US10198506B2 (en) 2011-07-11 2019-02-05 Lexxe Pty Ltd. System and method of sentiment data generation
US10311113B2 (en) 2011-07-11 2019-06-04 Lexxe Pty Ltd. System and method of sentiment data use
CN102999547A (zh) * 2011-09-16 2013-03-27 莱克西私人有限公司 搜索查询的自动生成
US9075791B2 (en) * 2012-12-20 2015-07-07 Bank Of America Corporation Enterprise concept definition management
US9298696B2 (en) 2012-12-20 2016-03-29 Bank Of America Corporation Semantic application logging and analytics
US10146751B1 (en) 2014-12-31 2018-12-04 Guangsheng Zhang Methods for information extraction, search, and structured representation of text data
CN108885617B (zh) * 2016-03-23 2022-05-31 株式会社野村综合研究所 语句解析系统以及程序

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6126176A (ja) * 1984-07-17 1986-02-05 Nec Corp 言語処理用辞書
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4862408A (en) * 1987-03-20 1989-08-29 International Business Machines Corporation Paradigm-based morphological text analysis for natural languages
JPS6410300A (en) * 1987-07-03 1989-01-13 Hitachi Ltd User's interface system for searching
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
JP2664915B2 (ja) * 1988-01-12 1997-10-22 株式会社日立製作所 情報検索システム
US4849898A (en) * 1988-05-18 1989-07-18 Management Information Technologies, Inc. Method and apparatus to identify the relation of meaning between words in text expressions
US5007019A (en) * 1989-01-05 1991-04-09 Franklin Electronic Publishers, Incorporated Electronic thesaurus with access history list

Also Published As

Publication number Publication date
US5151857A (en) 1992-09-29

Similar Documents

Publication Publication Date Title
JPH03188566A (ja) 辞書連動テキストベース装置
JP3836928B2 (ja) データベース処理方法
Kowalski et al. Information storage and retrieval systems: theory and implementation
JP2783558B2 (ja) 要約生成方法および要約生成装置
Cafarella et al. Knowitnow: Fast, scalable information extraction from the web
US7266553B1 (en) Content data indexing
US6983240B2 (en) Method and apparatus for generating normalized representations of strings
Baptist et al. Genesis-II: A versatile system for language generation in conversational system applications
JPH03278174A (ja) 異言語交信用翻訳方法およびシステム
Aliod et al. A real world implementation of answer extraction
Sharoff Meaning as use: exploitation of aligned corpora for the contrastive study of lexical semantics.
Aksyonoff Introduction to Search with Sphinx: From installation to relevance tuning
Schulz et al. Indexing medical WWW documents by morphemes
Schulze et al. The CQP user’s manual
Conover et al. Pangloss: Fast entity linking in noisy text environments
Maarek Automatically constructing simple help systems from natural language documentation
JP5148583B2 (ja) 機械翻訳装置、方法及びプログラム
Bai Describing the Grammatical Knowledge of Chinese Words for Natural Language Processing
JP3601869B2 (ja) 機械翻訳システム
Tikk et al. Searching the deep web: the WOW project
Theobald TopX: efficient and versatile top-k query processing for text, structured, and semistructured data
KR100522719B1 (ko) 자질연산 구문분석기법을 이용한 범용정보 추출 템플리트구성방법
JP3294966B2 (ja) 機械翻訳装置
JPH05189492A (ja) 検索式自動生成装置
Hasi et al. Design and Implementation of Mongolian Wordnet Management Platform