JPS6126176A - 言語処理用辞書 - Google Patents

言語処理用辞書

Info

Publication number
JPS6126176A
JPS6126176A JP14813884A JP14813884A JPS6126176A JP S6126176 A JPS6126176 A JP S6126176A JP 14813884 A JP14813884 A JP 14813884A JP 14813884 A JP14813884 A JP 14813884A JP S6126176 A JPS6126176 A JP S6126176A
Authority
JP
Japan
Prior art keywords
dictionary
record
semantic
field
morphological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP14813884A
Other languages
English (en)
Other versions
JPH0531787B2 (ja
Inventor
Kazushi Muraki
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP14813884A priority Critical patent/JPS6126176A/ja
Priority to CA000486856A priority patent/CA1237527A/en
Priority to EP85108889A priority patent/EP0168814B1/en
Priority to DE3587832T priority patent/DE3587832T2/de
Priority to US06/755,812 priority patent/US4703425A/en
Publication of JPS6126176A publication Critical patent/JPS6126176A/ja
Publication of JPH0531787B2 publication Critical patent/JPH0531787B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は言語処理システムに於いて特に形態情報、文法
情報、意味情報といった各種言語データを格納・管理・
検索する辞書管理方式に関し、特に記述の冗長性を除去
し、検索の柔軟性、シン−ラス機能、多言語辞書管理機
能を実現する言語処理用辞書に関する。
(従来技術とその問題点) 言語処理に於いて辞書の果す役割は多岐に渡る。
ワードプロセッサー中のカナ−漢字変換機能を実現する
ために見出し語としてのカナ(あるいはローマ字)表記
と形態情報・漢字表記を格納する辞書が用いられる。言
語理解システムでは、見出し語としての表記と形態情報
、品詞等の文法情報、意味情報などを格納する辞書が用
いられる。
しかし、言語解析と言語生成機能を必要とする翻訳シス
テムでは、上側のように見出し語(形態素おるいは単語
表記)から検索するだけでなく、生成時には特定の意味
をもつ単語を検索できなければない。従来の辞書構成法
では、こういった検索に不可能にしていた0また、多言
語間翻訳システムでは、翻訳言語封缶に各々辞書全用意
しなければならなかった。これによシ同種であるが、複
数個の辞書が必要となり、その構成は繁雑を極めること
になった〇 また、従来の表記だけを見出し語とする辞書で、類義語
を検索するには、特定の表記である見出し語の下に当該
表記の類義語を記述しなければならず、同類義語を見出
しとする辞書項目も用意すると記述が冗長になるという
欠点があった〇言語に於いては、表層形態、単語、意味
には以下の表1に示す関係があるり 表1 表層形態   単語(原形)  意味(シンボル)つま
)表層形態とその単@(原形)にはm対mの対応があシ
、単語と意味(シンボル)にもn対nの対応がある。従
来の辞書形式では基本的に以下の表2に示すような構成
全敗っていた。表2では、少なくとも@BAZAR’ 
 という意味の説明ないし記述が複数回行なわれ、少な
くとも表層形態か単語を見出し語に用いるだけでは、類
義語の検索表2 (発明の目的) 本発明では、上述の欠点を除去し辞書記述の冗長性を除
去し、形態・意味両方向の検索を可能にする言語処理用
辞書を提供することを目的とする〇(発明の構成) 本発明による言語処理用辞書構成方式は、形態素辞書手
段、構文辞書手段、意味辞書手段と形態素表記インデク
ス、意味表記インデクスを管理する辞書検索手段よシな
ること金特徴とする。
(実施例) 本発明を1実飽例に庵とづき説明する。第1図は本発明
の一実施例を示すブロック図である。以下では説明を容
易とするために日本語・英語を例に取シ説明する。
辞書検索手段1は形態素辞書手段2内のレコードの形態
素表記と、意味辞書手段4内のレコード中の意味シンボ
ルを検索インデクク、とじて保持する辞書検索・管理機
能を持ち、Btree手法によれば簡単に実現できる。
この13tree手法については宮用正弘、弓場敏嗣に
よる「計算機における見出し探索の技術」電気学会誌、
vol。95.No。8゜ppll−18(1975年
8月)にくわしく説明されているので、ここでは簡単な
説明を行なうにとトW) ルo B t r e e手
法の検索用インデクスファイルの形式を第2図に示す0
個々のレコード11は固定とし、日本語であれば2バイ
トコードの表記、英語なら1バイトコードの表記と各々
の先頭バイトに日本語指定の15”、英語指定の@E′
″□けたものか、1バイトコードの意味シンボルに@C
”を先付けしだものをインデックスとして格納する検索
キーフィールド11と、日本語なら読みを記述するカタ
カナ文字列を保持し、英語ならば発音記号を保持する読
みフィールド12、検索キーフィールドが日本語・英語
の表層検索キーなら形態辞書手段2内の対応する形態辞
書項目が格納されるレコード番号を保持し、意味シンボ
ルキーなら意味辞書手段4内の対応する意味辞書項目が
格納されるレコード番号を保持するポインタフィールド
14と、形態的、意味的情報(例えば、形態接続情報や
意味の分野指定情報など)を保持する内容フィールド1
3からなる。これによシ、意味シンボルや形態表記が辞
書検索手段1に与えられたら、当該辞書検索手段1によ
シ該当インデクスフアイ/l/ 中ノ’vコード1jが
検索され、ポインタフィールド14に指定された形態辞
書手段2あるいは意味辞書手段4のレコードが検索でき
る。
第3図は、形態辞書手段1のデータ格納形式を説明する
図である。形態辞書内のデータは、m/バイトレコード
の1つないし複数個によってグルービングされる可変長
論理レコード(mI2m2゜m、・・・)の集合である
01つの論理レコードm。
監 の先頭はヘッダフィールド21と呼ばれ、関連する物理
レコードの連結関係などの制御を保持し、その次に表記
フィールド22がある。第3フイールドはSポインタフ
ィールド23と呼ばれ、構文辞書手段3内の対応項目の
格納されるレコードの番号の集合を保持し、第4フイー
ルドは制御フィールド24と呼ばれる構文辞書手段3の
検索制御情報を保持し、第5フイールドは各種形態情報
を格納する情報フィールドであルその長さは一般にml
 X K + (ml−Σml、)バイトである。ここ
でに凰−1 は各論理レコードによって変わる正数である。
第5図は意味辞書手段4内の意味辞書格納データ形式を
説明する図である。意味辞書はc/バイトの物理レコー
ド(rn、)の集合である論理レコード(項目) (C
,)の集合であシ、論理レコードの第1フイールドはヘ
ッダフィールド41、第2フイールドは表記フィールド
42、第3フイールドは構文辞書手段内の対応する物理
レコード番号の集合を保持するSポインターフィールド
43.縞4フィールドは各種意味情報を格納する情報フ
ィールド44でちゃ、その長さは一般にCノxd+(c
z一ΣCZ、)バイトである。とこではdは、各論理鳳
二==ル コード(例えばc3の場合)ごとに定まる正数(C3の
ときd=2)である。
第4図は、構文辞書手段3内の構文辞書格納データ形式
を説明する図である。構文辞書はsl バイトの物理レ
コード(r、)の集合である論理レコード(sJ、)の
集合であり、第1フイールドはヘッダフィールド31で
あシ、前記形態辞書、前記意味辞書に於けるヘッダフィ
ールド21.及びヘッダフィールド41と同様な機能を
もつ。第2フイールドは前記形態辞書手段内の対応する
形態辞書項目の物理レコード番号の集合を保持するmポ
インターフィルルビ32、第3フイールドは前記意味辞
書手段内の対応する意味辞書項目の物理レコード番号の
集合を保持するCポインタフィールド論理レコード番号
)sl!Xp+(sl−Σ5l−)バイトである。但し
、pは正数。論理レコードs2 に於いてFisI!+
(5l−sll−s4−5lB’ )バイトである。
さて、第1図に於いて、線5、線8は、辞書検索手段1
中のインデクスフアイル中の各レコードのポインターフ
ィールド14によって指定される単方向ポインターで、
それは前記形態辞書論理レコードないし前記意味辞書論
理レコードを指す。
また双方向ポインター697は以下の事項を示す。
前者は、前記形態辞書手段2内の論理レコード中の第3
フイールド23のSポインタが前記構文辞書手段3内の
特定の論理レコードの集合を指定し、逆に同構文辞書手
段3内の論理レコード中の第3フイールド33が前記形
態辞書手段2内の論理レコード集合を指定していること
金示すQ後者は、前記構文辞書手段3内の論理レコード
の第2フイールド32のCポインターと前記意味辞書手
段4内輪理レコードの第3フイー〃ド43のSポインタ
ーによシ対広する2種類の辞書論理レコードの対応が示
されることをいう。
第6図は既述構成によって得られた辞書の前記辞書検索
手段1に於ける検索手法を説明するフローチャートであ
る。
まず入力として言語の指定と表記と検索パターンとを受
ける。言語指定は文字@J II 、 @F、t 、 
@c″でそれぞれ日本語、英語、意味シンボルを示すO
検索パターンは出力すべき辞書の種類を示す。例えば、
M、  S、 Cでは3種全て、s、 cならば構文、
意味辞書を指定する。これによって、同図”IIa2の
終了を判定する〇 図中a、においては、言語指定文字“a”(α((J、
 E、 C,・・・司)と表記を1α十表記”と連結し
、B−treeサーチによシイ/デクスレコートテ決定
する0 次にa4において同ポインタフィールド14内の情報に
より辞書検索する。
8gでは、同辞書検索によシ得た論理レコードの第3フ
イールド23ないし43により構文辞書論理レコード集
合を検索する0 次に36において構文辞書論理レコードの各々のCポイ
ンタフィールド(入力言語指定が@J’or1E”)な
いしmポインタフィールド(言語指定1C”)の全てを
検索する。
(発明の効果) 本発明による言語処理辞書によれば、表層上の表記から
形態素辞書、構文辞書、意味辞書が検索できるばかシか
、同意味辞書から構文辞書、形態辞書を検索することに
より類義語検索機能が実現できる。またこの機能によれ
ば、言語解析、文生成両システムを開発するために1つ
の辞書インデクスで管理できる3つの辞書さえ用意すれ
ば多言語の解析・生成用辞書システムが得られ、辞書情
報の集中管理が可能になる。
例えは、多言語間機械翻訳システム開発のために、本方
式の辞書システムを使えば、言語解析では特定言語λの
形態表記を指定し、順次形態辞書、構文辞書、意味辞書
を検索しその情報によp解析を行ない、文生成では特定
言語Bを指定し意味辞書、構文辞書、形態辞書を検索し
文生成を行うことができる0また、この翻訳プロセスの
逆に特定言語Bから特定言@Aへの翻訳にも同一の辞書
が利用できるという利点がある。
また、辞書記述を3つに分割していることにより、従来
のような記述の重複を解消できるという利点ももつ。
さて、本発明の辞書構成方式に於いては、形態辞書、構
文辞書、意味辞書を独立管理しているが、同三種の辞書
は物理的に同一形成に変換可能であよシ計算機障害によ
るデータ破壊の危険性を減少させることも可能である。
【図面の簡単な説明】
第1図は、本発明による言語処理辞書構成方式を説明す
るブロック図、 第2図は、辞書検索手段1内のインデクスフアイルレコ
ード形式を示す図、 第3図は、形態辞書手段2内のレコード形弐全示す図、 第4図は、構文辞書手段3内のレコード形式を示す図、 第5図は、意味辞書手段4内のレコード形式を示す図、 第6図は、辞書検索手段1の動作を説明するフローチャ
ート である。 図において 1・・・辞書検索手段 2・・・形態辞書手段3・・・
構文辞書手段 4・・・意味辞書手段をそれぞれ示す。 72 図 当ハイド bハイド 13バイト A4ハイド Aハイド mj22ゆ4Σエート S! ′75 図 mul=s11;c4ハイド Cρ2バイト オ 6 図

Claims (1)

  1. 【特許請求の範囲】 (a)形態素や形態範疇、形態情報と同情報に対応する
    文法情報記述辞書項目へのポインターを保持する形態辞
    書手段、 (b)前記形態辞書手段内の特定形態素辞書項目に対応
    する品詞、文法情報と前記特定形態素辞書項目へのポイ
    ンターと、前記特定形態素と当該品詞、文法情報に対応
    する意味情報記述辞書項目へのポインターとを保持する
    構文辞書手段、 (c)意味シンボルと他の意味情報と対応する前記構文
    辞書手段内の項目へのポインターとを格納する意味辞書
    手段、 (d)前記形態辞書手段内の形態素表記と前記意味辞書
    格納手段中の意味シンボルを検索キーとして有する辞書
    検索手段、 とからなる言語処理用辞書。
JP14813884A 1984-07-17 1984-07-17 言語処理用辞書 Granted JPS6126176A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP14813884A JPS6126176A (ja) 1984-07-17 1984-07-17 言語処理用辞書
CA000486856A CA1237527A (en) 1984-07-17 1985-07-16 Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions
EP85108889A EP0168814B1 (en) 1984-07-17 1985-07-16 Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions
DE3587832T DE3587832T2 (de) 1984-07-17 1985-07-16 Sprachverarbeitungslexikon zum Zweirichtungswiederfinden von morphemischen und semantischen Ausdrücken.
US06/755,812 US4703425A (en) 1984-07-17 1985-07-17 Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14813884A JPS6126176A (ja) 1984-07-17 1984-07-17 言語処理用辞書

Publications (2)

Publication Number Publication Date
JPS6126176A true JPS6126176A (ja) 1986-02-05
JPH0531787B2 JPH0531787B2 (ja) 1993-05-13

Family

ID=15446116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14813884A Granted JPS6126176A (ja) 1984-07-17 1984-07-17 言語処理用辞書

Country Status (5)

Country Link
US (1) US4703425A (ja)
EP (1) EP0168814B1 (ja)
JP (1) JPS6126176A (ja)
CA (1) CA1237527A (ja)
DE (1) DE3587832T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62232080A (ja) * 1986-04-02 1987-10-12 Nec Corp 意訳用辞書

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61184685A (ja) * 1985-02-12 1986-08-18 Hitachi Ltd 翻訳情報追加方法
US4800522A (en) * 1985-05-14 1989-01-24 Sharp Kabushiki Kaisha Bilingual translation system capable of memorizing learned words
CA1270063A (en) * 1985-05-14 1990-06-05 Kouji Miyao Translating apparatus
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
JP2732563B2 (ja) * 1986-05-20 1998-03-30 株式会社東芝 機械翻訳方法及び装置
JPH0625901B2 (ja) * 1986-08-08 1994-04-06 三輪 博秀 電子単一言語辞典及び電子複数言語間辞典
US5225981A (en) * 1986-10-03 1993-07-06 Ricoh Company, Ltd. Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes
NL8702359A (nl) * 1986-10-03 1988-05-02 Ricoh Kk Taal analyse inrichting.
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
US4777617A (en) * 1987-03-12 1988-10-11 International Business Machines Corporation Method for verifying spelling of compound words
US4873634A (en) * 1987-03-27 1989-10-10 International Business Machines Corporation Spelling assistance method for compound words
US5754847A (en) * 1987-05-26 1998-05-19 Xerox Corporation Word/number and number/word mapping
CA1280215C (en) * 1987-09-28 1991-02-12 Eddy Lee Multilingual ordered data retrieval system
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
US4923314A (en) * 1988-01-06 1990-05-08 Smith Corona Corporation Thesaurus feature for electronic typewriters
JP2664915B2 (ja) * 1988-01-12 1997-10-22 株式会社日立製作所 情報検索システム
EP0380239A3 (en) * 1989-01-18 1992-04-15 Lotus Development Corporation Search and retrieval system
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
NL8900587A (nl) * 1989-03-10 1990-10-01 Bso Buro Voor Systeemontwikkel Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst.
US6978277B2 (en) * 1989-10-26 2005-12-20 Encyclopaedia Britannica, Inc. Multimedia search system
JPH03188566A (ja) * 1989-12-18 1991-08-16 Fujitsu Ltd 辞書連動テキストベース装置
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5055049A (en) * 1990-01-25 1991-10-08 Kasravi Peter B Word listing system
US5537652A (en) * 1990-08-20 1996-07-16 International Business Machines Corporation Data file directory system and method for writing data file directory information
EP0473864A1 (en) * 1990-09-04 1992-03-11 International Business Machines Corporation Method and apparatus for paraphrasing information contained in logical forms
NL9101286A (nl) * 1991-07-23 1993-02-16 Oce Nederland Bv Werkwijze voor het verbuigen van woorden, alsmede een data-verwerkings-eenheid voor het uitvoeren van een dergelijke werkwijze.
CA2175187A1 (en) * 1993-10-28 1995-05-04 William K. Thomson Database search summary with user determined characteristics
US6092035A (en) * 1996-12-03 2000-07-18 Brothers Kogyo Kabushiki Kaisha Server device for multilingual transmission system
JP3177593B2 (ja) * 1997-09-18 2001-06-18 株式会社ジャストシステム 語句の絞込検索方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US6401061B1 (en) * 1999-05-13 2002-06-04 Yuri L. Zieman Combinatorial computational technique for transformation phrase text-phrase meaning
US6490548B1 (en) * 1999-05-14 2002-12-03 Paterra, Inc. Multilingual electronic transfer dictionary containing topical codes and method of use
US7346488B2 (en) * 2000-07-10 2008-03-18 Fujitsu Limited Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
US20030157467A1 (en) * 2002-02-15 2003-08-21 Lundquist Lynn C. Method for teaching the verb in foreign language instruction
US7490034B2 (en) * 2002-04-30 2009-02-10 Microsoft Corporation Lexicon with sectionalized data and method of using the same
US7011525B2 (en) 2002-07-09 2006-03-14 Literacy S.T.A.R. Encoding system combining language elements for rapid advancement
US6980949B2 (en) * 2003-03-14 2005-12-27 Sonum Technologies, Inc. Natural language processor
US20060040242A1 (en) * 2003-07-09 2006-02-23 Literacy S.T.A.R. System and method for teaching reading and writing
US7398210B2 (en) * 2003-10-23 2008-07-08 Microsoft Corporation System and method for performing analysis on word variants
US7447627B2 (en) * 2003-10-23 2008-11-04 Microsoft Corporation Compound word breaker and spell checker
US7421386B2 (en) * 2003-10-23 2008-09-02 Microsoft Corporation Full-form lexicon with tagged data and methods of constructing and using the same
KR100643801B1 (ko) * 2005-10-26 2006-11-10 엔에이치엔(주) 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법
US7756859B2 (en) * 2005-12-19 2010-07-13 Intentional Software Corporation Multi-segment string search
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
EP2534585A4 (en) * 2010-02-12 2018-01-24 Google LLC Compound splitting
US8612213B1 (en) 2012-10-16 2013-12-17 Google Inc. Correction of errors in character strings that include a word delimiter
US8713433B1 (en) 2012-10-16 2014-04-29 Google Inc. Feature-based autocorrection

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3312946A (en) * 1963-12-18 1967-04-04 Ibm Processor for coded data
GB1458510A (en) * 1972-12-01 1976-12-15 Canadian Jurimetrics Ltd Apparatus for updating textual data
JPS5335434A (en) * 1976-09-13 1978-04-01 Lexicon Corp Information processor
JPS59868B2 (ja) * 1979-10-24 1984-01-09 シャープ株式会社 単語の基本形認識装置およびこれを用いた翻訳装置
US4384329A (en) * 1980-12-19 1983-05-17 International Business Machines Corporation Retrieval of related linked linguistic expressions including synonyms and antonyms
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
US4579533A (en) * 1982-04-26 1986-04-01 Anderson Weston A Method of teaching a subject including use of a dictionary and translator
JPS58201175A (ja) * 1982-05-20 1983-11-22 Kokusai Denshin Denwa Co Ltd <Kdd> 機械翻訳方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62232080A (ja) * 1986-04-02 1987-10-12 Nec Corp 意訳用辞書

Also Published As

Publication number Publication date
CA1237527A (en) 1988-05-31
US4703425A (en) 1987-10-27
EP0168814A3 (en) 1986-07-23
DE3587832T2 (de) 1994-09-08
DE3587832D1 (de) 1994-06-30
EP0168814A2 (en) 1986-01-22
JPH0531787B2 (ja) 1993-05-13
EP0168814B1 (en) 1994-05-25

Similar Documents

Publication Publication Date Title
JPS6126176A (ja) 言語処理用辞書
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
US5523946A (en) Compact encoding of multi-lingual translation dictionaries
EP0378848A2 (en) Method for use of morphological information to cross reference keywords used for information retrieval
US4811400A (en) Method for transforming symbolic data
US20090055358A1 (en) Efficient processing of mapped boolean queries via generative indexing
US5384700A (en) Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document
CN105786963A (zh) 一种语料库的检索方法及系统
EP0241717A2 (en) Linguistic analysis method and apparatus
Flor A fast and flexible architecture for very large word n-gram datasets
JPH0315980A (ja) 文字列検索装置
Gerdes et al. Starting a new treebank? Go SUD! Theoretical and practical benefits of the Surface-Syntactic distributional approach
US20050187964A1 (en) Method and apparatus for retrieving natural language text
Meyer On Sanskrit and information retrieval
JPH03116375A (ja) 情報検索装置
KR100404320B1 (ko) 문장 자동 색인 방법
Papakitsos et al. Modelling a Morpheme‐based Lexicon for Modern Greek
JPS646499B2 (ja)
JPS62144269A (ja) 情報検索装置
JPH0576068B2 (ja)
WO2018228101A1 (zh) 基于汉语含义的汉语编码方法及系统和介质设备
Vagelatos et al. Utilization of a lexicon for spelling correction in Modern Greek
JPS59116835A (ja) 短縮入力機能付日本語入力装置
JPH0260022B2 (ja)
Ito et al. A retrieval system for on-line English-Japanese dictionaries