JPS6126176A - 言語処理用辞書 - Google Patents
言語処理用辞書Info
- Publication number
- JPS6126176A JPS6126176A JP14813884A JP14813884A JPS6126176A JP S6126176 A JPS6126176 A JP S6126176A JP 14813884 A JP14813884 A JP 14813884A JP 14813884 A JP14813884 A JP 14813884A JP S6126176 A JPS6126176 A JP S6126176A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- record
- semantic
- field
- morphological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は言語処理システムに於いて特に形態情報、文法
情報、意味情報といった各種言語データを格納・管理・
検索する辞書管理方式に関し、特に記述の冗長性を除去
し、検索の柔軟性、シン−ラス機能、多言語辞書管理機
能を実現する言語処理用辞書に関する。
情報、意味情報といった各種言語データを格納・管理・
検索する辞書管理方式に関し、特に記述の冗長性を除去
し、検索の柔軟性、シン−ラス機能、多言語辞書管理機
能を実現する言語処理用辞書に関する。
(従来技術とその問題点)
言語処理に於いて辞書の果す役割は多岐に渡る。
ワードプロセッサー中のカナ−漢字変換機能を実現する
ために見出し語としてのカナ(あるいはローマ字)表記
と形態情報・漢字表記を格納する辞書が用いられる。言
語理解システムでは、見出し語としての表記と形態情報
、品詞等の文法情報、意味情報などを格納する辞書が用
いられる。
ために見出し語としてのカナ(あるいはローマ字)表記
と形態情報・漢字表記を格納する辞書が用いられる。言
語理解システムでは、見出し語としての表記と形態情報
、品詞等の文法情報、意味情報などを格納する辞書が用
いられる。
しかし、言語解析と言語生成機能を必要とする翻訳シス
テムでは、上側のように見出し語(形態素おるいは単語
表記)から検索するだけでなく、生成時には特定の意味
をもつ単語を検索できなければない。従来の辞書構成法
では、こういった検索に不可能にしていた0また、多言
語間翻訳システムでは、翻訳言語封缶に各々辞書全用意
しなければならなかった。これによシ同種であるが、複
数個の辞書が必要となり、その構成は繁雑を極めること
になった〇 また、従来の表記だけを見出し語とする辞書で、類義語
を検索するには、特定の表記である見出し語の下に当該
表記の類義語を記述しなければならず、同類義語を見出
しとする辞書項目も用意すると記述が冗長になるという
欠点があった〇言語に於いては、表層形態、単語、意味
には以下の表1に示す関係があるり 表1 表層形態 単語(原形) 意味(シンボル)つま
)表層形態とその単@(原形)にはm対mの対応があシ
、単語と意味(シンボル)にもn対nの対応がある。従
来の辞書形式では基本的に以下の表2に示すような構成
全敗っていた。表2では、少なくとも@BAZAR’
という意味の説明ないし記述が複数回行なわれ、少な
くとも表層形態か単語を見出し語に用いるだけでは、類
義語の検索表2 (発明の目的) 本発明では、上述の欠点を除去し辞書記述の冗長性を除
去し、形態・意味両方向の検索を可能にする言語処理用
辞書を提供することを目的とする〇(発明の構成) 本発明による言語処理用辞書構成方式は、形態素辞書手
段、構文辞書手段、意味辞書手段と形態素表記インデク
ス、意味表記インデクスを管理する辞書検索手段よシな
ること金特徴とする。
テムでは、上側のように見出し語(形態素おるいは単語
表記)から検索するだけでなく、生成時には特定の意味
をもつ単語を検索できなければない。従来の辞書構成法
では、こういった検索に不可能にしていた0また、多言
語間翻訳システムでは、翻訳言語封缶に各々辞書全用意
しなければならなかった。これによシ同種であるが、複
数個の辞書が必要となり、その構成は繁雑を極めること
になった〇 また、従来の表記だけを見出し語とする辞書で、類義語
を検索するには、特定の表記である見出し語の下に当該
表記の類義語を記述しなければならず、同類義語を見出
しとする辞書項目も用意すると記述が冗長になるという
欠点があった〇言語に於いては、表層形態、単語、意味
には以下の表1に示す関係があるり 表1 表層形態 単語(原形) 意味(シンボル)つま
)表層形態とその単@(原形)にはm対mの対応があシ
、単語と意味(シンボル)にもn対nの対応がある。従
来の辞書形式では基本的に以下の表2に示すような構成
全敗っていた。表2では、少なくとも@BAZAR’
という意味の説明ないし記述が複数回行なわれ、少な
くとも表層形態か単語を見出し語に用いるだけでは、類
義語の検索表2 (発明の目的) 本発明では、上述の欠点を除去し辞書記述の冗長性を除
去し、形態・意味両方向の検索を可能にする言語処理用
辞書を提供することを目的とする〇(発明の構成) 本発明による言語処理用辞書構成方式は、形態素辞書手
段、構文辞書手段、意味辞書手段と形態素表記インデク
ス、意味表記インデクスを管理する辞書検索手段よシな
ること金特徴とする。
(実施例)
本発明を1実飽例に庵とづき説明する。第1図は本発明
の一実施例を示すブロック図である。以下では説明を容
易とするために日本語・英語を例に取シ説明する。
の一実施例を示すブロック図である。以下では説明を容
易とするために日本語・英語を例に取シ説明する。
辞書検索手段1は形態素辞書手段2内のレコードの形態
素表記と、意味辞書手段4内のレコード中の意味シンボ
ルを検索インデクク、とじて保持する辞書検索・管理機
能を持ち、Btree手法によれば簡単に実現できる。
素表記と、意味辞書手段4内のレコード中の意味シンボ
ルを検索インデクク、とじて保持する辞書検索・管理機
能を持ち、Btree手法によれば簡単に実現できる。
この13tree手法については宮用正弘、弓場敏嗣に
よる「計算機における見出し探索の技術」電気学会誌、
vol。95.No。8゜ppll−18(1975年
8月)にくわしく説明されているので、ここでは簡単な
説明を行なうにとトW) ルo B t r e e手
法の検索用インデクスファイルの形式を第2図に示す0
個々のレコード11は固定とし、日本語であれば2バイ
トコードの表記、英語なら1バイトコードの表記と各々
の先頭バイトに日本語指定の15”、英語指定の@E′
″□けたものか、1バイトコードの意味シンボルに@C
”を先付けしだものをインデックスとして格納する検索
キーフィールド11と、日本語なら読みを記述するカタ
カナ文字列を保持し、英語ならば発音記号を保持する読
みフィールド12、検索キーフィールドが日本語・英語
の表層検索キーなら形態辞書手段2内の対応する形態辞
書項目が格納されるレコード番号を保持し、意味シンボ
ルキーなら意味辞書手段4内の対応する意味辞書項目が
格納されるレコード番号を保持するポインタフィールド
14と、形態的、意味的情報(例えば、形態接続情報や
意味の分野指定情報など)を保持する内容フィールド1
3からなる。これによシ、意味シンボルや形態表記が辞
書検索手段1に与えられたら、当該辞書検索手段1によ
シ該当インデクスフアイ/l/ 中ノ’vコード1jが
検索され、ポインタフィールド14に指定された形態辞
書手段2あるいは意味辞書手段4のレコードが検索でき
る。
よる「計算機における見出し探索の技術」電気学会誌、
vol。95.No。8゜ppll−18(1975年
8月)にくわしく説明されているので、ここでは簡単な
説明を行なうにとトW) ルo B t r e e手
法の検索用インデクスファイルの形式を第2図に示す0
個々のレコード11は固定とし、日本語であれば2バイ
トコードの表記、英語なら1バイトコードの表記と各々
の先頭バイトに日本語指定の15”、英語指定の@E′
″□けたものか、1バイトコードの意味シンボルに@C
”を先付けしだものをインデックスとして格納する検索
キーフィールド11と、日本語なら読みを記述するカタ
カナ文字列を保持し、英語ならば発音記号を保持する読
みフィールド12、検索キーフィールドが日本語・英語
の表層検索キーなら形態辞書手段2内の対応する形態辞
書項目が格納されるレコード番号を保持し、意味シンボ
ルキーなら意味辞書手段4内の対応する意味辞書項目が
格納されるレコード番号を保持するポインタフィールド
14と、形態的、意味的情報(例えば、形態接続情報や
意味の分野指定情報など)を保持する内容フィールド1
3からなる。これによシ、意味シンボルや形態表記が辞
書検索手段1に与えられたら、当該辞書検索手段1によ
シ該当インデクスフアイ/l/ 中ノ’vコード1jが
検索され、ポインタフィールド14に指定された形態辞
書手段2あるいは意味辞書手段4のレコードが検索でき
る。
第3図は、形態辞書手段1のデータ格納形式を説明する
図である。形態辞書内のデータは、m/バイトレコード
の1つないし複数個によってグルービングされる可変長
論理レコード(mI2m2゜m、・・・)の集合である
01つの論理レコードm。
図である。形態辞書内のデータは、m/バイトレコード
の1つないし複数個によってグルービングされる可変長
論理レコード(mI2m2゜m、・・・)の集合である
01つの論理レコードm。
監
の先頭はヘッダフィールド21と呼ばれ、関連する物理
レコードの連結関係などの制御を保持し、その次に表記
フィールド22がある。第3フイールドはSポインタフ
ィールド23と呼ばれ、構文辞書手段3内の対応項目の
格納されるレコードの番号の集合を保持し、第4フイー
ルドは制御フィールド24と呼ばれる構文辞書手段3の
検索制御情報を保持し、第5フイールドは各種形態情報
を格納する情報フィールドであルその長さは一般にml
X K + (ml−Σml、)バイトである。ここ
でに凰−1 は各論理レコードによって変わる正数である。
レコードの連結関係などの制御を保持し、その次に表記
フィールド22がある。第3フイールドはSポインタフ
ィールド23と呼ばれ、構文辞書手段3内の対応項目の
格納されるレコードの番号の集合を保持し、第4フイー
ルドは制御フィールド24と呼ばれる構文辞書手段3の
検索制御情報を保持し、第5フイールドは各種形態情報
を格納する情報フィールドであルその長さは一般にml
X K + (ml−Σml、)バイトである。ここ
でに凰−1 は各論理レコードによって変わる正数である。
第5図は意味辞書手段4内の意味辞書格納データ形式を
説明する図である。意味辞書はc/バイトの物理レコー
ド(rn、)の集合である論理レコード(項目) (C
,)の集合であシ、論理レコードの第1フイールドはヘ
ッダフィールド41、第2フイールドは表記フィールド
42、第3フイールドは構文辞書手段内の対応する物理
レコード番号の集合を保持するSポインターフィールド
43.縞4フィールドは各種意味情報を格納する情報フ
ィールド44でちゃ、その長さは一般にCノxd+(c
z一ΣCZ、)バイトである。とこではdは、各論理鳳
二==ル コード(例えばc3の場合)ごとに定まる正数(C3の
ときd=2)である。
説明する図である。意味辞書はc/バイトの物理レコー
ド(rn、)の集合である論理レコード(項目) (C
,)の集合であシ、論理レコードの第1フイールドはヘ
ッダフィールド41、第2フイールドは表記フィールド
42、第3フイールドは構文辞書手段内の対応する物理
レコード番号の集合を保持するSポインターフィールド
43.縞4フィールドは各種意味情報を格納する情報フ
ィールド44でちゃ、その長さは一般にCノxd+(c
z一ΣCZ、)バイトである。とこではdは、各論理鳳
二==ル コード(例えばc3の場合)ごとに定まる正数(C3の
ときd=2)である。
第4図は、構文辞書手段3内の構文辞書格納データ形式
を説明する図である。構文辞書はsl バイトの物理レ
コード(r、)の集合である論理レコード(sJ、)の
集合であり、第1フイールドはヘッダフィールド31で
あシ、前記形態辞書、前記意味辞書に於けるヘッダフィ
ールド21.及びヘッダフィールド41と同様な機能を
もつ。第2フイールドは前記形態辞書手段内の対応する
形態辞書項目の物理レコード番号の集合を保持するmポ
インターフィルルビ32、第3フイールドは前記意味辞
書手段内の対応する意味辞書項目の物理レコード番号の
集合を保持するCポインタフィールド論理レコード番号
)sl!Xp+(sl−Σ5l−)バイトである。但し
、pは正数。論理レコードs2 に於いてFisI!+
(5l−sll−s4−5lB’ )バイトである。
を説明する図である。構文辞書はsl バイトの物理レ
コード(r、)の集合である論理レコード(sJ、)の
集合であり、第1フイールドはヘッダフィールド31で
あシ、前記形態辞書、前記意味辞書に於けるヘッダフィ
ールド21.及びヘッダフィールド41と同様な機能を
もつ。第2フイールドは前記形態辞書手段内の対応する
形態辞書項目の物理レコード番号の集合を保持するmポ
インターフィルルビ32、第3フイールドは前記意味辞
書手段内の対応する意味辞書項目の物理レコード番号の
集合を保持するCポインタフィールド論理レコード番号
)sl!Xp+(sl−Σ5l−)バイトである。但し
、pは正数。論理レコードs2 に於いてFisI!+
(5l−sll−s4−5lB’ )バイトである。
さて、第1図に於いて、線5、線8は、辞書検索手段1
中のインデクスフアイル中の各レコードのポインターフ
ィールド14によって指定される単方向ポインターで、
それは前記形態辞書論理レコードないし前記意味辞書論
理レコードを指す。
中のインデクスフアイル中の各レコードのポインターフ
ィールド14によって指定される単方向ポインターで、
それは前記形態辞書論理レコードないし前記意味辞書論
理レコードを指す。
また双方向ポインター697は以下の事項を示す。
前者は、前記形態辞書手段2内の論理レコード中の第3
フイールド23のSポインタが前記構文辞書手段3内の
特定の論理レコードの集合を指定し、逆に同構文辞書手
段3内の論理レコード中の第3フイールド33が前記形
態辞書手段2内の論理レコード集合を指定していること
金示すQ後者は、前記構文辞書手段3内の論理レコード
の第2フイールド32のCポインターと前記意味辞書手
段4内輪理レコードの第3フイー〃ド43のSポインタ
ーによシ対広する2種類の辞書論理レコードの対応が示
されることをいう。
フイールド23のSポインタが前記構文辞書手段3内の
特定の論理レコードの集合を指定し、逆に同構文辞書手
段3内の論理レコード中の第3フイールド33が前記形
態辞書手段2内の論理レコード集合を指定していること
金示すQ後者は、前記構文辞書手段3内の論理レコード
の第2フイールド32のCポインターと前記意味辞書手
段4内輪理レコードの第3フイー〃ド43のSポインタ
ーによシ対広する2種類の辞書論理レコードの対応が示
されることをいう。
第6図は既述構成によって得られた辞書の前記辞書検索
手段1に於ける検索手法を説明するフローチャートであ
る。
手段1に於ける検索手法を説明するフローチャートであ
る。
まず入力として言語の指定と表記と検索パターンとを受
ける。言語指定は文字@J II 、 @F、t 、
@c″でそれぞれ日本語、英語、意味シンボルを示すO
検索パターンは出力すべき辞書の種類を示す。例えば、
M、 S、 Cでは3種全て、s、 cならば構文、
意味辞書を指定する。これによって、同図”IIa2の
終了を判定する〇 図中a、においては、言語指定文字“a”(α((J、
E、 C,・・・司)と表記を1α十表記”と連結し
、B−treeサーチによシイ/デクスレコートテ決定
する0 次にa4において同ポインタフィールド14内の情報に
より辞書検索する。
ける。言語指定は文字@J II 、 @F、t 、
@c″でそれぞれ日本語、英語、意味シンボルを示すO
検索パターンは出力すべき辞書の種類を示す。例えば、
M、 S、 Cでは3種全て、s、 cならば構文、
意味辞書を指定する。これによって、同図”IIa2の
終了を判定する〇 図中a、においては、言語指定文字“a”(α((J、
E、 C,・・・司)と表記を1α十表記”と連結し
、B−treeサーチによシイ/デクスレコートテ決定
する0 次にa4において同ポインタフィールド14内の情報に
より辞書検索する。
8gでは、同辞書検索によシ得た論理レコードの第3フ
イールド23ないし43により構文辞書論理レコード集
合を検索する0 次に36において構文辞書論理レコードの各々のCポイ
ンタフィールド(入力言語指定が@J’or1E”)な
いしmポインタフィールド(言語指定1C”)の全てを
検索する。
イールド23ないし43により構文辞書論理レコード集
合を検索する0 次に36において構文辞書論理レコードの各々のCポイ
ンタフィールド(入力言語指定が@J’or1E”)な
いしmポインタフィールド(言語指定1C”)の全てを
検索する。
(発明の効果)
本発明による言語処理辞書によれば、表層上の表記から
形態素辞書、構文辞書、意味辞書が検索できるばかシか
、同意味辞書から構文辞書、形態辞書を検索することに
より類義語検索機能が実現できる。またこの機能によれ
ば、言語解析、文生成両システムを開発するために1つ
の辞書インデクスで管理できる3つの辞書さえ用意すれ
ば多言語の解析・生成用辞書システムが得られ、辞書情
報の集中管理が可能になる。
形態素辞書、構文辞書、意味辞書が検索できるばかシか
、同意味辞書から構文辞書、形態辞書を検索することに
より類義語検索機能が実現できる。またこの機能によれ
ば、言語解析、文生成両システムを開発するために1つ
の辞書インデクスで管理できる3つの辞書さえ用意すれ
ば多言語の解析・生成用辞書システムが得られ、辞書情
報の集中管理が可能になる。
例えは、多言語間機械翻訳システム開発のために、本方
式の辞書システムを使えば、言語解析では特定言語λの
形態表記を指定し、順次形態辞書、構文辞書、意味辞書
を検索しその情報によp解析を行ない、文生成では特定
言語Bを指定し意味辞書、構文辞書、形態辞書を検索し
文生成を行うことができる0また、この翻訳プロセスの
逆に特定言語Bから特定言@Aへの翻訳にも同一の辞書
が利用できるという利点がある。
式の辞書システムを使えば、言語解析では特定言語λの
形態表記を指定し、順次形態辞書、構文辞書、意味辞書
を検索しその情報によp解析を行ない、文生成では特定
言語Bを指定し意味辞書、構文辞書、形態辞書を検索し
文生成を行うことができる0また、この翻訳プロセスの
逆に特定言語Bから特定言@Aへの翻訳にも同一の辞書
が利用できるという利点がある。
また、辞書記述を3つに分割していることにより、従来
のような記述の重複を解消できるという利点ももつ。
のような記述の重複を解消できるという利点ももつ。
さて、本発明の辞書構成方式に於いては、形態辞書、構
文辞書、意味辞書を独立管理しているが、同三種の辞書
は物理的に同一形成に変換可能であよシ計算機障害によ
るデータ破壊の危険性を減少させることも可能である。
文辞書、意味辞書を独立管理しているが、同三種の辞書
は物理的に同一形成に変換可能であよシ計算機障害によ
るデータ破壊の危険性を減少させることも可能である。
一
第1図は、本発明による言語処理辞書構成方式を説明す
るブロック図、 第2図は、辞書検索手段1内のインデクスフアイルレコ
ード形式を示す図、 第3図は、形態辞書手段2内のレコード形弐全示す図、 第4図は、構文辞書手段3内のレコード形式を示す図、 第5図は、意味辞書手段4内のレコード形式を示す図、 第6図は、辞書検索手段1の動作を説明するフローチャ
ート である。 図において 1・・・辞書検索手段 2・・・形態辞書手段3・・・
構文辞書手段 4・・・意味辞書手段をそれぞれ示す。 72 図 当ハイド bハイド 13バイト A4ハイド Aハイド mj22ゆ4Σエート S! ′75 図 mul=s11;c4ハイド Cρ2バイト オ 6 図
るブロック図、 第2図は、辞書検索手段1内のインデクスフアイルレコ
ード形式を示す図、 第3図は、形態辞書手段2内のレコード形弐全示す図、 第4図は、構文辞書手段3内のレコード形式を示す図、 第5図は、意味辞書手段4内のレコード形式を示す図、 第6図は、辞書検索手段1の動作を説明するフローチャ
ート である。 図において 1・・・辞書検索手段 2・・・形態辞書手段3・・・
構文辞書手段 4・・・意味辞書手段をそれぞれ示す。 72 図 当ハイド bハイド 13バイト A4ハイド Aハイド mj22ゆ4Σエート S! ′75 図 mul=s11;c4ハイド Cρ2バイト オ 6 図
Claims (1)
- 【特許請求の範囲】 (a)形態素や形態範疇、形態情報と同情報に対応する
文法情報記述辞書項目へのポインターを保持する形態辞
書手段、 (b)前記形態辞書手段内の特定形態素辞書項目に対応
する品詞、文法情報と前記特定形態素辞書項目へのポイ
ンターと、前記特定形態素と当該品詞、文法情報に対応
する意味情報記述辞書項目へのポインターとを保持する
構文辞書手段、 (c)意味シンボルと他の意味情報と対応する前記構文
辞書手段内の項目へのポインターとを格納する意味辞書
手段、 (d)前記形態辞書手段内の形態素表記と前記意味辞書
格納手段中の意味シンボルを検索キーとして有する辞書
検索手段、 とからなる言語処理用辞書。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14813884A JPS6126176A (ja) | 1984-07-17 | 1984-07-17 | 言語処理用辞書 |
CA000486856A CA1237527A (en) | 1984-07-17 | 1985-07-16 | Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions |
EP85108889A EP0168814B1 (en) | 1984-07-17 | 1985-07-16 | Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions |
DE3587832T DE3587832T2 (de) | 1984-07-17 | 1985-07-16 | Sprachverarbeitungslexikon zum Zweirichtungswiederfinden von morphemischen und semantischen Ausdrücken. |
US06/755,812 US4703425A (en) | 1984-07-17 | 1985-07-17 | Language processing dictionary for bidirectionally retrieving morphemic and semantic expressions |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14813884A JPS6126176A (ja) | 1984-07-17 | 1984-07-17 | 言語処理用辞書 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6126176A true JPS6126176A (ja) | 1986-02-05 |
JPH0531787B2 JPH0531787B2 (ja) | 1993-05-13 |
Family
ID=15446116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14813884A Granted JPS6126176A (ja) | 1984-07-17 | 1984-07-17 | 言語処理用辞書 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4703425A (ja) |
EP (1) | EP0168814B1 (ja) |
JP (1) | JPS6126176A (ja) |
CA (1) | CA1237527A (ja) |
DE (1) | DE3587832T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62232080A (ja) * | 1986-04-02 | 1987-10-12 | Nec Corp | 意訳用辞書 |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61184685A (ja) * | 1985-02-12 | 1986-08-18 | Hitachi Ltd | 翻訳情報追加方法 |
US4800522A (en) * | 1985-05-14 | 1989-01-24 | Sharp Kabushiki Kaisha | Bilingual translation system capable of memorizing learned words |
CA1270063A (en) * | 1985-05-14 | 1990-06-05 | Kouji Miyao | Translating apparatus |
JPH083815B2 (ja) * | 1985-10-25 | 1996-01-17 | 株式会社日立製作所 | 自然言語の共起関係辞書保守方法 |
JP2732563B2 (ja) * | 1986-05-20 | 1998-03-30 | 株式会社東芝 | 機械翻訳方法及び装置 |
JPH0625901B2 (ja) * | 1986-08-08 | 1994-04-06 | 三輪 博秀 | 電子単一言語辞典及び電子複数言語間辞典 |
US5225981A (en) * | 1986-10-03 | 1993-07-06 | Ricoh Company, Ltd. | Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes |
NL8702359A (nl) * | 1986-10-03 | 1988-05-02 | Ricoh Kk | Taal analyse inrichting. |
US4916614A (en) * | 1986-11-25 | 1990-04-10 | Hitachi, Ltd. | Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words |
US4777617A (en) * | 1987-03-12 | 1988-10-11 | International Business Machines Corporation | Method for verifying spelling of compound words |
US4873634A (en) * | 1987-03-27 | 1989-10-10 | International Business Machines Corporation | Spelling assistance method for compound words |
US5754847A (en) * | 1987-05-26 | 1998-05-19 | Xerox Corporation | Word/number and number/word mapping |
CA1280215C (en) * | 1987-09-28 | 1991-02-12 | Eddy Lee | Multilingual ordered data retrieval system |
US4868750A (en) * | 1987-10-07 | 1989-09-19 | Houghton Mifflin Company | Collocational grammar system |
US4923314A (en) * | 1988-01-06 | 1990-05-08 | Smith Corona Corporation | Thesaurus feature for electronic typewriters |
JP2664915B2 (ja) * | 1988-01-12 | 1997-10-22 | 株式会社日立製作所 | 情報検索システム |
EP0380239A3 (en) * | 1989-01-18 | 1992-04-15 | Lotus Development Corporation | Search and retrieval system |
SE466029B (sv) * | 1989-03-06 | 1991-12-02 | Ibm Svenska Ab | Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem |
NL8900587A (nl) * | 1989-03-10 | 1990-10-01 | Bso Buro Voor Systeemontwikkel | Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst. |
US6978277B2 (en) * | 1989-10-26 | 2005-12-20 | Encyclopaedia Britannica, Inc. | Multimedia search system |
JPH03188566A (ja) * | 1989-12-18 | 1991-08-16 | Fujitsu Ltd | 辞書連動テキストベース装置 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
US5055049A (en) * | 1990-01-25 | 1991-10-08 | Kasravi Peter B | Word listing system |
US5537652A (en) * | 1990-08-20 | 1996-07-16 | International Business Machines Corporation | Data file directory system and method for writing data file directory information |
EP0473864A1 (en) * | 1990-09-04 | 1992-03-11 | International Business Machines Corporation | Method and apparatus for paraphrasing information contained in logical forms |
NL9101286A (nl) * | 1991-07-23 | 1993-02-16 | Oce Nederland Bv | Werkwijze voor het verbuigen van woorden, alsmede een data-verwerkings-eenheid voor het uitvoeren van een dergelijke werkwijze. |
CA2175187A1 (en) * | 1993-10-28 | 1995-05-04 | William K. Thomson | Database search summary with user determined characteristics |
US6092035A (en) * | 1996-12-03 | 2000-07-18 | Brothers Kogyo Kabushiki Kaisha | Server device for multilingual transmission system |
JP3177593B2 (ja) * | 1997-09-18 | 2001-06-18 | 株式会社ジャストシステム | 語句の絞込検索方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6401061B1 (en) * | 1999-05-13 | 2002-06-04 | Yuri L. Zieman | Combinatorial computational technique for transformation phrase text-phrase meaning |
US6490548B1 (en) * | 1999-05-14 | 2002-12-03 | Paterra, Inc. | Multilingual electronic transfer dictionary containing topical codes and method of use |
US7346488B2 (en) * | 2000-07-10 | 2008-03-18 | Fujitsu Limited | Automatic translator and computer-readable storage medium having automatic translation program recorded thereon |
US20030157467A1 (en) * | 2002-02-15 | 2003-08-21 | Lundquist Lynn C. | Method for teaching the verb in foreign language instruction |
US7490034B2 (en) * | 2002-04-30 | 2009-02-10 | Microsoft Corporation | Lexicon with sectionalized data and method of using the same |
US7011525B2 (en) | 2002-07-09 | 2006-03-14 | Literacy S.T.A.R. | Encoding system combining language elements for rapid advancement |
US6980949B2 (en) * | 2003-03-14 | 2005-12-27 | Sonum Technologies, Inc. | Natural language processor |
US20060040242A1 (en) * | 2003-07-09 | 2006-02-23 | Literacy S.T.A.R. | System and method for teaching reading and writing |
US7398210B2 (en) * | 2003-10-23 | 2008-07-08 | Microsoft Corporation | System and method for performing analysis on word variants |
US7447627B2 (en) * | 2003-10-23 | 2008-11-04 | Microsoft Corporation | Compound word breaker and spell checker |
US7421386B2 (en) * | 2003-10-23 | 2008-09-02 | Microsoft Corporation | Full-form lexicon with tagged data and methods of constructing and using the same |
KR100643801B1 (ko) * | 2005-10-26 | 2006-11-10 | 엔에이치엔(주) | 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법 |
US7756859B2 (en) * | 2005-12-19 | 2010-07-13 | Intentional Software Corporation | Multi-segment string search |
US8706477B1 (en) | 2008-04-25 | 2014-04-22 | Softwin Srl Romania | Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code |
US8762130B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking |
US8762131B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates |
EP2534585A4 (en) * | 2010-02-12 | 2018-01-24 | Google LLC | Compound splitting |
US8612213B1 (en) | 2012-10-16 | 2013-12-17 | Google Inc. | Correction of errors in character strings that include a word delimiter |
US8713433B1 (en) | 2012-10-16 | 2014-04-29 | Google Inc. | Feature-based autocorrection |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3312946A (en) * | 1963-12-18 | 1967-04-04 | Ibm | Processor for coded data |
GB1458510A (en) * | 1972-12-01 | 1976-12-15 | Canadian Jurimetrics Ltd | Apparatus for updating textual data |
JPS5335434A (en) * | 1976-09-13 | 1978-04-01 | Lexicon Corp | Information processor |
JPS59868B2 (ja) * | 1979-10-24 | 1984-01-09 | シャープ株式会社 | 単語の基本形認識装置およびこれを用いた翻訳装置 |
US4384329A (en) * | 1980-12-19 | 1983-05-17 | International Business Machines Corporation | Retrieval of related linked linguistic expressions including synonyms and antonyms |
JPS57201958A (en) * | 1981-06-05 | 1982-12-10 | Hitachi Ltd | Device and method for interpretation between natural languages |
US4579533A (en) * | 1982-04-26 | 1986-04-01 | Anderson Weston A | Method of teaching a subject including use of a dictionary and translator |
JPS58201175A (ja) * | 1982-05-20 | 1983-11-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 機械翻訳方式 |
-
1984
- 1984-07-17 JP JP14813884A patent/JPS6126176A/ja active Granted
-
1985
- 1985-07-16 DE DE3587832T patent/DE3587832T2/de not_active Expired - Fee Related
- 1985-07-16 EP EP85108889A patent/EP0168814B1/en not_active Expired - Lifetime
- 1985-07-16 CA CA000486856A patent/CA1237527A/en not_active Expired
- 1985-07-17 US US06/755,812 patent/US4703425A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62232080A (ja) * | 1986-04-02 | 1987-10-12 | Nec Corp | 意訳用辞書 |
Also Published As
Publication number | Publication date |
---|---|
CA1237527A (en) | 1988-05-31 |
US4703425A (en) | 1987-10-27 |
EP0168814A3 (en) | 1986-07-23 |
DE3587832T2 (de) | 1994-09-08 |
DE3587832D1 (de) | 1994-06-30 |
EP0168814A2 (en) | 1986-01-22 |
JPH0531787B2 (ja) | 1993-05-13 |
EP0168814B1 (en) | 1994-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6126176A (ja) | 言語処理用辞書 | |
JP3196868B2 (ja) | テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ | |
US5523946A (en) | Compact encoding of multi-lingual translation dictionaries | |
EP0378848A2 (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
US4811400A (en) | Method for transforming symbolic data | |
US20090055358A1 (en) | Efficient processing of mapped boolean queries via generative indexing | |
US5384700A (en) | Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document | |
CN105786963A (zh) | 一种语料库的检索方法及系统 | |
EP0241717A2 (en) | Linguistic analysis method and apparatus | |
Flor | A fast and flexible architecture for very large word n-gram datasets | |
JPH0315980A (ja) | 文字列検索装置 | |
Gerdes et al. | Starting a new treebank? Go SUD! Theoretical and practical benefits of the Surface-Syntactic distributional approach | |
US20050187964A1 (en) | Method and apparatus for retrieving natural language text | |
Meyer | On Sanskrit and information retrieval | |
JPH03116375A (ja) | 情報検索装置 | |
KR100404320B1 (ko) | 문장 자동 색인 방법 | |
Papakitsos et al. | Modelling a Morpheme‐based Lexicon for Modern Greek | |
JPS646499B2 (ja) | ||
JPS62144269A (ja) | 情報検索装置 | |
JPH0576068B2 (ja) | ||
WO2018228101A1 (zh) | 基于汉语含义的汉语编码方法及系统和介质设备 | |
Vagelatos et al. | Utilization of a lexicon for spelling correction in Modern Greek | |
JPS59116835A (ja) | 短縮入力機能付日本語入力装置 | |
JPH0260022B2 (ja) | ||
Ito et al. | A retrieval system for on-line English-Japanese dictionaries |