JPS6140672A - 多品詞解消処理方式 - Google Patents

多品詞解消処理方式

Info

Publication number
JPS6140672A
JPS6140672A JP16244584A JP16244584A JPS6140672A JP S6140672 A JPS6140672 A JP S6140672A JP 16244584 A JP16244584 A JP 16244584A JP 16244584 A JP16244584 A JP 16244584A JP S6140672 A JPS6140672 A JP S6140672A
Authority
JP
Japan
Prior art keywords
speech
many parts
resolution
words
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16244584A
Other languages
English (en)
Inventor
Eri Okamoto
岡本 恵里
Atsushi Okajima
岡島 惇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP16244584A priority Critical patent/JPS6140672A/ja
Priority to US06/756,670 priority patent/US4661924A/en
Publication of JPS6140672A publication Critical patent/JPS6140672A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、多品詞解消処理方式に関し、詳しくは、機械
翻訳システムにおいて、多品詞語を規則とともに、品詞
の出現率を考慮して1つの品詞に決定し、構文解析する
処理方式に関するものである。
〔発明の背景〕
機械翻訳システムを実用化するためには、使用する辞書
を豊富に揃え、実際の辞書に近い環境で処理する必要が
ある。自然言語の処理では、先ず多品側の単語を持つ言
語で書かれた文章を構文解析する。多品詞語の品詞を決
定する場合、従来は、その単語の前後の品詞等を調べて
、あらかじめ決められてい、る多品詞解消規則にもとづ
いて品詞を決定している。多品詞解消規則にしたがって
処理するものとしては、例えば、特開昭56−1385
86号公報に示されている方式がある。多品詞解消規則
としては、文中に隣接する品詞の文法的規約や、統計的
な確率によるものが一般的である。
この規則にも種々のものが提案されているが、例えば、
電気通信学会雑誌第46巻11号における清野武他によ
る「機械翻訳」と題する文献に示されている規則がある
しかし、内容の豊富な辞書を使用すると、文中で多品詞
語が連続することが多くなるため、従来の品詞の配列に
着目した多品詞解消処理方式では対処しきれず、正しく
多品詞の11¥消ができなくなる。また、多品詞解消規
則を固定してしまうと、ある分野では、殆んど現われな
いような品詞を選んでしまうことがあり、翻訳する文章
の範囲を限定しても、それを多品詞解消処理に反映でき
ない。
そのため、構文解析および翻訳処理の精度が低下してい
る。
〔発明の目的〕
本発明の目的は、このような従来の問題点を改善し、多
品詞語が連続して現われる場合にも、有効な多品詞解消
を行い、構文解析の精度を向上することができる゛多品
詞解消処理方式を提供することにある。
〔発明の概要〕
上記目的を達成するため、本発明の多品詞解消処理方式
では、自然言語で書かれた文章を入力する入力手段、該
入力手段より入力された文章の構文解析処理を行うプロ
セッサ、該プロセッサにより参照される単語辞書メモリ
、および多品詞解消規則テーブルを格納するメモリを備
えた機械翻訳システムにおいて、上記多品詞解消規則テ
ーブルを適用して品詞の配列に着目し品詞を決定すると
ともに、あらかじめ算出した多品詞語の各品詞の出現率
が、設定された閾値を越えているか否かにより品詞を決
定することに特徴がある。        。
〔発明の実施例〕
以下、本発明の実施例を、図面により説明する。
第1図は、本発明の多品詞解消処理を行う機械翻訳処理
装置のブロック図である。
■はプロセッサ、2は辞書用メモリ、3は多品詞解消規
則テーブル用メモリ、牛は内部処理用テーブル、5はキ
ーボード、6はディスプレイ装置で゛ある。
あらかじめ、キーボード5から辞書メモリ2に辞書内容
を、多品詞解消規則テーブル用メモリ3に規則テーブル
内容を入力して格納しておく。プロセッサ1は、翻訳の
ためにキーボード5から入力された文章を単語に切り分
け、辞書メモリ2を参照して、単語、品詞、属性等を処
理テーブル4に格納した後、規則テーブルメモリ3を参
照して多品詞解消処理を行う。以下、英語で書かれた文
章の構文解析について述べろ。
第2図は、本発明の第1の実施例を示す多品詞解消処理
のフローチャートである。
第2図に示すように、本発明は、多品詞解消処理におい
て、品詞の並びが文法的に正しくなるようにする多品詞
解消規則を適用する(ステップ102)とともに、多品
詞語の品詞のうち出現率が閾値を越えた品詞を選ぶ処理
(ステップ104)を、閾値を小さくしながら繰り返し
行う(ステップ106)。
キーボード5から文を入力すると、プロセッサ1はこの
文をワーク・メモリに格納した後、単語に切り分け、辞
書用メモリ2を参照して、各単語について品詞、各品詞
の出現頻度、属性を内部処理用テーブル牛に順次格納す
る(ステップ101)。
第4図は、内部処理用テーブルの一例を示す図である。
内部処理用テーブル牛は、単語格納エリア41゜品詞格
納エリア42、品詞の出現頻度格納エリア43、品詞の
出現率格納エリア44、品詞の属性格納エリア45、お
よび確定した品詞の格納エリア46から構成される。
多品詞解消処理に移ると、先ず、プロセッサ1は多品詞
解消規則テーブル3を読み出す。
第5図は、多品詞解消規則テーブルの一例を示す図であ
る。
多品詞解消規則テーブル3は、多品詞語の直前の品詞を
示すエリア31.多品詞語の品詞の組み合わせを示すエ
リア32、多品詞語の直後の品詞を示すエリア33、そ
の品詞の配列より確定する品詞を示すエリア34から構
成される。
プロセッサlは、内部処理用テーブル4を参照して、そ
れに該当する多品詞解消規則を適用する(ステップ10
2)。
第6図は、品詞の配列に着目した多品詞解消規則の適用
例を示す図である。
第6図では、多品詞語「R,08EJの直前の品詞が冠
詞であることから、第5図の1行目の規則により、冠詞
の次に続(品詞は名詞と判断している結果、1−RO8
Ejを名詞と決定している。第6図に示すように、「名
詞」が確定した品詞の格納エリア46に格納される。
次に、プロセッサ1は、多品詞語が残っているかを調べ
る(ステップ103)。多品詞語がまだ残っている場合
には、内部処理用テーブル牛を参照して、多品詞語の各
品詞の出現頻度を調べ出現率を計算して、出現率格納エ
リア44に格納する。
ある品、詞の出現率があらかじめ定めた閾値より高げれ
ば、その品詞を選ぶ(ステップ104)。
第7図は、内部処理用テーブルの処理例を示す図で、第
6図の処理の次に品詞の出現率に着目して品詞を決定す
る場合を示している。
第7図では、先ず閾値を0.7とし、残りの単語1’−
LITTLJと1RO5Ejについて各品詞の出現率を
調べると、多品詞語「RO8Elの品詞のうち動詞の出
現率が0.7を越えているので、「RO8EJを動詞と
判定している。これに対して、多品詞語1−LITTL
EJの品詞はいずれも閾値(0,7)を越えていないの
で、ここでは決定しない。次に、多品詞語が残っている
か否かを調べる(ステップ105)。残っていれば、閾
値を小さくしくステップ106)、出現率をもとに決定
された単語のまわりの単語について、再び品詞の並びに
もとづく多品詞解消規則テーブル3により、多品詞解消
を行う(ステップ102)。          1例
えば、第7・図においては、「RO8E」を出   □
現率により動詞と判定した後、第5図に示す2行目の規
則を用いて、「LITTLE」を副詞と判定する。その
結果、第8図に示すように、ILITTLJを副詞、「
RO8E」を動詞と決定する。このように、「LITT
LE RO8Ejのような多品詞語が連続する場合につ
いても、多品詞解消が実現できる。なお、第5図に示す
規則でもし[LITTLEJの品詞が判定できない場合
には、小さくした閾値(例えばo、5)によって、出現
率がこの値より高い品詞を選ぶ。この場合には、0.5
8の値を参照して形容詞と判定する。
このようにして、第1の実施例では、閾値を小さくしな
がら、「品詞の並びにもとづく多品詞解消」の適用と、
「出現率による多品詞解消」を、多品詞語がなくなるま
で繰り返して行った後、品詞を決定し、その品詞をもと
に構文解析を行う(ステップ107)。
第3図は、本発明の第2の実施例を示す多品詞解消処理
のフローチャートである。
第3図の実施例では、多品詞語を持つ言語で書かれた同
一分野の文章を多数構文解析する場合に、多品詞解消の
結果を次の文章の多品詞解消に利用して、構文解析の精
度を上げている。すなわち、第3図のステップ201〜
207において、第2図と全く同じ処理、つまり、品詞
の並びにも・とづく多品詞解消規則を適用する方法と、
多品詞語の品詞のうち出現率が閾値を越えた品詞を選ぶ
方法の組み合わせ処理を行った後、ステップ208〜2
11で、上記の結果を人為的に確認、訂正して、正しい
品詞の出現を認知し、それをもとに多品詞語の品詞の出
現頻度を修正し、次の文章の多品詞解消に反映させる。
第3図に示すように、先ずプロセッサ1はキーボード5
から入力された文を単語に切り分け、辞書用メモリ2を
参照して、単語、品詞、各品詞の出現頻度、属性を内部
処理用テーブル4に格納する(ステップ201)。内部
処理用テーブル牛は、第4図を参照されたい。次に、プ
ロセッサ1は、内部処理用テーブル4を参照して、それ
に該当する多品詞解消規則を適用する(ステップ202
)。
なお、多品詞解消規則テーブル3は、第5図を参照され
たい。そして、ここまでの処理の結果は、第6図を参照
されたい。次に、プロセッサlば、多品詞語が残ってい
るが否かを調べる(ステップ203)。多品詞語がまだ
残っている場合には、内部処理用テーブルΦを参照して
多品詞語の各品詞の出現頻度を調べ、出現率を計算して
、出現率格納エリア44に格納する。そして、ある品詞
の出現率があらかじめ定めた閾値より高ければ、その品
詞を選択する(ステップ204)。ここまでの処理は、
第7図に示される(出現率〉閾値0.7)。
これによって、「RO8E」は、動詞と判定される。次
に、プロセッサlは、多品詞語が残っているか否かを調
べる(ステップ205)。残っていれば、閾値を小さく
シ(ステップ206)、出現率をもとに決定された単語
(THE RO8E−R,O8E〜)のまわりの単語に
ついて、再び品詞の並びにもとづく多品詞解消規則テー
ブル3により多品側解消を行う(ステップ202)。こ
こまでの処理は、第8図に示される(1−RO3EJを
動詞と判定し、「LITTLEJを副詞と判定する)。
このようにして、閾値を小さくしながら品詞の並びにも
とづく多品側解消と、出現率による多品側解消を、多品
詞語がなくなるまで繰り返して行って、品詞を決定し、
その品詞をもとに構文解析を行う(ステップ207)。
次に、プロセッサ1は、解析した文章について、確定し
た品詞をディスプレイ6に表示する。確認者は、ディス
プレイ6の画面を見て、誤った品詞が用いられている場
合には、正しい品詞をキーボード5から入力する(ステ
ップ208)。
第9図は、多品側解消結果の確認者による訂正の入力例
の図である。
確認者がキーインすると、下線部で示す部分が訂正部分
として表示される。第9図では、「LITTLBJの副
詞が形容詞と訂正されている。プロセッサ1は、訂正さ
れた品詞が存在するか否かを調べる(ステップ209)
。訂正された品詞が存在したときには、訂正された正し
い品詞を内部処理用テーブル4の確定した品詞の格納エ
リア46   ゛に格納する(ステップ210)。
第10図は、訂正した時点までの内部処理用テ一プル上
の処理例を示す図である。
第10図では、1−LITTLEJの品詞が形容詞であ
ると訂正されたので、内部処理用テーブル4の確定した
品詞の格納エリア46には、形容詞が格納される。
次に、プロセッサ1は、内部処理用テーブル4の確定し
た品詞の格納エリア46を参照し、その品詞の出現頻度
格納エリア43に、それまでの出現頻度に1を加えた値
を格納する。そして、辞書用メモリ2に新しい出現頻度
を、内部処理用テーブル4を参照して格納し直す(ステ
ップ211)。
第11図は、出現頻度の値を更新した時点までの内部処
理用テーブル上の処理例を示す図である。
第1o図では、「LITTLEJの形容詞の出現頻度は
23であるが、第11図ではこの値に1を加えた24の
値に更新される。
このようにして、文章を解析する度ごとに、多品詞語の
品詞の出現頻度を更新し、常に新しい出現頻度をもとに
して多品側解消を行う。
〔廃明の効果〕
以上説明したように、本発明によれば、多品詞語を持つ
自然言語の構文解析において、多品詞語が連続している
場合でも、その言語の文法規則にしたがいながら、多品
詞語の品詞の出現頻度をもとに多品側解消を行うので、
精度の高い多品側解消および構文解析ができる。また、
多品詞語を持つ自然言語の同一分野の文章を多数構文解
析する際に、多品側解消を行った結果をもとに、多品詞
語の品詞の出現頻度を更新していき、それを多品側解消
に反映させるので、その分野に適合した精度の高い多品
側解消および構文解析ができる。
【図面の簡単な説明】
第1図は本発明の多品詞解消処理を行う機械翻訳処理装
置のブロック図、第2図は本発明の第1の実施例を示す
多品詞解消処理のフローチャート、  □第3図は本発
明の第2の実施例を示す処理のフローチャート、第4図
は内部処理用テーブルの一例を示す図、第5図は多品詞
解消規則テーブルの一例を示す図、第6図は品詞の配列
に着目した多品詞解消規則の適用例を示す図、第7図は
内部処理用テーブルの処理例を示す図、第8図は同じ(
次の段階における処理例を示す図、第9図は多品詞解消
結果の確認者による訂正入力の図、第10図、第11図
はそれぞれ確認者による訂正時、および出現頻度値の更
新時の処理例を示す図である。 1:プロセッサ、2:辞書用メモリ、3=多品詞解消規
則テーブル用メモリ、4=内部処理用テーブル、5=キ
ーボード、6:ディスプレイ装置、41=単語格納エリ
ア、42二品詞格納工IJ 7.43二品詞の出現頻度
格納エリア、44=品詞の出現率格納エリア、46=確
定した品詞の格納エリア。 第   1   図 り 第   6   図 第   7   図 第   8   区

Claims (3)

    【特許請求の範囲】
  1. (1)自然言語で書かれた文章を入力する入力手段、該
    入力手段より入力された文章の構文解析処理を行うプロ
    セッサ、該プロセッサにより参照される単語辞書メモリ
    、および多品詞解消規則テーブルを格納するメモリを備
    えた機械翻訳システムにおいて、上記多品詞解消規則テ
    ーブルを適用して品詞の配列に着目し品詞を決定すると
    ともに、あらかじめ算出した多品詞語の各品詞の出現率
    が、設定された閾値を越えているか否かにより品詞を決
    定することを特徴とする多品詞解消処理方式。
  2. (2)前記各品詞の出現率により品詞を決定する場合、
    設定される閾値を変更する等、条件を変えながら、処理
    を繰り返すことを特徴とする特許請求の範囲第1項記載
    の多品詞解消処理方式。
  3. (3)前記各品詞の出現率により品詞を決定する場合、
    決定された結果をディスプレイに表示し、表示画面を外
    部から確認及び訂正されたあと、その結果をもとにして
    多品詞語の品詞の出現頻度を更新し、次の文章の多品詞
    解消処理に備えることを特徴とする特許請求の範囲第1
    項または第2項記載の多品詞解消処理方式。
JP16244584A 1984-07-31 1984-07-31 多品詞解消処理方式 Pending JPS6140672A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP16244584A JPS6140672A (ja) 1984-07-31 1984-07-31 多品詞解消処理方式
US06/756,670 US4661924A (en) 1984-07-31 1985-07-19 Multiple-parts-of-speech disambiguating method and apparatus for machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16244584A JPS6140672A (ja) 1984-07-31 1984-07-31 多品詞解消処理方式

Publications (1)

Publication Number Publication Date
JPS6140672A true JPS6140672A (ja) 1986-02-26

Family

ID=15754745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16244584A Pending JPS6140672A (ja) 1984-07-31 1984-07-31 多品詞解消処理方式

Country Status (2)

Country Link
US (1) US4661924A (ja)
JP (1) JPS6140672A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0228873A (ja) * 1988-07-19 1990-01-30 Ricoh Co Ltd 形態素解析方法
JPH03167657A (ja) * 1989-11-28 1991-07-19 Canon Inc 文字処理装置

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
JPS61184685A (ja) * 1985-02-12 1986-08-18 Hitachi Ltd 翻訳情報追加方法
JPS61255468A (ja) * 1985-05-08 1986-11-13 Toshiba Corp 機械翻訳処理装置
DE3616751A1 (de) * 1985-05-20 1986-11-20 Sharp K.K., Osaka Uebersetzungssystem
JPS6244877A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム
US5201042A (en) * 1986-04-30 1993-04-06 Hewlett-Packard Company Software process and tools for development of local language translations of text portions of computer source code
US5083268A (en) * 1986-10-15 1992-01-21 Texas Instruments Incorporated System and method for parsing natural language by unifying lexical features of words
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
JPS63223962A (ja) * 1987-03-13 1988-09-19 Hitachi Ltd 翻訳装置
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
JP2664915B2 (ja) * 1988-01-12 1997-10-22 株式会社日立製作所 情報検索システム
US5146405A (en) * 1988-02-05 1992-09-08 At&T Bell Laboratories Methods for part-of-speech determination and usage
US4994966A (en) * 1988-03-31 1991-02-19 Emerson & Stern Associates, Inc. System and method for natural language parsing by initiating processing prior to entry of complete sentences
JPH02308370A (ja) * 1989-05-24 1990-12-21 Toshiba Corp 機械翻訳システム
US5146406A (en) * 1989-08-16 1992-09-08 International Business Machines Corporation Computer method for identifying predicate-argument structures in natural language text
US5020112A (en) * 1989-10-31 1991-05-28 At&T Bell Laboratories Image recognition method using two-dimensional stochastic grammars
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
US5265014A (en) * 1990-04-10 1993-11-23 Hewlett-Packard Company Multi-modal user interface
US5243520A (en) * 1990-08-21 1993-09-07 General Electric Company Sense discrimination system and method
US5418717A (en) * 1990-08-27 1995-05-23 Su; Keh-Yih Multiple score language processing system
US5317507A (en) * 1990-11-07 1994-05-31 Gallant Stephen I Method for document retrieval and for word sense disambiguation using neural networks
US5442780A (en) * 1991-07-11 1995-08-15 Mitsubishi Denki Kabushiki Kaisha Natural language database retrieval system using virtual tables to convert parsed input phrases into retrieval keys
US5541836A (en) * 1991-12-30 1996-07-30 At&T Corp. Word disambiguation apparatus and methods
NZ255865A (en) * 1992-09-04 1997-06-24 Caterpillar Inc Computerised multilingual translator: text editor enforces lexical constraints
JPH06195373A (ja) * 1992-12-24 1994-07-15 Sharp Corp 機械翻訳装置
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
JP2821840B2 (ja) * 1993-04-28 1998-11-05 日本アイ・ビー・エム株式会社 機械翻訳装置
JPH06348750A (ja) * 1993-06-11 1994-12-22 Matsushita Electric Ind Co Ltd 文書作成支援装置
JPH0756957A (ja) * 1993-08-03 1995-03-03 Xerox Corp ユーザへの情報提供方法
US5537317A (en) * 1994-06-01 1996-07-16 Mitsubishi Electric Research Laboratories Inc. System for correcting grammer based parts on speech probability
US5687364A (en) * 1994-09-16 1997-11-11 Xerox Corporation Method for learning to infer the topical content of documents based upon their lexical content
US6139201A (en) * 1994-12-22 2000-10-31 Caterpillar Inc. Integrated authoring and translation system
US5802533A (en) * 1996-08-07 1998-09-01 Walker; Randall C. Text processor
US6279017B1 (en) * 1996-08-07 2001-08-21 Randall C. Walker Method and apparatus for displaying text based upon attributes found within the text
GB2321117A (en) * 1997-01-09 1998-07-15 Sharp Kk Disambiguating syntactic word multiples
US6260008B1 (en) 1998-01-08 2001-07-10 Sharp Kabushiki Kaisha Method of and system for disambiguating syntactic word multiples
EP1131812A2 (en) * 1998-11-17 2001-09-12 Lernout & Hauspie Speech Products N.V. Method and apparatus for improved part-of-speech tagging
JP4718687B2 (ja) 1999-03-19 2011-07-06 トラドス ゲゼルシャフト ミット ベシュレンクテル ハフツング ワークフロー管理システム
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7171349B1 (en) * 2000-08-11 2007-01-30 Attensity Corporation Relational text index creation and searching
AU2002316581A1 (en) 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
WO2004001623A2 (en) * 2002-03-26 2003-12-31 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
CN1647068A (zh) * 2002-03-28 2005-07-27 南加利福尼亚大学 统计机器翻译
US20070038614A1 (en) * 2005-08-10 2007-02-15 Guha Ramanathan V Generating and presenting advertisements based on context data for programmable search engines
US7711545B2 (en) * 2003-07-02 2010-05-04 Language Weaver, Inc. Empirical methods for splitting compound words with application to machine translation
US8548794B2 (en) * 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7813916B2 (en) 2003-11-18 2010-10-12 University Of Utah Acquisition and application of contextual role knowledge for coreference resolution
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
GB2417103A (en) * 2004-08-11 2006-02-15 Sdl Plc Natural language translation system
DE112005002534T5 (de) * 2004-10-12 2007-11-08 University Of Southern California, Los Angeles Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
JP4473702B2 (ja) * 2004-11-02 2010-06-02 株式会社東芝 機械翻訳システム、機械翻訳方法及びプログラム
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) * 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8831928B2 (en) * 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
GB2468278A (en) * 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) * 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US20120239381A1 (en) 2011-03-17 2012-09-20 Sap Ag Semantic phrase suggestion engine
US8527451B2 (en) 2011-03-17 2013-09-03 Sap Ag Business semantic network build
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8725760B2 (en) 2011-05-31 2014-05-13 Sap Ag Semantic terminology importer
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8935230B2 (en) 2011-08-25 2015-01-13 Sap Se Self-learning semantic search engine
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
CA3205257A1 (en) 2014-04-25 2015-10-29 Mayo Foundation For Medical Education And Research Enhancing reading accuracy, efficiency and retention
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN112528671A (zh) * 2020-12-02 2021-03-19 北京小米松果电子有限公司 语义分析方法、装置以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5544606A (en) * 1978-09-25 1980-03-29 Toshiba Corp Document producing device
JPS5617468A (en) * 1979-07-20 1981-02-19 Fujitsu Ltd *kana* japanese syllabary *kanji* chinese character converter
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58175074A (ja) * 1982-04-07 1983-10-14 Toshiba Corp 構文分析方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5544606A (en) * 1978-09-25 1980-03-29 Toshiba Corp Document producing device
JPS5617468A (en) * 1979-07-20 1981-02-19 Fujitsu Ltd *kana* japanese syllabary *kanji* chinese character converter
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0228873A (ja) * 1988-07-19 1990-01-30 Ricoh Co Ltd 形態素解析方法
JPH03167657A (ja) * 1989-11-28 1991-07-19 Canon Inc 文字処理装置

Also Published As

Publication number Publication date
US4661924A (en) 1987-04-28

Similar Documents

Publication Publication Date Title
JPS6140672A (ja) 多品詞解消処理方式
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
KR101906561B1 (ko) 문장구조 이해가 용이한 영어문장 표시방법
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
JPH06149887A (ja) テキスト型データベース装置
JPH0682376B2 (ja) 感情情報抽出装置
JPH0635961A (ja) 文書要約装置
EP0547222A1 (en) System for syntax analysis of japanese language
JPH03260764A (ja) 翻訳用辞書登録方式
JPS6368972A (ja) 未登録語処理方式
JP2871300B2 (ja) 機械翻訳装置
JPH06295311A (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JP3339006B2 (ja) 機械翻訳装置における並列名詞句処理装置
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPH0540781A (ja) 日本語構文解析システム
JP3007397B2 (ja) 言語処理装置
JP2766738B2 (ja) 機械翻訳装置
JPH02148261A (ja) 構文学習機能付機械翻訳システム
JPH09160915A (ja) 自然言語の文脈的処理方式
JPH05233691A (ja) 機械翻訳装置
JPH09319746A (ja) 文書解析方法および装置
JPH09190440A (ja) 機械翻訳装置
JPH06215025A (ja) 自然言語処理装置及びその方法