JPH04107675A - 英文ワードプロセッサー - Google Patents

英文ワードプロセッサー

Info

Publication number
JPH04107675A
JPH04107675A JP2225901A JP22590190A JPH04107675A JP H04107675 A JPH04107675 A JP H04107675A JP 2225901 A JP2225901 A JP 2225901A JP 22590190 A JP22590190 A JP 22590190A JP H04107675 A JPH04107675 A JP H04107675A
Authority
JP
Japan
Prior art keywords
english
japanese
dictionary
information
english expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2225901A
Other languages
English (en)
Inventor
Shinichiro Kamei
亀井 眞一郎
Kiyoshi Yamahata
潔 山端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2225901A priority Critical patent/JPH04107675A/ja
Publication of JPH04107675A publication Critical patent/JPH04107675A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は英文ワードプロセッサーに関する。
(従来の技術) 従来、英文ワードプロセッサーにおいて、英文を入力し
てから後編集したり出力したりする機能を充実させるこ
とは図られているが、英語を母国語としない利用者、た
とえば日本人の利用者に対して、書くべき英文の発想を
支援する機能の充実は十分に図られていない、従来の英
文ワードプロセッサーにおける英文発想支援を目的とす
る機能として、予め記憶されている既成の和英辞書など
の辞書を検索することによって入力された日本語の単語
に対応する英語の単語を読み出し、該英語の単語を表示
する日本語英語変換機能が用いられている。
(発明が解決しようとする課題) しかし、和英の辞書引きを行う従来の方法では、日本語
の単語を英語の単語の並びに単純に対応させるだけであ
るから、例えば、次に列挙するような問題点がある。
相、体、時制等によって表層形が変化されるような入力
語、または助詞・助動詞によって修飾されるような入力
語については、その変化した形あるいは修飾された形を
すべて登録しておくか、入力可能な形をたとえば原形の
みに制限する必要がある。
例えば、「走る」という語は過去を表すときに「走った
」に変化し、進行中の出来事を表すときに「走っている
」に変化するが、「走った」に対応する入力文字列と「
走っている」に対応する入力文字列とは互いに異なるか
ら、原形から変化した形の全てを辞書中に登録しておか
なければ各変化した形に対する対訳を得ることが出来な
い。
入力可能な形を制限した場合、ユーザが入力された形の
語から変換される出力語およびその変化形を選択するこ
とが考えられるが、出力語の活用形選択の仕組みが煩雑
になる。
上記「走る」を例にして説明する。入力可能、すなわち
辞書登録されている活用形が「走る」であり、「走って
いる」に対する訳を得ようとするとき、まずユーザーが
「走っている」を原形「走る」になおした後、辞書引き
l!能を用いて対訳run”を得、さらに辞書を参照し
て元の語の持つ情報と同じ情報を持つ活用形“runn
i−ng”を引き出す必要がある。
また、日本語と英語とで用言の原形の間に相や時制の相
違がある場合にも問題が発生する。例えば、動詞「知る
」に対する英語動詞は“knowであるが、「知る」と
“know”とは互いに相を異にしている。「知る」は
現在における動作を表し、“know”は現在における
状態を表す。
[私は彼女を知っている。」の訳は“I  amkno
wing  her、”ではなく、“Iknow  h
er、”でなければならないが、「「知る」とknow
”が対応するJというような単語間の対応を覚えておく
だけの従来技術では、これら相情報等種々の付加情報の
対応をも考慮した訳は置敷である。
入力文中の複数の語の間に存在する関係、たとえば呼応
関係を抽出することができないから、正しい英語表現を
得ることができない0例えば、呼応関係「めったに/な
い」の存在する文「彼はめったに外出しない、」に対し
ては、「めったに/ない」をまとめて seldom 
 と訳し、“ He      se   Idom 
    goes      out、   ”   
とするのが適切だが、単語ごとの辞書引きによってはこ
のような訳を得ることが出来ない。
出力の複数の語の間の関係、たとえば英語における主語
と述語の一致や、用言とその格要素の間に必要な前置詞
の選択などを正しく行うことができない。
後者の例について説明すると、例えば、「ジョンとJを
単独で英語に直す場合には“w i t hJ o h
 n ”とするのが適切だが、「ジョンと会う」に対し
てはmeet  John”とするのが適切で、 me
et  with  John”とすることは誤りであ
る。しかし、単語に対して辞書引きを行う従来技術では
、誤った訳のほうを出力してしまう。
一方、書きない内容を日本語で入力すれば自動的に英文
表現を作成する日英R緘翻訳システムを英文ワードプロ
セッサーに搭載する方法も考えられる。この方法によれ
ば、上記のような問題は発生しない。しかし、本格的な
機械翻訳システムでは、必要な辞書、文法規則や意味規
則の数、それらを動かすプログラムのいずれが膨大な大
きさの容量を有するから、その格納に多大なコストがか
かる。また、現在の英文ワードプロセッサーに搭載され
ている計算機では、計算能力が不十分であるから、計算
能力が高い計算機を搭載する必要があり、コストがかか
る。このように、この解決法は可能ではあるがコストの
点に雛があり、たとえば商用にするには実際的でない。
本発明の目的は、比較的安価に英文発想支援機能を実現
することができる日本語英語変換部を備える英文ワード
プロセッサーを提供することにある。
(課題を解決するための手段) 本発明は、入力された英語文字列をm集しかつ表示する
英文処理部と入力された日本語文字列をそれに対応する
英語表現に変換する日本語英語変換部とを備える英語ワ
ードプロセッサーであって、前記日本語英語変換部は、
日本語文字列を入力する日本語入力手段と、日本語およ
びそれに対応する英語表現を保持する辞書と、該辞書を
参照して入力された日本語文字列の形態素解析を行う日
本語形態素解析手段と、該日本語形態素解析手段の形態
素解析の結果をもとに前期辞書を参照して入力日本語文
字列に対応する英語表現を作成する英語表現作成手段と
、該英語表現作成手段で作成された英語表現を表示する
英語表現表示手段とを有することを特徴とする。
前記辞書は日本語および笑話用言の時制、相および態に
よる形態変化の情報を保持し、前記日本語形態素解析手
段は前記辞書を参照して入力日本語文字列中の用言文節
の時制情報、相情報および形態情報を解析し、該解析さ
れた各情報を統語素性の一部として用言文節に付与し、
前記英語表現作成手段は、前記日本語形態素解析手段が
入力日本語文字列中の用言文節にその統語素性の一部と
して付与した時制情報、相情報および態情報にあわせて
形態変化した英語表現を前記辞書から読み出し、該英語
表現をその用言文節に対する英語表現の第一候補として
作成することを特徴とする。
前記辞書は日本語および英語の呼応を示す語粱に関する
情報を保持し、 前記日本語形態素解析手段は、前記辞書を参照して入力
日本語文字列中の文節の呼応に関する情報を解析し、該
解析された情報を統語素性の一部として文節に付与し、 前記英語表現作成手段は、前記日本語形態素解析手段が
入力日本語文字列中の文節にその統語素性の一部として
付与した呼応に関する情報と合致する英語表現を前記辞
書から読み出し、該英語表現をその文節に対する英語表
現の第一候補とじて作成する ことを特徴とする。
前記辞書は日本語および英語用言の格フレームに関する
情報を保持し、 前記日本語形態素解析手段は、前記辞書を参照して入力
日本語文字列中の用言文節の格フレーム情報を解析し、
該解析された情報を統語素性の一部として用言文節に付
与し、 前記英語表現作成手段は、前記日本語形態素解析手段が
入力日本語文字列中の用言文節にその統語素性の一部と
して付与した格フレーム情報に対応する英語表現を前記
辞書から読み出し、該英語表現をその用言文節に対応す
る英語表現の第一候補として作成する ことを特徴とする。
前記辞書は日本語および英語体言の性、数、人称に対す
る活用の情報を保持し、 前記日本語形態素解析手段は、前記辞書を参照して入力
日本語文字列中の体言文節の性、数、人称の情報を解析
し、該解析された情報を統語素性の一部として体言文節
に付与し、 前記英語表現作成手段は、前記日本語形態素解析手段が
入力日本語文字列中の体言文節にその統語組成の一部と
して付与した情報に合致する英語表現を前記辞書から読
み出し、該英語表現をその体言文節に対応する英語表現
の第一候補として作成する ことを特徴とする。
前記日本語形態素解析手段が入力日本語文字列中に前記
辞書に登録されていない未知語を検出した場合、該未知
語のローマ字表記が英語表現の第一候補として前記英語
表現表示手段に送られることを特徴とする。
(作用) 本発明の英文ワードプロセッサーでは、入力された日本
語が前記日本語形態素解析手段で形態素解析される。た
とえば、自立語と付属語の認定、文節の認定、語の意味
の選定などの形態素解析作業が行われる。具体的な例を
挙げると、用言に対してはその原型の認定、活用形の認
定、付属する助f!h詞や助詞等の認定とその意味の確
認などの作業が行われる。形態素解析の結果得られた情
報は前記英語表現作成手段に送られる。前記英語表現作
成手段は、日本語文節の自立語に対応する英語表現を辞
書を参照して求め、辞書内容の英語に関する部分の持つ
情報と日本語文節に付票する情報を総合的に利用して英
語表現を作成する。作成された英語表現は前記英語表現
表示手段によってユーザーに提示される。
前記日本語形態素解析手段が入力文中の用言文節の時制
、相および慝情報を解析し、前記英語表現作成手段が前
記日本語形態素解析手段の解析の結果に基づき英語表現
を作成することにより、入力文中の用言が持つ時制、相
、態のVI報を英語表現中に再現することができる。
前記日本語形態素解析手段が入力文中の呼応に関する語
彙の情報を解析し、前記英語表現作成手段は呼応に関す
る訪粟の情報を用いて英語表現を作成することにより、
入力文中の呼応表現を適切に英語表現に反映させること
ができる。
前記日本語形態素解析手段が行う形態素解析によって日
本語用言の格フレーム情報が得られ、この情報および英
語表現の用言の格フレーム情報を英語表現作成手段が利
用することにより、日本語用言の持つ格フレーム情報に
合致した英語表現用言を選択することができると共に、
格により定まる格要素中の前置詞や格要素の語形変化の
情報を正しく英語表現に反映させることができる。
前記日本語形態素解析手段が入力文中の体言の性・数・
人称に関する情報を抽出することにより、入力文中の体
言の文法的に正しい英語表現を得ることが出来る。
入力日本語文字列中に未知語が存在した場合、それをロ
ーマ字表記で出力することにより、未知語であることを
明示すると共に、固有名詞など辞書登録しきれない種類
の語に対しても妥当な英語表現を与えることができる。
(実施例) 以下に、図面を参照しながら本発明の詳細な説明する。
第1図は本発明の英文ワードプロセッサの日本語英語変
換部を示すブロック図である1日本語入力手段1に日本
語文字列からなる入力文が入力されると、日本語入力手
段1は入力文を日本語形態素解析手段2に送る。日本語
形態素解析手段2は辞書5の日本語部分を用いて入力文
を形態素に分割し、各形態素に辞書内容を割り付け、さ
らにそれが用言である時にはそれらに付属する助動詞の
意味を認定する。この解析結果は英語表現作成手段3に
送られる。英語表現作成手段3は辞書5から日本語の自
立語に対応する英語を読み出し、該英語の辞書内容と、
受は取った日本語の解析結果とを比較し、入力された日
本語に対応する英語表現を作成する0作成された英語表
現は英語表現表示手段4に送られ、表示される。
第2図は第1図の英文ワードプロセッサーの日本語英語
変換部の辞書の内容の一例を示す図である0図の「英語
」の欄には「日本語Jの欄の日本語に対応する英語の単
語が書かれている。第2図(a)には辞書5に記述され
ている時制・相に関する情報の内の助動詞相当表現「て
いる」に関する部分が示されている。時制は「現在」、
「過去」「未来」など用語の示す1時」に関する情報で
あり、釦情報は「進行」、「状態」、「完了jなど用言
の様子に関する情報である0例えば、日本語の動詞「走
る」に「ている」が付与されることによって「走る」が
「走っている」となるとき、第2図(a)に示すように
、「走っている」は「進行」の意味になることがわかる
0日本語の「走る」に対応する英語の動詞はrrunJ
であるが、英語側の釦情報からrrunJを「進行」の
意味に変えるときにはrrunningJのようにri
ng形」にすれば良いことがわかる。
「走る」の場合には日本語の「ている」と英語のrin
g形」が対応しているが、「ている」とring形」と
が必ず対応するとは限らない。例えば、日本語の「知る
」の場合「ている」がついな「知っている」の形で「現
在の状態」を表す。
「知る」に対応する英語r k n o w 」の場合
、「現在の状態」を表すには現在形を用いる。このよう
に「′ている」がついている用言の相fiV報は用言毎
に異なるが、本発明では用言毎の釦情報が辞書5に記述
されているから、入力文を適切な英語表現に対応させる
ことができる。
第2図(b)には、時制・相に関する情報のうち助動詞
「た」に関する部分が示されている。例えば日本語の動
詞「食べる」に「た」を付与することによってr食べる
」が「食べた」となるとき、第2図(b)に示すように
、「食べた」は「過去」の意味になることがわかる1日
本語の「食べる」に対応する英語の動詞はreat、1
であるが、「過去」の意味を表すにはreat」をra
te」のように「過去形」にすれば良いことが英語側の
時制情報かられかる。「食べる」の場合には日本語の「
た」と英語の「過去形」が対応しているが、この対応関
係が必ず成立するとは限らない0例えば日本語の「似る
」の場合、「な」がついて「似た人」となるとき、「似
た」の形で「現在の状態」を表す、「似る」に対応する
英0’resem−ble」の場合、「現在の状態」を
表すには現在形を用いる。このように用言に「た」がつ
いたときの時制・釦情報は用言毎に異なるが、本発明で
は、第2図(b)に示すように、用言毎の時制情報が辞
書5に記述されているから、入力文を適切な英語表現に
対応させることができる。
第2図(c)には、辞書5に記述されている態情報に関
する部分が示されている6日本語の用言における態情報
は助動詞「れる」まなは「られる」がついて受身の意味
になることである。例えば日本語の動詞「とるJがそれ
に「れるjがついて「とられる」となるときに、「とら
れる」は受身の意味になる。日本語の「とる」に対応す
る英語の動詞はrtake」であるが、受身の意味を表
すにはrtake」をrtaken」のように「過去分
詞形」にすれば良いことがわかる。
以下に、日本語の用言の釦情報と英語の用言の釦情報と
を対応させることによって入力文を対応する英語表現に
変換する動作について説明する。
いま、日本語入力手段1から「知っている」が入力され
たとする。この入力文は日本語形態素解析手段2で「知
つ」と「ている」に分解され、「知っ」の辞書には第2
図(a)の「知る」の桐に示したような辞書内容が割り
付けられる0日本語形態素解析手段2は辞書5の釦情報
から「知っている」の意味が「現在の状態Jであること
を計算し、その解析結果を英語表現作成手段3に送る。
英語表現作成手段3は辞書5を参照し日本語「知る」に
対応する英語r k n o W Jを得る。r k 
n o W Jの辞書の釦情報から「現在の状態」を表
すにはr k n o W Jを現在形にすれば良いこ
とがわかる。
そこで英語表現作成手段3は入力日本語「知っている」
に対応する英語表現としてr k n o W Jを英
語表現表示手段4に送る。
本発明では、辞85に時制・相・態情報が記述されてい
るから、動詞ごとに適切な英語表現を出力することがで
きる。
第3図は第1図の英文ワードプロセッサの日本語英語変
換部の辞書の内容の他の例を示す図である。第3図には
、辞書5に記述されている辞書内容の内の呼応情報に関
する部分が示されている。
日本語には「めったに・・・ない」の「めったに」のよ
うに必ず後ろに特定の表現を要求するものがある。この
「めったに」の場合後ろの「ない」と合わせて英語のr
seldom」に対応する。このような日本語の呼応情
報を辞@5に記述した例が第3図である。
以下に、呼応情報を用いて入力文を対応する英語表現に
変換する動作について説明する。いま、日本語入力手段
1から「めったに走らない」が入力されたとする。この
入力文は日本語形態素解析手段2で「めったに」と「走
ら」と「ない」に分解され、「めったに」には第3図に
示したような辞書内容が割り付けられる6日本語形態素
解析手12は辞書5の呼応情報から「めったに」が次の
文節に含まれる「ない」と呼応し、その両者で一つの意
味をなすことを認定する。英語表現作成手段3は日本語
形態素解析手段2からその解析結果を受は取り、辞書5
を参照して「めったに・・・ないJに対応する英a’s
eldomJを得る。
rseldom」は英語表現表示手段4に送られる。
本発明では、辞書5に呼応情報が記述されているから、
日本語の呼応表現に対応する適切な英語表現を出力する
ことができる。
第4図は第1図の英文ワードプロセッサの日本語英語変
換部の辞書の内容のさらに他の例を示す図である。第4
図には辞書5に記述されている辞書内容の内の用言の格
フレーム情報に関する部分が示されている。第4図では
日本語の用言の格フレームとそれに対応する英語の用言
の格フレームとが記述されている。用言の格フレーム情
報は日本語の場合で言えば各々の用言が支配する格助詞
とその意味の対応のことである0例えば、日本語の動詞
「会う」は格助詞が「が」で「主体」を表し、格助詞「
と」あるいは「に」で「相手」を表す0日本語の格助詞
は英語の前置詞に相当するが、その対応は用言ごとに異
なる。第4図によれば日本語の動詞「会う」に相当する
英語はrme e t Jであり、「会う」の「とJ格
はrme e t Jの目的格に対応することがわかる
。一方、同じ「と」格でも「−言う」の場合には、その
「と」格は英語rsa3/Jのrthat」に相当する
以下に、用言の格フレーム情報を用いて入力文を対応す
る英語表現に変換する動作について説明する。いま、日
本語入力手段1から「ジョンと会う」が入力されたとす
る。この入力文は日本語形態素解析手段2で「ジョン」
と「と」と「会う」とに分解され、「会う」には第4図
に示したような辞書内容が割り付けられる6日本語形態
素解析手段2は辞書5の格フレーム情報から「ジョン」
が「相手」であることを認定する。英語表現作成手段3
は日本語形態素解析手段2からその解析結果を受は取り
、辞書5を参照して「会う」に対応する莢m ’ m 
e e t 」を得る。次いで、英語表現作成手段3は
、格フレーム情報から「相手」である「ジョン」を動詞
rme e t Jの目的格の位置に配置し、それを英
語表現表示手段4に送る。このようにして日本語の助詞
「と」か表していた格要素は英語では前置詞を伴なわず
目的語で表現される。
本発明では、辞書5に格フレーム情報が記述されている
から、日本語の格フレームに対応する適切な英語表現を
出力することができる。
第5図は第1図のに英文ワードプロセッサーの日本語英
語変換部の辞書の内容のさらに他の例を示す図である。
第5図には辞書5に記述されている辞書内容の内の名詞
の数案性情報に関する部分が示されている。数案性情報
とは特に英語の名詞の場合の数に関する制限のことをい
う。例えば、英語の名詞rdesk」は単数のときrd
esk4、複数のときrdesks」という形をとる。
しかし名詞の中にはrinformaion4rkno
wledge」のように単数でしか用いられないもの、
rscissors」のように複数形でしか用いられな
いもの等がある1本発明では名詞毎の数案性情報を第5
図のように辞書に記述しておく。
以下に、名詞の数案性情報を用いて入力文中の体言を対
応する英語表現に変換する動作について説明する。いま
、日本語入力手段1から「机」が入力されたとする。こ
の入力文は日本語形態素解析手段2で一つの名詞である
と認定されその名詞「机」の辞書には第5図の「机」の
欄に示したような辞書内容が割り付けられる。この解析
結果は英語表現作成手段3に伝達される。英語表現作成
手段3は辞書5を引き、日本語「机」に対応する英語r
desk」を得る。辞書5の数案性情報からrdesk
」は単数形にも複数形にもなることがわかる。そこで、
英語表現作成手段3は入力日本語「机Jに対応する英語
表現としてrdesk」とrdesks」とを英語表現
表示手段4に送る。
次に、日本語「知識」が入力された場合を考える。
上記の場合と同様に英語表現作成手段3は辞書5を参照
し、日本語「知識」に対応する英語[kn o w I
 e d g e Jを得るが、辞書5の数案性情報か
らr k n o w I e d g e 」は複数
形にならないことがわかる。そこで英語表現作成手段3
は入力日本語「知識」に対応する英語表現として単数形
r k n o w 1 e d g e Jだけを英
語表現表示手段4に送る。
本発明では、辞書5に数案性情報が記述されているから
、名詞ごとに適切な英語表現を出力することができる。
第6図は日本語のローマ字表記と英語らしいつづりとの
対応関係の一例を示す図である0本発明では、辞書5を
参照して入力された日本語に対応する英語表現を求める
が、入力された日本語が辞書に登録されていないことが
ある。この問題は自然言語処理システムにおいて常に起
こりうる問題である。自然言語で使われる語彙は数が膨
大でしかも新たに生産されるから、全ての語をあらかじ
め辞書に登録することは無理である。本発明においても
、入力された日本語に対応する英語を得るときに、それ
が辞書にないことがある。このようなことが起こる場合
のうち入力された日本語が固有名詞である場合には日本
語をローマ字表記すれば英語の表記として通用する。そ
こで、日本話人力がローマ字入力によって行われたとき
にはそのローマ字を英語として出力すればよい。ただし
、日本語のローマ字表記と英語らしい表記とには少し差
があ・υ0例えば、「東京」および「神戸」の例を考え
る0日本語のローマ字表記には代表的なものとして「訓
令式」と「ヘボン式」とがあるがそのどちらで表しても
「東京」、「神戸」はそれぞれr T o u k y
 o u J、rKoube」となる。
これに対し英語らしい表記はそれぞれr T o k 
−VOJ、I’Kobe4であり、日本語のローマ字表
記と英語らしい表記との間にはオ段の長音に関して差が
ある。第6図にはこのような日本語のローマ字表記と英
語らしい表記との差の例が示されている。日本語形態素
解析手段2は、辞書5を検索して該当する日本語を見つ
けられなかったとき、入力された日本語ローマ字をこの
第6図に従って変換し、その結果とそれが辞書5に登録
されていない語であることを示す情報とを英語表現作成
手段3に伝達する。英語表現作成手段3はそれらの情報
から判断して受は取った文字列をそのまま英語表現表示
手Pi4に送る。このようにして、入力された日本語、
例えば「東京」が辞書5に登録されていなかったときに
は、入力された日本語ローマ字表記rToukyou、
1をもとにr T o k −3’OJが出力される。
(発明の効果) 本発明によれば、前記日本語英語変換部が必要とする記
憶能力および計算能力は、単なる辞書引きを行う従来の
日本語英語変換部が必要とする記憶能力および計算能力
とほぼ同等であるから、前記日本語英語変換部を比較的
安価なコストで実現することができる。また、本発明に
よれば、日本語で発想した文章を語単位のみならず助詞
・助動詞等を含んだ文節単位で英語表現に変換するから
、高品質な日英変換結果を得ることができ、英文作成の
能率を大幅に向上させることができる。
【図面の簡単な説明】
第1図は本発明の英文ワードプロセッサーの日本語英語
変換部を示すブロック図、第2図(a)。 (b)、(c)は第1図の英文ワードプロセッサーの日
本語英語変換部の辞書の内容の一例を示す図、第3図は
第1図の英文ワードプロセッサーの日本語英語変換部の
辞書の内容の他の例を示す図、第4図は第1図の英文ワ
ードプロセッサーの日本語英語変換部の辞書の内容のさ
らに他の例を示す図、第5図は第1図の英文ワードプロ
セッサーの日本語英語変換部の辞書の内容のさらに他の
例を示す図、第6図は日本語のローマ字表記と英語らし
いつづりとの対応関係の一例を示す図である。 1・・・日本語入力手段、2・・・日本語形態素解析手
段、3・・・英語表現作成手段、4・・・英語表現表示
手段、5・・・辞書。 日本語文字列

Claims (6)

    【特許請求の範囲】
  1. (1)入力された英語文字列を編集しかつ表示する英文
    処理部と入力された日本語文字列をそれに対応する英語
    表現に変換する日本語英語変換部とを備える英文ワード
    プロセッサーであって、前記日本語英語変換部は、日本
    語文字列を入力する日本語入力手段と、日本語およびそ
    れに対応する英語表現を保持する辞書と、該辞書を参照
    して入力された日本語文字列の形態素解析を行う日本語
    形態素解析手段と、該日本語形態素解析手段の形態素解
    析の結果をもとに前記辞書を参照して入力日本語文字列
    に対応する英語表現を作成する英語表現作成手段と、該
    英語表現作成手段で作成された英語表現を表示する英語
    表現表示手段とを有することを特徴とする英文ワードプ
    ロセッサー。
  2. (2)前記辞書は日本語および英語用言の時制、相およ
    び態による形態変化の情報を保持し、前記日本語形態素
    解析手段は前記辞書を参照して入力日本語文字列中の用
    言文節の時制情報、相情報および形態情報を解析し、該
    解析された各情報を統語素性の一部として用言文節に付
    与し、前記英語表現作成手段は、前記日本語形態素解析
    手段が入力日本語文字列中の用言文節にその統語素性の
    一部として付与した時制情報、相情報および態情報にあ
    わせて形態変化した英語表現を前記辞書から読み出し、
    該英語表現をその用言文節に対する英語表現の第一候補
    として作成する、ことを特徴とする請求項1に記載の英
    文ワードプロセッサー。
  3. (3)前記辞書は日本語および英語の呼応を示す語彙に
    関する情報を保持し、 前記日本語形態素解析手段は、前記辞書を参照して入力
    日本語文字列中の文節の呼応に関する情報を解析し、該
    解析された情報を統語素性の一部として文節に付与し、 前記英語表現作成手段は、前記日本語形態素解析手段が
    入力日本語文字列中の文節にその統語素性の一部として
    付与した呼応に関する情報と合致する英語表現を前記辞
    書から読み出し、該英語表現をその文節に対する英語表
    現の第一候補として作成する ことを特徴とする請求項1に記載の英文ワードプロセッ
    サー。
  4. (4)前記辞書は日本語および英語用言の格フレームに
    関する情報を保持し、 前記日本語形態素解析手段は、前記辞書を参照して入力
    日本語文字列中の用言文節の格フレーム情報を解析し、
    該解析された情報を統語素性の一部として用言文節に付
    与し、 前記英語表現作成手段は、前記日本語形態素解析手段が
    入力日本語文字列中の用言文節にその統語素性の一部と
    して付与した格フレーム情報に対応する英語表現を前記
    辞書から読み出し、該英語表現をその用言文節に対応す
    る英語表現の第一候補として作成する ことを特徴とする請求項1に記載の英文ワードプロセッ
    サー。
  5. (5)前記辞書は日本語および英語体現の性、数、人称
    に対する活用の情報を保持し、 前記日本語形態素解析手段は、前記辞書を参照して入力
    日本語文字列中の体言文節の性、数、人称の情報を解析
    し、該解析された情報を統語素性の一部として体言文節
    に付与し、 前記英語表現作成手段は、前記日本語形態素解析手段が
    入力日本語文字列中の体言文節にその統語素性の一部と
    して付与した情報に合致する英語表現を前記辞書から読
    み出し、該英語表現をその体言文節に対応する英語表現
    の第一候補として作成する ことを特徴とする請求項1に記載の英文ワードプロセッ
    サー。
  6. (6)前記日本語形態素解析手段が入力日本語文字列中
    に前記辞書に登録されていない未知語を検出した場合、
    該未知語のローマ字表記が英語表現の第一候補として前
    記英語表現表示手段に送られることを特徴とする請求項
    1に記載の英文ワードプロセッサー。
JP2225901A 1990-08-28 1990-08-28 英文ワードプロセッサー Pending JPH04107675A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2225901A JPH04107675A (ja) 1990-08-28 1990-08-28 英文ワードプロセッサー

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2225901A JPH04107675A (ja) 1990-08-28 1990-08-28 英文ワードプロセッサー

Publications (1)

Publication Number Publication Date
JPH04107675A true JPH04107675A (ja) 1992-04-09

Family

ID=16836662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2225901A Pending JPH04107675A (ja) 1990-08-28 1990-08-28 英文ワードプロセッサー

Country Status (1)

Country Link
JP (1) JPH04107675A (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62184572A (ja) * 1986-02-10 1987-08-12 Fujitsu Ltd 単語分割装置における呼応複合語の辞書検索方式
JPS62271064A (ja) * 1986-05-20 1987-11-25 Toshiba Corp 機械翻訳システム
JPS63132379A (ja) * 1986-11-25 1988-06-04 Hitachi Ltd 自然言語文生成方法
JPS6433674A (en) * 1987-07-30 1989-02-03 Nec Corp Unregistered word processing system
JPS6441067A (en) * 1987-08-06 1989-02-13 Fuji Xerox Co Ltd Back-up device for production of english sentence
JPH01219946A (ja) * 1988-02-27 1989-09-01 Toshiba Corp 文書作成支援装置
JPH01245357A (ja) * 1988-03-28 1989-09-29 Toshiba Corp 文書作成支援装置
JPH0244461A (ja) * 1988-08-04 1990-02-14 Ricoh Co Ltd 翻訳用辞書編集装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62184572A (ja) * 1986-02-10 1987-08-12 Fujitsu Ltd 単語分割装置における呼応複合語の辞書検索方式
JPS62271064A (ja) * 1986-05-20 1987-11-25 Toshiba Corp 機械翻訳システム
JPS63132379A (ja) * 1986-11-25 1988-06-04 Hitachi Ltd 自然言語文生成方法
JPS6433674A (en) * 1987-07-30 1989-02-03 Nec Corp Unregistered word processing system
JPS6441067A (en) * 1987-08-06 1989-02-13 Fuji Xerox Co Ltd Back-up device for production of english sentence
JPH01219946A (ja) * 1988-02-27 1989-09-01 Toshiba Corp 文書作成支援装置
JPH01245357A (ja) * 1988-03-28 1989-09-29 Toshiba Corp 文書作成支援装置
JPH0244461A (ja) * 1988-08-04 1990-02-14 Ricoh Co Ltd 翻訳用辞書編集装置

Similar Documents

Publication Publication Date Title
Habash et al. MADA+ TOKAN: A toolkit for Arabic tokenization, diacritization, morphological disambiguation, POS tagging, stemming and lemmatization
JP3277123B2 (ja) 中国語テキストを処理するためのシステムおよび方法
JPH096787A (ja) 訳振り機械翻訳装置
JPH05120324A (ja) 言語処理方式
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
JPH04107675A (ja) 英文ワードプロセッサー
JP2003178087A (ja) 外国語電子辞書検索装置および方法
ASAHIAH et al. A survey of diacritic restoration in abjad and alphabet writing systems
JP2011175306A (ja) 情報処理装置
JP2003022266A (ja) 文章語文体変換システムおよび文章語文体変換処理プログラム
Vasuki et al. English to Tamil machine translation system using parallel corpus
Botev et al. Deciphering and Characterizing Out-of-Vocabulary Words for Morphologically Rich Languages
Chaudhary et al. A Study of Transliteration Approaches
Galieva et al. On the way to the relevant grammatical tagset for the tatar national corpus
Josan et al. Direct Approach for Machine Translation from Punjabi to Hindi
Devi et al. Parts of Speech Tagged Phrase-Based Statistical Machine Translation System for English→ Mizo Language
Ekpenyong et al. A robust language processor for African tone language systems
Gokhale et al. A Survey of Morphological Analysis for Marathi Language
JP3313810B2 (ja) アスペクト処理装置
Popović et al. Automatic Morphological Annotation in a Text-to-Speech System for Hebrew
Megerdoomian Low-density language strategies for Persian and Armenian
JPH07121542A (ja) 機械翻訳装置
JP4023384B2 (ja) 自然言語翻訳方法及び装置及び自然言語翻訳プログラム
Qassim A hybrid rules and statistical method for Arabic to English machine translation
JP2947554B2 (ja) 機械翻訳装置