JP3362036B2 - 機械翻訳方法および装置 - Google Patents

機械翻訳方法および装置

Info

Publication number
JP3362036B2
JP3362036B2 JP2001354700A JP2001354700A JP3362036B2 JP 3362036 B2 JP3362036 B2 JP 3362036B2 JP 2001354700 A JP2001354700 A JP 2001354700A JP 2001354700 A JP2001354700 A JP 2001354700A JP 3362036 B2 JP3362036 B2 JP 3362036B2
Authority
JP
Japan
Prior art keywords
parenthesis
unmatched
delimiter
unsupported
parentheses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001354700A
Other languages
English (en)
Other versions
JP2002197082A (ja
Inventor
ひとみ 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2001354700A priority Critical patent/JP3362036B2/ja
Publication of JP2002197082A publication Critical patent/JP2002197082A/ja
Application granted granted Critical
Publication of JP3362036B2 publication Critical patent/JP3362036B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、原文から訳文に翻
訳するコンピュータを利用した機械翻訳方法および装置
に関するものである。
【0002】
【従来の技術】近年、機械翻訳に対する社会のニーズが
高まり、機械翻訳装置の開発が盛んに行なわれるように
なってきた。
【0003】機械翻訳機においては、OCR等より入力
したテキストを翻訳する場合、翻訳の単位に分割しなけ
ればならない(以下、この処理を文認定と呼ぶ。)。通
常、機械翻訳機における翻訳の単位は文である。したが
って、文認定処理では、ピリオド(.)、感嘆符
(!)、疑問符(?)などの文末を表わすトークンを区
切り文字(記号)として文を認定している。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では、入力したテキスト中の「(
)」「「」」「< >」「{ }」「〔 〕」「“
”」のような括弧の内、開き括弧または閉じ括弧の一
方だけという対応のとれていない括弧が存在した場合、
括弧のチェックは行なうが、その後の修正は、ユーザが
テキスト・エディタを用いて行なわなければならないと
いう問題があった。
【0005】本発明は、このような従来の問題を解決す
るものであり、対応の取れていない括弧があってもテキ
スト・エディタを用いずに修正することのできる機械翻
訳方法および装置を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明の機械翻訳方法は、入力したテキストをある
決まった区切り文字で翻訳の単位に分割するコンピュー
タを利用した機械翻訳方法において、未対応括弧検出手
段が、前記入力テキスト中の括弧の対応がとれていない
未対応括弧を検出するステップと対応括弧推定手段
が、前記未対応括弧が開き括弧である場合には、前記未
対応括弧以後の区切り文字の後ろを前記未対応括弧に対
応する閉じ括弧の位置候補として順次推定し、前記未対
応括弧が閉じ括弧である場合には、前記未対応括弧以前
の区切り文字の後ろを前記未対応括弧に対応する開き括
弧の位置候補として順次推定するステップと対応括弧
表示手段が、前記推定された位置候補における対応する
括弧とその位置の前または後の単語とを併せた表記で複
数の候補を表示するステップと、修正手段が、前記表示
された候補の中からユーザによって選択された正しい候
補に基づいてテキストを修正するステップとを備えた
とを特徴とするものである。この方法によれば、対応の
とれていない括弧が存在した場合でも、予めシステムが
簡単なアルゴリズムによりその括弧に対応する括弧の位
置を推測して、その位置における対応する括弧とその位
置の前または後の単語とを併せた表記で複数の候補を
ーザに表示するようにしたので、ユーザはその中から正
しいものを選択するだけでよく、テキスト・エディタを
介在させることなく、未対応括弧の修正を行なうことが
できる。
【0007】
【0008】また、本発明の機械翻訳装置は、入力した
テキストをある決まった区切り文字で翻訳の単位に分割
する機械翻訳装置において、前記入力テキスト中の括弧
の対応がとれていない未対応括弧を検出する手段と、前
記未対応括弧が開き括弧である場合には、前記未対応括
弧以後の区切り文字の後ろを前記未対応括弧に対応する
閉じ括弧の位置候補として順次推定し、前記未対応括弧
が閉じ括弧である場合には、前記未対応括弧以前の区切
り文字の後ろを前記未対応括弧に対応する開き括弧の位
置候補として順次推定する手段と、前記推定された位置
候補における対応する括弧とその位置の前または後の単
語とを併せた表記で複数の候補を表示する手段と、前記
表示された候補の中からユーザによって選択された正し
い候補に基づいてテキストを修正する手段とを備えたも
のである。この構成によれば、対応のとれていない括弧
が存在した場合でも、予めシステムが簡単なアルゴリズ
ムによりその括弧に対応する括弧の位置を推測して、
の位置における対応する括弧とその位置の前または後の
単語とを併せた表記で複数の候補をユーザに表示するよ
うにしたので、ユーザはその中から正しいものを選択す
るだけでよく、テキスト・エディタを介在させることな
く、未対応括弧の修正を行なうことができる。
【0009】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。図1は本発明の実施の形態
における英日機械翻訳装置の概略ブロック図である。図
1において、原文入力部1は、OCRやキーボードなど
から翻訳対象となる原文を入力するものである。通常、
機械翻訳では、「.?!」等の文末を示す区切り文字で
区切られた文を翻訳の単位とする。しかし、原文入力部
1に入力される原文は、未だ文に区切られていないテキ
ストの集まりである。未対応括弧検出部2は、原文入力
部1で入力されたテキストから対応のとれていない未対
応括弧を検出するものである。未対応括弧とは、対応す
る閉じ括弧が存在しない開き括弧、または対応する開き
括弧が存在しない閉じ括弧、または対応するクォーテー
ション・マークが存在しないクォーテーション・マーク
等である。対応括弧推定部3は、未対応括弧検出部2で
検出した括弧に対応する括弧の位置を所定の推定アルゴ
リズムを用いて推定するものである。未対応括弧検出結
果表示部(以下、単に検出結果表示部という。)4は、
未対応括弧検出部2で検出した括弧を強調表示(例え
ば、反転表示など)して、原文入力部1で入力したテキ
ストを表示するものである。対応括弧推定結果表示部
(以下、単に推定結果表示部という。)5は、対応括弧
推定部3で推定した結果をユーザに示すものである。修
正指示部6は、推定結果表示部5で表示した推定結果の
中から正しいものをユーザが選択し、入力テキストを修
正するものである。ユーザ・インターフェース部7は、
検出結果表示部4、推定結果表示部5、修正指示部6を
制御するものである。文認定部8は、入力テキストを区
切り文字で翻訳の単位となる文に分割するものであり、
括弧検出手段、区切り文字検出手段、分割実行手段の
他、括弧の中に区切り文字を検出した場合、その区切り
文字から閉じ括弧までの間にテキストが存在しないかど
うかを調べ、存在する場合は、その区切り文字でテキス
トを分割することを禁止する手段を備えている。翻訳実
行部9は、文認定部8で分割した結果を用いて、一文単
位の翻訳を行なうものである。制御部10は、原文入力
部1、未対応括弧検出部2、対応括弧推定部3、ユーザ
・インターフェース部7、文認定部8、翻訳実行部9を
制御するものである。記憶部11は、原文入力部1で入
力したテキスト、未対応括弧検出部2における検出結
果、対応括弧推定部3における推定結果、修正指示部6
で未対応括弧の修正を行なった後のテキスト、文認定部
8における認定結果、翻訳実行部9における翻訳結果等
を記憶するものである。
【0010】以上のように構成された機械翻訳装置にお
ける動作を図2のフローチャートに基づいて説明する。
まず、ステップ21で翻訳対象となるテキストを原文入
力部1から入力する。次に、ステップ22で入力テキス
ト中に未対応括弧がないかを未対応括弧検出部2でチェ
ックする。そして、ステップ23で未対応括弧が検出さ
れた場合はステップ24へ進み、検出されなければステ
ップ27の処理を行なう。
【0011】ステップ24では、ステップ22で検出さ
れた未対応括弧に対応する括弧の位置を対応括弧推定部
3で以下のような推定アルゴリズムを用いて複数箇所推
定する。例えば、開き括弧「(」のみ存在する場合、 候補1…次の区切り文字の後ろ 候補2…その次の区切り文字の後ろ 候補3…そのまた次の区切り文字の後ろ また、閉じ括弧「)」のみ存在する場合は、 候補1…1つ前の区切り文字の後ろ 候補2…もう1つ前の区切り文字の後ろ 候補3…そのまたもう1つ前の区切り文字の後ろ というように推定する。
【0012】ステップ25では、ステップ22で検出し
た未対応括弧を検出結果表示部4で反転表示して、ステ
ップ21で入力したテキストをディスプレイなどに表示
する。この時、このテキスト中の最初の未対応括弧に関
しては、推定結果表示部5によりその推定結果が表示さ
れる。例えば、図5に示すような入力テキストにおい
て、Hinamatsuri の後ろの開き括弧「(」に対応する閉
じ括弧がない場合、上記した推定アルゴリズムに従っ
て、図6のように複数の候補が表示される。
【0013】次にステップ26で、表示された推定結果
の中からユーザが正しいもの(図6の場合は候補1)を
選択して、その修正を修正指示部6によりテキストの先
頭から順に行なう。未対応括弧の修正については、図3
のフローチャートに基づいて説明する。まず上記した通
り、未対応括弧の検出結果を表示する際に最初の未対応
括弧に対する推定結果を表示する(ステップ31)。次
にユーザが、この推定結果の中から正しい候補をマウス
でクリックすると(ステップ32)、原文が修正され
(ステップ33)、ステップ35へ行く。いずれの候補
もマウスでクリックされない場合は、推定結果の中の
「次へ」をマウスでクリックするか、または「→」キー
を押すと(ステップ34)、原文は修正されずにステッ
プ35へ行く。ステップ35では、いま修正した未対応
括弧がテキスト中で最後であったかどうかチェックし、
最後なら未対応括弧の修正処理を終了し、最後でなけれ
ばステップ36で次の未対応括弧の推定結果を表示し、
ステップ32へ戻る。
【0014】こうして、未対応括弧の修正を終えると、
図2のステップ27で文認定部8により文認定を行な
う。この文認定の処理については、図4のフローチャー
トに基づいて説明する。ここでは文認定に、2つのバッ
ファを用いる。1つは、開き括弧を検出するとその括弧
を記憶する括弧バッファa、もう1つは入力した文字を
記憶する一文バッファbである。また、クォーテーショ
ン・マークは、「“ ・・”」のように開き括弧と閉じ括
弧の区別があるのが普通であるが、以下の説明ではこれ
ら区別のないクォーテーション・マーク「” ”」の場
合について述べる。
【0015】まず、ステップ41で、原文入力部1から
入力されて記憶部11に記憶された入力テキストから1
文字入力する。ステップ42で、入力文字がテキストの
終わりを示すeof マークかどうかチェックして、eof マ
ークであれば、一文バッファbに記憶されている文字群
を一文と認定し(ステップ53)、文認定処理を終了す
る。eof マークでなければ、ステップ43の処理を行な
う。ステップ43では、入力文字が開き括弧かどうかチ
ェックし、開き括弧であればステップ44、開き括弧で
なければステップ45の処理を行なう。ステップ44で
は、入力した開き括弧を括弧バッファaへ記憶するとと
もに、その入力文字である開き括弧をステップ52で一
文バッファbへ記憶する。ステップ45では、入力文字
が閉じ括弧かどうかチェックし、閉じ括弧であればステ
ップ46、閉じ括弧でなければステップ47の処理を行
なう。ステップ46では、入力した閉じ括弧に対応する
開き括弧、例えば「}」であれば「{」、「)」であれ
ば「(」のように同じ種類の開き括弧を括弧バッファa
から取り出し、開き括弧の記憶をキャンセルする。この
ときの動作を図7に示す。すなわち、括弧バッファa内
に「(」が1つしかない場合は、その1つの「(」を取
り出し、括弧バッファa内に「(」が複数存在する場合
は、最初の「(」を取り出す。そして、ステップ52で
その入力文字である閉じ括弧を一文バッファbへ記憶す
る。ステップ47では、入力文字がダブル・クォーテー
ションかどうかチェックし、ダブル・クォーテーション
であればステップ48、ダブル・クォーテーションでな
ければステップ49の処理を行なう。この場合のダブル
・クォーテーションは開き括弧、閉じ括弧の区別がない
ので、ステップ48では、まず括弧バッファaを検索
し、ダブル・クォーテーションが見つかれば、いま入力
したダブル・クォーテーションは閉じ括弧だったものと
して、ダブル・クォーテーションを括弧バッファaから
取り出す。見つからなければ、開き括弧だったものとし
てダブル・クォーテーションを括弧バッファaに記憶す
る。そして、ステップ52でその入力文字であるダブル
・クォーテーションを一文バッファbへ記憶する。ステ
ップ49では、入力文字が区切り文字かどうかをチェッ
クし、区切り文字であればステップ50、区切り文字で
なければ残された文字種としてはアルファベット文字と
いうことになるので、その入力文字であるアルファベッ
ト文字をステップ52で一文バッファbへ記憶する。ス
テップ50では、括弧バッファaに括弧が記憶されてい
るかどうかをチェックし、記憶されていなければステッ
プ51で一文認定処理を行なう。記憶されていれば、括
弧内の区切り文字ということになるので、その区切り文
字の位置でテキストを分割することをせず、その入力文
字である区切り文字をステップ52で一文バッファbへ
記憶する。ステップ51およびステップ53の一文認定
処理とは、一文バッファbに記憶された文字群を翻訳の
単位として認定し、然るべき型式にして記憶し、一文バ
ッファbを初期化することである。
【0016】こうして入力テキストの文認定が終える
と、その結果を入力として、図2のステップ28で翻訳
を行なう。
【0017】このように、上記実施の形態によれば、原
文入力部1から入力したテキストの中に対応のとれてい
ない括弧が存在しても、それを未対応括弧検出部2で検
出し、対応括弧推定部3がその括弧に対応する括弧の位
置を推測し、対応括弧推定結果表示部5が複数箇を候補
として表示し、ユーザが修正指示部6によりその中から
正しいものを選択するだけでよく、テキスト・エディタ
を介在させることなく、未対応括弧の修正を行なうこと
ができる。また、括弧を考慮した文認定を行なうことに
より、She said to him,“Don't be lazy. Study harde
r.”のようなテキストが存在しても正しく文認定するこ
とができる。
【0018】
【発明の効果】本発明は、上記実施の形態から明らかな
ように、入力したテキストをある決まった区切り文字で
翻訳の単位に分割する際に、未対応括弧検出手段が、
力テキスト中の括弧の対応がとれていない未対応括弧を
検出し、対応括弧推定手段が、未対応括弧が開き括弧で
ある場合には、前記未対応括弧以後の区切り文字の後ろ
を前記未対応括弧に対応する閉じ括弧の位置候補として
順次推定し、前記未対応括弧が閉じ括弧である場合に
は、前記未対応括弧以前の区切り文字の後ろを前記未対
応括弧に対応する開き括弧の位置候補として順次推定
し、対応括弧表示手段が、推定された位置候補における
対応する括弧とその位置の前または後の単語とを併せた
表記で複数の候補を表示し、修正手段が、表示された候
補の中からユーザによって選択された正しい候補に基づ
いてテキストを修正するようにしたので、ユーザは表示
された推定結果の中から正しいものを選択するだけでよ
く、テキスト・エディタを介在させることなく、未対応
括弧の修正を行なうことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における英日機械翻訳装置
の構成を示すブロック図
【図2】本発明の実施の形態における英日機械翻訳装置
の動作を示すフロー図
【図3】本発明の実施の形態における未対応括弧の修正
の流れを示すフロー図
【図4】本発明の実施の形態における文認定処理の流れ
を示すフロー図
【図5】本発明の実施の形態における未対応括弧を有す
るテキストを表示した画面図
【図6】本発明の実施の形態における未対応括弧の検出
結果を表示した画面図
【図7】本発明の実施の形態におけるバッファから対応
する開き括弧を取り出す際の動作を示す模式図
【符号の説明】
1 原文入力部 2 未対応括弧検出部 3 対応括弧推定部 4 未対応括弧検出結果表示部 5 対応括弧推定結果表示部 6 修正指示部 7 ユーザ・インターフェース部 8 文認定部 9 翻訳実行部 10 制御部 11 記憶部

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力したテキストをある決まった区切り
    文字で翻訳の単位に分割するコンピュータを利用した
    械翻訳方法において、未対応括弧検出手段が、前記入力
    テキスト中の括弧の対応がとれていない未対応括弧を検
    するステップと対応括弧推定手段が、前記未対応括
    弧が開き括弧である場合には、前記未対応括弧以後の区
    切り文字の後ろを前記未対応括弧に対応する閉じ括弧の
    位置候補として順次推定し、前記未対応括弧が閉じ括弧
    である場合には、前記未対応括弧以前の区切り文字の後
    ろを前記未対応括弧に対応する開き括弧の位置候補とし
    て順次推定するステップと対応括弧表示手段が、前記
    推定された位置候補における対応する括弧とその位置の
    前または後の単語とを併せた表記で複数の候補を表示
    るステップと、修正手段が、前記表示された候補の中か
    らユーザによって選択された正しい候補に基づいてテキ
    ストを修正するステップとを備えたことを特徴とする機
    械翻訳方法。
  2. 【請求項2】 入力したテキストをある決まった区切り
    文字で翻訳の単位に分割する機械翻訳装置において、前
    記入力テキスト中の括弧の対応がとれていない未対応括
    弧を検出する手段と、前記未対応括弧が開き括弧である
    場合には、前記未対応括弧以後の区切り文字の後ろを前
    記未対応括弧に対応する閉じ括弧の位置候補として順次
    推定し、前記未対応括弧が閉じ括弧である場合には、前
    記未対応括弧以前の区切り文字の後ろを前記未対応括弧
    に対応する開き括弧の位置候補として順次推定する手段
    と、前記推定された位置候補における対応する括弧とそ
    の位置の前または後の単語とを併せた表記で複数の候補
    を表示する手段と、前記表示された候補の中からユーザ
    によって選択された正しい候補に基づいてテキストを修
    正する手段とを備えた機械翻訳装置。
JP2001354700A 2001-11-20 2001-11-20 機械翻訳方法および装置 Expired - Fee Related JP3362036B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001354700A JP3362036B2 (ja) 2001-11-20 2001-11-20 機械翻訳方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001354700A JP3362036B2 (ja) 2001-11-20 2001-11-20 機械翻訳方法および装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP03099193A Division JP3705825B2 (ja) 1993-02-19 1993-02-19 機械翻訳装置ならびにその装置を用いたテキスト区切り方法

Publications (2)

Publication Number Publication Date
JP2002197082A JP2002197082A (ja) 2002-07-12
JP3362036B2 true JP3362036B2 (ja) 2003-01-07

Family

ID=19166512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001354700A Expired - Fee Related JP3362036B2 (ja) 2001-11-20 2001-11-20 機械翻訳方法および装置

Country Status (1)

Country Link
JP (1) JP3362036B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8077974B2 (en) 2006-07-28 2011-12-13 Hewlett-Packard Development Company, L.P. Compact stylus-based input technique for indic scripts
KR102475796B1 (ko) * 2020-09-17 2022-12-08 에스케이플래닛 주식회사 조건식 생성 인터페이스를 이용한 챗봇 서비스 제공 방법 및 장치

Also Published As

Publication number Publication date
JP2002197082A (ja) 2002-07-12

Similar Documents

Publication Publication Date Title
US9218066B2 (en) Method for character correction
JP2003514304A (ja) スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
JP5007977B2 (ja) 機械翻訳装置、機械翻訳方法、及びプログラム
JP2009059159A (ja) 情報処理装置と情報処理方法とプログラム
JP3362036B2 (ja) 機械翻訳方法および装置
JPS61156466A (ja) 単語抽出方式
JP3705825B2 (ja) 機械翻訳装置ならびにその装置を用いたテキスト区切り方法
JP3935374B2 (ja) 辞書構築支援方法、装置及びプログラム
JP3329476B2 (ja) かな漢字変換装置
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JP2936761B2 (ja) 日本語文書の校正装置
JP3466761B2 (ja) 文書処理装置及びその制御方法
JP3995155B2 (ja) 複数言語文書の対応付けシステム,複数言語文書の対応付け方法,及びプログラム並びにプログラムを記録した記録媒体
JP2023146547A (ja) 抽出プログラム、装置、及び方法
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム
JPS60124777A (ja) 文書処理装置
JPS63229562A (ja) 文書作成・校正支援装置
JPH06259467A (ja) 機械翻訳装置
JPH04158477A (ja) 機械翻訳装置
JPS62212767A (ja) 辞書更新機能付き自然言語処理方式
JPH04101269A (ja) スペルコレクト方式
JP2002351868A (ja) 電子辞書
JPH10326276A (ja) 機械翻訳システム用辞書・ルール学習方法及びシステム及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JPH11338859A (ja) 氏名入力装置及びプログラム記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees