JPS61272873A - テキストの補整表記方式 - Google Patents

テキストの補整表記方式

Info

Publication number
JPS61272873A
JPS61272873A JP60114049A JP11404985A JPS61272873A JP S61272873 A JPS61272873 A JP S61272873A JP 60114049 A JP60114049 A JP 60114049A JP 11404985 A JP11404985 A JP 11404985A JP S61272873 A JPS61272873 A JP S61272873A
Authority
JP
Japan
Prior art keywords
word
japanese
character
characters
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60114049A
Other languages
English (en)
Inventor
Fumiyuki Yamano
山野 文行
Atsushi Okajima
岡島 惇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60114049A priority Critical patent/JPS61272873A/ja
Publication of JPS61272873A publication Critical patent/JPS61272873A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の利用分野〕 本発明は、ある言語から日本語への翻訳処理や日本語文
の生成処理等において1日本語以外の文字や数字、記号
等が文字列中に連接して存在する場合に、日本語の文字
列の表記を読み易くなるように自動的に補整する日本語
の表記方式に関するものである。
〔発明の背景〕
一般に、日本語はこう着語という性格上、文字列を単語
のレベルに関係なく、読点も文字の一部とみなせば、す
べての文字を連接して表記している。しかし、日本語へ
の翻訳処理、例えば、英語から日本語への翻訳処理にお
いては、人名や地名がシステムの辞書に登録されていな
いことが多く。
未登録語として英語の表記のままで訳出されることがあ
る。さらには、固有名詞等では訳語が英文と同じ表記に
なることも多い。その結果1日本語の文章中に、英文表
記としての訳語が連続して現われる場合、2つの単語を
連接して訳出すると。
原文の単語の意味とは異なった単語列として訳出される
ことになり、誤解を招くことになる。
尚、現状の翻訳処理としては、例えば、「言語の機械処
理J  (1984年、長比 真編、三省堂発行)のp
、112に翻訳結果が示されている。
〔発明の目的〕
本発明は、上記の点を鑑み、日本語の文字列を単語単位
の文字列を用いて合成表記する際、単語間の隣り合う文
字をチェックし、英数字等の特殊文字が連接して出現す
る場合には空白を挿入することにより、日本語文を読み
易く表記することを目的としてなされたものである。
〔発明の概要〕
本発明はある言語によるテキストを単語単位の文字列を
連接することによって生成していくテキストの生成処理
に関連し、べた詰め表記を禁止する文字のテーブルを持
つことにより、単語単位の文字列が前記言語とは異なる
言語の文字で構成された単語が相前後して連接される場
合を、2つの単語間の連接に直接関係する、前側に位置
する単語の末尾1文字と後側に位置する単語の先頭1文
字を抽出し、前記テーブルに登録された文字かどうかチ
ェックする手段を持つことにより、どちらも登録された
文字であれば、2つの単語間に空白を1文字挿入する補
整機能を有することを特徴とするものである。
〔発明の実施例〕
以下、本発明を実施例を参照して詳細に説明する。
一実施例として、単語から日本語への翻訳処理における
訳文の合成処理について述べる。
第3図は、本発明による日本語の補整表記方式を実施す
るための装置の一実施例を示すブロック図を示す0図中
、11はプロセッサ、12はメモリ、13はキーボード
等の入力装置、14はディスプレイ装置、15は辞書フ
ァイルを表している。
ここで、英語から日本語への翻訳処理の一実現方法とし
ては、例えば、特開昭58−40684で開示された方
法を用いることが可能であり、詳細説明は省略する。
翻訳処理における訳文の合成処理は、図式化すれば、第
1図のようになる。つまり、入力英文(Proof b
y refutation and resoluti
on theoremproving)  に対して翻
訳処理によって得られる訳出語順(7,6,1,2,3
,4,5の順)に従って辞書ファイル中の訳語を抽出し
、訳文(rrefutationとressoluti
on theoremproving による証明」)
を合成していく。
以下、本発明に関する日本語の補整表記方式について説
明する。
日本語の補整表記は、第4図に示されるフローに従って
行なわれる。
(101)  メモリ2中のテーブルLCにスペース(
空白)をセットし、メモリ2中の訳出語順テーブルの配
列内の位置を示すポインタWCを1とする。さらに、メ
モリ2中の訳文データ列テーブルJDATAをクリアす
る。
(102)  訳出語順テーブル内の最後の単語まで訳
文の合成処理が終わっていれば、すべての処理を終了す
る。訳出語順テーブル内にまだ単語データが残されてい
れば、(103)の処理へ移る。
(103)  ポインタWCによって示される入力英文
中の単語の訳語を辞書ファイル5より抽出し、メモリ2
中のテーブルJPNにセットすると共に、訳語の先頭の
一文字をメモリ2中のテーブルHCにセットする。
(104)  テーブルLCとテーブルHCに納められ
たデータが共に第5図で示される特殊文字テーブル内に
存在するかどうかチェックし、共に存在すれば(105
)へ、前記以外であれば(106)の処理へ移る。
(105)  スペース−文字分を訳文データ列テーブ
ルJDATA内のデータの直後に連接する。
(106)  メモリ2中のテーブルJPN内の訳語デ
ータを訳文データ列テーブルJDATA内のデータの直
後に連接する。
(107)  訳語の最後の一文字をメモリ2中のテー
ブルLCにセットする。さらに、ポインタWCの値を1
つ増やして(102)の処理へ移る。
上記の処理ステップ′こ従って、訳文データ列テーブル
内のデータの変化する様子を示すと、第2図(a)〜(
g)のようになる。このようにして、最終的に、入力英
文に対応する訳文が合成される。
以上説明したごとく本発明によれば、日本語の文字列の
中に、英語のような異なる言語や記号等の文字列が連接
して現れる場合に、空白文字を自動的に挿入することに
より訳文等の日本語を読み易く表記することが可能とな
る。
本発明においては、英語から日本語への翻訳処理におけ
る訳文の合成処理を中心に説明したが、一般的には、日
本語のような、こう着語の文字列表記中に、英語のよう
な屈折語の文字列表記が併用されるような場合において
、単語単位の文を合成していく際に、本発明を適用する
ことができる。
【図面の簡単な説明】
第1図は本発明の一実施例による日本語の補整表記処理
の一例を示すための説明図、第2図は処理に伴なうデー
タの変化例を示す図、第3図は本発明の一実施例の構成
を示すブロック図、第4図は本発明の一実施例の動作を
説明するためのフローチャート、第5図は本発明の一実
施例で用いるテーブル内のデータの説明図である。 図中、1はプロセッサ、2はメモリ、3はキーボード等
の入力装置、4はディスプレイ装置、5は辞書ファイル
を表している。 代理人 弁理士 小川勝馬□′   Y 1 口 (2’f!′図 番 第4− 口

Claims (1)

    【特許請求の範囲】
  1. 1、ある言語によるテキストを単語単位の大字列を連接
    することによつて生成していくテキストの生成処理に関
    連し、べた詰め表記を禁止する文字のテーブルを持つこ
    とにより、単語単位の文字列が前記言語とは異なる言語
    の文字で構成された単語が相前後して連接される場合を
    、2つの単語間の連接に直接関係する、前側に位置する
    単語の末尾1文字と後側に位置する単語の先頭1文字を
    抽出し、前記テーブルに登録された文字かどうかをチェ
    ックする手段を持つことにより、どちらも登録された文
    字であれば、2つの単語間に空白を1文字挿入する補整
    機能を有することを特徴とするテキストの補整表記方式
JP60114049A 1985-05-29 1985-05-29 テキストの補整表記方式 Pending JPS61272873A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60114049A JPS61272873A (ja) 1985-05-29 1985-05-29 テキストの補整表記方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60114049A JPS61272873A (ja) 1985-05-29 1985-05-29 テキストの補整表記方式

Publications (1)

Publication Number Publication Date
JPS61272873A true JPS61272873A (ja) 1986-12-03

Family

ID=14627752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60114049A Pending JPS61272873A (ja) 1985-05-29 1985-05-29 テキストの補整表記方式

Country Status (1)

Country Link
JP (1) JPS61272873A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62267871A (ja) * 1986-05-15 1987-11-20 Ricoh Co Ltd 日本語生成装置
JPH0258162A (ja) * 1988-08-24 1990-02-27 Toshiba Corp 機械翻訳装置および機械翻訳方法
WO2004003786A1 (ja) * 2002-06-27 2004-01-08 Hiroshi Ishikura 文章入力システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62267871A (ja) * 1986-05-15 1987-11-20 Ricoh Co Ltd 日本語生成装置
JPH0258162A (ja) * 1988-08-24 1990-02-27 Toshiba Corp 機械翻訳装置および機械翻訳方法
WO2004003786A1 (ja) * 2002-06-27 2004-01-08 Hiroshi Ishikura 文章入力システム

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
EP0749075A2 (en) Machine translation system
US20070179779A1 (en) Language information translating device and method
JPH07325829A (ja) 文法チェックシステム
JP2009157888A (ja) 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム
JPS61272873A (ja) テキストの補整表記方式
JPS5892063A (ja) イデイオム処理方式
US20050015237A1 (en) Process, computerized device and computer program for assisting the vowelization of Arabic language words
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JP3136973B2 (ja) 言語解析システムおよび方法
JP2626722B2 (ja) 日本語生成装置
JPH0552543B2 (ja)
Deksne et al. Towards the Development of Language Analysis Tools for the Written Latgalian Language
JP3692711B2 (ja) 機械翻訳装置
KR20070083757A (ko) 텍스트 데이터 구조, 텍스트 데이터 처리방법, 텍스트데이터 처리 프로그램 및 텍스트 데이터 처리 프로그램을기록한 기록 매체
Utka Towards the Development of Language Analysis Tools for the Written Latgalian
JP2723886B2 (ja) 機械翻訳装置及びその翻訳規則作成方法
JPH06119379A (ja) ふりがな機能つき機械翻訳装置および方法
JP3353873B2 (ja) 機械翻訳装置
JP2972212B2 (ja) 機械翻訳方法及びシステム
JPH10198676A (ja) 日本語形態素解析装置及び日本語形態素解析方法
JPH0348366A (ja) 形態素解析、構文解析及び形態素生成方式
JPH09204429A (ja) 機械翻訳装置
JOINT PUBLICATIONS RESEARCH SERVICE ARLINGTON VA Foreign Developments in Information Processing and Machine Translation
King English dialectology: An introduction By Lawrence M. Davis