JP2003141114A - 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム - Google Patents

複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム

Info

Publication number
JP2003141114A
JP2003141114A JP2002232922A JP2002232922A JP2003141114A JP 2003141114 A JP2003141114 A JP 2003141114A JP 2002232922 A JP2002232922 A JP 2002232922A JP 2002232922 A JP2002232922 A JP 2002232922A JP 2003141114 A JP2003141114 A JP 2003141114A
Authority
JP
Japan
Prior art keywords
language
text
analysis
information
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002232922A
Other languages
English (en)
Other versions
JP4304268B2 (ja
Inventor
Hitoshi Isahara
均 井佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communications Research Laboratory
Original Assignee
Communications Research Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communications Research Laboratory filed Critical Communications Research Laboratory
Priority to JP2002232922A priority Critical patent/JP4304268B2/ja
Publication of JP2003141114A publication Critical patent/JP2003141114A/ja
Application granted granted Critical
Publication of JP4304268B2 publication Critical patent/JP4304268B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Abstract

(57)【要約】 【課題】 主要言語間のみならず主要言語・非主要言語
間における機械翻訳に用いることができる第3言語テキ
ストの生成技術を創出すること。同時に、従来よりも高
精度にテキストを生成することのできる生成技術を提供
する。 【解決手段】 複数の対訳関係を有する言語テキストを
入力し、両言語の対訳コーパスを用いることで、従来の
単言語入力よりも高精度な第3言語テキストを生成する
技術を実現する。入力後、解析過程、変換過程、生成過
程の各過程を経て、目標言語文書を出力する。目標言語
文書は、固有情報を自動獲得可能なため、大規模なコー
パス等を必要としないことに特徴を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、機械翻訳等におけ
る目標言語のテキストを高精度に生成する技術に関する
ものである。より詳しくは、複数の言語を入力し、それ
らの情報を融合することで目標言語テキスト生成の高精
度化を図る技術である。
【0002】
【従来の技術】近年、多くの情報がコンピュータ上に記
録され、特にインターネットの普及に伴って、そのよう
なデジタルデータにアクセスする手段を持つ者と持たな
い者の格差、いわゆるデジタルデバイドの問題が大きく
なっている。それに加えて、インターネット上に記録さ
れた多くの情報は、英語等の主要言語によるものが大半
であり、それらの言語を解する者と解さない者との格差
も大きな問題である。
【0003】これまで、これら言語障壁によるデジタル
デバイドの解消策として機械翻訳の研究は各所で行わ
れ、内外の多くの企業や研究所が取り組んでいる。例え
ば、入力言語と出力言語の対訳を用いて、その言語間の
翻訳に必要とされる知識を獲得する、コーパスを用いた
機械翻訳の研究がおこなわれているが、これらは大規模
な対訳データが存在する言語間でしか実現できない上
に、知識を獲得するだけであるため、従来よりも高精度
な機械翻訳には寄与しても、主要言語にしか用いること
ができない。
【0004】このように従来研究されている技術は、主
要言語間でのみ用いることができる技術が大半であり、
言語障壁によるデジタルデバイドの解消には寄与しない
と言わざるを得ない。インターネットをはじめとする情
報技術の進展により、このような格差は急速に広がりつ
つあり、格差が致命的になる前に対処することが緊急の
課題である。しかしながら、発展途上国には言語資源と
技術を開発するコストを負担する能力は乏しく、情報産
業が収益の伴わない高額の投資をするのは難しい。ま
た、先進国においても、多くの非主要言語に個別に対応
するだけの負担は不可能である。これらを解決するため
には、低コストで非主要言語にも対応可能な言語処理手
法の開発が求められているが、従来そのような技術開発
は遅れている。
【0005】さらに、現在の機械翻訳の精度は、広く実
用に供する域には達していない。ひとつの文を見ただけ
では十分に意味が取れず、前後の文脈を見てはじめて意
味がわかるような文が存在するが、現在の自然言語処理
技術は、このような文脈を扱う能力は不充分である。
【0006】
【発明が解決しようとする課題】本発明は、上記従来技
術の有する問題点に鑑みて創出されたものであり、その
目的は、主要言語間のみならず主要言語・非主要言語間
における機械翻訳に用いることができる第3言語テキス
トの生成技術を創出することである。同時に、従来より
も高精度にテキストを生成することのできる生成技術を
提供する。
【0007】
【課題を解決するための手段】本発明は、上記の課題を
解決するために、次のような第3言語テキストの生成ア
ルゴリズムを用いる。すなわち、そのもっとも核心的技
術は、複数の言語テキストを用いて新たな第3の言語テ
キストを生成するものである。そして、本発明によるア
ルゴリズムでは次の各ステップを含んでいる。 (1) 異なる言語によって記述され、翻訳のベースと
なる第1の言語と、その第1の言語と対訳関係にある少
なくとも第2の言語によって記述された2つ以上の対訳
テキストを入力する入力ステップ。 (2) 各対訳テキストにつき、各言語毎に、又は各言
語を任意に2つ以上組み合わせて、少なくとも係り受け
解析及び意味解析を含む言語解析を行い、少なくとも依
存構造及び意味表現に係る言語情報を獲得する解析ステ
ップ。 (3) 該変換ステップにおける変換結果に基づき第3
言語によるテキストを生成する生成ステップ。
【0008】そして、生成ステップが、解析ステップに
おいて獲得された言語情報又は、解析ステップの後、該
解析結果に基づき、第3言語固有の変換知識を備えて言
語変換を行う変換ステップを設け、該変換ステップにお
ける変換結果、の少なくともいずれかを用いて第3言語
によるテキストを生成する。
【0009】さらに、上記解析ステップが、各対訳テキ
ストを構成する語句・文が、いかなる対訳関係を有する
かについて関連づけを行う関連づけ過程、少なくとも前
記第1の言語のテキストにつき、それぞれ予め用意され
た解析モジュールを用いて解析する解析過程、関連づけ
の結果、第1の言語のテキストと対訳関係にある少なく
とも第2の言語テキスト中の部分を予め用意された解析
モジュールを用いて解析し、該各解析結果を融合する融
合過程の各過程を含んでもよい。
【0010】上記解析ステップ、変換ステップ、生成ス
テップの少なくともいずれかにおいて、各言語に関する
辞書情報又は文法情報の少なくともいずれかを含んで構
成される規則的情報と、コーパス等の実データからの学
習結果による経験的情報とを用いてもよい。
【0011】上記生成ステップにおいて、第3言語の構
文構造情報、又は第3言語の単語用法情報の少なくとも
いずれかについての情報が、該言語の既存のコーパスか
ら一部又は全部について自動獲得して形成され、該自動
獲得された第3言語の固有情報に基づき第3言語による
テキストを生成してもよい。
【0012】以上の方法を用いた第3言語テキストの生
成装置を提供することもできる。また、以上の方法によ
るプログラムとして提供することも可能である。
【0013】
【発明の実施の形態】以下、本発明の実施方法を図面に
示した実施例に基づいて説明する。なお、本発明の実施
形態は以下に限定されず、適宜変更可能である。本発明
は、従来の機械翻訳を超えた精度で目標とする第3言語
のテキスト(以下、単に目標言語と呼ぶ。)を生成する
ため、人手により作成された高精度の複数の対訳文書、
例えば日米2カ国の言語から内容面での情報を得、対訳
辞書等から変換規則を得、目標言語の文書から言語的特
徴を得て、目標言語の的確な文章を生成する技術であ
る。
【0014】従来の自然言語処理技術は、ひとつの文を
読んで、それを翻訳したり、要約したりするという通常
人間が行うであろう行為を模擬するものであった。しか
し一方で、計算機に文脈を扱わせる技術の確立が困難で
あるという致命的な欠陥があった。本発明では、例えば
日本語と英語の対訳文書から情報を和や積の形で取り出
し、深い意味理解を実現する。
【0015】単に情報をこのように和で取り出すことに
より情報の量を増やすという試みは他の情報処理の手法
ではあったが、本発明のように対訳を用いて積極的に文
の曖昧性を解消するという手法は全く新規なものであ
り、そこに本発明の最も大きな特徴がある。また、その
理解結果を元に、目標言語の単一言語コーパスから各言
語固有の情報を得て、表層の文章を生成する点も全く新
規な技術である。
【0016】図1に従来から行われている単言語文書を
目標言語に変換、生成するフローチャートを、図2に本
発明に係る日米対訳文書から目標言語に変換、生成する
フローチャートを示す。従来の方法において、単言語文
書(10)を目標言語文書(14)に翻訳するプロセス
は、大きく分類して、解析システム(11)、変換シス
テム(12)、生成システム(13)を経て行うのが一
般的であった。それら各システム(11)(12)(1
3)の開発に当たっては、人手による規則の作成(1
5)が不可欠であって、高精度なシステム開発には大規
模な文書の解析作業が必要であった。たとえば、学習に
用いる大規模なテキストコーパスは莫大なコストと、研
究が必要であり、現状では主要言語のみにようやく整備
されつつあるものの、非主要言語において用意される望
みは極めて薄い。
【0017】そこで、本発明は、図2に示すように、主
要言語等のコーパスが整備された少なくとも2つの言語
を用い、それらを解析システム(21)、変換システム
(22)、生成システム(23)の各システムを経て目
標言語文書(24)を生成する。すなわち、第3言語テ
キスト生成装置は、図3に示す2つ以上の対訳テキスト
を入力する入力手段によって文書の入力を行う。テキス
トは、スキャナ(31)から画像データとしてインター
フェース(32)を介してCPU(33)に入力して公
知のOCR処理をCPU(33)で実行し、テキストデ
ータに変換した上でハードディスク(34)・メモリ
(35)のいずれかに記憶させてもよい。また、ハード
ディスク(34)にあらかじめ記憶したテキストデータ
を読み出して入力してもよい。その他、コンピュータに
備えたキーボード(36)から対訳テキストを入力して
もよいし、ネットワークを介して接続された他のコンピ
ュータ(37)から取得する構成でもよい。これらとC
PU(33)を接続するインターフェースには対応する
I/Oデバイス、ネットワークアダプタなどを用いるこ
とができる。
【0018】各対訳テキストにつき、各言語毎に、又は
各言語を任意に2つ以上組み合わせて、言語情報の解析
を行う解析手段として対訳文書解析システム(21)に
至る。さらに、少なくとも該解析ステップにおける解析
結果に基づき、第3言語への言語変換を行う変換手段と
して変換システム(22)、該変換ステップにおける変
換結果に基づき第3言語によるテキストを生成する生成
手段として生成システム(23)を有する。これらは、
別に配設する出力手段(図示しない)によって出力可能
である。出力手段としては、画面表示をするモニタや、
ハードディスクなどの記憶装置、ネットワーク上の他の
コンピュータに対して出力を行うことができる。
【0019】入力する言語は、例えば日本語と英語の対
訳関係にある文書である。本発明では、翻訳のベースと
なる第1の言語を決め、それと対訳関係にある第2の言
語と共に入力する。また、入力する言語は2つ以上であ
ればよく、例えば3言語(日本語、英語、フランス語な
ど)によってより高精度な解析を実現することもでき
る。
【0020】従来の機械翻訳システムの精度が上がらな
い大きな理由の一つは、言語解析の困難さによる。解析
の困難さというのは、曖昧性の解消ができないというこ
とであるが、対訳を用いることにより、解析が可能にな
る場合がある。たとえば、日本語だけを見ていては、あ
るものが複数であるかどうかはわからないが、英語を見
れば、その語が単数形か複数形かで判断できる。一方、
英語ではその語の意味的役割がわからないが、日本語で
は助詞がついているので、たとえば「場所」をあらわす
情報であるということがわかったりする。これは日本語
と英語のように言語の体系が大きく異なる言語同士を利
用することで、特に有効となる。
【0021】従って、本発明における対訳文書の言語の
組み合わせとしては、日本語と英語や、日本語と中国
語、或いはその3言語を用いるなど、言語体系が異なる
言語を用いると特に好適である。逆に、英語とフランス
語のみ等では本発明による効果は必ずしも大きくない
が、英語・フランス語・日本語のように組み合わせる
と、英語・日本語のみの場合よりも高精度な生成が行え
る可能性が高く、そのような構成でもよい。
【0022】次に、本発明に係る解析システム(21)
につき詳述する。解析システムの構成を図4に示す。本
システム(21)は、上記入力手段でハードディスク
(34)に記憶された日英二言語の対訳文書(20)の
入力を前提に、語と語(あるいは日本語の文節のように
もう少し大きい単位)の間の依存関係をCPU(33)
で解析処理する。CPU(33)は必要に応じてメモリ
(35)などのコンピュータにおける諸装置・部材と連
携動作する。
【0023】本実施例では、まず入力された対訳文書
(20)について、対訳文書を構成する各文間での対訳
関係の関連づけを行い、次の解析処理における解析結果
の融合に用いる。すなわち、日英対訳文書(20)は、
仮に全部が逐次対訳関係にあったとしても、それらは各
言語の特性、読みやすさなどにより文の数が変わるた
め、機械的に対訳関係を見いだすことはできない場合が
ある。そこで、各対訳文書(20)を構成する文が、い
かなる対訳関係を有するかについて関連づけを行う対訳
関係関連づけ部(42)の処理を行い、対訳関係にある
テキストの関連づけを行っておく。関連づけのデータは
例えば日本語テキストの第10文は英語テキストの第1
1文と対訳関係にある、というように例えば日本語テキ
スト中にタグ付けし、ハードディスク(34)などに記
憶する。関連づけの方法には2つのテキスト間の相互関
係を抽出する周知の言語処理技術を用いることができる
が、例えば言語横断検索により実現することもできる。
【0024】そして、CPU(33)において、係り受
け解析(40)及び意味解析(41)の各処理を少なく
とも行う。これら各解析については、すでに公知であり
任意の方法を用いることができるが、例えば、すでに本
件出願人らが提案している日本語の係り受けモデル(内
元清貴、村田真樹、関根聡、井佐原均、「後方文脈を考
慮した係り受けモデル」、自然言語処理, Vol.7, No.5,
pp.3-17 (2000)、に記載)を日本語及び英語に適用す
ることによって決定する。このモデルは、二つの語(あ
るいは文節)が依存関係にあるかないかを学習するもの
で、機械学習モデルを用いて実現される。依存関係は学
習されたモデルによって計算される確率の積が一文全体
で最も高くなるように決定する。
【0025】係り受け解析(40)において、まずベー
スとなる日本語テキストについて構成される文を順次解
析を行うが、その際、当該文にタグ付けがされ、英語の
対訳文がある場合には、当該文の係り受け解析(40)
を合わせて行い、融合処理部(43)において両者の文
で上記確率の積が最も高いものをその文の係り受け解析
結果とする。これにより、日本語テキストだけを入力す
るよりも、他の言語の解析結果を融合して最も確率の高
い結果が得られるため、格段の解析結果の向上を図るこ
とができる。
【0026】さらに、この依存関係構造から格解析(意
味解析)を行う。依存関係の処理においては、二言語対
訳入力の有効性は、依存構造における係り受けの正解率
の向上で計量可能である。ここでも、上記同様に日本語
テキストからの解析結果と共に、対訳関係にある文が英
語テキスト中に含まれるときには、融合処理部(43)
において両者の解析結果を比較し、より確率の高い意味
解析の結果を用いる。このように本発明は、解析結果に
おいて単に確率の高い方を採ることができるので、より
多くの言語を入力することで容易に解析精度の向上が図
られる。
【0027】係り受け解析(40)や意味解析(41)
については、本件出願人による特願2001−1395
63号にも開示されており、意味解析(41)の一例と
して固有表現の抽出処理を詳述している。固有表現の抽
出は、正確な訳語選択において重要な意味解析の1つで
あり、第3言語への翻訳に極めて有効である。もっと
も、本発明はこれまでに提案されていなかった2つ以上
の対訳文書を入力し、解析、変換、生成の枠組みにおけ
る第3言語テキストの生成を図るものであるから、解析
方法は問わず、例えば周知の形態素解析を行い、そのと
きに対訳文書からの解析結果を融合してもよく、その融
合方法も解析方法によって異なるので、任意に決めるこ
とができる。
【0028】以上の係り受け解析・意味解析結果は、ハ
ードディスク(34)に記憶される。このように、解析
システム(21)の構成要素としては、それぞれの言語
の係り受け解析(40)・意味解析(41)処理を少な
くとも行う解析モジュール(45)を備え、さらに高精
度な解析のために、対訳関係関連づけ部(42)、融合
処理部(43)の各処理を行う。
【0029】また、本発明の解析モジュール(45)で
は辞書や文法など、あらかじめ作成された規則に基づく
解析を行う一方、対訳関係を関連づけ、その解析結果を
融合することにより実データに基づいた解析を可能にし
ている。このように前者の解析による規則的情報と、後
者の解析による経験的情報を融合することにより、本発
明ではより高精度な解析システム(21)の実現に寄与
している。
【0030】次に、変換システム(22)について以下
に説述する。図5に変換システムの構成を示す。前述し
た通り、コンピュータを用いてある言語の情報を別の言
語に変換するためにはコンピュータ処理に適した言語情
報が必要である。これらを人手で作ることは二言語を理
解する専門家による膨大な作業を必要とするため主要言
語対以外で行うことは現実的ではない。また、大量の対
訳コーパスからこれらの言語情報を自動獲得する手法も
あるが、今まで述べたように主要言語対以外では大量の
対訳コーパスを前提とすることはできない。
【0031】そこで、本発明では翻訳元である二言語の
対訳コーパス(27)と翻訳先言語、すなわち目標言語
(ここでは例えばタイ語とする)の単言語コーパス(2
8)、および、翻訳元言語と翻訳先言語との間の小規模
な対訳辞書等、例えば日タイ、英タイ辞書の小規模デー
タ(29)を組み合わせることによって、言語情報の獲
得を図る。単言語コーパス(28)の規模は小規模でも
よく、言語処理のための十分な研究、解析が期待できな
い言語に対しても効果的に対応できる。これによって獲
得された情報が、変換知識(25)及び生成用言語知識
(26)であり、本発明に係る変換システム(22)は
該変換知識(25)に基づき言語間の変換を司る。
【0032】本発明では、大規模な第3言語のコーパス
を用いなくとも高精度な出力を行うために、入力する対
訳コーパス(27)と第3言語の単言語コーパス(2
8)とを比較し、第3言語における固有の言語情報を自
動的に獲得し、変換知識データベース(54)を生成す
る。例えば、複合語句などの場合、単に各単語を辞書に
基づいて変換したのでは自然な言い回しとならないこと
が多い。特に訳語の選択や並び順などは第3言語の固有
の情報であり、それを変換知識として備えておくのが好
ましい。
【0033】そこで、本発明における変換システム(2
2)では、日英タイ語句間対応部(51)を設け、日英
対訳コーパス(27)・対訳文書(20)と、タイ語コ
ーパス(28)との間で、例えば同義の語句を抽出し、
それを変換知識生成部(52)において変換知識データ
ベース(54)に記憶する。例えば、翻訳元言語のコー
パスが日英の対訳であることから、双方の言語の対訳関
係にある語句に共通して最も対応する第3言語の語句を
統計的に決定してもよい。
【0034】変換知識は上記にかぎらず、日英対訳コー
パス(27)に多く見られる構文構造と、タイ語コーパ
スに多く見られる構文構造とを統計的に対応づけし、変
換知識として備えることもできる。これにより解析シス
テム(21)の解析結果を、タイ語固有の構文構造に変
換することが可能となる。
【0035】さらに、変換部(53)では、その時に記
憶された変換知識や、以前の翻訳によって生成された変
換知識を変換知識データベース(54)から読み出し、
上記解析システム(21)でハードディスク(34)に
記憶された依存構造及び意味表現に係る言語情報を変換
する。変換方法は、単に単語の係り受け関係や、固有表
現を、第3言語の変換知識に合わせて上書き修正するだ
けで足りる。変換された情報は再びハードディスク(3
4)に記憶される。
【0036】最後に、生成システム(23)につき詳述
する。図6に生成システムの構成を示す。生成に関する
技術開発は、従来あまり系統だって行われてこなかった
が、作成した文書を人間が直接読む場合、その精度は人
問の「読もうとする意欲」に直結する。そこで、本発明
では、生成システム(23)も極めて重要な言語処理シ
ステムの要素として捉え、次のような技術を用いてい
る。
【0037】すなわち、単言語コーパス(28)から単
語の用法に関する情報を得る技術と、構文構造に関する
情報を得る。二言語以上の情報を用いて理解された結果
を第3言語のテキストにする場合には、当然その言語に
ついての知識が必要となる。生成される文章の質の向上
のためには、その言語固有の情報も得る必要がある。し
かし、これをその言語の研究者の持つ言語直観によって
規則化していくということは、膨大な作業であり、主要
な言語以外でこのような規則を作成するということは現
実的ではない。
【0038】そこで、本発明に係る第3言語テキスト生
成装置では、個別の言語についての情報は、個別の言語
のデータを元に公知の技術により自動獲得する。すなわ
ち、CPU(33)はメモリ(35)と協働しながら、
構文構造獲得部(60)において、タイ語コーパス(2
8)から語順に係る構文構造を自動的に獲得する。この
獲得方法については、言語処理分野において、様々な公
知の手法があるが、例えば、コーパスから語順(内元清
貴、村田真樹、馬青、関根聡、井佐原均、「コーパスか
らの語順の学習」、自然言語処理, Vol.7, No.4, pp.16
3-180 (2000)、に記載)を用いることもできる。
【0039】具体的には、解析システム(21)、変換
システム(22)で得られた、語と語の依存構造から自
然な並びの表層文を生成する。本実施例では、自然な並
びであるかどうかを、語順モデルを適用することによっ
て決定した。このモデルは、同じ語を修飾する複数の修
飾語があるとき、修飾語間での自然な順序を学習するも
ので、周知の機械学習モデルを用いて実現される。自然
な語順は学習されたモデルによって計算される確率の積
が一文全体で最も高くなるように決定している。この
時、自動獲得した情報、例えば学習モデルにおける確率
値などは、生成用言語知識データベース(64)に記憶
し、次回以降の生成に用いてもよい。
【0040】基本的な構文構造が確定した後、表層表現
決定部(61)で、文中の個々の語に対する適切な表層
表現を決定する。表層表現の決定には、従来の言語処理
における周知の生成方法を用いることができるが、例え
ば本件出願人らが従来提案した文末モダリティの決定手
法を、格の表現をはじめとする他の表層表現にも拡張し
て用いることもできる。
【0041】すなわち、文末の時制情報(村田真樹、馬
青、内元清貴、井佐原均、「用例ベースによるテンス・
アスペクト・モダリティの日英翻訳」、人工知能学会誌
Vol.16, No.1, pp.20-27 (2001)に記載)を獲得する方
法は、テンス・アスペクト・モダリティの翻訳の問題に
初めて用例ベースの手法を適用したものであり、対訳の
データベースから解析しているテンス・アスペクト・モ
ダリティ表現によく似た対訳例(用例)を取り出し、そ
のデータベースから翻訳結果を出力する手法である。用
例間の類似度の定義として、文末からの一致文字列(も
しくは分類語彙表の分類番号も含めた文字列での一致)
を使っているため簡易な構成が可能であり、また、他の
表層表現にも容易に適用できる。
【0042】以上により、従来ではぎこちないテキスト
が出力されることが多かったコンピュータ生成による文
書を、コーパスに示される実際の文章での流暢さに基づ
いたレベルにまで向上させることが可能となる。また、
単言語コーパスからの単語用法情報を自動獲得し、生成
用言語知識(26)に加えることもできる。
【0043】以上、本発明における第3言語テキスト生
成装置の解析手段、変換手段、生成手段につき説述した
が、本発明の実施においては必ずしも変換手段を設けな
くともよい。すなわち、本発明で言う変換手段は、出力
する言語固有の変換知識を有するものであるが、明示的
に変換手段を配設しなくともよい。例えば、解析手段や
生成手段の有する言語情報に関する知識・情報で十分に
生成まで行える場合には、変換手段として独立した手段
ではなく、解析手段による解析結果から、生成手段によ
って直接第3言語を生成することができる。
【0044】また、本装置では、入力手段・出力手段に
ついても様々な形態を考えることができる。入力手段
は、多様な媒体を介して流通する情報から入力すること
が考えられる。例えば、紙片、書籍等の文書を電磁的記
録に変換可能な文書取込変換手段を有する。これはスキ
ャナと文字認識装置・ソフトウェアによってすでに容易
に実現可能であり、本発明の装置に内蔵することによっ
て、例えば日英の2言語で記述された対訳関係にある書
籍を読みとることで、タイ語等の第3言語テキストを出
力する構成を実現できる。出力には、表示装置による表
示、記録装置への書き出し、インターネット等のネット
ワーク上への掲載等、その出力手段は任意である。
【0045】また、ハードディスク、光学的記憶装置等
の電磁的記録装置から読み出されるコンピュータデータ
は、より簡易に読み出し、かつ入力することが可能であ
る。特に、近年ユニコード等の多言語に対応した文字コ
ードが開発されており、同時に複数の言語、特に非主要
言語であっても同時に扱うことが可能になってきた。こ
のようなコードを用いることで、円滑に複数の言語を同
時に扱うことが可能であり、上記電磁気的記録装置への
記録、読み出しは容易である。
【0046】さらに、本発明が大きく効果を有する用途
として、インターネット等のネットワーク上のコンピュ
ータに付設される電磁的記憶装置から取得可能なコンピ
ュータデータを入力することが考えられる。インターネ
ット上では、特に主要言語が用いられる地域でコンピュ
ータの普及が進んでいることもあり、流通する情報は多
くが主要言語で記述されている。また、多国籍企業のホ
ームページ等は、すでに主要言語間の人手による高精度
な翻訳がなされており、本発明の技術を用いることで、
未だ翻訳が行われていない多くの非主要言語への変換が
可能となる。従って、該装置の入力手段がインターネッ
ト等のネットワークに接続された電磁気的記録装置から
コンピュータデータを取得し、本装置へ入力することは
非常に効果的である。
【0047】上記では本発明の一実施形態として、第3
言語テキスト生成装置を挙げたが、本発明は単にコンピ
ュータのアルゴリズムとして提供することもできるし、
また、プログラムとして実現し、任意のコンピュータ上
で動作させることもできる。また、本発明によって構成
されたプログラムを、ネットワーク上で流通させること
もできる。
【0048】
【発明の効果】本発明は、以上の構成を備えるので、次
の効果を奏する。請求項1に記載の第3言語テキスト生
成アルゴリズムによると、複数の言語で書かれた同じ内
容の文章を合わせて解析することにより、正確な意味理
解を行い、入力とは異なる第3の言語で適切にテキスト
を生成することができる。また、必要に応じて変換過程
を備えることにより、より高精度化に寄与する。これに
より、発展途上国等への母国語による情報提供が可能に
なる。また、この手法が確立すれば、新しい言語への対
応は、その言語に関する言語情報の獲得が主たる開発要
素となり、それぞれの国でも対応できると思われる。今
後とも、英語で作られた文書を人手をかけて高品位の日
本語文書とすることは引き続き大量に行われるであろう
が、このような文書がすべて、他のアジアの多くの言語
にも高品位に翻訳されていくことは考えにくい。本発明
により、タイ語などのアジアの諸言語等への翻訳水準が
飛躍的に向上することが可能である。本技術の確立によ
り、デジタルデバイドに悩む多くの開発途上国が、独自
の努力と多少の支援により、そこから抜け出すことが可
能となる。さらに、従来の単言語からの翻訳に比して、
飛躍的に高精度な第3言語テキストの生成を低コストで
可能にすることができる。
【0049】請求項2に記載の第3言語テキスト生成ア
ルゴリズムによると、解析ステップが関連づけ過程、解
析過程、解析結果の融合過程を含み、該解析結果を変換
ステップや生成ステップにおいて用いることにより、高
精度な第3言語テキストの生成方法を実現することがで
きる。
【0050】請求項3に記載の第3言語テキスト生成ア
ルゴリズムによると、解析ステップ・変換ステップ・生
成ステップの各ステップのいずれかにおいて、規則的情
報と経験的情報を融合することで、第3言語テキストの
生成方法の高精度化に寄与する。
【0051】請求項4に記載の第3言語テキスト生成ア
ルゴリズムによると、第3言語の固有情報を自動獲得す
ることが出来るので、大規模な第3言語のコーパスを用
意することなく、多くの非主要言語に対応可能な第3言
語テキスト生成方法を実現することができ、デジタルデ
バイド問題に効果的に対応することができる。同時に、
生成方法の低コスト化にも寄与する。
【0052】請求項5に記載の第3言語テキスト生成装
置によると、複数の言語で書かれた同じ内容の文章を合
わせて解析することにより、正確な意味理解を行い、入
力とは異なる第3の言語で適切にテキストを生成する生
成装置を提供することができる。該装置の提供によっ
て、低コストで、多くの非主要言語で出力可能になり、
ひいてはデジタルデバイドの解消につながる。
【0053】請求項6に記載の第3言語テキスト生成装
置によると、解析手段が対訳関係の関連づけ、解析、解
析結果の融合を行うことによって、低コストで高精度な
第3言語テキス生成装置を実現することができる。
【0054】請求項7に記載の第3言語テキスト生成装
置によると、解析手段・変換手段・生成手段の各手段の
いずれかにおいて、規則的情報と経験的情報を融合する
ことによって、第3言語テキストの生成装置の高精度化
に寄与する。
【0055】請求項8に記載の第3言語テキスト生成装
置によると、第3言語の固有情報を自動獲得することが
出来るので、大規模な第3言語のコーパスを用意するこ
となく、多くの非主要言語に対応可能な第3言語テキス
ト生成装置を提供することができる。同時に、該装置の
低コスト化にも寄与する。
【0056】請求項9に記載の第3言語テキスト生成装
置によると、様々に流通する情報から自由に情報を入力
する入力手段を有するので、近年の多様な情報流通形態
にも柔軟に対応することが可能である。特に、インター
ネット上の情報を効率よく入力し、インターネット上に
出力することで、非主要言語による情報提供が容易にな
る。
【0057】請求項10に記載の第3言語テキスト生成
プログラムによると、複数の言語で書かれた同じ内容の
文章を合わせて解析することにより、正確な意味理解を
行い、入力とは異なる第3の言語で適切にテキストを生
成する第3言語テキスト生成プログラムを提供すること
ができる。それらの提供によって、低コストで、多くの
非主要言語で出力可能になり、ひいてはデジタルデバイ
ドの解消につながる。
【0058】請求項11に記載の第3言語テキスト生成
プログラムによると、解析処理部が関連づけ、解析、解
析結果の融合を行うことによって、低コストで高精度な
プログラムを実現することができる。
【0059】請求項12に記載の第3言語テキスト生成
プログラムによると、解析処理部・変換処理部・生成処
理部の各処理のいずれかにおいて、規則的情報と経験的
情報を融合することによって、それらの高精度化に寄与
する。
【0060】請求項13に記載の第3言語テキスト生成
プログラムによると、第3言語の固有情報を自動獲得す
ることが出来るので、大規模な第3言語のコーパスを用
意することなく、多くの非主要言語に対応可能な第3言
語テキスト生成プログラムを提供することができ、デジ
タルデバイド問題に効果的に対応することができる。同
時に、それらの低コスト化にも寄与する。
【図面の簡単な説明】
【図1】従来の目標言語文書生成フローチャートであ
る。
【図2】本発明による目標言語文書生成フローチャート
である。
【図3】本発明に係る第3言語テキスト生成装置の入力
手段の構成図である。
【図4】本発明に係る第3言語テキスト生成装置の解析
システムの構成図である。
【図5】本発明に係る第3言語テキスト生成装置の変換
システムの構成図である。
【図6】本発明に係る第3言語テキスト生成装置の生成
システムの構成図である。
【符号の説明】
20 対訳文書 21 対訳文書解析システム 22 変換システム 23 生成システム 24 目標言語文書 25 変換知識 26 生成用言語知識 27 対訳コーパス 28 単言語コーパス 29 目標言語の小規模データ 30 対訳コーパスから変換知識を取得する処理を示す
矢印

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】コンピュータにおける言語処理のうち、複
    数の言語テキストを用いて新たな第3の言語テキストを
    生成するアルゴリズムであって、該アルゴリズムが、 異なる言語によって記述され、翻訳元となる第1の言語
    と、該第1の言語と対訳関係にある少なくとも第2の言
    語で記述された、2つ以上の対訳テキストを入力する入
    力ステップ、 各対訳テキストにつき、各言語毎に、又は各言語を任意
    に2つ以上組み合わせて、少なくとも係り受け解析及び
    意味解析を含む言語解析を行い、少なくとも依存構造及
    び意味表現に係る言語情報を獲得する解析ステップ、 第3言語によるテキストを生成する生成ステップの各ス
    テップを含む構成であって、 生成ステップが、 解析ステップにおいて獲得された言語情報、又は、 解析ステップの後、該解析結果に基づき、第3言語固有
    の変換知識を備えて言語変換を行う変換ステップを設
    け、該変換ステップにおける変換結果、 の少なくともいずれかを用いて第3言語によるテキスト
    を生成することを特徴とする第3言語テキスト生成アル
    ゴリズム。
  2. 【請求項2】前記解析ステップが、 各対訳テキストを構成する語句・文が、いかなる対訳関
    係を有するかについて関連づけを行う関連づけ過程、 少なくとも前記第1の言語のテキストにつき、それぞれ
    予め用意された解析モジュールを用いて解析する解析過
    程、 関連づけの結果、第1の言語のテキストと対訳関係にあ
    る少なくとも第2の言語のテキスト中の部分を予め用意
    された解析モジュールを用いて解析し、該各解析結果を
    融合する融合過程の各過程を含む請求項1に記載の第3
    言語テキスト生成アルゴリズム。
  3. 【請求項3】前記解析・変換・生成ステップの少なくと
    もいずれかにおいて、 各言語に関する辞書情報又は文法情報の少なくともいず
    れかを含んで構成される規則的情報と、 コーパス等の実データからの学習結果による経験的情報
    とを用いる請求項1又は2に記載の第3言語テキスト生
    成アルゴリズム。
  4. 【請求項4】前記生成ステップにおいて、 第3言語の構文構造情報、又は第3言語の単語用法情報
    の少なくともいずれかについての情報が、該言語の既存
    のコーパスから一部又は全部について自動獲得して形成
    され、 該自動獲得された第3言語の固有情報に基づき第3言語
    によるテキストを生成する請求項1ないし3に記載の第
    3言語テキスト生成アルゴリズム。
  5. 【請求項5】言語処理のうち、複数の言語を用いて新た
    な第3の言語テキストを生成する装置であって、該装置
    が、 異なる言語によって記述され、翻訳元となる第1の言語
    と、該第1の言語と対訳関係にある少なくとも第2の言
    語で記述された、2つ以上の対訳テキストを入力する入
    力手段、 各対訳テキストにつき、各言語毎に、又は各言語を任意
    に2つ以上組み合わせて、少なくとも係り受け解析及び
    意味解析を含む言語解析を行い、少なくとも依存構造及
    び意味表現に係る言語情報を獲得する解析手段、 第3言語によるテキストを生成する生成手段、 該生成手段によって生成された第3言語テキストを出力
    可能な出力手段の各手段を備える構成であって、 生成手段が、 解析手段において獲得された言語情報、又は、解析手段
    の解析結果に基づき、第3言語固有の変換知識を備えて
    言語変換を行う変換手段を備え、該変換手段における変
    換結果、 の少なくともいずれかを用いて第3言語によるテキスト
    を生成することを特徴とする第3言語テキスト生成装
    置。
  6. 【請求項6】前記解析手段が、 各対訳テキストを構成する語句・文が、いかなる対訳関
    係を有するかについて関連づけを行う対訳関係関連づけ
    部、 少なくとも前記第1の言語のテキストを解析する、解析
    モジュール部、 該関連づけの結果、第1の言語のテキストと対訳関係に
    ある少なくとも第2の言語のテキスト中の部分を予め用
    意された解析モジュールを用いて解析し、該各解析結果
    を融合する融合部を備える請求項5に記載の第3言語テ
    キスト生成装置。
  7. 【請求項7】前記第3言語テキスト生成装置が、 各言語に関する辞書情報又は文法情報の少なくともいず
    れかを含んで構成される規則的情報と、 コーパス等の実データからの学習結果による経験的情報
    とを各々記憶する情報記憶手段を備えると共に、 前記解析手段・変換手段・生成手段の少なくともいずれ
    かが、 該情報記憶手段によって記憶された各情報に基づいて解
    析処理を行う請求項5又は6に記載の第3言語テキスト
    生成装置。
  8. 【請求項8】前記第3言語テキスト生成装置が、 第3言語の構文構造情報、又は第3言語の単語用法情報
    の少なくともいずれかについての情報を、該言語の既存
    のコーパスから一部又は全部について自動獲得する第3
    言語固有情報獲得手段又は、 予め自動獲得された第3言語固有情報を保持可能な第3
    言語固有情報記憶手段の少なくともいずれかの手段を有
    し、 前記生成手段が、 該第3言語固有情報に基づき第3言語テキストを生成す
    る請求項5ないし7に記載の第3言語テキスト生成装
    置。
  9. 【請求項9】前記第3言語テキスト生成装置における入
    力手段が、 紙片、書籍等の文書を電磁的記録に変換する文書取込変
    換手段によって変換作成されたコンピュータデータ、又
    は、 ハードディスク、光学的記憶装置等の電磁的記録装置か
    ら読み出されるコンピュータデータ、又は、 インターネット等のネットワーク上の電磁的記憶装置か
    ら取得可能なコンピュータデータの少なくともいずれか
    のコンピュータデータを該装置に入力可能である請求項
    5ないし8に記載の第3言語テキスト生成装置。
  10. 【請求項10】コンピュータにおける言語処理のうち、
    複数の言語テキストを用いて新たな第3の言語テキスト
    を生成するプログラムであって、該プログラムが、 異なる言語によって記述され、翻訳元となる第1の言語
    と、該第1の言語と対訳関係にある少なくとも第2の言
    語で記述された、2つ以上の対訳テキストをコンピュー
    タ上の記憶装置又は入力装置から取得する入力部、 取得した各対訳テキストにつき、各言語毎に、又は各言
    語を任意に2つ以上組み合わせて、少なくとも係り受け
    解析及び意味解析を含む言語解析処理を行い、少なくと
    も依存構造及び意味表現に係る言語情報を、コンピュー
    タ上の演算装置及び記憶装置を用いた演算処理により獲
    得する解析処理部、 第3言語によるテキストをコンピュータ上の演算装置及
    び記憶装置を用いた演算処理により生成する生成処理部 該生成処理部によって生成された第3言語テキストをコ
    ンピュータ上の記憶装置又は出力装置により出力する出
    力部の各部を含む構成であって、 生成処理部が、 解析処理部において獲得された言語情報、又は、 解析処理部の解析結果に基づき、第3言語固有の変換知
    識を備えて言語変換を行う変換処理部を設け、該変換処
    理部における変換結果、 の少なくともいずれかを用いて第3言語によるテキスト
    を生成することを特徴とする第3言語テキスト生成プロ
    グラム。
  11. 【請求項11】前記解析処理部が、 各対訳テキストを構成する語句・文が、いかなる対訳関
    係を有するかについて関連づけを行う対訳関係関連づけ
    ルーチン、 少なくとも前記第1の言語のテキストを解析する、解析
    ルーチン、 該関連づけの結果、第1の言語のテキストと対訳関係に
    ある少なくとも第2の言語のテキスト中の部分を解析ル
    ーチンを用いて解析し、該各解析結果を融合する融合ル
    ーチンの各ルーチンを含む請求項10に記載の第3言語
    テキスト生成プログラム。
  12. 【請求項12】前記解析処理部・変換処理部・生成処理
    部の少なくともいずれかにおいて、 各言語に関する辞書情報又は文法情報の少なくともいず
    れかを含んで構成される規則的情報と、 コーパス等の実データからの学習結果による経験的情報
    とを用いる請求項10又は11に記載の第3言語テキス
    ト生成プログラム。
  13. 【請求項13】前記第3言語テキスト生成プログラム
    が、 第3言語の構文構造情報、又は第3言語の単語用法情報
    の少なくともいずれかについての情報を、該言語の既存
    のコーパスから一部又は全部について自動獲得した第3
    言語固有情報を読み出す第3言語固有情報読み出しルー
    チンを備え、 前記生成処理部が、 該第3言語固有情報に基づき第3言語テキストを生成す
    る請求項10ないし12に記載の第3言語テキスト生成
    プログラム。
JP2002232922A 2001-08-10 2002-08-09 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム Expired - Lifetime JP4304268B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002232922A JP4304268B2 (ja) 2001-08-10 2002-08-09 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001243118 2001-08-10
JP2001-243118 2001-08-10
JP2002232922A JP4304268B2 (ja) 2001-08-10 2002-08-09 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム

Publications (2)

Publication Number Publication Date
JP2003141114A true JP2003141114A (ja) 2003-05-16
JP4304268B2 JP4304268B2 (ja) 2009-07-29

Family

ID=19073262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002232922A Expired - Lifetime JP4304268B2 (ja) 2001-08-10 2002-08-09 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム

Country Status (6)

Country Link
US (1) US20040254783A1 (ja)
EP (1) EP1655674A2 (ja)
JP (1) JP4304268B2 (ja)
KR (1) KR100918338B1 (ja)
CN (1) CN1554058A (ja)
WO (1) WO2003014967A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008108209A (ja) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> 機械翻訳の精度を向上させる技術

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7689412B2 (en) * 2003-12-05 2010-03-30 Microsoft Corporation Synonymous collocation extraction using translation information
US20060083431A1 (en) * 2004-10-20 2006-04-20 Bliss Harry M Electronic device and method for visual text interpretation
US20060282255A1 (en) * 2005-06-14 2006-12-14 Microsoft Corporation Collocation translation from monolingual and available bilingual corpora
US20070016397A1 (en) * 2005-07-18 2007-01-18 Microsoft Corporation Collocation translation using monolingual corpora
US7991608B2 (en) * 2006-04-19 2011-08-02 Raytheon Company Multilingual data querying
CN105117376B (zh) * 2007-04-10 2018-07-10 谷歌有限责任公司 多模式输入法编辑器
JP2010055235A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 翻訳支援プログラム、及び該システム
CN102591857B (zh) * 2011-01-10 2015-06-24 富士通株式会社 一种平行语料资源获取方法及系统
JP5924666B2 (ja) * 2012-02-27 2016-05-25 国立研究開発法人情報通信研究機構 述語テンプレート収集装置、特定フレーズペア収集装置、及びそれらのためのコンピュータプログラム
CN104484156B (zh) * 2014-12-16 2017-04-05 用友网络科技股份有限公司 多语言公式的编辑方法、编辑系统和多语言公式编辑器
US10191899B2 (en) 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text
US10460036B2 (en) * 2017-04-23 2019-10-29 Voicebox Technologies Corporation Multi-lingual semantic parser based on transferred learning
US11385916B2 (en) * 2020-03-16 2022-07-12 Servicenow, Inc. Dynamic translation of graphical user interfaces
US11580312B2 (en) 2020-03-16 2023-02-14 Servicenow, Inc. Machine translation of chat sessions
CN113569565B (zh) * 2020-04-29 2023-04-11 抖音视界有限公司 一种语义理解方法、装置、设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9101286A (nl) * 1991-07-23 1993-02-16 Oce Nederland Bv Werkwijze voor het verbuigen van woorden, alsmede een data-verwerkings-eenheid voor het uitvoeren van een dergelijke werkwijze.
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JP2880601B2 (ja) * 1992-01-22 1999-04-12 シャープ株式会社 言語処理装置
WO1994006086A1 (en) * 1992-09-04 1994-03-17 Caterpillar Inc. Integrated authoring and translation system
US6014615A (en) * 1994-08-16 2000-01-11 International Business Machines Corporaiton System and method for processing morphological and syntactical analyses of inputted Chinese language phrases
US5737734A (en) * 1995-09-15 1998-04-07 Infonautics Corporation Query word relevance adjustment in a search of an information retrieval system
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
US6243669B1 (en) * 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008108209A (ja) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> 機械翻訳の精度を向上させる技術
US8126698B2 (en) 2006-10-27 2012-02-28 International Business Machines Corporation Technique for improving accuracy of machine translation

Also Published As

Publication number Publication date
WO2003014967A2 (fr) 2003-02-20
KR100918338B1 (ko) 2009-09-22
CN1554058A (zh) 2004-12-08
EP1655674A2 (en) 2006-05-10
JP4304268B2 (ja) 2009-07-29
US20040254783A1 (en) 2004-12-16
KR20040024619A (ko) 2004-03-20

Similar Documents

Publication Publication Date Title
Chéragui Theoretical Overview of Machine translation.
JP2005507525A (ja) 機械翻訳
JP4304268B2 (ja) 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム
Ameur et al. Arabic machine translation: A survey of the latest trends and challenges
Hutchins Example-based machine translation: a review and commentary
Lyons A review of Thai–English machine translation
Isahara Translation technology in Japan
Gupta et al. Advanced machine learning techniques in natural language processing for Indian languages
Pinnis et al. Tilde MT platform for developing client specific MT solutions
Alkım et al. Machine translation infrastructure for Turkic languages (MT-Turk)
JPH02112068A (ja) テキスト簡略表示方式
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
JP2546245B2 (ja) 自然言語文生成方法
Daimary et al. Bodo to english statistical machine translation system
Kameyama Information extraction across linguistic barriers
Alansary et al. The universal networking language in action in English-Arabic machine translation
Bhatti et al. Sindhi Text Corpus using XML and Custom Tags
Singh et al. An efficient Romanization of Gurmukhi Punjabi proper nouns for pattern matching
Khosla et al. A SURVEY REPORT ON THE EXISTING METHODS OF BUILDING A PARALLEL CORPUS.
Dhore et al. English to Devnagari translation for UI labels of commercial web based interactive applications
Dubey Need for Hindi-Dogri machine translation system
Rico Pérez et al. New trends in machine translation
Bramhe et al. MULTILINGUAL TRANSLATION FOR JAPANESE AND ENGLISH LANGUAGE
Winiwarter JETCAT-Japanese-English Translation using Corpus-based Acquisition of Transfer rules
Xia et al. Enriching, editing, and representing interlinear glossed text

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050920

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090223

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Ref document number: 4304268

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term