JP4404211B2 - マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム - Google Patents

マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム Download PDF

Info

Publication number
JP4404211B2
JP4404211B2 JP2005071068A JP2005071068A JP4404211B2 JP 4404211 B2 JP4404211 B2 JP 4404211B2 JP 2005071068 A JP2005071068 A JP 2005071068A JP 2005071068 A JP2005071068 A JP 2005071068A JP 4404211 B2 JP4404211 B2 JP 4404211B2
Authority
JP
Japan
Prior art keywords
index
translation
dictionary
trie structure
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005071068A
Other languages
English (en)
Other versions
JP2006252428A (ja
Inventor
紹明 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005071068A priority Critical patent/JP4404211B2/ja
Priority to CNB2005100938291A priority patent/CN100511215C/zh
Priority to US11/216,057 priority patent/US7707026B2/en
Publication of JP2006252428A publication Critical patent/JP2006252428A/ja
Application granted granted Critical
Publication of JP4404211B2 publication Critical patent/JP4404211B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Description

本発明は、原言語の文、文字列または文章を目的言語の文、文字列または文章に翻訳するマルチリンガル翻訳装置に関し、特にトライ検索構造を用いた翻訳メモリの技術に関する。
原言語から目的言語へ機械翻訳する手法として、単語直接翻訳技術、解析ベース翻訳技術・中間言語方式、統計ベース翻訳技術、例文ベース翻訳技術などがある。
単語直接翻訳技術は、原言語の文を構成する単語を直接に目標言語の単語に翻訳し、統計データ或いは予め決められたルールによって、目標言語の翻訳文を生成するものである。
解析ベース翻訳技術・中間言語方式は、原言語の文を形態素解析、構文解析、意味解析し、目標言語の意味、構文、形態素に変換し、目標言語の翻訳文を生成するものである。中間言語方式は、原言語の文を解析して中間言語に変換し、変換された中間言語から目標言語の訳文を生成するものである。
統計ベース翻訳技術は、言語モデルと翻訳モデルを用いて、原言語を目標言語に翻訳するものである。例文ベース翻訳技術は、人間が外国語を学ぶ過程のように、翻訳された例文等の学習により構築された知識ベースを参考にしながら入力された原言語の文を目標言語の訳文に翻訳する方法である。
このような翻訳技術において、中間言語方式による幾つかの特許文献が開示されている。例えば特許文献1は、単一の中間言語を用いて1つの原語から2つ以上の目的言語に同時翻訳可能な自動翻訳システムを提供する。この翻訳システムは、原語で書かれた文書を基に、メッセージの高度な理解を可能にする文書解析、知識の明確な表現、および「翻訳品質/時間」に関して高いレベルで、多数の目的言語への自動翻訳を可能としている。
特許文献2は、入力された原言語に関する情報に基づいて、それに対応する標準化中間言語を抽出し、抽出された標準化言語に基づいて、それに対応する目的言語に関する情報を生成する電子翻訳装置に関するものである。
特許文献3は、ユーザが簡単に作成でき、しかも効率良く検索できる、機械翻訳用の翻訳パターンを提供する。文パターンを木構造の検索辞書に格納し、入力されたテキスト文を検索辞書と照合し、成功すれば、対応している他の言語の文パターンを取り出し、当該文パターンを用いて目的言語のテキスト文を生成する。失敗した場合には、言語解析・生成方式の機械翻訳技術を用いて翻訳を行うものである。
さらに翻訳メモリに関する技術として、文字インデックス法と単語インデックス法がある。前者は、対訳句対コーパスに存在するすべでの文字に対して文字インデックスを作成することにより、翻訳メモリを実現する方法である。後者は、対訳句対コーパスに存在するすべでの単語に対して単語インデックスを作成することにより、翻訳メモリを実現する方法である。
特開平6−32508号 特開昭62−251875号 特開平5−290082号
しかしながら、従来の翻訳技術には、次のような課題がある。単語直接翻訳技術は、比較的簡単に構成できる反面、その翻訳精度を保証することができない。中間言語方式は、マルチリンガル機械翻訳に対応できるが、各言語の構文解析・意味解析技術は未熟であるため、実用化するのは非常に困難である。さらに、高等な言語解析技術や中言語の生成技術を必要とするため、多分野の翻訳に対応することができず、機能を拡張することが困難であり、翻訳ツールのメンテナンスも非常に困難であるという課題もある。
また、特許文献3に開示される技術は、木構造を用いて文パターンを格納し、文パターンを照合するときに、部分パターンを見つけると、その部分パターンをある変数で入れ替えることにより、パターンの表現範囲を広げることを可能にしている。しかし、文に出現した単語を、部分パターンとして木構造に登録されていないと、たとえ、文に対応するパターンが存在していても照合できないという問題がある。特許文献3の図7の木構造において、文「接点を改善する」に対して、「〜を改善する」というパターンが照合されるが、文「性能を改善する」に対して、もし、「性能」という部分パターンが登録されていなければ、「〜を改善する」というパターンと照合されない。さらに、仮に、「性能」という部分パターンが木構造の下の階層に登録されていても、「〜を改善する」というパターンと照合されない。従って、広範囲の表現をカバーするためには、数多くの文パターンを用意しなければならないという問題点があった。
さらに、文字インデックス法による翻訳メモリは、リアルタイムで翻訳するのが困難であり、単語インデックス法による翻訳メモリは、リアルタイムでの翻訳の困難性に加えて、マルチリンガルの翻訳システムに対応できないという課題がある。
本発明は、従来の課題を解決するために成されたもので、原言語の文を目的言語の文により正確に翻訳することができる翻訳メモリ、翻訳システム、翻訳方法および翻訳プログラムを提供することを目的とする。
さらに本発明は、原言語の文を複数の目的言語に同時に翻訳することができるマルチリンガル翻訳メモリ、翻訳システム、翻訳方法および翻訳プログラムを提供することを目的とする。
さらに本発明は、対訳辞書等の記憶容量を低減し、かつ高速に翻訳することができる翻訳メモリ、翻訳システム、翻訳方法および翻訳プログラムを提供することを目的とする。
本発明に係る原言語の文を目的言語の文に翻訳する翻訳メモリは、第1の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第1の辞書トライ構造、および第1の辞書トライ構造に記憶されたサブ文字列を特定するためのインデックス情報を記憶するインデックストライ構造を含む第1の検索辞書と、第2の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第2の辞書トライ構造、および第2の辞書トライ構造に記憶されたサブ文字列を特定するためのインデックス情報を記憶するインデックストライ構造を含む第2の検索辞書とを有し、第1の検索辞書のインデックス情報は、少なくとも第2の検索辞書における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含むものである。辞書トライとインデックストライの2重検索トライ構造を採用し、サブ文字列のトライ検索を可能にすることで、メモリ(記憶)使用容量をできるだけ削減しつつ、文の翻訳の高速化を図っている。
好ましくは、インデックス情報は、辞書トライ構造のルートから末端ノードまでのパスによりサブ文字列を特定する。例えば、インデックス情報は、辞書トライ構造の末端ノードを識別するノード識別情報である。さらに、第1の検索辞書のインデックス情報は、第2の検索辞書のインデックストライ構造の対応するノード識別情報を含む。例えば、インデックス情報は、インデックストライ構造のルートから末端ノードのパスにより複数のサブ文字列からなる文を特定する。
翻訳メモリはさらに、第3の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第3の辞書トライ構造、および第3の辞書トライ構造に記憶されたサブ文字列を特定するためのインデックス情報を記憶するインデックストライ構造を含む第3の検索辞書とを有し、第2の検索辞書のインデックス情報は、少なくとも第3の検索辞書における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含む。すなわち、翻訳メモリは、複数の言語について、それぞれの検索辞書を構築し、入力された原言語の文に対応する目的言語の訳文を選択することができる、いわゆるマルチリンガル翻訳メモリである。
好ましくは、翻訳メモリはさらに、原言語の文を入力する入力手段と、入力された文をサブ文字列に分割する分割手段と、分割されたサブ文字列を第1の検索辞書の第1の辞書トライ構造と照合し、照合されたサブ文字列のインデックス情報を検索する検索手段と、検索されたインデックス情報に基づき第2の検索辞書のインデックストライ構造から対応するインデックス情報を識別し、識別されたインデックス情報に基づき第2の辞書トライ構造からサブ文字列を特定し、第2の言語の文を抽出する抽出手段と、抽出された文を出力する出力手段とを有する。これにより、ユーザは、所望の文を入力し、それに対応する言語の訳文を得ることができる。目的言語は、ユーザにより適宜選択される。
好ましくは、分割されたサブ文字列の文字数は、第1、第2または第3の辞書トライ構造のルートから末端ノードまでのパスで規定される文字列の文字数に等しい。例えば、辞書トライ構造が文字列を5文字に分割している場合には、分割手段は、入力された文を5文字に分割し、5文字の文字列を辞書トライ構造において検索する。
好ましくは、翻訳メモリは、Nカ国の言語(Nは、2以上の整数)に対応する第1ないし第Nの検索辞書を含み、それぞれの検索辞書は、インデックス情報により対訳関係が特定されている。上記したように本発明の翻訳メモリは、複数の言語間において文の対訳を得ることが可能なマルチリンガル翻訳メモリを構成することができる。
さらに本発明に係る、原言語の文を目的言語の文に翻訳する翻訳メモリは、第1の言語についてルートから複数の末端ノードまでの各パス上にサブ文字列を記憶し、かつ第2の言語についてルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する辞書トライ構造と、第1の言語のサブ文字列を特定するための第1のインデックス情報、および第2の言語のサブ文字列を特定するための第2のインデックス情報を記憶するインデックストライ構造とを含む検索辞書を有し、第1のインデックス情報は、少なくとも第2の言語のサブ文字列を特定するための第2のインデックス情報を識別する識別情報を含むものである。1つの辞書トライ構造に複数の言語の文字列を記憶させ、かつ1つのインデックストライ構造に複数の言語のインデックス情報を記憶させることで、よりメモリ容量を削減し、翻訳処理の高速化を図ることができる。
本発明に係る機械翻訳システムは、上記した特徴を有する翻訳メモリと、翻訳メモリによって翻訳できなかった文を入力し、当該文の翻訳を行う翻訳エンジンと、翻訳メモリによって翻訳された文と翻訳エンジンによって翻訳された文とを識別して出力する出力手段とを有する。好ましくは、翻訳エンジンは、パターンベース翻訳エンジン、チャンベース翻訳エンジン、解析ベースまたは単語直訳翻訳エンジンの少なくとも1つを含む。
本発明に係る、原言語の文を目的言語の文に翻訳する翻訳方法は、第1の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を第1の辞書トライ構造に記憶し、第1の辞書トライ構造に記憶されたサブ文字列を特定するためのインデックス情報をインデックストライ構造に記憶する第1の検索辞書を構築し、かつ、第2の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を第2の辞書トライ構造に記憶し、第2の辞書トライ構造に記憶されたサブ文字列を特定するためのインデックス情報をインデックストライ構造に記憶する第2の検索辞書を構築するステップを有する。好ましくは、第1の検索辞書のインデックス情報は、少なくとも第2の検索辞書における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含む。
さらに本発明に係る原言語の文を目的言語の文に翻訳する翻訳プログラムは、第1の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を第1の辞書トライ構造に記憶し、第1の辞書トライ構造に記憶されたサブ文字列を特定するためのインデックス情報をインデックストライ構造に記憶する第1の検索辞書を構築し、かつ、第2の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を第2の辞書トライ構造に記憶し、第2の辞書トライ構造に記憶されたサブ文字列を特定するためのインデックス情報をインデックストライ構造に記憶する第2の検索辞書を構築するステップを有する。
本発明に係る翻訳メモリによれば、辞書トライ構造とインデックストライ構造の2重トライ構造を採用することで、サブ文字列による共用部分が増え、辞書トライ構造のメモリ使用量を削減しつつ、より高速な文の翻訳を行うことができる。さらに、2重トライ構造の検索辞書を複数の言語毎に構築することで、マルチリンガルな文の翻訳を行う翻訳メモリを提供することができる。
以下、本発明の最良の実施形態について図面を参照して説明する。図1は、本発明の実施例に係る機械翻訳システムの全体構成を示す図である。機械翻訳システム1は、文書のすべての部分を正しく翻訳することはできず、翻訳できない部分に無理に翻訳すると、ユーザを混迷させ、原文の内容の把握に悪い影響を与えてしまう。そこで、翻訳結果において、正解または失敗の区別、あるいは信頼性の高低を与えるようにしている。また、翻訳システムに学習機能を設け、翻訳できない部分を自動的に回収し、正確な対訳を付与することで、翻訳の性能を向上させている。
機械翻訳システム1は、原言語テキスト文入力部10から入力された文単位の文を翻訳する翻訳メモリエンジン12、翻訳メモリエンジン12のデータベースにおいて照合できなかった部分、つまり正確に翻訳をできなかった部分を入力しこれの形態素解析を行う形態素解析部14と、形態素解析部14で解析された入力文の解析結果を入力しパターンベースで翻訳をするパターンベース翻訳エンジン16と、パターンベース翻訳エンジン16で翻訳できなかった場合は、前記入力文の形態素解析部分の結果をチャンクベース例文(単語の組合せまたは名詞句のようなフレーズ)で翻訳するチャンクベース翻訳エンジン18と、チャンクベース翻訳エンジン18で翻訳できなかった場合は、前記入力文の形態素解析の結果を入力し、解析ベースまたは単語ベースで翻訳する解析ベースまたは単語直訳翻訳エンジン20と、目的言語テキスト文を作成する目的言語テキスト作成部22とを有している。
翻訳メモリエンジン12、パターンベース翻訳エンジン16、チャンクベース例文翻訳エンジン18により翻訳が成功した部分の翻訳データは、目的言語テキスト作成部22に入力される。目的言語テキスト作成部22は、これらの翻訳データに基づき目的言語のテキストを作成する。このとき、翻訳成功した部分については、正確に翻訳されたことがわかるような識別を与える。一方、解析ベースまたは単語直訳翻訳エンジン20によって翻訳された翻訳データは、目的言語テキスト文作成部22において、参考程度の翻訳として出力される。これにより、ユーザは、テキスト訳文において、どこが信頼できる翻訳結果であり、どこが信頼できない翻訳結果かを一見して把握することができる。
一方、チャンクベース例文翻訳エンジン18で翻訳失敗した部分は、回収部24によって回収される。回収された翻訳失敗部分は、翻訳者によって正確な翻訳がなされ、その結果が、学習エンジン26に出力される。学習エンジン26は、正確な翻訳に基づき、対訳データを対訳辞書28へ書き込む。
図2は、本実施例の好ましい翻訳メモリエンジンの構成を示す図である。翻訳メモリエンジン12は、Nカ国(1、2、・・・Nの)複数の言語についての検索辞書12−1、12−2、・・・12−Nを含んでいる。検索辞書12−1の出力が検索辞書12−2に入力され、検索辞書12−Nの出力が検索辞書12−1に入力されるように、検索辞書12−1から検索辞書12−Nまでが循環するように連結されている。勿論、検索辞書12−1から検索辞書12−NまでのN個の検索辞書を双方向で循環するように連結しても構わない。翻訳メモリエンジン12は、原言語テキスト文入力部12からテキスト文が入力されると、そのテキスト文を検索辞書12−1において言語1に翻訳することができ、さらに、言語1の翻訳結果を用いて検索辞書12−2において言語2に翻訳することができる。すなわち、入力されたテキスト文をNカ国の言語に同時に翻訳することができる。目的言語テキスト文22は、ユーザによって指定された目的言語への翻訳を出力する。目的言語は、単一の言語のみならず、複数の言語であってもよい。
図3は、翻訳メモリエンジンのハードウエア構成を示す図である。翻訳メモリエンジンは、入力装置30、表示装置32、主記憶装置34、外部記憶装置36、中央処理装置(CPU)38、これらを接続するバス40を含んでいる。入力装置30、キー操作により単語を入力するキーボード、原稿に記載された単語を光学的に読み取る光学式読取装置、あるいは、他のハードウエアまたはソフトウエアの演算結果であってもよい。
表示装置32は、原言語のテキスト文を表示したり、原言語を翻訳した目的言語の文を出力するディスプレイ等を含む。主記憶装置34は、ROMまたはRAMを含み、翻訳メモリを制御するためのプログラムや演算結果等のデータを記憶する。外部記憶装置36は、例えばハードディスク等の大容量記憶装置を含み、ここには、文の翻訳に必要な検索辞書12−1、12−2・・・12−N等の対訳辞書が記憶されている。CPU(Central Processing Unit)38は、主記憶装置34に記憶されたプログラムに従い各部を制御する。
次に、本実施例に係る翻訳メモリエンジンの詳細について説明する。図4は、翻訳メモリの検索辞書の構成を示す図である。各検索辞書12−1〜12−Nは、辞書トライ構造100−1〜100−Nとインデックストライ構造200−1〜200−Nとを有している。辞書トライ構造100−1は、言語1についてのサブ文字列をトライ構造に記憶したものであり、インデックストライ構造200−1は、辞書トライ構造100−1のサブ文字列を特定するためのインデックス情報をトライ構造に記憶したものである。こうした辞書トライ構造とインデックストライ構造の2重トライ構造が、各言語ごとに構築されている。
トライ構造(TRIE structure)とは、言語情報処理分野において、検索キー集合の共通部分の文字列を併合して得られる木構造のことである。例えば、「あい」、「あいさい」、「あいさつ」、「あいのこ」、「あいのり」の5つの検索キーから生成したトライ構造は図5に示すようになる。図中の$は、単語の末尾を表わす特殊文字として用いることができる。トライ構造を用いて検索するには、検索文字列を左から順に走査しながら、木の根(ノードN1)から各ノードN2〜N13に付与された文字を手がかりに木をたどり、検索文字列に照合する単語を抽出する。トライ構造を用いると、検索キーの数によらず検索文字列に比例した時間で、高速な検索を行うことができる。
図6は、辞書トライ構造の詳細を説明する図である。辞書トライ構造は、ルート110から末端ノード120−1〜120−Nのパス上に、複数のサブ文字列を格納している。例えば、末端ノード120−1からルートまでのパスをたどることで、そのパス上のノードに含まれる文字M10、M11、・・・M1nからなるサブ文字列が特定され、同様に、末端ノード120−2からルートまでのパスをたどることで、そのパス上のノードに含まれる文字M20、M21、・・・M2nからなるサブ文字列が特定される。ルートから末端ノードまでのパス上に存在するノード数、すなわち、サブ文字列の文字数は、適宜選択することができる。
図7は、インデックストライ構造の詳細を説明する図である。インデックストライ構造は、辞書トライ構造に含まれる文字列を検索し、特定することを可能にする。インデックストライ構造の各ノードには、文字列を特定するためのインデックス情報が記憶される。インデックス情報は、辞書トライ構造の末端ノードを識別する情報を含んでいる。例えば、ノード222−2には、インデックス情報IN2が記憶され、インデックス情報IN2は、辞書トライ構造の末端ノード120−2を識別する情報を含み、末端ノード220−2には、インデックス情報IN1が記憶され、インデックス情報IN1は、辞書トライ構造の末端ノード120−1を識別する情報を含む。つまり、インデックス情報IN2は、サブ文字列M20、M21、・・・M2nを特定することができ、インデックス情報N1は、サブ文字列M10、M11、・・・N1nを特定することができる。従って、インデックストライ構造の末端ノードは、その末端ノードからルートまでのパス上に存在するインデックス情報により辞書トライ構造のサブ文字列を組み合わせた文を特定することができる。
また、インデックストライ構造の末端ノード220−1、220−2、・・・220−Nは、他のインデックストライ構造の末端ノード230−1、230−2、230−Nとリンク付けされる。このリンク付けは、原言語の文と、目的言語の訳文との関係を規定するものである。例えば、末端ノード220−2は、他の言語のインデックストライ構造の末端ノード230−1とリンク付けされるように、末端ノード230−1を識別する情報を含んでいる。この末端ノード230−1とルート212のパス上に存在するノードに含まれるインデックス情報IN1、IN2、IN3により特定されるサブ文字列からなる文は、末端ノード220−2からルート210のパス上に存在するノードに含まれるインデックス情報IN1、IN2、IN3、IN4により特定されるサブ文字列からなる文の翻訳である。
次に、辞書トライ構造の作成フローについて説明する。辞書トライ構造を新規に登録し、または追加する場合には、図8に示すように、翻訳メモリ用の対訳データファイルからデータを入力する(ステップS101)。入力されたデータは、CPU38によってデータフォーマット変換によりユニコードに変換される(ステップS102)。これにより、対訳の関係にある、文字列Jと文字列Cが生成される。
次に、CPU38は、図9に示すように、文字列Jを長さmjで左から右の順で、kj個のサブ文字列J1、J2、・・・Jkjに分割する(ステップS103)。同様に、文字列Cを長さmcで左から右の順でkc個のサブ文字列C1、C2・・・Ckcに分割する。
次に、CPU38は、サブ文字列J1、J2、・・・Jkj、あるいはサブ文字列C1、C2、・・・Ckcが、対応する言語の検索辞書に存在するか否かをチェックする(ステップS104)。存在していない場合には、CPU38は、サブ文字列J1、J2、・・・Jkjおよびサブ文字列C1、C2、・・・Ckcを対応する検索辞書に登録し、ログファイルに情報を記憶し、終了する(ステップS105)。
一方、既に検索辞書内に、サブ文字列J1、J2、・・・Jkj、あるいはサブ文字列C1、C2、・・・Ckcが存在している場合には、ログファイルに情報を記録し、終了する(ステップS106)。
ユーザはまた、外部記憶装置36に格納された検索辞書の内容を編集することも可能である。表示装置32に既存の検索辞書に登録された文字列を表示させ、これを入力装置30から訂正等をする。
図10は、対訳データを検索辞書に登録する例を示す図である。ここでは、言語Jの辞書トライ構造を100−Jとし、言語Cの辞書トライ構造を100−Cとする。上記したように、対訳データから一方の言語jの文の文字列が入力されると、これが文字列J1、J2、・・・Jkjに分割され、辞書トライ構造100−Jに挿入される。一方、言語jの文Jの訳文文字列Cが文字列C1、C2、・・・Ckcに分割され、辞書トライ構造100−Cに挿入される。
辞書トライ構造100−Jにおいて、文字列J1、J2、・・・Jkjを特定するためのルートから末端ノードまでのパスが記録され、言語Jのインデックストライ構造200−Jが構築される。同様に、辞書トライ構造100−Cにおいて、文字列C1、C2、・・・Ckjを特定するためのルートから末端ノードまでのパスが記録され、言語Cのインデックストライ構造200−Cが構築される。
次に、言語Jのインデックストライ構造の末端ノードと言語Cのインデックストライ構造の末端ノード間に対応関係をつける。このようにして、対訳データに基づき複数の言語間の検索辞書を構築する。
なお、サブ文字列の分割方法は、例えばサブ文字列の文字数を予め設定しておくことができる。この場合、入力された文を、予め設定された文字数で除した値が、サブ文字列の数となる。あるいは、サブ文字列の数を予め設定しておいても良い。この場合、入力された文(文字列)をサブ文字列数で除した値が、サブ文字列の文字数となる。言語Jと言語Cにおいて、サブ文字列の文字数は等しくてもよいし、異なるものであっても良い。
次に、トライ構造の各ノードの構造定義を説明する。ノードの構造定義には、物理構造の定義と論理構造の定義の2種類がある。図11(a)は、辞書トライ構造のノードの物理構造の定義を示している。辞書トライノードID300は、当該ノードを識別するための情報(ID)である。文字情報302は、ノードに含まれる文字が漢字、ひらがな、カタカナ、アルファベットかを示すものである。文字列フラグ304は、図12(a)に示すように、当該ノードが文字列の終わりか否かを示すフラグであり、フラグ=0であれば終わりであり、フラグ=1であれば、終わりでない。例えば、辞書トライの末端ノードであれば、フラグ=0であり、それ以外はフラグ=1となる。
言語訳語ID306は、図12(b)に示すように、言語の種類を識別するものである。例えば、日本語=1、中国語=2、英語=3のように対応をつける。さらに、一番左の子供フラグのメモリのポインタ308、親ノードのメモリのポインタ310および右兄弟ノードのメモリのポインタ312が記憶され、これらのノードポイントは、トライ構造に必要な情報である。
図11(b)には、インデックストライ構造が示されている。インデックストライノードID320は、当該ノードを識別するための情報である。辞書トライノードポインタ321は、当該ノードに対応する辞書トライのノードを識別するための情報である。すなわち、辞書トライ構造の末端ノードを識別するための情報である。文フラグ322は、当該ノードが末端ノードか否かを識別するための情報である。次に、訳語言語ID324、一番左の子供のメモリのポインタ326、親ノードのメモリのポインタ328、および右兄弟ノードのメモリのポインタ330が記憶される。最後の訳語インデックストライノードIDのポインタ332は、訳語のインデックストライ構造の末端ノードを識別する情報である。
図13(a)は、辞書トライ構造のノードの論理構造を示している。文字情報340は、上記したようにノードに含まれる文字種を示すものである。文字列フラグ+子供フラグ+訳語言語ID342は、上記したように、文字列フラグが「1」のとき中間ノードを意味し、文字列フラグが「0」のとき、文字列ノードを意味し(ルートから該ノードまでのパス上の情報が文字列を表す)。子供フラグが「0」のとき、当該ノードよりも下の階層にノードを含まないことを意味し、子供フラグ「1」のとき、当該ノードよりも下の階層にノードがあることを意味する。訳語言語IDは、上記下通りであり、さら親ノードID344おおび右兄弟ノード346を含んでいる。
図13(b)は、インデックストライ構造のノードの論理構造を示している。辞書トライノードID350は、当該ノードが対応する辞書トライ構造の末端ノードIDである。文フラグは、当該ノードが文の終わりか否かを示す情報であり、インデックストライ構造の末端ノードは、文の終了であるので、例えばフラグ「1」となり、それ以外のノードがフラグ「0」となる。また、インデックストライ親ノードID352は、当該ノードの親ノードを識別する情報である。さらに、子供フラグ+インデックストライ右兄弟ノードID354と訳語インデックストライノードID354が記憶される。
次にノードIDの付与方法について説明する。図14は、ノードIDの付与方法を示す図である。トライ構造では、深さ優先探索し、探索の順番によって番号を1あるいは0から順に増加させ、ノードIDを付与する。ノードIDを付与したならば、図15に示すように、ノードIDに対応するレコードをノードIDの順番に従い配列し、格納する。ノードIDの順番でレコードを配列させることで、ノードIDが指すノード情報に瞬時にアクセスすることができる。
次に、検索辞書の処理のフローを図16に示す。新規に文を登録する場合、入力装置30(図3参照)から入力された文がサブ文字列に分割され、それらが図11(a)に示す物理構造ノードの定義に従い辞書トライの単語情報レコードを構成する(ステップS201)。
次に、物理構造のトライのすべてのノードを深さ優先走査順でIDを付与する(ステップS202)。次に、物理構造のトライとノードIDを用いて論理構造のトライと単語情報レコードを構成する(ステップS203)。これにより、辞書トライとインデックストライが作成される(ステップS204)。
文の追加、編集を行う場合には、既存の辞書トライ構造および既存のインデックストライ構造を、一旦、メモリ上の物理構造に変換する(ステップS205)。次いで、メモリ上の物理構造トライにおいて、文またはサブ文字列の編集、追加を行う(ステップS206)。ここで、トライに要求されることは、トライのルートをヌル(Null)にすること、および各頂点の子供が左から右へ文字情報の値を小さい順で並べることである。また、辞書トライ構造の各ノードは、2バイトにより1文字を表す。
次に、マルチリンガルの検索辞書の構築について説明する。
1)言語1、言語2、・・・言語Nのテキスト文集合をそれぞれ用いて、言語1、 言語2、・・・言語Nをそれぞれ複数のサブ文字列に分割し、分割されたサブ文字列を、それぞれ対応している言語の対訳辞書トライとインデックストライに構築する。
2)それぞれのN個の対訳辞書トライとインデックストライに対して、ノードIDを付与する。
3)トライの保存方法:トライのノード情報が定数長であるので、一つのノード情報を一つのレコードとする。ノードIDの順番でトライのノード情報を配列構造で書き換える。そうすることにより、ノードIDにより、ノードIDが指すノードの情報を瞬間に取り出すことができる。
4)すべての対訳文に対して、言語1のテキスト文−言語2のテキスト文・・・言語Nのテキスト文となるマルチリンガル対訳文対を用いて、言語i(i=1、2、・・・N)のテキスト文を、言語iの対訳辞書トライと照合し、照合したときに得られたk個のノードID(ID1(i)、ID2(i)、・・・IDk(i))を用いて、言語iのインデックストライと照合する。
5)照合が整合したときのインデックストライのノードIDを取り出す。このノードIDをI(i)とする。ノードI(i)の訳語インデックストライノードID(訳語は言語i+1を指している)をT(i)で表すと、T(1)=I(2)、T(2)=I(3)、・・・T(N)=I(1)となる。
言語iのテキスト文から言語jのテキスト文に翻訳する動作を図17のフローを参照して説明する。テキスト文を入力すると(ステップS301)、テキスト文がサブ文字列に分割される(ステップS302)。分割されたサブ文字列を、それぞれ言語iの対訳辞書トライと照合する(ステップS303)。
照合が成功した場合(ステップS304)、照合したときに得られたk個のノードID(ID1(i)、ID2(i)、・・・IDk(i)を用いて、言語iのインデックストライと照合する(ステップS305)。照合が成功した場合は(ステップS306)、言語iのインデックストライのノードI(i)に対応する訳語インデックストライノードIDのT(i)の値によって、言語i+1のインデックストライのノードI(i+1)のT(i+1)の値を取り出す(ステップS307)。
j=i+1であれば(ステップS308)、ノードI(i+1)からルートまでのパス上の情報を取り出し、h個の言語jの対訳辞書トライのノードIDを得る(ステップS309)。そして、これらのIDを、ID1(j)、ID2(j)・・・IDh(j)を用いて、言語jの対訳辞書トライから訳文を求め、これを出力する(ステップS310)。もし、j=i+1でなければ、ステップS307を行う。こうして、言語iのテキスト文から言語jのテキスト文への翻訳が行われる。
次に、日本語と中国語間の機械翻訳の例を説明する。先ず、対訳辞書の構築動作を説明する。日本語と中国語のテキスト文集合をそれぞれを用いて、日本語と中国語をそれぞれ複数のサブ文字列に分割し、分割されたサブ文字列をそれぞれ対応している言語の対訳辞書トライとインデックストライを構築する。たとえば、図18(a)に示す日本語のテキスト文「この決勝戦のスコアは終了したばかりの3位決定戦さえにも及ばない。」が、中国語に翻訳される例を用いる。日本語のテキスト文は、図18(b)に示すように、サブ文字列J1〜J7に分割され、中国語のテキスト文は、図18(c)に示すように、サブ文字列C1〜C6に分割され、辞書トライに格納される。ここでは、サブ文字列の文字数を5にしている。
図19は、日本語と中国語のそれぞれの辞書トライ構造およびインデックストライ構造を示す図である。日本語と中国語の対訳辞書トライとインデックストライに対してノードIDを付与する。
すべでの対訳文に対して、日本語のテキスト文−中国語テキスト文となる対訳文対を用いて、日本語のテキスト文を日本語の対訳辞書トライと照合し、照合したときに得られた7個のノードID(ID1(1)、ID2(1)、・・・ID7(1))を用いて、日本語のインデックストライと照合する。照合が整合したときの日本語インデックストライのノードID1(1)を取り出す。
中国語のテキスト文を中国語の対訳辞書トライと照合し、照合したときに得られた6個のノードID(ID1(2)、ID2(2)、・・・ID6(2))を用いて、中国語のインデックストライと照合する。照合が整合したときの中国語インデックストライのノードIDI(2)を取り出す。ノードI(1)の訳語インデックストライノードID(訳語は中国語を指している)をT(1)で表すと、T(1)=I(2)となる。ノードI(2)の訳語インデックストライノードID(訳語は日本語を指している)をT(2)で表すと、T(2)=I(1)となる。
次に、翻訳動作を説明する。日本語のテキスト文をサブ文字列Jに分割する。分割されたサブ文字列J1、J2、・・・J7を日本語の対訳辞書トライと照合し、これにより、ID1(1)、ID2(1)、・・・ID7(1)が得られる。
次に、ID1(1)、ID2(1)、・・・ID7(1)をサブ文字列として、日本語インデックストライと照合し、この照合により、ノードI(1)が得られる。ノードID(1)の訳語インデックストライノードIDの値によって、中国語インデックストライのノードI(2)が得られる。
中国語インデックストライI(2)からルートまで逆にインデックストライを辿っていけば、中国語対訳辞書トライのノードID(ID1(2)、ID2(2)、・・・ID6(2))が得られる。ID1(2)、ID2(2)、・・・ID6(2)を用いて、中国語の対訳辞書トライから中国語訳文が抽出される。
このように本実施例に係る翻訳メモリによれば、複数言語間の翻訳において、正確に、高速に、かつ、対訳辞書の大きさを従来のトライ構造の1/2〜1/3としたマルチリンがル機械翻訳を実現することができる。特に、慣用句、ことわざ、技術分野の固定文書、マニュアル、技術説明文書などの機械翻訳に最適である。さらに、翻訳メモリに学習機能を持たせ、ある文とその文の対訳文を学習させれば、以降においてより正確な翻訳文を得ることができる。勿論、本発明の翻訳メモリは、マルチリンガルの単語対訳辞書の構築、マルチリンガルのパターンベースの例文ベース機械翻訳装置、単語対訳辞書の構築翻訳にも適用することができる。
次に、本発明の第2の実施例について説明する。第2の実施例は、辞書トライおよびインデックストライが複数の言語(好ましくは2カ国の言語)に対応している。
図20に示すように、第1言語の文の文字列Jを、サブ文字列J1、J2・・・Jk1に分割し、対訳辞書トライ400に挿入する。また、第2言語の文Jの訳文の文字列Cを、サブ文字列C1、C2・・・Ck2に分割し、対訳辞書トライ400に挿入する。
対訳辞書トライ400のルートからIDiのノードまでのパスがJiの情報を記録とすると、ID1、ID2・・・IDk1を用いてインデックストライ410を構築する。対訳辞書トライ400のルートからIDjのノードまでのパスがCjの情報を記録とすると、ID1、ID2・・・IDk2を用いてインデックストライを構築する。最後に、インデックストライに、2カ国言語情報間の対応関係を付ける。これにより、辞書トライおよびインデックストライを2カ国の言語に対応させることができる。
次に本発明の第3の実施例について説明する。第3の実施例は、辞書トライ構造とインデックストライ構造を1つにまとめたものである。図21は、第3の実施例の翻訳メモリに用いられる検索辞書を示す図である。ここでは、説明を間単にするために、言語iと言語jの検索辞書を示している。
言語iの文の文字列Siを言語iの言語トライ400−iに挿入し、言語jの文の文字列Sjを言語jの言語トライ400−jに挿入する。言語iのトライ400−iのルートからIDiの末端ノードまでのパス上に文字列Siの情報を記録する。同様に、言語jの言語トライ400−jのルートからIDjの末端ノードまでのパス上に文字列Sjの情報を記録する。
図21(b)は、言語iの言語トライのノードの構造を示している。ノード構造は、当該ノードを識別するノードID402、文字情報404、文フラグ・子供フラグ・訳語言語ID406、言語jの検索辞書への対応する訳文のノードID408、親ノード410、および右兄弟ノードID412を含んでいる。
翻訳をするとき、文字列Siが入力されると、言語iの言語トライ400−iのルートからIDiのノードを探し出し、IDiのノードに格納してる対訳文の情報IDjを取り出す。 言語jの言語トライのノードIDjからルートまで逆に走査すれば、訳文Sjを取り出すことができる。
また、第3の実施例の検索辞書が2カ国言語に限定される場合には、図22のように構成することも可能である。言語1の文Jと言語2の文Cをそれぞれ辞書言語トライ500に挿入して、検索辞書を構築する。言語トライ500のルートからIDjのノードまでのパスが文Jの情報を記録している。また、トライのルートからIDcのノードまでのパスが文Cの情報を記録している。図22(b)にノードの構造を示す。この場合、言語1または言語2への対応する訳文のノードID502が与えられている。
翻訳するとき、言語トライ500のルートから文Jを探し、IDjノードを取り出し、IDjノードに格納している対訳文の情報IDcを取り出す。言語トライ500のノードIDcからトライのルートまで逆に走査すれば、訳文Cを取り出すことができる。
本実施例による翻訳メモリを用いることで、次のような効果を得ることができる。第1の実施例に係る翻訳メモリと文字インデックス法の空間量は、ほぼ同じであるが、第1の実施例の翻訳メモリは、文字インデックス法と比較して翻訳速度が約24,000倍速いことがわかった。さらに、単語インでクス法と比較すると、記憶容量は大幅に小さくすることができ、翻訳速度は、単語インデックス法より約500倍速いことがわかった。さらに、第1の実施例は、第3の実施例よりも記憶容量は約56%減少し、速度は、第3の実施例よりも約4倍早いことがわかった。
以上、本発明の好ましい実施の形態について詳述したが、本発明に係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
本発明に係る翻訳メモリは、マルチリンガル機械翻訳システム、例えば、パターンベース例文ベースマルチリンガル機械翻訳、チャンク例文ベースマルチリンガル機械翻訳などに適用することができる。さらに、紙原稿をコピー感覚でリアルタイムに翻訳して結果を出力し、電子化するスキャン翻訳や、自動信憑性判定機能および自動回収機能を有するスキャン翻訳装置を用いて、マルチリンガルの翻訳サービスに適用することができる。さらに、翻訳メモリは、その機能を実行するソフトウエアをコンピュータに搭載させたり、あるいは携帯用もしくはポータブル用の電子辞書として利用することもできる。
本発明の実施例に係る機械翻訳システムの構成を示す図である。 翻訳メモリエンジンの構成を示す図である。 本発明の実施例に係る翻訳メモリエンジンのハードウエア構成を示す図である。 検索辞書の構成を示す図である。 トライ構造を説明する図である。 辞書トライ構造を説明する図である。 インデックストライ構造を説明する図である。 辞書トライ構造の作成するフローを示す図である。 文字列を分割する例を示す図。 検索辞書への文字列の登録を示す図である。 図11(a)は辞書トライ構造のノードの物理構造を示し、図11(b)はインデックストライ構造の物理構造を示す。 フラグと言語IDを説明する図である。 図13(a)は辞書トライ構造のノードの論理構造を示し、図13(b)はインデックストライ構造のノードの論理構造を示す。 ノードレコードIDの付与を説明する図である。 ノードレコードの配列を示す図である。 辞書構成の処理フローを示す図である。 言語iのテキスト文から言語jのテキスト文への翻訳動作を説明するフローである。 日本語と中国語間の翻訳例を説明する図である。 日本語と中国語の辞書トライ構造およびインデックストライ構造を示す図である。 本発明の第2の実施例に係る翻訳メモリの検索辞書の構成を示す図である。 本発明の第3の実施例に係る翻訳メモリの検索辞書の構成を示す図である。 第3の実施例の検索辞書の変形例である。
符号の説明
1:機械翻訳システム
10:原言語テキスト分入力部
12:翻訳メモリエンジン
12−1、12−2、12−N:検索辞書
22:目的言語テキスト文作成部
100−1、100−2、100−N:辞書トライ構造
120−1、120−2、120−N:末端ノード
200−1、200−2、200−N:インデックストライ構造
220−1、220−2、220−N:末端ノード

Claims (13)

  1. 原言語の文を目的言語の文に翻訳する翻訳装置であって、
    原言語の文の入力を受け付ける入力手段と、
    第1の言語についての第1の検索辞書および第2の言語についての第2の検索辞書とを記憶する記憶装置であって、前記第1の検索辞書は、第1の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第1の辞書トライ構造、およびルートから複数の末端ノードまでの各パス上に第1の辞書トライ構造に記憶されたサブ文字列のパスを特定するための末端ノードを識別するインデックス情報を記憶する第1のインデックストライ構造を含み、前記第2の検索辞書は、第2の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第2の辞書トライ構造、およびルートから複数の末端ノードまでの各パス上に第2の辞書トライ構造に記憶されたサブ文字列のパスを特定するための末端ノードを識別するインデックス情報を記憶する第2のインデックストライ構造を含み、第1および第2のインデックストライ構造のインデックス情報は、ルートから末端ノードのパスにより複数のサブ文字列からなる文を特定し、第1のインデックストライ構造のインデックス情報は、少なくとも第2のインデックストライ構造における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含む、前記記憶装置と、
    入力された原言語の文を前記記憶装置の第1の検索辞書の第1の辞書トライ構造と照合し、原言語の文のサブ文字列のパスを特定するための末端ノードを検索し、かつ検索された末端ノードを第1のインデックストライ構造と照合し、前記検索された末端ノードに該当するパスのインデックス情報を検索する検索手段と、
    検索されたインデックス情報の末端ノードに基づき前記記憶装置の第2の検索辞書の第2のインデックストライ構造から対応する末端ノードのインデックス情報を識別して第2のインデックストライ構造の末端ノードからルートまでのパスを特定し、第2のインデックストライ構造で特定されたパスのインデックス情報の末端ノードに基づき第2の辞書トライ構造からサブ文字列を特定し、第2のインデックストライ構造で特定されたパスの末端ノードからルートまでの順序に従い特定されたサブ文字列からなる第2の言語の文を抽出する抽出手段と、
    抽出された文を目的言語の翻訳として出力する出力手段とを有する、
    翻訳装置。
  2. インデックス情報は、辞書トライ構造の末端ノードを識別するノード識別情報を含む、請求項1に記載の翻訳装置。
  3. 第1の検索辞書のインデックス情報は、第2の検索辞書のインデックストライ構造の対応するノード識別情報を含む、請求項1または2に記載の翻訳装置。
  4. 前記記憶装置はさらに、第3の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第3の辞書トライ構造、およびルートから複数の末端ノードまでの各パス上に第3の辞書トライ構造に記憶されたサブ文字列のパスを特定するための末端ノードを識別するインデックス情報を記憶する第3のインデックストライ構造を含む第3の検索辞書とを有し、第3のインデックストライ構造のインデックス情報は、ルートから末端ノードのパスにより複数のサブ文字列からなる文を特定し、第2の検索辞書のインデックス情報は、少なくとも第3の検索辞書における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含み、
    前記検索手段は、第2の言語の文を前記記憶装置の第2の検索辞書の第2の辞書トライ構造と照合し、第2の言語の文のサブ文字列のパスを特定するための末端ノードを検索し、かつ検索された末端ノードを第2のインデックストライ構造と照合し、前記検索された末端ノードに該当するパスのインデックス情報を検索し、
    前記抽出手段は、検索されたインデックス情報の末端ノードに基づき前記記憶装置の第3の検索辞書の第3のインデックストライ構造から対応する末端ノードのインデックス情報を識別して第3のインデックストライ構造の末端ノードからルートまでのパスを特定し、第3のインデックストライ構造で特定されたパスのインデックス情報の末端ノードに基づき第3の辞書トライ構造からサブ文字列を特定し、第3のインデックストライ構造で特定されたパスの末端ノードからルートまでの順序に従い特定されたサブ文字列からなる第3の言語の文を抽出し、
    前記出力手段は、抽出された文を目的言語の翻訳として出力する、請求項1に記載の翻訳装置。
  5. 翻訳装置はさらに、入力された文をサブ文字列に分割する分割手段を含み、前記検索手段は、分割されたサブ文字列を第1の検索辞書の第1の辞書トライ構造と照合し、照合されたサブ文字列のインデックス情報を検索する、請求項1ないし4いずれか1つに記載の翻訳装置。
  6. 分割されたサブ文字列の文字数は、第1、第2または第3の辞書トライ構造のルートから末端ノードまでのパスで規定される文字列の文字数に等しい、請求項1ないしいずれか1つに記載の翻訳装置。
  7. 前記記憶装置はさらに、Nカ国の言語(Nは、2以上の整数)に対応する第1ないし第Nの検索辞書を含み、それぞれの検索辞書は、インデックス情報により対訳関係が特定されている、請求項1ないしいずれか1つに記載の翻訳装置。
  8. 原言語の文を目的言語の文に翻訳する翻訳装置であって、
    原言語の文の入力を受け付ける入力手段と、
    第1の言語についてルートから複数の末端ノードまでの各パス上にサブ文字列を記憶し、かつ第2の言語についてルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する辞書トライ構造と、ルートから複数の末端ノードまでの各パス上に第1の言語のサブ文字列のパスを特定するための末端ノードを識別する第1のインデックス情報、およびルートから複数の末端ノードまでの各パス上に第2の言語のサブ文字列のパスを特定するための末端ノードを識別する第2のインデックス情報を記憶するインデックストライ構造とを含む検索辞書を記憶し、第1および第2のインデックス情報はそれぞれルートから末端ノードのパスにより複数のサブ文字列からなる第1の言語および第2の言語の文を特定し、かつ第1のインデックス情報は、少なくとも第2の言語のサブ文字列を特定するための第2のインデックス情報を識別する識別情報を含んでいる、記憶装置と、
    入力された原言語の文を前記記憶装置の第1の言語についての検索辞書の辞書トライ構造と照合し、原言語の文のサブ文字列のパスを特定するための末端ノードを検索し、かつ検索された末端ノードをインデックストライ構造と照合し、前記検索された末端ノードに該当するパスの第1のインデックス情報を検索する検索手段と、
    検索された第1のインデックス情報の末端ノードに基づき前記記憶装置の第2の言語についての検索辞書のインデックストライ構造から対応する末端ノードの第2のインデックス情報を識別してインデックストライ構造の末端ノードからルートまでのパスを特定し、インデックストライ構造で特定されたパスの第2のインデックス情報の末端ノードに基づき辞書トライ構造からサブ文字列を特定し、インデックストライ構造で特定された第2のインデックス情報のパスの末端ノードからルートまでの順序に従い特定されたサブ文字列からなる第2の言語の文を抽出する抽出手段と、
    抽出された文を目的言語の翻訳として出力する出力手段とを有する、
    翻訳装置。
  9. 請求項1ないしいずれか1つに記載の翻訳装置と、
    前記翻訳装置によって翻訳できなかった文を入力し、当該文の翻訳を行う翻訳エンジンと、
    前記翻訳装置によって翻訳された文と翻訳エンジンによって翻訳された文とを識別して出力する出力手段と、
    を有する機械翻訳システム。
  10. 翻訳エンジンは、パターンベース翻訳エンジン、チャンク翻訳エンジン、解析ベースまたは単語直訳翻訳エンジンの少なくとも1つを含む、請求項に記載の機械翻訳システム。
  11. コンピュータを、第1の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第1の辞書トライ構造、およびルートから複数の末端ノードまでの各パス上に第1の辞書トライ構造に記憶されたサブ文字列のパスを特定するための末端ノードを識別するインデックス情報を記憶する第1のインデックストライ構造を含む第1の検索辞書と、第2の言語について、ルートから複数の末端ノードまでの各パス上にサブ文字列を記憶する第2の辞書トライ構造、およびルートから複数の末端ノードまでの各パス上に第2の辞書トライ構造に記憶されたサブ文字列のパスを特定するための末端ノードを識別するインデックス情報を記憶する第2のインデックストライ構造を含む第2の検索辞書とを記憶し、第1および第2のインデックストライ構造のインデックス情報は、ルートから末端ノードのパスにより複数のサブ文字列からなる文を特定し、第1のインデックストライ構造のインデックス情報は、少なくとも第2のインデックストライ構造における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含む記憶装置を備えた翻訳装置として機能させるための翻訳プログラムであって、
    コンピュータに、
    入力部から入力された原言語の文を前記記憶装置の第1の検索辞書の第1の辞書トライ構造と照合し、原言語の文のサブ文字列のパスを特定するための末端ノードを検索し、かつ検索された末端ノードを第1のインデックストライ構造と照合し、前記検索された末端ノードに該当するパスのインデックス情報を検索するステップと、
    検索されたインデックス情報の末端ノードに基づき第2の検索辞書の第2のインデックストライ構造から対応する末端ノードのインデックス情報を識別して第2のインデックストライ構造の末端ノードからルートまでのパスを特定し、第2のインデックストライ構造で特定されたパスのインデックス情報の末端ノードに基づき第2の辞書トライ構造からサブ文字列を特定し、第2のインデックストライ構造で特定されたパスの末端ノードからルートまでの順序に従い特定されたサブ文字列からなる第2の言語の文を抽出するステップと、
    抽出された文を目的言語の翻訳として出力部から出力するステップと、
    を実行させるための翻訳プログラム。
  12. 第1の検索辞書のインデックス情報は、少なくとも第2の検索辞書における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含む、請求項11に記載の翻訳プログラム。
  13. 翻訳プログラムはさらに、入力された文をサブ文字列に分割するステップを含み、前記検索するステップは、分割されたサブ文字列を第1の検索辞書の第1の辞書トライ構造と照合し、照合されたサブ文字列のインデックス情報を検索する、請求項11に記載の翻訳プログラム。
JP2005071068A 2005-03-14 2005-03-14 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム Expired - Fee Related JP4404211B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005071068A JP4404211B2 (ja) 2005-03-14 2005-03-14 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
CNB2005100938291A CN100511215C (zh) 2005-03-14 2005-08-30 多语种翻译存储器和翻译方法
US11/216,057 US7707026B2 (en) 2005-03-14 2005-09-01 Multilingual translation memory, translation method, and translation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005071068A JP4404211B2 (ja) 2005-03-14 2005-03-14 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2006252428A JP2006252428A (ja) 2006-09-21
JP4404211B2 true JP4404211B2 (ja) 2010-01-27

Family

ID=36972140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005071068A Expired - Fee Related JP4404211B2 (ja) 2005-03-14 2005-03-14 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム

Country Status (3)

Country Link
US (1) US7707026B2 (ja)
JP (1) JP4404211B2 (ja)
CN (1) CN100511215C (ja)

Families Citing this family (215)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
WO2006090732A1 (ja) * 2005-02-24 2006-08-31 Fuji Xerox Co., Ltd. 単語翻訳装置、翻訳方法および翻訳プログラム
JP4626356B2 (ja) * 2005-03-25 2011-02-09 富士ゼロックス株式会社 付加情報を含む電子文書を編集する方法、装置およびプログラム
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7676359B2 (en) * 2005-10-06 2010-03-09 International Business Machines Corporation System and method for synchronizing languages and data elements
KR100643801B1 (ko) * 2005-10-26 2006-11-10 엔에이치엔(주) 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법
US20080004858A1 (en) * 2006-06-29 2008-01-03 International Business Machines Corporation Apparatus and method for integrated phrase-based and free-form speech-to-speech translation
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR100724141B1 (ko) * 2006-12-29 2007-05-31 주식회사 네오패드 한글 표출 장치 및 그 방법
US8074172B2 (en) 2007-01-05 2011-12-06 Apple Inc. Method, system, and graphical user interface for providing word recommendations
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
JP2008305167A (ja) * 2007-06-07 2008-12-18 Toshiba Corp 原言語文を目的言語文に機械翻訳する装置、方法およびプログラム
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8232973B2 (en) 2008-01-09 2012-07-31 Apple Inc. Method, device, and graphical user interface providing word recommendations for text input
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP5791861B2 (ja) * 2008-07-25 2015-10-07 シャープ株式会社 情報処理装置および情報処理方法
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
JP2010055235A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 翻訳支援プログラム、及び該システム
US7593844B1 (en) * 2008-09-22 2009-09-22 International Business Machines Corporation Document translation systems and methods employing translation memories
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
TW201020816A (en) * 2008-11-25 2010-06-01 Univ Nat Taiwan Information retrieval oriented translation apparatus and methods, and storage media
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8176080B2 (en) * 2009-03-06 2012-05-08 Hewlett-Packard Development Company, L.P. Desensitizing character strings
US20100235780A1 (en) * 2009-03-16 2010-09-16 Westerman Wayne C System and Method for Identifying Words Based on a Sequence of Keyboard Events
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9189475B2 (en) * 2009-06-22 2015-11-17 Ca, Inc. Indexing mechanism (nth phrasal index) for advanced leveraging for translation
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8773706B2 (en) * 2010-03-29 2014-07-08 Konica Minolta Laboratory U.S.A., Inc. Apparatus, systems, and methods for dynamic language customization
US8484016B2 (en) * 2010-05-28 2013-07-09 Microsoft Corporation Locating paraphrases through utilization of a multipartite graph
CN102012897B (zh) * 2010-12-02 2014-09-17 无敌科技(西安)有限公司 一种实现高命中率的逐词比对方法
JP5928673B2 (ja) * 2010-12-09 2016-06-01 株式会社サン・フレア 中継サーバ
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
JP5747508B2 (ja) * 2011-01-05 2015-07-15 富士ゼロックス株式会社 対訳情報検索装置、翻訳装置及びプログラム
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8954315B2 (en) 2011-10-10 2015-02-10 Ca, Inc. System and method for mixed-language support for applications
US20130138421A1 (en) * 2011-11-28 2013-05-30 Micromass Uk Limited Automatic Human Language Translation
CN103294682A (zh) * 2012-02-24 2013-09-11 摩根全球购物有限公司 多语言检索方法、计算机可读储存媒体及网络搜寻系统
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US8732207B2 (en) 2012-07-02 2014-05-20 International Business Machines Corporation Attribute-based linked tries for rule evaluation
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP4138075A1 (en) 2013-02-07 2023-02-22 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
WO2014200728A1 (en) 2013-06-09 2014-12-18 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
JP6163266B2 (ja) 2013-08-06 2017-07-12 アップル インコーポレイテッド リモート機器からの作動に基づくスマート応答の自動作動
US9852129B2 (en) 2013-11-26 2017-12-26 International Business Machines Corporation Language independent processing of logs in a log analytics system
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
JP6165671B2 (ja) * 2014-05-08 2017-07-19 株式会社インフィニトラベルインフォメーション 運賃規則翻訳システム、運賃規則翻訳方法、及び運賃規則翻訳プログラム
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9582493B2 (en) * 2014-11-10 2017-02-28 Oracle International Corporation Lemma mapping to universal ontologies in computer natural language processing
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
CN105138521B (zh) * 2015-08-27 2017-12-22 武汉传神信息技术有限公司 一种翻译行业风险项目通用推荐译员方法
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10275459B1 (en) 2016-09-28 2019-04-30 Amazon Technologies, Inc. Source language content scoring for localizability
US10229113B1 (en) 2016-09-28 2019-03-12 Amazon Technologies, Inc. Leveraging content dimensions during the translation of human-readable languages
US10235362B1 (en) 2016-09-28 2019-03-19 Amazon Technologies, Inc. Continuous translation refinement with automated delivery of re-translated content
US10223356B1 (en) 2016-09-28 2019-03-05 Amazon Technologies, Inc. Abstraction of syntax in localization through pre-rendering
US10261995B1 (en) * 2016-09-28 2019-04-16 Amazon Technologies, Inc. Semantic and natural language processing for content categorization and routing
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
KR102637337B1 (ko) * 2016-12-09 2024-02-16 삼성전자주식회사 자동 통역 방법 및 장치, 및 기계 번역 방법
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11449495B2 (en) * 2017-02-01 2022-09-20 United Parcel Service Of America, Inc. Indexable database profiles comprising multi-language encoding data and methods for generating the same
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10769386B2 (en) * 2017-12-05 2020-09-08 Sap Se Terminology proposal engine for determining target language equivalents
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
CN110895660A (zh) * 2018-08-23 2020-03-20 澳门大学 一种基于句法依存关系动态编码的语句处理方法及装置
JP6517414B1 (ja) * 2018-08-24 2019-05-22 グレイステクノロジー株式会社 ドキュメント作成支援システム
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
CN116933807B (zh) * 2023-09-14 2023-12-29 成都帆点创想科技有限公司 一种文本翻译方法、装置、设备及可读存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58201175A (ja) * 1982-05-20 1983-11-22 Kokusai Denshin Denwa Co Ltd <Kdd> 機械翻訳方式
JPS62251875A (ja) 1986-04-24 1987-11-02 Kenzo Ikegami 電子翻訳装置
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
JP3189186B2 (ja) 1992-03-23 2001-07-16 インターナショナル・ビジネス・マシーンズ・コーポレ−ション パターンに基づく翻訳装置
DE4218421A1 (de) 1992-06-04 1993-12-09 Heidelberger Druckmasch Ag Bogenführung im Ausleger einer Druckmaschine
JP3152868B2 (ja) * 1994-11-16 2001-04-03 富士通株式会社 検索装置および辞書/テキスト検索方法
JPH1011447A (ja) * 1996-06-21 1998-01-16 Ibm Japan Ltd パターンに基づく翻訳方法及び翻訳システム
US6507678B2 (en) * 1998-06-19 2003-01-14 Fujitsu Limited Apparatus and method for retrieving character string based on classification of character
US6584458B1 (en) * 1999-02-19 2003-06-24 Novell, Inc. Method and apparatuses for creating a full text index accommodating child words
US6675169B1 (en) * 1999-09-07 2004-01-06 Microsoft Corporation Method and system for attaching information to words of a trie
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US7734459B2 (en) 2001-06-01 2010-06-08 Microsoft Corporation Automatic extraction of transfer mappings from bilingual corpora
US7050964B2 (en) * 2001-06-01 2006-05-23 Microsoft Corporation Scaleable machine translation system
WO2003005166A2 (en) * 2001-07-03 2003-01-16 University Of Southern California A syntax-based statistical translation model
JP2005507524A (ja) * 2001-10-29 2005-03-17 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 機械翻訳
JP2006134051A (ja) 2004-11-05 2006-05-25 Fuji Xerox Co Ltd 翻訳装置、翻訳方法およびプログラム

Also Published As

Publication number Publication date
CN1834955A (zh) 2006-09-20
US7707026B2 (en) 2010-04-27
JP2006252428A (ja) 2006-09-21
CN100511215C (zh) 2009-07-08
US20060206304A1 (en) 2006-09-14

Similar Documents

Publication Publication Date Title
JP4404211B2 (ja) マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
JP4911028B2 (ja) 単語翻訳装置、翻訳方法および翻訳プログラム
US5895446A (en) Pattern-based translation method and system
JP3973549B2 (ja) 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体
US8239188B2 (en) Example based translation apparatus, translation method, and translation program
JP5235344B2 (ja) 機械翻訳を行う装置、方法およびプログラム
US8812296B2 (en) Method and system for natural language dictionary generation
JP2005507525A (ja) 機械翻訳
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JP2005507524A (ja) 機械翻訳
JPS62163173A (ja) 機械翻訳方法
WO2005059771A1 (ja) 対訳判断装置、方法及びプログラム
JP2017510924A (ja) 機械翻訳システムおよび機械翻訳方法
Wax Automated grammar engineering for verbal morphology
Neme A lexicon of Arabic verbs constructed on the basis of Semitic taxonomy and using finite-state transducers
JP2009205357A (ja) 中国語の品詞を判定する装置、方法およびプログラム
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
Nghiem et al. Using MathML parallel markup corpora for semantic enrichment of mathematical expressions
Bosch et al. Memory-based morphological analysis and part-of-speech tagging of Arabic
JP2006134051A (ja) 翻訳装置、翻訳方法およびプログラム
JP3508312B2 (ja) キーワード抽出装置
Sajjad Statistical models for unsupervised, semi-supervised and supervised transliteration mining
Bender et al. From IGT to precision grammar: French verbal morphology
JP2608384B2 (ja) 機械翻訳装置及びその方法
Dash Morphological processing of words in bangla corpus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090310

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091014

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091027

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131113

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees