JP2010513997A - オンラインコンピュータ支援翻訳 - Google Patents

オンラインコンピュータ支援翻訳 Download PDF

Info

Publication number
JP2010513997A
JP2010513997A JP2009540522A JP2009540522A JP2010513997A JP 2010513997 A JP2010513997 A JP 2010513997A JP 2009540522 A JP2009540522 A JP 2009540522A JP 2009540522 A JP2009540522 A JP 2009540522A JP 2010513997 A JP2010513997 A JP 2010513997A
Authority
JP
Japan
Prior art keywords
translation
text
source
language
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009540522A
Other languages
English (en)
Other versions
JP2010513997A5 (ja
Inventor
パトリック ジェイ ホール
Original Assignee
パトリック ジェイ ホール
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パトリック ジェイ ホール filed Critical パトリック ジェイ ホール
Publication of JP2010513997A publication Critical patent/JP2010513997A/ja
Publication of JP2010513997A5 publication Critical patent/JP2010513997A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Abstract

ソース言語のソーステキストが受け取られる。ソーステキストは複数のセグメントに区分される。ターゲット言語の、セグメントの最初の1つに関連付けられている第1の翻訳入力がユーザーから受け取られる。第1の翻訳入力がテキストデータレポジトリに保存される。
【選択図】図2

Description

本願は、米国特許法第119条に基づき、2006年12月8日に出願された米国仮特許出願第60/873,812号「オンラインコンピュータ支援翻訳」の利益を主張し、ここに本明細書の一部を構成するものとしてその内容を援用する。
本開示は、コンピュータ支援翻訳に関する。
ワールド・ワイド・ウェブ(WWW)が進歩して国際的な媒体になったことに伴い、ウェブの内容に選択される言語としての英語の優位性が減少した。ウェブ・コンテンツの多くは、英語以外の言語で書かれている。この現象の一例は、英語以外の言語で書かれた多くのブログが存在するブロゴスフィア(blogsphere)に見られる。この非英語のブログの成長と、非英語のウェブ・コンテンツ全般の成長は、言語の間の溝を橋渡しする言語翻訳の必要性を増加させた。
翻訳の1つの選択肢は、コンピュータによってコンテンツの全てを翻訳する機械翻訳である。しかし、機械翻訳には、正確性の問題や、機械翻訳によって扱うことができる言語ペアの数が限られているなどの、制限がある。コンテンツ翻訳のもう1つの選択肢は、人間がソフトウェアプログラムの助けを得てコンテンツを翻訳するコンピュータ支援翻訳(CAT)である。しかし、今日入手可能なCATソフトウェアは、高価でプロ向けである傾向にある。そのため、CATのコストが増加し、そのようなサービスを多くの人やグループが使うことができないようにしてしまっている。
一般に、この明細書に記載される主題の1つの局面は、ソース言語のソーステキストを受け取るステップと、前記ソーステキストを複数のセグメントに区分するステップと、ユーザーからターゲット言語の第1の翻訳入力を受け取るステップであって、前記第1の翻訳入力は、前記セグメントの最初の1つに関連付けられている前記ステップと、テキストデータレポジトリに前記第1の翻訳入力を保存するステップとを含む方法によって実施することができる。この局面の他の実施例は、対応するシステム、装置、コンピュータプログラム、及びコンピュータで読み取り可能なメディアを含む。
一般に、この明細書に記載される主題のもう1つの局面は、翻訳者とコンテンツの翻訳の要求をマッチングする翻訳マッチャーと、コンテンツの翻訳を容易にする翻訳エディターと、コンテンツの翻訳を保存する翻訳データベースとを含むことを特徴とするシステムによって実施することができる。この局面の他の実施例は、対応するシステム、装置、方法、コンピュータプログラム、及びコンピュータで読み取り可能なメディアを含む。
この明細書に記載される主題の特定の実施例は、1つ以上の下記の利点を実現するために、実装されることができる。翻訳プロジェクトのソーステキストと作業成果には、専用のソフトウェア又はアドオンをインストールすることなく、ウェブブラウザでコンピュータからアクセスすることができる。翻訳プロジェクトを依頼するクライアントは、自分でプロジェクトの進行状況を確認することができる。翻訳者は、他の翻訳者と協力し、他の翻訳者からの助けを求めることができる。
この明細書に記載される主題の1つ以上の実施例の詳細は、添付される図面と下記の記載に説明される。主題のその他の特徴、局面、及び利点は、明細書、図面、及び請求項から明らかになる。
様々な図面の同じ参照番号と符号は、同じ要素を示す。
アグリゲーターインターフェースの例を示す。 エディターインターフェースの例を示す。 オンラインコンピュータ支援翻訳サービスのエンティティ関係図の例を示す。 翻訳を要求するプロセスの例を示す。 翻訳要求を引き受けるプロセスの例を示す。 翻訳入力を受信し保存するプロセスの例を示す。 ソーステキストと翻訳を受信し保存するシステムの例を図示する。
コンピュータ支援翻訳(CAT)は、オンラインで実装されてもよい。ある実装においては、CATツールは、ウェブサイトでホスティングされるウェブベースのサービスである。CATウェブサイトにおいて、翻訳者は翻訳するコンテンツを選択し、選択されたコンテンツの翻訳を入力し、翻訳されたコンテンツを公開してもよい。
ある実装においては、オンラインCATツールは、ソースコンテンツを管理し翻訳するコンテンツを選択するアグリゲーターと、翻訳者が素早く効率的に作業できることを助けるエディターと、完了した翻訳を外向けコンテンツにして管理する送信箱とを含む。
コンテツを翻訳したいと願う翻訳者は、CATツールのアカウントに登録してもよい。CATツールは、アカウント管理と個人選好の設定のページを含んでもよい。
ある実装においては、CATツールは、ハイパーテキスト・マークアップ言語(HTML)、Java(登録商標)Script、拡張マークアップ言語(XML)、Asynchronous Java(登録商標)Script + XML(AJAX)、その他の適切な技術等を使ったウェブページとして実装される。ウェブページは、ウェブブラウザで処理することができる。
図1は、アグリゲーターインターフェースの例を示す。アグリゲーターは、翻訳者による翻訳のコンテンツ(「ソースコンテンツ」)の選択を容易にする。アグリゲーターは、翻訳可能なソースコンテンツ(例えば、ブログ、ウェブページ)を提示する。ある実装においては、アグリゲーターのレイアウトは、ブログやウェブページ等のタイトルなどの、翻訳可能なソースコンテンツのリストを表示する領域102と、現在選択されているタイトルのコンテンツを表示する別の領域104とを有する。ある実装においては、表示されるコンテンツは、リンクやその他のユーザーインタフェースオブジェクトを含んでいてもよく、「これを翻訳」などと示されていてもよい。翻訳者は、リンクやオブジェクトを選択して、翻訳するコンテンツを引き受けてもよい。ある実装においては、ユーザーインタフェースは、エディターに受け継がれ、翻訳者は翻訳をエディターにおいて行う。これについては、後に詳しく説明する。ある実装においては、コンテンツは、翻訳者の翻訳ドケットに追加される。
アグリゲーターは、アグリゲーターにコンテンツを追加するツールを含んでもよい。ある実装においては、ブログ又はそのコンテンツフィード(例えば、RSSフィード、アトムフィード)のユニバーサルリソースロケータ(URL)を指定することにより、アグリゲーターにブログを追加するユーザーインタフェースがある。翻訳者がブログのURLを送信すると、ブログのコンテンツが取り寄せられ(例えば、そのコンテンツフィードにアクセスすることによって)、そして、コンテンツがデータベースに追加される。そして、翻訳者は、追加されたコンテンツをブラウズすることができ、翻訳するものを選択できる。ある実装においては、同様のユーザーインタフェースを使って、翻訳されるウェブページなどのその他のコンテンツを追加してもよい。ある実装においては、コンテンツは、翻訳者の介在なしに追加されてもよい。例えば、アグリゲーターは、その他からの翻訳の要求を示してもよく、翻訳者は、要求をブラウズし、引き受けたいものを選択してもよい。別の例としては、CATツールは、係る言語と翻訳者のスキル群などの任意の数の条件に基づき、自動的に翻訳者にコンテンツを割り当ててもよい。
ある実装においては、アグリゲーターは、翻訳可能なコンテンツを翻訳者に提示してもよい。提示する際に、コンテンツはソース(例えば、ブログ、ウェブサイト、ドメイン、翻訳の要求者等)によって整理されてもよく、ブログ投稿、個別のウェブページ等などの特定の単位で提示されてもよい。翻訳者は、コンテンツの特定の単位を選んで、翻訳者の翻訳ドケットに追加してもよい。例えば、翻訳者は、アグリゲーターにブログを追加してもよい。アグリゲーターは、ブログからの投稿を翻訳者に提示し、翻訳者は、翻訳者のドケットに追加するためにブログの特定の投稿を選択してもよい。
ある実装においては、ソースコンテンツは、1つ又は複数のサーバーに保存されている。例えば、ソースコンテンツは、ブログ、ウェブサイト等から抽出されてサーバーに保存されることができる。別の例としては、ソースコンテンツのファイルは、サーバーにアップロードされることができる。また、別の例としては、ソースコンテンツのテキストは、フォームに入力されることができ(例えば、タイピング、コピーアンドペースト等により)、テキストは、保存のためサーバーに送られる。ソースコンテンツは、サーバーのテキストデータのレポジトリ(例えば、データベース)に保存される。アグリゲーターインターフェースは、テキストデータレポジトリに保存されているソースコンテンツを、選択のために潜在的な翻訳者へ、表示することができる。ある実装においては、ソースコンテンツのテキストは、サーバーにおいて、各セグメントに分割される。各セグメントは、文、段落、表の欄等であってよい。
図2は、エディターインターフェースの例を示す。翻訳者は、エディター200において、ソースコンテンツの翻訳を行うことができる。ある実装においては、エディターは、用語集202、編集領域204、及び諸情報を表示する領域206を有する。ある実装においては、エディターは、翻訳されるソースコンテンツを小さい単位(「セグメント」)に自動的に分割・区分する。ある実装においては、セグメントは、ピリオド、疑問符等の文の終わりの句読点によって分離される、個々の文である。ある実装においては、セグメントは、ソースコンテンツのテキストや表の欄等にある段落である。
図2では、編集領域204は、ウェールズ語で書かれたブログ投稿のセグメントを、そのセグメントについて入力された翻訳とともに、示している。翻訳されている現在のセグメント(「Dyma’r union bobl」で始まるテキスト)は、現在の文の領域208に示される。翻訳者は、現在のセグメントの翻訳領域210に、現在のセグメントの領域208に示されるセグメントについての翻訳をタイプしてもよい。完了したセグメントの翻訳は、完了翻訳領域212に表示されてもよい。ある実装においては、完了した翻訳は、完了した順番とは逆の順番に表示される。つまり、翻訳者が個別のセグメントを完了し、翻訳を(エンターキーを押す、「送信」ボタンを押す等によって)送信し、送信されたセグメントが、完了翻訳領域212の文のリストの一番上に追加される。例えば、現在の文の翻訳「それらは・・・人々と同じである」が完了すると、それは、「私はいつも驚く・・・」で始まる文の上に配置される。テキストの流れは、ここにおけるコンテンツの単位が個別の投稿ではなく文である点を除き、ブログと同じように、上から下に流れる。ある実装においては、セグメントの翻訳は、セグメントが強調表示されるか編集のために選択された時に、表示される。ある実装においては、原文のソースコンテンツのテキストと翻訳は、横に並べて表示されることができる。
翻訳中の現在の文で、下線が引かれている単語は、CATツールの用語集に見つかった単語であり、それらは、用語集領域202に表示されてもよい。
ある実装においては、ソースコンテンツ全文の翻訳が完了した時に保存されるのではなく、セグメントの翻訳が翻訳者によって送信された時にセグメントの翻訳がサーバーに保存される。例えば、翻訳は、ソースコンテンツが保存されるテキストデータレポジトリに保存されることができる。従って、翻訳者がソースコンテンツのテキストの翻訳を進めるに従って、セグメントごとに翻訳は保存されることができる。テキストデータレポジトリ内において、翻訳は、ソースコンテンツの対応するセグメントと関連付けられることができる。
テキストデータレポジトリは、ソースコンテンツのテキストとソースコンテンツのテキストのセグメントの翻訳とともに、検索されることができる。例えば、エディターインターフェース200は、ソースコンテンツのテキストのセグメントをテキストデータレポジトリから検索するための検索ボックスを含むことができる。ユーザー(例えば、翻訳者)は、検索ボックスにテキストクエリーを入力することができ、テキストデータレポジトリからテキストクエリーを含むセグメントが検索される。合致したセグメントとその翻訳が検索結果としてユーザーに返される。従って、翻訳者はテキストデータレポジトリからテキストを検索することができ、他の翻訳者がテキストをどのように翻訳したかを見ることができる。
ある実装においては、ソースコンテンツのテキストに対する翻訳完了のパーセント又は割合は、テキストデータレポジトリに保存された翻訳を有するソースコンテンツのセグメントの数(又はセグメントの単語・文字の数)及びソースコンテンツのテキストのセグメントの合計数(又は単語・文字の合計数)に基づいて、計算されることができる。完了パーセントは、ソースコンテンツのテキストとともに、エディターインターフェース200に表示されることができる。完了パーセントは、翻訳を依頼したクライアントへ、表示することもできる(例えば、クライアントが翻訳の進行を調べるためにソースコンテンツのテキスト及び翻訳にアクセスしている時に)。
ある実装においては、テキストデータレポジトリのソースコンテンツと翻訳は、制約なしに翻訳者とクライアントに開示される。しかし、ソースコンテンツのテキストとソースコンテンツのテキストの翻訳が、機密情報や、翻訳を依頼したクライアントが権限のない人に開示することを望まないその他の情報を含む場合があるかもしれない。ある実装においては、ソースコンテンツのテキストと翻訳の検索、閲覧、及び編集は、クライアントと権限のある人(例えば、翻訳を行うように依頼された翻訳者)に限定されることができる。限定は、ソースコンテンツのテキストの全体又はセグメントごとに(例えば、あるセグメントは公衆に開示され、その他のセグメントは権限のある人に限定されるように)行われることができる。
ある実装においては、コメントスレッドが生成され、ソースコンテンツのテキストのセグメントに関連付けられることができる。ユーザー(例えば、セグメントを翻訳している翻訳者)は、コメントスレッドを使って他の翻訳者に助けを求めることができる。従って、コメントスレッドは、翻訳における協力を容易にすることができる。更に、ある実装においては、翻訳者による品質コメント(例えば、他の翻訳者から投票により有用であるとされた、ある翻訳者が助けを提供したときのコメント)の数を使用して、翻訳者の品質又は評判の尺度を決定することができる。
上記のように、テキストデータレポジトリは、1つ以上のサーバーに保存されることができる。ユーザー(例えば、翻訳者、クライアント)は、ウェブベースのインターフェース(例えば、アグリゲーターインターフェース100、エディターインターフェース200)を通じて、テキストデータレポジトリのコンテンツ(すなわち、ソースコンテンツと翻訳)にアクセスすることができる。
図3は、オンラインコンピュータ支援翻訳サービスのエンティティ関係図300の例を示す。ある実装においては、関係図300は、オンラインコンピュータ支援翻訳のシステムも示す。素材又はコンテンツを翻訳してほしいと欲する、翻訳される素材の消費者がいる。それらの消費者は、翻訳マーケットに参加してもよい。翻訳マーケットでは、消費者は、翻訳の要求をして、翻訳してほしい素材を指定又は提供してもよい。また、消費者は、所定のレートの翻訳料を払うか、又は、翻訳にどれだけ支払うつもりがあるのか指定(つまり、入札する)する。翻訳者のコミュニティは、翻訳の要求を検討して、どの要求を引き受けるか決定してもよい。翻訳者は、スキル群、係る言語、及び要求の入札価格などの、任意の数の条件に基づき、要求とマッチングされてもよい。翻訳者は、翻訳者の希望レートを指定してもよい。
翻訳者が、コンテンツの1つを翻訳する準備ができた時、翻訳者は、翻訳エディターを使って翻訳を行ってよい。翻訳されたコンテンツは、対応する消費者に返される。消費者によって支払われた翻訳料の金額の少なくとも一部が、翻訳者に支払われてもよい。翻訳マーケットは、消費者によって支払われた料金の一部を、コミッション、サービスチャージ等として受け取ってもよい。
翻訳されたコンテンツは、翻訳のデータベースにも保存される。データベースは、任意の数の言語ペアの、原文素材とその翻訳を保存してもよい。ある実装においては、翻訳データベースは、上記のテキストデータレポジトリである。データベースの翻訳は、翻訳者が翻訳を行うことの助けとするために、翻訳者によってアクセスされてもよい。言いかえれば、翻訳されたコンテンツは保存されて、将来に翻訳者によってサンプル又は参照として使われてもよい。
ある実装においては、翻訳者は、他の翻訳者の翻訳にレートを付けてもよい。そのようなレート付けは、データベースに保存されてもよい。それらのレート付けに基づき、翻訳者は、翻訳者のコミュニティと翻訳マーケットでの評判を築いてもよい。評判は、レート付けに反映されてもよく、翻訳を要求する消費者に提供されてもよい。
翻訳データベースは、コンテンツとコンテンツの翻訳のコーパスとして閲覧されてもよい。ある実装において、アプリケーション・プログラミング・インターフェース(API)が、コーパスにアクセスすることを欲する事業体やシステムに提供されてもよい。例えば、機械翻訳システムが、コーパスにアクセスして、その翻訳アルゴリズムを訓練してもよい。APIは、無償又は有料購読又はライセンスとして提供されてよい。
図4は、翻訳を要求するプロセス400の例を示す。消費者は、翻訳されるコンテンツを指定する(402)。ある実装においては、消費者は、コンテンツのソース言語、コンテンツのターゲット言語、及びソースフォーマット(例えば、コンテンツがURLで示されるウェブページか、フィードのURLで示されるコンテンツフィードか、電子メールかなど)を指定する。消費者は、期限日や料金の入札価格などの、その他の情報を指定してもよい。
消費者は、翻訳者を選択する(404)。ある実装においては、消費者は、名前で特定の翻訳者を要求してもよい。消費者は、言語、翻訳者のレート付け、及び特別なスキル(例えば、法律文書のスキル、医療文書のスキル、航空分野の文書のスキル等)などの、任意の数の条件によって、翻訳者を検索してもよい。
消費者と翻訳者は、料金を協議する(406)。消費者と翻訳者の双方は、双方が合意できる料金に達するまで、入札することができる。ある実装においては、料金は、単語単位のコスト又は文字単位のコストによって表現されてもよい。
ある実装においては、料金協議は省略される。翻訳者は、事前にその翻訳者のレートを指定してよく、消費者は、その他の要素の中から料金に基づいて翻訳者を選択してもよい。消費者は、合意できないレートの翻訳者を拒否してもよい。
選択された翻訳者がコンテンツを翻訳した後、消費者は翻訳されたコンテンツを受け取る(408)。
図5は、翻訳要求を引き受けるプロセス500の例を示す。翻訳者は、引き受ける翻訳要求を選択してもよい(502)。様々な条件が要求を並べ替える為に使用されてもよく、そうすることにより、翻訳者はより効率的に好みの要求を見つけることができる。並べ替え条件の例として、これらに限定されるものではないが、言語、要求される特別なスキル、料金、翻訳されるコンテンツの量、期限日が挙げられる。ある実装においては、翻訳者は、要求を受け入れるかどうか決定する前に、要求の原文のコンテンツを検討してもよい。
翻訳者が要求を引き受けた後、翻訳者と要求する消費者は料金を協議してもよい(504)。料金が合意された後、翻訳者は、コンテンツの翻訳を開始する(506)。翻訳者は、上述したエディター200と関連ツールを使って、翻訳を行ってもよい。翻訳が完了した後、翻訳は消費者に届けられる。
ある実装においては、翻訳者は、スキル群とレートを事前に指定してもよく、消費者は、係る言語、要求されるスキル、及び料金を指定する要求をしてもよい。翻訳者は、指定された情報に基づき、要求(又は翻訳者に割り当てられた要求)と自動的にマッチングされてもよい。
さらに別の実装においては、翻訳者は無償で翻訳サービスを行ってもよい。
図6は、翻訳入力を受信し保存するプロセス600の例を示す。ソース言語のソーステキストを受け取る(602)。翻訳プロジェクトを依頼することを欲するクライアントが、ソーステキストを、例えばファイル又はフォームへの入力として、システム(例えば、システム700、図7)に送信する。ある実装においては、ファイル又はフォーム入力は、フロントエンド704(図7)によって受け取られ、テキストデータレポジトリ706(図7)に保存される。
ある実装においては、ユニバーサルリソースロケータ(URL)がクライアントによって提供され、システム700(例えば、フロントエンド704)が提供されたURLからソーステキストを取り寄せることができる。
ソーステキストは、複数のセグメントに区分されている(604)。ある実装においては、セグメントは、ソーステキストの個々の文であり、ソーステキストのそれぞれの文は、セグメントである。それ以外の実装においては、セグメントは、ソーステキストの段落である。他の区分分けの単位も可能である。もし、ソーステキストが1つのセグメント単位に収まるほど短ければ、ソーステキストは、ソーステキスト自体のセグメントになることができる。例えば、たった1つの文のソーステキストは、その文自体である1つのセグメントを有する(ただし、文がセグメントの単位である場合)。ある実装においては、ソーステキストは、テキストデータレポジトリ706に、そのセグメントの形で、保存される。ソーステキストが、エディターインターフェース200で翻訳者に表示される時、ソーステキストはセグメントとして表示される。
セグメントの1つの翻訳入力を、ユーザーから受け取る(606)。ユーザー(例えば、翻訳者)は、エディターインターフェース200に、ソーステキストの任意の数のセグメントについての、ターゲット言語への翻訳を入力することができる。翻訳者は、セグメントごとに翻訳を入力する。翻訳者は、エディターインターフェース200を通じてセグメントの翻訳入力を送信し、システム700が入力を受け取る。
翻訳入力は、テキストデータレポジトリに保存される(608)。受け取った翻訳入力は、テキストデータレポジトリに、ソーステキスト全体の翻訳の完了を必ずしも待たずに、保存される。
翻訳者は、他のセグメントの翻訳を入力することができる。システム700は、翻訳入力を受け取り、セグメントごとにテキストデータレポジトリに受け取った翻訳入力を保存する。
図7は、ソーステキストと翻訳を受信し保存するシステムの例を図示する。システム700は、フロントエンド704とテキストデータレポジトリ706を有する。ある実装においては、フロントエンド704は、ウェブサーバーである。ある実装においては、フロントエンド704は、例えば、アグリゲーションインターフェース100及び/又は編集インターフェース200を含む、コンピュータ支援翻訳を容易にするウェブベースのインターフェースとして働く。ウェブベースのインターフェースは、ウェブページを処理し表示できるユーザーデバイス702(例えば、ウェブブラウザ・アプリケーションを有するユーザーデバイス)からユーザー(例えば、翻訳者、クライアント)が、アクセスすることができる。ユーザーデバイス702の例としては、デスクトップコンピュータ、ノートブックコンピュータ、スマートフォン、携帯電話、パーソナルデジタルアシスタント(PDA)、タブレットコンピュータ等が挙げられる。
テキストデータレポジトリ706は、ソーステキストと対応する翻訳を保存する。ある実装においては、ソーステキストは、テキストデータレポジトリにセグメントとして保存され、保存された翻訳は、セグメントのそれぞれの翻訳である。ある実装においては、テキストデータレポジトリ706は、図3を参照して上記の説明した翻訳データベースの役目を担う。ある実装においては、テキストデータレポジトリ706は、コンピュータ(例えば、サーバー)に保存されることができ、又は、複数のコンピュータ(例えば、複数のサーバー)にまたがって保存又は分散されることができる。
開示された又はその他の実施例とこの明細書に記載された機能的動作は、この明細書に記載された構造とそれに同等なものを含む、デジタル電子回路、又はコンピュータソフトウェア、ファームウェア、又はハードウェア、又はその1つ以上の組み合わせで実装することができる。開示された又はその他の実施例は、1つ以上のコンピュータプログラム、すなわち、コンピュータで読み取ることができる媒体に符号化された、データ処理装置によって実行される又はデータ処理装置の動作を制御するコンピュータプログラム命令の1つ以上のモジュールとして、実装することができる。コンピュータで読み取ることができる媒体は、機械で読み取ることができるストレージデバイス、機械で読み取ることができるストレージ基板と、メモリーデバイス、機械で読み取ることができる伝搬信号を生じさせる組成物、又はその1つ以上の組み合わせを含む。「データ処理装置」は、例として、プログラム可能なプロセッサ、コンピュータ、複数のプロセッサ又はコンピュータを含む、すべての装置、デバイス、及びデータを処理する機械を含む。この装置は、ハードウェアに加えて、例えば、プロセッサのファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はその1つ以上の組み合わせを構成するコードなどの、当該コンピュータプログラムの為の実行環境を作るコードを含むことができる。伝搬信号は、例えば、機械で生成された電気、光、又は電磁信号などの、適当な受信装置へ送信のために情報を符号化するために生成された、人工的に作られた信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる)は、コンパイル又はインタプリタ言語を含む、どのような形態のプログラム言語でも書かれることができ、スタンドアローンプログラム、又はモジュール、コンポーネント、サブルーチン、又はコンピュータ環境での使用に適したその他の単位を含め、どのような形態でも展開することができる。コンピュータプログラムは必ずしもファイルシステムのファイルには対応しない。プログラムは、他のプログラムやデータ(例えば、マークアップ言語ドキュメントに保存された1つ以上のスクリプト)を保持するファイルの部分、当該プログラム専用の1つのファイル、又は複数の協調したファイルに保存されることができる(例えば、1つまたは複数のモジュール、サブプログラム、又はコードの一部を保存するファイル)。コンピュータプログラムは、1つのサイトにある又は複数のサイトにまたがって分散し、通信ネットワークによって互いに接続された、1つ以上のコンピュータで実行される為に展開されることができる。
この明細書に記載されたプロセスとロジックのフローは、1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって、実行されることができ、入力データを処理し出力を生成することによって機能を実行する。プロセスとロジックのフローは、例えば、FPGA(フィールド・プログラマブル・ゲート・アレイ)又はASIC(特定用途向け集積回路)などの専用のロジック回路によって実行されることができ、装置は、例えば、FPGA(フィールド・プログラマブル・ゲート・アレイ)又はASIC(特定用途向け集積回路)などの専用のロジック回路として実装されることもできる。
コンピュータプログラムの実行に適したプロセッサとしては、汎用又は専用のマイクロプロセッサ、及びデジタルコンピュータの任意の種類の任意の1つ以上のプロセッサが、例として挙げられる。一般的に、プロセッサは、読取専用メモリー又はランダムアクセスメモリー又はその両方から命令とデータを受け取る。コンピュータの重要な要素は、命令を実行するプロセッサと命令及びデータを記憶する1つ以上のメモリーデバイスである。一般的に、コンピュータは、例えば、磁気、光磁気ディスク、又は光ディスクなどの、データを記憶する1つ以上の大容量ストレージデバイスを含むか、又は、それに対してデータの送受信ができるように接続されているか、又は、その両方である。しかし、コンピュータには、そのようなデバイスは必要ない。コンピュータプログラムの命令やデータを記憶するのに適した、コンピュータが読み取ることができるメディアは、例えば、EPROM、EEPROM、フラッシュメモリーデバイスなどの半導体メモリーデバイス、例えば、内蔵ハードディスク又はリムーバブルディスクなどの磁気ディスク、光磁気ディスク、CD−ROM、及びDVD−ROMディスクを例として含む、全ての種類の不揮発メモリー、メディア、及びメモリーデバイスを含む。プロセッサとメモリーは、専用のロジック回路によって補われることができるか、又は専用のロジック回路に組み込まれることができる。
ユーザーとの対話を提供するために、開示された実施例は、例えばCRT(陰極線管)又はLCD(液晶ディスプレイ)モニタなどのユーザーに情報を表示するディスプレイデバイスと、例えばマウス又はトラックボールなどのユーザーがコンピュータに入力を提供することができるキーボード及びポインティングデバイスとを有するコンピュータに実装されることができる。その他の種類のデバイスも、ユーザーとの対話を提供するために使用されることができる。例えば、ユーザーに提供されるフィードバックは、例えば、視覚的フィードバック、聴覚的フィードバック、又は触角的フィードバックなどの、いかなる形態の知覚上のフィードバックであってもよく、ユーザーからの入力は、音響、音声、又は触角入力を含む、いかなる形態でも受け取られ得る。
開示された実施例は、データサーバーのようなバックエンドコンポーネントを含むコンピュータシステム、又はアプリケーションサーバーのようなミドルウェアコンポーネントを含むコンピュータシステム、又はグラフィカルユーザーインタフェースを有するクライアントコンピュータのようなフロントエンドコンポーネントを含むコンピュータシステム、又はユーザーがここに開示される実装と双方向に対話することができるウェブブラウザ、又は1つ以上のそのようなバックエンド、ミドルウェア、又はフロントエンドコンポーネントのいかなる組み合わせでも実装されることができる。システムのコンポーネントは、例えば通信ネットワークなどの、デジタルデータ通信の如何なる形態又はメディアによっても相互接続されることができる。通信ネットワークの例としては、ローカルエリアネットワーク(「LAN」)及び例えばインターネットなどの広域ネットワーク(「WAN」)が挙げられる。
コンピューティングシステムは、クライアントとサーバーを含めることができる。クライアントとサーバーは、概してお互いに離れており、典型的には通信ネットワークを通じて相互通信する。クライアントとサーバーの関係は、それぞれのコンピュータで動作しクライアント−サーバーの関係を互いに有するコンピュータプログラムにより、発生する。
この明細書は多くの詳細を含むが、それらは請求の範囲又は請求され得る範囲に対する制限として解釈されてはならず、むしろ、特定の実施例に特有の特徴の記載として解釈されなければならない。別の実施例の文脈で、この明細書に記載されるある特徴は、1つの実施例における組み合わせとしても実装されることができる。反対に、1つの実施例の文脈で記載される様々な特徴は、複数の実施例で別々に、又は、如何なる適切なサブコンビネーションでも、実装されることができる。更に、特徴はあるコンビネーションで動作するとして上述され、最初にそのように主張されさえしているが、主張されるコンビネーションからの1つ以上の特徴は、場合によっては、コンビネーションから削除されることができ、主張されるコンビネーションは、サブコンビネーション又はサブコンビネーションの変形に向けられてもよい。
同様に、動作は図面に特定の順番で描かれているが、これは、望ましい結果を達成するために、そのような動作が示される特定の順番又は連続的な順番で行われるか、又は描かれる全ての動作が行われることが、要求されると理解されてはならない。ある状況下においては、マルチタスク及び並行処理が有利かもしれない。更に、上述された実施例の様々なシステムコンポーネントの分離は、全ての実施例においてそのような分離が要求されると理解されてはならず、それは、記載されたプログラムコンポーネント及びシステムが、一般的には、1つのソフトウェア製品に共に統合されることができるか、又は複数のソフトウェア製品にパッケージ化されることができる、と理解されなければならない。

Claims (10)

  1. ソース言語のソーステキストを受け取るステップと、
    前記ソーステキストを複数のセグメントに区分するステップと、
    ユーザーからターゲット言語の第1の翻訳入力を受け取るステップであって、前記第1の翻訳入力は、前記セグメントの最初の1つに関連付けられている前記ステップと
    テキストデータレポジトリに前記第1の翻訳入力を保存するステップと
    を含むことを特徴とする方法。
  2. 前記テキストデータレポジトリは、1つ以上のサーバーに保存されることを特徴とする請求項1に記載の方法。
  3. 前記ユーザーからターゲット言語の第2の翻訳入力を受け取るステップであって、前記第2の翻訳入力は、前記セグメントの2つ目に関連付けられている前記ステップと
    前記テキストデータレポジトリに前記第2の翻訳入力を保存するステップと
    を更に含むことを特徴とする請求項1に記載の方法。
  4. 第1の言語のクエリーを受け取るステップと、
    前記テキストデータレポジトリから前記クエリーに合致する前記第1の言語の1つ以上のテキスト文字列を検索するステップであって、前記テキストデータレポジトリは、前記第1の言語の前記合致するテキスト文字列にそれぞれ関連付けられた第2の言語の翻訳を含む前記ステップと、
    前記第2の言語の前記翻訳を提示するステップと
    を更に含むことを特徴とする請求項1に記載の方法。
  5. 前記ソーステキストを前記テキストデータレポジトリに保存するステップを更に含むことを特徴とする請求項1に記載の方法。
  6. それぞれのセグメントにコメントスレッドを生成するステップを更に含むことを特徴とする請求項1に記載の方法。
  7. 前記ソーステキストの1つ以上のセグメントは前記第2の言語の前記ユーザーからのそれぞれの翻訳入力に関連付けられており、前記ソーステキストの前記セグメントと前記それぞれの翻訳入力は前記テキストデータレポジトリに保存されている方法であって、
    前記翻訳入力の量と前記ソーステキストの量に基づいて、前記ソーステキストの翻訳完了割合を決定するステップと、
    前記翻訳完了割合を提示するステップと
    を更に含むことを特徴とする請求項1に記載の方法。
  8. 読み取り可能なプログラム担体に符号化されているコンピュータプログラム製品であって、
    ソース言語のソーステキストを受け取るステップと、
    前記ソーステキストを複数のセグメントに区分するステップと、
    ユーザーからターゲット言語の第1の翻訳入力を受け取るステップであって、前記第1の翻訳入力は、前記セグメントの最初の1つに関連付けられている前記ステップと
    テキストデータレポジトリに前記第1の翻訳入力を保存するステップと
    を含む動作をデータ処理装置に行わせることができることを特徴とする前記コンピュータプログラム製品。
  9. テキストデータレポジトリを保存することができる1つ以上のサーバーと、
    ソース言語のソーステキストを受け取り、前記ソーステキストを複数のセグメントに区分し、前記セグメントの最初の1つに関連付けられている、ターゲット言語の第1の翻訳入力をユーザーから受け取り、前記テキストデータレポジトリに前記第1の翻訳入力を保存するように動作可能なコンピュータと
    を含むことを特徴とするシステム。
  10. 翻訳者とコンテンツの翻訳の要求をマッチングする翻訳マッチャーと、
    コンテンツの翻訳を容易にする翻訳エディターと、
    コンテンツの翻訳を保存する翻訳データベースと
    を含むことを特徴とするシステム。
JP2009540522A 2006-12-08 2007-12-10 オンラインコンピュータ支援翻訳 Pending JP2010513997A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US87381206P 2006-12-08 2006-12-08
PCT/US2007/087036 WO2008070877A2 (en) 2006-12-08 2007-12-10 Online computer-aided translation

Publications (2)

Publication Number Publication Date
JP2010513997A true JP2010513997A (ja) 2010-04-30
JP2010513997A5 JP2010513997A5 (ja) 2011-02-10

Family

ID=39493117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009540522A Pending JP2010513997A (ja) 2006-12-08 2007-12-10 オンラインコンピュータ支援翻訳

Country Status (8)

Country Link
US (1) US20080147378A1 (ja)
EP (1) EP2092439A2 (ja)
JP (1) JP2010513997A (ja)
KR (1) KR20090111813A (ja)
CN (1) CN102388383A (ja)
AU (1) AU2007329240A1 (ja)
CA (1) CA2671771A1 (ja)
WO (1) WO2008070877A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016519779A (ja) * 2013-03-15 2016-07-07 メディア マウス インコーポレイテッド 言語学習環境

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8271260B2 (en) * 2007-12-05 2012-09-18 Facebook, Inc. Community translation on a social network
CN101615181B (zh) * 2008-06-27 2012-05-16 国际商业机器公司 创建国际化网络应用的系统和方法
US9262403B2 (en) * 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9053202B2 (en) * 2009-09-25 2015-06-09 Yahoo! Inc. Apparatus and methods for user generated translation
US8965751B2 (en) * 2010-11-01 2015-02-24 Microsoft Corporation Providing multi-lingual translation for third party content feed applications
US8738358B2 (en) * 2010-12-24 2014-05-27 Telefonaktiebolaget L M Ericsson (Publ) Messaging translation service application servers and methods for use in message translations
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US9015030B2 (en) * 2011-04-15 2015-04-21 International Business Machines Corporation Translating prompt and user input
WO2013040107A1 (en) * 2011-09-13 2013-03-21 Monk Akarshala Design Private Limited Modular translation of learning applications in a modular learning system
US9081749B2 (en) * 2011-12-12 2015-07-14 Microsoft Technology Licensing, Llc Automatic language sensitive, event based activity feeds
US9658998B2 (en) * 2012-02-24 2017-05-23 American Express Travel Related Services Company, Inc. Systems and methods for internationalization and localization
US9519639B2 (en) 2012-06-08 2016-12-13 Facebook, Inc. Community translation of user-generated content
US9619463B2 (en) * 2012-11-14 2017-04-11 International Business Machines Corporation Document decomposition into parts based upon translation complexity for translation assignment and execution
US9195651B2 (en) * 2013-03-15 2015-11-24 Google Inc. Techniques for language translation localization for computer applications
WO2015070093A1 (en) * 2013-11-08 2015-05-14 Thomas Fennell System and method for translating texts
CN103823796A (zh) * 2014-02-25 2014-05-28 武汉传神信息技术有限公司 一种翻译系统及翻译方法
JP6250013B2 (ja) 2014-11-26 2017-12-20 ネイバー コーポレーションNAVER Corporation コンテンツ参加翻訳装置、及びそれを利用したコンテンツ参加翻訳方法
CN106156010B (zh) 2015-04-20 2019-10-11 阿里巴巴集团控股有限公司 翻译训练方法、装置、系统、以及在线翻译方法及装置
RU2604984C1 (ru) * 2015-05-25 2016-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Переводческий сервис на базе электронного сообщества
US9734142B2 (en) * 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
CN107329958B (zh) * 2017-06-08 2021-03-26 努比亚技术有限公司 基于网页的语言转换方法及装置
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
CN108491400A (zh) * 2018-04-09 2018-09-04 江苏省舜禹信息技术有限公司 一种辅助翻译智能系统及方法
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN111401000B (zh) * 2020-04-03 2023-06-20 上海一者信息科技有限公司 一种在线辅助翻译的译文实时预览方法
CN111666776B (zh) * 2020-06-23 2021-07-23 北京字节跳动网络技术有限公司 文档翻译方法和装置、存储介质和电子设备
CN112433793A (zh) * 2020-11-20 2021-03-02 掌阅科技股份有限公司 翻译界面的布局显示方法、计算设备及计算机存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69836785T2 (de) * 1997-10-03 2007-04-26 Matsushita Electric Industrial Co., Ltd., Kadoma Audiosignalkompression, Sprachsignalkompression und Spracherkennung
US20060116865A1 (en) * 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
AUPQ539700A0 (en) * 2000-02-02 2000-02-24 Worldlingo.Com Pty Ltd Translation ordering system
US20020111787A1 (en) * 2000-10-13 2002-08-15 Iko Knyphausen Client-driven workload environment
US7130792B2 (en) * 2000-10-16 2006-10-31 Iis Inc. Method for offering multilingual information translated in many languages through a communication network
US6980953B1 (en) * 2000-10-31 2005-12-27 International Business Machines Corp. Real-time remote transcription or translation service
US20020087302A1 (en) * 2000-11-10 2002-07-04 Miyuki Tomaru Processing system, processing method and recording medium
JP2002215621A (ja) * 2001-01-19 2002-08-02 Nec Corp 翻訳サーバ及び翻訳方法並びにプログラム
US7114123B2 (en) * 2001-02-14 2006-09-26 International Business Machines Corporation User controllable data grouping in structural document translation
US20020165885A1 (en) * 2001-05-03 2002-11-07 International Business Machines Corporation Method and system for verifying translation of localized messages for an internationalized application
US20030004702A1 (en) * 2001-06-29 2003-01-02 Dan Higinbotham Partial sentence translation memory program
WO2003032178A1 (en) * 2001-09-10 2003-04-17 My2Centences, Llc. Method and system for creating a collaborative work over a digital network
JP3959453B2 (ja) * 2002-03-14 2007-08-15 沖電気工業株式会社 翻訳仲介システム及び翻訳仲介サーバ
FR2850473A1 (fr) * 2003-01-28 2004-07-30 France Telecom Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web
US7627817B2 (en) * 2003-02-21 2009-12-01 Motionpoint Corporation Analyzing web site for translation
US20050010419A1 (en) * 2003-07-07 2005-01-13 Ahmad Pourhamid System and Method for On-line Translation of documents and Advertisement
US20050086044A1 (en) * 2003-10-16 2005-04-21 Translation Science Llc System and method of identifying a translation resource
US7412388B2 (en) * 2003-12-12 2008-08-12 International Business Machines Corporation Language-enhanced programming tools
JP2007518164A (ja) * 2004-01-06 2007-07-05 イン−ソプ リ 自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体
US7680646B2 (en) * 2004-12-21 2010-03-16 Xerox Corporation Retrieval method for translation memories containing highly structured documents
US7536640B2 (en) * 2005-01-28 2009-05-19 Oracle International Corporation Advanced translation context via web pages embedded with resource information
US7653531B2 (en) * 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016519779A (ja) * 2013-03-15 2016-07-07 メディア マウス インコーポレイテッド 言語学習環境

Also Published As

Publication number Publication date
EP2092439A2 (en) 2009-08-26
US20080147378A1 (en) 2008-06-19
KR20090111813A (ko) 2009-10-27
WO2008070877A2 (en) 2008-06-12
WO2008070877A3 (en) 2016-06-09
AU2007329240A1 (en) 2008-06-12
CA2671771A1 (en) 2008-06-12
CN102388383A (zh) 2012-03-21

Similar Documents

Publication Publication Date Title
JP2010513997A (ja) オンラインコンピュータ支援翻訳
JP6403340B2 (ja) 引用を処理、提示、および、推奨するためのシステム、方法、および、ソフトウェア
Vaughan Web scale discovery services
US9589071B2 (en) Query suggestions from documents
US7720856B2 (en) Cross-language searching
US9053158B1 (en) Method for human ranking of search results
US20130297625A1 (en) Method and apparatus for identifiying similar questions in a consultation system
US20150200893A1 (en) Document review system
US8769392B2 (en) Searching and selecting content from multiple source documents having a plurality of native formats, indexing and aggregating the selected content into customized reports
TWI267005B (en) System, method, and computer readable medium for annotating a displayed received document without changing the received document content
BR112012012133B1 (pt) método implementado por computador, sistema e meio de armazenamento de computador para opções de pesquisa multi-idiomas
US20210342912A1 (en) Knowledgebase with work products of service providers and processing thereof
JP2014081918A (ja) 検索語自動完成機能と連動する推薦結果の提供方法
JP5247741B2 (ja) 文字入力支援装置及び方法
JP2009223372A (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
Haseli et al. The Activities of Public Libraries in the Economic Development of Society: A Systematic Review
Wang Using search engines as a retrieval tool for translating newly coined expressions and terminology between Chinese and English
Apps et al. Prototyping digital library technologies in zetoc
Metcalf Good stewards in trying times: Benchmarking peer collections of sociology reference sources using LibGuides
Sunny Evaluation of open source content management system: A comparative study
Mondal et al. Google search: A simple and free tool to detect plagiarism
Tait et al. Patent Search: An important new test bed for IR
Tumanishvili PROBLEMATIC ISSUES OF H-INDEX CAPTURING–HOW TO WRITE PAPERS AND MAKE LIFE EASIER FOR THE ALGORITHMS.
Kwiatkowski et al. Misinformation Stocks
Coe Conference Report: Bibliographical Society of Australia and New Zealand (BSANZ) 2019

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101210

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20120501