JP2018512671A - 翻訳費用を計算するためのコンピュータシステム - Google Patents

翻訳費用を計算するためのコンピュータシステム Download PDF

Info

Publication number
JP2018512671A
JP2018512671A JP2017550623A JP2017550623A JP2018512671A JP 2018512671 A JP2018512671 A JP 2018512671A JP 2017550623 A JP2017550623 A JP 2017550623A JP 2017550623 A JP2017550623 A JP 2017550623A JP 2018512671 A JP2018512671 A JP 2018512671A
Authority
JP
Japan
Prior art keywords
translation
computer system
language
original document
corrected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017550623A
Other languages
English (en)
Inventor
トーマス シンプキン,ネイル
トーマス シンプキン,ネイル
エドワード シッチ,チャールズ
エドワード シッチ,チャールズ
アレキサンダー ビアルム,ヒュー
アレキサンダー ビアルム,ヒュー
レイ,サスミタ
クマー サランガパニ,センシル
クマー サランガパニ,センシル
ウィルフレッド セルヴァラジ,ジョン
ウィルフレッド セルヴァラジ,ジョン
レスリー クームベス,ベンジャミン
レスリー クームベス,ベンジャミン
ジョン カーリー,ベン
ジョン カーリー,ベン
ライアン シンプソン,ジャスティン
ライアン シンプソン,ジャスティン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rws Translations Ltd
Original Assignee
Rws Translations Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rws Translations Ltd filed Critical Rws Translations Ltd
Publication of JP2018512671A publication Critical patent/JP2018512671A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Abstract

本開示は、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するためのコンピュータシステム、コンピュータプログラム製品、及びコンピュータ実装方法に関する。これは、元文書と原言語−目的言語ペアとを受け取るステップと、元文書を、原言語−目的言語ペアに対応する過去に翻訳されたテキスト又は翻訳メモリデータベースと比較するステップと、その比較に基づいて、元文書と過去に翻訳されたテキストとの重複程度を反映する修正単語数を計算するステップとを含む。さらに、閲覧可能なデータベース内において、原言語−目的言語ペアに対応する1単語あたり翻訳単価が特定され、及び1単語あたり翻訳単価と修正単語数とから修正翻訳費用が計算される。【選択図】図1B

Description

本発明は、翻訳メモリ解析に基づいて翻訳費用を計算するためのコンピュータシステムに関する。
本発明は、とりわけ複数の出願書類の提出が必要な場合に特許明細書の翻訳費用を計算するために特に開発されたものであり、以下では、この利用分野に関して説明する。しかし、当然のことながら、本発明は、この特定の用途に限定されず、他の文書を1つ又は複数の原語に翻訳する費用を見積もるためにも適している。
特許翻訳に関する費用見積を作成し、インボイスを作成するための現在の方法は、一般に、手作業に依存する部分の多いプロセスである。出願人は、何れの国に出願することを望むかを決定し、典型的には、自らの提案する特許出願をそれらの国で出願するためにどの程度の費用がかかるかを自らの現地代理人に問い合わせる。その後、代理人は、過去に出願された案件の平均費用に基づいて費用概算見積を手作業で作成するか、又は単純に出願人の関心対象である国で実務を行う弁理士又は代理人から、提案中の出願に関する新たな見積書を直接入手する。しかしながら、このような見積は、一般に、特にそれに関わる翻訳費用について非常に不正確である。
外国出願費用のなかで最も大きい割合を占める要素の1つは翻訳費用である。各国の特許事務所は、自国の言語に翻訳された特許明細書を必要とする。明細書が特に長い場合、翻訳費用は高額となり得る。
多数の専門の翻訳会社が存在する。これらは、典型的に、特定の言語に習熟した個人の専門翻訳者を利用して、クライアントのために特許明細書の翻訳を行う。
一部の会社は、過去に翻訳した文書を「翻訳メモリ」として保存している。特に、翻訳メモリには、過去に原言語から目的言語に翻訳された文章のペアが保存される。翻訳者が、元文書中で文章のペアの第一の文章と完全に又は部分的にマッチする文章に遭遇すると、ソフトウェアは、目的言語の第二の文章の適用を検討するように翻訳者に促す。その翻訳が容認可能であるように思える場合、それまで未翻訳の文章に翻訳労力を集中させることができるため、翻訳者の作業はより容易となる。典型的に、このような翻訳メモリソフトウェアは各翻訳から「学習」し、新しい文章ペアの各々を拡張翻訳メモリに保存する。
このような先行技術の方法の1つの欠点は、平均費用に基づく見積が非常に不正確であるという点である。ほとんどの国で翻訳費用は特許明細書のサイズによって異なる。そのため、平均費用は、計算するには事務的に比較的好都合であるものの、それは不正確となることが多く、予算策定の目的に理想的でない。
1つ又は複数の提案中の出願にとって特定のより正確な費用見積を取得することを代理人が選択した場合、これは、何れかの現実的な正確さで実現するための多大な時間及び労力を伴う。例えば、出願人が複数の国での費用見積を依頼した場合、代理人は、その全ての外国代理人に見積を作成するように書面で求め、その後、これを受け取り、出願人のために現地通貨でまとめなければならない。この事務労力は、現地代理人と外国代理人との両方に発生する。或いは、現地代理人は、各外国代理人の料金表を手作業で調べ、これらの数字から費用見積を作成することを試みる必要がある。このプロセスは長い時間を要し、現地代理人は、本来であればその時間をより高レベルの作業に充てるであろう。それに関わる時間はまた、特に提案中の出願の提出期限が迫っている場合、クライアントにも不利な影響を与える可能性がある。
先行技術の方法の別の欠点は、提案中の外国出願に関する正確な費用見積を作成するために、その工業財産に関する特定の統計又は特徴を知っている必要がある点である。例えば、特許の場合、これらの統計としては、典型的に、関連する特許明細書の単語数、その明細書のページ数及びその明細書の特許請求項の数が含まれる。この情報は、通常、担当者が明細書のページ及びその他の側面の手集計を実施し、必要な統計を集めることにより得られる。その後、担当者は、手作業により、集計した統計に対し、外国代理人によって提供された料金表から得られたそれぞれの金額を乗じる。これらのデータを手作業で見つけ、外国特許出願費用を正確に計算するプロセスは、通常、非常に面倒であるため、ほとんどの代理人/担当者は追及しきれず、したがって費用見積の正確さが損なわれる。
第一の態様では、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するためのコンピュータシステムが提供され、コンピュータシステムは、翻訳メモリアナライザ及び料金計算エンジンと通信するように適合されたインタフェースを含み、(a)インタフェースは、元文書と原言語−目的言語ペアとを受け取るように構成され、(b)翻訳メモリアナライザは、(i)元文書を、原言語−目的言語ペアに対応する翻訳メモリデータベースに保存されている元文書の言語で過去に翻訳されたテキスト部分と比較し、且つ(ii)当初単語数、及び元文書と過去に翻訳されたテキスト部分との重複程度を反映する修正単語数を返すように構成され、(c)料金計算エンジンは、(i)少なくとも修正単語数と原言語−目的言語ペアとを受け取り、(ii)料金ルールデータベース内の原言語−目的言語ペアに対応する1単語あたり翻訳料単価を特定し、且つ(iii)1単語あたり翻訳単価と修正単語数とから修正翻訳費用を計算するように構成される。
有利には、修正単語数に基づいて修正翻訳費用を計算することにより、より正確な見積が可能となる。例えば、インタフェースは、修正翻訳費用を表示するか、又は修正翻訳費用をクライアントのコンピュータに送信するように構成され得る。
料金計算エンジンは、修正単語数が当初単語数より少ないか否かをチェックし、及びこのチェックが否定である場合、料金計算エンジンは、修正単語数を当初単語数に書き換える。このようにして、誤った結果の提示が防止される。
いくつかの実施形態では、インタフェースは、クライアント側のインタフェース、例えばブラウザで実行されるアプリケーションを含む。いくつかの実施形態では、インタフェースはサーバ側で提供され、API、ウェブサービス又はhttpコンテンツストリームを利用し得る。いくつかの実施形態では、インタフェースは、例えば受け取ったデータを保存及び/又は前処理するためにサードパーティサービス(例えば、クラウドサービス)とやりとりするが、いくつかの実施形態では、また、データベース、特に翻訳メモリデータベース及び料金ルールデータベースに問い合わせることにより、呼び出されたデータを処理し、データを異なるコンポーネント間で送信し、及び/又は翻訳費用を生成する分散配置を含む。分配配置は、同様に又は代わりに、場合に応じてこれらの機能のいくつか又は全部を実行し、及び/又はサードパーティ若しくはクラウドサービスとやりとりするための1つまた複数のサーバ(物理的又は仮想)によりホストされるプラットフォームを含み得る。
当然のことながら、インタフェース、翻訳メモリアナライザ及び料金計算エンジンは、本明細書では別々のモジュールとして記載されているが、これは、いくつかの実施形態では、それぞれのモジュールの機能に関する論理的区別であり得、対象のモジュールは、共有ハードウェア又はソフトウェア、サードパーティサービス、API、ウェブサービス等の何れの組合せで実装され得る。
いくつかの実施形態では、インタフェースは、原言語−目的言語ペアを、例えばユーザが原言語と目的言語とを入力できるユーザインタフェースから明示的に受け取るように構成される。他の実施形態では、原言語−目的言語ペアは、例えば、それから原言語−目的言語ペアを導き出すことのできる情報の形態で黙示的に受け取られる。この情報としては、ユーザが翻訳費用を知ることを望む1つ又は複数の国の選択が含まれ得、原言語−目的言語ペアを受け取るステップは、1つ又は複数の国の各々からそれぞれの目的言語を導き出すステップを含み得る。目的言語(又は国)は、ユーザ識別子に関連付けて保存され、原言語−目的言語ペアを受け取るために、受け取られたユーザ識別子を使って呼び出され得る。原言語−目的言語ペアを受け取るステップは、それから原言語を導き出すことのできる情報を受け取るステップを含み得る。例えば、原言語は、元文書に関連付けられる(それに関連付けて埋め込まれるか又は保存される)メタデータから、又は元文書の識別子(例えば、特許出願の公開番号)から導き出され得る。原言語は、当然ながら、いくつかの実施形態ではユーザによる明確な原言語の入力から受け取られ得る。
いくつかの実施形態では、インタフェースは、複数の選択された原言語−目的言語ペアを受け取るように構成され、修正単語数及び翻訳費用は、各言語ペアについて生成される。例えば、元文書は特許明細書であり得、それぞれの言語ペアは、選択された特許法域に対応し得る。加えて、料金計算エンジンは、選択された特許法域における特許明細書の提出に関わる代理人手数料及び出願料を計算するようにさらに構成され得る。各言語ペアは、選択された特許法域に基づいて自動的に選択され得る。特許法域がユーザから受け取られ得、或いは事前に選択された特許法域のリストがユーザ選好データベースに保存され得る。
いくつかの実施形態では、インタフェースは、ユーザ識別子、例えば上述のものと同じユーザ識別子を受け取るように適合されている。これらの実施形態では、翻訳メモリデータベースは、複数の翻訳メモリであって、各々が関連付けられたユーザ識別子を有する複数の翻訳メモリを含む。翻訳メモリアナライザは、元文書を翻訳メモリデータベースに保存されている過去に翻訳されたテキスト部分と比較する際、受け取られたユーザ識別子に関連付けられている翻訳メモリについてのみ比較を行う。
有利には、翻訳メモリの比較をユーザ識別子に関連付けられた翻訳メモリのみで行うことにより、解析は、手元にあるテキストとより関連性があり得る翻訳メモリに限定され、なぜなら、これらは同じユーザに関連付けられているからである。したがって、この解析に伴う処理負荷は、より対象を絞った解析を実行することにより軽減できる。例えば、このようにして、マッチする翻訳メモリを探すのにかかる時間を大幅に削減できる。
別の態様では、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するコンピュータ実装方法が提供され、この方法は、元文書と原言語−目的言語ペアとを受け取るステップと、元文書を、原言語−目的言語ペアに対応する翻訳メモリデータベースに保存されている元文書の言語で過去に翻訳されたテキスト部分と比較するステップと、その比較に基づいて、元文書と過去に翻訳されたテキスト部分との重複程度を反映する修正単語数を計算するステップと、料金ルールデータベース内の原言語−目的言語ペアに対応する1単語あたり翻訳料単価を特定するステップと、1単語あたり翻訳料単価と修正単語数とから修正翻訳費用を計算するステップとを含む。
別の態様は、コンピュータプログラム製品、このようなコンピュータプログラム製品を具現化する有形コンピュータ可読媒体、このようなコンピュータプログラム製品をコード化するキャリア信号及びコンピュータシステムを提供し、これらは、全て上述され且つ後述の方法に関する従属請求項にさらに詳細に記載されている方法を実施するためのものである。
これらの態様の何れかのいくつかの実施形態では、翻訳メモリデータベースに加えて用語データベースが提供される。用語データベースは、翻訳メモリデータベースと同様の目的に役立つものであるが、過去の翻訳に基づくのではなく、これは翻訳で使用される用語(単語、語句等)の事前に決定された原言語−目的言語テキストペアを含んでいる。これらの実施形態では、翻訳費用を計算するステップ及び/又は単語数を推測するステップは、翻訳メモリと用語データベースとの両方に問い合わせるステップと、結果を適当なロジックと組み合わせる(例えば、用語データベースの翻訳ペアで用語データベースの翻訳ペアを書き換える)ステップと、用語データベースが使用されない実施形態と同様の方法で(例えば、何れかのデータベースにマッチが見つかった場合に単語数を減らす)費用/修正単語数を予測するステップとを含む。各々がユーザ識別子に関連付けられた(又はユーザ識別子との関連付けは記録若しくは表に基づき得る)複数の用語データベースが提供され得、それにより、修正単語数/費用は、上述の実施形態の複数の翻訳メモリと同様の方法で、カスタム化された用語データベースに基づく。
以下の詳細な説明では、特許請求される主題を十分に理解できるようにするために多くの具体的な詳細が記載されている。しかしながら、当業者であればわかるように、特許請求される主題は、これらの具体的な詳細なしに実行できる。別の場合、よく知られている方法、手順、コンポーネント及び/又は回路について詳細に説明されない。
以下の詳細な説明のいくつかの部分は、コンピューティングシステム、例えばコンピュータ及び/又はコンピューティングシステムメモリに保存されたデータビット及び/又はバイナリデジタル信号に対する動作のアルゴリズム及び/又は記号的表現で提示される。これらのアルゴリズムによる記述及び/又は表現は、データ処理技術の当業者が他の当業者にその作業の内容を伝えるために用いる技術である。アルゴリズムは、ここではまた一般に、所望の結果を導く自己無撞着動作シーケンス及び/又は同様の処理と考えられる。動作及び/又は処理には、物理的数量を物理的に扱うことが関わり得る。典型的に、ただし必ずではないが、これらの数量は、保存、伝送、複合、比較及び/又はその他の方法で操作できる電気及び/又は磁気信号の形態をとり得る。場合により、主として一般的用法を理由として、これらの信号は、ビット、データ、値、要素、記号、文字、項、数字、数詞及び/又はその他として言及すると好都合であることがわかっている。しかしながら、これら及び同様の用語は、全て適当な物理的数量に関連付けられ、便利なラベルにすぎないことを理解すべきである。
特に明確な別段の記載がないかぎり、以下の説明から明らかであるように、当然のことながら、本明細書全体を通じて、「処理」、「コンピューティング」、「計算」、「決定」及び/又はその他の用語を用いる説明は、コンピューティングプラットフォーム、例えばコンピュータ又は同様の電子コンピューティングデバイスの動作及び/又はプロセスを指し、これらはコンピューティングプラットフォームのプロセッサ、メモリ、レジスタ及び/又はその他の情報記憶、伝送、並びに/又は入力及び表示デバイス内において、物理的な電子及び/若しくは磁気数量並びに/又はその他の物理的数量として提示されるデータを操作及び/又は変形させる。
実施形態は、ハードウェアにおけるものであり得、例えば、デバイス又はデバイスの組合せ上で動作するように実装されるなどし得、それに対して、別の実施形態はソフトウェアにおけるものであり得る。実施形態はファームウェアでも、又は例えばハードウェア、ソフトウェア及び/若しくはファームウェアの何れの組合せで実装され得る。同様に、特許請求される主題は、範囲においてこの点で限定されないが、実施形態は1つ又は複数の物品、例えば1つ又は複数のキャリア又は記憶媒体を含み得る。記憶媒体、例えば1つ又は複数のCD−ROM、ソリッドステートメモリ、磁気光ディスク及び/又は磁気ディスク若しくはテープは、その上に命令が記憶され得、これは、システム、例えばコンピュータシステム、コンピューティングプラットフォーム又はその他のシステムにより実行されると、特許請求される主題による方法のある実施形態、例えば前述の実施形態のうちの1つが実行され得る。実施形態は、電気通信媒体、例えば電気通信ネットワーク上のキャリア信号を含み得る。適当なキャリア信号の例には、無線周波数信号、光信号及び/又は電気信号が含まれる。
1つの考え得る例として、コンピューティングプラットフォーム又はコンピュータシステムは、1つ又は複数の処理ユニット又はプロセッサ、1つ又は複数の入力/出力デバイス、例えばディスプレイ、キーボード、及び/又はマウス、及び/又は1つ又は複数のメモリ、例えばスタティックランダムアクセスメモリ、ダイナミックランダムアクセスメモリ、フラッシュメモリ、及び/又はハードドライブを含み得る。
疑義の発生を防止するために付記すると、当然のことながら、コンピュータ、コンピュータシステム又はコンピュータプラットフォーム若しくは装置への言及は、単独の物理的実体又は1つの機器に限定するのではなく、分散型コンピュータシステム、例えばネットワークコンポーネントも同様に含んでいる。
ここで、あくまでも例として、下記のような添付の図面を参照しながら実施形態を説明する。
図1Aは、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するためのコンピュータシステムのブロック図である。 図1Bは、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するためのコンピュータシステムのブロック図である。 図1Cは、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するためのコンピュータシステムのブロック図である。 図2は、翻訳メモリに基づいて修正単語数を生成するプロセスを説明するフロー図である。 図3は、修正単語数に基づいて翻訳費用を計算するプロセスを説明するフロー図である。 図4は、翻訳費用を表示するためのインタフェースのスクリーンショットである。 図5は、修正単語数を生成させるための例示的なウェブサービスでのリクエストである。 図6は、修正単語数の数を返す例示的なウェブサービスでのレスポンスである。 図7は、複数の言語ペアに関して返された修正単語数を報告する例示的なインタフェースのスクリーンショットである。
説明及び特許請求の範囲では、「国」という用語は、知的財産権又は知的財産権のための出願が関係する法域を指す。当然のことながら、文脈上明らかに他の解釈が必要な場合を除き、国という用語は、そのような知的財産権がそのような地域又は国にも拡張又は適用される性質のものである場合、「地域」又は複数の国も含むものとする。
説明及び特許請求の範囲では、「知的財産」及び「工業財産」という用語は、互換的に使用されており、何れも「IP」と省略される。
説明及び特許請求の範囲では、「特許明細書」という用語は、様々な言語に翻訳される予定の文書を示すために使用されている。当然のことながら、文脈上明らかに他の解釈が必要な場合を除き、この用語はまた、1つ又は複数の言語に翻訳される予定である、自動化された翻訳料を計算すべきあらゆる文書を含むものとする。
図1Aを参照すると、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するためのコンピュータシステム1は、翻訳メモリアナライザ3及び料金計算エンジン4と通信するように適合されたインタフェース2を含む。翻訳メモリアナライザ3は、多数の過去の翻訳(図示せず)を記憶する翻訳メモリデータベース5と通信する。いくつかの実施形態では、過去の翻訳は、それぞれ1つ又は複数の原言語−目的言語ペアに対応する原言語及び目的言語のテキスト部分(例えば、文章)のペアを含む。いくつかの実施形態では、翻訳メモリデータベースが費用見積の目的のためにのみ保持される場合、原言語のテキスト部分のみが記憶され得、これは、比較目的のために十分であり得るからである。料金計算エンジン4は、多くの料金ルール(図示せず)が記憶されている料金ルールデータベース6と通信する。各料金ルールには、特定の原言語−目的言語ペアの1単語あたり翻訳料単価が含まれ、好ましくは、特許庁及びこれらの出願を担当する外国特許代理人に支払われる特許出願手数料に関するルールも含まれる。
好ましい実施形態では、インタフェース2は、国選択フィールド9を介した複数の国選択肢と共に、識別子受取フィールド8を介してIP識別子7を受け取るように設計される。
いくつかの実施形態では、インタフェースは、クライアントコンピュータ上のウェブブラウザで実装され、翻訳メモリアナライザ3及び料金計算エンジン4は、通信ネットワーク上でクライアントコンピュータと通信する1つ又は複数のサーバコンピュータで実装される。他の実施形態では、インタフェース2は、翻訳メモリアナライサ及び料金計算エンジン4にローカル接続される。
図1Bを参照すると、いくつかの実施形態では、インタフェース2は、通信インタフェースサーバ側として、例えば翻訳メモリアナライザ3及び料金計算エンジン4と同じサーバ上で実装される。これらの実施形態では、インタフェース2は、通信ネットワーク、例えばインターネット上でウェブブラウザクライアント側と通信し、ウェブブラウザに、図1Aに関して上で説明したインタフェースに対応するブラウザウィンドウ2aを表示させる。
図1Cを参照すると、いくつかの実施形態では、用語アナライザ3a及び用語データベース5aがある。用語アナライザ3aは、用語データベース5aに対して翻訳メモリアナライザと同様の方法で動作して自動翻訳を決定する。自動翻訳は、何れの適当な方法でも、例えば全てのマッチを使って組み合わせられ得、用語データベース内のマッチに翻訳メモリデータベース内のそれらが書き換えられる。したがって、料金計算の目的のために、何れかのデータベースがマッチを提供する場合、減らされた単語数が返され得る。いくつかの実施形態では、用語アナライザ3aが翻訳メモリアナライザ3に連結されてこの機能を実行する。他の実施形態では、各アナライザ3、3aは別々にインタフェース2に接続され、そこで個々の結果が組み合わされる。いくつかの実施形態では、両方のアナライザ3、3aの機能は、1つのモジュール、例えば翻訳メモリアナライザ3又はインタフェース2に組み込まれる。
インタフェース2は、様々な方法で、例えば上述のように実装され得る。加えて、特に図1B及び1Cに関連して上述した実施形態に関して、インタフェース2自体は、例えば完全にサーバ(物理的又は仮想)上でホストされるか、1つ又は複数のサーバ(物理的又は仮想)を含むプラットフォーム上でホスト若しくはコホストされたプラットフォームとしてか、それ自体で若しくはシステムの他のモジュールと共にか、ユーザインタフェースの表示が行われるようにすることのできるクライアントコンピュータから受け取ったデータを記憶及び/又は前処理するために使用されるサードパーティサービスによるか、又はこれらの方式の組合せによるなど、様々な方法で実装され得る。
より一般的には、当然のことながら、全てのモジュール及び機能、特に翻訳メモリアナライザ3(該当する場合には用語アナライザ3a)、料金計算エンジン4、図1A〜1Cに関連して上述したインタフェース2、翻訳メモリデータベース5(該当する場合には用語データベース5a)及び料金ルールデータベース6は、それぞれのプロセッサ及び/又はコンピュータ内のこれらの要素の実際の物理的実装に対応し得、又は全てが同じプロセッサ及び/又はコンピュータシステム上で実装され得るか、若しくは各種のプロセッサ及びコンピュータシステム間で分散され得る機能ブロックに対応し得る。
図2は、翻訳メモリ解析に基づいて翻訳費用を自動的に計算するシステムにより実行されるステップを示す。コンピュータシステム1は、特許明細書(図示せず)の電子コピーを受け取る11。1つの実施形態では、コンピュータシステムは、特許明細書の電子コピーをインタフェースのアップロード部10を介してユーザから受け取る。代替的な実施形態では、コンピュータシステム1は、特許明細書の電子コピーをオンラインデータベース(図示せず)から受け取る。
その後、システムは、翻訳対象の特許明細書の単語数を反映する当初単語数を計算する12。次に、翻訳メモリアナライザ3は、その明細書を、第一の言語ペアに関する翻訳メモリデータベース5に保存されている過去の翻訳と比較し13、その言語ペアに関する修正単語数を生成する14。修正単語数は、翻訳対象の明細書と過去の翻訳との間の重複程度を反映している。上述のように、用語データベース及びアナライザの機能も有する実施形態では、修正単語数は、翻訳メモリとの重複程度、及び元文書中の用語と語句とが用語データベース内に存在する程度を反映し得る。その後、翻訳メモリアナライザ5は、国選択フィールド9を介して受け取った選択された国に対応する各言語(これが該当する実施形態では用語データベースを考慮する)について解析15を繰り返し、料金計算エンジン4に(各ペアに関する)当初及び修正単語数を提供する16。
複数の言語ペアにおける修正単語数を求める例示的なシステムリクエスト17が図5に示されている。この例では、原言語18は英語(“en−GB)であり、11の目的言語19がある。各目的言語は、翻訳対象言語及び特許明細書を提出する国の参照記号を含んでいる。例えば、「ko−KR」は、明細書を韓国語に翻訳し、韓国で出願する予定であることを意味する。「es−MX」は、明細書をスペイン語に翻訳し、メキシコで出願する予定であることを意味する。
1つの実施形態では、翻訳対象言語は、選択された国に基づいて自動的に決定される。例えば、国選択フィールド9で韓国を選択すると、翻訳対象言語が韓国語であることを自動的に決定できる。
図6は、本発明の実施形態により、多数の修正単語数20を返す例示的なウェブサービスでのレスポンス19を示す。図のように、この特定のPCT明細書に関して、当初単語数21は11,964であったが、英語からウクライナ語の翻訳メモリに基づくと、その言語ペアの修正単語数20は11,692であった。
別の例として、当初及び修正単語数を生成する際、いくつかの実施形態では、システムはまた、各言語ペアについて当初単語数21及び修正単語数20を示す報告用電子メール22も作成する。
次に図3を参照すると、各言語ペアについて当初単語数21及び修正単語数20が翻訳メモリアナライザ(いくつかの実施形態では用語アナライザと共に)により生成されると、料金計算エンジン4は、修正単語数20と第一の原言語−目的言語ペアとを受け取る23。その後、料金計算エンジン4は、料金ルールデータベース6から第一の原言語−目的言語ペアに対応する1単語あたり翻訳料単価を特定し24、当初単語数21及び1単語あたり翻訳料単価に基づいて当初翻訳料27を計算する25。
次に、料金計算エンジン4は、その第一の言語ペアに関する修正翻訳料28を修正単語数20及び1単語あたり翻訳料単価に基づいて計算する26。その後、料金計算エンジン4は、これら2つの差29を計算し35、各種の翻訳料をインタフェース2に返す30。料金計算エンジン4は、修正単語数が当初単語数より少ないか否かを、例えばステップ23、24若しくは25の一部として、又はその後にチェックし、チェックの結果が肯定である場合、上述のように進む。チェックの結果が否定である場合、ステップ26及びステップ35はスキップされ、ステップ30で関連する原言語−目的言語ペアに関する当初翻訳料のみが返される。
図4は、インタフェース2のスクリーンショットを示し、多数の言語ペア31に関して当初翻訳料27、修正翻訳料28及び差29が表示されている。
スクリーンショットはまた、計算された代理人手数料32及び特許庁から請求される出願料33も含んでいる。これらの料金は、料金計算エンジンによってページ数、クレーム数、先行技術文献数及びその他の「明細書統計」を考慮して計算されたものである。
1つの実施形態では、国の選択はユーザからインタフェース2で受け取る。別の実施形態では、選択は、そのユーザが通常出願する選好国を記憶するユーザ選好データベースから受け取る。
いくつかの実施形態では、翻訳メモリは、特定のユーザ、アカウント又は会社に固有のものである。その実施形態では、インタフェース2は、ユーザからユーザ識別子を受け取るように設計される。翻訳メモリデータベース5は、各々が関連付けられたユーザ識別子を有する多数の翻訳メモリを含み、それにより、翻訳メモリアナライザは、元文書を翻訳メモリデータベースに保存されていた過去の翻訳と比較する際、受け取られたユーザ識別子に関連付けられた翻訳メモリについてのみ比較を行う。
上述の実施形態は、読者がこれらの実施形態の構造及び機能を理解するのを支援するために例示的に示されている。読者はまた、特に本明細書中の教示の利点を考えると、実施形態の様々な特徴及び機能が選択的に組み合わされて利用でき、又はある実施形態の正確な実施の具体的事項に応じて互換可能若しくは省略可能であることもわかるであろう。本発明者らが例示的実施形態を提供する意図は、本発明の実施を実証することであり、これらの特徴及び機能を追加し、置き換え、又は他の考えられる実施形態から省略できないことを黙示することではない。
本発明を具体的な例に関して説明したが、当業者であればわかるように、本発明は他の様々な形態で実施され得、これにはデバイス、システム及び方法として具現化されるものを含むがこれらに限定されない。

Claims (21)

  1. 翻訳メモリ解析に基づいて翻訳費用を自動的に計算するためのコンピュータシステムにおいて、翻訳メモリアナライザ及び料金計算エンジンと通信するように適合されたインタフェースを含み、
    (a)前記インタフェースは、元文書と原言語−目的言語ペアとを受け取るように構成され、
    (b)前記翻訳メモリアナライザは、
    (i)前記元文書を、前記原言語−目的言語ペアに対応する翻訳メモリデータベースに保存されている前記元文書の言語で過去に翻訳されたテキスト部分と比較し、且つ
    (ii)当初単語数、及び前記元文書と前記過去に翻訳されたテキスト部分との重複程度を反映する修正単語数を返す
    ように構成され、
    (c)前記料金計算エンジンは、
    (i)少なくとも前記修正単語数と前記原言語−目的言語ペアとを受け取り、
    (ii)料金ルールデータベース内の前記原言語−目的言語ペアに対応する1単語あたり翻訳料単価を特定し、且つ
    (iii)前記1単語あたり翻訳単価と前記修正単語数とから修正翻訳費用を計算する
    ように構成されることを特徴とするコンピュータシステム。
  2. 請求項1に記載のコンピュータシステムにおいて、前記料金計算エンジンは、前記修正翻訳費用を、前記修正翻訳費用を表示するか、又は前記修正翻訳費用をクライアントコンピュータに送信するように構成される前記インタフェースに提供するように構成されることを特徴とするコンピュータシステム。
  3. 請求項1又は2に記載のコンピュータシステムにおいて、前記料金計算エンジンは、前記修正単語数が前記当初単語数より少ないか否かをチェックし、及び前記チェックが否定である場合、前記料金計算エンジンは、前記修正単語数を前記当初単語数に書き換えることを特徴とするコンピュータシステム。
  4. 請求項1乃至3の何れか1項に記載のコンピュータシステムにおいて、前記インタフェースは、複数の選択された原言語−目的言語ペアを受け取るようにさらに構成され、前記翻訳メモリアナライザは、各言語ペアについて修正単語数を生成するように構成され、前記料金計算エンジンは、各言語ペアについて修正翻訳費用を計算するように構成されることを特徴とするコンピュータシステム。
  5. 請求項1乃至4の何れか1項に記載のコンピュータシステムにおいて、前記元文書は特許明細書であり、それぞれの選択された言語ペアは、選択された特許法域に対応し、
    前記料金計算エンジンは、前記選択された特許法域内で前記特許明細書を出願するための代理人手数料及び出願料を計算するようにさらに構成されることを特徴とするコンピュータシステム。
  6. 請求項5に記載のコンピュータシステムにおいて、各言語ペアは、前記選択された特許法域に基づいて自動的に選択されることを特徴とするコンピュータシステム。
  7. 請求項5又は6に記載のコンピュータシステムにおいて、前記インタフェースは、
    (a)ユーザ、又は
    (b)ユーザ選好データベースに保存されている事前に選択された特許法域のリスト
    から前記選択された特許法域を受け取るように適合されていることを特徴とするコンピュータシステム。
  8. 請求項1乃至7の何れか1項に記載のコンピュータシステムにおいて、前記インタフェースは、ユーザ識別子を受け取るようにさらに適合されており、前記翻訳メモリデータベースは、複数の翻訳メモリであって、各々が関連付けられたユーザ識別子を有する複数の翻訳メモリを含み、それにより、前記翻訳メモリアナライザは、前記元文書を翻訳メモリデータベースに保存されている過去に翻訳されたテキストと比較する際、前記受け取られたユーザ識別子に関連付けられている翻訳メモリについてのみ比較を行うことを特徴とするコンピュータシステム。
  9. 翻訳メモリ解析に基づいて翻訳費用を自動的に計算するコンピュータ実装方法において、
    元文書と原言語−目的言語ペアとを受け取るステップと、
    前記元文書を、前記原言語−目的言語ペアに対応する翻訳メモリデータベースに保存されている前記元文書の言語で過去に翻訳されたテキスト部分と比較するステップと、
    前記比較に基づいて、前記元文書と前記過去に翻訳されたテキスト部分との重複程度を反映する修正単語数を計算するステップと、
    料金ルールデータベース内の前記原言語−目的言語ペアに対応する1単語あたり翻訳料単価を特定するステップと、
    前記1単語あたり翻訳料単価と前記修正単語数とから修正翻訳費用を計算するステップと
    を含むことを特徴とする方法。
  10. 請求項9に記載の方法において、前記修正翻訳費用を、前記修正翻訳費用を表示するか、又は前記修正翻訳費用をクライアントコンピュータに送信するように構成されるインタフェースに提供するステップを含むことを特徴とする方法。
  11. 請求項9又は10に記載の方法において、前記修正単語数が当初単語数より少ないか否かをチェックするステップと、前記チェックが否定である場合、前記修正単語数を前記当初単語数に書き換えるステップとを含むことを特徴とする方法。
  12. 請求項9乃至11の何れか1項に記載の方法において、複数の選択された原言語−目的言語ペアを受け取るステップと、各言語ペアについて修正単語数を生成するステップと、各言語ペアについて修正翻訳費用を計算するステップとを含むことを特徴とする方法。
  13. 請求項9乃至12の何れか1項に記載の方法において、前記元文書は特許明細書であり、それぞれの選択された言語ペアは、選択された特許法域に対応し、
    前記方法は、前記選択された特許法域内で前記特許明細書を出願するための代理人手数料及び出願料を計算するステップをさらに含むことを特徴とする方法。
  14. 請求項13に記載の方法において、各言語ペアは、前記選択された特許法域に基づいて自動的に選択されることを特徴とする方法。
  15. 請求項13又は14に記載の方法において、
    (a)ユーザ、又は
    (b)ユーザ選好データベースに保存されている事前に選択された特許法域のリスト
    から前記選択された特許法域を受け取るステップを含むことを特徴とする方法。
  16. 請求項9乃至15の何れか1項に記載の方法において、前記翻訳メモリデータベースは、複数の翻訳メモリであって、各々が関連付けられたユーザ識別子を有する複数の翻訳メモリを含み、前記方法は、ユーザ識別子を受け取るステップを含み、前記元文書を前記翻訳メモリデータベースに保存されている過去の翻訳と比較するステップは、前記元文書を、前記受け取られたユーザ識別子に関連付けられている翻訳メモリに保存されている過去に翻訳されたテキストと比較するステップを含むことを特徴とする方法。
  17. コンピュータプログラム製品において、プロセッサで実行されると、請求項9乃至16の何れか1項に記載の方法を実施するコード化された命令を含むことを特徴とするコンピュータプログラム製品。
  18. 有形コンピュータ可読媒体において、請求項17に記載のコンピュータプログラム製品を具現化することを特徴とする有形コンピュータ可読媒体。
  19. キャリア信号において、請求項17に記載のコンピュータプログラム製品をコード化することを特徴とするキャリア信号。
  20. コンピュータシステムにおいて、請求項9乃至16の何れか1項に記載の方法を実施するように構成されたプロセッサを含むことを特徴とするコンピュータシステム。
  21. コンピュータシステムにおいて、請求項9乃至16の何れか1項に記載の方法を実施するための手段を含むことを特徴とするコンピュータシステム。
JP2017550623A 2015-03-25 2016-03-24 翻訳費用を計算するためのコンピュータシステム Pending JP2018512671A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1505079.2 2015-03-25
GBGB1505079.2A GB201505079D0 (en) 2015-03-25 2015-03-25 Computer system for calculating translation costs
PCT/GB2016/050844 WO2016151333A1 (en) 2015-03-25 2016-03-24 Computer system for calculating translation costs

Publications (1)

Publication Number Publication Date
JP2018512671A true JP2018512671A (ja) 2018-05-17

Family

ID=53052408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017550623A Pending JP2018512671A (ja) 2015-03-25 2016-03-24 翻訳費用を計算するためのコンピュータシステム

Country Status (9)

Country Link
US (1) US20180108053A1 (ja)
EP (1) EP3274947A1 (ja)
JP (1) JP2018512671A (ja)
KR (1) KR20170131528A (ja)
CN (1) CN107430737A (ja)
AU (1) AU2016238601A1 (ja)
CA (1) CA2980668A1 (ja)
GB (1) GB201505079D0 (ja)
WO (1) WO2016151333A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10977288B2 (en) 2019-02-06 2021-04-13 International Business Machines Corporation Methods and systems for managing content translations

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10372828B2 (en) * 2017-06-21 2019-08-06 Sap Se Assessing translation quality
CN109918683A (zh) * 2019-03-05 2019-06-21 广东机电职业技术学院 一种语言分析系统及方法
CN110298773A (zh) * 2019-06-26 2019-10-01 深圳数大软件有限公司 一种律师服务费用定价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269285A (ja) * 1997-03-25 1998-10-09 Toshiba Corp 文書変換料決定方法及び文書変換サービスシステム
JP2011180978A (ja) * 2010-03-03 2011-09-15 Ricoh Co Ltd 翻訳支援装置及び翻訳支援プログラム
JP2012181571A (ja) * 2011-02-28 2012-09-20 Ricoh Co Ltd 翻訳支援装置、翻訳納期設定方法及びプログラム
JP2013543166A (ja) * 2010-09-16 2013-11-28 イノヴィア ホールディングス プロプライエタリー リミテッド 国毎の料金を計算するためのコンピュータシステム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708480A (zh) * 2005-05-03 2012-10-03 Pctfiler控股有限公司 用于分发确认指示消息的计算机系统
US8442856B2 (en) * 2010-03-03 2013-05-14 Ricoh Company, Ltd. Translation support apparatus and computer-readable storage medium
US10417646B2 (en) * 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269285A (ja) * 1997-03-25 1998-10-09 Toshiba Corp 文書変換料決定方法及び文書変換サービスシステム
JP2011180978A (ja) * 2010-03-03 2011-09-15 Ricoh Co Ltd 翻訳支援装置及び翻訳支援プログラム
JP2013543166A (ja) * 2010-09-16 2013-11-28 イノヴィア ホールディングス プロプライエタリー リミテッド 国毎の料金を計算するためのコンピュータシステム
JP2012181571A (ja) * 2011-02-28 2012-09-20 Ricoh Co Ltd 翻訳支援装置、翻訳納期設定方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10977288B2 (en) 2019-02-06 2021-04-13 International Business Machines Corporation Methods and systems for managing content translations

Also Published As

Publication number Publication date
US20180108053A1 (en) 2018-04-19
AU2016238601A1 (en) 2017-10-05
WO2016151333A1 (en) 2016-09-29
KR20170131528A (ko) 2017-11-29
CA2980668A1 (en) 2016-09-29
EP3274947A1 (en) 2018-01-31
CN107430737A (zh) 2017-12-01
GB201505079D0 (en) 2015-05-06

Similar Documents

Publication Publication Date Title
CA3033825C (en) System and method for selecting data sample groups for machine learning of context of data fields for various document types and/or for test data generation for quality assurance systems
US10902191B1 (en) Natural language processing techniques for generating a document summary
Lee et al. Redlistr: tools for the IUCN Red Lists of ecosystems and threatened species in R
AU2014257335B2 (en) Systems and methods for predicting revenue for web-based content
US11238507B2 (en) Extracting, validating, and correcting item attribute values in a database
EP3381158B1 (en) Machine learning based identification of broken network connections
US20190187959A1 (en) System, method, and recording medium for validating computer documentation
JP2018512671A (ja) 翻訳費用を計算するためのコンピュータシステム
US20160378748A1 (en) System and method for ensuring the quality of a human translation of content through real-time quality checks of reviewers
US20200065912A1 (en) Expense validator
US11562400B1 (en) Uplift modeling
US20130271466A1 (en) Determining scaling factors for devices
US10664653B2 (en) Automated structured cloud datatester
CN110222096A (zh) 区块链上信息点击评论数据的查询方法和用户设备
US11966711B2 (en) Translation verification and correction
US20230123979A1 (en) Systems and methods for sending claim status requests
US20180068122A1 (en) Transmission of trustworthy data
US20220245460A1 (en) Adaptive self-adversarial negative sampling for graph neural network training
US20150294254A1 (en) Dynamic and intelligent multi-triggered item revalidation based on projected return on investment
US11354361B2 (en) Document discrepancy determination and mitigation
CN111126649A (zh) 用于生成信息的方法和装置
US20230093666A1 (en) Removing data having a data type from a data set
US11928153B2 (en) Multimedia linked timestamp validation detection
US11694026B2 (en) Recognizing transliterated words using suffix and/or prefix outputs
US8793229B1 (en) Management of legal documents for transactions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200804