JP2022017173A - 情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム - Google Patents

情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム Download PDF

Info

Publication number
JP2022017173A
JP2022017173A JP2021051105A JP2021051105A JP2022017173A JP 2022017173 A JP2022017173 A JP 2022017173A JP 2021051105 A JP2021051105 A JP 2021051105A JP 2021051105 A JP2021051105 A JP 2021051105A JP 2022017173 A JP2022017173 A JP 2022017173A
Authority
JP
Japan
Prior art keywords
sentence
chinese
foreign language
variable
translation target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021051105A
Other languages
English (en)
Inventor
リー、モンチャオ
Mengzhao Li
チャン、チュン
Chung Chan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022017173A publication Critical patent/JP2022017173A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

【課題】文ペアセットから、翻訳対象文とマッチングする外国語文を確定し、翻訳対象文に基づいて外国語文を最適化することによって、翻訳の対象となるフロントエンドでJavaScriptによってレンダリングされたコピーライティング、バックエンドからのエラーメッセージおよび戻りデータの翻訳文をより流暢にする方法、装置、プログラム及び記憶媒体を提供する。【解決手段】情報を出力するための方法は、翻訳対象文を取得し201、中国語文及び対応する外国語文を含む事前設定された文ペアセットから、翻訳対象文とマッチングする外国語文を確定し202、翻訳対象文および確定された外国語文に基づいて、翻訳対象文のターゲット外国語文を確定し203、ターゲット外国語文を出力する204。【選択図】図2

Description

本出願は、コンピュータ技術の分野、具体的にはウェブページ処理、自然言語処理、およびクラウドコンピューティングの分野、特に情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラムに関する。
スマートデバイスの開発に伴い、スマートオペレーティングシステムはますます多様化になっており、これらのシステムを統合したスマートデバイスはますます多くのユーザに使用され始めている。ユーザはこれらのデバイスをゲーム、ソーシャル、読書などの日常的な活動に使用する。
スマートデバイスの販売量の増加に伴い、これらの製品を使用する外国人ユーザがいるため、これらの製品を提供するウェブページを翻訳する必要がある。翻訳の対象となる内容は、フロントエンドでJavaScriptによってレンダリングされたコピーライティング、並びにバックエンドからのエラーメッセージおよび戻りデータを含む。従来の翻訳方式は、これらの文についての翻訳結果が非常に不自然である。
情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラムが提供される。
第1態様において、翻訳対象文を取得するステップと、中国語文および対応する外国語文を含む事前設定された文ペアセットから、翻訳対象文とマッチングする外国語文を確定するステップと、翻訳対象文と確定された外国語文とに基づいて、翻訳対象文のターゲット外国語文を確定するステップと、ターゲット外国語文を出力するステップと、を含む、情報を出力するための方法を提供する。
第2態様において、翻訳対象文を取得するように構成された取得ユニットと、中国語文および対応する外国語文を含む事前設定された文ペアセットから、翻訳対象文とマッチングする外国語文を確定するように構成されたマッチングユニットと、翻訳対象文と確定された外国語文とに基づいて、翻訳対象文のターゲット外国語文を確定するように構成された確定ユニットと、ターゲット外国語文を出力するように構成された出力ユニットと、を含む、情報を出力するための装置を提供する。
第3態様において、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含み、メモリには、少なくとも1つのプロセッサによって実行可能な指令が格納されており、指令が少なくとも1つのプロセッサによって実行されると、少なくとも1つのプロセッサに第1態様に記載の方法を実行させる、情報を出力するための電子機器を提供する。
第4態様において、第1態様に記載の方法をコンピュータに実行させるためのコンピュータ指令を格納している非一時的コンピュータ可読記憶媒体を提供する。
第5態様において、プロセッサにより実行されると、第1態様に記載の方法を実現する、コンピュータプログラムを提供する。
本出願の技術によれば、文ペアセットから、翻訳対象文とマッチングする外国語文を確定し、翻訳対象文に基づいて外国語文を最適化して、取得されたターゲット翻訳文をより流暢にすることができる。
このセクションで説明される内容は、本出願の実施形態の主要または重要な特徴を特定することを意図するものではなく、本出願の範囲を限定することを意図するものでもないことを理解すべきである。本出願の他の特徴は、以下の説明から容易に理解される。
図面は、本実施形態をよりよく理解するために使用されており、本出願を限定するものではない。
本出願の一実施形態が適用され得る例示的なシステムアーキテクチャ図である。 本出願に係る情報を出力するための方法の一実施形態のフローチャートである。 本出願に係る情報を出力するための方法の応用シーンの概略図である。 本出願に係る情報を出力するための方法の別の実施形態のフローチャートである。 本出願に係る情報を出力するための方法の別の実施形態のフローチャートである。 本出願に係る情報を出力するための方法における文ペアセットを確定するためのフローチャートである。 本出願に係る情報を出力するための装置の一実施形態の構造概略図である。 本出願の実施形態に係る情報を出力するための方法を実現するための電子機器のブロック図である。
以下は図面を参照して本出願の例示的な実施形態を説明し、ここでは理解を助けるため、本出願の実施形態の様々な詳細が記載されるが、これらは単なる例示であるに過ぎない。従って、本出願の範囲および要旨を逸脱しない限り、当業者が本明細書の実施形態に対して様々な変更と修正を行うことができることを理解すべきである。なお、以下の説明では、明確化および簡略化のため、公知の機能および構成については説明を省略する。
なお、本出願の実施形態および実施形態における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、図面および実施形態を参照しながら本出願を詳細に説明する。
図1は、本出願が適用され得る、情報を出力するための方法または情報を出力するための装置の実施形態の例示的なシステムアーキテクチャ100を示す。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103、ネットワーク104、およびサーバ105を含み得る。ネットワーク104は、端末装置101、102、103とサーバ105との間の通信リンクを提供するための媒体である。ネットワーク104は、有線、無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含み得る。
ユーザは、メッセージを送受信する等のために、端末装置101、102、103を使用して、ネットワーク104を介してサーバ105と情報のやり取りをすることができる。端末装置101、102、103には、ウェブブラウジングアプリケーション、ショッピングアプリケーション、ソーシャルプラットフォームアプリケーション、音声認識アプリケーションなどの様々な通信クライアントアプリケーションがインストールされ得る。
端末装置101、102、103は、ハードウェアでもよく、ソフトウェアでもよい。端末装置101、102、103は、ハードウェアである場合、様々な電子機器であり得、スマートフォン、タブレットコンピュータ、電子書籍リーダ、車載コンピュータ、ラップトップポータブルコンピュータ、デスクトップコンピュータなどを含むがこれらに限定されない。端末装置101、102、103は、ソフトウェアである場合、上記に挙げた電子機器にインストールされ得、複数のソフトウェアまたはソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実装されてもよく、または単一のソフトウェアまたはソフトウェアモジュールとして実装されてもよい。ここでは特に限定しない。
サーバ105は、端末装置101、102、103から返送されたウェブページ内の文を翻訳するバックエンドサーバなど、様々なサービスを提供するサーバであり得る。バックエンドサーバは、ユーザに返送されたウェブページを取得し、ウェブページ内の文を翻訳し、翻訳により得られた外国語文を端末装置101、102、103にフィードバックすることができる。
なお、サーバ105は、ハードウェアでもよく、ソフトウェアでもよい。サーバ105は、ハードウェアである場合、複数のサーバからなる分散サーバクラスタとして実装されてもよく、単一のサーバとして実装されてもよい。サーバ105は、ソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実装されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実装されてもよい。ここでは特に限定しない。
なお、本出願の実施形態によって提供される情報を出力するための方法は、通常に、サーバ105によって実行される。それに応じて、情報を出力するための装置は、通常に、サーバ105に設置される。
図1中の端末装置、ネットワーク、およびサーバの数は、単なる例示であることを理解すべきである。実装の必要性に応じて、端末装置、ネットワーク、およびサーバの数が任意に設定され得る。
さらに図2を参照すると、図2は、本出願に係る情報を出力するための方法の一実施形態のプロセス200を示す。本実施形態に係る情報を出力するための方法は、以下のステップを含む。
ステップ201、翻訳対象文を取得する。
本実施形態では、情報を出力するための方法の実行主体(例えば、図1に示すサーバ105)は、様々な方法で翻訳対象文を取得することができる。上記翻訳対象文は、ユーザによって実行主体に送信されてもよく、検索エンジンによって実行主体に返送されてもよい。上記翻訳対象文は、少なくとも1つの中国語文字を含み得る。
ステップ202、事前設定された文ペアセットから、翻訳対象文とマッチングする外国語文を確定する。
実行主体は、翻訳対象文を取得した後、事前設定された文ペアセットから、翻訳対象文とマッチングする外国語文を確定することができる。ここで、文ペアセットは複数の文ペアを含み得、各文ペアは中国語文とそれに対応する外国語文とを含み得、外国語文は英文、ロシア文、ドイツ文などの複数の文を含み得る。実行主体は、翻訳対象文を文ペアセットにおける各中国語文と比較し、翻訳対象文とマッチングする中国語文を確定することができる。比較の際、実行主体は、翻訳対象文と文ペアセットにおける各中国語文との類似度を計算し、類似度が最も高い中国語文を翻訳対象文とマッチングする中国語文として確定することができる。次に、この中国語文に対応する外国語文を翻訳対象文とマッチングする外国語文として確定することができる。
ステップ203、翻訳対象文と確定された外国語文とに基づいて、翻訳対象文のターゲット外国語文を確定する。
本実施形態では、翻訳対象文は変数を含み得、これらの変数の値は変化するものである。文ペアセットにおける外国語文中の変数値は固定または空白である。従って、実行主体は、確定された外国語文中の変数値を翻訳対象文中の変数で置き換えて、ターゲット外国語文を取得することができる。例えば、翻訳対象文は「A+′における′+B+′のデータフォーマットが間違っている′」である。ここで、「A」および「B」は変数である。JavaScriptでは、変数はデータ値を格納するためのコンテナである。マッチングされた外国語文は「′Data in the C of D format error′」である。ここで、「C」および「D」も変数である。この場合、実行主体は、外国語文における「C」および「D」を「A」および「B」で置き換えて、ターゲット外国語文「′Data in the B of A format error′」を取得することができる。
ステップ204、ターゲット外国語文を出力する。
実行主体は、ターゲット外国語文を取得した後、ユーザが閲覧できるように、ターゲット外国語文を出力することができる。
さらに図3を参照すると、図3は、本出願に係る情報を出力するための方法の応用シーンの概略図を示す。図3の応用シーンでは、ユーザは、端末301のブラウザを介して特定の製品のウェブページを閲覧するが、閲覧プロセス中にエラーが発生した。サーバ302は、ブラウザから返送されたウェブページ内の文を翻訳対象文として確定することができる。翻訳対象文は「A+′における′+B+′のデータフォーマットが間違っている′」である。ステップ202~203によって処理した後、ターゲット外国語文「′Data in the B of A format error′」が取得される。サーバ302は、上記ターゲット外国語文をブラウザから返送されたウェブページに表示することができる。
本出願の上記実施形態によって提供される情報を出力するための方法によれば、文ペアセットから、翻訳対象文とマッチングする外国語文を確定し、取得されたターゲット翻訳文をより流暢にするために、翻訳対象文に基づいて外国語文を最適化することができる。
さらに図4を参照すると、図4は、本出願に係る情報を出力するための方法の別の実施形態のプロセス400を示す。図4に示すように、本実施形態では、情報を出力するための方法は、以下のステップを含み得る。
ステップ401、ユーザのウェブページアクセスリクエストを受信した場合、ウェブページアクセスリクエストの対象となるウェブページ内の文を翻訳対象文として確定する。
本実施形態では、実行主体は、ユーザのウェブページアクセスリクエストを受信することができる。上記ウェブページアクセスリクエストは、特定のウェブページへのアクセスをリクエストするために使用される。実行主体は、ウェブページアクセスリクエストの対象となるウェブページ内の文を翻訳対象文として確定することができる。
ステップ402、翻訳対象文中の第1変数と第1中国語単語を確定する。
実行主体は、上記翻訳対象文中の変数と中国語単語を確定し、上記変数を第1変数として記録し、上記中国語単語を第1中国語単語として記録することができる。変数を確定する際、実行主体は、コンピュータプログラミング言語に従ってその中の変数を確定することができる。JavaScriptの場合、一重引用符で表されていないパラメータは変数と見なすことができる。実行主体は、従来の中国語認識アルゴリズムを介して、翻訳対象文中の中国語単語を認識することができる。
ステップ403、文ペアセットにおける各中国語文中の第2変数と第2中国語単語を確定する。
同様に、実行主体は、文ペアセットにおける各中国語文中の変数と中国語単語を確定することもできる。上記変数を第2変数として記録し、上記中国語単語を第2中国語単語として記録する。いくつかの特定の応用では、実行主体は、各中国語文を1回だけ解析し、取得した第2変数および第2中国語単語を次回の使用のために保存することができる。
ステップ404、第1変数と、第1中国語単語と、各第1中国語単語と、各第2中国語単語とに基づいて、文ペアセットから、翻訳対象文とマッチングする中国語文を確定する。
実行主体は、第1変数、第1中国語単語、各第1中国語単語、および各第2中国語単語を確定した後、文ペアセットから、前記翻訳対象文とマッチングする中国語文を確定することができる。具体的には、実行主体は、第2中国語単語と第1中国語単語とが同じである中国語文を、翻訳対象文とマッチングする中国語文として確定することができる。
本実施形態のいくつかのオプション的な実施形態では、上記ステップ404は具体的に、第1変数の翻訳対象文における第1位置情報を確定するステップ(図示せず)と、各第2変数の、文ペアセットの各中国語文における第2位置情報を確定するステップ(図示せず)と、第1位置情報、各第2位置情報、第1中国語単語、および各第2中国語単語に基づいて、文ペアセットから、翻訳対象文とマッチングする中国語文を確定するステップ(図示せず)と、によって実行されてもよい。
本実施形態では、実行主体は、第1変数の翻訳対象文における第1位置情報を確定することができる。ここで、第1位置情報は、第1変数から翻訳対象文の頭文字までの距離を表すために使用される値であり得る。同様に、実行主体は、各第2変数の、文ペアセットの各中国語文における第2位置情報を確定することもできる。次に、実行主体は、第1位置情報と、各第2位置情報と、第1中国語単語と、各第2中国語単語とに基づいて、翻訳対象文とマッチングする外国語文を確定することができる。具体的には、実行主体は、文ペアセットにおける各中国語文から、第2中国語単語と第1中国語単語とが同じ、第2位置情報と第1位置情報とが同じである中国語文を確定することができる。
ステップ405、確定された中国語文に対応する外国語文を翻訳対象文とマッチングする外国語文として確定する。
実行主体は、中国語文を確定した後、この中国語文に対応する外国語文を翻訳対象文とマッチングする外国語文として確定することができる。
ステップ406、マッチングした外国語文中の第2変数を第1変数で置き換えて、ターゲット外国語文を取得する。
次に、実行主体は、マッチングした外国語文中の第2変数を翻訳対象文中の第1変数で置き換えて、ターゲット外国語文を取得することができる。
本出願の上記実施形態によって提供される情報を出力するための方法は、翻訳対象文中の変数の位置と、中国語単語、および文ペアセットにおける各中国語文中の変数の位置と、中国語単語とに基づいて、翻訳対象文とマッチングする外国語文を正確に確定することができるので、翻訳精度が向上される。
さらに図5を参照すると、図5は、本出願に係る情報を出力するための方法の別の実施形態のプロセス500を示す。本実施形態では、実行主体は、以下のステップを含み得る。
ステップ501、翻訳対象文を取得する。
ステップ502、翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得する。
本実施形態では、実行主体は、翻訳対象文を取得した後、翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得することができる。具体的には、実行主体は、翻訳対象文を様々な記号に従ってセグメント化することができる。上記記号は、′:′、′,′、′||′、′.′、′。′、′,′、′;′、′;′、およびブラケット記号′( )′、′( )′、′{ }′、′「 」′、′[ ]′、′< >′を含み得るが、これらに限定されない。例えば、翻訳対象文が「チャート「A」の間に循環依存関係が形成されますので、依存関係の構成を変更してください!」である場合、セグメント化処理した後の各サブ文は、「チャート」、「の間に循環依存関係が形成されます」、および「依存関係の構成を変更してください」を含み得る。
ステップ503、文ペアセットから、少なくとも2つのサブ文とマッチングする外国語文をそれぞれ確定する。
本実施形態では、実行主体は、文ペアセットから、少なくとも2つのサブ文とマッチングする外国語文をそれぞれ確定することができる。その確定方法としては、ステップ402~405に示される方法が採用され得る。
ステップ504、翻訳対象文と確定された外国語文とに基づいて、翻訳対象文のターゲット外国語文を確定する。
本実施形態では、実行主体は、各サブ文とマッチングする外国語文を取得した後、各サブ文の翻訳対象文における位置に基づいて、各外国語文をスプライスすることができる。同時に、翻訳対象文中の変数をスプライス後の外国語文に挿入して、ターゲット外国語文を取得することができる。
ステップ505、ターゲット外国語文を出力する。
なお、本実施形態の方法が、マッチングする外国語文が図4に示す実施形態によって確定されていない場合に使用され得、ステップ502のセグメント化はさらに、第1変数に基づいて翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得することができる。
例えば、翻訳対象文が「′SQLにおける′+(A′文中の′ ′(第′+B+′行)′:′′)+′不正なキーワードが表示される′+C」である場合、各サブ文は、「SQLにおける」、「文中の」、「第」、「行」、および「不正なキーワードが表示される」を含み得る。
本出願の上記実施形態によって提供される情報を出力するための方法は、翻訳精度をさらに向上させることができる。
さらに図6を参照すると、図6は、本出願に係る情報を出力するための方法の文ペアセットを確定するための一実施形態のプロセス600を示す。図6に示すように、本実施形態では、文ペアセットは、以下のステップによって取得され得る。
ステップ601、中国語文セットを取得する。
本実施形態では、実行主体は、まず中国語文セットを取得することができる。ここで、中国語文セットにおける各中国語文は、フロントエンドウェブページに表示される文、およびバックエンドから返送された文を含み得る。
ステップ602、中国語文セットの各中国語文における第3変数と第3中国語単語を確定する。
実行主体は、中国語文セットを取得した後、中国語文セットにおける各中国語文中の第3変数と第3中国語単語を確定することができる。
ステップ603、各中国語文に第3変数をマークし、各中国語文中の第3中国語単語の翻訳のために、マーク付けされた各中国語文を出力する。
具体的には、翻訳対象文中の変数を確定した後、まず変数を対称記号でマークすることができる。上記対称記号は、「[」と「]」、「<」と「>」、および「「」と「」」を含み得る。上記対称記号は、コンピュータプログラミング言語では使用されない記号であり得ることを理解すべきである。例えば、翻訳対象文が「A+′における′+B+′のデータフォーマットが間違っている′」である場合、変数を「「」と「」」でマークすれば、文「′「′+A+′」′+′における「′+B+′」のデータフォーマットが間違っている′」を取得する。
変数をマーク付けした後、変数を所定の記号で置き換えて、他の翻訳対象単語を抽出することができる。上記文を例にすると、変数Aを[%%0%%]で示し、変数Bを[%%1%%]で示す。次に、一重引用符で引用される部分中の中国語単語を抽出し、「′[%%0%%]における[%%1%%]のデータフォーマットが間違っている′」という文を取得する。実行主体は、翻訳者が各中国語文中の第3中国語単語を翻訳するために、上記文を翻訳者に出力することができる。
場合によっては、翻訳対象文にネストされた変数がある。この場合、各変数をマークした後、最も近い「「」と「」」からマッチングを開始し、「「」と「」」がなくなるまでマッチングを再帰的に行う必要がある。例えば、翻訳対象文は「′SQLにおける′+(A?′(第′+B+′行)′:′′)+′不正なキーワードが表示される′+C」である。変数Cに加えて、A?′(第′+B+′行)′:′′は条件付き演算子文であることがわかる。実行結果が、Bが真であるか否かに依存し、特定の値が実行時にのみ確定され得るため、全体で変数と見なすことができ、両端に特殊記号「「」と「」」を追加する必要がある。この変数の内部に変数Bもあるため、両端に特殊記号を追加する必要もある。文1「′SQLにおける「′+(A?′(第「′+B+′」行)′:′′)+′」不正なキーワード「′+C+′」が表示される′」を取得する。
文1にネストされた「「」と「」」の構造があることがわかる。翻訳対象単語を抽出するとき、最小の「「」と「」」の構造から置き換えを開始する。初回の検索によると、最小の「「」と「」」の構造は′「′+B+′」′、および′「′+C+′」′であることがわかる。′「′+B+′」′、および′「′+C+′」′の内部に文字列がなく、単純な変数名のみがあるため、まずそれらを′[%%0%%]′に置き換える。′[%%1%%]′の代わりに′[%%0%%]′を使用する理由は、その後で、外層における距離が最小の「「」と「」」の構造を容易に見つけて、文2「′SQLにおける「′+(A?′(第[%%0%%]行)′:′′)+′」不正なキーワード[%%0%%]が表示される′」を取得することができるためである。
次に、外層における最小の「「」と「」」の構造を見つける。このとき、見つけるのは′「′+(A?′(第[%%0%%]行)′:′′)+′」′であり、内部には文字列′(第[%%0%%]行)′、および空の文字列′′がある。文字列′(第[%%0%%]行)′におけるすべての[%%0%%]を′「%%i%%」′に置き換え、置き換えられた′(第「%%0%%」行)′を翻訳対象単語として抽出する。ここで、iは0から増加する数値である。
次に、マッチングした「「」と「」」の構造′「′+(A?′(第[%%0%%]行)′:′′)+′」′を′[%%0%%]′に置き換えて、文3「′SQLにおける[%%0%%]に不正なキーワード[%%0%%]が表示される′」を取得する。
次に、外層における最小の「「」と「」」の構造を見つけ続ける。見つからなかった場合は、ネストされた「「」と「」」の構造がなくなり、ネスト構造内のすべての抽出対象単語が既に抽出されたことを意味し、「「」と「」」の構造を見つけ続ける必要がなく、再帰ロジックは終了する。
次に、ネスト構造なしの文3中の[%%0%%]を′「%%i%%」′に置き換えて、文4「′SQLにおける「%%0%%」に不正なキーワード「%%1%%」が表示される′」を取得する。ここで、iは0から増加する数値である。文4を翻訳対象単語として抽出し、抽出ロジックは終了する。
なお、図2に示す実施形態では、実行主体は、翻訳対象文中の変数をマークし、文ペアセットから、マーク付けされた文とマッチングする外国語文を確定することもできる。
ステップ604、翻訳により得られた各外国語文を受信する。
実行主体は、翻訳により得られた各外国語文を受信することもできる。ここでの外国語文がマークされた中国語文に基づいて翻訳者によって翻訳されたものであるため、翻訳結果はより流暢で、文脈に沿ったものである。
ステップ605、各中国語文および対応する各外国語文を文ペアとして文ペアセットに追加する。
最後に、実行主体は、中国語文および対応する外国語文を文ペアとして確定し、各文ペアを文ペアセットに追加することができる。
本出願の上記実施形態によって提供される情報を出力するための方法は、翻訳者によって翻訳された外国語文と対応する中国語文とを文ペアとして文ペアセットに追加することができ、より標準的で流暢な外国語文が返送される。
さらに図7を参照すると、上記各図に示された方法の実施形態として、本出願は、情報を出力するための装置の一実施形態を提供する。この装置の実施形態は、図2に示す方法の実施形態に対応する。この装置は、様々な電子機器に特に適用できる。
図7に示すように、本実施形態に係る情報を出力するための装置700は、取得ユニット701と、マッチングユニット702と、確定ユニット703と、出力ユニット704とを含む。
取得ユニット701は、翻訳対象文を取得するように構成される。
マッチングユニット702は、事前設定された文ペアセットから、翻訳対象文とマッチングする外国語文を確定するように構成される。ここで、文ペアセットは、中国語文および対応する外国語文を含む。
確定ユニット703は、翻訳対象文と確定された外国語文とに基づいて、翻訳対象文のターゲット外国語文を確定するように構成される。
出力ユニット704は、ターゲット外国語文を出力するように構成される。
本実施形態のいくつかのオプション的な実施形態では、マッチングユニット702は、図7に示されていないもの、即ち、第1確定モジュール、第2確定モジュール、第1マッチングモジュール、および第2マッチングモジュールをさらに含み得る。
第1確定モジュールは、翻訳対象文における第1変数と第1中国語単語を確定するように構成される。
第2確定モジュールは、文ペアセットの各中国語文における第2変数と第2中国語単語を確定するように構成される。
第1マッチングモジュールは、第1変数と、第1中国語単語と、各第1中国語単語と、各第2中国語単語とに基づいて、文ペアセットから、翻訳対象文とマッチングする中国語文を確定するように構成される。
第2マッチングモジュールは、確定された中国語文に対応する外国語文を翻訳対象文とマッチングする外国語文として確定するように構成される。
本実施形態のいくつかのオプション的な実施形態では、第1マッチングモジュールは、第1変数の翻訳対象文における第1位置情報を確定するステップと、各第2変数の、文ペアセットにおける各中国語文における第2位置情報を確定するステップと、第1位置情報と、各第2位置情報と、第1中国語単語と、各第2中国語単語とに基づいて、文ペアセットから、翻訳対象文とマッチングする中国語文を確定するステップと、を実行するようにさらに構成される。
本実施形態のいくつかのオプション的な実施形態では、確定ユニット703は、図7に示されていないもの、即ち、セグメント化モジュールと第3確定モジュールとをさらに含み得る。
セグメント化モジュールは、翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得するように構成される。
第3確定モジュールは、文ペアセットから、少なくとも2つのサブ文とマッチングする外国語文をそれぞれ確定するように構成される。
本実施形態のいくつかのオプション的な実施形態では、セグメント化モジュールは、第1変数に基づいて翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得するようにさらに構成される。
本実施形態のいくつかのオプション的な実施形態では、確定ユニット703は、マッチングした外国語文中の第2変数を第1変数で置き換えて、ターゲット外国語文を取得するようにさらに構成される。
本実施形態のいくつかのオプション的な実施形態では、取得ユニット701は、ユーザのウェブページアクセスリクエストを受信した場合、ウェブページアクセスリクエストの対象となるウェブページ内の文を翻訳対象文として確定するようにさらに構成される。
本実施形態のいくつかのオプション的な実施形態では、装置700は、中国語文セットを取得し、中国語文セットにおける各中国語文中の第3変数と第3中国語単語とを確定し、各中国語文中の第3変数をマークし、各中国語文中の第3中国語単語の翻訳のために、マーク付けされた各中国語文を出力し、翻訳により得られた各外国語文を受信するステップと、各中国語文および対応する各外国語文を文ペアとして文ペアセットに追加するように構成された確立ユニット(図示せず)をさらに含み得る。
情報を出力するための装置700に記載のユニット701から704は、それぞれ、図2を参照して説明された方法の各ステップに対応することを理解すべきである。従って、情報を出力するための方法について上述した動作および特徴は、装置700およびそれに含まれるユニットにも適用可能であるが、ここではその説明を省略する。
本出願の実施形態によれば、本出願は、電子機器および可読記憶媒体をさらに提供する。
図8に示すように、図8は、本出願の実施形態に係る情報を出力するための方法を実施するための電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、およびその他の適切なコンピュータなど、様々な形態のデジタルコンピュータを表すことを意図する。電子機器は、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブルデバイス、およびその他の同様のコンピューティングデバイスなど、様々な形態のモバイルデバイスを表すこともできる。本明細書に示されるコンポーネント、それらの接続と関係、およびそれらの機能は単なる例示であり、本明細書に説明および/または請求される本出願の実施形態を限定することを意図したものではない。
図8に示すように、この電子機器は、1つまたは複数のプロセッサ801と、メモリ802と、高速インターフェースおよび低速インターフェースを含む様々なコンポーネントを接続するためのインターフェースとを含む。各コンポーネントは、互いに異なるバスで接続されており、共通のマザーボード上に実装されていてもよいし、必要に応じて他の方式で実装されていてもよい。プロセッサは、電子機器内で実行される指令を処理することができ、前記指令は、インターフェースに結合された表示装置等の外部入出力装置にグラフィカルユーザインタフェース(GUI,Graphical User Interface)のグラフィック情報を表示するために、メモリ内またはメモリ上に格納される指令を含む。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを、複数のメモリとともに使用することができる。また、複数の電子機器が接続されていてもよく、各機器は、例えば、サーバアレイ、ブレードサーバ群またはマルチプロセッサシステムなど、一部の必要な動作を提供する。図8では、1つのプロセッサ801を例としている。
メモリ802は、本出願によって提供される非一時的コンピュータ可読記憶媒体である。ここで、前記メモリには、前記少なくとも1つのプロセッサが本出願によって提供される情報を出力するための方法を実行できるように、少なくとも1つのプロセッサによって実行され得る指令が格納されている。本出願の非一時的コンピュータ可読記憶媒体には、本出願によって提供される情報を出力するための方法をコンピュータに実行させるために使用されるコンピュータ指令が格納されている。
非一時的コンピュータ可読記憶媒体として、メモリ802は、非一時的ソフトウェアプログラムと、非一時的コンピュータ実行可能プログラムと、本出願の実施形態における情報を出力するための方法に対応するプログラム指令/モジュール(例えば、図7に示す取得ユニット701、マッチングユニット702、確定ユニット703、および出力ユニット704)などのモジュールとを格納するために使用され得る。プロセッサ801は、メモリ802に格納された非一時的ソフトウェアプログラム、指令、およびモジュールを実行することにより、サーバの様々な機能アプリケーションおよびデータ処理を実行する、即ち、上記方法の実施形態における情報を出力するための方法を実施する。
メモリ802は、オペレーティングシステムおよび少なくとも1つの機能に必要なアプリケーションプログラムが記憶され得るプログラム記憶領域と、情報を出力するための方法を実施するための電子機器によって作成されたデータなどが記憶され得るデータ記憶領域とを含み得る。さらに、メモリ802は、高速ランダムアクセスメモリを含み得、また、少なくとも1つの磁気ディスクメモリ、フラッシュメモリ、またはその他の非一時的ソリッドステートメモリなどの非一時的メモリを含み得る。いくつかの実施形態では、メモリ802は、任意選択で、プロセッサ801に対して遠隔的に設定されたメモリを含み得、これらの遠隔メモリは、ネットワークを介して、情報を出力するための方法を実施するための電子機器に接続され得る。上記ネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組み合わせが含まれるが、これらに限定されない。
情報を出力するための方法を実施するための電子機器は、入力装置803と出力装置804とをさらに含み得る。プロセッサ801、メモリ802、入力装置803、および出力装置804は、バスまたはその他の手段によって接続され得るが、図8にはバスによる接続が例として挙げられる。
入力装置803は、入力された数字または文字情報を受信し、情報を出力するための方法を実施するための電子機器のユーザ設定および機能制御に関連するキー信号入力を生成することができるものであり、例えば、タッチパネル、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つまたは複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置804は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含み得る。この表示装置は、液晶ディスプレイ(LDC)、発光ダイオード(LED)ディスプレイ、およびプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置は、タッチパネルであり得る。
本明細書に記載のシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実装され得る。これらの様々な実施形態は、記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置からデータおよび指令を受信したり、この記憶システム、この少なくとも1つの入力装置、およびこの少なくとも1つの出力装置にデータおよび指令を送信したりすることができる専用又は汎用のプログラマブルプロセッサであり得る少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行および/または解釈され得る1つまたは複数のコンピュータプログラムに実装されることを含み得る。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高水準手続き型またはオブジェクト指向型のプログラミング言語、および/またはアセンブリ言語/機械語で実装され得る。本明細書で使用される場合、「機械可読媒体」および「コンピュータ可読媒体」という用語は、機械可読信号としての機械命令を受信する機械可読媒体を含む、機械命令および/またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指す。「機械可読信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとのやりとりを行うために、本明細書に記載のシステムおよび技術は、情報をユーザに表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、ユーザが入力をコンピュータに提供することを可能にするキーボードとポインティングデバイス(例えば、マウスまたはトラックボール)とを備えたコンピュータに実装され得る。他のタイプの装置は、ユーザとのやりとりを行うためにも使用されており、例えば、任意の形態の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバック)をユーザに提供したり、任意の形態(音響入力、音声入力、および触覚入力を含む形態)を使用してユーザからの入力を受信したりするために使用され得る。
ここで記述したシステムおよび技術は、バックグラウンドコンポーネントを含む演算システム(例えば、データサーバ)に実施されてもよく、またはミドルウェアコンポーネントを含む演算システム(例えば、アプリケーションサーバ)に実施されてもよく、またはフロントエンドコンポーネントを含む演算システム(例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータ)に実施されてもよく、ユーザは該グラフィカルユーザインタフェースまたはウェブブラウザを介してここで記述したシステムおよび技術の実施形態とやりとりを行っていてもよく、またはこのようなバックグラウンドコンポーネント、ミドルウェアコンポーネントまたはフロントエンドコンポーネントのいずれかの組み合わせを含む演算システムに実施されてもよい。また、システムの各コンポーネントの間は、通信ネットワーク等の任意の形態または媒体を介してデジタルデータ通信により接続されていてもよい。通信ネットワークとしては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)およびインターネットなどを含む。
コンピュータシステムは、クライアントおよびサーバを含み得る。クライアントおよびサーバは通常、互いに遠く離れており、通信ネットワークを介してやりとりを行う。クライアントとサーバとの関係は、互いにクライアント-サーバの関係を有するコンピュータプログラムをそれぞれのコンピュータ上で動作することによって生成される。
本出願の実施形態の技術的解決手段によれば、文ペアセットから、翻訳対象文とマッチングする外国語文を確定し、翻訳対象文に基づいて外国語文を最適化して、取得されたターゲット翻訳文をより流暢にすることができる。
なお、上述した様々な形態のフローを用いて、ステップを改めて並び替え、追加または削除を行うことができる。例えば、本出願に記載された各ステップは、本出願に開示された技術案の所望の結果が達成できる限り、並行して実行されてもよいし、順序に実行されてもよいし、異なる順番で実行されてもよい。本明細書はここで限定しない。
上記具体的な実施形態は、本出願の保護範囲を限定するものではない。設計要件および他の要因に従って、様々な修正、組み合わせ、副次的な組み合わせ、および置換を行うことができることを当業者は理解すべきである。本出願の趣旨および原理を逸脱せずに行われたあらゆる修正、均等置換および改善などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims (19)

  1. 翻訳対象文を取得するステップと、
    中国語文と対応する外国語文とを含む事前設定された文ペアセットから、前記翻訳対象文とマッチングする外国語文を確定するステップと、
    前記翻訳対象文と確定された外国語文とに基づいて、前記翻訳対象文のターゲット外国語文を確定するステップと、
    前記ターゲット外国語文を出力するステップと、を含む、
    情報を出力するための方法。
  2. 事前設定された文ペアセットから、前記翻訳対象文とマッチングする外国語文を確定するステップは、
    前記翻訳対象文における第1変数と第1中国語単語を確定するステップと、
    前記文ペアセットの各中国語文における第2変数と第2中国語単語を確定するステップと、
    前記第1変数と、前記第1中国語単語と、各前記第1中国語単語と、各前記第2中国語単語とに基づいて、前記文ペアセットから、前記翻訳対象文とマッチングする中国語文を確定するステップと、
    確定された中国語文に対応する外国語文を、前記翻訳対象文とマッチングする外国語文とするステップと、を含む、
    請求項1に記載の方法。
  3. 前記第1変数と、前記第1中国語単語と、各前記第1中国語単語と、各前記第2中国語単語とに基づいて、前記文ペアセットから、前記翻訳対象文とマッチングする中国語文を確定するステップは、
    前記第1変数の前記翻訳対象文における第1位置情報を確定するステップと、
    各前記第2変数の、前記文ペアセットの各中国語文における第2位置情報を確定するステップと、
    前記第1位置情報と、各前記第2位置情報と、前記第1中国語単語と、各前記第2中国語単語とに基づいて、前記文ペアセットから、前記翻訳対象文とマッチングする中国語文を確定するステップと、を含む、
    請求項2に記載の方法。
  4. 前記文ペアセットから、前記翻訳対象文とマッチングする外国語文を確定するステップは、
    前記翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得するステップと、
    前記文ペアセットから、前記少なくとも2つのサブ文とマッチングする外国語文をそれぞれ確定するステップと、を含む、
    請求項2または3に記載の方法。
  5. 前記翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得するステップは、
    前記第1変数に基づいて前記翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得するステップを含む、
    請求項4に記載の方法。
  6. 前記翻訳対象文と確定された外国語文とに基づいて、前記翻訳対象文のターゲット外国語文を確定するステップは、
    マッチングされた外国語文における第2変数を前記第1変数で置き換えて、前記ターゲット外国語文を取得するステップを含む、
    請求項2に記載の方法。
  7. 翻訳対象文を取得するステップは、
    ユーザのウェブページアクセスリクエストを受信したことに応答して、前記ウェブページアクセスリクエストの対象となるウェブページ内の文を翻訳対象文とするステップを含む、
    請求項1に記載の方法。
  8. 前記文ペアセットは、
    中国語文セットを取得するステップと、
    前記中国語文セットの各中国語文における第3変数と第3中国語単語を確定するステップと、
    各中国語文における第3中国語単語を翻訳するために、各中国語文に前記第3変数をマーク付け、マーク付けされた各中国語文を出力するステップと、
    翻訳により得られた各外国語文を受信するステップと、
    各中国語文と対応する各外国語文とを文ペアとして前記文ペアセットに追加するステップと、によって確定される、
    請求項1に記載の方法。
  9. 翻訳対象文を取得するように構成された取得ユニットと、
    中国語文と対応する外国語文とを含む事前設定された文ペアセットから、前記翻訳対象文とマッチングする外国語文を確定するように構成されたマッチングユニットと、
    前記翻訳対象文と確定された外国語文とに基づいて、前記翻訳対象文のターゲット外国語文を確定するように構成された確定ユニットと、
    前記ターゲット外国語文を出力するように構成された出力ユニットと、を含む、情報を出力するための装置。
  10. 前記マッチングユニットは、
    前記翻訳対象文における第1変数と第1中国語単語を確定するように構成された第1確定モジュールと、
    前記文ペアセットの各中国語文における第2変数と第2中国語単語を確定するように構成された第2確定モジュールと、
    前記第1変数と、前記第1中国語単語と、各前記第1中国語単語と、各前記第2中国語単語とに基づいて、前記文ペアセットから、前記翻訳対象文とマッチングする中国語文を確定するように構成された第1マッチングモジュールと、
    確定された中国語文に対応する外国語文を、前記翻訳対象文とマッチングする外国語文とするように構成された第2マッチングモジュールと、を含む、
    請求項9に記載の装置。
  11. 前記第1マッチングモジュールはさらに、
    前記第1変数の前記翻訳対象文における第1位置情報を確定し、
    各前記第2変数の、前記文ペアセットの各中国語文における第2位置情報を確定し、
    前記第1位置情報と、各前記第2位置情報と、前記第1中国語単語と、各前記第2中国語単語とに基づいて、前記文ペアセットから、前記翻訳対象文とマッチングする中国語文を確定する
    ように構成される、請求項10に記載の装置。
  12. 前記確定ユニットは、
    前記翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得するように構成されたセグメント化モジュールと、
    前記文ペアセットから、前記少なくとも2つのサブ文とマッチングする外国語文をそれぞれ確定するように構成された第3確定モジュールと、を含む、
    請求項10または11に記載の装置。
  13. 前記セグメント化モジュールはさらに、
    前記第1変数に基づいて前記翻訳対象文をセグメント化して、少なくとも2つのサブ文を取得するように構成される、
    請求項12に記載の装置。
  14. 前記確定ユニットはさらに、
    マッチングされた外国語文における第2変数を前記第1変数で置き換えて、前記ターゲット外国語文を取得するように構成される、
    請求項10に記載の装置。
  15. 前記取得ユニットはさらに、
    ユーザのウェブページアクセスリクエストを受信したことに応答して、前記ウェブページアクセスリクエストの対象となるウェブページ内の文を翻訳対象文とするように構成される、
    請求項9に記載の装置。
  16. 中国語文セットを取得し、
    前記中国語文セットの各中国語文における第3変数と第3中国語単語を確定し、
    各中国語文の第3中国語単語を翻訳するために、各中国語文に前記第3変数をマーク付けて、マーク付けされた中国語文を出力し、
    翻訳により得られた各外国語文を受信し、
    各中国語文と対応する各外国語文とを文ペアとして前記文ペアセットに追加するように構成された確立ユニットをさらに含む、
    請求項9に記載の装置。
  17. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な指令が格納されており、前記指令が前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~8のいずれか一項に記載の方法を実行させる、情報を出力するための電子機器。
  18. コンピュータ指令を格納している非一時的コンピュータ可読記憶媒体であって、
    前記コンピュータ指令は、請求項1~8のいずれか一項に記載の方法をコンピュータに実行させるためのものである、非一時的コンピュータ可読記憶媒体。
  19. プロセッサにより実行されると、請求項1~8のいずれか一項に記載の方法を実現する、コンピュータプログラム。
JP2021051105A 2020-07-15 2021-03-25 情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム Pending JP2022017173A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010678775.XA CN111931524B (zh) 2020-07-15 2020-07-15 用于输出信息的方法、装置、设备以及存储介质
CN202010678775.X 2020-07-15

Publications (1)

Publication Number Publication Date
JP2022017173A true JP2022017173A (ja) 2022-01-25

Family

ID=73312526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021051105A Pending JP2022017173A (ja) 2020-07-15 2021-03-25 情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム

Country Status (5)

Country Link
US (1) US11687735B2 (ja)
EP (1) EP3825897A3 (ja)
JP (1) JP2022017173A (ja)
KR (1) KR102531507B1 (ja)
CN (1) CN111931524B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115983291A (zh) * 2021-10-15 2023-04-18 华为技术有限公司 网页内容翻译方法、计算机设备、存储介质及程序产品

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152420A (ja) * 2008-12-23 2010-07-08 Fuji Xerox Co Ltd 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020091509A1 (en) 2001-01-02 2002-07-11 Yacov Zoarez Method and system for translating text
CN100437557C (zh) * 2004-02-04 2008-11-26 北京赛迪翻译技术有限公司 基于语言知识库的机器翻译方法与装置
BRPI0820927A2 (pt) * 2007-12-05 2015-06-23 Facebook Inc Método implementado por computador e produtos de programa de computador para tradução de texto em rede social
US9201870B2 (en) * 2008-01-25 2015-12-01 First Data Corporation Method and system for providing translated dynamic web page content
CN101996166B (zh) * 2009-08-14 2015-08-05 张龙哺 双语句对模式化记录方法以及翻译方法和翻译系统
US9613026B2 (en) * 2011-12-28 2017-04-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US20180095950A1 (en) * 2016-10-05 2018-04-05 Lingua Next Technologies Pvt. Ltd. Systems and methods for complete translation of a web element
CN109145313A (zh) * 2018-07-18 2019-01-04 广州杰赛科技股份有限公司 语句的翻译方法、装置和存储介质
CN109614082B (zh) * 2018-09-28 2022-03-04 创新先进技术有限公司 一种针对数据查询脚本的翻译方法、装置及设备
CN109858045B (zh) * 2019-02-01 2020-07-10 北京字节跳动网络技术有限公司 机器翻译方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152420A (ja) * 2008-12-23 2010-07-08 Fuji Xerox Co Ltd 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置

Also Published As

Publication number Publication date
CN111931524B (zh) 2023-08-08
KR20210045960A (ko) 2021-04-27
US20210200964A1 (en) 2021-07-01
EP3825897A2 (en) 2021-05-26
US11687735B2 (en) 2023-06-27
KR102531507B1 (ko) 2023-05-12
EP3825897A3 (en) 2021-10-06
CN111931524A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
JP7398402B2 (ja) 実体リンキング方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP2021197137A (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US9262403B2 (en) Dynamic generation of auto-suggest dictionary for natural language translation
JP7301922B2 (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US11403468B2 (en) Method and apparatus for generating vector representation of text, and related computer device
CN111709234B (zh) 文本处理模型的训练方法、装置及电子设备
US10402474B2 (en) Keyboard input corresponding to multiple languages
KR20210056961A (ko) 의미 처리 방법, 장치, 전자 기기 및 매체
CN112528001B (zh) 一种信息查询方法、装置及电子设备
US20230061398A1 (en) Method and device for training, based on crossmodal information, document reading comprehension model
CN111090991B (zh) 场景纠错方法、装置、电子设备和存储介质
JP7395553B2 (ja) 文章翻訳方法、装置、電子機器及び記憶媒体
EP3832492A1 (en) Method and apparatus for recommending voice packet, electronic device, and storage medium
JP7139028B2 (ja) 目標内容の確定方法、装置、機器及びコンピュータ可読記憶媒体
CN112153206A (zh) 一种联系人匹配方法、装置、电子设备及存储介质
US20210350090A1 (en) Text to visualization
JP7241122B2 (ja) スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
CN112269884B (zh) 信息抽取方法、装置、设备及存储介质
JP2022017173A (ja) 情報を出力するための方法および装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
US20230153550A1 (en) Machine Translation Method and Apparatus, Device and Storage Medium
CN111339314A (zh) 一种三元组数据的生成方法、装置和电子设备
CN108509058B (zh) 输入方法与相关设备
CN116070614A (zh) 用于搜索场景的文本相似度计算方法及双塔模型训练方法
CN111859998A (zh) 篇章翻译的方法、装置、电子设备和可读存储介质
CN113778594A (zh) 一种多语言应用程序包生成方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220712

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230120