JP2019057137A - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP2019057137A JP2019057137A JP2017181096A JP2017181096A JP2019057137A JP 2019057137 A JP2019057137 A JP 2019057137A JP 2017181096 A JP2017181096 A JP 2017181096A JP 2017181096 A JP2017181096 A JP 2017181096A JP 2019057137 A JP2019057137 A JP 2019057137A
- Authority
- JP
- Japan
- Prior art keywords
- language
- country
- translation
- document
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Abstract
Description
本発明は、利用者に誤解の生じるおそれがある固有表現の翻訳結果に対して、その翻訳結果を説明する補足情報を付加することができる情報処理装置及び情報処理プログラムを提供することを目的としている。
請求項1の発明は、翻訳対象の文書を受け付ける受付手段と、前記文書で用いられている言語である第1の言語を取得する第1の取得手段と、翻訳先の言語である第2の言語を取得する第2の取得手段と、前記文書の固有表現と前記第1の言語と前記第2の言語に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する第3の取得手段と、前記補足情報を前記文書の翻訳結果に付加する付加手段を有する情報処理装置である。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
文書を受け付けるとは、例えば、記憶媒体(例えば、ハードディスク等であり、コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている文書を読み出すこと、画像読取装置で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること等が含まれる。受け付ける文書は、1枚であってもよいし、複数枚であってもよい。また、文書の内容として、ビジネスに用いられる文書、料理用レシピ、旅行ガイド、広告宣伝用のパンフレット等であってもよい。
さらに、翻訳先言語・国取得モジュール115は、第2の言語とともに、文書の翻訳結果が用いられる第2の国又は地域を取得するようにしてもよい。例えば、言語と国又は地域とを対応させたテーブルを用意しておき、言語から国又は地域を取得するようにしてもよいし、ユーザーに国又は地域を選択(又は、入力)させるようにしてもよいし、予め定められた言語だけに翻訳する場合は、その予め定められた言語としてもよいし、その文書を利用するユーザーのSNSにおけるプロフィールからそのユーザーの国又は地域を取得するようにしてもよい。また、その国又は地域には、国籍、住所、居所等の意味を有していると解釈してもよい。さらに、その国又は地域から、宗教、人種等を取得するようにしてもよい。例えば、国又は地域と宗教、人種等を対応させたテーブルを用意しておき、国又は地域から宗教、人種等を取得するようにしてもよい。
また、固有表現抽出モジュール130は、その文書の翻訳結果(翻訳モジュール120によって翻訳された後の文書)から固有表現を抽出するようにしてもよい。ここでの翻訳結果は、対象となっている文書を第2の言語に翻訳した結果(文書)である。もちろんのことながら、翻訳した結果である文書では、第2の言語が用いられている。
ここで固有表現は、第1の言語で用いられている意味と第2の言語で用いられている意味が異なる表現である。ここで「第1の言語で用いられている意味と第2の言語で用いられている意味」における「意味」として、慣習的(習慣、文化、民俗、習俗、宗教等を含む)な意味も含む。例えば、「13」という意味として、いずれの言語でも数字としての意味は同じであるが、単なる数字としてのみ用いられる言語(例えば、日本語)と慣習的には忌み嫌われる数字として扱われる言語(例えば、キリスト教圏で主に用いられている英語等の言語)がある。この場合、そもそも補足情報を付加する理由を含めた方が、利用者に誤解を生じさせないようにすることができる。
なお、厳密には、宗教が異なることによって(キリスト教であるか否かによって)、前述の相違がでてくるが、その言語を用いる人間は特定の宗教に属している場合が多い場合には、言語だけで判断してもよい。
固有表現抽出モジュール130が行う固有表現の抽出は、予め定められた固有表現を記憶しているテーブルを用いればよい。例えば、第1の言語と第2の言語の組み合わせに対応して、固有表現を記憶しているテーブルである。
さらに、固有表現抽出モジュール130は、固有表現と第1の言語と第1の国又は地域と第2の言語と第2の国又は地域に基づいて、その固有表現を第2の言語で説明する補足情報を取得するようにしてもよい。ここでの固有表現は、第1の国又は地域で用いられている意味と第2の国又は地域で用いられている意味が異なる表現である。また、意味が異なる表現として、宗教、人種等における意味が異なる表現を含めてもよい。
さらに、固有表現として、第2の国又は地域ではアクセスできないとされているURLを含めるようにしてもよい。
そして、補足情報追記モジュール135は、補足情報を文書の翻訳結果に付加する。
補足情報の取得は、予め定められた補足情報を記憶しているテーブルを用いればよい。例えば、第1の言語と第2の言語と固有表現の組み合わせに対応して、補足情報を記憶しているテーブルである。
補足情報として、意味が異なることの説明(例えば、補足情報を付加する理由を含む)を含めるようにしてもよい。
また、補足情報として、国又は地域での慣習上での相違の説明を含めるようにしてもよい。
また、補足情報追記モジュール135は、補足情報をルビ、又は、注意書きとして、翻訳結果に付加するようにしてもよい。ここでルビとは、固有表現の付近に配置する小文字である。一般的には、振り仮名用に用いられるが、補足情報の記載に用いている。注意書きは、翻訳結果の文書の予め定められた領域(例えば、固有表現が記載されているページにおける下欄、最終ページ等)、又は、矩形領域等に記載されている。注意書きは、固有表現との対応がとれていればよい。例えば、固有表現に番号をルビとして付加し、その番号を付して注意書きを記載してもよい。
そして、補足情報追記モジュール135は、補足情報の文字を、少なくとも固有表現以外の翻訳結果である文字とは異なる形態(形状、模様、色彩、動的に変化すること(例えば、フラッシュ、アニメーション等)、点滅(点滅における変更対象は、点滅を行うか否か、点滅を行っている期間、点滅の間隔等がある)、又は、これらの組み合わせであってもよい)とするようにしてもよい。ここで、異なる形態として、例えば、文字サイズを小さくすること、文字色を赤色にすること、点滅させること等が含まれる。
また、固有表現の翻訳結果は、他の翻訳結果(固有表現ではない部分の翻訳結果)と同じ形態としてもよいが、異なる形態としてもよい。異なる形態とすれば、補足情報があることを利用者は把握しやすくなる。
図2(a)の例に示す画像処理装置200は、情報処理装置100を有している。画像処理装置200は、例えば、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)であって、スキャナで読み込んだ文書を文字認識し、翻訳して、補足情報を含む翻訳結果をプリンタが印刷する。その印刷された文書は、スキャン対象の文書のレイアウトを維持して翻訳結果が配置されていてもよい。
例えば、画像処理装置210が文書を読み込み、文書画像を情報処理装置100に送信し、情報処理装置100から翻訳された文書(補足情報を含む翻訳結果)を受け取って印刷してもよい。また、ユーザー端末220のユーザーの操作によって、ユーザー端末220又は文書記憶装置230内の電子文書を情報処理装置100に送信し、情報処理装置100から翻訳された文書(補足情報を含む翻訳結果)を受け取ってもよい。その後、翻訳された文書を画像処理装置210で印刷してもよいし、文書記憶装置230に記憶させてもよい。
ステップS302では、文書受付モジュール105は、翻訳対象文書を受け付ける。
ステップS304では、翻訳モジュール120は、翻訳対象文書を翻訳する。
ステップS306では、翻訳対象言語・国取得モジュール110は、翻訳対象の文書情報を取得する。
ステップS308では、翻訳先言語・国取得モジュール115は、翻訳先の言語・国を取得する。
ステップS310では、固有表現抽出モジュール130は、翻訳対象文書から固有表現を抽出する。
ステップS312では、固有表現抽出モジュール130は、固有表現があるか否かを判断し、ある場合はステップS314へ進み、それ以外の場合はステップS320へ進む。
ステップS314では、補足情報追記モジュール135は、背景となる補足情報を取得する。
ステップS316では、補足情報追記モジュール135は、補足情報があるか否かを判断し、ある場合はステップS318へ進み、それ以外の場合(補足情報がない場合)はステップS320へ進む。
ステップS318では、補足情報追記モジュール135は、補足情報を翻訳済文書に反映する。なお、翻訳結果自体を変更することはしない。
ステップS320では、出力モジュール140は、翻訳結果を出力する。
図4は、本実施の形態による処理例を示す説明図である。
例えば、「美味しさの秘訣は大さじ2の砂糖を入れることです」が翻訳対象文410である。翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(米国)420を取得した場合は、翻訳文430として、例えば、「The secret of taste is to put 2 tablespoons sugar」となる。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(オーストラリア)440を取得した場合は、翻訳文450として、例えば、「The secret of taste is to put 2 tablespoons sugar」となる。
ここで、米国と日本とでは「大さじ」の容量(15ml)が同じなので、翻訳文430そのままを翻訳結果とする。つまり、日本で用いられている「大さじ」の意味(容量)と米国で用いられている意味「tablespoons」の意味(容量)は同じなので、補足情報は不要である。
しかし、オーストラリアでは「大さじ」の容量は20mlであり、日本とは異なる。そこで、補足情報としてルビ455を翻訳文450に付加する。ルビ455として、例えば、「30ml」であり、これを「tablespoons」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「AU」を取得する。例えば、翻訳結果を利用するユーザーのユーザープロファイルテーブル500を、そのユーザーのSNSから取得する。図5は、ユーザープロファイルテーブル500のデータ構造例を示す説明図である。ユーザープロファイルテーブル500は、プロファイル欄510、年齢欄520、住所欄530、氏名欄540、国欄550等を有している。プロファイル欄510は、ユーザーの識別情報を記憶している。年齢欄520は、そのユーザーの年齢を記憶している。住所欄530は、そのユーザーの住所を記憶している。氏名欄540は、そのユーザーの氏名を記憶している。国欄550は、そのユーザーの国を記憶している。この例では、翻訳文450を利用するユーザーは「no3」である。
そして、翻訳対象の言語(又は国)、翻訳先の言語(又は国)から、テーブルAを選択し、このテーブルA内にあるので、補足情報を付加すべきと判断できる。その後で、単位変換テーブル700を用いて補足情報を生成してもよい。
図8は、本実施の形態による処理例を示す説明図である。文書中のURLがアクセス不可能な国のユーザーへの翻訳の場合、アクセス可能なURLを補足情報として付加するものである。つまり、特定の国からアクセスが難しいURLが記載されている場合は、アクセス可能なURLを付加している。
例えば、「最新の情報は、以下を参照してください。
https://ggg.gg/xxxx.xxxx」が翻訳対象文810である。
翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。
翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(米国)820を取得した場合は、翻訳文830として、例えば、「For the latest information, please see below.
https://ggg.gg/xxxx.xxxx」となる。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語は中国語、国又は地域は翻訳先(中国)840を取得した場合は、翻訳文850として、例えば、「最新の情報は、以下を参照してください。(中国語)
https://ggg.gg/xxxx.xxxx」である。なお、表現できる文字コードの関係で、以下、翻訳文内に「(中国語)」のように、かっこ書きの言語名がある場合は、その言語での翻訳文であることを示している。
ここで、URL「https://ggg.gg/xxxx.xxxx」は、米国においてもアクセス可能であるので、翻訳文830そのままを翻訳結果とする。
しかし、URL「https://ggg.gg/xxxx.xxxx」は、中国ではアクセスできないので短縮URLではなく、展開後のURLもルビ855として追記する。
ルビ855として、例えば、「https://www.ffffxxxxx.co.jp/service/scantlanslation/」であり、これを本来のURLの上に、本文のURL(翻訳文でもあるURL)よりも小さく、赤い文字で表示する。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「CHINA」を取得する。
(2)固有表現抽出モジュール130は、URL置換処理テーブル900を参照し、URLを変換する。図9は、URL置換処理テーブル900のデータ構造例を示す説明図である。URL置換処理テーブル900は、URL欄910、JP欄920、US欄930、China欄940を有している。URL欄910は、URLを記憶している。JP欄920は、日本での置換処理を記憶している。US欄930は、米国での置換処理を記憶している。China欄940は、中国での置換処理を記憶している。例えば、「変換必要」、「アクセス不可」等がある。また、「変換必要」の場合は、変換後のURLそのものを記憶していてもよいし、変換ルール等を記憶していてもよい。例えば、URL「https://ggg.gg/xxxx.xxxx」は、変換必要であることを取得し、変換ルールにしたがって変換して、「https://www.ffffxxxxx.co.jp/service/scantlanslation/」を取得する。
(3)補足情報追記モジュール135は、翻訳文850に対して、アクセス可能なURLを示しているルビ855を追記する。
図10は、本実施の形態による処理例を示す説明図である。
例えば、「A社ビルの13階で歓迎パーティが行われます」が翻訳対象文1010である。翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。翻訳先言語・国取得モジュール115は、翻訳先の言語は中国語、国又は地域は翻訳先(中国)1020を取得した場合は、翻訳文1030として、例えば、「A社ビルの13階で歓迎パーティが行われます(中国語)」となる。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(米国)1040を取得した場合は、翻訳文1050として、例えば、「A welcome party will be held on the 13th floor of A Building」となる。
米国では、13階という表現は不幸な数字(忌み数)であると一般的に思われている。日本では13階という表現は不幸な数字ではないことを補足情報として付加する。ルビ1055として、例えば、「In Japan, “13th floor” is not used as an unfortunate figure.」であり、これを「13th floor」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「US」を取得する。
(2)固有表現抽出モジュール130は、文化補足テーブル1100を参照し、補足情報を取得する。図11は、文化補足テーブル1100のデータ構造例を示す説明図である。文化補足テーブル1100は、固有表現欄1110、JP欄1120、US欄1130、China欄1140を有している。固有表現欄1110は、固有表現を記憶している。JP欄1120は、翻訳先である日本における補足情報を記憶している。US欄1130は、翻訳先である米国における補足情報を記憶している。China欄1140は、翻訳先である中国における補足情報を記憶している。「○」は、その国で、その固有表現は用いることにその固有表現そのものの意味以外の意味はないことを示している。「×」は、その国で、その固有表現を用いるとその他の意味(不幸であることを示している等)があることを示している。例えば、「404号室」は、日本では忌み数が用いられていることから、忌避されることが多いが、アメリカではそのような意味はないことから、「アメリカでは「404号室」は不幸な数字としては使われていません。」との補足情報が記憶されている。
(3)補足情報追記モジュール135は、翻訳文1050に対して、留意事項を示しているルビ1055を追記する。
例えば、「魚の煮物は日本で人気のある料理です。」が翻訳対象文1210である。翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。翻訳先言語・国取得モジュール115は、翻訳先の言語はインドネシア語、国又は地域は翻訳先(インドネシア)1220を取得した場合は、翻訳文1230として、例えば、「Fish simmered is a popular dish in Japan.(インドネシア語)」となる。料理酒が使われることがあるので、ハラール認証の確認が必要であるので、補足情報としてルビ1235を翻訳文1230に付加する。ルビ1235として、例えば、「Cooking alcohol may be used..(インドネシア語)」であり、これを「Fish simmered(インドネシア語)」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語はアラビア語、国又は地域は翻訳先(アラブ首長国連邦)1240を取得した場合は、翻訳文1250として、例えば、「Fish simmered is a popular dish in Japan.(アラビア語)」である。同様に、補足情報としてルビ1255を翻訳文1250に付加する。ルビ1255として、例えば、「Confirmation of halal authentication is required..(アラビア語)」であり、これを「Fish simmered(アラビア語)」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
なお、ルビ1235とルビ1255が異なるのは、国(又は、言語としてもよい)によってハラールの適用の厳格さが異なるためである。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「UAE」を取得する。
(2)固有表現抽出モジュール130は、文化補足テーブル1300を参照し、補足情報を取得する。図13は、文化補足テーブル1300のデータ構造例を示す説明図である。文化補足テーブル1300は、固有表現欄1310、JP欄1320、ID欄1330、UAE欄1340を有している。固有表現欄1310は、固有表現を記憶している。JP欄1320は、その固有表現の翻訳先である日本における補足情報を記憶している。ID欄1330は、その固有表現の翻訳先であるインドネシアにおける補足情報を記憶している。UAE欄1340は、その固有表現の翻訳先であるアラブ首長国連邦における補足情報を記憶している。「○」は、その国で、その固有表現は用いることにその固有表現そのものの意味以外の意味はないことを示している。「×」は、その国で、その固有表現を用いるとその他の意味(注意事項等であって、例えば、ハラール認証の確認が必要であること等)があることを示している。例えば、「Confirmation of halal authentication is required..(アラビア語)」との補足情報が記憶されている。
(3)補足情報追記モジュール135は、翻訳文1250に対して、留意事項を示しているルビ1255を追記する。
なお、図14に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図14に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図14に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
105…文書受付モジュール
110…翻訳対象言語・国取得モジュール
115…翻訳先言語・国取得モジュール
120…翻訳モジュール
125…固有表現情報記憶モジュール
130…固有表現抽出モジュール
135…補足情報追記モジュール
140…出力モジュール
200…画像処理装置
210…画像処理装置
220…ユーザー端末
230…文書記憶装置
290…通信回線
Claims (10)
- 翻訳対象の文書を受け付ける受付手段と、
前記文書で用いられている言語である第1の言語を取得する第1の取得手段と、
翻訳先の言語である第2の言語を取得する第2の取得手段と、
前記文書の固有表現と前記第1の言語と前記第2の言語に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する第3の取得手段と、
前記補足情報を前記文書の翻訳結果に付加する付加手段
を有する情報処理装置。 - 前記固有表現は、前記第1の言語で用いられている意味と前記第2の言語で用いられている意味が異なる表現である、
請求項1に記載の情報処理装置。 - 前記補足情報として、意味が異なることの説明を含む、
請求項2に記載の情報処理装置。 - 前記第1の取得手段は、前記第1の言語とともに、前記文書が作成された第1の国又は地域を取得し、
前記第2の取得手段は、前記第2の言語とともに、前記文書の翻訳結果が用いられる第2の国又は地域を取得し、
前記第3の取得手段は、前記固有表現と前記第1の言語と前記第1の国又は地域と前記第2の言語と前記第2の国又は地域に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する、
請求項1に記載の情報処理装置。 - 前記固有表現は、前記第1の国又は地域で用いられている意味と前記第2の国又は地域で用いられている意味が異なる表現である、
請求項4に記載の情報処理装置。 - 前記補足情報として、前記国又は地域での慣習上での相違の説明を含む、
請求項5に記載の情報処理装置。 - 前記固有表現として、前記第2の国又は地域ではアクセスできないとされているURLを含む、
請求項5又は6に記載の情報処理装置。 - 前記付加手段は、前記補足情報をルビ、又は、注意書きとして、前記翻訳結果に付加する、
請求項1に記載の情報処理装置。 - 前記付加手段は、前記補足情報の文字を、少なくとも固有表現以外の翻訳結果である文字とは異なる形態とする、
請求項7に記載の情報処理装置。 - コンピュータを、
翻訳対象の文書を受け付ける受付手段と、
前記文書で用いられている言語である第1の言語を取得する第1の取得手段と、
翻訳先の言語である第2の言語を取得する第2の取得手段と、
前記文書の固有表現と前記第1の言語と前記第2の言語に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する第3の取得手段と、
前記補足情報を前記文書の翻訳結果に付加する付加手段
として機能させるための情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017181096A JP7027757B2 (ja) | 2017-09-21 | 2017-09-21 | 情報処理装置及び情報処理プログラム |
US15/913,227 US11256880B2 (en) | 2017-09-21 | 2018-03-06 | Information processing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017181096A JP7027757B2 (ja) | 2017-09-21 | 2017-09-21 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019057137A true JP2019057137A (ja) | 2019-04-11 |
JP7027757B2 JP7027757B2 (ja) | 2022-03-02 |
Family
ID=65720283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017181096A Active JP7027757B2 (ja) | 2017-09-21 | 2017-09-21 | 情報処理装置及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11256880B2 (ja) |
JP (1) | JP7027757B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7126282B1 (ja) | 2021-06-29 | 2022-08-26 | クェスタ株式会社 | 情報提供装置、情報提供方法及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7396061B2 (ja) * | 2020-01-15 | 2023-12-12 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006277103A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文書翻訳方法および文書翻訳装置 |
JP2014503098A (ja) * | 2011-01-06 | 2014-02-06 | クアルコム,インコーポレイテッド | 移動局に翻訳情報サービスを提供する際に使用するための方法および装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990076935A (ko) * | 1997-03-31 | 1999-10-25 | 다카노 야스아키 | 문서처리방법,및기계번역장치 |
US20040205671A1 (en) * | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
JP3896084B2 (ja) | 2003-01-16 | 2007-03-22 | 株式会社東芝 | 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置 |
US20100070265A1 (en) * | 2003-05-28 | 2010-03-18 | Nelson David D | Apparatus, system, and method for multilingual regulation management |
US20040243391A1 (en) * | 2003-05-28 | 2004-12-02 | Nelson David D. | Apparatus, system, and method for multilingual regulation management |
JP4263181B2 (ja) | 2005-03-28 | 2009-05-13 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP4050755B2 (ja) | 2005-03-30 | 2008-02-20 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
JP4064413B2 (ja) * | 2005-06-27 | 2008-03-19 | 株式会社東芝 | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム |
US8972268B2 (en) * | 2008-04-15 | 2015-03-03 | Facebook, Inc. | Enhanced speech-to-speech translation system and methods for adding a new word |
US8875019B2 (en) * | 2010-03-16 | 2014-10-28 | International Business Machines Corporation | Virtual cultural attache |
US9864809B2 (en) * | 2010-07-13 | 2018-01-09 | Motionpoint Corporation | Dynamic language translation of web site content |
JP5144736B2 (ja) * | 2010-11-10 | 2013-02-13 | シャープ株式会社 | 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 |
WO2013086666A1 (en) * | 2011-12-12 | 2013-06-20 | Google Inc. | Techniques for assisting a human translator in translating a document including at least one tag |
WO2014186346A1 (en) * | 2013-05-13 | 2014-11-20 | Mango Languages | Method and system for motion picture assisted foreign language learning |
US9342505B2 (en) * | 2013-06-02 | 2016-05-17 | Jianqing Wu | Translation protocol for large discovery projects |
KR20150085145A (ko) * | 2014-01-13 | 2015-07-23 | 한국전자통신연구원 | 사용자 반응 기반 통역 시스템 및 그 방법 |
US10248653B2 (en) * | 2014-11-25 | 2019-04-02 | Lionbridge Technologies, Inc. | Information technology platform for language translation and task management |
JP6320982B2 (ja) * | 2014-11-26 | 2018-05-09 | ネイバー コーポレーションNAVER Corporation | 翻訳文エディタ提供装置、並びに翻訳文エディタ提供方法 |
CN108156825B (zh) * | 2015-11-13 | 2023-08-08 | 柯达阿拉里斯股份有限公司 | 跨文化问候卡系统 |
US10191903B2 (en) * | 2016-09-30 | 2019-01-29 | Microsoft Technology Licensing, Llc | Customized and contextual translated content for travelers |
-
2017
- 2017-09-21 JP JP2017181096A patent/JP7027757B2/ja active Active
-
2018
- 2018-03-06 US US15/913,227 patent/US11256880B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006277103A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文書翻訳方法および文書翻訳装置 |
JP2014503098A (ja) * | 2011-01-06 | 2014-02-06 | クアルコム,インコーポレイテッド | 移動局に翻訳情報サービスを提供する際に使用するための方法および装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7126282B1 (ja) | 2021-06-29 | 2022-08-26 | クェスタ株式会社 | 情報提供装置、情報提供方法及びプログラム |
JP2023005805A (ja) * | 2021-06-29 | 2023-01-18 | クェスタ株式会社 | 情報提供装置、情報提供方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20190087416A1 (en) | 2019-03-21 |
US11256880B2 (en) | 2022-02-22 |
JP7027757B2 (ja) | 2022-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6544131B2 (ja) | 情報処理装置及び情報処理プログラム | |
US9262104B2 (en) | Information processing apparatus, image processing apparatus, and information processing system | |
CN111176650B (zh) | 解析器生成方法、检索方法、服务器及存储介质 | |
CN101512518B (zh) | 自然语言处理系统和词典登录系统 | |
WO2014205232A1 (en) | Language input method editor to disambiguate ambiguous phrases via diacriticization | |
JP2016001403A (ja) | テンプレート管理装置及びプログラム | |
CN107148624A (zh) | 预处理文本的方法以及用于执行该方法的预处理系统 | |
CN110008807B (zh) | 一种合同内容识别模型的训练方法、装置及设备 | |
JP7027757B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20210295033A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20080313607A1 (en) | Unified input stack | |
CN107590136B (zh) | 翻译设备、翻译系统以及翻译方法 | |
US11165737B2 (en) | Information processing apparatus for conversion between abbreviated name and formal name | |
JP7027696B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6897168B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6203083B2 (ja) | 未知語抽出装置及び未知語抽出方法 | |
KR101561673B1 (ko) | 클라우드를 이용한 문서 내의 텍스트 변환 방법 및 그 방법이 기록된 기록매체 | |
US20240135100A1 (en) | Information processing apparatus, information processing method, and program | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6702047B2 (ja) | 翻訳装置、翻訳システムおよびプログラム | |
JP2012063822A (ja) | 情報処理装置及び情報処理プログラム | |
CN110874519B (zh) | 一种将Markdown文档转换为PDF文档的方法、装置 | |
JP2017040988A (ja) | 情報処理装置及び情報処理プログラム | |
JP6476988B2 (ja) | 情報処理装置及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200831 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220118 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220131 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7027757 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |