JP2019057137A - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP2019057137A
JP2019057137A JP2017181096A JP2017181096A JP2019057137A JP 2019057137 A JP2019057137 A JP 2019057137A JP 2017181096 A JP2017181096 A JP 2017181096A JP 2017181096 A JP2017181096 A JP 2017181096A JP 2019057137 A JP2019057137 A JP 2019057137A
Authority
JP
Japan
Prior art keywords
language
country
translation
document
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017181096A
Other languages
English (en)
Other versions
JP7027757B2 (ja
Inventor
伊藤 康洋
Yasuhiro Ito
康洋 伊藤
和哉 田中
Kazuya Tanaka
和哉 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2017181096A priority Critical patent/JP7027757B2/ja
Priority to US15/913,227 priority patent/US11256880B2/en
Publication of JP2019057137A publication Critical patent/JP2019057137A/ja
Application granted granted Critical
Publication of JP7027757B2 publication Critical patent/JP7027757B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

【課題】利用者に誤解の生じるおそれがある固有表現の翻訳結果に対して、その翻訳結果を説明する補足情報を付加することができる情報処理装置を提供する。【解決手段】情報処理装置の受付手段は、翻訳対象の文書1210を受け付ける。第1の取得手段は、前記文書で用いられている言語である第1の言語を取得する。第2の取得手段は、翻訳先の言語である第2の言語を取得する。第3の取得手段は、前記文書の固有表現と第1の言語と第2の言語に基づいて、該固有表現を第2の言語で説明する補足情報1235を取得する。付加手段は、前記補足情報を前記文書の翻訳結果1230に付加する。【選択図】図12

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、利用者の意図した内容を適切に伝えることができるコミュニケーション支援装置を提供することを課題とし、翻訳の元となる原言語文の意味内容の解釈である原言語解釈と、原言語解釈の表す意味内容を補足する文の例である補足例文とを対応づけて格納する補足例文記憶部と、利用者が入力した原言語文を受け付ける入力受付部と、入力受付部が受け付けた原言語文の意味内容を解析し、原言語解釈を出力する原言語解析部と、原言語解析部が出力した原言語解釈に対応づけられた補足例文を、補足例文記憶部から検索する補足例文検索部と、入力受付部が受け付けた原言語文と、補足例文検索部が検索した補足例文とを翻訳し、翻訳の対象言語で記述した文である対象言語文を出力する翻訳部と、を備えたことが開示されている。
特許文献2には、誤りを含まない対象言語文を得ることができるコミュニケーション支援装置を提供することを課題とし、原言語文の意味内容を解析し、その解釈の候補である少なくとも1つの原言語解釈候補を出力する原言語解析部と、複数の原言語解釈候補の各候補間の相違する部分である曖昧部分を検出する曖昧部分検出部と、曖昧部分検出部が検出した曖昧部分を削除する曖昧部分削除部と、原言語解析部が出力し、曖昧部分削除部が曖昧部分を削除した原言語解釈候補を、対象言語における意味内容に翻訳し、対象言語における意味内容の解釈の候補である少なくとも1つの対象言語解釈候補を出力する翻訳部と、翻訳部が出力した対象言語解釈候補に基づき、対象言語で記述した文である対象言語文を生成し、対象言語文の候補である少なくとも1つの対象言語文候補を出力する対象言語生成部と、を備えたことが開示されている。
特許文献3には、第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含む場合でも、第二言語を母国語とする人に翻訳文の意味を伝達させることを課題とし、入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳装置において、翻訳部の訳文生成部は、特定見出し記憶部を参照しつつ、第一言語内に数量程度表現を含むか否かを判定し、また、翻訳辞書部を参照しつつ、第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定し、ここで、第一言語の1つの文内で数量程度表現及び固有名詞がそれぞれ含まれるとき、訳文生成部は、補足語辞書部3を参照しつつ、当該固有名詞に補足情報を付加して翻訳結果を作成し、このように、第一言語の国内特有の固有名詞には補足情報を付加して、第二言語を母国語とする人に翻訳文の意味を伝達させることが開示されている。
特開2006−277119号公報 特開2006−277677号公報 特開2004−220416号公報
翻訳技術において、翻訳結果は正しいが、その翻訳結果だけでは利用者に誤解が生じるおそれのある固有表現がある。例えば、「大さじ1杯」との表現において、その容量は、日本では15mlであるが、20mlと解釈する国もある。
本発明は、利用者に誤解の生じるおそれがある固有表現の翻訳結果に対して、その翻訳結果を説明する補足情報を付加することができる情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、翻訳対象の文書を受け付ける受付手段と、前記文書で用いられている言語である第1の言語を取得する第1の取得手段と、翻訳先の言語である第2の言語を取得する第2の取得手段と、前記文書の固有表現と前記第1の言語と前記第2の言語に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する第3の取得手段と、前記補足情報を前記文書の翻訳結果に付加する付加手段を有する情報処理装置である。
請求項2の発明は、前記固有表現は、前記第1の言語で用いられている意味と前記第2の言語で用いられている意味が異なる表現である、請求項1に記載の情報処理装置である。
請求項3の発明は、前記補足情報として、意味が異なることの説明を含む、請求項2に記載の情報処理装置である。
請求項4の発明は、前記第1の取得手段は、前記第1の言語とともに、前記文書が作成された第1の国又は地域を取得し、前記第2の取得手段は、前記第2の言語とともに、前記文書の翻訳結果が用いられる第2の国又は地域を取得し、前記第3の取得手段は、前記固有表現と前記第1の言語と前記第1の国又は地域と前記第2の言語と前記第2の国又は地域に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する、請求項1に記載の情報処理装置である。
請求項5の発明は、前記固有表現は、前記第1の国又は地域で用いられている意味と前記第2の国又は地域で用いられている意味が異なる表現である、請求項4に記載の情報処理装置である。
請求項6の発明は、前記補足情報として、前記国又は地域での慣習上での相違の説明を含む、請求項5に記載の情報処理装置である。
請求項7の発明は、前記固有表現として、前記第2の国又は地域ではアクセスできないとされているURLを含む、請求項5又は6に記載の情報処理装置である。
請求項8の発明は、前記付加手段は、前記補足情報をルビ、又は、注意書きとして、前記翻訳結果に付加する、請求項1に記載の情報処理装置である。
請求項9の発明は、前記付加手段は、前記補足情報の文字を、少なくとも固有表現以外の翻訳結果である文字とは異なる形態とする、請求項7に記載の情報処理装置である。
請求項10の発明は、コンピュータを、翻訳対象の文書を受け付ける受付手段と、前記文書で用いられている言語である第1の言語を取得する第1の取得手段と、翻訳先の言語である第2の言語を取得する第2の取得手段と、前記文書の固有表現と前記第1の言語と前記第2の言語に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する第3の取得手段と、前記補足情報を前記文書の翻訳結果に付加する付加手段として機能させるための情報処理プログラムである。
請求項1の情報処理装置によれば、利用者に誤解の生じるおそれがある固有表現の翻訳結果に対して、その翻訳結果を説明する補足情報を付加することができる。
請求項2の情報処理装置によれば、固有表現として、第1の言語で用いられている意味と第2の言語で用いられている意味が異なる表現を対象とすることができる。
請求項3の情報処理装置によれば、補足情報として、意味が異なることの説明を含ませることができる。
請求項4の情報処理装置によれば、国又は地域によって、利用者に誤解の生じるおそれがある固有表現の翻訳結果に対して、その翻訳結果を説明する補足情報を付加することができる。
請求項5の情報処理装置によれば、固有表現として、第1の国又は地域で用いられている意味と第2の国又は地域で用いられている意味が異なる表現を対象とすることができる。
請求項6の情報処理装置によれば、補足情報として、国又は地域での慣習上での相違の説明を含ませることができる。
請求項7の情報処理装置によれば、固有表現として、第2の国又は地域ではアクセスできないとされているURLを含ませることができる。
請求項8の情報処理装置によれば、翻訳結果に、補足情報をルビ、又は、注意書きとして付加することができる。
請求項9の情報処理装置によれば、補足情報の文字を、固有表現以外の翻訳結果である文字とは区別して表示することができる。
請求項10の情報処理プログラムによれば、利用者に誤解の生じるおそれがある固有表現の翻訳結果に対して、その翻訳結果を説明する補足情報を付加することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 ユーザープロファイルテーブルのデータ構造例を示す説明図である。 固有表現翻訳置換テーブルのデータ構造例を示す説明図である。 単位変換テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 URL置換処理テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 文化補足テーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 文化補足テーブルのデータ構造例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である情報処理装置100は、翻訳処理を行うものであって、図1の例に示すように、文書受付モジュール105、翻訳対象言語・国取得モジュール110、翻訳先言語・国取得モジュール115、翻訳モジュール120、固有表現情報記憶モジュール125、固有表現抽出モジュール130、補足情報追記モジュール135、出力モジュール140を有している。情報処理装置100は、翻訳結果と補足情報を出力する。補足情報は、翻訳結果の説明であり、例えば、翻訳結果における背景の意味、留意事項等を含めてもよい。より具体的には、情報処理装置100は、文書を翻訳する際に、翻訳結果だけでは理解に齟齬が生じるような文書に対して、補足情報を付加する。つまり、翻訳結果自体は正しいが、翻訳結果を利用する者に誤解が発生するおそれがあるような場合に、その誤解の発生を抑制するために補足情報を付加するものである。
文書受付モジュール105は、翻訳対象言語・国取得モジュール110、翻訳モジュール120、固有表現抽出モジュール130と接続されている。文書受付モジュール105は、翻訳対象の文書を受け付け、その文書を翻訳対象言語・国取得モジュール110、翻訳モジュール120、固有表現抽出モジュール130に渡す。文書(ファイルとも言われる)とは、少なくともテキストデータを含み、数値データ、図形データ、画像データ、動画データ、音声データ等、又はこれらの組み合わせを含んでいてもよい。そして、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。具体的には、文書作成プログラムによって作成された文書、画像読取装置(スキャナ、カメラ等)で読み込まれた画像、Webページ等を含む。なお、画像読取装置で読み込まれた画像を受け付けた場合は、文字認識処理を行って、文字画像をテキストデータに変換したものであってもよい。
文書を受け付けるとは、例えば、記憶媒体(例えば、ハードディスク等であり、コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている文書を読み出すこと、画像読取装置で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること等が含まれる。受け付ける文書は、1枚であってもよいし、複数枚であってもよい。また、文書の内容として、ビジネスに用いられる文書、料理用レシピ、旅行ガイド、広告宣伝用のパンフレット等であってもよい。
翻訳対象言語・国取得モジュール110は、文書受付モジュール105、固有表現抽出モジュール130と接続されている。翻訳対象言語・国取得モジュール110は、文書受付モジュール105が受け付けた文書で用いられている言語である第1の言語を取得し、固有表現抽出モジュール130に渡す。例えば、文書に記載されている文字の文字コードから言語を判断してもよいし、ユーザーに言語を選択(又は、入力)させるようにしてもよいし、予め定められた言語の文書だけを取得する場合は、その予め定められた言語としてもよい。
さらに、翻訳対象言語・国取得モジュール110は、第1の言語とともに、文書が作成された第1の国又は地域を取得するようにしてもよい。例えば、言語と国又は地域とを対応させたテーブルを用意しておき、言語から国又は地域を取得するようにしてもよいし、文書の属性として作成された国又は地域が含まれている場合は、その属性から取得してもよいし、ユーザーに国又は地域を選択(又は、入力)させるようにしてもよいし、予め定められた国又は地域の文書だけを取得する場合は、その予め定められた国又は地域としてもよいし、その文書を作成したユーザーのSNS(Social Networking Service)におけるプロフィールからそのユーザーの国又は地域を取得するようにしてもよい。また、その国又は地域には、国籍、住所、居所等の意味を有していると解釈してもよい。さらに、その国又は地域から、宗教、人種等を取得するようにしてもよい。例えば、国又は地域と宗教、人種等を対応させたテーブルを用意しておき、国又は地域から宗教、人種等を取得するようにしてもよい。
翻訳先言語・国取得モジュール115は、固有表現抽出モジュール130と接続されている。翻訳先言語・国取得モジュール115は、翻訳先の言語である第2の言語を取得し、固有表現抽出モジュール130に渡す。例えば、ユーザーに言語を選択させるようにしてもよいし、予め定められた言語だけに翻訳する場合は、その予め定められた言語としてもよいし、その文書を利用するユーザーのSNSにおけるプロフィールからそのユーザーの使用言語を取得するようにしてもよい。
さらに、翻訳先言語・国取得モジュール115は、第2の言語とともに、文書の翻訳結果が用いられる第2の国又は地域を取得するようにしてもよい。例えば、言語と国又は地域とを対応させたテーブルを用意しておき、言語から国又は地域を取得するようにしてもよいし、ユーザーに国又は地域を選択(又は、入力)させるようにしてもよいし、予め定められた言語だけに翻訳する場合は、その予め定められた言語としてもよいし、その文書を利用するユーザーのSNSにおけるプロフィールからそのユーザーの国又は地域を取得するようにしてもよい。また、その国又は地域には、国籍、住所、居所等の意味を有していると解釈してもよい。さらに、その国又は地域から、宗教、人種等を取得するようにしてもよい。例えば、国又は地域と宗教、人種等を対応させたテーブルを用意しておき、国又は地域から宗教、人種等を取得するようにしてもよい。
翻訳モジュール120は、文書受付モジュール105、補足情報追記モジュール135と接続されている。翻訳モジュール120は、文書受付モジュール105が受け付けた文書を第2の言語(翻訳先言語・国取得モジュール115が取得した翻訳先の言語である第2の言語)に翻訳する。既存の翻訳技術を用いればよい。ここでの翻訳は、第1の言語から第2の言語への翻訳となる。
固有表現情報記憶モジュール125は、固有表現抽出モジュール130、補足情報追記モジュール135と接続されている。固有表現情報記憶モジュール125は、固有表現、その固有表現に対応する補足情報を記憶している。例えば、後述する固有表現翻訳置換テーブル600、単位変換テーブル700、URL置換処理テーブル900、文化補足テーブル1100、文化補足テーブル1300等を記憶している。固有表現情報記憶モジュール125は、固有表現抽出モジュール130によってアクセスされ、固有表現の抽出に利用され、補足情報追記モジュール135によってアクセスされ、補足情報の追加に利用される。
固有表現抽出モジュール130は、文書受付モジュール105、翻訳対象言語・国取得モジュール110、翻訳先言語・国取得モジュール115、固有表現情報記憶モジュール125、補足情報追記モジュール135と接続されている。固有表現抽出モジュール130は、文書受付モジュール105が受け付けた文書から固有表現を抽出する。具体的には、文書内の表現(単語、複数の単語を含む)が固有表現情報記憶モジュール125内の固有表現に該当するか否かを検査すればよい。
また、固有表現抽出モジュール130は、その文書の翻訳結果(翻訳モジュール120によって翻訳された後の文書)から固有表現を抽出するようにしてもよい。ここでの翻訳結果は、対象となっている文書を第2の言語に翻訳した結果(文書)である。もちろんのことながら、翻訳した結果である文書では、第2の言語が用いられている。
ここで固有表現は、第1の言語で用いられている意味と第2の言語で用いられている意味が異なる表現である。ここで「第1の言語で用いられている意味と第2の言語で用いられている意味」における「意味」として、慣習的(習慣、文化、民俗、習俗、宗教等を含む)な意味も含む。例えば、「13」という意味として、いずれの言語でも数字としての意味は同じであるが、単なる数字としてのみ用いられる言語(例えば、日本語)と慣習的には忌み嫌われる数字として扱われる言語(例えば、キリスト教圏で主に用いられている英語等の言語)がある。この場合、そもそも補足情報を付加する理由を含めた方が、利用者に誤解を生じさせないようにすることができる。
なお、厳密には、宗教が異なることによって(キリスト教であるか否かによって)、前述の相違がでてくるが、その言語を用いる人間は特定の宗教に属している場合が多い場合には、言語だけで判断してもよい。
固有表現抽出モジュール130が行う固有表現の抽出は、予め定められた固有表現を記憶しているテーブルを用いればよい。例えば、第1の言語と第2の言語の組み合わせに対応して、固有表現を記憶しているテーブルである。
さらに、固有表現抽出モジュール130は、固有表現と第1の言語と第1の国又は地域と第2の言語と第2の国又は地域に基づいて、その固有表現を第2の言語で説明する補足情報を取得するようにしてもよい。ここでの固有表現は、第1の国又は地域で用いられている意味と第2の国又は地域で用いられている意味が異なる表現である。また、意味が異なる表現として、宗教、人種等における意味が異なる表現を含めてもよい。
さらに、固有表現として、第2の国又は地域ではアクセスできないとされているURLを含めるようにしてもよい。
補足情報追記モジュール135は、翻訳モジュール120、固有表現情報記憶モジュール125、固有表現抽出モジュール130、出力モジュール140と接続されている。補足情報追記モジュール135は、固有表現と第1の言語と第2の言語に基づいて、その固有表現を第2の言語で説明する補足情報を固有表現情報記憶モジュール125から取得する。
そして、補足情報追記モジュール135は、補足情報を文書の翻訳結果に付加する。
補足情報の取得は、予め定められた補足情報を記憶しているテーブルを用いればよい。例えば、第1の言語と第2の言語と固有表現の組み合わせに対応して、補足情報を記憶しているテーブルである。
補足情報として、意味が異なることの説明(例えば、補足情報を付加する理由を含む)を含めるようにしてもよい。
また、補足情報として、国又は地域での慣習上での相違の説明を含めるようにしてもよい。
また、補足情報追記モジュール135は、補足情報をルビ、又は、注意書きとして、翻訳結果に付加するようにしてもよい。ここでルビとは、固有表現の付近に配置する小文字である。一般的には、振り仮名用に用いられるが、補足情報の記載に用いている。注意書きは、翻訳結果の文書の予め定められた領域(例えば、固有表現が記載されているページにおける下欄、最終ページ等)、又は、矩形領域等に記載されている。注意書きは、固有表現との対応がとれていればよい。例えば、固有表現に番号をルビとして付加し、その番号を付して注意書きを記載してもよい。
そして、補足情報追記モジュール135は、補足情報の文字を、少なくとも固有表現以外の翻訳結果である文字とは異なる形態(形状、模様、色彩、動的に変化すること(例えば、フラッシュ、アニメーション等)、点滅(点滅における変更対象は、点滅を行うか否か、点滅を行っている期間、点滅の間隔等がある)、又は、これらの組み合わせであってもよい)とするようにしてもよい。ここで、異なる形態として、例えば、文字サイズを小さくすること、文字色を赤色にすること、点滅させること等が含まれる。
また、固有表現の翻訳結果は、他の翻訳結果(固有表現ではない部分の翻訳結果)と同じ形態としてもよいが、異なる形態としてもよい。異なる形態とすれば、補足情報があることを利用者は把握しやすくなる。
出力モジュール140は、補足情報追記モジュール135と接続されている。出力モジュール140は、補足情報追記モジュール135によって補足情報が付加された翻訳結果(文書)を出力する。文書を出力するとは、例えば、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で画像を送信すること、文書データベース等の文書記憶装置へ文書を書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置へ渡すこと(電子メール等)等が含まれる。
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
図2(a)の例に示す画像処理装置200は、情報処理装置100を有している。画像処理装置200は、例えば、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)であって、スキャナで読み込んだ文書を文字認識し、翻訳して、補足情報を含む翻訳結果をプリンタが印刷する。その印刷された文書は、スキャン対象の文書のレイアウトを維持して翻訳結果が配置されていてもよい。
図2(b)の例に示すシステムでは、情報処理装置100、画像処理装置210、ユーザー端末220、文書リポジトリとしての文書記憶装置230は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100、文書記憶装置230による機能は、クラウドサービスとして実現してもよい。
例えば、画像処理装置210が文書を読み込み、文書画像を情報処理装置100に送信し、情報処理装置100から翻訳された文書(補足情報を含む翻訳結果)を受け取って印刷してもよい。また、ユーザー端末220のユーザーの操作によって、ユーザー端末220又は文書記憶装置230内の電子文書を情報処理装置100に送信し、情報処理装置100から翻訳された文書(補足情報を含む翻訳結果)を受け取ってもよい。その後、翻訳された文書を画像処理装置210で印刷してもよいし、文書記憶装置230に記憶させてもよい。
図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、文書受付モジュール105は、翻訳対象文書を受け付ける。
ステップS304では、翻訳モジュール120は、翻訳対象文書を翻訳する。
ステップS306では、翻訳対象言語・国取得モジュール110は、翻訳対象の文書情報を取得する。
ステップS308では、翻訳先言語・国取得モジュール115は、翻訳先の言語・国を取得する。
ステップS310では、固有表現抽出モジュール130は、翻訳対象文書から固有表現を抽出する。
ステップS312では、固有表現抽出モジュール130は、固有表現があるか否かを判断し、ある場合はステップS314へ進み、それ以外の場合はステップS320へ進む。
ステップS314では、補足情報追記モジュール135は、背景となる補足情報を取得する。
ステップS316では、補足情報追記モジュール135は、補足情報があるか否かを判断し、ある場合はステップS318へ進み、それ以外の場合(補足情報がない場合)はステップS320へ進む。
ステップS318では、補足情報追記モジュール135は、補足情報を翻訳済文書に反映する。なお、翻訳結果自体を変更することはしない。
ステップS320では、出力モジュール140は、翻訳結果を出力する。
以下に例を示す。
図4は、本実施の形態による処理例を示す説明図である。
例えば、「美味しさの秘訣は大さじ2の砂糖を入れることです」が翻訳対象文410である。翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(米国)420を取得した場合は、翻訳文430として、例えば、「The secret of taste is to put 2 tablespoons sugar」となる。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(オーストラリア)440を取得した場合は、翻訳文450として、例えば、「The secret of taste is to put 2 tablespoons sugar」となる。
ここで、米国と日本とでは「大さじ」の容量(15ml)が同じなので、翻訳文430そのままを翻訳結果とする。つまり、日本で用いられている「大さじ」の意味(容量)と米国で用いられている意味「tablespoons」の意味(容量)は同じなので、補足情報は不要である。
しかし、オーストラリアでは「大さじ」の容量は20mlであり、日本とは異なる。そこで、補足情報としてルビ455を翻訳文450に付加する。ルビ455として、例えば、「30ml」であり、これを「tablespoons」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
以下に、翻訳先(オーストラリア)440の場合の処理例を示す。翻訳対象文410には、「大さじ」「2」の表現がある。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「AU」を取得する。例えば、翻訳結果を利用するユーザーのユーザープロファイルテーブル500を、そのユーザーのSNSから取得する。図5は、ユーザープロファイルテーブル500のデータ構造例を示す説明図である。ユーザープロファイルテーブル500は、プロファイル欄510、年齢欄520、住所欄530、氏名欄540、国欄550等を有している。プロファイル欄510は、ユーザーの識別情報を記憶している。年齢欄520は、そのユーザーの年齢を記憶している。住所欄530は、そのユーザーの住所を記憶している。氏名欄540は、そのユーザーの氏名を記憶している。国欄550は、そのユーザーの国を記憶している。この例では、翻訳文450を利用するユーザーは「no3」である。
(2)固有表現抽出モジュール130は、固有表現翻訳置換テーブル600を用いて固有表現を取得する。図6は、固有表現翻訳置換テーブル600のデータ構造例を示す説明図である。固有表現翻訳置換テーブル600は、固有表現ID欄610、JP欄620、AU欄630、US欄640を有している。固有表現ID欄610は、本実施の形態において、固有表現を一意に識別するための情報(固有表現ID:IDentification)を記憶している。JP欄620は、日本における表現を記憶している。AU欄630は、オーストラリアにおける表現を記憶している。US欄640は、米国における表現を記憶している。例えば、「大さじ1」は、オーストラリア用に翻訳した場合は「1tablespoon」、米国用に翻訳した場合は「1tablespoon」である。
(3)固有表現抽出モジュール130は、単位変換テーブル700を用いて、同じ固有表現IDの原文(JP)と翻訳文(AU)で単位容量を比較する。図7は、単位変換テーブル700のデータ構造例を示す説明図である。単位変換テーブル700は、固有表現ID欄710、US Metric欄720、JP Metric欄730、AU Metric欄740を有している。固有表現ID欄710は、固有表現IDを記憶している。US Metric欄720は、米国における単位容量を記憶している。JP Metric欄730は、日本における単位容量を記憶している。AU Metric欄740は、オーストラリアにおける単位容量を記憶している。具体的には、単位変換テーブル700の2行目(固有表現ID:2)のJP Metric欄730(15ml)、AU Metric欄740(20ml)を取得する。
(4)翻訳文(AU)と原文(JP)とでは単位容量が異なるため、補足情報追記モジュール135は、翻訳文450に対して、正確な容量(30ml)を示しているルビ455を追記する。なお、「30ml」は、単位容量を示す「大さじ」(15ml)と量を示す「2」とから算出している。
なお、この例では、固有表現翻訳置換テーブル600で固有表現があり、単位変換テーブル700で単位容量が異なった場合に、補足情報を付加しているが、固有表現翻訳置換テーブル600を単位容量が異なるもの同士だけで構成して、固有表現翻訳置換テーブル600だけで補足情報を付加するか否かを判断するようにしてもよい。具体的には、固有表現ID欄610、JP欄620、AU欄630によって構成されているテーブルA、固有表現ID欄610、AU欄630、US欄640によって構成されているテーブルBの2つを用意する。なお、固有表現ID欄610、JP欄620、US欄640によって構成されているテーブルは不要である。同じ単位容量であるからである。
そして、翻訳対象の言語(又は国)、翻訳先の言語(又は国)から、テーブルAを選択し、このテーブルA内にあるので、補足情報を付加すべきと判断できる。その後で、単位変換テーブル700を用いて補足情報を生成してもよい。
なお、以下の例では、国又は地域を例としてあげているが、国又は地域に対応する部分を言語として読み替えてもよい。言語だけで対応することも可能である。後述するように、言語以外に国又は地域を用いることによって、翻訳結果の利用者にふさわしい補足情報の選択が可能となる。
図8は、本実施の形態による処理例を示す説明図である。文書中のURLがアクセス不可能な国のユーザーへの翻訳の場合、アクセス可能なURLを補足情報として付加するものである。つまり、特定の国からアクセスが難しいURLが記載されている場合は、アクセス可能なURLを付加している。
例えば、「最新の情報は、以下を参照してください。
https://ggg.gg/xxxx.xxxx」が翻訳対象文810である。
翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。
翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(米国)820を取得した場合は、翻訳文830として、例えば、「For the latest information, please see below.
https://ggg.gg/xxxx.xxxx」となる。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語は中国語、国又は地域は翻訳先(中国)840を取得した場合は、翻訳文850として、例えば、「最新の情報は、以下を参照してください。(中国語)
https://ggg.gg/xxxx.xxxx」である。なお、表現できる文字コードの関係で、以下、翻訳文内に「(中国語)」のように、かっこ書きの言語名がある場合は、その言語での翻訳文であることを示している。
ここで、URL「https://ggg.gg/xxxx.xxxx」は、米国においてもアクセス可能であるので、翻訳文830そのままを翻訳結果とする。
しかし、URL「https://ggg.gg/xxxx.xxxx」は、中国ではアクセスできないので短縮URLではなく、展開後のURLもルビ855として追記する。
ルビ855として、例えば、「https://www.ffffxxxxx.co.jp/service/scantlanslation/」であり、これを本来のURLの上に、本文のURL(翻訳文でもあるURL)よりも小さく、赤い文字で表示する。
以下に、翻訳先(中国)840の場合の処理例を示す。翻訳対象文810には、「ggg.gg」のURL表現がある。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「CHINA」を取得する。
(2)固有表現抽出モジュール130は、URL置換処理テーブル900を参照し、URLを変換する。図9は、URL置換処理テーブル900のデータ構造例を示す説明図である。URL置換処理テーブル900は、URL欄910、JP欄920、US欄930、China欄940を有している。URL欄910は、URLを記憶している。JP欄920は、日本での置換処理を記憶している。US欄930は、米国での置換処理を記憶している。China欄940は、中国での置換処理を記憶している。例えば、「変換必要」、「アクセス不可」等がある。また、「変換必要」の場合は、変換後のURLそのものを記憶していてもよいし、変換ルール等を記憶していてもよい。例えば、URL「https://ggg.gg/xxxx.xxxx」は、変換必要であることを取得し、変換ルールにしたがって変換して、「https://www.ffffxxxxx.co.jp/service/scantlanslation/」を取得する。
(3)補足情報追記モジュール135は、翻訳文850に対して、アクセス可能なURLを示しているルビ855を追記する。
翻訳結果を用いるユーザーの文化では理解できない情報を、補足情報として付加する例を図10、図12を用いて示す。つまり、翻訳対象文の国では通常の行為や事象だが、翻訳結果を用いるユーザーの国では理解ができない事象等に対して補足情報を付加することで誤解を抑制している。
図10は、本実施の形態による処理例を示す説明図である。
例えば、「A社ビルの13階で歓迎パーティが行われます」が翻訳対象文1010である。翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。翻訳先言語・国取得モジュール115は、翻訳先の言語は中国語、国又は地域は翻訳先(中国)1020を取得した場合は、翻訳文1030として、例えば、「A社ビルの13階で歓迎パーティが行われます(中国語)」となる。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語は英語、国又は地域は翻訳先(米国)1040を取得した場合は、翻訳文1050として、例えば、「A welcome party will be held on the 13th floor of A Building」となる。
米国では、13階という表現は不幸な数字(忌み数)であると一般的に思われている。日本では13階という表現は不幸な数字ではないことを補足情報として付加する。ルビ1055として、例えば、「In Japan, “13th floor” is not used as an unfortunate figure.」であり、これを「13th floor」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
以下に、翻訳先(米国)1040の場合の処理例を示す。翻訳対象文1010には、「13階」の表現がある。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「US」を取得する。
(2)固有表現抽出モジュール130は、文化補足テーブル1100を参照し、補足情報を取得する。図11は、文化補足テーブル1100のデータ構造例を示す説明図である。文化補足テーブル1100は、固有表現欄1110、JP欄1120、US欄1130、China欄1140を有している。固有表現欄1110は、固有表現を記憶している。JP欄1120は、翻訳先である日本における補足情報を記憶している。US欄1130は、翻訳先である米国における補足情報を記憶している。China欄1140は、翻訳先である中国における補足情報を記憶している。「○」は、その国で、その固有表現は用いることにその固有表現そのものの意味以外の意味はないことを示している。「×」は、その国で、その固有表現を用いるとその他の意味(不幸であることを示している等)があることを示している。例えば、「404号室」は、日本では忌み数が用いられていることから、忌避されることが多いが、アメリカではそのような意味はないことから、「アメリカでは「404号室」は不幸な数字としては使われていません。」との補足情報が記憶されている。
(3)補足情報追記モジュール135は、翻訳文1050に対して、留意事項を示しているルビ1055を追記する。
図12は、本実施の形態による処理例を示す説明図である。
例えば、「魚の煮物は日本で人気のある料理です。」が翻訳対象文1210である。翻訳対象言語・国取得モジュール110は、文字コードから翻訳対象言語は日本語、国又は地域は日本であることを取得する。翻訳先言語・国取得モジュール115は、翻訳先の言語はインドネシア語、国又は地域は翻訳先(インドネシア)1220を取得した場合は、翻訳文1230として、例えば、「Fish simmered is a popular dish in Japan.(インドネシア語)」となる。料理酒が使われることがあるので、ハラール認証の確認が必要であるので、補足情報としてルビ1235を翻訳文1230に付加する。ルビ1235として、例えば、「Cooking alcohol may be used..(インドネシア語)」であり、これを「Fish simmered(インドネシア語)」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
また、翻訳先言語・国取得モジュール115は、翻訳先の言語はアラビア語、国又は地域は翻訳先(アラブ首長国連邦)1240を取得した場合は、翻訳文1250として、例えば、「Fish simmered is a popular dish in Japan.(アラビア語)」である。同様に、補足情報としてルビ1255を翻訳文1250に付加する。ルビ1255として、例えば、「Confirmation of halal authentication is required..(アラビア語)」であり、これを「Fish simmered(アラビア語)」の上に、本文(翻訳文)よりも小さく、赤い文字で表示する。
なお、ルビ1235とルビ1255が異なるのは、国(又は、言語としてもよい)によってハラールの適用の厳格さが異なるためである。
以下に、翻訳先(アラブ首長国連邦)1240の場合の処理例を示す。翻訳対象文1210には、「魚の煮物」の表現がある。
(1)翻訳先言語・国取得モジュール115は、プロファイルから国情報「UAE」を取得する。
(2)固有表現抽出モジュール130は、文化補足テーブル1300を参照し、補足情報を取得する。図13は、文化補足テーブル1300のデータ構造例を示す説明図である。文化補足テーブル1300は、固有表現欄1310、JP欄1320、ID欄1330、UAE欄1340を有している。固有表現欄1310は、固有表現を記憶している。JP欄1320は、その固有表現の翻訳先である日本における補足情報を記憶している。ID欄1330は、その固有表現の翻訳先であるインドネシアにおける補足情報を記憶している。UAE欄1340は、その固有表現の翻訳先であるアラブ首長国連邦における補足情報を記憶している。「○」は、その国で、その固有表現は用いることにその固有表現そのものの意味以外の意味はないことを示している。「×」は、その国で、その固有表現を用いるとその他の意味(注意事項等であって、例えば、ハラール認証の確認が必要であること等)があることを示している。例えば、「Confirmation of halal authentication is required..(アラビア語)」との補足情報が記憶されている。
(3)補足情報追記モジュール135は、翻訳文1250に対して、留意事項を示しているルビ1255を追記する。
なお、本実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、図14に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。つまり、具体例として、処理部(演算部)としてCPU1401を用い、記憶装置としてRAM1402、ROM1403、HD1404を用いている。HD1404として、例えばハードディスク、SSD(Solid State Drive)を用いてもよい。文書受付モジュール105、翻訳対象言語・国取得モジュール110、翻訳先言語・国取得モジュール115、翻訳モジュール120、固有表現抽出モジュール130、補足情報追記モジュール135、出力モジュール140等のプログラムを実行するCPU1401と、そのプログラムやデータを記憶するRAM1402と、本コンピュータを起動するためのプログラム等が格納されているROM1403と、固有表現情報記憶モジュール125としての機能を有する補助記憶装置(フラッシュ・メモリ等であってもよい)であるHD1404と、キーボード、マウス、タッチスクリーン、マイク、カメラ(視線検知カメラ等を含む)等に対する利用者の操作(動作、音声、視線等を含む)に基づいてデータを受け付ける受付装置1406と、CRT、液晶ディスプレイ、スピーカー等の出力装置1405と、ネットワークインタフェースカード等の通信ネットワークと接続するための通信回線インタフェース1407、そして、それらをつないでデータのやりとりをするためのバス1408により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。
前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図14に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図14に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図14に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
第1の言語(又は、国又は地域)で用いられている意味と第2の言語(又は、国又は地域)で用いられている意味が異なる表現として、前述したものの他、ホテルのフロアー、タクシーの止め方(特に、ギリシャにおけるタクシーの止め方)、観光情報の注意事項等を含めてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理装置
105…文書受付モジュール
110…翻訳対象言語・国取得モジュール
115…翻訳先言語・国取得モジュール
120…翻訳モジュール
125…固有表現情報記憶モジュール
130…固有表現抽出モジュール
135…補足情報追記モジュール
140…出力モジュール
200…画像処理装置
210…画像処理装置
220…ユーザー端末
230…文書記憶装置
290…通信回線

Claims (10)

  1. 翻訳対象の文書を受け付ける受付手段と、
    前記文書で用いられている言語である第1の言語を取得する第1の取得手段と、
    翻訳先の言語である第2の言語を取得する第2の取得手段と、
    前記文書の固有表現と前記第1の言語と前記第2の言語に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する第3の取得手段と、
    前記補足情報を前記文書の翻訳結果に付加する付加手段
    を有する情報処理装置。
  2. 前記固有表現は、前記第1の言語で用いられている意味と前記第2の言語で用いられている意味が異なる表現である、
    請求項1に記載の情報処理装置。
  3. 前記補足情報として、意味が異なることの説明を含む、
    請求項2に記載の情報処理装置。
  4. 前記第1の取得手段は、前記第1の言語とともに、前記文書が作成された第1の国又は地域を取得し、
    前記第2の取得手段は、前記第2の言語とともに、前記文書の翻訳結果が用いられる第2の国又は地域を取得し、
    前記第3の取得手段は、前記固有表現と前記第1の言語と前記第1の国又は地域と前記第2の言語と前記第2の国又は地域に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する、
    請求項1に記載の情報処理装置。
  5. 前記固有表現は、前記第1の国又は地域で用いられている意味と前記第2の国又は地域で用いられている意味が異なる表現である、
    請求項4に記載の情報処理装置。
  6. 前記補足情報として、前記国又は地域での慣習上での相違の説明を含む、
    請求項5に記載の情報処理装置。
  7. 前記固有表現として、前記第2の国又は地域ではアクセスできないとされているURLを含む、
    請求項5又は6に記載の情報処理装置。
  8. 前記付加手段は、前記補足情報をルビ、又は、注意書きとして、前記翻訳結果に付加する、
    請求項1に記載の情報処理装置。
  9. 前記付加手段は、前記補足情報の文字を、少なくとも固有表現以外の翻訳結果である文字とは異なる形態とする、
    請求項7に記載の情報処理装置。
  10. コンピュータを、
    翻訳対象の文書を受け付ける受付手段と、
    前記文書で用いられている言語である第1の言語を取得する第1の取得手段と、
    翻訳先の言語である第2の言語を取得する第2の取得手段と、
    前記文書の固有表現と前記第1の言語と前記第2の言語に基づいて、該固有表現を該第2の言語で説明する補足情報を取得する第3の取得手段と、
    前記補足情報を前記文書の翻訳結果に付加する付加手段
    として機能させるための情報処理プログラム。
JP2017181096A 2017-09-21 2017-09-21 情報処理装置及び情報処理プログラム Active JP7027757B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017181096A JP7027757B2 (ja) 2017-09-21 2017-09-21 情報処理装置及び情報処理プログラム
US15/913,227 US11256880B2 (en) 2017-09-21 2018-03-06 Information processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017181096A JP7027757B2 (ja) 2017-09-21 2017-09-21 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2019057137A true JP2019057137A (ja) 2019-04-11
JP7027757B2 JP7027757B2 (ja) 2022-03-02

Family

ID=65720283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017181096A Active JP7027757B2 (ja) 2017-09-21 2017-09-21 情報処理装置及び情報処理プログラム

Country Status (2)

Country Link
US (1) US11256880B2 (ja)
JP (1) JP7027757B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7126282B1 (ja) 2021-06-29 2022-08-26 クェスタ株式会社 情報提供装置、情報提供方法及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7396061B2 (ja) * 2020-01-15 2023-12-12 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
JP2014503098A (ja) * 2011-01-06 2014-02-06 クアルコム,インコーポレイテッド 移動局に翻訳情報サービスを提供する際に使用するための方法および装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990076935A (ko) * 1997-03-31 1999-10-25 다카노 야스아키 문서처리방법,및기계번역장치
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
JP3896084B2 (ja) 2003-01-16 2007-03-22 株式会社東芝 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置
US20100070265A1 (en) * 2003-05-28 2010-03-18 Nelson David D Apparatus, system, and method for multilingual regulation management
US20040243391A1 (en) * 2003-05-28 2004-12-02 Nelson David D. Apparatus, system, and method for multilingual regulation management
JP4263181B2 (ja) 2005-03-28 2009-05-13 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4050755B2 (ja) 2005-03-30 2008-02-20 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4064413B2 (ja) * 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8972268B2 (en) * 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US8875019B2 (en) * 2010-03-16 2014-10-28 International Business Machines Corporation Virtual cultural attache
US9864809B2 (en) * 2010-07-13 2018-01-09 Motionpoint Corporation Dynamic language translation of web site content
JP5144736B2 (ja) * 2010-11-10 2013-02-13 シャープ株式会社 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
WO2013086666A1 (en) * 2011-12-12 2013-06-20 Google Inc. Techniques for assisting a human translator in translating a document including at least one tag
WO2014186346A1 (en) * 2013-05-13 2014-11-20 Mango Languages Method and system for motion picture assisted foreign language learning
US9342505B2 (en) * 2013-06-02 2016-05-17 Jianqing Wu Translation protocol for large discovery projects
KR20150085145A (ko) * 2014-01-13 2015-07-23 한국전자통신연구원 사용자 반응 기반 통역 시스템 및 그 방법
US10248653B2 (en) * 2014-11-25 2019-04-02 Lionbridge Technologies, Inc. Information technology platform for language translation and task management
JP6320982B2 (ja) * 2014-11-26 2018-05-09 ネイバー コーポレーションNAVER Corporation 翻訳文エディタ提供装置、並びに翻訳文エディタ提供方法
CN108156825B (zh) * 2015-11-13 2023-08-08 柯达阿拉里斯股份有限公司 跨文化问候卡系统
US10191903B2 (en) * 2016-09-30 2019-01-29 Microsoft Technology Licensing, Llc Customized and contextual translated content for travelers

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
JP2014503098A (ja) * 2011-01-06 2014-02-06 クアルコム,インコーポレイテッド 移動局に翻訳情報サービスを提供する際に使用するための方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7126282B1 (ja) 2021-06-29 2022-08-26 クェスタ株式会社 情報提供装置、情報提供方法及びプログラム
JP2023005805A (ja) * 2021-06-29 2023-01-18 クェスタ株式会社 情報提供装置、情報提供方法及びプログラム

Also Published As

Publication number Publication date
US20190087416A1 (en) 2019-03-21
US11256880B2 (en) 2022-02-22
JP7027757B2 (ja) 2022-03-02

Similar Documents

Publication Publication Date Title
JP6544131B2 (ja) 情報処理装置及び情報処理プログラム
US9262104B2 (en) Information processing apparatus, image processing apparatus, and information processing system
CN111176650B (zh) 解析器生成方法、检索方法、服务器及存储介质
CN101512518B (zh) 自然语言处理系统和词典登录系统
WO2014205232A1 (en) Language input method editor to disambiguate ambiguous phrases via diacriticization
JP2016001403A (ja) テンプレート管理装置及びプログラム
CN107148624A (zh) 预处理文本的方法以及用于执行该方法的预处理系统
CN110008807B (zh) 一种合同内容识别模型的训练方法、装置及设备
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
US20080313607A1 (en) Unified input stack
CN107590136B (zh) 翻译设备、翻译系统以及翻译方法
US11165737B2 (en) Information processing apparatus for conversion between abbreviated name and formal name
JP7027696B2 (ja) 情報処理装置及び情報処理プログラム
JP6897168B2 (ja) 情報処理装置及び情報処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP6203083B2 (ja) 未知語抽出装置及び未知語抽出方法
KR101561673B1 (ko) 클라우드를 이용한 문서 내의 텍스트 변환 방법 및 그 방법이 기록된 기록매체
US20240135100A1 (en) Information processing apparatus, information processing method, and program
JP7342518B2 (ja) 画像処理装置及び画像処理プログラム
JP6702047B2 (ja) 翻訳装置、翻訳システムおよびプログラム
JP2012063822A (ja) 情報処理装置及び情報処理プログラム
CN110874519B (zh) 一种将Markdown文档转换为PDF文档的方法、装置
JP2017040988A (ja) 情報処理装置及び情報処理プログラム
JP6476988B2 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220131

R150 Certificate of patent or registration of utility model

Ref document number: 7027757

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150