JP2010066926A - 翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法 - Google Patents
翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法 Download PDFInfo
- Publication number
- JP2010066926A JP2010066926A JP2008231441A JP2008231441A JP2010066926A JP 2010066926 A JP2010066926 A JP 2010066926A JP 2008231441 A JP2008231441 A JP 2008231441A JP 2008231441 A JP2008231441 A JP 2008231441A JP 2010066926 A JP2010066926 A JP 2010066926A
- Authority
- JP
- Japan
- Prior art keywords
- data
- language
- translation
- simple sentence
- language simple
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】第1言語で表現された原文データ13を受け取り、翻訳処理部40は、前記原文データに基づいて第1の対訳データ記憶部32に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部44と、翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを第1の対訳データ記憶部34から読み出して、読み出した第2言語単文データに基づき訳文データを出力する対訳出力処理部48とを含む。前記第1言語単文データの語句にキーワード情報が設定され、前記キーワード情報に基づき前記原文データと前記第1言語単文データとを比較して、比較結果に基づき前記第1の対訳データ記憶部からいずれかの第1言語単文データを翻訳対象として選択する。
【選択図】図1
Description
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、してコンピュータを機能させ、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、
を含み、
第1の対訳データ記憶部は、
少なくとも1つの前記第1言語単文データを構成する少なくとも1つの語句を特定するためのキーワード情報を含み、
前記翻訳対象選択処理部は、
前記キーワード情報に基づき前記原文データと前記第1言語単文データとを比較して、比較結果に基づき前記第1の対訳データ記憶部かいらずれかの第1言語単文データを翻訳対象として選択することを特徴とする。
前記翻訳対象選択処理部は、
前記原文データと前記第1言語単文データとを比較する際に、前記第1言語単文データの前記キーワード情報に基づき特定される語句が前記原文データに含まれているか否か判断し、否と判断した場合には、前記第1言語単文データを選択対象から除外して翻訳対象を選択する処理又は前記第1言語単文データの選択優先度を下げて翻訳対象を選択する処理を行ってもよい。
前記翻訳対象選択処理部は、
前記原文データと前記第1言語単文データとを比較して、前記第1言語単文データの前記キーワード情報に基づき特定される語句とそれ以外の語句とでは異なる重み付けを行い類似度を演算し、演算された類似度に基づき前記第1の対訳データ記憶部からいずれかの第1言語単文データを翻訳対象として選択してもよい。
第1の対訳データ記憶部は、
前記第1言語単文データの前記キーワード情報によって特定される語句についてレベルが設定され、
前記翻訳対象選択処理部は、
前記原文データと前記第1言語単文データとを比較して、前記第1言語単文データの前記キーワード情報に基づき特定される語句については設定されたレベルに応じて異なる重み付けを行い類似度を演算し、演算された類似度に基づき前記第1の対訳データ記憶部からいずれかの第1言語単文データを翻訳対象として選択してもよい。
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
第1言語で表現された複数の第1言語語句データと、第2言語で表現された複数の第2言語語句データとを含み、対訳関係を有する前記第1言語語句データと前記第2言語語句データとが関連付けられて記憶された第2の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、してコンピュータを機能させ、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データには含まれないが原文データには含まれている語句である補足語を検出して、前記第2の対訳データ記憶部から補足語に対応した第1言語語句データと対訳関係を有する第2言語語句データを読み出す補足語抽出処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含み、
前記対訳出力処理部は、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データに読み出した第2言語語句データを添付し、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力してもよい。
前記対訳出力処理部は、
読み出した第2言語語句データが所定の語句であるか否か判断し、所定の語句であると判断した場合には、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力してもよい。
前記第2の対訳データ記憶部は、
前記第1言語語句データ及び前記第2言語語句データの少なくとも一方に関連づけて記憶された属性情報を含み、
前記対訳出力処理部は、
前記属性情報に基づき、読み出した第2言語語句データまたは前記第2言語語句データと対訳関係にある前記第1言語語句データが所定の属性であるか否か判断し、所定の属性であると判断した場合には、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力してもよい。
前記対訳出力処理部は、
選択された第1言語単文データに所定の語句が含まれているか否か判断し、所定の語句が含まれていると判断した場合には、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力してもよい。
所定の言語で表現された音声またはテキストによる呼びかけデータを記憶する呼びかけデータ記憶部と、
操作入力情報に基づき前記所与の呼びかけデータに対応した音声又はテキストの出力を行う呼びかけデータ出力部とを、含むんでもよい。
前記翻訳対象選択処理部は、
前記原文データに基づいて複数の第1言語単文データを翻訳対象選択候補として抽出し、抽出された翻訳対象選択候補を出力し(表示し)、
受け取った選択入力情報に基づき、第1言語単文データを選択してもよい。
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、を含み、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含むことを特徴とする翻訳システムの製造方法であって、
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶され、第1言語単文データ及び第2言語単文データの少なくとも一方に関連づけて、利用場面に関するデータ利用場面情報が設定された対訳データベースを作成するステップと、
翻訳システムの利用場面に関するシステム利用場面情報を受け取るステップと、
前記システム利用場面情報とデータ利用場面情報とに基づいて対訳データベースから対訳データを抽出するステップと、
抽出した対訳データに基づき翻訳システムの第1の対訳データ記憶部を製造するステップを、含むことを特徴とする。
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、してコンピュータを機能させ、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含む。
前記翻訳処理部は、
入力された原文データから特徴語を抽出する特徴語抽出処理部を含み、
前記翻訳対象選択処理部は、
前記第1の対訳データ記憶部から前記特徴語を含む第1言語単文データを抽出して、抽出結果に基づきいずれかの第1言語単文データを翻訳対象として選択してもよい。
特徴語を含む第1言語単文データが複数抽出された場合には、抽出された複数の第1言語単文データと原文データの類似度を判断し、判断結果に基づき第1言語単文データを選択してもよい。例えば最も類似度が高いと判断した第1言語単文データを選択してもよい。
前記第1の対訳データ記憶部は、
対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連した管理ID(例えば同じ管理ID)に対応付けて記憶されており、
前記対訳出力処理部は、
前記管理ID(例えば同じ管理ID)に基づき対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して前記訳文データとして出力してもよい。
第1言語で表現された複数の第1言語語句データと、第2言語で表現された複数の第2言語語句データとを含み、対訳関係を有する前記第1言語語句データと前記第2言語語句データとが関連付けられて記憶された第2の対訳データ記憶部(単語、慣用句辞書)を含み、
前記翻訳処理部は、
翻訳対象として選択された第1言語単文データには含まれないが原文データには含まれている語句である補足語を検出して、前記第2の対訳データ記憶部から補足語に対応した第1言語語句データと対訳関係を有する第2言語語句データを読み出す補足語抽出処理部を含み、
前記対訳出力処理部は、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データに読み出した第2言語語句データを添付して、前記訳文データとして出力してもよい。
第1言語で表現された代表語句と所定の関連を有する関連語句の情報である関連語句情報が記憶されている関連語句情報記憶部をさらに含み、
前記翻訳対象選択処理部は、
前記関連語句情報に基づき、入力された原文データが前記関連語句を含むか否か判断し、含むと判断した場合には、原文データの関連語句の部分を当該関連語句と所定の関連を有する代表語句に置換して、置換後の原文データに基づいて、前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択し、
前記補足語抽出処理部は、
前記関連語句に対応した第1言語語句データと対訳関係を有する第2言語語句データを前記第2の対訳データ記憶部から読み出し、
前記対訳出力処理部は、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データに読み出した第2言語語句データを添付して、前記訳文データとして出力してもよい。
翻訳対象として選択された第1言語単文データの後ろに、読み出した第2言語語句データを添付して前記訳文データとして出力してもよい。
前記第1の対訳データ記憶部は、
意味内容が同じで表現形式が異なる複数の第1言語単文データがグループ化されて記憶され、グループに属するいずれかの第1言語単文データに代表データの指定がされており、
前記翻訳対象選択処理部は、
原文データに基づき抽出された第1言語単文データがグループ化されている場合には、当該グループの代表データの指定がなされている第1言語単文データを翻訳対象として抽出してもよい。
前記第1の対訳データ記憶部は、
意味内容が同じで表現形式が異なる複数の第2言語単文データがグループ化されて記憶され、グループに属するいずれかの第2言語単文データに代表データの指定がされており、
前記対訳出力処理部は、
選択された第1言語単文データと対訳関係を有する第2言語単文データがグループ化されている場合には、当該グループの代表データの指定がなされている第2言語単文データに基づき前記訳文データを出力してもよい。
前記第1の対訳データ記憶部は、
対訳関係を有する前記第1言語単文データのグループと前記第2言語単文データのグループとがグループ単位で関連付けられていてもよい。
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データに含まれる特徴語が記憶されており、
前記翻訳対象選択処理部は、
前記第1の対訳データ記憶部を検索して、抽出された特徴語に関連づけられている第1言語単文データを抽出してもよい。
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データの利用場面に関するデータ利用場面情報が記憶されており、
前記翻訳処理部は、
前記第1言語で表現された原文データに関連づけて、前記原文データの利用場面に関する原文利用場面情報を受け取り、
前記翻訳対象選択処理部は、
前記原文利用場面情報とデータ利用場面情報とに基づいて翻訳対象を選択してもよい。
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データの話し手/聞き手に関するデータ話し手/聞き手情報が記憶されており、
前記翻訳処理部は、
前記第1言語で表現された原文データに関連づけて、前記原文データの話し手/聞き手に関する原文話し手/聞き手情報を受け取り、
前記翻訳対象選択処理部は、
前記原文話し手/聞き手情報とデータ話し手/聞き手情報とに基づいて翻訳対象を選択してもよい。
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データの事実/質問に関するデータ事実/質問情報が記憶されており、
前記翻訳処理部は、
前記第1言語で表現された原文データに関連づけて、前記原文データの事実/質問に関する原文事実/質問情報を受け取り、
前記翻訳対象選択処理部は、
前記原文事実/質問情報とデータ事実/質問情報とに基づいて翻訳対象を選択してもよい。
前記翻訳対象選択処理部は、
前記第1の対訳データ記憶部から特徴語を含む複数の第1言語単文データを抽出し、原文データにおける前記複数の第1言語単文データとの一致部分が所定の分布条件を満たすか否か判断し、満たすと判断した場合には、前記複数の第1言語単文データを翻訳対象として選択し、
前記対訳出力処理部は、
翻訳対象となった前記複数の第1言語単文データとそれぞれ対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出し、読み出された複数の第2言語単文データを接続して前記訳文データとして出力してもよい。
前記翻訳対象選択処理部は、
前記前記原文データに基づいて複数の第1言語単文データを抽出し、抽出された複数の第1言語単文データについてそれぞれ原文データとの類似度を判断する類似度判断処理を行い、判断結果に基づき翻訳対象となる第1言語単文データを選択してもよい。
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、を含み、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含む。
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された対訳データベースの製造方法であって、
対訳関係を有する前記第1言語単文データと前記第2言語単文データとを関連した管理IDに対応付けて記憶させる。
意味内容が同じで表現形式が異なる複数の第1言語単文データ及び意味内容が同じで表現形式が異なる複数の第1言語単文データをグループ化して記憶させ、対訳関係を有する前記第1言語単文データのグループと前記第2言語単文データのグループとをグループ単位で、関連した管理IDで管理してもよい。
前記グループに属するいずれかの第1言語単文データ及び第2言語単文データの少なくとも一方に代表データの指定を行ってもよい。
以下、本発明を適用した第1の実施の形態に係る翻訳システム1について説明する。
図1は本実施の形態の翻訳システム(または翻訳プログラムをコンピュータで実行することにより実現される各部)1の機能ブロック図である。
図3に、第1の対訳データ記憶部32に記憶される単文(第1言語単文及び第2言語単文)の一例を示す。本実施の形態では、図3に示すように、第1言語単文データと第2言語単文データとが、対訳となるように関連付けて記憶されている。本実施の形態では、第1言語単文データ及び第2言語単文データは、ASCIIコードやJISコードで構成されたテキストデータであってもよい。
図6〜図15は、本実施の形態の翻訳処理の具体例について説明するための図である。
本実施の形態に係る対訳データベースの製造方は第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された対訳データベースの製造方法であって、対訳関係を有する前記第1言語単文データと前記第2言語単文データとを関連した管理IDに対応付けて記憶させる。
図17(A)(B)は、図18(A)(B)はキーワード情報に基づく翻訳対象選択処理について説明するための図である。ここでは第1言語が日本語、第2言語が英語である場合を例にとり説明する。
(ステップS60)。
図20(A)(B)は、補足語がある場合の対訳出力処理について説明するための図である。ここでは第1言語が英語、第2言語が日本語である場合を例にとり説明する。
読み出した第2言語語句データが所定の語句「早く」でない場合には、読み出した第2言語語句データまたは前記第2言語語句データと対訳関係にある前記第1言語語句データが所定の属性(例えば名詞)であるか否か判断し(ステップS230)、所定の属性(例えば名詞)であると判断した場合には、翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データとともに、所定の属性(例えば名詞)の第2言語語句データ後に「です」を添付して、前記訳文データとして出力する(ステップS240)
所定の属性(例えば名詞)でないと判断した場合には、翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データとともに、読み出した第2言語語句データを添付して、前記訳文データとして出力する(ステップS250)
図23は、補足語処理の流れの他の一例を示すフローチャートである。
図24は、翻訳対象選候補の選択肢表示について説明する図である。
図25(A)(B)は、多言語音声ガイダンスについて説明するための図である。
図26は翻訳システムの製造方法について説明するためのフローチャート図である。
このようにシステム利用場面情報としてユーザが必要なものを指定することで、ユーザにとって必要十分な対訳データが記憶された第1の対訳データ記憶部を有する翻訳システム(翻訳装置)を製造することが出来る。
Claims (29)
- 第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、してコンピュータを機能させ、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、
を含み、
第1の対訳データ記憶部は、
少なくとも1つの前記第1言語単文データを構成する少なくとも1つの語句を特定するためのキーワード情報を含み、
前記翻訳対象選択処理部は、
前記キーワード情報に基づき前記原文データと前記第1言語単文データとを比較して、比較結果に基づき前記第1の対訳データ記憶部からいずれかの第1言語単文データを翻訳対象として選択することを特徴とする翻訳プログラム。 - 請求項1において、
前記翻訳対象選択処理部は、
前記原文データと前記第1言語単文データとを比較する際に、前記第1言語単文データの前記キーワード情報に基づき特定される語句が前記原文データに含まれているか否か判断し、否と判断した場合には、前記第1言語単文データを選択対象から除外して翻訳対象を選択する処理又は前記第1言語単文データの選択優先度を下げて翻訳対象を選択する処理を行うことを特徴とする翻訳プログラム。 - 請求項1乃至2のいずれかにおいて、
前記翻訳対象選択処理部は、
前記原文データと前記第1言語単文データとを比較して、前記第1言語単文データの前記キーワード情報に基づき特定される語句とそれ以外の語句とでは異なる重み付けを行い類似度を演算し、演算された類似度に基づき前記第1の対訳データ記憶部からいずれかの第1言語単文データを翻訳対象として選択することを特徴とする翻訳プログラム。 - 請求項1乃至3のいずれかにおいて、
第1の対訳データ記憶部は、
前記第1言語単文データの前記キーワード情報によって特定される語句についてレベルが設定され、
前記翻訳対象選択処理部は、
前記原文データと前記第1言語単文データとを比較して、前記第1言語単文データの前記キーワード情報に基づき特定される語句については設定されたレベルに応じて異なる重み付けを行い類似度を演算し、演算された類似度に基づき前記第1の対訳データ記憶部からいずれかの第1言語単文データを翻訳対象として選択することを特徴とする翻訳プログラム。 - 第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
第1言語で表現された複数の第1言語語句データと、第2言語で表現された複数の第2言語語句データとを含み、対訳関係を有する前記第1言語語句データと前記第2言語語句データとが関連付けられて記憶された第2の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、してコンピュータを機能させ、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データには含まれないが原文データには含まれている語句である補足語を検出して、前記第2の対訳データ記憶部から補足語に対応した第1言語語句データと対訳関係を有する第2言語語句データを読み出す補足語抽出処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含み、
前記対訳出力処理部は、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データに読み出した第2言語語句データを添付し、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項5において、
前記対訳出力処理部は、
読み出した第2言語語句データが所定の語句であるか否か判断し、所定の語句であると判断した場合には、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項5又は6のいずれかにおいて、
前記第2の対訳データ記憶部は、
前記第1言語語句データ及び前記第2言語語句データの少なくとも一方に関連づけて記憶された属性情報を含み、
前記対訳出力処理部は、
前記属性情報に基づき、読み出した第2言語語句データまたは前記第2言語語句データと対訳関係にある前記第1言語語句データが所定の属性であるか否か判断し、所定の属性であると判断した場合には、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項5において、
前記対訳出力処理部は、
選択された第1言語単文データに所定の語句が含まれているか否か判断し、所定の語句が含まれていると判断した場合には、読み出した第2言語語句データの前又は後に所定の第2言語語句データを添付して、前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項1乃至8のいずれかにおいて、
所定の言語で表現された音声またはテキストによる呼びかけデータを記憶する呼びかけデータ記憶部と、
操作入力情報に基づき前記所与の呼びかけデータに対応した音声又はテキストの出力を行う呼びかけデータ出力部とを、含むことを特徴とする翻訳プログラム。 - 請求項1乃至9のいずれかにおいて、
前記翻訳対象選択処理部は、
前記原文データに基づいて複数の第1言語単文データを翻訳対象選択候補として抽出し、抽出された翻訳対象選択候補を出力し、
受け取った選択入力情報に基づき、第1言語単文データを選択することを特徴とする翻訳プログラム。 - 第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、を含み、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含むことを特徴とする翻訳システムの製造方法であって、
第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶され、第1言語単文データ及び第2言語単文データの少なくとも一方に関連づけて、利用場面に関するデータ利用場面情報が設定された対訳データベースを作成するステップと、
翻訳システムの利用場面に関するシステム利用場面情報を受け取るステップと、
前記システム利用場面情報とデータ利用場面情報とに基づいて対訳データベースから対訳データを抽出するステップと、
抽出した対訳データに基づき翻訳システムの第1の対訳データ記憶部を製造するステップを、含むことを特徴とする翻訳システムの製造方法。 - 第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、してコンピュータを機能させ、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含むことを特徴とする翻訳プログラム。 - 請求項12において、
前記翻訳処理部は、
入力された原文データから特徴語を抽出する特徴語抽出処理部を含み、
前記翻訳対象選択処理部は、
前記第1の対訳データ記憶部から前記特徴語を含む第1言語単文データを抽出して、抽出結果に基づきいずれかの第1言語単文データを翻訳対象として選択することを特徴とする翻訳プログラム。 - 請求項12乃至13のいずれかにおいて、
前記第1の対訳データ記憶部は、
対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連した管理IDに対応付けて記憶されており、
前記対訳出力処理部は、
前記管理IDに基づき対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項12乃至14のいずれかにおいて、
第1言語で表現された複数の第1言語語句データと、第2言語で表現された複数の第2言語語句データとを含み、対訳関係を有する前記第1言語語句データと前記第2言語語句データとが関連付けられて記憶された第2の対訳データ記憶部を含み、
前記翻訳処理部は、
翻訳対象として選択された第1言語単文データには含まれないが原文データには含まれている語句である補足語を検出して、前記第2の対訳データ記憶部から補足語に対応した第1言語語句データと対訳関係を有する第2言語語句データを読み出す補足語抽出処理部とを含み、
前記対訳出力処理部は、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データに読み出した第2言語語句データを添付して、前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項15において、
第1言語で表現された代表語句と所定の関連を有する関連語句の情報である関連語句情報が記憶されている関連語句情報記憶部をさらに含み、
前記翻訳対象選択処理部は、
前記関連語句情報に基づき、入力された原文データが前記関連語句を含むか否か判断し、含むと判断した場合には、原文データの関連語句の部分を当該関連語句と所定の関連を有する代表語句に置換して、置換後の原文データに基づいて、前記第1の対訳データ記憶
部に記憶されたいずれかの第1言語単文データを翻訳対象として選択し、
前記補足語抽出処理部は、
前記関連語句に対応した第1言語語句データと対訳関係を有する第2言語語句データを前記第2の対訳データ記憶部から読み出し、
前記対訳出力処理部は、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データに読み出した第2言語語句データを添付して、前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項12乃至請求項16のいずれかにおいて、
前記第1の対訳データ記憶部は、
意味内容が同じで表現形式が異なる複数の第1言語単文データがグループ化されて記憶され、グループに属するいずれかの第1言語単文データに代表データの指定がされており、
前記翻訳対象選択処理部は、
原文データに基づき抽出された第1言語単文データがグループ化されている場合には、当該グループの代表データの指定がなされている第1言語単文データを翻訳対象として抽出することを特徴とする翻訳プログラム。 - 請求項12乃至請求項17のいずれかにおいて、
前記第1の対訳データ記憶部は、
意味内容が同じで表現形式が異なる複数の第2言語単文データがグループ化されて記憶され、グループに属するいずれかの第2言語単文データに代表データの指定がされており、
前記対訳出力処理部は、
選択された第1言語単文データと対訳関係を有する第2言語単文データがグループ化されている場合には、当該グループの代表データの指定がなされている第2言語単文データに基づき前記訳文データを出力することを特徴とする翻訳プログラム。 - 請求項17に従属する請求項18において、
前記第1の対訳データ記憶部は、
対訳関係を有する前記第1言語単文データのグループと前記第2言語単文データのグループとがグループ単位で関連付けられていることを特徴とする翻訳プログラム。 - 請求項12乃至請求項19のいずれかにおいて、
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データに含まれる特徴語が記憶されており、
前記翻訳対象選択処理部は、
前記第1の対訳データ記憶部を検索して、抽出された特徴語に関連づけられている第1言語単文データを抽出することを特徴とする翻訳プログラム。 - 請求項11乃至請求項20のいずれかにおいて、
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データの利用場面に関するデータ利用場面情報が記憶されており、
前記翻訳処理部は、
前記第1言語で表現された原文データに関連づけて、前記原文データの利用場面に関する原文利用場面情報を受け取り、
前記翻訳対象選択処理部は、
前記原文利用場面情報とデータ利用場面情報とに基づいて翻訳対象を選択することを特徴とする翻訳プログラム。 - 請求項12乃至請求項21のいずれかにおいて、
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データの話し手/聞き手に関するデータ話し手/聞き手情報が記憶されており、
前記翻訳処理部は、
前記第1言語で表現された原文データに関連づけて、前記原文データの話し手/聞き手に関する原文話し手/聞き手情報を受け取り、
前記翻訳対象選択処理部は、
前記原文話し手/聞き手情報とデータ話し手/聞き手情報とに基づいて翻訳対象を選択することを特徴とする翻訳プログラム。 - 請求項12乃至請求項22のいずれかにおいて、
前記第1の対訳データ記憶部は、
第1言語単文データに関連づけて、当該第1言語単文データの事実/質問に関するデータ事実/質問情報が記憶されており、
前記翻訳処理部は、
前記第1言語で表現された原文データに関連づけて、前記原文データの事実/質問に関する原文事実/質問情報を受け取り、
前記翻訳対象選択処理部は、
前記原文事実/質問情報とデータ事実/質問情報とに基づいて翻訳対象を選択することを特徴とする翻訳プログラム。 - 請求項12乃至請求項23のいずれかにおいて、
前記翻訳対象選択処理部は、
前記第1の対訳データ記憶部から特徴語を含む複数の第1言語単文データを抽出し、原文データにおける前記複数の第1言語単文データとの一致部分が所定の分布条件を満たすか否か判断し、満たすと判断した場合には、前記複数の第1言語単文データを翻訳対象として選択し、
前記対訳出力処理部は、
翻訳対象となった前記複数の第1言語単文データとそれぞれ対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出し、読み出された複数の第2言語単文データを接続して前記訳文データとして出力することを特徴とする翻訳プログラム。 - 請求項12乃至請求項24いずれかにおいて、
前記翻訳対象選択処理部は、
前記前記原文データに基づいて複数の第1言語単文データを抽出し、抽出された複数の第1言語単文データについてそれぞれ原文データとの類似度を判断する類似度判断処理を行い、判断結果に基づき翻訳対象となる第1言語単文データを選択することを特徴とする翻訳プログラム。 - 第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された第1の対訳データ記憶部と、
前記第1言語で表現された原文データを受け取り、前記原文データの訳文データを出力する翻訳処理部と、を含み、
前記翻訳処理部は、
前記原文データに基づいて前記第1の対訳データ記憶部に記憶されたいずれかの第1言
語単文データを翻訳対象として選択する翻訳対象選択処理部と、
翻訳対象として選択された第1言語単文データと対訳関係を有する第2言語単文データを前記第1の対訳データ記憶部から読み出して、読み出した第2言語単文データに基づき前記訳文データを出力する対訳出力処理部と、を含むことを特徴とする翻訳システム。 - 第1言語で表現された複数の第1言語単文データと、第2言語で表現された複数の第2言語単文データとを含み、対訳関係を有する前記第1言語単文データと前記第2言語単文データとが関連付けられて記憶された対訳データベースの製造方法であって、
対訳関係を有する前記第1言語単文データと前記第2言語単文データとを関連した管理IDに対応付けて記憶させることを特徴とする対訳データベースの製造方法。 - 請求項27において、
意味内容が同じで表現形式が異なる複数の第1言語単文データ及び意味内容が同じで表現形式が異なる複数の第1言語単文データをグループ化して記憶させ、対訳関係を有する前記第1言語単文データのグループと前記第2言語単文データのグループとをグループ単位で、関連した管理IDで管理することを特徴とする対訳データベースの製造方法。 - 請求項28において、
前記グループに属するいずれかの第1言語単文データ及び第2言語単文データの少なくとも一方に代表データの指定を行うことを特徴とする対訳データベースの製造方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008231441A JP5398202B2 (ja) | 2008-09-09 | 2008-09-09 | 翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008231441A JP5398202B2 (ja) | 2008-09-09 | 2008-09-09 | 翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010066926A true JP2010066926A (ja) | 2010-03-25 |
JP5398202B2 JP5398202B2 (ja) | 2014-01-29 |
Family
ID=42192472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008231441A Expired - Fee Related JP5398202B2 (ja) | 2008-09-09 | 2008-09-09 | 翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5398202B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018022269A (ja) * | 2016-08-02 | 2018-02-08 | 国立研究開発法人情報通信研究機構 | 自動翻訳システム、自動翻訳方法、およびプログラム |
CN109564591A (zh) * | 2016-09-09 | 2019-04-02 | 松下知识产权经营株式会社 | 翻译装置以及翻译方法 |
CN110543641A (zh) * | 2019-08-14 | 2019-12-06 | 交控科技股份有限公司 | 一种中外文信息对比方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962681A (ja) * | 1995-06-13 | 1997-03-07 | Sharp Corp | 会話文翻訳装置 |
-
2008
- 2008-09-09 JP JP2008231441A patent/JP5398202B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962681A (ja) * | 1995-06-13 | 1997-03-07 | Sharp Corp | 会話文翻訳装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018022269A (ja) * | 2016-08-02 | 2018-02-08 | 国立研究開発法人情報通信研究機構 | 自動翻訳システム、自動翻訳方法、およびプログラム |
CN109564591A (zh) * | 2016-09-09 | 2019-04-02 | 松下知识产权经营株式会社 | 翻译装置以及翻译方法 |
CN110543641A (zh) * | 2019-08-14 | 2019-12-06 | 交控科技股份有限公司 | 一种中外文信息对比方法及装置 |
CN110543641B (zh) * | 2019-08-14 | 2023-05-26 | 交控科技股份有限公司 | 一种中外文信息对比方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5398202B2 (ja) | 2014-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102048030B1 (ko) | 자동화 어시스턴트와의 단대단 다국어 통신 촉진 | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
US7925506B2 (en) | Speech recognition accuracy via concept to keyword mapping | |
US7881928B2 (en) | Enhanced linguistic transformation | |
EP2306451B1 (en) | Speech recognition | |
US8719027B2 (en) | Name synthesis | |
JP5280642B2 (ja) | 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法 | |
JP2002024212A (ja) | 音声対話システム | |
JPS59144978A (ja) | ポ−タブル翻訳装置 | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
US11531693B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
EP2869219A1 (en) | Text processing apparatus, text processing method, and computer program product | |
US6985147B2 (en) | Information access method, system and storage medium | |
US20030061031A1 (en) | Japanese virtual dictionary | |
WO2003085550A1 (en) | Conversation control system and conversation control method | |
JP5398202B2 (ja) | 翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法 | |
JP2010092357A (ja) | 施設関連情報検索方法および施設関連情報検索システム | |
US11256870B2 (en) | Systems and methods for inserting dialogue into a query response | |
US20110022378A1 (en) | Translation system using phonetic symbol input and method and interface thereof | |
JP2006030326A (ja) | 音声合成装置 | |
US20230004720A1 (en) | Logos Communication Platform | |
CA2483805C (en) | System and methods for improving accuracy of speech recognition | |
JP5204529B2 (ja) | 翻訳プログラム、翻訳システム及び対訳データ生成方法 | |
JP6843689B2 (ja) | コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 | |
JP2008305291A (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130227 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130724 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131022 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |