JP6221339B2 - 翻訳装置及び翻訳方法 - Google Patents
翻訳装置及び翻訳方法 Download PDFInfo
- Publication number
- JP6221339B2 JP6221339B2 JP2013102268A JP2013102268A JP6221339B2 JP 6221339 B2 JP6221339 B2 JP 6221339B2 JP 2013102268 A JP2013102268 A JP 2013102268A JP 2013102268 A JP2013102268 A JP 2013102268A JP 6221339 B2 JP6221339 B2 JP 6221339B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- translation
- term
- common part
- notation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
この翻訳装置は、複数の用例のそれぞれに対する、二つ以上の言語による表記が登録された翻訳用例コーパスを用いることにより、入力された文の構造を、形態素解析などを用いて解析することなくその文を翻訳する。そのために、この翻訳装置は、翻訳用例コーパスに登録された、入力された文の言語(以下、便宜上、第1言語と呼ぶ)と同じ言語の表記の用例の中から、入力された文の少なくとも一部と一致する用例を抽出する。この翻訳装置は、抽出された用例のうちの少なくとも二つについての共通部分が最長となる用例についての翻訳対象言語(以下、便宜上第2言語と呼ぶ)の表記の中で、最も長い共通部分を用語訳として抽出する。そしてこの翻訳装置は、その用語訳を含む第2言語表記の用例を翻訳用例コーパスから選択し、その選択された用例の第1言語表記の中で最も長い共通部分を、その用語訳に対応する第1言語の用語とする。そしてこの翻訳装置は、用語と用語訳とを対訳として、入力された文を用語ごとにその用語訳で置き換えることにより、入力された文を第2言語に翻訳する。
なお、以下の実施形態では、第1言語は日本語、第2言語は中国語とする。
入力部2は、入力文のテキストデータを処理部4へ渡す。
あるいは、出力部5は、翻訳文のテキストデータを、通信ネットワークを介して翻訳装置1と接続された他の装置へ出力してもよい。この場合、出力部5は、通信ネットワークに翻訳装置1を接続するためのインターフェース回路を有する。なお、入力部2も通信ネットワークを介して入力文のテキストデータを取得する場合、入力部2と出力部5は一体化されていてもよい。
図3は、処理部4の機能ブロック図である。処理部4は、順方向検索部11と、最長共通部抽出部12と、逆方向検索部13と、対訳生成部14と、置換部15とを有する。
処理部4が有するこれらの各部は、例えば、処理部4が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。あるいは、処理部4が有するこれらの各部は、その各部の機能を実現する一つの集積回路として翻訳装置1に実装されてもよい。
したがって、図5のテーブル500に示されるように、入力文「ネットワークモニター」に対して、図2に示された翻訳用例コーパスの中から二つの最長共通部分の組が求められる。一つは、第1言語(日本語)の最長共通部分「モニター」と第2言語(中国語)の最長共通部分「監視器」の組であり、もう一つは、第1言語の最長共通部分「ネットワークモ」と第2言語の最長共通部分「網路」の組である。
その後、最長共通部抽出部12は、番号Lが、抽出された用例の総数Smaxよりも大きいか否か判定する(ステップS107)。番号Lが用例の総数Smax以下であれば(ステップS107−No)、最長共通部抽出部12は、ステップS102以降の処理を繰り返す。一方、番号Lが用例の総数Smaxより大きければ(ステップS107−Yes)、最長共通部抽出部12は、着目する用例の番号Kを1インクリメントするとともに、番号Lを(K+1)に設定する(ステップS108)。
対訳生成部14は、対訳となる用語と用語訳の組み合わせを記憶部3に記憶する。
置換部15は、用語訳の配列のうち、最も確からしい評価値を持つ用語訳の配列を、入力文に対する第2言語の訳文とする。そして置換部15は、得られた訳文のテキストデータを出力部5を介して出力する。
そして処理部4は翻訳処理を終了する。
第2の実施形態による翻訳装置は、第1の実施形態による翻訳装置と比較して、利用される翻訳用例コーパスと、処理部により実行される処理の一部が異なる。そこで以下では、翻訳用例コーパス及び処理部について説明する。
対訳生成部14は、翻訳用例コーパスに登録された用例のうち、第2言語表記が用語訳を含む用例の第1言語表記のうちの最長共通部分を、その用語訳に対応する第1言語の用語の候補とする(ステップS301)。対訳生成部14は、その用語の候補が不適切条件を満たすか否か判定する(ステップS302)。
ステップS303またはS307の後、対訳生成部14は、対訳生成処理を終了する。
また他の変形例によれば、各実施形態による翻訳装置は、対訳が求められる度にその対訳に含まれる第1言語の用語を入力文から除いた残りの文字列についてステップS202〜S206の処理を行って、入力文に含まれる全ての用語について対訳を求めてもよい。
2 入力部
3 記憶部
4 処理部
5 出力部
11 順方向検索部
12 最長共通部抽出部
13 逆方向検索部
14 対訳生成部
15 置換部
Claims (4)
- 第1の言語で表記された文のテキストデータを取得する入力部と、
複数の用例のそれぞれについて、少なくとも前記第1の言語の表記と第2の言語の表記とが登録された翻訳用例コーパスを記憶する記憶部と、
前記複数の用例の前記第1の言語の表記のうち、前記文に含まれる所定数の文字単位または単語単位の何れかの文字列を含む用例を検索対象用例として抽出する順方向検索部と、
前記検索対象用例に含まれる前記文字列のそれぞれごとに、前記検索対象用例のうちの少なくとも二つの前記第1の言語の表記間で最も長く、かつ前記文字列を含む第1の共通部分を求め、当該第1の共通部分を含む、前記検索対象用例の前記第2の言語の表記間の最も長い第2の共通部分を前記第2の言語の用語訳として抽出する最長共通部抽出部と、
前記用語訳ごとに、前記複数の用例のうち、前記第2の言語の表記に当該用語訳を含む用例を逆引き用例として抽出する逆方向検索部と、
前記用語訳ごとに、前記逆引き用例に対応する前記第1の言語の表記間で最も長い共通部分を当該用語訳に対応する前記第1の言語の用語とし、当該用語と当該用語訳の組を対訳とする対訳生成部と、
前記対訳を参照することにより、前記文に含まれる前記対訳が求められた第1の言語の用語のそれぞれを、当該用語に対応する前記用語訳に置換することで前記文の前記第2の言語による訳文を生成する置換部と、
を有する翻訳装置。 - 前記翻訳用例コーパスには、前記複数の用例のそれぞれについての第3の言語の表記がさらに登録されており、
前記対訳生成部は、前記用語訳ごとに、当該用語訳の前記逆引き用例の前記第1の言語の表記間の最も長い共通部分を当該用語訳に対応する前記第1言語の用語の候補とし、当該用語の候補が所定の不適切条件を満たす場合、前記逆引き用例のうちの少なくとも二つの前記第3の言語の表記間の最も長い共通部分をキーワードとし、前記複数の用例のうち、前記第3の言語の表記が前記キーワードを含む用例の前記第1の言語の表記間で最も長い共通部分を前記用語とする、請求項1に記載の翻訳装置。 - 前記置換部は、前記用語訳の配列ごとに当該配列の確からしさを表す評価値を前記第2の言語についての言語モデルに基づいて算出し、最も確からしい評価値に対応する前記用語訳の配列を前記訳文とする、請求項1または2に記載の翻訳装置。
- 第1の言語で表記された文のテキストデータを取得し、
処理部が、記憶部に記憶された、複数の用例のそれぞれについて、少なくとも前記第1の言語の表記と第2の言語の表記とが登録された翻訳用例コーパスに登録された前記複数の用例の前記第1の言語の表記のうち、前記文に含まれる所定数の文字単位または単語単位の何れかの文字列を含む用例を検索対象用例として抽出し、
前記処理部が、前記検索対象用例に含まれる前記文字列のそれぞれごとに、前記検索対象用例のうちの少なくとも二つの前記第1の言語の表記間で最も長く、かつ前記文字列を含む第1の共通部分を求め、当該第1の共通部分を含む、前記検索対象用例の前記第2の言語の表記間の最も長い第2の共通部分を前記第2の言語の用語訳として抽出し、
前記処理部が、前記用語訳ごとに、前記複数の用例のうち、前記第2の言語の表記に当該用語訳を含む用例を逆引き用例として抽出し、
前記処理部が、前記用語訳ごとに、前記逆引き用例に対応する前記第1の言語の表記間で最も長い共通部分を当該用語訳に対応する前記第1の言語の用語とし、当該用語と当該用語訳の組を対訳とし、
前記処理部が、前記対訳を参照することにより、前記文に含まれる前記対訳が求められた第1の言語の用語のそれぞれを、当該用語に対応する前記用語訳に置換することで前記文の前記第2の言語による訳文を生成する、
ことを含む翻訳方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013102268A JP6221339B2 (ja) | 2013-05-14 | 2013-05-14 | 翻訳装置及び翻訳方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013102268A JP6221339B2 (ja) | 2013-05-14 | 2013-05-14 | 翻訳装置及び翻訳方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014222456A JP2014222456A (ja) | 2014-11-27 |
JP6221339B2 true JP6221339B2 (ja) | 2017-11-01 |
Family
ID=52121947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013102268A Expired - Fee Related JP6221339B2 (ja) | 2013-05-14 | 2013-05-14 | 翻訳装置及び翻訳方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6221339B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118410811A (zh) * | 2024-03-28 | 2024-07-30 | 广州逸虎网络科技有限公司 | 文本翻译方法、装置、设备以及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4607671B2 (ja) * | 2005-06-07 | 2011-01-05 | 富士通株式会社 | 翻訳支援プログラム、方法及び装置 |
JP5100445B2 (ja) * | 2008-02-28 | 2012-12-19 | 株式会社東芝 | 機械翻訳する装置および方法 |
JP5257189B2 (ja) * | 2009-03-25 | 2013-08-07 | 富士通株式会社 | 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法 |
-
2013
- 2013-05-14 JP JP2013102268A patent/JP6221339B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014222456A (ja) | 2014-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102268875B1 (ko) | 전자 장치에 텍스트를 입력하는 시스템 및 방법 | |
KR101435265B1 (ko) | 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법 | |
US8041557B2 (en) | Word translation device, translation method, and computer readable medium | |
JP6655788B2 (ja) | 対訳コーパス作成方法、該装置および該プログラムならびに機械翻訳システム | |
CN102455845B (zh) | 一种文字输入方法和装置 | |
KR101266361B1 (ko) | 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법 | |
JP5915326B2 (ja) | 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム | |
JP4266222B2 (ja) | 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体 | |
JP6145059B2 (ja) | モデル学習装置、形態素解析装置、及び方法 | |
JP2009205357A (ja) | 中国語の品詞を判定する装置、方法およびプログラム | |
JP6160438B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
Jamro | Sindhi language processing: A survey | |
JP6221339B2 (ja) | 翻訳装置及び翻訳方法 | |
JP4953440B2 (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
JP4843596B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2016189154A (ja) | 翻訳方法、装置、及びプログラム | |
JP5398638B2 (ja) | 記号入力支援装置、記号入力支援方法、及びプログラム | |
JP4881399B2 (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
JP6203083B2 (ja) | 未知語抽出装置及び未知語抽出方法 | |
JP2006024114A (ja) | 機械翻訳装置および機械翻訳コンピュータプログラム | |
Cui et al. | Efficient Text Analysis with Pre-Trained Neural Network Models | |
EP4394648A1 (en) | Parallel corpus construction program, parallel corpus construction method, and information processing apparatus | |
JP2018055620A (ja) | 情報処理装置及びプログラム | |
JP2005135039A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161111 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170613 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170814 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6221339 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |