JP2008233956A - 翻訳装置及び翻訳プログラム - Google Patents
翻訳装置及び翻訳プログラム Download PDFInfo
- Publication number
- JP2008233956A JP2008233956A JP2007068090A JP2007068090A JP2008233956A JP 2008233956 A JP2008233956 A JP 2008233956A JP 2007068090 A JP2007068090 A JP 2007068090A JP 2007068090 A JP2007068090 A JP 2007068090A JP 2008233956 A JP2008233956 A JP 2008233956A
- Authority
- JP
- Japan
- Prior art keywords
- basic information
- sentence
- database
- language
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】翻訳装置1は、入力された集合文章から話題を特定して、この話題を特定した集合文章に含まれる第一言語の文章である入力文を、第二言語の文章である翻訳文にして出力するものであって、集合文章話題分類手段3と、キーワードデータベース5と、基本情報取得手段7と、基本情報データベース9と、基本情報値抽出手段11と、基本情報値抽出規則データベース13と、基本情報値翻訳変換手段15と、対訳変換データベース17と、翻訳文出力手段19と、テンプレートデータベース21とを備える構成とした。
【選択図】図1
Description
1つ目の翻訳システムは、予め設定した規則に沿って入力文を翻訳する規則方式を採用した翻訳システムであり、一般に市販されているもの、例えば、富士通(登録商標)のATLAS(登録商標)、東芝(登録商標)のThe翻訳(登録商標)等が挙げられる。
Sumita,Example−based machine translation using DP−matching between word sequences,39th ACL workshop on DDMT,pp.1−8,2001. 池原他、「非線形な表現構造に着目した重文と複文の日英文型パターン化、自然言語処理」、Vol.11,No.3,pp.69−95,2004.
(翻訳装置の構成)
図1は、翻訳装置のブロック図である。この図1に示すように、翻訳装置1は、入力された集合文章の話題を分類し、この集合文章に含まれている第一言語の文章である入力文を第二言語の文章である翻訳文にして出力するもので、集合文章話題分類手段3と、キーワードデータベース5と、基本情報取得手段7と、基本情報データベース9と、基本情報値抽出手段11と、基本情報値抽出規則データベース13と、基本情報値翻訳変換手段15と、対訳変換データベース17と、翻訳文出力手段19と、テンプレートデータベース21とを備えている。
次に、図2に示すフローチャートを参照して、翻訳装置の動作を説明する(適宜、図1参照)。
まず、翻訳装置1は、集合文章が入力されると、集合文章話題分類手段3によって、キーワードデータベース5を用いて、集合文章の話題を分類する(ステップS1)。続いて、翻訳装置1は、基本情報取得手段7によって、集合文章話題分類手段3で分類された話題と一致する話題の基本情報を、基本情報データベース9から取得する(ステップS2)。
3 集合文章話題分類手段
5 キーワードデータベース
7 基本情報取得手段
9 基本情報データベース
11 基本情報値抽出手段
13 基本情報値抽出規則データベース
15 基本情報値翻訳変換手段
17 対訳変換データベース
19 翻訳文出力手段
21 テンプレートデータベース
Claims (4)
- 固有名又は数値を第一言語から第二言語に翻訳又は変換する値とし、当該固有名又は数値の意味分類を示す基本情報を設定すると共に、前記第一言語の文章である入力文から前記基本情報の値を抽出する規則を設定した基本情報値抽出規則データベースと、
前記第一言語の単語を前記第二言語の単語に翻訳した複数のデータからなる対訳辞書データ又は前記第一言語の表現を前記第二言語の表現に変換する変換ルールを記録した対訳変換データベースと、
前記基本情報及びこの基本情報以外の部分を第二言語で記述した定型文を定義しておいたテンプレートを記録したテンプレートデータベースと、を備え、前記入力文を、第二言語の文章である翻訳文にして出力する翻訳装置であって、
前記基本情報値抽出規則データベースで設定された基本情報と一致する基本情報の値を、前記入力文から抽出する基本情報値抽出手段と、
この基本情報値抽出手段で抽出された基本情報の値について、当該基本情報の固有名を、前記対訳変換データベースを用いて翻訳する、又は、当該基本情報の数値を、前記対訳変換データベースを用いて変換する基本情報値翻訳変換手段と、
前記基本情報値抽出手段で抽出した基本情報と一致する基本情報を含むテンプレートを前記テンプレートデータベースから読み出して、読み出したテンプレートに前記基本情報値翻訳変換手段で翻訳又は変換された基本情報の固有名又は数値を挿入して、前記翻訳文として出力する翻訳文出力手段と、
を備えることを特徴とする翻訳装置。 - 複数の第一言語の文章からなる集合文章について、話題を特定するためのキーワードを記録したキーワードデータベースと、
固有名又は数値を第一言語から第二言語に翻訳又は変換する値とし、当該固有名又は数値の意味分類を示す基本情報を設定する基本情報データベースと、
前記第一言語の文章である入力文から前記基本情報の値を抽出する規則を設定した基本情報値抽出規則データベースと、
前記第一言語の単語を前記第二言語の単語に翻訳した複数のデータからなる対訳辞書データ又は前記第一言語の表現を前記第二言語の表現に変換する変換ルールを記録した対訳変換データベースと、
前記話題ごとに基本情報及びこの基本情報以外の部分を第二言語で記述した定型文を定義しておいたテンプレートを記録したテンプレートデータベースと、を備え、入力された集合文章から前記話題を特定して、この話題を特定した集合文章に含まれる第一言語の文章である入力文を、第二言語の文章である翻訳文にして出力する翻訳装置であって、
前記キーワードデータベースを用いて、入力された集合文章の話題を分類する集合文章話題特定手段と、
この集合文章話題特定手段で分類された話題と一致する話題の基本情報を、前記基本情報データベースから取得する基本情報取得手段と、
この基本情報取得手段で取得した基本情報と一致する基本情報の値を、前記基本情報値抽出規則データベースを用いて、前記入力文から抽出する基本情報値抽出手段と、
この基本情報値抽出手段で抽出された基本情報の値について、当該基本情報の固有名を、前記対訳変換データベースを用いて翻訳する、又は、当該基本情報の数値を、前記対訳変換データベースを用いて変換する基本情報値翻訳変換手段と、
前記集合文章話題特定手段で特定された話題に対応したテンプレートの中で、前記基本情報取得手段で取得された基本情報が含まれているテンプレートを前記テンプレートデータベースから読み出して、読み出したテンプレートに前記基本情報値翻訳変換手段で翻訳又は変換された基本情報の固有名又は数値を挿入して、前記翻訳文として出力する翻訳文出力手段と、
を備えることを特徴とする翻訳装置。 - 固有名又は数値を第一言語から第二言語に翻訳又は変換する値とし、当該固有名又は数値の意味分類を示す基本情報を設定すると共に、前記第一言語の文章である入力文から前記基本情報の値を抽出する規則を設定した基本情報値抽出規則データベースと、
前記第一言語の単語を前記第二言語の単語に翻訳した複数のデータからなる対訳辞書データ又は前記第一言語の表現を前記第二言語の表現に変換する変換ルールを記録した対訳変換データベースと、
前記基本情報及びこの基本情報以外の部分を第二言語で記述した定型文を定義しておいたテンプレートを記録したテンプレートデータベースと、を備えたコンピュータを、前記入力文を、第二言語の文章である翻訳文にして出力するために、
前記基本情報値抽出規則データベースで設定された基本情報と一致する基本情報の値を、前記入力文から抽出する基本情報値抽出手段、
この基本情報値抽出手段で抽出された基本情報の値について、当該基本情報の固有名を、前記対訳変換データベースを用いて翻訳する、又は、当該基本情報の数値を、前記対訳変換データベースを用いて変換する基本情報値翻訳変換手段、
前記基本情報値抽出手段で抽出した基本情報と一致する基本情報を含むテンプレートを前記テンプレートデータベースから読み出して、読み出したテンプレートに前記基本情報値翻訳変換手段で翻訳又は変換された基本情報の固有名又は数値を挿入して、前記翻訳文として出力する翻訳文出力手段、
として機能させることを特徴とする翻訳プログラム。 - 複数の第一言語の文章からなる集合文章について、話題を特定するためのキーワードを記録したキーワードデータベースと、
固有名又は数値を第一言語から第二言語に翻訳又は変換する値とし、当該固有名又は数値の意味分類を示す基本情報を設定した基本情報データベースと、
前記第一言語の文章である入力文から前記基本情報の値を抽出する規則を設定した基本情報値抽出規則データベースと、
前記第一言語の単語を前記第二言語の単語に翻訳した複数のデータからなる対訳辞書データ又は前記第一言語の表現を前記第二言語の表現に変換する変換ルールを記録した対訳変換データベースと、
前記話題ごとに基本情報及びこの基本情報以外の部分を第二言語で記述した定型文を定義しておいたテンプレートを記録したテンプレートデータベースと、を備えたコンピュータを、入力された集合文章から前記話題を特定して、この話題を特定した集合文章に含まれる第一言語の文章である入力文を、第二言語の文章である翻訳文にして出力するために、
前記キーワードデータベースを用いて、入力された集合文章の話題を分類する集合文章話題特定手段、
この集合文章話題特定手段で分類された話題と一致する話題の基本情報を、前記基本情報データベースから取得する基本情報取得手段、
この基本情報取得手段で取得した基本情報と一致する基本情報の値を、前記基本情報値抽出規則データベースを用いて、前記入力文から抽出する基本情報値抽出手段、
この基本情報値抽出手段で抽出された基本情報の値について、当該基本情報の固有名を、前記対訳変換データベースを用いて翻訳する、又は、当該基本情報の数値を、前記対訳変換データベースを用いて変換する基本情報値翻訳変換手段、
前記集合文章話題特定手段で特定された話題に対応したテンプレートの中で、前記基本情報取得手段で取得された基本情報が含まれているテンプレートを前記テンプレートデータベースから読み出して、読み出したテンプレートに前記基本情報値翻訳変換手段で翻訳又は変換された基本情報の固有名又は数値を挿入して、前記翻訳文として出力する翻訳文出力手段、
として機能させることを特徴とする翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007068090A JP4971845B2 (ja) | 2007-03-16 | 2007-03-16 | 翻訳装置及び翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007068090A JP4971845B2 (ja) | 2007-03-16 | 2007-03-16 | 翻訳装置及び翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008233956A true JP2008233956A (ja) | 2008-10-02 |
JP4971845B2 JP4971845B2 (ja) | 2012-07-11 |
Family
ID=39906713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007068090A Expired - Fee Related JP4971845B2 (ja) | 2007-03-16 | 2007-03-16 | 翻訳装置及び翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4971845B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346732A (zh) * | 2010-07-30 | 2012-02-08 | 英业达股份有限公司 | 基于文句的段落式线上翻译系统及其方法 |
JP2013008139A (ja) * | 2011-06-23 | 2013-01-10 | Ntt Docomo Inc | メッセージ作成システムおよびメッセージ作成装置 |
CN107491441A (zh) * | 2016-06-13 | 2017-12-19 | 沈阳雅译网络技术有限公司 | 一种基于强制解码的动态抽取翻译模板的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001357032A (ja) * | 2000-06-12 | 2001-12-26 | Casio Comput Co Ltd | 翻訳装置、翻訳プログラムが記録された記録媒体 |
JP2006065542A (ja) * | 2004-08-26 | 2006-03-09 | Univ Of Tokushima | 機械翻訳方法 |
-
2007
- 2007-03-16 JP JP2007068090A patent/JP4971845B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001357032A (ja) * | 2000-06-12 | 2001-12-26 | Casio Comput Co Ltd | 翻訳装置、翻訳プログラムが記録された記録媒体 |
JP2006065542A (ja) * | 2004-08-26 | 2006-03-09 | Univ Of Tokushima | 機械翻訳方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346732A (zh) * | 2010-07-30 | 2012-02-08 | 英业达股份有限公司 | 基于文句的段落式线上翻译系统及其方法 |
JP2013008139A (ja) * | 2011-06-23 | 2013-01-10 | Ntt Docomo Inc | メッセージ作成システムおよびメッセージ作成装置 |
CN107491441A (zh) * | 2016-06-13 | 2017-12-19 | 沈阳雅译网络技术有限公司 | 一种基于强制解码的动态抽取翻译模板的方法 |
CN107491441B (zh) * | 2016-06-13 | 2020-07-17 | 沈阳雅译网络技术有限公司 | 一种基于强制解码的动态抽取翻译模板的方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4971845B2 (ja) | 2012-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104408078B (zh) | 一种基于关键词的中英双语平行语料库构建方法 | |
JP6842167B2 (ja) | 要約生成装置、要約生成方法及びコンピュータプログラム | |
CN109065021B (zh) | 基于条件深度卷积生成对抗网络的端到端方言辨识方法 | |
CN104679850B (zh) | 地址结构化方法及装置 | |
CN107516509B (zh) | 用于新闻播报语音合成的语音库构建方法及系统 | |
JP6300889B2 (ja) | 非定型テキストの抽出性能の向上のためのシステム及び方法 | |
WO2017177809A1 (zh) | 语言文本的分词方法和系统 | |
CN104199972A (zh) | 一种基于深度学习的命名实体关系抽取与构建方法 | |
CN107039034A (zh) | 一种韵律预测方法及系统 | |
CN110298039B (zh) | 事件地的识别方法、系统、设备及计算机可读存储介质 | |
WO2023108991A1 (zh) | 模型的训练方法、知识分类方法、装置、设备、介质 | |
CN101202041A (zh) | 一种汉语韵律词组词方法及装置 | |
CN101794308B (zh) | 一种面向有意义串挖掘的重复串提取方法及装置 | |
CN104750820A (zh) | 一种语料库的过滤方法及装置 | |
CN101782897A (zh) | 基于事件的中文语料标注方法 | |
JP4971845B2 (ja) | 翻訳装置及び翻訳プログラム | |
JP3735336B2 (ja) | 文書要約方法及びシステム | |
CN114579695A (zh) | 一种事件抽取方法、装置、设备及存储介质 | |
CN112528642B (zh) | 一种隐式篇章关系自动识别方法及系统 | |
CN110232160B (zh) | 兴趣点变迁事件检测方法、装置及存储介质 | |
Turner et al. | Selecting the content of textual descriptions of geographically located events in spatio-temporal weather data | |
CN110515926A (zh) | 基于分词和语义依存分析的异构数据源海量数据梳理方法 | |
CN112488593B (zh) | 一种用于招标的辅助评标系统及方法 | |
KR100886687B1 (ko) | 중국어 미등록어 자동 추출 방법 및 장치 | |
Evain et al. | Towards automatic captioning of university lectures for french students who are deaf |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120406 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |