JP2008084078A - 和英規格変換方法及びシステム並びに和英規格変換プログラム - Google Patents
和英規格変換方法及びシステム並びに和英規格変換プログラム Download PDFInfo
- Publication number
- JP2008084078A JP2008084078A JP2006264412A JP2006264412A JP2008084078A JP 2008084078 A JP2008084078 A JP 2008084078A JP 2006264412 A JP2006264412 A JP 2006264412A JP 2006264412 A JP2006264412 A JP 2006264412A JP 2008084078 A JP2008084078 A JP 2008084078A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- japanese
- english
- word
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】翻訳システムにおいて、原文から単語を抽出する手段と、作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する手段と、用語集を参照して各単語に適用する手段と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段とから構成される。
【選択図】図3
Description
(2)請求項2記載の発明は、翻訳システムにおいて、原文から単語を抽出する手段と、
作業者のプロファイル(所属,担当業務,専門分野等)として登録した情報を元に訳例検索時の優先度を設定する手段と、用語集を参照して各単語に適用する手段と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段と、から構成されることを特徴とする。
(3)請求項3記載の発明は、和用語と、英用語と、規格番号と、規格名称と、分野と頻度を記憶する代替類似語クラスタリングテーブルを設け、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が100%でない場合には、このテーブルに作業者のプロファイル(所属,担当業務,専門分野等)に応じた代替類似語を所与のクラスタリンググループより選出して訳例の類似度を算出した訳文を訳例として蓄積していくことを特徴とする。
(4)請求項4記載の発明は、和文の原文用語と訳例用語とのパターンマッチング、又は英文の原文用語と訳例用語とのパターンマッチングを行なって類似度を求め、求めた類似度を元に所定の演算により誤差を算出し、算出した誤差が一番小さくなった訳例を変換用語として用いるようにしたことを特徴とする。
(5)請求項5記載の発明は、前記訳例が決定されたら、前記原文が日本語である場合に当該訳例と対応付けられている英語を翻訳単語として決定することを特徴とする。
(6)請求項6記載の発明は、類似度が低かった場合には、日本語から英語又は英語から日本語への変換のパスを切り替えて翻訳を行なうことを特徴とする。
(7)請求項7記載の発明は、和英/英和翻訳ルートを複数通り設けることを特徴とする。
(8)請求項8記載の発明は、過去に累積した訳例を元に類似文章から利用者のプロファイル(所属,担当業務,専門分野等)に合わせて最適な訳を照合することを特徴とする。
(9)請求項9記載の発明は、原文と訳例で使用されている用語の種類とその頻度数で両者の類似度を算出し、所定の演算に基づく誤差が最小となるように訳例の単語を検索していくことを特徴とする。
(10)請求項10記載の発明は、代替した訳語が気に入らない場合、操作部から手入力で入力できるように構成されていることを特徴とする。
11.また、この発明は、類似度が低かった場合は、類似語グループの中で一番頻度の高い用語を訳例として代替するようにしたことを特徴とする。
12、また、この発明は、前記翻訳時に、類似英語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することを特徴とする。
13.また、この発明は、類似語は、訳例の用語抽出で原文語と訳例語の一致させている組み合わせで決定することを特徴とする。
14.また、この発明は、設計者の作業プロファイルにより訳例検索する際に、優先度選択を行ない、翻訳処理を行なうことを特徴とする。
15.また、この発明は、和英変換と英和変換は規格限定構文を用いて、作業者プロファイル、用語の種類、頻度で行なうことを特徴とする。
16.また、この発明は、翻訳システムにおいて、原文から単語を抽出する工程と、作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、用語集を参照して各単語に適用する工程と、訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程とをコンピュータで実行することを特徴とする。
(2)請求項2記載の発明によれば、原文から抽出した単語と、訳例とを対比させ、その類似度を算出して最も類似した訳例を選択することにより、日本語から英語又は英語から日本語への変換を利用者のスキルを必要とすることなしに自動で変換することができる。
(3)請求項3記載の発明によれば、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が100%でない場合に、テーブルに類似度を算出した訳文を訳例として蓄積していくことにより、翻訳時の学習機能を持たせることができる。
(4)請求項4記載の発明によれば、原文と訳例とのパターンマッチングを行なって類似度を求め、この類似度を用いて誤差を算出し、算出した誤差が最も小さい訳例を変換用語として用いることにより、正確な翻訳を行なうことができる。
(5)請求項5記載の発明によれば、日本語で原文と訳文のパターンマッチングを行ない、訳文が決定されたら、その訳文と対応付けられている英語を翻訳単語として決定することで、日本語から英語への変換をスムーズに行なうことができる。
(6)請求項7記載の発明によれば、類似度が低かった場合、日本語から英語、又は英語から日本語への変換のパスを切り替えて翻訳を行なうことにより、類似度の高い翻訳を行なうことができる。
(7)請求項7記載の発明によれば、和英/英和翻訳ルートを複数通り設けることにより、翻訳結果の誤差が多い場合に、最も翻訳誤差の少ないルートを採用することで、正確な翻訳を実行することができる。
(8)請求項8記載の発明によれば、過去に累積した訳例を元に類似文章から利用者のプロファイルに合わせて最適な訳を用いるので、正確な翻訳を行なうことができる。
(9)請求項9記載の発明によれば、原文と訳例から両者の類似度を算出し、この類似度を用いた所定の演算により誤差が最小となる訳例の単語を検索していくので、正確な翻訳が可能となる。
(10)請求項10記載の発明によれば、代替した訳語が気に入らない場合に、設計者が操作部から最も好ましい訳語を入力することができるので、文章全体として正確な翻訳を行なうことができる。
11.また、この発明によれば、類似度が低かった場合は、代替類似語クラスタリングの中で一番頻度の高い用語を訳例として用いることで、最も適当と思われる翻訳を行なうことができる。
12.また、この発明によれば、類似英語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することができる。
13.また、この発明によれば、類似語を原文語と訳例語の組み合わせで決定することができる。
14.また、この発明によれば、設計者の作業プロファイルにより訳例検索する際に優先度選択を行なうことにより、設計者の専門分野における最適な翻訳を行なうことができる。
15.また、この発明によれば、翻訳に規格限定構文を用いることで、より最適な翻訳を行なうことができる。
16.また、この発明によれば、上述した一連の翻訳作業をコンピュータで実行することができる。
e=1−(Wi/Ti) only if(Ti−Wi=0) (1)
となる。
e=1−(4/4)=0
となる。次に、例2について考える。この場合には、4個の用語のうち、1語に若干の相違がある場合である。即ち、t1とw1に若干の相違がある。例えば、t1は“プリント回路板”であり、w1は“プリント回路ボード”である。この2つの用語は表現が異なるものの実質的に同一のものを示しているから、類似度1とする。即ち一致したものとみなす。この結果、例1の場合と同様に、双方の文の誤差eは0となる。
e=1−3/4=0.25
となる。
e={1−(Mi/Ti)}×(Wi−Ti)(Ti≠Wi) (2)
例4の場合に誤差eを求めてみると、Mi=1、Ti=4、Wi=6であるから、(2)式に代入すると、
e={1−(1/4)}×(6−4)=1.5
となる。
e={1−1/4}×(2−4)=−1.5
となる。
翻訳システムにおいて、原文から単語を抽出する工程と、
作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、
用語集を参照して各単語に適用する工程と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程と、
から構成されることを特徴とする和英規格変換方法。
翻訳システムにおいて、原文から単語を抽出する手段と、
作業者のプロファイル(所属,担当業務,専門分野等)として登録した情報を元に訳例検索時の優先度を設定する手段と、
用語集を参照して各単語に適用する手段と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段と、
から構成されることを特徴とする和英規格変換システム。
和用語と、英用語と、規格番号と、規格名称と、分野と頻度を記憶する代替類似語クラスタリングテーブルを設け、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が100%でない場合には、このテーブルに作業者のプロファイル(所属,担当業務,専門分野等)に応じた代替類似語を所与のクラスタリンググループより選出して訳例の類似度を算出した訳文を訳例として蓄積していくことを特徴とする付記1記載の和英規格変換方法。
和文の原文用語と訳例用語とのパターンマッチング、又は英文の原文用語と訳例用語とのパターンマッチングを行なって類似度を求め、求めた類似度を元に所定の演算により誤差を算出し、算出した誤差が一番小さくなった訳例を変換用語として用いるようにしたことを特徴とする付記3記載の和英規格変換方法。
前記訳例が決定されたら、前記原文が日本語である場合に当該訳例と対応付けられている英語を翻訳単語として決定することを特徴とする付記4記載の和英規格変換方法。
類似度が低かった場合には、日本語から英語又は英語から日本語への変換のパスを切り替えて翻訳を行なうことを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。
和英/英和翻訳ルートを複数通り設けることを特徴とする請求項3乃至5の何れかに記載の和英規格変換方法。
過去に累積した訳例を元に類似文章から利用者のプロファイル(所属,担当業務,専門分野等)に合わせて最適な訳を照合することを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。
原文と訳例で使用されている用語の種類とその頻度数で両者の類似度を算出し、所定の演算に基づく誤差が最小となるように訳例の単語を検索していくことを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。
代替した訳語が気に入らない場合、操作部から手入力で入力できるように構成されていることを特徴とする付記12記載の和英規格変換方法。
類似度が低かった場合は、代替類似語クラスタリングの中で一番頻度の高い用語を訳例として代替するようにしたことを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。
前記翻訳時に、類似英語の利用選択は、用語集の利用者のプロファイルと用語頻度を元に決定することを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。
類似語は、訳例の用語抽出で原文語と訳例語の一致させている組み合わせで決定することを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。
設計者の作業プロファイルにより訳例検索する際に、優先度選択を行ない、翻訳処理を行なうことを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。(10)
(付記15)
和英変換と英和変換は規格限定構文を用いて、作業者プロファイル、用語の種類、頻度で行なうことを特徴とする付記3乃至5の何れかに記載の和英規格変換方法。
翻訳システムにおいて、原文から単語を抽出する工程と、
作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、
用語集を参照して各単語に適用する工程と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程と、
をコンピュータで実行することを特徴とする和英規格変換プログラム。
1)和英併記のドキュメントの様式が種々存在しても、柔軟に処理ができる。
2)単語を和英変換について、最適な用語を利用者のスキルによらずに実施することができる。
3)用語変換機能を具備しており、分野別変換が可能である。
4)パラグラフ(段落)のように一つの塊を一括変換できる。
5)過去の訳例の引用がいつでもできる。
6 訳例集
10 和文原文
11 用語抽出文
12 用語集
13 訳例
14 英文
15 和文
16 英文原文
17 用語抽出文
18 作業者プロファイル
19 和英変換部
20 英和変換部
Claims (10)
- 翻訳システムにおいて、原文から単語を抽出する工程と、
作業者のプロファイルとして登録した情報を元に訳例検索時の優先度を設定する工程と、
用語集を参照して各単語に適用する工程と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する工程と、
から構成されることを特徴とする和英規格変換方法。 - 翻訳システムにおいて、原文から単語を抽出する手段と、
作業者のプロファイル(所属,担当業務,専門分野等)として登録した情報を元に訳例検索時の優先度を設定する手段と、
用語集を参照して各単語に適用する手段と、
訳例集を参照して過去の頻度数から類似度を算出して最も類似した訳例文を選択する手段と、
から構成されることを特徴とする和英規格変換システム。 - 和用語と、英用語と、規格番号と、規格名称と、分野と頻度を記憶する代替類似語クラスタリングテーブルを設け、翻訳作業で和文の原文と訳文との類似度を参照し、類似度が100%でない場合には、このテーブルに作業者のプロファイル(所属,担当業務,専門分野等)に応じた代替類似語を所与のクラスタリンググループより選出して訳例の類似度を算出した訳文を訳例として蓄積していくことを特徴とする請求項1記載の和英規格変換方法。
- 和文の原文用語と訳例用語とのパターンマッチング、又は英文の原文用語と訳例用語とのパターンマッチングを行なって類似度を求め、求めた類似度を元に所定の演算により誤差を算出し、算出した誤差が一番小さくなった訳例を変換用語として用いるようにしたことを特徴とする請求項3記載の和英規格変換方法。
- 前記訳例が決定されたら、前記原文が日本語である場合に当該訳例と対応付けられている英語を翻訳単語として決定することを特徴とする請求項4記載の和英規格変換方法。
- 類似度が低かった場合には、日本語から英語又は英語から日本語への変換のパスを切り替えて翻訳を行なうことを特徴とする請求項3乃至5の何れかに記載の和英規格変換方法。
- 和英/英和翻訳ルートを複数通り設けることを特徴とする請求項3乃至5の何れかに記載の和英規格変換方法。
- 過去に累積した訳例を元に類似文章から利用者のプロファイル(所属,担当業務,専門分野等)に合わせて最適な訳を照合することを特徴とする請求項3乃至5の何れかに記載の和英規格変換方法。
- 原文と訳例で使用されている用語の種類とその頻度数で両者の類似度を算出し、所定の演算に基づく誤差が最小となるように訳例の単語を検索していくことを特徴とする請求項3乃至5の何れかに記載の和英規格変換方法。
- 代替した訳語が気に入らない場合、操作部から手入力で入力できるように構成されていることを特徴とする請求項3乃至5の何れかに記載の和英規格変換方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006264412A JP2008084078A (ja) | 2006-09-28 | 2006-09-28 | 和英規格変換方法及びシステム並びに和英規格変換プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006264412A JP2008084078A (ja) | 2006-09-28 | 2006-09-28 | 和英規格変換方法及びシステム並びに和英規格変換プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008084078A true JP2008084078A (ja) | 2008-04-10 |
Family
ID=39354883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006264412A Pending JP2008084078A (ja) | 2006-09-28 | 2006-09-28 | 和英規格変換方法及びシステム並びに和英規格変換プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008084078A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008468A (zh) * | 2019-03-04 | 2019-07-12 | 广州虎牙信息科技有限公司 | 语言系统管理方法、信息转换方法、服务器以及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10116286A (ja) * | 1996-10-09 | 1998-05-06 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語翻訳方法及び装置 |
-
2006
- 2006-09-28 JP JP2006264412A patent/JP2008084078A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10116286A (ja) * | 1996-10-09 | 1998-05-06 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語翻訳方法及び装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008468A (zh) * | 2019-03-04 | 2019-07-12 | 广州虎牙信息科技有限公司 | 语言系统管理方法、信息转换方法、服务器以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7343371B2 (en) | Queries-and-responses processing method, queries-and-responses processing program, queries-and-responses processing program recording medium, and queries-and-responses processing apparatus | |
US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
US20170235841A1 (en) | Enterprise search method and system | |
US7647303B2 (en) | Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program | |
JP2006012168A (ja) | 翻訳メモリシステムにおいてカバレージおよび質を改良する方法 | |
JP2008033931A (ja) | テキストを追補する方法、クエリーに応答してテキストを取得する方法、およびシステム | |
JP2019032704A (ja) | 表データ構造化システムおよび表データ構造化方法 | |
JP6108212B2 (ja) | 同義語抽出システム、方法およびプログラム | |
WO2019163642A1 (ja) | 要約評価装置、方法、プログラム、及び記憶媒体 | |
RU2546064C1 (ru) | Распределенная система и способ языкового перевода | |
Broughton | A faceted classification as the basis of a faceted terminology: conversion of a classified structure to thesaurus format in the Bliss Bibliographic Classification | |
JP2006343925A (ja) | 関連語辞書作成装置、および関連語辞書作成方法、並びにコンピュータ・プログラム | |
JP2003167898A (ja) | 情報検索システム | |
JP2007172179A (ja) | 意見抽出装置、意見抽出方法、および意見抽出プログラム | |
CN114528824A (zh) | 文本纠错方法、装置、电子设备及存储介质 | |
JP2008084078A (ja) | 和英規格変換方法及びシステム並びに和英規格変換プログラム | |
JP2010250389A (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
CN111339272A (zh) | 代码缺陷报告检索方法及装置 | |
JP4033089B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP2004280316A (ja) | 分野判定装置及び言語処理装置 | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
CN109271392B (zh) | 快速判别和抽取关系型数据库实体及属性的方法及设备 | |
JPH05158969A (ja) | 言語処理システム | |
JP6476638B2 (ja) | 固有用語候補抽出装置、固有用語候補抽出方法、及び固有用語候補抽出プログラム | |
JP3135221B2 (ja) | 用例主導型言語構造解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090710 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111101 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120918 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130226 |