JP7107609B1 - 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム - Google Patents
言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム Download PDFInfo
- Publication number
- JP7107609B1 JP7107609B1 JP2021176759A JP2021176759A JP7107609B1 JP 7107609 B1 JP7107609 B1 JP 7107609B1 JP 2021176759 A JP2021176759 A JP 2021176759A JP 2021176759 A JP2021176759 A JP 2021176759A JP 7107609 B1 JP7107609 B1 JP 7107609B1
- Authority
- JP
- Japan
- Prior art keywords
- translation
- machine translation
- sentence
- language
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims description 23
- 238000013519 translation Methods 0.000 claims abstract description 217
- 230000015654 memory Effects 0.000 claims abstract description 87
- 238000012545 processing Methods 0.000 claims abstract description 34
- 238000012546 transfer Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 27
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000014616 translation Effects 0.000 description 148
- 230000008676 import Effects 0.000 description 26
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
図1は、本実施形態における言語資産管理システムの概要図である。言語資産管理システムは、サーバ1と、端末装置2と、1又は複数のサーバ3と、を備える。
図2に例示されるように、サーバ1は、既知または慣用のコンピュータの態様をとり、例として、演算デバイス101、主記憶デバイス102、補助記憶デバイス103、入力デバイス104、出力デバイス105、通信デバイス106、及び、バスインタフェースを有し、本発明が発揮する作用効果を実現する上で適宜、用いられる。
図1に例示されるように、サーバ1は、生成手段11と、格納手段12と、学習手段13と、設定手段14と、翻訳手段15と、出力処理手段16と、データベースDBと、を有する。
図3が示すように、本発明にかかる一連の処理は以下のステップを含む。なお、図3に示される各ステップの順序は一例であり、指定がない限り適宜、当該順序は変更され得る。
2 :端末装置
3 :サーバ
101 :演算デバイス
102 :主記憶デバイス
103 :補助記憶デバイス
104 :入力デバイス
105 :出力デバイス
106 :通信デバイス
201 :演算デバイス
202 :主記憶デバイス
203 :補助記憶デバイス
204 :入力デバイス
205 :出力デバイス
206 :通信デバイス
11 :生成手段
12 :格納手段
13 :学習手段
14 :設定手段
15 :翻訳手段
16 :出力処理手段
21 :インポート手段
22 :出力手段
23 :入力手段
Claims (9)
- 原文を訳文に翻訳する機械翻訳モデルと、文章の原文と訳文を対訳表記した翻訳メモリ及び用語の原文と訳文を対訳表記した用語集と、を対応付けて、1又は複数の翻訳メモリと用語集によって利用者が任意にカスタムした機械翻訳モデルを前記機械翻訳モデルとして管理する言語資産管理システムであって、
前記利用者によってインポートされた原文及び訳文の双方の言語による文章又は用語が記述された転送元ファイルに基づき、前記翻訳メモリ及び/又は前記用語集を生成する手段と、
生成した前記翻訳メモリ及び、前記用語集のそれぞれに識別情報を対応付けて格納する手段と、
1又は複数の前記翻訳メモリを用いた前記機械翻訳モデルの学習処理並びに、1又は複数の前記用語集の前記機械翻訳モデルへの設定処理を行い、カスタムされた機械翻訳モデルの識別情報に対して前記学習処理に用いた前記翻訳メモリ及び、前記設定処理に用いた前記用語集の識別情報を対応付けて登録する手段と、を備え、
前記登録する手段は、前記カスタムされた機械翻訳モデルを複数登録可能であって、複数の前記カスタムされた機械翻訳モデルに対応付けられた前記翻訳メモリはそれぞれ異なる言語資産管理システム。 - 前記言語資産管理システムは、利用者による翻訳対象である文章の入力及び、登録された複数の前記カスタムされた機械翻訳モデルの中から翻訳に利用する前記カスタムされた機械翻訳モデルの指定を受け付け、指定された前記カスタムされた機械翻訳モデルに基づき入力された前記翻訳対象である文章の翻訳処理を行う手段を有する請求項1に記載の言語資産管理システム。
- 前記言語資産管理システムは、アダプテーションの対象となる機械翻訳学習サービスを選択可能に構成され、
前記登録する手段は、選択された前記機械翻訳学習サービスに対して前記学習処理及び、前記設定処理が行われることで、前記カスタムされた機械翻訳モデルを登録可能であり、前記カスタムされた機械翻訳モデルの識別情報に、前記学習処理を行う際に選択された前記機械翻訳学習サービスを対応付けて登録する請求項1又は2に記載の言語資産管理システム。 - 前記生成する手段は更に、原文のみが記述された転送元ファイルにおける文章と、前記機械翻訳モデルと、に基づき前記翻訳メモリを生成する請求項1~3の何れかに記載の言語資産管理システム。
- 前記生成する手段は更に、前記翻訳メモリにおける前記原文と前記訳文の対である各セグメントにおいて前記訳文の逆翻訳を行うことで逆翻訳文を生成し、前記原文と前記逆翻訳文との間の編集距離に基づいて翻訳精度をスコア値として評価し、前記スコア値が閾値よりも高い前記セグメントから前記翻訳メモリを生成する請求項1~4の何れかに記載の言語資産管理システム。
- 前記生成する手段は更に、文章の原文と訳文の間において対応する単語及び対応しない単語の数に基づいて翻訳精度を前記スコア値として評価し、前記スコア値が閾値よりも高い文章同士から前記翻訳メモリを生成する請求項1~5の何れかに記載の言語資産管理システム。
- 前記生成する手段は更に、前記翻訳精度が閾値よりも低い前記セグメントから前記翻訳メモリを生成し、
前記言語資産管理システムは更に、前記利用者が前記セグメントの編集を行うための手段を有する請求項5又は6に記載の言語資産管理システム。 - 原文を訳文に翻訳する機械翻訳モデルと、文章の原文と訳文を対訳表記した翻訳メモリ及び用語の原文と訳文を対訳表記した用語集と、を対応付けて、1又は複数の翻訳メモリと用語集によって利用者が任意にカスタムした機械翻訳モデルを前記機械翻訳モデルとして管理する言語資産管理プログラムであって、コンピュータを、
前記利用者によってインポートされた原文及び訳文の双方の言語による文章又は用語が記述された転送元ファイルに基づき、前記翻訳メモリ及び/又は前記用語集を生成する手段と、
生成した前記翻訳メモリ及び、前記用語集のそれぞれに識別情報を対応付けて格納する手段と、
1又は複数の前記翻訳メモリを用いた前記機械翻訳モデルの学習処理並びに、1又は複数の前記用語集の前記機械翻訳モデルへの設定処理を行い、カスタムされた機械翻訳モデルの識別情報に対して前記学習処理に用いた前記翻訳メモリ及び、前記設定処理に用いた前記用語集の識別情報を対応付けて登録する手段と、として機能させ、
前記登録する手段は、前記カスタムされた機械翻訳モデルを複数登録可能であって、複数の前記カスタムされた機械翻訳モデルに対応付けられた前記翻訳メモリはそれぞれ異なる言語資産管理プログラム。 - 原文を訳文に翻訳する機械翻訳モデルと、文章の原文と訳文を対訳表記した翻訳メモリ及び用語の原文と訳文を対訳表記した用語集と、を対応付けて、1又は複数の翻訳メモリと用語集によって利用者が任意にカスタムした機械翻訳モデルを前記機械翻訳モデルとして言語資産管理方法であって、コンピュータが、
前記利用者によってインポートされた原文及び訳文の双方の言語による文章又は用語が記述された転送元ファイルに基づき、前記翻訳メモリ及び/又は前記用語集を生成するステップと、
生成した前記翻訳メモリ及び、前記用語集のそれぞれに識別情報を対応付けて格納するステップと、
1又は複数の前記翻訳メモリを用いた前記機械翻訳モデルの学習処理並びに、1又は複数の前記用語集の前記機械翻訳モデルへの設定処理を行い、カスタムされた機械翻訳モデルの識別情報に対して前記学習処理に用いた前記翻訳メモリ及び、前記設定処理に用いた前記用語集の識別情報を対応付けて登録するステップと、を備え、
前記登録するステップは、前記カスタムされた機械翻訳モデルを複数登録可能であって、複数の前記カスタムされた機械翻訳モデルに対応付けられた前記翻訳メモリはそれぞれ異なる言語資産管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021176759A JP7107609B1 (ja) | 2021-10-28 | 2021-10-28 | 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021176759A JP7107609B1 (ja) | 2021-10-28 | 2021-10-28 | 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7107609B1 true JP7107609B1 (ja) | 2022-07-27 |
JP2023066183A JP2023066183A (ja) | 2023-05-15 |
Family
ID=82607866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021176759A Active JP7107609B1 (ja) | 2021-10-28 | 2021-10-28 | 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7107609B1 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050234700A1 (en) | 2004-04-15 | 2005-10-20 | International Business Machines Corporation | Autonomic method, system and program product for translating content |
WO2009004723A1 (ja) | 2007-07-04 | 2009-01-08 | Fujitsu Limited | 翻訳支援プログラム、翻訳支援装置および翻訳支援方法 |
JP2009116585A (ja) | 2007-11-06 | 2009-05-28 | Toshiba Corp | 機械翻訳装置及び機械翻訳プログラム |
JP2009217689A (ja) | 2008-03-12 | 2009-09-24 | National Institute Of Information & Communication Technology | 情報処理装置、情報処理方法、及びプログラム |
JP2012190080A (ja) | 2011-03-08 | 2012-10-04 | Internatl Business Mach Corp <Ibm> | 用語の対応を見出す方法、プログラム及びシステム |
US20180143975A1 (en) | 2016-11-18 | 2018-05-24 | Lionbridge Technologies, Inc. | Collection strategies that facilitate arranging portions of documents into content collections |
CN111859995A (zh) | 2020-06-16 | 2020-10-30 | 北京百度网讯科技有限公司 | 机器翻译模型的训练方法、装置、电子设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05298360A (ja) * | 1992-04-17 | 1993-11-12 | Hitachi Ltd | 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置 |
JP3305953B2 (ja) * | 1996-06-19 | 2002-07-24 | 沖電気工業株式会社 | 翻訳パターン作成方法および装置 |
KR20150052400A (ko) * | 2013-11-04 | 2015-05-14 | 주식회사 에버트란 | 번역 은행 기반의 번역 서비스 제공 시스템 |
-
2021
- 2021-10-28 JP JP2021176759A patent/JP7107609B1/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050234700A1 (en) | 2004-04-15 | 2005-10-20 | International Business Machines Corporation | Autonomic method, system and program product for translating content |
WO2009004723A1 (ja) | 2007-07-04 | 2009-01-08 | Fujitsu Limited | 翻訳支援プログラム、翻訳支援装置および翻訳支援方法 |
JP2009116585A (ja) | 2007-11-06 | 2009-05-28 | Toshiba Corp | 機械翻訳装置及び機械翻訳プログラム |
JP2009217689A (ja) | 2008-03-12 | 2009-09-24 | National Institute Of Information & Communication Technology | 情報処理装置、情報処理方法、及びプログラム |
JP2012190080A (ja) | 2011-03-08 | 2012-10-04 | Internatl Business Mach Corp <Ibm> | 用語の対応を見出す方法、プログラム及びシステム |
US20180143975A1 (en) | 2016-11-18 | 2018-05-24 | Lionbridge Technologies, Inc. | Collection strategies that facilitate arranging portions of documents into content collections |
CN111859995A (zh) | 2020-06-16 | 2020-10-30 | 北京百度网讯科技有限公司 | 机器翻译模型的训练方法、装置、电子设备及存储介质 |
JP2021197188A (ja) | 2020-06-16 | 2021-12-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 機械翻訳モデルの訓練方法、装置、電子デバイス及び記憶媒体 |
Non-Patent Citations (6)
Title |
---|
Imankulova Aizhan 外2名,逆翻訳による高品質な大規模擬似対訳コーパスの作成,言語処理学会第23回年次大会 発表論文集 [online] ,日本,言語処理学会,2017年03月06日,pp.210-213 |
土井 惟成 外2名,コーポレート・ガバナンス報告書における機械翻訳の検討,言語処理学会第25回年次大会 発表論文集 [online],日本,言語処理学会,2019年03月04日,pp.926-929 |
土井 惟成 外3名,上場会社開示資料の日英対訳コーパスの自動生成に関する検討,言語処理学会第27回年次大会 発表論文集 [online],日本,言語処理学会,2021年03月08日,pp.1535-1539 |
後藤 統興 外2名,対象ドメインの高頻出句に対する人手対訳追加による講義音声翻訳の検討,情報処理学会 研究報告 自然言語処理(NL) 2016-NL-226 [online] ,日本,情報処理学会,2016年05月09日,pp.1-8 |
森下 睦 外2名,クラウドソーシングによるWebサイトマイニングを用いた翻訳モデルの即時領域適応,言語処理学会第27回年次大会 発表論文集 [online],日本,言語処理学会,2021年03月08日,pp.1397-1402 |
深津 康行,第11回 機械学習サービスその3 追加学習で業務に合わせた文章分類を実現 特殊な専門用語を扱える機械翻訳モデルも,日経クラウドファースト,日本,日経BP社 Nikkei Business Publications,Inc.,2019年02月20日,第35号,pp.32-36 |
Also Published As
Publication number | Publication date |
---|---|
JP2023066183A (ja) | 2023-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021089705A (ja) | 翻訳品質を評価するための方法と装置 | |
US20190220490A1 (en) | Combining website characteristics in an automatically generated website | |
EP2947581B1 (en) | Interactive searching method and apparatus | |
CN110019732B (zh) | 一种智能问答方法以及相关装置 | |
JP6693582B2 (ja) | 文書要約の生成方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体 | |
CN111191012B (zh) | 知识图谱产生装置、方法及其计算机可读存储介质 | |
CN108717437B (zh) | 搜索结果展示方法、装置及存储介质 | |
CN116127020A (zh) | 生成式大语言模型训练方法以及基于模型的搜索方法 | |
EP4123474A1 (en) | Method for acquiring structured question-answering model, question-answering method and corresponding apparatus | |
CN116303537A (zh) | 数据查询方法及装置、电子设备、存储介质 | |
JP2021056659A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP2022166215A (ja) | 文字位置決めモデルのトレーニング方法及び文字位置決め方法 | |
CN111814496A (zh) | 文本处理方法、装置、设备及存储介质 | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
CN109471957B (zh) | 一种基于统一标签的元数据转换方法及装置 | |
CN114141384A (zh) | 用于检索医学数据的方法、设备和介质 | |
CN113590578A (zh) | 跨语言知识单元迁移方法、装置、存储介质及终端 | |
JP7107609B1 (ja) | 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム | |
CN113642337A (zh) | 数据处理方法和装置、翻译方法、电子设备以及计算机可读存储介质 | |
JP2023012541A (ja) | テーブルに基づく質問応答方法、装置及び電子機器 | |
CN115757720A (zh) | 基于知识图谱的项目信息搜索方法、装置、设备和介质 | |
CN111859985A (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
JP7539094B1 (ja) | プログラム、方法、情報処理装置、システム | |
CN115376153B (zh) | 一种合同比对方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211028 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220707 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7107609 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |