JP4845921B2 - 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 - Google Patents
機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 Download PDFInfo
- Publication number
- JP4845921B2 JP4845921B2 JP2008105609A JP2008105609A JP4845921B2 JP 4845921 B2 JP4845921 B2 JP 4845921B2 JP 2008105609 A JP2008105609 A JP 2008105609A JP 2008105609 A JP2008105609 A JP 2008105609A JP 4845921 B2 JP4845921 B2 JP 4845921B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- language
- words
- word
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
(例2)
これらの訳文は原文の意味を表現しているとは言えず、翻訳結果としては不十分である。このように、一塊の言葉を含む文を翻訳するとき、表意文字だからといって、より細かく分割して辞書引きし、辞書引きをした訳語をつなぎ合わせて日本語の文字列を作っても、結果として、読み手に原文の意味を正しく伝えることができない場合がある。
このとき、「画」、「本」、「館」、「画本」、「本館」、「画本館」をキーに存在検索単語データベース31を調べる。いま、「画本館」以外の「画」、「本」、「館」、「画本」、「本館」は存在検索単語データベース31に存在し、「画本館」は存在しないとすると、ルール(3−1)の場合には、最も多くの語が連結された「画本館」が存在しないため、結果的には不合格となる。また、ルール(3−1)の場合には、得点が0となり、図4のステップS5での合計点数が低く抑えられる。
このとき、「図書」、「館」、「図書館」をキーに存在検索単語データベース31を調べる。存在検索単語データベース31に、「図書」、「館」、「図書館」のすべてが存在しているとき、ルール(3−1)の場合には、最も多くの語が連結された「図書館」が存在するので合格となる。また、ルール(3−2)の場合には、「図書」、「館」、「図書館」のすべてが存在するので高得点となる。
を翻訳する場合を考える。韓日翻訳辞書を引いても登録語が見つからなかったとき、ハングル文字は表音文字であるため機械的に日本語の仮名に置き換えることができる。そうして得た訳語候補は韓国語の発音をそのまま表現したものであり、日本語に同じ発音をもつ言葉が存在するとは限らない。そこで、存在検索単語データベース31を調べる。そしてそれが見つかれば、かなり高い確率で日本語にも存在すると言うことができる。
Claims (4)
- 機械翻訳プログラム、第1言語の語句とそれに対応する第2言語の語句とを対にしてデ
ータとして記録した翻訳辞書、翻訳に必要な知識・規則及び第1言語の語句の訳語候補の
点数を蓄積した機械翻訳知識データベースを記憶した記憶装置と、前記機械翻訳プログラ
ムを演算実行する演算制御装置とを備えた機械翻訳装置において、
前記記憶装置に予め記憶され第2言語の単語が記載された文書情報を集積した存在検索
単語データベースと;
入力装置から入力された第1言語の原文の形態素解析を行い、原文を語句ごとに分割し
、前記翻訳辞書を参照し、分割した語句が前記翻訳辞書に存在するときは第2言語の訳語
に置き換え訳語候補とし、存在しないときは第1言語の原語表記の未知語を訳語候補とし
た訳文を出力する翻訳辞書検索部と;
前記翻訳辞書検索部で得られた訳文中の訳語候補に対して、前記機械翻訳知識データベ
ースを参照して前記訳語候補の点数を求め、前記存在検索単語データベースを参照して前
記存在検索単語データベースに存在する訳語候補の個数に応じて予め定められた点数を求
め、これら訳語候補の点数の合計点数が予め定めた点数以上のときは合格と判定し、予め
定めた点数未満のときは不合格と判定する訳語候補検証部と;
前記訳語候補検証部で不合格となった訳文について、原文の分割位置及び分割した語句
の訳語を解析情報として第1言語の原文に付加し、既に付加した解析情報と異なる解析情
報が更新される限りその解析情報を付加した第1言語の原文を前記翻訳辞書検索部に出力
して前記翻訳辞書検索部に再解析を指示する再解析指示部と;
前記訳語候補検証部で合格と判断された訳文または前記再解析指示部による前記翻訳辞
書検索部への再解析の指示がないときの訳文を出力装置に出力する出力処理部とを備え;
前記翻訳辞書検索部は、前記再解析指示部から解析情報が付加された第1言語の原文を
取り込んだときは、第1言語の原文を形態素解析する際にその解析情報の分割位置と異な
る位置で原文を語句ごとに分割し、前記翻訳辞書を参照して、分割した語句が前記翻訳辞
書に存在するときは第2言語の訳語に置き換え訳語候補とするとともに存在しないときは
第1言語の原語表記の未知語を訳語候補とした訳文を出力することを特徴とする機械翻訳
装置。 - 前記訳語候補検証部は、前記翻訳辞書検索部で得られた訳語候補に対して、同じ品詞が
複数語連続しているときは連続する語を連結した連結語が前記存在検索単語データベース
に存在するか否かを判定し、存在するときは合格とし、存在しないときは不合格とするこ
とを特徴とする請求項1記載の機械翻訳装置。 - 機械翻訳プログラム、第1言語の語句とそれに対応する第2言語の語句とを対にしてデ
ータとして記録した翻訳辞書、翻訳に必要な知識・規則及び第1言語の語句の訳語候補の
点数を蓄積した機械翻訳知識データベースを記憶した記憶装置と、前記機械翻訳プログラ
ムを演算実行する演算制御装置とを備えたコンピュータに用いられ、前記記憶装置に予め
記憶され第2言語の単語が記載された文書情報を集積した存在検索単語データベースを格
納しておき、
前記コンピュータに、入力装置から入力された第1言語の原文の形態素解析を行い、原
文を語句ごとに分割し、前記翻訳辞書を参照し、分割した語句が前記翻訳辞書に存在する
ときは第2言語の訳語に置き換え訳語候補とし、存在しないときは第1言語の原語表記の
未知語を訳語候補とした訳文を出力する機能と;
得られた訳文中の訳語候補に対して、前記機械翻訳知識データベースを参照して前記訳
語候補の点数を求め、前記存在検索単語データベースを参照して前記存在検索単語データ
ベースに存在する訳語候補の個数に応じて予め定められた点数を求め、これら訳語候補の
点数の合計点数が予め定めた点数以上のときは合格と判定し、予め定めた点数未満のとき
は不合格と判定する機能と、
不合格となった訳文について、原文の分割位置及び分割した語句の訳語を解析情報とし
て第1言語の原文に付加し、既に付加した解析情報と異なる解析情報が更新される限りそ
の解析情報を付加した第1言語の原文の再解析を指示する機能と;
再解析が指示された第1言語の原文を形態素解析する際に付加された解析情報の分割位
置と異なる位置で原文を語句ごとに分割し、前記翻訳辞書を参照して、分割した語句が前
記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とするとともに存在しな
いときは第1言語の原語表記の未知語を訳語候補とした訳文を出力する機能と;
合格と判断された訳文または再解析の指示がないときの訳文を出力装置に出力する機能
と;を実現させるための機械翻訳プログラム。 - 機械翻訳プログラム、第1言語の語句とそれに対応する第2言語の語句とを対にしてデ
ータとして記録した翻訳辞書、翻訳に必要な知識・規則及び第1言語の語句の訳語候補の
点数を蓄積した機械翻訳知識データベースを記憶した記憶装置と、前記機械翻訳プログラ
ムを演算実行する演算制御装置とを備え、機械翻訳を行う機械翻訳方法において、
前記記憶装置に予め記憶され第2言語の単語が記載された文書情報を集積した存在検索
単語データベースを格納しておくステップと;
入力装置から入力された第1言語の原文の形態素解析を行い、原文を語句ごとに分割し
、前記翻訳辞書を参照し、分割した語句が前記翻訳辞書に存在するときは第2言語の訳語
に置き換え訳語候補とし、存在しないときは第1言語の原語表記の未知語を訳語候補とし
た訳文を出力するステップと;
得られた訳文中の訳語候補に対して、前記機械翻訳知識データベースを参照して前記訳
語候補の点数を求め、前記存在検索単語データベースを参照して前記存在検索単語データ
ベースに存在する訳語候補の個数に応じて予め定められた点数を求め、これら訳語候補の
点数の合計点数が予め定めた点数以上のときは合格と判定し、予め定めた点数未満のとき
は不合格と判定するステップと;
不合格となった訳文について、原文の分割位置及び分割した語句の訳語を解析情報とし
て第1言語の原文に付加し、既に付加した解析情報と異なる解析情報が更新される限りそ
の解析情報を付加した第1言語の原文の再解析を指示するステップと;
再解析が指示された第1言語の原文を形態素解析する際に付加された解析情報の分割位
置と異なる位置で原文を語句ごとに分割し、前記翻訳辞書を参照して、分割した語句が前
記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とするとともに存在しな
いときは第1言語の原語表記の未知語を訳語候補とした訳文を出力するステップと;
合格と判断された訳文または再解析の指示がないときの訳文を出力装置に出力するステ
ップとを備えたことを特徴とする機械翻訳方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008105609A JP4845921B2 (ja) | 2008-04-15 | 2008-04-15 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008105609A JP4845921B2 (ja) | 2008-04-15 | 2008-04-15 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009258887A JP2009258887A (ja) | 2009-11-05 |
JP4845921B2 true JP4845921B2 (ja) | 2011-12-28 |
Family
ID=41386240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008105609A Expired - Fee Related JP4845921B2 (ja) | 2008-04-15 | 2008-04-15 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4845921B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101709693B1 (ko) * | 2015-07-13 | 2017-02-27 | 주식회사 에버트란 | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 |
KR101834436B1 (ko) * | 2016-07-13 | 2018-03-05 | 김태완 | 텍스트 생성 방법 및 장치 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05135094A (ja) * | 1991-11-12 | 1993-06-01 | Ricoh Co Ltd | 言語解析装置 |
-
2008
- 2008-04-15 JP JP2008105609A patent/JP4845921B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009258887A (ja) | 2009-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102268875B1 (ko) | 전자 장치에 텍스트를 입력하는 시스템 및 방법 | |
US7584093B2 (en) | Method and system for generating spelling suggestions | |
US9262409B2 (en) | Translation of a selected text fragment of a screen | |
US7630880B2 (en) | Japanese virtual dictionary | |
US20070021956A1 (en) | Method and apparatus for generating ideographic representations of letter based names | |
US20080133444A1 (en) | Web-based collocation error proofing | |
US20060241934A1 (en) | Apparatus and method for translating Japanese into Chinese, and computer program product therefor | |
US8655641B2 (en) | Machine translation apparatus and non-transitory computer readable medium | |
KR101544690B1 (ko) | 단어 분할 장치, 단어 분할 방법 및 단어 분할 프로그램 | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
JP2002517039A (ja) | 中国語テキストにおける単語分割 | |
KR101841824B1 (ko) | 텍스트 분할 프로그램, 텍스트 분할 장치, 및 텍스트 분할 방법 | |
US20110046940A1 (en) | Machine translation device, machine translation method, and program | |
US10120843B2 (en) | Generation of parsable data for deep parsing | |
JP2018055670A (ja) | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム | |
JPH10326275A (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
JP6160438B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP4845921B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP4940606B2 (ja) | 翻訳システム、翻訳装置、翻訳方法及びプログラム | |
US7983899B2 (en) | Apparatus for and method of analyzing chinese | |
WO2008131509A1 (en) | Systems and methods for improving translation systems | |
JP5185343B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP3825645B2 (ja) | 表現変換方法及び表現変換装置 | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110317 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110711 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110916 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111011 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141021 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4845921 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |