JP2015170094A - Translation device and translation method - Google Patents

Translation device and translation method Download PDF

Info

Publication number
JP2015170094A
JP2015170094A JP2014044002A JP2014044002A JP2015170094A JP 2015170094 A JP2015170094 A JP 2015170094A JP 2014044002 A JP2014044002 A JP 2014044002A JP 2014044002 A JP2014044002 A JP 2014044002A JP 2015170094 A JP2015170094 A JP 2015170094A
Authority
JP
Japan
Prior art keywords
translation
category
sentence
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014044002A
Other languages
Japanese (ja)
Other versions
JP6306376B2 (en
Inventor
武市 真知
Masatomo Takechi
真知 武市
貴司 清水
Takashi Shimizu
貴司 清水
浩二 山中
Koji Yamanaka
浩二 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2014044002A priority Critical patent/JP6306376B2/en
Publication of JP2015170094A publication Critical patent/JP2015170094A/en
Application granted granted Critical
Publication of JP6306376B2 publication Critical patent/JP6306376B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To properly translate a sentence even in a case where the single sentence is not enough to determine a dictionary to be used to translate the sentence.SOLUTION: The translation device 10 comprises: a translation engine group 11 which stores a plurality of dictionaries to be used for translation by associating the dictionaries with categories to perform translation processing; an input unit 12 to which the sentence to be translated is input; a determination unit 13 which determines a category of the sentence; an information storage unit 14 which stores category information for specifying the category of the sentence; an update unit 15 which updates the category information when the category is determined and does not update the category information when the category is not determined; a translation engine distribution unit 16 which outputs the sentence to a translation engine 110 that is associated with the category specified according to the stored category information; an automatic input correction unit 17 which corrects the sentence to be translated; and an output unit 18 which outputs the translated sentence.

Description

本発明は、文章を翻訳する翻訳装置及び翻訳方法に関する。   The present invention relates to a translation apparatus and a translation method for translating a sentence.

機械翻訳サービスは、言語の確からしさや、翻訳の確からしさを基に、最も適切さの度合いが高い翻訳結果を求めて訳文を生成している。特許文献1では、翻訳対象文の特徴を示す翻訳対象特徴ベクトルを作成すると共に専門分野文の特徴を示す専門分野特徴ベクトルを作成し、これらから翻訳対象文の各専門分野への帰属可能性を推定し、その推定に基づいて翻訳に適した専門辞書データを選択する技術が提案されている。   The machine translation service generates a translation by obtaining a translation result having the highest degree of appropriateness based on the certainty of the language and the certainty of the translation. In Patent Document 1, a translation target feature vector indicating the characteristics of the translation target sentence is created, and a specialized field feature vector indicating the characteristics of the specialized field sentence is created. A technique for estimating and selecting specialized dictionary data suitable for translation based on the estimation has been proposed.

特開2007−80221号公報JP 2007-80221 A

しかしながら、翻訳対象となる各文章のみからでは、文章が属するカテゴリ(分野)を判断できず、十分に適切に翻訳を行えない場合がある。例えば、翻訳対象の文章が「お体の状態はいかがですか?」というものである場合を考える。本文章は、例えば、一般的な機械翻訳エンジンでは、「How is state of body?」等と翻訳される。しかしながら、上記の文章が、例えば、医療分野での会話に係るものであった場合、必ずしも上記の翻訳は適切ではない。上記の文章は、例えば、医療辞書データベースを有する翻訳エンジンでは、「How is condition of body?」等と翻訳される。このように、会話の背景によっては、一般的な機械翻訳エンジンより、特定の分野の辞書データベースを有する翻訳エンジンを用いて翻訳することが望ましい。しかし、上記の文章だけでは、医療分野に特化した翻訳を行えばよいかどうか十分に判断することは難しい。   However, the category (field) to which the sentence belongs cannot be determined only from each sentence to be translated, and the translation may not be performed adequately. For example, consider a case where a sentence to be translated is "How is your body?" The main body chapter is translated as “How is state of body?”, For example, in a general machine translation engine. However, if the above sentence relates to a conversation in the medical field, for example, the above translation is not necessarily appropriate. For example, the above sentence is translated as “How is condition of body?” Or the like in a translation engine having a medical dictionary database. Thus, depending on the background of conversation, it is desirable to translate using a translation engine having a dictionary database in a specific field rather than a general machine translation engine. However, it is difficult to sufficiently determine whether or not it is only necessary to perform translation specialized for the medical field by using the above sentence alone.

本発明は、上記の問題点に鑑みてなされたものであり、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、当該文章を適切に翻訳することができる翻訳装置及び翻訳方法を提供することを目的とする。   The present invention has been made in view of the above problems, and even when it is not possible to sufficiently determine what dictionary should be used for translation from a single sentence, the sentence is appropriately It is an object of the present invention to provide a translation apparatus and a translation method that can translate.

上記の目的を達成するために、本発明に係る翻訳装置は、カテゴリに対応付けて、翻訳に用いる複数の辞書を保持する辞書保持手段と、翻訳対象となる文章のカテゴリを特定するカテゴリ情報を保持するカテゴリ情報保持手段と、翻訳対象となる第1の言語による文章を入力する入力手段と、入力手段によって入力された文章に基づいて、当該文章のカテゴリを判定する判定手段と、判定手段によってカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報でカテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、判定手段によってカテゴリが判定されない場合には、カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新手段と、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、辞書保持手段に保持されている辞書を用いて、入力手段によって入力された文章を第1の言語から第2の言語に翻訳する翻訳手段と、翻訳手段によって翻訳された文章を出力する出力手段と、を備える。   In order to achieve the above object, a translation apparatus according to the present invention includes dictionary holding means for holding a plurality of dictionaries used for translation in association with a category, and category information for specifying a category of a sentence to be translated. A category information holding means for holding; an input means for inputting a sentence in a first language to be translated; a determining means for determining a category of the sentence based on a sentence input by the input means; and a determining means When the category is determined, the category information held by the category information holding unit is updated with the category information for specifying the determined category. When the category is not determined by the determining unit, the category information holding unit The update means that keeps the category information that is held, and the category information holding means Translation means for translating a sentence input by the input means from the first language to the second language using a dictionary associated with the category specified by the category information and held in the dictionary holding means. Output means for outputting a sentence translated by the translation means.

本発明に係る翻訳装置では、入力された翻訳対象の文章からカテゴリの判定が行われる。カテゴリの判定が行われた場合には、判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。一方、カテゴリの判定が行われなかった場合には、それ以前に入力された文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。即ち、本発明に係る翻訳装置では、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、会話等の一連の文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。従って、本発明に係る翻訳装置によれば、上記の場合であっても、文章を適切に翻訳することができる。   In the translation apparatus according to the present invention, the category is determined from the input sentence to be translated. When the category is determined, translation is performed using a dictionary associated with the determined category. On the other hand, if the category is not determined, translation is performed using a dictionary associated with the category determined based on the sentence input before that. That is, in the translation device according to the present invention, even if it is not possible to sufficiently determine what dictionary should be used for translation from a single sentence, it is determined based on a series of sentences such as conversations. Translation is performed using a dictionary associated with the category. Therefore, according to the translation apparatus according to the present invention, it is possible to appropriately translate a sentence even in the above case.

判定手段は、機械学習により、入力手段によって入力された文章がカテゴリに属する度合いを推定し、当該度合いに基づいて当該文章のカテゴリを判定することとしてもよい。この構成によれば、カテゴリを判定できるか否かを含めて、適切にカテゴリを判定することができる。これにより、文章をより適切に翻訳することができる。   The determination means may estimate the degree to which the text input by the input means belongs to a category by machine learning, and determine the category of the text based on the degree. According to this configuration, it is possible to appropriately determine the category including whether or not the category can be determined. Thereby, a sentence can be translated more appropriately.

入力手段は、翻訳対象となる第2の言語による文章を入力し、翻訳手段は、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、辞書保持手段に保持されている辞書を用いて、入力手段によって入力された文章を第2の言語から第1の言語に翻訳する、こととしてもよい。この構成によれば、例えば、適切な翻訳が行われた上で、異なる言語での会話を可能とすることができる。   The input means inputs sentences in the second language to be translated, and the translation means is associated with the category specified by the category information held by the category information holding means and held in the dictionary holding means. The sentence input by the input means may be translated from the second language into the first language using the existing dictionary. According to this configuration, for example, a conversation in a different language can be performed after appropriate translation is performed.

翻訳手段は、翻訳対象となる文章を、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに応じて予め設定されたルールに基づいて変換し、変換した文章を翻訳することとしてもよい。この構成によれば、翻訳された文章をより適切なものとすることができる。   The translation unit may convert the sentence to be translated based on a rule set in advance according to the category specified by the category information held by the category information holding unit, and may translate the converted sentence. . According to this configuration, the translated sentence can be made more appropriate.

ところで、本発明は、上記のように翻訳装置の発明として記述できる他に、以下のように翻訳方法の発明としても記述することができる。これはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。   By the way, the present invention can be described as an invention of a translation apparatus as described below, in addition to the invention of a translation apparatus as described above. This is substantially the same invention only in different categories, and has the same operations and effects.

即ち、本発明に係る翻訳方法は、カテゴリに対応付けて、翻訳に用いる複数の辞書を保持する辞書保持手段と、翻訳対象となる文章のカテゴリを特定するカテゴリ情報を保持するカテゴリ情報保持手段と、を備える翻訳装置の動作方法である翻訳方法であって、翻訳対象となる第1の言語による文章を入力する入力ステップと、入力ステップにおいて入力された文章に基づいて、当該文章のカテゴリを判定する判定ステップと、判定ステップにおいてカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報でカテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、判定ステップにおいてカテゴリが判定されない場合には、カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新ステップと、カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、辞書保持手段に保持されている辞書を用いて、入力ステップにおいて入力された文章を第1の言語から第2の言語に翻訳する翻訳ステップと、翻訳ステップにおいて翻訳された文章を出力する出力ステップと、を含む。   That is, the translation method according to the present invention includes a dictionary holding unit that holds a plurality of dictionaries used for translation in association with a category, and a category information holding unit that holds category information for specifying a category of a sentence to be translated. A translation method that is an operation method of a translation apparatus comprising: an input step for inputting a sentence in a first language to be translated; and a category of the sentence based on the sentence input in the input step And when the category is determined in the determination step, the category information held by the category information holding means is updated with the category information for specifying the determined category, and the category is not determined in the determination step Keeps the category information held by the category information holding means. Using the dictionary stored in the dictionary holding unit in association with the category specified by the update step and the category information held by the category information holding unit, the sentence input in the input step is converted into the first language. A translation step for translating the text into the second language, and an output step for outputting the text translated in the translation step.

本発明では、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、会話等の一連の文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。従って、本発明によれば、上記の場合であっても、文章を適切に翻訳することができる。   In the present invention, even if it is not possible to sufficiently determine what dictionary should be used for translation from a single sentence, it is associated with a category determined based on a series of sentences such as conversation. A dictionary is used for translation. Therefore, according to the present invention, even in the above case, the sentence can be appropriately translated.

本発明の実施形態に係る翻訳装置の構成を示す図である。It is a figure which shows the structure of the translation apparatus which concerns on embodiment of this invention. 翻訳装置によって翻訳される文章の例を示す図である。It is a figure which shows the example of the text translated by the translation apparatus. ユーザ端末の表示画面の例を示す図である。It is a figure which shows the example of the display screen of a user terminal. 推定ラベルが判定されているか否かを判断するために用いられる閾値を示す確信度判定パターン表である。It is a certainty factor determination pattern table | surface which shows the threshold value used in order to judge whether the presumed label is judged. 推定ラベルと翻訳エンジン番号とが対応付けられた翻訳エンジン振り分けパターン表である。It is a translation engine distribution pattern table | surface with which the presumed label and the translation engine number were matched. 入力文の例と機械翻訳文の例とを示す図である。It is a figure which shows the example of an input sentence, and the example of a machine translation sentence. Pカテゴリ毎のEカテゴリの候補となる単語を含むE推定辞書の例を示す図である。It is a figure which shows the example of the E estimation dictionary containing the word used as the candidate of E category for every P category. Eカテゴリの推定の概要を示す図である。It is a figure which shows the outline | summary of estimation of E category. カテゴリ及びPカテゴリ毎に記憶される標準フレーズの例を示す図である。It is a figure which shows the example of the standard phrase memorize | stored for every category and P category. 標準的なフレーズの決定の概要を示す図である。It is a figure which shows the outline | summary of determination of a standard phrase. 本発明の実施形態に係る翻訳装置のハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the translation apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る翻訳装置で実行される処理(翻訳方法)全体を示すフローチャートである。It is a flowchart which shows the whole process (translation method) performed with the translation apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る翻訳装置で実行される処理(翻訳方法)のうち推定ラベルの判定処理を示すフローチャートである。It is a flowchart which shows the estimation label determination process among the processes (translation method) performed with the translation apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る翻訳装置で実行される処理(翻訳方法)のうち入力文の自動補正処理を示すフローチャートである。It is a flowchart which shows the automatic correction process of an input sentence among the processes (translation method) performed with the translation apparatus which concerns on embodiment of this invention.

以下、図面と共に本発明に係る翻訳装置及び翻訳方法の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。   Hereinafter, embodiments of a translation apparatus and a translation method according to the present invention will be described in detail with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.

図1に本実施形態に係る翻訳装置10を示す。翻訳装置10は、翻訳対象となる文章を入力し、当該文章を翻訳(機械翻訳)して、翻訳された文章を出力する装置である。即ち、翻訳装置10は、翻訳サービスを提供する装置である。例えば、翻訳装置10は、ユーザ端末20と移動体通信網あるいはインターネット等の通信網を介して接続されている。翻訳装置10は、ユーザ端末20から翻訳対象となる文章を受信し、ユーザ端末20に対して翻訳された文章を送信する。   FIG. 1 shows a translation apparatus 10 according to this embodiment. The translation apparatus 10 is an apparatus that inputs a sentence to be translated, translates the sentence (machine translation), and outputs the translated sentence. That is, the translation device 10 is a device that provides a translation service. For example, the translation apparatus 10 is connected to the user terminal 20 via a communication network such as a mobile communication network or the Internet. The translation device 10 receives a sentence to be translated from the user terminal 20 and transmits the translated sentence to the user terminal 20.

翻訳装置10は、複数の一連の文章を順次、翻訳する。また、翻訳装置10は、第1の言語による文章を第2の言語に翻訳すると共に、その逆の第2の言語による文章を第1の言語に翻訳することとしてもよい。例えば、翻訳装置10は、日本語による文章を英語に翻訳すると共に、英語による文章を日本語に翻訳することとしてもよい。具体的には、翻訳装置10は、図2に示すようなユーザ30a,30b同士の一連の会話を翻訳する。   The translation device 10 sequentially translates a plurality of series of sentences. The translation device 10 may translate the sentence in the first language into the second language and translate the sentence in the opposite second language into the first language. For example, the translation apparatus 10 may translate Japanese sentences into English and translate English sentences into Japanese. Specifically, the translation apparatus 10 translates a series of conversations between the users 30a and 30b as shown in FIG.

ユーザ端末20は、通信網を介して翻訳装置10と通信を行うことができる装置であり、例えば、スマートフォン、携帯電話機又はPC(Personal Computer)に相当する。ユーザ端末20は、翻訳装置10との間でセッションを確立して、翻訳対象の文章を入力して翻訳装置10に送信する。また、ユーザ端末20は、文章をどの言語からどの言語に翻訳するかを示す翻訳方向情報(例えば、日本語から英語への翻訳であることを示す情報)を入力して、文章の送信と合わせて当該情報を翻訳装置10に送信することとしてもよい。ユーザ端末20と翻訳装置10とのセッションは、セッションID等で一意に識別され、翻訳装置10では、どのユーザ端末20から翻訳対象の文章が送信されたか把握することができる。   The user terminal 20 is a device that can communicate with the translation device 10 via a communication network, and corresponds to, for example, a smartphone, a mobile phone, or a PC (Personal Computer). The user terminal 20 establishes a session with the translation apparatus 10, inputs a translation target sentence, and transmits it to the translation apparatus 10. In addition, the user terminal 20 inputs translation direction information (for example, information indicating that the translation is from Japanese to English) indicating which language is translated from which language, and matches the transmission of the sentence. The information may be transmitted to the translation apparatus 10. The session between the user terminal 20 and the translation device 10 is uniquely identified by a session ID or the like, and the translation device 10 can grasp from which user terminal 20 the sentence to be translated is transmitted.

ユーザ端末20は、例えば、ユーザからの音声を入力し、音声を音声認識して文章とすることで翻訳対象の文章を入力する。音声認識は、従来から用いられている音声認識技術が用いられて行われる。あるいは、ユーザ端末20は、入力した音声を翻訳装置10に送信し、翻訳装置10側で音声認識が行われてもよい。あるいは、翻訳装置10とは別の音声認識サーバで音声認識が行われてもよい。その場合、ユーザ端末20は、音声認識サーバに音声を送信し、音声認識サーバから音声認識結果である文章を受信する。翻訳対象の文章は、音声による入力以外でも、ユーザがユーザ端末20のボタンを操作すること等によって入力されてもよい。   The user terminal 20 inputs a sentence to be translated, for example, by inputting a voice from the user and recognizing the voice as a sentence. Speech recognition is performed using a conventionally used speech recognition technique. Alternatively, the user terminal 20 may transmit the input speech to the translation device 10 and speech recognition may be performed on the translation device 10 side. Alternatively, the speech recognition may be performed by a speech recognition server different from the translation device 10. In that case, the user terminal 20 transmits voice to the voice recognition server, and receives a sentence that is a voice recognition result from the voice recognition server. The sentence to be translated may be input by the user operating a button on the user terminal 20 or the like other than the input by voice.

また、ユーザ端末20は、翻訳方向情報をユーザの操作に基づいて入力する。この入力は、例えば、図3に示すようなインタフェースにより行われる。図3は、ユーザ端末20が備えるタッチパネルの表示画面21を示している。この表示画面21には、翻訳方向情報を入力するためのボタン21a,21bが設けられている。例えば、ユーザが「話す」と記載されたボタン21aをタッチしてから発話すると、発話に基づく文章と共に日本語を英語に翻訳することを示す翻訳方向情報が入力される。また、ユーザが「Speak」と記載されたボタン21bをタッチしてから発話すると、発話に基づく文章と共に英語を日本語に翻訳することを示す翻訳方向情報が入力される。   Moreover, the user terminal 20 inputs translation direction information based on a user's operation. This input is performed by an interface as shown in FIG. 3, for example. FIG. 3 shows a display screen 21 of a touch panel provided in the user terminal 20. The display screen 21 is provided with buttons 21a and 21b for inputting translation direction information. For example, when the user speaks after touching the button 21a described as “speak”, translation direction information indicating that Japanese is translated into English is input together with a sentence based on the utterance. Further, when the user utters after touching the button 21b described as “Speak”, translation direction information indicating that English is translated into Japanese is input together with a sentence based on the utterance.

また、ユーザ端末20は、翻訳装置10から翻訳結果の文章を受信する。ユーザ端末20は、受信した翻訳結果の文章をタッチパネルの表示画面21に表示する。これにより、ユーザが翻訳結果を認識することができる。この際、図3に示すように、ユーザから入力された文章(翻訳対象の文章)21cと、当該文章の翻訳後の文章21dとを合わせて表示することとしてもよい。また、英語から日本語からの翻訳に関する文章を右側からの吹き出し21eの中に表示し、日本語から英語からの翻訳に関する文章を左側からの吹き出し21fの中に表示することとしてもよい。   Further, the user terminal 20 receives the translation result text from the translation device 10. The user terminal 20 displays the received translation result text on the display screen 21 of the touch panel. Thereby, the user can recognize the translation result. At this time, as shown in FIG. 3, a sentence (translation target sentence) 21 c input from the user and a translated sentence 21 d of the sentence may be displayed together. Alternatively, a sentence related to translation from English to Japanese may be displayed in a balloon 21e from the right side, and a sentence related to translation from Japanese to English may be displayed in a balloon 21f from the left side.

引き続いて、本実施形態に係る翻訳装置10の機能構成について説明する。図1に示すように翻訳装置10は、翻訳エンジン群11と、入力部12と、判定部13と、更新部15と、カテゴリ情報保持部14と、翻訳エンジン振り分け部16と、自動入力補正部17と、出力部18とを備えて構成される。これらの構成要素のうち、判定部13と、更新部15と、カテゴリ情報保持部14と、翻訳エンジン振り分け部16と、自動入力補正部17とは、カテゴリ推定・振り分けプログラムによって実現されることができる。   Subsequently, the functional configuration of the translation apparatus 10 according to the present embodiment will be described. As shown in FIG. 1, the translation apparatus 10 includes a translation engine group 11, an input unit 12, a determination unit 13, an update unit 15, a category information holding unit 14, a translation engine distribution unit 16, and an automatic input correction unit. 17 and an output unit 18. Among these components, the determination unit 13, the update unit 15, the category information holding unit 14, the translation engine distribution unit 16, and the automatic input correction unit 17 can be realized by a category estimation / distribution program. it can.

翻訳エンジン群11は、翻訳装置10に入力された文章の翻訳処理を行う機能手段群である。翻訳エンジン群11は、複数の翻訳エンジン110a〜110d(翻訳エンジンA〜D)を含んで構成されている。後述するように翻訳装置10に入力された文章は、翻訳エンジン群11に含まれる複数の翻訳エンジン110(翻訳エンジン110a〜110dの総称)の何れかに入力される。各翻訳エンジン110は、入力した文章を翻訳して出力部18に出力する。   The translation engine group 11 is a functional means group that performs a translation process on the text input to the translation apparatus 10. The translation engine group 11 includes a plurality of translation engines 110a to 110d (translation engines A to D). As will be described later, the text input to the translation device 10 is input to any of a plurality of translation engines 110 (generic name of the translation engines 110a to 110d) included in the translation engine group 11. Each translation engine 110 translates the input sentence and outputs it to the output unit 18.

翻訳エンジン110は、処理部111(処理部111a〜111dの総称)と、翻訳辞書112(翻訳辞書112a〜112dの総称)とを備えて構成される。翻訳辞書112は、翻訳に用いられる辞書の情報を保持する辞書保持手段である。翻訳辞書112が保持する辞書の情報は、例えば、翻訳元の言語の単語と翻訳後の言語の単語との対応付けを示す情報であり、従来の機械翻訳で用いられる辞書と同様ものであってもよい。また、翻訳辞書112が保持する辞書は、翻訳エンジン110に応じたカテゴリに対応付けられている。カテゴリとは、翻訳対象の文章が属する分野(専門分野)を示すものであり、例えば、「医療」、「金融」、「科学(技術)」等がある。翻訳辞書112は、予め翻訳装置10の管理者等によって予め用意される。   The translation engine 110 includes a processing unit 111 (generic name for the processing units 111a to 111d) and a translation dictionary 112 (generic name for the translation dictionaries 112a to 112d). The translation dictionary 112 is a dictionary holding unit that holds dictionary information used for translation. The dictionary information held by the translation dictionary 112 is, for example, information indicating correspondence between words in the translation source language and words in the translated language, and is similar to the dictionary used in conventional machine translation. Also good. The dictionary held by the translation dictionary 112 is associated with a category corresponding to the translation engine 110. The category indicates a field (specialized field) to which the sentence to be translated belongs, and includes, for example, “medical”, “finance”, “science (technology)”, and the like. The translation dictionary 112 is prepared in advance by an administrator of the translation apparatus 10 or the like.

例えば、翻訳エンジン110a(翻訳エンジンA)が備える翻訳辞書112aは、特別の分野に係るカテゴリではなく、一般的な文章を翻訳するための基本翻訳辞書を保持する。なお、基本翻訳辞書を用いて翻訳した場合、言語の確からしさや、翻訳の確からしさを基に、最も確からしさの確率の高い翻訳結果である訳文を生成する。このため、医療、金融、科学技術等の専門性のある入力文の翻訳精度は必ずしも適切とは言えず、違和感のある翻訳結果となるおそれがある。   For example, the translation dictionary 112a included in the translation engine 110a (translation engine A) holds a basic translation dictionary for translating general sentences, not a category related to a special field. When translation is performed using the basic translation dictionary, a translation that is the translation result with the highest probability of probability is generated based on the certainty of the language and the certainty of the translation. For this reason, the translation accuracy of input sentences with expertise such as medical care, finance, and science and technology is not necessarily appropriate, and there is a possibility that the translation result may be strange.

翻訳エンジン110b(翻訳エンジンB)が備える翻訳辞書112bは、「医療」のカテゴリに係る医療翻訳辞書を保持する。翻訳エンジン110c(翻訳エンジンC)が備える翻訳辞書112cは、「金融」のカテゴリに係る金融翻訳辞書を保持する。翻訳エンジン110d(翻訳エンジンD)が備える翻訳辞書112dは、「科学」のカテゴリに係る科学翻訳辞書を保持する。   The translation dictionary 112b included in the translation engine 110b (translation engine B) holds a medical translation dictionary related to the “medical” category. The translation dictionary 112c included in the translation engine 110c (translation engine C) holds a financial translation dictionary related to the category of “finance”. The translation dictionary 112d included in the translation engine 110d (translation engine D) holds a scientific translation dictionary related to the category of “science”.

処理部111は、翻訳辞書112を用いて、翻訳エンジン110に入力された文章を第1の言語から第2の言語に翻訳する翻訳手段である。処理部111は、複数の言語間での翻訳(上記の第1の言語及び第2の言語の何れか一方、又は両方が複数である)が行えることとしてもよい。その場合、翻訳エンジン110には、翻訳対象の文章と合わせて翻訳方向情報も入力され、翻訳方向情報によって示される言語間の方向で翻訳が行われる。処理部111は、例えば、従来の機械翻訳と同様の技術により実現される。なお、処理部111は、翻訳エンジン110毎に異なるものであってもよいし、翻訳エンジン110間で共通化されていてもよい。   The processing unit 111 is a translation unit that translates the text input to the translation engine 110 from the first language to the second language using the translation dictionary 112. The processing unit 111 may perform translation between a plurality of languages (any one or both of the first language and the second language described above). In that case, translation direction information is also input to the translation engine 110 together with the text to be translated, and translation is performed in the direction between languages indicated by the translation direction information. For example, the processing unit 111 is realized by a technique similar to that of conventional machine translation. Note that the processing unit 111 may be different for each translation engine 110 or may be shared among the translation engines 110.

なお、各翻訳エンジン110は、必ずしも、翻訳装置10の各翻訳エンジン110以外の構成要素と同様の装置によって実現されている必要はない。各翻訳エンジン110と、翻訳装置10の各翻訳エンジン110以外の構成要素とは別体の装置として構成されていてもよい。即ち、翻訳装置10は、複数のコンピュータからなるコンピュータシステムによって構成されていてもよい。   Note that each translation engine 110 is not necessarily realized by a device similar to the constituent elements of the translation apparatus 10 other than each translation engine 110. Each translation engine 110 and the components other than each translation engine 110 of the translation apparatus 10 may be configured as separate devices. That is, the translation apparatus 10 may be configured by a computer system including a plurality of computers.

入力部12は、翻訳対象となる文章を入力する入力手段である。具体的には、入力部12は、ユーザ端末20と翻訳装置10との間のセッションを確立して、当該セッションを介してユーザ端末20から翻訳対象となる文章を受信することで文章を入力する。翻訳装置10では、セッションIDによりセッションを把握することができ、これにより何れのユーザ端末20から情報を入力したかを把握することができる。また、上述したようにユーザ端末20から音声を受信して、当該音声を音声認識して文章を取得することとしてもよい。また、翻訳装置10が複数の翻訳を実行できる場合には、入力部12は、翻訳方向情報を入力することとしてもよい。翻訳方向情報には、翻訳対象の文章の言語(入力言語)を示す情報、及び翻訳後の文章の言語(翻訳言語)を示す情報が含まれる。本実施形態における以下の処理は、入力言語及び翻訳言語に基づいて行われる。即ち、翻訳前の文章に対しては入力言語毎の処理を行い、入力言語から翻訳言語への翻訳が行われる。入力部12は、当該情報も翻訳対象となる文章と合わせてユーザ端末20から受信する。入力部12は、入力した情報を判定部13に出力する。   The input unit 12 is input means for inputting a sentence to be translated. Specifically, the input unit 12 establishes a session between the user terminal 20 and the translation device 10 and inputs a sentence by receiving a sentence to be translated from the user terminal 20 via the session. . In the translation apparatus 10, the session can be grasped by the session ID, and thereby it can be grasped from which user terminal 20 the information is inputted. Further, as described above, it is also possible to receive a voice from the user terminal 20 and recognize the voice to obtain a sentence. Further, when the translation apparatus 10 can execute a plurality of translations, the input unit 12 may input translation direction information. The translation direction information includes information indicating the language (input language) of the sentence to be translated and information indicating the language of the translated sentence (translation language). The following processing in this embodiment is performed based on the input language and the translation language. That is, for each sentence before translation, processing for each input language is performed, and translation from the input language to the translation language is performed. The input unit 12 receives the information from the user terminal 20 together with the text to be translated. The input unit 12 outputs the input information to the determination unit 13.

判定部13は、入力部12から入力された文章に基づいて、当該文章のカテゴリを判定する判定手段である。例えば、判定部13は、機械学習により、入力部12から入力された文章がカテゴリに属する度合いを推定し、当該度合いに基づいて当該文章のカテゴリを判定する。本実施形態では、判定する文章のカテゴリを推定ラベルと呼ぶ。また、文章がカテゴリに属する度合いを確信度と呼ぶ。例えば、判定部13による判定によって、入力された文章である入力文が「内科はどちらですか?」というものであった場合、推定ラベルが「医療」、確信度が78%といった出力がなされる。   The determination unit 13 is a determination unit that determines the category of the sentence based on the sentence input from the input unit 12. For example, the determination unit 13 estimates the degree to which a sentence input from the input unit 12 belongs to a category by machine learning, and determines the category of the sentence based on the degree. In the present embodiment, the category of the sentence to be determined is referred to as an estimated label. In addition, the degree to which a sentence belongs to a category is called confidence. For example, if the input sentence that is the input sentence is “Which is internal medicine?” By the determination by the determination unit 13, an output such that the estimated label is “medical” and the certainty factor is 78% is output. .

本実施形態に係る判定部13を実現するため、予めカテゴリに対応付いた文章を収集する。カテゴリに対応付けられた正解データ(サンプルデータ)として教師あり機械学習を行い、学習データベース(学習モデル)を得る。機械学習のロジックは、例えば、汎用SVM(Support Vector Machine)を用いることができる。判定部13は、入力部12から入力された文章を学習データベースに基づく識別器に入力して、当該識別器によってカテゴリを判定する。   In order to implement the determination unit 13 according to the present embodiment, sentences associated with categories are collected in advance. Supervised machine learning is performed as correct answer data (sample data) associated with a category to obtain a learning database (learning model). For example, a general-purpose SVM (Support Vector Machine) can be used as the logic for machine learning. The determination unit 13 inputs the text input from the input unit 12 to a discriminator based on the learning database, and determines the category by the discriminator.

具体的には、判定部13は、入力部12から入力した入力文の形態素解析を行う。形態素解析は、汎用の形態素解析エンジンを活用して行うことができる。例えば、入力文が「病名を教えて」というものであった場合、「病院(名詞)/を(助詞)/教え(動詞)/て(助詞)」との形態素解析の結果が得られる。形態素解析の結果中の「/」は形態素の区切りであり、括弧は各形態素の品詞を示す。続いて、判定部13は、形態素解析結果から、各形態素についてSVMの入力データである素性IDを生成する。具体的には、判定部13は、各形態素を素性IDに変換する。判定部13は、形態素と素性IDとの対応関係を予め記憶しており、当該対応関係に基づいて上記の変形を行う。例えば、「病院」との形態素は素性IDを「1」に、「教え」との形態素は素性IDを「2」に変換する。   Specifically, the determination unit 13 performs morphological analysis of the input sentence input from the input unit 12. Morphological analysis can be performed using a general-purpose morphological analysis engine. For example, if the input sentence is “Tell me the disease name”, the result of morphological analysis of “hospital (noun) / to (particle) / teaching (verb) / te (particle)” is obtained. “/” In the result of morpheme analysis is a morpheme break, and parentheses indicate the part of speech of each morpheme. Subsequently, the determination unit 13 generates a feature ID that is SVM input data for each morpheme from the morpheme analysis result. Specifically, the determination unit 13 converts each morpheme into a feature ID. The determination unit 13 stores a correspondence relationship between the morpheme and the feature ID in advance, and performs the above modification based on the correspondence relationship. For example, the morpheme “hospital” converts the feature ID to “1”, and the morpheme “teach” converts the feature ID to “2”.

判定部13は、得られたSVMの入力データを用いてSVMにより推定ラベル及び確信度を出力(生成)する。上記は、汎用のSVMエンジンロジックを活用して行うことができる。なお、複数の推定ラベルを推定するため、マルチクラスSVM推定を行ってもよいし、推定ラベル毎の学習データベースを用いることとしてもよい。判定部13は、判定結果を示す推定ラベル及び確信度を示す情報を更新部15に出力する。また、判定部13は、入力部12から入力された情報を翻訳エンジン振り分け部16に出力する。   The determination unit 13 outputs (generates) an estimated label and a certainty factor by SVM using the obtained input data of SVM. The above can be performed by utilizing general-purpose SVM engine logic. In order to estimate a plurality of estimated labels, multi-class SVM estimation may be performed, or a learning database for each estimated label may be used. The determination unit 13 outputs an estimation label indicating the determination result and information indicating the certainty factor to the update unit 15. Further, the determination unit 13 outputs the information input from the input unit 12 to the translation engine distribution unit 16.

なお、判定部13は、機械学習によって得られた学習データベースに基づく識別器を利用できればよく、必ずしも翻訳装置10において機械学習が行われる必要はない。その場合、翻訳装置10は上記の機械学習を行った装置から、学習データベースを示す情報を予め取得しておく。また、判定部13は、SVMにより上記の判定を行うこととしているが、その他の手法、例えば、パターン認識の手法等を用いることとしてもよい。また、判定部13は、上記の機械学習以外の方法によって、文章からカテゴリを判定してもよい。   Note that the determination unit 13 only needs to be able to use a discriminator based on a learning database obtained by machine learning, and machine translation need not necessarily be performed in the translation apparatus 10. In that case, the translation apparatus 10 acquires in advance information indicating a learning database from the apparatus that performed the machine learning. The determination unit 13 performs the above determination by SVM, but other methods such as a pattern recognition method may be used. Moreover, the determination part 13 may determine a category from a sentence by methods other than said machine learning.

カテゴリ情報保持部14は、翻訳対象となる文章の推定ラベルを特定するカテゴリ情報を保持するカテゴリ情報保持手段である。具体的には、カテゴリ情報保持部14は、セッションIDとカテゴリ情報とを対応付けて保持する。カテゴリ情報保持部14は、更新部15からの更新の指示を受け付けて上記の情報の更新を行う。また、カテゴリ情報保持部14は、翻訳エンジン振り分け部16から翻訳エンジン振り分け部16から保持された情報の問い合わせを受け付け、カテゴリ情報を返信する。カテゴリ情報保持部14は、同一セッションIDに対して、予め設定された一定時間、情報の更新や問い合わせがない場合、セッション別に保持している情報を開放(消去)する。また、セッションが切断された場合にも同様に解放してもよい。   The category information holding unit 14 is a category information holding unit that holds category information that specifies an estimated label of a sentence to be translated. Specifically, the category information holding unit 14 holds a session ID and category information in association with each other. The category information holding unit 14 receives the update instruction from the update unit 15 and updates the above information. The category information holding unit 14 receives an inquiry about the information held from the translation engine sorting unit 16 from the translation engine sorting unit 16 and returns the category information. The category information holding unit 14 releases (deletes) information held for each session when there is no information update or inquiry for a predetermined time for the same session ID. Also, when a session is disconnected, it may be released in the same manner.

更新部15は、判定部13によって推定ラベルが判定された場合には、判定された推定ラベルを特定するカテゴリ情報でカテゴリ情報保持部14によって保持されるカテゴリ情報を更新すると共に、判定部13によって推定ラベルが判定されない場合には、カテゴリ情報保持部14によって保持されるカテゴリ情報を保持させたままとする更新手段である。   When the determination unit 13 determines the estimated label, the update unit 15 updates the category information held by the category information holding unit 14 with the category information that identifies the determined estimated label, and the determination unit 13 When the estimated label is not determined, the updating unit keeps the category information held by the category information holding unit 14.

具体的には、更新部15は、判定部13から入力された推定ラベル及び確信度を示す情報に基づいて、判定部13によって推定ラベルが判定されているか否か(文章からのカテゴリの判定が可能であったか否か)を判断する。更新部15は、確信度と予め設定された閾値とを比較して上記の判断を行う。例えば、更新部15は、確信度が閾値を上回っていたら、判定部13によって推定ラベルが判定されていると判断する。更新部15は、確信度が閾値を下回っていたら、判定部13によって推定ラベルが判定されていない(文章が特定のカテゴリに属するものではない)と判断する。この判断を行うための閾値は、図4の確信度判定パターン表に示すように推定ラベル毎に設定されていてもよい。   Specifically, the update unit 15 determines whether or not the estimated label is determined by the determination unit 13 based on the information indicating the estimated label and the certainty factor input from the determination unit 13 (the category is determined from the sentence). Whether it was possible). The update unit 15 makes the above determination by comparing the certainty factor with a preset threshold value. For example, if the certainty factor exceeds the threshold value, the update unit 15 determines that the estimated label is determined by the determination unit 13. If the certainty factor is below the threshold value, the update unit 15 determines that the estimation label is not determined by the determination unit 13 (the sentence does not belong to a specific category). The threshold for making this determination may be set for each estimated label as shown in the certainty determination pattern table of FIG.

更新部15は、推定ラベルが判定されていると判断すると、当該推定ラベルを特定するカテゴリ情報をカテゴリ情報保持部14に入力して、カテゴリ情報保持部14に保持されるカテゴリ情報を更新する。この更新は、入力された文章に係るセッションIDに対応付けられて保持されているカテゴリ情報に対して行われる。カテゴリ情報保持部14に保持されるカテゴリ情報がなかった場合には、更新部15から入力されたカテゴリ情報が新たに保持される。更新部15は、推定ラベルが判定されていないと判断すると、カテゴリ情報の更新を行わない(この場合、特段の処理は行われない)。   When the update unit 15 determines that the estimated label is determined, the update unit 15 inputs the category information specifying the estimated label to the category information holding unit 14 and updates the category information held in the category information holding unit 14. This update is performed on the category information held in association with the session ID related to the input sentence. When there is no category information held in the category information holding unit 14, the category information input from the updating unit 15 is newly held. If the update unit 15 determines that the estimated label has not been determined, the update unit 15 does not update the category information (in this case, no special processing is performed).

翻訳エンジン振り分け部16は、判定部13から入力された文章を翻訳する翻訳エンジン110の振り分けを行う翻訳手段の一機能である。翻訳エンジン振り分け部16は、カテゴリ情報保持部14によって保持されるカテゴリ情報に基づいて上記の振り分けを行う。この振り分けの処理は、更新部15による上記の処理が終了した後で行われる。   The translation engine sorting unit 16 is a function of a translation unit that sorts the translation engine 110 that translates the text input from the determination unit 13. The translation engine sorting unit 16 performs the sorting described above based on the category information held by the category information holding unit 14. This distribution process is performed after the above process by the updating unit 15 is completed.

具体的には、翻訳エンジン振り分け部16は、図5の翻訳エンジン振り分けパターン表に示すような、推定ラベルと翻訳エンジン110を特定する翻訳エンジン番号とが対応付けられた情報を予め記憶している。また、図5に示すように、この情報には、入力言語及び翻訳言語の組み合わせも合わせて対応付けられていてもよい。翻訳エンジン振り分け部16は、判定部13から文章が入力されると、入力された文章に係るセッションIDに対応付けられてカテゴリ情報保持部14に保持されるカテゴリ情報を参照する。具体的には、翻訳エンジン振り分け部16は、カテゴリ情報保持部14に対して、入力された文章に係るセッションIDと共にカテゴリ問い合わせ要求を行って、カテゴリ情報保持部14からカテゴリ情報を取得してもよい。翻訳エンジン振り分け部16は、図5の翻訳エンジン振り分けパターン表において、参照したカテゴリ情報によって示される推定ラベルに対応付けられている翻訳エンジン番号で特定される翻訳エンジン110を振り分け先の翻訳エンジン110として決定する。なお、入力された文章に係るセッションIDに対応付けられてカテゴリ情報保持部14に保持されるカテゴリ情報がない場合には、翻訳エンジン振り分け部16は、予め設定された翻訳エンジン110を振り分け先の翻訳エンジン110として決定する。例えば、図5における推定ラベル「その他」に対応付けられた翻訳エンジン番号で特定される翻訳エンジン110(例えば、一般的な文章を翻訳するための翻訳辞書112aを備える翻訳エンジン110a(翻訳エンジンA))を振り分け先の翻訳エンジン110として決定する。   Specifically, the translation engine sorting unit 16 stores in advance information in which an estimated label and a translation engine number that identifies the translation engine 110 are associated with each other, as shown in the translation engine sorting pattern table of FIG. . Further, as shown in FIG. 5, this information may also be associated with a combination of the input language and the translation language. When a sentence is input from the determination unit 13, the translation engine distribution unit 16 refers to the category information held in the category information holding unit 14 in association with the session ID related to the input sentence. Specifically, the translation engine sorting unit 16 may request the category information holding unit 14 to make a category inquiry request together with the session ID related to the input sentence, and acquire the category information from the category information holding unit 14. Good. The translation engine distribution unit 16 uses the translation engine 110 identified by the translation engine number associated with the estimated label indicated by the referenced category information in the translation engine distribution pattern table of FIG. decide. If there is no category information associated with the session ID associated with the input sentence and retained in the category information retaining unit 14, the translation engine allocating unit 16 selects a preset translation engine 110 as a distribution destination. The translation engine 110 is determined. For example, the translation engine 110 identified by the translation engine number associated with the estimated label “others” in FIG. 5 (for example, the translation engine 110a including the translation dictionary 112a for translating general sentences (translation engine A)) ) Is determined as the translation engine 110 of the distribution destination.

また、判定部13から、翻訳方向情報として入力言語及び翻訳言語を示す情報が入力されている場合には、更にそれらの組み合わせに対応付けられている翻訳エンジン番号で特定される翻訳エンジン110を振り分け先の翻訳エンジン110として決定する。   Further, when information indicating the input language and the translation language is input as the translation direction information from the determination unit 13, the translation engine 110 specified by the translation engine number associated with the combination is further distributed. It is determined as the previous translation engine 110.

翻訳エンジン振り分け部16は、振り分け先の翻訳エンジン110に翻訳対象の文章を出力する。翻訳エンジン110が別の装置によって構成されている場合には、翻訳エンジン番号に翻訳エンジン110を構成するサーバのIPアドレスを対応付けておき、当該IPアドレス宛に翻訳対象の文章を送信する。また、翻訳エンジン番号自体をIPアドレスにしておいてもよい。また、翻訳エンジン振り分け部16は、翻訳方向情報として入力言語及び翻訳言語を示す情報を合わせて翻訳エンジン110に出力してもよい。   The translation engine sorting unit 16 outputs the sentence to be translated to the translation engine 110 that is the sorting destination. When the translation engine 110 is configured by another device, the translation engine number is associated with the IP address of the server that constitutes the translation engine 110, and the sentence to be translated is transmitted to the IP address. The translation engine number itself may be an IP address. Further, the translation engine distribution unit 16 may output information indicating the input language and the translation language to the translation engine 110 as translation direction information.

翻訳エンジン振り分け部16は、翻訳エンジン110に翻訳対象の文章を出力する前に自動入力補正部17に当該文章を補正させてもよい。その場合、翻訳エンジン振り分け部16は、自動入力補正部17による補正後の文章を翻訳エンジン110に出力する。   The translation engine distribution unit 16 may cause the automatic input correction unit 17 to correct the sentence before outputting the sentence to be translated to the translation engine 110. In that case, the translation engine distribution unit 16 outputs the sentence corrected by the automatic input correction unit 17 to the translation engine 110.

自動入力補正部17は、翻訳エンジン振り分け部16から入力した翻訳対象となる文章を、カテゴリ情報保持部14によって保持されるカテゴリ情報によって特定される推定ラベルに応じて予め設定されたルールに基づいて変換する翻訳手段の一機能である。   The automatic input correction unit 17 converts the sentence to be translated input from the translation engine distribution unit 16 based on a rule set in advance according to the estimated label specified by the category information held by the category information holding unit 14. This is a function of translation means for conversion.

入力文のカテゴリ推定がされた場合、適切な翻訳エンジン110を選択することが可能である。しかし、更にカテゴリ別に入力文を標準的な言い回しに補正し、翻訳エンジン110に入力することで、よりカテゴリ別に正確な翻訳結果を導出し、訳質を向上させることが可能である。例えば、図6に医療で頭が非常に痛いと主張する場合の入力文の例を示す。しかしながら、「頭痛でぎんぎんする」といった入力文のように、入力の形式によっては誤訳されてしまう。自動入力補正部17では、カテゴリに応じて入力文を標準的なフレーズに補正する。   When the category of the input sentence is estimated, an appropriate translation engine 110 can be selected. However, by further correcting the input sentence for each category into a standard wording and inputting it to the translation engine 110, it is possible to derive a more accurate translation result for each category and improve the translation quality. For example, FIG. 6 shows an example of an input sentence when it is claimed that the head is very painful in medical treatment. However, depending on the input format, it may be mistranslated, such as an input sentence such as “I'll be angry with a headache”. The automatic input correction unit 17 corrects the input sentence to a standard phrase according to the category.

自動入力補正部17は、推定ラベルと文章を変換(補正)するルールとが対応付けられた情報を予め記憶している。自動入力補正部17は、入力された文章に係るセッションIDに対応付けられてカテゴリ情報保持部14に保持されるカテゴリ情報を参照する。自動入力補正部17は、参照したカテゴリ情報に対応付けられて記憶しているルールに従って文章の変換(補正)を行う。   The automatic input correction unit 17 stores in advance information in which an estimated label and a rule for converting (correcting) a sentence are associated with each other. The automatic input correction unit 17 refers to the category information held in the category information holding unit 14 in association with the session ID related to the input sentence. The automatic input correction unit 17 converts (corrects) a sentence according to a rule stored in association with the referenced category information.

以下では、「医療」カテゴリにおける変換の例について説明する。自動入力補正部17は、まず、入力文から、入力文がカテゴリ内で何を意味しているかを示すPカテゴリを推定する。この推定には、例えば、Pカテゴリを推定するために予め機械学習によって作成された学習データベースが用いられる。機械学習に用いられる正解データ(サンプルデータ)としては、例えば、Pカテゴリに対応付けられた文章である。例えば、入力文に「〜が鈍く痛い」「〜が波打つように痛い」「〜が締め付けられるように痛い」「〜が割れるように痛い」とのフレーズが含まれている場合には、Pカテゴリは、「(病状・)痛み:高」と推定される。   Hereinafter, an example of conversion in the “medical” category will be described. First, the automatic input correction unit 17 estimates a P category indicating what the input sentence means in the category from the input sentence. For this estimation, for example, a learning database created by machine learning in advance to estimate the P category is used. The correct answer data (sample data) used for machine learning is, for example, a sentence associated with the P category. For example, if the input sentence includes phrases such as “~ hurts like dull”, “~ hurts like rippling”, “~ hurts like being tightened”, “~ hurts like cracking”, the P category Is estimated to be “(disease state) pain: high”.

続いて、自動入力補正部17は、入力文から、Pカテゴリの対象を示すEカテゴリを推定する。自動入力補正部17は、予めPカテゴリ毎にEカテゴリの候補となる単語を辞書(E推定辞書)として記憶しておく。図7にE推定辞書の例を示す。図7に示す例では、「痛み:高」とのPカテゴリに対するEカテゴリの候補となる単語が対応付けられている。自動入力補正部17は、入力文中に、推定されたPカテゴリに対応付けられたEカテゴリの候補となる単語が含まれているか否か判断する。Eカテゴリの候補となる単語が含まれていた場合、自動入力補正部17は、当該単語を、Eカテゴリを示す単語として抽出する。例えば、図8に示すように入力文が「頭が鈍く痛い」、Pカテゴリが「痛み:高」だった場合、Eカテゴリは「頭」とされる。   Subsequently, the automatic input correction unit 17 estimates the E category indicating the target of the P category from the input sentence. The automatic input correction unit 17 previously stores words that are candidates for the E category for each P category as a dictionary (E estimation dictionary). FIG. 7 shows an example of the E estimation dictionary. In the example illustrated in FIG. 7, words that are candidates for the E category with respect to the P category of “pain: high” are associated with each other. The automatic input correction unit 17 determines whether or not the input sentence includes a word that is a candidate for the E category associated with the estimated P category. If a word that is a candidate for the E category is included, the automatic input correction unit 17 extracts the word as a word indicating the E category. For example, as shown in FIG. 8, when the input sentence is “slow and painful head” and the P category is “pain: high”, the E category is “head”.

続いて、自動入力補正部17は、カテゴリ(推定ラベル)、Pカテゴリ及びEカテゴリから標準的なフレーズを生成する。入力文に基づいて、Pカテゴリの対象を示すEカテゴリを推定する。自動入力補正部17は、予めカテゴリ及びPカテゴリ毎に標準フレーズを記憶しておく。図9にカテゴリ及びPカテゴリ毎に記憶される標準フレーズの例を示す。記憶されている標準フレーズには、単語が入力される部分が含まれている。図9の例では、当該部分を「〜」で示す。   Subsequently, the automatic input correction unit 17 generates a standard phrase from the category (estimated label), the P category, and the E category. Based on the input sentence, the E category indicating the target of the P category is estimated. The automatic input correction unit 17 stores a standard phrase for each category and P category in advance. FIG. 9 shows an example of standard phrases stored for each category and P category. The stored standard phrase includes a portion where a word is input. In the example of FIG. 9, this part is indicated by “˜”.

自動入力補正部17は、上記によって決定(推定)されたカテゴリ及びPカテゴリの組み合わせに対応付けられて記憶される標準フレーズを抽出する。自動入力補正部17は、抽出した標準フレーズの単語が入力される部分に、Eカテゴリを挿入し、標準的なフレーズを完成させる。例えば、図10に示すように、カテゴリが「医療」、Pカテゴリが「痛み:高」、Eカテゴリが「頭」であった場合、抽出される標準フレーズは「〜が鋭く痛いです。」となり、生成される標準的なフレーズは「頭が鋭く痛いです。」となる。   The automatic input correction unit 17 extracts a standard phrase stored in association with the combination of the category and P category determined (estimated) as described above. The automatic input correction unit 17 inserts the E category in the portion where the extracted standard phrase word is input, and completes the standard phrase. For example, as shown in FIG. 10, when the category is “medical”, the P category is “pain: high”, and the E category is “head”, the extracted standard phrase is “~ is sharp and painful”. , The standard phrase generated is “Heart is sharp and painful.”

自動入力補正部17は、生成した標準的なフレーズを、補正後の文章として翻訳エンジン振り分け部16に出力する。このように入力文を標準的なフレーズに自動補正すると、(機械)翻訳エンジン110は、入力した意味に応じて最適な翻訳結果を出力することができる。また、このように自動補正を行った場合には、翻訳結果の文章と合わせて自動補正した文章をユーザ端末20に送信して、ユーザに自動補正した結果を通知することとしてもよい。   The automatic input correction unit 17 outputs the generated standard phrase to the translation engine distribution unit 16 as corrected text. When the input sentence is automatically corrected to a standard phrase in this way, the (machine) translation engine 110 can output an optimal translation result according to the input meaning. In addition, when automatic correction is performed in this way, a sentence automatically corrected together with the sentence of the translation result may be transmitted to the user terminal 20 to notify the user of the result of automatic correction.

出力部18は、翻訳エンジン110によって翻訳された文章を出力する出力手段である。具体的には、出力部18は、ユーザ端末20と翻訳装置10との間のセッションを介してユーザ端末20に翻訳後の文章を送信することで文章を出力する。ユーザ端末20によって受信された文章は、上述したようにユーザ端末20において表示等の出力が行われる。以上が、本実施形態に係る翻訳装置10の機能構成である。   The output unit 18 is an output unit that outputs sentences translated by the translation engine 110. Specifically, the output unit 18 outputs the sentence by transmitting the translated sentence to the user terminal 20 via a session between the user terminal 20 and the translation device 10. The text received by the user terminal 20 is displayed and output on the user terminal 20 as described above. The functional configuration of the translation apparatus 10 according to the present embodiment has been described above.

図11に本実施形態に係る翻訳装置10のハードウェア構成を示す。図11に示すように翻訳装置10は、CPU(Central Processing Unit)101、主記憶装置であるRAM(RandomAccess Memory)102及びROM(Read Only Memory)103、通信を行うための通信モジュール104、並びにハードディスク等の補助記憶装置105等のハードウェアを備えるコンピュータを含むものとして構成される。これらの構成要素がプログラム等により動作することにより、上述した翻訳装置10の機能が発揮される。以上が、本実施形態に係る翻訳装置10の構成である。   FIG. 11 shows a hardware configuration of the translation apparatus 10 according to the present embodiment. As shown in FIG. 11, the translation apparatus 10 includes a central processing unit (CPU) 101, a random access memory (RAM) 102 and a read only memory (ROM) 103 that are main storage devices, a communication module 104 for communication, and a hard disk. The computer is configured to include a computer including hardware such as the auxiliary storage device 105. The functions of the translation apparatus 10 described above are exhibited when these components are operated by a program or the like. The above is the configuration of the translation apparatus 10 according to the present embodiment.

引き続いて、図12〜図14のフローチャートを用いて、本実施形態に係る翻訳装置10の動作方法(翻訳装置10で実行される処理)である翻訳方法を説明する。図12のフローチャートを用いて翻訳方法の全体について説明する。本処理では、まず、翻訳対象の文章である入力文が、ユーザ端末20から翻訳装置10に送信される。翻訳装置10では、入力部12によって入力文が受信される(S01、入力ステップ)。入力された文章は、入力部12から判定部13に出力される。   Subsequently, a translation method, which is an operation method of the translation apparatus 10 according to the present embodiment (a process executed by the translation apparatus 10), will be described using the flowcharts of FIGS. The entire translation method will be described with reference to the flowchart of FIG. In this process, first, an input sentence that is a sentence to be translated is transmitted from the user terminal 20 to the translation apparatus 10. In the translation apparatus 10, the input sentence is received by the input unit 12 (S01, input step). The input sentence is output from the input unit 12 to the determination unit 13.

続いて、判定部13によって、入力文に基づいて推定ラベルの判定が行われる(S02、判定ステップ)。この判定処理を図13のフローチャートを用いて説明する。まず、入力文に対して形態素解析が実施される(S21)。続いて、形態素解析結果から、各形態素についてSVMの入力データである素性IDが生成される(S22)。続いて、得られたSVMの入力データが用いられてマルチクラスSVM推定が行われる(S23)。当該推定により得られた、推定ラベル及び確信度が出力(生成)される(S24)。推定ラベル及び確信度を示す情報は、判定部13から更新部15に出力される。また、入力部12から入力された情報は、判定部13から翻訳エンジン振り分け部16に出力される。   Subsequently, the determination unit 13 determines the estimated label based on the input sentence (S02, determination step). This determination process will be described with reference to the flowchart of FIG. First, morphological analysis is performed on the input sentence (S21). Subsequently, from the morpheme analysis result, a feature ID that is SVM input data is generated for each morpheme (S22). Subsequently, multi-class SVM estimation is performed using the obtained SVM input data (S23). The estimated label and the certainty factor obtained by the estimation are output (generated) (S24). Information indicating the estimated label and the certainty factor is output from the determination unit 13 to the update unit 15. Information input from the input unit 12 is output from the determination unit 13 to the translation engine distribution unit 16.

図12に戻り、続いて、更新部15によって、判定部13によって推定ラベルが判定されているか否かが判断される(S03、更新ステップ)。この判断は、具体的には、確信度と予め設定された閾値とが比較されて行われる。確信度が閾値を上回っていたら、推定ラベルが判定されていると判断される(S03のYES)。この場合、更新部15によって、当該推定ラベルを特定するカテゴリ情報がカテゴリ情報保持部14に入力されて、カテゴリ情報保持部14に保持されるカテゴリ情報が更新される(S04、更新ステップ)。一方で、確信度が閾値を下回っていたら、推定ラベルが判定されていないと判断される(S03のNO)。この場合は、上記の更新処理は行われない。   Returning to FIG. 12, subsequently, the updating unit 15 determines whether or not the estimated label is determined by the determining unit 13 (S03, update step). Specifically, this determination is made by comparing the certainty factor with a preset threshold value. If the certainty level exceeds the threshold value, it is determined that the estimated label is determined (YES in S03). In this case, the update unit 15 inputs the category information specifying the estimated label to the category information holding unit 14, and the category information held in the category information holding unit 14 is updated (S04, update step). On the other hand, if the certainty factor is below the threshold value, it is determined that the estimated label has not been determined (NO in S03). In this case, the above update process is not performed.

続いて(S04又はS03のNOの後)、翻訳エンジン振り分け部16から自動入力補正部17に入力文が出力される。続いて、自動入力補正部17によって、入力文が、カテゴリ情報保持部14によって保持されるカテゴリ情報によって特定される推定ラベルに応じて予め設定されたルールに基づいて補正(変換)される(S05、翻訳ステップ)。この補正処理を図14のフローチャートを用いて説明する。まず、機械学習によって作成された学習データベースに基づいて、入力文からPカテゴリが推定される(S51)。続いて、E推定辞書が用いられて、入力文からEカテゴリが推定される(S52)。続いて、予め記憶されたカテゴリ及びPカテゴリ毎の標準フレーズに基づいて、カテゴリ(推定ラベル)、Pカテゴリ及びEカテゴリから標準的なフレーズが、補正後の文章として生成される(S53)。補正後の文章は、自動入力補正部17から翻訳エンジン振り分け部16に出力される。   Subsequently (after NO in S04 or S03), the input sentence is output from the translation engine distribution unit 16 to the automatic input correction unit 17. Subsequently, the automatic input correction unit 17 corrects (converts) the input sentence based on a rule set in advance according to the estimated label specified by the category information held by the category information holding unit 14 (S05). , Translation step). This correction process will be described with reference to the flowchart of FIG. First, the P category is estimated from the input sentence based on a learning database created by machine learning (S51). Subsequently, the E estimation dictionary is used to estimate the E category from the input sentence (S52). Subsequently, a standard phrase is generated as a corrected sentence from the category (estimated label), the P category, and the E category based on the previously stored category and the standard phrase for each P category (S53). The corrected sentence is output from the automatic input correction unit 17 to the translation engine distribution unit 16.

図12に戻り、続いて、翻訳エンジン振り分け部16によって、カテゴリ情報保持部14によって保持されるカテゴリ情報に基づいて、翻訳対象の文章(補正後の文章)を翻訳する翻訳エンジン110の振り分けが行われる(S06、翻訳ステップ)。この振り分けは、予め記憶された、推定ラベルと翻訳エンジン番号とが対応付けられた情報に基づいて行われる。翻訳対象の文章(補正後の文章)は、翻訳エンジン振り分け部16から振り分け先の翻訳エンジン110に出力される。   Returning to FIG. 12, subsequently, the translation engine sorting unit 16 sorts the translation engine 110 that translates the sentence to be translated (corrected sentence) based on the category information held by the category information holding unit 14. (S06, translation step). This distribution is performed based on information stored in advance in which the estimated label and the translation engine number are associated with each other. The translation target text (corrected text) is output from the translation engine sorting section 16 to the translation engine 110 that is the sorting destination.

続いて、振り分け先の翻訳エンジン110によって、文章が入力され、翻訳エンジン110が備える翻訳辞書112が用いられて当該文章の翻訳が行われる(S07、翻訳ステップ)。翻訳後の文章は、翻訳エンジン110から出力部18に出力される。続いて、出力部18によって、翻訳後の文章がユーザ端末20に対して送信される(S08、出力ステップ)。ユーザ端末20では、翻訳後の文章が受信されて、表示等のユーザが認識できる形式での出力が行われる。以上が、本実施形態に係る翻訳装置10で実行される処理である翻訳方法である。   Subsequently, the distribution destination translation engine 110 inputs a sentence, and the translation dictionary 112 provided in the translation engine 110 is used to translate the sentence (S07, translation step). The translated text is output from the translation engine 110 to the output unit 18. Subsequently, the output unit 18 transmits the translated sentence to the user terminal 20 (S08, output step). The user terminal 20 receives the translated text and outputs it in a format that the user can recognize, such as a display. The above is the translation method that is the process executed by the translation apparatus 10 according to the present embodiment.

上記の処理は、ユーザ端末20から入力文が送信される度に行われる。従って、一連の入力文に対して翻訳が行われる。上述したように本実施形態では、入力文からカテゴリの判定が行われる。カテゴリの判定が行われた場合には、判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。一方、カテゴリの判定が行われなかった(入力文が特定のカテゴリに属するものではないと判定された)場合には、それ以前の入力文に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。即ち、本実施形態では、単独の文章からではどのような辞書を用いて翻訳すればよいか十分な判断ができない場合であっても、会話等の一連の文章に基づいて判定されたカテゴリに対応付けられた辞書が用いられて翻訳が行われる。従って、本実施形態によれば、上記の場合であっても、文章を適切に翻訳することができる。医療、金融、科学技術等の専門性のある入力文の翻訳に適する、最適な翻訳エンジンを選択することが可能であり、翻訳結果の質を向上させることができる。また、特定のカテゴリの辞書を基本辞書とは独立に拡張できるため、コンシューマ向けの翻訳精度に影響を与えることがない。   The above process is performed every time an input sentence is transmitted from the user terminal 20. Therefore, translation is performed on a series of input sentences. As described above, in this embodiment, the category is determined from the input sentence. When the category is determined, translation is performed using a dictionary associated with the determined category. On the other hand, if the category is not determined (the input sentence is determined not to belong to a specific category), the dictionary associated with the category determined based on the previous input sentence is Used to translate. That is, in this embodiment, even if it is not possible to sufficiently determine what dictionary should be used for translation from a single sentence, it corresponds to a category determined based on a series of sentences such as conversation. The attached dictionary is used for translation. Therefore, according to this embodiment, even in the above case, the sentence can be appropriately translated. It is possible to select an optimal translation engine that is suitable for translation of specialized input sentences such as medical care, finance, and science and technology, and improve the quality of translation results. In addition, since the dictionary of a specific category can be expanded independently of the basic dictionary, the translation accuracy for consumers is not affected.

具体的には、図2に示す例のように、例えば、「頭が波打つように痛い」との文章によりカテゴリが「医療」と判定された後は、新たにカテゴリが判定される迄は「医療」の翻訳辞書が用いられて翻訳が行われる。従って、その後の「状態はいかがですか?」との、何れのカテゴリに属するか判定ができない文章であっても、「医療」の翻訳辞書が用いられて適切に翻訳が行われる。   Specifically, as in the example illustrated in FIG. 2, for example, after the category is determined as “medical” based on the sentence “the head hurts like undulating”, until the category is newly determined, Translation is performed using a medical dictionary. Accordingly, even if it is a sentence that cannot be determined as to which category, “How is the state?” After that, the “medical” translation dictionary is used for appropriate translation.

また、本実施形態のようにカテゴリの判定は、機械学習により行うこととしてもよい。この構成によれば、カテゴリを判定できるか否かを含めて、適切にカテゴリを判定することができる。これにより、文章をより適切に翻訳することができる。   Further, as in the present embodiment, the category determination may be performed by machine learning. According to this configuration, it is possible to appropriately determine the category including whether or not the category can be determined. Thereby, a sentence can be translated more appropriately.

また、本実施形態のように、第1の言語による文章を第2の言語に翻訳すると共に、その逆の第2の言語による文章を第1の言語に翻訳することとしてもよい。例えば、図2に示すように、一連の翻訳対象の文章に、日本語から英語へ翻訳する文章と日本語から英語へ翻訳する文章とが含まれていてもよい。この場合は、片方向でカテゴリ(例えば、「医療」)を判定した場合、逆方向への会話翻訳にも当該カテゴリ(例えば、「医療」)を自動で適用することができる。これにより、適切な翻訳が行われた上で、異なる言語での双方向での会話を可能とすることができる。なお、必ずしも逆方向への翻訳を行える必要はなく、片方向での翻訳のみを行えるものであってもよい。   Further, as in the present embodiment, the sentence in the first language may be translated into the second language, and the sentence in the opposite second language may be translated into the first language. For example, as shown in FIG. 2, a series of sentences to be translated may include a sentence translated from Japanese to English and a sentence translated from Japanese to English. In this case, when the category (for example, “medical”) is determined in one direction, the category (for example, “medical”) can be automatically applied to the conversation translation in the reverse direction. Thereby, it is possible to perform two-way conversation in different languages after appropriate translation. Note that it is not always necessary to perform translation in the reverse direction, and translation in only one direction may be performed.

また、本実施形態のように入力文の自動補正を行うこととしてもよい。この構成によれば、上述したように翻訳された文章をより適切なものとすることができる。但し、入力文を自動補正する必要がない場合については、必ずしも入力文の自動補正を行う必要はない。   Moreover, it is good also as performing an automatic correction | amendment of an input sentence like this embodiment. According to this configuration, the sentence translated as described above can be made more appropriate. However, when it is not necessary to automatically correct the input sentence, it is not always necessary to automatically correct the input sentence.

なお、本実施形態では、翻訳装置10は、ユーザ端末20と通信を行って入力文及び翻訳後の文章を送受信する構成となっていた。しかしながら、ユーザ端末20等のユーザに用いられる端末に、翻訳装置10の機能が備えられていてもよい。その場合、当該端末が本発明の一実施形態に係る翻訳装置となる。また、当該端末が、翻訳装置10の一部の機能を備えていてもよい。   In the present embodiment, the translation apparatus 10 is configured to communicate with the user terminal 20 to transmit / receive an input sentence and a translated sentence. However, the terminal used by the user such as the user terminal 20 may be provided with the function of the translation device 10. In that case, the terminal is a translation apparatus according to an embodiment of the present invention. In addition, the terminal may have some functions of the translation device 10.

また、本実施形態のようにカテゴリ情報の更新を行うのは、会話翻訳等の一定の場合のみに行われるようにしてもよい。この場合、当該一定の場合以外は、文章毎にカテゴリを判定して、判定したカテゴリに応じた翻訳を行う(本実施形態の場合、それ以前のカテゴリ判定の結果は利用しない)。会話翻訳である場合は、翻訳処理の前に会話翻訳である旨を翻訳装置10に入力することとしてもよい。あるいは、逆方向の翻訳要求が同一セッションIDで存在した場合(例えば、それ以前に日本語から英語への翻訳を行っており、英語から日本語への翻訳要求があった場合)に、会話翻訳であると設定してもよい。   Further, the category information may be updated as in the present embodiment only in certain cases such as conversation translation. In this case, except for the fixed case, the category is determined for each sentence, and translation according to the determined category is performed (in the case of the present embodiment, the previous category determination result is not used). In the case of conversational translation, it may be input to the translation apparatus 10 that it is conversational translation before the translation process. Or, if there is a reverse translation request with the same session ID (for example, if a translation from Japanese to English was performed before that and there was a translation request from English to Japanese), conversational translation It may be set to be.

10…翻訳装置、11…翻訳エンジン群、110(110a〜110d)…翻訳エンジン、111(111a〜111d)…処理部、112(112a〜112d)…翻訳辞書、12…入力部、13…判定部、14…カテゴリ情報保持部、15…更新部、16…翻訳エンジン振り分け部、17…自動入力補正部、18…出力部、101…CPU、102…RAM、103…ROM、104…通信モジュール、105…補助記憶装置、20…ユーザ端末。   DESCRIPTION OF SYMBOLS 10 ... Translation apparatus, 11 ... Translation engine group, 110 (110a-110d) ... Translation engine, 111 (111a-111d) ... Processing part, 112 (112a-112d) ... Translation dictionary, 12 ... Input part, 13 ... Determination part 14 ... Category information holding unit, 15 ... Update unit, 16 ... Translation engine sorting unit, 17 ... Automatic input correction unit, 18 ... Output unit, 101 ... CPU, 102 ... RAM, 103 ... ROM, 104 ... Communication module, 105 ... Auxiliary storage device, 20 ... User terminal.

Claims (5)

カテゴリに対応付けて、翻訳に用いる複数の辞書を保持する辞書保持手段と、
翻訳対象となる文章のカテゴリを特定するカテゴリ情報を保持するカテゴリ情報保持手段と、
翻訳対象となる第1の言語による文章を入力する入力手段と、
前記入力手段によって入力された文章に基づいて、当該文章のカテゴリを判定する判定手段と、
前記判定手段によってカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報で前記カテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、前記判定手段によってカテゴリが判定されない場合には、前記カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新手段と、
前記カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、前記辞書保持手段に保持されている辞書を用いて、前記入力手段によって入力された文章を第1の言語から第2の言語に翻訳する翻訳手段と、
前記翻訳手段によって翻訳された文章を出力する出力手段と、
を備える翻訳装置。
Dictionary holding means for holding a plurality of dictionaries used for translation in association with categories;
Category information holding means for holding category information for specifying a category of a sentence to be translated;
An input means for inputting a sentence in a first language to be translated;
Determination means for determining a category of the sentence based on the sentence input by the input means;
When the category is determined by the determination unit, the category information held by the category information holding unit is updated with the category information that identifies the determined category, and the category is not determined by the determination unit. Updating means for keeping the category information held by the category information holding means;
Using the dictionary held in the dictionary holding means in association with the category specified by the category information held by the category information holding means, the sentence input by the input means is read from the first language. Translation means for translating into a second language;
Output means for outputting sentences translated by the translation means;
A translation device comprising:
前記判定手段は、機械学習により、前記入力手段によって入力された文章が前記カテゴリに属する度合いを推定し、当該度合いに基づいて当該文章のカテゴリを判定する請求項1に記載の翻訳装置。   The translation device according to claim 1, wherein the determination unit estimates a degree to which the sentence input by the input unit belongs to the category by machine learning, and determines the category of the sentence based on the degree. 前記入力手段は、翻訳対象となる第2の言語による文章を入力し、
前記翻訳手段は、前記カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、前記辞書保持手段に保持されている辞書を用いて、前記入力手段によって入力された文章を第2の言語から第1の言語に翻訳する、請求項1又は2に記載の翻訳装置。
The input means inputs a sentence in a second language to be translated,
The translation unit associates a sentence input by the input unit with a dictionary that is associated with the category specified by the category information held by the category information holding unit and is held by the dictionary holding unit. The translation device according to claim 1, wherein the translation device translates the second language into the first language.
前記翻訳手段は、翻訳対象となる文章を、前記カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに応じて予め設定されたルールに基づいて変換し、変換した文章を翻訳する請求項1〜3の何れか一項に記載の翻訳装置。   The translation unit converts a sentence to be translated based on a rule set in advance according to a category specified by category information held by the category information holding unit, and translates the converted sentence. The translation apparatus as described in any one of 1-3. カテゴリに対応付けて、翻訳に用いる複数の辞書を保持する辞書保持手段と、翻訳対象となる文章のカテゴリを特定するカテゴリ情報を保持するカテゴリ情報保持手段と、を備える翻訳装置の動作方法である翻訳方法であって、
翻訳対象となる第1の言語による文章を入力する入力ステップと、
前記入力ステップにおいて入力された文章に基づいて、当該文章のカテゴリを判定する判定ステップと、
前記判定ステップにおいてカテゴリが判定された場合には、判定されたカテゴリを特定するカテゴリ情報で前記カテゴリ情報保持手段によって保持されるカテゴリ情報を更新すると共に、前記判定ステップにおいてカテゴリが判定されない場合には、前記カテゴリ情報保持手段によって保持されるカテゴリ情報を保持させたままとする更新ステップと、
前記カテゴリ情報保持手段によって保持されるカテゴリ情報によって特定されるカテゴリに対応付けられて、前記辞書保持手段に保持されている辞書を用いて、前記入力ステップにおいて入力された文章を第1の言語から第2の言語に翻訳する翻訳ステップと、
前記翻訳ステップにおいて翻訳された文章を出力する出力ステップと、
を含む翻訳方法。
An operation method of a translation apparatus comprising: a dictionary holding unit that holds a plurality of dictionaries used in translation in association with a category; and a category information holding unit that holds category information that specifies a category of a sentence to be translated. A translation method,
An input step for inputting a sentence in a first language to be translated;
A determination step of determining a category of the sentence based on the sentence input in the input step;
When the category is determined in the determination step, the category information held by the category information holding unit is updated with the category information specifying the determined category, and when the category is not determined in the determination step An update step for keeping the category information held by the category information holding means;
Using the dictionary held in the dictionary holding unit in association with the category specified by the category information held by the category information holding unit, the sentence input in the input step is read from the first language. A translation step for translating into a second language;
An output step of outputting the sentence translated in the translation step;
Translation method including
JP2014044002A 2014-03-06 2014-03-06 Translation apparatus and translation method Active JP6306376B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014044002A JP6306376B2 (en) 2014-03-06 2014-03-06 Translation apparatus and translation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014044002A JP6306376B2 (en) 2014-03-06 2014-03-06 Translation apparatus and translation method

Publications (2)

Publication Number Publication Date
JP2015170094A true JP2015170094A (en) 2015-09-28
JP6306376B2 JP6306376B2 (en) 2018-04-04

Family

ID=54202795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014044002A Active JP6306376B2 (en) 2014-03-06 2014-03-06 Translation apparatus and translation method

Country Status (1)

Country Link
JP (1) JP6306376B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776583A (en) * 2015-11-24 2017-05-31 株式会社Ntt都科摩 Machine translation evaluation method and apparatus and machine translation method and equipment
KR20190004790A (en) * 2016-05-06 2019-01-14 이베이 인크. Technique using meta information when translating an artificial neural network machine
JP2019139629A (en) * 2018-02-14 2019-08-22 株式会社Nttドコモ Machine translation device, translation learned model and determination learned model
JP2020501228A (en) * 2016-11-04 2020-01-16 グーグル エルエルシー Implicit bridging of machine learning tasks
KR20220105551A (en) * 2021-01-20 2022-07-27 주식회사 한글과컴퓨터 Document translation service server for performing supplement of machine translation using prestored translation result, and the operating method thereof
KR102628304B1 (en) * 2023-06-29 2024-01-24 주식회사 멜로우컴퍼니 Device for correcting original text of image using natural language processing processor

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001273294A (en) * 2000-03-27 2001-10-05 Toshiba Corp Method, system and server for translation, recording medium and information transmitting medium
JP2002108858A (en) * 2000-09-20 2002-04-12 Internatl Business Mach Corp <Ibm> Machine translation method, machine translation system and recording medium
JP2002183134A (en) * 2000-12-18 2002-06-28 Logo Vista Corp Translating device
JP2003122748A (en) * 2001-10-16 2003-04-25 Chisso Corp Automatic translation pre-processing system, pre- processing method, program for pre-processing or recording medium in which the same program is recorded
JP2004280316A (en) * 2003-03-14 2004-10-07 Fuji Xerox Co Ltd Field determination device and language processor

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001273294A (en) * 2000-03-27 2001-10-05 Toshiba Corp Method, system and server for translation, recording medium and information transmitting medium
JP2002108858A (en) * 2000-09-20 2002-04-12 Internatl Business Mach Corp <Ibm> Machine translation method, machine translation system and recording medium
JP2002183134A (en) * 2000-12-18 2002-06-28 Logo Vista Corp Translating device
JP2003122748A (en) * 2001-10-16 2003-04-25 Chisso Corp Automatic translation pre-processing system, pre- processing method, program for pre-processing or recording medium in which the same program is recorded
JP2004280316A (en) * 2003-03-14 2004-10-07 Fuji Xerox Co Ltd Field determination device and language processor

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
河合 敦夫: "意味属性の学習結果にもとづく文書自動分類方式", 情報処理学会論文誌, vol. 第33巻第9号, JPN6017026857, 15 September 1992 (1992-09-15), JP, pages 1114 - 1122, ISSN: 0003602956 *
鈴木 伸哉 外3名: "ドメイン依存知識を動的に切り替える固有表現抽出手法について", 言語処理学会第8回年次大会発表論文集 PROCEEDINGS OF THE EIGHTH ANNUAL MEETING OF THE ASSOCIATION FO, JPN6017026859, 18 March 2002 (2002-03-18), JP, pages 1 - 4, ISSN: 0003602957 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776583A (en) * 2015-11-24 2017-05-31 株式会社Ntt都科摩 Machine translation evaluation method and apparatus and machine translation method and equipment
JP2017097882A (en) * 2015-11-24 2017-06-01 株式会社Nttドコモ Machine translation evaluation method and device, and machine translation method and device
KR102463567B1 (en) * 2016-05-06 2022-11-07 이베이 인크. Using meta-information in neural machine translation
KR20220017001A (en) * 2016-05-06 2022-02-10 이베이 인크. Using meta-information in neural machine translation
US11783197B2 (en) 2016-05-06 2023-10-10 Ebay Inc. Using meta-information in neural machine translation
KR102206588B1 (en) * 2016-05-06 2021-01-22 이베이 인크. Techniques for using meta information in machine translation of artificial neural networks
KR20210019562A (en) * 2016-05-06 2021-02-22 이베이 인크. Using meta-information in neural machine translation
US11238348B2 (en) 2016-05-06 2022-02-01 Ebay Inc. Using meta-information in neural machine translation
KR102357322B1 (en) * 2016-05-06 2022-02-08 이베이 인크. Using meta-information in neural machine translation
KR20190004790A (en) * 2016-05-06 2019-01-14 이베이 인크. Technique using meta information when translating an artificial neural network machine
JP2020501228A (en) * 2016-11-04 2020-01-16 グーグル エルエルシー Implicit bridging of machine learning tasks
JP7122835B2 (en) 2018-02-14 2022-08-22 株式会社Nttドコモ Machine translation device, translation trained model and judgment trained model
JP2019139629A (en) * 2018-02-14 2019-08-22 株式会社Nttドコモ Machine translation device, translation learned model and determination learned model
KR20220105551A (en) * 2021-01-20 2022-07-27 주식회사 한글과컴퓨터 Document translation service server for performing supplement of machine translation using prestored translation result, and the operating method thereof
KR102523806B1 (en) * 2021-01-20 2023-04-21 주식회사 한글과컴퓨터 Document translation service server for performing supplement of machine translation using prestored translation result, and the operating method thereof
KR102628304B1 (en) * 2023-06-29 2024-01-24 주식회사 멜로우컴퍼니 Device for correcting original text of image using natural language processing processor

Also Published As

Publication number Publication date
JP6306376B2 (en) 2018-04-04

Similar Documents

Publication Publication Date Title
JP7063932B2 (en) Appropriate agent automation assistant call
US11915692B2 (en) Facilitating end-to-end communications with automated assistants in multiple languages
JP6306376B2 (en) Translation apparatus and translation method
US9805718B2 (en) Clarifying natural language input using targeted questions
US9317501B2 (en) Data security system for natural language translation
US11354521B2 (en) Facilitating communications with automated assistants in multiple languages
US11295092B2 (en) Automatic post-editing model for neural machine translation
JP2017058673A (en) Dialog processing apparatus and method, and intelligent dialog processing system
CN112262430A (en) Automatically determining language for speech recognition of a spoken utterance received via an automated assistant interface
US11093110B1 (en) Messaging feedback mechanism
KR20130123037A (en) Apparatus and method for providing two-way automatic interpretation and tranlating service
CN106713111B (en) Processing method for adding friends, terminal and server
JP2018197924A (en) Information processing apparatus, interactive processing method, and interactive processing program
US11942091B2 (en) Alphanumeric sequence biasing for automatic speech recognition using a grammar and a speller finite state transducer
KR20190074508A (en) Method for crowdsourcing data of chat model for chatbot
JP5901694B2 (en) Dictionary database management device, API server, dictionary database management method, and dictionary database management program
KR20210051523A (en) Dialogue system by automatic domain classfication
JP5300576B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
JP6985311B2 (en) Dialogue implementation programs, devices and methods that control response utterance generation by aizuchi determination
JP7406921B2 (en) Information processing device, information processing method and program
JP6298806B2 (en) Speech translation system, control method therefor, and speech translation program
Accame et al. Transliteration of Contact Names and/or Other Data Using an Automated Assistant
JP2023007014A (en) Response system, response method, and response program
JP2023171109A (en) Learning device, estimation device, learning method, estimation method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180308

R150 Certificate of patent or registration of utility model

Ref document number: 6306376

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250