JP2016189154A - 翻訳方法、装置、及びプログラム - Google Patents

翻訳方法、装置、及びプログラム Download PDF

Info

Publication number
JP2016189154A
JP2016189154A JP2015069428A JP2015069428A JP2016189154A JP 2016189154 A JP2016189154 A JP 2016189154A JP 2015069428 A JP2015069428 A JP 2015069428A JP 2015069428 A JP2015069428 A JP 2015069428A JP 2016189154 A JP2016189154 A JP 2016189154A
Authority
JP
Japan
Prior art keywords
translation
language sentence
sentence
word
target language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015069428A
Other languages
English (en)
Inventor
太一 片山
Taichi Katayama
太一 片山
一 内野
Hajime Uchino
一 内野
仙 吉田
Sen Yoshida
仙 吉田
昌英 水島
Masahide Mizushima
昌英 水島
孝文 引地
Takafumi Hikichi
孝文 引地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015069428A priority Critical patent/JP2016189154A/ja
Publication of JP2016189154A publication Critical patent/JP2016189154A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】ユーザ辞書に登録された単語を、統一された訳語を用いて翻訳する装置、方法及びプログラムを提供する。【解決手段】ユーザ辞書適応部22が、原言語の単語と該単語の目的語への対訳を表す訳語との組み合わせが複数登録されているユーザ辞書を用いて、入力された原言語の文に含まれる単語に対応する訳語を取得する。そして、翻訳部24が、入力された原言語の文を目的言語の文へ翻訳した翻訳候補から、原言語の文を目的言語の文へ翻訳するための予め学習されたモデルに基づいて得られるスコアと、ユーザ辞書適応部22によって取得された訳語を優先するための予め定められたスコアとを用いて、入力された原言語の文を翻訳した目的言語の文を決定する。【選択図】図1

Description

本発明は、翻訳方法、装置、及びプログラムに関する。
従来知られている統計的機械翻訳では、学習データの統計情報を計算することにより、最適な翻訳結果を返す処理を行う(例えば非特許文献1参照)。
塚田元、渡辺太郎、鈴木潤、永田昌明、磯崎秀樹、「統計的機械翻訳」、2007、NTT技術ジャーナル(2007.6)、p.23-25、NTT
一般的に、翻訳作業をする際、ある単語の訳語を統一したり、新語を翻訳したい場合がある。しかし、統計的機械翻訳では、翻訳結果は学習データに依存するため、訳語の統一や新語の翻訳をすることが困難である。
本発明は、上記の事情に鑑みてなされたもので、ユーザ辞書に登録された単語については、統一された訳語を用いて翻訳することができる翻訳方法、装置、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の翻訳方法は、ユーザ辞書適応部及び翻訳部を含み、入力された原言語の文を目的言語の文へ翻訳する翻訳装置における翻訳方法であって、
前記ユーザ辞書適応部が、原言語の単語と該単語の目的語への対訳を表す訳語との組み合わせが複数登録されているユーザ辞書を用いて、前記入力された原言語の文に含まれる単語に対応する前記訳語を取得するステップと、前記翻訳部が、前記入力された原言語の文を目的言語の文へ翻訳した翻訳候補から、原言語の文を目的言語の文へ翻訳するための予め学習されたモデルに基づいて得られるスコアと、前記ユーザ辞書適応部によって取得された前記訳語を優先するための予め定められたスコアとを用いて、前記入力された原言語の文を翻訳した目的言語の文を決定するステップと、を含んで構成される。
本発明の翻訳装置は、入力された原言語の文を目的言語の文へ翻訳する翻訳装置であって、原言語の単語と該単語の目的語への対訳を表す訳語との組み合わせが複数登録されているユーザ辞書を用いて、前記入力された原言語の文に含まれる単語に対応する前記訳語を取得するユーザ辞書適応部と、前記入力された原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習されたモデルとに基づいて得られる、前記入力された原言語の文を目的言語の文へ翻訳した翻訳候補から、前記ユーザ辞書適応部によって取得された前記訳語を優先するための予め定められたスコアを用いて、前記入力された原言語の文を翻訳した目的言語の文を決定する翻訳部と、を含んで構成される。
また、前記モデルは、原言語の単語を目的言語の単語へ翻訳するための予め学習された翻訳モデルと、目的言語の語順を決定するための予め学習された言語モデルとを含み、前記翻訳部が前記入力された原言語の文を翻訳した目的言語の文を決定するステップは、前記翻訳候補に含まれる目的言語の単語の各々について前記翻訳モデルに基づいて得られるスコアと、前記翻訳候補に含まれる、前記ユーザ辞書適応部によって取得された前記訳語を優先するための前記予め定められたスコアと、前記翻訳候補の語順について前記言語モデルに基づいて得られるスコアと、を用いて、前記入力された原言語の文を翻訳した目的言語の文を決定するようにすることができる。
また、前記翻訳部が前記入力された原言語の文を翻訳した目的言語の文を決定するステップは、入力された原言語の文に対応する目的言語の文として、目的言語の文の部分文字列を表す部分仮説から前記部分仮説より長い新たな部分仮説を順次生成して前記部分仮説を拡張することによって最終的に生成された部分仮説である仮説を生成して翻訳するときに、前記生成された新たな部分仮説が表す目的言語の文の部分文字列に含まれる目的言語の単語の各々について前記翻訳モデルに基づいて得られるスコアのうち、前記生成された新たな部分仮説が表す目的言語の文の部分文字列に含まれる、前記ユーザ辞書適応部によって取得された前記訳語に対するスコアを、前記予め定められたスコアに置き換えて、前記生成された新たな部分仮説が表す目的言語の文の部分文字列について前記翻訳モデルに基づいて得られるスコアと、前記生成された新たな部分仮説が表す目的言語の文の部分文字列について前記言語モデルに基づいて得られるスコアとを用いて、確からしい前記新たな部分仮説を探索するようにすることができる。
また、本発明のプログラムは、上記翻訳方法の各ステップを、コンピュータに実行させるためのプログラムである。
以上説明したように、本発明の翻訳方法、装置、及びプログラムによれば、原言語の単語と該単語の目的語への対訳を表す訳語との組み合わせが複数登録されているユーザ辞書を用いて、入力された原言語の文に含まれる単語に対応する訳語を取得し、入力された原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習されたモデルとに基づいて得られる、入力された原言語の文を目的言語の文へ翻訳した翻訳候補から、取得された訳語を優先するための予め定められたスコアを用いて、入力された原言語の文を翻訳した目的言語の文を決定することにより、ユーザ辞書に登録された単語については、統一された訳語を用いて翻訳することができる、という効果が得られる。
本実施の形態に係る翻訳装置の機能的な構成例を示すブロック図である。 ユーザ辞書適応部22の詳細な構成例を示す図である。 ユーザ辞書220に登録された訳語を取得する一例を示す図である。 翻訳部24の詳細な構成例を示す図である。 仮説探索部244の処理の一例を示す図である。 ユーザ辞書適応部22によって取得された訳語を用いた仮説の探索処理の一例を示す図である。 本発明の実施の形態における翻訳処理の内容を示すフローチャートである。
<概要>
まず、本発明の実施の形態の概要について説明する。
本発明の実施の形態では、ユーザ辞書を予め作成し、原言語の文を目的言語の文へ翻訳する際の訳語選択の工程において、ユーザ辞書を利用する。具体的には、ユーザ辞書を利用する、または統計データを利用するという分岐をさせることで、原言語の文に含まれる単語がユーザ辞書に存在する場合には、ユーザ辞書に登録された訳語を選択し、原言語の文に含まれる単語がユーザ辞書に存在しない場合には、統計データを利用する。
以下、図面を参照して、本発明の実施の形態を詳細に説明する。
<翻訳装置のシステム構成>
図1は、本発明の実施の形態に係る翻訳装置100を示すブロック図である。翻訳装置100は、入力された原言語の文を目的言語の文へ翻訳する。この翻訳装置100は、CPUと、RAMと、後述する翻訳処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
本実施の形態に係る翻訳装置100は、図1に示すように、入力部10と、演算部20と、出力部30とを備えている。
入力部10は、翻訳対象の原言語の文を受け付ける。
演算部20は、入力部10によって受け付けた原言語の文を、目的言語の文へ翻訳する。演算部20は、ユーザ辞書適応部22と、翻訳部24とを備えている。
ユーザ辞書適応部22は、後述するユーザ辞書220を用いて、入力部10によって受け付けた原言語の文に含まれる単語に対応する訳語を取得する。ここで、訳語とは、原言語の単語の目的語への予め定められた対訳を表す。
ユーザ辞書適応部22の詳細な構成例を図2に示す。ユーザ辞書適応部22は、図2に示すように、ユーザ辞書220と、適応処理部222とを備えている。
ユーザ辞書220には、原言語の単語と当該単語の目的語への対訳を表す訳語との組み合わせが複数登録されている。ユーザ辞書220には、原言語の単語に対して統一したい訳語が予め登録される。
適応処理部222は、ユーザ辞書220を用いて、入力部10によって受け付けた原言語の文に含まれる単語に対応する訳語を取得する。
図3に、適応処理部222の処理の一例を示す。図3では、英日翻訳において、原言語の文「language is a means of communication」が翻訳対象として入力部10により受け付けられ、ユーザ辞書220に、原言語の単語と訳語の組み合わせ「communication―>コミュニケーション」が登録されている場合を例に示す。
適応処理部222は、図3に示すように、入力された原言語の文の各単語に対して、ユーザ辞書220に格納されている原言語の単語とマッチする単語を検索する。例えば、原言語の文に、ユーザ辞書220に格納されている原言語の単語「communication」が存在する場合、訳語である「コミュニケーション」を、ユーザ辞書適応結果を表すデータ構造の中に配置する。
翻訳部24は、適応処理部222によって得られたユーザ辞書適応結果を表すデータ構造に基づいて、入力部10によって受け付けた原言語の文を目的言語の文へ翻訳した翻訳候補から、翻訳候補に含まれる目的言語の単語の各々について、予め学習された翻訳モデルに基づいて得られるスコアと、翻訳候補に含まれる、ユーザ辞書適応部22によって取得された訳語を優先するための予め定められたスコアと、翻訳候補の語順について予め学習された言語モデルに基づいて得られるスコアとを用いて、入力された原言語の文を翻訳した目的言語の文を決定する。
翻訳部24の詳細な構成例を図4に示す。翻訳部24は、図4に示すように、翻訳モデル記憶部240と、言語モデル記憶部242と、仮説探索部244とを備えている。
翻訳モデル記憶部240には、原言語の単語を目的言語の単語へ翻訳するための予め学習された翻訳モデルが記憶されている。翻訳モデルに原言語の単語が入力されると、原言語の単語に対する目的言語の単語への対訳の各々と、当該対訳の各々についての翻訳の確からしさを表すスコアが出力される。
本実施の形態では、ユーザ辞書適応部22によってユーザ辞書220から取得された訳語については、翻訳モデルに基づいて得られるスコアとして、予め定められたスコアを用いる。例えば、翻訳モデルに基づいて得られるスコアとして、翻訳確率を用いることができる。スコアとして翻訳確率を用いる場合、ユーザ辞書220から取得された訳語については、当該訳語を優先するための予め定められたスコアとして固定値1.0を割り当てる。
また、言語モデル記憶部242には、目的言語の語順を決定するための予め学習された言語モデルが記憶されている。言語モデルに目的言語の文字列が入力されると、目的言語での語順の確からしさを表すスコアが出力される。
本実施の形態では、翻訳モデルに基づいて得られるスコアに関しては、ユーザ辞書220から取得された訳語を優先するための予め定められたスコアを用いるが、言語モデルに基づいて得られるスコアは、ユーザ辞書220から取得された訳語を含む目的言語の文字列についても、通常の目的言語の文字列と同様にスコアを求める。
具体的には、翻訳部24は、入力された原言語の文に対して目的言語の文として、目的言語の文の部分文字列を表す部分仮説から前記部分仮説より長い新たな部分仮説を順次生成して前記部分仮説を拡張することによって最終的に生成された部分仮説である仮説を生成して翻訳する。
具体的には、仮説探索部244が、新たな部分仮説を順次生成して翻訳するときに、生成された新たな部分仮説が表す目的言語の文の部分文字列に含まれる目的言語の単語の各々について翻訳モデル記憶部240に記憶された翻訳モデルに基づいて得られるスコアのうち、生成された新たな部分仮説が表す目的言語の文の部分文字列に含まれる、ユーザ辞書適応部22によって取得された訳語に対するスコアを、予め定められたスコアに置き換える。
そして、仮説探索部244は、生成された新たな部分仮説が表す目的言語の文の部分文字列について翻訳モデル記憶部240に記憶された翻訳モデルに基づいて得られるスコアと、生成された新たな部分仮説が表す目的言語の文の部分文字列について言語モデル記憶部242に記憶された言語モデルに基づいて得られるスコアとを用いて、確からしい新たな部分仮説を探索する。
図5に、仮説探索部244の処理の一例を示す。仮説探索部244は、入力された原言語の文を、あらゆる句に分割し、分割された句の中から一つ句を選択し、選択された句を、翻訳モデル記憶部240に記憶された翻訳モデルに入力する。そして、翻訳モデルは、図5に示すように、選択された句の対訳の各々を出力し、仮説探索部244は、出力された対訳の各々を左から右に並べ、目的言語の文の部分文字列を生成する。なお、句の対訳の各々には、翻訳モデルによって出力されたスコアが付与される。
そして、仮説探索部244は、図5に示す数多くある仮説の中から、翻訳モデルに基づいて得られるスコアと、仮説で生成された目的言語の文の部分文字列について言語モデルに基づいて得られるスコアとを考慮して、仮説の各単語に対する翻訳モデルに基づくスコアと、言語モデルに基づくスコアとを統合したスコアが最大となる仮説を、もっとも確からしい解として探索する。
図6に、ユーザ辞書適応部22によって取得された訳語を用いた仮説の探索処理の一例を示す。図6に示すように、仮説探索部244は、仮説を列挙する過程において、ユーザ辞書220から取得された訳語については、単語単体で一つの句を形成し、当該句に対する対訳はデータ構造の中に入っている訳語に決定し、当該単語に対する他の仮説は削除する。したがって、「communication」については、図6に示すように、「コミュニケーション」が対訳として決定され、他の単語「通信」「会話」に対応する仮説については削除される。そして、仮説探索部244による仮説の探索により、もっとも確からしい目的言語の文が翻訳結果として出力される。
出力部30は、仮説探索部244によって探索された目的言語の文を、結果として出力する。
<翻訳装置の作用>
次に、本実施の形態に係る翻訳装置100の作用について説明する。翻訳対象である原言語の文が翻訳装置100に入力されると、翻訳装置100によって、図7に示す翻訳処理ルーチンが実行される。
まず、ステップS100において、入力部10は、翻訳対象である原言語の文の入力を受け付ける。
ステップS102において、ユーザ辞書適応部22は、ユーザ辞書220を用いて、上記ステップS100で受け付けた原言語の文に含まれる単語に対応する訳語を取得し、ユーザ辞書適応結果を表すデータ構造の中に配置する。
ステップS104において、仮説探索部244は、上記ステップS100で受け付けた原言語の文と、上記ステップS102で得られたデータ構造と、翻訳モデル記憶部240に記憶された翻訳モデルと、言語モデル記憶部242に記憶された言語モデルとに基づいて、入力された原言語の文に対して目的言語の文の部分文字列を表す部分仮説を順次生成し、翻訳モデル記憶部240に記憶された翻訳モデルに基づいて得られるスコアと、言語モデル記憶部242に記憶された言語モデルに基づいて得られるスコアと、ユーザ辞書適応部22によって取得された訳語に対する予め定められたスコアとを用いて、最終的に得られた仮説のうち、最も確からしい仮説を探索する。
ステップS106において、仮説探索部244は、上記ステップS104で探索された仮説を、上記ステップS100で受け付けた原言語の文の翻訳文として決定する。
ステップS108において、出力部30は、上記ステップS106で決定された翻訳文を出力して、翻訳処理ルーチンを終了する。
以上説明したように、本実施の形態に係る翻訳装置によれば、原言語の単語と該単語の目的語への対訳を表す訳語との組み合わせが複数登録されているユーザ辞書を用いて、入力された原言語の文に含まれる単語に対応する訳語を取得し、入力された原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習されたモデルとに基づいて得られる、入力された原言語の文を目的言語の文へ翻訳した翻訳候補から、取得された訳語を優先するための予め定められたスコアを用いて、入力された原言語の文を翻訳した目的言語の文を決定することにより、ユーザ辞書に登録された単語については、統一された訳語を用いて翻訳することができる。
また、原言語の文に含まれる単語に対する翻訳語の選択時に、ユーザ辞書に登録されている訳語を用いるのか、または統計翻訳の結果を用いるのかという分岐を設置することで、ユーザ辞書を統計翻訳の中に組み込むことが可能になり、訳語の統一や新語の翻訳について、ユーザが辞書に訳語を追加するという単純な操作のみで可能となる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記実施形態では、仮説探索部244は、入力された原言語の文を、あらゆる句に分割し、分割された句の中から一つ句を選択し、選択された句を、翻訳モデル記憶部240に記憶された翻訳モデルに入力する場合を例に説明したが、これに限定されるものではなく、仮説探索部244は、入力された原言語の文を、あらゆる単語に分割し、分割された単語の中から一つ単語を選択し、選択された単語を、翻訳モデル記憶部240に記憶された翻訳モデルに入力してもよい。
上述の翻訳装置100では、ユーザ辞書220、翻訳モデル記憶部240、及び言語モデル記憶部242を備えている場合について説明したが、例えばユーザ辞書220、翻訳モデル記憶部240、及び言語モデル記憶部242の少なくとも1つが翻訳装置100の外部装置に設けられ、翻訳装置100は、外部装置と通信手段を用いて通信することにより、ユーザ辞書220、翻訳モデル記憶部240、及び言語モデル記憶部242の少なくとも1つを参照するようにしてもよい。
また、上述の翻訳装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体、例えばCD−ROMやメモリーカード等に格納して提供することも可能である。
10 入力部
20 演算部
22 ユーザ辞書適応部
24 翻訳部
30 出力部
100 翻訳装置
220 ユーザ辞書
222 適応処理部
240 翻訳モデル記憶部
242 言語モデル記憶部
244 仮説探索部

Claims (5)

  1. ユーザ辞書適応部及び翻訳部を含み、入力された原言語の文を目的言語の文へ翻訳する翻訳装置における翻訳方法であって、
    前記ユーザ辞書適応部が、原言語の単語と該単語の目的語への対訳を表す訳語との組み合わせが複数登録されているユーザ辞書を用いて、前記入力された原言語の文に含まれる単語に対応する前記訳語を取得するステップと、
    前記翻訳部が、前記入力された原言語の文を目的言語の文へ翻訳した翻訳候補から、原言語の文を目的言語の文へ翻訳するための予め学習されたモデルに基づいて得られるスコアと、前記ユーザ辞書適応部によって取得された前記訳語を優先するための予め定められたスコアとを用いて、前記入力された原言語の文を翻訳した目的言語の文を決定するステップと、
    を含む翻訳方法。
  2. 前記モデルは、原言語の単語を目的言語の単語へ翻訳するための予め学習された翻訳モデルと、目的言語の語順を決定するための予め学習された言語モデルとを含み、
    前記翻訳部が前記入力された原言語の文を翻訳した目的言語の文を決定するステップは、
    前記翻訳候補に含まれる目的言語の単語の各々について前記翻訳モデルに基づいて得られるスコアと、前記翻訳候補に含まれる、前記ユーザ辞書適応部によって取得された前記訳語を優先するための前記予め定められたスコアと、前記翻訳候補の語順について前記言語モデルに基づいて得られるスコアと、を用いて、前記入力された原言語の文を翻訳した目的言語の文を決定する請求項1記載の翻訳方法。
  3. 前記翻訳部が前記入力された原言語の文を翻訳した目的言語の文を決定するステップは、
    入力された原言語の文に対応する目的言語の文として、目的言語の文の部分文字列を表す部分仮説から前記部分仮説より長い新たな部分仮説を順次生成して前記部分仮説を拡張することによって最終的に生成された部分仮説である仮説を生成して翻訳するときに、
    前記生成された新たな部分仮説が表す目的言語の文の部分文字列に含まれる目的言語の単語の各々について前記翻訳モデルに基づいて得られるスコアのうち、前記生成された新たな部分仮説が表す目的言語の文の部分文字列に含まれる、前記ユーザ辞書適応部によって取得された前記訳語に対するスコアを、前記予め定められたスコアに置き換えて、前記生成された新たな部分仮説が表す目的言語の文の部分文字列について前記翻訳モデルに基づいて得られるスコアと、前記生成された新たな部分仮説が表す目的言語の文の部分文字列について前記言語モデルに基づいて得られるスコアとを用いて、確からしい前記新たな部分仮説を探索する請求項2記載の翻訳方法。
  4. 入力された原言語の文を目的言語の文へ翻訳する翻訳装置であって、
    原言語の単語と該単語の目的語への対訳を表す訳語との組み合わせが複数登録されているユーザ辞書を用いて、前記入力された原言語の文に含まれる単語に対応する前記訳語を取得するユーザ辞書適応部と、
    前記入力された原言語の文と、原言語の文を目的言語の文へ翻訳するための予め学習されたモデルとに基づいて得られる、前記入力された原言語の文を目的言語の文へ翻訳した翻訳候補から、前記ユーザ辞書適応部によって取得された前記訳語を優先するための予め定められたスコアを用いて、前記入力された原言語の文を翻訳した目的言語の文を決定する翻訳部と、
    を含む翻訳装置。
  5. 請求項1〜請求項3の何れか1項に記載の翻訳方法の各ステップを、コンピュータに実行させるためのプログラム。
JP2015069428A 2015-03-30 2015-03-30 翻訳方法、装置、及びプログラム Pending JP2016189154A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015069428A JP2016189154A (ja) 2015-03-30 2015-03-30 翻訳方法、装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015069428A JP2016189154A (ja) 2015-03-30 2015-03-30 翻訳方法、装置、及びプログラム

Publications (1)

Publication Number Publication Date
JP2016189154A true JP2016189154A (ja) 2016-11-04

Family

ID=57240361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015069428A Pending JP2016189154A (ja) 2015-03-30 2015-03-30 翻訳方法、装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP2016189154A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024004184A1 (ja) * 2022-06-30 2024-01-04 日本電信電話株式会社 生成装置、生成方法、及びプログラム
WO2024004183A1 (ja) * 2022-06-30 2024-01-04 日本電信電話株式会社 抽出装置、生成装置、抽出方法、生成方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024004184A1 (ja) * 2022-06-30 2024-01-04 日本電信電話株式会社 生成装置、生成方法、及びプログラム
WO2024004183A1 (ja) * 2022-06-30 2024-01-04 日本電信電話株式会社 抽出装置、生成装置、抽出方法、生成方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP6493866B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5599662B2 (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
US10303761B2 (en) Method, non-transitory computer-readable recording medium storing a program, apparatus, and system for creating similar sentence from original sentences to be translated
KR102516364B1 (ko) 기계 번역 방법 및 장치
KR101326354B1 (ko) 문자 변환 처리 장치, 기록 매체 및 방법
JP2004038976A (ja) 用例ベースの機械翻訳システム
KR101544690B1 (ko) 단어 분할 장치, 단어 분할 방법 및 단어 분할 프로그램
JP5054210B2 (ja) 属性抽出装置および方法
US20110320464A1 (en) Retrieval device
JP6817556B2 (ja) 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム
JP5809381B1 (ja) 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
JP6145059B2 (ja) モデル学習装置、形態素解析装置、及び方法
US10936825B1 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space
JP2006338261A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP6160438B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP2016189154A (ja) 翻訳方法、装置、及びプログラム
JP2011028379A (ja) データ構造変換プログラムおよびデータ構造変換装置
KR20120045906A (ko) 코퍼스 오류 교정 장치 및 그 방법
JP2007317000A (ja) 機械翻訳装置、その方法およびプログラム
JP4478042B2 (ja) 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置
US20150356076A1 (en) System and method of machine translation
JP5302784B2 (ja) 機械翻訳方法、及びシステム
JP6584361B2 (ja) キーワード抽出装置、キーワード抽出方法及びキーワード抽出プログラム
JP2006024114A (ja) 機械翻訳装置および機械翻訳コンピュータプログラム