以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。図面の説明において、同一又は同等の要素には同一符号を用い、重複する説明を省略する。
最初に、図1を参照して、本実施形態に係る翻訳用データ生成システム1の処理イメージを説明する。図1は、本実施形態に係る翻訳用データ生成システム1の処理イメージを模式的に示す図である。翻訳用データ生成システム1は、既存の対訳コーパス(一般的に用いられる対訳コーパス)の原言語側のテキスト(原言語テキスト)に対してノイズを付与すると共に、ノイズが付与された原言語テキスト(ノイズ付与原言語テキスト)と、ノイズ付与前の原言語テキストに対応する目的言語側のテキスト(目的言語テキスト)とを対応付けた疑似対訳コーパスを構築し、該疑似対訳コーパスを用いて機械翻訳モデル(例えばNMT(Neural Machine Translation)モデル)を学習(構築)するシステムである。ここでのノイズとは、利用者の自然発話入力に含まれ得る言い淀み、言い直し、又はフィラー等である。
図1に示される例では、既存の対訳コーパスにおける「主要な高速道路よりも観光ルートの方を走りたいです」との原言語テキストに対して、所定のルールに従って複数パターンのノイズを付与し(詳細は後述)、「えー主要な高速道路よりもまー観光ルートの方を走りたいです」「あ主要な高速道路よりもえー観光ルートの方を走りたいです」「えーっと主要な高速道路よりもまー観光ルートの方を走りたいです」という3パターンのノイズ付与原言語テキスト得ている。そして、ノイズ付与前の原言語テキストに対応する目的言語テキストである「I would rather take a scenic route than a main highway.」と、上述した3パターンのノイズ付与原言語テキストとを対応付けた疑似対訳コーパスが構築されて、該疑似対訳コーパスを用いて機械翻訳モデルが学習(構築)されている。このように、ノイズ付与原言語テキストがノイズ付与前の原言語テキストに対応する目的言語テキストに対応付けられた疑似対訳コーパスが構築されることにより、このような疑似対訳コーパスを利用して、例えば自然発話入力にフィラー等のノイズが含まれている場合においても、ノイズ付与前の原言語テキストに対応する目的言語テキストを適切に導出することが可能となる。以下、翻訳用データ生成システム1の機能の詳細について説明する。
図2は、本実施形態に係る翻訳用データ生成システム1の機能構成を示す図である。図2に示されるように、翻訳用データ生成システム1は、翻訳用データ生成装置10と、対訳コーパスDB20と、訓練情報DB30と、ノイズモデル学習装置40(ノイズモデル学習部)と、翻訳モデル学習装置50(翻訳モデル学習部)と、を備えている。なお、翻訳用データ生成システム1は、必ずしも上記の各構成を備えるものでなくてもよく、例えば翻訳用データ生成装置10のみで構成されていてもよいし、翻訳用データ生成装置10及びノイズモデル学習装置40のみで構成されていてもよいし、翻訳用データ生成装置10、ノイズモデル学習装置40、及び翻訳モデル学習装置50のみで構成されていてもよいし。
対訳コーパスDB20は、対訳コーパスを記憶しているデータベースである。対訳コーパスとは、原言語テキスト及び目的言語テキストの組み合わせを構造化したものである。対訳コーパスDB20が記憶する対訳コーパスは、通常利用されるものでよく、例えばKFTT(Kyoto Free Translation Task)又はBTEC等の日本語・英語の対訳コーパスである。本実施形態では、翻訳用データ生成装置10によって、対訳コーパスDB20が記憶する対訳コーパスの原言語テキストにノイズが付与され、疑似対訳コーパスが生成される(詳細は後述)。
訓練情報DB30は、ノイズモデル(詳細は後述)を学習するための訓練情報(訓練データ)を記憶しているデータベースである。訓練情報とは、予めノイズがアノテーションされた原言語テキスト群(自然発話の書き起こしコーパス。学習用発話データ)である。このような訓練情報は、例えば通常のコーパスに含まれる原言語テキストにノイズがアノテーションされることによって構築されている。
ノイズモデル学習装置40は、訓練情報DB30に記憶されている訓練情報(ノイズを含んだ原言語テキスト群である訓練データ)を用いて、原言語テキストに対するノイズの付与に係るノイズモデルを学習する。ノイズモデルの学習データ(訓練データ)としては、例えば、日本語はなし言葉コーパス(CSJ)又はSwitch Board Corpus等の自然発話コーパスの書き起こしコーパスが用いられてもよい。ノイズモデルは、原言語テキストが入力された場合に、該原言語テキストに係るノイズラベルの情報を出力するものである。ノイズラベルとは、ノイズのタイプ(種別)を示す情報である。図4は、ノイズラベルを説明する図である。図4に示されるように、本実施形態では、ノイズラベルとして、<F>、<D>、0の3種類がある。<F>は、フィラーを示すノイズラベルである。<D>は言い淀み又は言い直しを示すノイズラベルである。0はノイズ無しを示すノイズラベルである。ノイズラベルの情報とは、ノイズラベルの種類(上述した<F>、<D>、0)と各ノイズラベルが対応付けられる単語(詳細には形態素)とが紐づいた情報であり、例えば後述するノイズラベル系列である。
図3は、ノイズモデルの概要を説明する図である。図3に示されるように、ノイズモデルは、例えば、品詞タグ付けや固有表現抽出タスク等で広く用いられている双方向再帰的ニューラルネットワーク(BiRNN:Bi-directional Recurrent Neural Networks)を用いて構築されている。なお、ノイズモデルは、RNN等のその他のニューラルネットワークを用いた手法や、CRF(Conditional random field)等の条件付き確率場を用いた手法により構築されていてもよい。ノイズモデルは、入力された原言語テキストの各入力要素(単語詳細には形態素)の次にノイズが入る場合、その要素に対して適当なノイズラベルを予測するように学習されている。ノイズモデルを用いたノイズ付与においては、原言語テキストの形態素系列w=(w0,w1,…,wn)からノイズラベル系列l=(l0,l1,…,ln)を予測する系列ラベリング問題として考える。
いま、「<Fえー>それでは会議を<Dを>始め<Fあー>ます」という学習用発話データを例にノイズモデルを学習する方法を説明する。ここで、学習用発話データに含まれる「<Fえー>」は「えー」がフィラー<F>に相当することを表している。この場合、まず、学習用発話データから形態素系列w=(<BOS>,それでは,会議,を,始め,ます,<EOS>)が抽出される。図3に示されるように形態素系列は、t=0〜6までのタイムステップに各形態素(<BOS>及び<EOS>を含む)が対応付いている。次に、同じ学習用発話データであってノイズがアノテーションされた情報に基づいて、ノイズラベル系列l=(<F>,0,0,<D>,<F>,0,0)が生成される。最後に、形態素系列wからノイズラベル系列lを予測する系列ラベリング問題としてBiRNNを学習する。BiRNNでは、入力系列に対する出力系列の予測誤差が用いられ、パラメータ学習が行われる。
図2に戻り、翻訳モデル学習装置50は、翻訳用データ生成装置10において構築された疑似対訳コーパスを用いて翻訳モデルを学習する。翻訳モデルとしては、Transformer又はRNN−based Sequence−to−Sequenceモデル等を用いてもよい。
翻訳用データ生成装置10は、その機能として、解析部11と、ノイズ付与部12と、コーパス構築部13と、記憶部14とを備えている。
解析部11は、対訳コーパスDB20から原言語テキストを取得し、取得した原言語テキストに対して形態素解析を行う。すなわち、例えば、解析部11は、「主要な高速道路よりも観光ルートの方を走りたいです。」という原言語テキストを取得すると、該原言語テキストについて形態素系列w=(主要,な,高速,道路,より,も,観光,ルート,の,方,を,走り,たい,です)を抽出する。
ノイズ付与部12は、原言語テキスト(詳細には解析部11が抽出した形態素系列)にノイズを付与してノイズ付与原言語テキストを得る。ノイズ付与部12は、ノイズモデル学習装置40によって学習されたノイズモデルを用いて、原言語テキストにノイズを付与する。ノイズ付与部12は、原言語テキストの各単語の特徴(具体的には形態素)に応じて、各形態素にノイズラベルを付与し、該ノイズラベルを該ノイズラベルに対応する単語(ノイズとしての単語)へ置き換えることにより、原言語テキストにノイズを付与する。ノイズ付与部12は、ノイズモデルを用いることにより、入力された原言語テキストの形態素系列に対応するノイズラベル系列を予測し、対応する形態素系列の次にノイズラベルを挿入する。そして、ノイズ付与部12は、挿入したノイズラベルを、ノイズを表す単語に置換し、最終的な出力であるノイズが付与された原言語テキストであるノイズ付き原言語テキストを得る。なお、ノイズ付与部12は、原言語テキストの形態素に応じてノイズラベルを付与するとして説明したがこれに限定されず、原言語テキストの各単語の品詞や読み(発音)に応じてノイズラベルを付与してもよい。また、ノイズ付与部12は、単語の形態素、品詞、及び読み等の2つ以上の情報に応じて、ノイズラベルを付与してもよい。
ノイズ付与部12は、具体的には、まず、原言語テキストの形態素系列をノイズモデルに入力し、各タイムステップ(各形態素系列)におけるノイズモデルの出力ベクトルhtを取得する。本実施形態では、各タイムステップにおけるノイズラベルについて、単純にノイズラベルの事後確率が最大となるものを推定結果とするのではなく、出力ベクトルhtに指数をとった値exp(ht/τ)で定義される多項分布に基づくサンプリングにより決定する。すなわち、各タイムステップにおけるノイズラベルltは以下の(1)式に基づき推定される。
lt〜exp(ht/τ)・・・(1)
上記(1)式において、ltはノイズラベルの推定結果、htはノイズモデルの出力ベクトル、τは温度パラメータである。出力ベクトルhtは、3種類のラベルタイプ(<F>,<D>,0)についての3次元ベクトルで示される。温度パラメータτは、ノイズラベルのバリエーションの強弱を操作するためのパラメータである。温度パラメータτの値を大きく(τ→∞)するとノイズラベルの確率分布は一様分布に近づき、小さく(τ→0)すると最も高い確率のノイズラベルが選択されるようになる。
例えば温度パラメータτが比較的小さい場合のノイズラベルの決定について説明する。いま、ノイズモデルの出力ベクトルht=(−0.1(0の重みスコア),0.3(<F>の重みスコア),−0.3(<D>の重みスコア))であり、温度パラメータτ=0.15であるとする。この場合、ht/τ=(−0.6666…,2,−2)となる。各ノイズラベルの重みスコアを0以上とすべく指数をとると、exp(ht/τ)=(0.51,7.39,0.13)となる。重みスコアを確率値として扱うべく値域が[0,1]且つ全ての値を足して1になるように正規化すると、確率分布は(0.06(0がノイズラベルとして選ばれる確率),0.92(<F>がノイズラベルとして選ばれる確率),0.02(<D>がノイズラベルとして選ばれる確率))となる。このような確率分布(多項分布)に基づきノイズラベルを1回だけサンプリング(試行)することは、カテゴリカル分布からのサンプリングに相当する。この場合、ノイズラベル<F>の確立が92%と極めて高く、サンプリング結果として選択される可能性が極めて高い。
例えば温度パラメータτが比較的大きい場合のノイズラベルの決定について説明する。いま、ノイズモデルの出力ベクトルht=(−0.1(0の重みスコア),0.3(<F>の重みスコア),−0.3(<D>の重みスコア))であり、温度パラメータτ=1.0であるとする。この場合、ht/τ=(−0.1,0.3,−0.3)となる。各ノイズラベルの重みスコアを0以上とすべく指数をとると、exp(ht/τ)=(0.90,1.35,0.74)となる。重みスコアを確率値として扱うべく値域が[0,1]且つ全ての値を足して1になるように正規化すると、確率分布は(0.30(0がノイズラベルとして選ばれる確率),0.45(<F>がノイズラベルとして選ばれる確率),0.25(<D>がノイズラベルとして選ばれる確率))となる。このように、温度パラメータτを大きくすると、上述した温度パラメータτ=0.15の場合と比較して、ノイズラベル0及びノイズラベル<D>が選択されやすくなっていることがわかる。温度パラメータτが∞に近づくほど、各ノイズラベルの確立は33.333…%に近づき、確率分布が一様分布に近づく。
このように、ノイズ付与部12は、原言語テキストの各単語の特徴(形態素系列)を入力としてノイズモデルから出力される各ノイズラベルのスコアに基づく確率分布に従ってノイズラベルをサンプリングし、原言語テキストに付与するノイズラベルを決定している。なお、上述した説明においては、ノイズモデルの出力値を基に定義される確率分布が多項分布を表すとして説明したが、これに限定されず、確率分布はポアソン分布又は正規分布等を表すものであってもよい。
ノイズ付与部12は、つづいて、ノイズモデルを用いて予測したノイズラベル系列を、ノイズを表す単語に置き換える。ノイズ付与部12は、例えば、各ノイズラベルに対応する語彙集合Vtypeからユニグラム確率に基づきサンプリングを行う。例えば、フィラーのノイズラベル<F>を、フィラーを表す単語へ置換する場合、以下の(2)式に基づきフィラーを表す単語が決定される。
wt´〜V<F>・・・(2)
上記(2)式において、V<F>はノイズラベル<F>の語彙集合、wt´はタイムステップtに挿入されるフィラー(ノイズ)を表す単語である。以上によって、原言語テキストの形態素系列w=(w0,w1,…,wn)からノイズを表す単語を含む系列w´=(w0,w1,w1´,w2,w2´,…,wn)を得る。
ノイズ付与部12は、1つの原言語テキストから複数パターンのノイズ付与原言語テキストを得る。ノイズ付与部12は、例えば、1つのノイズラベルに対して置き換える単語(ノイズを表す単語)を複数パターン導出し、1つの原言語テキストから複数パターンのノイズ付与原言語テキストを得てもよい。また、ノイズ付与部12は、例えば各形態素に対応するノイズラベルを複数パターン導出し、1つの原言語テキストから複数パターンのノイズ付与原言語テキストを得てもよい。
コーパス構築部13は、ノイズ付与原言語テキストと、該ノイズ付与原言語テキストのノイズ付与前の原言語テキストに対応する目的言語テキストとを対応付けた疑似対訳コーパスを構築する。図5は、疑似対訳コーパスの構築イメージを示す図である。図5に示される例では、ノイズ付与前の原言語テキストである「主要な高速道路よりも観光ルートの方を走りたいです」についてのノイズ付与原言語テキスト(「えー主要な高速道路よりも観光ルートの方を走りたいです」等の7つのノイズ付与原言語テキスト)と、ノイズ付与前の原言語テキストに対応する目的言語テキストである「I would rather take a scenic route than a main highway.」とが対応付けられた(対訳ペアとした)疑似対訳コーパスが構築されている。
記憶部14は、コーパス構築部13によって構築された疑似対訳コーパスを記憶するDBである。翻訳モデル学習装置50は、記憶部14に記憶されている疑似対訳コーパスを用いて翻訳モデルを学習する。
次に、図6を参照して、翻訳用データ生成システム1が実行する処理を説明する。図6は、翻訳用データ生成システム1が実行する処理を示すフローチャートである。なお、図6に示される処理が実行される前提として、ノイズモデル学習装置40によってノイズモデルが構築(学習)されているものとする。
図6に示されるように、翻訳用データ生成システム1では、まず、翻訳用データ生成装置10の解析部11が対訳コーパスDB20から原言語テキストを取得する(ステップS1)。つづいて、解析部11は、取得した原言語テキストに対して形態素解析を実行する(ステップS2)。
つづいて、翻訳用データ生成装置10のノイズ付与部12は、解析部11が抽出した形態素系列に対してノイズを付与し、ノイズ付与原言語テキストを得る(ステップS3)。詳細には、ノイズ付与部12は、ノイズモデルを用いることにより、入力された原言語テキストの形態素系列に対応するノイズラベル系列を予測し、対応する形態素系列の次にノイズラベルを挿入する。そして、ノイズ付与部12は、挿入したノイズラベルを、ノイズを表す単語に置換し、最終的な出力であるノイズが付与された原言語テキストであるノイズ付き原言語テキストを得る。
つづいて、翻訳用データ生成装置10のコーパス構築部13は、ノイズ付与原言語テキストと、該ノイズ付与原言語テキストのノイズ付与前の原言語テキストに対応する目的言語テキストとを対応付けた疑似対訳コーパスを構築する(ステップS4)。
最後に、翻訳モデル学習装置50は、コーパス構築部13によって構築された疑似対訳コーパスを用いて翻訳モデルを学習する(ステップS5)。以上が、翻訳用データ生成システム1が実行する処理の一例である。
次に、本実施形態の作用効果について説明する。
本実施形態に係る翻訳用データ生成システム1は、原言語テキストにノイズを付与してノイズ付与原言語テキストを得るノイズ付与部12と、ノイズ付与原言語テキストと、該ノイズ付与原言語テキストのノイズ付与前の原言語テキストに対応する目的言語テキストとを対応付けた疑似対訳コーパスを構築するコーパス構築部13と、を備える。
本実施形態に係る翻訳用データ生成システム1では、原言語テキストにノイズが付与され、ノイズ付与原言語テキストとノイズ付与前の原言語テキストに対応する目的言語テキストとを対応付けた疑似対訳コーパスが構築される。このように、ノイズ付与原言語テキストがノイズ付与前の原言語テキストに対応する目的言語テキストに対応付けられた対訳コーパスが構築されることにより、このような対訳コーパスを利用して、例えば自然発話入力にフィラー等のノイズが含まれている場合においても、ノイズ付与前の原言語テキストに対応する目的言語テキストを適切に導出することが可能となる。すなわち、本実施形態に係る翻訳用データ生成システム1によれば、ノイズが含まれる自然発話に対して頑健なコーパス(疑似対訳コーパス)を構築することができ、ノイズが含まれる非流暢な自然発話に対しても高精度に翻訳を行うことができる。なお、このような翻訳用データ生成システム1により生成された情報が翻訳に用いられる場合には、利用者の発話内容を修正して翻訳モデルに入力する必要がなく、利用者の発話内容をそのまま翻訳モデルに入力することができる。また、例えば、特開2010−079647号公報及び特開2007−057844号公報に記載されたシステムでは、音声認識装置を用いて、逐次利用者の発話を受け取り言い直し判定を行っているが、本実施形態に係る翻訳用データ生成システム1では音声認識装置が不要であり、認識結果のテキスト情報のみが利用できればよい。このように、本実施形態に係る翻訳用データ生成システム1では、発話内容の修正処理や言い直し判定処理が実施されることを抑制できるため、CPU等の処理部における処理負荷を軽減するという技術的効果も併せて奏する。
図7は、本実施形態及び比較例の翻訳例を示す表である。図7の上段に示されるように、ノイズが含まれる自然発話入力に対して、比較例では訳抜けが生じている。また、図7の下段に示されるように、ノイズが含まれる自然発話入力に対して、比較例ではノイズを含めた状態で翻訳しており、所望の翻訳を行うことができていない。比較例に示されるように、従来、ノイズが含まれる自然発話に対して高精度に翻訳を行うことは困難であった。この点、図7の上段及び下段に示されるように、本実施形態の翻訳用データ生成システム1によって構築された疑似対訳コーパスが考慮されて翻訳が行われた場合には、ノイズが含まれる自然発話に対しても翻訳誤りが起きにくく、高精度に翻訳を行うことができる。
翻訳用データ生成システム1は、疑似対訳コーパスを用いて翻訳モデルを学習する翻訳モデル学習装置50を備えている。構築したコーパスに基づいて翻訳モデルが学習されることにより、ノイズが含まれる自然発話に対してより高精度に翻訳を行うことができる。
翻訳用データ生成システム1は、ノイズを含んだ原言語テキスト群である訓練データを用いて、原言語テキストに対するノイズの付与に係るノイズモデルを学習するノイズモデル学習装置40を備え、ノイズ付与部12は、ノイズモデルを用いて、原言語テキストにノイズを付与する。予めノイズが含まれている原言語テキスト群に基づきノイズモデルが学習され、該ノイズモデルに基づいてノイズの付与が行われることによって、実際に含まれる可能性が高いノイズが付与され易くなり、翻訳精度をより向上させることができる。
翻訳用データ生成システム1において、ノイズ付与部12は、原言語テキストの各単語に、ノイズのタイプを示すノイズラベルを付与し、該ノイズラベルを該ノイズラベルに対応する単語へ置き換えることにより、原言語テキストにノイズを付与する。原言語テキストの各単語に応じたノイズラベルが付与された後に該ノイズラベルに応じた単語(ノイズ)が導出されることにより、ノイズ付与の容易性及び妥当性を担保することができる。
翻訳用データ生成システム1において、ノイズ付与部12は、1つのノイズラベルに対して置き換える単語を複数パターン導出し、1つの原言語テキストから複数パターンのノイズ付与原言語テキストを得る。これにより、1つの原言語テキストから効率的に疑似対訳コーパスを充実させ、翻訳精度をより向上させることができる。
翻訳用データ生成システム1において、ノイズ付与部12は、各単語に対応するノイズラベルを複数パターン導出し、1つの原言語テキストから複数パターンのノイズ付与原言語テキストを得る。これにより、1つの原言語テキストから効率的に疑似対訳コーパスを充実させ、翻訳精度をより向上させることができる。
翻訳用データ生成システム1において、ノイズ付与部12は、原言語テキストの各単語の特徴に応じて、ノイズラベルを付与する。これにより、各単語に関連して含まれやすいノイズに係るノイズラベルを、各単語に適切に付与することができる。
翻訳用データ生成システム1において、ノイズ付与部12は、原言語テキストの各単語の特徴である、形態素、品詞、及び単語の読みの少なくとも一つに応じて、ノイズラベルを付与する。これにより、各単語に関連して含まれやすいノイズに係るノイズラベルを、各単語に適切に付与することができる。
翻訳用データ生成システム1において、ノイズ付与部12は、原言語テキストの各単語の特徴を入力としてノイズモデルから出力される各ノイズラベルのスコアに基づく各ノイズレベルの確率分布に従ってノイズラベルをサンプリングし、原言語テキストに付与するノイズラベルを決定する。これにより、例えばノイズモデルから出力されたスコアが高いノイズラベルを付与することが可能となり、各単語に関連して含まれやすいノイズに係るノイズラベルを、各単語に適切に付与することができる。
最後に、翻訳用データ生成装置10のハードウェア構成について、図8を参照して説明する。上述の翻訳用データ生成装置10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。翻訳用データ生成装置10のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
翻訳用データ生成装置10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、翻訳用データ生成装置10のノイズ付与部12等の制御機能はプロセッサ1001で実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、翻訳用データ生成装置10のノイズ付与部12等の制御機能は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る無線通信方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
また、翻訳用データ生成装置10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。例えば、本発明の一態様に係る翻訳用データ生成システムは、事前に定義したノイズ単語(フィラー、言い淀み、言い直し等)を原言語テキストのランダムな位置に付与するものであってもよい。ランダムな位置に付与する単語(ノイズ)は、例えばノイズ単語候補からランダムに選択されてもよい。このような構成においては、ノイズモデルの学習データ(ラベル付きデータ)がなくても、ノイズ単語が定義できさえすれば、ノイズをランダムに付与するノイズモデルを構築することができる。
本明細書で説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE−A(LTE-Advanced)、SUPER 3G、IMT−Advanced、4G、5G、FRA(Future Radio Access)、W−CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broad-band)、IEEE 802.11(Wi−Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、UWB(Ultra-Wide Band)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及び/又はこれらに基づいて拡張された次世代システムに適用されてもよい。
本明細書で説明した各態様/実施形態の処理手順、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。
ユーザ端末は、当業者によって、移動通信端末、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、またはいくつかの他の適切な用語で呼ばれる場合もある。
本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
本明細書で「第1の」、「第2の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1および第2の要素への参照は、2つの要素のみがそこで採用され得ること、または何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。
本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。