JP2019016048A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2019016048A
JP2019016048A JP2017131164A JP2017131164A JP2019016048A JP 2019016048 A JP2019016048 A JP 2019016048A JP 2017131164 A JP2017131164 A JP 2017131164A JP 2017131164 A JP2017131164 A JP 2017131164A JP 2019016048 A JP2019016048 A JP 2019016048A
Authority
JP
Japan
Prior art keywords
sentence
language
translation
unit
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017131164A
Other languages
English (en)
Other versions
JP6924636B2 (ja
Inventor
継太 勝野
Keita Katsuno
継太 勝野
憲一朗 足羽
Kenichiro Ashiba
憲一朗 足羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2017131164A priority Critical patent/JP6924636B2/ja
Publication of JP2019016048A publication Critical patent/JP2019016048A/ja
Application granted granted Critical
Publication of JP6924636B2 publication Critical patent/JP6924636B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】翻訳文の検索によって翻訳が成功する可能性を高くする。【解決手段】翻訳元文とその翻訳文とを対応付けて登録しておき、翻訳対象となる文が入力されると、まず、これに類似する翻訳元文を検索し、次に、その翻訳元文に対応する翻訳文を検索して出力するという機能において、入力された文に対して、日本語の文法において意味が共通となるように語順を入れ替えた文を含めて検索を行う。ここで、英語の文法に関係なく、日本語の文法においてその文の意味が共通するように語順を入れ替えるようにする点が特徴である。【選択図】図3

Description

本発明は、異言語間の翻訳技術に関する。
異言語間の翻訳に関して、例えば特許文献1には、翻訳元の言語である日本語で表現された文における語順を、翻訳先の言語である英語に近い語順に並べ替えてから翻訳することが記載されている。
特開2014−170296号公報
ところで、異言語間の翻訳技術においては、使用頻度が比較的多い翻訳元文(例えば「海と空が綺麗です。」という日本語の文)と、その翻訳文(例えば「The sea and the sky are beautiful.」という英語の文)とを対応付けて登録しておき、翻訳対象となる文が入力されると、まず、これに類似する翻訳元文を検索し、次に、その翻訳元文に対応する翻訳文を検索して出力するという機能が知られている。
ただし、一般的には、同じ意味の文であっても複数とおりの語順で表現することが可能な場合があるから、入力された翻訳対象の文(例えば「空と海が綺麗です。」)と予め登録されている翻訳元文(例えば「海と空が綺麗です。」)とがほぼ同じ意味なのに語順のみが異なるために、入力された翻訳対象の文と同じ意味の翻訳元文を検索しても見つからないという可能性がある。
これに対処するために、例えば1つの意味の表現に対してあらゆる語順を想定した翻訳元文を登録しておくことが考えられるが、このようにしてしまうと、翻訳元文群のデータサイズが膨大となることに加え、検索処理に要する時間も増大してしまうという問題がある。
そこで、本発明は、翻訳文の検索によって翻訳が成功する可能性を高くすることを目的とする。
上記課題を解決するため、本発明は、第1言語で表現された翻訳元文と、当該翻訳元文を前記第1言語とは異なる第2言語に翻訳した翻訳文とを対応付けて記憶する記憶部と、前記第1言語で表現された文を取得する取得部と、取得された前記第1言語の文を構成する複数の語又は句のうち、当該文における位置を入れ替えた前後で前記第1言語の文法において当該文の意味が共通となるような関係にある語又は句を特定する特定部と、取得された前記第1言語の文において前記関係にある語又は句の位置を入れ替えた前記第1言語の文を生成する生成部と、取得された前記第1言語の文及び生成された前記第1言語の文を翻訳元文として、前記記憶部において当該翻訳元文に対応する前記第2言語の翻訳文を検索する検索部と、検索された前記第2言語の翻訳文を出力する出力部とを備える情報処理装置を提供する。
前記出力部は、前記第2言語の翻訳文の検索に失敗した場合には、前記第1言語から前記第2言語に翻訳する翻訳装置に対して、前記取得部により取得された前記第1言語の文を出力するようにしてもよい。
前記検索部は、前記関係にある語又は句の位置を入れ替えた前記第1の言語の文のうち、語順の入替に関する所定の条件を満たす文を翻訳元文として前記検索を行うようにしてもよい。
前記検索部は、前記取得部により取得された前記第1言語の文と、当該第1言語の文を前記第2言語に翻訳した結果とに基づいて、語又は句の語順に関する学習を行い、
前記関係にある語又は句の位置を入れ替えた前記第1言語の文のうち、前記学習の結果に応じた語順となる文を翻訳元文として前記検索を行うようにしてもよい。
前記検索部は、前記取得部により取得される前記第1言語の文を提供するユーザごとに前記学習を行うようにしてもよい。
前記検索部は、取得された前記第1言語の文において前記関係にある語又は句のうち当該文における位置の違いが小さい語又は句を入れ替えた第1言語の文を翻訳元文として前記検索を行うようにしてもよい。
前記検索部は、取得された前記第1言語の文において前記関係にある語又は句の位置を入れ替えた前後で当該入替の回数が少ない第1言語の文を翻訳元文として前記検索を行うようにしてもよい。
前記検索部は、取得された前記第1言語で表現された文の途中に配置される約物で区切られた各部分において前記関係にある語又は句の位置を入れ替えた第1言語の文を翻訳元文として前記検索を行うようにしてもよい。
また、本発明は、コンピュータを、第1言語で表現された翻訳元文と、当該翻訳元文を前記第1言語とは異なる第2言語に翻訳した翻訳文とを対応付けて記憶する記憶部と、前記第1言語で表現された文を取得する取得部と、取得された前記第1言語の文を構成する複数の語又は句のうち、当該文における位置を入れ替えた前後で前記第1言語の文法において当該文の意味が共通となるような関係にある語又は句を特定する特定部と、取得された前記第1言語の文において前記関係にある語又は句の位置を入れ替えた前記第1言語の文を生成する生成部と、取得された前記第1言語の文及び生成された前記第1言語の文を翻訳元文として、前記記憶部において当該翻訳元文に対応する前記第2言語の翻訳文を検索する検索部と、検索された前記第2言語の翻訳文を出力する出力部として機能させるためのプログラムを提供する。
本発明によれば、翻訳文の検索によって翻訳が成功する可能性を高くすることができる。
本発明の一実施形態にかかる翻訳システムの全体構成を示す図である。 本発明の一実施形態にかかる情報処理装置のハードウェア構成を示す図である。 同情報処理装置の機能構成を示す図である。 同情報処理装置の処理を示すフローチャートである。 文の構造を例示する図である。 変形例に係る入力文と生成文との関係を例示する図である。 変形例に係る入力文と生成文との関係を例示する図である。
[構成]
図1は、本発明の一実施形態に係る翻訳システムの全体構成を示すブロック図である。この翻訳システムは、異言語間の翻訳に関する処理を行う情報処理装置1と、ユーザに対する情報の入出力を行うユーザ端末2と、情報処理装置1及びユーザ端末2を通信可能に接続する通信網3とを備えている。通信網3は移動通信網又は固定通信網を含む。ユーザ端末2は、例えばスマートホンやタブレット或いはウェアラブル端末などの通信可能なコンピュータである。本実施形態において、ユーザ端末2を操作するユーザは、第1言語(例えば日本語)の話者であり、この第1言語とは異なる第2言語(例えば英語)の話者との間で、この翻訳システムを利用しながら会話を行うものとする。情報処理装置1は、本発明に係る情報処理装置の一例であり、ユーザ端末2においてユーザにより入力された第1言語(例えば日本語)の表現を第2言語(例えば英語)の表現に翻訳してユーザ端末2に出力する。
図2は、情報処理装置1のハードウェア構成を示すブロック図である。情報処理装置1は、制御部101と、通信部102と、記憶部103とを備えたコンピュータである。制御部101は、CPU(Central Processing Unit)などの演算装置と、ROM(Read Only Memory)及びRAM(Random Access Memory)などの記憶装置とを備えている。CPUは、RAMをワークエリアとして用いてROMや記憶部103に記憶されたプログラムを実行することによって、情報処理装置1の各部の動作を制御する。通信部102は通信網3に接続されている。記憶部103は、例えばハードディスク等の、大容量で不揮発性の記憶手段である。記憶部103は、制御部101が用いるデータ群やプログラム群を記憶している。
図3は、情報処理装置1の機能構成を示すブロック図である。図に示した取得部11、出力部16は主に通信部102及び制御部101(図2)というハードウェアによって実現され、記憶部14は主に記憶部103(図2)というハードウェアによって実現され、特定部12、生成部13、検索部15及び翻訳部17は主に制御部101及び記憶部14(図2)というハードウェアによって実現される。
取得部11は、ユーザの発話によってユーザ端末2に入力されて生成された日本語の音声データを通信網3経由で受信すると、音声認識処理を施してその音声データをテキストデータに変換して、日本語で表現された文を取得する。
記憶部14は、日本語で表現された文である翻訳元文と、その翻訳元文を英語に翻訳した翻訳文とが対応付けられたデータベースを記憶する。翻訳元文は、使用頻度が比較的多い文としてシステム運用前に予め決められたものであり、適宜アップデートされる。翻訳文は、翻訳元文が英語に翻訳されたものであり、システム運用前に予め決められているが適宜アップデートされる。簡単な例示として、このデータベースには、「海と空が綺麗です。」という日本語の文と、その翻訳文である「The sea and the sky are beautiful.」という英語の文とが対応付けられているものとする。
特定部12は、取得部11により取得された日本語の文を構成する複数の語又は句のうち、その文における位置を入れ替えた前後で日本語の文法においてその文の意味が共通となるような関係(以下、並列関係という)にある語又は句を特定する。例えば「空と海が綺麗です。」という日本語の文において、「空」及び「海」はという語の位置を入れ替えた場合、入替前は「空と海が綺麗です。」であり、入替後は「海と空が綺麗です。」となるが、いずれも日本語の文法において文の意味は共通である。よって、「空と海が綺麗です。」という日本語の文において、「空」及び「海」という語は並列関係にあることになる。
生成部13は、取得部11により取得された日本語の文において、特定部12により特定された並列関係にある語又は句の位置を入れ替えた日本語の文を生成する。例えば「空と海が綺麗です。」という日本語の文においては、並列関係にある「空」及び「海」という語が入れ替えられて、「海と空が綺麗です。」という日本語の文が生成される。
検索部15は、取得部11により取得された日本語の文及び生成部13により生成された日本語の文を翻訳元文として、記憶部14においてその翻訳元文に対応する英語の翻訳文を検索する。ここでは、「空と海が綺麗です。」という日本語の文と、「海と空が綺麗です。」という日本語の文とがいずれも翻訳元文とされ、これらに対応する英語の翻訳文が検索されることになる。
出力部16は、検索部15により検索された英語の翻訳文を通信網3経由でユーザ端末2に対して出力する。ここでは、「空と海が綺麗です。」という日本語の文と「海と空が綺麗です。」という日本語の文のうち、「海と空が綺麗です。」という日本語の文に対応する翻訳文である「The sea and the sky are beautiful.」という英語の文が出力されることになる。
なお、検索部15が英語の翻訳文の検索に失敗した場合、つまり、取得部11により取得された日本語の文又は生成部13により生成された日本語の文に対応する日本語の翻訳元文及び英語の翻訳文が記憶部14に記憶されていなかった場合、出力部16は、日本語から英語に翻訳する翻訳部17に対して、取得部11により取得された日本語の文を出力する。翻訳部17は、日本語で表現された文を英語で表現された文に翻訳する翻訳エンジンである。翻訳部17による翻訳処理は、上述したような翻訳文検索による翻訳よりも高度で時間を要する処理であり、例えば形態素解析や構文解析のほか意味解析等の高度な解析手法を含んでいる。出力部16は、翻訳部17により翻訳された翻訳文を通信網3経由でユーザ端末2に対して出力する。
[動作]
次に、図4を参照して本実施形態の動作を説明する。情報処理装置1の記憶部14は上述したデータベースを記憶しておく。このデータベースには、例えば「私は昨日の夜にクリームシチューを食べました。」という日本語の文と、その英語の翻訳文である「I ate a cream stew last night.」とが対応付けられているものとする。
情報処理装置1の取得部11は、ユーザの発話によってユーザ端末2に入力されて生成された日本語の音声データ(例えば「昨日の夜に私はクリームシチューを食べました。」)を通信網3経由で受信し、音声認識処理を施してその音声データをテキストデータに変換して、日本語で表現された文を取得する(ステップS1)。
情報処理装置1の特定部12は、取得された上記日本語の文を構成する複数の語又は句のうち、当該文における位置を入れ替えた前後で日本語の文法において当該文の意味が共通となるような並列関係にある語又は句を特定する(ステップS2)。具体的には、特定部12は、入力された「昨日の夜に私はクリームシチューを食べました。」という日本語の文に対して形態素解析を行い、品詞ごとに区分する。これにより、上記文は「昨日/の/夜/に/私/は/クリームシチュー/を/食べました。」(「/」は品詞の区切り)というように品詞単位で分離される。次に、特定部12は、品詞単位で区分された文に対して例えばKNPと呼ばれるようなアルゴリズムの構文解析を行い、どの語又は句がどの語又は句に係る可能性があるかを調べ、上述した並列関係にある語又は句を特定する。
図5は構文解析の結果である、上記文の構造を例示したものである。この構文解析により、「昨日の夜に」という句と、「私は」という句と、「クリームシチューを」という句とが、「食べました。」という句に対して係ることが分かる。つまり、「昨日の夜に」という句と、「私は」という句と、「クリームシチューを」という句とが並列関係にあることが特定される。
情報処理装置1の生成部13は、入力された日本語の文において特定された並列関係にある語又は句の位置を相互に入れ替えた日本語の文を生成する(ステップS3)。これにより、
「私は昨日の夜にクリームシチューを食べました。」、
「昨日の夜にクリームシチューを私は食べました。」、
「昨日の夜に私はクリームシチューを食べました。」、
「クリームシチューを昨日の夜に私は食べました。」、
「クリームシチューを私は昨日の夜に食べました。」、
というように、並列関係にある語が全ての組み合わせによって入れ替えられた複数の日本語の文が生成される。
次に、情報処理装置1の検索部15は、取得部11により取得された日本語の文である「昨日の夜に私はクリームシチューを食べました。」と、生成部13により生成された日本語の文である「私は昨日の夜にクリームシチューを食べました。」、「昨日の夜にクリームシチューを私は食べました。」、「昨日の夜に私はクリームシチューを食べました。」、「クリームシチューを昨日の夜に私は食べました。」、「クリームシチューを私は昨日の夜に食べました。」の全てを翻訳元文として、記憶部14においてその翻訳元文に対応する英語の翻訳文を総当たりで検索する(ステップS4)。このとき、例えば語尾表現や人称代名詞が類似するなどの各種の類似表現の検索技術(例えば「食べた。」に対して「食べました。」を検索するとか、「わたし」に対して「わたくし」を検索するなど)を用いてもよい。これにより、「私は昨日の夜にクリームシチューを食べました。」という翻訳元文が検索され、さらにその翻訳元文に対応する英語の翻訳文「I ate a cream stew last night.」が検索される(ステップS5;YES)。
情報処理装置1の出力部16は、検索部15により検索された英語の翻訳文を通信網3経由でユーザ端末2に対して出力する(ステップS6)。ユーザ端末2においてはこの英語の翻訳文が例えば音声又は表示等の任意の態様により出力される。
出力部16は、翻訳文の検索に失敗した場合には(ステップS5;NO)、翻訳部17に対して、取得部11により取得された日本語の文を出力する。翻訳部17はこの翻訳を行い(ステップS7)、出力部16は、翻訳部17により翻訳された翻訳文を通信網3経由でユーザ端末2に対して出力する(ステップS6)。ユーザ端末2においてはこの英語の翻訳文が音声又は表示等の任意の態様により出力される。
以上説明した実施形態によれば、翻訳元文とその翻訳文とを対応付けたデータベースにおいて、翻訳対象となる文に類似する翻訳元文を検索してその翻訳元文に対応する翻訳文を出力するという機能において、翻訳対象となる文において並列関係にある語順を入れ替えた文を含めて検索を行うため、翻訳が成功する可能性が高くなる。前述した特許文献1の記載の仕組みでは、日本語で表現された文における語順を、それとは異なる言語である英語の文法に沿った語順に並べ替えてから翻訳している。これに対し、本実施形態では、特許文献1のように翻訳先の言語である英語の文法は一切関係なく、翻訳元の言語である日本語の文法においてその文の意味が共通するような並列関係にある語又は句を特定しており、この点で特許文献1の記載の発明とは技術思想が異なっている。
[変形例]
上述した実施形態は次のような変形が可能である。また、以下の変形例を互いに組み合わせて実施してもよい。
[変形例1]
検索部15は、並列関係にある語又は句の位置を入れ替えた第1の言語の文のうち、語順の入替に関する所定の条件を満たす文を翻訳元文として用いて検索を行うようにしてもよい。具体的には以下のような複数の例が考えられる。
検索部15は、取得部11により取得された第1言語の文と、当該第1言語の文を第2言語に翻訳した結果とに基づいて、語又は句の語順に関する学習を行い、並列関係にある語又は句の位置を入れ替えた複数の第1言語の文のうち、上記の学習結果に応じた語順となる文を翻訳元文として検索を行う。つまりこの場合、語順の入替に関する所定の条件とは、語又は句の語順に関する学習結果に合致するという条件である。
例えば、並列関係にある語が全ての組み合わせによって入れ替えられた複数の文のなかには、文法としては間違っていないが、特定の話者によってはあまり用いられない語順というものがある。例えば、日本語においては、「クリームシチューを昨日の夜に私は食べました。」というように、文全体において主語を述語や目的語よりも後ろに配置することが少ない話者が居ることが考えられる。そこで、検索部15は、取得部11により取得された第1言語の文を提供するユーザごとに、その文に対して形態素解析や構文解析等を用いて、例えば主語、述語、目的語がどのような語順で用いられることが多いかということを学習する。そして、検索部15は、生成部13が生成した文のうち、そのユーザが用いる可能性が閾値以上となるような語順の文のみを用いて検索を行う。なお、この学習はユーザ単位でなくてもよく、複数のユーザ或いは全ユーザに共通の学習で行ってもよい。
また、検索部15は、取得部11により取得された第1言語の文において並列関係にある語又は句のうち、当該文における位置の違いが小さい語又は句を入れ替えた第1言語の文を翻訳元文として検索を行う。つまり、この場合、語順の入替に関する所定の条件とは、入力された文において入替対象となる語又は句の位置の違いが小さい、という条件である。例えば、(x)「昨日の夜に私はクリームシチューを食べました。」という入力文に対して、
(a)「私は昨日の夜にクリームシチューを食べました。」、
(b)「昨日の夜にクリームシチューを私は食べました。」、
(c)「昨日の夜に私はクリームシチューを食べました。」、
(d)「クリームシチューを昨日の夜に私は食べました。」、
(e)「クリームシチューを私は昨日の夜に食べました。」、
という5つの文が生成される場合を想定する。
(x)「昨日の夜に私はクリームシチューを食べました。」という入力文に対する(a)「私は昨日の夜にクリームシチューを食べました。」の生成文においては、「私は」、「昨日の夜に」という句が入れ替わっているのみ、つまり、これらの句が1つ分の句に相当する移動量で変更されているだけである(図6上段参照)。これに対し、(x)「昨日の夜に私はクリームシチューを食べました。」という入力文に対する(d)「クリームシチューを昨日の夜に私は食べました。」の生成文においては、「クリームシチューが」という句は2つ分の句に相当する移動量で変更され、「昨日の夜に」という句は1つ分の句に相当する移動量で変更され、「私は」という句は1つ分の句に相当する移動量で変更されている(図6下段参照)。このような場合、検索部15は、生成部13が生成した文のうち、それぞれの語又は句の移動量が閾値以下となるような語順の文のみを用いて検索を行う。
例えば図6の例において、閾値を、文全体において3つ分の句に相当する移動量とする。(x)「昨日の夜に私はクリームシチューを食べました。」という入力文に対する(a)「私は昨日の夜にクリームシチューを食べました。」の生成文においては、全移動量が2つ分の句に相当する移動量であり、(x)「昨日の夜に私はクリームシチューを食べました。」という入力文に対する(d)「クリームシチューを昨日の夜に私は食べました。」の生成文においては、全移動量が4つ分の句に相当する移動量である。よって、この場合、(d)「クリームシチューを昨日の夜に私は食べました。」の生成文は検索部15による検索に使用されない。
また、検索部15は、取得された第1言語の文において並列関係にある語又は句の位置を入れ替えた前後で当該入替の回数が少ない第1言語の文を翻訳元文として検索を行う。つまり、この場合、語順の入替に関する所定の条件とは、入力された文において入替の回数が少ない、という条件である。例えば「昨日の夜に私は家族とクリームシチューを食べました。」という入力文に対して、「私は昨日の夜に家族とクリームシチューを食べました。」、「クリームシチューを家族と私は昨日の夜に食べました。」という文を含む複数の文が生成される場合を想定する。
「昨日の夜に私は家族とクリームシチューを食べました。」という入力文に対する(a)「私は昨日の夜に家族とクリームシチューを食べました。」の生成文においては、「私は」、「昨日の夜に」という句が入れ替わっているのみ、つまり、入替の回数は1回である(図7上段参照)。これに対し、「昨日の夜に私は家族とクリームシチューを食べました。」という入力文に対する(a)「クリームシチューを家族と私は昨日の夜に食べました。」の生成文においては、「私は」という句と「家族と」という句とが入れ替えられており、さらに、「クリームシチューを」という句と「昨日の夜に」という句とが入れ替えられており、入替の回数は2回である(図7下段参照)。このような場合、検索部15は、生成部13が生成した文のうち、語又は句の入替の回数が閾値以下となるような語順の文のみを用いて検索を行う。
例えば図7の例において、閾値を、文全体において入替の回数1回とする。「昨日の夜に私は家族とクリームシチューを食べました。」という入力文に対する「私は昨日の夜に家族とクリームシチューを食べました。」の生成文においては、入替の回数が1回であり、「昨日の夜に私は家族とクリームシチューを食べました。」という入力文に対する「クリームシチューを家族と私は昨日の夜に食べました。」の生成文においては、入替の回数が2回であるから、「クリームシチューを家族と私は昨日の夜に食べました。」の生成文は検索部15による検索に使用されない。
[変形例2]
文の途中において、約物と呼ばれる記号によって区切られることがある。例えば、句読点、疑問符、感嘆符、終止符、コンマ、括弧などである。これら約物で区切られた一部分においては意味のつながりが有るか強いのに対し、これら約物で区切られた一部分とこれに隣接する一部分との間には、意味のつながりが無いか弱いことが多い。そこで、検索部15は、取得された第1言語で表現された文の途中に配置される約物で区切られた各部分において並列関係にある語又は句の位置を入れ替えた第1言語の文を翻訳元文として優先した検索を行う。ここで、翻訳元文として優先した検索とは、約物で区切られた各々の部分内において並列関係にある語又は句の位置を入れ替えた第1言語の文を、約物で区切られた各部分に跨って並列関係にある語又は句の位置を入れ替えた第1言語の文よりも優先して検索を行うという意味である。
検索部15は、例えば「××××、○○○○」というように読点で区切られている前半の「××××」において語順が入れ替えられ、これとは別の後半「○○○○」において語順が入れ替えられてなる文を用いて検索を行う。このとき、検索部15は、「××××、○○○○」という文全体において語順が入れ替えられた文を用いた検索は行わないか、或いは、前半の「××××」において語順が入れ替えられ且つ後半「○○○○」において語順が入れ替えられてなる文を用いて検索を行った後に、「××××、○○○○」という文全体において語順が入れ替えられた文を用いた検索を行う。
[変形例3]
本発明は、上記実施形態のような音声入力に限らず、テキストによる入力にも適用可能である。テキストによる入力の場合には音声認識処理は不要となる。
また、第1言語及び第2言語は上記実施形態で例示した日本語及び英語に限定されず、任意の言語を用いることが可能である。
[そのほかの変形例]
上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
本明細書で説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE−A(LTE-Advanced)、SUPER 3G、IMT−Advanced、4G、5G、FRA(Future Radio Access)、W−CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi−Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及び/又はこれらに基づいて拡張された次世代システムに適用されてもよい。
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
本明細書で使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。
本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining) した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving) (例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
本発明は、情報処理装置1が行う情報処理方法や、コンピュータを情報処理装置1として機能させるためのプログラムといった形態でも実施が可能である。かかるプログラムは、光ディスク等の記録媒体に記録した形態で提供されたり、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、これをインストールして利用可能にするなどの形態で提供されたりすることが可能である。
また、情報処理装置1は、図3の機能の全てを一体に備えた単一装置によっても実現可能であるし、これらの機能を複数の装置に分散して備えたシステムによって実現されてもよい。例えば取得部11、記憶部12、特定部13、生成部14、検索部15及び出力部17をユーザ端末2に実装し、翻訳部17を情報処理装置1に実装してもよい。この場合、ユーザ端末2が本発明に係る情報処理装置の一例に相当する。
以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。
1・・・情報処理装置、11・・・取得部、12・・・記憶部、13・・・特定部、14・・・生成部、15・・・検索部、16・・・出力部、17・・・翻訳部、101・・・制御部、102・・・通信部、103・・・記憶部、2・・・ユーザ端末、3・・・通信網。

Claims (9)

  1. 第1言語で表現された翻訳元文と、当該翻訳元文を前記第1言語とは異なる第2言語に翻訳した翻訳文とを対応付けて記憶する記憶部と、
    前記第1言語で表現された文を取得する取得部と、
    取得された前記第1言語の文を構成する複数の語又は句のうち、当該文における位置を入れ替えた前後で前記第1言語の文法において当該文の意味が共通となるような関係にある語又は句を特定する特定部と、
    取得された前記第1言語の文において前記関係にある語又は句の位置を入れ替えた前記第1言語の文を生成する生成部と、
    取得された前記第1言語の文及び生成された前記第1言語の文を翻訳元文として、前記記憶部において当該翻訳元文に対応する前記第2言語の翻訳文を検索する検索部と、
    検索された前記第2言語の翻訳文を出力する出力部と
    を備える情報処理装置。
  2. 前記出力部は、前記第2言語の翻訳文の検索に失敗した場合には、前記第1言語から前記第2言語に翻訳する翻訳装置に対して、前記取得部により取得された前記第1言語の文を出力する
    ことを特徴とする請求項1記載の情報処理装置。
  3. 前記検索部は、前記関係にある語又は句の位置を入れ替えた前記第1の言語の文のうち、語順の入替に関する所定の条件を満たす文を翻訳元文として前記検索を行う
    ことを特徴とする請求項1又は2記載の情報処理装置。
  4. 前記検索部は、
    前記取得部により取得された前記第1言語の文と、当該第1言語の文を前記第2言語に翻訳した結果とに基づいて、語又は句の語順に関する学習を行い、
    前記関係にある語又は句の位置を入れ替えた前記第1言語の文のうち、前記学習の結果に応じた語順となる文を翻訳元文として前記検索を行う
    ことを特徴とする請求項3記載の情報処理装置。
  5. 前記検索部は、前記取得部により取得される前記第1言語の文を提供するユーザごとに前記学習を行う
    ことを特徴とする請求項4記載の情報処理装置。
  6. 前記検索部は、取得された前記第1言語の文において前記関係にある語又は句のうち当該文における位置の違いが小さい語又は句を入れ替えた第1言語の文を翻訳元文として前記検索を行う
    ことを特徴とする請求項3記載の情報処理装置。
  7. 前記検索部は、取得された前記第1言語の文において前記関係にある語又は句の位置を入れ替えた前後で当該入替の回数が少ない第1言語の文を翻訳元文として前記検索を行う
    ことを特徴とする請求項3記載の情報処理装置。
  8. 前記検索部は、取得された前記第1言語で表現された文の途中に配置される約物で区切られた各部分において前記関係にある語又は句の位置を入れ替えた第1言語の文を翻訳元文として前記検索を行う
    ことを特徴とする請求項3記載の情報処理装置。
  9. コンピュータを、
    第1言語で表現された翻訳元文と、当該翻訳元文を前記第1言語とは異なる第2言語に翻訳した翻訳文とを対応付けて記憶する記憶部と、
    前記第1言語で表現された文を取得する取得部と、
    取得された前記第1言語の文を構成する複数の語又は句のうち、当該文における位置を入れ替えた前後で前記第1言語の文法において当該文の意味が共通となるような関係にある語又は句を特定する特定部と、
    取得された前記第1言語の文において前記関係にある語又は句の位置を入れ替えた前記 第1言語の文を生成する生成部と、
    取得された前記第1言語の文及び生成された前記第1言語の文を翻訳元文として、前記記憶部において当該翻訳元文に対応する前記第2言語の翻訳文を検索する検索部と、
    検索された前記第2言語の翻訳文を出力する出力部と
    して機能させるためのプログラム。
JP2017131164A 2017-07-04 2017-07-04 情報処理装置及びプログラム Active JP6924636B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017131164A JP6924636B2 (ja) 2017-07-04 2017-07-04 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017131164A JP6924636B2 (ja) 2017-07-04 2017-07-04 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2019016048A true JP2019016048A (ja) 2019-01-31
JP6924636B2 JP6924636B2 (ja) 2021-08-25

Family

ID=65358711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017131164A Active JP6924636B2 (ja) 2017-07-04 2017-07-04 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6924636B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539231A (zh) * 2020-04-29 2020-08-14 北京金山安全软件有限公司 一种翻译方法、装置、服务器及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539231A (zh) * 2020-04-29 2020-08-14 北京金山安全软件有限公司 一种翻译方法、装置、服务器及计算机可读存储介质

Also Published As

Publication number Publication date
JP6924636B2 (ja) 2021-08-25

Similar Documents

Publication Publication Date Title
US20240078386A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
US20240038088A1 (en) Display apparatus and method for question and answer
US20230377577A1 (en) System, apparatus, and method for processing natural language, and non-transitory computer readable recording medium
JP7346610B2 (ja) 自然言語理解フレームワークでの発言についての複数意味表現の導出
JP2022539138A (ja) 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法
US20220207067A1 (en) User-customized question-answering system based on knowledge graph
WO2018141140A1 (zh) 一种语义识别方法和装置
CN105590627B (zh) 图像显示装置、用于驱动图像显示装置的方法和计算机可读记录介质
KR102348084B1 (ko) 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
WO2019042450A1 (zh) 一种自然语言处理方法和装置
US20200074342A1 (en) Question answering system, question answering processing method, and question answering integrated system
CN106713111A (zh) 一种添加好友的处理方法、终端及服务器
US20160042736A1 (en) Method for processing dialogue based on processing instructing expression and apparatus therefor
JP7031462B2 (ja) 分類プログラム、分類方法、および情報処理装置
JP2019016048A (ja) 情報処理装置及びプログラム
WO2021107208A1 (ko) 챗봇 채널연계 통합을 위한 챗봇 통합 에이전트 플랫폼 시스템 및 그 서비스 방법
JP2021124913A (ja) 検索装置
US20210241755A1 (en) Information-processing device and information-processing method
KR20160131730A (ko) 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체
US20230032208A1 (en) Augmenting data sets for machine learning models
CN107918606A (zh) 具象名词识别方法及装置
JP6107003B2 (ja) 辞書更新装置、音声認識システム、辞書更新方法、音声認識方法、および、コンピュータ・プログラム
WO2019187463A1 (ja) 対話サーバ
JP6745402B2 (ja) 質問推定装置
JP2021082125A (ja) 対話装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210802

R150 Certificate of patent or registration of utility model

Ref document number: 6924636

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150