JP2014109791A - 外国語文章作成支援装置、方法、及びプログラム - Google Patents

外国語文章作成支援装置、方法、及びプログラム Download PDF

Info

Publication number
JP2014109791A
JP2014109791A JP2012262297A JP2012262297A JP2014109791A JP 2014109791 A JP2014109791 A JP 2014109791A JP 2012262297 A JP2012262297 A JP 2012262297A JP 2012262297 A JP2012262297 A JP 2012262297A JP 2014109791 A JP2014109791 A JP 2014109791A
Authority
JP
Japan
Prior art keywords
word
foreign language
sentence
candidate
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012262297A
Other languages
English (en)
Other versions
JP6096489B2 (ja
Inventor
Hirokazu Suzuki
博和 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012262297A priority Critical patent/JP6096489B2/ja
Priority to US14/089,231 priority patent/US20140156258A1/en
Priority to CN201310629795.8A priority patent/CN103853813A/zh
Publication of JP2014109791A publication Critical patent/JP2014109791A/ja
Application granted granted Critical
Publication of JP6096489B2 publication Critical patent/JP6096489B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

【課題】スムーズな外国語文章の作成を支援する外国語文章作成支援装置を提供する。
【解決手段】一実施形態に係る外国語文章作成支援装置は、入力部、辞書検索部、単語列生成部、候補生成部、機械翻訳部、及び表示部を備える。入力部は、外国語の文章の入力を受け付ける。辞書検索部は、前記外国語の文章中に含まれる他言語の単語に対して辞書検索を行い、前記他言語の単語に対応する前記外国語の単語である訳語を取得する。単語列生成部は、前記訳語を含む拡張単語列を生成する。候補生成部は、前記他言語の単語を前記訳語及び前記単語列の各々に置換することによって外国語文章候補を生成する。機械翻訳部は、前記外国語文章候補を機械翻訳して機械翻訳結果を生成する。表示部は、前記外国語文章候補を前記機械翻訳結果とともに表示する。
【選択図】図1

Description

本発明の実施形態は、外国語文章の作成を支援する外国語文章作成支援装置、方法、及びプログラムに関する。
ユーザが外国語(即ち、母国語以外の言語)で文章を作成することを支援する外国語文章作成支援装置がある。従来の外国語文章作成支援装置は、ユーザが母国語で入力した文章を機械翻訳により所望の外国語に翻訳し、ユーザがその機械翻訳結果を編集するようになっている。しかしながら、機械翻訳結果がユーザの意図した文章と大きく相違する場合、ユーザが多くの修正操作を行う必要がある。さらに、ユーザに所望の外国語についてある程度の知識がある場合、機械翻訳結果を修正するのは、却ってユーザのストレスとなりうる。
特開2005−25690号公報
外国語文章作成支援装置においては、ユーザが外国語で文章をスムーズに作成できるように外国語文章の作成を支援できることが求められている。
本発明が解決しようとする課題は、ユーザが外国語で文章をスムーズに作成できるように外国語文章の作成を支援する外国語文章作成支援装置、方法、及びプログラムを提供することである。
一実施形態に係る外国語文章作成支援装置は、入力部、辞書検索部、単語列生成部、候補生成部、機械翻訳部、及び表示部を備える。入力部は、外国語の文章の入力を受け付ける。辞書検索部は、前記外国語の文章中に含まれる他言語の単語に対して辞書検索を行い、前記他言語の単語に対応する前記外国語の単語である訳語を取得する。単語列生成部は、前記訳語を含む拡張単語列を生成する。候補生成部は、前記他言語の単語を前記訳語及び前記単語列の各々に置換することによって外国語文章候補を生成する。機械翻訳部は、前記外国語文章候補を機械翻訳して機械翻訳結果を生成する。表示部は、前記外国語文章候補を前記機械翻訳結果とともに表示する。
第1の実施形態に係る外国語文章作成支援装置を概略的に示すブロック図。 図1に示した単語列生成部の一例を示すブロック図。 図1に示した単語列生成部の他の例を示すブロック図。 第1の実施形態に係る外国語文章を入力する画面を示す図。 第1の実施形態に係る外国語文章候補を表示する画面を示す図。 図1の外国語文章作成支援装置の動作を概略的に示すフローチャート。 第2の実施形態に係る外国語文章候補を表示する画面を示す図。
以下、必要に応じて図面を参照しながら、実施形態に係る外国語文章作成支援装置、方法、及びプログラムを説明する。
(第1の実施形態)
図1は、第1の実施形態に係る外国語文章作成支援装置を概略的に示している。この外国語文章作成支援装置は、ユーザが外国語で文章を作成することを支援するものである。具体的には、外国語文章作成支援装置は、図1に示されるように、外国語文章入力部101、辞書検索部102、活用訳語生成部103、単語列生成部104、候補生成部105、機械翻訳部106、候補表示部107、及び外国語文章作成支援制御部(単に制御部ともいう)108を備える。制御部108は、各部101〜107を制御する。
外国語文章入力部101は、外国語の文章の入力を受け付ける。具体的には、外国語文章入力部101は、キーボード、マウス、タッチパッドなどの入力装置を含み、ユーザが入力装置を操作して入力した外国語文章を取得する。ユーザは、作成する外国語文章の一部(例えば、単語、熟語など)がわからない場合、わからない部分を他言語(例えば母国語)の単語で記述した外国語文章を入力する。
辞書検索部102は、入力された外国語文章中に含まれる他言語単語に対して辞書検索を行い、この他言語単語に対応する外国語単語を取得する。辞書検索を行う対象となる他言語単語を検索見出し、検索語などとも呼び、辞書検索部102によって取得される他言語単語に対応する外国語単語を訳語とも呼ぶ。活用訳語生成部103は、他言語単語に活用形情報が付与されている場合、この活用形情報に従って、辞書検索部102で取得された訳語に対して活用処理を行う。活用処理された訳語を活用訳語と呼ぶ。活用形情報は、単語の品詞(例えば動詞、形容詞、副詞、名詞など)を示す情報及びその単語の活用形を指定する情報を含む。単語の活用形は、その単語が動詞の場合には、現在形、過去形などであり、形容詞の場合には、比較級、最上級などであり、名詞の場合、単数形、複数形などである。
単語列生成部104は、訳語又は活用訳語を含む拡張単語列を取得する。本実施形態の単語列生成部104は、図2Aに示すように、外国語コーパスを格納する外国語コーパス格納部202と、訳語又は活用訳語で外国語コーパス格納部202に格納されている外国語コーパスを検索して訳語又は活用訳語を含む拡張単語列を生成する外国語検索部201と、を含む。外国語コーパスとしては、Web上の外国語文書や社内外国語文書、外国語論文などの様々な文書を予め登録したものを利用することができる。本実施形態では、コーパスの種類やその検索方法、構築方法、格納方法などは既存の任意の技術を利用することができる。他の実施形態では、外国語検索部201は、図2Bに示すように、インターネット203を介してWeb検索を行って拡張単語列を生成してもよい。
候補生成部105は、外国語文章において他言語単語を訳語又は活用訳語に置換することで外国語文章候補を作成する。候補生成部105は、単語列生成部104によって拡張単語列が取得されている場合には、他言語単語を拡張単語列に置換することで外国語文章候補をさらに生成する。機械翻訳部106は、候補生成部104によって生成された外国語文章候補を機械翻訳する。候補表示部107は、外国語文章候補と対応する機械翻訳結果とを並べて表示装置に表示する。
本実施形態に係る外国語文章作成支援装置は、わからない部分を他言語で記載した外国語文章の入力を受け付け、この外国語文章に基づいて外国語文章候補を生成し、外国語文章候補を機械翻訳結果とともにユーザに提示する。これにより、ユーザが外国語文章候補の中から適切な外国語文章を選択することができ、ユーザによる外国語文章のスムーズな作成が実現される。
次に、外国語文章作成支援装置の動作を具体的に説明する。外国語及び母国語は任意の言語であってよいが、以下では、一例として外国語を英語、母国語を日本語として説明する。これは、日本人ユーザが英語で文章を作成する場合に相当する。
ここでは、具体例として、ユーザが下記日本語文章(1)に示す意味の英文を作成する場合を想定する。
「彼は東京に移動した。」 (1)
この例において、ユーザは、基本的文法、日本語単語「彼」の英訳が「He」であること、及び日本語単語「東京」の英訳が「Tokyo」であることを知っている、即ち、SV(主語(Subject) - 動詞(Verb))又はSVO(主語(Subject) - 動詞(Verb) - 目的語(Object))のように、日本語単語(動詞)「移動した」に対応する英訳(例えば、過去形の動詞又は過去形の動詞と前置詞の組み合わせ)を「He」と「Tokyo」の間に配置することを把握しているが、以下のことは知らないものとする。
・日本語単語「移動する」を英語で何というか。
・その英単語の過去形「移動した」はどのような形(活用形)にすればよいか。
従来の手法では、まず辞書検索クエリに「移動」又は「移動する」というキーワードを入力して辞書検索を行う。一般に、辞書検索結果として複数の訳語候補が得られる。ユーザは、複数の訳語候補の中から適切と思われる訳語を選択し、選択した訳語の過去形を調べる必要がある。最後に、調べた単語を用いて文章を完成させる。このような手順は非常に煩雑であり、ユーザのスムーズな英作文を阻害する。
本実施形態では、ユーザは、外国語文章入力部101に下記文章(2)に示すような英文を入力する。図3は、外国語文章の入力画面の一例であって、文章(2)が入力された画面を示す。
He ido<-v_pst Tokyo. (2)
即ち、ユーザは、日本語単語「移動した」に対応する英訳を入れるべき場所に、日本語単語「移動」のローマ字読み“ido”を検索見出しとして配置する。文章(2)では、検索見出し“ido”に活用形情報“<-v_pst”が付与されている。活用形情報“<-v_pst”は、検索見出し“ido”が動詞であり、それを過去形(pstはpastの略である。)に活用させることを示す。なお、活用形情報は、文章(2)に示される表記法の例に限らず、ユーザがその単語をどのような活用形にしたいかを通知できればいかなる表記法であってもよい。
なお、図3並びに文章(2)及び下記文章(3)から(6)では、下線は、検索見出し及び活用形情報を強調するために便宜的に付しているものであって、ユーザが入力したものではない。
制御部108は、外国語文章入力部101への上記文章(2)の入力を検出すると、ユーザの英作文を支援するために、以下のように、辞書検索部102、活用訳語生成部103、単語列生成部104、候補生成部105、機械翻訳部106、及び候補表示部107を制御する。
辞書検索部102は、“ido<-v_pst”から検索見出し“ido”を取り出し、この検索見出し“ido”に対して辞書検索を行う。
なお、ここでは、検索見出しとして“ido”が入力された場合を想定しているが、下記文章(3)〜(6)に示すような入力であってもよい。
He いどう<-v_pst Tokyo. (3)
He 移動<-v_pst Tokyo. (4)
He 移動する<-pst Tokyo. (5)
He 移動した Tokyo. (6)
文章(3)は、検索見出しを平仮名で入力する例である。文章(4)から(6)は、漢字を用いて検索見出しを入力する例である。文章(5)では、検索見出しが「移動する」であり、形態素解析によりそれが動詞であると判断することが可能であるので、活用形情報として、検索見出しが動詞であることを示す情報を省略して、過去形に活用させることを指定する情報“<-pst”が付与されている。文章(6)では、検索見出しが「移動した」であり、形態素解析によりそれが動詞の過去形であると判断することが可能であるので、活用形情報が省略されている。このように検索見出しから品詞及び活用形が判断できる場合には、活用形情報を明示的に付さなくてもよい。品詞及び活用形を判断できるように検索見出しを記述することは活用形情報を付すことと実質的に同じ意味である。このような場合には、例えば、活用訳語生成部103又は制御部108が形態素解析を行って検索見出しから品詞及び活用形を判断する。
辞書検索部102が使用する辞書は、検索見出しの入力形態(例えば、平仮名、漢字、ローマ字)に対応していて、検索見出しに対応する訳語を検索可能であればいかなるものであってもよい。
ここでは、辞書検索部102は、検索見出し“ido”に対する辞書検索の結果として、以下の2つの訳語を取得したとする。
move (移動)
transfer (異動)
次に、活用訳語生成部103は、活用形情報“<-v_pst”に従ってこれらの語を過去形にして、以下の2つの活用訳語を生成する。
moved
transferred
入力文字列“ido<-v_pst”を“moved”及び“transferred”に置換することによって、下記文章(7)及び(8)に示すような英語文章が作成される。
He moved Tokyo. (7)
He transferred Tokyo. (8)
文章(7)及び(8)は文法的には正しいが、ユーザが意図した文章(1)の意味にはなっていない。このように、単語を辞書で調べて適切な活用形とした後、その単語を単純に置換するだけでは所望の文章が得られない場合がある。
単語列生成部104(具体的には外国語検索部201)は、動詞“moved”を含む単語列の外国語コーパスでのn−gramを調べ、動詞“moved”に接続可能な語を取得する。さらに、単語列生成部104は、動詞“transferred”を含む単語列の外国語コーパスでのn−gramを調べ、動詞“transferred”に接続可能な語を取得する。接続可能な語としては、英語の場合には前置詞などが考えられる。単語列生成部104は、外国語コーパスから“moved”及び“transferred”と隣接する前置詞を取得し、取得した前置詞を“moved”及び“transferred”と連結することで、拡張単語列を生成する。ここでは、“moved”に対するコーパス検索の結果として前置詞“to”が得られ、“transferred”に対するコーパス検索の結果として前置詞“to”及び“away from”が得られたとする。それにより、3つの拡張単語列“moved to”、“transferred to”、“transferred away from”が生成される。
候補生成部105は、入力文字列“ido<-v_pst”を活用訳語生成部103で生成された活用訳語及び単語列生成部104で生成された拡張単語列に置換することで、下記文章(9)から(13)に示す英文候補を生成する。
He moved Tokyo. (9)
He transferred Tokyo. (10)
He moved to Tokyo. (11)
He transferred to Tokyo. (12)
He moved away from Tokyo. (13)
続いて、機械翻訳部106は、英文候補(9)〜(13)それぞれを機械翻訳して、下記文章(14)から(18)に示すように、対応する日本語訳文を生成する。
He moved Tokyo. 彼は東京を移動させました。 (14)
He transferred Tokyo. 彼は東京を転送しました。 (15)
He moved to Tokyo. 彼は東京に移動しました。 (16)
He transferred to Tokyo. 彼は東京に移りました。 (17)
He moved away from Tokyo. 彼は東京から立ち去りました。 (18)
候補表示部107は、図4に示すように、英文候補を対応する機械翻訳結果(日本語訳文)と並べて表示装置に表示する。英文候補の表示順に関しては、コーパスでの頻度に基づいてオーダリングを行い、頻出表現順に表示してもよい。
ユーザは、表示装置に表示された英文候補及び対応する日本語訳文を見て、それらの中から適切な英文を選択する。この例では、文章(16)が選択される。一例では、ユーザが入力装置を用いて英文候補(14)〜(18)から適切な英文を選択すると、入力文章が選択された英文に自動的に置換される。文章(16)に含まれる前置詞“to”は、ユーザが意図して入力した前置詞ではなく、本実施形態の外国語文章作成支援装置によって推定された前置詞である。本実施形態では、英文候補をそれらに対応する日本語訳文とともにユーザに提示することにより、文法的には合っていたとしても、ユーザが意図していない意味の外国語文章を作成してしまうことを抑制することができる。
このようにして本実施形態に係る外国語文章作成支援装置は、わからない部分を日本語単語で記載した英文をユーザから受け付けると、1以上の英文候補を機械翻訳結果(日本語訳文)とともにユーザに提示する。これにより、ユーザは所望の英文を簡単に選択することができる。このように入力及び選択といった少ない操作によって所望の英文を作成することが可能であり、即ち、スムーズな英作文の支援を実現できる。
図5は、外国語文章作成支援装置が実行する処理の手順を概略的に示している。図5のステップS501では、外国語文章入力部101は、ユーザからの英語文章(英文)の入力を受け付ける。ステップS502では、制御部108は、入力された英文中に日本語の単語が含まれている否かを判断する。日本語単語が含まれていない場合、ステップS501に戻り、外国語文章入力部101が次の英文の入力を受け付ける。英文中に日本語単語が含まれている場合、ステップS503に進む。
ステップS503では、辞書検索部102は、英文中に含まれる日本語単語を検索見出しとして辞書検索を行い、日本語単語に対応する1以上の訳語を取得する。ここでは、説明を簡単にするために、辞書検索部102で取得された訳語(例えば動詞)が1つであるとする。ステップS504では、制御部108は、日本語単語に活用形情報が付与されているか否かを判断する。活用形情報が付与されている場合、ステップS505に進み、活用形情報が付与されていない場合、ステップS506に進む。
ステップS505では、活用訳語生成部103は、活用形情報に従ってステップS503で取得された訳語を活用させて活用訳語を生成する。ステップS506では、単語列生成部104は、ステップS503で取得された訳語又はステップS505で取得された活用訳語に対してコーパス検索を行い、この訳語に接続可能な語を取得する。より詳細には、単語列生成部104は、ステップS505で活用訳語が得られた場合にこの活用訳語に対してコーパス検索を行い、ステップS505で活用訳語が得られない場合にステップS503で取得された訳語に対してコーパス検索を行う。ステップS507では、制御部108は、ステップS506で取得された接続可能な語の中に前置詞があるか否かを判断する。前置詞がある場合には、ステップS508に進み、前置詞がない場合には、ステップS509に進む。ステップS508では、単語列生成部104は、訳語と前置詞を組み合わせである拡張単語列を生成する。なお、検索見出しが名詞である場合には、単語列生成部104は、訳語に定冠詞を補う処理などを行う。
ステップS509では、候補生成部105は、日本語単語をステップS503で取得された訳語又はステップS505で生成された活用訳語に置換した英文候補を生成する。さらに、候補生成部105は、日本語単語をステップS508で生成された単語列に置換した英文候補を生成する。ステップS510では、機械翻訳部106は、英文候補に対して機械翻訳を行う。ステップS511では、候補表示部107は、英文候補をそれらに対応する機械翻訳結果とともに表示装置に表示する。このようにして、本実施形態に係る外国語文章作成支援装置はユーザの英作文を支援する。
以上のように、本実施形態に係る外国語文章作成支援装置は、少なくとも一部に母国語単語を含む外国語文章を受け取ると、この母国語言語を対応する訳語及びこの訳語を含む拡張単語列に置き換えた外国語文章候補を作成し、作成した外国語文章候補を機械翻訳結果とともにユーザに提示する。これにより、ユーザは所望の外国語文章を簡単に選択することができ、ユーザによる外国語文章のスムーズな作成を実現することができる。
(第2の実施形態)
第2の実施形態に係る外国語文章作成支援装置は、図1に示される外国語文章作成支援装置と同様の構成を有する。本実施形態では、外国語コーパスには特定分野の英語文書が登録されている。
ここでは、具体例として、ユーザが下記日本語文章(19)に示す意味の英文を作成する場合を想定する。
「広告は番組作りに関係している。」 (19)
この例において、ユーザがわからない単語は「関係している」という形容詞であるとする。より詳細には、ユーザは、基本的文法SVC(主語(Subject) - 動詞(Verb) - 補語(Complement))、動詞が「is」であること、日本語単語「広告」の英訳が「advertisement」であること、及び日本語単語「番組作り」の英訳が「programming」であることを知っているが、以下のことは知らないものとする。
・日本語単語「関係している」を英語で何というか。
この場合、ユーザは、外国語文章入力部101に、例えば下記文章(20)に示すような英文を入力する。
The advertisement is 関係している programming. (20)
ここでは、ユーザが調べたい単語(形容詞)が日本語で入力されている。文章(20)に関して、本実施形態に係る外国語文章作成支援装置は、以下のようにユーザの英作文を支援する。
まず、辞書検索部102は、日本語単語(形容詞)「関係している」に対して辞書検索を行う。ここでは、辞書検索結果として以下の3つの訳語が取得されたとする。
related
relevant
associated
単語列生成部104は、これらの訳語に対して外国語コーパスを検索し、これらの訳語に接続可能な語を取得する。続いて、単語列生成部104は、各訳語にそれに対応する接続可能な語を連結若しくは補完した拡張単語列を生成する。一例では、“related”に対するコーパス検索の結果として前置詞“to”が得られ、“relevant”に対するコーパス検索の結果として前置詞“to”が得られ、“associated”に対するコーパス検索の結果として前置詞“with”が得られ、それにより、3つの拡張単語列“related to”、“relevant to”、“associated with”が生成される。
候補生成部105は、入力文字列「関係している」を辞書検索部102で取得された訳語及び単語列生成部104で生成された単語列に置換して英文候補を生成する。この例では、下記文章(21)〜(26)に示す英文候補が生成される。
The advertisement is associated programming. (21)
The advertisement is related programming. (22)
The advertisement is related to programming. (23)
The advertisement is associated with programming. (24)
The advertisement is relevant programming. (25)
The advertisement is relevant to programming. (26)
本実施形態では、訳語“related”、“relevant”、“associated”及び拡張単語列“related to”、“relevant to”、“associated with”に関して外国語コーパスでの出現頻度が多い順にオーダリングを行い、英文候補の表示順を決定する。外国語コーパスに特定分野の英文を登録しているので、その分野においてよく使われる表現が優先して提示される。
生成される英文候補は、ユーザが予め登録している外国語コーパスの内容によって変わる。例えば、特定分野の英文を外国語コーパスに登録している場合、外国語コーパス中に“related to”及び“relevant to”が存在しているが、“associated”が存在しないことがある。この場合、“associated”に接続可能な語(“with”)は取得されず、そのため単語列“associated with”は生成されない。即ち、文章(24)に示す文章候補は生成されない。
外国語コーパス中に“associated”が存在しない場合、候補表示部107は、図6に示すように、機械翻訳部106による機械翻訳結果と併せて5つの英文候補を表示装置に表示する。例えば、英文(21)は文法的に正しいため、機械翻訳による翻訳が成功しているが、この英文はユーザが意図した意味と相違することが機械翻訳結果から明らかである。
以上のように、第2の実施形態によれば、第1の実施形態と同様の効果が得られるとともに、外国語コーパスに特定分野の外国語文章を登録し、その分野においてよく使われる表現を優先してユーザに提示することにより、ユーザがその分野に適した英文を作成することが可能になり、さらに、単純な辞書引きだけでは抑制できない文法誤り、意味誤りも抑制することが可能になる。
(変形例)
上記各実施形態の変形例に係る外国語文章作成支援装置を説明する。各実施形態では、辞書検索部102は、入力された外国語文章中に含まれる他言語単語に対応する外国語単語を訳語として取得している。これに対し、変形例では、辞書検索部102は、入力された外国語文章中に含まれる他言語単語に対応する外国語単語とともに、その外国語単語を含む熟語(イディオム)を訳語として取得する。第2の実施形態で説明した例を用いると、変形例に係る辞書検索部102は、単語“related”及び熟語“related to”を訳語として取得する。訳語“related to”は単語列生成部104で生成される拡張単語列に相当する。従って、辞書検索部102が単語及びその単語を含むイディオムを訳語として取得する場合には、単語列生成部104を省略することもできる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した音声翻訳装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RWなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の音声翻訳装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
101…外国語文章入力部、102…単語検索部、103…活用訳語生成部、104…単語列生成部、105…候補生成部、106…機械翻訳部、107…候補表示部、108…外国語文章作成支援制御部、201…外国語検索部、202…外国語コーパス格納部、203…インターネット。

Claims (7)

  1. 外国語の文章の入力を受け付ける入力部と、
    前記外国語の文章中に含まれる他言語の単語に対して辞書検索を行い、前記他言語の単語に対応する前記外国語の単語である訳語を取得する辞書検索部と、
    前記訳語を含む拡張単語列を生成する単語列生成部と、
    前記他言語の単語を前記訳語及び前記単語列の各々に置換することによって外国語文章候補を生成する候補生成部と、
    前記外国語文章候補を機械翻訳して機械翻訳結果を生成する機械翻訳部と、
    前記外国語文章候補を前記機械翻訳結果とともに表示する表示部と、
    を具備する外国語文章作成支援装置。
  2. 前記他言語の単語に活用形を指定する活用形情報が付与されている場合に、該活用形情報に従って前記訳語を活用させて活用訳語を生成する活用訳語生成部をさらに具備し、
    前記候補生成部は、前記他言語の単語を前記活用訳語及び前記単語列の各々に置換することによって外国語文章候補を生成する、請求項1に記載の外国語文章作成支援装置。
  3. 前記単語列生成部は、外国語コーパスを格納する格納部と、前記訳語で前記外国語コーパスを検索して前記訳語に接続可能な語を取得し、前記接続可能な語を前記訳語に連結することで前記拡張単語列を生成する外国語検索部と、を備える請求項1に記載の外国語文章作成支援装置。
  4. 前記候補生成部は、前記外国語コーパスにおける出現頻度に基づいて前記訳語及び前記拡張単語列の表示順を決定する、請求項3に記載の外国語文章作成支援装置。
  5. 前記拡張単語列は、前記訳語に前置詞を補完したものである、請求項1に記載の外国語文章作成支援装置。
  6. 外国語の文章の入力を受け付けることと、
    前記外国語の文章中に含まれる他言語の単語に対して辞書検索を行い、前記他言語の単語に対応する前記外国語の単語である訳語を取得することと、
    前記訳語を含む拡張単語列を生成することと、
    前記他言語の単語を前記訳語及び前記単語列の各々に置換することによって外国語文章候補を生成することと、
    前記外国語文章候補を機械翻訳して機械翻訳結果を生成することと、
    前記外国語文章候補を前記機械翻訳結果とともに表示することと、
    を具備する外国語文章作成支援方法。
  7. コンピュータを、
    外国語の文章の入力を受け付ける入力手段と、
    前記外国語の文章中に含まれる他言語の単語に対して辞書検索を行い、前記他言語の単語に対応する前記外国語の単語である訳語を取得する辞書検索手段と、
    前記訳語を含む拡張単語列を生成する単語列生成手段と、
    前記他言語の単語を前記訳語及び前記単語列の各々に置換することによって外国語文章候補を生成する候補生成手段と、
    前記外国語文章候補を機械翻訳して機械翻訳結果を生成する機械翻訳手段と、
    前記外国語文章候補を前記機械翻訳結果とともに表示する表示手段として機能させるための外国語文章作成支援プログラム。
JP2012262297A 2012-11-30 2012-11-30 外国語文章作成支援装置、方法、及びプログラム Expired - Fee Related JP6096489B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012262297A JP6096489B2 (ja) 2012-11-30 2012-11-30 外国語文章作成支援装置、方法、及びプログラム
US14/089,231 US20140156258A1 (en) 2012-11-30 2013-11-25 Foreign language writing support apparatus and method
CN201310629795.8A CN103853813A (zh) 2012-11-30 2013-11-29 外语文章写作辅助装置、方法及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012262297A JP6096489B2 (ja) 2012-11-30 2012-11-30 外国語文章作成支援装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014109791A true JP2014109791A (ja) 2014-06-12
JP6096489B2 JP6096489B2 (ja) 2017-03-15

Family

ID=50826277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012262297A Expired - Fee Related JP6096489B2 (ja) 2012-11-30 2012-11-30 外国語文章作成支援装置、方法、及びプログラム

Country Status (3)

Country Link
US (1) US20140156258A1 (ja)
JP (1) JP6096489B2 (ja)
CN (1) CN103853813A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10394961B2 (en) 2014-11-04 2019-08-27 Kabushiki Kaisha Toshiba Foreign language sentence creation support apparatus, method, and program

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014075073A (ja) * 2012-10-05 2014-04-24 Fuji Xerox Co Ltd 翻訳処理装置及びプログラム
WO2014130132A2 (en) * 2012-12-06 2014-08-28 Raytheon Bbn Technologies Corp. Active error detection and resolution for linguistic translation
US10693962B1 (en) * 2015-12-18 2020-06-23 EMC IP Holding Company LLC Language and mechanism for modeling and exporting storage platform topologies, attributes, and behaviors
US10346548B1 (en) * 2016-09-26 2019-07-09 Lilt, Inc. Apparatus and method for prefix-constrained decoding in a neural machine translation system
TWI613554B (zh) * 2017-03-24 2018-02-01 Zhuang Shi Cheng 翻譯輔助系統
EP3567495A1 (en) * 2018-05-11 2019-11-13 AbbType Ltd. Method of abbreviated typing and compression of texts written in languages using alphabetic scripts
KR20210048569A (ko) * 2018-08-29 2021-05-03 주식회사 아이팩토리 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
CN109284349A (zh) * 2018-09-27 2019-01-29 中国矿业大学(北京) 专业性外文书写辅助系统
CN109582982A (zh) * 2018-12-17 2019-04-05 北京百度网讯科技有限公司 用于翻译语音的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62208168A (ja) * 1986-03-10 1987-09-12 Ricoh Co Ltd 翻訳装置
JPH0383161A (ja) * 1989-08-25 1991-04-09 Fujitsu Sooshiaru Sci Lab:Kk 文書作成処理装置
JP2004516527A (ja) * 2000-04-24 2004-06-03 マイクロソフト コーポレイション クロス言語ライティングウィザードを伴うコンピュータ支援ライティングのシステムおよび方法
JP2005157412A (ja) * 2003-11-20 2005-06-16 Brother Ind Ltd 機械翻訳装置及び、プログラム、記録媒体
JP2007073054A (ja) * 2005-09-08 2007-03-22 Fujitsu Ltd 対訳語句提示プログラム、対訳語句提示方法および対訳語句提示装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999916B2 (en) * 2001-04-20 2006-02-14 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
FR2914079B1 (fr) * 2007-03-20 2009-06-26 Commissariat Energie Atomique Procede de traduction automatique
JP5791861B2 (ja) * 2008-07-25 2015-10-07 シャープ株式会社 情報処理装置および情報処理方法
US8296125B2 (en) * 2008-10-17 2012-10-23 International Business Machines Corporation Translating source locale input string to target locale output string
JP2011044023A (ja) * 2009-08-21 2011-03-03 Sharp Corp 情報処理装置、表示制御方法、およびプログラム
KR101301536B1 (ko) * 2009-12-11 2013-09-04 한국전자통신연구원 외국어 작문 서비스 방법 및 시스템
US9031829B2 (en) * 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62208168A (ja) * 1986-03-10 1987-09-12 Ricoh Co Ltd 翻訳装置
JPH0383161A (ja) * 1989-08-25 1991-04-09 Fujitsu Sooshiaru Sci Lab:Kk 文書作成処理装置
JP2004516527A (ja) * 2000-04-24 2004-06-03 マイクロソフト コーポレイション クロス言語ライティングウィザードを伴うコンピュータ支援ライティングのシステムおよび方法
JP2005157412A (ja) * 2003-11-20 2005-06-16 Brother Ind Ltd 機械翻訳装置及び、プログラム、記録媒体
JP2007073054A (ja) * 2005-09-08 2007-03-22 Fujitsu Ltd 対訳語句提示プログラム、対訳語句提示方法および対訳語句提示装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
中尾 孔一 外2名: "大規模コーパスに基づく文脈可変型日英訳語選択", 言語処理学会第13回年次大会発表論文集, JPN6016027178, 19 March 2007 (2007-03-19), US, pages 195 - 198, ISSN: 0003359477 *
佐藤 学 外2名: "検索エンジンを利用した英作文支援システムの構築", 言語処理学会第12回年次大会発表論文集, JPN6016027181, 13 March 2006 (2006-03-13), JP, pages 664 - 667, ISSN: 0003478471 *
大鹿 広憲 外3名: "Googleを活用した英作文支援システムの構築", DEWS2005論文集 [ONLINE], JPN6016027180, 2 May 2005 (2005-05-02), JP, pages 2005 - 4, ISSN: 0003478470 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10394961B2 (en) 2014-11-04 2019-08-27 Kabushiki Kaisha Toshiba Foreign language sentence creation support apparatus, method, and program

Also Published As

Publication number Publication date
CN103853813A (zh) 2014-06-11
US20140156258A1 (en) 2014-06-05
JP6096489B2 (ja) 2017-03-15

Similar Documents

Publication Publication Date Title
JP6096489B2 (ja) 外国語文章作成支援装置、方法、及びプログラム
JP6671027B2 (ja) 換言文生成方法、該装置および該プログラム
JP2014078132A (ja) 機械翻訳装置、方法およびプログラム
US20120136647A1 (en) Machine translation apparatus and non-transitory computer readable medium
US7801722B2 (en) Techniques for customization of phonetic schemes
JP6466138B2 (ja) 外国語文作成支援装置、方法及びプログラム
JP2009140466A (ja) 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
Kieraś et al. Morphosyntactic annotation of historical texts. The making of the baroque corpus of Polish
JP2004220616A (ja) 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置
Duszkin et al. New parallel corpora of Baltic and Slavic languages—Assumptions of corpus construction
Petran et al. ReM: A reference corpus of Middle High German--corpus compilation, annotation, and access
Rabus et al. Linguistic Analysis of Church Slavonic Documents: A Mixed-Methods Approach
Gromann et al. A cross-lingual correcting and completive method for multilingual ontology labels
Alosaimy et al. Web-based annotation tool for inflectional language resources
WO2009144890A1 (ja) 翻訳前換言規則生成システム
JP2007072594A (ja) 翻訳装置、翻訳方法および翻訳プログラム、媒体
Iqbal et al. Translational Style: A Corpus-Based Comparative Analysis of English Translations of Urdu Fiction by Memon and Naqvi
JP5632213B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Ping Dialect, voice, and identity in Chinese translation: a descriptive study of Chinese translations of Huckleberry Finn, Tess, and Pygmalion: by Jing Yu, London, Routledge, 2024, 234 pp.,£ 35.99 (eBook), ISBN 9781003184102
JP5039114B2 (ja) 機械翻訳装置及びプログラム
JP2008059600A (ja) 文書処理装置、文書処理方法、および、文書処理プログラム
Janssen Pos tagging and less resources languages individuated features in corpuswiki
JP2009075748A (ja) 機械翻訳装置及びプログラム
JP2013196493A (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2006011842A (ja) 翻訳装置および翻訳プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170216

R151 Written notification of patent or utility model registration

Ref document number: 6096489

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees