JP2016091269A - 外国語文作成支援装置、方法及びプログラム - Google Patents

外国語文作成支援装置、方法及びプログラム Download PDF

Info

Publication number
JP2016091269A
JP2016091269A JP2014224518A JP2014224518A JP2016091269A JP 2016091269 A JP2016091269 A JP 2016091269A JP 2014224518 A JP2014224518 A JP 2014224518A JP 2014224518 A JP2014224518 A JP 2014224518A JP 2016091269 A JP2016091269 A JP 2016091269A
Authority
JP
Japan
Prior art keywords
sentence
language
search query
input
foreign language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014224518A
Other languages
English (en)
Other versions
JP6466138B2 (ja
Inventor
国威 祖
Guowei Zu
国威 祖
敏行 加納
Toshiyuki Kano
敏行 加納
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2014224518A priority Critical patent/JP6466138B2/ja
Priority to TW104134199A priority patent/TWI588668B/zh
Priority to US14/927,720 priority patent/US10394961B2/en
Priority to CN201510726952.6A priority patent/CN105573990B/zh
Publication of JP2016091269A publication Critical patent/JP2016091269A/ja
Application granted granted Critical
Publication of JP6466138B2 publication Critical patent/JP6466138B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 外国語の文を作成する際の負担を軽減する。【解決手段】 実施形態の記憶手段は、外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国との例文に対応する索引とを含む例文コーパスを記憶する。入力手段は、第1の文に対応する母国語の第2の文である入力文の入力を受け付ける。言語解析実施手段は、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する。文法特徴抽出手段は、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する。検索クエリ生成手段は、前記抽出された文法特徴に基づき、検索クエリを生成する。出力手段は、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する。【選択図】図2

Description

本発明の実施形態は、外国語文作成支援装置、方法及びプログラムに関する。
オフショア開発等の開発現場では、外国語文を作成することがしばしば要求される。外国語の文法知識が不十分な書き手が外国語文を作成する場合、大きく2通りの状況がある。1つ目は、書き手の母国語文を作成し、これを元に所望の外国語文を作成する状況であり、2つ目は、書き手が文法上不完全な外国語文を作成し、これを元に所望の外国語文を作成する状況である。いずれの状況においても、書き手の負担を低減し、効率的に外国語文を作成するために、外国語文の作成を支援する方法が必要とされている。
この種の外国語文作成支援方法としては、例えば、機械翻訳、単語帳、対訳例文データベース又は類似度を用いた手法が知られている。
ここで、機械翻訳を用いた手法は、書き手の母国語で入力した母国語文を機械翻訳により外国語に翻訳することで、外国語文を生成可能となっている。
単語帳を用いた手法は、外国語単語が分からない場合、母国語の単語帳を検索して訳語を出力することによって外国語単語を得ることが可能となっている。
対訳例文データベースを用いた手法は、母国語の単語を入力すると対訳辞書及び類似語辞書を用いた対訳例文データベースを検索し、対応する訳語、及び訳語が含まれる例文を出力可能となっている。
類似度を用いた手法は、入力文と検索対象の例文との単語間の類似度を比較し、類似度が高い例文を出力可能となっている。
特開平7−141382号公報 特開2014−109791号公報 特開2003−6191号公報 特開2000−259627号公報
しかしながら、従来の外国語文作成支援方法は、いずれの手法も書き手の負担が大きいという不都合がある。
例えば、機械翻訳を用いた手法は、機械翻訳結果が必ずしも書き手が意図した文章であるとは限らないので、所望の外国語文を作成するまでに多くの修正操作を要する可能性がある。
単語帳を用いた手法は、得られた外国語単語から外国語文を作成できないか、又は外国語文を作成するための負担が大きい。
対訳例文データベースを用いた手法は、意図しない文法表現を用いた例文まで検索されてしまい、意図した文法表現を用いた例文を絞り込むのに負担がかかる。また、対訳例文データベースを用いた手法は、文法上不完全な外国語文を入力として、完全な外国語文を作成するような場合に適用できない。
類似度を用いた手法は、単語間の類似度によって例文を検索するので、意図しない例文が含まれる可能性があり、意図した例文を絞り込むのに負担がかかる。
即ち、従来の外国語文作成支援方法では、書き手が意図した外国語文を作成する際の負担が大きい。
本発明が解決しようとする課題は、外国語の文を作成する際の負担を軽減し得る外国語文作成支援装置、方法及びプログラムを提供することである。
実施形態の外国語文作成支援装置は、少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する。
前記外国語文作成支援装置は、記憶手段と、入力手段と、言語解析実施手段と、文法特徴抽出手段と、検索クエリ作成手段と、出力手段とを備えている。
前記記憶手段は、前記外国語の例部の予備前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する。
前記入力手段は、前記第1の文に対応する母国語の第2の文である入力文の入力を受け付ける。
前記言語解析実施手段は、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する。
前記文法特徴抽出手段は、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する。
前記検索クエリ生成手段は、前記抽出された文法特徴に基づき、検索クエリを生成する。
前記出力手段は、前記生成された検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する。
第1の実施形態に係る外国語文作成支援装置のハードウェア構成を示すブロック図である。 同実施形態における外国語文作成支援装置の構成例を示すブロック図である。 同実施形態における文法特徴情報の一例を示す模式図である。 同実施形態における文法特徴情報の一例を示す模式図である。 同実施形態における例文コーパスの一例を示す模式図である。 同実施形態における動作を説明するためのフローチャートである。 同実施形態における形態素解析結果の一例を示す模式図である。 同実施形態における構文解析結果の一例を示す模式図である。 同実施形態における文法特徴の一例を示す模式図である。 同実施形態における検索クエリの一例を示す模式図である。 同実施形態における出力文の一例を示す模式図である。 同実施形態における形態素解析結果の一例を示す模式図である。 同実施形態における文法特徴の一例を示す模式図である。 同実施形態における検索クエリの一例を示す模式図である。 同実施形態における出力文の一例を示す模式図である。 第2の実施形態に係る外国語文作成支援装置の構成例を示す模式図である。 同実施形態における意味属性情報の一例を示す模式図である。 同実施形態における例文コーパスの一例を示す模式図である。 同実施形態における動作を説明するためのフローチャートである。 同実施形態における形態素解析結果の一例を示す模式図である。 同実施形態における文法特徴の一例を示す模式図である。 同実施形態における検索クエリの一例を示す模式図である。 同実施形態における検索クエリの一例を示す模式図である。 同実施形態における出力文の一例を示す模式図である。
以下、いくつかの実施形態について図面を参照して説明する。なお、各実施形態の外国語文作成支援装置は、スタンドアロンのユーザ端末として実施してもよく、クライアントサーバシステムにおけるサーバ装置として実施してもよい。また、各実施形態の外国語文作成支援装置は、プライベートクラウド又はパブリッククラウド等のクラウドコンピューティングシステムにおいて、低負荷時に選択される複数台の処理実行装置の各々として実施してもよい。
(第1の実施形態)
図1は、第1の実施形態に係る外国語文作成支援装置のハードウェア構成の一例を示す模式図である。この外国語文作成支援装置1は、コンピュータ10と、外部記憶装置20とを備えている。コンピュータ10は、例えばハードディスクドライブ(HDD:Hard Disk Drive)のような外部記憶装置20と接続されている。外部記憶装置20は、コンピュータ10によって実行されるプログラム21を記憶する。
第1の実施形態に係る外国語文作成支援装置1は、少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する機能を有する。なお、各実施形態の外国語文作成支援装置1のユーザとしては、例文を用いずに文法上完全な外国語文を作成する作文能力には至らないものの、適切な例文を選択して文法上完全な外国語文を作成できる作文能力を有する者を主なユーザとして想定する。但し、各実施形態の外国語文作成支援装置1は、当該主なユーザに限らず、不完全な外国語文を作成できる程度の作文能力を有する任意のユーザに対して適用可能となっている。
外国語文作成支援装置1は、具体的には図2に示すように、文法特徴情報記憶部31と、例文コーパス記憶部32と、入力部33と、言語解析部34と、文法特徴抽出部35と、検索クエリ生成部36と、例文検索部37と、出力部38とを備えている。各部31〜38は、コンピュータ10が外部記憶装置20に記憶されているプログラム(外国語文作成支援プログラム)21を実行することにより実現されるものとする。プログラム21は、コンピュータ読取可能な記憶媒体に予め記憶された形態で頒布可能となっている。また、プログラム21は、例えばネットワークを介してコンピュータ10にダウンロードされても構わない。また、文法特徴情報記憶部31及び例文コーパス記憶部32は、例えば外部記憶装置20内に実装されているが、コンピュータ10のメモリ(図示せず)内に書込んで実装されてもよい。
文法特徴情報記憶部31は、読出し/書込み可能なメモリであり、図3及び図4に示す如き、見出し単語に対して、品詞、文法属性、文法パターン、同義語、及び自他動詞ペア等を含む文法特徴が関連付けられた文法特徴情報31a,31bが予め記憶されている。文法特徴情報31aは、中国語に対する文法特徴情報の一例であり、文法特徴情報31bは、日本語に対する文法特徴情報の一例である。なお、文法特徴情報記憶部31は、中国語と日本語とに限らず、任意の言語種に対する文法特徴情報が記憶されていてもよい。また、文法特徴情報記憶部31は、文法特徴抽出部35及び検索クエリ生成部36からの読出しに応じて、指定された言語種の文法特徴情報31a,31bを文法特徴抽出部35及び検索クエリ生成部36に送信する。
ここで、見出し単語は、動詞や形容詞等の用言と、助詞や助動詞等の機能語とを含む単語の総称である。品詞は、見出し単語の品詞を表す情報である。文法属性は、見出し単語の文法用法を表す情報であり、例えば、見出し単語の品詞が動詞の場合、自動詞であるか、又は他動詞であるかを表す。また、文法属性は、見出し単語の品詞が機能語の場合、その機能語が用いられる文型(使役型、受動型又は仮定形等)を表す。文法パターンは、見出し単語が文法用途を果たす場合の典型的な文法のフォーマットを示す情報である。また、同義語は、見出し単語の意味と同じ又は類似する意味を有する単語を表す情報である。自他動詞ペアは、見出し単語の文法属性が自動詞又は他動詞の場合、見出し単語の動詞に対して対になる他動詞又は自動詞を表す情報である。
例えば、図4に示すように、見出し単語が「増える」の場合、品詞には「動詞」が記憶され、文法属性には「自動詞」が記憶され、文法パターンには「増える」が典型的に使用される用法として、「名詞−が−増える」といった情報が記憶される。また、同義語には「増える」と類似する意味を有する「増加する」が記憶され、自他動詞ペアには「増える」に対応する他動詞として「増やす」が記憶される。
なお、文法特徴情報31a,31bは、記憶される言語種特有の項目を含んでいてもよい。例えば、中国語と日本語とに着目した場合、文法特徴情報31bに含まれる自他動詞ペアの項目は、日本語に特有の項目である。
例文コーパス記憶部32は、読出し/書込み可能なメモリであり、図5に示す如き、例文コーパス32aが記憶されている。例文コーパス32aは、中国語の例文及び当該例文に対応する日本語の例文を含む例文集と、当該中国語及び日本語の例文に対応する索引とを含む。例文コーパス32aは、任意の数の言語種に対応する対訳例文の組を含む例文集と、当該例文の組の言語種のそれぞれに対応する索引とを含んでもよい。索引としては、例えば、例文の文法パターンを示す情報が使用可能となっている。例文の文法パターンを示す情報としては、例えば、例文の対象単語と、例文の助詞と、例文の対象単語及び助詞以外の単語の文法用語(品詞、文法役割等)とを組み合わせて例文の構成を表す情報が使用可能となっている。
この種の索引としては、対象単語が動詞の場合、例えば、例文の形態素解析結果に基づき、例文に含まれる体言を品詞に置換した情報が使用可能となっている。補足すると、当該置換した情報としては、例文の具体的な体言(具体的な名詞、代名詞等)に代えて、当該体言の品詞(名詞、名詞節又は代名詞等)を記述した情報が使用可能となっている。なお、例文の形態素解析結果に基づく情報は、例文内の名詞節にまとめられる部分を1つの名詞節として表してもよい。
また、索引としては、対象単語が動詞の場合、例えば、例文の構文解析結果に基づき、例文に含まれる体言を文法役割に置換した情報が使用可能となっている。補足すると、当該置換した情報としては、例文の具体的な体言(具体的に名詞、代名詞等)に代えて、当該体言の文法役割(目的語、対象語等)を記述した情報が使用可能となっている。なお、例文の構文解析結果に基づく情報は、例文内の名詞節にまとめられる部分を1つの文法役割として表してもよい。
例文コーパス記憶部32は、例文検索部37からの読出しに応じて、例文コーパス32aを例文検索部37に送信する。
入力部33は、例えばキーボード又はマウス(図示せず)等に対するユーザの操作に応じて、当該ユーザからの指示又は文の入力を受け付ける。例えば、入力部33は、第1の文に対応する母国語の第2の文である入力文の入力、又は外国語の第3の文である入力文の入力を受け付ける機能を持っている。なお、外国語の第3の文は、例えばユーザによって指定された評価対象となる文である。なお、外国語の第3の文は、文法上完全な文であってもよく、文法上不完全な文であってもよい。また、入力部33は、入力を受け付けた入力文に対して出力部38から出力される文(以下、出力文と言う。)の言語種を指定する入力を更に受け付ける。入力部33は、入力文と、出力文の言語種とを言語解析部34に送信する。また、入力部33は、出力文の言語種を例文検索部37に送信する。
ここで、入力文は、少なくとも自立語(例えば、名詞や動詞等)を含む複数の文節から構成される。なお、当該入力文を構成する文節には、自立語以外に付属語(例えば、助詞や助動詞等)が含まれていてもよい。また、入力文の言語種は、ユーザにとっての母国語であっても、外国語であってもよい。なお、以下の説明では、ユーザにとっての母国語が、例えば外国語文作成支援装置1に予め設定されている場合を例に挙げて述べる。しかしながら、当該母国語の言語種の設定は、任意に変更可能であってもよい。
言語解析部34は、入力部33により入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施機能を持っている。具体的には例えば、言語解析部34は、入力文と、出力文の言語種とを入力部33から受信し、当該入力文の言語種を判定する。言語解析部34は、判定した入力文の言語種に基づき、当該入力文に対して言語解析を実施する。言語解析部34は、判定した入力文の言語種が母国語の場合、入力文に対して、形態素解析及び構文解析を含む言語解析を実施し、判定した入力文の言語種が外国語だった場合、入力文に対して、形態素解析を含む言語解析を実施する。言語解析部34は、言語解析結果を文法特徴抽出部35に送信する。
なお、言語解析部34は、言語種の判定に際し、入力文に使用される文字種を解析してもよい。文字種に基づく言語種の判定方法の例としては、英文字のアルファベットを主に含む文の言語種を英語と判定する方法や、片仮名や平仮名を含む文の言語種を日本語と判定する方法等が挙げられる。また、全て漢字で構成される文の言語種を中国語と判定する方法が挙げられる。なお、言語種の判定方法は、上記の方法に限らず、任意の判定方法を適用可能であり、これらの判定方法は、言語解析部34に予め設定されていてもよい。
なお、言語解析部34は、形態素解析を実施した場合、形態素解析結果を得る。具体的には、言語解析部34は、入力文を単語毎に区切り、各単語に対応する品詞を付記することで、入力文における具体的な文の組み合わせ方を得る。
また、言語解析部34は、構文解析を実施した場合、構文解析結果を得る。具体的には、言語解析部34は、入力文を構成する文節間の係り受け関係を示した文の構造を得る。構文解析結果に含まれる文節間の係り受け関係には、例えば、主語、目的語等の文法役割として、どの語が主格及び目的格等の格に相当するか等の情報、及び機能語の役割として、どの語がどの語と連関しているか等の情報を含む。なお、構文解析結果は、文の構造をノード及びアークによって構成されるツリー構造(構文木)で表してもよい。ここで、ノードは、文を構成する各文節を示し、構文木において楕円形で表現されていてもよい。ノードには、当該ノードによって示される文節の表層文字列と、当該文節の自立語又は語幹の品詞が付記される。また、アークは、文を構成する各文節間の係り受け関係を示し、ノード間を結ぶ矢印によって表現されていてもよい。アークには、当該アークによって示される文節間の係り受け関係の種類が付記される。
なお、以下の説明では、アークの始点側のノードは、「親ノード」又は「係り受け先のノード」と読み替えてもよく、アークの終点側のノードは、「子ノード」又は「係り受け元のノード」と読み替えてもよい。
文法特徴抽出部35は、言語解析部34により実施された言語解析の結果に基づき、入力文の文法特徴を抽出する文法特徴抽出機能を持っている。具体的には例えば、文法特徴抽出部35は、言語解析結果を言語解析部34から受信し、文法特徴情報記憶部31から文法特徴情報31a,31bを読み出す。文法特徴抽出部35は、当該言語解析の結果に基づき、読み出した文法特徴情報31a,31bを参照しながら、入力文の文法特徴を抽出する。文法特徴抽出部35は、抽出された入力文の文法特徴を、検索クエリ生成部36に送信する。
なお、抽出される入力文の文法特徴は、言語種、主動詞、文型、機能語、文構成等の情報を含む。文構成は、形態素解析結果としての具体的な文の組み合わせ方、及び構文解析結果としての文節間の係り受け関係を含む。なお、受信した言語解析結果が構文解析結果を含まない場合、文節間の係り受け関係は、文構成に含まれない。
検索クエリ生成部36は、文法特徴抽出部35により抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成機能を持っている。具体的には例えば、検索クエリ生成部36は、入力文の文法特徴を文法特徴抽出部35から受信し、文法特徴情報記憶部31から文法特徴情報31a,31bを読出す。検索クエリ生成部36は、当該入力文の文法特徴に基づき、読み出した文法特徴情報31a,31bを参照しながら、入力文の検索クエリを生成する。検索クエリ生成部36は、入力文の文法特徴に含まれる文構成を検索クエリとしてもよい。検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。
また、検索クエリ生成部36は、文法特徴に基づき、検索クエリを作成し、作成した検索クエリを拡張することにより、最終的に検索クエリを生成してもよい。(検索クエリの検索範囲を拡張してもよい。)当該検索クエリを拡張することは、当該検索クエリに対し、体言抽象化、同義語拡張、助詞拡張、又は自他動詞拡張の少なくともいずれか一つを適用することを含んでもよい。
ここで、体言抽象化とは、検索クエリ内の体言に対して、入力された具体的な言葉を使用する代わりに、品詞(名詞、代名詞等)や文法役割(目的語、対象語等)といった抽象的な概念を使用することである。また、検索クエリ生成部36は、検索クエリ内の名詞節にまとめられる部分を1つの名詞節として扱うこともできる。これにより、検索クエリ生成部36は、検索クエリ内の具体的な体言を、上位概念で抽象化したものに拡張することができる。
また、同義語拡張とは、検索クエリ内の主動詞及び機能語等に対して、同じ又は類似する意味を有する同義語についても同時に検索されるよう、当該同義語を検索クエリ内に含めることである。これにより、検索クエリ生成部36は、検索クエリ内の具体的な語句を、同義語を含む一群の語句に拡張することができる。
また、助詞拡張は、検索クエリ内の助詞に対して、その他の助詞についても同時に検索されるよう、当該その他の助詞を検索クエリ内に含めることである。これにより、検索クエリ生成部36は、検索クエリ内の助詞を、その他の助詞を含む一群の助詞に拡張することができる。
また、自他動詞拡張は、検索クエリ内の自動詞又は他動詞に対して、対応する他動詞又は自動詞についても同時に検索されるよう、当該対応する他動詞又は自動詞を検索クエリに内に含めることである。これにより、検索クエリ生成部36は、検索クエリ内の自動詞又は他動詞を、当該動詞の対となる他動詞又は自動詞を含む一群の動詞に拡張することができる。
なお、検索クエリ生成部36は、これらのいずれの拡張項目を適用するか否かを、入力文の言語種に対応して選択してもよい。例えば、外国語文として日本語文が入力された場合、当該日本語の入力文は、自動詞及び他動詞が誤用された、又は助詞が誤用された日本語文である可能性がある。したがって、当該日本語の入力文に対しては、検索クエリ生成部36は、生成した検索クエリの検索範囲の拡張項目として、特に自他動詞拡張、及び助詞拡張を適用してもよい。なお、中国語文の入力に対しては、検索クエリ生成部36は、自他動詞拡張、及び助詞拡張を適用しなくてもよい。
例文検索部37は、生成された検索クエリを検索クエリ生成部36から受信し、出力文の出力言語種を入力部33から受信し、例文コーパス32aを例文コーパス記憶部32から読出す。例文検索部37は、当該検索クエリ及び出力言語種に基づいて例文コーパス32a内の索引を検索し、検索クエリに該当する索引に対応する例文と、当該例文に対応する出力言語種の例文との組を抽出し、出力部38に送信する。なお、入力文の言語種と、出力文の言語種とが同一の場合、抽出される例文は単言語のみでもよい。
また、例文検索部37は、当該例文の組に加え、当該例文の組に対応する索引を更に抽出し、出力部38に送信してもよい。また、例文検索部37は、索引が検索クエリに該当するか否かを判定する際に、索引と検索クエリとの類似度を計算してもよく、当該類似度の計算方法は、既存の統計的な手法を用いてもよい。この場合、例文検索部37は、当該類似度を例文の組と共に出力部38に送信してもよい。
また、例文検索部37は、例文コーパス32a内に索引が存在しない場合、当該例文コーパス32a内の例文をそれぞれ言語解析部34、文法特徴抽出部35、及び検索クエリ生成部36に送信し、言語解析を実施させ、文法特徴を抽出させ、及び検索クエリを生成させてもよい。例文検索部37は、例文コーパス32a内の各例文に対する検索クエリを検索クエリ生成部36から受信し、当該各例文に対する検索クエリを索引として利用してもよい。また、例文検索部37は、以後の利用時において当該索引を使用するために、当該索引を例文コーパス32a内に含める形で例文コーパス記憶部32に記憶させてもよい。
出力部38は、検索クエリが該当する索引に対応する例文又は例文の組を例文検索部37から受信し、検索結果としてユーザに出力する。ここで、出力部38による検索結果の出力形態としては、例えば液晶ディスプレイに表示出力する形態等が適宜、使用可能となっている。なお、出力部38は、索引と検索クエリとの類似度を例文検索部37から受信してもよい。出力部38は、検索結果を出力する際にユーザが確認しやすいように、受信した検索の類似度に応じて例文をソートしてもよく、検索クエリに該当した文字列を認識しやすいように、当該文字列を色付きや下線で明示してもよい。このような例文検索部37及び出力部38は、入力文が母国語の文の場合、生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力手段を構成している。また、例文検索部37及び出力部38は、入力文が外国語の文の場合、生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する外国語の例文を出力する出力手段を構成している。後者の出力手段は、検索クエリに該当する索引に対応する外国語の例文に対応する母国語の例文を更に出力してもよい。
次に、以上のように構成された外国語文作成支援装置1の動作について、図6のフローチャートを用いて説明する。なお、以下の説明において、外国語文作成支援装置1は、母国語として中国語が設定されているものとし、日本語を出力文として出力する場合を想定する。なお、説明を簡単にするために、外国語の情報としては日本語のみが記憶されているものとする。即ち、文法特徴情報記憶部31は、文法特徴情報31a,31bを予め記憶しているものとする。
始めに、入力文として、母国語が入力される場合における動作について説明する。ここでは、一例として、
Figure 2016091269
という文法上完全な母国語文が入力された場合について説明する。
始めに、例文コーパス記憶部32は、例文コーパス32aを記憶する(ST1)。
次に、入力部33は、入力文Aと、出力文の言語種「日本語」との入力を受付け(ST2)、入力文Aと、出力文の言語種「日本語」とを言語解析部34へ送信する。
言語解析部34は、入力文Aと、出力文の言語種「日本語」とを受信し、当該入力文Aの言語種を判定する(ST3)。言語解析部34は、入力文Aが全て漢字で構成されていること等に基づいて、入力文Aが中国語であると判定する。
言語解析部34は、入力文Aの言語解析を実施する(ST4〜ST6)。
具体的には、言語解析部34は、入力文Aに対して形態素解析を実施し(ST4)、形態素解析結果を得る。言語解析部34は、具体的には、図7(a)に示す如き入力文Aを
Figure 2016091269
のように語単位で分割し、図7(b)に示すように、それぞれの語に品詞を付与する。
言語解析部34は、入力文Aが出力文の言語種と同一であるか否かを判定する(ST5)。言語解析部34は、入力文Aが出力文の言語種と同一でないと判定し(ST5:no)、入力文Aに対して、得られた形態素解析結果に基づき、構文解析を実施する(ST6)。
言語解析部34は、具体的には、図8に示すように、入力文Aの構造としてノード101,102,105,107及び109と、アーク103,104,106及び108からなる構文木を得る。例として、ノード101,102、及びアーク103の関係について説明する。
Figure 2016091269
また、アーク103には「目的語」が付与され、ノード101とノード102とが、ノード101を親ノードとして、ノード102を子ノードとして関係づけられることを示している。つまり、アーク103は、ノード102がノード101の目的語であることを示している。
言語解析部34は、得られた形態素解析結果及び構文解析結果を含む言語解析結果を文法特徴抽出部35に送信する。
文法特徴抽出部35は、言語解析結果を受信し、文法特徴情報記憶部31から文法特徴情報31aを読み出す。文法特徴抽出部35は、言語解析結果及び文法特徴情報31aに基づき、入力文Aの文法特徴を抽出する(ST7)。
Figure 2016091269
また、文法特徴抽出部35は、入力文Aの形態素解析結果としての具体的な文の組み合わせ方、及び構文解析結果としての文節間の係り受け関係を含む文構成を得る。文法特徴抽出部35は、抽出した入力文Aの文法特徴を検索クエリ生成部36に送信する。
検索クエリ生成部36は、入力文Aの文法特徴を受信し、文法特徴情報記憶部31から文法特徴情報31aを読み出す。検索クエリ生成部36は、入力文Aの文法特徴及び文法特徴情報31aに基づき、検索クエリを生成する(ST8)。検索クエリ生成部36は、具体的には、入力文Aの文法特徴内の文構成を検索クエリとして用いる。
また、検索クエリ生成部36は、文法特徴情報31aに基づき、図10に示すように、生成した検索クエリを拡張する。具体的には、検索クエリ生成部36は、生成した検索クエリの検索範囲として、体言抽象化及び同義語拡張を適用する。
Figure 2016091269
検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。
例文検索部37は、検索クエリを受信し、出力文の出力言語種として「日本語」を入力部33から受信し、例文コーパス32aを例文コーパス記憶部32から読出す。例文検索部37は、検索クエリ及び出力言語種に基づいて例文コーパス32a内の索引を検索し、検索クエリに該当する索引に対応する中国語の例文、及びこの中国語の例文に対応する日本語の例文の組を取得する(ST9)。例文検索部37は、具体的には、例文コーパス32a内の中国語索引を参照し、検索クエリに該当する以下の中国語例文1〜3を抽出する。
Figure 2016091269
例文検索部37は、抽出した中国語例文1〜3に対応する日本語例文1〜3を更に抽出し、これら例文の組をそれぞれ取得し、出力部38に送信する。
出力部38は、取得された例文の組を受信する(ST10)。出力部38は、図11に示すように、例文の組として出力文A−1〜A−3を出力することにより、ユーザに提示する。なお、出力部38は、取得した例文の組について、検索クエリと合致した文字列に、色付きや下線で明示してもよい。
これにより、外国語文作成支援装置1は、入力を受け付けた母国語の入力文Aに基づいて、その文法特徴と類似する例文を出力することができる。ユーザは、出力文を参照し、正しい外国語文を作成するための参考にすることができる。具体的には、ユーザは、出力文A−1,A−2の「読ませる」という動詞の使い方等を参照して、「日本語が分からない人に日本語の教科書を読ませる。」という日本語文を作成することができる。また、ユーザは、出力文A−3の「読んでもらう」という動詞の使い方等を参照して、「日本語が分からない人に日本語の教科書を読んでもらう。」という日本語文を作成することができる。
次に、入力文として、外国語が入力される場合における動作について説明する。ここでは、一例として、
(入力文B)「管理者はデータを増えた。」
という文法上不完全な外国語文が入力された場合について説明する。
始めに、例文コーパス記憶部32は、例文コーパス32aを記憶する(ST1)。
次に、入力部33は、入力文Bと、出力文の言語種「日本語」との入力を受付け(ST2)、入力文Bと、出力文の言語種「日本語」とを言語解析部34へ送信する。
言語解析部34は、入力文Bと、出力文の言語種「日本語」とを受信し、当該入力文Bの言語種を判定する(ST3)。言語解析部34は、入力文Bが「は、データ、が、や、す」等の平仮名及び片仮名を有すること等を考慮して、入力文Bが日本語であると判定する。
言語解析部34は、入力文Bの言語解析を実施する(ST4〜ST5)。
具体的には、言語解析部34は、入力文Bに対して形態素解析を実施し(ST4)、形態素解析結果を得る。言語解析部34は、具体的には、図12(a)に示す如き入力文Bを
「管理者/は/データ/を/増えた/。」
のように語単位で分割し、図12(b)に示すように、それぞれの語に対して品詞を付与する。
言語解析部34は、入力文Bが出力文の言語種と同一であるか否かを判定する(ST5)。言語解析部34は、入力文Bが出力文の言語種と同一であると判定し(ST5:yes)、入力文Bに対して、得られた形態素解析結果に基づき、構文解析を実施せずに、得られた形態素解析結果を含む言語解析結果を文法特徴抽出部35に送信する。
文法特徴抽出部35は、言語解析結果を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。文法特徴抽出部35は、言語解析結果及び文法特徴情報31bに基づき、入力文Bの文法特徴を抽出する(ST7)。
文法特徴抽出部35は、具体的には、図13に示すように、入力文Bの文法特徴として、機能語として「は」や「を」を用いる、主動詞が「増える」の「過去形」文の「日本語」であることを抽出する。また、文法特徴抽出部35は、入力文Bの形態素解析結果としての具体的な文の組み合わせ方を含むが、構文解析結果としての文節間の係り受け関係を含まない文構成を抽出する。文法特徴抽出部35は、抽出した入力文Bの文法特徴を検索クエリ生成部36に送信する。
検索クエリ生成部36は、入力文Bの文法特徴を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。検索クエリ生成部36は、入力文Bの文法特徴及び文法特徴情報31bに基づき、検索クエリを生成する(ST8)。検索クエリ生成部36は、具体的には、入力文Bの文法特徴内の文構成を検索クエリとして用いる。
また、検索クエリ生成部36は、文法特徴情報31bに基づき、図14に示すように、生成した検索クエリを拡張する。具体的には、検索クエリ生成部36は、生成した検索クエリの検索範囲として、体言抽象化、助詞拡張及び自他動詞拡張を適用する。つまり、文法特徴抽出部35は、検索クエリに体言拡張化を適用し、「管理者」及び「データ」の検索範囲を「名詞節」に拡張する。また、文法特徴抽出部35は、検索クエリに助詞拡張を適用し、助詞「は」及び助詞「を」に対して、助詞「が」を検索クエリに含めることで、検索範囲を拡張する。また、文法特徴抽出部35は、検索クエリに自他動詞拡張を適用し、自動詞である「増やす」の対となる他動詞である「増やす」を検索クエリに含めることで、検索範囲を拡張する。
検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。
例文検索部37は、検索クエリを受信し、例文コーパス32aを例文コーパス記憶部32から読出す。例文検索部37は、検索クエリに基づいて例文コーパス32a内の索引を検索し、検索クエリに該当する索引に対応する日本語の例文、及びこの日本語の例文に対応する中国語の例文の組を取得する(ST9)。例文検索部37は、具体的には、例文コーパス32a内の日本語索引を参照し、検索クエリに該当する以下の日本語例文1〜3を抽出する。
(日本語例文1):「会社は社員の給料を増やした。」
(日本語例文2):「企業が採用数を増やす理由。」
(日本語例文3):「最近はお客さんが増えた。」
例文検索部37は、抽出した日本語例文1〜3に対応する中国語例文1〜3を更に抽出し、これら例文の組をそれぞれ取得し、出力部38に送信する。なお、例文検索部37は、入力文Bの言語種と、出力文の言語種とが同一の場合、日本語例文1〜3のみを取得し、出力部38に送信してもよい。
出力部38は、取得された例文の組を例文検索部37から受信する(ST10)。出力部38は、図15に示すように、例文の組として出力文B−1〜B−3をユーザに出力する。なお、出力部38は、取得した例文の組について、検索クエリと合致した文字列に、色付きや下線で明示してもよい。
これにより、外国語文作成支援装置1は、入力した外国語の入力文Bに基づいて、その文法特徴と類似する例文を出力することができ、ユーザは、出力文を参照し、正しい外国語文を作成するための参考にすることができる。具体的には、ユーザは、「管理者はデータを増えた。」という文法上不完全な外国語文を入力することで、出力文B−1,B−2を得ることができ、出力文B−1,B−2を参照して、「管理者はデータを増やした。」という日本語文を作成することができる。
上述したように、本実施形態によれば、母国語の入力文に対して言語解析を実施し、言語解析の結果に基づき、入力文の文法特徴を抽出し、当該抽出された文法特徴に基づき、検索クエリを生成する。また、当該生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する。これにより、外国語文を作成する際の負担を軽減することができる。
補足すると、母国語の入力文の文法特徴に基づき、母国語の例文と外国語の例文との組を出力する構成により、外国語文を作成困難なユーザに対し、外国語文の作成を支援することができる。
また、外国語の入力文の場合、同様に、入力文の言語解析を実施し、言語解析の結果に基づき、入力文の文法特徴を抽出し、当該抽出された文法特徴に基づき、検索クエリを生成する。また、当該生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する外国語の例文を出力する。従って、この場合も外国語文を作成する際の負担を軽減することができる。
補足すると、外国語の入力文の文法特徴に基づき、外国語の例文を出力する構成により、文法上不完全な外国語の文を作成できるユーザに対し、自ら作成した外国語文と文法特徴が類似した外国語の例文を提示できる。これにより、ユーザが入力した外国文の文法が不完全だった場合、ユーザは、提示された外国語の例文を参照して文法上正しい外国語文を作成できる。また、ユーザが入力した外国語文が結果的に正しかった場合においても、提示された外国語の例文を参照して、自身が作成した外国語文が文法上正しいことを確認できる。したがって、外国語文を作成する際の負担を軽減できる。
また、ユーザが外国語文を入力した場合、外国語の例文に対応する母国語の例文を更に出力できる構成により、文法上不完全な外国語の文を作成できるユーザに対し、外国語の例文に対応する母国語の対訳例文を更に提示できるので、より一層、外国語文を作成する際の負担を軽減できる。
また、文法特徴に基づき、作成した検索クエリを拡張して最終的に検索クエリを生成することで、自ら作成した外国語文の文法特徴に類似した例文を効率よく抽出できる。具体的には、体言抽象化、同義語拡張、助詞拡張及び自他動詞拡張等を適用することができる。したがって、外国語文を作成する際の負担を軽減できる。
(第2の実施形態)
図16は、第2の実施形態に係る外国語文作成支援装置のハードウェア構成の一例を示す模式図である。以下では、図1と同一部分には同一符号を付してその詳しい説明を省略し、異なる部分について主に述べる。
第2の実施形態は、第1の実施形態の変形例であり、より適切な例文を出力し得る構成となっている。具体的には、この外国語文作成支援装置1は、第1の実施形態に加え、意味属性情報記憶部39及び意味属性解析部40を更に備える。
ここで、意味属性情報記憶部39は、読出し/書込み可能なメモリであり、図17に示す如き、見出し単語と、当該見出し単語の意味属性とが関連付けられた意味属性情報39aが予め記憶されている。意味属性情報39aは、日本語の見出し単語に対する意味属性を示す情報の一例である。なお、意味属性情報記憶部39は、日本語に限らず、任意の言語種の見出し単語に対する意味属性情報39aが記憶されていてもよい。また、意味属性情報記憶部39は、意味属性解析部40からの読出しに応じて、指定された言語種の意味属性情報39aを意味属性解析部40に送信する。
ここで、意味属性とは、単語を語句の意味に基づいて分類するものである。意味属性は、例えば単語の上位概念と下位概念とを関連付ける分類であってもよい。例えば、「リンゴ」の意味属性としては、「リンゴ」の上位概念である「果物」が挙げられ、「月曜日」の意味属性としては、「月曜日」の上位概念である「時間」が挙げられる。また、意味属性は、複数の階層レベルに分類されて設定されてもよい。例えば、「管理者」の意味属性としては、「名詞:主体:人」のように、3つの階層レベルに分類されて設定されてもよい。意味属性の階層レベルは、レベルの数値が大きくなるほど、より下位概念に限定されるように構成されていてもよい。この場合、「管理者」の意味属性は、階層レベル1では「名詞」であり、より下位概念に限定した階層レベル2では「主体」であり、更に下位概念に限定した階層レベル3では「人」、となる。上記の例において、「果物」や「時間」、「名詞:主体:人」以外の意味属性及び分類の仕方も任意に取り得る。このように、意味属性情報39a内の意味属性は、見出し単語毎に、任意に設定可能である。
なお、意味属性が定義される対象としては、名詞や代名詞、及び形容動詞の語幹等の体言が主として想定されるが、体言に限らず、形容詞や動詞等の用言を含む自立語に対して定義可能である。
意味属性解析部40は、言語解析部34により実施された言語解析の結果に基づき、入力文の意味属性解析を実施する意味属性解析実施機能を持っている。具体的には、意味属性解析部40は、言語解析結果を言語解析部34から受信し、意味属性情報記憶部39から意味属性情報39aを読出す。意味属性解析部40は、言語解析結果に基づき、意味属性情報39aを参照しながら、入力文に使用される自立語に対して意味属性を付与し、意味属性解析結果を取得する。なお、意味属性解析部40は、当該付与される意味属性を1又は複数の階層レベルに分類してもよい。この場合、意味属性解析の結果は、入力文の自立語の意味属性を階層レベル毎に含んでいる。意味属性解析部40は、取得された意味属性解析の結果を文法特徴抽出部35に送信する。
例文コーパス記憶部32は、図18に示す如き、索引に意味属性を更に付与した例文コーパス32bを記憶する。
言語解析部34は、言語解析結果を意味属性解析部40に送信する。
文法特徴抽出部35は、意味属性解析部40により実施された意味属性解析の結果に基づき、入力文の文法特徴を抽出する抽出機能を持っている。具体的には、文法特徴抽出部35は、意味属性解析結果を意味属性解析部40から受信し、文法特徴情報記憶部31から文法特徴情報31a,31bを読み出す。文法特徴抽出部35は、意味属性解析結果に基づき、読み出した文法特徴情報31a,31bを参照しながら、入力文の文法特徴を抽出する。抽出された文法特徴は、言語解析結果に基づく情報に加え、意味属性が付与された文構成を含んでいる。当該付与された意味属性は、複数の階層レベルに分類されていてもよい。この場合、文法特徴抽出部35は、階層レベル毎の意味属性を含む文法特徴を抽出する。文法特徴抽出部35は、抽出された入力文の文法特徴を、検索クエリ生成部36に送信する。
検索クエリ生成部36は、言語解析結果に基づく情報に加え、意味属性が付与された文構成を含む文法特徴を文法特徴抽出部から受信し、当該文法特徴に基づき、検索クエリを生成する。なお、検索クエリ生成部36は、意味属性が複数の階層レベルに分類されている場合、検索クエリに適用する意味属性の階層レベルを選択して検索クエリを生成してもよい。また、検索クエリ生成部36は、意味属性が体言について付与されている場合、検索クエリ生成に体言抽象化を適用する代わりに、意味属性を付与してもよい。なお、選択される意味属性の階層レベルは、検索クエリ生成部36に対して予め設定されていてもよく、ユーザの要求により適宜変更可能であってもよい。検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。
例文検索部37は、検索クエリを検索クエリ生成部36から受信し、出力文の言語種を入力部33から受信し、意味属性が付与された索引を含む例文コーパス32bを例文コーパス記憶部32から読み出す。例文検索部37は、当該検索クエリに基づいて、例文コーパス32b内の索引を検索し、検索クエリに該当する索引に対応する例文を抽出し、出力部38に送信する。なお、例文検索部37は、検索クエリに選択された意味属性の階層レベルと同じか、当該意味属性の下位概念の階層レベルに分類されている索引を検索対象として検索を実施してもよい。即ち、選択された意味属性の階層レベルが大きいほど、検索範囲は限定されてもよい。
なお、例文検索部37は、例文コーパス32b内に索引が存在しない場合、当該例文コーパス32b内の例文をそれぞれ言語解析部34、意味属性解析部40、文法特徴抽出部35、及び検索クエリ生成部36に送信し、言語解析を実施させ、意味属性解析を実施させ、文法特徴を抽出させ、及び検索クエリを生成させてもよい。例文検索部37は、例文コーパス32b内の各例文に対する検索クエリを検索クエリ生成部36から受信し、当該各例文に対する検索クエリを索引として利用してもよい。また、例文検索部37は、以後の利用時において当該索引を使用するために、当該索引を例文コーパス32b内に含める形で例文コーパス記憶部32に記憶させてもよい。
次に、以上のように構成された外国語文作成支援装置1の動作について、図19のフローチャートを用いて説明する。なお、以下の説明において、外国語文作成支援装置1は、第1の実施形態と同様、母国語として中国語が設定されているものとし、日本語を出力文として出力する場合を想定する。なお、理解を容易にするために、外国語の情報としては日本語のみが記憶されているものとする。即ち、文法特徴情報記憶部31は、文法特徴情報31a,31bを予め記憶しているものとする。
また、入力文として、外国語が入力される場合における動作について説明する。ここでは、一例として、
(入力文B)「管理者はデータを増えた。」
という文法上不完全な外国語文が入力された場合について説明する。
ステップST1〜ステップST5までは第1の実施形態と同様に実行される。
言語解析部34は、入力文Bが出力文の言語種と同一であると判定し(ST5:yes)、入力文Bに対して、得られた形態素解析結果に基づき、構文解析を実施せずに、得られた形態素解析結果を含む言語解析結果を意味属性解析部40に送信する。
意味属性解析部40は、言語解析結果を受信し、意味属性情報記憶部39から意味属性情報39aを読出す。意味属性解析部40は、言語解析結果に基づき、入力文Bに対して意味属性解析を実施し(ST7’)、意味属性解析結果を得る。意味属性解析部40は、具体的には、図20(a)に示す如き入力文B内の自立語に対して、図20(b)に示すように、意味属性情報39aに基づき、意味属性を付与する。
意味属性解析部40は、意味属性解析結果を文法特徴抽出部35に送信する。
文法特徴抽出部35は、意味属性解析結果を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。文法特徴抽出部35は、意味属性解析結果及び文法特徴情報31bに基づき、入力文Bの文法特徴を抽出する(ST7)。文法特徴抽出部35は、具体的には、図21に示すように、文法特徴の文構成として、入力文Bの言語解析結果を含むと共に、意味属性解析結果を含む文構成を得る。文法特徴抽出部35は、抽出した入力文Bの文法特徴を検索クエリ生成部36に送信する。
検索クエリ生成部36は、入力文Bの文法特徴を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。検索クエリ生成部36は、入力文Bの文法特徴及び文法特徴情報31bに基づき、検索クエリを生成する(ST8)。検索クエリ生成部36は、具体的には、入力文Bの文法特徴内の文構成を検索クエリとして用いる。
また、検索クエリ生成部36は、文法特徴情報31bに基づき、生成した検索クエリを拡張し、意味属性が複数の階層レベルに分類されている場合、検索クエリに適用する意味属性の階層レベルを選択して検索クエリを生成する。検索クエリ生成部36は、具体的には、図22に示すように、意味属性の階層レベルが“2”に設定されている場合、「管理者」に対する意味属性として、「名詞:主体」を適用し、検索クエリを生成する。また、検索クエリ生成部36は、図23に示すように、意味属性の階層レベルが3に設定されている場合、「管理者」に対する意味属性として、「名詞:主体:人」を適用し、検索クエリを生成する。なお、以下の説明では、意味属性の階層レベルは“2”に設定されているものとする。
検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。
例文検索部37は、検索クエリを受信し、例文コーパス32bを例文コーパス記憶部32から読出す。例文検索部37は、検索クエリに基づいて例文コーパス32b内の索引を検索し、検索クエリに該当する索引に対応する日本語の例文、及びこの日本語の例文を取得する(ST9)。ここで、例文検索部37は、選択された意味属性と同じ階層レベルか、当該意味属性の下位概念の階層レベルの索引を検索対象とする。具体的には、例文検索部37は、階層レベルが“2”に選択されている場合、例文コーパス32b内の日本語索引を参照し、入力文Bの検索クエリに該当する以下の日本語例文1,2を抽出する。
(日本語例文1):「会社は社員の給料を増やした。」
(日本語例文2):「企業が採用数を増やす理由。」
なお、例文検索部37は、階層レベルが“3”に選択されている場合、上記の日本語例文のうち、日本語例文1のみを抽出する。
例文検索部37は、抽出した日本語例文1,2に対応する中国語例文1,2を更に抽出し、これら例文の組をそれぞれ取得し、出力部38に送信してもよい。なお、例文検索部37は、入力文Bの言語種と、出力文の言語種とが同一の場合、日本語例文1,2のみを取得し、出力部38に送信してもよい。
出力部38は、取得された例文の組を例文検索部37から受信する(ST10)。出力部38は、図24に示すように、例文の組として出力文B−1,B−2をユーザに出力する。なお、出力部38は、取得した例文の組について、検索クエリと合致した文字列に、色付きや下線で明示してもよい。
これにより、外国語文作成支援装置1は、入力した外国語の入力文Bに基づいて、その文法特徴と類似する例文のうち、意味属性が更に限定された例文を出力することができる。これにより、ユーザは、より効率的に例文を参照し、正しい外国語文を作成するための参考にすることができる。具体的には、外国語文作成支援装置1は、文法特徴が類似するものの、入力文Bにおける階層レベル2の意味属性「主体」とは異なる意味属性「抽象」が付与された例文「最近はお客さんが増えた。」を除外することができる。したがって、ユーザは、出力文B−1,B−2のみを参照して、「管理者はデータを増やした。」という日本語文を作成することができる。
上述したように第2の実施形態によれば、外国語の文を作成する際の負担を軽減することができる。補足すると、言語解析結果に基づいて、意味属性解析を更に実施し、得られた意味属性解析結果に基づいて、文法特徴を抽出する。これにより、文法特徴は類似するものの、意味属性が異なるために入力文と類似しない例文を除外することができる。したがって、外国語文を作成する際の負担をより軽減することができる。
また、意味属性解析によって付与される意味属性は、入力文の自立語の意味属性を複数の階層レベルに分類し、当該意味属性の階層レベルを選択して検索クエリを生成する。これにより、意味属性の階層レベルを変更することで、出力される例文の検索範囲を調整できるため、適切な検索範囲による例文検索ができる。したがって、外国語文を作成する際の負担を、より一層、軽減することができる。
なお、上記の実施形態に記載した手法は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、光磁気ディスク(MO)、半導体メモリ等の記憶媒体に格納して頒布することができる。
また、この記憶媒体としては、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であってもよい。
また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が上記実施形態を実現するための各処理の一部を実行してもよい。
さらに、実施形態における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶又は一時記憶した記憶媒体も含まれる。
また、実施形態における記憶媒体は1つに限らず、複数の媒体から上記の実施形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であってもよい。
なお、実施形態におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、上記の実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。
なお、本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…外国語文作成支援装置、10…コンピュータ、20…外部記憶装置、21…プログラム、31…文法特徴情報記憶部、31a,31b…文法特徴情報、32…例文コーパス記憶部、32a,32b…例文コーパス、33…入力部、34…言語解析部、35…文法特徴抽出部、36…検索クエリ生成部、37…例文検索部、38…出力部、39…意味属性情報記憶部、39a…意味属性情報、40…意味属性解析部。

Claims (11)

  1. 少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置であって、
    前記外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段と、
    前記第1の文に対応する母国語の第2の文である入力文の入力を受け付ける入力手段と、
    前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施手段と、
    前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段と、
    前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段と、
    前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力手段と、
    を備えることを特徴とする外国語文作成支援装置。
  2. 少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置であって、
    前記外国語の例文を含む例文集と、前記外国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段と、
    外国語の第3の文である入力文の入力を受け付ける入力手段と、
    前記入力を受け付けた入力文に対して、形態素解析を含む言語解析を実施する言語解析実施手段と、
    前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段と、
    前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段と、
    前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する外国語の例文を出力する出力手段と、
    を備えることを特徴とする外国語文作成支援装置。
  3. 前記記憶手段は、
    前記外国語の例文に対応する母国語の例文を更に含む例文集を含む例文コーパスを記憶し、
    前記出力手段は、
    前記検索クエリに該当する索引に対応する外国語の例文に対応する母国語の例文を更に出力する
    ことを特徴とする請求項2に記載の外国語文作成支援装置。
  4. 前記検索クエリ生成手段は、
    前記文法特徴に基づき、検索クエリを作成し、前記作成した検索クエリを拡張することにより、最終的に検索クエリを生成する
    ことを特徴とする請求項1乃至請求項3のいずれか1項に記載の外国語文作成支援装置。
  5. 前記検索クエリを拡張することは、
    当該検索クエリに対し、体言抽象化、同義語拡張、助詞拡張、または自他動詞拡張の少なくともいずれか1つを適用することを含む
    ことを特徴とする請求項4に記載の外国語文作成支援装置。
  6. 前記文法特徴抽出手段は、
    前記実施された言語解析の結果に基づき、前記入力文の意味属性解析を実施する意味属性解析実施部と、
    前記実施された意味属性解析の結果に基づき、前記入力文の文法特徴を抽出する抽出部と
    を更に備えたことを特徴とする請求項1乃至請求項5のいずれか1項に記載の外国語文作成支援装置。
  7. 前記意味属性解析の結果は、前記入力文の自立語の意味属性を階層レベル毎に含んでおり、
    前記抽出部は、
    前記階層レベル毎の意味属性を含む文法特徴を抽出し、
    前記検索クエリ生成手段は、
    前記検索クエリに適用する意味属性の階層レベルを選択して前記検索クエリを生成する
    ことを特徴とする請求項6に記載の外国語文作成支援装置。
  8. 少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置における外国語文作成支援方法であって、
    前記外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する記憶工程と、
    前記第1の文に対応する母国語の第2の文である入力文の入力を受け付ける入力工程と、
    前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施工程と、
    前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出工程と、
    前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成工程と、
    前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力工程と、
    を備えることを特徴とする外国語文作成支援方法。
  9. 少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置における外国語文作成支援方法であって、
    前記外国語の例文を含む例文集と、前記外国語の例文に対応する索引とを含む例文コーパスを記憶する記憶工程と、
    外国語の第3の文である入力文の入力を受け付ける入力工程と、
    前記入力を受け付けた入力文に対して、形態素解析を含む言語解析を実施する言語解析実施工程と、
    前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出工程と、
    前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成工程と、
    前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する外国語の例文を出力する出力工程と、
    を備えることを特徴とする外国語文作成支援方法。
  10. 少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置に用いられるプログラムであって、
    前記外国語文作成支援装置を、
    前記外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段、
    前記第1の文に対応する母国語の第2の文である入力文の入力を受け付ける入力手段、
    前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施手段、
    前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段、
    前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段、
    前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力手段、
    として機能させるためのプログラム。
  11. 少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置に用いられるプログラムであって、
    前記外国語文作成支援装置を、
    前記外国語の例文を含む例文集と、前記外国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段、
    外国語の第3の文である入力文の入力を受け付ける入力手段、
    前記入力を受け付けた入力文に対して、形態素解析を含む言語解析を実施する言語解析実施手段、
    前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段、
    前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段、
    前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する外国語の例文を出力する出力手段、
    として機能させるためのプログラム。
JP2014224518A 2014-11-04 2014-11-04 外国語文作成支援装置、方法及びプログラム Expired - Fee Related JP6466138B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014224518A JP6466138B2 (ja) 2014-11-04 2014-11-04 外国語文作成支援装置、方法及びプログラム
TW104134199A TWI588668B (zh) 2014-11-04 2015-10-19 Foreign language production support facilities and methods
US14/927,720 US10394961B2 (en) 2014-11-04 2015-10-30 Foreign language sentence creation support apparatus, method, and program
CN201510726952.6A CN105573990B (zh) 2014-11-04 2015-10-30 外语句子制作支援装置以及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014224518A JP6466138B2 (ja) 2014-11-04 2014-11-04 外国語文作成支援装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016091269A true JP2016091269A (ja) 2016-05-23
JP6466138B2 JP6466138B2 (ja) 2019-02-06

Family

ID=55852848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014224518A Expired - Fee Related JP6466138B2 (ja) 2014-11-04 2014-11-04 外国語文作成支援装置、方法及びプログラム

Country Status (4)

Country Link
US (1) US10394961B2 (ja)
JP (1) JP6466138B2 (ja)
CN (1) CN105573990B (ja)
TW (1) TWI588668B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210023640A (ko) * 2019-08-23 2021-03-04 울산대학교 산학협력단 의미 추상화를 이용한 전이 기반 한국어 의존관계 분석 시스템

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11449744B2 (en) 2016-06-23 2022-09-20 Microsoft Technology Licensing, Llc End-to-end memory networks for contextual language understanding
US10366163B2 (en) * 2016-09-07 2019-07-30 Microsoft Technology Licensing, Llc Knowledge-guided structural attention processing
US10346548B1 (en) * 2016-09-26 2019-07-09 Lilt, Inc. Apparatus and method for prefix-constrained decoding in a neural machine translation system
JP7106999B2 (ja) * 2018-06-06 2022-07-27 日本電信電話株式会社 難易度推定装置、難易度推定モデル学習装置、方法、及びプログラム
TWI666558B (zh) * 2018-11-20 2019-07-21 財團法人資訊工業策進會 語意分析方法、語意分析系統及非暫態電腦可讀取媒體
CN113330430B (zh) * 2019-01-31 2024-01-09 三菱电机株式会社 语句结构向量化装置、语句结构向量化方法及记录有语句结构向量化程序的记录介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190972A (ja) * 1989-01-19 1990-07-26 Sharp Corp 用例検索システム
JPH06110929A (ja) * 1992-09-28 1994-04-22 Toshiba Corp データ検索装置
JPH10105555A (ja) * 1996-09-26 1998-04-24 Sharp Corp 対訳例文検索装置
JP2001188678A (ja) * 2000-01-05 2001-07-10 Mitsubishi Electric Corp 言語事例推論装置,言語事例推論方法及び言語事例推論プログラムが記述された記憶媒体
JP2003228578A (ja) * 2002-02-01 2003-08-15 Canon Inc 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム
JP2004110835A (ja) * 2002-09-19 2004-04-08 Microsoft Corp 確認文を検索するための方法およびシステム
JP2004133564A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd 文書検索装置
JP2007317140A (ja) * 2006-05-29 2007-12-06 Fuji Xerox Co Ltd 文一致度分析装置および方法、ならびに言語変換装置および方法
JP2008165563A (ja) * 2006-12-28 2008-07-17 Fujitsu Ltd 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法
JP2008204312A (ja) * 2007-02-22 2008-09-04 Toshiba Corp 用例データベース及び用例検索システム
JP2008233955A (ja) * 2007-03-16 2008-10-02 Nippon Hoso Kyokai <Nhk> 用例データベース作成装置及び用例データベース作成プログラム、並びに、翻訳装置及び翻訳プログラム
JP2014142780A (ja) * 2013-01-23 2014-08-07 Ntt Data Corp 用例検索装置、用例検索方法、および用例検索プログラム

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
AU677605B2 (en) * 1992-09-04 1997-05-01 Caterpillar Inc. Integrated authoring and translation system
JPH07141382A (ja) 1993-11-19 1995-06-02 Sharp Corp 外国語文書作成支援装置
EP0932897B1 (en) * 1997-06-26 2003-10-08 Koninklijke Philips Electronics N.V. A machine-organized method and a device for translating a word-organized source text into a word-organized target text
WO1999063456A1 (fr) * 1998-06-04 1999-12-09 Matsushita Electric Industrial Co., Ltd. Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme
JP3114703B2 (ja) * 1998-07-02 2000-12-04 富士ゼロックス株式会社 対訳文検索装置
US6092034A (en) * 1998-07-27 2000-07-18 International Business Machines Corporation Statistical translation system and method for fast sense disambiguation and translation of large corpora using fertility models and sense models
JP2000259627A (ja) 1999-03-08 2000-09-22 Ai Soft Kk 自然言語文関係判定装置、自然言語文関係判定方法およびこれを用いた検索装置、検索方法ならびに記録媒体
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US7016977B1 (en) * 1999-11-05 2006-03-21 International Business Machines Corporation Method and system for multilingual web server
US20020010574A1 (en) * 2000-04-20 2002-01-24 Valery Tsourikov Natural language processing and query driven information retrieval
US7437669B1 (en) * 2000-05-23 2008-10-14 International Business Machines Corporation Method and system for dynamic creation of mixed language hypertext markup language content through machine translation
US7389220B2 (en) * 2000-10-20 2008-06-17 Microsoft Corporation Correcting incomplete negation errors in French language text
US20020072914A1 (en) * 2000-12-08 2002-06-13 Hiyan Alshawi Method and apparatus for creation and user-customization of speech-enabled services
US6990439B2 (en) * 2001-01-10 2006-01-24 Microsoft Corporation Method and apparatus for performing machine translation using a unified language model and translation model
JP2003006191A (ja) 2001-06-27 2003-01-10 Ricoh Co Ltd 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体
AU2002316581A1 (en) * 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
US7058567B2 (en) * 2001-10-10 2006-06-06 Xerox Corporation Natural language parser
CN1726508A (zh) * 2002-10-18 2006-01-25 独立行政法人科学技术振兴机构 基于结构化知识的学习/思考机器和学习/思考方法以及计算机系统和信息生成方法
US7412385B2 (en) * 2003-11-12 2008-08-12 Microsoft Corporation System for identifying paraphrases using machine translation
US7493602B2 (en) * 2005-05-02 2009-02-17 International Business Machines Corporation Methods and arrangements for unified program analysis
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
US7949514B2 (en) * 2007-04-20 2011-05-24 Xerox Corporation Method for building parallel corpora
JP5280642B2 (ja) 2007-04-23 2013-09-04 株式会社船井電機新応用技術研究所 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法
US9779079B2 (en) * 2007-06-01 2017-10-03 Xerox Corporation Authoring system
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
US20090119090A1 (en) * 2007-11-01 2009-05-07 Microsoft Corporation Principled Approach to Paraphrasing
TWI496012B (zh) * 2007-11-26 2015-08-11 Warren Daniel Child 管理電子形式之中文、日文及韓文語言資料的模組系統與方法
JP5112116B2 (ja) * 2008-03-07 2013-01-09 株式会社東芝 機械翻訳する装置、方法およびプログラム
TWI457868B (zh) * 2008-03-12 2014-10-21 Univ Nat Kaohsiung 1St Univ Sc 機器翻譯譯文之自動修飾方法
JP5043735B2 (ja) * 2008-03-28 2012-10-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報分類システム、情報処理装置、情報分類方法およびプログラム
EP2300939A4 (en) * 2008-06-09 2016-03-30 Nat Res Council Canada METHOD AND SYSTEM FOR USING ALIGNMENT MEANS IN TRANSLATION MATCHING
TWI385538B (zh) * 2008-07-18 2013-02-11 Inventec Corp 單詞擷取翻譯系統及其方法
US8812304B2 (en) * 2008-08-12 2014-08-19 Abbyy Infopoisk Llc Method and system for downloading additional search results into electronic dictionaries
JP2010267019A (ja) * 2009-05-13 2010-11-25 Internatl Business Mach Corp <Ibm> 文書作成を支援する方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム
WO2010141598A2 (en) * 2009-06-02 2010-12-09 Index Logic, Llc Systematic presentation of the contents of one or more documents
US7969254B2 (en) * 2009-08-07 2011-06-28 National Instruments Corporation I/Q impairment calibration using a spectrum analyzer
CN101996166B (zh) * 2009-08-14 2015-08-05 张龙哺 双语句对模式化记录方法以及翻译方法和翻译系统
US8484016B2 (en) * 2010-05-28 2013-07-09 Microsoft Corporation Locating paraphrases through utilization of a multipartite graph
TWI427976B (zh) * 2010-09-21 2014-02-21 Inventec Corp 提供多種語言同時進行翻譯轉換的即時通訊系統及其方法
KR101762866B1 (ko) * 2010-11-05 2017-08-16 에스케이플래닛 주식회사 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
CN102654866A (zh) 2011-03-02 2012-09-05 北京百度网讯科技有限公司 例句索引创建方法和装置以及例句检索方法和装置
US8713037B2 (en) * 2011-06-30 2014-04-29 Xerox Corporation Translation system adapted for query translation via a reranking framework
JP2013235507A (ja) * 2012-05-10 2013-11-21 Mynd Inc 情報処理方法、装置、コンピュータプログラムならびに記録媒体
US9026425B2 (en) * 2012-08-28 2015-05-05 Xerox Corporation Lexical and phrasal feature domain adaptation in statistical machine translation
US9601010B2 (en) * 2012-11-06 2017-03-21 Nec Corporation Assessment device, assessment system, assessment method, and computer-readable storage medium
US9152622B2 (en) * 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
JP6096489B2 (ja) 2012-11-30 2017-03-15 株式会社東芝 外国語文章作成支援装置、方法、及びプログラム
US9235567B2 (en) * 2013-01-14 2016-01-12 Xerox Corporation Multi-domain machine translation model adaptation
US9047274B2 (en) * 2013-01-21 2015-06-02 Xerox Corporation Machine translation-driven authoring system and method
US9231898B2 (en) * 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US20140358519A1 (en) * 2013-06-03 2014-12-04 Xerox Corporation Confidence-driven rewriting of source texts for improved translation
JP2015022590A (ja) * 2013-07-19 2015-02-02 株式会社東芝 文字入力装置、文字入力方法、及び文字入力プログラム
KR101509727B1 (ko) * 2013-10-02 2015-04-07 주식회사 시스트란인터내셔널 자율학습 정렬 기반의 정렬 코퍼스 생성 장치 및 그 방법과, 정렬 코퍼스를 사용한 파괴 표현 형태소 분석 장치 및 그 형태소 분석 방법
US20150199339A1 (en) * 2014-01-14 2015-07-16 Xerox Corporation Semantic refining of cross-lingual information retrieval results
US9881006B2 (en) * 2014-02-28 2018-01-30 Paypal, Inc. Methods for automatic generation of parallel corpora
US9652453B2 (en) * 2014-04-14 2017-05-16 Xerox Corporation Estimation of parameters for machine translation without in-domain parallel data
JP6390264B2 (ja) * 2014-08-21 2018-09-19 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
US9367541B1 (en) * 2015-01-20 2016-06-14 Xerox Corporation Terminological adaptation of statistical machine translation system through automatic generation of phrasal contexts for bilingual terms

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190972A (ja) * 1989-01-19 1990-07-26 Sharp Corp 用例検索システム
JPH06110929A (ja) * 1992-09-28 1994-04-22 Toshiba Corp データ検索装置
JPH10105555A (ja) * 1996-09-26 1998-04-24 Sharp Corp 対訳例文検索装置
JP2001188678A (ja) * 2000-01-05 2001-07-10 Mitsubishi Electric Corp 言語事例推論装置,言語事例推論方法及び言語事例推論プログラムが記述された記憶媒体
JP2003228578A (ja) * 2002-02-01 2003-08-15 Canon Inc 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム
JP2004110835A (ja) * 2002-09-19 2004-04-08 Microsoft Corp 確認文を検索するための方法およびシステム
JP2004133564A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd 文書検索装置
JP2007317140A (ja) * 2006-05-29 2007-12-06 Fuji Xerox Co Ltd 文一致度分析装置および方法、ならびに言語変換装置および方法
JP2008165563A (ja) * 2006-12-28 2008-07-17 Fujitsu Ltd 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法
JP2008204312A (ja) * 2007-02-22 2008-09-04 Toshiba Corp 用例データベース及び用例検索システム
JP2008233955A (ja) * 2007-03-16 2008-10-02 Nippon Hoso Kyokai <Nhk> 用例データベース作成装置及び用例データベース作成プログラム、並びに、翻訳装置及び翻訳プログラム
JP2014142780A (ja) * 2013-01-23 2014-08-07 Ntt Data Corp 用例検索装置、用例検索方法、および用例検索プログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
兵藤 安昭 外3名: "構文付きコーパスを対象とする用例検索システム", 第51回(平成7年後期)全国大会講演論文集(3) 人工知能及び認知科学 メディア情報処理, JPN6018012198, 20 September 1995 (1995-09-20), JP, pages 3 - 215, ISSN: 0003775226 *
山本 和英 外1名: "要約事例を用例として模倣利用したニュース記事要約", 自然言語処理, vol. 第15巻第3号, JPN6018012196, 10 July 2008 (2008-07-10), JP, pages 115 - 158, ISSN: 0003775225 *
青山 典生 外4名: "形態素解析と意味コード化に基づく翻訳支援のための類似例文検索システム", 電子情報通信学会技術研究報告, vol. 第93巻第528号, JPN6018012201, 22 March 1994 (1994-03-22), JP, pages 39 - 45, ISSN: 0003775227 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210023640A (ko) * 2019-08-23 2021-03-04 울산대학교 산학협력단 의미 추상화를 이용한 전이 기반 한국어 의존관계 분석 시스템
KR102339487B1 (ko) * 2019-08-23 2021-12-15 울산대학교 산학협력단 의미 추상화를 이용한 전이 기반 한국어 의존관계 분석 시스템

Also Published As

Publication number Publication date
TW201636873A (zh) 2016-10-16
JP6466138B2 (ja) 2019-02-06
CN105573990B (zh) 2019-09-27
CN105573990A (zh) 2016-05-11
TWI588668B (zh) 2017-06-21
US20160124943A1 (en) 2016-05-05
US10394961B2 (en) 2019-08-27

Similar Documents

Publication Publication Date Title
JP6466138B2 (ja) 外国語文作成支援装置、方法及びプログラム
Derczynski et al. Microblog-genre noise and impact on semantic annotation accuracy
Cotterell et al. An algerian arabic-french code-switched corpus
JPH0293866A (ja) 要約生成方法および要約生成装置
JP2010519655A (ja) 名前照合システムの名前インデックス付け
JP6077727B1 (ja) 多言語の固有表現認識モデルの転移を行うコンピュータシステム、方法、およびプログラム
Abdurakhmonova et al. UZBEK ELECTRONIC CORPUS AS A TOOL FOR LINGUISTIC ANALYSIS
US20190303437A1 (en) Status reporting with natural language processing risk assessment
Hammouda et al. Parsing Arabic nominal sentences with transducers to annotate corpora
Fudholi et al. Ontology-based information extraction for knowledge enrichment and validation
Rana et al. Extraction of opinion target using syntactic rules in Urdu text
Romadhony et al. Rule-based Indonesian open information extraction
JP2003323425A (ja) 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム
Kaur et al. Toward normalizing romanized gurumukhi text from social media
Al-Arfaj et al. Arabic NLP tools for ontology construction from Arabic text: An overview
Gadag et al. Paraphrase generator using dictionary lookup for Kannada language
Tang et al. Mining language variation using word using and collocation characteristics
Stankovic et al. Sentiment Analysis of Sentences from Serbian ELTeC corpus
Zhao et al. THUNLP at TAC KBP 2011 in Entity Linking.
Wushouer et al. Building contemporary Uyghur grammatical information dictionary
Gondal et al. No Sql-Not Obligatory Sql (Natural Language To Sql Conversion)
Rodrigues et al. Arabic data science toolkit: An api for arabic language feature extraction
Bhowmik et al. Development of A Word Based Spell Checker for Bangla Language
Šimon et al. Transliterated named entity recognition based on Chinese word sketch
Jamwal et al. A Novel Hybrid Approach for the Designing and Implementation of Dogri Spell Checker

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160929

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180410

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190109

R150 Certificate of patent or registration of utility model

Ref document number: 6466138

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees