JP2014109954A - 格助詞識別装置、方法、及びプログラム - Google Patents

格助詞識別装置、方法、及びプログラム Download PDF

Info

Publication number
JP2014109954A
JP2014109954A JP2012264658A JP2012264658A JP2014109954A JP 2014109954 A JP2014109954 A JP 2014109954A JP 2012264658 A JP2012264658 A JP 2012264658A JP 2012264658 A JP2012264658 A JP 2012264658A JP 2014109954 A JP2014109954 A JP 2014109954A
Authority
JP
Japan
Prior art keywords
case
learning
particle
sentence
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012264658A
Other languages
English (en)
Inventor
Kugatsu Sadamitsu
九月 貞光
Kuniko Saito
邦子 齋藤
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012264658A priority Critical patent/JP2014109954A/ja
Publication of JP2014109954A publication Critical patent/JP2014109954A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】日本語の文章中の誤った格助詞を精度良く識別する。
【解決手段】学習用素性抽出部21が、日本語の文章中の誤った格助詞を示す正解情報、または誤った格助詞に対する正解の格助詞を示す正解情報が付与された学習用文章から、学習用文章に対応する格フレームが、格助詞の使い方が正しい格フレームが登録された格フレームDB31内のいずれかの格フレームに一致するか否かを示す格フレーム素性を含む学習用素性を抽出し、学習部22が、複数の学習用文章の各々から抽出された学習用素性の各々と正解情報とのペアを学習データとして、日本語の文章中の誤った格助詞を識別するための識別モデル32を学習し、対象素性抽出部41が、対象文章から、格フレームDB31を参照して、格フレーム素性を含む対象素性を抽出し、識別部42が、対象素性と識別モデル32とに基づいて、対象文章中の誤った格助詞を識別する。
【選択図】図1

Description

本発明は、格助詞識別装置、方法、及びプログラムに係り、特に、日本語の文章中に現れる格助詞の誤りを検出または訂正する格助詞識別装置、方法、及びプログラムに関する。
従来、日本語の文章中に現れる格助詞を識別する技術が提案されている。例えば、「以下は旅行に行った時の写真を添付する」という自然でない日本語の文章から、「は」という誤った格助詞を検出したり、誤った格助詞「は」を正解の格助詞「に」に訂正したりする技術である(例えば、非特許文献1及び2参照)。
従来の手法では、学習用の文章から抽出した格助詞に関する素性を用いて識別モデルを学習しておき、この識別モデルと識別対象の文章から抽出された素性とを用いて、文章中の格助詞を識別している。素性には、文脈や係り受け関係を示す情報が用いられている。例えば、「彼を言う」という文章中の誤った格助詞の部分を示す情報が付与された学習データ(「彼[を:誤り]言う」)、または誤った格助詞の部分に正解の格助詞を示す情報が付与された学習データ(「彼[を:正解「に」]言う」)から、格助詞の1単語前に「彼」が出現する場合は「を」という格助詞は誤りである、または格助詞「を」は「に」に訂正される、ということを学習する。
鈴木久美、Kristina Toutanova、「機械学習による日本語格助詞の予測」、言語処理学会第12回年次大会 (2006) Na-raeHan, Joel Tetreault, Soo-hwaLee, Jin-young Ha, "Using an Error-Annotated Learner Corpus to Develop an ESL / EFL Error Correction System", LREC 2010
しかし、非特許文献1及び2に記載の手法では、局所的な情報や、単純な係り受け情報のみを用いており、格助詞の識別精度が十分でない、という問題がある。具体的には、従来のような素性のみを用いて生成した識別モデルでは、学習用の文章に識別対象の文章と全く同じ事例が存在しない場合には、識別対象の文章から誤った格助詞を識別できない場合がある。
本発明は上記事実を考慮して成されたもので、日本語の文章中の誤った格助詞を精度良く識別することができる格助詞識別装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の格助詞識別装置は、日本語の文章中の誤った格助詞を示す正解情報、または誤った格助詞に対する正解の格助詞を示す正解情報が付与された学習用文章から、該学習用文章に対応する格フレームが、格助詞の使い方が正しい格フレームとして予め定められた複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む学習用素性を抽出する学習用素性抽出手段と、前記学習用素性抽出手段により、複数の学習用文章の各々から抽出された学習用素性の各々と、前記学習用文章の各々に付与された正解情報とのペアを学習データとして、日本語の文章中の誤った格助詞を識別するための識別モデルを学習する学習手段と、を含んで構成されている。
本発明の格助詞識別装置によれば、日本語の文章中の誤った格助詞を示す正解情報、または誤った格助詞に対する正解の格助詞を示す正解情報が付与された学習用文章を用いる。学習用素性抽出手段が、この学習用文章から、学習用文章に対応する格フレームが、格助詞の使い方が正しい格フレームとして予め定められた複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む学習用素性を抽出する。そして、学習手段が、学習用素性抽出手段により、複数の学習用文章の各々から抽出された学習用素性の各々と、学習用文章の各々に付与された正解情報とのペアを学習データとして、日本語の文章中の誤った格助詞を識別するための識別モデルを学習する。
このように、日本語の文章中の誤った格助詞を識別するための識別モデルを、格フレーム素性を含む学習用素性を用いて学習するため、日本語の文章中の誤った格助詞を精度良く識別することができる。
また、本発明の格助詞識別装置は、誤った格助詞の識別対象である日本語の対象文章から、該対象文章に対応する格フレームが、前記複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む対象素性を抽出する対象素性抽出手段と、前記対象素性抽出手段により抽出された対象素性と、前記学習手段により学習された識別モデルとに基づいて、前記対象文章中の誤った格助詞を識別する識別手段と、を含んで構成することができる。
また、本発明の格助詞識別方法は、学習用素性抽出手段と、学習手段とを含む格助詞識別装置における格助詞識別方法であって、前記学習用素性抽出手段が、日本語の文章中の誤った格助詞を示す正解情報、または誤った格助詞に対する正解の格助詞を示す正解情報が付与された学習用文章から、該学習用文章に対応する格フレームが、格助詞の使い方が正しい格フレームとして予め定められた複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む学習用素性を抽出し、前記学習手段が、前記学習用素性抽出手段により、複数の学習用文章の各々から抽出された学習用素性の各々と、前記学習用文章の各々に付与された正解情報とのペアを学習データとして、日本語の文章中の誤った格助詞を識別するための識別モデルを学習する方法である。
また、本発明の格助詞識別方法は、対象素性抽出手段と、識別手段とをさらに含む格助詞識別装置における格助詞識別方法であって、前記対象素性抽出手段が、誤った格助詞の識別対象である日本語の対象文章から、該対象文章に対応する格フレームが、前記複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む対象素性を抽出し、前記識別手段が、前記対象素性抽出手段により抽出された対象素性と、前記学習手段により学習された識別モデルとに基づいて、前記対象文章中の誤った格助詞を識別することができる。
また、本発明の格助詞識別プログラムは、コンピュータを、上記の格助詞識別装置を構成する各手段として機能させるためのプログラムである。
本発明の格助詞識別装置、方法、及びプログラムによれば、日本語の文章中の誤った格助詞を識別するための識別モデルを、格フレーム素性を含む学習用素性を用いて学習するため、日本語の文章中の誤った格助詞を精度良く識別することができる、という効果を有する。
本実施の形態に係る格助詞識別装置の機能的構成を示すブロック図である。 格フレームDBの一例を示す図である。 本実施の形態における識別モデル生成処理ルーチンを示すフローチャートである。 本実施の形態における格助詞誤り訂正処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
本実施の形態に係る格助詞識別装置10は、CPUと、RAMと、後述する識別モデル生成処理ルーチン、及び格助詞誤り訂正処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。
格助詞識別装置10を構成するコンピュータは、機能的には、図1に示すように、識別モデル生成部20と、格助詞誤り訂正部40とを含んだ構成で表すことができる。また、格助詞識別装置10を構成するコンピュータのROMまたはHDDには、格フレームデータベース(DB)31と、識別モデル32とを記憶する所定の記憶領域が設けられている。
識別モデル生成部20はさらに、学習用素性抽出部21と、学習部22とを含んだ構成で表すことができる。
学習用素性抽出部21は、入力として、形態素解析済みの文章であって、誤った格助詞の部分に正解の格助詞を示す正解情報が付与された学習用文章の集合を受け付ける。例えば、「彼を言う」という文章の場合、形態素解析により「彼/を/言う」と単語毎に分解され、誤った格助詞「を」の部分に正解の格助詞「に」が付与された「彼[を:正解「に」]言う」という学習用文章となる。なお、この学習用文章の例では、格助詞及び正解情報を[ ]で表記している。
学習用素性抽出部21は、学習用文章集合に含まれる学習用文章の各々から、文脈素性及び係り受け素性を抽出する。例えば、誤った格助詞の1単語前の単語を文脈素性として抽出することができる。また、誤った格助詞の係り先の単語を係り受け素性として抽出することができる。例えば、「彼[を:正解「に」]言う」という学習用文章からは、文脈素性として「彼」が抽出され、係り受け素性として「言う」が抽出される。
また、学習用素性抽出部21は、学習用文章の各々に対応する格フレームが格フレームDB31に登録された格フレームのいずれかと一致するか否かを示す格フレーム素性を抽出する。格フレームとは、例えば、「言う」という動詞に対し、「ガ格」または「ニ格」が付き得る、という言語的情報である。学習用素性抽出部21は、例えば、学習用文章に対応する格フレームが格フレームDB31に登録された格フレームのいずれかと一致する場合には、格フレーム素性=1、一致しない場合には、格フレーム素性=0とすることができる。
格フレームDB31には、例えば図2に示すように、格助詞の使い方が正しい格フレームが登録される。「僕が言う」や「彼女に言う」のような文章は格フレームに沿った文章であり、格助詞の使い方が正しい文章である。一方で、「彼を言う」のような文章は格フレームに沿っておらず、動詞「言う」に対して、このような格助詞の使い方は許容されない。学習用素性抽出部21は、例えば、「彼[を:正解「に」]言う」という学習用文章については、学習用文章に対応する「人+を+言う」という格フレームが格フレームDB31に登録された格フレームのいずれとも一致しないため、格フレーム素性を0とする。
さらに、学習用素性抽出部21は、学習用文章の各々から抽出された文脈素性、係り受け素性、及び格フレーム素性をまとめて学習用素性とし、学習用素性と学習用文章に付与された正解情報とのペアを学習データとして作成する。全ての学習用文章から作成された学習データの集合を学習部22へ出力する。
学習部22は、学習用素性抽出部21から出力された学習データ集合を受け取り、従来の識別学習器(例えば、SVM(サポートベクターマシン)、最大エントロピー法、ナイーブベイズモデル等)を用いて識別モデル32を生成する。学習用素性には、文脈素性及び係り受け素性が含まれるため、従来技術と同様に、例えば、「彼[を:正解「に」]言う」という学習用文章から、格助詞「を」の1単語前に「彼」が出現する場合や、格助詞「を」の係り先が「言う」の場合、格助詞「を」は「に」に訂正される、ということが学習される。さらに、本実施の形態では、学習用素性に格フレーム素性が含まれているため、「彼を言う」に対応する格フレームは許容されない、という格フレーム素性から、「人+を+言う」という格フレームが誤りを導き易い、という情報が学習される。
また、格助詞誤り訂正部40はさらに、対象素性抽出部41と、識別部42とを含んだ構成で表すことができる。
対象素性抽出部41は、入力として、格助詞の誤りを訂正する処理対象の形態素解析済みの文章である対象文章を受け付ける。例えば、「私[を]言う」のような誤った格助詞の正解を示す正解情報が付与されていない文章である。なお、この対象文章の例では、格助詞を[ ]で表記している。対象素性抽出部41は、学習用素性抽出部21と同様に、対象文章から文脈素性及び係り受け素性を抽出すると共に、格フレームDB31を参照して格フレーム素性を抽出する。例えば、「私[を]言う」という対象文章から、文脈素性として「私」が抽出され、係り受け素性として「言う」が抽出され、格フレーム素性として「0」が抽出される。対象素性抽出部41は、文脈素性、係り受け素性、及び格フレーム素性をまとめて対象素性として出力する。
識別部42は、対象素性抽出部41から出力された対象素性を受け取り、識別モデル生成部20により生成された識別モデル32を用いて、識別モデル32学習時の手法に応じた手法により、格助詞に対する識別を行う。
ここで、学習用文章集合に「彼[を:正解「に」]言う」という学習用文章が含まれ、「私[を:正解「に」]言う」という学習用文章が含まれていない場合に、素性として文脈素性及び係り受け素性のみを用いて生成された識別モデルでは、格助詞「を」の1単語前に「私」が出現する場合は、格助詞「を」は「に」に訂正される、ということが学習されていないため、格助詞「を」を誤った格助詞として識別できない可能性がある。一方、本実施の形態のように、格フレーム素性を含む学習用素性を用いて生成された識別モデルにより識別する場合には、学習用文章「彼[を:正解「に」]から、「人+を+言う」という格フレームが誤りを導き易い、という情報が学習されているため、同様の格フレーム「人+を+言う」となる対象文章「私を言う」について、誤った格助詞を識別することができる。
識別部42は、識別モデル32によって識別された誤った格助詞に対する正解の格助詞を示す誤り訂正情報を出力する。例えば、格助詞「を」は「に」に訂正する方が尤もらしい旨のメッセージや、格助詞「を」を「に」に訂正した「私に言う」という文章を誤り訂正情報として出力することができる。
次に、本実施の形態に係る格助詞識別装置10の作用について説明する。格助詞識別装置10に形態素解析済みの学習用文章集合(テキストデータ)が入力されると、格助詞識別装置10において、図3に示す識別モデル生成処理ルーチンが実行される。そして、識別モデル32が生成されて所定の記憶領域に記憶された状態で、格助詞識別装置10に対象文章(テキストデータ)が入力されると、格助詞識別装置10において、図4に示す格助詞誤り訂正処理ルーチンが実行される。以下、各処理について説明する。
識別モデル生成処理ルーチンでは、ステップ100で、学習用素性抽出部21が、入力された形態素解析済みの学習用文章集合を受け付ける。次に、ステップ102で、学習用素性抽出部21が、学習用文章集合に含まれる学習用文章の各々から、文脈素性及び係り受け素性を抽出する。次に、ステップ104で、学習用素性抽出部21が、学習用文章の各々から、格フレームDB31を参照して、格フレーム素性を抽出する。次に、ステップ106で、学習用素性抽出部21が、学習用文章の各々から抽出された文脈素性、係り受け素性、及び格フレーム素性をまとめて学習用素性とし、学習用素性と学習用文章に付与された正解情報とのペアを学習データとして作成する。
次に、ステップ108で、学習部22が、上記ステップ106において、全ての学習用文章から作成された学習データ集合を受け取って学習し、識別モデル32を生成する。学習部22は、生成した識別モデル32を所定の記憶領域に記憶して、識別モデル生成処理ルーチンを終了する。
次に、格助詞誤り訂正処理ルーチンでは、ステップ120で、対象素性抽出部41が、入力された形態素解析済みの対象文章を受け付ける。次に、ステップ122で、対象素性抽出部41が、対象文章から、文脈素性及び係り受け素性を抽出する。次に、ステップ124で、対象素性抽出部41が、対象文章から、格フレームDB31を参照して、格フレーム素性を抽出し、文脈素性及び係り受け素性とまとめて対象素性とする。
次に、ステップ126で、識別部42が、上記ステップ124でまとめられた対象素性を受け取り、所定の記憶領域に記憶された識別モデル32を用いて、対象文章に含まれる格助詞に対する識別を行う。次に、ステップ128で、識別部42が、対象文章から検出された誤った格助詞に対する正解の格助詞を示す誤り訂正情報を出力して、格助詞誤り訂正処理ルーチンを終了する。
以上説明したように、本実施の形態に係る格助詞識別装置によれば、識別モデルの学習の際、及び識別モデルを用いた識別の際に、学習用文章または対象文章に対応する格フレームが格助詞の使い方が正しい格フレームが登録された格フレームDB中のいずれかの格フレームに一致するか否か示す格フレーム素性を用いるため、識別モデルの学習に用いた学習用文章に、対象文章と全く同じ事例が存在しない場合でもあっても、その文章が許容されない格助詞の使い方であるということを識別可能になる。このため、日本語の文章中の誤った格助詞を精度良く識別することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記実施の形態では、識別モデル生成部と格助詞誤り訂正部とを同一のコンピュータ上で構成する場合について説明したが、別々のコンピュータで構成するようにしてもよい。
また、上記実施の形態では、格助詞の識別として、誤った格助詞を訂正する場合について説明したが、誤った格助詞の検出のみを行うようにしてもよい。この場合、識別モデルを学習する際の学習用文章は、「彼[を:誤り]言う」のように、誤った格助詞の部分を示す情報が付与されたものを用いればよい。
また、上記実施の形態では、形態素解析済みの学習用文章集合または対象文章が入力される場合について説明したが、形態素解析が未処理の文章を入力してもよい。この場合、学習用素性抽出部及び対象素性抽出部の前に、入力された文章を形態素解析する形態素解析部を設けるとよい。
また、上述の格助詞識別装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。また、本発明は、周知のコンピュータに媒体もしくは通信回線を介して、プログラムをインストールすることによっても実現可能である。
10 格助詞識別装置
20 識別モデル生成部
21 学習用素性抽出部
22 学習部
31 格フレームDB
32 識別モデル
40 格助詞誤り訂正部
41 対象素性抽出部
42 識別部

Claims (5)

  1. 日本語の文章中の誤った格助詞を示す正解情報、または誤った格助詞に対する正解の格助詞を示す正解情報が付与された学習用文章から、該学習用文章に対応する格フレームが、格助詞の使い方が正しい格フレームとして予め定められた複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む学習用素性を抽出する学習用素性抽出手段と、
    前記学習用素性抽出手段により、複数の学習用文章の各々から抽出された学習用素性の各々と、前記学習用文章の各々に付与された正解情報とのペアを学習データとして、日本語の文章中の誤った格助詞を識別するための識別モデルを学習する学習手段と、
    を含む格助詞識別装置。
  2. 誤った格助詞の識別対象である日本語の対象文章から、該対象文章に対応する格フレームが、前記複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む対象素性を抽出する対象素性抽出手段と、
    前記対象素性抽出手段により抽出された対象素性と、前記学習手段により学習された識別モデルとに基づいて、前記対象文章中の誤った格助詞を識別する識別手段と、
    を含む請求項1記載の格助詞識別装置。
  3. 学習用素性抽出手段と、学習手段とを含む格助詞識別装置における格助詞識別方法であって、
    前記学習用素性抽出手段が、日本語の文章中の誤った格助詞を示す正解情報、または誤った格助詞に対する正解の格助詞を示す正解情報が付与された学習用文章から、該学習用文章に対応する格フレームが、格助詞の使い方が正しい格フレームとして予め定められた複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む学習用素性を抽出し、
    前記学習手段が、前記学習用素性抽出手段により、複数の学習用文章の各々から抽出された学習用素性の各々と、前記学習用文章の各々に付与された正解情報とのペアを学習データとして、日本語の文章中の誤った格助詞を識別するための識別モデルを学習する
    格助詞識別方法。
  4. 対象素性抽出手段と、識別手段とをさらに含む格助詞識別装置における格助詞識別方法であって、
    前記対象素性抽出手段が、誤った格助詞の識別対象である日本語の対象文章から、該対象文章に対応する格フレームが、前記複数の格フレームのいずれかに一致するか否かを示す格フレーム素性を含む対象素性を抽出し、
    前記識別手段が、前記対象素性抽出手段により抽出された対象素性と、前記学習手段により学習された識別モデルとに基づいて、前記対象文章中の誤った格助詞を識別する
    請求項3記載の格助詞識別方法。
  5. コンピュータを、請求項1または請求項2記載の格助詞識別装置を構成する各手段として機能させるための格助詞識別プログラム。
JP2012264658A 2012-12-03 2012-12-03 格助詞識別装置、方法、及びプログラム Pending JP2014109954A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012264658A JP2014109954A (ja) 2012-12-03 2012-12-03 格助詞識別装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012264658A JP2014109954A (ja) 2012-12-03 2012-12-03 格助詞識別装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2014109954A true JP2014109954A (ja) 2014-06-12

Family

ID=51030537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012264658A Pending JP2014109954A (ja) 2012-12-03 2012-12-03 格助詞識別装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2014109954A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020071608A (ja) * 2018-10-30 2020-05-07 凸版印刷株式会社 文書校正支援システム、文書校正支援装置、学習装置、文書校正支援方法、学習方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02236776A (ja) * 1989-03-10 1990-09-19 Nippon Telegr & Teleph Corp <Ntt> 自然文意味解析処理装置
JP2008176630A (ja) * 2007-01-19 2008-07-31 Toshiba Corp 文書データ処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02236776A (ja) * 1989-03-10 1990-09-19 Nippon Telegr & Teleph Corp <Ntt> 自然文意味解析処理装置
JP2008176630A (ja) * 2007-01-19 2008-07-31 Toshiba Corp 文書データ処理装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSNG201100237233; 大木環美 他4名: '非日本語母国話者の作成するシステム開発文書を対象とした助詞の誤用判定' 言語処理学会第17回年次大会発表論文集 , 20110307, 1047-1050頁, 言語処理学会 *
JPN6014006820; 大木環美 他4名: '非日本語母国話者の作成するシステム開発文書を対象とした助詞の誤用判定' 言語処理学会第17回年次大会発表論文集 , 20110307, 1047-1050頁, 言語処理学会 *
JPN6014039012; Na-Rae Han 他3名: 'Using an Error-Annotated Learner Corpus to Develop an ESL/EFL ErrorCorrection System[online]' LREC 2010 Proceedings , 20100517 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020071608A (ja) * 2018-10-30 2020-05-07 凸版印刷株式会社 文書校正支援システム、文書校正支援装置、学習装置、文書校正支援方法、学習方法、及びプログラム
JP7222218B2 (ja) 2018-10-30 2023-02-15 凸版印刷株式会社 文書校正支援システム、文書校正支援装置、文書校正支援方法、及びプログラム

Similar Documents

Publication Publication Date Title
Tajiri et al. Tense and aspect error correction for ESL learners using global context
WO2018120889A1 (zh) 输入语句的纠错方法、装置、电子设备及介质
CN105988990B (zh) 汉语零指代消解装置和方法、模型训练方法和存储介质
US10762293B2 (en) Using parts-of-speech tagging and named entity recognition for spelling correction
KR101364774B1 (ko) 음성 인식의 오류 수정 방법 및 장치
US9141601B2 (en) Learning device, determination device, learning method, determination method, and computer program product
CN110516248A (zh) 语音识别结果纠错方法、装置、存储介质和电子设备
KR101482430B1 (ko) 전치사 교정 방법 및 이를 수행하는 장치
US11593557B2 (en) Domain-specific grammar correction system, server and method for academic text
US11074406B2 (en) Device for automatically detecting morpheme part of speech tagging corpus error by using rough sets, and method therefor
KR100911834B1 (ko) 번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정 방법 및 장치
CN105373527B (zh) 一种省略恢复方法及问答系统
KR20180078569A (ko) 텍스트 기반의 상황 분류 장치 및 방법
JP6665061B2 (ja) 整合性判定装置、方法、及びプログラム
WO2014191043A1 (en) Entity extraction feedback
WO2015099418A1 (ko) 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템
JP5911931B2 (ja) 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体
JPWO2019092868A1 (ja) 情報処理装置、情報処理方法及びプログラム
US20120265520A1 (en) Text processor and method of text processing
JP5954836B2 (ja) 不理解文判定モデル学習方法、不理解文判定方法、装置、及びプログラム
JP2014109954A (ja) 格助詞識別装置、方法、及びプログラム
KR102571435B1 (ko) 자연어 텍스트의 시간적 문맥 정보 추출 장치 및 방법
Sinha et al. IAI@ SocialDisNER: Catch me if you can! Capturing complex disease mentions in tweets
JP5944859B2 (ja) 評価情報抽出装置、確信度学習装置、方法、及びプログラム
KR101559129B1 (ko) 영단어 추천 방법 및 장치

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140916

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141202