JP5870790B2 - 文章校正装置、及び文章校正方法 - Google Patents

文章校正装置、及び文章校正方法 Download PDF

Info

Publication number
JP5870790B2
JP5870790B2 JP2012062759A JP2012062759A JP5870790B2 JP 5870790 B2 JP5870790 B2 JP 5870790B2 JP 2012062759 A JP2012062759 A JP 2012062759A JP 2012062759 A JP2012062759 A JP 2012062759A JP 5870790 B2 JP5870790 B2 JP 5870790B2
Authority
JP
Japan
Prior art keywords
sentence
proofreading
target
proofread
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012062759A
Other languages
English (en)
Other versions
JP2013196374A (ja
Inventor
友樹 長瀬
友樹 長瀬
育昌 鄭
育昌 鄭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012062759A priority Critical patent/JP5870790B2/ja
Priority to US13/711,144 priority patent/US9087047B2/en
Priority to CN201210574520.4A priority patent/CN103324609B/zh
Publication of JP2013196374A publication Critical patent/JP2013196374A/ja
Application granted granted Critical
Publication of JP5870790B2 publication Critical patent/JP5870790B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Description

本発明は、文章校正装置、及び文章校正方法に関する。
近年、企業等のグローバル化に伴い、日本語を母国語としない外国人による日本語の執筆機会が増加しつつある。これに伴い、外国人等による日本語の執筆を支援するため、作成された文章の誤りや不適切箇所の検出や修正を行う文章校正装置が開発されている。文章校正装置として、例えば、文章を形態素解析した結果に基づき、文章中の不適切な用語を自動的に校正したり、送り仮名や活用語尾の誤用を指摘したりするソフトウェアが商用化されている。あるいは、表記揺れに対する統一的な校正の基準を予め定義しておき、この基準に合わない表記が文章中に検出された場合には、執筆者に修正を促す技術も提案されている。更には、動詞がとり得る助詞や、助詞に付随する名詞の意味内容を基に、文章に含まれる助詞の正否を判別し、誤っている場合には、その助詞を適切な助詞に自動修正する技術も研究されている。
特開平7−85050号公報 特開平5−120275号公報
しかしながら、上述した文章校正技術には、例えば、以下に示す様な問題があった。すなわち、文章中には、送り仮名や表記揺れの様に、辞書引き等の表層的な解析でも解決することができる誤りが存在する一方、助詞の修正の様に、字面を追う表層レベルの解析では解決することが困難な誤りも存在する。例えば、助詞の修正を行う場合、助詞を適用するための動詞や名詞の制約条件が整理された膨大なデータを事前に辞書に登録しておくのが一般的であるが、かかる手法は、文中の動詞を固定して、助詞の妥当性を判別するものである。したがって、動詞自体の用法に誤りがある場合でも、その誤りを修正することは困難である。
具体的には、例えば、校正対象の文として「冬は、雪を降ります。」という文が与えられた場合を想定する。この場合、動詞の「降ります」を固定する手法では、「冬は、雪が降ります。」の様に、助詞を修正する修正候補を挙げることはできるが、「冬には、雪が降ります。」の様に、2ヶ所の助詞を同時に修正すること(複合誤りの修正)は困難である。
また、動詞を固定する手法では、「冬は、雪が降ります。」という候補を挙げることはできるが、「冬は、雪を降らせます。」という別の修正の可能性を提示することは困難である。かかる問題は、文章校正装置が、置換前と置換後の文字列を校正用の辞書に登録しておき、この辞書と原文(校正対象文)とを照合して、検出された誤りを自動的に修正するという手法を用いることで、解決することも可能である。例えば、「を降ります。」を「を降らせます。」に置換するデータを文章校正装置が校正辞書に事前登録しておくことで、上記問題は、解決し得る。しかしながら、上記手法では、「彼の実家は、2月に沢山の雪を降ります。」の様に「降らせます」への置換を適用すべきでない文と、適用すべき文との判別が困難であり、その結果、本来置換すべきでない単語を置換してしまうという問題が生じることがある。このことが、文章の校正精度を低下させる要因となる。
更に、上記制約条件の構築は、通常、人の手作業により行われるため、校正用の辞書の作成には、膨大な工数や時間が必要となる。その上、作業者によるアウトプットのバラつきが生じ易いという問題もある。このことが、文章を校正する際、校正精度の向上を阻害する一因となっていた。
開示の技術は、上記に鑑みてなされたものであって、正確かつ簡易に文章を校正することのできる文章校正装置、及び文章校正方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本願の開示する文章校正装置は、一つの態様において、記憶部と取得部と選択部と校正部とを有する。前記記憶部は、校正前の文と校正後の文とを対応付けて記憶する。前記取得部は、校正対象の文の特徴に基づき、前記校正前の文に対応する前記校正後の文を前記記憶部から取得する。前記選択部は、前記取得部により取得された前記校正後の文の中から、前記校正対象の文と前記校正後の文との類似度が所定の閾値以上である校正後の文を選択する。前記校正部は、前記選択部により選択された前記校正後の文の内、前記類似度が最も高い校正後の文を用いて、前記校正対象の文を校正する。
本願の開示する文章校正装置の一つの態様によれば、正確かつ簡易に文章を校正することができる。
図1は、本実施例に係る文章校正装置の機能構成を示す図である。 図2は、修正履歴コーパスにおけるデータ格納例を示す図である。 図3は、本実施例に係る文章校正装置のハードウェア構成を示す図である。 図4は、本実施例に係る文章校正装置の動作を説明するためのフローチャートである。 図5は、文章校正装置の実行する校正可否判別処理を説明するためのフローチャートである。 図6Aは、対象例文1が校正される過程を説明するための図である。 図6Bは、対象例文1が別の文に校正される過程を説明するための図である。 図7は、校正候補生成部が、対象例文1の校正候補を生成する処理の前半部分を説明するための図である。 図8Aは、校正候補生成部が、対象例文1の校正候補を生成する処理の後半部分を説明するための図である。 図8Bは、校正候補生成部が、対象例文1の別の校正候補を生成する処理を説明するための図である。 図9Aは、校正可否判別部が、対象例文1の校正候補による校正の可否を判別する処理を説明するための図である。 図9Bは、校正可否判別部が、対象例文1の別の校正候補による校正の可否を判別する処理を説明するための図である。 図10Aは、自動校正部が、対象例文1を校正する処理を説明するための図である。 図10Bは、自動校正部が、対象例文1を別の文に校正する処理を説明するための図である。 図11は、対象例文2が校正される過程を説明するための図である。 図12は、対象例文2が校正される過程において、重複部分を判定する方法を説明するための図である。 図13は、校正候補生成部が、対象例文2の校正候補を生成する処理の前半部分を説明するための図である。 図14は、校正候補生成部が、対象例文2の校正候補を生成する処理の後半部分を説明するための図である。 図15は、校正可否判別部が、対象例文2の校正候補による校正の可否を判別する処理を説明するための図である。 図16は、自動校正部が、対象例文2を校正する処理を説明するための図である。 図17は、対象例文3が校正される過程を説明するための図である。 図18は、校正候補生成部が、対象例文3の校正候補を生成する処理の前半部分を説明するための図である。 図19は、校正候補生成部が、対象例文3の校正候補を生成する処理の後半部分を説明するための図である。 図20は、校正可否判別部が、対象例文3の校正候補による校正の可否を判別する処理を説明するための図である。 図21は、自動校正部が、対象例文3を校正する処理を説明するための図である。 図22は、対象例文4が校正される過程を説明するための図である。 図23は、校正候補生成部が、対象例文4の校正候補を生成する処理の前半部分を説明するための図である。 図24は、校正候補生成部が、対象例文4の校正候補を生成する処理の後半部分を説明するための図である。 図25は、校正可否判別部が、対象例文4の校正候補による校正の可否を判別する処理を説明するための図である。 図26は、自動校正部が、対象例文4を校正する処理を説明するための図である。
以下に、本願の開示する文章校正装置、及び文章校正方法の実施例を、図面を参照しながら詳細に説明する。なお、以下の実施例により本願の開示する文章校正装置、及び文章校正方法が限定されるものではない。
まず、本実施例に係る文章校正装置の構成を説明する。図1は、本実施例に係る文章校正装置10の機能構成を示す図である。図1に示す様に、文章校正装置10は、対象文入力部11と修正履歴コーパス12と校正候補生成部13と校正可否判別部14と校正候補整序部15と自動校正部16と校正結果出力部17とを有する。これら各構成部分は、一方向又は双方向に、各種信号やデータの入出力が可能なように接続されている。
対象文入力部11は、校正対象の文書D1を読み込むと、文書D1中の文章を文単位に分割し、1文ずつ、後段の校正候補生成部13に出力する。修正履歴コーパス12は、人が校正作業により発見した誤った文が正しい文に修正された履歴(修正履歴)が、修正前と修正後との対データとして、文単位で格納された更新可能なデータベースである。
図2は、修正履歴コーパス12におけるデータ格納例を示す図である。図2に示す様に、修正履歴コーパス12には、誤りを含む修正前の文が負例として、負例を修正した後の文が正例として、対応付けて格納されている。例えば、修正前の文(負例)が「ここでは、参考程度で図をあげるだけです。」である場合、この文は、助詞である「で」や「だけ」の用法の誤りを含むため、「ここでは、参考程度に図だけを記載します。」が正例として登録されている。ここで、上記誤りは、構文上の誤りに限らず、意味上の誤りであってもよい。例えば、負例が「第1試合は、相手が昨年の優勝校の東高校でした。」である場合、この文は、助詞や句読点の誤りを含むため、「第1試合の相手は、昨年の優勝校の東高校でした。」が正例として登録されている。
なお、負例と正例とは、図2に示す様に、必ずしも1対1に対応付けられている必要はない。すなわち、1つの負例に対して、複数通りの修正が可能な場合には、1つの負例に複数の正例が対応付けて格納されるものとしてもよい。例えば、負例が「冬は、雪を降ります。」である場合、文章校正装置10は、正例として、「冬は、雪が降ります。」、「冬には、雪が降ります。」、「冬は、雪を降らせます。」という3種類の文を事前に登録しておくものとしてもよい。これとは反対に、修正履歴コーパス12内に、複数の負例に共通する1つの正例が格納されるものとしてもよい。
校正候補生成部13は、修正履歴コーパス12を検索し、自動校正に使えそうな上記修正履歴の候補リストを作成し、該候補リストを、更新可能な校正候補一時格納部131に格納させる。校正候補生成部13は、テキスト解析部132に、対象文入力部11に入力された対象文と修正履歴コーパス12の検索結果である負例文との形態素解析を実行させることで、対象文と負例とに共通する文字列(共通文字列)を単語単位で認識する。校正候補生成部13は、負例に対応する正例についても同様に、テキスト解析部132に形態素解析を実行させ、負例と正例との間で相違する文字列(相違文字列)を単語単位で認識する。また、校正候補生成部13は、対象文と負例テキストとの共通部分と、負例テキストと正例テキストとの相違部分と、の共通部分を置換文字列とみなし、該置換文字列が存在する負例と正例とのペアを校正候補として、校正候補一時格納部131に残す。そして、校正候補生成部13は、校正候補一時格納部131から他の候補を削除する。
校正可否判別部14は、校正候補一時格納部131に残存する校正候補に対し、対象文の校正に使用することができる候補であるか否かのチェックを行う。すなわち、校正可否判別部14は、テキスト解析部132に構文解析を実行させることで、校正候補生成部13により作成された上記候補リストに掲載された校正候補の中から、対象文の校正に実際に利用可能と推測される校正候補を選択し、校正候補の絞込みを行う。また、校正可否判別部14は、校正候補の絞込みに際し、文節互換性判別部141に、対象文と正例とに対する構文解析を実行させる。この構文解析は、上述の形態素解析と同様に、更新可能な単語辞書141aを参照して実行される。
具体的には、校正可否判別部14は、構文解析を実行した結果、置換文字列が自立語である場合には、置換語と被置換語との間における構文的及び意味的な類似度を評価する。また、置換文字列が助詞または用言の語尾である場合には、校正可否判別部14は、該置換文字列を含む文節の中心語同士の類似度を評価する。更に、置換文字列が自立語である場合には、校正可否判別部14は、該置換文字列を含む文節が係っている単語同士の類似度を評価する。校正可否判別部14は、上記評価により得られた単語間類似度の評価結果に基づき、各々の置換候補に評価点を付与する。そして、この評価点が所定の閾値を下回る置換候補(校正不可候補)を、上述の校正候補から除外する。これにより、評価点が閾値以上の校正候補のみが、校正候補一時格納部131に残ることとなる。
校正候補整序部15は、現時点で校正候補一時格納部131に格納されている各校正候補毎の評価点に従い、評価点の高い順に、校正候補を並べ替える。自動校正部16は、校正候補整序部15による校正候補の並替えの結果、最上位に位置することとなった校正候補を特定し、該校正候補の置換文字列により、校正対象文の該当部分(文字列)を置き換える。自動校正部16は、特定された校正候補による文字列の置換を、自動で行うものとしてもよいが、これに限らず、ユーザによる指示を待って、文字列を置換するものとしてもよい。校正結果出力部17は、上記校正候補を以って校正された文を、表示装置10dを介してユーザに提示する。
次に、文章校正装置10のハードウェア構成を説明する。図3は、文章校正装置10のハードウェア構成を示す図である。図3に示す様に、文章校正装置10は、プロセッサ10aと、記憶装置10bと、入力装置10cと、表示装置10dとが、バスを介して各種信号やデータの入出力が可能なように接続されている。プロセッサ10aは、例えば、CPU(Central Processing Unit)、DSP(Digital Signal Processor)である。記憶装置10bは、例えば、HD(Hard Disk)、ROM(Read Only Memory)、フラッシュメモリ等の不揮発性記憶装置の他、SDRAM(Synchronous Dynamic Random Access Memory)等のRAMを含む。また、入力装置10cは、例えば、キーボード、マウス、タッチパネルにより構成され、表示装置10dは、例えば、LCD(Liquid Crystal Display)、ELD(Electro Luminescence Display)、CRT(Cathode Ray Tube)により構成される。
図1に示した文章校正装置10の対象文入力部11は、ハードウェアとしての入力装置10cにより実現される。修正履歴コーパス12と校正候補一時格納部131と単独辞書141aとは、ハードウェアとしての記憶装置10bにより実現される。また、校正候補生成部13と校正可否判別部14と校正候補整序部15と自動校正部16とテキスト解析部132と文節互換性判別部141とは、ハードウェアとしてのプロセッサ10aにより実現される。校正結果出力部17は、ハードウェアとしての表示装置10dにより実現される。
次に、文章校正装置10の動作を説明する。図4は、本実施例に係る文章校正装置10の動作を説明するためのフローチャートである。
まずS1では、校正候補生成部13は、対象文入力部11に校正対象の文が入力されたことを契機として、対象文に対する形態素解析及び構文解析を実行する。これにより、校正候補生成部13は、上記形態素解析の結果として、対象文を構成する形態素の一覧である形態素リストと、対象文を文節に分解した文節リストとを取得する。併せて、校正候補生成部13は、形態素解析の結果として得られた各形態素の係り元と係り先との構造を含む概念構造(Conceptual Structure)を、上記構文解析の結果として取得する。
S2では、校正候補生成部13は、S1でテキスト解析(形態素解析、構文解析等)の施された校正対象文の特徴を基に、修正履歴コーパス12に格納されている負例テキストを検索する。これにより、S1で入力された対象文と同様の特徴を有する負例に対応する正例が、修正履歴コーパス12から抽出され、対応する負例と共に、修正履歴リストとしてリスト化される。上記検索の結果、対象文と同様の特徴を有する負例が修正履歴コーパス12内に存在しない場合(S3;No)、文章校正装置10は一連の処理を終了するが、存在する場合(S3;Yes)には、校正候補生成部13は、校正可否判別部14に対し、上記負例を用いた校正の可否の判別を指示する。
校正可否判別部14は、校正候補生成部13から校正可否の判別を指示されると、該指示に従い、後述するS4〜S7の各処理を実行する。S4では、校正可否判別部14は、校正可否判別処理を実行することで、上記修正履歴リストに掲載されている複数の校正候補の中から、実際に校正に使用することができる候補を選択し、校正候補の絞込みを行う。S3〜S7の一連の処理は、上記修正履歴リストに掲載されている全ての校正候補に対して個別に実行され、リスト上の全ての校正候補について上記一連の処理の実行が完了した時点で終了する。
図5は、文章校正装置の実行する校正可否判別処理を説明するためのフローチャートである。校正可否判別処理では、まず、校正可否判別部14は、修正履歴コーパス12から引かれた校正候補データを構成する、負例テキストと正例テキストとの各々を形態素解析する(S401)。次に、校正可否判別部14は、校正対象文に対する形態素解析結果と上記負例テキストに対する形態素解析結果とを比較し、重複する文字列を特定する(S402)。続いて、校正可否判別部14は、上記負例テキストに対する形態素解析結果と上記正例テキストに対する形態素解析結果とを比較し、相違する文字列を特定する(S403)。S404では、校正可否判別部14は、S402にて特定された上記重複する文字列と、S403にて特定された上記相違する文字列とを比較し、これらの文字列が重複する部分の文字列を特定する。
S404における特定の結果、重複部分が存在しない場合(S405;No)には、後述するS419の処理に移行するが、重複部分が存在する場合(S405;Yes)には、校正可否判別部14は、対象文に含まれる全ての重複部分に対して、後述するS406〜S417の一連の処理を繰り返し実行する。
すなわち、校正可否判別部14は、類似度に初期値(例えば、100)を設定(S406)した後、対象文と負例テキストと正例テキストとにおいて、S404で特定された重複部分に対応する文節を更に特定する(S407)。次に、校正可否判別部14は、上記重複部分が付属語であるか自立語であるかを判定する(S408)。当該判定の結果、上記重複部分が付属語である場合(S408;Yes)、校正可否判別部14は、上記対象文と上記負例テキストとにおいて、上記重複部分(S404で特定された重複部分)を含む文節の中心語の相違度を評価する(S409)。一方、上記重複部分が自立語である場合(S408;No)、校正可否判別部14は、上記対象文と上記負例テキストとにおいて、上記重複部分の文節(S407で特定された文節)の相違度を評価する(S411)。
S411では、校正対象文と正例テキストとの類似度が算出される。類似度の初期値としては、例えば100の値が設定されているため、この場合、S409またはS410で算定された上記相違度の評価値を100から減算(減点)した値が、類似度として設定される(S411)。
S412では、校正可否判別部14は、対象文における上記重複部分(以下、「RPC1」と記す。)の品詞が助詞であるか否かの判定を行う。当該判定の結果、RPC1が助詞でない場合(S412;No)には、校正可否判別部14は、RPC1の係り先である自立語と、正例における上記重複部分(以下、「RPC3」と記す。)の係り先である自立語との相違度を評価する(S413)。
これに対して、S412における判定の結果、RPC1の品詞が助詞である場合(S412;Yes)には、校正可否判別部14は、RPC1に付随する助詞を、RPC3に付随する助詞に置き換えた上で、対象文を構文解析する(S414)。S415では、助詞の置き換えによって得られた暫定修正文節(以下、「RPC4」と記す。)に関し、S413と同様の処理が実行される。すなわち、校正可否判別部14は、RPC4の係り先である自立語と、RPC3の係り先である自立語との相違度を評価する(S415)。
ここで、暫定修正文節の作成について、具体的に説明する。上記重複部分に対応する文節が付属語を含む場合、修正後の文節の係り先が修正前と異なる可能性がある。このため、校正可否判別部14は、上記重複部分に対応する文節の係り先である自立語の相違度を評価する際、修正されたRPC1の係り先を評価すべきである。そこで、校正可否判別部14は、修正後の係り先を同定するため、RPC1の付属語を、負例における上記重複部分(以下、「RPC2」と記す。)に対応するRPC3の付属語に修正することで、暫定修正文節(RPC4)を作成する。これにより、校正可否判別部14は、RPC4を含む対象文を解析し、RPC4の係り先を同定することができる。その結果、校正可否判別部14は、自立語の相違度を評価する際、RPC4の係り先を用いて評価することが可能となる。
S416では、校正対象文と正例テキストとの類似度が再び算出される。すなわち、S411で算出された類似度から、S413またはS415で算定された上記相違度の評価値を減算した値が、新たな類似度として設定される(S416)。
次に、校正可否判別部14は、S416で設定された類似度と、事前に設定されている所定の閾値とを比較し(S417)、類似度が閾値以上である場合(S417;No)には、校正対象文と正例テキストとの類似度が高く、現在の校正候補により校正を実行することが有効であるとの判断が可能である。したがって、校正可否判別部14は、判定対象の校正候補による校正を「可」に設定した後(S418)、図4のS5に示す処理を実行する。一方、上記類似度が閾値未満である場合(S417;Yes)には、校正対象文と正例テキストとの類似度が低く、現在の校正候補により校正を実行することは有効でないとの判断が可能である。したがって、校正可否判別部14は、判定対象の校正候補による校正を「不可」に設定した後(S419)、図4のS5に示す処理を実行する。なお、S405において、重複部分が無いと判定された場合(S405;No)にも、上述したように、S419の処理に移行する。
なお、判定対象の対象文に含まれる全ての重複部分に対する校正可否判定が完了した場合にも同様に、校正可否判別部14は、判定対象の校正候補による校正を「可」に設定する。その上で、図4のS5に示す処理に移行する。
図4に戻り、校正可否判別部14は、S4の校正可否判別処理の結果、校正候補による校正が可能であると判定された場合(S5;Yes)、修正履歴コーパス12を参照して、対象文の校正箇所を特定し、該校正箇所に対応する校正候補テキストを生成する(S6)。校正可否判別部14は、S6で生成された校正候補テキストを使用した校正の妥当性を自動評価し、評価値として点数化する(S7)。なお、上記S5において、校正候補による校正が不可であると判定された場合(S5;No)には、S3〜S7の一連のループの始点に戻り、文章校正装置10は、S3以降の処理を再び実行する。
上記修正履歴リストに掲載されている全ての校正候補に関し、校正の可否判定及び校正の妥当性評価が完了すると、校正可否判別部14は、後段の校正候補整序部15に対し、S6で生成された校正候補テキストの並べ替えを指示する。校正候補整序部15は、該指示に従い、S7で点数化された妥当性評価値の降順に、校正候補テキストを並べ替える(S8)。
S9では、自動校正部16は、現在の校正モードが自動校正であるか、ユーザによる手動校正であるかの判定を行う。自動校正モードに設定されている場合(S9;Yes)には、自動校正部16は、S8で評価値の降順に並べ替えられた校正候補の内、最上位に位置する校正候補により、対象文を自動的に書き換える(S10)。書換えの結果は、校正結果として、校正結果出力部17に表示される。一方、手動校正モードに設定されている場合(S9;No)には、自動校正部16は、S8で並べ替えられた全ての校正候補を、校正妥当性評価値の降順に、校正結果出力部17に表示させ(S11)、ユーザによる選択操作を待機する。
続いて、単語や文節間の相違度を評価する方法(図5に示したS409、S410)について、より詳細に説明する。相違度の評価として、例えば、表記(Txt)、構文的特徴(Syn)、意味クラス(Sem)、意味関係(Rel)、及びこれらの組合せによる評価が可能である。表記による相違度評価では、校正可否判別部14は、表記の文字列の重複度合いに基づき、類似度を判定する。表記による相違度評価では、例えば、一方の文字列を他方の文字列に編集するために、挿入、削除、置換等の操作を最低何回行う必要があるかを数値化したもの(レーベンシュタイン距離)を用いることができる。また、構文的特徴による相違度評価では、校正可否判別部14は、単語辞書の有する構文属性を利用し、品詞間における必須格の総数及び必須格の重複から、相違度を点数化する。例えば、動詞の単語辞書を用いる場合において、動詞1と動詞2とに関し、必須格の総数として“5”が、必須格の重複として“1”が与えられている場合、相違度は、“4(=5−1)”と算出される。
意味クラスによる相違度評価には、例えば、辞書の有する意味属性を利用する手法、外部データを利用する手法、正例のクラスタリング情報を利用する手法がある。辞書の有する意味属性を利用する手法では、校正可否判別部14は、シソーラスをルートから辿った場合に分岐が生じるまでの深さを、単語間の類似度と定義し、シソーラスの最大深度から該類似度を減算した値を、相違度の評価値とする。例えば、最大深度が“5”のシソーラスを想定すると、単語A、B間の類似度が“0”の場合、相違度は“5(=5−0)” と算出される。同様に、単語B、C間の類似度が“2”の場合、相違度は“3(=5−2)” と算出される。また、外部データを利用する手法では、校正可否判別部14は、シソーラスとして、外部で参照可能なリソースを活用する。更に、正例のクラスタリング情報を利用する手法では、校正可否判別部14は、クラスタリング技術を用いて、大量の正例テキストを対象として単語を分類し、同一の分類に属する単語を意味的に近い単語とみなす。
意味関係による相違度評価では、校正可否判別部14は、単語そのものの評価は行わず、単語間の修飾、被修飾の関係を評価対象に加える。例えば、校正可否判別部14は、関係アークの重複を利用し、係り受けのラベルが同一である場合には相違度を“0”とし、異なる場合には相違度を“5”とする。
相違度の評価値は、係数a、b、c、dを用いて、例えば、以下の算定式(1)により、算定される。なお、上記算定式(1)は、上述した4種類の相違度評価手法を複合的に組み合わせて生成された式であるが、必ずしも全ての手法を用いる必要はなく、その組合せや順列についても、校正に要求される精度や時間に応じて、適宜変更可能である。
相違度評価値=a*Txt/単語長+b*Syn+c*Sem+d*Rel・・・(1)
上述したように、文章校正装置10には、類似度の初期値として100が設定されており、対象文と正例文との現在の類似度(=前回までの類似度−相違度評価値)<閾値となった時点で、その正例文は、校正候補から除外される。
以下、4つの対象例文を用いて、文章校正装置10による自動校正の方法について、より詳細に説明する。
(対象例文1)
まず、図6A〜図10Bを参照しながら、対象例文1に含まれる2つの助詞を同時に校正する態様を説明する。対象例文1は、「梅雨は雨を降ります。」である。対象例文1は、複数の助詞「は」、「を」の誤りを複合的に有し、2通りの訂正が可能である。
図6Aは、対象例文1が校正される過程を説明するための図である。図6Aに示す様に、校正対象の文として「梅雨は雨を降ります。」が与えられると、この文と同様の特徴を有する校正前の文「冬は雪を降ります。」が、修正履歴コーパス12から検索され、対象文との共通部分A1、A2が特定される。次に、修正履歴コーパス12内に上記校正前の文と対応付けて格納されている校正後の文「冬には雪が降ります。」と、上記校正前の文との相違部分B1、B2が特定される。更に、対象文と校正前の文との間で、自立語C1〜C4の構文上及び意味上の類似度がチェックされ、所定の類似度に達している場合には、上記校正前の文による校正が可能と判定される。その結果、上記校正前の文が自動校正用の文に採用され、自動校正後の文として「梅雨には雨が降ります。」が出力される。なお、自動校正後の文の内、右下がり斜線の施された文字列(「には」、「が」)は、校正により変更された文字列を表す。また、矢印Y1、Y2は、それぞれ下線の付された文字列(「冬には」、「雪が」)の係り先が「降」ります、であることを示す。
次に、対象例文1の2つ目の校正候補について説明する。図6Bは、対象例文1が別の文に校正される過程を説明するための図である。図6Bに示す様に、校正対象の文として「梅雨は雨を降ります。」が与えられると、この文と同様の特徴を有する校正前の文「冬は雪を降ります。」が、修正履歴コーパス12から検索され、対象文との共通部分A1、A2が特定される。次に、修正履歴コーパス12内に上記校正前の文と対応付けて格納されている校正後の文「冬は雪を降らせます。」と、上記校正前の文との相違部分B3が特定される。更に、対象文と校正前の文との間で、自立語C1〜C4の構文上及び意味上の類似度がチェックされ、所定の類似度に達している場合には、上記校正前の文による校正が可能と判定される。その結果、上記校正前の文が自動校正用の文に採用され、自動校正後の文として「梅雨は雨を降らせます。」が出力される。なお、自動校正後の文の内、右下がり斜線の施された文字列(「らせ」)は、校正により変更された文字列を表す。また、矢印Y3、Y4は、それぞれ下線の付された文字列(「冬は」、「雪を」)の係り先が「降」ります、であることを示す。
以下、図7〜図10Aを参照し、対象文の入力から自動校正後の文の出力までの処理を、より具体的に説明する。図7は、校正候補生成部13が、対象例文1の校正候補を生成する処理の前半部分を説明するための図である。図7に示す様に、対象例文1は、形態素解析を適用された結果、「梅雨/は/雨/を/降/り/ます/。」の各形態素に分解される。更に、対象例文1は、構文解析を適用された結果、各形態素間の係り受け関係が特定される。この係り受け関係を有する3つの形態素“梅雨、降、雨”が、修正履歴コーパス12の検索キーワードとして選定される。すなわち、対象例文1からは、「梅雨(季節)&降」、「雨(天候)&降」の2パターンの検索キーワードが抽出される。修正履歴コーパス12の検索では、表記が一致しない場合でも、意味クラス(括弧内の文字列)での検索が可能である。対象例文1の場合、梅雨の意味クラスは、冬の意味クラスと同じ季節であることから、「梅雨」は「冬」とマッチし、「雨」は、雪と同じ天候の意味クラスに属することから、「雪」とマッチする。
校正候補生成部13は、対象文を形態素解析及び構文解析した後、その結果を用いて、対象文と負例テキストとの対応解析を行い、対象文と負例テキストとの共通部分E1、E2、E3を認識する。共通部分の認識は、意味クラスを含めて行われる。したがって、「梅雨」と「冬」、「雨」と「雪」は、表記上は異なるが、同一の意味クラスに分類される単語であることから、「降」と同様に、共通部分として認識される。修正履歴コーパス12には、負例テキストの1つとして「冬は雪を降ります。」が登録されている。このため、図7に示す様に、2組の検索キーワード「梅雨(季節)&降」と「雨(天候)&降」とにより、双方のキーワードを文中に含む負例テキスト及びこれに対応する正例テキストが抽出される。対象例文1では、負例テキスト「冬は雪を降ります。」に対応する正例テキストが2種類登録されており、「冬には雪が降ります。」と「冬は雪を降らせます。」の2種類の正例テキストα、βが、修正履歴コーパス12から読み出される。なお、本実施例では、1回の係り受けに関係する2語を検索キーワードとする態様を例示したが、これに限らず、校正候補生成部13は、2回の係り受けに関係する3語、あるいは、3回の係り受けに関係する4語を検索キーワードに設定するものとしてもよい。
図8Aは、校正候補生成部13が、対象例文1の校正候補を生成する処理の後半部分を説明するための図である。修正履歴コーパス12には、負例テキストの1つとして「冬は雪を降ります。」が登録されている。このため、図8Aに示す様に、双方の検索キーワード「梅雨&降」及び「雨&降」により、「冬」と「降」とを共に含む負例テキスト及びこれに対応する正例テキストが抽出される。校正候補生成部13は、負例テキストを構文解析した後、その結果を用いて、負例テキストと対象文との対応解析を行い、対象文と負例テキストとの共通部分を認識する。更に、校正候補生成部13は、負例テキストと正例テキストとの対応解析を行い、負例テキストと正例テキストとの相違部分を認識する。
上述の対応解析は、他方の正例テキスト「冬/は/雪/を/降/らせ/ます/。」についても同様に実行される。なお、図8A、図8Bにおいて、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。また、下線の付された文字列は、負例テキストと対象文とに共通する文字列(共通部分)であり、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)である。対象文と負例との共通部分(下線部)に、負例と正例との相違部分(右下がり斜線部)が含まれる場合には、校正候補生成部13は、該当する文字列を、置き換えに利用できる履歴の候補に加えると共に、それ以外の文字列を候補から除外する。その結果、図8A、図8Bに示す例では、下線が付された部分の内、右下がり斜線部の文字列である「は、を」と「り」とが校正候補にそれぞれ追加される。
次に、図9Aは、校正可否判別部14が、対象例文1の校正候補による校正の可否を判別する処理を説明するための図である。図9Aに示す様に、校正可否判別部14は、まず、負例テキストと対象文との単語の対比を行う。すなわち、校正可否判別部14は、負例テキスト中の校正された文字列(右下がり斜線部)と、対象文と負例テキストとで重複する文字列(下線部分)との重複部分の単語を特定する。対象例文1では、「は」及び「を」がこれに該当する。
次いで、校正可否判別部14は、対象文と負例テキストとで異なる文節をチェックする。すなわち、校正可否判別部14は、上記特定された単語の品詞が付属語(例えば、助詞、助動詞、活用語尾等)である場合には、その単語により形成される文節の中心を為す自立語を特定する。更に、上記特定された、負例テキスト中の単語に対応する単語を、対象文の中で特定する。対象例文1では、図9Aに示す様に、対象文中の自立語として「梅雨」が、負例テキスト中の自立語として「冬」がそれぞれ特定される。これらの単語を1つ目の対応語とする。同様に、対象文中の自立語として「雨」が、負例テキスト中の自立語として「雪」がそれぞれ特定される。これらの単語を2つ目の対応語とする。校正可否判別部14は、上記2つの対応語に関し、単語間の類似度を評価する。対象例文1では、「梅雨」と「冬」とは何れも季節の意味クラスに属し、単語間の類似度が高いことから、修正履歴データを用いた自動校正は可能であると判定される。したがって、正例テキストにおける単語「には」は、校正可否条件チェックをクリアする。同様に、対象例文1では、「雨」と「雪」とは何れも天候の意味クラスに属し、単語間の類似度が高いことから、修正履歴データを用いた自動校正は可能であると判定される。したがって、正例テキストにおける単語「が」も、校正可否条件チェックをクリアする。
上述の校正可否判別処理は、他方の正例テキスト「冬/は/雪/を/降/らせ/ます/。」についても同様に実行される。図9Bは、校正可否判別部14が、対象例文1の別の校正候補による校正の可否を判別する処理を説明するための図である。図9Bに示す様に、2つ目の正例テキストにつき、対象文中の自立語として「降」が、負例テキスト中の自立語として「降」がそれぞれ特定される。これらの単語を対応語とする。校正可否判別部14は、この対応語に関し、単語間の類似度を評価する。対象例文1では、「降」と「降」とは何れも同一の単語であり、単語間の類似度が高いことから、修正履歴データを用いた自動校正は可能であると判定される。したがって、正例テキストにおける単語「らせ」は、校正可否条件チェックをクリアする。
図10Aは、自動校正部16が、対象例文1を校正する処理を説明するための図である。図10Aに示す様に、自動校正部16は、負例テキストと正例テキストとの間で異なる文字列を、負例テキストから対象文に移行する。その結果、対象文は、「は」、「を」の各単語に、右下がり斜線の施された状態となる。その後、自動校正部16は、対象文と正例テキストとの間で異なる文字列を、正例テキストにおいて対応する文字列に置き換える。これにより、校正後の対象文である「梅雨には雨が降ります。」が生成及び出力される。なお、図10Aにおいて、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)であり、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。相違部分であり、かつ、検索キーワードにマッチした文字列には、右下がり斜線が優先的に施されている。
上述の自動校正処理は、他方の正例テキスト「冬/は/雪/を/降/らせ/ます/。」についても同様に実行される。図10Bは、自動校正部16が、対象例文1を別の文に校正する処理を説明するための図である。図10Bに示す様に、自動校正部16は、負例テキストと正例テキストとの間で異なる文字列を、負例テキストから対象文に移行する。その結果、対象文は、「り」の単語に右下がり斜線の施された状態となる。その後、自動校正部16は、対象文と正例テキストとの間で異なる文字列を、正例テキストにおいて対応する文字列に置き換える。これにより、校正後の対象文である「梅雨は雨を降らせます。」が生成及び出力される。
(対象例文2)
次に、図11〜図16を参照しながら、対象例文2に含まれる助詞と動詞を同時に校正する態様を説明する。対象例文2は、「パラメータの文字列転換はされていない。」である。対象例文2は、助詞「の」、動詞「転換」の誤りを複合的に有する。
図11は、対象例文2が校正される過程を説明するための図である。図11に示す様に、校正対象の文として「パラメータの文字列転換はされていない。」が与えられると、この文と同様の特徴を有する校正前の文「引数のエンコード転換はされていない。」が、修正履歴コーパス12から検索され、対象文との共通部分A3、A4が特定される。次に、修正履歴コーパス12内に上記校正前の文と対応付けて格納されている校正後の文「引数がエンコード変換されていない。」と、上記校正前の文との相違部分B4、B5が特定される。更に、対象文と校正前の文との間で、自立語C5〜C8の構文上及び意味上の類似度がチェックされ、所定の類似度に達している場合には、上記校正前の文による校正が可能と判定される。その結果、上記校正前の文が自動校正用の文に採用され、自動校正後の文として「パラメータが文字列変換されていない。」が出力される。なお、自動校正後の文の内、右下がり斜線の施された文字列(「が」、「変換」)は、校正により変更された文字列を表す。また、矢印Y11は、下線の付された「引数が」の係り先が「変換」であることを示す。
図12は、対象例文2が校正される過程において、重複部分を判定する方法を説明するための図である。文章校正装置10は、自動校正部16により、重複部分判定テーブル161を参照して、対象文の校正を行う。図12に示す様に、対象例文2「パラメータの文字列転換はされていない。」は、9つの単語から構成される。自動校正部16は、対象例文2を、負例テキスト「引数のエンコード転換はされていない。」と単語単位で比較し、共通する「の」、「転換」、「は」の各単語に、共通部分フラグ“1”を設定する。次に、自動校正部16は、負例テキストを、正例テキスト「引数がエンコード変換されていない。」と単語単位で比較し、相異なる「の、が」、「転換、変換」、「は、−」の各単語に、相違部分フラグ“0”を設定する。そして、自動校正部16は、共通部分フラグとして“1”が、相違部分フラグとして“0”がそれぞれ設定された部分Z1、Z2、Z3を対象とし、正例テキストへの置換による校正を行う。このとき、何れのフラグも設定されていない単語(例えば、引数、エンコード)、共通部分フラグのみが設定されている単語(例えば、され、ていな、い、。)、及び相違部分フラグのみが設定されている単語については、対象文の単語(例えば、パラメータ、文字列、され、ていな、い、。)が、原文のまま使用される。その結果、自動校正後の対象文として、「パラメータが文字列変換されていない。」が生成される。
以下、図13〜図16を参照し、対象文の入力から自動校正後の文の出力までの処理を、より具体的に説明する。図13は、校正候補生成部13が、対象例文2の校正候補を生成する処理の前半部分を説明するための図である。図13に示す様に、対象例文2は、形態素解析を適用された結果、「パラメータ/の/文字列/転換/は/され/ていな/い/。」の各形態素に分解される。更に、対象例文2は、構文解析を適用された結果、各形態素間の係り受け関係が特定される。この係り受け関係を有する4つの形態素“パラメータ、文字列、転換、され”が、修正履歴コーパス12の検索キーワードとして選定される。すなわち、対象例文2からは、「パラメータ&文字列」、「文字列&転換」、「転換&され」の3パターンの検索キーワードが抽出される。なお、本実施例では、1回の係り受けに関係する2語を検索キーワードとする態様を例示したが、これに限らず、校正候補生成部13は、2回の係り受けに関係する3語、あるいは、3回の係り受けに関係する4語を検索キーワードに設定するものとしてもよい。
図14は、校正候補生成部13が、対象例文2の校正候補を生成する処理の後半部分を説明するための図である。修正履歴コーパス12には、負例テキストの1つとして「引数のエンコード転換はされていない。」が登録されている。このため、図14に示す様に、3つ目の検索キーワード「転換&され」により、「転換」と「され」の双方を文中に含む負例テキスト及びこれに対応する正例テキストが抽出される。校正候補生成部13は、負例テキストを構文解析した後、その結果を用いて、負例テキストと対象文との対応解析を行い、対象文と負例テキストとの共通部分を認識する。更に、校正候補生成部13は、負例テキストと正例テキストとの対応解析を行い、負例テキストと正例テキストとの相違部分を認識する。
なお、図14において、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。また、下線の付された文字列は、負例テキストと対象文とに共通する文字列(共通部分)であり、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)である。対象文と負例との共通部分(下線部)に、負例と正例との相違部分(右下がり斜線部)が含まれる場合には、校正候補生成部13は、該当する文字列を、置き換えに利用できる履歴の候補に加えると共に、それ以外の文字列を候補から除外する。その結果、図14に示す例では、下線が付された部分の内、右下がり斜線部の文字列である「の、転換、は」が校正候補に追加される。
次に、図15は、校正可否判別部14が、対象例文2の校正候補による校正の可否を判別する処理を説明するための図である。図15に示す様に、校正可否判別部14は、まず、負例テキストと対象文との単語の対比を行う。すなわち、校正可否判別部14は、負例テキスト中の校正された文字列(右下がり斜線部)と、対象文と負例テキストとで重複する文字列(下線部分)との重複部分の単語を特定する。対象例文2では、「の」及び「転換」がこれに該当する。
校正可否判別部14は、次いで、対象文と負例テキストとで異なる文節をチェックする。すなわち、校正可否判別部14は、上記特定された単語の品詞が付属語(例えば、助詞、助動詞、活用語尾等)である場合には、その単語により形成される文節の中心を為す自立語を特定する。更に、上記特定された、負例テキスト中の単語に対応する単語を、対象文の中で特定する。対象例文2では、図15に示す様に、対象文中の自立語として「パラメータ」が、負例テキスト中の自立語として「引数」がそれぞれ特定される。これらの単語を1つ目の対応語とする。これに対し、上記特定された単語の品詞が自立語(例えば、名詞、動詞等)である場合には、校正可否判別部14は、その単語(自立語)を特定する。更に、この特定された、負例テキスト中の単語に対応する単語を、対象文の中で特定する。対象例文2では、図15に示す様に、対象文中の自立語として「転換」が、負例テキスト中の自立語として「変換」がそれぞれ特定される。これらの単語を2つ目の対応語とする。校正可否判別部14は、上記2つの対応語に関し、単語間の類似度を評価する。
次に、校正可否判別部14は、修飾語及び被修飾語をチェックする。すなわち、校正可否判別部14は、正例テキストに対する構文解析により、上記特定された各単語に対応する単語の係り受け構造を検出する。対象例文2は、図15に示す様に、「転換」を「の」の係り先(矢印Y18)として有する。対象例文2では、図15に示す様に、「変換」が、「引数」の係り先(矢印Y19)となると共に「エンコード」の係り先(矢印Y20)となる係り受け構造が、検出される。校正可否判別部14は、対象文中で特定された単語に対応する、正例テキスト中の単語と、当該対象文中の単語との間で、修飾語及び被修飾語の類似度を評価する。対象例文2では、図15に示す様に、矢印Y19に示す係り先の単語である「変換」及び「転換」間の類似度が高いことから、修正履歴データを用いた自動校正は可能であると判定される。したがって、正例テキストにおける矢印Y19の係り先の単語「変換」は、校正可否条件チェックをクリアする。同様に、矢印Y20に示す係り元の単語である「エンコード」及び「文字列」間の類似度は高いことから、修正履歴データを用いた自動校正は可能であると判定される。したがって、正例テキストにおける矢印Y20の係り元の単語「エンコード」も、校正可否条件チェックをクリアする。
図16は、自動校正部16が、対象例文2を校正する処理を説明するための図である。図16に示す様に、自動校正部16は、負例テキストと正例テキストとの間で異なる文字列を、負例テキストから対象文に移行する。その結果、対象文は、「の」、「転換」、「は」の各単語に、右下がり斜線の施された状態となる。その後、自動校正部16は、対象文と正例テキストとの間で異なる文字列を、正例テキストにおいて対応する文字列に置き換える。これにより、校正後の対象文である「パラメータが文字列変換されていない。」が生成及び出力される。なお、図16において、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)であり、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。相違部分であり、かつ、検索キーワードにマッチした文字列には、右下がり斜線が優先的に施されている。
(対象例文3)
次に、図17〜図21を参照しながら、連体修飾助詞が連用修飾助詞に校正される態様を説明する。
図17は、対象例文3が校正される過程を説明するための図である。図17に示す様に、校正対象の文として「ローカルとリモートの流れが大きく異なる。」が与えられると、この文と同様の特徴を有する校正前の文「ローカルとリモートの流れが違いますので、ご注意。」が、修正履歴コーパス12から検索され、対象文との共通部分A5が特定される。次に、修正履歴コーパス12内に上記校正前の文と対応付けて格納されている校正後の文「ローカルとリモートで流れが違いますので、注意してください。」と、上記校正前の文との相違部分B6〜B8が特定される。更に、対象文と校正後の文との間で、自立語C9、C10の構文上及び意味上の類似度がチェックされ、所定の類似度に達している場合には、上記校正後の文による校正が可能と判定される。その結果、上記校正後の文が自動校正用の文に採用され、自動校正後の文として「ローカルとリモートの流れが大きく異なる。」が出力される。なお、自動校正後の文の内、右下がり斜線の施された文字列「で」は、校正により変更された文字列を表す。
以下、図18〜図21を参照し、対象文の入力から自動校正後の文の出力までの処理を、より具体的に説明する。図18は、校正候補生成部13が、対象例文3の校正候補を生成する処理の前半部分を説明するための図である。図18に示す様に、対象例文3は、形態素解析を適用された結果、「ローカル/と/リモート/の/流れ/が/大きく/異なる/。」の各形態素に分解される。更に、対象例文3は、構文解析を適用された結果、各形態素間の係り受け関係が特定される。この係り受け関係を有する5つの形態素“ローカル、リモート、流れ、大きく、異なる”が、修正履歴コーパス12の検索キーワードとして選定される。すなわち、対象例文3からは、「ローカル&リモート」、「リモート&流れ」、「流れ&異なる」、「大きく&異なる」の4パターンの検索キーワードが抽出される。なお、本実施例では、1回の係り受けに関係する2語を検索キーワードとする態様を例示したが、これに限らず、校正候補生成部13は、2回の係り受けに関係する3語、あるいは、3回の係り受けに関係する4語を検索キーワードに設定するものとしてもよい。
図19は、校正候補生成部13が、対象例文3の校正候補を生成する処理の後半部分を説明するための図である。修正履歴コーパス12には、負例テキストの1つとして「ローカルとリモートの流れが違いますので、注意してください。」が登録されている。このため、図19に示す様に、1つ目の検索キーワード「ローカル&リモート」により、「ローカル」と「リモート」の双方を文中に含む負例テキスト及びこれに対応する正例テキストが抽出される。校正候補生成部13は、負例テキストを構文解析した後、その結果を用いて、負例テキストと対象文との対応解析を行い、対象文と負例テキストとの共通部分を認識する。更に、校正候補生成部13は、負例テキストと正例テキストとの対応解析を行い、負例テキストと正例テキストとの相違部分を認識する。なお、2つ目の検索キーワード「リモート&流れ」についても、負例テキストに含まれるが、上記と同一の検索結果(負例と正例)が得られるため、重複を回避するため、以降の解析処理は省略される。
なお、図19において、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。また、下線の付された文字列は、負例テキストと対象文とに共通する文字列(共通部分)であり、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)である。対象文と負例との共通部分(下線部)に、負例と正例との相違部分(右下がり斜線部)が含まれる場合には、校正候補生成部13は、該当する文字列を、置き換えに利用できる履歴の候補に加えると共に、それ以外の文字列を候補から除外する。その結果、図19に示す例では、下線が付された部分の内、右下がり斜線部の文字列である「の」が校正候補に追加される。
次に、図20は、校正可否判別部14が、対象例文3の校正候補による校正の可否を判別する処理を説明するための図である。図20に示す様に、校正可否判別部14は、まず、負例テキストと対象文との単語の対比を行う。すなわち、校正可否判別部14は、負例テキスト中の校正された文字列(右下がり斜線部)と、対象文と負例テキストとで重複する文字列(下線部分)との重複部分の単語を特定する。対象例文3では、「の」がこれに該当する。
校正可否判別部14は、次いで、対象文と負例テキストとで異なる文節をチェックする。すなわち、校正可否判別部14は、上記特定された単語の品詞が付属語(例えば、助詞、助動詞、活用語尾等)である場合には、その単語により形成される文節の中心を為す自立語を特定する。更に、上記特定された、負例テキスト中の単語に対応する単語を、対象文の中で特定する。対象例文3では、図20に示す様に、正例テキストにつき、対象文中の自立語として「リモート」が、負例テキスト中の自立語として「リモート」がそれぞれ特定される。これらの単語を対応語とする。校正可否判別部14は、この対応語に関し、単語間の類似度を評価する。対象例文3では、「リモート」と「リモート」とは同一の単語であり、単語間の類似度が高いことから、修正履歴データを用いた自動校正は可能であると判定される。したがって、正例テキストにおける単語「リモート」は、校正可否条件チェックをクリアする。
次に、校正可否判別部14は、修飾語及び被修飾語をチェックする。すなわち、校正可否判別部14は、正例テキストに対する構文解析により、上記特定された各単語に対応する単語の係り受け構造を検出する。構文解析に際し、対象文は、正例テキストの助詞「で」に置き換えられて構文解析される。校正可否判別部14は、対象文中で特定された単語に対応する、正例テキスト中の単語と、当該対象文中の単語との間で、修飾語及び被修飾語の類似度を評価する。対象例文3では、正例テキスト中の「違い」と対象文中の「異なる」とが類似度評価の対象となるが、これらの単語は、意味クラスが同一であり、かつ、格の制約条件が類似していることから、訂正可能と判定され、校正可否条件チェックをクリアする。
図21は、自動校正部16が、対象例文3を校正する処理を説明するための図である。図21に示す様に、自動校正部16は、負例テキストと正例テキストとの間で異なる文字列を、負例テキストから対象文に移行する。その結果、対象文は、「の」の単語に、右下がり斜線の施された状態となる。その後、自動校正部16は、対象文と正例テキストとの間で異なる文字列を、正例テキストにおいて対応する文字列に置き換える。これにより、校正後の対象文である「ローカルとリモートの流れが大きく異なる。」が生成及び出力される。なお、図21において、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)であり、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。相違部分であり、かつ、検索キーワードにマッチした文字列には、右下がり斜線が優先的に施されている。
(対象例文4)
次に、図22〜図26を参照しながら、動詞表現が校正される態様を説明する。
図22は、対象例文4が校正される過程を説明するための図である。図22に示す様に、校正対象の文として「彼は次々と奇跡を見せている。」が与えられると、この文と同様の特徴を有する校正前の文「数々の奇跡を見せてきた。」が、修正履歴コーパス12から検索され、対象文との共通部分A6が特定される。次に、修正履歴コーパス12内に上記校正前の文と対応付けて格納されている校正後の文「数々の奇跡を演じてきた。」と、上記校正前の文との相違部分B9が特定される。更に、対象文と校正後の文との間で、自立語C11、C12の構文上及び意味上の類似度がチェックされ、所定の類似度に達している場合には、上記校正後の文による校正が可能と判定される。その結果、上記校正後の文が自動校正用の文に採用され、自動校正後の文として「彼は次々と奇跡を演じている。」が出力される。なお、自動校正後の文の内、右下がり斜線の施された文字列「演じ」は、校正により変更された文字列を表す。
以下、図23〜図26を参照し、対象文の入力から自動校正後の文の出力までの処理を、より具体的に説明する。図23は、校正候補生成部13が、対象例文4の校正候補を生成する処理の前半部分を説明するための図である。図23に示す様に、対象例文4は、形態素解析を適用された結果、「彼/は/次々/と/奇跡/を/見せ/てい/る/。」の各形態素に分解される。更に、対象例文4は、構文解析を適用された結果、各形態素間の係り受け関係が特定される。この係り受け関係を有する4つの形態素“彼、見せ、次々、奇跡”が、修正履歴コーパス12の検索キーワードとして選定される。すなわち、対象例文4からは、「彼&見せ」、「次々&見せ」、「奇跡&見せ」の3パターンの検索キーワードが抽出される。なお、本実施例では、1回の係り受けに関係する2語を検索キーワードとする態様を例示したが、これに限らず、校正候補生成部13は、2回の係り受けに関係する3語、あるいは、3回の係り受けに関係する4語を検索キーワードに設定するものとしてもよい。
図24は、校正候補生成部13が、対象例文4の校正候補を生成する処理の後半部分を説明するための図である。修正履歴コーパス12には、負例テキストの1つとして「数々の奇跡を見せてきた。」が登録されている。このため、図24に示す様に、3つ目の検索キーワード「奇跡&見せ」により、「奇跡」と「見せ」の双方を文中に含む負例テキスト及びこれに対応する正例テキストが抽出される。校正候補生成部13は、負例テキストを構文解析した後、その結果を用いて、負例テキストと対象文との対応解析を行い、対象文と負例テキストとの共通部分を認識する。更に、校正候補生成部13は、負例テキストと正例テキストとの対応解析を行い、負例テキストと正例テキストとの相違部分を認識する。
なお、図24において、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。また、下線の付された文字列は、負例テキストと対象文とに共通する文字列(共通部分)であり、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)である。対象文と負例との共通部分(下線部)に、負例と正例との相違部分(右下がり斜線部)が含まれる場合には、校正候補生成部13は、該当する文字列を、置き換えに利用できる履歴の候補に加えると共に、それ以外の文字列を候補から除外する。その結果、図24に示す例では、下線が付された部分の内、右下がり斜線部の文字列である「見せ」が校正候補に追加される。
次に、図25は、校正可否判別部14が、対象例文4の校正候補による校正の可否を判別する処理を説明するための図である。図25に示す様に、校正可否判別部14は、まず、負例テキストと対象文との単語の対比を行う。すなわち、校正可否判別部14は、負例テキスト中の校正された文字列(右下がり斜線部)と、対象文と負例テキストとで重複する文字列(下線部分)との重複部分の単語を特定する。対象例文4では、「見せ」がこれに該当する。
校正可否判別部14は、次いで、対象文と負例テキストとで異なる文節をチェックする。すなわち、校正可否判別部14は、上記特定された単語の品詞が付属語(例えば、助詞、助動詞、活用語尾等)である場合には、その単語により形成される文節の中心を為す自立語を特定する。更に、上記特定された、負例テキスト中の単語に対応する単語を、対象文の中で特定する。対象例文4では、図25に示す様に、正例テキストにつき、対象文中の自立語として「見せ」が、負例テキスト中の自立語として「見せ」がそれぞれ特定される。これらの単語を対応語とする。校正可否判別部14は、この対応語に関し、単語間の類似度を評価する。対象例文4では、「見せ」と「見せ」とは同一の単語であり、単語間の類似度が高いことから、修正履歴データを用いた自動校正は可能であると判定される。したがって、正例テキストにおける単語「演じ」は、校正可否条件チェックをクリアする。
次に、校正可否判別部14は、修飾語及び被修飾語をチェックする。すなわち、校正可否判別部14は、正例テキストに対する構文解析により、上記特定された各単語に対応する単語の係り受け構造を検出する。校正可否判別部14は、対象文中で特定された単語に対応する、正例テキスト中の単語と、当該対象文中の単語との間で、修飾語及び被修飾語の類似度を評価する。対象例文4では、正例テキスト中の「奇跡」と対象文中の「奇跡」とが類似度評価の対象となるが、これらの単語は、同一の単語であることから類似度が高い。したがって、訂正可能と判定され、校正可否条件チェックをクリアする。
図26は、自動校正部16が、対象例文4を校正する処理を説明するための図である。図26に示す様に、自動校正部16は、負例テキストと正例テキストとの間で異なる文字列を、負例テキストから対象文に移行する。その結果、対象文は、「見せ」の単語に、右下がり斜線の施された状態となる。その後、自動校正部16は、対象文と正例テキストとの間で異なる文字列を、正例テキストにおいて対応する文字列に置き換える。これにより、校正後の対象文である「彼は次々と奇跡を演じている。」が生成及び出力される。なお、図26において、右下がり斜線の施された文字列は、負例テキストと正例テキストとで相違する文字列(相違部分)であり、左下がり斜線の施された文字列は、検索キーワードにマッチした文字列である。相違部分であり、かつ、検索キーワードにマッチした文字列には、右下がり斜線が優先的に施されている。
以上説明したように、文章校正装置10は、修正履歴コーパス12と校正候補生成部13と校正可否判別部14と自動校正部16とを有する。修正履歴コーパス12は、校正前の文(負例文)と校正後の文(正例文)とを対応付けて記憶する。校正候補生成部13は、校正対象の文の特徴に基づき、上記校正前の文に対応する上記校正後の文を修正履歴コーパス12から取得する。校正可否判別部14は、校正候補生成部13により取得された上記校正後の文の中から、上記校正対象の文と上記校正後の文との類似度が所定の閾値以上である校正後の文を、校正候補として選択する。自動校正部16は、校正可否判別部14により選択された上記校正後の文の内、上記類似度が最も高い校正後の文を用いて、上記校正対象の文を校正する。
上述したように、文章校正装置10は、誤りを含む例文(負例)とその誤りを修正した後の例文(正例)とを対応付けて保持する修正履歴コーパス12を検索することで、過去の修正履歴を参照した、助詞、動詞の語尾、自立語等、多様な語句の自動修正を可能とする。すなわち、文章校正装置10は、修正履歴コーパス12の検索結果を基に、上記共通文字列と上記相違文字列とをそれぞれ認識し、これら2種の文字列の共通部分(重なる部分)を校正の必要な部分とみなす。その際、文章校正装置10は、対象文及び正例に対して形態素解析及び構文解析を施すと共に、係り先または係り元の単語の構文的及び意味的類似性を評価する。これにより、文章校正装置10は、対象文を校正することの要否を判定する。
文章校正装置10は、人の手作業により、修正前と修正後の文を、文対データベースである修正履歴コーパス12に蓄積し、この修正履歴コーパス12を利用して、文章の自動校正を行う。したがって、従来の様に、校正用の辞書を事前に準備することなく、複数の品詞の誤り(複合誤り)も同時に検出し、正しい表現に修正することができる。その結果、簡易な構成で、文章を精度良く校正することが可能となる。
また、文章校正装置10において、自動校正部16は、上記校正対象の文と上記校正前の文とに共通する文字列(共通文字列)と、上記校正前の文と上記校正後の文との間で相違する文字列(相違文字列)とが、上記校正前の文において重なる部分の文字列を、該文字列に対応する、上記校正後の文の文字列に置換する。これにより、自動校正部16は、上記校正対象の文を校正する。
上記共通文字列と上記相違文字列とが重なる部分は、校正対象の文と対応しているにも拘らず、校正後の文(正例)と異なっていることから、誤っている文字列(修正が必要な文字列)であるとの推測が可能である。一方、校正前の文(負例)に含まれる文字列であっても、上記重なる部分以外の文字列は、原文(対象文)のまま使用してもよい文字列(修正の不要な文字列)であるとの推測が可能である。したがって、自動校正部16は、上記共通文字列と上記相違文字列とが重なる文字列のみを、校正後の文(正例)に合わせて置換することで、過不足のない効率的な文章校正が可能となる。その結果、文章校正装置10の処理負荷が低減されると共に、校正処理速度が向上する。
更に、文章校正装置10において、校正可否判別部14は、上記校正対象の文と上記校正後の文との間における構文的な類似度または意味的な類似度に基づき、上記校正後の文による校正の可否を判定するものとしてもよい。換言すれば、校正可否判別部14は、上記類似度を評価することにより、対象文と正例文とが構文的に類似する場合のみならず、対象文と正例文とが意味的に類似する場合にも、該正例文を、自動校正部16による校正の候補として選択する。具体的には、校正可否判別部14は、対象文、正例文間の類似度が低い場合には、その正例文を使用した校正を不可と判定し、対象文、正例文間の類似度が高い場合には、その正例文を使用した校正を可と判定する。これにより、対象文に類似しない正例文が校正候補から除外される。したがって、対象文が、対象文に類似しない正例文によって校正されることが未然に防止される。その結果、誤った校正が減少し、校正精度が向上する。
文章校正装置10の適用先として、文章校正装置10は、例えば、外国人等の執筆する日本語文書の品質向上や外国人等の執筆した文書の校正作業の効率化のために利用することができる。あるいは、日本企業の海外拠点等で働く外国人従業員による日本語学習を促進するために利用することができる。
なお、上記実施例では、文章校正装置10は、S2でリストアップされた校正候補の使用可否を判別した後に、校正の妥当性評価を行うものとした(図4参照)。しかしながら、かかる態様に限らず、文章校正装置10は、リストアップされた校正候補に対する校正の妥当性評価を先に行い、その後、妥当と判定された校正候補による校正の可否を判別するものとしてもよい。また、妥当性評価値に基づく校正候補の並べ替え処理(図4のS8)は、必ずしも実行する必要は無く、文章校正装置10は、妥当性評価値の最も高い校正候補のみを、残った校正候補の中からピックアップして、ユーザに提示するものとしてもよい。
文章校正装置10の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的態様は、図示のものに限らず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することもできる。例えば、校正候補一時格納部131、テキスト解析部132は、校正候補生成部13や校正可否判別部14とは別体に構成されるものとして説明及び図示したが、これらの構成部分に包含されるものとしてもよい。同様に、文節互換性判別部141、単語辞書141aは、校正可否判別部14に含まれるものとしてもよい。また、校正可否判別部14と校正候補整序部15、あるいは、校正候補生成部13と修正履歴コーパス12をそれぞれ1つの構成要素として統合してもよい。
反対に、校正可否判別部14に関し、校正候補の使用可否を判定する部分と、使用可能と判定された校正候補の妥当性を個別に評価(点数化)する部分とに分散してもよい。同様に、テキスト解析部132に関し、構文解析を行う部分と形態素解析を行う部分とに分けてもよい。更に、記憶装置10bを、文章校正装置10の外部装置としてネットワークやケーブル経由で接続するようにしてもよい。
10 文章校正装置
10a プロセッサ
10b 記憶装置
10c 入力装置
10d 表示装置
11 対象文入力部
12 修正履歴コーパス
13 校正候補生成部
14 校正可否判別部
15 校正候補整序部
16 自動校正部
17 校正結果出力部
121 修正履歴コーパス内のデータ
131 校正候補一時格納部
132 テキスト解析部
141 文節互換性判別部
141a 単語辞書
161 重複部分判定テーブル
A1〜A6 対象文と負例との共通部分
B1〜B9 負例と正例との相違部分
C1〜C12 類似度評価の対象部分
D1 校正対象文書
E1〜E3 対象文と負例との共通部分
Y1〜Y34、Y41〜Y51 係り先矢印
Z1、Z2、Z3 重複部分
α、β 対象例文1の負例と正例のペア

Claims (4)

  1. 校正前の文と校正後の文とを対応付けて記憶する記憶部と、
    テキスト解析の施された校正対象の文の特徴を基に、前記記憶部に格納されている負例テキストを検索し、前記校正対象の文と同様の特徴を有する負例に対応する正例を、前記記憶部から抽出することにより、前記校正前の文に対応する前記校正後の文を前記記憶部から取得する取得部と、
    前記校正対象の文と前記負例テキストとの共通部分と、前記負例テキストと正例テキストとの相違部分と、の共通部分である置換文字列が自立語である場合には、該置換文字列を含む文節が係っている単語同士の類似度を評価し、置換文字列が助詞または用言の語尾である場合には、該置換文字列を含む文節の中心語同士の類似度を評価して、前記取得部により取得された前記校正後の文の中から、前記校正対象の文と前記校正後の文との類似度が所定の閾値以上である校正後の文を選択する選択部と、
    前記選択部により選択された前記校正後の文の内、前記類似度が最も高い校正後の文を前記正例テキストとして用い、前記負例テキストと前記正例テキストとの間で異なる文字列を、前記校正対象の文において置き換え可能な状態に設定した後、該校正対象の文と前記正例テキストとの間で異なる文字列の内、前記置き換え可能な状態に設定された文字列を、前記正例テキストにおいて対応する文字列に置き換えることにより、前記校正対象の文を校正する校正部と
    を有することを特徴とする文章校正装置。
  2. 前記校正部は、前記校正対象の文と前記校正前の文とに共通する文字列と、前記校正前の文と前記校正後の文との間で相違する文字列とが、前記校正前の文において重なる部分の文字列を、該文字列に対応する、前記校正後の文の文字列に置換することにより、前記校正対象の文を校正することを特徴とする請求項1記載の文章校正装置。
  3. 前記選択部は、前記校正対象の文と前記校正後の文との間における構文的な類似度または意味的な類似度に基づき、前記校正後の文による校正の可否を判定することを特徴とする請求項1記載の文章校正装置。
  4. 文章校正装置が、
    テキスト解析の施された校正対象の文の特徴を基に、記憶部に格納されている負例テキストを検索し、前記校正対象の文と同様の特徴を有する負例に対応する正例を、前記記憶部から抽出することにより、校正前の文に対応する校正後の文を取得し、
    前記校正対象の文と前記負例テキストとの共通部分と、前記負例テキストと正例テキストとの相違部分と、の共通部分である置換文字列が自立語である場合には、該置換文字列を含む文節が係っている単語同士の類似度を評価し、置換文字列が助詞または用言の語尾である場合には、該置換文字列を含む文節の中心語同士の類似度を評価して、取得された前記校正後の文の中から、前記校正対象の文と前記校正後の文との類似度が所定の閾値以上である校正後の文を選択し、
    選択された前記校正後の文の内、前記類似度が最も高い校正後の文を前記正例テキストとして用い、前記負例テキストと前記正例テキストとの間で異なる文字列を、前記校正対象の文において置き換え可能な状態に設定した後、該校正対象の文と前記正例テキストとの間で異なる文字列の内、前記置き換え可能な状態に設定された文字列を、前記正例テキストにおいて対応する文字列に置き換えることにより、前記校正対象の文を校正する
    ことを特徴とする文章校正方法。
JP2012062759A 2012-03-19 2012-03-19 文章校正装置、及び文章校正方法 Expired - Fee Related JP5870790B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012062759A JP5870790B2 (ja) 2012-03-19 2012-03-19 文章校正装置、及び文章校正方法
US13/711,144 US9087047B2 (en) 2012-03-19 2012-12-11 Text proofreading apparatus and text proofreading method using post-proofreading sentence with highest degree of similarity
CN201210574520.4A CN103324609B (zh) 2012-03-19 2012-12-26 文本校对装置和文本校对方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012062759A JP5870790B2 (ja) 2012-03-19 2012-03-19 文章校正装置、及び文章校正方法

Publications (2)

Publication Number Publication Date
JP2013196374A JP2013196374A (ja) 2013-09-30
JP5870790B2 true JP5870790B2 (ja) 2016-03-01

Family

ID=49158467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012062759A Expired - Fee Related JP5870790B2 (ja) 2012-03-19 2012-03-19 文章校正装置、及び文章校正方法

Country Status (3)

Country Link
US (1) US9087047B2 (ja)
JP (1) JP5870790B2 (ja)
CN (1) CN103324609B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11853708B1 (en) * 2023-05-10 2023-12-26 Holovisions LLC Detecting AI-generated text by measuring the asserted author's understanding of selected words and/or phrases in the text

Families Citing this family (176)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
JP5870790B2 (ja) * 2012-03-19 2016-03-01 富士通株式会社 文章校正装置、及び文章校正方法
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101509727B1 (ko) * 2013-10-02 2015-04-07 주식회사 시스트란인터내셔널 자율학습 정렬 기반의 정렬 코퍼스 생성 장치 및 그 방법과, 정렬 코퍼스를 사용한 파괴 표현 형태소 분석 장치 및 그 형태소 분석 방법
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
CN106471570B (zh) 2014-05-30 2019-10-01 苹果公司 多命令单一话语输入方法
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) * 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9679554B1 (en) * 2014-06-23 2017-06-13 Amazon Technologies, Inc. Text-to-speech corpus development system
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
JP6505421B2 (ja) 2014-11-19 2019-04-24 株式会社東芝 情報抽出支援装置、方法およびプログラム
EP3062212A1 (en) * 2015-02-25 2016-08-31 Kyocera Document Solutions Inc. Text editing apparatus and print data storage apparatus
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10740129B2 (en) * 2015-06-05 2020-08-11 International Business Machines Corporation Distinguishing portions of output from multiple hosts
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
JP6775935B2 (ja) 2015-11-04 2020-10-28 株式会社東芝 文書処理装置、方法、およびプログラム
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
JP6490607B2 (ja) 2016-02-09 2019-03-27 株式会社東芝 材料推薦装置
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP6675078B2 (ja) * 2016-03-15 2020-04-01 パナソニックIpマネジメント株式会社 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム
JP6602243B2 (ja) 2016-03-16 2019-11-06 株式会社東芝 学習装置、方法、及びプログラム
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
JP2018067159A (ja) * 2016-10-19 2018-04-26 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像形成装置
JP6622172B2 (ja) 2016-11-17 2019-12-18 株式会社東芝 情報抽出支援装置、情報抽出支援方法およびプログラム
CN106708801B (zh) * 2016-11-29 2020-08-28 深圳市天朗时代科技有限公司 用于文本的校对方法
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
CN107895251A (zh) * 2016-12-24 2018-04-10 上海壹账通金融科技有限公司 数据纠错方法及装置
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
JP6979294B2 (ja) * 2017-07-06 2021-12-08 株式会社朝日新聞社 校正支援装置、校正支援方法及び校正支援プログラム
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
JP6992584B2 (ja) * 2018-02-21 2022-01-13 沖電気工業株式会社 情報処理装置、情報処理方法、及びプログラム
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11151307B2 (en) * 2018-11-13 2021-10-19 Adobe Inc. Mapping annotations to ranges of text across documents
WO2020100018A1 (en) * 2018-11-15 2020-05-22 Bhat Sushma A system and method for artificial intelligence-based proof reader for documents
KR101983517B1 (ko) * 2018-11-30 2019-05-29 한국과학기술원 주어진 문서가 독자에게 보다 높은 신뢰를 받을 수 있도록 하는 문서 신뢰도 증강 방법 및 그 시스템
CN111259897A (zh) * 2018-12-03 2020-06-09 杭州翼心信息科技有限公司 知识感知的文本识别方法和系统
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
JP2020166720A (ja) * 2019-03-29 2020-10-08 富士通株式会社 表示プログラム、表示方法、表示装置及び作成プログラム
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11132505B2 (en) * 2019-08-22 2021-09-28 Culture Com Technology (Macau), Limited Chinese composition reviewing system
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
WO2021112141A1 (ja) * 2019-12-03 2021-06-10 富士フイルム株式会社 文書作成支援装置、方法およびプログラム
KR20210132855A (ko) * 2020-04-28 2021-11-05 삼성전자주식회사 음성 처리 방법 및 장치
US11776529B2 (en) * 2020-04-28 2023-10-03 Samsung Electronics Co., Ltd. Method and apparatus with speech processing
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
CN111709247B (zh) * 2020-05-20 2023-04-07 北京百度网讯科技有限公司 数据集处理方法、装置、电子设备和存储介质
CN111709228B (zh) * 2020-06-22 2023-11-21 中国标准化研究院 一种字词重复错误的自动识别方法
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
KR102365341B1 (ko) * 2021-03-04 2022-02-23 주식회사 팀플백 인공지능 기반의 글쓰기 첨삭 시스템 및 그 방법
CN116306558B (zh) * 2022-11-23 2023-11-10 北京语言大学 一种计算机辅助中文文本改编的方法及装置
CN116502614B (zh) * 2023-06-26 2023-09-01 北京每日信动科技有限公司 一种数据校对方法、系统及存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02159674A (ja) * 1988-12-13 1990-06-19 Matsushita Electric Ind Co Ltd 意味解析装置と構文解析装置
JPH05120275A (ja) 1991-10-29 1993-05-18 Matsushita Electric Ind Co Ltd 文章校正方法およびその装置
JPH0785050A (ja) 1993-09-17 1995-03-31 Nec Corp 自動校正方式
US6125377A (en) * 1996-03-18 2000-09-26 Expert Ease Development, Ltd. Method and apparatus for proofreading a document using a computer system which detects inconsistencies in style
US6490563B2 (en) * 1998-08-17 2002-12-03 Microsoft Corporation Proofreading with text to speech feedback
JP3387437B2 (ja) * 1999-03-08 2003-03-17 セイコーエプソン株式会社 機械翻訳校正装置
WO2004086359A2 (en) * 2003-03-26 2004-10-07 Philips Intellectual Property & Standards Gmbh System for speech recognition and correction, correction device and method for creating a lexicon of alternatives
CN1484173A (zh) * 2003-08-10 2004-03-24 卢小林 基于汉字形状的中文单词拼写错误校正方法
US7383172B1 (en) * 2003-08-15 2008-06-03 Patrick William Jamieson Process and system for semantically recognizing, correcting, and suggesting domain specific speech
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP4645242B2 (ja) * 2005-03-14 2011-03-09 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP4654745B2 (ja) * 2005-04-13 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US7640158B2 (en) * 2005-11-08 2009-12-29 Multimodal Technologies, Inc. Automatic detection and application of editing patterns in draft documents
WO2009123260A1 (ja) * 2008-04-01 2009-10-08 日本電気株式会社 共起辞書作成システムおよびスコアリングシステム
CN101369285B (zh) * 2008-10-17 2010-06-02 清华大学 一种中文搜索引擎中查询词的拼写校正方法
JP2011008754A (ja) * 2009-05-29 2011-01-13 Toshiba Corp 文書処理装置およびプログラム
JP5752150B2 (ja) * 2010-02-01 2015-07-22 ジンジャー ソフトウェア、インコーポレイティッド 特に小型キーボード装置向けのインターネットコーパスを用いた文脈感応型自動言語訂正
JP5870790B2 (ja) * 2012-03-19 2016-03-01 富士通株式会社 文章校正装置、及び文章校正方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11853708B1 (en) * 2023-05-10 2023-12-26 Holovisions LLC Detecting AI-generated text by measuring the asserted author's understanding of selected words and/or phrases in the text

Also Published As

Publication number Publication date
CN103324609B (zh) 2017-05-03
CN103324609A (zh) 2013-09-25
US20130246048A1 (en) 2013-09-19
US9087047B2 (en) 2015-07-21
JP2013196374A (ja) 2013-09-30

Similar Documents

Publication Publication Date Title
JP5870790B2 (ja) 文章校正装置、及び文章校正方法
CN102298582B (zh) 数据搜索和匹配方法和系统
JP2004199427A (ja) 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体
JP2009129032A (ja) 翻訳装置及び翻訳プログラム
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
US20050273316A1 (en) Apparatus and method for translating Japanese into Chinese and computer program product
US20040193399A1 (en) System and method for word analysis
US10650195B2 (en) Translated-clause generating method, translated-clause generating apparatus, and recording medium
CN107862045B (zh) 一种基于多特征的跨语言剽窃检测方法
JP5391867B2 (ja) 翻訳装置及び翻訳プログラム
JP2011238159A (ja) 計算機システム
JP5447368B2 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP7176233B2 (ja) 検索方法、検索プログラムおよび検索装置
KR20100108338A (ko) 자연어의 공식화
CN115169328A (zh) 一种高准确性的中文拼写检查方法、系统及介质
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
CN114528824A (zh) 文本纠错方法、装置、电子设备及存储介质
JP5298833B2 (ja) 翻訳装置及び翻訳プログラム
JP2007148630A (ja) 特許分析装置、特許分析システム、特許分析方法およびプログラム
JP2005158044A (ja) 情報検索プログラム、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、情報検索方法、および情報検索装置
JP2006127405A (ja) バイリンガルパラレルテキストをアライメントする方法及びそのためのコンピュータで実行可能なプログラム
JP5853688B2 (ja) 言語処理プログラム、言語処理装置および言語処理方法
KR101116478B1 (ko) 문장의 지지도를 이용한 점증적 단일 문서 요약방법
JP5521670B2 (ja) パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム
JP5348699B2 (ja) データ分類システム、データ分類方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151228

R150 Certificate of patent or registration of utility model

Ref document number: 5870790

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees