JP2019145023A - 文書校閲装置およびプログラム - Google Patents

文書校閲装置およびプログラム Download PDF

Info

Publication number
JP2019145023A
JP2019145023A JP2018031035A JP2018031035A JP2019145023A JP 2019145023 A JP2019145023 A JP 2019145023A JP 2018031035 A JP2018031035 A JP 2018031035A JP 2018031035 A JP2018031035 A JP 2018031035A JP 2019145023 A JP2019145023 A JP 2019145023A
Authority
JP
Japan
Prior art keywords
document
typographical
character
mismatch
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018031035A
Other languages
English (en)
Other versions
JP6568968B2 (ja
Inventor
諒 高橋
Ryo Takahashi
諒 高橋
和麻 蓑田
Kazuma Minoda
和麻 蓑田
石川 信行
Nobuyuki Ishikawa
信行 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Recruit Co Ltd
Original Assignee
Recruit Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Recruit Co Ltd filed Critical Recruit Co Ltd
Priority to JP2018031035A priority Critical patent/JP6568968B2/ja
Application granted granted Critical
Publication of JP6568968B2 publication Critical patent/JP6568968B2/ja
Publication of JP2019145023A publication Critical patent/JP2019145023A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】予め設定されたルールに基づく検出が難しい誤字脱字や原稿内不一致の検出を行う。【解決手段】対象文書の校閲を行う文書校閲装置であって、機械学習によって、文章中の誤字を検出するための誤字検出モデルを構築するモデル構築部と、誤字検出モデルを用いて、対象文書に含まれる誤字脱字の情報を抽出する誤字脱字抽出部と、対象文書に含まれる複数の単語間の関連性を解析し、文書内不一致を抽出する文書内不一致抽出部と、を備える。【選択図】図4

Description

本発明は、文書校閲装置およびプログラムに関する。
文章中の誤字脱字や原稿内不一致(矛盾や表記ゆれ)を検出するシステムが活用されている。例えば、特許文献1には、予め記憶されている誤字脱字のパターンに基づいて、文書中から誤字脱字の情報を抽出するシステムが記載されている。
特開2015−130102号公報
従来のシステムでは、予め設定されたルールに基づいて、文書の校閲が行われていた。このため、ルールベースでは検出が難しい誤字脱字や原稿内不一致に適切に対応することができなかった。
本発明は、以上説明した事情を鑑みてなされたものであり、予め設定されたルールに基づく検出が難しい誤字脱字や原稿内不一致の検出を行うことを目的の一つとする。
本発明の一実施形態に係る文書校閲装置は、対象文書の校閲を行う文書校閲装置であって、
機械学習によって、文章中の誤字を検出するための誤字検出モデルを構築するモデル構築部と、
前記誤字検出モデルを用いて、前記対象文書に含まれる誤字脱字の情報を抽出する誤字脱字抽出部と、
前記対象文書に含まれる複数の単語間の関連性を解析し、文書内不一致を抽出する文書内不一致抽出部と、を備えたものである。
また、前記誤字脱字抽出部は、前記対象文書の各文字の出現確率を、前後の文脈に基づいて計算し、出現確率が一定値以下の文字を誤字と判定して抽出するようにしてもよい。
また、誤字と判定された前記文字について、より出願確率の高い文字を修正候補として提示する修正候補提示部を備えるようにしてもよい。
また、前記文書内不一致抽出部は、前記対象文書に含まれる2つの単語間の類似度を算出し、算出した類似度が所定の閾値以上の場合には、当該2つの単語を文書内不一致として抽出するようにしてもよい。
また、前記文書内不一致抽出部は、前記対象文書に含まれる2つの固有名詞間の編集距離を算出し、算出した編集距離がゼロではなく、且つ所定の閾値以内の場合には、2つの固有名詞を文書内不一致として抽出し、前記対象文書に含まれる読み方が一致する2つの一般名詞間の類似度を、前記文書内不一致検出モデルを用いて算出し、算出した類似度が所定の閾値以上の場合には、当該2つの一般名詞を文書内不一致として抽出するようにしてもよい。
本発明によれば、予め設定されたルールに基づく検出が難しい誤字脱字や原稿内不一致の検出を行うことができる。
本発明の実施形態に係る文書校閲システム1の構成を示す図。 本発明の実施形態に係る誤字検出モデル構築処理のフローチャート。 本発明の実施形態に係る誤字検出モデルを説明する図。 本発明の実施形態に係る誤字脱字の検出処理のフローチャート。 本発明の実施形態に係る修正候補の表示方法を例示する図。 本発明の実施形態に係る文書内不一致の検出処理のフローチャート。
以下、本発明の実施形態について図面を参照しつつ詳細に説明する。なお、同一の要素には同一の符号を付し、重複する説明を省略する。
実施の形態
図1は、本実施形態に係る文書校閲システム1の構成を示す図である。
図1に示すように、文書校閲システム1は、文書校閲サーバ(文書校閲装置)10と、端末20を含んでいる。文書校閲サーバ10と端末20は、通信ネットワークNを介して接続される。通信ネットワークNは、例えば、インターネット、LAN、専用線、電話回線、企業内ネットワーク、移動体通信網、ブルートゥース(登録商標)、WiFi(Wireless Fidelity)、その他の通信回線、それらの組み合わせ等のいずれであってもよく、有線であるか無線であるかを問わない。また、端末20は複数含まれていてもよい。
文書校閲サーバ10は、利用者が端末20を介して入力する文書の校閲を行う。文書校閲サーバ10は、汎用的なコンピュータであり、1台のコンピュータで構成されていてもよいし、通信ネットワークN上に分散する複数のコンピュータから構成されてもよい。文書校閲サーバ10は、制御装置11(モデル構築部、誤字脱字抽出部、文書内不一致抽出部、修正候補提示部)と、外部記憶装置12を備えている。制御装置11は、ハードウェアとして、CPU、ROMやRAM等のメモリ、入力インタフェース、出力インタフェース、通信インタフェース及びこれらを結ぶバス等を備えている。制御装置11は、CPUがROM等に格納されたプログラムを実行することにより各種機能を実現する。外部記憶装置12は、ハードディスクドライブ等である。
端末20は、通信ネットワークNを介して文書校閲サーバ10とデータの授受が可能なあらゆる端末装置を利用することができる。例えば、タブレット端末やスマートフォン、パーソナルコンピュータ(PC)、ノートPC、携帯電話機、携帯情報端末(PDA)などであってもよい。端末20は、プロセッサ201、各種操作ボタンやタッチパネルなどの入力装置202、液晶ディスプレイなどの表示装置203、通信ネットワークNに接続するための通信インタフェース204、ディスクドライブまたは半導体メモリ(ROM、RAMなど)などの記憶資源205を備えている。
(誤字検出モデルの構築)
次に、本実施形態による誤字検出モデルの構築について、図2のフローチャートを用いて説明する。
まず、文書校閲サーバ10は、モデル構築のための機械学習に用いる学習用データを取得する(ステップS101)。学習用データは、文章のサンプルデータであり、誤字脱字を含まない大量の文章(OKデータ、例「私は犬と散歩する。」)と、誤字脱字を含む文章と、誤っている箇所の情報(NGデータ、例「私は犬に散歩する。(に)」)が含まれる。学習用データは、外部記憶装置12に記憶されていてもよいし、通信ネットワークNを介して外部のサーバ等から取得するようにしてもよい。なお、学習用データとして用いる文書のサンプルは、校閲対象の文書と形式や内容ができるだけ類似しているものを用いることが望ましい。
次に、文書校閲サーバ10は、学習用データを用いて機械学習を行うためのネットワークを構築する(ステップS102)。図3は、誤字検出モデルを図式化したものである。図3に示す誤字検出モデルは、双方向LSTM(Bidirectional Long Short-Term Memory)をもとに構成した言語モデルであり、文章中の対象箇所にあてはまる文字の出現確率を、前後の文言に基づいて算出し、当該文字の出現確率が低ければ誤字と判定する。具体的には、前方層(Forward Layer)と後方層(Backward Layer)からなる双方向LSTMにおいて、前方層及び後方層を構成する各LSTMに、文章を構成する各文字を入力する。そして、誤字判定をする文字が入力される対象箇所に位置するLSTM(図中のL)に対して、前方層において1つ前方に位置するLSTM(図中のLf)の出力と、後方層において1つ後方に位置するLSTM(図中のLb)の出力とに基づいて、当該対象箇所に出現する文字候補とその出願確率を出力する。
図3に示す例では、「数億円単位(A)金額の商談となる。」という文章の対象箇所(A)に入る文字として、「が」、「の」、「を」の出現確率はそれぞれ0.1、0.5、0.05と算出される。この場合、誤字検出モデルは、「数億円単位の金額の商談となる。」という文章に対しては、誤字なしと判定し、「数億円単位が金額の商談となる。」または「数億円単位を金額の商談となる。」という文章に対しては、「が」、「の」をそれぞれ誤字と判定する。
文書校閲サーバ10は、まず、誤字検出モデルを構築するための学習ネットワークを構築する。具体的には、双方向LSTMにより、文章中の対象箇所にある文字が出現する尤度(もっともらしさ)と出現確率を、前後の文言の並びに基づいて算出するネットワークを構築する。
次に、文書校閲サーバ10は、大量のOKデータとNGデータを含む学習用データを入力として学習ネットワークの機械学習を行う(ステップS103)。例えば、「私は犬と散歩する。」のようなOKデータが大量に入力され、これに対して「私は犬に散歩する。(に)」のようなNGデータが入力されることにより、「私は犬」と「散歩する。」の間に入る文字としては「と」が尤度と出現確率が高く、「に」は低いということが学習される。
次に、文書校閲サーバ10は、ステップS103で得られた尤度と出現確率に基づいて、文章中に誤字が含まれるか否かを判定するディープネットワークを構築する(ステップS104)。
さらに、文書校閲サーバ10は、ステップS104で構築したディープネットワークの機械学習を行い、対象文書に誤字が含まれるか否かを判定する誤字検出モデルを構築する(ステップS105)。
(誤字脱字の検出)
次に、本実施形態による誤字脱字の検出処理について、図4のフローチャートを用いて説明する。
文書校閲サーバ10は、校閲対象の文書を取得する(ステップS201)。校閲対象の文書は、利用者が端末20を介して文章を入力したり、文書校閲サーバ10に文書ファイルを送信することにより文書校閲サーバ10に提供するようにしてもよい。また、文書は外部記憶装置12に記憶しておいてもよいし、通信ネットワークNを介して外部のサーバ等から取得するようにしてもよい。
文書校閲サーバ10は、学習済の誤字検出モデルを用いて、対象文書を解析する(ステップS202)。誤字検出モデルは、対象運所の中に出現確率が所定の閾値以下の文字が検出された場合には出力「1」(誤字有り)を、検出されなかった場合には出力「0」(誤字無し)を返す。誤字検出モデルによる出力が「0」(の場合(ステップS203:NO)、処理を終了する。
一方、誤字検出モデルによる出力が「1」の場合(ステップS203:YES)、文書校閲サーバ10は、図2のステップS103で機械学習を行ったモデルに問い合わせを行い、誤字として検出された箇所(出現確率が所定の閾値以下の文字)の情報と、修正候補の文字の情報を取得する(ステップS204)。修正候補の文字としては、当該誤り箇所において最も尤度の高い文字が提示される。また、尤度が一定値以上の複数の文字を候補として提示するようにしてもよい。修正候補の文字は、端末20の表示装置203に表示される。例えば、図5に示すように、「私は犬に散歩する。」という元の文書が入力された場合に、「に」の修正候補として「と」を表示する。
予め定義された辞書に基づく誤字検出のようなルールベースでの誤字検出の場合、上記の「私は犬に散歩する。」のような例では、各単語が辞書に存在するため、誤字として検出することは難しい。しかし、本実施形態のように、大量の文書サンプルを用いて機械学習を行った誤字検出モデルを用いることにより、ルールベースでは検出が難しい前後の文脈を考慮した誤字の判定を実現することができる。
(文書内不一致の検出)
次に、本実施形態による文書内不一致の検出処理について、図6のフローチャートを用いて説明する。
文書校閲サーバ10は、校閲対象の文書を単語単位に分割する(ステップS301)。文書校閲サーバ10は、分割した単語の中から固有名詞を抽出し、各固有名詞間の距離を算出する(ステップS302)。固有名詞間の距離は、例えば、レーベンシュタイン距離のような編集距離を利用することができる。レーベンシュタイン距離は、一方の文字列を他方の文字列に変換するのに必要な編集の回数(文字の削除、挿入、置換などの手順の回数)を表している。例えば、「ウエディング」という文字列を「ウェディング」という文字列に変換するためには、「エ」を「ェ」に変換する、という1つの手順が必要になるので、「ウエディング」と「ウェディング」のレーベンシュタイン距離は「1」となる。
文書校閲サーバ10は、算出した距離が所定の閾値以内(距離がゼロは含まない。)の場合(ステップS303:YES)、それらの単語を文書内不一致として抽出する(ステップS304)。すなわち、文字列同士が同一(距離がゼロ)ではないものの、ある程度近い(距離が閾値以内)であれば、不一致の可能性が高いと判断される。
次に、文書校閲サーバ10は、分割した単語の中から、読み方が一致する一般名詞の組を抽出する(ステップS305)。例えば、「街並み」(マチナミ)と「街並」(マチナミ)、「式」(シキ)と「四季」(シキ)のように、表記が異なっていても読み方が一致する単語の組み合わせが抽出される。
さらに、文書校閲サーバ10は、抽出したそれぞれの単語間の類似度を算出する(ステップS306)。具体的には、まず、Word2Vec等のニューラルネットワークモデル(文書内不一致検出モデル)を利用してそれぞれの単語をベクトルで表現する。Word2Vecは、大量のサンプル文書データを用いて、ある単語の周辺に高い頻度で出現する単語(例えば、「リンゴ」の周辺に「食べる」、「赤い」、「おいしい」等)を学習し、その結果を反映したベクトルを出力する。したがって、同じような文脈で使用される意味の似た単語のベクトルは同じような値のベクトル(ベクトル間の距離が近い)となる。
文書校閲サーバ10は、出力されたそれぞれのベクトル間の距離を、単語間の類似度として算出する。例えば、「街並み」(マチナミ)と「街並」(マチナミ)については、意味がほぼ同じなので、類似度は高い値となる。一方、「式」(シキ)と「四季」(シキ)については、意味は全く異なるため類似度は低くなる。
文書校閲サーバ10は、算出した類似度が所定の閾値以上の場合(ステップS307:YES)、それらの単語を文書内不一致として抽出する(ステップS308)。
例えば、上記の例では、「街並み」と「街並」の組み合わせは文書内不一致と判定されるが、「式」と「四季」については文書内不一致とは判定されない。このように、ニューラルネットワークモデルを用いて文書内不一致の判定を行うことにより、表記ゆれの検出精度を向上させることができる。
次に、文書校閲サーバ10は、日付、人数、距離等の主に数値についての表記の矛盾の検出を行う(ステップS309)。具体的には、予め設定したルールにしたがって、文書内の矛盾した表記を抽出する。例えば、文書中に「200人まで収容可能」という記載と「300人まで貸切OK」という記載が含まれている場合、「200人」と「300人」が矛盾した表記として抽出される。
以上のように、本実施形態によれば、機械学習によって構築した誤字検出モデルを用いて、文書中に含まれる誤字脱字を抽出するようにしたので、予め設定されたルールに基づく検出が難しい誤字脱字や原稿内不一致の検出を行うことができる。なお、本実施形態では、機械学習により構築した誤字検出モデルを用いて誤字脱字の検出を行っているが、既存のルールベースでの誤字検出(予め作成した辞書に基づく判定等)と組み合わせて誤字脱字の検出を行うようにしてもよい。
また、誤字検出モデルは、文書中の各文字の出現確率を前後の文脈に基づいて計算し、出現確率が一定値以下の文字を誤字と判定して抽出するので、誤字の判定の精度を向上させることができる。
また、誤字と判定された文字については、より出願確率の高い文字を代替案として提示するようにしたので、利用者が効率的に文書の修正を行うことができる。
また、対象文書に含まれる2つの単語間の類似度を機械学習によって構築した文書内不一致検出モデルを用いて算出し、算出した類似度が所定の閾値以上の場合には、当該2つの単語を文書内不一致として抽出するようにしたので、文書内の表記ゆれを高い精度で抽出することができる。
また、対象文書に含まれる2つの固有名詞間の編集距離を算出し、算出した編集距離が所定の閾値以内の場合には、2つの固有名詞を文書内不一致として抽出するとともに、対象文書に含まれる読み方が一致する2つの一般名詞間の類似度を、文書内不一致検出モデルを用いて算出し、算出した類似度が所定の閾値以上の場合には、当該2つの一般名詞を文書内不一致として抽出するようにした。これにより、単語の種類を考慮して、より精度の高い表記ゆれの判定を行うことができる。
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、上述した各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。
1…文書校閲システム
10…文書校閲サーバ
11…制御装置
12…外部記憶装置
20…端末
201…プロセッサ
202…入力装置
203…表示装置
204…通信インタフェース
205…記憶資源
N…通信ネットワーク

Claims (6)

  1. 対象文書の校閲を行う文書校閲装置であって、
    機械学習によって、文章中の誤字を検出するための誤字検出モデルを構築するモデル構築部と、
    前記誤字検出モデルを用いて、前記対象文書に含まれる誤字脱字の情報を抽出する誤字脱字抽出部と、
    前記対象文書に含まれる複数の単語間の関連性を解析し、文書内不一致を抽出する文書内不一致抽出部と、を備えた文書校閲装置。
  2. 前記誤字脱字抽出部は、
    前記対象文書の各文字の出現確率を、前後の文脈に基づいて計算し、出現確率が一定値以下の文字を誤字と判定して抽出する、請求項1に記載の文書校閲装置。
  3. 誤字と判定された前記文字について、より出願確率の高い文字を修正候補として提示する修正候補提示部を備えた請求項2に記載の文書校閲装置。
  4. 前記文書内不一致抽出部は、
    前記対象文書に含まれる2つの単語間の類似度を機械学習によって構築した文書内不一致検出モデルを用いて算出し、算出した類似度が所定の閾値以上の場合には、当該2つの単語を文書内不一致として抽出する、請求項1から3のいずれか1項に記載の文書校閲装置。
  5. 前記文書内不一致抽出部は、
    前記対象文書に含まれる2つの固有名詞間の編集距離を算出し、算出した編集距離がゼロではなく、且つ所定の閾値以内の場合には、2つの固有名詞を文書内不一致として抽出し、
    前記対象文書に含まれる読み方が一致する2つの一般名詞間の類似度を、前記文書内不一致検出モデルを用いて算出し、算出した類似度が所定の閾値以上の場合には、当該2つの一般名詞を文書内不一致として抽出する、請求項4に記載の文書校閲装置。
  6. 対象文書の校閲を行うコンピュータを、
    機械学習によって、文章中の誤字を検出するための誤字検出モデルを構築するモデル構築部と、
    前記誤字検出モデルを用いて、前記対象文書に含まれる誤字脱字の情報を抽出する誤字脱字抽出部と、
    前記対象文書に含まれる複数の単語間の関連性を解析し、文書内不一致を抽出する文書内不一致抽出部と、して機能させるプログラム。
JP2018031035A 2018-02-23 2018-02-23 文書校閲装置およびプログラム Active JP6568968B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018031035A JP6568968B2 (ja) 2018-02-23 2018-02-23 文書校閲装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018031035A JP6568968B2 (ja) 2018-02-23 2018-02-23 文書校閲装置およびプログラム

Publications (2)

Publication Number Publication Date
JP6568968B2 JP6568968B2 (ja) 2019-08-28
JP2019145023A true JP2019145023A (ja) 2019-08-29

Family

ID=67766703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018031035A Active JP6568968B2 (ja) 2018-02-23 2018-02-23 文書校閲装置およびプログラム

Country Status (1)

Country Link
JP (1) JP6568968B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021241697A1 (ja) * 2020-05-29 2021-12-02 株式会社クオリティア 電子メッセージ翻訳分析システム
KR20210154755A (ko) * 2020-06-11 2021-12-21 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 문자 오류 수정 방법, 장치, 전자 기기 및 기록 매체

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358570A (ja) * 1986-08-29 1988-03-14 Nippon Telegr & Teleph Corp <Ntt> 日本文誤字自動検出方式
JP2003196636A (ja) * 2001-12-26 2003-07-11 Communication Research Laboratory 教師あり機械学習法を用いた表記誤り検出処理方法、その処理装置、およびその処理プログラム
JP2005352888A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 表記揺れ対応辞書作成システム
US20160063094A1 (en) * 2014-08-28 2016-03-03 Microsoft Corporation Spelling Correction of Email Queries
CN107357775A (zh) * 2017-06-05 2017-11-17 百度在线网络技术(北京)有限公司 基于人工智能的循环神经网络的文本纠错方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358570A (ja) * 1986-08-29 1988-03-14 Nippon Telegr & Teleph Corp <Ntt> 日本文誤字自動検出方式
JP2003196636A (ja) * 2001-12-26 2003-07-11 Communication Research Laboratory 教師あり機械学習法を用いた表記誤り検出処理方法、その処理装置、およびその処理プログラム
JP2005352888A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 表記揺れ対応辞書作成システム
US20160063094A1 (en) * 2014-08-28 2016-03-03 Microsoft Corporation Spelling Correction of Email Queries
CN107357775A (zh) * 2017-06-05 2017-11-17 百度在线网络技术(北京)有限公司 基于人工智能的循环神经网络的文本纠错方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
しだみえ: "ソフト買いたい新書 第1回", YOMIURI PC, vol. 第11巻第2号, JPN6019008485, 1 February 2006 (2006-02-01), JP, pages 76 - 79, ISSN: 0003994889 *
仙田 明広: "ワープロステップアップ講座 校正機能を使えば文書のチェックも簡単に", 日経PC21, vol. 第5巻第23号, JPN6019008489, 1 December 2000 (2000-12-01), JP, pages 167, ISSN: 0003994893 *
佐藤 政伸 外3名: "マルコフ連鎖モデルを用いた日本語文誤り検出法の改善", 電子情報通信学会技術研究報告, vol. 第100巻第401号, JPN6019008487, 20 October 2000 (2000-10-20), JP, pages 1 - 7, ISSN: 0003994891 *
河田 岳大 外3名: "両方向N−gram確率を用いた誤り文字検出法", 電子情報通信学会論文誌 (J88−D−II), vol. 第J88-D-II巻第3号, JPN6019008486, 1 March 2005 (2005-03-01), JP, pages 629 - 635, ISSN: 0003994890 *
荒牧 英治 外2名: "TYPO Writer ヒトはどのように打ち間違えるのか?", 言語処理学会第16回年次大会発表論文集, JPN6019008488, 8 March 2010 (2010-03-08), JP, pages 966 - 969, ISSN: 0003994892 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021241697A1 (ja) * 2020-05-29 2021-12-02 株式会社クオリティア 電子メッセージ翻訳分析システム
JP2021189794A (ja) * 2020-05-29 2021-12-13 株式会社クオリティア 電子メッセージ翻訳分析システム
JP7497552B2 (ja) 2020-05-29 2024-06-11 株式会社クオリティア 電子メッセージ翻訳分析システム
KR20210154755A (ko) * 2020-06-11 2021-12-21 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 문자 오류 수정 방법, 장치, 전자 기기 및 기록 매체
JP2021197175A (ja) * 2020-06-11 2021-12-27 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 文字誤り訂正方法、装置、電子デバイス及び記憶媒体
US11443100B2 (en) 2020-06-11 2022-09-13 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for correcting character errors, electronic device and storage medium
KR102541054B1 (ko) 2020-06-11 2023-06-05 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 문자 오류 수정 방법, 장치, 전자 기기 및 기록 매체

Also Published As

Publication number Publication date
JP6568968B2 (ja) 2019-08-28

Similar Documents

Publication Publication Date Title
US11151130B2 (en) Systems and methods for assessing quality of input text using recurrent neural networks
CN110765763B (zh) 语音识别文本的纠错方法、装置、计算机设备和存储介质
US11636264B2 (en) Stylistic text rewriting for a target author
US20210157984A1 (en) Intelligent system that dynamically improves its knowledge and code-base for natural language understanding
US20230142217A1 (en) Model Training Method, Electronic Device, And Storage Medium
US11762926B2 (en) Recommending web API&#39;s and associated endpoints
US20190286691A1 (en) Caption Association Techniques
US10803241B2 (en) System and method for text normalization in noisy channels
CN111626048A (zh) 文本纠错方法、装置、设备及存储介质
US10402474B2 (en) Keyboard input corresponding to multiple languages
CN111680159A (zh) 数据处理方法、装置及电子设备
US20220147835A1 (en) Knowledge graph construction system and knowledge graph construction method
TWI567569B (zh) Natural language processing systems, natural language processing methods, and natural language processing programs
CN110866098A (zh) 基于transformer和lstm的机器阅读方法、装置及可读存储介质
CN104239289A (zh) 音节划分方法和音节划分设备
CN116702723A (zh) 一种合同段落标注模型的训练方法、装置及设备
JP6568968B2 (ja) 文書校閲装置およびプログラム
CN110516125B (zh) 识别异常字符串的方法、装置、设备及可读存储介质
CN111814496A (zh) 文本处理方法、装置、设备及存储介质
US8244732B2 (en) Named entity marking apparatus, named entity marking method, and computer readable medium thereof
CN110083817B (zh) 一种命名排歧方法、装置、计算机可读存储介质
US20210200796A1 (en) Search word suggestion device, method for generating unique expression informaton, and program for generating unique expression information
CN114064845A (zh) 关系表示模型的训练方法、装置及电子设备
JP2021018520A (ja) 情報処理装置、情報処理方法及びプログラム
US20180033425A1 (en) Evaluation device and evaluation method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181129

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181129

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20181212

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190805

R150 Certificate of patent or registration of utility model

Ref document number: 6568968

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250