JP2020035023A - 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム - Google Patents
学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム Download PDFInfo
- Publication number
- JP2020035023A JP2020035023A JP2018158681A JP2018158681A JP2020035023A JP 2020035023 A JP2020035023 A JP 2020035023A JP 2018158681 A JP2018158681 A JP 2018158681A JP 2018158681 A JP2018158681 A JP 2018158681A JP 2020035023 A JP2020035023 A JP 2020035023A
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- learning
- character string
- error
- vector sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
Description
図1は、本発明の第1の実施形態に係る学習方法および誤り判定方法が適用された誤り発見エンジンの構成例を示すブロック図である。
学習プログラム21は、ニューラル・ネットワークを学習させるためのプログラムである。
このように学習されたニューラル・ネットワークによってなされる文字列における誤り判定時の処理について、具体例を用いながら説明する。
次に、第1の実施形態の変形例1について説明する。
11・・バス、
12・・CPU、
13・・外部記録媒体、
14・・記録媒体読取部、
15・・ディスプレイ、
16・・キー入力部、
17・・通信部、
18・・記憶装置、
20・・メモリ、
21・・学習プログラム、
22・・誤り判定プログラム、
23・・書込可能データエリア、
30・・記事データベース。
Claims (18)
- 文字列の正誤判定をするために、ニューラル・ネットワークを学習させる方法であって、
学習データとなる文字列を、ベクトル列に変換する第1の工程と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させる第2の工程とを含む、学習方法。 - 前記第1の工程は、前記文字列をベクトル列に変換する際に、前記文字列に含まれる文字を、ワン・ホット・ベクトルに置換する工程を含む、請求項1に記載の学習方法。
- 前記第2の工程は、前記変換されたベクトル列を、次元削減して、前記ニューラル・ネットワークに入力する工程を含む、請求項1または2に記載の学習方法。
- 前記ニューラル・ネットワークは、多層LSTM(Long Short Term Memory)である、請求項1乃至3のうち何れか1項に記載の学習方法。
- 前記第2の工程は、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力して得られた出力を、ソフトマックス関数に入力することによって、前記ベクトル列に対応する文字列の前記正誤判定を示すスコアに変換する工程を含む、請求項1に記載の学習方法。 - 前記第2の工程は、前記スコアに基づいて、前記ニューラル・ネットワークを学習する工程を含む、請求項5に記載の学習方法。
- ニューラル・ネットワークを使って、文字列における誤りの有無を判定する誤り判定方法であって、
学習データとなる文字列を、ベクトル列に変換する第1の工程と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、得られた出力に基づいて、前記文字列における誤りの有無を判定する第2の工程とを含む、誤り判定方法。 - 前記文字列の長さは、ジャンルに応じて決定される、請求項7に記載の誤り判定方法。
- 文字列の正誤判定をするために、ニューラル・ネットワークを学習させるシステムであって、
学習データとなる文字列を、ベクトル列に変換する第1の手段と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させる第2の手段とを含む、学習システム。 - 前記第1の手段は、前記文字列をベクトル列に変換する際に、前記文字列に含まれる文字を、ワン・ホット・ベクトルに置換する手段を含む、請求項9に記載の学習システム。
- 前記第2の手段は、前記変換されたベクトル列を、次元削減して、前記ニューラル・ネットワークに入力する手段を含む、請求項9または10に記載の学習システム。
- 前記ニューラル・ネットワークは、多層LSTM(Long Short Term Memory)である、請求項9乃至11のうち何れか1項に記載の学習システム。
- 前記第2の手段は、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力して得られた出力を、ソフトマックス関数に入力することによって、前記ベクトル列に対応する文字列の前記正誤判定を示すスコアに変換する手段を含む、請求項9に記載の学習システム。 - 前記第2の手段は、前記スコアに基づいて、前記ニューラル・ネットワークを学習する手段を含む、請求項13に記載の学習システム。
- ニューラル・ネットワークを使って、文字列における誤りの有無を判定する誤り判定システムであって、
学習データとなる文字列を、ベクトル列に変換する第1の手段と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、得られた出力に基づいて、前記文字列における誤りの有無を判定する第2の手段とを含む、誤り判定システム。 - 前記文字列の長さは、ジャンルに応じて決定される、請求項15に記載の誤り判定システム。
- 文字列の正誤判定をするために、ニューラル・ネットワークを学習させるプログラムであって、
学習データとなる文字列を、ベクトル列に変換する機能、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させる機能を、プロセッサに実現させるためのプログラム。 - ニューラル・ネットワークを使って、文字列における誤りの有無を判定する誤り判定プログラムであって、
学習データとなる文字列を、ベクトル列に変換する機能、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、得られた出力に基づいて、前記文字列における誤りの有無を判定する機能を、プロセッサに実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158681A JP6768750B2 (ja) | 2018-08-27 | 2018-08-27 | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158681A JP6768750B2 (ja) | 2018-08-27 | 2018-08-27 | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035023A true JP2020035023A (ja) | 2020-03-05 |
JP6768750B2 JP6768750B2 (ja) | 2020-10-14 |
Family
ID=69668082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018158681A Active JP6768750B2 (ja) | 2018-08-27 | 2018-08-27 | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6768750B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023018101A (ja) * | 2020-12-28 | 2023-02-07 | 楽天グループ株式会社 | 学習装置、機械学習モデル及び学習方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013182347A (ja) * | 2012-02-29 | 2013-09-12 | Nippon Telegr & Teleph Corp <Ntt> | 助詞誤り訂正装置、方法、及びプログラム |
US20160350655A1 (en) * | 2015-05-26 | 2016-12-01 | Evature Technologies (2009) Ltd. | Systems Methods Circuits and Associated Computer Executable Code for Deep Learning Based Natural Language Understanding |
-
2018
- 2018-08-27 JP JP2018158681A patent/JP6768750B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013182347A (ja) * | 2012-02-29 | 2013-09-12 | Nippon Telegr & Teleph Corp <Ntt> | 助詞誤り訂正装置、方法、及びプログラム |
US20160350655A1 (en) * | 2015-05-26 | 2016-12-01 | Evature Technologies (2009) Ltd. | Systems Methods Circuits and Associated Computer Executable Code for Deep Learning Based Natural Language Understanding |
Non-Patent Citations (4)
Title |
---|
氏原 淳志: "第2章 ディープラーニング入門 CNNで画像分類とドキュメント分類にチャレンジ!", SOFTWAREDESIGN, vol. 第322号, JPN6020008331, 18 August 2017 (2017-08-18), JP, pages 26 - 34, ISSN: 0004227189 * |
竹内 孔一、松本 裕治: "共起情報と統計的形態素解析によるOCR誤り訂正", 情報処理学会研究報告, vol. 第97巻第85号, JPN6020008333, 12 September 1997 (1997-09-12), JP, pages 17 - 24, ISSN: 0004227191 * |
金子 顕之 外3名: "深層学習と合議を用いた極性分類", 電子情報通信学会技術研究報告, vol. 第117巻第207号, JPN6020008332, 31 August 2017 (2017-08-31), JP, pages 81 - 86, ISSN: 0004227190 * |
高橋 諒: "Deep Learningで始める文書解析入門(2)校正担当者必見!? 地味な誤字脱字で泣かないためのRecurrent Neu", インターネット, JPN6020008334, 6 October 2016 (2016-10-06), pages 1 - 7, ISSN: 0004227192 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023018101A (ja) * | 2020-12-28 | 2023-02-07 | 楽天グループ株式会社 | 学習装置、機械学習モデル及び学習方法 |
JP7445730B2 (ja) | 2020-12-28 | 2024-03-07 | 楽天グループ株式会社 | 学習装置、機械学習モデル及び学習方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6768750B2 (ja) | 2020-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Al-Thanyyan et al. | Automated text simplification: a survey | |
CN109783796B (zh) | 预测文本内容中的样式破坏 | |
TW201918913A (zh) | 機器處理及文本糾錯方法和裝置、計算設備以及儲存媒體 | |
US20160098645A1 (en) | High-precision limited supervision relationship extractor | |
US20090326912A1 (en) | Means and a method for training a statistical machine translation system | |
US20190317986A1 (en) | Annotated text data expanding method, annotated text data expanding computer-readable storage medium, annotated text data expanding device, and text classification model training method | |
JP7281905B2 (ja) | 文書評価装置、文書評価方法及びプログラム | |
CN111723784A (zh) | 一种风险视频识别方法、装置和电子设备 | |
JP7155625B2 (ja) | 検査装置、検査方法、プログラム及び学習装置 | |
CN114564959A (zh) | 中文临床表型细粒度命名实体识别方法及系统 | |
JP6768738B2 (ja) | 学習データ生成装置、方法、およびプログラム | |
Moryossef et al. | Linguistically motivated sign language segmentation | |
CN112836013B (zh) | 一种数据标注的方法、装置、可读存储介质和电子设备 | |
CN113887191A (zh) | 文章的相似性检测方法及装置 | |
JP6768750B2 (ja) | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
JP2013134625A (ja) | 抽出装置、抽出プログラム、および抽出方法 | |
JP5594134B2 (ja) | 文字列検索装置,文字列検索方法および文字列検索プログラム | |
JP2016133821A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP7322468B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2010092108A (ja) | 類似文章抽出プログラム、方法、装置 | |
JP2007193500A (ja) | 文書または図面作成支援装置 | |
WO2023228351A1 (ja) | 学習装置、管理シート作成支援装置、プログラム、学習方法及び管理シート作成支援方法 | |
CN115759087B (zh) | 中文分词的方法、装置及电子设备 | |
WO2024116381A1 (ja) | 表記ゆれ指摘装置、表記ゆれ指摘方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180925 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200825 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200923 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6768750 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |