JP6768750B2 - 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム - Google Patents
学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム Download PDFInfo
- Publication number
- JP6768750B2 JP6768750B2 JP2018158681A JP2018158681A JP6768750B2 JP 6768750 B2 JP6768750 B2 JP 6768750B2 JP 2018158681 A JP2018158681 A JP 2018158681A JP 2018158681 A JP2018158681 A JP 2018158681A JP 6768750 B2 JP6768750 B2 JP 6768750B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- neural network
- character string
- error
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Description
図1は、本発明の第1の実施形態に係る学習方法および誤り判定方法が適用された誤り発見エンジンの構成例を示すブロック図である。
学習プログラム21は、ニューラル・ネットワークを学習させるためのプログラムである。
このように学習されたニューラル・ネットワークによってなされる文字列における誤り判定時の処理について、具体例を用いながら説明する。
次に、第1の実施形態の変形例1について説明する。
11・・バス、
12・・CPU、
13・・外部記録媒体、
14・・記録媒体読取部、
15・・ディスプレイ、
16・・キー入力部、
17・・通信部、
18・・記憶装置、
20・・メモリ、
21・・学習プログラム、
22・・誤り判定プログラム、
23・・書込可能データエリア、
30・・記事データベース。
Claims (18)
- 被験文書の正誤判定をするために、ニューラル・ネットワークを学習させる方法であって、
プロセッサが、
記憶装置に記憶された正しい文書から、任意の長さの任意の文字列を切り出し、正しい学習データとする工程と、
前記正しい学習データに対して、文字の置換、並べ替え、追加、重複、及び削除のうちの何れかを実施することによって誤り学習データを作成する工程と、
前記正しい学習データである文字列と、前記誤り学習データである文字列とを、ベクトル列に変換する工程と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させる工程とを実行する、学習方法。 - 前記プロセッサは、
前記変換する工程を実行する場合、前記文字列をベクトル列に変換する際に、前記文字列に含まれる文字を、ワン・ホット・ベクトルに置換する、請求項1に記載の学習方法。 - 前記プロセッサは、
前記学習させる工程を実行する場合、前記変換されたベクトル列を、次元削減して、前記ニューラル・ネットワークに入力する、請求項1または2に記載の学習方法。 - 前記ニューラル・ネットワークは、多層LSTM(Long Short Term Memory)である、請求項1乃至3のうち何れか1項に記載の学習方法。
- 前記プロセッサは、
前記学習させる工程を実行する場合、前記変換されたベクトル列を、前記ニューラル・ネットワークに入力して得られた出力を、ソフトマックス関数に入力することによって、前記ベクトル列に対応する文字列の前記正誤判定を示すスコアに変換する、請求項1に記載の学習方法。 - 前記プロセッサは、
前記学習させる工程を実行する場合、前記スコアに基づいて、前記ニューラル・ネットワークを学習させる、請求項5に記載の学習方法。 - ニューラル・ネットワークを学習させて、被験文書における誤りの有無を判定する誤り判定方法であって、
プロセッサが、
記憶装置に記憶された正しい文書から、任意の長さの任意の文字列を切り出し、正しい学習データとする工程と、
前記正しい学習データに対して、文字の置換、並べ替え、追加、重複、及び削除のうちの何れかを実施することによって誤り学習データを作成する工程と、
前記正しい学習データである文字列と、前記誤り学習データである文字列とを、ベクトル列に変換する工程と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させることによって得られた出力に基づいて、前記被験文書における誤りの有無を判定する工程とを実行する、誤り判定方法。 - 前記切り出される文字列の長さは、ジャンルに応じて決定される、請求項7に記載の誤り判定方法。
- 被験文書の正誤判定をするために、ニューラル・ネットワークを学習させるシステムであって、
記憶装置に記憶された正しい文書から、任意の長さの任意の文字列を切り出し、正しい学習データとする手段と、
前記正しい学習データに対して、文字の置換、並べ替え、追加、重複、及び削除のうちの何れかを実施することによって誤り学習データを作成する手段と、
前記正しい学習データである文字列と、前記誤り学習データである文字列とを、ベクトル列に変換する手段と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させる手段とを含む、学習システム。 - 前記変換する手段は、前記文字列をベクトル列に変換する際に、前記文字列に含まれる文字を、ワン・ホット・ベクトルに置換する手段を含む、請求項9に記載の学習システム。
- 前記学習させる手段は、前記変換されたベクトル列を、次元削減して、前記ニューラル・ネットワークに入力する手段を含む、請求項9または10に記載の学習システム。
- 前記ニューラル・ネットワークは、多層LSTM(Long Short Term Memory)である、請求項9乃至11のうち何れか1項に記載の学習システム。
- 前記学習させる手段は、前記変換されたベクトル列を、前記ニューラル・ネットワークに入力して得られた出力を、ソフトマックス関数に入力することによって、前記ベクトル列に対応する文字列の前記正誤判定を示すスコアに変換する手段を含む、請求項9に記載の学習システム。
- 前記学習させる手段は、前記スコアに基づいて、前記ニューラル・ネットワークを学習する手段を含む、請求項13に記載の学習システム。
- ニューラル・ネットワークを学習させて、被験文書における誤りの有無を判定する誤り判定システムであって、
記憶装置に記憶された正しい文書から、任意の長さの任意の文字列を切り出し、正しい学習データとする手段と、
前記正しい学習データに対して、文字の置換、並べ替え、追加、重複、及び削除のうちの何れかを実施することによって誤り学習データを作成する手段と、
前記正しい学習データである文字列と、前記誤り学習データである文字列とを、ベクトル列に変換する手段と、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させることによって得られた出力に基づいて、前記文字列における誤りの有無を判定する手段とを含む、誤り判定システム。 - 前記文字列の長さは、ジャンルに応じて決定される、請求項15に記載の誤り判定システム。
- 被験文書の正誤判定をするために、ニューラル・ネットワークを学習させるプログラムであって、
記憶装置に記憶された正しい文書から、任意の長さの任意の文字列を切り出し、正しい学習データとする機能、
前記正しい学習データに対して、文字の置換、並べ替え、追加、重複、及び削除のうちの何れかを実施することによって誤り学習データを作成する機能、
前記正しい学習データである文字列と、前記誤り学習データである文字列とを、ベクトル列に変換する機能、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させる機能を、プロセッサに実現させるためのプログラム。 - ニューラル・ネットワークを学習させて、文字列における誤りの有無を判定する誤り判定プログラムであって、
記憶装置に記憶された正しい文書から、任意の長さの任意の文字列を切り出し、正しい学習データとする機能、
前記正しい学習データに対して、文字の置換、並べ替え、追加、重複、及び削除のうちの何れかを実施することによって誤り学習データを作成する機能、
前記正しい学習データである文字列と、前記誤り学習データである文字列とを、ベクトル列に変換する機能、
前記変換されたベクトル列を、前記ニューラル・ネットワークに入力し、前記ニューラル・ネットワークを学習させることによって得られた出力に基づいて、前記文字列における誤りの有無を判定する機能を、プロセッサに実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158681A JP6768750B2 (ja) | 2018-08-27 | 2018-08-27 | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158681A JP6768750B2 (ja) | 2018-08-27 | 2018-08-27 | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035023A JP2020035023A (ja) | 2020-03-05 |
JP6768750B2 true JP6768750B2 (ja) | 2020-10-14 |
Family
ID=69668082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018158681A Active JP6768750B2 (ja) | 2018-08-27 | 2018-08-27 | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6768750B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7190479B2 (ja) * | 2020-12-28 | 2022-12-15 | 楽天グループ株式会社 | 学習装置、機械学習モデル及び学習方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5635025B2 (ja) * | 2012-02-29 | 2014-12-03 | 日本電信電話株式会社 | 助詞誤り訂正装置、方法、及びプログラム |
US10115055B2 (en) * | 2015-05-26 | 2018-10-30 | Booking.Com B.V. | Systems methods circuits and associated computer executable code for deep learning based natural language understanding |
-
2018
- 2018-08-27 JP JP2018158681A patent/JP6768750B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020035023A (ja) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106650943B (zh) | 基于人工智能的辅助写作方法和装置 | |
JP5963328B2 (ja) | 生成装置、生成方法、およびプログラム | |
CN111680634B (zh) | 公文文件处理方法、装置、计算机设备及存储介质 | |
JP7433601B2 (ja) | エキスパートレポートエディタ | |
CN109783796A (zh) | 预测文本内容中的样式破坏 | |
US20190317986A1 (en) | Annotated text data expanding method, annotated text data expanding computer-readable storage medium, annotated text data expanding device, and text classification model training method | |
CN111553159B (zh) | 一种问句生成方法及系统 | |
JP7281905B2 (ja) | 文書評価装置、文書評価方法及びプログラム | |
JP6768738B2 (ja) | 学習データ生成装置、方法、およびプログラム | |
CN117408650B (zh) | 基于人工智能的数字化招标文件制作和评估系统 | |
CN111180025A (zh) | 表示病历文本向量的方法、装置及问诊系统 | |
JP2019212115A (ja) | 検査装置、検査方法、プログラム及び学習装置 | |
JP6768750B2 (ja) | 学習方法、誤り判定方法、学習システム、誤り判定システム、およびプログラム | |
JP2009199302A (ja) | ドキュメントを解析するためのプログラム,装置および方法 | |
CN112836013A (zh) | 一种数据标注的方法、装置、可读存储介质和电子设备 | |
JP2006065675A (ja) | データ検索方法および装置 | |
CN117112743A (zh) | 文本自动生成问题的可回答性评估方法、系统及存储介质 | |
JP5357711B2 (ja) | 文書処理装置 | |
JP2016133821A (ja) | 情報処理装置、情報処理方法およびプログラム | |
KR20090126862A (ko) | 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체 | |
JP7427510B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2010092108A (ja) | 類似文章抽出プログラム、方法、装置 | |
JP7531748B2 (ja) | 学習装置、管理シート作成支援装置、プログラム、学習方法及び管理シート作成支援方法 | |
WO2024116381A1 (ja) | 表記ゆれ指摘装置、表記ゆれ指摘方法、及びプログラム | |
CN115759087B (zh) | 中文分词的方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180925 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200825 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200923 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6768750 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |