JP6418975B2 - 難易度推定モデル学習装置、難易度推定装置、方法、及びプログラム - Google Patents
難易度推定モデル学習装置、難易度推定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6418975B2 JP6418975B2 JP2015031000A JP2015031000A JP6418975B2 JP 6418975 B2 JP6418975 B2 JP 6418975B2 JP 2015031000 A JP2015031000 A JP 2015031000A JP 2015031000 A JP2015031000 A JP 2015031000A JP 6418975 B2 JP6418975 B2 JP 6418975B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- difficulty level
- text
- estimation model
- level estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
10、210 入力部
20、220 演算部
30、230 特徴量抽出部
32 難易度推定モデル生成部
40、240 難易度推定モデル
100 難易度推定モデル学習装置
200 難易度推定装置
228 前処理部
232 難易度推定部
250 出力部
Claims (8)
- 難易度又は対象年齢が付与された絵本のテキストの各々から、動詞の割合及び形容詞の割合を含む特定の品詞の割合と、空白、句読点、改行、及び改ページの区切りで抽出された塊の異なり数と、
文区切りで抽出された、
一文に含まれる文字数の平均値、
一文に含まれる文節数の平均値、
一文に含まれる述語数の平均値、
一文に含まれる単語数の平均値、
一文に含まれる文字数の最大値、
一文に含まれる文節数の最大値、
一文に含まれる述語数の最大値、及び
一文に含まれる単語数の最大値
のうちの少なくともいずれか一つ以上と、を含む特徴量を抽出する特徴量抽出部と、
前記特徴量抽出部により前記テキストの各々について抽出された前記特徴量、及び前記テキストの各々に付与された難易度又は対象年齢に基づいて、前記テキストの難易度又は対象年齢を推定するための難易度推定モデルを生成する難易度推定モデル生成部と、
を含む難易度推定モデル学習装置であって、
前記文区切りは、
前記テキストに句点が存在する場合には、句点を文区切りとして句点前後の文を異なる文であると判定し、
前記テキストが名詞のみ、または、名詞及び擬音語のみの場合であって、改行直前の単語が名詞である場合に前記改行の次の文は前記改行直前の文とは異なる文であると判定し、
前記テキストに句読点がなく、かつ、一ページ中に複数の文が含まれる場合であって、改行直前の単語が助詞である場合に、前記改行の次の文は前記改行直前の文と同じ文であると判定し、前記助詞である場合以外の場合は改行前後の文を異なる文であると判定する、ことによって決定されるものであることを特徴とする難易度推定モデル学習装置。 - 入力された絵本のテキストから、動詞の割合及び形容詞の割合を含む特定の品詞の割合と、空白、句読点、改行、及び改ページの区切りで抽出された塊の異なり数と、文区切りで抽出された、一文に含まれる文字数の平均値、一文に含まれる文節数の平均値、一文に含まれる述語数の平均値、一文に含まれる単語数の平均値、一文に含まれる文字数の最大値、一文に含まれる文節数の最大値、一文に含まれる述語数の最大値、及び一文に含まれる単語数の最大値のうちの少なくともいずれか一つ以上と、を含む特徴量を抽出する特徴量抽出部と、
前記特徴量抽出部により抽出された前記テキストの前記特徴量と、前記テキストの難易度又は対象年齢を推定するための予め求められた難易度推定モデルとに基づいて、前記テキストの難易度又は対象年齢を推定する難易度推定部と、
を含む難易度推定装置であって、
前記文区切りは、
前記テキストに句点が存在する場合には、句点を文区切りとして句点前後の文を異なる文であると判定し、
前記テキストが名詞のみ、または、名詞及び擬音語のみの場合であって、改行直前の単語が名詞である場合に前記改行の次の文は前記改行直前の文とは異なる文であると判定し、
前記テキストに句読点がなく、かつ、一ページ中に複数の文が含まれる場合であって、改行直前の単語が助詞である場合に、前記改行の次の文は前記改行直前の文と同じ文であると判定し、前記助詞である場合以外の場合は改行前後の文を異なる文であると判定する、ことによって決定されるものであることを特徴とする難易度推定装置。 - 前記難易度推定モデル生成部は、前記特徴量に基づいて難易度又は対象年齢を推定するための識別器を、前記難易度推定モデルとして推定する請求項1に記載の難易度推定モデル学習装置。
- 前記難易度推定部は、前記難易度推定モデルとして予め求められた、前記特徴量に基づいて難易度を推定するための識別器に基づいて、前記テキストの難易度又は対象年齢を推定する請求項2に記載の難易度推定装置。
- 特徴量抽出部が、難易度又は対象年齢が付与された絵本のテキストの各々から、動詞の割合及び形容詞の割合を含む特定の品詞の割合と、空白、句読点、改行、及び改ページの区切りで抽出された塊の異なり数と、文区切りで抽出された、一文に含まれる文字数の平均値、一文に含まれる文節数の平均値、一文に含まれる述語数の平均値、一文に含まれる単語数の平均値、一文に含まれる文字数の最大値、一文に含まれる文節数の最大値、一文に含まれる述語数の最大値、及び一文に含まれる単語数の最大値のうちの少なくともいずれか一つ以上と、を含む特徴量を抽出するステップと、
難易度推定モデル生成部が、前記特徴量抽出部により前記テキストの各々について抽出された前記特徴量、及び前記テキストの各々に付与された難易度又は対象年齢に基づいて、前記テキストの難易度又は対象年齢を推定するための難易度推定モデルを生成するステップと、
を含む難易度推定モデル学習方法であって、
前記文区切りは、
前記テキストに句点が存在する場合には、句点を文区切りとして句点前後の文を異なる文であると判定し、
前記テキストが名詞のみ、または、名詞及び擬音語のみの場合であって、改行直前の単語が名詞である場合に前記改行の次の文は前記改行直前の文とは異なる文であると判定し、
前記テキストに句読点がなく、かつ、一ページ中に複数の文が含まれる場合であって、改行直前の単語が助詞である場合に、前記改行の次の文は前記改行直前の文と同じ文であると判定し、前記助詞である場合以外の場合は改行前後の文を異なる文であると判定する、ことによって決定されるものであることを特徴とする難易度推定モデル学習方法。 - 特徴量抽出部が、入力された絵本のテキストから、動詞の割合及び形容詞の割合を含む特定の品詞の割合と、空白、句読点、改行、及び改ページの区切りで抽出された塊の異なり数と、文区切りで抽出された、一文に含まれる文字数の平均値、一文に含まれる文節数の平均値、一文に含まれる述語数の平均値、一文に含まれる単語数の平均値、一文に含まれる文字数の最大値、一文に含まれる文節数の最大値、一文に含まれる述語数の最大値、及び一文に含まれる単語数の最大値のうちの少なくともいずれか一つ以上と、を含む特徴量を抽出するステップと、
難易度推定部が、前記特徴量抽出部により抽出された前記テキストの前記特徴量と、前記テキストの難易度又は対象年齢を推定するための予め求められた難易度推定モデルとに基づいて、前記テキストの難易度又は対象年齢を推定するステップと、
を含む難易度推定であって、
前記文区切りは、
前記テキストに句点が存在する場合には、句点を文区切りとして句点前後の文を異なる文であると判定し、
前記テキストが名詞のみ、または、名詞及び擬音語のみの場合であって、改行直前の単語が名詞である場合に前記改行の次の文は前記改行直前の文とは異なる文であると判定し、
前記テキストに句読点がなく、かつ、一ページ中に複数の文が含まれる場合であって、改行直前の単語が助詞である場合に、前記改行の次の文は前記改行直前の文と同じ文であると判定し、前記助詞である場合以外の場合は改行前後の文を異なる文であると判定する、ことによって決定されるものであることを特徴とする難易度推定方法。 - コンピュータを、請求項1又は3に記載の難易度推定モデル学習装置の各部として機能させるためのプログラム。
- コンピュータを、請求項2又は4に記載の難易度推定装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015031000A JP6418975B2 (ja) | 2015-02-19 | 2015-02-19 | 難易度推定モデル学習装置、難易度推定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015031000A JP6418975B2 (ja) | 2015-02-19 | 2015-02-19 | 難易度推定モデル学習装置、難易度推定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016152032A JP2016152032A (ja) | 2016-08-22 |
JP6418975B2 true JP6418975B2 (ja) | 2018-11-07 |
Family
ID=56695460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015031000A Active JP6418975B2 (ja) | 2015-02-19 | 2015-02-19 | 難易度推定モデル学習装置、難易度推定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6418975B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6729330B2 (ja) * | 2016-11-29 | 2020-07-22 | 日本製鉄株式会社 | 製造工期予測装置、製造工期予測方法、およびコンピュータプログラム |
JP7106999B2 (ja) * | 2018-06-06 | 2022-07-27 | 日本電信電話株式会社 | 難易度推定装置、難易度推定モデル学習装置、方法、及びプログラム |
US20230205992A1 (en) * | 2020-06-16 | 2023-06-29 | Nippon Telegraph And Telephone Corporation | Proofreading support apparatus, proofreading support method and proofreading support program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5322047B2 (ja) * | 2007-06-27 | 2013-10-23 | 国立大学法人長岡技術科学大学 | 文章の読み易さ評価システム |
JP2011013811A (ja) * | 2009-06-30 | 2011-01-20 | Konan Gakuen | 単語レベル判定装置、単語レベル判定システム、単語レベル判定方法、制御プログラム、および、記録媒体 |
-
2015
- 2015-02-19 JP JP2015031000A patent/JP6418975B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016152032A (ja) | 2016-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Salehi et al. | A word embedding approach to predicting the compositionality of multiword expressions | |
JP6466952B2 (ja) | 文章生成システム | |
CN101315622B (zh) | 检测文件相似度的系统及方法 | |
CN103995853A (zh) | 基于关键句的多语言情感数据处理分类方法及系统 | |
US10452785B2 (en) | Translation assistance system, translation assistance method and translation assistance program | |
Nguyen-Son et al. | Identifying computer-generated text using statistical analysis | |
Ljubešić et al. | Discriminating between closely related languages on twitter | |
JP4534666B2 (ja) | テキスト文検索装置及びテキスト文検索プログラム | |
Sazali et al. | Information extraction: Evaluating named entity recognition from classical Malay documents | |
Wahbeh et al. | Comparative assessment of the performance of three WEKA text classifiers applied to arabic text | |
Sheth et al. | Dhiya: A stemmer for morphological level analysis of Gujarati language | |
JP6418975B2 (ja) | 難易度推定モデル学習装置、難易度推定装置、方法、及びプログラム | |
Gupta | Hybrid algorithm for multilingual summarization of Hindi and Punjabi documents | |
US11520994B2 (en) | Summary evaluation device, method, program, and storage medium | |
WO2019235446A1 (ja) | 難易度推定装置、難易度推定モデル学習装置、方法、及びプログラム | |
CN112989816B (zh) | 文本内容质量评估方法及系统 | |
Gupta | Automatic stemming of words for Punjabi language | |
CN111259661B (zh) | 一种基于商品评论的新情感词提取方法 | |
JP6298780B2 (ja) | 難易度学習装置、難易度推定モデル学習装置、難易度推定装置、方法、及びプログラム | |
Chiu et al. | Chinese spell checking based on noisy channel model | |
Aedmaa et al. | Combining abstractness and language-specific theoretical indicators for detecting non-literal usage of Estonian particle verbs | |
JP2016057810A (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
JP2016152030A (ja) | 難易度推定式学習装置、難易度推定装置、方法、及びプログラム | |
Çetinoglu | Turkish Treebank as a Gold Standard for Morphological Disambiguation and Its Influence on Parsing. | |
Cholakov et al. | Automated verb sense labelling based on linked lexical resources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180327 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181009 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6418975 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |