JP2014049008A - 語彙学習関数推定装置、語彙学習関数推定方法及びそのプログラム - Google Patents
語彙学習関数推定装置、語彙学習関数推定方法及びそのプログラム Download PDFInfo
- Publication number
- JP2014049008A JP2014049008A JP2012192939A JP2012192939A JP2014049008A JP 2014049008 A JP2014049008 A JP 2014049008A JP 2012192939 A JP2012192939 A JP 2012192939A JP 2012192939 A JP2012192939 A JP 2012192939A JP 2014049008 A JP2014049008 A JP 2014049008A
- Authority
- JP
- Japan
- Prior art keywords
- vocabulary learning
- vocabulary
- plateau
- age
- learning curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】語彙学習関数推定装置は、幼児が新しい単語を発話するようになった日齢と、日齢までに幼児が発話するようになった単語の累積数との関係を示す語彙学習曲線に基づき、新しい単語を発話するようになった日齢の間隔が閾値より大きくなる部分を検出し、語彙学習曲線を平滑化して、平滑化した語彙学習曲線の語彙学習速度が極小となる部分を検出し、新しい単語を発話するようになった日齢の間隔が閾値より大きくなる部分における日齢の間隔を閾値よりも小さい基準値に置き換え、平滑化した語彙学習曲線の語彙学習速度が極小となる部分の前後における日齢の間隔が基準値よりも大きい場合には、その日齢の間隔を基準値に置き換え、日齢の間隔が置き換えられた前記語彙学習曲線を、線形関数で近似する。
【選択図】図5
Description
(2)緩やかな上昇を示す二次曲線で語彙学習曲線を近似し、18−20ヶ月ころに現れる変曲点を語彙爆発時期とする手法。
(3)50語覚えた時点を語彙爆発時期と定義する50語達成基準法。
(4)ある特定の期間(例えば三週間)で達成基準(例えば三十語以上)を満たした時期を語彙爆発時期にするという特定期間達成基準法。
(5)時間軸に沿った語彙獲得データの速度成分をロジスティック回帰式に近似させ、その変曲点を語彙爆発時期とするロジスティック回帰近似法(非特許文献1参照)。
(6)語彙爆発の前後で、語彙獲得直線を、二つの直線で近似し、その誤差の和が最小になるようにし、その交点を語彙爆発時期とする手法(非特許文献2参照)。
まず、発明者らは、語彙爆発がある一時期に語彙が急激に増加するような簡単な現象ではなく、いくつかの急峻な語彙の増加が重なりあっている現象であることを発見した(参考文献1参照)。
[参考文献1]Y. Minami, H. Sugiyama, T. Kobayashi, "Multiple Vocabulary Spurts in Japanese Children", 12th International Congress for the Study of Child Language (IASCL2011), 2011
さらに、語彙学習曲線をよく観察すると、これらの増加は、単純な曲線(直線や二次曲線)に、新しい単語を数日間以上発話しない区間を複数個挿入するモデルで表現できることを発見した。この新しい単語を数日間以上発話しない区間(部分)をプラトー(plateau:「平原」を意味する学習心理学の専門用語)と名付けた。実際、図1及び図2を見ると、プラトー(その幾つかを実線で囲まれた部分に示す)が存在することが分かる。このモデル化では、元々の語彙学習曲線が極めて単純な曲線(直線や二次曲線)と仮定しているため、これらのプラトーは、語彙爆発という現象を理解するのに重要な鍵となる特徴量であり、語彙学習曲線の特徴と言える。
図5は第一実施形態に係る語彙学習関数推定装置100の機能ブロック図を、図6はその処理フローを示す。
(データセットの収集について)
幼児の語彙学習曲線におけるプラトーを推定するために、どういったデータを参照するかがまずは問題となる。幼児の発話を全てデジタルビデオレコーダーなどの電子メディアで記録可能であれば、それを分析するのが最も高精度な方法といえるが、データ取得にかかるコストは膨大で、かつ幼児の曖昧な発話データを自動で認識し単語レベルで分析する工学的技術もまだ存在しないので、実現は大変難しい。一方、所定期間毎に(例えば、三ヶ月に1度)アンケートに回答してもらい、幼児が新たに発話した単語数の変化を把握する方法もある。この場合、所定期間が長ければ、語彙爆発の正確な時期を把握するのは困難である。また、所定期間が短ければ、アンケートの回答者(幼児の親)への負担が増大する。従って、現実的には、データを記録する親への負担を軽減しつつ、かつ細かい時間ポイントでデータ取得が可能な方法が望ましい。
[参考文献2]小林哲生、永田昌明、「ウェブを用いた幼児言語発達研究:大規模縦断データ収集の試み」、言語処理学会第15回年次大会論文集、2009年、p.534−537
[参考文献3]小林哲生、永田昌明、「ウェブ上で収集した幼児語彙発達データの信頼性検証」、言語処理学会第16回年次大会論文集、2010年、p.403−406
この方法の有効性は科学的に検証されている点で非常によい。
第一プラトー検出部110は、データセット{(1,y1),(2,y2),…,(i,yi),…,(I,yI)}を受け取り、幼児が新しい単語を発話するようになった日齢yiに基づき、新しい単語を発話するようになった日齢の間隔(yi−yi−1)が閾値p1より大きくなる部分を検出し(s110)、その部分の終了位置に対応する単語の累積数iの集合をプラトーの位置の集合{r1,1,r1,2,…,r1,v,…,r1,V}として併合部130に出力する。なお、日齢の間隔(yi−yi−1)が閾値p1より大きくなる場合、プラトーの開始位置の累積数はi−1となり、終了位置に対応する累積数はiとなる。なお、累積数iは、プラトーの終了位置の累積数ではなく、プラトーの終了位置に対応する累積数であり、プラトーの終了位置は単語の累積数がiになる前日である(日齢で表すとyi−1)。
第二プラトー検出部120は、平滑化部121と検出部123とを含む。第二プラトー検出部120は、語彙学習曲線を平滑化して、平滑化した語彙学習曲線の語彙学習速度が極小となる部分を検出し、その部分に対応する単語の累積数iをプラトーの位置r2,vとして併合部130に出力する。以下、平滑化部121と検出部123の処理内容を説明する。
平滑化部121は、データセット{(1,y1),(2,y2),…,(i,yi),…,(I,yI)}を受け取り、ノイズの影響を取り除くフィルタを用いて、データセット{(1,y1),(2,y2),…,(i,yi),…,(I,yI)}によって表される語彙学習曲線を滑らかに(平滑化)する(s121)。
検出部123は、データセット{(1,δx1),(2,δx2),…,(i,δxi),…,(I,δxI)}を受け取り、1単語を学習するのに必要な日数の系列{δx1,δx2,…,δxi,…,δxI}から、1単語を学習するのに必要な日数δxiが極大となる部分を検出し(s123)、その部分に対応する単語の累積数iの集合をプラトーの位置の集合{r2,1,r2,2,…,r2,w,…,r2,W}として併合部130に出力する。なお、1単語を学習するのに必要な日数δxiが極大となる部分は、語彙学習曲線の傾斜が急になる部分(プラトー)であり、語彙学習速度が極小となる部分である。
併合部130は、プラトーの位置の集合{r1,1,r1,2,…,r1,v,…,r1,V}及び{r2,1,r2,2,…,r2,w,…,r2,W}とを受け取り、重複部分を削除して併合し(s130)、併合したプラトーの位置の集合{r1,r2,…,rk,…,rK}を置換部140に出力する。また、語彙学習関数推定装置100の出力値として、出力する。
置換部140は、併合したプラトーの位置の集合{r1,r2,…,rk,…,rK}と、データセット{(1,y1),(2,y2),…,(i,yi),…,(I,yI)}とを受け取り、新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分(第一プラトー検出部110で検出されたプラトー)における日齢の間隔を閾値p1よりも小さい基準値p2に置き換える(s140)。さらに、平滑化した語彙学習曲線の語彙学習速度が極小となる部分(第二プラトー検出部120で検出されたプラトー)の前後における日齢の間隔が基準値p2よりも大きい場合には、その日齢の間隔を基準値p2に置き換える(s140)。置き換えた新たなデータセット{(1,y’1),(2,y’2),…,(i,y’i),…,(I,y’I)}を関数近似部150に出力する。ただし、基準値p2は閾値p1よりも小さい値とする。例えば、p2=2、p1=6とする。この置き換えた新たなデータセット{(1,y’1),(2,y’2),…,(i,y’i),…,(I,y’I)}が真の語彙学習曲線に相当する。
iが長さIより大きい場合、全てのデータセットについて置き換え処理を終えたことを意味するため、置き換え処理を終了する。
関数近似部150は、新たなデータセット{(1,y’1),(2,y’2),…,(i,y’i),…,(I,y’I)}を受け取り、線形関数y’i=f(i)で近似し(s150)、線形関数y’i=f(i)、及び、その傾きaまたはaの逆数(本実施形態では、傾きa)を語彙学習関数推定装置の出力値として出力する。なお、傾きaの逆数は、語彙学習速度の推定値を表す。
このような構成により、語彙爆発とは異なる語彙学習曲線の特徴であるプラトーを検出し、語彙学習曲線からプラトーを取り除いて、幼児の真の語彙学習曲線に置換し、語彙学習関数を近似させることができる。さらに、このような構成により、真の語彙学習曲線をモデル化できるため幼児毎に固有の語彙学習速度を安定的に精度良く求めることができる。
本実施形態では、データを各部間で直接入出力しているが、図示しない記憶部を介してデータを入出力してもよい。
上述した特徴検出装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施形態で図に示した機能構成をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施形態で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
110 第一プラトー検出部
120 第二プラトー検出部
121 平滑化部
123 検出部
130 併合部
140 置換部
150 関数近似部
Claims (5)
- 幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す語彙学習曲線に基づき、新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分を検出する第一プラトー検出部と、
前記語彙学習曲線を平滑化して、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分を検出する第二プラトー検出部と、
新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分における日齢の間隔を閾値p1よりも小さい基準値p2に置き換え、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分の前後における日齢の間隔が基準値p2よりも大きい場合には、その日齢の間隔を基準値p2に置き換える置換部と、
日齢の間隔が置き換えられた前記語彙学習曲線を、線形関数で近似し、その線形関数を出力する関数近似部と、を含む、
語彙学習関数推定装置。 - 幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す語彙学習曲線に基づき、新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分を検出する第一プラトー検出部と、
前記語彙学習曲線を平滑化して、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分を検出する第二プラトー検出部と、
新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分における日齢の間隔を閾値p1よりも小さい基準値p2に置き換え、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分の前後における日齢の間隔が基準値p2よりも大きい場合には、その日齢の間隔を基準値p2に置き換える置換部と、
日齢の間隔が置き換えられた前記語彙学習曲線を、線形関数で近似し、その傾きまたは傾きの逆数を出力する関数近似部と、を含む、
語彙学習関数推定装置。 - 第一プラトー検出部、第二プラトー検出部、置換部及び関数近似部を含む語彙学習関数推定装置における語彙学習関数推定方法であって、
前記第一プラトー検出部によって、幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す語彙学習曲線に基づき、新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分を検出する第一プラトー検出ステップと、
前記第二プラトー検出部によって、前記語彙学習曲線を平滑化して、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分を検出する第二プラトー検出ステップと、
前記置換部によって、新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分における日齢の間隔を閾値p1よりも小さい基準値p2に置き換え、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分の前後における日齢の間隔が基準値p2よりも大きい場合には、その日齢の間隔を基準値p2に置き換える置換ステップと、
前記関数近似部によって、日齢の間隔が置き換えられた前記語彙学習曲線を、線形関数で近似し、その線形関数を出力する関数近似ステップと、を含む、
語彙学習関数推定方法。 - 第一プラトー検出部、第二プラトー検出部、置換部、関数近似部及び微分部を含む語彙学習関数推定装置における語彙学習関数推定方法であって、
第一プラトー検出部、第二プラトー検出部、置換部及び関数近似部を含む語彙学習関数推定装置における語彙学習関数推定方法であって、
前記第一プラトー検出部によって、幼児が新しい単語を発話するようになった日齢と、前記日齢までに前記幼児が発話するようになった単語の累積数との関係を示す語彙学習曲線に基づき、新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分を検出する第一プラトー検出ステップと、
前記第二プラトー検出部によって、前記語彙学習曲線を平滑化して、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分を検出する第二プラトー検出ステップと、
前記置換部によって、新しい単語を発話するようになった日齢の間隔が閾値p1より大きくなる部分における日齢の間隔を閾値p1よりも小さい基準値p2に置き換え、平滑化した前記語彙学習曲線の語彙学習速度が極小となる部分の前後における日齢の間隔が基準値p2よりも大きい場合には、その日齢の間隔を基準値p2に置き換える置換ステップと、
前記関数近似部によって、日齢の間隔が置き換えられた前記語彙学習曲線を、前記線形関数で近似し、その傾きまたはその傾きの逆数を出力する関数近似ステップと、を含む、
語彙学習関数推定方法。 - 請求項1または請求項2記載の特徴検出装置を構成する各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012192939A JP5752654B2 (ja) | 2012-09-03 | 2012-09-03 | 語彙学習関数推定装置、語彙学習関数推定方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012192939A JP5752654B2 (ja) | 2012-09-03 | 2012-09-03 | 語彙学習関数推定装置、語彙学習関数推定方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014049008A true JP2014049008A (ja) | 2014-03-17 |
JP5752654B2 JP5752654B2 (ja) | 2015-07-22 |
Family
ID=50608580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012192939A Active JP5752654B2 (ja) | 2012-09-03 | 2012-09-03 | 語彙学習関数推定装置、語彙学習関数推定方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5752654B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005025605A (ja) * | 2003-07-04 | 2005-01-27 | Hitachi Eng Co Ltd | 物理データフィッティング係数生成システムおよび方法 |
-
2012
- 2012-09-03 JP JP2012192939A patent/JP5752654B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005025605A (ja) * | 2003-07-04 | 2005-01-27 | Hitachi Eng Co Ltd | 物理データフィッティング係数生成システムおよび方法 |
Non-Patent Citations (2)
Title |
---|
CSNG201200271012; 南 泰浩: '線形関数とプラトー割込による幼児語彙発達のモデル化' 言語処理学会第18回年次大会発表論文集 , 20120314, pp.50-53 * |
JPN6015006434; 南 泰浩: '線形関数とプラトー割込による幼児語彙発達のモデル化' 言語処理学会第18回年次大会発表論文集 , 20120314, pp.50-53 * |
Also Published As
Publication number | Publication date |
---|---|
JP5752654B2 (ja) | 2015-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiang et al. | Investigation of different speech types and emotions for detecting depression using different classifiers | |
Dackermann et al. | Damage identification based on response-only measurements using cepstrum analysis and artificial neural networks | |
López-de-Ipiña et al. | Feature selection for spontaneous speech analysis to aid in Alzheimer's disease diagnosis: A fractal dimension approach | |
CN110188047B (zh) | 一种基于双通道卷积神经网络的重复缺陷报告检测方法 | |
CN109493968A (zh) | 一种认知评估方法及装置 | |
Qiao et al. | Alzheimer's Disease Detection from Spontaneous Speech Through Combining Linguistic Complexity and (Dis) Fluency Features with Pretrained Language Models | |
Pham et al. | Multimodal detection of Parkinson disease based on vocal and improved spiral test | |
Berisha et al. | Are reported accuracies in the clinical speech machine learning literature overoptimistic? | |
Coppock et al. | A summary of the ComParE COVID-19 challenges | |
Li et al. | Estimating trust in conversational agent with lexical and acoustic features | |
JP5752654B2 (ja) | 語彙学習関数推定装置、語彙学習関数推定方法及びそのプログラム | |
JP5706380B2 (ja) | 語彙学習関数推定装置、語彙学習関数推定方法及びそのプログラム | |
JP5706379B2 (ja) | 特徴検出装置、特徴検出方法及びそのプログラム | |
Lustyk et al. | Evaluation of disfluent speech by means of automatic acoustic measurements | |
JP5604344B2 (ja) | 語彙爆発時期検出装置、方法、及びプログラム | |
CN115391523A (zh) | 风电场多源异构数据处理方法及装置 | |
JP5604464B2 (ja) | 語彙学習曲線パラメータ推定装置、方法、及びプログラム | |
Anjos et al. | A model for sibilant distortion detection in children | |
Hireš et al. | On the inter-dataset generalization of machine learning approaches to Parkinson's disease detection from voice | |
Grant et al. | Considerations and Challenges for Real-World Deployment of an Acoustic-Based COVID-19 Screening System | |
JP5657585B2 (ja) | 語彙学習曲線パラメータ推定装置、方法、及びプログラム | |
Korvel et al. | Comparative analysis of spectral and cepstral feature extraction techniques for phoneme modelling | |
JP5604347B2 (ja) | 語彙爆発時期推定装置、方法、及びプログラム | |
Kavitha et al. | Deep Learning based Audio Processing Speech Emotion Detection | |
JP6054039B2 (ja) | 語彙学習速度推定装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150512 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5752654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |