JP7160078B2 - 能力推定装置、方法及びプログラム - Google Patents

能力推定装置、方法及びプログラム Download PDF

Info

Publication number
JP7160078B2
JP7160078B2 JP2020193982A JP2020193982A JP7160078B2 JP 7160078 B2 JP7160078 B2 JP 7160078B2 JP 2020193982 A JP2020193982 A JP 2020193982A JP 2020193982 A JP2020193982 A JP 2020193982A JP 7160078 B2 JP7160078 B2 JP 7160078B2
Authority
JP
Japan
Prior art keywords
age
ability
words
target
acquired
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020193982A
Other languages
English (en)
Other versions
JP2021047878A (ja
Inventor
哲生 小林
泰浩 南
佑亮 森山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2020193982A priority Critical patent/JP7160078B2/ja
Publication of JP2021047878A publication Critical patent/JP2021047878A/ja
Application granted granted Critical
Publication of JP7160078B2 publication Critical patent/JP7160078B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

特許法第30条第2項適用 (1) 発行日 2017年1月20日 刊行物 「電子情報通信学会 技術研究報告 信学技報 Vol.116 No.436 139頁~144頁」 発行者名 一般社団法人 電子情報通信学会 (2) 発行日 2017年1月20日 刊行物 「電子情報通信学会 技術研究報告 信学技報 Vol.116 No.436 145頁~150頁」 発行者名 一般社団法人 電子情報通信学会
この発明は、幼児の語彙能力を推定するために用いられる技術に関する。
従来、幼児の語彙の発達状態を調べるために、語彙チェックリストによる親の回答に基づくアンケート調査が利用されることが多かった。これらのチェックリストは、幼児の発達状況を調べるのに有効である(例えば、非特許文献1から3参照。)。
小椋たみ子、綿巻徹、「日本のこどもの語彙発達の基準研究:日本語マッカーサー乳幼児言語発達質問紙から」、京都国際社会福祉センター紀要、発達・療育研究、2008.11、第24号、P.3-42 小林哲生、奥村優子、南泰浩、「語彙チェックリストアプリによる幼児語彙発達データ収集の試み」、電子情報通信学会技術研究報告、HCS2015-59、2016 稲葉太一、小椋たみ子、綿巻徹、前田美穂、「言語習得の発達過程におけるパーンセンタイル値の推定方法」、日本行動計量学会第31回大会発表論文抄録集、P.46-49、2003
従来の語彙チェックリストによる能力測定方法では、%タイルという指標で同年代の幼児と比べてどれぐらい外れているのかを調べていた。この方法では、平均からずれているという総体的な評価はできるが、その幼児の語彙の能力が絶対的にどの程度であるかということを判定できなかった。
また、従来の語彙チェックリストによる能力測定方法では、語彙チェックリストの語が多かった。例えば、非特許文献1で述べた語彙チェックリストには700語程度の語が含まれており、2才後半の幼児では、母親が語彙チェックリストによるアンケートに答えるために、1時間程度の時間を要していた。
この発明の目的は、幼児の語彙の能力が絶対的にどの程度であるかを推定する能力推定装置、方法及びプログラムを提供することである。
この発明の一態様による能力推定装置は、能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、対象幼児がどれ位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を補正する能力齢補正部、を含み、複数の幼児のそれぞれが獲得している語の品詞情報に基づいて複数の幼児をクラスタリングすることにより複数の幼児は少なくとも1個のグループに分けられており、各グループに対応する補正値が予め定められているとして、能力齢補正部は、能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、対象幼児が属するグループを特定し、特定されたグループに対応する補正値に基づいて対象幼児の能力齢を補正する
この発明の一態様による能力推定装置は、能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、対象幼児がどれ位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を補正する能力齢補正部、を含み、能力齢補正部は、対象幼児が獲得している語の中の、品詞情報が名詞の語の個数が多いほど大きく、品詞情報が社会語の語の個数が多いほど小さい値に基づいて補正値を得て、得られた補正値に基づいて対象幼児の能力齢を補正する
幼児の語彙の能力が絶対的にどの程度であるかを推定することができる。
能力推定装置の例を説明するためのブロック図。 能力推定方法の例を説明するための流れ図。 ワンワンという語の理解曲線及び発話曲線の例を示す図。 実験例の結果を説明するための図。 実験例の結果を説明するための図。
以下、図面を参照してこの発明の一実施形態について説明する。
能力推定装置は、図1に示すように、記憶部1、語選択部2、能力齢計算部3、能力齢補正部4及びクラスタリング部5を例えば備えている。語選択部2は、語選択装置でもある。
能力推定方法は、文書検索装置の各部が、図2や後に説明するステップS2からステップS4の処理を実行することにより例えば実現される。語選択方法は、語選択部2が、ステップS2の処理を実行することにより例えば実現される。
<記憶部1>
記憶部1には、複数の語と、複数の語のそれぞれを各齢xの幼児が獲得している確率についての情報が記憶されている。具体的には、複数の語のそれぞれを識別するためのIDと紐付けられて、そのそれぞれの語を各齢xの幼児が獲得している確率についての情報が記憶されている。
ここで、獲得とは、語を理解できるようになること、又は、語を発話できるようになることを意味する。
各齢xの平均的な幼児が獲得している確率についての情報の例は、以下に説明する語の理解曲線に関する情報及び語の発話曲線に関する情報の少なくとも一方である。
ある語の理解曲線は、幼児の齢(例えば月齢)に対しそのある語を理解している幼児の割合を表す曲線である。理解曲線は、養育者が語彙チェックリスト調査で回答したものである。理解曲線は、調査時点で、幼児が該当語を(発話できなくても)理解できるかどうかを判断して答えられたものを月齢ごとに集計して、例えば図3に示すように、横軸に幼児の月齢、縦軸に該当語を理解できる幼児の割合をとり、△としてプロットし、それらをロジスティック曲線で近似したものである。図3は、「ワンワン」という語の理解曲線及び発話曲線の例を示す図である。
ある語の発話曲線は、幼児の月齢に対しそのある語を発話できる幼児の割合を表す曲線である。発話曲線も、養育者が語彙チェックリスト調査で回答したものである。発話曲線は、調査時点で、幼児が該当語を発話できるかどうかを判断して答えられたものを月齢ごとに集計して、例えば図3に示すように、横軸に幼児の月齢、縦軸に該当語を発話できる幼児の割合をとり、○としてプロットし、それらをロジスティック曲線で近似したものである。
なお、ロジスティック曲線による近似には、最小二乗法、尤度最大化手法を例えば用いることができる。この場合、非線形な関数の最適化が必要になるので、最急降下法等の方法を用いて最適なパラメータを求める。何れの方法も周知であるため、ここでは詳しい説明は省略する。
ロジスティック関数は、以下の式(1)で表される。式(1)において、xは月齢を表し、fj(x)は語jの獲得割合を表し、eはネイピア数を表す。aj,bj,cjは、ロジスティック曲線の形状を定めるパラメータである。具体的には、ajは獲得割合の上限を決めるパラメータであり、bjはロジスティック曲線のオフセット量を表すパラメータであり、cjは語jの累積獲得割合の傾きを表すパラメータである。
Figure 0007160078000001
aj,bj,cjが定まればロジスティック曲線の形状が定まる。このため、例えば、ある語jの理解曲線を表すロジスティック曲線のパラメータaj,bj,cjが、その語jの理解曲線に関する情報となる。また、例えば、ある語jの発話曲線を表すロジスティック曲線のパラメータaj,bj,cjが、その語jの発話曲線に関する情報となる。
各齢xの平均的な幼児が獲得している確率についての情報の他の例は、Xを0≦X≦100の所定の数として、幼児のX%がその語を獲得するX%獲得齢である。Xは例えば50である。
このX%獲得齢が記憶部1に記憶されていてもよい。
ある語のX%獲得齢は、幼児のX%がその語を理解する齢である。この場合、ある語のX%獲得齢は、その語の理解曲線から求めることができる。すなわち、その語jの理解曲線のパラメータaj,bj,cjを所与として、x=(aje(cjx+bj))/(1+e(cjx+bj))となるxを求める。求まったxが、その語jのX%獲得齢となる。
また、ある語のX%獲得齢は、幼児のX%がその語を発話する月齢であってもよい。この場合、ある語のX%獲得齢は、その語の発話曲線から求めることができる。すなわち、その語の発話曲線のパラメータaj,bj,cjを所与として、x=(aje(cjx+bj))/(1+e(cjx+bj))となるxを求める。求まったxが、その語のX%獲得齢となる。
このように、語のX%獲得齢は、その語の理解曲線又は発話曲線から求めることができるため、語のX%獲得齢に代えて、語の理解曲線に関する情報及び語の発話曲線に関する情報の少なくとも一方が記憶部1に記憶されていてもよい。この場合、後述する語選択部2は、記憶部1を参照して、語の理解曲線に関する情報及び語の発話曲線に関する情報の少なくとも一方から語のX%獲得齢を求め、求まった語のX%獲得齢を、記憶部1から読み込んだ語のX%獲得齢として後述する処理を行う。
もちろん、語の理解曲線に関する情報及び語の発話曲線に関する情報の少なくとも一方に加えて、語のX%獲得齢が記憶部1に記憶されていてもよい。これにより、語のX%獲得齢を求める計算コストを削減することができる。
上記の説明では、X%獲得齢は、月齢を単位として表されるとしているが、X%獲得齢は、月齢以外の、週齢、日齢等の所定の時間の単位により表されてもよい。
記憶部1には、複数の語と対応する各齢xの幼児が獲得している確率についての情報とがX%獲得齢が小さい順に並んで記憶されていてもよい。
<語選択部2>
語選択部2には、記憶部1に記憶されている語が入力される。
語選択部2は、式(1)を確率分布とするフィッシャー情報量を求め、その情報量が大きくかつ幅広くなるようにT個の語を選択することにより簡易語彙チェックリストを作成する。語選択部2からは、T個の語、又は、T個の語により構成される簡易語彙チェックリストが出力される。
すなわち、語選択部2は、例えば、式(1)を確率分布とする、式(0)に示されるフィッシャー情報量Fが大きくかつ幅広くなるように、記憶部1に記憶されている語を選択する。言い換えれば、語選択部2は、所定の区間で万遍なく語を選択する。ここで、所定の区間とは、語選択の対象となる区間である。
Figure 0007160078000002
そのために、語選択部2は、例えば、選択される語に対応するX%獲得齢が予め定められた複数の齢区間のそれぞれに少なくとも1個含まれるように、記憶部1に記憶されている語を選択する(ステップS2)。語選択部2は、例えばT個の語を選択する。Tは、所定の正の整数である。選択されたT個の語から構成されるチェックリストを、簡易語彙チェックリストとも呼ぶ。ここで、T≦Mである。例えば、Tは、Mの半分以上の値とする。
予め定められた複数の齢区間の例は、生後g日からh日までの期間を所定の区間としたとき、生後g日からh日までの日数をM分割した区間である。Mは所定の2以上の整数である。予め定められた複数の齢区間の例は、(1)12ヶ月以下、(2)13-18ヶ月、(3)19-24ヶ月、(4)25-30ヶ月、(5)31-36ヶ月、(6)37-48ヶ月という6個の区間である。この場合、M=6となる。
予め定められた複数の齢区間の他の例は、これらのM分割した区間から少なくとも1個の区間を除いた区間である。これらのM分割した区間の中に、X%獲得齢が含まれる語が記憶部1に記憶されていない区間がある場合には、そのX%獲得齢が含まれる語が記憶部1に記憶されていない区間を、これらのM分割した区間から除いてもよい。
gとhは、対象とする幼児に応じて適宜設定される正の整数である。例えば、幼児全体を能力推定の対象とし、所定の区間を幼児期全体とする場合は、gを400程度、hを1500程度に設定する。
なお、2才児近辺の幼児を対象とする場合は、gを600程度、hを800程度に設定する。このように、対象となる幼児の齢が明確である場合には、その齢の近傍の区間を所定の区間とみなして、その齢の近傍の区間をM分割してもよい。
語選択部2は、例えば、各齢区間で%語獲得齢がその齢区間の中央値に近い語を1つ選択する。
語選択部2は、所定の区間で万遍なく語を選択することができれば、上記のM分割の方法以外の方法により語を選択してもよい。
語選択部2による語の選択により生成された簡易語彙チェックリストは、養育者のアンケートに用いられる。すなわち、養育者は、簡易語彙チェックリストに掲載された各語jについて、能力推定の対象となる対象幼児が獲得しているかどうかを判断し、その判断結果を得る。具体的には、j=1,…,Tとして、対象幼児が語jを獲得しているか否かについての情報をtjとし、対象幼児が語jを獲得している場合にはtj=1とし、上記対象幼児が語jを獲得していない場合にはtj=0とする。
この判断結果が、能力齢計算部3に入力される。
このように、語選択部2が、記憶部1に記憶されている語から、T個の語を選択して出力する、または、選択したT個の語による簡易語彙チェックリストを作成することで、能力齢の推定の対象となる対象幼児の養育者がアンケートにおいて答える必要がある語の数を減らすことができる。これにより、対象幼児の養育者のアンケートの回答時間を減らすことができる。
<能力齢計算部3>
能力齢計算部3には、上記の判断結果、言い換えれば、能力推定の対象となる対象幼児が複数の語のそれぞれを獲得しているか否かについての情報が入力される。
能力齢計算部3は、入力された、対象幼児が複数の語のそれぞれを獲得しているか否かについての情報と、記憶部1から読み込んだ複数の語のそれぞれを各齢xの幼児が獲得している確率についての情報とに基づいて、対象幼児がどの位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を求める(ステップS3)。求まった能力齢は、能力齢補正部4に出力される。能力齢は、月齢、週齢、日齢等の所定の時間の単位により表される。
例えば、能力齢計算部3は、記憶部1から読み込んだ、語jを各齢xの幼児が獲得している確率についての情報をaj,bj,cjとし、eをネイピア数として、以下の式(2)により定義されるx-を能力齢とする。
Figure 0007160078000003
このように、最小二乗法により能力齢を求めてもよい。より具体的には、能力齢計算部3は、入力された、対象幼児が複数の語のそれぞれを獲得しているか否かについての情報(1,0の情報)と、記憶部1から読み込んだ複数の語のそれぞれを各齢xの幼児が獲得している確率についての情報との二乗距離が最小となるx-を能力齢としてもよい。
式(2)により定義されるx-を求めるために、能力齢計算部3は、例えば、g(x)が以下の式(2’)のように定義されるとして、g(x)の1階導関数g'(x)=0となるxの値を求める。この求まったxが、x-となる。
Figure 0007160078000004
また、式(2)により定義されるx-を求めるために、能力齢計算部3は、ニュートン法等の0となるxの値を逐次的に求める等の最適化手法を用いてもよい。また、能力齢計算部3は、xmin<x<xmaxの区間で所定の微小間隔Δxずつシフトしすることによりg(x)の値を求めることにより、g(x)を最小にするxの値を求めてもよい。xminはxの所定の最小値であり、xmaxはxの所定の最大値である。これらの求まったxが、x-となる。
また、能力齢計算部3は、記憶部1から読み込んだ、語jを各齢xの幼児が獲得している確率についての情報をaj,bj,cjとし、eをネイピア数として、以下の式(3)により定義されるx-を能力齢としてもよい。
Figure 0007160078000005
このように、能力齢計算部3は、式(3’)の確率分布を用いた、最尤推定法により幼児能力を求めてもよい。言い換えれば、能力齢計算部3は、確率的に近い齢を能力齢として求めてもよい。
式(3)により定義されるx-を求めるために、能力齢計算部3は、例えば、h(x)が以下の式(3'')のように定義されるとして、log h(x)の1階導関数(log h(x))'=∂log h(x)/∂x=0となるxの値を求める。この求まったxが、x-となる。
Figure 0007160078000006
また、式(3)により定義されるx-を求めるために、能力齢計算部3は、ニュートン法等の0となるxの値を逐次的に求める等の最適化手法を用いてもよい。また、能力齢計算部3は、xmin<x<xmaxの区間で所定の微小間隔Δxずつシフトしすることによりh(x)の値を求めることにより、h(x)を最大にするxの値を求めてもよい。xminはxの所定の最小値であり、xmaxはxの所定の最大値である。これらの求まったxが、x-となる。
このように、能力齢を求めることで、幼児の語彙の能力が絶対的にどの程度であるかを推定することができる。
能力齢計算部3は、最小二乗法と最尤推定法のどちらを用いてもよいが、例えば推定月齢には少なくとも1ヵ月の幅があるため、中心から外れるほど2個の方法のそれぞれで求めた値に差が出る可能性がある。この差を抑えるために、式(1)のロジスティック関数のパラメータを求めるときと、能力齢を推定するときの手法を合わせてもよい。すなわち、能力齢計算部3は、式(1)のロジスティック関数のパラメータを求めるときに用いた、最小二乗法又は最尤推定法で、能力齢を推定してもよい。
<能力齢補正部4>
能力齢補正部4には、能力齢計算部3で求まった能力齢が入力される。
能力齢補正部4は、対象幼児が獲得している語の品詞情報に基づいて能力齢計算部3で求まった能力齢を補正する(ステップS3)。補正後の能力齢は、能力推定装置及び方法による最終的な能力推定結果として出力される。
能力齢補正部4による能力齢の補正は、幼児の語の獲得タイプによって語彙獲得の速度が異なるという参考文献1で示されている事実を利用したものである。
〔参考文献1〕小林哲生、南泰浩、杉山弘晃、"語彙爆発の新しい視点:日本語学習児
の初期語彙発達に関する縦断データ解析"、日本赤ちゃん学会、ベビーサイエンス、12, 34-49, 2013
能力齢補正部4による能力齢の補正により、能力齢を更に正確に求めることができる。
能力齢補正部4による補正の方法の<<例1>><<例2>>を以下に説明する。
<<例1>>
例えば、複数の幼児のそれぞれが獲得している語の品詞情報に基づいて複数の幼児をクラスタリングすることにより複数の幼児は少なくとも1個のグループに分けられており、各グループに対応する補正値が予め定められているとする。
複数の幼児のそれぞれが獲得している語の品詞情報は、養育者が補正用簡易語彙チェックリストに掲載された各語jを、幼児が獲得しているかどうかを判断することにより得られる。補正用簡易語彙チェックリストは、語選択部2により作成された簡易語彙チェックリストとは異なる語彙チェックリストである。
補正用簡易語彙チェックリストを作成するために、例えば、語選択部2は、記憶部1に記憶されている語の中から、式(1)=0.5となるxが小さい方からN個の語を選択する(ステップS2)。言い換えれば、語選択部2は、例えば発話初期に獲得される語をN個選択する。Nは予め定められた正の整数である。例えば、Nは400程度である。補正用簡易語彙チェックリストは、これらの選択された語により構成される。なお、これらの選択された語には、社会語、名詞、述語、閉じた語、その他という品詞情報が定められているとする。社会語とは、例えば、あいさつ、ママ、パパである。閉じた語とは、例えば、代名詞、助詞、助動詞、数詞である。
クラスタリング部5には、補正用簡易語彙チェックリストに基づいて生成された、複数の幼児のそれぞれが獲得している語の品詞情報が入力される。
クラスタリング部5は、複数の幼児のそれぞれが獲得している語の品詞情報に基づいて複数の幼児を、k-means法等のクラスタリング方法によりクラスタリングする。具体的には、幼児kのベクトルvkが以下のように定義されているとして、このベクトルvkに基づいて複数の幼児をクラスタリングする。
Figure 0007160078000007
ここで、Vk,nは幼児kが獲得している品詞情報が名詞である語の数であり、Vk,sは幼児kが獲得している品詞情報が社会語である語の数であり、Vk,pは幼児kが獲得している品詞情報が述語である語の数であり、Vk,cは幼児kが獲得している品詞情報が閉じた語である語の数であり、Vk,oは幼児kが獲得している品詞情報がその他である語の数である。
クラスタリングにより幼児は少なくとも1個のグループに分けられる。例えば、クラスタ数を3とする。クラスタ数を3とすることにより、「発話初期に(他の品詞よりも)名詞を発話する」「発話初期に(他の品詞よりも)社会語を発話する」「その他」という3個のグループに幼児を分けることができる。もちろん、クラスタ数は3以外でもよい。例えば、クラスタ数は5程度としてもよい。
クラスタリング部5は、グループごとに、そのグループに含まれる幼児の能力齢と実齢との差の平均値を計算し、この計算された平均値をそのグループの補正値とする。補正値は、正の値の場合もあるし、負の値となる場合もある。幼児の能力齢は、能力齢計算部3のステップS3の処理により得ることができる。クラスタリング部5により生成された各グループについての情報及び各グループの補正値は、能力齢補正部4に出力される。
以上のクラスタリング部5の処理が、能力齢補正部4の処理に先だって予め行われているとする。
また、養育者が補正用簡易語彙チェックリストに掲載された各語jを、対象幼児が獲得しているかどうかを判断することにより、対象幼児が獲得している語の品詞情報が予め得られているとする。
能力齢補正部4には、対象幼児が獲得している語の品詞情報と、クラスタリング部5により生成された各グループについての情報及び各グループの補正値と、能力齢計算部3により計算された能力齢とが入力される。この各グループについての情報には、各グループを表すクラスタが含まれているとする。各グループを表すクラスタは、例えばその各グループに含まれる幼児の式(4)により定義されるベクトルの平均値である。
この場合、能力齢補正部4は、対象幼児が獲得している語の品詞情報に基づいて、対象幼児が属するグループを特定し、特定されたグループに対応する補正値に基づいて対象幼児の能力齢を補正する。
具体的には、能力齢補正部4は、対象幼児が獲得している語の品詞情報に基づいて、式(4)により定義される、対象幼児のベクトルを求め、求まった対象幼児のベクトルに最も距離が近いクラスタを有するグループを特定し、特定されたグループを対象幼児が属するグループとする。そして、能力齢補正部4は、能力齢計算部3により計算された能力齢から、特定されたグループに対応する補正値を減算する。減算された値は、補正後の能力齢として出力される。
なお、クラスタリング部5は、予め定められた複数の齢区間の中のある齢区間に実齢が含まれる幼児を式(4)により定義されるベクトルに基づいてクラスタリングすることによりグループ分けをして、上記と同様の処理を行うことにより、そのある齢区間の各グループに対応する補正値を求めてもよい。クラスタリング部5は、この処理を、予め定められた複数の齢区間のそれぞれに対して行うことにより、各予め定められた齢区間の各グループに対応する補正値を求めることができる。
予め定められた齢区間の例は、(1)12ヶ月以下、(2)13-18ヶ月、(3)19-24ヶ月、(4)25-30ヶ月、(5)31-36ヶ月、(6)37-48ヶ月という6個の区間である。もちろん、これ以外の区間を予め定められた齢区間としてもよい。
この場合、能力齢補正部4は、対象幼児の実齢に基づいて、予め定められた複数の齢区間の中の対象幼児の実齢が含まれる齢区間を特定する。また、能力齢補正部4は、対象幼児が獲得している語の品詞情報に基づいて、特定された齢区間において、対象幼児が属するグループを特定する。そして、能力齢補正部4は、特定されたグループに対応する補正値を選択し、その選択された補正値に基づいて対象幼児の能力齢を補正する。例えば、能力齢補正部4は、対象幼児の能力齢からその選択された補正値を減算する。減算された値は、補正後の能力齢として出力される。
なお、クラスタリング部5は、各グループの予め定められた複数の齢区間のそれぞれごとに補正値を求めてもよい。予め定められた齢区間の例は、(1)12ヶ月以下、(2)13-18ヶ月、(3)19-24ヶ月、(4)25-30ヶ月、(5)31-36ヶ月、(6)37-48ヶ月という6個の区間である。もちろん、これ以外の区間を予め定められた齢区間としてもよい。
例えば、クラスタリング部5は、あるグループ内のある齢区間に含まれる実齢を有する幼児の能力齢と実齢との差の平均値を計算し、この計算された平均値をそのグループのその齢区間に対応する補正値とする。クラスタリング部5は、この処理を、各グループの各予め定められた齢区間に対して行うことにより、各グループの各予め定められた齢区間に対応する補正値を得ることができる。
この場合、能力齢補正部4は、上記と同様に、対象幼児が獲得している語の品詞情報に基づいて、対象幼児が属するグループを特定する。そして、能力齢補正部4は、特定されたグループの、対象幼児の実齢が含まれる齢区間に対応する補正値を選択し、その選択された補正値に基づいて対象幼児の能力齢を補正する。例えば、能力齢補正部4は、対象幼児の能力齢からその選択された補正値を減算する。減算された値は、補正後の能力齢として出力される。
<<例2>>
幼児が獲得している語の中の品詞情報に含まれる名詞の語の個数が、一般的な幼児が獲得している語の中の平均的な個数よりも多く、かつ、幼児が獲得している語の中の品詞情報に含まれる名詞と社会語の比率における名詞が占める割合が、一般的な幼児が獲得している語の中の品詞情報に含まれる名詞と社会語の比率における名詞が占める平均的な割合よりも高い場合には、その幼児の獲得している語彙数は一般的な幼児の獲得している語彙数よりも多く、また、幼児が獲得している語の中の品詞情報に含まれる社会語の個数が、一般的な幼児が獲得している語の中の平均的な個数よりも多く、かつ、幼児が獲得している語の中の品詞情報に含まれる名詞と社会語の比率における社会語が占める割合が、一般的な幼児が獲得している語の中の品詞情報に含まれる名詞と社会語の比率における社会語が占める平均的な割合よりも高い場合には、その幼児の獲得している語彙数は一般的な幼児の獲得している語彙数よりも少ない、という参考文献1に示された事実が知られている。<<例2>>では、この事実に基づき、能力齢補正部4は、対象幼児が獲得している語の中の、品詞情報が名詞の語の個数が多いほど大きく、品詞情報が社会語の語の個数が多いほど小さい値に基づいて補正値を得て、得られた補正値を用いて能力齢を補正する。
αを、幼児が獲得している語の中の、品詞情報が名詞の語の個数が多いほど大きく、品詞情報が社会語の語の個数が多いほど小さい値を取る値とする。例えば、α=名詞の数/(名詞の数+社会語の数)である。もちろん、幼児が獲得している語の中の、品詞情報が名詞の語の個数が多いほど大きく、品詞情報が社会語の語の個数が多いほど小さい値を取る値であれば、α=名詞の数/(社会語の数)、α=名詞の数-社会語の数等であってもよい。
<<例1>>と同様に、複数の幼児の養育者が、補正用簡易語彙チェックリストに掲載された各語jを、幼児が獲得しているかどうかを判断することにより、複数の幼児のそれぞれが獲得している語の品詞情報が得られているとする。この得られている複数の幼児のそれぞれが獲得している語の品詞情報が、能力齢補正部4に入力される。
そして、能力齢補正部4は、ある幼児kのαの値をαkとして、ある幼児kの能力齢xk -と複数の幼児の実齢の平均値dkとの差分xk --dk=vαk-uとおいて、最小二乗法によりこの式を満たす尤もらしいv,uを推定する。
なお、xk --dkとαkとに相関が大きくない場合、例えば最小二乗法でuとvによりモデル化できない場合、能力齢補正部4は<<例2>>による補正を行わなくてもよい。xk --dk=vαk-uの式を満たす尤もらしいv,uを最小二乗法でモデル化できない場合とは、例えば、5%や1%で、最小二乗法の検定を行った場合、p値が閾値以上になる場合などのことである。
また、対象幼児の養育者が、補正用簡易語彙チェックリストに掲載された各語jを、幼児が獲得しているかどうかを判断することにより、対象幼児が獲得している語の品詞情報が得られているとする。この得られている対象幼児が獲得している語の品詞情報が、能力齢補正部4に入力される。
以上の処理が、能力齢補正部4による補正の処理に先だって予め行われているとする。
能力齢補正部4は、入力された対象幼児が獲得している語の品詞情報に基づいて、対象幼児のαの値を計算し、計算されたαの値に基づいてvα-uを計算し、この計算された値を補正値とする。そして、能力齢補正部4は、この補正値を用いて能力齢を補正する。例えば、能力齢補正部4は、能力齢からこの補正値を減算する。減算された値は、補正後の能力齢として出力される。
なお、能力齢補正部4は、予め定められた複数の齢区間のそれぞれごとにv,nを求めてもよい。予め定められた齢区間の例は、(1)12ヶ月以下、(2)13-18ヶ月、(3)19-24ヶ月、(4)25-30ヶ月、(5)31-36ヶ月、(6)37-48ヶ月という6個の区間である。もちろん、これ以外の区間を予め定められた齢区間としてもよい。
例えば、能力齢補正部4は、予め定められた複数の齢区間の中のある齢区間に実齢が含まれる幼児kのxk -,dkkを用いて、xk --dk=vαk-uの式を満たす尤もらしいv,uを例えば最小二乗法により求める。能力齢補正部4は、この処理を、予め定められた複数の齢区間の中の各齢区間に対して行うことにより、予め定められた複数の齢区間の中の各齢区間に対応するv,uを得ることができる。
この場合、能力齢補正部4は、対象幼児の実齢に基づいて、予め定められた複数の齢区間の中の対象幼児の実齢が含まれる齢区間を特定し、その特定された齢空間に対応するv,uを用いて、上記と同様にして、補正値を求め、求まった補正値を用いて能力齢を補正する。
また、能力齢補正部4は、<<例1>>で説明した各グループ毎にv,nを求めてもよい。予め定められた齢区間の例は、(1)12ヶ月以下、(2)13-18ヶ月、(3)19-24ヶ月、(4)25-30ヶ月、(5)31-36ヶ月、(6)37-48ヶ月という6個の区間である。もちろん、これ以外の区間を予め定められた齢区間としてもよい。
例えば、能力齢補正部4は、あるグループに含まれる幼児kのxk -,dkkを用いて、xk --dk=vαk-uの式を満たす尤もらしいv,uを例えば最小二乗法により求める。能力齢補正部4は、この処理を、各グループに対して行うことにより、各グループに対応するv,uを得ることができる。
この場合、能力齢補正部4は、対象幼児が獲得している語の品詞情報に基づいて、式(4)により定義される、対象幼児のベクトルを求め、求まった対象幼児のベクトルに最も距離が近いクラスタを有するグループを特定する。そして、能力齢補正部4は、その特定されたグループに対応するv,uを用いて、上記と同様にして、補正値を求め、求まった補正値を用いて能力齢を補正する。
[実験例]
非特許文献2で示した2688個の語彙チェックリストを用いて予め収集した940人のチェック結果から、語毎の獲得曲線のロジスティック関数(1)を求めた。このロジスティック関数から、上記の手法により、幼児の能力齢を推定した。評価に用いた幼児は200人である。実験例では、gを400、hを1500と設定した。
推定した能力齢と幼児が実際に持つ能力の分散を比較することで、上記の簡易語彙チェックリストによるテストの推定精度を評価することを考える。しかし、幼児k が実際に持つ能力は未知であるため直接比較できない。そこで、実際の能力との差の分散を求める代わりに幼児kの実齢dkとの差の分散を調べる。この分散もテストが正確になるほど小さくなる。区間の分割数Mを変えながら作成した簡易語彙チェックリストによるテストで推定した能力齢xkと実齢dkの差の分散を図4に示す。ここでは、能力齢及び実齢として、日齢を用いている。図4の、左から2列目及び5列目の語数Tは簡易語彙チェックリストに掲載された語の数を表す。この分散は、モデルの適合度を表しており,小さくなるほど幼児の能力推定に適したモデルになっている。簡易語彙チェックリストの語数と分散の関係を比較すると分散は語数によらずほぼ一定の値となるが分かる。この結果から、30,40程度の語でも十分な推定結果を示すことが分かる。
以下、能力齢の補正による推定精度の向上について説明する。
まず、クラスタリングを用いる場合には、全体の語数クラスタリングの数(タイプ数)を2とした。補正を求める品詞を調べる品詞テストには,2688語のうち,幼児が平均的に最初に覚える400語を利用した。幼児の簡易語彙チェックリストには40語を用いた。図5に実施した結果を示す。能力齢の補正前の分散である補正前分散は、(1)式により推定した能力齢を表す。能力齢の補正後の分散である補正分散(1)は、上記手法により補正された能力齢と実齢の差の分散を示す。ここでは、能力齢及び実齢として、日齢を用いている。この分散の値が小さくなることが、正当な評価をしていることに相当する。図5を見ると、上記の手法による補正により分散値が小さくなっている。より具体的には、上記の手法では、トータル440語テストが必要であるが、図4の語数Tが473のところよりも分散が小さくなっており、上記の手法による補正の有効性を示している。
つぎに、クラスタリングを用いる場合と同条件で、能力齢の補正を行った結果を図5の補正分散(2)に示す。この場合でも、分散の削減が優位に行えることが確認できる。
[変形例等]
上記の実施形態では、幼児の語彙獲得の例で説明したが、能力齢の推定の対象は幼児、言い換えれば母国語を習得中の未就学児でなくてもよい。
上記の説明では、理解曲線及び発話曲線を、月齢を用いて定義したが、理解曲線及び発話曲線は、月齢に代えて日齢、週齢等の所定の時間を表す指標を用いて定義されてもよい。
能力齢推定装置は、能力齢補正部4及びクラスタリング部5を備えていなくてもよい。この場合、能力齢推定装置は、能力齢計算部3により計算された能力齢を最終的な推定結果として出力する。
上記各装置及び方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、上記各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に又は人手により実現することとしてもよい。
この発明は、例えば、幼児を対象とした語彙能力を調べる様々な幼児語彙テストの作成に役立つ。
1 記憶部
2 語選択部
3 能力齢計算部
4 能力齢補正部
5 クラスタリング部

Claims (7)

  1. 能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、上記対象幼児がどれ位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を補正する能力齢補正部、
    を含み、
    複数の幼児のそれぞれが獲得している語の品詞情報に基づいて上記複数の幼児をクラスタリングすることにより上記複数の幼児は少なくとも1個のグループに分けられており、各グループに対応する補正値が予め定められているとして、
    上記能力齢補正部は、能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、上記対象幼児が属するグループを特定し、特定されたグループに対応する補正値に基づいて上記対象幼児の能力齢を補正する、
    能力推定装置。
  2. 能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、上記対象幼児がどれ位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を補正する能力齢補正部、
    を含み、
    上記能力齢補正部は、上記対象幼児が獲得している語の中の、品詞情報が名詞の語の個数が多いほど大きく、品詞情報が社会語の語の個数が多いほど小さい値に基づいて補正値を得て、得られた補正値に基づいて上記対象幼児の能力齢を補正する、
    能力推定装置。
  3. 請求項1又は2の能力推定装置において、
    上記能力齢は、能力推定の対象となる対象幼児が複数の語のそれぞれを獲得しているか否かについての情報と、複数の語のそれぞれを各齢xの幼児が獲得している確率についての情報とに基づいて求まる指標である、
    能力推定装置。
  4. 請求項1又は2の能力推定装置において、
    能力推定の対象となる対象幼児が複数の語のそれぞれを獲得しているか否かについての情報と、複数の語のそれぞれを各齢xの幼児が獲得している確率についての情報とに基づいて、上記対象幼児がどの位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を求める能力齢計算部を更に含む、
    能力推定装置。
  5. 能力齢補正部が、能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、上記対象幼児がどれ位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を補正する能力齢補正ステップ、
    を含み、
    複数の幼児のそれぞれが獲得している語の品詞情報に基づいて上記複数の幼児をクラスタリングすることにより上記複数の幼児は少なくとも1個のグループに分けられており、各グループに対応する補正値が予め定められているとして、
    上記能力齢補正部は、能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、上記対象幼児が属するグループを特定し、特定されたグループに対応する補正値に基づいて上記対象幼児の能力齢を補正する、
    能力推定方法。
  6. 能力齢補正部が、能力推定の対象となる対象幼児が獲得している語の品詞情報に基づいて、上記対象幼児がどれ位の齢の幼児と同程度の語彙能力を有するかを示す指標である能力齢を補正する能力齢補正ステップ、
    を含み、
    上記能力齢補正部は、上記対象幼児が獲得している語の中の、品詞情報が名詞の語の個数が多いほど大きく、品詞情報が社会語の語の個数が多いほど小さい値に基づいて補正値を得て、得られた補正値に基づいて上記対象幼児の能力齢を補正する、
    能力推定方法。
  7. 請求項1からの何れかの能力推定装置の各部としてコンピュータを機能させるためのプログラム。
JP2020193982A 2020-11-24 2020-11-24 能力推定装置、方法及びプログラム Active JP7160078B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020193982A JP7160078B2 (ja) 2020-11-24 2020-11-24 能力推定装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020193982A JP7160078B2 (ja) 2020-11-24 2020-11-24 能力推定装置、方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017138791A Division JP6850218B2 (ja) 2017-07-18 2017-07-18 能力推定装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021047878A JP2021047878A (ja) 2021-03-25
JP7160078B2 true JP7160078B2 (ja) 2022-10-25

Family

ID=74876483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020193982A Active JP7160078B2 (ja) 2020-11-24 2020-11-24 能力推定装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7160078B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090155751A1 (en) 2007-01-23 2009-06-18 Terrance Paul System and method for expressive language assessment

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090155751A1 (en) 2007-01-23 2009-06-18 Terrance Paul System and method for expressive language assessment

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小林 哲生,外1名,「ウェブを用いた幼児言語発達研究:大規模縦断データ収集の試み」,言語処理学会第15回年次大会発表論文集,日本,言語処理学会,2009年03月02日,p.534-537

Also Published As

Publication number Publication date
JP2021047878A (ja) 2021-03-25

Similar Documents

Publication Publication Date Title
Crowe et al. Children's English consonant acquisition in the United States: A review
DeAnda et al. The language exposure assessment tool: Quantifying language exposure in infants and children
Madrigal Statistics for anthropology
Davis et al. A factor analytic study of the cross-cultural adaptability inventory
Braxton et al. The influence of student problems on student withdrawal decisions: An autopsy on “autopsy” studies
US20090070100A1 (en) Methods, systems, and computer program products for spoken language grammar evaluation
CN114388103A (zh) 一种针对青少年心理预警分析的算法
Larson et al. Exploring early childhood language environments: A comparison of language use, exposure, and interactions in the home and childcare settings
McDonald et al. Prior precision, prior accuracy, and the estimation of disease prevalence using imperfect diagnostic tests
JP2020535526A (ja) リハビリ状態のための評価及び管理システム並びに関係する方法
AU2012200812A1 (en) Measuring cognitive load
JP7160078B2 (ja) 能力推定装置、方法及びプログラム
US20210312942A1 (en) System, method, and computer program for cognitive training
Spencer et al. An instrumental variable consistent estimation procedure to overcome the problem of endogenous variables in multilevel models
Kothe et al. The Hamburg Selection Procedure for Dental Students–Introduction of the HAM-Nat as subject-specific test for study aptitude
JP7092178B2 (ja) 語選択装置、方法及びプログラム
CN116975558A (zh) 一种基于多维项目反应理论的计算思维测评方法
JP6850218B2 (ja) 能力推定装置、方法及びプログラム
JP5925140B2 (ja) 幼児語彙理解難易度評価装置と幼児語彙検索装置と幼児語彙分類装置と、それらの方法とプログラム
Alan et al. Parental socialization effort and the intergenerational transmission of risk preferences
Schwabe BayesTwin: An R package for Bayesian inference of item-level twin data
O'Brien et al. Prognosis tool based on a modified children's implant profile for use in pediatric cochlear implant candidacy evaluation
JP6463520B2 (ja) 計算装置、方法、システム及びプログラム
Mellenbergh et al. Finding the biasing trait (s)
JP6377517B2 (ja) 単語提示装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220118

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220926

R150 Certificate of patent or registration of utility model

Ref document number: 7160078

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150