JP2011018155A - Method, device and program for creating infant vocabulary development database - Google Patents
Method, device and program for creating infant vocabulary development database Download PDFInfo
- Publication number
- JP2011018155A JP2011018155A JP2009161592A JP2009161592A JP2011018155A JP 2011018155 A JP2011018155 A JP 2011018155A JP 2009161592 A JP2009161592 A JP 2009161592A JP 2009161592 A JP2009161592 A JP 2009161592A JP 2011018155 A JP2011018155 A JP 2011018155A
- Authority
- JP
- Japan
- Prior art keywords
- word information
- age
- category
- word
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011161 development Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims description 22
- 238000001514 detection method Methods 0.000 claims abstract description 32
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 230000001174 ascending effect Effects 0.000 claims 2
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000018109 developmental process Effects 0.000 description 34
- 230000008569 process Effects 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 241001446467 Mama Species 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 230000008140 language development Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003925 brain function Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010988 intraclass correlation coefficient Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000020509 sex determination Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、ウェブ(Web)上から投稿されたデータを利用して幼児語彙発達データベースを作成する技術であり、特に投稿データの信頼性を確保して高品質な前記データベースを実現させる技術に関する。 The present invention relates to a technology for creating an infant vocabulary development database using data posted from the Web, and more particularly to a technology for ensuring the reliability of posted data and realizing the high-quality database.
現在、ウェブ上には、英和辞書や国語辞書などの従来の書籍版辞書を電子化してウェブサイト上で閲覧するものから、「wikipedia」に代表されるユーザ参加型の辞書まで、様々な辞書およびデータベースの閲覧サービスが存在する。 Currently, there are various dictionaries on the web, ranging from electronic book-version dictionaries such as English-Japanese dictionaries and national language dictionaries to browse on the website to user-participation dictionaries represented by “wikipedia”. There is a database browsing service.
書籍版の辞書と比較して、ウェブ上で辞書やデータベースを公開する最大のメリットは、多数のユーザによる情報の追加・変更を容易に実施可能なため、新しい情報をタイムリーに追加できる点にある。すなわち、投稿された情報の精度や信頼性に関するデメリットは考えられるものの、こうしたウェブの特性を生かせば、これまでに存在しなかった種類の辞書やデータベースを効率的にかつ迅速に構築することが可能である。 The biggest advantage of publishing dictionaries and databases on the web compared to the book version is that many users can easily add and change information, so that new information can be added in a timely manner. is there. In other words, although there are possible disadvantages related to the accuracy and reliability of posted information, it is possible to efficiently and quickly build a kind of dictionary and database that did not exist so far by taking advantage of these web characteristics. It is.
こうした中、現在、「こども語辞書」と呼ばれる幼児語彙発達に関するデータベースがウェブ上で公開され、世界に類のない辞書が構築されつつある。これは幼児が何時、どのような単語を発話するようになったかというデータを、ウェブの日誌ツール上にユーザが随時記録し、その記録情報を整理・加工して作成したデータベースをウェブ上で閲覧できるようにしたものである。この閲覧サービスによれば、ある単語がいつ獲得されるか(例えば単語「ママ」:獲得平均15.4ヶ月齢)や、幼児語の意味(幼児語「しゃ」→意味:「電車」)などを簡単に検索・閲覧でき、0−3歳の子どもを持つ親には有用な育児情報提供サービスである(非特許文献1)。 Under such circumstances, a database on infant vocabulary development called “Children's Dictionary” has been released on the web, and a dictionary unique to the world is being constructed. This is the data recorded by the user on the web diary tool, and the database created by organizing and processing the recorded information on the web. It is something that can be done. According to this browsing service, when a certain word is acquired (for example, the word “mom”: acquisition average 15.4 months old), the meaning of an infant word (infant word “sha” → meaning: “train”), etc. Can be easily searched and viewed, and is a childcare information providing service useful for parents who have children aged 0 to 3 (Non-patent Document 1).
こうした幼児語彙発達に関するデータの収集は、通常、発達心理学や心理言語学の分野の研究者が子どもの発話行動を観察したり、母親に直接インタビューをしたりするため、データの信頼性が問題となることはほとんどない。 The collection of data related to infant vocabulary development is usually a problem because researchers in the fields of developmental psychology and psycholinguistics observe children's utterance behaviors and directly interview their mothers. Almost never.
しかしながら、ユーザ投稿のデータに基づいて幼児語彙発達データベースを構築する場合には、不正データの投稿などによるデータの信頼性が問題となる。特に、前記「こども語辞書」の場合には、ある単語がいつ発話されたかに関する各個人の情報が重要な構成要素となるため、多くのユーザがデータの正確さを欠いて投稿したり、実際に子どもがいないのに虚偽のデータを悪質に投稿したりすると、集計されたデータの精度が低下するおそれがある。 However, when an infant vocabulary development database is constructed based on user-submitted data, the reliability of data due to posting of illegal data becomes a problem. In particular, in the case of the “Children's Word Dictionary”, each individual's information about when a certain word was spoken is an important component, so many users can post data with inaccuracy of data, If there are no children, posting false data maliciously may reduce the accuracy of the aggregated data.
また、前記データベースを閲覧サービスとして一般公開する場合には、より一層の正確な情報を提示する責任が求められる。したがって、何らかの技術でこうした問題を回避する必要があり、データベースの精度および信頼性を確保することが重要となる。 Further, when the database is opened to the public as a browsing service, a responsibility for presenting more accurate information is required. Therefore, it is necessary to avoid these problems with some technique, and it is important to ensure the accuracy and reliability of the database.
本発明は、上記課題を解決するためのものであり、ユーザ参加型の方式で収集したデータをもとに信頼性の高い幼児語彙発達データベースを構築する技術の提供を解決課題としている。 The present invention has been made to solve the above-mentioned problems, and it is an object of the present invention to provide a technique for constructing a reliable infant vocabulary development database based on data collected by a user participation type method.
そこで、本発明は、ユーザ参加型の方式で収集したデータに基づき幼児語彙発達データベースを作成する際に幼児語彙発達特性を生かした不正データ検出および信頼性検証のプロセスを実施し、高精度・高品質のデータベース作成技術を提供する。 Therefore, the present invention implements a process for detecting and reliability of fraudulent data that makes use of infant vocabulary development characteristics when creating an infant vocabulary development database based on data collected by a user participation type method. Provide quality database creation technology.
本発明の一態様は、ユーザの端末を通じてウェブ上に投稿された単語情報を利用して、幼児語彙発達データベースを作成するための方法であって、入力手段が、前記端末に単語情報を入力するインタフェースを表示させ、前記端末を通じてユーザが入力した単語情報を受け付ける入力受付ステップと、不正検出手段が、前記入力受付ステップで受け付けた単語情報の獲得月齢あるいは意味カテゴリを、あらかじめ用意した複数の定義基準に当てはめて不正な単語情報を検出し、該不正情報を排除する不正検出ステップと、平均獲得月齢算出手段が、前記不正検出ステップで排除されずに有効と認められた単語情報の平均獲得月齢を算出する平均獲得月齢算出ステップと、信頼性決定手段が、前記平均月齢算出ステップで算出した平均獲得月齢に基づき有効と認められた単語情報の信頼性を判断する信頼性決定ステップと、生成手段が、前記信頼性決定ステップで信頼性を認められた単語情報をもとに幼児語彙発達データベースを生成する生成ステップと、を有する。 One aspect of the present invention is a method for creating an infant vocabulary development database using word information posted on the web through a user's terminal, wherein the input means inputs the word information to the terminal. An input receiving step for displaying the interface and receiving the word information input by the user through the terminal, and the fraud detection means, a plurality of definition criteria prepared in advance for the acquired age or meaning category of the word information received in the input receiving step And the fraud detection step for detecting fraudulent word information and eliminating the fraud information, and the average acquisition age calculation means determine the average acquisition age of the word information that is recognized as valid without being excluded in the fraud detection step. The average acquired age calculated by the average acquired age calculated in the average acquired age calculated in the average acquired age A reliability determination step for judging the reliability of the word information recognized as valid based on the above, and generation means for generating the infant vocabulary development database based on the word information whose reliability is recognized in the reliability determination step Steps.
本発明の他の態様は、ユーザの端末を通じてウェブ上に投稿された単語情報を利用して、幼児語彙発達データベースを作成するための装置であって、前記端末に単語情報を入力するインタフェースを表示させ、前記端末を通じてユーザが入力した単語情報を受け付ける入力手段と、前記入力手段で受け付けた単語情報の獲得月齢あるいは意味カテゴリを、あらかじめ用意した複数の定義基準に当てはめて不正な単語情報を検出し、該不正情報を排除する不正検出手段と、前記不正検出手段で排除されずに有効と認められた単語情報の平均獲得月齢を算出する平均獲得月齢算出手段と、前記平均月齢算出手段の算出した平均獲得月齢に基づき有効と認められた単語情報の信頼性を判断する信頼性決定手段と、前記信頼性決定手段で信頼性を認められた単語情報をもとに幼児語彙発達データベースを生成する生成手段と、を備える。 Another aspect of the present invention is an apparatus for creating an infant vocabulary development database using word information posted on the web through a user terminal, and displaying an interface for inputting word information on the terminal Incorrect word information is detected by applying the input means for receiving word information input by the user through the terminal and the acquired age or semantic category of the word information received by the input means to a plurality of definition criteria prepared in advance. Calculated by the fraud detection means for eliminating the fraud information, the average acquisition age calculation means for calculating the average acquisition age of the word information that is recognized as valid without being excluded by the fraud detection means, and the average age calculation means Reliability determination means for judging the reliability of word information recognized as effective based on average acquired age, and reliability is recognized by the reliability determination means. Based on the word information comprises generation means for generating an infant vocabulary development database, a.
なお、本発明は、前記装置の各手段としてコンピュータを機能させるためのプログラムの態様としてもよい。このプログラムは、記録媒体に格納した態様で提供してもよい。 In addition, this invention is good also as an aspect of the program for functioning a computer as each means of the said apparatus. This program may be provided in a form stored in a recording medium.
本発明によれば、ユーザ参加型の方式を通じて収集したデータをもとに信頼性の高い幼児語彙発達データベースが構築される。 According to the present invention, a highly reliable infant vocabulary development database is constructed based on data collected through a user participation method.
≪基本構成≫
図1は、本発明の実施形態に係る幼児語彙発達データベースの作成装置の基本的な構成を示している。この作成装置1は、図示省略のユーザ端末とインターネット経由で接続されているものとする。
≪Basic structure≫
FIG. 1 shows a basic configuration of an apparatus for creating an infant vocabulary development database according to an embodiment of the present invention. This
ここでは前記作成装置1は、前記ユーザ端末からの幼児語彙発達に関する投稿データに対して、不正データ検出及びデータ信頼性決定の処理プロセスを実施し、高品質の幼児語彙発達データベースを作成する。具体的には、前記作成装置1は、コンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばCPU,メモリ(RAM),ハードディスクドライブ装置,通信デバイスなどを備えている。
Here, the
このハードウェアリソースとソフトウェアリソース(OS,アプリケーション)との協同の結果、前記作成装置1は、前記ユーザ端末に対して幼児語彙の特徴に応じて単語を入力可能なユーザインタフェースを提供するユーザインタフェース入力手段11と、該入力手段11を通じて入力された各単語データの獲得月齢を計算する単語獲得月齢生成手段12と、各入力単語に意味カテゴリを付与する幼児語彙意味カテゴリ付与手段13と、該両手段12.13の処理結果を利用して入力単語群に複数の定義基準を当てはめて不正データを検出する不正データ検出手段14と、該検出手段14で排除されなかった有効なデータセットから入力単語の平均獲得月齢を生成する平均獲得月齢生成手段15と、該生成手段15の算出した平均獲得月齢を用いて前記データセットの信頼性を判断するデータ信頼性決定手段16と、該決定手段16の判断した信頼性の高いデータセットをもとに各入力単語の項目を生成して幼児語彙発達データベース化するデータベース項目生成手段17と、該生成手段17の生成した前記データベースを前記ユーザ端末で閲覧・検索可能なユーザインタフェースを提供するユーザインタフェース閲覧手段18と、を有している。
As a result of the cooperation between the hardware resource and the software resource (OS, application), the
ここで前記生成手段17は、前記データベースを前記ハードディスクドライブ装置上に生成するものとする。また、前記入力手段11および前記閲覧手段18は、前記通信デバイスを通じて前記ユーザ端末に各ユーザインタフェースを提供するものとする。なお、前記入力手段11は、ウェブ日誌ツールのユーザインタフェースを提供するものとする。
Here, the
図2は、前記作成装置1のデータベース作成プロセスを示している。ここではまず、前記入力手段11を通じて前記ユーザ端末に表示されたウェブ日誌ツールのインタフェースにわが子の覚えた単語を入力させ、該入力された単語を前記入力手段11がインターネット経由で受け付けるウェブ日誌ツール単語受付ステップ(S01)が実施される。
FIG. 2 shows a database creation process of the
つぎにS01で受け付けた各入力単語に対して、前記生成手段12が獲得月齢を算出する単語獲得月齢生成ステップ(S02)が実施され、その後に該各入力単語の意味カテゴリを前記付与手段13が付与する幼児語彙意味カテゴリ付与ステップ(S03)が実施される。 Next, for each input word received in S01, a word acquisition age generation step (S02) in which the generation means 12 calculates an acquisition month age is performed, and then the meaning category of each input word is given by the assignment means 13. An infant vocabulary meaning category assignment step (S03) to be provided is performed.
続いてS01で受け付けた入力単語群に対して、前記検出手段14が幼児語彙の科学的特徴から考案された複数の基準指標に基づいて不正データを検出・排除する不正データ検出ステップ(S04)が実施される。この検出ステップの実施にはS02で算出された単語獲得月齢とS03で付与された意味カテゴリとが利用される。 Subsequently, for the input word group received in S01, there is an illegal data detection step (S04) in which the detection means 14 detects and eliminates illegal data based on a plurality of reference indices devised from scientific characteristics of infant vocabulary. To be implemented. The detection step is performed by using the word acquisition age calculated in S02 and the semantic category assigned in S03.
そして、S04で排除されなかった有効な各入力単語に対して、前記生成手段15にて平均獲得月齢を生成する平均獲得月齢生成ステップ(S05)が実施される。ここで生成された平均獲得月齢に基づき前記決定手段16が、あらかじめ単語毎の獲得月齢を集計・リスト化した辞書を参照し、各入力単語の信頼性を評価・決定するデータ信頼性決定ステップ(S06)が実施される。 Then, for each valid input word that has not been excluded in S04, the generation means 15 performs an average acquired age generation step (S05) in which an average acquired age is generated. A data reliability determination step in which the determination means 16 evaluates / determines the reliability of each input word by referring to a dictionary in which the acquired age for each word is previously tabulated / listed based on the generated average acquired age. S06) is performed.
このS06の段階で信頼性の高かった各入力単語をもとに、前記生成手段17が最終的なデータベース項目を生成するデータベース項目生成ステップ(S07)が実施される。ここでは生成された前記項目がデータベース化されて幼児語彙発達データベースとして利用され、前記閲覧手段18を通じて前記ユーザ端末に閲覧・検索可能なユーザインタフェースが表示される。 A database item generating step (S07) is performed in which the generating means 17 generates a final database item based on each input word having high reliability in the stage of S06. Here, the generated items are converted into a database and used as an infant vocabulary development database, and a user interface that can be browsed and searched is displayed on the user terminal through the browsing means 18.
≪実施例≫
図3は、前記作成装置1の実施例の構成を示し、ユーザインタフェース入力部31,単語獲得月齢生成部32,幼児語彙意味カテゴリ付与部33,中間データ保持部34,不正データ検出部35,平均獲得月齢生成部36,データ信頼性決定部37,データベース項目生成部38,ユーザインタフェース閲覧部39を有している。ここでは前記各部31〜33.35〜39は、それぞれ前記各手段11〜18に対応している。以下、各部31〜39を個別具体的に説明する。
<Example>
FIG. 3 shows a configuration of an embodiment of the
(1)ユーザインタフェース入力部31
前記ユーザインタフェース入力部31は、インターネット経由で前記ユーザ端末のブラウザに個人用のウェブ日誌ツールのユーザインタフェースを表示させる。このインタフェースによれば、図4に示すように、日時ごと(何時「例:200x年x月x日」)に、どんな単語(例:わんわん)をどんな意味(例:犬)で発話したかを記録するための入力欄Q.Rが表示される。ここで入力される単語情報、即ち前記入力欄Qの入力データを入力単語,前記入力欄Rの入力データを入力意味と呼ぶものとする。
(1) User
The user
この各入力データを前記入力部31が受け付けることによりデータベース作成に必要な投稿データが収集される。ここで収集された各データは前記各部32.33に転送される。なお、個人識別ID、性別や誕生日、出生順、居住地域などの基本情報は、別途ウェブ日誌ツール利用前に入力しておくものとする。入力された基本情報は、前記生成部32および前記データ保持部34に転送される。
When the
(2)単語獲得月齢生成部32
前記単語獲得月齢生成部32は、前記入力欄Q.Rへのデータ記録日時と、前記基本情報として入力されたユーザの子供の生年月日との差から、入力単語の獲得月齢、即ち生後何ヶ月目に発話されたかを決定する。例えばデータ記録日時「2008.10.21」、生年月日「2007.8.5」の場合には、獲得月齢「14.5ヶ月」と算出される。ここで算出された獲得月齢は入力単語とペアで前記中間データ保持部34に転送される。
(2) Word acquisition
The word acquisition
(3)幼児語彙意味カテゴリ付与部33
前記幼児語彙意味カテゴリ付与部33は、入力意味(例:犬)に対して、図5の意味カテゴリ分類表を参照して意味カテゴリ(例:動物)を付与する。その際に入力単語(例:わんわん)を図3中の意味カテゴリ定義辞書310と照合し、入力意味のカテゴリを決定するものとする。この定義辞書310は、図6に示すように、幼児語彙として投稿される可能性のある単語に対して事前に意味カテゴリが定義されている。
(3) Infant vocabulary meaning
The infant vocabulary meaning
例えば入力単語(例:わんわん)は、図6の前記定義辞書310によれば、カテゴリID「25」のカテゴリ名「動物」に該当する。これにより入力意味(例:犬)には、図5の前記カテゴリ分類表に示すように、「2.身のまわり」中の「25.動物」の意味カテゴリが付与される。ここで付与された意味カテゴリは、入力意味とペアで前記中間データ保持部34に転送される。なお、図5の意味カテゴリ分類表および図6の前記定義辞書310は、それぞれ前記ハードディスクドライブ装置に保存されているものとする。
For example, according to the
(4)中間データ保持部34
前記中間データ保持部34は、前記各部31〜33からの転送データを整理・保持する。ここでは入力単語(例:わんわん)に対して、入力意味(例:犬)と獲得月齢(例:14.5ヶ月)と意味カテゴリ(例:25.動物)と個人識別ID(例:F09−3−456)をデータセットにするものとする。
(4) Intermediate
The intermediate
具体的には、前記中間データ保持部34は、前記メモリ(RAM)あるいは前記ハードディスクドライブ装置を通じて前記データセットをユーザ毎に順次保持していくものとする。
Specifically, the intermediate
(5)不正データ検出部35
前記不正データ検出部35は、プログラムに定義された4つの指標、即ち図3中の有意味単語月齢照合定義311・名詞カテゴリ照合定義312・日課/挨拶カテゴリ照合定義313・NV比計算照合定義314に基づき前記中間データ保持部34の保持するデータセットから不正データを決定・検出する。以下、図7に基づき前記不正データ検出部35の処理プロセスを説明する。
(5) Unauthorized
The fraudulent
S11:まず、前記不正データ検出部35は、前記データセットに含まれる各ユーザの入力単語のうち獲得月齢が最も小さい単語から50番目の単語までを選択する。ここで選択された単語を「早期出現語彙50語」と呼ぶ。この早期出現語彙50語に対して、S12以降で前記各指標に基づき不正データを検出する。
S11: First, the fraudulent
S12:S11で選択された早期出現語彙50語に対する有意味単語月齢照合、即ち有意味単語月齢照合定義311に基づく不正データ検出を実施する。ここでは早期出現語彙50語に獲得月齢が8ヶ月齢以前の有意味単語が含まれていれば、これを不正データとみなすものとする。この有意味単語か否かの照合にあたっては前記データセット中の入力意味が利用される。
S12: Incorrect data detection based on the meaningful word age collation for the 50 words of early appearance vocabulary selected in S11, that is, the meaningful word
このように獲得月齢が8ヶ月以前の場合に不正データとする理由は、乳児の8ヶ月齢以前には、構音器官とその制御を司る脳機能、および音声表象と指示対象の認知的関連づけ脳機能が十分に成熟していないという自然科学的知見が存在するためである。例えば3ヶ月齢児が「ちょうだい」・「ジャンプ」・「落ちた」のような有意味単語を発したと前記入力欄Qに入力されたとしても、現実には不可能だと推定される。 As described above, the reason why the data is incorrect when the acquired age is 8 months or older is that the infant's 8 months of age or earlier is the brain function that controls the articulatory organ and its control, and the cognitively related brain function of the speech representation and the target object. This is because there is a natural scientific finding that is not mature enough. For example, even if a 3-month-old child utters a meaningful word such as “give me”, “jump”, or “fallen”, it is presumed that it is actually impossible even if it is entered in the input field Q.
S13.S14:つぎにS11で選択された早期出現語彙50語に対するに対する名詞カテゴリ照合、即ち名詞カテゴリ照合定義312に基づく不正データ検出を実施する(S13)。ここでは早期出現語彙50語中に名詞カテゴリ(図5の意味カテゴリ分類表における21「食べ物・飲み物」〜26「乗物」)に該当する単語の存否が照合される。照合の結果、名詞カテゴリに該当する単語がひとつも存在しない場合には不正データとする。
S13. S14: Next, noun category matching is performed on the 50 early appearing vocabulary words selected in S11, that is, illegal data detection based on the noun
その後に早期出現語彙50語に対する日課/挨拶カテゴリ照合、即ち日課/挨拶カテゴリ照合定義313に基づき不正データ検出を実施する(S14)。ここでは早期出現語彙50語中に日課/挨拶カテゴリ(図5の意味カテゴリ分類表における31「日課・あいさつ」)に該当する単語の存否が照合される。照合の結果、日課/挨拶カテゴリに該当する単語がひとつも存在しない場合には、S13と同様に不正データとする。なお、S13.S14の照合にあたっては前記データセット中の意味カテゴリが利用される。 After that, illegal data detection is performed based on daily / greeting category matching for the 50 words that appear early, that is, daily / greeting category matching definition 313 (S14). Here, the presence / absence of a word corresponding to a daily / greeting category (31 “daily routine / greeting” in the semantic category classification table of FIG. 5) in the 50 early appearing vocabulary words is collated. If there is no word corresponding to the daily / greeting category as a result of the collation, it is regarded as illegal data as in S13. S13. The semantic category in the data set is used for the collation in S14.
このように両カテゴリに該当する単語が不存在の場合に不正データとする理由は、発明者達の実施した日本語学習児の調査によれば、早期出現語彙50語にかならず両カテゴリのものが存在することを発見しており、もしこのカテゴリの単語が全く存在しないとすれば、それは不正データの可能性が高いと考えられるためである。 As described above, the reason why the data is invalid when there are no words corresponding to both categories is that, according to the survey of Japanese learning children conducted by the inventors, the words in both categories are not limited to the 50 early appearance vocabulary words. If it has been found that there is no word in this category, it is considered that there is a high possibility of illegal data.
S15:最後にS11で選択された早期出現語彙50語に含まれる名詞カテゴリ(N)と動詞カテゴリ(V)とのNV比計算照合、即ちNV比計算照合定義314に基づく不正データの検出を実施する。
S15: Finally, NV ratio calculation collation between the noun category (N) and the verb category (V) included in the 50 early appearance vocabulary words selected in S11, that is, illegal data detection based on the NV ratio
具体的には、早期出現語彙50語に含まれる名詞カテゴリ(図5の意味カテゴリ分類表における21「食べ物・飲み物」〜26「乗物」)と動詞カテゴリ(図5の意味カテゴリ分類表における41「動作語」)の単語の各個数から「NV比(noun−verb ratio)」を計算する。ここでは「NV比=名詞カテゴリ数÷動詞カテゴリ数」とし、算出したNV比が特定の範囲外の場合は不正データとみなす。 Specifically, the noun category (21 “food / drink” to 26 “vehicle” in the semantic category classification table of FIG. 5) included in the 50 words of early appearance vocabulary and the verb category (41 “in the semantic category classification table of FIG. 5). “Non-verb ratio” is calculated from the number of words of “operation word”). Here, “NV ratio = noun category number ÷ verb category number” is assumed, and when the calculated NV ratio is outside a specific range, it is regarded as illegal data.
発明者達の実施した研究によれば、日本語学習児の早期出現語彙50語のNV比は、平均「3.32」、標準偏差「1.78」であり、標準偏差の2倍を基準とした2SDに該当する「95.45%」のデータが、「0〜6.87」の値に当てはまることを発見した。この自然科学的現象を指標として使用し、NV比が「0〜6.87」の範囲外であれば、不正データとみなすものとする。 According to the research conducted by the inventors, the NV ratio of the 50 early vocabulary words of Japanese learning children is an average of “3.32” and a standard deviation of “1.78”, and is based on twice the standard deviation It was found that the data of “95.45%” corresponding to 2SD, which falls under the above, falls within the value of “0 to 6.87”. If this natural scientific phenomenon is used as an index and the NV ratio is outside the range of “0 to 6.87”, it is regarded as illegal data.
ただし、NV比は獲得する言語によって異なることが判明しており、NV比の前記範囲を日本語以外の言語に適用することはできない。なお、非特許文献2によれば、英語ではNV比の平均が約12.0と日本語よりもかなり高く、韓国語では平均が約1.8と日本語よりも低いことから、言語に応じてNV比の前記範囲を調整すればよい。
However, it has been found that the NV ratio varies depending on the language to be acquired, and the above range of the NV ratio cannot be applied to languages other than Japanese. According to
このようにS12〜S15の処理において、4つの前記指標311〜314を最終的にすべて満たせば、そのユーザの前記各データセットを有効とし、以降の分析対象の有効データとして利用する。この有効データは前記中間データ保持部34に保持しておくものとする。
As described above, in the processes of S12 to S15, if all the four
一方、前記指標311〜314のうちで1つでも不正データに該当すれば、そのユーザの前記各データセットを無効とし、以降の分析対象から除外する。その際に前記中間データ保持部34から消去してもよい。こうした幼児言語発達の特徴を利用した指標による基準適用により、悪戯などによる不正データを高精度に検出可能となる。
On the other hand, if any one of the
(6)平均獲得月齢生成部36
前記平均獲得月齢生成部36は、前記不正データ検出部35で認められた前記有効データを対象に、各入力単語の平均獲得月齢および投稿データ個数を生成する。例えば、「ママ」という意味で登録された単語をすべて選択し、該単語の各ユーザの獲得月齢を平均化することで、単語「ママ」の平均獲得月齢(例:16.7ヶ月齢)と、入力された投稿データ個数(例:123件)とを生成する。ここで生成された平均獲得月齢および投稿データ個数は前記メモリ(RAM)に記憶されるものとする。
(6) Average acquired
The average acquired
(7)データ信頼性決定部37
前記データ信頼性決定部37は、前記メモリ(RAM)に記憶された各入力単語の平均獲得月齢値(例:単語「ママ」、16.7ヶ月齢)および投稿データ個数(例:個数値単語「ママ」、123件)を利用して、前記中間データ保持部34に保持された前記有効データの信頼性を決定する。
(7) Data
The data
詳細を説明すれば、まず各単語の平均獲得月齢値(例:単語「ママ」、16.7ヶ月齢)を、図3中の横断50%到達月齢辞書315と照合し、前記有効データの信頼性を決定する。この辞書315は、図8に示すように、各単語の「50%到達月齢」値をあらかじめリスト化して、前記ハードディスクドライブ装置に保存しているものとする。
More specifically, first, the average acquired age value of each word (eg, the word “mama”, 16.7 months old) is collated with the crossing 50% reaching
ここで保存される「50%到達月齢」は、10−36ヶ月齢の子どもを持つ親を対象に、わが子が現時点で、どのような単語を覚えているかをチェックリスト(質問紙)に回答してもらい、該回答のデータを月齢ごとに集計し、各単語がその月齢群のどの程度の割合の子どもに獲得されているかを算出し(例えば、18ヶ月齢群では「ママ」は65%,パパは57%など)、各単語の獲得割合が50%に到達した月齢を該単語の獲得月齢と暫定的に設定したものである(非特許文献3参照)。 “50% Reaching Age” stored here is for parents with children aged 10-36 months, answering the checklist (question paper) what words my child currently remembers The data of the answer is tabulated for each age, and the percentage of children in each age group that each word is acquired is calculated (for example, 65% The age at which the acquisition rate of each word reaches 50% is provisionally set as the acquisition age of the word (see Non-Patent Document 3).
例えば、「まんま」という単語に対して13ヶ月齢群では46%、14ヶ月齢群では51%、15ヶ月齢群では60%の獲得割合とすれば、「まんま」の50%到達月齢を14ヶ月齢と設定する。この「50%到達月齢」は、前記平均獲得月齢生成部36で算出される平均獲得月齢値と、データ収集および計算手法の点で全く異なるものであるが、発明者達の研究成果によれば、「50%到達月齢」の値が統計的に有意なレベルで合致することを発見した(級内相関係数が0.7であり、5%水準で有意に合致した)。
For example, if the acquisition rate is 46% in the 13-month-old group, 51% in the 14-month-old group, and 60% in the 15-month-old group for the word “manma”, the 50-month-old age of “manma” is 14 Set as months of age. This “50% reached age” is completely different from the average acquired age value calculated by the average acquired
こうした科学的事実に基づいて前記転送データ中の平均獲得月齢値を前記辞書315と単語ごとに照合し、50%獲得月齢(例えば単語「まんま:14ヶ月齢」)の前後2ヶ月の範囲(例えば、12−16ヶ月齢)に該当すれば、該平均獲得月齢の前記有効データの信頼性を肯定する。この信頼性肯定範囲(平均獲得月齢の前後2ヶ月)はプログラムに設定されているものとする。
Based on such scientific facts, the average acquired age value in the transferred data is collated with the
ただし、前記転送データに含まれる投稿データ個数が、あまりに少ない場合には平均獲得月齢の正確な推定が難しい。そこで、投稿データ個数が10個以上の入力単語のみを有効とする基準を設定し、投稿データ個数が9以下の場合は信頼性のないデータとして、前記有効データから除外するものとする。この基準個数も、プログラムに設定され、必要に応じて調整可能とする。 However, when the number of posted data included in the transfer data is too small, it is difficult to accurately estimate the average acquired age. Therefore, a criterion for validating only the input words having the posted data number of 10 or more is set, and when the posted data number is 9 or less, it is excluded from the valid data as unreliable data. This reference number is also set in the program and can be adjusted as necessary.
(8)データベース項目生成部38
前記データベース項目生成部38は、前記各部32〜37の一連の処理手続を経て信頼性を肯定された有効データを、入力単語ごと(例:アンパンマン)に平均獲得月齢(例:18.3ヶ月齢)・意味カテゴリのカテゴリID(例:52 キャラクター)・投稿されたデータ数(例:133件)・発話例(例:あんぱん、ぱんぱん)の項目別に集計・加工し、図9に示すように、データベース化する。ここで生成されたデータベースを幼児語彙発達データベースとする。
(8) Database
The database
したがって、前記作成装置1によれば、前記ユーザ端末からのウェブ投稿データ、即ちユーザ参加型の方式で収集したデータから、日本語学習児の幼児語彙発達特性を生かした不正データ検出(S11〜S15)および信頼性検証のプロセスを通じて高精度・高品質の幼児語彙発達データベースが作成される。
Therefore, according to the
(9)ユーザインタフェース閲覧部39
前記ユーザインタフェース閲覧部39によれば、前記データベース項目生成部38で作成された幼児語彙発達データベースを、ウェブ上で検索・閲覧できるユーザインタフェースが前記ユーザ端末に提供される。すなわち、前記閲覧部39は、図10に示すように、前記データベースを検索可能な検索ページを前記ユーザ端末のブラウザに表示させる。
(9) User
According to the user
この検索ページに入力された検索要求に応じて検索結果を出力し、図11に示すように、前記ユーザ端末のブラウザ表示を検索結果のページに切り替える。これによりユーザは、前記ユーザ端末を通じて幼児の語彙発達に関する情報を簡単に取得することができる。例えば、図10の検索ページのT欄「フリーキーワードから調べる」に発音「わんわん」を入力し、発音から検索要求すれば、図11に示すように、音声」(わんわん)に対する「意味」(犬、動物、NHKのキャラクター)と、「カテゴリ」(動物)と、「平均獲得月齢」(18,1ヶ月齢)と、発話された割合(%)を示す獲得分布(度数分布表)Wが前記ユーザ端末のブラウザに表示される。 The search result is output in response to the search request input to the search page, and the browser display of the user terminal is switched to the search result page as shown in FIG. Thereby, the user can easily acquire information related to infant vocabulary development through the user terminal. For example, if the pronunciation “Wanwan” is entered in the T column “Search from free keyword” on the search page of FIG. 10 and a search is requested from the pronunciation, the “meaning” (dog) for the voice (wanwan) as shown in FIG. , Animals, NHK characters), “category” (animals), “average acquired age” (18, 1 month old), and acquisition distribution (frequency distribution table) W indicating the percentage (%) spoken It is displayed on the browser of the user terminal.
また、16ヶ月齢の子どもが平均的にどんな単語を覚える傾向にあるかを検索したい場合には、図10の項目「月齢から調べる」のうち「16ヶ月」をブラウザ上でクリックすれば、平均獲得月齢が「16.0ヶ月〜16.9ヶ月」の単語が一覧リストとして前記ユーザ端末のブラウザに表示される。その他に図10の項目「索引から調べる」、項目「意味カテゴリから調べる」をクリックし、該当結果をブラウザに表示させることもできる。 Also, if you want to find out what words 16-month-old children tend to memorize on average, you can click on “16 months” on the browser in the item “Check by age” in FIG. Words having an acquired age of “16.0 months to 16.9 months” are displayed as a list on the browser of the user terminal. In addition, by clicking the item “Check from index” and the item “Check from semantic category” in FIG. 10, the corresponding result can be displayed on the browser.
これにより幼児の言語発達過程を簡単に検索/閲覧可能な「こども語辞書」サービスが提供され、親が知りたいと思う子どもの言葉の成長に関する情報が容易に検索可能となる。このとき前記幼児語彙発達データベースは、前記不正データ検出部35および前記データ信頼性決定部37を通じて不正データが排斥され、信頼性を有する投稿データに基づき構築されているため、幼児語彙発達に関する高精度・高品質のデータベースとして構築されている。
This provides a “children dictionary” service that allows easy search / browsing of the language development process of infants, and makes it easy to search for information on the growth of children's words that parents want to know. At this time, the infant vocabulary development database is constructed on the basis of reliable post data in which invalid data is rejected through the invalid
したがって、子供の言葉の成長をより正確に推定・知得でき、エビデンスベース(Evidence Base)の情報開示が可能となる。また、前記幼児語彙発達データベースに含まれる各単語の平均獲得月齢を利用すれば、初期語彙発達教育支援システムや、月齢に応じた幼児向け音声対話システムへの応用も将来的に可能であり、様々な産業場面で適用できる。 Therefore, the growth of the child's words can be estimated and understood more accurately, and evidence-based information disclosure is possible. In addition, if the average acquired age of each word contained in the infant vocabulary development database is used, it can be applied to an early vocabulary development education support system and a spoken dialogue system for infants according to the age. Applicable in various industrial situations.
≪プログラムなど≫
本発明は、前記作成装置1を構成する各手段12〜18.各部31〜39の一部若しくは全部として、コンピュータを機能させるためのプログラムとして構成することもできる。このプログラムでは、S01〜S07.S11〜S15の全ステップあるいは一部のステップをコンピュータに実行させることが可能である。
≪Programs≫
In the present invention, each means 12-18. Some or all of the
このプログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,Blu−ray Disk(登録商標)などの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。 This program can be provided through a network such as a website or e-mail. The program is recorded on a recording medium such as a CD-ROM, DVD-ROM, CD-R, CD-RW, DVD-R, DVD-RW, MO, HDD, Blu-ray Disk (registered trademark). It is also possible to save and distribute. This recording medium is read using a recording medium driving device, and the program code itself realizes the processing of the above embodiment, so that the recording medium also constitutes the present invention.
1…幼児語彙発達データベース作成装置
11…ユーザインタフェース入力手段(入力手段)
12…単語獲得月齢生成手段(獲得月齢生成手段)
13…幼児語彙意味カテゴリ付与手段(カテゴリ付与手段)
14…不正データ検出手段(不正検出手段)
15…平均獲得月齢生成手段
16…データ信頼性決定手段(信頼性決定手段)
17…データベース項目生成手段(生成手段)
18…ユーザインタフェース閲覧手段
31…ユーザインタフェース入力部
32…単語獲得月齢生成部
33…幼児語彙意味カテゴリ付与部
34…中間データ保持部
35…不正データ検出部
36…平均獲得月齢生成部
37…データ信頼性決定部
38…データベース項目生成部
310…意味カテゴリ定義辞書
311…有意味単語月齢照合定義
312…名詞カテゴリ照合定義
313…日課/挨拶カテゴリ照合定義
314…NV比計算照合定義
315…横断50%到達月齢辞書
1 ... Infant vocabulary development
12 ... Word acquisition age generation means (acquisition age generation means)
13. Infant vocabulary meaning category assigning means (category assigning means)
14: Unauthorized data detection means (injustice detection means)
15 ... Average acquired age generation means 16 ... Data reliability determination means (reliability determination means)
17 ... Database item generation means (generation means)
DESCRIPTION OF
Claims (9)
入力手段が、前記端末に単語情報を入力するインタフェースを表示させ、前記端末を通じてユーザが入力した単語情報を受け付ける入力受付ステップと、
不正検出手段が、前記入力受付ステップで受け付けた単語情報の獲得月齢あるいは意味カテゴリを、あらかじめ用意した複数の定義基準に当てはめて不正な単語情報を検出し、該不正情報を排除する不正検出ステップと、
平均獲得月齢算出手段が、前記不正検出ステップで排除されずに有効と認められた単語情報の平均獲得月齢を算出する平均獲得月齢算出ステップと、
信頼性決定手段が、前記平均月齢算出ステップで算出した平均獲得月齢に基づき有効と認められた単語情報の信頼性を判断する信頼性決定ステップと、
生成手段が、前記信頼性決定ステップで信頼性を認められた単語情報をもとに幼児語彙発達データベースを生成する生成ステップと、
を有することを特徴とする幼児語彙発達データベース作成方法。 A method for creating an infant vocabulary development database using word information posted on the web through a user terminal,
An input receiving step of displaying an interface for inputting word information on the terminal and receiving the word information input by the user through the terminal;
A fraud detection step in which the fraud detection means detects fraudulent word information by applying the acquired age or semantic category of the word information received in the input reception step to a plurality of definition criteria prepared in advance, and eliminates the fraud information; ,
An average acquisition age calculation means for calculating an average acquisition age of word information recognized as effective without being excluded in the fraud detection step;
A reliability determining step for determining the reliability of the word information recognized as valid based on the average acquired age calculated in the average age calculating step;
A generating step for generating an infant vocabulary development database based on the word information whose reliability is recognized in the reliability determining step;
A method for creating an infant vocabulary development database.
カテゴリ付与手段が、前記入力受付ステップで受け付けた単語情報に対して、事前に用意されたカテゴリ辞書を参照して、前記意味カテゴリを付与するカテゴリ付与ステップと、
ユーザインタフェース閲覧手段が、前記生成ステップで生成されたデータベースをウェブ上で検索・閲覧可能なインタフェースを前記端末に表示させるユーザインタフェース閲覧ステップと、
をさらに有することを特徴とする請求項1記載の幼児語彙発達データベース作成方法。 An acquired age generation step for calculating the acquired age from the difference between the input date and time of the word information and the date of birth input through the terminal, with respect to the word information received in the input receiving step. ,
A category assigning step in which the category assigning unit assigns the semantic category with reference to a category dictionary prepared in advance for the word information received in the input accepting step;
A user interface browsing means for displaying on the terminal an interface capable of searching and browsing the database generated in the generating step on the web;
The infant vocabulary development database creation method according to claim 1, further comprising:
前記選択された単語情報群中に、前記獲得月齢が基準値以前の有意味の単語情報を含めば、該ユーザの単語情報群を不正情報と認めるステップと、
前記選択された各単語情報の前記意味カテゴリを照合し、名詞カテゴリあるいは日課/あいさつカテゴリに該当する単語情報が存在しなければ、該ユーザの単語情報群を不正情報と認めるステップと、
前記選択された各単語情報の前記意味カテゴリを参照して、名詞カテゴリに該当する単語情報と動詞カテゴリに属する単語情報との比率を算出し、該比率が事前に定められた指標の範囲外であれば、該ユーザの単語情報群を不正情報と認めるステップと、
を有することを特徴とする請求項1または2のいずれか1項に記載の幼児語彙発達データベース作成方法。 The fraud detection step includes a step of selecting an arbitrary number of the word information for each user in ascending order of the acquired age;
Recognizing the user's word information group as incorrect information if the acquired word information group includes meaningful word information whose acquired age is before a reference value;
Collating the semantic categories of each of the selected word information, and if there is no word information corresponding to a noun category or daily / greeting category, recognizing the user's word information group as incorrect information;
By referring to the semantic category of each selected word information, the ratio of the word information corresponding to the noun category and the word information belonging to the verb category is calculated, and the ratio is outside the range of the predetermined index. If there is a step of recognizing the user's word information group as illegal information,
The method for creating an infant vocabulary development database according to claim 1, wherein:
有効と認められた単語情報群の個数が、事前設定の基準個数を超えていなければ、該単語情報群の信頼性を否定するステップと、
を有することを特徴とする請求項1〜3のいずれか1項に記載の幼児語彙発達データベース作成方法。 The reliability determining step is to check the reliability of each word information recognized as valid by comparing the average acquired age with an age dictionary summarizing acquired age for each word;
If the number of word information groups recognized as valid does not exceed a preset reference number, denying the reliability of the word information groups;
The method for creating an infant vocabulary development database according to any one of claims 1 to 3.
前記端末に単語情報を入力するインタフェースを表示させ、前記端末を通じてユーザが入力した単語情報を受け付ける入力手段と、
前記入力手段で受け付けた単語情報の獲得月齢あるいは意味カテゴリを、あらかじめ用意した複数の定義基準に当てはめて不正な単語情報を検出し、該不正情報を排除する不正検出手段と、
前記不正検出手段で排除されずに有効と認められた単語情報の平均獲得月齢を算出する平均獲得月齢算出手段と、
前記平均月齢算出手段の算出した平均獲得月齢に基づき有効と認められた単語情報の信頼性を判断する信頼性決定手段と、
前記信頼性決定手段で信頼性を認められた単語情報をもとに幼児語彙発達データベースを生成する生成手段と、
を備えることを特徴とする幼児語彙発達データベース作成装置。 A device for creating an infant vocabulary development database using word information posted on the web through a user terminal,
An input means for displaying an interface for inputting word information on the terminal, and receiving word information input by a user through the terminal;
The fraud detection means for detecting the fraudulent word information by applying the acquisition age or semantic category of the word information received by the input means to a plurality of definition criteria prepared in advance, and removing the fraud information;
An average acquired age calculating means for calculating an average acquired age of word information recognized as effective without being excluded by the fraud detector;
Reliability determining means for judging the reliability of word information recognized as effective based on the average acquired age calculated by the average age calculating means;
Generating means for generating an infant vocabulary development database based on word information whose reliability is recognized by the reliability determining means;
An infant vocabulary development database creation device characterized by comprising:
前記入力手段の受け付けた単語情報に対して、事前に用意されたカテゴリ辞書を参照して、前記意味カテゴリを付与するカテゴリ付与手段と、
前記生成ステップで生成されたデータベースをウェブ上で検索・閲覧可能なインタフェースを前記端末に表示させるユーザインタフェース閲覧手段と、
をさらに備えることを特徴とする請求項5記載の幼児語彙発達データベース作成装置。 For the word information received by the input means, acquired age generation means for calculating the acquired age from the difference between the input date and time of the word information and the date of birth input through the terminal;
For the word information received by the input means, referring to a category dictionary prepared in advance, category giving means for giving the semantic category;
User interface browsing means for displaying on the terminal an interface capable of searching and browsing the database generated in the generating step on the web;
The infant vocabulary development database creation device according to claim 5, further comprising:
前記選択された単語情報群中に、前記獲得月齢が基準値以前の有意味の単語情報を含めば、該ユーザの単語情報群を不正情報と認める手段と、
前記選択された各単語情報の前記意味カテゴリを照合し、名詞カテゴリあるいは日課/あいさつカテゴリに該当する単語情報が存在しなければ、該ユーザの単語情報群を不正情報と認める手段と、
前記選択された各単語情報の前記意味カテゴリを参照して、名詞カテゴリに該当する単語情報と動詞カテゴリに属する単語情報との比率を算出し、該比率が事前に定められた指標の範囲外であれば、該ユーザの単語情報群を不正情報と認める手段と、
を備えることを特徴とする請求項5または6のいずれか1項に記載の幼児語彙発達データベース作成装置。 The fraud detection means selects an arbitrary number of the word information for each user in ascending order of the acquired age;
Means for recognizing the user's word information group as fraudulent information if the acquired word information group includes meaningful word information whose acquired age is before a reference value;
Means for recognizing the user's word information group as illegal information if the semantic category of each selected word information is collated and there is no word information corresponding to a noun category or daily / greeting category;
By referring to the semantic category of each selected word information, the ratio of the word information corresponding to the noun category and the word information belonging to the verb category is calculated, and the ratio is outside the range of the predetermined index. If there is, means for recognizing the user's word information group as illegal information,
The infant vocabulary development database creation device according to any one of claims 5 and 6, characterized by comprising:
有効と認められた単語情報群の個数が、事前設定の基準個数を超えていなければ、該単語情報群の信頼性を否定する手段と、
を備えることを特徴とする請求項5〜7のいずれか1項に記載の幼児語彙発達データベース作成装置。 The reliability determination means is a means for checking the reliability of each word information recognized as valid by checking the average acquired age for each word with a month dictionary summarizing acquired age for each word;
If the number of word information groups recognized as valid does not exceed a preset reference number, means for denying the reliability of the word information groups;
The infant vocabulary development database creation device according to any one of claims 5 to 7, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009161592A JP5371589B2 (en) | 2009-07-08 | 2009-07-08 | Infant vocabulary development database creation method, infant vocabulary development database creation device, infant vocabulary development database creation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009161592A JP5371589B2 (en) | 2009-07-08 | 2009-07-08 | Infant vocabulary development database creation method, infant vocabulary development database creation device, infant vocabulary development database creation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011018155A true JP2011018155A (en) | 2011-01-27 |
JP5371589B2 JP5371589B2 (en) | 2013-12-18 |
Family
ID=43595907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009161592A Active JP5371589B2 (en) | 2009-07-08 | 2009-07-08 | Infant vocabulary development database creation method, infant vocabulary development database creation device, infant vocabulary development database creation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5371589B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013254272A (en) * | 2012-06-05 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | Understood word moon age table generation device, object age estimation device, method and program |
CN103544393A (en) * | 2013-10-23 | 2014-01-29 | 北京师范大学 | Method for tracking development of language abilities of children |
JP2014038457A (en) * | 2012-08-15 | 2014-02-27 | Nippon Telegr & Teleph Corp <Ntt> | Infant vocabulary comprehension period estimating device, method and program |
JP2014153601A (en) * | 2013-02-12 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | Device for evaluating difficulty degree of infant vocabulary comprehension, infant vocabulary retrieval device, and infant vocabulary classification device, and method and program for the devices |
JP2019012382A (en) * | 2017-06-30 | 2019-01-24 | 日本電信電話株式会社 | Document search apparatus, word presentation apparatus, and method and program thereof |
JP2020115197A (en) * | 2019-01-18 | 2020-07-30 | 日本電信電話株式会社 | Vocabulary development index estimation device, vocabulary development index estimation method, program |
JP2022087151A (en) * | 2019-01-18 | 2022-06-09 | 日本電信電話株式会社 | Vocabulary development index estimation device, vocabulary development index estimation method, program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002055592A (en) * | 2000-05-31 | 2002-02-20 | People Co Ltd | Foreign language's word phoneme discriminating field forming method, foreign language's word phoneme discriminating field forming device, foreign language's word phoneme discriminating field forming system and foreign language's word phoneme discriminating field forming program |
JP2007087361A (en) * | 2005-09-22 | 2007-04-05 | Hiroshi Nagai | Information providing system |
-
2009
- 2009-07-08 JP JP2009161592A patent/JP5371589B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002055592A (en) * | 2000-05-31 | 2002-02-20 | People Co Ltd | Foreign language's word phoneme discriminating field forming method, foreign language's word phoneme discriminating field forming device, foreign language's word phoneme discriminating field forming system and foreign language's word phoneme discriminating field forming program |
JP2007087361A (en) * | 2005-09-22 | 2007-04-05 | Hiroshi Nagai | Information providing system |
Non-Patent Citations (4)
Title |
---|
CSNG200100530006; 白井 英俊: '言語獲得研究における言語データベースとツール環境' 第27回 言語・音声理解と対話処理研究会 (SIG-SLUD-9902) 第29-34ページ, 19991014, 社団法人人工知能学会 * |
JPN6013012048; 白井 英俊: '言語獲得研究における言語データベースとツール環境' 第27回 言語・音声理解と対話処理研究会 (SIG-SLUD-9902) 第29-34ページ, 19991014, 社団法人人工知能学会 * |
JPN6013033527; japan.internet.com 編集部: '言語発達過程を解析表示「こども語辞書」を公開、NTT・NTT レゾナント' インターネット , 20080205 * |
JPN6013033528; '幼児の言語発達過程を解析表示する「こども語辞書」をサイト上で公開' インターネット , 20080131, 日本電信電話株式会社 NTTレゾナント株式会社 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013254272A (en) * | 2012-06-05 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | Understood word moon age table generation device, object age estimation device, method and program |
JP2014038457A (en) * | 2012-08-15 | 2014-02-27 | Nippon Telegr & Teleph Corp <Ntt> | Infant vocabulary comprehension period estimating device, method and program |
JP2014153601A (en) * | 2013-02-12 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | Device for evaluating difficulty degree of infant vocabulary comprehension, infant vocabulary retrieval device, and infant vocabulary classification device, and method and program for the devices |
CN103544393A (en) * | 2013-10-23 | 2014-01-29 | 北京师范大学 | Method for tracking development of language abilities of children |
JP2019012382A (en) * | 2017-06-30 | 2019-01-24 | 日本電信電話株式会社 | Document search apparatus, word presentation apparatus, and method and program thereof |
JP2020115197A (en) * | 2019-01-18 | 2020-07-30 | 日本電信電話株式会社 | Vocabulary development index estimation device, vocabulary development index estimation method, program |
JP2022087151A (en) * | 2019-01-18 | 2022-06-09 | 日本電信電話株式会社 | Vocabulary development index estimation device, vocabulary development index estimation method, program |
JP7097026B2 (en) | 2019-01-18 | 2022-07-07 | 日本電信電話株式会社 | Vocabulary development index estimation device, vocabulary development index estimation method, program |
JP7213509B2 (en) | 2019-01-18 | 2023-01-27 | 日本電信電話株式会社 | Vocabulary development index estimation device, vocabulary development index estimation method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP5371589B2 (en) | 2013-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rathje et al. | GPT is an effective tool for multilingual psychological text analysis | |
Caldarini et al. | A literature survey of recent advances in chatbots | |
US9836511B2 (en) | Computer-generated sentiment-based knowledge base | |
CN105408890B (en) | Performing operations related to listing data based on voice input | |
US8452772B1 (en) | Methods, systems, and articles of manufacture for addressing popular topics in a socials sphere | |
US20220405484A1 (en) | Methods for Reinforcement Document Transformer for Multimodal Conversations and Devices Thereof | |
JP5371589B2 (en) | Infant vocabulary development database creation method, infant vocabulary development database creation device, infant vocabulary development database creation program | |
Bednarek et al. | Computer-assisted digital text analysis for journalism and communications research: introducing corpus linguistic techniques that do not require programming | |
US9710829B1 (en) | Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities | |
Chan et al. | Reproducible extraction of cross-lingual topics (rectr) | |
Rianto et al. | Improving the accuracy of text classification using stemming method, a case of non-formal Indonesian conversation | |
KR101540683B1 (en) | Method and server for classifying emotion polarity of words | |
Lazarski et al. | Using nlp for fact checking: A survey | |
Eika et al. | Assessing the reading level of web texts for WCAG2. 0 compliance—can it be done automatically? | |
Zeng | Evaluation and enhancement of web content accessibility for persons with disabilities | |
Mehrbod et al. | Tender calls search using a procurement product named entity recogniser | |
Mutiara et al. | Improving the accuracy of text classification using stemming method, a case of non-formal Indonesian conversation | |
Ahiladas et al. | Ruchi: Rating individual food items in restaurant reviews | |
GB2572320A (en) | Hate speech detection system for online media content | |
Alfraidi et al. | The Saudi novel corpus: Design and compilation | |
Temel et al. | Quality and readability of online information on cerebral palsy | |
EP3704660A1 (en) | Techniques for ranking posts in community forums | |
Lee et al. | Trustsql: A reliability benchmark for text-to-sql models with diverse unanswerable questions | |
US20120197894A1 (en) | Apparatus and method for processing documents to extract expressions and descriptions | |
Bobicev et al. | Can anonymous posters on medical forums be reidentified? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5371589 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |