JP6807909B2 - データ評価方法、装置、機器及び読み取り可能な記憶媒体 - Google Patents
データ評価方法、装置、機器及び読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP6807909B2 JP6807909B2 JP2018208620A JP2018208620A JP6807909B2 JP 6807909 B2 JP6807909 B2 JP 6807909B2 JP 2018208620 A JP2018208620 A JP 2018208620A JP 2018208620 A JP2018208620 A JP 2018208620A JP 6807909 B2 JP6807909 B2 JP 6807909B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- data
- result
- waiting
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 77
- 238000011157 data evaluation Methods 0.000 title claims description 41
- 238000011156 evaluation Methods 0.000 claims description 625
- 238000013210 evaluation model Methods 0.000 claims description 220
- 238000012795 verification Methods 0.000 claims description 100
- 238000012549 training Methods 0.000 claims description 37
- 230000008569 process Effects 0.000 claims description 33
- 238000010200 validation analysis Methods 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 32
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012854 evaluation process Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Description
データ評価方法であって、
第1評価待ちデータを取得し、
評価モデルに基づき、前記第1評価待ちデータを評価することで、第1評価結果を得て、前記評価モデルは第1較正データに基づきトレーニングすることで得られて、前記第1較正データには専門家が第2評価待ちデータに対する評価結果が含まれ、
前記第1評価結果が設定された結果収束条件を満たしていなければ、第2較正データを取得するとともに、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定するまでに、前記第2較正データにより、前記評価モデルを反復更新し、前記第2較正データには専門家が第3評価待ちデータに対する評価結果が含まれ、
最新の評価モデルに基づき、データ評価を行う。
現在の更新後の評価モデルにより、プリセットの検証セットにおいて検証を行って、検証結果を得ることと、
検証結果が設定された検証結果収束条件を満たしていると確定すると、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することと、を含む。
検証結果として、現在の更新後の評価モデルが検証セット内の検証サンプルに対する予測結果を取得することを含み、
前記検証結果が設定された検証結果収束条件を満たしていると確定すると、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することは、
前記検証サンプルのマーク結果を基準として、前記検証サンプルの予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定すること、
または、
前の評価モデルが前記検証サンプルに対する予測結果を参照し、現在の更新後の評価モデルが前記検証サンプルに対する予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することを含む。
汎用評価モデルの評価待ちデータに対する第2評価結果、及び人工評価主体の前記評価待ちデータに対する第3評価結果を取得することと、
各々の人工評価主体の前記評価待ちデータに対する第3評価結果、及び前記評価待ちデータの第2評価結果に応じて、各々の前記人工評価主体から、前記専門家を確定することと、
前記専門家により評価された評価待ちデータから、前記第1較正データと前記第2較正データを確定することと、を含む。
前記第2評価結果を参照し、前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択することを含み、
人工評価主体の前記評価待ちデータに対する第3評価結果を取得することは、
人工評価主体の前記目標評価待ちデータに対する第3評価結果を取得することを含む。
各々の前記評価待ちデータの第2評価得点または第2評価レベルを参照し、正規分布のサンプリング方式に従って、各々の前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択することを含む。
各々の人工評価主体の前記評価待ちデータに対する第3評価結果、及び前記評価待ちデータの第2評価結果に応じて、前記第3評価結果と前記第2評価結果との関連性を算出することと、
前記専門家として、関連性が設定関連性条件を満たしている第3評価結果に対応する人工評価主体を選択することと、を含む。
前記第1評価サブモデルは、評価待ち音声の音響特徴を評価特徴として、評価待ち音声のマーク評価結果をラベルとして、ニューラルネットワークモデルをトレーニングすることで得られて、
前記第2評価サブモデルは、評価待ち音声の識別結果に対応するテキスト特徴を評価特徴として、評価待ち音声のマーク評価結果をラベルとして、畳み込みニューラルネットワークモデルをトレーニングすることで得られて、
前記第3評価サブモデルは、評価待ち音声の識別結果に対応するテキスト特徴を評価特徴として、評価待ち音声のマーク評価結果をラベルとして、再帰型ニューラルネットワークモデルをトレーニングすることで得られてる。
第1評価待ちデータを取得するための第1評価待ちデータ取得手段と、
評価モデルに基づき、前記第1評価待ちデータを評価することで、第1評価結果を得るための第1評価結果取得手段と、
前記第1評価結果が設定された結果収束条件を満たしていなければ、第2較正データを取得するための第2較正データ取得手段と、
現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定するまでに、前記第2較正データにより、前記評価モデルを反復更新するためのモデル更新手段と、
最新の評価モデルに基づき、データ評価を行うためのモデル評価手段と、を備え、
前記評価モデルは、第1較正データに基づきトレーニングすることで得られて、前記第1較正データには、専門家が第2評価待ちデータに対する評価結果が含まれ、前記第2較正データには、専門家が第3評価待ちデータに対する評価結果が含まれる。
現在の更新後の評価モデルにより、プリセットの検証セットにおいて検証を行って、検証結果を得ることと、
検証結果が設定された検証結果収束条件を満たしていると確定すれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することと、を含む。
検証結果として、現在の更新後の評価モデルの検証セット内の検証サンプルに対する予測結果を取得することを含み、
前記モデル更新手段により検証結果が設定された検証結果収束条件を満たしていると確定すれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定する過程は、
前記検証サンプルのマーク結果を基準として、前記検証サンプルの予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定すること、
または、
前の評価モデルの前記検証サンプルに対する予測結果を参照し、現在の更新後の評価モデルが前記検証サンプルに対する予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することを含む。
汎用評価モデルの評価待ちデータに対する第2評価結果を取得するための第2評価結果取得手段と、
人工評価主体の前記評価待ち音声に対する第3評価結果を取得するための第3評価結果取得手段と、
各々の人工評価主体の前記評価待ちデータに対する第3評価結果、及び前記評価待ちデータの第2評価結果に応じて、各々の前記人工評価主体から前記専門家を確定するための専門家確定手段と、
前記専門家により評価された評価待ちデータから、前記第2較正データを確定するため
の第2較正データ確定手段と、を備える。
前記汎用評価モデルの評価待ちデータに対する第2評価結果を取得した後に、前記第2評価結果を参照し、前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択するための目標評価待ちデータ選択手段を備え、
前記第3評価結果取得手段により人工評価主体の前記評価待ち音声に対する第3評価結果を取得する過程は、
人工評価主体の前記目標評価待ちデータに対する第3評価結果を取得することを含む。
各々の前記評価待ちデータの第2評価得点または第2評価レベルを参照し、正規分布のサンプリング方式に従って、各々の前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択するための正規分布サンプリング手段を備える。
各々の人工評価主体の前記評価待ちデータに対する第3評価結果、及び前記評価待ちデータの第2評価結果に応じて、前記第3評価結果と前記第2評価結果との関連性を算出するための関連性算出手段と、
前記専門家として、関連性が設定関連性条件を満たしている第3評価結果に対応する人工評価主体を選択するための関連性スクリーニング手段と、を備える。
プログラムを記憶するためのメモリと、
上記記載のデータ評価方法の各ステップを実現するように、前記プログラムを実行するためのプロセッサーと、を備える。
明らかに、以下に説明する図面は、本出願の実施例のみであり、当業者にとって、進歩性に値する労働をしない前提で、提供される図面に応じて、他の図面を取得できる。
第1評価待ちデータを取得するステップS100を含む。
まずは、専門家により評価された300分の較正データを取得し、該300分の較正データにより評価モデルをトレーニングし、トレーニングされた第1評価モデルを得る。さらに、評価待ちデータから、100分の評価待ちデータを取得し、第1評価モデルにより、100分の評価待ちデータを評価し、第1評価結果を得る。第1評価結果が設定された結果収束条件を満たしているかどうかを確定し、満たしていなければ、さらに専門家により評価された他の300分の較正データを取得するとともに、新たに取得された300分の較正データにより、第1評価モデルを反復トレーニングし、トレーニングされた第2評価モデルを得る。第2評価モデルが設定されたモデル更新停止条件を満たしているかどうかを判定し、NOであれば、専門家により評価された新たな較正データを継続的に取得し、及び評価モデルを継続的に反復トレーニングし検証し、YESであれば、トレーニングされた評価モデルが十分に優秀になり、最新の評価モデルとして利用することができることを示し、そして、専門家に評価待ちデータに対する評価を停止させることができる。
第1評価サブモデルであって、
第1評価サブモデルは、評価待ち音声の音響特徴を評価特徴として、評価待ち音声のマーク評価結果をラベルとして、ニューラルネットワークモデルをトレーニングすることで得られる。
第2評価サブモデルは、評価待ち音声の識別結果に対応するテキスト特徴を評価特徴として、評価待ち音声のマーク評価結果をラベルとして、畳み込みニューラルネットワークモデルをトレーニングすることで得られる。
第3評価サブモデルは、評価待ち音声の識別結果に対応するテキスト特徴を評価特徴として、評価待ち音声のマーク評価結果をラベルとして、再帰型ニューラルネットワークモデルをトレーニングすることで得られる。
検証結果として、現在の更新後の評価モデルが検証セット内の検証サンプルに対する予測結果を取得することを含んでもよい。
前記検証サンプルのマーク結果を基準として、前記検証サンプルの予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することを含んでもよい。
前の評価モデルが前記検証サンプルに対する予測結果を参照し、現在の更新後の評価モデルが前記検証サンプルに対する予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルがモデル停止更新条件を満たしていると確定することを含んでもよい。
Part1:試験音声の纏まり及び人工による較正専門家の選定。
口頭試験内容において、一部の問題タイプは音声評価モデルにより採点でき、例えば、朗読問題などであり、また、一部の自由開放性の問題タイプが存在し、該部分の問題タイプは音声評価モデルによる採点効果が理想ではないから、人工による採点を必要とする。ここで、第2バッチの採点専門家は、主に当該部分の音声評価モデルによる採点効果が理想ではない問題タイプに対して、人工の評価採点を行う。また、音声評価モデルにより採点可能な問題タイプに対して、前のステップにおいてトレーニング後の音声評価モデルにより評価し採点する。
1、Part1のステップにおいて、人工により較正専門家を選定する必要が有るから、人工経験の影響を受けやすくて、選択される較正専門家の専門能力が不均一である恐れがあり、さらに、較正専門家により評価される試験音声をトレーニングデータとしてトレーニングされる口頭試験評価モデルにも偏差が発生し、最終の評価の正確度に影響する恐れがある。
S1で、汎用評価モデルが評価待ちデータに対する第2評価結果、及び人工評価主体が前記評価待ちデータに対する第3評価結果を取得する。
Part1:試験音声の纏まり。
得る。
まずは、評価待ち音声の識別結果及び評価特徴を取得することができる。
第1種類:
評価特徴として、評価待ち音声の音響特徴を抽出し、主に発音の正確性、流暢性、完全性が含まれる。さらに、履歴経験データと人工マーク結果で、音声評価モデルを予めトレーニングし、該音声評価モデルはSVM(Support Vector Machine、サポートベクターマシン)、LR(Logistic Regression、ロジスティック回帰)などの構成であってもよい。
評価特徴として、評価待ち音声の識別結果からテキスト特徴を抽出してもよい。受験生の言語表現水準を音声評価モデルの出力目標として、口頭試験の範囲にある言語組織水準レベル分類による音声評価モデルを設計し、モデルが評価待ち音声の識別結果に基づき、受験生の言語水準能力を分析し、受験生の口頭水準レベルを判定できる。
評価特徴として、評価待ち音声の識別結果からテキスト特徴を抽出してもよい。音声評価モデルはRNN再帰型ニューラルネットワークを採用してもよく、それはテキストのシーケンスセマンティクスとロジック情報を抽出できるから、受験生のテキスト理解に適切である。
前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択する。
人工評価主体が前記目標評価待ちデータに対する第3評価結果を取得することを含む。
前記第2評価結果を参照し、前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択することを含んでもよい。
各々評価待ちデータの第2評価レベルには、合計にn個のレベルが含まれる。そうすると、第2評価レベルの正規分布のサンプリング方式に従って、各々評価待ちデータから、目標評価待ちデータを抽出し、最終に抽出された目標評価待ちデータにおいて、レベル軸の両端レベルにあるデータが少なくて、レベル軸の中間レベルの区間にあるデータが多い。
分布の抽出方式に従って、目標評価待ちデータを抽出することは、全体の受験生をよくカバーすることができ、トレーニングサンプルをより均衡にする。
まずは、各々の人工評価主体が前記評価待ちデータに対する第3評価結果、及び前記評価待ちデータの第2評価結果に応じて、前記第3評価結果と前記第2評価結果との関連性を算出する。
第1評価待ちデータを取得するための第1評価待ちデータ取得手段11と、
評価モデルに基づき、前記第1評価待ちデータを評価することで、第1評価結果を得るための第1評価結果取得手段12と、
前記第1評価結果が設定された結果収束条件を満たしていなければ、第2較正データを取得するための第2較正データ取得手段13と、
現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定するまでに、前記第2較正データにより、前記評価モデルを反復更新するためのモデル更新手
段14と、
最新の評価モデルに基づきデータ評価を行うためのモデル評価手段15と、を備え、
前記評価モデルは第1較正データに基づきトレーニングすることで得られて、前記第1較正データには専門家が第2評価待ちデータに対する評価結果が含まれ、前記第2較正データには専門家が第3評価待ちデータに対する評価結果が含まれる。
現在の更新後の評価モデルにより、プリセットの検証セットにおいて検証を行って、検証結果を得ることと、
検証結果が設定された検証結果収束条件を満たしていると確定すれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することと、を含む。
検証結果として、現在の更新後の評価モデルが検証セット内の検証サンプルに対する予測結果を取得することを含み、
前記モデル更新手段により、検証結果が設定された検証結果収束条件を満たしていると確定すれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定する過程は、
前記検証サンプルのマーク結果を基準として、前記検証サンプルの予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定すること、
または、
前の評価モデルが前記検証サンプルに対する予測結果を参照し、現在の更新後の評価モデルが前記検証サンプルに対する予測結果が設定された検証結果収束条件を満たしているかどうかを判定し、YESであれば、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することを含む。
汎用評価モデルが評価待ちデータに対する第2評価結果を取得するための第2評価結果取得手段と、
人工評価主体が前記評価待ちデータに対する第3評価結果を取得するための第3評価結果取得手段と、
各々の人工評価主体が前記評価待ちデータに対する第3評価結果、及び前記評価待ちデータの第2評価結果に応じて、前記各々の人工評価主体から前記専門家を確定するための専門家確定手段と、
前記専門家により評価された評価待ちデータから、前記第2較正データを確定するための第2較正データ確定手段と、を備える。
前記汎用評価モデルが評価待ちデータに対する第2評価結果を取得した後に、前記第2評価結果を参照し、前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択するための目標評価待ちデータ選択手段を備える。これに基づき、前記第3評価結果取得手段により人工評価主体が前記評価待ちデータ対する第3評価結果を取得する過程は、
人工評価主体が前記目標評価待ちデータに対する第3評価結果を取得することを含んでもよい。
記目標評価待ちデータ選択手段は、
各々前記評価待ちデータの第2評価得点または第2評価レベルを参照し、正規分布のサンプリング方式に従って、各々前記評価待ちデータから、人工評価の対象としての目標評価待ちデータを選択するための正規分布サンプリング手段を含んでもよい。
各々の人工評価主体が前記評価待ちデータに対する第3評価結果、及び前記評価待ちデータの第2評価結果に応じて、前記第3評価結果と前記第2評価結果との関連性を算出するための関連性算出手段と、
前記専門家として、関連性が設定関連性条件を満たしている第3評価結果に対応する人工評価主体を選択するための関連性スクリーニング手段と、を備える。
本出願の実施例において、プロセッサー1、通信インターフェース2、メモリ3、通信バス4の数は少なくとも一つであり、且つプロセッサー1、通信インターフェース2、メモリ3は通信バス4により、互いの通信を完成し、
プロセッサー1は、中央演算処理装置CPUまたは特定用途向け集積回路ASIC(Application Specific Integrated Circuit)、
または、本発明の実施例を実施するように配置される一つまたは複数の集積回路などのものである可能性があり、
メモリ3には、高速RAMメモリ、また不揮発性メモリ(non−volatilememory)など、例えば、少なくとも一つのディスクメモリが含まれる可能性があり、
メモリにはプログラムが記憶され、プロセッサーはメモリに記憶されるプログラムを呼び出すことができ、前記プログラムは、
第1評価待ちデータを取得し、
評価モデルに基づき、前記第1評価待ちデータを評価することで、第1評価結果を得て、前記評価モデルは第1較正データに基づきトレーニングすることで得られて、前記第1較正データには専門家の第2評価待ちデータに対する評価結果が含まれ、
前記第1評価結果が設定された結果収束条件を満たしていなければ、第2較正データを取得するとともに、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定するまでに、前記第2較正データにより、前記評価モデルを反復更新し、前記第2較正データには専門家の第3評価待ちデータに対する評価結果が含まれ、
最新の評価モデルに基づき、データ評価を行う。
第1評価待ちデータを取得し、
評価モデルに基づき、前記第1評価待ちデータを評価することで、第1評価結果を得て、前記評価モデルは第1較正データに基づきトレーニングすることで得られて、前記第1較正データには専門家の第2評価待ちデータに対する評価結果が含まれ、
前記第1評価結果が設定された結果収束条件を満たしていなければ、第2較正データを取得するとともに、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たし
ていると確定するまでに、前記第2較正データにより、前記評価モデルを反復更新し、前記第2較正データには専門家の第3評価待ちデータに対する評価結果が含まれ、
最新の評価モデルに基づき、データ評価を行う。
Claims (18)
- 評価待ちデータのデータ評価方法であって、
評価待ちデータの母集団から第1評価待ちデータを取得し、
評価モデルに基づき、前記第1評価待ちデータを評価することで、第1評価結果を得て、前記評価モデルは第1較正データに基づきトレーニングすることで得られ、前記第1較正データには人手評価を行う専門家による前記評価待ちデータの母集団から抽出された一定数の第2評価待ちデータに対する評価結果が含まれ、
前記第1評価結果が設定された評価結果収束条件を満たしていなければ、第2較正データを取得するとともに、現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定するまで、前記第2較正データにより、前記評価モデルを反復更新し、前記第2較正データには人手評価を行う専門家による前記評価待ちデータの母集団から抽出された一定数の第3評価待ちデータに対する評価結果が含まれ、
最新の評価モデルに基づき、データ評価を行うことを含むことを特徴とする方法。 - 前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定する過程は、
前記現在の更新後の評価モデルにより、プリセットの検証セットにおいて検証を行って、検証結果を得ることと、
前記検証結果が設定された検証結果収束条件を満たしていると確定すると、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することと、を含むことを特徴とする請求項1に記載の方法。 - 前記現在の更新後の評価モデルにより、プリセットの検証セットにおいて検証を行って、前記検証結果を得ることは、
前記検証結果として、前記現在の更新後の評価モデルが検証セット内の検証サンプルに対する予測結果を取得することを含み、
前記検証結果が設定された前記検証結果収束条件を満たしていると確定すると、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することは、
前記検証サンプルの事前にマークされた人手評価結果であるマーク評価結果を基準として、前記検証サンプルの予測結果が設定された前記検証結果収束条件を満たしているかどうかを判定し、YESであれば、前記現在の更新後の評価モデルが設定されたモデル更新
停止条件を満たしていると確定すること、
または、
前の評価モデルが前記検証サンプルに対する予測結果を参照し、前記現在の更新後の評価モデルが前記検証サンプルに対する予測結果が設定された前記検証結果収束条件を満たしているかどうかを判定し、YESであれば、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することを含むことを特徴とする請求項2に記載の方法。 - 前記第1較正データと前記第2較正データを取得する過程は、
汎用評価モデルによる評価待ちデータの母集団における各データに対する第2評価結果、及び人手評価を行う人手評価主体による前記評価待ちデータの母集団における各データに対する第3評価結果を取得することと、
各々の前記人手評価主体による前記評価待ちデータの母集団における各データに対する前記第3評価結果、及び前記評価待ちデータの母集団における各データの前記第2評価結果に応じて、各々の前記人手評価主体から、前記専門家を確定することと、
前記専門家により評価された前記評価待ちデータの母集団から、前記第1較正データと前記第2較正データを確定することと、を含むことを特徴とする請求項1に記載の方法。 - 前記汎用評価モデルによる前記評価待ちデータの母集団における各データに対する前記第2評価結果を取得した後、さらに、
前記第2評価結果を参照し、前記評価待ちデータの母集団から、人手評価の対象としての目標評価待ちデータを選択することを含み、
前記人手評価主体による前記評価待ちデータの母集団における各データに対する前記第3評価結果を取得することは、
前記人手評価主体による前記目標評価待ちデータに対する前記第3評価結果を取得することを含むことを特徴とする請求項4に記載の方法。 - 前記第2評価結果は、第2評価得点または第2評価レベルであり、
前記第2評価結果を参照し、前記評価待ちデータの母集団から、人手評価の対象としての前記目標評価待ちデータを選択することは、
前記評価待ちデータの母集団における各データの第2評価得点または第2評価レベルを参照し、正規分布のサンプリング方式に従って、各々の前記評価待ちデータの母集団から、人手評価の対象としての前記目標評価待ちデータを選択することを含むことを特徴とする請求項5に記載の方法。 - 各々の前記人手評価主体による前記評価待ちデータの母集団における各データに対する前記第3評価結果、及び前記評価待ちデータの母集団における各データの前記第2評価結果に応じて、各々の前記人手評価主体から前記専門家を確定することは、
各々の前記人手評価主体による前記評価待ちデータの母集団における各データに対する前記第3評価結果、及び前記評価待ちデータの母集団における各データの前記第2評価結果に応じて、前記第3評価結果と前記第2評価結果との関連性を算出することと、
前記専門家として、関連性が設定関連性条件を満たしている前記第3評価結果に対応する前記人手評価主体を選択することと、を含むことを特徴とする請求項4に記載の方法。 - 前記第2評価待ちデータと前記第3評価待ちデータは、評価待ち音声であり、前記評価モデルには、第1評価サブモデル、第2評価サブモデル、第3評価サブモデルのうちの、少なくとも一つが含まれ、
前記第1評価サブモデルは、評価待ち音声の音響特徴を評価特徴として、評価待ち音声の事前にマークされた人手評価結果であるマーク評価結果をラベルとして、ニューラルネットワークモデルをトレーニングすることで得られて、
前記第2評価サブモデルは、評価待ち音声の識別結果に対応するテキスト特徴を評価特徴として、評価待ち音声の前記マーク評価結果をラベルとして、畳み込みニューラルネットワークモデルをトレーニングすることで得られて、
前記第3評価サブモデルは、評価待ち音声の識別結果に対応するテキスト特徴を評価特徴として、評価待ち音声の前記マーク評価結果をラベルとして、再帰型ニューラルネットワークモデルをトレーニングすることで得られることを特徴とする請求項1に記載の方法。 - 評価待ちデータのデータ評価装置であって、
評価待ちデータの母集団から第1評価待ちデータを取得するための第1評価待ちデータ取得手段と、
評価モデルに基づき、前記第1評価待ちデータを評価することで、第1評価結果を得るための第1評価結果取得手段と、
前記第1評価結果が設定された評価結果収束条件を満たしていなければ、第2較正データを取得するための第2較正データ取得手段と、
現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定するまで、前記第2較正データにより、前記評価モデルを反復更新するためのモデル更新手段と、
最新の評価モデルに基づき、データ評価を行うためのモデル評価手段と、を備え、
前記評価モデルは、第1較正データに基づきトレーニングすることで得られて、前記第1較正データには、人手評価を行う専門家による前記評価待ちデータの母集団から抽出された一定数の第2評価待ちデータに対する評価結果が含まれ、前記第2較正データには、人手評価を行う専門家による前記評価待ちデータの母集団から抽出された一定数の第3評価待ちデータに対する評価結果が含まれることを特徴とする装置。 - 前記モデル更新手段が、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定する過程は、
前記現在の更新後の評価モデルにより、プリセットの検証セットにおいて検証を行って、検証結果を得ることと、
前記検証結果が設定された検証結果収束条件を満たしていると確定すれば、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することと、を含むことを特徴とする請求項9に記載の装置。 - 前記モデル更新手段が、前記現在の更新後の評価モデルにより、プリセットの検証セットにおいて検証を行って、前記検証結果を得る過程は、
前記検証結果として、前記現在の更新後の評価モデルが検証セット内の検証サンプルに対する予測結果を取得することを含み、
前記モデル更新手段により前記検証結果が設定された前記検証結果収束条件を満たしていると確定すれば、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定する過程は、
前記検証サンプルの事前にマークされた人手評価結果であるマーク評価結果を基準として、前記検証サンプルの予測結果が設定された前記検証結果収束条件を満たしているかどうかを判定し、YESであれば、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定すること、
または、
前の評価モデルが前記検証サンプルに対する予測結果を参照し、前記現在の更新後の評価モデルが前記検証サンプルに対する予測結果が設定された前記検証結果収束条件を満たしているかどうかを判定し、YESであれば、前記現在の更新後の評価モデルが設定されたモデル更新停止条件を満たしていると確定することを含むことを特徴とする請求項10に記載の装置。 - 前記第2較正データ取得手段は、
汎用評価モデルによる評価待ちデータの母集団における各データに対する第2評価結果を取得するための第2評価結果取得手段と、
人手評価を行う人手評価主体による前記評価待ちデータの母集団における各データに対する第3評価結果を取得するための第3評価結果取得手段と、
各々の前記人手評価主体による前記評価待ちデータの母集団における各データに対する前記第3評価結果、及び前記評価待ちデータの母集団における各データの前記第2評価結果に応じて、各々の前記人手評価主体から前記専門家を確定するための専門家確定手段と、
前記専門家により評価された前記評価待ちデータの母集団から、前記第2較正データを確定するための第2較正データ確定手段と、を備えることを特徴とする請求項9に記載の装置。 - さらに、
前記汎用評価モデルによる前記評価待ちデータの母集団における各データに対する前記第2評価結果を取得した後に、前記第2評価結果を参照し、前記評価待ちデータの母集団から、人手評価の対象としての目標評価待ちデータを選択するための目標評価待ちデータ選択手段を備え、
前記第3評価結果取得手段により前記人手評価主体による前記評価待ちデータ対する前記第3評価結果を取得する過程は、
前記人手評価主体の前記目標評価待ちデータに対する前記第3評価結果を取得することを含むことを特徴とする請求項12に記載の装置。 - 前記第2評価結果は、第2評価得点または第2評価レベルであり、
前記目標評価待ちデータ選択手段は、
前記評価待ちデータの母集団における各データの第2評価得点または第2評価レベルを参照し、正規分布のサンプリング方式に従って、各々の前記評価待ちデータの母集団から、人手評価の対象としての前記目標評価待ちデータを選択するための正規分布サンプリング手段を備えることを特徴とする請求項13に記載の装置。 - 前記専門家確定手段は、
各々の前記人手評価主体による前記評価待ちデータの母集団における各データに対する前記第3評価結果、及び前記評価待ちデータの母集団における各データの前記第2評価結果に応じて、前記第3評価結果と前記第2評価結果との関連性を算出するための関連性算出手段と、
前記専門家として、関連性が設定関連性条件を満たしている前記第3評価結果に対応する前記人手評価主体を選択するための関連性スクリーニング手段と、を備えることを特徴とする請求項12に記載の装置。 - データ評価機器であって、
プログラムを記憶するためのメモリと、
請求項1〜8のいずれか一項に記載のデータ評価方法の各ステップを実現するように、前記プログラムを実行するためのプロセッサーと、を備えることを特徴とする機器。 - コンピュータプログラムが記憶される読み取り可能な記憶媒体であって、前記コンピュータプログラムがプロセッサーにより実行される際に、請求項1〜8のいずれか一項に記載のデータ評価方法の各ステップを実現することを特徴とする読み取り可能な記憶媒体。
- 請求項1〜8のいずれか1項に記載のデータ評価方法をコンピュータに実行させるため
のコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811099474.0 | 2018-09-20 | ||
CN201811099474.0A CN109273023B (zh) | 2018-09-20 | 2018-09-20 | 一种数据评测方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020047234A JP2020047234A (ja) | 2020-03-26 |
JP6807909B2 true JP6807909B2 (ja) | 2021-01-06 |
Family
ID=65197712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018208620A Active JP6807909B2 (ja) | 2018-09-20 | 2018-11-06 | データ評価方法、装置、機器及び読み取り可能な記憶媒体 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6807909B2 (ja) |
CN (1) | CN109273023B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069783B (zh) * | 2019-04-30 | 2023-05-30 | 科大讯飞股份有限公司 | 一种答题内容评测方法及装置 |
CN110600006B (zh) * | 2019-10-29 | 2022-02-11 | 福建天晴数码有限公司 | 一种语音识别的评测方法及系统 |
CN111881008B (zh) * | 2019-12-18 | 2021-12-24 | 马上消费金融股份有限公司 | 一种数据评测、模型训练方法、装置、设备及存储介质 |
CN111105813B (zh) * | 2019-12-31 | 2022-09-02 | 科大讯飞股份有限公司 | 朗读评分方法、装置、设备及可读存储介质 |
CN113539246B (zh) * | 2021-08-20 | 2022-10-18 | 贝壳找房(北京)科技有限公司 | 语音识别方法和装置 |
CN117116253B (zh) * | 2023-10-23 | 2024-01-12 | 摩尔线程智能科技(北京)有限责任公司 | 初始模型的训练方法、装置、语音识别方法及装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1340075B1 (en) * | 2000-10-20 | 2009-01-28 | Virco Bvba | Establishment of biological cut-off values for predicting resistance to therapy |
JP2004326200A (ja) * | 2003-04-21 | 2004-11-18 | Mitsubishi Heavy Ind Ltd | 自動機械、機械の自動運転システム、及び、機械の自動運転方法 |
CN103559894B (zh) * | 2013-11-08 | 2016-04-20 | 科大讯飞股份有限公司 | 口语评测方法及系统 |
CN104978971B (zh) * | 2014-04-08 | 2019-04-05 | 科大讯飞股份有限公司 | 一种口语评测方法及系统 |
CN104464423A (zh) * | 2014-12-19 | 2015-03-25 | 科大讯飞股份有限公司 | 一种口语考试评测的校标优化方法及系统 |
CN105336342B (zh) * | 2015-11-17 | 2019-05-28 | 科大讯飞股份有限公司 | 语音识别结果评价方法及系统 |
AU2017324627B2 (en) * | 2016-09-07 | 2019-12-05 | Elekta, Inc. | System and method for learning models of radiotherapy treatment plans to predict radiotherapy dose distributions |
US10887324B2 (en) * | 2016-09-19 | 2021-01-05 | Ntt Research, Inc. | Threat scoring system and method |
KR20180071029A (ko) * | 2016-12-19 | 2018-06-27 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
CN107958673B (zh) * | 2017-11-28 | 2021-05-11 | 北京先声教育科技有限公司 | 一种口语评分方法及装置 |
-
2018
- 2018-09-20 CN CN201811099474.0A patent/CN109273023B/zh active Active
- 2018-11-06 JP JP2018208620A patent/JP6807909B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN109273023B (zh) | 2022-05-17 |
CN109273023A (zh) | 2019-01-25 |
JP2020047234A (ja) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6807909B2 (ja) | データ評価方法、装置、機器及び読み取り可能な記憶媒体 | |
CN110084271B (zh) | 一种图片类别的识别方法和装置 | |
CN108960269B (zh) | 数据集的特征获取方法、装置及计算设备 | |
CN112257966B (zh) | 模型处理方法、装置、电子设备及存储介质 | |
CN112508334A (zh) | 融合认知特性及试题文本信息的个性化组卷方法及系统 | |
CN110991195B (zh) | 机器翻译模型训练方法、装置及存储介质 | |
CN112069329B (zh) | 文本语料的处理方法、装置、设备及存储介质 | |
CN112184089B (zh) | 试题难度预测模型的训练方法、装置、设备及存储介质 | |
CN114254127A (zh) | 学生能力画像方法、学习资源推荐方法及装置 | |
CN117574201A (zh) | 基于多工业模型的模型训练方法、装置、设备和存储介质 | |
CN112700763B (zh) | 语音标注质量评价方法、装置、设备及存储介质 | |
CN110751170A (zh) | 面板质量检测方法、系统、终端设备及计算机可读介质 | |
CN116028702A (zh) | 学习资源推荐方法、系统及电子设备 | |
CN112052686B (zh) | 一种用户交互式教育的语音学习资源推送方法 | |
CN113919432A (zh) | 一种分类模型构建方法、数据分类方法及装置 | |
WO2021147405A1 (zh) | 客服语句质检方法及相关设备 | |
CN117313947A (zh) | 一种基于随机森林和金枪鱼群优化算法的学习预警方法 | |
CN114943674A (zh) | 瑕疵检测方法、电子装置及存储介质 | |
CN112017777A (zh) | 相似对问题预测的方法、装置及电子设备 | |
CN109460474B (zh) | 用户偏好趋势挖掘方法 | |
CN111507632A (zh) | 一种发展性评测的方法、装置及电子设备 | |
WO2023280229A1 (zh) | 图像处理方法、电子设备及存储介质 | |
CN112883284B (zh) | 一种基于网络和数据分析的在线学习系统及测试题推荐方法 | |
CN114925610A (zh) | 一种学习者知识结构与水平建模方法、系统、设备及终端 | |
CN113919983A (zh) | 试题画像方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190704 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6807909 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |