JP2022078060A - ラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラム - Google Patents
ラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2022078060A JP2022078060A JP2022018650A JP2022018650A JP2022078060A JP 2022078060 A JP2022078060 A JP 2022078060A JP 2022018650 A JP2022018650 A JP 2022018650A JP 2022018650 A JP2022018650 A JP 2022018650A JP 2022078060 A JP2022078060 A JP 2022078060A
- Authority
- JP
- Japan
- Prior art keywords
- labeling
- test
- data
- time
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 775
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000004590 computer program Methods 0.000 title claims abstract description 14
- 238000012360 testing method Methods 0.000 claims description 316
- 230000002547 anomalous effect Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000007717 exclusion Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3688—Test management for test execution, e.g. scheduling of test suites
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1916—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3692—Test management for test results analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3419—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
- Image Analysis (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】ラベリング能力情報の精度を向上させるラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラムを提供する。【解決手段】方法は、ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定することと201、ラベリング要件及び所定の試験ラベリング要件に基づいて試験ラベリングデータを決定することと202、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定することと203、試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトのラベリング能力情報を決定することと204、を含む。【選択図】図2
Description
本開示は、データ処理技術分野、具体的にはデータラベリング、ラベリング結果分析、ラベリングタスク割り当てなどの技術分野、特にラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラムに関する。
人工知能が様々な分野で開発されて適用されるにつれて、要件を満たすデータラベリング需要量は空前の速度で増加している。データラベリングは、構造化データを人工知能アルゴリズムに提供するプロセスであり、ラベリングプロセスは一般に、データパケットまたはプロキシを介してラベリング作業者によって完成され得る。従来の自動ラベリングモデルの実用性は、まだ要件を満たすことができない。
従って、どのようにラベリングオブジェクトのラベリング能力を決定するかは当業者の研究焦点である。
本開示の実施例は、ラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラムを提供する。
第一様態では、本開示の実施例は、ラベリング能力情報決定方法を提供する。この方法は、ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定することと、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定することと、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定し、試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトのラベリング能力情報を決定することと、を含む。
第二様態では、本開示の実施例は、ラベリング能力情報決定装置を提供する。この装置は、ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定するように構成された試験ラベリングオブジェクト決定ユニットと、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定するように構成された試験ラベリングデータ決定ユニットと、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定し、試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトのラベリング能力情報を決定するように構成された試験ラベリング時間/ラベリング能力情報決定ユニットと、を含む。
第三様態では、本開示の実施例は、電子デバイスを提供する。この電子デバイスは、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信接続されたメモリと、を含み、このメモリは、少なくとも1つのプロセッサによって実行可能な命令を記憶しており、この命令は、少なくとも1つのプロセッサが第一様態の任意の実施形態に記載のラベリング能力情報決定方法を実行できるように少なくとも1つのプロセッサによって実行される。
第四様態では、本開示の実施例は、第一様態の任意の実施形態に記載のラベリング能力情報決定方法をコンピュータに実行させるためのコンピュータ命令を記憶する非一時的なコンピュータ可読記憶媒体を提供する。
第五態様では、本開示の実施例は、プロセッサによって実行されると、第一様態の任意の実施形態に記載のラベリング能力情報決定方法を実行するコンピュータプログラムを提供する。
本開示の実施例によって提供されるラベリング能力情報決定方法は、まず、ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定し、次に、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定し、次に、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定し、最後に、試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトのラベリング能力情報を決定する。
本開示は、ラベリング要件に基づいて試験ラベリングオブジェクトを決定した場合、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定すると同時に、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を合理的に決定し、ラベリングコストおよびラベリング品質を考慮するので、ラベリング能力情報の精度を向上させる。
このセクションで説明される内容は、本開示の実施例の主要または重要な特徴を特定することを意図するものではなく、また、本開示の範囲を限定することを意図するものでもないことを理解されたい。本開示の他の特徴は、以下の説明から容易に理解されるであろう。
本開示の他の特徴、目的および利点は、以下の図面で行われる非限定的な実施例についての詳細な説明からより明らかになるであろう。
本開示の例示的な実施例は、理解を容易にするための本開示の実施例の様々な詳細を含む図面と併せて以下に説明され、単なる例示と見なされるべきである。従って、本開示の範囲および精神から逸脱することなく、本明細書に記載の実施例に対して様々な変更および修正を行うことができることは、当業者にとって理解されるであろう。同様に、明瞭性と簡潔性の観点から、公知の機能と構造に関する説明は、以下の説明において省略される。なお、本開示の実施例および実施例の特徴は、矛盾しない限り、互いに組み合わせることができる。
本開示の技術的解決手段に係るユーザ個人情報の取得、記憶、適用などはいずれも、関連法令の規定に沿って行われており、公序良俗に違反せずに必要な機密保護措置を採用する。
図1は、本開示の実施例が適用され得るラベリング能力情報決定方法、装置、電子デバイス、およびコンピュータ可読記憶媒体の例示的なシステムアーキテクチャ100を示す。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103、ネットワーク104、およびサーバ105を含み得る。ネットワーク104は、端末装置101、102、103とサーバ105との間の通信リンクを提供するための媒体である。ネットワーク104は、有線、無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含み得る。
ユーザは、端末装置101、102、103を使用してネットワーク104を介してサーバ105と対話して、メッセージなどを送受信することができる。端末装置101、102、103およびサーバ105には、ラベリング能力情報決定アプリケーション、ラベリングデータ送信アプリケーション、試験ラベリングデータ準備アプリケーションなど、両者間の情報通信を実現するための様々なアプリケーションがインストールされ得る。
端末装置101、102、103およびサーバ105は、ハードウェアであり得るか、またはソフトウェアであり得る。端末装置101、102、103がハードウェアである場合、それらは、スマートフォン、タブレットコンピュータ、ラップトップポータブルコンピュータ、デスクトップコンピュータなどを含むがこれらに限定されない、表示画面を備えた様々な電子デバイスであり得る。端末装置101、102、103がソフトウェアである場合、それらは、複数のソフトウェアまたはソフトウェアモジュールとして、または単一のソフトウェアまたはソフトウェアモジュールとして実装され得る上記の電子デバイスにインストールされ得るが、ここでは特に限定されない。サーバ105がハードウェアである場合、それは、複数のサーバからなる分散型サーバクラスタとして実装され得るか、または単一のサーバとして実装され得る。サーバがソフトウェアである場合、それは、複数のソフトウェアまたはソフトウェアモジュールとして実装され得るか、または単一のソフトウェアまたはソフトウェアモジュールとして実装され得るが、ここでは特に限定されない。
サーバ105は、内蔵される様々なアプリケーションを介して様々なサービスを提供できる。試験ラベリング操作を実行して試験ラベリングオブジェクトを決定するためのラベリングオブジェクトサービスを提供できるラベリング能力情報決定アプリケーションを例にすると、サーバ105は、このラベリング能力情報決定アプリケーションを実行するときに以下の効果を実現することができる。まず、ネットワーク104を介して端末装置101からのラベリングタスクを受信し、次に、ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクト(例えば、図1に示す端末装置102、103に対応するユーザ)を決定し、次に、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定し、次に、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定し、次に、ネットワーク104を介して試験ラベリングデータを端末装置102、103に対応するユーザに送信して、試験ラベリング時間の試験ラベリング操作を実行し、最後に、端末装置102、103から受信された試験ラベリング時間内における試験ラベリングデータのラベリング結果に基づいて、対応する試験ラベリングオブジェクトのラベリング能力情報を決定する。
なお、ネットワーク104を介して端末装置101から取得され得ることに加えて、ラベリングタスクはまた、様々な方式でサーバ105のローカルに事前に記憶され得る。従って、サーバ105は、これらのデータ(例えば、処理開始前に保存されたラベリングタスク)がローカルに記憶されたことを検出した場合、これらのデータは、ローカルから直接取得され得る。この場合、例示的なシステムアーキテクチャ100は、端末装置101およびネットワーク104を含まなくてもよい。
本開示の後続の各実施例によって提供されるラベリングタスク処理方法が一般に、タスク割り当ておよび統括能力を備えたサーバ105によって実行されるため、ラベリングタスク処理装置は一般に、サーバ105に配置される。ただし、端末装置101、102、103も要件を満たすタスク割り当ておよび統括能力を備える場合、端末装置101、102、103も、それらにインストールされたラベリングタスク処理アプリケーションを介して、サーバ105に割り当てられた上記の様々な計算を完了して、最終的にサーバ105と同じ結果を取得することができる。それに応じて、ラベリングタスク処理装置は、端末装置101、102、103にも配置され得る。この場合、例示的なシステムアーキテクチャ100は、サーバ105およびネットワーク104を含まなくてもよい。
図1中の端末装置、ネットワーク、およびサーバの数は、単なる例示であることを理解されたい。実際のニーズに応じて、端末装置、ネットワーク、およびサーバの数が任意に設定され得る。
図2を参照すると、図2は、本開示の実施例によって提供されるラベリング能力情報決定方法のフローチャートである。プロセス200は、以下のステップを含む。
ステップ201:ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定する。
このステップは、ラベリング能力情報決定方法の実行主体(例えば、図1に示すサーバ105)が、ラベリングタスクのラベリング要件に基づいてそれに対応するラベリング能力を決定し、次に、このラベリング能力に基づいて適切なラベリングオブジェクトを、後続の試験ラベリング操作を実行するための試験ラベリングオブジェクトとして決定することを目的とする。
ラベリング要件は、様々な要件を含み、判断洗浄、コンテンツ転写、コンテンツ抽出、豊富化などの大分類に分けられており、各大分類は、具体的なデータタイプに基づいて複数の小分類に細分されており、データタイプは、ピクチャ、音声、テキスト、ビデオ、ウェブページなどを含む。ピクチャ+コンテンツ抽出を例にすると、ラベリング要件は、ピクチャ要素のフレーム選択、ピクチャ準備、ピクチャ領域のセマンティクス定義、ピクチャ車線境界線のラベリングなどに再細分され得る。同時に、ラベリングオブジェクト、ラベリング形式などの要件情報に加えて、ラベリング要件は、ラベリング中のラベリングオブジェクトの能力レベルの関連要件、例えば、ピクチャ要素のフレーム選択の方面で行われた履歴ラベリング動作の数、履歴平均ラベリング精度などをさらに含む。
このラベリング要件に対応するすべてのラベリング能力を備えたラベリングオブジェクトが占用されていない場合、それを試験ラベリングオブジェクトとして直接決定することができる。このラベリング要件に対応するすべてのラベリング能力を備えたラベリングオブジェクトが占用される場合、必要なラベリング能力との差異が最も小さいラベリングオブジェクトを適切に選択して、試験ラベリングオブジェクトとして決定することができる。最も小さい差異は、差異のあるラベリング能力の数量に基づいて決定され得るだけでなく、差異のあるラベリング能力の重要度にも基づいて決定され得る。
ステップ202:ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定する。
ステップ201に基づいて、このステップは、上記実行主体が、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定することを目的とする。ラベリング要件は、ラベリングタスクの関連パラメータを決定して、このラベリング要件に基づいてラベリングタスクと一致または類似するデータを試験ラベリングデータとして選択するために使用される。所定の試験ラベリング要件は、このラベリング要件の場合、ラベリング要件に対応するラベリング能力によって与えられる要件を全面的にカバーし、ラベリング要件に基づいて試験ラベリングデータをラベリングタスクと類似させてラベリング能力を全面的に評価するために使用される。この所与の要件は、データタイプ、カバーされたシーンタイプ、データ量、データの複雑さなど、試験ラベリングデータの複数の次元への要件を含む。
ステップ203:試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定する。
ステップ202に基づいて、このステップは、上記実行主体が、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定することを目的とする。ここで、試験ラベリングオブジェクトの属性は、その身分に対応する属性情報、例えば、性別、年齢、勤続年数、作業状態などを含み得るだけでなく、実行されるラベリングタスクに関連する履歴ラベリング記録情報、例えば、履歴ラベリングデータ量、履歴ラベリングデータタイプの比率分布、履歴平均単回ラベリング時間、履歴ラベリング精度、履歴ラベリング精度の経時変化傾向なども含み得る。
さらに、試験ラベリング時間を直接決定するために使用される影響要因に加えて、上記属性情報は、試験ラベリングのための基礎時間を補正して、補正された時間を実際の試験ラベリング時間として現在の試験ラベリングオブジェクトとマッチングさせるために使用される影響要因とすることもできる。
ステップ204:試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトのラベリング能力情報を決定する。
ステップ203に基づいて、このステップは、上記実行主体が、試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトを特徴付けるラベリング能力情報を決定することを目的とする。ここで、このラベリング能力情報は、所属するオブジェクトによって実際に所有されているラベリング能力を表すために使用される。このために、決定されたラベリング能力に基づいて、この試験ラベリングオブジェクトがラベリングタスクをラベリングする実際のラベリングオブジェクトとして決定され得るか否かを決定する。
ラベリング要件によって決定されたラベリング能力が、ラベリング能力カテゴリおよび各能力カテゴリ内の能力値パラメータに細分され得る場合、試験ラベリングオブジェクトは、ラベリング能力カテゴリに対応するラベリング能力を備えたラベリングオブジェクトのみとして決定され得る。次に、このステップによって決定されたラベリング能力情報に基づいて、このラベリング能力カテゴリにおけるこの試験ラベリングオブジェクトのラベリング能力値を具体的に決定する。
ここで、各能力カテゴリは、独立した能力ラベルとして表現され得、この能力カテゴリにおける能力値パラメータは、このラベルに記録された具体的な数値または他の表現形式の情報として決定され得る。例えば、各能力カテゴリの能力値を等級で分類する場合、対応するカラーを等級ごとに割り当てて、対応するカラーの能力ラベルを表示することにより、このラベリング能力カテゴリにおける所属するラベリングオブジェクトの具体的なラベリング能力等級を特徴付けることができる。
本開示の実施例によって提供されるラベリング能力情報決定方法は、ラベリング要件に基づいて試験ラベリングオブジェクトを決定した場合、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定すると同時に、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を合理的に決定し、ラベリングコストおよびラベリング品質を考慮するので、ラベリング能力情報の精度を向上させる。
さらに、ラベリング能力カテゴリにおける試験ラベリングオブジェクトのラベリング能力値を決定した後、試験ラベリングオブジェクトのラベリング能力値に基づいて、適切な比率のラベリングタスクを試験ラベリングオブジェクトに割り当てることができる。即ち、試験ラベリングオブジェクトによって所有されているラベリング能力が高ければ高いほど、ラベリングタスクの総量を占める割合が大きくなるラベリングタスクの一部をそれに割り当て、さらに高いラベリング能力を備えたラベリングオブジェクトを十分に利用して、全体的なラベリング品質を向上させる。またさらに、ラベリングタスクを各試験ラベリングオブジェクトに割り当てる前に、その具体的なラベリング能力値が所定の最小値よりも大きいか否かを決定し、この最小値を超えた実際のラベリング能力値のみを備えた試験ラベリングオブジェクトがラベリングタスクのラベリングに参加するように制御する。
図3を参照すると、図3は、本開示の実施例によって提供される別のラベリング能力情報決定方法のフローチャートである。プロセス300は、以下のステップを含む。
ステップ301:ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定する。
ステップ302:試験ラベリング要件に基づいて、ラベリングデータのデータタイプ、ラベリング要素、ラベリング方式を決定する。
このステップでは、試験ラベリング要件に基づいて、試験ラベリングデータを選択するための三つのパラメータ、即ち、試験ラベリングデータとしてのラベリングデータのデータタイプ、ラベリング要素、およびラベリング方式を決定する。データタイプは、ピクチャ、音声、テキスト、ビデオ、ウェブページなどを含み得る。ピクチャを例にすると、そのラベリング要素は、歩行者、障害物、静的物体、運転中の車、自動車のナンバープレートなどを含み得、ラベリング方式は、要素のフレーム選択、座標ラベリング、カラー判別、セマンティクス転送、テキスト識別などを含み得る。
ステップ303:試験ラベリング要件に基づいて、ラベリング要素に対応する要求数量範囲、ラベリングデータに対応する要求データ量、およびデータタイプに対応する要求シーンタイプセットを決定する。
ステップ302に基づいて、このステップは、上記実行主体が、試験ラベリング要件に基づいて、ステップ302に対応する三つの要件、即ち、ラベリング要素に対応する要求数量範囲、ラベリングデータに対応する要求データ量、およびデータタイプに対応する要求シーンタイプセットを決定することを目的とする。ここで、ラベリングピクチャに含まれる歩行者を例にすると、要求数量範囲は[0、100)であり得、要求シーンタイプセットに含まれる要求シーンタイプは、十字路シーン、T字路シーン、東西方向交差点シーン、南北方向交差点シーン、双方向2車線シーン、双方向4車線シーン、昼間の交差点シーン、夕方の交差点シーン、夜間の交差点シーンなどであり得、要求データ量は、サンプルとしてのピクチャの数が1000枚以上であることを要求することができる。
ステップ304:要求数量範囲をラベリング要素の実数量でカバーし、要求シーンタイプセット内の各要求シーンタイプをデータタイプ内の実シーンタイプでカバーし、実データ量が要求データ量以上であるラベリングデータを試験ラベリングデータとして決定する。
ステップ303に基づいて、このステップは、上記実行主体が、要求数量範囲をラベリング要素の実数量でカバーし、要求シーンタイプセット内の各要求シーンタイプをデータタイプ内の実シーンタイプでカバーし、実データ量が要求データ量以上であるラベリングデータを試験ラベリングデータとして決定することを目的とする。即ち、このステップは、タイプが全面的であり、かつデータ量が適切であるラベリングデータを試験ラベリングデータとして選択して、試験ラベリングオブジェクトのラベリング能力を十分、全面的かつ正確に決定することを目的とする。
ステップ305:試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定する。
ステップ306:試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータの実ラベリング量を決定する。
ステップ307:実ラベリング量と試験ラベリングデータの総量との比率に基づいて、試験ラベリング完了率を決定する。
試験ラベリングオブジェクトは試験ラベリング時間内に所与のすべての試験ラベリングデータのラベリングを完了する場合があるため、ステップ306~ステップ307は、上記実行主体が、実ラベリング量と試験ラベリングデータの総量との比率に基づいて、試験ラベリング完了率を決定することを目的とする。すべての試験ラベリングデータのラベリングが完了していない場合、試験ラベリング完了率は100%未満である。
当然のことながら、試験ラベリングオブジェクトが試験ラベリング時間内にすべての試験ラベリングデータのラベリングを事前に完了する場合、事前完了時間に基づいて100%を超える試験ラベリング完了率を取得することができる。
ステップ308:実ラベリング量のラベリング済みデータにおける各要求シーンタイプにそれぞれ対応する試験ラベリング精度を決定する。
ステップ309:試験ラベリング精度および試験ラベリング完了率に基づいて、異なる要求シーンタイプのラベリングデータについての試験ラベリングオブジェクトのラベリング能力情報を決定する。
ステップ307においてラベリング数に基づいて決定された試験ラベリング完了率と異なり、ステップ308~ステップ309は、ラベリング済みデータにおける各要求シーンタイプにそれぞれ対応するラベリング精度に基づいて試験ラベリング精度を決定し、異なる要求シーンタイプのラベリングデータについての試験ラベリングオブジェクトのラベリング能力を特徴付ける情報を決定する。
プロセス200に示す実施例と異なり、本実施例は、ステップ302~ステップ304を介して、試験ラベリングデータを決定する実施形態を具体的に提供する。これは、データタイプ、ラベリング要素、ラベリング方式、要求シーンタイプセット、要求要素数量範囲、および要求データ量に基づいて、試験ラベリングデータが十分なデータ量を有し、複雑さが全面的にカバーされ、シーンタイプが全面的にカバーされるように確保する。本実施例はまた、ステップ306~ステップ309を介して、ラベリング能力を決定する実施形態を具体的に提供する。これは、試験ラベリング完了率、試験ラベリング精度、および異なる要求シーンタイプに基づいて、試験ラベリングオブジェクトのラベリング能力を特徴付ける情報を多くの方面から詳細に決定することができる。
ステップ302~ステップ304によって提供される具体的な実施形態と、ステップ306~ステップ309によって提供される具体的な実施形態との間には因果関係および依存関係がなく、具体的な実施形態は、プロセス200における対応する実施形態を完全に代替して、それぞれ独立した実施例を形成することができ、本実施例は、二つの具体的な実施形態を同時に含む好ましい実施例としてのみ存在することを理解されたい。
プロセス300に示す実施例に基づいて、決定されたラベリング能力精度をさらに向上させるために、試験ラベリングプロセスにおけるラベリング効率に基づいて、高すぎるまたは低すぎる異常ラベリング効率が存在するか否かを決定することにより、異常部分を除去して実際の状況とよりマッチングするラベリング能力を評価することもできる。
含むがこれらに限定されない実施形態は、以下のとおりである。
試験ラベリング時間を構成する各試験ラベリング期間内における試験ラベリングオブジェクトの試験ラベリングデータの実ラベリング効率を決定する。
各実ラベリング効率における異常ラベリング効率を決定する。
異常ラベリング効率に対応するラベリング済みデータを実ラベリング量およびラベリング精度の計算範囲から排除する。
多くの履歴ラベリング記録に基づいて統計された通常ラベリング効率が3~7個/分である(即ち、毎分ごとにピクチャ内の3~7個のターゲットオブジェクトのラベリングを完了する)と仮定すると、分を単位として、毎分のラベリング効率が0.5よりも小さく10よりも大きい部分を異常データとして計算範囲から排除する。
さらに、誤判定を防止するために、対応する期間のネットワーク品質を取得して、低いラベリング効率がネットワーク品質の変動につながるか否かを判定することもでき、対応する期間のラベリングピクチャの類似性を取得して、高いラベリング効率がコンテンツ重複度の高い連続的なピクチャにつながるか否かを判定することもできる。当然のことながら、誤判定は、他の検証手段にもよって減少され得る。
上記任意の実施例に基づいて、本開示はまた、図4を介して、実施形態の実行可能性および合理性を検証するための実行可能な例としてのみ、試験ラベリング時間決定方法を具体的に提供する。当業者は、指導思想に基づいて、異なる具体的な実施形態を異なる実際のシーンで調整して取得することができる。プロセス400は、以下のステップを含む。
ステップ401:試験ラベリングオブジェクトの履歴ラベリング記録に基づいて、履歴単回ラベリング時間および履歴ラベリング難度を決定する。
ステップ402:試験ラベリングデータの予想ラベリング難度および履歴ラベリング難度に基づいて、差異係数を決定する。
この差異係数は、予想ラベリング難度と履歴ラベリング難度との差を定量化することによって実現され得る。このときの差異係数が正数である場合は、予想ラベリング難度が履歴ラベリング難度よりも大きいことを表すが、差異係数が負数である場合は、予想ラベリング難度が履歴ラベリング難度よりも小さいことを表す。
当然のことながら、これはまた、予想ラベリング難度と履歴ラベリング難度との商を定量化することによって実現され得る。このときの差異係数が1よりも大きい場合は、予想ラベリング難度が履歴ラベリング難度よりも大きいことを表すが、差異係数が0よりも大きく1よりも小さい場合は、予想ラベリング難度が履歴ラベリング難度よりも小さいことを表す。
ステップ403:差異係数に基づいて履歴単回ラベリング時間を調整して、試験ラベリング時間を取得する。
ステップ402に基づいて、差異係数は予想ラベリング難度が履歴ラベリング難度よりも大きいことを表す場合、履歴単回ラベリング時間を小さく調整するが、差異係数は予想ラベリング難度が履歴ラベリング難度よりも小さいことを表す場合、履歴単回ラベリング時間を大きく調整する。
具体的な調整方式は、以下のとおりであり得る。
差異係数が正数である場合、差異係数と履歴単回ラベリング時間との積を試験ラベリング時間として決定する。
差異係数が負数である場合、履歴単回ラベリング時間と差異係数との商の絶対値を試験ラベリング時間として決定する。
本実施例は、上記実行主体が、履歴ラベリング難度およびそのラベリング難度によって決定された差異係数に基づいて、その履歴単回ラベリング時間を調整して、時間が実際の難度とマッチングする試験ラベリング時間を取得することを目的とする。
さらに、最終的に決定された試験ラベリング時間が長い場合、実際の状況に応じて、実行されている試験ラベリング時間の上限を比例的に縮減することもできる。
さらに図5を参照すると、上記の各図に示す方法の実施形態として、本開示は、図2に示す方法の実施例に対応するラベリング能力情報決定装置の実施例を提供する。この装置は、様々な電子デバイスに特に適用できる。
図5に示すように、本実施例のラベリング能力情報決定装置500は、試験ラベリングオブジェクト決定ユニット501、試験ラベリングデータ決定ユニット502、および試験ラベリング時間/ラベリング能力情報決定ユニット503を含み得る。ここで、試験ラベリングオブジェクト決定ユニット501は、ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定するように構成される。試験ラベリングデータ決定ユニット502は、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定するように構成される。試験ラベリング時間/ラベリング能力情報決定ユニット503は、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定し、試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトのラベリング能力情報を決定するように構成される。
本実施例では、ラベリング能力情報決定装置500の試験ラベリングオブジェクト決定ユニット501、試験ラベリングデータ決定ユニット502、および試験ラベリング時間/ラベリング能力情報決定ユニット503の具体的な処理とその技術的効果については、それぞれ図2に対応する実施例のステップ201~203の関連説明を参照することができるので、ここでは繰り返さない。
本実施例のいくつかの代替的な実施形態では、試験ラベリングデータ決定ユニット502は、
試験ラベリング要件に基づいて、ラベリングデータのデータタイプ、ラベリング要素、およびラベリング方式を決定することと、
試験ラベリング要件に基づいて、ラベリング要素に対応する要求数量範囲、ラベリングデータに対応する要求データ量、およびデータタイプに対応する要求シーンタイプセットを決定することと、
要求数量範囲をラベリング要素の実数量でカバーし、要求シーンタイプセット内の各要求シーンタイプをデータタイプ内の実シーンタイプでカバーし、実データ量が要求データ量以上であるラベリングデータを試験ラベリングデータとして決定することと、を実行するようにさらに構成される。
本実施例のいくつかの代替的な実施形態では、試験ラベリング時間/ラベリング能力情報決定ユニット503は、試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータのラベリング結果に基づいて、試験ラベリングオブジェクトのラベリング能力情報を決定するように構成されたラベリング能力情報決定サブユニットを含み、ラベリング能力情報決定サブユニットは、
試験ラベリング時間内における試験ラベリングオブジェクトの試験ラベリングデータの実ラベリング量を決定することと、
実ラベリング量と試験ラベリングデータの総量との比率に基づいて、試験ラベリング完了率を決定することと、
実ラベリング量のラベリング済みデータにおける各要求シーンタイプにそれぞれ対応する試験ラベリング精度を決定することと、
試験ラベリング精度および試験ラベリング完了率に基づいて、異なる要求シーンタイプのラベリングデータについての試験ラベリングオブジェクトのラベリング能力情報を決定することと、を実行するようにさらに構成される。
本実施例のいくつかの代替的な実施形態では、ラベリング能力情報決定装置500は、
試験ラベリング時間を構成する各試験ラベリング期間内における試験ラベリングオブジェクトの試験ラベリングデータの実ラベリング効率を決定するように構成された実ラベリング効率決定ユニットと、
各実ラベリング効率における異常ラベリング効率を決定するように構成された異常ラベリング効率決定ユニットと、
異常ラベリング効率に対応するラベリング済みデータを実ラベリング量およびラベリング精度の計算範囲から排除するように構成された異常データ排除ユニットと、をさらに含み得る。
本実施例のいくつかの代替的な実施形態では、試験ラベリング時間/ラベリング能力情報決定ユニット503は、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定するように構成された試験ラベリング時間決定サブユニットを含み、試験ラベリング時間決定サブユニットは、
試験ラベリングオブジェクトの履歴ラベリング記録に基づいて、履歴単回ラベリング時間および履歴ラベリング難度を決定するように構成された履歴ラベリングパラメータ決定モジュールと、
試験ラベリングデータの予想ラベリング難度および履歴ラベリング難度に基づいて、差異係数を決定するように構成された差異係数決定モジュールと、
差異係数に基づいて履歴単回ラベリング時間を調整して、試験ラベリング時間を取得するように構成された試験ラベリング時間決定モジュールと、を含み得る。
本実施例のいくつかの代替実施形態では、試験ラベリング時間決定モジュールは、
差異係数が正数である場合、差異係数と履歴単回ラベリング時間との積を試験ラベリング時間として決定することであって、差異係数が正数である場合は予想ラベリング難度が履歴ラベリング難度よりも大きいことを表すことと、
差異係数が負数である場合、履歴単回ラベリング時間と差異係数との商の絶対値を試験ラベリング時間として決定することであって、差異係数が負数である場合は予想ラベリング難度が履歴ラベリング難度よりも小さいことを表すことと、を実行するようにさらに構成される。
本実施例のいくつかの代替実施形態では、試験ラベリングオブジェクト決定ユニットは、
ラベリングタスクのラベリング要件に基づいて必要なラベリング能力カテゴリを決定することと、
ラベリング能力カテゴリに対応するラベリング能力を有するラベリングオブジェクトを、試験ラベリングオブジェクトとして決定することと、を実行するようにさらに構成される。
それに応じて、試験ラベリング時間/ラベリング能力情報決定ユニットは、試験ラベリングオブジェクトのラベリング能力情報を決定するように構成されたラベリング能力情報決定サブユニットを含み、ラベリング能力情報決定サブユニットは、
ラベリング能力カテゴリにおける試験ラベリングオブジェクトのラベリング能力値を決定することを実行するようにさらに構成される。
本実施例のいくつかの代替的な実施形態では、ラベリング能力情報決定装置500は、
ラベリング能力カテゴリにおける試験ラベリングオブジェクトのラベリング能力値を決定した後、試験ラベリングオブジェクトのラベリング能力値に基づいて、適切な比率のラベリングタスクを試験ラベリングオブジェクトに割り当てるように構成されたラベリングタスク割り当てユニットをさらに含み得る。
本実施例は、上記方法の実施例に対応する装置の実施例として存在する。本実施例によって提供されるラベリング能力情報決定装置は、ラベリング要件に基づいて試験ラベリングオブジェクトを決定した場合、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定すると同時に、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を合理的に決定し、ラベリングコストおよびラベリング品質を考慮するので、ラベリング能力情報の精度を向上させる。
本開示の実施例によれば、本開示は、電子デバイスをさらに提供する。この電子デバイスは、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信接続されたメモリと、を含み、このメモリは、少なくとも1つのプロセッサによって実行可能な命令を記憶しており、この命令は、少なくとも1つのプロセッサが上記任意の実施例に記載のラベリング能力情報決定方法を実行できるように少なくとも1つのプロセッサによって実行される。
本開示の実施例によれば、本開示は、上記任意の実施例に記載のラベリング能力情報決定方法をコンピュータに実行させるためのコンピュータ命令を記憶する可読記憶媒体をさらに提供する。
本開示の実施例は、プロセッサによって実行されると、上記任意の実施例に記載のラベリング能力情報決定方法を実行するコンピュータプログラムを含むコンピュータプログラム製品を提供する。
図6は、本開示の実施例を実施するために使用され得る例示的な電子デバイス600の概略ブロック図を示す。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、およびその他の適切なコンピュータなど、様々な形態のデジタルコンピュータを表すことを意図する。電子デバイスは、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブルデバイス、および他の同様のコンピューティングデバイスなど、様々な形態のモバイルデバイスを表すこともできる。本明細書に示されるコンポーネント、それらの接続と関係、およびそれらの機能は単なる例示であり、本明細書に説明および/または請求される本開示の実施形態を限定することを意図したものではない。
図6に示すように、デバイス600は、リードオンリメモリ(ROM)602に記憶されたコンピュータプログラム、または記憶ユニット608からランダムアクセスメモリ(RAM)603にロードされたコンピュータプログラムに従って、各種の適切な動作および処理を実行することができる計算ユニット601を含む。RAM603には、デバイス600の動作に必要な各種のプログラムおよびデータも記憶され得る。計算ユニット601、ROM602、およびRAM603は、バス604を介して互いに接続される。入力/出力(I/O)インターフェース605も、バス604に接続される。
デバイス600内の複数のコンポーネントは、I/Oインターフェース605に接続されており、キーボード、マウスなどの入力ユニット606と、各種のディスプレイ、スピーカーなどの出力ユニット607と、磁気ディスク、光ディスクなどの記憶ユニット608と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット609と、を含む。通信ユニット609は、デバイス600が、インターネットなどのコンピュータネットワーク、および/または様々な通信ネットワークを介して、他のデバイスとの間で情報/データを交換することを可能にする。
計算ユニット601は、処理能力および計算能力を備えた様々な汎用および/または専用の処理コンポーネントであり得る。計算ユニット601のいくつかの例は、中央処理装置(CPU)、グラフィックス処理ユニット(GPU)、様々な専用の人工知能(AI)計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ(DSP)、任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット601は、上記様々な方法および処理、例えば、ラベリング能力情報決定方法を実行する。例えば、いくつかの実施例では、ラベリング能力情報決定方法は、記憶ユニット608などの機械可読媒体で有形的に具現化されるコンピュータソフトウェアプログラムとして実施され得る。いくつかの実施例では、コンピュータプログラムの一部または全部は、ROM602および/または通信ユニット609を介して、デバイス600にロードおよび/またはインストールされ得る。コンピュータプログラムがRAM603にロードされ、計算ユニット601によって実行されると、上記ラベリング能力情報決定方法の1つまたは複数のステップが実行され得る。あるいは、他の実施例では、計算ユニット601は、他の任意の適切な手段(例えば、ファームウェア)を介して、ラベリング能力情報決定方法を実行するように構成され得る。
本明細書に記載のシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途用標準品(ASSP)、システムオンチップ(SOC)、ロードプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実装され得る。これらの様々な実施形態は、記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置からデータおよび命令を受信したり、この記憶システム、この少なくとも1つの入力装置、およびこの少なくとも1つの出力装置にデータおよび命令を送信したりすることができる専用又は汎用のプログラマブルプロセッサであり得る少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行および/または解釈され得る1つまたは複数のコンピュータプログラムに実装されることを含み得る。
本開示の方法を実施するためのプログラムコードは、1つまたは複数のプログラミング言語の任意の組み合わせで書かれ得る。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサまたはコントローラに提供され得るので、プログラムコードがプロセッサまたはコントローラによって実行されると、フローチャートおよび/またはブロック図で指定された機能/動作が実行される。プログラムコードは、完全にマシン上で実行され得るか、または部分的にマシン上で実行され得るか、または独立したソフトウェアパッケージとして、部分的にマシン上で、部分的にリモートマシン上で実行され得るか、または完全にリモートマシンまたはサーバ上で実行され得る。
本開示の文脈において、機械可読媒体は、命令実行システム、装置、またはデバイスによって、またはそれらと組み合わせて使用するためのプログラムを含むかまたは記憶することができる有形媒体であり得る。機械可読媒体は、機械可読信号媒体または機械可読記憶媒体であり得る。機械可読媒体は、電子、磁気、光学、電磁気、赤外線、または半導体のシステム、装置またはデバイス、または上記の任意の適切な組み合わせを含み得るが、これらに限定されない。機械可読記憶媒体のより具体的な例は、1本または複数本の導線を備えた電気コネクタ、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能なプログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブル・コンパクト・ディスク・リードオンリメモリ(CD-ROM)、光学メモリ、磁気メモリ、または上記の任意の適切な組み合わせを含む。
ユーザとの対話を提供するために、本明細書に記載のシステムおよび技術は、情報をユーザに表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、ユーザが入力をコンピュータに提供することを可能にするキーボードとポインティングデバイス(例えば、マウスまたはトラックボール)とを備えたコンピュータに実装され得る。他のタイプの装置は、ユーザとの対話を提供するためにも使用されており、例えば、任意の形態の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック、または触覚的フィードバック)をユーザに提供したり、任意の形態(音響入力、音声入力、および触覚入力を含む形態)を使用してユーザからの入力を受信したりするために使用され得る。
本明細書に記載のシステムおよび技術は、バックエンドコンポーネント(例えば、データサーバ)を含むコンピュータシステム、ミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含むコンピュータシステム、フロントエンドコンポーネント(例えば、ユーザが本明細書に記載のシステムおよび技術の実施形態と対話することを可能にするグラフィカルユーザインターフェースまたはウェブブラウザを備えたユーザコンピュータ)を含むコンピュータシステム、または、これらバックエンドコンポーネント、ミドルウェアコンポーネントまたはフロントエンドコンポーネントの任意の組み合わせを含むコンピュータシステムに実装され得る。システムのコンポーネントは、デジタルデータ通信の任意の形態または媒体(例えば、通信ネットワーク)を介して互いに接続され得る。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、およびインターネットを含む。
コンピュータシステムは、クライアントおよびサーバを含み得る。クライアントおよびサーバは通常、互いに遠く離れており、通信ネットワークを介して対話する。クライアントとサーバとの関係は、対応するコンピュータで実行され、クライアント-サーバの関係を有するコンピュータプログラムによって生成される。サーバは、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれるクラウドサーバであってもよく、クラウドコンピューティングサービスシステムのホスト製品として、従来の物理ホストおよび仮想プライベートサーバ(VPS、Virtual Private Server)のサービスにおける、管理の難しさが高く、サービスの拡張性が低いという欠点を解決する。
本開示の実施例の技術的解決手段によれば、ラベリング要件に基づいて試験ラベリングオブジェクトを決定した場合、ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定すると同時に、試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を合理的に決定し、ラベリングコストおよびラベリング品質を考慮するので、ラベリング能力情報の精度を向上させる。
ステップの並べ替え、追加、または削除は、上記様々な形態のプロセスによって実行され得ることを理解されたい。例えば、本開示に記載の各ステップは、本開示に開示された技術的解決手段の所望の結果が達成できる限り、並行して、順次に、または異なる順序で実行され得るが、本明細書に限定されない。
上記特定の実施形態は、本開示の保護範囲を限定するものではない。設計要件および他の要因に応じて、様々な修正、組み合わせ、副次的組み合わせおよび置換を行うことができることは、当業者にとって明らかであろう。本開示の精神と原則の範囲内で行われた修正、同等置換、改良などは、本開示の保護範囲に含まれるべきである。
Claims (19)
- ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定することと、
前記ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定することと、
前記試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定し、前記試験ラベリング時間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータのラベリング結果に基づいて、前記試験ラベリングオブジェクトのラベリング能力情報を決定することと、を含む、
ラベリング能力情報決定方法。 - 前述した前記ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定することは、
前記試験ラベリング要件に基づいて、ラベリングデータのデータタイプ、ラベリング要素、およびラベリング方式を決定することと、
前記試験ラベリング要件に基づいて、前記ラベリング要素に対応する要求数量範囲、前記ラベリングデータに対応する要求データ量、および前記データタイプに対応する要求シーンタイプセットを決定することと、
前記要求数量範囲を前記ラベリング要素の実数量でカバーし、前記要求シーンタイプセット内の各要求シーンタイプを前記データタイプ内の実シーンタイプでカバーし、実データ量が前記要求データ量以上であるラベリングデータを前記試験ラベリングデータとして決定することと、を含む、
請求項1に記載の方法。 - 前述した前記試験ラベリング時間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータのラベリング結果に基づいて、前記試験ラベリングオブジェクトのラベリング能力情報を決定することは、
前記試験ラベリング時間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータの実ラベリング量を決定することと、
前記実ラベリング量と前記試験ラベリングデータの総量との比率に基づいて、試験ラベリング完了率を決定することと、
前記実ラベリング量のラベリング済みデータにおける各前記要求シーンタイプにそれぞれ対応する試験ラベリング精度を決定することと、
前記試験ラベリング精度および前記試験ラベリング完了率に基づいて、異なる要求シーンタイプのラベリングデータについての前記試験ラベリングオブジェクトのラベリング能力情報を決定することと、を含む、
請求項2に記載の方法。 - 前記試験ラベリング時間を構成する各試験ラベリング期間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータの実ラベリング効率を決定することと、
各前記実ラベリング効率における異常ラベリング効率を決定することと、
前記異常ラベリング効率に対応するラベリング済みデータを前記実ラベリング量および前記ラベリング精度の計算範囲から排除することと、をさらに含む、
請求項3に記載の方法。 - 前述した前記試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定することは、
前記試験ラベリングオブジェクトの履歴ラベリング記録に基づいて、履歴単回ラベリング時間および履歴ラベリング難度を決定することと、
前記試験ラベリングデータの予想ラベリング難度および前記履歴ラベリング難度に基づいて、差異係数を決定することと、
前記差異係数に基づいて前記履歴単回ラベリング時間を調整して、前記試験ラベリング時間を取得することと、を含む、
請求項1に記載の方法。 - 前述した前記差異係数に基づいて前記履歴単回ラベリング時間を調整して、前記試験ラベリング時間を取得することは、
前記差異係数が正数である場合、前記差異係数と前記履歴単回ラベリング時間との積を前記試験ラベリング時間として決定することであって、前記差異係数が正数である場合は前記予想ラベリング難度が前記履歴ラベリング難度よりも大きいことを表すことと、
前記差異係数が負数である場合、前記履歴単回ラベリング時間と前記差異係数との商の絶対値を前記試験ラベリング時間として決定することであって、前記差異係数が負数である場合は前記予想ラベリング難度が前記履歴ラベリング難度よりも小さいことを表すことと、を含む、
請求項5に記載の方法。 - 前述したラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定することは、
前記ラベリングタスクのラベリング要件に基づいて必要なラベリング能力カテゴリを決定することと、
前記ラベリング能力カテゴリに対応するラベリング能力を有するラベリングオブジェクトを、前記試験ラベリングオブジェクトとして決定することと、を含み、
それに応じて、前述した前記試験ラベリングオブジェクトのラベリング能力情報を決定することは、
前記ラベリング能力カテゴリにおける前記試験ラベリングオブジェクトのラベリング能力値を決定することを含む、
請求項1~6のいずれか一項に記載の方法。 - 前記ラベリング能力カテゴリにおける前記試験ラベリングオブジェクトのラベリング能力値を決定した後、
前記試験ラベリングオブジェクトのラベリング能力値に基づいて、適切な比率のラベリングタスクを前記試験ラベリングオブジェクトに割り当てることをさらに含む、
請求項7に記載の方法。 - ラベリングタスクのラベリング要件に基づいて試験ラベリングオブジェクトを決定するように構成された試験ラベリングオブジェクト決定ユニットと、
前記ラベリング要件および所定の試験ラベリング要件に基づいて試験ラベリングデータを決定するように構成された試験ラベリングデータ決定ユニットと、
前記試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定し、前記試験ラベリング時間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータのラベリング結果に基づいて、前記試験ラベリングオブジェクトのラベリング能力情報を決定するように構成された試験ラベリング時間/ラベリング能力情報決定ユニットと、を含む、
ラベリング能力情報決定装置。 - 前記試験ラベリングデータ決定ユニットは、
前記試験ラベリング要件に基づいて、ラベリングデータのデータタイプ、ラベリング要素、およびラベリング方式を決定することと、
前記試験ラベリング要件に基づいて、前記ラベリング要素に対応する要求数量範囲、前記ラベリングデータに対応する要求データ量、および前記データタイプに対応する要求シーンタイプセットを決定することと、
前記要求数量範囲を前記ラベリング要素の実数量でカバーし、前記要求シーンタイプセット内の各要求シーンタイプを前記データタイプ内の実シーンタイプでカバーし、実データ量が前記要求データ量以上であるラベリングデータを前記試験ラベリングデータとして決定することと、を実行するようにさらに構成される、
請求項9に記載の装置。 - 前記試験ラベリング時間/ラベリング能力情報決定ユニットは、前記試験ラベリング時間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータのラベリング結果に基づいて、前記試験ラベリングオブジェクトのラベリング能力情報を決定するように構成されたラベリング能力情報決定サブユニットを含み、前記ラベリング能力情報決定サブユニットは、
前記試験ラベリング時間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータの実ラベリング量を決定することと、
前記実ラベリング量と前記試験ラベリングデータの総量との比率に基づいて、試験ラベリング完了率を決定することと、
前記実ラベリング量のラベリング済みデータにおける各前記要求シーンタイプにそれぞれ対応する試験ラベリング精度を決定することと、
前記試験ラベリング精度および前記試験ラベリング完了率に基づいて、異なる要求シーンタイプのラベリングデータについての前記試験ラベリングオブジェクトのラベリング能力情報を決定することと、を実行するようにさらに構成される、
請求項10に記載の装置。 - 前記試験ラベリング時間を構成する各試験ラベリング期間内における前記試験ラベリングオブジェクトの前記試験ラベリングデータの実ラベリング効率を決定するように構成された実ラベリング効率決定ユニットと、
各前記実ラベリング効率における異常ラベリング効率を決定するように構成された異常ラベリング効率決定ユニットと、
前記異常ラベリング効率に対応するラベリング済みデータを前記実ラベリング量および前記ラベリング精度の計算範囲から排除するように構成された異常データ排除ユニットと、をさらに含む、
請求項11に記載の装置。 - 前記試験ラベリング時間/ラベリング能力情報決定ユニットは、前記試験ラベリングオブジェクトの属性に基づいて試験ラベリング時間を決定するように構成された試験ラベリング時間決定サブユニットを含み、前記試験ラベリング時間決定サブユニットは、
前記試験ラベリングオブジェクトの履歴ラベリング記録に基づいて、履歴単回ラベリング時間および履歴ラベリング難度を決定するように構成された履歴ラベリングパラメータ決定モジュールと、
前記試験ラベリングデータの予想ラベリング難度および前記履歴ラベリング難度に基づいて、差異係数を決定するように構成された差異係数決定モジュールと、
前記差異係数に基づいて前記履歴単回ラベリング時間を調整して、前記試験ラベリング時間を取得するように構成された試験ラベリング時間決定モジュールと、を含む、
請求項9に記載の装置。 - 前記試験ラベリング時間決定モジュールは、
前記差異係数が正数である場合、前記差異係数と前記履歴単回ラベリング時間との積を前記試験ラベリング時間として決定することであって、前記差異係数が正数である場合は前記予想ラベリング難度が前記履歴ラベリング難度よりも大きいことを表すことと、
前記差異係数が負数である場合、前記履歴単回ラベリング時間と前記差異係数との商の絶対値を前記試験ラベリング時間として決定することであって、前記差異係数が負数である場合は前記予想ラベリング難度が前記履歴ラベリング難度よりも小さいことを表すことと、を実行するようにさらに構成される、
請求項13に記載の装置。 - 前記試験ラベリングオブジェクト決定ユニットは、
前記ラベリングタスクのラベリング要件に基づいて必要なラベリング能力カテゴリを決定することと、
前記ラベリング能力カテゴリに対応するラベリング能力を有するラベリングオブジェクトを、前記試験ラベリングオブジェクトとして決定することと、を実行するようにさらに構成されており、
それに応じて、前記試験ラベリング時間/ラベリング能力情報決定ユニットは、前記試験ラベリングオブジェクトのラベリング能力情報を決定するように構成されたラベリング能力情報決定サブユニットを含み、前記ラベリング能力情報決定サブユニットは、
前記ラベリング能力カテゴリにおける前記試験ラベリングオブジェクトのラベリング能力値を決定することを実行するようにさらに構成される、
請求項9~14のいずれか一項に記載の装置。 - 前記ラベリング能力カテゴリにおける前記試験ラベリングオブジェクトのラベリング能力値を決定した後、前記試験ラベリングオブジェクトのラベリング能力値に基づいて、適切な比率のラベリングタスクを前記試験ラベリングオブジェクトに割り当てるように構成されたラベリングタスク割り当てユニットをさらに含む、
請求項15に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリと、を含み、
前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶しており、前記命令は、前記少なくとも1つのプロセッサが請求項1~8のいずれか一項に記載のラベリング能力情報決定方法を実行できるように前記少なくとも1つのプロセッサによって実行される、
電子デバイス。 - 請求項1~8のいずれか一項に記載のラベリング能力情報決定方法をコンピュータに実行させるためのコンピュータ命令を記憶する非一時的なコンピュータ可読記憶媒体。
- プロセッサによって実行されると、請求項1~8のいずれか一項に記載のラベリング能力情報決定方法を実行するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110670173.4 | 2021-06-17 | ||
CN202110670173.4A CN113326888B (zh) | 2021-06-17 | 2021-06-17 | 标注能力信息确定方法、相关装置及计算机程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022078060A true JP2022078060A (ja) | 2022-05-24 |
Family
ID=77423406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022018650A Pending JP2022078060A (ja) | 2021-06-17 | 2022-02-09 | ラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220139097A1 (ja) |
EP (1) | EP4089592A1 (ja) |
JP (1) | JP2022078060A (ja) |
KR (1) | KR20220030966A (ja) |
CN (1) | CN113326888B (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015166975A (ja) * | 2014-03-04 | 2015-09-24 | 富士ゼロックス株式会社 | 注釈情報付与プログラム及び情報処理装置 |
US20160275418A1 (en) * | 2012-06-22 | 2016-09-22 | California Institute Of Technology | Systems and Methods for the Determining Annotator Performance in the Distributed Annotation of Source Data |
CN112270533A (zh) * | 2020-11-12 | 2021-01-26 | 北京百度网讯科技有限公司 | 一种数据处理方法、装置、电子设备以及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190030434A (ko) * | 2017-09-14 | 2019-03-22 | 주식회사 세진마인드 | 상표 유사판단 결과에 기초하여 학습된 딥러닝 엔진을 이용한 상표 유사판단 방법, 장치 및 컴퓨터 판독가능한 기록 매체에 저장된 컴퓨터 소프트웨어 |
CN109978356A (zh) * | 2019-03-15 | 2019-07-05 | 平安普惠企业管理有限公司 | 标注任务分配方法、装置、介质和计算机设备 |
CN111080092B (zh) * | 2019-11-29 | 2023-04-18 | 北京云聚智慧科技有限公司 | 数据标注管理方法及装置、电子设备和可读存储介质 |
CN112016053B (zh) * | 2020-08-25 | 2024-08-27 | 北京金山云网络技术有限公司 | 数据标注的考核方法、装置和电子设备 |
CN112163132B (zh) * | 2020-09-21 | 2024-05-10 | 中国建设银行股份有限公司 | 一种数据标注方法、装置、存储介质及电子设备 |
CN112906375B (zh) * | 2021-03-24 | 2024-05-14 | 平安科技(深圳)有限公司 | 文本数据标注方法、装置、设备及存储介质 |
-
2021
- 2021-06-17 CN CN202110670173.4A patent/CN113326888B/zh active Active
-
2022
- 2022-01-14 US US17/576,877 patent/US20220139097A1/en not_active Abandoned
- 2022-02-09 JP JP2022018650A patent/JP2022078060A/ja active Pending
- 2022-02-21 KR KR1020220022103A patent/KR20220030966A/ko not_active Application Discontinuation
- 2022-05-10 EP EP22172474.3A patent/EP4089592A1/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160275418A1 (en) * | 2012-06-22 | 2016-09-22 | California Institute Of Technology | Systems and Methods for the Determining Annotator Performance in the Distributed Annotation of Source Data |
JP2015166975A (ja) * | 2014-03-04 | 2015-09-24 | 富士ゼロックス株式会社 | 注釈情報付与プログラム及び情報処理装置 |
CN112270533A (zh) * | 2020-11-12 | 2021-01-26 | 北京百度网讯科技有限公司 | 一种数据处理方法、装置、电子设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113326888A (zh) | 2021-08-31 |
US20220139097A1 (en) | 2022-05-05 |
KR20220030966A (ko) | 2022-03-11 |
EP4089592A1 (en) | 2022-11-16 |
CN113326888B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111917878B (zh) | 消息处理方法、装置、设备及存储介质 | |
JP2019534487A (ja) | 最適ストラテジーを決定するためのシステムおよび方法 | |
JP7270691B2 (ja) | データをラベリングするための方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
WO2017143773A1 (zh) | 一种众包学习方法及装置 | |
US20240020556A1 (en) | Information processing method and apparatus, server, and user device | |
CN111435367A (zh) | 知识图谱的构建方法、系统、设备及存储介质 | |
WO2017206893A1 (zh) | 界面刷新同步方法、装置、终端及存储介质 | |
CN110083529B (zh) | 自动化测试方法、装置、介质和电子设备 | |
KR102243275B1 (ko) | 오프라인 오브젝트에 관한 콘텐츠 자동 생성 방법, 장치 및 컴퓨터 판독가능 저장 매체 | |
CN111049988A (zh) | 移动设备的亲密度预测方法、系统、设备及存储介质 | |
JP2022078060A (ja) | ラベリング能力情報決定方法、関連する装置、電子デバイス、コンピュータ可読記憶媒体およびコンピュータプログラム | |
CN113343133B (zh) | 显示页面生成方法、相关装置及计算机程序产品 | |
CN115953234A (zh) | 风险评估方法、装置、电子设备及存储介质 | |
CN112817742B (zh) | 数据迁移方法、装置、设备及存储介质 | |
CN115293423A (zh) | 基于自然灾害数据的处理方法、装置、设备及存储介质 | |
CN114116418A (zh) | 信息处理方法及装置、计算机存储介质、电子设备 | |
CN111461891A (zh) | 订单审批的系统、方法、计算机设备及存储介质 | |
CN115292081B (zh) | 信息发送方法、装置、电子设备和介质 | |
US20220126860A1 (en) | Method and apparatus for processing autonomous driving simulation data, and electronic device | |
US20220383626A1 (en) | Image processing method, model training method, relevant devices and electronic device | |
CN111241318B (zh) | 选取对象推送封面图的方法、装置、设备、存储介质 | |
CN112613976A (zh) | 逻辑条件判定方法、装置、介质及电子设备 | |
CN115686722A (zh) | 一种展示内容更新方法、装置、电子设备及存储介质 | |
CN114969543A (zh) | 推广方法、系统、电子设备和存储介质 | |
CN114329399A (zh) | 一种人脸视频的校验方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230516 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231212 |