JP7284786B2 - データをラベリングするための方法、装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラム - Google Patents

データをラベリングするための方法、装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラム Download PDF

Info

Publication number
JP7284786B2
JP7284786B2 JP2021141707A JP2021141707A JP7284786B2 JP 7284786 B2 JP7284786 B2 JP 7284786B2 JP 2021141707 A JP2021141707 A JP 2021141707A JP 2021141707 A JP2021141707 A JP 2021141707A JP 7284786 B2 JP7284786 B2 JP 7284786B2
Authority
JP
Japan
Prior art keywords
labeling
title
type
request
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021141707A
Other languages
English (en)
Other versions
JP2021184316A (ja
Inventor
雪 楊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021184316A publication Critical patent/JP2021184316A/ja
Application granted granted Critical
Publication of JP7284786B2 publication Critical patent/JP7284786B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/235Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Description

本願の実施形態は、コンピュータ技術分野に関し、具体的には、データラベリングおよび深層学習技術分野に関し、特にデータをラベリングするための方法および装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラムに関する。
近年、人工知能アルゴリズムの段階的な実装に伴い、データラベリングのニーズが爆発的に増加しており、ラベリング業務の急成長をもたらした。日々増加するさまざまなラベリングニーズに応えるために、異なるラベリング作業員によるサポートが必要となる。
関連技術では、画像、音声などの異なるラベリングシーンに対して、カスタマイズして対応するラベリングツールを開発した。例えば、画像ラベリングツールは画像フレームをサポートすることができる。さまざまなラベリングツールの開発は大量の労力と物を費やした。
データをラベリングするための方法、装置、電子機器、記憶媒体およびコンピュータプログラムを提供する。
第1の態様によれば、データをラベリングするための方法であって、ラベリング対象データおよび前記ラベリング対象データのラベリング要求(labeling requirements)を取得することと、ラベリング要求を満たすラベリングモードタイプを決定することであって、ラベリングモードタイプはラベリング要求を満たすために、ラベリング対象データをラベリングするための方法のタイプであることと、ラベリング要求に基づき、ラベリングモードタイプに合致するラベリングタイトルを生成することであって、ラベリングタイトルはラベリングツールにラベリングコンテンツを提示するために用いられることと、ラベリングタイトルのタイトル論理関係を決定し、ラベリング対象データ、ラベリングタイトルおよびタイトル論理関係を含むラベリングツールを生成することと、を含む、データをラベリングするための方法を提供する。
第2の態様によれば、ラベリング対象データおよび前記ラベリング対象データのラベリング要求を取得するように構成される取得ユニットと、ラベリング要求を満たすラベリングモードタイプを決定するように構成され、ここで、ラベリングモードタイプはラベリング要求を満たすために、ラベリング対象データをラベリングするための方法のタイプである決定ユニットと、ラベリング要求に基づき、ラベリングモードタイプに合致するラベリングタイトルを生成するように構成され、ここで、ラベリングタイトルはラベリングツールにラベリングコンテンツを提示するために用いられるタイトル生成ユニットと、ラベリングタイトルのタイトル論理関係を決定し、ラベリング対象データ、ラベリングタイトル、およびタイトル論理関係を含むラベリングツールを生成するように構成されるツール生成ユニットと、を含む、データをラベリングするための装置を提供する。
第3の態様によれば、少なくとも1つのプロセッサと、少なくとも1つのプロセッサと通信可能に接続されたメモリとを備える電子機器であって、メモリには、少なくとも1つのプロセッサによって実行可能な指令が格納され、指令が少なくとも1つのプロセッサによって実行されると、少なくとも1つのプロセッサにデータをラベリングするための方法のうちのいずれかの実施形態の方法を実行させる、電子機器を提供する。
第4の態様によれば、コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、コンピュータ指令はコンピュータにデータをラベリングするための方法のうちのいずれかの実施形態の方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体を提供する。
第5の態様によれば、プロセッサによって実行されると、データをラベリングするための方法のうちのいずれかの実施形態の方法が実現されるコンピュータプログラムを提供する。
本願の解決手段によれば、異なるラベリング対象データとラベリング要求に対して、ラベリングモードタイプを決定することができ、それによりラベリング要求に対する適切な評価方法を見つけ、具体的なラベリング要求シーンに適合したラベリングツールを自動的、柔軟にカスタマイズすることができる。
本願の他の特徴、目的および利点は、以下の図面を参照してなされる非限定的な実施形態に係る詳細な説明を読むことにより、より明らかになる。
本願のいくつかの実施形態を適用可能な例示的なシステムアーキテクチャを示す図である。 本願に係るデータをラベリングするための方法の一実施形態を示すフローチャートである。 本願に係るデータをラベリングするための方法の一応用シーンを示す概略図である。 本願に係るデータをラベリングするための方法のもう一つの実施形態を示すフローチャートである。 本願に係るデータをラベリングするための方法の校正タイトルのラベリングコンテンツを示す概略図である。 本願のデータをラベリングするための方法に基づくラベリング対象データのラベリングモードタイプが転写タイプである場合に得られるラベリングツールの概略図である。 本願のデータをラベリングするための方法によるラベリング対象データのラベリングモードタイプが転写タイプである場合に得られるもう1つのラベリングツールの概略図である。 本願に係るデータをラベリングするための装置の一実施形態を示す構造概略図である。 本願に係るデータをラベリングするための装置のもう1つの実施形態を示す構造概略図である。 本願の実施形態に係るデータをラベリングするための方法が実装されるための電子機器のブロック図である。
以下は図面を参照して本願の例示的な実施形態を説明し、ここでは理解を助けるため、本願の実施形態の様々な詳細が記載されるが、これらは単なる例示であるに過ぎない。従って、本願の範囲および要旨を逸脱しない限り、当業者が本明細書の実施形態に対して様々な変更と修正を行うことができることを理解すべきである。なお、以下の説明では、明確化および簡略化のため、公知の機能および構成については説明を省略する。
なお、本願の実施形態および実施形態における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、図面および実施形態を参照しながら本願を詳細に説明する。
図1は、本願に係るデータをラベリングするための方法またはデータをラベリングするための装置の実施形態が適用可能な例示的なシステムアーキテクチャ100を示している。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103と、ネットワーク104と、サーバ105とを含んでもよい。ネットワーク104は、端末装置101、102、103とサーバ105との間で通信リンクを提供するための媒体として使用される。ネットワーク104は、有線、無線通信リンクまたは光ファイバケーブルなどの様々なタイプの接続を含んでもよい。
ユーザは、メッセージを送受信する等のために、端末装置101、102、103を使用してネットワーク104を介してサーバ105と情報のやり取りをすることができる。端末装置101、102、103には、例えば、映像アプリケーション、生放送アプリケーション、インスタントコミュニケーションツール、メールボックスクライアント、ソーシャルプラットフォームソフトウェア等のような様々な通信クライアントアプリケーションをインストールすることができる。
端末装置101、102、103は、ハードウェアでもよく、ソフトウェアでもよい。端末装置101、102、103がハードウェアである場合、様々な電子機器であってもよく、スマートフォン、タブレットコンピュータ、電子書籍リーダ、ラップトップコンピュータおよびデスクトップコンピュータなどを含むが、これらに限定されない。端末装置101、102および103がソフトウェアである場合、上記の電子機器にインストールされてもよい。複数のソフトウェアまたはソフトウェアモジュール(例えば、分散サービスを提供するための複数のソフトウェアまたはソフトウェアモジュール)として実装されてもよく、または単一のソフトウェアまたはソフトウェアモジュールとして実装されてもよい。ここでは特に限定しない。
サーバ105は、様々なサービスを提供するサーバ、例えば、端末装置101、102、103をサポートするバックエンドサーバであってもよい。バックエンドサーバは、ラべリング対象データなどのデータに対して解析等の処理を行い、且つ処理結果(例えば、ラべリングツール)を端末装置にフィードバックすることができる。
なお、本願の実施形態により提供されるデータをラベリングするための方法はサーバ105または端末装置101、102、103により実行され得、それにより、データをラベリングするための装置はサーバ105または端末装置101、102、103に設けられてもよい。
なお、図1における端末装置、ネットワークおよびサーバの数は例示的なものに過ぎない。実装の必要性に応じて、端末装置、ネットワークおよびサーバの数を任意に加減してもよい。
次に、本願に係るデータをラベリングするための方法の一実施形態のフロー200を示す図2を参照する。このデータをラベリングするための方法は、次のステップ(ステップ201~204)を含む。
ステップ201、ラベリング対象データおよびラベリング対象データのラベリング要求を取得する。
本実施形態において、データをラベリングするための方法を実行する実行主体(例えば図1に示すサーバまたは端末装置)は、ラベリング対象データ及び該ラベリング対象データをラベリングするためのラベリング要求を取得することができる。ラベリング要求とは、ラベリング対象データに対してラベリングが必要であること、すなわちラベリングがどのような目的を達成しようとするのかをいう。
具体的には、ラベリング対象データのタイプ、すなわちラベリング対象データタイプは、画像、音声、映像、テキスト、点群、およびウェブページを含んでもよい。つまり、これらはすべてラベリングされ得る。具体的には、ラベリング対象データの数は、1つまたは少なくとも2つ、例えば10枚の画像であってもよい。
ステップ202、ラベリング要求を満たすラベリングモードタイプを決定し、ここで、ラベリングモードタイプは、ラベリング要求を満たすためにラベリング対象データに対して使用されるラベリング方式のタイプである。
本実施形態において、上記実行主体はラベリング要求を満たすラベリングモードタイプを決定することができる。ラベリングモードタイプは、ラベリング要求を満たすために、ラベリング対象データに採用されるラベリング方式のタイプである。例えば、ラベリングモードタイプは抽出タイプであり、該抽出タイプに含まれるラベリング方式は音声インターセプション、画像インターセプションなどを含んでもよい。
実際には、上記実行主体は、様々な方法で、ラベリング要求を満たすラベリングモードタイプを決定することができる。例えば、上記実行主体はラベリング要求、ラベリングモードタイプとの間のマッピング関係(すなわち対応関係表)を取得し、且つラベリング要求のマッピングされたラベリングモードタイプを探すことができる。また、上記実行主体は、ラベリング要求を既定モデルに入力し、当該既定モデルから出力されるラベリングモードタイプを取得するようにしてもよい。該既定モデルは、ラベリング要求によってラベリングモードタイプを決定(例えば、予測)するために用いられる。
あるいは、上記実行主体は、ラベリング対象データのラベリング対象データのタイプを取得し、ラベリング対象データのタイプとラベリング要求の両方に基づいて、ラベリングモードタイプを決定してもよい。例えば、上記実行主体は、ラベリング要求とラベリング対象データタイプを事前設定モデルに入力し、該事前設定モデルから出力されたラベリングモードタイプを得ることができる。この事前設定モデルは、ラベリング要求とラベリング対象データタイプにより、ラベリングモードタイプを決定(例えば、予測)するために使用され得る。また、ラベリング対象データタイプとラベリング要求の両方と、ラベリングモードタイプとの間のマッピングを取得して、取得したラベリング要求のラベリングモードタイプを決定してもよい。
ステップ203、ラベリング要求に基づいて、ラベリングモードタイプに適合したラベリングタイトルを生成し、ここで、ラベリングタイトルはラベリングツールにラベリングコンテンツを提示するために用いられる。
本実施形態において、上記実行主体はラベリング要求に基づき、ラベリングモードタイプに適合したラベリングタイトルを生成することができる。実際に、上記実行主体は様々な方式でラベリングモードタイプに適合したラベリングタイトルを生成してもよい。例えば、上記実行主体は、指定モデルにラベリング要求とラベリングモードタイプを入力し、その指定モデルから出力されたラベリングタイトルを取得してもよい。該指定モデルは、ラベリング要求とラベリングモードタイプを使用して、ラベリングモードタイプに適合したラベリングタイトルを決定(例えば、予測)するために使用される。また例えば、上記実行主体は、ラベリング要求、ラベリングモードタイプの両者と、ラベリングタイトルとのマッピング関係を取得し、ラベリング要求、ラベリングモードタイプがマッピングされたラベリングタイトルを探すことができる。
上記の既定モデル、事前設定モデルおよび指定モデルのいずれかは、各種の数式、アルゴリズムまたは深層ニューラルネットワークなどであってもよい。
具体的には、ラベリングタイトルは、ラベリングツールにおいて、ラベリングコンテンツを(ラベリング作業員に)提示するために使用される。例えば、ラベリングタイトルは「画像がクリアであるか」、及び「はい」と「いいえ」の2つのオプションである。このラベリングタイトルは、ラベリングコンテンツが「はい」と「いいえ」の2つのオプションがそれぞれ対応する「画像がクリアである」と「画像がクリアでない」ことを提示するために使用できる。
ステップ204、ラベリングタイトルのタイトル論理関係を決定し、ラベリング対象データ、ラベリングタイトルおよびタイトル論理関係を含むラベリングツールを生成する。
本実施形態において、上記実行主体はラベリングツールを生成することができ、具体的には、該ラベリングツールはラベリング対象データおよびラベリングタイトルを含む。ラベリングツールはラベリングコンテンツ、すなわちラベリングすべきコンテンツをラベリング作業員に提示するために使用することができ、このようにして、ラベリング作業員は該ラベリングツールを使用してラベリング対象データをラベリングすることができる。
タイトル論理関係とはラベリングタイトル間の論理関係をいう。ラベリングタイトルが1つ存在する場合、決定されたタイトル論理関係はNULLであり、ラベリングタイトルが少なくとも2つ存在する場合、決定されたタイトル論理関係は各ラベリングタイトル間の関係になる。具体的には、タイトル論理関係は、様々な方式によって決定することができ、例えば、ラベリングタイトルにそれぞれ対応するラベリングモードタイプと、ラベリングタイトルにそれぞれ対応するラベリングモードタイプに予め設定された対応関係(例えば、対応関係テーブルまたはモデル)に基づいて決定され、該対応関係は、ラベリングタイトルにそれぞれ対応するラベリングモードタイプとタイトル論理関係との間の対応関係を示すことができる。
タイトル論理関係は例えばラベリング順序など、様々な関係であってもよい。ラベリング順序とは、ラベリングタイトル間の表示順序を指し、同時にラベリング作業員によるラベリングタイトルの完了順序でもあり、およびラベリングタイトルに関するラベリングコンテンツの生成順序でもある。
本願の上記実施形態により提供される方法は、異なるラベリング対象データとラベリング要求に対し、ラベリングモードタイプを決定することができ、それによりラベリング要求に対する適切な評価方法を見つけ、具体的なラベリング要求シーンに適合したラベリングツールを自動的、柔軟にカスタマイズすることができる。
次に、図3を参照し、図3は、本実施形態に係るデータをラベリングするための方法の応用シーンを示す概略図である。図3の応用シーンにおいて、実行主体301は、ラベリング対象データ302およびラベリング対象データのラベリング要求303を取得し、ラベリング要求303に基づいて、ラベリング要求303を満たすラベリングモードタイプ304を決定し、ラベリングモードタイプは、ラベリング要求を満たすためにラベリング対象データに用いられるラベリング方式のタイプである。実行主体301は、ラベリング要求303に基づいて、ラベリングモードタイプ304に適合したラベリングタイトル305を生成し、ここで、ラベリングタイトル305はラベリングツールにラベリングコンテンツを提示するために使用される。実行主体301は、ラベリングタイトルのタイトル論理関係を判定し、ラベリング対象データ301と、ラベリングタイトル305と、タイトル論理関係とを含むラベリングツール306を生成する。
本願のいずれかの実施形態のいくつかのオプション的な実施形態において、前記ラベリングモードタイプは必要なラベリングモードタイプを含み、または必要なラベリングモードタイプおよび付加的なラベリングモードタイプを含む。
これらのオプション的な実施形態では、ラベリング要求ごとのラベリングモードタイプは、少なくとも1つであってもよく、すなわち、1つまたは少なくとも2つであってもよい。必要なラベリングモードタイプとは、ラベリング要求が直接指示する、必要なラベリングモードタイプである。付加的なラベリング方式は、ラベリング効果を高め、より良い訓練サンプルを得るためのラベリング方式である。
例えば、ラベリング要求は、画像内の障害物をラベリングすることであり、すると、必要なラベリングモードタイプは、画像内にターゲットボックスをラベリングする抽出タイプであってもよい。ラベリングの最終的な目的は、モデルを訓練するためのサンプルを生成することであるので、画像が非常にぼやけている場合には、訓練するためのサンプルとすることができなくなる。したがって、フィルタリング画像(すなわち、スクリーニング画像)を含むクレンジングタイプを付加的なラベリングモードタイプとすることができ、ここようにすると、解像度が低い(例えば、閾値より低い)画像を最初にフィルタリングすることができる。すなわち、画像の解像度が低い場合には、フィルタリングされ、抽出タイプのラベリングタイトルのラベリングを経ることはない。
これらの実施形態において、必要なラベリングモードタイプと付加的なラベリングモードタイプを採用することができ、より全面的で、正確なラベリング過程を実現し、さらに正確なトレーニングサンプルを生成する。
これらの実施形態のいくつかのオプション的な応用シーンにおいて、少なくとも1つのラベリングモードタイプは必要なラベリングモードタイプと付加的なラベリングモードタイプを含む。上記ラベリングタイトルのタイトル論理関係を決定し、ラベリング対象データとラベリングタイトルを含むラベリングツールを生成することは、必要なラベリングモードタイプと付加的なラベリングモードタイプにそれぞれ対応するラベリングタイトルの間のタイトル論理関係を決定することであって、タイトル論理関係はラベリング順序および/または表示制限関係を含むことと、ラベリング対象データ、タイトル論理関係およびラベリングタイトルを含むラベリングツールを生成することとを含む。
これらの応用シーンでは、ラベリングツールにはタイトル論理関係も含まれ得る。上記実行主体は、異なるラベリングモードタイプに対応するラベリングタイトル間のタイトル論理関係を決定することができる。異なるラベリングモードタイプに対応するラベリングタイトル間のタイトル論理関係は、予め設定されたものでもよく、モデル(例えば予め訓練された深層ニューラルネットワーク)によってリアルタイムに決定したものでもよい。ラベリングモードタイプに対応するラベリングタイトルとは、そのラベリングモードタイプに適合したラベリングタイトルをいう。
表示制限関係とは、ラベリング順序が先であるラベリングタイトルのラベリングコンテンツが、ラベリング順序が後であるラベリングタイトルが表示状態であるか否かに影響を及ぼし、表示状態はユーザ(すなわち、ラベリング作業員)が該ラベリングタイトルに対して作業可能であるか否かを示す。
これらのオプション的な応用シーンは、ラベリングツールにタイトル論理関係を追加することができ、これにより、無効なラベリングまたは効果の悪いラベリングを回避させ、ラベリングの効率とラベリングの精度を向上させる。
オプション的に、必要なラベリングモードタイプと付加的なラベリングモードタイプはそれぞれ抽出タイプとクレンジングタイプであり、タイトル論理関係はラベリング順序と表示制限関係を含み、ラベリング順序はクレンジングタイプのラベリングタイトルのラベリングコンテンツを受信した後、抽出タイプのラベリングタイトルのラベリング動作を受信することを示す。ラベリングツールの表示過程は、ラベリングツールにおけるクレンジングタイプに対応するラベリングタイトルに対するラベリング動作を受信したことに応答し、該ラベリング動作のラベリングコンテンツを決定し、表示制限関係と該ラベリングコンテンツに基づいて、抽出タイプに対応するラベリングタイトルの表示状態を決定することであって、表示状態は動作可能表示状態または動作不可表示状態であることと、決定された表示状態が動作可能表示状態であることに応答し、動作可能な状態で抽出タイプに対応するラベリングタイトルを表示することと、決定された表示状態は動作不可表示状態であることに応答し、動作不可能な状態で抽出タイプに対応するラベリングタイトルを表示し、または抽出タイプに対応するラベリングタイトルを表示しないこととを含む。
具体的には、ラベリング順序は、ラベリング作業員がまずクレンジングタイプのラベリングタイトルに対してラベリング動作を行い、その後抽出タイプのラベリングタイトルに対してラベリング動作を行うようにする。画像を例示する、表示制限関係は、クレンジングタイプに対応するラベリングタイトルのラベリングコンテンツが画像の解像度が低いことを示す場合、抽出タイプに対応するラベリングタイトルの表示状態が動作不可表示状態であることを示す。ラベリング順序は、クレンジングタイプのラベリングタイトルのラベリングコンテンツを受信する前に、抽出タイプのラベリングタイトルのラベリング動作が使用禁止されることを示す。ラベリング動作が使用禁止されることは、電子機器がラベリング動作を受信できないことを意味するもので、このように、ユーザはラベリングタイトルに対してラベリング動作を行うことができない。
動作不可状態で表示されているラベリングタイトルは、ユーザがそれに対して動作できない特性を示す。例えば、ラベリングタイトルを動作不可状態で表示することは、そのラベリングタイトルの色の深さを暗くしたり、「使用不可」などの文字を表示したりすることができる。
これらのオプション的な応用シーンは、タイトル論理関係を介して、ラベリング作業員のラべリング動作を案内し、かつ表示を介して有効な動作制限を行うことにより、ラベリング作業員が無効なラベリングを行うこと又は効果の悪いラベリングを行うことを避けることができる。
更に、データをラベリングするための方法のもう一つの実施形態のフロー400を示す図4Aを参照する。該フロー400は、次のステップを含む。
ステップ401、ラベリング対象データおよびラベリング対象データのラベリング要求を取得する。
本実施形態において、データをラベリングするための方法が実行される実行主体(例えば図1に示すサーバまたは端末装置)は、ラベリング対象データ及び該ラベリング対象データをラベリングするためのラベリング要求を取得することができる。ラベリング要求とは、ラベリング対象データに対してラベリングが必要であること、すなわちラベリングがどのような目的を達成するかをいう。
ステップ402、ラベリング要求を満たすラベリングモードタイプを決定し、ここで、ラベリングモードタイプは、ラベリング要求を満たすためにラベリング対象データに採用されるラベリング方式のタイプである。
本実施形態において、上記実行主体はラベリング要求を満たすラベリングモードタイプを決定することができる。ラベリングモードタイプは、ラベリング要求を満たすために、ラベリング対象データに採用されるラベリング方式のタイプである。例えば、ラベリングモードタイプは抽出タイプであり、該抽出タイプに含まれるラベリング方式は音声インターセプション、画像インターセプションなどを含んでもよい。
ステップ403、ラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプの中から、ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定する。
本実施形態において、上記実行主体はラベリング要求に基づき、ラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプにおいて、ラベリングタイトルタイプ(例えば1つのラベリングタイトルタイプ)をターゲットタイトルタイプとして決定することができる。
実際には、ラベリングモードタイプごとに、対応する少なくとも1つのラベリングタイトルタイプが存在する。例えば、ラベリングモードタイプがクレンジングタイプである場合、ラベリングタイトルタイプは、選択肢選択タイプとドロップダウンボックス選択タイプとを含んでもよい。ここで、選択肢選択タイプには、選択肢単一選択、選択肢複数選択が含まれる。ドロップダウンボックス選択タイプは、ドロップダウンボックス単一選択とドロップダウンボックス複数選択を含んでもよい。したがって、ラベリングタイトルタイプは、選択肢単一選択、選択肢複数選択、ドロップダウンボックス単一選択、およびドロップダウンボックス複数選択の4つのタイトルタイプに対応することができる。
上記実行主体は、少なくとも1つのラベリングタイトルタイプのうち、ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定してもよい。例えば、ラベリングタイトルタイプは4種類あり、それぞれ選択肢単一選択、選択肢複数選択、ドロップダウンボックス単一選択、ドロップダウンボックス複数選択である。ラベリング要求が「ラベリング画像がクリアであるか否か」を含む場合、上記実行主体は、当該ラベリング要求に適合したラベリングタイトルタイプが選択肢単一選択であると決定することができる。
オプション的に、ターゲットタイトルタイプを決定する場合、さらにラベリング対象データタイプに基づいて決定することができる。ラベリング対象データタイプとターゲットタイトルタイプとは対応関係が存在し得る。もちろん、ラベリング対象データタイプはラベリング要求から取得されてもよい。このように、上記実行主体は、ラベリング対象データタイプとラベリング要求とを組み合わせて、ターゲットタイトルタイプを総合的に決定することができる。
ステップ404、ラベリング要求に基づき、ターゲットタイトルタイプのラベリングタイトルを生成し、ここで、ラベリングタイトルはラベリングツールにラベリングコンテンツを提示するために用いられる。
本実施形態では、上記実行主体はラベリング要求に基づき、ターゲットタイトルタイプのラベリングタイトルを生成することができ、すなわち、生成された該ラベリングタイトルは該ターゲットタイトルタイプに適合している。
実際に、上記実行主体は様々な方式を採用してラベリング要求に応じて、ターゲットタイトルタイプのラベリングタイトルを生成することができる。例えば、上記実行主体は、ラベリング要求およびターゲットタイトルタイプを所定のモデルに入力し、当該所定のモデルから出力されたラベリングタイトルを取得することができる。当該所定のモデルは、ラベリング要求およびターゲットタイトルタイプに基づいて、ラベリングタイトルを決定(例えば、予測)することができる。さらに、上記実行主体は、ラベリング要求と候補ラベリングタイトルとの間のマッピング関係を取得し、取得したラベリング要求がマッピングされている候補ラベリングタイトルを該マッピング関係から探し、その中からターゲットタイトルタイプに適合したラベリングタイトルを見つけることができる。
ステップ405、ラベリングタイトルのタイトル論理関係を決定し、ラベリング対象データ、ラベリングタイトルおよびタイトル論理関係を含むラベリングツールを生成する。
本実施形態において、上記実行主体はラベリングツールを生成することができ、具体的には、該ラベリングツールはラベリング対象データ、ラベリングタイトルおよびタイトル論理関係を含む。ラベリングツールはラベリングコンテンツ、すなわちラベリングすべきコンテンツをラベリング作業員に提示するために使用することができ、このようにすれば、ラベリング作業員は該ラベリングツールを使用してラベリング対象データをラベリングすることができる。
本実施形態は、まずラベリング要求に基づき、ラベリングタイトルのタイプを限定し、且つ該タイプに適合するラベリングタイトルを生成することができ、それによりラベリングタイトルを生成する精度を向上させることができる。
本実施形態のいくつかのオプション的な実施形態において、ラベリング要求に基づき、ターゲットタイトルタイプのラベリングタイトルを生成することは、ラベリング要求が予め設定された校正の必要な要求であることに応答し、ターゲットタイトルタイプのラベリングタイトル、および校正の必要な要求に対応する校正タイトルを生成することを含み、ここで、校正タイトルのラベリングコンテンツは、ラベリングタイトルのラベリングコンテンツを調整するために用いられる。
これらのオプション的な実施形態において、上記実行主体はラベリング要求が予め設定された校正の必要な要求である場合、該ターゲットタイトルタイプのラベリングタイトルを生成するだけでなく、上記校正の必要な要求に対応する校正タイトル、すなわち校正に用いられるラベリングタイトルを生成することができる。校正タイトルのラベリングコンテンツとラベリングタイトルのラベリングコンテンツを決定した後、ユーザ(例えば、ラベリング作業員)は校正タイトルのラベリングコンテンツを利用して、ラベリングタイトルのラベリングコンテンツを調整することができる。
例えば、図4bに示すように、図中の矢印が指すキーポイントは、ラベリングタイトルのラベリングコンテンツである。このキーポイントを中間点とする3つのキーポイントの連結線(補助線)は、校正タイトルのラベリングコンテンツである。該連結線における該キーポイントを頂点とする角度は180°よりも大きく、予め設定された、該キーポイントに対応する角度閾値に合致しない。したがって、上記角度が180°以下になるように、このキーポイントの位置を調整することができる。
上記校正タイトルは、校正の必要な要求から直接生成するものであってもよく、例えば、校正の必要な要求を予め訓練されたモデルに入力するか、または予め設定されたマッピング関係に基づいて決定することができる。あるいは、他のパラメータを使用して校正タイトルを生成することもできる。例えば、他のパラメータはターゲットタイトルタイプを含んでもよい。
これらの実施形態は、校正に用いられるラベリングコンテンツにより、ラベリングタイトルのラベリングコンテンツを調整し、それによりラベリングの精度を向上させることができる。
具体的には、ステップ402において、ラベリング要求を満たすラベリングモードタイプを決定することは、ラベリング要求にラベリング対象データのフィルタリングが含まれることに応答して、ラベリング対象データのラベリングモードタイプがクレンジングタイプであると決定することであって、クレンジングタイプは、ラベリング対象データがフィルタリング対象データであるか否かを決定すること、または、ラベリング対象データのうちフィルタリング対象データの一部を決定することを示すために用いられることと、ラベリング要求にラベリングデータの転写が含まれることに応答して、ラベリング対象データのラベリングモードタイプが転写タイプであると決定することと、ラベリング要求がラベリングデータの採集を含むことに応答して、ラベリング対象データのラベリングモードタイプがエンリッチメントタイプであると決定することと、ラベリング要求がラベリングデータの抽出を含むことに応答して、ラベリング対象データのラベリングモードタイプが抽出タイプであると決定することとを含んでもよい。
ステップ403は、ラベリングモードタイプがターゲットタイプであると決定することに応答し、ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプを取得することと、ラベリング要求が事前設定要求であると判定したことに応答し、該事前設定要求に対応するタイトルタイプを、ターゲットタイトルタイプとすることとを含んでもよい。
ターゲットタイプがクレンジングタイプであることに応答して、事前設定要求が直接選択要求である場合、ターゲットタイトルタイプは選択肢選択タイプであり、事前設定要求がファジー検索要求である場合、ターゲットタイトルタイプはドロップダウンボックス選択タイプである。ターゲットタイプが転写タイプであることに応答して、事前設定要求が少ないコンテンツの転写要求である場合、ターゲットタイトルタイプは一行テキストタイトルであり、事前設定要求がマルチコンテンツの転写要求である場合、ターゲットタイトルタイプは複数行テキストタイトルである。ターゲットタイプがエンリッチメントタイプであることに応答して、事前設定要求が少ないコンテンツのエンリッチメント要求である場合、ターゲットタイトルタイプは一行テキストタイトルであり、事前設定要求がマルチコンテンツのエンリッチメント要求である場合、ターゲットタイトルタイプは複数行テキストタイトルである。
本実施形態のいくつかのオプション的な実施形態において、ステップ402におけるラベリング要求を満たすラベリングモードタイプを決定することは、ラベリング要求がラベリング対象データのフィルタリングを含むことに応答して、ラベリング対象データのラベリングモードタイプがクレンジングタイプであることを決定することを含み得、ここで、クレンジングタイプはラベリング対象データがフィルタリング対象データであるか否かを判定することを示すために用いられるか、またはラベリング対象データのうちフィルタリング対象データの一部を決定することを示すために用いられる。
これらのオプション的な実施形態において、上記実行主体はラベリング要求に含まれたラベリングデータフィルタリングを含む場合、ラベリング対象データのラベリングモードタイプはクレンジングタイプであると決定することができる。具体的には、ラベリングモードタイプがクレンジングタイプである可能性があるラベリング対象データタイプは、画像、テキスト、映像、音声、ウェブページ、および点群(すなわち、点群画像などのような点群情報)を含んでもよい。
ラベリング対象データのフィルタリング、つまり「データクレンジング」は、ラベリング対象データがフィルタリング対象データであるか否かを特定すること、またはラベリング対象データのうちフィルタリング対象データの一部を特定することを示すことを目的としている。ここでのフィルタリングとは、除去または削除を指す。
一例として、上記のクレンジングは、ラベリング作業員が画像に対して、クリアな画像であるかまたはクリアでない画像であるかを示すことができ、ラベリング要求に応じて、フィルタリングされるのはクリアな画像またはクリアでない画像であってもよい。あるいは、クレンジングは、ラベリング作業員がテキストにおいて血なまぐさいコンテンツに関わる文がラベリングされた場合、その文をフィルタリングして除去してもよい。
これらの実施形態は要求の具体的な情報をラベリングすることにより、クレンジングタイプのラベリングモードタイプを正確に決定することができる。
オプションとして、ステップ403は、ラベリングモードタイプがクレンジングタイプであることに応答し、ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプを取得することと、ラベリング対象データのフィルタリングが直接選択要求であることに応答し、該少なくとも2つのラベリングタイトルタイプにおける選択肢選択タイプをターゲットタイトルタイプとすることと、ラベリング対象データのフィルタリングがファジー検索要求であることに応答し、該少なくとも2つのラベリングタイトルタイプにおけるドロップダウンボックス選択タイプをターゲットタイトルタイプとすることとを含んでもよい。
具体的には、ラベリングモードタイプがクレンジングタイプである場合、ラベリングモードタイプは少なくとも2つのラベリングタイトルタイプに対応することができる。例えば、上述した選択肢単一選択、選択肢複数選択、ドロップダウンボックス単一選択、ドロップダウンボックス複数選択であってもよい。
ラベリング要求であるラベリング対象データのフィルタリングが、ラベリング作業員が選択肢の中から回答を直接選択する必要があることを示す直接選択要求である場合、上記実行主体は、上記少なくとも2つのラベリングタイトルタイプのうちの選択肢選択タイプをターゲットタイトルタイプとすることができる。ラベリング要求であるラベリング対象データのフィルタリングが、ラベリング作業員によるファジー検索が必要であることを示すモデル検索要求である場合、上記実行主体は、少なくとも2つのラベリングタイトルタイプのうちドロップダウンボックス選択タイプをターゲットタイトルタイプとすることができる。
ここでのファジー検索とは、ドロップダウンボックスに対応する元となるボックス(すなわち、ドロップダウンボックスの上方にドロップダウンボックスに接続されたボックス)にカテゴリが表示され、ドロップダウンボックスにはそのカテゴリの下のそれぞれのオブジェクトが表示されることをいう。例えば、元となるボックスには「ミネラルウォーター」が表示され、ドロップダウンボックスには「Aブランドミネラルウォーター」、「Bブランドミネラルウォーター」、「Cブランドミネラルウォーター」が表示され、ラベリング作業員の選択に供している。
これらのオプションの実施形態は、ラベリング要求がそれぞれ直接選択要求とファジー検索要求を示す場合に、異なるラベリングタイトルタイプにそれぞれ対応したターゲットタイトルタイプとすることができる。
本実施形態のいくつかのオプション的な実施態様では、ステップ402におけるラベリング要求を満たすラベリングモードタイプを決定することは、ラベリング要求にラベリングデータの転写を含むことに応答して、ラベリング対象データのラベリングモードタイプを転写タイプと決定することを含んでいてもよい。
これらのオプション的な実施形態において、上記実行主体はラベリング要求がラベリングデータの転写を含む場合、ラベリング対象データのラベリングモードタイプが転写タイプであると決定することができる。具体的には、ラベリングモードタイプが転写タイプの可能性のあるラベリング対象データタイプは、画像、テキスト、映像、音声、およびウェブページを含み得る。
転写とは、非テキスト系のデータをテキストに変換する要求をいい、具体的には、音声転写、映像転写、画像コンテンツの要約転写、テキストコンテンツの要約転写またはウェブページコンテンツの要約転写などが挙げられる。
これらの実施形態は要求の具体的な情報をラベリングすることにより、転写タイプのラベリングモードタイプを正確に決定することができる。
オプションとして、ステップ403は、ラベリングモードタイプが転写タイプである場合、ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプを取得することと、ラベリングデータ転写が少ないコンテンツの転写要求である場合、該少なくとも2つのラベリングタイトルタイプにおける一行テキストタイトルタイプをターゲットタイトルタイプとすることと、ラベリングデータ転写がマルチコンテンツの転写要求である場合、該少なくとも2つのラベリングタイトルタイプにおける複数行テキストタイトルタイプをターゲットタイトルタイプとすることとを含んでいてもよい。
具体的には、ラベリングモードタイプが転写タイプである場合、ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプは、一行テキストタイトルタイプと複数行テキストタイトルタイプを含んでいてもよい。上記実行主体は、ラベリング要求に含まれるラベリングデータ転写が、少ないコンテンツの転写要求であるか、またはマルチコンテンツの転写要求であるかを判断することができる。
上記実行主体は、ラベリング対象データの転写後のテキストの長さの数値(文字数、キャラクター数、行数など)に設定された閾値を取得してもよい。取得したラベリング対象データの転写後のテキストの長さの数値がこの閾値を超えていなければ、上記ラベリングデータの転写は少ないコンテンツの転写要求であると判断することができる。取得したラベリング対象データの転写後のテキストの長さの数値がこの閾値を超えている場合、上記ラベリングデータの転写がマルチコンテンツの転写要求であると判断することができる。また、上記実行主体は、取得したラベリング対象データの転写後のテキストの長さの数値をモデルまたは数式に入力し、該モデルまたは数式により計算された結果を得ることができ、該結果は、上記ラベリングデータの転写が少ないコンテンツの転写要求またはマルチコンテンツの転写要求であることを直接示すことができる。
ここでの一行テキストタイトルタイプとは、図4Cに示すように一行のテキストで転写結果を表示することを意味してもよい。図4Cには、ラベリング対象データが音声であること、生成されたラベリングタイトルが4つの選択肢からの単一選択であること、および1つの一行テキストタイトルであることが示されている。
複数行テキストタイトルタイプとは、図4Dに示すように、転写結果を複数行テキストタイトルタイプで表示することをいう。図4Dには、ラベリング対象データが映像であることと、生成されたラベリングタイトルは1つの複数行テキストタイトルであることとが示されている。
これらのオプション的な実施形態は、転写要求がそれぞれ少ないコンテンツの転写要求およびマルチコンテンツの転写要求を示す場合に、少ないコンテンツの転写要求およびマルチコンテンツの転写要求にそれぞれ対応した異なるラベリングタイトルタイプをターゲットタイトルタイプとすることができる。
本実施形態のいくつかのオプション的な実施形態において、ステップ402においてラベリング要求を満たすラベリングモードタイプを決定することは、ラベリング要求にラベリングデータ採集を含む場合、ラベリング対象データのラベリングモードタイプがエンリッチメントタイプであると決定することを含んでいてもよい。
これらのオプション的な実施形態では、ラベリング要求がラベリングデータ採集を含む場合、上記実行主体はラベリング対象データのラベリングモードタイプがエンリッチメントタイプであると決定することができる。ラベリングモードタイプがエンリッチメントタイプである場合、ラベリング対象データのタイプはテキストである。
ここでのエンリッチメントとは、人と人との対話、人間と機械との対話のシーンの中で行われるテキスト採集を意味してもよい。
これらの実施形態は要求の具体的な情報をラベリングすることにより、エンリッチメントタイプのラベリングモードタイプを正確に決定することができる。
オプションとして、ステップ403は、ラベリングモードタイプがエンリッチメントタイプである場合、ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプを取得することと、ラベリングデータ採集が少ないコンテンツの採集要求である場合、該少なくとも2つのラベリングタイトルタイプにおける一行テキストタイトルタイプをターゲットタイトルタイプとすることと、ラベリングデータ採集がマルチコンテンツの採集要求である場合、該少なくとも2つのラベリングタイトルタイプにおける複数行テキストタイトルタイプをターゲットタイトルタイプとすることと、を含んでもよい。
具体的には、上記実行主体はラベリング対象データのエンリッチメントをしたテキストの長さ数値(例えば漢字の文字数、文字数、行数)に設定された閾値を取得することができる。取得したラベリング対象データのエンリッチメントをしたテキストの長さ数値がこの閾値を超えていなければ、上記ラベリングデータのエンリッチメントが少ないコンテンツのエンリッチメント要求であると決定することができる。取得したラベリング対象データのエンリッチメントをしたテキストの長さ数値がこの閾値を超えていれば、上記ラベリングデータのエンリッチメントがマルチコンテンツのエンリッチメント要求であると決定することができる。また、上記実行主体は、取得したラベリング対象データのエンリッチメントをしたテキストの長さ数値をモデルまたは公式に入力して、モデルまたは公式によって計算された結果を取得することができ、該結果は上記ラベリングデータのエンリッチメントが少ないコンテンツのエンリッチメント要求であるかまたはマルチコンテンツのエンリッチメント要求であるかを直接示すことができる。
これらのオプション的な実施形態は、エンリッチメント要求がそれぞれ少ないコンテンツのエンリッチメント要求とマルチコンテンツのエンリッチメント要求を示す場合に、少ないコンテンツのエンリッチメント要求とマルチコンテンツのエンリッチメント要求にそれぞれ対応した異なるラベリングタイトルタイプをターゲットタイトルタイプとすることができる。
本実施形態のいくつかのオプション的な実施形態において、ステップ402におけるラベリング要求を満たすラベリングモードタイプを決定することは、ラベリング要求はラベリングデータの抽出を含む場合、ラベリング対象データのラベリングモードタイプが抽出タイプであると決定することを含んでいてもよい。
これらのオプション的な実施形態において、上記実行主体はラベリング要求がラベリングデータの抽出を含む場合、ラベリング対象データのラベリングモードタイプが抽出タイプであると決定することができる。具体的には、ラベリングモードタイプが抽出タイプである可能性のあるラベリング対象データのタイプは、画像、テキスト、映像、音声、点群、およびウェブページを含んでもよい。
ここでの抽出は、画像抽出、音声インターセプション、映像インターセプション、テキスト抽出、点群抽出(すなわち点群データの抽出)などの異なるシーンを示すことができる。
具体的には、画像抽出とは、画像の中から1つのオブジェクトを選択し、画像の中でオブジェクトを「描く」必要があり、画像抽出のラベリングタイトルは画像エディタに基づいて設計することができる。音声抽出は、音声再生中に1つ(または複数)のセグメントにマークを付けてもよい。音声抽出を行うためのラベリングタイトルは、音声プレーヤーに基づいて設計することができる。映像抽出を行うためのラベリングタイトルは、映像プレーヤーに基づいて設計する必要がある。テキスト抽出を行うためのラベリングタイトルは、テキストエディタに基づいて設計してもよく、絵筆の形式でテキストを丸で囲んでもよい。点群データ抽出のためのラベリングタイトルは、点群エディタに基づいて設計することができる。
これらの実施形態は要求の具体的な情報をラベリングすることにより、抽出タイプのラベリングモードタイプを正確に特定することができる。
更に図5Aを参照すると、上記の各図に示された方法の実施態様として、本願は、データをラベリングするための装置の一実施形態を提供し、当該装置の実施形態は、図2に示された方法の実施形態に対応しており、以下に記載する特徴に加えて、該装置の実施形態はさらに図2に示される方法の実施形態と同じまたは対応する特徴または効果を含んでもよい。この装置は、具体的には様々な電子機器に適用され得る。
図5に示すように、本実施形態のデータをラベリングするための装置500は、取得ユニット501と、決定ユニット502と、タイトル生成ユニット503と、ツール生成ユニット504とを備える。ここで、取得ユニット501は、ラベリング対象データおよびラベリング対象データのラベリング要求を取得するように構成される。決定ユニット502は、ラベリング要求を満たすラベリングモードタイプを決定するように構成される。ここで、ラベリングモードタイプは、ラベリング要求を満たすためにラベリング対象データに採用されるラベリング方式のタイプである。タイトル生成ユニット503は、ラベリング要求に基づいて、ラベリングモードタイプに適合したラベリングタイトルを生成するように構成される。ここで、ラベリングタイトルは、ラベリングツールにラベリングコンテンツを提示するように構成される。ツール生成ユニット504は、ラベリングタイトルのタイトル論理関係を決定し、ラベリング対象データ、ラベリングタイトルおよびタイトル論理関係を含むラベリングツールを生成するように構成される。
本実施形態において、データをラベリングするための装置500の取得ユニット501と、決定ユニット502と、タイトル生成ユニット503と、ツール生成ユニット504の具体的な処理およびそれらの技術的効果は、それぞれ図2の対応する実施形態におけるステップ201、ステップ202、ステップ203およびステップ204の関連する説明を参照することができ、ここではその説明を省略する。
本実施形態のいくつかのオプション的な実施態様では、ラベリングモードタイプは、必要なラベリングモードタイプを含むか、または必要なラベリングモードタイプおよび付加的なラベリングモードタイプを含む。
本実施形態のいくつかのオプション的な実施形態において、ラベリングモードタイプは必要なラベリングモードタイプと付加的なラベリングモードタイプを含む。ツール生成ユニットは、さらに必要なラベリングモードタイプと付加的なラベリングモードタイプがそれぞれ対応するラベリングタイトル間のタイトル論理関係を決定し、ここで、前記タイトル論理関係は、ラベリング順序、表示制限関係の少なくとも一つを含み、ラベリング対象データ、該タイトル論理関係およびラベリングタイトルを含むラベリングツールを生成することによって、ラベリングタイトルを決定するタイトル論理関係を実行し、ラベリング対象データ、ラベリングタイトルおよびタイトル論理関係を含むラベリングツールを生成するように構成される。
本実施形態のいくつかのオプション的な実施形態において、必要なラベリングモードタイプと付加的なラベリングモードタイプはそれぞれ抽出タイプとクレンジングタイプであり、タイトル論理関係はラベリング順序と表示制限関係を含み、ラベリング順序はクレンジングタイプのラベリングタイトルのラベリングコンテンツを受信した後、抽出タイプのラベリングタイトルのラベリング動作を受信することを示す。ラベリングツールの表示過程は、ラベリングツールにおけるクレンジングタイプに対応するラベリングタイトルに対するラベリング動作を受信したことに応答し、該ラベリング動作のラベリングコンテンツを決定し、表示制限関係と該ラベリングコンテンツに基づき、抽出タイプに対応するラベリングタイトルの表示状態を決定することであって、表示状態は動作可能表示状態または動作不可表示状態であることと、決定された表示状態が動作可能表示状態であることに応答し、動作可能な状態で抽出タイプに対応するラベリングタイトルを表示することと、決定された表示状態は動作不可表示状態であることに応答し、動作不可能な状態で抽出タイプに対応するラベリングタイトルを表示し、または抽出タイプに対応するラベリングタイトルを表示しないこととを含む。
本実施形態のいくつかのオプション的な実施形態において、タイトル生成ユニットは、さらにラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプの中から、ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定することと、ラベリング要求に基づき、ターゲットタイトルタイプのラベリングタイトルを生成することとによって、ラベリング要求に基づいて、ラベリングモードタイプに適合したラベリングタイトルを生成することを実行するように構成される。
本実施形態のいくつかのオプション的な実施形態では、タイトル生成ユニットは、さらに、ラベリング要求が予め設定された校正の必要な要求であることに応答し、ターゲットタイトルタイプのラベリングタイトル、および校正の必要な要求に対応する校正タイトルを生成することによって、ラベリング要求に基づき、ターゲットタイトルタイプのラベリングタイトルを生成することを実行するように構成され、校正タイトルのラベリングコンテンツは、ラベリングタイトルのラベリングコンテンツを調整するために用いられる。
本実施形態のいくつかのオプション的な実施形態において、決定ユニットは、さらに
ラベリング要求がラベリング対象データのフィルタリングを含むことに応答して、ラベリング対象データのラベリングモードタイプがクレンジングタイプであると決定することであって、クレンジングタイプは、ラベリング対象データがフィルタリング対象データであるか否かを決定すること、または、ラベリング対象データのうちフィルタリング対象データの一部を決定することを示すために用いられることと、ラベリング要求にラベリングデータの転写が含まれることに応答して、ラベリング対象データのラベリングモードタイプが転写タイプであると決定することと、ラベリング要求がラベリングデータの採集が含まれることに応答して、ラベリング対象データのラベリングモードタイプがエンリッチメントタイプであると決定することと、ラベリング要求がラベリングデータの抽出が含まれることに応答して、ラベリング対象データのラベリングモードタイプが抽出タイプであると決定することとによって、
ラベリング要求を満たすラベリングモードタイプを決定することを実行するように構成される。
本実施形態のいくつかのオプション的な実施形態では、タイトル生成ユニットは、さらに、
ラベリングモードタイプがターゲットタイプである場合、ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプを取得することと、ラベリング要求が事前設定要求である場合、該事前設定要求に対応するタイトルタイプを、ターゲットタイトルタイプとすることによって、
ラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプにおいて、ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定することを実行するように構成される。
本実施形態のいくつかのオプション的な実施形態では、ターゲットタイプがクレンジングタイプであることに応答して、事前設定要求が直接選択要求である場合、ターゲットタイトルタイプは選択肢選択タイプであり、事前設定要求がファジー検索要求である場合、ターゲットタイトルタイプはドロップダウンボックス選択タイプである。ターゲットタイプが転写タイプであることに応答して、事前設定要求が少ないコンテンツの転写要求である場合、ターゲットタイトルタイプは一行テキストタイトルであり、事前設定要求がマルチコンテンツの転写要求である場合、ターゲットタイトルタイプは複数行テキストタイトルである。ターゲットタイプがエンリッチメントタイプであることに応答して、事前設定要求が少ないコンテンツのエンリッチメント要求である場合、ターゲットタイトルタイプは一行テキストタイトルであり、事前設定要求がマルチコンテンツのエンリッチメント要求である場合、ターゲットタイトルタイプは複数行テキストタイトルである。
図5Bに示すように、データをラベリングするための装置が存在し得る様々な処理層が示されている。具体的には、各処理層は、データ層、評価方法層、タイトル層、コンフィグレーション層、およびツール層を含んでもよい。
ここで、データ層は、種々のラベリング対象データタイプのラベリング対象データを含んでもよい。評価方法層は、様々なタイプのラベリング方式を含んでもよい。タイトル層には、個々のラベリングタイトルタイプが含まれる。ここで、一般的な要素(一般的なラベリングタイトルタイプ)は、単一選択、複数選択、マトリックス、穴埋めを含んでもよく、これらはすべてのタイプのラベリング対象データがいずれも採用できるラベリングタイトルタイプである。ここで、マトリックスは、1つのタイトルの複数のサブタイトルが行列状に並んでいることを意味してもよい。
特定タイトル(特定ラベリングタイトルタイプ)とは、異なるタイプのラベリング対象データがそれぞれ採用可能なラベリングタイトルが属するラベリングタイトルタイプを指し、ラベリング要求を示すことができる。例えば、画像のラベリング要求は、「点」をラベリングすることであってもよい。この要求に対し、補助線関連の校正タイトルを採用してもよい。図におけるコンフィグレーション層は、ラベリングタイトルからラベリングツールを生成するためのステップを示す。ここで、論理(例えば、タイトル論理関係)コンフィグレーションを含んでもよい。
本願の実施形態によれば、本願はさらに電子機器、読み取り可能な記憶媒体およびコンピュータプログラムを提供する。図6に示すように、本願の実施形態に係るデータをラベリングするための方法を実行する電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレード型サーバ、メインフレームコンピュータおよびその他の適切なコンピュータ等の様々な形態のデジタルコンピュータを表す。また、電子機器は、個人デジタル処理、携帯電話、スマートフォン、ウェアラブル機器およびその他の類似するコンピューティングデバイス等の様々な形態のモバイルデバイスを表すことができる。なお、ここで示したコンポーネント、それらの接続関係、およびそれらの機能はあくまでも例示であり、ここで記述および/または要求した本願の実施形態を限定することを意図するものではない。
図6に示すように、該電子機器は、1つまたは複数のプロセッサ601、メモリ602、および各コンポーネントを接続するためのインタフェース(高速インタフェースおよび低速インタフェースを含む)を含む。各コンポーネントは、互いに異なるバスで接続されており、共通のマザーボード上に実装されていてもよいし、必要に応じて他の方式で実装されていてもよい。プロセッサは、電子機器内で実行される指令を処理することができ、前記指令は、インタフェースに結合された表示装置等の外部入出力装置にグラフィカルユーザインタフェース(GUI,Graphical User Interface)のグラフィック情報を表示するために、メモリ内またはメモリ上に格納される指令を含む。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを、複数のメモリとともに使用することができる。また、複数の電子機器が接続されていてもよく、各機器は、例えば、サーバアレイ、ブレードサーバ群またはマルチプロセッサシステムなど、一部の必要な動作を提供する。図6では、1つのプロセッサ601を例としている。
メモリ602は、本願に係る非一時的コンピュータ可読記憶媒体である。ここで、メモリには、少なくとも1つのプロセッサにより実行され得る指令が格納されており、それにより少なくとも1つのプロセッサに本願に係るデータをラべリングするための方法を実行させる。本願の非一時的コンピュータ可読記憶媒体はコンピュータ指令を格納し、該コンピュータ指令はコンピュータに本願に係るデータをラべリングするための方法を実行させるために用いられる。
メモリ602は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム並びに、例えば本願の実施形態におけるデータをラベリングするための方法に対応するプログラム指令/モジュール(例えば、図5に示す取得ユニット501、決定ユニット502、タイトル生成ユニット503、およびツール生成ユニット504)などのモジュールを格納することに用いることができる。プロセッサ601は、メモリ602に格納された非一時的ソフトウェアプログラム、指令およびモジュールを実行することにより、サーバの各種機能アプリケーションおよびデータ処理を実行し、すなわち上記方法の実施形態におけるデータをラベリングするための方法を実現する。
メモリ602は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶できるプログラム記憶領域、およびデータをラべリングするための方法を実行する電子機器の使用に作成されるデータ等を記憶できるデータ記憶領域を備えてもよい。また、メモリ602は高速ランダムアクセスメモリを含むことができ、また非一時的メモリ(例えば、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリデバイスまたはその他の非一時的ソリッドステート記憶装置)を含み得る。いくつかの実施形態において、メモリ602は任意選択でプロセッサ601に対して遠隔に設置されたメモリを含み、これらのリモートメモリはネットワークを介してデータをラべリングするための方法を実行する電子機器に接続することができる。上記ネットワークとしては、例えば、インターネット、企業イントラネット、ローカルエリアネットワーク、移動体通信網およびこれらの組み合わせなどが挙げられるが、それらに限定されない。
データをラべリングするための方法を実行する電子機器は、さらに入力装置603および出力装置604を含んでもよい。プロセッサ601、メモリ602、入力装置603および出力装置604は、バスまたはその他の方式で接続されていてもよく、図6ではバスで接続されている例を示している。
入力装置603(例えばタッチパネル、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングデバイス、1つまたは複数のマウスボタン、トラックボール、ジョイスティック等)は、入力された数字や文字情報を受信でき、データをラべリングするための方法を実行する電子機器のユーザ設定および機能制御に関するキー信号入力を生成することができる。出力装置604は表示装置、補助照明装置(例えば、LED)および触覚フィードバック装置(例えば、振動モータ)等を含むことができる。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイおよびプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態において、表示装置はタッチパネルであってもよい。
ここで記述するシステムおよび技術の各実施形態はデジタル電子回路システム、集積回路システム、特定用途向け集積回路(Application Specific Integrated Circuit,ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにおいて実装され得る。これらの各実施形態は、1つまたは複数のコンピュータプログラムに実装され、該1つまたは複数のコンピュータプログラムは少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行および/または解釈することができ、該プログラマブルプロセッサは専用または汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置および少なくとも1つの出力装置からデータおよび指令を受信することができ、且つデータおよび指令を該記憶システム、該少なくとも1つの入力装置および該少なくとも1つの出力装置に伝送することを含み得る。
これらのコンピュータプログラムは、プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとも呼ばれ、プログラマブルプロセッサの機械命令を含み、且つ高度プロセスおよび/またはオブジェクト指向のプログラミング言語、および/またはアセンブリ言語/機械語により実装され得る。ここで、「機械可読媒体」および「コンピュータ可読媒体」という用語は、機械指令および/またはデータをプログラマブルプロセッサに供給するための任意のコンピュータプログラム製品、機器、および/または装置(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を意味し、機械可読信号である機械命令を受信する機械可読媒体を含む。「機械可読信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに供給するための任意の信号を意味する。
ユーザとのやりとりを行うために、ここで記述するシステムと技術は、ユーザに情報を表示するための表示装置(例えば、陰極線管(Cathode Ray Tube,CRT)またはLCD(液晶ディスプレイ)モニタ)と、キーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)とを備えるコンピュータ上で実装することができ、ユーザが該キーボードおよび該ポインティングデバイスを介してコンピュータに入力を提供できる。他の種類の装置もユーザとのやりとりを行うことに用いることができる。例えば、ユーザに提供されるフィードバックは、例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックであるいかなる形態のセンシングフィードバックであってもよく、且つ音入力、音声入力若しくは触覚入力を含むいかなる形態でユーザからの入力を受信してもよい。
ここで記述したシステムおよび技術は、バックグラウンドコンポーネントを含む演算システム(例えば、データサーバ)に実施されてもよく、またはミドルウェアコンポーネントを含む演算システム(例えば、アプリケーションサーバ)に実施されてもよく、またはフロントエンドコンポーネントを含む演算システム(例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータ)に実施されてもよく、ユーザは該グラフィカルユーザインタフェースまたはウェブブラウザを介してここで記述したシステムおよび技術の実施形態とやりとりを行っていてもよく、またはこのようなバックグラウンドコンポーネント、ミドルウェアコンポーネントまたはフロントエンドコンポーネントのいずれかの組み合わせを含む演算システムに実施されてもよい。また、システムの各コンポーネントの間は、通信ネットワーク等の任意の形態または媒体を介してデジタルデータ通信により接続されていてもよい。通信ネットワークとしては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)およびインターネットなどを含む。
コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、通常、互いに離れており、通信ネットワークを介してやりとりを行う。クライアントとサーバとの関係は、互いにクライアント-サーバの関係を有するコンピュータプログラムをそれぞれのコンピュータ上で動作することによって生成される。サーバはクラウドサーバであってもよく、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおけるホスト製品であり、従来の物理ホストと仮想専用サーバ(VPS、Virtual Private Server)サービスにおける管理難度が大きく、ビジネス拡張性が弱いという欠陥を解決する。サーバは、分散システムのサーバ、あるいはブロックチェーンを結合したサーバであってもよい。
図面のうちのフローチャートおよびブロック図は、本願の様々な実施形態に係るシステム、方法およびコンピュータプログラム製品によって実現できるアーキテクチャ、機能および動作の表示例である。これについては、フローチャートまたはブロック図における各ブロックは、モジュール、プログラムセグメント、またはコードの一部を表すことができる。当該モジュール、プログラムセグメント、またはコードの一部には、所定のロジック機能を実現するための1つまたは複数の実行可能な指令が含まれている。なお、一部の代替となる実施態様においては、ブロックに示されている機能は図面に示されているものとは異なる順序で実行することも可能である。例えば、連続して示された2つのブロックは、実際には係る機能に応じて、ほぼ並行して実行されてもよく、時には逆の順序で実行されてもよい。なお、ブロック図および/またはフローチャートにおけるすべてのブロック、ならびにブロック図および/またはフローチャートにおけるブロックの組み合わせは、所定の機能または動作を実行する専用のハードウェアベースのシステムで実装されてもよく、または専用のハードウェアとコンピュータ指令との組み合わせで実装されてもよい。
本願の実施形態に記載されたユニットは、ソフトウェアで実装されてもよく、ハードウェアで実装されてもよい。記載されたユニットは、プロセッサに設定されてもよく、例えば、「取得ユニットと、決定ユニットと、タイトル生成ユニットと、ツール生成ユニットとを備えるプロセッサ」というように記載されてもよい。ここで、これらのユニットの名称は、ある場合において当該ユニットその自体を限定するものではなく、例えば、タイトル生成ユニットは、「ラベリング要求に基づいて、ラベリングモードタイプに適合したラベリングタイトルを生成するユニット」として記載されてもよい。
一方、本願は、コンピュータ可読媒体を更に提供し、当該コンピュータ可読媒体は、上記実施形態に記載されたデバイスに含まれるものであってもよく、該デバイスに実装されずに別体として存在するものであってもよい。上記コンピュータ可読媒体には一つまたは複数のプログラムが担持されており、上記一つまたは複数のプログラムが該装置に実行されると、ラベリング対象データおよびラベリング対象データのラベリング要求を取得することと、ラベリング要求を満たすラベリングモードタイプを決定し、ここで、ラベリングモードタイプはラベリング要求を満たすためにラベリング対象データをラベリングするための方法のタイプであることと、ラベリング要求に基づき、ラベリングモードタイプに適合したラベリングタイトルを生成し、ここで、ラベリングタイトルはラベリングツールにラベリングコンテンツを提示するために用いられることと、ラベリングタイトルのタイトル論理関係を決定し、ラベリング対象データ、ラベリングタイトルおよびタイトル論理関係を含むラベリングツールを生成することと、を該装置に実行させる。
以上の記載は、本願の好ましい実施形態、および応用される技術的原理に関する説明に過ぎない。当業者であれば、本願に係る発明の範囲は、前記の技術的特徴の特定の組み合わせからなる技術案に限定されることなく、本願の技術的思想を逸脱しない限り、前記技術的特徴またはそれらの均等の特徴の任意の組み合わせからなる他の技術案も含むべきであることを理解すべきである。例えば、前記特徴と、本願に開示された類似の機能を持っている技術的特徴(これらに限定されていない)とを互いに置き換えてなる技術案が挙げられる。

Claims (19)

  1. データをラベリングするための装置により実行される方法であって、
    ラベリング対象データおよび前記ラベリング対象データのラベリング要求を取得することと、
    前記ラベリング要求を満たすラベリングモードタイプを決定することであって、前記ラベリングモードタイプは、ラベリング要求を満たすために、ラベリング対象データをラベリングするための方法のタイプである、ことと、
    前記ラベリング要求に基づいて、前記ラベリングモードタイプに適合したラベリングタイトルを生成することであって、前記ラベリングタイトルはラベリングツールにラベリングコンテンツを提示するために用いられる、ことと、
    前記ラベリングタイトルのタイトル論理関係を決定し、前記ラベリング対象データ、前記ラベリングタイトルおよび前記タイトル論理関係を含むラベリングツールを生成することと、を含み、
    前記の、前記ラベリング要求を満たすラベリングモードタイプを決定することは、
    前記ラベリング要求がラベリング対象データのフィルタリングを含む場合、前記ラベリング対象データのラベリングモードタイプがクレンジングタイプであると決定することであって、前記クレンジングタイプは、ラベリング対象データがフィルタリング対象データであるか否かを判定することを示すか、またはラベリング対象データのうちのフィルタリング対象データの一部を決定することを示すために用いられる、ことと、
    前記ラベリング要求がラベリングデータの転写を含む場合、前記ラベリング対象データのラベリングモードタイプが転写タイプであると決定することと、
    前記ラベリング要求がラベリングデータの採集を含む場合、前記ラベリング対象データのラベリングモードタイプがエンリッチメントタイプであると決定することと、
    前記ラベリング要求がラベリングデータの抽出を含む場合、前記ラベリング対象データのラベリングモードタイプが抽出タイプであると決定することと、を含む、方法。
  2. 前記ラベリングモードタイプは、必要なラベリングモードタイプを含むか、または必要なラベリングモードタイプおよび付加的なラベリングモードタイプを含む請求項1に記載の方法。
  3. 前記ラベリングモードタイプは、必要なラベリングモードタイプおよび付加的なラベリングモードタイプを含み、
    前記の、前記ラベリングタイトルのタイトル論理関係を決定し、前記ラベリング対象データ、前記ラベリングタイトルおよび前記タイトル論理関係を含むラベリングツールを生成することは、
    前記必要なラベリングモードタイプと前記付加的なラベリングモードタイプがそれぞれ対応するラベリングタイトル間のタイトル論理関係を決定することであって、前記タイトル論理関係はラベリング順序および/または表示制限関係を含む、ことと、
    前記ラベリング対象データ、前記タイトル論理関係および前記ラベリングタイトルを含むラベリングツールを生成することと、を含む請求項2に記載の方法。
  4. 前記必要なラベリングモードタイプおよび前記付加的なラベリングモードタイプはそれぞれ抽出タイプとクレンジングタイプであり、前記タイトル論理関係はラベリング順序と表示制限関係とを含み、前記ラベリング順序はクレンジングタイプのラベリングタイトルのラベリングコンテンツを受信した後、抽出タイプのラベリングタイトルのラベリング動作を受信することを示し、
    前記ラベリングツールの表示プロセスは、
    前記ラベリングツールにおけるクレンジングタイプに対応するラベリングタイトルに対するラベリング動作が受信されたことに応答して、前記ラベリング動作のラベリングコンテンツを決定し、前記表示制限関係および前記ラベリングコンテンツに基づいて、抽出タイプに対応するラベリングタイトルの表示状態を決定することであって、前記表示状態は動作可能表示状態または動作不可表示状態である、ことと、
    決定された表示状態が動作可能表示状態であることに応答して、前記抽出タイプに対応するラベリングタイトルを動作可能な状態で表示することと、
    決定された表示状態が動作不可表示状態であることに応答して、前記抽出タイプに対応するラベリングタイトルを動作不可な状態で表示するか、または前記抽出タイプに対応するラベリングタイトルを表示しないことと、を含む請求項3に記載の方法。
  5. 前記の、前記ラベリング要求に基づいて、前記ラベリングモードタイプに合致するラベリングタイトルを生成することは、
    前記ラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプの中から、前記ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定することと、
    前記ラベリング要求に基づいて、前記ターゲットタイトルタイプのラベリングタイトルを生成することとを含む請求項1~4のいずれか1項に記載の方法。
  6. 前記の、前記ラベリング要求に基づいて、前記ターゲットタイトルタイプのラベリングタイトルを生成することは、
    前記ラベリング要求が予め設定された校正の必要な要求であることに応答して、前記ターゲットタイトルタイプのラベリングタイトル、および前記校正の必要な要求に対応する校正タイトルを生成することを含み、
    前記校正タイトルのラベリングコンテンツは、前記ラベリングタイトルのラベリングコンテンツを調整するために用いられる請求項5に記載の方法。
  7. 前記の、前記ラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプの中から、前記ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定することは、
    前記ラベリングモードタイプがターゲットタイプである場合、前記ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプを取得することと、
    前記ラベリング要求が事前設定要求である場合、前記事前設定要求に対応するタイトルのタイプを、ターゲットタイトルタイプとすることとを含む請求項に記載の方法。
  8. 前記ターゲットタイプがクレンジングタイプであることに応答して、前記事前設定要求が直接選択要求である場合、前記ターゲットタイトルタイプは選択肢選択タイプであり、前記事前設定要求がファジー検索要求である場合、前記ターゲットタイトルタイプはドロップダウンボックス選択タイプであり、
    前記ターゲットタイプが転写タイプであることに応答して、前記事前設定要求が少ないコンテンツの転写要求である場合、前記ターゲットタイトルタイプは一行テキストタイトルであり、前記事前設定要求がマルチコンテンツの転写要求である場合、前記ターゲットタイトルタイプは複数行テキストタイトルであり、
    前記ターゲットタイプがエンリッチメントタイプであることに応答して、前記事前設定要求が少ないコンテンツのエンリッチメント要求である場合、前記ターゲットタイトルタイプは一行テキストタイトルであり、前記事前設定要求がマルチコンテンツのエンリッチメント要求である場合、前記ターゲットタイトルタイプは複数行テキストタイトルである請求項に記載の方法。
  9. ラベリング対象データおよび前記ラベリング対象データのラベリング要求を取得するように構成される取得ユニットと、
    前記ラベリング要求を満たすラベリングモードタイプを決定するように構成される決定ユニットであって、前記ラベリングモードタイプは、ラベリング要求を満たすために、前記ラベリング対象データをラベリングするための方法のタイプである決定ユニットと、 前記ラベリング要求に基づいて、前記ラベリングモードタイプに合致するラベリングタイトルを生成するように構成されるタイトル生成ユニットであって、前記ラベリングタイトルはラベリングツールにラベリングコンテンツを提示するために用いられるタイトル生成ユニットと、
    前記ラベリングタイトルのタイトル論理関係を決定し、前記ラベリング対象データ、前記ラベリングタイトルおよび前記タイトル論理関係を含むラベリングツールを生成するように構成されるツール生成ユニットと、を含
    前記決定ユニットはさらに、
    前記ラベリング要求がラベリング対象データのフィルタリングを含む場合、前記ラベリング対象データのラベリングモードタイプがクレンジングタイプであると決定することであって、前記クレンジングタイプは、ラベリング対象データがフィルタリング対象データであるか否かを判定することを示すか、またはラベリング対象データのうちのフィルタリング対象データの一部を決定することを示すために用いられる、ことと、
    前記ラベリング要求がラベリングデータの転写を含む場合、前記ラベリング対象データのラベリングモードタイプが転写タイプであると決定することと、
    前記ラベリング要求がラベリングデータの採集を含む場合、前記ラベリング対象データのラベリングモードタイプがエンリッチメントタイプであると決定することと、
    前記ラベリング要求がラベリングデータの抽出を含む場合、前記ラベリング対象データのラベリングモードタイプが抽出タイプであると決定することと、によって前記ラベリング要求を満たすラベリングモードタイプを決定することを実行するように構成される、データをラベリングするための装置。
  10. 前記ラベリングモードタイプは、必要なラベリングモードタイプを含むか、または必要なラベリングモードタイプおよび付加的なラベリングモードタイプを含む請求項に記載の装置。
  11. 前記ラベリングモードタイプは、必要なラベリングモードタイプおよび付加的なラベリングモードタイプを含み、
    前記ツール生成ユニットは、さらに、
    前記必要なラベリングモードタイプと前記付加的なラベリングモードタイプがそれぞれ対応するラベリングタイトル間のタイトル論理関係を決定することであって、前記タイトル論理関係はラベリング順序および/または表示制限関係を含む、ことと、
    前記ラベリング対象データ、前記タイトル論理関係および前記ラベリングタイトルを含むラベリングツールを生成することと、によって前記ラベリングタイトルのタイトル論理関係を決定し、前記ラベリング対象データ、前記ラベリングタイトルおよび前記タイトル論理関係を含むラベリングツールを生成することを実行するように構成される請求項10に記載の装置。
  12. 前記必要なラベリングモードタイプおよび前記付加的なラベリングモードタイプはそれぞれ抽出タイプとクレンジングタイプであり、前記タイトル論理関係はラベリング順序と表示制限関係とを含み、前記ラベリング順序はクレンジングタイプのラベリングタイトルのラベリングコンテンツを受信した後、さらに抽出タイプのラベリングタイトルのラベリング動作を受信することを示し、
    前記ラベリングツールの表示プロセスは、
    前記ラベリングツールにおけるクレンジングタイプに対応するラベリングタイトルに対するラベリング動作が受信されたことに応答して、該ラベリング動作のラベリングコンテンツを決定し、前記表示制限関係および該ラベリングコンテンツに基づいて、抽出タイプに対応するラベリングタイトルの表示状態を決定することであって、前記表示状態は動作可能表示状態または動作不可表示状態である、ことと、
    決定された表示状態が動作可能表示状態であることに応答して、前記抽出タイプに対応するラベリングタイトルを動作可能な状態で表示することと、
    決定された表示状態が動作不可表示状態であることに応答して、前記抽出タイプに対応するラベリングタイトルを動作不可な状態で表示するか、または前記抽出タイプに対応するラベリングタイトルを表示しないことと、を含む請求項11に記載の装置。
  13. 前記タイトル生成ユニットは、さらに
    前記ラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプの中から、前記ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定することと、
    前記ラベリング要求に基づき、前記ターゲットタイトルタイプのラベリングタイトルを生成することと、によって前記ラベリング要求に基づいて、前記ラベリングモードタイプに適合するラベリングタイトルを生成することを実行するように構成される請求項12のいずれか1項に記載の装置。
  14. 前記タイトル生成ユニットは、さらに
    前記ラベリング要求が予め設定された校正の必要な要求であることに応答して、前記ターゲットタイトルタイプのラベリングタイトル、および前記校正の必要な要求に対応する校正タイトルを生成することによって前記ラベリング要求に基づき、前記ターゲットタイトルタイプのラベリングタイトルを生成することを実行するように構成され、
    前記校正タイトルのラベリングコンテンツは、前記ラベリングタイトルのラベリングコンテンツを調整するために用いられる請求項13に記載の装置。
  15. 前記タイトル生成ユニットは、さらに
    前記ラベリングモードタイプがターゲットタイプである場合、前記ラベリングモードタイプに対応する少なくとも2つのラベリングタイトルタイプを取得することと、
    前記ラベリング要求が事前設定要求である場合、前記事前設定要求に対応するタイトルのタイプを、ターゲットタイトルタイプとすることと、によって前記ラベリングモードタイプに対応する少なくとも1つのラベリングタイトルタイプにおいて、前記ラベリング要求に対応するラベリングタイトルタイプをターゲットタイトルタイプとして決定することを実行するように構成される請求項に記載の装置。
  16. 前記ターゲットタイプがクレンジングタイプであることに応答して、前記事前設定要求が直接選択要求である場合、前記ターゲットタイトルタイプは選択肢選択タイプであり、前記事前設定要求がファジー検索要求である場合、前記ターゲットタイトルタイプはドロップダウンボックス選択タイプであり、
    前記ターゲットタイプが転写タイプであることに応答して、前記事前設定要求が少ないコンテンツの転写要求である場合、前記ターゲットタイトルタイプは一行テキストタイトルであり、前記事前設定要求がマルチコンテンツの転写要求である場合、前記ターゲットタイトルタイプは複数行テキストタイトルであり、
    前記ターゲットタイプがエンリッチメントタイプであることに応答して、前記事前設定要求が少ないコンテンツのエンリッチメント要求である場合、前記ターゲットタイトルタイプは一行テキストタイトルであり、前記事前設定要求がマルチコンテンツのエンリッチメント要求である場合、前記ターゲットタイトルタイプは複数行テキストタイトルである請求項15に記載の装置。
  17. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備える電子機器であって、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な指令が格納され、前記指令が前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~のいずれか1項に記載の方法を実行させる、電子機器。
  18. コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
    前記コンピュータ指令はコンピュータに請求項1~のいずれか1項に記載の方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体。
  19. プロセッサによって実行されると、請求項1~のいずれか1項に記載の方法が実現されるコンピュータプログラム。
JP2021141707A 2021-03-25 2021-08-31 データをラベリングするための方法、装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラム Active JP7284786B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110319793.3 2021-03-25
CN202110319793.3A CN113157170B (zh) 2021-03-25 2021-03-25 数据的标注方法和装置

Publications (2)

Publication Number Publication Date
JP2021184316A JP2021184316A (ja) 2021-12-02
JP7284786B2 true JP7284786B2 (ja) 2023-05-31

Family

ID=76885085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021141707A Active JP7284786B2 (ja) 2021-03-25 2021-08-31 データをラベリングするための方法、装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラム

Country Status (5)

Country Link
US (1) US20210382918A1 (ja)
EP (1) EP3896614A3 (ja)
JP (1) JP7284786B2 (ja)
KR (1) KR102583345B1 (ja)
CN (1) CN113157170B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102585322B1 (ko) * 2022-10-26 2023-10-06 주식회사 데이터메이커 불안정한 인터넷 환경에서 원활한 데이터 라벨링을 위한 클라이언트 장치 및 이를 포함하는 데이터 라벨링 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002055748A (ja) 2000-04-28 2002-02-20 Canon Inc 情報処理方法及び装置
JP2009540447A (ja) 2006-06-16 2009-11-19 ノキア コーポレイション メタデータエントリーを提供するための方法、装置及びコンピュータ読み取り可能記憶媒体
JP2017187850A (ja) 2016-04-01 2017-10-12 株式会社リコー 画像処理システム、情報処理装置、プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080263103A1 (en) * 2007-03-02 2008-10-23 Mcgregor Lucas Digital asset management system (DAMS)
US8694905B2 (en) * 2009-06-10 2014-04-08 International Business Machines Corporation Model-driven display of metric annotations on a resource/relationship graph
US8805112B2 (en) * 2010-05-06 2014-08-12 Nikon Corporation Image sharpness classification system
PE20161468A1 (es) 2014-06-09 2017-01-29 Sicpa Holding Sa Sistema de administracion de integridad para administrar y controlar datos entre entidades en una cadena de suministros de activos de petroleo y gas
US9767565B2 (en) * 2015-08-26 2017-09-19 Digitalglobe, Inc. Synthesizing training data for broad area geospatial object detection
CN107705034B (zh) * 2017-10-26 2021-06-29 医渡云(北京)技术有限公司 众包平台实现方法及装置、存储介质和电子设备
CN109063055B (zh) 2018-07-19 2021-02-02 中国科学院信息工程研究所 同源二进制文件检索方法和装置
CN109657675B (zh) * 2018-12-06 2021-03-30 广州景骐科技有限公司 图像标注方法、装置、计算机设备和可读存储介质
CN111340054A (zh) * 2018-12-18 2020-06-26 北京嘀嘀无限科技发展有限公司 数据标注方法、装置及数据处理设备
CN112163424A (zh) * 2020-09-17 2021-01-01 中国建设银行股份有限公司 数据的标注方法、装置、设备和介质
CN112528610B (zh) * 2020-12-09 2023-11-14 北京百度网讯科技有限公司 一种数据标注方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002055748A (ja) 2000-04-28 2002-02-20 Canon Inc 情報処理方法及び装置
JP2009540447A (ja) 2006-06-16 2009-11-19 ノキア コーポレイション メタデータエントリーを提供するための方法、装置及びコンピュータ読み取り可能記憶媒体
JP2017187850A (ja) 2016-04-01 2017-10-12 株式会社リコー 画像処理システム、情報処理装置、プログラム

Also Published As

Publication number Publication date
JP2021184316A (ja) 2021-12-02
EP3896614A3 (en) 2022-03-23
EP3896614A2 (en) 2021-10-20
CN113157170B (zh) 2022-09-20
US20210382918A1 (en) 2021-12-09
KR102583345B1 (ko) 2023-09-27
KR20210119923A (ko) 2021-10-06
CN113157170A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN110020411B (zh) 图文内容生成方法及设备
CN109348275B (zh) 视频处理方法和装置
US11244122B2 (en) Reformatting of context sensitive data
CN110914872A (zh) 用认知洞察力导航视频场景
CN107908641B (zh) 一种获取图片标注数据的方法和系统
CN110673777A (zh) 在线教学方法、装置、存储介质及终端设备
CN108491421B (zh) 一种生成问答的方法、装置、设备和计算存储介质
US20140195899A1 (en) Collaborative presentation of extracted information
JP2016524229A (ja) 検索推奨方法及び装置
CN111738041A (zh) 一种视频分割方法、装置、设备及介质
US20210312121A1 (en) Annotation tool generation method, annotation method, electronic device and storage medium
CN112614478B (zh) 音频训练数据处理方法、装置、设备以及存储介质
US10936815B2 (en) Removable spell checker device
US11423219B2 (en) Generation and population of new application document utilizing historical application documents
JP7284786B2 (ja) データをラベリングするための方法、装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラム
JP2021103552A (ja) 構造化文書情報の標識方法、構造化文書情報の標識装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
US10594954B2 (en) Dynamic and contextual data replacement in video content
CN113259763A (zh) 教学视频处理方法、装置和电子设备
US11335084B2 (en) Image object anomaly detection
CN111931034A (zh) 数据搜索方法、装置、设备及存储介质
CN112016077A (zh) 一种基于滑动轨迹模拟的页面信息获取方法、装置和电子设备
US20210312223A1 (en) Automated determination of textual overlap between classes for machine learning
US10970533B2 (en) Methods and systems for finding elements in optical character recognition documents
CN112988099A (zh) 视频的显示方法和装置
EP4336379A1 (en) Tracking concepts within content in content management systems and adaptive learning systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230519

R150 Certificate of patent or registration of utility model

Ref document number: 7284786

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150