JP7128919B2 - 技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体 - Google Patents

技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体 Download PDF

Info

Publication number
JP7128919B2
JP7128919B2 JP2021017217A JP2021017217A JP7128919B2 JP 7128919 B2 JP7128919 B2 JP 7128919B2 JP 2021017217 A JP2021017217 A JP 2021017217A JP 2021017217 A JP2021017217 A JP 2021017217A JP 7128919 B2 JP7128919 B2 JP 7128919B2
Authority
JP
Japan
Prior art keywords
skill
term
list
skill term
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021017217A
Other languages
English (en)
Other versions
JP2022020543A (ja
Inventor
ジンシュアイ・ジャン
チャオ・マ
ヘンシュ・ジュ
カイチュン・ヤオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022020543A publication Critical patent/JP2022020543A/ja
Application granted granted Critical
Publication of JP7128919B2 publication Critical patent/JP7128919B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本願の実施例は機械学習技術分野に関するものであり、特に、プロフィールの技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体ならびにコンピュータプログラム製品に関するものである。
現在、企業の人材採用過程において、採用担当者が向き合うものは膨大な量の求職者のプロフィールであることが常であり、手作業での識別、判断、選別という方式を用いることが多いことから、企業の要求を満たす人材を膨大な量のプロフィールの中から選別するために、採用担当者は多くの時間を費やしてプロフィールにおける有効な情報を識別しなければならない。また、企業は、特に専門的技能において、異なるポジションに対して異なる専門的要求があるのが常であり、採用担当者の知識に限界があり、プロフィールのすべての専門的技能を効果的に識別できず、優秀なプロフィールを見逃すことになってしまう。
よって、如何に採用担当者を補佐して、プロフィールの選別および対象人材の選別の効率と正確さを向上させるかということが目下解決の待たれる技術課題となっている。
本願の実施例はプロフィールの技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体ならびにコンピュータプログラム製品を提供する。
第1の態様において、本願の実施例はプロフィールの技能用語評定方法を提供し、当該技能用語評定方法は、
評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するステップと、
前記第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するステップと、を含む。
第2の態様において、本願の実施例は技能用語評定装置を提供し、当該技能用語評定装置は、
評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するための技能用語取得モジュールと、
前記第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するための技能用語評定モジュールと、を含む。
第3の態様において、本願の実施例は電子機器を提供し、当該電子機器は、
1つ以上のプロセッサと、
1つ以上のプログラムが記憶され、前記1つ以上のプログラムが前記1つ以上のプロセッサにより実行されるときに、前記1つ以上のプロセッサに本願のいずれか1つの実施例が提供する技能用語評定方法を実現させるメモリと、を含む。
第4の態様において、本願の実施例はコンピュータプログラムが記憶されたコンピュータ読み取り可能な媒体であって、前記コンピュータプログラムが実行されるときに本願のいずれか1つの実施例が提供する技能用語評定方法を実現するコンピュータ読み取り可能な媒体を提供する。
第5の態様において、本願の実施例は、コンピュータプログラムを含み、前記コンピュータプログラムがプロセッサにより実行されるときに本願のいずれか1つの実施例が提供する技能用語評定方法を実現するコンピュータプログラム製品を提供する。
本願の実施例が提供するプロフィールの技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体ならびにコンピュータプログラム製品は、技能用語評定の正確さ、プロフィールの選別効率を向上させており、手作業による選別と評定の時間コストを大幅に縮小している。
図面は本願の実施例をさらに理解するために提供されるものであり、また明細書の一部を構成し、本願の実施例とともに本願を解釈するために用いられるものであって、本願を限定するものではない。図面を参照して詳細な例示的な実施例について説明することにより、上記およびその他の特徴と利点が当業者にとってより自明になるであろう。
本願の実施例が提供するプロフィールの技能用語評定方法のフローチャートである。 図1におけるステップ11の具体的な実現方式のフローチャートである。 図2におけるステップ111の具体的な実現方式のフローチャートである。 本願の実施例における技能用語評定モデルのトレーニング方法のフローチャートである。 本願の実施例における単語埋め込みモデルのニューラルネットワーク構造の模式図である。 本願の実施例が提供する技能用語評定装置の構造ブロック図である。 図6における技能用語取得モジュールの構造ブロック図である。 本願の実施例が提供する他の技能用語評定装置の構造ブロック図である。 本願の実施例が提供する電子機器の構造ブロック図である。
当業者が本願の技術案をより良く理解できるように、以下に図面を組み合わせながら本願が提供するプロフィールの技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体ならびにコンピュータプログラム製品について詳細に説明する。
以下では図面を参照しながら例示的な実施例についてより十分に説明していくが、説明する例示的な実施例は異なる形式で体現することができ、本明細書に記載の実施例に限定されると解釈してはならない。むしろ、これらの実施例を提供する目的は、本願を詳らかにかつ完全にし、当業者に本願の範囲を十分に理解させることである。
矛盾することがなければ、本願の各実施例および実施例における各特徴を互いに組み合わせることができる。
本明細書で使用する、「および/または」のような用語は、1つ以上の関連する列挙対象の任意およびすべての組み合わせを含む。
本明細書にて使用する用語は特定の実施例を説明するためだけに使用され、本願を限定することは意図していない。本明細書にて使用する、単数形式の「1つ」および「当該」のような用語は、前後の文で別途明確に示さない限り、複数の形式を含むことも意図している。また、本明細書で「含む」および/または「……からなる」という用語を使用する場合、前記特徴、全体、ステップ、操作、要素および/またはコンポーネントが存在することを指すが、1つ以上のその他の特徴、全体、ステップ、操作、要素、コンポーネントおよび/またはそのグループの存在、あるいは追加は除外されない。
別途限定しない限り、本明細書にて使用するすべての用語(技術および科学用語を含む)の意味は、当業者が一般的に理解する意味と同じである。また、一般辞書にて限定されるような用語は、それが関連技術および本願の背景における意味と一致する意味を有すると解釈されるべきであり、本明細書で明確に限定しない限り、理想化または過度の形式上の意味を有すると解釈されないということも合わせて理解されたい。
図1は本願の実施例が提供するプロフィールの技能用語評定方法のフローチャートであり、図1に示すように、当該方法は技能用語評定装置により実行することができ、当該装置はソフトウェアおよび/またはハードウェアの形式で実現することができ、当該装置はサーバなどの電子機器内に統合することができる。当該技能用語の評定方法はステップ11およびステップ12を含む。
ステップ11、評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定する。
いくつかの応用シーンにおいて、採用担当者が求職者の一件以上のプロフィール文書を取得した後、プロフィール文書を技能用語評定装置に送信して評定することができ、採用担当者がプロフィール文書を取得する経路は、求人用メールアドレス、求人サイト、求人用クライアントなどを介して取得してよい。いくつかの応用シーンにおいて、求人用メールアドレス、求人サイト、求人用クライアントなどが求職者のプロフィール文書を受信した後、プロフィール文書を自動的に技能用語評定装置に転送することもできる。いくつかの応用シーンにおいて、技能用語評定装置は所定時間おきに(例えば10分、20分など)自発的に問い合わせるという方式により、求人用メールアドレス、求人サイト、求人用クライアントなどから求職者のプロフィール文書を取得してもよい。いくつかの応用シーンにおいて、プロフィール文書は紙媒体のプロフィール文書であってもよく、採用担当者が紙媒体のプロフィール文書を取得した後、スキャンすることで紙媒体のプロフィール文書を電子版のプロフィール文書に変換してから技能用語評定装置に送信することができる。
本願の実施例では、技能用語評定装置がプロフィール文書を受信した後、各プロフィール文書に対してステップ11およびステップ12の操作を行い、これにより各プロフィール文書の技能用語の自動評定が完了する。いくつかの実施例では、技能用語評定装置が各プロフィール文書の技能用語評定を終えた後、採用担当者が素早く正確に求職者のプロフィール技能画像を取得してプロフィールの選別を終えることができるように、マンマシンインターフェースなどの適切な方式により、採用担当者に各プロフィール文書の技能用語評定結果を提示することもできる。
図2は図1におけるステップ11の具体的な実現方式のフローチャートであり、図2に示すように、いくつかの実施例においてステップ11はステップ111からステップ113を含む。
ステップ111、プロフィール文書から、プロフィール文書に出現するすべての技能用語を含む第2の技能用語リストを決定する。
図3は図2におけるステップ111の具体的な実現方式のフローチャートであり、図3に示すように、いくつかの実施例においてステップ111はステップ1111、ステップ1112を含む。
ステップ1111、プロフィール文書からプロフィールテキストデータを取得する。
具体的に、ステップ1111では、プロフィール文書を取得した後、プロフィール文書におけるプロフィールテキストデータを得るために、プロフィール文書を標準化、フォーマット化処理し、プロフィールテキストデータには、業務経験の記述、プロジェクト経験の記述、個人の専門的技能の記述などのテキストデータを含む。
ステップ1112、プロフィールテキストデータから、プロフィールテキストデータに出現するすべての技能用語を抽出し、第2の技能用語リストを生成する。
具体的に、ステップ1112では、プロフィールテキストデータに対して、まず、あらかじめ設定された品詞分解ツールを用いてプロフィールテキストデータに品詞分解処理を行い、プロフィールテキストデータにおける各単語を含む、品詞分解処理結果を得る。
その後、あらかじめ設定された分野技能用語データベースを用いて、品詞分解処理結果からプロフィールテキストデータに出現するすべての技能用語を選別する。具体的には、品詞分解して得た単語を技能用語データベースにおける技能用語と照合することができ、合致すれば当該単語は技能用語であることを表す。ここで、技能用語は中国語形式の技能用語であってよく、英語形式の技能用語であってもよく、あるいは中国語、英語の略称形式の技能用語であってもよい。
ステップ1112では、分野技能用語データベースによりプロフィールテキストデータにおける非技能用語をフィルタリングしてから、プロフィールテキストデータに出現するすべての技能用語を得て、当該すべての技能用語に基づいて第2の技能用語リストを生成する。
ステップ112、第2の技能用語リストにおける各技能用語が属する技術分野を確定する。
技能用語に対する採用担当者の理解を深めるために、いくつかの実施例では、技能用語が属する技術分野を識別する必要がある。具体的に、ステップ112では、あらかじめ設定されたナレッジグラフを用いて、第2の技能用語リストにおける各技能用語が属する技術分野を確定する。ナレッジグラフは技能用語と属する技術分野の対応関係とを含み、技術分野は複数の技能用語を含んでよい。例えば、「TensorFlow」という技能は「ディープラーニング」分野の技能である。採用担当者はある技能用語(例えばTensorFlow)について理解していない可能性があり、求職者のプロフィールへの理解に大きなずれが生じる恐れがあるため、いくつかの実施例では、あらかじめ設定された、技術分野と技能用語のナレッジグラフを導入することにより、技能用語の上位下位関係、相似関係などを拡大し、技能用語の説明を合理的に規範化し、即ち後続ステップのモデルの入力を規範化できるだけでなく、モデル出力結果の可読性も向上でき、プロフィールにおける技能用語に対する採用担当者の理解を深めている。
ステップ113、第2の技能用語リストにおけるすべての技能用語と対応する技術分野とに基づき、第1の技能用語リストを生成し、各技術分野を第1の技能用語リストにおける1つの技能用語とする。
いくつかの実施例では、ステップ113において、プロフィール文書に出現するすべての技能用語を取得して、各技能用語が属する技術分野を識別した後に、技術分野そのものも1つの技能用語とし、プロフィール文書に出現するすべての技能用語と対応する技術分野とに基づいて第1の技能用語リストを生成し、第1の技能用語リストにおいて、各技術分野は1つの技能用語とされる。
ステップ12、第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測する。
なお、当該技能用語の第1の技能用語リストにおける前後の文の情報は第1の技能用語リストにおける当該技能用語以外のその他の技能用語を含む。ステップ12では、あらかじめトレーニングされた技能用語評定モデルの入力を当該技能用語以外のその他の技能用語に対応する単語ベクトルとし、その出力を当該技能用語が出現する確率値、即ち当該技能用語が、プロフィール文書においてその他の技能用語が既知である状態下で出現する確率とし、当該確率値は対応する技能用語の重要度を特徴付けることができ、確率値が大きいほど、当該技能用語の重要度はより高い。
具体的に、ステップ12では、まず第1の技能用語リストにおける当該技能用語以外の各技能用語について、当該技能用語以外の各技能用語に対応する単語ベクトルを生成する。ここで、各技能用語に対応する単語ベクトルはワンホットエンコーディング(Onehot)という方式で生成してよい。
その後、当該技能用語以外の各技能用語に対応する単語ベクトルをあらかじめトレーニングされた技能用語評定モデルの入力とし、前記技能用語評定モデルを用いて当該技能用語が出現する確率値を予測して得る。
あらかじめトレーニングされた技能用語評定モデルを用いて第1の技能用語リストにおける各技能用語を予測し、第1の技能用語リストにおいて各技能用語が出現する確率値を得る。
図4は本願の実施例における技能用語評定モデルのトレーニング方法のフローチャートであり、いくつかの実施例では、図4に示すように、技能用語評定モデルは以下のステップトレーニングにより得られる。
ステップ21、プロフィールサンプルから抽出して得た複数のトレーニング技能用語を含む、トレーニングデータセットを取得する。
ここで、複数のトレーニング技能用語はプロフィールサンプルから抽出した技能用語およびその対応する技術分野を含む。
ステップ22、各トレーニング技能用語に対応する単語ベクトルを生成する。
いくつかの実施例では、各トレーニング技能用語にワンホットエンコーディング(Onehot)処理を行って各トレーニング技能用語に対応する単語ベクトルを得ることができる。
ステップ23、各トレーニング技能用語に対して、当該トレーニング技能用語以外の各トレーニング技能用語に対応する単語ベクトルを入力とし、あらかじめ設定された単語埋め込みモデルを用いてモデルトレーニングを行い、単語埋め込みモデルの出力を当該トレーニング技能用語が出現する確率値とする。
ここで、当該トレーニング技技能用語以外の各トレーニング技能用語に対応する単語ベクトルはそれぞれ、x,x,…,x,と記され、Cは当該トレーニング技能用語以外のその他のトレーニング技能用語の総数量を表す。
いくつかの実施例において、単語埋め込みモデルはContinuous Bag of Wordsニューラルネットワークモデル(CBOW)を含み、図5は本願の実施例における単語埋め込みモデルのニューラルネットワーク構造の模式図であり、図5に示すように、単語埋め込みモデルは入力層(Input layer)、隠れ層(Hidden layer)、出力層(Output layer)を含む。
ここで、入力層はC個のトレーニング技能用語の入力{x,x,…,x}を有し、ウィンドウの大きさをC、単語テーブルの長さをVとし、Vは分野技能用語データベースにおける技能用語の総数量を表す。
隠れ層はN次元のベクトルであって、Nは隠れ層のニューロンの数であり、隠れ層hの出力表示は以下の通りである。
Figure 0007128919000001
ここで、Wは入力層から隠れ層へ至るN*V次元の重み行列、hは隠れ層の出力であり、hはC個のトレーニング技能用語に対応する単語ベクトルの加重平均を表し、x,x,…,xは当該トレーニング技能用語以外のその他のトレーニング技能用語に対応する単語ベクトルをそれぞれ表す。
出力層の入力はV×1次元のベクトルuであり、u=W’・hであって、W’は隠れ層から出力層へ至るN*V次元の重み行列で、ベクトルuの第j個の素子uはW’の第j列と隠れ層の出力hのスカラー積で、即ち
Figure 0007128919000002
であって、
Figure 0007128919000003
はW’の第j列を表し、uは分野技能用語データベースにおける第j個の技能用語のスコアを表し、スコアが最も高い技能用語を予測出力する技能用語として、Softmax(ロジスティック回帰)関数を用いてベクトルuを[0,1]の間に正規化することで、出力する技能用語の確率を予測して得て、最終的に出力層の出力ベクトルyを得る。出力ベクトルyの表示は以下の通りである。
Figure 0007128919000004
ここで、xはトレーニング技能用語テーブルにおける第i個の技能用語を表し、contex(x)はトレーニング技能用語テーブルにおけるx以外の残りの技能用語を表し、P(x|contex(x))は出力する第i個の技能用語が出現する確率値を表す。
ステップ24、あらかじめ設定された確率的勾配降下法を用いて前記単語埋め込みモデルのモデルパラメータを繰り返し更新し、技能用語評定モデルを得る。
ステップ24では、モデルトレーニング過程において、モデルが収束するまで確率的勾配降下法を用いてモデルパラメータWとW’を更新し続け、必要な技能用語評定モデルを最終的に得る。
本願の実施例が提供する技能用語評定方法は、プロフィールにおける技能情報の抽出を自動化することに加え、技能用語の前後の文の情報とあらかじめトレーニングされた技能用語評定モデルを用いて、技能用語が出現する確率を予測し、確率値が大きいほど技能用語の重要性がより高いことを表し、これによりプロフィールにおける各技能用語の評定の自動化を実現しており、技能用語評定の正確さを高めるとともに、プロフィールの技能画像を速やかに構築でき、採用担当者がプロフィールの技能情報を素早く抽出し、プロフィール内容の確認およびプロフィール選別を終えることを効果的に補佐することができ、プロフィールの選別効率を高めており、手作業での選別と評定の時間コストを大幅に縮小している。
図6は本願の実施例が提供する技能用語評定装置の構造ブロック図であり、図6に示すように、当該技能用語評定装置は上述の技能用語評定方法を実現するためのものであって、当該技能用語評定装置は、技能用語取得モジュール31と技能用語評定モジュール32とを含む。
ここで、技能用語取得モジュール31は、評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するためのものである。
技能用語評定モジュール32は、第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するためのものである。
図7は図6における技能用語取得モジュールの構造ブロック図であり、図7に示すように、いくつかの実施例では、技能用語取得モジュール31は、技能用語抽出サブモジュール311と、技能分野確定サブモジュール312と、技能用語リスト生成サブモジュール313と、を含む。
ここで、技能用語抽出サブモジュール311は、プロフィール文書から、プロフィール文書に出現するすべての技能用語を含む第2の技能用語リストを決定するためのものであり、技能分野確定サブモジュール312は、第2の技能用語リストにおける各技能用語が属する技術分野を確定するためのものであり、技能用語リスト生成サブモジュール313は、第2の技能用語リストにおけるすべての技能用語と対応する技術分野とに基づき、第1の技能用語リストを生成し、各技術分野を第1の技能用語リストにおける1つの技能用語とするためのものである。
いくつかの実施例において、技能用語抽出サブモジュール311は具体的に、プロフィール文書からプロフィールテキストデータを取得し、プロフィールテキストデータからプロフィールテキストデータに出現するすべての技能用語を抽出し、第2の技能用語リストを生成するためのものである。
いくつかの実施例において、技能用語抽出サブモジュール311は具体的に、あらかじめ設定された品詞分解ツールを用いてプロフィールテキストデータに品詞分解処理を行い、あらかじめ設定された分野技能用語データベースを用いて、品詞分解処理結果からプロフィールテキストデータに出現するすべての技能用語を選別するためのものである。
いくつかの実施例において、技能分野確定サブモジュール312は具体的に、あらかじめ設定されたナレッジグラフを用いて、第2の技能用語リストにおける各技能用語が属する技術分野を確定するためのものである。
図8は本願の実施例が提供する他の技能用語評定装置の構造ブロック図であり、図8に示すように、当該技能用語評定装置はモデルトレーニングモジュール33をさらに含む。
ここで、モデルトレーニングモジュール33は、プロフィールサンプルから抽出して得た複数のトレーニング技能用語を含む、トレーニングデータセットを取得し、各トレーニング技能用語に対応する単語ベクトルを生成し、各トレーニング技能用語に対して、当該トレーニング技能用語以外の各トレーニング技能用語に対応する単語ベクトルを入力とし、あらかじめ設定された単語埋め込みモデルを用いてモデルトレーニングを行い、単語埋め込みモデルの出力を当該トレーニング技能用語が出現する確率値とし、あらかじめ設定された確率的勾配降下法を用いて単語埋め込みモデルのモデルパラメータを繰り返し更新し、技能用語評定モデルを得るためのものである。
いくつかの実施例において、単語埋め込みモデルはContinuous Bag of Wordsニューラルネットワークモデルを含む。
このほか、本願の実施例が提供する技能用語評定装置は具体的に、前述の技能用語評定方法を実施するために用いられ、具体的に前述の技能用語評定方法の説明を参照することができるため、ここでは改めて説明しない。
図9は本願の実施例が提供する電子機器の構造ブロック図であり、図9に示すように、当該電子機器は1つ以上のプロセッサ501と、1つ以上のプログラムが記憶され、1つ以上のプログラムが1つ以上のプロセッサ501により実行されるときに、1つ以上のプロセッサ501に上述の技能用語評定方法を実現させるメモリ502と、を含み、1つ以上のI/Oインターフェース503はプロセッサ501とメモリ502との間に接続され、プロセッサ501とメモリ502との情報のやり取りを実現するように配置される。
本願の実施例は、コンピュータプログラムが記憶されたコンピュータ読み取り可能な記憶媒体であって、当該コンピュータプログラムが実行されるときに前述の技能用語評定方法を実現するコンピュータ読み取り可能な記憶媒体をさらに提供する。
当業者であれば、上記で公開された方法のすべてまたはいくつかのステップ、システム、装置内の機能モジュール/ユニットが、ソフトウェア、ファームウェア、ハードウェアおよびその適切な組み合わせとして実施されてもよいと理解できる。ハードウェアの実施の形態において、上記の説明で言及した機能モジュール/ユニット間の区分は、必ずしも物理的コンポーネントの区分に対応しているわけではない。例えば、1つの物理的コンポーネントは、複数の機能を有することができ、または、1つの機能またはステップは、いくつかの物理的コンポーネントによって連携して実行することができる。いくつかの物理的コンポーネントまたはすべての物理的コンポーネントは、中央プロセッサ、デジタル信号プロセッサまたはマイクロプロセッサのようなプロセッサによって実行されるソフトウェアとして実施されてもよく、またはハードウェアとして実施されてもよく、あるいは専用集積回路のような集積回路として実施されてもよい。このようなソフトウェアは、コンピュータ読み取り可能な媒体に設けることができ、コンピュータ読み取り可能な媒体は、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含んでよい。当業者に知られているように、用語としてのコンピュータ記憶媒体は、情報(例えば、コンピュータ読み取り可能なコマンド、データ構造、プログラムモジュールまたはその他のデータ)を記憶するための任意の方法または技術で実施される揮発性および不揮発性、リムーバブル媒体および非リムーバブル媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM(登録商標)、フラッシュメモリまたはその他のメモリ技術、CD-ROM、デジタル多機能ディスク(DVD)またはその他の光ディスクメモリ、磁気カセット、磁気テープ、磁気ディスクメモリまたはその他の磁気記憶装置、あるいは所望の情報を記憶するために使用され、かつコンピュータによってアクセスすることのできるその他の任意の媒体を含むが、これらに限定されない。このほか、当業者に知られているように、通信媒体は通常、コンピュータ読み取り可能なコマンド、データ構造、プログラムモジュールまたは搬送波またはその他の伝送機構のような変調データ信号におけるその他のデータを含むほか、任意の情報伝達媒体を含むことができる。
本願の実施例は、コンピュータプログラムを含み、コンピュータプログラムがプロセッサにより実行されるときに前述の技能用語評定方法を実現するコンピュータプログラム製品をさらに提供する。
本願が公開する方法を実施するためのプログラムコードは、1つ以上のプログラミング言語の任意の組み合わせを用いて作成することができる。これらのプログラムコードは、プロセッサまたはコントローラによってプログラムコードが実行されると、フローチャートおよび/またはブロック図に規定された機能/動作が実行されるように、汎用コンピュータ、専用コンピュータまたはその他のプログラマブルデータ処理装置のプロセッサまたはコントローラに提供されてよい。プログラムコードは完全にマシン上で、部分的にマシン上で実行されてよく、独立したソフトウェアパッケージとして部分的にマシン上で実行され、且つ部分的にリモートマシン上で実行され、あるいは完全にリモートマシンまたはサーバ上で実行されてよい。
本明細書では例示的な実施例を公開し、また具体的な用語を採用しているが、これらは一般的な例証的な意味としてのみ使用され、そのような意味にのみ解釈されるべきであって、限定する目的では使用されない。いくつかの実施例において、特に別途指摘されていない限り、特定の実施例に関連して説明された特徴、特性、および/または要素を単独で使用してもよく、または他の実施例に関連して説明された特徴、特性、および/または要素の組み合わせとして使用してもよいということは当業者にとって明らかである。よって、当業者は、添付の請求項によって明らかにされた本願の範囲から逸脱することなく、様々な形態および細部において変更が可能であると理解するであろう。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するステップと、
前記第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するステップと、を含む
プロフィールの技能用語評定方法。
[C2]
評定するプロフィール文書から、評定する第1の技能用語リストを決定する前記ステップは、
前記プロフィール文書から、前記プロフィール文書に出現するすべての技能用語を含む第2の技能用語リストを決定するステップと、
前記第2の技能用語リストにおける各技能用語が属する技術分野を確定するステップと、
前記第2の技能用語リストにおけるすべての技能用語と対応する技術分野とに基づき、前記第1の技能用語リストを生成し、各前記技術分野を前記第1の技能用語リストにおける1つの技能用語とするステップと、を含む
C1に記載の技能用語評定方法。
[C3]
前記プロフィール文書から第2の技能用語リストを決定する前記ステップは、
前記プロフィール文書からプロフィールテキストデータを取得するステップと、
前記プロフィールテキストデータから、前記プロフィールテキストデータに出現するすべての技能用語を抽出し、前記第2の技能用語リストを生成するステップと、を含む
C2に記載の技能用語評定方法。
[C4]
前記プロフィールテキストデータから、前記プロフィールテキストデータに出現するすべての技能用語を抽出する前記ステップは、
あらかじめ設定された品詞分解ツールを用いて前記プロフィールテキストデータに品詞分解処理を行うことと、
あらかじめ設定された分野技能用語データベースを用いて、品詞分解処理結果から前記プロフィールテキストデータに出現するすべての技能用語を選別することと、を含む
C3に記載の技能用語評定方法。
[C5]
前記第2の技能用語リストにおける各技能用語が属する技術分野を確定する前記ステップは、
あらかじめ設定されたナレッジグラフを用いて、前記第2の技能用語リストにおける各技能用語が属する技術分野を確定することを含む
C2に記載の技能用語評定方法。
[C6]
前記技能用語評定モデルは、
プロフィールサンプルから抽出して得た複数のトレーニング技能用語を含む、トレーニングデータセットを取得し、
各トレーニング技能用語に対応する単語ベクトルを生成し、
各トレーニング技能用語に対して、当該トレーニング技能用語以外の各トレーニング技能用語に対応する単語ベクトルを入力とし、あらかじめ設定された単語埋め込みモデルを用いてモデルトレーニングを行い、前記単語埋め込みモデルの出力を当該トレーニング技能用語が出現する確率値とし、
あらかじめ設定された確率的勾配降下法を用いて前記単語埋め込みモデルのモデルパラメータを繰り返し更新し、前記技能用語評定モデルを得る
というステップによってトレーニングにより得られる
C1に記載の技能用語評定方法。
[C7]
各トレーニング技能用語に対応する単語ベクトルを生成する前記ステップは、
各トレーニング技能用語にワンホットエンコーディング処理を行い、各トレーニング技能用語に対応する単語ベクトルを得ることを含む
C6に記載の技能用語評定方法。
[C8]
前記単語埋め込みモデルはContinuous Bag of Wordsニューラルネットワークモデルを含む
C6に記載の技能用語評定方法。
[C9]
当該技能用語の前記第1の技能用語リストにおける前後の文の情報は前記第1の技能用語リストにおける当該技能用語以外のその他の技能用語を含み、
あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語が出現する確率値を予測する前記ステップは、
前記第1の技能用語リストにおける当該技能用語以外の各技能用語に対応する単語ベクトルを生成することと、
当該技能用語以外の各技能用語に対応する単語ベクトルを前記技能用語評定モデルの入力とし、前記技能用語評定モデルを用いて当該技能用語が出現する確率値を予測して得ることと、を含む
C1に記載の技能用語評定方法。
[C10]
評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するための技能用語取得モジュールと、
前記第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するための技能用語評定モジュールと、を含む
技能用語評定装置。
[C11]
前記プロフィール文書から、前記プロフィール文書に出現するすべての技能用語を含む第2の技能用語リストを決定するための技能用語抽出サブモジュールと、
前記第2の技能用語リストにおける各技能用語が属する技術分野を確定するための技能分野確定サブモジュールと、
前記第2の技能用語リストにおけるすべての技能用語と対応する技術分野とに基づき、前記第1の技能用語リストを生成し、各前記技術分野を前記第1の技能用語リストにおける1つの技能用語とするための技能用語リスト生成サブモジュールと、を含む
C10に記載の技能用語評定装置。
[C12]
前記技能用語抽出サブモジュールは具体的に、前記プロフィール文書からプロフィールテキストデータを取得し、前記プロフィールテキストデータから前記プロフィールテキストデータに出現するすべての技能用語を抽出し、前記第2の技能用語リストを生成するためのものである
C11に記載の技能用語評定装置。
[C13]
前記技能用語抽出サブモジュールは具体的に、あらかじめ設定された品詞分解ツールを用いて前記プロフィールテキストデータに品詞分解処理を行い、あらかじめ設定された分野技能用語データベースを用いて、品詞分解処理結果から前記プロフィールテキストデータに出現するすべての技能用語を選別するためのものである
C12に記載の技能用語評定装置。
[C14]
前記技能分野確定サブモジュールは具体的に、あらかじめ設定されたナレッジグラフを用いて、前記第2の技能用語リストにおける各技能用語が属する技術分野を確定するためのものである
C11に記載の技能用語評定装置。
[C15]
モデルトレーニングモジュールをさらに含み、
前記モデルトレーニングモジュールは、プロフィールサンプルから抽出して得た複数のトレーニング技能用語を含む、トレーニングデータセットを取得し、各トレーニング技能用語に対応する単語ベクトルを生成し、各トレーニング技能用語に対して、当該トレーニング技能用語以外の各トレーニング技能用語に対応する単語ベクトルを入力とし、あらかじめ設定された単語埋め込みモデルを用いてモデルトレーニングを行い、前記単語埋め込みモデルの出力を当該トレーニング技能用語が出現する確率値とし、あらかじめ設定された確率的勾配降下法を用いて前記単語埋め込みモデルのモデルパラメータを繰り返し更新し、前記技能用語評定モデルを得るためのものである
C10に記載の技能用語評定装置。
[C16]
前記単語埋め込みモデルはCBOWニューラルネットワークモデルを含む
C15に記載の技能用語評定装置。
[C17]
1つ以上のプロセッサと、
1つ以上のプログラムが記憶され、前記1つ以上のプログラムが前記1つ以上のプロセッサにより実行されるときに、前記1つ以上のプロセッサにC1から9のいずれか一項に記載の技能用語評定方法を実現させるメモリと、を含む
電子機器。
[C18]
コンピュータプログラムが記憶されたコンピュータ読み取り可能な媒体であって、前記コンピュータプログラムが実行されるときにC1から9のいずれか一項に記載の技能用語評定方法を実現する
コンピュータ読み取り可能な記憶媒体。
[C19]
コンピュータプログラムを含み、前記コンピュータプログラムがプロセッサにより実行されるときにC1から9のいずれか一項に記載の技能用語評定方法を実現する
コンピュータプログラム製品。

Claims (16)

  1. 評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するステップと、
    前記第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するステップと、を含み、
    ここにおいて、評定するプロフィール文書から、評定する第1の技能用語リストを決定する前記ステップは、
    前記プロフィール文書から、前記プロフィール文書に出現するすべての技能用語を含む第2の技能用語リストを決定するステップと、
    前記第2の技能用語リストにおける各技能用語が属する技術分野を確定するステップと、
    前記第2の技能用語リストにおけるすべての技能用語と対応する技術分野とに基づき、前記第1の技能用語リストを生成し、各前記技術分野を前記第1の技能用語リストにおける1つの技能用語とするステップと、を含む
    プロフィールの技能用語評定方法。
  2. 前記プロフィール文書から第2の技能用語リストを決定する前記ステップは、
    前記プロフィール文書からプロフィールテキストデータを取得するステップと、
    前記プロフィールテキストデータから、前記プロフィールテキストデータに出現するすべての技能用語を抽出し、前記第2の技能用語リストを生成するステップと、を含む
    請求項に記載の技能用語評定方法。
  3. 前記プロフィールテキストデータから、前記プロフィールテキストデータに出現するすべての技能用語を抽出する前記ステップは、
    あらかじめ設定された品詞分解ツールを用いて前記プロフィールテキストデータに品詞分解処理を行うことと、
    あらかじめ設定された分野技能用語データベースを用いて、品詞分解処理結果から前記プロフィールテキストデータに出現するすべての技能用語を選別することと、を含む
    請求項に記載の技能用語評定方法。
  4. 前記第2の技能用語リストにおける各技能用語が属する技術分野を確定する前記ステップは、
    あらかじめ設定されたナレッジグラフを用いて、前記第2の技能用語リストにおける各技能用語が属する技術分野を確定することを含む
    請求項に記載の技能用語評定方法。
  5. 前記技能用語評定モデルは、
    プロフィールサンプルから抽出して得た複数のトレーニング技能用語を含む、トレーニングデータセットを取得し、
    各トレーニング技能用語に対応する単語ベクトルを生成し、
    各トレーニング技能用語に対して、当該トレーニング技能用語以外の各トレーニング技能用語に対応する単語ベクトルを入力とし、あらかじめ設定された単語埋め込みモデルを用いてモデルトレーニングを行い、前記単語埋め込みモデルの出力を当該トレーニング技能用語が出現する確率値とし、
    あらかじめ設定された確率的勾配降下法を用いて前記単語埋め込みモデルのモデルパラメータを繰り返し更新し、前記技能用語評定モデルを得る
    というステップによってトレーニングにより得られる
    請求項1に記載の技能用語評定方法。
  6. 各トレーニング技能用語に対応する単語ベクトルを生成する前記ステップは、
    各トレーニング技能用語にワンホットエンコーディング処理を行い、各トレーニング技能用語に対応する単語ベクトルを得ることを含む
    請求項に記載の技能用語評定方法。
  7. 前記単語埋め込みモデルはContinuous Bag of Wordsニューラルネットワークモデルを含む
    請求項に記載の技能用語評定方法。
  8. 当該技能用語の前記第1の技能用語リストにおける前後の文の情報は前記第1の技能用語リストにおける当該技能用語以外のその他の技能用語を含み、
    あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語が出現する確率値を予測する前記ステップは、
    前記第1の技能用語リストにおける当該技能用語以外の各技能用語に対応する単語ベクトルを生成することと、
    当該技能用語以外の各技能用語に対応する単語ベクトルを前記技能用語評定モデルの入力とし、前記技能用語評定モデルを用いて当該技能用語が出現する確率値を予測して得ることと、を含む
    請求項1に記載の技能用語評定方法。
  9. 評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するための技能用語取得モジュールと、
    前記第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するための技能用語評定モジュールと、を含
    前記プロフィール文書から、前記プロフィール文書に出現するすべての技能用語を含む第2の技能用語リストを決定するための技能用語抽出サブモジュールと、
    前記第2の技能用語リストにおける各技能用語が属する技術分野を確定するための技能分野確定サブモジュールと、
    前記第2の技能用語リストにおけるすべての技能用語と対応する技術分野とに基づき、前記第1の技能用語リストを生成し、各前記技術分野を前記第1の技能用語リストにおける1つの技能用語とするための技能用語リスト生成サブモジュールと、を含む
    技能用語評定装置。
  10. 前記技能用語抽出サブモジュールは具体的に、前記プロフィール文書からプロフィールテキストデータを取得し、前記プロフィールテキストデータから前記プロフィールテキストデータに出現するすべての技能用語を抽出し、前記第2の技能用語リストを生成するためのものである
    請求項に記載の技能用語評定装置。
  11. 前記技能用語抽出サブモジュールは具体的に、あらかじめ設定された品詞分解ツールを用いて前記プロフィールテキストデータに品詞分解処理を行い、あらかじめ設定された分野技能用語データベースを用いて、品詞分解処理結果から前記プロフィールテキストデータに出現するすべての技能用語を選別するためのものである
    請求項10に記載の技能用語評定装置。
  12. 前記技能分野確定サブモジュールは具体的に、あらかじめ設定されたナレッジグラフを用いて、前記第2の技能用語リストにおける各技能用語が属する技術分野を確定するためのものである
    請求項に記載の技能用語評定装置。
  13. モデルトレーニングモジュールをさらに含み、
    前記モデルトレーニングモジュールは、プロフィールサンプルから抽出して得た複数のトレーニング技能用語を含む、トレーニングデータセットを取得し、各トレーニング技能用語に対応する単語ベクトルを生成し、各トレーニング技能用語に対して、当該トレーニング技能用語以外の各トレーニング技能用語に対応する単語ベクトルを入力とし、あらかじめ設定された単語埋め込みモデルを用いてモデルトレーニングを行い、前記単語埋め込みモデルの出力を当該トレーニング技能用語が出現する確率値とし、あらかじめ設定された確率的勾配降下法を用いて前記単語埋め込みモデルのモデルパラメータを繰り返し更新し、前記技能用語評定モデルを得るためのものである
    請求項に記載の技能用語評定装置。
  14. 前記単語埋め込みモデルはCBOWニューラルネットワークモデルを含む
    請求項13に記載の技能用語評定装置。
  15. 電子機器であって、
    評定するプロフィール文書から、複数の技能用語を含み、評定する第1の技能用語リストを決定するステップと、
    前記第1の技能用語リストにおける各技能用語に対して、あらかじめトレーニングされた技能用語評定モデルと当該技能用語の前記第1の技能用語リストにおける前後の文の情報とを用いて、当該技能用語の重要度を特徴付けするための、当該技能用語が出現する確率値を予測するステップと、
    ここにおいて、評定するプロフィール文書から、評定する第1の技能用語リストを決定する前記ステップは、
    前記プロフィール文書から、前記プロフィール文書に出現するすべての技能用語を含む第2の技能用語リストを決定するステップと、
    前記第2の技能用語リストにおける各技能用語が属する技術分野を確定するステップと、
    前記第2の技能用語リストにおけるすべての技能用語と対応する技術分野とに基づき、前記第1の技能用語リストを生成し、各前記技術分野を前記第1の技能用語リストにおける1つの技能用語とするステップと、を含む
    を実行する
    電子機器。
  16. コンピュータプログラムが記憶されたコンピュータ読み取り可能な媒体であって、前記コンピュータプログラムが実行されるときに請求項1からのいずれか一項に記載の技能用語評定方法を実現する
    コンピュータ読み取り可能な記憶媒体。
JP2021017217A 2020-06-28 2021-02-05 技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体 Active JP7128919B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010598970.1 2020-06-28
CN202010598970.1A CN111767390A (zh) 2020-06-28 2020-06-28 技能词评估方法及装置、电子设备、计算机可读介质

Publications (2)

Publication Number Publication Date
JP2022020543A JP2022020543A (ja) 2022-02-01
JP7128919B2 true JP7128919B2 (ja) 2022-08-31

Family

ID=72722230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021017217A Active JP7128919B2 (ja) 2020-06-28 2021-02-05 技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体

Country Status (5)

Country Link
US (1) US20210406464A1 (ja)
EP (1) EP3929800A1 (ja)
JP (1) JP7128919B2 (ja)
KR (1) KR102456148B1 (ja)
CN (1) CN111767390A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101828B (zh) * 2020-11-23 2021-06-22 广州万维图灵智能科技有限公司 岗位技能评估方法、系统、电子设备及存储介质
CN113011177B (zh) * 2021-03-15 2023-09-29 北京百度网讯科技有限公司 模型训练和词向量确定方法、装置、设备、介质和产品
CN113780669A (zh) * 2021-09-15 2021-12-10 湖北天天数链技术有限公司 一种薪资的预测方法及装置、可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050080657A1 (en) 2003-10-10 2005-04-14 Unicru, Inc. Matching job candidate information
US20160103885A1 (en) 2014-10-10 2016-04-14 Workdigital Limited System for, and method of, building a taxonomy
US20160103837A1 (en) 2014-10-10 2016-04-14 Workdigital Limited System for, and method of, ranking search results obtained by searching a body of data records
US20200126020A1 (en) 2018-10-22 2020-04-23 Microsoft Technology Licensing, Llc Assessing suitability to join a current team of workers
US20200175455A1 (en) 2018-11-30 2020-06-04 Microsoft Technology Licensing, Llc Classification of skills
US20200193382A1 (en) 2018-12-17 2020-06-18 Robert P. Michaels Employment resource system, method and apparatus

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9734436B2 (en) * 2015-06-05 2017-08-15 At&T Intellectual Property I, L.P. Hash codes for images
US10061766B2 (en) * 2015-07-27 2018-08-28 Texas State Technical College System Systems and methods for domain-specific machine-interpretation of input data
US20180181544A1 (en) * 2016-12-28 2018-06-28 Google Inc. Systems for Automatically Extracting Job Skills from an Electronic Document
US11210636B1 (en) * 2017-08-14 2021-12-28 Enfuego Technologies, LLC Systems and methods for generating proposals
US20190066843A1 (en) * 2017-08-22 2019-02-28 Koninklijke Philips N.V. Collapsing clinical event data into meaningful states of patient care
US10839157B2 (en) * 2017-10-09 2020-11-17 Talentful Technology Inc. Candidate identification and matching
NL2021559B1 (en) * 2018-09-04 2020-04-30 Aidence B V Determination of a growth rate of an object in 3D data sets using deep learning
CN109614481A (zh) * 2018-09-29 2019-04-12 阿里巴巴集团控股有限公司 对象识别方法、装置、电子设备及计算机可读存储介质
CN111198943A (zh) * 2018-11-19 2020-05-26 Tcl集团股份有限公司 一种简历筛选方法、装置及终端设备
JP7462632B2 (ja) * 2018-11-30 2024-04-05 カリス エムピーアイ インコーポレイテッド 次世代分子プロファイリング
US11403279B1 (en) * 2018-12-04 2022-08-02 Marc Brandis Ag Electronic device and method for building a remake of a transaction-processing system
KR102200334B1 (ko) * 2018-12-13 2021-01-08 (주)코멘토 구직 서류 기반 직무능력 분석매칭 시스템 및 그 제어방법
US20200364765A1 (en) * 2019-04-25 2020-11-19 Mycelebs Co., Ltd. Method for managing item recommendation using degree of association between language unit and usage history
US11301636B2 (en) * 2019-05-01 2022-04-12 Microsoft Technology Licensing, Llc Analyzing resumes and highlighting non-traditional resumes
US11250214B2 (en) * 2019-07-02 2022-02-15 Microsoft Technology Licensing, Llc Keyphrase extraction beyond language modeling
CN110489765B (zh) * 2019-07-19 2024-05-10 平安科技(深圳)有限公司 机器翻译方法、装置及计算机可读存储介质
CN110516261A (zh) * 2019-09-03 2019-11-29 北京字节跳动网络技术有限公司 简历评估方法、装置、电子设备及计算机存储介质
US11080491B2 (en) * 2019-10-14 2021-08-03 International Business Machines Corporation Filtering spurious knowledge graph relationships between labeled entities
CN111078835A (zh) * 2019-12-05 2020-04-28 平安金融管理学院(中国·深圳) 简历评估方法、装置、计算机设备及存储介质
US11914954B2 (en) * 2019-12-08 2024-02-27 Virginia Tech Intellectual Properties, Inc. Methods and systems for generating declarative statements given documents with questions and answers
US11487947B2 (en) * 2019-12-16 2022-11-01 Microsoft Technology Licensing, Llc Machine learning techniques for analyzing textual content
US11526956B2 (en) * 2020-02-14 2022-12-13 Accenture Global Solutions Limited Skill acquisition platform
US20210358601A1 (en) * 2020-05-13 2021-11-18 Optum Technology, Inc. Artificial intelligence system for clinical data semantic interoperability

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050080657A1 (en) 2003-10-10 2005-04-14 Unicru, Inc. Matching job candidate information
US20160103885A1 (en) 2014-10-10 2016-04-14 Workdigital Limited System for, and method of, building a taxonomy
US20160103837A1 (en) 2014-10-10 2016-04-14 Workdigital Limited System for, and method of, ranking search results obtained by searching a body of data records
US20200126020A1 (en) 2018-10-22 2020-04-23 Microsoft Technology Licensing, Llc Assessing suitability to join a current team of workers
US20200175455A1 (en) 2018-11-30 2020-06-04 Microsoft Technology Licensing, Llc Classification of skills
US20200193382A1 (en) 2018-12-17 2020-06-18 Robert P. Michaels Employment resource system, method and apparatus

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Sayfullina, Luiza, Eric Malmi, and Juho Kannala.,Learning representations for soft skill matching,arXiv:1807.07741v1 [オンライン],2018年07月20日,[2022年 4月 1日検索],インターネット<URL: https://arxiv.org/abs/1807.07741>
Zhao, Meng, et al.,SKILL: A system for skill identification and normalization,Twenty-Seventh IAAI Conference,2015年

Also Published As

Publication number Publication date
US20210406464A1 (en) 2021-12-30
KR20220001009A (ko) 2022-01-04
CN111767390A (zh) 2020-10-13
EP3929800A1 (en) 2021-12-29
KR102456148B1 (ko) 2022-10-18
JP2022020543A (ja) 2022-02-01

Similar Documents

Publication Publication Date Title
JP7128919B2 (ja) 技能用語評定方法および装置、電子機器、コンピュータ読み取り可能な媒体
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
US10872204B2 (en) Generating natural language recommendations based on an industrial language model
US10725827B2 (en) Artificial intelligence based virtual automated assistance
US11604980B2 (en) Targeted crowd sourcing for metadata management across data sets
CN109271539B (zh) 一种基于深度学习的图像自动标注方法及装置
CN111368049A (zh) 信息获取方法、装置、电子设备及计算机可读存储介质
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
CN110968695A (zh) 基于弱监督技术主动学习的智能标注方法、装置及平台
KR102244938B1 (ko) 인공지능 채용 시스템 및 상기 시스템의 채용 방법
US10789533B2 (en) Generating a consistently labeled training dataset by automatically generating and displaying a set of most similar previously-labeled texts and their previously assigned labels for each text that is being labeled for the training dataset
CN112036842B (zh) 一种科技服务智能匹配装置
US7558803B1 (en) Computer-implemented systems and methods for bottom-up induction of decision trees
KR102281161B1 (ko) 자기소개서를 기반으로 면접 질문을 생성하는 서버 및 방법
JP2020135135A (ja) 対話コンテンツ作成支援方法およびシステム
CN114911929A (zh) 分类模型训练方法、文本挖掘方法、设备及存储介质
CN107688609B (zh) 一种职位标签推荐方法和计算设备
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
JP5905651B1 (ja) 実績評価装置、実績評価装置の制御方法、および実績評価装置の制御プログラム
DE102018007024A1 (de) Dokumentdurchsuchen mittels grammatischer einheiten
US20200050637A1 (en) System and method to analyse and predict impact of textual data
CN112905713B (zh) 联合罪名预测的涉案新闻重叠实体关系抽取方法
CN115982830B (zh) 室内设计节点的适配方法、装置、计算机设备和存储介质
KR102665966B1 (ko) 도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템
US20230368085A1 (en) Automated intelligence facilitation of routing operations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220819

R150 Certificate of patent or registration of utility model

Ref document number: 7128919

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150