TWI709048B

TWI709048B - 高頻詞企業特質屬性推薦方法

Info

Publication number: TWI709048B
Application number: TW107127911A
Authority: TW
Inventors: 金仁; 張凱閔; 洪維均
Original assignee: 全球華人股份有限公司
Priority date: 2018-08-10
Filing date: 2018-08-10
Publication date: 2020-11-01
Also published as: TW202009732A

Abstract

本發明係為一種高頻詞企業特質屬性推薦方法，其係包含：一企業高頻詞取樣步驟、一求職者高頻詞取樣步驟以及一媒合步驟。企業高頻詞取樣步驟係於一求才企業資料庫中，取得企業名單，並將該企業名單中的企業文本進行企業文字庫的建立，並將企業文字庫內的高頻詞取出，製成企業高頻詞資料庫。求職者高頻詞取樣步驟係於一求職者資料庫中，取得求職者名單，並將該求職者名單中的求職者文本進行求職者文字庫的建立，並將求職者文字庫內的高頻詞取出，取得求職者高頻詞資料庫。媒合步驟係將企業高頻詞資料庫與求職者高頻詞資料庫進行比對，以兩資料庫內之高頻詞相近程度進行比對，而產生一推薦名單。透過此方法可取得與使用者最相近的企業，可提升求職時的準確率。

Description

高頻詞企業特質屬性推薦方法

本發明係與一種職業配對方法有關，特別是指一種高頻詞企業特質屬性推薦方法。

按，現今因為網路的發展，求職者也多會透過網路的徵才入口，如104或1111等不同的求職入口網站進行應徵的工作，透過基本的資料與公司的徵才需求來選擇所需要的職缺，並對於有興趣或職缺相符合的工作進行應徵及面試。

但是，在一般的求職職缺中，求職者對於企業內部的文化及相關的企業特質並無法了解，導致無法確實的了解到企業的屬性是否與自己相符合，錄取後無法順利融入，除了無法勝任之外，辭職後再重新找尋新的工作時，又需要再花不少的時間及來進行應徵的工作。

本發明係為一種高頻詞企業特質屬性推薦方法，其主要係包含：一企業高頻詞取樣步驟，其係於一求才企業資料庫中，取得相關之企業名單，並對於該企業名單中所提供的所有的企業文本進行企業文字庫的建立，於已建立完成的企業文字資料庫中，將企業文字庫內使用頻率較高的作為高頻詞取出，以取得一企業高頻詞資料庫；一求職者高頻詞取樣步驟，其係於一求職者資料庫中，取得相關之求職者名單，並將該求職者名單中所提供的求職者文本進行求職者文字庫的建立，建立完成的求職者文字資料庫中，並將求職者文字庫內使用頻率較高作為的高頻詞取出，以取得求職者高頻詞資料庫；以及一媒合步驟，其將企業高頻詞資料庫與求職者高頻詞資料庫進行比對，將兩者資料庫內之高頻詞相近程度進行比對，對於近似程度較高的企業或求職者可以產生一推薦名單者。

本發明所提供之一種高頻詞企業特質屬性推薦方法，其係將企業相關的高頻詞與求職者的高頻詞進行相互比對，進而得到與求職者有最相近屬性的企業推薦名單，使求職者在進行應徵時能更了解企業的特質屬性是否與自身相符，可以降低求職時的不確定性；抑或，企業可以得到相近屬性的求職者名單，使企業在篩選求職者時得以更充分找出與該企業特質屬性相近或相符之求職者，以期在其中找出最適任者。

S1‧‧‧企業高頻詞取樣步驟

S2‧‧‧求職者高頻詞取樣步驟

S3‧‧‧文字去除步驟

S4‧‧‧文字轉換步驟

S5‧‧‧媒合步驟

第1圖係本發明之流程示意圖。

請參閱第1圖所示，其係為本發明之流程示意圖，其主要方法如以下詳述。

求職者先提供自己的履歷文字資料，並針對所要找的相關企業進行範圍的選擇，當確認其範圍之選擇後，將相關的企業及求職者所提供的資料進行高頻詞的取樣，會分為企業高頻詞取樣步驟S1及求職者高頻詞取樣步驟S2。在某些實施例中，求職者可進一步為求職網站之求職會員。

企業高頻詞取樣步驟S1：於一提供職缺的求才企業資料庫中，取得與求職者有相關職缺的企業名單，並將該相關企業名單中的企業文本進行企業文字庫的建立，該企業文本主要係來自於該企業相關之文字資料，如該企業在網路上的介紹、網站上對於企業的評論及網友討論等等的相關文字資料，以及透過企業自身對於企業簡介之文字資料，以及在該企業中資深任職者之履歷中所展現之特質之文字資料所構成，並將該企業文字庫內的文字資料中具有使用頻率較高的高頻詞取出，並且將該等高頻詞彙整集中後取得企業高頻詞資料庫。

求職者高頻詞取樣步驟S2：於一求職者資料庫中，取得要進行比對之求職者名單，並將該求職者名單中的求職者文本進行求職者文字庫的建立，該求職者文本係由求職者所提供的求職履歷之文字資料取得，並將求職者文字庫內的文字資料中使用頻率較高的高頻詞取出，並且將該等高頻詞彙整集中後取得求職者高頻詞資料庫。

一文字去除步驟S3：再將企業高頻詞資料庫及求職者高頻詞資料庫分別與一取樣文字庫比對，該取樣文字庫係由名詞文字庫、形容詞文字庫或其組合所構成，將企業高頻詞資料庫與求職者高頻詞資料庫內不符合該取樣文字庫的內容去除，使得企業高頻詞資料庫與求職者高頻詞資料庫內的高頻詞可以得到更純粹而可進行比對的內容，如此一來，可以避免在企業高頻詞資料庫及求職者高頻詞資料庫中出現無意義的用詞或語助詞，以提升比對後的可靠度。

一文字轉換步驟S4：將企業高頻詞資料庫及求職者高頻詞資料庫分別與一相似詞資料庫比對，該相似詞資料庫中係將一些語意相通的字詞先進行彙整，彙整後再統整成一固定的相似詞，將該企業高頻詞資料庫及求職者高頻詞資料庫中含有相同意義之相似詞轉換成同一詞彙，轉換成同一詞彙後可以更有效的分類，並可將相似詞進行一歸納及整理，可以集中媒合分析時各個相近似高頻詞的權重比例，以及避免相近似的高頻詞過於分散而降低其高頻詞權重所導致的誤差。

一媒合步驟S5：將轉換匯整後的企業高頻詞資料庫以及求職者高頻詞資料庫進行一高頻詞的比對媒合，該媒合步驟係包含有；

步驟1：對所有文本進行文字向量化，建立餘弦(Cosine)相似度模型，該相似度之計算式如下段所揭之內容。

Mean(求職者高頻詞1之權重* Mean(求職者高頻詞1及企業a高頻詞1之相似度+求職者高頻詞1及企業a高頻詞2之相似度+......+求職者高頻詞1及企業a高頻詞n之相似度)+求職者高頻詞2之權重* Mean(求職者高頻詞2及企業X高頻詞1之相似度+求職者高頻詞2及企業X高頻詞2之相似度+......+求職者高頻詞2及企業X高頻詞n之相似度)+…求職者高頻詞n之權重* Mean(求職者高頻詞n及企業X高頻詞1之相似度+求職者高頻詞n及企業X高頻詞2之相似度+…......+求職者高頻詞n及企業X高頻詞n之相似度))。

舉例而言，在求職者A中取出高頻詞為：積極、認真、程式，而在企業A中取出之高頻詞為：努力、團隊、電腦，以及在企業B中取出之高頻詞為：溝通、合作、業務。

透過相似度計算可得到，會員A與企業A之相似度為mean( 積極的adj * mean(積極與努力的相似度+積極與團隊的相似度+積極與電腦的相似度)+認真的adj * mean(認真與努力的相似度+認真與團隊的相似度+認真與電腦的相似度)+程式的adj * mean(程式與努力的相似度+程式與團隊的相似度+程式與電腦的相似度)。

而會員A與企業B之相似度為mean(積極的adj * mean(積極與溝通的相似度+積極與合作的相似度+積極與業務的相似度)+認真的adj * mean(認真與溝通的相似度+認真與合作的相似度+認真與業務相似度)+程式的adj * mean(程式與溝通的相似度+程式與合作的相似度+程式與業務的相似度)，其中，ADJ為各單詞權重。

另外，對於高頻詞的各單詞權重的計算方式可以有下列幾種方式，1.單詞權重係以出現次數來計算，出現次數越高，則權重越低；2.以計算式：1-((詞頻-所有詞頻最小值)/(所有詞頻最大值-所有詞頻最小值))來計算高頻詞的權重；3.另外亦可以其獨特性來計算，其權重係以高頻詞之獨特性來計算，越大眾化的字詞其權重越低。

步驟2：提出該求職者文本中之高頻詞並與所有企業文字庫中的高頻詞進行相似度計算，將企業高頻詞資料庫與求職者高頻詞資料庫進行比對，以兩資料庫內之高頻詞相近程度進行比對，比對後將兩資料庫中高頻詞相近程度較高的產生一推薦名單，該推薦名單係提供予求職者，該推薦名單可以給予求職者一較明確的企業資訊。

透過此一方法，可以將求職者的履歷進行一較完整的分析，並與範圍內的企業特質屬性有一完整的比較分析，透過此一方法，求職者可以知道自己的特質屬性與那一個企業是高度相符，可以提供求職者更進一步的參考資料，而可避免進入到與自己特質屬性不相符的企業內任質。

另外，此一比對方法，亦可轉換利用，在企業內亦可對於眾多求職者進行一比對，讓企業主可對於求職面試者先進行一篩選，進而可錄用與企業屬性較相近似的求職者，以使求職者能符合企業之需求

綜上所述，當知本發明具有產業上利用性與進步性，且本發明未見於任何刊物，亦具新穎性，當符合專利法之規定，爰依法提出發明專利申請，懇請貴審查委員惠准專利為禱。

唯以上所述者，僅為本發明之一可行實施例而已，當不能以之限定本發明實施之範圍；即大凡依本發明申請專利範圍所作之均等變化與修飾，皆應仍屬本發明專利涵蓋之範圍內。

S1‧‧‧企業高頻詞取樣步驟

S2‧‧‧求職者高頻詞取樣步驟

S3‧‧‧文字去除步驟

S4‧‧‧文字轉換步驟

S5‧‧‧媒合步驟

Claims

一種高頻詞企業特質屬性推薦方法，係包括下列步驟：一企業高頻詞取樣步驟：其係於一求才企業資料庫中，取得企業名單，並將該企業名單中的企業文本進行企業文字庫的建立，將企業文字庫內使用頻率較高的作為高頻詞取出，形成企業高頻詞資料庫；一求職者高頻詞取樣步驟：其係於一求職者資料庫中，取得求職者名單，並將該求職者名單中的求職者文本進行求職者文字庫的建立，並將求職者文字庫內使用頻率較高的作為高頻詞取出，以取得求職者高頻詞資料庫；以及，一媒合步驟：將企業高頻詞資料庫與求職者高頻詞資料庫進行比對，以兩資料庫內之高頻詞相近程度進行比對，而產生一推薦名單者。
如申請專利範圍第1項所述之高頻詞企業特質屬性推薦方法，其中，該企業文本係由該企業相關之文字資料、企業簡介之文字資料及企業中資深任職者之履歷中展現之特質其中一種以上所構成。
如申請專利範圍第1項所述之高頻詞企業特質屬性推薦方法，其中，該求職者文本係由求職者履歷之文字資料取得。
如申請專利範圍第1項所述之高頻詞企業特質屬性推薦方法，其中，更包含有一文字去除步驟：將企業高頻詞資料庫及求職者高頻詞資料庫與一取樣文字庫比對，將企業高頻詞資料庫與求職者高頻詞資料庫內不符合該取樣文字庫的內容去除。
如申請專利範圍第4項所述之高頻詞企業特質屬性推薦方法，其中，該取樣文字庫係由名詞文字庫、形容詞文字庫或其組合所構成。
如申請專利範圍第1項所述之高頻詞企業特質屬性推薦方法，其中，更包含有一文字轉換步驟：將企業高頻詞資料庫及求職者高頻詞資料庫與一相似詞資料庫比對，將該兩高頻詞資料庫中含有相同意義之相似詞轉換成同一詞彙。
如申請專利範圍第1項所述之高頻詞企業特質屬性推薦方法，其中，推薦名單係提供予求職者，推薦名單為與求職者具有相同高頻詞之企業名單。
如申請專利範圍第7項所述之高頻詞企業特質屬性推薦方法，其中，一媒合步驟係包括下列步驟：步驟1：對所有文本進行文字向量化，建立餘弦(Cosine)相似度模型；步驟2：提出該求職者文本中之高頻詞並與所有企業文字庫中的高頻詞進行相似度計算。
如申請專利範圍第8項所述之高頻詞企業特質屬性推薦方法，其中，該相似度之計算式為：Mean(求職者高頻詞1之權重* Mean(求職者高頻詞1及企業a高頻詞1之相似度+求職者高頻詞1及企業a高頻詞2之相似度+.........+求職者高頻詞1及企業a高頻詞n之相似度)+求職者高頻詞2之權重* Mean(求職者高頻詞2及企業X高頻詞1之相似度+求職者高頻詞2及企業X高頻詞2之相似度+.........+求職者高頻詞2及企業X高頻詞n之相似度)+...求職者高頻詞n之權重* Mean(求職者高頻詞n及企業X高頻詞1之相似度+求職者高頻詞n及企業X高頻詞2之相似度+.........+求職者高頻詞n及企業X高頻詞n之相似度))。
如申請專利範圍第9項所述之高頻詞企業特質屬性推薦方法，其中，該權重係以出現次數來計算，出現次數越高，則權重越低。
如申請專利範圍第9項所述之高頻詞企業特質屬性推薦方法，其中，其權重之計算方式為：1-((詞頻-所有詞頻最小值)/(所有詞頻最大值-所有詞頻最小值))。