TW201741948A

TW201741948A - 履歷評估方法和裝置

Info

Publication number: TW201741948A
Application number: TW106105765A
Authority: TW
Inventors: Hai Ying Wang; jun ning Liu; Ding Guo; Ao Chen; hua qing Song; Xiao Ying Zhang; Zhi Wei Shi; Kai Min Jin; Quan Yuan; chang jiang Liu
Original assignee: Alibaba Group Services Ltd
Priority date: 2016-03-30
Filing date: 2017-02-21
Publication date: 2017-12-01
Also published as: WO2017167069A1; CN107291715A

Abstract

本發明公開了一種履歷評估方法和裝置。其中，該方法包括：獲取歷史招聘資料集合；從歷史招聘資料集合中抽取資料，其中，資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，招聘結果至少包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數；通過訓練抽取到的資料構建履歷評估模型；使用履歷評估模型對接收到的履歷進行履歷評估。本發明解決了現有技術中對應聘者進行評估通過對應聘者的行為、社交資料進行全面分析來評價應聘者，而應聘者的行為、社交資料複雜多變且獲取難度高，從而導致評價的評估難度大的技術問題。

Description

履歷評估方法和裝置

本發明係關於資料處理領域，具體而言，關於一種履歷評估方法和裝置。

在現有技術的招聘過程中，很多招聘網站通過社交網路、可得行為資料等各方面對應聘者的完整形象進行刻畫，從各個方面對應聘者進行瞭解，從而希望幫助招聘方找到合適的人才。例如，作為大數據招聘平台的“尋英網”，以大數據演算法實現人才與企業職位的精準匹配，並具有“職位需求一鍵同步至主流招聘網站”等實用功能；“尋英網”的特點包括：(1)全量資料，形成多維度立體的用戶求職圖像。尋英網通過高科技獲取求職者的社交資訊、求職者在論壇上發布的言論以及發表的論文等全方面資料，將一個人由過去的平面圖片拓展到一個人的電影故事，從而形成多維度立體的用戶求職圖像。(2)個性化，多維度動態分析人才和企業的發展規律，優化雙向匹配引擎。尋英網以兩千萬人的職業發展路徑為資料源，通過分析，形成職位晉升圖譜，如職位晉升路徑、職位關聯關係等。

與上述應用功能類似的應用還包括“人才雷達”，“人才雷達”通過每個人在網路上留下的大量的資料，如生活軌跡、社交言行等個人資訊，從中剝離出他的興趣圖譜、性格畫像和能力評估。

因此，已有方案主要使用社交資料、行為資料等來進行求職人員和職位的匹配，然而使用社交資料、行為資料進行求職人員和職位的匹配存在如下問題：

(1)應用目標過於複雜

現有技術大多的應用場景集中在對合適人的匹配，落腳點在人的屬性，為了實現這個目標需要對人的行為、社交資料進行分析，全面的對人進行評價和刻畫，以至於大大提升對資料全面性和資料多樣性的要求。

(2)資料的可得性和全面性受到局限

現有技術為達到尋找到合適的員工的目的需要搜集多方面的資料，所以對資料的可得性和資料的全面性有很高的要求，同時也大大的局限了技術的準確性。

針對現有技術中通過對目標人物的行為、社交資料進行全面分析來評價目標應聘者，導致評估難度大的問題，目前尚未提出有效的解決方案。

本發明實施例提供了一種履歷評估方法和裝置，以至少解決現有技術中對應聘者進行評估通過對應聘者的行為、社交資料進行全面分析來評價應聘者，而應聘者的行為、社交資料複雜多變且獲取難度高，從而導致評價的評估難度大的技術問題。

根據本發明實施例的一個態樣，提供了一種履歷評估方法，包括：獲取歷史招聘資料集合，其中，歷史招聘資料集合至少包括：履歷文本資料；從歷史招聘資料集合中抽取資料，其中，資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，招聘結果至少包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數；通過訓練抽取到的資料構建履歷評估模型。

根據本發明實施例的一個態樣，還提供了一種履歷評估方法，包括：輸入待評估履歷；獲取待評估履歷的履歷評估結果，其中，履歷評估結果是根據履歷評估模型做出的，履歷評估模型是根據從歷史招聘資料集合中抽取資料建立的。

根據本發明實施例的另一態樣，還提供了一種履歷評估裝置，包括：獲取模組，用於獲取歷史招聘資料集合，其中，歷史招聘資料集合至少包括：履歷文本資料；抽取模組，用於從歷史招聘資料集合中抽取資料，其中，資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，招聘結果至少包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數；構建模組，用於通過訓練抽取到的資料構建履歷評估模型；評估模組，用於使用履歷評估模型對接收到的履歷進行履歷評估。

根據本發明實施例的一個態樣，還提供了一種履歷評估裝置，包括：第一輸入模組，用於輸入待評估履歷；獲取模組，用於獲取待評估履歷的履歷評估結果，其中，履歷評估結果是根據履歷評估模型做出的，履歷評估模型是根據從歷史招聘資料集合中抽取資料建立的。

容易注意到的是，採用在歷史招聘資料集合中抽取的資料進行履歷評估模型的建立，用於構建對某一職位的先驗認知，使得對應聘者的分析能够著眼於對應聘者綜合實力與職位的匹配程度的挖掘，即，為不同公司的不同職位尋找到合適的履歷，這樣能够免去對每個應聘者的行為、社交資料進行分析，減少招聘的複雜程度，從而免去了搜集應聘者在各個社交平台上行為資料的繁瑣工作，從而進一步的減少在招聘過程中付出的代價，效果和代價比方面具有更好的表現。

由此，本發明提供的上述方案解決了現有技術中對應聘者進行評估通過對應聘者的行為、社交資料進行全面分析來評價應聘者，而應聘者的行為、社交資料複雜多變且獲取難度高，從而導致評價的評估難度大的技術問題。

10‧‧‧電腦終端

102‧‧‧處理器

104‧‧‧記憶體

106‧‧‧傳輸裝置

60‧‧‧獲取模組

62‧‧‧抽取模組

64‧‧‧構建模組

66‧‧‧評估模組

70‧‧‧清洗模組

72‧‧‧第一抽取子模組

80‧‧‧分類模組

82‧‧‧生成模組

84‧‧‧確認模組

90‧‧‧第二抽取子模組

92‧‧‧整理模組

100‧‧‧檢驗模組

102‧‧‧確認子模組

112‧‧‧歸一化模組

120‧‧‧第一子歸一化模組

122‧‧‧第二子歸一化模組

124‧‧‧第三子歸一化模組

126‧‧‧第四子歸一化模組

130‧‧‧第一輸入模組

132‧‧‧獲取模組

140‧‧‧第二輸入模組

150‧‧‧顯示模組

1601‧‧‧處理器

1603‧‧‧記憶體

1605‧‧‧傳輸裝置

此處所說明的附圖用來提供對本發明的進一步理解，構成本申請的一部分，本發明的示意性實施例及其說明用於解釋本發明，並不構成對本發明的不當限定。在附圖中：圖1是根據本發明實施例1的一種履歷評估方法的電腦終端的硬體結構框圖；圖2是根據本發明實施例1的一種可選的履歷評估方法的流程圖；圖3是根據本發明實施例1的一種可選的履歷評估方法的流程圖；圖4是根據本發明實施例2的履歷評估方法的流程圖；圖5是根據本發明實施例2的一種可選的履歷評估方法的示意圖；圖6是根據本發明實施例3的一種可選的履歷評估裝置的結構示意圖；圖7是根據本發明實施例3的一種可選的履歷評估裝置的結構示意圖；圖8是根據本發明實施例3的一種可選的履歷評估裝置的結構示意圖；圖9是根據本發明實施例3的一種可選的履歷評估裝置的結構示意圖；圖10是根據本發明實施例3的一種可選的履歷評估裝置的結構示意圖；圖11是根據本發明實施例3的一種可選的履歷評估裝置的結構示意圖；圖12是根據本發明實施例3的一種可選的履歷評估裝置的結構示意圖；圖13是根據本發明實施例4的一種履歷評估裝置的結構示意圖；圖14是根據本發明實施例4的一種可選的履歷評估裝置的結構示意圖；圖15是根據本發明實施例4的一種可選的履歷評估裝置的結構示意圖；以及圖16是根據本發明實施例的一種電腦終端的結構框圖。

為了使本技術領域的人員更好地理解本發明方案，下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分的實施例，而不是全部的實施例。基於本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都應當屬本發明保護的範圍。

需要說明的是，本發明的說明書和申請專利範圍及上述附圖中的術語“第一”、“第二”等是用於區別類似的對象，而不必用於描述特定的順序或先後次序。應該理解這樣使用的資料在適當情況下可以互換，以便這裡描述的本發明的實施例能够以除了在這裡圖示或描述的那些以外的順序實施。此外，術語“包括”和“具有”以及他們的任何變形，意圖在於覆蓋不排他的包含，例如，包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限於清楚地列出的那些步驟或單元，而是可包括沒有清楚地列出的或對於這些過程、方法、產品或設備固有的其它步驟或單元。

以下的實施例可以應用到可以應用到普通的終端中，例如電腦。當然以下的實施例也可以應用到伺服器當中，伺服器也可以理解為由一個或多個電腦組成的設備。因此，下面所示出的電腦的結構也適用於伺服器。當移動終端計算能力逐步增強，以下實施例也可以在移動終端中實施。當然，下述實施例中的步驟或者模組可以在分別在不同的伺服器或者終端或者移動終端中進行，這些伺服器或者終端或者移動終端之間進行必要的資料交互即可。

實施例1

根據本發明實施例，還提供了一種履歷評估方法的實施例，需要說明的是，在附圖的流程圖示出的步驟可以在諸如一組電腦可執行指令的電腦系統中執行，並且，雖然在流程圖中示出了邏輯順序，但是在某些情況下，可以以不同於此處的順序執行所示出或描述的步驟。

本申請實施例1所提供的方法實施例可以在移動終端、電腦終端或者類似的運算裝置中執行。以運行在電腦終端上為例，圖1是本發明實施例1的一種履歷評估方法的電腦終端的硬體結構框圖。如圖1所示，電腦終端10可以包括一個或多個(圖中僅示出一個)處理器102(處理器102可以包括但不限於微處理器MCU或可編程邏輯裝置FPGA等的處理裝置)、用於儲存資料的記憶體104、以及用於通信功能的傳輸裝置106。本領域普通技術人員可以理解，圖1所示的結構僅為示意，其並不對上述電子裝置的結構造成限定。例如，電腦終端10還可包括比圖1中所示更多或者更少的組件，或者具有與圖1所示不同的配置。

記憶體104可用於儲存應用軟體的軟體程式以及模組，如本發明實施例中的履歷評估方法對應的程式指令/模組，處理器102通過運行儲存在記憶體104內的軟體程式以及模組，從而執行各種功能應用以及資料處理，即實現上述的應用程式的漏洞檢測方法。記憶體104可包括高速隨機記憶體，還可包括非易失性記憶體，如一個或者多個磁性儲存裝置、快閃記憶體、或者其他非易失性固態記憶體。在一些實例中，記憶體104可進一步包括相對於處理器102遠程設置的記憶體，這些遠程記憶體可以通過網路連接至電腦終端10。上述網路的實例包括但不限於互聯網、企業內部網、局域網、移動通信網及其組合。

傳輸裝置106用於經由一個網路接收或者發送資料。上述的網路具體實例可包括電腦終端10的通信供應商提供的無線網路。在一個實例中，傳輸裝置106包括一個網路適配器(Network Interface Controller，NIC)，其可通過基地台與其他網路設備相連從而可與互聯網進行通訊。在一個實例中，傳輸裝置106可以為射頻(Radio Frequency，RF)模組，其用於通過無線方式與互聯網進行通訊。

在上述運行環境下，本申請提供了如圖2所示的履歷評估方法。圖2是根據本發明實施例1的履歷評估方法的流程圖。

需要說明的是，對於前述的各方法實施例，為了簡單描述，故將其都表述為一系列的動作組合，但是本領域技術人員應該知悉，本發明並不受所描述的動作順序的限制，因為依據本發明，某些步驟可以採用其他順序或者同時進行。其次，本領域技術人員也應該知悉，說明書中所描述的實施例均屬較佳實施例，所涉及的動作和模組並不一定是本發明所必須的。

通過以上的實施方式的描述，本領域的技術人員可以清楚地瞭解到根據上述實施例的方法可借助軟體加必需的通用硬體平台的方式來實現，當然也可以通過硬體，但很多情況下前者是更佳的實施方式。基於這樣的理解，本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來，該電腦軟體產品儲存在一個儲存媒體(如ROM/RAM、磁碟、光碟)中，包括若干指令用以使得一台終端設備(可以是手機，電腦，伺服器，或者網路設備等)執行本發明各個實施例所述的方法。

在本實施例中以下步驟中使用了資料集合，一個或多個資料被進行相同或類似的處理，或者作為某個動作或者步驟的依據均可以認為是一個資料集合。

步驟S21，獲取歷史招聘資料集合，其中，該歷史招聘資料集合至少包括：履歷文本資料。

在上述步驟中，作為可選的實施方式，歷史招聘資料集合的來源可以是目標招聘方的歷史招聘資料集合，例如：目標招聘方在預設時間內(如上一個招聘季)參加招聘的人員的資訊，以及參加招聘並獲取該目標招聘單位職位的人員的資訊。獲取歷史招聘資料集合的方法可以是通過網站自身的資料庫來獲取歷史招聘資料集合。

在一種可選的實施例中，通過資料庫獲取目標招聘方的近五年的歷史招聘資料作為該資料集合，由於招聘方的招聘準則會隨著時間的變化而變化，例如，招聘方對學歷的要求可能升高，或對應聘者的工作經驗更加重視，因此，獲取近兩年的全部歷史招聘資料作為資料集合以及前五年至前三年的部分招聘資料作為資料集合。

步驟S23，從歷史招聘資料集合中抽取資料，其中，抽取的該資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數；作為一個可選的實施方式，招聘結果可以包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數。當然，招聘結果頁可以包括除這兩部分內容之外的其他內容，然後有利於人員招聘的資訊都可以統計在招聘結果中。

在上述步驟中，上述用於表徵應聘者特徵的參數的屬性可以是應聘者的學歷、專業、工作經驗等參數。

步驟S25，通過訓練抽取到的資料構建履歷評估模型。

在一種可選的實施例中，可以採用GDBT演算法對抽取到的資料進行訓練，得到構建履歷評估模型，在採用GDBT演算法對抽取到的資料進行訓練時，可以首先採用上述步驟抽取的歷史招聘資料集合構建一個或多個維度上的決策樹，最終模型的輸出結果為多個決策樹得到的結果的累積值。

此處需要說明的是，對抽取到的資料進行訓練的演算法可以是上述GDBT演算法，但不限於此。對抽取到的資料進行訓練的目的在於使構建的履歷評估模型學習抽取到的資料，從而使當履歷評估模型再次接收到相同或相似的資料時能够得到同樣或相近的輸出結果，因此訓練需要大量的資料，以使在使用履歷評估模型對履歷進行評估時，應聘者的履歷能够落在用於訓練的資料之中，也就是說，對於用於訓練的資料的資料量本申請不做具體限定，但在一種較佳的情況下，抽取到的用於訓練的資料量越大、資料的覆蓋範圍越廣，構建的履歷評估模型準確程度越高。

步驟S27，可選的，本申請上述實施例提供的履歷評估方法還可以包括如下步驟：使用履歷評估模型對接收到的履歷進行履歷評估。

在一種可選的實施例中，將接收到的履歷輸入至構建的履歷模型中，得到模型的輸出結果。在另一個可選的實施例中，可以將模型的輸出結果與應聘者預期的職位進行匹配，如果匹配成功則進行提示。提示的方式也有很多種，例如，可以將應聘者的名字使用的不同的顏色來標識不同的匹配度。

此處需要說明的是，由於步驟S23中抽取的資料包括一個或多個屬性在職位上對應的招聘結果，而一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，因此可以知曉，在步驟S27中當對抽取的資料進行訓練從而構建履歷評估模型時，並未使用招聘者的行為、社交資料，從而避免了行為、社交資料複雜多變且獲取難度高影響履歷評估效率的情況發生。還需要說明的是，本申請實施例上述方案在使用了履歷中的資料，這些資料是容易獲取到的，並且還使用了應聘者的參數(屬性)與招聘結果的對應關係，鑒於履歷中的資料真實度比較高，因此，不僅不會因為不使用行為、社交資料而引起評估的準確率低，還會由於使用了歷史招聘結果中應聘者參數與招聘結果的關係提高履歷評估的準確度。

容易注意到的是，通過上述步驟S21至步驟S27，採用在歷史招聘資料集合中抽取的資料進行履歷評估模型的建立，用於構建對某一職位的先驗認知，使得對應聘者的分析能够著眼於對應聘者綜合實力與職位的匹配程度的挖掘，即，為不同公司的不同職位尋找到合適的履歷，這樣能够免去對每個應聘者的行為、社交資料進行分析，減少招聘的複雜程度，從而免去了搜集應聘者在各個社交平台上行為資料的繁瑣工作，從而進一步的減少在招聘過程中付出的代價，效果和代價比方面具有更好的表現。

由此，本發明上述實施例提供的方案解決了現有技術中對應聘者進行評估通過對應聘者的行為、社交資料進行全面分析來評價應聘者，而應聘者的行為、社交資料複雜多變且獲取難度高，從而導致評價的評估難度大的技術問題。

根據本申請上述實施例，步驟S23中從歷史招聘資料集合中抽取資料，抽取資料時可以從全部的歷史招聘資料集合中進行抽取，但是，作為一個可選的實施例，可以首先對資料進行過濾或者清洗，去除掉認為有可能產生影響的資料。例如，上述步驟S23可以包括如下步驟：

步驟S231，對歷史招聘資料集合進行清洗，其中，該資料清洗主要用來將評估不通過的履歷從歷史招聘資料集合之中屏蔽。

在上述步驟中，對歷史招聘資料集合進行清洗的目的在於發現並清除歷史招聘資料集合中包括的噪音資料。

步驟S233，從清洗後的歷史招聘資料集合中抽取資料。

通過上述兩個步驟，可以使抽取的資料更加準確，使建立的履歷評估模型更加符合要求。

對於評估不通過的履歷可能有很多類型，例如，評估不通過的履歷包括以下至少之一：由於人員編制head count導致評估不通過的履歷、沒有進行履歷評估而直接進行面試並且面試未通過的履歷、履歷重複投遞導致評估不通過的履歷。

在上述步驟中，head count可以用於表徵招聘方的人力資源在某一職位上針對該職位當前的需求、未來發展的需求以及企業整體規劃，對這一職位預定的員工數量，和/或招聘人員數量。

在一種可選的實施例中，應聘者甲符合招聘方的招聘條件，但由於人力資源部門對於應聘者甲所應聘的職位具有預先的人員數量規劃，如果聘用應聘者甲，可能會引起員工冗餘的現象，因此並不聘用應聘者甲，應聘者甲的履歷即為由於編制head count導致評估不通過的履歷。

在另一種可選的實施例中，由於任意原因應聘者乙的履歷並未經過評估，而直接參與了招聘方在某一職位上的面試，但面試並未通過，則應聘者乙的履歷也被認為是評估不通過的履歷。

在又一種可選的實施例中，應聘者丙反覆向應聘方的某一職位重複使用不同的方式投遞自己的履歷，例如，通過不同的招聘網站向同一招聘方的同一職位多次重複投遞個人履歷，應聘者的履歷也被認為是不通過評估的履歷。

當然也可以根據招聘單位的實際需要來設置哪些類型的建立是評估不通過的履歷。

根據本申請上述實施例，步驟S25中是通過訓練抽取到的資料構建履歷評估模型。在該步驟中可以將所有的抽取到的資料均應用到建立履歷評估模型上，該履歷評估模型的檢驗可以使用真實接收到的履歷來進行檢驗。這種處理方法需要使用真實應聘者的履歷來進行檢驗，有可能將合適的應聘者錯誤的篩除。作為另一種可選的實施方式，可以將抽取的資料分為兩部分，一部分用來進行生成履歷評估模型，一部分用來對生成的履歷評估模型進行測試，在這種實施例中，步驟S25可以包括如下步驟：

步驟S251，將抽取到的資料分為訓練樣本資料和測試樣本資料。

在上述步驟中，上述訓練樣本資料包括多個資料，用於通過訓練構建履歷評估模型，測試樣本資料同樣包含多個資料，用於驗證上述履歷評估模型是否準確。

在一種可選的實施例中，訓練樣本資料和測試樣本資料可以是歷史招聘資料集合中的多個維度上的資料。

此處需要說明的是，為了確保履歷評估模型的準確性，抽取的資料中被分為訓練樣本資料的資料是在任意維度上均是多樣化的，以確保任意維度上的多種資料都能經過訓練，使得履歷評估模型能够學習任意維度上的多種資料。

此處還需要說明的是，由於訓練樣本資料用於構成履歷評估模型，測試樣本資料用於檢驗履歷評估模型的準確程度，因此，訓練樣本資料和測試樣本資料均為已經知曉招聘結果的歷史招聘資料集合。

步驟S253，使用訓練樣本資料進行訓練生成待檢驗的履歷評估模型。下面以一個可選的實施例進行說明。

在該可選的實施例中，假定預先需要招聘的是資料庫維護崗位，已經應聘成功的該職位的人員有6名，先使用這6名人員的履歷用於訓練：人員1：A學校、A專業、B公司、B職位；人員2：B學校、A專業、C公司、B職位；人員3：A學校、B專業、A公司、A職位；人員4：C學校、B專業、B公司、A職位；人員5：A學校、A專業、C公司、B職位；人員6：C學校、B專業、C公司、A職位。

由此可以獲得資料維護崗位人員的特徵：學校：A學校在6個資料中出現過3次，占比為0.5；B學校在6個資料中出現過1次，占比為0.17；C學校出現過兩次，占比為0.33；其他學校沒有出現過，占比為0。

專業：A專業出現過3次，占比為0.5；B專業出現過3次，占比為0.5；其他專業沒有出現過，占比為0。

公司：A公司出現過1次，占比為0.17；B公司出現過2次，占比為0.33；C公司出現過3次，占比為0.5；其他公司沒有出現過，占比為0。

職位：A職位出現過3次，占比為0.5；B職位出現過3次，占比為0.5；其他職位占比為0。

在已經應聘成功的該職位的6名人員的履歷中，出現過3個不同的學校，3個不同的公司，而僅僅出現過2個不同的專業和職位，因此，從履歷篩選的角度來講，專業和職位比學校和公司更重要，其重要程度為學校和公司的1.5倍。因此，在進行訓練的過程中學校、公司、專業、職位的權重分別為：0.2、0.2、0.3、0.3。

通過上述數值來計算人員的得分：人員1：A學校、A專業、B公司、B職位；可以計算得到人員1在各個屬性上得分分別為0.5*0.2、0.3*0.5、0.2*0.33、0.3*0.5，即為0.1、0.15、0.066和0.15；人員2：B學校、A專業、C公司、B職位；可以計算得到人員2在各個屬性上得分分別為0.2*0.17、0.3*0.5、0.2*0.5和0.3*0.5，即為0.034、0.15、0.1和0.15；人員3：A學校、B專業、A公司、A職位；可以計算得到人員3在各個屬性上得分分別為0.2*0.5、0.3*0.5、0.2*0.17和0.3*0.5，即為0.1、0.15、0.034和0.15；人員4：C學校、B專業、B公司、A職位；可以計算得到人員4在各個屬性上得分分別為 0.2*0.33、0.3*0.5、0.2*0.33和0.3*0.5，即為0.066、0.15、0.066和0.15；人員5：A學校、A專業、C公司、B職位

可以計算得到人員5在各個屬性上得分分別為0.2*0.5、0.3*0.5、0.2*0.5和0.3*0.5，即為0.1、0.15、0.1和0.15；人員6：C學校、B專業、C公司、A職位

可以計算得到人員6在各個屬性上得分分別為0.2*0.33、0.3*0.5、0.2*0.5和0.3*0.5，即為0.066、0.15、0.1和0.15。

這樣就可以得到6個向量，如果使用比較簡單的演算法，可以對每個人員求和(當然，也可以採用其他的方式來進行向量計算)，人員1得分0.466，人員2得分0.434，人員3得分0.434，人員4得分0.433，人員5得分0.5，人員6得分0.466。這其中得分範圍為[0.433，0.5]，如果低於0.433則認為這個履歷是不符合這個職位的。

此處需要說明的是，上述實施例僅以說明為目的，訓練資料只有6個，當訓練資料更為廣泛的，得分的區間範圍將更加合理。

上述僅僅是一個職位的得分，還可以使用同樣的方式得出多個職位的得分，或多個公司中多個不同職位的得分，然後，將求職履歷中的多個屬性進行計算，落入了哪個職位的範圍，則可以認為該人員符合該職位的要求。

此處需要說明的是，上述實施例提供的方法可用於對訓練樣本資料進行訓練得到履歷評估模型，但得到履歷評估模型的方法並不僅限於此，任何能够通過訓練樣本資料獲得履歷評估模型的演算法都能够應用於上述步驟，例如，GBDT演算法等。

步驟S255，使用測試樣本資料對待檢驗的履歷評估模型進行檢驗，在檢驗通過的情況下確認待檢驗的履歷評估模型為準確的履歷評估模型。

在得到待檢驗的履歷評估模型後，由於訓練樣本資料的取值並不一定全面，或訓練樣本資料中存在噪聲資料等原因的影響，使得待檢驗的履歷評估模型的準確度並不一定較高，因此，需要通過向待檢驗的招聘資料模型輸入測試樣本資料來驗證待檢驗的履歷評估模型是否準確。

此處還需要說明的是，訓練樣本資料中包含的資料量的多少與履歷評估模型的準確程度成正比。

通過上述步驟，可以使用已有的資料來對生成的履歷評估模型進行驗證，從而避免了使用真實招聘資料進行驗證而導致的可能錯誤篩除履歷的問題。

為了便於進行計算，對於上述的資料可以進行向量化處理。即，根據本申請上述實施例，生成待檢驗的履歷評估模型的訓練樣本資料可以是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料；和/或，檢測待檢驗的履歷評估模型的測試樣本資料可以是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料。

在對訓練樣本資料和/或測試樣本資料進行向量抽取可以是對訓練樣本資料和/或測試樣本資料在一個或者多個維度上的資料進行提取。在對訓練樣本資料和/或測試樣本資料進行向量抽取後進行特徵整理可以是將訓練樣本資料和/或測試樣本資料中形式、格式、顯示方式等不同但表徵的意義相同的資料進行統一處理。上述步驟的目的在於統一資料形式，解決了由於資料多樣化導致的同一資料具有多種形式，不易通過演算法進行訓練的技術問題。

根據本申請上述實施例，上述步驟S255中使用了測試樣本資料對待檢驗的履歷評估模型進行檢驗，並確認待檢驗的履歷評估模型為準確的履歷評估模型。確認是否為準確的履歷評估模型的方式有多種，例如，可以將認為實際結果與履歷評估模型輸出的結果完全一致，才認為準確的模型。作為另一個可選的實施例，步驟S255可以包括：

步驟S2551，將測試樣本資料輸入至待檢驗的履歷評估模型中進行檢驗，並輸出檢驗結果。

步驟S2553，如果檢驗結果與測試樣本資料對應的招聘結果誤差在預定範圍內，則確認待檢驗的履歷評估模型為準確的履歷評估模型。

在上述步驟中，允許存在一定的誤差，這種誤差的存在可能是由於抽取資料的數量不足够導致的，但是該誤差的存在並不影響對招聘結果的判斷，也在可以接受的範圍之內。

在一種可選的實施例中，將測試樣本資料中的多個資料分別輸入至待檢驗的履歷評估模型中，仍以上述招聘的崗位是資料庫維護崗位為例，測試樣本資料中的3名已經知曉應聘結果的成員進行測試：測試人員1：A學校、C專業、C公司、B職位、未被錄取；測試人員2：D學校、A專業、B公司、A職位、未被錄取；測試人員3：B學校、A專業、A公司、A職位、成功錄取。

採用上述實施例中得到的學校、公司、專業、職位的權重：0.2、0.2、0.3、0.3，計算測試樣本資料的測試結果：測試人員1：A學校、C專業、C公司、B職位；可以計算得到測試人員1在各個屬性上得分分別為0.5*0.2、0.3*0、0.2*0.5、0.3*0.5，即為0.1、0、0.1和0.15。

測試人員2：D學校、A專業、B公司、A職位；可以計算得到測試人員2在各個屬性上得分分別為0*0.2、0.3*0.5、0.2*0.33、0.3*0.5，即為0、0.15、0.066和0.15。

測試人員3：B學校、A專業、D公司、A職位；可以計算得到測試人員3在各個屬性上得分分別為0.2*0.17、0.3*0.5、0.2*0、0.3*0.5，即為0.034、0.15、0 和0.15。

對上述3個測試樣本資料在不同維度上的得分進行計算，得到測試人員1的得分為0.35，測試人員2的得分為0.366，測試人員3的得分為0.434，僅有測試人員3落入符合該職位的評分取值範圍內，因此，由上述履歷評估模型得到的結果為測試人員1未被錄取，測試人員2未被錄取，測試人員3被錄取，與實際結果相同，因此可以認為上述履歷評估模型具有較高的準確度。

此處需要說明的是，當測試結果與測試樣本資料的結果不相同時，將該測試樣本資料作為訓練樣本資料，對履歷評估模型進行訓練，直至能够得到與測試樣本資料的結果相同的測試結果。

根據本申請上述實施例，進行向量抽取包括：步驟S2555，對應聘者的一個或多個屬性進行向量抽取，其中，一個或多個屬性包括以下至少之一：公司名稱、職位名稱、學校名稱、專業名稱；對向量抽取後的資料進行特徵整理包括：步驟S2557，對一個或多個屬性進行歸一化處理。

歸一化的處理方式有很多種，在一個可選的實施例中根據公司名稱、職位名稱、學校名稱、專業名稱的性質的不同，提供了幾個不同的歸一化方式，這幾種歸一化方式可以分別單獨使用，也可以結合使用。歸一化的方式並不限於此，其他的歸一化方式也可以取得相同的效果。

公司名稱歸一化處理

對公司名稱進行歸一化處理包括：構建行業詞表和地名詞表；按照行業詞表和地名詞表中的行業名詞和地名名詞提取公司名稱，得到公司名稱的歸一化結果。

在一種可選的實施例中，由於公司名稱大致是由公司地點、公司名、公司行業、通用詞四部分組成，例如：淘寶(中國)軟件有限公司，在此基礎上，構建了行業詞表和地名詞表對公司的名稱進行提取。

在另一種可選的實施例中，在公司名稱由地名和行業詞構成的情況下，例如：中國建築工程那總公司等。對於上述沒有明顯公司名提取的公司，提取地名和公司行業以對公司名稱進行歸一化。

在又一種可選的實施例中，還需要構建公司英文名稱和公司中文名稱的映射詞表，以及子公司與子公司所屬的母公司的映射詞表，在出現英文名稱的公司的情況下，從公司英文名稱和公司中文名稱的映射詞表中查找與上述英文名稱對應的中文名稱，得到公司名稱的歸一化結果，例如，將公司名稱為alibab的公司名稱歸一化為阿里巴巴；在公司名稱為子公司的公司名稱的情況下，在子公司與子公司所屬的母公司的映射詞表中查找上述子公司所屬的母公司，以得到公司名稱歸一化的結果，例如，將公司名稱為淘寶的公司名稱歸一化為阿里巴巴。

職位名稱進行歸一化處理

對職位名稱進行歸一化處理包括：確認在歷史招聘資料集合中，出現次數大於預設次數的職位描述為正確的職位名稱；通過編輯距離構建履歷文本資料中的職位描述與正確的職位名稱之間的映射詞表；通過正則表達式對履歷文本資料中的職位描述在映射詞表中進行匹配，得到職位名稱的歸一化結果。

在一種可選的實施例中，在上述預設次數可以為2000次的示例中，將出現次數大於2000次的職位描述確認為準確的職位描述，例如，在應聘軟體開發工程師這一職務的履歷中，將該職務描述為軟體開發工程師的次數大於2000，而將該職務描述成為軟體設計工程師、軟體工程師等為同一職務但出現次數並未超過2000次，則確認該職務準確的名稱為軟體開發工程師，並將所有職務名稱為軟體設計工程師、軟體工程師的職務的名稱歸一化為軟體開發工程師，如果軟體開發工程師和軟體設計工程師這兩個職務名稱均超過2000，在確認軟體開發工程師和軟體設計工程師為同一職務的情況下，確認出現次數最多的名稱為該職務的名稱。

在另一種可選的實施例中，將所有職務名稱為軟體設計工程師、軟體工程師的職務的名稱歸一化為軟體開發工程師，首先通過編輯距離構建履歷文本資料中，軟體設計工程師、軟體工程師等其他表徵軟體開發工程師這一職務的名稱與軟體開發工程師之間的映射詞表，即，將所有用於表徵軟體開發工程師這一職務的名稱均映射到軟體開發工程師這一職務上；通過正則表達式對履歷文本資料中的職位描述在映射詞表中進行匹配，從而得到歸一化的結果。

學校名稱進行歸一化處理

對學校名稱進行歸一化處理包括：將履歷文本資料中的學校名稱根據出現的次數按照由大至小的順序排列，並獲取預設排名的學校名稱，得到基礎詞典；對學校名稱進行去噪處理，並通過正則匹配將去噪得到的學校名稱與基礎字典中的學校名稱進行匹配，以得到歸一化後的學校名稱；使用同義詞表，根據預設規則構造學校名稱對應的簡寫，將出現學校名稱對應的簡寫的名稱記錄為學校名稱；將學校名稱中包含預設第一後綴詞語的學校名稱歸一化為相應的第一後綴詞語，其中，預設的第一後綴詞語至少包括：職業技術學院、網路學院、成教、自考和專升本；去掉學校名稱中包含的第二後綴詞語，以生成歸一化後的學校名稱，其中，第二後綴詞語用於表徵學校的分支機構；去掉學校名稱中的前綴，以生成歸一化後的學校名稱。

在一種可選的實施例中，將履歷文本資料中出現的所有學校名稱按照出現的次數由高至低排列，並獲取出現次數排名在前1000名的學校名稱構成基礎詞典，在構成基礎詞典的基礎上，對學校名稱進行去噪處理，在對學校名稱進行去噪處理後，在基礎詞典中與學校名稱進行匹配，以得到學校名稱的歸一化結果。

在另一種可選的實施例中，對學校名稱進行去噪處理是通過正則匹配，棄掉學校名稱中的造成資料，例如，將卡爾斯魯爾大學(德國)處理為卡爾斯魯爾大學；將厦門海洋學院(招統否是y招統否是)處理為厦門海洋學院，以消除噪音對學校名稱進行歸一化處理時的影響。

在又一種可選的實施例中，將學校名稱中包含預設第一後綴詞語的學校名稱歸一化為相應的第一後綴詞語，例如，將厦門市興才職業技術學院歸一化為職業技術學院；去掉學校名稱中包含的用於表徵學校的分支機構的第二後綴詞語，例如，將江蘇科技大學經濟管理學院歸一化為江蘇科技大學；去掉學校名稱中的前綴，例如，將江蘇省南京大學金陵學院歸一化為南京大學金陵學院。

此處需要說明的是，還可以建立世界名校的名稱表。如果存在任意學校名稱出現頻率很低，則首先需要確認該學校名稱是否為世界名校，確認的方法可以是在世界名校的名稱表中查找該學校名稱。

專業名稱進行歸一化處理

對專業名稱進行歸一化處理包括：構建專業分類表，並通過專業分類表進行貝葉斯模型訓練；根據訓練後的貝葉斯模型對履歷文本資料中的專業進行分類。

此處需要說明的是，上述實施例中的對應聘者的履歷文本資料的JD文本與履歷文本的匹配，可以基於tfidf和word2vec演算法或基於這兩個演算法演進的方法對文本的相似性進行量化。

圖3示出了在一種應用場景的應用步驟，圖3是根據本發明實施例1的一種可選的履歷評估方法的流程圖。如圖3所示，下面對本申請上述實施例的一種應用場景下的示例進行詳細描述如下：

S31：導入歷史招聘資料集合。

獲取一個或多個招聘方的歷史招聘資料集合，上述歷史資料至少包括履歷文本資料。

S32：對歷史招聘資料集合進行資料清洗。

在上述步驟中，對歷史招聘資料集合進行資料清洗可以是從歷史招聘資料集合中屏蔽評估不通過的履歷，其中，評估不通過的履歷可以是由於人員編制head count導致評估不通過的履歷、沒有進行履歷評估而直接進行面試並且面試未通過的履歷、履歷重複投遞導致評估不通過的履歷。

S33：將歷史招聘資料集合分成訓練樣本資料和測試樣本資料。

S34：對訓練樣本資料進行向量抽取。

在上述步驟中，對訓練樣本資料進行向量抽取可以是抽取訓練樣本資料中的應聘者的一個或多個屬性，一個或多個屬性包括如下之一：公司名稱、職位名稱、學校名稱、專業名稱。

S35：對抽取的向量進行特徵整理。

在上述步驟中，對抽取的向量進行特徵整可以是對應聘者的一個或多個屬性進行歸一化處理。

S36：對訓練樣本資料進行模型訓練。

在上述步驟中，可以採用GDBT演算法對訓練樣本資料進行訓練，得到待檢驗的履歷評估模型，但得到履歷評估模型的訓練演算法不限於此。

S37：對測試樣本資料進行特徵整理。

S38：通過對訓練樣本資料進行模型訓練得到待驗證履歷評估模型。

S39：輸出測試結果。

將測試樣本資料輸入至待檢驗履歷評估模型，如果輸出的結果與測試樣本資料的招聘結果相同，則可以認為待檢驗的履歷評估模型為準確的履歷評估模型。

實施例2

本申請實施例還提供了如圖4所示的履歷評估方法。圖4是根據本發明實施例2的履歷評估方法的流程圖。

步驟S41，輸入待評估履歷。

在上述步驟中，上述預設的履歷評估模型可以是本申請實施例1中的任意一個履歷評估模型。

步驟S43，獲取待評估履歷的履歷評估結果，其中，履歷評估結果是根據履歷評估模型做出的，履歷評估模型是根據從歷史招聘資料集合中抽取資料建立的。

此處需要說明的是，本申請上述實施例中出現的預設的履歷評估模型可以是實施例1中的任意一個履歷評估模型，也可以是除實施例1以外的其他履歷評估模型，任意使用歷史招聘資料而非社交資料得到的履歷評估模型均能應用於本實施例。

容易注意到的是，採用在歷史招聘資料集合中抽取的資料進行履歷評估模型的建立，用於構建對某一職位的先驗認知，使得對應聘者的分析能够著眼於對應聘者綜合實力與職位的匹配程度的挖掘，即，為不同公司的不同職位尋找到合適的履歷，這樣能够免去對每個應聘者的行為、社交資料進行分析，減少招聘的複雜程度，從而免去了搜集應聘者在各個社交平台上行為資料的繁瑣工作，從而進一步的減少在招聘過程中付出的代價，效果和代價比方面具有更好的表現。因此，採用上述履歷評估模型進行履歷評估，能够方案解決現有技術中對應聘者進行評估通過對應聘者的行為、社交資料進行全面分析來評價應聘者，而應聘者的行為、社交資料複雜多變且獲取難度高，從而導致評價的評估難度大的技術問題。

在本申請上述實施例中，步驟S43，上述方法還包括：步驟S45，輸入歷史招聘資料集合，其中，歷史招聘集合中的資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，招聘結果至少包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數。

在本申請上述實施例中，步驟S43，在獲取待評估履歷的履歷評估結果之後，上述方法還包括：步驟S451，在預設區域顯示待評估對象的履歷評估結果。

在本申請上述步驟中，在得到履歷評估結果後，可以根據預設的顯示內容顯示建立評估結果。

在一種可選的實施例中，以履歷評估模型為實施例1中提出的履歷評估模型為示例，在用戶向預設的履歷評估系統(其中，該履歷評估系統使用預設的履歷評估模型)輸入自身履歷，或者按著履歷評估系統提供的表格填寫自身履歷後，履歷評估系統使用履歷評估模型對用戶的履歷進行評估後，得到上述用戶的評估結果，並將用戶的履歷評估結果顯示於用戶所示用的顯示終端上，同時，通過對用戶履歷的評估，履歷評估系統還能够得到用戶所適合的職位，因此履歷評估系統在顯示用戶的履歷評估結果的同時，還可以顯示為用戶推薦的適合職位。

在另一種可選的實施例中，仍以履歷評估模型為實施例1中提出的履歷評估模型為示例，在人力管理人員向預設的履歷評估系統輸入一份或多份求職者的履歷後，履歷評價系統對求職者的履歷依次或按預設順序進行評估，得到評估結果並顯示與人力管理人員的顯示終端上，例如，可以將符合職位、不符合職位的求職者名單按照不同的顏色或位置顯示，人力管理人員也可以通過點擊求職者的姓名或其他操作對求職者的具體履歷進行查看。同時，履歷評估系統也可以在履歷資料庫中查找符合該職位的求職者為人力管理人員進行推薦。

此處需要說明的是，根據預設的顯示內容顯示履歷評估結果的顯示方式不限於上述實施例的任何一種顯示方式。

圖5是根據本申請實施例2的一種可選的履歷評估方法的示意圖，下面結合圖5所示的示例，在本申請實施例1提供的履歷評估方法的基礎上對上述實施例2提供的方法進行進一步說明。

首先，需要說明的是，該方法可以包括兩個階段，第一個階段為預備階段，即伺服器獲取歷史招聘資料，並使用學習方法對歷史招聘資料進行訓練，來得到履歷評估模型，該第一階段在歷史招聘資料不發生變動的情況下僅進行一次，或按照固定周次來更新履歷評估模型；第二個階段是工作階段，即用戶使用履歷評估模型來進行評估的階段，而這一階段的是重複性、多次發生的。

在一種可選的實施例中，用戶通過預設的履歷評估系統向伺服器輸入歷史招聘資料，伺服器接收用戶輸入的歷史招聘資料後，使用機器學習方法通過對歷史招聘資料進行訓練得到履歷評估模型，上述過程可以是本申請履歷評估方法的第一階段。在伺服器生成履歷評估模型後，用戶可以使用履歷評估模型對履歷進行評估，該過程可以是本申請履歷評估方法中的第二階段，用戶將新的待評估的履歷輸入至履歷評估模型，伺服器對新的履歷進行評估，得到新的履歷的評估結果，用戶接收伺服器評估得到的新的履歷的評估結果，並可以對新的履歷的評估結果進行顯示等操作。

此處需要說明的是，該實施例中的上述機器學習方法可以是本申請實施例1中的任意一種構建履歷評估模型的方法。

實施例3

根據本發明實施例，還提供了一種用於實施上述履歷評估方法的履歷評估裝置，如圖6所示，該裝置包括：獲取模組60、抽取模組62、構建模組64和評估模組66。

獲取模組60用於獲取歷史招聘資料集合，其中，歷史招聘資料集合至少包括：履歷文本資料。

在上述模組涉及的歷史招聘資料集合中，歷史招聘資料集合的來源可以是目標招聘方的歷史招聘資料集合，例如：目標招聘方在預設時間內(如上一個招聘季，或者上兩個招聘季)參加招聘的人員的資訊，以及參加招聘並獲取該目標招聘單位職位的人員的資訊。獲取歷史招聘資料集合的方法可以是通過網站自身的資料庫來獲取歷史招聘資料集合。

在一種可選的實施例中，通過資料庫獲取目標招聘方的近五年的歷史招聘資料集合，由於招聘方的招聘準則會隨著時間的變化而變化，例如，招聘方對學歷的要求可能升高，或對應聘者的工作經驗更加重視，因此，獲取近兩年的全部歷史招聘資料集合以及前五年至前三年的部分招聘資料。

抽取模組62用於從歷史招聘資料集合中抽取資料，其中，抽取的該資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數；作為一個可選的實施方式，招聘結果可以包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數。當然，招聘結果頁可以包括除這兩部分內容之外的其他內容，然後有利於人員招聘的資訊都可以統計在招聘結果中。

構建模組64用於通過訓練抽取到的資料構建履歷評估模型。

評估模組66用於使用履歷評估模型對接收到的履歷進行履歷評估。

此處需要說明的是，通過上述模組，採用在歷史招聘資料集合中抽取的資料進行履歷評估模型的建立，用於構建對某一職位的先驗認知，使得對應聘者的分析能够著眼於對應聘者綜合實力與職位的匹配程度的挖掘，即為不同公司的不同職位尋找到合適的履歷，這樣能够免去對每個應聘者的行為、社交資料進行分析，減少招聘的複雜程度，從而免去了搜集應聘者在各個社交平台上行為資料的繁瑣工作，從而減少在招聘過程中付出的代價，效果和代價比方面具有更好的表現。

根據本申請上述實施例，結合圖7所示，上述抽取模組62可以包括：清洗模組70，用於對歷史招聘資料集合進行清洗，其中，該資料清洗主要用來將評估不通過的履歷從歷史招聘資料集合之中屏蔽。

第一抽取子模組72，用於從清洗後的歷史招聘資料集合中抽取資料。

根據本申請上述實施例，評估不通過的履歷包括以下至少之一：由於人員編制head count導致評估不通過的履歷、沒有進行履歷評估而直接進行面試並且面試不同的履歷、履歷重複投遞導致評估不通過的履歷。對於評估不通過的履歷在實施例1中已經進行了說明，在此不再贅述。

根據本申請上述實施例，結合圖8所示，上述構建模組64是通過訓練抽取到的資料構建履歷評估模型。在該模組中可以將所有的抽取到的資料均應用到建立履歷評估模型上，該履歷評估模型的檢驗可以使用真實接收到的履歷來進行檢驗。這種處理方法需要使用真實應聘者的履歷來進行檢驗，有可能將合適的應聘者錯誤的篩除。作為另一種可選的實施方式，可以將抽取的資料分為兩部分，一部分用來進行生成履歷評估模型，一部分用來對生成的履歷評估模型進行測試，在這種實施例中上述構建模組64可以包括：分類模組80，用於將抽取到的資料分為訓練樣本資料和測試樣本資料。

生成模組82，用於使用訓練樣本資料進行訓練生成待檢驗的履歷評估模型。

具體的例子與實施例1基本相同，假定預先需要招聘的是資料庫維護崗位，已經應聘成功的該職位的人員有6名，先使用這6名人員的履歷用於訓練：人員1：A學校、A專業、B公司、B職位；人員2：B學校、A專業、C公司、B職位；人員3：A學校、B專業、A公司、A職位；人員4：C學校、B專業、B公司、A職位；人員5：A學校、A專業、C公司、B職位；人員6：C學校、B專業、C公司、A職位。

由此可以獲得資料維護崗位人員的特徵：通過上述數值來計算人員的得分：人員1：A學校、A專業、B公司、B職位；可以計算得到人員1在各個屬性上得分分別為0.5*0.2、0.3*0.5、0.2*0.33、0.3*0.5，即為0.1、0.15、0.066和0.15；人員2：B學校、A專業、C公司、B職位；可以計算得到人員2在各個屬性上得分分別為 0.2*0.17、0.3*0.5、0.2*0.5和0.3*0.5，即為0.034、0.15、0.1和0.15；人員3：A學校、B專業、A公司、A職位；可以計算得到人員3在各個屬性上得分分別為0.2*0.5、0.3*0.5、0.2*0.17和0.3*0.5，即為0.1、0.15、0.034和0.15；人員4：C學校、B專業、B公司、A職位；可以計算得到人員4在各個屬性上得分分別為0.2*0.33、0.3*0.5、0.2*0.33和0.3*0.5，即為0.066、0.15、0.066和0.15；人員5：A學校、A專業、C公司、B職位；可以計算得到人員5在各個屬性上得分分別為0.2*0.5、0.3*0.5、0.2*0.5和0.3*0.5，即為0.1、0.15、0.1和0.15；人員6：C學校、B專業、C公司、A職位；可以計算得到人員6在各個屬性上得分分別為0.2*0.33、0.3*0.5、0.2*0.5和0.3*0.5，即為0.066、0.15、0.1和0.15。

這樣就可以得到6個向量，如果使用比較簡單的演算法，可以對每個人員求和，人員1得分0.466，人員2得分0.434，人員3得分0.434，人員4得分0.433，人員5得分0.5，人員6得分0.466。這其中得分範圍為[0.433，0.5]，如果低於0.433則認為這個履歷是不符合這個職位的。

與實施例1中的例子不同的是，在這個崗位的招聘中，還可以考慮人員的年齡，如果人員的年齡在預定範圍內，則可以增加分數。例如，這個崗位是一個經驗很重要的崗位，那麽，年齡超過40歲，可以增加0.07分。

確認模組74，用於使用測試樣本資料對待檢驗的履歷評估模型進行檢驗，在檢驗通過的情況下確認待檢驗的履歷評估模型為準確的履歷評估模型。

根據本申請上述實施例，結合圖9所示，上述分類模組80包括：第二抽取子模組90，用於進行向量抽取。

整理模組92，用於對進行向量抽取後的資料進行特徵整理，以得到訓練樣本資料和/或測試樣本資料。

根據本申請上述實施例，結合圖10所示，上述確認模組84用於進行確認。確認是否為準確的履歷評估模型的方式有多種，例如，可以將認為實際結果與履歷評估模型輸出的結果完全一致，才認為準確的模型。作為另一個可選的實施例，上述確認模組84可以包括：檢驗模組100，用於將測試樣本資料輸入至待檢驗的履歷評估模型中進行檢驗，並輸出檢驗結果。

確認子模組102，如果檢驗結果與測試樣本資料對應的招聘結果誤差在預定範圍內，則確認待檢驗的履歷評估模型為準確的履歷評估模型。

測試人員3：B學校、A專業、D公司、A職位；可以計算得到測試人員3在各個屬性上得分分別為0.2*0.17、0.3*0.5、0.2*0、0.3*0.5，即為0.034、0.15、0和0.15。

作為另一個可選實施方式，在當時招聘的時候，沒有考慮年齡的問題，而此時如果考慮年齡的問題，測試人員2是可以加分的，此時測試人員2的得分為0.366+0.07=0.4336，按照這種方式，測試人員2是應該被錄取的，但是實際是沒有錄取。這種誤差是由於招聘需要發生改變而導致的，是在可接受的範圍之內的。

根據本申請上述實施例，結合圖11所示，上述第二抽取子模組90用於對應聘者的一個或多個屬性進行向量抽取，其中，一個或多個屬性包括以下至少之一：公司名稱、職位名稱、學校名稱、專業名稱；上述整理模組92包括：歸一化模組112，用於對一個或多個屬性進行歸一化處理。

根據本申請上述實施例，結合圖12所示，歸一化模組112可以包括以下至少之一：第一子歸一化模組120，用於構建行業詞表和地名詞表；按照行業詞表和地名詞表中的行業名詞和地名名詞提取公司名稱，得到公司名稱的歸一化結果，以對公司名稱進行歸一化處理。

第二子歸一化模組122，用於確認在歷史招聘資料集合中，出現次數大於預設次數的職位描述為正確的職位名稱；通過編輯距離構建履歷文本資料中的職位描述與正確的職位名稱之間的映射詞表；通過正則表達式對履歷文本資料中的職位描述在映射詞表中進行匹配，得到職位名稱的歸一化結果，以對職位名稱進行歸一化處理。

第三子歸一化模組124，用於將履歷文本資料中的學校名稱根據出現的次數按照由大至小的順序排列，並獲取預設排名的學校名稱，得到基礎詞典；對學校名稱進行去噪處理，並通過正則匹配將去噪得到的學校名稱與基礎字典中的學校名稱進行匹配，以得到歸一化後的學校名稱；使用同義詞表，根據預設規則構造學校名稱對應的簡寫，將出現學校名稱對應的簡寫的名稱記錄為學校名稱；將學校名稱中包含預設第一後綴詞語的學校名稱歸一化為相應的第一後綴詞語，其中，預設的第一後綴詞語至少包括：職業技術學院、網路學院、成教、自考和專升本；去掉學校名稱中包含的第二後綴詞語，以生成歸一化後的學校名稱，其中，第二後綴詞語用於表徵學校的分支機構；去掉學校名稱中的前綴，以生成歸一化後的學校名稱，以對學校名稱進行歸一化處理。

第四子歸一化模組126，用於構建專業分類表，並通過專業分類表進行貝葉斯模型訓練；根據訓練後的貝葉斯模型對履歷文本資料中的專業進行分類，以對專業名稱進行歸一化處理。

需要說明的是，上述歸一化的處理，在實施例1中已經進行了詳細的說明，在此不再贅述。

實施例4

根據本發明實施例，還提供了一種用於實施實施例2中的履歷評估方法的履歷評估裝置，如圖13所示，該裝置包括：第一輸入模組130和獲取模組132。

第一輸入模組130，用於輸入待評估履歷；獲取模組132，用於獲取待評估履歷的履歷評估結果，其中，履歷評估結果是根據履歷評估模型做出的，履歷評估模型是根據從歷史招聘資料集合中抽取資料建立的。

此處需要說明的是，上述第一輸入模組130獲取模組132對應於實施例2中的步驟S41至步驟S43，此模組與對應的步驟所實現的實例和應用場景相同，但不限於上述實施例一所公開的內容。需要說明的是，上述模組作為裝置的一部分可以運行在實施例一提供的電腦終端10中。

在本申請上述實施例中，結合圖14所示，上述裝置還包括：第二輸入模組140。

第二輸入模組140，用於輸入歷史招聘資料集合，其中，所述歷史招聘集合中的資料至少包括：一個或多個屬性在職位上對應的招聘結果，所述一個或多個屬性是所述履歷文本資料中用於表徵應聘者特徵的參數，所述招聘結果至少包括：所述一個或多個屬性在所述職位上的出現次數、和/或所述一個或多個屬性在所述職位上錄取次數。

此處需要說明的是，上述第二輸入模組140對應於實施例2中的步驟S45，此模組與對應的步驟所實現的實例和應用場景相同，但不限於上述實施例一所公開的內容。需要說明的是，上述模組作為裝置的一部分可以運行在實施例一提供的電腦終端10中。

在本申請上述實施例中，結合圖15所示，上述裝置還包括：顯示模組150，用於在預設區域顯示所述待評估對象的履歷評估結果。

此處需要說明的是，上述顯示模組150對應於實施例2中的步驟S451，此模組與對應的步驟所實現的實例和應用場景相同，但不限於上述實施例一所公開的內容。需要說明的是，上述模組作為裝置的一部分可以運行在實施例一提供的電腦終端10中。

實施例5

本發明的實施例可以提供一種電腦終端，該電腦終端可以是電腦終端群中的任意一個電腦終端設備。可選的，在本實施例中，上述電腦終端也可以替換為移動終端等終端設備。

可選的，在本實施例中，上述電腦終端可以位於電腦網路的多個網路設備中的至少一個網路設備。

在本實施例中，上述電腦終端可以執行履歷評估方法中以下步驟的程式代碼：獲取歷史招聘資料集合，其中，歷史招聘資料集合至少包括：履歷文本資料；從歷史招聘資料集合中抽取資料，其中，資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，招聘結果至少包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數；通過訓練抽取到的資料構建履歷評估模型；使用履歷評估模型對接收到的履歷進行履歷評估。

可選的，圖16是根據本發明實施例的一種電腦終端的結構框圖。如圖16所示，該電腦終端A可以包括：一個或多個(圖中僅示出一個)處理器1601、記憶體1603、以及傳輸裝置1605。

其中，記憶體可用於儲存軟體程式以及模組，如本發明實施例中的履歷評估方法和裝置對應的程式指令/模組，處理器通過運行儲存在記憶體內的軟體程式以及模組，從而執行各種功能應用以及資料處理，即實現上述的履歷評估方法。記憶體可包括高速隨機記憶體，還可以包括非易失性記憶體，如一個或者多個磁性儲存裝置、快閃記憶體、或者其他非易失性固態記憶體。在一些實例中，記憶體可進一步包括相對於處理器遠程設置的記憶體，這些遠程記憶體可以通過網路連接至終端A。上述網路的實例包括但不限於互聯網、企業內部網、局域網、移動通信網及其組合。

處理器可以通過傳輸裝置調用記憶體儲存的資訊及應用程式，以執行下述步驟：獲取歷史招聘資料集合，其中，歷史招聘資料集合至少包括：履歷文本資料；從歷史招聘資料集合中抽取資料，其中，資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，招聘結果至少包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數；通過訓練抽取到的資料構建履歷評估模型；使用履歷評估模型對接收到的履歷進行履歷評估。

可選的，上述處理器還可以執行如下步驟的程式代碼：對歷史招聘資料集合進行清洗，其中，資料清洗包括：從歷史招聘資料集合之中屏蔽評估不通過的履歷；從清洗後的歷史招聘資料集合中抽取資料。

可選的，上述處理器還可以執行如下步驟的程式代碼：由於人員編制head count導致評估不通過的履歷、沒有進行履歷評估而直接進行面試並且面試不同的履歷、履歷重複投遞導致評估不通過的履歷。

可選的，上述處理器還可以執行如下步驟的程式代碼：將抽取到的資料分為訓練樣本資料和測試樣本資料；使用訓練樣本資料進行訓練生成待檢驗的履歷評估模型；使用測試樣本資料對待檢驗的履歷評估模型進行檢驗，在檢驗通過的情況下確認待檢驗的履歷評估模型為準確的履歷評估模型。

可選的，上述處理器還可以執行如下步驟的程式代碼：生成待檢驗的履歷評估模型的訓練樣本資料是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料；和/或，檢測待檢驗的履歷評估模型的測試樣本資料是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料。

可選的，上述處理器還可以執行如下步驟的程式代碼：將測試樣本資料輸入至待檢驗的履歷評估模型中進行檢驗，並輸出檢驗結果；如果檢驗結果與測試樣本資料對應的招聘結果誤差在預定範圍內，則確認待檢驗的履歷評估模型為準確的履歷評估模型。

可選的，上述處理器還可以執行如下步驟的程式代碼：進行向量抽取包括：對應聘者的一個或多個屬性進行向量抽取，其中，一個或多個屬性包括以下至少之一：公司名稱、職位名稱、學校名稱、專業名稱；對向量抽取後的資料進行特徵整理包括：對一個或多個屬性進行歸一化處理。

可選的，上述處理器還可以執行如下步驟的程式代碼：對公司名稱進行歸一化處理包括：構建行業詞表和地名詞表；按照行業詞表和地名詞表中的行業名詞和地名名詞提取公司名稱，得到公司名稱的歸一化結果；對職位名稱進行歸一化處理包括：確認在歷史招聘資料集合中，出現次數大於預設次數的職位描述為正確的職位名稱；通過編輯距離構建履歷文本資料中的職位描述與正確的職位名稱之間的映射詞表；通過正則表達式對履歷文本資料中的職位描述在映射詞表中進行匹配，得到職位名稱的歸一化結果；對學校名稱進行歸一化處理包括：將履歷文本資料中的學校名稱根據出現的次數按照由大至小的順序排列，並獲取預設排名的學校名稱，得到基礎詞典；對學校名稱進行去噪處理，並通過正則匹配將去噪得到的學校名稱與基礎字典中的學校名稱進行匹配，以得到歸一化後的學校名稱；使用同義詞表，根據預設規則構造學校名稱對應的簡寫，將出現學校名稱對應的簡寫的名稱記錄為學校名稱；將學校名稱中包含預設第一後綴詞語的學校名稱歸一化為相應的第一後綴詞語，其中，預設的第一後綴詞語至少包括：職業技術學院、網路學院、成教、自考和專升本；去掉學校名稱中包含的第二後綴詞語，以生成歸一化後的學校名稱，其中，第二後綴詞語用於表徵學校的分支機構；去掉學校名稱中的前綴，以生成歸一化後的學校名稱；對專業名稱進行歸一化處理包括：構建專業分類表，並通過專業分類表進行貝葉斯模型訓練；根據訓練後的貝葉斯模型對履歷文本資料中的專業進行分類。

本領域普通技術人員可以理解，電腦終端也可以是智慧型手機(如Android手機、iOS手機等)、平板電腦、掌上型電腦以及移動互聯網設備(Mobile Internet Devices，MID)、PAD等終端設備。圖16其並不對上述電子裝置的結構造成限定。例如，電腦終端A還可包括比圖16中所示更多或者更少的組件(如網路介面、顯示裝置等)，或者具有與圖16所示不同的配置。

本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程式來指令終端設備相關的硬體來完成，該程式可以儲存於一電腦可讀儲存媒體中，儲存媒體可以包括：快閃隨身碟、唯讀記憶體 (Read-Only Memory，ROM)、隨機存取記憶體(Random Access Memory，RAM)、磁碟或光碟等。

實施例6

本發明的實施例還提供了一種儲存媒體。可選的，在本實施例中，上述儲存媒體可以用於保存上述實施例1所提供的履歷評估方法所執行的程式代碼。

可選的，在本實施例中，上述儲存媒體可以位於電腦網路中電腦終端群中的任意一個電腦終端中，或者位於移動終端群中的任意一個移動終端中。

可選的，在本實施例中，儲存媒體被設置為儲存用於執行以下步驟的程式代碼：獲取歷史招聘資料集合，其中，歷史招聘資料集合至少包括：履歷文本資料；從歷史招聘資料集合中抽取資料，其中，資料至少包括：一個或多個屬性在職位上對應的招聘結果，一個或多個屬性是履歷文本資料中用於表徵應聘者特徵的參數，招聘結果至少包括：一個或多個屬性在職位上的出現次數、和/或一個或多個屬性在職位上錄取次數；通過訓練抽取到的資料構建履歷評估模型；使用履歷評估模型對接收到的履歷進行履歷評估。

可選的，上述儲存媒體還被設置為儲存用於執行以下步驟的程式代碼：處理器還可以執行如下步驟的程式代碼：對歷史招聘資料集合進行清洗，其中，資料清洗包括：從歷史招聘資料集合之中屏蔽評估不通過的履歷；從清洗後的歷史招聘資料集合中抽取資料。

可選的，上述儲存媒體還被設置為儲存用於執行以下步驟的程式代碼：由於人員編制head count導致評估不通過的履歷、沒有進行履歷評估而直接進行面試並且面試不同的履歷、履歷重複投遞導致評估不通過的履歷。

可選的，上述儲存媒體還被設置為儲存用於執行以下步驟的程式代碼：將抽取到的資料分為訓練樣本資料和測試樣本資料；使用訓練樣本資料進行訓練生成待檢驗的履歷評估模型；使用測試樣本資料對待檢驗的履歷評估模型進行檢驗，在檢驗通過的情況下確認待檢驗的履歷評估模型為準確的履歷評估模型。

可選的，上述儲存媒體還被設置為儲存用於執行以下步驟的程式代碼：生成待檢驗的履歷評估模型的訓練樣本資料是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料；和/或，檢測待檢驗的履歷評估模型的測試樣本資料是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料。

可選的，上述儲存媒體還被設置為儲存用於執行以下步驟的程式代碼：將測試樣本資料輸入至待檢驗的履歷評估模型中進行檢驗，並輸出檢驗結果；如果檢驗結果與測試樣本資料對應的招聘結果誤差在預定範圍內，則確認待檢驗的履歷評估模型為準確的履歷評估模型。

可選的，上述儲存媒體還被設置為儲存用於執行以下步驟的程式代碼：進行向量抽取包括：對應聘者的一個或多個屬性進行向量抽取，其中，一個或多個屬性包括以下至少之一：公司名稱、職位名稱、學校名稱、專業名稱；對向量抽取後的資料進行特徵整理包括：對一個或多個屬性進行歸一化處理。

可選的，上述儲存媒體還被設置為儲存用於執行以下步驟的程式代碼：對公司名稱進行歸一化處理包括：構建行業詞表和地名詞表；按照行業詞表和地名詞表中的行業名詞和地名名詞提取公司名稱，得到公司名稱的歸一化結果；對職位名稱進行歸一化處理包括：確認在歷史招聘資料集合中，出現次數大於預設次數的職位描述為正確的職位名稱；通過編輯距離構建履歷文本資料中的職位描述與正確的職位名稱之間的映射詞表；通過正則表達式對履歷文本資料中的職位描述在映射詞表中進行匹配，得到職位名稱的歸一化結果；對學校名稱進行歸一化處理包括：將履歷文本資料中的學校名稱根據出現的次數按照由大至小的順序排列，並獲取預設排名的學校名稱，得到基礎詞典；對學校名稱進行去噪處理，並通過正則匹配將去噪得到的學校名稱與基礎字典中的學校名稱進行匹配，以得到歸一化後的學校名稱；使用同義詞表，根據預設規則構造學校名稱對應的簡寫，將出現學校名稱對應的簡寫的名稱記錄為學校名稱；將學校名稱中包含預設第一後綴詞語的學校名稱歸一化為相應的第一後綴詞語，其中，預設的第一後綴詞語至少包括：職業技術學院、網路學院、成教、自考和專升本；去掉學校名稱中包含的第二後綴詞語，以生成歸一化後的學校名稱，其中，第二後綴詞語用於表徵學校的分支機構；去掉學校名稱中的前綴，以生成歸一化後的學校名稱；對專業名稱進行歸一化處理包括：構建專業分類表，並通過專業分類表進行貝葉斯模型訓練；根據訓練後的貝葉斯模型對履歷文本資料中的專業進行分類。

上述本發明實施例序號僅僅為了描述，不代表實施例的優劣。

在本發明的上述實施例中，對各個實施例的描述都各有側重，某個實施例中沒有詳述的部分，可以參見其他實施例的相關描述。

在本申請所提供的幾個實施例中，應該理解到，所揭露的技術內容，可通過其它的方式實現。其中，以上所描述的裝置實施例僅僅是示意性的，例如所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現時可以有另外的劃分方式，例如多個單元或組件可以結合或者可以集成到另一個系統，或一些特徵可以忽略，或不執行。另一點，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些介面，單元或模組的間接耦合或通信連接，可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位於一個地方，或者也可以分布到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。

另外，在本發明各個實施例中的各功能單元可以集成在一個處理單元中，也可以是各個單元單獨物理存在，也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現，也可以採用軟體功能單元的形式實現。

所述集成的單元如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時，可以儲存在一個電腦可讀取儲存媒體中。基於這樣的理解，本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟體產品的形式體現出來，該電腦軟體產品儲存在一個儲存媒體中，包括若干指令用以使得一台電腦設備(可為個人電腦、伺服器或者網路設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的儲存媒體包括：USB隨身碟、唯讀記憶體(ROM，Read-Only Memory)、隨機存取記憶體(RAM，Random Access Memory)、移動硬碟、磁碟或者光碟等各種可以儲存程式代碼的媒體。

以上所述僅是本發明的較佳實施方式，應當指出，對於本技術領域的普通技術人員來說，在不脫離本發明原理的前提下，還可以做出若干改進和潤飾，這些改進和潤飾也應視為本發明的保護範圍。

Claims

一種履歷評估方法，包括：獲取歷史招聘資料集合，其中，所述歷史招聘資料集合至少包括：履歷文本資料；從所述歷史招聘資料集合中抽取資料，其中，所述資料至少包括：一個或多個屬性在職位上對應的招聘結果，所述一個或多個屬性是所述履歷文本資料中用於表徵應聘者特徵的參數，所述招聘結果至少包括：所述一個或多個屬性在所述職位上的出現次數、和/或所述一個或多個屬性在所述職位上錄取次數；通過訓練抽取到的資料構建履歷評估模型。
根據申請專利範圍第1項所述的方法，其中，從所述歷史招聘資料集合中抽取所述資料包括：對所述歷史招聘資料集合進行清洗，其中，所述資料清洗包括：從所述歷史招聘資料集合之中屏蔽評估不通過的履歷；從清洗後的所述歷史招聘資料集合中抽取所述資料。
根據申請專利範圍第2項所述的方法，其中，評估不通過的履歷包括以下至少之一：由於人員編制head count導致評估不通過的履歷、沒有進行履歷評估而直接進行面試並且面試未通過的履歷、及履歷重複投遞導致評估不通過的履歷。
根據申請專利範圍第1項所述的方法，其中，通過訓練抽取到的資料構建履歷評估模型包括：將抽取到的資料分為訓練樣本資料和測試樣本資料；使用所述訓練樣本資料進行訓練生成待檢驗的履歷評估模型；使用所述測試樣本資料對所述待檢驗的履歷評估模型進行檢驗，在檢驗通過的情況下確認所述待檢驗的履歷評估模型為準確的履歷評估模型。
根據申請專利範圍第4項所述的方法，其中，生成所述待檢驗的履歷評估模型的訓練樣本資料是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料；和/或，檢測所述待檢驗的履歷評估模型的測試樣本資料是：進行向量抽取並對向量抽取後的資料進行特徵整理後得到的資料。
根據申請專利範圍第4或5項所述的方法，其中，使用所述測試樣本資料對所述待檢驗的履歷評估模型進行檢驗，並確認所述待檢驗的履歷評估模型為準確的履歷評估模型包括：將所述測試樣本資料輸入至所述待檢驗的履歷評估模型中進行檢驗，並輸出檢驗結果；如果所述檢驗結果與所述測試樣本資料對應的招聘結果誤差在預定範圍內，則確認所述待檢驗的履歷評估模型為準確的履歷評估模型。
根據申請專利範圍第4項所述的方法，其中，進行向量抽取包括：對所述應聘者的一個或多個屬性進行向量抽取，其中，所述一個或多個屬性包括以下至少之一：公司名稱、職位名稱、學校名稱、及專業名稱；對向量抽取後的資料進行特徵整理包括：對所述一個或多個屬性進行歸一化處理。
根據申請專利範圍第7項所述的方法，其中，對所述一個或多個屬性進行歸一化處理包括以下至少之一：對所述公司名稱進行歸一化處理包括：構建行業詞表和地名詞表；按照所述行業詞表和所述地名詞表中的行業名詞和地名名詞提取所述公司名稱，得到所述公司名稱的歸一化結果；對所述職位名稱進行歸一化處理包括：確認在所述歷史招聘資料集合中，出現次數大於預設次數的職位描述為正確的職位名稱；通過編輯距離構建所述履歷文本資料中的職位描述與所述正確的職位名稱之間的映射詞表；通過正則表達式對所述履歷文本資料中的職位描述在所述映射詞表中進行匹配，得到所述職位名稱的歸一化結果；對所述學校名稱進行歸一化處理包括：將所述履歷文本資料中的學校名稱根據出現的次數按照由大至小的順序排列，並獲取預設排名的學校名稱，得到基礎詞典；對所述學校名稱進行去噪處理，並通過正則匹配將去噪得到的學校名稱與所述基礎字典中的學校名稱進行匹配，以得到歸一化後的學校名稱；使用同義詞表，根據預設規則構造學校名稱對應的簡寫，將出現所述學校名稱對應的簡寫的名稱記錄為所述學校名稱；將所述學校名稱中包含預設第一後綴詞語的學校名稱歸一化為相應的第一後綴詞語，其中，所述預設的第一後綴詞語至少包括：職業技術學院、網路學院、成教、自考和專升本；去掉所述學校名稱中包含的第二後綴詞語，以生成歸一化後的學校名稱，其中，所述第二後綴詞語用於表徵所述學校的分支機構；去掉所述學校名稱中的前綴，以生成歸一化後的學校名稱；及對所述專業名稱進行歸一化處理包括：構建專業分類表，並通過所述專業分類表進行貝葉斯模型訓練；根據訓練後的所述貝葉斯模型對所述履歷文本資料中的專業進行分類。
一種履歷評估方法，包括：輸入待評估履歷；獲取所述待評估履歷的履歷評估結果，其中，所述履歷評估結果是根據履歷評估模型做出的，所述履歷評估模型是根據從歷史招聘資料集合中抽取資料建立的。
根據申請專利範圍第9項所述的方法，其中，所述方法還包括：輸入歷史招聘資料集合，其中，所述歷史招聘集合中的資料至少包括：一個或多個屬性在職位上對應的招聘結果，所述一個或多個屬性是所述履歷文本資料中用於表徵應聘者特徵的參數，所述招聘結果至少包括：所述一個或多個屬性在所述職位上的出現次數、和/或所述一個或多個屬性在所述職位上錄取次數。
根據申請專利範圍第10項所述的方法，其中，在獲取所述待評估履歷的履歷評估結果之後，所述方法還包括：在預設區域顯示所述待評估對象的履歷評估結果。
一種履歷評估裝置，包括：獲取模組，用於獲取歷史招聘資料集合，其中，所述歷史招聘資料集合至少包括：履歷文本資料；抽取模組，用於從所述歷史招聘資料集合中抽取資料，其中，所述資料至少包括：一個或多個屬性在職位上對應的招聘結果，所述一個或多個屬性是所述履歷文本資料中用於表徵應聘者特徵的參數，所述招聘結果至少包括：所述一個或多個屬性在所述職位上的出現次數、和/或所述一個或多個屬性在所述職位上錄取次數；構建模組，用於通過訓練抽取到的資料構建履歷評估模型。
根據申請專利範圍第12項所述的裝置，其中，所述抽取模組包括：清洗模組，用於對所述歷史招聘資料集合進行清洗，其中，所述資料清洗包括：從所述歷史招聘資料集合之中屏蔽評估不通過的履歷；第一抽取子模組，用於從清洗後的所述歷史招聘資料集合中抽取所述資料。
根據申請專利範圍第13項所述的裝置，其中，評估不通過的履歷包括以下至少之一：由於人員編制head count導致評估不通過的履歷、沒有進行履歷評估而直接進行面試並且面試不同的履歷、及履歷重複投遞導致評估不通過的履歷。
根據申請專利範圍第12項所述的裝置，其中，所述構建模組包括：分類模組，用於將抽取到的資料分為訓練樣本資料和測試樣本資料；生成模組，用於使用所述訓練樣本資料進行訓練生成待檢驗的履歷評估模型；確認模組，用於使用所述測試樣本資料對所述待檢驗的履歷評估模型進行檢驗，在檢驗通過的情況下確認所述待檢驗的履歷評估模型為準確的履歷評估模型。
根據申請專利範圍第15項所述的裝置，其中，所述分類模組包括：第二抽取子模組，用於進行向量抽取；整理模組，用於對進行所述向量抽取後的資料進行特徵整理，以得到所述訓練樣本資料和/或所述測試樣本資料。
根據申請專利範圍第15或16項所述的裝置，其中，所述確認模組包括：檢驗模組，用於將所述測試樣本資料輸入至所述待檢驗的履歷評估模型中進行檢驗，並輸出檢驗結果；確認子模組，如果所述檢驗結果與所述測試樣本資料對應的招聘結果誤差在預定範圍內，則確認所述待檢驗的履歷評估模型為準確的履歷評估模型。
根據申請專利範圍第16項所述的裝置，其中，所述第二抽取子模組，用於對所述應聘者的一個或多個屬性進行向量抽取，其中，所述一個或多個屬性包括以下至少之一：公司名稱、職位名稱、學校名稱、及專業名稱；所述整理模組包括：歸一化模組，用於對所述一個或多個屬性進行歸一化處理。
根據申請專利範圍第18項所述的裝置，其中，所述歸一化模組包括以下至少之一：第一子歸一化模組，用於構建行業詞表和地名詞表；按照所述行業詞表和所述地名詞表中的行業名詞和地名名詞提取所述公司名稱，得到所述公司名稱的歸一化結果，以對所述公司名稱進行歸一化處理；第二子歸一化模組，用於確認在所述歷史招聘資料集合中，出現次數大於預設次數的職位描述為正確的職位名稱；通過編輯距離構建所述履歷文本資料中的職位描述與所述正確的職位名稱之間的映射詞表；通過正則表達式對所述履歷文本資料中的職位描述在所述映射詞表中進行匹配，得到所述職位名稱的歸一化結果，以對所述職位名稱進行歸一化處理；第三子歸一化模組，用於將所述履歷文本資料中的學校名稱根據出現的次數按照由大至小的順序排列，並獲取預設排名的學校名稱，得到基礎詞典；對所述學校名稱進行去噪處理，並通過正則匹配將去噪得到的學校名稱與所述基礎字典中的學校名稱進行匹配，以得到歸一化後的學校名稱；使用同義詞表，根據預設規則構造學校名稱對應的簡寫，將出現所述學校名稱對應的簡寫的名稱記錄為所述學校名稱；將所述學校名稱中包含預設第一後綴詞語的學校名稱歸一化為相應的第一後綴詞語，其中，所述預設的第一後綴詞語至少包括：職業技術學院、網路學院、成教、自考和專升本；去掉所述學校名稱中包含的第二後綴詞語，以生成歸一化後的學校名稱，其中，所述第二後綴詞語用於表徵所述學校的分支機構；去掉所述學校名稱中的前綴，以生成歸一化後的學校名稱，以對所述學校名稱進行歸一化處理；及第四子歸一化模組，用於構建專業分類表，並通過所述專業分類表進行貝葉斯模型訓練；根據訓練後的所述貝葉斯模型對所述履歷文本資料中的專業進行分類，以對所述專業名稱進行歸一化處理。
一種履歷評估裝置，其特徵在於，包括：第一輸入模組，用於輸入待評估履歷；獲取模組，用於獲取所述待評估履歷的履歷評估結果，其中，所述履歷評估結果是根據履歷評估模型做出的，所述履歷評估模型是根據從歷史招聘資料集合中抽取資料建立的。
根據申請專利範圍第20項所述的裝置，其中，所述裝置還包括：第二輸入模組，用於輸入歷史招聘資料集合，其中，所述歷史招聘集合中的資料至少包括：一個或多個屬性在職位上對應的招聘結果，所述一個或多個屬性是所述履歷文本資料中用於表徵應聘者特徵的參數，所述招聘結果至少包括：所述一個或多個屬性在所述職位上的出現次數、和/或所述一個或多個屬性在所述職位上錄取次數。
根據申請專利範圍第21項所述的裝置，其中，所述裝置還包括：顯示模組，用於在預設區域顯示所述待評估對象的履歷評估結果。