以下、本発明の一実施形態を図面に基づいて説明する。図1は、本実施形態に係る情報処理システム1の構成例を示す図である。図1で示すように情報処理システム1は、情報処理装置2と1つ以上の端末3とを含んで構成されている。情報処理装置2および端末3は共に、インターネット、電話網、その他の通信網を含むネットワークNに接続可能である。
ここで企業、その他の組織は、組織に勤める人材を募集し、選考する採用活動を行うことがある。採用活動の内容は様々であるが、応募者がエントリーシートを組織に提供することが広く行われている。エントリーシートは、紙媒体の書類として提出される他、所定フォーマットの電子ファイルとして、或いは、組織が開設したWebサイトのWebページを利用したWebエントリーシートとして提出される。
エントリーシートには通常、自己PRや志望理由、組織が設定した設問(例えば「これまでの活動を教えて下さい。」や、「弊所でチャレンジしたいことを教えて下さい」等)に対する回答等、組織が設定したテーマに沿って文章を記入する欄が形成されている。以下エントリーシートにおいて、組織が設定したテーマに沿って記入された文章を「評価対象文章」という。組織の採用担当者は、エントリーシートに記入された評価対象文章の内容を確認して評価し、その評価を利用して応募者の合否を決定する(ただし、評価対象文章についての評価のみを用いて合否を決定するわけでは当然ない)。つまり評価対象文章は、応募者が作成し、組織が選考に利用する文章である。なお本実施形態において合否とは、採用するかどうかという最終的な合否だけを意味するのではなく、「複数の段階で選考が行われる場合における、次の段階に選考を進めるか否かの決定」等、ポジティブな判定とネガティブな判定とに分けられる何らかの選考結果を意味する。
そして情報処理装置2は、端末3をクライアントの1つとするサーバ装置である。本実施形態に係る情報処理装置2は特に、クラウドシステムにおけるクラウドサーバである。情報処理装置2は、上述した評価対象文章を分析し、組織による採用活動を支援するサービスを提供する機能を備えている。図1では、情報処理装置2を1つのブロックで表しているが、情報処理装置2は単一のサーバ装置である必要はなく、例えば複数のサーバ装置により構成されてもよく、また所定のシステムの一部であってもよい。
端末3は、情報処理装置2のクライアントとして機能するコンピュータである。端末3は、特に組織の採用担当者が使用することが想定されている。以下、端末3を使用する者を便宜的に「ユーザ」という。図1で示すように複数の異なる組織が存在し、各組織に端末3が属している。端末3はブラウザが搭載されているコンピュータであれば、その形態はどのようなものであってもよく、例えばデスクトップ型コンピュータ、ノート型コンピュータ、タブレット型コンピュータ(いわゆるスマートフォンを含む)を端末3として機能させることができる。
図2は、情報処理装置2および端末3の機能構成例を示すブロック図である。図2で示すように、情報処理装置2は機能構成として、情報処理部10および通信部11を備えている。また端末3は機能構成として、端末制御部12および端末通信部13を備えている。上記各機能ブロック10~13は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック10~13は、実際にはコンピュータのCPU、RAM、ROM等を備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。また情報処理装置2は記憶手段として、記憶部14を備えている。
通信部11は、ネットワークNに接続された機器と所定のプロトコルに従って通信する。また端末通信部13は、ネットワークNに接続された機器と所定のプロトコルに従って通信する。以下の説明では情報処理装置2と端末3との間での通信は、通信部11および端末通信部13により適切に行われるものとして詳細な説明を省略する。
情報処理装置2が処理を行うシーンは、大きく「分析シーン」と「情報提供シーン」との2つに分けられる。以下、情報処理装置2がある1つの組織(以下「対象組織」という)を対象として実行する処理についてシーンごとに説明する。
なお本実施形態おいて「単語」とは、意味や機能を持った最小の単位を意味するものとする。単語は、言語学上の形態素とほとんど一致する概念であり、例えば、「私は映画館に行きました」という文では、「私」、「は」、「映画館」、「に」、「行き」、「まし」、「た」がそれぞれ単語に相当する。「文字」とは、文字コードが割り当てられた対象1つ1つのことを意味し、例えば、「あ」、「ア」、「A」はそれぞれ文字であり、各種記号、空白文字および制御文字についても文字コードが割り当てられている限り「文字」に相当する。
また「文」とは、1つ以上の単語からなり、意味的にまとまった表現の最小の単位を意味するものとする。ほとんどの場合において文は、句点(「。」や「.」等)や、感嘆符(「!」)或いはこれに準じるもの、または、疑問符(「?」)或いはこれに準じるもので終了する。例えば「私は映画館に行きました。彼も映画に行きました。」という文章では、「私は映画館に行きました」、「彼も映画に行きました」がそれぞれ文に相当する。また「文章」とは、1つ以上の文より構成される一連のまとまった情報を意味するものとする。「私は映画館に行きました。彼も映画に行きました。」という情報(他に連続する文はないものとする)は、文章に相当する。
<分析シーン>
分析シーンは簡単に言うと、情報処理装置2が応募者ごとに評価対象文章を分析し、文章特徴評価値、適合性評価値および特異性評価値(いずれも後述)を導出するシーンである。分析シーンにおいてまず情報処理装置2は、文章前処理を実行する。
図3は、文章前処理の説明に利用する図である。文章前処理にあたって事前に記憶部14には、処理対象となる評価対象文章データが相当数、記憶される(図3の符号J31)。評価対象文章データとは、評価対象文章がテキスト(文字コードの組合せ)として記録されたデータである。特に本例で処理対象となる評価対象文章データのそれぞれは、対象組織が行ったある一連の採用活動において応募者のそれぞれがエントリーシートの特定のテーマ(例えば志望理由)について記入した評価対象文章のそれぞれに対応している。例えば対象組織について応募した応募者が1000人いたとする。この場合、1000人の応募者のそれぞれに対応して、1000個の評価対象文章データが記憶部14に記憶され、各評価対象文章データには、各応募者が特定のテーマについて記入した評価対象文章が記録されている。
なお図3では、1つの評価対象文章データを1つのブロックにより表しているが、これは説明の便宜のためにこのように表現しているだけであり、1つの評価対象文章データごとに1つの電子ファイルが記憶部14に記憶されることを意味するものではない。例えば複数の評価対象文章データ(全ての評価対象文章データであってもよい)が1つの電子ファイルに記録されていてもよい。また評価対象文章データは基本的には対象組織から提供されるものであるが、当該データはどのような方法で生成されてもよい。例えばエントリーシートがWebエントリーシート或いは所定フォーマットのファイルとして提出される場合には、所定のコンピュータにより評価対象文章のテキストデータが抽出され、評価対象文章データが生成される。また例えばエントリーシートが紙媒体の書類として提出される場合には、エントリーシートのスキャンデータ或いは撮影画像データが所定のコンピュータにより文字認識され、その結果に基づいて評価対象文章データが生成される。
評価対象文章データが記憶部14に記憶された状態において情報処理装置2の情報処理部10は、評価対象データのそれぞれを対象として文章前処理を実行する(図3の符号J32)。文章前処理とは、1つの評価対象文章データ内において、或いは、異なる評価対象文章データ間において、表記の揺れや不統一性が無くなるようにデータを整形する処理である。文章前処理は、後続する処理が適切に行われるようにするために行われる。文章前処理では例えば、小文字/大文字の統一や、全角/半角の統一、文字の正規化が行われる。例えば文章前処理において情報処理部10は、「WEB」、「Web」、「web」との表記を「WEB」という表記に統一したり、「。」や「.」と表記され得る句点を「。」に統一したり、「、」や「,」と表記され得る読点を「、」に統一したり、数字を半角に統一したりする。以下、文章前処理が施された評価対象文章データを「処理用データ」という。処理用データのそれぞれは、記憶部14に記憶される(図3の符号J33)。
文章前処理により処理用データが記憶部14に記憶された状態となった後、情報処理部10は、文章特徴評価値導出処理、適合性評価値導出処理および特異性評価値導出処理を実行する。以下、各処理について順番に説明する。なお各処理の順番は順不同である。また各処理では、記憶部14に記憶された処理用データが取得されて文章特徴評価値、適合性評価値および特異性評価値が導出されることになるが、処理用データを取得する処理は「評価対象文章を取得する処理」に相当する。
・文章特徴評価値導出処理
まず文章特徴評価値導出処理について説明する。ここで発明者らは、採用活動に関する研究、分析を通して、評価対象文章について統計的に把握可能な文章特徴が、実際の選考結果(合否)に影響を与えていることを見出した。文章特徴の具体例は後述するが、文章特徴には、評価対象文章を構成する文章、または、評価対象文章に含まれる文、単語或いは文字について統計的に把握可能な特徴が含まれる。これを踏まえ本実施形態に係る情報処理装置2は、評価対象文章のそれぞれについて、その文章特徴から応募者がどれだけ合格可能性が高いと評価できるかを示す文章特徴評価値を導出する機能を備えている。そして文章特徴評価値導出処理は簡単に言うと、文章特徴評価値を導出する処理である。
図4は、文章特徴評価値導出処理の説明に利用する図である。図4で示すように文章特徴評価値導出処理においてまず情報処理部10は、処理用データを対象として入力特徴ベクトル導出処理を実行する(図4の符号J41)。ここで後述するように文章特徴評価値の導出の前に、これの元となる調整前文章特徴評価値が調整前文章特徴評価値導出処理により導出される。図5は、調整前文章特徴評価値導出処理の説明に利用する図である。図5で示すように調整前文章特徴評価値導出処理では、評価対象文章のそれぞれについて、機械学習された学習済モデル16に入力特徴ベクトルが入力され、調整前文章特徴評価値が導出される。入力特徴ベクトルは、選考結果に影響を与え得る「文章特徴の特徴量」をベクトルの要素として含む特徴ベクトルである。そして、入力特徴ベクトル導出処理とは、評価対象文章ごとに入力特徴量ベクトルを生成する処理である。
図6は、入力特徴ベクトルに含まれる特徴量の一覧である。入力特徴ベクトル導出処理において情報処理部10は、評価対象文章のそれぞれについて、処理用データに基づいて図6の一覧で示す全ての特徴量の値を決定する。以下の説明では入力特徴ベクトルに含まれる各特徴量について、特徴量名を[]で囲み、例えば[一文長]のように表現する。なお入力特徴ベクトル導出処理は、処理用データを処理対象とするが、処理用データを処理する前に必要な前処理を施してもよいことは勿論である。
図6の通番の1~4を参照し[一文長]は、評価対象文章に含まれる文のそれぞれの長さ(文字数)の平均値である。[一文長]は、文章或いは文について統計的に把握可能な文章特徴の特徴量である。[文章句点数]は、評価対象文章に含まれる句点の個数である。[文章句点数]は、文章或いは文字について統計的に把握可能な文章特徴の特徴量である。[文章読点数]は、評価対象文章に含まれる読点の個数である。[文章読点数]は、文章或いは文字について統計的に把握可能な文章特徴の特徴量である。[一文読点数]は、1文あたりに含まれる読点の個数の平均値である。[一文読点数]は、文章、文或いは文字について統計的に把握可能な文章特徴の特徴量である。情報処理部10は、処理用データを情報処理(自然言語処理を含む)により分析することにより、これら4つの特徴量の各値を決定する。
ここで[一文長]、[文章句点数]、[文章読点数]および[一文読点数]は、文章の読みやすさ、簡潔性およびリズム感に影響すると考えられ、このため選考結果に影響を与え得ると考えられる。評価対象文章の読みやすさ、簡潔性およびリズム感は、それを読んだ採用担当者の心証に影響を与えるからである。学習済モデル16は、これら4つの特徴量の各値が、合格と判定されことに対して良い影響を与える状態となっているほど、出力する値(調整前文章特徴評価値)が大きくなるようなモデルとなるように学習されることが期待される。
図6の通番の5~9を参照し[文章ひらがな数/割合]は、評価対象文章において使用されている「ひらがな」の個数、および、評価対象文章の全体の文字数に対する「ひらがな」の個数の割合である。[文章ひらがな数/割合]は、文章或いは文字について統計的に把握可能な文章特徴の特徴量である。[文章カタカナ数/割合]は、評価対象文章において使用されている「カタカナ」の個数、および、評価対象文章の全体の文字数に対する「カタナカ」の個数の割合である。[文章カタカナ数/割合]は、文章或いは文字について統計的に把握可能な文章特徴の特徴量である。[文章漢字数/割合]は、評価対象文章において使用されている「漢字」の個数、および、評価対象文章の全体の文字数に対する「漢字」の個数の割合である。[文章漢字数/割合]は、文章或いは文字について統計的に把握可能な文章特徴の特徴量である。[文章記号数/割合]は、評価対象文章において使用されている「記号」の個数、および、評価対象文章の全体の文字数に対する「記号」の個数の割合である。[文章記号数/割合]は、文章或いは文字について統計的に把握可能な文章特徴の特徴量である。[文章数字数/割合]は、評価対象文章において使用されている「数字」の個数、および、評価対象文章の全体の文字数に対する「数字」の個数の割合である。[文章数字数/割合]は、文章或いは文字について統計的に把握可能な文章特徴の特徴量である。情報処理部10は、処理用データを情報処理(自然言語処理を含む)により分析することにより、これら5つの特徴量の各値を決定する。
[文章ひらがな数/割合]、[文章カタカナ数/割合]、[文章漢字数/割合]、[文章記号数/割合]および[文章数字数/割合]は、文章に横文字(外来語、カタカナ語)が使用される傾向や、文章の固さ、文章に含まれる情報量の多寡に影響を与え、またこれらの指標となり得、このため選考結果に影響を与えると考えられる。文章に横文字が使用される傾向や、文章の固さ、文章に含まれる情報量の多寡は、それを読んだ採用担当者の心証に影響を与えるからである。学習済モデル16は、これら5つの特徴量の各値が、合格と判定されことに対して良い影響を与える状態となっているほど、出力する値(調整前文章特徴評価値)が大きくなるようなモデルとなるように学習されることが期待される。
図6の通番の10~12を参照し[文章ストップワード数/割合]は、評価対象文章において使用されている「ストップワード」の個数、および、評価対象文章の全体の単語数に対する「ストップワード」の個数の割合である。ストップワードとは、助詞の「は」、助詞の「の」、助動詞の「です」といった一般的であり重要な意味を持たない頻出単語のことである。[文章ストップワード数/割合]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。[文章名詞数/割合]は、評価対象文章において使用されている「名詞」の個数、および、評価対象文章の全体の単語数に対する「名詞」の個数の割合である。[文章名詞数/割合]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。[文章語彙数]は、評価対象文章において使用されている「語彙」の個数である。語彙とは、ストップワード以外の単語を意味する(このように本実施形態では定義する)。[文章語彙数]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。情報処理部10は、処理用データを情報処理(自然言語処理を含む)により分析することにより、これら3つの特徴量の各値を決定する。
ここで[文章ストップワード数/割合]、[文章名詞数/割合]および[文章語彙数]は、評価対象文章の具体性(内容が具体的かどうか)に影響を与え、またこれの指標となり得、このため選考結果に影響を与えると考えられる。文章の内容が具体的かどうかは、それを読んだ採用担当者の心証に影響を与えるからである。学習済モデル16は、これら3つの特徴量の各値が、合格と判定されことに対して良い影響を与える状態となっているほど、調整前文章特徴評価値が大きくなるようなモデルとなるように学習されることが期待される。
図6の通番の13を参照し[文章名詞平均反復回数]は、評価対象文章において同じ名詞が反復して使用されている回数の平均値である。例えば評価対象文章の文章中に「私」という名詞と、「大学」という名詞とが出現し、「私」について5回、「大学」について3回使用されていたとすると、[文章名詞平均反復回数]の値は「4」である。[文章名詞平均反復回数]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。情報処理部10は、処理用データを情報処理(自然言語処理を含む)により分析することにより、この1つの特徴量の値を決定する。
ここで[文章名詞平均反復回数]は、主語や固有名詞など繰返しの多い冗長な文章かどうかに影響を与え、またこの指標となり得、このため選考結果に影響を与えると考えられる。文章が冗長かどうかは、それを読んだ採用担当者の心証に影響を与えるからである。学習済モデル16は、この1つの特徴量の値が、合格と判定されことに対して良い影響を与える状態となっているほど、調整前文章特徴評価値が大きくなるようなモデルとなるように学習されることが期待される。
図6の通番の14~16を参照し[文章重要キーワード数]は、評価対象文章において使用されている「重要キーワード」の個数である。重要キーワードは、事前に定められた単語である。[文章重要キーワード数]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。[文章数字キーワード数]は評価対象文章において使用されている「数字キーワード」の個数である。数字キーワードとは例えば、「○○%」(○○には数字が入る)等の数字を伴い、予め定められた表現方法で表現された単語である。数字キーワードは、文章の具体性、論理性、説得力性に寄与し得るかという観点で定められる。[文章数字キーワード数]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。[文章特定表現キーワード数]は、評価対象文章において使用されている「特定表現キーワード」の個数である。特定表現キーワードとは例えば、「○○部」(例、サッカー部、バスケットボール部)等の特定の文字を伴い、予め定められた表現方法で表現された単語である。特定表現キーワードは、文章の具体性、論理性、説得力性に寄与し得るかという観点で定められる。「特定表現キーワード」は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。情報処理部10は、処理用データを情報処理(自然言語処理を含む)により分析することにより、これら3つの特徴量の各値を決定する。
ここで[文章重要キーワード数]、[文章数字キーワード数]および[文章特定表現キーワード数]は、評価対象文章の論理性、具体性、説得力性に影響を与え、またこれらの指標となり得、このため選考結果に影響を与えると考えられる。文章の内容が論理的かどうか、具体的かどうか、説得力があるかどうかは、それを読んだ採用担当者の心証に影響を与えるからである。学習済モデル16は、これら3つの特徴量の各値が、合格と判定されことに対して良い影響を与える状態となっているほど、出力する値(調整前文章特徴評価値)が大きくなるようなモデルとなるように機械学習されることが期待される。
図6の通番の17、18を参照し[各単語出現頻度]は、予め定められた複数の単語のそれぞれが、評価対象文章において使用されている回数である。単語としては、例えば1000語以上の相当数の単語が事前に定義される。[各単語出現頻度]は、定義された各単語の出現回数を要素とする特徴ベクトルと考えることができる。[各単語出現頻度]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。[各単語TF-IDF値]は、予め定められた複数の単語のそれぞれについてのTF-IDF値である。[各単語TF-IDF値]は、定義された各単語のTF-IDF値を要素とする特徴ベクトルと考えることができる。周知の通りTF-IDF値は、単語の重要度の指標となる値である。なお[各単語TF-IDF値]は、[各単語出現頻度]について補正をかける(より正確には、学習済モデル16において補正がかかる)ことを目的として特徴量として採用されている。なお、[各単語TF-IDF値]の値は、全ての評価対象文章についての入力特徴ベクトルにおいて同値となる。[各単語TF-IDF値]は、文章或いは単語について統計的に把握可能な文章特徴の特徴量である。
情報処理部10は、処理用データを情報処理(自然言語処理を含む)により分析することにより、[各単語出現頻度]の値を決定する。また情報処理部10は、全ての処理用データを情報処理(自然減処理を含む)により分析することにより、[各単語TF-IDF値]の値を決定する。[各単語TF-IDF値]の導出は、どこかのタイミングで1回だけ行われればよい。
ここで[各単語出現頻度]と[各単語TF-IDF値]との組み合わせは、評価対象文章で使用されている単語を踏まえて、評価対象文章がどのような特徴を持っているかということの指標となり得、このため選考結果に影響を与えると考えられる。当然、評価対象文章の特徴によって、それを読んだ採用担当者の心証は変わるからである。学習済モデル16は、これら2つの特徴量の各値が、合格と判定されことに対して良い影響を与える状態となっているほど、出力する値(調整前文章特徴評価値)が大きくなるようなモデルとなるように機械学習されることが期待される。
入力特徴ベクトル導出処理において情報処理部10は、全ての評価対象文章について、全ての種類の特徴量の値を決定し、入力特徴ベクトルを生成する。生成された入力特徴ベクトルのそれぞれは記憶部14に記憶される(図4の符号J42)。
入力特徴ベクトル導出処理の後、情報処理部10は、調整前文章特徴評価値導出処理を実行する(図4の符号J43)。ここで調整前文章特徴評価値導出処理の説明に先立って、上述した学習済モデル16についてより詳細に説明する。上述の通り図5は、学習済モデル16について、その入力(入力特徴ベクトル)およびその出力(調整前文章特徴評価値)と共に単純化して示した図である。本実施形態に係る学習済モデル16は、入力特徴ベクトル(ただし必要な正規化処理(スケーリングを含む)が施されたもの)を入力し、合格の確率(合格可能性の高さ)および不合格の確率を出力するよう設計されている。つまり学習済モデル16は、入力された入力特徴ベクトルが、合格と不合格という2つのラベルに属する確率を出力する。そして、出力のうち「合格の確率」が調整前文章特徴評価値に相当する。この学習済モデル16は基本的には以下の方法で学習される。
すなわち対象組織で過去に行われた採用活動で使用された評価対象文章について、入力特徴ベクトルと選考結果(合否)を示すラベルとを含む学習データ(図5の符号J51参照)が用意される。学習済モデル16は、この学習データにより学習される。この結果、学習済モデル16は、過去の実際の評価対象文章の入力特徴ベクトルの内容と、実際の選考結果とを反映して、入力された入力特徴ベクトルから合格の確率(調整前文章特徴評価値)を導出するモデルとなる。なお図5の学習済モデル16は、非常に単純化したものであり、学習済モデル16は単一のモデルである必要はない。学習済モデル16は、複数のモデルが組み合わされて構成されたものであってもよい。また学習データについても、対象組織の過去の選考で使用された評価対象文章だけを使用するのではなく、他の組織の選考に係る評価対象文章を使用してもよく、また、学習データを増やす既存の技術を利用して増やされたものを使用してもよい。
調整前文章特徴評価値導出処理において情報処理部10は、評価対象文章のそれぞれの入力特徴ベクトルに基づいて、調整前文章特徴評価値のそれぞれを導出する。ある1つの入力特徴ベクトルから調整前文章特徴評価値を導出する場合に着目して情報処理部10の動作について説明すると、まず情報処理部10は、入力特徴ベクトルの各特徴量について正規化処理(スケーリングを含む)、その他の必要な前処理を施す。次いで情報処理部10は、学習済モデル16に、前処理後の入力特徴ベクトルを入力し、当該モデルから出力された調整前文章特徴評価値を取得する。
調整前文章特徴評価値導出処理において情報処理部10は、全ての評価対象文章について、入力特徴ベクトルに基づいて学習済モデル16を利用して調整前文章特徴評価値を導出する。導出された調整前文章特徴評価値のそれぞれは、記憶部14に記憶される(図4の符号J44)。
調整前文章特徴評価値導出処理の後、情報処理部10は、文章特徴評価値調整処理を実行する(図4の符号J45)。文章特徴評価値調整処理において情報処理部10は、調整前文章特徴評価値のそれぞれについて、「0.0」~「100.0」の範囲内で値をとり、小数点第一位まで示された値へと変換することによって文章特徴評価値を導出する。文章特徴評価値は、入力特徴ベクトルの内容、つまり評価対象文章の文章特徴から応募者の合格可能性がどれだけ高いと評価できるかを示す評価値である。調整前文章特徴評価値から文章特徴評価値へ変換は、文章特徴評価値の意味と値がとり得る範囲とを踏まえ、文章特徴評価値の値が人間の直感と反しない値となるようにする(例えば、値が「50」のときに合格可能性が半々となる)との観点の下で事前に生成された計算式を利用して行われる。
文章特徴評価値調整処理において情報処理部10は、全ての評価対象文章について、調整前文章特徴評価値に基づいて文章特徴評価値を導出する。導出された文章特徴評価値のそれぞれは、記憶部14に記憶される(図4の符号J46)。
・適合性評価値導出処理
次に適合性評価値導出処理について説明する。図7は、適合性評価値導出処理の説明に利用する図である。適合性評価値導出処理において情報処理部10は、希望人物像ベクトル導出処理を実行する(図7の符号J701)。以下、希望人物像ベクトル導出処理について説明する。
希望人物像ベクトル導出処理が行われる前に記憶部14には、希望人物像文章が記録された希望人物像文章データが記憶される(図7の符号J702)。希望人物像文章は、対象組織(実際には対象組織に属する人物あるいはチーム)が、評価対象文章と同じテーマに沿って、対象組織が求める人物像について記載した文章である。希望人物像文章には、対象組織が求める人物像を表現するために、基本的には1つ以上の人材要件が記載される。人材要件とは、この条件を満たしていなければ採用しないという厳しい条件を意味するのではなく、このような人物であることを希望する或いは期待するといった、組織が期待し或いは希望する人材の要件を意味する。
例えばテーマが志望理由であり、固定観念にとらわれずに行動する一方で、協調性もあり、他人と強調しながら新しい分野を新規開拓していくことが期待される積極的で協調性のある人材を組織が求めていたとする。この場合、希望人物像文章は、積極的に活動し協調性のある人物像が、志望理由というテーマに沿って記載された文章となる。この場合の希望人物像文章の簡単な一例は以下である。『固定観念にとらわれない柔軟な考えおよび発想を持ち、その考えおよび発想に従って行動できる強い行動力を持つ。一方で自分勝手に突き進むのではなく、様々な困難に臨機応変に対応する柔軟性を持ち、しかも他人の意見をよく聞き、他人と協力しながら行動する協調性を持つ。』。
希望人物像ベクトル導出処理において、情報処理部10は、希望人物像文章データについて適切な前処理(上述した文章前処理と同等の処理、その他の必要な処理)を施した上で、希望人物像文章をベクトル化して希望人物像ベクトルを導出する。情報処理部10は、所定の言語モデルを使用してベクトル化を行う。所定の言語モデルは、異なる文章間で類似度を測定するのに適した言語モデルとされる。一例として「Universal Sentence Encoder」が使用される。導出された希望人物像ベクトルは、記憶部14に記憶される(図7の符号J703)。
また適合性評価値導出処理において情報処理部10は、第1適合性評価用ベクトル導出処理を実行する(図7の符号J704)。第1適合性評価用ベクトル導出処理において情報処理部10は、記憶部14に記憶された処理用データのそれぞれについて(ただし、処理用データに必要な前処理を更に施してもよい)、所定の言語モデル(ただし本実施形態では希望人物像ベクトル導出処理で使用した言語モデルと同じモデル)を利用してベクトル化し、第1適合性評価用ベクトルを生成する。第1適合性評価用ベクトル導出処理において情報処理部10は、全ての評価対象文章について、処理用データに基づいて第1適合性評価用ベクトルを導出する。導出された第1適合性評価用ベクトルのそれぞれは、記憶部14に記憶される(図7の符号J705)。
また適合性評価値導出処理において情報処理部10は、キーフレーズ抽出処理およびこの処理に後続する第2適合性評価用ベクトル導出処理を実行する(図7の符号J706、J707)。以下、各処理を順番に説明する。
まずキーフレーズ抽出処理では情報処理部10は、所定のキーフレーズ抽出のアルゴリズムが実装されたモジュールの機能により、評価対象文章(厳密には処理用データ)から、キーフレーズを抽出する(図7の符号J706)。なお本実施形態において「フレーズ」とは、1つ以上の単語を含み、使用されるキーフレーズ抽出のアルゴリズムにより抽出され得る単位を意味する。従ってフレーズは言語学上の「単語」や「句」と一致する概念ではなく、例えば、キーフレーズ抽出のアルゴリズムにおいて、複数の単語の連続がキーフレーズとして抽出され得る場合には、フレーズの概念には複数の単語の連続も含まれる。またキーフレーズとは、対象となった文章において、文章の主題をよく表現している(主題への関連度、寄与度が高いとも言える)フレーズであり、より一般化していうと、文章中で重要性が高いと想定されるフレーズのことである。
本実施形態で使用されるキーフレーズ抽出のアルゴリズムは、フレーズが出現する領域が重要性の判定に考慮されるアルゴリズムである。つまりフレーズが、文章中のどの領域に出現したかが重要性の判定に影響を与える。特にキーフレーズ抽出のアルゴリズムは、文章の冒頭に近い領域に出現するフレーズほど重要性が高いと判定する特性を持つアルゴリズムである。文章の領域とは、文章の冒頭に近い領域(冒頭も含む)、文章の中盤の領域、文章の末尾に近い領域(末尾も含む)等、文章を上流から下流に向かっていくつかに分けた場合の各区分けされた範囲を意味する。使用されるキーフレーズ抽出のアルゴリズムは一例として「Position Rank」である。
キーフレーズ抽出処理において情報処理部10は、全ての処理用データについてキーフレーズを抽出し、抽出したキーフレーズが記録された抽出後データを生成する。つまり抽出後データには、キーフレーズ抽出のアルゴリズムにより抽出されたキーフレーズが記録される。抽出後データのそれぞれは記憶部14に記憶される(図7の符号J708)。
キーフレーズ抽出処理の後、情報処理部10は、第2適合性評価用ベクトル導出処理を実行する(図7の符号J707)。第2適合性評価用ベクトル導出処理において情報処理部10は、記憶部14に記憶された抽出後データのそれぞれについて、所定の言語モデル(ただし本実施形態では希望人物像ベクトル導出処理で使用した言語モデルと同じモデル)を利用してベクトル化し、第2適合性評価用ベクトルを生成する。情報処理部10は、生成した第2適合性評価用ベクトルのそれぞれを記憶部14に記憶する(図7の符J709)。
以上の希望人物像ベクトル導出処理、第1適合性評価用ベクトル導出処理、および、キーフレーズ抽出処理とこれに続く第2適合性評価用ベクトル導出処理が行われる順番は順不同である。希望人物像ベクトル導出処理、第1適合性評価用ベクトル導出処理、および、キーフレーズ抽出処理とこれに続く第2適合性評価用ベクトル導出処理の実行後、情報処理部10は、調整前適合性評価値導出処理を実行する(図7の符号J710)。調整前適合性評価値導出処理において情報処理部10は、評価対象文章ごとに以下の処理を実行する。
図8は、調整前適合性評価値導出処理において、情報処理部10が、ある1つの評価対象文章について実行する処理の説明に利用する図である。図8を参照し、情報処理部10は、希望人物像ベクトルと、処理対象となる評価対象文章の第1適合性評価用ベクトルとに基づいて、これらの類似度(以下「第1類似度」という)を導出する処理を行って、第1類似度を導出する(図8の符号81)。第1類似度(および後述する第2類似度)は、多次元のベクトルの類似度を導出する技術(例えば、ベクトル同士の成す角度からコサイン類似度を導出する技術)により導出される。ここで第1適合性評価用ベクトルは、キーフレーズ抽出処理を施していない評価対象文章についてのベクトルである。従って、第1類似度は、評価対象文章と、希望人物像文章とが全体としてどの程度、類似しているかを示す指標値であると言うことができる。
更に情報処理部10は、希望人物像ベクトルと、処理対象となる評価対象文章の第2適合性評価用ベクトルとに基づいてこれらの類似度(以下「第2類似度」という)を導出する処理を行って、第2類似度を導出する(図8の符号J82)。ここで第2適合性評価用ベクトルは、キーフレーズ抽出処理を施した評価対象文章についてのベクトルである。上述した通り本実施形態に係るキーフレーズ抽出処理は、文章の冒頭に近い領域に出現するフレーズほど重要性が高いと判定される特性を持つアルゴリズムに基づく処理である。従って第2類似度は、評価対象文章と希望人物像文章とについて、評価対象文章の冒頭に近い領域に、希望人物像文章に記載された人材要件と適合するフレーズが記載されているほど高くなるように補正された類似度ということができる。次いで情報処理部10は、第1類似度と第2類似度との平均をとる処理を実行し(図8の符号J83)、その結果を調整前適合性評価値とする。
調整前適合性評価値導出処理において情報処理部10は、全ての評価対象文章について、希望人物像ベクトル、第1適合性評価用ベクトルおよび第2適合性評価用ベクトルに基づいて調整前適合性評価値を導出する。導出された調整前適合性評価値のそれぞれは、記憶部14に記憶される(図7の符号J711)。
調整前適合性評価値導出処理を実行した後、情報処理部10は、適合性評価値調整処理を実行する(図7の符号J712)。適合性評価値調整処理において情報処理部10は、評価対象文章のそれぞれについて、調整前適合性評価値を「0.0」~「100.0」の範囲内で値をとり、小数点第一位までで示された値へと変換することによって適合性評価値を導出する。調整前適合性評価値から適合性評価値への変換は、適合性評価値の意味と値がとり得る範囲とを踏まえ、適合性評価値の値が人間の直感と反しない値となるようにする(例えば、値が「50.0」のときに適合の度合いが半々となる)との観点の下で事前に生成された計算式を利用して行われる。。適合性評価値調整処理において情報処理部10は、全ての評価対象文章について適合性評価値を導出する。導出された適合性評価値のそれぞれは、記憶部14に記憶される(図7の符号J713)。
以上のようにして導出された適合性評価値は基本的には、評価対象文章と希望人物像文章との類似度を示している。そして評価対象文章と希望人物像文章との類似度は、希望人物像文章および評価対象文章の意義を踏まえると、評価対象文章により表される応募者の人物像と、組織が求める人物像とがどれだけ適合していると評価できるかを示していると言える。つまり適合性評価値は基本的には、評価対象文章により表される応募者の人物像と、組織が求める人物像とがどれだけ適合していると評価できるかを示す評価値である。
その上で適合性評価値は、第2類似度が反映された値であり、単に評価対象文章と希望人物像文章とが全体として似ているかどうかというだけでなく、希望人物像文章に記載された人材要件と適合する(意味的に近い)フレーズが、評価対象文章の冒頭に近い領域に記載されているほど、値が大きくなるように調整されている。適合性評価値がこのように調整されていることにより以下の効果を奏する。すなわち発明者らは、採用活動についての研究、分析を通して、評価対象文章の冒頭に近い領域に組織が求める人材要件と適合するフレーズが記載されているケース程、採用担当者による評価が高く、合格可能性が高いことを見出した。これを踏まえ、適合性評価値が上述の方法で調整されることにより、適合性評価値を、応募者の人物像と組織が求める人物像とが合格可能性を高め得る態様で適合しているかという実効性のある観点で導出された精度の高い値とすることができる。
なお本実施形態では、適合性評価値は、希望人物像文章に記載された人材要件と適合する(意味的に近い)フレーズが、評価対象文章の冒頭に近い領域に記載されているほど、値が大きくなるように調整されている。つまり評価対象文章における冒頭に近い領域が、特許請求の範囲の「特定の領域」に相当する。しかしながら例えば、組織のニーズ、その他の事情(例えば、評価対象文章のテーマがある特定のテーマのときには、評価対象文章の末尾に近い領域に希望人物像文章に記載された人材要件と適合するフレーズが記載されているほど、評価が高くなる(合格可能性が高くなる)といった事情)により、適合性評価値の上昇に寄与する領域(つまり「特定の領域」)を、末尾に近い領域や、中盤の領域等に変更する構成でもよい。この場合、フレーズの重要性が高いと判定される出現位置が本実施形態のものと異なるキーフレーズ抽出のアルゴリズム(或いはそのようにカスタマイズされたアルゴリズム)を用いてキーフレーズ抽出処理を実行すればよい。
また第1類似度と第2類似度との平均を用いて適合性評価値(厳密には調整前適合性評価値)を導出したが、平均以外の統計的手法(例えば加重平均)を用いて適合性評価値を導出する構成でもよい。また第2類似度を導出せずに(従って第2類似度を反映させずに)、第1類似度だけを用いて適合性評価値を導出する構成でもよい。
・特異性評価値導出処理
次に特異性評価値導出処理について説明する。図9は、特異性評価値導出処理の説明に利用する図である。図9で示すように適合性評価値導出処理において情報処理部10は、特異性評価用ベクトル導出処理を実行する(図9の符号J91)。特異性評価用ベクトル導出処理において情報処理部10は、記憶部14に記憶された処理用データのそれぞれについて(ただし処理用データに必要な前処理を更に施してもよい)、所定の言語モデルを使用してベクトル化し、特異性評価用ベクトルを生成する。使用する言語モデルは、希望人物像ベクトル導出処理において使用したモデルと同じあっても異なっていてもよい。特異性評価用ベクトル導出処理において情報処理部10は、全ての評価対象文章について特異性評価用ベクトルを導出する。特異性評価用ベクトルのそれぞれは、記憶部14に記憶される(図9の符号J92)。
特異性評価用ベクトルの導出後、情報処理部10は、調整前特異性評価値導出処理を実行する(図9の符号J93)。調整前特異性評価値導出処理において情報処理部10は、評価対象文章ごとに、処理対象の評価対象文章が全ての評価対象文章の集合においてどれだけ特異であるかを示す調整前特異性評価値を導出する。どれだけ特異であるかというのは、どれだけ外れていいるかという、外れ値である度合と言い換えることもできる。以下、ある1つの評価対象文章に係る特異性評価用ベクトルを処理対象として情報処理部10が実行する調整前特異性評価値導出処理について説明する。
本実施形態では情報処理部10は、異常検出アルゴリズムの1つである「Isolation Forest」を使用し、全ての特異性評価用ベクトルが配置されたベクトル空間において、処理対象の特異性評価用ベクトルが、全ての評価対象文章の集合からどれだけ外れているかを示す指標値を導出し、これを調整前特異性評価値とする。ただし調整前特異性評価値の導出にあたって使用するアルゴリズムは、「Isolation Forest」に限られない。また主成分分析(PCA)や、特異値分解(SVD)により次元削減を行ったベクトルを使用して調整前特異性評価値を導出する構成でもよい。調整前特異性評価値導出処理において情報処理部10は、全ての評価対象文章について調整前特異性評価値を導出する。調整前特異性評価値のそれぞれは、記憶部14に記憶される(図9の符号J94)。
調整前特異性評価値導出処理を実行した後、情報処理部10は、特異性評価値調整処理を実行する(図9の符号J95)。特異性評価値調整処理において情報処理部10は、評価対象文章のそれぞれについて、調整前特異性評価値を、「0.0」~「100.0」の範囲内で値をとり、小数点第一位まで示された値へと変換することによって特異性評価値を導出する。調整前特異性評価値から特異性評価値への値への変換は、特異性評価値の意味と値がとり得る範囲とを踏まえ、特異性評価値の値が人間の直感と反しない値となるようにするとの観点の下で事前に生成された計算式を利用して行われる。
特異性評価値調整処理において情報処理部10は、全ての評価対象文章について、調整前特異性評価値に基づいて特異性評価値を導出する。導出された特異性評価値のそれぞれは、記憶部14に記憶される(図9の符号J96)。
以上のようにして導出されたある評価対象文章についての特異性評価値は、その評価対象文章が他の評価対象文章と比較してどれだけ特異であると評価できるかを示す値(値が大きいほど、特異性が大きい)である。そして評価対象文章の内容には、それを記載した応募者の人物像が反映されることを鑑みると、特異性評価値は、応募者の集団において応募者がどれだけ特異であると推測されるかを示す指標値と言うことができる。
以上、文章特徴評価値導出処理、適合性評価値導出処理および特異性評価値導出処理について説明した。これらの処理が行われる結果、応募者のぞれぞれについて文章特徴評価値、適合性評価値および特異性評価値が導出されることになる。情報処理部10は、これら処理を実行した後、応募者ごとに、応募者IDおよび応募者氏名情報と、文章特徴評価値、適合性評価値および特異性評価値とが対応づけて記録された評価値データベースを記憶部14に記憶する。応募者IDとは応募者を一意に識別するための識別情報であり、応募者氏名情報とは応募者の氏名を示す情報である。これら情報は対象組織から提供される。
<情報提供シーン>
次に情報提供シーンにおける情報処理装置2の動作について説明する。情報提供シーンでは、分析シーンにより評価値データベースが記憶部14に記憶された状態となった後、ユーザの要請により処理が行われる。上述したように本実施形態では、端末3を使用する者を便宜的に「ユーザ」というが、情報提供シーンにおいてユーザは、対象組織の採用担当者や経営者等が想定される。
ユーザは、自身が使用する端末3のブラウザを立ち上げ、情報処理装置2の所定のURLへのアクセスを指示する。当該指示に応じて端末3の端末制御部12は、ブラウザの機能により当該所定のURLにアクセスする。情報処理装置2の情報処理部10は、当該所定のURLへのアクセスがあると、適切に認証を行った上、メイン画面を表示させるための描画ファイル(HTMLファイル等)を端末3に応答する。端末3の端末制御部12は、描画ファイルを受信し、描画ファイルに基づいてメイン画面を表示画面に表示する。
以下では情報処理装置2の情報処理部10から送信された描画ファイルに基づいて端末3の表示画面に表示された各種画面に対する操作の検出、各種画面へ入力された情報の取得、各種画面の動的な変更、その他の画面に関する各種処理は、CGI、JavaScript(登録商標)、Ajax、DHTML、その他の既存の技術を用いて適切に実行されるものとし、詳しい説明は行わない。また情報処理装置2の情報処理部10が描画ファイルを端末3に送信し、描画ファイルに基づく画面を端末3の表示画面に表示させることを、「情報処理部10が、端末3の端末制御部12に、○○画面を表示画面に表示させる」或いは単に「情報処理部10が○○画面を端末3の表示画面に表示する」、「情報処理部10が○○画面を表示する」のように表現することがある。
ユーザは、メイン画面(或いはメイン画面から遷移できる画面。以下同様)から、情報処理装置2から受けるサービスを選択できる。本実施形態では、サービスとして少なくとも「検索関連サービス」および「総合評価値関連サービス」が存在する。以下、各サービスが選択されたときの情報処理装置2の動作について端末3の動作と共に説明する。なお以下の説明において、文章特徴評価値、適合性評価値および特異性評価値を区別しない場合、「個別評価値」と表現する場合がある。また各個別評価値の単位を便宜的に「点」とする。
・検索関連サービス
検索関連サービスが選択されると情報処理装置2の情報処理部10は、端末3の表示画面に一覧表示画面20を表示する。図10は、一覧表示画面20の一例を示す図である。図10で示すように一覧表示画面20には、一覧テーブル21が表示される。一覧テーブル21は、応募者ごとにレコードが一覧表示されたレコードである。一覧テーブル21の1件のレコードには、応募者氏名情報および応募者IDのほか、文章特徴評価値、適合性評価値および特異性評価値が含まれている。ユーザは、ソートボタン22を利用して、レコードの何れかの項目の昇順或いは降順にレコードを並べ替えることができる。
以上のように本実施形態では、情報処理装置2は、文章特徴評価値、適合性評価値および特異性評価値を導出する機能を有している。ユーザは、各応募者について、情報処理装置2により導出された文章特徴評価値、適合性評価値および特異性評価値を参照することが可能である。この構成によれば、文章特徴評価値、適合性評価値および特異性評価値という評価対象文章の評価に関する客観的な情報が導出されるため、各ユーザがこれら情報を利用して評価対象文章を評価することにより、評価対象文章についての評価の揺らぎを抑制することが可能となる。その上で更に以下の効果を奏する。
すなわち上述したように発明者らは採用活動に関する研究、分析を通して、評価対象文章について統計的に把握可能な文章特徴が、選考の結果に影響を与えていることを見出した。なお、ある応募者が合格となった場合、選考においてその応募者が有用であると判断されたということであり、不合格の場合はその逆である。以上を踏まえ上記構成によれば、文章特徴評価値が導出されるため、ユーザ(採用担当者を含む)は、導出された文章特徴評価値を利用して、文章特徴から応募者の合格可能性がどれだけ高いと評価できるか、という有用な人材を採用するという点で有効な観点で評価対象文章を評価できる。
ここで組織が求める人物像と応募者とが適合しているほど、応募者が企業にとって有用であることは当然である。一方でユーザは、文章特徴評価値からは、文章特徴を鑑みてどれだけ合格可能性が高いと評価できるかという観点で評価対象文章を評価できるものの、組織が求める人物像と応募者とがどれだけ適合しているかということは評価できない。以上を踏まえ上記構成によれば、上述した文章特徴評価値に加えて適合性評価値が導出されるため、ユーザは、導出された適合性評価値を利用して、組織が求める人物像と評価対象文章により表される応募者とがどれだけ適合していると評価できるかという、有用な人材を採用するという点で有効な観点で評価対象文章を評価できる。
また組織においては、他人とは違う考え或いは他人とは違う物の見方をすることができる特異な人材が、組織内にイノベーションを起こし、組織に競争力をもたらすことがある。一方で、文章特徴評価値および適合性評価値からは、文章特徴を鑑みてどれだけ合格可能性が高いと評価できるか、および、組織が求める人物像と応募者とがどれだけ適合していると評価できるかという観点で評価対象文章を評価できるものの、応募者の集合において応募者がどれだけ特異であるかということは評価できない。以上を踏まえ上記構成によれば、上述した文章特徴評価値および適合性評価値に加えて特異性評価値が導出されるため、ユーザは、導出された特異性評価値を利用して、応募者の評価対象文章の集団において応募者の評価対象文章がどれだけ特異であると評価できるかを把握でき、さらにこれを通して、応募者の集団において応募者がどれだけ特異であると推測されるかという、有用な人材を採用するという点で有効な観点で評価対象文章を評価できる。
以上の通り上記構成によれば、組織の採用活動において、評価対象文章についての評価の揺らぎを抑制し、かつ、有用な人材を採用するという点で有効な複数の観点でユーザが評価対象文章を評価できるようになる。
またユーザは、一覧表示画面20を介して検索条件を指定して応募者の検索を指示することができる。具体的には当該指示に際してユーザは、一覧表示画面20の条件入力ボタン23を操作する。条件入力ボタン23が操作されると情報処理部10は、検索条件入力画面24をポップアップで表示する。図11は、検索条件入力画面24の一例を示す図である。図11で示すように検索条件入力画面24には、ラジオボタン25により4つの選択肢のうち1つの選択肢を選択できる構成となっている。
ここで本実施形態では、人物の類型(以下「人物類型」という)が複数、定義されると共に、人物類型のそれぞれについて、各個別評価値の範囲が定義される。以下、各個別評価値の範囲のことを「個別評価値範囲条件」という。また各人物類型には、対応する人物類型を端的に表す名称が定義されている。
本実施形態では「組織との適合性は低いものの優秀であり、個性が強い」という人物類型が定義され、この人物類型には「クリエイティブ人材」という名称が定義されると共に、この人物類型には「文章特徴評価値が70.0~100.0点、適合性評価値が0.0~40.0点、特異性評価値が60.0~100.0点」という個別評価値範囲条件が定められている。クリエイティブ人材の個別評価値範囲条件は、各個別評価値の意義と整合する条件である。
また本実施形態では「優秀であり、組織との適合性が高く、かつ個性も強い」という人物類型が定義され、この人物類型には「イノベーション人材」という名称が定義されると共に、この人物類型には「文章特徴評価値が70.0~100.0点、適合性評価値が80.0~100.0点、特異性評価値が70.0~100.0点」という個別評価値範囲条件が定められている。イノベーション人材の個別評価値範囲条件は、3つの個別評価値の意義と整合する。
また本実施形態では「優秀であり、組織との適合性が高く、かつ馴染みやすい」という人物類型が定義され、この人物類型には「マネジメント人材」という名称が定義されると共に、この人物類型には、「文章特徴評価値が70.0~100.0点、適合性評価値が80.0~100.0点、特異性評価値が0.0~40.0点」という個別評価値範囲条件が定められている。マネジメント人材の個別評価値範囲条件は、3つの個別評価値の意義と整合する。
図11の検索条件入力画面24において、1~3番目の選択肢はそれぞれ、クリエイティブ人材、イノベーション人材およびマネジメント人材となっており、何れかの人物類型が選択された場合、その人物類型について定義された個別評価値範囲条件を満たす応募者が検索されることになる。検索条件入力画面24において4番目の選択肢は、個別評価値範囲条件を明示的に指定するための選択肢である。図11で示すように4番目の選択肢に係るラジオボタン25に対応して、3つの個別評価値のそれぞれの範囲を入力する入力欄が形成されている。ユーザ、各入力欄に値を入力することによって、個別評価値範囲条件に係る各個別評価値の範囲を明示的に指定することができる。
ユーザは、ラジオボタン25を利用して1つの選択肢を選択し(4番目の選択肢を選択した場合には更に各入力欄に値を入力し)、検索開始を指示する検索開始ボタン26を操作する。検索開始ボタン26が操作されると情報処理部10は、個別評価値範囲条件を特定する。すなわち情報処理部10は、何れかの人物類型が選択されている場合には、選択された人物類型に対応する個別評価値範囲条件を特定し、4つ目の選択肢が選択されている場合には、指定された個別評価値範囲条件を特定する。次いで情報処理部10は、記憶部14に記憶された評価値データベースを参照し、特定した個別評価値範囲条件に合致するレコードを抽出する。つまり情報処理部10は、文章特徴評価値、適合性評価値および特異性評価値のそれぞれが、特定した個別評価値範囲条件の各個別評価値についての範囲内に属するレコードを抽出する。以下の説明では、評価値データベースのレコードを特に「評価値データベースレコード」という。
次いで情報処理部10は、抽出した評価値データベースレコードに基づいて一覧表示画面20(図10)の一覧テーブル21の内容を、抽出した評価値データベースレコードに対応するレコードが一覧表示された状態となるように更新する。
以上の通り本実施形態ではユーザは、各個別評価値が特定の範囲に属している応募者を抽出し認識することができる。特にユーザは、予め定義された人物類型ごとに、各個別評価値の内容から人物類型であると推測される応募者を抽出し、認識することができる。このため、ユーザにとって利便性が高く、また、個別評価値を有効に活用できる。ここでクリエイティブ人材の「組織との適合性は低いものの優秀であり、個性が強い」という評価は、画一的な観点からは分かり得ない評価であり、特に組織が求める人物像に応募者が適合するかどうかという観点だけから評価対象文章を考察したのでは分かり得ない評価である。一方で本実施形態によれば、異なる複数の観点で複数の個別評価値が導出されるため、上述のような多面的な観点から評価対象文章を評価して初めて分かり得る評価についても行うことができる。他の人物類型についても同様である。
なお本実施形態では、3つの人物類型を例示したが、人物類型は例示したものに限られないことは当然である。また、ユーザが人物類型およびその個別評価値範囲条件事前に設定できるようにしてもよい。
・総合評価値関連サービス
次に総合評価値関連サービスが選択された場合の情報処理装置2の動作について説明する。総合評価値関連サービスが選択されると情報処理装置2の情報処理部10は、端末3の表示画面に重み指定画面30を表示する。図12は、重み指定画面30の一例を示す図である。後に明らかになるように総合評価値関連サービスでは、3つの個別評価値の加重平均がとられることにより総合評価値が導出される。そして重み指定画面30は、総合評価値の導出に際して行われる加重平均において各個別評価値に付与する“重み”を指定する画面である。以下、総合評価値の導出に際して行われる加重平均において各個別評価値に付与する重みを特に「評価値重み」という。説明の便宜上、3つの評価値重みは、合計すると「1」になるように値が設定されるものとする。図12で示すように重み指定画面30には、ラジオボタン31により5つの選択肢のうち1つの選択肢を選択できる構成となっている。
ここで組織には、応募者の選考にあたって重視する希望が1つ以上あることが想定される。また、ある希望を重視した場合には応募者の評価はどうなるか、その希望とは別の希望を重視した場合には応募者の評価はどうなるかというように、異なる複数の希望について、各希望を重視したときにおける応募者の評価がどのようになるかシミュレーションしたいとするニーズがあると想定される。これを踏まえ本実施形態では、事前に複数の希望が定義される。以下、定義された希望を特に「組織希望」という。更に本実施形態では組織希望ごとに、加重平均によって導出される総合評価値が、組織希望を重視して応募者(厳密には応募者が記入した評価対象文章)を評価したときの指標値となるように評価値重みが定義されている。「総合評価値が、組織希望を重視して応募者を評価したときの指標値となるように評価値重みが定義されている」とは、換言すれば応募者が組織希望を満たしているほど、導出される総合評価値の値が大きくなるように評価値重みが調整されている、ということである。
本実施形態では「独自性のある人材を採用し、人材の多様性を確保したい」という組織希望(以下「第1組織希望」という)が用意されている。この第1組織希望については、文章特徴評価値に付与する評価値重みとして「0.2」、適合性評価値に付与する評価値重みとして「0.1」、特異性評価値に付与する評価値重みとして「0.7」が定義されている。これは各個別用価値の意義と整合する定義である。また本実施形態では「組織とのミスマッチを避けたい」という組織希望(以下「第2組織希望」という)が用意されている。この第2組織希望については、文章特徴評価値に付与する評価値重みとして「0.15」、適合性評価値に付与する評価値重みとして「0.8」、特異性評価値に付与する評価値重みとして「0.05」が定義されている。これは各個別用価値の意義と整合する定義である。また「過去の合格者と同じ傾向の人間を採用したい」という組織希望(以下「第3組織希望」という)が用意されている。この第3組織希望については、文章特徴評価値に付与する評価値重みとして「0.8」、適合性評価値に付与する評価値重みとして「0.1」、特異性評価値に付与する評価値重みとして「0.1」が定義されている。これは各個別用価値の意義と整合する定義である。
図12の重み指定画面30において、1~3番目の選択肢はそれぞれ、第1~第3組織希望となっており、何れかの組織希望が選択された場合、その組織希望について定義された評価値重みにより総合評価値が導出されることになる。
重み指定画面30において4番目の選択肢は、過去の選考の実績に基づいて調整された評価値重み(以下、特に「実績調整重み」という)である。本実施形態では過去の合格者の文章特徴評価値、適合性評価値および特異性評価値のそれぞれについて、合格に影響している度合いが分析される。そして各個別評価値についての実績調整重みは、当該度合の比に比例した値とされる。つまり実績調整重みは、過去の選考において文章特徴評価値、適合性評価値および特異性評価値が合格に影響している度合に準じた重みである。例えば分析の結果、文章特徴評価値、適合性評価値および特異性評価値がそれぞれ5:3:2の比で合格に影響していると分析されたとする。この場合、文章特徴評価値に付与される実績調整重み、適合性評価値に付与される実績調整重み、および、特異性評価値に付与される実績調整重みはそれぞれ、「0.5」、「0.3」および「0.2」とされる。上記分析は、モデルの機械学習という形で行われてもよい。この場合、モデルの学習には過去の合格者の個別評価値に関するデータを学習データとして使用される。なお実績調整重みは、過去の選考において特に評価が高かった応募者(合格者)の文章特徴評価値、適合性評価値および特異性評価値の比に準じた値としてもよい。
重み指定画面30において5番目の選択肢は、評価値重みを明示的に指定して総合評価値を導出させるときに指定される選択肢である。図12で示すように5番目の選択肢に係るラジオボタン31に対応して、3つの評価値重みのそれぞれの値を入力する入力欄が形成されている。ユーザは、各入力欄に値を入力することによって、評価値重みを明示的に指定することができる。
ユーザは、ラジオボタン31を利用して1つの選択肢を選択し(5番目の選択肢を選択した場合には更に各入力欄に値を入力し)、総合評価値の導出を指示する導出指示ボタン32を操作する。導出指示ボタン32が操作されると情報処理部10は、各評価値重みを特定する。すなわち情報処理部10は、何れかの組織希望が選択されている場合には、選択された組織希望に対応する各評価値重みを特定し、4つ目の選択肢が選択されている場合には、事前に定義された各実績値重みを特定し、5つ目の選択肢が選択されている場合には、指定された各評価値重みを特定する。次いで情報処理部10は、記憶部14に記憶された評価値データベースを参照し、応募者のそれぞれについて総合評価値を導出する。
例えばユーザにより第1組織希望が選択されていたとする。この場合、文章特徴評価値に付与する評価値重みは「0.2」、適合性評価値に付与する評価値重みは「0.1」、特異性評価値に付与する評価値重みは「0.7」である。この場合において、ある応募者について文章特徴評価値が「80.0点」、適合性評価値が「40.0点」および特異性評価値が「70.0点」であったとする。この場合、総合評価値は、「80.0×0.2+40.0×0.1+70.0×0.7=69.0」より「69.0点」となる。
次いで情報処理部10は、応募者のそれぞれの総合評価値に基づいて、総合評価値表示画面33を表示する。図13は総合評価値表示画面33の一例を示す図である。図13で示すように総合評価値表示画面33には総合評価値テーブル34が表示される。総合評価値テーブル34には応募者ごとにレコードが設けられ、各レコードには応募者ID、応募者氏名情報、総合評価値および3つの個別評価値が含まれている。初期状態の総合評価値テーブル34では、各レコードは、総合評価値の昇順で並べられる。ただしユーザは、ソートボタン35を利用して、レコードの何れかの項目の昇順或いは降順にレコードを並べ替えることができる。
以上のように本実施形態では、情報処理装置2の情報処理部10により総合評価値が導出される。総合評価値は、文章特徴評価値、適合性評価値および特異性評価値を加重平均したものであり、ユーザは、総合評価値という1つの値を利用して直感的かつ迅速に、文章特徴評価値、適合性評価値および特異性評価値に重みをつけた場合の評価を把握できる。更にユーザは、重み指定画面30において組織希望を選択した場合においては、総合評価値表示画面33を参照することにより、選択した組織希望を重視して応募者(評価対象文章)を評価したときの評価値を把握することができる。更にユーザは、重み指定画面30において実績調整重みを選択した場合には、過去の採用活動における実績を反映したときの評価値を把握することができる。更にユーザは、重み指定画面30において各評価値重みを明示的に指定した場合には、総合評価値表示画面33を参照することにより、指定した評価値重みで導出された総合評価値を各応募者について把握することができる。
以上、情報提供シーンにおける情報処理装置2の動作について、適宜、情報処理装置2の情報処理部10が表示する画面を例示して説明した。ただし各画面の態様は、例示した態様に限定されるものではない。例えば一覧表示画面20の一覧テーブル21および総合評価値表示画面33の総合評価値テーブル34の各レコードに、例示した情報以外の情報が含まれる構成でもよい。例えば各レコードに、応募者の年齢、性別、経歴などの応募者に関する付随情報(特にエントリーシートに記入された情報)が含まれる構成でもよい。この場合、各レコードに含める情報は、適宜、対象組織により提供を受けることになる。また例えば各レコードに評価対象文章を参照するためのリンク、或いは、評価対象文章のテキストデータそのものが含まれる構成でもよい。また一覧テーブル21および総合評価値テーブル34のレコードを例示した方法以外の方法で並び替えたり、検索が行えたりできる構成としてもよい。例えば応募者の氏名を対象としたキーワード検索、或いは、応募者の経歴などの応募者に関する付随情報を含める場合にはこの付随情報を対象としたキーワード検索が行える構成としてもよい。
また情報処理装置2は、個別評価値或いは総合評価値に関する情報を、画面(Webページ)により提供する構成であった。この点に関して画面以外の方法で、各種情報を提供する構成でもよい。一例として、各応募者についての個別評価値或いは総合評価値に関する情報を、CSV形式のデータまたはレポート形式のデータが記録されたファイルにより提供する構成でもよい。
次に、情報処理装置2による情報処理方法についてフローチャートを用いて説明する。図14は、情報処理装置2の主要な動作を示すフローチャートである。図14で示すように情報処理装置2の情報処理部10は、評価対象文章を取得する(ステップSA1)。次いで情報処理部10は、文章特徴評価値、適合性評価値および特異性評価値を導出する(ステップSA2)。
<入力特徴ベクトルに関する変形例>
次に入力特徴ベクトルに関する変形例について説明する。上述した実施形態では、入力特徴ベクトルに含まれる特徴量の種類は、図6で示す種類であったが、入力特徴ベクトルにこれ以外の種類の特徴量が含められていてもよい。例えば情報処理部10が、SPI総合検査、語学に関する試験、専門性に関する試験、その他の選考に際して行われる試験の結果に基づく特徴量を入力特徴ベクトルに含める構成でもよい。この構成によれば、文章特徴評価値に試験の結果を反映することができる。
また例えば、情報処理部10が、評価対象文章(或いはこれに基づいて生成されるデータ)をベクトル化してベクトルを導出し、導出したベクトルを入力特徴ベクトルに含める構成でもよい。この場合においてベクトルは、評価対象文章の分散表現に基づくベクトルであってもよく、評価対象文章に含まれる単語の分散表現に基づくベクトルであってもよい。また、この場合において情報処理部10が、異なるアルゴリズムで導出された複数のベクトルを入力特徴ベクトルに含める構成でもよい。この構成によれば、文章の全体的な特徴、傾向が反映されて文章特徴評価値が導出されるため、文章特徴評価値の精度を向上することが可能である。
また例えば情報処理部10が、入力特徴ベクトルの複数種類の特徴量(入力特徴ベクトルに、評価対象文章をベクトル化して導出したベクトルを含める場合には、このベクトルも対象となる)を対象として主成分分析および特異値分解を行って次元削減したベクトル(主成分分析の結果に基づくベクトル、および、特異値分解の結果に基づくベクトル)を導出し、導出したベクトルのそれぞれを入力特徴ベクトルに含める構成でもよい。その際、情報処理部10が主成分分析と特異値分解との何れか一方のみを行う構成でもよい。この構成によれば、入力特徴ベクトル自体の特徴が反映されて文章特徴評価値が導出されるため、文章特徴評価値の精度を向上することが可能である。
また例えば情報処理部10が、調整前適合性評価値或いはこれに基づく値を入力特徴ベクトルに含める構成でもよい。この構成によれば、文章特徴評価値に、適合性の度合いを反映することができる。また例えば情報処理部10が、調整前特異性評価値或いはこれに基づく値を入力特徴ベクトルに含める構成でもよい。この構成によれば、文章特徴評価値に、特異性の度合いを反映することができる。
この他、情報処理部10は、図6で例示した特徴量以外の特徴量であって、評価対象文章について統計的に把握可能な文章特徴の特徴量を入力特徴ベクトルに含めることができる。その際、特徴量を、評価対象文章を構成する文章または評価対象文章に含まれる文、単語或いは文字について統計的に把握可能な文章特徴の特徴量とすることができる。一例として、「評価対象文を構成する文章の長さ」を特徴量としてもよい。また図6で例示した特徴量の全てが入力特徴ベクトルに含まれている必要はない。例えば、特徴選択により、学習データのラベル(選考結果を示すラベル)との相関が弱いと結論された1つ以上の特徴量について入力特徴ベクトルに含めないようにしてもよい。
以上、本発明の一実施形態(変形例を含む)について説明したが、上記実施形態は、本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
例えば上述した実施形態では、情報処理装置2が記憶部14を備える構成であった。この点に関し、情報処理装置2と通信可能な他の装置に記憶部14が設けられ、情報処理装置2が適宜、他の装置にアクセスする構成でもよい。
また上述した実施形態では、情報処理装置2は、インターネットを含むグローバルなネットワークNに接続されたクラウドサーバであったが、情報処理装置2はクラウドサーバである必要はない。一例として、選考を行う組織のローカルネットワークに設けられたサーバ装置であってもよい。この場合、情報処理装置2は、ローカルネットワークに接続する端末3をクライアントとして各種サービスを提供する。
また情報処理部10が加重平均以外の方法(例えば単純な平均)で総合評価値を導出する構成でもよい。また総合評価値の態様(範囲や、小数点以下の有効桁数等)は上記実施形態で例示したものに限られない。また、評価値データベースの各レコードに、ユーザに指定された重みで計算した総合評価値が含まれる構成でもよい。