JP6442918B2 - 専門家検索装置、専門家検索方法および専門家検索プログラム - Google Patents

専門家検索装置、専門家検索方法および専門家検索プログラム Download PDF

Info

Publication number
JP6442918B2
JP6442918B2 JP2014168309A JP2014168309A JP6442918B2 JP 6442918 B2 JP6442918 B2 JP 6442918B2 JP 2014168309 A JP2014168309 A JP 2014168309A JP 2014168309 A JP2014168309 A JP 2014168309A JP 6442918 B2 JP6442918 B2 JP 6442918B2
Authority
JP
Japan
Prior art keywords
expert
document
keyword
search
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014168309A
Other languages
English (en)
Other versions
JP2016045620A (ja
Inventor
富士 秀
秀 富士
友樹 長瀬
友樹 長瀬
育昌 鄭
育昌 鄭
昌剛 角谷
昌剛 角谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014168309A priority Critical patent/JP6442918B2/ja
Priority to US14/800,011 priority patent/US10331674B2/en
Publication of JP2016045620A publication Critical patent/JP2016045620A/ja
Application granted granted Critical
Publication of JP6442918B2 publication Critical patent/JP6442918B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、専門家検索装置、専門家検索方法および専門家検索プログラムに関する。
企業、大学、官庁または研究機関等の組織では、様々な専門家が、同一のネットワークを利用して業務活動を行っている。組織の中で、例えば新規のプロジェクトを立ち上げる際には、組織内に分散した専門家の中から、プロジェクトの遂行に必要となる専門知識を有する専門家を効率的に集められることが望ましい。
そこで近年では、ネットワークを介して専門家を簡便に検索できる技術が開示されている。例えば特許文献1では、ユーザ端末から検索キーワードを指定した検索要求を受信したときに、検索キーワードを文書内に含む文書を文書記憶装置から検索する技術が開示されている。当該技術によれば、検索された文書内における検索キーワードの重要度スコアを決定し、検索された文書の登録者と重要度スコアとに基づいて、検索された文書の登録者の専門度スコアを計算する。この方法により、専門度スコアに基づいて登録ユーザをランキングすることができる。
特開2008−234550号公報 特開2006−268080号公報 特開2011−103059号公報
特許文献1に開示されている方法によれば、検索キーワードを含む文書を多数登録している人ほど専門性が高いと判断されてしまう。また、現在は検索キーワードに関連する業務に従事していない人であっても、過去の検索キーワードを含む文書の登録件数によっては、専門性が高い人として判断されてしまう。
本発明の1つの側面では、検索キーワードをもとに専門家を検索する精度を向上させることが可能な専門家検索装置、専門家検索方法および専門家検索プログラムを提供することを目的とする。
発明の一観点によれば、複数の年代を含む期間内に登録された複数の文書と、前記複数の文書の各々に関連する専門家の情報とを含む文書情報を格納する記憶部と、キーワードを受信する受信部と、前記キーワードが含まれる文書に関連する1以上の専門家を前記文書情報から検索する検索部と、前記1以上の専門家の各々について、前記1以上の専門家毎の全ての文書の登録件数に対する、前記キーワードに関連する文書の登録件数の比率と、前記年代が新しいほど値が大きくなる係数とに基づいて、年代毎のスコアを算出するスコア算出部と、前記年代毎のスコアを合算することにより、前記キーワードに関する専門家値を前記1以上の専門家毎に算出する専門家値算出部と、前記専門家値の比較に基づいて、前記1以上の専門家の順位付けを実行するソート部と、を有する専門家検索装置が提供される。
一実施態様によれば、検索キーワードをもとに専門家を検索する精度を向上させることが可能な専門家検索装置、専門家検索方法および専門家検索プログラムを提供することができる。
図1は、専門家検索システムの構成の一例を示す図である。 図2は、専門家検索装置のハードウェア構成の一例を示す図である。 図3は、実施例1における、計数部15の構成の一例を示す図である。 図4は、実施例1における、専門家検索装置による専門家検索方法の一例を示すフローチャートである。 図5は、文書DBの一例を示す図である。 図6は、S102における、キーワード含有文書および登録者を抽出する処理の一例を示すフローチャートである。 図7は、S103における、スコアを算出する処理の一例を示すフローチャートである。 図8は、S303における、nに対応する年代に登録された、全登録文書の件数の情報とキーワード含有文書の件数の情報とを取得する処理の一例を示すフローチャートである。 図9は、S305における、パラメータβの算出方法を示すフローチャートの一例である。 図10は、式(3)に基づいて年代毎に設定されたパラメータγの一例を示す図である。 図11は、S104における、専門家値を算出する処理の一例を示すフローチャートである。 図12は、スコアおよび専門家値の算出結果の一例を示す図である。 図13は、図12のデータに基づいて作成した各登録者の年代毎の登録文書件数を示す図である。 図14は、検索キーワードを含む文書数に基づいた専門家のランキング結果の一例を示す図である。 図15は、専門家値に基づいて作成した専門家のランキング結果の一例を示す図である。 図16は、実施例2における、専門家検索装置による専門家検索方法の一例を示すフローチャートである。 図17は、S102aにおける、キーワード含有文書を抽出する処理の一例を示すフローチャートである。 図18は、実施例3における、専門家検索装置による専門家検索方法の一例を示すフローチャートである。 図19は、S102bにおける、キーワード含有文書および登録者を抽出する処理の一例を示すフローチャートである。 図20は、S102cにおける、分野担当者を抽出する処理の一例を示すフローチャートである。 図21は、実施例4における、計数部15の構成の一例を示す図である。 図22は、実施例4における、専門家検索装置による専門家検索方法の一例を示すフローチャートである。 図23は、S303cにおける、キーワード含有文書の件数およびキーワード非含有文書の件数の情報を取得する処理の一例を示すフローチャートである。 図24は、S305cにおける、パラメータβの算出方法を示すフローチャートの一例である。 図25は、ウェブアプリケーションを用いた専門家検索サービスの一例を示す図である。
以下、本発明の実施形態について、図1から図25を参照して具体的に説明する。
(実施例1)
図1は、専門家検索システムの一例を示す図である。図1に示すように、専門家検索システムは、専門家検索装置10と端末装置30とを有している。専門家検索装置10と端末装置30とは、インターネット等のネットワーク50を介して相互に通信可能に接続されている。
専門家検索装置10は、文書が登録された文書データベース(文書DB)を用いて、特定の分野に関する専門家を検索する装置である。ここで専門家とは、専門分野の知識およびスキルを有する人材であり、企業、大学、官庁または研究機関等の組織において、当該専門分野のプロジェクトの立ち上げおよび遂行に力を発揮できる人的資源である。例えば企業の構成員は、専門の分野の業務に直接携わる分野担当者と、当該分野の業務を管理する分野管理者とを含む。本実施形態における専門家検索装置10は、検索キーワードをもとに文書DBを検索することにより、両者を抽出することができる。なお、文書DBは、文書情報の一例である。専門家検索装置10は、例えばサーバ、汎用コンピュータ、またはパーソナルコンピュータ(PC)等によって実現される。専門家検索装置10が実行する処理の方法については後述する。
端末装置30は、例えば専門家を検索するために専門家検索装置10を利用するユーザが所有する端末であり、例えばスマートフォン、携帯電話、ノートPC(Personal Computer)、デスクトップPC、またはタブレット端末等である。また、文書とは、例えば資料、論文、メール文書などのテキスト情報、写真などの静止画、および動画を含む画像情報、または音声情報である。
次に、専門家検索装置10のハードウェア構成について説明する。
図2は、専門家検索装置10のハードウェア構成の一例を示す図である。図2に示すように、専門家検索装置10は、CPU(Central Processing Unit)61、ROM(Read Only Memory)62、RAM(Random Access Memory)63、ストレージ装置64、ネットワークインタフェース65、表示装置66、及び可搬型記憶媒体用ドライブ67等を備えている。
専門家検索装置10の構成各部は、バス68に接続されている。ストレージ装置64は、例えばHDD(Hard Disk Drive)である。専門家検索装置10では、ROM62あるいはストレージ装置64に格納されているプログラム(専門家検索プログラムを含む)、或いは可搬型記憶媒体用ドライブ66が可搬型記憶媒体69から読み取ったプログラム(専門家検索プログラムを含む)をCPU61等のプロセッサが実行することにより、専門家検索装置10の機能が実現される。当該プログラムは、RAM63にロードされ、CPU61等のプロセッサに実行されてもよい。表示装置66は、例えば液晶ディスプレイ、プラズマディスプレイ、有機ELディスプレイまたは電子ペーパー等である。
図1に戻り、専門家検索装置10を構成する各部の機能について説明する。
図1に示すように、専門家検索装置10は、第1記憶部11と、第2記憶部12と、受信部13と、検索部14と、計数部15と、スコア算出部16と、専門家値算出部17と、専門家ソート部18と、送信部19と、出力部20とを備えている。
第1記憶部11は、文書DBを用いて特定の分野に関する専門家を検索するための専門家検索プログラムを記憶することができる。第1記憶部11は、例えば図2のROM62、ストレージ装置64、可搬型記憶媒体用ドライブ67あるいは可搬型記憶媒体69に対応する。
第2記憶部12は、専門家検索装置10内で行われる各処理に用いる各種情報を記憶するためのデータベース(DB;Data Base)として用いられる。例えば、文書DBは、第2記憶部12に格納される。第2記憶部12は、例えば図2のROM62、RAM63、ストレージ装置64、可搬型記憶媒体用ドライブ67あるいは可搬型記憶媒体69に対応する。
受信部13は、端末装置30から送信された、文字列の情報を含む検索キーワードを受信する。受信部13は、端末装置30と相互に通信可能に接続されており、例えば図2のネットワークインタフェース65によって実現される。
検索部14は、受信部13が受信した検索キーワードを用いて、第2記憶部12に格納されている文書DBを検索する。文書DBを検索することにより、検索部14は、検索キーワードが含まれている全ての文書を抽出することができる。また、検索部14は、抽出した全ての文書の中から、それぞれの文書を登録した登録者を抽出することができる。なお、以降の本実施形態の説明では、前提として、登録者と文書の責任者とが同一であり、文書の責任者が当該文書の作成者を含むものとして説明する。
計数部15は、検索部14によって抽出された登録者の各々について、当該登録者によって登録された全ての文書の件数を年代毎にカウントすることができる。また、計数部15は、検索部14によって抽出された登録者の各々について、当該登録者によって登録された検索キーワードに関連する文書の件数を年代毎にカウントすることができる。
図3は、実施例1における、計数部15の構成の一例を示す図である。図3に示すように、計数部15は、年代別計数部21とキーワード含有文書計数部22とを含む。年代別計数部21は、ある登録者が登録した文書の件数を年代毎にカウントする機能を有する。一方、キーワード含有文書計数部22は、検索キーワードが含まれている文書の件数を年代毎にカウントする機能を有する。年代別計数部21およびキーワード含有文書計数部22が行う処理の詳細については後述する。以降では、検索キーワードが含まれている文書を、キーワード含有文書と呼称する。
スコア算出部16は、登録者によって登録された全ての文書の件数の情報と、当該登録者によって登録された検索キーワードを含む文書の件数の情報と、年代が新しくなるほど値が大きくなる係数とに基づいて、専門家値を算出するために用いられる年代毎のスコアを算出する。ここで、専門家値とは、特定の分野に関する専門性の高さを示す指標であり、登録者毎に算出される値である。スコアの算出方法については後述する。スコア算出部16は、例えば図2のCPU61あるいはMPU等のプロセッサによって実現される。
専門家値算出部17は、スコア算出部16によって年代毎に算出されたスコアを合算することにより、検索キーワードに関する専門家値を登録者毎に算出する。専門家値の算出方法については後述する。専門家値算出部17は、例えば図2のCPU61あるいはMPU等のプロセッサによって実現される。
専門家ソート部18は、スコア算出部16によって算出された専門家値をソートし、登録者の順位付けを実行する。そして専門家ソート部18は、専門家の順位付けの結果であるランキング結果を示すリストを生成する。専門家ソート部18は、例えば図2のCPU61あるいはMPU等のプロセッサによって実現される。
送信部19は、専門家ソート部18によって生成された専門家の検索結果を、ネットワーク50に向けて送信する機能を有している。端末装置30は、ネットワーク50を介して専門家検索装置10から送信されたリストを、検索結果として受信する。
出力部20は、図2の表示装置66に対応するハードウェア装置であり、専門家ソート部18によって生成された専門家のリストを出力することができる。
次に、専門家検索装置10による専門家検索方法について説明する。
図4は、専門家検索装置による専門家検索方法の一例を示すフローチャートである。
まず、受信部13は、端末装置30によって入力された検索キーワードの情報を受信する(S101)。検索キーワードは、端末装置30のユーザが検索しようとしている専門家の専門分野に関するキーワードである。例えば、ユーザがクラウドコンピューティングの専門家を検索する場合、ユーザから例えば「クラウド」または「クラウドコンピューティング」等の語が端末装置30に入力される。そして受信部13は、これらの語を検索キーワードとして受信することとなる。
続いて、検索部14は、検索キーワードを用いて第2記憶部12に格納されている文書DBを検索し、検索キーワードが含まれている文書と、当該文書の全ての登録者を抽出する(S102)。なお、文書DBを検索した結果、検索キーワードが含まれている文書が文書DBに存在しないことが判明した場合は、専門家を検索する処理を終了する。
図5は、文書DBの一例を示す図である。図5に示すように、文書DBには、文書を一意に識別するための番号(No.)と、文書を登録した登録者と、登録日と、文書名とが対応付けられて登録されている。文書が対応する年代は、文書DBの登録日の欄に格納された情報に基づいて特定することができる。例えば、No.が5145の文書は、登録日の欄によれば登録日が2013年12月23日(図5では2013/12/23と表記)である。よって、対応する年代を2013年と特定することができる。
以下、S102の処理の詳細について説明する。
図6は、S102における、キーワード含有文書および登録者を抽出する処理の一例を示すフローチャートである。S102では、キーワード含有文書およびキーワード含有文書の登録者を、文書DBの先頭行から順次検索する処理を実行する。
まず、検索部14は、文書DBの1行目から検索を行うため、Lの値を初期設定し、Lに1を格納する(S201)。
続いて、検索部14は、文書DBを検索し、文書DBにL行目が存在するか否かを判定する(S202)。文書DBにL行目が存在しない場合(S202否定)、文書DBの全ての行の検索が終了したものと判定し、S103に移る。一方、文書DBにL行目が存在する場合(S202肯定)、検索部14は、文書DBのL行目に登録されている文書を参照し、文書中に検索キーワードが含まれているか否かを判定する(S203)。S203では、検索部14は、文書DB中の、文書を一意に識別するための番号に紐づけられて第2記憶部12に格納されている文書(文書ファイル)を参照して、文書中の検索キーワードを検索する。なお、検索部14は、文書ファイルを参照するのではなく、文書DBの文書名の項目に登録されている文書名を参照して、文書名の中の検索キーワードを検索してもよい。
L行目の文書中に検索キーワードが含まれていない場合(S203否定)、検索部14は、文書DBのL行目の文書に検索キーワードが含まれていないものと判定する。そこで、検索部14は、文書DBの次の行を検索するため、Lの値をカウントアップし、Lに1を加算した値を新たなLの値とする(S206)。S206の処理の後、S202に戻り、検索部14は、S202以降の処理を再び実行する。
一方、L行目の文書中に検索キーワードが含まれている場合(S203肯定)、検索部14は、L行目の文書をキーワード含有文書として抽出する(S204)。そして、検索部14は、L行目の文書の登録者を抽出する(S205)。その後、Lの値をカウントアップするS206の処理を経て、S202に戻る。そして、検索部14は、文書DBの新たなL行目を検索するため、S202以降の処理を再び実行する。
やがて、文書DBの全ての行の検索が終了すると、S202においてS202否定と判定され、S103に移る。これによりS102の処理が完了する。
図5を参照しながら、S102の処理結果の一例について説明する。例えば、受信部13が検索キーワードとして「クラウド」を受信したものとする。検索部14は、検索キーワードとして受信された「クラウド」をもとに図5の文書DBを検索する。その結果、文書DBに登録されている文書の中から、文書No.が4332,4506,4866,4867,5022および5145の文書が順次抽出される。
そして、上述の文書が抽出された場合、図6に示す各処理を経て、文書No.が4866,4867,5145の文書を登録した登録者である「鈴木」と、文書No.が5022の文書を登録した登録者である「井上」と、文書No.が4506の文書を登録した登録者である「橋本」と、文書No.が4332の文書を登録した登録者である「中村」とが抽出される。
以上のようにして、検索部14は、文書DBから検索キーワードが含まれている文書と、当該文書の登録者を全て抽出することができる。
以降の処理では、年代を「年」と同義と見做して説明する。一方、例えば1年の上半期および下半期をそれぞれ一つの年代として定義する、あるいは複数の年をまとめて一つの年代として定義する等、他の方法で年代を定義することもできる。
図4に戻り、スコア算出部16は、抽出された登録者の各々について、年代毎にスコアを算出する(S103)。以下、S103の処理の詳細について説明する。
図7は、S103における、スコアを算出する処理の一例を示すフローチャートである。
S103では、まず、スコア算出部16は、S102で抽出された全ての登録者のうち、未選択の一名を選択する(S301)。
続いて、スコア算出部16は、文書DBに格納されている文書のうち、最も古い文書が登録された年の数値を変数nに格納する(S302)。ここで、変数nは、スコアを算出する処理の対象の年代を示す変数である。例えば、2006は西暦2006年に対応する年代IDであり、本実施形態では、西暦X年の年代IDをXと定義している。最も古い文書が登録された年は、最も古い文書から順番に文書DBのNo.が付与されている場合、すなわち、文書DBの行が登録順である場合は、文書DBの先頭行の文書の登録日から特定することができる。一方、最も古い文書から順番に文書DBのNo.が付与されていない場合は、図6に示すS102の処理において、文書DBの全ての行を検索することになるため、当該検索が終了した際に、検索した全ての行の中で登録日が最も古い文書に基づいて特定することができる。
S302の処理の後、スコア算出部16は、文書DBを参照し、S301で選択した登録者に関する、nに対応する年代に登録された全ての登録文書の件数の情報と、キーワード含有文書の件数の情報とを取得する(S303)。以降では、ある年代に登録された全ての登録文書を全登録文書と呼称する。例えばn=2006の場合、スコア算出部16は、S301で選択した登録者に関する、2006年の全登録文書の件数の情報と、キーワード含有文書の件数の情報とを取得する。
以下、S303の処理の詳細について説明する。
図8は、S303における、nに対応する年代に登録された、全登録文書の件数の情報とキーワード含有文書の件数の情報とを取得する処理の一例を示すフローチャートである。
S303では、まず、検索部14は、文書DBの1行目から検索を行うため、Lの値を初期設定し、Lに1を格納する(S401)。
続いて、検索部14は、文書DBを検索し、文書DBにL行目が存在するか否かを判定する(S402)。文書DBにL行目が存在する場合(S402肯定)、検索部14は、文書DBのL行目に登録されている文書を参照し、L行目の文書の登録者が、S102において抽出された登録者の中に含まれているか否かを判定する(S403)。
L行目の文書の登録者が、S102において抽出された登録者に含まれていない場合(S403否定)、検索部14は、文書DBの次の行を検索するため、Lの値をカウントアップし、Lに1を加算した値を新たなLの値とする(S404)。その後、S402に戻り、S402以降の処理を再び実行する。一方、L行目の文書の登録者が、S102において抽出された登録者の中に含まれている場合(S403肯定)、計数部15は、L行目の文書を、nに対応する年代に登録された登録文書としてカウントする(S405)。具体的には、nに対応する年代に登録された登録文書の件数を示す変数を設定して初期値として零を格納する。そして、S403肯定と判定される度に変数に1を加算していくことにより、nに対応する年代に登録された登録文書の件数をカウントしていく。S303の処理が終了すると、nに対応する年代に登録された、全登録文書の件数の情報を取得することができる。
S405の処理の後、検索部14は、L行目の文書中に検索キーワードが含まれているか否かを判定する(S406)。L行目の文書中に検索キーワードが含まれていない場合(S406否定)、Lの値をカウントアップするS404の処理を経てS402に戻り、S402以降の処理を再び実行する。一方、L行目の文書中に検索キーワードが含まれている場合(S406肯定)、計数部15は、L行目の文書をキーワード含有文書としてカウントする(S407)。具体的には、nに対応する年代に登録されたキーワード含有文書の件数を示す変数を設定して初期値として零を格納する。そして、S406肯定と判定される度に変数に1を加算していくことにより、nに対応する年代に登録された登録文書の件数をカウントしていく。S303の処理が終了すると、nに対応する年代に登録された、キーワード含有文書の件数の情報を取得することができる。
S407の処理の後、スコア算出部16は、Lの値をカウントアップするS404の処理を経て、S402に戻る。そして、スコア算出部16は、文書DBの新たなL行目を参照するため、S402以降の処理を再び実行する。
やがて、文書DBの全ての行についての処理が終了すると、S402において文書DBにL行目が存在しないと判定され(S402否定)、S304に移る。これによりS303の処理が完了する。
続いて、スコア算出部16は、キーワード含有文書の件数の対数値からなるパラメータαを算出する(S304)。S304では、例えば以下の式(1)を用いて年代IDがnの年代におけるパラメータαを算出する。
式(1):
Figure 0006442918
例えば、年代IDがnの年代における、ある登録者のキーワード含有文書の件数が7件である場合、式(1)のdfに7を代入することにより、α=3と算出することができる。式(1)に示すように、パラメータαは、キーワード含有文書の件数が大きいほど値が大きくなるパラメータである。キーワード含有文書の件数の対数を算出することにより、登録者間でキーワード含有文書の件数が異なった場合にαの差が広がるため、αを用いて算出する専門家値の差を広げることができる。そのため、専門家値に基づいて、登録者間の専門性をより容易に比較することができる。
続いて、スコア算出部16は、全登録文書の件数に対するキーワード含有文書の件数の比率からなるパラメータβを算出する(S305)。
ここで、パラメータβの算出方法について説明する。
図9は、S305における、パラメータβの算出方法を示すフローチャートの一例である。
S305では、まず、スコア算出部16は、S303で取得したキーワード含有件数の値が零か否かを判定する(S501)。キーワード含有件数の値が零である場合(S501肯定)、当該年代におけるβの値をβ=0とする(S502)。一方、キーワード含有件数の値が零でない場合(S501否定)、スコア算出部16は、例えば以下の式(2)を用いて、年代IDがnにおけるパラメータβを算出する(S503)。
式(2):
Figure 0006442918
例えば、nの年代における、ある登録者の全登録文書の件数が9件であり、キーワード含有文書の件数が4件である場合、式(2)のDに9を代入し、dfに4を代入することにより、β=0.5と算出することができる。
式(2)に示すように、パラメータβは、ある年代においてキーワード含有文書を登録した文書の比率が高いほど値が大きくなるパラメータである。ところが、キーワード含有文書の件数の値が零の場合に式(2)を用いてβを算出すると、β=1となり、キーワード含有文書が全く抽出されていないにも関わらず、キーワード含有文書が抽出された場合よりもβの値が大きくなってしまうことがある。そこで、S502に示すように、キーワード含有文書の件数の値が零の場合にはβ=0とすることにより、上述の不具合を回避することができる。
以上のようにして、スコア算出部16はパラメータβを算出する。
図7に戻り、S305の処理の後、スコア算出部16は、各年代に対応するパラメータγを第2記憶部12から読み出す。γは、年代の新しさを示す指標であり、年代毎に予め設定され、第2記憶部12に格納されている。なお、年代毎のγの値は、nの最大値である最新の年代の年代IDであるmと、算出対象の年代の年代IDであるnとの差であるm−nに基づいて、例えば式(3)によって算出することができる。
式(3):
Figure 0006442918
mの値は、最も古い文書から順番に文書DBのNo.が付与されている場合、すなわち、文書DBの行が登録順である場合は、文書DBの最終行の文書の登録日から特定することができる。一方、最も古い文書から順番に文書DBのNo.が付与されていない場合は、図6に示すS102の処理において、文書DBの全ての行を検索することになるため、当該検索が終了した際に、検索した全ての行の中で登録日が最も新しい文書に基づいて特定することができる。
一例として、2006年におけるパラメータγを算出する。2006年に対応する年代IDは2006であり、最新の年代を2013年とすると、m=2013である。よって、式(3)のmに2013を代入し、nに2006をそれぞれ代入してパラメータγを計算すると、γ≒0.77と算出することができる。
図10は、式(3)に基づいて年代毎に設定されたパラメータγの一例を示す図である。γ欄には、小数第2位までのγの値が表示されている。図10に示すように、パラメータγは、年代が新しいほど値が大きくなる係数である。パラメータαと同様に、対数を用いてパラメータγを算出することにより、年代毎のγの値の差を広げることができる。
図7に戻り、スコア算出部16は、S304で算出したパラメータαと、S305で算出したパラメータβと、第2記憶部12から読み出したパラメータγとを用いて、nの年代におけるスコアを算出する(S306)。
式(4):
Figure 0006442918
式(4)に示すように、スコアは、全登録文書の件数に対するキーワード含有文書の件数の比率(パラメータβ)と年代の新しさを示す指標(パラメータγ)とを乗算し、乗算により得られた値に、キーワード含有文書の件数の対数(パラメータα)を重み付けすることにより算出される。
続いて、スコア算出部16は、変数nに1を加算する(S307)。例えば、変数nに2006が格納されている場合、nに1を加算すると、新たにn=2007と設定され、処理の対象が2006年の1年後の年代である2007年に移ることとなる。
続いて、スコア算出部16は、新たに設定された変数nがmよりも大きいか否かを判定する(S308)。変数nがmよりも大きいと判定されなかった場合(S308否定)、S301で選択された登録者に関する全ての年代のスコアが算出されていないと判定され、S303に移る。そして、スコア算出部16は、S303以降の処理を再び実行する。一方、変数nがmよりも大きいと判定された場合(S308肯定)、年代IDの最大値mを超えたため、S301で選択された登録者に関する全ての年代のスコアが算出されたと判定される。そして、S309に移る。
S309において、スコア算出部16は、S102で抽出された全ての登録者を選択したか否かを判定する。全ての登録者を選択していないと判定された場合(S309否定)、全ての登録者の年代毎のスコアが算出されていないと判定され、S301に移る。そして、S301以降の処理を再び実行する。一方、全ての登録者を選択したと判定された場合(S309肯定)、全ての登録者の年代毎のスコアが算出されたと判定され、S104に移る。これと同時に、スコアを算出する処理が終了する。
図4に戻り、S104において、専門家値算出部17は、S102で抽出された登録者毎に専門家値を算出する。S104では、登録者毎に、S103で算出した各年代のスコアを全て合算することにより、専門家値を算出することができる。以下、S104の処理の具体例について説明する。
図11は、S104における、専門家値を算出する処理の一例を示すフローチャートである。
S104では、まず、専門家値算出部17は、S102で抽出された全ての登録者のうち、未選択の一名を選択する(S601)。
続いて、専門家値算出部17は、文書DBに格納されている文書のうち、最も古い文書が登録された年の数値を変数nに格納する(S602)。S602の処理は図7のS302の処理と略同様であるので、詳細な説明は省略する。
続いて、専門家値算出部17は、変数Xの値を初期化するため、変数Xに零を格納する(S603)。以降では、専門家値を算出するために変数Xを用いる。
続いて、専門家値算出部17は、S601で選択された登録者に対応する、年代nにおけるスコアを変数Xに加算する(S604)。S604では、S103で算出した年代nにおけるスコアを変数Xに加算することによって、変数Xに格納されている値を更新する。
続いて、専門家値算出部17は、変数nに1を加算する(S605)。
続いて、専門家値算出部17は、新たに設定された変数nがmよりも大きいか否かを判定する(S606)。変数nがmよりも大きいと判定されなかった場合(S606否定)、変数Xを更新する処理が完了していないと判定され、S604に戻る。そして、専門家値算出部17は、S604以降の処理を再び実行する。一方、変数nがmよりも大きいと判定された場合(S606肯定)、年代IDの最大値mを超えたため、変数Xを更新する処理が完了したと判定される。すなわち、この時点で、S601で選択された登録者に対応する各年代のスコアが全て合算され、合算された値が変数Xに格納されたこととなる。そして、専門家値算出部17は、変数Xに格納されている値を、S601で選択された登録者の専門家値として決定する(S607)。
続いて、専門家値算出部17は、S102で抽出された全ての登録者を選択したか否かを判定する(S608)。全ての登録者を選択していないと判定された場合(S608否定)、全ての登録者の専門家値が算出されていないと判定され、S601に移る。そして、S601以降の処理を再び実行する。一方、全ての登録者を選択したと判定された場合(S608肯定)、全ての登録者の専門家値が算出されたと判定され、S105に移る。これにより、各登録者の専門家値を算出する処理が終了する。
文書DBに格納されている文書のうち、最も古い文書が登録された年が2006年である場合、S104の処理の中で算出した専門家値は、例えば以下の式(5)で表すことができる。
式(5):
Figure 0006442918
式(5)に示すように、専門家値算出部17は、最も古い文書が登録された年から最新の年までの各年代について算出したスコアα×β×γを全て合算することによって、専門家値を算出する。この式を用いることにより、限られた年代だけ局所的に高いスコアとなる登録者よりも、一定のスコアを長い年代に渡って維持している登録者の方が、より高い専門家値を得やすくなる。
図12は、スコアおよび専門家値の算出結果の一例を示す図である。図12では、キーワード含有文書の件数を「KW頻度」と表記している。また、全登録文書の件数を「全体頻度」と表記している。S102で抽出された登録者は鈴木、橋本、中村、井上の4名である。本実施例において、鈴木は2006年から現在まで、検索キーワードに関する業務の管理を継続している分野管理者であると仮定する。橋本は、2010年に別の分野の職場に異動した分野担当者であると仮定する。中村は、少なくとも2006年から現在まで、検索キーワードに関する業務の担当を継続している分野担当者であると仮定する。井上は2009年に入社した分野担当者であり、検索キーワードに関する業務の担当を現在まで継続している分野担当者であると仮定する。図12に示す年代毎のKW頻度および全体頻度に基づいて各登録者の専門家値を算出すると、鈴木の専門家値は6.57、橋本の専門家値は9.47、中村の専門家値は13.49、鈴木の専門家値は9.61と算出される。なお、これらの各値は、式(5)に基づいて算出された値の小数第3位を四捨五入することによって算出した値である。
ここで、S102で抽出された登録者によって登録された文書の件数の推移について説明する。
図13は、図12のデータに基づいて作成した各登録者の年代毎の登録文書件数を示す図である。図13(a)は鈴木、図13(b)は橋本、図13(c)は中村、図13(d)は井上の登録文書件数のデータをそれぞれ示している。図13の中の棒グラフにおいて、斜線で示していない部分はキーワード含有文書、斜線で示している部分は、キーワード含有文書以外の文書を示している。
図13(a)は、鈴木の登録文書件数のデータである。鈴木は分野管理者であるため、全ての年代において登録文書の件数が他の3名の登録者よりも多い傾向にある。また、2010年以前は、キーワード含有文書の登録件数は0件または1件と低く、2011年以降における全登録文書の件数に対するキーワード含有文書の件数の比率が2010年以前よりも増加していることがわかる。
図13(b)は、橋本の登録文書件数のデータである。橋本は、全ての年代において分野管理者である鈴木よりも登録文書の件数が低い傾向にある。また、2010年以降において、上述のキーワード含有文書の件数の比率が激減している。これは、2010年に別の分野の職場に異動したためである。
図13(c)は、中村の登録文書件数のデータである。中村も橋本と同様に、全ての年代において分野管理者である鈴木よりも登録文書の件数が低い傾向にある。また、中村は全ての年代において、上述のキーワード含有文書の件数の割合は常に50%以上を維持していることがわかる。
図13(d)は、井上の登録文書件数のデータである。井上も、橋本および中村と同様に、全ての年代において分野管理者である鈴木よりも登録文書の件数が低い傾向にある。また、井上は、2008年以前は文書の登録を行っていない。これは、井上が2009年以前は入社していないためである。
図4に戻り、専門家ソート部18は、S104で算出した専門家値に基づいて登録者をソートする(S105)。専門家値に基づいて登録者をソートすると、検索キーワードに関連する分野に関する専門家を専門性が高い順序で並べたランキング結果を得ることができる。ここで、専門家値を用いずに専門家のランキングを行うと、以下のようになる。
図14は、検索キーワードを含む文書数に基づいた専門家のランキング結果の一例を示す図である。前述の通り、検索キーワードに関連する業務を管理する分野管理者は、データベースに登録する文書の件数が多くなる傾向がある。このため、検索キーワードを含む文書数に基づいて順位付けを行うと、図14に示すように、検索キーワードについての専門性の高さに関わらず、分野管理者が上位にランキングされることがある。また、専門家の検索結果を表示する表示装置において、画面上の表示範囲に制限がある場合、すなわち、画面表示範囲内の一端からそれに対向する他端に向けて、上位から下位の方向に向かう順序であるランク昇順によりランキングを行った場合、図14に示すように、検索キーワードについての専門家である分野担当者が下位にランキングされ、画面表示範囲から外れてしまうことがある。
図15は、専門家値に基づいて作成した専門家のランキング結果の一例を示す図である。図15に示すように、画面表示範囲内に入っている登録者は、中村、橋本、井上の3名である。そして、全ての年代に渡って検索キーワードに関する業務の担当を継続している中村が最上位にランキングされている。なお、画面表示範囲内に入っている登録者は、いずれも分野担当者である。
さらに、図15を参照すると、2010年以前に当該業務を担当していた橋本よりも、2009年以降継続して当該業務を担当している井上の方がより上位にランキングされていることがわかる。これは、式(5)を用いたことにより、当該業務を担当していた時期が新しい登録者ほど専門家値が高くなったことを示している。
一方、図14の検索キーワードの頻度に基づいたランキングで最上位にランキングされた分野管理者の鈴木は、下位にランキングされ、画面表示範囲から外れている。これは、キーワード含有文書の件数の比率が50%を超える期間が橋本、中村および井上よりも短いことが、ランキングに影響したことを示している。
図4に戻り、S105の後、送信部19は、検索キーワードを送信した端末装置30にソート結果を送信する(S106)。これにより、検索要求元である端末装置30のユーザは、検索キーワードに関連する専門家の検索結果を得ることができる。
以上のようにして、専門家検索装置10は、特定の分野に関する専門家を検索することができる。
一般に、検索キーワードに関する業務の担当を継続している期間が長いほど、より高い専門性を有していることが多い。また、当該業務の担当を継続している時期が現在に近いほど最新の専門知識を有している可能性が高くなるため、より高い専門性を有していることが多い。
本実施形態によれば、専門家値を算出する際の基礎となる各年代のスコアには、全登録文書の件数に対するキーワード含有文書の件数の比率がパラメータとして含まれている。そして、専門家値の算出は、年代毎にスコアを算出した後、各年代のスコアを全て合算することにより行われる。この方法によれば、年代毎のキーワード含有文書の件数の比率と、キーワードに関連する業務に従事している期間の長さが専門家値に反映されるため、検索キーワードに関する業務の担当を継続している期間が長い登録者ほど、より高い専門家値を得やすくなる。これにより、専門家の検索において、検索キーワードに関する専門性が高い分野担当者を漏らすことなく抽出することが可能となる。
さらに、各年代のスコアは、年代の新しさを示す指標γもパラメータとして含む。この方法によれば、キーワードに関連する業務に従事している時期も専門家値に反映されるため、キーワード含有文書の件数の比率が高い年代が現在に近い登録者ほど、より高い専門家値を得ることができる。換言すれば、キーワードに関する業務の担当を継続している期間が長く、キーワード含有文書の件数の比率が高い年代が現在に近い登録者ほど、より高い専門家値を得ることができ、専門家の検索において抽出されやすくなる。
以上のように、本実施形態に示す方法で算出した専門家値に基づいて登録者のランキングを行うことにより、検索キーワードをもとに専門家を検索する精度を向上させることが可能となる。
(実施例2)
次に、実施例2について説明する。なお、実施例2を実現するための専門家検索システムは、図1乃至図3に例示されている専門家検索システムの構成を用いることができるため、説明を省略する。
実施例1では、文書中に検索キーワードに該当する語が1か所でも含まれている場合、その文書はキーワード含有文書として抽出される。これに対して実施例2では、文書中に登場する検索キーワードの数が所定の閾値を満たさない場合に、その文書をキーワード含有文書から除外することを特徴としている。
図16は、実施例2における、専門家検索装置による専門家検索方法の一例を示すフローチャートである。S101で行う処理は実施例1と同様であるので、説明は省略する。S101で検索キーワードを受信した後、検索部14は、第2記憶部12に格納されている文書DBを参照しながら、キーワード含有文書と、当該文書の登録者を抽出する(S102a)。以下、S102aの処理について具体的に説明する。
図17は、S102aにおける、キーワード含有文書を抽出する処理の一例を示すフローチャートである。
まず、検索部14は、第2記憶部12に格納されている文書DBを検索し、検索キーワードが含まれている文書を全て抽出する(S701)。実施例2では、S701で抽出した検索キーワードが含まれている文書を候補文書と呼称する。
続いて、検索部14は、候補文書の中から未選択の文書を1件選択する(S702)。
続いて、検索部14は、S702で選択した文書内に出現する検索キーワードの数を示す出現回数が所定の閾値Th以上か否かを判定する(S703)。すなわち、S703では、S702で選択した文書中に、検索キーワードが何件出現するかをカウントする。そして、カウントされた出現回数を所定の閾値と比較する。比較に用いる閾値Thは5以下であることが好ましく、例えば2である。
文書中の検索キーワードの出現回数が所定の閾値Th以上である場合(S703肯定)、検索部14は、当該文書をキーワード含有文書と判定し(S704)、キーワード含有文書の登録者を抽出する(S705)。その後、S707に移る。一方、文書中の検索キーワードの出現回数が所定の閾値Th以上でないと判定された場合(S703否定)、検索部14は、当該文書がキーワード含有文書でないと判定し(S706)、S707に移る。
S707では、検索部14は、全ての候補文書を選択したか否かを判定する。全ての候補文書を選択していないと判定された場合(S707否定)、S702に戻り、S702以降の処理を再び実行する。一方、全ての候補文書を選択したと判定された場合(S707肯定)、S103へ移る。
以上のようにして、S102aにおける、キーワード含有文書を抽出する処理を実行する。なお、S103以降の処理は、実施例1で説明したS103以降の処理と同様であるので、説明は省略する。
本実施形態によれば、検索キーワードが含まれている文書を抽出した後、その文書内での検索キーワードの出現回数をカウントし、カウント値が所定の閾値に満たない場合に、その文書をキーワード含有文書から除外する。文書によっては、検索キーワードと関連しない内容の文書であっても、検索キーワードの語が文中に登場することがある。本実施形態によれば、検索キーワードの出現回数の情報に基づいて検索キーワードとの関連性が薄い文書をキーワード含有文書から除外することができるため、検索キーワードに関連する文書の選定精度が向上し、専門家値の妥当性を高めることができる。
(実施例3)
次に、実施例3について説明する。なお、実施例3を実現するための情報処理システムは、図1乃至図3に例示されている専門家検索システムの構成を用いることができるため、説明を省略する。
実施例1では、図4のS103において、検索キーワードが含まれている文書を登録した全ての登録者が抽出される。これに対して実施例3では、専門家の検索対象のカテゴリ(職務または職種)を予め指定することを特徴としている。実施例3で用いる文書DBには、文書を一意に識別するための番号(No.)と、文書を登録した登録者と、登録日と、文書名と、登録者のカテゴリ(職務または職種)とが対応付けられて登録されている。
図18は、実施例3における、専門家検索装置による専門家検索方法の一例を示すフローチャートである。S101で行う処理は実施例1および実施例2と同様であるので、説明は省略する。S101の処理の後、受信部13は、端末装置30のユーザによって指定され、入力された検索対象の情報を受信する(S101b)。検索対象の情報には、例えば、検索対象から分野管理者を除き、分野担当者のみに限定する旨の指定が含まれている。なお、S101bで行う処理は、S101で行う処理の中で、同一の処理ステップとして行うこともできる。すなわち、検索対象の情報は、S101で受信する検索キーワードと同時に受信することもできる。また、あるいは、S101bの処理を実行した後に、S101の処理を行うこともできる。以降では、端末装置30のユーザによって、検索対象を分野担当者に限定する旨の指定がなされたものとして説明する。
S101bの処理の後、検索部14は、検索キーワードを用いて第2記憶部12に格納されている文書DBを検索し、検索キーワードが含まれている文書と、当該文書の登録者の情報とを全て抽出する(S102b)。
図19は、S102bにおける、キーワード含有文書および登録者を抽出する処理の一例を示すフローチャートである。S201からS204までの処理、およびS204の処理の後、検索部14は、L行目の文書の登録者および登録者のカテゴリの情報を抽出する(S205b)。これにより、検索部14は、抽出された登録者だけでなく、抽出された登録者がどのようなカテゴリに属しているのかについても把握することができる。S205bの処理の後、S206に移る。S206の処理は、図8に示す処理と同様であるので、説明は省略する。
図18に戻り、S102bの処理の後、検索部14は、キーワード含有文書を登録した登録者の中から、分野担当者を全て抽出する(S102c)。以下、S102cの処理について具体的に説明する。
図20は、S102cにおける、分野担当者を抽出する処理の一例を示すフローチャートである。
まず、検索部14は、受信部13から受信した検索対象の情報に基づいて、分野担当者を検索対象として設定する(S801)。
続いて、検索部14は、S102で抽出した全ての登録者の中から、未選択の登録者を1名選択する(S802)。
続いて、検索部14は、S802で選択した登録者が分野担当者か否かを判定する(S803)。検索部14は、S205bにおいて登録者に対応付けられて抽出されたカテゴリを参照することにより、S802で選択した登録者が分野担当者であるか否かを判定することができる。検索部14は、選択した登録者が分野担当者である場合(S803肯定)、検索対象の登録者と判定し(S804)、S806に移る。一方、選択した登録者が分野担当者でない場合(S803否定)、検索対象の登録者でないと判定し(S805)、S806に移る。
S806では、検索部14は、全ての登録者を選択したか否かを判定する。全ての登録者を選択していないと判定された場合(S806否定)、S802に戻り、S802以降の処理を再び実行する。一方、全ての登録者を選択したと判定された場合(S806肯定)、S103へ移る。
以上のようにして、S102cにおける分野担当者を抽出する処理を実行する。なお、S102cの後に続くS103以降の各処理は、実施例1または実施例2で説明したS103以降の各処理と同様であるので、説明は省略する。
本実施形態によれば、検索キーワードが含まれている文書を登録した全ての登録者の中から、端末装置によって検索範囲として指定された分野担当者のみを抽出する。この方法によれば、例えば検索要求元が新規プロジェクトを立ち上げるにあたって分野担当者のみを探している場合に、分野管理者が専門家検索により抽出されることがなくなる。このため、分野担当者に特化した検索結果を得ることができる。
(実施例4)
次に、実施例4について説明する。実施例1では、図7のS303において、全登録文書の件数に対するキーワード含有文書の件数の比率(パラメータβ)を算出するために、年代毎に、登録された全登録文書の件数の情報と、キーワード含有文書の件数の情報とを取得した。これに対して実施例4では、パラメータβを算出するために、年代毎に、検索キーワード含有文書の件数の情報と、検索キーワードを含有しない文書の件数の情報とを取得することを特徴としている。
実施例4を実現するための情報処理システムは、図1および図2に例示されている専門家検索システムの構成を用いることができるため、説明を省略する。以下、実施例4における計数部15の構成について説明する。
図21は、実施例4における、計数部15の構成の一例を示す図である。実施例1では、計数部15は年代別計数部21を備えていたが、実施例4では、計数部15は年代別計数部21の代わりにキーワード非含有文書計数部23を備えている。キーワード含有文書計数部22は、実施例1乃至3と同様に、検索キーワード含有文書の件数をカウントする機能を有する。一方、キーワード非含有文書計数部23は、検索キーワードを含まない文書の件数をカウントする機能を有する。以降では、検索キーワードを含有しない文書を、キーワード非含有文書と呼称する。
図22は、実施例4における、専門家検索装置による専門家検索方法の一例を示すフローチャートである。図22は、図7に示したS103の処理内容の変形例である。S103の変形例の処理の前に行うS101およびS102の各処理は実施例1と同様であるので、説明は省略する。また、S301およびS302の各処理も実施例1と同様であるので、説明は省略する。
S302の処理の後、キーワード含有文書計数部22およびキーワード非含有文書計数部23は、nに対応する年代に登録されたキーワード含有文書の件数およびキーワード非含有文書の件数の情報を取得する(S303c)。以下、S303cの処理について具体的に説明する。
図23は、S303cにおける、キーワード含有文書の件数およびキーワード非含有文書の件数の情報を取得する処理の一例を示すフローチャートである。
S303cでは、まず、検索部14は、文書DBの1行目から検索を行うため、Lの値を初期設定し、Lに1を格納する(S901)。
続いて、検索部14は、文書DBを検索し、文書DBにL行目が存在するか否かを判定する(S902)。文書DBにL行目が存在する場合(S902肯定)、検索部14は、文書DBのL行目に登録されている文書を参照し、L行目の文書の登録者が、S102において抽出された登録者の中に含まれているか否かを判定する(S903)。
L行目の文書の登録者が、S102において抽出された登録者の中に含まれていない場合(S903否定)、検索部14は、文書DBの次の行を検索するため、Lの値をカウントアップし、Lに1を加算した値を新たなLの値とする(S904)。その後、S902に戻り、S902以降の処理を再び実行する。一方、L行目の文書の登録者が、S102において抽出された登録者の中に含まれている場合(S903肯定)、検索部14は、L行目の文書中に、検索キーワードが含まれているか否かを判定する(S905)。
L行目の文書中に検索キーワードが含まれている場合(S905肯定)、キーワード含有文書計数部22は、L行目の文書をキーワード含有文書としてカウントする(S906)。S906の処理の後、検索部14は、Lの値をカウントアップするS904の処理を経てS902に戻り、S902以降の処理を再び実行する。一方、L行目の文書中に検索キーワードが含まれていない場合(S905否定)、キーワード非含有文書計数部23は、L行目の文書を非キーワード含有文書としてカウントする(S907)。そして、検索部14は、Lの値をカウントアップするS904の処理を経て、S902に戻る。そして、検索部14は、文書DBの新たなL行目を参照するため、S902以降の処理を再び実行する。
やがて、文書DBの全ての行についての処理が終了すると、S902において文書DBにL行目が存在しないと判定され(S902否定)、S304に移る。これによりS303cの処理が完了する。
S304で行う処理は実施例1と同様であるので、説明は省略する。S304の処理の後、スコア算出部16は、全登録文書の件数に対するキーワード含有文書の件数の比率からなるパラメータβを算出する(S305c)。ここで、実施例4におけるパラメータβの算出方法について説明する。
図24は、S305cにおける、パラメータβの算出方法を示すフローチャートの一例である。S305cでは、まず、キーワード含有文書計数部22は、S303cで取得したキーワード含有文書の件数の値が零か否かを判定する(S1001)。キーワード含有文書の件数の値が零である場合(S1001肯定)、当該年代におけるβの値をβ=0とする。一方、キーワード含有文書の件数の値が零でない場合(S1001否定)、スコア算出部16は、例えば以下の式(6)を用いて年代IDがnにおけるパラメータβを算出する(S1003)。
式(6):
Figure 0006442918
例えば、nの年代において、キーワード含有文書の件数が4件であり、キーワード非含有文書の件数が5件である場合、式(6)のdfに4を代入し、df’に5を代入することにより、β=0.5と算出することができる。
以上のようにしてS305cの処理を実行する。なお、S305cの後に続くS306以降の各処理は、実施例1で説明したS306以降の各処理と同様であるので、説明は省略する。
以上、本発明の好ましい実施例について詳述したが、本発明は特定の実施例に限定されるものではなく、種々の変形や変更が可能である。例えば、本実施形態では、文書DBに登録者の項目を設け、登録者と文書の責任者が同一であるものとして説明したが、登録者の項目に替えて、若しくは追加により、文書の作成者を含む責任者の情報を示す項目を文書DBに設け、責任者を対象にして専門家を検索する処理を実行することもできる。この方法によれば、登録者と文書の責任者とが異なるようなケースがある場合においても、検索キーワードについての専門性を有する人材を抽出することができる。
また、例えば、パラメータα、β、γを算出するために用いる式は、式(1)〜(3)に限定されるものではなく、変形が可能である。また、これまでの実施形態の説明では、年代毎に設定されるパラメータγの値を第2記憶部12に予め格納しておく例について説明したが、専門家値を算出する処理を実行する度にパラメータγの値を算出するようにしてもよい。
専門家検索装置10による専門家検索は、ウェブアプリケーションを用いて行うことができる。図25は、ウェブアプリケーションを用いた専門家検索サービスの一例を示す図である。図25に示すように、専門家検索装置10は、専門家を検索するためのソフトウェアをウェブアプリケーション80の形態で端末装置30を所有するユーザに提供する。そしてユーザは、インターネット等のネットワーク50を介してウェブアプリケーション80を利用することにより、専門家検索装置10による専門家検索を行うことができる。
前述した専門家検索装置および専門家検索方法をコンピュータに実行させるコンピュータプログラム、およびそのプログラムを記録したコンピュータ読み取り可能な記録媒体は、本発明の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体は、例えば、フレキシブルディスク、ハードディスク、CD−ROM(Compact Disc−Read Only Memory)、MO(Magneto Optical disk)、DVD(Digital Video Disc)、DVD−ROM(DVD−Read Only Memory)、DVD−RAM(DVD−Random Access Memory)、BD(Blue-ray Disc)、半導体メモリである。前記コンピュータプログラムは、前記記録媒体に記録されたものに限られず、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して伝送されるものであってもよい。
10:専門家検索装置
11:第1記憶部
12:第2記憶部
13:受信部
14:検索部
15:計数部
16:スコア算出部
17:専門家値算出部
18:専門家ソート部
19:送信部
20:出力部
21:年代別計数部
22:キーワード含有文書計数部
23:キーワード非含有文書計数部
30:端末装置
50:ネットワーク
61:CPU
62:ROM
63:RAM
64:ストレージ装置
65:ネットワークインタフェース
66:表示装置
67:可搬型記憶媒体用ドライブ
68:バス
69:可搬型記憶媒体
80:ウェブアプリケーション

Claims (9)

  1. キーワードを受け付け、
    時期情報と専門家情報とが関連づけられた複数の文書情報のうち、受け付けた前記キーワードを含む特定文書情報を抽出し、
    前記特定文書情報のそれぞれに関連付けられた前記専門家情報である特定専門家情報を、前記特定専門家情報ごとに決定される優先度に基づいて出力する、
    処理をコンピュータに実行させ、
    前記特定専門家情報に含まれる第1の特定専門家情報の前記優先度は、前記第1の特定専門家情報に関連付けられた前記特定文書情報に関連付けられた前記時期情報が示す時期が相対的に新しいほど相対的に高く決定されるとともに、前記第1の特定専門家情報に関連付けられた前記特定文書情報の、前記複数の文書情報のうち前記第1の特定専門家情報に関連付けられた文書情報に対する割合が相対的に大きいほど相対的に高く決定される、
    ことを特徴とする専門家情報検索プログラム。
  2. 複数の年代を含む期間内に登録された複数の文書と、前記複数の文書の各々に関連する専門家の情報とを含む文書情報を格納する記憶部と、
    キーワードを受信する受信部と、
    前記キーワードが含まれる文書に関連する1以上の専門家を前記文書情報から検索する検索部と、
    前記1以上の専門家の各々について、前記1以上の専門家毎の全ての文書の登録件数に対する、前記キーワードに関連する文書の登録件数の比率と、前記年代が新しいほど値が大きくなる係数とに基づいて、年代毎のスコアを算出するスコア算出部と、
    前記年代毎のスコアを合算することにより、前記キーワードに関する専門家値を前記1以上の専門家毎に算出する専門家値算出部と、
    前記専門家値の比較に基づいて、前記1以上の専門家の順位付けを実行するソート部と、
    を有することを特徴とする専門家検索装置。
  3. 前記スコア算出部は、所定の年代に登録された、前記キーワードに関連する文書の件数が多いほど値が大きくなる指標と、前記所定の年代に対応する前記比率を示す指標と、前記所定の年代に対応する前記係数とを乗算することによって、前記所定の年代のスコアを算出する
    ことを特徴とする請求項2に記載の専門家検索装置。
  4. 前記スコア算出部は、前記所定の年代に登録された、前記キーワードに関連する文書の件数が零である場合、前記所定の年代に対応する前記比率を示す指標を零とする、
    ことを特徴とする請求項3に記載の専門家検索装置。
  5. 前記検索部は、前記キーワードが含まれる文書を前記文書情報から抽出し、
    前記キーワードが含まれる文書のうち、前記キーワードの出現回数が所定の閾値以上である文書の件数を前記年代毎にカウントする計数部を更に有する
    ことを特徴とする請求項2〜4のいずれか1項に記載の専門家検索装置。
  6. 前記受信部は、検索対象の情報を受信し、
    前記検索部は、前記1以上の専門家のうち、前記検索対象に該当する専門家を抽出する
    ことを特徴とする請求項2〜5のいずれか1項に記載の専門家検索装置。
  7. 前記1以上の専門家の各々について、前記キーワードが含まれる文書の登録件数を前記年代毎にカウントするキーワード含有文書計数部と、
    前記1以上の専門家の各々について、前記キーワードが含まれない文書の登録件数を前記年代毎にカウントするキーワード非含有文書計数部と、
    を更に有し、
    前記スコア算出部は、前記キーワードが含まれる文書の登録件数と、前記キーワードが含まれない文書の登録件数とに基づいて、前記比率を算出する
    ことを特徴とする請求項2〜6のいずれか1項に記載の専門家検索装置。
  8. 複数の年代を含む期間内に登録された複数の文書と、前記複数の文書の各々の専門家の情報とを含む文書情報を格納し、
    キーワードを受信し、
    前記キーワードが含まれる文書に関連する1以上の専門家の情報を前記文書情報から抽出し、
    前記1以上の専門家の各々について、前記1以上の専門家毎の全ての文書の登録件数に対する、前記キーワードに関連する文書の登録件数の比率と、前記年代が新しいほど値が大きくなる係数とに基づいて、年代毎のスコアを算出し、
    前記年代毎のスコアを合算することにより、前記キーワードに関する専門家値を前記専門家毎に算出し、
    前記専門家値の比較に基づいて、前記1以上の専門家の順位付けを実行する、
    処理をコンピュータが実行することを特徴とする専門家検索方法。
  9. 複数の年代を含む期間内に登録された複数の文書と、前記複数の文書の各々の専門家の情報とを含む文書情報を格納する記憶部を有する専門家検索装置に、
    キーワードを受信する処理と、
    前記キーワードが含まれる文書を登録した1以上の専門家の情報を前記文書情報から抽出する処理と、
    前記1以上の専門家の各々について、前記1以上の専門家毎の全ての文書の登録件数に対する、前記キーワードに関連する文書の登録件数の比率と、前記年代が新しいほど値が大きくなる係数とに基づいて、年代毎のスコアを算出する処理と、
    前記年代毎のスコアを合算することにより、前記キーワードに関する専門家値を前記1以上の専門家毎に算出する処理と、
    前記専門家値の比較に基づいて、前記1以上の専門家の順位付けを実行する処理と、
    を実行させるための専門家検索プログラム。
JP2014168309A 2014-08-21 2014-08-21 専門家検索装置、専門家検索方法および専門家検索プログラム Expired - Fee Related JP6442918B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014168309A JP6442918B2 (ja) 2014-08-21 2014-08-21 専門家検索装置、専門家検索方法および専門家検索プログラム
US14/800,011 US10331674B2 (en) 2014-08-21 2015-07-15 Information processing method, information processing apparatus and storage medium to determine ranking of registrants

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014168309A JP6442918B2 (ja) 2014-08-21 2014-08-21 専門家検索装置、専門家検索方法および専門家検索プログラム

Publications (2)

Publication Number Publication Date
JP2016045620A JP2016045620A (ja) 2016-04-04
JP6442918B2 true JP6442918B2 (ja) 2018-12-26

Family

ID=55348497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014168309A Expired - Fee Related JP6442918B2 (ja) 2014-08-21 2014-08-21 専門家検索装置、専門家検索方法および専門家検索プログラム

Country Status (2)

Country Link
US (1) US10331674B2 (ja)
JP (1) JP6442918B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11341188B2 (en) 2017-03-09 2022-05-24 International Business Machines Corporation Expert stance classification using computerized text analytics
US10387472B2 (en) 2017-03-09 2019-08-20 International Business Machines Corporation Expert stance classification using computerized text analytics
WO2020075029A1 (en) * 2018-10-09 2020-04-16 Brodsky Jesse Methods and systems for facilitating selection of a professional based on objective criteria
US20220027855A1 (en) * 2020-10-23 2022-01-27 Vmware, Inc. Methods for improved interorganizational collaboration
WO2023026429A1 (ja) * 2021-08-26 2023-03-02 日本電信電話株式会社 情報処理装置、情報処理方法およびプログラム
WO2024150273A1 (ja) * 2023-01-10 2024-07-18 日本電信電話株式会社 相談支援制御装置、方法およびプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282837A (ja) * 2000-03-31 2001-10-12 Oki Electric Ind Co Ltd 情報収集装置
JP2006268080A (ja) 2005-03-22 2006-10-05 National Institute Of Advanced Industrial & Technology 特許データ解析方法、装置、プログラムおよび記録媒体
US8280882B2 (en) * 2005-04-21 2012-10-02 Case Western Reserve University Automatic expert identification, ranking and literature search based on authorship in large document collections
WO2008083504A1 (en) * 2007-01-10 2008-07-17 Nick Koudas Method and system for information discovery and text analysis
JP2008234550A (ja) * 2007-03-23 2008-10-02 Nec Corp 専門家情報検索装置、専門家情報検索方法およびプログラム。
JP5201727B2 (ja) * 2008-07-14 2013-06-05 日本電信電話株式会社 文書要約装置、文書要約方法、プログラムおよび記録媒体
JP2011103059A (ja) 2009-11-11 2011-05-26 Oki Electric Industry Co Ltd 専門用語抽出装置およびプログラム
US9110979B2 (en) * 2009-12-01 2015-08-18 Apple Inc. Search of sources and targets based on relative expertise of the sources
US9324112B2 (en) * 2010-11-09 2016-04-26 Microsoft Technology Licensing, Llc Ranking authors in social media systems
US9589072B2 (en) * 2011-06-01 2017-03-07 Microsoft Technology Licensing, Llc Discovering expertise using document metadata in part to rank authors
WO2012178152A1 (en) * 2011-06-23 2012-12-27 I3 Analytics Methods and systems for retrieval of experts based on user customizable search and ranking parameters
US8965889B2 (en) * 2011-09-08 2015-02-24 Oracle International Corporation Bi-temporal user profiles for information brokering in collaboration systems
US8478735B1 (en) * 2012-01-09 2013-07-02 Wajam Internet Technologies Inc. Method and system for ranking results and providing lists of experts from social networks
US20130325779A1 (en) * 2012-05-30 2013-12-05 Yahoo! Inc. Relative expertise scores and recommendations
CA2821164A1 (en) * 2013-06-21 2014-12-21 Nicholas KOUDAS System and method for analysing social network data
US9213702B2 (en) * 2013-12-13 2015-12-15 National Cheng Kung University Method and system for recommending research information news
KR101442518B1 (ko) * 2014-01-09 2014-09-26 재단법인 한국연구재단 학술지 평가 시스템, 평가 방법 및 평가 프로그램이 기록된 기록 매체

Also Published As

Publication number Publication date
JP2016045620A (ja) 2016-04-04
US20160055249A1 (en) 2016-02-25
US10331674B2 (en) 2019-06-25

Similar Documents

Publication Publication Date Title
JP6442918B2 (ja) 専門家検索装置、専門家検索方法および専門家検索プログラム
KR102354716B1 (ko) 딥 러닝 모델을 이용한 상황 의존 검색 기법
EP3550568A1 (en) Graph convolution based gene prioritization on heterogeneous networks
RU2701110C2 (ru) Изучение и использование контекстных правил извлечения контента для устранения неоднозначности запросов
JP6390139B2 (ja) 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
US20160078086A1 (en) Query Rewriting Using Session Information
EP2407897A1 (en) Device for determining internet activity
US9075812B1 (en) System and method for automatically selecting images to accompany text
US10061767B1 (en) Analyzing user reviews to determine entity attributes
US10606895B2 (en) Multiple entity aware typeahead in searches
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
JP2015500525A (ja) 情報検索のための方法および装置
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
CN105653553B (zh) 词权重生成方法和装置
US20160162930A1 (en) Associating Social Comments with Individual Assets Used in a Campaign
US20190018885A1 (en) Index aware typeahead in searches
WO2019192122A1 (zh) 文档主题参数提取方法、产品推荐方法、设备及存储介质
CN108170664B (zh) 基于重点关键词的关键词拓展方法和装置
JP5397198B2 (ja) 話題推薦装置、話題推薦装方法およびプログラム
JP6034584B2 (ja) 特許調査支援装置、特許調査支援方法、およびプログラム
CN115238165A (zh) 基于机器学习的信息推送方法及装置、存储介质、终端
JP2012027841A (ja) 検索プログラム、検索装置、検索システム、検索方法及び記録媒体
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP6490989B2 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
JP2019053520A (ja) 提供装置、提供方法及び提供プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20160401

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180403

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20180426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181112

R150 Certificate of patent or registration of utility model

Ref document number: 6442918

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees