JP5233518B2 - 検索分析サーバ装置及び検索分析方法 - Google Patents

検索分析サーバ装置及び検索分析方法 Download PDF

Info

Publication number
JP5233518B2
JP5233518B2 JP2008221606A JP2008221606A JP5233518B2 JP 5233518 B2 JP5233518 B2 JP 5233518B2 JP 2008221606 A JP2008221606 A JP 2008221606A JP 2008221606 A JP2008221606 A JP 2008221606A JP 5233518 B2 JP5233518 B2 JP 5233518B2
Authority
JP
Japan
Prior art keywords
search
department
search word
frequency table
word frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008221606A
Other languages
English (en)
Other versions
JP2010055494A (ja
Inventor
和彦 首藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2008221606A priority Critical patent/JP5233518B2/ja
Publication of JP2010055494A publication Critical patent/JP2010055494A/ja
Application granted granted Critical
Publication of JP5233518B2 publication Critical patent/JP5233518B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、個人や部門間での業務の関連性を取得するための検索分析サーバ装置及び検索分析方法に関する。
近年、情報化社会の進展に伴い、企業内での知的生産性を高める必要が生じている。組織の知的生産性を高めるためには、情報の共有や部門間の協力関係の構築が重要なのは言うまでもない。企業内での異なる部門であっても業務上の関連性が高ければ、いち早くそのような部門を発見して、協力関係を構築することで組織全体としての知的な生産性が向上する。そのために社内のネットワークで部門ごとにホームページを作成して情報発信を行ったり、社内でのブログやSNSなどの取り組みもなされている。
ただ、このような方法では情報発信に手間がかかったり、他の部門の情報をチェックするなどの手間がかかるという問題がある。そこで、人手によらずにコンピューターを用いて機械的に個人や部門間の関係性を把握しようとする試みがなされている。例えば、組織内でのメールなどによるコミュニケーションを計測して、部門間のコミュニケーションの生産性を評価しようとする試みが開示されている(例えば、特許文献1参照)。
また、会議等のスケジュール情報から出席者の共起関係を調べ、人脈情報の生成、表示を行うようにした技術が開示されている(例えば、特許文献2参照)。
特開2007−280000号公報 特開2005−108123号公報
しかし、特許文献1では、既にコミュニケーションがなされている場合に、関連した指標を計測するものの、まだコミュニケーションがなされていない部門間の関係については処理の対象としていない。従って、まだコミュニケーションがなされていない部門間であっても、業務上の関連がある場合にそれを発見して部門間の情報共有、提携を促す目的には向かない。
また、特許文献2でも、やはり会議等の既にコミュニケーションがなされている場合を主な処理の対象としているため、まだ交流がない部門間で業務の関連性を発見する目的には向かないと考えられる。
本発明はこのような点に鑑みなされたもので、ある部門間で、まだコミュニケーションがなされていなくても、その部門間の業務上のつながりを手間をかけずに自動的に発見することが可能な検索分析サーバ装置及び検索分析方法を得ることを目的とする。
また、個人間や個人と部門間においても、業務上のつながりを手間をかけずに自動的に発見することが可能な検索分析サーバ装置及び検索分析方法を得ることを目的とする。
本発明に係る検索分析サーバ装置は、組織内の複数の各部門に設置された複数の端末にネットワークを介して接続される検索分析サーバ装置であって、複数の端末からそれぞれ送信された検索要求の履歴を、検索要求による検索単語とその検索要求を行った個人の個人IDと対応付けて記録する検索ログ記録部と、検索ログ記録部に記録された検索ログを個人ごとに集計し、検索単語とその検索回数とを対応付けた個人別検索単語頻度表を生成する検索単語頻度表生成部と、個人ごとの個人別検索単語頻度表を部門ごとに集計し、部門別検索単語頻度表を生成する部門集計部と、部門別検索単語頻度表の検索回数を正規化する検索単語頻度表正規化部と、検索単語頻度表正規化部で正規化して得られた部門ごとの頻度データを基に、部門間の検索単語の類似度を計算する類似度計算部と、類似度計算部で計算された類似度結果を出力する結果出力部とを備えたものである。
また、本発明に係る検索分析サーバ装置は、検索単語頻度表正規化部が、個人別検索単語頻度表の検索回数を正規化し、類似度計算部が、検索単語頻度表正規化部で正規化して得られた個人ごとの頻度データ及び部門ごとの頻度データを基に、個人間または個人と部門間の検索単語の類似度を計算するものである。
本発明によれば、社内における部門または個人が検索に用いた単語を分析することで、まだ互いにコミュニケーションがなされていない部門間、または個人間の業務の関係性を自動的に発見することが可能となる。
以下、図面を参照して本発明の実施形態を説明する。本発明は組織内の個人が行っている情報検索に注目する。なぜならば、そのような検索作業は普段の業務の必要から生じるものであり、従って検索の際にどのような単語を用いたかを調べることで、その個人や部門の業務内容を相当程度把握することができると考えられるからである。本発明の本質は、このような検索に用いた単語を個人または部門ごとに集計し、個人や部門等の類似度を調べることで個人または部門間の関連性を発見することにある。
図1は、本発明の一実施の形態のネットワーク構成を示す図である。
図1に示す検索分析システムは、PC等の各端末10(図1中の端末1〜端末N)と、各端末10から送信された検索要求を分析する検索分析サーバ装置20とがネットワーク30を介して接続されている。各端末10は、組織内の複数の各部門に分散して設けられており、社内LAN等のネットワーク30及び検索分析サーバ装置20を介してインターットなどのネットワーク40に接続されている。
各端末10は、組織内の個人によって操作されるもので、この端末10を使用して各個人が情報検索を行う。各端末10から送信される検索要求は、ネットワーク30を通して検索分析サーバ装置20へと送信される。検索分析サーバ装置20は、受信した検索要求を処理して検索結果を返信するとともに、以下に詳述する検索分析処理を行う。このような検索は社内の文書の検索であってもよいし、インターネット検索でもよい。後者の場合には検索分析サーバ装置20は例えばウェッブ・プロキシーであってもよい。
図2は、本発明の検索分析サーバ装置のハードウェア構成を示すブロック図である。
検索分析サーバ装置20は、具体的には例えばパソコンなどのコンピュータで構成され、CPU等の演算部21と、ROMやRAMで構成される主記憶装置22と、ハードディスクなどの補助記憶装置23と、端末10等の外部装置とデータ送信を行うための通信インタフェース(I/F)24と、ディスプレイなどの表示装置25とを備えている。
図3は、本発明の検索分析サーバ装置の機能的な構成を示すブロック図である。
検索分析サーバ装置20は、検索ログ記録部31と、検索単語頻度表生成部32と、部門集計部33と、検索単語頻度表正規化部34と、部門間類似度計算部35と、結果出力部36と、検索ログデータベース37と、検索単語頻度表データベース38と、部門データベース39とを備えている。各処理部31〜36は、CPUと主記憶装置22内の制御プログラムとにより機能的に実現されている。
検索ログ記録部31は、各端末10からそれぞれ送信された検索要求の履歴を記録するもので、個人が検索に用いた単語と、その検索を行った個人の個人IDと対応させて検索ログデータベース37に検索ログとして記録する。なお、検索分析サーバ装置20は、各端末10から検索要求を受け付ける際、その端末10を操作する個人に対し、個別の個人IDの入力を求めるようにしており、検索ログ記録部31は、その際に入力された個人IDを記録するものである。また、検索分析サーバ装置20がインターネット検索のウェッブ・プロキシーである場合には、個人が特定の検索サイト(Googleなど)を用いて検索している際にその検索単語を個人IDと共にログとして記録するようにすればよい。
検索単語頻度表生成部32は、検索ログデータベース37に記録された検索ログを各個人IDごとに集計し、当該個人が検索に用いた文字列と、当該個人によるその文字列の検索回数とからなる個人別検索単語頻度表を生成して検索単語頻度表データベース38に記録する。図4は、検索単語頻度表を示したものであり、検索に用いた文字列(検索単語)とその検索回数(頻度)とを示している。
また、部門データベース39には、部門IDとその部門に所属する全個人の個人IDリストとが対応付けて記憶されている。部門集計部33は、この部門データベース39を用いて、各部門ごとに、その部門に所属する全ての個人の個人別検索単語頻度表を検索単語頻度表データベース38から取得して合成し、部門ごとの部門別検索単語頻度表を生成する。
検索単語頻度表正規化部34は、部門集計部33で得られた部門ごとの部門別検索単語頻度表の頻度を、TF−IDF(Term Frequency-Inverse Document Frequency)等によって正規化する。部門間類似度計算部35は、検索単語頻度表正規化部34で正規化された各部門それぞれの正規化結果を用いて、部門間の類似度を計算する。
結果出力部36は、部門間類似度計算部35で得られた部門間の類似度を表示装置25に出力して表示させる。
以下、検索分析システムの動作の流れを説明する。
個人は、自己の端末10を操作して検索画面を表示し、自己の個人IDと検索文字列を入力して検索を実行する。この検索の際には、文字列を複数入力するものとする。ここで入力される検索語句は、個人の普段の業務に関連する単語であったり、関心のある単語であったりする。また、個人が、ある特定の分野に関して活動を行う場合には、その活動に関連する語句も検索語句として入力されることが想定される。従って、個人から入力される検索語句は、ある特定の分野に関して活動を行おうとする意志を表したものと言える。このように個人から端末10に入力された検索文字列は、個人IDと共に検索要求として検索分析サーバ装置20へと送信される。
検索分析サーバ装置20は、端末10からの検索要求を受信すると、検索要求に含まれる検索文字列を、個人IDと対応させて検索ログデータベース37に検索ログとして記録する。なお、検索要求に含まれる検索文字列を、そのまま検索ログデータベース37に記録してもよいが、形態素分析を使って一度単語に分解し、各単語を個人IDと対応させて検索ログデータベース37に記録するようにしてもよい。検索単語の検索ログデータベース37への記録は、個人が検索を行う度に常時行う。
<検索分析処理の方法>
以下、検索ログデータベース37に記録された検索ログを利用した検索分析処理の流れを説明する。
図5は、検索分析サーバ装置における検索分析処理の流れを示したフローチャート図である。
検索単語頻度表生成部32は、検索ログデータベース37から検索ログを取得する(S1)。そして、検索ログを各個人IDごとに集計し、当該個人が検索に用いた各文字列と、当該個人によるその文字列の検索回数とからなる個人別検索単語頻度表を生成し(S2)、検索単語頻度表データベース38に記録する。個人別検索単語頻度表が一旦生成された後に、その個人別検索単語頻度表に対応する個人からの検索要求に基づき検索ログデータベース37が更新された場合には、該当の個人別検索単語頻度表も更新する。すなわち、個人が検索に用いた文字列(または、形態素解析の出力である各単語について)が個人別検索単語頻度表に既に存在するかどうかを調べる。もし既に存在すれば、その文字列の頻度の数値を1だけ増加させる。もし存在しなければ、その文字列を検索単語とし、頻度を1とする新たな項目をその個人別検索単語頻度表に追加する。
なお、検索単語頻度表生成部32における個人別検索単語頻度表の生成・更新のタイミングは、検索ログ記録部31で検索ログデータベース37が更新される度に行っても良いし、一定期間ごとに定期的に行うようにしても良い。
部門集計部33は、検索単語頻度表生成部32で作成された個人別検索単語頻度表を、部門データベース39に記憶された部門別の個人IDリストを用いて各部門ごとに合成し、部門ごとの検索単語頻度表(以下、部門別検索単語頻度表という)を作成する(S3)。この処理および以降の処理は個人から検索要求が送信される度に行うよりも、ある一定時間ごと、例えば一日ごとに行うほうがよいだろう。
以下、部門集計部33における合成処理について具体的に説明する。
図6は、個人別検索単語頻度表の合成処理の説明図である。
まず、個人IDリストのうちの最初の個人IDを取り出し、その個人IDに対応する検索単語頻度表T1を検索単語頻度表データベース38から取得する(S11)。この検索単語頻度表T1をそのまま部門別検索単語頻度表X0とする(S12)。
次に、部門集計部33は、個人IDリストから次の個人IDを取り出し、その個人IDに対応する検索単語頻度表T2を検索単語頻度表データベース38から得る(S13)。そして、検索単語頻度表T2の各要素について、その検索単語が部門別検索単語頻度表X0に存在するかどうか判断し、存在する場合には、対応する頻度を検索単語頻度表T2の頻度だけ増加させる。もし部門別検索単語頻度表X0にその検索単語が存在しない場合には、新たな要素として、検索単語とその頻度とを検索単語頻度表T2から抽出して部門別検索単語頻度表X0に追加する(S14)。そして、部門別検索単語頻度表Xを完成する(S15)。以上の処理をその部門の全ての個人IDについて繰り返すことで、部門別検索単語頻度表Xを完成する。
以上の処理を全ての部門について行い、各部門ごとに、それぞれ部門別検索単語頻度表Xを作成する。
検索単語頻度表正規化部34は、部門集計部33で作成された各部門ごとの部門別検索単語頻度表の頻度を正規化する(S4)。以下、正規化処理について説明する。なお、後の処理の便宜のために、部門集計部33で作成された部門別検索単語頻度表Xを、検索単語をインデックス化して数値ベクトルとしておくのが都合がよい。すなわち、全ての検索単語の総数をNとした時、各検索単語について、適当に1からNまでの数字で一対一に対応づける。その上で各部門の部門別検索単語頻度表を1からNまでのインデックスで対応づけられたベクトルとし、その各値を、そのインデックスに対応する検索単語の頻度とする。これをその部門の検索単語頻度ベクトルと呼ぶ。
すなわち、ある部門の検索単語頻度ベクトルとは、数字の列
Figure 0005233518
であって、niは単語ID=iに対応するその部門での検索単語の頻度である。Nは全検索単語数である。
図6の部門別検索単語頻度表Xの場合、
(8,81,7,20,…)
となる。
ただし、検索単語
「テレワーク]、「動向」、「臨場感」、「とは」
は、それぞれ単語ID
1、2、3、4
に対応するものとする。
こうして作成された部門ごとの各検索単語頻度ベクトルを、後の部門間類似度計算部35で用いるために正規化する。これはTF−IDF(Term Frequency-Inverse Document Frequency)に基づくもので、自然言語処理ではよく知られている手法である。これは、どんな文章でも一般的によく表れる単語とそうではない単語があり、よく表れる単語については検索単語頻度表におけるその頻度のウエイトを下げ、あまり表れない単語については検索単語頻度表におけるその頻度のウエイトを上げることで、部門が検索している単語の特徴をより引き出すことを狙いとしている。
すなわち、ある部門の正規化された検索単語頻度ベクトルを
Figure 0005233518
とする。
ここで、niは単語ID=iに対応するその部門での検索単語の頻度である。Nは全検索単語数である。
この時、この部門の正規化された検索単語頻度ベクトル
Figure 0005233518
をTF−IDF法により以下のように定める。
Figure 0005233518
ここに、
Figure 0005233518
ここでDは全検索総数であり、検索ログデータベース37に存在する、全ての個人について、検索した回数を合計したものである。dfiは全検索のうち、単語iを含む検索の回数である。なお、Dおよびdfiについてはここでは検索ログをもとに集計した値としたが、通常は大量のドキュメントをもとに計算するのが普通であり、そのような値を用いてもよい。その場合には大量のドキュメントがあると仮定して、Dは総ドキュメント数,dfiは単語iを含むドキュメント数である。
検索単語頻度表正規化部34では、以上のようにして部門ごとに、正規化された検索単語頻度ベクトルを作成する。
続いて、部門間類似度計算部35は検索単語頻度表正規化部34で作成された部門ごとの正規化された検索単語頻度ベクトルを用いて、全ての部門ペアそれぞれについて類似度を算出する(S5)。この類似度は、各部門がそれぞれ検索に用いた単語が類似している度合いを示すものであって、部門の間の業務の近さを表す指標となる。検索に用いた単語は上述したように普段の業務、関心を反映したものであり、2つの部門が似たような単語で検索しているほど、それらの部門は関連の深い業務をしていると推定できる。
任意の2つの部門間の検索単語の類似度の計算について以下に説明する。
2つの部門X,Yの正規化された検索単語頻度ベクトルをそれぞれ、
Figure 0005233518
とする。ここで、xiおよびyiは、それぞれ単語ID=iに対応する部門Xの検索単語頻度ベクトルと部門Yの検索単語頻度ベクトルの値である。Nは、全検索単語の総数である。
この時、部門間の類似度はN次元ベクトルのコサイン距離として以下の式から算出される。
Figure 0005233518
類似度は−1≦(類似度)≦1の値をとり、部門間の検索単語の特徴が似ているほど類似度は1に近くなる。部門の人間が普段の業務で検索を行う際に使う単語は、上述したように業務の内容や領域を反映したものとなるので、部門間の類似度が1に近いほどその部門間では業務が似ていて関連が深い可能性が高い。
部門間類似度計算部35は、以上に説明した類似度の計算処理を全ての部門ペアごとに行い、それぞれの類似度を算出する。
結果出力部36は、部門間類似度計算部35で算出された、全ての部門ペアごとの類似度を表示装置25に出力して表示させる(S6)。
図7は、類似度計算結果の表示例を図である。なお、図7には部門Aの類似度計算結果の表示例を示している。
図7に示すように、部門Aで検索頻度が高かった検索単語を複数表示するとともに、部門Aと関連がある可能性のある部門名を、類似度が高い順に順位付けしてリスト表示する。この表示により部門Aでは、例えばテレワークの分野などで部門XXXや部門YYY等と業務の関連性が高いことを知ることができる。
類似度計算結果の提示の仕方としては、上述したように検索分析サーバ装置20の表示装置25に表示してもよいし、メールや社内のホームページなどを用いて社内全体に広く提示するようにしてもよい。例えば、全ての部門ペアごとの類似度結果を社内のホームページなどに常時、掲示するようにしてもよい。この場合、各部門はホームページにアクセスすることにより、自分たちと業務上のつながりがありそうな部門を知ることができる。これにより、まだコミュニケーションがなされていないが業務上関連のありそうな部門に注目することができ、必要ならアクセスすることが可能である。そうすることで部門間の情報共有や協力関係の構築を促す。このようにして社内でのコミュニケーション、情報共有、業務の提携などが向上し、組織全体としての生産性が向上することが期待できる。
また、類似度結果の提示の仕方としては、他に例えば、端末10からの類似度計算要求に応じて検索分析サーバ装置20で類似度を計算し、類似度計算結果を結果出力部36から通信I/F24を介して端末10に送信し、端末10側で表示するようにしてもよい。
このように本実施の形態では、検索で用いられる検索単語が、その検索を行う個人やその個人が属する部門の業務内容に関連する語句であり、また、今後の業務活動に関連する語句でもあることに着目し、各個人の検索ログを利用して部門間の類似度を自動的に計算し、その類似度計算結果を出力するようにした。したがって、この検索分析サーバ装置20を用いることにより、まだ互いにコミュニケーションがなされていない部門間の業務の関係性を自動的に発見することが可能となる。また、算出された類似度に基づいて2つの部門間における業務の関連性の程度を知ることが可能となる。したがって、互いの業務に関連がありそうな部門同士、また、ある分野に関して活動を行おうとする意志を持っている部門同士を早期に結びつけることが可能となる。そして、まだ互いにコミュニケーションがなされていないうちから早期に部門間での情報交換、協力関係の構築等を促すことが可能となり、組織の生産性を高める効果がある。
なお、本実施の形態では、部門ごとの検索単語頻度ベクトルを対象に、正規化及び類似度の算出を行う場合を例に説明したが、個人別検索単語頻度表から部門別検索単語頻度表への変換は行わずに、個人別検索単語頻度表から個人の検索単語頻度ベクトルを作成し、それをTF−IDF法により正規化して個人間の類似度を計算するようにしてもよい。この結果は、個人間の情報交換や協力関係の推進に利用することができる。あるいは個人の検索単語頻度ベクトルと部門ごとの検索単語頻度ベクトルとを用いて個人と部門間の類似度を計算してもよい。この場合、個人と部門間での協力の可能性の発見が可能である。
本発明の一実施の形態のネットワーク構成を示す図である。 本発明の検索分析サーバ装置のハードウェア構成を示すブロック図である。 本発明の検索分析サーバ装置の機能的な構成を示すブロック図である。 図1の検索分析サーバ装置における検索分析処理の流れを示したフローチャート図である。 ある個人の検索単語頻度表を示す図である。 検索単語頻度表の合成処理の説明図である。 類似度計算結果の表示例を示す図である。
符号の説明
10 端末
20 検索分析サーバ装置
21 演算部
22 主記憶装置
23 補助記憶装置
25 表示装置
30 ネットワーク
31 検索ログ記録部
32 検索単語頻度表生成部
33 部門集計部
34 検索単語頻度表正規化部
35 部門間類似度計算部
36 結果出力部
37 検索ログデータベース
38 検索単語頻度表データベース
39 部門データベース

Claims (10)

  1. 組織内の複数の各部門に設置された複数の端末にネットワークを介して接続される検索分析サーバ装置であって、
    前記複数の端末からそれぞれ送信された検索要求の履歴を、該検索要求による検索単語とその検索要求を行った個人の個人IDと対応付けて記録する検索ログ記録部と、
    前記検索ログ記録部に記録された検索ログを個人ごとに集計し、検索単語とその検索回数とを対応付けた個人別検索単語頻度表を生成する検索単語頻度表生成部と、
    前記個人ごとの個人別検索単語頻度表を部門ごとに集計し、部門別検索単語頻度表を生成する部門集計部と、
    前記部門別検索単語頻度表の検索回数を正規化する検索単語頻度表正規化部と、
    該検索単語頻度表正規化部で正規化して得られた部門ごとの頻度データを基に、部門間の検索単語の類似度を計算する類似度計算部と、
    該類似度計算部で計算された類似度結果を出力する結果出力部と
    を備えたことを特徴とする検索分析サーバ装置。
  2. 前記検索単語頻度表正規化部は、前記個人別検索単語頻度表の検索回数を正規化し、前記類似度計算部は、前記検索単語頻度表正規化部で正規化して得られた個人ごとの頻度データ及び前記部門ごとの頻度データを基に、個人間または個人と部門間の検索単語の類似度を計算することを特徴とする請求項1記載の検索分析サーバ装置。
  3. 前記検索単語頻度表正規化部は、TF−IDF(Term Frequency-Inverse Document Frequency)に基づき検索単語の検索回数を正規化することを特徴とする請求項1または請求項2記載の検索分析サーバ装置。
  4. 前記検索単語頻度表正規化部は、検索回数を正規化して頻度ベクトルを求め、前記類似度計算部は、前記類似度を、前記頻度ベクトルのコサイン距離として計算することを特徴とする請求項1乃至請求項3の何れかに記載の検索分析サーバ装置。
  5. 前記結果出力部は、部門ごとに、その部門で検索回数が多い検索単語と、その部門と類似度が高い部門名を類似度が高い順に示したリストとを類似度結果として作成して出力することを特徴とする請求項1乃至請求項4の何れかに記載の検索分析サーバ装置。
  6. 組織内の複数の各部門に設置された複数の端末にネットワークを介して接続される検索分析サーバ装置における検索分析方法であって、
    前記検索分析サーバ装置は、
    組織内の複数の各部門に設置された複数の端末からそれぞれ送信された検索要求の履歴を、該検索要求による検索単語とその検索要求を行った個人の個人IDとを対応づけて検索ログ記録部に検索ログとして記録する記録工程と、
    前記検索ログ記録部に記録された検索ログを個人ごとに集計し、検索単語とその検索回数とを対応付けた個人別検索単語頻度表を生成する検索単語頻度表生成工程と、
    前記個人ごとの個人別検索単語頻度表を部門ごとに集計し、部門別検索単語頻度表を生成する部門集計工程と、
    前記部門別検索単語頻度表の検索回数を正規化する検索単語頻度表正規化部と、
    前記正規化して得られた部門ごとの頻度データを基に、部門間の検索単語の類似度を計算する類似度計算工程と、
    前記計算された類似度結果を出力する結果出力工程と
    行うことを特徴とする検索分析方法。
  7. 前記検索単語頻度表正規化工程は、前記個人別検索単語頻度表の検索回数を正規化しし、前記類似度計算工程は、前記正規化して得られた個人ごとの頻度データ及び前記部門ごとの頻度データを基に、個人間または個人と部門間の検索単語の類似度を計算することを特徴とする請求項6記載の検索分析方法。
  8. 前記検索単語頻度表正規化工程では、TF−IDF(Term Frequency-Inverse Document Frequency)に基づき検索単語の頻度を正規化することを特徴とする請求項6または請求項7記載の検索分析方法。
  9. 前記検索単語頻度表正規化工程では、検索回数を正規化して頻度ベクトルを求め、前記類似度計算部は、前記類似度を、前記頻度ベクトルのコサイン距離として計算することを特徴とする請求項6乃至請求項8の何れかに記載の検索分析方法。
  10. 前記結果出力工程では、部門ごとに、その部門で検索回数が多い検索単語と、その部門と類似度が高い部門名を類似度が高い順に示したリストとを類似度結果として作成して出力することを特徴とする請求項6乃至請求項9の何れかに記載の検索分析方法。
JP2008221606A 2008-08-29 2008-08-29 検索分析サーバ装置及び検索分析方法 Expired - Fee Related JP5233518B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008221606A JP5233518B2 (ja) 2008-08-29 2008-08-29 検索分析サーバ装置及び検索分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008221606A JP5233518B2 (ja) 2008-08-29 2008-08-29 検索分析サーバ装置及び検索分析方法

Publications (2)

Publication Number Publication Date
JP2010055494A JP2010055494A (ja) 2010-03-11
JP5233518B2 true JP5233518B2 (ja) 2013-07-10

Family

ID=42071317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008221606A Expired - Fee Related JP5233518B2 (ja) 2008-08-29 2008-08-29 検索分析サーバ装置及び検索分析方法

Country Status (1)

Country Link
JP (1) JP5233518B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102073833B1 (ko) * 2019-11-05 2020-02-05 (주)키온비트 복수의 파일들 각각에 대한 피쳐들의 분포 정보를 기초로 기준 파일에 대한 유사 파일의 탐색이 가능한 전자 장치 및 동작 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012014267A (ja) * 2010-06-29 2012-01-19 Canon Electronics Inc 情報分析装置、情報分析方法、情報分析システムおよびプログラム
JP2014179860A (ja) * 2013-03-15 2014-09-25 Nec Corp 通信システム
CN111367971A (zh) * 2020-03-30 2020-07-03 中国建设银行股份有限公司 一种基于数据挖掘的金融系统异常辅助分析方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3722672B2 (ja) * 2000-06-30 2005-11-30 シャープ株式会社 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体,及び設定単語関係者度数集計装置
JP2003076676A (ja) * 2001-06-22 2003-03-14 Toyo Eng Corp 報告書作成を支援する装置、プログラムおよび方法
JP2005339510A (ja) * 2001-11-01 2005-12-08 Matsushita Electric Ind Co Ltd 特許文書評価部署割り当てシステム
JP2003167891A (ja) * 2001-11-29 2003-06-13 Nippon Telegr & Teleph Corp <Ntt> 単語重要度算出方法、装置、プログラム、および記録媒体
JP2003173352A (ja) * 2001-12-05 2003-06-20 Nippon Telegr & Teleph Corp <Ntt> 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
JP2004206517A (ja) * 2002-12-26 2004-07-22 Nifty Corp ホットキーワード提示方法及びホットサイト提示方法
JP2004348626A (ja) * 2003-05-26 2004-12-09 Hitachi Ltd 文書検索方法及び文書検索システム
JP2006185279A (ja) * 2004-12-28 2006-07-13 Kan:Kk アクセス元把握装置及びアクセス元把握方法
JP2006331070A (ja) * 2005-05-26 2006-12-07 Ntt Docomo Inc コミュニティ制御ノード装置、コミュニティ情報探索システム、コミュニティ情報探索方法
JP2007148948A (ja) * 2005-11-30 2007-06-14 Hitachi Ltd 文書検索プログラム
JP2007213401A (ja) * 2006-02-10 2007-08-23 Kddi Corp ユーザ嗜好の音楽データに基づいてコミュニティを構成するコミュニティサイトサーバ及びプログラム
JP4976044B2 (ja) * 2006-04-18 2012-07-18 楽天株式会社 検索履歴保存システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102073833B1 (ko) * 2019-11-05 2020-02-05 (주)키온비트 복수의 파일들 각각에 대한 피쳐들의 분포 정보를 기초로 기준 파일에 대한 유사 파일의 탐색이 가능한 전자 장치 및 동작 방법
WO2021091124A1 (ko) * 2019-11-05 2021-05-14 (주)키온비트 복수의 파일들 각각에 대한 피쳐들의 분포 정보를 기초로 기준 파일에 대한 유사 파일의 탐색이 가능한 전자 장치 및 동작 방법

Also Published As

Publication number Publication date
JP2010055494A (ja) 2010-03-11

Similar Documents

Publication Publication Date Title
US20220005125A1 (en) Systems and methods for collecting and processing alternative data sources for risk analysis and insurance
Currie et al. The conundrum of police officer-involved homicides: Counter-data in Los Angeles County
US10922657B2 (en) Using an employee database with social media connections to calculate job candidate reputation scores
US9135291B2 (en) System and method for determining similarities between online entities
JP6369053B2 (ja) マッチング装置、マッチング方法及びプログラム
Sharara et al. Active surveying: A probabilistic approach for identifying key opinion leaders
Abbasi et al. A social network system for analyzing publication activities of researchers
US10331790B1 (en) System and method for actionizing comments
Cook et al. Aggregating incomplete lists of journal rankings: An application to academic accounting journals
Altin Does resource-based view explain outsourcing intention: Revenue management perspective
KR101425054B1 (ko) 전문가 검색 시스템 및 방법
JP5233518B2 (ja) 検索分析サーバ装置及び検索分析方法
Rowe Forecasting audience increase on youtube
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
Judges et al. A critique of the historical clinical risk–20, version 3, risk assessment instrument
Terranova et al. Perceptions of pretrial risk assessment: An examination across role in the initial pretrial release decision
JP5266975B2 (ja) 個人検索システム、情報処理装置、個人検索方法、プログラムおよび記録媒体
JP7280705B2 (ja) 機械学習装置、プログラム及び機械学習方法
Whittington et al. Unidimensionality of the strengths and vulnerabilities scales in the short-term assessment of risk and treatability (START)
Kim et al. Topic-Driven SocialRank: Personalized search result ranking by identifying similar, credible users in a social network
Iqbal et al. The assessment of perceived information pollution in banking sector: A scale development and validation study
Yu Revisiting unemployment levels and trends in South Africa since the transition
JP6752330B1 (ja) 機械学習ベースのマッチング装置およびマッチング方法
CN115470361A (zh) 数据检测方法以及装置
JP7369920B2 (ja) サーバおよびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130311

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5233518

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees