JP2012014267A - Information analysis device, information analysis method, information analysis system and program - Google Patents

Information analysis device, information analysis method, information analysis system and program Download PDF

Info

Publication number
JP2012014267A
JP2012014267A JP2010148010A JP2010148010A JP2012014267A JP 2012014267 A JP2012014267 A JP 2012014267A JP 2010148010 A JP2010148010 A JP 2010148010A JP 2010148010 A JP2010148010 A JP 2010148010A JP 2012014267 A JP2012014267 A JP 2012014267A
Authority
JP
Japan
Prior art keywords
search keyword
search
browsing history
input
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010148010A
Other languages
Japanese (ja)
Inventor
Takashi Yotsuyanagi
敬志 四柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Electronics Inc
Original Assignee
Canon Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Electronics Inc filed Critical Canon Electronics Inc
Priority to JP2010148010A priority Critical patent/JP2012014267A/en
Publication of JP2012014267A publication Critical patent/JP2012014267A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To easily grasp a use aspect of the Internet by members in an organization from retrieval keywords used in the organization.SOLUTION: An information analysis device includes, for example, input means for inputting browsing history of a Web site on a terminal, extraction means for extracting a retrieval keyword transmitted from the browsing history input by the input means to a retrieval site and identification information of a member inputting the retrieval keyword on the terminal, creation means for creating an analysis result that shows correspondence relation between the retrieval keyword extracted by the extraction means and the identification information of the member, and output means for outputting the analysis result created by the creation means.

Description

本発明は、各端末のインターネットの閲覧履歴を収集して分析する情報分析装置、情報分析方法、情報分析システムおよびプログラムに関する。   The present invention relates to an information analysis apparatus, an information analysis method, an information analysis system, and a program that collect and analyze Internet browsing history of each terminal.

インターネットが普及して多くの人が利用するようになった。このような状況の中、組織においてもインターネットは必要不可欠なものになっている。また、膨大な情報の中から所望の情報を効率的に取得するために、ユーザは、検索サイトを利用する。検索サイトは、ユーザがキーワードを入力し意図した情報を得られるようなサービスを提供している。キーワードにはユーザの意思、嗜好、悩みなどが多分に含まれている。よって、キーワードを解析して利用すれば、有用な分析が可能となろう。   The Internet has spread and many people have used it. Under such circumstances, the Internet is indispensable for organizations. Further, in order to efficiently obtain desired information from a vast amount of information, a user uses a search site. Search sites provide services that allow users to enter keywords and obtain intended information. The keywords often include the user's intentions, preferences, and worries. Therefore, if a keyword is analyzed and used, a useful analysis will be possible.

非特許文献1によれば、検索結果に関連した広告を表示するサービスについて解説されている。広告主のサイトを検索結果に表示されやすくする技術であるSEO(Search Engine Optimization:検索エンジン最適化)に、キーワードの解析結果を利用できる。   Non-Patent Document 1 describes a service for displaying an advertisement related to a search result. Keyword analysis results can be used for SEO (Search Engine Optimization), a technology that makes it easier for advertiser sites to appear in search results.

”Google Adsenseとは”、[online]、Google, Inc.、[平成22年6月17日]、インターネット<https://www.google.com/adsense/support/bin/answer.py?answer=9712&topic=8421&sourceid=aso&subid=ww-ww-et-asui&medium=link>"What is Google Adsense", [online], Google, Inc., [June 17, 2010], Internet <https://www.google.com/adsense/support/bin/answer.py?answer= 9712 & topic = 8421 & sourceid = aso & subid = ww-ww-et-asui & medium = link>

ところで、法人、官公庁、団体および学校などの組織内でもインターネットの検索サイトを活用するユーザ(組織構成員)は多い。しかしながら、従来は、検索キーワードを組織の生産性向上に活用することができなかった。非特許文献1では、検索キーワードに関連した広告が表示されるにすぎない。よって、ある組織内における組織の構成員が有している興味の傾向をその組織が把握することはできなかった。   By the way, there are many users (organizational members) who use Internet search sites in organizations such as corporations, government offices, organizations, and schools. However, conventionally, the search keyword cannot be used for improving the productivity of the organization. In Non-Patent Document 1, only an advertisement related to a search keyword is displayed. Therefore, the organization could not grasp the tendency of interest of the members of the organization within a certain organization.

そこで、本発明は、このような課題および他の課題のうち、少なくとも1つを解決することを目的とする。たとえば、本発明は、組織内において検索キーワードから組織構成員によるインターネットの利用態様を簡便に把握する技術を提供することを目的とする。なお、他の課題については明細書の全体を通して理解できよう。   Therefore, an object of the present invention is to solve at least one of such problems and other problems. For example, an object of the present invention is to provide a technique for easily grasping an Internet usage mode by an organization member from a search keyword in an organization. Other issues can be understood throughout the specification.

本発明による情報分析装置は、組織内に配置された端末におけるWebサイトの閲覧履歴を分析する情報分析装置として実現できる。当該情報分析装置は、たとえば、前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、前記作成手段により作成された分析結果を出力手段とを備えることを特徴とする。   The information analysis apparatus according to the present invention can be realized as an information analysis apparatus that analyzes a browsing history of a Web site at a terminal arranged in an organization. The information analysis apparatus inputs, for example, an input means for inputting a browsing history of a Web site in the terminal, a search keyword transmitted to the search site from the browsing history input by the input means, and a search keyword in the terminal Extraction means for extracting member identification information, creation means for creating an analysis result indicating a correspondence relationship between the search keyword extracted by the extraction means and member identification information, and created by the creation means An analysis result is provided with an output means.

本発明によれば、組織内に配置された各端末におけるWebサイトの閲覧履歴を取得し、閲覧履歴から検索キーワードとそれを入力した構成員の識別情報とを抽出し、これらの対応関係を示す分析結果を作成して出力する。よって、組織内において検索キーワードから構成員によるインターネットの利用態様を簡便に把握することが可能となる。   According to the present invention, a browsing history of a website at each terminal arranged in an organization is acquired, a search keyword and identification information of a member who has input the search keyword are extracted from the browsing history, and a correspondence relationship therebetween is shown. Create and output analysis results. Therefore, it is possible to easily grasp the usage mode of the Internet by the members from the search keyword in the organization.

情報分析システムの一例を示す図である。It is a figure which shows an example of an information analysis system. 端末装置のハードウエア構成を示す図である。It is a figure which shows the hardware constitutions of a terminal device. ログ管理サーバのハードウエア構成を示す図である。It is a figure which shows the hardware constitutions of a log management server. 情報分析装置のハードウエア構成を示す図である。It is a figure which shows the hardware constitutions of an information analyzer. ログ管理DBの記録内容の一例を示す図である。It is a figure which shows an example of the recording content of log management DB. 情報分析装置が実行する情報分析処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the information analysis process which an information analyzer performs. キーワード開始位置符号テーブルの一例を示す図である。It is a figure which shows an example of a keyword start position code table. 閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。It is a figure which shows an example of the method of extracting a search keyword from browsing history. 閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。It is a figure which shows an example of the method of extracting a search keyword from browsing history. キーワード分類テーブルの一例を示す図である。It is a figure which shows an example of a keyword classification table. 分析結果DBの一例を示す図である。It is a figure which shows an example of analysis result DB. 分析結果DBの他の例(人脈マップ)を示す図である。It is a figure which shows the other example (human network map) of analysis result DB.

本発明の実施の形態における検索キーワードの情報分析システムについて説明する。第一実施形態では、組織内に配置された各端末装置はWebサイトへ送信されたURLと検索キーワードとを含むリクエストデータを記録し、ログ管理サーバに送信する。ログ管理サーバは、これを閲覧履歴として収集し、収集した閲覧履歴を情報分析装置に入力する。情報分析装置が、閲覧履歴に含まれている検索キーワードを抽出して出力することで、組織内のユーザの利用態様を簡便に把握することができる。   A search keyword information analysis system according to an embodiment of the present invention will be described. In the first embodiment, each terminal device arranged in the organization records request data including the URL and the search keyword transmitted to the website, and transmits the request data to the log management server. The log management server collects this as browsing history, and inputs the collected browsing history to the information analysis apparatus. By extracting and outputting the search keyword included in the browsing history, the information analysis apparatus can easily grasp the usage mode of the user in the organization.

なお、組織内に配置された端末装置とは、その組織の事業のために構成員によって使用される端末装置のことである。端末装置には、たとえば、組織から構成員に貸与された端末装置や、構成員が所有しているもののその組織の事業に使用される端末装置が含まれる。端末装置は、たとえば、その組織のイントラネットを通じてインターネットにアクセスする端末装置や、他の組織から提供されたアクセスネットワークを介してインターネットにアクセスする端末装置であってもよい。また、その組織が所有または占有している土地や建物に端末装置が設置されていてもよいし、その外部に設置されていなくてもよい。端末装置は、固定端末であってもよいし、移動端末であってもよい。組織は、法人、官公庁、団体および学校など、営利を目的とした組織や非営利の組織を含む。また、学校は、私立と公立の別を問わず、専門学校や予備校など、各種の教育事業組織も含まれる。構成員は、所属する組織によって呼び名が異なることがある。たとえば、企業であれば従業員や社員が構成員であり、学校であれば生徒や学生、教職員が構成員であり、官公庁であれば職員や公務員が構成員である。なお、これらの定義は例示にすぎない。   The terminal device arranged in the organization is a terminal device used by a member for the business of the organization. The terminal device includes, for example, a terminal device lent to a member from an organization and a terminal device that is owned by a member but used for the business of the organization. The terminal device may be, for example, a terminal device that accesses the Internet through the organization's intranet or a terminal device that accesses the Internet via an access network provided by another organization. Moreover, the terminal device may be installed in a land or building owned or occupied by the organization, or may not be installed outside the terminal device. The terminal device may be a fixed terminal or a mobile terminal. Organizations include for-profit organizations and non-profit organizations such as corporations, government agencies, organizations and schools. Schools also include various educational business organizations such as vocational schools and prep schools, whether private or public. Members may have different names depending on the organization they belong to. For example, in the case of a company, employees and employees are members, in the case of a school, students, students and faculty members are members, and in the case of a government office, employees and civil servants are members. These definitions are merely examples.

(システム構成)
図1は、情報分析システムの一例を示す図である。情報分析システムは、複数の端末装置11a、11bと、ログ管理サーバ12と、情報分析装置13とを備えている。端末装置11a、11bは、組織内に配置された端末の一例である。ログ管理サーバ12は、組織内に配置された端末装置によるWebサイトの閲覧ログ(閲覧履歴)を管理する。情報分析装置13は、組織内に配置された端末装置におけるWebサイトの閲覧履歴を分析する情報分析装置の一例である。これらの装置はLAN(Local Area Network)を含むイントラネットやインターネットなどの各種のネットワーク50を介して接続されている。端末装置11a、11bに共通する事項について説明するときは、単に端末装置11と記載することにする。
(System configuration)
FIG. 1 is a diagram illustrating an example of an information analysis system. The information analysis system includes a plurality of terminal devices 11a and 11b, a log management server 12, and an information analysis device 13. The terminal devices 11a and 11b are examples of terminals arranged in an organization. The log management server 12 manages a browsing log (viewing history) of a Web site by a terminal device arranged in the organization. The information analysis device 13 is an example of an information analysis device that analyzes a browsing history of a Web site in a terminal device arranged in an organization. These devices are connected via various networks 50 such as an intranet including a LAN (Local Area Network) and the Internet. When the matters common to the terminal devices 11a and 11b are described, they are simply referred to as the terminal device 11.

ログ管理サーバ12は、端末装置11が設置されている組織内に配置されていてもよいし、他の組織内に配置されていてもよい。同様に、情報分析装置13も、端末装置11が設置されている組織内に配置されていてもよいし、他の組織内に配置されていてもよい。また、ログ管理サーバ12と情報分析装置13は、同一組織によって管理されてもよいし、それぞれ他の組織によって管理されてもよい。   The log management server 12 may be arranged in an organization in which the terminal device 11 is installed, or may be arranged in another organization. Similarly, the information analysis device 13 may be arranged in the organization where the terminal device 11 is installed, or may be arranged in another organization. Further, the log management server 12 and the information analysis device 13 may be managed by the same organization, or may be managed by other organizations.

Webサーバ30は、端末装置11にWebサービスを提供するコンピュータである。Webサーバ30はイントラネットに接続されているものや、インターネットに接続されているものなど様々である。   The web server 30 is a computer that provides a web service to the terminal device 11. There are various Web servers 30 such as those connected to an intranet and those connected to the Internet.

端末装置11は、Webサーバ30が提供するWebサイトを組織内の構成員(ユーザ)が閲覧するために使用する情報処理装置(コンピュータ)である。端末装置11は、WebサイトをWebブラウザによってユーザが閲覧する際に端末装置11へ入力される各種の操作内容を監視して閲覧履歴を取得する監視部14を備えている。監視部14は、自己の端末におけるWebサイトの閲覧履歴を記録する記録手段として機能する。閲覧履歴には、たとえば、Webサイトに関する以下のものが含まれる。
・ マシン名・・・各端末装置に付与された識別情報
・ ユーザ名・・・各ユーザに付与された識別情報
・ 閲覧日時・・・Webサイトを閲覧した日時
・ WebサイトのURL
端末装置11の監視部14は、定期的(たとえば、1分ごと)または閲覧しているWebサイトが変更されるたびに閲覧履歴を取得してログ管理サーバ12に送信する。なお、ログ管理サーバ12に閲覧履歴を送信する条件は、所定時間が経過したとき(たとえば、2時間毎)、所定量以上の閲覧履歴が蓄積されたとき、端末装置11が起動したとき、端末装置11がシャットダウンを指示されたとき、ログ管理サーバ12からの閲覧履歴の送信を要求されたときなど、様々な条件を設定可能である。
The terminal device 11 is an information processing device (computer) used by a member (user) in an organization to browse a Web site provided by the Web server 30. The terminal device 11 includes a monitoring unit 14 that monitors various operation contents input to the terminal device 11 when a user browses a website using a web browser and acquires a browsing history. The monitoring unit 14 functions as a recording unit that records the browsing history of the Web site in its own terminal. The browsing history includes, for example, the following items related to Web sites.
-Machine name: Identification information assigned to each terminal device-User name: Identification information assigned to each user-Browsing date: Date of browsing the website-URL of the website
The monitoring unit 14 of the terminal device 11 acquires a browsing history and transmits it to the log management server 12 periodically (for example, every minute) or whenever the browsing website is changed. The condition for transmitting the browsing history to the log management server 12 is that when a predetermined time has elapsed (for example, every two hours), when a browsing history of a predetermined amount or more is accumulated, when the terminal device 11 is activated, Various conditions can be set, for example, when the apparatus 11 is instructed to shut down, or when transmission of browsing history is requested from the log management server 12.

ログ管理サーバ12は、端末装置11における閲覧履歴を管理する情報処理装置である。図1が示すように、ログ管理サーバ12は、ログ管理DB15を備える。DBはデータベースの略称である。ログ管理サーバ12は、端末装置11から受信した閲覧履歴に基づいて、ログ管理DB15に、端末装置毎(またはユーザ毎)に閲覧履歴を記録する。   The log management server 12 is an information processing device that manages a browsing history in the terminal device 11. As shown in FIG. 1, the log management server 12 includes a log management DB 15. DB is an abbreviation for database. The log management server 12 records the browsing history for each terminal device (or for each user) in the log management DB 15 based on the browsing history received from the terminal device 11.

情報分析装置13は、キーワード検出部16、キーワード判定部17、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を備える。情報分析装置13は、ログ管理サーバ12からネットワーク50を介して受信した閲覧履歴に基づいて、閲覧内容(たとえば、検索キーワードの利用状況)を分析して出力する。情報分析装置13のネットワークインターフェースは、端末におけるWebサイトの閲覧ログを入力する入力手段(受付手段)の一例である。   The information analysis apparatus 13 includes a keyword detection unit 16, a keyword determination unit 17, a keyword classification table 18, an analysis result DB 19, and a keyword start position code table 20. Based on the browsing history received from the log management server 12 via the network 50, the information analysis device 13 analyzes and outputs the browsing content (for example, the usage status of the search keyword). The network interface of the information analysis device 13 is an example of an input unit (accepting unit) for inputting a web site browsing log in the terminal.

なお、ログ管理サーバ12から情報分析装置13への閲覧履歴の受け渡しは、ネットワーク50であってもよいし、外部記憶媒体(FD、MO、USBメモリ、CD−R、DVD−RAM等)であってもよい。情報分析装置13は、このような外部記憶媒体のドライブ装置を備え、端末におけるWebサイトの閲覧ログを入力する入力手段として機能する。   It should be noted that the browsing history is transferred from the log management server 12 to the information analysis apparatus 13 via the network 50 or an external storage medium (FD, MO, USB memory, CD-R, DVD-RAM, etc.). May be. The information analysis device 13 includes such a drive device for an external storage medium, and functions as an input means for inputting a web site browsing log in the terminal.

キーワード検出部16は、キーワード開始位置符号テーブル20を参照して検索キーワードを抽出する。キーワード開始位置符号テーブル20には、Webサイトへ送信されたリクエストにおいてURLと検索キーワードとを区別するための符号(キー)が、各検索サイトごとに登録されている。この符号(キー)は、”p=”や”q=”など検索エンジンごとに異なっている。キーワード検出部16は、URLを抽出し、抽出したURLが検索サイトのURLかどうかを判定したり、検索キーワードの抽出してキーワード判定部17へ渡したりする。   The keyword detection unit 16 refers to the keyword start position code table 20 and extracts a search keyword. In the keyword start position code table 20, a code (key) for distinguishing between a URL and a search keyword in a request transmitted to a Web site is registered for each search site. This code (key) is different for each search engine such as “p =” and “q =”. The keyword detection unit 16 extracts a URL, determines whether the extracted URL is a URL of a search site, extracts a search keyword, and passes it to the keyword determination unit 17.

キーワード判定部17は、キーワード検出部16により抽出された検索キーワードがキーワード分類テーブル18に予め登録されている検索キーワードと一致するかどうかを判定したり、キーワード分類テーブル18を参照して抽出された検索キーワードを分類し、分類結果を分析結果DB19に記憶したりする。キーワード分類テーブル18には、検索キーワードと、その分類名とが対応付けて記録されている。情報分析装置13はこの分析結果から視覚的な分析結果(グラフや表など)を作成し表示装置や印刷装置に出力してもよい。   The keyword determination unit 17 determines whether the search keyword extracted by the keyword detection unit 16 matches a search keyword registered in advance in the keyword classification table 18 or is extracted by referring to the keyword classification table 18. The search keywords are classified, and the classification result is stored in the analysis result DB 19. In the keyword classification table 18, search keywords and their classification names are recorded in association with each other. The information analysis device 13 may create a visual analysis result (such as a graph or a table) from the analysis result and output it to a display device or a printing device.

(ハードウエア構成)
図2Aは、端末装置11のハードウエア構成を示す図である。端末装置11は、オフィスなどに配置されるパーソナルコンピュータなどの情報処理装置である。端末装置11では、ハードディスクドライブ(HDD25)に記憶されているソフトウエアにしたがってCPU21が各種手段として機能する。とりわけ、CPU21は、上述した監視部14として機能し、Webサイトへ送信されたWebページのリクエストデータを監視する。一般に、検索サイトへ送信されるリクエストデータには、WebサイトのURLと、Webサイトへ送信された検索キーワードとが含まれている。CPU21(監視部14)は、リクエストデータや閲覧日時、ユーザ名やコンピュータ名をWebサイトの閲覧履歴として取得し、ログ管理サーバ12へ送信する。表示装置22は、情報を表示するためのユーザインタフェースである。メモリ23は、RAMやROMなどを含む。ネットワークインターフェース24は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD25は、Webサイトから受信したWebコンテンツを表示するためのWebブラウザプログラム27や、インターネットの閲覧操作を監視して閲覧レコードを作成する監視プログラム28などを記憶する。入力部26は、ポインティングデバイス(マウスやタッチパネル)やキーボードなどである。キーボードはソフトウエアキーボードであってもよい。また、入力部26は、入力された操作者の音声を音声認識機能により認識してCPU21へ指示を入力する音声認識入力部であってもよい。
(Hardware configuration)
FIG. 2A is a diagram illustrating a hardware configuration of the terminal device 11. The terminal device 11 is an information processing device such as a personal computer disposed in an office or the like. In the terminal device 11, the CPU 21 functions as various means according to software stored in the hard disk drive (HDD 25). In particular, the CPU 21 functions as the monitoring unit 14 described above, and monitors the request data of the Web page transmitted to the Web site. In general, the request data transmitted to the search site includes the URL of the Web site and the search keyword transmitted to the Web site. The CPU 21 (monitoring unit 14) acquires the request data, the browsing date, the user name, and the computer name as the browsing history of the Web site, and transmits them to the log management server 12. The display device 22 is a user interface for displaying information. The memory 23 includes RAM, ROM, and the like. The network interface 24 is a communication circuit for communicating with other computers via the network 50. The HDD 25 stores a Web browser program 27 for displaying Web content received from the Web site, a monitoring program 28 for monitoring browsing operations on the Internet and creating browsing records. The input unit 26 is a pointing device (mouse or touch panel) or a keyboard. The keyboard may be a software keyboard. The input unit 26 may be a voice recognition input unit that recognizes the input voice of the operator using a voice recognition function and inputs an instruction to the CPU 21.

図2Bは、ログ管理サーバ12のハードウエア構成を示す図である。ログ管理サーバ12も、コンピュータの一種である。ログ管理サーバ12では、ハードディスクドライブ(HDD35)に記憶されているソフトウエアにしたがってCPU31が各種手段として機能する。メモリ33は、RAMやROMなどを含む。ネットワークインターフェース34は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD35は、ログ管理プログラム36やログ管理DB15を記憶する。   FIG. 2B is a diagram illustrating a hardware configuration of the log management server 12. The log management server 12 is also a kind of computer. In the log management server 12, the CPU 31 functions as various means according to software stored in the hard disk drive (HDD 35). The memory 33 includes RAM, ROM, and the like. The network interface 34 is a communication circuit for communicating with other computers through the network 50. The HDD 35 stores a log management program 36 and a log management DB 15.

図2Cは、情報分析装置13のハードウエア構成を示す図である。情報分析装置13も、コンピュータの一種である。情報分析装置13では、ハードディスクドライブ(HDD45)に記憶されているソフトウエアにしたがってCPU41が各種手段として機能する。メモリ43は、RAMやROMなどを含む。ネットワークインターフェース44は、ネットワーク50を通じて他のコンピュータと通信するための通信回路である。HDD45は、情報分析プログラム46や、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を記憶する。   FIG. 2C is a diagram illustrating a hardware configuration of the information analysis device 13. The information analysis device 13 is also a kind of computer. In the information analysis device 13, the CPU 41 functions as various means according to software stored in the hard disk drive (HDD 45). The memory 43 includes RAM, ROM, and the like. The network interface 44 is a communication circuit for communicating with other computers via the network 50. The HDD 45 stores an information analysis program 46, a keyword classification table 18, an analysis result DB 19, and a keyword start position code table 20.

(ログ管理データベース)
図3は、ログ管理DB15の記録内容の一例を示す図である。図3では、端末装置11から受信した、Webサイトの閲覧に関する閲覧ログ(閲覧履歴)の一例を示している。PC名の欄301には、端末装置11の端末識別情報が記録される。ユーザ名の欄302には、端末装置11の利用者(ログインユーザ)の識別情報が記録される。閲覧日時の欄303には、Webサイトを閲覧した日時が記録される。URLの欄304には、端末装置11を通じてユーザが閲覧したWebサイトの識別情報(URL)が記録される。端末装置11の監視部14は、基本的に、閲覧対象のWebサイトのURLを指定したり、変更したりするたびに、1レコード分の閲覧履歴を送信する。よって、ログ管理DB15には、Webサイトの閲覧日時にしたがって、各レコードが時系列に沿って記録されている。
(Log management database)
FIG. 3 is a diagram illustrating an example of recorded contents of the log management DB 15. FIG. 3 shows an example of a browsing log (browsing history) received from the terminal device 11 relating to browsing of the website. In the PC name column 301, terminal identification information of the terminal device 11 is recorded. In the user name column 302, identification information of the user (login user) of the terminal device 11 is recorded. The browsing date / time column 303 records the date / time when the Web site was browsed. In the URL field 304, identification information (URL) of a Web site browsed by the user through the terminal device 11 is recorded. The monitoring unit 14 of the terminal device 11 basically transmits a browsing history for one record each time a URL of a browsing target Web site is designated or changed. Therefore, each record is recorded in the log management DB 15 in chronological order according to the browsing date of the website.

(情報分析装置の処理)
図4は、情報分析装置13が実行する情報分析処理の流れを示すフローチャートである。CPU41が情報分析プログラム46をHDD45から読み出してメモリ43のRAMへロードすることで、本処理が開始される。
(Processing of information analyzer)
FIG. 4 is a flowchart showing a flow of information analysis processing executed by the information analysis apparatus 13. The CPU 41 reads the information analysis program 46 from the HDD 45 and loads it into the RAM of the memory 43, whereby this processing is started.

S401で、情報分析装置13のCPU41は、ログ管理DB15に記録されている閲覧履歴を、ネットワーク50を介してメモリ43のRAMに入力する。なお、入力単位は、ユーザ単位、グループ単位、所定期間など、自由に設定できる。グループは、複数のユーザにより構成されている。たとえば、組織内の組織(部・課・係など)をグループとしてもよい。あるいは、グループは、複数のPCから構成されていてもよい。各グループにも固有の識別情報が付与される。上述したように、閲覧履歴は、外部記憶媒体(FD、MO、USB、CD−R、DVD−RAM等)を通じて入力されてもよい。   In S <b> 401, the CPU 41 of the information analysis device 13 inputs the browsing history recorded in the log management DB 15 to the RAM of the memory 43 via the network 50. The input unit can be freely set, such as a user unit, a group unit, or a predetermined period. A group is composed of a plurality of users. For example, an organization (department, section, staff, etc.) within the organization may be a group. Alternatively, the group may be composed of a plurality of PCs. Unique identification information is also given to each group. As described above, the browsing history may be input through an external storage medium (FD, MO, USB, CD-R, DVD-RAM, etc.).

S402で、CPU41は、閲覧履歴に未処理のレコードが存在するか否かを判定する。未処理のレコードが存在する場合S403に進む。未処理のレコードが存在しなければ、CPU41は、本処理を終了する。   In S402, the CPU 41 determines whether there is an unprocessed record in the browsing history. When there is an unprocessed record, the process proceeds to S403. If there is no unprocessed record, the CPU 41 ends this process.

S403で、キーワード検出部16として機能するCPU41は、閲覧履歴から未処理のレコードを1つ読み出し、読み出したレコードからURLを抽出する。このように、キーワード検出部16やCPU41は、入力手段を通じて入力された閲覧履歴から検索に使用された検索サイトのURLを抽出する抽出手段として機能する。   In S403, the CPU 41 functioning as the keyword detection unit 16 reads one unprocessed record from the browsing history, and extracts a URL from the read record. Thus, the keyword detection unit 16 and the CPU 41 function as an extraction unit that extracts the URL of the search site used for the search from the browsing history input through the input unit.

S404で、キーワード検出部16として機能するCPU41は、抽出したURLが検索サイトのURLかどうかを判定する。上述したように、キーワード開始位置符号テーブル20には、検索サイトのURLが予め登録されている。そこで、CPU41は、抽出したURLがキーワード開始位置符号テーブル20に登録されているURLかどうかを判定する。抽出したURLが検索サイトのURLであればS405に進む。一方、抽出したURLが検索サイトのURLでなければS409に進む。   In S404, the CPU 41 functioning as the keyword detection unit 16 determines whether or not the extracted URL is the URL of the search site. As described above, the URL of the search site is registered in the keyword start position code table 20 in advance. Therefore, the CPU 41 determines whether or not the extracted URL is a URL registered in the keyword start position code table 20. If the extracted URL is the URL of the search site, the process proceeds to S405. On the other hand, if the extracted URL is not the URL of the search site, the process proceeds to S409.

図5は、キーワード開始位置符号テーブル20の一例を示す図である。URL(ホスト名)の欄501には、検索サイトのホスト名が登録される。キーワード開始位置符号の欄502には、検索サイトのURLと検索キーワードとを区別するための符号(キー)が登録されている。すなわち、Webページのリクエストにおいてキーワード開始位置符号(例:q=)より後ろにある文字がユーザにより入力された検索キーワードである。なお、キーワード開始位置符号テーブル20は、検索キーワードの抽出だけでなく、Webサイトが検索サイトかどうかを判定するためにも使用される。   FIG. 5 is a diagram illustrating an example of the keyword start position code table 20. In the URL (host name) column 501, the host name of the search site is registered. In the keyword start position code field 502, codes (keys) for distinguishing the URL of the search site from the search keyword are registered. In other words, in the Web page request, the character after the keyword start position code (eg, q =) is the search keyword input by the user. The keyword start position code table 20 is used not only to extract search keywords but also to determine whether a Web site is a search site.

S405で、キーワード検出部16として機能するCPU41は、読み出したレコードから検索キーワードを抽出する。CPU41は、キーワード開始位置符号テーブル20を参照し、抽出したURLに対応して登録されている検索キーワード開始位置符号を読み出す。さらに、CPU41は、読み出した検索キーワード開始位置符号に基づいて、レコードから検索キーワードを抽出する。このように、キーワード検出部16やCPU41は、入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードを抽出する抽出手段として機能する。   In S405, the CPU 41 functioning as the keyword detection unit 16 extracts a search keyword from the read record. The CPU 41 reads the search keyword start position code registered corresponding to the extracted URL with reference to the keyword start position code table 20. Further, the CPU 41 extracts a search keyword from the record based on the read search keyword start position code. As described above, the keyword detection unit 16 and the CPU 41 function as an extraction unit that extracts the search keyword transmitted to the search site from the browsing history input by the input unit.

図6A、6Bは、閲覧履歴から検索キーワードを抽出する方法の一例を示す図である。とりわけ、図6Aでは、検索サイトがfooの場合の検索キーワードの抽出方法が示されている。なお、よく知られているように、foo、bar、hoge、fuga、piyoは例示のためのメタ構文変数にすぎない。検索サイトがfooのキーワード開始位置符号(キー)は、キーワード開始位置符号テーブル20によると”q=”であることがわかる。よって、CPU41は、q=以降にある文字(hogehoge)をユーザにより検索サイトへ入力された検索キーワードであると認識して抽出する。なお、日本語の検索キーワードは、2バイト文字であるため、一般には、1バイト文字に変換(エンコード)されて表示される。よって、CPU41は、検索キーワードを抽出する際に、1バイト文字により表現されている検索キーワードを元の2バイト文字に逆変換する。   6A and 6B are diagrams illustrating an example of a method for extracting a search keyword from the browsing history. In particular, FIG. 6A shows a search keyword extraction method when the search site is foo. As is well known, foo, bar, hoge, fuga, and piyo are only meta-syntax variables for illustration. According to the keyword start position code table 20, the keyword start position code (key) of the search site foo is “q =”. Therefore, the CPU 41 recognizes and extracts characters (hogehoge) after q = as a search keyword input to the search site by the user. Since Japanese search keywords are double-byte characters, they are generally displayed after being converted (encoded) into single-byte characters. Therefore, when extracting the search keyword, the CPU 41 reversely converts the search keyword expressed by the 1-byte character into the original 2-byte character.

図6Bでは、検索サイトがbarの場合の検索キーワードの抽出方法が示されている。検索サイトがbarのキーワード開始位置符号(キー)は、キーワード開始位置符号テーブル20によると”p=”であることがわかる。よって、CPU41は、p=以降にある文字(hogehoge)をユーザにより検索サイトへ入力された検索キーワードであると認識して抽出する。このように、CPU41は、各検索エンジンのURLと、各検索エンジンへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを閲覧履歴から抽出する抽出手段として機能する。   FIG. 6B shows a method for extracting a search keyword when the search site is bar. According to the keyword start position code table 20, the keyword start position code (key) of the search site bar is “p =”. Therefore, the CPU 41 recognizes and extracts characters (hogehoge) after p = as a search keyword input to the search site by the user. In this way, the CPU 41 determines the start position of the search keyword according to the code table showing the correspondence between the URL of each search engine and the code indicating the start position of the search keyword in the request data transmitted to each search engine. It functions as an extracting means for extracting the search keyword recorded following the indicated code from the browsing history.

S406で、CPU41は、検索キーワードの抽出に成功したか否かを判定する。検索キーワードの抽出に成功していなければS409に進む。検索キーワードの抽出に成功したのであれば、S407に進む。   In S406, the CPU 41 determines whether the search keyword has been successfully extracted. If the search keyword has not been successfully extracted, the process proceeds to S409. If the search keyword has been successfully extracted, the process proceeds to S407.

S407で、キーワード判定部17として機能するCPU41は、抽出した検索キーワードを分類する。たとえば、CPU41は、キーワード分類テーブル18を参照し、抽出した検索キーワードに対応する分類を検索し、検索により見つかった分類名を当該検索キーワードに付与する。なお、キーワード分類テーブル18に一致する検索キーワードが存在しなければ、CPU41は「未分類」を示すフラグを分類名として付与する。このように、CPU41は、分類テーブルにしたがって、抽出手段により抽出された検索キーワードに分類を付与する分類付与手段として機能する。   In S407, the CPU 41 functioning as the keyword determination unit 17 classifies the extracted search keywords. For example, the CPU 41 refers to the keyword classification table 18 to search for a classification corresponding to the extracted search keyword, and assigns the classification name found by the search to the search keyword. If there is no matching keyword in the keyword classification table 18, the CPU 41 assigns a flag indicating “unclassified” as a classification name. As described above, the CPU 41 functions as a classification providing unit that assigns a classification to the search keyword extracted by the extraction unit in accordance with the classification table.

図7は、キーワード分類テーブル18の一例を示す図である。検索キーワードの欄701には、検索キーワードが登録される。分類名の欄702には、検索キーワードに対応する分類名(カテゴリ名)が登録される。たとえば、抽出された検索キーワードが「とらえもん」であれば、対応する分類名は「業務外」である。   FIG. 7 is a diagram illustrating an example of the keyword classification table 18. Search keywords are registered in the search keyword column 701. In the category name column 702, a category name (category name) corresponding to the search keyword is registered. For example, if the extracted search keyword is “Toraemon”, the corresponding classification name is “out of business”.

S408で、CPU41は、閲覧履歴のレコードから抽出したPC名、ユーザ名、閲覧日時および検索キーワードと、キーワード分類テーブル18から抽出した分類名との対応関係を示す分析結果レコードを作成し、分析結果DB19に登録する。このように、CPU41は、入力手段によって入力された閲覧履歴から端末において検索キーワードを入力したユーザの識別情報を抽出する抽出手段として機能する。また、CPU41は、抽出手段により抽出された検索キーワードとユーザの識別情報との対応関係を示した分析結果を作成する作成手段として機能する。S409で、CPU41は、次のレコードを読み出し、S402に戻る。すべての分析処理が終了すると、CPU41は、分析結果を表示装置に出力したり、音声出力装置に出力したり、電子メールの本文に出力して所定のアドレスへ送信したり、イントラネット内のWebサイトのWebページとして出力したり、記憶装置にデータとして出力する。このように、CPU41や協働する周辺装置は、作成手段により作成された分析結果を出力する出力手段として機能する。   In S408, the CPU 41 creates an analysis result record indicating the correspondence between the PC name, user name, browsing date and search keyword extracted from the browsing history record, and the classification name extracted from the keyword classification table 18, and the analysis result Register in DB19. Thus, the CPU 41 functions as an extraction unit that extracts identification information of the user who has input the search keyword in the terminal from the browsing history input by the input unit. Further, the CPU 41 functions as a creation unit that creates an analysis result indicating a correspondence relationship between the search keyword extracted by the extraction unit and the user identification information. In S409, the CPU 41 reads the next record and returns to S402. When all the analysis processes are completed, the CPU 41 outputs the analysis result to a display device, outputs it to an audio output device, outputs it to the body of an e-mail, and sends it to a predetermined address, or a website in the intranet As a Web page or as data to a storage device. As described above, the CPU 41 and the cooperating peripheral devices function as output means for outputting the analysis result created by the creation means.

(分析結果データベース)
図8は、分析結果DBの一例を示す図である。PC名の欄801には、端末装置11の端末識別情報が記録される。ユーザ名の欄802には、ユーザの識別情報が記録される。閲覧日時の欄803には、Webサイトを閲覧した日時が記録される。つまり、閲覧日時の欄803には、検索キーワードが送信された日時を示す日時データが記録されている。検索キーワードの欄804には、検索キーワードが登録される。PC名から検索キーワードまでは、閲覧履歴のレコードから抽出されたデータである。分類名の欄805には、検索キーワードに対応する分類名が登録される。分類名は、キーワード分類テーブル18から抽出した分類名または「未分類」である。
(Analysis result database)
FIG. 8 is a diagram illustrating an example of the analysis result DB. In the PC name column 801, terminal identification information of the terminal device 11 is recorded. In the user name column 802, user identification information is recorded. The browsing date / time field 803 records the date and time when the Web site was browsed. That is, date / time data indicating the date / time at which the search keyword was transmitted is recorded in the browsing date / time column 803. Search keywords are registered in the search keyword column 804. From the PC name to the search keyword is data extracted from the browsing history record. In the category name column 805, the category name corresponding to the search keyword is registered. The classification name is a classification name extracted from the keyword classification table 18 or “unclassified”.

分析結果DBには構成員が使用した検索キーワードが含まれているため、構成員が関心を持っている検索キーワードをその上司や管理者等が把握しやすくなる。つまり、組織内で社員がどのような技術や情報を知りたがっているか、またはどのような知識が不足しているかを把握することができる。なお、CPU41は、分析結果DB19に対して様々な統計処理を適用してもよい。たとえば、CPU41は、分析結果DB19に登録されている同一または類似の検索キーワードの数を算出することで、分析結果DB19に登録されているうちで最も多く使用された検索キーワードを特定してもよい。また、CPU41は、さらに、分類名を使用して分析結果DB19をソートすることで、構成員にどのような分類の知識が不足しているかを検出し、その検索キーワードをリスト化してもよい。このリストに基づいて、経営者や管理者は適切な情報提供(参考書購入、勉強会開催など)のアクションを起こすことができるため、構成員の生産性向上に役立てることができる。なお、CPU41は、経営者や管理者のメールアドレスに当該リストを添付して送信してもよい。たとえば、HDD45は、各ユーザの識別情報と、各ユーザが所属するグループの識別情報と、各グループの責任者の識別情報とを対応付けて登録した組織管理テーブルを記憶している。組織管理テーブルには、各構成員(ユーザ)の社員番号、氏名、メールアドレス、所属グループの識別番号、上司の社員番号などが関連付けて記憶されている。よって、CPU41は、組織管理テーブルにしたがって、各グループに所属するユーザの識別情報を抽出し、抽出した識別情報を検索キーとして分析結果DBを検索し、当該ユーザが検索に使用した検索キーワードを抽出する。そして、CPU41は、各グループに所属しているユーザによって送信された検索キーワードのリストをグループごとに作成する。さらに、CPU41やネットワークインターフェース44は、そのグループの責任者へ電子メールにより通知する通知手段として機能してもよい。   Since the analysis result DB includes the search keywords used by the members, it becomes easier for the supervisor or administrator to grasp the search keywords that the members are interested in. In other words, it is possible to grasp what technology and information employees want to know in the organization or what kind of knowledge is lacking. The CPU 41 may apply various statistical processes to the analysis result DB 19. For example, the CPU 41 may identify the most frequently used search keyword registered in the analysis result DB 19 by calculating the number of identical or similar search keywords registered in the analysis result DB 19. . Further, the CPU 41 may further sort the analysis result DB 19 using the classification name to detect what kind of classification is lacking in the members and list the search keywords. Based on this list, managers and managers can take appropriate actions to provide information (purchase reference books, hold study meetings, etc.), which can help improve the productivity of members. Note that the CPU 41 may transmit the list attached to the mail address of the manager or administrator. For example, the HDD 45 stores an organization management table in which identification information of each user, identification information of a group to which each user belongs, and identification information of a person in charge of each group are registered in association with each other. The organization management table stores employee numbers, names, email addresses, group identification numbers, supervisor employee numbers, and the like of each member (user) in association with each other. Therefore, the CPU 41 extracts the identification information of the users belonging to each group according to the organization management table, searches the analysis result DB using the extracted identification information as a search key, and extracts the search keyword used by the user for the search. To do. Then, the CPU 41 creates a list of search keywords transmitted by the users belonging to each group for each group. Further, the CPU 41 and the network interface 44 may function as notification means for notifying the person in charge of the group by electronic mail.

図9は、分析結果DBの他の例(人脈マップ)を示す図である。検索キーワードの欄901には、検索キーワードが登録される。分類名の欄902には、検索キーワードに対応する分類名が登録される。PC名の欄903には、同一の検索キーワードを使用した1台以上の端末識別情報が記録される。ユーザ名の欄904には、同一の検索キーワードを使用した一人以上のユーザの識別情報が記録される。このように、CPU41は、分析結果を分類毎に並べ替えることにより、社内の人脈マップを作成することができる。図9に示した人脈マップから、同一または類似した検索を行っているユーザを把握することができる。CPU41は、経営者や管理者のメールアドレスに当該人脈マップを添付して送信してもよい。CPU41は、各検索キーワードごとに、その検索キーワードを入力した複数のユーザの識別情報をまとめた分析結果を作成する作成手段として機能している。同様に、CPU41は、各検索キーワードごとに、その検索キーワードを入力した複数の端末の識別情報をまとめた分析結果を作成する作成手段として機能する。   FIG. 9 is a diagram showing another example (human network map) of the analysis result DB. Search keywords are registered in the search keyword column 901. In the category name column 902, the category name corresponding to the search keyword is registered. In the PC name column 903, one or more terminal identification information using the same search keyword is recorded. In the user name column 904, identification information of one or more users using the same search keyword is recorded. In this way, the CPU 41 can create an in-house personality map by sorting the analysis results for each classification. The user who is performing the same or similar search can be grasped from the personal network map shown in FIG. CPU41 may attach and transmit the said personal network map to the mail address of a manager or an administrator. For each search keyword, the CPU 41 functions as a creation unit that creates an analysis result that summarizes the identification information of a plurality of users who input the search keyword. Similarly, for each search keyword, the CPU 41 functions as a creation unit that creates an analysis result that summarizes the identification information of a plurality of terminals that have input the search keyword.

本実施形態によれば、組織内に配置された各端末におけるWebサイトの閲覧履歴を取得し、閲覧履歴から検索キーワードとそれを入力したユーザの識別情報とを抽出し、これらの対応関係を示す分析結果を作成して出力する。よって、組織内において検索キーワードから構成員によるインターネットの利用態様を簡便に把握することが可能となる。   According to the present embodiment, the browsing history of the website at each terminal arranged in the organization is acquired, the search keyword and the identification information of the user who has input the search keyword are extracted from the browsing history, and the correspondence between them is shown. Create and output analysis results. Therefore, it is possible to easily grasp the usage mode of the Internet by the members from the search keyword in the organization.

とりわけ、検索キーワードを分析することで、その分析結果を組織内におけるナレッジマネジメントに活用でき、かつ、構成員の生産性の向上に役立つシステムを提供することができる。検索キーワードを組織内で情報共有することもできる。たとえば、上述したリストや人脈マップを活用すれば、自分の知りたい情報(キーワード)について、既に社内で検索した実績のあるユーザを発見することができる。同じ問題に対し、既に誰かが解決済みであれば、そのユーザに電子メールや電話で問合せることができる。そのユーザが解決した結果(失敗・成功事例など)を参照することで、各ユーザは、効率的に回答を得ることができる。例えば、CPU41は、分析結果DBに記録されている閲覧日時のデータに基づいて、第1ユーザが使用した検索キーワードと同一の検索キーワードを使用した第2ユーザであって、第1ユーザが検索キーワードを送信した日時よりも過去の日時に検索キーワードを送信した第2ユーザの識別情報を抽出する。さらに、CPU41やネットワークインターフェースは、抽出した第2ユーザの識別情報を第1ユーザへ電子メールにより通知する通知手段として機能してもよい。電子メールにより通知される第2ユーザの識別情報は、社員番号や社員名称、電子メールアドレスなどである。また、電子メールには、参考のために、検索キーワード、第1ユーザの検索日時(閲覧日時)などが、記載されてもよい。   In particular, by analyzing the search keyword, the analysis result can be utilized for knowledge management in the organization, and a system useful for improving the productivity of the members can be provided. You can also share search keywords within your organization. For example, if the above-described list or network map is used, it is possible to find a user who has already been searched in-house for information (keyword) that he / she wants to know. If someone has already solved the same problem, you can contact the user by email or phone. Each user can efficiently obtain an answer by referring to the result (failure / successful case, etc.) solved by the user. For example, the CPU 41 is a second user who uses the same search keyword as the search keyword used by the first user based on the browsing date data recorded in the analysis result DB, and the first user uses the search keyword The identification information of the second user who transmitted the search keyword at a date and time that is earlier than the date and time when the message is transmitted is extracted. Further, the CPU 41 and the network interface may function as a notification unit that notifies the first user of the extracted identification information of the second user by e-mail. The identification information of the second user notified by electronic mail is an employee number, an employee name, an electronic mail address, or the like. The e-mail may include a search keyword, a search date (viewing date) of the first user, and the like for reference.

他人に相談しにくい個人的な悩みが検索キーワードとして使用されることもある。CPU41は、そうした「悩み」に関するキーワードを検出して、そのユーザの管理責任者(上司など)や管理責任部門に電子メール等で通知してもよい。これにより、管理責任者等は、適時構成員の状態を把握して、適切な対応を取ることができる。たとえば、うつ病・人間関係の悩みなどに分類される検索キーワードが分析結果DB19から見つかれば、CPU41は、その構成員の識別情報とその検索キーワードを電子メール等により人事部門に通知することができる。これにより、人事部門は適切な対応を取ることができる。   Personal concerns that are difficult to consult with others are sometimes used as search keywords. The CPU 41 may detect a keyword related to such “worries” and notify the user's management manager (such as a boss) or a management department by e-mail or the like. As a result, the manager or the like can grasp the state of the members in a timely manner and take appropriate measures. For example, if a search keyword classified as depression / human relations is found from the analysis result DB 19, the CPU 41 can notify the personnel department of the identification information of the member and the search keyword by e-mail or the like. . This allows the HR department to take appropriate action.

CPU41は、業務と関係のない検索キーワードを検出すると、業務上不要なコンピュータ利用を行っている可能性があるユーザへ電子メールを送信して注意を行うことができる。また、組織側は、インターネットフィルタリングを導入したりするなど、生産性向上のための適切なアクションを取ることができるようになろう。   When the CPU 41 detects a search keyword unrelated to business, it can send an e-mail to a user who may be using a computer that is not necessary for business, and can be careful. Organizations will also be able to take appropriate actions to improve productivity, such as introducing Internet filtering.

上述したログ管理サーバ12の機能が情報分析装置13に組み込まれてもよい。これにより、単一のサーバによってログ管理サーバ12と情報分析装置13とを実現できる。この場合、情報分析装置13が、ログ管理DB15、キーワード検出部16、キーワード判定部17、キーワード分類テーブル18、分析結果DB19、キーワード開始位置符号テーブル20を備えることになる。また、端末装置11の監視部14によって取得された閲覧履歴は、情報分析装置13のログ管理DB15に記録されることになる。   The function of the log management server 12 described above may be incorporated in the information analysis device 13. Thereby, the log management server 12 and the information analysis device 13 can be realized by a single server. In this case, the information analysis device 13 includes a log management DB 15, a keyword detection unit 16, a keyword determination unit 17, a keyword classification table 18, an analysis result DB 19, and a keyword start position code table 20. Also, the browsing history acquired by the monitoring unit 14 of the terminal device 11 is recorded in the log management DB 15 of the information analysis device 13.

このように、ログ管理サーバ12と情報分析装置13を同一のサーバ上で実現することで、端末装置が配置された組織の内部だけで閲覧履歴を管理しやすくなる。この場合、閲覧履歴が記録媒体や通信媒体によってイントラネットの外部に持ち出されることがなくなるため、よりセキュリティを考慮した分析が可能となろう。   Thus, by realizing the log management server 12 and the information analysis device 13 on the same server, it becomes easy to manage the browsing history only within the organization where the terminal device is arranged. In this case, since the browsing history is not taken out of the intranet by the recording medium or the communication medium, the analysis considering the security will be possible.

なお、ユーザ端末装置11a、11bの操作内容を監視して、その操作ログを各ユーザ端末装置11a、11b内の監視部14で生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成に限らず、Webサーバ30において各ユーザ端末装置11a、11bの操作ログを生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成でもよい。   The operation contents of the user terminal devices 11a and 11b are monitored, and the operation log is generated by the monitoring unit 14 in each user terminal device 11a and 11b and managed by the log management server 12, and the information analysis device 13 performs Web Not only the configuration for analyzing the browsing history of the site, the operation log of each user terminal device 11a, 11b is generated in the Web server 30 and managed by the log management server 12, and the browsing history of the Web site is checked by the information analysis device 13. A configuration for performing analysis may also be used.

また、ネットワーク上を流れる情報の一部(Webサイトの閲覧履歴)を取得するネットワーク情報収集装置をネットワーク上に備え、ネットワーク情報収集装置おいて各ユーザ端末装置11a、11bの操作ログを生成してログ管理サーバ12で管理し、情報分析装置13でWebサイトの閲覧履歴の分析を行う構成でもよい。   In addition, a network information collection device that acquires a part of information flowing on the network (website browsing history) is provided on the network, and the operation log of each user terminal device 11a, 11b is generated in the network information collection device. The configuration may be such that the log management server 12 manages and the information analysis apparatus 13 analyzes the browsing history of the website.

Claims (12)

複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析装置であって、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析装置。
An information analysis apparatus that analyzes a browsing history of a website on a terminal used by a member in an organization composed of a plurality of members,
An input means for inputting a browsing history of a website on the terminal;
An extraction means for extracting the search keyword transmitted to the search site from the browsing history input by the input means and the identification information of the member who input the search keyword in the terminal;
Creating means for creating an analysis result indicating the correspondence between the search keyword extracted by the extracting means and the identification information of the member;
An information analysis apparatus comprising: output means for outputting the analysis result created by the creation means.
前記作成手段は、各検索キーワードごとに、その検索キーワードを入力した複数の構成員の識別情報をまとめた分析結果を作成することを特徴とする請求項1に記載の情報分析装置。   The information analysis apparatus according to claim 1, wherein the creation unit creates an analysis result in which identification information of a plurality of members who input the search keyword is collected for each search keyword. 前記作成手段は、各検索キーワードごとに、その検索キーワードを入力した複数の端末の識別情報をまとめた分析結果を作成することを特徴とする請求項1または2に記載の情報分析装置。   The information analysis apparatus according to claim 1, wherein the creation unit creates an analysis result in which identification information of a plurality of terminals that input the search keyword is collected for each search keyword. 前記作成手段は、
検索キーワードと対応する分類とを示す分類テーブルと、
前記分類テーブルにしたがって、前記抽出手段により抽出された検索キーワードに分類を付与する分類付与手段と
をさらに備えることを特徴とする請求項1ないし3のいずれか1項に記載の情報分析装置。
The creating means includes
A classification table showing search keywords and corresponding classifications;
The information analysis apparatus according to claim 1, further comprising: a classifying unit that adds a class to the search keyword extracted by the extracting unit according to the classification table.
前記Webサイトの閲覧履歴には、該WebサイトのURLと、該Webサイトへ送信された検索キーワードとを有するリクエストデータを含み、
前記抽出手段は、各検索サイトのURLと、各検索サイトへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、前記検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを前記閲覧履歴から抽出することを特徴とする請求項1ないし4のいずれか1項に記載の情報分析装置。
The browsing history of the website includes request data having a URL of the website and a search keyword transmitted to the website,
The extraction means indicates the start position of the search keyword in accordance with a code table indicating a correspondence relationship between the URL of each search site and a code indicating the start position of the search keyword in request data transmitted to each search site. The information analysis apparatus according to any one of claims 1 to 4, wherein a search keyword recorded following the code is extracted from the browsing history.
前記分析結果には、前記検索キーワードが送信された日時を示す日時データが含まれており、
前記分析結果の日時データに基づいて、第1構成員が使用した検索キーワードと同一の検索キーワードを使用した第2構成員であって、該第1構成員が該検索キーワードを送信した日時よりも過去の日時に該検索キーワードを送信した該第2構成員の識別情報を前記第1構成員へ電子メールにより通知する通知手段をさらに備えることを特徴とする請求項1ないし5のいずれか1項に記載の情報分析装置。
The analysis result includes date and time data indicating the date and time when the search keyword was transmitted,
Based on the date and time data of the analysis result, the second member uses the same search keyword as the search keyword used by the first member, and the date and time when the first member transmits the search keyword. 6. The information processing apparatus according to claim 1, further comprising notification means for notifying the first member of the identification information of the second member who transmitted the search keyword at a past date and time by e-mail. Information analysis device described in 1.
各構成員の識別情報と、各構成員が所属するグループの識別情報と、各グループの責任者の識別情報とを対応付けて登録した組織管理テーブルをさらに備え、
各グループに所属する構成員によって送信された検索キーワードのリストを、そのグループの責任者へ電子メールにより通知する通知手段をさらに備えることを特徴とする請求項1ないし5のいずれか1項に記載の情報分析装置。
It further comprises an organization management table in which the identification information of each member, the identification information of the group to which each member belongs, and the identification information of the person in charge of each group are registered in association with each other.
6. The information processing apparatus according to claim 1, further comprising notification means for notifying a person in charge of the group of a list of search keywords transmitted by a member belonging to each group by e-mail. Information analysis equipment.
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析方法であって、
入力手段が、前記端末におけるWebサイトの閲覧履歴を入力する入力工程と、
抽出手段が、前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出工程と、
作成手段が、前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成工程と、
出力手段が、前記作成手段により作成された分析結果を出力する出力工程と
を有することを特徴とする情報分析方法。
An information analysis method for analyzing a browsing history of a website on a terminal used by a member in an organization composed of a plurality of members,
An input step in which the input means inputs a browsing history of the website on the terminal;
An extraction step in which the extraction means extracts the search keyword transmitted to the search site from the browsing history input by the input means and the identification information of the member who has input the search keyword in the terminal;
A creating step for creating an analysis result indicating a correspondence relationship between the search keyword extracted by the extracting unit and the identification information of the member;
An information analysis method, wherein the output means includes an output step of outputting the analysis result created by the creation means.
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析するプログラムであって、
コンピュータに、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段として機能させることを特徴とするプログラム。
A program for analyzing browsing history of a website on a terminal used by a member in an organization composed of a plurality of members,
On the computer,
An input means for inputting a browsing history of a website on the terminal;
An extraction means for extracting the search keyword transmitted to the search site from the browsing history input by the input means and the identification information of the member who input the search keyword in the terminal;
Creating means for creating an analysis result indicating the correspondence between the search keyword extracted by the extracting means and the identification information of the member;
A program that functions as an output unit that outputs an analysis result created by the creating unit.
複数の構成員によって構成される組織において該構成員がWebサイトを閲覧する際に使用する複数の端末と、各端末におけるWebサイトの閲覧履歴を分析する情報分析装置とを備える情報分析システムであって、
前記複数の端末のそれぞれは、
自己の端末におけるWebサイトの閲覧履歴を記録する記録手段
を備え、
前記情報分析装置は、
前記端末の記録手段により記録されたWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した構成員の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと構成員の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析システム。
An information analysis system comprising a plurality of terminals used when a member browses a website in an organization composed of a plurality of members, and an information analysis apparatus that analyzes the browsing history of the website at each terminal. And
Each of the plurality of terminals is
A recording means for recording a browsing history of a website on the terminal of the user;
The information analyzer is
Input means for inputting the browsing history of the website recorded by the recording means of the terminal;
An extraction means for extracting the search keyword transmitted to the search site from the browsing history input by the input means and the identification information of the member who input the search keyword in the terminal;
Creating means for creating an analysis result indicating the correspondence between the search keyword extracted by the extracting means and the identification information of the member;
An information analysis system comprising: output means for outputting the analysis result created by the creation means.
複数の構成員によって構成される組織において該構成員が使用する端末におけるWebサイトの閲覧履歴を分析する情報分析装置であって、
前記端末におけるWebサイトの閲覧履歴を入力する入力手段と、
前記入力手段によって入力された閲覧履歴から検索サイトへ送信された検索キーワードおよび前記端末において検索キーワードを入力した端末の識別情報を抽出する抽出手段と、
前記抽出手段により抽出された検索キーワードと端末の識別情報との対応関係を示した分析結果を作成する作成手段と、
前記作成手段により作成された分析結果を出力する出力手段と
を備えることを特徴とする情報分析装置。
An information analysis apparatus that analyzes a browsing history of a website on a terminal used by a member in an organization composed of a plurality of members,
An input means for inputting a browsing history of a website on the terminal;
An extraction means for extracting the search keyword transmitted to the search site from the browsing history input by the input means and the identification information of the terminal that has input the search keyword in the terminal;
Creating means for creating an analysis result indicating the correspondence between the search keyword extracted by the extracting means and the identification information of the terminal;
An information analysis apparatus comprising: output means for outputting the analysis result created by the creation means.
前記Webサイトの閲覧履歴には、該WebサイトのURLと、該Webサイトへ送信された検索キーワードとを有するリクエストデータを含み、
前記抽出手段は、各検索サイトのURLと、各検索サイトへ送信されるリクエストデータにおいて検索キーワードの開始位置を示す符号との対応関係を示した符号テーブルにしたがって、前記検索キーワードの開始位置を示す符号に続いて記録されている検索キーワードを前記閲覧履歴から抽出することを特徴とする請求項11項に記載の情報分析装置。
The browsing history of the website includes request data having a URL of the website and a search keyword transmitted to the website,
The extraction means indicates the start position of the search keyword in accordance with a code table indicating a correspondence relationship between the URL of each search site and a code indicating the start position of the search keyword in request data transmitted to each search site. The information analysis apparatus according to claim 11, wherein a search keyword recorded following the code is extracted from the browsing history.
JP2010148010A 2010-06-29 2010-06-29 Information analysis device, information analysis method, information analysis system and program Pending JP2012014267A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010148010A JP2012014267A (en) 2010-06-29 2010-06-29 Information analysis device, information analysis method, information analysis system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010148010A JP2012014267A (en) 2010-06-29 2010-06-29 Information analysis device, information analysis method, information analysis system and program

Publications (1)

Publication Number Publication Date
JP2012014267A true JP2012014267A (en) 2012-01-19

Family

ID=45600660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010148010A Pending JP2012014267A (en) 2010-06-29 2010-06-29 Information analysis device, information analysis method, information analysis system and program

Country Status (1)

Country Link
JP (1) JP2012014267A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013161244A (en) * 2012-02-03 2013-08-19 Canon Electronics Inc Information processing device, control method therefor, system, and computer program
JP2014146298A (en) * 2013-01-30 2014-08-14 Canon Electronics Inc Information processing unit, history information retrieval method, system and computer program
JP2016149143A (en) * 2012-08-30 2016-08-18 ザ ニールセン カンパニー (ユー エス) エルエルシー Method and apparatus to collect distributed user information for media impression and search term
JP2018173850A (en) * 2017-03-31 2018-11-08 ブラザー工業株式会社 Web server

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233517A (en) * 1988-03-14 1989-09-19 Mitsubishi Electric Corp Data base retrieving device
JP2002057722A (en) * 2000-08-11 2002-02-22 Masanao Kuninobu System for suppressing load and preventing illegal use of internet channel
JP2002133305A (en) * 2000-10-20 2002-05-10 Fuji Xerox Co Ltd Service provision system
JP2003323433A (en) * 2002-05-07 2003-11-14 Hitachi Ltd Information terminal and server
JP2004362451A (en) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> Method and system for displaying retrieving keyword information, and retrieving keyword information display program
JP2005267095A (en) * 2004-03-17 2005-09-29 Nippon Telegr & Teleph Corp <Ntt> Information display method and device, and information display program
JP2010055494A (en) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd Search and analysis server device and search and analysis method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01233517A (en) * 1988-03-14 1989-09-19 Mitsubishi Electric Corp Data base retrieving device
JP2002057722A (en) * 2000-08-11 2002-02-22 Masanao Kuninobu System for suppressing load and preventing illegal use of internet channel
JP2002133305A (en) * 2000-10-20 2002-05-10 Fuji Xerox Co Ltd Service provision system
JP2003323433A (en) * 2002-05-07 2003-11-14 Hitachi Ltd Information terminal and server
JP2004362451A (en) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> Method and system for displaying retrieving keyword information, and retrieving keyword information display program
JP2005267095A (en) * 2004-03-17 2005-09-29 Nippon Telegr & Teleph Corp <Ntt> Information display method and device, and information display program
JP2010055494A (en) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd Search and analysis server device and search and analysis method

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200400032007; 鵜飼孝典、外1名: '検索ログ分析結果を利用して知識を持つ人を探すことを支援するシステム' 情報処理学会研究報告(2001-GN-41) 第2001巻,第98号, 20011018, p.37-42, 社団法人情報処理学会 *
CSNG200800337007; 堀幸雄、外1名: 'ユーザの検索要求に基づいた興味関心の定量的評価' 情報知識学会誌 第16巻,第2号, 20060526, p.33-38, 情報知識学会 *
JPN6013064835; 堀幸雄、外1名: 'ユーザの検索要求に基づいた興味関心の定量的評価' 情報知識学会誌 第16巻,第2号, 20060526, p.33-38, 情報知識学会 *
JPN6013064837; 鵜飼孝典、外1名: '検索ログ分析結果を利用して知識を持つ人を探すことを支援するシステム' 情報処理学会研究報告(2001-GN-41) 第2001巻,第98号, 20011018, p.37-42, 社団法人情報処理学会 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013161244A (en) * 2012-02-03 2013-08-19 Canon Electronics Inc Information processing device, control method therefor, system, and computer program
JP2020098648A (en) * 2012-08-30 2020-06-25 ザ ニールセン カンパニー (ユー エス) エルエルシー Methods, apparatus, and machine-readable storage media to collect distributed user information for media impressions and search terms
JP2016149143A (en) * 2012-08-30 2016-08-18 ザ ニールセン カンパニー (ユー エス) エルエルシー Method and apparatus to collect distributed user information for media impression and search term
US9912482B2 (en) 2012-08-30 2018-03-06 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
US10063378B2 (en) 2012-08-30 2018-08-28 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
US10778440B2 (en) 2012-08-30 2020-09-15 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
JP2021108217A (en) * 2012-08-30 2021-07-29 ザ ニールセン カンパニー (ユー エス) エルエルシー Methods, apparatus and machine-readable storage medium to collect distributed user information for media impressions and search terms
JP7121159B2 (en) 2012-08-30 2022-08-17 ザ ニールセン カンパニー (ユー エス) エルエルシー Method, Apparatus and Machine-readable Storage Medium for Collecting Distributed User Information Regarding Media Impressions and Search Terms
US11483160B2 (en) 2012-08-30 2022-10-25 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
US11792016B2 (en) 2012-08-30 2023-10-17 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
US11870912B2 (en) 2012-08-30 2024-01-09 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
JP2014146298A (en) * 2013-01-30 2014-08-14 Canon Electronics Inc Information processing unit, history information retrieval method, system and computer program
JP2018173850A (en) * 2017-03-31 2018-11-08 ブラザー工業株式会社 Web server

Similar Documents

Publication Publication Date Title
CN100530177C (en) Method, system, and apparatus for receiving and responding to knowledge interchange queries
Abbasi et al. A social network system for analyzing publication activities of researchers
JP5932223B2 (en) Information analysis apparatus, information analysis method, information analysis system, and program
US20070185907A1 (en) Method and apparatus for displaying information on personal relationship, and computer product
JP2014178907A (en) Information analysis device, information analysis method, information analysis system and program
JP2015115024A (en) Profile management system, information equipment, profile update method, and computer program
WO2004081822A1 (en) Data registration/search support device using a keyword
JP2012014267A (en) Information analysis device, information analysis method, information analysis system and program
JP2002117215A (en) Patent management system
CN106503085B (en) Domain-based customizable search systems, methods, and techniques
KR20030042135A (en) System and Method for collecting Internet bulletin
JP2007265296A (en) Log provision system, log provision method and computer program
Tion et al. Evaluation of the Uses of Social Media in Libraries Operation in University Libraries in Benue State.
JP3932764B2 (en) Electronic service site management system
JPWO2005006191A1 (en) Apparatus and method for registering multiple types of information
JP4432460B2 (en) Electronic bulletin board management apparatus, electronic bulletin board management method, and program
JP4218231B2 (en) Contractor mediation method and apparatus, storage medium, and program
JP2020077029A (en) Information processing method and information processing system
JP2003308417A (en) Information collection system
JP2001331684A (en) Employment support system
Żak Identification of the most important road transportatioll decision problems
JP7064766B2 (en) Information processing equipment, information processing methods, and programs
Leffler Technical Issues: Creating a Troubleshooting System with Microsoft Outlook
JP5046634B2 (en) Information retrieval system
KR20110012545A (en) System and method for analyzing on-line buzz

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140307

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140411