JP2012141928A - Computer, document presentation method and document presentation program - Google Patents

Computer, document presentation method and document presentation program Download PDF

Info

Publication number
JP2012141928A
JP2012141928A JP2011001220A JP2011001220A JP2012141928A JP 2012141928 A JP2012141928 A JP 2012141928A JP 2011001220 A JP2011001220 A JP 2011001220A JP 2011001220 A JP2011001220 A JP 2011001220A JP 2012141928 A JP2012141928 A JP 2012141928A
Authority
JP
Japan
Prior art keywords
word
document
user
causal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011001220A
Other languages
Japanese (ja)
Inventor
Keiichi Hiroki
桂一 廣木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011001220A priority Critical patent/JP2012141928A/en
Publication of JP2012141928A publication Critical patent/JP2012141928A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a computer for presenting a document to which a title as a valid determination material of the selection of information is applied.SOLUTION: In a computer connected to a document database in which a document is stored, a processor is configured to extract an inter-word causal relation included in the document stored in the document database, create causal network data expressing the extracted inter-word causal relation with a network structure, extract a word having the causal relation with an interesting word as a word which interests a user from the causal network data, create a title of the document based on a first word and a second word if defining the interesting word as the first word and the extracted word as the second word, and create data for presenting the document to which the created title is applied via an output device to the user.

Description

本発明は、計算機、文書提示方法及び文書提示プログラムに関し、計算機の利用者に対して文書を提示する技術に関する。   The present invention relates to a computer, a document presentation method, and a document presentation program, and to a technique for presenting a document to a computer user.

計算機を使用して作業する作業者に対して、作業の助けとなるような文書(補助資料)を計算機上で提示することによって、作業を支援する技術が知られている(特許文献1参照)。特許文献1には、見出しを付与した文書を提示することによって、作業者の取捨選択や情報に対する概要把握を支援する技術が開示されている。   A technique for supporting work by presenting a document (auxiliary material) that assists the work to a worker who works using the computer on the computer is known (see Patent Document 1). . Japanese Patent Application Laid-Open No. H10-228561 discloses a technique that supports selection of an operator and grasping an outline of information by presenting a document with a headline.

特開2010−117790号公報JP 2010-117790 A

しかしながら、特許文献1に開示された技術において文書に付与される見出しは、作業者の作業状況を考慮したものではない。そのため、情報の取捨選択の判断材料として適切でない問題があった。   However, the headline given to the document in the technique disclosed in Patent Document 1 does not consider the work status of the worker. For this reason, there is a problem that is not appropriate as a judgment material for selecting information.

本発明は、上述した課題を考慮したものであって、情報の取捨選択の有効な判断材料となる見出しを付与した文書を提示する計算機を提供することを目的とする。   An object of the present invention is to provide a computer that presents a document with a heading that is an effective determination material for selecting information, in consideration of the above-described problems.

上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。   In order to solve the above problems, for example, the configuration described in the claims is adopted.

本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機であって、前記プロセッサは、前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成し、前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出し、前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成し、作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成することを特徴とする。   The present application includes a plurality of means for solving the above problems. To give an example, a processor that executes a program, a memory that stores a program executed by the processor, and an interface connected to the processor, A computer connected to a document database for storing documents, wherein the processor extracts a causal relationship between words contained in the document stored in the document database, and the extracted words Causal network data representing a causal relationship in a network structure is created, and from the causal network data, an interesting word that is a word that a user is interested in is extracted and a word that is causal is extracted. Word, based on the first word and the second word when the extracted word is the second word Te, create a heading documents, a document the title that was created is assigned, and generating the data for presentation to a user via the output device.

本発明によれば、情報の取捨選択の有効な判断材料となる見出しを付与した文書を提示することができる。   According to the present invention, it is possible to present a document with a heading that is an effective determination material for selecting information.

上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。   Problems, configurations, and effects other than those described above will be clarified by the following description of embodiments.

本発明の実施形態の計算機システムの利用者の操作概要を示すフローチャートである。It is a flowchart which shows the operation | movement outline | summary of the user of the computer system of embodiment of this invention. 本発明の実施形態の計算機システムの構成例を説明する図である。It is a figure explaining the structural example of the computer system of embodiment of this invention. 本発明の実施形態の計算機システムのハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the computer system of embodiment of this invention. 本発明の実施形態の個人作業状態データの例を示す図である。It is a figure which shows the example of the personal work status data of embodiment of this invention. 本発明の実施形態の個人作業履歴データの例を示す図である。It is a figure which shows the example of the personal work log | history data of embodiment of this invention. 本発明の実施形態の個人プロフィールデータの例を示す図である。It is a figure which shows the example of the personal profile data of embodiment of this invention. 本発明の実施形態の情報提供サーバの全体処理を示すフローチャートである。It is a flowchart which shows the whole process of the information provision server of embodiment of this invention. 本発明の実施形態の熟練度判定部の制御ロジックを示すフローチャートである。It is a flowchart which shows the control logic of the skill level determination part of embodiment of this invention. 本発明の実施形態の多義性解決部の制御ロジックを示すフローチャートである。It is a flowchart which shows the control logic of the ambiguity resolution part of embodiment of this invention. 本発明の実施形態の因果抽出部の制御ロジックを示すフローチャートである。It is a flowchart which shows the control logic of the causal extraction part of embodiment of this invention. 本発明の実施形態の因果抽出部によって作成される因果ネットワークデータの例を説明する図である。It is a figure explaining the example of the causal network data produced by the causal extraction part of embodiment of this invention. 本発明の実施形態の興味語抽出部の制御ロジックを示すフローチャートである。It is a flowchart which shows the control logic of the interested word extraction part of embodiment of this invention. 本発明の実施形態の見出し作成部の制御ロジックを示すフローチャートである。It is a flowchart which shows the control logic of the headline preparation part of embodiment of this invention. 本発明の実施形態の見出し作成部によって作成される見出しの一例を示す図である。It is a figure which shows an example of the headline produced by the headline preparation part of embodiment of this invention. 本発明の実施形態の見出しリスト表示部の制御ロジックを示すフローチャートである。It is a flowchart which shows the control logic of the heading list display part of embodiment of this invention. 本発明の実施形態の見出しリスト表示部による表示画面の例を示す図である。It is a figure which shows the example of the display screen by the heading list display part of embodiment of this invention.

以下、本発明の実施の形態について図面を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

本発明の実施形態の計算機システム1(図2参照)では、製造現場においてクライアントコンピュータ40を用いて作業する作業者(以下、「利用者」という。)に、過去の不具合事例や作業ノウハウに関する文書を提示することによって、不具合再発防止や作業の効率化を実現する。   In the computer system 1 (see FIG. 2) according to the embodiment of the present invention, a document on past trouble cases and work know-how is given to a worker (hereinafter referred to as a “user”) who uses the client computer 40 at a manufacturing site. By presenting, it is possible to prevent the recurrence of defects and improve work efficiency.

図1は、本発明の実施形態の計算機システム1の利用者の操作概要を示すフローチャートである。利用者の操作概要について、図2を適宜参照して説明する。   FIG. 1 is a flowchart showing an outline of the operation of the user of the computer system 1 according to the embodiment of this invention. An outline of user operations will be described with reference to FIG.

はじめに、利用者は、業務管理システムクライアント402を介して、業務管理システム201にログインし、ユーザIDを入力する(S101)。その後、クライアントコンピュータ40の出力部(ディスプレイ等)に業務の一覧が提示されるので、利用者は実行する業務を選択し、業務を開始する(S102)。そうすると、クライアントコンピュータ40上で、選択された業務の作業状態に関連する情報の見出し一覧が表示される(S103)。   First, the user logs in to the business management system 201 via the business management system client 402 and inputs a user ID (S101). Thereafter, since a list of tasks is presented on the output unit (display or the like) of the client computer 40, the user selects a task to be executed and starts the task (S102). Then, a heading list of information related to the work status of the selected job is displayed on the client computer 40 (S103).

利用者は、表示された見出し一覧の中で、興味を引く見出しがあるか否かを判断する(S104)。興味を引く見出しがある場合(S104でYES)、利用者は、この見出しを選択し、情報提供サーバ10から業務に有用な情報を取得する(S105)。一方、興味を引く見出しがない場合(S104でNO)、利用者は業務を継続する(S106)。   The user determines whether there is a headline that attracts interest in the displayed heading list (S104). When there is a headline that attracts interest (YES in S104), the user selects this headline, and acquires information useful for business from the information providing server 10 (S105). On the other hand, when there is no headline that attracts interest (NO in S104), the user continues the business (S106).

その後、業務中の場合(S107でNO)、ステップ103に戻る。この場合、表示される見出し一覧が、その時点における業務の作業状態に応じて更新される。一方、業務が終了すると(S107でYES)、利用者は業務管理システム201からログアウトする(S108)。   Thereafter, when the job is in progress (NO in S107), the process returns to step 103. In this case, the displayed heading list is updated according to the work status of the task at that time. On the other hand, when the business is completed (YES in S107), the user logs out from the business management system 201 (S108).

以下、ステップ103の処理、すなわち見出し一覧の表示方法について説明する。   Hereinafter, the process of step 103, that is, the heading list display method will be described.

図2は、本発明の実施形態の計算機システム1の構成例を説明する図である。   FIG. 2 is a diagram illustrating a configuration example of the computer system 1 according to the embodiment of this invention.

図2において、実線長方形で示すブロック(熟練度判定部101等)は、プログラムモジュールである。平行四辺形で示すブロック(ユーザID111等)は、データである。破線長方形で示すブロック(業務管理システム201等)は、情報提供サーバ10と別の独立した外部システムである。円柱で示すブロック(業務情報DB50等)は、データベースである。   In FIG. 2, blocks (skill level determination unit 101 and the like) indicated by solid line rectangles are program modules. A block (user ID 111 or the like) indicated by a parallelogram is data. A block (business management system 201 or the like) indicated by a broken-line rectangle is an independent external system separate from the information providing server 10. A block (business information DB 50 or the like) indicated by a cylinder is a database.

計算機システム1は、情報提供サーバ10、業務管理サーバ20、検索サーバ30、クライアントコンピュータ40、業務情報DB50、個人情報DB60、文書DB70を備える。   The computer system 1 includes an information providing server 10, a business management server 20, a search server 30, a client computer 40, a business information DB 50, a personal information DB 60, and a document DB 70.

情報提供サーバ10は、クライアントコンピュータ40に見出し付き文書データ118を提供するコンピュータ装置である。この情報提供サーバ10は、熟練度判定部101、興味語抽出部102、多義性解決部103、因果抽出部104、見出し作成部105を備える。各機能部については詳細に後述する。   The information providing server 10 is a computer device that provides document data 118 with a header to the client computer 40. The information providing server 10 includes a skill level determination unit 101, an interesting word extraction unit 102, an ambiguity resolution unit 103, a causal extraction unit 104, and a headline creation unit 105. Each functional unit will be described in detail later.

この情報提供サーバ10は、業務管理サーバ20から受信したユーザID111に基づいて、業務管理サーバ20を介して又は介さずに、業務情報DB50、個人情報DB60から、それぞれ個人作業状態データ112、個人プロフィールデータ114を入力する。   Based on the user ID 111 received from the business management server 20, the information providing server 10 receives the personal work status data 112 and the personal profile from the business information DB 50 and the personal information DB 60 with or without the business management server 20. Data 114 is input.

業務管理サーバ20は、クライアントコンピュータ40からの要求に応じて、業務管理システムクライアント402にサービスを提供する業務管理システム201を備えたコンピュータ装置である。この業務管理サーバ20は、クライアントコンピュータ40から、利用者のユーザID411、業務の作業状態に関するデータ412を受信する。   The business management server 20 is a computer device including a business management system 201 that provides a service to the business management system client 402 in response to a request from the client computer 40. The business management server 20 receives from the client computer 40 the user ID 411 of the user and data 412 relating to the work status of the business.

検索サーバ30は、情報を検索する検索エンジン301を備えたコンピュータ装置である。この検索サーバ30は、情報提供サーバ10から興味語データ117を受信し、興味語データ117に基づいて、文書DB70中に記録された文書データに対して検索を実行し、検索結果として抽出される文書データ311を情報提供サーバ10に送信する。   The search server 30 is a computer device that includes a search engine 301 that searches for information. The search server 30 receives the interesting word data 117 from the information providing server 10, performs a search on the document data recorded in the document DB 70 based on the interesting word data 117, and is extracted as a search result. The document data 311 is transmitted to the information providing server 10.

クライアントコンピュータ40は、見出しリスト表示部401、業務管理システムクライアント402を備えたコンピュータ装置である。利用者は、クライアントコンピュータ40を用いて自身の業務を実行する。   The client computer 40 is a computer device that includes a heading list display unit 401 and a business management system client 402. The user executes his / her business using the client computer 40.

業務情報DB50は、クライアントコンピュータ40の各利用者によって遂行される業務に関する情報(業務名、関連文書一覧、関連語一覧等、詳細は後述)が記録されたデータベースである。個人情報DB60は、クライアントコンピュータ40の各利用者の個人プロフィールデータ114が記録されたデータベースである。文書DB70は、各種文書データが記録されたデータベースである。   The business information DB 50 is a database in which information related to business performed by each user of the client computer 40 (business name, related document list, related word list, etc., details will be described later) is recorded. The personal information DB 60 is a database in which personal profile data 114 of each user of the client computer 40 is recorded. The document DB 70 is a database in which various document data are recorded.

図3は、本発明の実施形態の計算機システム1のハードウェア構成例を説明する図である。なお、図3では、図2と同様の機能を果たす部分には同一の符号を付して重複する説明を適宜省略する。   FIG. 3 is a diagram illustrating a hardware configuration example of the computer system 1 according to the embodiment of this invention. In FIG. 3, the same reference numerals are given to portions that perform the same functions as those in FIG. 2, and redundant descriptions are omitted as appropriate.

図3に示す計算機システム1は、ネットワーク80を介して互いに接続された情報提供サーバ10、業務管理サーバ20、検索サーバ30、クライアントコンピュータ40を備える。なお、ネットワーク80は、LAN(Local Area Network)、WAN(Wide Area Network)、又は、インターネット等のグローバルネットワークである。   The computer system 1 shown in FIG. 3 includes an information providing server 10, a business management server 20, a search server 30, and a client computer 40 that are connected to each other via a network 80. The network 80 is a global network such as a LAN (Local Area Network), a WAN (Wide Area Network), or the Internet.

以下、各装置のハードウェア構成について説明する。   Hereinafter, the hardware configuration of each apparatus will be described.

情報提供サーバ10は、ネットワークインタフェース11、CPU(Central Processing Unit)12、主記憶装置13、二次記憶装置14、及び、これらを相互に接続するバス15を備える。   The information providing server 10 includes a network interface 11, a CPU (Central Processing Unit) 12, a main storage device 13, a secondary storage device 14, and a bus 15 that interconnects them.

ネットワークインタフェース11は、情報提供サーバ10がネットワーク80に接続するためのインタフェースである。CPU12は、主記憶装置13に記憶されているプログラムを実行する演算処理装置である。主記憶装置13は、CPU12によって実行されるプログラム、及び、プログラムの実行に必要なデータを記憶するRAM(Random Access Memory)等の記憶装置である。プログラムとは、例えば、不図示のOS(Operating System)である。二次記憶装置14は、ハードディスク装置などの磁気記憶媒体である。   The network interface 11 is an interface for the information providing server 10 to connect to the network 80. The CPU 12 is an arithmetic processing device that executes a program stored in the main storage device 13. The main storage device 13 is a storage device such as a RAM (Random Access Memory) that stores a program executed by the CPU 12 and data necessary for executing the program. The program is, for example, an OS (Operating System) (not shown). The secondary storage device 14 is a magnetic storage medium such as a hard disk device.

業務管理サーバ20、検索サーバ30、クライアントコンピュータ40のそれぞれのハードウェア構成は、情報提供サーバ10と同様であるとして、ここでは説明を省略する。   The hardware configurations of the business management server 20, the search server 30, and the client computer 40 are the same as those of the information providing server 10, and a description thereof is omitted here.

図4Aは、本発明の実施形態の個人作業状態データ112の例を示す図である。   FIG. 4A is a diagram illustrating an example of the personal work status data 112 according to the embodiment of this invention.

個人作業状態データ112は、各利用者の作業状態を示すデータである。この個人作業状態データ112は、業務ID112A、作成中文書112B、閲覧中文書112C、検索エンジン状態112Dを含む。   The personal work status data 112 is data indicating the work status of each user. The personal work status data 112 includes a business ID 112A, a document being created 112B, a document being browsed 112C, and a search engine status 112D.

業務ID112Aとは、利用者が従事している業務を一意に識別する識別子である。この業務ID112Aは、あらかじめ工場内又は製造工程内の全ての業務に振られている。作成中文書112Bとは、利用者が作業時間中にクライアントコンピュータ40上で作成している文書、例えば設計図、仕様書等である。この作成中文書112Bは、常駐ソフトによる監視や、一定のタイミングで業務管理サーバ20にアップロードする規則の制定などによって取得される。閲覧中文書112Cとは、利用者が作業時間中にクライアントコンピュータ40上で閲覧している文書、例えば仕様書、手順書、Webページ等である。この閲覧中文書112Cは、常駐ソフトによる監視や、ブラウザの履歴の抽出などによって取得される。検索エンジン状態112Dとは、検索エンジン301に入力された単語や検索オプションのことである。この検索エンジン状態112Dは、常駐ソフトによる監視やブラウザからの情報抽出によって取得される。   The business ID 112A is an identifier that uniquely identifies the business that the user is engaged in. This work ID 112A is assigned in advance to all work in the factory or manufacturing process. The document 112B being created is a document created on the client computer 40 by the user during work, such as a design drawing or a specification. The document 112B being created is acquired by monitoring with resident software or by establishing rules for uploading to the business management server 20 at a certain timing. The browsing document 112C is a document that the user is browsing on the client computer 40 during working hours, such as a specification, a procedure manual, a Web page, and the like. This browsing document 112C is acquired by monitoring with resident software, extracting browser history, or the like. The search engine state 112D is a word or a search option input to the search engine 301. This search engine state 112D is acquired by monitoring with resident software or extracting information from a browser.

図4Bは、本発明の実施形態の個人作業履歴データ113の例を示す図である。   FIG. 4B is a diagram illustrating an example of the personal work history data 113 according to the embodiment of this invention.

個人作業履歴データ113は、各利用者の作業状態の履歴を示すデータである。この個人作業履歴データ113は、作成文書履歴113A、閲覧文書履歴113Bを含む。   The personal work history data 113 is data indicating a work state history of each user. The personal work history data 113 includes a created document history 113A and a browsing document history 113B.

作成文書履歴113Aとは、個人作業状態データ112の作成中文書112Bのうち、同じ業務IDの作成中文書112Bに、時刻情報を加えたものである。閲覧文書履歴113Bとは、個人作業状態データ112の閲覧中文書112Cのうち、同じ業務IDの閲覧中文書112Cに、時刻情報を加えたものである。   The created document history 113A is obtained by adding time information to a document 112B being created with the same job ID in the document 112B being created of the personal work status data 112. The browsing document history 113B is obtained by adding time information to the browsing document 112C having the same job ID among the browsing documents 112C of the personal work state data 112.

図4Cは、本発明の実施形態の個人プロフィールデータ114の例を示す図である。   FIG. 4C is a diagram illustrating an example of the personal profile data 114 according to the embodiment of this invention.

個人プロフィールデータ114は、各利用者のプロフィールを示すデータである。この個人プロフィールデータ114は、担当業務データ114A、所属部署データ114B、過去作成文書データ114C、過去閲覧文書データ114Dを含む。   The personal profile data 114 is data indicating the profile of each user. The personal profile data 114 includes responsible business data 114A, affiliation department data 114B, past created document data 114C, and past browse document data 114D.

担当業務データ114Aとは、利用者の担当業務に関するデータである。この担当業務データ114Aは、担当業務の業務名、担当業務に関連する文書(以下、「関連文書」という。)の一覧と関連係数、担当業務に関連する語(以下、「関連語」という。)の一覧と関連係数、担当業務に関連する業務のID(以下、「関連業務ID」という。)の一覧、担当業務の担当期間を含む。関連係数とは、業務に携わる全ての利用者の閲覧文書や作成文書における単語の出現頻度を用いること等によって算出される。この担当業務データ114Aは、業務IDを用いて読み出すことができる。   The assigned job data 114A is data related to the user's assigned job. The assigned job data 114A is referred to as a job name of the assigned job, a list of documents related to the assigned job (hereinafter referred to as “related documents”) and related coefficients, and a word related to the assigned job (hereinafter referred to as “related word”). ) List and related coefficients, a list of work IDs related to the work in charge (hereinafter referred to as “related work ID”), and a charge period of the work in charge. The related coefficient is calculated by using the appearance frequency of words in the browsed documents and created documents of all users engaged in the business. The assigned business data 114A can be read using the business ID.

所属部署データ114Bとは、利用者の所属部署に関するデータである。この所属部署データ114Bは、所属部署の部署名、所属部署の関連業務IDの一覧と関連係数、所属部署の所属メンバの一覧、所属部署における所属期間を含む。過去作成文書データ114Cとは、業務IDに関わらず過去の全ての作成文書に、時刻情報を加えたものである。過去閲覧文書データ114Dとは、業務IDに関わらず過去の全ての閲覧文書に、時刻情報を加えたものである。   The belonging department data 114B is data relating to the user's belonging department. The belonging department data 114B includes the department name of the belonging department, a list of related business IDs and related coefficients of the belonging department, a list of belonging members of the belonging department, and a belonging period in the belonging department. The past created document data 114C is obtained by adding time information to all past created documents regardless of the business ID. The past browsing document data 114D is obtained by adding time information to all past browsing documents regardless of the business ID.

図5は、本発明の実施形態の情報提供サーバ10の全体処理を示すフローチャートである。ここでは、情報提供サーバ10の全体処理について、図2を適宜参照して説明する。   FIG. 5 is a flowchart showing the overall processing of the information providing server 10 according to the embodiment of this invention. Here, the overall processing of the information providing server 10 will be described with reference to FIG. 2 as appropriate.

はじめに、利用者がクライアントコンピュータ40を用いて業務管理システム201にログインすると、情報提供サーバ10はユーザID111を受理する(S501)。以降ステップ502〜504の処理により、情報提供サーバ10は、ステップ501で受理したユーザID111をキーとして、各情報を読み出す。   First, when a user logs in to the business management system 201 using the client computer 40, the information providing server 10 receives the user ID 111 (S501). Thereafter, the information providing server 10 reads each piece of information using the user ID 111 received in step 501 as a key through the processing of steps 502 to 504.

ステップ502において、情報提供サーバ10は、業務管理システム201から、利用者の担当業務の業務IDを受理する(S502)。その後ステップ503において、因果ネットワークデータ106を読み出す(S503)。因果ネットワークデータ106とは、文書DB70内の複数の文書に含まれる事象の因果関係を表すネットワーク構造のデータである。図9を用いて詳細に後述する。   In step 502, the information providing server 10 receives the business ID of the business in charge of the user from the business management system 201 (S502). Thereafter, in step 503, the causal network data 106 is read (S503). The causal network data 106 is data having a network structure representing the causal relationship of events included in a plurality of documents in the document DB 70. Details will be described later with reference to FIG.

その後ステップ504において、情報提供サーバ10は、個人情報DB60から個人プロフィールデータ114を読み出す(S504)。その後ステップ505において、情報提供サーバ10(熟練度判定部101)は、ステップ504で読み出された個人プロフィールデータ114を基に、利用者の熟練度を計算する(S505)。このステップ505の処理については、図6を用いて詳細に後述する。   Thereafter, in step 504, the information providing server 10 reads the personal profile data 114 from the personal information DB 60 (S504). Thereafter, in step 505, the information providing server 10 (skill level determination unit 101) calculates the skill level of the user based on the personal profile data 114 read in step 504 (S505). The processing in step 505 will be described later in detail with reference to FIG.

その後ステップ506において、情報提供サーバ10は、業務管理システム201から、その時点での個人作業状態データ112を受理する(S506)。   Thereafter, in step 506, the information providing server 10 receives the personal work status data 112 at that time from the business management system 201 (S506).

その後ステップ507において、情報提供サーバ10は、個人作業履歴データ113を更新する(S507)。具体的には、ステップ506で受信した個人作業状態データ112に含まれる作成中文書112B、閲覧中文書112Cを、個人作業履歴データ113に追加する。その後ステップ508において、興味語抽出部102が、利用者の興味語を抽出する(S508)。このステップ508の処理については、図10を用いて詳細に後述する。   Thereafter, in step 507, the information providing server 10 updates the personal work history data 113 (S507). Specifically, the creating document 112B and the browsing document 112C included in the personal work status data 112 received in step 506 are added to the personal work history data 113. Thereafter, in step 508, the interested word extracting unit 102 extracts the user's interested words (S508). The processing in step 508 will be described later in detail with reference to FIG.

その後ステップ509において、情報提供サーバ10は、ステップ508で抽出された興味語に基づき、当該興味語に関連する文書を、文書DB70から検索する(S509)。ここでは、既存の検索エンジン301を用いて検索する。興味語に関連する文書とは、興味語と因果関係にあるキーワードを有する文書である。その後ステップ510において、多義性解決部103が、興味語の多義性を解決する(S510)。このステップ510の処理については、図7を用いて詳細に後述する。   Thereafter, in step 509, the information providing server 10 searches the document DB 70 for a document related to the interesting word based on the interesting word extracted in step 508 (S509). Here, the search is performed using the existing search engine 301. A document related to an interesting word is a document having a keyword that has a causal relationship with the interesting word. Thereafter, in step 510, the ambiguity resolution unit 103 resolves the ambiguity of the interested word (S510). The processing of step 510 will be described later in detail with reference to FIG.

その後ステップ511において、見出し作成部105が、ステップ509で検索された文書に対して付与する見出しを作成する(S511)。このステップ511の処理については、図11を用いて詳細に後述する。   Thereafter, in step 511, the headline creation unit 105 creates a headline to be assigned to the document searched in step 509 (S511). The processing in step 511 will be described later in detail with reference to FIG.

その後ステップ512において、見出しリスト表示部401は、ステップ511で作成された見出しを、出力部(ディスプレイ等)に表示することによって、利用者に提示する(S512)。   Thereafter, in step 512, the heading list display unit 401 presents the heading created in step 511 to the user by displaying it on the output unit (display or the like) (S512).

その後ステップ513において、情報提供サーバ10は、利用者の入力を受け付ける(S513)。ここでいう利用者の入力とは、ステップ512で提示された見出しに対する利用者の閲覧要求である。その後ステップ514において、情報提供サーバ10は、文書閲覧要求があるか否かを判定する(S514)。   Thereafter, in step 513, the information providing server 10 accepts user input (S513). The user input here is a user browsing request for the headline presented in step 512. Thereafter, in step 514, the information providing server 10 determines whether there is a document browsing request (S514).

文書閲覧要求がある場合(S514でYES)、情報提供サーバ10は、当該要求に対応する文書を提示し(S515)、ステップ512に戻って処理を繰り返す。一方、文書閲覧要求がない場合(S514でNO)、情報提供サーバ10は、待機状態になり、利用者がログアウトしたか否かを判定する(S516)。   If there is a document browsing request (YES in S514), the information providing server 10 presents a document corresponding to the request (S515), returns to step 512, and repeats the process. On the other hand, when there is no document browsing request (NO in S514), the information providing server 10 enters a standby state and determines whether or not the user has logged out (S516).

ログアウトした場合(S516でYES)、情報提供サーバ10の待機状態は終了し、処理を終了する。一方、ログアウトしていない場合(S516でNO)、情報提供サーバ10は、個人作業状態データ112が変化したか否か(更新されたか否か)を判定する(S517)。個人作業状態データ112が変化した場合(S517でYES)、ステップ506へ戻って処理を繰り返す。個人作業状態データ112が変化していない場合(S517でNO)、ステップ516へ戻って処理を繰り返す。   When logging out (YES in S516), the standby state of the information providing server 10 ends, and the process ends. On the other hand, if the user has not logged out (NO in S516), the information providing server 10 determines whether or not the personal work status data 112 has been changed (updated) (S517). If the personal work status data 112 has changed (YES in S517), the process returns to step 506 and the process is repeated. If the personal work status data 112 has not changed (NO in S517), the process returns to step 516 to repeat the process.

以下、熟練度判定部101、興味語抽出部102、多義性解決部103、因果抽出部104、見出し作成部105、見出しリスト表示部401の処理フローについて説明する。   Hereinafter, the processing flow of the skill level determination unit 101, the interested word extraction unit 102, the ambiguity resolution unit 103, the causal extraction unit 104, the headline creation unit 105, and the headline list display unit 401 will be described.

図6は、本発明の実施形態の熟練度判定部101の制御ロジックを示すフローチャートである。ここでは、図5のステップ505の処理について、図2を適宜参照して説明する。   FIG. 6 is a flowchart illustrating the control logic of the skill level determination unit 101 according to the embodiment of this invention. Here, the processing of step 505 in FIG. 5 will be described with reference to FIG. 2 as appropriate.

はじめに、熟練度判定部101は、ユーザID111をキーに、個人情報DB60から個人プロフィールデータ114を読み込む(S601)。次に、業務管理システム201から業務IDを受信し、受信した業務IDをキーに、業務情報DB50から業務関連語一覧を読み込む(S602)。   First, the skill level determination unit 101 reads the personal profile data 114 from the personal information DB 60 using the user ID 111 as a key (S601). Next, a business ID is received from the business management system 201, and a business related word list is read from the business information DB 50 using the received business ID as a key (S602).

その後ステップ603において、熟練度判定部101は、ステップ601で読み込まれた個人プロフィールデータ114内の過去作成文書データ114Cが、ステップ602で読み込まれた業務関連語一覧中の業務関連語を含む場合、この業務関連語の出現頻度を取得する(S603)。その後ステップ604において、ステップ601で読み込まれた個人プロフィールデータ114内の過去閲覧文書データ114Dが、ステップ602で読み込まれた業務関連語一覧中の業務関連語を含む場合、この業務関連語の出現頻度を取得する(S604)。   Thereafter, in step 603, the skill level determination unit 101 determines that the past-created document data 114C in the personal profile data 114 read in step 601 includes the business-related words in the business-related word list read in step 602. The appearance frequency of the business related word is acquired (S603). Thereafter, in step 604, if the past browsing document data 114D in the personal profile data 114 read in step 601 includes the business-related words in the business-related word list read in step 602, the appearance frequency of this business-related word. Is acquired (S604).

その後ステップ605において、熟練度判定部101は、個人プロフィールデータ114内の所属部署データ114Bのうち、関連業務ID一覧と所属期間を取得する(S605)。その後ステップ606において、個人プロフィールデータ114内の担当業務データ114Aのうち、関連業務IDと担当期間を取得する(S606)。その後ステップ607において、取得された各種データに基づき、式(1)に従って、業務IDで示される業務に対する利用者の熟練度を計算し、利用者熟練度データ115として出力する(S607)。   Thereafter, in step 605, the skill level determination unit 101 acquires a list of related business IDs and a belonging period in the belonging department data 114B in the personal profile data 114 (S605). Thereafter, in step 606, the related work ID and the charge period are acquired from the work data 114A in the personal profile data 114 (S606). Thereafter, in step 607, the user's skill level for the work indicated by the work ID is calculated according to the formula (1) based on the acquired various data, and is output as the user skill level data 115 (S607).

Figure 2012141928
Figure 2012141928

式(1)は、業務に対する利用者の熟練度を算出するための式である。式(1)において、部署関連度(業務ID、部署ID)とは、部署への所属期間による関連業務への知識習得度(業務と部署の関連の深さ)である。Lとは、部署や業務に従事した期間と、関連知識の習熟度との相関を示す習熟関数である。L(所属期間(部署ID))とは、部署に所属した期間による業務への習熟度である。L(担当期間(業務ID))とは、業務に従事した期間による業務への習熟度である。p(w)は、過去に作成した文書(過去作成文書データ114C)における業務関連語の出現頻度である。D(w)は、業務IDの関連語一覧に基づく単語の専門性である。すなわち、Σ(p(w)×D(w))は、過去に作成した文書から推定される業務への習熟度である。なお、過去に作成した文書が業務関連語を多く含むほど、習熟度は高いと判断される。q(w)は、過去に閲覧した文書(過去閲覧文書データ114D)における業務関連語の出現頻度である。すなわち、Σ(q(w)×D(w))は、過去に閲覧した文書から推定される業務への習熟度である。なお、過去に閲覧した文書が業務関連語を多く含むほど、習熟度は高いと判断される。また、α、β、γ、δは、それぞれα≧0、β≧0、γ≧δ≧0の定数である。   Expression (1) is an expression for calculating the skill level of the user for the business. In equation (1), the degree of department relevance (business ID, department ID) is the degree of knowledge acquisition of related work (depth of relation between business and department) according to the period of belonging to the department. L is a proficiency function that indicates the correlation between the period in which a department or business has been engaged and the proficiency level of related knowledge. L (Affiliation period (department ID)) is the proficiency level for the work by the period of belonging to the department. L (in charge period (business ID)) is a proficiency level for the business during the business period. p (w) is a frequency of appearance of business related words in a document created in the past (past created document data 114C). D (w) is the word specialty based on the related word list of the business ID. In other words, Σ (p (w) × D (w)) is a proficiency level for work estimated from documents created in the past. It is determined that the proficiency level is higher as the documents created in the past contain more business related words. q (w) is a frequency of appearance of business related words in a document browsed in the past (past browsed document data 114D). In other words, Σ (q (w) × D (w)) is a proficiency level for work estimated from documents browsed in the past. In addition, it is judged that the proficiency is higher as the documents browsed in the past contain more business-related words. Α, β, γ, and δ are constants of α ≧ 0, β ≧ 0, and γ ≧ δ ≧ 0, respectively.

以上に示す処理により、熟練度判定部101は、業務に対する利用者の熟練度を判定し、数値化することができる。   Through the processing described above, the skill level determination unit 101 can determine and quantify the user's skill level for business.

図7は、本発明の実施形態の多義性解決部103の制御ロジックを示すフローチャートである。ここでは、図5のステップ510の処理について、図2を適宜参照して説明する。   FIG. 7 is a flowchart illustrating the control logic of the ambiguity resolution unit 103 according to the embodiment of this invention. Here, the processing of step 510 in FIG. 5 will be described with reference to FIG. 2 as appropriate.

はじめに、多義性解決部103は、個人作業履歴データ113、因果ネットワークデータ106、興味語データ116を読み込む(S701〜S703)。次にステップ704において、入力された興味語データ116が因果ネットワークデータ106(図9参照)内の2箇所以上のノードに登場するかどうかを判定する(S704)。   First, the ambiguity resolution unit 103 reads the personal work history data 113, the causal network data 106, and the interesting word data 116 (S701 to S703). Next, in step 704, it is determined whether or not the input interesting word data 116 appears in two or more nodes in the causal network data 106 (see FIG. 9) (S704).

1箇所以下のノードに登場する場合(S704でNO)、この興味語データ116が新出単語、又は一つの意味しかない単語であるので、ステップ705に進み、多義性解決部103は、この興味語データ116をそのまま出力し(S705)、処理を終了する。一方、2箇所以上(複数)のノードに登場する場合(S704でYES)、複数のノードのそれぞれについて、式(2)によって、ノードの文脈適合度を計算する(S706)。文脈適合度とは、文書における興味語の適合性を示す指標である。   If it appears in one or less nodes (NO in S704), since this interesting word data 116 is a new word or a word that has only one meaning, the process proceeds to step 705, and the ambiguity resolution unit 103 determines this interest word. The word data 116 is output as it is (S705), and the process is terminated. On the other hand, when the node appears in two or more (plural) nodes (YES in S704), the node's context suitability is calculated for each of the plurality of nodes by Expression (2) (S706). The context suitability is an index indicating the suitability of an interesting word in a document.

Figure 2012141928
Figure 2012141928

式(2)は、ノードの文脈適合度を計算するための式である。式(2)において、d(w、i)は、個人作業履歴データ113に登場する単語wと、興味語データ116で示される興味語iとの、因果ネットワークデータ106上の(意味的)距離である。このd(
w、i)は、ノードと単語とが強い因果関係にあるほど小さな値になる。t(w)は、単
語wが最後に文脈に登場してからの経過時間(文脈内での時間的距離)である。C1、C2は定数である。なお、該当する興味語のノードの近辺に位置する単語が、個人作業履歴データ113上に多く登場するほど、及び、個人作業履歴データ113上での登場時刻が新しいほど、式(2)によって計算される文脈適合度は高くなる。
Expression (2) is an expression for calculating the context suitability of the node. In Expression (2), d (w, i) is a (semantic) distance on the causal network data 106 between the word w appearing in the personal work history data 113 and the interest word i indicated by the interest word data 116. It is. This d (
w, i) becomes smaller as the causal relationship between the node and the word is stronger. t (w) is the elapsed time (temporal distance within the context) since the word w last appeared in the context. C1 and C2 are constants. It is to be noted that the more words that are located in the vicinity of the relevant interesting word node appear on the personal work history data 113 and the newer the appearance time on the personal work history data 113, the more the calculation is performed according to the equation (2) The degree of context suitability is high.

その後ステップ707において、多義性解決部103は、ステップ706で計算された各ノードの文脈適合度を比較し、文脈適合度の高いノードを採用する(S707)。その後ステップ708において、ステップ707で採用されたノード(意味を限定した興味語)を出力する(S708)。   Thereafter, in step 707, the ambiguity resolution unit 103 compares the context suitability of each node calculated in step 706, and adopts a node having a high context suitability (S707). Thereafter, in step 708, the node (interested word with limited meaning) adopted in step 707 is output (S708).

以上に示す処理により、多義性解決部103は、興味語が複数の意味を有する場合、この多義性を解決して、最も適した興味語に意味を限定し、この興味語を出力することができる。   By the processing described above, the ambiguity resolution unit 103 can resolve this ambiguity, limit the meaning to the most suitable interest word, and output this interest word when the interest word has a plurality of meanings. it can.

図8は、本発明の実施形態の因果抽出部104の制御ロジックを示すフローチャートである。ここでは、図5のステップ510の処理について、図2を適宜参照して説明する。   FIG. 8 is a flowchart illustrating the control logic of the causal extraction unit 104 according to the embodiment of this invention. Here, the processing of step 510 in FIG. 5 will be described with reference to FIG. 2 as appropriate.

はじめに、因果抽出部104は、文書DB70から未処理の文書(処理対象の文書)を一つ読み出す(S801)。次にステップ802において、因果抽出部104は、ステップ601で読み出された文書から、因果関係を有する単語ペアを一つ抽出する(S802)。   First, the causal extraction unit 104 reads one unprocessed document (processing target document) from the document DB 70 (S801). In step 802, the causal extraction unit 104 extracts one word pair having a causal relationship from the document read in step 601 (S802).

その後ステップ803において、因果抽出部104は、抽出された単語ペアを構成する2単語が、共に因果ネットワークデータ106内にノードとして登録されているか否かを判定する(S803)。   Thereafter, in step 803, the causal extraction unit 104 determines whether or not two words constituting the extracted word pair are both registered as nodes in the causal network data 106 (S803).

2単語が共に登録されている場合(S803でYES)、ステップ804に進み、因果抽出部104は、登録されている二つのノードをリンク(リンクの強度1)で結合する(S804)。リンクの強度とは、ノード間の因果関係の強さを示す指標である。なお、このステップ804では、既に二つのノードがリンクで結合されている場合、リンクの強度に1を加算する。一方、2単語共に登録されてはいない場合(S803でNO)、ステップ805に進み、因果抽出部104は、いずれか片方の単語が因果ネットワークデータ106内にノードとして登録されているか否かを判定する(S805)。   If the two words are registered together (YES in S803), the process proceeds to step 804, and the causal extraction unit 104 connects the two registered nodes with a link (link strength 1) (S804). The link strength is an index indicating the strength of the causal relationship between nodes. In step 804, if two nodes are already connected by a link, 1 is added to the link strength. On the other hand, if both words are not registered (NO in S803), the process proceeds to step 805, and the causal extraction unit 104 determines whether one of the words is registered as a node in the causal network data 106. (S805).

片方の単語のみ登録されている場合(S805でYES)、ステップ806に進み、因果抽出部104は、登録されていない方の単語を新しいノードとして登録し、二つのノードをリンク(リンクの強度1)で結合する(S806)。一方、2単語がいずれも登録されていない場合(S805でNO)、ステップ807に進み、因果抽出部104は、2単語をそれぞれ新しいノードとして登録し、二つのノードをリンク(リンクの強度1)で結合する(S807)。   If only one word is registered (YES in S805), the process proceeds to step 806, where the causal extraction unit 104 registers the unregistered word as a new node, and links the two nodes (link strength 1). ) (S806). On the other hand, if neither of the two words is registered (NO in S805), the process proceeds to step 807, where the causal extraction unit 104 registers the two words as new nodes, and links the two nodes (link strength 1). (S807).

その後ステップ808により、因果抽出部104は、因果関係を有する他の単語ペアがあるか否かを判定し(S808)、他の単語ペアがある場合(S808でYES)、ステップ802に戻って処理を繰り返す。またステップ809により、因果抽出部104は、文書DB70に未処理の文書があるか否かを判定し(S809)、他の未処理の文書がある場合(S809でYES)、ステップ801に戻って処理を繰り返す。   Thereafter, in step 808, the causal extraction unit 104 determines whether there is another word pair having a causal relationship (S808). If there is another word pair (YES in S808), the process returns to step 802 and the process is performed. repeat. In step 809, the causal extraction unit 104 determines whether there is an unprocessed document in the document DB 70 (S809). If there is another unprocessed document (YES in S809), the process returns to step 801. Repeat the process.

以上に示す処理により、因果抽出部104は、文書DB70中の全ての文書における単語間の因果関係を抽出し、因果ネットワークデータ106を作成する。   Through the processing described above, the causal extraction unit 104 extracts the causal relationship between words in all documents in the document DB 70 and creates the causal network data 106.

特に、製造現場における技術文書から因果関係を抽出することによって、設計支援、不具合の原因究明、不良の再発防止等の目的で過去の文書を活用することができる。   In particular, by extracting causal relationships from technical documents at the manufacturing site, past documents can be used for the purposes of design support, investigation of the cause of defects, prevention of recurrence of defects, and the like.

図9は、本発明の実施形態の因果抽出部104によって作成される因果ネットワークデータ106の例を説明する図である。因果抽出部104は、文書DB70に格納された製造現場における事故・不良報告書に基づいて、図9に示すような因果ネットワークデータ106を作成する。   FIG. 9 is a diagram illustrating an example of the causal network data 106 created by the causal extraction unit 104 according to the embodiment of this invention. The causal extraction unit 104 creates causal network data 106 as shown in FIG. 9 based on the accident / defect report at the manufacturing site stored in the document DB 70.

図9において、長方形はノードを示している。また、矢印はリンク、すなわちノード間の因果関係を表している。例えば「摩擦901」と「発熱902」とは、「摩擦901」が「発熱902」を引き起こす因果関係であることを示している。また、「発熱902」と「部品変形903」とは、「発熱902」が「部品変形903」を引き起こす因果関係であることを示している。   In FIG. 9, the rectangle indicates a node. An arrow represents a link, that is, a causal relationship between nodes. For example, “friction 901” and “heat generation 902” indicate that “friction 901” is a causal relationship that causes “heat generation 902”. Further, “heat generation 902” and “component deformation 903” indicate that “heat generation 902” is a causal relationship that causes “component deformation 903”.

図10は、本発明の実施形態の興味語抽出部102の制御ロジックを示すフローチャートである。ここでは、図5のステップ508の処理について、図2を適宜参照して説明する。   FIG. 10 is a flowchart illustrating the control logic of the interesting word extraction unit 102 according to the embodiment of this invention. Here, the processing of step 508 in FIG. 5 will be described with reference to FIG. 2 as appropriate.

はじめに、興味語抽出部102は、個人作業状態データ112を読み込む(S1001)。次にステップ1002において、利用者熟練度データ115を読み込む(S1002)。その後ステップ1003において、個人作業履歴データ113を読み込む(S1003)。その後ステップ1004において、興味語候補を初期化する(S1004)。興味語候補とは、興味語抽出部102が興味語を抽出するための候補となる興味語群である。   First, the interested word extraction unit 102 reads the personal work state data 112 (S1001). Next, in step 1002, the user skill level data 115 is read (S1002). Thereafter, in step 1003, the personal work history data 113 is read (S1003). Thereafter, in step 1004, the interested word candidate is initialized (S1004). An interesting word candidate is an interesting word group which becomes a candidate for the interesting word extraction part 102 to extract an interesting word.

その後ステップ1005〜1008により、興味語抽出部102は、個人プロフィールデータ114中の関連語一覧、個人作業状態データ112中の作成中文書112B内の特徴語、閲覧中文書112C内の特徴語、検索エンジン状態112D中の検索エンジン301に入力された検索式に含まれる単語を、興味語候補に加える(S1005〜1008)。ここで、文書内の特徴語とは、その文書内に多く含まれるなど、文書との関連の高い単語のことであり、例えばTF(Term Frequency)−IDF(Inverse Document Frequency)の高い単語を特徴語として扱うことができる。TF(Term Frequency)−IDF(Inverse Document Frequency)とは、文書中の特徴語らしさを表す値であって、TFをDF(Document Frequency)で除算することによって求められる。TFは、該当文書中の単語の出現頻度である。DFは、全文書中の単語の出現頻度である。その後ステップ1009において、興味語抽出部102は、全ての興味語候補のそれぞれの興味度を、式(3)に従って計算する(S809)。興味度とは、興味語に対する利用者の興味の度合いを示す指標である。   Thereafter, in steps 1005 to 1008, the interested word extracting unit 102 searches the related word list in the personal profile data 114, the feature words in the document 112B being created in the personal work status data 112, the feature words in the document 112C being browsed, and the search. A word included in the search expression input to the search engine 301 in the engine state 112D is added to the candidate for interesting words (S1005 to 1008). Here, the characteristic words in the document are words that are highly related to the document, such as being included in many in the document. For example, the word is characterized by a word having a high TF (Term Frequency) -IDF (Inverse Document Frequency). Can be treated as a word. TF (Term Frequency) -IDF (Inverse Document Frequency) is a value representing the likelihood of a feature word in a document, and is obtained by dividing TF by DF (Document Frequency). TF is the frequency of appearance of words in the document. DF is the appearance frequency of words in all documents. Thereafter, in step 1009, the interested word extraction unit 102 calculates the interest levels of all the interested word candidates according to the equation (3) (S809). The degree of interest is an index indicating the degree of interest of the user with respect to the interesting word.

Figure 2012141928
Figure 2012141928

式(3)は、興味語候補の興味度を算出するための式である。式(3)において、業務関連係数とは、業務IDによって呼び出される関連語の関連係数である。利用者熟練度とは、ステップ1002で読み込まれた利用者熟練度データ115である。適正熟練度とは、単語の専門性であり、その単語に興味を持つ可能性が高い利用者の熟練度である。専門性の高い単語は出現頻度が低いと仮定すれば、単語の専門性は、DFに基づいて算出することができる。   Expression (3) is an expression for calculating the interest level of the interesting word candidate. In Equation (3), the business related coefficient is a related coefficient of a related word called by the business ID. The user skill level is the user skill level data 115 read in step 1002. The appropriate skill level is a word specialty and a skill level of a user who is highly likely to be interested in the word. If it is assumed that a highly specialized word has a low appearance frequency, the word specialty can be calculated based on the DF.

検索式内重要度とは、検索式における単語の各々に割り振られる単語の重要度である。例えば検索式がAND検索である場合、ANDで結ばれた各単語に重要度を等分に分配する。一方、検索式がOR検索の場合、ORで結ばれた各単語に重要度を等分せずにそのまま付する。   The importance in the search expression is the importance of the word assigned to each word in the search expression. For example, when the search formula is an AND search, importance is equally distributed to each word connected by AND. On the other hand, when the search expression is an OR search, the importance is assigned to each word connected by OR without being divided equally.

例えば検索式が(A∨B)∧C)である場合、検索式内重要度は(A、B、C)=(0.5、0.5、0.5)である。また、検索式が(A∧B)∨C)である場合、検索式内重要度は(A、B、C)=(0.5、0.5、1.0)である。また、α、β、γ、δ、εは、それぞれ0以上の定数である。   For example, when the search formula is (A∨B) ∧C), the importance in the search formula is (A, B, C) = (0.5, 0.5, 0.5). When the search formula is (A∧B) ∨C), the importance in the search formula is (A, B, C) = (0.5, 0.5, 1.0). Α, β, γ, δ, and ε are constants of 0 or more.

この式(3)によれば、作業中の業務に関連が深い単語、作成文書中や閲覧文書中で特に多く出現する単語、作業者の熟練度と同程度の専門性を持つ単語、作業者が検索システムを使っている場合は検索式に含まれる単語ほど、興味度が高くなる。   According to this equation (3), words that are closely related to the work being worked on, words that appear particularly frequently in the created document and the read document, words that have the same level of expertise as the skill level of the worker, and the worker When using a search system, the more the word included in the search formula, the higher the degree of interest.

その後ステップ810において、興味語抽出部102は、興味度が一定以上の興味語候補を抽出し、興味語データ116として出力する(S810)。   Thereafter, in step 810, the interested word extracting unit 102 extracts an interesting word candidate having a certain degree of interest and outputs it as interesting word data 116 (S810).

以上に示す処理により、興味語抽出部102は、個人作業履歴データ113、個人プロフィールデータ114等に基づいて、その時点において利用者が興味を持つ可能性が高い単語を抽出することができる。   Through the processing described above, the interested word extraction unit 102 can extract words that are likely to be of interest to the user at that time based on the personal work history data 113, the personal profile data 114, and the like.

図11は、本発明の実施形態の見出し作成部105の制御ロジックを示すフローチャートである。ここでは、図5のステップ511の処理について、図2を適宜参照して説明する。   FIG. 11 is a flowchart illustrating the control logic of the headline creation unit 105 according to the embodiment of this invention. Here, the processing of step 511 in FIG. 5 will be described with reference to FIG. 2 as appropriate.

はじめに、見出し作成部105は、因果ネットワークデータ106を読み込む(S1101)。次にステップ1102において、検索エンジン301による検索結果の文書データ311と、興味語データ117に示される興味語(以下、「検索語」という。)とのセットを読み込む(S1102)。   First, the headline creation unit 105 reads the causal network data 106 (S1101). Next, in step 1102, a set of document data 311 as a search result by the search engine 301 and an interesting word (hereinafter referred to as “search word”) indicated in the interesting word data 117 is read (S1102).

その後ステップ1103において、見出し作成部105は、因果ネットワークデータ106上で、検索語と一定距離内の因果関係にある単語を抽出する(S1103)。その後ステップ1104において、検索語を第1ワード、ステップ1103で抽出された単語を第2ワードとする(S1104)。   Thereafter, in step 1103, the headline creation unit 105 extracts words having a causal relationship within a certain distance from the search word on the causal network data 106 (S1103). Thereafter, in step 1104, the search word is the first word, and the word extracted in step 1103 is the second word (S1104).

具体的には、利用者とコンテンツとの関連性の根拠となる興味語を、第1ワードとする。この第1ワードは複数でもよい。利用者が実行中の業務に関連する単語、作成中文書内の単語、閲覧文書履歴の特徴語、検索キーワード等が第1ワードの候補である。このような第1ワードを見出しの一部にすることによって、提示するコンテンツに対する納得感(透過性)を高めることができる。次に、コンテンツの内容において、第1ワードと最も関係の深い第2ワードを決定する。   Specifically, the interesting word that is the basis for the relationship between the user and the content is the first word. This first word may be plural. Words related to the business being executed by the user, words in the document being created, feature words of the browsing document history, search keywords, etc. are candidates for the first word. By making such a first word a part of the headline, the satisfaction (transparency) with respect to the presented content can be enhanced. Next, in the contents, the second word that is most closely related to the first word is determined.

その後ステップ1105において、見出し作成部105は、第1ワード、第2ワード、補間表現を組み合わせて文書の見出しを作成する(S1105)。ここでの補間表現とは、第1ワードと第2ワードとの因果関係を表す、「〜による…」、「〜を原因とする…」、「〜を引き起こす…」のような表現を示す。   Thereafter, in step 1105, the headline creation unit 105 creates a headline for the document by combining the first word, the second word, and the interpolated expression (S1105). The interpolated expression here indicates expressions such as “by ...”, “cause of ...”, “cause ...”, which represent the causal relationship between the first word and the second word.

このように、見出し作成部105は、第1ワードと第2ワードを組み合わせ、これらのワードの関係性を表す表現を補間して見出しを作成する。例えば製造現場における技術文書を扱う場合、技術文書は、原因、現象、対策の構造を有する確率が高い。文書の中で、第1ワードと原因−現象、原因−対策、現象−対策のいずれかの関係にある単語を、第2ワードとして選択する。   In this way, the headline creation unit 105 combines the first word and the second word, and creates a headline by interpolating the expression representing the relationship between these words. For example, when handling a technical document at a manufacturing site, the technical document has a high probability of having a cause, phenomenon, and countermeasure structure. In the document, a word that is in any one of cause-phenomenon, cause-countermeasure, phenomenon-countermeasure relationship with the first word is selected as the second word.

図12は、本発明の実施形態の見出し作成部105によって作成される見出しの一例を示す図である。   FIG. 12 is a diagram illustrating an example of a headline created by the headline creation unit 105 according to the embodiment of this invention.

第1ワード(興味語)が「短絡」、第2ワードが「経年動作」である場合、作成される見出しは、図12に示すように「経年動作による短絡」となる。また、第2ワードが複数(「ボルト緩み」、「局部過熱」、「ボルト通電」、「溶融物」等)抽出された場合、作成される見出しも複数(「ボルト緩みによる短絡」、「局部過熱による短絡」、「ボルト通電による短絡」、「溶融物による短絡」等)である。一つの文書から複数の見出しが作成された場合、他の文書にも多く登場する因果関係の見出しを優先する。つまり、因果ネットワークデータ106上で最もリンク強度の強い2単語によって作成された見出し(図12に示す例では、「溶融物による短絡」)を採用する。第1ワードと第2ワードとを直接結ぶリンクがない場合、経由する全てのリンクの強度の逆数の総和を計算し、逆数の総和を因果関係の強弱を判定するための指標としてもよい。   When the first word (interesting word) is “short circuit” and the second word is “aging operation”, the created heading is “short circuit by aging operation” as shown in FIG. Also, if the second word is extracted (“bolt loosening”, “local overheating”, “bolt energization”, “melt”, etc.), multiple headlines are created (“short circuit due to bolt loosening”, “local”). Short circuit due to overheating, "short circuit due to volt energization", "short circuit due to melt", etc.). When multiple headings are created from one document, priority is given to causal headings that frequently appear in other documents. That is, a headline (in the example shown in FIG. 12, “short circuit due to melt”) created by two words having the strongest link strength on the causal network data 106 is employed. When there is no link that directly connects the first word and the second word, the sum of the reciprocals of the strengths of all the links that pass through may be calculated, and the sum of the reciprocals may be used as an index for determining the strength of the causal relationship.

図11に戻り、その後ステップ1106において、見出し作成部105は、ステップ1105で作成された見出しを文書に付与し、見出し付き文書データ118として出力する(S1106)。その後ステップ1107において、検索結果の他の文書があるか否かを判定し(S1107)、他の文書がある場合(S1107でYES)、ステップ1102に戻って処理を繰り返す。   Returning to FIG. 11, in step 1106, the headline creation unit 105 adds the headline created in step 1105 to the document and outputs it as headlined document data 118 (S1106). Thereafter, in step 1107, it is determined whether there is another document as a search result (S1107). If there is another document (YES in S1107), the process returns to step 1102 to repeat the process.

以上に示す処理により、見出し作成部105は、利用者の作業状況や知識に適合した見出しを作成し、作成された見出しを文書に付与して出力する。なお、見出し作成部105は、複数のコンテンツから同一の見出しを作成する場合がある。この場合、これら複数のコンテンツを、同質のコンテンツとして同一の見出しを付与してグルーピングしてもよい。これにより、内容が重複する文書の閲覧を防ぐことができる。   Through the processing described above, the headline creation unit 105 creates a headline that matches the user's work situation and knowledge, and assigns the created headline to the document for output. The headline creation unit 105 may create the same headline from a plurality of contents. In this case, the plurality of contents may be grouped by giving the same heading as the same quality contents. This prevents browsing of documents with overlapping contents.

図13は、本発明の実施形態の見出しリスト表示部401の制御ロジックを示すフローチャートである。ここでは図5のステップ512の処理について、図2を適宜参照して説明する。   FIG. 13 is a flowchart illustrating the control logic of the heading list display unit 401 according to the embodiment of this invention. Here, the processing of step 512 in FIG. 5 will be described with reference to FIG. 2 as appropriate.

はじめに、見出しリスト表示部401は、見出し作成部105から出力された見出し付き文書データ118を全て読み込む(S1301)。次にステップ1302において、ステップ1301で読み込まれた見出し付き文書データ118のうち、重複しない全ての見出しを表示する(S1302)。その後ステップ1303において、利用者の入力を待機する(S1303)。   First, the heading list display unit 401 reads all the headlined document data 118 output from the heading creation unit 105 (S1301). Next, in step 1302, all the headings that do not overlap among the headlined document data 118 read in step 1301 are displayed (S1302). Thereafter, in step 1303, the user input is waited (S1303).

その後ステップ1304において、見出しに対して利用者の閲覧要求があり(S1304でYES)、且つ、見出しに対応する文書が二つ以上ある場合(S1305でYES)、見出しリスト表示部401は、一つの文書を表示し、さらに閲覧要求があった場合に他の文書を表示する(S1306)。   Thereafter, in step 1304, when there is a user browsing request for the headline (YES in S1304) and there are two or more documents corresponding to the headline (YES in S1305), the heading list display unit 401 displays The document is displayed, and when there is a browsing request, another document is displayed (S1306).

一方、見出しに対して利用者の閲覧要求があり(S1304でYES)、且つ、見出しに対応する文書が一つである場合(S1305でNO)、見出しリスト表示部401は、当該見出しに対応する文書を表示する(S1307)。文書を表示した後は、ステップ1303に戻って、再び利用者の入力を待機する。なお、ステップ1304において、利用者の閲覧要求がない場合(S1304でNO)、処理を終了する。   On the other hand, when there is a user browsing request for a headline (YES in S1304) and there is one document corresponding to the headline (NO in S1305), the headline list display unit 401 corresponds to the headline. The document is displayed (S1307). After the document is displayed, the process returns to step 1303 to wait for user input again. In step 1304, if there is no user browsing request (NO in step S1304), the process ends.

以上に示す処理により、見出しリスト表示部401は、見出し作成部105によって作成された見出し付き文書データ118を表示する。   Through the processing described above, the heading list display unit 401 displays the document data 118 with a heading created by the heading creation unit 105.

図14は、本発明の実施形態の見出しリスト表示部401による表示画面1401の例を示す図である。   FIG. 14 is a diagram showing an example of a display screen 1401 by the heading list display unit 401 according to the embodiment of this invention.

図14に示す表示画面1401において、タイトル1402には、見出し作成部105によって作成された見出しが表示される。本文確認ボタン1403は、タイトル1402に対応する文書の本文を確認するためのボタンである。事業者名1404、製品名1405には、タイトル1402に関する事業者名、製品名が表示される。関連ワード1406には、タイトル1402に関連するワードが表示される。   In the display screen 1401 shown in FIG. 14, a title created by the header creation unit 105 is displayed in the title 1402. A text confirmation button 1403 is a button for confirming the text of the document corresponding to the title 1402. In the business name 1404 and product name 1405, the business name and product name related to the title 1402 are displayed. In the related word 1406, a word related to the title 1402 is displayed.

図14に示すような表示画面1401を表示することにより、利用者は、表示された情報の要不要を迅速且つ正確に判断することができる。   By displaying the display screen 1401 as shown in FIG. 14, the user can quickly and accurately determine whether or not the displayed information is necessary.

以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一つを示したものであり、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。本発明の要旨を逸脱しない範囲において種々変更可能である。   As mentioned above, although embodiment of this invention was described, the said embodiment showed one of the application examples of this invention, and in the meaning which limits the technical scope of this invention to the specific structure of the said embodiment. Absent. Various modifications can be made without departing from the scope of the present invention.

1 計算機システム
10 情報提供サーバ
20 業務管理サーバ
30 検索サーバ
40 クライアントコンピュータ
50 業務情報DB
60 個人情報DB
70 文書DB
101 熟練度判定部
102 興味語抽出部
103 多義性解決部
104 因果抽出部
105 見出し作成部
106 因果ネットワークデータ
112 個人作業状態データ
113 個人作業履歴データ
114 個人プロフィールデータ
115 利用者熟練度データ
116 興味語データ
118 見出し付き文書データ
401 見出しリスト表示部
1 Computer System 10 Information Providing Server 20 Business Management Server 30 Search Server 40 Client Computer 50 Business Information DB
60 Personal Information DB
70 Document DB
101 Skill Level Determination Unit 102 Interesting Word Extraction Unit 103 Ambiguity Resolution Unit 104 Causal Extraction Unit 105 Headline Creation Unit 106 Causal Network Data 112 Personal Work Status Data 113 Personal Work History Data 114 Personal Profile Data 115 User Skill Level Data 116 Interesting Words Data 118 Headlined document data 401 Headline list display section

Claims (7)

プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機であって、
前記プロセッサは、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成し、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出し、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成し、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成することを特徴とする計算機。
A computer comprising a processor for executing a program, a memory for storing a program executed by the processor, and an interface connected to the processor, and connected to a document database for storing documents,
The processor is
Extracting the causal relationship between words included in the document stored in the document database, creating causal network data representing the extracted causal relationship between the words in a network structure,
From the causal network data, extract words that are causal with an interest word that is a word that the user is interested in,
Based on the first word and the second word when the interesting word is the first word and the extracted word is the second word, a headline of the document is created,
A computer that generates data for presenting a created document with the heading to a user via an output device.
前記プロセッサは、所定の業務に対する前記利用者の作業状態を示す作業状態データ、及び、前記利用者のプロフィールを示すプロフィールデータに基づいて、当該利用者の興味語を抽出することを特徴とする請求項1に記載の計算機。   The processor extracts an interest word of the user based on work state data indicating a work state of the user for a predetermined job and profile data indicating a profile of the user. Item 1. The computer according to item 1. 前記プロセッサは、前記プロフィールデータに基づいて、前記所定の業務に対する前記利用者の熟練度を示す利用者熟練度データを作成し、
さらに、前記作業者熟練度データに基づいて、当該利用者の興味語を抽出することを特徴とする請求項2に記載の計算機。
The processor creates user skill data indicating the skill level of the user for the predetermined job based on the profile data,
The computer according to claim 2, further comprising extracting an interest word of the user based on the worker skill level data.
前記プロセッサは、前記興味語が複数ある場合、前記複数の興味語のうち、前記因果ネットワークデータ中の当該興味語の周辺の単語が、前記作業状態データにおいて最も高い出現頻度で出現する興味語を、当該利用者の興味語とすることを特徴とする請求項1に記載の計算機。   When there are a plurality of interesting words, the processor selects an interesting word in which the words around the interesting word in the causal network data appear with the highest appearance frequency in the work state data. The computer according to claim 1, wherein the computer is an interesting word of the user. 前記プロセッサは、前記第1ワードと、前記第2ワードと、前記第1ワードと前記第2ワードとの因果関係を表す補間表現とによって、前記文書の見出しを作成することを特徴とする請求項1に記載の計算機。   The said processor produces the heading of the said document by the said 1st word, the said 2nd word, and the interpolation expression showing the causal relationship of the said 1st word and the said 2nd word. 1. The computer according to 1. プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機における文書提示方法であって、
前記プロセッサが、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成する手順と、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出する手順と、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成する手順と、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成する手順と、
を実行することを特徴とする文書提示方法。
A document presentation method in a computer comprising a processor for executing a program, a memory for storing a program executed by the processor, and an interface connected to the processor, and connected to a document database for storing the document. ,
The processor is
A procedure for extracting a causal relationship between words included in a document stored in the document database, and creating causal network data representing the extracted causal relationship between the words in a network structure;
A procedure for extracting a word that is causal with an interesting word that is a word that the user is interested in from the causal network data;
Creating a document heading based on the first word and the second word when the interesting word is the first word and the extracted word is the second word;
A procedure for generating data for presenting the created document with the heading to a user via an output device;
The document presentation method characterized by performing.
プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機において実行される文書提示プログラムであって、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成する手順と、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出する手順と、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成する手順と、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成する手順と、
を前記計算機に実行させることを特徴とする文書提示プログラム。
A document presentation program executed on a computer connected to a document database for storing a document, comprising: a processor for executing the program; a memory for storing the program executed by the processor; and an interface connected to the processor. Because
A procedure for extracting a causal relationship between words included in a document stored in the document database, and creating causal network data representing the extracted causal relationship between the words in a network structure;
A procedure for extracting a word that is causal with an interesting word that is a word that the user is interested in from the causal network data;
Creating a document heading based on the first word and the second word when the interesting word is the first word and the extracted word is the second word;
A procedure for generating data for presenting the created document with the heading to a user via an output device;
Is executed by the computer.
JP2011001220A 2011-01-06 2011-01-06 Computer, document presentation method and document presentation program Pending JP2012141928A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011001220A JP2012141928A (en) 2011-01-06 2011-01-06 Computer, document presentation method and document presentation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011001220A JP2012141928A (en) 2011-01-06 2011-01-06 Computer, document presentation method and document presentation program

Publications (1)

Publication Number Publication Date
JP2012141928A true JP2012141928A (en) 2012-07-26

Family

ID=46678124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011001220A Pending JP2012141928A (en) 2011-01-06 2011-01-06 Computer, document presentation method and document presentation program

Country Status (1)

Country Link
JP (1) JP2012141928A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017104656A1 (en) * 2015-12-14 2017-06-22 日本電気株式会社 Information processing device, information processing method, and recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017104656A1 (en) * 2015-12-14 2017-06-22 日本電気株式会社 Information processing device, information processing method, and recording medium

Similar Documents

Publication Publication Date Title
RU2501078C2 (en) Ranking search results using edit distance and document information
TWI529543B (en) Computerized system and computer-storage media for social network powered query refinement and recommendations
JP6360456B2 (en) Apparatus, system, and method for context management
US20070226183A1 (en) Method and apparatus for performing collaborative searches
TWI547815B (en) Information retrieval method and device
US20120233160A1 (en) System and method for assisting a user to identify the contexts of search results
GB2492198A (en) Using a dynamically-generated content-level newsworthiness rating to provide content recommendations
JP2005259110A (en) Document information management device, program, and method
JP5327784B2 (en) Computer system, information collection support device, and information collection support method
JP5539127B2 (en) Document management system, search specification method, program
US20130304721A1 (en) Locating human resources via a computer network
JP2008299842A (en) Reaction information providing method by advertisement execution, computer readable recording medium, and reaction information providing system by advertisement execution
JPWO2009107628A1 (en) Search system, search method and program
JP2011100208A (en) Action estimation device, action estimation method, and action estimation program
JP2007272465A (en) Schedule management device, document presentation method for schedule management device, and schedule management program
JP2012141928A (en) Computer, document presentation method and document presentation program
JP2020181463A (en) Treasure keyword search system
JP5613536B2 (en) Method, system, and computer-readable recording medium for dynamically extracting and providing the most suitable image according to a user's request
JP2009211281A (en) Propagation structure extraction device, method and program, and computer-readable recording medium
JP2008102790A (en) Retrieval system
JP2009003553A (en) File retrieval system
CN109614542B (en) Public number recommendation method, device, computer equipment and storage medium
JP5589009B2 (en) RECOMMENDED QUERY EXTRACTION DEVICE, METHOD, AND PROGRAM
JP5292322B2 (en) Document search method, document search apparatus, and document search program
JP2006164045A (en) Cooccurrence graph creation method, device, program, and storage medium storing program