JP2012141928A - Computer, document presentation method and document presentation program - Google Patents
Computer, document presentation method and document presentation program Download PDFInfo
- Publication number
- JP2012141928A JP2012141928A JP2011001220A JP2011001220A JP2012141928A JP 2012141928 A JP2012141928 A JP 2012141928A JP 2011001220 A JP2011001220 A JP 2011001220A JP 2011001220 A JP2011001220 A JP 2011001220A JP 2012141928 A JP2012141928 A JP 2012141928A
- Authority
- JP
- Japan
- Prior art keywords
- word
- document
- user
- causal
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、計算機、文書提示方法及び文書提示プログラムに関し、計算機の利用者に対して文書を提示する技術に関する。 The present invention relates to a computer, a document presentation method, and a document presentation program, and to a technique for presenting a document to a computer user.
計算機を使用して作業する作業者に対して、作業の助けとなるような文書(補助資料)を計算機上で提示することによって、作業を支援する技術が知られている(特許文献1参照)。特許文献1には、見出しを付与した文書を提示することによって、作業者の取捨選択や情報に対する概要把握を支援する技術が開示されている。 A technique for supporting work by presenting a document (auxiliary material) that assists the work to a worker who works using the computer on the computer is known (see Patent Document 1). . Japanese Patent Application Laid-Open No. H10-228561 discloses a technique that supports selection of an operator and grasping an outline of information by presenting a document with a headline.
しかしながら、特許文献1に開示された技術において文書に付与される見出しは、作業者の作業状況を考慮したものではない。そのため、情報の取捨選択の判断材料として適切でない問題があった。
However, the headline given to the document in the technique disclosed in
本発明は、上述した課題を考慮したものであって、情報の取捨選択の有効な判断材料となる見出しを付与した文書を提示する計算機を提供することを目的とする。 An object of the present invention is to provide a computer that presents a document with a heading that is an effective determination material for selecting information, in consideration of the above-described problems.
上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。 In order to solve the above problems, for example, the configuration described in the claims is adopted.
本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインタフェースと、を備え、文書を格納する文書データベースに接続された計算機であって、前記プロセッサは、前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成し、前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出し、前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成し、作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成することを特徴とする。 The present application includes a plurality of means for solving the above problems. To give an example, a processor that executes a program, a memory that stores a program executed by the processor, and an interface connected to the processor, A computer connected to a document database for storing documents, wherein the processor extracts a causal relationship between words contained in the document stored in the document database, and the extracted words Causal network data representing a causal relationship in a network structure is created, and from the causal network data, an interesting word that is a word that a user is interested in is extracted and a word that is causal is extracted. Word, based on the first word and the second word when the extracted word is the second word Te, create a heading documents, a document the title that was created is assigned, and generating the data for presentation to a user via the output device.
本発明によれば、情報の取捨選択の有効な判断材料となる見出しを付与した文書を提示することができる。 According to the present invention, it is possible to present a document with a heading that is an effective determination material for selecting information.
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。 Problems, configurations, and effects other than those described above will be clarified by the following description of embodiments.
以下、本発明の実施の形態について図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
本発明の実施形態の計算機システム1(図2参照)では、製造現場においてクライアントコンピュータ40を用いて作業する作業者(以下、「利用者」という。)に、過去の不具合事例や作業ノウハウに関する文書を提示することによって、不具合再発防止や作業の効率化を実現する。
In the computer system 1 (see FIG. 2) according to the embodiment of the present invention, a document on past trouble cases and work know-how is given to a worker (hereinafter referred to as a “user”) who uses the
図1は、本発明の実施形態の計算機システム1の利用者の操作概要を示すフローチャートである。利用者の操作概要について、図2を適宜参照して説明する。
FIG. 1 is a flowchart showing an outline of the operation of the user of the
はじめに、利用者は、業務管理システムクライアント402を介して、業務管理システム201にログインし、ユーザIDを入力する(S101)。その後、クライアントコンピュータ40の出力部(ディスプレイ等)に業務の一覧が提示されるので、利用者は実行する業務を選択し、業務を開始する(S102)。そうすると、クライアントコンピュータ40上で、選択された業務の作業状態に関連する情報の見出し一覧が表示される(S103)。
First, the user logs in to the
利用者は、表示された見出し一覧の中で、興味を引く見出しがあるか否かを判断する(S104)。興味を引く見出しがある場合(S104でYES)、利用者は、この見出しを選択し、情報提供サーバ10から業務に有用な情報を取得する(S105)。一方、興味を引く見出しがない場合(S104でNO)、利用者は業務を継続する(S106)。 The user determines whether there is a headline that attracts interest in the displayed heading list (S104). When there is a headline that attracts interest (YES in S104), the user selects this headline, and acquires information useful for business from the information providing server 10 (S105). On the other hand, when there is no headline that attracts interest (NO in S104), the user continues the business (S106).
その後、業務中の場合(S107でNO)、ステップ103に戻る。この場合、表示される見出し一覧が、その時点における業務の作業状態に応じて更新される。一方、業務が終了すると(S107でYES)、利用者は業務管理システム201からログアウトする(S108)。
Thereafter, when the job is in progress (NO in S107), the process returns to
以下、ステップ103の処理、すなわち見出し一覧の表示方法について説明する。
Hereinafter, the process of
図2は、本発明の実施形態の計算機システム1の構成例を説明する図である。
FIG. 2 is a diagram illustrating a configuration example of the
図2において、実線長方形で示すブロック(熟練度判定部101等)は、プログラムモジュールである。平行四辺形で示すブロック(ユーザID111等)は、データである。破線長方形で示すブロック(業務管理システム201等)は、情報提供サーバ10と別の独立した外部システムである。円柱で示すブロック(業務情報DB50等)は、データベースである。
In FIG. 2, blocks (skill
計算機システム1は、情報提供サーバ10、業務管理サーバ20、検索サーバ30、クライアントコンピュータ40、業務情報DB50、個人情報DB60、文書DB70を備える。
The
情報提供サーバ10は、クライアントコンピュータ40に見出し付き文書データ118を提供するコンピュータ装置である。この情報提供サーバ10は、熟練度判定部101、興味語抽出部102、多義性解決部103、因果抽出部104、見出し作成部105を備える。各機能部については詳細に後述する。
The
この情報提供サーバ10は、業務管理サーバ20から受信したユーザID111に基づいて、業務管理サーバ20を介して又は介さずに、業務情報DB50、個人情報DB60から、それぞれ個人作業状態データ112、個人プロフィールデータ114を入力する。
Based on the
業務管理サーバ20は、クライアントコンピュータ40からの要求に応じて、業務管理システムクライアント402にサービスを提供する業務管理システム201を備えたコンピュータ装置である。この業務管理サーバ20は、クライアントコンピュータ40から、利用者のユーザID411、業務の作業状態に関するデータ412を受信する。
The
検索サーバ30は、情報を検索する検索エンジン301を備えたコンピュータ装置である。この検索サーバ30は、情報提供サーバ10から興味語データ117を受信し、興味語データ117に基づいて、文書DB70中に記録された文書データに対して検索を実行し、検索結果として抽出される文書データ311を情報提供サーバ10に送信する。
The
クライアントコンピュータ40は、見出しリスト表示部401、業務管理システムクライアント402を備えたコンピュータ装置である。利用者は、クライアントコンピュータ40を用いて自身の業務を実行する。
The
業務情報DB50は、クライアントコンピュータ40の各利用者によって遂行される業務に関する情報(業務名、関連文書一覧、関連語一覧等、詳細は後述)が記録されたデータベースである。個人情報DB60は、クライアントコンピュータ40の各利用者の個人プロフィールデータ114が記録されたデータベースである。文書DB70は、各種文書データが記録されたデータベースである。
The business information DB 50 is a database in which information related to business performed by each user of the client computer 40 (business name, related document list, related word list, etc., details will be described later) is recorded. The personal information DB 60 is a database in which
図3は、本発明の実施形態の計算機システム1のハードウェア構成例を説明する図である。なお、図3では、図2と同様の機能を果たす部分には同一の符号を付して重複する説明を適宜省略する。
FIG. 3 is a diagram illustrating a hardware configuration example of the
図3に示す計算機システム1は、ネットワーク80を介して互いに接続された情報提供サーバ10、業務管理サーバ20、検索サーバ30、クライアントコンピュータ40を備える。なお、ネットワーク80は、LAN(Local Area Network)、WAN(Wide Area Network)、又は、インターネット等のグローバルネットワークである。
The
以下、各装置のハードウェア構成について説明する。 Hereinafter, the hardware configuration of each apparatus will be described.
情報提供サーバ10は、ネットワークインタフェース11、CPU(Central Processing Unit)12、主記憶装置13、二次記憶装置14、及び、これらを相互に接続するバス15を備える。
The
ネットワークインタフェース11は、情報提供サーバ10がネットワーク80に接続するためのインタフェースである。CPU12は、主記憶装置13に記憶されているプログラムを実行する演算処理装置である。主記憶装置13は、CPU12によって実行されるプログラム、及び、プログラムの実行に必要なデータを記憶するRAM(Random Access Memory)等の記憶装置である。プログラムとは、例えば、不図示のOS(Operating System)である。二次記憶装置14は、ハードディスク装置などの磁気記憶媒体である。
The network interface 11 is an interface for the
業務管理サーバ20、検索サーバ30、クライアントコンピュータ40のそれぞれのハードウェア構成は、情報提供サーバ10と同様であるとして、ここでは説明を省略する。
The hardware configurations of the
図4Aは、本発明の実施形態の個人作業状態データ112の例を示す図である。
FIG. 4A is a diagram illustrating an example of the personal
個人作業状態データ112は、各利用者の作業状態を示すデータである。この個人作業状態データ112は、業務ID112A、作成中文書112B、閲覧中文書112C、検索エンジン状態112Dを含む。
The personal
業務ID112Aとは、利用者が従事している業務を一意に識別する識別子である。この業務ID112Aは、あらかじめ工場内又は製造工程内の全ての業務に振られている。作成中文書112Bとは、利用者が作業時間中にクライアントコンピュータ40上で作成している文書、例えば設計図、仕様書等である。この作成中文書112Bは、常駐ソフトによる監視や、一定のタイミングで業務管理サーバ20にアップロードする規則の制定などによって取得される。閲覧中文書112Cとは、利用者が作業時間中にクライアントコンピュータ40上で閲覧している文書、例えば仕様書、手順書、Webページ等である。この閲覧中文書112Cは、常駐ソフトによる監視や、ブラウザの履歴の抽出などによって取得される。検索エンジン状態112Dとは、検索エンジン301に入力された単語や検索オプションのことである。この検索エンジン状態112Dは、常駐ソフトによる監視やブラウザからの情報抽出によって取得される。
The
図4Bは、本発明の実施形態の個人作業履歴データ113の例を示す図である。
FIG. 4B is a diagram illustrating an example of the personal
個人作業履歴データ113は、各利用者の作業状態の履歴を示すデータである。この個人作業履歴データ113は、作成文書履歴113A、閲覧文書履歴113Bを含む。
The personal
作成文書履歴113Aとは、個人作業状態データ112の作成中文書112Bのうち、同じ業務IDの作成中文書112Bに、時刻情報を加えたものである。閲覧文書履歴113Bとは、個人作業状態データ112の閲覧中文書112Cのうち、同じ業務IDの閲覧中文書112Cに、時刻情報を加えたものである。
The created
図4Cは、本発明の実施形態の個人プロフィールデータ114の例を示す図である。
FIG. 4C is a diagram illustrating an example of the
個人プロフィールデータ114は、各利用者のプロフィールを示すデータである。この個人プロフィールデータ114は、担当業務データ114A、所属部署データ114B、過去作成文書データ114C、過去閲覧文書データ114Dを含む。
The
担当業務データ114Aとは、利用者の担当業務に関するデータである。この担当業務データ114Aは、担当業務の業務名、担当業務に関連する文書(以下、「関連文書」という。)の一覧と関連係数、担当業務に関連する語(以下、「関連語」という。)の一覧と関連係数、担当業務に関連する業務のID(以下、「関連業務ID」という。)の一覧、担当業務の担当期間を含む。関連係数とは、業務に携わる全ての利用者の閲覧文書や作成文書における単語の出現頻度を用いること等によって算出される。この担当業務データ114Aは、業務IDを用いて読み出すことができる。
The assigned
所属部署データ114Bとは、利用者の所属部署に関するデータである。この所属部署データ114Bは、所属部署の部署名、所属部署の関連業務IDの一覧と関連係数、所属部署の所属メンバの一覧、所属部署における所属期間を含む。過去作成文書データ114Cとは、業務IDに関わらず過去の全ての作成文書に、時刻情報を加えたものである。過去閲覧文書データ114Dとは、業務IDに関わらず過去の全ての閲覧文書に、時刻情報を加えたものである。
The belonging department data 114B is data relating to the user's belonging department. The belonging department data 114B includes the department name of the belonging department, a list of related business IDs and related coefficients of the belonging department, a list of belonging members of the belonging department, and a belonging period in the belonging department. The past created
図5は、本発明の実施形態の情報提供サーバ10の全体処理を示すフローチャートである。ここでは、情報提供サーバ10の全体処理について、図2を適宜参照して説明する。
FIG. 5 is a flowchart showing the overall processing of the
はじめに、利用者がクライアントコンピュータ40を用いて業務管理システム201にログインすると、情報提供サーバ10はユーザID111を受理する(S501)。以降ステップ502〜504の処理により、情報提供サーバ10は、ステップ501で受理したユーザID111をキーとして、各情報を読み出す。
First, when a user logs in to the
ステップ502において、情報提供サーバ10は、業務管理システム201から、利用者の担当業務の業務IDを受理する(S502)。その後ステップ503において、因果ネットワークデータ106を読み出す(S503)。因果ネットワークデータ106とは、文書DB70内の複数の文書に含まれる事象の因果関係を表すネットワーク構造のデータである。図9を用いて詳細に後述する。
In step 502, the
その後ステップ504において、情報提供サーバ10は、個人情報DB60から個人プロフィールデータ114を読み出す(S504)。その後ステップ505において、情報提供サーバ10(熟練度判定部101)は、ステップ504で読み出された個人プロフィールデータ114を基に、利用者の熟練度を計算する(S505)。このステップ505の処理については、図6を用いて詳細に後述する。
Thereafter, in step 504, the
その後ステップ506において、情報提供サーバ10は、業務管理システム201から、その時点での個人作業状態データ112を受理する(S506)。
Thereafter, in
その後ステップ507において、情報提供サーバ10は、個人作業履歴データ113を更新する(S507)。具体的には、ステップ506で受信した個人作業状態データ112に含まれる作成中文書112B、閲覧中文書112Cを、個人作業履歴データ113に追加する。その後ステップ508において、興味語抽出部102が、利用者の興味語を抽出する(S508)。このステップ508の処理については、図10を用いて詳細に後述する。
Thereafter, in
その後ステップ509において、情報提供サーバ10は、ステップ508で抽出された興味語に基づき、当該興味語に関連する文書を、文書DB70から検索する(S509)。ここでは、既存の検索エンジン301を用いて検索する。興味語に関連する文書とは、興味語と因果関係にあるキーワードを有する文書である。その後ステップ510において、多義性解決部103が、興味語の多義性を解決する(S510)。このステップ510の処理については、図7を用いて詳細に後述する。
Thereafter, in
その後ステップ511において、見出し作成部105が、ステップ509で検索された文書に対して付与する見出しを作成する(S511)。このステップ511の処理については、図11を用いて詳細に後述する。
Thereafter, in step 511, the
その後ステップ512において、見出しリスト表示部401は、ステップ511で作成された見出しを、出力部(ディスプレイ等)に表示することによって、利用者に提示する(S512)。
Thereafter, in step 512, the heading
その後ステップ513において、情報提供サーバ10は、利用者の入力を受け付ける(S513)。ここでいう利用者の入力とは、ステップ512で提示された見出しに対する利用者の閲覧要求である。その後ステップ514において、情報提供サーバ10は、文書閲覧要求があるか否かを判定する(S514)。
Thereafter, in step 513, the
文書閲覧要求がある場合(S514でYES)、情報提供サーバ10は、当該要求に対応する文書を提示し(S515)、ステップ512に戻って処理を繰り返す。一方、文書閲覧要求がない場合(S514でNO)、情報提供サーバ10は、待機状態になり、利用者がログアウトしたか否かを判定する(S516)。
If there is a document browsing request (YES in S514), the
ログアウトした場合(S516でYES)、情報提供サーバ10の待機状態は終了し、処理を終了する。一方、ログアウトしていない場合(S516でNO)、情報提供サーバ10は、個人作業状態データ112が変化したか否か(更新されたか否か)を判定する(S517)。個人作業状態データ112が変化した場合(S517でYES)、ステップ506へ戻って処理を繰り返す。個人作業状態データ112が変化していない場合(S517でNO)、ステップ516へ戻って処理を繰り返す。
When logging out (YES in S516), the standby state of the
以下、熟練度判定部101、興味語抽出部102、多義性解決部103、因果抽出部104、見出し作成部105、見出しリスト表示部401の処理フローについて説明する。
Hereinafter, the processing flow of the skill
図6は、本発明の実施形態の熟練度判定部101の制御ロジックを示すフローチャートである。ここでは、図5のステップ505の処理について、図2を適宜参照して説明する。
FIG. 6 is a flowchart illustrating the control logic of the skill
はじめに、熟練度判定部101は、ユーザID111をキーに、個人情報DB60から個人プロフィールデータ114を読み込む(S601)。次に、業務管理システム201から業務IDを受信し、受信した業務IDをキーに、業務情報DB50から業務関連語一覧を読み込む(S602)。
First, the skill
その後ステップ603において、熟練度判定部101は、ステップ601で読み込まれた個人プロフィールデータ114内の過去作成文書データ114Cが、ステップ602で読み込まれた業務関連語一覧中の業務関連語を含む場合、この業務関連語の出現頻度を取得する(S603)。その後ステップ604において、ステップ601で読み込まれた個人プロフィールデータ114内の過去閲覧文書データ114Dが、ステップ602で読み込まれた業務関連語一覧中の業務関連語を含む場合、この業務関連語の出現頻度を取得する(S604)。
Thereafter, in step 603, the skill
その後ステップ605において、熟練度判定部101は、個人プロフィールデータ114内の所属部署データ114Bのうち、関連業務ID一覧と所属期間を取得する(S605)。その後ステップ606において、個人プロフィールデータ114内の担当業務データ114Aのうち、関連業務IDと担当期間を取得する(S606)。その後ステップ607において、取得された各種データに基づき、式(1)に従って、業務IDで示される業務に対する利用者の熟練度を計算し、利用者熟練度データ115として出力する(S607)。
Thereafter, in step 605, the skill
式(1)は、業務に対する利用者の熟練度を算出するための式である。式(1)において、部署関連度(業務ID、部署ID)とは、部署への所属期間による関連業務への知識習得度(業務と部署の関連の深さ)である。Lとは、部署や業務に従事した期間と、関連知識の習熟度との相関を示す習熟関数である。L(所属期間(部署ID))とは、部署に所属した期間による業務への習熟度である。L(担当期間(業務ID))とは、業務に従事した期間による業務への習熟度である。p(w)は、過去に作成した文書(過去作成文書データ114C)における業務関連語の出現頻度である。D(w)は、業務IDの関連語一覧に基づく単語の専門性である。すなわち、Σ(p(w)×D(w))は、過去に作成した文書から推定される業務への習熟度である。なお、過去に作成した文書が業務関連語を多く含むほど、習熟度は高いと判断される。q(w)は、過去に閲覧した文書(過去閲覧文書データ114D)における業務関連語の出現頻度である。すなわち、Σ(q(w)×D(w))は、過去に閲覧した文書から推定される業務への習熟度である。なお、過去に閲覧した文書が業務関連語を多く含むほど、習熟度は高いと判断される。また、α、β、γ、δは、それぞれα≧0、β≧0、γ≧δ≧0の定数である。
Expression (1) is an expression for calculating the skill level of the user for the business. In equation (1), the degree of department relevance (business ID, department ID) is the degree of knowledge acquisition of related work (depth of relation between business and department) according to the period of belonging to the department. L is a proficiency function that indicates the correlation between the period in which a department or business has been engaged and the proficiency level of related knowledge. L (Affiliation period (department ID)) is the proficiency level for the work by the period of belonging to the department. L (in charge period (business ID)) is a proficiency level for the business during the business period. p (w) is a frequency of appearance of business related words in a document created in the past (past created
以上に示す処理により、熟練度判定部101は、業務に対する利用者の熟練度を判定し、数値化することができる。
Through the processing described above, the skill
図7は、本発明の実施形態の多義性解決部103の制御ロジックを示すフローチャートである。ここでは、図5のステップ510の処理について、図2を適宜参照して説明する。
FIG. 7 is a flowchart illustrating the control logic of the
はじめに、多義性解決部103は、個人作業履歴データ113、因果ネットワークデータ106、興味語データ116を読み込む(S701〜S703)。次にステップ704において、入力された興味語データ116が因果ネットワークデータ106(図9参照)内の2箇所以上のノードに登場するかどうかを判定する(S704)。
First, the
1箇所以下のノードに登場する場合(S704でNO)、この興味語データ116が新出単語、又は一つの意味しかない単語であるので、ステップ705に進み、多義性解決部103は、この興味語データ116をそのまま出力し(S705)、処理を終了する。一方、2箇所以上(複数)のノードに登場する場合(S704でYES)、複数のノードのそれぞれについて、式(2)によって、ノードの文脈適合度を計算する(S706)。文脈適合度とは、文書における興味語の適合性を示す指標である。
If it appears in one or less nodes (NO in S704), since this
式(2)は、ノードの文脈適合度を計算するための式である。式(2)において、d(w、i)は、個人作業履歴データ113に登場する単語wと、興味語データ116で示される興味語iとの、因果ネットワークデータ106上の(意味的)距離である。このd(
w、i)は、ノードと単語とが強い因果関係にあるほど小さな値になる。t(w)は、単
語wが最後に文脈に登場してからの経過時間(文脈内での時間的距離)である。C1、C2は定数である。なお、該当する興味語のノードの近辺に位置する単語が、個人作業履歴データ113上に多く登場するほど、及び、個人作業履歴データ113上での登場時刻が新しいほど、式(2)によって計算される文脈適合度は高くなる。
Expression (2) is an expression for calculating the context suitability of the node. In Expression (2), d (w, i) is a (semantic) distance on the
w, i) becomes smaller as the causal relationship between the node and the word is stronger. t (w) is the elapsed time (temporal distance within the context) since the word w last appeared in the context. C1 and C2 are constants. It is to be noted that the more words that are located in the vicinity of the relevant interesting word node appear on the personal
その後ステップ707において、多義性解決部103は、ステップ706で計算された各ノードの文脈適合度を比較し、文脈適合度の高いノードを採用する(S707)。その後ステップ708において、ステップ707で採用されたノード(意味を限定した興味語)を出力する(S708)。
Thereafter, in step 707, the
以上に示す処理により、多義性解決部103は、興味語が複数の意味を有する場合、この多義性を解決して、最も適した興味語に意味を限定し、この興味語を出力することができる。
By the processing described above, the
図8は、本発明の実施形態の因果抽出部104の制御ロジックを示すフローチャートである。ここでは、図5のステップ510の処理について、図2を適宜参照して説明する。
FIG. 8 is a flowchart illustrating the control logic of the
はじめに、因果抽出部104は、文書DB70から未処理の文書(処理対象の文書)を一つ読み出す(S801)。次にステップ802において、因果抽出部104は、ステップ601で読み出された文書から、因果関係を有する単語ペアを一つ抽出する(S802)。
First, the
その後ステップ803において、因果抽出部104は、抽出された単語ペアを構成する2単語が、共に因果ネットワークデータ106内にノードとして登録されているか否かを判定する(S803)。
Thereafter, in step 803, the
2単語が共に登録されている場合(S803でYES)、ステップ804に進み、因果抽出部104は、登録されている二つのノードをリンク(リンクの強度1)で結合する(S804)。リンクの強度とは、ノード間の因果関係の強さを示す指標である。なお、このステップ804では、既に二つのノードがリンクで結合されている場合、リンクの強度に1を加算する。一方、2単語共に登録されてはいない場合(S803でNO)、ステップ805に進み、因果抽出部104は、いずれか片方の単語が因果ネットワークデータ106内にノードとして登録されているか否かを判定する(S805)。
If the two words are registered together (YES in S803), the process proceeds to step 804, and the
片方の単語のみ登録されている場合(S805でYES)、ステップ806に進み、因果抽出部104は、登録されていない方の単語を新しいノードとして登録し、二つのノードをリンク(リンクの強度1)で結合する(S806)。一方、2単語がいずれも登録されていない場合(S805でNO)、ステップ807に進み、因果抽出部104は、2単語をそれぞれ新しいノードとして登録し、二つのノードをリンク(リンクの強度1)で結合する(S807)。
If only one word is registered (YES in S805), the process proceeds to step 806, where the
その後ステップ808により、因果抽出部104は、因果関係を有する他の単語ペアがあるか否かを判定し(S808)、他の単語ペアがある場合(S808でYES)、ステップ802に戻って処理を繰り返す。またステップ809により、因果抽出部104は、文書DB70に未処理の文書があるか否かを判定し(S809)、他の未処理の文書がある場合(S809でYES)、ステップ801に戻って処理を繰り返す。
Thereafter, in
以上に示す処理により、因果抽出部104は、文書DB70中の全ての文書における単語間の因果関係を抽出し、因果ネットワークデータ106を作成する。
Through the processing described above, the
特に、製造現場における技術文書から因果関係を抽出することによって、設計支援、不具合の原因究明、不良の再発防止等の目的で過去の文書を活用することができる。 In particular, by extracting causal relationships from technical documents at the manufacturing site, past documents can be used for the purposes of design support, investigation of the cause of defects, prevention of recurrence of defects, and the like.
図9は、本発明の実施形態の因果抽出部104によって作成される因果ネットワークデータ106の例を説明する図である。因果抽出部104は、文書DB70に格納された製造現場における事故・不良報告書に基づいて、図9に示すような因果ネットワークデータ106を作成する。
FIG. 9 is a diagram illustrating an example of the
図9において、長方形はノードを示している。また、矢印はリンク、すなわちノード間の因果関係を表している。例えば「摩擦901」と「発熱902」とは、「摩擦901」が「発熱902」を引き起こす因果関係であることを示している。また、「発熱902」と「部品変形903」とは、「発熱902」が「部品変形903」を引き起こす因果関係であることを示している。
In FIG. 9, the rectangle indicates a node. An arrow represents a link, that is, a causal relationship between nodes. For example, “
図10は、本発明の実施形態の興味語抽出部102の制御ロジックを示すフローチャートである。ここでは、図5のステップ508の処理について、図2を適宜参照して説明する。
FIG. 10 is a flowchart illustrating the control logic of the interesting
はじめに、興味語抽出部102は、個人作業状態データ112を読み込む(S1001)。次にステップ1002において、利用者熟練度データ115を読み込む(S1002)。その後ステップ1003において、個人作業履歴データ113を読み込む(S1003)。その後ステップ1004において、興味語候補を初期化する(S1004)。興味語候補とは、興味語抽出部102が興味語を抽出するための候補となる興味語群である。
First, the interested
その後ステップ1005〜1008により、興味語抽出部102は、個人プロフィールデータ114中の関連語一覧、個人作業状態データ112中の作成中文書112B内の特徴語、閲覧中文書112C内の特徴語、検索エンジン状態112D中の検索エンジン301に入力された検索式に含まれる単語を、興味語候補に加える(S1005〜1008)。ここで、文書内の特徴語とは、その文書内に多く含まれるなど、文書との関連の高い単語のことであり、例えばTF(Term Frequency)−IDF(Inverse Document Frequency)の高い単語を特徴語として扱うことができる。TF(Term Frequency)−IDF(Inverse Document Frequency)とは、文書中の特徴語らしさを表す値であって、TFをDF(Document Frequency)で除算することによって求められる。TFは、該当文書中の単語の出現頻度である。DFは、全文書中の単語の出現頻度である。その後ステップ1009において、興味語抽出部102は、全ての興味語候補のそれぞれの興味度を、式(3)に従って計算する(S809)。興味度とは、興味語に対する利用者の興味の度合いを示す指標である。
Thereafter, in steps 1005 to 1008, the interested
式(3)は、興味語候補の興味度を算出するための式である。式(3)において、業務関連係数とは、業務IDによって呼び出される関連語の関連係数である。利用者熟練度とは、ステップ1002で読み込まれた利用者熟練度データ115である。適正熟練度とは、単語の専門性であり、その単語に興味を持つ可能性が高い利用者の熟練度である。専門性の高い単語は出現頻度が低いと仮定すれば、単語の専門性は、DFに基づいて算出することができる。
Expression (3) is an expression for calculating the interest level of the interesting word candidate. In Equation (3), the business related coefficient is a related coefficient of a related word called by the business ID. The user skill level is the user
検索式内重要度とは、検索式における単語の各々に割り振られる単語の重要度である。例えば検索式がAND検索である場合、ANDで結ばれた各単語に重要度を等分に分配する。一方、検索式がOR検索の場合、ORで結ばれた各単語に重要度を等分せずにそのまま付する。 The importance in the search expression is the importance of the word assigned to each word in the search expression. For example, when the search formula is an AND search, importance is equally distributed to each word connected by AND. On the other hand, when the search expression is an OR search, the importance is assigned to each word connected by OR without being divided equally.
例えば検索式が(A∨B)∧C)である場合、検索式内重要度は(A、B、C)=(0.5、0.5、0.5)である。また、検索式が(A∧B)∨C)である場合、検索式内重要度は(A、B、C)=(0.5、0.5、1.0)である。また、α、β、γ、δ、εは、それぞれ0以上の定数である。 For example, when the search formula is (A∨B) ∧C), the importance in the search formula is (A, B, C) = (0.5, 0.5, 0.5). When the search formula is (A∧B) ∨C), the importance in the search formula is (A, B, C) = (0.5, 0.5, 1.0). Α, β, γ, δ, and ε are constants of 0 or more.
この式(3)によれば、作業中の業務に関連が深い単語、作成文書中や閲覧文書中で特に多く出現する単語、作業者の熟練度と同程度の専門性を持つ単語、作業者が検索システムを使っている場合は検索式に含まれる単語ほど、興味度が高くなる。 According to this equation (3), words that are closely related to the work being worked on, words that appear particularly frequently in the created document and the read document, words that have the same level of expertise as the skill level of the worker, and the worker When using a search system, the more the word included in the search formula, the higher the degree of interest.
その後ステップ810において、興味語抽出部102は、興味度が一定以上の興味語候補を抽出し、興味語データ116として出力する(S810)。
Thereafter, in step 810, the interested
以上に示す処理により、興味語抽出部102は、個人作業履歴データ113、個人プロフィールデータ114等に基づいて、その時点において利用者が興味を持つ可能性が高い単語を抽出することができる。
Through the processing described above, the interested
図11は、本発明の実施形態の見出し作成部105の制御ロジックを示すフローチャートである。ここでは、図5のステップ511の処理について、図2を適宜参照して説明する。
FIG. 11 is a flowchart illustrating the control logic of the
はじめに、見出し作成部105は、因果ネットワークデータ106を読み込む(S1101)。次にステップ1102において、検索エンジン301による検索結果の文書データ311と、興味語データ117に示される興味語(以下、「検索語」という。)とのセットを読み込む(S1102)。
First, the
その後ステップ1103において、見出し作成部105は、因果ネットワークデータ106上で、検索語と一定距離内の因果関係にある単語を抽出する(S1103)。その後ステップ1104において、検索語を第1ワード、ステップ1103で抽出された単語を第2ワードとする(S1104)。
Thereafter, in step 1103, the
具体的には、利用者とコンテンツとの関連性の根拠となる興味語を、第1ワードとする。この第1ワードは複数でもよい。利用者が実行中の業務に関連する単語、作成中文書内の単語、閲覧文書履歴の特徴語、検索キーワード等が第1ワードの候補である。このような第1ワードを見出しの一部にすることによって、提示するコンテンツに対する納得感(透過性)を高めることができる。次に、コンテンツの内容において、第1ワードと最も関係の深い第2ワードを決定する。 Specifically, the interesting word that is the basis for the relationship between the user and the content is the first word. This first word may be plural. Words related to the business being executed by the user, words in the document being created, feature words of the browsing document history, search keywords, etc. are candidates for the first word. By making such a first word a part of the headline, the satisfaction (transparency) with respect to the presented content can be enhanced. Next, in the contents, the second word that is most closely related to the first word is determined.
その後ステップ1105において、見出し作成部105は、第1ワード、第2ワード、補間表現を組み合わせて文書の見出しを作成する(S1105)。ここでの補間表現とは、第1ワードと第2ワードとの因果関係を表す、「〜による…」、「〜を原因とする…」、「〜を引き起こす…」のような表現を示す。
Thereafter, in
このように、見出し作成部105は、第1ワードと第2ワードを組み合わせ、これらのワードの関係性を表す表現を補間して見出しを作成する。例えば製造現場における技術文書を扱う場合、技術文書は、原因、現象、対策の構造を有する確率が高い。文書の中で、第1ワードと原因−現象、原因−対策、現象−対策のいずれかの関係にある単語を、第2ワードとして選択する。
In this way, the
図12は、本発明の実施形態の見出し作成部105によって作成される見出しの一例を示す図である。
FIG. 12 is a diagram illustrating an example of a headline created by the
第1ワード(興味語)が「短絡」、第2ワードが「経年動作」である場合、作成される見出しは、図12に示すように「経年動作による短絡」となる。また、第2ワードが複数(「ボルト緩み」、「局部過熱」、「ボルト通電」、「溶融物」等)抽出された場合、作成される見出しも複数(「ボルト緩みによる短絡」、「局部過熱による短絡」、「ボルト通電による短絡」、「溶融物による短絡」等)である。一つの文書から複数の見出しが作成された場合、他の文書にも多く登場する因果関係の見出しを優先する。つまり、因果ネットワークデータ106上で最もリンク強度の強い2単語によって作成された見出し(図12に示す例では、「溶融物による短絡」)を採用する。第1ワードと第2ワードとを直接結ぶリンクがない場合、経由する全てのリンクの強度の逆数の総和を計算し、逆数の総和を因果関係の強弱を判定するための指標としてもよい。
When the first word (interesting word) is “short circuit” and the second word is “aging operation”, the created heading is “short circuit by aging operation” as shown in FIG. Also, if the second word is extracted (“bolt loosening”, “local overheating”, “bolt energization”, “melt”, etc.), multiple headlines are created (“short circuit due to bolt loosening”, “local”). Short circuit due to overheating, "short circuit due to volt energization", "short circuit due to melt", etc.). When multiple headings are created from one document, priority is given to causal headings that frequently appear in other documents. That is, a headline (in the example shown in FIG. 12, “short circuit due to melt”) created by two words having the strongest link strength on the
図11に戻り、その後ステップ1106において、見出し作成部105は、ステップ1105で作成された見出しを文書に付与し、見出し付き文書データ118として出力する(S1106)。その後ステップ1107において、検索結果の他の文書があるか否かを判定し(S1107)、他の文書がある場合(S1107でYES)、ステップ1102に戻って処理を繰り返す。
Returning to FIG. 11, in step 1106, the
以上に示す処理により、見出し作成部105は、利用者の作業状況や知識に適合した見出しを作成し、作成された見出しを文書に付与して出力する。なお、見出し作成部105は、複数のコンテンツから同一の見出しを作成する場合がある。この場合、これら複数のコンテンツを、同質のコンテンツとして同一の見出しを付与してグルーピングしてもよい。これにより、内容が重複する文書の閲覧を防ぐことができる。
Through the processing described above, the
図13は、本発明の実施形態の見出しリスト表示部401の制御ロジックを示すフローチャートである。ここでは図5のステップ512の処理について、図2を適宜参照して説明する。
FIG. 13 is a flowchart illustrating the control logic of the heading
はじめに、見出しリスト表示部401は、見出し作成部105から出力された見出し付き文書データ118を全て読み込む(S1301)。次にステップ1302において、ステップ1301で読み込まれた見出し付き文書データ118のうち、重複しない全ての見出しを表示する(S1302)。その後ステップ1303において、利用者の入力を待機する(S1303)。
First, the heading
その後ステップ1304において、見出しに対して利用者の閲覧要求があり(S1304でYES)、且つ、見出しに対応する文書が二つ以上ある場合(S1305でYES)、見出しリスト表示部401は、一つの文書を表示し、さらに閲覧要求があった場合に他の文書を表示する(S1306)。
Thereafter, in step 1304, when there is a user browsing request for the headline (YES in S1304) and there are two or more documents corresponding to the headline (YES in S1305), the heading
一方、見出しに対して利用者の閲覧要求があり(S1304でYES)、且つ、見出しに対応する文書が一つである場合(S1305でNO)、見出しリスト表示部401は、当該見出しに対応する文書を表示する(S1307)。文書を表示した後は、ステップ1303に戻って、再び利用者の入力を待機する。なお、ステップ1304において、利用者の閲覧要求がない場合(S1304でNO)、処理を終了する。
On the other hand, when there is a user browsing request for a headline (YES in S1304) and there is one document corresponding to the headline (NO in S1305), the headline
以上に示す処理により、見出しリスト表示部401は、見出し作成部105によって作成された見出し付き文書データ118を表示する。
Through the processing described above, the heading
図14は、本発明の実施形態の見出しリスト表示部401による表示画面1401の例を示す図である。
FIG. 14 is a diagram showing an example of a
図14に示す表示画面1401において、タイトル1402には、見出し作成部105によって作成された見出しが表示される。本文確認ボタン1403は、タイトル1402に対応する文書の本文を確認するためのボタンである。事業者名1404、製品名1405には、タイトル1402に関する事業者名、製品名が表示される。関連ワード1406には、タイトル1402に関連するワードが表示される。
In the
図14に示すような表示画面1401を表示することにより、利用者は、表示された情報の要不要を迅速且つ正確に判断することができる。
By displaying the
以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一つを示したものであり、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。本発明の要旨を逸脱しない範囲において種々変更可能である。 As mentioned above, although embodiment of this invention was described, the said embodiment showed one of the application examples of this invention, and in the meaning which limits the technical scope of this invention to the specific structure of the said embodiment. Absent. Various modifications can be made without departing from the scope of the present invention.
1 計算機システム
10 情報提供サーバ
20 業務管理サーバ
30 検索サーバ
40 クライアントコンピュータ
50 業務情報DB
60 個人情報DB
70 文書DB
101 熟練度判定部
102 興味語抽出部
103 多義性解決部
104 因果抽出部
105 見出し作成部
106 因果ネットワークデータ
112 個人作業状態データ
113 個人作業履歴データ
114 個人プロフィールデータ
115 利用者熟練度データ
116 興味語データ
118 見出し付き文書データ
401 見出しリスト表示部
1
60 Personal Information DB
70 Document DB
101 Skill
Claims (7)
前記プロセッサは、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成し、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出し、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成し、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成することを特徴とする計算機。 A computer comprising a processor for executing a program, a memory for storing a program executed by the processor, and an interface connected to the processor, and connected to a document database for storing documents,
The processor is
Extracting the causal relationship between words included in the document stored in the document database, creating causal network data representing the extracted causal relationship between the words in a network structure,
From the causal network data, extract words that are causal with an interest word that is a word that the user is interested in,
Based on the first word and the second word when the interesting word is the first word and the extracted word is the second word, a headline of the document is created,
A computer that generates data for presenting a created document with the heading to a user via an output device.
さらに、前記作業者熟練度データに基づいて、当該利用者の興味語を抽出することを特徴とする請求項2に記載の計算機。 The processor creates user skill data indicating the skill level of the user for the predetermined job based on the profile data,
The computer according to claim 2, further comprising extracting an interest word of the user based on the worker skill level data.
前記プロセッサが、
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成する手順と、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出する手順と、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成する手順と、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成する手順と、
を実行することを特徴とする文書提示方法。 A document presentation method in a computer comprising a processor for executing a program, a memory for storing a program executed by the processor, and an interface connected to the processor, and connected to a document database for storing the document. ,
The processor is
A procedure for extracting a causal relationship between words included in a document stored in the document database, and creating causal network data representing the extracted causal relationship between the words in a network structure;
A procedure for extracting a word that is causal with an interesting word that is a word that the user is interested in from the causal network data;
Creating a document heading based on the first word and the second word when the interesting word is the first word and the extracted word is the second word;
A procedure for generating data for presenting the created document with the heading to a user via an output device;
The document presentation method characterized by performing.
前記文書データベースに格納された文書に含まれる単語間の因果関係を抽出し、抽出された前記単語間の因果関係をネットワーク構造で表した因果ネットワークデータを作成する手順と、
前記因果ネットワークデータから、利用者が興味を持っている単語である興味語と因果関係にある単語を抽出する手順と、
前記興味語を第1ワード、抽出された単語を第2ワードとした場合における前記第1ワードと、前記第2ワードとに基づいて、文書の見出しを作成する手順と、
作成された前記見出しが付与された文書を、出力装置を介して利用者に提示するためのデータを生成する手順と、
を前記計算機に実行させることを特徴とする文書提示プログラム。 A document presentation program executed on a computer connected to a document database for storing a document, comprising: a processor for executing the program; a memory for storing the program executed by the processor; and an interface connected to the processor. Because
A procedure for extracting a causal relationship between words included in a document stored in the document database, and creating causal network data representing the extracted causal relationship between the words in a network structure;
A procedure for extracting a word that is causal with an interesting word that is a word that the user is interested in from the causal network data;
Creating a document heading based on the first word and the second word when the interesting word is the first word and the extracted word is the second word;
A procedure for generating data for presenting the created document with the heading to a user via an output device;
Is executed by the computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011001220A JP2012141928A (en) | 2011-01-06 | 2011-01-06 | Computer, document presentation method and document presentation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011001220A JP2012141928A (en) | 2011-01-06 | 2011-01-06 | Computer, document presentation method and document presentation program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012141928A true JP2012141928A (en) | 2012-07-26 |
Family
ID=46678124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011001220A Pending JP2012141928A (en) | 2011-01-06 | 2011-01-06 | Computer, document presentation method and document presentation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012141928A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017104656A1 (en) * | 2015-12-14 | 2017-06-22 | 日本電気株式会社 | Information processing device, information processing method, and recording medium |
-
2011
- 2011-01-06 JP JP2011001220A patent/JP2012141928A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017104656A1 (en) * | 2015-12-14 | 2017-06-22 | 日本電気株式会社 | Information processing device, information processing method, and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2501078C2 (en) | Ranking search results using edit distance and document information | |
TWI529543B (en) | Computerized system and computer-storage media for social network powered query refinement and recommendations | |
JP6360456B2 (en) | Apparatus, system, and method for context management | |
US20070226183A1 (en) | Method and apparatus for performing collaborative searches | |
TWI547815B (en) | Information retrieval method and device | |
US20120233160A1 (en) | System and method for assisting a user to identify the contexts of search results | |
GB2492198A (en) | Using a dynamically-generated content-level newsworthiness rating to provide content recommendations | |
JP2005259110A (en) | Document information management device, program, and method | |
JP5327784B2 (en) | Computer system, information collection support device, and information collection support method | |
JP5539127B2 (en) | Document management system, search specification method, program | |
US20130304721A1 (en) | Locating human resources via a computer network | |
JP2008299842A (en) | Reaction information providing method by advertisement execution, computer readable recording medium, and reaction information providing system by advertisement execution | |
JPWO2009107628A1 (en) | Search system, search method and program | |
JP2011100208A (en) | Action estimation device, action estimation method, and action estimation program | |
JP2007272465A (en) | Schedule management device, document presentation method for schedule management device, and schedule management program | |
JP2012141928A (en) | Computer, document presentation method and document presentation program | |
JP2020181463A (en) | Treasure keyword search system | |
JP5613536B2 (en) | Method, system, and computer-readable recording medium for dynamically extracting and providing the most suitable image according to a user's request | |
JP2009211281A (en) | Propagation structure extraction device, method and program, and computer-readable recording medium | |
JP2008102790A (en) | Retrieval system | |
JP2009003553A (en) | File retrieval system | |
CN109614542B (en) | Public number recommendation method, device, computer equipment and storage medium | |
JP5589009B2 (en) | RECOMMENDED QUERY EXTRACTION DEVICE, METHOD, AND PROGRAM | |
JP5292322B2 (en) | Document search method, document search apparatus, and document search program | |
JP2006164045A (en) | Cooccurrence graph creation method, device, program, and storage medium storing program |