JP5055202B2 - キーワード比較システム、キーワード比較方法およびキーワード比較プログラム - Google Patents
キーワード比較システム、キーワード比較方法およびキーワード比較プログラム Download PDFInfo
- Publication number
- JP5055202B2 JP5055202B2 JP2008141863A JP2008141863A JP5055202B2 JP 5055202 B2 JP5055202 B2 JP 5055202B2 JP 2008141863 A JP2008141863 A JP 2008141863A JP 2008141863 A JP2008141863 A JP 2008141863A JP 5055202 B2 JP5055202 B2 JP 5055202B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- information
- company
- electronic file
- outside
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title description 29
- 238000012937 correction Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000009118 appropriate response Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
101 記憶装置、ハードディスクドライブ
102 プログラム
103 メモリ
104 CPU
105 入力インターフェース
106 出力インターフェース
107 通信装置
108 I/O部
110 内外部情報受信部
111 内外部文書取得部
112 キーワード抽出部
113 出現回数算出部
114 矯正係数算出部
115 ギャップ判定部
116 ギャップ情報出力部
117 内外部情報データベース更新部
118 非キーワード情報データベース更新部
119 キーワード情報データベース更新部
120 内外部情報データベース
121 キーワード情報データベース
122 非キーワード情報データベース
130 イントラネット/インターネット
Claims (9)
- 企業の内部および外部に存在する電子ファイル中のキーワードの出現回数または出現頻度のギャップを判定するキーワード比較システムであって、
企業の内部および外部に存在する前記電子ファイルに含まれるキーワードを抽出して前記キーワードに関する情報を記憶するキーワード抽出部と、
前記キーワードに関する情報に基づき、企業の内部および外部に存在する前記電子ファイル中の前記キーワードの出現回数または出現頻度をそれぞれ算出する出現回数/出現頻度算出部と、
算出した前記出現回数または出現頻度を用いて、企業の内部および外部に存在する前記電子ファイル中の前記キーワードの出現回数または出現頻度のギャップを判定するギャップ判定部と、
前記キーワードのうち、企業の内部および外部に存在する前記電子ファイルの両方に含まれるキーワードを主要キーワードとし、企業の内部および外部に存在する前記電子ファイル中の前記主要キーワードの出現回数の比から矯正係数を算出する矯正係数算出部とを備え、
前記ギャップ判定部は、前記キーワードの出現回数に対して前記矯正係数を用いることにより、前記キーワードの出現回数を矯正し、矯正した前記出現回数を用いて、企業の内部および外部に存在する前記電子ファイル中の前記キーワードの出現回数のギャップを判定することを特徴とするキーワード比較システム。 - 請求項1記載のキーワード比較システムにおいて、
前記矯正係数算出部は、企業の内部および外部に存在する前記電子ファイルの両方に含まれる前記キーワードの、企業の内部に存在する前記電子ファイル中の出現回数の和に対して各前記キーワードが占める出現割合と、企業の外部に存在する前記電子ファイル中の出現回数の和に対して各前記キーワードが占める出現割合をそれぞれ算出し、企業の内部に存在する前記電子ファイル中の出現割合が企業の外部に存在する前記電子ファイル中の出現割合より高いキーワードを前記主要キーワードとすることを特徴とするキーワード比較システム。 - 請求項2に記載のキーワード比較システムにおいて、
ネットワークを介して前記電子ファイルを取得し記憶する内外部情報取得部を備え、
前記内外部情報取得部は、前記電子ファイルをテキスト形式に変換してテキスト文書情報として記憶し、
前記キーワード抽出部は、記憶した前記テキスト文書情報に対して形態素解析を行うことにより前記キーワードを抽出することを特徴とするキーワード比較システム。 - 請求項3記載のキーワード比較システムにおいて、
形態素を予め記憶する手段を備え、
前記キーワード抽出部は、予め記憶した前記形態素とは異なる形態素をキーワードとして抽出し、抽出した前記キーワードに関する情報を記憶することを特徴とするキーワード比較システム。 - 請求項3または4に記載のキーワード比較システムにおいて、
前記内外部情報取得部は、取得した前記電子ファイルと同一の場所より取得した、当該電子ファイルとは異なる情報が既に記憶されている場合には、当該電子ファイルの情報を前記異なる情報に上書きして記憶することを特徴とするキーワード比較システム。 - 請求項5に記載のキーワード比較システムにおいて、
前記内外部情報取得部は、取得した前記電子ファイルと同一の情報が既に記憶されている場合には、当該電子ファイルの情報を新たに記憶しないことを特徴とするキーワード比較システム。 - 請求項3乃至6のいずれか1つに記載のキーワード比較システムにおいて、
前記内外部情報取得部は、複数の前記電子ファイルを取得可能であり、
前記出現回数/出現頻度算出部は、取得した企業の内部に存在する複数の前記電子ファイル中の前記キーワードの出現回数の総和または出現頻度の平均と、取得した企業の外部に存在する複数の前記電子ファイル中の前記キーワードの出現回数の総和または出現頻度の平均をそれぞれ算出し、
前記ギャップ判定部は、前記出現回数の総和または出現頻度の平均を用いて、企業の内部および外部に存在する複数の前記電子ファイル中の前記キーワードの出現回数または出現頻度のギャップを判定することを特徴とするキーワード比較システム。 - 請求項1乃至7のいずれか1つに記載のキーワード比較システムにおいて、
前記ギャップ判定部は、前記キーワードの出現回数に対して前記矯正係数を用いた値のカイ二乗値を算出し、前記カイ二乗値を用いて企業の内部および外部に存在する前記電子ファイル中の前記キーワードの出現回数のギャップを判定し、判定結果を出力インターフェースに出力することを特徴とするキーワード比較システム。 - 請求項1乃至8のいずれか1つに記載のキーワード比較システムにおいて、
前記出現回数/出現頻度算出部は、前記電子ファイルの取得日時および前記キーワードに関する情報に基づき、前記キーワードの出現回数または出現頻度に対して前記取得日時からの経過時間に応じた重み付けを行うことを特徴とするキーワード比較システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008141863A JP5055202B2 (ja) | 2008-05-30 | 2008-05-30 | キーワード比較システム、キーワード比較方法およびキーワード比較プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008141863A JP5055202B2 (ja) | 2008-05-30 | 2008-05-30 | キーワード比較システム、キーワード比較方法およびキーワード比較プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009289094A JP2009289094A (ja) | 2009-12-10 |
JP5055202B2 true JP5055202B2 (ja) | 2012-10-24 |
Family
ID=41458243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008141863A Expired - Fee Related JP5055202B2 (ja) | 2008-05-30 | 2008-05-30 | キーワード比較システム、キーワード比較方法およびキーワード比較プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5055202B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5422409B2 (ja) * | 2010-01-20 | 2014-02-19 | 株式会社東芝 | 業務分析システム及び業務分析プログラム |
CN113407487A (zh) * | 2021-06-07 | 2021-09-17 | 广东辰宜信息科技有限公司 | 数据文件管理方法、系统及计算机可读存储介质 |
KR102418004B1 (ko) * | 2021-12-21 | 2022-07-06 | 노무법인 더원인사노무컨설팅 | 인공지능 기반 노무 리스크 자가진단 방법, 장치 및 시스템 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3583631B2 (ja) * | 1998-12-03 | 2004-11-04 | 三菱電機株式会社 | 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体 |
EP1936520A1 (en) * | 2005-10-11 | 2008-06-25 | Intellectual Property Bank Corp. | Company technical document group analysis supporting device |
JP4837989B2 (ja) * | 2005-12-26 | 2011-12-14 | 株式会社野村総合研究所 | 文献情報分析装置及び文献情報分析方法 |
JP2008003717A (ja) * | 2006-06-20 | 2008-01-10 | Fuji Xerox Co Ltd | 情報提供拠点評価装置 |
-
2008
- 2008-05-30 JP JP2008141863A patent/JP5055202B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009289094A (ja) | 2009-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10180980B2 (en) | Methods and systems for eliminating duplicate events | |
JP4772378B2 (ja) | Webページから時系列データを生成する方法及び装置 | |
US6782423B1 (en) | Hypertext analyzing system and method | |
JP2011022705A (ja) | 証跡管理方法、システム、及びプログラム | |
US20150066478A1 (en) | Synonym relation determination device, synonym relation determination method, and program thereof | |
JP2008310582A (ja) | 保守作業支援装置とシステム並びに保守作業支援方法 | |
JP2008033687A (ja) | 検索クエリー作成装置 | |
JP5556711B2 (ja) | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム | |
JP2018206361A (ja) | ユーザ指向トピック選択及びブラウジングのためのシステム及び方法、複数のコンテンツ項目を表示する方法、プログラム、及びコンピューティングデバイス | |
JP5125558B2 (ja) | 推薦情報提供装置、推薦情報提供方法、推薦情報提供システムおよび推薦情報提供プログラム | |
JP2009230663A (ja) | ウェブページの異常検知装置、プログラム、および記録媒体 | |
JP4636473B2 (ja) | リンク情報抽出装置、リンク情報抽出方法およびプログラム | |
JP5294002B2 (ja) | 文書管理システム、文書管理プログラム及び文書管理方法 | |
JP5228584B2 (ja) | 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム | |
US7853606B1 (en) | Alternate methods of displaying search results | |
JP5055202B2 (ja) | キーワード比較システム、キーワード比較方法およびキーワード比較プログラム | |
JP6025487B2 (ja) | フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム | |
JP5954053B2 (ja) | 検索支援システム、検索支援方法、およびコンピュータプログラム | |
JP5777663B2 (ja) | 検索支援装置及び検索支援プログラム | |
JP2004295836A (ja) | 文書管理方法 | |
JP2009199356A (ja) | ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム | |
JP2009252123A5 (ja) | ||
JP2010224752A (ja) | 情報処理装置、データ記憶方法及びプログラム、並びに情報処理システム | |
JP2010146031A (ja) | 情報分析装置、情報分析方法、及び情報分析用プログラム | |
JP5046634B2 (ja) | 情報検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120703 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120730 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5055202 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |