JP2017054232A - Information extraction device, information extraction method, and information extraction program - Google Patents

Information extraction device, information extraction method, and information extraction program Download PDF

Info

Publication number
JP2017054232A
JP2017054232A JP2015176620A JP2015176620A JP2017054232A JP 2017054232 A JP2017054232 A JP 2017054232A JP 2015176620 A JP2015176620 A JP 2015176620A JP 2015176620 A JP2015176620 A JP 2015176620A JP 2017054232 A JP2017054232 A JP 2017054232A
Authority
JP
Japan
Prior art keywords
information
extraction
keyword
source
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015176620A
Other languages
Japanese (ja)
Inventor
正彦 堤
Masahiko Tsutsumi
正彦 堤
景和 宮本
Kagekazu Miyamoto
景和 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2015176620A priority Critical patent/JP2017054232A/en
Publication of JP2017054232A publication Critical patent/JP2017054232A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an information extraction device, an information extraction method, and an information extraction program with which it is possible to extract information that includes a content truly needed for residents from source information.SOLUTION: An information extraction device in an embodiment of the invention has a keyword acquisition unit, a disadvantage information database, an extraction source database, a first extraction unit, a second extraction unit, and a transmission unit. The keyword acquisition unit acquires a keyword. The disadvantage information database stores first information predetermined as disadvantage information in correlation to the keyword. The extraction source database stores extraction source information that includes second information similar or identical to the first information in correlation to the keyword. The first extraction unit extracts the keyword from the extraction source information. The second extraction unit extracts the second information from the extraction source information in accordance with the extracted keyword. The transmission unit transmits the extracted second information to a person who requests information when the second information is stored in the extraction source database.SELECTED DRAWING: Figure 1

Description

本発明の実施形態は、情報抽出装置、情報抽出方法及び情報抽出プログラムに関する。   Embodiments described herein relate generally to an information extraction apparatus, an information extraction method, and an information extraction program.

自治体による工事や草刈り等の作業によって、騒音が発生する場合がある。このため、住民は、住居の近くで実施される作業のスケジュール情報を自治体に要求する場合がある。このような要求に対し、自治体が管理するサーバ装置は、自治体のデータベースに記憶されている元情報からスケジュール情報を抽出して、抽出したスケジュール情報を住民に提供する。しかしながら、抽出したスケジュール情報に示された作業日が直前に迫っていたり、作業が既に開始していたりする等、従来の装置が抽出したスケジュール情報は、住民にとって真に必要な内容を含む情報でない場合があった。   Noise may be generated by local government work or mowing. For this reason, a resident may request the local government for schedule information of work performed near the residence. In response to such a request, the server device managed by the local government extracts schedule information from the original information stored in the local government database, and provides the extracted schedule information to the residents. However, the schedule information extracted by conventional devices, such as when the work date shown in the extracted schedule information is approaching immediately or the work has already started, is not information that contains the content that is really necessary for the residents. There was a case.

このような問題は、自治体による作業のスケジュール情報に限られた問題ではない。上述したサーバ装置のように元情報から情報を抽出する情報抽出装置に共通する問題である。すなわち、従来の情報抽出装置は、住民にとって真に必要な内容を含む情報を元情報から抽出することができない場合があった。   Such a problem is not limited to work schedule information by local governments. This is a problem common to information extraction apparatuses that extract information from original information, such as the server apparatus described above. In other words, the conventional information extraction apparatus may not be able to extract information including content that is truly necessary for the residents from the original information.

特開2006−31204号公報JP 2006-31204 A 特開2008−234607号公報JP 2008-234607 A 特開2012−64236号公報JP 2012-64236 A 特開2006−190174号公報JP 2006-190174 A

本発明が解決しようとする課題は、住民にとって真に必要な内容を含む情報を元情報から抽出することができる情報抽出装置、情報抽出方法及び情報抽出プログラムを提供することである。   The problem to be solved by the present invention is to provide an information extraction apparatus, an information extraction method, and an information extraction program that can extract information including content that is truly necessary for residents from original information.

実施形態の情報抽出装置は、キーワード取得部と、不利益情報データベースと、抽出元データベースと、第1抽出部と、第2抽出部と、送信部とを持つ。キーワード取得部は、キーワードを取得する。不利益情報データベースは、情報を要求する者にとって不利益な情報として予め定められた第1情報をキーワードに対応付けて記憶する。抽出元データベースは、第1情報に類似する又は同一である第2情報とキーワードとを対応付けて含む抽出元情報を記憶する。第1抽出部は、抽出元情報からキーワードを抽出する。第2抽出部は、抽出されたキーワードに応じて第2情報を抽出元情報から抽出する。送信部は、第2情報が抽出元データベースに記憶された場合、抽出された第2情報を、情報を要求する者に対して送信する。   The information extraction apparatus according to the embodiment includes a keyword acquisition unit, a disadvantage information database, an extraction source database, a first extraction unit, a second extraction unit, and a transmission unit. The keyword acquisition unit acquires a keyword. The disadvantage information database stores first information that is predetermined as information that is disadvantageous to a person who requests information in association with a keyword. The extraction source database stores extraction source information that includes second information similar to or identical to the first information and a keyword in association with each other. The first extraction unit extracts a keyword from the extraction source information. The second extraction unit extracts second information from the extraction source information according to the extracted keyword. When the second information is stored in the extraction source database, the transmission unit transmits the extracted second information to a person who requests the information.

実施形態における、情報抽出システムの構成の第1例を示す図。The figure which shows the 1st example of a structure of the information extraction system in embodiment. 実施形態における、抽出元情報の例を示す図。The figure which shows the example of the extraction source information in embodiment. 実施形態における、不利益情報の例を示す図。The figure which shows the example of the disadvantageous information in embodiment. 実施形態における、不利益情報の具体例を示す図。The figure which shows the specific example of the disadvantageous information in embodiment. 実施形態における、不利益情報に対応付けられた注意事項の第1例を示す図。The figure which shows the 1st example of the precautions matched with the disadvantageous information in embodiment. 実施形態における、不利益情報に対応付けられた注意事項の第2例を示す図。The figure which shows the 2nd example of the notes matched with the disadvantageous information in embodiment. 実施形態における、情報抽出装置の動作の例を示すフローチャート。The flowchart which shows the example of operation | movement of the information extraction apparatus in embodiment. 実施形態における、情報抽出システムの構成の第2例を示す図。The figure which shows the 2nd example of a structure of the information extraction system in embodiment. 実施形態における、情報抽出システムの構成の第3例を示す図。The figure which shows the 3rd example of a structure of the information extraction system in embodiment.

以下、実施形態の情報抽出装置、情報抽出方法及び情報抽出プログラムを、図面を参照して説明する。
図1は、情報抽出装置を備える情報抽出システム10の構成の第1例を示す図である。情報抽出システム10aは、サーバ装置等の情報処理装置を備えるシステムである。情報抽出システム10aは、インタフェース100と、情報取得部200と、抽出元データベース300と、情報抽出装置400aとを備える。
Hereinafter, an information extraction device, an information extraction method, and an information extraction program according to embodiments will be described with reference to the drawings.
FIG. 1 is a diagram illustrating a first example of a configuration of an information extraction system 10 including an information extraction device. The information extraction system 10a is a system including an information processing device such as a server device. The information extraction system 10a includes an interface 100, an information acquisition unit 200, an extraction source database 300, and an information extraction device 400a.

インタフェース100は、パーソナルコンピュータ装置やタブレット端末等の情報処理装置である。インタフェース100は、操作部と演算部と表示部とを備える。操作部は、例えば、キーボード、タッチパネルやマウスである。演算部は、CPU(Central Processing Unit)等のプロセッサである。表示部は、液晶ディスプレイ等の表示画面である。   The interface 100 is an information processing device such as a personal computer device or a tablet terminal. The interface 100 includes an operation unit, a calculation unit, and a display unit. The operation unit is, for example, a keyboard, a touch panel, or a mouse. The arithmetic unit is a processor such as a CPU (Central Processing Unit). The display unit is a display screen such as a liquid crystal display.

情報取得部200は、サーバ装置等の情報処理装置である。情報取得部200は、インタフェース100から取得した抽出元情報を、抽出元データベース300に記憶させる。   The information acquisition unit 200 is an information processing device such as a server device. The information acquisition unit 200 stores the extraction source information acquired from the interface 100 in the extraction source database 300.

抽出元データベース300は、記憶装置である。抽出元データベース300は、例えば、フラッシュメモリ、HDD(Hard Disk Drive)などの不揮発性の記憶媒体(非一時的な記録媒体)を有する。抽出元データベース300は、抽出元情報を記憶する。   The extraction source database 300 is a storage device. The extraction source database 300 includes, for example, a non-volatile storage medium (non-temporary recording medium) such as a flash memory or an HDD (Hard Disk Drive). The extraction source database 300 stores extraction source information.

情報抽出装置400aは、サーバ装置等の情報処理装置である。情報抽出装置400aは、抽出元データベース300に記憶されている抽出元情報から、情報を要求する者(以下、「情報要求者」という。)500にとって真に必要な内容を含む情報を抽出する。情報抽出装置400aは、抽出元情報から抽出された情報を、インタフェース100に送信する。   The information extraction device 400a is an information processing device such as a server device. The information extraction apparatus 400a extracts information including content that is truly necessary for a person who requests information (hereinafter referred to as “information requester”) 500 from the extraction source information stored in the extraction source database 300. The information extraction device 400a transmits information extracted from the extraction source information to the interface 100.

情報要求者500は、インタフェース100を介して、情報抽出装置400aにキーワードを予め指定する。情報要求者500は、例えば、A3浄水場の近くの住民である。キーワードは、例えば、「A3浄水場」、「草刈り」である。キーワードは、例えば、「スケジュール」でもよい。   The information requester 500 designates a keyword in advance in the information extraction device 400a via the interface 100. The information requester 500 is a resident near the A3 water purification plant, for example. The keywords are, for example, “A3 water purification plant” and “mowing”. The keyword may be “schedule”, for example.

以下、情報を要求する者にとって不利益な情報として予め定められた情報を「不利益情報」という。不利益情報には、例えば、時間に関する情報(時間情報)と、環境に関する情報(環境情報)と、ライフラインに関する情報(ライフライン情報)とがある。   Hereinafter, information predetermined as disadvantageous information for a person who requests information is referred to as “unfavorable information”. The disadvantageous information includes, for example, information on time (time information), information on environment (environment information), and information on lifeline (lifeline information).

情報要求者500は、インタフェース100を介して、情報抽出装置400aにキーワードを指定する。情報要求者から情報を要求される者(以下、「情報被要求者」という。)600は、例えば、自治体に属する管理者である。情報抽出システム10aは、情報要求者500と情報被要求者600とをいずれも含まない。インタフェース100は、情報要求者500が指定したキーワードを、情報抽出装置400に送信する。   The information requester 500 designates a keyword to the information extraction device 400a via the interface 100. A person who requests information from an information requester (hereinafter referred to as “information requestee”) 600 is, for example, an administrator who belongs to a local government. The information extraction system 10a includes neither the information requester 500 nor the information requestee 600. The interface 100 transmits the keyword specified by the information requester 500 to the information extraction device 400.

インタフェース100は、情報抽出装置400によって抽出元情報から抽出された情報を、情報抽出装置400から取得する。抽出元情報は、情報が抽出される元の情報である。抽出元情報は、抽出元データベース300に記憶されている。抽出元情報の詳細については後述する。   The interface 100 acquires the information extracted from the extraction source information by the information extraction device 400 from the information extraction device 400. The extraction source information is information from which information is extracted. The extraction source information is stored in the extraction source database 300. Details of the extraction source information will be described later.

インタフェース100は、情報抽出装置400aによって抽出された情報を、情報要求者500に提供する。インタフェース100は、例えば、電子メールやファクシミリを利用して情報要求者に情報を提供する。電子メールのアドレスは、情報要求者に割り当てられたアドレスでもよいし、情報要求者が指定したアドレスでもよい。インタフェース100は、例えば、電話、郵送を利用して情報要求者に情報を提供してもよい。   The interface 100 provides the information requester 500 with the information extracted by the information extraction device 400a. The interface 100 provides information to the information requester using e-mail or facsimile, for example. The e-mail address may be an address assigned to the information requester or an address designated by the information requester. The interface 100 may provide information to the information requester using, for example, telephone or mail.

インタフェース100は、情報被要求者600から取得した抽出元情報を、情報取得部200に送信する。情報取得部200は、抽出元データベース300に抽出元情報を記憶させる。これによって、情報被要求者600は、インタフェース100及び情報取得部200を介して、抽出元情報を抽出元データベース300に記憶させることができる。   The interface 100 transmits the extraction source information acquired from the information requestee 600 to the information acquisition unit 200. The information acquisition unit 200 stores extraction source information in the extraction source database 300. As a result, the information requestee 600 can store the extraction source information in the extraction source database 300 via the interface 100 and the information acquisition unit 200.

図2は、抽出元情報の例を示す図である。図2に示す抽出元情報は、一例として、自治体であるA市の浄水場における草刈りのスケジュール情報である。浄水場には、例えば配水池が備えられている。抽出元情報は、不利益情報に類似する又は同一である情報とキーワードとを対応付けて含む。図2に示す抽出元情報では、作業内容と、場所と、実施日と、注意事項とが対応付けられている。図2では、一例として、作業内容「草刈り」と、場所「A3浄水場」と、実施日「2015年7月12日」と、注意事項とが対応付けられている。なお、抽出元情報は更新されてもよい。   FIG. 2 is a diagram illustrating an example of the extraction source information. The extraction source information illustrated in FIG. 2 is, for example, schedule information for mowing at a water purification plant in City A, which is a local government. In the water purification plant, for example, a distribution reservoir is provided. The extraction source information includes information similar to or identical to the disadvantage information and a keyword in association with each other. In the extraction source information illustrated in FIG. 2, the work content, the location, the execution date, and the notes are associated with each other. In FIG. 2, as an example, the work content “mowing”, the place “A3 water purification plant”, the implementation date “July 12, 2015”, and the notes are associated with each other. Note that the extraction source information may be updated.

図1において、情報抽出装置400aは、キーワード取得部401と、キーワードデータベース402と、変換部403と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、抽出結果データベース407と、送信部408とを備える。情報抽出装置400aは、抽出元データベース300を備えてもよい。   In FIG. 1, an information extraction device 400a includes a keyword acquisition unit 401, a keyword database 402, a conversion unit 403, a disadvantage information database 404, a first extraction unit 405, a second extraction unit 406, and an extraction result database. 407 and a transmission unit 408. The information extraction device 400a may include an extraction source database 300.

キーワード取得部401と、変換部403と、第1抽出部405と、第2抽出部406と、送信部408とのうち一部または全部は、例えば、CPU等のプロセッサが、記憶部に記憶されたプログラムを実行することにより機能するソフトウェア機能部である。   Some or all of the keyword acquisition unit 401, the conversion unit 403, the first extraction unit 405, the second extraction unit 406, and the transmission unit 408 are stored in the storage unit, for example, a processor such as a CPU. A software function unit that functions by executing a program.

情報抽出装置400aの各部の関連について説明する。
キーワード取得部401は、情報要求者500から指定されたキーワードを、インタフェース100から取得する。キーワードデータベース402は、キーワード取得部401から取得したキーワードを記憶する。変換部403は、キーワードデータベース402に記憶されているキーワードを、不利益情報に変換する。不利益情報データベース404は、キーワードと不利益情報とを対応付けて記憶する。
The relationship between each part of the information extraction device 400a will be described.
The keyword acquisition unit 401 acquires a keyword designated by the information requester 500 from the interface 100. The keyword database 402 stores the keywords acquired from the keyword acquisition unit 401. The conversion unit 403 converts the keyword stored in the keyword database 402 into disadvantageous information. The disadvantage information database 404 stores the keyword and the disadvantage information in association with each other.

第1抽出部405は、抽出元情報とキーワードとを照合することによって、抽出元情報からキーワードを抽出する。第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報(第1情報)と同一である第2情報を、抽出元情報から抽出する。第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報(第1情報)に類似する第2情報を、抽出元情報から抽出する。抽出結果データベース407は、第1抽出部405によって抽出されたキーワードを記憶する。抽出結果データベース407は、第2抽出部406によって抽出された第2情報を記憶する。送信部408は、抽出元データベース300に不利益情報が記憶された場合、第1抽出部405及び第2抽出部406によって抽出元情報から抽出された情報を、インタフェース100に送信する。   The 1st extraction part 405 extracts a keyword from extraction source information by collating extraction source information and a keyword. The second extraction unit 406 extracts second information that is identical to the disadvantageous information (first information) associated with the extracted keyword from the extraction source information. The second extraction unit 406 extracts second information similar to the disadvantage information (first information) associated with the extracted keyword from the extraction source information. The extraction result database 407 stores the keywords extracted by the first extraction unit 405. The extraction result database 407 stores the second information extracted by the second extraction unit 406. When the disadvantage information is stored in the extraction source database 300, the transmission unit 408 transmits the information extracted from the extraction source information by the first extraction unit 405 and the second extraction unit 406 to the interface 100.

情報抽出装置400aの各部の詳細について説明する。
キーワード取得部401は、情報要求者500から指定されたキーワードを、インタフェース100から取得する。キーワード取得部401は、キーワードデータベース402にキーワードを記憶させる。キーワード取得部401は、情報要求者500に割り当てられた識別情報に対応付けて、キーワードを記憶させてもよい。識別情報は、例えば、情報要求者500の情報処理装置のIP(Internet Protocol)アドレスである。
Details of each unit of the information extraction device 400a will be described.
The keyword acquisition unit 401 acquires a keyword designated by the information requester 500 from the interface 100. The keyword acquisition unit 401 stores keywords in the keyword database 402. The keyword acquisition unit 401 may store the keyword in association with the identification information assigned to the information requester 500. The identification information is, for example, the IP (Internet Protocol) address of the information processing apparatus of the information requester 500.

キーワードデータベース402は、キーワード取得部401から取得したキーワードを記憶する。キーワードデータベース402は、キーワード取得部401から取得したキーワードを、変換部403に送信する。なお、キーワードデータベース402と不利益情報データベース404とは一体でもよい。   The keyword database 402 stores the keywords acquired from the keyword acquisition unit 401. The keyword database 402 transmits the keyword acquired from the keyword acquisition unit 401 to the conversion unit 403. The keyword database 402 and the disadvantage information database 404 may be integrated.

変換部403は、キーワードデータベース402に記憶されているキーワードを、不利益情報に変換する。例えば、変換部403は、キーワード「草刈り」を不利益情報(時間情報)「期日」に変換する。例えば、不利益情報に示された期日に実施される草刈りによって騒音が発生する可能性があるので、期日を表す情報は、情報要求者500にとって不利益な情報である。   The conversion unit 403 converts the keyword stored in the keyword database 402 into disadvantageous information. For example, the conversion unit 403 converts the keyword “mowing” into disadvantageous information (time information) “date”. For example, since there is a possibility that noise is generated by mowing performed on the date indicated in the disadvantageous information, the information indicating the date is information that is disadvantageous for the information requester 500.

不利益情報データベース404は、キーワードと不利益情報とを、変換部403から取得する。不利益情報データベース404は、キーワードと不利益情報とを対応付けて記憶する。不利益情報データベース404は、不利益情報と具体例とを対応付けて記憶してもよい。不利益情報データベース404は、不利益情報と注意事項とを対応付けて記憶してもよい。   The disadvantage information database 404 acquires keywords and disadvantage information from the conversion unit 403. The disadvantage information database 404 stores the keyword and the disadvantage information in association with each other. The disadvantage information database 404 may store the disadvantage information and specific examples in association with each other. The disadvantage information database 404 may store the disadvantage information and the notes in association with each other.

図3は、不利益情報の例を示す図である。図3に示す不利益情報では、キーワードと、不利益情報(時間情報)と、不利益情報(環境情報)と、不利益情報(ライフライン情報)とが対応付けられている。図3では、一例として、キーワード「草刈り、除草」と、不利益情報(時間情報)「期日、実施日、日にち、いつ」と、不利益情報(環境情報)「騒音、振動、うるさい、揺れる」と、不利益情報(ライフライン情報)「道路、道、車道、歩道、国道、号線、鉄道、電車、B鉄道会社」とが対応付けられている。なお、変換部403は、不利益情報を更新してもよい。変換部403は、不利益情報に含まれている文字列の同義語及び類義語を、不利益情報に更に含めてもよい。   FIG. 3 is a diagram illustrating an example of the disadvantage information. In the disadvantage information shown in FIG. 3, keywords, disadvantage information (time information), disadvantage information (environment information), and disadvantage information (lifeline information) are associated with each other. In FIG. 3, as an example, the keywords “mowing and weeding”, disadvantageous information (time information) “date, implementation date, date, when” and disadvantageous information (environmental information) “noise, vibration, noisy, shaking” And disadvantageous information (lifeline information) “road, road, roadway, sidewalk, national road, route, railway, train, B railway company” are associated with each other. Note that the conversion unit 403 may update the disadvantage information. The conversion unit 403 may further include synonyms and synonyms of character strings included in the disadvantage information in the disadvantage information.

図4は、不利益情報の具体例を示す図である。図4では、不利益情報(時間情報)の具体例である実施日「2015年7月12日」が、キーワード「草刈り」及び「除草」に対応付けられている。   FIG. 4 is a diagram illustrating a specific example of the disadvantageous information. In FIG. 4, the implementation date “July 12, 2015”, which is a specific example of the disadvantageous information (time information), is associated with the keywords “mowing” and “weeding”.

図5は、不利益情報に対応付けられた注意事項の第1例を示す図である。図5では、不利益情報(環境情報)に対応付けられた注意事項の具体例として、文字列「草刈り中に騒音が発生する場合があります。配水池の近隣を通行する際にはご注意ください。天候等の状況により、実施日が延期される場合がありますので、ご了承ください。延期された場合、情報を再度提示します。」が対応付けられている。送信部408を介して注意事項を通知された情報要求者500は、草刈りの実施日が延期されることに注意することができる。   FIG. 5 is a diagram illustrating a first example of precautions associated with the disadvantage information. In Fig. 5, as a specific example of precautions associated with the disadvantageous information (environmental information), the character string "Noise may be generated during mowing. Please be careful when passing near the reservoir. Please note that the implementation date may be postponed depending on the weather, etc. If this is postponed, the information will be presented again. " The information requester 500 notified of the precautions via the transmission unit 408 can note that the mowing date is postponed.

図6は、不利益情報に対応付けられた注意事項の第2例を示す図である。図6では、不利益情報(ライフライン情報)に対応付けられた注意事項の具体例として、文字列「草刈り中に国道の一部を使用します。」が対応付けられている。注意事項を通知された情報要求者500は、国道の一部が使用されることに注意することができる。   FIG. 6 is a diagram illustrating a second example of precautions associated with the disadvantage information. In FIG. 6, as a specific example of precautions associated with the disadvantage information (lifeline information), the character string “A part of the national road is used during mowing” is associated. The information requester 500 notified of the precautions can note that a part of the national road is used.

なお、不利益情報は、更に細分化されてもよい。例えば、不利益情報「水道」は、水道に関する不利益情報と、下水道に関する不利益情報とに細分化されてもよい。   The disadvantage information may be further subdivided. For example, the disadvantage information “waterworks” may be subdivided into disadvantageous information about waterworks and disadvantageous information about sewers.

第1抽出部405は、抽出元データベース300が新たな抽出元情報を記憶した場合、抽出元情報を抽出元データベース300から取得する。第1抽出部405は、抽出元データベース300に記憶されている抽出元情報を更新された場合、抽出元情報を抽出元データベース300から取得してもよい。   When the extraction source database 300 stores new extraction source information, the first extraction unit 405 acquires the extraction source information from the extraction source database 300. When the extraction source information stored in the extraction source database 300 is updated, the first extraction unit 405 may acquire the extraction source information from the extraction source database 300.

図1において、第1抽出部405は、キーワードデータベース402からキーワードを取得する。第1抽出部405は、抽出元情報とキーワードとを照合することによって、抽出元情報からキーワードを抽出する。図2に示す例では、第1抽出部405は、キーワードデータベース402から取得したキーワード「A3浄水場」及び「草刈り」を、抽出元情報から抽出する。第1抽出部405は、抽出されたキーワードを抽出結果データベース407に記憶させる。   In FIG. 1, the first extraction unit 405 acquires a keyword from the keyword database 402. The 1st extraction part 405 extracts a keyword from extraction source information by collating extraction source information and a keyword. In the example illustrated in FIG. 2, the first extraction unit 405 extracts the keywords “A3 water purification plant” and “mowing” acquired from the keyword database 402 from the extraction source information. The first extraction unit 405 stores the extracted keyword in the extraction result database 407.

第1抽出部405は、抽出元情報を第2抽出部406に送信する。第1抽出部405は、抽出されたキーワードに対応付けられた他の情報(以下、「第2情報」という。)を、第2抽出部406に送信してもよい。図2に示す例では、第1抽出部405は、キーワード「A3浄水場」及び「草刈り」に対応付けられた他の情報として、実施日「2015年7月12日」と注意事項等とを、第2抽出部406に送信してもよい。   The first extraction unit 405 transmits the extraction source information to the second extraction unit 406. The first extraction unit 405 may transmit other information associated with the extracted keyword (hereinafter referred to as “second information”) to the second extraction unit 406. In the example illustrated in FIG. 2, the first extraction unit 405 includes an implementation date “July 12, 2015” and notes as other information associated with the keywords “A3 water purification plant” and “mowing”. , It may be transmitted to the second extraction unit 406.

第2抽出部406は、不利益情報データベース404から不利益情報(第1情報)を取得する。第2抽出部406は、情報要求者500に割り当てられた識別情報ごとに、不利益情報を取得してもよい。第2抽出部406は、第1抽出部405から抽出元情報を取得する。図2に示されているように、抽出元情報は、抽出されたキーワードと第2情報とを含んでいる。   The second extraction unit 406 acquires disadvantageous information (first information) from the disadvantageous information database 404. The second extraction unit 406 may acquire the disadvantage information for each identification information assigned to the information requester 500. The second extraction unit 406 acquires extraction source information from the first extraction unit 405. As shown in FIG. 2, the extraction source information includes the extracted keyword and the second information.

第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報(第1情報)と同一又は類似である第2情報を、抽出元情報から抽出する。第2抽出部406は、抽出された第2情報を、抽出結果データベース407に記憶させる。   The second extraction unit 406 extracts second information that is the same as or similar to the disadvantageous information (first information) associated with the extracted keyword from the extraction source information. The second extraction unit 406 stores the extracted second information in the extraction result database 407.

図2、3及び4に示す例では、第2抽出部406は、抽出されたキーワード「草刈り」に対応付けられた不利益情報「実施日」と同一である第2情報「実施日」を、抽出元情報から抽出する。すなわち、第2抽出部406は、抽出されたキーワードに対応付けられた実施日「2015年7月12日」を、抽出元情報から抽出する。なお、第2抽出部406は、不利益情報「実施日」に類似する情報が抽出元情報に含まれている場合、抽出されたキーワードに対応付けられた不利益情報「実施日」に類似する第2情報「期日」を、抽出元情報から抽出してもよい。   In the example shown in FIGS. 2, 3, and 4, the second extraction unit 406 displays the second information “implementation date” that is the same as the disadvantage information “implementation date” associated with the extracted keyword “mowing”. Extract from source information. That is, the second extraction unit 406 extracts the implementation date “July 12, 2015” associated with the extracted keyword from the extraction source information. The second extraction unit 406 resembles the disadvantage information “implementation date” associated with the extracted keyword when information similar to the disadvantage information “implementation date” is included in the extraction source information. The second information “date” may be extracted from the extraction source information.

図2及び5に示す例では、第2抽出部406は、抽出されたキーワード「草刈り」に対応付けられた注意事項を、第2情報として抽出元情報から抽出してもよい。すなわち、第2抽出部406は、抽出されたキーワードに対応付けられた注意事項「草刈り中に騒音が発生する場合があります。配水池の近隣を通行する際にはご注意ください。天候等の状況により、実施日が延期される場合がありますので、ご了承ください。延期された場合、情報を再度提示します。」を、第2情報として抽出元情報から抽出してもよい。   In the example illustrated in FIGS. 2 and 5, the second extraction unit 406 may extract the notes associated with the extracted keyword “mowing” from the extraction source information as the second information. In other words, the second extraction unit 406 has a precaution associated with the extracted keyword “Noise may be generated during mowing. Be careful when passing near the reservoir. Please note that the implementation date may be postponed. If postponed, information will be presented again. "May be extracted from the source information as the second information.

抽出結果データベース407は、第1抽出部405によって抽出されたキーワードを記憶する。図2に示す例では、抽出結果データベース407は、キーワード「草刈り」及び「A3浄水場」を記憶する。   The extraction result database 407 stores the keywords extracted by the first extraction unit 405. In the example illustrated in FIG. 2, the extraction result database 407 stores the keywords “mowing” and “A3 water purification plant”.

抽出結果データベース407は、第2抽出部406によって抽出された第2情報を記憶する。図2及び4に示す例では、抽出結果データベース407は、実施日「2015年7月12日」を記憶する。図2及び5に示す例では、抽出結果データベース407は、注意事項「草刈り中に騒音が発生する場合があります。配水池の近隣を通行する際にはご注意ください。天候等の状況により、実施日が延期される場合がありますので、ご了承ください。延期された場合、情報を再度提示します。」を記憶する。   The extraction result database 407 stores the second information extracted by the second extraction unit 406. In the example illustrated in FIGS. 2 and 4, the extraction result database 407 stores the implementation date “July 12, 2015”. In the examples shown in Figs. 2 and 5, the extraction result database 407 shows the precautions "Noise may be generated during mowing. Be careful when passing in the vicinity of the reservoir. May be postponed. If this is postponed, the information will be presented again. "

送信部408は、第1抽出部405及び第2抽出部406によって抽出元情報から抽出された情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。すなわち、送信部408は、抽出結果データベース407に記憶されている情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。   The transmission unit 408 transmits the information extracted from the extraction source information by the first extraction unit 405 and the second extraction unit 406 to the interface 100 for each identification information assigned to the information requester 500. That is, the transmission unit 408 transmits the information stored in the extraction result database 407 to the interface 100 for each piece of identification information assigned to the information requester 500.

これによって、第1の実施形態の送信部408は、期日等の不利益情報が変更になる可能性を表す注意事項を情報要求者500に通知することによって、情報要求者500に注意を促すことができる。   Accordingly, the transmission unit 408 according to the first embodiment alerts the information requester 500 by notifying the information requester 500 of a notice indicating a possibility that the disadvantageous information such as the due date may be changed. Can do.

次に、情報抽出装置400aの動作の例を説明する。
図7は、情報抽出装置400aの動作の例を示すフローチャートである。キーワード取得部401は、情報要求者500から指定されたキーワードを取得する(ステップS101)。変換部403は、不利益情報をキーワードに対応付けて、不利益情報データベース404に記憶させる(ステップS102)。第1抽出部405は、キーワード及び第2情報を対応付けて含む抽出元情報から、キーワードを抽出する(ステップS103)。第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報と同一又は類似である第2情報を、抽出元情報から抽出する(ステップS104)。送信部408は、抽出されたキーワード及び第2情報を、情報要求者500の情報端末に送信する(ステップS105)。
Next, an example of the operation of the information extraction device 400a will be described.
FIG. 7 is a flowchart illustrating an example of the operation of the information extraction apparatus 400a. The keyword acquisition unit 401 acquires a keyword designated by the information requester 500 (step S101). The conversion unit 403 stores the disadvantage information in the disadvantage information database 404 in association with the keyword (step S102). The first extraction unit 405 extracts a keyword from extraction source information that includes the keyword and second information in association with each other (step S103). The second extracting unit 406 extracts second information that is the same as or similar to the disadvantageous information associated with the extracted keyword from the extraction source information (step S104). The transmission unit 408 transmits the extracted keyword and second information to the information terminal of the information requester 500 (step S105).

以上のように、第1の実施形態の情報抽出装置400a(情報マッチング装置)は、キーワード取得部401と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、送信部408と、抽出元データベース300とを持つ。キーワード取得部401は、情報要求者500から指定されたキーワードを取得する。不利益情報データベース404は、不利益情報(第1情報)をキーワードに対応付けて記憶する。抽出元データベース300は、不利益情報に類似する又は同一である第2情報とキーワードとを対応付けて含む抽出元情報を記憶する。第1抽出部405は、抽出元情報からキーワードを抽出する。第2抽出部406は、抽出されたキーワードに応じて第2情報(マッチング情報)を抽出元情報から抽出する。送信部408は、第2情報が抽出元データベース300に記憶された場合、抽出された第2情報を、インタフェース100を介して情報要求者500に対して送信する。   As described above, the information extraction apparatus 400a (information matching apparatus) of the first embodiment includes the keyword acquisition unit 401, the disadvantage information database 404, the first extraction unit 405, the second extraction unit 406, and the transmission. A section 408 and an extraction source database 300. The keyword acquisition unit 401 acquires a keyword specified by the information requester 500. The disadvantage information database 404 stores the disadvantage information (first information) in association with the keywords. The extraction source database 300 stores extraction source information that includes second information similar to or identical to the disadvantageous information and a keyword in association with each other. The first extraction unit 405 extracts keywords from the extraction source information. The second extraction unit 406 extracts second information (matching information) from the extraction source information according to the extracted keyword. When the second information is stored in the extraction source database 300, the transmission unit 408 transmits the extracted second information to the information requester 500 via the interface 100.

これによって、第1の実施形態の情報抽出装置400aは、住民にとって真に必要な内容を含む情報を、元情報から抽出することができる。   As a result, the information extraction apparatus 400a of the first embodiment can extract information including content that is truly necessary for the residents from the original information.

第1の実施形態の情報抽出装置400aは、情報要求者500に対して不利益情報を迅速に通知することができる。第1の実施形態の情報抽出装置400aは、所定期間内に、情報要求者500に対して不利益情報を通知することができる。   The information extraction apparatus 400a of the first embodiment can quickly notify the information requester 500 of the disadvantageous information. The information extraction device 400a of the first embodiment can notify the information requester 500 of disadvantageous information within a predetermined period.

第1の実施形態の情報抽出装置400aは、情報要求者500に分かりやすく不利益情報を明示することができる。不利益情報は、例えば、申込日限、面談日、転職先の特殊な業務内容、転職先の組織体系、公共サービスに係る意見申立て期間又は住民サービスに係る意見申立て期間である。不利益情報は、赤い色などの色文字で強調表示されてもよい。不利益情報は、相対的に大きな文字で強調表示されてもよい。不利益情報は、他の情報の表示とは異なる書体が使用されることによって強調表示されてもよい。不利益情報は、文字列に下線が引かれることによって強調表示されてもよい。   The information extraction device 400a of the first embodiment can clearly indicate the disadvantageous information to the information requester 500. The disadvantageous information is, for example, the application deadline, the interview date, the special work content of the job change destination, the organizational structure of the job change destination, the comment period concerning public services, or the comment period concerning residents' services. The disadvantage information may be highlighted with a color character such as a red color. The disadvantage information may be highlighted with relatively large characters. The disadvantageous information may be highlighted by using a typeface different from the display of other information. The disadvantage information may be highlighted by underlining the character string.

第1の実施形態の情報要求者500は、期限を徒過することなく、抽出された情報を有効に活用することができる。例えば、第1の実施形態の情報要求者500は、A3浄水場における草刈りが実施される場合、A3浄水場における他の草刈りの実施を中止又は延期させることについて、自治体に意見を申立てることができる。例えば、第1の実施形態の情報要求者500は、住居の近くで実施される大規模工事に対して、自治体に意見を申立てることができる。   The information requester 500 according to the first embodiment can effectively use the extracted information without passing the deadline. For example, the information requester 500 of the first embodiment may file an opinion with the local government about canceling or postponing other mowing at the A3 water treatment plant when mowing at the A3 water purification plant is performed. it can. For example, the information requester 500 of the first embodiment can appeal to the local government for a large-scale construction performed near a residence.

第1の実施形態の第2抽出部406は、第1抽出部405によって抽出された情報から情報を更に抽出する。すなわち、第1の実施形態の第2抽出部406は、第1抽出部405によって絞られた情報を更に絞り込むので、情報を効率よく抽出することができる。なお、第1の実施形態の第2抽出部406は、第1抽出部405が情報を抽出する処理を実行している場合に、情報を抽出する処理を実行してもよい。これによって、第1の実施形態の第2抽出部406は、第1抽出部405が抽出できなかった情報を抽出することができる。   The second extraction unit 406 of the first embodiment further extracts information from the information extracted by the first extraction unit 405. That is, the second extraction unit 406 of the first embodiment further narrows down the information narrowed down by the first extraction unit 405, so that information can be extracted efficiently. Note that the second extraction unit 406 of the first embodiment may execute the process of extracting information when the first extraction unit 405 is executing the process of extracting information. Accordingly, the second extraction unit 406 of the first embodiment can extract information that the first extraction unit 405 could not extract.

第1の実施形態の送信部408は、電子メールを利用して情報要求者500に情報を送信するので、電話を利用して情報要求者500に情報を送信する場合と比較して、住民等である情報要求者500の負担を低減することができる。第1の実施形態の送信部408は、電子メールを利用して情報要求者500に情報を送信するので、電話を利用して情報要求者500に情報を送信する場合と比較して、自治体に属する管理者等である情報被要求者600の負担を低減することができる。   Since the transmission unit 408 according to the first embodiment transmits information to the information requester 500 using e-mail, compared to the case where information is transmitted to the information requester 500 using a telephone, a resident or the like Thus, the burden on the information requester 500 can be reduced. Since the transmission unit 408 of the first embodiment transmits information to the information requester 500 using e-mail, compared with the case of transmitting information to the information requester 500 using a telephone, It is possible to reduce the burden on the information requestee 600 who is a manager or the like to which the user belongs.

不利益情報は、キーワードの同義語又は類義語を含んでいてもよい。これによって、第1の実施形態の情報抽出装置400aは、情報要求者500がインタフェース100にキーワードを誤入力した場合でも、要求された情報と要求された情報に対応付けられた他の情報とを、抽出元情報から抽出することができる。   The disadvantage information may include synonyms or synonyms of keywords. Thereby, even when the information requester 500 erroneously inputs a keyword to the interface 100, the information extraction apparatus 400a of the first embodiment displays the requested information and other information associated with the requested information. , Can be extracted from the source information.

水道に関する不利益情報と下水道に関する不利益情報とに不利益情報が細分化されている場合、情報被要求者600の管轄が水道課と下水道課と分離されていても、水道課の担当者と下水道課の担当者とは、水道に関する情報を効率的に管理することができる。   If the disadvantageous information is subdivided into the disadvantageous information about the water supply and the disadvantageous information about the sewer, even if the jurisdiction of the information requestee 600 is separated from the water supply section and the sewerage section, The person in charge of the sewerage section can efficiently manage information about waterworks.

(第2の実施形態)
第2の実施形態では、情報抽出装置400が第3抽出部409を更に備える点が、第1の実施形態と相違する。第2の実施形態では、第1の実施形態との相違点についてのみ説明する。
(Second Embodiment)
The second embodiment is different from the first embodiment in that the information extraction device 400 further includes a third extraction unit 409. In the second embodiment, only differences from the first embodiment will be described.

図8は、情報抽出システム10の構成の第2例を示す図である。情報抽出システム10bは、サーバ装置等の情報処理装置を備えるシステムである。情報抽出システム10bは、インタフェース100と、情報取得部200と、抽出元データベース300と、情報抽出装置400bとを備える。   FIG. 8 is a diagram illustrating a second example of the configuration of the information extraction system 10. The information extraction system 10b is a system including an information processing device such as a server device. The information extraction system 10b includes an interface 100, an information acquisition unit 200, an extraction source database 300, and an information extraction device 400b.

情報抽出装置400bは、キーワード取得部401と、キーワードデータベース402と、変換部403と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、抽出結果データベース407と、送信部408と、第3抽出部409とを備える。   The information extraction device 400b includes a keyword acquisition unit 401, a keyword database 402, a conversion unit 403, a disadvantage information database 404, a first extraction unit 405, a second extraction unit 406, an extraction result database 407, and a transmission Unit 408 and a third extraction unit 409.

情報被要求者600は、情報処理装置を介して、出典情報を含む抽出元情報をインタフェース100に送信する。出典情報は、抽出元情報の出典を表す情報である。例えば、出典情報は、不利益情報又は第2情報の出典を表す情報である。出典情報は、URL(Uniform Resource Locator)によって表現されてもよい。インタフェース100は、出典情報を含む抽出元情報を、情報取得部200に送信する。情報取得部200は、抽出元データベース300に抽出元情報を記憶させる。これによって、情報被要求者600は、インタフェース100及び情報取得部200を介して、出典情報を含む抽出元情報を抽出元データベース300に記憶させることができる。   The information requestee 600 transmits the extraction source information including the source information to the interface 100 via the information processing apparatus. The source information is information representing the source of the extraction source information. For example, the source information is information representing the source of disadvantageous information or second information. The source information may be expressed by a URL (Uniform Resource Locator). The interface 100 transmits the extraction source information including the source information to the information acquisition unit 200. The information acquisition unit 200 stores extraction source information in the extraction source database 300. As a result, the information requestee 600 can store the extraction source information including the source information in the extraction source database 300 via the interface 100 and the information acquisition unit 200.

第3抽出部409は、例えば、CPU等のプロセッサが、記憶部に記憶されたプログラムを実行することにより機能するソフトウェア機能部である。第3抽出部409は、LSIやASIC等のハードウェア機能部であってもよい。第3抽出部409は、抽出元情報から出典情報を抽出する。第3抽出部409は、第1抽出部405によって抽出されたキーワードに対応付けられた出典情報を抽出してもよい。第3抽出部409は、抽出された出典情報を抽出結果データベース407に記憶させる。   The third extraction unit 409 is a software function unit that functions when a processor such as a CPU executes a program stored in the storage unit, for example. The third extraction unit 409 may be a hardware function unit such as an LSI or an ASIC. The third extraction unit 409 extracts source information from the extraction source information. The third extraction unit 409 may extract source information associated with the keyword extracted by the first extraction unit 405. The third extraction unit 409 stores the extracted source information in the extraction result database 407.

送信部408は、第3抽出部409によって抽出元情報から抽出された出典情報等を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。すなわち、送信部408は、抽出結果データベース407に記憶されている出典情報等を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。   The transmission unit 408 transmits the source information extracted from the extraction source information by the third extraction unit 409 to the interface 100 for each identification information assigned to the information requester 500. That is, the transmission unit 408 transmits the source information and the like stored in the extraction result database 407 to the interface 100 for each piece of identification information assigned to the information requester 500.

以上のように、第2の実施形態の第3抽出部409は、出典情報を抽出元情報が更に含む場合、出典情報を抽出元情報から抽出する。これによって、第2の実施形態の情報抽出装置400bは、URLなどの出典情報を、情報要求者500に提示することができる。情報要求者500は、不利益情報に関する詳細な情報を、出典情報に基づいて検索することができる。   As described above, the third extraction unit 409 according to the second embodiment extracts source information from the extraction source information when the extraction source information further includes the source information. As a result, the information extraction apparatus 400b of the second embodiment can present source information such as a URL to the information requester 500. The information requester 500 can search for detailed information regarding the disadvantageous information based on the source information.

(第3の実施形態)
第3の実施形態では、情報抽出装置400が削除部410を更に備える点が、第2の実施形態と相違する。第3の実施形態では、第2の実施形態との相違点についてのみ説明する。
(Third embodiment)
The third embodiment is different from the second embodiment in that the information extraction device 400 further includes a deletion unit 410. In the third embodiment, only differences from the second embodiment will be described.

図9は、情報抽出システム10の構成の第3例を示す図である。情報抽出システム10cは、サーバ装置等の情報処理装置を備えるシステムである。情報抽出システム10cは、インタフェース100と、情報取得部200と、抽出元データベース300と、情報抽出装置400cとを備える。   FIG. 9 is a diagram illustrating a third example of the configuration of the information extraction system 10. The information extraction system 10c is a system including an information processing device such as a server device. The information extraction system 10c includes an interface 100, an information acquisition unit 200, an extraction source database 300, and an information extraction device 400c.

情報抽出装置400cは、キーワード取得部401と、キーワードデータベース402と、変換部403と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、抽出結果データベース407と、送信部408と、第3抽出部409と、削除部410とを備える。   The information extraction device 400c includes a keyword acquisition unit 401, a keyword database 402, a conversion unit 403, a disadvantage information database 404, a first extraction unit 405, a second extraction unit 406, an extraction result database 407, and a transmission Unit 408, third extraction unit 409, and deletion unit 410.

情報被要求者600は、情報処理装置を介して、秘密情報(第3情報)を含む抽出元情報をインタフェース100に送信する。秘密情報は、情報要求者500に送信されない情報として予め定められた情報である。例えば、秘密情報は、作業者責任者、作業担当者及び自治体担当者の個人情報である。個人情報は、例えば、氏名、住所、電話番号である。インタフェース100は、秘密情報を含む抽出元情報を、情報取得部200に送信する。情報取得部200は、抽出元データベース300に抽出元情報を記憶させる。これによって、情報被要求者600は、インタフェース100及び情報取得部200を介して、秘密情報を含む抽出元情報を抽出元データベース300に記憶させることができる。   The information requestee 600 transmits extraction source information including secret information (third information) to the interface 100 via the information processing apparatus. The secret information is information predetermined as information that is not transmitted to the information requester 500. For example, the secret information is personal information of the worker manager, the worker staff, and the local government staff. The personal information is, for example, a name, an address, and a telephone number. The interface 100 transmits extraction source information including secret information to the information acquisition unit 200. The information acquisition unit 200 stores extraction source information in the extraction source database 300. As a result, the information requestee 600 can store the extraction source information including the secret information in the extraction source database 300 via the interface 100 and the information acquisition unit 200.

削除部410(セキュリティ装置)は、例えば、CPU等のプロセッサが、記憶部に記憶されたプログラムを実行することにより機能するソフトウェア機能部である。削除部410は、LSIやASIC等のハードウェア機能部であってもよい。   The deletion unit 410 (security device) is a software function unit that functions when, for example, a processor such as a CPU executes a program stored in the storage unit. The deletion unit 410 may be a hardware function unit such as an LSI or an ASIC.

削除部410は、秘密情報を含む抽出元情報を、抽出結果データベース407から取得する。すなわち、削除部410は、抽出されたキーワード及び第2情報を、抽出結果データベース407から取得する。削除部410は、抽出されたキーワード及び第2情報から秘密情報を削除する。削除部410は、抽出されたキーワード及び第2情報から秘密情報が削除された残りの情報を、送信部408に送信する。   The deletion unit 410 acquires extraction source information including secret information from the extraction result database 407. That is, the deletion unit 410 acquires the extracted keyword and second information from the extraction result database 407. The deletion unit 410 deletes secret information from the extracted keyword and second information. The deletion unit 410 transmits the remaining information from which the secret information is deleted from the extracted keyword and the second information to the transmission unit 408.

送信部408は、抽出されたキーワード及び第2情報から秘密情報が削除された残りの情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。例えば、送信部408は、抽出されたキーワード及び第2情報から個人情報が削除された残りの情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。   The transmission unit 408 transmits the extracted keyword and the remaining information from which the secret information is deleted from the second information to the interface 100 for each identification information assigned to the information requester 500. For example, the transmission unit 408 transmits the extracted keyword and the remaining information from which the personal information is deleted from the second information to the interface 100 for each identification information assigned to the information requester 500.

以上のように、第3の実施形態の送信部408は、抽出されたキーワードと第2情報とが秘密情報(第3情報)を含む場合、抽出されたキーワード及び第2情報から秘密情報が削除部410によって削除されて残った情報を送信する。   As described above, when the extracted keyword and second information include secret information (third information), the transmission unit 408 of the third embodiment deletes the secret information from the extracted keyword and second information. Information remaining after being deleted by the unit 410 is transmitted.

これによって、第3の実施形態の情報抽出装置400cは、個人情報等の秘密情報が不利益情報に含まれている場合でも情報要求者500に個人情報や秘密情報を提示することなく、秘密情報を適正に管理することができる。   As a result, the information extraction apparatus 400c of the third embodiment does not present the personal information or the confidential information to the information requester 500 even if the confidential information such as the personal information is included in the disadvantageous information. Can be managed properly.

以上述べた少なくともひとつの実施形態によれば、抽出されたキーワードに応じて第2情報を抽出元情報から抽出する第2抽出部を持つことにより、住民にとって真に必要な内容を含む情報を元情報から抽出することができる。   According to at least one embodiment described above, by including the second extraction unit that extracts the second information from the extraction source information in accordance with the extracted keyword, the information including the content that is truly necessary for the residents can be obtained. It can be extracted from the information.

以上、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。   As mentioned above, although some embodiment of this invention was described, these embodiment is shown as an example and is not intending limiting the range of invention. These embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are also included in the invention described in the claims and the equivalents thereof.

10a…情報抽出システム、10b…情報抽出システム、10c…情報抽出システム、100…インタフェース、200…情報取得部、300…抽出元データベース、400a…情報抽出装置、400b…情報抽出装置、400c…情報抽出装置、401…キーワード取得部、402…キーワードデータベース、403…変換部、404…不利益情報データベース、405…第1抽出部、406…第2抽出部、407…抽出結果データベース、408…送信部、409…第3抽出部、410…削除部、500…情報要求者、600…情報被要求者 DESCRIPTION OF SYMBOLS 10a ... Information extraction system, 10b ... Information extraction system, 10c ... Information extraction system, 100 ... Interface, 200 ... Information acquisition part, 300 ... Extraction source database, 400a ... Information extraction device, 400b ... Information extraction device, 400c ... Information extraction Device 401: Keyword acquisition unit 402 ... Keyword database 403 ... Conversion unit 404 ... Disadvantage information database 405 ... First extraction unit 406 ... Second extraction unit 407 ... Extraction result database 408 ... Transmission unit 409 ... third extraction unit, 410 ... deletion unit, 500 ... information requester, 600 ... information requestee

Claims (6)

キーワードを取得するキーワード取得部と、
情報を要求する者にとって不利益な情報として予め定められた第1情報を前記キーワードに対応付けて記憶する不利益情報データベースと、
前記第1情報に類似する又は同一である第2情報と前記キーワードとを対応付けて含む抽出元情報を記憶する抽出元データベースと、
前記抽出元情報から前記キーワードを抽出する第1抽出部と、
抽出された前記キーワードに応じて前記第2情報を前記抽出元情報から抽出する第2抽出部と、
前記第2情報が前記抽出元データベースに記憶された場合、抽出された前記第2情報を、前記情報を要求する者に対して送信する送信部と、
を備える情報抽出装置。
A keyword acquisition unit for acquiring keywords;
A disadvantage information database that stores first information predetermined as disadvantageous information for a person who requests information in association with the keyword;
An extraction source database that stores extraction source information that includes the second information similar to or identical to the first information and the keyword;
A first extraction unit for extracting the keyword from the extraction source information;
A second extraction unit for extracting the second information from the extraction source information according to the extracted keyword;
A transmitter that transmits the extracted second information to a person who requests the information, when the second information is stored in the extraction source database;
An information extraction device comprising:
前記第1情報又は前記第2情報の出典を表す情報である出典情報を前記抽出元情報が更に含む場合、前記抽出元情報から前記出典情報を抽出する第3抽出部
を更に備える、請求項1に記載の情報抽出装置。
The third extraction unit that extracts the source information from the source information when the source information further includes source information that is information representing the source of the first information or the second information. The information extraction device described in 1.
前記送信部は、前記抽出されたキーワードを更に送信する、請求項1に記載の情報抽出装置。   The information extraction device according to claim 1, wherein the transmission unit further transmits the extracted keyword. 前記送信部は、前記抽出されたキーワードと前記第2情報とが秘密情報を含む場合、前記抽出されたキーワード及び前記第2情報から前記秘密情報が削除されて残った情報を送信する、請求項1に記載の情報抽出装置。   The transmission unit, when the extracted keyword and the second information include secret information, transmits information remaining after the secret information is deleted from the extracted keyword and the second information. 1. The information extraction device according to 1. 情報抽出装置における情報抽出方法であって、
キーワードを取得するステップと、
情報を要求する者にとって不利益な情報として予め定められた第1情報を前記キーワードに対応付けて不利益情報データベースに記憶させるステップと、
前記第1情報に類似する又は同一である第2情報と前記キーワードとを対応付けて含む抽出元情報を記憶するステップと、
前記抽出元情報から前記キーワードを抽出するステップと、
抽出された前記キーワードに応じて前記第2情報を前記抽出元情報から抽出するステップと、
前記第2情報が前記抽出元データベースに記憶された場合、抽出された前記第2情報を、前記情報を要求する者に対して送信するステップと、
を含む情報抽出方法。
An information extraction method in an information extraction device,
Obtaining a keyword;
Storing in a disadvantage information database first information predetermined as information disadvantageous for a person who requests information in association with the keyword;
Storing extraction source information including the second information similar to or identical to the first information and the keyword;
Extracting the keyword from the source information;
Extracting the second information from the source information according to the extracted keyword;
When the second information is stored in the source database, the extracted second information is transmitted to a person who requests the information;
Information extraction method.
コンピュータに、
キーワードを取得する手順と、
情報を要求する者にとって不利益な情報として予め定められた第1情報を前記キーワードに対応付けて不利益情報データベースに記憶させる手順と、
前記第1情報に類似する又は同一である第2情報と前記キーワードとを対応付けて含む抽出元情報を記憶する手順と、
前記抽出元情報から前記キーワードを抽出する手順と、
抽出された前記キーワードに応じて前記第2情報を前記抽出元情報から抽出する手順と、
前記第2情報が前記抽出元データベースに記憶された場合、抽出された前記第2情報を、前記情報を要求する者に対して送信する手順と、
を実行させるための情報抽出プログラム。
On the computer,
Steps to get keywords,
A procedure for storing first information predetermined as disadvantageous information for a person who requests information in a disadvantageous information database in association with the keyword;
Storing extraction source information that includes second information that is similar to or identical to the first information and the keyword;
A procedure for extracting the keyword from the extraction source information;
A procedure for extracting the second information from the extraction source information according to the extracted keyword;
A procedure for transmitting the extracted second information to a person who requests the information when the second information is stored in the source database;
Information extraction program to execute.
JP2015176620A 2015-09-08 2015-09-08 Information extraction device, information extraction method, and information extraction program Pending JP2017054232A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015176620A JP2017054232A (en) 2015-09-08 2015-09-08 Information extraction device, information extraction method, and information extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015176620A JP2017054232A (en) 2015-09-08 2015-09-08 Information extraction device, information extraction method, and information extraction program

Publications (1)

Publication Number Publication Date
JP2017054232A true JP2017054232A (en) 2017-03-16

Family

ID=58316681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015176620A Pending JP2017054232A (en) 2015-09-08 2015-09-08 Information extraction device, information extraction method, and information extraction program

Country Status (1)

Country Link
JP (1) JP2017054232A (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120190A (en) * 1997-10-15 1999-04-30 Hitachi Ltd Reservation retrieval method
JP2004030021A (en) * 2002-06-24 2004-01-29 Oki Electric Ind Co Ltd Document processor and processing method
WO2010106642A1 (en) * 2009-03-17 2010-09-23 富士通株式会社 Search processing method and apparatus
JP2012108638A (en) * 2010-11-16 2012-06-07 Hitachi Ltd Event/accident information sharing system
JP2015143925A (en) * 2014-01-31 2015-08-06 前田建設工業株式会社 Updating monitoring method, updating monitoring program, and updating device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120190A (en) * 1997-10-15 1999-04-30 Hitachi Ltd Reservation retrieval method
JP2004030021A (en) * 2002-06-24 2004-01-29 Oki Electric Ind Co Ltd Document processor and processing method
WO2010106642A1 (en) * 2009-03-17 2010-09-23 富士通株式会社 Search processing method and apparatus
JP2012108638A (en) * 2010-11-16 2012-06-07 Hitachi Ltd Event/accident information sharing system
JP2015143925A (en) * 2014-01-31 2015-08-06 前田建設工業株式会社 Updating monitoring method, updating monitoring program, and updating device

Similar Documents

Publication Publication Date Title
US20150186537A1 (en) Question distribution method and a question distribution system for a q&a platform
JP2005134990A (en) Ciphered database retrieval device and method, and ciphered database retrieval program
JP5533291B2 (en) Privacy protection device, privacy protection method and program
Tsou et al. Identifying data noises, user biases, and system errors in geo-tagged twitter messages (Tweets)
JP5231514B2 (en) Action support information providing apparatus, method, and program
JP2023059956A (en) Map maintenance device, guide device, control method, program, and storage medium
JP4835661B2 (en) User information management program, user information management device, and information management system
US9898463B2 (en) Document management server, document management method, and non-transitory storage medium storing program
JP2017054232A (en) Information extraction device, information extraction method, and information extraction program
WO2013146910A1 (en) Data search system and data search method
JP6413540B2 (en) Relay device, data processing system, and program
JP2012194676A (en) Information processing system, information generation device, information providing device, information generation method, information providing method, information generation program, and information providing program
WO2020048059A1 (en) Fund data association method and system, computer device and storage medium
Shaheer et al. Challenges and opportunities for sacred journeys: a media representation of the impact of COVID-19
JP6323109B2 (en) Document management system, key-value store apparatus, document management method, and program
JP2007249423A (en) Processing screen switching method in work processing system, work processing system, server therefor, and program
Hill et al. Operationalizing an open-source dashboard for communicating results of wastewater-based epidemiology
JP6528417B2 (en) Anonymity management program, anonymity management device, and electronic sticky note management device
Rabang Cultural mapping as a tool in heritage conservation in a world heritage site: The Vigan City experience
JP5932094B2 (en) Server apparatus, annotation system, method, and program
JP2007265014A (en) Human resource retrieval system
JP6219425B2 (en) Attribute information generation device, linkage system, and attribute information generation program
KR101263383B1 (en) System for delivering online coupon including the validity data
JP2005202501A (en) Asset management system, method therefor, program and asset management server device
JP2009093567A (en) Time information conversion program and time information conversion device

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20170912

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170912

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190219

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191001