JP2017054232A - Information extraction device, information extraction method, and information extraction program - Google Patents
Information extraction device, information extraction method, and information extraction program Download PDFInfo
- Publication number
- JP2017054232A JP2017054232A JP2015176620A JP2015176620A JP2017054232A JP 2017054232 A JP2017054232 A JP 2017054232A JP 2015176620 A JP2015176620 A JP 2015176620A JP 2015176620 A JP2015176620 A JP 2015176620A JP 2017054232 A JP2017054232 A JP 2017054232A
- Authority
- JP
- Japan
- Prior art keywords
- information
- extraction
- keyword
- source
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明の実施形態は、情報抽出装置、情報抽出方法及び情報抽出プログラムに関する。 Embodiments described herein relate generally to an information extraction apparatus, an information extraction method, and an information extraction program.
自治体による工事や草刈り等の作業によって、騒音が発生する場合がある。このため、住民は、住居の近くで実施される作業のスケジュール情報を自治体に要求する場合がある。このような要求に対し、自治体が管理するサーバ装置は、自治体のデータベースに記憶されている元情報からスケジュール情報を抽出して、抽出したスケジュール情報を住民に提供する。しかしながら、抽出したスケジュール情報に示された作業日が直前に迫っていたり、作業が既に開始していたりする等、従来の装置が抽出したスケジュール情報は、住民にとって真に必要な内容を含む情報でない場合があった。 Noise may be generated by local government work or mowing. For this reason, a resident may request the local government for schedule information of work performed near the residence. In response to such a request, the server device managed by the local government extracts schedule information from the original information stored in the local government database, and provides the extracted schedule information to the residents. However, the schedule information extracted by conventional devices, such as when the work date shown in the extracted schedule information is approaching immediately or the work has already started, is not information that contains the content that is really necessary for the residents. There was a case.
このような問題は、自治体による作業のスケジュール情報に限られた問題ではない。上述したサーバ装置のように元情報から情報を抽出する情報抽出装置に共通する問題である。すなわち、従来の情報抽出装置は、住民にとって真に必要な内容を含む情報を元情報から抽出することができない場合があった。 Such a problem is not limited to work schedule information by local governments. This is a problem common to information extraction apparatuses that extract information from original information, such as the server apparatus described above. In other words, the conventional information extraction apparatus may not be able to extract information including content that is truly necessary for the residents from the original information.
本発明が解決しようとする課題は、住民にとって真に必要な内容を含む情報を元情報から抽出することができる情報抽出装置、情報抽出方法及び情報抽出プログラムを提供することである。 The problem to be solved by the present invention is to provide an information extraction apparatus, an information extraction method, and an information extraction program that can extract information including content that is truly necessary for residents from original information.
実施形態の情報抽出装置は、キーワード取得部と、不利益情報データベースと、抽出元データベースと、第1抽出部と、第2抽出部と、送信部とを持つ。キーワード取得部は、キーワードを取得する。不利益情報データベースは、情報を要求する者にとって不利益な情報として予め定められた第1情報をキーワードに対応付けて記憶する。抽出元データベースは、第1情報に類似する又は同一である第2情報とキーワードとを対応付けて含む抽出元情報を記憶する。第1抽出部は、抽出元情報からキーワードを抽出する。第2抽出部は、抽出されたキーワードに応じて第2情報を抽出元情報から抽出する。送信部は、第2情報が抽出元データベースに記憶された場合、抽出された第2情報を、情報を要求する者に対して送信する。 The information extraction apparatus according to the embodiment includes a keyword acquisition unit, a disadvantage information database, an extraction source database, a first extraction unit, a second extraction unit, and a transmission unit. The keyword acquisition unit acquires a keyword. The disadvantage information database stores first information that is predetermined as information that is disadvantageous to a person who requests information in association with a keyword. The extraction source database stores extraction source information that includes second information similar to or identical to the first information and a keyword in association with each other. The first extraction unit extracts a keyword from the extraction source information. The second extraction unit extracts second information from the extraction source information according to the extracted keyword. When the second information is stored in the extraction source database, the transmission unit transmits the extracted second information to a person who requests the information.
以下、実施形態の情報抽出装置、情報抽出方法及び情報抽出プログラムを、図面を参照して説明する。
図1は、情報抽出装置を備える情報抽出システム10の構成の第1例を示す図である。情報抽出システム10aは、サーバ装置等の情報処理装置を備えるシステムである。情報抽出システム10aは、インタフェース100と、情報取得部200と、抽出元データベース300と、情報抽出装置400aとを備える。
Hereinafter, an information extraction device, an information extraction method, and an information extraction program according to embodiments will be described with reference to the drawings.
FIG. 1 is a diagram illustrating a first example of a configuration of an information extraction system 10 including an information extraction device. The
インタフェース100は、パーソナルコンピュータ装置やタブレット端末等の情報処理装置である。インタフェース100は、操作部と演算部と表示部とを備える。操作部は、例えば、キーボード、タッチパネルやマウスである。演算部は、CPU(Central Processing Unit)等のプロセッサである。表示部は、液晶ディスプレイ等の表示画面である。
The
情報取得部200は、サーバ装置等の情報処理装置である。情報取得部200は、インタフェース100から取得した抽出元情報を、抽出元データベース300に記憶させる。
The
抽出元データベース300は、記憶装置である。抽出元データベース300は、例えば、フラッシュメモリ、HDD(Hard Disk Drive)などの不揮発性の記憶媒体(非一時的な記録媒体)を有する。抽出元データベース300は、抽出元情報を記憶する。
The
情報抽出装置400aは、サーバ装置等の情報処理装置である。情報抽出装置400aは、抽出元データベース300に記憶されている抽出元情報から、情報を要求する者(以下、「情報要求者」という。)500にとって真に必要な内容を含む情報を抽出する。情報抽出装置400aは、抽出元情報から抽出された情報を、インタフェース100に送信する。
The
情報要求者500は、インタフェース100を介して、情報抽出装置400aにキーワードを予め指定する。情報要求者500は、例えば、A3浄水場の近くの住民である。キーワードは、例えば、「A3浄水場」、「草刈り」である。キーワードは、例えば、「スケジュール」でもよい。
The information requester 500 designates a keyword in advance in the
以下、情報を要求する者にとって不利益な情報として予め定められた情報を「不利益情報」という。不利益情報には、例えば、時間に関する情報(時間情報)と、環境に関する情報(環境情報)と、ライフラインに関する情報(ライフライン情報)とがある。 Hereinafter, information predetermined as disadvantageous information for a person who requests information is referred to as “unfavorable information”. The disadvantageous information includes, for example, information on time (time information), information on environment (environment information), and information on lifeline (lifeline information).
情報要求者500は、インタフェース100を介して、情報抽出装置400aにキーワードを指定する。情報要求者から情報を要求される者(以下、「情報被要求者」という。)600は、例えば、自治体に属する管理者である。情報抽出システム10aは、情報要求者500と情報被要求者600とをいずれも含まない。インタフェース100は、情報要求者500が指定したキーワードを、情報抽出装置400に送信する。
The information requester 500 designates a keyword to the
インタフェース100は、情報抽出装置400によって抽出元情報から抽出された情報を、情報抽出装置400から取得する。抽出元情報は、情報が抽出される元の情報である。抽出元情報は、抽出元データベース300に記憶されている。抽出元情報の詳細については後述する。
The
インタフェース100は、情報抽出装置400aによって抽出された情報を、情報要求者500に提供する。インタフェース100は、例えば、電子メールやファクシミリを利用して情報要求者に情報を提供する。電子メールのアドレスは、情報要求者に割り当てられたアドレスでもよいし、情報要求者が指定したアドレスでもよい。インタフェース100は、例えば、電話、郵送を利用して情報要求者に情報を提供してもよい。
The
インタフェース100は、情報被要求者600から取得した抽出元情報を、情報取得部200に送信する。情報取得部200は、抽出元データベース300に抽出元情報を記憶させる。これによって、情報被要求者600は、インタフェース100及び情報取得部200を介して、抽出元情報を抽出元データベース300に記憶させることができる。
The
図2は、抽出元情報の例を示す図である。図2に示す抽出元情報は、一例として、自治体であるA市の浄水場における草刈りのスケジュール情報である。浄水場には、例えば配水池が備えられている。抽出元情報は、不利益情報に類似する又は同一である情報とキーワードとを対応付けて含む。図2に示す抽出元情報では、作業内容と、場所と、実施日と、注意事項とが対応付けられている。図2では、一例として、作業内容「草刈り」と、場所「A3浄水場」と、実施日「2015年7月12日」と、注意事項とが対応付けられている。なお、抽出元情報は更新されてもよい。 FIG. 2 is a diagram illustrating an example of the extraction source information. The extraction source information illustrated in FIG. 2 is, for example, schedule information for mowing at a water purification plant in City A, which is a local government. In the water purification plant, for example, a distribution reservoir is provided. The extraction source information includes information similar to or identical to the disadvantage information and a keyword in association with each other. In the extraction source information illustrated in FIG. 2, the work content, the location, the execution date, and the notes are associated with each other. In FIG. 2, as an example, the work content “mowing”, the place “A3 water purification plant”, the implementation date “July 12, 2015”, and the notes are associated with each other. Note that the extraction source information may be updated.
図1において、情報抽出装置400aは、キーワード取得部401と、キーワードデータベース402と、変換部403と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、抽出結果データベース407と、送信部408とを備える。情報抽出装置400aは、抽出元データベース300を備えてもよい。
In FIG. 1, an
キーワード取得部401と、変換部403と、第1抽出部405と、第2抽出部406と、送信部408とのうち一部または全部は、例えば、CPU等のプロセッサが、記憶部に記憶されたプログラムを実行することにより機能するソフトウェア機能部である。
Some or all of the
情報抽出装置400aの各部の関連について説明する。
キーワード取得部401は、情報要求者500から指定されたキーワードを、インタフェース100から取得する。キーワードデータベース402は、キーワード取得部401から取得したキーワードを記憶する。変換部403は、キーワードデータベース402に記憶されているキーワードを、不利益情報に変換する。不利益情報データベース404は、キーワードと不利益情報とを対応付けて記憶する。
The relationship between each part of the
The
第1抽出部405は、抽出元情報とキーワードとを照合することによって、抽出元情報からキーワードを抽出する。第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報(第1情報)と同一である第2情報を、抽出元情報から抽出する。第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報(第1情報)に類似する第2情報を、抽出元情報から抽出する。抽出結果データベース407は、第1抽出部405によって抽出されたキーワードを記憶する。抽出結果データベース407は、第2抽出部406によって抽出された第2情報を記憶する。送信部408は、抽出元データベース300に不利益情報が記憶された場合、第1抽出部405及び第2抽出部406によって抽出元情報から抽出された情報を、インタフェース100に送信する。
The
情報抽出装置400aの各部の詳細について説明する。
キーワード取得部401は、情報要求者500から指定されたキーワードを、インタフェース100から取得する。キーワード取得部401は、キーワードデータベース402にキーワードを記憶させる。キーワード取得部401は、情報要求者500に割り当てられた識別情報に対応付けて、キーワードを記憶させてもよい。識別情報は、例えば、情報要求者500の情報処理装置のIP(Internet Protocol)アドレスである。
Details of each unit of the
The
キーワードデータベース402は、キーワード取得部401から取得したキーワードを記憶する。キーワードデータベース402は、キーワード取得部401から取得したキーワードを、変換部403に送信する。なお、キーワードデータベース402と不利益情報データベース404とは一体でもよい。
The
変換部403は、キーワードデータベース402に記憶されているキーワードを、不利益情報に変換する。例えば、変換部403は、キーワード「草刈り」を不利益情報(時間情報)「期日」に変換する。例えば、不利益情報に示された期日に実施される草刈りによって騒音が発生する可能性があるので、期日を表す情報は、情報要求者500にとって不利益な情報である。
The conversion unit 403 converts the keyword stored in the
不利益情報データベース404は、キーワードと不利益情報とを、変換部403から取得する。不利益情報データベース404は、キーワードと不利益情報とを対応付けて記憶する。不利益情報データベース404は、不利益情報と具体例とを対応付けて記憶してもよい。不利益情報データベース404は、不利益情報と注意事項とを対応付けて記憶してもよい。
The
図3は、不利益情報の例を示す図である。図3に示す不利益情報では、キーワードと、不利益情報(時間情報)と、不利益情報(環境情報)と、不利益情報(ライフライン情報)とが対応付けられている。図3では、一例として、キーワード「草刈り、除草」と、不利益情報(時間情報)「期日、実施日、日にち、いつ」と、不利益情報(環境情報)「騒音、振動、うるさい、揺れる」と、不利益情報(ライフライン情報)「道路、道、車道、歩道、国道、号線、鉄道、電車、B鉄道会社」とが対応付けられている。なお、変換部403は、不利益情報を更新してもよい。変換部403は、不利益情報に含まれている文字列の同義語及び類義語を、不利益情報に更に含めてもよい。 FIG. 3 is a diagram illustrating an example of the disadvantage information. In the disadvantage information shown in FIG. 3, keywords, disadvantage information (time information), disadvantage information (environment information), and disadvantage information (lifeline information) are associated with each other. In FIG. 3, as an example, the keywords “mowing and weeding”, disadvantageous information (time information) “date, implementation date, date, when” and disadvantageous information (environmental information) “noise, vibration, noisy, shaking” And disadvantageous information (lifeline information) “road, road, roadway, sidewalk, national road, route, railway, train, B railway company” are associated with each other. Note that the conversion unit 403 may update the disadvantage information. The conversion unit 403 may further include synonyms and synonyms of character strings included in the disadvantage information in the disadvantage information.
図4は、不利益情報の具体例を示す図である。図4では、不利益情報(時間情報)の具体例である実施日「2015年7月12日」が、キーワード「草刈り」及び「除草」に対応付けられている。 FIG. 4 is a diagram illustrating a specific example of the disadvantageous information. In FIG. 4, the implementation date “July 12, 2015”, which is a specific example of the disadvantageous information (time information), is associated with the keywords “mowing” and “weeding”.
図5は、不利益情報に対応付けられた注意事項の第1例を示す図である。図5では、不利益情報(環境情報)に対応付けられた注意事項の具体例として、文字列「草刈り中に騒音が発生する場合があります。配水池の近隣を通行する際にはご注意ください。天候等の状況により、実施日が延期される場合がありますので、ご了承ください。延期された場合、情報を再度提示します。」が対応付けられている。送信部408を介して注意事項を通知された情報要求者500は、草刈りの実施日が延期されることに注意することができる。
FIG. 5 is a diagram illustrating a first example of precautions associated with the disadvantage information. In Fig. 5, as a specific example of precautions associated with the disadvantageous information (environmental information), the character string "Noise may be generated during mowing. Please be careful when passing near the reservoir. Please note that the implementation date may be postponed depending on the weather, etc. If this is postponed, the information will be presented again. " The information requester 500 notified of the precautions via the
図6は、不利益情報に対応付けられた注意事項の第2例を示す図である。図6では、不利益情報(ライフライン情報)に対応付けられた注意事項の具体例として、文字列「草刈り中に国道の一部を使用します。」が対応付けられている。注意事項を通知された情報要求者500は、国道の一部が使用されることに注意することができる。 FIG. 6 is a diagram illustrating a second example of precautions associated with the disadvantage information. In FIG. 6, as a specific example of precautions associated with the disadvantage information (lifeline information), the character string “A part of the national road is used during mowing” is associated. The information requester 500 notified of the precautions can note that a part of the national road is used.
なお、不利益情報は、更に細分化されてもよい。例えば、不利益情報「水道」は、水道に関する不利益情報と、下水道に関する不利益情報とに細分化されてもよい。 The disadvantage information may be further subdivided. For example, the disadvantage information “waterworks” may be subdivided into disadvantageous information about waterworks and disadvantageous information about sewers.
第1抽出部405は、抽出元データベース300が新たな抽出元情報を記憶した場合、抽出元情報を抽出元データベース300から取得する。第1抽出部405は、抽出元データベース300に記憶されている抽出元情報を更新された場合、抽出元情報を抽出元データベース300から取得してもよい。
When the
図1において、第1抽出部405は、キーワードデータベース402からキーワードを取得する。第1抽出部405は、抽出元情報とキーワードとを照合することによって、抽出元情報からキーワードを抽出する。図2に示す例では、第1抽出部405は、キーワードデータベース402から取得したキーワード「A3浄水場」及び「草刈り」を、抽出元情報から抽出する。第1抽出部405は、抽出されたキーワードを抽出結果データベース407に記憶させる。
In FIG. 1, the
第1抽出部405は、抽出元情報を第2抽出部406に送信する。第1抽出部405は、抽出されたキーワードに対応付けられた他の情報(以下、「第2情報」という。)を、第2抽出部406に送信してもよい。図2に示す例では、第1抽出部405は、キーワード「A3浄水場」及び「草刈り」に対応付けられた他の情報として、実施日「2015年7月12日」と注意事項等とを、第2抽出部406に送信してもよい。
The
第2抽出部406は、不利益情報データベース404から不利益情報(第1情報)を取得する。第2抽出部406は、情報要求者500に割り当てられた識別情報ごとに、不利益情報を取得してもよい。第2抽出部406は、第1抽出部405から抽出元情報を取得する。図2に示されているように、抽出元情報は、抽出されたキーワードと第2情報とを含んでいる。
The
第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報(第1情報)と同一又は類似である第2情報を、抽出元情報から抽出する。第2抽出部406は、抽出された第2情報を、抽出結果データベース407に記憶させる。
The
図2、3及び4に示す例では、第2抽出部406は、抽出されたキーワード「草刈り」に対応付けられた不利益情報「実施日」と同一である第2情報「実施日」を、抽出元情報から抽出する。すなわち、第2抽出部406は、抽出されたキーワードに対応付けられた実施日「2015年7月12日」を、抽出元情報から抽出する。なお、第2抽出部406は、不利益情報「実施日」に類似する情報が抽出元情報に含まれている場合、抽出されたキーワードに対応付けられた不利益情報「実施日」に類似する第2情報「期日」を、抽出元情報から抽出してもよい。
In the example shown in FIGS. 2, 3, and 4, the
図2及び5に示す例では、第2抽出部406は、抽出されたキーワード「草刈り」に対応付けられた注意事項を、第2情報として抽出元情報から抽出してもよい。すなわち、第2抽出部406は、抽出されたキーワードに対応付けられた注意事項「草刈り中に騒音が発生する場合があります。配水池の近隣を通行する際にはご注意ください。天候等の状況により、実施日が延期される場合がありますので、ご了承ください。延期された場合、情報を再度提示します。」を、第2情報として抽出元情報から抽出してもよい。
In the example illustrated in FIGS. 2 and 5, the
抽出結果データベース407は、第1抽出部405によって抽出されたキーワードを記憶する。図2に示す例では、抽出結果データベース407は、キーワード「草刈り」及び「A3浄水場」を記憶する。
The
抽出結果データベース407は、第2抽出部406によって抽出された第2情報を記憶する。図2及び4に示す例では、抽出結果データベース407は、実施日「2015年7月12日」を記憶する。図2及び5に示す例では、抽出結果データベース407は、注意事項「草刈り中に騒音が発生する場合があります。配水池の近隣を通行する際にはご注意ください。天候等の状況により、実施日が延期される場合がありますので、ご了承ください。延期された場合、情報を再度提示します。」を記憶する。
The
送信部408は、第1抽出部405及び第2抽出部406によって抽出元情報から抽出された情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。すなわち、送信部408は、抽出結果データベース407に記憶されている情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。
The
これによって、第1の実施形態の送信部408は、期日等の不利益情報が変更になる可能性を表す注意事項を情報要求者500に通知することによって、情報要求者500に注意を促すことができる。
Accordingly, the
次に、情報抽出装置400aの動作の例を説明する。
図7は、情報抽出装置400aの動作の例を示すフローチャートである。キーワード取得部401は、情報要求者500から指定されたキーワードを取得する(ステップS101)。変換部403は、不利益情報をキーワードに対応付けて、不利益情報データベース404に記憶させる(ステップS102)。第1抽出部405は、キーワード及び第2情報を対応付けて含む抽出元情報から、キーワードを抽出する(ステップS103)。第2抽出部406は、抽出されたキーワードに対応付けられた不利益情報と同一又は類似である第2情報を、抽出元情報から抽出する(ステップS104)。送信部408は、抽出されたキーワード及び第2情報を、情報要求者500の情報端末に送信する(ステップS105)。
Next, an example of the operation of the
FIG. 7 is a flowchart illustrating an example of the operation of the
以上のように、第1の実施形態の情報抽出装置400a(情報マッチング装置)は、キーワード取得部401と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、送信部408と、抽出元データベース300とを持つ。キーワード取得部401は、情報要求者500から指定されたキーワードを取得する。不利益情報データベース404は、不利益情報(第1情報)をキーワードに対応付けて記憶する。抽出元データベース300は、不利益情報に類似する又は同一である第2情報とキーワードとを対応付けて含む抽出元情報を記憶する。第1抽出部405は、抽出元情報からキーワードを抽出する。第2抽出部406は、抽出されたキーワードに応じて第2情報(マッチング情報)を抽出元情報から抽出する。送信部408は、第2情報が抽出元データベース300に記憶された場合、抽出された第2情報を、インタフェース100を介して情報要求者500に対して送信する。
As described above, the
これによって、第1の実施形態の情報抽出装置400aは、住民にとって真に必要な内容を含む情報を、元情報から抽出することができる。
As a result, the
第1の実施形態の情報抽出装置400aは、情報要求者500に対して不利益情報を迅速に通知することができる。第1の実施形態の情報抽出装置400aは、所定期間内に、情報要求者500に対して不利益情報を通知することができる。
The
第1の実施形態の情報抽出装置400aは、情報要求者500に分かりやすく不利益情報を明示することができる。不利益情報は、例えば、申込日限、面談日、転職先の特殊な業務内容、転職先の組織体系、公共サービスに係る意見申立て期間又は住民サービスに係る意見申立て期間である。不利益情報は、赤い色などの色文字で強調表示されてもよい。不利益情報は、相対的に大きな文字で強調表示されてもよい。不利益情報は、他の情報の表示とは異なる書体が使用されることによって強調表示されてもよい。不利益情報は、文字列に下線が引かれることによって強調表示されてもよい。
The
第1の実施形態の情報要求者500は、期限を徒過することなく、抽出された情報を有効に活用することができる。例えば、第1の実施形態の情報要求者500は、A3浄水場における草刈りが実施される場合、A3浄水場における他の草刈りの実施を中止又は延期させることについて、自治体に意見を申立てることができる。例えば、第1の実施形態の情報要求者500は、住居の近くで実施される大規模工事に対して、自治体に意見を申立てることができる。 The information requester 500 according to the first embodiment can effectively use the extracted information without passing the deadline. For example, the information requester 500 of the first embodiment may file an opinion with the local government about canceling or postponing other mowing at the A3 water treatment plant when mowing at the A3 water purification plant is performed. it can. For example, the information requester 500 of the first embodiment can appeal to the local government for a large-scale construction performed near a residence.
第1の実施形態の第2抽出部406は、第1抽出部405によって抽出された情報から情報を更に抽出する。すなわち、第1の実施形態の第2抽出部406は、第1抽出部405によって絞られた情報を更に絞り込むので、情報を効率よく抽出することができる。なお、第1の実施形態の第2抽出部406は、第1抽出部405が情報を抽出する処理を実行している場合に、情報を抽出する処理を実行してもよい。これによって、第1の実施形態の第2抽出部406は、第1抽出部405が抽出できなかった情報を抽出することができる。
The
第1の実施形態の送信部408は、電子メールを利用して情報要求者500に情報を送信するので、電話を利用して情報要求者500に情報を送信する場合と比較して、住民等である情報要求者500の負担を低減することができる。第1の実施形態の送信部408は、電子メールを利用して情報要求者500に情報を送信するので、電話を利用して情報要求者500に情報を送信する場合と比較して、自治体に属する管理者等である情報被要求者600の負担を低減することができる。
Since the
不利益情報は、キーワードの同義語又は類義語を含んでいてもよい。これによって、第1の実施形態の情報抽出装置400aは、情報要求者500がインタフェース100にキーワードを誤入力した場合でも、要求された情報と要求された情報に対応付けられた他の情報とを、抽出元情報から抽出することができる。
The disadvantage information may include synonyms or synonyms of keywords. Thereby, even when the information requester 500 erroneously inputs a keyword to the
水道に関する不利益情報と下水道に関する不利益情報とに不利益情報が細分化されている場合、情報被要求者600の管轄が水道課と下水道課と分離されていても、水道課の担当者と下水道課の担当者とは、水道に関する情報を効率的に管理することができる。
If the disadvantageous information is subdivided into the disadvantageous information about the water supply and the disadvantageous information about the sewer, even if the jurisdiction of the
(第2の実施形態)
第2の実施形態では、情報抽出装置400が第3抽出部409を更に備える点が、第1の実施形態と相違する。第2の実施形態では、第1の実施形態との相違点についてのみ説明する。
(Second Embodiment)
The second embodiment is different from the first embodiment in that the information extraction device 400 further includes a
図8は、情報抽出システム10の構成の第2例を示す図である。情報抽出システム10bは、サーバ装置等の情報処理装置を備えるシステムである。情報抽出システム10bは、インタフェース100と、情報取得部200と、抽出元データベース300と、情報抽出装置400bとを備える。
FIG. 8 is a diagram illustrating a second example of the configuration of the information extraction system 10. The
情報抽出装置400bは、キーワード取得部401と、キーワードデータベース402と、変換部403と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、抽出結果データベース407と、送信部408と、第3抽出部409とを備える。
The
情報被要求者600は、情報処理装置を介して、出典情報を含む抽出元情報をインタフェース100に送信する。出典情報は、抽出元情報の出典を表す情報である。例えば、出典情報は、不利益情報又は第2情報の出典を表す情報である。出典情報は、URL(Uniform Resource Locator)によって表現されてもよい。インタフェース100は、出典情報を含む抽出元情報を、情報取得部200に送信する。情報取得部200は、抽出元データベース300に抽出元情報を記憶させる。これによって、情報被要求者600は、インタフェース100及び情報取得部200を介して、出典情報を含む抽出元情報を抽出元データベース300に記憶させることができる。
The information requestee 600 transmits the extraction source information including the source information to the
第3抽出部409は、例えば、CPU等のプロセッサが、記憶部に記憶されたプログラムを実行することにより機能するソフトウェア機能部である。第3抽出部409は、LSIやASIC等のハードウェア機能部であってもよい。第3抽出部409は、抽出元情報から出典情報を抽出する。第3抽出部409は、第1抽出部405によって抽出されたキーワードに対応付けられた出典情報を抽出してもよい。第3抽出部409は、抽出された出典情報を抽出結果データベース407に記憶させる。
The
送信部408は、第3抽出部409によって抽出元情報から抽出された出典情報等を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。すなわち、送信部408は、抽出結果データベース407に記憶されている出典情報等を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。
The
以上のように、第2の実施形態の第3抽出部409は、出典情報を抽出元情報が更に含む場合、出典情報を抽出元情報から抽出する。これによって、第2の実施形態の情報抽出装置400bは、URLなどの出典情報を、情報要求者500に提示することができる。情報要求者500は、不利益情報に関する詳細な情報を、出典情報に基づいて検索することができる。
As described above, the
(第3の実施形態)
第3の実施形態では、情報抽出装置400が削除部410を更に備える点が、第2の実施形態と相違する。第3の実施形態では、第2の実施形態との相違点についてのみ説明する。
(Third embodiment)
The third embodiment is different from the second embodiment in that the information extraction device 400 further includes a
図9は、情報抽出システム10の構成の第3例を示す図である。情報抽出システム10cは、サーバ装置等の情報処理装置を備えるシステムである。情報抽出システム10cは、インタフェース100と、情報取得部200と、抽出元データベース300と、情報抽出装置400cとを備える。
FIG. 9 is a diagram illustrating a third example of the configuration of the information extraction system 10. The
情報抽出装置400cは、キーワード取得部401と、キーワードデータベース402と、変換部403と、不利益情報データベース404と、第1抽出部405と、第2抽出部406と、抽出結果データベース407と、送信部408と、第3抽出部409と、削除部410とを備える。
The
情報被要求者600は、情報処理装置を介して、秘密情報(第3情報)を含む抽出元情報をインタフェース100に送信する。秘密情報は、情報要求者500に送信されない情報として予め定められた情報である。例えば、秘密情報は、作業者責任者、作業担当者及び自治体担当者の個人情報である。個人情報は、例えば、氏名、住所、電話番号である。インタフェース100は、秘密情報を含む抽出元情報を、情報取得部200に送信する。情報取得部200は、抽出元データベース300に抽出元情報を記憶させる。これによって、情報被要求者600は、インタフェース100及び情報取得部200を介して、秘密情報を含む抽出元情報を抽出元データベース300に記憶させることができる。
The information requestee 600 transmits extraction source information including secret information (third information) to the
削除部410(セキュリティ装置)は、例えば、CPU等のプロセッサが、記憶部に記憶されたプログラムを実行することにより機能するソフトウェア機能部である。削除部410は、LSIやASIC等のハードウェア機能部であってもよい。
The deletion unit 410 (security device) is a software function unit that functions when, for example, a processor such as a CPU executes a program stored in the storage unit. The
削除部410は、秘密情報を含む抽出元情報を、抽出結果データベース407から取得する。すなわち、削除部410は、抽出されたキーワード及び第2情報を、抽出結果データベース407から取得する。削除部410は、抽出されたキーワード及び第2情報から秘密情報を削除する。削除部410は、抽出されたキーワード及び第2情報から秘密情報が削除された残りの情報を、送信部408に送信する。
The
送信部408は、抽出されたキーワード及び第2情報から秘密情報が削除された残りの情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。例えば、送信部408は、抽出されたキーワード及び第2情報から個人情報が削除された残りの情報を、情報要求者500に割り当てられた識別情報ごとにインタフェース100に送信する。
The
以上のように、第3の実施形態の送信部408は、抽出されたキーワードと第2情報とが秘密情報(第3情報)を含む場合、抽出されたキーワード及び第2情報から秘密情報が削除部410によって削除されて残った情報を送信する。
As described above, when the extracted keyword and second information include secret information (third information), the
これによって、第3の実施形態の情報抽出装置400cは、個人情報等の秘密情報が不利益情報に含まれている場合でも情報要求者500に個人情報や秘密情報を提示することなく、秘密情報を適正に管理することができる。
As a result, the
以上述べた少なくともひとつの実施形態によれば、抽出されたキーワードに応じて第2情報を抽出元情報から抽出する第2抽出部を持つことにより、住民にとって真に必要な内容を含む情報を元情報から抽出することができる。 According to at least one embodiment described above, by including the second extraction unit that extracts the second information from the extraction source information in accordance with the extracted keyword, the information including the content that is truly necessary for the residents can be obtained. It can be extracted from the information.
以上、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。 As mentioned above, although some embodiment of this invention was described, these embodiment is shown as an example and is not intending limiting the range of invention. These embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are also included in the invention described in the claims and the equivalents thereof.
10a…情報抽出システム、10b…情報抽出システム、10c…情報抽出システム、100…インタフェース、200…情報取得部、300…抽出元データベース、400a…情報抽出装置、400b…情報抽出装置、400c…情報抽出装置、401…キーワード取得部、402…キーワードデータベース、403…変換部、404…不利益情報データベース、405…第1抽出部、406…第2抽出部、407…抽出結果データベース、408…送信部、409…第3抽出部、410…削除部、500…情報要求者、600…情報被要求者
DESCRIPTION OF
Claims (6)
情報を要求する者にとって不利益な情報として予め定められた第1情報を前記キーワードに対応付けて記憶する不利益情報データベースと、
前記第1情報に類似する又は同一である第2情報と前記キーワードとを対応付けて含む抽出元情報を記憶する抽出元データベースと、
前記抽出元情報から前記キーワードを抽出する第1抽出部と、
抽出された前記キーワードに応じて前記第2情報を前記抽出元情報から抽出する第2抽出部と、
前記第2情報が前記抽出元データベースに記憶された場合、抽出された前記第2情報を、前記情報を要求する者に対して送信する送信部と、
を備える情報抽出装置。 A keyword acquisition unit for acquiring keywords;
A disadvantage information database that stores first information predetermined as disadvantageous information for a person who requests information in association with the keyword;
An extraction source database that stores extraction source information that includes the second information similar to or identical to the first information and the keyword;
A first extraction unit for extracting the keyword from the extraction source information;
A second extraction unit for extracting the second information from the extraction source information according to the extracted keyword;
A transmitter that transmits the extracted second information to a person who requests the information, when the second information is stored in the extraction source database;
An information extraction device comprising:
を更に備える、請求項1に記載の情報抽出装置。 The third extraction unit that extracts the source information from the source information when the source information further includes source information that is information representing the source of the first information or the second information. The information extraction device described in 1.
キーワードを取得するステップと、
情報を要求する者にとって不利益な情報として予め定められた第1情報を前記キーワードに対応付けて不利益情報データベースに記憶させるステップと、
前記第1情報に類似する又は同一である第2情報と前記キーワードとを対応付けて含む抽出元情報を記憶するステップと、
前記抽出元情報から前記キーワードを抽出するステップと、
抽出された前記キーワードに応じて前記第2情報を前記抽出元情報から抽出するステップと、
前記第2情報が前記抽出元データベースに記憶された場合、抽出された前記第2情報を、前記情報を要求する者に対して送信するステップと、
を含む情報抽出方法。 An information extraction method in an information extraction device,
Obtaining a keyword;
Storing in a disadvantage information database first information predetermined as information disadvantageous for a person who requests information in association with the keyword;
Storing extraction source information including the second information similar to or identical to the first information and the keyword;
Extracting the keyword from the source information;
Extracting the second information from the source information according to the extracted keyword;
When the second information is stored in the source database, the extracted second information is transmitted to a person who requests the information;
Information extraction method.
キーワードを取得する手順と、
情報を要求する者にとって不利益な情報として予め定められた第1情報を前記キーワードに対応付けて不利益情報データベースに記憶させる手順と、
前記第1情報に類似する又は同一である第2情報と前記キーワードとを対応付けて含む抽出元情報を記憶する手順と、
前記抽出元情報から前記キーワードを抽出する手順と、
抽出された前記キーワードに応じて前記第2情報を前記抽出元情報から抽出する手順と、
前記第2情報が前記抽出元データベースに記憶された場合、抽出された前記第2情報を、前記情報を要求する者に対して送信する手順と、
を実行させるための情報抽出プログラム。 On the computer,
Steps to get keywords,
A procedure for storing first information predetermined as disadvantageous information for a person who requests information in a disadvantageous information database in association with the keyword;
Storing extraction source information that includes second information that is similar to or identical to the first information and the keyword;
A procedure for extracting the keyword from the extraction source information;
A procedure for extracting the second information from the extraction source information according to the extracted keyword;
A procedure for transmitting the extracted second information to a person who requests the information when the second information is stored in the source database;
Information extraction program to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015176620A JP2017054232A (en) | 2015-09-08 | 2015-09-08 | Information extraction device, information extraction method, and information extraction program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015176620A JP2017054232A (en) | 2015-09-08 | 2015-09-08 | Information extraction device, information extraction method, and information extraction program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017054232A true JP2017054232A (en) | 2017-03-16 |
Family
ID=58316681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015176620A Pending JP2017054232A (en) | 2015-09-08 | 2015-09-08 | Information extraction device, information extraction method, and information extraction program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017054232A (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120190A (en) * | 1997-10-15 | 1999-04-30 | Hitachi Ltd | Reservation retrieval method |
JP2004030021A (en) * | 2002-06-24 | 2004-01-29 | Oki Electric Ind Co Ltd | Document processor and processing method |
WO2010106642A1 (en) * | 2009-03-17 | 2010-09-23 | 富士通株式会社 | Search processing method and apparatus |
JP2012108638A (en) * | 2010-11-16 | 2012-06-07 | Hitachi Ltd | Event/accident information sharing system |
JP2015143925A (en) * | 2014-01-31 | 2015-08-06 | 前田建設工業株式会社 | Updating monitoring method, updating monitoring program, and updating device |
-
2015
- 2015-09-08 JP JP2015176620A patent/JP2017054232A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120190A (en) * | 1997-10-15 | 1999-04-30 | Hitachi Ltd | Reservation retrieval method |
JP2004030021A (en) * | 2002-06-24 | 2004-01-29 | Oki Electric Ind Co Ltd | Document processor and processing method |
WO2010106642A1 (en) * | 2009-03-17 | 2010-09-23 | 富士通株式会社 | Search processing method and apparatus |
JP2012108638A (en) * | 2010-11-16 | 2012-06-07 | Hitachi Ltd | Event/accident information sharing system |
JP2015143925A (en) * | 2014-01-31 | 2015-08-06 | 前田建設工業株式会社 | Updating monitoring method, updating monitoring program, and updating device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150186537A1 (en) | Question distribution method and a question distribution system for a q&a platform | |
JP2005134990A (en) | Ciphered database retrieval device and method, and ciphered database retrieval program | |
JP5533291B2 (en) | Privacy protection device, privacy protection method and program | |
Tsou et al. | Identifying data noises, user biases, and system errors in geo-tagged twitter messages (Tweets) | |
JP5231514B2 (en) | Action support information providing apparatus, method, and program | |
JP2023059956A (en) | Map maintenance device, guide device, control method, program, and storage medium | |
JP4835661B2 (en) | User information management program, user information management device, and information management system | |
US9898463B2 (en) | Document management server, document management method, and non-transitory storage medium storing program | |
JP2017054232A (en) | Information extraction device, information extraction method, and information extraction program | |
WO2013146910A1 (en) | Data search system and data search method | |
JP6413540B2 (en) | Relay device, data processing system, and program | |
JP2012194676A (en) | Information processing system, information generation device, information providing device, information generation method, information providing method, information generation program, and information providing program | |
WO2020048059A1 (en) | Fund data association method and system, computer device and storage medium | |
Shaheer et al. | Challenges and opportunities for sacred journeys: a media representation of the impact of COVID-19 | |
JP6323109B2 (en) | Document management system, key-value store apparatus, document management method, and program | |
JP2007249423A (en) | Processing screen switching method in work processing system, work processing system, server therefor, and program | |
Hill et al. | Operationalizing an open-source dashboard for communicating results of wastewater-based epidemiology | |
JP6528417B2 (en) | Anonymity management program, anonymity management device, and electronic sticky note management device | |
Rabang | Cultural mapping as a tool in heritage conservation in a world heritage site: The Vigan City experience | |
JP5932094B2 (en) | Server apparatus, annotation system, method, and program | |
JP2007265014A (en) | Human resource retrieval system | |
JP6219425B2 (en) | Attribute information generation device, linkage system, and attribute information generation program | |
KR101263383B1 (en) | System for delivering online coupon including the validity data | |
JP2005202501A (en) | Asset management system, method therefor, program and asset management server device | |
JP2009093567A (en) | Time information conversion program and time information conversion device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20170912 Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20170912 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190219 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191001 |