JP2020052595A - 抽出装置及びプログラム - Google Patents
抽出装置及びプログラム Download PDFInfo
- Publication number
- JP2020052595A JP2020052595A JP2018179757A JP2018179757A JP2020052595A JP 2020052595 A JP2020052595 A JP 2020052595A JP 2018179757 A JP2018179757 A JP 2018179757A JP 2018179757 A JP2018179757 A JP 2018179757A JP 2020052595 A JP2020052595 A JP 2020052595A
- Authority
- JP
- Japan
- Prior art keywords
- information
- time
- date
- category
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims abstract description 47
- 239000000284 extract Substances 0.000 claims abstract description 4
- 230000005540 biological transmission Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 7
- 230000002265 prevention Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 206010039203 Road traffic accident Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
第一例は、指定されたカテゴリc(j)が図4のカテゴリc(1)=「日時」であり、且つ、入力テキストTの情報種別t(i)が図3のいずれかである場合に関する。
a(1,1,1)=a(2,1,1)=a(3,1,1)=a(4,1,1)=「情報発信日時との関係」
と定義しておく。
a(1,1,2)=a(2,1,2)=a(3,1,2)=a(4,1,2)=「情報発信日時との時間差」
と定義しておく。
a(1,1,3)=a(2,1,3)=a(3,1,3)=a(4,1,3)=「日時情報の粒度」
と定義しておく。
a(1,1,4)=a(2,1,4)=a(3,1,4)=a(4,1,4)=「時間帯」
と定義しておく。
第二例は、指定されたカテゴリc(j)が図4のカテゴリc(2)=「場所」であり、且つ、入力テキストTの情報種別t(i)が図3のいずれかである場合に関する。
a(1,2,1)=a(2,2,1)=a(3,2,1)=a(4,2,1)=「場所情報の種類」
と定義しておく。
a(1,2,2)=a(2,2,2)=a(3,2,2)=a(4,2,2)=「場所情報の粒度」
と定義しておく。
地域イベント情報の情報種別として、t(11)=「地域イベント_祭り」、t(12)=「地域イベント_展示会」、t(13)=「地域イベント_音楽」、t(14)=「地域イベント_フリーマーケット」の4個を例に説明する。
地域イベントで抽出すべき日時情報は開催日時である。将来開催される地域イベントの案内や、開催された地域イベントの報告、感想などが情報発信される場合があるため、属性「情報発信日時との関係」は「過去」、「未来」の両方の場合が想定される。属性「情報発信日時との時間差」について、将来開催される地域イベントの案内の場合は、情報発信日時が開催日時に対して、最大1年間前まで含む傾向が想定される。一方、開催されたイベントの報告や感想の場合、情報発信日時が開催日時に対して最大1か月後の傾向が高いことが想定される。属性「日時情報の粒度」について、開催日時は「時間粒度」や「分粒度以下」の傾向が高いことが想定される。「時間帯」について、9時〜18時の間の時間帯の傾向が高いことが想定される。
地域イベントで抽出すべき場所情報は開催場所である。情報種別により属性「場所情報の種類」は「屋外」、「屋内」のどちらかの傾向が高いことが想定される。属性「場所情報の粒度」は「番地粒度」の傾向が高いことが想定される。
道路交通情報の情報種別として、t(21)=「道路交通情報_交通事故」、t(22)=「道路交通情報_渋滞」、t(23)=「道路交通情報_通行止め」の3個を例に説明する。
属性「情報発信日時との関係」について、「道路交通情報_交通事故」と「道路交通情報_渋滞」は「過去」、「道路交通情報_通行止め」は「未来」、「過去」の傾向が高いことが想定される。属性「日時情報の粒度」について、「道路交通情報_交通事故」と「道路交通情報_通行止め」は「時間粒度」や「分粒度以下」、「道路交通情報_渋滞」は「日粒度」や「時間粒度」の傾向が高いことが想定される。属性「時間帯」については24時間の何れの可能性もあることが想定される。
情報種別に共通して、属性「場所情報の種類」は「屋外」の傾向が高いことが想定される。属性「場所情報の粒度」について、「道路交通情報_交通事故」と「道路交通情報_通行止め」は「番地粒度」、「道路交通情報_渋滞」は「市町村粒度」の傾向が高いことが想定される。
Claims (8)
- 入力テキストを解析してその情報種別を判定する判定部と、
前記入力テキストを解析して、指定されるカテゴリに対する該当箇所を抽出する抽出部と、
前記該当箇所が複数抽出された場合に、前記情報種別及び前記カテゴリに基づいて最適な該当箇所を選別する選別部と、を備えることを特徴とする抽出装置。 - 前記選別部では、前記情報種別及前記カテゴリに応じて予め定義される1つ以上の属性に関して、前記複数抽出された該当箇所における当該属性の評価結果を求め、当該評価結果に基づいて前記最適な該当箇所を選別することを特徴とする請求項1に記載の抽出装置。
- 前記指定されるカテゴリは日時であり、
前記予め定義される1つ以上の属性は、入力テキストに紐づいた情報発信日時との関係、入力テキストに紐づいた情報発信日時との時間差、粒度、時間帯、からなるグループより選択されるものを含むことを特徴とする請求項2に記載の抽出装置。 - 前記指定されるカテゴリは場所であり、
前記予め定義される1つ以上の属性は、種類及び粒度からなるグループより選択されるものを含むことを特徴とする請求項2に記載の抽出装置。 - 前記選別部では、前記情報種別及前記カテゴリごとに予め機械学習された学習モデルを用いて、前記最適な該当箇所を選別することを特徴とする請求項1ないし4のいずれかに記載の抽出装置。
- 前記選別部では、前記該当箇所が1つのみ抽出された場合には当該1つの該当箇所を出力し、前記該当箇所が抽出されなかった場合には当該抽出されなかった旨を出力することを特徴とする請求項1ないし5のいずれかに記載の抽出装置。
- 前記選別部では、前記最適な該当箇所と、前記情報種別と、を紐づけて出力することを特徴とする請求項1ないし6のいずれかに記載の抽出装置。
- コンピュータを請求項1ないし7のいずれかに記載の抽出装置として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018179757A JP6975118B2 (ja) | 2018-09-26 | 2018-09-26 | 抽出装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018179757A JP6975118B2 (ja) | 2018-09-26 | 2018-09-26 | 抽出装置及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020052595A true JP2020052595A (ja) | 2020-04-02 |
JP2020052595A5 JP2020052595A5 (ja) | 2020-11-19 |
JP6975118B2 JP6975118B2 (ja) | 2021-12-01 |
Family
ID=69997184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018179757A Active JP6975118B2 (ja) | 2018-09-26 | 2018-09-26 | 抽出装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6975118B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023510906A (ja) * | 2020-05-21 | 2023-03-15 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 地理的位置ポイント空間関係を抽出する方法、抽出モデルをトレーニングする方法、及び装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113716A (ja) * | 2010-11-23 | 2012-06-14 | Nhn Business Platform Corp | カテゴリーマッチングを用いたキーワード抽出システムおよびキーワード抽出方法 |
WO2014064777A1 (ja) * | 2012-10-24 | 2014-05-01 | 株式会社 日立製作所 | 文書評価支援システム、及び文書評価支援方法 |
-
2018
- 2018-09-26 JP JP2018179757A patent/JP6975118B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113716A (ja) * | 2010-11-23 | 2012-06-14 | Nhn Business Platform Corp | カテゴリーマッチングを用いたキーワード抽出システムおよびキーワード抽出方法 |
WO2014064777A1 (ja) * | 2012-10-24 | 2014-05-01 | 株式会社 日立製作所 | 文書評価支援システム、及び文書評価支援方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023510906A (ja) * | 2020-05-21 | 2023-03-15 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 地理的位置ポイント空間関係を抽出する方法、抽出モデルをトレーニングする方法、及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6975118B2 (ja) | 2021-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Resch et al. | Combining machine-learning topic models and spatiotemporal analysis of social media data for disaster footprint and damage assessment | |
Calvin et al. | # bully: Uses of hashtags in posts about bullying on Twitter | |
Imran et al. | Coordinating human and machine intelligence to classify microblog communications in crises. | |
CN105005594B (zh) | 异常微博用户识别方法 | |
US9218568B2 (en) | Disambiguating data using contextual and historical information | |
JP6662119B2 (ja) | ソーシャルメディア投稿のキャプションを生成する方法、プログラム及びサーバ装置 | |
US9069880B2 (en) | Prediction and isolation of patterns across datasets | |
US10769196B2 (en) | Method and apparatus for displaying electronic photo, and mobile device | |
CN102779114A (zh) | 利用自动规则生成的非结构化数据支持 | |
JP6756744B2 (ja) | 位置情報提供方法及び装置 | |
JP6392042B2 (ja) | 情報提供装置、情報を提供する方法およびプログラム | |
US20170235835A1 (en) | Information identification and extraction | |
Zhang et al. | Snaf: Observation filtering and location inference for event monitoring on twitter | |
JP2020052595A (ja) | 抽出装置及びプログラム | |
JP5841108B2 (ja) | 情報処理装置、記事情報生成方法およびプログラム | |
JP2020129239A (ja) | 投稿分析システム、投稿分析装置および投稿分析方法 | |
JP6457986B2 (ja) | メッセージ分類システム、メッセージ分類方法及びプログラム | |
KR102324179B1 (ko) | 영유아 기관정보 통합 서비스 제공 시스템 | |
Kurniawan et al. | Exploring Tourist Feedback on Riau Attractions Through Indonesian Language YouTube Opinion Using Naïve Bayes Algorithm | |
Sandesh et al. | Detection of cyberbullying on twitter data using machine learning | |
Yin et al. | Research of integrated algorithm establishment of a spam detection system | |
CN113742614A (zh) | 生成、显示推荐信息的方法、电子设备及存储介质 | |
CN112685652A (zh) | 面向企业用户的信息推送方法及系统 | |
Cherichi et al. | Big data analysis for event detection in microblogs | |
JP6496952B2 (ja) | データ処理装置、データ処理システム、データ処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6975118 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |