JP6097707B2 - データ更新装置、方法、及びプログラム - Google Patents
データ更新装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6097707B2 JP6097707B2 JP2014020651A JP2014020651A JP6097707B2 JP 6097707 B2 JP6097707 B2 JP 6097707B2 JP 2014020651 A JP2014020651 A JP 2014020651A JP 2014020651 A JP2014020651 A JP 2014020651A JP 6097707 B2 JP6097707 B2 JP 6097707B2
- Authority
- JP
- Japan
- Prior art keywords
- news
- utterance
- information
- feature word
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、本発明の実施の形態の概要について説明する。
図1は、本発明の実施の形態に係るデータ更新装置100を示すブロック図である。このデータ更新装置100は、CPUと、RAMと、後述する発話インデックス更新処理ルーチン及びニュースインデックス更新処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
(3)全体との割合の比較:Q/R<T/Sであれば、無効と判定する。
次に、本実施の形態に係るデータ更新装置100の作用について説明する。まず、ニュースデータベース20に格納されているニュースインデックスに、ニュースサイト14から得られた、又は人手により入力された複数のニュース情報が逐次登録され、発話データベース40に格納されている発話インデックスに、マイクロブログサイト16から得られた複数の発話と当該発話の発言時期とが逐次登録される。そして、一定期間(例えば、1日)が経過する毎に、データ更新装置100によって、図3に示す発話インデックス更新処理ルーチンが実行される。
12 インターネット
14 ニュースサイト
16 マイクロブログサイト
20 ニュースデータベース
25 発話データベース構築部
30 発話データ入力部
40 発話データベース
50 演算部
52 期限切れニュース抽出部
54,60 特徴単語抽出部
56 発話無効化部
58 期限なしニュース抽出部
62 頻度算出部
64 ニュース無効化部
100 データ更新装置
Claims (6)
- 予め定められた有効期限を経過したニュース情報から、特徴単語を抽出する特徴単語抽出部と、
有効であるか無効であるかを示す情報が付与された複数の発話が登録された発話データベースに対し、前記特徴単語抽出部によって抽出された特徴単語を含む前記発話に対応する前記情報を、無効であることを示す情報に更新する発話無効化部と、
を含むデータ更新装置。 - 有効であるか無効であるかを示す情報が付与された複数のニュース情報が登録されたニュースデータベースに登録されている前記ニュース情報から、特徴単語を抽出する特徴単語抽出部と、
発言時期が付与された複数の発話が登録された発話データベースに登録されている、前記発言時期が予め定められた期間内に含まれる発話における、前記特徴単語抽出部によって抽出された特徴単語の出現頻度に基づいて、前記ニュース情報に対応する前記情報を、無効であることを示す情報に更新するニュース無効化部と、
を含むデータ更新装置。 - 特徴単語抽出部、及び発話無効化部を含むデータ更新装置におけるデータ更新方法であって、
前記特徴単語抽出部が、予め定められた有効期限を経過したニュース情報から、特徴単語を抽出するステップと、
前記発話無効化部が、有効であるか無効であるかを示す情報が付与された複数の発話が登録された発話データベースに対し、前記特徴単語抽出部によって抽出された特徴単語を含む前記発話に対応する前記情報を、無効であることを示す情報に更新するステップと、
を含むデータ更新方法。 - 特徴単語抽出部、及びニュース無効化部を含むデータ更新装置におけるデータ更新方法であって、
前記特徴単語抽出部が、有効であるか無効であるかを示す情報が付与された複数のニュース情報が登録されたニュースデータベースに登録されている前記ニュース情報から、特徴単語を抽出するステップと、
前記ニュース無効化部が、発言時期が付与された複数の発話が登録された発話データベースに登録されている、前記発言時期が予め定められた期間内に含まれる発話における、前記特徴単語抽出部によって抽出された特徴単語の出現頻度に基づいて、前記ニュース情報に対応する前記情報を、無効であることを示す情報に更新するステップと、
を含むデータ更新方法。 - コンピュータを、請求項1記載のデータ更新装置の各部として機能させるためのプログラム。
- コンピュータを、請求項2記載のデータ更新装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014020651A JP6097707B2 (ja) | 2014-02-05 | 2014-02-05 | データ更新装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014020651A JP6097707B2 (ja) | 2014-02-05 | 2014-02-05 | データ更新装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015148894A JP2015148894A (ja) | 2015-08-20 |
JP6097707B2 true JP6097707B2 (ja) | 2017-03-15 |
Family
ID=53892219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014020651A Active JP6097707B2 (ja) | 2014-02-05 | 2014-02-05 | データ更新装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6097707B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6697373B2 (ja) | 2016-12-06 | 2020-05-20 | カシオ計算機株式会社 | 文生成装置、文生成方法及びプログラム |
JP2018198097A (ja) * | 2018-09-20 | 2018-12-13 | カシオ計算機株式会社 | 文生成装置、文生成方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091866A (ja) * | 2000-06-28 | 2002-03-29 | Hiroki Iwasaki | 情報発信システム |
JP3762226B2 (ja) * | 2001-01-23 | 2006-04-05 | 日本電信電話株式会社 | 電子掲示板作成装置、電子掲示板作成方法、電子掲示板作成処理用プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003076640A (ja) * | 2001-09-04 | 2003-03-14 | Matsushita Electric Ind Co Ltd | データ処理装置およびファイルシステム |
JP2006031509A (ja) * | 2004-07-20 | 2006-02-02 | Ricoh Co Ltd | 電子掲示板システム、電子掲示板システムの記事整理方法、プログラムおよび記録媒体 |
JP2011108053A (ja) * | 2009-11-18 | 2011-06-02 | Nomura Research Institute Ltd | ニュース記事評価システム |
-
2014
- 2014-02-05 JP JP2014020651A patent/JP6097707B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015148894A (ja) | 2015-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sidorov et al. | Syntactic n-grams as machine learning features for natural language processing | |
CN105095204B (zh) | 同义词的获取方法及装置 | |
JP5744228B2 (ja) | インターネットにおける有害情報の遮断方法と装置 | |
US8051088B1 (en) | Document analysis | |
CN110717034A (zh) | 一种本体构建方法及装置 | |
KR101353521B1 (ko) | 키워드 추출 방법 및 시스템, 그리고 대화 보조 장치 | |
CN112417102A (zh) | 一种语音查询方法、装置、服务器和可读存储介质 | |
JP2013529805A5 (ja) | 検索方法、検索システム及びコンピュータプログラム | |
CN109977233B (zh) | 一种成语知识图谱构建方法及装置 | |
WO2017198031A1 (zh) | 解析语义的方法和装置 | |
US9916301B2 (en) | Named entity variations for multimodal understanding systems | |
CN112417103A (zh) | 用于检测敏感词的方法、装置、设备和存储介质 | |
CN111444713B (zh) | 新闻事件内实体关系抽取方法及装置 | |
JP6097707B2 (ja) | データ更新装置、方法、及びプログラム | |
CN109298796B (zh) | 一种词联想方法及装置 | |
CN114244795A (zh) | 一种信息的推送方法、装置、设备及介质 | |
Mayor et al. | A single author style representation for the author verification task. | |
CN110705285B (zh) | 一种政务文本主题词库构建方法、装置、服务器及可读存储介质 | |
Alkhatib et al. | Paraphrasing Arabic metaphor with neural machine translation | |
US9336317B2 (en) | System and method for searching aliases associated with an entity | |
JP4326713B2 (ja) | ニュース話題解析装置 | |
JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
JP5676683B2 (ja) | 発話文抽出装置、方法、及びプログラム | |
JP2014222399A (ja) | 焦点推定装置、方法、及びプログラム | |
JP5583107B2 (ja) | キーワード地名ペア抽出装置及び方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160617 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20160617 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160617 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6097707 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |