JP5620814B2 - トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム - Google Patents
トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム Download PDFInfo
- Publication number
- JP5620814B2 JP5620814B2 JP2010293761A JP2010293761A JP5620814B2 JP 5620814 B2 JP5620814 B2 JP 5620814B2 JP 2010293761 A JP2010293761 A JP 2010293761A JP 2010293761 A JP2010293761 A JP 2010293761A JP 5620814 B2 JP5620814 B2 JP 5620814B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- phrase
- characters
- weighting
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 84
- 238000000605 extraction Methods 0.000 claims description 41
- 239000000284 extract Substances 0.000 claims description 22
- 238000012545 processing Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 25
- 230000014509 gene expression Effects 0.000 description 10
- 230000034994 death Effects 0.000 description 9
- 231100000517 death Toxicity 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 208000027418 Wounds and injury Diseases 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 239000002245 particle Substances 0.000 description 5
- 241001125840 Coryphaenidae Species 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 235000013410 fast food Nutrition 0.000 description 3
- 235000015220 hamburgers Nutrition 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 206010043248 Tendon rupture Diseases 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G06F17/21—
-
- G06F17/27—
-
- G06F17/28—
-
- G06F17/30—
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
次に、図2を用いて、実施例に係るトピック作成支援装置10の構成を説明する。図2は、本発明の一実施形態に係るトピックス作成支援装置の構成図である。同図に示すように、このトピック作成支援装置10は、通信I/F(インターフェース)11、記憶部12、制御部13を備え、ネットワーク等を介して作成者端末20と接続される。以下にこれらの各部の処理を説明する。
次に、図9を用いて、実施例1に係るトピック作成支援装置10による処理を説明する。図9は、図2に示すトピックス作成支援装置の処理手順を示すフローチャートである。
以上のように本実施形態に係るトピック作成支援装置10は、見出しおよび本文からなるニュース記事情報からトピックを自動で作成して出力するので、トピック作成の作業負担を軽減することが可能である。つまり、トピック作成者がトピックの作成を指示するだけで、トピック作成支援装置1が文字数制限内で作成されたトピック候補を自動で作成して出力するので、トピック作成者は、トピック候補をそのままトピックとして利用したり、トピック候補をもとに編集してトピックを作成することができる結果、トピック作成の作業負担を軽減することができる。
また、上述においては、ニュース記事のトピック候補を作成する例を説明したが、これに限定されるものではなく、ショッピング情報や求人情報などのトピック候補を作成するようにしてもよい。
2 ニュース記事情報記憶手段
3 ディスプレイ
11 通信I/F
12 記憶部
12a ニュース記事情報
12b 分割ルール情報
12c 重み付けルール情報
12d 省略化ルール情報
12e 省略化辞書情報
12f 検索回数情報
13 制御部
13a 見出し抽出手段
13b 分割手段
13c 重み付け手段
13d 文節要素抽出手段
13e 文字数判定手段
13f 省略化手段
13g トピック候補出力手段
20 作成者端末
Claims (8)
- 見出しおよび本文からなる文章情報を記憶する文章情報記憶手段から、前記見出しを構成する見出し情報を抽出する見出し抽出手段と、
前記見出し抽出手段によって抽出された見出し情報を文節で区切って、複数の文節要素に分割する分割手段と、
前記分割手段によって分割された各文節要素に対して、予め定められた重み付け判定データであって、動詞の特定の活用を含む文節要素である場合には重み付けの度合いが、前記動詞の特定の活用を含まない文節要素よりも大きくなる重み付け判定データに基づいて、重み付けを行う重み付け手段と、
前記重み付け手段によって重み付けされた文節要素のうち、重み付けの度合いが大きい文節要素を抽出する文節要素抽出手段と、
前記文節要素抽出手段によって抽出された文節要素を前記文章情報のトピックとして出力するとともに、前記文節要素の文字数が所定の文字数よりも多いか少ないかを判定し、前記文節要素の文字数が多い場合には、過剰文字数を出力し、前記文節要素の文字数が少ない場合には、不足文字数を出力するトピック出力手段と
を備えることを特徴とするトピック作成支援装置。 - 前記文節要素抽出手段によって抽出された文節要素が所定の文字数以下であるか判定する文字数判定手段と、
前記文字数判定手段によって前記文節要素が所定の文字数よりも多いと判定された場合には、文章の意味に与える影響に応じて予め定められた省略化ルールに基づいて、該文節要素から文字または記号を省略する省略化手段をさらに備え、
前記トピック出力手段は、前記省略化手段によって省略された文節要素を前記文章情報のトピックとして出力することを特徴とする請求項1に記載のトピック作成支援装置。 - 前記文字数判定手段は、前記省略化手段によって複数の省略化ルールうちの一の省略化ルールに基づいて、該文節要素から文字または記号が省略されるたびに、該文節要素が所定の文字数以下であるか判定し、
前記トピック出力手段は、前記文字数判定手段によって前記文節要素が所定の文字数以下であると判定された場合には、前記省略化手段によって省略された文節要素を前記文章情報のトピックとして出力することを特徴とする請求項2に記載のトピック作成支援装置。 - 前記省略化手段は、複数の名詞が省略対象となった場合に、各名詞が検索クエリとして入力された回数である検索回数情報を取得し、該複数の名詞のうち、検索クエリとして入力された回数が最も多い名詞以外の名詞を省略することを特徴とする請求項2または3に記載のトピック作成支援装置。
- 前記重み付け手段は、複数の重み付け判定データごとに、前記分割手段によって分割された各文節要素に対する重み付けを行い、
前記文節要素抽出手段は、前記重み付け手段によって複数の重み付け判定データごとに重み付けされた文節要素から、重み付けの度合いが大きい文節要素をそれぞれ抽出し、
前記トピック出力手段は、前記文節要素抽出手段によって抽出された複数の文節要素を前記文章情報のトピックとしてそれぞれ出力することを特徴とする請求項1〜4のいずれか一つに記載のトピック作成支援装置。 - 前記トピック出力手段は、前記文章情報のトピックと前記見出し情報との差分を検出し、前記文章情報のトピックとともに前記差分を出力することを特徴とする請求項1〜5のいずれか一つに記載のトピック作成支援装置。
- コンピュータを制御し、見出しおよび本文からなる文章情報のトピックの作成を支援するトピック作成支援方法において、
前記コンピュータが、見出しおよび本文からなる文章情報を記憶する文章情報記憶手段から、前記見出しを構成する見出し情報を抽出する見出し抽出手順と、
前記コンピュータが、前記見出し情報を文節で区切って、複数の文節要素ごとに分割する分割手順と、
前記コンピュータが、前記各文節要素に対して、予め定められた重み付け判定データであって、動詞の特定の活用を含む文節要素である場合には重み付けの度合いが、前記動詞の特定の活用を含まない文節要素よりも大きくなる重み付け判定データに基づいて、重み付けを行う重み付け手順と、
前記コンピュータが、前記重み付けされた文節要素のうち、重み付けの度合いが大きい文節要素を抽出する文節要素抽出手順と、
前記コンピュータが、前記抽出された文節要素を前記文章情報のトピックとして出力するとともに、前記文節要素の文字数が所定の文字数よりも多いか少ないかを判定し、前記文節要素の文字数が多い場合には、過剰文字数を出力し、前記文節要素の文字数が少ない場合には、不足文字数を出力するトピック出力手順と
を含むことを特徴とするトピック作成支援方法。 - 見出しおよび本文からなる文章情報のトピックの作成を支援する処理をコンピュータに実行させるトピック作成支援プログラムにおいて、
見出しおよび本文からなる文章情報を記憶する文章情報記憶手段から、前記見出しを構成する見出し情報を抽出し、
前記見出し情報を文節で区切って、複数の文節要素ごとに分割し、
前記各文節要素に対して、予め定められた重み付け判定データであって、動詞の特定の活用を含む文節要素である場合には重み付けの度合いが、前記動詞の特定の活用を含まない文節要素よりも大きくなる重み付け判定データに基づいて、重み付けを行い、
前記重み付けされた文節要素のうち、重み付けの度合いが大きい文節要素を抽出し、
前記抽出された文節要素を前記文章情報のトピックとして出力するとともに、前記文節要素の文字数が所定の文字数よりも多いか少ないかを判定し、前記文節要素の文字数が多い場合には、過剰文字数を出力し、前記文節要素の文字数が少ない場合には、不足文字数を出力する処理をコンピュータに実行させることを特徴とするトピック作成支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010293761A JP5620814B2 (ja) | 2010-12-28 | 2010-12-28 | トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010293761A JP5620814B2 (ja) | 2010-12-28 | 2010-12-28 | トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012141772A JP2012141772A (ja) | 2012-07-26 |
JP5620814B2 true JP5620814B2 (ja) | 2014-11-05 |
Family
ID=46678016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010293761A Active JP5620814B2 (ja) | 2010-12-28 | 2010-12-28 | トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5620814B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5930229B2 (ja) | 2014-03-10 | 2016-06-08 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 電子文書の内容の把握を支援する装置及び方法 |
CN104408093B (zh) * | 2014-11-14 | 2018-01-26 | 中国科学院计算技术研究所 | 一种新闻事件要素抽取方法与装置 |
JP6348831B2 (ja) * | 2014-12-12 | 2018-06-27 | クラリオン株式会社 | 音声入力補助装置、音声入力補助システムおよび音声入力方法 |
JP7000171B2 (ja) * | 2018-01-16 | 2022-01-19 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | コミュニケーションシステム、コミュニケーション方法およびコミュニケーションプログラム |
JP6940428B2 (ja) * | 2018-02-15 | 2021-09-29 | アルパイン株式会社 | 検索結果提供装置および検索結果提供方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254876A (ja) * | 1997-03-07 | 1998-09-25 | Omron Corp | 文書要約方法及び文書要約装置 |
JP3652086B2 (ja) * | 1997-10-22 | 2005-05-25 | 株式会社日立製作所 | 速読支援装置 |
JP2000029894A (ja) * | 1998-07-13 | 2000-01-28 | Ntt Data Corp | 主題文抽出方式 |
JP2007188225A (ja) * | 2006-01-12 | 2007-07-26 | Yafoo Japan Corp | 要約文抽出システム |
JP2007233823A (ja) * | 2006-03-02 | 2007-09-13 | Advanced Telecommunication Research Institute International | 自動要約装置及びコンピュータプログラム |
-
2010
- 2010-12-28 JP JP2010293761A patent/JP5620814B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012141772A (ja) | 2012-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9020808B2 (en) | Document summarization using noun and sentence ranking | |
JP5106636B2 (ja) | テキストセグメントを有する文書から用語を抽出するためのシステム | |
CN109657054A (zh) | 摘要生成方法、装置、服务器及存储介质 | |
JP2019067433A (ja) | 話題提供システム | |
US8745044B2 (en) | Generating descriptions of matching resources based on the kind, quality, and relevance of available sources of information about the matching resources | |
US8874590B2 (en) | Apparatus and method for supporting keyword input | |
JP4347226B2 (ja) | 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法 | |
JP5620814B2 (ja) | トピック作成支援装置、トピック作成支援方法およびトピック作成支援プログラム | |
US8990246B2 (en) | Understanding and addressing complex information needs | |
WO2011091442A1 (en) | System and method for optimizing search objects submitted to a data resource | |
JP2009217802A (ja) | 文書処理装置、文書処理プログラムおよび記録媒体 | |
JP2009116662A (ja) | 質問応答装置、質問応答方法、及びプログラム | |
JP2014219872A (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
JPH1145267A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4827163B2 (ja) | テスト問題配信システム | |
JP4065346B2 (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP6144133B2 (ja) | 検索システム | |
JP5085584B2 (ja) | 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム | |
CN114328865A (zh) | 一种改进的TextRank多特征融合教育资源关键词提取方法 | |
US9280603B2 (en) | Generating descriptions of matching resources based on the kind, quality, and relevance of available sources of information about the matching resources | |
JP2005050156A (ja) | コンテンツの置換方法及びシステム | |
Samanta et al. | Development of multimodal user interfaces to Internet for common people | |
JP2005234772A (ja) | 文書管理装置および方法 | |
Peng et al. | Geographic named entity disambiguation with automatic profile generation | |
JP6502732B2 (ja) | 文書表示装置、文書表示方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131023 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20131031 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20131115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140919 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5620814 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |