JP2008171302A - アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム - Google Patents
アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム Download PDFInfo
- Publication number
- JP2008171302A JP2008171302A JP2007005470A JP2007005470A JP2008171302A JP 2008171302 A JP2008171302 A JP 2008171302A JP 2007005470 A JP2007005470 A JP 2007005470A JP 2007005470 A JP2007005470 A JP 2007005470A JP 2008171302 A JP2008171302 A JP 2008171302A
- Authority
- JP
- Japan
- Prior art keywords
- outline
- document
- candidates
- importance
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】文書を取得する文書取得部11と、取得した文書を解析し、重要度で階層化されたアウトライン候補を抽出する文書特徴量抽出部12と、アウトラインとして表示可能な最大量を算出する最大表示量算出部13と、前記抽出されたアウトライン候補を、前記算出された最大量を超えない範囲まで、該アウトライン候補の重要度に基づいて絞り込むアウトライン生成部14と、前記生成されたアウトラインの表示形式を指定し、アウトライン文書を作成する表示形式指定部15と、前記作成されたアウトライン文書を出力する出力部16とを備える。
【選択図】図1
Description
文章要約過程におけるアウトライン・ビューの有効性についての検討−テキスト読解支援システムの試み−、赤星哲也、情処学会研究報告、人文科学とコンピュータ、38−8、1998 見出し情報を用いたテキスト解析と情報抽出、高松忍・西田富士夫、情処学会論文誌、29(8)、1998 プレーンテキスト/ハイパーテキスト間の変換、土井美和子、福井美佳、山口浩司、竹林洋一、岩井勇、情処学会研究報告、情報学基礎、13−5、1989
(2)また請求項2、6に記載の発明によれば、アウトライン量の制限や閲覧者の閲覧環境に応じて、自動的に適切なアウトラインの量を計算し生成することができ、且つ指定した表示形式のアウトライン文書を得ることができる。
(3)また請求項3、7に記載の発明によれば、重要度の高いアウトライン候補を自動的にアウトラインとして生成することができる。
(4)また請求項4、8に記載の発明によれば、重要度が同じアウトライン候補が存在しても、自動的にアウトラインを絞り込むことができる。
(実施例1)
本実施例は、文書の作成者もしくは文書の管理者側のシステムで指定した表示領域量に基づいてアウトライン文書を自動作成する例であり、文書を作成する者が所有する文書作成ツール内において実施される。図1は本発明であるアウトライン生成装置のブロック構成図を示している。
上記の算出式(1)はアウトラインを記述するHTMLタグの文字数を考慮したものである。上記の算出式を用いて、本実施例ではNmax=8.33となる。
N=Nall
として全ての見出しを表示する。
Nall>Nmax
となる場合は、抽出された見出しのうち、重要度が最も低い見出しの数を0とすることで、見出しの数Nallを減らす。NallがNmax以下となるまで、重要度の低い方からこの処理を繰り返す。
<a href=”リンク先のファイル名#○○(見出しのある部分につけたマーカ)”>アウトラインとして表示された見出し</a>
として記述する。本実施例では、N=5であるため5個の見出しについて、元の文書ファイル名を「haishoku.html」とし、マーカ名を重要度kと重要度ごとのNo.の組み合わせとして、図5のようなアウトラインを生成する。また、元の対象ファイル「haishoku.html」はアウトラインを見出し部分へのリンクとするための追加記述をしたことにより、図6のようになる。
(実施例2)
本実施例は、文書を閲覧する者が使用する端末内において実施される。装置構成および処理の流れは実施例1と同様であるが、閲覧者側のシステムで、表示領域のサイズにあわせてアウトライン文書を自動的に作成する例である。最大表示量算出部13では表示可能量に関する表示領域情報を取得する。
表示形式指定部15では、元の文書ファイルのコピーファイルを作成し、そのコピーファイル内にアウトラインを追加記述することで、アウトラインを含めた新しい文書を生成してもよい。
(実施例3)
本実施例は、Webサーバ上において実施される例である。図8は本実施例におけるアウトライン生成システムの構成を表しており、図1と同一部分は同一符号をもって示している。図8において20は、アウトライン生成対象である文書が蓄積されたコンテンツサーバである。
Claims (9)
- 文書のアウトラインを生成するアウトライン生成装置であって、
文書を取得する文書取得手段と、
前記取得した文書を解析し、重要度で階層化されたアウトライン候補を抽出する文書特徴量抽出手段と、
アウトラインとして表示可能な最大量を算出する最大表示量算出手段と、
前記文書特徴量抽出手段により抽出されたアウトライン候補を、前記最大表示量算出手段により算出された表示可能なアウトラインの最大量を超えない範囲まで、該アウトライン候補の重要度に基づいて絞り込むアウトライン生成手段と、
前記アウトライン生成手段により生成されたアウトライン文書を出力する出力手段と
を有することを特徴とするアウトライン生成装置。 - 文書のアウトラインを生成するアウトライン生成装置であって、
文書を取得する文書取得手段と、
前記取得した文書を解析し、重要度で階層化されたアウトライン候補を抽出する文書特徴量抽出手段と、
アウトラインとして表示可能な最大量を算出する最大表示量算出手段と、
前記文書特徴量抽出手段により抽出されたアウトライン候補を、前記最大表示量算出手段により算出された表示可能なアウトラインの最大量を超えない範囲まで、該アウトライン候補の重要度に基づいて絞り込むアウトライン生成手段と、
前記アウトライン生成手段により生成されたアウトラインの表示形式を指定し、アウトライン文書を作成する表示形式指定手段と、
前記表示形式指定手段により作成されたアウトライン文書を出力する出力手段と
を有することを特徴とするアウトライン生成装置。 - 前記アウトライン生成手段におけるアウトライン候補の絞込みが、アウトライン候補のうち重要度の低いものから削除していく
ことを特徴とした請求項1又は2に記載のアウトライン生成装置。 - 前記アウトライン生成手段におけるアウトライン候補の絞込みが、アウトライン候補のうち重要度が同じものが複数あった場合に、同じ重要度の中で間引きを行う
ことを特徴とした請求項1又は2に記載のアウトライン生成装置。 - 文書のアウトラインを生成するアウトライン生成方法であって、
文書取得手段が文書を取得する文書取得ステップと、
文書特徴量抽出手段が、前記取得した文書を解析し、重要度で階層化されたアウトライン候補を抽出する文書特徴量抽出ステップと、
最大表示量算出手段が、アウトラインとして表示可能な最大量を算出する最大表示量算出ステップと、
アウトライン生成手段が、前記文書特徴量抽出手段により抽出されたアウトライン候補を、前記最大表示量算出手段により算出された表示可能なアウトラインの最大量を超えない範囲まで、該アウトライン候補の重要度に基づいて絞り込むアウトライン生成ステップと、
出力手段が、前記アウトライン生成手段により生成されたアウトライン文書を出力する出力ステップと
を有することを特徴とするアウトライン生成方法。 - 文書のアウトラインを生成するアウトライン生成方法であって、
文書取得手段が文書を取得する文書取得ステップと、
文書特徴量抽出手段が、前記取得した文書を解析し、重要度で階層化されたアウトライン候補を抽出する文書特徴量抽出ステップと、
アウトライン生成手段が、アウトラインとして表示可能な最大量を算出する最大表示量算出ステップと、
アウトライン生成手段が、前記文書特徴量抽出手段により抽出されたアウトライン候補を、前記最大表示量算出手段により算出された表示可能なアウトラインの最大量を超えない範囲まで、該アウトライン候補の重要度に基づいて絞り込むアウトライン生成ステップと、
表示形式指定手段が、前記アウトライン生成手段により生成されたアウトラインの表示形式を指定し、アウトライン文書を作成する表示形式指定ステップと、
出力手段が、前記表示形式指定手段により作成されたアウトライン文書を出力する出力ステップと
を有することを特徴とするアウトライン生成方法。 - 前記アウトライン生成ステップは、前記アウトライン候補のうち重要度の低いものから削除していき、アウトライン候補を絞り込む
ことを特徴とする請求項5又は6に記載のアウトライン生成方法。 - 前記アウトライン生成ステップは、前記アウトライン候補の重要度が同じものが複数あった場合に、同じ重要度の中で間引きを行う
ことを特徴とする請求項5又は6に記載のアウトライン生成方法。 - 請求項5から請求項8のいずれか1項に記載のアウトライン生成方法の各ステップを、コンピュータに実行させるためのプログラムとしたことを特徴とするアウトライン生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007005470A JP2008171302A (ja) | 2007-01-15 | 2007-01-15 | アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007005470A JP2008171302A (ja) | 2007-01-15 | 2007-01-15 | アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008171302A true JP2008171302A (ja) | 2008-07-24 |
Family
ID=39699322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007005470A Pending JP2008171302A (ja) | 2007-01-15 | 2007-01-15 | アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008171302A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012256204A (ja) * | 2011-06-09 | 2012-12-27 | Dainippon Printing Co Ltd | 記事配信システム、記事配信方法、サーバ及びプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09153065A (ja) * | 1995-12-01 | 1997-06-10 | Hitachi Ltd | 電子新聞記事表示データ量自動調整方法 |
JPH1153361A (ja) * | 1997-08-05 | 1999-02-26 | Hitachi Ltd | 文書と付加情報間の対応付け方法 |
JPH11184865A (ja) * | 1997-12-19 | 1999-07-09 | Matsushita Electric Ind Co Ltd | 文書要約装置 |
JP2001052032A (ja) * | 1999-05-28 | 2001-02-23 | Nippon Telegr & Teleph Corp <Ntt> | 要約文作成方法及び装置及び要約文作成プログラムを格納した記憶媒体 |
JP2005528672A (ja) * | 2001-08-31 | 2005-09-22 | ジナン グラスゴー, | 特許の起草および技術評価のための自動化されたシステムおよび方法 |
JP2005258676A (ja) * | 2004-03-10 | 2005-09-22 | Seiko Epson Corp | 文書出力装置及びその制御方法 |
-
2007
- 2007-01-15 JP JP2007005470A patent/JP2008171302A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09153065A (ja) * | 1995-12-01 | 1997-06-10 | Hitachi Ltd | 電子新聞記事表示データ量自動調整方法 |
JPH1153361A (ja) * | 1997-08-05 | 1999-02-26 | Hitachi Ltd | 文書と付加情報間の対応付け方法 |
JPH11184865A (ja) * | 1997-12-19 | 1999-07-09 | Matsushita Electric Ind Co Ltd | 文書要約装置 |
JP2001052032A (ja) * | 1999-05-28 | 2001-02-23 | Nippon Telegr & Teleph Corp <Ntt> | 要約文作成方法及び装置及び要約文作成プログラムを格納した記憶媒体 |
JP2005528672A (ja) * | 2001-08-31 | 2005-09-22 | ジナン グラスゴー, | 特許の起草および技術評価のための自動化されたシステムおよび方法 |
JP2005258676A (ja) * | 2004-03-10 | 2005-09-22 | Seiko Epson Corp | 文書出力装置及びその制御方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012256204A (ja) * | 2011-06-09 | 2012-12-27 | Dainippon Printing Co Ltd | 記事配信システム、記事配信方法、サーバ及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11294968B2 (en) | Combining website characteristics in an automatically generated website | |
KR101150132B1 (ko) | 시작 템플릿과 목표 템플릿 사이의 콘텐츠 맵핑을 위한방법 및 시스템 | |
US6964015B2 (en) | Redline extensible markup language (XML) schema | |
Cervone | MathJax: a platform for mathematics on the Web | |
JP5469244B2 (ja) | 選択的なコンテンツ抽出 | |
US9542363B2 (en) | Processing of page-image based document to generate a re-targeted document for different display devices which support different types of user input methods | |
US20140156590A1 (en) | Producing automated terms listings in html document publishing with enhanced terms definitions | |
US20100218086A1 (en) | Font handling for viewing documents on the web | |
AU2014309040B2 (en) | Presenting fixed format documents in reflowed format | |
CN108717437B (zh) | 搜索结果展示方法、装置及存储介质 | |
US20150006573A1 (en) | Information processing terminal and method, and information management apparatus and method | |
JP2010086517A (ja) | コンピュータによって実施される、ウェブページからデータを抽出する方法 | |
JP7290391B2 (ja) | 情報処理装置及びプログラム | |
US7461337B2 (en) | Exception markup documents | |
KR100463835B1 (ko) | 무선 단말기에서의 웹 컨텐츠 변환을 위한 인덱스 추출시스템 및 그 방법 | |
JP5462591B2 (ja) | 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及び関連コンテンツ挿入装置 | |
Artail et al. | Device-aware desktop web page transformation for rendering on handhelds | |
JP6621514B1 (ja) | 要約作成装置、要約作成方法、及びプログラム | |
JP2010165218A (ja) | 電子メール表示制御装置、電子メール表示制御方法、及び、プログラム | |
JP5317638B2 (ja) | Web文書主要コンテンツ抽出装置及びプログラム | |
JP2008171302A (ja) | アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム | |
JP2009265770A (ja) | 重要文提示システム | |
JP5682113B2 (ja) | 情報表示装置およびプログラム | |
US20030212959A1 (en) | System and method for processing Web documents | |
JP5068356B2 (ja) | ブログ本文特定装置及びブログ本文特定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090121 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090610 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100525 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110502 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111129 |