JP3712966B2 - Presentation material generating apparatus, presentation material generating method, and presentation material generating program - Google Patents
Presentation material generating apparatus, presentation material generating method, and presentation material generating program Download PDFInfo
- Publication number
- JP3712966B2 JP3712966B2 JP2001263023A JP2001263023A JP3712966B2 JP 3712966 B2 JP3712966 B2 JP 3712966B2 JP 2001263023 A JP2001263023 A JP 2001263023A JP 2001263023 A JP2001263023 A JP 2001263023A JP 3712966 B2 JP3712966 B2 JP 3712966B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- document
- concise
- accepted
- presentation material
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、プレゼンテーション資料生成装置、プレゼンテーション資料生成方法、及びプレゼンテーション資料生成プログラムに関し、例えば、論文や報告書などのプレゼンテーションの元になる資料からプレゼンテーション資料を自動生成するものなどに関する。
【0002】
【従来の技術】
産業、学術、教育など様々な分野でプレゼンテーションの重要性が高まっている。
プレゼンテーションでは、図表や簡潔な文などが記載されたプレゼンテーション資料を用いながら、演者が所定の主題について聴衆に説明する。
これらプレゼンテーションに使用される資料は、例えば紙に印刷されて聴衆に配布されたり、又は、プロジェクターを用いてスクリーンに投影されたりなどする。
【0003】
現在、このようなプレゼンテーション資料の作成を支援する様々なソフトウェア(以下プレゼンテーションソフトと記す)が市場で販売されている。
ユーザはこれらのプレゼンテーションソフトをパーソナルコンピュータなどにインストールしてプレゼンテーション資料作成に使用することができる。
【0004】
これら、プレゼンテーションソフトでは、例えば、スライドなどと呼ばれる表示単位が所望の数だけ生成することができ、ユーザはこれらスライドに図表を貼り付けたり、テキストを書き込んだりすることにより、プレゼンテーション資料を作成していく。
【0005】
作成したスライドは、紙に印刷して聴衆に配布したり、又はフィルムに印刷してプロジェクターで投影したり、或いは、直接パーソナルコンピュータからプロジェクターにデータを送信し、プロジェクターが当該スライドを投影するなどすることにより、聴衆に提示される。
【0006】
プレゼンテーションを行う場合は、通常プレゼンテーションの元となる論文や報告書、企画書などの資料がある。演者はこれら資料から図表を抜粋したり、重要なポイントを表す文言を抜き出すなどしてプレゼンテーション資料を作成する。
【0007】
このように、プレゼンテーション資料作成を支援する発明として「言語資源の共有と利用」シンポジウム(1999)に掲載の「GDAタグからのスライド生成」がある。
これは、人手で作成されたGDA(Global Document Anotation)コーパスからのプレゼンテーション資料(論文中では「スライド資料」と記載されている)の生成を行っている。
【0008】
【発明が解決しようとする課題】
しかし、このGDAコーパスを作る(タグ付け)のに、プレゼンテーション資料を作成するよりも多くのコスト(時間・労力)をかけなければならず、文書からプレゼンテーション資料を生成する目的には適していない。
また、現在販売されているプレゼンテーションソフトには、プレゼンテーション資料を自動的に作成・生成するという機能は含まれていない。そのため、ユーザは、プレゼンテーション資料の作成に、多くの時間と手間を費やしている。
【0009】
そこで、本発明の目的は、プレゼンテーション資料の元になるデータ(例えば論文や企画書など)を入力として、プレゼンテーション資料を自動生成することができるプレゼンテーション資料生成装置、プレゼンテーション資料生成方法、及びプレゼンテーション資料生成プログラムを提供することである。
【0010】
【課題を解決するための手段】
本発明は、前記目的を達成するために、請求項1に記載の発明では、文書を分割する分割数、抽出する最大文数、文末表現、及びレイアウトの設定を受け付ける受付手段と、文書を取得する文書取得手段と、前記取得した文書の文書構造を解析し、べた書き文の領域を判定する判定手段と、前記判定されたべた書き文を形態素解析、及び構文解析し、前記解析の結果と、所定の手がかり語を用いて、前記べた書き文から重要文を認定する認定手段と、前記判定手段による解析結果をもとに、前記文書を前記受け付けた分割数に分割する分割手段と、前記分割した各部分から、前記受け付けた最大文数内で重要度に応じて前記認定した重要文を抽出する抽出手段と、前記抽出した重要文を簡潔化すると共に、前記簡潔化した簡潔文の文末表現が前記受け付けた文末表現となる簡潔文を生成する簡潔文生成手段と、前記生成した簡潔文を前記受け付けたレイアウトにて出力する出力手段と、を備え、前記出力手段は、前記受け付けたレイアウトが、文のみのときは前記生成した簡潔文のみを出力し、文と図表の混在の場合は前記簡潔文と当該簡潔文とマッチングする図表を出力し、図表のみの場合は前記簡潔文にマッチングする図表のみを出力することを特徴とするプレゼンテーション資料生成装置を提供する。
請求項2に記載の発明では、簡略なプレゼンテーション資料を生成するか、あるいは詳細なプレゼンテーション資料を生成するかの選択を受け付ける簡略・詳細受付手段を具備し、前記抽出手段は、前記簡略・詳細受付手段にて受け付けた選択に基づいて、前記抽出する重要文の数を前記最大文数の範囲内で増減することを特徴とする請求項1に記載のプレゼンテーション資料生成装置を提供する。
請求項3に記載の発明では、受付手段と、文書取得手段と、判定手段と、認定手段と、分割手段と、抽出手段と、簡潔文生成手段と、出力手段と、を備えたコンピュータにおいて、前記受付手段で、文書を分割する分割数、抽出する最大文数、文末表現、及びレイアウトの設定を受け付ける受付ステップと、前記文書取得手段で、文書を取得する文書取得ステップと、前記判定手段で、前記取得した文書の文書構造を解析し、べた書き文の領域を判定する判定ステップと、前記認定手段で、前記判定されたべた書き文を形態素解析、及び構文解析し、前記解析の結果と、所定の手がかり語を用いて、前記べた書き文から重要文を認定する認定ステップと、前記分割手段で、前記判定手段による解析結果をもとに、前記文書を前記受け付けた分割数に分割する分割ステップと、前記抽出手段で、前記分割した各部分から、前記受け付けた最大文数内で重要度に応じて前記認定した重要文を抽出する抽出ステップと、前記簡潔文生成手段で、前記抽出した重要文を簡潔化すると共に、前記簡潔化した簡潔文の文末表現が前記受け付けた文末表現となる簡潔文を生成する簡潔文生成ステップと、前記出力手段で、前記生成した簡潔文を前記受け付けたレイアウトにて出力する出力ステップと、から構成され、前記出力ステップでは、前記受け付けたレイアウトが、文のみのときは前記生成した簡潔文のみを出力し、文と図表の混在の場合は前記簡潔文と当該簡潔文とマッチングする図表を出力し、図表のみの場合は前記簡潔文にマッチングする図表のみを出力することを特徴とするプレゼンテーション資料生成方法を提供する。
請求項4に記載の発明では、文書を分割する分割数、抽出する最大文数、文末表現、及びレイアウトの設定を受け付ける受付機能と、文書を取得する文書取得機能と、前記取得した文書の文書構造を解析し、べた書き文の領域を判定する判定機能と、前記判定されたべた書き文を形態素解析、及び構文解析し、前記解析の結果と、所定の手がかり語を用いて、前記べた書き文から重要文を認定する認定機能と、前記解析機能による解析結果をもとに、前記文書を前記受け付けた分割数に分割する分割機能と、前記分割した各部分から、前記受け付けた最大文数内で重要度に応じて前記認定した重要文を抽出する抽出機能と、前記抽出した重要文を簡潔化すると共に、前記簡潔化した簡潔文の文末表現が前記受け付けた文末表現となる簡潔文を生成する簡潔文生成機能と、前記生成した簡潔文を前記受け付けたレイアウトにて出力する出力機能と、をコンピュータで実現するプレゼンテーション資料生成プログラムであって、前記出力機能は、前記受け付けたレイアウトが、文の みのときは前記生成した簡潔文のみを出力し、文と図表の混在の場合は前記簡潔文と当該簡潔文とマッチングする図表を出力し、図表のみの場合は前記簡潔文にマッチングする図表のみを出力することを特徴とするプレゼンテーション資料生成プログラムを提供する。
【0011】
【発明の実施の形態】
プレゼンテーション資料を作成する場合、元になる文書が存在する場合が多い。本実施の形態では、その元文書から重要個所を抽出し、簡潔な表現に変換することにより、プレゼンテーション資料を自動生成する。
以下、本発明の好適な実施の形態の1例について、図1ないし図3を参照して詳細に説明する。
【0012】
図1は、本実施の形態に係るプレゼンテーション資料生成装置1の構成を概念的に示した図である。
プレゼンテーション資料生成装置1は、文書解析部2、形態素解析部4、重要文判定部6、構文解析部8、簡潔表現生成部10、文書構造生成部12などから構成されている。
【0013】
プレゼンテーション資料生成装置1は情報処理装置の一種であって、入力文書14と入力パラメータ16を受け取って、これらを用いてプレゼンテーション資料18を生成する。
入力文書14は、例えば学術論文や業務報告書、企画書などの文書ファイルであって、プレゼンテーション資料18を生成する元となる文書ファイルである。
【0014】
入力文書14は、例えば、ワードプロセッサやテキストエディタなどで作成された文書ファイルであり、図表データを含んでいても良い。
更に、入力文書14は、段落単位であっても良いし、1文書であっても良い。又は、入力文書14は、タイトルや章見出し、改行を伴った箇条書きなどの文書構造を持たないいわゆるべたの文書であっても良い。ここで、べたの文書とは、表示面全面に渡って書かれた文書のことである。
【0015】
文書構造解析部2は、入力文書14の文書構造を分析し、入力文書14から、章や節、箇条書き、図表などを抽出する。また、文書構造解析部2は、章や節、箇条書き、図表、タイトルと判定されなかった部分をべた書き文として抽出する。
入力文書14は、例えば、論文やレポート、企画書などであり、通常まず表題があり、内容が章、節などと細かい単位から組み立てられており、また、写真や図、グラフなどといった図表や箇条書きが組み込まれている場合もある。
このように入力文書14は、様々な文書構造を有している。
【0016】
文書構造解析部2は、入力文書14を取得し、章や節、箇条書き、図表、タイトル、べた書きの領域などの文書構造を判定する。テキスト文は、行頭にある章や節の番号、インデント量などを参考に、ワープロ文書は連番記号や書式(太文字や下線)なども判定材料に加えて文書構造を判定する。
【0017】
形態素解析部4は、文書構造解析部2によって抽出されたべた書き文を図示しない形態素解析辞書を用いて形態素解析する。
形態素解析部4が行う形態素解析は、入力文書14を形態素の並びに分解し、それぞれの形態素の属性(品詞、活用、数、性、人称、格など)を決定することであり、公知として一般に行われているものである。形態素解析部4は、解析結果を形態素列として構文解析部8に出力する。
なお、形態素とは、意味を持つ最小の言語単位である。
【0018】
構文解析部8は、形態素解析部4から出力される形態素列を入力として受け取り、係り受け解析や重要文や文の関係を示す手がかり語を認定する。これによって、構文解析部8は、プレゼンテーション資料で使用する文の素材となる抽出文を判定するための材料を収集することができる。
重要文の手がかりとなる語としては、例えば、「要するに」「即ち」などがあり、これらは図示しない構文解析辞書に格納されている。
【0019】
構文解析部8は、更に、後に重要文判定部6が抽出した抽出文に対して係り受け解析や削除可能領域(接続詞、副詞、連体修飾節など)の推定などを行い、簡潔表現生成部10に簡潔な表現を生成するための情報提供を行う。
【0020】
重要文判定部6は、入力パラメータ16によって指定された選択基準(例えば抽出する文の文数など)と構文解析結果をもとに入力文書14を木構造化し、指定された文数を抽出する構成要素である。
重要文判定部6は、文書構造解析部2で文書構造が判定された場合はその文書構造情報をもとに、入力文書14を指定された数の領域に分割する(但し、最大分割数は文数とする)。
【0021】
重要文判定部6は、その分割された領域ごとに、構文解析部8で認定した文の重要度と、文の出現位置をもとにして、最終的に抽出する文を選択し、選択した文を抽出する。
本実施の形態では、1つの領域で抽出される最大文数はユーザによって与えられる入力パラメータ16によって規定されるものとする。なお、最大文数は、予めデフォルト値を設定しておき、ユーザが必要に応じてこれを変更したり、或いは所定の値に固定するように構成することもできる。
【0022】
なお、入力パラメータ16は、図示しない入力パラメータ取得部がユーザから取得して重要文判定部6に渡す。
入力パラメータ16は、最大文数、図表優先又は文書優先、選択されたテンプレートの種類、文末表現の種類(ですます調、である調、タイトル表示など)などから構成されており、それぞれユーザが指定することができる。テンプレートを出力する文や図表のレイアウト(配置)を特定する情報である。即ち、出力する文や図表のレイアウトは入力パラメータとして特定される。
入力パラメータ16で図表優先を選択すると図表が優先的に抽出され、文書中心を選択すると文書が優先的に抽出される。このように、文と図表を混合して抽出したい場合、どちらを優先的に抽出するかを規定することができる。
【0023】
また、重要文判定部6は、入力文書に図表が含まれている場合に、ユーザが「図表優先」というパラメータを入力パラメータ16にて指定することで、抽出される文の代わりに図表を抽出することもできる。
【0024】
抽出した図表をどの領域に割り当てるかは、例えば、入力文書14中に記載された「図1は〇△装置の構成を表した図である」といったような表現と、抽出した図に付随している「図1〇△装置の構成」といったようなキャプションをマッチングすることにより行う。マッチングが失敗した場合は、領域を1つ追加し、とりあえずその領域に図表を割り当てる。
【0025】
簡潔表現生成部10は、入力パラメータ16として予め入力されたパラメータ(文末表現などを規定する)をもとに選択された重要文を簡潔表現に変換する。簡潔表現生成部10は、構文解析部8で推定された削除可能領域を削除すると共に、予め指定された文末表現(ですます調、である調、タイトル調)への変換を行う。「タイトル調」が指定された場合は、体言止めや主名詞の連体節化などにより変換する。
ここで、体言止めや主名詞の連体節化の例を以下に示す。
例文:山本が連続安打記録を20にのばした
体言止め:山本、連続安打記録を20に
主名詞の連体節化:連続安打記録を20にのばした山本
【0026】
文書構造生成部12は、ユーザによって指定されたテンプレートに出力データ(簡潔表現生成部10で生成された簡潔表現、重要文判定部で抽出された図表など)を流し込む。文書構造は、予めユーザが指定したテンプレートに流し込むことによって作成する。
【0027】
テンプレートとしては、「文のみ」「文と図表の混在」「図表のみ」などが選択可能になっている。
「文のみ」が選択された場合は、入力文書14から生成した簡潔表現からプレゼンテーション資料を生成する。この場合、入力文書14から図表が抽出された場合でも、図表はプレゼンテーション資料に使用されない。
【0028】
「文と図表の混在」が選択された場合は、入力文書14から生成された簡潔表現と入力文書14から抽出した図表を用いてプレゼンテーション資料が生成される。図表の位置は、入力文書14中の「図1は〜」といった記載と、図表のキャプションを比較して決められる。
【0029】
「図表のみ」が選択された場合は、入力文書14から抽出した図表を用いてプレゼンテーション資料が生成される。
テンプレートは、入力される入力文書14ごとに予め用意することができる。
また、「文のみ」のテンプレートが選択された場合は、更に「箇条書き」というオプションを用意しておき、簡潔表現生成部10が生成した簡潔表現に、例えば1、2、3、・・・、などの行頭マークを付加して箇条書きを生成するように構成することもできる。
【0030】
また、入力パラメータ16に「詳細/簡略」という項目を設けておき、ユーザが「詳細」を選択した場合は、抽出する重要文を多くするなどして詳細なプレゼンテーション資料18を生成し、「簡略」を選択した場合は、抽出する重要文を少なくするなどして簡略なプレゼンテーション資料18を生成するように構成することもできる。
【0031】
これによってプレゼンテーション時間が長い場合は「詳細」を選択し、プレゼンテーション時間が短い場合は「簡略」を選択することにより適切なプレゼンテーション資料18を生成することができる。
このように、構成することにより、プレゼンテーション時間に応じたプレゼンテーション資料18を生成することができる。
【0032】
図2(a)は、プレゼンテーション資料生成装置1をPCを用いて構成した場合の構成図である。
プレゼンテーション資料生成装置1は、制御部26にバスライン43を介して入力装置34、出力装置38、通信制御装置42、記憶装置48、記憶媒体駆動装置46、入出力インターフェース44などが接続して構成されている。
【0033】
制御部26は、プレゼンテーション資料生成プログラム50などに従って入力文書14からプレゼンテーション資料18を生成したり、プレゼンテーション資料生成装置1全体を制御したりなどする。
制御部26は、CPU28、ROM(Read Only Memory)30、RAM(Random Access Memory)32などから構成されている。
【0034】
ROM30は、CPU28が各種演算や制御を行うための各種プログラム、データ及びパラメータなどを格納したリードオンリーメモリ(読み出し専用メモリ)である。CPU28は、ROM30からプログラムやデータ、パラメータなどを読み込むことはできるが、これらを書き換えたり消去することはできない。
【0035】
RAM32は、CPU28にワーキングメモリとして使用されるランダムアクセスメモリである。CPU28は、RAM32にプログラムやデータなどを書込んだり消去したりすることができる。本実施の形態では、RAM32には、CPU28が入力文書14の格納、文書構造解析、形態素解析、重要文判定、構文解析、簡潔表現生成、文書構造生成、などを行うためのエリアが確保可能となっている。
【0036】
入力装置34は、例えばキーボードやマウスなどの入力装置から構成されている。
キーボードは、プレゼンテーション資料生成装置1に対して文字や数字などの情報を入力するための装置である。
キーボードは、カナや英文字などを入力するためのキーや数字を入力するためのテンキー、各種機能キー、カーソルキー及びその他のキーによって構成されている。
【0037】
キーボートは、例えばユーザがプレゼンテーション資料生成装置1にログインするためのログインIDやパスワードを入力したり、あるいはプレゼンテーション資料生成プログラム50に従って表示装置に表示される画面の各種入力欄に必要なデータ(例えば入力パラメータ18など)を入力する際に使用する。
【0038】
また、プレゼンテーション資料生成装置1がテキストエディタやワープロソフトなどを実装している場合は、これらのソフトウェアを用いてキーボードから入力文書14を直接プレゼンテーション資料生成装置1に入力することも可能である。
【0039】
マウスは、ポインティングデバイスである。GUI(Graphical User Interface)などを用いてプレゼンテーション資料生成装置1を操作する場合、表示装置上に表示されたボタンやアイコンなどをマウスでクリックすることにより、所定の情報の入力を行うことができる。
【0040】
出力装置38は、例えば表示装置や印刷装置などの出力装置から構成されている。
表示装置は、例えばCRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、プラズマディスプレイなどで構成された情報を画面上に提示するための装置である。
表示装置は、キーボードやマウスの入力結果や、入力文書14、生成したプレゼンテーション資料18などを表示することができる。
【0041】
印刷装置は、例えば、生成したプレゼンテーション資料18や、入力文書14などをテキストの形で紙などの印刷媒体に印刷する装置である。印刷装置は、例えば、インクジェットプリンタ、レーザプリンタ、熱転写プリンタ、ドットプリンタなどの各種プリンタ装置によって構成されている。
【0042】
通信制御装置42は、図示しない回線を介してプレゼンテーション資料生成装置1をサーバ装置などに接続するための装置であって、モデム、ターミナルアダプタその他の装置によって構成されている。
【0043】
通信制御装置42は、例えばインターネットやLAN(Local AreaNetwork)などに接続しており、これらのネットワークに接続した他の端末装置あるいはサーバ装置などから通信によって入力文書14を取得したり、あるいはこれらの装置に対してプレゼンテーション資料18を送信したりすることなどができる。
【0044】
通信制御装置42はCPU28によって制御され、例えば、TCP/IPなどの所定のプロトコルに従ってこれら端末装置やサーバ装置との信号及びデータの送受信を行う。
【0045】
記憶装置48は、読み書き可能な記憶媒体と、その記憶媒体に対してプログラムやデータを読み書きするための駆動装置によって構成されている。当該記憶媒体として主にハードディスクが使用されるが、その他に、例えば、光磁気ディスク、磁気ディスク、半導体メモリなどの他の読み書き可能な記憶媒体によって構成することも可能である。
【0046】
記憶装置48は、プレゼンテーション資料生成プログラム50、その他のプログラム52、解析辞書54、その他のデータ60などが記憶されている。
プレゼンテーション資料生成プログラム50は、CPU28にプレゼンテーション資料生成機能を発揮させるためのプログラムであって、後に説明する各モジュールから構成されている。
【0047】
その他のプログラム52は、例えば、通信制御装置42を制御し、プレゼンテーション資料生成装置1とネットワークでつながれた端末装置やサーバ装置との通信を維持する通信プログラムや、メモリ管理や入出力管理などのプレゼンテーション資料生成装置1を動作させるための基本ソフトウェアであるOS(Operating System)などで構成されている。
【0048】
解析辞書54は、CPU28が形態素解析、構文解析などを行う際に使用する形態素解析辞書や構文解析辞書などが格納されている。また、重要文判定部6が重要文を判定する際に使用する重要語などを格納した重要語辞書なども格納されている。
【0049】
CPU28は、記憶装置48の駆動装置を駆動することにより、記憶装置48に対してプログラムやデータの読み書きを行うことができる。
また、その他のデータ60に入力文書14を格納しておき、記憶装置48を駆動してCPU28が入力文書14を読み込んで取得することもできる。このように、記憶装置48は、入力文書14の取得手段として使用することができる。
【0050】
記憶媒体駆動装置46は、着脱可能な記憶媒体を駆動してデータの読み書きを行うための駆動装置である。着脱可能な記憶媒体としては、例えば、光磁気ディスク、磁気ディスク、磁気テープ、半導体メモリ、データをパンチした紙テープ、CD−ROMなどがある。なお、CD−ROMは、読み込みのみ可能である。
【0051】
プレゼンテーション資料生成装置1は、記憶媒体駆動装置46によって記憶媒体を駆動することにより、入力文書14を記録した記憶媒体から入力文書14を取得したり、あるいは、生成したプレゼンテーション資料18を記憶媒体駆動装置に出力することができる。このように、記憶媒体駆動装置46は、入力文書取得手段として使用することができる。
【0052】
入出力インターフェース44は、例えば、シリアルインターフェースやその他の規格のインターフェースにより構成されている。入出力インターフェース44に当該インターフェースに対応した外部機器を接続することにより、プレゼンテーション資料生成装置1の機能を拡張することができる。このような外部機器として例えば、ハードディスクなどの記憶装置、スピーカ、マイクロフォンなどがある。
【0053】
図2(b)は、プレゼンテーション資料生成プログラム50を構成するモジュールを示した図である。
プレゼンテーション資料生成プログラム50は、文書構造解析モジュール62、形態素解析モジュール64、重要文判定モジュール66、構文解析モジュール68、簡潔表現生成モジュール70、文書構造生成モジュール72などプログラムから構成されている。
CPU28がプレゼンテーション資料生成プログラム50の各モジュールをロードして実行することにより、当該PCはプレゼンテーション資料生成装置としての機能を発揮することができる。
【0054】
CPU28が文書構造解析モジュール62を実行することにより、文書構造解析部2(図1)が実現される。
同様に、CPU28は、形態素解析モジュール64、重要文判定モジュール66、構文解析モジュール68、簡潔表現生成モジュール70、文書構造生成モジュール72をロードして実行することにより、それぞれ、形態素解析部4、重要文判定部6、構文解析部8、簡潔表現生成部10、文書構造生成部12を構成することができる。
【0055】
即ち、図1のプレゼンテーション資料生成装置1は、プレゼンテーション資料生成プログラム50がCPU28によって実行されることにより、ソフトウェア的に実現される。
【0056】
また、プレゼンテーション資料生成プログラム50は、図示しない入力パラメータ取得モジュールを含んでいる。
CPU28は、入力パラメータ取得モジュールによって、表示装置にパラメータ入力画面を表示する。ユーザは、キーボードやマウスなどを用いてパラメータ入力画面から最大文数、図表優先の有無、テンプレートの種類、文末表現の種類などを入力することができるようになっている。
【0057】
プレゼンテーション資料生成プログラム50に、生成したプレゼンテーション資料18を編集する編集モジュールを追加し、生成したプレゼンテーション資料18をユーザが編集できる編集機能を持たせるように構成することもできる。この編集機能としては、例えば以下のような機能が考えられる。
【0058】
編集モジュールの機能として図表の大きさを調節できるようにすることができる。この場合、CPU28は、生成したプレゼンテーション資料18を表示装置に表示する。ユーザは、マウスを用いて、表示されたプレゼンテーション資料18上の図表の端にポインタを合わせてマウスのボタンを抑え、これをドラッグする。するとCPU28は、ポインタの移動に合わせて図表を拡大縮小する。ユーザは図表が適当な大きさになった時点でマウスのボタンを離すとCPU28は図表をこの時点の大きさに固定する。
【0059】
編集モジュールの機能として図表や文字列の位置を移動することができる。この場合、ユーザはマウスを操作して図表や文字列の中心あたりにポインタを置き、ドラッグする。するとCPU28は、図表や文字列の位置をポインタの移動と共に移動させる。ユーザが適当なところでマウスのボタンを離すと、CPU28は図表や文字列をその位置に固定する。
【0060】
編集モジュールの機能として文字のフォントや大きさ、色を変更することができる。ユーザはマウスやキーボードなどを用いてプレゼンテーション資料18上の特定の文字又は文字列などを指定し、指定された文字又は文字列のフォント、大きさ、色などを指定することができる。するとCPU28は、指定された文字又は文字列などをユーザから指定されたフォント、大きさ、色に変更する。
更には、文字又は文字列を斜体文字にしたり、所定の文字又は文字列の下に下線を引いたりなどして、所定の文字又は文字列を強調することなどもできる。
【0061】
編集モジュールの機能として図表や文字列を追加することができる。図表を追加する場合は、予めビットマップ形式又は他の形式の図表を、記憶装置48、又は記憶媒体駆動装置46で駆動可能な記憶媒体などに用意しておく。ユーザは、表示装置に表示されたプレゼンテーション資料18の特定の位置を指定し、その位置に追加する図表を指定する。するとCPU28は、ユーザが指定した位置に当該図表を貼り付ける。
【0062】
文字列を追加する場合は、ユーザは、表示装置に表示されたプレゼンテーション資料18上の特定の場所を指定し、その位置にキーボードをから所望の文字列を入力することができる。するとCPU28は、指定された場所にユーザが入力した文字列を挿入する。
また、プレゼンテーション資料18上の文字や図表は所定の操作により削除することができる。この場合は、CPU28は、ユーザが指定した文字や図表をスライド上から削除する。
【0063】
以上、本実施の形態では、1例としてプレゼンテーション資料生成装置1をPCを用いて実現したが、これに限定するものではなく、例えばワードプロセッサにプレゼンテーション資料生成機能を備えることもできる。
また、サーバ装置にプレゼンテーション資料生成プログラムを実装して、ネットワークを介してプレゼンテーション資料生成サービスをユーザに提供することもできる。
この場合は、端末装置から入力文書14を取得し、サーバ装置でプレゼンテーション資料18を生成した後、これを端末装置に返送する。
【0064】
プレゼンテーション資料生成プログラム50を記憶したCD−ROMなどの記憶媒体を頒布して、ユーザがそれぞれ自分のPCにプレゼンテーション資料生成プログラム50をインストールすることも可能であり、又はワードプロセッサプログラムにプレゼンテーション資料生成プログラム50を組み込んでこれを頒布することも可能である。
【0065】
図3は、プレゼンテーション資料生成装置1の動作を説明するためのフローチャートである。
まず、CPU28は、入力文書14を取得する(ステップ10)。入力文書14は、予め記憶装置48に記憶されているか、記憶媒体に記憶されており記憶媒体駆動装置46から読み込まれるか、あるいは通信制御装置42を介してネットワーク経由で取得するなどする。
入力文書14は、プレゼンテーション資料を生成する元となる論文や企画書などのデータであり、テキストの他に図表を含んでいても良い。
【0066】
次に、CPU28は、入力パラメータ16を取得する(ステップ15)。CPU28は、入力パラメータを表示装置に表示されたパラメータ入力画面からユーザが入力した値から取得することができる。この入力パラメータ取得機能は、入力パラメータ取得モジュールにより実現される。
【0067】
次に、CPU28は、入力文書14の文書構造を解析する(ステップ17)。この解析により、章、節、箇条書き、図表、タイトルなどの文書構造を判定すると共に、形態素解析すべきいわゆるべた書き文を抽出する。この文書構造解析機能は、文書構造解析モジュール62により実現される。
【0068】
次に、CPU28は、入力文書14から抽出したべた書き文に対して形態素解析を行う(ステップ20)。CPU28は、形態素解析の結果、形態素列を生成する。この形態素解析機能は、形態素解析モジュール64により実現される。
次に、CPU28は、形態素列を用いて入力文書14のべた書き文を構文解析する(ステップ25)。この構文解析では重要文を抽出するための文を判定する材料を調べる。例えば、該構文解析により、重要文の手がかりとなる重要語(「要するに」など)を認定する。この構文解析機能は構文解析モジュール68により実現される。
【0069】
次に、CPU28は、構文解析によって得られた手がかりを元に、抽出するための重要文を推定する(ステップ30)。この推定機能は構文解析モジュール68によって実現される。
次に、CPU28は、入力パラメータ16から、入力文書14から抽出するものが、文であるのか、文及び図表であるのか、或いは図表であるかを判断する(ステップ35)。この判断機能は重要文判定モジュール66で実現される。
【0070】
抽出するものが文である場合は(ステップ35;文を抽出)、CPU28は、ステップ30で重要文と推定された文を入力文書14から抽出する(ステップ40)。
抽出するものが文と図表である場合は(ステップ35;文と図表を抽出)、CPU28は、ステップ30で重要文と推定された文と、図表を入力文書14から抽出する(ステップ45)。
【0071】
抽出するものが図表である場合は(ステップ35;図表を抽出)、CPU28は、入力文書14から図表を抽出する(ステップ50)。
以上のステップ40、ステップ45、ステップ50の抽出機能は重要文判定モジュール66によって実現される。
【0072】
次に、CPU28は、ステップ40又はステップ45で抽出した重要文を構文解析し、係り受け解析や削除可能領域(接続詞、副詞、連体修飾節など)の推定を行う(ステップ55)。この構文解析機能は、構文解析モジュール68によって実現される。
【0073】
次に、CPU28は、ステップ55にて構文解析が終了した重要文から、推定された削除可能領域を削除したり、重要文の文末を入力パラメータ16によって指定された文末表現に変換したりなどして、簡潔な文を生成する(ステップ60)。この簡潔文生成機能は、簡潔表現生成モジュール60によって実現される。
【0074】
次に、CPU28は、入力パラメータ16で設定されたテンプレートに、生成した簡潔な文や図表を入れてプレゼンテーション資料18を生成する(ステップ65)。このプレゼンテーション資料生成機能は、文書構造生成モジュール72によって実現される。
【0075】
プレゼンテーション資料18は、所定の形式のファイルにて出力され、例えば、記憶装置48や記憶媒体駆動装置46に装着された記憶媒体などに記憶される。
【0076】
以上の本実施の形態では以下のような効果を得ることができる。
入力パラメータ16を指定することで、様々なプレゼンテーション資料が容易に作成することができる。
【0077】
例えば、文と図表の混在したプレゼンテーション資料や、ですます調/である調/タイトル調などの特定の文体を設定したりすることができる。
これによって、図表中心のプレゼンテーション資料を作成したり、文書中心のプレゼンテーション資料を作成したりすることができ、また、例えば、顧客が対象の時にはですます調とし、社内が対象のときはタイトル調とすることができる。
【0078】
また、本実施の形態により、べた書き(文書構造がない)文書から簡潔表現を自動生成することができる。
更に、べた書きで書かれやすい短い文書にも適用可能なので、複数文書からのプレゼン資料の生成が可能になる。このため、営業日報などをもとにプレゼンテーション資料を作成したり、Web情報を元に市場分析資料を生成したりすることもできる。
【0079】
入力文書14としてプレゼンテーション資料を入力してプレゼンテーション資料18を生成することにより、文末表現の統一などを行うことができ、校正支援を行うことも可能となる。
【0080】
【発明の効果】
本発明によれば、プレゼンテーション資料の元になるデータを入力として、プレゼンテーション資料を自動生成することができる。
【図面の簡単な説明】
【図1】本実施の形態に係るプレゼンテーション資料生成装置の構成を概念的に示した図である。
【図2】(a)は、プレゼンテーション資料生成装置をPCを用いて構成した場合の構成図でり、(b)は、プレゼンテーション資料生成プログラムを構成するモジュールを示した図である。
【図3】プレゼンテーション資料生成装置の動作を説明するためのフローチャートである。
【符号の説明】
1 プレゼンテーション資料生成装置
2 文書構造解析部
4 形態素解析部
6 重要文判定部
8 構文解析部
10 簡潔表現生成部
12 文書構造生成部
14 入力文書
16 入力パラメータ
18 プレゼンテーション資料
26 制御部
28 CPU
30 ROM
32 RAM
34 入力装置
38 出力装置
40 印刷装置
42 通信制御装置
43 バスライン
44 入出力インターフェース
46 記憶媒体駆動装置
48 記憶装置
50 プレゼンテーション資料生成プログラム
52 その他のプログラム
54 解析辞書
60 その他のデータ
62 文書構造解析モジュール
64 形態素解析モジュール
66 重要文判定モジュール
68 構文解析モジュール
70 簡潔表現生成モジュール
72 文書構造生成モジュール[0001]
BACKGROUND OF THE INVENTION
The present inventionPresentation material generating apparatus, presentation material generating method, and presentation material generating programFor example, it relates to a device that automatically generates presentation materials from materials that are the basis of presentations such as papers and reports.
[0002]
[Prior art]
The importance of presentation is increasing in various fields such as industry, academics, and education.
In the presentation, the performer explains a predetermined subject to the audience using presentation materials including diagrams and simple sentences.
The materials used for these presentations are printed on paper and distributed to the audience, or projected onto a screen using a projector, for example.
[0003]
Currently, various software (hereinafter referred to as presentation software) that supports the creation of such presentation materials is sold in the market.
The user can install these presentation software on a personal computer or the like and use them for creating presentation materials.
[0004]
In these presentation software, for example, a desired number of display units called slides can be generated, and the user can create presentation materials by pasting charts or writing text on these slides. Go.
[0005]
The created slide is printed on paper and distributed to the audience, or printed on film and projected by a projector, or data is directly transmitted from a personal computer to the projector, and the projector projects the slide. Is presented to the audience.
[0006]
In the case of giving a presentation, there are usually papers, reports, planning documents, etc. that are the basis of the presentation. The performer creates presentation materials by excerpting diagrams from these materials, or by extracting words that represent important points.
[0007]
As described above, there is “slide generation from GDA tag” published in the “Language Resource Sharing and Utilization” Symposium (1999) as an invention that supports the creation of presentation materials.
This is to generate presentation materials (which are described as “slide materials” in the paper) from a manually created GDA (Global Document Annotation) corpus.
[0008]
[Problems to be solved by the invention]
However, making this GDA corpus (tagging) requires more cost (time and labor) than creating presentation materials, and is not suitable for the purpose of generating presentation materials from documents.
Moreover, the presently sold presentation software does not include a function for automatically creating and generating presentation materials. Therefore, the user spends a lot of time and effort in creating the presentation material.
[0009]
Therefore, an object of the present invention is to automatically generate presentation materials by using data (for example, a paper or a plan) as a source of presentation materials.Presentation material generating apparatus, presentation material generating method, and presentation material generating programIs to provide.
[0010]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides a method according to claim 1,Receiving means for receiving the number of divisions for dividing the document, the maximum number of sentences to be extracted, the sentence end expression, and the layout;A document acquisition means for acquiring a document;Analyzing the document structure of the acquired document, determining means for determining the area of the solid written sentence, morphological analysis and syntactic analysis of the determined solid written sentence, the result of the analysis and a predetermined clue word Using the authorizing means for authorizing an important sentence from the solid written sentence, the dividing means for dividing the document into the accepted number of divisions based on the analysis result by the determining means, and the divided parts, Extracting means for extracting the recognized important sentence in accordance with the importance within the accepted maximum number of sentences, and simplifying the extracted important sentence, and the simplified sentence ending expression is the accepted sentence ending A concise sentence generating means for generating a concise sentence to be expressed; and an output means for outputting the generated concise sentence in the accepted layout, wherein the output means In the case of, only the generated concise sentence is output, in the case of a mixture of sentences and charts, the concise sentence and a chart that matches the concise sentence are output, and in the case of only the chart, only the chart that matches the concise sentence is output. Presentation material generating device characterized by outputI will provide a.
In the invention according to claim 2,Simplified / detail receiving means for receiving selection of whether to generate simple presentation material or detailed presentation material is provided, and the extracting means is based on the selection received by the simplified / detail receiving means. The presentation material generating apparatus according to claim 1, wherein the number of important sentences to be extracted is increased or decreased within the range of the maximum number of sentences.
In invention of Claim 3,In a computer including a receiving unit, a document acquiring unit, a determining unit, an authorizing unit, a dividing unit, an extracting unit, a concise sentence generating unit, and an output unit, the receiving unit divides the document. The accepting step for accepting the setting of the number of divisions, the maximum number of sentences to be extracted, the sentence end expression, and the layout, the document obtaining step for obtaining the document by the document obtaining means, and the document structure of the obtained document by the judging means Analyzing and determining the area of the solid written sentence, and using the certifying means, morphological analysis and syntactic analysis of the determined solid written sentence, using the result of the analysis and a predetermined clue word, A recognition step for recognizing an important sentence from the solid written sentence, and a dividing step for dividing the document into the accepted number of divisions based on the analysis result by the determining means by the dividing means. An extraction step of extracting the recognized important sentence according to importance within the accepted maximum number of sentences from the divided parts by the extracting means; and the extracted important sentence by the concise sentence generating means Concise sentence generation step for generating a concise sentence in which the sentence end expression of the simplified concise sentence becomes the accepted sentence ending expression, and the output means converts the generated concise sentence into the accepted layout. An output step for outputting, and in the output step, if the accepted layout is a sentence only, the generated concise sentence is output. A presentation material generation method characterized by outputting a chart that matches a concise sentence and outputting only a chart that matches the concise sentence if only the chart is output. Subjected to.
In the invention according to claim 4,Accepts the number of divisions to divide a document, the maximum number of sentences to be extracted, sentence ending expression, and layout settings, the document acquisition function to acquire a document, the document structure of the acquired document, A determination function for determining an area, and a certifying function for performing morphological analysis and syntactic analysis on the determined solid written sentence, and certifying an important sentence from the solid written sentence using a result of the analysis and a predetermined clue word And a division function that divides the document into the accepted number of divisions based on the analysis result by the analysis function, and the recognition according to the degree of importance within the maximum number of sentences received from each of the divided parts. An extraction function for extracting the important sentence, and a concise sentence generation function for simplifying the extracted important sentence and generating a concise sentence in which the sentence ending expression of the simplified concise sentence becomes the accepted sentence ending expression, An output function to output a brief statement that the serial generated by the accepted layout, the presentation documentation generation program to be implemented by a computer, the output function, the accepted layout, of the sentence Only the generated concise sentence is output, and if the sentence and the chart are mixed, the concise sentence and the chart that matches the concise sentence are output, and if only the chart, only the chart that matches the concise sentence is output. Is provided. A presentation material generation program is provided.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
When creating presentation materials, there are many cases where the original document exists. In the present embodiment, presentation material is automatically generated by extracting important parts from the original document and converting them into a concise expression.
Hereinafter, an example of a preferred embodiment of the present invention will be described in detail with reference to FIGS.
[0012]
FIG. 1 is a diagram conceptually showing the configuration of the presentation material generating apparatus 1 according to the present embodiment.
The presentation material generation apparatus 1 includes a document analysis unit 2, a morpheme analysis unit 4, an important sentence determination unit 6, a syntax analysis unit 8, a concise expression generation unit 10, a document structure generation unit 12, and the like.
[0013]
The presentation material generation apparatus 1 is a kind of information processing apparatus, and receives an
The
[0014]
The
Further, the
[0015]
The document structure analysis unit 2 analyzes the document structure of the
The
Thus, the
[0016]
The document structure analysis unit 2 acquires the
[0017]
The morpheme analysis unit 4 performs a morpheme analysis on the written text extracted by the document structure analysis unit 2 using a morpheme analysis dictionary (not shown).
The morpheme analysis performed by the morpheme analysis unit 4 is to decompose the
A morpheme is the smallest meaningful language unit.
[0018]
The syntax analysis unit 8 receives the morpheme string output from the morpheme analysis unit 4 as an input, and recognizes a clue word indicating dependency analysis or relationship between important sentences and sentences. Thereby, the syntax analysis unit 8 can collect the material for determining the extracted sentence that is the material of the sentence used in the presentation material.
Examples of the key words for the important sentence include “In short” and “That”, and these are stored in a syntax analysis dictionary (not shown).
[0019]
The syntax analysis unit 8 further performs dependency analysis or estimation of a erasable region (connective, adverb, conjunction modifier, etc.) on the extracted sentence extracted later by the important sentence determination unit 6, and the concise expression generation unit 10. Provide information to generate simple expressions.
[0020]
The important sentence determination unit 6 tree-structures the
When the document structure analysis unit 2 determines the document structure, the important sentence determination unit 6 divides the
[0021]
The important sentence determination unit 6 selects and selects the sentence to be finally extracted based on the importance of the sentence recognized by the syntax analysis unit 8 and the appearance position of the sentence for each of the divided areas. Extract sentences.
In the present embodiment, it is assumed that the maximum number of sentences extracted in one area is defined by the input parameter 16 given by the user. The maximum number of sentences can be configured so that a default value is set in advance, and the user can change it as necessary or fix it to a predetermined value.
[0022]
The input parameter 16 is acquired from a user by an input parameter acquisition unit (not shown) and passed to the important sentence determination unit 6.
The input parameters 16 are composed of the maximum number of sentences, chart priority or document priority, selected template type, sentence ending expression type (mass key, key, title display, etc.), etc., each specified by the user can do. This is information for specifying the layout (arrangement) of a sentence or a diagram for outputting a template. In other words, the sentence and chart layout to be output are specified as input parameters.
When the chart priority is selected by the input parameter 16, the chart is extracted with priority, and when the document center is selected, the document is extracted with priority. In this way, when it is desired to extract a sentence and a chart by mixing them, it can be specified which one is preferentially extracted.
[0023]
In addition, when the input document includes a chart, the important sentence determination unit 6 extracts a chart instead of the sentence to be extracted by designating the parameter “preferred chart” with the input parameter 16. You can also
[0024]
The area to which the extracted chart is assigned is, for example, an expression such as “FIG. 1 is a diagram representing the configuration of the device” described in the
[0025]
The concise expression generation unit 10 converts an important sentence selected based on a parameter (specifying a sentence end expression or the like) input in advance as the input parameter 16 into a concise expression. The concise expression generation unit 10 deletes the erasable area estimated by the syntax analysis unit 8 and converts it to a sentence end expression specified in advance (mass key, key, title key). When "title style" is specified, conversion is performed by stopping the body or categorizing the main nouns.
Here, examples of body deterrence and synonymization of main nouns are shown below.
Example sentence: Yamamoto has extended his consecutive hit record to 20
Suppression: Yamamoto, 20 consecutive hit records
Combining the main nouns: Yamamoto with 20 consecutive hits
[0026]
The document structure generation unit 12 flows the output data (the concise expression generated by the concise expression generation unit 10, the chart extracted by the important sentence determination unit, etc.) into the template specified by the user. The document structure is created by pouring into a template designated by the user in advance.
[0027]
As the template, “sentence only”, “mixture of sentences and charts”, “tables and charts”, and the like can be selected.
When “sentence only” is selected, the presentation material is generated from the concise expression generated from the
[0028]
When “mixture of sentence and chart” is selected, a presentation material is generated using the concise expression generated from the
[0029]
When “only chart” is selected, the presentation material is generated using the chart extracted from the
A template can be prepared in advance for each
In addition, when the “sentence only” template is selected, an option “itemized” is prepared, and the concise expression generated by the concise expression generating unit 10 is, for example, 1, 2, 3,. , Etc. may be added to generate bullets.
[0030]
In addition, when the item “detailed / simplified” is provided in the input parameter 16 and the user selects “detailed”, a
[0031]
As a result, when the presentation time is long, “details” is selected, and when the presentation time is short, “simple” is selected to generate an
By configuring in this way, the
[0032]
FIG. 2A is a configuration diagram when the presentation material generating apparatus 1 is configured using a PC.
The presentation material generating apparatus 1 is configured by connecting an
[0033]
The
The
[0034]
The
[0035]
The
[0036]
The
The keyboard is a device for inputting information such as letters and numbers to the presentation material generating device 1.
The keyboard includes keys for inputting kana and English characters, numeric keys for inputting numbers, various function keys, cursor keys, and other keys.
[0037]
For example, the keyboard inputs a login ID and a password for the user to log in to the presentation material generation apparatus 1, or data necessary for various input fields on the screen displayed on the display device according to the presentation material generation program 50 (for example, input) Used to input parameter 18).
[0038]
In addition, when the presentation material generation apparatus 1 is equipped with a text editor, word processor software, or the like, the
[0039]
A mouse is a pointing device. When the presentation material generation apparatus 1 is operated using a GUI (Graphical User Interface) or the like, predetermined information can be input by clicking a button or icon displayed on the display device with a mouse.
[0040]
The
The display device is a device for presenting information formed on, for example, a CRT (Cathode Ray Tube) display, a liquid crystal display, a plasma display, or the like on a screen.
The display device can display the input result of the keyboard and mouse, the
[0041]
The printing apparatus is an apparatus that prints the generated
[0042]
The
[0043]
The
[0044]
The
[0045]
The
[0046]
The
The presentation
[0047]
The
[0048]
The
[0049]
The
Alternatively, the
[0050]
The storage
[0051]
The presentation material generation apparatus 1 acquires the
[0052]
The input /
[0053]
FIG. 2B is a diagram showing modules constituting the presentation
The presentation
When the
[0054]
When the
Similarly, the
[0055]
That is, the presentation material generation apparatus 1 of FIG. 1 is realized by software by the presentation
[0056]
The presentation
The
[0057]
An editing module for editing the generated
[0058]
As a function of the editing module, the size of the chart can be adjusted. In this case, the
[0059]
As a function of the editing module, the position of a chart or character string can be moved. In this case, the user operates the mouse to place a pointer around the center of the chart or character string and drags it. Then, the
[0060]
As a function of the editing module, the font, size, and color of characters can be changed. The user can specify a specific character or character string on the
Furthermore, the predetermined character or character string can be emphasized by making the character or character string italicized or underlining the predetermined character or character string.
[0061]
Charts and character strings can be added as functions of the editing module. When adding a chart, a bitmap or other chart is prepared in advance on a storage medium that can be driven by the
[0062]
When adding a character string, the user can designate a specific location on the
In addition, characters and diagrams on the
[0063]
As described above, in the present embodiment, the presentation material generation apparatus 1 is realized by using a PC as an example. However, the present invention is not limited to this. For example, a word processor can be provided with a presentation material generation function.
It is also possible to provide a presentation material generation service to a user via a network by mounting a presentation material generation program on the server device.
In this case, the
[0064]
It is possible to distribute a storage medium such as a CD-ROM in which the presentation
[0065]
FIG. 3 is a flowchart for explaining the operation of the presentation material generating apparatus 1.
First, the
The
[0066]
Next, the
[0067]
Next, the
[0068]
Next, the
Next, the
[0069]
Next, the
Next, the
[0070]
If what is to be extracted is a sentence (step 35; extract sentence), the
If what is to be extracted is a sentence and a chart (step 35; extract sentence and chart), the
[0071]
When what is to be extracted is a chart (step 35; extract chart), the
The extraction functions of
[0072]
Next, the
[0073]
Next, the
[0074]
Next, the
[0075]
The
[0076]
In the above embodiment, the following effects can be obtained.
By specifying the input parameter 16, various presentation materials can be easily created.
[0077]
For example, it is possible to set a presentation material in which sentences and diagrams are mixed, and a specific style such as a key / tone / title key.
This makes it possible to create diagram-centric presentation materials and document-centric presentation materials. can do.
[0078]
In addition, according to the present embodiment, it is possible to automatically generate a concise expression from a solid-written (no document structure) document.
Furthermore, since it can be applied to a short document that is easy to be written in solid, it is possible to generate a presentation material from a plurality of documents. For this reason, presentation materials can be created based on daily business reports, etc., or market analysis materials can be generated based on Web information.
[0079]
By inputting the presentation material as the
[0080]
【The invention's effect】
According to the present invention, it is possible to automatically generate a presentation material by using data as a source of the presentation material as an input.
[Brief description of the drawings]
FIG. 1 is a diagram conceptually showing the configuration of a presentation material generating apparatus according to the present embodiment.
FIG. 2A is a configuration diagram when a presentation material generating apparatus is configured using a PC, and FIG. 2B is a diagram showing modules that constitute a presentation material generating program.
FIG. 3 is a flowchart for explaining the operation of the presentation material generating apparatus.
[Explanation of symbols]
1 Presentation material generator
2 Document structure analysis department
4 Morphological analyzer
6 important sentence judgment part
8 Parsing section
10 Concise expression generator
12 Document structure generator
14 Input documents
16 Input parameters
18 Presentation materials
26 Control unit
28 CPU
30 ROM
32 RAM
34 Input device
38 Output device
40 Printing device
42 Communication control device
43 Bus line
44 I / O interface
46 Storage Medium Drive Device
48 storage devices
50 Presentation material generation program
52 Other programs
54 Analysis Dictionary
60 Other data
62 Document structure analysis module
64 Morphological analysis module
66 Important sentence determination module
68 Parsing module
70 Concise Expression Generation Module
72 Document structure generation module
Claims (4)
文書を取得する文書取得手段と、
前記取得した文書の文書構造を解析し、べた書き文の領域を判定する判定手段と、
前記判定されたべた書き文を形態素解析、及び構文解析し、前記解析の結果と、所定の手がかり語を用いて、前記べた書き文から重要文を認定する認定手段と、
前記判定手段による解析結果をもとに、前記文書を前記受け付けた分割数に分割する分割手段と、
前記分割した各部分から、前記受け付けた最大文数内で重要度に応じて前記認定した重要文を抽出する抽出手段と、
前記抽出した重要文を簡潔化すると共に、前記簡潔化した簡潔文の文末表現が前記受け付けた文末表現となる簡潔文を生成する簡潔文生成手段と、
前記生成した簡潔文を前記受け付けたレイアウトにて出力する出力手段と、を備え、
前記出力手段は、前記受け付けたレイアウトが、文のみのときは前記生成した簡潔文のみを出力し、文と図表の混在の場合は前記簡潔文と当該簡潔文とマッチングする図表を出力し、図表のみの場合は前記簡潔文にマッチングする図表のみを出力することを特徴とするプレゼンテーション資料生成装置。 Receiving means for receiving the number of divisions for dividing the document, the maximum number of sentences to be extracted, the sentence end expression, and the layout;
A document acquisition means for acquiring a document;
A determination means for analyzing the document structure of the acquired document and determining an area of a solid written sentence;
A morphological analysis and syntactic analysis of the determined solid writing, and using the result of the analysis and a predetermined clue word, an certifying means for certifying an important sentence from the solid writing,
A dividing unit that divides the document into the accepted number of divisions based on an analysis result by the determining unit;
Extraction means for extracting the recognized important sentence according to the importance within the accepted maximum number of sentences from each of the divided parts;
Concise sentence generating means for simplifying the extracted important sentence and generating a concise sentence in which the sentence ending expression of the simplified concise sentence becomes the accepted sentence ending expression;
Output means for outputting the generated concise sentence in the accepted layout,
The output means outputs only the generated concise sentence when the accepted layout is a sentence only, and outputs a chart matching the concise sentence and the concise sentence when the sentence and the chart are mixed. In the case of only the presentation material generating apparatus, only the chart matching the concise sentence is output.
前記抽出手段は、前記簡略・詳細受付手段にて受け付けた選択に基づいて、前記抽出する重要文の数を前記最大文数の範囲内で増減することを特徴とする請求項1に記載のプレゼンテーション資料生成装置。 2. The presentation according to claim 1, wherein the extracting unit increases or decreases the number of important sentences to be extracted within the range of the maximum number of sentences based on the selection received by the simplified / detail receiving unit. Material generator.
前記受付手段で、文書を分割する分割数、抽出する最大文数、文末表現、及びレイアウトの設定を受け付ける受付ステップと、 A reception step of receiving the number of divisions for dividing the document, the maximum number of sentences to be extracted, the sentence end expression, and the layout in the reception unit;
前記文書取得手段で、文書を取得する文書取得ステップと、 A document acquisition step of acquiring a document by the document acquisition means;
前記判定手段で、前記取得した文書の文書構造を解析し、べた書き文の領域を判定する判定ステップと、 A determination step of analyzing a document structure of the acquired document and determining an area of a solid written sentence by the determination unit;
前記認定手段で、前記判定されたべた書き文を形態素解析、及び構文解析し、前記解析の結果と、所定の手がかり語を用いて、前記べた書き文から重要文を認定する認定ステップと、 The certifying means performs morphological analysis and syntactic analysis on the determined solid sentence, and uses the analysis result and a predetermined clue word to certify an important sentence from the solid sentence,
前記分割手段で、前記判定手段による解析結果をもとに、前記文書を前記受け付けた分割数に分割する分割ステップと、 A dividing step of dividing the document into the accepted number of divisions based on the analysis result by the determination unit;
前記抽出手段で、前記分割した各部分から、前記受け付けた最大文数内で重要度に応じて前記認定した重要文を抽出する抽出ステップと、 An extraction step of extracting the recognized important sentence according to the importance within the accepted maximum number of sentences from the divided parts by the extracting means;
前記簡潔文生成手段で、前記抽出した重要文を簡潔化すると共に、前記簡潔化した簡潔文の文末表現が前記受け付けた文末表現となる簡潔文を生成する簡潔文生成ステップと、 A concise sentence generation step of simplifying the extracted important sentence and generating a concise sentence in which the sentence ending expression of the simplified concise sentence becomes the accepted sentence ending expression in the concise sentence generating means;
前記出力手段で、前記生成した簡潔文を前記受け付けたレイアウトにて出力する出力ステップと、から構成され、 An output step for outputting the generated concise sentence in the accepted layout by the output means; and
前記出力ステップでは、前記受け付けたレイアウトが、文のみのときは前記生成した簡潔文のみを出力し、文と図表の混在の場合は前記簡潔文と当該簡潔文とマッチングする図表を出力し、図表のみの場合は前記簡潔文にマッチングする図表のみを出力することを特徴とするプレゼンテーション資料生成方法。 In the output step, when the accepted layout is a sentence only, only the generated concise sentence is output, and in the case of a mixture of a sentence and a chart, the concise sentence and a chart matching the concise sentence are output, In the case of only the presentation material, the presentation material generating method is characterized in that only the chart matching the concise sentence is output.
文書を取得する文書取得機能と、 A document acquisition function for acquiring a document;
前記取得した文書の文書構造を解析し、べた書き文の領域を判定する判定機能と、 A determination function for analyzing the document structure of the acquired document and determining an area of a solid written sentence;
前記判定されたべた書き文を形態素解析、及び構文解析し、前記解析の結果と、所定の The determined solid sentence is subjected to morphological analysis and syntactic analysis, and the result of the analysis and a predetermined 手がかり語を用いて、前記べた書き文から重要文を認定する認定機能と、Using a clue word, an authorization function that authorizes important sentences from the written text,
前記解析機能による解析結果をもとに、前記文書を前記受け付けた分割数に分割する分割機能と、 A division function for dividing the document into the accepted number of divisions based on the analysis result by the analysis function;
前記分割した各部分から、前記受け付けた最大文数内で重要度に応じて前記認定した重要文を抽出する抽出機能と、 From each of the divided parts, an extraction function that extracts the recognized important sentence according to the importance within the maximum number of accepted sentences;
前記抽出した重要文を簡潔化すると共に、前記簡潔化した簡潔文の文末表現が前記受け付けた文末表現となる簡潔文を生成する簡潔文生成機能と、 A concise sentence generation function for simplifying the extracted important sentence and generating a concise sentence in which the ending sentence expression of the simplified concise sentence becomes the accepted sentence ending expression;
前記生成した簡潔文を前記受け付けたレイアウトにて出力する出力機能と、をコンピュータで実現するプレゼンテーション資料生成プログラムであって、 An output function for outputting the generated concise sentence in the accepted layout, and a presentation material generation program that realizes on a computer,
前記出力機能は、前記受け付けたレイアウトが、文のみのときは前記生成した簡潔文のみを出力し、文と図表の混在の場合は前記簡潔文と当該簡潔文とマッチングする図表を出力し、図表のみの場合は前記簡潔文にマッチングする図表のみを出力することを特徴とするプレゼンテーション資料生成プログラム。 The output function outputs only the generated concise sentence when the accepted layout is a sentence only, and outputs a chart matching the concise sentence and the concise sentence when the sentence and the chart are mixed. In the case of only, a presentation material generating program characterized in that only a chart matching the concise sentence is output.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001263023A JP3712966B2 (en) | 2001-08-31 | 2001-08-31 | Presentation material generating apparatus, presentation material generating method, and presentation material generating program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001263023A JP3712966B2 (en) | 2001-08-31 | 2001-08-31 | Presentation material generating apparatus, presentation material generating method, and presentation material generating program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003076678A JP2003076678A (en) | 2003-03-14 |
JP3712966B2 true JP3712966B2 (en) | 2005-11-02 |
Family
ID=19089844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001263023A Expired - Fee Related JP3712966B2 (en) | 2001-08-31 | 2001-08-31 | Presentation material generating apparatus, presentation material generating method, and presentation material generating program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3712966B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102166516B1 (en) * | 2020-07-27 | 2020-10-15 | 김밀알 | Automatic document creation system based on artificial intelligence |
KR20210062239A (en) * | 2019-11-21 | 2021-05-31 | 이화여자대학교 산학협력단 | A method and system for generating slide show |
KR20220015287A (en) * | 2020-07-30 | 2022-02-08 | 주식회사 에스크라운 | Server and method for automatically generating slide using artificial intelligence |
KR102435844B1 (en) * | 2021-12-02 | 2022-08-24 | (주)아데나 | Template providing system based on image data extraction |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007072528A (en) | 2005-09-02 | 2007-03-22 | Internatl Business Mach Corp <Ibm> | Method, program and device for analyzing document structure |
US9595298B2 (en) | 2012-07-18 | 2017-03-14 | Microsoft Technology Licensing, Llc | Transforming data to create layouts |
US9009092B2 (en) * | 2012-07-19 | 2015-04-14 | Microsoft Technology Licensing, Llc | Creating variations when transforming data into consumable content |
US9626068B2 (en) * | 2013-06-06 | 2017-04-18 | Microsoft Technology Licensing, Llc | Automated system for organizing presentation slides |
JP6270747B2 (en) * | 2015-01-16 | 2018-01-31 | 日本電信電話株式会社 | Question answering method, apparatus, and program |
WO2024218839A1 (en) * | 2023-04-17 | 2024-10-24 | ヤマハ発動機株式会社 | Content generation system |
-
2001
- 2001-08-31 JP JP2001263023A patent/JP3712966B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210062239A (en) * | 2019-11-21 | 2021-05-31 | 이화여자대학교 산학협력단 | A method and system for generating slide show |
KR102430556B1 (en) * | 2019-11-21 | 2022-08-08 | 이화여자대학교 산학협력단 | A method and system for generating slide show |
KR102166516B1 (en) * | 2020-07-27 | 2020-10-15 | 김밀알 | Automatic document creation system based on artificial intelligence |
KR20220015287A (en) * | 2020-07-30 | 2022-02-08 | 주식회사 에스크라운 | Server and method for automatically generating slide using artificial intelligence |
KR102366182B1 (en) * | 2020-07-30 | 2022-02-22 | 주식회사 에스크라운 | Server and method for automatically generating slide using artificial intelligence |
KR102435844B1 (en) * | 2021-12-02 | 2022-08-24 | (주)아데나 | Template providing system based on image data extraction |
Also Published As
Publication number | Publication date |
---|---|
JP2003076678A (en) | 2003-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20050060046A1 (en) | Information processing apparatus, its control method, and program | |
EP1696337A2 (en) | Document processing apparatus, document processing method and computer program | |
US20020010719A1 (en) | Method and system for generating document summaries with location information | |
US9122654B2 (en) | Method and system for deriving and matching local formatting in an electronic document | |
US20050228635A1 (en) | Method for describing existing data by a natural language and program for that | |
JP3712966B2 (en) | Presentation material generating apparatus, presentation material generating method, and presentation material generating program | |
US7793224B1 (en) | Methods and apparatus for formatting identified content | |
KR100905744B1 (en) | Method and system for providing conversation dictionary service based on user created dialog data | |
Baldonado et al. | Notable: At the intersection of annotations and handheld technology | |
CN117391053A (en) | Personalized editing publishing method | |
JP2006119915A (en) | Electronic filing system and electronic filing method | |
JPH1145290A (en) | Document processor, storage medium storing document processing program and document processing method | |
JP2001067342A (en) | Document processor and storage medium | |
JP2001155467A (en) | Editorial processor, and recording medium in which editorial processing program is stored | |
US10990338B2 (en) | Information processing system and non-transitory computer readable medium | |
JP2000020549A (en) | Device for assisting input to document database system | |
JPH09325787A (en) | Voice synthesizing method, voice synthesizing device, method and device for incorporating voice command in sentence | |
JP2001092615A (en) | Method and system for printing html document and recording medium | |
JP2000076226A (en) | Document data editing system | |
JPH0944486A (en) | Document preparing device and method for preparing note | |
JP3206600B2 (en) | Document generation device | |
JP3734101B2 (en) | Hypermedia construction support device | |
JP2008233952A (en) | Document preparation support device and document preparation support program | |
KR100640062B1 (en) | Apparatus for printing control and method thereof | |
KR101115523B1 (en) | Web-Editor for Multimedia with tailoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050818 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080826 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110826 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |