JP2009093503A - スケジュール登録支援システム、スケジュール登録支援方法及びプログラム - Google Patents

スケジュール登録支援システム、スケジュール登録支援方法及びプログラム Download PDF

Info

Publication number
JP2009093503A
JP2009093503A JP2007264973A JP2007264973A JP2009093503A JP 2009093503 A JP2009093503 A JP 2009093503A JP 2007264973 A JP2007264973 A JP 2007264973A JP 2007264973 A JP2007264973 A JP 2007264973A JP 2009093503 A JP2009093503 A JP 2009093503A
Authority
JP
Japan
Prior art keywords
schedule
information
schedule information
ranking
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007264973A
Other languages
English (en)
Inventor
Seiji Nakamura
誠次 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007264973A priority Critical patent/JP2009093503A/ja
Publication of JP2009093503A publication Critical patent/JP2009093503A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Calculators And Similar Devices (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】電子メール内に複数のスケジュール情報が記載されている場合に、スケジュール管理システムに登録することができるスケジュール登録支援システム、スケジュール登録支援方法及びプログラムを提供する。
【解決手段】入力された電子メールから解析対象部分を抽出し、解析対象部分に対して形態素解析及び構文解析を行い、それら解析結果に対して、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得し、取得したスケジュール情報を、タイトル、時間、場所の各項目に分類し、分類したスケジュール情報について出現回数及び出現文書数を計算し、その結果を分類知識情報として分類知識DBに格納した後、再度分類知識情報を取得し、分類したスケジュール情報に対して分類知識情報に基づいて順位付けを行い、順位付けに基づいてスケジュール候補リストを作成し、スケジュール管理システムに登録する。
【選択図】図1

Description

本発明は、電子メール内に記載されたスケジュール情報を抽出し、スケジュール管理システムに登録するスケジュール登録支援システム、スケジュール登録支援方法及びプログラムに関する。
イベントや会議の開催などの日時等を示すスケジュール情報の多くは電子メールにて通知されることが非常に多く、電子メールを受け取ったユーザはスケジュール管理システム(情報処理装置等におけるスケジュール管理ソフトウェアなども含む)に対して手作業でスケジュールを登録(入力)していた。しかし、スケジュール情報を含んだ電子メールが多くなればなるほど、スケジュール登録にかかる時間は増大するという問題が生じている。また、スケジュール登録時に誤った情報を入力し、会議の開催日時や時刻などを間違えてしまうという問題が生じている。
電子メールの内容を解析してスケジュール情報を登録する技術として、例えば、特許文献5にはスケジュール入力支援システムが開示されている。このスケジュール入力支援システムは、特許文献5の図1に示されているように、メーラと、スケジューラと、キーワード抽出装置、内容解析部、処理判定部とから構成されており、電子メールの内容を解析し、スケジュールに書き込む内容であるかどうか判断し、スケジュールに書き込む内容だと判断された受信メールは、内容を自動的にスケジュールに書き込む処理を行う。
しかし、特許文献5のスケジュール入力支援システムは、電子メール内に複数のスケジュール情報が記載されている場合(例えば、会議の開催日時と資料の提出期限)に対応していないので、電子メール中に複数のスケジュール情報が含まれている場合には、1つのスケジュール情報しかスケジュール管理システムに入力できず、それ以外のスケジュール情報を手作業で入力しなければならないという問題がある。
上記特許文献5以外の本発明に関連する技術例としては、電子文書の解析技術の例が特許文献1,2にそれぞれ開示されており、また、スケジュールの管理技術の例が特許文献3,4,5にそれぞれ開示されている。
特開2000−148752号公報 特開2003−271590号公報 特開2004−171216号公報 特開平10−240818号公報 特開平11−259568号公報
ここで、上記各特許文献1〜5のそれぞれの技術と、本発明との相違点について以下に説明する。なお、以下で説明する本発明の内容は、後述する「本発明を実施するための最良の形態」に基づく。
特許文献1では、箇条書きの判定の際に、文書の構造を示す箇条書きパターンを作成し、文書の構造が箇条書きパターンに一致しているかどうかにより箇条書きかどうかを判定している。
これに対し、本発明では、箇条書きの判定には、特許文献1のように文書の構造には着目しておらず、文字列の先頭に記号(■、●、(1)など。後述する箇条書き情報)が含まれているかどうかのみで箇条書きかどうかを判定しているので、特許文献1とは、箇条書きを発見する方法が全く異なる。
また、本発明において、タイトルなどの文字が含まれるかどうかを判定している部分は、箇条書きの中に含まれるスケジュール情報を、『タイトル情報』、『日付情報』、『場所情報』に分類するために実施しているものであり、箇条書きを取得するという効果を狙ったものではなく、箇条書き取得後に、スケジュール情報を分類するために行っているものである。そのため箇条書きの発見に利用しているものではない。
特許文献2では、括弧表現の役割を周囲の文脈によって分類し、括弧表現の役割に応じて処理を行っている。
これに対し、本発明では、括弧表現は箇条書き情報を探すための目印として使用しているものである。スケジュール情報を分類する際には、『タイトル情報』、『日付情報』、『場所情報』の語句を含んでいるかどうかにより判断しており、文脈などの情報は使用していない。
特許文献3では、形態素解析結果を元に、細かいルールを用いて語句を取得している。また、形態素解析の結果の品詞分類を用いて単語を分類している。特許文献3で用いられている細かいルールでは、(日時、相手、場所、行動)など単語の出現順番が決まっている。
これに対し、本発明では、構文解析を実施した後、特許文献3で用いられている方法よりもよりシンプルな方法で語句を取得している。また、本発明でのフィルタリングとして、特許文献3で設定しているような出現順によるルールは設定しておらず、単に、品詞の種類(固有名詞、未知語、一般名詞、日付)により大まかに分類している。このような方法を用いる理由としては、助詞、助動詞、形容詞などの不要語を取り除くことが目的である。そして、本発明は、最終的にスコアを計算し、順位づけを行うため、特許文献3で用いているような地域や名詞といった品詞分類の情報は必要ではない。
また、本発明で用いている処理は、自然言語処理(機械翻訳、構文解析など)の分野(研究や開発など)にて古くから盛んに行われており(主に事前処理)、ほぼ常識的に使われている方法である。そのため、自然言語処理をある程度勉強した人間であれば誰でも知っている方法である。
特許文献4では、スケジュール優先度として、ユーザが予め設定しておいた情報、スケジュールの目的や文書内容などより総合的に判断している。
これに対し、本発明では、順位付けを行う際に、過去の入力データやメールデータを元に、自然言語処理で用いられる単語クラスタリングの方法(TF・IDFなど)を使用してスコアを計算し、順位を決定しており、方法が異なる。
本発明は、電子メールにて通知されるスケジュール情報を解析してスケジュール管理を支援するシステムであり、特許文献5も同様である。これらシステムに必要な機能としては、「メールを解析して情報を取り出す」、「スケジュール情報に登録する」という2つの処理に集約される。そのため、マクロな視点で見ると、本発明と特許文献5は、機能面や構造が似通っているように見える可能性が考えられる。しかしながら、ミクロな視点で見てみると、本発明と特許文献5は、順位付けの処理を行う部分や知識DBを使用している部分など異なる点が多くあり、同じものとは言えない。
また、特許文献5では、スケジュールが重複した際にユーザに対して電子メールにて通知を行っている。このスケジュールが重複した場合というのは、解析したスケジュールの日時が重複している場合に、ユーザに対して通知を行っているものである。これに対し、本発明では、得られる効果として、1つのメール内に複数のスケジュール情報が記載されている場合にスケジュール管理システムに登録することを可能にすることである。そのため、複数のスケジュール情報を、一括して電子メールより取得し処理を行うためスケジュールリストを作成している。ユーザに提示する際にそのリストを用いているに過ぎない。特許文献5では、原則1メールに1つの情報が記載されているということが暗黙の了解となっており、1メール中に複数のスケジュール情報が記載されている場合などについては言及していない。
なお、特許文献5に記載されている「スケジュールが重複した場合の処理」に基づいて、本発明の「重複した2つのスケジュールをリストとしてユーザに提示する」ことは、容易に想到できるものではない。その理由は、本発明にてスケジュール情報をユーザに提示しているのは、複数のスケジュール情報を登録する際にユーザは何回もスケジュール情報を登録しなければならないという背景があるためである。単にスケジュールが重複したときの処理のみであれば、スケジュールの重複箇所をユーザに提示するのみで、スケジュールリストを作成する必要性はないはずである。そのため、複数のスケジュール情報が電子メールに記載されている可能性があるという背景を思いつかなければならないので、特許文献5に基づいて本発明の「スケジュールリストを作成する」というアイデアを導き出すことは困難である。
また、上記各特許文献1〜5の技術例を組み合わせたとしても、1つのメール内に複数のスケジュール情報が記載されている場合には対応できない。上記各特許文献を組み合わせてシステムを構成した場合、スケジュールの解析及び入力までは実施することができるが、1つのメールに複数のスケジュール情報が記載されていた場合、どのように処理を行うのかについては、どの特許文献にも記載されていない。そのため、複数のスケジュール情報が電子メールに記載されている場合の処理ができない。単純に、順位付けの方法として、語句の出現回数をカウントしただけでは、文書を特徴づける語句が上位に来るように順位付けすることは難しい。そのため、複数のスケジュール情報を処理することは難しいと考えられる。
本発明は、上記問題を解決するためになされたものであり、スケジュール候補リストを作成・使用することにより、電子メール内に複数のスケジュール情報が記載されている場合に、スケジュール管理システムに登録することができるスケジュール登録支援システム、スケジュール登録支援方法及びプログラムを提供することを目的とする。
かかる目的を達成するために、本発明の第1のスケジュール登録支援システムは、所定の電子文書データが入力された場合、所定のルールに従って、電子文書データから解析対象部分を抽出する抽出部と、解析対象部分に対して、形態素解析及び構文解析を行う解析部と、形態素解析及び構文解析の結果に対して、所定のルールに従って、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得するフィルタ部と、所定のルールに従って、スケジュール情報を、タイトル、時間、場所のいずれかの項目に分類し、いずれかの項目に分類したスケジュール情報について出現回数及び出現文書数を計算し、計算の結果を分類知識情報として分類知識記憶手段に格納する分類部と、分類知識記憶手段から分類知識情報を再取得し、分類部で分類したスケジュール情報に対して、分類知識情報に基づいて順位付けを行い、順位付けの結果に基づいてスケジュール候補リストを作成する順位付け部と、順位付け部で作成したスケジュール候補リストを所定のスケジュール管理システムに登録する登録部と、を有することを特徴とする。
本発明の第2のスケジュール登録支援システムは、本発明の第1のスケジュール登録支援システムにおいて、抽出部は、解析対象部分を、引用部分と、それ以外の部分とに分け、解析部は、引用部分と、それ以外の部分とに対して別々に、形態素解析及び構文解析を行うことを特徴とする。
本発明の第3のスケジュール登録支援システムは、本発明の第1又は第2のスケジュール登録支援システムにおいて、順位付け部は、タイトルに分類したスケジュール情報の順位付けを行う場合、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする。
本発明の第4のスケジュール登録支援システムは、本発明の第1又は第2のスケジュール登録支援システムにおいて、順位付け部は、時間に分類したスケジュール情報の順位付けを行う場合、スコア計算は行わず、時間が新しいものが上位に来るように順位付けをすることを特徴とする。
本発明の第5のスケジュール登録支援システムは、本発明の第1又は第2のスケジュール登録支援システムにおいて、順位付け部は、場所に分類したスケジュール情報の順位付けを行う場合、過去にスケジュール管理システムに入力した回数に基づいて順位付けを行い、同じ順位かどうかを判断し、判断の結果、同じ順位の場合には、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする。
本発明の第6のスケジュール登録支援システムは、本発明の第1から第5のいずれか1つのスケジュール登録支援システムにおいて、所定の電子文書データが入力された場合、電子文書データの中の箇条書き部分を見つけるために用いる箇条書き情報を取得する箇条書き情報取得部と、取得した箇条書き情報に基づいて電子文書データの中から箇条書き部分を見つけて切り出す箇条書き探索部と、スケジュール情報となる同義語を格納した同義語辞書記憶手段を参照して、箇条書き部分から所定のスケジュール情報を特定して切り出すスケジュール情報探索部と、切り出したスケジュール情報を、タイトル、時間、場所のいずれかの項目に分類するスケジュール情報分類部と、を有し、登録部は、スケジュール情報分類部で分類したスケジュール情報を、分類知識情報として、分類知識記憶手段へ格納することを特徴とする。
本発明の第7のスケジュール登録支援システムは、本発明の第6のスケジュール登録支援システムにおいて、箇条書き探索部が電子文書データの中から箇条書き部分を見つけられなかった場合、電子文書データに対して抽出部が処理を開始することを特徴とする。
本発明の第8のスケジュール登録支援システムは、本発明の第6のスケジュール登録支援システムにおいて、登録部がスケジュール情報分類部で分類したスケジュール情報を分類知識情報として分類知識記憶手段へ格納した後、電子文書データに対して抽出部が処理を開始することを特徴とする。
本発明の第1のスケジュール登録支援方法は、所定の電子文書データが入力された場合、所定のルールに従って、電子文書データから解析対象部分を抽出する抽出ステップと、解析対象部分に対して、形態素解析及び構文解析を行う解析ステップと、形態素解析及び構文解析の結果に対して、所定のルールに従って、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得するフィルタステップと、所定のルールに従って、スケジュール情報を、タイトル、時間、場所のいずれかの項目に分類し、いずれかの項目に分類したスケジュール情報について出現回数及び出現文書数を計算し、計算の結果を分類知識情報として分類知識記憶手段に格納する分類ステップと、分類知識記憶手段から分類知識情報を再取得し、分類ステップで分類したスケジュール情報に対して、分類知識情報に基づいて順位付けを行い、順位付けの結果に基づいてスケジュール候補リストを作成する順位付けステップと、順位付け部で作成したスケジュール候補リストを所定のスケジュール管理システムに登録する登録ステップと、を有することを特徴とする。
本発明の第2のスケジュール登録支援方法は、本発明の第1のスケジュール登録支援方法において、抽出ステップでは、解析対象部分を、引用部分と、それ以外の部分とに分け、解析ステップでは、引用部分と、それ以外の部分とに対して別々に、形態素解析及び構文解析を行うことを特徴とする。
本発明の第3のスケジュール登録支援方法は、本発明の第1又は第2のスケジュール登録支援方法において、順位付けステップでは、タイトルに分類したスケジュール情報の順位付けを行う場合、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする。
本発明の第4のスケジュール登録支援方法は、本発明の第1又は第2のスケジュール登録支援方法において、順位付けステップでは、時間に分類したスケジュール情報の順位付けを行う場合、スコア計算は行わず、時間が新しいものが上位に来るように順位付けをすることを特徴とする。
本発明の第5のスケジュール登録支援方法は、本発明の第1又は第2のスケジュール登録支援方法において、順位付けステップでは、場所に分類したスケジュール情報の順位付けを行う場合、過去にスケジュール管理システムに入力した回数に基づいて順位付けを行い、同じ順位かどうかを判断し、判断の結果、同じ順位の場合には、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする。
本発明の第6のスケジュール登録支援方法は、本発明の第1から第5のいずれか1つのスケジュール登録支援方法において、所定の電子文書データが入力された場合、電子文書データの中の箇条書き部分を見つけるために用いる箇条書き情報を取得する箇条書き情報取得ステップと、取得した箇条書き情報に基づいて電子文書データの中から箇条書き部分を見つけて切り出す箇条書き探索ステップと、スケジュール情報となる同義語を格納した同義語辞書記憶手段を参照して、箇条書き部分から所定のスケジュール情報を特定して切り出すスケジュール情報探索ステップと、切り出したスケジュール情報を、タイトル、時間、場所のいずれかの項目に分類するスケジュール情報分類ステップと、を有し、登録ステップでは、スケジュール情報分類ステップで分類したスケジュール情報を、分類知識情報として、分類知識記憶手段へ格納することを特徴とする。
本発明の第7のスケジュール登録支援方法は、本発明の第6のスケジュール登録支援方法において、箇条書き探索ステップで電子文書データの中から箇条書き部分を見つけられなかった場合、電子文書データに対して抽出ステップを開始することを特徴とする。
本発明の第8のスケジュール登録支援方法は、本発明の第6のスケジュール登録支援方法において、登録ステップでスケジュール情報分類ステップにて分類したスケジュール情報を分類知識情報として分類知識記憶手段へ格納した後、電子文書データに対して抽出ステップを開始することを特徴とする。
本発明の第1のプログラムは、所定の電子文書データが入力された場合、所定のルールに従って、電子文書データから解析対象部分を抽出する抽出処理と、解析対象部分に対して、形態素解析及び構文解析を行う解析処理と、形態素解析及び構文解析の結果に対して、所定のルールに従って、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得するフィルタ処理と、所定のルールに従って、スケジュール情報を、タイトル、時間、場所のいずれかの項目に分類し、いずれかの項目に分類したスケジュール情報について出現回数及び出現文書数を計算し、計算の結果を分類知識情報として分類知識記憶手段に格納する分類処理と、分類知識記憶手段から分類知識情報を再取得し、分類処理で分類したスケジュール情報に対して、分類知識情報に基づいて順位付けを行い、順位付けの結果に基づいてスケジュール候補リストを作成する順位付け処理と、順位付け部で作成したスケジュール候補リストを所定のスケジュール管理システムに登録する登録処理と、をコンピュータに実行させることを特徴とする。
本発明の第2のプログラムは、本発明の第1のプログラムにおいて、抽出処理では、解析対象部分を、引用部分と、それ以外の部分とに分け、解析処理では、引用部分と、それ以外の部分とに対して別々に、形態素解析及び構文解析を行うことを特徴とする。
本発明の第3のプログラムは、本発明の第1又は第2のプログラムにおいて、順位付け処理では、タイトルに分類したスケジュール情報の順位付けを行う場合、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする。
本発明の第4のプログラムは、本発明の第1又は第2のプログラムにおいて、順位付け処理では、時間に分類したスケジュール情報の順位付けを行う場合、スコア計算は行わず、時間が新しいものが上位に来るように順位付けをすることを特徴とする。
本発明の第5のプログラムは、本発明の第1又は第2のプログラムにおいて、順位付け処理では、場所に分類したスケジュール情報の順位付けを行う場合、過去にスケジュール管理システムに入力した回数に基づいて順位付けを行い、同じ順位かどうかを判断し、判断の結果、同じ順位の場合には、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする。
本発明の第6のプログラムは、本発明の第1から第5のいずれか1つのプログラムにおいて、所定の電子文書データが入力された場合、電子文書データの中の箇条書き部分を見つけるために用いる箇条書き情報を取得する箇条書き情報取得処理と、取得した箇条書き情報に基づいて電子文書データの中から箇条書き部分を見つけて切り出す箇条書き探索処理と、スケジュール情報となる同義語を格納した同義語辞書記憶手段を参照して、箇条書き部分から所定のスケジュール情報を特定して切り出すスケジュール情報探索処理と、切り出したスケジュール情報を、タイトル、時間、場所のいずれかの項目に分類するスケジュール情報分類処理と、コンピュータに実行させ、登録処理では、スケジュール情報分類処理で分類したスケジュール情報を、分類知識情報として、分類知識記憶手段へ格納することを特徴とする。
本発明の第7のプログラムは、本発明の第1から第6のいずれか1つのプログラムにおいて、箇条書き探索処理で電子文書データの中から箇条書き部分を見つけられなかった場合、電子文書データに対して抽出処理を開始する処理をコンピュータに実行させることを特徴とする。
本発明の第8のプログラムは、本発明の第1から第6のいずれか1つのプログラムにおいて、登録処理でスケジュール情報分類処理にて分類したスケジュール情報を分類知識情報として分類知識記憶手段へ格納した後、電子文書データに対して抽出処理を開始する処理をコンピュータに実行させることを特徴とする。
本発明によれば、作成したスケジュール候補リストを使用することにより、電子文書データ内に複数のスケジュール情報が記載されている場合でも、ユーザが手動でスケジュールを入力する必要がなく、スケジュール管理システムにスケジュールを登録することが可能となる。
以下、本発明を実施するための最良の形態について添付図面を参照して詳細に説明する。
まず、本発明のスケジュール登録支援システムの実施例の概要について説明する。
例えば電子メール(電子文書データ)にて通知されるスケジュール情報の多くは、図20に示す電子メール例のように、箇条書きが使用されていることが多い。そこで、本実施例のスケジュール登録支援システムでは、電子メール中の箇条書き情報(箇条書きの部分において一般的に用いられる記号など)に注目し、箇条書き情報を元に箇条書き部分(箇条書き部分情報)を取得し、その箇条書き部分からスケジュール情報を取得する。なお、上記箇条書き部分を取得する際には、箇条書き部分が同じ意味の語句によって記載されている場合(例えば、タイトルと名称など)を考慮し、同義語辞書を使用する。次に、メール本文に対して、形態素解析器と構文解析器(製品によっては形態素解析器機能を含む構文解析器もある)を使用し、語句に分解する。そして形態素解析器及び構文解析器で分解した語句に対して、過去の入力データや単語の頻度などを元に事前言語処理でよく使用される単語クラスタリングの技術を利用し、スコアを計算し順位付けを実施する。この順位付けを元に、それぞれスケジュール候補リストを作成する。このスケジュール候補リストを使用することにより、電子メール内に複数のスケジュール情報が記載されている場合に、スケジュール管理システムに登録することができる。
次に、本実施例のスケジュール登録支援システムの構成について以下に説明する。
図1を参照すると、本実施例のスケジュール登録支援システムは、箇条書き情報を元に電子メール中の箇条書き部分を探索する箇条書き探索装置1と、箇条書き部分を探索する際に使用される上記箇条書き情報を格納する箇条書き情報DB(Data Base)2と、整形パターンDB14と、探索した箇条書き部分からスケジュール情報を取得する箇条書き解析装置3と、解析する際に利用する同義語辞書DB4と、電子メール中より解析するために必要な事前処理を実施するメール文書解析装置5と、解析する際に利用する解析ルールDB6と、各スケジュール情報を分類し、スコア計算によりスケジュール候補リストを作成するスケジュール候補分類装置7と、分類する際に利用する分類ルールDB8と、分類知識DB9と、取得したスケジュール情報をユーザに表示し、スケジュール管理データベースに登録するスケジュール情報登録装置10と、スケジュール管理DB110と、ユーザ表示装置120と、を有する。なお、本実施例では、上記各装置から構成されるスケジュール登録支援システムとしたが、上記各装置の機能を有するように構成してスケジュール登録支援装置としてもよい。
図2を参照すると、箇条書き探索装置1は、箇条書き情報DB2より、箇条書きの部分を見つけるために必要な情報(箇条書き情報。電子メール中の箇条書き部分を探索する際にキーとなる情報であり、箇条書きの部分(文字列)の先頭に表記される一般的な記号など)を取得する箇条書き情報取得部11と、取得した箇条書き情報を元に箇条書き部分を見つけて切り出す箇条書き探索部12と、切り出した箇条書き部分(箇条書き部分情報。切り出した箇条書き部分を示す情報であり、上記箇条書き情報を含む)を整形パターンDB14の情報(図22参照)を元に、処理のしやすい形式に整形する箇条書き情報整形部13と、を有する。なお、箇条書き探索装置1は、箇条書き情報DB2及び整形パターンDB14の少なくとも1つを含む構成としてもよい。
図3を参照すると、箇条書き解析装置3は、同義語辞書DB4を用いて、箇条書き探索装置1によって得られた箇条書き部分情報からスケジュール情報を特定し、スケジュール情報を切り出す(解析する)ためのスケジュール情報探索部31と、解析したスケジュール情報を、タイトル、日付、場所の各項目に分類するためのスケジュール情報分類部32と、解析分類したデータを整形するデータ整形部33と、を有する。なお、箇条書き解析装置3は、同義語辞書DB4を含む構成としてもよい。
図4を参照すると、メール文書解析装置5は、メールを解析するための前処理として、解析ルールDB6のルールを用いて必要な範囲を抽出する該当箇所抽出部51と、そして取得した該当部分に対して、形態素解析及び構文解析を実施する構文解析器52と、分類ルールDB8を用いて、形態素解析及び構文解析結果のうち、不要な語句を除去するフィルタ部53と、を有する。なお、メール文書解析装置5は、解析ルールDB6及び分類ルールDB8の少なくとも1つを含む構成としてもよい。
図5を参照すると、スケジュール情報分類装置7は、分類ルールDB8を用いて、フィルタを実施したスケジュール情報を、「タイトル」、「時間」、「場所」に分類するためのスケジュール情報候補分類部71、分類した語句に対して、分類知識DB9の情報を元にして、スコアを計算し順位付けを実施し、スケジュール候補リストを作成するためのスケジュール情報順位付け部72と、スケジュール情報候補分類部71にて分類した情報を、再利用するために、分類知識DB9に格納する分類知識DB登録部73と、を有する。なお、スケジュール情報分類装置7は、分類ルールDB8を含む構成としてもよい。
図6を参照すると、スケジュール情報登録装置10は、スケジュール情報をスケジュール管理システムのスケジュール管理DB110に登録するスケジュール情報登録部101と、スケジュール管理DB110に登録した情報を知識として再利用するために、分類知識DB9に登録する分類知識DB登録部102と、を有する。
上述した各装置の動作について以下にそれぞれ説明する。
箇条書き探索装置1では、箇条書き情報取得部11が、箇条書き情報DB2より、箇条書きの部分を見つけるために必要な箇条書き情報を取得し、箇条書き探索部12が、取得した箇条書き情報を元に箇条書き部分を見つけ切り出す。そして、箇条書き情報整形部13が、切り出した箇条書き部分(箇条書き部分情報)を、整形パターンDB14の情報を元に、処理のしやすい形式に整形する。
箇条書き解析装置3では、スケジュール情報探索部31が、スケジュール情報となる同義語を複数格納した同義語辞書DB4を用いて、箇条書き探索装置1によって得られた箇条書き部分情報からスケジュール情報を特定し、特定したスケジュール情報を切り出す。スケジュール情報分類部32が、切り出されたスケジュール情報を、タイトル、日付(日時、時間)、場所の各項目に分類し、データ整形部33が、不要語を除去し、スケジュール情報を整える。このスケジュール情報は、後述するスケジュール情報登録装置10へ送られ、スケジュール候補リスト作成の際に知識として利用するために、分類知識DB9へ登録される(よって、スケジュール候補リストに直接は反映されない)。
メール文書解析装置5では、該当箇所抽出部51が、メールを解析するための前処理として、解析ルールDB6のルールを使用して、必要な範囲を抽出する。構文解析器52が、抽出された該当部分(必要な範囲)に対して、形態素解析及び構文解析を実施する。フィルタ部53が分類ルールDB8を使用し、形態素解析及び構文解析結果について、スケジュール情報に必要な情報のみを取得するフィルタリングを実施する。
スケジュール分類装置9では、スケジュール情報候補分類部71が、フィルタを実施したスケジュール情報を、分類ルールDB8を用い、「タイトル」、「時間」、「場所」に分類する。スケジュール情報順位付け部72が、それぞれ分類した語句に対して、分類知識DB9の情報を元にして、スコアを計算し、その結果を元に順位付けを実施し、スケジュール候補リストを作成する。その際に、分類知識DB登録部73が、スケジュール情報候補分類部71にて分類した情報を、知識として利用するために、分類知識DB9に格納する。
スケジュール情報登録装置10では、スケジュール情報登録部101が、順位付けを行ったスケジュール情報を、ユーザ表示装置120に表示し(この表示は任意)、スケジュール管理システムのスケジュール管理DB110に登録する。また、分類知識DB登録部102が、スケジュール管理DB110に登録した情報を知識として再利用するために、その登録情報を分類知識DB9に登録する。
次に、本実施例のスケジュール登録支援システムの動作について以下に説明する。
まず、図7のフローチャートを参照して実施例の動作(箇条書き探索装置1の動作)について詳細に説明する。
電子メールのデータが入力されると、箇条書き探索装置1では、箇条書き情報取得部11が、箇条書き情報DB2から、箇条書きの部分を見つけるために必要な情報である箇条書き情報を取得する(ステップS1)。
箇条書き探索部12は、取得した箇条書き情報が『()』であるかどうかを判別する(ステップS2)。
箇条書き情報が『()』である場合は(ステップS2/YES)、正規表現を使用し、『(1)・・(10)』という形で記載されている箇条書き部分(箇条書き情報を含む部分)を探索する(ステップS3)。その後は、ステップS9へ進む。
箇条書き情報が『()』ではない場合は(ステップS2/NO)、取得した箇条書き情報が『)』であるかどうかを判別する(ステップS4)。
箇条書き情報が『』』である場合は(ステップS3/YES)、正規表現を使用し、『1』・・10』』という形で記載されている箇条書き部分(箇条書き情報を含む部分)を探索する(ステップS3)。その後は、ステップS9へ進む。
箇条書き情報が『)』ではない場合は(ステップS4/NO)、取得した箇条書き情報が『1.』であるかどうかを判別する(ステップS5)。
箇条書き情報が『1.』である場合は(ステップS5/YES)、正規表現を使用し、『1.2.・・・10.11.』という形で記載されている箇条書き部分(箇条書き情報を含む部分)を探索する(ステップS3)。その後は、ステップS9へ進む。
箇条書き情報が『1.』ではない場合は(ステップS5/NO)、取得した箇条書き情報が『まる1(図7のステップS7に示すように、丸印の中に数字が入った表示形式のこと)』であるかどうかを判別する(ステップS6)。
箇条書き情報が『まる1』である場合は(ステップS6/YES)、『まる1〜まる20』の範囲で記載されている箇条書き部分(箇条書き情報を含む部分)を探索する(ステップS7)。その後は、ステップS9へ進む。
箇条書き情報が『まる1』ではない場合(ステップS6/NO)、その他の箇条書き情報として、例えば■や○などを用いて記載されている箇条書き部分(箇条書き情報を含む部分)を探索する(ステップS8)。
そして、ステップS3,S7,S8における探索で、各箇条書き情報を含む箇条書き部分が見つかったか否かを判断する(ステップS9)。
各箇条書き情報を含む箇条書き部分を見つけた場合には(ステップS9/YES)、該当部分を一行切り出す(ステップS10)。この切り出した一行は、切り出した箇条書き部分(箇条書き情報を含む)を示す情報として、箇条書き部分情報となる。箇条書き情報整形部13は、その箇条書き部分情報を、整形パターンDB14の情報を元に、箇条書き解析装置3で処理のしやすい形式(ここでは、箇条書きの内容を示す形式)に整える。そして、所定の形式となった箇条書き部分情報は、箇条書き解析装置3へ送られる。また、この時、箇条書き探索装置1に入力された電子メールデータを箇条書き解析装置3へ出力する(電子メールデータが箇条書き探索装置1への入力と同時にメール文書解析装置5へ入力されなかった場合)。また事前準備として、箇条書き情報DB2(図12参照)と、整形パターンDB14(図22参照)とにおける各情報は、あらかじめ管理者が手作業で登録しておく。
該当部分を一行切り出した(ステップS10)後、及び、各箇条書き情報を含む箇条書き部分を見つけられなかった場合には(ステップS9/NO)、箇条書き情報DB2から取得した箇条書き情報の判別を終了したかどうかを判断し(ステップS11)、終了していない場合(ステップS11/NO)、ステップS2へ戻り、終了した場合(ステップS11/YES)、箇条書き探索装置1における一連の処理を終了する。
なお、各箇条書き情報を含む箇条書き部分を見つけられなかったと判断された場合で(ステップS9/NO)、箇条書き情報DB2から取得した全ての箇条書き情報の判別を終了した場合は(ステップS11/YES)、当該電子メール中に箇条書きは無かったものと判断され、メール文書解析装置5における、当該電子メール本文の解析動作に移行する(箇条書きが無いため、箇条書き解析装置3での解析動作は省略される)。この時、箇条書き探索装置1に入力された電子メールデータをメール文書解析装置5へ出力する(電子メールデータが箇条書き探索装置1への入力と同時にメール文書解析装置5へ入力されなかった場合)。
次に、図8のフローチャートを参照して実施例の動作(箇条書き解析装置3の動作)について詳細に説明する。
箇条書き解析装置3では、同義語辞書DB4を用いて、箇条書き探索装置1によって得られた箇条書き部分情報からスケジュール情報を特定して切り出した後、分類し、不要語を削除して整える。なお、同義語辞書DB4に関しては、自然言語処理などで用いられる研究段階のものや市販されているものを使用してもよい。
箇条書き探索装置1から箇条書き部分情報を受け取ると(ステップS21)、スケジュール情報探索部31は、同義語辞書DB4の各項目(図13参照)、すなわち、『Title』、『Start Time』、『End Time』、『Room』、『Column』についての同義語をそれぞれ取得し(ステップS22,S23,S24,S25,S26)、取得した各同義語が、箇条書き探索装置1から受け取った箇条書き部分情報の中に含まれているかどうかの探索を実施し(ステップS27)、各同義語を含む部分(スケジュール情報)が見つかったかどうかを判断する(ステップS28)。
スケジュール情報が見つかった場合(ステップS28/YES)、スケジュール情報探索部31は、見つかったスケジュール情報を箇条書き部分情報から切り出す。
そして、スケジュール情報分類部32は、切り出されたスケジュール情報を、『Title』の同義語が含まれている場合には「タイトル」、『Start Time』が含まれている場合には「日付」、『Room』の同義語が含まれている場合には「場所」という形で、それぞれの同義語辞書DB4のフィールドに対応させて分類する(ステップS29)。
データ整形部33は、同義語辞書DB4の各項目(図13参照)に基づいて、分類したスケジュール情報に対して、同義語を取り除く(ステップS30)。そして形態素解析器及び構文解析器(データ整形部33に含まれる)を行い(ステップS31)、固有名詞、未知語、一般名詞、日付表現のみを取得し、記号や助詞などの不要語は削除する(ステップS32)。このようにして、スケジュール情報は整えられ、後述するスケジュール情報登録装置10へ送られる。以上で、箇条書き解析装置3における一連の処理が終了する。
そして、箇条書き解析装置3において、上述した一連の処理が終了した後は、メール文書解析装置5での動作に移行する。この時、箇条書き解析装置3に入力された電子メールデータをメール文書解析装置5へ送る(電子メールデータが箇条書き探索装置1への入力と同時にメール文書解析装置5へ入力されなかった場合)。
なお、スケジュール情報登録装置10へ送られたスケジュール情報は、分類知識DB9へ登録される。よって、このスケジュール情報は、スケジュール候補リストの作成の際に知識として参照されることになるのみで、スケジュール候補リストに直接は反映されない。なお、このスケジュール情報をユーザ表示装置120へ表示することはできる。
次に、図9のフローチャートを参照して実施例の動作(メール文書解析装置5の動作)について詳細に説明する。
電子メールのデータが入力されると、メール文書解析装置5では、メールを解析するための前処理として、該当箇所抽出部51は、解析ルールDB6のルール(図14参照)を使用して、必要な範囲を抽出する。この必要な範囲として、例えば、電子メール中の、Subject(題名)とメール本文を抜き出す(ステップS41)。なお、メール文書解析装置5への電子メールデータの入力は、上述したように箇条書き探索装置1及び箇条書き解析装置3を経由して入力されるようにしてもよいし、箇条書き探索装置1への入力と同時に入力されるようにしてもよい(この場合、メール文書解析装置5は、自装置で行う電子メールの解析動作を、箇条書き探索装置1及び箇条書き解析装置3での動作が終わるまで待機する。その理由は、当該電子メールの箇条書きの探索・解析により得られたスケジュール情報をスケジュール候補リスト作成の際に利用するためである)。
次に、該当箇所抽出部51は、メール本文中において、引用部分(例えば、<>や〜など)とそれ以外の部分とに分ける(ステップS42)。引用部分とそれ以外の部分とに分割する理由としては、それ以外の部分に記載されているスケジュール情報は、最新のものである可能性が高く、引用部分に記載されているスケジュール情報は、以前の情報であることが多いと考えられるため、別々にスコア付けを行う必要があるためである。
次に、分割された引用部分とそれ以外の部分とにおいて、「本日」や「昨日」などの日付(日時)を示す語句を、具体的な日付(日時)を示す語句(例えば、2007年9月1日10時)に置き換える(ステップS43)。
そして、構文解析器52は、取得した引用部分とそれ以外の部分とに対して、別々に、形態素解析及び構文解析を実施する(ステップS44)。構文解析器の中には形態素解析の機能を含むものがあり、その場合には構文解析機能のみを利用する。構文解析と形態素解析の両方を用いる理由としては、形態素解析のみでは、語句が分割されすぎてしまう過分割が起こるため、この場合両方の機能を用いている。
そして、フィルタ部53は、形態素解析及び構文解析結果について、分類ルールDB8の情報(図15参照)を使用し、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報候補として取得し、不要な語句(助詞や記号など)を除去する(ステップS45)。
次に、図10のフローチャートを参照して実施例の動作(スケジュール情報分類装置7の動作)について詳細に説明する。
スケジュール情報分類装置7では、スケジュール情報候補分類部71にて、フィルタ部53でフィルタリングを実施したスケジュール情報候補に対して、分類ルールDB8(図15参照)を用い、「タイトル」、「時間」、「場所」の項目に分類する。スケジュール情報候補分類部71は、まず、分類ルールDB8から分類ルール(図15参照)を取得し(ステップS51)、取得した分類ルールに沿って、「タイトル」、「日付」、「場所」の各項目に分類する(ステップS52)。
スケジュール情報候補分類部71は、各項目に分類したスケジュール情報(語句情報。図16、図17に示す「単語」の項目にある語句)について、出現回数(例えば、一の文書又は所定数の文書中に出現した回数。出現頻度ともいう)、出現文書数(出現した文書の数。文書頻度ともいう)を計算し、分類知識DB登録部73は、その計算結果を分類知識DB9に格納する(ステップS53)。分類知識DB9に格納する際に、スケジュール情報(語句情報)が格納されているかどうかを確かめ、既に格納されている場合には、出現回数、出現文書数を追加(更新)する。新規の場合には、語句情報とともに出現回数、出現文書数を格納(登録)する。
そして、スケジュール情報順位付け部72は、分類知識DB9から情報(図16、図17)を再取得する(ステップS54)。分類知識DB9に一度格納し、再取得する理由としては、スコア付けを行う際に、過去の解析データを使用するためであり、解析したデータを反映させたものを使用するためである。分類した語句に対して、スケジュール情報順位付け部72は、分類知識DB9の情報を元にして、スコアを計算し順位付けを実施し、スケジュール候補リストを作成する。
タイトルのスコア計算では、主に自然言語処理で用いられているものである出現頻度や、文書頻度、TF・IDFといったもの(関連文献1「『情報検索と言語処理』 徳永 健伸 東京大学出版会 1999年」参照)を使用して順位付けをする(ステップS55)。その順位付けの結果に基づいてタイトル候補リストを作成する(ステップS56)。
日付情報(日時情報)は、スコア計算は行わず、時間が新しいものが上位に来るように順位付けを行い(ステップS57)、その順位付けの結果に基づいて時間候補リストを作成する(ステップS58)。
場所情報では、まず過去にスケジュール管理システムに入力した回数により順位付けを行い(ステップS59)、同じスコアかどうかを判断する(ステップS60)。その結果、同じスコア(順位)の場合には(ステップS60/YES)、タイトル情報の時に使用したスコア計算方法を用い、順位付けを行う(ステップS62)。同じスコア(順位)ではない場合(ステップS60/NO)、及び、ステップS62で順位付けを行った後は、順位付けの結果に基づいて場所候補リストを作成する(ステップS61)。
そして、それぞれ作成したリストをスケジュール候補リストとし、スケジュール情報登録装置10へ送る。なお、順位付けの際に、引用部分から取得したスケジュール情報は、引用部分以外から取得した情報よりも下位に順位付けを行う(図21参照)。
次に、図11のフローチャートを参照して実施例の動作(スケジュール情報登録装置10の動作)について詳細に説明する。
スケジュール情報登録装置10では、順位付けがされたスケジュール候補リストを受け取ると(ステップS71)、そのスケジュール候補リストを元に、一番上位に来ているスケジュール情報(スコアが一番高いもの)をデフォルト値として設定し(ステップS72)、図18に示すように、ユーザ表示装置120に表示する(ステップS73)。
ユーザは、デフォルト値として画面入力されているスケジュール情報を見て、スケジュールに登録する場合には、図19に示す画面例において、登録ボタンを押す(ステップS74)。そして、スケジュール情報登録部101が、スケジュール管理システムのスケジュール管理DB110に登録するとともに(ステップS75)、スケジュールに登録した情報を知識として再利用するため、分類知識DB登録部102が、分類知識DB9に登録する(ステップS76)。両方の登録が終わると、スケジュール情報登録部101は、ユーザ表示装置120に登録完了画面を表示する(ステップS77)。また、ユーザが連続してスケジュール情報を選択したい場合には、連続登録ボタン(図18参照)を押すことで(ステップS78)、続けてスケジュール情報を登録することができる(ステップS73へ戻る)。
一方で、ユーザは、デフォルト値として画面入力されているスケジュール情報を見て、意図しないスケジュール情報が入力されている場合には、図19に示す画面例において、参照ボタン(図18参照)を押すと(ステップS79)、スケジュール情報登録部101は、スケジュール候補を例えば10件ずつ画面表示する(ステップS80)。さらに参照ボタンが押された場合は、次の10件を表示する(ステップS81)。スケジュール候補の中から所定のものが選択され、選択ボタンが押された場合は(ステップS82)、ステップS73へ戻り、ユーザに対して表示する。過去の入力データが選択された場合は(ステップS83)、分類知識DB9に格納されている情報を取得し、例えば10件ずつ表示する(ステップS85)。さらに参照ボタンが押された場合は、次の10件を表示する(ステップS86)。ユーザが所望のスケジュール候補を選択した場合(ステップS87)、ステップS80へ戻る。なお、上記において、参照しても意図したスケジュール情報が無い場合には直接入力することもできるものとする。
なお、上記説明では、図11のフローにおいて、スケジュール情報分類装置7からスケジュール候補リストを受け取った場合の動作について説明したが、スケジュール登録装置10が箇条書き解析装置3からスケジュール情報を受け取った場合は、スケジュール候補リストを作成するための知識として利用するため、分類知識DB登録部102が、そのスケジュール情報を分類知識DB9に登録する。
以上説明したように、本実施例によれば、以下の効果を得られる。
第1の効果は、スケジュール登録時の誤入力防止である。その理由は、電子メールを解析し、スケジュール情報候補リストを作成するため、ユーザは手動でスケジュール情報を入力する必要がないためである。
第2の効果は、スケジュール登録時の登録時間の削減である。その理由は、電子メールを解析し、スケジュール情報候補リストを作成するため、ユーザは手動でスケジュール情報を入力する必要がないためである。
第3の効果は、メール本文中に複数のスケジュール情報が記載されている場合にも対応できる。その理由は、スケジュール情報の候補を順位付けし、スケジュール候補リストを作成するためである。
上記実施例1の説明では、本発明のスケジュール登録支援システムにおいて、図1に示すように箇条書き探索装置1及び箇条書き解析装置3を用いる構成としたが、これらの装置1,3を省いた構成としてもよい。その場合、電子メールのデータは、メール文書解析装置5に対してのみ入力され、その後は、実施例1と同様の動作となる。つまり、電子メールにおける箇条書きの探索及び解析を行わないことになる。
なお、上記実施例1のように、箇条書き探索装置1及び箇条書き解析装置3を用いた場合は、「箇条書きの言い換えに対応できる」という効果を得ることができる。これは、本発明と、上記各特許文献1〜5を組み合わせてシステムを構成した場合との相違点でもある。上記各特許文献1〜5を組み合わせてシステムを構成した場合、箇条書きからスケジュール情報を取得することになるが、例えばタイトル、名称は同じ内容を示すがこれらの言い換えを含むようなメール文書の箇条書きに対応することは非常に難しいと考える。その理由は、特許文献1では箇条書きを取得することは可能であるものの、箇条書きからスケジュール情報を取得する方法が記載されておらず、また、その他の特許文献にも、箇条書きからスケジュール情報を取得する方法が記載されていないためである。また、従来の語句抽出方法では特定の語句を抽出することしかできず、狭い範囲の語句抽出となっていたが、本発明では、上述したように同義語辞書DBを用いてスケジュール情報(語句)を取得することにより、比較的広い範囲のスケジュール情報(語句)を抽出できる。
また、上記実施例1のように、箇条書き探索装置1及び箇条書き解析装置3を用いた場合は、箇条書き探索装置1及び箇条書き解析装置3で電子メールの箇条書きの探索及び解析を行った後に、メール文書解析装置5及びスケジュール情報分類装置7の動作を行うので、スケジュール情報分類装置7でスケジュール候補リストを作成する際に、箇条書き解析装置3で当該電子メールの箇条書きから得たスケジュール情報を、知識として利用することができる。
以上、本発明の各実施例について説明したが、上記実施例の記載に限定されるものではなく、その要旨を逸脱しない範囲において種々の変形が可能である。
例えば、上述した実施例における制御動作は、ハードウェア、または、ソフトウェア、あるいは、両者の複合構成によって実行することも可能である。
なお、ソフトウェアによる処理を実行する場合には、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
例えば、プログラムは、記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことが可能である。
あるいは、プログラムは、フロッピー(登録商標)ディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的、あるいは、永続的に格納(記録)しておくことが可能である。
このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することが可能である。
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送したりし、コンピュータでは、転送されてきたプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることが可能である。
また、上記実施例で説明した処理動作に従って時系列的に実行されるのみならず、処理を実行する装置の処理能力、あるいは、必要に応じて並列的にあるいは個別に実行するように構築することも可能である。
また、上記実施例で説明したシステムは、複数の装置の論理的集合構成にしたり、各装置の機能を混在させたりするように構築することも可能である。
本発明は、1つの電子データから所定の属性を持つ複数の語句を抽出する装置・機器、システム、方法、プログラム等に適用できる。
本発明の実施例1に係るスケジュール登録支援システムの全体構成を示すブロック図である。 本発明の実施例1に係る箇条書き探索装置の構成を示すブロック図である。 本発明の実施例1に係る箇条書き解析装置の構成を示すブロック図である。 本発明の実施例1に係るメール文書解析装置の構成を示すブロック図である。 本発明の実施例1に係るスケジュール情報分類装置の構成を示すブロック図である。 本発明の実施例1に係るスケジュール情報登録装置の構成を示すブロック図である。 本発明の実施例1に係る箇条書き探索装置の動作を示すフローチャートである。 本発明の実施例1に係る箇条書き解析装置の動作を示すフローチャートである。 本発明の実施例1に係るメール文書解析装置の動作を示すフローチャートである。 本発明の実施例1に係るスケジュール情報分類装置の動作を示すフローチャートである。 本発明の実施例1に係るスケジュール情報登録装置の動作を示すフローチャートである。 本発明の実施例1に係る箇条書き情報DBの例を示す図である。 本発明の実施例1に係る同義語辞書DBの例を示す図である。 本発明の実施例1に係る解析ルールDBの例を示す図である。 本発明の実施例1に係る分類ルールDBの例を示す図である。 本発明の実施例1に係る分類知識DBの例を示す図である。 本発明の実施例1に係る分類知識DBの例を示す図である。 本発明の実施例1に係るユーザ表示装置の表示画面例を示す図である。 本発明の実施例1に係るユーザ表示装置の表示画面例を示す図である。 本発明の実施例1に係る電子メールの記載例を示す図である。 本発明の実施例1に係るスケジュール候補リストの例を示す図である。 本発明の実施例1に係る整形パターンDBの例を示す図である。
符号の説明
1 箇条書き探索装置
2 箇条書き情報DB
3 箇条書き解析装置
4 同義語辞書DB
5 メール文書解析装置
6 解析ルールDB
7 スケジュール情報分類装置
8 分類ルールDB
9 分類知識DB
10 スケジュール情報登録装置
11 箇条書き情報取得部
12 箇条書き探索部
13 箇条書き情報整形部
14 整形パターンDB
31 スケジュール情報探索部
32 スケジュール情報分類部
33 データ整形部
51 該当箇所抽出部
52 構文解析器
53 フィルタ部
71 スケジュール情報候補分類部
72 スケジュール情報順位付け部
73 分類知識DB登録部
101 スケジュール情報登録部
102 分類知識DB登録部
110 スケジュール管理DB
120 ユーザ表示装置

Claims (24)

  1. 所定の電子文書データが入力された場合、所定のルールに従って、該電子文書データから解析対象部分を抽出する抽出部と、
    前記解析対象部分に対して、形態素解析及び構文解析を行う解析部と、
    前記形態素解析及び前記構文解析の結果に対して、所定のルールに従って、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得するフィルタ部と、
    所定のルールに従って、前記スケジュール情報を、タイトル、時間、場所のいずれかの項目に分類し、該いずれかの項目に分類したスケジュール情報について出現回数及び出現文書数を計算し、該計算の結果を分類知識情報として分類知識記憶手段に格納する分類部と、
    前記分類知識記憶手段から前記分類知識情報を再取得し、前記分類部で分類したスケジュール情報に対して、前記分類知識情報に基づいて順位付けを行い、該順位付けの結果に基づいてスケジュール候補リストを作成する順位付け部と、
    前記順位付け部で作成したスケジュール候補リストを所定のスケジュール管理システムに登録する登録部と、
    を有することを特徴とするスケジュール登録支援システム。
  2. 前記抽出部は、前記解析対象部分を、引用部分と、それ以外の部分とに分け、
    前記解析部は、前記引用部分と、前記それ以外の部分とに対して別々に、前記形態素解析及び前記構文解析を行うことを特徴とする請求項1記載のスケジュール登録支援システム。
  3. 前記順位付け部は、前記タイトルに分類したスケジュール情報の順位付けを行う場合、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする請求項1又は2記載のスケジュール登録支援システム。
  4. 前記順位付け部は、前記時間に分類したスケジュール情報の順位付けを行う場合、スコア計算は行わず、時間が新しいものが上位に来るように順位付けをすることを特徴とする請求項1又は2記載のスケジュール登録支援システム。
  5. 前記順位付け部は、前記場所に分類したスケジュール情報の順位付けを行う場合、過去に前記スケジュール管理システムに入力した回数に基づいて順位付けを行い、同じ順位かどうかを判断し、該判断の結果、同じ順位の場合には、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする請求項1又は2記載のスケジュール登録支援システム。
  6. 所定の電子文書データが入力された場合、該電子文書データの中の箇条書き部分を見つけるために用いる箇条書き情報を取得する箇条書き情報取得部と、
    前記取得した箇条書き情報に基づいて前記電子文書データの中から箇条書き部分を見つけて切り出す箇条書き探索部と、
    前記スケジュール情報となる同義語を格納した同義語辞書記憶手段を参照して、前記箇条書き部分から所定のスケジュール情報を特定して切り出すスケジュール情報探索部と、
    前記切り出したスケジュール情報を、タイトル、時間、場所のいずれかの項目に分類するスケジュール情報分類部と、を有し、
    前記登録部は、前記スケジュール情報分類部で分類したスケジュール情報を、前記分類知識情報として、前記分類知識記憶手段へ格納することを特徴とする請求項1から5のいずれか1項に記載のスケジュール登録支援システム。
  7. 前記箇条書き探索部が前記電子文書データの中から箇条書き部分を見つけられなかった場合、前記電子文書データに対して前記抽出部が処理を開始することを特徴とする請求項6記載のスケジュール登録支援システム。
  8. 前記登録部が前記スケジュール情報分類部で分類したスケジュール情報を前記分類知識情報として前記分類知識記憶手段へ格納した後、前記電子文書データに対して前記抽出部が処理を開始することを特徴とする請求項6記載のスケジュール登録支援システム。
  9. 所定の電子文書データが入力された場合、所定のルールに従って、該電子文書データから解析対象部分を抽出する抽出ステップと、
    前記解析対象部分に対して、形態素解析及び構文解析を行う解析ステップと、
    前記形態素解析及び前記構文解析の結果に対して、所定のルールに従って、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得するフィルタステップと、
    所定のルールに従って、前記スケジュール情報を、タイトル、時間、場所のいずれかの項目に分類し、該いずれかの項目に分類したスケジュール情報について出現回数及び出現文書数を計算し、該計算の結果を分類知識情報として分類知識記憶手段に格納する分類ステップと、
    前記分類知識記憶手段から前記分類知識情報を再取得し、前記分類ステップで分類したスケジュール情報に対して、前記分類知識情報に基づいて順位付けを行い、該順位付けの結果に基づいてスケジュール候補リストを作成する順位付けステップと、
    前記順位付け部で作成したスケジュール候補リストを所定のスケジュール管理システムに登録する登録ステップと、
    を有することを特徴とするスケジュール登録支援方法。
  10. 前記抽出ステップでは、前記解析対象部分を、引用部分と、それ以外の部分とに分け、
    前記解析ステップでは、前記引用部分と、前記それ以外の部分とに対して別々に、前記形態素解析及び前記構文解析を行うことを特徴とする請求項9記載のスケジュール登録支援方法。
  11. 前記順位付けステップでは、前記タイトルに分類したスケジュール情報の順位付けを行う場合、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする請求項9又は10記載のスケジュール登録支援方法。
  12. 前記順位付けステップでは、前記時間に分類したスケジュール情報の順位付けを行う場合、スコア計算は行わず、時間が新しいものが上位に来るように順位付けをすることを特徴とする請求項9又は10記載のスケジュール登録支援方法。
  13. 前記順位付けステップでは、前記場所に分類したスケジュール情報の順位付けを行う場合、過去に前記スケジュール管理システムに入力した回数に基づいて順位付けを行い、同じ順位かどうかを判断し、該判断の結果、同じ順位の場合には、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする請求項9又は10記載のスケジュール登録支援方法。
  14. 所定の電子文書データが入力された場合、該電子文書データの中の箇条書き部分を見つけるために用いる箇条書き情報を取得する箇条書き情報取得ステップと、
    前記取得した箇条書き情報に基づいて前記電子文書データの中から箇条書き部分を見つけて切り出す箇条書き探索ステップと、
    前記スケジュール情報となる同義語を格納した同義語辞書記憶手段を参照して、前記箇条書き部分から所定のスケジュール情報を特定して切り出すスケジュール情報探索ステップと、
    前記切り出したスケジュール情報を、タイトル、時間、場所のいずれかの項目に分類するスケジュール情報分類ステップと、を有し、
    前記登録ステップでは、前記スケジュール情報分類ステップで分類したスケジュール情報を、前記分類知識情報として、前記分類知識記憶手段へ格納することを特徴とする請求項9から13のいずれか1項に記載のスケジュール登録支援方法。
  15. 前記箇条書き探索ステップで前記電子文書データの中から箇条書き部分を見つけられなかった場合、前記電子文書データに対して前記抽出ステップを開始することを特徴とする請求項14記載のスケジュール登録支援方法。
  16. 前記登録ステップで前記スケジュール情報分類ステップにて分類したスケジュール情報を前記分類知識情報として前記分類知識記憶手段へ格納した後、前記電子文書データに対して前記抽出ステップを開始することを特徴とする請求項14記載のスケジュール登録支援方法。
  17. 所定の電子文書データが入力された場合、所定のルールに従って、該電子文書データから解析対象部分を抽出する抽出処理と、
    前記解析対象部分に対して、形態素解析及び構文解析を行う解析処理と、
    前記形態素解析及び前記構文解析の結果に対して、所定のルールに従って、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得するフィルタ処理と、
    所定のルールに従って、前記スケジュール情報を、タイトル、時間、場所のいずれかの項目に分類し、該いずれかの項目に分類したスケジュール情報について出現回数及び出現文書数を計算し、該計算の結果を分類知識情報として分類知識記憶手段に格納する分類処理と、
    前記分類知識記憶手段から前記分類知識情報を再取得し、前記分類処理で分類したスケジュール情報に対して、前記分類知識情報に基づいて順位付けを行い、該順位付けの結果に基づいてスケジュール候補リストを作成する順位付け処理と、
    前記順位付け部で作成したスケジュール候補リストを所定のスケジュール管理システムに登録する登録処理と、
    をコンピュータに実行させることを特徴とするプログラム。
  18. 前記抽出処理では、前記解析対象部分を、引用部分と、それ以外の部分とに分け、
    前記解析処理では、前記引用部分と、前記それ以外の部分とに対して別々に、前記形態素解析及び前記構文解析を行うことを特徴とする請求項17記載のプログラム。
  19. 前記順位付け処理では、前記タイトルに分類したスケジュール情報の順位付けを行う場合、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする請求項17又は18記載のプログラム。
  20. 前記順位付け処理では、前記時間に分類したスケジュール情報の順位付けを行う場合、スコア計算は行わず、時間が新しいものが上位に来るように順位付けをすることを特徴とする請求項17又は18記載のプログラム。
  21. 前記順位付け処理では、前記場所に分類したスケジュール情報の順位付けを行う場合、過去に前記スケジュール管理システムに入力した回数に基づいて順位付けを行い、同じ順位かどうかを判断し、該判断の結果、同じ順位の場合には、自然言語処理で用いられている、出現回数、出現文書数、TF・IDFを使用してスコア計算を行って順位付けをすることを特徴とする請求項17又は18記載のプログラム。
  22. 所定の電子文書データが入力された場合、該電子文書データの中の箇条書き部分を見つけるために用いる箇条書き情報を取得する箇条書き情報取得処理と、
    前記取得した箇条書き情報に基づいて前記電子文書データの中から箇条書き部分を見つけて切り出す箇条書き探索処理と、
    前記スケジュール情報となる同義語を格納した同義語辞書記憶手段を参照して、前記箇条書き部分から所定のスケジュール情報を特定して切り出すスケジュール情報探索処理と、
    前記切り出したスケジュール情報を、タイトル、時間、場所のいずれかの項目に分類するスケジュール情報分類処理と、コンピュータに実行させ、
    前記登録処理では、前記スケジュール情報分類処理で分類したスケジュール情報を、前記分類知識情報として、前記分類知識記憶手段へ格納することを特徴とする請求項17から21のいずれか1項に記載のプログラム。
  23. 前記箇条書き探索処理で前記電子文書データの中から箇条書き部分を見つけられなかった場合、前記電子文書データに対して前記抽出処理を開始する処理をコンピュータに実行させることを特徴とする請求項22記載のプログラム。
  24. 前記登録処理で前記スケジュール情報分類処理にて分類したスケジュール情報を前記分類知識情報として前記分類知識記憶手段へ格納した後、前記電子文書データに対して前記抽出処理を開始する処理をコンピュータに実行させることを特徴とする請求項22記載のプログラム。
JP2007264973A 2007-10-10 2007-10-10 スケジュール登録支援システム、スケジュール登録支援方法及びプログラム Withdrawn JP2009093503A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007264973A JP2009093503A (ja) 2007-10-10 2007-10-10 スケジュール登録支援システム、スケジュール登録支援方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007264973A JP2009093503A (ja) 2007-10-10 2007-10-10 スケジュール登録支援システム、スケジュール登録支援方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2009093503A true JP2009093503A (ja) 2009-04-30

Family

ID=40665416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007264973A Withdrawn JP2009093503A (ja) 2007-10-10 2007-10-10 スケジュール登録支援システム、スケジュール登録支援方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2009093503A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011001989A1 (ja) * 2009-06-29 2011-01-06 Tokuyama Masaaki ワークフロー処理プログラム、情報処理装置、及び、ワークフロー処理方法
WO2011105191A1 (ja) * 2010-02-26 2011-09-01 ブラザー工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
JP2011257939A (ja) * 2010-06-08 2011-12-22 Panasonic Corp 通信装置、通信システム、スケジュール登録方法、及びプログラム
JP2012027747A (ja) * 2010-07-26 2012-02-09 Hitachi Ltd スケジュール情報登録方法
JP2012032887A (ja) * 2010-07-28 2012-02-16 Fujitsu Ltd スケジュール管理プログラム、スケジュール管理装置およびスケジュール管理方法
JP2012118660A (ja) * 2010-11-30 2012-06-21 Yahoo Japan Corp 行動支援情報提供装置、方法、及びプログラム
JP2013196427A (ja) * 2012-03-21 2013-09-30 Casio Comput Co Ltd 予約管理装置及びプログラム
JP2014523585A (ja) * 2011-06-28 2014-09-11 マイクロソフト コーポレーション 自動的タスク抽出およびカレンダーエントリー
JP2015090610A (ja) * 2013-11-06 2015-05-11 コヨミ株式会社 スケジュール登録プログラム、スケジュール登録装置、スケジュール登録方法及びスケジュール登録システム
US10361981B2 (en) 2015-05-15 2019-07-23 Microsoft Technology Licensing, Llc Automatic extraction of commitments and requests from communications and content
KR20190107682A (ko) * 2013-04-10 2019-09-20 루슬란 알베르토비치 시가부디노 캘린더 애플리케이션들의 입력 스트림들을 프로세싱하기 위한 시스템들 및 방법들

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092746B2 (en) 2009-06-29 2015-07-28 Masaaki Tokuyama Workflow processing program, information processing device and workflow processing method
WO2011001989A1 (ja) * 2009-06-29 2011-01-06 Tokuyama Masaaki ワークフロー処理プログラム、情報処理装置、及び、ワークフロー処理方法
JP5444346B2 (ja) * 2009-06-29 2014-03-19 真旭 徳山 ワークフロー処理プログラム、情報処理装置、及び、ワークフロー処理方法
KR101358084B1 (ko) * 2009-06-29 2014-02-11 마사아키 토쿠야마 정보처리장치 및 워크플로우 처리방법
US9691040B2 (en) 2009-06-29 2017-06-27 Masaaki Tokuyama Workflow processing program, information processing device and workflow processing method
JP2011180780A (ja) * 2010-02-26 2011-09-15 Brother Industries Ltd 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
WO2011105191A1 (ja) * 2010-02-26 2011-09-01 ブラザー工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
JP2011257939A (ja) * 2010-06-08 2011-12-22 Panasonic Corp 通信装置、通信システム、スケジュール登録方法、及びプログラム
JP2012027747A (ja) * 2010-07-26 2012-02-09 Hitachi Ltd スケジュール情報登録方法
JP2012032887A (ja) * 2010-07-28 2012-02-16 Fujitsu Ltd スケジュール管理プログラム、スケジュール管理装置およびスケジュール管理方法
JP2012118660A (ja) * 2010-11-30 2012-06-21 Yahoo Japan Corp 行動支援情報提供装置、方法、及びプログラム
US10984387B2 (en) 2011-06-28 2021-04-20 Microsoft Technology Licensing, Llc Automatic task extraction and calendar entry
JP2014523585A (ja) * 2011-06-28 2014-09-11 マイクロソフト コーポレーション 自動的タスク抽出およびカレンダーエントリー
JP2013196427A (ja) * 2012-03-21 2013-09-30 Casio Comput Co Ltd 予約管理装置及びプログラム
KR20190107682A (ko) * 2013-04-10 2019-09-20 루슬란 알베르토비치 시가부디노 캘린더 애플리케이션들의 입력 스트림들을 프로세싱하기 위한 시스템들 및 방법들
KR102149478B1 (ko) * 2013-04-10 2020-08-28 루슬란 알베르토비치 시가부디노 캘린더 애플리케이션들의 입력 스트림들을 프로세싱하기 위한 시스템들 및 방법들
JP2015090610A (ja) * 2013-11-06 2015-05-11 コヨミ株式会社 スケジュール登録プログラム、スケジュール登録装置、スケジュール登録方法及びスケジュール登録システム
US10361981B2 (en) 2015-05-15 2019-07-23 Microsoft Technology Licensing, Llc Automatic extraction of commitments and requests from communications and content

Similar Documents

Publication Publication Date Title
JP2009093503A (ja) スケジュール登録支援システム、スケジュール登録支援方法及びプログラム
US8812301B2 (en) Linguistically-adapted structural query annotation
KR101960115B1 (ko) 대화 스레드의 요약 기법
JP3936243B2 (ja) 音声注釈を使用した、画像におけるイベントを区分及び識別するための方法及びシステム
US10146767B2 (en) Automatic text skimming using lexical chains
JP3691844B2 (ja) 文書処理方法
WO2009154153A1 (ja) 文書検索システム
JPH10134075A (ja) 文書処理装置、単語抽出装置、単語抽出方法、及び単語抽出プログラムを記録した記録媒体
KR101782802B1 (ko) 전자 문서 간 메모 공유 방법 및 컴퓨터 프로그램
Smith et al. Corpus tools and methods, today and tomorrow: Incorporating linguists’ manual annotations
US20120124467A1 (en) Method for automatically generating descriptive headings for a text element
JP2000331032A (ja) 文書処理装置、単語抽出装置及び単語抽出方法
JP5204203B2 (ja) 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JP2009134378A (ja) 文書群提示装置および文書群提示プログラム
JP2003108584A (ja) 情報検索システム及びプログラム
JP2007172179A (ja) 意見抽出装置、意見抽出方法、および意見抽出プログラム
JP4389102B2 (ja) 技術文献検索システム
JP4980604B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体
JP3710463B2 (ja) 翻訳支援辞書装置
KR20190084370A (ko) 지능형 법률정보 검색 방법
JP2009059290A (ja) 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム
JP2002288166A (ja) 関係情報抽出方法及び意味情報抽出方法
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008203997A (ja) 文書検索装置及びプログラム

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20100406