JP2020057195A - 要約生成サーバ、要約生成システム及び要約生成方法 - Google Patents

要約生成サーバ、要約生成システム及び要約生成方法 Download PDF

Info

Publication number
JP2020057195A
JP2020057195A JP2018187344A JP2018187344A JP2020057195A JP 2020057195 A JP2020057195 A JP 2020057195A JP 2018187344 A JP2018187344 A JP 2018187344A JP 2018187344 A JP2018187344 A JP 2018187344A JP 2020057195 A JP2020057195 A JP 2020057195A
Authority
JP
Japan
Prior art keywords
information
document
keyword
document information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018187344A
Other languages
English (en)
Other versions
JP6717909B2 (ja
Inventor
利純 岩元
Toshizumi Iwamoto
利純 岩元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Techmatrix Corp
Original Assignee
Techmatrix Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Techmatrix Corp filed Critical Techmatrix Corp
Priority to JP2018187344A priority Critical patent/JP6717909B2/ja
Publication of JP2020057195A publication Critical patent/JP2020057195A/ja
Application granted granted Critical
Publication of JP6717909B2 publication Critical patent/JP6717909B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】要約依頼者が注目する注目キーワードが要約対象の文書情報内に存在する場合に該注目キーワードを漏らさずに要約情報を生成することができる要約生成サーバ、要約生成システム及び要約生成方法を提供すること。【解決手段】要約対象の文書情報43から要約情報44を生成する要約生成サーバ10であって、要約依頼者が取り扱う分野の汎用辞書である基礎辞書に前記要約依頼者が注目する注目キーワードKWが登録され、かつ、注目キーワードKWが他の単語よりも重要度が高く登録される固有辞書42と、固有辞書42を用いて文書情報43から要約情報44を生成する要約生成部53とを備える。【選択図】図2

Description

本発明は、要約依頼者が注目する注目キーワードが要約対象の文書情報内に存在する場合に該注目キーワードを漏らさずに要約情報を生成することができる要約生成サーバ、要約生成システム及び要約生成方法に関する。
従来、文章を解析処理して、文章の内容を容易に把握するための要約文を得る技術が提案されている。例えば特許文献1に記載の文章要約装置では、文章の書かれた意図、目的等による特別な要素を予め選択基準として設定しておき、文章を構文解析して得られた情報をこの選択基準と照合比較して、重要と思われるものを要約文として抽出選択している。
特開平2−297157号公報
従来の自動要約生成装置は、要約エンジンが汎用シソーラス辞書などを用いて文献などの文書情報から重要文を抽出し、この抽出された重要文を利用して要約情報を生成する。例えば、医薬関係の自動要約生成装置は、汎用医薬用語シソーラス辞書や製薬辞書などの汎用専門分野辞書を用いて要約情報を生成する。
しかしながら、汎用専門分野辞書を用いて要約情報を生成した場合、自製薬会社が注目する薬剤や疾患等の注目キーワードが要約対象の文書情報内に存在していたにもかかわらず、重要文として抽出されず、注目キーワードが要約情報から抜けてしまう場合がある。すなわち、従来の自動要約生成装置では、自製薬会社に対応する汎用専門分野辞書を用いて要約情報を生成しても、要約依頼者の意図にそぐわない要約情報が生成されてしまう場合があるという課題がある。
本発明は、上記従来技術の課題を解決するためになされたものであって、要約依頼者が注目する注目キーワードが要約対象の文書情報内に存在する場合に該注目キーワードを漏らさずに要約情報を生成することができる要約生成サーバ、要約生成システム及び要約生成方法を提供することを目的とする。
上記の課題を解決するため、本発明は、要約対象の文書情報から要約情報を生成する要約生成サーバであって、要約依頼者が取り扱う分野の汎用辞書である基礎辞書に前記要約依頼者が注目する注目キーワードが登録され、かつ、前記注目キーワードが他の単語よりも重要度が高く登録される固有辞書と、前記固有辞書を用いて前記文書情報から前記要約情報を生成する要約生成部とを備えたことを特徴とする。
また、本発明は、上記の発明において、前記文書情報がテキスト情報でない場合、前記文書情報をテキスト情報に変換する変換部を備えたことを特徴とする。
また、本発明は、上記の発明において、前記要約生成部は、要約対象の前記文書情報内に前記注目キーワードが存在するか否かを示す注目キーワード有無情報を前記要約情報に付加することを特徴とする。
また、本発明は、上記の発明において、日本語以外の他の言語の情報を日本語の情報に翻訳する翻訳部を備え、前記要約生成部は、前記文書情報が日本語以外の他の言語である場合、日本語以外の他の言語の要約情報を生成するとともに、生成した要約情報を前記翻訳部を介して翻訳させて日本語の要約情報を生成することを特徴とする。
また、本発明は、上記の発明において、前記要約生成部は、前記要約情報の生成の際に解析した文書内キーワードを含む文書属性情報を生成することを特徴とする。
また、本発明は、上記の発明において、前記要約依頼者が利用している文書情報と該文書情報の要約教師情報とをもとに前記要約生成部を学習させる要約学習部を備えたことを特徴とする。
また、本発明は、上記の発明において、前記文書情報に前記要約情報及び前記文書属性情報を付加した文書情報セットを外部の文書検索サーバに転送する転送処理部を備えたことを特徴とする。
また、本発明は、上記の発明のいずれか一つに記載の要約生成サーバと、前記要約生成サーバにネットワークを介して接続され前記要約依頼者が前記要約対象の文書情報を前記要約生成サーバにアップロードして少なくとも前記要約情報を取得する端末装置とを備えたことを特徴とする。
また、本発明は、要約対象の文書情報から要約情報を生成する要約生成方法であって、
要約依頼者が取り扱う分野の汎用辞書に前記要約依頼者が注目する注目キーワードが登録され、かつ、前記注目キーワードが他の単語よりも重要度が高く登録される固有辞書を用いて前記文書情報から前記要約情報を生成する要約生成ステップを含むことを特徴とする。
また、本発明は、上記の発明において、前記文書情報がテキスト情報でない場合、前記文書情報をテキスト情報に変換する変換ステップを含むことを特徴とする。
また、本発明は、上記の発明において、前記要約生成ステップは、生成した前記要約情報内における前記注目キーワードの有無情報を前記要約情報に付加することを特徴とする。
本発明によれば、要約依頼者が注目する注目キーワードが要約対象の文書情報内に存在する場合に該注目キーワードを漏らさずに要約情報を生成することができる。
図1は、本実施例に係る要約生成サーバを含む要約生成システムの概要を説明するための説明図である。 図2は、図1に示した要約生成サーバを含む要約生成システムの構成を示す機能ブロック図である。 図3は、図2に示した端末装置の構成を示す機能ブロック図である。 図4は、辞書学習部による辞書学習処理手順を示すフローチャートである。 図5は、要約生成部による要約生成処理手順を示すフローチャートである。 図6は、文書属性情報の一例を示す図である。 図7は、要約情報に付加される注目キーワード有無情報の一例を示す図である。
以下に、添付図面を参照して、本発明に係る要約生成サーバ、要約生成システム及び要約生成方法の好適な実施例を詳細に説明する。
<要約生成システムの概要>
まず、本実施例に係る要約生成システムの概要について説明する。図1は、本実施例に係る要約生成サーバ10を含む要約生成システムの概要を説明するための説明図である。
図1に示すように、この要約生成システムは、要約生成サーバ10に端末装置60が接続される。端末装置60は、例えば、製薬会社で学術文献等を取り扱う要約依頼者が取り扱うパーソナルコンピュータなどである。まず、要約依頼者は、事前に自製薬会社が注目する薬剤や疾患等の注目キーワードKWを要約生成サーバ10に送信し、固有辞書42に登録する(ステップS1)。固有辞書42は、汎用医薬用語シソーラス辞書や製薬辞書などの汎用専門分野辞書を基礎辞書とし、送信された注目キーワードKWの重要度を基礎辞書の単語よりも重要度が高く登録されたものである。基礎辞書はそれ自体、製薬分野に特化した辞書であるが、固有辞書42は、この基礎辞書に、重要度を高くした注目キーワードKWを基礎辞書に登録しておくことにより、製薬会社に固有の辞書に調整される。
その後、要約依頼者は、端末装置60から、要約対象である学術文献などの文書情報43を要約生成サーバ10にアップロードする(ステップS2)。要約生成サーバ10の要約生成部53は、固有辞書42を参照して、受け付けた文書情報43の要約情報44を生成し、端末装置60に送出する(ステップS3)。要約生成部53は、要約生成エンジンであり、文書情報43内に注目キーワードKWが存在する場合、注目キーワードKWの重要度が高く設定されているため、要約情報44には、たとえ文書情報43内に一語のみ含まれていても、必ず注目キーワードKWが含まれる。
そして、要約生成部53は、文書情報43内に注目キーワードKWが存在しない場合、注目キーワードKWが存在しない旨を示す注目キーワード有無情報45を要約情報44に付加する。なお、要約生成部53は、文書情報43内に注目キーワードKWが存在する場合、注目キーワードKWが存在する旨を示す注目キーワード有無情報45を付加するようにしてもよい。
なお、要約生成部53は、要約生成処理時にテキスト情報で処理するため、受け付けた文書情報が、例えばPDF形式である場合、変換部52を介してOCR(Optical Character Recognition)処理を行ってテキスト情報に変換した文書情報43に対して要約生成を行う。
これにより、要約生成サーバ10は、要約依頼者が注目する注目キーワードKWが要約対象の文書情報43内に存在する場合に注目キーワードKWを漏らさずに要約情報44を生成することができる。
なお、一般に要約情報44は、膨大な文書情報43の中から所望の文書情報43を検索する際にも利用価値がある。文書情報43の検索対象をすべての文書情報43の内容とするのではなく、各文書情報43の要約情報44を検索対象とすることにより、文書情報43の適切な検索を短時間かつ簡易に行うことができる。ここで、文書検索に要約生成サーバ10が生成した要約情報44を用いると、注目キーワードKWが含まれている文書情報43の要約情報44には必ず注目キーワードKWが含まれているため、注目キーワードKWが含まれる文書情報43を漏らさずに検索することができる。
また、要約生成サーバ10は、注目キーワードKWが含まれていない文書情報43に対する要約情報44を生成した場合、注目キーワードKWが存在しない旨を示す注目キーワード有無情報45を要約情報44に付加するため、要約情報44の生成のもとになった文書情報43が要約依頼者にとって注目すべき文書情報43であるか否かを容易に知ることができる。
さらに、要約生成サーバ10は、テキスト情報以外の文書情報43である場合でも、文書情報43をテキスト情報に変換するようにしているので、要約依頼者にとって利便性の高いものとなる。
なお、要約生成サーバ10は、日本語以外の言語、例えば英語で記述された文書情報43である場合、英語の要約情報44を生成するとともに、英語の要約情報44を翻訳した日本語の要約情報44を生成するようにしているので、この点でも、要約依頼者にとって利便性の高いものとなる。
<要約生成サーバの構成>
次に、図1に示した要約生成サーバ10の構成について説明する。図2は、図1に示した要約生成サーバ10を含む要約生成システムの構成を示す機能ブロック図である。要約生成サーバ10には、ネットワークNを介して端末装置60と、要約情報44を用いて文書情報43の文書検索処理を行う文書検索サーバ70が接続されている。要約生成サーバ10は、入出力部20、通信部30、記憶部40及び制御部50を有する。
入出力部20は、各種操作入力及び表示出力等を行うタッチパネル式ディスプレイなどの入出力インタフェースである。通信部30は、ネットワークNを介して端末装置60及び文書検索サーバ70との通信を行うための通信インタフェースである。
記憶部40は、ハードディスク装置や不揮発性メモリ等からなる記憶デバイスであり、設定パラメータ41、固有辞書42、文書情報43、注目キーワード有無情報45を含む要約情報44、及び、文書属性情報46を記憶する。
制御部50は、要約生成サーバ10の全体を制御する制御部であり、受付部51、変換部52、要約生成部53、翻訳部54、パラメータ設定部55、辞書学習部56、要約学習部57及び文書転送処理部58を有する。制御部50は、これらの機能部に対応するプログラムを不揮発性メモリや磁気ディスク装置などの記憶装置に記憶しておき、これらのプログラムをメモリにロードして、CPUで実行することで、対応するプロセスを実行させることになる。
受付部51は、通信部30を介して端末装置60からアップロードされた注目キーワードKW、要約対象の文書情報43、各種設定情報などを受け付け、受け付けた内容に応じた処理を制御部50内の各部に引き渡す。
変換部52は、受け付けた文書情報43がテキスト情報以外である場合に、テキスト情報の文書情報43に変換する。
要約生成部53は、上記のように、固有辞書42を参照して文書情報43から要約情報44を生成する。なお、要約生成部53は、要約情報44の生成の際に解析した文書内キーワードを含む文書属性情報46を生成する。文書属性情報46は、例えば、文書情報43が文献である場合、著者名、雑誌名、日時、引用文献、文書内のキーワードなどである。
また、要約生成部53は、要約対象の文書情報43内に注目キーワードKWが存在するか否かを示す注目キーワード有無情報45を要約情報44に付加する。さらに、要約生成部53は、上記のように、文書情報43が日本語以外の他の言語である場合、日本語以外の他の言語の要約情報44を生成するとともに、生成した要約情報44を、翻訳部54を介して翻訳させて日本語の要約情報44を生成する。
翻訳部54は、日本語以外の他の言語、例えば英語の情報を日本語の情報に翻訳する。パラメータ設定部55は、設定パラメータ41を設定する。なお、記憶部40には、デフォルトの設定パラメータ41が予め設定されている。設定パラメータとしては、例えば、要約情報の文字数、翻訳対象の文書情報の文字数に対する要約情報の文字数の割合、抽出された文書内キーワードの重み付け値などである。
辞書学習部56は、要約依頼者が取り扱う分野の汎用辞書である基礎辞書に要約依頼者が注目する注目キーワードKWを順次登録し、注目キーワードKWが基礎辞書内の他の単語よりも重要度が高く登録する学習処理を行って固有辞書42を順次調整する。なお、注目キーワードKWとしては、例えば、自製薬会社が取り扱う重要な薬剤、薬剤に関する疾患、臓器、研究者などである。なお、固有辞書42は、登録された言語の類似関係や包含関係によって分類された辞書であり、かつ、重要度が設定されている。
要約学習部57は、要約依頼者が利用している文書情報43と、この文書情報43の要約教師情報とを用いて要約生成部53を学習させ、要約学習部57を調整する。
文書転送処理部58は、文書情報43に要約情報44及び文書属性情報46を付加した文書情報セットを外部の文書検索サーバ70に転送する。この文書情報セット内の要約情報44及び文書属性情報46は、検索処理時に用いられる。
<端末装置の構成>
次に、図2に示した端末装置60の構成について説明する。図3は、図2に示した端末装置60の構成を示す機能ブロック図である。端末装置60は、入力部61、表示部62、通信部63、記憶部64及び制御部65を有する。
入力部61は、キーボード又はマウス等の入力デバイスであり、表示部62は、液晶パネル等の表示デバイスであり、通信部63は、要約生成サーバ10に接続するための通信インタフェース部である。なお、入力部61及び表示部62は、例えばタッチパネル式ディスプレイによる一体型の入出力部であってもよい。また、端末装置60は、携帯端末装置であってもよい。
記憶部64は、ハードディスク装置や不揮発性メモリ等からなる記憶デバイスであり、文書情報43、要約情報44、注目キーワードKWなどを記憶する。
制御部65は、端末装置60の全体を制御する制御部であり、要約依頼処理部66を有する。制御部65は、この機能部に対応するプログラムを不揮発性メモリや磁気ディスク装置などの記憶装置に記憶しておき、このプログラムをメモリにロードして、CPUで実行することで、対応するプロセスを実行させることになる。
要約依頼処理部66は、入力部61によって受け付けた文書情報43、注目キーワードKW、設定パラメータ41などを要約生成サーバ10にアップロードし、要約生成サーバ10が生成した要約情報44をダウンロードする処理を行う。
<辞書学習処理>
次に、辞書学習部56による辞書学習処理手順について説明する。図4は、辞書学習部56による辞書学習処理手順を示すフローチャートである。図4に示すように、まず、辞書学習部56は、端末装置60から注目キーワードKWがアップロードされたか否かにより、注目キーワードKWの登録を行うか否かを判定する(ステップS101)。注目キーワードKWの登録を行わない場合であるならば(ステップS101;No)、このステップS101の判定処理を繰り返す。
一方、注目キーワードKWの登録を行う場合には(ステップS101;Yes)、注目キーワードKWの類似語の関係を生成し、注目キーワードKW及び類似語の重要度を、基礎辞書の言語よりも高くして登録し(ステップS102)、本処理を終了する。なお、本処理は、所定自時間毎に、繰り返し処理される。
<要約生成処理>
次に、要約生成部53による要約生成処理手順について説明する。図5は、要約生成部53による要約生成処理手順を示すフローチャートである。図5に示すように、まず、受付部51は、端末装置60からアップロードされた文書情報43を受け付けたか否かを判定する(ステップS201)。文書情報43を受け付けていないならば(ステップS201;No)、ステップS201の判定処理を繰り返す。
一方、文書情報43を受け付けたならば(ステップS201;Yes)、さらに文書情報43は、テキスト情報であるか否かを判定する(ステップS202)。これは、受付部51が、文書情報43の形式、例えばファイル識別子を識別することによって判定することができる。文書情報43がテキスト情報でないならば(ステップS202;No)、変換部52は、文書情報43をテキスト情報に変換し(ステップS203)、ステップS204に移行する。一方、文書情報43がテキスト情報であるならば(ステップS202;Yes)、そのままステップS204に移行する。
ステップS204では、要約生成部53は、文書情報43を解析し、文書情報43内の属性や分類などの文書属性情報46を生成する。その後、要約生成部53、固有辞書42を用いて文書情報43に出現するキーワードの重要度算出などを行い、設定パラメータ41を満足する要約情報44を生成する(ステップS205)。
その後、要約生成部53は、生成した要約情報44の言語が他の言語の一例である英語であるか否かを判定する(ステップS206)。要約情報44が英語であるならば(ステップS206;Yes)、翻訳部54を介して、要約情報44を日本語に翻訳した翻訳要約情報を生成し(ステップS207)、ステップS208に移行する。一方、要約情報44が英語でなく日本語であるならば(ステップS206;No)、そのままステップS208に移行する。
ステップS208では、要約対象の文書情報43内に注目キーワードKWが存在しているか否かを示す注目キーワード有無情報45を生成する(ステップS208)。その後、要約生成部53は、注目キーワード有無情報45が付加された要約情報44を出力し(ステップS209)、本処理を終了する。なお、要約情報44が英語である場合に日本語要約情報が要約情報44に付加される。
<文書属性情報の一例>
図6は、文書属性情報46の一例を示す図である。図6に示すように、文書属性情報46は、例えば、文書情報43の解析により、文書情報43のタイトル、著者、著者略歴、文書内のキーワード、疾患、薬剤、検査値などの属性で分類された情報である。
図6に示した文書属性情報46は、学術文献に対する一例である。学術文献では、文書情報43が定型パターンになっており、要約生成部53は、要約学習部57によって定型パターンを学習することによって、文書属性の抽出精度を向上させることができる。なお、この文書属性情報46は、文書情報43の検索時に用いることができる。
<注目キーワード有無情報の一例>
図7は、要約情報44に付加される注目キーワード有無情報45の一例を示す図である。図7に示すように、要約生成部53は、翻訳対象の文書情報43を構成する5つの文章TA〜TEの中に存在するキーワードAAA,BBB,CCC,DDD,EEEを抽出し、各キーワードの重要度の値(スコア)を比較し、上位のスコアを有する文章TB、TDを重要文として要約情報44としている。
そして、文書情報43内には注目キーワードKWが存在しなかったため、要約情報44に、「注目キーワードはありません」とする注目キーワード有無情報45を要約情報44に付加する。
要約依頼者は、この注目キーワード有無情報45を参照することによって、要約情報44の全文を読む前に、自製薬会社にとって必要な文書情報43でないことを瞬時に判断することができる。
なお、上記の実施例では、アップロードされた文書情報43が要約生成サーバ10内に格納することを前提として説明したが、要約生成サーバ10は、要約生成時に一時的に保持するのみで、要約生成後に端末装置60に転送し、あるいは削除するようにしてもよい。
また、上記の実施例では、文書情報43、要約情報44、注目キーワードKWなどを端末装置60の記憶部64に記憶する場合を示したが、本発明はこれに限定されるものではなく、これらの情報を記憶部64に記憶しないようにすることもできる。
また、上記の実施例で示した変換部52、要約生成部53(要約学習部57)、辞書学習部56などは、AI(artificial intelligence)を用いることが好ましい。
なお、上記の実施例で図示した各構成は機能概略的なものであり、必ずしも物理的に図示の構成をされていることを要しない。すなわち、各装置の分散・統合の形態は図示のものに限られず、その全部又は一部を各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
本発明に係る要約生成サーバ、要約生成システム及び要約生成方法は、要約依頼者が注目する注目キーワードが要約対象の文書情報内に存在する場合に該注目キーワードを漏らさずに要約情報を生成する場合に有用であり、特に製薬会社や医療研究機関における文献の要約生成に有用である。
10 要約生成サーバ
20 入出力部
30,63 通信部
40,64 記憶部
41 設定パラメータ
42 固有辞書
43 文書情報
44 要約情報
45 注目キーワード有無情報
46 文書属性情報
50,65 制御部
51 受付部
52 変換部
53 要約生成部
54 翻訳部
55 パラメータ設定部
56 辞書学習部
57 要約学習部
58 文書転送処理部
60 端末装置
61 入力部
62 表示部
66 要約依頼処理部
70 文書検索サーバ
KW 注目キーワード
Nネットワーク
TA〜TE 文章

Claims (11)

  1. 要約対象の文書情報から要約情報を生成する要約生成サーバであって、
    要約依頼者が取り扱う分野の汎用辞書である基礎辞書に前記要約依頼者が注目する注目キーワードが登録され、かつ、前記注目キーワードが他の単語よりも重要度が高く登録される固有辞書と、
    前記固有辞書を用いて前記文書情報から前記要約情報を生成する要約生成部と
    を備えたことを特徴とする要約生成サーバ。
  2. 前記文書情報がテキスト情報でない場合、前記文書情報をテキスト情報に変換する変換部を備えたことを特徴とする請求項1に記載の要約生成サーバ。
  3. 前記要約生成部は、要約対象の前記文書情報内に前記注目キーワードが存在するか否かを示す注目キーワード有無情報を前記要約情報に付加することを特徴とする請求項1又は2に記載の要約生成サーバ。
  4. 日本語以外の他の言語の情報を日本語の情報に翻訳する翻訳部を備え、
    前記要約生成部は、前記文書情報が日本語以外の他の言語である場合、日本語以外の他の言語の要約情報を生成するとともに、生成した要約情報を前記翻訳部を介して翻訳させて日本語の要約情報を生成することを特徴とする請求項1〜3のいずれか一つに記載の要約生成サーバ。
  5. 前記要約生成部は、前記要約情報の生成の際に解析した文書内キーワードを含む文書属性情報を生成することを特徴とする請求項1〜4のいずれか一つに記載の要約生成サーバ。
  6. 前記要約依頼者が利用している文書情報と該文書情報の要約教師情報とをもとに前記要約生成部を学習させる要約学習部を備えたことを特徴とする請求項1〜5のいずれか一つに記載の要約生成サーバ。
  7. 前記文書情報に前記要約情報及び前記文書属性情報を付加した文書情報セットを外部の文書検索サーバに転送する転送処理部を備えたことを特徴とする請求項5に記載の要約生成サーバ。
  8. 請求項1〜7のいずれか一つに記載の要約生成サーバと、
    前記要約生成サーバにネットワークを介して接続され前記要約依頼者が前記要約対象の文書情報を前記要約生成サーバにアップロードして少なくとも前記要約情報を取得する端末装置と
    を備えたことを特徴とする要約生成システム。
  9. 要約対象の文書情報から要約情報を生成する要約生成方法であって、
    要約依頼者が取り扱う分野の汎用辞書に前記要約依頼者が注目する注目キーワードが登録され、かつ、前記注目キーワードが他の単語よりも重要度が高く登録される固有辞書を用いて前記文書情報から前記要約情報を生成する要約生成ステップを含むことを特徴とする要約生成方法。
  10. 前記文書情報がテキスト情報でない場合、前記文書情報をテキスト情報に変換する変換ステップを含むことを特徴とする請求項9に記載の要約生成方法。
  11. 前記要約生成ステップは、生成した前記要約情報内における前記注目キーワードの有無情報を前記要約情報に付加することを特徴とする請求項9又は10に記載の要約生成方法。
JP2018187344A 2018-10-02 2018-10-02 要約生成サーバ、要約生成システム及び要約生成方法 Active JP6717909B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018187344A JP6717909B2 (ja) 2018-10-02 2018-10-02 要約生成サーバ、要約生成システム及び要約生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018187344A JP6717909B2 (ja) 2018-10-02 2018-10-02 要約生成サーバ、要約生成システム及び要約生成方法

Publications (2)

Publication Number Publication Date
JP2020057195A true JP2020057195A (ja) 2020-04-09
JP6717909B2 JP6717909B2 (ja) 2020-07-08

Family

ID=70107356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018187344A Active JP6717909B2 (ja) 2018-10-02 2018-10-02 要約生成サーバ、要約生成システム及び要約生成方法

Country Status (1)

Country Link
JP (1) JP6717909B2 (ja)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222520A (ja) * 1997-01-31 1998-08-21 Toshiba Corp 電子化文書処理装置
JPH10340271A (ja) * 1997-06-09 1998-12-22 Fuji Xerox Co Ltd 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体
JPH11288414A (ja) * 1998-04-02 1999-10-19 Toshiba Corp 文書作成装置
JP2001282815A (ja) * 2000-03-28 2001-10-12 Hitachi Ltd 要約読み上げ装置
JP2001339424A (ja) * 2000-05-26 2001-12-07 Nec Corp 電子メール処理システム、処理方法及び処理装置
JP2002230037A (ja) * 2001-01-31 2002-08-16 Kddi Corp 検索システム、方法及びプログラム
JP2002245065A (ja) * 2001-02-14 2002-08-30 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラムおよび記録媒体
JP2004253011A (ja) * 2004-06-07 2004-09-09 National Institute Of Information & Communication Technology 自動要約処理装置および自動要約処理方法
JP2006318509A (ja) * 2006-08-17 2006-11-24 National Institute Of Information & Communication Technology 解データ編集処理装置および処理方法
JP2014235511A (ja) * 2013-05-31 2014-12-15 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、及びコンピュータプログラム
JP2017054509A (ja) * 2015-09-09 2017-03-16 ウバープル カンパニー リミテッド 文抽出方法及びシステム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222520A (ja) * 1997-01-31 1998-08-21 Toshiba Corp 電子化文書処理装置
JPH10340271A (ja) * 1997-06-09 1998-12-22 Fuji Xerox Co Ltd 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体
JPH11288414A (ja) * 1998-04-02 1999-10-19 Toshiba Corp 文書作成装置
JP2001282815A (ja) * 2000-03-28 2001-10-12 Hitachi Ltd 要約読み上げ装置
JP2001339424A (ja) * 2000-05-26 2001-12-07 Nec Corp 電子メール処理システム、処理方法及び処理装置
JP2002230037A (ja) * 2001-01-31 2002-08-16 Kddi Corp 検索システム、方法及びプログラム
JP2002245065A (ja) * 2001-02-14 2002-08-30 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラムおよび記録媒体
JP2004253011A (ja) * 2004-06-07 2004-09-09 National Institute Of Information & Communication Technology 自動要約処理装置および自動要約処理方法
JP2006318509A (ja) * 2006-08-17 2006-11-24 National Institute Of Information & Communication Technology 解データ編集処理装置および処理方法
JP2014235511A (ja) * 2013-05-31 2014-12-15 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、及びコンピュータプログラム
JP2017054509A (ja) * 2015-09-09 2017-03-16 ウバープル カンパニー リミテッド 文抽出方法及びシステム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
長尾 確: "デジタルコンテンツの意味的拡張とその応用", 言語処理学会第8回年次大会ワークショップ「社会情報基盤のための言語・メディア処理」論文集, JPN6019051977, 16 March 2002 (2002-03-16), JP, pages 1 - 15, ISSN: 0004189266 *

Also Published As

Publication number Publication date
JP6717909B2 (ja) 2020-07-08

Similar Documents

Publication Publication Date Title
US8594992B2 (en) Method and system for using alignment means in matching translation
US8484238B2 (en) Automatically generating regular expressions for relaxed matching of text patterns
KR100936204B1 (ko) 카피 앤드 페이스트 처리 방법, 장치 및 기록 매체
EP1450267B1 (en) Methods and systems for language translation
US10417267B2 (en) Information processing terminal and method, and information management apparatus and method
US20110137943A1 (en) Apparatus for deciding word-related keywords, and method and program for controlling operation of same
JP2006073012A (ja) 予め定められた個数の予め定義された質問に応答することによって情報を管理するシステムおよび方法
JP7211901B2 (ja) 情報処理装置および情報処理方法
Xia et al. Enriching a massively multilingual database of interlinear glossed text
CN104536769A (zh) 一种国际化文档实现方法
Iurshina et al. NILK: entity linking dataset targeting NIL-linking cases
KR102260396B1 (ko) 범용 신경망 기계번역기를 활용한 하이브리드 번역 시스템
JP6095487B2 (ja) 質問応答装置、及び質問応答方法
TW202011219A (zh) 利用文字解析結果與自然語言輸入的文件搜尋系統
Vandeghinste et al. Improving the translation environment for professional translators
US20210263915A1 (en) Search Text Generation System and Search Text Generation Method
JP6717909B2 (ja) 要約生成サーバ、要約生成システム及び要約生成方法
JP2009086979A (ja) 組織名抽出装置、方法及びプログラム
Rebholz-Schuhmann et al. IeXML: towards an annotation framework for biomedical semantic types enabling interoperability of text processing modules
JP2010198525A (ja) 言語横断型情報検索システムおよび言語横断型情報検索方法
Nitu et al. Reconstructing scanned documents for full-text indexing to empower digital library services
Cummings et al. The Holinshed Project: Comparing and linking two editions of Holinshed's Chronicle
US11645472B2 (en) Conversion of result processing to annotated text for non-rich text exchange
JP7244767B2 (ja) 情報処理装置、制御方法、及びプログラム
US11720531B2 (en) Automatic creation of database objects

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181016

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200611

R150 Certificate of patent or registration of utility model

Ref document number: 6717909

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250