JP2017054509A - 文抽出方法及びシステム - Google Patents
文抽出方法及びシステム Download PDFInfo
- Publication number
- JP2017054509A JP2017054509A JP2016174150A JP2016174150A JP2017054509A JP 2017054509 A JP2017054509 A JP 2017054509A JP 2016174150 A JP2016174150 A JP 2016174150A JP 2016174150 A JP2016174150 A JP 2016174150A JP 2017054509 A JP2017054509 A JP 2017054509A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- document
- important
- keyword
- sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 68
- 238000004590 computer program Methods 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 claims description 5
- 238000010187 selection method Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 description 33
- 238000010586 diagram Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000010276 construction Methods 0.000 description 10
- 239000000470 constituent Substances 0.000 description 6
- 238000010295 mobile communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
Abstract
Description
以下、本発明について添付された図面を参照してより詳細に説明する。図1は本発明の一実施形態による重要文抽出の概念を説明するための図である。
したがって、本発明の一実施形態による重要文抽出によれば、読者の選好度により文書10から抽出された重要文が異なる。
ここで、Tnは文書Aを引用している他の文書である。PR(Tn)はTn文書にページランクアルゴリズムを適用して算出した重要度である。すなわち、PR(Tn)はTnのページランク値である。C(Tn)はTnを引用しているまた他の文書の数である。また、dは読者またはウェブサーファーが文書Aに満足せず、他の文書を調べる確率である。dはdamping factorの役割を行い、0.85に設定し得る。
ここで、Tnは文Aに該当するバーテックスに連結された他のバーテックスである。PRw(Tn)PRw(Tn)はTnバーテックスに変形されたページランクアルゴリズムを適用して算出した重要度である。すなわち、PRw(Tn)はTnバーテックスのページランク値である。本発明の一実施形態による文書要約装置100はPRw(Tn)の初期値として任意の数(Arbitrary number)を代入し、PRw(Tn)が一定の値に収束するときまで変形されたページランクアルゴリズムを繰り返し(iterative)行う。しかし、本発明の他の実施形態による文書要約装置100はPRw(Tn)の初期値にw(Tn)を代入し、PRw(Tn)が一定の値に収束するときまで変形されたページランクアルゴリズムを繰り返し行う。この場合、文書要約装置100は変形されたページランクアルゴリズムをより少なく行ってもPRw(Tn)を算出できるであろう。
バーテックスA、B、D及びEのキーワードとの関連度による加重値、w(Tn)変形されたページランクを適用して算出した重要度PRw(Tn)及びバーテックスに付属したエッジの数C(Tn)は以下の表2の通りであり、文書要約装置100は以下の数4のようにバーテックスCの重要度を0.4に算定する。このとき、dは0.8であると仮定する。
ここで、Tnは文Aに該当するバーテックスに連結された他のバーテックスである。PRw(Tn)はTnバーテックスに変形されたページランクアルゴリズムを適用して算出した重要度である。すなわち、PRw(Tn)はTnバーテックスのページランク値である。本発明の一実施形態による重要度算定部120はPRw(Tn)の初期値として任意の数(Arbitrary number)を代入し、PRw(Tn)が一定の値に収束するときまで変形されたページランクアルゴリズムを繰り返し(iterative)行う。しかし、本発明の他の実施形態による重要度算定部120はPRw(Tn)の初期値にw(Tn)を代入し、PRw(Tn)が一定の値に収束するときまで変形されたページランクアルゴリズムを繰り返し行う。この場合、文書要約装置100は変形されたページランクアルゴリズムをより少なく行ってもPRw(Tn)を算出できるであろう。
Claims (16)
- キーワードを受信する段階と、
複数の文を含む文書をパーシングして前記文書に含まれた各文を識別する段階と、
前記各文をバーテックス(Vertex)とし、前記各文間の類似度をエッジ(Edge)の加重値(Weight)とするグラフを構成する段階と、
前記グラフに変形されたページランクアルゴリズム(PageRank algorithm)を適用して前記各文の重要度を算定し、前記変形されたページランクアルゴリズムは前記キーワードとの関連度による加重値が反映されるように変形された段階と、
前記算定された重要度を基準に前記文書から重要文を抽出する段階を含み、
前記ページランクアルゴリズムは、
第1バーテックスに隣接したバーテックスの相対的な重要度を基準に前記第1バーテックスの重要度を算定し、前記第1バーテックスに隣接した各バーテックスの文に前記キーワードが含まれているかどうかと関連した加重値が前記第1バーテックスに隣接した各バーテックスの相対的な重要度に反映されたアルゴリズムである文書要約方法。 - 前記グラフを構成する段階は、
前記各文をバーテックスとするグラフを構成し、前記グラフはすべてのバーテックスがエッジによって連結された完全グラフである段階と、
前記各文間の類似度を算定し、算定された類似度を前記バーテックスの間を連結するエッジの加重値として付与する段階と、
前記グラフからすでに指定された臨界値より低い加重値が付与されたエッジを除去する段階を含む請求項1に記載の文書要約方法。 - 前記重要文を抽出する段階は、
前記文書からすでに指定されたk個の重要文を抽出し、前記k個の重要文は前記重要度が最大である文から前記重要度が低くなる順に抽出される段階と、
前記重要文の前記文書内での位置を基準に前記k個の重要文を再配列して要約文を生成する段階を含む請求項1に記載の文書要約方法。 - 前記重要文を抽出する段階は、
前記文書から一つの重要文を抽出する段階と、
前記抽出された重要文のバーテックスにエッジによって連結された他のバーテックスの文のうち要約文の生成に利用される文を選択する段階と、
前記抽出された重要文及び前記選択された要約文の生成に利用される文を利用して要約文を生成する段階を含む請求項1に記載の文書要約方法。 - ユーザ端末から文書の重要文を抽出するためのキーワードを含まない文書の要約要請を受信する段階と、
前記ユーザ端末のユーザに対するプロファイルを基準に前記ユーザの選好度が反映されたキーワードを選定する段階と、
前記選定されたキーワードに基づいて前記文書から重要文を抽出する段階と、
前記抽出された重要文に基づいて前記文書の要約文を生成する段階を含む文書要約方法。 - 前記キーワードを選定する段階は、
前記ユーザの選好度が反映された第1キーワード及び第2キーワードを選定する段階を含み、
前記重要文を抽出する段階は、
前記第1キーワードに基づいて前記文書からすでに指定されたk個の重要文を抽出する段階と、
前記第2キーワードに基づいて前記文書からすでに指定されたm個の重要文を抽出する段階を含み、
前記要約文を生成する段階は、
前記第1キーワードによって抽出されたk個の重要文及び前記第2キーワードによって抽出されたm個の重要文のうち同一の文に基づいて前記要約文を生成する段階を含む請求項5に記載の文書要約方法。 - 第1キーワード及び第2キーワードを受信する段階と、
前記第1キーワードに基づいて複数の文を含む文書からk個の重要文を抽出する段階と、
前記k個の重要文に基づいて第1要約文を生成する段階と、
前記第2キーワードに基づいて第1要約文からm個の重要文を抽出する段階と、
前記m個の重要文に基づいて第2要約文を生成する段階を含む文書要約方法。 - 第1キーワード及び前記第1キーワードと異なる第2キーワードを受信する段階と、
前記第1キーワードに基づいて複数の文を含む文書から第1重要文を抽出する段階と、
前記第2キーワードに基づいて前記文書から第2重要文を抽出する段階と、
前記第1重要文と前記第2重要文を含む要約文を生成する段階を含み、
前記第1重要文と前記第2重要文は互いに異なる文である文書要約方法。 - ユーザ端末から検索キーワードを受信する段階と、
前記受信された検索キーワードを利用して予備検索を行う段階と、
前記予備検索を行った結果、検索された文書から重要文を抽出する段階と、
前記抽出された重要文に前記検索キーワードが含まれているかどうかを反映して前記予備検索を行った結果を再構成した最終検索結果を構成する段階を含む検索サービス提供方法。 - 前記重要文を抽出する段階は、
前記文書からすでに指定されたk個の重要文を抽出し、前記k個の重要文は文の重要度が最大である文から前記重要度が低くなる順に抽出する段階を含み、
前記最終検索結果を構成する段階は、
前記検索キーワードが前記k個の重要文のどこにも含まれていない場合、前記文書が除外された前記最終検索結果を構成する段階を含む請求項9に記載の検索サービス提供方法。 - 前記ユーザ端末からフィルタリングキーワードを受信する段階をさらに含み、
前記重要文を抽出する段階は、
前記文書からすでに指定されたk個の重要文を抽出し、前記k個の重要文は文の重要度が最大である文から前記重要度が低くなる順に抽出される段階を含み、
前記最終検索結果を構成する段階は、
前記フィルタリングキーワードが前記k個の重要文に含まれている場合、前記文書が除外された前記最終検索結果を構成する段階を含む請求項9に記載の検索サービス提供方法。 - 前記重要文を抽出する段階は、
すでに指定されたm個の文書それぞれから重要文を抽出し、前記m個の文書は前記検索キーワードによって検索された文書の段階を含み、
前記最終検索結果を構成する段階は、
前記抽出された重要文間の類似度を算定する段階と、
前記類似度がすでに指定された臨界値より低い重要文が抽出される文書を前記最終検索結果から除外する段階を含む請求項9に記載の検索サービス提供方法。 - 第1文書及び第2文書を含む複数の文書を受信する段階と、
クラスタキーワードを含むコンテンツクラスタリング要請を受信する段階と、
前記クラスタキーワードを利用して第1文書から第1重要文を抽出する段階と、
前記クラスタキーワードを利用して第2文書から第2重要文を抽出する段階と、
前記第1重要文と前記第2重要文との間の類似度を算定する段階と、
前記算定された類似度を基準に前記第1文書と前記第2文書が一つのクラスタに含まれ得るかどうかを決定する段階を含むコンテンツクラスタリング方法。 - 複数の文で構成されたテキストから重要文を選定する方法において、
第1キーワードに基づいて前記テキストから第1重要文を選定する段階と、
前記第1キーワードと異なる第2キーワードに基づいて前記テキストから前記第1重要文と異なる第2重要文を選定する段階と、
前記第1キーワード及び前記第2キーワードに対応する前記テキストの要約結果として、前記第1重要文及び前記第2重要文を含む前記テキストの要約データをユーザ端末に送信する段階を含む重要文選定方法。 - ネットワークインターフェースと、
一つ以上のプロセッサと、
前記プロセッサによって行われるコンピュータプログラムをロード(load)するメモリと、
一つ以上のファイルを保存するストレージを含み、
前記コンピュータプログラムは、
キーワードを受信するオペレーションと、
複数の文を含む文書をパーシングして前記文書に含まれた各文を識別するオペレーションと、
前記各文をバーテックスとし、前記各文間の類似度をエッジの加重値とするグラフを構成するオペレーションと、
前記グラフに変形されたページランクアルゴリズムを適用して前記各文の重要度を算定し、前記変形されたページランクアルゴリズムは前記キーワードとの関連度による加重値が反映されるように変形されたオペレーションと、
前記算定された重要度を基準に前記文書から重要文を抽出するオペレーションを含み、
前記ページランクアルゴリズムは、
第1バーテックスに隣接したバーテックスの相対的な重要度を基準に前記第1バーテックスの重要度を算定し、前記第1バーテックスに隣接した各バーテックスの文に前記キーワードが含まれているかどうかと関連した加重値が前記第1バーテックスに隣接した各バーテックスの相対的な重要度に反映されたアルゴリズムである文書要約装置。 - キーワードを受信する段階と、
複数の文を含む文書をパーシングして前記文書に含まれた各文を識別する段階と、
前記各文をバーテックスとし、前記各文間の類似度をエッジの加重値とするグラフを構成する段階と、
前記グラフに変形されたページランクアルゴリズムを適用して前記各文の重要度を算定し、前記変形されたページランクアルゴリズムは前記キーワードとの関連度による加重値が適用されるように反映された段階と、
前記算定された重要度を基準に前記文書から重要文を抽出する段階を実行させ、
前記ページランクアルゴリズムは、
第1バーテックスに隣接したバーテックスの相対的な重要度を基準に前記第1バーテックスの重要度を算定し、前記第1バーテックスに隣接した各バーテックスの文に前記キーワードが含まれているかどうかと関連した加重値が前記第1バーテックスに隣接した各バーテックスの相対的な重要度に反映されたアルゴリズムであるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2015-0127556 | 2015-09-09 | ||
KR1020150127556A KR101656245B1 (ko) | 2015-09-09 | 2015-09-09 | 문장 추출 방법 및 시스템 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017233294A Division JP6646030B2 (ja) | 2015-09-09 | 2017-12-05 | 文抽出方法及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017054509A true JP2017054509A (ja) | 2017-03-16 |
JP6272417B2 JP6272417B2 (ja) | 2018-01-31 |
Family
ID=56939322
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016174150A Active JP6272417B2 (ja) | 2015-09-09 | 2016-09-07 | 文抽出方法及びシステム |
JP2017233294A Active JP6646030B2 (ja) | 2015-09-09 | 2017-12-05 | 文抽出方法及びシステム |
JP2020002212A Active JP6905098B2 (ja) | 2015-09-09 | 2020-01-09 | 文抽出方法及びシステム |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017233294A Active JP6646030B2 (ja) | 2015-09-09 | 2017-12-05 | 文抽出方法及びシステム |
JP2020002212A Active JP6905098B2 (ja) | 2015-09-09 | 2020-01-09 | 文抽出方法及びシステム |
Country Status (4)
Country | Link |
---|---|
US (2) | US10430468B2 (ja) |
JP (3) | JP6272417B2 (ja) |
KR (1) | KR101656245B1 (ja) |
CN (1) | CN107025216A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020057195A (ja) * | 2018-10-02 | 2020-04-09 | テクマトリックス株式会社 | 要約生成サーバ、要約生成システム及び要約生成方法 |
JP2021131769A (ja) * | 2020-02-20 | 2021-09-09 | ソフトバンク株式会社 | 要約生成プログラム、要約生成装置および要約生成方法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10762283B2 (en) * | 2015-11-20 | 2020-09-01 | Adobe Inc. | Multimedia document summarization |
US10572726B1 (en) * | 2016-10-21 | 2020-02-25 | Digital Research Solutions, Inc. | Media summarizer |
CN108038096A (zh) * | 2017-11-10 | 2018-05-15 | 平安科技(深圳)有限公司 | 知识库文档快速检索方法、应用服务器计算机可读存储介质 |
CN109753651B (zh) * | 2018-12-14 | 2022-05-17 | 昆明理工大学 | 一种针对体现用户意图的app软件用户评论挖掘方法 |
EP3739491B1 (en) | 2019-05-17 | 2022-07-06 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
CN110263343B (zh) * | 2019-06-24 | 2021-06-15 | 北京理工大学 | 基于短语向量的关键词抽取方法及系统 |
US11281854B2 (en) * | 2019-08-21 | 2022-03-22 | Primer Technologies, Inc. | Limiting a dictionary used by a natural language model to summarize a document |
CN111291186B (zh) * | 2020-01-21 | 2024-01-09 | 北京捷通华声科技股份有限公司 | 一种基于聚类算法的上下文挖掘方法、装置和电子设备 |
CN111859982B (zh) * | 2020-06-19 | 2024-04-26 | 北京百度网讯科技有限公司 | 语言模型的训练方法、装置、电子设备及可读存储介质 |
US20220353100A1 (en) * | 2021-04-30 | 2022-11-03 | Zoom Video Communications, Inc. | Automated Recording Highlights For Conferences |
US11863711B2 (en) | 2021-04-30 | 2024-01-02 | Zoom Video Communications, Inc. | Speaker segment analysis for conferences |
US11409800B1 (en) | 2021-07-23 | 2022-08-09 | Bank Of America Corporation | Generating search queries for database searching |
KR20230046086A (ko) | 2021-09-29 | 2023-04-05 | 한국전자통신연구원 | 중요 문장 기반 검색 서비스 제공 장치 및 방법 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0293866A (ja) * | 1988-09-30 | 1990-04-04 | Toshiba Corp | 要約生成方法および要約生成装置 |
JPH06231178A (ja) * | 1993-01-28 | 1994-08-19 | Toshiba Corp | 文書検索装置 |
JPH10207891A (ja) * | 1997-01-17 | 1998-08-07 | Fujitsu Ltd | 文書要約装置およびその方法 |
JPH1145289A (ja) * | 1997-07-28 | 1999-02-16 | Just Syst Corp | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 |
JP2000172716A (ja) * | 1998-12-03 | 2000-06-23 | Ricoh Co Ltd | 文書検索装置および文書検索方法 |
JP2002297633A (ja) * | 2001-03-29 | 2002-10-11 | Ricoh Co Ltd | 重要文抽出装置および方法並びにコンピュータプログラム |
JP2004318243A (ja) * | 2003-04-11 | 2004-11-11 | Canon Inc | 情報検索装置 |
JP2005085112A (ja) * | 2003-09-10 | 2005-03-31 | Toshiba Corp | 情報分類システム及びプログラム |
JP2005174003A (ja) * | 2003-12-11 | 2005-06-30 | Sanyo Electric Co Ltd | 要約生成方法およびプログラム |
JP2008097077A (ja) * | 2006-10-06 | 2008-04-24 | Kobe Steel Ltd | 重要文選出装置,重要文選出プログラム,重要文選出方法 |
WO2011036703A1 (ja) * | 2009-09-24 | 2011-03-31 | 株式会社 東芝 | 情報選択装置 |
JP2012104041A (ja) * | 2010-11-12 | 2012-05-31 | Nippon Telegr & Teleph Corp <Ntt> | テキストデータ要約装置、テキストデータ要約方法及びテキストデータ要約プログラム |
JP2013161457A (ja) * | 2012-02-08 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 文書要約装置及び方法及びプログラム |
JP2014528620A (ja) * | 2011-10-14 | 2014-10-27 | ヤフー! インコーポレイテッド | 電子文書の内容を自動的に要約するための方法及び装置 |
JP2015090663A (ja) * | 2013-11-07 | 2015-05-11 | 三菱電機株式会社 | テキスト要約装置 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7017114B2 (en) * | 2000-09-20 | 2006-03-21 | International Business Machines Corporation | Automatic correlation method for generating summaries for text documents |
US7092872B2 (en) * | 2001-06-19 | 2006-08-15 | Fuji Xerox Co., Ltd. | Systems and methods for generating analytic summaries |
KR100435442B1 (ko) | 2001-11-13 | 2004-06-10 | 주식회사 포스코 | 문서 요약 방법 및 시스템 |
KR100849272B1 (ko) | 2001-11-23 | 2008-07-29 | 주식회사 엘지이아이 | 마크업 문서 자동 요약 방법 |
US7392280B2 (en) * | 2001-11-27 | 2008-06-24 | International Business Machines Corporation | Method for summarization of threads in electronic mail |
US7421504B2 (en) * | 2002-05-08 | 2008-09-02 | Matsushita Electric Industrial Co., Ltd. | Service providing device and service providing method |
JP3816891B2 (ja) * | 2003-04-14 | 2006-08-30 | 株式会社東芝 | 要約作成装置、要約作成方法、メッセージ配信装置、メッセージ配信方法およびプログラム |
CN1609845A (zh) * | 2003-10-22 | 2005-04-27 | 国际商业机器公司 | 用于改善由机器自动生成的摘要的可读性的方法和装置 |
CN1629834A (zh) * | 2003-12-17 | 2005-06-22 | 国际商业机器公司 | 计算机辅助写作、电子文档的浏览、检索和预订发布 |
JP2005301584A (ja) * | 2004-04-09 | 2005-10-27 | Mitsubishi Electric Corp | 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム |
NO20052215L (no) * | 2005-05-06 | 2006-11-07 | Fast Search & Transfer Asa | Fremgangsmate til bestemmelse av kontekstuell sammendragsinformasjon over dokumenter |
CN1916904A (zh) * | 2006-09-01 | 2007-02-21 | 北大方正集团有限公司 | 一种基于文档扩展的单文档摘要方法 |
CA2679094A1 (en) * | 2007-02-23 | 2008-08-28 | 1698413 Ontario Inc. | System and method for delivering content and advertisements |
JP5040396B2 (ja) * | 2007-03-28 | 2012-10-03 | 富士通株式会社 | Webページ検索プログラム、方法、及び装置 |
US7747600B2 (en) * | 2007-06-13 | 2010-06-29 | Microsoft Corporation | Multi-level search |
US7716054B2 (en) * | 2007-06-29 | 2010-05-11 | Microsoft Corporation | Activity-ware for non-textual objects |
CN101446940B (zh) * | 2007-11-27 | 2011-09-28 | 北京大学 | 为文档集自动生成摘要的方法及装置 |
CN101526938B (zh) * | 2008-03-06 | 2011-12-28 | 夏普株式会社 | 文档处理装置 |
JP4942727B2 (ja) * | 2008-11-26 | 2012-05-30 | 日本電信電話株式会社 | テキスト要約装置、その方法およびプログラム |
WO2011095923A1 (en) * | 2010-02-03 | 2011-08-11 | Syed Yasin | Self-learning methods for automatically generating a summary of a document, knowledge extraction and contextual mapping |
US8489600B2 (en) * | 2010-02-23 | 2013-07-16 | Nokia Corporation | Method and apparatus for segmenting and summarizing media content |
US20110295612A1 (en) * | 2010-05-28 | 2011-12-01 | Thierry Donneau-Golencer | Method and apparatus for user modelization |
US8594998B2 (en) * | 2010-07-30 | 2013-11-26 | Ben-Gurion University Of The Negev Research And Development Authority | Multilingual sentence extractor |
KR101290439B1 (ko) * | 2011-04-15 | 2013-07-26 | 경북대학교 산학협력단 | 문장 네트워크 기반 회의록 요약 방법 |
KR101696499B1 (ko) * | 2012-02-15 | 2017-01-13 | 한국전자통신연구원 | 한국어 키워드 검색문 해석 장치 및 방법 |
US8892523B2 (en) * | 2012-06-08 | 2014-11-18 | Commvault Systems, Inc. | Auto summarization of content |
US9436766B1 (en) * | 2012-11-16 | 2016-09-06 | Google Inc. | Clustering of documents for providing content |
US10691737B2 (en) * | 2013-02-05 | 2020-06-23 | Intel Corporation | Content summarization and/or recommendation apparatus and method |
US20150348538A1 (en) * | 2013-03-14 | 2015-12-03 | Aliphcom | Speech summary and action item generation |
US20150293928A1 (en) * | 2014-04-14 | 2015-10-15 | David Mo Chen | Systems and Methods for Generating Personalized Video Playlists |
WO2015163857A1 (en) * | 2014-04-22 | 2015-10-29 | Hewlett-Packard Development Company, L.P. | Determining an optimized summarizer architecture for a selected task |
KR101549792B1 (ko) * | 2014-10-01 | 2015-09-02 | 삼성에스디에스 주식회사 | 문서 자동 작성 장치 및 방법 |
KR101548096B1 (ko) * | 2015-02-02 | 2015-08-27 | 숭실대학교산학협력단 | 문서 자동 요약 방법 및 서버 |
US20160299881A1 (en) * | 2015-04-07 | 2016-10-13 | Xerox Corporation | Method and system for summarizing a document |
-
2015
- 2015-09-09 KR KR1020150127556A patent/KR101656245B1/ko active IP Right Grant
-
2016
- 2016-09-07 CN CN201610809405.9A patent/CN107025216A/zh active Pending
- 2016-09-07 JP JP2016174150A patent/JP6272417B2/ja active Active
- 2016-09-09 US US15/260,923 patent/US10430468B2/en active Active
-
2017
- 2017-12-05 JP JP2017233294A patent/JP6646030B2/ja active Active
-
2019
- 2019-09-12 US US16/568,868 patent/US20200004790A1/en not_active Abandoned
-
2020
- 2020-01-09 JP JP2020002212A patent/JP6905098B2/ja active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0293866A (ja) * | 1988-09-30 | 1990-04-04 | Toshiba Corp | 要約生成方法および要約生成装置 |
JPH06231178A (ja) * | 1993-01-28 | 1994-08-19 | Toshiba Corp | 文書検索装置 |
JPH10207891A (ja) * | 1997-01-17 | 1998-08-07 | Fujitsu Ltd | 文書要約装置およびその方法 |
JPH1145289A (ja) * | 1997-07-28 | 1999-02-16 | Just Syst Corp | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 |
JP2000172716A (ja) * | 1998-12-03 | 2000-06-23 | Ricoh Co Ltd | 文書検索装置および文書検索方法 |
JP2002297633A (ja) * | 2001-03-29 | 2002-10-11 | Ricoh Co Ltd | 重要文抽出装置および方法並びにコンピュータプログラム |
JP2004318243A (ja) * | 2003-04-11 | 2004-11-11 | Canon Inc | 情報検索装置 |
JP2005085112A (ja) * | 2003-09-10 | 2005-03-31 | Toshiba Corp | 情報分類システム及びプログラム |
JP2005174003A (ja) * | 2003-12-11 | 2005-06-30 | Sanyo Electric Co Ltd | 要約生成方法およびプログラム |
JP2008097077A (ja) * | 2006-10-06 | 2008-04-24 | Kobe Steel Ltd | 重要文選出装置,重要文選出プログラム,重要文選出方法 |
WO2011036703A1 (ja) * | 2009-09-24 | 2011-03-31 | 株式会社 東芝 | 情報選択装置 |
JP2012104041A (ja) * | 2010-11-12 | 2012-05-31 | Nippon Telegr & Teleph Corp <Ntt> | テキストデータ要約装置、テキストデータ要約方法及びテキストデータ要約プログラム |
JP2014528620A (ja) * | 2011-10-14 | 2014-10-27 | ヤフー! インコーポレイテッド | 電子文書の内容を自動的に要約するための方法及び装置 |
JP2013161457A (ja) * | 2012-02-08 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 文書要約装置及び方法及びプログラム |
JP2015090663A (ja) * | 2013-11-07 | 2015-05-11 | 三菱電機株式会社 | テキスト要約装置 |
Non-Patent Citations (2)
Title |
---|
前田 剛、外2名: "場所に焦点を当てた複数旅行ブログの自動要約", 第7回データ工学と情報マネジメントに関するフォーラム (第13回日本データベース学会年次大会), JPN6017033329, 18 August 2015 (2015-08-18), JP, pages 1 - 7, ISSN: 0003631652 * |
能野 琴、外4名: "グラフスペクトル解析を用いた平行座標系の軸縮約", 画像電子学会誌, vol. 第44巻,第3号, JPN6017033331, 30 July 2015 (2015-07-30), JP, pages 447 - 456, ISSN: 0003631653 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020057195A (ja) * | 2018-10-02 | 2020-04-09 | テクマトリックス株式会社 | 要約生成サーバ、要約生成システム及び要約生成方法 |
JP2021131769A (ja) * | 2020-02-20 | 2021-09-09 | ソフトバンク株式会社 | 要約生成プログラム、要約生成装置および要約生成方法 |
JP7152437B2 (ja) | 2020-02-20 | 2022-10-12 | ソフトバンク株式会社 | 要約生成プログラム、要約生成装置および要約生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2018081702A (ja) | 2018-05-24 |
US20170068654A1 (en) | 2017-03-09 |
JP6646030B2 (ja) | 2020-02-14 |
JP2020057438A (ja) | 2020-04-09 |
CN107025216A (zh) | 2017-08-08 |
JP6905098B2 (ja) | 2021-07-21 |
US10430468B2 (en) | 2019-10-01 |
US20200004790A1 (en) | 2020-01-02 |
JP6272417B2 (ja) | 2018-01-31 |
KR101656245B1 (ko) | 2016-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6272417B2 (ja) | 文抽出方法及びシステム | |
US10303689B2 (en) | Answering natural language table queries through semantic table representation | |
CN111566654A (zh) | 集成知识和自然语言处理的机器学习 | |
CN108256070B (zh) | 用于生成信息的方法和装置 | |
US11613008B2 (en) | Automating a process using robotic process automation code | |
US11409754B2 (en) | NLP-based context-aware log mining for troubleshooting | |
US20180196871A1 (en) | System and method for metadata correlation using natural language processing | |
US10956470B2 (en) | Facet-based query refinement based on multiple query interpretations | |
KR101842274B1 (ko) | 문장 추출 방법 및 시스템 | |
US20230034011A1 (en) | Natural language processing workflow | |
CN112070550A (zh) | 基于搜索平台的关键词确定方法、装置、设备及存储介质 | |
KR102125407B1 (ko) | 문장 추출 방법 및 시스템 | |
CN110147223B (zh) | 组件库的生成方法、装置及设备 | |
CN112926298A (zh) | 新闻内容识别方法、相关装置及计算机程序产品 | |
KR102034302B1 (ko) | 문장 추출 방법 및 시스템 | |
CN109685091B (zh) | 使用贝叶斯方式的数字体验目标确定 | |
CN113792232B (zh) | 页面特征计算方法、装置、电子设备、介质及程序产品 | |
CN114048315A (zh) | 确定文档标签的方法、装置、电子设备和存储介质 | |
US11074591B2 (en) | Recommendation system to support mapping between regulations and controls | |
CN112948584A (zh) | 短文本分类方法、装置、设备以及存储介质 | |
CN109426358B (zh) | 信息输入方法和装置 | |
US11868737B2 (en) | Method and server for processing text sequence for machine processing task | |
RU2775820C2 (ru) | Способ и сервер для обработки текстовой последовательности в задаче машинной обработки | |
KR102641660B1 (ko) | 생성형 ai를 활용하여 문제해결을 최적화하기 위한 서버 및 그 동작방법 | |
CN113326416A (zh) | 检索数据的方法、向客户端发送检索数据的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6272417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |