JP2015088061A - テキスト処理装置、テキスト処理方法およびプログラム - Google Patents
テキスト処理装置、テキスト処理方法およびプログラム Download PDFInfo
- Publication number
- JP2015088061A JP2015088061A JP2013227557A JP2013227557A JP2015088061A JP 2015088061 A JP2015088061 A JP 2015088061A JP 2013227557 A JP2013227557 A JP 2013227557A JP 2013227557 A JP2013227557 A JP 2013227557A JP 2015088061 A JP2015088061 A JP 2015088061A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- text
- node
- topics
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 114
- 238000003672 processing method Methods 0.000 title claims abstract description 6
- 238000009826 distribution Methods 0.000 claims description 46
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 92
- 230000008569 process Effects 0.000 description 52
- 235000013336 milk Nutrition 0.000 description 38
- 239000008267 milk Substances 0.000 description 38
- 210000004080 milk Anatomy 0.000 description 38
- 108090000765 processed proteins & peptides Proteins 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 239000000843 powder Substances 0.000 description 16
- 238000012217 deletion Methods 0.000 description 14
- 230000037430 deletion Effects 0.000 description 14
- 230000002452 interceptive effect Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 10
- 235000008476 powdered milk Nutrition 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 206010020751 Hypersensitivity Diseases 0.000 description 5
- 208000026935 allergic disease Diseases 0.000 description 5
- 230000007815 allergy Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 239000000796 flavoring agent Substances 0.000 description 3
- 235000019634 flavors Nutrition 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 208000004262 Food Hypersensitivity Diseases 0.000 description 1
- 206010016946 Food allergy Diseases 0.000 description 1
- 208000009793 Milk Hypersensitivity Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001739 density measurement Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000020932 food allergy Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】実施形態のテキスト処理装置は、生成部(話題構造モデル生成器10)と、リスト表示部(話題アウトライナ20)と、を備える。生成部は、入力されたテキストを解析して、前記テキストに含まれる複数の話題間の従属関係を示す情報と、前記テキストに含まれる複数の話題間の前後関係を示す情報と、を含む話題構造情報を生成する。リスト表示部は、前記話題構造情報に基づき、各々が前記テキストに含まれる話題に対応した複数のノードであって、各ノードが当該ノードに対応する話題と他の話題との従属関係を表したラベルを持つ複数のノードを、各ノードに対応する話題間の前後関係に従って配列した話題構造リストをディスプレイに表示させる。
【選択図】図3
Description
(1)話題アウトライナ20の要約要求部23の要求に従って本文ウィンドウ102にテキストTの要約を表示させつつ、その要約率をユーザ操作に応じて動的に変更することができる。
(2)要約率を変更する操作に関しては、テキストT全体の要約率を変更する「大域モード」と、テキストTの中で興味がある部分を中心として局所的な領域だけ要約率を変更する「局所モード」とがある。
(3)局所モードでは、話題構造モデルMを用いて、なるべく話題が続いている途中で要約率が切り替わらないように、同じ要約率を適用する範囲を自動調整する。
(4)要約処理の文やフレーズの重要文選択の際に、話題構造モデルMを用いて話題構造に即した重要性評価を行う。
参考文献:H.P.Luhn.The automatic creation of literature abstracts.IBM Journal of Research and Development,Vol.2,No.2,pp159-165,1958.
f=Σi・wi・fi ・・・(1)
b=Σi・wi・bi ・・・(2)
wi=di/Σj・dj ・・・(3)
ただし、i,jは話題番号、fiはマウスカーソルが置かれた位置から話題iの話題分布範囲の前方境界までの距離、biはマウスカーソルが置かれた位置から話題iの話題分布範囲の後方境界までの距離、diは話題iの話題密度、djは話題jの話題密度である。
15 話題辞書
20 話題アウトライナ
21 初期状態生成部
22 話題構造操作部
23 要約要求部
30 インタラクティブ要約器
31 適用範囲調整部
32 重要文選択部
T テキスト
Ta 要約テキスト
M 話題構造モデル
M1 話題従属関係モデル
M2 話題前後関係モデル
Claims (15)
- 入力されたテキストを解析して、前記テキストに含まれる複数の話題間の従属関係を示す情報と、前記テキストに含まれる複数の話題間の前後関係を示す情報と、を含む話題構造情報を生成する生成部と、
前記話題構造情報に基づき、各々が前記テキストに含まれる話題に対応した複数のノードであって、各ノードが当該ノードに対応する話題と他の話題との従属関係を表したラベルを持つ複数のノードを、各ノードに対応する話題間の前後関係に従って配列した話題構造リストをディスプレイに表示させるリスト表示部と、を備えるテキスト処理装置。 - 前記話題構造リストに含まれる各ノードは、当該ノードに対応する話題が他の話題に従属する話題である場合、当該ノードに対応する話題を表す話題名と、当該ノードに対応する話題の従属先の他の話題を表す話題名とを所定の記号を挟んで並べることで、当該ノードに対応する話題と他の話題との従属関係を表した前記ラベルを持つ、請求項1に記載のテキスト処理装置。
- 前記リスト表示部は、前記ディスプレイに表示されている前記話題構造リスト内のノードであって、他の話題が従属されている話題に対応するノードを対象として第1の操作が行われた場合、当該第1の操作の対象となったノードを削除するとともに、当該第1の操作の対象となったノードに対応する話題に従属する他のすべての話題に各々対応するすべてのノードを追加した新たな前記話題構造リストを前記ディスプレイに表示させる、請求項1に記載のテキスト処理装置。
- 前記リスト表示部は、前記ディスプレイに表示されている前記話題構造リスト内のノードであって、他の話題に従属している話題に対応するノードを対象とした第2の操作が行われた場合、当該第2の操作の対象となったノードを含め、当該第2の操作の対象となったノードの従属先である他の話題に従属するすべての話題に各々対応するすべてのノードを削除するとともに、当該第2の操作の対象となったノードの従属先である他の話題に対応するノードを追加した新たな前記話題構造リストを前記ディスプレイに表示させる、請求項1に記載のテキスト処理装置。
- 前記生成部は、前記テキストに含まれる2つの話題を話題Aおよび話題Bとしたときに、前記テキストにおける予め定めたテキスト単位を処理単位として、前記テキストにおいて話題Aに関する記述が最初に出現したテキスト単位を検知し、検知したテキスト単位において、話題Aに関する記述よりも前方に話題Bに関する記述が存在する場合に、話題Aは話題Bに従属する話題であると判定する、請求項1に記載のテキスト処理装置。
- 前記生成部は、前記テキストに含まれる2つの話題を話題Aおよび話題Bとしたときに、前記テキストにおいて話題Aに関する記述が最初に出現した位置と、前記テキストにおいて話題Bに関する記述が最初に出現した位置とを比較することで、話題Aと話題Bの前後関係を判定する、請求項1に記載のテキスト処理装置。
- 前記生成部は、前記テキストに含まれる複数の話題のそれぞれについて、前記テキスト内において当該話題に関する記述が最初に現れた位置から最後に現れた位置までの範囲である話題分布範囲を検出し、
前記話題構造情報は、前記テキストに含まれる複数の話題それぞれの前記話題分布範囲を示す情報をさらに含む、請求項1に記載のテキスト処理装置。 - 前記生成部は、前記話題分布範囲の大きさが予め定めた上限を超えている話題を、前記上限以下の大きさの前記話題分布範囲を持つ複数の話題に分割する、請求項7に記載のテキスト処理装置。
- 前記生成部は、前記話題分布範囲の中に当該話題に関する記述を含まない文が所定数以上連続するブランクを含む話題を、前記ブランクよりも前方の前記話題分布範囲を持つ話題と、前記ブランクよりも後方の前記話題分布範囲を持つ話題とに分割する、請求項7に記載のテキスト処理装置。
- 前記ディスプレイに表示されている前記話題構造リスト内の任意のノードを対象とした第3の操作が行われた場合に、当該第3の操作の対象となったノードに対応する話題の前記話題分布範囲を要約対象として前記テキストを要約し、要約結果である要約テキストを前記ディスプレイにさらに表示させる要約表示部をさらに備える、請求項7に記載のテキスト処理装置。
- 前記要約表示部は、前記ディスプレイに表示されている前記要約テキストの中で任意の位置および要約率を指定する第4の操作が行われた場合、指定された位置を前記話題分布範囲に含むすべての話題の前記話題分布範囲を合成した合成範囲、または、指定された位置を前記話題分布範囲に含むすべての話題の前記話題分布範囲のうち予め定めた規則に従って選択された選択範囲を新たな要約対象として前記テキストを指定された要約率で要約し、前記ディスプレイに表示させる前記要約テキストを更新する、請求項10に記載のテキスト処理装置。
- 前記要約表示部は、前記テキストにおける予め定めたテキスト単位を処理単位とし、前記テキスト内の要約対象に含まれるテキスト単位のそれぞれについて、文に含まれる話題に関する記述をすべて検出して、検出した記述に対応する各話題の重要度に応じて当該テキスト単位の重要度を判定し、判定したテキスト単位の重要度に応じて要約対象に含まれるテキスト単位の中で削除または追加するテキスト単位を選択することで、前記テキストを要約する、請求項10に記載のテキスト処理装置。
- 話題の重要度は、当該話題に従属する他の話題の数が多いほど高い重要度となる、請求項12に記載のテキスト処理装置。
- テキスト処理装置において実行されるテキスト処理方法であって、
前記テキスト処理装置の生成部が、入力されたテキストを解析して、前記テキストに含まれる複数の話題間の従属関係を示す情報と、前記テキストに含まれる複数の話題間の前後関係を示す情報と、を含む話題構造情報を生成する工程と、
前記テキスト処理装置のリスト表示部が、前記話題構造情報に基づき、各々が前記テキストに含まれる話題に対応した複数のノードであって、各ノードが当該ノードに対応する話題と他の話題との従属関係を表したラベルを持つ複数のノードを、各ノードに対応する話題間の前後関係に従って配列した話題構造リストをディスプレイに表示させる工程と、を含むテキスト処理方法。 - コンピュータに、
入力されたテキストを解析して、前記テキストに含まれる複数の話題間の従属関係を示す情報と、前記テキストに含まれる複数の話題間の前後関係を示す情報と、を含む話題構造情報を生成する機能と、
前記話題構造情報に基づき、各々が前記テキストに含まれる話題に対応した複数のノードであって、各ノードが当該ノードに対応する話題と他の話題との従属関係を表したラベルを持つ複数のノードを、各ノードに対応する話題間の前後関係に従って配列した話題構造リストをディスプレイに表示させる機能と、を実現させるためのプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013227557A JP6239344B2 (ja) | 2013-10-31 | 2013-10-31 | テキスト処理装置、テキスト処理方法およびプログラム |
CN201410392254.2A CN104598440B (zh) | 2013-10-31 | 2014-08-11 | 文本处理装置以及文本处理方法 |
US14/458,477 US20150121200A1 (en) | 2013-10-31 | 2014-08-13 | Text processing apparatus, text processing method, and computer program product |
EP20140180982 EP2869219A1 (en) | 2013-10-31 | 2014-08-14 | Text processing apparatus, text processing method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013227557A JP6239344B2 (ja) | 2013-10-31 | 2013-10-31 | テキスト処理装置、テキスト処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015088061A true JP2015088061A (ja) | 2015-05-07 |
JP6239344B2 JP6239344B2 (ja) | 2017-11-29 |
Family
ID=51357770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013227557A Active JP6239344B2 (ja) | 2013-10-31 | 2013-10-31 | テキスト処理装置、テキスト処理方法およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150121200A1 (ja) |
EP (1) | EP2869219A1 (ja) |
JP (1) | JP6239344B2 (ja) |
CN (1) | CN104598440B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019197293A (ja) * | 2018-05-08 | 2019-11-14 | ベクスト株式会社 | 会話支援システムおよび会話支援方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018069026A1 (en) * | 2016-10-11 | 2018-04-19 | Koninklijke Philips N.V. | Patient-centric clinical knowledge discovery system |
US10685049B2 (en) * | 2017-09-15 | 2020-06-16 | Oath Inc. | Conversation summary |
CN108055384A (zh) * | 2017-10-19 | 2018-05-18 | 福建中金在线信息科技有限公司 | 数据显示方法和装置 |
CN107967257B (zh) * | 2017-11-20 | 2021-01-12 | 哈尔滨工业大学 | 一种级联式作文生成方法 |
US20200090648A1 (en) * | 2018-09-14 | 2020-03-19 | International Business Machines Corporation | Maintaining voice conversation continuity |
CN111461301B (zh) * | 2020-03-30 | 2021-05-25 | 北京沃东天骏信息技术有限公司 | 序列化数据处理方法和装置、文本处理方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003162525A (ja) * | 2002-10-23 | 2003-06-06 | Toshiba Corp | 自然言語処理装置及びその方法 |
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2368167A (en) * | 2000-10-17 | 2002-04-24 | Radka Radana Dvorak | Knowledge management software system |
US7111253B2 (en) * | 2002-12-16 | 2006-09-19 | Palo Alto Research Center Incorporated | Method and apparatus for displaying hierarchical information |
CN100592296C (zh) * | 2007-12-27 | 2010-02-24 | 腾讯科技(深圳)有限公司 | 一种分页方法及分页装置 |
US20120231441A1 (en) * | 2009-09-03 | 2012-09-13 | Coaxis Services Inc. | System and method for virtual content collaboration |
JP2013030066A (ja) * | 2011-07-29 | 2013-02-07 | Fujitsu Ltd | 描画装置 |
US8687946B2 (en) * | 2011-11-30 | 2014-04-01 | Nokia Corporation | Method and apparatus for enriching media with meta-information |
-
2013
- 2013-10-31 JP JP2013227557A patent/JP6239344B2/ja active Active
-
2014
- 2014-08-11 CN CN201410392254.2A patent/CN104598440B/zh not_active Expired - Fee Related
- 2014-08-13 US US14/458,477 patent/US20150121200A1/en not_active Abandoned
- 2014-08-14 EP EP20140180982 patent/EP2869219A1/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003162525A (ja) * | 2002-10-23 | 2003-06-06 | Toshiba Corp | 自然言語処理装置及びその方法 |
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019197293A (ja) * | 2018-05-08 | 2019-11-14 | ベクスト株式会社 | 会話支援システムおよび会話支援方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6239344B2 (ja) | 2017-11-29 |
CN104598440B (zh) | 2018-12-04 |
CN104598440A (zh) | 2015-05-06 |
US20150121200A1 (en) | 2015-04-30 |
EP2869219A1 (en) | 2015-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6239344B2 (ja) | テキスト処理装置、テキスト処理方法およびプログラム | |
US11487832B2 (en) | Analyzing web pages to facilitate automatic navigation | |
US11599729B2 (en) | Method and apparatus for intelligent automated chatting | |
US11729120B2 (en) | Generating responses in automated chatting | |
JP4985974B2 (ja) | コミュニケーション支援方法、システムおよびサーバ装置 | |
CN109314660A (zh) | 在自动聊天中提供新闻推荐 | |
US11822868B2 (en) | Augmenting text with multimedia assets | |
JP6851894B2 (ja) | 対話システム、対話方法及び対話プログラム | |
JP6818706B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
US11586689B2 (en) | Electronic apparatus and controlling method thereof | |
CN109478187A (zh) | 输入法编辑器 | |
JP6605410B2 (ja) | 感情要因推定支援装置、感情要因推定支援方法及び感情要因推定支援用プログラム | |
JP2020135135A (ja) | 対話コンテンツ作成支援方法およびシステム | |
JP5212204B2 (ja) | 応答生成装置及びプログラム | |
JP6429747B2 (ja) | 情報提供装置、情報提供方法および情報提供プログラム | |
JP4671440B2 (ja) | 評判関係抽出装置、その方法およびプログラム | |
KR102381387B1 (ko) | 챗봇 학습용 데이터 생성 방법 | |
JP2007026347A (ja) | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム | |
JP5142395B2 (ja) | 関係情報抽出装置、その方法、プログラム及び記録媒体 | |
JP2017059082A (ja) | 情報提供装置、情報提供方法および情報提供プログラム | |
JP3402598B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP7375096B2 (ja) | 分散表現生成システム、分散表現生成方法及び分散表現生成プログラム | |
JP4646078B2 (ja) | 相互に関係する固有表現の組抽出装置及びその方法 | |
CN112182228B (zh) | 一种短文本热点主题挖掘与概括方法及装置 | |
KR102624790B1 (ko) | 다중 의도 발화의 의도 분석 및 처리를 위한 자연어 처리 장치, 프로그램 및 그것의 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20151102 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160923 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6239344 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |