JP6718345B2 - テキスト分析方法、テキスト分析装置、及びプログラム - Google Patents
テキスト分析方法、テキスト分析装置、及びプログラム Download PDFInfo
- Publication number
- JP6718345B2 JP6718345B2 JP2016184789A JP2016184789A JP6718345B2 JP 6718345 B2 JP6718345 B2 JP 6718345B2 JP 2016184789 A JP2016184789 A JP 2016184789A JP 2016184789 A JP2016184789 A JP 2016184789A JP 6718345 B2 JP6718345 B2 JP 6718345B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- text
- keyword
- partial texts
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
11 入力部
12 出力部
13 制御部
14 話題区切り推定部
15 カテゴリ分類部
16 カテゴリ分類更新部
17 カテゴリ情報記憶部
18 テキスト記憶部
19 区切り文字列記憶部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
106 表示装置
107 入力装置
B バス
Claims (5)
- 話題の変化を示す1以上の文字列を記憶した第1の記憶部を参照して、入力されたテキストを、話題が変化したと推定される個所で分割して複数の部分テキストを生成する分割手順と、
前記各部分テキストについて、カテゴリごとに、当該カテゴリに対応して第2の記憶部に記憶されているキーワードの出現数と、前記各キーワードに対して設定されている重み値との加重和と、前記各部分テキストにおける2つの前記キーワードの組ごとの共起数の加重和との和を評価値として算出し、前記評価値が最大であるカテゴリに前記各部分テキストを分類する分類手順と、
前記カテゴリに対応するキーワードごとに、当該キーワードを含む前記部分テキストの数と、当該カテゴリに分類された前記部分テキストの数との関係に基づいて、当該キーワードに対する前記重み値を更新する更新手順と、
をコンピュータが実行することを特徴とするテキスト分析方法。 - 或る前記カテゴリについての或る2つの前記キーワードの組の共起数の加重和の重みは、過去に当該カテゴリに分類された前記部分テキストのうち、当該組が共起する前記部分テキストの数を、過去に当該カテゴリに分類された前記部分テキストの数で除した値である、
ことを特徴とする請求項1記載のテキスト分析方法。 - 話題の変化を示す1以上の文字列を記憶した第1の記憶部を参照して、入力されたテキストを、話題が変化したと推定される個所で分割して複数の部分テキストを生成する分割部と、
前記各部分テキストについて、カテゴリごとに、当該カテゴリに対応して第2の記憶部に記憶されているキーワードの出現数と、前記各キーワードに対して設定されている重み値との加重和と、前記各部分テキストにおける2つの前記キーワードの組ごとの共起数の加重和との和を評価値として算出し、前記評価値が最大であるカテゴリに前記各部分テキストを分類する分類部と、
前記カテゴリに対応するキーワードごとに、当該キーワードを含む前記部分テキストの数と、当該カテゴリに分類された前記部分テキストの数との関係に基づいて、当該キーワードに対する前記重み値を更新する更新部と、
を有することを特徴とするテキスト分析装置。 - 或る前記カテゴリについての或る2つの前記キーワードの組の共起数の加重和の重みは、過去に当該カテゴリに分類された前記部分テキストのうち、当該組が共起する前記部分テキストの数を、過去に当該カテゴリに分類された前記部分テキストの数で除した値である、
ことを特徴とする請求項3記載のテキスト分析装置。 - 請求項1又は2記載のテキスト分析方法をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016184789A JP6718345B2 (ja) | 2016-09-21 | 2016-09-21 | テキスト分析方法、テキスト分析装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016184789A JP6718345B2 (ja) | 2016-09-21 | 2016-09-21 | テキスト分析方法、テキスト分析装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018049478A JP2018049478A (ja) | 2018-03-29 |
JP6718345B2 true JP6718345B2 (ja) | 2020-07-08 |
Family
ID=61767636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016184789A Active JP6718345B2 (ja) | 2016-09-21 | 2016-09-21 | テキスト分析方法、テキスト分析装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6718345B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7091146B2 (ja) * | 2018-05-25 | 2022-06-27 | シャープ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN110265032A (zh) * | 2019-06-05 | 2019-09-20 | 平安科技(深圳)有限公司 | 会议数据分析处理方法、装置、计算机设备和存储介质 |
CN114072786A (zh) * | 2019-07-04 | 2022-02-18 | 松下知识产权经营株式会社 | 说话解析装置、说话解析方法以及程序 |
JP2021140485A (ja) * | 2020-03-05 | 2021-09-16 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110409A (ja) * | 1997-10-07 | 1999-04-23 | Ntt Data Corp | 情報分類方法及び装置 |
JP2000222431A (ja) * | 1999-02-03 | 2000-08-11 | Mitsubishi Electric Corp | 文書分類装置 |
JP4161171B2 (ja) * | 2002-06-17 | 2008-10-08 | ヤマハ株式会社 | 情報分類装置、方法及びプログラム |
JP2005141476A (ja) * | 2003-11-06 | 2005-06-02 | Ricoh Co Ltd | 文書管理装置、プログラムおよび記録媒体 |
US8443008B2 (en) * | 2008-04-01 | 2013-05-14 | Nec Corporation | Cooccurrence dictionary creating system, scoring system, cooccurrence dictionary creating method, scoring method, and program thereof |
JP5409321B2 (ja) * | 2009-12-16 | 2014-02-05 | 株式会社エヌ・ティ・ティ・データ | 情報評価装置、情報評価方法、及び情報評価プログラム |
-
2016
- 2016-09-21 JP JP2016184789A patent/JP6718345B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018049478A (ja) | 2018-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6718345B2 (ja) | テキスト分析方法、テキスト分析装置、及びプログラム | |
US7231375B2 (en) | Computer aided query to task mapping | |
US20230142864A1 (en) | Estimation of Admixture Generation | |
CN106874441B (zh) | 智能问答方法和装置 | |
CN108153800B (zh) | 信息处理方法、信息处理装置以及记录介质 | |
CN110888990B (zh) | 文本推荐方法、装置、设备及介质 | |
US20070244690A1 (en) | Clustering of Text for Structuring of Text Documents and Training of Language Models | |
EP2885755B1 (en) | Agent system, agent control method and agent control program with ability of natural conversation with users | |
JP5125307B2 (ja) | 工数見積プログラム、該プログラムを記録した記録媒体、工数見積装置、および工数見積方法 | |
WO2014028860A2 (en) | System and method for matching data using probabilistic modeling techniques | |
WO2014109388A1 (ja) | テキストマイニング装置、テキストマイニングシステム、テキストマイニング方法及び記録媒体 | |
JP6663826B2 (ja) | 計算機及び応答の生成方法 | |
WO2019156103A1 (ja) | Faq整備支援装置、faq整備支援方法、及びプログラム | |
JP2001266060A (ja) | アンケート回答分析システム | |
CN111368130A (zh) | 客服录音的质检方法、装置、设备及存储介质 | |
US20210133390A1 (en) | Conceptual graph processing apparatus and non-transitory computer readable medium | |
US8301619B2 (en) | System and method for generating queries | |
CN113379398B (zh) | 一种项目需求的生成方法、装置、电子设备及存储介质 | |
JP2021092925A (ja) | データ生成装置およびデータ生成方法 | |
JPWO2014020834A1 (ja) | 単語潜在トピック推定装置および単語潜在トピック推定方法 | |
CN113342942B (zh) | 语料自动化获取方法、装置、计算机设备及存储介质 | |
US10599658B2 (en) | Search device, search method, and non-transitory computer readable medium for performing a search for candidate experts and displaying results of the search | |
CN111145053A (zh) | 基于人工智能的企业法律顾问管理系统及方法 | |
JP2021105907A (ja) | 会議群分析装置、及びプログラム | |
JP2005192024A (ja) | コールセンタにおける通話音声データ管理方式およびそれに用いるオペレータ端末 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160923 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160923 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180806 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20180806 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190723 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200212 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6718345 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |