JP7031462B2 - 分類プログラム、分類方法、および情報処理装置 - Google Patents
分類プログラム、分類方法、および情報処理装置 Download PDFInfo
- Publication number
- JP7031462B2 JP7031462B2 JP2018076952A JP2018076952A JP7031462B2 JP 7031462 B2 JP7031462 B2 JP 7031462B2 JP 2018076952 A JP2018076952 A JP 2018076952A JP 2018076952 A JP2018076952 A JP 2018076952A JP 7031462 B2 JP7031462 B2 JP 7031462B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- question
- text data
- unit
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下、図面を参照して、実施形態について説明する。図1は、実施形態のシステム構成の一例を示す図である。実施形態のシステムは、情報処理装置1と表示装置2と入力装置3とを含む。情報処理装置1は、コンピュータの一例である。
(付記1)
質問文と回答文とをそれぞれが含む複数のテキストデータを取得し、
取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が基準を満たす第1の単語と、前記複数の質問文のうち、前記第1の単語が存在しない質問文に存在し、かつ、前記第1の単語が存在する質問文に存在しない第2の単語とを特定し、
特定した前記第1の単語が存在する質問文を含むテキストデータと、特定した前記第2の単語が存在する質問文を含むテキストデータとを、それぞれ異なるグループに分類する、
処理をコンピュータに実行させるための分類プログラム。
(付記2)
前記複数のテキストデータに含まれる複数の質問文の一致部分を抽出し、
前記複数の質問文の前記一致部分を除いた部分から、前記第1の単語と前記第2の単語とを特定し、
前記一致部分を示すノードを最上位のノードに設定し、該ノードの下位に前記第1の単語を示すノードと前記第2の単語を示すノードとが接続されたツリーを生成する
処理を前記コンピュータに実行させることを特徴とする付記1記載の分類プログラム。
(付記3)
取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が最も多い前記第1の単語を特定する
処理を前記コンピュータに実行させることを特徴とする付記1または2記載の分類プログラム。
(付記4)
前記グループ内に複数のテキストデータが含まれる場合、前記複数のテキストデータが含まれるグループをさらに分類する
処理を前記コンピュータに実行させることを特徴とする付記1乃至3のうち何れか1項に記載の分類プログラム。
(付記5)
生成した前記ツリーを表示装置に表示し、
前記ツリーに対する修正指示に応じて、前記ツリーを修正する
処理を前記コンピュータに実行させることを特徴とする付記2に記載の分類プログラム。
(付記6)
質問を受け付けた場合、前記質問に対応するノードを前記ツリーの最上位のノードから検索し、
前記質問に対応するノードの下位のノードを選択枝として表示させ、
選択枝として表示されたノードが最下層のノードでない場合、選択されたノードの下位のノードをさらに選択枝として表示させ、
選択枝として表示されたノードが最下層のノードである場合、選択されたノードに対応づけられた回答を表示させる
処理を前記コンピュータに実行させることを特徴とする付記2に記載の分類プログラム。
(付記7)
コンピュータが、
質問文と回答文とをそれぞれが含む複数のテキストデータを取得し、
取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が基準を満たす第1の単語と、前記複数の質問文のうち、前記第1の単語が存在しない質問文に存在し、かつ、前記第1の単語が存在する質問文に存在しない第2の単語とを特定し、
特定した前記第1の単語が存在する質問文を含むテキストデータと、特定した前記第2の単語が存在する質問文を含むテキストデータとを、それぞれ異なるグループに分類する、
処理を実行することを特徴とする分類方法。
(付記8)
質問文と回答文とをそれぞれが含む複数のテキストデータを取得する取得部と、
取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が基準を満たす第1の単語と、前記複数の質問文のうち、前記第1の単語が存在しない質問文に存在し、かつ、前記第1の単語が存在する質問文に存在しない第2の単語とを特定する特定部と、
特定した前記第1の単語が存在する質問文を含むテキストデータと、特定した前記第2の単語が存在する質問文を含むテキストデータとを、それぞれ異なるグループに分類する分類部と、
を備えることを特徴とする分類装置。
本実施形態は、以上に述べた実施の形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で様々な変更、追加、省略が適用可能である。
2 表示装置
3 入力装置
11 取得部
12 第1分類部
13 抽出部
14 解析部
15 特定部
16 第2分類部
17 生成部
18 記憶部
19 出力部
20 修正部
21 応答部
100 バス
111 プロセッサ
112 メモリ
113 補助記憶装置
114 通信インタフェース
115 媒体接続部
116 入力装置
117 出力装置
118 可搬型記録媒体
Claims (7)
- 質問文と回答文とをそれぞれが含む複数のテキストデータを取得し、
取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が基準を満たす第1の単語と、前記複数の質問文のうち、前記第1の単語が存在しない質問文に存在し、かつ、前記第1の単語が存在する質問文に存在しない第2の単語とを特定し、
特定した前記第1の単語が存在する質問文を含むテキストデータと、特定した前記第2の単語が存在する質問文を含むテキストデータとを、それぞれ異なるグループに分類する、
処理をコンピュータに実行させるための分類プログラム。 - 前記複数のテキストデータに含まれる複数の質問文の一致部分を抽出し、
前記複数の質問文の前記一致部分を除いた部分から、前記第1の単語と前記第2の単語とを特定し、
前記一致部分を示すノードを最上位のノードに設定し、該ノードの下位に前記第1の単語を示すノードと前記第2の単語を示すノードとが接続されたツリーを生成する
処理を前記コンピュータに実行させることを特徴とする請求項1記載の分類プログラム。 - 取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が最も多い前記第1の単語を特定する
処理を前記コンピュータに実行させることを特徴とする請求項1または2記載の分類プログラム。 - 前記グループ内に複数のテキストデータが含まれる場合、前記複数のテキストデータが含まれるグループをさらに分類する
処理を前記コンピュータに実行させることを特徴とする請求項1乃至3のうち何れか1項に記載の分類プログラム。 - 生成した前記ツリーを表示装置に表示し、
前記ツリーに対する修正指示に応じて、前記ツリーを修正する
処理を前記コンピュータに実行させることを特徴とする請求項2に記載の分類プログラム。 - コンピュータが、
質問文と回答文とをそれぞれが含む複数のテキストデータを取得し、
取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が基準を満たす第1の単語と、前記複数の質問文のうち、前記第1の単語が存在しない質問文に存在し、かつ、前記第1の単語が存在する質問文に存在しない第2の単語とを特定し、
特定した前記第1の単語が存在する質問文を含むテキストデータと、特定した前記第2の単語が存在する質問文を含むテキストデータとを、それぞれ異なるグループに分類する、
処理を実行することを特徴とする分類方法。 - 質問文と回答文とをそれぞれが含む複数のテキストデータを取得する取得部と、
取得した前記複数のテキストデータに含まれる複数の質問文に存在する単語のうち、存在する質問文の数が基準を満たす第1の単語と、前記複数の質問文のうち、前記第1の単語が存在しない質問文に存在し、かつ、前記第1の単語が存在する質問文に存在しない第2の単語とを特定する特定部と、
特定した前記第1の単語が存在する質問文を含むテキストデータと、特定した前記第2の単語が存在する質問文を含むテキストデータとを、それぞれ異なるグループに分類する分類部と、
を備えることを特徴とする情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076952A JP7031462B2 (ja) | 2018-04-12 | 2018-04-12 | 分類プログラム、分類方法、および情報処理装置 |
US16/376,584 US20190317993A1 (en) | 2018-04-12 | 2019-04-05 | Effective classification of text data based on a word appearance frequency |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076952A JP7031462B2 (ja) | 2018-04-12 | 2018-04-12 | 分類プログラム、分類方法、および情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019185478A JP2019185478A (ja) | 2019-10-24 |
JP7031462B2 true JP7031462B2 (ja) | 2022-03-08 |
Family
ID=68161805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018076952A Active JP7031462B2 (ja) | 2018-04-12 | 2018-04-12 | 分類プログラム、分類方法、および情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20190317993A1 (ja) |
JP (1) | JP7031462B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7164510B2 (ja) * | 2019-11-27 | 2022-11-01 | エムオーテックス株式会社 | チャットボットシステム |
WO2021171372A1 (ja) * | 2020-02-25 | 2021-09-02 | 日本電気株式会社 | アイテム分類支援システム、方法およびプログラム |
US20220391576A1 (en) * | 2021-06-08 | 2022-12-08 | InCloud, LLC | System and method for constructing digital documents |
US12001775B1 (en) * | 2023-06-13 | 2024-06-04 | Oracle International Corporation | Identifying and formatting headers for text content |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030050908A1 (en) | 2001-08-22 | 2003-03-13 | International Business Machines Corporation | Method for automatically finding frequently asked questions in a helpdesk data set |
JP2005190232A (ja) | 2003-12-26 | 2005-07-14 | Seiko Epson Corp | 質問回答装置の精度向上支援装置及び精度向上支援方法ならびにそのプログラム |
JP2008204374A (ja) | 2007-02-22 | 2008-09-04 | Fuji Xerox Co Ltd | クラスタ生成装置およびクラスタ生成プログラム |
JP2009199576A (ja) | 2008-01-23 | 2009-09-03 | Yano Keizai Kenkyusho:Kk | 文書解析支援装置、文書解析支援方法、プログラム及び記録媒体 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63191235A (ja) * | 1987-02-04 | 1988-08-08 | Hitachi Ltd | 推論システム |
JPH10320402A (ja) * | 1997-05-14 | 1998-12-04 | N T T Data:Kk | 検索式作成方法、検索式作成装置、及び記録媒体 |
-
2018
- 2018-04-12 JP JP2018076952A patent/JP7031462B2/ja active Active
-
2019
- 2019-04-05 US US16/376,584 patent/US20190317993A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030050908A1 (en) | 2001-08-22 | 2003-03-13 | International Business Machines Corporation | Method for automatically finding frequently asked questions in a helpdesk data set |
JP2005190232A (ja) | 2003-12-26 | 2005-07-14 | Seiko Epson Corp | 質問回答装置の精度向上支援装置及び精度向上支援方法ならびにそのプログラム |
JP2008204374A (ja) | 2007-02-22 | 2008-09-04 | Fuji Xerox Co Ltd | クラスタ生成装置およびクラスタ生成プログラム |
JP2009199576A (ja) | 2008-01-23 | 2009-09-03 | Yano Keizai Kenkyusho:Kk | 文書解析支援装置、文書解析支援方法、プログラム及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20190317993A1 (en) | 2019-10-17 |
JP2019185478A (ja) | 2019-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102650611B1 (ko) | 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체 | |
JP7031462B2 (ja) | 分類プログラム、分類方法、および情報処理装置 | |
US10831796B2 (en) | Tone optimization for digital content | |
CN108287858B (zh) | 自然语言的语义提取方法及装置 | |
CN110164435B (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN108153800B (zh) | 信息处理方法、信息处理装置以及记录介质 | |
US10803253B2 (en) | Method and device for extracting point of interest from natural language sentences | |
CN111046133A (zh) | 基于图谱化知识库的问答方法、设备、存储介质及装置 | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
AU2019239454A1 (en) | Method and system for retrieving video temporal segments | |
US20180173694A1 (en) | Methods and computer systems for named entity verification, named entity verification model training, and phrase expansion | |
JPWO2008078670A1 (ja) | 文言い換え方法、プログラムおよびシステム | |
US20190095428A1 (en) | Information processing apparatus, dialogue processing method, and dialogue system | |
JP2009289202A (ja) | キーワード入力支援装置、キーワード入力支援方法及びプログラム | |
US20150169539A1 (en) | Adjusting Time Dependent Terminology in a Question and Answer System | |
JP4754849B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2017182646A (ja) | 情報処理装置、プログラム及び情報処理方法 | |
CN109977294B (zh) | 信息/查询处理装置、查询处理/文本查询方法、存储介质 | |
JP2021039727A (ja) | テキスト処理方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 | |
KR20160131730A (ko) | 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체 | |
JP2019220115A (ja) | 音声対話システムとモデル作成装置およびその方法 | |
JP5248121B2 (ja) | 愛称を推定する装置、方法およびプログラム | |
JP6988715B2 (ja) | 回答文選択装置、方法、およびプログラム | |
JP2007026347A (ja) | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム | |
JP6911983B2 (ja) | 情報処理装置、プログラム及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7031462 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |