JP2015172880A - テンプレート生成装置及びテンプレート生成プログラム - Google Patents
テンプレート生成装置及びテンプレート生成プログラム Download PDFInfo
- Publication number
- JP2015172880A JP2015172880A JP2014048822A JP2014048822A JP2015172880A JP 2015172880 A JP2015172880 A JP 2015172880A JP 2014048822 A JP2014048822 A JP 2014048822A JP 2014048822 A JP2014048822 A JP 2014048822A JP 2015172880 A JP2015172880 A JP 2015172880A
- Authority
- JP
- Japan
- Prior art keywords
- template
- expression
- specific expression
- pattern
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 テンプレート生成装置100は、学習データベース2から文を抽出する文抽出部11と、文抽出部11にて抽出された文を複数の形態素に分割し、複数の形態素の中から固有表現を抽出する形態素分析部12と、文抽出部11にて抽出された文から、形態素分析部にて抽出された固有表現をその固有表現タイプを示すタグに置き換えて、パターンを生成する固有表現分析部14と、同一の固有表現タイプの組を有し、かつ同一の固有表現タイプの組以外が同一の表現又は所定値以下の編集距離を有する表現となるパターンが、所定の数以上ある場合に、当該パターンをテンプレートとして抽出するテンプレート抽出部3とを備えている。
【選択図】 図1
Description
1 自然言語分析部
11 文抽出部
12 形態素分析部
13 構文分析部
14 固有表現分析部
2 学習データベース
3 テンプレート抽出部
4 オントロジー辞書
41 拡張固有表現階層部
5 テンプレート辞書
Claims (11)
- コーパスから文を抽出する文抽出部と、
前記文抽出部にて抽出された文を複数の形態素に分割し、前記複数の形態素の中から固有表現を抽出する形態素分析部と、
前記文抽出部にて抽出された文から、前記形態素分析部にて抽出された前記固有表現をその固有表現タイプを示すタグに置き換えて、パターンを生成するパターン生成部と、
同一の前記固有表現タイプの組を有し、かつ前記同一の固有表現タイプの組以外が同一の表現又は所定値以下の編集距離を有する表現となるパターンが、所定の数以上ある場合に、当該パターンをテンプレートとして抽出するテンプレート抽出部と、
を備えたことを特徴とするテンプレート生成装置。 - 前記テンプレート抽出部は、前記パターン生成部にて生成された前記パターンに含まれる前記固有表現タイプ及びそれ以外の表現を同種の固有表現タイプ及び表現に置き換えてパターンを生成し、生成したパターンも含めて前記パターンの数をカウントすることを特徴とする請求項1に記載のテンプレート生成装置。
- 前記同種の固有表現タイプ及び表現は、前記パターン生成部にて生成されたパターンに含まれる固有表現タイプ及び表現の上位概念の固有表現タイプ及び表現であることを特徴とする請求項2に記載のテンプレート生成装置。
- 前記同種の固有表現タイプ及び表現は、前記パターン生成部にて生成されたパターンに含まれる固有表現タイプ及び表現と上位概念を共通にする類似概念の固有表現タイプ及び表現であることを特徴とする請求項2又は3に記載のテンプレート生成装置。
- 前記テンプレート抽出部にて抽出された前記テンプレートに含まれる固有表現タイプ及び表現を、前記パターン抽出部にて抽出されていない同種の固有表現タイプ及び表現に置き換えて、新たなテンプレートを作出するテンプレート作出部をさらに備えたことを特徴とする請求項1に記載のテンプレート生成装置。
- 前記置き換えに用いる同種の固有表現タイプ及び表現は、前記テンプレート抽出部にて抽出されたテンプレートに含まれる固有表現タイプ及び表現の上位概念の固有表現タイプ及び表現であることを特徴とする請求項5に記載のテンプレート生成装置。
- 前記置き換えに用いる同種の固有表現タイプ及び表現は、前記テンプレート抽出部にて抽出されたテンプレートに含まれる固有表現タイプ及び表現と上位概念を共通にする類似概念の固有表現タイプ及び表現であることを特徴とする請求項5に記載のテンプレート生成装置。
- 前記テンプレート抽出部にて抽出された、同一の概念を有する複数のテンプレートをまとめてクラスタとするクラスタリング部をさらに備えたことを特徴とする請求項5ないし7のいずれか一項に記載のテンプレート生成装置。
- 前記クラスタリング部は、前記クラスタに含まれる各テンプレートに含まれる固有表現タイプ及び表現を上位概念の固有表現タイプ及び表現に置き換えて、上位テンプレートのクラスタを生成することを特徴とする請求項8に記載のテンプレート生成装置。
- 前記クラスタリング部は、前記上位テンプレートのクラスタに含まれる各テンプレートに含まれる固有表現タイプ及び表現を下位概念の固有表現タイプ及び表現に置き換えて、類似テンプレートのクラスタを生成することを特徴とする請求項9に記載のテンプレート生成装置。
- コンピュータに、
コーパスから文を抽出する文抽出ステップと、
前記文抽出ステップにて抽出された文を複数の形態素に分割し、前記複数の形態素の中から固有表現を抽出する形態素分析ステップと、
前記文抽出ステップにて抽出された文から、前記形態素分析ステップにて抽出された前記固有表現をその固有表現タイプを示すタグに置き換えて、パターンを生成するパターン生成ステップと、
同一の前記固有表現タイプの組を有し、かつ前記同一の固有表現タイプの組以外が同一の表現又は所定値以下の編集距離を有する表現となるパターンが、所定の数以上ある場合に、当該パターンをテンプレートとして抽出するテンプレート抽出ステップと、
を実行させることを特徴とするテンプレート生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014048822A JP6263420B2 (ja) | 2014-03-12 | 2014-03-12 | テンプレート生成装置及びテンプレート生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014048822A JP6263420B2 (ja) | 2014-03-12 | 2014-03-12 | テンプレート生成装置及びテンプレート生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015172880A true JP2015172880A (ja) | 2015-10-01 |
JP6263420B2 JP6263420B2 (ja) | 2018-01-17 |
Family
ID=54260159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014048822A Expired - Fee Related JP6263420B2 (ja) | 2014-03-12 | 2014-03-12 | テンプレート生成装置及びテンプレート生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6263420B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018503145A (ja) * | 2015-11-17 | 2018-02-01 | 小米科技有限責任公司Xiaomi Inc. | 情報テンプレートをマイニングする方法、その装置、プログラム、及び記録媒体 |
JP2018120401A (ja) * | 2017-01-25 | 2018-08-02 | 国立大学法人 東京大学 | 抽出装置、抽出方法、ならびに、プログラム |
JP2020135135A (ja) * | 2019-02-14 | 2020-08-31 | 株式会社日立製作所 | 対話コンテンツ作成支援方法およびシステム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077649B (zh) * | 2023-10-16 | 2024-01-09 | 之江实验室 | 一种生成医疗文本提取模版方法、装置、介质及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003085170A (ja) * | 2001-09-11 | 2003-03-20 | Nippon Hoso Kyokai <Nhk> | 定型文クラスタリング装置および方法 |
US20080005265A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Method for automatic parsing of variable data fields from textual report data |
JP2010079858A (ja) * | 2008-09-29 | 2010-04-08 | Toshiba Solutions Corp | 辞書作成支援装置及びプログラム |
JP2010224659A (ja) * | 2009-03-19 | 2010-10-07 | Canon Inc | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
JP2012037790A (ja) * | 2010-08-10 | 2012-02-23 | Toshiba Corp | 音声対話装置 |
JP2012078647A (ja) * | 2010-10-04 | 2012-04-19 | National Institute Of Information & Communication Technology | 言語モデル学習装置及びコンピュータプログラム |
-
2014
- 2014-03-12 JP JP2014048822A patent/JP6263420B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003085170A (ja) * | 2001-09-11 | 2003-03-20 | Nippon Hoso Kyokai <Nhk> | 定型文クラスタリング装置および方法 |
US20080005265A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Method for automatic parsing of variable data fields from textual report data |
JP2010079858A (ja) * | 2008-09-29 | 2010-04-08 | Toshiba Solutions Corp | 辞書作成支援装置及びプログラム |
JP2010224659A (ja) * | 2009-03-19 | 2010-10-07 | Canon Inc | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
JP2012037790A (ja) * | 2010-08-10 | 2012-02-23 | Toshiba Corp | 音声対話装置 |
JP2012078647A (ja) * | 2010-10-04 | 2012-04-19 | National Institute Of Information & Communication Technology | 言語モデル学習装置及びコンピュータプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018503145A (ja) * | 2015-11-17 | 2018-02-01 | 小米科技有限責任公司Xiaomi Inc. | 情報テンプレートをマイニングする方法、その装置、プログラム、及び記録媒体 |
US10180976B2 (en) | 2015-11-17 | 2019-01-15 | Xiaomi Inc. | Method and device for mining an information template |
JP2018120401A (ja) * | 2017-01-25 | 2018-08-02 | 国立大学法人 東京大学 | 抽出装置、抽出方法、ならびに、プログラム |
JP2020135135A (ja) * | 2019-02-14 | 2020-08-31 | 株式会社日立製作所 | 対話コンテンツ作成支援方法およびシステム |
JP7297458B2 (ja) | 2019-02-14 | 2023-06-26 | 株式会社日立製作所 | 対話コンテンツ作成支援方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6263420B2 (ja) | 2018-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6655788B2 (ja) | 対訳コーパス作成方法、該装置および該プログラムならびに機械翻訳システム | |
Miura et al. | TeamX: A sentiment analyzer with enhanced lexicon mapping and weighting scheme for unbalanced data | |
JP6263420B2 (ja) | テンプレート生成装置及びテンプレート生成プログラム | |
JP2016157407A (ja) | テキスト分析及び応答システムのための語彙意味パターンの事前構築方法 | |
Al-Debagy et al. | A new decomposition method for designing microservices | |
Francisca et al. | Adapting rule based machine translation from english to bangla | |
CN110532487B (zh) | 标签的生成方法及装置 | |
Kumar et al. | Sanskrit compound processor | |
JP2020106880A (ja) | 情報処理装置、モデル作成方法及びプログラム | |
JP2019211974A (ja) | 企業分析装置 | |
KR102206742B1 (ko) | 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치 | |
Kostareva et al. | Using Ontology-Driven Methods to Develop Frameworks for Tackling NLP Problems. | |
KR20200086586A (ko) | 온톨로지 기반의 프레임을 이용한 지식 추출 시스템 | |
WO2021205639A1 (ja) | オントロジを用いた文章データ解析情報生成装置、文章データ解析情報生成方法、および文章データ解析情報生成プログラム | |
KR102474042B1 (ko) | 데이터 마이닝을 이용한 질병 연관성 분석 방법 | |
JPWO2018174000A1 (ja) | 構成管理装置、構成管理方法および構成管理プログラム | |
JP7014301B2 (ja) | 情報処理装置、分析システム、分析方法及び分析プログラム | |
Vu-Manh et al. | Improving Vietnamese dependency parsing using distributed word representations | |
JP2022165476A (ja) | 設備id推論方法および設備id推論装置 | |
US20180011833A1 (en) | Syntax analyzing device, learning device, machine translation device and storage medium | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
JP4940251B2 (ja) | 文書処理プログラム及び文書処理装置 | |
JP2016051367A (ja) | データ解析装置、データ解析方法、および、プログラム。 | |
WO2016190063A1 (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
JP5600826B1 (ja) | 非構造化データ処理システム、非構造化データ処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20151113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170502 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6263420 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |