JP7327523B2 - 生成装置、生成方法及び生成プログラム - Google Patents
生成装置、生成方法及び生成プログラム Download PDFInfo
- Publication number
- JP7327523B2 JP7327523B2 JP2021572206A JP2021572206A JP7327523B2 JP 7327523 B2 JP7327523 B2 JP 7327523B2 JP 2021572206 A JP2021572206 A JP 2021572206A JP 2021572206 A JP2021572206 A JP 2021572206A JP 7327523 B2 JP7327523 B2 JP 7327523B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- text
- speech
- domain
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Machine Translation (AREA)
Description
[第1の実施形態の構成]
まず、図1を用いて、第1の実施形態に係る生成装置の構成について説明する。図1は、第1の実施形態に係る生成装置の構成例を示す図である。図1に示すように、生成装置10は、インタフェース部11、記憶部12及び制御部13を有する。
制約A:変換元の単語の品詞が助詞又は助動詞である。
制約B:変換元の単語の品詞と変換先の単語の品詞が異なる。
図6は、第1の実施形態に係る生成装置の処理の流れを示すフローチャートである。まず、生成装置10は、変換先ドメインのテキストデータを使って言語モデルを学習する(ステップS10)。次に、生成装置10は、変換元ドメインの文から変換先ドメインの文を生成する(ステップS20)。そして、生成装置10は、生成した文を出力する(ステップS30)。
これまで説明してきたように、抽出部132は、第1のテキストに含まれる第1の単語に対応する第2の単語を、所定のドメインに属する複数の単語の中から抽出する。判定部133は、第1の単語の品詞に関する所定の条件が満たされているか否かを判定する。生成部134は、判定部133により条件が満たされていると判定された場合に、第1のテキストの第1の単語を第2の単語に入れ換えた第2のテキストを生成する。このように、生成装置10は、学習用データを増強したいドメインの単語があれば、当該ドメインのテキストデータを自動的に生成することができる。このため、本実施形態によれば、言語モデルの精度を高めるような学習用データの増強を行うことができる。
第1の実施形態の有効性を検証する実験について説明する。実験では、CSJ講義音声コーパス(参考文献2:K. Maekawa, “Corpus of spontaneous Japanese: its design and evaluation,” in Proc. Workshop on Spontaneous Speech Processing and Recognition (SSPR), 2003, pp. 7-12.)(以下、CSJ)が変換元ドメインのテキストデータとして用いられた。また、NTTミーティング(複数人自由会話)音声コーパス(参考文献3:T. Hori, S. Araki, T. Yoshioka, M. Fujimoto, S. Watanabe, T. Oba, A. Ogawa, K. Otsuka, D. Mikami, K. Kinoshita, T. Nakatani, A. Nakamura, and J. Yamato, “Low-latency real-time meeting recognition and understanding using distant microphones and omni-directional camera,” IEEE TASLP, vol. 20, no. 2, pp. 499-513, Feb. 2012.)(以下、NTT)が変換先ドメインのテキストデータとして用いられた。
第1の実施形態では、例えば図5の3段目に示すように、「何と なく ペット の 恵み を 届け させる」といった、文法的には正しいが、意味的には正しいとはいえないテキストが生成される場合がある。これは、各単語の入れ換えは独立に行われ、その前後関係(文脈)が考慮されないためである。そこで、第2の実施形態では、生成装置は、生成したテキストを、意味的な正しさを考慮してさらに絞り込む。
図10を用いて、第2の実施形態に係る生成装置の構成について説明する。図10は、第2の実施形態に係る生成装置の構成例を示す図である。なお、図10において、第1の実施形態と同様の部分については、図1等と同様の符号を付し説明を省略する。図10に示すように、生成装置10aは、第1の実施形態と生成装置10と同様の処理部に加え、計算部153及び選択部136を有する。
図12は、第2の実施形態に係る生成装置の処理の流れを示すフローチャートである。まず、生成装置10は、変換先ドメインのテキストデータを使って言語モデルを学習する(ステップS10)。次に、生成装置10は、変換元ドメインの文から変換先ドメインの文を生成する(ステップS20)。
これまで説明してきたように、計算部135は、生成部134によって生成された複数の第2のテキストのそれぞれのPPL(Perplexity)を、言語モデルを用いて計算する。選択部136は、複数の第2のテキストの中から、計算部よって計算されたPPLの低さが所定の基準を満たすテキストを選択する。PPLが低いということは、単語が無理なく繋がっていること、すなわち、意味的に正しいことを示している。このため、本実施形態によれば、文法的に正しく、かつ意味的にも正しいテキストを得ることができる。
制約条件は、テキストの言語によって異なるものであってもよい。例えば、テキストの言語が英語等である場合、判定部133は、第1の単語の品詞がparticle(不変化詞、小辞、接頭辞、接尾辞)及びauxiliary verb(助動詞)のいずれでもなく、かつ第1の単語の品詞と第2の単語の品詞が同じである場合に、条件が満たされていると判定することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散及び統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散又は統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
一実施形態として、生成装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の生成処理を実行する生成プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の生成プログラムを情報処理装置に実行させることにより、情報処理装置を生成装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
11 インタフェース部
12 記憶部
13 制御部
121 変換先ドメインテキストデータ
122 言語モデル情報
123 入れ換えモデル情報
124 辞書情報
125 制約条件情報
131 学習部
132 抽出部
133 判定部
134 生成部
135 計算部
136 選択部
Claims (8)
- 変換元のドメインのテキスト、及び指定された変換先のドメインのラベルを基に、前記テキストに含まれる単語のそれぞれに対する、前記変換先のドメインに属する複数の単語、及び前記複数の単語の確率分布を出力する入れ換えモデルに、第1のドメインの第1のテキストを入力し、第2のドメインのラベルを指定して得られた前記第2のドメインに属する複数の単語の中から、前記複数の単語の確率分布を基に、前記第1のテキストに含まれる第1の単語に対応する第2の単語を選択する抽出部と、
前記第1の単語の品詞に関する所定の条件が満たされているか否かを判定する判定部と、
前記判定部により前記条件が満たされていると判定された場合に、前記第1のテキストの前記第1の単語を前記第2の単語に入れ換えた第2のテキストを生成する生成部と、
を有することを特徴とする生成装置。 - 前記判定部は、前記第1の単語の品詞があらかじめ定められた品詞であり、かつ前記第1の単語の品詞と前記第2の単語の品詞が同じである場合に、前記条件が満たされていると判定することを特徴とする請求項1に記載の生成装置。
- 前記判定部は、前記第1の単語の品詞が助詞及び助動詞のいずれでもなく、かつ前記第1の単語の品詞と前記第2の単語の品詞が同じである場合に、前記条件が満たされていると判定することを特徴とする請求項1に記載の生成装置。
- 前記判定部は、前記第1の単語の品詞がparticle及びauxiliary verbのいずれでもなく、かつ前記第1の単語の品詞と前記第2の単語の品詞が同じである場合に、前記条件が満たされていると判定することを特徴とする請求項1に記載の生成装置。
- 前記抽出部は、前記第2のドメインに属する複数の単語の確率分布に、Gumbel分布からサンプルした複数の値のそれぞれを加算して得られた複数の確率分布のそれぞれを基に、前記第2の単語を選択することを特徴とする請求項1に記載の生成装置。
- 前記生成部によって生成された複数の前記第2のテキストのそれぞれのPPL(Perplexity)を、言語モデルを用いて計算する計算部と、
前記第2のテキストの中から、前記計算部よって計算されたPPLの低さが所定の基準を満たすテキストを選択する選択部と、
をさらに有することを特徴とする請求項1に記載の生成装置。 - 生成装置によって実行される生成方法であって、
変換元のドメインのテキスト、及び指定された変換先のドメインのラベルを基に、前記テキストに含まれる単語のそれぞれに対する、前記変換先のドメインに属する複数の単語、及び前記複数の単語の確率分布を出力する入れ換えモデルに、第1のドメインの第1のテキストを入力し、第2のドメインのラベルを指定して得られた前記第2のドメインに属する複数の単語の中から、前記複数の単語の確率分布を基に、前記第1のテキストに含まれる第1の単語に対応する第2の単語を選択する抽出工程と、
前記第1の単語の品詞に関する所定の条件が満たされているか否かを判定する判定工程と、
前記判定工程により前記条件が満たされていると判定された場合に、前記第1のテキストの前記第1の単語を前記第2の単語に入れ換えた第2のテキストを生成する生成工程と、
を含むことを特徴とする生成方法。 - コンピュータを、請求項1から6のいずれか1項に記載の生成装置として機能させるための生成プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/002193 WO2021149206A1 (ja) | 2020-01-22 | 2020-01-22 | 生成装置、生成方法及び生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021149206A1 JPWO2021149206A1 (ja) | 2021-07-29 |
JP7327523B2 true JP7327523B2 (ja) | 2023-08-16 |
Family
ID=76992692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021572206A Active JP7327523B2 (ja) | 2020-01-22 | 2020-01-22 | 生成装置、生成方法及び生成プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230032372A1 (ja) |
JP (1) | JP7327523B2 (ja) |
WO (1) | WO2021149206A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019021804A1 (ja) | 2017-07-24 | 2019-01-31 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
JP2019128790A (ja) | 2018-01-24 | 2019-08-01 | 株式会社リコー | 言語処理装置、言語処理方法及びプログラム |
-
2020
- 2020-01-22 US US17/790,528 patent/US20230032372A1/en active Pending
- 2020-01-22 WO PCT/JP2020/002193 patent/WO2021149206A1/ja active Application Filing
- 2020-01-22 JP JP2021572206A patent/JP7327523B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019021804A1 (ja) | 2017-07-24 | 2019-01-31 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
JP2019128790A (ja) | 2018-01-24 | 2019-08-01 | 株式会社リコー | 言語処理装置、言語処理方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
辰巳守祐 他3名,辞書を用いたコーパス拡張による化学ドメインのDistantly Supervised固有表現認識,情報処理学会研究報告[online],日本,情報処理学会,2019年08月22日,Vol.2019-NL-241 No.7,ISSN 2188-8779 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021149206A1 (ja) | 2021-07-29 |
WO2021149206A1 (ja) | 2021-07-29 |
US20230032372A1 (en) | 2023-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10606946B2 (en) | Learning word embedding using morphological knowledge | |
US6904402B1 (en) | System and iterative method for lexicon, segmentation and language model joint optimization | |
US9588958B2 (en) | Cross-language text classification | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
US9052748B2 (en) | System and method for inputting text into electronic devices | |
US7275029B1 (en) | System and method for joint optimization of language model performance and size | |
CN112906392B (zh) | 一种文本增强方法、文本分类方法及相关装置 | |
JP2020520492A (ja) | 文書要約自動抽出方法、装置、コンピュータ機器及び記憶媒体 | |
US20060277028A1 (en) | Training a statistical parser on noisy data by filtering | |
EP2643770A2 (en) | Text segmentation with multiple granularity levels | |
JP6312467B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN113053367A (zh) | 语音识别方法、语音识别的模型训练方法以及装置 | |
CN113609284A (zh) | 一种融合多元语义的文本摘要自动生成方法及装置 | |
US8224642B2 (en) | Automated identification of documents as not belonging to any language | |
JP5975938B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
US10810368B2 (en) | Method for parsing natural language text with constituent construction links | |
CN112232057B (zh) | 基于文本扩展的对抗样本生成方法、装置、介质和设备 | |
CN111091001B (zh) | 一种词语的词向量的生成方法、装置及设备 | |
CN112835798A (zh) | 聚类学习方法、测试步骤聚类方法及相关装置 | |
US20210103608A1 (en) | Rare topic detection using hierarchical clustering | |
JP7327523B2 (ja) | 生成装置、生成方法及び生成プログラム | |
JP5500636B2 (ja) | 句テーブル生成器及びそのためのコンピュータプログラム | |
CN115858776A (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 | |
CN113553398A (zh) | 搜索词纠正方法、装置、电子设备及计算机存储介质 | |
Santos-Pérez et al. | Topic-dependent language model switching for embedded automatic speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7327523 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |