JP5344396B2 - 言語学習装置、言語学習プログラム及び言語学習方法 - Google Patents
言語学習装置、言語学習プログラム及び言語学習方法 Download PDFInfo
- Publication number
- JP5344396B2 JP5344396B2 JP2009206505A JP2009206505A JP5344396B2 JP 5344396 B2 JP5344396 B2 JP 5344396B2 JP 2009206505 A JP2009206505 A JP 2009206505A JP 2009206505 A JP2009206505 A JP 2009206505A JP 5344396 B2 JP5344396 B2 JP 5344396B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- language
- list
- learning
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Navigation (AREA)
Description
B : 概要『言語学習』について
C : 概要『発話理解』について
D : 概要『応答生成』について
E : 言語学習装置について
E−1: 言語学習装置の構成
E−2: 言語学習装置の動作
F : 『言語処理システム』の実験例
F―1: 実験内容
F―2: 実験条件
F―3: 実験結果と考察
F−3−1:獲得単語数と発話の認識結果
F−3−2:出力したキーワードの音素正解精度
G : 言語処理システムの適用例
H : その他
A:概要『言語処理システム』について
本発明の実施形態に係る言語処理システムは、言語を学習する第1モードと、この第1モードで学習した言語に基づいてユーザーの発話を理解したり、理解した発話に基づいて応答したりする第2モードと、を切り替えて行う。モードの切替は適宜、例えばユーザーによる制御或いは予め設定されたタイミングで行われる。
B:概要『言語学習』について
本実施形態の言語学習装置は、単語の知識を当初所有しない状態で言語学習を開始し、発話から単語を学習する。単語とは、例えば物や場所や人の名前である。
言語学習装置は、例えば学習データを用いて『初期の単語候補』(以下、単語リストと呼ぶ)を作成する。この単語リストは、学習データを音素認識した結果から生成される。
言語学習装置では、単語リストを用いて学習データを単語認識して、意味と文法の学習を行う。これにより、初期の学習内容、所謂『知識』が生成される(以下、言語知識と呼ぶ場合がある)。
初期の単語リストに基づいて学習した内容には、不要な単語に関する情報が知識として含まれる。また、学習すべき内容が知識として含まれていない場合がある。そこで、本実施形態の言語学習装置では、単語リストを修正する。具体的には、言語学習装置は、不要な単語を上記の単語リストから削除(以下、削除処理と呼ぶ)したり、上記の単語リストに新たな単語を追加(以下、追加処理と呼ぶ)したりする。単語リストの修正として、「削除処理」及び「追加処理」の少なくとも一方の処理が実行される。
修正した単語リストと当初与えられた学習データとを用いて再び学習を行う。これにより、初期の単語リストによって作成された学習内容中の不備を是正する。よって、学習内容(知識)が改良される。なお、『不備の是正』とは、存在する全ての欠点を修正する場合に限らず、一部の欠点を修正する場合も含む。
修正された単語リストに基づいて学習した内容(第4ステップによる知識)にも、不要な単語に関する情報が知識として含まれ、及び/又は未だ必要な情報が欠落している虞がある。そこで、単語リストを再度修正する。
再度修正した単語リストと当初与えられた学習データとを用いて再び学習を行う。
C:概要『発話理解』について
本実施形態の発話理解装置について説明する。
E:言語学習装置について
(E1:言語学習装置の構成)
図3は本実施形態に係る言語学習装置100の構成を示すブロック図である。
前述したように、ある音声aを単語認識すると、その認識結果のNBestには、ある単語wが含まれる結果と含まれない結果が出てくる。wが含まれた最尤の候補と、wが含まれなかった2番目の候補の尤度差は、wが含まれるモデルθ0と含まれないθlの(音声aにおける)尤度差といえる。また、モデルθlの自由度はモデルθ0から一語減っているため以下の式9となる。
(2)単語の連結
リスト修正手段150は、削除処理と共に、或いは削除処理とは別に、追加処理を行う。
E−2:言語学習装置の動作
本実施形態に係る言語学習装置100における言語獲得手法、つまり言語処理システム1における学習フェイズは、大まかに分けると、三つのステップでなる(ステップS1〜S3:図3及び図4参照)。
F:『言語処理システム』の実験例
〔F―1:実験内容〕
実験は、言語を獲得するための学習フェイズと、獲得した知識を運用する評価フェイズ(評価フェイズとも呼ぶ)と、から成る。
〔F―2:実験条件〕
実験には男性話者17名の音声を用いた。対象の数は10、言い回しのパターン数は6とし、その全ての組み合わせとなる60発話を話者毎に収集した。対象番号と対応するキーワードを表1に、言い回しのパターンを表2に示す。12-fold Cross Validation法〔55個のデータで学習を行い、残り5個のデータで評価を行うことを12通り行う〕を用いて話者毎に評価する。なお、式(1)に示した各尤度の重みには、無作為に選出した一人の話者のデータに対して最も良い結果が得られた(音響重みω1=0.0001,文法重みω2=5.0,語意重みω3=5.0)を使用した。
〔F−3−1:獲得単語数と発話の認識結果〕
まず、モデル選択時における記述長DLと単語数との関係を図9に示す。図には実験した事例の一つを示す(50語以上は省略)。モデル選択1回目の時には32単語の時にDLが最小となったため、そこで単語の削除がストップした。得られた32単語に、単語の連結によって作られた単語を統合することで、新たな単語リストが生成される。そのため、モデル選択2回目は32単語より多くの単語がある状態からスタートする。モデル選択を繰り返すことで、最小の記述長となる単語数が収束していることがわかる。
〔F−3−2:出力したキーワードの音素正解精度〕
初期の言語知識を用いて60発話を音素認識した際の、発話全体に対する音素正解精度は82%であった(図中、破線の「音素正解精度(ベースライン)」)。各対象のキーワードを式4によって出力し、その音素正解精度を算出した(図中「キーワードの音素正解精度」)。モデル選択を行わない場合の出力キーワードの音素正解精度は50%以下であり、モデル選択を繰り返すことで85%まで上昇した。
G:言語処理システムの適用例
本実施形態に係る言語処理システム1は、例えば二足歩行を行う人型ロボット(以下、ロボットと呼ぶ)に適用できる。この種のロボットでは、学習フェイズで、人がロボットを所望の場所に連れて行き、『ここはスマートルームです。』や『この場所の名前は辻野さんのブース。』などと言って、その場所の名前を教示する。場所の情報は、予めカテゴライズされた位置情報が与えられる。ロボットは、発話と、発話が示す対象(本稿では場所を扱うが、物や人でもよい)の対応関係を学習する。
H:その他
以上詳述したが、本発明はその趣旨を逸脱しない範囲において様々な形態で実施をすることができる。
10 言語学習部
20 発話理解部
30 応答生成部
100 言語学習装置
110 音素処理手段
120 リスト作成手段
130 単語認識手段
140 学習処理手段
150 リスト修正手段
M1 言語モデル
M2 語意モデル
θ 言語知識
Claims (8)
- 単語の知識を当初備えていないが、学習を進めることで上記単語の知識を習得する言語学習装置であって、
音素モデルに基づいて音声を音素認識する音素認識手段と、
上記音素認識手段で認識された音素情報から単語リストを作成するリスト作成手段と、
上記リスト作成手段で作成された単語リストに基づいて上記音声を単語認識する単語認識手段と、
上記単語認識手段で認識された単語情報を利用して言語知識を学習する学習処理手段と、
上記単語リストを修正するリスト修正手段と、
を備え、
上記学習処理手段は、上記単語認識手段においてNbestとして認識された単語列を用いて言語モデルと語意モデルを上記言語知識として学習し、
上記リスト修正手段は、上記言語モデル及び上記語意モデルの尤度を考慮して、上記言語モデルと上記語意モデルの数が適切になるように、上記単語リストとして削除すべき単語、必要とすべき新単語の何れか一方又は双方を認識し、
上記学習処理手段が、上記リスト修正手段によって修正した単語リストに基づいて上記言語知識を修正することを特徴とする、言語学習装置。 - 前記リスト修正手段が前記単語リストの修正を複数回或いは繰り返し行い、前記学習処理手段が、前記リスト修正手段で前記単語リストが修正される度に前記言語知識の修正を行うことを特徴とする、請求項1に記載の言語学習装置。
- 請求項1又は2に記載の言語学習装置と、この言語学習装置で作成された言語知識に基づいて発話の理解を行う発話理解装置と、を備えたことを特徴とする、言語学習システム。
- 請求項3に記載の前記言語学習システムを搭載したことを特徴とする、ロボット。
- 請求項3に記載の前記言語学習システムを搭載したことを特徴とする、カーナビゲーション装置。
- コンピュータを、
音素モデルに基づいて音声を音素認識する音素認識手段、
上記音素認識手段で認識された音素情報から単語リストを作成するリスト作成手段、
上記リスト作成手段で作成された単語リストに基づいて上記音声を単語認識する単語認識手段、
上記単語認識手段で認識された単語情報に基づいて言語知識を学習する学習処理手段、
上記単語リストを修正するリスト修正手段、
として機能させて、単語の知識を当初備えていないが学習を進めることで上記単語の知識を習得するプログラムであって、
上記学習処理手段が、上記言語知識として前記単語認識手段でNbestとして認識された単語列を用いて言語モデルと語意モデルを学習し、
上記リスト修正手段が、上記言語モデル及び上記語意モデルの尤度を考慮して、上記言語モデルと上記語意モデルの数が最適となるように、上記単語リストとして削除すべき単語、必要とすべき新単語の何れか一方又は双方を決定して上記単語リストを修正し、
上記学習処理手段が、修正された単語リストに基づいて前記言語知識を修正することを特徴とする、言語学習プログラム。 - 前記リスト修正手段が前記単語リストの修正を複数回或いは繰り返し行い、前記学習処理手段が、前記リスト修正手段で前記単語リストが修正される度に前記言語知識の修正を行うことを特徴とする、請求項6に記載の言語学習プログラム。
- 単語の知識を当初備えずに学習を進めることで上記単語の知識を習得する言語学習方法であって、
音素モデルに基づいて音声を音素認識する第1ステップと、
上記第1ステップで認識された音素情報から単語リストを作成する第2ステップと、
上記第2ステップで作成された単語リストに基づいて上記音声を単語認識する第3ステップと、
上記第3ステップで認識された単語情報に基づいて、上記第3ステップで認識された各単語に対応する複数のモデルを含む言語知識を学習する第4ステップと、
上記第4ステップで作成された言語知識と最小記述長原理とに基づいて上記単語リストから削除する単語を決定して、上記単語リストの修正を複数回或いは繰り返し行う第5ステップと、
上記第5ステップで上記単語リストが修正される度に上記言語知識の修正を行う第6ステップと、を含むことを特徴とする、言語学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009206505A JP5344396B2 (ja) | 2009-09-07 | 2009-09-07 | 言語学習装置、言語学習プログラム及び言語学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009206505A JP5344396B2 (ja) | 2009-09-07 | 2009-09-07 | 言語学習装置、言語学習プログラム及び言語学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011059830A JP2011059830A (ja) | 2011-03-24 |
JP5344396B2 true JP5344396B2 (ja) | 2013-11-20 |
Family
ID=43947406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009206505A Expired - Fee Related JP5344396B2 (ja) | 2009-09-07 | 2009-09-07 | 言語学習装置、言語学習プログラム及び言語学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5344396B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378485A (zh) * | 2019-06-03 | 2019-10-25 | 广东幽澜机器人科技有限公司 | 一种机器人自学习新业务知识方法及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102285142B1 (ko) * | 2019-03-27 | 2021-08-04 | 주식회사 단비아이엔씨 | 챗봇을 위한 학습 데이터 추천 장치 및 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2738508B2 (ja) * | 1994-10-27 | 1998-04-08 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 統計的言語モデル作成装置及び音声認識装置 |
JP3923513B2 (ja) * | 2004-06-08 | 2007-06-06 | 松下電器産業株式会社 | 音声認識装置および音声認識方法 |
-
2009
- 2009-09-07 JP JP2009206505A patent/JP5344396B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378485A (zh) * | 2019-06-03 | 2019-10-25 | 广东幽澜机器人科技有限公司 | 一种机器人自学习新业务知识方法及装置 |
CN110378485B (zh) * | 2019-06-03 | 2021-05-11 | 广东幽澜机器人科技有限公司 | 一种机器人自学习新业务知识方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2011059830A (ja) | 2011-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10210862B1 (en) | Lattice decoding and result confirmation using recurrent neural networks | |
US8019602B2 (en) | Automatic speech recognition learning using user corrections | |
CN1112669C (zh) | 采用连续密度隐藏式马尔克夫模型的语音识别方法和系统 | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
CN113168828A (zh) | 基于合成数据训练的会话代理管线 | |
CN110085215B (zh) | 一种基于生成对抗网络的语言模型数据增强方法 | |
JP2011033680A (ja) | 音声処理装置及び方法、並びにプログラム | |
JPWO2008004666A1 (ja) | 音声認識装置、音声認識方法、および音声認識用プログラム | |
JP2008293019A (ja) | 言語理解装置 | |
Neubig et al. | Bayesian learning of a language model from continuous speech | |
CN110021293B (zh) | 语音识别方法及装置、可读存储介质 | |
JP2007047412A (ja) | 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置 | |
JP5276610B2 (ja) | 言語モデル生成装置、そのプログラムおよび音声認識システム | |
JP5183120B2 (ja) | 平方根ディスカウンティングを使用した統計的言語による音声認識 | |
US20210049324A1 (en) | Apparatus, method, and program for utilizing language model | |
CN108806691B (zh) | 语音识别方法及系统 | |
Shafran et al. | A comparison of classifiers for detecting emotion from speech | |
JP5344396B2 (ja) | 言語学習装置、言語学習プログラム及び言語学習方法 | |
KR101727306B1 (ko) | 언어모델 군집화 기반 음성인식 장치 및 방법 | |
JP4595415B2 (ja) | 音声検索システムおよび方法ならびにプログラム | |
JP3950957B2 (ja) | 言語処理装置および方法 | |
JP4741452B2 (ja) | 言語モデル作成装置及び言語モデル作成プログラム並びに音声認識装置及び音声認識プログラム | |
JPH09134192A (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
JP4417892B2 (ja) | 音声情報処理装置、音声情報処理方法および音声情報処理プログラム | |
JP2005250071A (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130805 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5344396 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |