JP6003127B2 - 言語モデル作成プログラム及び言語モデル作成装置 - Google Patents

言語モデル作成プログラム及び言語モデル作成装置 Download PDF

Info

Publication number
JP6003127B2
JP6003127B2 JP2012062373A JP2012062373A JP6003127B2 JP 6003127 B2 JP6003127 B2 JP 6003127B2 JP 2012062373 A JP2012062373 A JP 2012062373A JP 2012062373 A JP2012062373 A JP 2012062373A JP 6003127 B2 JP6003127 B2 JP 6003127B2
Authority
JP
Japan
Prior art keywords
morpheme
reading
extraction means
extracting
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012062373A
Other languages
English (en)
Other versions
JP2013195685A (ja
Inventor
昌嗣 外池
昌嗣 外池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012062373A priority Critical patent/JP6003127B2/ja
Publication of JP2013195685A publication Critical patent/JP2013195685A/ja
Application granted granted Critical
Publication of JP6003127B2 publication Critical patent/JP6003127B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、言語モデル作成プログラム、言語モデル作成装置及び音声認識装置に関する。
従来の音声認識装置として、入力される音声信号に対して音節の区切りに関する情報を付加するものが知られている(例えば、特許文献1参照)。
特許文献1の音声認識装置は、利用者が入力した音声信号を任意の音節に区切るための音節の区切りに関する情報としてのブレスコードを生成するブレスコード生成部と、利用者の操作のタイミングに応じてブレスコードを生成するために操作信号をブレスコード生成部に送信する操作部と、ブレスコードが付加された音声信号をブレスコードに応じて音節ごとにデジタルデータに変換する変換部と、変換部において変換されたデジタルデータを音節ライブラリと比較して一致する文字データを出力する出力部とを有し、利用者が音節区切りに関する情報を付加するため、比較するデジタルデータについて次音節との混同を抑制する。
特開平11−219194号公報
本発明の目的は、母音の発声に伴う言語の曖昧性を考慮した言語モデルを作成する言語モデル作成プログラム、言語モデル作成装置及びこれらにより作成された言語モデルを用いた音声認識装置を提供することにある。
[1]コンピュータを、
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
[2]コンピュータを、
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みの先頭から、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
[3]形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
[4]形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みから、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
請求項1又は3に係る発明によれば、母音が連続することにより、母音の発声に伴う言語の曖昧性を考慮した言語モデルを作成することができる。
請求項2又は4に係る発明によれば、母音が認識されないことにより、母音の発声に伴う言語の曖昧性を考慮した言語モデルを作成することができる。
図1は、本発明の実施の形態に係る言語モデル作成装置の構成例を示す概略ブロック図である。 図2(a)〜(d)は、言語モデル作成装置のパターン1の動作例を説明するための図である。 図3(a)〜(f)は、言語モデル作成装置のパターン2の動作例を説明するための図である。 図4は、言語モデル作成装置のパターン1の動作例を示すフローチャートである。 図5は、言語モデル作成装置のパターン2の動作例を示すフローチャートである。 図6は、音声認識装置の構成の一例を示すための概略ブロック図である。
(言語モデル作成装置の構成)
図1は、本発明の実施の形態に係る言語モデル作成装置の構成例を示す概略ブロック図である。
この言語モデル作成装置1は、CPU(Central Processing Unit)等から構成され各部を制御するとともに各種のプログラムを実行する制御部10と、HDD(Hard Disk Drive)やフラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、外部と通信する通信部12とを有する。なお、言語モデル作成装置1は、例えば、サーバ等のコンピュータであり、PDA(Personal Digital Assistant)又は携帯電話機等でもよい。また、さらに、文や図形等を表示する液晶ディスプレイ等の表示部、操作入力用のキーボードやマウス等の操作部を有する構成であってもよい。
制御部10は、後述する言語モデル作成プログラム110を実行することで、母音形態素抽出手段100、読み形態素抽出手段101、読み一致形態素抽出手段102、右接続形態素抽出手段103、左接続形態素抽出手段104及び曖昧性含有形態素抽出手段105等として機能する。
母音形態素抽出手段100は、後述する形態素解析辞書111から母音で始まる形態素A(第1の形態素)を抽出する。
読み形態素抽出手段101は、母音形態素抽出手段100が抽出した母音で始まる形態素Aの読みから先頭の母音を削除し、形態素Aの読みから先頭の母音を削除した読みを「読みa」(第1の読み)として、読みaで始まる形態素B(第2の形態素)を形態素解析辞書111から抽出する。
読み一致形態素抽出手段102は、読み形態素抽出手段101が抽出した形態素Bから、読みaと読みが完全一致する形態素C(第3の形態素)を抽出する。
右接続形態素抽出手段103は、読み形態素抽出手段101が抽出した形態素Bのうち、その読みの先頭から読みaを削除したものが形態素Aの右側に接続できる形態素を、形態素D(第5の形態素)として抽出する。
左接続形態素抽出手段104は、形態素Aと形態素Cに対し共通に左側に接続できる形態素E(第4の形態素)、又は形態素Aと形態素Dに対し共通に左側に接続できる形態素F(第6の形態素)を抽出する。
曖昧性含有形態素抽出手段105は、形態素E+Aと形態素E+Cの組み合わせ、又は形態素F+A+(D−a)と形態素F+Dの組み合わせを曖昧性を含有する形態素の並びとして抽出し、曖昧性含有形態素リスト112に追加する。なお、ここで「+」は、「+」の前の形態素の後に「+」の後の形態素を続けることを意味し、「D−a」は、「−」の後に続く読みaを「−」の前の形態素Dの読みの先頭から削除して得られる読みを持つ形態素を意味する。
記憶部11は、制御部10を上述した各手段100〜105として動作させる言語モデル作成プログラム110、品詞等の情報が付加された形態素の辞書である形態素解析辞書111、曖昧性含有形態素抽出手段105が抽出した曖昧性を含有する形態素の並びが追加される曖昧性含有形態素リスト112等を記憶する。
通信部12は、コーパス2に接続される。コーパス2は、文書の集合であり、一例として、ウェブサイト上の文書や新聞等の文書の集合を用いる。なお、コーパス2は記憶部11に格納したものを用いてもよいし、CD−ROM等の記憶媒体から読み込んだものを用いてもよい。
(言語モデル作成装置の動作)
以下に、言語モデル作成装置1の動作を図1〜5を参照しつつ、(1)パターン1、(2)パターン2に分けて説明する。
(1)パターン1
図2(a)〜(d)は、言語モデル作成装置1のパターン1の動作例を説明するための図である。また、図4は、言語モデル作成装置1のパターン1の動作例を示すフローチャートである。
まず、母音形態素抽出手段100は、形態素解析辞書111から母音で始まる形態素Aの一例として、図2(a)に示すように、「行き」という形態素200(母音は「い」)を抽出する(S10)。
次に、読み形態素抽出手段101は、図2(b)に示すように、読みaを得るために、母音形態素抽出手段100が抽出した母音で始まる形態素Aである形態素200の読みから先頭の母音「い」を削除して「き」(201)とする(S11)。
次に、読みa、つまり、先頭の母音「い」を削除した形態素A(201)の読み「き」で始まる形態素Bを形態素解析辞書111から抽出し、図2(c)に示す一又は複数の形態素Bのリスト202を得る(S12)。
次に、読み一致形態素抽出手段102は、読み形態素抽出手段101が抽出した形態素Bのリスト202から、先頭の母音「い」を削除した形態素A(201)の読みa、つまり「き」と読みが完全一致する「来」という形態素203を形態素Cとして抽出する(S13)。
次に、左接続形態素抽出手段104は、形態素A(「行き」形態素200)と形態素C(「来」形態素203)に対し共通に左側に接続できる「に」という形態素204を形態素解析辞書111から形態素Eとして抽出する(S14)。ここで、形態素Eとして「に」という形態素204を抽出した理由は、「に」の母音が「い」であるため、形態素Aの先頭の母音「い」と連続することで言語の曖昧性が生じる蓋然性が高いためである。なお、「に」以外にも曖昧性が生じる場合は「へ」等を形態素Eとして抽出してもよい。
なお、上記形態素Eの抽出は、形態素A+E及び形態素C+Eの連接頻度をコーパス2を用いて調べることで行う。また、コーパス2を用いる代わりに、連接可能性辞書を用いて調べてもよい。
次に、曖昧性含有形態素抽出手段105は、図2(d)に示す形態素E+A(「に行き」)と形態素E+C(「に来」)の組み合わせ112aを曖昧性を含有形する態素の並びとして抽出し、曖昧性含有形態素リスト112に追加する(S15)。
(2)パターン2
図3(a)〜(f)は、言語モデル作成装置1のパターン2の動作例を説明するための図である。また、図5は、言語モデル作成装置1のパターン2の動作例を示すフローチャートである。
まず、母音形態素抽出手段100は、形態素解析辞書111から母音で始まる形態素Aの一例として、図3(a)に示すように、「行き」という形態素200(先頭の母音は「い」)を抽出する(S20)。
次に、読み形態素抽出手段101は、図3(b)に示すように、読みaを得るために、母音形態素抽出手段100が抽出した母音で始まる形態素Aである形態素200の読みから先頭の母音「い」を削除して「き」(201)とする(S21)。
次に、読みa、つまり、先頭の母音「い」を削除した形態素A(201)の読み「き」で始まる形態素Bを形態素解析辞書111から抽出し、図3(c)に示す形態素Bのリスト202を得る(S22)。
次に、右接続形態素抽出手段103は、読み形態素抽出手段101が抽出した形態素Bのリスト202の各形態素のうち、その読みの先頭から、先頭の母音を削除した形態素Aの読みa、つまり「き」を削除したもの(例えば「きたい」に対して「たい」)が形態素Aに接続できる形態素(例えば「期待」)を形態素Dとして抽出する(S23)。
なお、形態素205を形態素Dとして抽出する際に、「たい」が形態素Aに接続できるか否かは以下の方法により判断する。
まず、読み形態素抽出手段101が抽出した形態素Bのリスト202の各形態素の読みから、先頭の母音を削除した形態素Aの読みa「き」を削除し、削除したもの「たい」、「ぼう」、「かん」…の品詞を判断する。一例として、形態素206である「たい」は、図3(d)に示すように、助動詞であることがわかる。
次に、形態素206である「たい」が形態素Aである形態素200の右に接続される連接頻度をコーパス2を用いて調べる。連接頻度が予め定めた閾値以上であれば形態素206が形態素Aに接続できるものと判断される。なお、右接続形態素抽出手段103は、形態素206である「たい」が形態素Aである形態素200の右に接続される可能性を連接可能性辞書を用いて調べてもよい。
次に、左接続形態素抽出手段104は、形態素A(「行き」形態素200)と形態素D(「期待」形態素206)に対し共通に左側に接続できる「に」という形態素207を形態素解析辞書111から形態素Fとして抽出する(S24)。ここで、形態素Fとして「に」という形態素207を抽出した理由は、「に」の母音が「い」であるため、形態素Aの先頭の母音「い」と連続することで言語の曖昧性が生じる蓋然性が高いためである。なお、「に」以外にも曖昧性が生じる場合は「へ」等を形態素Fとして抽出してもよい。また、左接続形態素抽出手段104は、形態素Aと形態素Dに対し共通に左側に接続できる形態素Fを連接可能性辞書を用いて抽出してもよい。
次に、曖昧性含有形態素抽出手段105は、図3(f)に示す形態素F+A+(D−a)(「に行きたい」)と形態素F+D(「に期待」)の組み合わせ112bを曖昧性を含有する形態素の並びとして抽出し、曖昧性含有形態素リスト112に追加する(S25)。
(音声認識装置の構成)
以下、上に説明した言語モデル作成装置1によって得られた曖昧性含有形態素リスト112を用いて音声認識を行うための構成及び動作について説明する。
図6は、音声認識装置の構成の一例を示すための概略ブロック図である。
音声認識装置3は、WAVファイル等の音声情報を受け付ける音声情報受付手段4と、音声情報受付手段4が受け付けた音声情報からフーリエ変換等の手法を用いてメル周波数ケプストラム係数(mel−frequency cepstral coefficient;MFCC)等の特徴量を抽出する特徴量抽出手段5と、特徴量抽出手段5が抽出した特徴量をテキスト情報へ変換するデコーダ6と、デコーダ6が変換したテキスト情報中に曖昧性が含まれる場合に曖昧性がある旨を出力する曖昧性出力手段7と、デコーダ6が変換したテキスト情報を出力するテキスト情報出力手段8とを有する。
デコーダ6は、特徴量と音素との対応を定義する音響モデル60と、音素の並びと単語との対応を定義する単語辞書61と、単語(形態素)の並びの確率を定義する言語モデル62とを有する。
曖昧性出力手段7は、言語モデル作成装置1によって得られた曖昧性含有形態素リスト112を有し、曖昧性含有形態素リスト112に該当する形態素の並びが入力された場合に曖昧性がある旨を利用者等に提示できる形式で出力する。
(音声認識装置の動作)
まず、音声認識装置3の音声情報受付手段4は、WAVファイル等の音声情報を受け付ける。
次に、特徴量抽出手段5は、音声情報受付手段4が受け付けた音声情報からフーリエ変換等の手法を用いてメル周波数ケプストラム係数(MFCC)等の特徴量を抽出する。
次に、デコーダ6は、特徴量抽出手段5が抽出した特徴量をテキスト情報へ変換する。この際、まず、デコーダ6は、音響モデル60を用いて特徴量を音素へ変換する。次に、デコーダ6は、単語辞書61を用いて連続する音素の並びを単語に変換する。この際、変換可能な単語を候補として複数出力する。最後に、デコーダ6は、複数の単語(形態素)の候補の並びを、言語モデル62を用いて単語(形態素)の並びの確率の高い順に出力する。
次に、テキスト情報出力手段8は、デコーダ6が出力した単語の並びの候補から、例えば、最上位の単語の並びをテキスト情報としたものを出力する。
ここで、曖昧性出力手段7は、デコーダ6が出力した単語の並びの候補を扱う際、言語モデル作成装置1によって得られた曖昧性含有形態素リスト112を用いて、曖昧性含有形態素リスト112に該当する単語(形態素)の並びが入力された場合、当該単語の並びに曖昧性があると判断する。次に、曖昧性出力手段7は、当該単語の並びに曖昧性がある旨を利用者等に提示できる形式、例えば、表示部に警告を表示する等の形式で出力する。また、曖昧性出力手段7は、曖昧性含有形態素リスト112に該当する単語(形態素)の並びが入力されない場合、警告等を出力せず、単語の並びの候補をテキスト情報出力手段8に出力する。
(実施の形態の効果)
上記したパターン1又はパターン2により形態素の並びを抽出することで、母音が連続した場合に生じる曖昧性や、母音が認識されない場合に生じる曖昧性等を含有する形態素の並びを抽出することができ、これらを含む文を言語モデルに追加することで、母音の発声に伴う言語の曖昧性を考慮した言語モデルを作成することができる。
また、デコーダ6により、作成した言語モデル62を用いて音声情報をテキスト情報に変換した後、当該テキスト情報中に曖昧性含有形態素リスト112に該当する形態素の並びが入力されたと曖昧性出力手段7が検出した場合に、当該単語の並びに曖昧性があると判断し、曖昧性出力手段7がその判断結果を利用者に出力するようにしたため、当該単語の並びに曖昧性がある旨を利用者等に提示することができる。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々な変形が可能である。例えば、単語の結合によって母音の結合が起こる場合としては、「パターン1」及び「パターン2」で説明した、助詞+動詞の組み合わせの他、名詞+助詞(「三重へ」と「三重」の曖昧性)、名詞+名詞、副詞+動詞、副詞+名詞、用言連用形+動詞、助詞+副詞、助詞+名詞(「を沖田」と「を北」の曖昧性)、助詞+形容詞等が挙げられる。
また、上記言語モデル作成プログラム110をCD−ROM等の記憶媒体に格納して提供することも可能であり、インターネット等のネットワークに接続されているサーバ装置等から装置内の記憶部にダウンロードしてもよい。また、母音形態素抽出手段100、読み形態素抽出手段101、読み一致形態素抽出手段102、右接続形態素抽出手段103、左接続形態素抽出手段104及び曖昧性含有形態素抽出手段105等の一部又は全部をASIC等のハードウェアによって実現してもよい。なお、上記実施の形態の動作説明で示した各ステップは、順序の変更、ステップの省略、追加が可能である。
1 言語モデル作成装置
2 コーパス
3 音声認識装置
4 音声情報受付手段
5 特徴量抽出手段
6 デコーダ
7 曖昧性出力手段
8 テキスト情報出力手段
10 制御部
11 記憶部
12 通信部
60 音響モデル
61 単語辞書
62 言語モデル
100 母音形態素抽出手段
101 読み形態素抽出手段
102 一致形態素抽出手段
103 右接続形態素抽出手段
104 左接続形態素抽出手段
105 曖昧性含有形態素抽出手段
110 言語モデル作成プログラム
111 形態素解析辞書
112 曖昧性含有形態素リスト

Claims (4)

  1. コンピュータを、
    形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
    前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
    前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
    前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
    前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
  2. コンピュータを、
    形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
    前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
    前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みの先頭から、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
    前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
    前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
  3. 形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
    前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
    前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
    前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
    前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
  4. 形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
    前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
    前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みから、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
    前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
    前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
JP2012062373A 2012-03-19 2012-03-19 言語モデル作成プログラム及び言語モデル作成装置 Expired - Fee Related JP6003127B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012062373A JP6003127B2 (ja) 2012-03-19 2012-03-19 言語モデル作成プログラム及び言語モデル作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012062373A JP6003127B2 (ja) 2012-03-19 2012-03-19 言語モデル作成プログラム及び言語モデル作成装置

Publications (2)

Publication Number Publication Date
JP2013195685A JP2013195685A (ja) 2013-09-30
JP6003127B2 true JP6003127B2 (ja) 2016-10-05

Family

ID=49394705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012062373A Expired - Fee Related JP6003127B2 (ja) 2012-03-19 2012-03-19 言語モデル作成プログラム及び言語モデル作成装置

Country Status (1)

Country Link
JP (1) JP6003127B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106023986B (zh) * 2016-05-05 2019-08-30 河南理工大学 一种基于声效模式检测的语音识别方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0553597A (ja) * 1991-06-12 1993-03-05 Ricoh Co Ltd 音声認識装置およびパターン比較方法
JPH0950292A (ja) * 1995-05-31 1997-02-18 Ricoh Co Ltd 音声認識装置
JPH09116648A (ja) * 1995-10-20 1997-05-02 Meidensha Corp 携帯用通信装置
JP4520555B2 (ja) * 1999-09-09 2010-08-04 クラリオン株式会社 音声認識装置および音声認識ナビゲーション装置
JP2001083982A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP2003150188A (ja) * 2001-08-31 2003-05-23 Hiraiwa Tekkosho:Kk 聴覚障害者用対話支援装置
JP3982289B2 (ja) * 2002-03-13 2007-09-26 日産自動車株式会社 音声認識装置
JP2005189846A (ja) * 2003-12-05 2005-07-14 Ihm:Kk 音声制御スクリーンシステム
JP2005257954A (ja) * 2004-03-10 2005-09-22 Nec Corp 音声検索装置、音声検索方法および音声検索プログラム
JP4736478B2 (ja) * 2005-03-07 2011-07-27 日本電気株式会社 音声書き起こし支援装置およびその方法ならびにプログラム
JP2007333778A (ja) * 2006-06-12 2007-12-27 Toshiichi Shinshi 商品売買システムとそれを実現するためのコンピュータプログラムとその方法

Also Published As

Publication number Publication date
JP2013195685A (ja) 2013-09-30

Similar Documents

Publication Publication Date Title
JP5318230B2 (ja) 認識辞書作成装置及び音声認識装置
JP4791984B2 (ja) 入力された音声を処理する装置、方法およびプログラム
JP5207642B2 (ja) 語句として新たに認識するべき文字列を取得するためのシステム、方法及びコンピュータプログラム
JP6251958B2 (ja) 発話解析装置、音声対話制御装置、方法、及びプログラム
US8015011B2 (en) Generating objectively evaluated sufficiently natural synthetic speech from text by using selective paraphrases
TWI532035B (zh) 語言模型的建立方法、語音辨識方法及電子裝置
US8504367B2 (en) Speech retrieval apparatus and speech retrieval method
TW546631B (en) Disambiguation language model
CN108140019B (zh) 语言模型生成装置、语言模型生成方法以及记录介质
JP6245846B2 (ja) 音声認識における読み精度を改善するシステム、方法、およびプログラム
JP7092953B2 (ja) エンドツーエンドモデルによる多言語音声認識のための音素に基づく文脈解析
JP2012063536A (ja) 端末装置、音声認識方法および音声認識プログラム
US20090138266A1 (en) Apparatus, method, and computer program product for recognizing speech
GB2557714A (en) Determining phonetic relationships
EP2595144B1 (en) Voice data retrieval system and program product therefor
JP2017009842A (ja) 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
JP4758758B2 (ja) 辞書作成装置および辞書作成プログラム
JP7110055B2 (ja) 音声合成システム、及び音声合成装置
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP2012003090A (ja) 音声認識装置および音声認識方法
JP2015084047A (ja) 文集合作成装置、文集合作成方法および文集合作成プログラム
JP6003127B2 (ja) 言語モデル作成プログラム及び言語モデル作成装置
JP2013061591A (ja) 音声合成装置、音声合成方法およびプログラム
JP6619932B2 (ja) 形態素解析装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160322

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160607

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160822

R150 Certificate of patent or registration of utility model

Ref document number: 6003127

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees