JP3916792B2 - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP3916792B2
JP3916792B2 JP06191499A JP6191499A JP3916792B2 JP 3916792 B2 JP3916792 B2 JP 3916792B2 JP 06191499 A JP06191499 A JP 06191499A JP 6191499 A JP6191499 A JP 6191499A JP 3916792 B2 JP3916792 B2 JP 3916792B2
Authority
JP
Japan
Prior art keywords
word
speech recognition
recognition
speech
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06191499A
Other languages
English (en)
Other versions
JP2000259174A (ja
Inventor
直人 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP06191499A priority Critical patent/JP3916792B2/ja
Publication of JP2000259174A publication Critical patent/JP2000259174A/ja
Application granted granted Critical
Publication of JP3916792B2 publication Critical patent/JP3916792B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、言語モデルを使用して音声認識を行う音声認識装置に関する。
【0002】
【従来の技術】
言語モデルを使用して音声認識を行う音声認識装置が知られている。言語モデルとしては一般に、文章が記載されているテキストからn個の連続する単語について学習したn−gramモデルが使用される。従来は、n=2の場合である2−gram(bi−gramとも呼ばれる)やn=3の場合である3−gram(tri−gramとも呼ばれる)がよく使用されていた(例えば、中川聖一著「確率モデルによる音声認識」電子通信学会、1998)。
【0003】
従来この種の音声認識方法をtri−gramを例にして説明する。tri−gramとして次の2つの言語モデルがテキストから学習されているとする。それぞれにはスコア(文法的あるいは意味的な結合度あるいは使用頻度について予め与える得点)が付けられている。この例では、テキスト中の出現頻度に基づいてスコアが計算されている。
【0004】
(tri−gramの言語モデル例)
放送−技術−研究所 スコア7
放送−技術−緊急会議 スコア8
次のような音声が発生され、音声認識の対象となったとする。
【0005】
(音声)
「砧にある放送技術研究所」
ここで音声の意味内容を文字で表現しているが、音声認識装置への入力は音声波形である。音声認識装置では入力の音声波形から音響的な特徴を取り出し、予め、音素(音韻よりも時間的に短い音声の長さの単位)ごとに用意されている音響モデルと比較する。入力の音声波形とその音響特徴がよく似ている音素を組み合わせて単語を認識する。通常、もっともらしさが高い幾つかの単語を認識候補として選択した後、言語モデルを使用して認識結果として出力する単語を決定する。
【0006】
上記音声の「技術」に継続する「研究所」について、以下の4つの認識候補が得られたとする。
【0007】
(認識候補の例)
【0008】
【表1】
Figure 0003916792
【0009】
この時、現在、認識中の単語を含めた認識候補のtri−gramは次のようになる。
【0010】
(認識候補のtri−gramの例)
認識候補1 放送−技術−研究所
認識候補2 放送−技術−緊急会議
認識候補3 放送−技術−緩急
認識候補4 放送−技術−県警
上記(tri−gramの言語モデル例)、すなわち、言語モデルとしてスコアが与えられているtri−gramを参照すると、2つのtri−gram、すなわち、(認識候補のtri−gram)の4つの認識候補の中の認識候補1と認識候補2についてはtri−gramのスコアが与えられており、他の認識候補3,4については該当するものが存在しない。このため、認識候補3および4についてのtri−gramが除外される。
【0011】
認識候補1、2についてのスコアを比較すると、認識候補2のスコアが8、認識候補1のスコアが7なので、スコアの高い認識候補として、認識候補2、すなわち、4つの認識候補(研究所、緊急会議、緩急、県警)の中の「緊急会議」が単語の認識結果として決定される。この認識結果は実際の音声「研究所」と異なるので誤認識となる。
【0012】
この問題の1つの単純な解決策はn−gramモデルの中でn≧4のnを使用するこである。今の例で6−gramを使用する例を説明する。テキストから次の6−gramが学習されているものとする。
【0013】
(6−gramの言語モデル例)
砧−に−ある−放送−技術−研究所 スコア9
音声認識候補として6−gramまで考慮すると、認識候補の6−gramは次のようになる。
【0014】
(認識候補の−6gramの例)
認識候補1 砧−に−ある−放送−技術−研究所
認識候補2 砧−に−ある−放送−技術−緊急会議
認識候補3 砧−に−ある−放送−技術−緩急
認識候補4 砧−に−ある−放送−技術−県警
(6−gramの言語モデル例)を参照すると、この場合には、認識候補1のみがスコアを有するので、単語の認識結果は「研究所」となる。これまでの認識結果と連結すると、最終的には「砧にある放送技術研究所」が得られ、音声の意味内容と音声認識結果とが一致した正解が得られる。
【0015】
なお、可変n−gram(政瀧浩和、松永昭一、匂坂芳典「連続音声認識のための可変長連鎖統計言語モデル」電子情報通信学会音声研究会報告,SP95−73,pp.1−6,1995では出現頻度が高い定型表現に対しては、n≧4のn−gramを利用する方法を提案している。
【0016】
【発明が解決しようとする課題】
しかしながら、上述の単純な解決策では、一般にどれくらいのnを使用すればよいかが問題となる。n=4,5,6...と単純に全てのnの場合をテキストから学習すると、nの値の増加と共に言語モデルのサイズ(個数)は大きくなり、音声認識装置の記憶容量を超えてしまう。
【0017】
また、出現頻度が1回でも音声認識の際に重要となるn≧4のn−gramもあるので、出現頻度が高いn−gramのみを対象にしている可変n−gramを使うことも困難である。
【0018】
本発明の目的は、上述の点に鑑みて、言語モデルのデータサイズを増やすことなく、また、頻度によらず、認識精度のよい音声認識装置を提供することにある。
【0019】
【課題を解決するための手段】
このような目的を達成するために、請求項1の発明は、入力の音声に対して単語毎に複数の音声認識候補を取得し、当該取得した複数の認識候補の中の1つを予め定めた選択基準にしたがって選択し、当該選択された認識候補を音声認識結果とする音声認識装置において、単語およびその単語の学習テキストにおける出現位置を記憶した記憶手段と、前記複数の音声認識候補の単語、及び、それまでに音声認識結果として選択された単語それぞれと同一単語の、前記学習テキストにおける出現位置の値を取得して、対応する音声認識候補の単語又は音声認識結果として選択された単語の単語位置の値とする単語位置検出手段と、前記複数の音声認識候補の単語それぞれについて、当該音声認識候補の単語の単語位置の値と、それまでに音声認識結果として選択された各単語の単語位置の値との連続性を調べ、連続している単語列の長さを計数する連続単語長さ計数手段とを有し、前記連続単語長さ計数手段によって計数された長さを前記選択基準とし、該選択基準に従って、該計数された単語列の長さが最も長い音声認識候補の単語を、音声認識結果として選択することを特徴とする。
【0020】
請求項2の発明は、請求項1に記載の音声認識装置は言語モデルを使用して音声認識が行われ、前記言語モデルの使用に際して得られるn個の連続する単語列の出現頻度を示すスコアと前記計数手段により計数された単語列の長さが大きくなるほどその値が大きくなるスコアとを前記複数の認識候補それぞれについて加算する加算手段をさらに具え、加算されたスコアの値が最も大きい認識候補を単語の音声認識結果として選択することを特徴とする。
【0021】
請求項3の発明は、請求項1に記載の音声認識装置において、前記記憶手段に登録すべき単語およびその出現位置を入力する入力手段と、当該入力された単語および単語位置を前記記憶手段に登録する登録手段とをさらに具えたことを特徴とする。
【0022】
請求項4の発明は、請求項3に記載の音声認識装置において、前記入力手段は文が記載された学習テキストを受け付け、当該受け付けた文を単語に分割し、当該単語に分割された学習テキストから単語の出現位置を検出し、入力することを特徴とする。
【0023】
請求項5の発明は、請求項1に記載の音声認識装置において、前記記憶手段に記憶される出現位置は同一の単語について複数の出現位置が許容されることを特徴とする。
【0026】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0027】
本発明を適用した音声認識装置のシステム構成を図1に示す。図1において、i1は言語モデルを学習するためのテキストを入力する端子であり、i2は単語の出現位置を検出し、辞書に登録するためのテキストを入力する端子である。i3は認識対象の音声を入力する端子である。01は音声認識結果を出力する端子である。
【0028】
1はn−gramモデル装置であり、端子i1から入力されたテキストについて単語列の出現頻度を計数し、各単語列についてスコアを付与する。このようにして学習した単語列およびそのスコアが言語モデルとしてn−gramモデル装置1内の記憶装置に保存される。
【0029】
n−gramモデル装置1は音声認識デコード装置3から単語列4が与えられた場合には、与えられた単語列について、装置内に保存された複数の言語モデルを検索し、合致する言語モデルのスコアを音声認識デコード装置3に返す。
【0030】
2は単語出現位置辞書装置である。単語出現位置辞書装置2は端子i2から入力されたテキスト中の各単語の出現位置を検出し、単語とその出現位置を単語出現位置辞書装置2内の記憶装置に保存する。
【0031】
また、音声認識デコード装置3から単語列が与えられた場合には、保存されている単語およびその位置を参照して、与えられた単語に合致する保存の単語のスコアを音声認識デコード装置3に返す。
【0032】
3は音声認識デコード装置であり、端子i3から入力された音声(信号)を音声認識する。より具体的には、従来と同様、音響モデルを使用して複数の音声認識候補を取得し、n−gramモデル装置1に保存された言語モデルのn−gram(スコア)および単語出現位置辞書装置2に保存されている単語およびその出現位置に基づき複数の音声認識候補の中から音声認識結果として使用する候補を決定する。この処理については後で詳しく説明する。
【0033】
図1の音声認識装置はたとえば、パーソナルコンピュータなどの汎用コンピュータで実現できる。汎用コンピュータで実行する音声認識プログラムの内容を図2および図3に示す。図2は音声認識処理の具体的な処理内容を示す。図3は言語出現位置辞書に単語およびおよびその出現位置を登録するための処理内容を示す。
【0034】
図2および図3を参照して本発明に係る処理を説明する。
【0035】
ステップS1〜S3において汎用コンピュータ(内蔵のCPU)は言語モデルの学習を行う。登録したいテキスト(いわゆる文書)をキーボードや装着のフロッピーディスクからインターフェース(図1のi1,i3に対応)を介して入力し、装置内のメモリに一時記憶しておく。メモリ上のテキストを従来と同様にして単語に分割し、n−gramの値を従来と同様にして出現頻度から計算する。
【0036】
計算された値(スコア)とその値に対応する単語列が言語モデルとして内蔵のハードディスクに保存される(ステップS1)。
【0037】
他のテキストが入力されると汎用コンピュータは入力されたテキストを単語分割し、n−gramを計算し直す。新たに計算された値で、ハードディスク上の対応の単語列のスコアが更新される。新たに出現した単語列についてはn−gramの値と共に、単語列がハードディスクに保存される(ステップS2)。
【0038】
単語分割されたメモリ上のテキストを使用して、分割された単語について単語出現位置を検出する。この処理は図3を使用して説明する。新たに検出された単語についてはハードディスク上の単語出現位置辞書に追加登録される(ステップS3)。
【0039】
ステップS4からS7で音声認識処理を実行する。
【0040】
汎用コンピュータに接続のマイクロホンから音声が入力されると、入力された音声(信号)は音響特徴が抽出される。ハードディスクに保存されている音響モデルを参照することにより入力の音響特徴に対してもっともらしさが高い音声認識候補単語が各単語ごとに複数作成される(ステップS4)。
【0041】
ステップS5では認識候補に対して、単語出現位置辞書に記載されている出現位置を与える。ステップS6では、これまでに音声認識結果として選択された単語列と今、選択しようとしている認識候補とを組み合わせた単語列について出現位置の連続性を調べる。単語出現位置が連続してる単語列の長さに応じてスコアを与える。
【0042】
ステップS7では、ステップS6で得られた出現位置についてのスコアと言語モデルのn−gramでのスコアとを加算し、加算結果が最も大きい値を持つ認識候補を認識結果(選択する音声認識候補)とする。
【0043】
ステップS8では入力された音声から得られるたとえば、文の単語認識候補全てについて、上述の認識候補確定処理を行ったかの終了判定を行う。終了していない場合には、手順をステップS4に戻し、次の位置の単語認識候補の作成および確定処理を実行する。全ての単語について候補選択を終了すると、選択された単語列(例えば、文)をインターフェース(図1の出力端子o1に対応)を介してディスプレイに表示する(ステップS8→エンド)。
【0044】
具体的な処理例を以下に示す。テキストが汎用コンピュータに入力されるとテキストは言語モデルの学習のために単語に分割される。テキストはニュース原稿のような大量のテキストが使用される。この単語に分割されたテキストを使用して、n−gramを計算する。スコアは単語列の出現頻度に基づいて計算される(ステップS1)。
【0045】
この計算によりtri−gram1として以下のスコアが得られたものとする。
【0046】
(tri−gram1)
放送−技術−研究所 スコア6
放送−技術−緊急会議 スコア8
新たな下記のテキストがテキストが入力されるとこのテキストは次のように単語分割される。
【0047】
(テキスト)
世田谷の砧にある放送技術研究所のグラウンド
(単語分割されたテキスト)
世田谷−の−砧−に−ある−放送−技術−研究所−の−グラウンド
上記tri−gram1の中の単語列と同じ単語列が単語分割されたテキストの中にあるので、
新たなtri−gram2が次のように再計算される(ステップS2)。
【0048】
(tri−gram2)
放送−技術−研究所 スコア7(6+1)
放送−技術−緊急会議 スコア8
以上がtri−gramの学習例であるが、n≧4のn−gramについても学習が行われ、入力のテキスト中の単語と同一部分があるものについてはスコアの値が1だけインクリメント(加算)される。このようにして学習された(作成された)n−gramの言語モデルが汎用コンピュータ内のハードディスクに保存される。
【0049】
次に本発明に係る単語出現位置辞書の登録処理を図3を使用して説明する。テキストが入力されると従来のようにテキストが単語分割される(ステップS11→S12)。
【0050】
次に、変数Iの初期値として数値1を与え、分割された単語のI番目の単語を取り出す(ステップS13→S14)。取り出された単語についてハードディスク上の単語出現位置辞書を検索し、同一の単語がなければ、単語およびそのスコアを登録(記憶)する(ステップS15)。
【0051】
以下、変数Iの値を更新して(ステップS17)、テキストから分割の次の単語を取り出して、出現位置を単語出現位置辞書に登録する(ステップS13〜S16→S17→S13のループ処理)。文末の単語の出現位置の登録を終了すると図3の手順を終了する(ステップS16→エンド)。
【0052】
このような処理を行うことによって、下記の入力のテキストの各単語の出現位置が単語出現位置辞書に登録することができる(ステップS3)。
【0053】
(単語分割されたテキストと出現位置の関係)
出現 世田谷−の−砧−に−ある−放送−技術−研究所−の−グラウンド
位置 01 02 03 04 05 06 07 08 09 10
認識すべき下記の音声が入力されると、
(音声)
砧にある放送技術研究所
(ここでは文字表記を行っているが実際の入力は音声波形である。)
音声認識認識候補が順次に選択され、単語音声「研究所」については以下のような音声認識候補が作成される(ステップS4)。
【0054】
(認識候補の例)
ここで、下記のような文字列の範囲でtri−gramを適用すると、
【0055】
【表2】
Figure 0003916792
【0056】
認識候補1,2のそれぞれについて、接続の単語の出現位置を単語出現位置辞書から求める(ステップS5)と、以下のようになる。
【0057】
(認識候補の単語出現位置)
認識候補1 砧−に−ある−放送−技術−研究所
出現位置1 03 04 05 06 07 08
認識候補2 砧−に−ある−放送−技術−緊急会議
出現位置2 03 04 05 06 07 NULL
ここで、「NULL」は単語出現位置辞書には単語位置が記載されていないことを示す。
【0058】
認識候補の単語を基準にして。そこから単語出現位置が連続している単語列の長さに対してスコアが与えられる。認識候補1は03〜08と6単語が連続しているので、6点のスコアが与えられる。一方、認識候補2では基準位置の単語「緊急会議」によって、単語出現位置が連続しなくなるので、出現位置に関するスコアは与えられない(ステップS6)。
【0059】
言語モデルのtri−gramのスコアと単語出現位置のスコアを加算すると(認識候補の総スコア)
認識候補1=7+6=13
認識候補2=8+0=8
したがって、スコアが高い認識候補1(「研究所」)が認識結果として選択される(ステップS7)。
【0060】
上述の実施形態の他に次の形態を実施できる。
【0061】
1)上記音声認識プログラムを記録する記録媒体は、ROM、RAM等のICメモリ、ハードディスクなどの固定記憶装置、フロッピーディスク、CDROMなどの各種の情報記録媒体を使用することができる。
【0062】
2)単語出現位置辞書に記載する単語位置の個数は1個に限らず複数とすることができる。この場合には、単語出現位置の連続の単語数を計数する際に、複数の単語位置それぞれについて連続の有無を判定し、前の単語と出現位置が連続する単語出現位置を使用する。
【0063】
3)上述の実施形態では単語出現位置辞書の作成および登録機能を有する音声認識装置を説明したが、単語出現位置辞書は外部の装置で作成しておき、通信あるいは記録媒体を介して音声認識装置に実装するようにしてもよい。この場合には、音声認識装置側では、実装された単語出現位置辞書を使用して音声認識を行う。
【0064】
4)上述の実施形態では言語モデルから得られるスコアと、単語出現位置辞書から得られるスコアとを加算して、複数の音声認識候補の中の1つを選択した。しかしながら、特定の用途、たとえば、入力される音声の文が限定されているような場合は、単語の出現位置だけを複数の音声認識候補の選択基準として使用することができる。
【0065】
5)単語出現位置の連続性を調べるにはつぎのようにするとよい。基準となる単語の出現位置を単語出現位置から取得すると、取得した出現位置の値を1だけ減算する。次に基準となる単語の前の位置の単語についても単語出現位置を単語出現位置辞書から取得し、取得した出現位置値と、上記減算により得られる値を比較する。一致判定が得られると、2つの単語は連続していることになる。以下、順次に接続する単語について、単語出現位置から取得した出現位置の値と、連続する場合に予測される出現位置の値を比較する。また、一致判定が得られる回数を計数することで、連続の単語長さを計数することができる。
【0066】
なお、単語列の先頭から認識候補の選択を行っていくので、選択が行われる毎に、選択された単語の単語出現辞書の出現位置をメモリに一時記憶しておくと、その都度、同一の単語の出現位置を単語出現辞書から取得する必要はない。
【0067】
【発明の効果】
以上、説明したように、請求項1の発明によれば、複数の認識候補の選択基準の1つとして、その認識候補の出現位置を使用し、他の単語と出現位置に関する連続性を調べることで、実際の入力音声の意味内容により近い認識候補を選択することができる。この音声認識候補の選択に使用される単語およびその出現位置情報は、n−gramの言語モデルの情報量よりも小さくできる。
【0068】
請求項2の発明では、言語モデルによる出現頻度のスコアと、単語位置の連続長さのスコアを加算することで、単語位置のみのあるいは言語モデルを使用する認識候補の選択よりも音声認識精度を高めることができる。
【0069】
請求項3の発明によれば、音声認識装置に、単語およびその出現位置を登録する機能が備わるので、新しい単語の音声認識にも対処することができる。
【0070】
請求項4の発明では、テキストを用意することでテキストから自動的に新しい単語を検出し、単語およびその出現位置を登録することができる。
【0071】
請求項5の発明では、出現位置が多岐に渡る単語についても、その出現位置を登録しておくことで、このような単語が認識候補となった場合にも対処することができる。
【図面の簡単な説明】
【図1】本発明実施形態のシステム構成を示すブロック図である。
【図2】本発明実施形態の音声認識処理内容を示すフローチャートである。
【図3】本発明実施形態の単語出現位置辞書の登録処理内容を示すフローチャートである。
【符号の説明】
1 n−gramモデル装置
2 単語出現位置辞書装置
3 音声認識デコード装置

Claims (5)

  1. 入力の音声に対して単語毎に複数の音声認識候補を取得し、当該取得した複数の認識候補の中の1つを予め定めた選択基準にしたがって選択し、当該選択された認識候補を音声認識結果とする音声認識装置において、
    単語およびその単語の学習テキストにおける出現位置を記憶した記憶手段と、
    前記複数の音声認識候補の単語、及び、それまでに音声認識結果として選択された単語それぞれと同一単語の、前記学習テキストにおける出現位置の値を取得して、対応する音声認識候補の単語又は音声認識結果として選択された単語の単語位置の値とする単語位置検出手段と、
    前記複数の音声認識候補の単語それぞれについて、当該音声認識候補の単語の単語位置の値と、それまでに音声認識結果として選択された各単語の単語位置の値との連続性を調べ、連続している単語列の長さを計数する連続単語長さ計数手段とを有し、
    前記連続単語長さ計数手段によって計数された長さを前記選択基準とし、該選択基準に従って、該計数された単語列の長さが最も長い音声認識候補の単語を、音声認識結果として選択することを特徴とする音声認識装置。
  2. 請求項1に記載の音声認識装置は言語モデルを使用して音声認識が行われ、前記言語モデルの使用に際して得られるn個の連続する単語列の出現頻度を示すスコアと前記計数手段により計数された単語列の長さが大きくなるほどその値が大きくなるスコアとを前記複数の認識候補それぞれについて加算する加算手段をさらに具え、加算されたスコアの値が最も大きい認識候補を単語の音声認識結果として選択することを特徴とする音声認識装置。
  3. 請求項1に記載の音声認識装置において、前記記憶手段に登録すべき単語およびその出現位置を入力する入力手段と、当該入力された単語および単語位置を前記記憶手段に登録する登録手段とをさらに具えたことを特徴とする音声認識装置。
  4. 請求項3に記載の音声認識装置において、前記入力手段は文が記載された学習テキストを受け付け、当該受け付けた文を単語に分割し、当該単語に分割された学習テキストから単語の出現位置を検出し、入力することを特徴とする音声認識装置。
  5. 請求項1に記載の音声認識装置において、前記記憶手段に記憶される出現位置は同一の単語について複数の出現位置が許容されることを特徴とする音声認識装置。
JP06191499A 1999-03-09 1999-03-09 音声認識装置 Expired - Fee Related JP3916792B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06191499A JP3916792B2 (ja) 1999-03-09 1999-03-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06191499A JP3916792B2 (ja) 1999-03-09 1999-03-09 音声認識装置

Publications (2)

Publication Number Publication Date
JP2000259174A JP2000259174A (ja) 2000-09-22
JP3916792B2 true JP3916792B2 (ja) 2007-05-23

Family

ID=13184917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06191499A Expired - Fee Related JP3916792B2 (ja) 1999-03-09 1999-03-09 音声認識装置

Country Status (1)

Country Link
JP (1) JP3916792B2 (ja)

Also Published As

Publication number Publication date
JP2000259174A (ja) 2000-09-22

Similar Documents

Publication Publication Date Title
CN107305768B (zh) 语音交互中的易错字校准方法
CN108304375B (zh) 一种信息识别方法及其设备、存储介质、终端
CN107016994B (zh) 语音识别的方法及装置
US9361879B2 (en) Word spotting false alarm phrases
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
CN109637537B (zh) 一种自动获取标注数据优化自定义唤醒模型的方法
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2004005600A (ja) データベースに格納された文書をインデックス付け及び検索する方法及びシステム
JP2004133880A (ja) インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法
JP2002531892A (ja) テキストの自動区分
CN101415259A (zh) 嵌入式设备上基于双语语音查询的信息检索系统及方法
CN111552777B (zh) 一种音频识别方法、装置、电子设备及存储介质
CN111832299A (zh) 一种中文分词系统
KR100704508B1 (ko) N-gram 네트워크를 이용하는 한국어 연속음성인식의언어모델 적응장치 및 그 방법
JP5897718B2 (ja) 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法
JPH10274996A (ja) 音声認識装置
CN112231440A (zh) 一种基于人工智能的语音搜索方法
JP2005257954A (ja) 音声検索装置、音声検索方法および音声検索プログラム
JP2000259645A (ja) 音声処理装置及び音声データ検索装置
JP4764203B2 (ja) 音声認識装置及び音声認識プログラム
CN116052655A (zh) 音频处理方法、装置、电子设备和可读存储介质
CN113539235B (zh) 文本分析与语音合成方法、装置、系统及存储介质
CN113539234B (zh) 语音合成方法、装置、系统及存储介质
JP2002278579A (ja) 音声データ検索装置
JP3916792B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060711

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060711

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060808

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20060908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061010

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20061024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070207

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees